240 15 151MB
German Pages 1232 [1248] Year 1996
Semiotik Semiotics HSK 13.1
≥
Handbücher zur Sprach- und Kommunikationswissenschaft Handbooks of Linguistics and Communication Science Manuels de linguistique et des sciences de communication Mitbegründet von Gerold Ungeheuer
Herausgegeben von / Edited by / Edite´s par Hugo Steger Herbert Ernst Wiegand Band 13.1
Walter de Gruyter · Berlin · New York 1997
Semiotik Semiotics Ein Handbuch zu den zeichentheoretischen Grundlagen von Natur und Kultur A Handbook on the Sign-Theoretic Foundations of Nature and Culture Herausgegeben von / Edited by Roland Posner, Klaus Robering, Thomas A. Sebeok 1. Teilband / Volume 1
Walter de Gruyter · Berlin · New York 1997
앝 Gedruckt auf säurefreiem Papier, das die 앪
US-ANSI-Norm über Haltbarkeit erfüllt.
Library of Congress Cataloging-in-Publication Data Semiotik : ein Handbuch zu den zeichentheoretischen Grundlagen von Natur und Kultur ⫽ Semiotics : a handbook on the sign-theoretic foundations of nature and culture / herausgegeben von Roland Posner, Klaus Robering, Thomas A. Sebeok (Handbücher zur Sprach- und Kommunikationswissenschaft ; Bd. 13 ⫽ Handbooks of linguistics and communication science) English and German. Includes bibliographical references and indexes. ISBN 3-11-009584-X (v. 1 : alk. paper) 1. Semiotics. I. Posner, Roland. II. Robering, Klaus. III. Sebeok, Thomas Albert, 1920⫺ . IV. Series: Handbücher zur Sprach- und Kommunikationswissenschaft ; Bd. 13. P99.S3943 1997 302.2⫺dc21 96-49024 CIP
Die Deutsche Bibliothek ⫺ CIP-Einheitsaufnahme Handbücher zur Sprach- und Kommunikationswissenschaft / mitbegr. von Gerold Ungeheuer. Hrsg. von Hugo Steger ; Herbert Ernst Wiegand. ⫺ Berlin ; New York : de Gruyter. Früher hrsg. von Gerold Ungeheuer und Herbert Ernst Wiegand. ⫺ Teilw. mit Parallelt.: Handbooks of linguistics and communication science. ⫺ Teilw. mit Nebent.: HSK NE: Ungeheuer, Gerold [Hrsg.]; Steger, Hugo [Hrsg.]; Handbooks of linguistics and communication science; HSK Bd. 13. Semiotik. Teilbd. 1 (1997) Semiotik : ein Handbuch zu den zeichentheoretischen Grundlagen von Natur und Kultur ⫽ Semiotics / hrsg. von Roland Posner … ⫺ Berlin ; New York : de Gruyter. (Handbücher zur Sprach- und Kommunikationswissenschaft ; Bd. 13) NE: Posner, Roland [Hrsg.]; Semiotics Teilbd. 1 (1997) ISBN 3-11-009584-X
” Copyright 1996 by Walter de Gruyter & Co., D-10785 Berlin. Dieses Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Printed in Germany Satz und Druck: Arthur Collignon GmbH, Berlin Buchbinderische Verarbeitung: Lüderitz & Bauer, Berlin
Inhalt / Contents 1. Teilband / Volume 1 Vorwort . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . XVII Preface . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . XXVI
I. 1. 2. 3. 4.
II.
5. 6. 7. 8. 9. 10. 11. 12.
13. 14. 15. 16. 17.
Systematik Systematics Roland Posner, Semiotics and its presentation in this Handbook (Die Semiotik und ihre Darstellung in diesem Handbuch) . . . . . Roland Posner / Klaus Robering, Syntactics (Syntaktik) . . . . . Klaus Robering, Semantik (Semantics) . . . . . . . . . . . . . . . . Roland Posner, Pragmatics (Pragmatik) . . . . . . . . . . . . . . .
. . . .
. . . .
. . . .
. . . .
1 14 83 219
Martin Krampen, Models of semiosis (Modelle der Semiose) . . . . . . Klaus Landwehr, Der optische Kanal (The optical channel) . . . . . . . Gerhard Strube / Gerda Lazarus, Der akustische Kanal (The acoustic channel) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Herbert Heuer, Der taktile Kanal (The tactile channel) . . . . . . . . . . Jürgen Kröller, Chemical channels (Chemische Kanäle) . . . . . . . . . . Peter Moller, The electric and magnetic channels (Der elektrische und der magnetische Kanal) . . . . . . . . . . . . . . . . . Kurt Brück, Der thermische Kanal (The thermal channel) . . . . . . . . Niels Galley, Die Organisation von Augenbewegungen: Fallstudie einer mehrkanaligen Semiose (The organization of eye movements: A case study of multichannel semiosis) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Riccardo Luccio, Body behavior as multichannel semiosis (Körperverhalten als mehrkanalige Semiose) . . . . . . . . . . . . . . . . . Karin Böhme-Dürr, Technische Medien der Semiose (Technical media in semiosis) . . . . . . . . . . . . . . . . . . . . . . . . . . . Terry Threadgold, Social media of semiosis (Soziale Medien der Semiose) Gavin T. Watt / William C. Watt, Codes (Kodes) . . . . . . . . . . . . . . Rudi Keller / Helmut Lüdtke, Kodewandel (Code change) . . . . . . . .
247 288
Gegenstand I: Aspekte der Semiose ⫺ Kanäle, Medien und Kodes General Topics I: Aspects of Semiosis ⫺ Channels, Media, and Codes
294 300 306 316 325
330 345 357 384 404 414
VI
Inhalt / Contents
III.
Gegenstand II: Arten der Semiose General Topics II: Types of Semiosis
18.
Thomas A. Sebeok, The evolution of semiosis (Die Evolution der Semiose) . . . . . . . . . . . . . . . . . . . . . . . . . . . Thure von Uexküll, Biosemiose (Biosemiosis) . . . . . . . . . . . . . . . . F. Eugene Yates, Microsemiosis (Mikrosemiose) . . . . . . . . . . . . . . . Thure von Uexküll / Werner Geigges / Jörg M. Herrmann, Endosemiose (Endosemiosis) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Gunda Kraepelin, Mykosemiose (Mycosemiosis) . . . . . . . . . . . . . . Martin Krampen, Phytosemiosis (Phytosemiose) . . . . . . . . . . . . . . Werner Schuler, Zoosemiose (Zoosemiosis) . . . . . . . . . . . . . . . . . . Franz M. Wuketits, Anthroposemiose (Anthroposemiosis) . . . . . . . . . Peter Bøgh Andersen / Per Hasle / Per Aage Brandt, Machine semiosis (Maschinensemiose) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Günter Tembrock, Ökosemiose (Environmental semiosis) . . . . . . . . .
19. 20. 21. 22. 23. 24. 25. 26. 27.
IV.
Methoden der Semiotik Methods of Semiotics
28.
Wolfgang Balzer, Methodenprobleme der Semiotik (Methodological problems of semiotics) . . . . . . . . . . . . . . . . . . Rüdiger Grotjahn, Daten und Hypothesen in der Semiotik (Data and hypotheses in semiotics) . . . . . . . . . . . . . . . . . . . . . Jerzy Pelc, Theory formation in semiotics (Theorienbildung in der Semiotik) . . . . . . . . . . . . . . . . . . . . . . Jerzy Pelc, Understanding, explanation, and action as problems of semiotics (Verstehen, Erklären und Handeln als Probleme der Semiotik) . . . .
29. 30. 31.
..
604
..
617
..
644
32.
Harald Haarmann, The development of sign conceptions in the evolution of human cultures (Die Entwicklung von Zeichenkonzeptionen in der Evolution menschlicher Kulturen) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Aleida Assmann, Probleme der Erfassung von Zeichenkonzeptionen im Abendland (Problems in the explication of Western sign conceptions) . . . . . . . . . Umberto Eco, History and historiography of semiotics (Geschichte und Geschichtsschreibung der Semiotik) . . . . . . . . . . . . Marcelo Dascal / Klaus D. Dutz, The beginnings of scientific semiotics (Zur Datierung des Beginns einer wissenschaftlichen Semiotik) . . . . . .
35.
548 571
592
Geschichtsschreibung der Semiotik The Historiography of Semiotics
34.
464 488 507 522 532
..
V.
33.
436 447 457
668
710 730 746
Inhalt / Contents
VII
VI.
Geschichte der abendländischen Semiotik I: Keltisches, Germanisches und Slavisches Altertum History of Western Semiotics I: Celtic, Germanic, and Slavic Antiquity
36.
Harald Haarmann, Zeichenkonzeptionen im keltischen Altertum (Sign conceptions in Celtic Antiquity) . . . . . . . . . . . . . . . . . . . . .
763
Klaus Düwel, Zeichenkonzeptionen im germanischen Altertum (Sign conceptions in Germanic Antiquity) . . . . . . . . . . . . . . . . . . .
803
Walter Koschmal, Zeichenkonzeptionen im slavischen Altertum (Sign conceptions in Slavic Antiquity) . . . . . . . . . . . . . . . . . . . . .
822
37. 38.
VII.
Geschichte der abendländischen Semiotik II: Griechische und Römische Antike History of Western Semiotics II: Ancient Greece and Rome
39.
Ezio Pellizer, Sign conceptions in pre-classical Greece (Zeichenkonzeptionen der griechischen Vorklassik) . . . . . . . . . . . . .
831
Karlheinz Hülser, Zeichenkonzeptionen in der Philosophie der griechischen und römischen Antike (Sign conceptions in philosophy in Ancient Greece and Rome) . . . . . . .
837
Pirmin Stekeler-Weithofer, Zeichenkonzeptionen in der Mathematik der griechischen und römischen Antike (Sign conceptions in mathematics in Ancient Greece and Rome) . . . . .
862
Giovanni Manetti, Sign conceptions in grammar, rhetoric, and poetics in Ancient Greece and Rome (Zeichenkonzeptionen in der Grammatik, Rhetorik und Poetik der griechischen und römischen Antike) . . . . . . . . . . . . . . . . . . . . . . .
876
Albrecht Riethmüller, Zeichenkonzeptionen in der Musik der griechischen und römischen Antike (Sign conceptions in music in Ancient Greece and Rome) . . . . . . . . . .
893
Alexandros Ph. Lagopoulos, Sign conceptions in architecture and the fine arts in Ancient Greece and Rome (Zeichenkonzeptionen in der Architektur und bildenden Kunst der griechischen und römischen Antike) . . . . . . . . . . . . . . . . . . . . . . .
900
Volker Langhoff, Zeichenkonzeptionen in der Medizin der griechischen und römischen Antike (Sign conceptions in medicine in Ancient Greece and Rome) . . . . . . . .
912
Giovanni Manetti, Sign conceptions in natural history and natural philosophy in Ancient Greece and Rome (Zeichenkonzeptionen in der Naturlehre der griechischen und römischen Antike) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
922
40.
41.
42.
43.
44.
45.
46.
VIII
47.
48.
Inhalt / Contents
Fritz Graf, Zeichenkonzeptionen in der Religion der griechischen und römischen Antike (Sign conceptions in religion in Ancient Greece and Rome) . . . . . . . . . Wolfgang Schindler und Detlef Rößler, Zeichenkonzeptionen im Alltagsleben der griechischen und römischen Antike (Sign conceptions in everyday life in Ancient Greece and Rome) . . . . .
939
958
VIII. Geschichte der abendländischen Semiotik III: Das Mittelalter History of Western Semiotics III: The Middle Ages 49.
50. 51.
52. 53.
54.
55.
56.
57.
58.
59.
Stephan Meier-Oeser, Zeichenkonzeptionen in der Philosophie des lateinischen Mittelalters (Sign conceptions in philosophy in the Latin Middle Ages) . . . . . . . . . Franc¸oise Bare´, Sign conceptions in aesthetics in the Latin Middle Ages (Zeichenkonzeptionen in der Ästhetik des lateinischen Mittelalters) . . . George Molland, Sign conceptions in mathematics in the Latin Middle Ages (Zeichenkonzeptionen in der Mathematik des lateinischen Mittelalters) Stephen F. Brown, Sign conceptions in logic in the Latin Middle Ages (Zeichenkonzeptionen in der Logik des lateinischen Mittelalters) . . . . . Markus H. Wörner, Zeichenkonzeptionen in der Grammatik, Rhetorik und Poetik des lateinischen Mittelalters (Sign conceptions in grammar, rhetoric, and poetics in the Latin Middle Ages) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Franco Alberto Gallo, Sign conceptions in music in the Latin Middle Ages (Zeichenkonzeptionen der in Musik des lateinischen Mittelalters) . . . . . Hans Holländer, Zeichenkonzeptionen in der Architektur und bildenden Kunst des lateinischen Mittelalters (Sign conceptions in architecture and the fine arts in the Latin Middle Ages) Costantino Marmo, Sign conceptions in medicine in the Latin Middle Ages (Zeichenkonzeptionen in der Medizin des lateinischen Mittelalters) . . . Ludger Kaczmarek, Zeichenkonzeptionen in der Naturlehre des lateinischen Mittelalters (Sign conceptions in natural history and natural philosophy in the Latin Middle Ages) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Rudolf Suntrup, Zeichenkonzeptionen in der Religion des lateinischen Mittelalters (Sign conceptions in religion in the Latin Middle Ages) . . . . . . . . . . . Klaus Frerichs, Zeichenkonzeptionen im Alltagsleben des lateinischen Mittelalters (Sign conceptions in everyday life in the Latin Middle Ages) . . . . . . .
984 1022
1029 1036
1046
1060
1065
1094
1099
1115
1132
Inhalt / Contents
60. 61.
Franz Tinnefeld, Zeichenkonzeptionen im griechischen Mittelalter (Sign conceptions in the Greek Middle Ages) . . . . . . . . . . . . . . . . . Claude Gandelman, Sign conceptions in the Judaic tradition (Zeichenkonzeptionen in der jüdischen Tradition) . . . . . . . . . . . . . .
2. Teilband (Überblick über den vorgesehenen Inhalt) Volume 2 (Preview of Contents) IX.
Geschichte der abendländischen Semiotik IV: Von der Renaissance bis zum frühen 19. Jahrhundert History of Western Semiotics IV: From the Renaissance to the Early 19th Century
62.
Stephan Meier-Oeser, Zeichenkonzeptionen in der Allgemeinen Philosophie von der Renaissance bis zum frühen 19. Jahrhundert (Sign conceptions in general philosophy from the Renaissance to the early 19th century) Ursula Franke, Zeichenkonzeptionen in der Kunstphilosophie und Ästhetik von der Renaissance bis zum frühen 19. Jahrhundert (Sign conceptions in the philosophy of art and aesthetics from the Renaissance to the early 19th century Wolfgang Lenzen, Zeichenkonzeptionen in der Logik von der Renaissance bis zum frühen 19. Jahrhundert (Sign conceptions in logic from the Renaissance to the early 19th century) Jürgen Trabant, Sign conceptions in the philosophy of language from the Renaissance to the early 19th century (Zeichenkonzeptionen in der Sprachphilosophie von der Renaissance bis zum frühen 19. Jahrhundert) Eberhard Knobloch, Zeichenkonzeptionen in der Mathematik von der Renaissance bis zum frühen 19. Jahrhundert (Sign conceptions in mathematics from the Renaissance to the early 19th century) Josef Rauscher, Zeichenkonzeptionen in Grammatik, Rhetorik und Poetik von der Renaissance bis zum frühen 19. Jahrhundert (Sign conceptions in grammar, rhetoric, and poetics from the Renaissance to the early 19th century) Mario Baroni, Sign conceptions in music from the Renaissance to the early 19th century (Zeichenkonzeptionen in der Musik von der Renaissance bis zum frühen 19. Jahrhundert) Josef Rykwert / Desmond Hui, Sign conceptions in architecture and the fine arts from the Renaissance to the early 19th century (Zeichenkonzeptionen in der Architektur und bildenden Kunst von der Renaissance bis zum frühen 19. Jahrhundert)
63.
64.
65.
66.
67.
68.
69.
IX
1148 1183
X
Inhalt / Contents
70.
Roger French, Sign conceptions in medicine from the Renaissance to the early 19th century (Zeichenkonzeptionen in der Medizin von der Renaissance bis zum frühen 19. Jahrhundert)
71.
Wolfgang Deppert, Zeichenkonzeptionen in der Naturlehre von der Renaissance bis zum frühen 19. Jahrhundert (Sign conceptions in natural history and natural philosophy from the Renaissance to the early 19th century)
72.
Rainer Volp, Zeichenkonzeptionen in der Religion von der Renaissance bis zum frühen 19. Jahrhundert (Sign conceptions in religion from the Renaissance to the early 19th century)
73.
Hans Ulrich Gumbrecht, Sign conceptions in everyday life from the Renaissance to the early 19th century (Zeichenkonzeptionen im Alltagsleben von der Renaissance bis zum frühen 19. Jahrhundert)
X.
Geschichte der abendländischen Semiotik V: Vom 19. Jahrhundert bis zur Gegenwart History of Western Semiotics V: From the 19th Century to the Present
74.
Adelhard Scheffczyk, Zeichenkonzeptionen in der Allgemeinen Philosophie vom 19. Jahrhundert bis zur Gegenwart (Sign conceptions in general philosophy from the 19th century to the present)
75.
Christoph Hubig, Zeichenkonzeptionen in der Ästhetik vom 19. Jahrhundert bis zur Gegenwart (Sign conceptions in aesthetics from the 19th century to the present)
76.
Denis Vernant, Sign conceptions in logic from the 19th century to the present (Zeichenkonzeptionen in der Logik vom 19. Jahrhundert bis zur Gegenwart)
77.
Karl-Friedrich Kiesow, Zeichenkonzeptionen in der Sprachphilosophie vom 19. Jahrhundert bis zur Gegenwart (Sign conceptions in the philosophy of language from the 19th century to the present)
78.
Klaus Mainzer, Zeichenkonzeptionen in der Mathematik und Informatik vom 19. Jahrhundert bis zur Gegenwart (Sign conceptions in mathematics and informatics from the 19th century to the present)
79.
Andreas Dörner, Zeichenkonzeptionen in der Grammatik vom 19. Jahrhundert bis zur Gegenwart (Sign conceptions in grammar from the 19th century to the present)
Inhalt / Contents
80.
81.
82.
83.
84.
85.
86.
87.
88.
Christiane Pankow, Zeichenkonzeptionen in Rhetorik, Stilistik und Poetik vom 19. Jahrhundert bis zur Gegenwart (Sign conceptions in rhetoric, stylistics, and poetics from the 19th century to the present) Eero Tarasti, Sign conceptions in music from the 19th century to the present (Zeichenkonzeptionen in der Musik vom 19. Jahrhundert bis zur Gegenwart) Desmond Hui / Josef Rykwert, Sign conceptions in architecture and the fine arts from the 19th century to the present (Zeichenkonzeptionen in der Architektur und bildenden Kunst vom 19. Jahrhundert bis zur Gegenwart) Wolfgang U. Eckart, Zeichenkonzeptionen in der Medizin vom 19. Jahrhundert bis zur Gegenwart (Sign conceptions in medicine from the 19th century to the present) Ulrich Majer, Zeichenkonzeptionen in der Physik vom 19. Jahrhundert bis zur Gegenwart (Sign conceptions in physics from the 19th century to the present) Franz M. Wuketits, Zeichenkonzeptionen in der Biologie vom 19. Jahrhundert bis zur Gegenwart (Sign conceptions in biology from the 19th century to the present) Leonhard Bauer, Zeichenkonzeptionen in der Ökonomie vom 19. Jahrhundert bis zur Gegenwart (Sign conceptions in economy from the 19th century to the present) Hermann Deuser, Zeichenkonzeptionen in der Religion vom 19. Jahrhundert bis zur Gegenwart (Sign conceptions in religion from the 19th century to the present) Winfried Nöth, Zeichenkonzeptionen im Alltagsleben vom 19. Jahrhundert bis zur Gegenwart (Sign conceptions in everyday life from the 19th century to the present)
XI.
Geschichte der nichtabendländischen Semiotik History of Non-Western Semiotics
89.
Antonio Loprieno, Zeichenkonzeptionen im Alten Orient (Sign conceptions in the Ancient Middle East) Fedwa Malti-Douglas, Sign conceptions in the Islamic World (Zeichenkonzeptionen in der islamischen Welt) Joachim Fiebach, Zeichenkonzeptionen im nicht-islamischen Afrika (Sign conceptions in Non-Islamic Africa) Bimal Krishna Matilal / Jogesh Chandra Panda, Sign conceptions in India (Zeichenkonzeptionen in Indien) You-Zheng Li, Sign conceptions in China (Zeichenkonzeptionen in China)
90. 91. 92.
93.
XI
XII
94. 95. 96. 97.
98. 99.
Inhalt / Contents
Harald Haarmann, Sign conceptions in Korea (Zeichenkonzeptionen in Korea) Yoshihiko Ikegami, Sign conceptions in Japan (Zeichenkonzeptionen in Japan) Kurt Huber, Zeichenkonzeptionen in Indonesien und den Philippinen (Sign conceptions in Indonesia and the Philippines) Harald Haarmann, Zeichenkonzeptionen in den Festlandkulturen Südostasiens (Sign conceptions in the mainland cultures of South East Asia) Gunter Senft, Zeichenkonzeptionen in Ozeanien (Sign conceptions in Oceania) Andreas König, Zeichenkonzeptionen in Altamerika (Sign conceptions in the Ancient Americas)
XII.
Gegenwartsströmungen der Semiotik Current Trends in Semiotics
100. 101.
Helmut Pape, Peirce and his followers (Peirce und seine Nachfolger) Svend Erik Larsen, Saussure und seine Nachfolger (Saussure and his followers) Pirmin Stekeler-Weithofer, Frege und seine Nachfolger (Frege and his followers) Sandra B. Rosenthal, Phenomenological Semiotics (Die phänomenologische Semiotik) H. Walter Schmitz, Die Signifik (Significs) Kurt Baldinger, Semasiologie und Onomasiologie (Semasiology and Onomasiology) Rainer Hegselmann, Der logische Empirismus (Logical Empiricism) Gerrit Haas, Der Konstruktivismus (Constructivism) Ursula Niklas, Praxiology (Die Praxiologie) Rom Harre´, Wittgenstein and Ordinary Language Philosophy (Wittgenstein und die Philosophie der normalen Sprache) Thure von Uexküll, Jakob von Uexkülls Umweltlehre (Jakob von Uexküll and his “Umweltlehre”) Heinz Paetzold, Cassirer und seine Nachfolger (Cassirer and his followers) Robert E. Innis, Bühler and his followers (Bühler und seine Nachfolger) Dieter Münch / Roland Posner, Morris, his predecessors and followers (Morris, seine Vorgänger und Nachfolger) Rainer, Grübel, Der Russische Formalismus (Russian Formalism) Thomas G. Winner, Prague Functionalism (Der Prager Funktionalismus)
102. 103. 104. 105. 106. 107. 108. 109. 110. 111. 112. 113. 114. 115.
Inhalt / Contents
116. 117. 118. 119. 120. 121. 122.
Linda R. Waugh / Stephen Rudy, Jakobson and Structuralism (Jakobson und der Strukturalismus) Jørgen Dines Johansen, Hjelmslev and Glossematics (Hjelmslev und die Glossematik) Michael Fleischer, Die Schule von Moskau und Tartu (The Moscow-Tartu School) Herman Parret, Greimas and his school (Greimas und seine Schule) Giampolo Proni, The position of Eco (Die Position Ecos) Søren Kjørup, The approach of Goodman (Der Ansatz Goodmans) Peter Rusterholz, Poststrukturalistische Semiotik (Post-structuralist semiotics)
3. Teilband (Überblick über den vorgesehenen Inhalt) Volume 3 (Preview of Contents) XIII. Semiotik und andere interdisziplinäre Wissenschaften Semiotics and Other Interdisciplinary Approaches 123.
124. 125. 126. 127. 128. 129. 130. 131.
Roland Posner, The relationship between individual disciplines and interdisciplinary approaches (Das Verhältnis zwischen Wissenschaftsdisziplinen und interdisziplinären Ansätzen) Klaus Robering, Semiotik und Wissenschaftstheorie (Semiotics and the philosophy of science) Helmar Frank, Semiotik und Informationstheorie (Semiotics and information theory) Herbert Stachowiak, Semiotik und Systemtheorie (Semiotics and systems theory) Reinhard Köhler, Semiotik und Synergetik (Semiotics and synergetics) Alexandre Me´traux, Semiotik und Theorie der Entwicklungsprozesse (Semotics and the theory of developmental processes) Michael Stadler / Wolfgang Wildgen, Semiotik und Gestalttheorie (Semiotics and gestalt theory) Irene Berkel, Semiotik und Psychoanalyse (Semiotics and psychoanalysis) Oliver Scholz, Semiotik und Hermeneutik (Semiotics and hermeneutics)
XIV. Semiotik und Einzelwissenschaften Semiotics and Individual Disciplines 132.
Roland Posner, The semiotic reconstruction of individual disciplines (Die semiotische Rekonstruktion der Einzelwissenschaften)
XIII
XIV
133. 134. 135. 136.
137. 138. 139.
140. 141.
142.
143. 144.
145. 146. 147.
148. 149.
150.
Inhalt / Contents
Pirmin Stekeler-Weithofer, Semiotische Aspekte der Mathematik (Semiotic aspects of mathematics) Andreas Kamlah, Semiotische Aspekte der Physik (Semiotic aspects of physics) Dieter Hellwinkel, Semiotische Aspekte der Chemie (Semiotic aspects of chemistry) Felix Schmeidler, Semiotische Aspekte der Astronomie und Kosmologie (Semiotic aspects of astronomy and cosmology) Kenneth E. Foote, Semiotische Aspekte der Geographie (Semiotic aspects of geography) Jesper Hoffmeyer, Semiotic aspects of biology: Biosemiotics (Semiotische Aspekte der Biologie: Biosemiotik) Andreas Müller / Joachim R. Wolff, Semiotische Aspekte der Neurophysiologie: Neurosemiotik (Semiotic aspects of neurophysiology: Neurosemiotics) Peter Hucklenbroich, Semiotische Aspekte der Medizin: Medizinsemiotik (Semiotic aspects of medicine: Medical semiotics) John A. Michon / Janet L. Jackson, Semiotic aspects of psychology: Psychosemiotics (Semiotische Aspekte der Psychologie: Psychosemiotik) Hans-Georg Soeffner / Hans Hagen Hildebrandt, Semiotische Aspekte der Soziologie: Soziosemiotik (Semiotic aspects of sociology: Sociosemiotics) Bernard S. Jackson, Semiotic aspects of jurisprudence: Legal semiotics (Semiotische Aspekte der Rechtswissenschaft: Rechtssemiotik) Hartmut Kliemt, Semiotische Aspekte der Wirtschaftswissenschaften: Wirtschaftssemiotik (Semiotic aspects of economics) Pertti Ahonen, Semiotic aspects of political science: Political semiotics (Semiotische Aspekte der Politikwissenschaft: Politiksemiotik) Mauro Wolf, Semiotic aspects of mass media studies (Semiotische Aspekte der Publizistikwissenschaft) Luisa Passerini / Antonis Liakos, Semiotic aspects of the historical disciplines (Semiotische Aspekte der Geschichtswissenschaften: Geschichtssemiotik) Klaus Frerichs, Semiotische Aspekte der Archäologie (Semiotic aspects of archeology) Jörg Peters, Semiotische Aspekte der Sprachwissenschaft: Sprachsemiotik (Semiotic aspects of linguistics: Semiotics of natural languages) Michael Titzmann, Semiotische Aspekte der Literaturwissenschaft: Literatursemiotik (Semiotic aspects of literary studies: Semiotics of literature)
Inhalt / Contents
151.
152.
153. 154.
155.
156.
157.
Erika Fischer-Lichte, Semiotische Aspekte der Theaterwissenschaft: Theatersemiotik (Semiotic aspects of the performing arts) Guerino Mazzola, Semiotische Aspekte der Musikwissenschaft: Musiksemiotik (Semiotic aspects of musicology: Semiotics of music) Rolf Kloepfer, Semiotische Aspekte der Filmwissenschaft: Filmsemiotik (Semiotic aspects of film studies: Semiotics of the cinema) Omar Calabrese, Semiotic aspects of art history: Semiotics of the fine arts (Semiotische Aspekte der Kunstgeschichte: Kunstsemiotik) Claus Dreyer, Semiotische Aspekte der Architekturwissenschaft: Architektursemiotik (Semiotic aspects of the study of architecture: Semiotics of architecture) Volker Heeschen, Semiotische Aspekte der Ethnologie: Ethnosemiotik (Semiotic aspects of ethnology and social anthropology: Ethnosemiotics) Donald J. Cunningham, Semiotic aspects of pedagogy (Semiotische Aspekte der Pädagogik)
158.
Eckhard Tramsen, Semiotische Aspekte der Religionswissenschaft: Religionssemiotik (Semiotic aspects of religious studies: Semiotics of religion)
XV.
Ausgewählte Gegenstände der Semiotik Selected Topics of Semiotics
159.
Friedrich Kittler, Geschichte der Kommunikationstechniken (The history of communications technology) Yishai Tobin, Divination and futurology (Mantik und Futurologie) Peter Bøgh Andersen / Berit Holmqvist, Work (Arbeit) Gunter Gebauer, Sport (Sports) Paul Bouissac, Interspecific Communication (Kommunikation zwischen Lebewesen verschiedener biologischer Arten) Philip B. Stafford, Gerontology and Geriatrics (Gerontologie und Geriatrie) Bennetta Jules-Rosette, Tourism (Tourismus) Ute Werner, Geschäftsleben (Business) Augusto Ponzio, Ideology (Ideologie) Karl Grammer, Körpersignale in menschlicher Interaktion (Body signals in human interaction) Ernest W. B. Hess-Lüttich, Multimediale Kommunikation (Multimedia Communication) Søren Kjørup, Pictograms (Piktogramme)
160. 161. 162. 163. 164. 165. 166. 167. 168. 169. 170.
XV
XVI
171.
172. 173. 174. 175. 176.
Inhalt / Contents
Eva-Maria Baxmann-Krafft / Bernd Hartlieb, Zeichennormung für Handwerk und Industrie (Standardization of signs for trade and industry) Umberto Eco, Fakes in arts and crafts (Fälschungen in Kunst und Kunstgewerbe) Antonio Tadiotto, Ciphers and other secret codes (Chiffren und Geheimkodes) Jose´ Lambert / Clem Robyns, Translation (Übersetzung) Peter Mühlhäusler, Universal languages and language planning (Universalsprachen und Sprachplanung) Richard Berendzen / Bernard M. Oliver, Extraterrestrial communication (Extraterrestrische Kommunikation)
XVI. Anhang Appendix 177. 178.
Gloria Withalm, Semiotische Organisationen (Semiotic organizations) Gloria Withalm, Semiotische Nachschlagewerke und Zeitschriften (Semiotic reference works and periodicals)
Personenindex (Index of persons) Sachindex (Index of subjects)
Vorwort Gedruckte Lexika, Enzyklopädien und Handbücher scheinen heutzutage ein Anachronismus zu sein. Statt das Wissen seiner Zeit in einer Bibliothek nachzuschlagen, wird man es in Zukunft per Knopfdruck aus weltweit vernetzten Datenbanken abrufen und direkt auf den Bildschirm am Arbeitsplatz bringen können. Auf Chips geladen oder in Disketten oder CD-ROMs gespeichert, wird der Inhalt Hunderter von Handbüchern auf den Teller einer Hand passen. Im elektronischen Medium wird das Wissen auch nicht als fertiges Werk präsent sein, das eine eigene Identität hat und sich nur schrittweise von Auflage zu Auflage ändern läßt. Es wird ständig weitergeschrieben und so immer auf dem neuesten Stand gehalten werden können. Seine Benutzer werden bei der Lektüre miteinander und mit ihm interagieren und selbst entscheiden, in welcher Form es auf ihrem Bildschirm erscheint. Wenn das so ist, warum haben die Herausgeber des vorliegenden Werkes dann so viel Mühe darauf verwandt, das semiotische Wissen ihrer Zeit im Stil eines gedruckten Handbuchs zu präsentieren? Die Antwort auf diese Frage liegt wiederum auf der Hand. In Datenbanken ist Wissen nur virtuell gegeben, sie liefern nur gering strukturierte Informationssammlungen. Wer aus ihnen Nutzen ziehen will, braucht intellektuelle Vorgaben, muß relevante Problemstellungen an sie herantragen können. Diese zu liefern ist die Aufgabe eines Handbuchs. Für die Erarbeitung solcher Problemstellungen ist jahrelange elektronische Interaktion der Experten miteinander und mit den Daten notwendig; ebenso wichtig ist es aber, daß diese Interaktion schließlich abgeschlossen wird und zu einem Resultat führt, an dem dann festgehalten werden kann. Ein solches Resultat ist die in Artikel 1 formulierte Konzeption des vorliegenden Handbuchs. Das Handbuch macht ein Angebot für die Strukturierung unseres Wissens. Es ordnet die Daten in größere Zusammenhänge ein und liefert die Gesichtspunkte für ihre Systematisierung. Es schildert die Sachverhalte nicht nur aus einer Sicht, sondern bietet durch die inhaltliche Überlappung der Artikel und die Unterschiede in der intellektuellen Herkunft der Autoren eine Vielzahl wechselnder Perspektiven. Seine Gliederung in Abteilungen, Kapitel und Einzelartikel mit Zwischenüberschriften in Relevanz anzeigender Dezimalnotation, mit Textverweisen, Glossaren und Registern ist auch im Zeitalter der elektronischen Datenverarbeitung ein wesentliches Mittel der Wissensorganisation geblieben. Daß es weiterhin in gebundener Form auf Papier angeboten wird, ist demgegenüber eher ein Zufall. So viel zu dem Medium, dem sich die Leserin und der Leser anvertrauen, wenn sie das vorliegende Handbuch zu Rate ziehen.
1. Zum Gegenstand dieses Handbuchs Die Machart dieses Handbuchs hat viel mit seinem Gegenstand zu tun. Denn die Semiotik ist die Wissenschaft von den Zeichen. Sie untersucht das Verhältnis zwischen der Struktur der Wissensträger und der Struktur des Wissens. Dies ist allerdings nur eine ihrer Aufgaben. Denn Vorgänge, an denen Zeichen beteiligt sind, gibt es nicht nur
XVIII
Vorwort
in der wissenschaftlichen Forschung, sondern auch in der Produktion und Interpretation von Werken der Literatur, Musik und Kunst, im Umgang zwischen den gesellschaftlichen Institutionen und in der Alltagskommunikation. Vorgänge, an denen Zeichen beteiligt sind, sind auch nicht auf die menschlichen Kulturen beschränkt, sie treten auf in den Interaktionen aller Primaten, in den Orientierungs- und Wahrnehmungsweisen aller Lebewesen, in den Reiz- und Reaktionsprozessen der Tiere und Pflanzen, ja sogar im Stoffwechsel der Organismen und in der Informationsverarbeitung der Maschinen. Der Schwerpunkt des semiotischen Interesses liegt dabei auf den Prozessen des Informationsaustauschs, d. h. den Zeichenprozessen oder Semiosen. Wer die Zeichenprozesse in all ihren Varianten als einheitliches Phänomen erfaßt, dessen Auftreten die belebte Natur und die Kulturen der Menschen miteinander verbindet und von der unbelebten Natur unterscheidet, der hat den Schlüssel in der Hand, um den Geistes-, Sozial-, Ingenieurs- und Naturwissenschaften eine gemeinsame theoretische Basis für wohldefinierte arbeitsteilige Kooperation zu liefern. Wer das Verhalten von Menschen in ihren Kulturen unter dem Gesichtspunkt seiner Zeichenhaftigkeit zu betrachten gelernt hat, der kann auch das Leben in Familie und Beruf, Wirtschaft und Verwaltung, Kunst und Religion begrifflich als Einheit erfassen und in seiner disziplinüberschreitenden Vielfalt wissenschaftlich erforschen. Die Semiotik hat sich dies zur Aufgabe gemacht. Nach wichtigen Anfängen in Antike und Mittelalter hat die Semiotik ihren Durchbruch zur Wissenschaft im Zeitalter der Aufklärung geschafft und verfügt seit einem Jahrhundert über eine Reihe leistungsfähiger begrifflicher Grundlegungen, die in den letzten Jahrzehnten zu Komponenten formaler Theorien ausgebaut wurden. Wegen der großen Bedeutung der Semiotik für die Reorganisation der Wissenschaften und für die aufeinander bezogene Analyse von Kultur und Natur sind die Forderungen nach einer umfassenden Darstellung ihrer Geschichte und Systematik immer dringlicher geworden.
2. Zur Vorgeschichte und Zielsetzung Vom 17. bis 22. September 1979 wurde mit Unterstützung des Landes Berlin, der Stiftung Preußischer Kulturbesitz und der Deutschen Forschungsgemeinschaft an der Technischen Universität Berlin (West) eine internationale Arbeitstagung über „Systematik, Geschichte und Terminologie der Semiotik“ durchgeführt, die in ihrem Abschlußbericht drei Desiderate für die Darstellung des Forschungsstands der Semiotik formulierte. 1. Das erste Desiderat bestand in einem umfassenden Lexikon der Terminologie der wesentlichen Schulen und Richtungen der Semiotik, das ausgehend von den semiotischen Klassikern die Brücke zu der vielfach semiotisch undurchsichtigen Terminologie der zeichenbezogenen Einzelwissenschaften schlägt und sie Fachleuten und Laien durch Arbeitsdefinitionen und Begriffsexplikationen erschließt. Die Verwirklichung dieser Aufgabe, die Winfried Nöth (Universität Kassel) übernahm, führte von dem anfänglichen Konzept eines Wörterbuchs weg zu einem Manual, das die betreffenden Lexikoneinträge in größere Sachzusammenhänge stellt und dabei auch den jeweiligen wissenschaftshistorischen Kontext erläutert. Es wurde 1985 unter dem Titel Handbuch der Semiotik bei Metzler in Stuttgart publiziert, 1989 ins Serbokroatische übersetzt (bei Globus in Belgrad) und 1990 in einer erweiterten Neuausgabe von 576 Seiten Länge auf englisch herausgebracht (bei Indiana University Press in Bloomington). Als Sammlung terminologiekritischer Forschungsberichte über zentrale Teilgebiete der Semiotik des
Vorwort
XIX
20. Jahrhunderts hat es seine Nützlichkeit bereits vielfach bewiesen. Doch konnte man, wie der Autor selbst anmerkt, von diesem Einmannwerk naturgemäß weder eine in allen Teilen gleich differenzierte systematische Darstellung der Semiotik noch einen umfassenden Bericht über den weltweiten Forschungsstand erwarten. 2. Das zweite Desiderat bestand in einer Enzyklopädie, die zusätzlich zur Terminologie das zeitgenössische Wissen über die Gegenstände der Semiotik, über Leben und Werk der wichtigsten Semiotiker und über die Einflüsse der Semiotik auf die Künste und Wissenschaften des 20. Jahrhunderts darstellt. Diese Aufgabe übernahm Thomas A. Sebeok (Indiana University Bloomington), der als General Editor unter Mitwirkung eines internationalen Herausgeberbeirats, bestehend aus Paul Bouissac (Kanada), Umberto Eco (Italien), Jerzy Pelc (Polen), Roland Posner (Bundesrepublik Deutschland), Alain Rey (Frankreich) und Ann Shukman (Großbritannien) 1986 ein dreibändiges Encyclopedic Dictionary of Semiotics publizierte (bei Mouton de Gruyter in Berlin, 2. Auflage 1994), das auf 1179 Seiten 380 Artikel zusammenbringt, die von nicht weniger als 132 Autoren verfaßt wurden. Das Werk kam dem Ziel der Erfassung des weltweiten Forschungsstands in den 80er Jahren bemerkenswert nahe, konnte aber wegen der alphabetischen Anordnung der Artikel den systematischen Aufbau, die historische Entwicklung und den Ertrag für die Nachbarwissenschaften der Semiotik nicht im Zusammenhang darstellen. 3. Das dritte Desiderat bestand in einem Handbuch im eingangs charakterisierten Sinne, das sowohl die Systematik als auch die Geschichte der Semiotik in ihrem Verhältnis zu den anderen interdisziplinären Wissenschaften und den Einzelwissenschaften darstellt und zugleich die heute als relevant angesehene Terminologie und Theorienbildung der Semiotik kritisch vergleichend aufarbeitet. Für eine kanonische Geschichtsschreibung der Semiotik schien es beim Stand der Forschung Ende der 70er Jahre selbst in einem Gemeinschaftswerk noch zu früh. Angestrebt werden sollte jedoch ein Überblick über die in den verschiedenen Kulturen der Welt und in den verschiedenen Epochen des Abendlands vorherrschenden semiotischen Fragestellungen und die Angabe der wichtigsten historischen Einschnitte in deren Entwicklung. Auch das erklärte Ziel von Charles W. Morris im Rahmen von Otto Neuraths Projekt einer International Encyclopedia of Unified Science aus den Jahren 1938 ff, nämlich die vollständige Rekonstruktion der Fragestellungen, Methoden, Theorien und Darstellungsweisen der Einzelwissenschaften auf semiotischer Basis, erschien beim heutigen Entwicklungsstand sowohl der Semiotik als auch der Einzelwissenschaften utopisch. Dennoch sollte die theoretische Grundlage dafür beschrieben und in der Explikation ausgewählter Teile der Einzelwissenschaften erprobt werden. Das Ergebnis dieser Bestrebungen ist das vorliegende Werk. Es enthält in 3 Bänden auf über 3000 Seiten 178 Artikel, die von 175 Autoren aus 25 Ländern stammen. Nicht enthalten sind im vorliegenden Handbuch Spezialartikel über Fachtermini oder Autoren; derartige Informationen können über das Sachregister bzw. das Personenregister innerhalb systematischer und historischer Artikel aufgesucht werden. Historische Strömungen der Semiotik werden nur dann in eigenen Artikeln abgehandelt, wenn sie in der heutigen Semiotik wirksam sind. Spezielle Zeichengebräuche werden im Handbuch im allgemeinen nicht direkt („enzyklopädisch“) erfaßt, sondern in Darstellungen der betreffenden Kultur oder Epoche bzw. im Rahmen einer semiotischen Rekonstruktion der für sie zuständigen Einzelwissenschaften behandelt.
XX
Vorwort
Dabei stellen die Artikel des Handbuchs nicht nur bekanntes Wissen dar, sondern weisen auch auf Lücken und Inkonsistenzen in diesem Wissen hin, bringen bisher unveröffentliche Informationen und versuchen neue Systematisierungen. Während das Encyclopedic Dictionary eine umfassende Gesamtbibliographie enthält, die die semiotisch relevante Literatur nach dem Stand der frühen 80er Jahre alphabetisch aufführt, liefert das vorliegende Handbuch in benutzerfreundlicher Weise die Literaturhinweise am Ende jedes Artikels. Im Gegensatz zum Encyclopedic Dictionary ist das Handbuch reich mit schwarz-weißen und farbigen Abbildungen ausgestattet, die die semiotischen Gegenstände nicht nur beschreiben, sondern soweit möglich auch veranschaulichen.
3. Zum Aufbau des Handbuchs Wie ein Blick auf das Inhaltsverzeichnis zeigt, ist das Handbuch in sechzehn Kapitel gegliedert, die sich in sechs Abteilungen zusammenfassen lassen. Die Abteilung A (31 Artikel) liefert einen in dieser Weise sonst nirgends zu findenden theoretisch durchstrukturierten Aufriß des gesamten Gebiets der Semiotik. Sie enthält Kapitel über die Systematik (I), die Gegenstände (II und III) und die Methoden (IV) der Semiotik. Die Abteilung B (68 Artikel) ergänzt die in A gegebene systematische Präsentation der Semiotik als Wissenschaft durch eine in dieser Form erstmalige umfassende Darstellung des impliziten semiotischen Denkens der wichtigsten Kulturen der Welt und der verschiedenen Epochen des Abendlands. Sie beginnt mit einem Kapitel über Rahmenbedingungen und Probleme einer Geschichtsschreibung der Semiotik (V), behandelt dann nacheinander die Zeichenkonzeptionen des Keltischen, Germanischen und Slavischen Altertums (VI), der Griechischen und Römischen Antike (VII), des Mittelalters (VIII), der Zeit von der Renaissance bis zum frühen 19. Jahrhundert (IX) sowie des 19. und 20. Jahrhunderts (X) und schließt mit einem Kapitel über die bemerkenswert komplexen und differenzierten Zeichenkonzeptionen in Religion, Kunst und Alltagsleben nichtabendländischer Kulturen (XI). Die Abteilung C (Kapitel XII) gibt die Vielfalt der heute virulenten Strömungen der Semiotik in 23 Einzelartikeln wieder. Dabei werden die wichtigsten Fragestellungen, Begriffe, Methoden und Ergebnisse der betreffenden Wissenschaftstraditionen mit Hilfe des in Kapitel I entwickelten begrifflichen Instrumentariums historisch-systematisch dargestellt. Die Abteilung D (36 Artikel) untersucht die Möglichkeiten einer systematischen Rekonstruktion der zeichenbezogenen Universitätsdisziplinen und interdisziplinären Wissenschaften auf semiotischer Basis. Sowohl bei der Diskussion des Verhältnisses zwischen der Semiotik und anderen interdiszipinären Wissenschaften (Kapitel XIII) als auch zwischen der Semiotik und den Einzelwissenschaften (Kapitel XIV) geht es um die wissenschaftstheoretisch relevante Frage, in welchem Maße die Gegenstände, Methoden und Darstellungsweisen der betreffenden Wissenschaften sich als Zeichenprozesse verstehen lassen. Die Beantwortung dieser Frage ist entscheidend dafür, welche Rolle die Semiotik bei der Reorganisation des durch Überspezialisierung in die Krise geratenen Systems der akademischen Wissenschaften spielen kann. Die Abteilung E (Kapitel XV) geht in 18 Artikeln auf ausgewählte Zeichenprobleme aus den heutigen industriellen und postindustriellen Gesellschaften ein, die im Rahmen
Vorwort
XXI
der herkömmlichen akademischen Wissenschaften nur am Rande oder überhaupt nicht behandelt werden. Anders als in den übrigen Abteilungen, die die vollständige Abdekkung eines Problemfeldes anstreben, sollen die Leser hier anhand von exemplarischen Fragestellungen die Vielfalt der Anwendungsbereiche und den Leistungsstand der heutigen Semiotik kennenlernen und dadurch zu ihrer Weiterentwicklung und kreativen eigenen Anwendung angeregt werden. Die Abteilung F (Kapitel XVI) bietet denn auch praktisch arbeitenden Semiotikern für ihre Untersuchungen eine Reihe konkreter Arbeitshilfen an. Sie gibt einen Überblick über semiotische Institutionen und Organisationen und orientiert die Leser über semiotische Nachschlagewerke und Zeitschriften. Der umfassende Personen- und Sachindex gestattet die Verwendung des Handbuchs als Enzyklopädie und Wörterbuch. Diese Abteilungen sind wie folgt auf die drei Teilbände des Handbuchs verteilt: Band 1 liefert die theoretischen Grundlagen (Abteilung A) und präsentiert aus Abteilung B das Kapitel über die Rahmenbedingungen und Probleme einer Geschichtsschreibung der Semiotik (V) sowie die Kapitel über die Geschichte der abendländischen Semiotik von den Anfängen bis zur Renaissance (VI⫺VIII). Band 2 vervollständigt die Geschichte der Semiotik, indem er die abendländische Semiotik von der Renaissance bis zur Gegenwart weiterführt (IX⫺X), sie durch die Zeichenkonzeptionen der nichtabendländischen Kulturen ergänzt (XI) und (in Abteilung C, Kapitel XII) die Gegenwartsströmungen der Semiotik abhandelt. Band 3 bringt die wissenschaftstheoretischen Aspekte der Semiotik (Abteilung D) mit den beiden Kapiteln über das Verhältnis der Semiotik zu den anderen interdisziplinären Wissenschaften (XIII) und zu den Einzelwissenschaften (XIV) sowie die anwendungsorientierten Aspekte der Semiotik (Abteilung E, Kapitel XV) und den Anhang (Abteilung F, Kapitel XVI) für die praktische semiotische Arbeit. Eine ausführliche Darstellung und Begründung der Gliederung des Handbuchs mit kurzen Kommentaren zu den Inhalten der Einzelartikel finden die Leser in Artikel 1 „Semiotics and its presentation in this Handbook“.
4. Zu den Adressaten und zum Umgang mit dem Handbuch Artikel 1 macht auch aufmerksam auf spezielle Modalitäten der Benutzung des Handbuchs. a. Wer eine Einführung in die Semiotik sucht, der findet sie in folgenden Artikeln: Die Anfangsteile der Artikel 1⫺4 (Kapitel I) machen mit den Aufgaben und der Einteilung der allgemeinen Semiotik bekannt; die Artikel 18⫺27 (Kapitel III) führen in die Bio-, Zoo-, Anthropo- und Maschinensemiotik ein; die Artikel 32⫺35 (Kapitel V) thematisieren die Geschichte und Geschichtsschreibung der Semiotik; über die Gegenwartsströmungen der Semiotik orientieren die Artikel 100⫺122 (Kapitel XII); als Einführung in die speziellen Zeichenkonzeptionen, die in nichtabendländischen Kulturen entwickelt worden sind, eignen sich die Artikel 89⫺99 (Kapitel XI). b. Wer Hintergrundinformationen zu den semiotischen Aspekten bestimmter Wissenschaften, Künste und anderer Kulturbereiche sucht, der kann sich durch die Kapitel über die Antike (VII), das Mittelalter (VIII), die Zeit von der Renaissance bis zur Aufklärung (IX), das 19. und 20. Jahrhundert (X) bzw. die Einzelwissenschaften (XIV) als ganze durcharbeiten. Er kann sich aber auch quer dazu bewegen und die betreffenden Reihen von Artikeln nacheinander lesen: zur Philosophie die Artikel 40,
XXII
Vorwort
49, 62, 74, zur Mathematik die Artikel 41, 51, 66, 78, 133, zur Logik die Artikel 52, 64, 76, zur Sprachphilosophie die Artikel 65 und 77, zur Kunstphilosophie und Ästhetik die Artikel 50, 63, 75, zur Grammatik, Rhetorik, Poetik und Stilistik die Artikel 42, 53, 67, 79, 80, 149, zur Architektur und bildenden Kunst die Artikel 44, 55, 69, 82, 154, 155, zur Musik die Artikel 43, 54, 68, 81, 152, zur Medizin die Artikel 45, 56, 70, 83, 140, zur Naturlehre (inklusive Physik, Chemie und Biologie) die Artikel 46, 57, 71, 84, 85, 134, 135, 136, 138, zur Religion die Artikel 47, 58, 72, 87, 158, zum Alltagsleben die Artikel 48, 59, 73, 88. Das Handbuch liefert auf diese Weise viele parallele Längsschnitte durch die Kulturgeschichte und ist in dieser Hinsicht ein System von ineinander geschachtelten Monographien. c. Wer Lösungen für aktuelle Probleme sucht und sich dabei von der disziplinübergreifenden Reanalyse unserer Zivilisation (in der Wirtschaft, in der Arbeitswelt, im Sport, im Tourismus, in der Gerontologie, in der menschlichen Interaktion und im Umgang mit Tieren) anregen lassen möchte, der kann auf Kapitel XV des Handbuchs zurückgreifen. d. Wer nachschlagbares Wissen sucht, der kann das Handbuch benutzen ⫺ als zweisprachiges Glossar (englisch-deutsch und deutsch-englisch) der semiotischen Terminologie aller Zeiten (im Sachindex), ⫺ als Enzyklopädie der als Zeichen interpretierbaren Erscheinungen von Natur und Kultur (ebenfalls erschlossen durch den Sachindex), ⫺ als Who-’s-who der Semiotik (durch den Personenindex), ⫺ als Manual der Institutionen semiotischer Forschung und Lehre weltweit (im Anhang, Artikel 177), ⫺ als Verzeichnis der semiotischen wissenschaftlichen Gesellschaften (ebenfalls in Artikel 177), ⫺ als Bibliographie der anderen semiotischen Nachschlagewerke und Zeitschriften (in Artikel 178). Mit diesem umfangreichen Angebot wendet sich das Handbuch an folgende Benutzergruppen: ⫺ Experten der Semiotik, die ihr historisches oder systematisches Wissen erweitern wollen, ⫺ Einzelwissenschaftler, die den Stellenwert und das Potential ihrer Disziplin im System der Wissenschaften abschätzen wollen, ⫺ ausübende Künstler der verschiedenen Bereiche, die ihr Tun als Zeichenproduktion verstehen wollen, ⫺ kulturell Interessierte, die unser Verhalten im Alltagsleben der verschiedenen Kulturen als Zeichenpraxis begreifen wollen, ⫺ jeden an den Beziehungen zwischen Kultur und Natur Interessierten. Gemeint sind vor allem die Lehrenden und Lernenden der Geistes- und Sozialwissenschaften sowie der Biologie, Medizin und Wissenschaftstheorie: Lehrer an Gymnasien und Fachhochschulen, Dozenten und Studierende der Universitäten. Gedacht ist aber auch an die Praktiker der entsprechenden Berufe, etwa an Kommunikationstechniker, Medienexperten, Verlagsspezialisten, Produktdesigner, Werbefachleute, Touristikexperten, Sozialpädagogen, Seelsorger, Psychoanalytiker, Ärzte und Architekten. Besonders wichtig ist das Handbuch für die Bibliotheken der Fortbildungsinstitutionen, z. B. in der Lehrerfortbildung, in der es darauf ankommt, Überblicke über die neuere Wissenschaftsentwicklung und das Verhältnis der Wissenschaften zueinander zu vermitteln.
Vorwort
XXIII
5. Zur Herstellungsweise und Form der Artikel Wie eingangs festgestellt, ist dieses Handbuch in mehrfacher Hinsicht ein Gemeinschaftswerk. Seine Zielsetzung ist aus einer Arbeitstagung hervorgegangen, und seine Konzeption ist das Resultat jahrelanger gemeinsamer Überlegungen der Herausgeber mit den Autoren. Auch seine Artikel sind dialogisch abgefaßt. Zunächst wurden auf der Basis des Wissensstands der 80er Jahre Rohfassungen von Grundsatzartikeln zur Systematik und Geschichte der Semiotik geschrieben. Diese (d. i. Artikel 1, 2, 3, 4, 5, 18, 34, 123 und 132) bildeten ein Konvolut von über 500 Seiten, das der Verlag dankenswerterweise allen 175 Autoren als Arbeitsmaterial zur Verfügung stellte. Diese waren aufgefordert, das Material ihren eigenen Artikeln zugrunde zu legen und entsprechend den Erfordernissen ihrer Artikel Korrekturen, Ergänzungen, weitergehende Differenzierungen oder andere Modifikationen vorzuschlagen. In die Endfassungen der Grundsatzartikel wurden all diese Vorschläge eingearbeitet. In den durch die Herausgeber angeregten Dialogen zwischen den Autoren der verschiedenen Artikel kam es nicht immer zu einer vollständigen Einigung. Auch dies wird im Handbuch dokumentiert, um die Leser zu veranlassen, die Dialoge fortzuführen. Verbliebene Meinungsunterschiede zwischen den Autoren wurden nicht geglättet, sondern vielmehr bis in die Terminologie hinein erkennbar gehalten. Bei inhaltlichem Dissens wurden die Autoren zur Mehrfachbehandlung desselben Themas von ihren verschiedenen Standpunkten aus ermutigt. Kreuzverweise machen auf solche Spuren des Dialogs aufmerksam, und wo mehr Deutlichkeit wünschenswert war, erhielten die Autoren Gelegenheit zu expliziter argumentativer Distanzierung voneinander. Auch in der äußeren Form wurde sorgfältig darauf geachtet, daß bei allen Änderungsvorschlägen der Herausgeber die Individualität jeder Autorin und jedes Autors erhalten blieb. Das betraf die Textkomposition des Artikels als in sich geschlossener wissenschaftlicher Abhandlung ebenso wie den Schreibstil. Oberstes Prinzip war die artikelinterne Einheitlichkeit. Dementsprechend weisen die Artikel untereinander erhebliche Unterschiede auf: ⫺ in der Wahl der Sprache (Deutsch oder Englisch mit ihren verschiedenen Varianten), ⫺ in der Übersetzungsweise bei Artikeln, die ursprünglich in einer dritten Sprache geschrieben worden waren, und bei Zitaten aus anderssprachigen Originalen, ⫺ in den Weisen der Hervorhebung im Text durch Kursiv- und Sperrsatz, ⫺ in der Handhabung der Anführungszeichen bei Äußerungs- und Ausdruckszitaten, bei Bedeutungsanführungen und bei der Distanzierung von Fremdformulierungen, ⫺ in der Wahl und Gebrauchsdichte von Abkürzungen deutscher, englischer und lateinischer Herkunft, ⫺ in der Angabe von Lebensdaten bei Autoren, ⫺ in der Gliederung und Ausstattung des Literaturverzeichnisses und ⫺ in der Zitierweise der Literatur im Text. Die Art, wie diese Formalien gehandhabt werden, ist kein zufälliger Schnörkel, sondern sagt etwas aus über die Einstellung des Autors zu seinem Thema. Selbstverständlich wurde dafür gesorgt, daß die Angaben bei all ihrer formalen Vielfalt in der Sache verläßlich sind. Ein Team von Mitarbeitern hat den Herausgebern bei der Überprüfung geholfen. Im Ergebnis stellt sich das Handbuch dem Leser dar als multikultureller wissenschaftlicher Text, der in Gestalt und Inhalt komplementäre Herangehensweisen bewahrt und die Verschiedenheit der Wissenschaftssozialisation seiner Autoren dokumentiert.
XXIV
Vorwort
Besonders hingewiesen sei der Leser auf die wechselnde Nähe der bestehenden Fachtraditionen zur semiotischen Terminologie und Theorienbildung. Mehr als ein Autor hat dieses Problem explizit formuliert. So schreibt F. A. Gallo (Bologna): „There has […] been no common ground upon which semiotics and the study of medieval music could meet“ (S. 1060); H. Holländer (Aachen) stellt fest: „Es ist nicht üblich, die zeichentheoretische Terminologie auf mittelalterliche Kunst anzuwenden“ (S. 1066); und K. Düwel (Göttingen) führt aus: „Semiotische Zugänge, vor allem zur nordgermanischen Literatur, wurden vereinzelt versucht, doch findet sich auch in der älteren Forschung Vergleichbares, ohne daß ausdrücklich von ‘Semiotik’ die Rede ist“ (S. 816). In diesem Sinne war die Übernahme der Autorschaft für die Mehrzahl der Autoren eine erhebliche Herausforderung. Sie sollten ihre Fachtradition ernst nehmen und sie zugleich in weitgehend fachfremder Terminologie neu formulieren. Die semiotische Fragestellung führte dabei vielfach zu beträchtlichen Akzentverschiebungen, zur Entdekkung von Forschungslücken und zur Uminterpretation bestehender Forschungsergebnisse. In der Mehrzahl der Artikel dieses Handbuchs wird auf diese Weise Neuland betreten. Und das gilt nicht nur für den historischen Teil im ersten und zweiten Band, sondern ebenso für die detaillierte systematische Darstellung der Typen der Semiose im ersten Band, die auf eine semiotische Reinterpretation der Biologie hinausläuft, und für den wissenschaftstheoretisch orientierten Teil im dritten Band. Viele seiner Artikel eröffnen Perspektiven auf Zukunftsaufgaben in der Zusammenarbeit zwischen der Semiotik und den Einzelwissenschaften.
6. Danksagungen So gilt denn auch der größte Dank der Herausgeber den Autorinnen und Autoren des Handbuchs. Der Dialog mit ihnen war immer spannend und hat Spaß gemacht. Wir haben gelernt, wie man Fachleute dazu bringt, ihr implizites semiotisches Wissen explizit zu machen, zunächst fachfremd scheinende Fragestellungen über ihren Stoff als relevant zu akzeptieren, sich mit den Vertreterinnen und Vertretern anderer Fächer durch den Austausch von Manuskripten inhaltlich abzustimmen und mitunter recht lange zu warten, bis andere Autoren (zumeist solche, die erst später mit der Arbeit beginnen konnten, da sie plötzlich entstandene Lücken zu füllen hatten) mit ihrem Beitrag fertig waren. Wir haben gelernt, wie man Semiotikerinnen und Semiotiker der verschiedenen Schulen zur Allgemeinverständlichkeit ihrer Formulierungen und zur Durchsichtigkeit ihrer Darstellungen über die Schulgrenzen hinweg anhält (dies war auch ein beliebtes Thema im Gespräch der Herausgeber untereinander). Wir haben unverhofft dabei auch für uns neue Aspekte der Semiose kennengelernt, etwa welchen Unterschied es macht, ob man die Zeichen in den statischen Dingen oder in den Bewegungsabläufen sucht (vgl. Artikel 91), welche Rolle die Metaphorik in allen Lebensbereichen für die Kohärenz einer Kultur spielt (vgl. Artikel 99), in welchem Maße sich die Schrift als Folie der Selbstinterpretation einer Kultur eignet (vgl. Artikel 61) und wie wichtig es ist, Menschen und andere Lebewesen nicht auf die Sender-EmpfängerDichotomie zu verkürzen, sondern sie auch ihrerseits als Zeichen ernst zu nehmen (vgl. Artikel 59 und 73). Besonders bedanken möchten wir uns auch bei unseren Kolleginnen und Kollegen; es sind zu viele, als daß wir sie hier einzeln namentlich anführen könnten. Sie haben uns Hinweise zur inhaltlichen und formalen Gestaltung des Handbuchs gegeben, die
Vorwort
XXV
mitunter entscheidend waren für die Umsetzung unserer konzeptionellen Utopie in eine durch Mitglieder des heutigen Wissenschaftsbetriebs realisierbare Form, für das Zuschneiden des Stoffes in handhabbare Kapitel und Artikel, für die Aufstellung der inhaltlichen Desiderate, die ⫺ selbst ein Buch von 175 Seiten ⫺ dann den Autoren als Ausgangspunkt für ihre Recherchen dienten, und nicht zuletzt für die weltweite Suche nach Autoren, die sowohl Experten ihres Gebiets als auch Kenner der Fachliteratur außerhalb ihrer Muttersprache sein sollten. Mehr als einmal waren es nicht die Herausgeber, die Autoren ermuntern mußten, bei der Stange zu bleiben, sondern Autoren und Kollegen, die den Herausgebern Mut gemacht haben, die Arbeit allen widrigen Umständen zum Trotz fortzusetzen und zu Ende zu führen. Das ganze Unternehmen fiel ja in eine Zeit großer politischer Umwälzungen, die zwei der Herausgeber in Berlin hautnah miterlebt haben. Sehr dankbar sind wir darum den Mitarbeiterinnen und Mitarbeitern an der Arbeitsstelle für Semiotik und am Institut für Linguistik der TU Berlin, die in all diesen Jahren die Arbeit am Handbuch bereitwillig unterstützt haben. Zu nennen sind Doris Mosbach, die uns in Fragen der Ausstattung des Werkes mit Abbildungen beriet, Heinz Beckmann, Sabine Kowal und Dagmar Schmauks, die uns beim Korrekturlesen halfen und dabei auch wichtige inhaltliche Verbesserungsvorschläge einbrachten, Theodore Slabey und John Orman, die die stilistische Überarbeitung deutscher und englischer Beiträge übernahmen und die Literaturangaben auf ihre Vollständigkeit hin überprüften, Thomas Diße-Runte und Barbara Schäfer, die die Verschriftung der altgriechischen und hebräischen Termini korrigierten und vereinheitlichten, Lothar Köster, der den Personen- und Sachindex erstellte, Helga Brummenbaum, Jürgen Rochel und Monika Meerwald, die den umfangreichen Schriftwechsel im Sekretariat betreuten und so den Dialog mit den Autoren erleichterten. Es gilt auch anzuerkennen, daß einige akademische Institutionen die Arbeit der Herausgeber erleichterten. Erwähnt sei der Fachbereich Kommunikations- und Geschichtswissenschaften der TU Berlin, der zweimal für einige Monate die Mittel für eine halbe studentische Hilfskraftstelle bewilligte, sowie die bibliographische Auskunft der Staatsbibliothek zu Berlin Preußischer Kulturbesitz, deren Mitarbeiterinnen und Mitarbeiter auch schwierige bibliographische Fragen mit detektivischem Spürsinn beantworteten. Dem Netherlands Institute for Advanced Study in the Humanities and Social Sciences (Wassenaar) ist zu danken, daß es Roland Posner in der wichtigen Phase der Handbuchkonzipierung durch ein einjähriges Fellowship im akademischen Jahr 1986⫺87 die notwendige Muße zu ungestörtem Nachdenken gewährte. In dieser Zeit wurden die Erstfassungen der Grundlagenartikel zum Handbuch geschrieben, die Ausgangspunkt für alle weiteren Schritte waren. Großer Dank gebührt dem Verlag und seinem Inhaber Dr. Kurt-Georg Cram, der in schwierigen Zeiten ungewöhnlichen Weitblick und große Flexibilität in Kalkulation und Herstellung des Werks bewiesen hat. Unser herzlicher Dank gilt nicht zuletzt dem zuständigen Reihenherausgeber Herbert Ernst Wiegand, der in allen Phasen stets unerschütterlich zu diesem Projekt gestanden hat. Im August 1996
Roland Posner Klaus Robering Thomas A. Sebeok
Preface Printed dictionaries, encyclopedias, and handbooks appear anachronistic today. Instead of being looked up in a library, the accumulated knowledge of the times will in the future be called up on the computer screen from globally connected databanks. Courtesy of chips and discette or CD-ROM storage, the contents of hundreds of handbooks will fit into the palm of one’s hand. Furthermore, knowledge in the electronic medium will not be present as a finished product which has its own identity and can be changed only in macro steps from edition to edition, but will be treated as work in progress and continuously updated. Instead of merely reading it, users will interact with it and with each other and thus decide themselves in what form they wish to access it. If this is so, why have the editors of the present work invested so much effort into publishing the semiotic knowledge of their time in the form of a printed handbook? The answer is obvious. Knowledge stored in databanks is only virtually present, since the information given there is minimally structured. To make use of it, one needs additional information such as would enable one to ask relevant questions. This is what a handbook provides. The elaboration of an appropriate system of questions requires long-term electronic interaction of experts with each other and with the information in question; however, it is at least as important that this elaborative phase be brought to a conclusion and a resolution be reached on which the data presentation can then be based. Such a resolution is to be found in the handbook conception formulated in Article 1 of the present Handbook. The Handbook offers a specific structuring of our knowledge. It establishes contexts for the data and provides a perspective for their systematization. It does not account for the subject matter from one standpoint only but presents a multiplicity of viewpoints due to systematic overlap between the articles and differences in the intellectual background of their authors. The division of this Handbook into sections, chapters, and individual articles with inserted captions in numbered notation to indicate their relevance, with cross-references, glossaries, and indexes, continues to be an essential means of organizing knowledge even in the age of electronic data processing. The fact that this knowledge system happens to be presented in a bound paper version is accidental. So much for the medium in which the reader engages the present Handbook.
1. The subject matter of this Handbook The design of this Handbook has much to do with the subject matter itself; for semiotics is the science of signs. It studies the relationship between the structure of knowledge carriers and the structure of knowledge. Yet this is only one of its tasks. Processes involving signs are to be found in scientific research as well as in the production and interpretation of works of literature, music, and art, in the dealings between social
Preface
XXVII
institutions, and in everyday communication. Such processes are not restricted to human cultures, they occur in the interactions of primates, in the activities of orientation and perception of animals, in the stimulus-response processes of all living beings, and even in the metabolism of organisms and in the processing of information in machines. In all these cases the focus of semiotic interest resides in the processes of transmission of information, i.e., in sign processes or semioses. If one conceives of sign processes in all their variations as a unitary phenomenon which connects living nature with human culture and distinguishes them both from inanimate nature, one has the key to providing the human, social, engineering, and natural sciences with a common theoretical basis for well-defined division of labor and cooperation. And if one comes to regard human behavior in all cultures as sign production and reception, one facilitates an understanding of life in family and profession, commerce and administration, art and religion in a unified way and makes possible its scientific investigation in a diversity which transcends disciplinary boundaries. Semiotics has made this its taks. After important beginnings in Antiquity and the Middle Ages, semiotics established itself as a scientific enterprise in the Age of Enlightenment and has developed several efficient conceptual approaches in the last hundred years. These have been elaborated into components of formal theory in recent decades. The focal relevance of semiotics for the reorganization of the academic disciplines and for the interlinked analysis of nature and culture has led to increasingly urgent demands for a comprehensive presentation of its history and systematics.
2. Concept and objectives On September 17⫺22, 1979, an international workshop on “The Systematics, History, and Terminology of Semiotics” took place at the Technische Universität Berlin (West), supported by the Berlin government, the regional foundation Stiftung Preußischer Kulturbesitz and the national German funding agency Deutsche Forschungsgemeinschaft. In its final report, the workshop formulated three desiderata for a presentation of the state of the art in semiotics. 1. The first desideratum was a comprehensive dictionary of the terminology of the essential schools and directions of semiotics. It was to bridge the gap between semiotics and the often semiotically opaque terminology of the sign-related academic disciplines by providing working definitions and conceptual explications for experts as well as laymen. Winfried Nöth (Universität Kassel) tried to accomplish this task but later departed from the initial dictionary concept for that of a manual which could place the individual dictionary entries into a larger context and take into account their background in the history of science. This work was published under the title Handbuch der Semiotik (Stuttgart: Metzler 1985), translated into Serbo-Croatian (Belgrade: Globus 1989), and reworked and expanded in an American edition (Bloomington: Indiana University Press 1990, 576 pages). Its emphasis on terminology has made this review of central areas of semiotics particularly useful. The author himself has noted, however, that one can expect neither an equally detailed account of all domains of semiotics nor a report on the world-wide state of the art from such a work by a single author. 2. The second desideratum was an encyclopedia which would present, in addition to articles on essential technical terms, the current state of our knowledge of the subject
XXVIII
Preface
matter of semiotics, the life and work of the most important semioticians as well as the influence semiotics has had on the arts and sciences in the 20th century. This task was undertaken by Thomas A. Sebeok (Indiana University, Bloomington), with the help of an international Editorial Board consisting of Paul Bouissac (Canada), Umberto Eco (Italy), Jerzy Pelc (Poland), Roland Posner (Federal Republic of Germany), Alain Rey (France), and Ann Shukman (Great Britain). The result was the Encyclopedic Dictionary of Semiotics (Berlin: Mouton de Gruyter 1986; 2nd edition 1994), which brings together in 1179 pages 380 articles written by no fewer than 132 authors. This work came remarkably close to the goal of summarizing the world-wide state of the art in the 80s, but the alphabetic order of its articles did not allow it to present the systematic coherence, the historical development, and the advantages of the semiotic approach for the sign-related disciplines. 3. The third desideratum was a handbook in the sense described above, which would treat the systematics as well as the history of semiotics in relation to other interdisciplinary approaches and individual disciplines and give a critical comparative account of currently relevant semiotic terminology and theory construction. In terms of the state of research in the late 1970s, the time was not ripe for a canonical historiography of semiotics, not even in a collective work. What was to be engaged instead, was an overview of salient semiotic problem formulations across world cultures and through the successive epochs of Western history, along with a specification of the most important changes which have come about in the course of their development. As to the systematics of semiotics, the goal that Charles W. Morris had set for Otto Neurath’s project of an International Encyclopedia of Unified Science in 1938, i.e., a complete semiotic reconstruction of the topics, methods, theories, and ways of presentation in the individual disciplines, seemed utopian as well in view of the state of research both in semiotics and the individual disciplines in the late 1970s. What appeared feasible, however, was a description of the theoretical basis for such a task and its exemplification in a semiotic explication of selected parts of the individual disciplines. The present work is the result of these efforts. Its three volumes present in more than 3000 pages 178 articles written by 175 authors from 25 countries. Not part of this Handbook are special articles on technical terms or on individual authors. These are treated in systematic or historical articles and can be found with the help of the subject and person indexes. Historical movements in semiotics are considered in special articles only if they are operative in present-day semiotics. Special sign uses are not described directly (“encyclopedically”) in the Handbook, but rather as part of presentations of the culture or epoch in question or in the framework of a semiotic reconstruction of the individual disciplines that study them. The articles of the Handbook not only present available information but also indicate gaps or inconsistencies, introduce previously unpublished material and attempt new systematizations. While the Encyclopedic Dictionary contains a comprehensive bibliography which lists alphabetically all semiotically relevant literature up to the early 1980s, the Handbook presents references in a user-friendly way at the end of each article. Unlike the Encyclopedic Dictionary, the Handbook includes drawings as well as black-and-white and color photographs which not only describe the semiotic subject matter but also showcase it as far as possible visually.
Preface
XXIX
3. Structure and contents As shown in the table of contents, the Handbook contains sixteen chapters. They can be grouped into six parts. Part A (31 articles) presents a theory-based outline of the entire field of semiotics. This unique reference includes chapters on the systematics (I), subject matter (II and III), and methods (IV) of semiotics. Part B (68 articles) complements this systematic account of semiotics by providing for the first time a survey of implicit semiotic thought in the most important cultures of the world and through the successive epochs of Western history. It starts with a chapter on presuppositions and problems in the historiography of semiotics (V), then deals with the sign conceptions of Celtic, Germanic, and Slavic Antiquity (VI), Ancient Greece and Rome (VII), the Middle Ages (VIII), the period from the Renaissance to the early 19th century (IX), as well as the 19th and 20th centuries (X), and concludes with a chapter on the remarkably complex and elaborated sign conceptions in religion, art, and everyday life of Non-Western cultures (XI). Part C (Chapter XII) describes, in 23 articles, the various trends currently operative within semiotics. It presents the most important questions, concepts, methods, and results of each trend within its historical context, by means of the conceptual apparatus developed in Chapter I. Part D (36 articles) analyzes the possibilities of a systematic reconstruction of the sign-related university disciplines and interdisciplinary approaches on a semiotic basis. The discussion of the relationship between semiotics and other interdisciplinary approaches (Chapter XIII) as well as the relationship between semiotics and the individual disciplines (Chapter XIV) focuses on the epistemologically relevant question as to the extent to which the subject matter, methods, and ways of presentation in each science can be understood as sign processes. The answer to this question is decisive for the role semiotics is to play in reorganizing the system of academic disciplines, caught as it is in a crisis of overspecialization. Part E (Chapter XV) contains 18 articles on selected sign problems in contemporary industrial and post-industrial societies ⫺ problems treated only marginally or not at all in the context of the current university disciplines. In contrast with other parts of the Handbook, this one is not meant to cover the whole problem area, but only to display a variety of current applied fields and to demonstrate the capacity of contemporary semiotics to cope with them, in the hope that the reader will be stimulated to further development and creative application. Part F (Chapter XVI) offers practioners of semiotics a series of concrete professional tools. It surveys semiotic institutions and organizations and informs the reader about semiotic reference sources and periodicals. The comprehensive person and subject indexes allow the use of the book both as encyclopedia and as dictionary. The parts of the Handbook are allocated to the three volumes as follows: Volume 1 provides the theoretical foundations (Part A) and contains the first chapters of Part B, which deal with the presuppositions and problems of semiotic historiography (V) and the history of Western semiotics from the beginnings to the Renaissance (VI⫺VIII). Volume 2 completes the history of semiotics, treating Western semiotics from the Renaissance to the present (IX⫺X), sign conceptions in Non-Western cultures (XI), and current trends in semiotics (XII). Volume 3 presents the epistemological aspects of semiotics (Part D) in the chapters on the relationship between semiotics and other interdisci-
XXX
Preface
plinary approaches (XIII) and between semiotics and the individual disciplines (XIV); it then focuses on the applied aspects of semiotics (Part E) and concludes with the professional tools in the appendix (Part F). Article 1, “Semiotics and its presentation in this Handbook”, gives a detailed account and justification of the structure of the Handbook, with short comments about the contents of the individual articles.
4. Intended readership and use Article 1 also draws attention to particular ways of using the Handbook. a. Readers who seek an introduction to semiotics can turn to the following articles: The initial sections of Articles 1⫺4 (Chapter I) set forth the tasks and branches of general semiotics; Articles 18⫺27 (Chapter III) summarize the subject matter of bio-, zoo-, anthropo-, and machine-semiotics; Articles 32⫺35 (Chapter V) focus on the history and historiography of semiotics; Articles 100⫺122 (Chapter XII) inform the reader regarding current trends in semiotics; Articles 89⫺99 (Chapter XI) can be consulted for introductions to the special sign conceptions developed in Non-Western cultures. b. Readers looking for background knowledge about the semiotic aspects of specific sciences, arts, and other domains of cultural life can work through each of the chapters on Antiquity (VII), the Middle Ages (VIII), the period from the Renaissance to the Enlightenment (IX), the 19th and 20th centuries (X), or individual disciplines (XIV). However, one can also cut across the grain and read particular articles in sequence selectively: on philosophy, Articles 40, 49, 62, 74; on mathematics, Articles 41, 51, 66, 78, 133; on logic, Articles 52, 64, 76; on philosophy of language, Articles 65 and 77; on the philosophy of art and aesthetics, Articles 50, 63, 75; on grammar, rhetoric, poetics, and stylistics, Articles 42, 53, 67, 79, 80, 149; on architecture and the fine arts, Articles 44, 55, 69, 82, 154, 155; on music, Articles 43, 54, 68, 81, 152; on medicine, Articles 45, 56, 70, 83, 140; on natural history and natural philosophy (including physics, chemistry, and biology), Articles 46, 57, 71, 84, 85, 134, 135, 136, 138; on religion, Articles 47, 58, 72, 87, 158; on everyday life, Articles 48, 59, 73, 88. In this way, the Handbook offers parallel longitudinal sections in the history of culture and can thus be regarded as a system of interlinked monographs. c. Readers looking for solutions to actual problems and eager to be stimulated by a transdisciplinary reanalysis of our civilization (in the economy, in the business world, in sports, in tourism, in gerontology, in human communication, and in interaction with animals) can resort to Chapter XV of the Handbook. d. Readers looking for a reference source can use the Handbook ⫺ as a two-way bilingual glossary (German-English and English-German) of the semiotic terminology of all historical periods (included in the index of subjects); ⫺ as an encyclopedia of those phenomena in nature and culture that are interpretable as signs (also included in the index of subjects); ⫺ as a Who-’s-who of semiotics (accessible in the index of persons); ⫺ as a manual providing access to semiotic research and teaching institutions throughout the world (included in the Appendix, Article 177); ⫺ as a register of scholarly associations in semiotics (also included in Article 177); ⫺ as a bibliography of other semiotic reference works and periodicals (in Article 178).
Preface
XXXI
With this array of offerings, the Handbook addresses the following user groups: ⫺ experts in semiotics who wish to extend their historical or systematic knowledge; ⫺ scholars in the individual disciplines who wish to assess the value and potential of their discipline within the framework of the traditional arts and sciences; ⫺ practicing artists in various fields who wish to consider their activities as sign production; ⫺ readers interested in culture who wish to appreciate human behavior in everyday life as sign use; ⫺ everyone interested in the relations between nature and culture. Especially targeted are specialists in the humanities and social sciences as well as in biology, medicine, and the philosophy of science. The Handbook supports the work of those teaching and studying in these areas: teachers in secondary schools and colleges as well as lecturers and students at universities. Moreover, it addresses the practitioners of the corresponding professions: communication technicians, media experts, publishers, product designers, advertising experts, tourism specialists, social workers, spiritual advisers, psychoanalysts, physicians, architects, artists, and musicians. The Handbook is particularly important for the libraries of institutions of higher education, e.g., in the continuing education of teachers, where it is essential to provide an overview of recent developments in the academic disciplines and of the relations between them.
5. Production and style of the articles As has been stated at the beginning, this Handbook is a collective achievement in several respects. Its concept and objectives originated in a workshop, the elaborated conception is the result of long-term joint deliberation of editors and authors. The articles were also produced dialogically. First, drafts of foundational articles about the systematics and history of semiotics were written. These (i.e., Articles 1, 2, 3, 4, 5, 18, 34, 123, and 132) formed a script of more than 500 pages, which the Publisher graciously made available to all 175 contributors as working material so that they could suggest corrections, expansions, pertinent differentiations, or other modifications according to the requirements of their own articles. All these suggestions were taken into account by the original authors in the final versions of their articles. The editors encouraged dialogues between the authors which, however, did not always lead to full agreement. This is also documented in the Handbook in order to motivate the reader to take up these dialogues. Residual differences of opinion between authors were not smoothed out, but rather retained in recognizable form even in the selection of terms. Where there was dissent concerning matters of fact, authors were encouraged to provide parallel treatments of the same topic from different positions. Cross-references draw attention to such traces of the dialogue, and where more perspicuity appeared desirable, authors were given the opportunity to distance themselves from one another’s positions explicitly. Concerning details of form, the editors took care that their interventions in no way violated the individual preferences of an author. This applied to the compositional structure of the article as a scientific treatise as well as to the writing style. Uniformity within each article was the guiding principle. Accordingly, the articles differ considerably from one another: ⫺ in the language chosen (English or German with their several variants);
XXXII
Preface
⫺ in the manner of translation in articles that were originally written in a third language and in passages quoted from texts in other languages; ⫺ in the portions of text set off from the rest by italics or spaced type; ⫺ in the handling of inverted commas for the purposes of quoting utterances and expressions, specifying word meaning and indicating reservations with regard to unusual formulations; ⫺ in the choice and frequency of use of abbreviations of English, German, or Latin origin; ⫺ in the specification of the dates of birth and death of writers; ⫺ in the structure and format of the bibliography; and ⫺ in the references given in the text. The management of these formalities is not ornamental, but rather an indication of the author’s attitude towards his or her topic. Formal variation was, of course, not maintained at the cost of reliability of the content. A team of collaborators assisted the editors in achieving this standard of quality. The result of this editorial policy is a Handbook which has all the marks of a multicultural scientific text preserving complementary approaches to form and content and documenting the diverse academic socialization of its authors. Special attention should be given to the varying proximity of existing scholarly traditions to semiotic terminology and theorizing. More than one author found it necessary to consider this problem explicitly. Thus F. A. Gallo (Bologna) writes: “There has […] been no common ground upon which semiotics and the study of medieval music could meet” (p. 1060); H. Holländer (Aachen) states: “It is not customary to apply signtheoretic terminology to medieval art” (p. 1066); and K. Düwel (Göttingen) elaborates: “In particular, semiotic approaches were sporadically applied to North-Germanic literature; however, comparable studies can also be found in earlier research, which does not mention ‘semiotics’ explicitly (p. 816). In this sense, the majority of contributors found that undertaking authorship in the Handbook was a considerable challenge. They had to take seriously the tradition of their discipline and were to rephrase it in a by and large unfamiliar terminology. The semiotic approach often led to substantial shifts in emphasis as well as to discoveries of knowledge gaps and to reinterpretations of research results. The majority of the articles of this Handbook thus brake new ground. And this applies not only to the historical parts of Volumes 1 and 2 but also to the detailed systematic presentation of the types of semiosis in Volume 1, which entails a semiotic reinterpretation of biology, and to the epistemologically oriented part of Volume 3. Many articles in the latter open new perspectives for cooperation between semiotics and the individual disciplines.
6. Note of thanks The editors’ greatest debt of gratitude is to the authors of the Handbook. The dialogue with them was always exciting and enjoyable. We learned how to motivate experts to express their implicit semiotic knowledge, to accept the relevance of questions that at first seemed remote from their subject matter, to reach an agreement with representatives of other subjects by exchanging manuscripts, and occasionally to wait a rather long time until other authors (primarily those who could start their work only after some organizational delay because they had to fill unexpected gaps) had completed
Preface
XXXIII
their contributions. We learned how to urge semioticians of the various schools to phrase their ideas in a way intelligible and transparent even to uninitiated readers (this was also a favorite topic in discussions among the editors themselves). We discovered unsuspected characteristics of semiosis, e.g., what a difference it makes whether one looks for signs in static objects or in the movements of bodies and things (see Article 91), what role metaphors in all domains of life play for the coherence of a culture (see Article 99), to what degree writing can become a basis for the self-interpretation of a culture (see Article 61), and how important it is not to reduce humans and other creatures to the sender-receiver dichotomy, but to accept them also as signs (see Articles 59 and 73). Special thanks are due to our colleagues ⫺ so many that we cannot list them all here by name. Concerning the content and form of the Handbook they have given us advice which was often decisive for the transformation of our conceptual utopia into task definitions that could be carried out by members of the contemporary academic scene. They have suggested manageable sizes for the chapters and articles. They have assisted us in setting up the article contents (themselves forming a booklet of 175 pages), which served the authors as a basis for their research. And they have helped us in the worldwide search for contributors who had to be both experts in their own fields and well read in research published in languages different from their mother tongues. More than once it was not the editors who had to encourage the contributors to persevere in their work, but the colleagues and contributors who supported the editors in overcoming adverse circumstances and continuing the work to its completion. Indeed, the whole project came at a time of great political upheaval which two of the editors could witness outside the windows of their offices in Berlin. In view of this situation, we are very grateful to our collaborators at the Research Center for Semiotics and at the Institute of Linguistics of the Technische Universität Berlin. They have generously supported the work at the Handbook through all these years. Doris Mosbach advised us in the handling of photos and diagrams; Heinz Beckmann, Sabine Kowal, and Dagmar Schmauks helped with the proof-reading and also made important proposals for improving the content; Theodore Slabey and John Orman devoted themselves to stylistic revision of the text and correction of the bibliographies; Thomas Diße-Runte and Barbara Schäfer corrected and reconciled the transliterations of ancient Greek and Hebrew terms; Lothar Köster produced the person and subject indexes; Helga Brummenbaum, Jürgen Rochel, and Monika Meerwald took care of the vast correspondence and thus facilitated dialogue with the authors. We would also like to acknowledge that several academic institutions have lightened the editors’ work. The Faculty of Communications and History of the Technische Universität Berlin contributed two grants of funds for several months of editorial assistance. The bibliographical service of the Staatsbibliothek zu Berlin Stiftung Preußischer Kulturbesitz helped us solve difficult bibliographical questions with remarkable expertise. Thanks are due to the Netherlands Institute for Advanced Study in the Humanities and Social Sciences (Wassenaar) for a one-year fellowship granted to Roland Posner in the academic year 1986/87. It provided the necessary time for undisturbed reflection during the important phase when the handbook conception was being worked out. In this year the draft versions of the foundational articles, which became the basis for all further steps, were written.
XXXIV
Preface
The Publishing House and its director Dr. Kurt-Georg Cram deserve great thanks for unusual farsightedness and great flexibility in the planning and production of the Handbook. Last, but not least, we cordially thank the responsible series editor Herbert Ernst Wiegand for his unfailing support in all phases of the work. August 1996
Roland Posner Klaus Robering Thomas A. Sebeok
I. Systematik Systematics 1. Semiotics and its presentation in this Handbook 1. Eight theses on the tasks of semiotics 1.1. The subject matter of semiotics 1.2. Theoretical, descriptive, and applied semiotics 1.3. Semiotics as an object-science 1.4. Semiotics as a metascience 1.5. Semiotics as an interdisciplinary approach 1.6. Current trends in semiotics 1.7. Culture-specific sign conceptions 1.8. Dialogical procedures in the presentation of semiotics 2. Syntactics, semantics, and pragmatics as branches of semiotics 3. The structure of semiotics as presented in the Handbook 3.1. Part A: Theoretical foundations 3.2. Part B: History of semiotics 3.3. Part C: Contemporary semiotics 3.4. Part D: The relationship between semiotics, other interdisciplinary approaches, and the individual disciplines 3.5. Part E: Applied semiotics 3.6. Part F: Working tools for semioticians 4. Selected references
1.
Eight theses on the tasks of semiotics
The present Handbook offers a comprehensive survey of contemporary knowledge and methods of research in semiotics. It is the result of a decade of cooperation between scholars in the humanities, social sciences, natural sciences and sciences of engineering. As a basis for their work, all contributors accepted eight theses on the task of semiotics and on the Handbook’s objectives and procedures of production. These theses are intended to provide a guideline for the Handbook user as well. 1.1. The subject matter of semiotics Semiotics is the study of signs. It thus investigates the structure and function of all events which involve signs: the processing of infor-
mation in machines, the metabolism in organisms, the stimulus-response processes in plants and animals, the activities of perception and orientation in higher creatures, the interactions of primates, communication between humans, the dealings between social institutions, and the delicate processes of interpretation which take place in the comprehension of the complex sign structures in legal matters, in literature, music, and art. Events which involve signs are called “sign processes” or “semioses”. They occur only in living nature and in the cultures of higher animals. Living nature consists in the totality of all organisms, i. e., the purposive systems whose ways of behavior and body forms are passed on from one generation to the next through the genetic code; a culture can be conceived as a group of organisms whose ways of behavior are tied to a particular tradition, i. e., acquired by learning and passed on to the next generation after creative modification. The two types of transmission (inheritance and tradition) are sign processes, and that which is transmitted (knowledge, attitudes, and skills in the production and use of artifacts) is, to a considerable extent, also based on signs. The Handbook documents the current state of research into the sign-theoretic foundations of living nature and culture. 1.2. Theoretical, descriptive, and applied semiotics Historically, semiotics has since Antiquity been geared towards solving everyday practical problems. Medical semiotics, already named so by the Greeks, helped physicians to recognize illnesses on the basis of their signs (symptoms). The art of divination practised by the Romans aimed at the prediction of future events through the interpretation of omens. Medieval heraldry regulated the de-
2 sign of coats of arms to enable knights to recognize each other. The cryptanalysis of the Baroque period made great efforts to decipher texts written in unknown characters and languages. The Enlightenment investigated those ways of presentation which could be expected to achieve desired effects in the various genres of the arts. Romantic philology attempted the attribution of historical documents to authors and epochs and tried to distinguish originals from copies. Craft and industry have always striven for the standardization and the legal protection of guild signs, corporate symbols, and, more recently, trademarks, a task for which institutions such as the International Standards Organization (ISO) now establish the guiding principles. These tasks of applied semiotics could be accomplished all the better, the more knowledge was available regarding the differences in the functioning of the various types of signs and semioses. Thus, on the basis of precursors in Antiquity and the Middle Ages, a descriptive and comparative semiotics developed, which saw as its main goal the establishment of an increasingly comprehensive and differentiated classification of signs. Philosophy systematized the criteria applied in this classification, which eventually led to the development of theoretical semiotics. Its aim is to set up a system of operations for the analysis of signs as well as a system of basic terms and axioms from which theorems can be derived to explain and predict how the meaning of complex signs depends on their structure, on their domain of reference, and on the goals of their users. In the Handbook equal attention is given to the results of theoretical, descriptive-comparative, and applied semiotics. 1.3. Semiotics as an object-science Encouraged by the epochal developments in modern logic and linguistics, early twentiethcentury theoretical semiotics set out to provide general concepts for all relevant types of signs and semioses. This intention brought it into competition with fields that had already established themselves as university disciplines and had developed their own independent approaches to the signs and semioses occurring in their subject matter; among the disciplines involved were biology, psychology, and medicine on the one hand and philology, musicology, and art history on the other. Semiotics responded to this challenge in two ways: (1) it concentrated on areas not
I. Systematik
treated by more established disciplines ⫺ a tendency which led to the constitution of regional semiotics such as theater semiotics, film semiotics and the semiotics of nonverbal communication; (2) it made the subject areas of the individual disciplines accessible to a unified and precise description within its own conceptual framework. The advantages of the latter approach became particularly evident in the analysis of multi-media semioses in nature and culture. With regard to culture, it became possible ⫺ in opera, circus, and theater as well as in newspapers, magazines, films, and television ⫺ to identify the specific contribution of the various sign types to the overall effect, to weigh them against each other, and thus to create the preconditions for a rational choice of the most effective medium in each case. The Handbook presents semiotics as an object-science which studies all types of sign processes, giving particular coverage to the fruitful interaction between semiotics and the sign-related academic disciplines. 1.4. Semiotics as a metascience The advantages of the semiotic approach appear not only in its results but also in its methods. Since the disciplines which interpret cultural artifacts ⫺ among them anthropology, archeology, philology, musicology, and art history ⫺ have, after a common beginning, developed their procedures of analysis and description independently of each other, their methods seem to be quite dissimilar and incompatible. In contrast, the semiotic approach explores the possibilities of applying the same procedures of analysis and description to artifacts of all kinds. In this way, semiotics has given considerable impulses for the reconstruction of the methods of sign-related disciplines as well as of their concepts, axioms, and theorems on a common basis. The role of semiotics in the philosophy of science is not limited to those disciplines which study sign processes. The fact that all disciplines have to use certain methods of investigation and modes of presentation, and that both the investigation and the presentation of a subject involve sign processes, led to the claim that even the philosophy of science is essentially semiotics. Since the beginning of this century, when this claim was made, the institutionalized communication among scholars and scientists has been added as a further argument and area of investigation. In consequence, semiotics has been consti-
1. Semiotics and its presentation
tuted not only as an object-science on the same level as the sign-related academic disciplines but also as a metascience which takes all academic disciplines as its domain, regardless of whether they themselves study sign processes (the humanities, the social sciences, biology, and medicine) or not (physics, chemistry, and astronomy). The Handbook takes account of this development and considers the achievements and limits of semiotics as a metascience within the framework of the philosophy of science. 1.5. Semiotics as an interdisciplinary approach Its multidisciplinary subject matter brought semiotics into competition with other interdisciplinary approaches ⫺ hermeneutics, gestalt theory, information theory, systems theory, etc. Each of these approaches was forced to justify its claims with respect to the individual disciplines and thus each has occasionally displayed a tendency to universalize its domain and to accuse competing approaches of being unscientific. This has been facilitated by the fact that most interdisciplinary approaches make implicit use of their mutual results, so that it is difficult to determine their systematic relationship to each other. Therefore, it remains to be clarified for each approach whether it is defined by a subject matter, a problem formulation, a method of investigation, or a mode of presentation, and how these relate to the subject matter, problem formulation, method of investigation, and mode of presentation in semiotics. The Handbook shows that universalist claims from any side whatsoever are unjustified by explicitly analyzing the systematic relationship between semiotics and the other interdisciplinary approaches. 1.6. Current trends in semiotics Universalist claims are also unjustified for the movements, schools of thought and traditions which compete within semiotics itself. Their differences at times appeared so irreconcilable that semioticians were advised to postpone their attempts at a reconstruction of the individual disciplines until they had put their own house in order. However, such advice has no justification, since all sciences are in a permanent process of change; if one wished to delay the application of their results until they came to a standstill, the application would be postponed indefinitely.
3 Moreover, the various movements within semiotics frequently place their emphasis and center of differentiation in quite different areas, so that they complement rather than contradict each other. This fact can be put to use in the systematic presentation of semiotics, provided a point is made of including alternative doctrines and of not covering up unresolved contradictions. The Handbook documents all trends currently active within semiotics without giving up the attempt at a unified systematic presentation of semiotic theory, suitable for determining the relationship of semiotics to other interdisciplinary approaches as well as for reconstructing the individual disciplines. 1.7. Culture-specific sign conceptions Semiotics has obtained impressive results in the last hundred years, thereby establishing itself in the academic world. So far, however, it has explicated only a fraction of the implicit knowledge of sign processes which sign users possess. Semioticians mostly know the history of their field less well than other scholars, and when they do turn to it they tend to give exclusive attention to individual figures or epochs. The great treasure of sign conceptions which has been accumulated in daily life, in the arts, and in the religions of earlier periods and of other cultures has generally lain fallow until quite recently. A description which does not systematically include all aspects of its subject must eventually default; however, no semiotician today can say with certainty that he or she is familiar with all relevant aspects of signs and semioses. It would therefore be wrong to yield to the decline in respect for common sense which has followed the rise of the natural and social sciences. In addition to academic semiotics, the individual sign-related disciplines, and the interdisciplinary approaches, the Handbook gives an account of the diverse sign conceptions which in the course of history have been developed in everyday life, in the arts, and in the religions of European and non-European cultures. 1.8. Dialogical procedures in the presentation of semiotics Academic semiotics and its relationship to the individual disciplines can no longer be covered in all its detail by any one person. The inclusion of the sign conceptions of different epochs and cultures renders such a
4
I. Systematik
comprehensive coverage entirely impossible. A cooperative account, however, always runs the risk of heterogeneity in problem presentation and incompatibility in terminology. This problem arises especially in the systematic and discipline-reconstructing sections. On the other hand, the contributors to the Handbook were not to be dogmatically prescribed a “standard theory” of semiotics. This is why the Handbook was produced dialogically in three steps: First, drafts of fundamental articles about the systematics and history of semiotics were written on the basis of the current state of the art. These were then made available to all contributors as working material so that they could suggest corrections, expansions, pertinent differentiations, or other modifications according to the requirements of their own articles. Only after these suggestions had been submitted did the original authors produce the final versions of their articles.
2.
Syntactics, semantics, and pragmatics as branches of semiotics
As was pointed out in § 1.1., semiotics may be defined with respect to its subject matter, which is semiosis. Semiosis is an event in which something functions as a sign. Different semioticians distinguish different factors in semiosis (cf., e. g., the traditions of Peirce (1931⫺58, 1982 ff), Morris (1938, 1946, and 1964), and Carnap (1939, 1942, and 1954); of Saussure (1916 ⫽ 1968), Buyssens (1943), Hjelmslev (1943), and Prieto (1966); of Ogden and Richards (1923), Bühler (1934), and Jakobson (1960); and of Uexküll (1940)). However, all such structurings of semiosis involve at least three factors, whose interrelation is described by phrases such as: “A takes B to stand for C”, “B refers to C for A”, “A takes account of C in virtue of the presence of B”, etc. We therefore stipulate that the following is a necessary and sufficient condition for something to be a semiosis: (1) A interprets B as representing C. In this relational characterization of semiosis, A is the interpreter, B is some object, property, relation, event, or state of affairs, and C is the meaning that A assigns to B. These factors are connected by the triadic relation: . . . interprets ⫺ ⫺ ⫺ as representing .⫺.⫺.⫺ .
The term “sign” can be used in two different ways with respect to this relation. While logic-oriented semioticians like Morris and Carnap use it as a term for B’s, linguisticsoriented semioticians like Saussure and Hjelmslev use it as a term for pairs of B’s and C’s. The latter usage is justified by the fact that what meaning is assigned to some entity in a specific semiosis depends in part on properties of that entity. However, it also depends on properties of the interpreter: It is true for all three ranges of entities able to enter the three slots in the triadic relation that they are dependent on each other. In the rest of this article we will therefore use a separate term for each of the three factors and refer to A as an interpreter, to B as a sign, and to C as a meaning. Because of the interdependence of the three factors it is not easy to devise a clearcut division of labor for the investigation of semiosis. Nevertheless, a tripartite division of semiotics is now generally accepted. It is usually defined with regard to the three factors of semiosis. The conditions an entity must fulfil to be able to represent meaning for interpreters in semiosis are the subject matter of syntactics. The conditions an entity must fulfil so that it can be represented by signs for interpreters in semiosis are the subject matter of semantics. The conditions an entity must fulfil to be able to interpret signs as representing meaning in semiosis are the subject matter of pragmatics. The historical origins of these disciplines can be traced back to the artes dicendi, viz. grammar, rhetoric, and dialectic, the teaching of which was organized in the so-called trivium in medieval European schools from the ninth century A. D. onwards. Charles S. Peirce reinterpreted the artes dicendi as branches of “semeiotic” and systematized them as disciplines treating signs as Firstness, Secondness, and Thirdness, respectively. He distinguished between speculative grammar, critical logic ⫺ the successor of dialectic ⫺, and methodeutic ⫺ the successor of rhetoric (Peirce, C.P. 1.191 ff and 2.93; cf. Savan 1988). It was Charles W. Morris (1938) who coined the terms “syntactics” and “pragmatics” and introduced the division of “semiotic” into syntactics, semantics, and pragmatics. Although this trichotomy is related to that of Peirce, its introduction was motivated differently: Morris tried to show that the objectives of three leading philosophical movements of his time, Logical Positivism, Empir-
1. Semiotics and its presentation
icism, and Pragmatism, were not incompatible but complementary (cf. Morris 1929 and 1937), since Logical Positivism studied the formal structures of the languages of science, Empiricism studied the objects of research and their relations to the languages of science, and Pragmatism studied the procedures and conventions governing communication among scientists. Thus, for Morris, syntactics could utilize the methods and results of Logical Syntax developed by the Logical Positivists (cf. Carnap 1934), while semantics and pragmatics could proceed from the analytical achievements of Empiricism and Pragmatism, respectively. Terminologically, Morris could build on Bre´ al, who had introduced “semantics” as the “the science of significations” (1897), which suggested parallel structures for the names of the other two branches of semiotics, “syntactics” and “pragmatics”. It was this parallelism that later also led to the transformation of the terms “semeiotic” (Peirce) and “semiotic” (Morris and Carnap) to “semiotics”, which was publicly introduced by Margaret Mead on May 19, 1962, to include “the study of all patterned communication in all modalities” (cf. Sebeok 1971: 9). Despite the general acceptance of the terminology, the theoretical status, the delimitations, and the subdivisions of the three branches of semiotics are still controversial today. The Morris of the International Encyclopedia of Unified Science (Neurath 1938 ff) treats the three branches in a parallel way (cf. Posner 1986: 566 f). He isolates the three factors of semiosis and specifies the subject matter of each semiotic discipline on the basis of a dyadic relation between one of the factors and the sign: Syntactics studies signs in relation to other signs (B in relation to B), semantics studies signs in relation to meanings (B in relation to C), and pragmatics studies signs in relation to interpreters (B in relation to A). Since these three definitions do not cover all aspects of semiosis (e. g., the triadic relation between A, B, and C) and of semiotics (e. g., the problem of the interrelation of the three semiotic disciplines), all remaining aspects are said to fall under semiotics proper (cf. Fig. 1.1). In this conception pragmatics cannot treat much of the relation between signs and interpreters without including meanings, i. e., without becoming semiotics proper. This and other criticisms made Morris give up the parallel conception of the three branches in fa-
5
Fig. 1.1: The three factors of semiosis and the three branches of semiotics according to the early Morris (1939: 133 ⫽ 1971: 417).
vor of a hierarchical one proposed by Carnap (1942: 9): “If we are analyzing a language, then we are concerned, of course, with expressions. But we need not necessarily also deal with speakers and designata. Although these factors are present whenever language is used, we may abstract from one or both of them in what we intend to say about the language in question. Accordingly we distinguish three fields of investigation of languages. If in an investigation explicit reference is made to the speaker, or, to put it in more general terms, to the user of a language, then we assign it to the field of pragmatics. (Whether in this case reference to designata is made or not makes no difference for this classification.) If we abstract from the user of the language and analyze only the expressions and their designata, we are in the field of semantics. And if, finally, we abstract from the designata also and analyze only the relations between the expressions, we are in (logical) syntax. The whole science of language, consisting of the three parts mentioned, is called semiotic.” As Morris emphasized (1946: 218 f ⫽ 1971: 302, cf. 1938: 16 ⫽ 1971: 30 f), this exposition can be adopted if it is generalized in a number of aspects: 1. Semiotics not only deals with linguistic expressions but with all kinds of signs; therefore “language” has to be replaced by “sign system”. 2. Pragmatics not only has to do with users and uses of signs in the sciences but with all kinds of sign users and sign uses. 3. Semantics does not only treat the designative mode of signification but all ways of representing meaning and all kinds of meaning. 4. Syntactics not only comprises the logical syntax of the languages
6
Fig. 1.2: The three factors of semiosis and the three branches of semiotics according to the later Morris (1946: 352 ff ⫽ 1971: 365 ff).
of science but is much wider: it also includes (a) phonology and morphology of the languages of science, (b) phonology, morphology, and syntax of other languages, and (c) the analysis of the formal aspects of non-linguistic sign systems. The results of this generalization was formulated by Morris in the glossary of his 1946 book (1946: 352 ff ⫽ 1971: 365 ff): Pragmatics is “that branch of semiotic which studies the origin, the uses, and the effects of signs”. Semantics is “that branch of semiotic which studies the signification of signs”. Syntactics is “that branch of semiotic that studies the way in which signs of various classes are combined to form compound signs. It abstracts from the signification of the signs it studies and from their uses and effects […]” (cf. Fig. 1.2). Whereas Carnap had made syntactics seem to be the basis of all semiotic studies in 1934 and Morris had treated syntactics, semantics, and pragmatics as relatively independent of each other in 1938, they later tended to see syntactics as embedded in semantics and semantics as embedded in pragmatics (cf. Carnap 1939: 16, cf. also Cherry 1957: 219 ff). This and the fact that Morris (1946) avoids speaking of abstraction in his characterization of pragmatics (and semantics!) have led some of his exegetes to speak of “Morris’s pragmatically unified semiotics” (cf. Apel 1973) and to advocate the identification of semiotics with pragmatics. However, this would substitute a maximalist conception for the minimalist conception of pragmatics in Morris 1938 and was clearly not the intention of Morris or Carnap at any time of their lives (cf. Posner 1979 ⫽ 1987: 49 f note 20).
I. Systematik
The opposite type of misunderstanding consisted in hypostatizing the subject matter of syntactics, semantics, and pragmatics by postulating the independent existence of “syntactic signs”, “semantic signs”, and “pragmatic signs”, respectively (cf., e. g., Reichenbach 1947: 318 ff). In this way, three perspectives of scientific investigation were reified as three types of objects in the domain of investigation. However, there are no signs that are exclusively syntactic or exclusively semantic or exclusively pragmatic. Where there is a sign, there must also be a meaning and an interpreter for a semiosis to take place. Thus every sign and every semiosis, by definition, have all three dimensions, and they can only be fully understood if studied from a syntactic and a semantic as well as a pragmatic point of view. It was Otto Neurath, the general editor of the International Encyclopedia of Unified Science, who warned that the Morrisian triads might engender pseudo-problems. And Morris himself admitted in 1946: “The course of events has proved in part the legitimacy of [such] […] fears. Yet these terms, if carefully introduced, serve to mark the scope and subdivisions of semiotic. […] in general it is more important to keep in mind the field of semiotic as a whole, and to bring to bear upon specific problems all that is relevant to their solution” (Morris 1946: 217 ff ⫽ 1971: 301 ff). Morris’s scientific ethos can best be summarized by the following quotation from his main work on semiotics: “[…] sign-behavior, as formulated in the present account, lends itself to treatment within the categories of a general theory of behavior. Vague speculation on these matters is no longer necessary; the problems of sign-behavior have already reached the stage of empirical formulation and possible experimental resolution” (1946: 58 f ⫽ 1971: 134). Although the once dominant behaviorist epistemology has lost much of its former attraction, the trend towards empirical formulations and experimental solutions has continued in the last half century. This becomes evident in each chapter of the present Handbook, the contents of which are set out in what follows.
3.
The structure of semiotics as presented in the Handbook
As is shown in the table of contents, the Handbook is composed of sixteen chapters, arranged in six parts. Volume 1 contains
1. Semiotics and its presentation
Part A (Chapters I⫺IV) and the first Chapters (V⫺VIII) of Part B. Volume 2 contains the remaining Chapters (IX⫺XI) of Part B as well as Part C (Chapter XII). Volume 3 contains Part D (Chapters XIII and XIV), Part E (Chapter XV) and Part F (Chapter XVI). 3.1. Part A: Theoretical foundations Part A (Chapters I⫺IV) presents a theorybased outline of the entire field of semiotics. This unique reference work includes chapters on the systematics (I), subject matter (II and III), and methods (IV) of semiotics. Chapter I takes the division of semiotics into the three branches of syntactics, semantics and pragmatics as its basis. As postulated in § 2., “Syntactics” (Article 2) studies the conditions an entity must fulfil so that it can be taken by an interpreter to represent something. The article deals with the signifier, i. e., it covers the formal aspects of signs, their relations to other signs, and the way in which signs are combined to form complex signs. This includes the principles of the construction of texts, pieces of music, pictures, sculptures, industrial products, buildings, gardens, and cities, insofar as they represent something; in particular, the syntax, morphology, and phonology of natural languages fall under syntactics in ways specified in the article. “Semantics” (Article 3) studies the conditions an entity must fulfil so that another can be taken to represent it for an interpreter. The article deals with the signified and, in particular, with the conventional meaning of signs. It analyzes the rules for truth and denotation, as well as implication and its operationalization by means of semantic models. “Pragmatics” (Article 4) studies the conditions an entity must fulfil so that it can interpret something as a representation of something. The article deals with the sign users and with the circumstances of sign use in communication as well as in other types of semiosis. These articles, together with the introductory articles of Chapters II, III, V, and XIV provide the theoretical and terminological foundation on which all subsequent articles are based. This is why they were made available in a preliminary draft to all contributors within the dialogical production process of the Handbook characterized in § 1.8. While Chapter I deals with the structuring of semiotics, Chapter II deals with the structuring of its subject, semiosis. As Article 5, “Models of Semiosis”, shows, a large number
7 of competing graphic representations for the structuring of sign processes has been developed. What is called for here is critical comparison leading to viable definitions of the basic concepts for the analysis of sign processes. When an organism or a machine takes an object as a representation of another object, it must have a “channel” of access to it; to interpret the representation, it may use a “code”; and the entire process will take place in a biological, social, or technical “medium”. Articles 6⫺11 examine the capacity of “optic”, “acoustic”, “tactile”, “chemical”, “electric and magnetic”, and “thermal” channels; Article 12, “The Organization of Eye Movements”, presents a case study of the combined use of several channels, and Article 13, “Body Behavior as Multichannel Semiosis”, investigates general ways of enhancing the effectivity of semiosis in human communication through the simultaneous utilization of more than one channel. Article 14, “Technical Media in Semiosis”, and Article 15, “Social Media of Semiosis”, treat the additional possibilities and constraints imposed on semiosis by technical instruments and social institutions. Article 16 analyzes the concept of “Codes” and discusses its applicability in various channels and media, while Article 17 deals with the principles of code formation and “Code Change”. Chapter III considers the subject of semiotics from the aspect of evolution. As outlined in Article 18, “The Evolution of Semiosis”, and Article 19, “Biosemiosis”, sign processes have not always existed in the course of the development of the universe. They originated together with the development of life. Accordingly, the subsequent articles, 19⫺25, characterize the sign processes typical of the most important species of organisms, following the order of their genesis: the metabolism of unicellular forms (“Microsemiosis”), the sign processes connecting the organs within an organism (“Endosemiosis”), the parasitic processes in which fungi involve their host organisms (“Mycosemiosis”), the stimulus and response patterns in the life of plants (“Phytosemiosis”), the interactions of animals (“Zoosemiosis”), and the additional types of semiosis developed by humans (“Anthroposemiosis”). Also included in this series are sign processes of the most recent kind (“Machine Semiosis”, Article 26), which were introduced with the invention of signprocessing machinery (measuring apparatus, automata, computers, and robots). The clos-
8 ing article of this section, “Environmental Semiosis” (Article 27), has a summarizing function: it shows how the sign processes of the various species and machines interact, thus determining their coevolution. How does semiotics investigate, describe, and explain the many aspects of its subject? This question is answered in Chapter IV. After the introductory Article 28 on “Methodological Problems of Semiotics”, Article 29 presents the ways of dealing with “Data and Hypotheses in Semiotics”; it covers laboratory experiments, tests, interviews, field work, naturalist observation, as well as the analysis of artifacts, tools and texts. In Article 30, the principles of “Theory Formation in Semiotics” are discussed, with particular emphasis on the theory structures appropriate for its various branches. Article 31 examines the application of semiotic theories in “Understanding, Explanation, and Action”, with special reference to the humanities and the social sciences. 3.2. Part B: History of semiotics Part B (Chapters V⫺XI) complements the systematic presentation of semiotics as a science, given in Part A, with a unique survey of the semiotic thought implicit in the use of signs in the various cultures of the world and in the historical epochs of the West. It is arranged in seven chapters according to chronological and geographical principles, although a point is made of not allowing the borders between the epochal and geographic areas to obscure the overall developments in semiotic thought. Chapter V offers a general outline of decisive stages within “The Development of Sign Conceptions in the Evolution of Human Cultures” (Article 32) and then focusses on the principal historical changes that took place in the sign conceptions of the West. Since this topic cannot be treated without a discussion of methodological questions, the following three articles are titled “Problems in the Explication of Western Sign Conceptions” (Article 33), “History and Historiography of Semiotics” (Article 34), and “The Beginnings of Scientific Semiotics” (Article 35). In addition to discussing the general problems announced in their titles, Articles 32⫺35 also serve to introduce the reader, by means of ample cross-references, to the ensuing Chapters VI⫺X, “History of Western Semiotics”, XI, “History of Non-Western Semiotics”, and XII, “Current Trends in Semiotics”.
I. Systematik
The sign conceptions of Europeans in the Greek and Latin traditions, including the Jewish and Christian world-views, cannot be adequately described without an understanding of preceding and simultaneous developments in the Ancient Middle East and in the cultures of the Celts, the ancient Germanic peoples, and the Ancient Slavs. Therefore, the presentation of Western semiotics in the Handbook begins with Chapter VI, which treats sign conceptions in “Celtic Antiquity” (Article 36), “Germanic Antiquity” (Article 37), and “Slavic Antiquity” (Article 38), and is complemented in Chapter XI with “Sign Conceptions in the Ancient Middle East” (Article 89) as well as “Sign Conceptions in the Islamic World” (Article 90). Chapter VII covers “Ancient Greece and Rome” as the second period in the “History of Western Semiotics”. The introductory Article 39, “Sign Conceptions in Pre-Classical Greece”, analyzes the lexical field of the ancient Greek words for signs documented in Pre-Classical Greek literature, and derives, on that basis, the conceptions the Greeks had of sign processes. Since it is practically impossible for any one person to describe, even for one single epoch, all semiotically relevant aspects with equal thoroughness, the remaining Articles in this chapter and in Chapter VIII, “The Middle Ages”, IX, “From the Renaissance to the Early 19th Century”, and X, “From the 19th Century to the Present”, are organized in parallel subsections. Article 40 deals with “Sign Conceptions in Philosophy in Ancient Greece and Rome”, Article 49 with “Sign Conceptions in Philosophy in the Latin Middle Ages”, Article 62 with “Sign Conceptions in General Philosophy from the Renaissance to the Early 19th Century”, and Article 74 with “Sign Conceptions in General Philosophy from the 19th Century to the Present”. So, anyone wishing to study the development of sign conceptions within European and American philosophy as a whole can read articles 40, 49, 62, and 74 consecutively as one longitudinal section of Western cultural history. It should be noted, however, that until the Middle Ages only “Philosophy” is mentioned and that afterwards the term “General Philosophy” is used, which draws attention to the fact that, since the Middle Ages, aesthetics (Article 50) and logic (Article 52) ⫺ and since the Renaissance, aesthetics (Articles 63 and 75), logic (Articles 64 and 76), and philosophy of language (Articles 65 and 77) ⫺ have been separated and are
1. Semiotics and its presentation
treated independently. A second longitudinal section of Western cultural history is formed by the articles on sign conceptions in the mathematics of Antiquity (Article 41), of the Middle Ages (Article 51), from the Renaissance to the early 19th century (Article 66), and from the 19th century to the present (Article 78). Additional longitudinal sections include music (Articles 43, 54, 68, and 81), architecture and the fine arts (Articles 44, 55, 69, and 82), medicine (Articles 45, 56, 70, and 83), and religion (Articles 47, 58, 72, and 87). As knowledge of languages on the one hand and of both human and non-human nature on the other has increased enormously since the 19th century, the relevant articles for this period have again been subdivided. The “Sign Conceptions in Grammar, Rhetoric, and Poetics”, which are treated together for Antiquity in Article 42, for the Middle Ages in Article 53, and for the period from the Renaissance to the early 19th century in Article 67, are covered by two articles from the 19th century to the present: one on “Sign Conceptions in Grammar” (Article 79) and the other on “Sign Conceptions in Rhetoric, Stylistics, and Poetics” (Article 80). Similarly, the articles on “Sign Conceptions in Natural History and Natural Philosophy in Antiquity” (Article 46), in the Middle Ages (Article 57), and in the period from the Renaissance to the 19th century (Article 71) are continued by three articles for the period from the 19th century to the present: on sign conceptions in physics (Article 84), in biology (Article 85), and in economy (Article 86), respectively. Unfortunately, articles on historical sign conceptions in chemistry, psychology, and sociology, which had also been planned for the Handbook, did not materialize. The interested reader can find relevant information in the corresponding metadisciplinary articles of Chapter XIV on the semiotic aspects of chemistry (Article 135), psychology (Article 141), and sociology (Article 142). The historical chapters of the Handbook each conclude with an article which analyzes the sign conceptions in everyday life at that time (Articles 48, 59, 73, and 88). Since most of the articles on sign conceptions in the “History of Western Semiotics” concentrate on Romanized cultures and on Christian world-views, they are complemented by two articles giving special attention to sign conceptions in the Byzantine east (Article 60) and to sign conceptions developed in the Jewish Middle Ages (Article 61).
9 With these two articles, Volume 1 of the Handbook ends, letting Volume 2 continue the historical Part B with Chapter IX, “From the Renaissance to the Early 19th Century”, and Chapter X, “From the 19th Century to the Present”. A history of culture which traces the development of a question that is studied in a modern academic discipline would normally be written with exclusive attention to the European developments. In a history of semiotics, however, it is indispensable to provide access also to the sign conceptions of nonEuropean cultures, which have reached remarkable complexity and elaboration in religion, in the arts, and in everyday life. This is attempted in Chapter XI, “History of NonWestern Semiotics”. In its organization historical and geographical criteria have been combined for practical reasons. Articles 89, “Sign Conceptions in the Ancient Middle East”, and 90, “Sign Conceptions in the Islamic World”, are followed by contributions that examine each geographical region with respect to the sign conceptions developed in it throughout its entire history: Non-Islamic Africa (Article 91), India (Article 92), China (Article 93), Korea (Article 94), Japan (Article 95), the Philippines and Indonesia (Article 96), continental South East Asia, including Thailand, Laos, Campuchea, and Vietnam (Article 97), Oceania, including Polynesia, Micronesia, Melanesia, New Guinea and Australia (Article 98) as well as the pre-Columbian Americas (Article 99). 3.3. Part C: Contemporary semiotics Part C (Chapter XII) characterizes the various trends currently active within semiotics. Each article deals with another trend; it is not primarily concerned with the biography of its leading authors, nor with the immanent interpretation of their works; it rather presents the most important questions, concepts, methods, and results of the trend within its historical context, using the conceptual apparatus developed in Chapter I of the Handbook. The main attention is focussed on historical controversies insofar as they have become relevant for modern semiotics. Precursors and successors of the movement concerned are included, as are researchers who, although they may not have been in actual contact with it, nevertheless had systematically related goals. Since many current semiotic movements have resulted from developments in the individual disciplines of the last
10 two centuries, there are many connections between the articles of this section and those of Chapters X as well as XIV. In Chapter XII, movements which proceeded simultaneously or in close interaction with each other are treated in neighboring articles. The opening articles deal with the currently dominant schools of Peirce (100) and Saussure (101), who had formulated explicit programs for the construction of a theory of signs. The following articles cover movements which made significant contributions to the realization of these programs: the “Logical Analysis of Language” of Frege and his successors Russell, Carnap, Church, Dummett, and others (Article 102), “Phenomenological Semiotics”, founded by Brentano, Meinong, and Husserl (Article 103), the “Signific Movement”, supported by the mathematicians Mannoury and Brouwer (Article 104), linguistically oriented “Semasiology and Onomasiology” (Article 105), the “Logical Empiricism”, originating in the Philosophy of Science of the Vienna and Berlin Circles and the Warsaw/Lwow School (Article 106), the Euro-American philosophical “Constructivism” with the related movements of intuitionism and operationalism (Article 107), the theory of action called “Praxeology” by Kotarbin´ sky (Article 108), Wittgenstein’s “Ordinary Language Philosophy” (Article 109), von Uexküll’s “Umweltlehre” with its repercussions in modern ethology and sociobiology (Article 110), the semiotics of culture developed by Cassirer and his successors (Article 111), the “Sematology” of Bühler which has become influential mainly in continental European psychology (Article 112), and the “Symbolic Interactionism” of G. H. Mead, C. W. Morris, and their successors (Article 113). These semiotic movements were joined, early in this century, by literature- and culture-oriented “Russian Formalism” (Article 114), which was continued between the world wars in “Prague Functionalism” (Article 115), and through the work of R. Jakobson influenced European and American “Structuralism” (Article 116). The Baltic area gave rise, after World War II, to Hjelmslev’s “Glossematics” (Article 117) and the “Moscow-Tartu School” (Article 118), whose questions and concepts were taken up and further developed by Greimas and his school in Paris (Article 119) and by Eco in Italy (Article 120). A critical stance to all these developments is taken by Goodman’s semiotics of art (Article 121) and by
I. Systematik
“Post-Structuralism” based on Derrida’s grammatology (Article 122). Indicating future options of semiotics, these articles form the end of Volume 2 of the Handbook. 3.4. Part D: The relationship between semiotics, other interdisciplinary approaches, and the individual disciplines Part D (Chapters XIII and XIV) in Volume 3 is intended to meet the demand, often made but as yet unrealized, for a systematic reconstruction of the sign-related university disciplines and interdisciplinary approaches on a semiotic basis. It is introduced by Article 123, “The Relationship between Individual Disciplines and Interdisciplinary Approaches”, and covers in Chapter XIII the interrelation between “Semiotics and the Philosophy of Science” (Article 124), “Semiotics and Information Theory” (Article 125), “Semiotics and Systems Theory” including cybernetics (Article 126), “Semiotics and Synergetics” (Article 127), “Semiotics and the Theory of Developmental Processes” (Article 128), “Semiotics and Gestalt Theory” (Article 129), “Semiotics and Psychoanalysis” (Article 130), and “Semiotics and Hermeneutics” (Article 131). Since each interdisciplinary direction of research is characterized by a multiplicity of teachings, sometimes incompatible with one another, each article must give a pluralistic account, showing that there are a number of alternatives possible in the specification of the relationship to semiotics. It is not so important, for example, whether the author considers hermeneutics a branch of semiotics or not, or whether he describes the two fields as complementary or overlapping; more important is the justification he or she gives for this by explaining the underlying conception of the purposes of hermeneutics and semiotics. The authors of Chapter XIV, which deals with the individual disciplines, have less of a free hand. Through their position within the division of labor of the university, the individual disciplines mostly have relatively stable problem areas, subject matter and methods. Differences within a discipline are usually shown clearly by the terminology used. The introductory Article 132 shows how one is to proceed in the semiotic reconstruction of each individual discipline. It has to be demonstrated which parts of the subject matter of a discipline are sign processes, how these special types of sign processes can be de-
1. Semiotics and its presentation
scribed in the framework of theoretical semiotics, and how the discipline’s traditional terminology can be explicated, defined, complemented or partially replaced on that basis. Also the methods (among them text analysis in the humanities, field work in the social sciences, and measurement operations in the natural sciences) are to be examined with regard to the extent to which they are sign processes, and the methodology of the discipline in question has to be systematized and improved on this basis. A special case occurs when a discipline includes in its subject area living beings with whom the scientist must communicate as part of his job. This has important consequences in psychology, law, and medicine so that the professional-client communication plays a central role in the semiotic reconstruction of their methods. Not without reason the disciplines also differ greatly in the modes of presentation used for their results and in the ways of reasoning developed by their representatives. They, too, must be semiotically justified with reference to the purpose of each discipline, and modified if a justification proves impossible. These goals require that all articles of Chapter XIV explicitly refer to the articles of Chapter I. The concepts, axioms, theorems, and principles of general semiotics introduced there are to be adopted in this section and used as a basis for a systematic presentation of the discipline in question as a branch of semiotics. Ideally, each article provides, after an informal introductory characterization of the discipline, a hierarchy of definitions and a set of axioms covering central parts of its subject area; it goes on to show by way of examples how selected branches of the discipline can be explicated on this basis. Then there is a discussion of the as yet unsolved problems, which leads to an assessment of the future measures necessary for a complete semiotic reconstruction of all reconstructable parts of the discipline. All articles of Chapter XIV describe the “semiotic aspects” of an individual discipline, but their headings are differently formulated. Those disciplines that investigate semioses can be referred to with a compound term consisting of “semiotics” as one constituent and a name for the special type of semioses investigated as another: “Biosemiotics”, “Neurosemiotics”, “Medical Semiotics”, “Psychosemiotics”, and “Semiotics of Literature”, “Semiotics of Music”, “Semiotics of the Fine Arts” are cases in point. Such terms would,
11 however, be tautological if applied to disciplines which fall within the limits of theoretical semiotics, such as logic, and they would be contradictory if applied to disciplines which do not investigate semioses, such as physics; this is why the respective articles only have “Semiotic Aspects of …” in their heading. 3.5. Part E: Applied semiotics Part E (Chapter XV, also in Volume 3) includes 18 articles on selected sign problems of industrial and post-industrial societies, which are only marginally treated in the context of the current university disciplines, if at all. The most striking feature of contemporary industrial culture is doubtless the standard of its communication techniques. The influence they have on the world view of humans can be assessed if one imagines what communication was like before they were available. If someone were to learn of a remote event only through perception of the nonlinguistic reactions of the leader of his tribe, he would get a different idea of it than one who received a verbal description, a handwritten report, a printed communication, or a telephone message, or who had seen it simulated in cyberspace. Accordingly, the first article (159) of Chapter XV characterizes the changes that the development of communications technology has brought about in the attitude humans have towards nature and culture. Ever since humans have existed on earth they have attempted to make predictions about the future on the basis of features of the present. This need manifests itself in a range of practices such as the oracle of Antiquity, the Chinese earthquake forecaster, Oriental palmistry, as well as European astrology, and American futurology. Article 160, “Divination and Futurology”, gives a semiotic analysis of these practices. Contemporary societies are characterized by their ways of classifying the activities of their members into duty versus leisure, their behavior into professional work versus hobby, and the time involved into work days versus holidays. The organization of work, the division of labor, the ways of communicating at the working place, and the procedures used for the reproduction of working skills and knowledge are central topics for a sign-based analysis of society. They are treated in Article 161, “Work”. The social problems created by the organization of work in industrial cultures are symbolically overcome in sports and games. This
12 is why inportance has steadily increased over the past hundred years. Article 162 examines them semiotically. Sports often involve other animals, which brings into focus the task of communication between man and animals. Interspecific communication differs from intraspecific communication in many respects, one of them being the need to find shared perceptory channels and to abstract from the codes used in the intraspecific context. Article 163 treats the problems occurring in such situations. Sports serve as physical education for adolescents and are used to preserve physical fitness in adults; corresponding means of maintaining the performance of the aging body are applied in geriatrics and studied in gerontology. Article 164 shows how the semiotic perspective can help to understand the ways in which a person’s modes of perception, emotional capacity, and general codes are changed in the aging process. And it shows how semiotics can be of use in the development of measures against memory loss and in the construction of prostheses for overcoming other physical deficiencies. Tourism is often also seen in the light of physical regeneration. It cannot be understood, however, without reference to the desire of experiencing the conditions of other cultures with one’s own body. Seeing other ways of life and other people as representative of a particular country, city, or period is an iconic process of a special kind, which is analyzed in Article 165. The world of business is also patterned in an increasingly subtle way by sign processes. Article 166 examines the kinds of signs used in product design, pricing strategies, market segmentation, sales talk, public relations and the cultivating of a corporate image. An important area of business communication is advertising, which is increasingly influencing the other communication genres in industrial cultures. Advertising also provides good examples for the functioning of ideology in industrial cultures. It creates social reality by encoding it. Article 167 examines the history of the ideology concept, considers the techniques involved in the production of ideology, and discusses ways of unmasking them. Writing is a particularly effective means of creating ideology. In industrial cultures it has acquired such a degree of prominence that even academic scholars for a long time staunchly neglected other forms of communication. This fact was criticized early by semi-
I. Systematik
oticians, and thus the semiotics of nonverbal communcation, treated in Article 168, has been of great influence in psychology and ethology. The semiotics of multi-media communication originated in a similar way and it is today continually taking on new tasks due to the rapid developments in electronic media. Article 169 discusses the challenge which multimedia communication poses to semiotics. It has become almost impossible to imagine industrial cultures without pictograms. The number of official traffic signs alone has increased a hundredfold, from four to over four hundred, in twentieth-century Europe. Pictograms have become a favorite field of demonstration for the achievements of semiotic theories, as shown in Article 170. Although industrialization rendered many traditional sign systems obsolete, it also created many new ones. Apart from graphical symbols and technical signs, one only has to think of acoustic signals: sirens, horns, the wailing of ambulances and police-cars, identification signals in radio, and the telephone code. The validity of such signs did not develop by way of convention, it was rather introduced by direct order or at least regulated by a standardizing public institution. Article 171 deals with this development. The refinement of copying techniques and the parallel sensitizing for the original have created a further problem, which has long occupied aesthetics but has become a considerable economic factor today: imitations and forgery in arts and crafts. Article 172 analyzes the semiotic aspects of fakes. Ciphers and secret codes have always had their place in the armory of diplomacy. Unimagined possibilities of making and breaking codes have risen from the use of computers, as is shown in Article 173. Reformulating the content of a text in another code is a procedure necessary in all cultures. It is called “translation” and may be regarded as semiosis par excellence. The circumstances to be taken into account and the procedures used in translation between natural languages are the topic of Article 174. Since the decline of Latin as the common European language, there have been many attempts to substitute an artificial language, conceived a priori as a notation of ideas or a posteriori as a simplified natural language. Article 175 deals with the function and structure of such universal languages and discusses the problems of their application.
1. Semiotics and its presentation
With the introduction of the computer and the increase in the range of terrestrial transmitting and receiving stations, an age-old dream of mankind has come closer to realization: the establishment of contact with extraterrestrial beings, should they exist. As Article 176 details, the principles developed in the theory of universal languages find systematic application here. With these articles on the present tasks of descriptive and applied semiotics, the Handbook completes the circle begun in the historical part with the description of medical semiotics and divination. Yet more special topics could have been picked out, but, unlike the others, this part of the Handbook is not meant to cover the whole problem area. Rather, it serves the purpose of displaying the variety of current fields of application and of demonstrating the capacity of modern semiotics to cope with them, so that the reader is stimulated to further development and creative application. 3.6. Part F: Working tools for semioticians Apart from the systematics, history, and modes of application of semiotics, the Handbook offers practicing semioticians a series of concrete professional tools. The name and subject indexes allow the use of the book as an encyclopedia and as a dictionary. The German terms are listed alongside the English in the subject index, so that it can also serve as a bilingual glossary. Anyone wishing for assisted access to semiotic societies and semiotic research and teaching institutions, or seeking to establish contact with other semioticians at summer universities or vacation courses, can make use of the review (Article 177) in Chapter XVI (appendix), which was contributed as a result of a worldwide survey undertaken by the International Association for Semiotic Studies. The appendix also offers, in Article 178, a survey of other important semiotic reference sources: dictionaries, encyclopedias, and bibliographies as well as periodicals.
4.
Selected references
Apel, Karl-Otto (1973), “Charles Morris und das Programm einer pragmatisch integrierten Semiotik”. In: Charles W. Morris, Zeichen, Sprache und Verhalten (German translation of Signs, Language, and Behavior). Düsseldorf: Schwann: 9⫺66. Bre´ al, Michel (1897), Essai de se´mantique: Science des significations. Paris: Hachette. English transla-
13 tion by Y. Whatnough: Semantics. Studies in the Science of Meaning. New York: Holt 1900. Bühler, Karl (1934), Sprachtheorie. Die Darstellungsfunktion der Sprache. Jena: G. Fischer. 2nd edition Stuttgart: G. Fischer 1965. English translation by D. F. Goodwin: Theory of Language. Amsterdam: Benjamins 1990. Buyssens, Eric (1943), Les langages et le discours. Brussels: Office de Publicite´ . Carnap, Rudolf (1934), Logische Syntax der Sprache. Wien: Springer. English by A. Smeaton: The Logical Syntax of Language. London: Kegan Paul 1937. Carnap, Rudolf (1939), Foundations of Logic and Mathematics. Chicago: The University of Chicago Press. Carnap, Rudolf (1942), Introduction to Semantics. Cambridge MA: Harvard University Press. Carnap, Rudolf (1954), Einführung in die symbolische Logik, mit besonderer Berücksichtigung ihrer Anwendungen. Wien: Springer. English by W. H. Meyer and J. Wilkinson: Introduction to Symbolic Logic and its Applications. New York: Dover 1958. Cherry, Colin (1957), On Human Communication. New York: John Wiley. Hjelmslev, Luis (1943), Omkring sprogteoriens grundlaeggelse. Copenhagen: Munksgaard. English translation by F. J. Whitfield: Prolegomena to a Theory of Language. Madison WI: The University of Wisconsin Press 1963. Jakobson, Roman (1960), “Linguistics and Poetics”. In: Thomas A. Sebeok (ed.), Style in Language. Cambridge MA: The MIT Press: 350⫺377. Morris, Charles W. (1929), “The Relation of Formal to Instrumental Logic”. In: Thomas V. Smith and William K. Wright (eds.), Essays in Philosophy. By Seventeen Doctors of Philosophy. Chicago: Open Court: 251⫺268. Morris, Charles W. (1937), Logical Positivism, Pragmatism, and Scientific Empiricism. Paris: Hermann. Morris, Charles W. (1938), Foundations of the Theory of Signs. Chicago: The University of Chicago Press. Morris, Charles W. (1939), “Aesthetics and the Theory of Signs”. Erkenntnis: Journal of Unified Science 8: 131⫺150. Morris, Charles W. (1946), Signs, Language, and Behavior. New York: Prentice-Hall. 2nd edition Braziller 1955. Morris, Charles W. (1964), Signification and Significance. Cambridge MA: The MIT Press. Morris, Charles W. (1971), Writings on the General Theory of Signs, ed. T. A. Sebeok. The Hague and Paris: Mouton. Neurath, Otto (ed.) (1938 ff), International Encyclopedia of Unified Science. Vols. 1⫺2: Foundations of the Unity of Science. Chicago: The University of Chicago Press.
14
I. Systematik
Ogden, Charles K. and Ivor A. Richards (1923), The Meaning of Meaning. London: Routledge and Kegan Paul. Peirce, Charles S. (1931⫺1958), Collected Papers. Vols 1⫺8, ed. C. Hartshorne and P. Weiss (vols 1⫺ 6) and A. W. Burks (vols 7 and 8). Cambridge MA: Harvard University Press (referred to as “C. P.” in the text). Peirce, Charles S. (1982 ff), The Writings. A Chronological Edition. 5 vols so far. Bloomington: Indiana University Press. Posner, Roland (1979), “Charles Morris und die verhaltenstheoretische Grundlegung der Semiotik”. Zeitschrift für Semiotik 1: 49⫺79. Enlarged English version: “Charles Morris and the Behavioral Foundations of Semiotics”. In: Martin Krampen et al. (eds.), Classics of Semiotics. New York and London: Plenum 1987: 23⫺57. Posner, Roland (1986), “Morris, Charles William”. In: Thomas A. Sebeok (ed.), Encyclopedic Dictionary of Semiotics. Berlin and New York: Mouton de Gruyter: I, 565⫺571.
Prieto, Luis J. (1966), Messages et signaux. Paris: Presses Universitaires de France. Reichenbach, Hans (1947), Elements of Symbolic Logic. New York: Macmillan. Saussure, Ferdinand de (1916), Cours de linguistique ge´ ne´ rale, ed. C. Bally, A. Sechehaye, and A. Riedlinger. Lausanne and Paris: Payot. English translation by W. Baslein: Course in General Linguistics. New York: Philosophical Library 1959. Saussure, Ferdinand de (1968), Cours de linguistique ge´ ne´ rale. Tome 1, e´ dition critique par Rudolf Engler. Wiesbaden: Harrassowitz. Savan, David (1988), “Peirce and the Trivium”. Cruzeiro Semiotico 8: 50⫺56. Sebeok, Thomas A. (1971), “Terminological Note”. In Morris 1971: 9⫺10. Uexküll, Jacob von (1940), Bedeutungslehre. Leipzig: Bios. English translation by Thure von Uexküll: “The Theory of Meaning”. Semiotica 42 (1982): 25⫺85.
Roland Posner, Berlin (Germany)
2. Syntactics 1. 2. 3. 4.
Subdivisions of syntactics Formal aspects of signs Relations between signs Complex signs 4.1. Analysis and synthesis 4.2. The concept of a string 4.3. String codes 4.4. Production grammars 4.5. Regular grammars 4.6. Context-free grammars 4.7. Context-sensitive grammars 4.8. Grammars and automata 4.9. Syntactic structures and structural descriptions 4.10. Transformational grammars 5. Recent developments in formal syntactics 5.1. X-bar syntax, subcategorization, and thematic roles 5.2. Graphs, markedness, and unification 5.3. The direct formation of structure trees 5.4. Multi-dimensional sign systems and graph grammars 6. Selected references
1.
Subdivisions of syntactics
Syntactics studies the conditions an entity must fulfil if it is to represent meaning for interpreters in semiosis (cf. Art.1). With re-
spect to the traditional problem areas of semiotics, it is not always easy to decide whether they belong to the subject matter of syntactics or not (cf. Morris 1946: 219 f ⫽ 1971: 303). In many cases the answer will be different according to which conception of syntactics it is based on: ⫺ syntactics1 as the study of the formal aspects of signs (Morris 1929, 1937, and 1938: 13 ff ⫽ 1971: 27 ff), ⫺ syntactics2 as the study of the relations of signs to other signs (Morris 1937, and 1938: 7 ff ⫽ 1971: 23 ff), or ⫺ syntactics3 as the study of the way in which signs of various classes are combined to form complex signs (Morris 1938: 14 ⫽ 1971: 28 f and 1946: 354 f ⫽ 1971: 367). The areas of research defined by the three characterizations overlap but are not identical. In what follows we will therefore use the term “syntactics” without a subscript only when we speak of syntactics proper, i. e., the science whose subject matter is the intersection of the subject matters of syntactics1, syntactics2, and syntactics3.
2. Syntactics
2.
Formal aspects of signs
The question as to what constitutes the formal aspects of signs has been given alternative answers by different traditions of semiotics (cf. Art.1 § 2.). While logic-oriented semioticians like Wittgenstein (1922: 3.33), Carnap (1934: 1, 208 and 1938: 16), and Morris (1938: 13 ff ⫽ 1971: 27 ff) equate the distinction between form and substance with the distinction between signs (B’s) and meanings (C’s), linguistics-oriented semioticians like Saussure (1916: 155⫺157) and Hjelmslev (1943: 69⫺73 and 98 ff ⫽ 1963: 76⫺81 and 110 ff) use it to differentiate two kinds of aspects within signs (B’s) as well as within meanings (C’s). Yet the underlying conceptions of form are quite similar and are based on the theory of invariants as developed in geometry; cf. the “Erlangen Program” of F. Klein (1872: 463 f): “A generalization of geometry raises the following problem: Let there be a multiplicity of elements and a group of transformations defined on them; now the configurations of elements in that multiplicity should be studied with respect to those properties that remain unchanged when transformations of that group are applied to them […]. The task is to develop the theory of invariants for that group.” In such configurations of elements two different types of entities may vary. On the one hand, certain properties of the configurations can change while others remain constant, as is the case in the movement of an object in space, where the location varies but all spatial proportions of the elements involved stay the same. On the other hand, the elements themselves can also change, as when geometrical figures are replaced by sequences of letters or numbers. What remains invariant here is the abstract structure of the figure (cf. Holenstein 1975: 30 ff and Wunderlich 1971). More complicated cases in point are mirroring in visual space, where the location and orientation of a figure changes but all of its spatial proportions remain the same, and the transposition of a musical chord in auditive space, where the absolute pitches of the tones change but the structure of the pitch relations is taken to remain the same, thus determining the pitch space of tonal music. The structure of a relation was extensionally defined (in a type-theoretic setting) by Russell (1919: 59 ff) and Carnap (1928: 13 ff) as the class of relations isomorphic with that relation. This approach was developed fur-
15 ther (within set theory) in the mathematical theory of structures published by the group of French mathematicians Bourbaki (1935 ff). It is related to Hilbert’s doctrine of implicit definitions (cf. 1918 and 1925; cf. Art. 30 § 1.6.). Hilbert proposed to define basic technical terms of a theory implicitly by specifying the axioms in which they occur. Discussing the development of mathematics, Hilbert wrote in 1925: “In intuitive number theory formulas were always exclusively used for communication. The letters stood for numbers and an equation communicated the fact that the two numbers coincided. In algebra, on the other hand, we regard expressions containing letters as independent structures which formalize the material theorems of number theory. In place of statements about numbers, we have formulas which are themselves the concrete objects of intuitive study. In place of number-theoretic material proof we have the derivation of a formula from another formula according to determinate rules” (cf. Putnam and Benacerraf 1964: 145). Carnap (1934) applied this idea to the study of language in general. He was convinced that for every language one can work out “a formal theory of the forms of that language” (1934: 1). It was the task of that theory to specify the rules that determine the sign forms of a language. For Carnap, the formal nature of the concrete individual sign was no problem, as it was for Hjelmslev (see below). Therefore he was content to characterize the sign forms of a language by specifying “the classes and the serial relations” of their components (1934: 1). Analogous to Hilbert’s program of Metamathematics, Carnap’s “formal theory” was to be formulated in a special metalanguage whose expressions refer to the object-language in question (1939: 5). Morris (1938: 9 ⫽ 1971: 23 f and 1946: 178 f ⫽ 1971: 256 f) generalized this conception for sign systems of all kinds with all their aspects. If we call a sign system under study “an object-code”, Morris (1938: 13 ff, 21 ff, and 29 ff ⫽ 1971: 28 ff, 35 ff, and 43 ff) envisaged three different metalanguages dealing with three different dimensions of semioses involving signs in the object-code. The metalanguages differ in what their expressions refer to. While the pragmatic metalanguage refers to the interpreters (cf. Art. 4) and the semantic metalanguage refers to the meanings (cf. Art. 3) of the signs in the object-code, a metalanguage whose descriptive terms all refer only to the sign forms of the
16 object-code is called “a syntactic metalanguage”. It is worth noting that each metalanguage has itself all properties of a sign system. Thus the syntactic metalanguage not only has a syntactic dimension insofar as it contains signs of various classes with various serial relations holding among them, it also has a semantic dimension since its signs are interpreted to represent meaning and refer to something, i. e., to the signs of the object-code, and it has a pragmatic dimension insofar as it can be used by special types of interpreters, i. e., by syntacticians. This being the case, it is the semantic dimension of the syntactic metalanguage that has to do with the syntactic dimension of the object-code. And it is the semantic metalanguage of the syntactic metalanguage that deals with the relations between signs of the syntactic metalanguage and signs of the object-code. Viewed from this perspective, the text of this article can be understood to be written in the pragmatic metalanguage of the syntactic metalanguages devised by semioticians of various traditions to deal with object-codes. What has been said about the syntactic metalanguage so far takes care of the terms “forms of a language” in Carnap’s program and “formal aspects of signs” in Morris’s version thereof. Understood in this way, syntactics1 becomes a subdiscipline of syntactics2. There are, however, two problems remaining; one is the task of setting up a “formal theory” within the syntactic metalanguage (it will be treated in § 4 and 5; cf. also Art. 30 § 1.7.3.); the other is the problem of characterizing the formal aspects of a sign that is not a complex sign. The latter problem was approached by Hjelmslev, who, like Carnap (1928: 11), insisted “that a totality does not consist of things but of relationships, and that not substance but only its internal and external relationships have scientific existence […]” (Hjelmslev 1943: 22 ⫽ 1963: 23). This approach had been successful in the theory of human speech sounds. Reflecting on Trubetzkoy’s (1929) analysis of vowel systems, Bühler (1931) had distinguished the acoustic sign from the concrete sound event by saying that the former was connected with the latter as form is connected with unformed matter. In 1934, Bühler described the complex relation between the properties of sign matter and sign form with reference to the areas of two overlapping geometrical figures (1934: 28 and 42 ff; cf. Art. 112): in
I. Systematik
order to recognize the sign form in the sign matter produced in semiosis, the interpreter must on the one hand concentrate on the relevant properties of the sign matter and abstract from the irrelevant ones (principle of abstractive relevance), and on the other hand complement properties of the sign form not manifested in the sign matter (principle of apperceptive complementation of the sign gestalt). The distinction between sign matter and sign form can be exemplified by the way different languages pattern the sign matter which Berliners produce in order to name their city: it becomes [be:1~=n] in English, [bø ir1li:n] in German, [bø æR1li{n] in Danish, and [bi~u~inu] in Japanese. Hjelmslev, who uses this example (1943: 52 ⫽ 1963: 56), describes it by saying that one and the same sign matter (“purport”) is modeled into different sign substance through the sign forms supplied by the different languages. The sign forms comprise the language-specific invariants patterning sign matter. According to Hjelmslev, these invariants are independent of the medium involved; thus a given sign form can be realized by sign matter in various media, as when the speech chain of German [bø ir1li:n] is transformed into the written word Berlin. From this he concludes (1943: 91 f ⫽ 1963: 103 f): “ ‘Substance’ cannot itself be a definiens for a language […]. Here is a graphic ‘substance’ which is addressed exclusively to the eye and which need not be transposed into a phonetic ‘substance’ in order to be grasped or understood.” What is true for language also holds for all other sign systems. In phonology, the difference between substance and form is captured terminologically by the distinction between phonetic and phonemic entities studied by phonetics and phonemics, respectively. This distinction was generalized in American Structuralism by isolating the suffixes -etic and -emic (cf. Bloomfield 1933 and Pike 1954, 1966) and using them in the description of non-linguistic sign systems. Thus a description in terms of behavioremes considers all and only those properties of a given behavior that are relevant for it to represent meaning to interpreters of the kind in question, while a description including other aspects of behavior would be called “behavioretic”. The fruitfulness of this distinction became obvious in Western cultural anthropology in the 1950’s and 60’s when ethnomusicologists such as Bruno Nettl (cf. Nettl 1957 and 1983) discovered that the conceptual
17
2. Syntactics
framework of Western music theory was inappropriate for the description of music from other parts of the world (cf. Nattiez 1987: 67⫺95). Chenoweth (1972) used methods of analysis developed by Pike (1954, cf. 1966) to determine the cultural relevance of musical intervals in culture-specific styles of singing. If the members of a culture tolerate the replacement of an interval by an acoustically different one in a given melody without judging the resultant melody to be different from the original, the two intervals must be considered emically equivalent in that culture (cf. Goodman 1968 and Posner 1988: 916). Occasionally, two etically different intervals are emically different in one context and emically equivalent in another one. In phonology, such cases are known as neutralization (cf. Trubetzkoy 1939). Examples for neutralizing contexts in Western music are the minor scales, as pointed out by Monelle (1992: 60) with reference to Nettl (1957: 39): “In the key of C, the tones a and b are used in ascent, a-flat and b-flat in descent. Thus a and a-flat are allophones of the same tone in the scale […]. Many folk music items exhibit this kind of tonal arrangement, using one variant of a pitch in ascent, another in descent.” What is true of tones and intervals also applies to duration and loudness so that one can postulate tonemes as well as rhythmemes and dynamemes in music (cf. Seeger 1960: 229 f). Analogously, chromemes, formemes and texturemes are postulated as elementary sign forms in visual signs (cf. Groupe m 1992: 197). The general conclusion to be drawn from this is that the sign forms in the various physical media (for the concept of media cf. Art. 14) are constructs of categorical perception, which are learned by infant organisms through culture-specific deformation of initial categorizations (cf. Eimas 1980 for speech perception, Burns and Ward 1978 for music perception and Saint-Martin 1987: ch. 2 for visual perception; see also Art. 6⫺11). Categorical perception can be mathematically described by means of catastrophe theory, which explains how small changes in certain parameters of a stimulus can lead to radical changes in the categorization of the percept (cf. Thom 1972 and 1980 as well as Petitot-Cocorda 1985 a and b; see also Wildgen 1982). In summary, it should be noted that syntactics1 studies sign forms and disregards sign substance and sign matter: Within linguistics,
syntactics1 includes phonemes but excludes physical phonetics; within musicology it includes tonemics, rhythmemics and dynamemics but excludes physical acoustics; within the study of visual signs it includes chromemics, formemics and texturemics but excludes physical optics. This delimitation, which relies on the differences between concrete and abstract, should not be confused with a distinction introduced by Peirce (C. P. 4.537) and developed further by Reichenbach (1947: 4, 21, 284, 336), which is based on the difference between individual and general. For practical purposes, sign forms must be reproducible since we want to use them on more than one occasion. The individual sign form is called a token. Thus in the two sentences “Whatever happens, Berlin will remain Berlin” and “Berlin is situated in Germany” we have the same word Berlin, but appearing in three different tokens; and in giving the explanation, a fourth token of the word has been produced. This can be described by stating that the four sign forms are tokens of the same sign type. Thus the common formulation “the same sign occurs in different places” amounts to saying “(sign [form]) tokens of the same (sign [form]) type occur in different places”. The independence of the type/tokendistinction from the form/substance/matterdistinction is demonstrated by the fact that one can also distinguish tokens from types in sign substance and in sign matter.
3.
Relations between signs
The statement that in a complex sign form like “Berlin will remain Berlin” two component sign forms are tokens of the same type is a statement about a relation between these sign forms and thus falls into syntactics2, the study of the relations between signs. Traditionally, there are said to be two kinds of relations between signs (cf. Morris 1938: 6 f and 18 ff ⫽ 1971: 21 f and 32 ff): a. relations between signs occurring in a given complex sign, b. relations between signs in a sign system (i. e., code; cf. Art. 16 and 17). Relations of the first kind are usually exemplified by syntagmatic relations, relations of the second kind by paradigmatic relations (cf. Kruszewski 1884, Saussaure 1916, and Hjelmslev 1943). The difference can best
18 be demonstrated with respect to the process of sign production. In producing a complex sign, the sender will make successive selections from the inventory of a sign system mastered by him and combine, according to certain rules, the chosen elements into an appropriate structure. Let us take a natural language like English as the sign system and an utterance of the sentence “The child sleeps” as an example. Then, “if child is the topic of the message the speaker selects one among the extant more or less similar nouns like child, kid, youngster, tot, all of them equivalent in a certain respect, and then, to comment on this topic, he may select one of the semantically cognate verbs sleeps, dozes, nods, naps. Both chosen words combine in the speech chain” (Jakobson 1960: 358). The set of elements that provides the basis of selection in each step of the sign production is called “a paradigm”, and the result of the combination of the elements selected is called “a syntagm”. Paradigms need not consist of semantically equivalent signs, as in Jakobson’s example, but can consist of signs having the same distribution in syntax like sleeps, lies, stands, or of signs belonging to the same lexeme like sleep, sleeping, sleeps, slept, or of signs containing the same root like sleep, sleeper, sleepy, or of signs having the same phonemes in certain positions like sleep, sweep, steep, or even of signs having the same subphonemic properties like German ich, nicht, Licht, where /x/ is pronounced differently from ach, Nacht, lacht. Semantic, syntactic, inflectional, derivational, phonemic, and phonetic paradigms all have the same structure: Each of them is a class of elements equivalent to one another in a certain respect. Paradigms that fulfil additional conditions such as that of mutual substitutability of all their elements in specified types of contexts salva congruitate, i. e., with well-formedness being preserved in the interchange, are called “syntactic categories” (cf. Bar-Hillel 1964; cf. also § 5.1. and 5.2. as well as Art. 4). While paradigms are constituted by relations of (partial) equivalence, syntagms are constituted by relations of contiguity. Contiguity can be conceived of as proximity in space or time, as a restriction determining the distribution of one constituent with respect to another, or as a dependency relation like agreement in number between a and child or agreement in person and number between child and sleeps in the above example. Since
I. Systematik
syntagms are complex signs produced by some interpreter, syntagmatic relations are part of the surface structure of those signs. A syntagmatic relation is to be distinguished from a deep-structure relation and from a syntactic rule determining either of them (cf. Posner 1982: 129⫺159). Although originally defined as a term for linear configurations of signs in texts (“serial relations”, cf. Saussure 1916: 171 and Carnap 1934: 1; “precedence relations”, cf. § 5.1.4.), the term “syntagmatic relation” is also applied to signs combined in more than one dimension (cf. § 5.4.), as occurring, e. g., in vestimentary codes (cf. Barthes 1967: ch. 12), film (cf. Metz 1974: ch. 8 and 9), music (cf. Tarasti 1979: ch. 6.1), theater (cf. Fischer-Lichte 1983: ch. 8), and pictorial art (cf. Groupe m 1992: 218 ff). Syntagmatic and paradigmatic relations are conceptually distinct, but they can occur together, as in paradigms of syntagms: The child sleeps, The youngster dozes, The kid nods, The tot naps constitute a paradigm of elements equivalent with respect to the syntagmatic relations holding within each of them; another case in point is the inflectional paradigm exemplified above. Paradigms of sign forms need not be given in advance within a generally valid code, they can also be constructed in the perception of an individual complex sign such as a poem, a picture, a building, or a piece of music. They then constitute what is called “the aesthetic code” of the complex sign in question (cf. Posner 1982: 122 f). In music, the listener’s search for œuvrespecific paradigms in melody, harmony and rhythm is an essential part of the interpretation process. Ruwet (1966) has attempted an operationalization of this process which is summarized here in the procedural formulation of Monelle (1992: 83 f): “1. One identifies […] the longest passages that are repeated fully, whether at once or after another passage, giving formulae like A ⫹ B ⫹ X ⫹ B ⫹ Y, where A and B are recurrent passages, X and Y non-recurrent passages. 2. Non-recurrent passages are considered units on the same level as recurrent passages in the respect of length. As repetitions of temporal proportion they may be written as primary units; thus A ⫹ X ⫹ A ⫹ Y becomes A ⫹ B ⫹ A ⫹ C. The resulting segmentation may now be checked by looking at pauses […]. 3. If the above operations have not yielded a satisfactory analysis, the following misfunctions may be suspected: (i) Non-recurrent
19
2. Syntactics
Fig. 2.1: Oevre-specific paradigms in the flagellant song Maria muoter reine mait as analyzed by Ruwet.
passages are much shorter than recurrent ones and therefore cannot be considered units on the same level. (ii) Non-recurrent passages are longer than recurrent ones. Here the non-recurrent passage may have to be subdivided, either yielding several units of level 1 ⫺ thus A ⫹ A ⫹ X becomes A ⫹ A ⫹ B ⫹ C ⫺ or shifting the analysis on to level 2 where the recurrent passages are themselves subdivided into shorter figures which may be found to recur in the non-recurrent passages. Thus, for example, A ⫹ A ⫹ X may become (a ⫹ b) ⫹ (a ⫹ b) ⫹ (x ⫹ b). If neither of these procedures is possible, it may be necessary to consider X as an unanalyzed unit on ‘level 0’. 4. Passages which seem initially not the same may be transformations of each other (rhythmic or melodic variants) according to certain principles of transformation. (i) If pitch and rhythm are separated, we may find similar contours with different rhythms or similar rhythms with different contours. (ii) There may be permutations, additions and suppressions of certain elements. (iii) In discerning the equivalence of certain passages it may be necessary to shift from a higher to a lower level or from a lower to a higher, which Ruwet calls ‘shunting’. For example, while units on level 2 ⫺ a ⫹ b ⫹ a ⫹ c ⫺ may seem to constitute the realities of analysis, it may be necessary to move up to level 1 for the purposes of subsequent work, and to determine that a ⫹ b ⫽ A and a ⫹ c ⫽ A⬘. (iv) In some cases units of level 1 may seem to group themselves into even longer units. Must we therefore evoke a ‘level 0’? Taking two typical formulae: A ⫹ X* ⫹ A ⫹ Y,
X ⫹ A* ⫹ Y ⫹ A, we find that each may become A ⫹ B or perhaps A ⫹ A⬘ on level 0, on the fulfilment of one of the following conditions: (a) there is some special rhythmic marking of the point shown by an asterisk, either a pause or the prolongation of a note. (b) Y is a transformation of X⬙. Ruwet (1966) exemplifies this procedure with the 14th century German flagellant song Maria muoter reine mait and isolates the paradigmatically related passages by writing them vertically beneath each other in the score (cf. Fig. 2.1). For similar approaches cf. Baroni and Jacoboni (1978), Lerdahl and Jackendoff (1983) as well as Stoffer (1985). A complex sign may be the basis for setting up several alternative paradigms, and the choice between them can be a source of aesthetic delight for the interpreter, as in Brahms’ Intermezzo opus 119 nr. 3 (cf. Fig. 2.2) where paradigms of recurrent rhythmic and melodic sequences (see the analysis beneath the score) compete with paradigms of metric and harmonic arrangement (see the analysis above the score). Each of these alternative structurings can be emphasized or de-emphasized by a musician through the use of subtle diacritical signs. Monelle (1992: 98) provides the historical context: “The […] analysis [given above the score] conforms best to the harmonic arrangement of the tune and seems initially the most natural. Indeed, Julius Katchen, in his recording of the piece, seems to follow it. But another pianist, Walter Klein, stresses the melodic repetitions [of the analysis given beneath the score] […]; and even more striking,
20
I. Systematik
Fig. 2.2: A passage from Brahms’ Intermezzo opus 119 nr. 3, analyzed according to competing paradigms (after Nattiez 1975: 326 and Monelle 1992: 98).
in the film Rendez-vous a` Bray of Andre´ Delvaux this piece serves as leitmotiv and becomes the object of variations in different styles. It is the melodic unit […] which serves as theme of these variations.” In mathematical music theory (cf. Mazzola 1985, 1990 and 1993 as well as Noll 1995), a paradigmatic relation is defined as a morphism between local compositions. Local compositions are regarded as pairs such as (K, M) and (L, N), where K and L are (finite) subsets of musical parameter spaces M and N. (For the concept of parameter space cf., e. g., Nattiez 1987: ch. 9⫺12.) A morphism between two local compositions f: (K, M) ⇒ (L, N) is a mapping f: K ⇒ L which is induced by a structure-preserving mapping F: M ⇒ N between the two parameter spaces involved. A simple example is Mazzola’s (1990: 93 ff) explication of the relationship between the major and minor tone scales in Western music: If these scales are studied as local compositions in a fifth-third-tone net, then it can be proven that there are exactly two isomorphisms which map them onto each other. In Fig. 2.3 the C-major scale and the C-minor scale are presented on the left and right, respectively. The isomorphism indicated by the three two-sided arrows is an axial mirroring along the central horizontal line connecting F and D which maps F, C, G and D into themselves and A into Ab, E into Eb, and B into Bb. The isomorphism indicated by the curved arrows is a central mirroring around the center of the line connecting C and G which maps F into D, C into G, A into Bb, E into Eb, B into Ab, and vice versa. This formal analysis is confirmed by
Fig. 2.3: The two isomorphisms connecting the Cmajor and C-minor scales in Western music.
the fact that Hindemith (1940) discussed exactly two possible interpretations of the opposition between major and minor scales. The axial mirroring corresponds to what Hindemith called “the dimming” of E to Eb (as well as of A to Ab and B to Bb), while the central mirroring corresponds to what he called “the dualism” between the two scales. In mathematical music theory, isomorphisms of the kind used in our examples are applied to set up a classification of all possible local compositions into paradigms (cf. Fripertinger 1993). In musicology, as in other semiotic disciplines, the study of paradigms is called “paradigmatics” and the study of syntagms is called “syntagmatics”. Paradigmatics and syntagmatics are both part of syntactics2. While paradigmatics requires the comparison of given sign forms with virtual ones, syntagmatics analyzes the relations of sign forms within actually produced sign complexes. It will therefore be treated in more detail in the context of syntactics3 (cf. § 4. and 5.).
21
2. Syntactics
Syntactics as an intersection of syntactics1, syntactics2 and syntactics3 must not be confused with syntagmatics nor with syntax as defined in linguistics. As is obvious from the verbal examples discussed above, paradigmatic and syntagmatic relations can be found on all levels of language. This fact has been exploited by structuralist linguists to use these relations in the definition of the levels of language and of the disciplines studying them (cf. Bloomfield 1933, Harris 1947, as well as Hjelmslev 1943): phonetics studying the physical properties of linguistic sound matter; phonemics studying the relations between phonemes, i. e., the smallest sound forms used to distinguish the signs of a language; morphology studying the relations between morphemes, i. e., the smallest combinations of phonemes representing meaning to the language user, and their combinations into words (derivational morphology) and word forms (inflectional morphology); syntax studying the relations between phrases, i. e., combinations of word forms within and into sentences; lexicology studying the relations between paradigms of word forms having the same meaning. Of these disciplines, phonetics does not deal with formal aspects of signs and is therefore excluded from syntactics1; phonemics deals with formal aspects of signs, but not with combinations of signs and is therefore excluded from syntactics3; inflectional and derivational morphology and syntax deal with formal aspects of signs, their relations, and their combinations and are part of syntactics proper; lexicology deals with formal aspects of signs but not with their combinations and is therefore excluded from syntactics3. As it turns out, syntactics proper includes only morphology and syntax from the linguistic disciplines, and it is no accident that this is exactly what linguists have traditionally called “grammar”. Thus it is justified to regard syntactics as a semiotic generalization of grammar. In many contexts, the Carnapian identification of syntactics with syntax (cf. Carnap 1934 and 1939) is highly misleading. Only in sign systems which do not require a distinction between morphology and syntax is it unproblematic to equate syntactics with syntax. This is the case in sign systems such as numerals and in most of the formal languages constructed in logic so far. In summary, it should be noted that syntactics proper contains both syntagmatics
and syntax as subdisciplines, but syntagmatics overlaps with syntax, since syntax studies not only syntagmatic but also paradigmatic relations between phrases, and syntagmatics studies not only phrases but also morphemes and phonemes.
4.
Complex signs
4.1. Analysis and synthesis In his program for a “logical syntax of language”, Carnap (1934: 1) had envisioned “a formal theory of the forms of a language” to be formulated in a syntactic metalanguage. There have been various attempts to work out such a formal theory (cf. Art. 28 and Art. 30 § 1.7.). Most of them have been guided by the idea of a calculus, i. e., an axiomatic system that has the properties of an algorithm for specifying exactly the set of all signs belonging to the object-code under investigation (concerning the concept of algorithm cf. § 5.3. below). The specification of a set of more or less complex objects can be given either by starting with the complex objects and introducing rules for their analysis into components, components of components, etc. until elementary objects are reached. Or one can proceed from elementary objects and introduce rules for their use in the synthesis of more and more complex signs. The two approaches are of different value for different kinds of sign systems. For many sign systems that are in use in human or animal societies or within organisms or machines, it is by no means clear what the basic elements are. The most controversial examples include dance, gestures, pictures, films, and architecture. However, there are also sign systems where it is clear what the elementary signs are and hard to decide for a given complex sign whether it is part of the sign system in question or not and what is its structure. Such cases occur in some of the richer artificial languages of logic and mathematics. For these reasons it has become customary to use the analytic approach in the study of natural sign systems that have evolved over time, and the synthetic approach in the study of artificial sign systems (cf. the distinction between text-oriented and grammar-oriented cultures in Lotman 1969 and 1971, which is discussed in Eco 1976: 137 ff; cf. also Pape 1980). Linguists such as Bloomfield (1926 and 1933), Harris (1947), Wells (1947), Pike
22 (1954) and Hockett (1958), as well as Hjelmslev (1943), Prieto (1966), and Ruwet (1966; see the application to music in Fig. 2.1 above) have developed procedures for the step-bystep analysis of texts into components, components of components, etc. The formal theory for this approach has been discussed by authors such as Hjelmslev (1943), Marcus (1967), and Harris (1970). According to Hjelmslev, syntactic theory has to provide a general calculus containing rules of partition for complex signs in all sign systems. The application of such a calculus to a given complex sign involves a finite set of partition operations, the last of which will yield basic elements of the sign system in question. The syntactic structure of that complex sign is described by describing its analysis. The basic elements of the whole sign system are obtained by analyzing complex signs belonging to the system until no new basic elements are generated (cf. Hjelmslev 1943: 27⫺31 ⫽ 1963: 28⫺33). In judging the value of this approach one must distinguish between the continental European tradition and the American tradition. The first relies on Hjelmslev’s commutation method (cf. Art. 4 § 4.), which is applicable to sign systems of all kinds but does not abstract from the meaning of the signs analyzed, in the way required by Carnap and Morris. The second abstracts from the meaning of the signs analyzed but relies on the method of parsing, which is applicable to languages only. Philosophers and logicians such as Leibniz (cf. Knobloch 1973), Boole (1854), Frege (1879 and 1893⫺1903), Schroeder (1890), Peano (1894), Peirce (1934), Whitehead and Russell (1910⫺1913), Carnap (1934, 1939, and 1954), and Curry (1963) were the first to develop step-by-step procedures for the construction of more and more complex signs out of basic elements. The formal theory for this approach has been given by authors such as Thue (1914), Post (1936), Turing (1937 and 1950), Hermes (1938 and 1961), Markov (1947), Lorenzen (1955), Davis (1958), Trakhtenbrot (1960), Chomsky and Miller (1963), Bar-Hillel (1964), and Lindenmayer (cf. Lindenmayer and Rozenberg 1976 and 1979 and Rozenberg and Salomaa 1974). According to Chomsky, syntactic theory has to specify the general form of a calculus that generates all the expressions, i. e., the simple and complex signs, of a given language, starting from a finite set of basic elements and
I. Systematik
using a finite set of rules of various types. The application of such a calculus to an initial string involves a finite set of production operations, the last of which yields an expression of the language in question. The syntactic structure of that expression is described by describing its production. The set of expressions of the language is obtained by applying the rules of the calculus to all its basic elements (cf. Chomsky 1957: 18⫺91). Compared with the analytic approach, the calculi developed for the synthetic approach have reached a much higher sophistication. In addition, logicians like Carnap (1934: 8), Quine (1960), Montague (1970 a and 1970 b), and Cresswell (1973) and linguists like Chomsky (1965) and Shaumyan (1970) have shown that it is possible to apply the synthetic approach in the analysis of natural languages also by using the so-called “indirect method” (cf. Schnelle 1973). The point of this method is to introduce an artificial sign system into the metalanguage, which can be kept under tight control by means of the stipulative definitions with which it was constructed, to compare this sign system with the object-code, and to incorporate more and more features of the object-code into it so that in the end the set of signs belonging to the object-code becomes completely reconstructed in the metalanguage. This strategy has worked well in the analysis of natural languages. If it is to be applied to the study of non-linguistic sign systems, an additional obstacle has to be overcome. In language, the relations between the components of a complex sign are generally thought to be based on one single serial relation, e. g., the relation “following in time” as in speech or “immediately to the right” as in European writing systems. Complex signs governed by serial relations can be produced through application of an associative non-commutative binary operation called “concatenation”. As noted in § 2. and 3., however, there are sign systems that have either additional serial relations or equivalence relations or relations of more complex types governing their complex signs. If one wants to describe the syntactic structure of complex signs in sign systems using operations other than concatenation, one can again choose between a direct and an indirect strategy. The first strategy consists in defining appropriate operations of combination and describing the complex signs directly on this basis (cf. § 5.4. below). This strategy
2. Syntactics
is applied in the logic of relations (cf., e. g., Peirce 1897, Peirce 1934, Peirce 1973, and Roberts 1973), and discussed in pattern theory (cf., e. g., Grenander 1976⫺1981 and 1994) and computer graphics (cf., e. g., Faiman and Nievergelt 1969, Rosendahl 1973, Gips 1974, Gonzalez and Thomason 1978, Foley and van Dam 1982, Encarnac¸ a˜ o et al. 1984, Wahl 1984, Beck 1988, and Alexandrov and Gorsky 1993). In the second strategy, a system of notation is devised to represent the relevant features of the complex signs in question in a way that makes them more amenable to a linguistics-type syntactic analysis. Notational systems tend to reduce multidimensional sign configurations to two-dimensional ones (scores) or one-dimensional ones (strings). Examples are musical notations and the phonetic transcriptions of natural languages. Theoretically it is always possible to reduce a given n-dimensional sign complex to a complex with n-1 dimensions as long as the relations among its constituents are serial or equivalence relations (cf. Greenberg 1957: 95 f, Curry 1963: 50⫺69, Goodman 1968: 127⫺224, Fu 1976; see also § 5.3. below). To sum up, the best developed branch of syntactics3 is able to describe the syntactic structure of sign systems for which two conditions are fulfilled: a. A set of discrete basic elements is given from which all well-formed signs of the system can be constructed by combinatory operations (for syntactic structures beyond discreteness cf. Marcus 1992: 1356 f). b. All combinatory operations can be reduced to or defined on the basis of one single binary operation, i. e., concatenation; all complex signs of the system therefore are, or are reducible to, strings (for syntactic structures beyond concatenation cf. § 5.4.). Sign systems with these properties are called “string codes”. They include, among others, natural languages, writing systems, vestmental codes, culinary codes, and traffic signs. As a technical device for the syntactic description of string codes, formal grammars have been developed which may be characterized as string production grammars. They are a special type of the so-called “generative grammars” (cf. Chomsky 1957 and 1965, Bar-Hillel 1964, Marcus 1968, and Hermanns 1977). The rest of § 4. will give formal definitions for the concepts of a string (§ 4.2.) and a string code (§ 4.3.), introduce some basic
23 types of string production grammars, (§ 4.4.⫺4.7.), compare them with automata (§ 4.8.), explicate the concepts of the syntactic structure and the structural description of a string (§ 4.9.), and discuss transformations between string structures (§ 4.10.). 4.2. The concept of a string Let V be a finite set. Then a string of length n (n ⱖ 1) over V is a finite sequence a1a2 … an of elements from V (ai苸V for i ⫽ 1, 2, …, n). A null string, L, can be defined as a string with no elements in it. We will use lower case Latin letters for elements of V and lower case Greek letters for strings. Let S(V) be the set of all non-null strings over V. There is a binary operation ∩ in S(V) such that if a and b are members of S(V) and if a ⫽ a1 … an and b ⫽ b1 … bm, then a∩b ⫽ a1 … anb1 … bm is also a member of S(V). This operation is non-commutative, i. e., for a ⫽ b we generally have a∩b ⫽ b∩a, and associative, i. e., (a∩b)∩g ⫽ a∩(b∩g) ⫽ a∩b∩g. Such an operation as well as each result of its application is called “concatenation”. In the following, concatenation of two strings will be represented by simple juxtaposition of these strings. Because of non-commutativity each concatenation result has a unique sequential order. Because of associativity the sequential order in which concatenation operations are performed has no effect on the concatenation results. 4.3. String codes An algebraic system *A, ◦+ composed of a set A and a binary operation ◦ is called “a semigroup” if ◦ is associative in A. Clearly *S(V), ∩+ is a semigroup. Since ∩ is represented by juxtaposition, we will use S(V) to refer to it. If *A, ◦+ is a semigroup which contains an element e such that a◦e ⫽ e◦a ⫽ a for all a苸A, then *A, ◦+ is called “a monoid” and e is called “an identity of A”. If a semigroup contains an identity this identity is unique. Let S⬘(V) ⫽ S(V) ∪ {L}; then clearly, S⬘(V) is a monoid with L as its identity. To exemplify an abstract system which fulfils the required conditions and is not a sign system, let us consider the set ⺞ of natural numbers 1, 2, 3, … under the operation of addition: The elements n1, n2, and n3 in ⺞ have the property (n1 ⫹ n2) ⫹ n3 ⫽ n1 ⫹ (n2 ⫹ n3), i. e., addition is associative and *⺞, ⫹+ is a semigroup. However, *⺞, ⫹+ is no monoid, since it contains no identity. Yet we
24 may add 0 as an identity to ⺞ and thus obtain ⺞0 ⫽ {0, 1, 2, …}. Then *⺞0, ⫹+ is a monoid with identity 0, since we still have (n1 ⫹ n2) ⫹ n3 ⫽ n1 ⫹ (n2 ⫹ n3) for all n1, n2, n3 苸 ⺞0 and moreover 0 ⫹ n ⫽ n ⫹ 0 ⫽n for any n 苸 ⺞0. A semigroup S(V) or monoid S⬘(V) constructed from a finite vocabulary V is called “the free semigroup over V” or “the free monoid over V”, respectively. How is a structure like a free monoid S'(V) related to a natural language? Let V be thought of as the set of phonemes (or of morphemes or of words) in a given language. Then S⬘(V) would contain, among other strings, all the sentences in the language under discussion. Thus that language can be defined as a subset of S⬘(V). This idea applies to all string codes. A string code is a set of signs that can be characterized as a subset of a free monoid. If one wants to characterize a given string code L syntactically, the task is to set up a finite vocabulary V, to define the free monoid S⬘(V) over it, and to distinguish the strings of L from the rest of S⬘(V). In language, this task corresponds to the language-user’s capacity to distinguish well-formed sentences from strings not belonging to his language. Analogous considerations apply to all other string codes. 4.4. Production grammars A production grammar is a set of rules on the basis of which the strings belonging to a certain subset of a free monoid can be constructed. If the grammar produces all and only the strings of a given string code L, then the grammar is called “observationally adequate for L” (cf. Chomsky 1964: 30 ff and Wasow 1985 for other levels of adequacy). As an example for a string code L we take the standard system of signs used for the representation of natural numbers, the HinduArabic numerals LH. Let VM be the set of the ten Hindu-Arabic digits 0, 1, 2, …, 9. Evidently LH is infinitely large; however, it is only a subset of S⬘(VM) since while it includes 10, 100, 1000, …, 20, 200, 2000, …, etc. it does not include 0, 00, 000, …, 01, 001, 0001, …, 02, 002, 0002, …, etc. To be observationally adequate for LH, a grammar must construct the infinitely large set of Hindu-Arabic numerals on the basis of VM and exclude strings like the ones mentioned. This is accomplished through a set of stipulations such as the following: (i) 1, 2, …, 9 belong to LH.
I. Systematik
(ii) If a belongs to LH, then a0, a1, …, a9 belong to LH. (iii) Elements of LH can be constructed in no other way than by employing (i) and (ii). The stipulations (i) through (iii) are said to be the rules RH of a grammar G0H for the string code LH. In RH, (iii) amounts to saying that LH is the smallest string code over VM which can be formed so as to satisfy rules (i) and (ii). Using (i) and (ii) one can construct all and only the strings that belong to LH, i. e., that are Hindu-Arabic numerals. Rules can be given in various forms. An alternative formulation for (i) through (iii) would be to introduce Z as a starting symbol and stipulate:
冦冧
1 2 (i⬘) Z → , ⯗ 9
冦冧
0 1 (ii⬘) Z → Z . ⯗ 9
In applying these rules one would first write down the starting symbol Z and then replace it either by any one digit except 0, according to (i⬘), or by Z followed by any one digit, according to (ii⬘). Rules such as (i⬘) and (ii⬘) are called “rewrite rules” or “production rules”. In order to construct the complex sign representing the number of the year 1983, the rules (i⬘) and (ii⬘) would have to be applied in the following way: (1⬘) Z (2⬘) Z3 (3⬘) Z83 (4⬘) Z983 (5⬘) 1983
by rewriting Z in (1⬘) according to (ii⬘) by rewriting Z in (2⬘) according to (ii⬘) by rewriting Z in (3⬘) according to (ii⬘) by rewriting Z in (4⬘) according to (i⬘)
as Z3 as Z8 as Z9 as 1
The ordered set of formulas (1⬘) through (5⬘) is called “a derivation of 1983”. Strings like 1983 that do not allow the further application of a rule are called “terminal strings”. A further alternative in the formulation of rewrite rules for the Hindu-Arabic numerals is obtained when we introduce M and N as special names for the classes of signs occurring in braces in (i⬘) and (ii⬘): (i⬙) Z→N, N→1, N→2, …, N→9, (ii⬙) Z→NM, M→0, M→1, …, M→9. Here M and N are called “non-terminal symbols” since in derivations made on the basis
25
2. Syntactics
of (i⬙) and (ii⬙) they occur only in non-terminal strings. Thus a grammar consisting of rules (i⬙) and (ii⬙) contains not only a terminal vocabulary VT ⫽ VH, but also a non-terminal vocabulary VNT with Z, M, and N as its members. In order to make precise the terms we have used in describing this example, we introduce the following definitions: A production grammar is a 4-tuple G ⫽ *VNT, VT, S, R+ where VNT and VT are two disjoint non-void finite sets, the non-terminal and terminal vocabularies of G; S is an arbitrary fixed symbol out of VNT, the so-called “axiom” or “starting symbol of G”; and R is a finite set of rules of the form a→b (“rewrite a as b”) such that a and b are elements of S⬘(VNT ∪ VT) and a contains at least one element from VNT. Now if there is a string g ⫽ g1ag2 from S⬘(VNT ∪ VT), then, given the rewrite rule a→b, the string g⬘ ⫽ g1bg2 is said to be “directly derivable from g”. The relation of direct derivability in grammar G is commonly designated by the double arrow ⇒G; thus we have g⇒Gg⬘. (The subscript G is omitted if it is clear from the context which is the grammar at issue.) Direct derivability has derivability ⇒* as its ancestral. This means that d⬘ is derivable from d if and only if there is a sequence e0, e1, …, em (m ⱖ 0) such that (1) e0 ⫽ d, (2) em ⫽ d⬘, and (3) for each k (0 ⱕ k ⱕ m⫺1) ek⇒ek⫹1. In our sample grammar with the rewrite rules (i⬙) and (ii⬙) for instance, it holds true that, e. g., ZM3 ⇒ NMM3 and NMM3 ⇒ NM83 and NM83 ⇒ N983 and N983 ⇒ 1983; thus we have ZM3 ⇒* 1983. (Note that, under the definition given, S⇒*S holds in every grammar.) The string code L(G) generated by G is the set of all strings over the vocabulary VT which is derivable from the axiom S; i. e., L(G) ⫽ {a | a苸S⬘(VT) and S⇒*a}. String codes are also sometimes called “languages”, even if their vocabulary does not consist of phonemes, morphemes, or words. Let us also introduce rewrite rules a→b of a special form here. If a is a single non-terminal symbol and b a terminal one, then a→b is called “a lexical rule” or “lexical entry for b” because it provides a classification of a word b (e. g., house) as belonging to a syntactic category a (e. g., a noun) and such information is typically given in dictionaries. In what follows, lexical rules are sometimes formulated by means of the inverted arrow (as
in a←b, which stands for, e. g., 9←N). A rule such as house←Noun amounts to the statement “house is a Noun”, which is a paraphrase of “the category Noun includes the item house”. Let us call the grammar with rules (i) through (iii) “G0H”, the production grammar with rules (i⬘) and (ii⬘) “G1H”, and the production grammar with rules (i⬙) and (ii⬙) “G2H”. It is easily seen that GH, G1H, and G2H have the same output, i. e., produce the same set of terminal strings, i. e., LH. In general we say that two production grammars G1 and G2 are equivalent if they have the same output (for other levels of equivalence cf. Chomsky 1963). There are three main classes of production grammars which are interesting syntactically. These are, in increasing amount of generality, regular grammars, context-free grammars, and context-sensitive grammars. 4.5. Regular grammars For obvious reasons it is necessary to distinguish two kinds of regular grammars, left regular grammars and right regular grammars. But it can easily be shown that for any given right regular grammar there exists a left regular grammar with the same output. A production grammar *VNT, VT, S, R+ is right (left) regular if its rules take one of the following forms: A→aB, C→c (A→Ba, C→c) where A, B, C belong to VNT and a, c to VT. Thus the grammar G1H is a left regular grammar, while the following is right regular: G0D ⫽ *{Z, P, Q}, {0, 1, 2, …, 9, .}, Z, R0D+ where R0D contains the rules:
冦冧
1 2 (P), (ii*) P → (i*) Z → ⯗ 9 (iii*) Z → .Q,
冦冧
0 1 (P), ⯗ 9
(iv*) P → .Q,
冦冧
0 1 (Q), (vi*) Q → (v*) Q → ⯗ 9 and (i*) is short for the two rules
冦冧
1 2 , ⯗ 9
26
I. Systematik
冦冧
1 2 S→ and S → ⯗ 9
冦冧
1 2 P. ⯗ 9
The same applies to (ii*) and (v*). The complex signs produced by G0D can be interpreted as representing the rational numbers with terminating decimal expressions. If a grammar G is right regular or left regular, then its output L(G) is called “a right regular” or “left regular string code”. Similarly, if a string code is generated by a grammar of any type (context-free, context-sensitive, etc.) it is referred to as a string code of that type (context-free string code, contextsensitive string code, etc.). 4.6. Context-free grammars Context-free grammars are a less restrictive kind of production grammar. A production grammar *VNT, VT, S, R+ is context-free if each of its rules takes the form A→a where A belongs to VNT and a to S(VNT∪VT). A context-free grammar is exemplified by G2H. However, LH, the output of G2H, can also be produced by G1H, and since G1H is regular, LH is not only contextfree but regular as well. An example of a string code that is context-free but not regular is the set L0 of English sentences connected by the logical connectives … and ---, … or---, it is false that …, and if … then---. If a and b are sentences of English, then a and b, a or b, it is false that a, and if a, then b are also sentences of English. These considerations can be embodied in a context-free grammar G0P as follows: Let the non-terminal vocabulary be composed of the symbols S, E, N, I, T and let the terminal vocabulary be composed of and, or, it, is, false, that, if, then, and s (where s would have to be expanded into an English sentence in a larger grammar containing the present fragment). Let the rules be (i∞) S→SES, (ii∞) S→ISTS, (iii∞) S→NS, (iv∞) S→s, (v∞) E→and, (vi∞) E→or, (vii∞) N→it is false that, (viii∞) I→if, (ix∞) T→then.
G0P will produce strings like if s then s, which become normal English sentences when every occurrence of s is replaced by an English sentence. However, G0P will not produce such strings for all English sentences containing the logical connectives specified. Strings such as sss and s, which have the syntactic structure of listing expressions like (1 a) Ann played the piano, Peter beat the drums, Mary plucked the bass, and Paul blew the horn. do not belong to the output of G0P. Another problem is the fact that, when interpreted in the usual way, some of the strings produced by G0P will be ambiguous (cf. the music example of Fig. 2.2 in § 3. above). For example, it will be left open whether s and s or s should be read as (s and s) or s or as s and (s or s). Depending on what sentences are substituted for s, these two readings can have rather different consequences. The two readings are mirrored in two different derivational histories for s and s or s: (1.1) (1.2) (1.3) (1.4) (1.5) (1.6) (1.7) (1.8) (2.1) (2.2) (2.3) (2.4) (2.5) (2.6) (2.7) (2.8)
s s s s
SE sE and and and and
S S S S s s s
S E E E E E or or
S S S S S S s
by by by by by by by
(i∞) (i∞) (iv∞) (v∞) (iv⬚) (v∞) (iv⬚)
s s s s
S SE SE sE and and and and
S S S S s s s
E E E E or or
S S S S S s
by by by by by by by
(i∞) (i∞) (iv∞) (v∞) (iv⬚) (v∞) (iv⬚)
The two derivations (1.1) through (1.8) and (2.1) through (2.8) use the same rules, but apply them differently: In S E S of (1.2) the first occurrence of S is rewritten as S E S according to rule (i∞). In S E S of (2.2) the second occurrence of S is rewritten as S E S according to rule (i∞). However, this difference cannot be reflected by the formal properties of the derivations as defined so far. Logicians solve the problem of ambiguity by introducing brackets into the terminal vocabulary and restating the first three rules above as follows: S→[SES], S→[ISTS], S→[NS]. The resulting grammar G1P will al-
2. Syntactics
low the following derivations: S, [SES], [[SES]ES], etc. and S, [SES], [SE[SES]], etc. The brackets can be dispensed with if we employ what is often called “Polish notation” (cf. Bar-Hillel 1964). A grammar avoiding ambiguity by using the Polish notation (for all sentence connectives except if⫺then) can be obtained if we restate the rules of G0P as follows: S→KSS, S→ESS, S→ISTS, S→NS, S→s, K→and, E→or, N→it is false that, I→if, T→then. The resulting Grammar G2P will allow the following derivations: S, ESS, EKSSS, etc. and S, KSS, KSESS, etc. Here the terminal strings are or and sss, and s or ss, respectively. As is seen from the form of the rules, each of the grammars G0P, G1P, and G2P is contextfree but not regular. Strings like the ones produced by G1P and G2P fulfil the requirements of logic since they have only one syntactic structure each, but they do not correspond to sentences of ordinary English since they either contain additional elements or are ordered in a different way. Strings like the ones produced by G0P do not have these disadvantages, but they are ambiguous. Neither grammar accounts for listing expressions like (1 a). While context-free grammars (as well as regular ones) are capable of generating such expressions, they are not able to generate them in such a way that their structural relatedness with expressions like (1 b) is indicated. (1 b) Ann played the piano, and Peter beat the drums, and Mary plucked the bass, and Paul blew the horn. This could be done through a grammar deriving expressions such as (1 a) from expressions such as (1 b) by dropping unnecessary connectives like the first two tokens of and in (1 b). (For discussion of the question whether a natural language like English can be regarded as a regular or context-free string code, cf. Chomsky and Miller 1963: 297⫺ 300, Bar-Hillel 1964: 94⫺98 and 114 f, Postal 1964, Hiz˙ 1968, Brainerd 1971: 176⫺181 and 186⫺195, and Pullum and Gazdar 1982; see also § 4.10. below). 4.7. Context-sensitive grammars A production grammar *VNT, VT, S, R+ is context-sensitive if its rules take the form a1Aa2→a1va2 where A belongs to VN, v to S(VNT∪VT), and a1 and a2 to S⬘(VNT∪VT). As an example, consider the grammar G*0, which differs from G0P in that its non-terminal vocabulary contains an additional ele-
27 ment Q and in that the rule (i∞) S→SES is replaced by the three rules S→QEQ, QE→QQE, and Q→S, where QE→QQE is context-sensitive. G*0 easily produces sentences of the form ssEs, sssEs, etc. Context-sensitive rules are sometimes presented in the form A→v/ a1 a2, read “rewrite A as v in the context a1 a2”. On certain occasions this is preferable to the form a1Aa2→a1va2 because the ai’s may also contain A’s, which renders the actual context that the writer had in mind unclear. For example, the rule QE→QQE can be read as a1 ⫽ Q and a2 ⫽ L or as a1 ⫽ L and a2 ⫽ E. If we employ the above convention, the former intent is rendered E→QE / Q and the latter Q→QQ / E. In case either ai is empty, the corresponding side of the bar is left empty. (For further details, including alternative terminology, more explicit definitions, and proofs, cf. Chomsky 1963, Gross and Lentin 1967, Brainerd 1971, Wall 1972, and Corcoran, Frank, and Maloney 1974; cf. also § 5. below). In special fields such as computer programming, string production grammars are used that hold an intermediate position between context-free and context-sensitive grammars. Such grammars are usually obtained on the basis of context-free rules by imposing special restrictions on the process of derivation. The most well-known are matrix grammars, controlled grammars, ordered grammars, scattered grammars, programmed grammars, and valence grammars (for discussion cf. Salomaa 1973). While all these grammars can be regarded as special types of context-sensitive grammars, there are also string production grammars that do not fit in the hierarchy of grammars discussed above. The most important are configurational grammars (cf. Gladkij 1963 and 1968), Lindenmayer systems (cf. Lindenmayer and Rozenberg 1976 and 1979, Herman and Rozenberg 1975, and Rozenberg and Salomaa 1974), and contextual grammars (cf. Paˇun 1982). Lindenmayer systems and contextual grammars are both characterized by the fact that they do not have a non-terminal vocabulary. Moreover, Lindenmayer systems require that every element of a given string be processed in each step of a derivation. Grammars with such properties have been successfully used in the description of cell structures and their development (cf. Claus, Ehrig, and Rozenberg 1979).
28 4.8. Grammars and automata As pointed out in § 4.1. above, sets of complex signs can be specified in two complementary ways: through synthesis of elementary signs and through analysis of complex signs. Synthesis is an activity characteristic of a sign producer constructing a complex sign, whereas analysis is characteristic of a sign recipient decoding a given sign. While synthesis is simulated by the functioning of a production grammar which generates complex strings through a step-by-step rewriting of the starting symbol, analysis can be simulated by an automaton in the sense of the mathematical theory of automata (cf. Art. 78 § 5.3.). In addition to providing a given complex string with a syntactic analysis (which is called “parsing”; see § 4.1. above and cf. Aho and Ullman 1972: I, ch. 4⫺6), an automaton must distinguish well-formed strings from illformed ones (see § 4.3. above). Automata capable of solving this problem are known as “recognizers” (cf. Aho and Ullman 1972: I, 93) or “acceptors” (cf. Ginsburg 1966: 46). If a string a over a vocabulary V occurs on a tape and is fed into an automaton A, it will start a computation which results in a classification of a either as well- or as ill-formed. The string a is said to be “accepted by A” if it is classified as well-formed. A very simple kind of automata are the “finite-state automata” (cf. Rabin and Scott 1959, Ginsburg 1966: 47, Maurer 1969: 86, Aho and Ullman 1972: I, 116 f). A finite-state automaton A consists of five components: (1) a finite, non-empty set A of states, (2) a finite vocabulary V, (3) a transition function M (from A ⫻ V to A), (4) an initial state s, (5) a set F of distinguished final states (F 債 A). Thus we have A ⫽ *A, V, M, s, F+. Now assume that A is in state z1 (from A) and that it is provided with a string a (from S(V)) whose initial symbol is w1 (from V). A scans w1 and turns into that state z2 which the transition function M assigns to the pair *z1, w1+, i. e., z2 ⫽ M(z1, w1). After that, A scans the second symbol w2 of the string a and turns into the state z3 ⫽ M (z2, w2). This procedure is repeated until the final symbol wm of the string a ⫽ w1w2 … wm and the state zm⫹1 ⫽ M(zm, wm) is reached. A pair consisting of a state and a string is called “a configuration”; each configuration is a member of A ⫻ S(V). We see that each configuration during a computation is uniquely determined through the preceding state. This is the reason why finitestate automata of this kind are called “deter-
I. Systematik
ministic”. (An intuitive idea of the functioning of abstract machines such as finite-state automata may be gathered from the drawing of Fig. 2.4 below, which represents a Turing machine.) Note that the above description of the computations which A is able to carry out extends the transition function M from its domain A ⫻ V to a more inclusive function M*, the domain of which is the set A ⫻ S(V) of all configurations. (A ⫻ V is the set of only those special configurations in which the tape consists of a single symbol.) A transition of the automaton A from one configuration to the (uniquely determined) next one is called “a move”. Thus M* describes the possible moves of A by assigning to each configuration its unique successor. More precisely, the extended transition function M* may be defined inductively through the following two clauses: (1) M*(z, a) ⫽ M(z, a), where a is a symbol (i. e., a one-letter string) from V, and (2) M*(z, ab) ⫽ M*(M(z, a), b) where ab is a string from S(V) with the initial symbol a. (Note the structural similarity between the definition of the relation ⇒* in terms of ⇒ and the definition of the function M* in terms of M.) A string a from S(V) is said “to be accepted by A” if and only if in computing the string a, A proceeds from the initial state s and reaches a last state M*(s, a) which belongs to the distinguished set F of final states. More formally, the set L(A) of accepted strings is given by the equation L(A) ⫽ {a 苸 S(V) | M*(s, a) 苸 F}. Thus the initial state s of the automaton plays a role which is analogous to that of the starting symbol S of a grammar. Correspondingly, L(A) is called “the string code accepted by L(A)”. As an example for the concepts introduced above, let us consider the automaton AH ⫽ *AH, VH, MH, sH, FH+ for the recognition of the Hindu-Arabic numerals. AH has only one further state s* in addition to its initial state sH : AH ⫽ {sH, s*}. Only sH is a final state; thus FH ⫽ {sH}. VH is the vocabulary of digits known as “VM” from § 4.4., i. e.: VH ⫽ {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}. The transition function MH is specified by Tab. 2.1. Tab. 2.1: Transition table for the automaton AH 0 sH s*
1
2
3
4
5
6
7
8
9
s* sH sH sH sH sH sH sH sH sH s* s* s* s* s* s* s* s* s* s*
2. Syntactics
Now assume AH, being in its initial state sH, is fed with the string 1983 (cf. the treatment of this string by the grammar G1H in § 4.4.). Then AH starts a computation which may be described by the following equations: MH*(sH, 1983) ⫽ MH*(MH(sH, 1),983) ⫽ MH*(MH(MH(sH,1),9),83) ⫽ MH*(MH(MH(MH(sH,1), 9),8),3) ⫽ MH(MH(MH(MH(sH,1), 9),8),3) Using the transition table we obtain: MH*(sH,1983) ⫽ MH(MH(MH(sH,9),8),3) ⫽ MH(MH(sH,8),3) ⫽ MH(sH,3) ⫽ sH Since sH is a final state (indeed the only one), the string 1983 is accepted (classified as wellformed) by AH. Furthermore, inspection of the transition table yields the result that there is only one possible way of reaching the nonfinal state s* from sH, namely by starting with a configuration *sH, 0a+. Thus the strings 0a are the only ones which are rejected (i. e.: not accepted) by AH. The string code L(AH) is identical with the string code L(G1H) generated by the grammar G1H) of § 4.3. Now the grammar G1H is of the most restricted type: it is a regular grammar. And since L(AH) ⫽ L(G1H), the string code accepted by the automaton AH is a regular string code. This is no accident: every string code accepted by a finite-state automaton is a regular one; and conversely, every regular string code is also accepted by some such device. Regular grammars and finite-state automata are equivalent in the following sense: the string codes generated by regular grammars are exactly those which are accepted by finite-state automata (Ginsburg 1966: 52, Maurer 1969: § 2.2., Aho and Ullman 1972: I, 118⫺121). This raises the question as to whether there are other kinds of recognizers corresponding to the other kinds of production grammars. This is indeed so: contextfree grammars are matched by “pushdown automata” (see also Art. 78 § 5.3.). While finite-state automata cannot keep track of auxiliary computations performed in testing a string for well-formedness, pushdown automata have a memory available for this purpose. The formal definition of a pushdown automaton resembles that of a finite-state automaton, but differs from it in providing an
29 additional vocabulary with a designated starting symbol. This vocabulary is used to store information. Accordingly, a configuration of a pushdown automaton P is a triple consisting of the current state of the automaton, the tape under investigation and the content of its memory. Of course, the transition function of a pushdown automaton has to take care of this additional structure. We shall not go into the exact details of the formal definition here (cf. Aho and Ullman 1972: I, 167⫺176) but simply state the result that a string code is context-free only when it is accepted by a pushdown automaton. In this sense, pushdown automata and contextfree grammars are equivalent (cf. Ginsburg 1966: 69, Aho and Ullman 1972: I, 184). The next correspondence requires the notion of a Turing machine (cf. Hermes 1961 ⫽ 1971: ch. 2 and Rogers 1967: 13⫺16 as well as Art. 78, § 5.3.). A Turing machine T is an automaton which is capable of scanning a tape which extends infinitely in both directions. This tape is divided into an infinite number of cells of which, however, only a finite number contain a single letter from a vocabulary V. In each move during a computation, T is supposed to operate on the content of just one single cell; this is the cell being examined by T (in that move). T can carry out just one of four operations in each move: (1) It can print a symbol from V on the cell it is examining. (2) It can go one cell to the right. (3) It can go one cell to the left. (4) It can stop its computation. After each move, T is in a certain state belonging to one of a fixed set of states T. Again we have an initial state, final states, configurations and a transition function (cf. Fig. 2.4; for exact definitions see the literature quoted above). Now, a string code L is accepted by a Turing machine if and only if L is generated by a production grammar (be it restricted or not; cf. Maurer 1969: 153, 158 and 164).
Fig. 2.4: A Turing machine (after Meschkowski 1967: 599). Naturally, only a finite part of the infinite tape can be represented.
30 A Turing machine has available in its computation the unlimited space of an infinitely long tape. This is a rather strong idealization in as much as a real machine never has more than a finite space at its disposal. We can, however, modify this idealization by requiring that the machine stay within the range of the (possibly disconnected) inscription which is written on its tape. The most restrictive requirement is that the automaton may scan only cells within the region between the leftmost cell which is filled with an input sign and the rightmost cell which is thus filled; such a machine is called “a linear bounded automaton” (cf. Maurer 1969: 135 f, Aho and Ullman 1972: I, 100). Linear bounded automata correspond to context-sensitive grammars; i. e., a string code is context-sensitive if and only if it is accepted by a linear bounded automaton (cf. Maurer 1969: 142). The four correspondences described above ⫺ namely those between production grammars and Turing machines, between contextsensitive grammars and linear bounded automata, between context-free grammars and pushdown automata, and between regular grammars and finite-state automata ⫺ are the core of what is known as “mathematical linguistics” (or “formal language theory”). This is a subdiscipline of mathematics which originated with the early work of Chomsky (1959 a, 1963) and the report on the programming language ALGOL edited by Naur in 1963. Obviously, it is very useful to know whether a string code has a grammar of one of the specified types since this indicates its computational complexity. We then know what structure a mechanical device must have if it is to accept the strings of this code as well-formed and to reject all other strings (over the same vocabulary) as ill-formed. Furthermore the stated correspondences (as well as others of a similar kind) may indicate the psychological capacity required of the sign users. If they manage to communicate by means of a string code of type X (e. g., a context-free one), their capacity must be at least as strong as that of an automaton of the corresponding type X⬘ (viz., a pushdown automaton). The relationship between mathematical linguistics and psycholinguistics is elaborated by Levelt (1974) and Berwick and Weinberg (1984). Of course, the capability of distinguishing the well-formed strings from the ill-formed ones is not enough in order to know a code.
I. Systematik
Someone who commands a code should also have (at least implicit) knowledge of the syntactic structures of its well-formed strings. An automaton should, therefore, not only classify a string as well- or ill-formed; in doing so it should also provide us with a reasonable parsing of the string tested. It is interesting to note that this is exactly what is achieved in the proofs of equivalence between grammars of certain types and the corresponding automata. (As it is often the case in mathematics, only the proofs supply the theorems with their full information content.) For instance, in showing that a context-free code L is also a pushdown code one uses a contextfree grammar G to generate L and constructs on the basis of G a pushdown automaton A which accepts L. Thus in computing whether a given string belongs to L or not, A parses this string in accordance with G. 4.9. Syntactic structures and structural descriptions The procedure by which a production grammar specifies the syntactic structure of a string is based on that string’s derivation. As has been pointed out in § 4.5. and 4.6., the derivational history of a string can be used to disambiguate it. In § 4.6., brackets were introduced to keep track of each step of the derivation. By labeling the brackets with the appropriate elements of the non-terminal vocabulary, each string in the output of the grammar can be given a description of its syntactic structure which is complete with respect to this grammar. (For discussion of this point cf. Reichenbach 1947: 164⫺167, Hermes 1961, Wang 1968, Schnelle 1970, and Posner 1971.) Let us consider once again our example of a syntactically ambiguous string: (2) s and s or s. Instead of introducing brackets by including them in the rewrite rules as in G10, we can construct labeled bracketings in the course of derivations by using the following bracketing convention: If a rule A→a is applied to a string b ⫽ x1Ax2, write the result as x1[a]Ax2, where [a]A is a bracketing of a labeled by A. (For other versions of the bracketing convention cf. Montague 1970 b, Brainerd 1971: 212 ff, and Hermanns 1977: 160 ff). In order to obtain the two structural descriptions indicated for (2), we proceed as follows:
31
2. Syntactics
(1.1⬘) (1.2⬘) (1.3⬘) (1.4⬘) (1.5⬘) (1.6⬘) (1.7⬘) (1.8⬘)
S [S E S ]S [[S E S ] S E S ]S S ]S E S ] S [[[s]S E [[[s]S [and]E S ]S E S ]S [[[s]S [and]E [s]S ]S E S ]S [[[s]S [and]E [s]S ]S [or]E S ]S [[[s]S [and]E [s]S ]S [or]E [ s]S ]S
by by by by by by by
(i∞) (i∞) (iv∞) (v∞) (iv∞) (v∞) (iv∞)
(2.1⬘) (2.2⬘) (2.3⬘) (2.4⬘) (2.5⬘) (2.6⬘) (2.7⬘) (2.8⬘)
S [S E S]S [S E [S E S ]S ]S [S E S ]S ]S [[s]S E [[s]S[and]E [S E S ]S ]S [[s]S[and]E [[s]S E S ]S ]S [[s]S[and]E [[s]S [or]E S ]S ]S [[s]S[and]E [[s]S [or]E [ s]S ]S ]S
by by by by by by by
(i∞) (i∞) (iv∞) (v∞) (iv∞) (v∞) (iv∞)
Each line in the above derivations contains a string within labeled bracketing indicating the syntactic structure of this string. The difference in structure between (1.8⬘) and (2.8⬘) is due to the structural difference between (1.3⬘) and (2.3⬘), which is caused by the application of rule (i∞) to different element tokens in the string [SES]S in (1.2⬘) and (2.2⬘), respectively. While the unstructured strings (1.8) and (2.8) are identical, the structured strings (1.8⬘) and 2.8⬘) are different: (1.8⬘) contains s and s as a constituent, (2.8⬘) does not. (2.8⬘) contains s or s as a constituent, (1.8⬘) does not. We are now in a position to give more exact definitions for some of the terms used in describing the ambiguous string (3) and its structure. If for a given context-free grammar G we apply the bracketing convention, then any of the bracketings assigned to a terminal string a 苸 L(G) is a description of the syntactic structure (or in short, a structural description) of a in G. Each partial string of a included within a labeled pair of brackets is a constituent of a. The non-terminal symbol occurring as a label of the brackets indicates the syntactic class or category which this partial string belongs to. These definitions explicate the central terms used in the characterization of syntactics3 given by Morris (1938: 14 ⫽ 1971: 28 f and 1946: 354 f ⫽ 1971: 367). Even for a simple string like (2), the bracketings assigned by the grammar are quite complex, leading to a certain room for error due to inaccurate transcription. This is why some syntacticians prefer to think of structural descriptions in terms of parsing trees (also called “derivation trees”, “phrase structure trees”, or “P-markers”) rather than in terms of labeled bracketings. As the two
Fig. 2.5
Fig. 2.6
methods are interchangeable, it makes sense to define the notion of a parsing tree as well at this point. Let G ⫽ *VNT, VT, S, R+ be a context-free grammar. Then each derivation S, a1, a2, …, an has associated with it a unique parsing tree which is constructed as follows: S is the root. If a1 ⫽ a1a2 … an where ai苸VNT∪VT for i ⫽ 1, 2, …, n, then the parsing tree has nodes 11, 12, …, 1n labeled respectively a1, a2, …, an, which are connected to the root by lines as in Fig. 2.5. If a2 is obtained from a1 by application of a rule ai→b1b2 … bk where ai苸VNT and bj苸VNT∪VT for 1 ⱕ j ⱕ k, then the nodes 1i1, 1i2, …, 1ik are connected to the node labeled ai by lines and are labeled b1, b2, …, bk respectively as in Fig. 2.6. If this process is continued until the terminal string is reached, we ultimately obtain a unique labeled tree corresponding to the derivation in question. This tree is the parsing tree which G assigns to the terminal string of that derivation. Fig. 2.7 and Fig. 2.8 give the structural descriptions of (2) in the form of parsing trees corresponding to derivations (1.1⬘) through (1.8⬘) and (2.1⬘) through (2.8⬘), respectively:
Fig. 2.7
32
I. Systematik
S.
.
.S .E .
.
.
.
.
.
S
.
.
s and s
E
or
S
S
s
Fig. 2.8
Trees such as those of Fig. 2.7 and 2.8 are special kinds of graphs and are investigated in graph theory. (For some basic concepts from graph theory cf. § 5.2. below.) However, most of the graph-theoretical concepts used in syntactics have such an intuitively clear geometric character that they may be introduced without recourse to this subdiscipline of mathematics. A single line which connects two nodes of a tree is called “an arc” or “an edge”; thus every arc links exactly two nodes. The arcs of a tree are given an orientation by the top-bottom direction of the drawing. The higher node of an arc is said to “directly dominate” the lower one; alternatively, the lower one is said to be “a daughter” of the higher one, which is called its “mother”. Thus the mother node always directly dominates the daughter node. Daughter nodes of the same mother node are called “sister nodes”. A node k is said to dominate another node k⬘ if and only if there is a sequence k0, k1, …, km (m ⱖ 1) such that for each l (0 ⱕ l ⬍ m) kl directly dominates kl⫹1. The single node which is not dominated by another node but dominates all others is the root (see above). Nodes which do not dominate any other nodes are called “leaves”. Note that a tree has no isolated nodes; each node either dominates or is dominated by another one. Furthermore, each node is dominated by at most one single node (its mother node) and the root is the only node without a mother. In a labeled tree, the concatenation of the labels of the leaves (in their left-toright order) is called the “yield” of the tree. Thus the yield of the derivation tree for a string a is just that string a. For approaches to the construction of parsing trees that do not rely on the derivational history of the strings parsed, cf. § 5.3. 4.10. Transformational grammars As was shown in § 4.8., it is very useful to know what type of grammar is sufficient to generate a given code. However, this infor-
mation is often hard to obtain, especially when the code was not introduced through explicit stipulations but is empirically given through the semiosic behavior of its users. This is typically the case for natural languages and their grammatical status is therefore controversial (cf. § 4.6. above). Most linguists will nowadays agree that natural languages are too complex to be classified as regular and treated by finite-state automata. This conviction can certainly be traced back to Chomsky’s (1959 b) famous criticism of behaviorism. Finite-state automata simulate the stimulus-response-behavior learned through trial-and-error, which is the only way of learning recognized by radical behaviorists (cf. Suppes 1969). If one can show (as Chomsky is supposed to have done) that natural languages can never be acquired by way of trial-and-error alone, one has thus demonstrated that they are not within the reach of finite-state automata, and this means that they are not regular (cf. Wexler and Cullicover 1980 for a classical exposition of the formal problems of language learning seen from the perspective of Generative Grammar). Admittedly, this is a rather indirect way of arguing against the case of regular grammars for natural languages. A more direct approach which would settle the problem without any recourse to the theory of language learning would be to look for natural language constructions that can be demonstrated not to be regular. For instance, the nonregular character of the language Lsym is known, where Lsym ⫽ {anbn}, i. e., Lsym comprises exactly those strings over the two-item vocabulary V ⫽ {a, b} which consist of a number of occurrences of the character a followed by an equal number of occurences of b. In order to demonstrate the inadequacy of regular grammars, one could try to find a set of constructions in a natural language which resemble Lsym. Sometimes the nested embedding of relative clauses is seen in this way; cf. the example in Fig. 2.9 and the discussion by, e. g., Kratzer, Pause and von Stechow (1973: 138⫺139). An analogous argument, concerning context-free languages, involves English sentences using several occurrences of the word respectively (cf. Postal 1964 and Kratzer, Pause and von Stechow 1973: 142). Based on his reasoning against linguistic behaviorism and on examples such as that of Fig. 2.9, Chomsky considered it necessary to supplement string production rules by what
33
2. Syntactics
Fig. 2.9
he called “transformation rules”. Transformations had already been postulated by Chomsky’s teacher Harris, who motivated them with the needs of discourse analysis (cf. Harris 1952 as well as 1970 and 1981). But whereas Harrisian transformations are mappings from strings to strings, Chomskyan transformations are of a more abstract character (cf. Joshi 1973 for a technical comparison of the two transformationalist approaches). Chomsky proposed to divide the derivation of a well-formed string a of a given language L into several stages: first a structural description of a is produced which encodes the most basic syntactic information about a; this structural description specifies the so-called “deep-structure”, which is the basis for the derivation of both a semantic and a phonological representation of a. Beginning with the late 1950s, Chomsky published studies of a series of grammar formats which followed this idea and were labeled either with the publication dates or with key words of the book titles or with special acronyms. Thus the grammar format described in Chomsky’s 1957 publication as well as in his 1975 book (which had been circulated in various mimeographed versions since 1955) is referred to as “the 1957 Model”; the model presented in 1965 is called “the Aspects theory” or “the Standard Theory (ST)”; it was followed by “the Extended Standard Theory (EST)” and by “the Revised Extended Standard Theory (REST)”. The version of Transformational Grammar that originated in Chomsky’s 1981 publication is called “Government and Binding Theory (GB)”; it has been reworked in further publications such as Chomsky 1986 a and 1986 b. Introductions to GB are provided, e. g., by Radford (1981 and 1988) and Riemsdijk and Williams (1986); some issues of GB are also discussed in § 5. below. Here we shall not deal with this recent development of Transforma-
tional Grammar but give a brief survey of the Standard Theory (and some of its amendments). This is done because of the historical importance of this theory, which dominated linguistic research for more than a decade. Introductions to the Standard Theory and its extensions are provided, e. g., by Akmajian and Heny (1975) and Baker (1978). As already mentioned, the Aspects Theory calls the structure underlying a string its “deep structure”. Deep structures are postulated for a wealth of reasons, which cannot all be reported here. But one of the best arguments for their acceptance is that an adequate grammar should explain the systematic co-occurrence of active and passive sentences (cf. example 3) or of sentences with a prepositional object and corresponding ones with an indirect object construction; (cf. example 4). (3 a) (3 b) (4 a) (4 b)
John kissed Mary. Mary was kissed by John. I gave the money to my friend. I gave my friend the money.
In Transformational Grammar pairs of strings such as (3 a, b) and (4 a, b) are said to have the same deep structure but differ in what is called their “surface structure”. Now deep structures are specified by means of the derivation trees of a context-free grammar (cf. § 4.4.⫺4.6.), and the transformation rules have the task of mapping deep structures to surface structures in several steps. Formally, transformation rules are functions which map labeled trees to labeled trees again. Allowing only for unary functions of this kind (i. e., functions with only one argument) the Aspects Theory of 1965 differs from the account given by Chomsky in 1957. Of course, not every unary function which takes labeled trees as its arguments and yields labeled trees as its values is recognized as a genuine transformation. However, before explaining the details of a transformation rule,
34
I. Systematik
let us take a look at the overall structure of a transformational grammar T for a language L. As already mentioned above, the items to which a transformation rule may be applied are specified by means of the derivation trees of a context-free syntax B ⫽ *VBNT, VBT, S, R+. The letter “B” stands for “Base”, but the syntax B is only one constituent of the socalled “base component” of a transformational grammar T, the others being a set of subcategorization rules and a lexicon (see below). The derivation trees of B are called “pre-terminal structures”. The elements of the vocabulary VBT are not yet the symbols of the strings of the language L to be analyzed but are strings of symbols for grammatical categories of L. Thus the yields of the pre-terminal structures, i. e., the pre-terminal strings, are not strings of L. In the case of a natural language the pre-terminal strings are strings of grammatical symbols like N(oun), N(oun) P(hrase), V(erb), V(erb) P(hrase), A(djective), A(djectival) P(hrase), P(reposition), P(repositional) P(hrase), Art(icle) etc. Within Transformational Grammar, the syntactical atoms which make up the strings of our language L are called “formatives”. The formatives have to be inserted into the preterminal structures generated by B by means of lexical rules (cf. § 4.4.) in a very complicated process which is called “lexical insertion”. For illustration, let us consider the simple tree in Fig. 2.10 as an example of a pre-terminal structure:
verb under V in this context. This would result in an ill-formed sentence such as *John behaved Mary. The verb form kissed is said to be “subcategorized” for a Noun Phrase as its direct object, and it is required that each item only appears together with elements for which it is subcategorized. Thus kissed takes a direct object, whereas behaved cannot be accompanied by such an additional phrase. Such restrictions are implemented by means of subcategorization rules. They expand the preterminal symbols into complex structures which provide information about the contexts in which the terminal symbols must appear. For instance, the V in the tree above is rewritten as a complex symbol which consists of the so-called “feature specifications” [V: ⫹] and [trans: ⫹] (cf. § 5.1. for more recent treatments of subcategorization and § 5.2. for treatments of syntactic features). The rewriting in our example is achieved by means of the following subcategorization rule, which has the form of a context-sensitive string production rule:
Fig. 2.10
Fig. 2.11
Having derived such a tree, let us substitute word forms of English for the pre-terminal symbols N and V. (In Transformational Grammar, more abstract units than word forms are used, but for simplicity of exposition we neglect this further complication.) We might use tentative lexical rules like John←NP, Mary←NP and kissed←V and attach the item John as a daughter to the leftmost NP, kissed to the V and Mary to the rightmost N. But obviously, we may (other things being equal) not insert an intransitive
The formatives of language L and their relevant grammatical properties are specified in the lexicon of the grammar T. It will contain lexical entries which allow the rewriting of a complex category symbol through a word form as in:
V→
冋
V: ⫹ trans: ⫹
册
N
Application of this rule to the derivation tree in Fig. 2.10 results in the tree of Fig. 2.11:
kissed ←
冋
behaved ←
V: ⫹ trans: ⫹
冋
册
册
V: ⫹ trans: ⫺
35
2. Syntactics
These lexical entries guarantee that only those word forms are inserted into a pre-terminal structure which are compatible with the feature specifications of the complex symbol. Our lexical entry for behaved, for instance, contradicts the specification [trans: ⫹] under the V-node in the tree of Fig. 2.11; thus the lexical item behaved cannot be inserted under the V-position. But obviously, the item kissed is allowed there. The rewriting of all non-terminal symbols in a pre-terminal structure on the basis of subcategorization and appropriate lexical entries results in a deep structure as in Fig. 2.12.
Fig. 2.12
Deep structures are turned into surface structures by means of transformation rules. There are two sets of such rules: (1) the class Rob of obligatory rules, which must be used where applicable, and (2) the set Rfac of facultative rules, which may or may not be applied where applicable. The class R of the transformation rules of our grammar T then is the union of these two classes: R ⫽ Rob ∪ Rfac. A transformational derivation takes the form of a sequence d0, …, dm where (a) d0 is a deep structure resulting from a derivation tree d of B through subcategorization and lexical insertion and (b) each dl (0 ⬍ l ⬍ m) results from its predecessor dl⫹1 through the application of a rule t from R, and (c) all members of Rob which are applicable at all in the course of the derivation are in fact applied. For an exact definition of the notion of a transformational derivation the reader is referred to Kimball (1967), Ginsburg and Partee (1969), Peters and Ritchie (1973) and Kratzer, Pause and von Stechow (1973: 272⫺ 281). Let us note here that the transformations are often postulated to be ordered in some way, so that the sequence of trans-
formations to be applied in the course of a transformational derivation is not free but restricted by a rule ordering V. There are several possibilities as regards the exact order type of V and the way V achieves the ordering of rule applications. For instance, V may specify some kind of either linear or cyclic order. Furthermore, rule ordering may be achieved through explicit stipulation (extrinsic order) or by defining the transformation rules in such a way that each rule has only one possible successor (intrinsic order). The linguistic implications of these matters are discussed, e. g., by Koutsoudas (1976). The transformation rules and the rule ordering make up the transformational component of the grammar. The complete grammar T then consists of the base component, which comprises the base syntax B as well as subcategorization rules and the lexicon, and the transformational component, which comprises the sets Rob and Rfac of obligatory and facultative transformation rules as well as the rule ordering V. The base component generates deep structures from which the surface structures are derived using transformation rules in accordance with the ordering V. The whole architecture of T may then be depicted as in Fig. 2.13. Since we now have an overall view of the functioning of a transformational grammar, let us turn to the structure of the transformation rules themselves. A transformation rule t consists of two finite sequences: (1) a sequence of “structural descriptions” (SDs) and (2) a sequence of “structural changes” (SCs). The structural descriptions delimit the range of those trees to which the transformation rule in question is applicable. They are usually given in the form of indexed cuts through the labeled trees. Consider, for instance, the tree in Fig. 2.14 with the cut indiX V NP P NP cated by , , , , . 1 2 3 4 5 As the numbering of the category symbols shows, the cut in Fig. 2.14 leads through five nodes of the tree, labeled with the respective category symbols, with X serving as a variX V NP P NP able. Thus “ , , , , ” says 1 2 3 4 5 that the first node of the cut may be labeled with any category symbol whatsoever, the second, however, must be labeled with a V, the third with an NP, etc. The five subtrees which are dominated by the nodes of the cut are
冉
冊
冉
冊
36
I. Systematik
Base Component
Transformational Component Transformation Rules
Base Syntax B Subcategorization Rules
deep structures
Lexicon
- Rob - Rfac Rule Ordering V
surface structures
Fig. 2.13
Fig. 2.14
required to have such yields that their concatenation (in the left-right-order of the nodes) equals the yield of the entire tree. For instance, the leftmost node numbered 1 in the above cut dominates a tree with the yield He; the second node has the yield gave, the third node the yield the money, and the fourth node the yield to, and the last node the yield me. Concatenation of these five yields results in the yield of the entire tree, namely He gave the money to me. (Structural descriptions in the form of cuts resemble the proper analysis
predicates of § 5.3., differing from them only in permitting variables and requiring numerical indices.) In the specification of the structural changes (SCs), the numerical indices of the structural descriptions (SDs) serve to indicate how the input tree must be modified. If the material dominated by the node of the input tree with index m is to be deleted, this is coded as “m → ⵰” within the specification of the structural change (SC). If the material dominated by node m is to be moved from its original position to the position right of the material dominated by node n, this is coded as “m → ⵰” and “n → n ⫹ m”. Such deletions and movements are the most important types of structural changes. (For other types the reader should consult the literature quoted above.) With respect to the SD in Fig. 2.14, we might, for instance, formulate the transformation rule tdm: tdm: SD: SC:
冉
X V NP P NP , , , , 1 2 3 4 5 2→2⫹5 4→⵰ 5→⵰
冊
Application of the transformation rule tdm to the tree in Fig. 2.14 results in a tree which resembles the one in Fig. 2.15, with the exception of having an additional arc on the right-hand side which leads from VP to a node PP that does not dominate any lexical material.
37
2. Syntactics
Fig. 2.15
The operation of omitting such void arcs is known as “tree pruning”; and a tree pruning convention ensures that void arcs will not appear in the surface structure. The transformation described above is known as “Dative Movement”. (An empirically more adequate formulation of Dative Movement for a transformational grammar of English is given in Akmajian and Heny 1980: 183⫺186; cf. also Larson 1988.) As the reader will certainly agree, transformational grammars of the kind set out here provide a rather complex framework for the syntactic description of complex signs. Thus it came as a surprise when Peters and Ritchie (1973) proved that production grammars and transformational grammars are equal in weak generative capacity (cf. also Pause 1976). This means that every language which is generated by a transformational grammar (i e.: whose well-formed strings are the yields of the surface structures of that grammar) can also be generated by a production grammar (and vice versa). However, this result does not render superfluous the transformationalist approach to syntactic description of natural languages. The more complex transformational descriptions might take account of the structural facts more adequately and might provide better explanations, e. g., for the ways natural languages are acquired and for the ways they change (cf. the brief discussion of Peter and Ritchie’s result in Chomsky 1981: 129). Nevertheless, the development of Transformational Grammar in the late 1970s and 1980s was characterized by the search for well-motivated theoretical restrictions of the power of possible transformation rules. The Aspects and the Standard Theories had allowed the structures derived in the base com-
ponent to be considerably modified and even mutilated in the transformational component, but since Emonds (1976) transformationalist linguists tended to keep the deep structures more similar to the surface structures. While the earlier approaches had tried to characterize each kind of surface structure by postulating a specific type of transformation rule, such as the Passive Transformation, Dative Movement, there-Insertion, etc., more recent transformational theory has tended to explain such constructions by means of a limited number of rather general grammatical principles. Chomsky’s Government and Binding Theory (GB) of 1981 assumes only one transformation rule, called “move-a” and providing for constituents to be moved. At the same time, however, the syntactic structures postulated for the sentences of natural languages have become more abstract, with poor surface structures and rather remote Dstructures (the recent equivalents of deep structures). This growing distance of presentday transformational theorizing from the practice of grammatical description (e. g., for the purposes of second language learning and translation) may be the reason why the more recent versions of Transformational Grammar never reached the degree of acceptance enjoyed by the Aspects and the Standard Theories.
5.
Recent developments in formal syntactics
Quite independently of the fate of Transformational Grammar, formal syntactics has made considerable progress since the 1970s, and this applies both to the analytic acumen of its conceptual tools and its range of applications. Some of these developments are covered in the following paragraphs; § 5.1. and § 5.2. are devoted to refinements of the technical apparatus of formal grammars, including X-bar-syntax (§ 5.1.1.), complex feature structures (§ 5.1.2.), subcategorization (§ 5.1.3.), and thematic roles (§ 5.1.4.) as well as graph theory (§ 5.2.1.), markedness theory (§ 5.2.2.), and unification theory (§ 5.2.3.); § 5.3. and § 5.4. deal with generalizations of formal grammars that allow their application in the syntactic analysis of non-string codes. 5.1. X-bar syntax, subcategorization, and thematic roles The examples of production grammars in § 4.3.⫺4.5. are peculiar in employing very restricted non-terminal vocabularies. Thus, the
38 non-terminal vocabulary of the grammar G2H, which generates the Hindu-Arabic numerals, includes only the three members Z, M and N. Furthermore, each syntactic category referred to by an item of a non-terminal vocabulary is treated as an atom without any internal structure; potential relationships between categories are left unconsidered. As an example, take the category N of G2H, which is a proper subcategory of M: Each terminal symbol belonging to N is also an element of M whereas M includes the terminal 0 which is not an element of N. The two categories M and N in turn are (proper) subcategories of the starting category Z. Also, N, M and Z are all categories of numerals, but while Z is the universal category of all numerals, N and M are categories of digits. N is the category of digits designating natural numbers, and M the category of digits designating non-negative integers. 5.1.1. X-bar syntax Relationships between syntactic categories may be described by means of syntactic features which are designated by feature symbols (cf. Brockhaus 1971, Kratzer, Pause and von Stechow 1973⫺74: II 5⫺14, as well as Gazdar, Klein, Pullum and Sag 1985: 17⫺42). We may, for instance, distinguish N and M by means of the feature [zero] designated by [zero]. (Following a convention from phonology, feature symbols are written with square brackets.) This feature may assume one of two possible values, which are designated by ⫹ and ⫺. The symbols ⫹ and ⫺ themselves are also feature symbols, sometimes called “singleton symbols” (Smolka 1988: 9). No deeper distinction needs to be made between feature symbols that designate features, and feature symbols (such as singleton symbols) that designate values, because features can themselves occur as values. A feature specification is an expression of the form [f: n] where f and n are feature symbols; the specification [f: n] says that the feature designated by f takes the value designated by n. Category symbols are now analyzed as consisting of such feature specifications (possibly besides other components such as sort symbols; cf. § 5.1.3. below); conversely, feature specifications are regarded as syntactic parts of category symbols. Thus, the symbol N is now analyzed as including, e. g., the feature specification [zero: ⫺] as its part, which indicates that the category N designated by N does not have the digit 0 as its element,
I. Systematik
whereas for M we have of course [zero: ⫹] because the category M designated by M does contain the digit 0. Features such as [zero] which can take only one of two possible values are called “Boolean features”. Complex category symbols consisting of feature specifications are also called “feature structures” (Shieber 1986: 12) or “feature terms” (Smolka 1988: 10 f); they are named “f-structures” in LFG (i. e., Lexical Functional Grammar; cf. the contributions in Bresnan 1982); in GPSG (i. e., Generalized Phrase Structure Grammar; cf. Gazdar 1982, and Gazdar, Klein, Pullum and Sag 1985) they are simply called “categories”. This, however, obliterates the distinction between the category symbols and the categories designated by these symbols. While such a mixing of levels may be harmless and may even simplify the exposition of a formalism, it should be observed that real progress in the formal theory of features has only been made on the basis of a “clear distinction between descriptions and what they denote” (Smolka 1988: 7). What remains to be treated in our reformulation of G2H is the difference between Z on the one hand and N and M on the other, which is not yet captured by the feature [zero]. Since Z does not include the digit 0, we have [zero: ⫺] as a part of the category symbol Z, but this only sets Z apart from N and does not distinguish Z from M. The difference between the categories Z versus M and N is fairly obvious, however. Expressions of category Z may be complex while those of M and N are always simple digits. In linguistics, the feature [bar] is used for the description of varying degrees of syntactic complexity, and syntactic theories employing such a feature are known as versions of X-bar syntax (cf., e. g., Jackendoff 1977). The name of this theory derives from the convention of designating the syntactic complexity of a category through the number of bars written above the category symbol (alternatively, sometimes primes are used instead of bars). Thus, V (no bar ⫽ bar-level 0) designates the category of simple verbs (e. g., swims, loves, gave, etc.), V (or, employing primes instead of bars, V⬘) designates the category of phrases consisting of a simple verb and its object(s) (e. g., swims, loves Mary, gave the book to Peter), V (or V⬙) designates the category of modified verb phrases (e. g., swims slowly, loves Mary ardently, gave the book to Peter with regret). The theory of bar-levels is
39
2. Syntactics
based on the syntactic work of Harris (1947: ch. 16). Before deciding on the bar-levels in our sample grammars, let us have a closer look at the two rules (i⬙) and (ii⬙) in § 4.4., parts of which are repeated here as (R1) and (R2) for easy reference.
grammar has only 3 categories). These pairs can be used to characterize the categories Z, M, N, E as shown in Tab. 2.2: Tab. 2.2
(R1) Z → N (R2) Z → NM The intuition behind this simple rule system is that we may write a digit behind a numeral in order to produce a new numeral, but this process may never start with a zero (cf. R1) and the first digit of a complex numeral must be an element of category N (cf. R2). Thus we may say that a numeral consists of a nonzero digit followed by a string of further digits which may begin with a zero. Let us call the category of such strings (e. g., 0, 01, 02, 03, …, 1, 11, 12, …, 001, 002, …) E (“ending”), and let us add E as a further category symbol to the non-terminal vocabulary of our rule system (cf. § 4.4.). Then, as a first step towards the grammar G3H, we may replace the rules (R1) and (R2) by the slightly more complex rules (R1⬘) and (R2⬘).
[zero: ⫹]
[zero: ⫺]
[bar: 0]
M
N
[bar: 1]
E
Z
Following Tab. 2.2, the category symbol M is now construed as the collection of the feature specifications [bar : 0] and [zero: ⫹], N as [bar : 0] and [zero: ⫺], E as [bar : 1] and [zero: ⫹] and Z as [bar : 1] and [zero: ⫺]. Collections of feature specifications are written by means of long square brackets as shown in the first row of Tab. 2.3. Obviously, the above complex category symbols come in pairs: the symbols for M and E differ only in their respective bar-specifications, as do those for N and Z. In cases like this, an abbreviation is used for the shared feature specifications, and such abbreviatory symbols are then indexed with an numerical superscript in order to indicate the bar-level. We chose the category symbols Z for [zero: ⫺] and E for [zero: ⫹]. These conventions are employed in the following reformulation of the rules (R1⬘) and R2⬘):
(R1⬘) Z → N (E) (R2⬘) E → M (E) As usual, parentheses indicate optional elements. Thus (R1⬘) abbreviates the two production rules: Z → N and Z → NE. Of course, it is not necessary to postulate a category such as E for the generation of the Hindu-Arabic numerals, as the rule systems of our original grammars G1H and G2H show. But if we now adopt the feature [bar] with the two possible values ⫺ and ⫹, the inclusion of E becomes very natural. Since we have the two features [zero] and [bar], taking two values each, there are 2·2 possible combinations of feature-value-pairs (whereas our original
(R1⬙) Z 1 → Z 0(E 1 ) (R2⬙) E 1 → E 0(E 1 ) As the reader will immediately recognize, the two rules (R1⬙) and (R2⬙) have a similar structure, which can be expressed by the very condensed rule scheme (X): (X) X m → X m-1 (Y m ), for 0 ⱕ m ⱕ 1 The possibility of economizing the formulation of rules by means of rule schemes is an
Tab. 2.3
The complex category symbol:
冋
bar: 0 zero: ⫹
册
冋
bar: 0 zero: ⫺
册
冋
bar: 1 zero: ⫹
册
冋
bar: 1 zero: ⫺
is abbreviated by:
E0
Z0
E1
Z1
and designatees the category:
M
N
E
Z
册
40
I. Systematik
additional reason for the introduction of syntactic features and complex category symbols. We shall return to rule schemes below. But let us complete the description of our new grammar G3H ⫽ *V3NT, V3T, S3, R3+ for the Hindu-Arabic numerals. So far we have only specified the following items: (i) the non-terminal vocabulary V3NT, which contains the four complex category symbols shown in Tab. 2.3, (ii) the terminal symbols of V3T, which are 0, 1, …, 9, as before, and (iii) the starting symbol, which is now Z 1. (Note that the symbol Z 1 simply stands for the complex symbol in the last field of the first row of Tab. 2.3.) But as members of R3 we have only given the two rules (R1⬙) and (R2⬙) and, alternatively, the rule scheme (X). These are supplemented now by the following lexical entries for the members of V3:
冋
bar: 0 (R3⬙) 0 ← zero: ⫹
冦冧
1 2 (R4⬙) ← ⯗ 9
册
冋 册
bar: 0 where x may be zero: x
either ⫹ or ⫺. Note that the use of complex symbols permits us to condense eighteen of the lexical entries of G2H (cf. (i⬙) and (ii⬙) in § 4.4.) into the nine instances of (R4⬙). Thus instead of the twenty-one rules of G2H, we only have the one rule (R3⬙) plus the two schemes (X) and (R4⬙) in G3H. This gain in economy may not look very impressive in the case of our sample grammars, but this is due to the simplicity of the numeral code. Kratzer, Pause and von Stechow (1974: 18) provide a grammatical fragment of German formulated with complex category symbols where 62,958,336 rules formulated with atomic symbols can be replaced by one single rule scheme. On the basis of G3H, the derivation of the numeral 1983 takes the form given in the parsing tree of Fig. 2.16. 5.1.2. Complex feature structures The feature structures of our sample grammar G3H are extremely simple. To get a better grasp of the descriptive power of feature structures, let us consider the architectonic order of antique columns as a more complex example (cf. Fig. 2.17). For our restricted purposes, it will suffice to distinguish three orders: the Doric, Ionic, and Corinthian ones (a more detailed account of the types of col-
Fig. 2.16
umns in classical architecture is given in Art. 69; cf. also Eco 1972). A classical column consists of at most three parts: a base, a shaft, and a capital. A complex symbol F characterizing a category of columns should therefore include specifications of the three symbols [base], [shaft], and [capital]. Doric columns do not possess a base whereas Ionic and Corinthian ones do. Ignoring the finer differences between Ionic and Corinthian bases, we construe [base] as a Boolean feature symbol which admits the two value symbols ⫹ (base) and ⫺ (no base). In contrast to the Boolean feature symbol [base], the value symbols for [shaft] and [capital] are not atomic but consist in the complex symbols Fs and Fc that provide more detailed feature descriptions of the shaft and capital. Including these structures, the symbol F characterizing an entire column then is:
冤
base: ⫾ F ⫽ shaft: Fs capital: Fc
冥
We describe the shaft by means of two feature symbols: [flute] provides the number of flutes of the shaft; the two possible numbers will be designated by the singleton symbols 20 (Doric) and 24 (Ionic and Corinthian). The shaft of a column of the Doric order is more tapered than that of columns of the other two orders. We represent this by the Boolean feature symbol [taper]. Then the complex value symbol of the feature symbol [shaft] for the category of Doric columns is:
冋
flute: 20 taper: ⫹
册
41
2. Syntactics
The capitals of the columns have three properties. Each column has an abacus (which is a narrow, square slab at the top of the capital) and an echinus (which is a convex molding at the bottom of the capital). We do not represent these properties in the feature symbol of a column because they do not differ for the three categories of columns, and there would be little point in having the Boolean feature symbols (abacus] and [echinus] if they could never receive a negative value. But Ionic and Corinthian capitals each have a volute, which Doric ones lack. Therefore we adopt a Boolean feature symbol [volut] which is specified negatively for the category of Doric column and positively for the two other categories. Furthermore, the capital of a Doric column is the most simply decorated of all three, while that of a Corinthian column with its characteristic garland of stylized acanthus leaves is more decorated than that of an Ionic one. So we adopt two further Boolean feature symbols [decor], which is specified negatively for the Doric but positively for the other two column categories, and [acant], which is specified positively only in the case of the Corinthian capital. As a result we obtain the following description of the Corinthian column, which can be taken as a (modestly) complex example of a complex category symbol (complex category symbols characterizing the other categories of columns are given in § 5.2.):
(CC)
冤
base: ⫹ flute: 24 shaft: taper: ⫺
冋
册
冤
冥
volut: ⫹ capital: decor: ⫹ acant: ⫹
冥
Obviously, there is a certain degree of redundancy in this feature description, because it is impossible for the feature [volut] to be specified negatively if [decor] takes the value ⫹. The latter feature in turn must be specified positively if [acant] is. Thus we can predict the positive specifications for [volut] and [decor] from that of [acant]. We shall come back to such relationships between features in § 5.2. 5.1.3. Subcategorization Let us return to our sample grammar G3H and its scheme (X). This scheme describes a complex expression of any category (be it Z1
Fig. 2.17: Doric, Ionic and Corinthian columns: their shaft with flutes and tapering, and their capital with abacus, echinus, and volute as well as acanthus leaves (cf. Amiet et al. 1981: 354; cf. also Carlini and Schneider 1977).
or E1) as consisting of one obligatory constituent (belonging to category Z0 in the case of Z1 and to E0 in the case of E1) which is facultatively followed by an expression belonging to category E1. Furthermore, the obligatory element differs from the whole category only with respect to its lower bar-level but not with respect to the value for the remaining feature [zero]. We may therefore say that the complex expression differs from its obligatory constituent in its complexity but not in its overall syntactic character (which in the case of numerals is exhausted by the [zero]value). Traditionally, a construction (e. g., one belonging to Z1 or to E1) with an obligatory constituent that has the same syntactic character as the whole is called “endocentric” ⫺ the obligatory constituent (e. g., of categories Z0 and E0) being known as “head”, “center” or “nucleus” and the facultative constituent as “modifier” of the head (center of nucleus; cf. Bloomfield 1933: ch. 12.10 and Hockett 1958: ch. 21 for a treatment of endo-
42 centric constructions within the framework of structuralist syntactics). However, the traditional concept of an endocentric construction differs in certain respects from the one in X-bar theory. For instance, X-bar theory requires an endocentric construction to have just one head (cf., e. g., Jackendoff 1977: chs. 2 and 3 and Sells 1985: 27⫺31), whereas Hockett admits Hydra-like constructions with several heads. As a consequence, syntactic coordination is classified as endocentric by Hockett but as exocentric by most X-bar theorists. Standard versions of X-bar theory require not only that each expression of category Xm possesses a unique head of category Xm-1, they also postulate that the facultatively present additional expressions belong to categories of maximal bar-level. The scheme (X): X m → X m⫺1 (Y m ) of grammar G3H conforms to these requirements of standard X-bar theory. Such a rule-scheme is therefore called an “X-bar scheme”. A category Xm is called a “projection” of category X (⫽ X0), and Ymax is the maximal projection of category Y. In our simple case, max equals 1, but, of course, this need not be the case for more complex codes. The X-bar scheme of our sample grammar G3H is very simple, indeed. More complex codes such as natural languages pose more difficult problems for X-bar analysis. In this context, the question arises as to how many bar-levels are to be distinguished for a given category X. In particular, how many degrees of complexity should be distinguished for verbal categories? Traditionally, there is agreement that simple verb forms constitute the basic level and that at least some languages (namely, those which are called “configurational languages”) contain a verb phrase (traditionally labeled VP) consisting of a simple verb form and its objects. But what status do adverbial modifiers then have? Are they constituents of the verb phrase or do they belong to a new bar-level? Since they are traditionally viewed as modifiers they should constitute a new bar-level, but if the constituent consisting of the verb, its objects, and the adverbial modifiers is called “a verb phrase”, then we need a new label for the complex consisting only of the verb and its objects. We might use V 0 for the verb, V 1 for the verb plus its objects, and V 2 for a constituent of category V1 plus its adverbial modifiers. However, what about sentences, whose category is traditionally labeled S? Is S a projection of V or do sentences be-
I. Systematik
long to a quite different category? If category S is indeed a projection of category V, is X ⫽ V3 or are there further categories intervening between V1 and S (due, e. g., to the complications of the auxiliary phrase)? The category S is analyzed as a projection of the verbal category in GPSG, as an exocentric category without a lexical head in LFG, and as a projection of a category INFL (which encodes information about the inflection of the verb) in GB (as presented in Chomsky 1982a: 18⫺19), which permits only S⬘ as maximal projection (where INFL ⫽ INFL0, S ⫽ INFL1 and S⬘ ⫽ INFL2; cf. also Sells 1985: 30). Furthermore, if S ⫽ V3, are there also only three higher levels for all the other syntactic categories? Traditionally, nouns are labeled with N, and noun phrases with NP; thus, granting that S ⫽ V3, is NP ⫽ N3? The hypothesis that all categories of expressions in a natural language share a unique common maximal bar-level max is known as the “uniform-level-hypothesis”. Jackendoff (1977) adopts the uniform-level-hypothesis and takes max to be 3 (starting from 0 as the lowest level); the version of GB presented in Sells (1985: ch. 2) assumes only three levels. In order to illustrate further concepts from X-bar theory, let us now introduce a new grammar G4H, which describes the syntactic structure of arithmetic expressions and is an extension of G3H. First we enlarge the set of 3 terminal symbols of G H by adding the new symbols: ), (, , ⫹, ⫺, x, :, EN and ⫽. The two parentheses ) and ( are called “auxiliary symbols”; they serve to indicate groupings in complex expressions. Each expression designating a natural number is called “a term”; examples of complex terms are 4, (5⫺3), ((3 ⫻ 4) : 6), etc. (In mathematical disciplines, “term” is used for any expression referring to an object of that discipline; thus, e. g., the terms of arithmetic refer to numbers. This, however, is not the basic meaning of this word which can be traced back to the Greek oÕrow, meaning ‘frontier’, and, in the syntactic terminology of traditional logic, originally designated certain constituents in the premises and conclusions of syllogistic inferences; cf. Art. 41 for further details.) Starting with terms, we use the sign of equality ⫽ to formulate sentences like 5 ⫽ 7, 4 ⫽ 2, ((3 ⫻ 4) : 6) ⫽ (1 ⫹ 1), etc. The terminal symbol EN is prefixed to a term in order to state that there exists a natural number which is the result of computing the term. For instance, EN 4 is a true sentence, because the
43
2. Syntactics
(positive) square root of 4 is the number 2, but EN(3 : 6) is false since the division of 3 by 6 does not yield a natural number and EN(4⫺4) is false because 0, which would be the result of subtracting 4 from 4, is classified here as a non-negative integer but not as a natural number. The feature symbols which are employed by G4H are displayed in the following Tab. 2.4 together with their corresponding singleton symbols. Tab. 2.4
feature symbol
corresponding singleton symbols
bar
0, 1, 2
subcat
1, 2
left
⫹, ⫺
tions; complex category symbols with the component CIPH contain only a [bar]-specification, while symbols with the component AUX contain a [bar]- and a [left]-specification. In order to state our rules and lexical entries, we use the abbreviations given in Tab. 2.5. Furthermore, we adopt the following convention with respect to underspecified abbreviations such as S 1 and Z m: If information must be displayed which is not provided in Tab. 2.5, we add the missing specifications to the respective abbreviation. For instance, Z m[subcat: 0] designates the category of 0-ary operators of bar-level m (cf. (LE4) below for examples), and S 1[subcat: 1] designates the unary relators of bar-level 1. Based on this convention, we may now list our lexical entries of G4H as in (LE4): (LE4)
We do not require any complex category symbol in G4H to contain a specification for each of the feature symbols listed in the first column of Tab. 2.4. With regard to G4H four sorts of expressions are distinguished: relators, operators, ciphers and auxiliaries. Relators are expressions which take terms in order to form sentences. Similarly, operators take terms in order to form other terms. For instance, the symbol EN is a unary (1-ary) relator and ⫽ is a binary (2-ary) relator, because two flanking terms t1 and t2 are required to form with it a complete sentence: t1 ⫽ t2. The feature [subcat] is used to encode the number of open slots (the “arity”) of operators and relators. Ciphers are either 0-ary operators (1, 2, …) or strings of digits of the type which we have called “endings” in G3H (e. g., 0, 1, 2, …, 9, 00, 01, …, 09, 10, 11, …, etc.). Note that the operators and ciphers intersect since the 0-ary operators 1, 2, …, 9, 10, 11, … are also ciphers. But there are operators which are not ciphers (e. g., ⫹ and ⫺) as well as ciphers like 0, 00, 01, …, etc. which are not 0-ary operators because they are not Hindu-Arabic numerals. Auxiliary symbols only include the two parentheses. In G4H, we shall use the sort symbols REL, OP, CIPH and AUX in order to designate the four sorts of expressions, so that we have sort symbols in addition to feature specifications occurring in the complex category symbols of G4H. We introduce the following restrictions: Category symbols containing REL or OP contain only [bar]- and [subcat]-specifica-
冦冧 冦冧 0 1 ⯗ 9
1 2 ⯗ 9
← E0
← Z1 [subcat: 0]
← Z0 [subcat: 1]
冦冧
⫹ ⫺ ← Z0 [subcat: 2] ⫻ :
EN ← S0 [subcat: 1]
⫽
← S0 [subcat: 2]
(
← P⫹
)
← P⫺
The non-lexical rules of G4H include the ones listed in (ID4): (ID4) H 1 [subcat: 1] → H 0, Z 2 H 1 [subcat: 2] → H 0, Z 2, Z 2 Z 2 → P⫹, Z 1, P⫺ Z 2 [subcat: 1] → Z 1 Z 2 [subcat: 0] → Z 1, (E 2) E 2 → E 1, (E 2) E m → E m-1, where m may be 2 or 1 (The presence of the commas in these rules is explained below.) In the first two rules the symbol “H” stands for the head of an expression. More precisely the first rule states that every expression of bar-level 1 for which the
44
I. Systematik
Tab. 2.5
The complex category symbol:
where:
is abbreviated by:
冥
n may be 1 or 2
S1 (note that the symbol n is neglected in this abbreviation)
冥
m may be 1 or 2
S0
冥
m and n may be 0, 1 or 2
Zm (note that the symbol n is neglected in this abbreviation)
冋 册
m may be 0, 1 or 2
Em
冤 冥
x may be ⫹ or ⫺
Px
冤
REL bar: 1 subcat: n
冤
REL bar: 0 subcat: m
冤
OP bar: m subcat: n
CIPH bar: m AUX bar: 2 left: x
feature [subcat] takes the value 1 and which is characterized by the complex symbol H consists of a head of bar-level 0 that is also characterized by H and an expression of category Z2. The rules of (ID4) do not accord with the uniform-level-hypothesis, but they all follow the very general scheme (X⬘): (X⬘) H m → …, H m-1, …, where m may be 0, 1 or 2. The dots “…” indicate that a number of further symbols may be present besides the one designating the head. Thus, in the first rule of (ID4) there is just one further constituent, in the second rule there are two, etc. In the grammar G4H, a sentence such as (2 ⫹ 2) ⫽ 16 is assigned the parsing tree of Fig. 2.18. As indicated by the commas in (ID4), the rules in question exclusively determine the hierarchical order of the constituents and are therefore called “immediate dominance rules (ID rules)”. The linear order of the constituents is left undetermined so that, e. g., the third rule of (ID4) does not prescribe that P⫹ must precede Z 1 and that Z 1 must in turn precede P⫺. Concerning the linearization of constituents the grammar G4H follows the
Fig. 2.18
format of GPSG (Generalized Phrase Structure Grammar), which provides so-called “linear precedence rules” (“LP rules”; cf. Gazdar, Klein, Pullum and Sag 1985: 44⫺50
45
2. Syntactics
and Sells 1985: 85). The LP rules in G4H are given in the list (LP4): (LP4) X 0 [subcat: 1] Ɱ Y Y 2 Ɱ X 0 [subcat: 2] Ɱ Y 2 P⫹ Ɱ X X Ɱ P⫺ X Ɱ E2 The domains of LP rules are constituents. Thus the first rule of (LP4) states that within a constituent any symbol X which contains as its parts the specifications [bar: 0] and [subcat: 1] must precede all its sister symbols. This amounts to the requirement for unary operators and relators that prefix notation is used, as in, e. g., 16 or EN(1 ⫹ 3). The second rule of (LP4) postulates infix notation for binary operators and relators. The third rule states that a left parenthesis precedes each of its sister symbols while the fourth rule states that a right parenthesis is preceded by each of its sister symbols. The last rule says that the ending of a numeral follows every other sister symbol. The ID and LP rules collaborate in the construction of parsing trees. For instance, the second rule of (ID4) allows for trees with a root node labeled S 1 which dominates three nodes, one of which is labeled S 0 and the other two both receiving the label Z 2. The second rule of (LP4) requires that the node labeled S 0 should occupy a position between the two other nodes. Taken as a whole, the grammar G4H comprises the following components: (i) the nonterminal vocabulary V4NT which contains all complex category symbols that may be constructed from the sort symbols REL, OP, AUX and CIPH and the feature symbols of Tab. 2.4 in accordance with the sort restric-
Fig. 2.19
tions stated above, (ii) the enlarged terminal 4 vocabulary V T ⫽ {0, 1, 2, 3, 4, 5, 6, 7, 8, 9, EN, ⫽, , ⫹, ⫺, ⫻, :, ), (}, (iii) the complex starting symbols S 1 (note that there are two such symbols differing in the [subcat]-specification), (iv) the ID rules listed in (ID4), and (v) the LP rules listed in (LP4). The grammar G4H allows for parsing trees which accord to the tree scheme in Fig. 2.19. As pointed out above, a category Xn is called a “projection” of the corresponding category Xm (m ⬍ n) of lowest bar-level. Most versions of X-bar theory require 0 to be the lowest bar-level for each kind of category. For our arithmetic code, however, this requirement would only result in an undue complication of the grammar. Thus we have adopted 1 as the lowest level for E but 0 as the base level for Z; cf. Tab. 2.5 and Fig. 2.18. Furthermore, the scheme of Fig. 2.19 is to be understood in such a way that everything except the position labeled X 2 may be left out. This again is a deviation from some versions of X-bar theory, which postulate that every node labeled with an X 2 must be the origin of a path that leads via X 1 to X 0. We have not included this postulate because that would only lead to trees with long nonbranching paths. The tree scheme of Fig. 2.19 can now serve to answer questions of the type posed in the beginning of this section (§ 5.1.3.) by defining the grammatical functions of the constituents of complex expressions. Expressions of a category Ymax which accompany an Xmax-1phrase and indicate that a constituent of the maximal projection Xmax has been completed are called “specifiers of X” (cf. Jackendoff 1977: 37 and Sells 1985: 28). In our arithmeti-
46 cal code, left and right parentheses are specifiers for the terms formed by means of binary operators; other kinds of terms have no specifiers, nor are there specifiers for sentences. Non-specifiers of a category Rmax accompanying the X1 in an X2-phrase are called “modifiers of X”. In our arithmetic code, expressions of category E2 can be modifiers of 0-ary operators; again there are no modifiers for the sentence category S. The occurrence of a modifier is optional, cf. the penultimate rule of (ID4). Thus in Fig. 2.18 the occurrence of the terminal digit 1 is modified by the following digit 6, but the two occurrences of 2 are left unmodified. The head of an Xmax which has the lowest bar-level is called “the lexical head” of the Xmax. Thus in Fig. 2.18 the operator ⫹ is the lexical head of the term (2 ⫹ 2) and the digit 1 is the lexical head of the 0-ary term 16. Constituents (of maximal bar-level) accompanying the lexical head of a construction are called its “arguments”; cf. Fig. 2.19, where the argument positions are labeled with U 2 and W 2. In Fig. 2.18, the two occurrences of the digit 2 are the arguments of the operator ⫹, and the 0-ary term 16 is theargument of . Furthermore, (2 ⫹ 2) and 16 are the arguments of the relator ⫽. The head is said to “subcategorize” for its arguments. This implies that the head must be accompanied by its arguments and that the head’s meaning semantically operates on their meanings. Subcategorization is an old topic in Generative Grammar, where the subcategorization properties of an expression are described by means of a subcategorization frame (cf. Chomsky 1965: § 2.3.4. and see § 4.10. above). The subcategorization frame for our binary symbols (both operators and relators) would be [Z 2 Z 2]Z1. From the viewpoint of X-bar theory, however, this is redundant because the resulting category Z1 is already uniquely determined by the head and thus need not be indicated by means of a subscript. Furthermore, the linear order of expressions is governed by independent principles such as the LP rules of GPSG. Other versions of X-bar theory employ postulates such as one requiring that the head of every constituent be placed at the extreme right or at the extreme left of that constituent. In any case, information about linear order need not be encoded in the subcategorization frames. The treatment of subcategorization in G4H again follows the line taken in GPSG (cf.
I. Systematik
Gazdar, Klein, Pullum and Sag 1985: 33 ff). This approach to subcategorization is simple because the subcategorization properties are directly encoded by means of the [subcat]specification. However, there is a certain arbitrariness in this procedure which is due to the fact that the singleton symbols which specify the values of the feature [subcat] are merely conventional code numbers. Of course, the choice of 1 and 2 in G4H is suggested by the fact that unary operators and relators subcategorize for one argument and binary operators and relators for two. But instead of 1 and 2 we could also have used such symbols as * and #. This arbitrariness becomes even more apparent when more complex codes are considered. E. g., Gazdar, Klein, Pullum and Sag (1985: 247) use the digit 8 as a code number for verbs like persuade, which subcategorize for a nominal object and an infinitival clause. In this case, the digit does not even specify the number of the argument and there is no reason for choosing 8 in this case instead of, say, 1056. There are several other approaches to subcategorization, e. g., that of Categorial Grammar or Lexical Functional Grammar. Categorial Grammar takes subcategorization as its criterion for classifying expressions into different categories. This makes it a very appropriate basis for semantics (cf. its extensive use in Art. 4; for recent approaches to categorial grammar cf., e. g., Ades and Steedman 1982, Uszkoreit 1986, Zeevat, Klein and Calder 1987, Buszkowski, Marciszewski and van Benthem 1988, Moortgat 1988, Oehrle, Bach and Wheeler 1988, König 1990). A very common approach to subcategorization is via grammatical relations. Traditionally, for instance, the arguments of a verb are called its “objects”. However, grammatical relations do not play an important role in syntactic theories which concentrate on constituent structure; instead, such theories try to define grammatical relations in terms of parsing tree configurations (cf., e. g., Chomsky 1965: ch. 2.2). This account of grammatical relations is in turn criticized by adherents of Relational Grammar (cf. Perlmutter 1982, Perlmutter 1983 as well as Perlmutter and Rosen 1984) and of Arc Pair Grammar, which is its formalized descendant (cf. Johnson and Postal 1980 as well as Postal 1982). A formally very elaborate theory which analyzes subcategorization in terms of grammatical relations is Lexical Functional Grammar (cf. Bresnan 1982).
47
2. Syntactics
5.1.4. Thematic roles A further approach to subcategorization is based on the assumption of so-called “thematic roles” (abbreviated: “h-roles”). This route is taken, e. g., by the influential Government and Binding Theory (GB) of Chomsky (1981); cf. § 4.10. above. The usefulness of thematic roles can again be illustrated with respect to our arithmetic code. Any adequate grammar of it must state that the operators ⫺ and : take two terms as their arguments. But, obviously, additional information is required. In subtraction it must be specified which of the two arguments is the minuend and which is the subtrahend; and in division it must be specified which of the two arguments is the dividend and which is the divisor. Relational concepts like these (minuend, subtrahend, dividend, divisor) are examples of h-roles. We shall now explain the GB analysis of subcategorization in terms of hroles as well as some other notions from this theory by introducing the grammar G5H for our arithmetic code. The list of feature symbols for G5H is an extension of that given for G4H in Tab. 2.4; cf. Tab. 2.6: Tab. 2.6
In G5H the subcategorization properties of expressions are described by means of argument grids (cf. Sells 1985: 36 and Andrews 1988: 71⫺76). The argument grid of an expression e consists of two lists: *a1, a2, …, am+ (h1, h2, …, hn). The first list *a1, a2, …, am+ specifies the respective categories of the arguments for which the expression subcategorizes, and the second list (h1, h2, …, hn) provides the thematic roles which are assigned to the arguments of e. The second list may be longer than the first one because e may have arguments for which it does not subcategorize. In GB for instance, the subject of a verb is analyzed as one of its arguments but verbs do not subcategorize for their subjects. Arguments like the subjects of verbs are called “external arguments”. There are, however, no external arguments in our code. The list (LE5) now specifies the lexical entries of G5H. (LE5)
冦冧 冦冧 0 1 ⯗ 9
1 2 ⯗ 9
← E0
← Z0
feature symbol
corresponding singleton symbols
bar
0, 1, 2
⫹
← Z0 *Z2, Z2+ (summand, summand)
case
left, right
⫺
role
theme, radicand, summand, minuend, subtrahend, factor, dividend, divisor
← Z0 *Z2, Z2+ (minuend, subtrahend)
⫻
← Z0 *Z2, Z2+ (factor, factor)
⫹, ⫺
⫽
← S0 *Z2, Z2+ (theme, theme)
(
← P2 [case: left]
)
← P2 [case: right]
zero
As in G4H, we have the sort symbols REL, OP, CIPH and AUX. Complex category symbols which contain the sort symbol REL have only a [bar]-specification, those containing OP have specifications for the feature symbols [bar], [case] and [role] while those with the sort symbol AUX or CIPH only have a [bar]- and a [case]-specification. We shall explain the special role of the feature [case] only after having explained the version of X-bar theory applied in G5H. Tab. 2.7 provides a list of the abbreviatory conventions used in connection with G5H.
← Z0 *Z2+ (radicand)
EN ← S0 *Z2+ (theme)
All the production rules of G5H are summed up by the following single X-bar scheme: (X5) X m → … X m-1 … In (X5) X m-1 indicates the position of the head (at level m ⫺ 1). The dots “…” may be filled with any sequence of category symbols for which the singleton symbol of the [bar]specification designates the maximal number possible. If one compares (X5) to the rules of
48
I. Systematik
Tab. 2.7
The complex category symbol:
where:
is abbreviated by:
冋 册
m may be 0, 1
Sm
冤 冥
m may be 0, 1 or 2, c may be left or right, u may be any of the role symbols of Tab. 2.6
Zm (note that the symbols c and u are neglected in this abbreviation)
m may be 0, 1 or 2
Em
m may be 0, 1 or 2 c may be left or right
Pm (note that the symbol x is neglected in this abbreviation)
REL bar: m
OP bar: m case: c role: u
冤
冥
NUM bar: m case: left
冤 冥 AUX bar: m case: c
G4H, one immediately regognizes that (X5) is highly overgenerative. This means that the scheme allows the derivation of many non well-formed expressions. For instance, (X5) admits a fragment of parsing trees such as the one given in Fig. 2.20: S1 Z2
S0
Z2
subtree on the right in Fig. 2.20 is ruled out for the following two reasons: (i) If there are two specifiers for a term they must flank it and may not both precede it. (ii) Infix notation (instead of the prefix notation of Fig. 2.20) is obligatory for binary operators. In order to exclude at least some of the illformed expressions admitted by (X5), we adopt the following principles for the X-bar theory applied to G5H.
Fig. 2.20
(S1) If in a structure [… [a]X max⫺1 …]X max there are specifiers at all, then there must be two of them and they occupy the extreme left and right-hand positions in the structure. (S2) In a structure [… [a]X max⫺1 …]X max, modifiers may only follow the modified element of the category designated by X max⫺1. (S3) In structures of the form [… [a]X 0 …]X 1 lexical heads always precede at least one argument, but if there are more than one, will not precede all of them.
We already know from grammar G4H that Fig. 2.20 cannot show the syntactic structure of any expression of our code. The left part of the tree in Fig. 2.20 is excluded by the fact that there cannot be any specifiers for terms whose head is not a binary operator. The
The principle (S1) excludes structures like those in the right subtree of Fig. 2.20 but still admits for the left subtree. The second principle excludes ill-formed pseudo-terms like 01 but it still admits, e. g., the ill-formed 16 0, where 0 modifies 16. Finally, (S3) excludes ⫹ 11 22 but it still admits the pseudo-term 11
P2
Z1 Z0
P2
P2
P2
Z1
Z0
Z2
Z2
Z1
Z1
Z0
Z0
2. Syntactics
⫹ 22 23, where ⫹ co-occurs with more than the appropriate number of arguments. This last example takes us back to the problem of subcategorization. In order to eliminate pseudo-terms such as 11 ⫹ 22 23, we adopt the following h-criterion, which postulates that lexical heads assign the roles of their argument grids to their arguments. (u) The n-th argument (in left-to-right-order) a of a lexical head h must carry exactly that h-role which is designated by the n-th item in the list of roles in the argument grid of h. The h-criterion excludes pseudo-terms like 11 ⫹ 22 23 because the operator ⫹ can assign two but not three h-roles. This means that ⫹ must always be accompanied by exactly two arguments, and by extension (h) taken together with the above (S3) requires that ⫹ always occurs as an infix between exactly two arguments. Furthermore, the argument grid of ⫹ requires (by means of its first component *Z 2, Z 2+) these arguments to be terms of bar-level 2. Similarly, the h-criterion taken together with(S3) requires that a unary operator such as must always appear as a prefix of a single argument of category Z2. Pseudo-terms like 0 ⫹ 17, 17 ⫹ 0 and 0 are ruled out by the following principle (A) of subcategorization. (A) If the argument grid of an expression h stipulates that h takes n arguments of the categories C1, C2, …, Cn respectively, then any occurrence of h has to be accompanied by n expressions of these categories. Note that (A) does not fix the order of the arguments. That is (partly) done by means of (S3), and the semantic impact of the argument order is accounted for by (h). It is a peculiarity due to the simplicity of our code that only expressions of category Z2 may carry h-roles so that one of the two lists of the argument grid is redundant in our case. There are only two problems left in this context, and these concern the distribution of specifiers and modifiers. The distribution of these expressions is governed by the feature [case]. Clearly, a 2-ary operator requires the left parenthesis to occur to the left of its first argument and the right parenthesis to occur to the right of its second argument. Similarly, 0-ary operators require their modifiers to appear to the right of them. Thus the position of specifiers and modifiers are determined by their corresponding heads. We explain this by
49 assuming the feature symbol [case] with the possible value symbols left and right, and say that heads assign case to their specifiers and modifiers. The case of a specifier or modifier determines the position of this expression; the left case determines the left position of the case marked expression, the right case the right position of this expression. If such an expression occurs at all, it must occur at a determinate position. But in order to occur there, it must carry a case which determines this position. It follows that a specifier or modifier cannot occur at all unless it has case. Again utilizing GB theory, we postulate the following case filter: (C) The [case]-specifications of occurrences of symbols P 2 and E 2 in parsing trees are completely determined by the lexical heads of the expression to which these occurrences belong. Only heads which are digits or binary operators may assign case. A binary operator assigns right case (i. e., [case: left]) to the left specifier position and right case (i. e., [case: right]) to the right one. A digit assigns right case to just one following modifier position. Trees like the left subtree in Fig. 2.20 are ruled out now because digits cannot assign case to parentheses, and 16 0 as well as 16 ⫹ 5 27 are ill-formed because unary and binary operators cannot assign case to following modifiers. Furthermore, since a 0ary operator may only assign case to the first modifier position, 1 17 18 is also ruled out as ill-formed. We conclude this section by taking the sentence (2 ⫹ 2) ⫽ 16 and confronting the parsing tree provided for it in G4H (cf. Fig. 2.18) with the parsing tree assigned to it by the grammar G5H (cf. Fig. 2.21). In Fig. 2.21, the cases and h-roles assigned to constituents by their heads are marked at the corresponding nodes. 5.2. Graphs, markedness, and unification The previous section showed that feature structures and feature symbols play an important part in advanced syntactic theories. The present section is, therefore, devoted to further aspects of feature structures and feature symbols. 5.2.1. Graphs Let us start by dealing with methods of representation for feature structures. Besides their representation by means of brackets, feature structures may also be represented by graphs, in particular by DAGs, i. e., directed acyclic
50
I. Systematik
Fig. 2.21
graphs (cf. Gazdar, Klein, Pullum and Sag 1985: 20⫺27 as well as Shieber 1986: 21⫺22; for the concept of a DAG cf. especially Aho and Ullman 1972: vol. 1, 39⫺45). As its name says, a DAG is a directed graph which has no cycles. There are several equivalent definitions of a graph, and since we shall need some concepts from graph theory in § 5.4., we shall be a little more explicit in our explanation of graphs than would otherwise be necessary at this point (cf. also the passage at the end of § 4.9.); we follow Ehrig (1979: 12⫺13) in matters of basic terminology (cf. also Halin 1980⫺1981). A graph D consists of two collections: the collections DN of its nodes and the collection DA of its arcs (also called its “edges”). In undirected graphs, each arc a from DA connects two nodes n1 and n2 from DN without assigning a direction to this link between the two nodes. Neglecting both the possibilities of arcs connecting nodes with themselves and that of several arcs between the same two nodes, we might identify DA with a subcollection of the set of all classes which contain exactly two elements from DN. For ordered graphs, however, there exist two functions ⫺ s(ource) and t(arget) ⫺ which determine the direction of each arc. In this case, it is natural to admit “loops”, i. e., arcs a with s(a) ⫽ t(a), and several arcs (e. g.,
two a1 ⫽ a2) connecting the same nodes in the same (i. e., s(a1) ⫽ s(a2) and t(a1) ⫽ t(a2)) or in the opposite direction (i. e., s(a1) ⫽ t(a2) and t(a1) ⫽ s(a2)). Graphs with several arcs between the same nodes are sometimes called “multi-graphs”. If a is an arc from DA and k1 and k2 are nodes from DN, then a is said to leave k1 and to enter k2 if s(a) ⫽ k1 and t(a) ⫽ k2; in this case, we say that a is an arc from k1 to k2. A graph is finite if the number of its arcs and that of its nodes are both finite. A directed path (from k0 to kn) is a sequence *k0, k1, …, kn+ such that for every two successive terms km and km⫹1 (0 ⱕ m ⬍ n) there is an arc leaving km and entering km⫹1; thus the shortest paths are the arcs themselves. A path *k0, k1, …, kn+ is a cycle (or circuit), if k0 ⫽ kn; thus the shortest cycles are the loops themselves. A root is a node which (i) is not entered by any arc, but (ii) from which there is a path to every other node of the graph. A graph is called “rooted” if it has a root. (Obviously, a directed graph may have at most one root. If there were two or more, they should be connected by directed paths, but then there would be arcs entering one of them, which is impossible for roots.) Conversely, a node is a leaf if there is no arc leaving it. Two nodes k0 and kn are called “connected” if there are intermediate
51
2. Syntactics
nodes k1, …, kn-1 such that every two successive terms km and km⫹1 (0 ⱕ m ⬍ n) of the sequence *k0, k1, …, kn+ are connected by a path. (Each node is said to be connected to itself.) A graph is connected if every two of its nodes are connected. As we have already said, a DAG has no cycles. DAGs which represent feature structures are mostly considered to be finite, rooted, and connected. But there are exceptions from this as well as from the requirement that graphs representing feature structures should have no cycles (cf. Johnson 1988 and Smolka 1989). Graphs may carry annotations both on their nodes and their arcs; these are called “colors” (or “labels”). A graph with colors on its nodes and/or arcs is a colored graph. A color alphabet is a pair C ⫽ *CA, CN+ of two sets: CA is the set of colors for arcs, CN the set of colors for nodes. Given a color alphabet, a colored graph is a graph together with an arc coloring map mA and a node coloring map mN. The arc coloring map mA assigns colors from CA to (not necessarily all) arcs, as does the node coloring map mN for (again not necessarily all) nodes and CN. Given this terminology from graph theory, we may reformulate the complex feature symbol (CC) from § 5.1.2. (characterizing the Corinthian column) as a colored DAG in the following way: the DAG in question has a root from which three arcs leave. These arcs carry the feature symbols [base], [shaft], and [capital] as their respective colors. The arc which is colored with [base] centers a leaf colored with the value symbol ⫹. The [shaft]-arc enters a node which is the source of two other arcs: The first is colored with [flute] and enters a leaf colored with the value symbol 24, while the second is colored with [taper] and enters a leaf colored with the value symbol ⫺. The node entered by the [capital]-arc is the source of three further arcs colored by the feature symbols [volut], [decor] and [acant] and entering three leaves colored with three instances of the symbol ⫹. Thus the complex feature symbol (CC) of § 5.1.2.:
(CC)
冤
base: ⫹ flute: 24 shaft: taper: ⫺
冋
册
冤
冥
volut: ⫹ capital: decor: ⫹ acant: ⫹
Fig. 2.22
Among other things, the representation of a feature structure in a graph has the advantage of allowing for a very intuitive interpretation of a somewhat subtle distinction. For theoretical reasons, a difference should be made between two features having values of the same type and two features sharing their values. E. g., in the feature graph of Fig. 2.22 the feature symbols [volut] and [decor] both have a positive value specification. We seem to be dealing with two distinct value tokens of the same type, and yet a volute is also a form of decoration, such that we would expect [volut] and [decor] to share their value specification instead of having only value tokens of the same type. (In view of the Ionic column, which has [decor: ⫹] but [acant: ⫺], the feature symbol [acant] cannot be included in these considerations.) We may represent this by letting the two arcs which
冥
is equivalent with the diagram in Fig. 2.22.
Fig. 2.23
52
I. Systematik
are colored with [volut] and [decor], respectively, enter the same node, which carries only one value specification ⫹ (cf. the graph in Fig. 2.23). If arcs enter the same node colored by a value specification, this is called “value sharing”. Using the bracket notation, value sharing is indicated by coindexed boxes. Such a box is known as “a tag”. The value is written out only once, and repetition is avoided by the use of its associated tag (cf. Shieber 1986: 13 f). For the feature structure represented by the DAG in Fig. 2.23, this is exemplified by the complex symbol (CC⬘):
(CC⬘)
冤
base: ⫹ flute: 24 shaft: taper: ⫺
冋
册
冤
冥
volut: ⫹ 씲 1 capital: decor: 씲 1 acant: ⫹
冥
Value sharing is not to be confused with a coincidence of the type of value symbols. This distinction is especially clear in the case of the graph notation, where value sharing corresponds to two arcs entering the same node while coincidence of value type corresponds to two arcs entering two different nodes which are colored with the same value symbol. Compare the graph of Fig. 2.22 (which corresponds to (CC) and exemplifies coincidence of the type of the specifications of the feature symbols [volut] and [decor]) with the graph of Fig. 2.23 (which corresponds to (CC⬘) and exemplifies value sharing, i. e., identity of the specifications of [volut] and [decor]). They are quite distinct graphs! Value sharing can be used to analyze agreement phenomena. Traditional grammars for natural languages formulate agreement rules such as the one requiring the subject and predicate of a sentence to agree in number and person. Obviously, this may easily be formalized by making use of value sharing. In the new structural description of Corinthian columns, which utilizes value sharing, the feature symbol [base] on the one hand and the feature symbols [volut] and [decor] on the other still have value specifications of the same type. (Note that [volut] and [decor] do not just agree in the type of their specifications but really do have the same specification.) We could, of course, let these merge,
too, but there seem to be reasons to keep them apart just as in the case of [acant]. (For instance, one could claim that decor is exclusively a matter of the capital.) If these reasons are valid, one might nevertheless want to express the fact that the feature symbols [decor] and [base] always have the same type of value symbols. The need to express coincidence of the type of value where there is no value sharing is even clearer in the case of the feature symbols [base], [flute] and [taper]. Here, the Boolean feature symbols must always have opposite value symbols, for, if a column has no base, then it is a Doric one and is specified positively for the feature symbol [taper]. The columns of the two other orders, however, have a base ([base: ⫹]) but are not tapered ([taper: ⫺]). This correspondence cannot be expressed by means of value sharing because there are no shared values. However, one might introduce functions on feature values in this case. Let op designate that function which reverses the values of Boolean features; i. e., it provides ⫹ on the basis of ⫺ and ⫺ on the basis of ⫹. Then the correspondence between [base] and [taper] can be expressed in bracket notation as follows:
冋
base: ⫹ 씲 1 shaft: [taper: op ( 씲 1 )]
册
Correspondences between feature values that are describable in this format are called “functional dependencies” in the HeadDriven Phrase Structure Grammar (HPSG) of Pollard and Sag (1987: 48). However, this solution of our problem is not quite satisfactory without additional assumptions: Why should the value specification of the feature symbol [taper] depend on that of the feature symbol [base] and not the other way round? And how should one account for the fact that the value symbol ⫺ for [base] must always be accompanied by the specification [flute: 20] whereas [base: ⫹] co-occurs with [flute: 24]? It would, of course, be easy to introduce a symbol designating a function which maps ⫺ to 20 and ⫹ to 24; but this would be a completely ad hoc definition since there is no intrinsic correspondence between the Boolean values and the numbers. A more adequate procedure would be the formulation of a feature co-occurrence restriction (FCR) of the type used in GPSG (cf. Gazdar, Klein, Pullum and Sag 1985: 27⫺29). A FCR is the statement of a relationship between the val-
53
2. Syntactics
ues of features within a feature structure and is formulated with the help of logical notation. In our case, we need the following FCR: (FCR1) [base: ⫹] ↔ [shaft: [flute: 24]] Instead of using a functional dependency in the case of [taper], we could adopt the (FCR2): (FCR2) [base: ⫹] ↔ [shaft: [taper: ⫺]] Two further biconditionals of this kind, which are also valid, are given below. (FCR3) is a logical consequence of (FCR1) and (FCR2) and thus may be omitted as redundant. (FCR4) states the above mentioned correspondence between positive value specifications for [decor] and [base]. (FCR3) [shaft: [taper: ⫺]] ↔ [shaft: [flute: 24]] (FCR4) [capital: [decor: ⫹]] ↔ [base: ⫹] The next FCR states that [decor] and [volut] share their value specification. (FCR5)
冋
capital:
冋
volut: 씲 1 decor: 씲 1
册册
5.2.2. Markedness There is another kind of restriction for feature structures which is motivated by the theory of markedness (cf. the contributions to Eckman, Moravcsik and Wirth 1986). Very often it is possible in linguistics to classify expressions (of various types, e. g., phonemes as well as morphemes, words, and constituents; cf. § 3.) into two groups ⫺ the group of the normal, typical, or paradigmatic items and the group of those which are remarkable, peculiar, or extraordinary in some respect. The members of the second group are then said to be “marked” for a special value of a particular feature (cf. Chomsky and Halle 1968: 405⫺407). Markedness theory goes back to the phonology of Trubezkoy (1929, 1939), in which the marked items are said to be “merkmalhaltig”, i. e., to be specified positively for a certain feature. Given a feature formalism, this is sometimes interpreted in such a way that the unmarked value of a feature is “⫺”. Following this interpretation we need only state those values in the feature description of an expression which are positive because they are the features for which the expression is marked. All other features are specified negatively. However, there is often no obvious reason to give one of the values a special status with respect to markedness, and this is especially true of features with non-Boolean
values. From a more general point of view, any statement about a feature structure which holds true for the normal cases is called a “feature specification default (FSD)” in GPSG (cf. Gazdar, Klein, Pullum, Sag 1985: 29⫺31). Let us again consider the example of columns. Two of the three types of columns have a base. Consequently, we adopt the following as a FSD: (FSD1) [base: ⫹] This means that we should normally find the feature specification above as a part of the feature symbol for a column. Furthermore, two of three orders do not require garlands of acanthus leaves in the capital. Thus one should expect the following as a part of a normal feature symbol: (FSD2) [capital: [acant: ⫺]], which implies that for the [acant]-feature the positive value is marked. Note that neither feature co-occurrence restrictions nor feature specification defaults have been newly invented by GPSG (or some other more recent approach in formal syntactics) but had been employed by old-fashioned transformational grammar (cf. Chomsky and Halle 1968). To transformationalists FCRs are known as “redundancy rules” and FSDs as “marking conventions”. What is new, however, is that these tools of syntactic description are embedded in a coherent formal theory of features and feature structures. Using FCRs and FSDs, we may considerably simplify our feature symbols. This is demonstrated by the three feature symbols below, which determine the column type in the three orders (as far as our analysis goes) and can therefore be used as lexical input in their syntactic descriptions: [base: ⫺] Doric
[capital: [acant: ⫺]] Corinthian
[] Ionic
The Ionic column is now described by the empty feature symbol [ ], which does not contain any feature specification! This extremely parsimonious description can be made more explicit in the following way: First, we use (FSD1) and (FSD2) to enrich [ ] with the unmarked specifications for [base] and [acant]. This yields the following structure:
冋
册
base: ⫹ capital: [acant: ⫺]
Given this structure, we use (FCR1) and (FCR2) to add the complete value specifica-
54
I. Systematik
tion for [shaft]. (FCR4) is employed to infer that [decor] is specified positively, which fact together with (FCR5) suffices to expand the substructure under [capital] with the positive value specification of both [decor] and [volut]. As a result we receive the category symbol (CC⬘) of § 5.2.1. above. In a sense, this presents the Ionic column as a column par excellence. Nothing special has to be said about it; it is not marked in any respect. This deserves some discussion which can only be carried through satisfactorily in the framework of a semiotic analysis of Classical architecture (cf. Art. 44 and 69). In the present context it should only be pointed out that one might well doubt whether the Ionic column is the least marked one of all three types. Admittedly, it has a somewhat intermediate status between the simple Doric column and the richly decorated Corinthian one. But should we not regard the Doric column in its classical modesty as the least marked case and the other two types as more special forms? This question aims at a crucial problem of markedness theory: What exactly is it that renders an item marked? We motivated the choice of our FSDs by frequency considerations, but the question now is whether this is really adequate. Note also that the status of the Ionic column would presumably have turned out to be different had we taken into account the Tuscan and the Composite orders. The suggestion that the Doric column should be considered the least marked column type indicates that other criteria than just probabilistic ones might be playing a role here; potentially relevant aspects would include perceptual, aesthetic and historical considerations, but such questions cannot be answered here. The completion of the structure for the Doric column is interesting for another reason. Since this structure must contain the specification [base: ⫺], (FSD1) cannot be applied here, whereas, of course, (FSD2) can and taken together with the lexical input it provides the following complex symbol:
冋
册
base: ⫺ capital: [acant: ⫺]
Now, since the value of [base] is negative, it is not positive (i. e.: ÿ [base: ⫹]); so by (FCR1) we conclude ÿ [shaft: [flute: 24]]. This leaves open two possibilities. Either, using graph terminology, there is no path [shaft: [flute]], or there is a path leading to a
node which is colored by a value which differs from the value symbol 24. (The path [f1: [f2: …: [fn]…] consists of n arcs which are colored with f1, f2, …, fn respectively; if the last arc of this path enters a leaf colored with v we express this by “[f1: [f2: …: [fn: v]…]”.) Assuming that each of our structures has a path [shaft: [flute]] and that the only possible value symbols for [flute] are 20 and 24, we infer that the Doric structure must contain the path [shaft: [flute: 24]]. By a similar reasoning, (FC3) then completes the complex value of [shaft] by adding the specification [taper: ⫹]. Note that again the feature co-occurrence restriction by itself does not suffice to reach the additional specifications: in addition we need the assumption that each of our structures has a [shaft: [taper]] path. The same assumption together with FCR4 adds [decor: ⫺] to the values of [capital]. Finally, (FCR5) requires that the just added negative value symbol of [decor] is also the value symbol of [volut]. This completes our description of the Doric column, yielding the following complex category symbol (DC):
(DC)
冤
base: ⫹ flute: 20 shaft: taper: ⫹
冋
册
冤
冥
volut: ⫺ 씲 1 capital: decor: 씲 1 acant: ⫺
冥
5.2.3. Unification Several times in building the complex structure designated by (DC) we relied upon the assumption that column structures are constructed in the same way; i. e., (i) that features defined for one structure also occur in the other structures and (ii) that there is a basic stock of possible values for each feature symbol which does not vary with the column structure in which the feature occurs. Correspondingly, all complex category symbols are built up with the same feature symbols. In other fields, however, it is sometimes natural to drop the assumption that all category symbols are similar in these ways. This leads to the use of different sorts of complex symbols which may not only differ with respect to their value symbols but also with respect to the feature symbols occurring in them. Examples for this have already been given with the grammars G4H and G5H in § 5.1.3. and § 5.1.4. There we distinguished several sorts of feature structures (cf. Pollard and Sag
55
2. Syntactics
Fig. 2.24
1987: 39⫺40, Smolka 1988 and 1989 as well as Carpenter 1992). Feature structures from different sorts need not contain specifications for the same feature, and, correspondingly, the complex category symbols are built up from different stocks of feature symbols for each sort. For instance, in G4H only structures from the sorts REL and OP contain specifications for the feature symbol [subcat], while only those of sort AUX may contain such a specification but need not do so. Sorts are marked by sort symbols in the complex feature symbols. Thus, a complex symbol which designates, e. g., a structure of sort REL contains the sort symbol REL as its part. Note that singleton symbols which designate ultimate values (i. e., values which are not complex feature structures) may be quite naturally considered as sort symbols. They designate sorts of simple structures for which no feature is defined. It seems natural to postulate that each such sort is exemplified by just one structure. In the formal apparatus of G4H we distinguished four sorts of complex structures, which are designated by the symbols REL, OP, CIPH and AUX, and five sorts of atomic structures, which are designated by the singleton symbols 0, 1, 2, ⫹ and ⫺. We may join the sorts REL, OP and CIPH to the more comprehensive sort DES of designators; designators are those expressions which have a designation (cf. Art. 3 § 2.). Furthermore, DES and AUX make up the sort EXP of expressions. If we now add a symbol T for the universal sort T and another symbol ⫺/ for the improper sort ⊥, which does not contain anything, we may view the collection of sort symbols as a lattice whose structure is pro-
vided by the Hasse diagram of Fig. 2.24; cf. Art. 3 § 4.4.1. and § 7. for the concepts from lattice theory. The ordering relation of this lattice of sort symbols is denoted by “ⱕ”; if S2 ⱕ S1, then the symbol S2 is said to be at most as specific as the symbol S1, conversely, S1 is said to subsume S2 or to be at most as general as S2. REL is at least as specific as EXP and therefore, since REL ⫽ EXP, REL is more specific than EXP. The symbol T is the most general and subsumes every feature symbol while ⫺/ is the most specific symbol subsumed by every other symbol. As a lattice ordering, the relation ⱕ is reflexive, antisymmetric and transitive. The fact that S2 ⱕ S1 is represented in the diagram through a path from the higher positioned S1 to the lower S2. The meet-operation in the lattice of sorts is called “greatest common subsort symbol (gcs)”. For sort symbols S1, S2, we may find gcs(S1, S2) by looking for the label of the highest node in the diagram which lies below the S1 and S2 nodes, and which may be reached from both these nodes by following the arcs of the Hasse graph. Thus, e. g., ⫺/ ⫽ gcs(REL, OP) and REL ⫽ gcs(REL, DES). In the intended model (cf. Art. 3, § 4.4.1.) of the feature formalism each sort symbol designates a sort of feature structures. We may simply identify such a sort with the set of structures exemplifying this sort. Then the universal sort T designated by T is the set of all feature structures, and the empty sort ⊥ designated by ⫺/ is the empty set. Singleton symbols are interpreted by singleton (i. e., one-membered) subsets of T, ⱕ corresponds to the subset relation (債) and the operation gcs corresponds to set intersection ( , cf.,
56
I. Systematik
e. g., Smolka 1988: 9 f). Thus the lattice represented by Fig. 2.24 corresponds to a sublattice of the power set of all feature structures. Starting with this interpretation of the sort symbols as the most simple of our feature symbols, we may assign to each complex feature symbol a subset of T as its designation. Above we often spoke of feature symbols as characterizing a unique feature structure, but clearly, unique characterization is only a borderline case. More often a feature symbol is only a partial characterization of feature structures, and now we may say that a feature symbol designates the set of those feature structures which are partially characterized by it. In fact we already employed this view when presenting our sample grammars G4H and G5H. The abbreviations introduced in Tab. 2.5 and Tab. 2.7 may be interpreted as standing for feature symbols which characterize classes of feature structures, e. g., instead of interpreting “S 1” of Tab. 2.5 as an abbreviation of a feature symbol which contains a variable (namely, the variable n), we may simply take it as an abbreviation for the following symbol (FS): (FS)
冋 册 REL bar: 1
The symbol (FS) characterizes feature structures containing [subcat: 1] as well as those containing [subcat: 2]. (Note that this re-interpretation requires a liberalization of the rules for constructing feature symbols for G4H, as they always require REL to co-occur with a [bar]- and a [subcat]-specification. Furthermore, the use of variables is essential for the above analysis of value sharing.) A symbol such as (FS) is then explicated in the derivation of a sentence by means of the rules (ID4) of G4H. The first two rules of (ID4) require that (FS) be combined with one of the specifications [subcat: 1] or [subcat: 2] depending on whether the head of the sentence is a unary relator (namely, EN) or a binary one (namely, ⫽). This kind of combination of feature symbols is known as “unification” (cf. Gazdar, Klein, Pullum and Sag 1985: 26 f, Shieber 1986, Pollard and Sag 1987: 35⫺38, Smolka 1988: 38 f). The unification of two feature symbols F1 and F2 is that symbol which designates the feature structures characterized by both F1 and F2. Clearly, if there is no feature structure characterized by F1 and by F2, the unification of these two symbols is ⫺/ . Unification becomes
particularly clear if we use graph notation. Consider the two graphs D1i and D2i below:
The two graphs D1i and D2i may be combined by making their common parts coincide. The resulting graph Di is their unification. As the reader will immediately verify, Di is exactly the (graph form of the) Ionic column’s feature symbol (IC).
(IC)
冤
base: ⫹ flute: 24 shaft: taper: ⫺
冋
册
冤
冥
volut: ⫹ 씲 1 capital: decor: 씲 1 acant: ⫹
冥
Non-trivial unification is only possible when the features which are to be combined are compatible, i. e., common paths must have identical continuations (or lead to identically colored leaves). As stated above, the unification of incompatible symbols yields ⫺/ as its trivial result. Historically, Kay’s Functional Unification Grammar (FUG) seems to have used unification in an extensive and systematic manner for the first time (cf., e. g., the exposition in Kay 1985, where reference is given to Kay’s earlier work, as well as Bresnan and Kaplan 1982). As might be evident from the examples discussed, unification is a very powerful tool of syntactic description (and its use is by no means confined to syntactics). Some syntac-
2. Syntactics
tic structures, however, seem to require even more efficient tools. Consequently, one of the main endeavors in the theory of syntactic features is to enrich the lattice of feature structures by additional operations. One such operation which is of special importance in order to express negative information is complementation, which indicates that a feature does not have a value of a certain kind (cf. Moshier and Rounds 1987, Johnson 1988, Smolka 1988, 1989). Several further tools are added to the usual feature formalism by HPSG (cf. Pollard and Sag 1987: ch. 2). This syntactic theory is also noteworthy for its application of the thus enriched feature formalism. All aspects of a linguistic unit ⫺ those which relate to its form as well as those which pertain to its content ⫺ are described in one and the same feature structure. In doing so, Pollard and Sag refer to Saussure (1916) and accordingly call the sort of feature structures ascribed to linguistic units “SIGN”. We conclude this section with the remark that the theory of syntactic features has made considerable progress through its elaboration in the framework of logic. In contrast to earlier approaches, feature structures are strictly distinguished from their semiotic representation. Formal languages are developed for the description of feature structures, and these languages are then interpreted in the way described in Art. 3 § 4. so that feature structures (or sets of such structures) become their models. This way of viewing of the matter is due especially to the work of Johnson (1988) and Smolka (1988 and 1989). 5.3. The direct formation of structure trees Given a complex expression of a natural language, most linguists assume two kinds of syntactic structure (cf. § 3. above). Syntagmatic structure is based on the contiguity relations between the various items of the complex expression. Paradigmatic structure is based on the equivalence relations between each item of the complex expression and other items that could take its place within this expression without changing its wellformedness. A third kind of structure can be defined by constructing paradigms of syntagms for the items of the complex expression under investigation. These form a hierarchical structure which groups the items of the complex expression into larger constituents; it is called “constituent structure” (for classical treatments of this concept cf. Bloomfield 1933 and Wells 1947).
57 Each constituent structure can be depicted in a tree diagram which represents the relationship between the constituents. Using the graph-theoretic terminology introduced in § 5.1.3., we can define a tree as a directed rooted graph, each node of which is entered by not more than one arc. Seen in this way, constituent structure has been studied in a rather indirect manner in traditional linguistics: Languages are considered as string codes and analyzed by means of string production grammars (cf. § 4.2.⫺4.7.). Each string production grammar G aims at characterizing the well-formed strings of a language L as a subset of all possible linear arrangements of syntactic items. This is achieved via the derivations of G: all and only the well-formed strings of L over the terminal vocabulary V should be derivable in G (cf. § 4.4.). The constituent structures of these strings are constructed only as by-products of their derivations. In order to assign a string l its constituent structure one projects onto l its derivational history in G (cf. § 4.9. for details). If constituency is a central notion in syntactics, it should be possible to study it in a more direct way without tying it to derivational history and syntagmatic contiguity. This is why most recent theories in formal syntactics approach hierarchical structure separately from linear order (cf., e. g., the distinction between immediate dominance rules ⫺ ID-rules ⫺ and linear precedence rules ⫺ LP-rules ⫺ in GPSG, see § 5.1.3.). Let us now introduce some technical means to provide an even more direct access to hierarchical structure. Note that tree structures are by no means limited to language codes. As examples for tree structures in music consider the diagram by Wankmüller (1987: 583) which (partially) represents the structure of a classical sonata (cf. Fig. 2.25) and the diagram by Lerdal and Jackendoff (1983: 144) which specifies the time-span reduction for Johann Sebastian Bach’s chorale O Haupt voll Blut und Wunden (cf. Fig. 2.26). The derivations in a string production grammar proceed by means of rewrite rules. In the case of context-sensitive grammars they take the form A → v / a1 a2, where A is an item of the non-terminal vocabulary VNT, v is a non-empty string of terminal and/ or non-terminal symbols (i. e., v 苸 S(VNT ∪ VT)), and a1, a2 are possibly empty strings of the same kind (i. e., a1, a2 苸 S⬘(VNT ∪ VT)); cf. § 4.7. Context-free grammars (cf. § 4.6.) only admit rules where a1 and a2 are empty.
58
I. Systematik
Fig. 2.25
Now instead of using such rewrite rules in order to form strings which are then assigned constituent structures, one could utilize them directly as norms regarding the well-formedness of trees. These rules then play the role of so-called “node admissability conditions”. This notion goes back to McCawley (1967), who considers the base component of a transformational grammar to be a set of colored trees instead of a rule system generating such trees. The members of this set, however, have to fulfil certain conditions which can be stated by means of the former rewrite rules. Peters and Ritchie (1969) elaborated McCawley’s idea, and it was later incorporated into GPSG (cf. Gazdar, Klein, Pullum and Sag 1985: 99⫺105). The results of Peters and Ritchie have been generalized in joint work by Joshi and Levy (1982), whose work is presented in what follows. We first explain the notion of a proper analysis of a colored tree d. Intuitively, a proper analysis is just a cut through a tree which crosses all of its paths (cf. § 4.10.). If k is a node of d, then every proper analysis of d cuts a path on which k lies. (Note that normally there are several paths that go through k.) Formally, this notion is defined by induction in the following way: (1) If d is the empty tree q, then the empty set Ø is the set P(q) of all proper analyses of q. (2) If d is the tree [d1…dm]A (where A is a non-terminal symbol), then P(d) ⫽ {A} ∪ P(d1)*…*P(dm) (where M*N is the set of strings whose heads come from M and whose tails come from N). As an example consider Fig. 2.27, which represents a parsing treethat G4H (cf. § 5.1.3.) assigns to the term 16 (this is the right subtree of the derivation tree shown in Fig. 2.18).
The dotted lines in Fig. 2.27 depict three of 0 2 the 1nineteen possible proper analyses: Z Z , 2 Z E , and 16. The nineteen proper analyses of the parsing tree of Fig. 2.27 are: {Z 1, Z 0Z 2, Z 0Z 1E 2, Z 0Z 1E 1, Z 0Z1E 0, Z 0Z 16, 0 2 0 1 0 0 0 2 Z , Z , Z 1E , Z Z 1E 2, 1E 1E 16, Z ,1 1 1 1 0 1 2 Z E , Z E , Z 6, 1E , 1E , 1E 0, 16}. Given a colored tree d, a node of d colored with A, and a context-sensitive rule A → v / a1 a2, we then say that “the rule holds for the node” if (1) the nodes immediately dominated by the node are each colored with a symbol from the string v and (2) there is a proper analysis b1a1Aa2b2 in P(d) for b1, b2 苸 S(VNT ∪ VT). The context a1 a2 of the rule is now called “a proper analysis predicate”. In the tree of Fig. 2.27, for instance, the rule Z 2 → Z 1E 2 / Z 0 holds for the right daughter of the root. One might think that a language which is determined by trees satisfying proper analysis predicates must be context-sensitive because the rules employed in analyzing trees are context-sensitive. Surprisingly, this is not the case. Such a language is still context-free. We may even allow Boolean combinations of proper analysis predicates and include so-called “domination predicates” without leaving the realm of the context-free (cf. Joshi and Levy 1982: 4, Theorem 3.1). A domination predicate DOM(g1 g2) may be viewed as the vertical analogue of a proper analysis predicate. It holds for a node colored with A if there is a path from the root through A to the terminal string which has the form b1g1Ag2b2 (where b1 and b2 may be void). Node admissibility conditions are rules for checking trees, and as such they presuppose that trees are available which can be checked.
2. Syntactics
59
Fig. 2.26
We may ask how these trees are to be constructed. One answer to this question is given by means of tree adjunct (or tree adjoining) grammars (TAGs), which were developed by Joshi and his colleagues (cf. Joshi and Levy 1975, Joshi 1985 as well as Weir 1988). Similar work has been done in computer science, and this proved to be a source of inspiration for Joshi (cf. Thatcher 1967, Brainerd 1969, Rounds 1970 and Dilger 1982). TAGs originate with Joshi’s attempt to formalize the string analysis and transformational theory of Harris (cf. Harris 1962 and 1970). Harris
started with a small collection of very primitive sentence forms, the so-called “center strings”, into which adjunct strings may be inserted at certain adjunction points. Since the adjunct strings themselves may have adjunction points, the insertion may be repeated in a recursive manner. Obviously, this kind of syntactic analysis concentrates exclusively on what may be called “head-modifier relationships” (in view of § 5.1.3.). The relationship between head and argument is either an internal matter of the center string and the adjunct strings or is neglected. If a complex
60
Fig. 2.27
string (e. g., a sentence) is embedded as an argument into another string, the matrix string, one would not consider the whole construction as a simple center string. Furthermore, the relationships between atomic components of the matrix string and those of the embedded string are of a quite different kind to those between items within the matrix string or those between items of the embedded string. Conversely, a complex argument cannot be regarded as an adjunct of any element of the matrix string into which it is embedded. Thus grammatical theories such as string analysis which concentrate on adjunction have problems with certain kinds of arguments. Traditional phrase structure approaches, on the other hand, (including the Standard Theory of Transformational Grammar with its base component) may deal with argument structure easily but have difficulties with adjuncts. These frameworks cannot, for example, distinguish between a relative clause (adjunct to a head noun) and a sentential object. Joshi tries to combine the merits of string analysis and phrase structure grammar in the notion of a “Mixed Adjunct Grammar (MAG)” which allows for both the adjunction operation of string analysis and the replacement rules of phrase structure grammar. MAGs could even be refined by adding transformation rules of various kinds; cf. Joshi (1972) and Sager (1981) for an application of such a framework. In admitting phrase structure rules besides adjunction, Joshi assigns a vertical structure to the initially merely horizontal strings. It was therefore only consistent of him to generalize the domain of the adjunction opera-
I. Systematik
tion from strings to trees (cf. Joshi, Levy and Takahashi 1975). This generalization allowed a unified treatment of adjunction and replacement operations and made the use of transformations superfluous. A tree adjunct grammar, then, is a pair G ⫽ *I, A+ consisting of a set I of initial trees (Joshi 1985: 211) ⫺ in Joshi, Levy and Takahashi (1975: 139) they are still called “center trees” ⫺ and a set A of auxiliary trees (Joshi 1985: 211); these are the “adjunct trees” of Joshi, Levy and Takahashi (1975: 139). An initial tree has its leaves colored with terminal symbols only; its root is colored with the start symbol. An auxiliary tree also has its leaves colored with terminal symbols, with one distinguished exception: the so-called “foot node”, which has the same color as its root. Thus an auxiliary tree looks like d0 below. (d0)
X
X
Now let d1 be a tree with a node n which is colored with X and let d2 be the subtree of d1 whose root is n. Then d0 is adjoined to d1 at node n by ways of excising d2, then inserting d0 at the node n, and finally placing the excised d2 at the foot node of d0. Let us illustrate the procedure of a TAG with the example of our arithmetical code (cf. § 5). The tree adjunct grammar G6H ⫽ *I6H, A6H+ is based on the same terminal vocabulary as our grammar G4H (cf. § 5.1.3.), but as non-terminal symbols we replace the complex symbols of this grammar with S (sentences), Z (terms), F (operators), R (relators), P (parentheses), N and M. The symbols N and M are used in the same sense as in the grammar G1H; cf. § 4.4. The set IH of initial trees of our TAG G6H comprises the trees of the forms shown in Fig. 2.28, where d1 and d are digits of category N (cf. § 4.4.). In addition, there are three kinds of auxiliary trees in A6H. Trees of the first kind have foot nodes N as shown in Fig. 2.29, where d1 is now a digit from category M. Trees of the other two kinds have foot nodes Z, as in Fig. 2.30, where in the right diagram 쑗 is a binary relator (i. e., ⫹, ⫺, ⫻, or :). The sentence (2 ⫹ 2) ⫽ 16, whose parsing trees in G4H and G5H are provided by Fig. 2.18 and Fig. 2.12, is now reached by
61
2. Syntactics
Fig. 2.28
N N
M d1
Fig. 2.29
Fig. 2.30
three adjunctions as shown in Fig. 2.31⫺ Fig. 2.33. In these diagrams we use 丣 as adjunction operator and mark the node where the adjunction takes place by a box. In a TAG there is no tree-building operation other than adjunction. As already pointed out, the application of this operation presupposes that there are already trees with some degree of complexity to be combined. Therefore the question arises whether one can give a still more direct account of trees which neither restricts the range of tree operations nor presupposes more than the most primitive trees consisting only of roots. Before we turn to such a direct syntactic construction of trees, let us again have a look at the syntagmatic continguity relation. The theory of concatenation was formally developed by Hermes in his classical booklet of 1938. However, Hermes did not start with concatenation but took a whole family of operations as basic instead: one for each atomic
symbol of the code under investigation. This procedure is exemplified in the analysis of Roman numerals in Art. 3 § 2. Corresponding, for instance, to the digit I there is the operation JI of adjoining I to the right of a numeral string; corresponding to V there is the operation JV of right-adjoining this digit, etc. Each Roman numeral can be constructed by means of these operations, starting from the empty word L. E. g., IV is JV(JI(L)) and VII is JI(JI(JV(L))). Concatenation is shown by Hermes (1938: 14⫺15) to be definable on the basis of such operations which adjoin just one syntactic atom. At first sight, this procedure seems to be a rather silly way of characterizing the class of strings that can be formed over a set of basic symbols. Nevertheless, there are several advantages connected with it. One is that it emphasizes the parallel between the semiotic theory of strings and arithmetics. Another advantage is that, in contrast to concatenation, the adjoining operations admit a unique syntactic analysis of strings, which is crucial for the procedure of semantic interpretation outlined in Art. 3 § 2. The empty word L plays a role similar to the number nought in arithmetic. But in contrast to arithmetic, where we have just one successor operation (which yields the successor m ⫹ 1 from its predecessor m), there are several such operations in the semiotic theory of syntagmatic order ⫺ namely the operations which adjoin the basic symbols. Thus Hermes’ procedure reveals that this theory is a kind of generalized arithmetic (cf. Hermes 1938: 9). Ordinary arithmetic is that special case of its semiotic counterpart in which there is just one successor operation (cf. also Quine 1946). Now let us go a step further in generalizing. There are just one minimal element and one unary successor operation in ordinary arithmetic and there are several minimal elements and several unary successor operations in the theory of syntagmatic order. What about having several starting elements and several n-ary (n ⱖ 1) operations? This generalization provides us with the notions of a ranked alphabet and a term algebra (Mahn 1965: § 1, Engelberg 1980: 16⫺20). A ranked alphabet assigns to each of its items a nonnegative number (0, 1, …) as its rank. Simple expressions of rank 0 are the terminal elements or basic terms. They are the “noughts” of our generalized arithmetic or ⫺ using tree terminology ⫺ the trees which only consist of
62
I. Systematik
S
+
Z
=
S Z
Z
R
N 2
Z
P
Z
N =
F
Z
P
P
N
1
(
Z
F
N
2
+
)
(
2
R Z
Z
P
N
N +
2
)
=
1
Fig. 2.31
S
+
Z P
Z
F
N (
2
R Z
P
Z
Z F
N
= Z
Z P
N +
2
S
Z
F
N )
=
1
√
(
2
R Z
P
Z F
N +
2
Z N
)
= √
1
Fig. 2.32
Fig. 2.33
a root (without any arcs). A non-terminal A of rank rA gives rise to an rA-ary successor operation NrA which assigns to rA terms y1, …, yrA the complex term (A(y1, …, yrA) as
their A-successor. This may be depicted as in Fig. 2.34. A tree being a term and a terminal element being a basic term, a tree behaves just like
63
2. Syntactics
Fig. 2.34
an ordinary terminal element in view of the successor functions. We therefore have the possibility of constructing trees of any complexity (height and branching structure) from primitive trees of height one (which only consist of a root). In order to illustrate these considerations with an example, we assign the following ranks to the symbols we used above in G6H for the analysis of our arithmetical code: (1) The terminal elements 0, 1, …, 9, ), (, , ⫹, ⫺, ⫻, ⫽, and EN are of rank 0. (2) M, N, F, R, and P are of rank 1. (3) Instead of the single symbol S, we now have two symbols S2 and S3 of ranks 2 and 3 respectively. Similarly instead of the single Z we have now Z1, Z2 and Z5 of the ranks indicated by their subscripts. This classification suffices to construct the following seven trees of height 2.
Fig. 2.35
Taking into account the classification of Z1, Z5 and S3, we may use these trees to successively construct the tree of Fig. 2.36, which is of height 5. Obviously, assigning ranks to terminal and non-terminal elements in the above way is not sufficient for the characterization of the well-formed trees of our arithmetic code. Since, for instance, N is simply said to be of rank 1, a tree consisting of a root colored with N which dominates just one leaf with the color is not yet excluded as ill-formed so far. In order to achieve that, we have to define special functions mapping trees onto yet other trees. Let, e. g., fN be a function which maps an argument tree consisting only of a root colored with either 1, 2, …, or 9 to the tree consisting of a root colored with N and having the single colored node of the ar-
Fig. 2.36
gument tree as its sole daughter. (For definiteness, we might postulate fN to assign the empty tree q to other arguments.) Then the well-formed trees with roots colored with N are just the values of the function fN. The other non-terminal elements may also be treated in this way. At first glance, the need for functions such as fN may look like a further unwelcome complication, but note that it makes possible a very direct approach to the question of syntactic complexity. We have seen that the unrestricted construction of trees involves a generalization of arithmetic. Before discussing syntactic complexity, let us therefore have a look at the complexity of computational tasks in arithmetic. There is one basic distinction within the realm of such tasks: some tasks are easy in the sense that they may be executed by means of a (sometimes awkward but nevertheless mechanical) procedure which yields a definite solution. A simple example of such a task is the addition of two numbers, another more complicated example is the task of computing all the prime factors of a given number (cf. Art. 26). The procedures which are used in solving such (easy) tasks are known as algorithms (cf. Rogers 1967: 1⫺5, Hermes 1961: ch. 1 and Davis 1958: § 1). On the other hand, there are tasks for which not only no algorithm is known but which can be proved to be unsolvable in an algorithmic manner. Examples of such problems are naturally rather complicated and are not given here for this reason; the interested reader should consult the books cited above as well as Art. 78. Now, algorithms have been described above only as mechanical procedures for the answering of questions within a finite timespan. Admittedly, this is not a strict defi-
64
I. Systematik
nition but only a rough description. Although the notion of an algorithm has been known for a very long time, formal explications for it were not formulated until the 1930s and 1940s. One such explication is provided by recursive function theory, which grew out of the metamathematical work of Herbrand (1931) and Gödel (1931). Roughly speaking (and thus grossly oversimplifying the matter), a recursive function is a function whose value for a given argument can be computed by means of an algorithm. This explains recursiveness in terms of algorithms; but Herbrand and Gödel demonstrated how to characterize recursive functions in a purely formal manner without recourse to any notion of algorithm. Thus the special arithmetic concept of a recursive function provides us also with a notion of an algorithm for other areas if we can translate the problems of these areas into arithmetic questions via coding. Such codings are known as “Gödel numberings” or “Gödelizations” (cf. Hermes 1961: 4 and Davis 1958: 56⫺59). The expressions of our arithmetic code may, for instance, be gödelized by recording them in the following way. First, we assign numbers to the basic symbols as shown in Tab. 2.8: Tab. 2.8 0 0 10
1 1
2 2
3 3
4 4
5 5
6 6
⫹ 11
⫺ 12
⫻ 13
: 14
EN ⫽ 15 16
7 7
8 8
( 17
) 18
9 9
Then a string s ⫽ z1z2 … zm consisting of m basic expressions z1, z2, …, zm with the respective code numbers C(z1), C(z2), …, C(zm) is coded as the product C(z) 1)pC(z2) … pC(zm) where p , p , …, p ⫽ pC(z 1 2 m 1 2 m are the first m prime numbers. For instance, the expression (2 ⫹ 7) is now coded as 217 · 32 · 511 · 77 · 1118. On this basis semiotic tasks relating to our arithmetic code can be treated as special arithmetic tasks. The task of constructing the term (e1 ⫹ e2) is a very simple example of this. We might say that there is an algorithm for solving this task, which can be described with the following list of instructions: (1) Write down a left bracket. (2) Then write down the first input expression e1. (3) Then add the sign ⫹. (4) Write down the second input expression e2. (5) Finish by adding a right bracket. Given Herbrand and Gödel’s explication of the concept of an algo-
rithm, we may now ask whether the binary arithmetic function f which corresponds to this procedure is a recursive one. This function f, the definition of which is too complicated to he stated were, is indeed recursive. As we said above, the distinction between recursive (algorithmically solvable) questions and non-recursive questions is a basic one. Building on this distinction, the set of recursive functions can be further subdivided according to the complexity of computation which is necessary for determining their values for given arguments. A very important proper subclass of the set of recursive functions are the primitive recursive functions. The values of such functions are more easily computable than those of functions which are recursive but not primitive recursive functions. The primitive recursive functions can thus be classified into classes of different degrees of subrecursiveness; the mathematical theory of such a classification is dealt with, e. g., by Rose (1984). Now the primitive recursive functions are those functions which can be defined in terms of the successor function and certain very simple functions of a combinatorial character (such as the functions assigning constant values to their values), as well as by functional composition and a certain definitional scheme which is called “primitive recursion”; (cf. Rose 1984: 10). Since tree formation is a generalization of arithmetic, we may also generalize the notions of primitive recursiveness and of degrees of subrecursiveness to take them from number arithmetic to tree arithmetic. This enables us to deal very directly with matters of complexity of algorithms for manipulating trees without the detour of Gödelization (cf. the work by Engelberg 1980). That the notions reached by generalization from numbers to trees indeed coincide with those reached by the indirect method of Gödelization is demonstrated by Mahn (1965). Given the ease and velocity with which sign users manipulate complex expressions, it seems to be a reasonable hypothesis that the syntactic operations employed are at most recursive. In particular, it is almost generally assumed that the class of well-formed expressions of a code (whether strings or trees or other configurations) is a decidable subclass of the set of all possible expressions of that code (i. e., all expressions that can be formed with the basic syntactic operations without taking care of the syntactic rules). A set is
2. Syntactics
decidable if there is an algorithm for testing membership in that set. Given the concept of a recursive function, we can define a decidable set to be one with a recursive characteristic function. (The characteristic function of a set assigns the value 1 to its members and 0 to its non-members.) The most noteworthy exception to the general agreement that the well-formedness of expressions is a decidable question is Hintikka (1975), who claims in his famous any-thesis that well-formedness is undecidable for natural languages such as English (but cf. also Hiz˙ 1968). There is another approach to study questions of complexity in formal syntactics which uses the concepts of automata theory instead of those from recursive function theory. This approach is based on Turing’s (1936) explication of the notion of an algorithm by means of Turing machines. The basic results of this approach have already been presented in § 4.3. above. Turing-computable functions (i. e., functions which may be computed by a Turing machine) are recursive and vice versa; thus Turing’s explication of the notion of an algorithm coincides with that of Herbrand and Gödel (cf. the proofs in Rogers 1967, Hermes 1961, Davis 1958). ⫺ Let us conclude this section with the remark that in automata theory a generalization from string processing to tree processing machines has been developed which parallels the above described generalization from number to tree arithmetic (cf. Levy 1972, Thatcher 1973). 5.4. Multi-dimensional sign systems and graph grammars String and tree structures are useful tools in the linguistic analysis of natural language expressions but they certainly do not suffice if we study the signs of other codes. Non-linguistic signs often have structures which obviously do not belong to the linear types of strings or the branching types of trees. Even in linguistics the structure trees of certain expression are sometimes adorned with additional arcs in order to point out special relationships between the nodes they link (cf. Karttunen 1981 and Joshi 1985: § 2). Strictly speaking, trees with additional links are no trees anymore but graphs of a more general kind. Non-linear and non-tree-like syntactic structures occur, e. g., in drawings, pictograms, pictures, maps and scores, in the spatial and tactile patterns of perception as well as in the morphological patterns of biology
65 and in the fixed action patterns (FAP) of ethology. Various disciplines have developed attempts to deal with these phenomena and to give a satisfactory description and explanation of their syntactic aspects, and such attempts have often been generalized beyond the border of the respective discipline. Thus there have been projects for a general morphology and theory of morphogenesis (which can be traced back to classical biological works such as that of Haeckel 1866 and Thompson 1917 ⫽ 1961), or for a general gestalt theory (which originates with gestalt psychology; cf. Köhler 1920). Comparable approaches in more recent times are catastrophe theory as developed by Thom and Petitot-Cocorda (cf. Thom 1972 and 1980, Petitot-Cocorda 1985 a, b, and Wildgen 1982), chaos theory and fractal geometry as developed by Mandelbrot (cf. Mandelbrot 1982, Edgar 1990, Falconer 1990 and Zeitler and Neidhardt 1993), and the theory of synergetics of Haken (cf. Haken and Haken-Krell 1989 for a general introduction and a biological application). Some of these approaches are dealt with in Chapter XIII of this Handbook (cf. especially Art. 127⫺131). An ambitious and mathematically sophisticated pattern theory has been developed by Ulf Grenander and his group at Brown University (Providence RI; cf. Grenander 1976⫺1981 and Grenander 1994). Furthermore, the need to construct automata which are able to react to sensory input patterns and to process pictorial information has led to a special branch of computer science which deals with patterns and pattern recognition (for the cases of vision and spatial patterns cf. the well-known 1982 book by Marr and his survey article from the same year as well as Alexandrov and Gorsky 1993; for a more general account cf. Niemann 1983). Since we have a rather good understanding of string structure, there are two obvious strategies in dealing with more complex syntactic patterns: reduction and generalization (cf. § 4.1. above). An instance of the reductive strategy is recoding. In analyzing a pattern which is not string-like, we may try to recode it by means of strings. This approach is exemplified by the analysis of line drawings given in Suppes and Rottmayer (1974). The data analyzed by Suppes and Rottmayer (1974: 350) consist of simple drawings like the one in Fig. 2.37. A line segment in a drawing is recoded as a sequence of the names of points lying on it.
66
Fig. 2.37
At least the first and last points of a line segment must be indicated. Thus the long horizontal segment in the drawing of Fig. 2.37 is coded by the name string ABCDE. The complete drawing is represented by a string of such name strings where neighboring name strings are separated by a comma. The drawing in Fig. 2.37 can be represented by ABCDE, AG, BF, GCH, HD (as well as by, e. g., AG, GCH, HD, ABCDE, BF). Of course, not every string of capital letters and commas is a recoding of a possible drawing; some are only combinatorial artifacts which represent geometrically impossible constellations (or: only pretend to recode a drawing). Suppes and Rottmayer (1974: 351) therefore provide three additional criteria for a name string to be a proper recoding of a line drawing. On the basis of this approach, we may now use geometric properties to characterize a class of the line drawings in which we are specially interested. These we consider as the class of well-formed elements of our pictorial code. For instance, we may be interested in those drawings in which it is always possible to reach a certain segment from a given one by traveling along segments of the drawings. Such drawings are called “connected”. The drawing in Fig. 2.37 is an example for connectedness. The simplest example of a nonconnected drawing consists of two segments without a shared point (encoded, e. g., by AB, CD). A representation is called “connected” if the drawing represented by it is connected. We may now ask for an automaton which accepts the connected representations as wellformed and rejects the non-connected ones as ill-formed. Suppes and Rottmayer (1974: 351) state that the connected representations are Turing-computable and this implies that there is a string production grammar for them. Thus the recoding system of connected line drawings is describable by means of a string production grammar. The same is true, e. g., for the system of polygons (cf. Suppes and Rottmayer 1974: 352).
I. Systematik
Nevertheless this method of analysis is severely restricted. One of its limitations is that it cannot distinguish convex from concave line drawings (cf. Fig. 2.38). This is simply due to the fact that the relevant information is lost in coding; thus, e. g., the two drawings in Fig. 2.38 have the same encoding AB, BC, CD, DE, EA (cf. Suppes and Rottmayer 1974: 352). This is an example of a crucial disadvantage of all recoding-approaches: There may always be properties lost in recoding. To make up for this loss in our example, we might insert numerals into the name strings in order to indicate angles of different degrees. But if we really want to apply an approach like the one sketched, we should clarify in advance which structural properties of the patterns to be studied are so essential that they should be preserved in the recoding. This presupposes that we have intuitions about the syntactic properties of these patterns. It therefore seems appropriate to look for a direct account of these intuitions. In the strategy of generalizing the syntactic concepts of string theory to the non-linear case, one obvious option is to assume more than one type of syntagmatic relation within a complex sign. Line drawings, for example, have not only a horizontal dimension but also a vertical one. This kind of approach is used in early work on pattern recognition, such as in Eden’s approach to handwriting and in Narasimhan’s syntactic theory of pictures (cf. Eden 1961 and 1962 as well as Narasimhan 1964 and 1966). A syntactic analysis of the print letters of standard German which follows this idea is given by Althaus (1973 ⫽ 1980). The syntactic items are called “GDMs” (“graphisch distinktive Merkmale”, ‘graphically distinctive features’) by Althaus; they are given in the following sequence: |, /, \, ⫺, O, (, ), Ó, ˛, ∩, ˙, ¨. This sequence of GDMs is numbered from 1 (for |) to 12 (for ¨). Each GDM may be placed within one of seven numbered cells of different size, which are called “Schreibräume” (‘writing spaces’) by Althaus and which subdivide the line on which letters are placed along the vertical axis. These cells are shown in Fig. 2.39. Let us call a GDM located in one of the seven cells “a figure”. Obviously, figures invite feature descriptions (cf. § 4.2.). Each figure can be described by means of a feature symbol specifying its GDM and another one stating the cell. As feature descriptions Althaus uses numerals with exponents n m where
67
2. Syntactics
Fig. 2.38
1
2
3
4
5
6
7
Fig. 2.39
n specifies the GDM and m the cell. The letter “F”, for example, is composed of the three figures given in Fig. 2.40:
Fig. 2.40
We cannot simply concatenate the GDMs, however, since this would result in the following configuration:
Fig. 2.41
So besides the syntagmatic relation of linear precedence, which Althaus denotes by an arrow “←”, he introduces as a second syntag-
matic relation that of vertical precedence, which is denoted by “↑”. Now the letter “F” is described by the formula “1 6 ← 4 1 ↑ 4 5”. As is evident from the work of Shaw (1969), this rather structuralist analysis may easily be extended to a string production grammar approach (cf. also Suppes and Rottmayer 1974: 354⫺356). Let us first redefine the relation “⇒G” of immediate derivability in a string production grammar G (we suppress the subscript “G” in the following; cf. § 4.4.)! The old definition explains the derivability relation ⇒ in terms of substitution into linear structures built up by concatenation. Now we admit structures which may be ordered with respect to several dimensions. Of course, rewrite rules must also be generalized in this way. If we have a rule X → YZ, which admits replacing an occurrence of X by the concatenation of Y and Z, we now have to state what type of combination of Y and Z (concatenation or another mode of combination) is allowed to replace occurrences of X. Shaw (1969) describes letter shapes and uses graphical items which are similar to the GDMs of Althaus (1973 ⫽ 1980), but unlike Althaus he assigns a direction to his graphical items, e. g., the vertical stroke is directed upwards, its bottom point is its tail and its top point its head; the tail of the horizontal stroke is its leftmost point and the head its rightmost one, as in | ↑ and 哫
68
I. Systematik
Fig. 2.42
The use of directions enables Shaw to do away with cells. Instead of simple concatenation, we now have several operations which are defined in terms of direction (tail, head) and the operation of identifying points of graphic elements: we shall designate the latter operation by “丢”. Then we may define the operations ⫹ by g1 ⫹ g2 ⫽ head(g1) 丢 tail(g2) and ⫻ by g1 ⫻ g2 ⫽ tail(g1) 丢 head(g2). Combinations of atomic elements inherit their heads and tails from their components. For instance, we have ⫽ | ⫹ ⫺, where the tail of |, which is the bottom point of , is the tail of the complex figure, and the head of ⫺, which is the rightmost point of ⫺, is its head. The letter “F” may now be generated by means of the context-free rule system (L1⫺3). (L1) S → (S ⫹ S) (L2) S → (S ⫻ S) (L3) |, ⫺ ← S The following is an example of a derivation yielding “F”: S (S⫹ S) (| ⫹ (S ⫻ S)) (| ⫹ (S ⫻ ⫺)) (| ⫹ ((S ⫹ S) ⫻ ⫺)) (| ⫹ ((| ⫹ S) ⫻ ⫺)) (| ⫹ ((| ⫹ ⫺) ⫻ ⫺)) (| ⫹ ( ⫻ ⫺)) (| ⫹ | )) (F) F For a more comprehensive approach to the syntactic characterization of capital letters, cf. Watt (1975⫺1988). In graph grammars (cf. Ehrig 1979, 1987 and Nagl 1979) the basic concepts of string theory are generalized in another way. Instead of admitting several syntagmatic operations to form non-linear expressions, we assume only a simple one but allow it to be more complex than in the case of strings. Let us begin our explanation of this approach again with a closer look at strings and the
relation of linear precedence between their atomic components. This precedence relation in strings is a projection from the temporal order of the physical production of the string tokens concerned. In representing a temporally extended sign event by a string, one abstracts from the duration of the minimal segments of the event. Consider the case of a sound event (an utterance, for instance) as an example. When we represent this event by means of a string of phonemes, these phonemes are treated as durationless atoms, which are ordered by syntagmatic precedence. If we want to remove this idealization, we must say that a syntactic item such as a phoneme consists of a left border, a characteristic content, and a right border. Pairs of adjoined items share one border. Instead of a string U V W X Y Z we thus have a structure like |U|V|W|X|Y|Z| where the strokes indicate borders and the capital letters contents which are enclosed between borders. Such a structure may be viewed as a very simple colored graph. The borders are its nodes, which are not colored here, and the capital letters are the colors of the arcs. The diagram g1 makes evident the graph character of the structure |U|V|W|X|Y|Z|. Given a graph such as g1, how do we have to modify the rewrite rules in order to account for it? The first change we make is merely notational. Since we want to save the arrow (→) for a later purpose, we shall write “(P, Q)” instead of “P → Q”. Let us assume now that we have a rewrite rule (W, ST) and the corresponding instance UVWXYZ ⇒ UVSTXYZ of a direct derivation; cf. § 4.4. ST corresponds to a graph b2 which is as simple as g1 above (cf. Fig. 2.43).
S (‚2)
o k20
Fig. 2.43
T
o
o
k21
k22
69
2. Syntactics
Given graphs instead of strings, we now have to substitute arcs for string elements. The subgraph b1 in g1, consisting of the arc colored with W which leaves k2 and enters k3, must be replaced by b2, thus transforming g1 into g2. How can this be achieved? The first step is to cut out in g1 the arc leading from k2 to k3; this results in a disconnected graph x which consists of two separated subgraphs. Of course, x is the graph counterpart of the string context UV XYZ and we therefore call x “a context”. Analogously, b1 and b2 correspond to the left and right side of a rewrite rule and thus these graphs will be called “left side” and “right side”, respectively. Now, the second step on our way from g1 to g2 (after the excision of the left side b1 from g1 which resulted in the context x) is to add the right side b2 to the context. The resulting graph is x ⫹ b2. The operation ⫹, which is known as “disjoint union”, resembles the union (∪) in set theory except that it dissimilates elements shared by the summands. The reason for using disjoint union instead of the simple union of set theory becomes clear in our last step towards the construction of g2. Note that the graph x ⫹ b2 contains the nodes k2 and k3 from the context x as well as the nodes k20, k21, and k22 from the right side. But, clearly, for g2 we want an arc colored by S which leaves k2 and
Fig. 2.44
enters k21 as well as an arc colored by T which leaves k21 and enters k3. Thus we must identify the node k20 with the node k2 and the node k22 with the node k3 in x ⫹ b2. In this way, the nodes k2 and k3 become shared elements of the context x and of the right side b2. Note that they constitute a graph which consists of two nodes but has no arc. This two-node graph, which occurs as a shared part of the context and the right side, is called “the interface”. It is the need to have explicit control of shared nodes that made us choose disjoint union plus a subsequent identification operation as a way of constructing g2 out of the context x and the right side b2. We said, for example, that the interface is a shared part of the context and the right side. Strictly speaking, however, this is often impossible because context and right side are quite separate graphs. (After all, the right side is to be inserted into the context.) This is why we treat context, interface, and right as well as left side as four disjoint graphs and use identifications to connect them. The complex operation which takes the right side b2, the context x and the interface k to the graph g2 is called a “gluing operation” and the graph g2 is called a “gluing of b2 and x along k” (cf. Ehrig 1979: 9⫺14). Obviously, the graph g1, from which we started, is a gluing of the left
70
I. Systematik
side b1 and the context x along the interface k. Thus each instance of the relation of direct derivability involves two gluings. A similar but more sophisticated technique of gluing together local objects has been elaborated for the description of musical syntagms within mathematical music theory (Mazzola 1990; see above, § 3.). Global compositions are understood as manifolds, consisting of local compositions (comparable to the representation of our globe in an atlas of geographic maps), together with a coherent list of gluing prescriptions (for the gluing of these maps by means of identifying isomorphisms; cf. Fig. 2.44). As a simple example consider the diatonic scale {c, d, e, f, g, a, b} interpreted as a global structure, consisting of seven overlapping local compositions I ⫽ {c, e, g}, II ⫽ {d, f, a}, III ⫽ {e, g, b}, IV ⫽ {f, a, c}, V ⫽ {g, b, d}, VI ⫽ {a, c, e}, VII ⫽ {b, d, f}. The nerve of this syntagm is given
Fig. 2.45
Fig. 2.46
in Fig. 2.45: Each of the 7 points represents a map, each of the 14 line segments represents a pair of two overlapping maps, each of the 7 triangles represents a triple of overlapping maps. The result is a Möbius strip which geometrically realizes Schönberg’s (1922) idea of harmonic strip. The non-orientability of the Möbius strip is related to a classical problem of the theory of functional harmony (Mazzola 1990: 176 ff.). After this brief look into mathematical music theory let us now discuss the construction of visual forms by means of graph grammars. Consider constructing the shape “A” from the two connected graphs given in Fig. 2.46. (This again is a simplified case because it neglects the possibility of coloring.) The construction of “A” can be achieved by a rewrite rule which allows the replacement of the arc a1 in h1 by the entire graph
71
2. Syntactics
b2. The resulting graph h2 is given in Fig. 2.47.
a graph morphism f is a pair of two functions f ⫽ *fA, fN+ where fA maps arcs from GA to those of G⬘A and nodes from GN to those of G⬘N and for each arc a of GA both fN(s(a)) ⫽ s⬘(fA(a)) and fN(t(a)) ⫽ t⬘(fA(a)). This property of graph morphisms is represented by the diagram in Fig. 2.50.
Fig. 2.47
The one-arc graph b1, which solely consists of an arc and its two nodes, is the left side of the rule involved. We depict it by the diagram in Fig. 2.48. Fig. 2.50
Fig. 2.48
The context x here takes the form of Fig. 2.49.
Fig. 2.49
In this case, the interface k is again a twonode graph without any arc. When we say that the interface is a shared part of the context and the left side b1 (as well as of the right side b2), then we imply that there are structure preserving functions m1 and m2 which map the graph k into the graphs x and b1 respectively (and this is true for b2 too). Such structure preserving functions are called “graph morphisms”. Preservance of structure means that such a function respects sourcetarget-relationships in the following sense: Neglecting coloring, we may (according to § 4.2. above) identify a graph g as a 4-tuple *GA, GN, s, t+ consisting of a set GA of arcs, a set GN of nodes, the source function (s), and the target function (t). Given two graphs g ⫽ *GA, GN, s, t+ and g⬘ ⫽ *G⬘A, G⬘N, s⬘, t⬘+
Interpreting this diagram, we claim that mappings which correspond to different tracks of arrows with the same source and target (but different routes, of course) are identical. In the language of category theory this is expressed by saying that the diagram commutes (cf., e. g., McLarty 1992). In our case, the interface k is the graph 2 ⫽ *⵰, {k9, k10}, ⵰, ⵰+; there are no arcs, and source s and target t are the empty function here. The graph morphism m1 maps this interface into the left side b1; this is expressed by “m1: 2 → b1”, which is read in category theory as “m1 is an arrow with source 2 and target b1”. Since our interface has no arcs, the first component of the morphism m1 which maps into b1 is again the empty function. Its second component maps k9 to k7 and k10 to k8. Thus the relevant copy 2ⴕ of 2 in the left side b1 is 2ⴕ ⫽ *⵰, {k7, k8}, ⵰, ⵰+. The mapping m2 of 2 into the context x maps k9 to k0 and k10 to k1, and thus the relevant copy 2ⴖ of 2 in the interface is 2ⴖ ⫽ *⵰, {k0, k1}, ⵰, ⵰+. Now employing graph morphisms g1: b1 → h1 and g2: x → h1, the initial graph h1 can now be interpreted as a gluing of the left side b1 with the context x along the interface k. In our example, g1 maps the only arc a3 of b1 to the arc a1 of h1; furthermore the nodes k7 and k8 are mapped to k0 and k1, respectively. (The reader should verify for himself that g1 is indeed a graph morphism!) Since x is a subgraph of h1, g2 is simply the identical embedding of into h1 which maps every com-
72
I. Systematik
ponent of x to itself. Now, h1 does not only contain b1 and x as its part, it is also distinguished by what is called a “universal property” in category theory. If there is another graph h1⬘ and two graph morphisms g1⬘: b1 → h1⬘ and g2⬘: x → h1⬘, then there is a unique graph-morphism h: h1 → h1⬘ for which the diagram in Fig. 2.51 commutes. b1 m1
g1
Í =2
h1 m2
g2
g1' h
h1'
g2'
˜ Fig. 2.51
Given objects k, b1, and x with morphisms m1: k → b1 and m2: k → x, an object such as h1 with morphisms like g1 and g2 for which the universal property of the diagram in Fig. 2.51 holds is called a “pushout” in category theory. Thus the gluing of b1 and x along k (⫽ 2) is a special case of a pushout, and category theory may be used in analyzing graph gluings as pushouts. Relations analogous to those between the left side b1, the context x, the interface k, and the gluing h1 also hold between the right side b2, the same context x, the interface k, and the gluing h2. Again there are graph morphisms n1 and n2 which locate copies of k (⫽ 2) within b2 and x. Furthermore, there are morphisms h1 and h2 identifying the right side and the context in the gluing h2. Generalizing the notion of a rewrite rule for the case of graphs, we can therefore define a “graph production rule” as a pair p ⫽ *b1, b2+ of graph morphisms b1: k → b1 and b2: k → b2, where b1, b2 and k are called “the left side”, “the right side”, and “the interface” of the production rule respectively. Given such
Fig. 2.52
a production rule p ⫽ *b1, b2+, a graph x (called “the context”), and a graph morphism d: k → x, then a direct derivation consists of two pushouts h1 and h2, as shown in the diagram of Fig. 2.52. A derivation is, of course, a finite sequence of direct derivations as in the case of strings (cf. § 4.4.). This generalization of the basic concepts of string grammar to that of graph grammar looks rather complicated. Much of this impression may be due to the unfamiliar language of category theory and will thus disappear as soon as one has mastered this language. Nevertheless, certain technicalities remain which might motivate the search for a simpler approach to non-linear syntactic patterns. One strategy for such a search is to look for the mechanisms employed by the sign users themselves when they process such patterns (cf. Art. 6⫺12 of this Handbook). A relatively well known theoretical device which is said to have similarities to known physiological structures is the perceptron (cf. Minsky and Papert 1969, the review by Block 1970 with its extensive bibliography, and Suppes and Rottmayer 1974: 345⫺350). The perceptron may be described as a device which solves a problem by carrying out a number of small experiments and then using the outcomes to arrive at the solution. Both the experiments and the problem to be solved are represented by characteristic functions, which are called “predicates” by Minsky and Papert. (In fact, the matter is a little more complicated; for details cf. Minsky and Papert 1969: 25 and § 1.6, Suppes and Rottmayer 1974: 347.) Let F ⫽ {f1, …, fn} be the experimental predicates and c the problem-predicate. For illustration, suppose we are interested in regions of the Euclidean plane. Then c might be the predicate cCIRCLE, which assigns the value TRUE to a region if an only if it is a circle (and the value FALSE otherwise). Now the idea is to reduce
2. Syntactics
such a complex predicate c to a family F of simpler predicates. Suppose f1c, … fcn are such simpler predicates. Then in order to decide whether cCIRCLE(X) ⫽ TRUE for the data X, we carry out the experiments ⫺ i. e., we determine the values f1c(X), …, fcn(X) ⫺ and then combine them by means of a procedure V in order to obtain cCIRCLE(X). (Of course, nothing guarantees that for each complex predicate one can find a family of simpler ones.) What is characteristic of the perceptron approach is its parallel character, the values of the simpler predicates being simultaneously given as inputs of the procedure V. Thus we may assume that these values are determined by parallel but independent computations. The functioning of a perceptron is illustrated by the following diagram from Minsky and Papert (1969: 5).
Fig. 2.53
Two questions arise here: (1) What exactly constitutes the simplicity of the predicates fm of the set F? (2) What exactly is the procedure V? We shall answer the second question first. Minsky and Papert (1969: 10) assume that V is a procedure of weighted voting. This means that for each fm 苸 F there is a number wfm which measures the importance of the outcome of the experiment fm. If fm is of minor importance, its weight wfm will be small; crucial experiments, on the other hand, will have large numbers as their weights. Furthermore, there is a number t such that c takes the value TRUE for data X whenever the weighted average of the experimental outcomes exceeds t. The number t is called “the threshold”. Thus we have the following reduction of c to F: (P) c(X) ⫽ TRUE if and only if t ⬍ 兺 wf · f (X). f苸F
If this holds, the predicate c is said to be “linear in F”. (There are some alternative but
73 equivalent ways to define linearity; cf. Minsky and Papert 1969: 29.) Let us now turn to the question of what constitutes the simplicity of the predicates fm in the family F. So far there exists no generally accepted theory of the simplicity of predicates, though there are some approaches towards such a theory (cf. Goodman 1972: ch. VII, von Kutschera 1972: § 4.2, Sober 1975, which is of semiotic importance because Sober deals with the question of the simplicity of grammatical descriptions). Therefore, Minsky and Papert provide explications of the notion of simplicity for the special case of geometric predicates (where “geometric” should be understood in a somewhat abstract sense which will become clearer in the following). The data to which their predicates apply are subsets X of a set R of points; R is called “the retina”. We may think of the data X as that part of the retina which is stimulated, or we may view the set R as a screen and X as the black points on the screen, or R as a plane and X as a figure on it; cf. Fig. 2.53. The simplicity of a predicate f 苸 F may now consist in the fact that the values f(X) do not depend on the whole data X but only on a subset Y 債 X so that f(X) ⫽ f(Y). If, furthermore, there is a smallest part Sf of the retina (i. e., Sf 債 R) such that that part Y of the data X on which f really depends may be characterized as Y ⫽ X ∩ Sf, then Sf is called “the support of f”. Clearly, it makes sense to call a predicate “simple” if it has a finite support ⫺ even if this notion of simplicity is not a general one but is restricted to our abstract geometrical settings. If a predicate c can be characterized by a biconditional of the kind (P) where the predicates from F all have finite support, then only finite sets of points from X need to be considered in order to decide whether c applies to X. This gives c a local character; c does not depend on the whole of X but only on small ⫺ even finite ⫺ parts of it. An example for a local predicate of this kind is convexity (cCONVEX). Roughly, a figure X is convex if every line segment which links two points of the figure completely lies within the figure. Thus a circle is convex but a halfmoon is not (cf. Fig. 2.54). Intuitively, cCONVEX is local because we only have to consider triples of points in order to decide whether a figure is convex or not (cf. the above drawings).
74
I. Systematik
6.
o
o
o
¯convex = TRUE
o
¯convex = FALSE
Fig. 2.54
For any predicate c, the smallest number k such that there is a family of predicates F characterizing c whose members all have a finite support of at most k members is called “the order of c”. The above example shows that cCONVEX is of order three, as are for example the predicates of being a solid rectangle and that of being a hollow one (cf. Minsky and Papert 1969: § 6.3.2). (A hollow rectangle is a rectangle with a hole in it.) There are, however, some predicates which would be considered fairly simple from an intuitive point of view but which turn out to be of no finite order. The most basic example is connectedness; a figure is connected if any two points can be linked by a (not necessarily straight) line which wholly lies within the figure. Figures with isolated parts, as in Fig. 2.55, are not connected.
Selected references
Ades, Anthony E., and Mark Steedman (1982), “On the Order of Words”. Linguistics and Philosophy 4: 517⫺558. Aho, Alfred V., and Jeffrey D. Ullman (1972), The Theory of Parsing, Translation, and Compiling. Vol. I: Parsing. Vol. II: Compiling. Englewood Cliffs NJ: Prentice-Hall. Ajdukiewicz, Kazimierz (1935), “Die syntaktische Konnexität”. Studia Philosophica 1: 1⫺27. English translation by H. Weber: “Syntactic Connexion”. In: Storrs McCall (ed.), Polish Logic 1920⫺1939. Oxford: Oxford University Press 1967: 207⫺231. Akmajian, Adrian, and Frank W. Heny (1975), An Introduction to the Principles of Transformational Syntax. Cambridge MA: MIT Press. Alexandrov, Viktor V., and Nikolaj D. Gorsky (1993), Image Representation and Processing. Dordrecht and Hingham MA: Kluwer. Althaus, Hans Peter (1973), “Graphetik”. In: H. P. Althaus, H. Henne and H. E. Wiegand (eds.), Lexikon der Germanistischen Linguistik. Tübingen: Niemeyer. 2nd edition 1980: 138⫺142. Amiet, Pierre, Franc¸ ois Baratte, Christiane Desroches Noblecourt, Catherine Metzger and Alain Pasquier (1981), La grammaire des formes et des styles: Antiquite´ . Fribourg: Office du Livre S.A. German translation by T. Mertl, K. Mühlethaler, R. and W. Steinmann: Handbuch der Formen- und Stilkunde: Antike: Wiesbaden: Fourier 1981. Andrews, Avery D. (1988), “Lexical Structure”. In: F. J. Newmeyer (ed.), Linguistics: The Cambridge Survey. Vol. I: Linguistic Theory: Foundations. Cambridge, England: Cambridge University Press: 60⫺88. Apel, Karl-Otto (1973), “Charles Morris und das Programm einer pragmatisch integrierten Semiotik”. In: Charles W. Morris, Zeichen, Sprache und Verhalten (German Translation of Signs, Language and Behavior). Düsseldorf: Schwann: 9⫺66.
¯convex = TRUE
¯convex = FALSE
Fig. 2.55
Such cases (as well as others, cf. Suppes and Rottmayer 1974: 349) show the serious limitations of the perceptron approach as developed by Minsky and Papert. However, it may be that these limitations are only due to the particular explication provided by these authors (cf. Block 1970). In any case, this fact as well as the example of graph grammars shows that an adequate framework for the analysis of multi-dimensional syntactic patterns will unavoidably employ notions considerably more complex than those needed for string codes.
Baker, Carl Lee (1978), Introduction to GenerativeTransformational Syntax. Englewood Cliffs NJ: Prentice-Hall. Ballmer, Thomas (1978), Logical Grammar. Amsterdam: North Holland. Bar-Hillel, Yehoshua (1964), Language and Information. Reading MA: Addison-Wesley. Baroni, Mario, and Carlo Jacoboni (1978), Proposal for a Grammar of Melody: The Bach Chorales. Montreal: Universite´ de Montre´ al. Barthes, Roland (1967), Syste`me de la mode. Paris: Seuil. English translation: The Fashion System. New York: Hill and Wang 1983. Bartsch, Renate, Jürgen Lenerz and Veronika Ullmer-Ehrich (1977), Einführung in die Syntax. Kronberg: Scriptor.
2. Syntactics Beck, Ulrich (1988), Computer-Graphik. Basel: Birkhäuser. Berwick, Robert C., and Amy S. Weinberg (1984), The Grammatical Basis of Linguistic Performance. Cambridge MA: MIT Press. Block, Herbert D. (1970), “A Review of Perceptrons [⫽ Minsky and Papert 1969]”. Information and Control 17: 501⫺522. Bloomfield, Leonard (1926), “A Set of Postulates for the Science of Language”. Language 2: 26⫺31. Bloomfield, Leonard (1933), Language. London: Allen and Unwin. Boole, George (1854), The Investigation of the Laws of Thought, on Which are Founded the Mathematical Theories of Logic and Probability. London: Walton and Maberly. Reprint New York: Dover 1951. Bourbaki, Nikolas (1935), E´ le´ ments de mathe´ matique. Vol. 1. Paris: Hermann. Brainerd, Barron (1971), Introduction to the Mathematics of Language Study. New York: American Elsevier. Brainerd, Walter S. (1969), “Tree-Generating Regular Systems”. Information and Control 14: 217⫺ 231. Bresnan, Joan (ed.) (1982), The Mental Representation of Grammatical Relations. Cambridge MA.: The MIT Press. Bresnan, Joan, and Ronald M. Kaplan (1982), “Lexical-Functional Grammar: A Formal System for Grammatical Representation”. In Bresnan 1982: 173⫺381. Brockhaus, Klaus (1971), Automatische Übersetzung. Braunschweig: Vieweg. Bühler, Karl (1931), “Phonetik und Phonologie”. Travaux du Cercle Linguistique de Prague 4: 22⫺53. Bühler, Karl (1934), Sprachtheorie. Die Darstellungsfunktion der Sprache. Jena: Gustav Fischer. 2nd edition. Stuttgart: Gustav Fischer. English translation by D. F. Goodwin: Theory of Language. Amsterdam: Benjamins 1990. Burns, Edward M., and W. Dixon Ward (1978), “Categorical Perception ⫺ Phenomenon or Epiphenomenon: Evidence from Experiments in the Perception of Melodic Musical Intervals”. Journal of the Acoustic Society of America 63. Buszkowski, Wojciech, Witold Marciszewski and Johan van Benthem (eds.) (1988), Categorial Grammar. Amsterdam: Benjamins. Buyssens, Eric (1943), Les langages et le discours. Brussels: Office de Publicite´ . Carlini, Alessandro, and Bernhard Schneider (1977), “Plädoyer für die Wiedereinführung der Säule: Semiotische Operationen an einem Paradigma der Architektur”. In: Roland Posner and Hans-Peter Reinecke (eds.), Zeichenprozesse: Semiotische Forschung in den Einzelwissenschaften. Wiesbaden: Akademische Verlagsgesellschaft: 371⫺418.
75 Carnap, Rudolf (1928), Der logische Aufbau der Welt. Berlin: Weltkreis. 2nd edition. Hamburg: Meiner 1961. Carnap, Rudolf (1934), Logische Syntax der Sprache. Wien: Springer. English translation by A. Smeaton: The Logical Syntax of Language. London: Kegan Paul 1937. Carnap, Rudolf (1935), Philosophy and Logical Syntax. London: Kegan Paul. Carnap, Rudolf (1939), Foundations of Logic and Mathematics. Chicago: The University of Chicago Press. Carnap, Rudolf (1942), Introduction to Semantics. Cambridge MA: Harvard University Press. Carnap, Rudolf (1954), Einführung in die symbolische Logik, mit besonderer Berücksichtigung ihrer Anwendungen. Wien: Springer. English translation by W. H. Meyer and J. Wilkinson: Introduction to Symbolic Logic and its Applications. New York: Dover 1958. Carpenter, Bob (1992), The Logic of Typed Feature Structures. Cambridge, England: Cambridge University Press. Chenoweth, Vida (1972), Melodic Analysis and Perception. Ukarumpa, Papua New Guinea: Summer Institute of Linguistics. Cherry, Colin (1957), On Human Communication. New York: Wiley. Chomsky, Noam (1957), Syntactic Structures. The Hague and Paris: Mouton. Chomsky, Noam (1959 a), “On Certain Formal Properties of Grammars”. Information and Control 2: 137⫺167. Chomsky, Noam (1959 b), “Review of B. F. Skinner: Verbal Behavior”. Language 35: 26⫺58. Chomsky, Noam (1963), “Formal Properties of Grammars”. In: R. D. Luce, R. R. Bush and E. Galanter (eds.), Handbook of Mathematical Psychology. Vol. 2. New York: Wiley: 323⫺418. Chomsky, Noam (1964), Current Issues in Linguistic Theory. The Hague and Paris: Mouton. Chomsky, Noam (1965), Aspects of the Theory of Syntax. Cambridge MA: MIT Press. Chomsky, Noam (1975), The Logical Structure of Linguistic Theory. New York and London: Plenum Press. Chomsky, Noam (1981), Lectures on Government and Binding. The Pisa Lectures. Dordrecht: Foris. Chomsky, Noam (1982), Some Concepts and Consequences of the Theory of Government and Binding. Cambridge MA: MIT Press. Chomsky, Noam (1986 a), Barriers. Cambridge MA: MIT Press. Chomsky, Noam (1986 b), Knowledge of Language: Its Nature, Origins and Use. New York, Westport and London: Praeger.
76 Chomsky, Noam, and Morris Halle (1968), The Sound Pattern of English. New York: Harper and Row. Chomsky, Noam, and George A. Miller (1963), “Introduction to the Formal Analysis of Natural Languages”. In: R. D. Luce, R. R. Bush and E. Galanter (eds.), Handbook of Mathematical Psychology. Vol. 2. New York: Wiley: 269⫺322. Claus, Volker, Harmut Ehrig and Grzegorz Rozenberg (eds.) (1979), Graph-Grammars and Their Application to Computer Science and Biology. International Workshop Bad Honnef, October 30⫺ November 3, 1978. Berlin, Heidelberg and New York: Springer. Cohen, Joel M. (1967), “The Equivalence of Two Concepts of Categorial Grammar”. Information and Control 10: 475⫺484. Corcoran, John, William Frank and Michael Maloney (1974), “String Theory”. Journal of Symbolic Logic 39: 625⫺637. Cresswell, Max J. (1973), Logics and Languages. London: Methuen. Curry, Haskell B. (1953), “Mathematics, Syntactics and Logics”. Mind 62: 172⫺283. Curry, Haskell B. (1963), Foundations of Mathematical Logic. New York and London: McGrawHill. Reprint New York: Dover 1977. Dacey, Michael F. (1970), “The Syntax of a Triangle and Some Other Figures”. Pattern Recognition 2,1: 11⫺31. Davis, Martin (1958), Computability and Unsolvability. New York and London: McGraw Hill. Dilger, Werner (1982), “Tree Directed Grammars”. In: J. Horecky´ (ed.), Coling 82. Amsterdam: NorthHolland: 77⫺82. Dowty, David, Lauri Karttunen and Arnold Zwicky (eds.), Natural Language Parsing. Cambridge, England: Cambridge University Press. Eckman, Fred R., E. A. Moravcsik and J. R. Wirth (eds.) (1986), Markedness. New York: Plenum Press. Eco, Umberto (1972), “A Componential Analysis of the Architectural Sign /Column/”. Semiotica 5,2: 97⫺117. Eco, Umberto (1976), A Theory of Semiotics. Bloomington IN: Indiana University Press. Eden, Murray (1961), “On the Formalization of Handwriting”. In Jakobson 1964: 83⫺88. Eden, Murray (1962), “Handwriting and Pattern Recognition”. IRE Transactions on Information Theory. IT-8: 160⫺166. Edgar, Gerald A. (1990), Measure, Topology and Fractal Geometry. New York: Springer. Ehrig, Hartmut (1979), “Introduction to the Algebraic Theory of Graph Grammars (a Survey)”. In Claus, Ehrig and Rozenberg 1979: 1⫺69.
I. Systematik Ehrig, Hartmut (1987), “Tutorial Introduction to the Algebraic Approach of Graph Grammars”. In Ehrig, Nagl, Rozenberg and Rosenfeld 1987: 3⫺14. Ehrig, Hartmut, M. Nagl and Grzegorz Rozenberg (eds.) (1983), Graph Grammars and Their Applications to Computer Science. 2nd International Workshop. Haus Ohrbeck, Germany. October, 4⫺8, 1982. Berlin, Heidelberg and New York: Springer. Ehrig, Hartmut, Grzegorz Rozenberg and Azriel Rosenfeld (eds.) (1987), Graph-Grammars and Their Application to Computer Science. 3rd International Workshop. Warrenton, Virginia, USA. December 1986. Berlin, Heidelberg and New York: Springer. Eimas, Peter D. (1980), “Infant Speech Perception: Issues and Models”. In: M. Garrett, J. Mehler and E. C. T. Walker (eds.), Perspectives on Mental Representation. Hillsdale NJ: Erlbaum. Emonds, Joseph E. (1976), A Transformational Approach to English Syntax. Root, Structure-Preserving, and Local Transformations. New York: Academic Press. Encarnac¸ a˜ o, Jose´ et al. (1984), CAD-Handbuch. Heidelberg and Berlin: Springer. Engelberg, Klaus-Jürgen (1980), Funktion und Transformation. Neue Aspekte der formalen Syntaxtheorie. Freiburg: Hochschulverlag. Faiman, Michael, and Jürgen Nievergelt (eds.) (1969), Pertinent Concepts in Computer Graphics. Chicago: University of Illinois Press. Falconer, Kenneth J. (1990), Fractal Geometry. Chichester: Wiley. Fischer-Lichte, Erika (1983), Semiotik des Theaters. Tübingen: Narr. English translation by J. Gaines and D. L. Jones: The Semiotics of Theater. Bloomington IN: Indiana University Press 1992. Foley, James D., and Andries van Dam (1982), Fundamentals of Interactive Computer Graphics. New York: Addison-Wesley. Franck, Reinhold (1978), “A Class of Linearly Parsable Graph Grammars”. Acta Informatica 10: 175⫺201. Frege, Gottlob (1879), Begriffsschrift, eine der arithmetischen nachgebildete Formelsprache des reinen Denkens. Halle a. d. S.: Nebert. Reprint Hildesheim and New York: Olms 1964. Frege, Gottlob (1893⫺1903), Grundgesetze der Arithmetik. Begriffsschriftlich abgeleitet. 2 vols. Jena: Pohle. Reprint Hildesheim and New York: Olms 1966. Partially translated into English by M. Furth: The Basic Laws of Arithmetic: Exposition of the System. Berkeley and Los Angeles: University of California Press 1964. Fripertinger, Harald (1993), Endliche Gruppenaktionen in Funktionenmengen: Das Lemma von Burnside, Repräsentationskonstruktionen, Anwendung in der Musiktheorie. Graz: Ph. D. dissertation. Fu, King Sun (1976), Digital Pattern Recognition. Berlin, Heidelberg and New York: Springer.
2. Syntactics Fu, King Sun (1982), Syntactic Pattern Recognition and Applications. Englewood Cliffs NJ: PrenticeHall. Fu, King Sun (ed.) (1974), Syntactic Methods in Pattern Recognition. London: Academic Press. Gazdar, Gerald (1982), “Phrase Structure Grammar”. In Jacobson and Pullum 1982: 131⫺186. Gazdar, Gerald, Ewan Klein, Geoffrey Pullum and Ivan Sag (1985), Generalized Phrase Structure Grammar. Oxford: Blackwell. Ginsburg, Seymour (1966), The Mathematical Theory of Context Free Languages. New York: McGraw-Hill. Ginsburg, Seymour, and Barbara H. Partee (1969), “A Mathematical Model of Transformational Grammars”. Information and Control 15: 297⫺334. Gips, James E. (1974), Shape Grammars and Their Uses. Stanford University: Ph. D. dissertation. Gladkij, Aleksej V. (1963), “The Configurational Characteristics of Languages” [in Russian]. Probl. Kibernetiki 10: 251⫺260. Gladkij, Aleksej V. (1968), Formal Grammars [in Russian]. Moscow. Gödel, Kurt (1931), “Über formal unentscheidbare Sätze der Principia Mathematica und verwandter Systeme I”. Monatshefte für Mathematik und Physik 38: 173⫺198. Reprint with an English translation in: Kurt Gödel, Collected Works. Vol. I: Publications 1929⫺1936. Ed. S. Feferman et al. Oxford: Oxford University Press: 144⫺195. Gonzales, Rafael C., and Michael G. Thomason (1978), Syntactic Pattern Recognition. Reading MA: Addison-Wesley. Goodman, Nelson (1968), Languages of Art. Indianapolis: Bobbs-Merrill. 2nd edition. Indianapolis: Hackett 1976. Goodman, Nelson (1972), Problems and Projects. Indianapolis and New York: Hackett. Greenberg, Joseph H. (1957), Essays in Linguistics. Chicago and London: University of Chicago Press. Grenander, Ulf (1976⫺1981), Lectures in Pattern Theory. Vol. 1: Pattern Synthesis (1976). Vol. 2: Pattern Analysis (1978). Vol. 3: Regular Structures (1981). Berlin, Heidelberg and New York: Springer. Grenander, Ulf (1994), General Pattern Theory: A Mathematical Study of Regular Structures. Oxford: Oxford University Press.
77 die von Charles Darwin reformierte Deszendenztheorie. 2 Vols. Berlin: Reimer. Haken, Hermann, and Maria Haken-Krell (1989), Entstehung von biologischer Information und Ordnung. Darmstadt: Wissenschaftliche Buchgesellschaft. Halin, Rudolf (1980⫺1981), Graphentheorie. 2 Vols. Darmstadt: Wissenschaftliche Buchgesellschaft. Harris, Hellig S. (1947), Methods in Structural Linguistics. Chicago: University of Chicago Press. Harris, Zellig S. (1952), “Discourse Analysis”. Language 28: 1⫺30. Reprint in Harris 1981: 107⫺142. Harris, Zellig S. (1962), String Analysis of Sentence Structure. The Hague and Paris: Mouton. Harris, Zellig S. (1970), Papers in Structural and Transformational Linguistics. Dordrecht: Reidel. Harris, Zellig S. (1981), Papers on Syntax. Dordrecht, Boston and London: Reidel. Heidler, Klaus, Hans Hermes and F. K. Mahn (1977), Rekursive Funktionen. Mannheim, Wien and Zürich: Bibliographisches Institut. Herbrand, Jacques (1931), “Sur la non-contradiction de l’arithme´ tique”. Journal für die reine und angewandte Mathematik 166: 1⫺8. English translation: “On the Consistency of Arithmetic”. In: Jacques Herbrand, Logical Writings. Ed. Warren D. Goldfarb. Dordrecht: Reidel 1971: 282⫺298. Herman, Gabor T., and Grzegorz Rozenberg (1975), Development Systems and Languages. Amsterdam: North Holland. Hermanns, Fritz (1977), Die Kalkülisierung der Grammatik. Heidelberg: Julius Groos. Hermes, Hans (1938), Semiotik. Eine Theorie der Zeichengestalten als Grundlage für Untersuchungen von formalisierten Sprachen. Leipzig: Hirzel. Hildesheim: Gerstenberg 1970. Hermes, Hans (1961), Aufzählbarkeit, Entscheidbarkeit, Berechenbarkeit. Einführung in die Theorie der rekursiven Funktionen. Berlin, Heidelberg and New York: Springer. English translation by G. T. Herman and O. Plassmann: Enumerability, Decidability, Computability. New York, Heidelberg and Berlin: Springer 1971. Hilbert, David (1918), “Axiomatisches Denken”. Mathematische Annalen 78: 405⫺415.
Gross, Maurice, and Andre´ Lentin (1967), Notations sur les grammaires formelles. Paris: GauthierVillars. English translation by M. Salkow: Introduction to Formal Grammars. New York, Heidelberg and Berlin: Springer 1970.
Hilbert, David (1925), “Über das Unendliche”. Mathematische Annalen 95: 161⫺190. English translation by E. Putnam and G. J. Massey: “On the Infinite”. In: H. Putnam and P. Benacerraf (eds.), Philosophy of Mathematics. Englewood Cliffs NJ: Prentice-Hall 1964: 134⫺151.
Groupe m (1992), Traite´ du signe visuel: Pour une rhe´ torique de l’image. Paris: Seuil.
Hindemith, Paul (1940), Unterweisung im Tonsatz. Mainz: Schott.
Haeckel, Ernst (1866), Generelle Morphologie der Organismen. Allgemeine Grundzüge der organischen Formen-Wissenschaft, mechanisch begründet durch
Hintikka, Jaakko (1975), “On the Limitation of Generative Grammar”. In: Proceedings of the Scandinavian Seminar on Philosophy of Language.
78 Uppsala, Sweden, Nov. 8.⫺9., 1974 (⫽ Filosofiska Studier 26, 1: 1⫺92. Hiz˙ , Henry (1968), “Computable and Uncomputable Elements of Syntax”. In: B. van Rootselaar, and J. F. Staal (eds.), Logic, Methodology, and Philosophy of Science. Vol. III. Amsterdam: NorthHolland: 239⫺254. Hjelmslev, Louis (1943): Omkring sprogteoriens grundlæggelse. Copenhagen: Munksgaard. English translation by F. J. Whitfield: Prolegomena to a Theory of Language. Revised English edition. Madison: University of Wisconsin Press 1961. 2nd edition 1963. Hockett, Charles F. (1958), A Course in Modern Linguistics. New York and London: Macmillan. Holenstein, Elmar (1975), Roman Jakobsons phänomenologischer Strukturalismus. Frankfurt/M.: Suhrkamp. Jackendoff, Ray (1977), X-bar Syntax: A Study of Phrase Structure. Cambridge MA: MIT Press. Jacobson, Pauline, and Geoffrey Pullum (1982) (eds.), The Nature of Syntactic Representation. Dordrecht, Boston and London: Reidel. Jähne, Bernd (1989), Digitale Bildverarbeitung. Berlin and Heidelberg: Springer. Jakobson, Roman (1960), “Linguistics and Poetics”. In: T. A. Sebeok (ed.), Style in Language. Cambridge MA: MIT Press. Jakobson, Roman (ed.) (1961), Structure of Language and Its Mathematical Aspects. Providence RI: American Mathematical Society. Johnson, David, and Paul M. Postal (1980), Arc Pair Grammar. Princeton: Princeton University Press. Johnson, Mark (1988), Attribute-Value Logic and the Theory of Grammar. Stanford CA: Center for the Study of Language and Information, CSLI Lecture Notes 14. Joshi, Aravind K. (1972), “A Class of Transformational Grammars”. In: M. Gross, M. Halle and M.-P. Schützenberger (eds.), Formal Language Analysis. The Hague and Paris: Mouton: 329⫺361. Joshi, Aravind K. (1973), “A Brief Survey of Some Mathematical Results Relevant to Natural Language Processing”. In: R. Randall (ed.), Natural Language Processing. Courant Computer Symposium 8. New York: Academic Press: 1⫺24. Joshi, Aravind K. (1985), “Tree Adjoining Grammars: How Much Context-Sensitivity is Required to Provide Reasonable Structural Descriptions?”. In Dowty, Karttunen and Zwicky 1985: 206⫺250. Joshi, Aravind K., and Leon S. Levy (1975), “Tree Adjunct Grammars”. Journal of Computer and System Sciences 10: 136⫺163. Joshi, Aravind K., and Leon S. Levy (1982), “Phrase Structure Trees Bear More Fruit than You Would Have Thought”. American Journal of Computational Linguistics 8: 1⫺11.
I. Systematik Joshi, Aravind K., Leon S. Levy and Masako Takahashi (1975), “Tree Adjunct Grammars”. Journal of Computer and System Sciences 10: 136⫺163. Karttunen, Lauri (1981), “Unbounded Dependencies in Phrase Structure Grammar: Slash Categories vs. Dotted Lines”. In: J. A. G. Groenendijk, T. M. V. Janssen and M. B. J. Stokhof (eds.), Formal Methods in the Study of Language. Part 2. Amsterdam: Mathematisch Centrum: 323⫺342. Kay, Martin (1985), “Parsing in Functional Unification Grammars”. In: D. Dowty, L. Karttunen and A. Zwicky (eds.), Natural Language Parsing. Cambridge, England: Cambridge University Press: 251⫺278. Kimball, John P. (1967), “Predicates Definable over Transformational Derivations by Intersection with Regular Languages”. Information and Control 11: 177⫺195. Klein, Felix (1872), “Das Erlanger Programm. Vergleichende Betrachtung über neuere geometrische Forschungen”. In: Felix Klein, Gesammelte mathematische Abhandlungen. Vol. 1. Berlin: Springer 1921: 460⫺497. Knobloch, Eberhard (1973), Die mathematischen Studien von G. W. Leibniz zur Kombinatorik. Wiesbaden: Steiner. Köhler, Wolfgang (1920), Die physischen Gestalten in Ruhe und im stationären Zustand, eine naturphilosophische Untersuchung. Braunschweig: Vieweg. König, Esther (1989), How to Fit the Lambek Calculus into the Chomsky Hierarchy. Stuttgart: IBM Germany, IWBS Report 80. König, Esther (1990), Der Lambek-Kalkül: Eine Logik für lexikalische Grammatiken. Stuttgart: IBM Germany, IWBS Report. 146. Koutsoudas, Andreas (1976), The Application and Ordering of Grammatical Rules. Paris and the Hague: Mouton. Kratzer, Angelika, Eberhard Pause, and Arnim von Stechow (1973⫺1974), Einführung in Theorie und Anwendung der generativen Syntax. Vol. 1: Syntaxtheorie. 1973. Vol. 2: Anwendung. 1974. Frankfurt/M.: Athenäum. Kruszewski, Mikolaj (1884), “Prinzipien der Sprachentwicklung I”. Internationale Zeitschrift für allgemeine Sprachwissenschaft 1: 295⫺307. Reprint in: D. Cherubim (ed.), Sprachwandel: Reader zur diachronen Sprachwissenschaft. Berlin and New York: de Gruyter 1975: 62⫺77. Kutschera, Franz von (1972), Wissenschaftstheorie II. Grundzüge der allgemeinen Methodologie der empirischen Wissenschaften. München: Fink. Lambek, Joachim (1958), “The Mathematics of Sentence Structure”. American Mathematical Monthly 65: 154⫺169. Lambek, Joachim (1959), “Contributions to a Mathematical Analysis of the English VerbPhrase”. Journal of the Canadian Linguistic Association 5: 83⫺89.
2. Syntactics Lambek, Joachim (1961), “On the Calculus of Syntactic Types”. In Jakobson 1961: 166⫺178. Larson, Richard (1988), “On the Double Object Construction”. Linguistic Inquiry 19: 335⫺391. Lerdahl, Fred, and Ray Jackendoff (1983), A Generative Theory of Tonal Music. Cambridge MA: MIT Press. Levelt, Wim J. M. (1974), Formal Grammars in Linguistics and Psycholinguistics. 3 Vols. Paris and the Hague: Mouton. Levy, Leon S. (1972), Tree Automata and Adjunct Grammars. Philadelphia. University of Pennsylvania. The Moore School of Electrical Engineering, MSR 72⫺16. Lieb, Hans-Heinrich (1976), “On Relating Pragmatics, Linguistics, and Non-Semiotic Disciplines”. In: A. Kasher (ed.), Language in Focus. Dordrecht: Reidel: 217⫺249. Lindenmayer, Aristid, and Grzegorz Rozenberg (1979), “Parallel Generation of Maps: Developmental Systems for Cell Layers”. In: Lecture Notes in Computer Science. Vol. 73. Berlin, Heidelberg, and New York: Springer: 301⫺316. Lindenmayer, Aristid, and Grzegorz Rozenberg (eds.) (1976), Automata, Languages, Development. At the Crossroads of Biology, Mathematics, and Computer Science. Amsterdam: North-Holland. Lorenzen, Paul (1955), Einführung in die operative Logik und Mathematik. Berlin: Springer. 2nd edition 1969. Lotman, Jurij M. (1969), “O metajazyke tipologicˇ eskick opisanij kult’ury”. Trudy po znakovym sistemam 4. Lotman, Jurij M. (1971), “Problema “obucˇ enija kult’ure” kak ee tipologicˇ eskaja charakteristika”. Trudy pos znakovym sistemam 5. Mahn, Friedrich-K. (1965), Über die Strukturunabhängigkeit des Begriffs der primitiv-rekursiven Funktionen. Münster, Westfalen: Ph. D. dissertation. Mandelbrot, Benoit B. (1982), Fractal Geometry of Nature. New York: Freeman. Marcus, Solomon (1967), Algebraic Linguistics. Analytical Models. New York and London: Academic Press. Marcus, Solomon (1992), “Research in Syntactics after Morris”. In: M. Balat and J. DeledalleRhodes (eds.), Signs of Humanity / L’homme et ses signes. Berlin and New York: Mouton de Gruyter: 1355⫺1382. Markov, Andrej A. (1947), “On the Impossibility of Certain Algorithms in the Theory of Associative Systems”. Doklady Akademii Nauk SSSR 55: 583⫺586. Marr, David (1982 a), Vision. San Francisco: Freeman. Marr, David (1982 b), “Representing and Computing Visual Information”. In: P. J. Henry and R. H.
79 Brown (eds.), Artificial Intelligence: An MIT Perspective. Vol. 2. Cambridge MA: MIT Press: 17⫺82. Maurer, Hermann (1969), Theoretische Grundlagen der Programmiersprachen: Theorie der Syntax. Mannheim: Bibliographisches Institut. Mayerthaler, Willi (1981), Morphologische Natürlichkeit. Frankfurt/M.: Athenäum. English translation: Morphological Naturalness. Ann Arbor MI: Karoma 1988. Mazzola, Guerino (1985), Gruppen und Kategorien in der Musik: Entwurf einer mathematischen Musiktheorie. Berlin: Heldermann. Mazzola, Guerino (1990), Geometrie der Töne. Basel: Birkhäuser. Mazzola, Guerino (1993), Geometry and Logic of Musical Performance. Zürich. [Swiss National Science Foundation Grant Nr. 21-33651.92 Report] McCawley, James D. (1967), “Concerning the Base Component of a Transformational Grammar”. Foundations of Language 4: 243⫺269. McLarty, Colin (1992), Elementary Categories, Elementary Toposes. Oxford: Oxford University Press. Meschkowski, Herbert (in collaboration with Detlef Laugwitz) (ed.) (1967), Meyers Handbuch über die Mathematik. Mannheim: Bibliographisches Institut. Metz, Christian (1974), Langage et cine´ ma. Paris: Larousse. English by D. J. Umiker-Sebeok: Language and Cinema. The Hague: Mouton 1974. Miller, Webb F., and Alan C. Shaw (1967), “A Picture Calculus”. In: Emerging Concepts of Computer Graphics. University of Illinois Conference: 101⫺ 121. Miller, Webb F., and Alan C. Shaw (1967), “Linguistic Methods in Picture Processing: A Survey”. Proceedings of the AFIPS 1968. FJCC 33: I, 279⫺290. Minsky, Marvin, and Seymour Papert (1969), Perceptrons: An Introduction to Computational Geometry. Cambridge MA: MIT Press. Molino, Jean (1975), “Fait musical et se´ miologie de la musique”. Musique en jeu 17: 37⫺61. Monelle, Raymond (1992), Linguistics and Semiotics in Music. Chur: Harwood. Montague, Richard (1970 a), “English as a Formal Language”. In: B. Visentini, Bruno et al. (eds.), Linguaggi nella societa` e nella tecnica. Milan: Edizioni di Comunita`. Reprint in: Richmond H. Thomason (ed.), Formal Philosophy. Selected Papers of Richard Montague. New Haven: Yale University Press: 188⫺221. Montague, Richard (1970 b), “Universal Grammar”. Theoria 36: 373⫺398. Reprint in Richmond H. Thomason (ed.), Formal Philosophy. Selected Papers of Richard Montague. New Haven: Yale University Press: 222⫺246.
80 Moortgat, Michael (1988), Categorial Investigations. Logical and Linguistic Aspects of the Lambek Calculus. Dordrecht and Providence RI: Foris. Morris, Charles W. (1929), “The Relation of Formal to Instrumental Logic”. In: T. V. Smith and W. K. Wright (eds.): Essays in Philosophy. By Seventeen Doctors in Philosophy. Chicago: Open Court. 251⫺268. Morris, Charles W. (1937), Logical Positivism, Pragmatism, and Scientific Empiricism. Paris: Hermann. Morris, Charles W. (1938), Foundations of the Theory of Signs. Chicago: University of Chicago Press. Morris, Charles W. (1946), Signs, Language, and Behavior. Englewood Cliffs NJ: Prentice-Hall. 2nd edition New York: Braziller 1955. Morris, Charles W. (1964), Signification and Significance. Cambridge MA: MIT Press. Morris, Charles W. (1971), Writings on the General Theory of Signs. The Hague and Paris: Mouton. Moshier, Michael D., and William C. Rounds (1987), “A Logic for Partially Specified Data Structures”. In: Proceedings of the 14th ACM Symposium on Principles of Programming Languages. Munich 1987: 156⫺167. Nadin, Mihai (1981), Zeichen und Wert. Tübingen: Narr. Nagl, Manfred (1979), Graph-Grammatiken: Theorie, Anwendungen, Implementierung. Braunschweig and Wiesbaden: Vieweg. Narasimhan, R. (1964), “Labeling Schemata and Syntactic Description of Pictures”. Information and Control 7: 151⫺179. Narasimhan, R. (1966), “Syntax-Directed Interpretation of Classes of Pictures”. ACM Communications 9: 166⫺173. Nattiez, Jean-Jacques (1975), Fondements d’une se´ miologie de la musique. Paris: Union Ge´ ne´ rale d’Editions. Nattiez, Jean-Jacques (1987), Musicologie ge´ ne´ rale et se´ miologie. Paris: Bourgois. Naur, Peter (1963) (ed.), “Revised Report on the Algorithmic Language ALGOL 60”. Numerische Mathematik, 4: 420⫺453. Nettl, Bruno (1957), North American Indian Musical Styles. Philadelphia: American Folklore Society. Nettl, Bruno (1983), The Study of Ethnomusicology. Glencoe: Free Press. Niemann, Heinrich (1974), Methoden der Mustererkennung. Frankfurt/M.: Akademische Verlagsgesellschaft. Niemann, Heinrich (1983), Klassifikation von Mustern. Heidelberg und Berlin: Springer. Niemann, Heinrich, and Horst Bunke (1987), Künstliche Intelligenz in Bild- und Sprachanalyse. Stuttgart: Teubner.
I. Systematik Noll, Thomas (1995), Morphologische Grundlagen der abendländischen Harmonik. Tübingen: Stauffenburg. Oehrle, Richard T., Emmon Bach and Deirdre Wheeler (1988), Categorial Grammars and Natural Language Structures. Dordrecht: Kluwer. Ogden, Charles K., and Ivor A. Richards (1923), The Meaning of Meaning. London: Kegan Paul. Pape, Uwe (ed.) (1980), Discrete Structures and Algorithms. Munich and Vienna: Hanser. Paˇ un, Gheorge (1982), Gramatici Contextuale. Bucharest: Editura Academiei. Pause, Eberhard (1976), Zur Theorie transformationeller Syntaxen. Frankfurt/M.: Athenaion. Peano, Guiseppe (1894), Notations de logique mathe´ matique. Introduction au formulaire de mathe´ matique. Turin: Guadagnini. Peirce, Charles S. (1897), “The Logic of Relatives”. The Monist 7: 161⫺217. Reprint in Ch. Hartshorne and P. Weiss (eds.), The Collected Papers of Charles S. Peirce. Vol. 3. Cambridge MA: Harvard University Press: § 456⫺552. Peirce, Charles S. (1931⫺1958), The Collected Papers of Charles S. Peirce. 8 Vols. Ed. Ch. Hartshorne and P. Weiss (vols. 1⫺6) and A. W. Burks (vols. 7⫺8). Cambridge MA: Harvard University Press. Peirce, Charles S. (1934), “The Simplest Mathematics”. In Peirce 1931⫺1958. Vol. 4. Peirce, Charles S. (1973), The New Elements of Mathematics. 4 Vols. Ed. C. Eisele. The Hague and Paris: Mouton. Perlmutter, David (1982), “Levels and the Notion of Subject”. In Jacobson and Pullum 1982: 283⫺ 340. Perlmutter, David (ed.) (1983), Studies in Relational Grammar. Vol. 1. Chicago: Chicago University Press. Perlmutter, David, and Carol Rosen (eds.) (1984), Studies in Relational Grammar. Vol. 2. Chicago: Chicago University Press. Peter, P. Stanley, and R. W. Ritchie (1969), “Context-Sensitive Immediate Constituent Analysis: Context-Free Languages Revisited”. In: ACM Symposium on Theory of Computing 1⫺8. Reprint in: Mathematical Systems Theory 6 (1973): 324⫺ 333. Peters, P. Stanley, and R. W. Ritchie (1973), “On the Generative Power of Transformational Grammar”. Information Sciences 6: 49⫺83. Petitot-Cocorda, Jean (1985 a), Les catastrophes de la parole. Paris: Maloine. Petitot-Cocorda, Jean (1985 b), Morphogene`se du sens. Paris: Presses Universitaires de France. Pike, Kenneth L. (1954), Language in Relation to a Unified Theory of the Structure of Human Behavior. Santa Ana CA: Summer Institute of Linguistics.
2. Syntactics Pike, Kenneth L. (1966), “Etic and Emic Standpoints for the Description of Behavior”. In: A. G. Smith (ed.), Communication and Culture: Readings in the Codes of Human Interaction. New York: Holt, Rinehart and Wiston: 152⫺163. Pollard, Carl, and Ivan A. Sag (1987), InformationBased Syntax and Semantics. Vol. 1: Fundamentals. Stanford CA: Center for the Study of Language and Information, CSLI Lecture Notes 13. Posner, Roland (1971), “Strukturbeschreibung und Beschreibungsstruktur in einer Phrasenstrukturgrammatik”. In: D. Wunderlich (ed.), Probleme und Fortschritte der Transformationsgrammatik. Munich: Hueber: 72⫺86. Posner, Roland (1979), “Charles Morris und die verhaltenstheoretische Grundlegung der Semiotik”. Zeitschrift für Semiotik 1: 49⫺79. Posner, Roland (1982), Rational Discourse and Poetic Communication. Methods of Linguistic, Literary, and Philosophical Analysis. Berlin, Paris, and New York: Mouton. Posner, Roland (1988), “Balance of Complexity and Hierarchy of Precision: Two Principles of Economy in the Notation of Language and Music”. In: Michael Herzfeld and Lucio Melazzo (eds.), Semiotic Theory and Practice. Berlin and New York: de Gruyter: 909⫺919. Post, Emil L. (1936), “Finite Combinatory Processes: Formulation 1”. Journal of Symbolic Logic 1: 103⫺105. Postal, Paul (1964), Constituent Structure: A Study of Contemporary Models of Syntactic Descriptions. Bloomington IN: Indiana University Publications in Folklore and Linguistics. Postal, Paul M. (1982): “Some Arc Pair Grammar Descriptions”. In Jacobson and Pullum 1982: 341⫺425. Prieto, Luis J. (1966), Messages et signaux. Paris: Presses Universitaires de France. Pullum, Geoffrey K., and Gerald Gazdar (1982), “Natural Languages and Context-Free Languages”. Linguistics and Philosophy 4: 471⫺504. Putnam, Hilary, and Paul Benacerraf (eds.) (1964), Philosophy of Mathematics: Selected Readings. Englewood Cliffs NJ: Prentice-Hall. Quine, Willard V. O. (1946), “Concatenation as a Basis for Arithmetic”. Journal of Symbolic Logic 11: 105⫺114. Reprint in W. V. O. Quine, Selected Logic Papers. New York: Random House 1966: 70⫺82. Quine, Willard V. O. (1960), Word and Object. Cambridge MA: MIT Press. Rabin, Michael O., and Dana Scott (1959), “Finite Automata and Their Decision Problems”. IBM Journal of Research and Development 3: 114⫺125. Radford, Andrew (1981), Transformational Syntax. A Student’s Guide to Chomsky’s Extended Standard Theory. Cambridge, England: Cambridge University Press.
81 Radford, Andrew (1988), Transformational Grammar. Cambridge, England: Cambridge University Press. Reichenbach, Hans (1947), Elements of Symbolic Logic. London: Collier-Macmillan. Riemsdijk, Henk van, and Edwin Williams (1986), Introduction to the Theory of Grammar. Cambridge MA: MIT Press. Roberts, Don D. (1973), The Existential Graphs of Charles Peirce. The Hague and Paris: Mouton. Rogers, Hartley (1967), Theory of Recursive Functions and Effective Computability. New York: McGraw-Hill. Rogers, Steven, K., and Matthew Kabrisky (1991), An Introduction to Biological and Artificial Neural Networks for Pattern Recognition. 2nd edition. Bellingham WA: The International Society for Optical Engineering. Rose, Horace E. (1984), Subrecursion. Functions and Hierarchies. Oxford: Oxford University Press. Rosendahl, Manfred (1973), Zur Beschreibung mehrdimensionaler Zeichenketten durch formale Sprachen. Bonn: Berichte der Gesellschaft für Mathematik und Datenverarbeitung 76. Rosenfeld, Azriel (1976), “Array and Web Languages: An Overview”. In Lindenmayer and Rozenberg 1976: 517⫺529. Rosenfeld, Azriel (1979), Picture Languages. New York: Academic Press. Rosenfeld, Azriel, and James P. Strong (1971), “A Grammar for Maps”. Software Engineering 2: 227⫺239. Rounds, William C. (1970), “Mappings and Grammars on Trees”. Mathematical System Theory 4: 257⫺287. Rozenberg, Grzegorz, and Arto Salomaa (eds.) (1974), L-systems. Heidelberg, Berlin and New York: Springer. Lecture Notes in Computer Science 15. Russell, Bertrand (1919), Introduction to Mathematical Philosophy. London: Allen and Unwin. Ruwet, Nicolas (1966), “Me´ thodes d’analyse en musicologie”. Re´ vue Belge de Musicologie 20: 65⫺90. Sager, Naomi (1981), Natural Language Information Processing. A Computer Grammar of English and Its Applications. Reading MA, London and Amsterdam: Addison-Wesley. Saint-Martin, Fernande (1987), Semiotics of Visual Language. Bloomington IN: Indiana University Press. Salomaa, Arto (1973), Formal Languages. New York: Academic Press. Saussure, Ferdinand de (1916), Cours de linguistique ge´ ne´ rale. Ed. C. Bally, A. Sechehaye, and A. Riedlinger. Lausanne and Paris: Payot. English translation by W. Baskin: Course in General Linguistics. London: Peter Owen 1959.
82 Schnelle, Helmut (1970), “Zur Entwicklung der theoretischen Linguistik”. Studium Generale 23: 1⫺23. Schnelle, Helmut (1973), Sprachphilosophie und Linguistik. Prinzipien der Sprachanalyse a priori and a posteriori. Reinbek: Rowohlt. Schnelle, Helmut (1979), “Syntax und Semantik ⫺ Wo stehen wir heute?” Linguistische Berichte 63: 1⫺25. Schönberg, Arnold (1922), Harmonielehre. Vienna: Universal Edition. Schroeder, Ernst (1890), Vorlesungen über die Algebra der Logik. Leipzig: Teubner. Seeger, Charles (1960), “On the Moods of a Music Logic”. Journal of the American Musicological Society 13: 224⫺261. Sells, Peter (1985), Lectures on Contemporary Syntactic Theories. An Introduction to GovernmentBinding Theory, Generalized Phrase Structure Grammar, and Lexical-Functional Grammar. Stanford CA.: Center for the Study of Language and Information. CSLI Lecture Notes 3. Shaumyan, Sebastian K. (1970), “Linguistic Models as Artificial Languages Simulating Natural Languages”. In: B. Visentini et al. (eds.), Linguaggi nella societa` e nella tecnica. Milan: Edizioni di Comunita`: 285⫺302. Shaw, Alan C. (1969), “A Formal Description Scheme as a Basis for Picture Processing Systems”. Information and Control 14: 9⫺52. Shieber, Stuart M. (1986), An Introduction to Unification-Based Approaches to Grammar. Stanford CA.: Center for the Study of Language and Information. CSLI Lecture Notes 4. Smolka, Gert (1988), A Feature Logic with Subsorts. Stuttgart: IBM Germany. LILOG-Report 33. Smolka, Gert (1989), Feature Constraints for Unification Grammars. Stuttgart: IBM Germany. Institute for Knowledge-Based Systems. IWBS Report 93. Sober, Elliott (1975), Simplicity. Oxford: Clarendon Press. Steedman, Mark (1985), “Dependency and Coordination in Dutch and English”. Language 61: 523⫺568. Stoffer, Thomas H. (1985), “Representation of Phrase Structure in the Perception of Music”. Music Perception 3: 191⫺220. Stowell, Tim (1989), “Subjects, Specifiers and XBar Theory”. In: M. R. Baltin and A. S. Kroch (eds.), Alternative Conceptions of Phrase Structure. Chicago and London: University of Chicago Press: 232⫺262. Suppes, Patrick (1969), “Stimulus-Response Theory of Finite Automata”. Journal of Mathematical Psychology 6: 327⫺355. Suppes, Patrick, and William Rottmayer (1974), “Automata”. In: E. C. Carterette and M. P. Fried-
I. Systematik man (eds.), Handbook of Perception Vol. I. New York: Academic Press: 335⫺362. Tarasti, Eero (1979), Myth and Music. The Hague: Mouton. Thatcher, James W. (1967), “Characterizing Derivation Trees of a Context-Free Grammar through a Generalization of Finite Automata Theory”. Journal of Computing and System Sciences 1: 317⫺322. Thatcher, James W. (1973), “Tree Automata: An Informal Survey”. In: A. V. Aho (ed.), Currents in Theory of Computing. Englewood Cliffs NJ: Prentice-Hall. Thom, Rene´ (1972), Stabilite´ structurelle et morphogene`se. Essai d’une the´ orie ge´ ne´ rale des mode`les. Paris: Ediscience. English translation by D. Fowler: Structural Stability and Morphogenesis: An Outline of a General Theory of Models. Reading MA: Benjamin 1975. Thom, Rene´ (1980), Mode`les mathe´ matiques de la morphogene`se. 2nd edition. Paris: Bourgois. Thompson, D’Arcy Wentworth (1917), On Growth and Form. Reprint Cambridge, England: Cambridge University Press 1961. Thue, Axel (1914), “Probleme über Veränderungen von Zeichenreihen nach gegebenen Regeln”. Skr. Viensk. Selsk. Kristiana I, 10: 1⫺34. Trakhtenbrot, Boris A. (1960), “Algoritmy i mashinnoe reshenie zadach”. Gosudarstvennoe Izdatel’stvo Techniko-teoreticˇ eskoj Literatury, Moscow. English translation by J. Kristian, J. D. McCawley and S. A. Schmitt: Algorithms and Automatic Computing Machines. Boston: Heath 1963. Trubetzkoy, Nikolaj S. (1929), “Zur allgemeinen Theorie der phonologischen Vokalsysteme”. Travaux du Cercle Linguistique de Prague 1: 39⫺67. Trubetzkoy, Nikolaj S. (1939), Grundzüge der Phonologie [⫽ Travaux du Cercle Linguistique de Prague 7]. 2nd edition Göttingen: Vandenhoeck and Ruprecht 1958. Turing, Alan M. (1937), “On Computable Numbers with an Application to the Entscheidungsproblem”. Proceedings of the London Mathematical Society 42: 230⫺265 and 43: 544⫺546. Turing, Alan M. (1950), “Computing Machinery and Intelligence”. Mind 59: 433⫺460. Uexküll, Jakob von (1972), Bedeutungslehre. Leipzig: Bios. Uszkoreit, Hans (1986), “Categorial Unification Grammars”. In: Proceedings of the 11th International Conference on Computational Linguistics and the 24th Annual Meeting of the Association for Computational Linguistics. Bonn: Institut für Kommunikationsforschung und Phonetik: 187⫺194. Wahl, Friedrich-M. (1984), Digitale Bildsignalverarbeitung. Berlin and Heidelberg: Springer. Wall, Robert (1972), Introduction to Mathematical Linguistics. Englewood Cliffs NJ: Prentice-Hall. Wang, Jün-tin (1968), Zur Anwendung kombinatorischer Verfahren auf die Formalisierung der Syntax. Bonn: JPK-Forschungsbericht 68⫺5.
83
3. Semantik Wankmüller, F. (1987), “Application of Graph Grammars in Music Composing Systems”. In Ehrig, Rozenberg and Rosenfeld 1987: 580⫺592. Wasow, Thomas (1985), “Postscript”. In Sells 1985: 193⫺205. Watt, William C. (1975), “What is the Proper Characterization of the Alphabet? I: Desiderata”. Visible Language 9: 293⫺327. Watt, William C. (1980), “What is the Proper Characterization of the Alphabet? II: Composition”. Ars Semeiotica 3: 3⫺46. Watt, William C. (1981), “What is the Proper Characterization of the Alphabet? III: Appearance”. Ars Semeiotica 4: 269⫺313. Watt, William C. (1988), “What is the Proper Characterization of the Alphabet? IV: Union” Semiotica 70: 190⫺241. Weinberg, Amy S. (1988), “Mathematical Properties of Grammars”. In: F. J. Newmeyer (ed.), Linguistics: The Cambridge Survey. Vol. I: Linguistic Theory: Foundations. Cambridge, England: Cambridge University Press: 416⫺429. Weir, David Jeremy (1988), Characterizing Mildly Context-Sensitive Grammar Formalisms. University of Pennsylvania at Philadelphia. Ph. D. dissertation.
Wells, Rulon S. (1947), “Immediate Constituents”. Language 23: 81⫺117. Wexler, Kenneth, and Peter W. Culicover (1980), Formal Principles of Language Acquisition. Cambridge MA: MIT Press. Whitehead, Alfred N., and Bertrand Russell (1910⫺1913), Principia Mathematica. 3 Vols. Cambridge, England: Cambridge University Press. Wildgen, Wolfgang (1982), Catastrophe-Theoretic Semantics. Amsterdam: Benjamins. Wittgenstein, Ludwig (1922), Tractatus logicophilosophicus. London: Kegan Paul. Wunderlich, Dieter (1971), “Terminologie des Strukturbegriffs”. In: Jens Ihwe (ed.), Literaturwissenschaft und Linguistik. Frankfurt/M.: Athenäum: 91⫺140. Zeevat, Henk, Ewan Klein and Jo Calder, “Unification Categorial Grammar”. In: N. Haddock, E. Klein and G. Morrill (eds.): Categorial Grammar, Unification Grammar and Parsing. Edinburgh: Centre for Cognitive Science, Edinburgh Working Papers in Cognitive Science 1: 195⫺222. Zeitler, Herbert, and Wolfgang Neidhardt (1993), Fraktale und Chaos. Darmstadt: Wissenschaftliche Buchgesellschaft.
Roland Posner and Klaus Robering, Berlin (Germany)
3. Semantik 1. Aufgaben der Semantik 1.1. Informationsmittel und ihre Systeme 1.2. Semantische Schlüsselbegriffe und Bedeutungstheorien 1.3. Die Architektur semantischer Systeme 2. Wahrheit und Referenz 2.1. Metasprache und Objektsprache 2.2. Wahrheit als Schlüsselbegriff 2.3. Wahrheit, Referenz und Designation 2.4. Das Kompositionalitätsprinzip 2.5. Syntaktisches Nachspiel 3. Attribute und multiple Denotation 3.1. Ein Informationsmittel mit klassifikatorischen Ausdrücken 3.2. Syntaktik und anschauliche Semantik von FO 3.3. Multiple Denotation 3.4. Attribute 3.5. Typen semantischer Einheiten 4. Klassische Methoden: Erfüllbarkeit, Modell- und Folgebegriff 4.1. Querbezug und Variablennotation 4.2. Die Folgebeziehung als Schlüsselbegriff 4.3. Syntaktisches Vorspiel 4.4. Modelle für L(G) 4.5. Definitionen und semantische Primitive
5.
6.
7.
8.
9.
4.6. Theorien und ihre Kodifikate 4.7. Gehalt und semiotische Folge 4.8. Diskursrepräsentationstheorie (DRT) Intensionale Semantik 5.1. Propositionen, Eigenschaften und Individuenkonzepte 5.2. Kontext, Inhalt und Charakter 5.3. Kritik und Weiterentwicklung: Partialität und Hyperintensionen 5.4. Theorie kommunikativer Kräfte Konstruktive Semantik 6.1. Semantischer Realismus und Antirealismus 6.2. Dummetts Argument 6.3. Behauptungen, Beweise und Konstruktionen Monotonie und Dynamik: Domain-Theorie 7.1. Verfahren und ihre Darstellung durch Flußdiagramme 7.2. Funktionen als Zuordnungsregeln: operationale Semantik 7.3. Funktionen als Zuordnungsgraphen: denotationale Semantik Situationstheorien und Situationssemantik 8.1. Sachverhalte als semantische Einheiten 8.2. Die Situationssemantik und ihre Situationstheorie Literatur (in Auswahl)
84
1.
I. Systematik
Aufgaben der Semantik
1.1. Informationsmittel und ihre Systeme Ein Gegenstand der Semiotik sind Informationsmittel; das sind Mittel, die Zeichenbenutzer verwenden, Informationen auszusenden, sich anzueignen oder untereinander auszutauschen; vgl. Carnaps (1942: 3) Begriff des „means of communication“ als semiotische Verallgemeinerung des Sprachbegriffs und Lieb (1968: Kap. 8, 9) über Informationskomplexe. Als Variablen für Informationsmittel verwende ich „I“, „I0“, „I1“ usw. Natürliche und formale Sprachen, Programmiersprachen, Funkkodes, Notenschriften und sogenannte Tiersprachen sind Beispiele für Informationsmittel. Diese besitzen gewöhnlich verschiedene Ausprägungen: natürliche Sprachen zum Beispiel Dialekte, Soziolekte, Fach- und Sondersprachen. Das Informationsmittel der internationalen Verkehrszeichen hat, was Schilderbestand und materiale Beschaffenheit der Schilder anbelangt, national verschiedene, leicht voneinander abweichende Ausprägungen. Programmiersprachen gibt es meist in verschiedenen Varianten (z. B. Cobol 59 und 65, Algol 60 und 68). Sogar die ‘Bienensprache’ gliedert sich in unterschiedliche Dialekte; vgl. von Frisch (1965: 292⫺300). Informationsmittel weisen also häufig eine interne Differenzierung in durch lokale, temporale oder andere Faktoren bedingte Ausprägungen auf (vgl. auch Art. 105 § 1.1. zum Begriff des Diasystems). Diese Ausdifferenzierung kann sogar von der Benutzergemeinschaft mehr oder minder bewußt gesteuert werden; vgl. Putnams (1975: 227) Theorie der „division of linguistic labor“ und ihrer semantischen Auswirkungen. ⫺ Im Gegensatz zu Informationsmitteln werden Kodes (s. Art. 16) vielfach als homogen (nicht-differenziert) und systematisch aufgefaßt. Systeme sind abstrakte Gebilde, mit denen Semiotiker Informationsmittel und deren Ausprägungen beschreiben, während die Informationsmittel selbst ihren Seinsgrund in den konkreten, raumzeitlich lokalisierbaren Verwendungen ihrer Zeichen haben. Einige, aber nicht alle Informationsmittel haben Systeme; Anzeichen (s. Art. 4 und Art. 5) zum Beispiel haben nicht immer Systeme. Als Systemvariablen verwende ich „S“, „S0“, „S1“ usw. Nach dem hier zugrunde gelegten Verständnis ist also ein Informationsmittel I kein System, es hat allenfalls ein System S. Ist im folgenden von der Beschreibung eines Informationsmittels I durch ein System S die
Rede, so heißt dies, daß zumindest eine Ausprägung von I das System S hat. Über den Status von Systemen kann man verschiedener Ansicht sein: Eine mögliche Position insistiert, daß bei festgelegtem Abstraktionsniveau der semiotischen Beschreibung ein Informationsmittel I nur ein einziges System S haben kann. Dieses System S sei z. B. dadurch ausgezeichnet, daß es allein den psychischen Mechanismus erfasse, aufgrund dessen Benutzer von I dieses Informationsmittel verwenden. Die Gegenposition kann dagegen einwenden, daß Objekte unter verschiedenen Aspekten beschrieben werden können und es daher unterschiedliche, aber gleich gute Beschreibungen S0, S1, S2, … von I geben kann. In der Sprachwissenschaft sind diese Standpunkte zum Beispiel in der Auseinandersetzung zwischen „god’s truth“ und „hocus pocus linguistics“ diskutiert worden: vgl. Hokkett (1948) und Art. 101 § 3.2.1. Hier kann diese Grundlagenfrage aber unentschieden gelassen werden. Unter einer semantischen Theorie (oder auch kurz: „Semantik“) eines Informationsmittels I wird hier die detaillierte Beschreibung des semantischen Teils eines I zugewiesenen Systems S verstanden. Der Bequemlichkeit halber werde ich statt „semantischer Teil des Systems S von I“ einfach „semantisches System S von I“ sagen. (Die „S“-Variablen werden also künftig auch als Variablen für semantische Teile von Systemen von Informationsmitteln verwendet.) Die Entwicklung semantischer Theorien für einzelne Informationsmittel ist das bisher am intensivsten bearbeitete Gebiet der Semantik, weshalb in diesem Artikel hauptsächlich Systemsemantik dargestellt wird. Die Semantik untersucht aber auch zum Beispiel den Systemwechsel (diachrone Semantik), das Zusammenwirken verschiedener semantischer Systeme im „code switching“ oder in der multimedialen Kommunikation und die Entstehung solcher Informationsmittel, deren semantische Systeme auf in der Benutzergemeinschaft geltenden Konventionen beruhen; dazu etwa Lewis (1969); vgl. Art. 17. Die semantische Analyse nicht-systematischer Informationsmittel liegt im Überschneidungsbereich von Semantik und Pragmatik, da sie wesentlich Gebrauch von einer Beschreibung der interpretativen Fähigkeiten der Semioseteilnehmer machen muß (vgl. Art. 4). ⫺ Was genau beschreibt man nun aber mit semantischen Systemen? Die Beantwortung dieser Frage ist abhängig von der jeweils vertrete-
3. Semantik
nen semiotischen Basistheorie, nach der man Semiosen beschreiben will. Es ist sogar der Standpunkt denkbar, daß es hier gar nichts zu beschreiben gibt und sich unmittelbar an die Syntaktik die Pragmatik anschließt; vgl. Art. 4 § 4. zu den Kode-Minimalisten. Die meisten semiotischen Theorien gehen aber davon aus, daß Zeichen neben syntaktischen Eigenschaften, die ihre Ausdrucksgestalten (hier verwendete Variablen: „z“, „j“, „f“, „x“, ggf. mit Ziffernsubskripten) betreffen, und pragmatischen Eigenschaften ihrer Verwendungen in Semiosen noch eine dritte Art von Qualitäten aufweisen: semantische Eigenschaften, vermittels derer sie etwas bedeuten. „Bedeuten“ und „Bedeutung“ werden dabei im gesamten Artikel im vortheoretischen Sinne, also insbesondere nicht so wie bei Frege (s. Art. 102) verwendet. Semantische Eigenschaften betreffen also gerade die dritten Relata in der klassischen Erklärung, daß vermittels einer Zeichenrelation ein Ausdruck z für einen Interpreten D b bedeutet (vgl. Art. 1 § 2.). Je nachdem, wie weit man „bedeutet“ hier faßt, enthält b mehr oder weniger. Versteht man es so wie in „z bedeutet für D, x zu tun“, so zählen zu b auch diejenigen Zeicheneigenschaften, die den Interpreten in seinem Verhalten beeinflussen, die ihn zum Beispiel zu einem bestimmten Tun veranlassen. Falls das „bedeutet“ der Erklärung auch so verstanden werden kann wie in „z bedeutet für D ein gewisses Behagen (oder auch Unbehagen)“, so umfaßt b auch Zeicheneigenschaften, die D emotional beeinflussen; vgl. z. B. Alston (1967) zur emotiven Bedeutung. Wenn man das „bedeutet“ der Erklärung so versteht, wie das „stellt … dar“ in „z stellt für D x dar“, so gelangt man zum Begriff der deskriptiven Bedeutung. Unter der deskriptiven Bedeutung eines Ausdrucks z eines Informationsmittels I mit System S verstehe ich das, was z gemäß S (für alle Interpreten D) darstellt. Diese deskriptive Bedeutung von z darf keinesfalls mit dem deskriptiven Gebrauch von z, d. h.: der Verwendung von z zum Zwecke der Behauptung (oder Sachverhaltsbeschreibung), identifiziert werden. Auch wenn ein Ausdruck etwa zu Zwecken der Aufforderung oder der Gefühlsäußerung gebraucht wird, hat er eine deskriptive Bedeutung. Mit der Verwendung eines Ausdrucks z in einer konkreten Semiose wird also nicht nur seine deskriptive Bedeutung übermittelt, seine Verwendung hat auch einen bestimmten Witz. Etwas soll zum Beispiel erfragt, behauptet
85 oder befohlen werden. Offensichtlich kann aber zum Beispiel etwas, was behauptet werden kann, zumindest häufig auch erfragt werden; deskriptive Bedeutung und Verwendungsweise sind eben nicht miteinander zu identifizieren. In Anlehnung an Frege (1918/ 1919: 62⫺64) ist es üblich geworden, den Bedeutungsaspekt, der auf den Witz der Zeichenverwendung abzielt, „Kraft“ zu nennen. Frege selbst hat allerdings keine solche Theorie der Kräfte entwickelt; dies ist erst in der sogenannten „Sprechakttheorie“ (Grice 1957, Austin 1962, Searle 1969) geleistet worden. Dort spricht man genauer von „illokutionären Kräften“. Die semantische Theorie eines Informationsmittels I hat also auch darzustellen, welche illokutionären Kräfte ein Benutzer von I mit den Ausdrücken von I ausüben kann; vgl. dazu auch unten § 5.4. Mit der deskriptiven Bedeutung und der illokutionären Kraft (sowie motivativen und emotiven Bedeutungsaspekten) ist der semantische Gehalt eines Ausdrucks aber keineswegs erschöpft. Für ihn spielt zum Beispiel auch die Gliederung eines Informationsmittels in verschiedene Ausprägungen eine Rolle. Die Verwendung von „Schrippe“ läßt etwa auf dem Hintergrund der Nicht-Anwendung von „Brötchen“ und „Wecken“ Rückschlüsse auf die regionale Herkunft eines Zeichenverwenders zu. Diese Schlüsse beruhen aber nicht auf der deskriptiven Bedeutung, die für alle drei Ausdrücke (ungefähr) dieselbe ist, sondern auf der Zugehörigkeit zu verschiedenen regionalen Ausprägungen desselben Informationsmittels (cf. Art. 4 § 3.4.). In Anlehnung an Hjelmslev (1961: 114) könnte man hier von „konnotativer“ Bedeutung sprechen und die als deskriptive Bedeutung eingeführte Größe in „Denotation“ umbenennen (vgl. auch Art. 117). Der Ausdruck „Konnotation“ wird allerdings in vielen, voneinander abweichenden Weisen verwendet: manchmal für den emotiven Bedeutungsaspekt und manchmal für das, was in § 5. (s. u.) als „Intension“ eingeführt wird. 1.2. Semantische Schlüsselbegriffe und Bedeutungstheorien Von einem semantischen System S eines Informationsmittels I wird man verlangen, daß es für jeden Ausdruck z von I dessen deskriptive Bedeutung(en) angibt. Die einfachste Art, dies für den Fall nur endlich vieler Ausdrücke mit nur endlich vielen Bedeutungen zu leisten, bestände in der Angabe einer Li-
86 ste. Für ein Informationsmittel mit unendlich vielen Ausdrücken (formale und natürliche Sprachen etwa) wäre aber dieses Verfahren bereits ausgeschlossen, und auch für die endlichen Informationsmittel ist eine bloße Auflistung wenig aufschlußreich. ⫺ Die Ausdrücke eines Informationsmittels lassen sich ja in Grundausdrücke ohne semantisch relevante syntaktische Struktur und in syntaktisch komplexe Ausdrücke einteilen, die aus Grundausdrücken mittels syntaktischer Operationen aufgebaut sind. Die Bedeutungen syntaktisch komplexer Ausdrücke hängen einerseits von ihrem syntaktischen Bau, andererseits von den Bedeutungen der in ihnen enthaltenen Teilausdrücke ab. Diese syntaktisch-semantische Abhängigkeit sollte ein semantisches System auch dann beschreiben, wenn aufgrund der Endlichkeit der Ausdrücke und Bedeutungen eine bloße Auflistung möglich wäre. Innerhalb semantischer Systeme lassen sich somit zwei Teilsysteme unterscheiden: das zu den Grundausdrücken und das zu den komplexen Ausdrücken gehörige. Spätestens bei der Beschreibung des letzteren Teilsystems wird man auf syntaktische Analysen zurückgreifen müssen. Zu einer solchen Analyse gehört unter anderem die Einteilung der verschiedenen Ausdrücke in syntaktische Kategorien (vgl. unten § 1.3. und Art. 2). Die Bedeutungen von Ausdrücken verschiedener syntaktischer Kategorien können sich jeweils in ihrer Art, ihrem ontologischen Status voneinander unterscheiden. So bedeuten zum Beispiel in der Notenschrift die Schlüssel Tonhöhen, die Linien Tonhöhenabstände und die Noten Zeiteinheiten. In der elementararithmetischen Notation bedeuten „⫹“, „⫺“, „·“ und „:“ Rechenoperationen, die Ziffern Zahlen, „⫽“, „⬍“ und „⬎“ Beziehungen zwischen Zahlen. Die meisten semiotischen Analysen sehen nun die verschiedenen Arten von Bedeutungen für Ausdrücke unterschiedlicher Kategorien nicht als gleichberechtigt an, sondern zeichnen eine Ausdruckskategorie und die damit verbundene Bedeutungsart vor den anderen als besonders grundlegend aus. Die ausgezeichnete Bedeutungsart hat die Rolle eines Schlüssels für das Verständnis des semiotischen Funktionierens des beschriebenen Informationsmittels: Sie stellt den semantischen Schlüsselbegriff (Dummett 1976: 75: „central notion“; Platts 1980: 3: „semantic key concept“) bereit. Dies ist der Begriff, den ein Zeichenbenutzer erfassen muß, um die Ausdrücke eines Informa-
I. Systematik
tionsmittels verstehen zu können: Das Verständnis der Ausdrücke nicht-ausgezeichneter Kategorien leitet sich von der Beherrschung des semantischen Schlüsselbegriffs her. In der abendländischen Grammatik- und Logiktradition sind zum Beispiel häufig die Satzkategorie und der Wahrheitsbegriff als ihr adäquater Schlüsselbegriff ausgezeichnet worden (vgl. Art. 40, 42, 49, 52, 64 und 76). Die Bedeutung eines Satzes zu verstehen, heiße zu wissen, unter welchen Bedingungen er wahr ist. Vorschläge dieser Art finden sich bei einer Reihe klassischer und moderner Autoren von Aristoteles bis hin zu Davidson. Demgegenüber ist aber häufig ⫺ insbesondere in Hinblick auf Theorien empirischer Wissenschaften ⫺ eingewendet worden, daß das Verständnis eines Satzes mehr verlange als die bloße Kenntnis seiner Wahrheitsbedingungen: nämlich das Verfügen über ein Verfahren, mit dem das Vorliegen dieser Bedingungen auch wirklich festgestellt werden kann. Die Bedeutung eines Satzes sei die Methode zu seiner Verifikation (bzw. Falsifikation), vgl. Art. 106 und 107. Schlick (1936) gilt als ein Begründer der sogenannten „Verifikationstheorie der Bedeutung“. Nach ihr ist Verifizierbarkeit und nicht Wahrheit der adäquate semantische Schlüsselbegriff. Harman (1974: 11) stimmt der verifikationistischen Kritik am wahrheitszentrierten Vorgehen zu, hält aber die Verifikationstheorie der Bedeutung nur für eine „simplified form“ eines adäquaten Ansatzes. Der Schlüssel zum Verständnis eines Satzes liegt nach Harman in seiner Rolle, die er für das konzeptuelle System der Zeichenbenutzer spielt. Dieses umfaßt beispielsweise Glaubensannahmen, Erwartungen und Handlungsdispositionen; und es wird durch Sinneserfahrungen, fremde und eigene Handlungen verändert. Man nennt diesen Ansatz „conceptual role semantics“ (Field 1977, Harman 1987); sein Schlüsselbegriff ist der der konzeptuellen Rolle. Ganz ähnlich meint auch Gärdenfors (1988: 18⫺20), daß Akzeptanzkriterien semantischen Vorrang gegenüber Wahrheitsbedingungen haben. Diese Kriterien betreffen die Auswirkungen, die ein Satz auf das Annahmensystem eines Zeichenbenutzers hätte, wenn er von dem Benutzer als wahr akzeptiert würde. Satzbedeutungen (Propositionen; vgl. unten § 5. und § 8.2.4.) lassen sich dann als Transformationen von Annahmensystemen definieren (Gärdenfors 1988: Kap. 6). Hier spielt der Akzeptanzbegriff die Rolle des semantischen Schlüssels.
3. Semantik Durchaus umstritten ist, ob man bei jedem Informationsmittel mit einem einzigen Schlüsselbegriff auskommt. Problematisch ist auch, wie sich der (oder die) Schlüsselbegriff(e) zur Theorie der Kraft verhalten. Stenius trennt zum Beispiel die Semantik des Satzradikals mit dem Schlüsselbegriff der Wahrheit von der Semantik der Satzmodi (illokutionären Kräfte), die er in Anschluß an Wittgenstein (1958) durch Sprachspiele deutet (s. Stenius 1967: 266⫺268). Seine Gesamtsemantik ist dualistisch aufgebaut. Demgegenüber sind zwei monistische Positionen möglich. Alston (1964: 34⫺39) versucht, die auf die deskriptive Bedeutung abzielenden semantischen Begriffe definitorisch auf solche aus der Theorie der Kraft zurückzuführen, während umgekehrt Zaefferer (1979) illokutionstheoretische Begriffe mit Hilfe des Begriffs der Wahrheit (in einem Kontext eines Modells; vgl. § 5.2.) analysieren möchte. Wird nur ein einziger Schlüsselbegriff ausgezeichnet, so hat dieser zumeist eine besondere Beziehung zum deskriptiven Zeichengebrauch. Auch hier stellt sich die Adäquatheitsfrage: Werden nicht zum Beispiel neben der Wahrheit weitere semantische Zentralbegriffe benötigt, die sich etwa zum Fragen oder zum Auffordern so verhalten, wie die Wahrheit zum Behaupten? Positive Antworten, die sich gegen reduktionistische Ansätze richten, geben etwa Belnap (1982: 17⫺25) für den Fall des Fragens und Hamblin (1987: 97⫺136) für den Fall des Aufforderns, während Tichy´ (1978: 275) meint, daß weder eine spezielle Fragelogik noch „[…] a special logic of conjectures, of wishes, prayers, prejudices, promises, or insults“ vonnöten sei; zur Gegenposition vgl. insbesondere Belnap (1990).
Fragen dieser Art werden nicht in semantischen Theorien, die ja jeweils bestimmte Informationsmittel behandeln, beantwortet, sondern in Bedeutungstheorien. Bedeutungstheorien erklären, was als Bedeutung überhaupt in Frage kommt und warum; sie liefern auch die Begründungen für die Wahl bestimmter Schlüsselbegriffe. Semantische Einheiten sind die möglichen Bedeutungen, die eine Bedeutungstheorie für Ausdrücke zur Verfügung stellt. Eine semantische Theorie eines Informationsmittels I baut auf einer Bedeutungstheorie auf und gibt eine semantische Interpretation der Ausdrücke von I an, d. h.: sie gibt für jeden Ausdruck von I an, welche der von der Bedeutungstheorie bereitgestellten semantischen Einheiten er bedeutet. 1.3. Die Architektur semantischer Systeme Meistens wird die semantische Interpretation von der syntaktischen Analyse des Informationsmittels I Gebrauch machen müssen. Diese umfaßt zumindest: (i) eine vollständige Auflistung der Grundausdrücke; (ii) eine
87 Aufstellung der syntaktischen Kategorien, in die Grundausdrücke und komplexe Ausdrücke eingeteilt werden; (iii) für jeden Grundausdruck die Angabe, zu welcher (ggf.: zu welchen) syntaktischen Kategorie(n) er gehört; (iv) eine Beschreibung der syntaktischen Operationen, mit deren Hilfe die komplexen Ausdrücke gebildet werden; (v) eine Liste der dabei zu befolgenden syntaktischen Regeln. Diese Angaben ermöglichen es, (vi) zu jeder syntaktischen Kategorie die Klasse der wohlgeformten Ausdrücke dieser Kategorie anzugeben. Zur Art und Weise, wie die semantische Interpretation auf diesen syntaktischen Daten aufbaut, beherrschen zur Zeit drei Hypothesen die Diskussion: die kompositionale, die konfigurationale und die restriktionale Hypothese. Die kompositionale Hypothese beruht auf dem sogenannten „Frege-Prinzip“, nach dem die Bedeutung eines komplexen Ausdrucks eindeutig durch die Bedeutungen seiner in ihm enthaltenen Grundausdrücke und durch seinen syntaktischen Bau bestimmt ist. Dieses Prinzip läßt sich trotz seines Namens in der Semiotikgeschichte weit über Frege hinaus zurückverfolgen, und ob Frege dieses Prinzip tatsächlich so vertreten hat, ist sogar strittig (vgl. Sluga 1980: 180 f; zu Frege s. Art. 102). Eine kompositionale semantische Interpretation funktioniert so: Die Bedeutung der Grundausdrücke wird durch Auflistung angegeben. Zu jeder syntaktischen Operation des untersuchten Informationsmittel wird eine semantische Operation als ihr Gegenstück bestimmt. Ergibt sich nun ein Ausdruck z durch regelgerechte Anwendung einer syntaktischen Operation auf andere Ausdrücke z1, z2, … zm, so erhält man die Bedeutung von z aus den Bedeutungen von z1, … zm, indem man auf diese das semantische Gegenstück der verwendeten syntaktischen Operation anwendet (Beispiele folgen in den nächsten Abschnitten dieses Artikels). Da jeder Ausdruck letztlich syntaktisch aus Grundausdrücken aufgebaut ist, deren Bedeutungen aufgelistet sind, weist eine solche kompositionale Interpretation jedem Ausdruck eine Bedeutung zu. ⫺ Hat ein Ausdruck z mehrere Bedeutungen, obwohl keiner der in ihm vorkommenden Grundausdrücke mehrdeutig ist, so kann dies nach der kompositionalen Hypothese nur daran liegen, daß es für ihn mehrere verschiedene syntaktische Analysen gibt. Folgt man der kompositionalen Hypothese, kann es daher vorkommen, daß man, um eine Mehrdeutigkeit erfas-
88 sen zu können, für ein Informationsmittel eine syntaktische Analyse zugrunde legen muß, die komplizierter ist, als es rein syntaktische Gesichtspunkte erfordern. Beim kompositionalen Vorgehen ist die Syntaktik Knecht der Semantik. (Ein Beispiel für syntaktische Mehrdeutigkeit wird in Art. 2 § 4.6. analysiert.) Dieses Vorgehen ist typisch für semantische Theorien, die sich an der Modelltheorie (der semantischen Teiltheorie der modernen Logik, s. u. § 4. und Art. 76) orientieren. Viele Linguisten beharren darauf, daß jede Ebene eines zu einer natürlichen Sprache gehörigen Systems ihre eigenen Prinzipien hat und man daher den syntaktischen Systemteil nicht einfach aufgrund semantischer Bedürfnisse ummodeln darf. Die Syntaktik ist gegenüber der Semantik autonom. Sie liefert als Eingaben für das semantische Interpretationsverfahren Ausdrücke, die nach den ihr eigentümlichen Prinzipien analysiert sind. Solche Analysen lassen sich durch Diagramme, zum Beispiel Baumgraphen, veranschaulichen. Die semantische Interpretation hat dann zwar nach semantikspezifischen Grundsätzen, aber unter Berücksichtigung der in diesen Diagrammen vorliegenden Konfigurationen (der Baumgeometrie) zu erfolgen; vgl. zu diesem konfigurationalen Vorgehen Higginbotham (1985). Dabei ist durchaus möglich, daß einem Ausdruck mehrere Bedeutungen zugeordnet werden, obwohl er nur eine einzige syntaktische Struktur besitzt und auch keine mehrdeutigen Grundausdrücke enthält. Die syntaktische Struktur eines Ausdrucks z betrifft durchaus unterschiedliche Eigenschaften von z, zum Beispiel die Art und Weise, wie z aus Teilausdrücken aufgebaut ist (seine Konstituentenstruktur), und die Beziehungen, die zwischen diesen Teilen bestehen (die sogenannte „funktionale“ Struktur von z; man denke etwa an grammatische Beziehungen wie „ist Attribut zu“, „ist Subjekt von“ usw.). Diese verschiedenen Strukturaspekte können in unterschiedlicher Weise zur Bedeutung von z beitragen (vgl. Halvorsen 1983: 569⫺578). Keiner dieser Aspekte legt für sich die Bedeutung von z eindeutig fest; jeder einzelne schränkt sie aber ein. So könnte etwa die Konstituentenstruktur nur b1, b2, b3 als mögliche Bedeutung von z in Frage kommen lassen, während nach der funktionalen Struktur nur b1, b3, b4 und b5 in Betracht kommen. Insgesamt bleiben also nur b1 und b3 als Bedeutungen für z übrig.
I. Systematik
So funktioniert der restriktionale Ansatz, der als Radikalisierung und Verallgemeinerung des konfigurationalen gelten kann (vgl. Halvorsen 1987; Fenstad, Halvorsen, Langholm und van Benthem 1986). Ebenso wie syntaktische Eigenschaften funktionieren nach ihm auch die Bedeutungen der Grundausdrücke: Sie legen keineswegs die Bedeutung von z fest, sie beschränken aber das Spektrum dessen, was z überhaupt bedeuten könnte. Syntaktische Eigenschaften und Grundausdrucksbedeutungen sind aber nicht die einzigen Beschränkungen für das Bedeutungsspektrum eines Ausdrucks z. Bei einer Verwendung von z in einer konkreten Semiose können die dort geltenden Umstände die Bedeutung von z kontextuell beschränken. Das restriktionale Interpretationsverfahren ist also von vornherein auf eine möglichst vollständige Erfassung aller bedeutungsstiftenden Zusammenhänge hin angelegt. Die Anwendung dieses Verfahrens ist typisch für die sogenannte „Situationssemantik“ (Barwise und Perry 1983; vgl. § 8.2.); es ist aber unabhängig von der Bedeutungstheorie der Situationssemantik und kann mit anderen bedeutungstheoretischen Annahmen verbunden werden. In den folgenden Abschnitten dieses Artikels werden jeweils verschiedene Informationsmittel durch Angabe semantischer Systeme beschrieben. Hierbei werden zentrale semantische Begriffe und Vorgehensweisen anhand konkreter, nicht gar zu trivialer Beispiele eingeführt und erläutert. Zusammen mit den einzelnen Systemen werden die sie berührenden bedeutungstheoretischen Fragen behandelt. Die zunächst behandelten Systeme legen den Wahrheitsbegriff als semantischen Schlüsselbegriff zugrunde, die folgenden Systeme entfernen sich immer mehr von dieser Konzeption. Die behandelten Interpretationsverfahren sind zumeist kompositional; es werden jedoch auch andere Strategien (s. § 4.7. und § 4.8.) berücksichtigt.
2.
Wahrheit und Referenz
2.1. Metasprache und Objektsprache Das semantische System S1, das unser erstes Beispiel abgibt, gehört zum Informationsmittel RA (⫽ römische Additionsarithmetik). RA umfaßt eine Ziffernnotation zur Zahldarstellung und eine Notation für einfache Gleichungen. Wie die meisten Informationsmittel, so besitzt auch RA verschiedene Ausprägungen. Eine Schwierigkeit, die zur Ausbil-
89
3. Semantik
dung solcher unterschiedlichen Ausprägungen führt, ist die Wiedergabe großer Zahlen. So wird z. B. die Zahl 5000 u. a. durch die Ausdrücke „ll傻傻“, „V“ und „| V |“ wiedergegeben (vgl. Ifrah 1981: 339 f). Ferner unterscheiden sich einige Ausprägungen von RA durch die Konsequenz, mit der sie das subtraktive Prinzip bei der Zahldarstellung befolgen: Für 48 findet man etwa das rein additiv gebaute „XXXXVIII“, das gemäßigt subtraktive „XLVIII“ und das konsequenter subtraktive „XLIIX“. Aufgrund dieser internen Differenziertheit kann ein Vorkommnis einer Zahldarstellung für einen Philologen als konnotative Bedeutung (s. o. § 1.2.) Informationen über Entstehungszeit und -ort mit sich führen. Auch von Zeichenbenutzern kann die Variabilität absichtsvoll konnotativ benutzt werden, zum Beispiel bei der Beschreibung einer großen Kriegsbeute, wobei die rein additive Darstellung mit ihrem immensen Ausdrucksaufwand in ikonischer Weise genutzt wird (s. Ifrah 1981: 340). ⫺ Im folgenden wird hier eine solche Ausprägung der Ziffernnotation beschrieben, die gemäßigt subtraktiv ist und bei der Darstellung großer Zahlen (⬎ 1000) rein additiv verfährt (also „MMMMM“ für 5000 benutzt); zur Zahldarstellung vgl. Posner (1984), zur römischen Ziffernnotation Art. 78 § 4.3. und dort Abb. 19. Als „Ziffer“ bezeichne ich jede Darstellung einer Zahl ⫺ gleichgültig, ob diese aus nur einem oder aus mehreren Ausdrücken besteht („I“, „V“ usw. sind also ebenso Ziffern wie „II“ oder „III“). Die Lösungen einfacher Additionsaufgaben, die die Summierung mehrerer Zahlen ⫺ z. B. 137 und 469 ⫺ verlangen, wurden in der römischen Rechentechnik vermutlich so dargestellt, daß die Summanden von unten nach oben aufgelistet und in der obersten Zeile (⫽ summa linea ⬎ summa; vgl. Schmidt 1906: 7) das Ergebnis hingeschrieben wurde. Mehrere Additionen können hintereinandergeschaltet werden, wobei die Ziffern abgearbeiteter Zahlen durchgestrichen oder auf der Tafel gelöscht wurden (vgl. Hultsch 1958: Sp. 5⫺6), so daß nur das jeweils letzte Ergebnis als nichtgestrichen erscheint. Der komplexe Ausdruck (1a) entspricht also unserer Gleichung „137 ⫹ 469 ⫽ 606“ oder unserem (1b). (1a)
DCVI CDLXIX CXXXVII
(1b)
137 469 1 1
606
Die Angabe eines semantischen Systems setzt eine syntaktische Beschreibung des zu analysierenden Informationsmittels voraus, die mit der vollständigen Auflistung der Grundausdrücke beginnt (s. o. § 1.3.). (2) Die Grundausdrücke von RA sind: I, V, X, L, C, D, M und ∑. Will man ein Informationsmittel analysieren, so benötigt man dazu wiederum ein Informationsmittel, um zum Beispiel die Ausdrücke des beschriebenen Informationsmittels benennen zu können. In der Logik ist es seit Tarski (1935c: 22) üblich geworden, von der „Metasprache“ zu reden, mit der die Objektsprache, das Objekt der Analyse also, beschrieben wird. Der Begriff der Metasprache findet sich der Sache nach zum Beispiel bereits bei Frege (1923: 280), der von der „Hilfssprache“ spricht, die einem hilft, seine Gedanken auszudrücken, und von der „Darlegungsprache“, in der man seine Untersuchungen über die Hilfssprache darlegt. Tarskis Metasprachenbegriff geht auf Unterscheidungen seines Lehrers Les´niewski zurück, vgl. Tarski (1936b: 2) und Art. 106 zur Semiotik der Warschau-Łwow-Schule. Auch Hjelmslevs Begriff des metasemiotischen Systems („metasemiotics“, vgl. Hjelmslev 1961: 119 f) ist von der polnischen Logikerschule inspiriert. Tarski hat die Objekt-/Metasprachen-Unterscheidung zur Vermeidung der sogenannten „semantischen Antinomien“ (s. u. § 5.3.1.) getroffen; zum Funktionieren der Tarskischen Dichotomie in diesem Zusammenhang s. Church (1976: 755⫺758).
Als Metasprache wird in diesem Artikel eine um semiotisches Fachvokabular ergänzte Ausprägung des Deutschen verwendet. Bisher wurden Anführungsnamen als metasprachliche Bezeichnungen für Ausdrücke benutzt: „ „I“ “ ist ein Name des Ausdrucks „I“, der dieselbe Zahl I darstellt wie der Ausdruck „1“. Um Anhäufungen von Anführungszeichen wie im vorigen Satz zu vermeiden, werden Ausdrücke auch häufig autonym, d. h.: als Namen ihrer selbst, verwendet. Dies ist bereits in der Auflistung (2) geschehen; in RA stellt also „I“ eine Zahl dar, das autonym verwendete „I“ gehört nicht zu RA, sondern zur Metasprache, in der es den Ausdruck „I“ bezeichnet. Im folgenden wird, um Unübersichtlichkeiten zu vermeiden, häufig die autonyme Gebrauchsweise bevorzugt. Um aus den Grundausdrücken von (2) komplexe Ausdrücke wie zum Beispiel (1a) zu bilden, werden drei syntaktische Operationen benötigt: (i) die Konkatenation J1, (ii) das Auftürmen J2 und (iii) das Durchstrei-
90
I. Systematik
chen J3. In (3) werden diese Operationen definiert und durch Beispiele verdeutlicht. (3) Definitionen: Beispiele: J1 (z, j) ⫽ zj J1 (D, C) ⫽ DC J2 (z, j) ⫽
J3
冢冣 z1 : : zn
z j
J2 ⫽
(CDLXIX, CDLXIX ⫽ CXXXVII) CXXXVII
∑ z1 : CDLXIX CDLXIX ⫽ : J3 ⫽ CXXXVII CXXXVII ∑ zn
冢
冣
Die metasprachlichen Bezeichnungen „J1“, „J2“ und „J3“ ermöglichen es, Ausdrücke von RA noch in einer weiteren Weise zu benennen: „J1(I, I)“ ist z. B. eine komplexe Bezeichnung für II. Solche Bezeichnungen heißen „strukturell-deskriptive Namen“ (Tarski 1935c: 9), da sie Ausdrücke aufgrund ihrer internen Struktur eindeutig benennen. Da sie die syntaktischen Strukturen der von ihnen benannten Ausdrücke beschreiben und nicht bloß zeigen, werden sie bei der Darstellung technischer Zusammenhänge dem autonymen Gebrauch vorgezogen. ⫺ Ausdrücke, wie sie J2 bildet, sollen „Säulen“ heißen; „Kolumnen“ sind Säulen nicht durchgestrichener Ziffern, und eine Ziffernsäule, in der lediglich die erste Ziffer nicht gestrichen ist, ist eine Gleichung von RA. Also ist (1a) eine Gleichung; (4a) zeigt ein weiteres Beispiel, dessen strukturell-deskriptiver Name in (4b) angegeben ist. (4a) III ∑ II ∑ I (4b) J2(J1(J1(I, I), I), J3(J2(J1(I, I), I))) 2.2. Wahrheit als Schlüsselbegriff Was heißt es nun, die Bedeutung des Ausdrucks (1a) von RA zu kennen, also (1a) zu verstehen? Folgende Mindestanforderungen an das Verständnis erscheinen plausibel: (i) Jemand, der weiß, daß 137 plus 469 gleich 606 ist, aber (1a) nicht versteht, weiß zwar aufgrund seiner arithmetischen Kenntnisse nicht, daß (1a) wahr ist; aber umgekehrt folgt aus dem Verständnis von (1a) und der arithmetischen Kenntnisse das Wissen um die Wahrheit von (1a). (ii) Wenn 137 plus 469 nicht 606 wäre, so müßte jemand, der dieses wüßte und (1a) versteht, (1a) für falsch erklären. Insgesamt ergibt sich so als Mindestanforderung an ein Verständnis von (1a): Wer diesen Ausdruck versteht, muß wissen, daß er genau dann wahr ist, wenn 137 plus 469
606 ergibt. Den Wahrheitsbegriff zum semantischen Schlüsselbegriff für RA zu wählen, heißt, diese Mindestanforderung (jedenfalls für die verfolgten Zwecke) für hinreichend zu erachten; für ein solches Vorgehen ist insbesondere von Davidson (1967: 1973) argumentiert worden. ⫺ Zwei Mißverständnissen gilt es hier vorzubeugen. (i) Es wurde nicht behauptet, daß man einen Ausdruck wie (1a) nur dann versteht, wenn man weiß, daß er wahr bzw. falsch ist; man muß lediglich die Bedingungen kennen, unter denen ein solcher Ausdruck wahr ist. Hat man sich an die römische Notation gewöhnt, so versteht man solche Ausdrücke auf Anhieb, obwohl man sich nach wie vor erst durch Nachrechnen von ihrer Wahrheit oder Falschheit überzeugen wird. (ii) Daß ein Ausdruck falsch ist, bedeutet nicht, daß er keine Wahrheitsbedingungen hat, sondern lediglich, daß diese Bedingungen nicht erfüllt sind. Falsche Sätze sind nicht bedeutungs- oder sinnlos. Um Wahrheitsbedingungen für Ausdrücke von RA formulieren zu können, benötigt man metasprachliche Ausdrücke, die dasselbe auszusagen gestatten, wie die objektsprachlichen Ausdrücke selbst: Man muß also über Zahlen, Gleichheit und Addition sprechen können. Zu diesem Zwecke enthält unsere Metasprache zum Beispiel: „1“, „2“, …, „⫹“, „⫽“. Nun ist ein Ausdruck von RA sicherlich dann wahr, wenn seine metasprachliche Übersetzung wahr ist. Bei einer adäquaten semantischen Beschreibung von RA müßte daher (5) gelten. (5) Wird in dem Ausdruck „z ist genau dann ein wahrer Ausdruck von RA, wenn p“ für „z“ ein strukturell-deskriptiver Name einer Gleichung von RA und für „p“ deren Übersetzung eingesetzt, so ergibt sich dadurch ein wahrer Satz der Metasprache. Dies ist die auf RA bezogene Fassung von Tarskis Konvention W (engl.: „convention T“ s. Tarski 1935c: 46). Ein Satz, der sich durch korrekte Einsetzungen der in (5) beschriebenen Art ergibt, ist ein W-Satz (engl.: „T-sentence“). Mit Hilfe des strukturell-deskriptiven Namens (4b) für die Gleichung (4a) bildet man zum Beispiel den W-Satz (6). (6) J2(J1(J1(I, I), I), J3(J2(J1(I, I), I))) ist genau dann ein wahrer Ausdruck von RA, wenn 1 ⫹ 2 ⫽ 3 ist.
91
3. Semantik
Tarskis Konvention W ist ein Maßstab für die adäquate Erfassung des Wahrheitsbegriffs (Maßstäbe werden per Konvention festgelegt): In einer semantischen Beschreibung wird der Wahrheitsbegriff nur dann adäquat charakterisiert, wenn sich alle WSätze als wahr erweisen. Eine semantische Beschreibung ist gut, wenn jeder W-Satz die Wahrheitsbedingungen des in ihm übersetzten objektsprachlichen Ausdrucks angibt. Eben aus diesem Grunde hält Davidson (1967 und 1973) das Tarskische Vorgehen für angemessen. Ein Problem hierbei ist aber, daß in der Konvention W bereits eine semantische Beziehung vorausgesetzt wird: die Übersetzungsrelation. Eine Pseudo-Übersetzung, die zwar Wahres durch Wahres und Falsches durch Falsches wiedergibt, dabei aber die Bedeutungen der übersetzten Ausdrücke völlig außer Acht läßt, würde die Konvention W ebenso erfüllen wie eine inhaltlich angemessene Übertragung; ihr läge aber sicherlich keine adäquate semantische Analyse zugrunde (vgl. Foster 1976: 10⫺12, Loar 1976: 139 f und Etchemendy 1988b: 56⫺64). 2.3. Wahrheit, Referenz und Designation Das System S1 für RA muß also (i) für jede Gleichung von RA angeben, unter welchen Bedingungen sie wahr ist, (ii) dabei die Konvention W erfüllen und zwar (iii) so, daß eine einsichtsvolle Übersetzungsrelation verwendet wird. Nun legt die gewöhnliche Redeweise, daß ein Ausdruck bedeutungsvoll oder bedeutsam sei, nahe, daß er dies darum sei, weil es eine semantische Einheit gibt, die er bedeutet. Aber nach der gerade skizzierten Konzeption von S1 zeigt sich die Bedeutsamkeit der Gleichungen von RA nicht in einer besonderen Beziehung zu irgendwelchen semantischen Einheiten, sondern in den Bedingungen, unter denen sie eine bestimmte Eigenschaft, nämlich die der Wahrheit, haben. Dennoch läßt sich auch für die Gleichungen die naive Auffassung technisch simulieren: Es werden zwei Objekte ⫺ W und F ⫺ ausgewählt, die als Kode-Objekte für Wahrheit und Falschheit benutzt werden. Statt also zu sagen, daß eine Gleichung z wahr (falsch) ist, sagt man nun: z bedeutet W (bzw.: F). Die beiden Kode-Objekte W und F bezeichnet man in Anschluß an Frege als „Wahrheitswerte“. Für das Folgende wird eine solche Wahl von W und F vorausgesetzt, daß eine Verwechslung mit irgendwelchen echten semantischen Einheiten ausgeschlossen ist.
(Für RA heißt dies zum Beispiel, daß W und F keine Zahlen sein sollen.) ⫺ Die Verwendungsweise von „bedeutet“ in „z bedeutet W“ hat einen solch technischen Charakter, daß ein Kunstausdruck hier angemessener ist. Mehrere Vorschläge sind dafür unterbreitet worden: Church (1956: 25) sagt etwa, daß ein Satz seinen Wahrheitswert denotiere („denotes“, das ist eine der gängigen engl. Übersetzungen für Freges „bedeuten“), während Carnap (1947: 6 und 1972: 8), dem hierin gefolgt werden soll, „designieren“ verwendet. Eine Gleichung z designiert also einen Wahrheitswert, und dieser ist das Designat von z. „Des“ bezeichnet die Funktion, die einem Ausdruck z sein Designat Des(z) zuweist; ist also z wahr (falsch), so gilt: Des(z) ⫽ W (bzw.: ⫽ F). S1 zeichnet die Gleichungen als Träger des semantischen Schlüsselbegriffs aus. Nach § 1.2. ist die Bedeutung eines jeden Ausdrucks j, der syntaktischer Teil eines ausgezeichneten Ausdrucks z ist, der Beitrag, den j zum Zutreffen oder Nicht-Zutreffen des Schlüsselbegriffs auf z leistet. Dieser Beitrag von j dazu, daß Des(z) ⫽ W oder Des(z) ⫽ F, soll dann selbst als „Designat“ von j bezeichnet werden: Des (j). Ein Ausdruck, der überhaupt ein Designat hat, ist ein Designator (Carnap 1947: 6 und 1972: 8). Worin besteht also zum Beispiel das Designat einer Ziffer oder einer Säule? Designatsgleiche Ausdrücke leisten denselben Beitrag zum Wahrheitswert. Solche Ausdrücke müssen daher in Gleichungen gegeneinander ausgetauscht werden dürfen, ohne daß sich dabei am Wahrheitswert, also am Designat, der betroffenen Gleichung etwas ändert. Es kann sich nichts ändern, da ja die ausgetauschten Ausdrücke denselben Beitrag zum Wahrheitswert leisten! Um eine Antwort auf die Frage nach dem Designat etwa der Ziffernsäule zu erhalten, die in (1a) gestrichen vorkommt, muß man also diese Säule gegen andere austauschen und prüfen, wie sich das auf den Wahrheitswert der dabei entstehenden Gleichungen auswirkt: Nur solche Säulen können dasselbe Designat haben, die bei diesem Austausch den Wahrheitswert unverändert lassen. So erhält man zwei Gruppen von Kolumnen: (7) zeigt solche, die den Wahrheitswert bei einem solchen Austausch unverändert lassen, während die Kolumnen von (8) ihn zu F ändern. (7)
CCCIII CCCIII
CC CC CCVI
CCL CCL CVI
XC CXC CCCXXVI
92 (8)
I. Systematik
MMMIII MMMIII
CL CL CL III
XXV XXV XIII
IX XIX XXXIII
Die Designate der Kolumnen aus (7) müssen von denen der in (8) verschieden sein. Den Kolumnen in (7) ist gemein, daß die Summe der Zahlen, die von ihren Ziffern dargestellt werden, 606 ergibt, und es ist klar, daß jede Kolumne mit dieser Eigenschaft in der Gleichung (1a) gegen die dortige Kolumne ohne Veränderung des Wahrheitswertes ausgetauscht werden darf. Diese Summe kann also als gemeinsames Designat dieser Kolumnen gewählt werden, und es dürfte schwerfallen, an ihnen eine weitere Gemeinsamkeit festzustellen, mit der sie die Wahrheitswerte von Gleichungen beeinflussen. Da es also keine andere plausible Wahl gibt, gilt Des(z) ⫽ 606 für jeden Ausdruck z, den (7) zeigt. ⫺ Für Ziffern läßt sich dieselbe Überlegung anstellen. Somit gelangt man zu dem Resultat: Ziffern designieren die von ihnen dargestellten Zahlen, Kolumnen die Summen der Zahlen, die die in ihnen aufgetürmten Ziffern designieren. ⫺ Vielleicht möchte man hier einwenden, daß man dies von vornherein gesagt hätte. Ja, aber das ist Intuition und nicht Semantik! In einer semantischen Analyse müssen die einzelnen Schritte und ihre Resultate durch Argumente gerechtfertigt werden. Wenn die Argumente zu demselben Ergebnis wie die naive Anschauung gelangen ⫺ um so besser! Gleichungen, Kolumnen und Ziffern sind zwar gleichermaßen Designatoren, aber doch von recht unterschiedlicher Natur. Die Zahlen, d. h. die Designate der Ziffern und Kolumnen, spielen ja keineswegs so wie die Wahrheitswerte die Rolle bloßer Kode-Objekte; Zahlen machen im Gegenteil gerade das Thema von RA aus. RA dient dazu, Verhältnisse zwischen Zahlen darzustellen. Ziffern und Kolumnen grenzen auch die von ihnen designierten Zahlen aus dem Bereich der positiven ganzen Zahlen (1, 2, …) aus, während sich von einer Gleichung kaum sagen läßt, daß sie einen Wahrheitswert ausgrenze. In Gleichungen wird etwas über die Designate mitgeteilt, die Ziffern und Kolumnen ausgrenzen; aber in Gleichungen wird keinesfalls etwas über Wahrheitswerte ausgesagt. Aufgrund ihrer Eigentümlichkeit verdient die Ziffern und Kolumnen betreffende Art der Designation auch einen eigenen Namen. Auch dazu sind verschiedene terminologische
Vorschläge unterbreitet worden, von denen „Referenz“ und „Denotation“ wohl die häufigsten sind. Hier wird der erste Terminus zusammen mit seiner deutschen Entsprechung „Bezug“ verwendet. Also referiert die Ziffer IV auf die Zahl 4, 4 ist das Bezugs- oder Referenzobjekt von IV, und IV ist ein referierender Ausdruck. Die Funktion Des ist eine Amalgamierung des Schlüsselbegriffs der Wahrheit mit der Referenzbeziehung. Referenz ist eine semantische Beziehung von außerordentlicher Wichtigkeit (s. u. § 5.2.). Was aber eine Referenzbeziehung genau ist, läßt sich in voller Allgemeinheit, ohne Rückgriff auf konkrete Beispiele, schwer sagen. Zwei Kennzeichen lassen sich der Darstellung von S1 entnehmen: (i) Das Bezugsobjekt g eines Ausdrucks z ist das, was z aus dem Realitätsbereich ausgrenzt, von dem das betreffende Informationsmittel thematisch handelt (daher die Vorkommnisse des Wortes „über“ in obigen Erläuterungen, vgl. auch § 8.1.1.). (ii) Der Bezug eines Ausdrucks ist das, wodurch er Einfluß auf den Schlüsselbegriff der Wahrheit nimmt. Referenz und Wahrheit sind also korrelativ: Sie gehören zu ein und demselben theoretisch-begrifflichen Rahmen (dazu insbesondere Quine 1960 und 1974 sowie Wallace 1970). ⫺ Damit sind aber die Kriterien für eine Referenzbeziehung keineswegs erschöpft. Ein weiteres wichtiges Merkmal ist, daß das Bezugsobjekt eines Ausdrucks im betreffenden semantischen System als ein Individuum (Gegenstand, Objekt) behandelt wird. Zweifellos gehört die Frage, was ein Individuum sei, zu denen, die so gut sind, daß man sie zu beantworten erst gar nicht versuchen sollte. Antwortversuche, die dennoch unternommen worden sind, führen eine Reihe von Kriterien an, die mit den Ausdrucksmöglichkeiten der behandelten Informationsmittel zusammenhängen. In erster Linie werden hier drei Phänomenbereiche genannt: (i) Identität, (ii) Prädikation und (iii) Quantifikation (vgl. die gerade angeführten Arbeiten Quines; die drei angeführten Begriffe gehören wie der des Individuum ins obige konzeptuelle Schema). Die Prädikation wird im 3., die Quantifikation im 4. Abschnitt behandelt. Über eine Möglichkeit, Identität auszudrücken, verfügt aber bereits RA: Die Zahl, auf die die oberste Ziffer einer Gleichung referiert, ist identisch mit der Summe der Zahlen, auf die die durchgestrichenen Ziffern referieren. In RA werden also Zahlen als Gegenstände behandelt. Dies zeigt, daß ein verbreitetes Mißverständnis der
93
3. Semantik
Referenzbeziehung auf einer falschen Annahme beruht: Referenzobjekte müssen keine (materiellen) Dinge sein, d. h. sie brauchen keineswegs in der Zeit lokalisierbar zu sein. Der Gegenstandsbegriff ist umfassender als der Dingbegriff. 2.4. Das Kompositionalitätsprinzip Die Designatfunktion Des ist bisher nur für einige Ausdrücke beispielshalber angegeben worden. Sie vollständig zu bestimmen, ist aber die wichtigste Aufgabe für S1; denn genau diese Funktion leistet ja die semantische Interpretation (s. o. § 1.3.) der Ausdrücke von RA. Der Anfang ist nach der Erklärung des kompositionalen Verfahrens in § 1.3. leicht gemacht: Die Designate der Grundziffern aus (2) werden durch die tabellarische Auflistung (9) angegeben. (9)
z
I
V X
L
C
D
M
Des(z)
1
5 10 50 100 500 1000
Der einzige Grundausdruck, der keine Grundziffer ist, also: ∑, erhält kein Designat; er ist kein Designator. ⫺ Um auch den syntaktisch komplexen Ziffern Designate zuweisen zu können, muß man nach § 1.3. zunächst den syntaktischen Operationen semantische Gegenstücke zuordnen. Ist dann zum Beispiel G⬘ das Gegenstück von J1, so müßte sich das Designat r eines mittels J1 aus z und j gebildeten Ausdrucks f aus den Designaten m von z und n von j durch G⬘ ermitteln lassen: r ⫽ G⬘(m, n) bei f ⫽ J1(z, j), m ⫽ Des(z) und n ⫽ Des(j). Für VI müßte also G⬘ das Designat 6 aufgrund des Designats 5 von V und des Designats 1 von I angeben: Des(VI) ⫽ G⬘(Des(V), Des(I)) ⫽ G⬘(5,1). Dieses Beispiel läßt einen vielleicht zunächst die Additionsoperation als semantisches Gegenstück G⬘ von J1 annehmen, denn Des(VI) ⫽ 6 ⫽ Des(V) ⫹ Des(I). Wegen der subtraktiven Notation führt G⬘ aber zu falschen Ergebnissen. Für IV ⫽ J1(I, V) ermittelt man zum Beispiel Des(IV) ⫽ Des(I) ⫹ Des(V) ⫽ 6, aber sicherlich muß Des(IV) ⫽ 4 sein! Nun könnte man vorschlagen, J1 durch die Subtraktion (in umgekehrter Reihenfolge) zu interpretieren, wenn es Ziffern z und j zu zj kombiniert und z auf eine kleinere Zahl als j referiert. Da Des(I) ⫽ 1 < Des(V) ⫽ 5, erhält man wunschgemäß Des(IV) ⫽ 5 ⫺ 1 ⫽ 4. Dieser Vorschlag verstößt gegen das kompositionale Prinzip, nach
dem jede syntaktische Operation nur ein einziges semantisches Gegenstück haben soll. Er führt auch, was schlimmer ist, ohne weitere Zusatzmaßnahmen zu falschen Ergebnissen. Für XIV ermittelt man nämlich aufgrund von J1(X, J1(I, V)) ⫽ XIV als Designat Des(XIV) ⫽ 10 ⫹ (5 ⫺ 1) ⫽ 14, aber wegen J1(J1(X, I), V) ⫽ XIV auch Des(XIV) ⫽ (10 ⫹ 1) ⫹ 5 ⫽ 16! ⫺ Dieses Beispiel zeigt, warum die Konkatenation J1 eine für das kompositionale Verfahren untaugliche syntaktische Operation ist. Die meisten Ziffern lassen sich ja in mehr als einer Weise mittels J1 aus den Grundziffern aufbauen. Solche syntaktischen Mehrdeutigkeiten können wie bei XIV dazu führen, daß einem Ausdruck fälschlicherweise mehrere Designate zugewiesen werden. Diese Mehrdeutigkeit der Konkatenation läßt sich aber vermeiden, wenn man verlangt, daß der angehängte Ausdruck stets ein Grundausdruck sein muß. Allerdings erhält man so statt des einen zweistelligen J1 sieben einstellige Operationen: FI, FV, FX, FL, FC, FD und FM (vgl. Hermes 1938: 8), wobei Fz(j) ⫽ J1(j, z) gilt (für z ⫽ I, V, …, M). Jetzt kann man nur noch auf einem Wege zu XIV gelangen: XIV ⫽ FV(FI(X)). Aber man muß auch passende semantische Gegenstücke G1, …, G7 für diese Operationen finden. Diese sind einigermaßen komplex. Sei im folgenden für n (1 ⱕ n ⱕ 7) cn ⫽ Des(z), wenn z die n-te der in (2) aufgelisteten Ziffern ist; ihr Designat läßt sich der Tabelle (9) entnehmen. Die sieben gesuchten Operationen sind für die positiven ganzen Zahlen und die beiden Wahrheitswerte bestimmt. (Letztere müssen berücksichtigt werden, weil die FOperationen in ihrer Anwendung völlig unbeschränkt sind. Man kann beispielsweise durch FC auch einer Gleichung ein C anhängen. Die syntaktischen Regeln, s. u. § 2.5., bestimmen, daß dabei allerdings nichts Wohlgeformtes entsteht.) Die semantischen Gegenstücke Gn (1 ⱕ n ⱕ 7) für FI, …, FM werden dann in (10) definiert.
Ï Ô Ô Gn (x) ⫽ Ì Ô Ô Ó
(10)
(x ⫹ cn), falls x eine durch cn ohne Rest teilbare Zahl ist, (x ⫹ cn) ⫺ 2r, falls x eine nicht durch cn teilbare Zahl und r der Rest der Division ist (bei x ⬍ cn ist r ⫽ x), F, falls x ein Wahrheitswert ist.
Mit Hilfe der Tabelle (9) und der in (10) definierten Operationen läßt sich nun jeder Ziffer von RA ein Designat zuweisen (vgl.
94 unten die Beispiele von (13)). Aber RA enthält ja auch noch Säulen und Gleichungen! ⫺ Als vertikale Konkatenation wirft die Säulenbildung J2 dieselben Probleme wie die horizontale J1 auf, wobei hier die aus den Grundziffern durch die neuen F-Operationen bildbaren Ausdrücke ⫺ sie sollen im folgenden „Präziffern“ heißen ⫺ die Rolle einnehmen, die für J1 die Grundziffern selbst spielen. Analog zum obigen Vorgehen wird daher J2 durch ein unendliches Ensemble FK z (z ist Präziffer) ersetzt, wobei FK z so definiert wird: FK z (j) ⫽ J2(z, j). Die Operation J3 wird stets zusammen mit einem FK z angewendet, da Säulen gestrichener Ziffern nur in Gleichungen vorkommen. Daher wird auch J3 durch eine Familie FzE (z ist Präziffer) syntaktischer Operationen ersetzt; es gilt: FzE (j) ⫽ E FK z (J3(j)). Fz ist also die Übertitelung einer Kolumne mit z bei gleichzeitiger Streichung aller Ziffern der Kolumne. Den neuen kolumnen- und gleichungsbildenden Operationen lassen sich leicht semantische Gegenstücke zuordnen. Zunächst beachte man, daß sich mit (9) und den in (10) bestimmten Gn jeder Präziffer ein (Quasi-)Designat zuweisen läßt, auch wenn sie keine wohlgeformte römische Ziffer ist (z. B. erhält VVV 15, VX 5 zugewiesen). Sei also m (Quasi-)Designat der Präziffer z; dann gibt (11) die Gegenstücke K E E GK m von Fz und Gm von Fz an. x ⫹ m, falls x eine Zahl ist; (11a) GK m (x) ⫽ F, falls x ein Wahrheitswert ist. W, falls x ⫽ m, E (11b) Gm (x) ⫽ F sonst. Der Säulenbildung entspricht also semanE wird der Wahrtisch die Addition. Mit Gm heitswert einer Gleichung ermittelt: Ist die Summe der von den gestrichenen Ziffern designierten Zahlen gleich dem Designat der obersten Ziffer, so ist er W, andernfalls F. Allen Designatoren von RA ⫺ Ziffern, Kolumnen und Gleichungen ⫺ kann nun ihr Designat zugewiesen werden. Entsteht z durch Anwendung der syntaktischen Operation F auf j und ist G das semantische Gegenstück von F, so ist das Designat von z der Wert, den G dem Designat von j zuweist. Es gilt dann (12). (12) Des(z) ⫽ G(Des(j)) Man sagt auch, Des setzte die Angaben von (9) für syntaktisch komplexe Ausdrücke entlang deren syntaktischer Struktur homomorph fort. Damit ist gemeint, daß Des die
I. Systematik
Syntaktik und die Semantik als strukturell ähnliche Algebren aufeinander bezieht, s. Abb. 3.1. syntaktische Algebra: semantische Algebra:
z ⫽ F(j) r ⫽ G(m)
Abb. 3.1: Das kompositionale Tandem-Prinzip. Die Arbeitsweisen syntaktischer (F) und semantischer Operationen (G) sind aufeinander abgestimmt wie die Bewegungen der beiden Fahrer eines Tandems. Die Pfeile stellen die Designatsfunktion dar, die die syntaktische Algebra homomorph in die semantische abbildet.
Da es zu jedem mit den F-Operatoren bildbaren Ausdruck z genau eine syntaktische Analyse gibt, die ihn auf Grundziffern zurückführt, deren Designate man (9) direkt entnehmen kann, läßt sich Des für z schrittweise ermitteln; (13) gibt ein Beispiel hierfür an. (13 a) Gegeben sei die Gleichung:
CLIV LI ∑I CI ∑I
(13 b) Syntaktische Analyse: CII ⫽ FI (FI (C)) LII ⫽ FI (FI (L)) CLIV ⫽ FV (FI (FL (C))) LII ⫽ FK LII (CII) CII
冉 冊
CLIV LII E LI ∑I ⫽ FCLIV CII CI ∑I
(13 c) Semantische Analyse: Des(CLIV) ⫽ Des(FV (FI (FL (C)))) wegen (13 b) ⫽ G2 (Des(FI (FL (C)))) wegen (12) ⫽ G2 (G1 (Des(FL (C)))) wegen (12) ⫽ G2 (G1 (G4 (Des(C)))) wegen (12) ⫽ G2 (G1 (G4 (100))) wegen ⫽ G2 (G1 (150)) wegen ⫽ G2 (151) wegen ⫽ (151 ⫹ 5) ⫺ 2 wegen ⫽ 154
(9) (10) (10) (10)
Des(LII) ⫽ Des(FI (FI (L))) wegen (13 b) ⫽ G1 (G1 (Des(L))) wegen (12) ⫽ 52 (9) und (10)
95
3. Semantik
Des(CII) ⫽ Des(FI (FI (C))) wegen (13 b) ⫽ 102 wie bisher Des
冉 冊
LII ⫽ Des(FK LII (CII)) wegen (13 b) CII K ⫽ G52 (102) ⫽ 154 (12)
冢 冣
冉 冊 冉 冊
CLIV LII E ⫽Des(FCLIV )wegen(13b) Des LI ∑I CII CI ∑I LII E ⫽ G154 (Des ) (12) CII ⫽ G154 (154) ⫽ W Der Begriff der wahren Gleichung von RA ist mit Hilfe der Des-Funktion leicht zu definieren: Eine Gleichung z ist genau dann wahr, wenn Des(z) ⫽ W. Verwendet man (wie bisher) die arabische Ziffer für Des(j) als metasprachliche Übersetzung der Ziffer j und benutzt die Definitionen der semantischen Operationen, so erhält man aufgrund der Wahrheitsdefinition W-Sätze, die einsichtsvolle Übersetzungen angeben; vgl. etwa (14) für (13a). E (14) FCLIV (FK LII(CII)) ist genau dann eine wahre Gleichung von RA, wenn 102 ⫹ 52 ⫽ 154 ist.
2.5. Syntaktisches Nachspiel Die semantische Beschreibungsaufgabe für RA wird durch Angabe von Des gelöst; Des leistet jedoch viel mehr, als eigentlich verlangt ist. Auch nicht-wohlgeformten Ausdrücken wird ein (Quasi-)Designat zugewiesen. Für S1 ist aber nur das Teilstück von Des interessant, das die wohlgeformten Ausdrücke von RA betrifft. In Hinblick auf folgende Beispiele soll hier noch kurz skizziert werden, wie diese Klasse wohlgeformter Ausdrücke zu bestimmen ist: Was wohlgeformt ist, legen syntaktische Regeln fest, und um die formulieren zu können, müssen die Ausdrücke in syntaktische Kategorien klassifiziert werden (s. o. § 1.3.). Drei solcher Kategorien sind bisher benutzt worden: die der Ziffern, der Kolumnen und der Gleichungen. Um bequem über solche Kategorien reden zu können, verwendet man sogenannte „Kategorienindizes“ als Abkürzungen für sie. Hier sollen „E“ für Gleichungen und „K“ für Kolumnen benutzt werden; die Ziffernkategorie wird im folgenden in feinere Kategorien zerlegt und erhält daher keinen Index. Für syntaktische Regeln soll die von Montague (1970: 376) eingeführte Standardrepräsentation benutzt werden. Danach ist eine Regel R eine Dreierfolge *F, *k1, …, kn+, k0+, wobei (i) F die durch R regle-
mentierte syntaktische Operation ist, (ii) die Indizes k1, …, kn die Kategorien angeben, denen die Ausdrücke angehören müssen, auf die F laut R angewendet werden darf (also bei RA stets: n ⫽ 1) und (iii) k0 die Kategorie des Anwendungsresultats benennt. Daß man zum Beispiel auf eine Kolumne eine Operation FEz anwenden darf und daß dabei eine Gleichung herauskommt, wird nun so beschrieben: REz ⫽ *FEz , *K+, E+. Hingegen besagt RjK ⫽ *FjK, *K+, K+, daß man eine neue Kolumne erhält, wenn man FjK auf eine Kolumne anwendet. Die Grundziffern der Liste (2) teilen die Gesamtheit der positiven ganzen Zahlen in vier Bereiche: Einer, Zehner, Hunderter, Große Zahlen (ⱖ 1000). Die Grundziffer, die jeweils die erste Zahl eines dieser Bereiche designiert, soll „Anfangsziffer“ heißen. Also sind I, X, C und M die Anfangsziffern. Ziffern, die auf zwei Vorkommnisse derselben Grundziffer enden, sind Doppelziffern (z. B.: II, VII, CXX). Fügt man einer Doppelziffer (z. B, II) ein drittes Vorkommnis ihrer letzten Grundziffer an (also z. B.: III), so entsteht eine nicht mehr erweiterbare, eine maximale Ziffer. Differenzenziffern sind die Ausdrücke, die dem gemäßigt subtraktiven Prinzip folgen, also z. B.: IX, XC, CM, und Zwischenziffern die Ausdrücke, die auf einer Grundziffer enden, die nicht Anfangsziffer ist⫺ also auf V, L oder D. Insbesondere sind diese Grundziffern selbst Zwischenziffern. Es folgen jetzt noch zwei Ziffernklassen, deren Ausdrücke sich durch ihre Ausbaumöglichkeiten unterscheiden: Einfach erweiterbaren Ziffern kann man noch eine weitere Grundziffer anfügen, ohne daß dadurch aber eine Differenzenziffer entsteht, z. B. VI, zu dem es VII gibt. Subtraktiv erweiterbare Ziffern lassen sich auch zu Differenzenziffern ausbauen; so hat man zu XI nicht nur die Doppelziffer XII, sondern auch die Differenzenziffer XIV. Diese Siebenerteilung muß noch mit einer Klassifikation in vier Ordnungen (1, 2, 3, 4) kombiniert werden: Bei den Grundziffern entsprechen die Ordnungen den vier Größenbereichen. Also ist I Anfangsziffer erster, M eine solche vierter Ordnung. In komplexen Ziffern übertragen die rechtsstehenden Grundziffern ihre Ordnung auf die der komplexen Ziffern. Dabei dürfen Ordnungen wie in MI übersprungen werden, wo man direkt von der vierten Ordnung (M) zur ersten (I) übergeht. Sieht man von den Differenzenziffern ab (vgl. MIX), so dürfen einmal übersprungene Ordnungen aber nicht nachgeholt werden. Benutzt man „A“ zur Kennzeichnung der Anfangsziffern, „G“ (vgl. „gemini“) für Doppelund „M“ für maximale Ziffern, „D“ für Differenzen-, „Z“ für Zwischenziffern, schließlich „O“ für einfach und „S“ für subtraktiv erweiterbare Ziffern, so erhält man neben E und K noch folgende Kategorien: Am, Gm, Dm, Zm, Om, Sm (1 ⱕ m ⱕ 3), A4 und G4. Sämtliche wohlgeformten Ausdrücke von RA gehören zu einer dieser 22 Kategorien. Für die Grundziffern hat man die Kategorienzugehörigkeit wieder anzugeben (s. o. § 1.3.): I gehört zu A1, V zu Z1, X zu A2, L zu Z2, C zu A3, D zu Z3 und M zu A4. ⫺ Aufgrund dieser
96
I. Systematik
Klassifikation lassen sich nun Regeln im bereits erklärten Standardformat erstellen. Die Gesamtzahl der notwendigen Regeln ist sehr groß, allerdings gibt es eine kleine Zahl wiederkehrender Muster. Statt sämtliche Regeln aufzuführen, gibt (15) Beispiele mit konkreten Anwendungen. (15) R1I ⫽ *FI, *Z1+, O1+: R2I ⫽ *FI, *O1+, G1+: R3I ⫽ *FI, *G1+, M1+: R1V ⫽ *FV, *A2+, Z1+: R1I s. o.: R4I ⫽ *FI, *A2+, S1+: R1X ⫽ *FX, *S1+, D1+:
FI(V) ⫽ VI gehört zu O1 FI(VI) ⫽ VII gehört zu G1 FI(VII) ⫽ VIII gehört zu M1 FV(X) ⫽ XV gehört zu Z1 FI(XV) ⫽ XVI gehört zu O1 FI(X) ⫽ XI gehört zu S1 FX(XI) ⫽ XIX gehört zu D1
Mithilfe solcher Regeln und der bereits angegebenen Regeln zur Bildung von Gleichungen und Kolumnen, läßt sich bestimmen, was ein wohlgeformter Ausdruck von RA ist: (i) Jede Grundziffer ist ein wohlgeformter Ausdruck der bereits angegebenen Kategorie. (ii) Ist z wohlgeformter Ausdruck der Kategorie k1 und R ⫽ *F, *k1+, k0+ eine Syntaxregel von RA, so ist F(z) ein wohlgeformter Ausdruck der Kategorie k0. (iii) Kein Ausdruck ist ein wohlgeformter Ausdruck irgendeiner Kategorie, wenn sich dies nicht aus (i) und (ii) ergibt. ⫺ Diese Definition läßt sich verwenden, um Des auf das interessante Teilstück einzuschränken, das die wohlgeformten Ausdrücke betrifft. Damit ist auch in dieser Hinsicht die semantische Beschreibung von RA abgeschlossen. Das nächste Informationsmittel hat neben wahrheitsfähigen (d. h.: wahren oder falschen) und referierenden Ausdrücken einen weiteren, in RA nicht vorkommenden Typ von Ausdrücken, die semantisch in anderer Weise funktionieren.
3.
Attribute und multiple Denotation
3.1. Ein Informationsmittel mit klassifikatorischen Ausdrücken S1 läßt sich durch nur drei Begriffe charakterisieren: den der Referenz, den der Wahrheit und den der Falschheit. Es gibt in RA keine Ausdrücke, die zum Beispiel speziell der Darstellung von Beziehungen zwischen Bezugsobjekten dienen, und ebenso fehlen Ausdrücke, mittels derer Klassifikationen der Bezugsobjekte (z. B. in gerade und ungerade Zahlen) darstellbar sind. Klassifizierende Ausdrücke sind charakteristisch für das In-
formationsmittel, welches Wilhelm Ostwald im Zeitraum zwischen 1915 und 1930 zur eindeutigen Kennzeichnung und anschaulichen Anordnung der Farben entwickelt hat; vgl. dazu Richter (1976: 159⫺164). Die hier beschriebene Ausprägung dieses Informationsmittels soll nach einem von Ostwald kommerziell vertriebenen Farbsortiment, das die Herstellung bestimmter Ausdrücke dieser Ausprägung ermöglichte, „FO“ (‘Farborgel’) genannt werden. Die Beschreibung von FO stützt sich dabei auf die Erläuterungen von Ostwald (1944); für eine tiefergehende semantische Analyse konsultiere man Carnap (1980: sec. 14). Wie andere Mittel der Farbkennzeichnung (z. B. das Normensystem nach DIN, Munsells Farbnotation) verfolgt auch FO zwei Zwecke: (i) Zu jedem Farbreiz r soll es einen Ausdruck z geben, der möglichst genau den Farbbereich kennzeichnet, dem r entstammt. (ii) Die dabei benutzten Ausdrücke sollen wichtige Zusammenhänge zwischen Farben (Mischung, harmonische Beziehungen usw.) darstellen. Es handelt sich dabei nicht um die Erfassung physikalischer Zusammenhänge zwischen Farbreizen, sondern um die psychologischer Beziehungen zwischen Farben. Zwei Farbreize, die von einem normalsichtigen Beobachter unter konstant gehaltenen Umständen für ununterscheidbar erachtet werden, sind (unter diesen Umständen, die für das Folgende als festgesetzt angenommen werden) metamer; eine maximale Gesamtheit untereinander metamerer Farbreize bildet eine Farbvalenz. Farbreize derselben Valenzen werden also empfindungsmäßig nicht unterschieden, weshalb FO, wo es um die Erfassung psychologisch-empfindungsmäßiger Zusammenhänge geht, von Valenzen und nicht von Farbreizen selbst handelt. FO basiert auf einer geometrisch anschaulichen Darstellung der Mannigfaltigkeit aller Valenzen: dem Ostwaldschen Farbkörper. Dieser ist ein Doppelkegel (s. Abb. 3.2), dessen Punkte die einzelnen Farbvalenzen darstellen. Sein Aufbau wird in § 3.2. genauer beschrieben. Diesen Doppelkegel zerlegt Ostwald in 680 überschneidungsfreie Teile, die ich „Zellen“ nenne. Der Empfindungsabstand zwischen Valenzen derselben Zelle ist so gering, daß er für Anwendungen von FO (ein Beispiel gibt unten § 4.2.) vernachlässigt werden darf. Für jede Zelle stellt FO eine Ziffern-Buchstaben-Kombination als Kodeausdruck bereit, die ich als „Farbprädikator“ bezeichne; die Farbprädikatoren bilden eine syntakti-
3. Semantik
Abb. 3.2: Der Ostwaldsche Farbkörper (nach Birren 1969: 18). Ostwalds Farbkörper ist ein Doppelkegel, dessen Spitzen von der reinen Weiß- und der reinen Schwarzvalenz besetzt sind. Die Achse des Farbkörpers bildet die Grauleiter; die beiden Halbkegel stoßen mit ihren Grundflächen zusammen, deren Peripherie der Farbtonkreis bildet. Das ausgeschnittene Segment veranschaulicht die Aufteilung des Farbkörpers in 680 Zellen. Ziffern und Buchstaben bilden ein Koordinatensystem für die Zellen; in Abb. 3.2 ist nur eine Buchstabenleiste dieses Koordinatensystems wiedergegeben.
sche Kategorie von FO. Wie die Valenzen einer Zelle aussehen, wird in FO durch Farbmuster veranschaulicht; das sind quadratische Farbtäfelchen. Zu jeder Zelle gibt FO ein Farbmuster an, welches mit dem Farbprädikator dieser Zelle untertitelt ist. Einen solchen Ausdruck nenne ich eine „Farbzuweisung“. Farbmuster und Farbzuweisungen sind weitere syntaktische Kategorien von FO, deren Indizes „FM“ bzw. „FZ“ sein sollen. Als metasprachliche Namen für FM-Ausdrücke benutze ich kleine Kästchen mit einem Zahlindex. Dieser soll die Position des Ausdrucks in einer (beliebig wählbaren) Standardaufzählung der FM angeben. Ein Ausdruck der Kategorie FZ hat also die Gestalt (16). (16) 첸m (1 ⱕ m ⱕ 680) z FO soll durch zwei Systeme S2 und S3 beschrieben werden, die beide auf dem Schlüsselbegriff der Wahrheit basieren. Eine Farbzuweisung wie in (16) ist wahr, wenn in Realisationen (tokens; siehe Art. 2 § 2.) von z der dem Farbmuster entsprechende Teil einen Farbreiz emittiert, der zu einer Valenz der Zelle gehört, die der Farbprädikator von z angibt. Ein Farbatlas (eines Mittels zur Farbkennzeichnung) ist eine Sammlung, die zu jeder wahren Farbzuweisung eine Realisation (token) enthält. Mit einem solchen Atlas
97 kann man nun für eine Farbprobe, zum Beispiel für eine Stoffbahn, ermitteln, welcher Valenz der von ihr ausgehende Farbreiz angehört, indem man die Probe einfach mit den einzelnen Farbmusterrealisationen konkreter Farbzuweisungen vergleicht. Unterhalb der ähnlichsten Farbmusterrealisation findet man einen Farbprädikator notiert, der die Zelle des Farbkörpers angibt, in der die gesuchte Valenz liegt. Dieser Farbprädikator kennzeichnet die gesuchte Valenz nicht eindeutig. In der betreffenden Zelle liegen unendlich viele Valenzen, aber deren emfindungsmäßiger Unterschied ist für praktische Zwecke vernachlässigbar. 3.2. Syntaktik und anschauliche Semantik von FO In unserer Farbwahrnehmung unterscheiden wir unbunte (Weiß, Grau, Schwarz und ihre Schattierungen) und bunte Valenzen. Die unbunten Valenzen bilden eine stetige, lineare Mannigfaltigkeit: die Grauleiter, die vom reinsten Weiß, das die obere Spitze des Farbkörpers besetzt, bis hin zum tiefsten Schwarz an seiner unteren Spitze reicht. Die Grauleiter bildet die Achse des Doppelkegels. Eine völlig reine Buntvalenz, die weder durch Beimengung von Weiß aufgehellt noch durch Zumischung von Schwarz abgedunkelt ist, ist eine Vollfarbvalenz. Die Vollfarbvalenzen bilden eine zyklische Mannigfaltigkeit: den Farbtonkreis. Er ist die Peripherie der gemeinsamen Grundfläche der beiden Kegel des Farbkörpers. Im oberen Kegel, zum Weiß hin, liegen die hellen, im unteren Kegel, zum Schwarz hin, die dunklen Valenzen. Jede Buntvalenz v läßt sich als Abkömmling (d. h. Mischung) einer Vollfarbvalenz f ⫺ ihres Buntbestandteils f ⫽ B( v) ⫺ mit der reinen Weiß- und der reinen Schwarzvalenz auffassen, wobei sich die numerischen Mischungsanteile v (der Vollfarbvalenz f ), w (⫽ Weiß( v), Weißgehalt) und s (⫽ Schwarz( v), Schwarzgehalt) zu 100 (%) aufaddieren: v ⫹ w ⫹ s ⫽ 100. (Kleine Kurrentbuchstaben wie „ v“ und „ f “ dienen in diesem Abschnitt als Variablen für Valenzen.) Genau darauf beruht der Aufbau der Farbprädikatoren. Für Zellen, durch die nicht die Grauleiter läuft, besteht der Farbprädikator z aus einem Buntprädikator j und einem Unbuntprädikator f: z ⫽ jf. Buntprädikatoren sind genau die 24 arabischen Ziffern: „1“, „2“, …, „24“. Jeder Buntprädikator bestimmt eines von 24 Segmenten des
98
I. Systematik 1
24
RÜ
N
OR A
10
ET
EI SB
T
11
19
1
15
UBLAU 12
6
VI O L
U LA
9
17
8
18
7
ROT
SEEGRÜN
6
20
5
21
E
LA
NG
UB
G
3
4
2
23 2
2
GELB
14
13
Abb. 3.3: Ostwalds Aufteilung des Farbtonkreises. Der Farbtonkreis wird in vierundzwanzig Segmente aufgeteilt, die in der dargestellten Weise durchnumeriert werden. Statt „orange“ heißt es bei Ostwald „kreß“, statt „violett“ „veil“. „Ublau“ bezieht sich auf die ultramarinblauen Farbtöne.
Farbtonkreises. Die von Ostwald vorgenommene Zuordnung zeigt die Abb. 3.3. Liegt v in der von z ⫽ jf bestimmten Zelle, so gehört B( v) zu dem von j angegebenen Segment. Den Mischungsanteil v, mit dem B( f ) in v eingeht, kann man nach obiger Gleichung berechnen (v ⫽ 100 ⫺ (w ⫹ s)), wenn man Weiß( v) ⫽ w und Schwarz( v) ⫽ s kennt. Diese Werte werden durch den Unbuntprädikator f von z spezifiziert. Ein Unbuntprädikator enthält also ebenfalls zwei Teile: einen Weiß- und einen Schwarzprädikator. Beide sind Buchstaben aus der oberen Zeile von (17). (17)
z
a
c
e
g
i
l
n
p
h(z) 89 56 36 22 14 8,9 5,6 3,6 Ist nun f ⫽ f1f2, so bestimmt f1 den Spielraum für Weiß( v). Falls nämlich a ⫽ f1 ⫽ p ist und f3 in der oberen Zeile von (17) f1 vorangeht, so gilt: h(f1 ) ⱕ Weiß( v)) ⬍ h(f3 ). Bei f1 ⫽ a ist h(a) ⫽ 89 ⱕ Weiß( v) ⱕ 100, und bei f1 ⫽ p ist 0 ⱕ Weiß( v) ⱕ 5,6 ⫽
h(n). Ebenso bestimmt f2 den Spielraum für Schwarz(v). Ist a ⫽ f2 ⫽ p und f4 der f2 in (17) vorangehende Buchstabe, so gilt: 100 ⫺ h(f4 ) ⬍ Schwarz( v) ⱕ 100 ⫺ h(f2 ). Bei f2 ⫽ p ist 100 ⫺ h(n) ⫽ 94,4 ⬍ Schwarz( v) ⱕ 100, und bei f2 ⫽ a gilt 0 ⱕ Schwarz( v) ⱕ 11 ⫽ 100 ⫺ h(a). Die Zahlenwerte von (17) sorgen nach Ostwalds Farbtheorie dafür, daß die Zellen des Farbkörpers empfindungsmäßig gleich groß sind. ⫺ Für Zellen, durch die die Grauleiter läuft, ist der Buntbestandteil ihrer Valenzen zu vernachlässigen. Die Farbprädikatoren solcher Zellen sind einfache Buchstaben: Wird der Weißgehalt ihrer Valenzen durch z beschränkt, so beschränkt derselbe Buchstabe z auch deren Schwarzgehalt. Dreierlei ergibt sich aus all dem für Semantik und Syntaktik von FO: (i) In einem Unbuntprädikator bestimmt die Position eines Buchstabens, ob er als Weiß- (links) oder Schwarzprädikator (rechts) fungiert. Eine kompositionale Semantik ordnet aber Ausdrücken unabhängig von ihren syntaktischen
99
3. Semantik
Kontexten semantischen Einheiten zu. (Daß dies nicht immer adäquat ist, wird insbesondere von der spieltheoretischen Semantik als Kritik vorgebracht; vgl. Hintikka 1981: 71⫺ 72.) Daher subskribiere ich hier die Buchstaben von (17) zur Verdeutlichung ihrer Funktion mit einen „w“ oder „s“: aw ist stets Weiß-, as immer Schwarzprädikator usw. Mit solchen Subskripten (und eckigen Klammern) gebildete Ausdrücke sind disambiguiert (vgl. Montague 1970: 376). (ii) Nur solche Unbuntprädikatoren machen Sinn, nach denen die Summe von Schwarz- und Weißgehalt einer Valenz höchstens 100 beträgt. Jeder Weiß- und Schwarzprädikator erhält daher als Rang eine Zahl n (1 ⱕ n ⱕ 8), den man für Weißprädikatoren durch Abzählen von aw (Rang 1) nach pw (Rang 8) und für Schwarzprädikatoren durch Abzählung in gegenläufiger Richtung (also 1 für ps und 8 für as ) ermittelt. Ein Schwarzprädikator ist nur mit Weißprädikatoren desselben oder größeren Ranges zu wohlgeformten Unbuntprädikatoren kombinierbar. (iii) Eine Farbzuweisung wie (16) ist semantisch maximal, da in ihrem Farbprädikator z alle Angaben über 첸m enthalten sind, die sich in FO überhaupt machen lassen. Dies erscheint als bloßer syntaktischer Zufall; denn semantisch gesehen würde (16) auch dann Sinn machen, wenn z nur Angaben über den Buntbestandteil, über den Schwarz- oder den Weißgehalt (oder eine Kombination solcher Angaben) der von 첸m veranschaulichten Valenz enthielte. Letzteres berücksichtigt die Syntaktik von FO wie folgt: In der Kategorialgrammatik (Ajdukiewicz 1935: 3) unterscheidet man Basis- und Funktorkategorien. (Ajdukiewicz verwendet statt „Basiskategorien“ den Terminus „Grundkategorien“.) Ausdrücke von Basiskategorien sind gesättigt, syntaktisch vollständig. Funktoren hingegen ⫺ das sind Ausdrücke der Funktorkategorien ⫺ sind ungesättigt und verlangen zu ihrer Vervollständigung jeweils eine bestimmte Anzahl von Ausdrücken genau festgelegter Kategorien. Dies sind ihre jeweiligen Argumentoren. Die Redeweise von gesättigten und ungesättigten Ausdrücken stammt von Frege (s. Art. 102 § 4.2.); den Terminus „Argumentor“ hat Potts (vgl. 1978: 8) eingeführt. Zusammen mit passenden Argumentoren bildet ein Funktor dann einen komplexen Zielausdruck oder Valuor (vgl. Potts 1978: 8). Die (einzigen) Basiskategorien von FO sind die schon besprochenen Kategorien FM und FZ. Im
Index einer Funktorkategorie kodiert man nun das kombinatorische Verhalten der zu ihr gehörigen Funktoren: Verlangen diese n Argumentoren der respektiven Kategorien k1, k2, …, kn, um mit ihnen einen Valuor der Kategorie k0 zu bilden, so ist der Index der Funktorkategorie k1k2 … kn(k0 ). (Verschiedene Notationen sind hier im Gebrauch; verbreitet ist zum Beispiel auch k0/(k1, k2, …, kn )). Ist F nun eine syntaktische Operation, mit der Funktoren dieser Kategorie k1 … kn(k0 ) mit Argumentoren der Kategorien k1, …, kn zu einem k0-Ausdruck verknüpft werden dürfen, so muß es nach § 2.5. eine Ajdukiewicz-Regel R ⫽ *F, *k1 … kn(k0 ), k1, …, kn+, k0+ geben. Farbprädikatoren werden nun der Kategorie FM(FZ) zugewiesen, denn sie bilden zusammen mit einem Farbmuster eine Farbzuweisung. Daß rein semantisch gesehen auch Bunt-, Unbunt-, Weiß- und Schwarzprädikatoren mit FM-Ausdrücken (partielle) Farbzuweisungen bilden können, berücksichtigen wir dadurch, daß wir sie den Funktorkategorien FM(FZ)b, FM(FZ)u, FM(FZ)w und FM(FZ)s zuweisen. Funktoren dieser Kategorie könnten also so wie solche der Kategorie FM(FZ) verwendet werden, wenn es entsprechende Regeln gäbe. Die gibt es allerdings in FO nicht. Die Kategorien FM(FZ)w und FM(FZ)s werden noch nach dem Rang ihrer Funktoren jeweils in acht Unterkategorien FM(FZ)wn bzw. FM(FZ)sn (1 ⱕ n ⱕ 8) subklassifiziert. Jede dieser Kategorien enthält nur ein einziges Element: FM(FZ)w1 aw, FM(FZ)w2 cw, …, FM(FZ)s1 ps, … und FM(FZ)s8 as. Um Ausdrücke syntaktisch eindeutig zu gliedern, werden in FO vertikale („[“ und „]“) und horizontale („“ und „“) Klammern benutzt, zwischen die syntaktische Hilfsoperationen J5 und J6 jeweils zwei Ausdrücke setzen können, vgl. (18). (18 a) J5 (z, j) ⫽ [zj] j (18 b) J6 (z, j) ⫽ z Für FO sind nur die Ausdrücke interessant, die man aus den 680 FM-Ausdrücken, den 24 FM (F2)b-Funktoren, den acht FM(FZ)wFunktoren und den acht FM(FZ)s-Funktoren mittels J5 und J6 bilden kann. Die Gesamtheit dieser Ausdrücke sei A(FO). Die syntaktischen Operationen F5 und F6 von FO sind die Einschränkungen von J5 und J6 auf A(FO); d. h. F5 und F6 unterscheiden
100
I. Systematik
sich von J5 und J6 lediglich dadurch, daß sie ausschließlich für die Ausdrücke aus A(FO) (und für keine anderen) bestimmt sind. Nun hat man alles beisammen, um die syntaktischen Regeln für FO so zu formulieren, wie es oben in § 2.5. erklärt wurde. (i) Ist n ⬍ m, u wm so ist Rm, , FM(FZ)sn+, n ⫽ *F5, *FM(FZ) u FM(FZ) + eine syntaktische Regel von FO. (ii) Rg ⫽ *F5, *FM(FZ)wm, FM(FZ)sm+, FM(FZ)+ und Rf5 ⫽ *F5, *FM(FZ)b, FM(FZ)u+, FM(FZ)+ sind Regeln von FO. (iii) Rz ⫽ *F6, *FM(FZ), FM+, FZ+ ist eine Regel von FO; ansonsten gibt es keine weiteren Regeln. ⫺ Ist j ein nach diesen Regeln wohlgeformter Ausdruck (s. o. § 2.5.), so ist seine Ambiguierung z der Ausdruck, den man aus j erhält, wenn man dort (i) alle Klammern und Subskripte streicht und (ii) Buchstabengeminaten (aa, cc, …, pp), die dadurch gegebenenfalls entstehen, (zu a, c, …, p) vereinfacht. Wohlgeformte Ausdrücke von FO erhält man nun als Ambiguierungen der Ausdrücke, die nach den angegebenen Regeln wohlgeformt sind; (19) gibt ein Beispiel. (19) u nw: FM(FZ)w7 R7,1 [n a ] : FM(FZ)u as : FM(FZ)s1 ¿¿¡ w s 2 : FZ(FM)b Rf u ¿¿¡ [2[nwas]] : FM(FZ) [n a ]: FZ(FM) w s
z 첸1 첸1 : FM R : FZ ¿¿¡ [2[n was]] [2[nwas]] : FM(FZ) 첸1 [2[nwas]]
¿¿¡
첸1
Ambiguierung 2na
3.3. Multiple Denotation Der Schlüssel zum semantischen System S2 von FO ist der Wahrheitsbegriff (s. o. § 3.1.); „wahr“ soll der metasprachliche Ausdruck für die Gesamtheit der korrekten Farbzuweisungen sein. Anders als bei S1 wird für S2 darauf verzichtet, Wahrheit als Designieren des Wahrheitswertes W zu bestimmen. Die Gründe dafür werden sogleich angegeben; die semantische Beschreibung S3 von FO (s. § 3.4.) folgt dann wieder der Vorgehensweise von § 2. ⫺ FM-Ausdrücke dienen dazu, aus dem Kontinuum der Farbvalenzen jeweils eine auszugrenzen; auch handelt FO thematisch von den Farbvalenzen. Daher werden die Farbmuster als referierende Ausdrücke (s. § 2.3.) aufgefaßt. Das Referenzobjekt fm ⫽ Ref(첸m ) des FM-Ausdrucks 첸m ist gerade die Valenz fm, die 첸m veranschaulicht. (Es liegt hier somit eine ganz besondere Art der
Referenz vor, s. u. § 4.7.). Ausdrücke der Funktorkategorien FM(FZ), FM(FZ)b, …, FM(FZ)s8 kennzeichnen nicht wie die FMAusdrücke eine einzige Valenz und sind auch nicht wie die FZ-Ausdrücke wahrheitsfähig. Sie grenzen vielmehr aus dem Farbkörper ganze Valenzgebiete aus. Ein Farbprädikator bestimmt etwa eine Zelle des Farbkörpers; und ein Unbuntprädikator z gibt ein Farbkörpergebiet an, in dem alle Valenzen lokalisiert sind, deren Schwarz- und Weißgehalte in den von z gezogenen Grenzen (s. o. § 3.2.) liegen. Die Funktoren von FO stehen also in semantischer Beziehung nicht zu nur einer, sondern zu vielen Valenzen. Diese Beziehung zwischen den Funktoren von FO und den jeweils vielen Valenzen, die sie charakterisieren, soll in Anschluß an Martin (1953: 11 und 1958: Kap. IV und V) und Carnap (1972: 20) als „(multiple) Denotation“ bezeichnet werden. Ein Funktor denotiert jeweils all die Valenzen des von ihm aus dem Farbkörper ausgesonderten Gebiets. „Denotation“ wird in vielfach verschiedener Weise gebraucht. So verwendet Church (1956: 6) es analog zu unserem „Designat“ (s. o. § 2.); Goodman (1981) faßt mit diesem Terminus die Referenzbeziehung und die gerade eingeführte Beziehung der multiplen Denotation zusammen. Von Montague (1970) wird er für eine komplizierte modelltheoretische Relation benutzt, nach der ein Ausdruck z eines Informationsmittels I etwas an einem Referenzpunkt r eines Modells M denotiert, s. u. § 5.2. All diese semantischen Begriffe dürfen nicht mit dem der multiplen Denotation verwechselt werden. Diese Relation ist, anders als die von Montague, nicht auf Modelle bezogen; anders als bei Goodman sind ausschließlich Funktoren bestimmter Art denotierend, während höchstens Ausdrücke von Basiskategorien referierend sein können. Aber wahrheitsfähige Ausdrücke, die zu einer Basiskategorie (hier: FZ) gehören, denotieren keineswegs ihren Wahrheitswert; das unterscheidet die Beziehung der multiplen Denotation von der Designation. Die Denotationsbeziehung wird metasprachlich mit „den“ bezeichnet; daß z v denotiert, wird metasprachlich dann auch so beschrieben: „den(z, v)“. Sind w1 und w2 zum Beispiel Valenzen mit Weiß( w1 ) ⭓ 89 ⬎ Weiß( w2 ) ⭓ 56, so gilt nach den Erklärungen von § 3.2. zum Beispiel den(aw, w1 ), den(cw, w2 ), aber zum Beispiel nicht den(aw, w2 ) und nicht den(cw, w1 ). Die anschauliche Semantik von FO in § 3.2. ermöglicht es, für die syn-
3. Semantik
taktisch einfachen Funktoren von FO Denotationsregeln zu formulieren, die festlegen, was ein Funktor jeweils denotiert: (i) Stammt z aus einer Kategorie FM(FZ)wn (1 ⱕ n ⱕ 8), so gilt genau dann den(z, v), wenn Weiß( v) zwischen den in § 3.2. für z bestimmten Grenzen bleibt. Entsprechend gilt (ii) für ein z aus FM(FZ)sn (1 ⱕ n ⱕ 8), daß Schwarz( v) in den für z in § 3.2. gezogenen Grenzen bleiben muß, damit den(z, v) gilt. (iii) Schließlich gilt für ein z aus FM(FZ)b, daß genau dann den(z, v) gilt, wenn B( v) in dem von z bestimmten Segment des Farbtonkreises (s. Abb. 3.2) liegt. Damit ist S2 soweit es die (disambiguierten) Grundausdrücke von FO betrifft, bereits vollständig beschrieben. Die Denotationsbeziehung erzwingt ein leichtes Abrücken vom funktional-kompositionalen Vorgehen bei der semantischen Interpretation syntaktisch komplexer Ausdrücke. Ein Funktor hat ja nun die den-Beziehung zu vielen semantischen Einheiten (in S2: Valenzen) und nicht nur zu einer einzigen. Ist beispielsweise ein Funktor z Teil der Farbzuweisung j, so kann der Wahrheitswert von j nicht von dem semantischen Wert von z funktional abhängen: Den Wert von z gibt es ja gar nicht; vermittels den hat z viele Werte. Dem kompositionalen Prinzip wird aber zumindest darin gefolgt, daß die semantischen Eigenschaften syntaktisch komplexer Ausdrücke auf die ihrer Teilausdrücke zurückgeführt werden. In (20) werden so die Denotate syntaktisch komplexer Funktoren aufgrund der Denotate ihrer Teile bestimmt.
101 gesagt wird, daß sie zu denen gehöre, die z denotiere. Die Prädikationsbeziehung werde metasprachlich durch „präd“ wiedergegeben: Daß präd(z, j, v) gilt, heißt demnach, daß der Ausdruck z im Ausdruck j von der Valenz v prädiziert wird. Diese dreistellige Beziehung wird in (21) definiert. (21) präd(z, j, v) genau dann wenn (i) j aus einem f von FM und aus z von FM(FZ) nach Rz gebildet ist und (ii) v ⫽ Ref(f). Eine Farbzuweisung ist wahr, wenn ihr Farbprädikator wahrheitsgemäß von der Valenz prädiziert wird, auf die sich ihr Farbmuster bezieht; und das ist genau dann der Fall, wenn der Farbprädikator diese Valenz denotiert. In (22) wird der Schlüsselbegriff von S2 so definiert. (22) Es gilt genau dann wahr(j), wenn (i) j aus einem z von FM und einem f von FM(FZ) gemäß Rz gebildet ist und (ii) den(f, Ref(z)) gilt, also f das Referenzobjekt von z denotiert. (Man beachte, daß die Festsetzungen (20), (21), (22) auf dem Hintergrund der eindeutigen Bestimmbarkeit der Ausdrücke erfolgen, von denen in ihnen die Rede ist.) Mit Hilfe dieser Definitionen erhält man zum Beispiel für den in (19) analysierten (disambiguierten) FZ-Ausdruck von FO den in (23) angegebenen W-Satz. (23) Genau dann gilt wahr(F6(F5(2, F5(nw, as )), 첸1 )), wenn (i) B(Ref(첸1 )) ein rotstichiges Gelb ist (vgl. Abb. 3.3.), (ii) 5, 6 ⭐ Weiß(Ref(첸1 )) ⬍ 8, 9 ist und (iii) 0 ⱕ Schwarz(Ref(첸1 )) ⱕ 11 ist.
(20a) Ist der Ausdruck z von FM(FZ)u geu mäß der Regel Rm, n aus z1 der Kategorie FM(FZ)wm und z2 der Kategorie FM(FZ)sn gebildet, so gilt für alle Valenzen v: den(z, v) genau dann, wenn den(z1, v) und den(z2, v). (20b) Ist z von FM(FZ) nach Rg aus z1 von FM(FZ)wm und z2 von FM(FZ)sm oder nach Rf aus z1 von FM(FZ)b und z2 von FM(FZ)u gebildet, so gilt ebenfalls für alle v: den(z, v) genau dann, wenn den(z1, v) und den(z2, v).
Die semantischen Begriffe lassen sich leicht von den disambiguierten Ausdrücken auf die eigentlichen Ausdrücke von FO übertragen: Ist j eine Ambiguierung des FZ-Ausdrucks z, so soll j genau dann wahr sein, wenn z gemäß (22) wahr ist; und wenn j eine Ambiguierung eines Funktors z ist, so soll j genau die Valenzen denotieren, die z den angegebenen Denotationsregeln gemäß denotiert.
Ein multipel denotierender Ausdruck z nimmt nun innerhalb einer Farbzuweisung j insofern Einfluß auf Wahrheit oder Falschheit von j, als er von der Valenz prädiziert wird, auf die der zu j gehörige FM-Ausdruck referiert: daher heißen solche Ausdrücke eben auch „Prädikatoren“. „Prädiziert“ bedeutet, daß von der betreffenden Valenz wahrheitsgemäß oder auch fälschlicherweise
3.4. Attribute Das semantische System S2 kennt nur eine einzige Art semantischer Einheiten: die Farbvalenzen, die in S2 als Gegenstände aufgefaßt werden. Wie ist es nun aber möglich, daß ein Ausdruck wie beispielsweise 19gc mehrere Valenzen denotieren kann, und wieso kann so ein Ausdruck von verschiedenen Valenzen
102 prädiziert werden? Jeder Farbprädikator klassifiziert die Valenzen nach Maßgabe ihres Farbtons, ihres Weiß- und ihres Schwarzgehalts in zwei Gruppen: die Gruppe derer, von denen er wahrheitsgemäß, und die Gruppe derer, von denen er nur fälschlicherweise ausgesagt werden kann. Eine mögliche Antwort auf die eingangs gestellten Fragen wäre die, daß ein Farbprädikator vermittels einer semantischen Beziehung zu dieser Klassifikation mehrere Valenzen denotiert bzw. von verschiedenen Valenzen prädiziert werden kann. Aber in S2 ist diese Klassifikation selbst keine semantische Einheit, obwohl jeder klassifizierte Gegenstand eine solche ist. Neben denotierendem Funktor und denotierten Gegenständen gibt es in S2 nichts Drittes. „Zu recht!“ werden einige Philosophen und Semiotiker sagen, denn was sollte das sein ⫺ die Klassifikation selbst? In der Realität gibt es nur Gegenstände, auf die sich ein referierender Ausdruck (nomen proprium) beziehen kann und die durch einen prädikativen Ausdruck (nomen commune) klassifiziert werden können; die Klassifikation selbst ist nicht real. Die Bedeutungstheorie (s. o. § 1.2.), auf der S2 basiert, läßt nur Ausdrücke (nomina) und Gegenstände als deren semantische Korrelate zu; eine so eingeschränkte Bedeutungstheorie bezeichnet man als „nominalistisch“. Häufig wird die nominalistische Position in einer noch schärferen Form vertreten, nach der Ausdrücke und Gegenstände konkret sein müssen; diese verschärfte Position wird als „Konkretismus“ bezeichnet. Eine konkretistische Semantik von FO dürfte nur von Ausdrucksrealisationen (tokens) und farbigen Dingen (oder Farbreizen) Gebrauch machen. Bedeutende Vertreter nominalistischer Positionen sind in diesem Jahrhundert Goodman (vgl. Art. 121) und Les´niewski; eine konkretistische Einstellung ist vehement von dem polnischen Philosophen Kotarbin´ski (s. Art. 108) vertreten worden. ⫺ Die Gegenposition, nach der die mit Hilfe prädikativer Ausdrücke erstellten Klassifikationen durchaus real sind, wird „Realismus“ genannt. Für eine realistische Bedeutungstheorie argumentiert zum Beispiel Church (1955). Die Auseinandersetzung zwischen diesen beiden Positionen hat im Abendland als sogenannter „Universalienstreit“ eine lange Tradition (vgl. Art. 40 § 3.2. zum antiken Ursprung des Universalienstreits; über seinen Verlauf im Mittelalter berichten Art. 49 und Art. 52). Sollen universale Einheiten wie etwa die gerade problematisierten Klassifikationen
I. Systematik
eine fruchtbare Rolle in einem semantischen System spielen, so muß in der Metasprache eine Theorie über sie formuliert sein. Für FO könnten zum Beispiel Klassifikationen eben Klassen oder Mengen von Valenzen sein („Klasse“ und „Menge“ werden in diesem Artikel als synonym und im vortechnischen Sinne verwendet; es gibt aber Mengentheorien, nach denen Mengen spezielle Klassen sind). In der Metasprache, in der FO beschrieben wird, müßte dann eine Mengentheorie angegeben werden, die festlegt, was für Mengen es überhaupt gibt und wie sie sich zueinander verhalten; man vergleiche ein Lehrbuch über Mengentheorie, zum Beispiel Fraenkel und Bar-Hillel (1958), über die hier möglichen Optionen. Für das kompositionale Verfahren erweist sich aber ein etwas anderer Zugang als günstiger. Eine Klassifikation, die einen Gegenstandsbereich in zwei Klassen zerlegt, wird eindeutig durch eine Zuordnung a bestimmt, die jedem Gegenstand g des Bereichs einen Wahrheitswert a(g) zuweist, je nachdem er zu der einen oder anderen Klasse der Zweiteilung gehört. Objekte derselben Klasse erhalten denselben Wahrheitswert zugewiesen. In Anschluß an Scholz und Hasenjäger (1961: § 50.), Hermes (1972: 73) und Asser (1972: 5) soll eine solche Zuordnung a „ein (einstelliges) Attribut (über den betreffenden Gegenstandsbereich“ genannt werden (n-stellige Attribute ordnen n-stelligen Folgen von Gegenständen jeweils W oder F zu; solche Attribute werden erst im nächsten Abschnitt benötigt). Nun müßte in der Metasprache eine Attributentheorie formuliert werden, die bestimmt, was für Attribute es gibt und wie sie sich zueinander verhalten. Da sich Zuordnungen (für viele Zwecke) mit bestimmten Mengen (nämlich Funktionen) identifizieren lassen, könnte man eine Attributentheorie in einer Mengentheorie formulieren (Attribute sind dann die charakteristischen Funktionen von Mengen). Nichts zwingt aber zu einem solchen Vorgehen. Eine andere Möglichkeit, die zunehmend an Wichtigkeit gewinnt, besteht in der Verwendung einer kategorientheoretischen (s. Mac Lane 1972) statt einer mengentheoretischen Metasprache (vgl. Seely 1987, Lambek 1988). Hier soll als Identitätskriterium für Attribute das Prinzip (24) gelten. (24) Attribute a1 und a2 sind genau dann gleich (a1 ⫽ a2 ), wenn sie denselben Objekten dieselben Wahrheitswerte zuweisen (d. h.: wenn a1(g) ⫽ a2(g) für jedes g gilt).
103
3. Semantik
(Erachtet man das Vorkommen in Identitätsaussagen als ein Kriterium für Referentialität, s. o. § 2.3., so sind nach (24) Attribute entweder spezielle Individuen oder „⫽“ hat für Attribute und Gegenstände unterschiedliche Bedeutung. Im ersten Fall unterscheiden sich S2 und S3 nur noch im Abstraktionsgrad ihrer semantischen Einheiten.) Im semantischen System S3 von FO sollen den Funktoren Attribute (über den Bereich der Valenzen) als Designate zugewiesen werden. Um über solche Farbvalenzen bequem reden zu können, führen wir in die Metasprache folgende Notationsweise ein: Ist z ein wahrheitsfähiger Ausdruck der Metasprache, der mindestens ein Vorkommnis der Valenzvariablen j (⫽ „ v“, „ v1“, …) enthält, so soll lj[z] das Attribut bezeichnen, welches einer Valenz v genau dann W zuordnet, wenn z⬘ wahr ist, wobei z⬘ aus z dadurch entsteht, daß in z jedes j-Vorkommnis durch eine Bezeichnung der Valenz v ersetzt wird. So ist zum Beispiel l v[56 ⬍ Weiß( v) ⱕ 100] das Attribut, einen Weißgehalt zwischen 56 (ausschließlich) und 100 (einschließlich) zu haben. ⫺ Ein Ausdruck der Gestalt lj[z] heißt „l-Term“; l-Terme zur Bezeichnung von Zuordnungen sind in den 30er Jahren von Church eingeführt worden (vgl. Hindley und Seldin 1986: Kap. 1, Kap. 3, sec. E). Aufgrund der gegebenen Erklärung muß für lTerme das Prinzip (25a) gelten, das (25b) durch ein Beispiel veranschaulicht. (25a) Genau dann ist lj[z](f) ⫽ W, wenn der Ausdruck c1, den man aus z erhält, falls man dort j überall durch f ersetzt, ein wahrer Satz ist. (25b) l v[56 ⬍ Weiß( v) ⱕ 100]( f ) ⫽ W genau dann, wenn 56 ⬍ Weiß( f ) ⱕ 100. Nun kann die Beschreibung von S3 mit der lexikalischen Auflistung der Designate der Grundausdrücke von FO, s. (26), beginnen. (26a) Ein Ausdruck 첸m der Kategorie FM designiert die Valenz fm, die dieses Farbmuster veranschaulicht: fm ⫽ Des(첸m ). (26b) Für die Grundausdrücke aus FM(FZ)wn (1 ⱕ n ⱕ 8) gilt: Des(aw ) ⫽ l v[89 ⭐ Weiß( v) ⱕ 100], ⯗ Des(pw) ⫽ l v[0 ⱕ Weiß( v) ⱕ 5, 6], und für die Grundausdrücke aus FM(FZ)sn (1 ⱕ n ⱕ 8):
Des(as ) ⫽ l v[0 ⱕ Schwarz( v) ⱕ 11], ⯗ Des(ps ) ⫽ l v[94,4 ⬍ Schwarz( v) ⱕ 100]. (Die Angaben für die hier ausgelassenen Funktoren sind den Erläuterungen im Anschluß an (17), s. o. § 3.2., entnehmbar.) (26c) Gehört z zu FM(FZ)b, so gilt: Des(z) ⫽ l v[B( v) liegt in dem durch z bestimmten Segment des Farbtonkreises]; s. Abb. 3.3. Die syntaktisch komplexen Ausdrücke z erhalten ihre Designate wieder mittels semantischer Operationen zugewiesen, die die syntaktischen dem Tandem-Prinzip (s. § 2.5., Abb. 3.1) gemäß interpretieren und mit denen Des ausgehend von (26) entlang dem syntaktischen Bau von z homomorph fortgesetzt werden kann. Schaut man sich die Denotationsregel (20b) und den W-Satz (23) an, so erkennt man, daß der semantischen Operation F5, die attributdesignierende Ausdrücke z und j zu einem wiederum attributdesignierenden Ausdruck [zj] zusammenfaßt, semantisch eine Operation G∩ entsprechen muß, die die von z und j designierten Attribute az und aj konjunktiv zu einem a verknüpft, das einer Valenz genau dann den Wert W zuweist, wenn sowohl az als auch aj der betreffenden Valenz diesen Wert zuordnen. Die Operation F6 dient hingegen dazu, einen komplexen Funktor mit dem Ausdruck zu kombinieren, von dessen Bezugsobjekt er prädiziert werden soll. Die semantische Interpretation von F6 ist die Anwendungsoperation Ga. Diese beiden Operationen G∩ und Ga werden in (27) definiert. Da die von ihnen interpretierten syntaktischen Operationen F5 und F6 in ihrer Anwendbarkeit völlig unbeschränkt sind, müssen G∩ und Ga wieder (s. o. § 2.5., die (10) vorangehende Erläuterung) so bestimmt werden, daß auch nichtwohlgeformte Anwendungsergebnisse von F5 und F6 ein (Quasi-)Designat erhalten (dazu unten § 3.5.); als Ersatzdesignat für solche Ausdrücke wird wieder F verwendet. (27 a)
Ï l v[x( v) und y( v)], falls G∩ (x, y) ⫽ Ì x und y Attribute sind; Ó F, sonst.
(27 b)
Ï x(y), falls x ein für y defiGa (x, y) ⫽ Ì niertes Attribut ist; Ó F, sonst.
104
I. Systematik
Abb. 3.4: Freges Semantik prädikativer Ausdrücke. Die Abbildung zeigt einen Ausschnitt aus einem Brief Freges an Husserl (24. 5. 1891; s. Frege 1976: 97). Frege erläutert die letzte Säule des Schemas so: „Beim Begriffsworte ist ein Schritt mehr bis zum Gegenstande als beim Eigennamen und der letzte kann fehlen ⫺ d. h. der Begriff kann leer sein ⫺, ohne dass dadurch das Begriffwort aufhört, wissenschaftlich verwendbar zu sein. Ich habe den letzten Schritt vom Begriffe zum Gegenstande seitwärts gezeichnet, um anzudeuten, dass er auf derselben Stufe geschieht, dass Gegenstände und Begriffe dieselbe Objectivität haben […]“. Der Unterschied zu Husserls Auffassung der Prädikatoren als denotierend wird im Text erläutert. ⫺ Die semantischen Einheiten der zweiten Schemazeile gehören zum Thema des 5. Abschnitts; s. u. § 5.1.3.
Wie das betreffende Anfangsstück der Funktion Des von S1 durch (12), so läßt sich das in (26) bestimmte, die Grundausdrücke von S3 behandelnde Teilstück der Des-Funktion von S3 durch (28) fortsetzen. (28a) Für z ⫽ F5(j, f) ist Des(z) ⫽ G∩(Des(j), Des(f)). (28b) Für z ⫽ F6(j, f) ist Des(z) ⫽ Ga(Des(j), Des(f)). In S3 besteht zwischen der Wahrheit eines FZ-Ausdrucks z und der Prädikationsbeziehung präd von (21) aufgrund von (28b) der folgende Zusammenhang: Des(z) ⫽ W genau dann, wenn es einen Farbprädikator j und eine Valenz v mit präd(j, z, v) gibt und das von j designierte Attribut a v den Wert W zuweist. Hier vermittelt also ein Attribut a zwischen v und dem prädikativen j, während in S2 j direkt v (und andere Valenzen) denotiert. Die Denotationsbeziehung von S2 läßt sich in S3 definieren: den(j, v) genau dann, wenn für das a mit Des(j) ⫽ a, a( v) ⫽ W ist. ⫺ Wie in S2 sind auch in S3 die semantischen Begriffe zunächst für disambiguierte Ausdrücke definiert worden; sie können aber wieder wie für S2 auf die eigentlichen Ausdrücke von FO übertragen werden. Der Unterschied zwischen S2 und S3 differenziert auch die Bedeutungstheorien Freges und Husserls (s. Art. 102 bzw. Art. 103). Frege bezeichnet einen prädikativen Funktor als „Begriffswort“ und ein einstelliges Attribut als „Begriff“, einen referierenden Aus-
druck nennt er „Eigenname“. In einem Brief an Husserl (vom 24. 5. 1891; s. Frege 1976: 96) faßt er seine Bedeutungstheorie durch das in Abb. 3.4 wiedergegebene Diagramm zusammen. Seinen Gegensatz zu Husserl sieht Frege so: „Es scheint mir nun, daß bei Ihnen das Schema etwa so aussehen würde: Begriffswort → Sinn des Begriffswortes (Begriff) → Gegenstand, der unter den Begriff fällt [im Original vertikal, K. R.], so daß bei Ihnen gleich viel Schritte vom Eigennamen wie vom Begriffsworte bis zu den Gegenständen zu tun wären. Es bestände dann zwischen Eigennamen und Begriffsworten nur der Unterschied, daß jener nur auf einen, dieses auf mehrere Gegenstände sich beziehen könnte“; Frege (1976: 98). Die hier Husserl zugeschriebene Konzeption ist genau die Auffassung von prädikativen Funktoren als multipel denotierenden Ausdrücken. 3.5. Typen semantischer Einheiten Semantisch gesehen gibt es in S3 nur drei Arten von Ausdrücken: wahrheitsfähige Farbzuschreibungen, referierende Farbmuster und Attribute bestimmende Prädikatoren. Diesen drei semantisch motivierten Ausdrucksklassen stehen allerdings zwanzig syntaktische Kategorien gegenüber. In diesem Unterabschnitt soll das Verhältnis zwischen diesen beiden Ausdrucksklassifikationen geklärt werden. ⫺ Die semantisch motivierte Dreierteilung beruht auf der Einteilung der Designate in Wahrheitswerte, Gegenstände und
3. Semantik
Attribute. Jeder Ausdruck wird nach dem Typ seines Designats einer der drei Klassen zugeordnet. Die Typen semantischer Einheiten werden ebenso wie auf der Ausdrucksebene die Kategorien mittels Indizes ⫺ nun: Typenindizes ⫺ benannt. Ist t ein Typenindex, so soll Dt die Gesamtheit aller Designate des Typs t sein. Der Terminus „Typ“ rührt von Russells Typentheorie her; s. Art. 76. Typen von Designaten könnte man auch als „semantische Kategorien“ bezeichnen. Das ist auch der Terminus, den ⫺ in Anschluß an Husserls Bedeutungskategorien ⫺ Les´niewski, der einer der Väter der Kategorialgrammatik ist, benutzt; zu Les´niewskis Kategorialgrammatik s. Machover (1966). Seine Theorie semantischer Kategorien sieht Les´niewski als Alternative zu Russells Typentheorie bei der Lösung der mengentheoretischen Antinomien. In Anschluß an Montague (1970) ist es vielfach üblich, auf der syntaktischen Ebene Ausdrücke in Kategorien und semantisch deren Bedeutungen in Typen zu klassifizieren.
Wie es Basis- und Funktorkategorien gibt, so unterscheidet man auch Basis- und Funktionstypen. In S3 sind zum Beispiel t (truth value) und e (entity) Basistypen; Dt ist die Klasse {W, F} der beiden Wahrheitswerte und De die Klasse V der Valenzen. Sind t1, …, tn und t0 Typen, so ist t ⫽ t1 … tn (t0 ) ein Funktionstyp. Dt umfaßt dann genau die Funktionen, die n-stelligen Folgen, deren mtes Glied (1 ⱕ m ⱕ n) jeweils aus Dtm stammt, ein Element aus Dt0 als Wert zuweisen. Diese Funktionengesamtheit bezeichnet man auch mit „Dt0 (Dt1 ⫻ … ⫻ Dtn)“. Es gilt also: Dt ⫽ Dt0 (Dt1 ⫻ … ⫻ Dtn). Die Valenzattribute von S3 sind (wenn man einstellige Individuenfolgen mit ihrem einzigen Glied identifiziert) vom Typ e(t) und gehören zu {W, F}V. ⫺ Eine Typenzuordnung (s. Montague 1970: 380) ist eine Funktion T, die die feinere syntaktische Klassifikation mit der gröberen semantischen verbindet: Sie ordnet jeder Kategorie k einen Typ t zu, so daß die Designate aller Ausdrücke von k in Dt liegen. Für S3 ist demnach die Typenzuordnung durch folgende drei Bestimmungen festgelegt: (i) T(FZ) ⫽ t, (ii) T(FM) ⫽ e und (iii) T(FM(FZ)) ⫽ T(FM)(T(FZ)) ⫽ e(t) sowie T(FM(FZ)i ) ⫽ T(FM(FZ)) für i ⫽ b, u, w1, …, s8. Die Grundidee bei einer solchen Typenzuordnung ist folgende kategoriale Version des Kompositionalitätsprinzips: Die Designate von Basisausdrücken gehören zu Basistypen, Funktoren designieren Funktionen. Ist z Valuor (Zielausdruck, s. o. § 3.2.)
105 des Funktors j0 für die Argumentoren j1, …, jn, designiert j0 die Funktion f, j1, a1, … und jn an, so ist das Designat a des Valuors der Wert der Funktion f für die Argumente a1, …, an: a ⫽ f(a1, …, an ). Die syntaktischen Operationen eines Informationsmittels führen nun nicht immer zu wohlgeformten Ausdrücken (vgl. VVV von RA oder [첸1첸2] und [14gw] von FO). Wenn die semantischen Operationen aber die homomorphen Gegenstücke der syntaktischen sein sollen, so muß auch solchen Ausdrücken eine semantische Interpretation verliehen werden. Daher können sich semantische Operationen nicht immer an Typengrenzen orientieren; z. B. muß G∩, um [첸1첸 2] interpretieren zu können, auch für Paare von Elementen aus De (⫽ V) definiert sein, obwohl diese Operation zur Interpretation wohlgeformter Ausdrücke stets auf ein Attributenpaar angewendet wird. In den meisten (aber durchaus nicht allen, vgl. eben VVV und [14gw] mit dem dritten angeführten Ausdruck) Fällen ist die semantische Interpretation nicht-wohlgeformter Ausdrücke völlig uninteressant. (Daß eine adäquate Semantik auch in der Lage sein muß, zumindest gewisse nichtwohlgeformte Ausdrücke zu interpretieren, wird insbesondere von Vertretern der konfigurationalen Strategie, s. o. § 1.3. und Higginbotham (1985: 550), hervorgehoben.) Wichtig ist, daß die semantischen Operationen für wohlgeformte Ausdrücke korrekt arbeiten. Was das genau heißt, wird erst nun mit Hilfe des Begriffs der Typenzuordnung formulierbar: (i) Ist z Grundausdruck der Kategorie k, so muß Des(z) zu DT(k) gehören. (ii) Ist R ⫽ *F, *k1, …, kn+, k0+ eine syntaktische Regel, gehören die Designate der n Ausdrücke z1, …, zn der respektiven Kategorien k1, …, kn zu DT(k1), …, DT(kn) und ist schließlich G die F interpretierende semantische Operation, so ist G(Des(z1 ), …, Des(zn )) ein Element von DT(k0). Von einem semantischen System, dessen Schlüsselbegriff die Wahrheit ist, wird man zudem verlangen, daß seine Typenzuordnung T der ausgezeichneten Kategorie der wahrheitsfähigen Ausdrücke t zuordnet. Dieser Zusammenhang garantiert, daß jeder Ausdruck einer Kategorie k sein Designat in DT(k) hat und daß die wahrheitsfähigen Ausdrücke Wahrheitswerte designieren. Mit S3 beschließen wir die Darstellung solcher semantischer Systeme, die vom Wahrheitsbegriff als Schlüsselbegriff ausgehen. Das im nächsten Abschnitt zu behandelnde
106
I. Systematik
Informationsmittel soll mit einem semantischen System beschrieben werden, das den Folgebegriff als grundlegend ansieht.
4.
Klassische Methoden: Erfüllbarkeit, Modell- und Folgebegriff
4.1. Querbezug und Variablennotation In FO kann man zwar Aussagen über einzelne Gegenstände (dort: Valenzen) treffen, aber man kann keine Behauptungen über alle Gegenstände aufstellen, und man kann keine Existenzaussagen über Valenzen mit bestimmten Eigenschaften formulieren. So kann man beispielsweise nicht ausdrücken, daß jede Valenz bunt oder unbunt ist; und man kann auch nicht sagen, daß es eine Valenz gibt, die genau in der Mitte des Farbkörpers liegt. Diese Ausdrucksmöglichkeiten, die FO fehlen, soll das Informationsmittel besitzen, dem folgende fiktive Anwendung von FO zugrundeliegt: Ein Genetiker möchte die Vererbung der Farbmuster auf der Körperoberfläche von Individuen einer bestimmten Tierart erforschen. Dazu führt er Kreuzungsexperimente über mehrere Generationen hinweg durch, bei denen er insgesamt 2500 Individuen (a1, a2, …) beobachtet und untersucht. Zur genaueren Identifizierung und Kennzeichnung der Farben benutzt er die Farbprädikatoren von FO und zur Formulierung seiner Beobachtungen und Hypothesen die formale Sprache L(G). Als Namen für die Versuchstiere stellt L(G) die Ziffern von „1“ bis „2500“ zur Verfügung, und zur Beschreibung ihrer Färbung werden die Ausdrücke der Kategorie FM(FZ) von FO verwendet. Hat etwa das Tier a1 einen Farbfleck einer Valenz, die in der 24ca-Zelle des Farbkörpers liegt, so notiert sich der Genetiker dies in L(G) so: „24ca(1)“. Auch für die Verwandtschaftsbeziehungen zwischen Tieren verwendet er Abkürzungen: „Va“ (Vater), „Mu“ (Mutter), „Elt“ (Elternteil) usw. Zur Formulierung von Zusammenhängen zwischen Sachverhalten werden die folgenden, „Junktoren“ genannten, Ausdrücke benutzt: „ÿ“ (Negator: ‘es ist nicht der Fall, daß …’), „∧“ (Konjunktor: ‘… und ---’), „∨“ (Adjunktor: ‘… oder --oder beides’), „→“ (Subjunktor: ‘wenn …, dann ---’) und „↔“ (Bisubjunktor: ‘… genau dann, wenn ---’; zur Berechtigung der angegebenen Übersetzungen vgl. man Grice 1975 und 1978 sowie Posner 1979). So heißt zum Beispiel „[Va(1, 7) ∨ Mu(1, 7)]“, daß das Tier
a1 Vater oder Mutter des Tieres a7 ist. Eckige Klammern dienen der eindeutigen Kenntlichmachung des Gemeinten. So hat man zum Beispiel „[[Va(1, 7) ∧ 24ca(1)] → 24ca(7)]“ so zu übersetzen: „Wenn a1 Vater des Tieres a7 ist und a1 einen Fleck aus dem Valenzgebiet 24ca hat, so weist auch a7 einen solchen Fleck auf“. Demgegenüber lautet aber die Übersetzung von „[Va(1, 7) ∧ [24ca(1) → 24ca(7)]]“: „a1 ist Vater von a7, und wenn a1 einen 24ca-Fleck hat, so hat auch a7 einen solchen Fleck“. Daß a1 tatsächlich Vater von a7 ist, wird mit dem zweiten, keineswegs aber mit dem ersten Ausdruck behauptet. Sicherlich wird unser Genetiker auch generelle Zusammenhänge wie (29a) ausdrücken und Existenzbehauptungen wie (29b) aufstellen wollen. (29a) Wenn irgendeines der Tiere Vater eines anderen ist und das erste Tier einen 24ca-Fleck hat, so hat auch das zweite Tier einen solchen Fleck. (29b) Die Tiere a1 und a2 haben einen gemeinsamen direkten Nachkommen. Hierzu stehen ihm die Quantoren „ “ (Generalisator: ‘für jedes …’) und „ “ (Partikularisator: ‘für mindestens ein …’) zur Verfügung. Diese beiden Ausdrücke reichen zu diesem Zwecke aber noch nicht ganz aus! In (29a) beziehen sich die Ausdrücke „das erste Tier“, „das zweite Tier“ anaphorisch zurück auf „irgendeines der Tiere“ bzw. „eines anderen“. Semantisch sichern diese anaphorischen Querbezüge, daß die Eigenschaft, einen 24caFleck aufzuweisen, im darzustellenden Verhältnis zur Vaterbeziehung steht: Wenn diese Beziehung zwischen zwei Tierindividuen statt hat, so trifft die Färbungseigenschaft auf das Nachfahrenindividuum zu, wenn sie auf das Vaterindividuum zutrifft. Neben den Quantoren benötigt L(G) auch Mittel, diese Querbezüge kenntlich zu machen. Mit den bisher besprochenen Ausdrücken von L(G) hätte man für (29a) ja nur so etwas wie „ [Va( , ) ∧ 24ca( )] → 24ca( )]“. Was im Unterschied zu (29a) diesem Ausdruck noch fehlt, ist gerade die Verdeutlichung der gemeinten Querbezüge: Wie hängen genau „Va“ und „24ca“ semantisch zusammen? Man könnte etwa (s. Quine 1940: 70) die Querbezüge graphisch durch Bogenzüge verdeutlichen; s. (30). (30)
[[Va( , )
24ca( )]
24ca( )]
3. Semantik
Statt solcher Bögen, die für die Ausdrücke komplexerer Zusammenhänge schnell unübersichtlich werden, verwendet man in Informationsmitteln wie L(G) spezielle Ausdrücke: Variablen. Man ersetzt jedes Bogenende durch eine Variable, wobei für Enden desselben Bogenzuges Vorkommnisse derselben Variablen benutzt und unterschiedliche Bogenzüge durch unterschiedliche Variablen differenziert werden. So erhält man für (29a) den Ausdruck (31a) und entsprechend (31b) für (29b). (31a) x x0[[Va(x, x0) ∧ 24ca(x)] → 24ca(x0)] (31b) x[Elt(1, x) ∧ Elt(2, x)] Die semantische Analyse anaphorischer Querbezüge, die in L(G) durch die Variablennotation widergespiegelt werden, gehörte bereits zu den Themen der stoischen Semiotik (s. Egli 1979; zur Semiotik der Stoa generell Art. 40 § 3.5.3.). Ihr gelten auch viele wichtige semantische Untersuchungen natürlicher Sprachen und ihrer Pronominalsysteme (s. Cooper 1983). Häufig haben die dabei auftauchenden Probleme die Entwicklung neuer semantischer Techniken (wie z. B, die Cooper-Speicherung, s. Cooper 1983: ch. 3) und Bedeutungstheorien angeregt oder mitveranlaßt. Letzteres gilt zum Beispiel für die sogenannte „Diskursrepräsentationstheorie“ (DRT; s. u. § 4.6.; vgl. Kamp 1981) und bis zu einem gewissen Grade auch für die spieltheoretische Semantik (zu deren Anaphernanalyse vgl. Hintikka und Carlson 1979 sowie Hintikka und Kulas 1983). Zur mathematischen Analyse der Variablennotation ist von Tarski und seinen Mitarbeitern sogar ein neues Teilgebiet der Algebra, die Theorie der Zylinderalgebren, entwickelt worden (s. Henkin, Monk und Tarski 1971 sowie 1985).
4.2. Die Folgebeziehung als Schlüsselbegriff Für L(G) könnte man nun ohne weiteres eine wahrheitstheoretische Semantik aufbauen; die Verfeinerungen des wahrheitstheoretischen Ansatzes, die durch L(G) (und in den folgenden Abschnitten behandelte Informationsmittel) erforderlich werden, kann man zum Beispiel der Lehrbuchdarstellung von Davies (1981) entnehmen. Statt vom Wahrheitsbegriff nimmt aber die semantische Beschreibung von L(G) durch S4 von folgender Überlegung ihren Ausgang: Jemand der (31a) versteht, muß nicht wissen, ob (31a) wahr oder falsch ist (das setzt auch der wahrheitstheoretische Ansatz nicht voraus), aber er muß wissen, daß „24ca(2)“ wahr ist, falls nur (31a) und darüber hinaus „Va(1)“ sowie „24ca(1)“ wahr sind. Wer die Bedeutung von (31a) kennt, muß also diesen Ausdruck ausnützen können: Er muß wissen, daß sich aus ihm zum Beispiel mit den beiden anderen an-
107 geführten Ausdrücken weitere Informationen herausholen lassen. Dies legt nahe, als semantische Einheit eines wahrheitsfähigen Ausdrucks nicht seinen Wahrheitswert anzunehmen, sondern seinen Gehalt oder Inhalt, d. h.: die Gesamtheit der Folgerungen, die sich aus ihm ziehen lassen. Da der Gehaltbegriff auf dem relationalen Begriff der Folge beruht, bringt uns dieser neue Ansatz in die Nähe der strukturellen Semantik (vgl. Lyons 1977: I, Kap. 9), die den Vorrang relationaler Sinnbeziehungen vor substanzbezogenen Begriffen betont. Viele Sinnbeziehungen lassen sich aufgrund der Folgebeziehung und des Gehaltbegriffs definieren. Zwei Ausdrücke z und j sind zum Beispiel synonym, wenn jeder wahrheitsfähige Ausdruck f, in dem z vorkommt, denselben Gehalt (nicht etwa nur denselben Wahrheitswert) hat wie der Ausdruck x, der aus f entsteht, wenn z durch j ersetzt wird (vgl. Carnap 1934: 38). Von der gerade skizzierten Grundidee des Systems S4 her betrachtet, klebt das mit S1, S2 und S3 exemplifizierte wahrheitstheoretische Vorgehen zu sehr am Faktischen. Semantisch sind aber nicht so sehr die tatsächlichen Designate einzelner Ausdrücke relevant, sondern nur deren allgemeine Beschaffenheit (ihr Typ; s. o. § 3.5.) und ihre Beziehungen untereinander. Betrachten wir dazu nochmals das obige Beispiel! Zum Ausdruck der Folgebeziehung wird „储–“ benutzt. Folgt z aus der Ausdrucksgesamtheit A, so gilt A 储– z; umfaßt dabei A genau j1, j2, …, jn, so gilt: j1, j2, …, jn 储– z. Ist nun (abkürzungshalber) f1 der Ausdruck (31a), f2 ⫽ „Va(1, 2)“, f3 ⫽ „24ca(1)“ und f4 ⫽ „24ca(2)“, so gilt: f1, f2, f3 储– f4. Daß dies so ist, ist nun aber völlig unabhängig von den tatsächlichen Designaten (Wahrheitswerten) von f1, …, f4. Daß f1, f2, f3 储– f4 heißt soviel wie: Gleichgültig welche Designate „24ca“, „Va“, „1“ und „2“ und gleichgültig welche Wahrheitswerte somit die betrachteten Ausdrücke f1, …, f4 tatsächlich haben, falls f1, f2 und f3 wahr sind, so ist es auch f4. Bei der Analyse der Folgebeziehung muß man sich also von den faktisch gegebenen Designaten lösen und muß alle möglichen Designatsverteilungen betrachten, denn wenn der Zusammenhang zwischen den Wahrheitswerten von f1, f2 und f3 einerseits und dem von f4 andererseits unter allen möglichen Verteilungen von Designaten besteht, dann ist es wirklich gleichgültig, welche Designatsverteilung die tatsächliche ist.
108 Eine mögliche Designatsverteilung nennt man nun ein „Modell“ (Tarski 1936 b: 8). „Möglich“ heißt hier lediglich, daß einem Ausdruck z (ohne freie Variablen; s. u. § 4.3.) in einem Modell M eine semantische Einheit b zugewiesen wird, die vom selben Typ wie das tatsächliche Designat von z ist. Ich sage dann, daß z in M b designiert: b ⫽ 储z储M; b nenne ich „das Modelldesignat von z in M“. Ist z also ein referierender Ausdruck, so muß sein Modelldesignat ein Gegenstand sein; die Modelldesignate prädikativer Ausdrücke müssen Attribute und die wahrheitsfähiger Ausdrücke Wahrheitswerte sein. Daß f1, f2, f3 储– f4, heißt dann eben, daß für jedes Modell M, in dem f1, f2 und f3 W designieren, auch W ⫽ 储f4储M gilt. ⫺ Man beachte den Unterschied zwischen der zweistelligen (bzw. dreistelligen; s. u. § 4.4.1.) modelltheoretischen Funktion 储 储 und den wahrheitstheoretischen Begriffen Des und den! Während die Funktion Des und die Relation den absolut, d. h. nicht modellrelativiert sind, ist das zweite Argument von 储 储 stets ein Modell. Dies bedingt, daß die metasprachliche Formulierung der Bedingungen, unter denen z in einem Modell M wahr ist (d. h.: W ⫽ 储z储M), keine Übersetzung von z darstellt (vgl. oben die Erläuterung der Konvention W in § 2.2.); diesen Unterschied zwischen wahrheits- und modelltheoretischem Vorgehen diskutiert Davidson (1973: 78 f). Wie die Arbeit zum Wahrheitsbegriff (Tarski 1935c) den Ausgangspunkt für die wahrheitstheoretische Semantik geliefert hat, so ist der Aufsatz von Tarski (1936) über die Folgebeziehung die Geburtsurkunde der Modelltheorie. Hiz˙ (1977: 41) zählt die Modelltheorie zusammen mit der linguistischen Semantik und der Ikonographie zu den Spezialisierungen der Semiotik auf bestimmte Anwendungsgebiete, während Mostowski (1965: 119) in ihr einfach „[…] the modern form of semantics“ sieht. Insbesondere durch die Arbeiten von Tarkis Schüler Montague haben Methoden der Modelltheorie auch Eingang in die Semantik natürlicher Sprachen gefunden. Die methodische Legitimität semantischer und speziell linguistischer Anwendungen der Modelltheorie ist dabei durchaus umstritten (vgl. Potts 1975), obwohl der modelltheoretische Ansatz neben dem wahrheitstheoretischen eine der die Semantik beherrschenden Forschungsrichtungen ist. Die Frage, ob er sich aufgrund seiner Analyse der Folgebeziehung rechtfertigen läßt, diskutiert Etchemendy (1988a: 64⫺78 und 1988b). Hi-
I. Systematik
storische Überblicke über die Entwicklung der Modelltheorie liefern Mostowski (1965: Kap. XIII und XIV) und Chang (1974). 4.3. Syntaktisches Vorspiel Vor der exakten Definition des für L(G) angemessenen Modellbegriffs muß noch der Ausdrucksbestand von L(G) genau beschrieben werden. Da für L(G) das syntaktische Kategoriensystem und das semantische Typensystem recht ähnlich sind, werden hier einheitliche Indizes verwendet: (i) e und t sind Basisindizes; (ii) die Funktions- bzw. Funktorindizes haben sämtlich die Gestalt t1t2 … tn (t0 ), wobei n ⱖ 1 und für jedes m (1 ⱕ m ⱕ n) tm ⫽ e und t0 ⫽ t oder e ist (für L(G) selbst ist sogar stets n ⱕ 2 und t0 ⫽ t; die allgemeinere Festsetzung wird in Hinblick auf spätere Beispiele getroffen). Neben diesen Kategorienindizes, die zugleich auch Typenindizes sind, gibt es noch den einzigen Kategorienindex ve für die Kategorie der Variablen von L(G), der nicht zugleich Typenindex ist. Die Grundausdrücke von L(G) sind vollständig in (32) aufgelistet, wobei für einige Ausdrücke in Klammern bereits Hinweise auf ihre Bedeutung (in der Beispielsituation von § 4.1.) gegeben werden. (32) L(G) verfügt genau über die folgenden Grundausdrücke: (32a) technische Hilfsausdrücke: (, ), [, ] und das Komma (32b) Variablen; sie gehören zu e und zugleich zu ve: x, x0, x00, x000 usw. (32c) Nominatoren, d. h. Ausdrücke der Kategorie e: 1, 2, 3, …, 2500 (32d) das Falsum der Kategorie t: (Es bedeutet den Wahrheitswert F.) (32e) einstellige Prädikatoren, d. h. Ausdrücke der Kategorie e(t): Wl (weiblich), Ml (männlich); ferner gehört hierher jeder für FO als FM(FZ) kategorisierter Ausdruck (also: 2na 5ie usw.) (32f) zweistellige Prädikatoren, d. h. Ausdrücke der Kategorie ee(t): ⫽ (Identität), Va (Vater), Mu (Mutter), Elt (Elternteil), Ki (Kind), Kw (Tochter), Km (Sohn), Bru (Bruder), Schwe (Schwester), Geschw (Geschwister), GrMu (Großmutter), GrVa (Großvater), GrElt (Großeltern), Em (Enkelsohn), Ew (Enkeltochter), Vf (Vorfahr), Nf (Nachfahr)
109
3. Semantik
(32g) Junktoren: ÿ, ∧, ∨, →, ↔ (32h) Quantoren: , Die Ausdrücke unter (32a), (32g) und (32h) gehören zu keiner Kategorie. Aber während die Hilfsausdrücke rein technischen Charakter haben, besitzen Junktoren und Quantoren auch ein semantisches Eigengewicht. Jedem dieser Ausdrücke entspricht genau eine syntaktische Operation von L(G), mit der er in komplexere Ausdrücke eingebaut wird. Ein Junktor oder Quantor wird daher durch die semantische Operation gedeutet, die die ihm entsprechende syntaktische Operation interpretiert. Einen semantisch so funktionierenden Ausdruck nennt man in Anschluß an die mittelalterliche Logik- und Grammatikterminologie (vgl. Kretzmann 1982) auch „synkategorematisch“; die kategoresierten Ausdrücke sind dann Kategoremata. ⫺ Die syntaktischen Operationen für L(G) werden wie bei FO aufgrund von Hilfsoperationen definiert; diese sind in (33) angegeben. (33a) J7, n(z, j1, j2, …, jn ) ⫽ z(j1, j2, …, jn ) (33b) J8(z) ⫽ ÿ z (33c) J9(z, j) ⫽ [z ∧ j], J10(z, j) ⫽ [z ∨ j], J11(z, j) ⫽ [z → j], J12(z, j) ⫽ [z ↔ j] (33d) J13(z, j) ⫽ zj, J14(z, j) ⫽ zj Ist A(L(G)) die Gesamtheit der aus den Kategoremata(!) von (32) mittels der Operationen aus (33) bildbaren Ausdrücke, so sind die syntaktischen Operationen F7, n, F8, …, F14 von L(G) als Einschränkungen der Operationen J7, n, J8, …, J14 auf A(L(G)) bestimmt (vgl. das analoge Vorgehen in § 3.2. für FO). In (34) sind die syntaktischen Regeln für L(G) angegeben. Man erkennt aufgrund dieser Regeln, daß die in § 4.1. als Beispiele besprochenen Ausdrücke wohlgeformt sind. (34 a) R7,n ⫽ *F7,n, *e … e(t), e, …, e +, t+ ÚÛÙ n-mal
ÚÛÙ n-mal
(34b) R8 ⫽ *F8, *t+, t+ (34c) Rm ⫽ *Fm, *t, t+, t+ (9 ⱕ m ⱕ 12) (34d) Rn ⫽ *Fn, *ve, t+, t+ (n ⫽ 13 oder 14) Aus Gründen der Übersichtlichkeit und Lesbarkeit sollen für das folgende einige Konventionen verabredet werden: Als metasprachliche Namen für „x0“, „x00“, „x000“ und „x0000“ verwendet ich „y“, „z“, „u“ und „w“. Für ⫽(z, j) soll z ⫽ j und für ÿ ⫽ (z, j) soll
z ⫽ j geschrieben werden. Manchmal werden eckige Klammern gesetzt, wo keine nötig sind (z. B. in „ x[x ⫽ x]“ für „ xx ⫽ x“). ⫺ Für die Semantik von L(G) ist noch folgender syntaktischer Begriff von großer Wichtigkeit: Kommt der t-Ausdruck j als Teil des tAusdrucks z vor und entsteht j nach R13 oder R14 aus f von ve und x von t (hat also j die Gestalt fx oder fx), so heißen alle Vorkommnisse der Variablen f in z, die in dem betreffenden j-Vorkommnis liegen, dort (durch das Präfix „ “ oder „ “ von j) „gebunden“. Nicht-gebundene Variablenvorkommnisse sind frei. Alle Variablenvorkommnisse in den t-Ausdrücken von (31a) und (31b) sind zum Beispiel gebunden. In [ x y[Va(y, x) ∧ Mu(z, x)] ∧ Wl(x)] sind die ersten drei x-Vorkommnisse gebunden, und das vierte ist frei; das einzige y-Vorkommnis ist gebunden, und das einzige z-Vorkommnis ist frei. 4.4.
Modelle für L(G)
4.4.1. Modelle und Erfüllung in Modellen Ein Modell für L(G) ist nun ein Paar M ⫽ *E, F +, in dem E eine nicht-leere Menge, der Individuenbereich (Gegenstandsbereich oder Trägermenge) von M, ist und die Modellfunktion F den Kategoremata von (32) ein passendes Modelldesignat zuweist. „Passend“ heißt (s. o. § 4.2.), daß das Modelldesignat eines z vom selben Typ sein muß, wie das Designat von z in der in § 4.1. geschilderten Anwendungssituation. Es muß daher für jedes Modell M eine Klassifikation der Modelldesignate in Typen (s. o. § 3.5.) angegeben und die Typenzuordnung TL(G) von L(G) bestimmt werden. Da außer ve jede Kategorie von L(G) auch Typ ist (s. § 4.3.), ist TL(G) denkbar einfach: (i) TL(G)(ve ) ⫽ e; (ii) TL(G)(t) ⫽ t für jede Kategorie t ⫽ ve. ⫺ Da die Wahrheitswerte in § 2.3. ein für allemal fest als W und F gewählt worden sind, hängt die Klassifikation der Modelldesignate für ein M ⫽ *E, F + lediglich vom jeweiligen E ab. Ist t ein Typ (für L(G)), so ist Dsgt, E der Bereich der möglichen Designate vom Typ t über E. Die Definition der Designatsbereiche Dsgt, E folgt den Erläuterungen von § 3.5. für das wahrheitstheoretische Analogon der Designatstypen. (35a) Dsgt, E ⫽ {W, F} (35b) Dsge, E ⫽ E (35c) Ist t ⫽ t1t2 … tn(t0 ), so ist Dsgt, E ⫽ Dsgt0, E (Dsgt E ⫻ Dsgt E ⫻ … ⫻ Dsgt E) 1,
2,
n,
110 Die Modellfunktion F eines Modells M ⫽ *E, F + für L(G) ordnet also einem z der Kategorie k ein Modelldesignat F (z) ⫽ 储z储M aus dem Designatsbereich Dsgt, E mit t ⫽ TL(G)(k) (in L(G) gilt stets: k ⫽ t) zu. ⫺ Zwei Grundausdrücke von L(G) werden dabei in besonderer Weise berücksichtigt: Das Falsum soll in jedem Modell F denotieren, und „⫽“ soll in jedem M ⫽ *E, F+ das Identitätsattribut über E designieren. Das ist das Attribut aI, E, welches g1 und g2 aus E genau dann den Wert W zuweist (d. h.: aI, E(g1, g2 ) ⫽ W), wenn g1 derselbe Gegenstand wie g2 ist. Von allen Modellen M ⫽ *E, F + wird also verlangt, daß F ( ) ⫽ F und daß F (⫽) ⫽ aI, E. ⫺ Damit ist der Begriff des Modells (für L(G)) exakt bestimmt. Durch die Beispielsituation von § 4.1. wird bereits ein Modell S ⫽ *S, I + festgelegt, dessen Gegenstandsbereich S die Stichprobe der 2500 beobachteten Tiere ist und dessen Modellfunktion I die Kategoremata von L(G) der Absicht des Beispielgenetikers entsprechend interpretiert. So ist etwa I (Wl) ⫽ a¥ das Attribut über S, das einem Tier a von S genau dann den Wert W zuweist, wenn es weiblich ist, und aso ⫽ I (Schwe) ordnet a1 und a2 genau dann W zu, wenn a1 Schwester von a2 ist. (Die I -Werte der anderen Kategoremata entnimmt man leicht den Klammerangaben in (32).) Da S den semantischen Intentionen des (fiktiven) Benutzers von L(G) entspricht, soll es das „intendierte Modell“ von L(G) heißen. Läßt sich ein Informationsmittel I modelltheoretisch analysieren, so ist das intendierte Modell von I gerade Beschreibungsgegenstand einer wahrheitstheoretischen Semantik von I; gewissermaßen ist das modelltheoretische Vorgehen also eine Verallgemeinerung des wahrheitstheoretischen. ⫺ Eine formale Sprache (wie L(G)), die ein intendiertes Modell hat, heißt „interpretiert“. Manchmal werden formale Sprachen zwar in Hinblick auf bestimmte Verwendungsarten entworfen, ohne daß dabei aber eine bestimmte Anwendung als intendiert ausgezeichnet wird; es gibt also durchaus nicht-interpretierte Sprachen. (Auch in der Wissenschaftstheorie werden Sprachen semantisch untersucht, die nur zum Teil interpretiert sind; vgl. Art. 84.) Mit einem Modell M ⫽ *E, F + für L(G) ist zwar durch F für jede Konstante z von L(G) (d. h.: für jeden kategorematischen Grundausdruck, der nicht Variable ist) ein Modelldesignat F (z) ⫽ 储z储M in M festgelegt; die Variablen haben aber noch keine seman-
I. Systematik
tischen Entsprechungen. Ihre semantische Analyse ist ein echtes Problem und soll zunächst zurückgestellt werden. ⫺ Damit ergibt sich als nächste Frage, wie man das Modelldesignat eines komplexen Ausdrucks aufgrund der Modelldesignate seiner Teilausdrücke ermittelt. Dazu werden wieder semantische Operationen benötigt, die die syntaktischen Operationen F7, n, …, F14 dem Tandem-Prinzip gemäß interpretieren. Da die semantischen Operationen jetzt modellabhängige semantische Einheiten miteinander kombinieren, sind sie selbst modellrelativiert: M GM 7, n, …, G14 sind die für M relevanten semantischen Operationen. Ist nun etwa das Tier a1 der Beispielsituation weiblich und Mutter von a2, so sollten die Modelldenotate von „Wl(1)“ und „Mu(1, 2)“ im intendierten Modell S gleichermaßen W sein. Der naheliegendste Kandidat zur Interpretation von F7, n in S ist mithin eine Anwendungsoperation HS 7, n die n-stellige Attribute a über S auf jeweils n Gegenstände a1, …, an von S anwendet (HS 7, n(a, a1, …, an ) ⫽ a(a1, …, an )) und ansonsten irgendein Ersatzobjekt zuweist (s. o. (27b) in § 3.4.). Mit dieser Operation hat man in Analogie zu (12) von § 2.4. und (28) von § 3.4. für n-stellige Prädikatoren z und n Nominatoren j1, j2, …, jn: 储F7, n(z, j1; …, jn )储S ⫽ H7, n(储z储S, 储j1储S, …, 储jn储S), und entsprechende Anwendungsoperationen lassen sich auch für die nicht-intendierten Modelle festlegen. Die Operationen F8, …, F12 werden mit Hilfe der Wahrheitswertfunktionen ¯ (Negation), (Konjunktion), (Adjunktion), ⱷ (Subjunktion) und ⫼ (Bisubjunktion) interpretiert, deren Zuordnungseffekte in sogenannten „Wahrheitswerttafeln“ dargestellt werden (s. auch Art. 76); es ist zum Beispiel W W ⫽ W und W ⱷ F ⫽ F. (36) a
a¯
W F F W
a b W W F F
W F W F
ab W F F F
a b W W F F
W F W F
ab W W W F
a b aⱷb
a b a⫼b
W W F F
W W F F
W F W F
W F W W
W F W F
W F F W
So wird als semantisches Gegenstück von F8 (für ein Modell M) eine Funktion HM 8 be-
3. Semantik
stimmt, die für Wahrheitswerte x wie ¯ funktioniert (HM ¯ ) und anderen Modellde8 (x) ⫽ x signaten von M ein Ersatzobjekt zuweist. Mit den Quantoren beginnen nun aber die Schwierigkeiten: Wann gilt zum Beispiel W ⫽ 储 x[Wl(x)]储S? Nach § 4.1. ist dies genau dann der Fall, wenn jedes der 2500 Tiere a1, a2, … in S weiblich ist. Nun hat jedes Tier bezogen auf S einen Namen: a1 ⫽ 储1储S, a2 ⫽ 储2储S usw. Man könnte also die 2500 S Werte 储Wl(1)储S, 储Wl(2)储 , … ermitteln; und es gilt tatsächlich 储 x[Wl(x)]储S ⫽ W genau dann, wenn alle diese Einsetzungsinstanzen „Wl(1)“, „Wl(2)“, … von „Wl(x)“ in S W designieren. Entsprechend gilt, daß 储 x[Wl(x)]储S ⫽ W genau dann vorliegt, wenn mindestens eine der 2500 Einsetzungsinstanzen von „Wl(x)“ in S W designiert. Sollte man also W ⫽ 储 jf储S für gültig erklären, wenn alle Einsetzungsinstanzen f⬘ von f in S W designieren, und sich für W ⫽ 储 jf储S mit der Wahrheit einer Einsetzungsinstanz zufriedengeben? ⫺ Das wäre die sogenannte „Substitutionsinterpretation“ (engl.: „substitutional interpretation“) der Quantoren. Sie stößt auf folgende Schwierigkeit: Angenommen, unser Genetiker vergrößert seine Stichprobe um 2500 neue Individuen, denen er aber keine Namen gibt. Sei S⬘ die neue Stichprobe; dann ist S⬘ ⫽ *S⬘, I ⬘+ ebenso wie S Modell für L(G). Sei nun ferner angenommen, daß die alten Individuen aus S sämtlich weiblich sind, während sich unter den neuen Tieren männliche und weibliche finden: Alle Einsetzungsinstanzen von „Wl(x)“ designieren in S⬘ W, da ja nur weibliche Tiere einen Namen haben; aber sicherlich sollte dennoch F ⫽ 储 x[Wl(x)]储S⬘ gelten. Nun, man könnte verlangen, daß ein Informationsmittel I stets alle Gegenstände, von denen es handelt, benennen können muß, obwohl dies semiotisch einigermaßen unplausibel ist. So kann man zwar aufgrund eines endlichen Ausdrucksvorrats für jede natürliche Zahl eine Benennung bilden, für die reellen Zahlen ist dies aber nicht möglich. (Dies zeigt man mittels des Cantorschen Diagonalverfahrens, das in Art. 107 ausführlich diskutiert wird. L(G) hat übrigens zwar aufgrund von (32b) unendlich viele Grundausdrücke, die sich aber ihrerseits wieder aus nur endlich vielen Ausdrücken aufbauen. Die Variablen bildet man ja aus „x“ und „0“.) Dieses Problem der namenlosen Individuen lösen wir in Anschluß an Tarski (1935c: 47⫺52), indem wir die Variablen als temporäre Nominatoren betrachten. Ist in S⬘ a ein
111 namenloses männliches Tier, so verabreden wir etwa, die Variable „x“ zeitweilig als Namen für a zu betrachten. Das nun mit „x“ bezeichenbare Tier a liefert dann ein Gegenbeispiel für die Gültigkeit von „ x[Wl(x)]“ in S⬘, d. h.: Mit der Anwendungsoperation HS 7, 1 erhält man aus der Festsetzung a ⫽ 储x储 S⬘ , 储Wl(x)储S⬘ und somit auch F ⫽ 储 daß F ⫽ x[Wl(x)]储S. Zweierlei bleibt aber noch zu berücksichtigen: (i) In einem zu interpretieren den Ausdruck können „ “ und “ beliebig oft vorkommen, so daß zur Konstruktion relevanter Beispiele und Gegenbeispiele Konventionen bezüglich mehrerer Variablen zu treffen sind. Am besten bestimmt man eine entsprechende Festsetzung also gleich für alle Variablen; eine solche Festsetzung wird „Belegung“ genannt. Ist M ein Modell mit Gegenstandsbereich E, so ist eine Belegung f über E eine Funktion, die jeder Variablen j ein g ⫽ f(j) aus E zuordnet. (ii) Belegungen sind bloß temporäre Festsetzungen; man will und muß sie verändern können. Angenommen nämlich, h belegt jede Variable j durch ein Individuum aus S; da S⬘ S enthält, wäre h gleichermaßen Belegung über S und über S⬘. Gleichgültig, welches Tier h(x) ist, aus der Setzung 储x储S⬘ ⫽ h(x) ergibt sich als Modelldesignat für „Wl(x)“ in S⬘ W; mit h kann man also nicht zu einem Gegenbeispiel für „ x[Wl(x)]“ gelangen. Ändert man aber h zu h⬘ ab, das alle von „x“ verschiedenen Variablen j genauso wie h belegt (h(j) ⫽ h⬘(j)), „x“ jedoch ein männliches Tier a aus S⬘ zuweist, so erhält man eine neue Belegung h⬘ über S⬘, die wieder ein Gegenbeispiel zu „ x[Wl(x)]“ liefert. Diese Veränderung von h zu h⬘ beschreibt man mit folgender Gleix chung: h⬘ ⫽ h* +; und entsprechend ist f⬘ a j , …, jn mit f⬘ ⫽ f* 1 + die Belegung, die für a1, …, an von j1, …, jn verschiedene Variablen mit f übereinstimmt, jedoch j1 a1, … und jn an zuordnet. Das diskutierte Beispiel zeigt auch, daß die bisherigen Bestimmungen hinsichtlich der Funktion 储 储 modifiziert werden müssen. Zur Ermittlung eines Modelldesignats für jz (z. B. „ x[Wl(x)]“) hat man zunächst z („Wl(x)“) semantisch zu interpretieren. Dieser Ausdruck enthält aber (zumeist) auch dann freie Variablen (nämlich j-Vorkomm nisse; hier: eines von „x“), wenn jz keine solchen enthält (R13 und R14 lassen auch sogenannte „leere Quantifikation“ zu, bei der j im z von jz bzw. jz nicht vorkommen
112 muß). Da Variablen aber nur in bezug auf Belegungen Modelldesignate haben, hängt auch das Modelldesignat von z von einer jeweils zugrunde gelegten Belegung ab. So war zum Beispiel 储Wl(x)储S⬘ ⫽ W unter der Belegung h, aber 储Wl(x)储S⬘ ⫽ F unter der Belex gung h⬘ ⫽ h* +. Die Funktion 储 储 muß also a um die jeweils zugrunde gelegte Belegung als zusätzliches Argument erweitert werden; 储 储 muß dreistellig sein: d ⫽ 储f储M f heißt, daß f in M unter der Belegung f d designiert. Die Modelldesignate sind also von Belegungen als zusätzlichen Parametern abhängig; van Benthem (1986: 252, 254) sieht hierin bereits einen ersten Schritt zur Relationentheorie der Bedeutung, die die Situationssemantik fundiert (s. u. § 8.2.4.). Die Modelldesignate der Konstanten f werden allerdings von den Belegungsparametern nicht beeinträchtigt; für sie gilt nach wie vor bei M ⫽ *E, F +: 储f储M f ⫽ F (f). Gehört aber x zu ve, so ist nun: 储x储M f ⫽ f(x). ⫺ Wie das Beispiel gezeigt hat, reicht es zur Inter pretation von „ “ und „ “ nicht hin, die gerade zugrunde gelegte Interpretation (etwa nur das h des Beispiels) zu betrachten; man muß alle Belegungen systematisch durchmustern, damiteinem kein mögliches Gegenbei spiel (für „ “) bzw. kein Beispiel (bei „ “) entgehen kann. Dies motiviert (37). (37 a) 储 jz 储M f ⫽ W genau dann, wenn für jedes g aus dem Gegenstandsbereich von M 储 z 储M f*gz + ⫽ W gilt. (37 b) 储 Vjz 储M f ⫽ W genau dann, wenn für mindestens ein g aus dem Gegenstandsbereich von 储 z 储M f*gz + ⫽ W gilt. Die beiden Klauseln von (37) machen die sogenannte „referentielle“ oder auch „Gegenstandsinterpretation“ (engl.: „referential“, „objectual interpretation“) der Quantoren aus. Sie liefert gerade eines der oben in § 2.3. angesprochenen Kriterien für Referentialität bzw. Gegenständlichkeit: Ein Ausdruck ist referentiell, wenn seine Bedeutung als Belegung einer Variablen auftreten kann, die ein Quantor bindet; zur Kritik dieses sogenannten „Quineschen Ontologiekriteriums“ vergleiche man Hinst (1983). Die Wahl zwischen Einsetzungs- und Gegenstandsinterpretation wird häufig mit grundsätzlichen ontologischen Erwägungen motiviert bzw. für irrelevant erklärt; zu diesem Problem vergleiche man Wallace (1970), Quine (1974), Kripke (1976), Baldwin (1979). Neben diesen beiden gebräuchlichsten Auffassungen der Quantoren gibt es noch weitere,
I. Systematik s. etwa Küng und Canty (1970) oder Baldwin (1979). Martin (1977) diskutiert Freges Semantik für Quantoren, die in Hinblick auf die Schwierigkeiten interessant ist, die Quantoren dem Kompositionalitätsprinzip bereiten.
Was muß man nun nach (37) genau tun? Welche Operationen interpretieren F13 und F14? Um dies präzise beantworten zu können, benötigt man einen Begriff, der im folgenden (insbesondere in § 7.) eine überragende Rolle spielen wird. Anhand der Tabellen von (36) überzeugt man sich leicht davon, daß für und die folgenden Beziehungen (38) gelten. (38a) Kommutativität: (38b) Assoziativität: (38c) Absorptionsgesetze:
a a a a a a
b⫽ba b⫽ba (b c) ⫽ (a b) c (b c) ⫽ (a b) c (a b) ⫽ a (a b) ⫽ a
Ein Tripel V ⫽ *V, · , · +, bestehend aus einer Trägermenge V mit zwei auf ihr definierten Operationen · und · , die beide kommutativ, assoziativ und sich gegenseitig absorbierend sind (also für v1 und v2 aus V: v1 · v2 ⫽ v2 · v1 usw.), nennt man einen „Verband“. Somit bildet {W, F} als Trägermenge nach (38) bezüglich der Konjunktion und Adjunktion einen Verband: den Wahrheitswertverband (s. u. § 7.3.2.). Die Verbandsordnung · eines Verbandes V ⫽ *V, · , · + wird so festgelegt: v1 · v2 (lies: v1 unter v2, oder: v2 über v1 ) genau dann, wenn v1 · v2 ⫽ v2. Aus der dritten Tabelle von (36) ermittelt man für den Wahrheitswertverband die Ordnung : W
W, F F, F W; aber nicht W F. Ist V ⫽ *V, · , · + irgendein Verband, V0 Teilmenge seiner Trägermenge V und v3 ein solches Element von V, für das (i) v1 · v3 für jedes v1 aus V0 (bzw. v3 v1 für jedes v1 von V0 ) und das im Sinne von · am dichtesten über V0 (bzw. unter V0 ) liegt (d. h.: falls für ein v2 aus V ebenfalls v1 · v2 ⫺ bzw. v2 · v1 ⫺ für jedes v1 aus V0 gilt, so: v3 v2 ⫺ bzw. v2
v3 ), so ist v3 das Supremum (bzw. Infimum) von V0. Das schreibt man auch so: v3 ⫽ · V0, bzw. v3 ⫽ · V0. Im Wahrheitswertverband gilt zum Beispiel: W ⫽ {W}, F ⫽
{W, F}, W ⫽ {W, F}, F ⫽ {F}. ⫺ Was zur Ermittlung von 储 jz储M f nach (37a) zu tun ist, läßt sich nun so beschreiben: (i) Ermittle für jedes g aus dem Gegenstandsbereich E von M den Wert d ⫽ 储 z 储M f*gz +! (ii) Fasse alle so ermittelten Werte zur Menge D (⫽ {储 z 储M f*gz + | g aus E}) zusammen! (iii) Bilde das Infimum von D! Entsprechend muß nach (37b) das Su-
3. Semantik
premum von D ermittelt werden. ⫺ Die bisherigen Erläuterungen zu 储 储 faßt (39) zusammen. (39) Ist M ⫽ *E, F + Modell für L(G), f eine Belegung über E, so gilt: (39a) Falls z eine Konstante ist, so ist 储 z储M f ⫽ F (z). (39b) Ist z aus ve, so ist 储z储M f ⫽ f(z). (39c) Wenn z nach R7, n gebildet ist und somit die Gestalt j0(z1, …, jn ) M hat, so ist 储z储M ⫽ 储j0储M f f (储j1储f , …, 储jn储M ). f (39d) Ist z nach R8 gebildet und von der Gestalt ÿ j, so ist 储z储M f ⫽ 储 j 储M f . (39e) Für nach R9, R10, R11 oder R12 gebildete z der Form [j1 ⴱ j2] (ⴱ ⫽ ∧, ∨, →, ↔) ist 储z储M f ⫽ 储j1储 M M ⫽ , , ⱷ, bzw. ⫼). f 왌 储j2储f (왌 (39f) Falls z ⫽ jf nach R13 gebildet M ist, so ist 储z储M f ⫽ {储 f 储f*jg+ | g aus E}, und ist z ⫽ jf nach R14 aufM gebaut, so ist 储z储M f ⫽ {储 f 储f*jg+ | g aus E}. Strenggenommen ist damit die Interpretation von „ “ und „ “ nicht denn mehr kompositional, zur Ermittlung von 储 jf储fM oder 储 jf储fM reichen die f-relativen Modelldesignate 储j储fM und 储f储fM der syntaktischen Teile dieser Ausdrücke nicht mehr aus! Man benötigt alle (!) Modelldesignate von f in M unter sämtlichen Modifikationen f1 ⫽ f*jg+ von f an der Stelle j. Um strikte Kompositionalität herzustellen, kann man aber in Anschluß an Montague (1970: 379 und 386) hier so verfahren: Ist E eine nicht-leere Menge, so ist die Gesamtheit Bedt, E der Modellbedeutungen vom Typ t über E die Funktionenklasse Dsgt, Ebel(E) (s. o. (35)), wobei bel(E) die Klasse aller Belegungen über E ist. Ein i aus Bede, E ordnet zum Beispiel jedem f aus bel(E) ein g aus E zu; ein p aus Bedt, E weist jedem solchen f einen Wahrheitswert zu. Da Modellbedeutungen Zuordnungen sind, wird für sie die in § 3.4. erklärte l-Notation verwendet, wobei diesmal aber der Argumentbereich der Zuordnung hinter dem „l“ notiert wird: (ly苸A)[h(y)] ordnet etwa jedem y aus A h(y) zu. Ausdrücken z von L(G) werden nun bezogen auf Modelle M ⫽ *E, F + Modellbedeutungen |z|M (passenden Typs über E) zugewiesen. Für die Grundausdrücke gilt dabei: Ist z eine Konstante, so ist |z|M ⫽ (lf苸bel(E))[F (z)], und gehört j zu ve, so ist |j|M ⫽ (lf苸bel(E))[f(j)]; damit sind die Bedeutungen von Konstanten konstante Funktionen, die für jedes ihrer Argumente denselben Wert annehmen. Hinsichtlich der Modellbedeutungen lassen sich die syntaktischen Operationen F7, n, F8, …, F14 durch semantische Gegenstücke interpretieren. Für M ⫽ *E, F + wird das Verhalten der MM M M relativen Operationen G7, n, G8 , …, G14 von (40) bis auf die Festlegung der Ersatzobjekte zur Inter-
113 pretation nicht-wohlgeformter Ausdrücke eindeutig bestimmt. M (40a) G7, n(a, b1, …, bn ) ⫽ (lf苸bel(E))[a(f)(b1(f), …, bn(f))] (40b) G8M (P) ⫽ (lf苸bel(E))[P(f)] M (40c) Gm (P, Q) ⫽ (lf苸bel(E))[P(f) 왌 Q(f)], für m ⫽ 9, … oder 12 und 왌 ⫽ , …, bzw. ⫼. (40d) Ist |j|M ⫽ i für ein j aus ve, so ist G13(i, P) j ⫽ (lf苸bel(E))[ {P(f* +| g aus E}], und g j G14(i, P) ⫽ (lf苸bel(E))[ {P(f* +) | g aus g E}]. (Hat E mehr als zwei Elemente, so ist, falls es ein j mit |j|M ⫽ i gibt, dieses eindeutig bestimmt; hat E nur ein Element, gibt es auch nur ein i aus Bede, E.)
Diese semantischen Operationen spielen auch durch Vermittlung der Typenzuordnung so mit den syntaktischen Regeln zusammen, wie es in § 3.5. erläutert worden ist. Die 储 储-Funktion ist definierbar: 储z储fM ⫽ |z|M(f). Die in (40) beschriebenen semantischen Operationen liefern zwar eine strikt kompositionale Semantik für L(G), aber sind sie auch mehr als bloße Kuriositäten, die lediglich zeigen, daß man es kompositional haben kann, wenn man es durchaus nun einmal so will (vgl. die unterschiedlichen Standpunkte bei Janssen und van Emde Boas 1984, und bei Stechow 1989: 51⫺59)? Das in (39) benutzte Verfahren ist in der Semantik üblicher Standard und soll daher auch in den folgenden Abschnitten befolgt werden.
Ein t-Ausdruck z wird in einem Modell M ⫽ *E, F + von der Belegung f über E erfüllt, abgekürzt: M 储– z („储–“ wird also in mehrfaf cher Weise gebraucht, s. o. § 4.2.), falls W ⫽ 储 M z储f . Der zentrale Begriff des Erfüllens erlaubt es nun auch, die Folgebeziehung zu definieren: z folgt aus G (also: G 储– z), wenn für jedes M und jedes f M储– z gilt, falls f jedes j f aus G in M erfüllt (vgl. Hermes 1972: 77⫺79). Ein t-Ausdruck heißt „allgemeingültig“ oder „logisch gültig“, wenn er aus der leeren Ausdrucksmenge folgt, wenn ihn also jede Belegung in jedem Modell erfüllt. (Der Folgebegriff wird vielfach, insbesondere in modelltheoretisch-technischen Zusammenhängen, auf eine etwas andere Weise definiert, die aber für Ausdrücke ohne freie Variablen mit der hier gegebenen Definition übereinstimmt; zur angesprochenen Definitionsalternative vgl. Asser 1972: 68⫺70). 4.4.2. Analytizität und Bedeutungspostulat Mit dem Modellbegriff hat man sich also in der gewünschten Weise (s. o. § 4.2.) von den bloß faktischen Designaten gelöst: Da in der Definition der Folgebeziehung auf die Ge-
114 samtheit aller Modelle Bezug genommen wird, abstrahiert man von der tatsächlichen und berücksichtigt statt dessen alle möglichen Designatsverteilungen. Es fragt sich jedoch, ob man dabei nicht einen Schritt zu weit gegangen ist. Zwar besteht jetzt für das in § 4.2. diskutierte Beispiel der gewünschte Folgezusammenhang. Aber in Hinblick auf die in § 4.1. geschilderte Anwendung von L(G) sollte beispielsweise auch gelten: Va(4, 5), Va(5, 6) 储– GrVa(4, 6); Vf(4, 5) 储– Nf(5, 4) und Vf(4, 5), Vf(5, 6) 储– Vf(4, 6). Wenn etwa (1. Beispiel) a4 Vater von a5 und a5 Vater von a6 ist, so folgt daraus, daß a4 Großvater von a6 ist. Es besteht aber in keinem der angeführten Fälle eine Folgebeziehung im Sinne des in § 4.4.1. definierten 储–! Einige der Modelle, auf die man bei der Definition von 储– zurückgreift, respektieren eben nicht die semantischen Zusammenhänge, die zwischen „Va“ und „GrVa“ oder „Vf“ und „Nf“ bestehen und auf denen die beiden ersten Folgebeziehungen beruhen, und in einigen Modellen hat das Modelldesignat von „Vf“ nicht die Eigenschaft, kraft derer die dritte Folgebeziehung besteht. Die Modellfunktion F eines wirklich adäquaten Modells für L(G) müßte „Vf“ und „Nf“ zum Beispiel durch zwei zueinander symmetrische Attribute aa und ad interpretieren: Ist a1 Vorfahr von a2, so ist a2 Nachfahr von a1, also aa(a1, a2 ) ⫽ ad(a2, a1 ). Die semantisch adäquaten Modelle bilden also eine echte Teilklasse der überhaupt möglichen Modelle. Die Folgebeziehung 储– berücksichtigt lediglich die semantischen Eigenschaften der Synkategoremata „ÿ“, „∧“, „∨“, „→“, „↔“, „ “ und „ “ sowie die des Falsums und des Identitätsrelators. Diese Ausdrücke werden aufgrund ihres offenkundig logischen Charakters als „logische Konstanten“ bezeichnet, von denen man die Nominatoren und die (von „⫽“ verschiedenen) Prädikatoren als deskriptive Konstanten absetzt. Alle Modelle verfahren mit den logischen Konstanten in einheitlicher Weise, unterscheiden sich jedoch hinsichtlich der deskriptiven Konstanten. Da somit lediglich semantische Verhältnisse durch 储– berücksichtigt werden, die zugleich logischer Natur sind, wird diese Beziehung auch als „logische Folge“ bezeichnet, von der die analytische Folge (Carnap 1972: 35) zu unterscheiden ist, die auch semantische Eigenschaften deskriptiver Konstanten berücksichtigt. Zur Bestimmung der analytischen Folgebeziehung a储– muß die Gesamtheit M aller Modelle auf die Gesamtheit A der adäquaten Modelle einge-
I. Systematik
schränkt werden; die Teilmenge A ist also eine Interpretationseinschränkung (Asser 1981: Kap. 2). Hat man erst einmal A, so ist a 储– denkbar einfach zu bestimmen: G a储– z gilt genau dann, wenn für jedes Modell M aus A (!) und jede Belegung f M储– z gilt, falls f jedes f j aus G in M erfüllt (M储– j). Ein Ausdruck f ist analytisch wahr, wenn er in jedem Modell aus A von jeder Belegung erfüllt wird. Eine analytische Folgebeziehung Ga储– z besteht aufgrund der semantischen Beziehungen zwischen den von ihr betroffenen Ausdrücken; ein analytisch wahrer Ausdruck ist wahr aufgrund seiner Bedeutung und nicht aufgrund bloß empirisch geltender Tatsachen. Zwei Probleme stellen sich nun: (i) Wie sind die logischen Konstanten von den deskriptiven zu unterscheiden; wo verläuft die Grenze zwischen 储– und a储–? (ii) Wie soll man A aus M ausgrenzen? ⫺ Bereits Tarski (1936b: 10) stellt fest, daß die Unterscheidung zwischen logischen und deskriptiven Konstanten mit einer gewissen Willkürlichkeit behaftet ist. Praktisch jedoch kommen bei Informationsmitteln wie L(G) kaum Einordnungsprobleme vor. Es ist zum Beispiel ziemlich klar, daß „→“ logisch und „Va“ deskriptiv ist. Ein Problem ist allerdings, warum dies so klar ist. ⫺ Als Antwort auf die zweite Frage hat Carnap (1952 und 1972: 35 f) vorgeschlagen, A durch eine Klasse G von t-Ausdrücken zu charakterisieren: A soll genau die Modelle M enthalten, in denen alle Ausdrücke von G gelten (d. h.: von jeder Belegung in M erfüllt werden). Die Ausdrücke von G heißen „Bedeutungspostulate“ (auch: „A-Postulate“ oder „Analytizitätshypothesen“), denn sie drücken Bedeutungsbeziehungen zwischen den deskriptiven Konstanten aus und durch das Postulat ihrer Gültigkeit grenzt man A aus M aus. So könnte man für L(G) zum Beispiel die Ausdrücke (41) als Bedeutungspostulate aufstellen und so das Bestehen der drei eingangs erwähnten Folgebeziehungen (nun im Sinne von a储–) sicherstellen. (41a) x y[[Va(x, y) ∧ Va(y, z)] → GrVa(x, z)] (41b) x y[Vf(x, y) → Nf(y, x)] (41c) x y z[[Vf(x, y) ∧ Vf(y, z)] → Vf(x, z)] Daß man zum Beispiel (41b) als A-Postulat aufstellt, heißt, daß man aufgrund der Bedeutungen von „Vf“ und „Nf“ diesen Ausdruck für wahr erachtet. Nun stellt sich aber erneut das erste Problem und zwar in verschärfter Form: Wie soll
115
3. Semantik
man zwischen solchen t-Ausdrücken unterscheiden, die aufgrund empirischer Gegebenheiten wahr sind (im intendierten Modell gelten, in anderen aber falsch sind), solchen, die aufgrund der Bedeutung der in ihnen enthaltenen deskriptiven Konstanten wahr sind aber nicht logisch gelten (die in allen Modellen aus A wahr sind, in einigen außerhalb von A aber falsch), und schließlich solchen, die logisch gelten (in allen Modellen aus M wahr sind)? Nehmen wir etwa den L(G)-Ausdruck „ x[Wl(x) ↔ ÿ Ml(x)]“! Angenommen, er gilt im intendierten Modell; gilt er aufgrund empirischer Tatsachen über die untersuchten Tiere oder aufgrund der Bedeutung von „Wl“ und „Ml“? Denkt man zunächst an Säugetiere, so wird man leicht geneigt sein, ihn für analytisch zu halten. Aber man erinnere sich, daß es Tierarten gibt, bei denen zwittrige oder geschlechtslose Individuen nichts Außergewöhnliches sind. ⫺ Insbesondere von Quine (1951: sec. 1⫺4 sowie 1960: Kap. II und VI) ist ⫺ die These Tarskis von der willkürlichen Grenzziehung zwischen logischen und deskriptiven Konstanten radikalisierend ⫺ für die Position argumentiert worden, daß es keine scharfen Trennlinien zwischen logisch wahren, analytisch (aber nicht logisch) wahren und faktisch wahren Ausdrücken gibt. Trotz der Kritik Quines (sowie anderer Philosophen, vgl. Art. 109) ist das Verfahren, Interpretationseinschränkungen durch A-Postulate zu bestimmen, weiterhin eine wichtige Methode der Semantik. Es spielt eine zentrale Rolle in theoretischen Ansätzen wie zum Beispiel der MontagueGrammatik (vgl. auch die Bedeutungspostulate in Montague 1973: 35⫺37), aber auch in der praktisch-semantischen Arbeit des Wörterbuchschreibens. Definitionen, wie man sie etwa in Wörterbüchern findet, lassen sich als spezielle Art von Bedeutungspostulaten auffassen. 4.5. Definitionen und semantische Primitive Beim Durchmustern der Grundausdrücke (32) von L(G) stellt man sofort fest, daß sich die Bedeutungen einiger Prädikatoren durch die anderer erklären lassen. So ist a2 genau dann Sohn von a1, wenn a1 Elternteil von a2 und a2 männlich ist. Nun erfüllt eine Belegung f den Ausdruck „[Elt(y, x) ∧ Ml(x)]“ im intendierten Modell S ⫽ *S, I + genau in dem Falle, daß f die Variablen x und y mit solchen Individuen belegt, auf die das Attribut I (Km) zutrifft, d. h.: I (Km)(f(x), f(y)) ⫽ W. Man sagt hier, daß der Ausdruck
„[Elt(y, x) ∧ Ml(x)]“ in S mithilfe der Variablen x und y das Sohn-Attribut asn (über S) explizit definiere. Die Reihenfolge der angegebenen Variablen ist dabei wichtig; denn derselbe Ausdruck definiert in S mit Hilfe von y und x (umgekehrte Reihenfolge) das zu asn konverse Attribut, Elternteil eines männlichen Individuums zu sein. ⫺ Ein weiteres Beispiel: Nehmen wir an, daß es in S keine zwittrigen Tiere gibt; dann wird das Attribut, ein männliches Tier (aus S) zu sein, in S durch den Ausdruck „ÿWl(x)“ mit Hilfe der Variablen x explizit definiert. Die Definitionsbeziehung zwischen Ausdrücken, Modellen und von den Ausdrücken in den Modellen definierten Attributen wird ganz allgemein in (42) definiert; diese Erklärung der Definitionsrelation geht auf Tarski (1931: 220 und 1935c: 53, Fn. 42) zurück. (42) Sei M ⫽ *E, F+ ein Modell, a ein n-stelliges Attribut über E (d. h.: aus Dsgt, E bei t ⫽ e … e (t)) und sei ferÚÛÙ n-mal
ner z ein t-Ausdruck, in dem genau die Variablen j1, …, jn frei vorkommen. Dann wird von z in M das Attribut a mit Hilfe der Variablen j1, …, jn genau dann definiert, wenn für jede Belegung f über E M储– z genau in dem Falle gilt, f daß a(f(j1 ), …, f(jn )) ⫽ W. Ist nun ein Attribut a im intendierten Modell M eines Informationsmittels I mit Hilfe der Variablen x1, …, xn definierbar, so gibt es hinsichtlich des Ausdrucksbestands von I zwei Möglichkeiten: (i) In I gibt es bereits einen Prädikator j, dessen Modelldesignat in M gerade a ist, oder (ii) ein solcher Prädikator fehlt in I. Kommt im ersten Falle j in z nicht vor, so nennt man den t-Ausdruck x1 … xn[j(x1, …, xn ) ↔ z] eine „explizite Definition“ von j, j (und auch j(x1, …, xn )) das „Definiendum“ dieser Definition und z ihr „Definiens“. In der Definition wird die Bedeutung des Definiendums (sein Modelldesignat im intendierten Modell) durch das Definiens erklärt, und man nennt solche Definitionen daher auch „explikative Definitionen“ (Church 1956: 76). ⫺ Im Beispiel wäre etwa (43b) eine explikative Definition von „Km“; neben dieser Definition listet (43) noch die weiteren Prädikatoren von L(G) auf, die in Hinblick auf S plausibel erscheinen. (43a) (43b) (43c) (43d) (43e)
↔ ÿ Wl(x)] x[Ml(x) xy[Km(x, y) ↔ [Elt(y, x) ∧ Ml(x)]] xy[Kw(x, y) ↔ [Elt(y, x) ∧ Wl(x)]] xy[Ki(x, y) ↔ [Km(x, y) ∨ Kw(x, y)]] x y[Mu(x, y) ↔ [Elt(x, y) ∧ Wl(x)]]
116
I. Systematik
(43f) xy[Va(x, y) ↔ [Elt(x, y) ∧ Ml(x)]] (43g) x y[Elt(x, y) ↔ [Vf(x, y) ∧ ÿ Vz[Vf(x, z) ∧ y)]]] Vf(z, (43h) x y[Bru(x, y) ↔ [[Vz[Va(z, y) ∧ Km(x, z)] ∧ Vz[Mu(z, y) ∧ Km(x, z)]] ∧ x ⫽ y]] (43i) x y[Schwe(x, y) ↔ [[Vz[Va(z, y) ∧ Kw(x, z)] ∧ Vz[Mu(z, y) ∧ Kw(x, z)]] ∧ x ⫽ y]] (43j) x y[Gesch(x, y) ↔ [x ⫽ y ∧ [Bru(x, y) ∨ Schwe(x, y)]]] (43k) x y[GrMu(x, y) ↔ Vz[Mu(x, z) ∧ Elt(z, y)]] (43l) xy[GrVa(x, y) ↔ Vz[Va(x, z) ∧ Elt(z, y)]] (43m) xy[GrElt(x, y) ↔ Vz[Elt(x, z) ∧ Elt(z, y)]] (43n) xy[Em(x, y) ↔ [GrElt(y, x) ∧ Ml(x)]] (43o) xy[Ew(x, y) ↔ [GrElt(y, x) ∧ Wl(x)]] (43p) x y[Nf(x, y) ↔ Vf(y, x)]
Für den zweiten der obigen Fälle, daß nämlich in dem betreffenden Informationsmittel für ein definierbares Attribut noch kein Prädikator zur Verfügung steht, ergeben sich wieder zwei Möglichkeiten, die Definierbarkeit des Attributs auszunutzen. Man kann das Informationsmittel um einen neuen Prädikator erweitern, dessen Bedeutung man in einer sogenannten „erweiternden Definition“ (Church 1956: 76 f, Fn. 168, Punkt (3)) festlegt, deren syntaktischer Bau dem einer explikativen Definition entspricht. Aber eine erweiternde Definition ist eine Bedeutungsfestsetzung und nicht wie eine explikative Definition eine Bedeutungserklärung (vgl. Art. 30 § 1.6.). So könnte man L(G) zum Beispiel um einen Prädikator „UrGrElt“ erweitern, dessen Bedeutung man durch die Erweiterungsdefinition (44) festsetzt. (44) x y[UrGrElt(x, y) def ↔ Vz[Elt(x, z) ∧ GrElt(z, y)]] Um es als definitorische Festsetzung der Bedeutung eines neuen Ausdrucks kenntlich zu machen, wird in (44) das Definiendum vom Definiens durch das Definitionszeichen „↔ “ getrennt. Für Erweitedef rungsdefinitionen benötigt man spezielle Definitionsregeln, die zum Beispiel erlauben, in Schlüssen “ von (44) als Bisubjunktor aufzufassen. das „↔ def Diese Definitionsregeln müssen auch Mehrfachdefinitionen und Zirkeldefinitionen ausschließen. Mehrfachdefinitionen sind günstigenfalls redundant, schlimmstenfalls führen sie zu Widersprüchen. In zirkulären Bestimmungen kann nichts festgesetzt werden. ⫺ Statt ein Informationsmittel definitorisch zu erweitern, kann man auch, wenn man über das definierbare Attribut sprechen will, ein passendes Definiens verwenden. Dies ist sicherlich umständlich, wenn mit dem Informationsmittel tatsächlich kommuniziert werden soll. Häufig geht es aber darum, ein Informationsmittel semantisch zu untersuchen, um so indirekt etwas über
den Realitätsausschnitt in Erfahrung zu bringen, von dem das Informationsmittel handelt (sogenannte Methode des „semantischen Aufstiegs“, engl.: „semantic ascent“; vgl. Art. 109). Dann ist es nützlich, in der Metasprache, in der man seine Untersuchung durchführt, eine Abkürzung für das Definiens zu haben; eine solche bestimmt man in einer Abkürzungsdefinition (Church 1956: 76). So ließe sich etwa das Definiens von (44) durch den metasprachlichen Ausdruck „UrGrElt(x, y)“ abkürzen. Im Gegensatz zu „UrGrElt“ gehört der fettgedruckte Ausdruck zu keiner Erweiterung von L(G). Sind z und j e-Ausdrücke, so ist vielmehr UrGrElt(z, j) derjenige Ausdruck von L(G), der aus dem Definiens von (44) entsteht, wenn man dort „x“ durch z und „y“ durch j ersetzt. UrGrElt(z, j) ist also ein Ausdruck von L(G), der dort dasselbe besagt, wie der Ausdruck „UrGrElt(z, j)“ in der durch (44) bestimmten Erweiterung von L(G). Aber der erste Ausdruck ist um elf Lettern (unter Einschluß von Interpunktionszeichen und Klammern) länger als der zweite. Nicht nur Prädikatoren, die bisher allein als Beispiele dienten, auch Ausdrücke anderer Kategorien (und Synkategoremata) können durch explizite Definitionen erläutert, eingeführt bzw. metasprachlich abgekürzt werden. Die explizite Definition ist auch nicht die einzige, aber sicherlich eine besonders wichtige Form der Definition. Die unterschiedlichen Definitionsformen sind Gegenstand der Definitionstheorie, die ⫺ wie so viele andere Teilgebiete der Semantik ⫺ ihre Entstehung Frege verdankt. Frege kritisierte den sorglosen Umgang seiner mathematischen Fachkollegen mit Definitionen und stellt im ersten Band seiner Grundgesetze der Arithmetik (1893: § 33.) „Grundsätze des Definierens“ auf, die er im zweiten Band (1903: § 55.⫺67.) nochmals ausführlich behandelt und rechtfertigt. Neben den Bemühungen Freges findet man ungefähr zur selben Zeit definitions-theoretische Untersuchungen in der Peano-Schule (s. Art. 76); die Analysen des Peano-Schülers Padoa (1902) gehören zum Beispiel durchaus zur Vorgeschichte der Modelltheorie. Freges Überlegungen bilden den direkten Anknüpfungspunkt für die Definitionslehre Les´niewskis. Sowohl Frege, wie auch Les´niewski entwickeln ihre Kategorialgrammatiken übrigens bei der Analyse der definitorischen Einführung neuer Ausdrücke in ihre formalen Sprachen. Wichtige Resultate in der Definitionstheorie hat in den späten 20er und den 30er Jahren Les´niewskis Schüler Tarski und in den 50er Jahren der niederländische Mathematiker, Philosoph und Signifiker E. W. Beth (s. Art. 104) erzielt.
Insbesondere bei strukturalistisch orientierten Semantikern ist die Auffassung verbreitet, die Bedeutungen eines Informationsmittels seien keine unanalysierbaren Einheiten, sondern ließen sich jeweils in kleinere Bedeutungselemente zerlegen. Jede überhaupt mögliche Bedeutung sei letztlich (atomar oder) eine Kombination von Einheiten eines
117
3. Semantik
Reservoirs ausgezeichneter kleinster Bedeutungselemente. Eine mögliche Explikation dieser Auffassung ist definitionstheoretischer Art: Für jedes Informationsmittel I mit semantischem System S gibt es eine Gesamtheit B von Bedeutungselementen b1, b2, …, die in der Metasprache, in der S aufgestellt wird, durch b1, b2, … benannt werden. Jeder Ausdruck b der Metasprache, der eine Bedeutung b eines Ausdrucks von I bezeichnet, muß dann durch einen Ausdruck definierbar sein, in dem neben b1, b2, … nur noch logisches Vokabular (metasprachliche Junktoren und Quantoren) vorkommen. Die Bedeutungselemente aus B werden häufig als „semantische Primitive“ bezeichnet; die semantische Analyse, die dem Erstellen einer Definition vorausgeht, „semantische Dekomposition“ (vgl. z. B. Leech 1974: Kap. 6). Welche Bedeutungen es dann in S überhaupt geben kann, hängt ganz offensichtlich vom Vorrat der semantischen Primitive und von der Ausdruckskraft der Metasprache ab. Die Liste (43) zeigt zum Beispiel, daß man für S4, was die Prädikate für Sexus- und Verwandtschaftsattribute anbelangt, mit zwei semantischen Primitiven ⫺ dem Weiblichkeits- und dem Vorfahrenattribut ⫺ auskommen kann, wenn die Metasprache wie L(G) selbst Junktoren und Quantoren (oder andere Mittel derselben Ausdrucksstärke) besitzt. In den Definientia von (43) kommen ja stets neben „Wl“ und „Vf“ (s. (43a) und (43g)) nur solche Prädikatoren vor, die (wie „Elt“ und „Ml“) entweder direkt mit Hilfe von „Wl“ und „Vf“ erklärbar sind, oder aber durch Definitionsketten auf diese beiden Prädikatoren zurückgeführt werden können. Frühe strukturalistische Versuche zur Komponentialanalyse haben allerdings die Metasprache ungebührlich stark eingeschränkt. Man ist davon ausgegangen, daß die metasprachlichen Bezeichnungen semantischer Primitive stets einstellige Prädikatoren (wie „MENSCHLICH“, „LEBEWESEN“, „MÄNNLICH“ usw.) sein müßten und hat in den Definientia zur Bestimmung komplexer Bedeutungen ausschließlich den Konjunktor und den Negator zugelassen. Durch diese Einschränkung wird das Ergebnis einer semantischen Dekomposition stets als Merkmalsmatrix darstellbar: Einem Definiens, das in einer Sprache wie L(G) die Form (45a) hätte, entspricht eine Matrix wie (45b). (45 a) [ÿ j1 (x) ∧ [j2 (x) ∧ [j3 (x) ∧ ÿ j4 (x)]]]
(45 b)
冤 冥 ⫺ j1 ⫹ j2 ⫹ j3 ⫺ j4
Bereits ein Blick auf (43) genügt, um einzusehen, daß eine Metasprache, die nur über Ausdrücke wie (45b) verfügt, allenfalls für die einfachsten Informationsmittel ausreicht (s. Bar-Hillel 1967: 546). Dies spricht aber keineswegs gegen die semantische Dekomposition selbst, sondern zeigt lediglich die Unzulänglichkeit eines zu primitiven Werkzeugs. Um die Erarbeitung eines leistungsfähigeren Instrumentariums für die Dekomposition haben sich in der Linguistik die sogenannten „generativen Semantiker“ (vgl. Lakoff 1970 und McCawley 1972; s. auch Art. 79) bemüht. Dieses Verfahren hat auch Eingang in die Montague-Grammatik gefunden (s. Dowty 1979). 4.6. Theorien und ihre Kodifikate Zur vollständigen Charakterisierung des semantischen Systems S4 von L(G) steht noch die Angabe der A-Postulate aus, deren Funktionieren in § 4.4.2. nur durch Beispiele verdeutlicht worden ist. Für die Färbungsprädikatoren („a“, …, „p“, „1ca“, „1da“, …, „24pp“) erscheint nur ein A-Postulat plausibel, daß nämlich die Tiere, da sie Körperwesen sind, auch irgendwie gefärbt sein müssen. Das entsprechende A-Postulat (46) ist allerdings einigermaßen lang. (46) x[a(x) ∨ [c(x) … ∨ [24pn(x) ∨ 24pp(x)] … ]] Was die Sexus- und Verwandtschaftsprädikatoren betrifft, so wird man die explikativen Definitionen (43) als A-Postulate ansehen wollen, da sie wichtige semantische Zusammenhänge aufzeigen. Aber sie reichen allein noch nicht aus, um etwa die Beziehung Vf(4, 5), Vf(5, 6) a储– Vf(4, 6) (s. o. § 4.4.2.) zu erfassen. In diesem Abschnitt sollen die neben den Definitionen von (43) und neben (46) noch notwendigen A-Postulate in einem Theorienkodifikat Th(G) systematisiert werden (s. Carnap 1954: 221⫺223). Dazu muß zunächst L(G) in einen umfassenderen Zusammenhang eingeordnet werden. 4.6.1. Ableitbarkeit In diesem Abschnitt ist vielfach auf Informationsmittel angespielt worden, die L(G) ähnlich seien. Mit dieser Ähnlichkeit ist gemeint, daß die einander gleichenden Informations-
118
I. Systematik
mittel über denselben Vorrat logischer Konstanten verfügen und sich lediglich durch ihre deskriptiven Grundausdrücke unterscheiden. L(G) und L(G) ähnelnde Informationsmittel gehören zur Familie der elementaren Sprachen oder prädikatenlogischen Sprachen 1. Stufe. Dabei heißt „elementar“ (bzw.: „von erster Stufe“), daß in diesen Sprachen lediglich solche Variablen von Quantoren gebunden werden, die durch Objekte der jeweiligen Gegenstandsbereiche zugehöriger Modelle belegt werden, nicht aber zum Beispiel Variablen für Attribute. Für die Zugehörigkeit zur Familie der elementaren Sprachen ist die Gestalt logischer Konstanten (etwa: „&“ statt „∧“) unerheblich; ebenso soll zugelassen sein, daß ein Familienmitglied nicht über alle Junktoren oder Quantoren verfügt, solange sich nur der übliche Bestand („ÿ“, „∧“, „∨“, „→“, „↔“, „ “ und „ “) durch definitorische Erweiterungen erreichen läßt. Die deskriptiven Konstanten elementarer Sprachen lassen sich mit den für L(G) aufgestellten Kategoriensystem (s. o. § 4.3.) ordnen, das L(G) selbst ja nicht voll besetzt. L(G) hat zum Beispiel keine Ausdrücke der Kategorie e(e), über die aber beispielsweise die elementare Sprache L(A) der Arithmetik verfügt, die unten in § 6. als Beispiel dienen soll. L(A) hat „0“ als einzigen Grundausdruck der Kategorie e, „S“ als einzigen der Kategorie e(e) und „⫽“ als einzigen von ee(t). Bis auf die zusätzlichen Regeln (47) (für L(A) käme man mit m ⫽ 1 aus) ist die Syntaktik von L(A) dieselbe wie die von L(G). (47) R15, m ⫽ *F7, m, *e … e(e), e, …, e+, e+ ÚÛÙ
ÚÛÙ
m-mal
m-mal
Der Gegenstandsbereich des intendierten Modells N ⫽ *⺞, N + von L(A) ist die Klasse ⺞ der natürlichen Zahlen; N („0“) ist die Zahl 0, N („S“) die Nachfolgeoperation ' (n' ⫽ n ⫹ 1) und N („⫽“) das Gleichheitsattribut über ⺞. Obwohl also L(A) mit seinem intendierten Modell N von einem ganz anderen Realitätsausschnitt handelt, gehört es doch zur selben Familie der elementaren Sprachen wie L(G) mit seiner spezifisch biologischen Thematik. Aufgrund ihres gemeinsamen Kerns folgen die semantischen Beschreibungen der verschiedenen elementaren Sprachen weitgehend einem gemeinsamen Muster, wenn man denselben Schlüsselbegriff zugrundelegt (vgl. aber in § 6. eine Semantik für L(A), die von einem anderen Schlüsselbegriff als dem der Folge ausgeht). Darüber hinaus gibt es wei-
tere Gemeinsamkeiten. Der Genetiker der Beispielsituation (§ 4.1.) verwendet L(G) zur Formulierung einer Theorie über die Vererbung von Farbmustern; ebenso wird ein Mathematiker mit Hilfe von L(A) die Theorie der natürlichen Zahlen entwickeln und untersuchen wollen. In Theorien sollen Zusammenhänge systematisch dargestellt und auf Gesetze zurückgeführt und eben dadurch erklärt werden. Theorien dienen also gerade der Explikation von Folgebeziehungen: Bestimmte Sachzusammenhänge folgen aus den Gesetzen der Theorie (ggf. zusammen mit Beobachtungen). Das Mittel, im Rahmen einer Theorie eine Folge explizit zu machen, ist der Beweis. Um ein einfaches Beispiel für einen Beweis zu geben, nehmen wir an, der Beispielgenetiker hätte die Hypothese (48a) bestätigt gefunden und hätte sich von (48b) und (48c) durch Beobachtung überzeugt. (48a) x y[[Elt(x, y) ∧ 24ca(x)] → 24ca(y)] (48b) 24ca(1) (48c) ÿ24ca(2) Dann kann er beweisen, daß a1 nicht Elternteil von a2 ist: Da (48a) für beliebige Tiere der Stichprobe gilt, so stimmt es auch für a1 und a2. Also: Falls a1 Elternteil von a2 ist und einen 24ca-Fleck hat, so hat auch a2 einen solchen Fleck. Angenommen, a1 wäre Elternteil von a2. Da nach (48b) a1 einen 24caFleck hat, müßte dann auch a2 einen solchen Fleck haben, was aber in Widerspruch zur Beobachtung (48c) steht. Also war die Annahme falsch, und a1 ist nicht Elternteil von a2. Ein Beweis führt somit von Voraussetzungen ⫺ Beobachtungen, hypothetischen Annahmen und Gesetzmäßigkeiten ⫺ über mehrere Beweisschritte hin zur Schlußfolgerung des Beweises. Während der Zusammenhang zwischen den Voraussetzungen und der Schlußfolgerung eines Beweises nicht von vornherein einsichtig ist, darf bei einem korrekten Beweis über die Gültigkeit der einzelnen Beweisschritte keinerlei Zweifel bestehen. Die Gültigkeit eines Beweises beruht eben auf der zweifelsfreien Einsichtigkeit seiner einzelnen Schritte und diese wiederum auf den semantischen Eigenschaften der logischen Konstanten. Da nun deren Bestand derselbe für alle elementaren Sprachen ist, müssen auch die jeweiligen Beweisverfahren für alle elementaren Sprachen (soweit sie auf die Bedeutung der logischen Konstanten rekurrieren) dieselben sein. Insofern unterscheidet sich die Logik der Genetik von L(G)
119
3. Semantik
nicht von der der Arithmetik in L(A). (Daneben kann es natürlich sachbezogene Beweisverfahren geben; das Prinzip der vollständigen Induktion in der Arithmetik ist ein ⫺ umstrittenes ⫺ Beispiel.) Die starke Normierung der Syntaktik elementarer Sprachen läßt es sogar zu, in rein syntaktischer Weise zu bestimmen, wann Beweisschritte und Beweise zulässig sind (entsprechende Versuche sind auch für natürliche Sprachen unternommen worden: Fitch 1973, Hiz˙ 1973, Suppes 1979). Man kann rein syn(49)
Ausdrücken erschließen kann. Schlußfiguren sind die Ausdruckskonstellationen, die von Schlußregeln als zulässig erlaubt (bzw. als unzulässig verboten) werden; sie werden in stammbaumförmigen Arrangements zu Herleitungen kombiniert. Als Beispiel gibt (49) die Herleitung an, die dem oben angeführten Beweis entspricht. Jeder waagerechte Strich in (49) bestimmt eine Schlußfigur. Die Buchstaben an den Schlußfiguren verweisen auf die Schlußregeln, von denen sie erlaubt und die im Anschluß an (49) besprochen werden.
x y[[Elt(x, y) ∧ 24ca(x)] → 24ca(y)] (1) AB y[[Elt(1, y) ∧ 24ca(1)] → 24ca(y)] Elt(1, 2) 24ca(1) UE AB [[Elt(1, 2) ∧ 24ca(1)] → 24ca(2)] [Elt(1, 2) ∧ 24ca(1)] FB 24ca(2)
ÿ 24ca(2) NB
E (1) ÿ Elt(1, 2) taktische Kriterien angeben, nach denen beurteilbar ist, ob eine Ausdruckskonstellation einer elementaren Sprache einen korrekten Beweis repräsentiert. Der syntaktische Gegenbegriff zum inhaltlichen Begriff des Beweises ist der der Herleitung (oder: Ableitung). Einem einzelnen Beweisschritt entspricht in einer Herleitung eine Schlußfigur, den Voraussetzungen eines Beweises korrespondieren die Anfangsformeln, seiner Schlußfolgerung die Endformel einer Herleitung. Kann man die Endformel z0 in einer Herleitung aus den Anfangsformeln z1, …, zn durch Anwendung zulässiger Schlußregeln gewinnen, so schreibt man dafür auch „z1, …, zn z0“ und sagt, daß z0 aus z1, …, zm (elementar) herleitbar ist. Im Gegensatz zu 储– ist eine rein syntaktische Beziehung. Es gibt eine ganze Reihe verschiedener Definitionsverfahren für ; wegen ihrer semantischen Bedeutsamkeit (s. u. § 6.) wird hier eine Methode vorgestellt, die auf Gentzen (1934; s. auch Prawitz 1965) zurückgeht und die wegen ihrer Nähe zum inhaltlichen Schließen als „Kalkül des natürlichen Schließens“ („NK“) bezeichnet wird. In NK wird das Verhalten einer logischen Konstanten ⴱ in Herleitungen jeweils durch zwei Schlußregeln charakterisiert: Einführungsregeln bestimmen, wie man einen mit ⴱ gebildeten Ausdruck erschließen kann, und Beseitigungsregeln geben an, was man aus solchen
Die Einführungsregel UE („Und“-Einführung, vgl. in (49) die obere rechte Schlußfigur als Anwendung von UE) besagt zum Beispiel, daß man [z j] als hergeleitet ansehen darf, falls man sowohl z als auch j bereits hergeleitet hat. In Hinblick auf die ∧ interpretierende Operation (s. o. (36)) kann man dies so rechtfertigen: Wenn die Herleitung von z diesen Ausdruck als wahr erweist und die von j dasselbe für j leistet, so muß auch [z ∧ j] wahr sein. In (49) bestehen die Herleitungen der Konjunktionsglieder aus diesen beiden Gliedern selbst; mit anderen Worten: ihre Herleitung besteht nicht darin, daß man sie aus anderen Ausdrücken gewinnt, sondern darin, daß ihre Wahrheit vorausgesetzt wird. Sie sind Annahmeformeln der Herleitung (49), d. h. Formeln, von deren Wahrheit die Wahrheit der Endformel abhängt. ⫺ Die Beseitigungsregel UB („Und“-Beseitigung) umfaßt zwei Teilregeln, die es erlauben, zu den Teilgliedern einer bereits hergeleiteten Konjunktion als ebenfalls hergeleitet überzugehen. Die Schlußregeln notiert man so wie die von ihnen zugelassenen Schlußfiguren; vgl. (50). z j [z ∧ j] [z ∧ j] (50) UE UB [z ∧ j] z j UE und UB sind eigentliche Schlußregeln (Prawitz 1965: 23). Solche Regeln gestatten es, aus hergeleiteten Ausdrücken einen neuen
120
I. Systematik
Ausdruck herzuleiten. In dem obigen Beispielbeweis steckt ein Beweisschritt, der nicht mit einer eigentlichen Schlußregel zu erfassen ist und dem in der Herleitung (49) der durch die beiden Vorkommnisse von „(1)“ markierte Übergang entspricht. Aus einer nur hypothetischen Annahme („… a1 wäre Elternteil von a2 …“) wird ein Widerspruch abgeleitet und aufgrund dessen wird die Annahme verworfen. Dieses Verwerfen der Annahme beruht selbst auf einem Beweis: auf dem Beweis, daß die Annahme zu einem Widerspruch führt. Das syntaktische Gegenstück zu einem solchen Beweisverfahren ist eine Deduktionsregel (Prawitz 1965: 23). Sie erlaubt aus einer oder mehreren Herleitungen eine neue zu bilden (solche Verfahren wurden bereits in der Stoa als sogenannte „Themata“ analysiert; s. Geach 1962: 31980: 110). Eine Deduktionsregel notiert man als uneigentliche Schlußregel; dem obigen Beweisschritt entspricht die Deduktionsregel, die als uneigentliche Schlußregel NE („Nicht“-Einführung) (51) notiert wird. (51) (z) ÿz NE Bei den uneigentlichen Schlußregeln muß man genau erläutern, wie man die ihnen entsprechende Deduktionsregel anwendet. Bei NE funktioniert dies so: Hat man bereits eine Herleitung H1, die zu etwas Falschem führt und unter deren Annahmeformeln sich z befindet, so darf man sie um den Schritt nach ÿz erweitern, wobei zugleich die Annahme z gelöscht oder gebunden (s. o. § 6.3.5.; die Annahmebeseitigung hat wirklich mit der Variablenbindung zu tun) wird. Um in einer Herleitung klar zu machen, welche Annahmen wo gebunden werden, koetikettiert man die gebundene Annahme und die Stelle ihrer Bindung (z. B. durch eine geklammerte Ziffer wie in (49)). ⫺ In (52) werden nun die Schlußregeln für die neben ∧ verbleibenden Junktoren angegeben. Die uneigentliche Regel FE („Folgt“-Einführung) funktioniert genauso wie NE. OB („Oder“-Beseitigung) besagt: Hat man Herleitungen H1 und H2 von f und eine H3 mit der Endformel [z ∨ j], so darf man diese zu einer Herleitung H4 von f kombinieren, in der die Endformel f von allen Annahmeformeln von H3 und den von z verschiedenen von H1 sowie den von j verschiedenen von H2 abhängt. In OB werden also zwei Annahmeformeln gebunden.
(52)
(z) (j) j [z ∨ j] f f z OE OB [z ∨ j] [z ∨ j] f (z) j z [z → j] FE FB [z → j] j [z ↔ j] [z ↔ j] [z → j] [j → z] EE EB [z ↔ j] [z → j] [j → z] (z) z ÿz NE NB ÿz
Die Regel I in (53) erklärt die Verwendung des Falsums in Herleitungen: Aus Falschem kann Beliebiges hergeleitet werden; und die Regel tnd (tertium non datur) erlaubt den Gebrauch von Ausdrücken der Gestalt [z ∨ ÿ j] an beliebigen Herleitungsstellen, ohne daß diese als zusätzliche Annahmeformeln vermerkt werden müßten. (53)
z
I
[z ∨ ÿz]
tnd
Zählt man (was keineswegs immer geschieht) auch den Identitätsrelator zu den logischen Konstanten, so müssen auch für ihn Regeln angegeben werden. Die erste Regel, Id, funktioniert wie tnd und erlaubt, Ausdrücke der Gestalt x ⫽ x (x von der Kategorie e) zu verwenden, ohne sie als Annahmeformeln zu vermerken. Die zweite Regel ⫺ Sub ⫺ beruht darauf, daß in elementaren Sprachen bedeutungsgleiche e-Ausdrücke in umfassenderen Ausdrücken gegeneinander ausgetauscht werden dürfen (das gilt nicht in allen Informationsmitteln, s. u. § 5.1.2.). Für die zweite „⫽“ betreffende Schlußregel benötigt man noch die folgende syntaktische Operation Sø |: Ist j eine Variable mit freien Vorkommnissen in z und ist x ein Ausdruck der Kategorie e, so soll Sø jx z| der Ausdruck z1 sein, den man aus z erhält, wenn man dort die freien Vorkommnisse von j durch x-Vorkommnisse ersetzt. (Dabei soll aber z1 dieselbe Struktur anaphorischer Querbezüge aufweisen wie das alte z. Um dies zu erreichen, sind einige komplizierte Vorkehrungen zu treffen, auf die hier nicht weiter eingegangen werden kann; s. z. B. Hermes 1972: 64⫺67. Die Sø -Notation stammt aus Church 1956: 170. Der Strich | zeigt an, wie weit sich die Substitution erstrecken soll.) Die beiden Regeln für „⫽“ sind in (54) angegeben.
121
3. Semantik
(54)
x⫽x
Id
Sø jx1 z | x1 ⫽ x2 Sub Sø jx2 z |
Ebenso schwierig wie ihre Semantik gestalten sich auch die Schlußregeln für die Quantoren. Probleme werfen insbesondere AE für „ “ und EB für „ “ auf. Für die „All“-Einführung AE erinnere man sich, daß viele Beweise den folgenden Verlauf nehmen: Beweisziel ist, zu zeigen, daß etwas Bestimmtes für alle Gegenstände einer gewissen Art gilt. Man nimmt nun an, daß p irgendein Gegenstand dieser Art ist und zeigt, daß auf p tatsächlich das Betreffende zutrifft. Dann schließt man den Beweis so: Da p ein beliebiger Gegenstand der fraglichen Art war, so gilt das Betreffende für alle Gegenstände dieser Art. In Systemen natürlichen Schließens nennt man solche Ausdrücke „p“ für beliebig gewählte Gegenstände auch „Individuenparameter“. Im folgenden soll „p“ für solche Parameter stehen. Das skizzierte Beweisverfahren muß ganz offensichtlich durch eine Deduktionsregel wiedergegeben werden: Ein Beweis für eine Behauptung über ein beliebiges p wird ja in einen Beweis überführt, daß diese Behauptung für alle Gegenstände g gelte. Die zur uneigentlichen Schlußregel AE gehörige Deduktionsregel lautet entsprechend: Ist H1 Herleitung des Ausdrucks z', der aus z durch Ersetzung der Variablen j durch den Parameter p hervorgeht, und kommt p in keiner der Annahmeformeln von H 1 vor, so darf man H1 um den Schritt nach jz erweitern. Die Beschränkung bezüglich der Annahmeformeln von H1 sichert, daß die Wahl des p wirklich beliebig war. ⫺ Gemessen an AE ist die „All“-Beseitigung AB relativ problemlos: Sie erlaubt den Schluß von einer Allaussage auf ihre Instanzen. Sø jp z | jz (55) AE AB j jz Sø f z | Will man aus einem Ausdruck der Gestalt jz etwas erschließen, so benutzt man ebenfalls häufig Parameter: Es gibt ja Gegenstände auf die das Betreffende zutrifft; sei also p ein solcher Gegenstand usw. Diese Schlußweise steht hinter der uneigentlichen Schlußregel „Existenz“-Beseitigung EB. Ihr entspricht folgende Deduktionsregel: Hat man Herleitungen H1 von jz und H2 von f, so darf man sie zu einer neuen Herleitung H3 von f kombinieren, in der f von den Annahmeformeln von H1 abhängt und nur noch von den Annahmeformeln von H2, die nicht
die Gestalt z' ⫽ Sø jpz| haben. Dabei darf aber der Parameter p weder in f selbst, noch in jz, noch in einer der Annahmeformeln von H2 vorkommen, die nicht die Gestalt z' haben. ⫺ Diesmal ist die Einführungsregel einfacher: Hat man eine Instanz einer Existenzaussage bewiesen, so gilt auch die Existenzaussage als bewiesen. Die Instanz zeigt ja ihre Gültigkeit an einem Beispiel. (56) Sø jx
z| EE jz
(Sø jp z |) jz f EB f
Die Funktionsweise der Individuenparameter in den Regeln AE und EB und das genaue Funktionieren der komplexen Parameterbeschränkungen für diese Regeln werfen eine Reihe interessanter semantischer Probleme auf, deren Analyse wiederum bereits die Stoa in Angriff genommen hat (s. Egli 1979). Von Fine (1985) werden die Parameter als Bezeichnungen arbiträrer (eben: beliebiger) Objekte analysiert; seine Theorie arbiträrer Objekte soll unter anderem zur semantischen Analyse generischer Aussagen (z. B. über den Menschen oder den Semiotiker) und der des Pronominalsystems natürlicher Sprachen (vgl. dazu King 1987: 353 f und 361) beitragen. ⫺ Eine Semantik, die wesentlichen Gebrauch von den hier eingeführten Regeln macht, wird unten in § 6. behandelt. Nun sind alle Regeln beisammen, um definieren zu können! (i) Die einfachste Möglichkeit, einen t-Ausdruck z herzuleiten, besteht darin, z einfach als wahr anzunehmen; dann ist z selbst Ableitung mit Endformel z, die von z als Annahmeformel abhängt. (Mit anderen Worten: Die kleinsten Herleitungen bestehen einfach im Treffen von Annahmen.) (ii) Gibt es Herleitungen H1, …, Hn mit den Endformeln z1, …, zn und den Annahmeformeln D1, …, Dm und läßt eine eigentliche Schlußregel die Schlußfigur zu, in der z1, …, zn als Oberformeln über dem waagerechten Strich und z als Unterformel unter ihm steht, so darf man H1, …, Hn zu einer Herleitung H mit Endformel z arrangieren (vgl. das Beispiel (49)). In H hängt z dann von allen Ausdrücken aus D1, …, Dn als Annahmeformeln ab. (iii) Die letzte Möglichkeit, Herleitungen zu bilden, besteht darin, Herleitungen H1, …, Hn mit den Endformeln z1, …, zn mit einer Deduktionsregel zu einer neuen Herleitung H eines z zusammenzusetzen. Welche Schritte dabei erlaubt sind und von welchen Annahmeformeln z dann abhängt, ist bei den einzel-
122
I. Systematik
Korrektheit heißt, daß die Herleitbarkeitsbeziehung die Folgebeziehung richtig wiedergibt: Ist ein Ausdruck aus anderen herleitbar, so folgt er auch aus diesen. Umgekehrt besagt die Vollständigkeit, daß die Herleitbarkeitsbeziehung die Folgebeziehung auch erschöpft. Folgt ein Ausdruck aus anderen, so ist er auch aus ihnen herleitbar. Der Nachweis der Vollständigkeit erfordert sehr tiefgehende Überlegungen und ist zuerst von K. Gödel (1929) erbracht worden. Die exakte Entsprechung von und 储– ist übrigens ein Glücksfall, der zwar für die elementaren Sprachen, aber nicht generell gilt. Neben der vollständigen syntaktischen Charakterisierbarkeit ihrer Folgebeziehung weisen elementare Sprachen noch eine Reihe weiterer Eigenschaften auf, durch die sie sich vor anderen formalen Sprachen auszeichnen (s. Lindström 1974).
nicht mehr erweitern. Von den Axiomen verlangt man gewöhnlich, daß ihre Anzahl endlich ist oder daß es im Falle unendlich vieler Axiome zumindest möglich ist, für jeden vorgelegten Ausdruck in endlich vielen Schritten eine zweifelsfreie Entscheidung darüber zu treffen, ob er Axiom ist oder nicht. Die formalen Axiome, die Gesamtheit der in ihnen vorkommenden deskriptiven Konstanten (ggf. mit weiteren definierbaren Konstanten und deren Definitionen) und ein Herleitungsbegriff bilden zusammen ein Kodifikat einer inhaltlichen Theorie. Statt von einem Kodifikat spricht man häufig auch von einer „formalen Theorie“ (vgl. Art. 30 § 1.4. und § 1.5.). Als Beispiel für eine formale Theorie systematisieren wir die A-Postulate des Verwandtschaftsvokabulars im Kodifikat Th(G). Die deskriptiven Konstanten von Th(G) sind die Sexus- und Verwandtschaftsprädikatoren von L(G); dabei werden die Definitionen von (43) angenommen. Der Herleitungsbegriff von Th(G) ist NK, und die Axiome von Th(G) sind in (58) angegeben. Die von diesem Kodifikat bestimmte (syntaktische) Theorie ist die Menge der aus den Axiomen von (58) und den Definitionen (43) (NK-) herleitbaren Ausdrücke. (58) GA1 x y z[[Va(x, y) ∧ Va(z, y)] → x ⫽ z] GA2 x y z[[Mu(x, y) ∧ Mu(z, y)] → x ⫽ z] GA3 x[ÿ Vf(x, x)] GA4 x y z[[Vf(x, y) ∧ Vf(y, z)] → Vf(x, z)]
4.6.2. Theorienkodifikate und implizite Definitionen Das Herleiten ist syntaktisches Gegenstück zum inhaltlichen Beweisen im Rahmen einer Theorie. Auch der Begriff der Theorie selbst hat eine syntaktische Entsprechung: Eine Theorie im syntaktischen Sinne ist eine Ausdrucksmenge, die sämtliche Endformeln solcher Herleitungen enthält, deren nicht im Herleitungsverlauf gebundene Annahmeformeln Gesetzmäßigkeiten der entsprechenden inhaltlichen Theorie kodifizieren. Diese nichtgebundenen Annahmeformeln sind die (formalen) Axiome der Theorie; die Theorie selbst ist also die Gesamtheit der aus ihren Axiomen herleitbaren Ausdrücke. Man sagt auch, eine Theorie (im syntaktischen Sinne) sei eine deduktiv abgeschlossene Ausdrucksmenge; sie läßt sich ja durch Herleitungen
Die A-Postulate von L(G) sind nun also (GA1)⫺(GA4), (46) und die explikativen Definitionen von (43). Damit läßt sich nun für L(G) eine analytische Folgebeziehung (s. o. § 4.4.2.) bestimmen. ⫺ Th(G) hat endlich viele Axiome (nämlich vier); ein Beispiel für eine Theorie mit unendlich vielen Axiomen ist Th(PA) („PA“ für „Peano-Arithmetik“). Ihre deskriptiven Konstanten sind „0“ und „S“ von L(A) („⫽“ zählen wir hier zu den logischen Konstanten); ihr Ableitungsbegriff ist wieder NK, und die Axiome gibt (59) an. Man beachte, daß PA3 selbst kein Axiom ist, sondern ein Schema, mit dem unendlich viele Axiome (alle t-Ausdrücke von L(A) dieser Form) zugelassen werden. (59) PA1 x y[S(x) ⫽ S(y) → x ⫽ y] PA2 x[S(x) ⫽0] PA3 [[Sø j0 z| ∧ j[z → Sø jS(j) z|]] → jz]
nen uneigentlichen Schlußregeln erläutert worden. Gibt es eine nach den angeführten Regeln gebildete Herleitung mit Endformel z und befinden sich die Annahmeformeln der Herleitung sämtlich in der Ausdrucksmenge G, so ist z aus G NK-herleitbar, d. h.: G NK z. (Der Index „NK“ wird fortgelassen, wenn aus dem Kontext ersichtlich ist, daß nur dieses Regelsystem gemeint sein kann.) Man beachte, daß G z zuläßt, daß einige der Ausdrücke von G bei einer Herleitung von z gar nicht als Annahmeformeln benötigt werden. Dies erleichtert den Vergleich von (Syntax) mit 储– (Semantik; die Definition von 储– verlangt ja nicht, daß bei G 储– z die Menge G endlich sein muß). Hier gelten die Beziehungen (57), s. auch Art. 76. (57) Korrektheit: Ist G z, so gilt auch G 储– z. Vollständigkeit: Ist G 储– z, so auch G z.
3. Semantik
Wie die semantische Beziehung 储– ihr syntaktisches Gegenstück in hat, so gibt es auch für die semantische Definitionsbeziehung von (42) ein syntaktisches Gegenstück (s. Tarski 1935b). Im Zusammenhang mit formalen Theorien wie Th(G) und Th(A) ist aber neben der in § 4.4. behandelten expliziten Definition noch eine weitere Definitionsform von Wichtigkeit: die implizite Definition. Verfügt ein Theorienkodifikat für eine seiner deskriptiven Konstanten über keine Definition, so heißt diese Konstante „undefiniert“. Die undefinierten Konstanten von Th(G) wären demnach also „Wl“ und „Vf“; in Th(PA) sind alle deskriptiven Konstanten undefiniert. Hinsichtlich der undefinierten Konstanten kann man nun fragen, ob ihre Bedeutungen, die ja nicht in Definitionen erklärt werden, zumindest durch die Axiome der formalen Theorie festgelegt werden. Ist dies für eine Konstante der Fall (wenn man die Bedeutungen der anderen Konstanten als bekannt voraussetzt), so sagt man, daß sie in der Theorie (bzgl. der verbleibenden Konstanten) implizit definiert wird. („Nf“ wird in Th(G) nicht implizit definiert.) Der Begriff der impliziten Definierbarkeit läßt sich modelltheoretisch genauer fassen (vgl. Hermes 1972: 179 und 192⫺194); er ist von großer Wichtigkeit in der Wissenschaftstheorie (vgl. hier z. B. Art. 2 und die ersten Artikel von Kap. XIV des Handbuchs). Die seiner modelltheoretischen Explikation zugrunde liegende Idee kann man in erster Annäherung etwa so formulieren: j wird in der formalen Theorie Th implizit definiert, wenn ein Modell M ⫽ *E, F +, in dem alle Axiome von Th gültig sind, bei der Wahl von F (j) nur eine Möglichkeit hat, wenn die Modellfunktion für die verbleibenden Konstanten festgelegt ist. 4.7. Gehalt und semiotische Folge In § 4.4.1. ist für L(G) die Beziehung 储– der logischen Folge definiert worden, und in § 4.5. und § 4.6. sind A-Postulate angegeben worden, mit deren Hilfe man auf 储– aufbauend auch eine Beziehung a储– der analytischen Folge für L(G) (nach dem in § 4.4.2. besprochenen Verfahren) definieren kann. Die Definition von 储– baut auf der der Funktion 储 储 (s. o. (39)) auf, die ihrerseits in gewohnter Weise von einer syntaktischen Analyse ihrer Argumentausdrücke Gebrauch macht. Nun ist aber nicht jedes Informationsmittel I0 syntaktisch so analysierbar, daß sich eine adäquate Semantik parallel zur Syntak-
123 tik von I0 aufbauen ließe. Dazu könnten beispielsweise die Ausdrücke von I0 zuwenig artikuliert sein (z. B.: wenn es sich um einfache Signale mit komplexer Bedeutung handelt, die für einen bestimmten Zweck ad hoc verabredet werden); oder die Ausdrücke von I0 könnten neben ihren I0-internen Bedeutungen, die ihnen sogar in einem syntaxgesteuerten Interpretationsverfahren zugewiesen werden, in bestimmten Kontexten noch weitere Bedeutungen annehmen (z. B.: wenn sie im Zusammenspiel mit Ausdrücken weiterer Informationsmittel I1, I2, … verwendet werden). Auch in solchen Fällen muß man nicht unbedingt auf die Folgebeziehung als semantischen Schlüsselbegriff verzichten. Zwar ist diese Beziehung nicht mehr mit den Verfahren von § 4.4.1. definierbar; aber es bleibt die Möglichkeit, die Folgebeziehung für das zu analysierende Informationsmittel im Rahmen einer Theorie zu charakterisieren, die diese Beziehung als undefinierten Grundbegriff annimmt. Eine solche Theorie kann sogar axiomatisiert und kodifiziert (s. o. § 4.6.2.) werden. Auch dieses Verfahren zur Erfassung der Folgebeziehung geht auf Tarski (1930 und 1935a) zurück. Bei der Formulierung solcher Theorien verwendet man aber statt der relationalen Folgebeziehung zumeist einen funktionalen Folgeoperator Cn, der Ausdrucksklassen G jeweils die Gesamtheit Cn(G) der aus G zu ziehenden Folgerungen zuordnet. Folgebeziehungen sind gewissermaßen Wahrheitswertübertragungen: Falls die Voraussetzungen wahr sind, so sind es auch die Folgen. Dies motiviert die erste Forderung an Cn: Im betreffenden Informationsmittel, dessen Folgebeziehung in der CnTheorie beschrieben werden soll, muß es eine Kategorie t wahrheitsfähiger Ausdrücke geben, und der Cn-Operator ist für Gesamtheiten solcher t-Ausdrücke als Argumente definiert und ordnet ihnen wiederum solche Gesamtheiten zu. (60a) Gehört z zu Cn(G), so gehört z zur Kategorie t und auch jeder Ausdruck aus G gehört zu dieser Kategorie. Die Forderung (60a) ist das erste Axiom in der Theorie des Cn-Operators. Wie gelangt man aber zu weiteren Gesetzen über Cn? Nun, für L(G) läßt sich ja aufgrund von 储– ein Folgeoperator CnL(G) definieren; man kann sich also die für diesen Operator aufgrund seiner Definition geltenden Gesetze anschauen, um dann die Gültigkeit derer, die man für den Folgebegriff als konstitutiv er-
124 achtet, in entsprechenden Axiomen generell für alle Folgeoperatoren Cn zu verlangen. Die Definition von CnL(G) ist einfach: CnL(G)(G) soll natürlich die Menge der z mit G 储– z sein. Ohne große Schwierigkeiten wird man erkennen, daß CnL(G) die drei Eigenschaften hat, die (60b)⫺(60d) bereits generell von Cn fordern. (60b) Einbettungseigenschaft: G ist Teilmenge von Cn(G); G 債 Cn(G) (vgl.: jeder Ausdruck folgt trivialerweise aus sich selbst als Voraussetzung). (60c) Monotonie: ist G 債 D, so auch Cn(G) 債 Cn(D) (vgl.: aus sparsameren Voraussetzungen gezogene Folgerungen können erst recht aus einem reicheren Prämissenvorrat gezogen werden). (60d) Abgeschlossenheit: Cn(Cn(G)) 債 Cn(G) (vgl.: kann man z aus Folgerungen von G folgern, so kann man z schon aus G selbst folgern). (In jüngster Zeit ist die Reichweite von (60c) problematisiert worden; s. z. B. McDermott und Doyle 1980.) Die Axiome (60a)⫺(60d) sind Mindestanforderungen an den Folgeoperator. Eine weitergehende Forderung ist die Kompaktheit (60e), die im engen Zusammenhang mit der Vollständigkeit (s. o. (57)) steht. Für die Folgeoperatoren elementarer Sprachen gilt zwar die Kompaktheit, aber nicht alle Folgebeziehungen sind kompakt. (60e) Kompaktheit: Gehört z zu Cn(G), so gibt es schon eine endliche Teilmenge D von G, so daß z bereits zu Cn(D) gehört. Im Rahmen einer axiomatischen Theorie des Cn-Operators lassen sich eine Reihe wichtiger semantischer Beziehungen definieren. Ein Ausdruck ist zum Beispiel analytisch wahr (s. o. § 4.4.2.), wenn er voraussetzungslos folgt, wenn er also zur Folgeklasse Cn(π) der leeren Menge gehört. Im Anschluß an die zu Beginn von § 4.2. erwähnte Idee Carnaps kann man den Gehalt von z, Gehalt(z), als die Klasse der nicht-analytischen Folgen von z bestimmen: Gehalt(z) ⫽ Cn(z) ⫺ Cn(π). (Enthält G nur die Ausdrücke z1, …, zn ), so soll Cn(z1, …, zn ) ⫽ Cn(G) sein; hier also: Cn(z) ⫽ Cn({z}).) Wegen (60c) gehören die analytischen Ausdrücke zur Folgeklasse Cn(G) einer jeden Ausdrucksgesamtheit G; sie werden also in der Gehaltsdefinition als nicht-spezifische Folgen ausgeschlossen. Diese Definitionsidee hat vielfach Anklang gefunden, vgl. z. B. Hiz˙ (1977: 44) und Popper
I. Systematik
(1974: 406). Normalerweise zieht man jedoch Folgerungen nicht allein aus einem t-Ausdruck, sondern aus mehreren. Auch dies läßt sich berücksichtigen: Gehalt(z, G) ist der Gehalt von z aufgrund der von den G-Ausdrükken gelieferten Hintergrundinformation; Gehalt(z, G) ⫽ Gehalt({z} ∪ G) ⫺ Gehalt(G) (wobei: Gehalt(G) ⫽ Cn(G) ⫺ Cn(π)). Da eine Ausdrucksklasse mehr oder weniger gehaltvoll (informativ) sein kann, stellt sich hier zwangsläufig die Frage, ob (und wenn ja, wie) sich der durch Cn bestimmte Gehalt eines t-Ausdrucks oder einer Klasse solcher Ausdrücke auch numerisch charakterisieren läßt. Ist es möglich, eine Maßfunktion Inf anzugeben, die die Klassen Gehalt(z) und Gehalt(j) so auf reelle Zahlen abbildet, daß Inf(Gehalt(z)) ⱕ Inf(Gehalt(j)), wenn z höchstens so informativ wie j ist? Solche Funktionen Inf sind für einfache Informationsmittel von Carnap und Bar-Hillel (1952) untersucht und als mögliche Informationsmaße gedeutet worden, s. Art. 125. In der semantischen Literatur werden solche Funktionen auch unter der Bezeichnung „logische Maßfunktionen“ (engl.: „logical measure functions“) diskutiert (s. Kemeny 1953, Gaifman 1964 sowie Leblanc und van Fraassen 1979). Popper (1974: 407) benutzt solche Gehaltsmaße, um den Grad der Annäherung eines Ausdrucks an die Wahrheit („truthlikeness“ bzw. „verisimilitude“) zahlenmäßig zu erfassen. Für eine semiotische Anwendung solcher Cn-Theorien wäre aber eine weitere Verallgemeinerung wünschenswert: Nach (60a) ist Cn auf Klassen wahrheitsfähiger Ausdrücke beschränkt. Aufsteigenden Rauch etwa würde man aber kaum als wahrheitsfähigen Ausdruck bezeichnen, obwohl er zu den Standardbeispielen für Zeichenphänomene zählt. Um solche Beispiele zu erfassen, müßte der Argumentbereich von Cn erweitert werden. Eine solche Erweiterung hat Hiz˙ (1977) vorgenommen (s. auch Hiz˙ 1984 und 1985; seine Theorien formuliert er allerdings für tokens (s. Art. 2 § 2.) und nicht für Ausdruckstypen; davon wird im folgenden abgesehen): Zum Gegenstand der Semiotik gehören nicht allein wahrheitsfähige Ausdrücke, sondern generell alle Elemente der Klasse Mo der bedeutungsvollen Objekte. Zeichenbenutzer, die einen Gegenstand im Rahmen eines semantischen Systems als bedeutungsvolles Objekt interpretieren, ziehen mit ihren Hintergrundinformationen Folgerungen aus diesem Objekt. Diese Folgerungen lassen sich dann wie-
125
3. Semantik
derum als Klassen von t-Ausdrücken einer geeigneten formalen oder natürlichen Sprache darstellen. Die Semiotik thematisiert also eine Cn verallgemeinernde Funktion Iocn der semiotischen Folge (Hiz˙ 1977: 46: „semiotic consequence“), die gemischten Klassen von bedeutungsvollen Objekten und t-Ausdrükken, die Hintergrundinformationen liefern, Klassen von t-Ausdrücken als verallgemeinerte Folgeklassen zuordnet. Statt (60a) hat man für Iocn daher das allgemeinere (61a); daß Iocn eine Verallgemeinerung von Cn ist, kommt in (61b) zum Ausdruck. (61a) Gehört z zu Iocn(G), so ist es von der Kategorie t, und jedes b von G gehört zu Mo oder ebenfalls zur Kategorie t. (61b) Enthält G nur t-Ausdrücke, so ist Iocn(G) ⫽ Cn(G). (61c) Iocn(Iocn(G)) 債 Iocn(G). Nach Hiz˙ (1977: 47) soll Iocn ebenso wie Cn die Abschlußeigenschaft (61c) haben, während es ein Problem darstellt, ob Iocn auch kompakt ist (ein interessanter Aspekt dieses Problems besteht in der Festlegung des Begriffs des endlichen Teils für Mo-Elemente, der dem Begriff der endlichen Teilmenge von (60e) analog ist; vgl. etwa die Diskussion pointillistischer Malerei bei Hiz˙ 1977: 47 f). In völliger Entsprechung zum Gehaltsbegriff läßt sich nun auch der allgemeinere Begriff des semiotischen Gehalts (Hiz˙ 1977: 48: „semiotic meaning“) definieren: SemGehalt(b, G)⫽ Iocn({b}) ∪ G) ⫺ Iocn(G). ⫺ Als weiteres Beispiel eines semiotisch interessanten Begriffs, der sich in einer Iocn-Theorie definieren läßt, sei noch die Beziehung der Anspielung (Hiz˙ 1977: 49) angeführt: Ein bedeutungsvolles Objekt b spielt in bezug auf die durch G gegebene Hintergrundinformation auf ein g aus Mo an, wenn es in Iocn ({b, g} ∪ G) ein z gibt, das weder zu Iocn({b} ∪ G) noch zu Iocn ({g} ∪ G) gehört. Konkrete Iocn-Funktionen betreffen stets mindestens zwei semantische Systeme: das der betrachteten bedeutungsvollen Objekte und das des Informationsmittels, welchem die t-Ausdrücke entstammen. Dabei können aber die bedeutungsvollen Objekte selbst tAusdrücke sein, denen durch SemGehalt Zusatzbedeutungen außerhalb ihres wahrheitszentrierten Systems zugewiesen werden. Dies sei für die Farbzuschreibungen von FO (s. o. § 3.) beispielshalber vorgeführt. Die benutzten t-Ausdrücke entstammen dabei der Erweiterung L(G, FO) von L(G). Neben den in (32) aufgelisteten Grundausdrücken hat L(G,
FO) noch die in (62) aufgeführten zusätzlichen deskriptiven Konstanten. (62) Zusätzliche Ausdrücke von L(G, FO). (62a) Weitere Nominatoren (Kategorie e): ¶1, ¶2, …, ¶680. (62b) Ein neuer einstelliger Prädikator (Kategorie e(t)): A (‘ist ein Tier’). (62c) Ein neuer zweistelliger Prädikator (Kategorie ee(t)): M (‘ähnelt farblich’). Im intendierten Modell von L(G, FO) sollen sich die neuen Nominatoren auf die Farbtäfelchen des Exemplars des Farbatlasses beziehen, den der Beispielgenetiker von § 4.1. benutzt; der Gegenstandsbereich dieses Modells umfaßt also genau die Tiere der Stichprobe S und diese 680 Farbtäfelchen. Der Ausdruck „¶n“ von L(G, FO) designiert im intendierten Modell ein token des Ausdrucks 첸m der Kategorie FM von FO (s. o. § 3.1.). Das Attribut, das „A“ im intendierten Modell von L(G, FO) designiert, trennt die Tiere von den Farbtäfelchen, indem es genau den Tieren W zuordnet und den Täfelchen F zuweist. Das von „M“ in diesem Modell designierte Ähnlichkeitsattribut betrifft gleichermaßen Tiere wie Farbproben: Es ordnet Gegenständen W zu, wenn von ihnen Farbreize derselben Valenz ausgehen. ⫺ Ob ein Färbungsprädikator z von L(G, FO) auf ein Tier a namens x zutrifft, wird der Beispielgenetiker dadurch feststellen, daß er a mit den Täfelchen ¶1, ¶2, … vergleicht. Hat a einen Fleck, der so wie ¶n gefärbt ist, und gibt es in S3 einen wahren FZ-Ausdruck j der Gestalt (63a), so ist (63b) im intendierten Modell von L(G, FO) wahr. Mit anderen Worten: Das Tier a hat einen Farbfleck des von ¶n veranschaulichten Valenzgebiets. (63 a) j ⫽
첸m z
(63b) z(x) Dieser Zusammenhang gilt aufgrund einer speziellen semiotischen Eigenschaft der Farbtäfelchen: ¶m (⫽ der Gegenstand, den der Ausdruck „¶m“ im intendierten Modell designiert) ist Ausdrucksrealisation von 첸m, das auf die Valenz v referiert, zu der der von ¶m ausgehende Farbreiz gehört. Die Valenz v fällt in FO unter ein Valenzattribut av (W ⫽ av( v)), das im Rahmen von L(G, FO) zur Erklärung eines Färbungsattributs az dient, unter das wiederum ¶m fällt. Komplexe semiotische Beziehungsketten dieser und ähnlicher Art sind von Goodman (1981) und Elgin
126
I. Systematik
Ausdruck von F0
Valenz referiert auf
Valenzattribut fällt unter
n
m
av
ist Realisation von
dient der Erklärung von
¶m
trifft zu auf
Ausdrucksrealisation (token)
aÊ Färbungsattribut
Abb. 3.5: Exemplifikationsbeziehung. ⫺ Die Ausdrucksrealisation ¶m, auf die der L(G, FO)-Ausdruck „¶m“ referiert, exemplifiziert das Valenzattribut av; denn dieses emittiert einen Farbreiz, der zu einer Valenz v gehört, die unter dieses durch 첸m in FO veranschaulichte Valenzattribut fällt.
(1983) untersucht worden; in Anlehnung an Goodmans Terminologie könnte man sagen, daß das Täfelchen ¶m das Färbungsattribut az exemplifiziere. Den komplexen Zusammenhang verdeutlicht nochmals Abb. 3.5. Für L(G, FO) kann die Folgebeziehung 储– wie für L(G) (s. o. § 4.4.1.) definiert werden: Zur Definition der für L(G, FO) adäquaten analytischen Folgebeziehung a储– treten zu den A-Postulaten von L(G) noch die von (64). Mit den ersten beiden schränkt man die Sexus- und Verwandtschaftsprädikatoren auf Tiere ein; dazu ist es aber auch nötig, die Definition (43a) durch (64c) zu ersetzen. Die APostulate (64d) verlangen, daß Farbtäfelchen keine Tiere sind, (64e) fordert die Reflexivität, (64f) die Symmetrie der von „M“ bedeuteten Farbähnlichkeit. Schließlich beschreibt (64g) die Testfunktion der Farbtäfelchen. (64a) x[Wl(x) → A(x)] (64b) x y[Vf(x, y) → [A(x) ∧ A(y)]] (64c) x[Ml(x) ↔ [ÿWl(x) ∧ A(x)]] (64d) ÿA(¶m ) (für: 1 ⱕ m ⱕ 680) (64e) x[M(x, x)] (64f) x y[M(x, y) → M(y, x)] (64g) z(¶m) → x[z(x) ↔ M(¶m, x)] (wobei z Färbungsprädikator und 1 ⱕ m ⱕ 680 ist) Für L(G, FO) ist nun Cn(G) die Klasse derjenigen z mit G a储– z, wobei jetzt a储– aufgrund der gerade angegebenen A-Postulate von
L(G, FO) definiert wird. In (65) wird die Funktion Iocn definiert, die für gemischte Klassen von t-Ausdrücken der Informationsmittel FO und L(G, FO) die Folgenklassen derjenigen L(G, FO)-Ausdrücke angibt, die die aus den gemischten Klassen herausholbaren Informationen festhalten. (65) Ist G eine Klasse von t-Ausdrücken, die zu FO oder zu L(G, FO) gehören, so ist Iocn(G) ⫽ Cn(G1 ∪ G2 ), wobei G1 die Klasse der L(G, FO)-Ausdrücke von G ist und G2 die Klasse der L(G, FO)-Ausdrücke, für die es in G ein 첸 j⫽ m z von FO gibt und die selbst die Gestalt f ⫽ z(¶m ) haben. Wählen wir als Beispiel die Farbzuschreibung (66a) und setzen wir ferner die Gültigkeit der Hypothese j0 (⫽ (48a)) über die Erblichkeit von Flecken aus dem Valenzgebiet 24ca voraus! Weiter soll der Beispielgenetiker die Wahrheit von j1 (⫽ (66b)) und die von j2 (⫽ (66c)) durch Beobachtungen bestätigt haben. Dann gilt nach (65) auch (66d): Man kann aufgrund der Hintergrundinformationen, die die L(G, FO)-Ausdrücke angeben, aus der Farbzuschreibung die neue Information extrahieren, daß das Tier a6 nicht Elternteil von a7 ist!
3. Semantik
첸653 24 ca (66b) j1 ⫽ ÿ M (¶653, 7) (66c) j2 ⫽ M(¶653, 6) (66d) ÿElt(6, 7) gehört zu Iocn({z, j0, j1, j2})
(66 a) z ⫽
Man kann also in einer Theorie des semiotischen Gehalts auch Zusatzbedeutungen von FO-Ausdrücken erfassen, die diese Ausdrücke in speziellen Gebrauchskontexten erhalten und die den engeren Rahmen der Semantiken von FO (s. o. § 3.) überschreiten. 4.8. Diskursrepräsentationstheorie (DRT) Das schwierigste semantische Problem, das L(G) und L(G, FO) aufwerfen, besteht in der adäquaten Analyse der Variablennotation und ihres Zusammenspiels mit den Quantoren. Die hierzu eingeführten begrifflichen Unterscheidungen, die angewendeten Verfahren und die erzielten Ergebnisse, die zu den Definitionsklauseln von (39f) führen, sind sicherlich sehr kompliziert. Nun sind andererseits L(G) und L(G, FO) selbst Informationsmittel recht bescheidener Komplexität, und man wird daher vermuten, daß bei komplizierteren Informationsmitteln, die ebenfalls anaphorische Querbezüge zu kodieren haben, die Art und Weise dieser Kodierung noch verwickelter sein wird. Genau dies trifft auch zu. Aus natürlichen Sprachen sind eine Reihe syntaktischer Konstruktionen bekannt, deren Übersetzung in elementare Sprachen Schwierigkeiten bereitet, ohne daß diese Konstruktionen die Ausdruckskraft elementarer Sprachen überschreiten. Eine berühmte Beispielgruppe bilden die sogenannten „Eselssätze“, deren semantische Problematik bereits im Mittelalter diskutiert worden ist und die von Geach (1962⫽ 31980: 143⫺145) in die neuere Diskussion eingebracht worden sind. Die Bezeichnung „Eselssatz“ führt von einem Beispiel her, das Geach diskutiert: „Any man who owns a donkey beats it“. Ein auf L(G, FO) zugeschnittenes Beispiel wäre etwa: „Jedes Tier, das einen weiblichen Nachkommen hat, ähnelt diesem (farblich)“. Normalerweise werden indefinite Nominalgruppen wie „einen weiblichen Nachkommen“ mit Hilfe des Partikularisators übersetzt, vgl. (67a) mit (67b); und eine mit „jedes“ eingeleitete Nominalgruppe (ggf. mit angeschlossenem Relativsatz) wird mit dem Generalisator mit folgendem Subjunktor wiedergegeben, vgl. (67c) mit (67d).
127 (67a) a1 hat einen weiblichen Nachkommen. (67b) x[Wl(x) ∧ Nf(x, 1)] (67c) Jedes Tier, das a1 gleicht, ist ein Nachfahre von ihm. (67d) x[[A(x) ∧ M(x, 1)] → Nf (x, 1)] Diese Übersetzungsstrategien schlagen jedoch bei Eselssätzen fehl: Eine korrekte Übertragung des angegebenen Beispiels in L(G, FO) ist (68b) aber nicht (68a)! (68a) x[[A(x) ∧ y[Wl(y) ∧ Nf(y, x)]] → M(x, y)] (68b) x y[A(x) ∧ [Wl(y) ∧ Nf(y, x)]] → M(x, y)] Indefinite Nominalgruppen des Deutschen verhalten sich also semantisch nicht (oder: zumindest nicht immer) so wie der Partikularisator. Ihre semantische Interpretation kann vom jeweiligen Kontext beeinflußt werden; im angeführten Beispiel interagiert die indefinite Nominalgruppe etwa mit der Relativsatzkonstruktion. Was dieses Phänomen so interessant macht, sind seine Konsequenzen für die semantische Beschreibung und sogar für die Bedeutungstheorie. Nach der von Kamp (1981) entwickelten Diskursrepräsentationstheorie (DRT; der Name rührt daher, daß in einer DRT-Semantik nicht nur einzelne t-Ausdrücke, sondern auch ganze Texte semantisch interpretiert werden können) bedürfen nämlich die bei der semantischen Interpretation wirksamen Faktoren zu ihrer adäquaten Erfassung neben der modelltheoretischen einer weiteren Ebene semantischer Beschreibung: der Repräsentationsebene. Eine umfassende Einführung in die Diskursrepräsentationstheorie bieten Kamp und Reyle (1993); mit der Diskursrepräsentationstheorie konkurriert auf dem Gebiet der Textinterpretation der Ansatz der sogenannten Dynamischen Montague-Grammatik (vgl. Groenendijk und Stokhof 1991), die ihrerseits auf der dynamischen Prädikatenlogik (vgl. zur Einführung etwa Friedrichsdorf 1992: 273⫺292) aufbaut. Um etwa Eselssätze semantisch interpretieren zu können, reicht es nicht aus, sofort nach ihren modellrelativen Wahrheitsbedingungen zu fragen; es muß auch untersucht werden, wie die mentalen Repräsentationen beschaffen sind, die Empfänger solcher Sätze als „Response“ auf sie bilden (s. Kamp 1981: 282). Ein Ausdruck induziert eine Repräsentation m, und er ist wahr im Modell M unter m, wenn M mit m kompatibel ist, d. h.: M muß so beschaffen sein, wie es m verlangt.
128
I. Systematik
Die von z induzierte Diskursrepräsentationsstruktur (kurz: DRS) m (z) ist ein baumförmig angeordnetes System einzelner Diskursrepräsentationen (kurz: DRn) m(j): Das sind Tafeln, die jeweils von Teilausdrücken oder transformierten Teilausdrücken j von z zu m(z) beigesteuert werden. (Genaugenommen handelte es sich um Teilausdrucksvorkommnisse; die genaue Formulierung der hier einschlägigen Regeln ist einigermaßen kompliziert; vgl. Kamp 1981: 308⫺311.) Eine DR m(j) kodiert Bedingungen, die ein Modell M erfüllen muß, in dem j gültig ist; sie besteht dabei aus einem Gegenstandsbereich Um(j) von Diskursreferenten und einer Liste Conm(j) von Bedingungen, die m(j) an die Modellfunktion von M stellt. Unter den DRn einer DRS m(z) befindet sich stets eine ausgezeichnete Haupt-DR, die dem Ausdruck z selbst entspricht; m(z) kann auch nur aus dieser Haupt-DR bestehen. Dies ist zum Beispiel für (67a) der Fall, dessen DRS (69) wiedergibt. m(67a)
(69)
m(66a):
U: d1
d2
Con: a1 hat einen weiblichen Nachkommen d 1 ⫽ a1 d1 hat einen weiblichen Nachkommen weiblich(d2) Nachkomme(d2, d1)
Der Gegenstandsbereich der einzigen und somit Haupt-DR m(67a) von m(67a) umfaßt genau die beiden Diskursreferenten d1 und d2, die zu den beiden Nominalgruppen „a1“ und „einen weiblichen Nachkommen“ gehören. Die Bedingungen in m(67a) werden von den in (67a) vorkommenden Prädikatoren („weiblich“, „Nachkomme“, „hat“) festgelegt, oder sie korrelieren die Nominatoren (wie „a1“) mit Diskursreferenten (vgl. in (60) die zweite Bedingung). Ganz generell verlangt eine DRS m(z) von einem Modell M, in dem z unter m(z) gültig sein soll, daß die Haupt-DR m(z) von m(z) in M einbettbar sein muß. Dies heißt etwa für das Beispiel (69), daß es eine Einbettungsfunktion B geben muß, über die m(69a) an ein M ⫽ *E, F + folgende Bedingungen stellt: (i) B muß die Diskursreferenten d1 und d2 auf Gegenstände g1 ⫽ B(d1 ) und g2 ⫽ B(d2 ) des Gegenstandsbereichs E von M abbilden. (ii) Vom
Modelldesignat F (a1 ) des Nominators wird B(d1 ) ⫽ g1 ⫽ F (a1 ) und vom Modelldesignat des zweistelligen Prädikators „Nachkomme“ wird F(Nachkomme)(B(d2 ),B(d1 )) ⫽ F (Nachkomme)(g1, g2 ) ⫽ W gefordert. Offensichtlich gibt es eine solche Einbettung B genau dann, wenn (67b) in M gültig ist (wenn man die Modellfunktion von M gleichermaßen für deutsche wie für Grundausdrücke von L(G, FO) erklärt ansieht). Enthält ein Ausdruck, vgl. (67c) den Generalisator „jedes“, so verzweigt seine DRS; in einer DR der DRS werden dann die Bedingungen notiert, die vom Kernsubstantiv der mit „jeder“ eingeleiteten Nominalgruppe (und dem ggf. folgenden Relativsatz) stammt, in einer anderen DR werden die Bedingungen notiert, die der Hauptsatz diktiert; vgl. (70) für (67c). (70)
m1 (67c) U: d1 Con: Jedes Tier, das a1 gleicht, ist ein Nachfahre von ihm d1 ⫽ a1
m(67c): m2 (67c)
m3 (67c)
U: d2
U:
Con: Tier(d2) Gleicht(d2, a1) Gleicht(d2, d1)
Con: d2 ist ein Nachfahre von ihm Nachfahre(d2, d1)
In (70) ist m1(67c) die Haupt-DR. Bei Erstellung der DR m3(67c) muß der anaphorische Querbezug zwischen „a1“ und „ihm“ durch Wahl des mit „ihm“ gemeinten Diskursreferenten aufgelöst werden. Dieser Diskursreferent darf aus den Gegenstandsbereichen der m3(67c) in m(67c) übergeordneten DR gewählt werden. (Wann eine DR einer anderen übergeordnet ist, wird aufgrund des syntaktischen Baus der von den DRn repräsentierten Ausdrücke definiert; vgl. Kamp 1981: 309). Eine Haupt-DR m(z), die sich so wie m(67c) in zwei DRn m1 und m2 verzweigt, verlangt für die Gültigkeit von z in einem Modell M ⫽ *E, F +, daß sich jede Einbettung B von m1 in M zu einer Einbettung B' von m2 in M ausbauen läßt. B' übernimmt alle Zuordnungen von Individuen aus E zu den Diskursrefe-
129
3. Semantik
renten, die bereits B getroffen hat. Ebenso werden alle Einschränkungen für F von B von B' übernommen. B' muß aber den neuen Diskursreferenten von m2 (wenn es solche gibt, was im Beispiel nicht der Fall ist) neue E-Elemente zuweisen und für die zusätzlichen Bedingungen von Conm2 weitere Anforderungen an F stellen. Im Beispiel verlangt eine Einbettung B von m2(67c) in ein M ⫽ *E, F + von F folgendes: F (Tier)(B(d2 )) ⫽ W, F (a1 ) ⫽ B(d1) und F (gleicht)(B(d2 ), B(d1)) ⫽ W. Dem fügt dann ein B erweiterndes B' für m3(67c) noch hinzu: F (Nachfahre)(B(d2 ), B(d1 )) ⫽ W (denn B'(dn ) ⫽ B(dn ) für n ⫽ 1 oder 2). Etwas Überlegung zeigt auch hier, daß die Forderung nach Fortsetzbarkeit der Einbettung B von m2(67c) in M zu einer Einbettung B' von m3(67c) in M mit dem Postulat äquivalent ist, daß (67d) in M gültig sein soll. Der problematische Eselssatz unterscheidet sich nicht wesentlich von dem gerade behandelten Beispiel; für ihn ist lediglich seine Antezedens-DR etwas komplizierter. Zur Erstellung seiner DRS muß man nur die für (69) und (70) benutzten Prinzipien miteinander kombinieren, s. (71). (71)
m0 U: Con: Jedes Tier, das einen weiblichen Nachfahren hat, ähnelt diesem
m: m1 U: d1
m2 U: d2
Con: Tier(d1) d1 hat einen weiblichen Nachfahren Weiblich(d2) Nachfahre(d2, d1)
Con: d1 ähnelt diesem d1 ähnelt d2
Wie bei (70) wird auch hier Fortsetzbarkeit von Modelleinbettungen B für m1 in ein M zu Modelleinbettungen B' von m2 in dasselbe M verlangt. Auch hier führt einige Überlegung wieder zu dem Ergebnis, daß dies genau darauf hinausläuft, daß (68b) im einbettenden Modell wahr sein soll. Die DRT-Semantik ist also in der Lage, indefinite Nominalgruppen kontextsensitiv als Partikularisatoren (s. o. (69)) oder Generalisatoren (s. (71)) zu interpretieren.
Die DRT, die neben Montague- und Situationssemantik zu den meistdiskutiertesten Theorien in der linguistischen Semantik zählt, verdient aus einer ganzen Reihe von Gründen besondere semiotische Aufmerksamkeit: (i) Zunächst stellt sie eine interessante Synthese modelltheoretischer und repräsentationalistischer Ansätze dar. Ansätze der letzteren Art, nach denen Bedeutungen empfängerinterne Repräsentationen von Realitätsausschnitten sind, findet man besonders häufig in der Künstliche-Intelligenz-Forschung und der kognitiven Psychologie, während modelltheoretische Verfahrensweisen vorwiegend bei logisch orientierten Semantikern, soweit diese nicht einen wahrheitstheoretischen, nicht-modellrelativierten Ansatz verfolgen, Anklang gefunden haben. (ii) Die DRSn zeigen auffällige Ähnlichkeiten mit einer ganzen Serie theoretischer Konstrukte, die in unterschiedlichen Richtungen der Semantikforschung entwickelt wurden. Insbesondere wären hier die sogenannten „semantischen Tafeln“ des Beth-Kalküls (s. Beth 1955) zu nennen, die ihrerseits wiederum eng mit dem in § 4.6.1. beschriebenen syntaktischen Formalismus NK des natürlichen Schließens verwandt sind. Allerdings muß vor allzu vorschnellen Identifizierungen gewarnt werden; Verwandtschaftsbeziehungen der gerade angesprochenen Art werden von van Benthem und van Eijck (1982) untersucht. (iii) Kamp (1981: 319, Fn. 7) bemerkt selbst, daß das Vorgehen der DRT in einigen Punkten dem der spieltheoretischen Semantik gleicht und verweist dabei auf Hintikka und Carlson (1979). Diese Ähnlichkeit betrifft die Verwendung von Ideen, die den auf Gödel (1958) zurückgehenden sogenannten „Funktionalinterpretationen“ (s. Hintikka und Kulas 1983 sowie Hindley und Seldin 1986: Kap. 18) zugrunde liegen. Eine Funktionalinterpretation, die auf einem NK ähnlichem Kalkül aufbaut, wird unten im 6. Abschnitt behandelt. (iv) Schließlich lassen sich die DRn als Beschreibungen partieller Modelle auffassen. Für die von der DRT verwendeten Einbettungsfunktionen gelten weiter auch bestimmte Kompatibilitätsbedingungen (s. Kamp 1981: 314). Dies rückt die DRT in die Nähe der unten im 7. Abschnitt behandelten Theorie, die Partialität und Monotonie (als eine Form der Kompatibilität) thematisiert. ⫺ Schließlich sei darauf verwiesen, daß ein der DRT ähnlicher Ansatz, die files change semantics, von Heim (1982 und 1983) entwickelt worden ist.
5.
Intensionale Semantik
In den bisher behandelten Informationsmitteln taucht ein wichtiges Phänomen nicht auf: die Intensionalität. Sie ist Thema der intensionalen Semantik, während die bisherigen Begriffe, Methoden und Ergebnisse zum klassischen Bestand der extensionalen Semantik zählen. Was Intensionalität ist und wie sie semantisch analysiert wird, soll in diesem Abschnitt erklärt werden.
130 5.1.
I. Systematik
Propositionen, Eigenschaften und Individuenkonzepte
5.1.1. Eine Sprache für die extraterrestrische Kommunikation Die Grundbegriffe der intensionalen Semantik sollen wieder im Zuge einer semantischen Analyse eines bestimmten Informationsmittels eingeführt werden. ⫺ Im Jahre 1960 hat der niederländische Mathematiker Hans Freudenthal seinen Entwurf der Sprache LINCOS (⫽ lingua cosmica; Freudenthal 1960: 14) vorgelegt, die der extraterrestrischen Kommunikation dienen soll. LINCOSAusdrücke sind Radiosignale. In immer komplizierter werdenden Programmen werden sie zunächst anhand von Beispielen (exemplarisch) und später mittels Definition eingeführt. Dies soll den Empfängern den schrittweisen LINCOS-Erwerb ermöglichen. Einige LINCOS-Ausdrücke dienen dazu, potentiellen Empfängern durch Angabe astronomischer Daten über unser Sonnensystem Auskunft über die Herkunft der Programme und ihre Sender zu erteilen. Die vereinfachte Version L(AL) (⫽ astronomisches LINCOS) dieses LINCOS-Ausschnitts soll als Beispiel dienen, an dem die Grundbegriffe der intensionalen Semantik veranschaulicht werden (zum authentischen LINCOS vgl. Freudenthal 1960). In L(AL) wird über dreierlei Sorten von Individuen geredet: über Himmelskörper, Zahlen zur Angabe astronomischer Größen und über Örter; es werden daher drei Gegenstandsbereiche angenommen. Für jeden dieser Bereiche gibt es eine eigene Variablensorte: „x“, „x0“, „x00“ usw. sollen Variablen für Körper, „y“, „y0“, „y00“ usw. solche für reelle Zahlen und „z“, „z0“, „z00“ usw. solche für Örter sein. Zur Leseerleichterung werden in den Subskripten Ziffern statt Strichfolgen (z. B.: „y3“ statt „y000“) verwendet. Sämtliche zur syntaktischen Beschreibung von L(AL) benutzten Ausdrücke sind bereits metasprachliche Namen für Funksignale. Wird etwa für L(AL) Morse-Kode verwendet, so bezeichnet „y3“ den Ausdruck „-·----··----··---··--“ (ein „y“ gefolgt von drei Kommata). Neben t gibt es für L(AL) nun also drei weitere Basistypen: ek (Körperindividuen), er (Zahlindividuen), eo (Ortsindividuen). Die Typen, die sich aus diesen Basistypen in derselben Weise wie die Typen von L(G) (s. o. § 4.3.) aus e und t aufbauen, sind die Typen 1. Stufe von L(AL). Daneben hat L(AL) noch die folgenden Typen 2. Stufe: Ist t0 Basistyp und t1
⫽ t2(t3 ) Typ 1. Stufe, so ist t1(t0 ) ein Typ 2. Stufe (Beispiel: ek(t)(er ) ist Typ 2. Stufe). Jeder Basistyp (⫽ Typ der Stufe 0) und die Typen der Stufe 1 sind zugleich Kategorien von L(AL). Daneben gibt es noch folgende Kategorien, die keine Typen sind: (i) die Variablenkategorien vk, vr und vo; (ii) die Konstantenkategorie cr, (iii) zwei spezielle Funktorkategorien: cr(cr ) und crcr(er ); (iv) die Operatorkategorien vt0; t1, wobei t0 und t1 von der Stufe 0 sind und v eine Variablenkategorie ist. Ausdrücke von cr bzw. vx gehören zugleich zu er bzw. zu ex (x ⫽ k, r, o). ⫺ Die Typenzuordnung T von L(AL) ist folgendermaßen festgelegt: (i) Ist k zugleich Typ und Kategorie, so ist T(k) ⫽ k. (ii) Für Variablen- und Konstantenkategorien ist T(vx ) ⫽ ex (x ⫽ k, r oder o) und T(cr ) ⫽ er. (iii) in Funktor- oder Operatorkategorien werden Konstanten- und Variablenkategorien in derselben Weise wie unter (ii) behandelt, d. h.: T(cr(cr )) ⫽ T(cr ) (T(cr )) ⫽ er(er ) (und entsprechend für crcr(er )), und T(vt1; t0 ) ⫽ T(v)(T(t1 ))(T(t0 )). Also z. B.: T(vkt; er ) ⫽ ek(t)(er ). Die Operatoren führen also zu den Typen zweiter Stufe. ⫺ In (72) sind die deskriptiven Konstanten von L(AL) aufgelistet, wobei wieder in Klammern Hinweise auf die Bedeutungen gegeben werden. (72) ek: 䉺 (Sonne), B · (Merkur), ¥ (Venus), ª (Erde), μ (Mars), K (Jupiter), L (Saturn), μ. (Uranus), N (Neptun), L P (Pluto), y (Mond); cr: 0 (Null), 1 (Eins); er: g (Gravitationskonstante), p (Pi); cr(cr ): 0 (Verdopplung), 1 (Verdopplung mit anschließender Addition von 1); crcr(er ): die Dualkommata: , und ,0 und ,00 usw.; erer(er ): ⫹ (Addition), · (Multiplikation), Exp (Exponentiation); ek(er ): Mas (Masse), Uml (Umlaufzeit); ekek(er ): Dst (mittlere Entfernung), Att (Anziehungskraft); eoeo(er ): Abst (Abstand); eket(eo ): Loc (Ort des Körpers … zur Zeit ---); ek(t): Aoi (Asteroid), Ste (Himmelskörper); er(t): Rea (reelle Zahl), Nat (natürliche Zahl); eo(t): Ort;
3. Semantik
131
ekek(t):
Klammern gestrichen (z. B.: (1)0 ⇒ 10). Sodann werden alle initialen Folgen von „0“ getilgt, die einer „1“ oder der Konstellation „0,“ vorangehen (z. B.: 010 ⇒ 10; (0(0)), ((1)0) ⇒ 00,10 ⇒ 0,10). (ii) In Ausdrücken, die mit einem Operator beginnen, wird die dem Operator folgende Variable tiefer gesetzt, das von Jo eingeführte Komma gestrichen und die linke eckige Klammer (unter Streichung nun redundant werdender Klammern) hinter die Variable verschoben (z. B.: Car[x, ⱕ (Mas(x), 1)] ⇒ Carx[ⱕ (Mas(x), 1)]). (iii) Es soll wieder Infixnotation (z. B.: ⫹(0,1) ⇒ 0 ⫹ 1; Carx[ⱕ(Mas(x), 1)] ⇒ Carx[Mas(x) ⱕ 1]) benutzt werden; und redundante eckige Klammern nach Quantoren sind erlaubt (z. B. xSte(x) ⇒ x[Ste(x)]). (iv) Für Exp(z, j) wird zj geschrieben. Wie in LINCOS ist auch in L(AL) die Zahldarstellung binär; „10“ referiert auf 2, „10,1“ auf 2,5. Mit den erläuterten Ausdrucksmöglichkeiten lassen sich astronomische Fakten über Himmelskörper und unser Sonnensystem an die extraterrestrischen Empfänger übermitteln; vgl. z. B. (74). (74a) x[Aoi(x) → Ste(x)] (74b) x1 x2[[Pla(x1, x2 ) ∨ Sat(x1, x2 )] → [Ste(x1 ) ∧ Ste(x2 )]] (74c) Pla(B · , 䉺), Pla(¥, 䉺), Pla (ª, 䉺), … Pla(P L, 䉺) (74d) [Sat(y, ª) ∧ Carx[Sat(x, ª) ⫽ 1]] (74e) Carx[Sat(x, L) ⫽ 1010] (74f) Mas(ª) ⫽ 101 · 101011010 (74g) Dst(ª, 䉺) ⫽ 1000, 11110011 · 1010000
Pla (--- ist Planet von …), Sat (--- ist Satellit von …); ekeker(t): Imp (--- stößt mit … zur Zeit ⫹⫹⫹ zusammen); ekek(t): ⬇ (Körperidentität); eoeo(t): ⯝ (Ortsidentität); erer(t): ⫽ (Zahlidentität), ⱕ (kleiner/ gleich); (Zur Leseerleichterung werden alle drei Identitätsrelatoren durch „⫽“ wiedergegeben.) vxt; er: Car (Anzahl der Körper/Zahlen/Örter, für die … gilt: x ⫽ k, r oder o), Sub (nur für x ⫽ r, Supremum, d. h.: kleinste obere Schranke aller Zahlen, für die … gilt). Zu diesen Ausdrücken treten noch die technischen Hilfsausdrücke (Kommata und Klammern), die Junktoren und Quantoren. Daneben gibt es aber noch zwei weitere Synkategoremata: 첸 (Es ist notwendig, daß …) und 앳 (Es ist möglich, daß …), die als „Modaloperatoren“ bezeichnet werden. Die syntaktischen Operationen entsprechen denen von L(G), s. o. (33). Hinzu treten jedoch die Operationen J16 und J17 für die Modaloperatoren, Jc1 und Jc2 für die Ziffernbildung und Jo für Operatorausdrücke, s. (73). (73) J16(z) ⫽ 첸z J17(z) ⫽ 앳z Jc1(z, j) ⫽ (j)z Jc2(f, z, j) ⫽ (z)f(j) Jo(z, j, x) ⫽ z[j, x] Schon routinemäßig werden nun die eigentlichen syntaktischen Operationen von L(AL) als die Einschränkungen der J-Operationen auf die Klasse A(L(AL)) definiert, die genau die Ausdrücke umfaßt, die aus den Konstanten von (72) mittels der J-Operationen bildbar sind. Einige syntaktische Regeln entsprechen denen von (34) für L(G) und (47) für L(A). Sie sollen auch so numeriert werden. Allerdings hat man für L(G) zu berücksichtigen, daß es drei e-Kategorien gibt. Man hat also zum Beispiel sechs Quantorenregeln: R13, k, R13, r und R13, r für „ “ und R14, k, R14, r und R14, o für „ “. Neu hinzu kommen die Regeln Rm ⫽ *Fm, *t+, t+ (m ⫽ 16 oder 17) und die Regeln zur Zifferbildung: Rc1 ⫽ *Fc1, *cr(cr ), cr+, cr+ und Rc2 ⫽ *Fc2, *crcr(cr ), cr, cr+, er+. Ebenfalls neu sind die Operatorregeln: R18, x ⫽ *Fo, *vxt1; t0, vx, t1+, t0+ (x ⫽ k, r oder o). Folgendes sei verabredet: (i) In Ausdrücken der Kategorie cr und in er-Ausdrücken, die aus Anwendungen von Fc1 und Fc2 resultieren, werden alle
Mit (74a) und (74b) wird gesagt, daß Asteroiden, Satelliten und Planeten sowie alle Körper, die Satelliten oder Planeten haben, Himmelskörper sind. In (74c) werden einige Planeten der Sonne angegeben; (74d) sagt, daß der Mond der einzige Satellit der Erde ist. Der Saturn hat 10 Satelliten, vgl. (74e). In (74f) und (74g) werden die (ungefähre) Masse der Erde und ihre mittlere Entfernung zur Sonne (die sogenannte „Astronomische Einheit“) angegeben. 5.1.2. Versagen der Regel Sub in nichtextensionalen Kontexten Wozu werden 첸 und 앳 in L(AL) überhaupt benötigt? Man kann beispielsweise für die Massenfunktion (Mas) mit Hilfe der Modaloperatoren, der Ortsfunktion (Ort) und der Stoß-Beziehung (Imp) eine explikative Definition angeben (vgl. Bressan 1972: Kap. 4), wenn man in L(AL) die für die Mechanik notwendige Mathematik zur Verfügung hat.
132 Daran mangelt es in L(AL) nicht: Man kann die klassischen Annahmen über die reellen Zahlen (daß sie einen archimedisch geordneten, vollständigen Körper bilden) formulieren und dann Analysis betreiben. Ist eine explikative Definition der Massenfunktion möglich, wird man sie bestimmt potentiellen Empfängern übermitteln wollen, da sie diesen das Erraten der Bedeutungen der deskriptiven Konstanten beträchtlich erleichtert. Aber die Modaloperatoren bringen auch Schwierigkeiten mit sich! Der t-Ausdruck (75a), nach dem 4 notwendigerweise kleiner als 9 ist, sollte sicherlich wahr sein. Ferner ist (75b) faktisch wahr: Die Sonne hat neun große Planeten. Nach der Schlußregel Sub (54) sollte sich daher (75c) als ebenfalls wahr erweisen. (75a) 첸[100 ⱕ 1001 ∧ 100 ⫽ 1001] (75b) 1001 ⫽ Carx[Pla(x, 䉺) ∧ ÿ Aoi(x)] (75c) 첸[100 ⱕ Carx[Pla(x, 䉺) ∧ ÿAoi(x)] 100 ⫽ Carx[Pla(x, 䉺) ∧ ÿAoi(x)]] Mit (75c) wird jedoch gesagt, daß notwendigerweise die Anzahl der großen Planeten unseres Sonnensystems größer als 4 ist; und das ist sicherlich falsch. Dieses Beispiel für SubVersagen ist die L(AL)-Adaption eines berühmten Arguments von Quine (1960: 195⫺ 200) gegen die Modaloperatoren. Daß Sub nach Modaloperatoren versagt, wertet Quine als Indiz dafür, daß sich keine kohärente Semantik für sie angeben läßt (oder weniger vornehm: daß sie Unfug sind). Tritt ein e-Ausdruck j (gleich welcher Sorte: k, r oder o) in einem t-Ausdruck z in einem solchen syntaktischen Kontext (…j---) auf, in dem er gegen jedes f, für das f ⫽ j wahr ist, ohne Veränderung des Wahrheitswertes ausgetauscht werden darf (wenn also …f--- denselben Wahrheitswert wie …j--hat), so nennt man den Kontext „extensional“, andernfalls „nicht-extensional“. Das Sub-Versagen in (75) zeigt, daß die Vorkommnisse von „1001“ in (75a) nicht-extensional sind, d. h.: in nicht-extensionalen Kontexten stehen (für weitere diagnostische Kriterien für Nicht-Extensionalität vgl. Zalta 1988: 3⫺10). ⫺ Entsprechende Begriffe der Extensionalität bzw. nicht-Extensionalität lassen sich auch für andere als e-Ausdrücke definieren. Man erinnere sich, daß im wahrheitstheoretischen Ansatz (s. o. § 2. und § 3.) die Anforderung, daß f ⫽ j für einen zu testenden Substituenden wahr sein soll, darauf hinausläuft, daß f dasselbe Referenzobjekt haben soll wie j. Für t-Ausdrücke übernimmt
I. Systematik
also bei Bestimmung extensionaler Ausdrücke „↔“ die Rolle von „⫽“, denn mit dem Bisubjunktor wird Wahrheitswertgleichheit ausgedrückt. Daß zum Beispiel (76a) wahr, (76c) aber falsch ist, obwohl wegen der Wahrheit von (76b) wahrheitswertgleiche Ausdrücke gegeneinander ausgetauscht werden, zeigt, daß t-Ausdrücke nach 첸 nicht-extensionale Vorkommnisse haben. (76a) 첸[1001 ⫽ 1001] (76b) [1001 ⫽ 1001 ↔ Sat(y, ª)] (76c) 첸[Sat(y, ª)] Entsprechend muß das Testkriterium für nicht-extensionales Vorkommen eines Prädikators sein, daß er nicht ohne Veränderung des Wahrheitswertes gegen einen Prädikator ausgetauscht werden kann, der dasselbe Attribut bestimmt. In (24) ist zum Beispiel angegeben, was Attributsidentität im Falle einstelliger Attribute heißt. Generell kann man sagen, daß Attribute, die dasselbe Zuordnungsverhalten zeigen, also denselben Argumenten dieselben Werte zuweisen, gleich sind. 5.1.3. Die Methode der Extension und Intension Für das Versagen von Sub in (75) gibt es eine ganze Reihe miteinander konkurrierender Erklärungsversuche. Die Mehrheitsmeinung der Semantiker folgt aber wohl in der ein oder anderen Weise Carnaps Methode der Extension und Intension, die er in seinem bahnbrechenden Buch Meaning and Necessity (1947: Kap. 1) entwickelt hat. (Fregeschen Prinzipien folgen hingegen z. B. Church 1951, 1973 und 1974 sowie Anderson 1984 und 1987b). Nach Carnaps semantischer Methode sind Kategoremata stets mit zwei semantischen Einheiten verbunden: ihren Extensionen und ihren Intensionen. Das Kompositionalitätsprinzip, aus dem sich die Gültigkeit von Ersetzungsprinzipien wie zum Beispiel Sub zwingend ergibt, wird mit Rücksicht auf diese semantische Bipolarität abgeschwächt: Die Extension eines Ausdrucks ist eine Funktion der Extensionen der in ihm extensional und der Intensionen der in ihm nicht-extensional, also intensional vorkommenden Teilausdrücke. (Dies bedarf noch einer Modifikation, s. u. § 5.3.3., da es Informationsmittel gibt, in denen einige Kontexte nicht-extensional und nicht-intensional sind.) Diese Fassung des (Quasi-)Kompositionalitätsprinzips ermöglicht es auch, semantische Einheiten für die Rolle der Extensionen und die der Intensionen namhaft zu machen. Das, was in
133
3. Semantik
extensionalen Kontexten ohne Wahrheitswertbeeinträchtigungen gegeneinander austauschbare Ausdrücke gemein haben, ist ⫺ je nach Kategorie ⫺ ihr Wahrheitswert, ihr Bezugsobjekt, das von ihnen bestimmte Attribut. Also kann man als Extensionen für tAusdrücke ihre Wahrheitswerte, für e-Ausdrücke ihre Bezugsobjekte und für Prädikatoren die von ihnen bestimmten Attribute nehmen. Man beachte Carnaps Vorgehen: Er geht von einer Klassifikation syntaktischer Kontexte aufgrund der für sie geltenden Ersetzungsmöglichkeiten aus und motiviert die Wahl seiner semantischen Einheiten aufgrund dieser Klassifikation. Um mit Hilfe des modifizierten Kompositionalitätsprinzips Intensionen für Ausdrücke z auffinden zu können, muß man zunächst ermitteln, durch welche anderen Ausdrücke j intensionale Vorkommnisse von z ohne Wahrheitswertbeeinträchtigung ersetzt werden dürfen. Die Beispiele (75) und (76) zeigen, daß die bloße faktische Wahrheit der objektsprachlichen Ausdrücke x, mit denen Designatgleichheit von z und j behauptet wird (also: [z ↔ j] für tAusdrücke, z ⫽ j für e-Ausdrücke und f1 f2 … fn [z(f1, f2, …, fn ) ↔ j(f1, f2, …, fn )] für n-stellige Prädikatoren) nicht hinreichen. Wenn sich die Wahrheit eines solchen x aber allein aus dem semantischen System des Informationsmittels ergibt und nicht von empirischen Fakten abhängig ist, so ist eine Ersetzung von z durch j auch in intensionalen Kontexten möglich. So ergibt sich beispielsweise aus der semantischen Erklärung der Ziffern und der arithmetischen Notation, daß in L(AL) (77a) und (77b) wahr sind, und „10 · 10“ läßt sich in (75a) für „100“ und „1000 ⫽ 1000“ in (76a) für „1001 ⫽ 1001“ ohne Beeinträchtigung des Wahrheitswertes einsetzen. (77a) 10 · 10 ⫽ 100 (77b) [1001 ⫽ 1001 ↔ 1000 ⫽ 1000] Es gilt sogar mehr als bloße Wahrheitswertinvarianz: daß Ausgangspunkt und Ergebnis der Ersetzung denselben Wahrheitswert besitzen, folgt wieder aus dem semantischen System. Dieselben Intensionen haben also Ausdrücke z und j dann, wenn sich die Wahrheit der Behauptung x ihrer Designatsgleichheit aus dem semantischen System ergibt. Anknüpfend an die Bedeutungstheorien Freges und Russells schlägt Carnap (1947: § 4.⫺6.) eine Festsetzung der verschiedenen Intensionsarten mit einer entsprechenden Termi-
nologie vor, die beide zum allgemeingebräuchlichen Standard (auch im Rahmen nicht-Carnapscher Bedeutungstheorien) geworden ist: Die Intension eines t-Ausdrucks ist eine Proposition; referierende Ausdrücke (e-Ausdrücke der verschiedenen Sorten) haben Individuenkonzepte als Intensionen, die Intension eines einstelligen Prädikators ist eine Eigenschaft, die eines m-stelligen Prädikators eine m-stellige Beziehung. Mit diesen Intensionsbestimmungen soll an ein intuitives Vorverständnis angeknüpft werden, das durch die theoretische Identifikation von Propositionen (⫽ Satzbedeutungen) mit Intensionen von t-Ausdrücken, von Eigenschaften mit Intensionen einstelliger und von Beziehungen mit Intensionen mehrstelliger Prädikatoren vertieft werden soll. Man hat schon eine ungefähre Vorstellung von Propositionen, Eigenschaften und Beziehungen; diese Vorstellung soll dann gegebenenfalls so modifiziert und präzisiert werden, daß diese semantischen Einheiten in dem gerade erläuterten Zusammenhang mit den Ersetzbarkeitseigenschaften bestimmter Ausdrücke stehen. Aus der Rolle fallen hier, wie Carnap (1947⫽ 2 1956: 41) selbst einräumt, die Individuenkonzepte. Der Begriff des Individuenkonzepts ist offensichtlich rein technischer Natur (und einigen Semantikern suspekt, vgl. § 5.2.). In der Carnapschen Version der wahrheitstheoretischen (d. h.: nicht-modellrelativen) Semantik hat man es also mit zwei Typen von Designationsbeziehungen zu tun: Dese(z) ist die Extension, Desi(z) die Intension von z (s. Carnap 1972: 13). Diese beiden Einheiten sind so miteinander korreliert, wie es (78) zeigt. (Carnap benutzt statt der Attribute allerdings die Klassen, deren charakteristische Funktionen die Attribute in einer mengentheoretischen Attributskonzeption, s. o. § 3.4., sind.) Man sagt, daß z seine Intension Desi(z) ausdrücke und seine Extension Dese(z) designiere oder bezeichne. (78) Ein Ausdruck z der Kategorie t
ex
hat als Intension Desi(z) eine Proposition P ein Individuenkonzept i
und als Extension Dese(z) einen Wahrheitswert d (⫽ W oder F) einen Gegenstand g
134
I. Systematik
ex(t)
eine Eigenschaft Q
ex1 … exn(t)
eine n-stellige Beziehung R
ein 1-stelliges Attribut a1 ein n-stelliges Attribut an
(Die Indizes an den e-Vorkommnissen in (78) deuten an, daß der Gegenstandstyp wie in L(AL) in mehrere Sorten subklassifiziert sein kann. Man vergleiche das Schema (78) mit dem der Abb. 3.4!) 5.1.4. Intensionen als Extensionsbestimmer: die Mögliche-Welten-Analyse (MWA) Eine eingehendere Analyse der von Carnap angenommenen semantischen Einheiten ist erst am Ende der 50er und zu Beginn der 60er Jahre aufgrund der Bemühungen von Kanger (1957), Montague (1960), Kripke (1963) und Hintikka (1963) gelungen, obwohl sich Ansätze in der von diesen Autoren verfolgten Richtung schon früher finden; man vergleiche etwa Oskar Beckers (1952: 16⫺36) statistische Deutung des Modalkalküls und Carnaps (1972: 46⫺48) Theorie der Quasi-Intensionen (die 1972 veröffentlichen „Notes“ sind etwa 1955 verfaßt worden). Die von den angeführten (und weiteren, insbesondere wären hier noch David Lewis und David Kaplan zu nennen) Autoren begründete Richtung der Semantikforschung wird nach einem Zentralbegriff dieses Ansatzes „Mögliche-Welten-Semantik“ genannt. Die Mögliche-Welten-Analyse intensionaler semantischer Einheiten (im folgenden kurz: MWA) verbindet Carnaps Methode der Extension und Intension mit einem Aspekt der Fregeschen Bedeutungstheorie: daß nämlich der Sinn eines Ausdrucks dessen Bedeutung festlegt. Die Möglichkeit einer solchen Kombination hat bereits Carnap (1947 ⫽ 21956: 181) selbst gesehen. Der Sinn eines Ausdrucks ist die „Art des Gegebenseins“ (Frege 1892: 26) seiner Bedeutung. In der MWA werden die Intensionen in Analogie zu den Fregeschen Sinnen als Bestimmer von Extensionen (als Entsprechungen Fregescher Bedeutungen) gesehen. (Trotz der Ähnlichkeit der beiden Schemata (78) und Abb. 3.4 funktioniert die Fregesche Semantik in grundsätzlich anderer Weise als die Methode der Extension und Intension; dazu vergleiche man die zu Beginn von § 5.1.3. angeführten Arbeiten von Anderson und Church. Was das Verhältnis zwischen Intension und Extension anbelangt, so handelt es sich hier nach Carnaps (1947 ⫽ 21956: § 21.⫺23. und
Kap. IV) eigenem Verständnis nicht um eine Unterscheidung zweier Entitätsarten, sondern eher um zwei Arten, sich metasprachlich auszudrücken.) Die MWA läßt sich am Beispiel der Propositionen etwa folgendermaßen verdeutlichen: Daß eine Proposition ⫺ etwa die, daß die Anzahl der großen Planeten unseres Sonnensystems 9 beträgt ⫺ einen bestimmten Wahrheitswert hat ⫺ nämlich: W ⫺, liegt an den Fakten, so wie sie nun einmal sind. Wären die Fakten anders, trüge diese Proposition einen anderen Wahrheitswert, und (75b) wäre dann falsch. Es lassen sich also für Propositionen funktionale Abhängigkeiten zwischen einschlägigen Fakten und den von den Propositionen festgelegten Wahrheitswerten feststellen: Wenn die Faktenlage „so und so ist“, hat die Proposition „den und den“ Wahrheitswert. Warum also nicht gleich diese funktionalen Abhängigkeiten mit den Propositionen identifizieren? Man braucht nicht einmal die jeweils relevanten Fakten für die einzelnen Propositionen genauer zu beschreiben, wenn man annimmt, daß sie jeweils Ausschnitte aus möglichen Gesamtsachlagen sind. Statt der speziellen Ausschnitte kann man dann für alle Propositionen einheitlich diese Gesamtsachlagen betrachten. Eine solche Gesamtsachlage ist eben eine mögliche Welt. Ihrer Konzeption nach weist also die Mögliche-Welten-Semantik einen Hang zum Totalen auf, obwohl einige Semantiker dieser Richtung ihre möglichen Welten als „small worlds“ konzipieren, die nicht Gesamtuniversen, sondern lediglich Weltausschnitte sein sollen. (Der Hang zum Totalen und die damit verbundene Elimination lokaler Fakten sind Hauptkritikpunkte der Situationssemantik, s. u. § 8., an der Mögliche-Welten-Semantik.) Die Erklärung der Modelle als möglicher Designatsverteilungen, s. o. § 4.2., suggeriert es, sie mit möglichen Welten zu identifizieren. Diese Idee liegt Carnaps (1972: 46⫺48) Theorie der Quasi-Intensionen zugrunde und ist unter anderem von Kaplan (1964: 63⫺66) benutzt worden. Auf Schwierigkeiten dieses Vorgehens bei der Analyse iterierter Einstellungsaussagen (s. u. § 5.3.3.) verweist Montague (1969: 164). Trotz dieser Bedenken Montagues hat Przełe˛cki (1980: 118) aufgrund philosophischer Skrupel hinsichtlich des Begriffs der möglichen Welt Carnaps Vorschlag erneuert. Er ermögliche die Elimination eines bedenklichen Konzepts zugunsten eines einwandfreien mengentheoretischen Konstrukts.
Eine Proposition P ist also in der MWA eine Funktion, die möglichen Welten w als ihren Argumenten jeweils Wahrheitswerte P(w)
135
3. Semantik
(⫽ W oder F) als Funktionswerte zuweist. Ein Individuenkonzept i ist eine Funktion, die jeder Welt w einen Gegenstand i(w) zuordnet. P(w) ist der Wahrheitswert, den P hätte, wenn die obwaltenden Umstände w wären; i(w) ist der Gegenstand, den i unter diesen Umständen bestimmt hätte. (Der Fall der Eigenschaften und Beziehungen wird in § 5.1.7. genauer behandelt.) Nun kann man in zweierlei Weise von solchen Erklärungen Gebrauch machen: (i) Eine Richtung der Mögliche-Welten-Semantik, für die insbesondere D. Lewis (z. B. 1986: 40⫺50) eintritt, nimmt den Begriff der möglichen Welt beim Wort. Intensionale semantische Einheiten sind (mengentheoretische) Konstrukte aus möglichen Welten, Gegenständen und Wahrheitswerten. (ii) Für eine andere Richtung ist die Einstellung Guptas (1980: 17 f) charakteristisch. Er konstatiert zunächst, daß es einer logisch-semantischen Analyse um die Folgebeziehungen zwischen und die Allgemeingültigkeit von Ausdrücken gehe, und stellt dann weiter fest, daß es für eine Analyse mit diesen Zwecken hinreiche, die Intensionen der zu analysierenden Ausdrücke durch solche Funktionen zu repräsentieren, wie sie die MWA vorsieht. Die Intensionen sind natürlich nicht mit diesen Repräsentationen identisch, aber „[t]heir representations suffice“ (Gupta 1980: 18). 5.1.5. Modelle für L(AL) Hier soll der zweiten Konzeption gefolgt werden und für L(AL) ein System S5 angegeben werden, das auf dem Schlüsselbegriff der Folge beruht. Die Beziehung 储– der logischen Folge wird wieder mit Hilfe des Modellbegriffs definiert. Dabei wird (mit einigen Modifikationen) der Vorgehensweise von Bressan (1972) und Parks (1976) gefolgt. ⫺ Modelle I für L(AL) haben entsprechend der Anzahl der Basistypen drei Gegenstandsbereiche Ek, Er und Eo. E sei jeweils die Folge dieser drei Bereiche: E ⫽ *Ek, Er, Eo+. Weiter ist für ein Modell I für L(AL) die Klasse U der zugrunde gelegten möglichen Welten anzugeben. Statt Modelldesignate wie in (35) müssen nun in Abhängigkeit von U und E Modellintensionen festgelegt werden. (Bressan und Carnap sprechen von „Quasi-Intensionen“, um den technischen Charakter dieser Einheiten zu betonen.) (79) Ist U eine nicht-leere Menge, E ⫽ *Ek, Er, Eo+ ein Tripel nicht-leerer Mengen, so ist ein auf U und E gegründetes Sy-
stem von Modellintensionen eine Familie von Mengen Intt, U, E (t Typ von L(LA)), für deren Elemente folgendes gilt: (79a) Ist t ⫽ t, so ist Intt, U, E ⫽ {W, F}U. (79b) Falls t ⫽ ex (x ⫽ k, r oder o), so ist jedes Element von Intt, U, E eine Funktion aus ExU (Intt, U, E 債 ExU ). (79c) Für t ⫽ t1 … tm (t0 ) ist Intt, U, E ⫽ Intt0, U, E(Intt , U, E ⫻ … ⫻ Intt , U, E). (Dies umfaßt auch den Spezialfall der Typen 2. Stufe; für sie ist m ⫽ 1, t1 ⫽ t1⬘(t1⬙), und t1⬘, t1⬙ und t0 sind Basistypen.) 1
m
In (79a) werden die Modellpropositionen (über E und U) und in (79b) die Modellindividuenkonzepte (über E und U) festgelegt. Nach (79b) muß Intex, U, E keinesfalls sämtliche Funktionen aus ExU (x ⫽ k, r oder o) umfassen. Dies ist durch folgende Überlegung motiviert: Vielleicht sollte man an ein ordentliches Individuenkonzept (bzw. an dessen Repräsentanten) weitergehende Anforderungen stellen als bloß die, zu ExU (x ⫽ k, r oder o) zu gehören. Sei etwa i Individuenkonzept eines Planeten, und seien weiter w1 und w2 mögliche Welten! Vielleicht müssen die Gegenstände i(w1 ) und i(w2 ) eine gewisse Ähnlichkeit hinsichtlich Masse, Umlaufzeit, Satellitenzahl usw. aufweisen, damit sie zum Wertebereich desselben Individuenkonzepts i gehören können. Das Problem, unter welchen Bedingungen Gegenstände Werte desselben Individuenkonzepts sein können bzw. ob es solche Bedingungen überhaupt gibt, ist als Problem der Querwelteinidentifikation (vgl. z. B. Kaplan 1975 und 1979) bekannt. Dabei ist sogar umstritten, ob hier ein wirkliches Problem oder nur ein Scheinproblem vorliegt, das sich bloß als Artefakt des technischen Apparats der MWA ergibt. Existieren aber tatsächlich einschränkende Bedingungen zulässiger Querwelteinidentifikationen, so bilden die diesen Bedingungen genügenden Individuenkonzepte eine Teilmenge Intex, U, E (x ⫽ k, r oder o) von ExU. Gibt es keine solchen Bedingungen, so ist Intex, U, E ⫽ ExU. Beide Möglichkeiten läßt (79b) zu. Die Bedingungen, die ein System von Intensionsbereichen an korrekte Querwelteinidentifikationen gegebenenfalls stellt, sind durch Angabe von U, E und D ⫽ *Intek, U, E, Inter, U, E, Inteo, U, E eindeutig festgelegt: U und E bestimmen, was überhaupt möglich, und D
136 legt fest, was hiervon erlaubt ist. Die Intensionsbereiche der Funktionstypen ermittelt man aufgrund von D nach (79c). Parks (1976: 114⫺116) folgend bestimme ich daher Modelle für L(AL) als Strukturen I ⫽ *U, E, D, G+, in denen E ⫽ *Ek, Er, Eo+ jeweils Dreierfolge nicht-leerer Mengen und D ⫽ *Dk, Dr, Do+ ein Tripel von Funktionsmengen ist, wobei die Funktionen aus Dx jeweils zu ExU (x ⫽ k, r oder o) gehören. Die Modellfunktion G eines Modells I gibt für jede Konstante z des Typs t ein Element j ⫽ G(z) aus dem durch U, E und D bestimmten Bereich Intt, U,E als Modellintension von z an. Dabei wird für die drei Identitätsrelatoren jx so verfahren: Für P ⫽ G(jx ) (i1, i2 ) und w aus U gilt genau dann P(w) ⫽ W, wenn i1(w) ⫽ i2(w). Mit anderen Worten: Die Identitätsproposition P ist in der möglichen Welt w genau dann wahr, wenn die Individuenkonzepte i1 und i2 in w denselben Gegenstand bestimmen. Nun muß aber noch für die Variablen gesorgt werden. In bezug auf ein Modell I ⫽ *U, E, D, G+ mit D ⫽ *Dk, Dr, Do+ ist eine I-Belegung f jetzt eine Funktion, die genau für Ausdrücke j der drei Variablenkategorien definiert ist und ein j aus vx mit einem i aus Dx (x ⫽ k, r oder o) belegt. Sei nun I ⫽ *U, E, D, G+ ein Modell für L(AL), f eine I-Belegung, dann ist 储z储If die Modellintension des Ausdrucks z im Modell I unter der Belegung f. Die Intensionszuweisung 储 储 für L(AL) definieren wir im selben Stil wie die Designatszuweisung 储 储 für L(G) (s. o. (39)). Da Intensionen Zuordnungen sind, benutzen wir zu ihrer Beschreibung wieder die bequeme, informale l-Notation. Die Funktion 储 储 für L(AL) ist die modelltheoretische Entsprechung zu Desi, s. o. § 5.1.3. (80a) Ist z eine Konstante der Liste (72), so ist 储z储If ⫽ G(z); wenn z eine Variable ist, so gilt 储z储If ⫽ f(z). (80b) Ist f ⫽ z(j1, …, jn ) ein nach R7, n gebildeter t- oder ein ex-Ausdruck (x ⫽ k, r oder o) gemäß R15, m, Rc1 oder Rc2, so ist 储f储If ⫽ 储z储If (储j1储If , …, 储zn储If ). (80c) Für ein nach R8 gebildetes f ⫽ ÿz ist 储 f储If ⫽ (lw苸U) [储z储If (w)]. (80d) Ist f nach einer der Regeln R9, …, R12 gebildet und hat es dementsprechend eine der folgenden Gestalten: [j ∧ j], [z ∨ j] [z → j], [z ↔ j], so ist 储f储If respektive (lw 苸 U)[储z储If 储j储If ], I I (lw 苸 U)[储z储f 储j储f ], (lw 苸 U)[储z储If ⱷ 储j储If ], (lw苸U)[储z储If ⫼ 储j储If ].
I. Systematik
(80e) Ist f ⫽ xjz nach R18x gebildet (und somit j aus vx, x ⫽ k, r oder o), so ist 储 f储If ⫽ 储x储If ((li苸Dx )[储z储If *ji +]). (80f) Ist f nach R13, x oder R14, x (x ⫽ k, r oder o) gebildet und hat es dement sprechend die Gestalt jz oder jz, so I ist 储f储f respektive (lw苸U)[ {储z储If *j+(w) | i aus Dx}], bzw. i (lw苸U)[ {储z储If *ji +(w) | i aus Dx}]. (80g) Ist f gemäß R16 oder R17 gebildet und hat es entsprechend die Gestalt 첸z oder 앳z, so ist 储f储If gleich (lw苸U) [ {储z储If (u) | u aus U}], bzw. (lw苸U) [ {储z储If (u) | u aus U}]. Die Modellextension 储z储Ifw von z in der möglichen Welt w des Modells J ⫽ *U, E, D, G+ unter der Belegung f ist der Wert der Modellintension 储z储If für das Argument w: 储z储Ifw ⫽ 储 z储If (w). Anhand von (80g) erkennt man, daß die Modellextensionen von 첸z und 앳z von der Modellintension P von z abhängt: Genau dann wenn P jeder möglichen Welt u W zuordnet, ist die Modellextension von 첸z (in einer beliebigen Welt) W, und die von 앳z (in einer beliebigen Welt) ist W, falls P mindestens einmal den Wert W annimmt. Ein Vergleich von (80f) und (80g) zeigt, daß 첸 wie ein Allquantor und 앳 wie ein Existenzquantor wirkt: Wie „ “ und „ “ über Individuenkonzepte (nicht über Individuen!) quantifizieren, so quantifizieren 첸 und 앳 über mögliche Welten. ⫺ Ein t-Ausdruck z ist wahr unter der Belegung f in der möglichen Welt w des Modells I, wenn 储z储Ifw ⫽ W ist; dafür soll auch „I储— z“ geschrieben werden. Ist G eine fw Klasse von t-Ausdrücken und j ein t-Ausdruck, so folgt j aus G, d. h. G 储– j, falls I储— j für jedes Modell I, jede I-Belegung f fw und jede Welt w von I gilt, für die für sämtliche z aus G auch I储— z ist. Damit ist der fw Schlüsselbegriff für L(AL) definiert. Aus den angegebenen Definitionen ergibt sich auch keineswegs, daß (75a), (75b) 储– (75c)! Repräsentiere etwa r die wirkliche Welt im Modell I. Wenn die Modellfunktion G von I die Konstanten von (72) im Einklang mit den dort eingeklammerten Hinweisen interpretiert, gilt I储— (75a) (für alle Welten w fw von I und Belegungen f) und I储— (75b) fr ebenfalls für alle f). Der Ausdruck (75c) besagt nun aber, daß in jeder Welt w von I die Anzahl der großen Planeten vier übersteigt; vgl. (80g). Sei P ⫽ 储(75b)储If , dann ist durch I储— (75b) lediglich gesichert, daß P(r) ⫽ W; fr aber es kann durchaus Welten u in I geben, für die P(u) ⫽ F ist. ⫺ Um zwei e-Ausdrücke
3. Semantik
j und f in jedem Kontext gegeneinander austauschen zu können, genügt es nicht, daß in nur einer Welt u (sei dies auch die tatsächliche) I储— j ⫽ f (für jedes f) gilt; vielmehr fu muß in jeder Welt w (unter jedem f) I储— j⫽ fw f gelten. Nach (80g) läuft dies aber darauf hinaus, daß 첸[j ⫽ f] in jeder Welt w von I unter jeder Belegung f wahr ist. Entsprechend müßte man also in der Regel Sub von (54) die rechte obere Prämisse verschärfen; vgl. Bressan (1972: 43⫺44). 5.1.6. A-Postulate für L(AL) Will man für S5 durch eine Interpretationseinschränkung, die mit Hilfe von A-Postulaten bestimmt ist, eine analytische Folgebeziehung a储– definieren (vgl. oben § 4.1.2.), so hat man zu beachten, daß A-Postulate nun nicht mehr nur die Modellfunktionen G, sondern auch die Universen U möglicher Welten in Modellen beschränken. Daß etwa aufgrund der Bedeutung von „Aoi“ und der von „Ste“ (74a) wahr ist, heißt, daß es keine mögliche Welt geben kann, in der ein Asteroid nicht Himmelskörper wäre. Dies fordert man durch die Nezessitierung von (74a); s. (81). (81) 첸 x[Aoi(x) → Ste(x)] Nach den Hinweisen von (72) sollen zum Beispiel die Car-Operatoren zum Zählen von Körpern (z. B.: wieviele Satelliten hat ein Planet), von Zahlen (z. B. als Zeitmaßen, etwa: für wieviele Zeiten eines Intervalls ist der Abstand zweier Planeten minimal) und von Örtern (z. B.: wieviele Brennpunkte hat eine Planetenbahn) verwendet werden. Diese Bedeutungsfestlegung wird in (80e) aber nicht berücksichtigt und muß durch A-Postulate eingefordert werden. Plausible Kandidaten für A-Postulate, die den Umgang mit den Car-Operatoren regeln, gibt (82) an. (82a) 첸 y[Nat(y) → y ⫹ 1 ⫽ Cary1[Nat(y1 ) ∧ y1 ⱕ y]] (82b) 첸[0 ⫽ Caryz ↔ ÿ yz] (82c) 첸 y[Nat(y) → [[ j[z(j) → 1 ⫽ Car y1[f(j, y1) ∧ [Nat(y1) ∧ y1 ⱕ y]]] ∧ y2[[Nat(y2) ∧ y2 ⱕ y] → 1 ⫽ Carj[z(j) ∧ f(j, y2)]]] → y ⫹ 1 ⫽ Cary3z(y3)]] Nach (82a) gibt eine natürliche Zahl die Anzahl ihrer Vorgänger an: Die Null hat keinen Vorgänger, die Eins hat einen (nämlich 0), die Zwei zwei (0 und 1) usw. Genau dann ist Carjz gleich 0, wenn es keine zs gibt; vgl. (82b). Das komplizierte Postulat (82c) beschreibt die Verwendung der natürlichen
137 Zahlen beim Zählen: Wenn sich durch f die zs den natürlichen Zahlen von 0 bis y eineindeutig zuordnen lassen, so beträgt die Anzahl der zs eben y ⫹ 1. Manchmal gibt es mehr zs als natürliche Zahlen; dann kann man ⫺1 als Ersatzzahl für Carjz nehmen; s. (82d). (82d) 첸[ y[Nat(y) ∧ y ⫽ Carjz] ∨ 0 ⫽ 1 ⫹ Carjz] Ebenso wie für Car müßten für die binäre Ziffernnotation A-Postulate aufgestellt werden, die Ziffern mit den Rechenzeichen „⫹“, „·“ und „Exp“ in Verbindung brächten. Für den Operator „Sup“ sind die A-Postulate nach Schema (83) angebracht. (83) 첸 y1[y1 ⫽ Supy2z(y2 ) ↔ [ y2[z(y 2 ) → y2 ⱕ y1] ∧ y3[ y2[z(y2 ) → y2 ⱕ y3] → y1 ⱕ y3]]] Die in § 4.4.2. erwähnten Probleme, die die A-Postulate aufwerfen, ergeben sich auch für L(AL). Liefert zum Beispiel das nezessitierte Schema (84) für die Vollständigkeitsaxiome A-Postulate oder die Formulierungen notwendiger Gestzmäßigkeiten über die reellen Zahlen, die sich keinesfalls aus den Bedeutungsfestsetzungen der in (84) vorkommenden Ausdrücke ergeben? Von den Instanzen des Schemas (83) scheint sich weit eher sagen zu lassen, daß ihre Gültigkeit auf der Bedeutung von „Sup“ beruhe, als von den Instanzen von (84). Mit (83) wird zwar keine explikative Definition (s. o. § 4.5.) des Operators „Sup“ geliefert, aber gewissermaßen wird jeder Einzelfall der Anwendung dieses Operators definitorisch erklärt. (84) 첸[ y y1[z(y1) → y1 ⱕ y] → y[y ⫽ Supy1z(y1)]] Aufgrund der Verfügbarkeit der Modaloperatoren in L(AL) stellt sich das Problem der A-Postulate sogar in noch verschärfter Form, denn 첸 scheint es ja zu ermöglichen, Analytizität von z objektsprachlich durch 첸z auszudrücken (wenn die Klasse M aller L(AL)-Modelle durch A-Postulate auf eine Klasse A eingeschränkt wird; bezogen auf das gesamte M würde 첸 logische Wahrheit ausdrücken). Eine semantisch adäquate Erfassung von 첸 verlangt also geradezu, genau anzugeben, was analytisch ist und was nicht. Aber drückt 첸z wirklich Analytizität aus? Alle Erläuterungen zum semantischen System S5 scheinen darauf hinauszulaufen; und eine positive Antwort motiviert auch das Vorgehen vieler Semantiker, die ihre A-Postulate mit Hilfe
138 von 첸 formulieren. Es sei aber darauf hingewiesen, daß eine solche Deutung von 첸 (wenn man zugleich an der Festsetzung (80g) festhält) durchaus nicht in jeder Hinsicht plausibel ist; vgl. Suszko (1975: 206⫺210). 5.1.7. Eigenschaften und Beziehungen in L(AL) Die Modellintension P eines t-Ausdrucks z von L(AL) in I ist eine Proposition im Sinne der MWA, und die Modellextension P(w) von z in der Welt w von I ist in Übereinstimmung mit (78) ein Wahrheitswert. Ebenso ist die Modellintension eines e-Ausdrucks j in I ein Individuenkonzept i im Sinne der MWA und die Modellextension i(w) von j in der möglichen Welt w von I ist in Übereinstimmung mit (78) ein Gegenstand. Für die Kategorien t und ex (x ⫽ k, r oder o) ergeben sich in S5 also die modelltheoretischen Entsprechungen des Carnapschen Schemas (78). In S5 sind die modelltheoretischen Repräsentanten der Intensionen prädikativer Ausdrücke ⫺ im Sinne von (78) also: der Eigenschaften und Beziehungen ⫺ Funktionen, die Folgen von Individuenkonzepten (bzw. einem solchen Konzept im Falle einer Eigenschaft) Propositionen zuordnen. Prädikative (Modell-)Intensionen dieser Art nennt Lewis (1970: 28) „kompositional“, da sie, wie die Klauseln von (80) zeigen, dem Kompositionalitätsprinzip, insofern es die Zuweisung von Intensionen reglementiert, stromlinienförmig angepaßt sind (vgl. auch Scott 1970a: 154⫺156). Ist Q eine solche (Modell-)Intension für den Prädikator x, so läßt sich allerdings die (Modell-)Extension von x in der möglichen Welt w nicht mehr wie im Falle der Basiskategorien als Anwendung von Q auf w definieren, denn Q ist ja gar nicht für mögliche Welten als Argumente bestimmt. Beharrt man darauf, daß die Extensionen prädikativer Ausdrücke Attribute sind, stehen die kompositionalen Intensionen in Spannung zur Konzeption, nach der Intensionen Extensionsbestimmer sind. In der intensionalen Semantik werden häufig (so auch unten in § 5.2.) statt der kompositionalen sogenannten „Carnap-Intensionen“ (s. Lewis 1970: 23) verwendet: Eine n-stellige CarnapIntension C ist eine Funktion, die möglichen Welten w n-stellige Attribute aw zuweist; aw(g1, … gn ) ⫽ W gilt dabei genau dann, wenn g1, …, gn in der Welt w die Beziehung C zueinander haben. So wäre etwa die CarnapIntension für „Pla“ eine Funktion, die jeder Welt w das Attribut aw, Pla zuweist, für wel-
I. Systematik
ches aw, Pla(g1, g2 ) ⫽ W genau dann gilt, wenn g1 in w Planet von g2 ist. Wie man an diesem Beispiel sieht, sind Carnap-Intensionen nur dann adäquat, wenn die einem prädikativen Grundausdruck folgenden Positionen für e-Ausdrücke extensional sind. Intensionale Prädikationen können mit Carnap-Intensionen nicht analysiert werden. In L(AL) sollte man durch A-Postulate dafür sorgen, daß Prädikation von „Rea“ intensional ist. Mit anderen Worten: „Rea“ wird nicht einfach von Individuen ausgesagt (s. o. (21)), sondern von konzeptualisierten Gegenständen ⫺ eben Individuenkonzepten. Reelle Zahlen sind ja logisch-mathematische Gegenstände und als solche sich in jeder Welt gleich. Dies hat zweierlei Konsequenzen: wenn i1 und i2 Konzepte reeller Zahlen sind, so sollte i1(w) ⫽ i2(w) für jede Welt w gelten, falls es überhaupt Welten u mit i1(u) ⫽ i2(u) gibt. Reelle Zahlen müssen einander gleich sein, wenn sie einander gleich sein können; s. (85). (85) y1 y2[[[Rea(y1 ) ∧ Rea(y2 )] ∧ 앳y1 ⫽ y2] → 첸y1 ⫽ y2] Die Intension von „Rea“ ist eine Eigenschaft sehr spezieller Art: Bestimmen Individuenkonzepte i und i' etwas mit dieser Eigenschaft, so bestimmen i und i' in jeder Welt dasselbe. Eigenschaften dieser Art nennt Bressan (1972: 66) „modal separiert“ („modally separated“). ⫺ Die zweite Konsequenz, die sich aus dem logisch-mathematischen Wesen reeller Zahlen ergibt, ist die Weltinvarianz ihres Bestandes. Die Sonne kann zum Beispiel in einer Welt neun große Planeten, in einer anderen nur sieben haben; aber der Bestand reeller Zahlen muß in allen Welten derselbe sein. Dies läuft auf (86) als A-Postulat hinaus. (86) y1[앳Rea(y1 ) → 첸Rea(y1 )] Eine Eigenschaft, die wie die Intension von „Rea“ in jeder Welt auf die durch dieselben Individuenkonzepte bestimmten Gegenstände zutrifft, wird von Bressan (1972: 49) als „modal konstant“ („modally constant“) bezeichnet. Modal separierte Eigenschaften, die zugleich modal konstant sind, heißen „absolut“ (Bressan 1971: 67). Eine reelle Zahl zu sein, ist also eine absolute Eigenschaft. Die Eigenschaft, Planet der Sonne zu sein, ist hingegen nicht absolut. Nun ist die Anzahl der Planeten notwendigerweise eine reelle Zahl (natürliche Zahlen werden ja in S5 als Spezialfälle reeller Zahlen
3. Semantik
angesehen). Aber in manchen Welten beträgt sie Sieben, in manchen Neun! Die Intension von „Carx[Pla(x, 䉺) ∧ ÿAoi(x)]“ kann also nicht zur absoluten Intension von „Rea“ gehören, was dem zu widersprechen scheint, daß die Anzahl der Planeten reell sein muß! Aber daß diese Anzahl notwendigerweise reell ist, darf in L(AL) auch gar nicht mit (87a), sondern muß mit (87b) wiedergegeben werden. Mit der Definition (87c) läßt sich (87b) kürzer als (87d) wiedergeben. (87a) 첸Rea(Car x[Pla(x, 䉺) ∧ ÿAoi(x)]) (87b) 첸 y[Rea(y) ∧ y ⫽ Carx[Pla(x, 䉺) ∧ ÿ Aoi(x)]] (87c) y1[Rea(e)(y1 ) def ↔ y2[Rea(y2 ) ∧ y1 ⫽ y2]] (87d) 첸Rea(e)(Carx[Pla(x, 䉺) ∧ ÿAoi(x)]) Im Gegensatz zur prädikativen Zuschreibung von „Rea“ ist die Prädikation von „Rea(e)“ extensional; die von „Rea(e)“ bedeutete Eigenschaft ist die Extensionalisierte der Eigenschaft Rea, reelle Zahl zu sein. Die Unterschiede zwischen absoluten und extensionalen Eigenschaften „[…] somehow mirror the distinction between substances and qualities“ (Bressan 1972: 89). Hier wird also eine wichtige Unterscheidung der antiken Semantik (s. Art. 40) mit formalen Mitteln rekonstruiert. Anwendungen der Bressanschen Unterscheidung zwischen extensionalen und absoluten Eigenschaften findet man in den semantischen Analysen Bacons (1978: Sec. II; Wahrnehmungsberichte) und Guptas (1980: Kap. 3⫺5; Substantivsemantik und Wahrheitstheorien für modallogische Sprachen). 5.2. Kontext, Inhalt und Charakter Nach Carnaps Methode der Extension und Intension, der S5 für L(AL) folgt, sind mit jedem kategorematischen Ausdruck zwei semantische Einheiten ⫺ seine Extension und seine Intension ⫺ verknüpft. Insbesondere für die Variablen führt die unmittelbare Umsetzung dieser Konzeption zu Schwierigkeiten, denn Variablen müßten sich dann über Belegungen eigentlich sowohl auf Gegenstände als auch auf Individuenkonzepte beziehen (vgl. Myhill 1963: 304). Das Zusammenspiel von Quantoren, Variablennotation und Modaloperatoren ist bis heute eines der Hauptprobleme der intensionalen Semantik geblieben (vgl. Garson 1984). In S5 wurde in Anschluß an Bressan (1972) eine Lösung dieses Problems eingebaut, die systematisch die Intensionen vor den Extensionen bevorzugt
139 (vgl. die Klauseln von (80)). Dabei geht S5 soweit, daß kein ex-Ausdruck (x ⫽ k, r oder o) einen Gegenstand ohne Vermittlung eines ihn fixierenden Individuenkonzepts herausgreifen kann: Es gibt in L(AL) nach S5 keine Ausdrücke, die sich ⫺ sei es durch eine Belegung f oder durch die Modellfunktion G eines Modells ⫺ direkt auf ein Element eines der Bereiche Ex (x ⫽ k, r, o) beziehen. ⫺ Was dies heißt, vergegenwärtige man sich etwa an dem folgenden Beispiel! Das, was einem bestimmt zunächst einfallen wird, wenn man sicherstellen will, daß die Eigenschaft, reelle Zahl zu sein, absolut ist, ist wohl die Forderung, daß es zu jedem Konzept i aus Dr ein x aus Er geben soll, so daß i(w) ⫽ r für alle Welten w gilt. D. h.: Konzepte reeler Zahlen sollen konstante Funktionen sein. Aber diese Forderung läßt sich in L(AL) noch nicht einmal formulieren, da es dort keine Quantoren mit einem direkten Zugriff auf die Gegenstandsbereiche Ek, Er und Eo (in L(AL)-Modellen) gibt. Man kann diese Eigenart der S5 fundierenden Bedeutungstheorie auch so formulieren: Alles, was in einer Proposition P Gegenstände betrifft, ist über Individuenkonzepte vermittelt; Gegenstände selbst sind keine Konstituenten von Propositionen. Dies ist eine Beschränkung des Bereichs der überhaupt möglichen Propositionen. Propositionen, die von dieser Beschränkung zugelassen werden und somit keine Gegenstandskonstituenten enthalten, sollen hier als „Fregesche Propositionen“ bezeichnet werden. Daß es nur Fregesche Propositionen gibt, ist insbesondere in Hinblick auf drei Ausdruckssorten bezweifelt worden: Für Gegenstandsvariablen, Nominatoren und für indexikalische Ausdrücke gäbe es keine Individuenkonzepte, die plausiblerweise die Mittlerrolle in Fregeschen Propositionen übernehmen könnten (klassische Kritiker an der These von der ausschließlichen Existenz Fregescher Propositionen sind in diesem Zusammenhang: Russell 1905, Kripke 1972, Kaplan 1989 und Perry 1977). Propositionen, die unter Zuhilfenahme dieser Zeichen ausgedrückt werden, müßten gegenständliche Teile enthalten; sie werden hier als „Russellsche Propositionen“ bezeichnet. Kaplan (1989: 483) verwendet statt dessen den Terminus „singuläre Propositionen“ („singular proposition“), der hier aber vermieden werden soll, um Verwechslungen mit einem Fachausdruck der traditionellen Logik (aus deren Quantitätslehre) zu vermeiden. Auffassungen, nach denen es auch ⫺ oder sogar ausschließlich ⫺
140 Russellsche Propositionen gibt, werden als „haecceitistisch“ (Kaplan 1975: 723) bezeichnet (zum Zusammenhang zwischen Haecceitismus und Querwelteinidentifikation, s. o. § 5.1.5., konsultiere man Kaplan 1975: 718). Hinsichtlich der drei angeführten Ausdruckssorten sind die Argumente für eine haecceitistische Position am überzeugendsten für indexikalische Ausdrücke. Dies sind solche Ausdrücke, deren Beiträge zur jeweiligen Proposition kontextuell bestimmt ist. Standardbeispiele für indexikalische Ausdrücke natürlicher Sprachen sind die Pronomina „ich“, „du“, „dieser“ und Adverbien wie „dort“, „hier“, „jetzt“. Der Witz der haecceitistischen Semantik indexikalischer Ausdrücke ist keineswegs, daß die Referenzobjekte dieser Ausdrücke kontextabhängig sind. Das ist ein ziemlich unspektakulärer Aspekt der Semantik der Indexikalia. Vielmehr geht es darum, daß ihre Bedeutung ⫺ das soll heißen: ihr Beitrag zu Propositionen ⫺ mit ihrem Referenzobjekt zu identifizieren ist. Ihre Bedeutung und die Bedeutung der Ausdrücke, in denen sie vorkommen, ist somit kontextabhängig. Daraus ergeben sich weitreichende semantische und philosophische Konsequenzen. Die erste Konsequenz besteht darin, daß neben dem Begriff der Bedeutung, der diese mit „Propositionsanteil“ gleichsetzt, ein weiterer Bedeutungsbegriff benötigt wird. Denn es gibt ja ganz offensichtlich eine Verwendungsweise des Terminus „Bedeutung“, wonach zum Beispiel „ich“ stets dasselbe ⫺ nämlich: soviel wie „der Sprecher“ ⫺ bedeutet. Als Beispiellieferant indexikalischer Ausdrücke soll hier das Informationsmittel U der Uhr behandelt werden. Dabei soll von einfachen Analoguhren mit Stunden- und Minutenzeiger, aber ohne Sekundenzeiger, ausgegangen werden, deren Ziffernblatt von „1“ bis „12“ skaliert ist. Ist m eine natürliche Zahl zwischen 1 und 12, r eine ebensolche zwischen 0 und 59, so soll ⱔm;r Grundausdruck von U sein. Weitere Grundausdrücke gibt es nicht, und jeder U-Ausdruck ist ein Grundausdruck. Der Grundausdruck ⱔ2;16 soll z. B. alle Zeigerstellungen erfassen, bei denen der Stundenzeiger in das Intervall (2 ⫻ 360/12)∞ ⱕ v ⬍ ((2 ⫹ 1) ⫻ 360/12)∞, und der Minutenzeiger in das Intervall (16 ⫻ 360/60)∞ ⱕ v ⬍ ((16 ⫹ 1) ⫻ 360/60)∞ weist. Der Ausdruck „ⱔ2;16“ ist metasprachliche Bezeichnung eines objektsprachlichen Ausdrucks, den man anschaulicher wie in (88) wiedergeben kann.
I. Systematik
(88)
Die semantische Beschreibung von U folgt dem Verfahren von § 4.7.: Es soll ein Folgeoperator Iocn definiert werden, der für UAusdrücke die Klasse derjenigen Ausdrücke eines weiteren Informationsmittels L(LD) angibt, die genau die Informationen darstellen, die sich aus den U-Ausdrücken (ggf. relativ zu einem in L(LD) formulierten Hintergrundwissen) ergeben. L(LD) ist eine Ausprägung einer von Kaplan (1989) entwickelten formalen Sprache. Sie wird durch das System S6 semantisch beschrieben. Einen guten Überblick über die im Rahmen der intensionalen Semantik entwickelten Kontexttheorie, wie sie sich im Anschluß an die zitierte Arbeit Kaplans entwickelt hat, bietet Zimmermann (1991). 5.2.1. Verwendungskontexte und Auswertungsumstände Eine Uhr der beschriebenen Ausprägung von U zeigt nicht unmittelbar an, wie spät es ist. Um dies aus der Zeigerstellung der Uhr zu ermitteln, muß man wissen, in welcher Tageshälfte man sich gerade befindet. Wenn es AM (⫽ ante meridiem) ist, zeigt ⱔ2;16 an, daß die Uhrzeit 2 h 16 min ist; für PM (⫽ post meridiem) verweist dieser Ausdruck aber auf 14 h 16 min. Die Information, die man aus einer Zeitangabe wie ⱔ2;16 extrahieren kann, hängt also davon ab, wie spät es ist! Man vergegenwärtige sich einmal folgende Situation: Eine Person wacht nach einer Schlafkur in einem völlig abgedunkelten Raum auf und schaut auf ihre noch tickende Uhr. Sie weiß nicht, wie lange sie geschlafen hat; sie kann aber der Angabe ⱔ2;16 entnehmen, daß es 2 h 16 min nachts oder 14 h 16 min nachmittags sein muß. Die Nützlichkeit von Uhren beruht unter anderem auch darauf, daß man sich über die jeweilige Tageshälfte normalerweise schnell perzeptuell Gewißheit verschaffen kann. Allerdings reicht Kenntnis der Tageshälfte noch nicht hin, um die Zeit aus einer Zeitangabe der Uhr zu ermitteln: Man muß auch noch wissen, in welcher Zeitzone man sich befindet, ob zum Beispiel MEZ oder GMT gilt. Ein weiterer Fak-
3. Semantik
tor, der den Informationsgehalt von U-Ausdrücken beeinflußt, sind die physikalischen Umstände: Ist die Uhr aufgezogen? Gibt es in der Umgebung starke Magnetfelder? Die Wahrheitswerte der Ausdrücke von L(LD), mit denen die in einer Zeitangabe z von U enthaltene Information dargestellt werden soll, hängen also von mindestens drei Faktoren ab: von Zeitpunkten (wann wurde die z darbietende Uhr abgelesen?), Örtern (wo wurde sie abgelesen?) und möglichen Welten (unter welchen Umständen wurde sie abgelesen?). Folgen von wahrheitswertbeeinflussenden Faktoren ⫺ also z. B. Zeit-OrtWelttripel ⫺ werden „Indizes“, „Referenz-“ oder auch „Bezugspunkte“ (vgl. Lewis 1970: 25, Montague 1970: 380, Scott 1970a: 148⫺ 150) genannt. Die einzelnen Folgeglieder eines Indexes sind seine Koordinaten, und von den sich entsprechenden Koordinaten verschiedener Indizes werde ich sagen, daß sie derselben semantischen Dimension D angehören. Für L(LD) sind also bisher drei semantische Dimensionen ⫺ Zeit, Ort und Welt ⫺ unterschieden worden. Daß Wahrheitswerte entlang dieser Dimensionen variieren können, macht es nötig, auch die in § 5.1. erläuterten intensional-semantischen Einheiten zu modifizieren. Von der Proposition P z. B., die der Satz „Steh(u)“ (‘u steht’) ausdrückt, wird man nun sagen müssen, daß sie in ein und derselben Welt w zu den Zeiten t, zu denen die Uhr u steht, wahr und zu den Zeiten t', zu denen diese Uhr geht, falsch ist. Propositionen für Informationsmittel wie L(LD) müssen demnach Funktionen sein, die ganzen Indizes und nicht bloß einzelnen möglichen Welten Wahrheitswerte zuweisen, und ganz Entsprechendes gilt für die Intensionen der Ausdrücke anderer Kategorien. Dabei hängt es aber vom Ausdrucksbestand eines Informationsmittels ab, ob eine semantische Dimension D auch durch Koordinaten in solchen Indizes berücksichtigt werden muß, denen durch Propositionen Wahrheitswerte zugeordnet werden und die somit die Definitionsbereiche der intensionalen Einheiten ausmachen. Ein Index, der Koordinaten sämtlicher wahrheitswertbeeinflussender Faktoren enthält, ist ein Verwendungskontext; ein Index, der in den Definitionsbereichen der intensionalen Einheiten vorkommt, ist ein Auswertungsumstand (Kaplan 1989: 499: „context of use“ vs. „circumstances of evaluation“). Die semantischen Dimensionen haben also durchaus unterschiedlichen Status: Nicht jede Dimension, die in Verwendungskontex-
141 ten durch Koordinaten vertreten ist, wird auch so in Auswertungsumständen berücksichtigt. Die Begründung dafür, warum dies so sein muß, erfordert eine längere, schwierige Überlegung, die anhand eines Beispiels veranschaulicht werden soll. ⫺ Es gibt Verwendungsweisen der Uhr, die ihrer normalen Benutzung (die Uhr zeigt den Zeitpunkt an) entgegenlaufen: Der Zeitpunkt zeigt den Zustand der Uhr an. Liest man etwa von seiner Uhr ⱔ1,0 ab und weiß dabei, daß es tatsächlich 13 h 15 min ist, so schließt man, daß die Uhr möglicherweise stehengeblieben ist. Sie könnte natürlich auch nur um eine Viertelstunde nachgehen. Eine solche Folgerung soll auch in L(LD) nachvollziehbar sein, weshalb es dort den Modaloperator 앳 (vgl.: „möglicherweise stehengeblieben“) geben soll. Man benötigt auch Mittel, um die Wahrheit einer Proposition in der Vergangenheit (vgl.: „stehengeblieben ist“) ausdrücken zu können. Um über Vergangenes und Künftiges reden zu können, gibt es daher in L(LD) die beiden Tempusoperatoren „P“ (‘Es war einmal so, daß …‘) und „F“ (‘Es wird einmal so sein, daß, …’). Mit dem Prädikator „Steh“ könnte man also die Schlußfolgerung des Beispiels durch „앳P[Steh(u)]“ wiedergeben (die eckigen Klammern sind redundant). Für t-Ausdrücke Fz und Pz würde man in (noch genauer zu bestimmenden) Modellen für L(LD) die folgenden semantischen Festlegungen treffen: Fz ist zum Zeitpunkt t0 (in der möglichen Welt w) wahr, wenn z zu einem auf t0 folgenden Zeitpunkt t, t0 Ɱ t, (in w) wahr ist; und Pz ist genau dann zu t0 (in w) wahr, wenn z zu einem früheren Zeitpunkt t', t' Ɱ t0, (in w) wahr ist. „F“ und „P“ sind also zeitpunktsensitive Ausdrücke, die semantisch auf Zeitkoordinaten in Indizes zurückgreifen. Benötigt man nun für die L(LD) angemessenen Propositionen in den Auswertungsumständen auch Ortskoordinaten, auf die zum Beispiel der lokaldeiktische Ausdruck „hier“, über den L(LD) verfügen soll, in derselben Weise zurückgreift wie „F“ und „P“ auf die Zeitkoordinaten? Um diese Frage nicht bloß ad hoc zu entscheiden, sondern um sie semantischen Prinzipien gemäß zu beantworten, vergleichen wir zunächst „F“ und „P“ mit einem dritten Zeitoperator. Ein Ausdruck z wie „Steh(u)“ drückt eine zeitneutrale Proposition P aus: Keiner seiner Teilausdrücke schränkt die Wahrheit von P auf einen ganz bestimmten Zeitpunkt oder Zeitraum ein. Will man be-
142 schreiben, welche Wahrheitswertzuweisungen P entlang der Dimension der Zeit trifft, so muß man jede einzelne Zeit t untersuchen: Ist P wahr zu t oder nicht? Ganz im selben Sinne drücken auch Fz und Pz zeitneutrale Propositionen P1 und P2 aus. Auch wenn man beschreiben will, wie P1 entlang der Zeitachse seinen Wahrheitswert ändert, muß man alle Zeiten t untersuchen: Gibt es nach t noch ein t', also: t Ɱ t', so daß das von z ausgedrückte P zu t' wahr ist? Ganz anders verhält es sich mit dem indexikalischen Operator „J“ (‘Es ist jetzt so, daß …’)! Mit Jz wird in einem Verwendungskontext c die Proposition P3 ausgedrückt, daß das von z ausgedrückte P zum Zeitpunkt cT des Kontexts wahr ist. Diese Proposition ist keineswegs mehr zeitneutral: Um den Wahrheitswert von P3 zu einem beliebigen Zeitpunkt t zu bestimmen, reicht es völlig aus, den Zeitpunkt cT zu untersuchen. Ist das von z ausgedrückte P zu cT wahr, so ist P3 zu jeder beliebigen Zeit t wahr! Hinsichtlich der semantischen Dimensionen (wie Zeit, Ort und Welt) sind somit zwei Ausdruckstypen zu unterscheiden: varianzeliminierende und varianzkonservierende. Ein Ausdruck j eliminiert Wahrheitswertvarianz entlang der semantischen Dimension D, wenn er (ggf. im Zusammenspiel mit weiteren Faktoren) ein echtes Teilstück d (einen Punkt oder ein Intervall) aus D ausgrenzt, so daß der Wahrheitswert, den die Proposition P, die ein j enthaltendes z ausdrückt, an einer beliebigen Stelle s von D hat, stets bloß von dem Stück d von D abhängt. Bei varianzkonservierenden Ausdrücken j hat man bei Festlegung des Wahrheitswertes, den z an der Stelle s von D annimmt, jeweils ein von s abhängiges Teilstück p(s) von D zu untersuchen (also normalerweise für jede Stelle s' ein anderes Teilstück p(s')). Für das von Ff ausgedrückte P1 hat man zum Beispiel zur Feststellung der Wahrheit von P1 zu t jeweils das gesamte auf t folgende (in die Zukunft hinein offene) Intervall p(t) zu untersuchen. ⫺ Nun die Nutzanwendung auf die Frage, was in einen Auswertungsumstand hineingehört! In einem Auswertungsumstand ist eine Dimension D nur dann zu berücksichtigen, wenn es Ausdrücke gibt, die Wahrheitswertvarianz entlang D konservieren (s. Kaplan 1989: 502⫺504). Nur für solche Ausdrücke muß ja Information über D stets zur Verfügung stehen, denn nur für sie kommt, da ihre Anwendung Varianz entlang D beibehält, Iterierbarkeit mit nicht-trivialen semantischen Effekten
I. Systematik
in Betracht. (Modaloperatoren, die (80g) entsprechenden Festlegungen folgen, stellen freilich einen Sonderfall dar: Sie eliminieren zwar auch Wahrheitswertvarianz entlang der Dimension Welt ⫺ aber eben nicht dadurch, daß sie eine bestimmte Welt oder eine Weltgesamtheit fixieren, die man zur Feststellung der Wahrheitswerte modalisierter Ausdrücke zu untersuchen hat, sondern indem sie globale Anforderungen an das Zuordnungsverhalten von Propositionen entlang der Weltdimension stellen.) Ortskoordinaten müßten Auswertungsumstände in L(LD) also nur dann haben, wenn es in L(LD) Ausdrücke gäbe, mit denen sich aus ortsneutralen Propositionen wiederum solche bilden ließen. Ein möglicher Operator dieser Art wäre etwa „WZ“ (‘Es ist in der westlich anschließenden Zeitzone so, daß …’). Einen solchen Operator soll es aber in L(LD) nicht geben. Der Operator „WZ“ wäre ja einer weiteren Analyse fähig; er gleicht Operatoren wie „In 27 min wird es so sein, daß …“, auf die ebenfalls verzichtet wird. Dennoch soll man sich deiktisch auf den jeweiligen Ort beziehen können; dazu dient der L(LD)-Ausdruck „hier“, der aber Ortsvarianz eliminiert. 5.2.2. Eine neue semantische Einheit: der Charakter Betrachten wir das Beispiel f ⫽ „Befind(u, hier)“ (‘Die Uhr u befindet sich hier’) für das Ortsdeiktikum „hier“. In Verwendungskontexten c, in denen u nicht am Orte cO des Kontexts ist, ist f falsch, in Kontexten c', in denen sich u am Ort cO' befindet, ist f wahr. Diese Wahrheitswertvarianz von f kann nicht damit erklärt werden, daß die von f ausgedrückte Proposition P dem Orte cO (zusammen mit der Zeit cT und der Welt cU und ggf. weiteren Koordinaten) F, aber dem Orte cO' (zusammen mit cT', cU' und ggf. weiteren Koordinaten) W zuweist; denn Auswertungsumstände haben gar keine Ortskoordinaten. Die Ortsabhängigkeit des Wahrheitswertes f im semantischen System S6 für L(LD) ist also ganz und gar nicht in Analogie mit der Weltabhängigkeit des Wahrheitswertes von (75b) in S5 für L(AL) zu sehen. Daß f in c falsch, in c' aber wahr ist, kann nur heißen, daß f in c eine andere Proposition als in c' ausdrückt! Wahrheitsfähige Ausdrücke von L(LD) legen also in Kontexten Propositionen fest, die unter bestimmten Auswertungsumständen wahr oder falsch sind. Ein und derselbe t-Ausdruck (Beispiel: eben f) kann dabei, obwohl er weder einen mehrdeutigen
143
3. Semantik
Ausdruck:
z utet bede
t
Inhalt: {z}c
er ni sig de
legt im Kontext c fest
Charakter: {z}
bestimmt unter den Auswertungsumständen < t, w >
{z}ctw: Extension
Abb. 3.6: Kaplans semiotisches Viereck. Die Bedeutung eines Ausdrucks ist sein Charakter. Dieser legt in verschiedenen Kontexten unterschiedliche Inhalte fest, die der Ausdruck in diesen Kontexten ausdrückt. Der in einem Kontext ausgedrückte Inhalt bestimmt für jeden Auswertungsumstand, was der Ausdruck in dem Kontext unter den betreffenden Auswertungsumständen als seine Extension designiert (Kaplan sagt: „denotiert“).
Teilausdruck enthält noch syntaktisch mehrdeutig ist, in verschiedenen Kontexten durchaus verschiedene Propositionen festlegen. Aber selbstverständlich gibt es auch einen Bedeutungsaspekt, den ein solcher Ausdruck in all seinen Verwendungskontexten invariant beibehält. Gerade auf diesen Aspekt zielen wir ja ab, wenn wir sagen, das eingangs angeführte f bedeute, daß sich u am jeweiligen Ort der Äußerung befinde. Diese kontextinvariante Art der Bedeutung eines Ausdrucks z nennt Kaplan (1989: Sec. VI) „den Charakter“ {z} von z. Allgemein bedeuten Ausdrücke z Charaktere {z}, die in Kontexten c Inhalte {z}c festlegen, die ihrerseits bezogen auf Auswertungsumstände ⫺ im Falle von L(LD) Zeit-Welt-Paare *t, w+ ⫺ Extensionen {z}ctw bestimmen. Der Charakter {z} ist diejenige semantische Einheit, die ein Zeichenverwender erfassen muß, um in Verwendungskontexten c den von z ausgedrückten Inhalt {z}c bestimmen zu können. Der Inhalt eines Ausdrucks kann, muß aber nicht eine Intension sein (s. u. § 5.5.3.); das Verhältnis von Charakter, Inhalt und Extension stellt Abb. 3.6 dar. Da die Extension {z}ctw eines Ausdrucks z von zwei Indizes ⫺ einem Kontext c und dem Auswertungsumstand *t, w+ ⫺ abhängt, spricht man häufig vom Verfahren der „doppelten Indizierung“ (engl.: „double index-
ing”). Als einer der ersten Semantiker hat Kamp (1971: 238 f) dieses Verfahren angewendet; vgl. ferner Kaplan (1989: 510), Lewis (1980: 98 f) und Cresswell (1990); zur Kritik dieses Verfahrens s. Tichy´ (1980b). ⫺ Aber ist es wirklich notwendig, zwischen Kontexten und Auswertungsumständen sowie zwischen Charakteren und Inhalten zu unterscheiden? Was passieren kann, wenn man diese Unterscheidungen unterläßt, demonstriert folgender Gedankengang von Kaplan (1989: 508 f), zu dem man Parallelen unter anderem bei Castan˜eda (1967) und Rankin (1968) findet. Indem eine Uhr ⱔ1;0 darbietet, sagt sie ihrem Ableser soviel wie: „Wenn ich richtig gehe, dann ist es jetzt 13 h 0 min PM oder 1 h 0 min AM“. Um eine solche Information darzustellen, benötigt man in L(LD) noch das Senderdeiktikum „ich“. Die Senderdimension ist die vierte und letzte semantische Dimension von L(LD). Kontexte für L(LD) sind also Viererfolgen c ⫽ *g, t, l, w+ von Sendern (⫽ Uhren), Zeitpunkten, Örtern und Welten. Im folgenden soll für einen solchen Kontext c stets cS die Sender-, cT die Zeit-, cO die Orts- und cU die Weltkoordinate sein. (Soviel zur Vorbereitung des Kaplanschen Gedankengangs.) Nicht jede Viererfolge ist ein Kontext! Der Sender eines Kontexts muß sich zur Kontextzeit in der Kontextwelt am Kontextort befin-
144 den; andernfalls könnte er ja dort und dann unter den gegebenen Umständen nichts senden (vgl. dazu auch Lewis 1980: 85). Es sind also nur passende Kontexte zugelassen. Schauen wir uns nun den hoch-indexikalischen Ausdruck x ⫽ „J[Befind(ich, hier)]“ (‘Ich bin jetzt hier’) an! Verzichtet man auf die Unterscheidung von Kontext und Auswertungsumstand, so müssen Propositionen Abbildungen sein, die passenden Kontexten Wahrheitswerte zuordnen. Dem Ausdruck x würde dann die Proposition entsprechen, die einem Kontext c genau dann W zuordnet, wenn sich cS zu cT in cU am Orte cO befindet. Da dies aber für alle passenden Kontexte gilt, würde x die Proposition ausdrücken, die konstant den Wert W annimmt. Wenn der Modaloperator 첸 von L(LD) ebenso wie der von L(AL) funktioniert, müßte also „첸J[Befind (ich, hier)]“ wahr sein, obwohl es sicherlich nicht notwendig ist, daß sich die sendende Uhr zur Zeit ihrer Ablesung am Ableseort befindet! 5.2.3. Direkte Referenz Mit der Unterscheidung von Verwendungskontext und Auswertungsumstand wird die falsche Wahrheitswertzuschreibung von W zu 첸x vermieden. Sei nämlich c ein Verwendungskontext! Die Frage ist dann, welche Proposition Pcx x in c ausdrückt. Die Bedeutungstheorie, die die Semantik für L(AL) fundiert, würde hier annehmen, daß „ich“ und „hier“ in c Individuenbegriffe iego und ihic ausdrücken, die in c gerade die Propositionsanteile sind, die „ich“ und „hier“ zu Pcx beisteuern. Die Proposition Pcx würde sich als Wert der von „Befind“ ausgedrückten Beziehung Rloc für die Argumente iego und ihic ergeben: Pcx ⫽ Rloc(iego, ihic ). Aber was für Individuenkonzepte sollen iego und ihic eigentlich sein? Die Überlegung von § 5.2.2. zeigt ja gerade, daß iego nicht das Konzept „der jeweilige Sender eines Kontexts“ und ihic nicht das Konzept „der jeweilige Ort eines Kontexts“ sein kann. Für Indexikalia scheint es aber selbst dann keine plausiblen Individuenkonzepte zu geben, wenn man einen Verwendungskontext c als gegeben festsetzt: Denn mit einer solchen Setzung hat man zwar ein Referenzobjekt, jedoch noch kein Individuenkonzept. Viele Semantiker sind daher der Überzeugung, daß Indexikalia Beispiele direkt referierender Ausdrücke sind, die sich unmittelbar, ohne Vermittlung eines Individuenkonzepts auf ihr Bezugsobjekt beziehen. (Fregesche Semantiken, nach denen auch In-
I. Systematik
dexikalia durch vermittelnde Größen ⫺ allerdings spezieller Art ⫺ referieren, haben unter anderem Tichy´ (1986) und Forbes (1987) vorgelegt.) Der Inhalt eines indexikalischen Ausdrucks in einem Kontext ist sein Bezugsgegenstand selbst und nicht irgendeine intensionale Einheit, kein Individuenkonzept. Der Terminus „Inhalt“ (s. o. § 5.2.2.) ist also allgemeiner als „Intension“: Der Inhalt eines referierenden Ausdrucks in einem Kontext kann ein Individuenkonzept, er kann aber auch ein Gegenstand sein. Indexikalia geben also Anlaß zu Russellschen Propositionen (vgl. die Einleitung zu § 5.2.). Den Unterschied seiner eigenen Bedeutungstheorie zu der Freges, in der referierende Ausdrücke sich stets durch einen vermittelnden Sinn auf ihr Bezugsobjekt beziehen, skizziert Kaplan durch zwei Diagramme, die hier als Abb. 3.7 wiedergegeben werden. Kehren wir nochmals zu dem Beispiel x und der von x in c ausgedrückten Proposition Pcx zurück! Für L(LD) sollen im Unterschied zu L(AL) Carnap-Intensionen für Prädikatoren verwendet werden: „Befind“ hat als Intension also die Funktion RL, die möglichen Welten w und Zeiten t als Wert das Attribut aLtw ⫽ RL(t, w) zuordnet, das seinerseits Dingen g und Orten o genau dann den Wahrheitswert W zuweist (also: W ⫽ aLtw(g, o)), wenn sich g zur Zeit t in der Welt w am Orte o befindet. Mit dieser Funktion RL ermittelt man Pcx so: Pcx ordnet der Zeit t und der Welt w den Wahrheitswert zu, der sich ergibt, wenn man das Attribut RL(t, w) auf den Sender cS und den Ort cO des Kontexts c anwendet: Pcx(t, w) ⫽ RL(t, w) (cS, cO ). Da es sicherlich Zeiten t' und Welten w' gibt, so daß sich cS zu t' in w' nicht am Orte cO befindet, wird Pcx manchmal (eben für solche Paare *t', w'+) den Wert F annehmen. Die Proposition Pcx, die x in c ausdrückt, ist also keineswegs notwendig, und 첸x ist im Kontext c falsch. Der Gedankengang von § 5.2.2., der 첸x fälschlicherweise für wahr erklärte, enthält immerhin etwas Zutreffendes. Mit dem Ausdruck x ⫽ „Befind(ich, hier)“ lassen sich ausschließlich zutreffende Behauptungen aufstellen. Dieser Ausdruck legt in jedem Kontext c' eine Proposition Pc'x fest, die zu dem vom Kontext bestimmten Auswertungsumstand *cT', cU'+ wahr ist: W ⫽ Pc'x(cT', cU'). Die Wahrheit von x in seinen Verwendungskontexten ist sogar a priori aufgrund der semantischen Regeln für L(LD) einsehbar: x ist also analytisch und apriorisch wahr. Aber x ist nicht notwendig! Es gibt also ⫺ weitreichende Konsequenz einer semantischen Unterscheidung! ⫺ apriorisch wahre,
145
3. Semantik
PROPOSITIONSTEIL
SPRACHE • (referierender Ausdruck)
ist Konzept von/fixiert
n t ne ich tio elle ) n ve vi rs. on t – che K m re e di stim Sp h s e rc b de du che en t is ra m n Sp ah tio er nn a el ln d ie A e R ege h d s e i R rc (D der du o ch au
• Sinn
(ein Konzept, so etwas wie eine rein-qualitative Kennzeichnung)
(Normalerweise ist dies eine empirische Relation: der Gegenstand, den der Sinn fixiert, der die kennzeichnenden Qualitäten hat.)
GEGENSTAND
bedeutet (Diese Beziehung ist das Relationsprodukt der beiden anderen.)
(a)
•
PROPOSITIONSTEIL
t uk ie od Bez r np n ne re io nde t ela a R den as bei (D er d
SPRACHE • (referierender Ausdruck)
referiert
Identität
n)
ge
n hu
GEGENSTAND
(Diese Beziehung ist durch Konventionen oder Regeln der Sprache bestimmt.)
(b) Abb. 3.7: Unterschiedliche semantische Analysen indexikalischer Ausdrücke (nach Kaplan 1989: 485 f): (a) Freges Konzeption in der Interpretation Kaplans; (b) Kaplans Konzeption der Unmittelbaren Referenz. Indexikalia führen zu Russellschen Propositionen, indem sie ihr Bezugsobjekt als Propositionsteil zu solchen Propositionen beisteuern, die mit ihrer Hilfe ausgedrückt werden.
analytische Sätze, die durchaus nicht notwendig sind, sondern deren Wahrheit von den empirisch vorliegenden Fakten abhängt; vgl. dazu Kaplan (1989: 538 f). Zu ähnlichen Ergebnissen gelangt auch Kripke (1972). Die philosophischen Konsequenzen und Nicht-Konsequenzen der Theorie der unmittelbaren Referenz werden ausführlich in Salmon (1981) diskutiert; vgl. auch Donellan (1979) und Tichy´ (1983).
5.2.4. Feste Inhalte und starre Designatoren Indexikalia liefern bei vorgegebenem Kontext c für jeden Auswertungsumstand zur semantischen Weiterverwertung stets dasselbe: ihr Bezugsobjekt in c. Sie haben feste Inhalte (Kaplan 1989: 502: „fixed content“). Sollen die Wahrheitswerte der Beispielproposition Pcx für die Auswertungsumstände *t, w+ und
146
I. Systematik
*t', w'+ ermittelt werden, so sind RL(t, w) und RL(t', w') beide Male auf dieselben Argumente cs (für „ich“) und cO (für „hier“) anzuwenden. Man erkennt hieran auch, daß der Prädikator „Befind“ (bezogen auf c) keinen festen Inhalt hat: Für den Auswertungsumstand *t, w+ liefert er ja das Attribut RL(t, w) und für *t', w'+ RL(t', w'): Diese Attribute sind aber nur dann gleich, wenn sich zu t in w alles am selben Ort befindet wie zu t' in w'. Es gibt aber sicherlich Auswertungsumstände, denen die Beziehung RL unterschiedliche Attribute zuweist. Der Prädikator „Befind“ liefert aber in jedem Kontext ein und denselben variablen Inhalt, während Indexikalia von Kontext zu Kontext unterschiedliche Referenzobjekte, also unterschiedliche Inhalte haben. Der Charakter (s. o. § 5.2.2.) der nicht-Indexikalia ist also fest (Kaplan 1989: 506: „fixed character“) während der der Indexikalia variabel ist. Indexikalia und Nicht-Indexikalia verhalten sich also hinsichtlich der Festheit von Charakter und Inhalt zueinander komplementär; s. (89). (89)
indexikali- nicht-indexisches z kalisches z variabel fest
Charakter {z} Inhalt in c fest {z}c
variabel
Da zwischen Charakter, Inhalt und Extension eines Ausdrucks die in Abb. 3.6 dargestellten Abhängigkeiten bestehen, kann man die ersten beiden Arten semantischer Einheiten genauso wie die von § 5.1. formal durch Funktionen repräsentieren. Inhalte sind Funktionen, die Auswertungsumständen Extensionen (also je nach Typ: Wahrheitswerte, Gegenstände oder Attribute) zuordnen, sind also Carnap-Intensionen; Charaktere sind Funktionen, die Kontexten Inhalte zuweisen. Nimmt eine Funktion, sei es ein Charakter oder ein Inhalt, für all ihre Argumente denselben Wert an, so nennt Kaplan (1989: 547 f) sie „stabil“. Feste Inhalte, wie Indexikalia sie haben, werden also durch stabile Intensionen repräsentiert. In Anlehnung an die Terminologie Kripkes (1972) werden solche Intensionen auch als „starr“ (engl.: „rigid“) bezeichnet: Kripke nennt einen Designator starr, wenn er eine stabile Intension hat. (Es gibt allerdings einige minutiöse Unterschiede zwischen „Kripke-Rigidity“ und „Kaplan-Rigidity“; vgl. Kaplan 1989: Sec. IV.) ⫺ Man muß sich vergegenwärtigen, daß die formale Repräsentation fester Inhalte durch Konstanzfunktionen Inhaltsunterschiede zwischen direkt referierenden und vermittelt referierenden Ausdrücken in gewisser Hinsicht verdeckt. Für einen referierenden Ausdruck kann sich herausstellen, daß er in jedem Kontext einen stabilen Inhalt
hat, ohne daß sein Charakter dies verlangen würde. Ein solcher Ausdruck wäre sozusagen durch einen semantischen Zufall ein starrer Designator. Umgekehrt verlangt der Charakter eines indexikalischen Ausdrucks von vornherein, daß er festen Inhalt haben muß, indem er den Inhalt mit dem jeweiligen Referenzobjekt identifiziert. Die Intensionen wären in beiden Fällen aber Konstanzfunktionen.
5.2.5. L(LD) und seine Modelle Damit sind nun die inhaltlichen Grundlagen für das semantische System S6 für L(LD) hinlänglich beschrieben, so daß auch die formale Präsentation von S6 verständlich sein wird. L(LD) verfügt über drei Basistypen: eu (Uhren), eo (Örter) und t. Aus diesen Basistypen bauen sich die Funktionstypen wie bei L(G) auf. Alle Typen sind zugleich auch wieder Kategorien, und eu und eo umfassen als Unterkategorien jeweils wieder Variablenkategorien: „x“, „x0“, „x00“ usw. sind Variablen der Kategorie vu und „z“, „z0“, „z00“ solche der Kategorie vo. Die Typenzuordnung bildet vu auf eu und vo auf eo ab. In (90) sind die deskriptiven Konstanten von L(LD) angegeben. (90) eu: e o: eu(t):
ich, u, u0, u00 usw. (Sender); hier, o, o0, o00 usw. (Örter); Uhr, Korrekt, Steh, und für jedes z von U der Ausdruck „Zifferblattz“; eo(t): AM, PM und für jede Ziffer z einer Zahl zwischen 0 und 23 und für jede Ziffer j einer Zahl zwischen 0 und 59 der Ausdruck „Zeitz; j“; eueu(t): ⫽ (Senderidentität); eoeo(t): ⯝ (Ortsidentität), Zonengleich; eueo(t): Befind. (Die Identitätsausdrücke sollen wieder einheitlich durch „⫽“ wiedergegeben werden.)
Die Ausdrücke „Uhr“, „Korrekt“, „Steh“ und „Zifferblattz“ von eu(t) bedeuten die Eigenschaften, eine Uhr zu sein, richtig zu gehen, gerade stehenzubleiben und auf dem Zifferblatt die durch z fixierte Zeigerstellung darzubieten. Die einstelligen Zeitprädikatoren von eo(t) bedeuten Eigenschaften von Örtern: Mit „Zeit1;15(o)“ wird zum Beispiel ausgesagt, daß es am Orte o gerade 1 h 15 min ortsüblicher, bürgerlicher Zeit ist; „AM(o)“ besagt, daß es am Orte o gerade Vormittag, „PM(o)“, daß es dort gerade Nachmittag ist. Zonengleich sind Örter derselben Zeitzone.
147
3. Semantik
Unter den Synkategoremata von L(LD) finden sich wieder die üblichen Junktoren und die beiden Quantoren. Neben den aus L(AL) bekannten Modaloperatoren 첸 und 앳 gibt es aber in L(LD) noch den deiktischen Modaloperator „Tatsächlich“, mit dem man sich auf die tatsächlich vorliegenden Umstände, auf die wirkliche Welt beziehen kann. Neben den bereits besprochenen nicht-deiktischen Zeitoperatoren „F“ und „P“ soll L(LD) noch die beiden ebenfalls nicht-deiktischen Operatoren 왎 (‘Es ist immer so, daß …‘) und 쏆 (‘Manchmal ist es so, daß …’) aufweisen. Diese beiden Operatoren könnte man auch definitorisch einführen: 왎z ↔ [z ∧ [ÿ P ÿz ∧ ÿ F ÿ z]] bzw. 쏆z ↔ [z ∨ [Pz ∨ Fz]]. Neben den nicht-deiktischen Tempusoperatoren gibt es in L(LD) noch das deiktische „J“. Die Syntaktik für L(LD) gleicht völlig der von L(G); natürlich benötigt man jedoch für die neuen Synkategoremata zusätzliche syntaktische Operationen und Regeln, deren genaue Formulierung aber mittlerweile Routine sein dürfte. Der Bestimmung des Modellbegriffs geht wieder die Festlegung der Intensionsbereiche voraus, aus denen die Modellfunktionen die semantischen Einheiten wählen, mit denen sie die Konstanten von L(LD) interpretieren. Im Unterschied zu (79) verwendet (91) CarnapIntensionen. Die Auswertungsumstände für L(LD) sind um eine Koordinate komplizierter als die von L(AL). Dafür brauchen in L(LD) keine Kriterien für die Querwelteinidentifikation angegeben zu werden; in L(LD) wird über Individuen, nicht über Individuenkonzepte quantifiziert. (91) Sei E ⫽ *Eu, Eo+ ein Paar nicht-leerer Mengen, und seien T und U ebenfalls nicht-leer. (91a) Dann ist das auf E gegründete System von Extensionsbereichen die Mengenfamilie, deren Elemente ExtE, t (t Typ von L(LD)) folgendermaßen bestimmt sind: (1) Für t ⫽ t ist Extt, E ⫽ {W, F}. (2) Exteu, E ⫽ Eu und Exteo, E ⫽ E o. (3) Für t ⫽ t1 … tm(tO ) ist Extt, E ⫽ ExttO, E (Extt , E ⫻ … ⫻ Extt , E). (91b) Das auf U, T und E gegründete System von Intensionsbereichen ist dann die Familie der Funktionsmengen Intt, T, U, E ⫽ Extt, E (T ⫻ U) (t Typ von L(LD)). 1
m
Ein auf ein System von Intensionsbereichen aufbauendes Modell A für L(LD) (vgl. Kaplan 1989: 543 f; das hier eingeschlagene Vorgehen weicht etwas von dem Kaplans ab) muß nun folgendes leisten: (i) Eine geeignete Klasse von Kontexten C ist zu bestimmen. (ii) Für jede Konstante z mit festem Charakter muß die Modellfunktion H eine Intension H (z) angeben, die konstant als Wert des stabilen Charakters {z} auftritt. Die konstanten Werte der Charaktere der beiden Identitätsausdrücke sollen dabei die beiden stabilen Intensionen sein, die Indizes konstant die Gleichheitsattribute für Eu bzw. Eo zuweisen. (iii) Es ist darauf zu achten, daß die Kontextkoordinaten durch die Intension von „Befind“ richtig miteinander in Beziehung gesetzt werden: Der Sender des Kontexts muß sich am Kontextort befinden usw. (iv) Schließlich muß für die Zeitpunkte eine strikte Ordnung ⬍ bestimmt werden: t1 ⬍ t2 heißt, daß t1 früher als t2 ist. (Eine Ordnung ist strikt, wenn sie irreflexiv, konnex und transitiv ist; Konnexität heißt, daß für zwei Zeitpunkte t1 und t2 t1 ⬍ t2 oder t2 ⬍ t1 gilt.) (92) Ein Modell A für L(LD) ist eine Struktur A ⫽ *C, U, T, ⬍, E, H+ (mit E ⫽ *Eu, Eo+, die den folgenden Bedingungen genügt: (92a) U, Eu, Eo und T sind nicht-leere Mengen (die Welten, die Sender, die Örter und die Zeitpunkte von A). C ist eine nicht-leere Teilmenge von Eu ⫻ T ⫻ Eo ⫻ U. (92b) Die Relation ⬍ ist eine strikte Ordnung auf T. (92c) Die Modellfunktion H gibt für jede von „ich“ und „hier“ verschiedene Konstante z des Typs t ein Element H (z) aus Intt, T, U, E des auf T, U und E gegründetes Systems von Intensionen an. Dabei gilt: (1) Für jedes c aus C ist H (Befind)(cT, cU ) (cS, cO ) ⫽ W. (2) Für j ⫽ „⫽“ und j ⫽ „⯝“, für jedes c aus C, jedes *t, w+ aus T ⫻ U und für alle g1, g2 aus Eu (bei j ⫽ „⫽“) bzw. aus Eo (bei j ⫽ „⯝“) gilt: H (j)(t, w)(g1, g2 ) ⫽ W genau dann, wenn g1 mit g2 identisch ist. Eine A-Belegung (bei A ⫽ *C, U, T, ⬍ E, H +) ist wieder eine für die Variablen definierte Funktion, die Ausdrücken von vx Ele-
148 mente aus Ex (x ⫽ u oder o) zuordnet. Belegungen für L(LD) unterscheiden sich darin von solchen für L(AL), daß sie den Variablen Individuen und keine Individuenkonzepte zuordnen! In (93) wird nun angegeben, wie die A Modellextension 储z储cftw eines Ausdrucks z im Modell A im Kontext c unter der Belegung f für den Auswertungsumstand *t, w+ zu ermitteln ist. Sie hängt wieder von den Extensionen (zum selben Auswertungsumstand) der in z extensional vorkommenden Teilausdrücke und den Intensionen der in z intensional vorkommenden Teilausdrücke ab. Demgegenüber gibt es aber keine Abhängigkeit der Extension eines Ausdrucks vom Charakter eines seiner Teilausdrücke! Kaplan (1989: Sec. VIII) und von Stechow (1989: 51⫺59) sehen darin zumindest für natürliche Sprachen eine semantische Gesetzmäßigkeit: Das sogenannte „Monsterverbot“ schließt solche Abhängigkeiten als semantische Ungeheuer aus. Die in § 4.4.1. (vgl. dort die Klauseln von (40)) angesprochene strikt-kompositionale Semantik für die Quantoren verstößt gegen das Monsterverbot (wenn man wie Montague (1970: 386) Belegungen als Kontextkoordinaten ansieht). Zur Formulierung einiger Prinzipien der Theorie illokutionärer Kräfte (vgl. Stalnaker 1978; s. auch § 5.4.1.) wird man allerdings Operatoren benötigen, die gegen das Monsterverbot verstoßen. (93) Sei A ⫽ *C, U, T, ⬍, E, H + ein Modell für L(LD), f eine A-Belegung, c ein Kontext aus C und *t, w+ ein Auswertungsumstand, d. h. ein Element von T ⫻ U. A Dann wird 储z储cftw wie folgt ermittelt: A (93a) Ist z ⫽ „ich“, so ist 储z储cftw ⫽ c S, A und ist z ⫽ „hier“, so ist 储z储cftw ⫽ c O. (93b) Ist z eine von „ich“ und „hier“ verschiedene Konstante, so ist A 储z储cftw ⫽ H (z). A A (93c) 储z(j1, …, jm )储cftw ⫽ 储z储cftw A A (储j1储cftw , …, 储jm储cftw ). A A (93d) 储ÿz储cftw ⫽ 储z储cftw . A A A (93e) 储[z ∧ j]储cftw ⫽ 储z储cftw
储j储cftw usw. für „∨“, „→“ und „↔“. A A (93f) 储첸z储cftw ⫽ {储z储cftw' | w' aus U} und Entsprechendes (s. o. (80f)) für 앳. A A (93g) 储Tatsächlich z储cftw ⫽ 储z储cftc . U A A (93h) 储Pz储cftw ⫽ {储z储cft'w | t' ⬍ t}, und 储 A A Fz储cftw ⫽ {储z储cft'w | t ⬍ t'}. A A (93i) 储왎z储cftw ⫽ {储z储cft'w | t' aus T}, A A und 储쏆z储cftw ⫽ {储z储cft'w | t' aus T}.
I. Systematik A A ⫽ 储z储cfc . (93j) 储Jz储 Tw cftw A A (93k) 储 jz储cftw ⫽ {储z储cf'tw | Es gibt ein g aus Ex, so daß f ' ⫽ f*jg+} (wobei x ⫽ u, falls j aus vu stammt, und x ⫽ o für ein j aus vo ) und Entsprechendes für „V“ (s. o. (39f)).
Die Intension, die formale Repräsentation des Inhalts eines Ausdrucks z (im Modell A unter der Belegung f) im Kontext c ist die A Funktion {z}cf , die jedem AuswertungsumA stand *t, w+ die Modellextension 储z储cftw zuordnet. Der Charakter {z} ordnet jedem Modell A, jeder A-Belegung f und jedem Kontext c der Kontextmenge von A den Wert A {z}cf zu (Kaplan 1989: 548). Hinter dieser Definition steht die Intuition, daß der Charakter von z die Gesamtheit der semantischen Regeln ist, nach denen die jeweiligen Inhalte von z in Verwendungskontexten zu bestimmen sind. Da diese Regeln aber alle Modelle in derselben Weise betreffen, sollte der Charakter als regulative semantische Einheit tatsächlich wohl modellunabhängig sein. A Daß {z}cftw ⫽ W für einen t-Ausdruck z gilt, soll auch wieder so geschrieben werden: „A储—— cftw z“. Ein Ausdruck z ist wahr im Kontext c des Modells A, wenn für jede Belegung f gilt, daß A储—–— cfc TcU z. z ist allgemeingültig, d. h.: 储– z, wenn z in jedem Kontext eines jeden Modells wahr ist. Für L(LD) heißt Allgemeingültigkeit also soviel wie Wahrheit in jedem Kontext. Man kann aber auch ausdrükken, daß z zu jedem Auswertungsumstand (zu jedem Zeit-Welt-Paar) wahr ist: 储– 왎첸z. 5.2.6. A-Postulate für L(LD) Die semantische Beschreibung der deskriptiven Konstanten von L(LD) erfolgt wieder durch Angabe von A-Postulaten. Daß ein exAusdruck z (x ⫽ u oder o) starrer Designator ist, also eine Intension hat, von der man von S5 für L(AL) her gesehen sagen würde, daß sie zu einer modal separierten Eigenschaft gehört, kann man nun durch (94a) ausdrücken. In (94a) kommt eine völlig andere Gegenstandsauffassung als die von S5 zum Ausdruck: Stabilität von Individuenkonzepten ist von den Eigenschaften, unter die die von ihnen bestimmten Gegenstände fallen, völlig unabhängig. Korrekt zu gehen, stehenzubleiben, eine bestimmte Zeigerstellung aufzuweisen, sind Eigenschaften von Uhren. Dies wird mit (94b), (94c) und (94d) gesagt. Wenn eine Uhr gerade stehenbleibt, so wird sie in allernächster Zukunft nicht korrekt gehen; vgl. (94e). Die nächsten A-Postulate charak-
149
3. Semantik
terisieren die Bedeutungen der Zeitprädikatoren „AM“, „PM“ und „Zeitz“. Dabei soll Z24 die Adjunktion aller Ausdrücke der Gestalt „Zeitz(z)“ sein; also Z24 ⫽ „[Zeit0;0(z) ∨ [Zeit0;1(z) ∨ [Zeit0;2(z) ∨ … Zeit23;59(z)]…]“; entsprechend sind Z⬍12 und Zⱖ12 als Teiladjunktionen von Z24 bis „Zeit11;59(z)“ bzw. ab „Zeit12;0(z)“ bestimmt. In (94f) wird dann gesagt, daß an jedem Ort, zu jedem Zeitpunkt und jeder Welt mindestens eine Zeitangabe richtig ist, und (94g) ergänzt, daß auch nur höchstens eine stimmen kann. Mit (94h) und (94i) wird festgelegt, wann Vormittag und wann Nachmittag ist. Die nächsten drei APostulate beinhalten, daß Zonengleichheit immer und in jeder Welt eine Äquivalenzrelation ist, durch die die Klasse der Örter in disjunkte Zeitzonen zerlegt wird. Die Postulate (94m) verlangen, daß in Örtern derselben Zeitzone dieselben Zeitangaben richtig sind. Eine Uhr befindet sich stets an genau einem Ort, s. (94n). Schließlich charakterisiert (94o), was es für eine Uhr heißt, richtig zu gehen: Ihre Zeigerstellung muß mit der gültigen Zeitangabe übereinstimmen, d. h., daß die Zeigerstellung genau diese Zeitangabe oder eine um 12 Einheiten verschobene darbieten muß. Für m ⬍ 12 soll dabei (m;n) ⫹ ⫹ 12 ⫽ (m ⫹ 12); n) und für m ⫽ 12 (m;n) ⫹ ⫹ 12 ⫽ (0;n) sein. j왎첸[z ⫽ j] für von „ich“ und (94a) „hier“ verschiedene Konstanten z von eu (dann ist j von vu ) und eo (dann ist j von vo ) (94b) x왎첸[Korrekt(x) → Uhr(x)] (94c) x왎첸[Steh(x) → Uhr(x)] (94d) x왎첸[Zifferblattz(x) → Uhr(x)] für alle z von U (94e) x왎첸[Steh(x) → FÿKorrekt(x)] (94f) z왎첸Z24 (94g) z왎첸[Zeitz(z) → ÿZeitj(z)] für z⫽j (94h) z왎첸[AM(z) ↔ Z⬍12] (94i) z왎첸[PM(z) ↔ Zⱖ12] z)] (94j) z왎첸[Zonengleich(z, (94k) z z1왎첸[[Zonengleich(z, z1 ) → 1, z)] Zonengleich(z (94l) z z1 z2왎첸[[Zonengleich(z, z1 ) ∧ Zonengleich (z1, z2 )] → Zonengleich(z, z2 )] (94m) z z1왎첸[Zonengleich(z, z1 ) → [Zeit z(z) ↔ Zeitz(z1)]] für jedes „Zeitz“ (94n) x왎첸[Uhr(x) → z[Befind(x, z) ∧ z1[Befind(x, z1 ) → z ⫽ z1]]] (94o) x z왎첸[[Korrekt(x) ∧ Befind(x, z)] → [Zifferblattⱔz(x) ↔ [Zeitz(z) ∨ Zeitz⫹ ⫹12(z)]]]
Im folgenden sei A die Gesamtheit aller Modelle A für L(LD), in denen diese Postulate (in jedem Kontext und daher aufgrund ihrer speziellen Form auch in jedem Auswertungsumstand) gelten. 5.2.7. Semiotische Folge, definiert für U und L(LD) Unter einer „Verwendung“ (Montague 1970: 381: „token“; Kaplan 1989: 546: „sentencein-a-context“; Kamp 1978: 260 und Gazdar 1981: 66: „utterance“, s. auch § 5.4.1. und Art. 2 § 2.) eines Ausdrucks z von U oder L(LD) soll nun ein Paar *z, c+ verstanden werden, in dem c eine viergliedrige Folge ist. Die zweite Koordinate c ⫽ *cS, cT, cO, cU+ einer Verwendung könnte also der Zahl ihrer Glieder nach Kontext in Modellen aus A sein. Ist V nun eine Klasse von Verwendungen *z1, c1+, *z2, c2+, … von t-Ausdrücken von L(LD), so folgt v0 ⫽ *z0, c0+ aus V bzgl. A, d. h.: V 储— A v0, wenn für jedes Modell A aus A und jede A-Belegung f gilt: Sind die cm, die als Zweitglieder der V-Elemente auftreten, Kontexte von A und ist jeweils A储 cmfcm cm zm, so ist auch A储 c0fc0 c0 z0 (vgl. Montague 1970: 381 f); Montague rechnet allerdings die Belegung zum Kontext; hier wird die Belegung so behandelt wie bei Bestimmung der Folgebeziehungen für L(G) und L(AL)). Ist G nun eine gemischte Klasse von Verwendungen von U- und von L(LD)Ausdrücken, wobei D die U-Verwendungen und U die L(LD)-Verwendungen von G enthält (also: G ⫽ D ∪ U), ist ferner T(D) die Gesamtheit der L(LD)-Verwendungen *[Tatsächlich[Korrekt(ich)] → J[Zeitz(hier) ∨ Zeitz⫹ ⫹(hier)]], c+, für die sich *ⱔz, c+ in D befindet, so soll Iocn(G) die Klasse der L(LD)-Verwendungen v sein, für die T(D)∪U 储— v gilt. A Betrachten wir als Beispiel eine gegenläufige Benutzung zweier Uhren! Sei c1 der Kontext *쑗∪1 , 19 h 7 min MEZ, 2. 1. 1991 n. u. Z., 52∞ 30⬘ N 13∞ 25⬘ O, ª+, wobei 쑗∪1 meine Taschenuhr ist, ª die wirkliche Welt sein soll und die geographische Angabe einen Ort l1 in Berlin bestimmt. Die Uhr 쑗∪1 soll in L(LD) den Namen „u1“ tragen, und „o1“ soll der Name des Ortes von c1 sein. Meine Schreibtischuhr 첸 ⬚ , die in L(LD) „u2“ heißen soll, befindet sich zur selben Zeit t ⫽ (19 h 7 min MEZ, 2. 1. 1991 n. u. Z.) in unmittelbarer Nähe l2 des Ortes l1. Der Ort l2 soll in L(LD) den Namen o2 tragen. Der Semiosekontext für 첸 ⬚ ist ∪ also c2 ⫽ *첸 ⬚ , t, l2, ª+. Nun zeigt 쑗1 ⱔ7;7 und 첸 ⬚ ⱔ6;45 an; die entsprechenden VerwendunT
U
T
U
150
I. Systematik
gen dieser U-Ausdrücke sind also: v1 ⫽ *ⱔ7;7, c1+ und v2 ⫽ *ⱔ6;45, c2+. Die beiden Örter l1 und l2 liegen beide in der MEZ-Zone: Sowohl v3 ⫽ *Zonengleich(o1, o2 ), c1+ als auch v4 ⫽ *Zonengleich (o1, o2), c2+ sind wahre Verwendungen (im intendierten L(LD)-Modell). Die beiden Sender werden durch die folgenden zwei Verwendungen identifiziert: v5 ⫽ *ich ⫽ u1, c1+ und v6 ⫽ *ich ⫽ u2, c2+. Lokalisiert werden die beiden Sender durch v7 ⫽ *hier ⫽ o1, c1+ und v8 ⫽ *hier ⫽ o2, c2+. Durch die Klausel (92c)(1) ist sichergestellt, daß in jedem Kontext c „Befind(ich, hier)“ gilt, woraus zusammen mit v5 und v7 bzw. mit v6 und v8 folgt, daß v9 ⫽ *Befind(u1, o1), c1+ und v10 ⫽ *Befind(u2, o2 ), c2+ wahre L(LD)-Verwendungen sind. Als semiotische Folge von v1 und v7 ergibt sich dann auf dem Hintergrund von v3, v4, v5, v6, v7 und v8 wegen der A-Postulate (94m) und (94g) die Wahrheit der Verwendungen v11 ⫽ *Tatsächlich [ÿKorrekt(u1 ) ∨ ÿKorrekt (u2 )], c1+ und v12 ⫽ *Tatsächlich [ÿKorrekt (u1 ) ∨ ÿKorrekt (u2 )], c2+. M. a. W.: Mindestens eine der beiden Uhren (vielleicht auch jede der beiden) geht falsch. Raum-zeitlich benachbarte Verwendungen unterschiedlicher U-Ausdrücke lassen also Rückschlüsse auf den Zustand der Sender zu. ⫺ Unbefriedigend an solchen Analysen ist sicherlich, daß die semiotische Folgebeziehung Iocn von der Übersetzbarkeit der U-Ausdrücke in tAusdrücke von L(LD) wesentlichen Gebrauch macht. Die eigentliche semantische Analyse wird für L(LD) geleistet, während U nur in indirekter Weise semantisch charakterisiert wird. Ein unmittelbarerer Zugang zu U soll in § 8.2. skizziert werden. 5.3.
Kritik und Weiterentwicklung: Partialität und Hyperintensionen
5.3.1. Partialität Sowohl in S5 für L(AL) als auch in S6 für L(LD) sind Intensionen ⫺ bei allen sonstigen Unterschieden ⫺ gleichermaßen totale Funktionen, d. h.: sie sind für alle Auswertungsumstände (Welten bzw. Zeit-Welt-Paare) definiert. Insbesondere in Hinblick auf vier Problembereiche ist an dieser Totalität von Intensionen Kritik geübt worden: (i) fehlende Bezugsobjekte und dadurch ausgelöstes Präsuppositionsversagen; (ii) Sortenunterscheidungen und Sortenfehler; (iii) semantische Antinomien; (iv) Informationsdefizite. Im folgenden sollen diese Problemfelder kurz skizziert werden, und es sollen Hinweise auf
entsprechende Weiterentwicklungen der intensionalen Semantik in diesen Bereichen gegeben werden. Fehlende Bezugsobjekte: Daß es unendlich viele Himmelskörper gibt, halten zumindest einige Leute nicht für ausgeschlossen. Sei etwa w⬁ (in einem Modell von L(AL)) eine entsprechende mögliche Welt, in der das tatsächlich auch so ist. Zunächst würde man dann vielleicht vermuten, daß „ÿ y[y ⫽ Carx[Ste(x)]]“ in w⬁ wahr ist, denn „Car“ gibt ja stets nur endliche Anzahlen an. Das System S5 läßt dies aber nicht zu: es bestimmt, daß das von „Carx[Ste(x)]“ ausgedrückte Individuenkonzept i in w⬁ als Ersatzobjekt die Zahl ⫺1 fixiert. Dies ist sicherlich ein technisches Artefakt, das dem Mangel partieller Intensionen in S5 geschuldet ist. Wäre es nicht viel angemessener für i eine Definitionslücke bei w⬁ anzunehmen? ⫺ Die Semantik solcher Ausdrücke, die ihrem syntaktischen Verhalten nach referentiell zu sein scheinen, aber kein Bezugsobjekt haben, ist bereits von Frege (1892) und von Russell (1905) diskutiert worden, die dabei zu recht unterschiedlichen Ergebnissen gelangen. Russell versucht im Rahmen seiner Kennzeichnungstheorie, solche Ausdrücke als nur dem Anschein nach referentiell wegzuanalysieren. Frege behandelt das Problem am Beispiel des Satzes „Odysseus wurde tief schlafend in Ithaca an Land gesetzt“ (Frege 1892: 32 f). Wenn Odysseus nur eine mythologische Figur ist, so hat der Ausdruck „Odysseus“ keine Referenz und der Beispielsatz keinen Wahrheitswert. Da der Satz aber einen Gedanken ausdrückt, muß auch „Odysseus“ einen Sinn haben. Man sieht, daß Frege ein Infektionsprinzip vertritt: Kommt ein bedeutungsloser Ausdruck j in extensionalen Kontexten in einem Ausdruck z vor, so hat auch z keine Bedeutung. Man erinnere sich, daß für Frege die Bedeutung eines Satzes sein Wahrheitswert ist. Im Anschluß an Strawson (1950) sagt man etwa von Freges Beispielsatz, daß er die Existenz des Odysseus präsupponiere. Allgemein: Ein t-Ausdruck f präsupponiert einen t-Ausdruck x, wenn x sowohl aus f selbst als auch aus der Negation von f folgt (vgl. van Fraassen 1971: 154). Bei vorliegendem Beispiel spricht man genauer von einer Existenzpräsupposition, da ja eine Existenzaussage präsupponiert wird. Vergleicht man die Erklärung der Präsupposition mit den Definitionen der Folgebeziehungen etwa für L(G) oder L(AL), so stellt man fest, daß es nur dann nicht-triviale Präsuppositionen geben
151
3. Semantik
kann, wenn einige Sätze keinen Wahrheitswert haben, bzw. einige Propositionen für einige Welten undefiniert sind. (Andernfalls werden nur allgemeingültige Sätze präsupponiert.) Fehlt einem t-Ausdruck (in einer Welt) ein Wahrheitswert, weil (dort) ein von ihm präsupponierter Satz falsch ist, so spricht man von einem „Präsuppositionsversagen“ (engl.: „presupposition failure“); zur semantischen Analyse von Präsuppositionen und Präsuppositionsversagen mit Hilfe der sogenannten „Superbewertungen“ („supervaluations“) vergleiche man van Fraassen (1971: 94⫺98 und 153⫺172). Sortenunterscheidungen: In L(AL) gibt es keine Prädikatoren, die Eigenschaften ausdrücken, die auf Individuen aller drei Typen ⫺ ek, er und eo ⫺ sinnvoll anwendbar sind. Daher lassen sich auch in der Syntaktik für L(AL) die Individuenausdrücke in drei exakt den Typen entsprechende, gleichbenannte Kategorien einteilen. Diese Subklassifikation der e-Ausdrücke setzt sich bei den Prädikatoren fort (also: ek(t), er(t), eo(t)), so daß man für jeden Prädikator den Bereich der sinnvollen Anwendbarkeit der von ihm ausgedrückten Eigenschaft aus seiner syntaktischen Einordnung erschließen kann. Demgegenüber gibt es in natürlichen Sprachen zum Beispiel Prädikatoren, die sinnvoll nur von weiblichen oder nur von männlichen Individuen prädiziert werden können, während andere sexusneutral sind (vgl. etwa „ist schwanger“ mit „ist blond“). Es macht hier daher wenig Sinn (obwohl so etwas durchaus vorgeschlagen worden ist), in der Syntaktik Ausdrücke, die auf Personen referieren, nach dem Sexus ihres Bezugsobjekts zu sortieren, da man ja eine Vielzahl sexusneutraler Prädikatoren hat. Mit anderen Worten: Man wird t-Ausdrücke wie „Hans ist schwanger“ oder „Uschi ist Vater“ nicht als syntaktisch abweichend klassifizieren. Solche Ausdrücke sind semantisch anormal, weil sie einen sogenannten „Sortenfehler“ enthalten: Der Gegenstand, dem in einem solchen Ausdruck eine bestimmte Eigenschaft zugeschrieben werden soll, gehört gar nicht zum Bereich der Individuen, auf die die Eigenschaft sinnvollerweise Anwendung finden kann. Es erscheint durchaus plausibel, zumindest einfachen Ausdrükken mit Sortenfehlern keinen Wahrheitswert zuzuschreiben. Eigenschaften (oder Attribute) sind dann keine totalen Funktionen, sondern können Definitionslücken aufweisen. Dann greift auch hier der oben erklärte Präsuppositionsbegriff. Anhand sortenbedingter
Präsuppositionen erschließt man zum Beispiel das Geschlecht des Bezugsobjekt sexusneutraler Namen wie „Kai“, wenn sie zusammen mit sortal beschränkten Prädikatoren vorkommen (vgl.: „Kai ist schwanger“ und „Kai ist Vater geworden“); semantische Analysen der Sortenunterscheidungen und Sortenfehler, die ebenfalls auf van Fraassens Methode der Superbewertungen zurückgreifen, findet man bei Thomason (1972) und Waldo (1979). Semantische Antinomien: Keines der in diesem Artikel behandelten Informationsmittel enthält Ausdrücke, die selbst semantische Beziehungen oder Eigenschaften bedeuten. Im Gegensatz dazu enthält etwa das Deutsche semantische Fachtermini wie „wahr“, „falsch“, „Name“, „bezieht sich auf“ usw. Gibt es in einem bestimmten Informationsmittel I mit semantischem Fachvokabular noch die Möglichkeit, mit I-Ausdrücken über I-Ausdrücke zu reden, so besteht die Gefahr, daß in I sogenannte „semantische Antinomien“ formulierbar sind. Die bekannte Lügner-Antinomie macht zum Beispiel in der Form (95) davon Gebrauch, daß ein Demonstrativpronomen sogar auf den Satz verweisen kann, in dem es selbst vorkommt. (Der Bezug von „dieser Satz“ in (95) wird durch die Klammern und den Pfeil verdeutlicht.) (95) Dieser Satz ist falsch
Der Ausdruck z von (95) ist wahr, wenn das Bezugsobjekt seines Teilausdrucks „Dieser Satz“ falsch ist. Dieses Bezugsobjekt ist aber der Ausdruck z selbst: z ist also genau dann wahr, wenn z falsch ist. Nimmt man an, daß jeder t-Ausdruck entweder wahr oder falsch ist, so ergibt sich ein Widerspruch. Wenn aber die Eigenschaft, wahr zu sein, partiell ist und z überhaupt keinen Wahrheitswert hat, so führt (95) zu keinem Widerspruch; für entsprechende Lösungsversuche der semantischen und mengentheoretischen Antinomien vgl. Feferman (1982). Zur Vermeidung solcher Widersprüche, wie sie (95) in sich birgt, hat Tarski in Anschluß an Les´niewski die Unterscheidung zwischen Objekt- und Metasprache getroffen (s. o. § 2.1.), derzufolge der metasprachliche Prädkikator „ist wahr“ von (95) nur auf solche Sätze anwendbar ist, die nicht zur selben Sprache wie dieser Prädikator selbst (sondern eben zur untersuchten Objektsprache) gehö-
152 ren. Während man die semantischen Antinomien lange Zeit aufgrund dieser Unterscheidung für erledigt hielt, ist das Interesse an ihnen in letzter Zeit ⫺ angeregt durch die Arbeit Kripkes (1975) ⫺ wieder erwacht. Eine situationstheoretische Analyse der Lügner-Antinomien entwickeln Barwise und Etchemendy (1987). Bei ihnen findet man auch eine Kritik des Versuches, die Lügnerantinomie dadurch zu lösen, daß man Ausdrücke wie (95) für wahrheitswertlos erklärt.
Informationsdefizite: In der MWA werden Intensionen als Extensionsbestimmer (s. o. § 5.1.4.) aufgefaßt. Man könnte aber auch sagen, daß die Intension eines Ausdrucks z die Informationseinheit sei, die das Auffinden der Extension von z (im Zusammenspiel mit den jeweils obwaltenden Fakten) gestatte. Dies ist eine eher epistemische Konzeption der Intensionen gegenüber der mehr ontologischen der MWA. Sie rückt einen weiteren möglichen Grund dafür ins Blickfeld, warum ein t-Ausdruck keinen Wahrheitswert hat: Die Information, die seine Proposition enthält, reicht nicht aus, um zusammen mit den statthabenden Umständen einen Wahrheitswert feststellen zu können. Solche durch Informationsdefizite verursachten semantischen Lücken spielen zum Beispiel in der Situationssemantik (s. u. § 8.2.) eine große Rolle. Sie sind offensichtlich von einem grundsätzlich anderen Typ als die bisher angesprochenen Partialitäten. Ein Informationsdefizit ist ja behebbar, während nichts einen einmal begangenen Sortenfehler wie in „Hans ist schwanger“ rückgängig machen kann und auch keine Zusatzinformation einem nur mythologischen Odysseus (wenn er wirklich nur mythologische Existenz hat) Realität verleihen kann. Auch das Fregesche Infektionsprinzip findet keine Anwendung auf Wahrheitswertlücken, die Informationsdefiziten geschuldet sind. Steht etwa hinsichtlich der Adjunktion „[z ∨ j]“ bereits die Information zur Verfügung, daß z wahr ist, so reicht dies hin, der Adjunktion selbst denselben Wahrheitswert zuzuweisen, auch wenn der von j unbestimmt ⫺ d. h. jetzt: noch unbekannt ⫺ sein sollte. Diesen Typ von Partialität untersucht zum Beispiel Langholm (1988). Es gibt also eine ganze Reihe von Ursachen für semantische Lücken (Wahrheitswertlosigkeit oder Fehlen des Bezugsobjekts) und das Auftreten partieller Einheiten. Wie man die allerdings in einer Semantik am besten berücksichtigt, erweist sich als ein ziemlich verwickeltes technisches Problem. Die
I. Systematik
naheliegendste Möglichkeit, auf die schon mehrfach angespielt worden ist, besteht darin, überall dort, wo bisher in der Semantik von einer totalen Funktion f aus einer Funktionsmenge ZA Gebrauch gemacht worden ist, die jedem Element ihres Definitionsbereichs A ein solches ihres Wertebereichs Z zuordnet (f: A → Z; f ist totale Funktion von A in Z), eine partielle Funktion f ' aus Z債(A) zu benutzen (f ': A Z; f ' ist partielle Funktion von A in Z). Diesen Weg beschreiten etwa von Kutschera (1975) und Tichy´ (1982 sowie 1988: ch. V). Eine andere Möglichkeit besteht darin, Definitionslücken durch anderweitig nicht vorkommende Ersatzobjekte zu füllen. So kann man zum Beispiel Wahrheitswertlücken durch ein von W und F verschiedenes Objekt ⊥ (unterbestimmt) beheben. Eine partielle Proposition, die nur von möglichen Welten aus U abhängt, kann dann technisch weiterhin als totale Funktion P aus {W, F, ⊥}U angesehen werden und braucht nicht tatsächlich partiell, d. h. aus {W, F}債U, zu sein. Dies hat den Vorteil, daß man weiterhin die Bequemlichkeiten totaler Funktionen genießen kann (vgl. die Umsetzungen dieser Strategie zum Beispiel bei Rusza 1986, Blamey 1986 und Muskens 1989). Allerdings stellt sich hier die Gretchenfrage, wie man es mit der inhaltlichen Interpretation und mit der Rechtfertigung von ⊥ (und ggf. weiteren benötigten Ersatzobjekten) hält. Ist ⊥ ein dritter Wahrheitswert oder ein aus Bequemlichkeitsgründen eingeführtes Wahrheitswertsurrogat? Ist ⊥ völlig frei wählbar und gerade deshalb nichtssagend? Oder läßt sich doch etwas Interessantes über ⊥ feststellen? Im 7. Abschnitt soll ein Informationsmittel behandelt werden, in dem die Ersatzobjekte durch inhaltlich motivierte Forderungen mit den normalen Objekten verknüpft sind. 5.3.2. Eigenschaftstheorie Die Identifizierung intensionaler semantischer Einheiten aufgrund der Klassifikation syntaktischer Kontexte nach Ersetzbarkeitskriterien (s. o. § 5.1.2. und § 5.1.3.) sollte an ein intuitives Vorverständnis von Eigenschaften, Beziehungen und Propositionen anknüpfen. Von einem solchen Vorverständnis entfernt sich dann aber sicherlich die MWA, denn Eigenschaften, Beziehungen und Propositionen sind bestimmt vertrautere Einheiten als mögliche Welten. Der Wert solcher Erklärungen wie der, wonach Propositionen Funktionen seien, die mögliche Welten (oder allgemeiner: Auswertungsumständen) Wahr-
3. Semantik
heitswerte zuweisen, läßt sich daher wohl anzweifeln: Wird hier nicht Naheliegenderes durch Obskures erklärt? Eigentlich sollte es umgekehrt sein; mögliche Welten ⫺ wenn es sie überhaupt gibt ⫺ sollte man mittels Eigenschaften, Beziehungen und Propositionen bestimmen (vgl. dazu etwa Fine 1977: 137⫺ 139 und 150⫺158 sowie von Kutschera 1979: 102). ⫺ Eine Richtung der intensionalen Semantik, die als „Eigenschaftstheorie“ (engl.: „property theory“) bezeichnet wird (vgl. Bealer 1982, Bealer und Mönnich 1989, McMichael 1983, Mönnich 1983, Zalta 1983 und 1988, Menzel 1986, Turner 1987 und 1990 sowie Jubien 1989), verzichtet ganz auf die vermeintlichen Erklärungen der MWA und versucht statt dessen, unsere Vorstellungen über Eigenschaften, Beziehungen und Propositionen direkt, ohne irgendeine Reduktion auf Grundlegenderes in einer Theorie zu systematisieren. Eine Eigenschaftstheorie ist also eine formalisierte Theorie intensionaler Einheiten, die unter anderem als Bedeutungen von Ausdrücken von Informationsmitteln fungieren können, aber auch in anderen Wissensgebieten, zum Beispiel der Wissenschaftstheorie oder der Philosophie des Geistes, Anwendung finden. Die Semantik ist also lediglich ein Anwendungsgebiet einer Eigenschaftstheorie. ⫺ Bei einer solchen Theorie hat man dreierlei zu unterscheiden: (i) die inhaltliche Erklärung der Theorie in einer natürlichen Sprache, (ii) ihren technischen Aufbau mittels einer formalen Sprache, (iii) die metatheoretische Untersuchung dieser formalen Sprache mit logisch-mathematischen Methoden. Diese metatheoretische Untersuchung kann zum Beispiel im Rahmen einer Mengentheorie erfolgen. Das heißt dann aber nicht, daß Eigenschaften, Beziehungen und Propositionen auf Mengen reduziert werden. Eine mengentheoretische Semantik einer Eigenschaftstheorie verfolgt metatheoretische Fragestellungen (etwa die nach Konsistenz und Vollständigkeit) und ist keinesfalls mit der inhaltlichen Erklärung oder Rechtfertigung der untersuchten Theorie zu verwechseln, obwohl sie einer solchen natürlich Argumente liefern kann. Im folgenden sollten für die Ausdrücke einer formalen eigenschaftstheoretischen Sprache die auch bislang für Ausdrücke benutzten griechischen Kleinbuchstaben verwendet werden. Die Einheiten, von denen die Eigenschaftstheorie handelt, werden mit Fettbuchstaben benannt, und für deren formale Repräsentanten (in eigenschaftstheoretischen
153 Modellen) werden lateinische Kleinbuchstaben im Normaldruck benutzt. „Eigenschaftstheorie“ ⫺ dies dürfte mittlerweile schon klar geworden sein ⫺ ist eigentlich eine Verkürzung für „Theorie der Propositionen, Eigenschaften und Beziehungen“ (der „PEB“; vgl. Bealer 1982: 1: „a theory of properties, relations and propositions (PRP)“). Auch in Eigenschaftstheorien ist eine Eigenschaft ein einstelliger Sonderfall; Propositionen lassen sich als 0-stellige Beziehungen auffassen. Eine n-stellige Beziehung (n ⱖ 0) benötigt eben n Gegenstände, um mit ihnen zusammen eine Proposition zu bilden. Obwohl einer Fregeschen Eigenschaftstheorie nichts im Wege stehen würde, gehen Eigenschaftstheorien von Russellschen Propositionen aus (s. Bealer 1982: 160⫺166 und Zalta 1988: 164 ff; Zalta behält aber einige Aspekte der Fregeschen Bedeutungstheorie bei, s. Zalta 1988: Kap. 9). Eine nstellige Beziehung R bildet also ohne Vermittlung von Individuenkonzepten mit n Individuen g1, …, gn eine Proposition P. Wird R vom n-stelligen Prädikator j ausgedrückt und bedeuten die Nominatoren f1, …, fn respektive die Gegenstände g1, …, gn, so drückt dann wie bisher j(f1, …, fn ) P aus. In der metatheoretischen Semantik werden aber ihrem nicht-reduzierbaren Charakter entsprechend Beziehungen R durch nicht weiter analysierte b repräsentiert. Wenn nun die Gegenstände g1, …, gn formal durch g1, …, gn vertreten werden, wie gelangt man dann von b und g1, …, gn zum formalen Repräsentanten p für P? Hier zeigt sich nun deutlich, worauf man eigentlich mit der MWA verzichtet hat. Die funktionale Auffassung intensionaler Einheiten liefert ja zugleich eine Prädikationstheorie, deren formales Bild hier so aussehen würde: Wäre b eine Mögliche-WeltenBeziehung (im Stile der Modellintensionen von (91)), so wäre p die Funktion (lu苸U) [b(u)(g1, …, gn )]. Prädikation ist Anwendung einer Funktion auf passende Argumente mit nachfolgender l-Abstraktion eines (abgesonderten) Mögliche-Welten-Arguments. Eigenschaftstheorien müssen hier eine andere Prädikationstheorie entwickeln. Eine solche ist bereits implizit in der Erklärung dafür enthalten, daß Propositionen 0stellige Beziehungen sind: Eine n-stellige Beziehung hat n Argumentlücken, die man verschließen kann, indem man Gegenstände in sie „einstöpselt“ (engl.: „plug“). Für eine Proposition ist n ⫽ 0; sie ist lückenlos. In eigenschaftstheoretischen Modellen gibt es daher
154 für jede natürliche Zahl m ⬎ 0 eine entsprechende Einstöpselungsfunktion (engl.: „plugging function“) Plugm, die in n-stelligen (Modell-)Beziehungen (n ⱖ m) die jeweils m-te Argumentlücke mit Gegenständen g aus dem Gegenstandsbereich des Modells verschließt. Das Ergebnis b' ⫽ Plugm(b, g) ist eine (n⫺1)stellige Beziehung b'. (Die Metaphorik der Lücken und des Einstöpselns erinnert stark an Freges Theorie der Sättigung, vgl. Menzel (1986: 5 f); man beachte aber, daß Freges ungesättigte Einheiten Funktionen sind und keine zusätzlichen Einstöpselungsoperationen benötigen, um ihren Argumenten Werte zuzuweisen.) Stellt etwa in einem Modell einer Eigenschaftstheorie b die Eigenschaft Q und g den Gegenstand g dar, so ist p ⫽ Plug1(b, g) die Modellrepräsentation der Proposition P, daß g die Eigenschaft Q hat. ⫺ In derselben Weise wie die Einstöpselungsfunktionen die (Modell-)Propositionen bilden, die von syntaktisch einfachen t-Ausdrücken bedeutet werden, ergeben sich die Propositionen komplexer t-Ausdrücke mit Hilfe entsprechender Funktionen Neg, Konj, Adj, Subj, Nec und Pos für die Synkategoremata „ÿ“, „∧“, „∨“, „→“, „첸“ und „앳“. Die Funktionen Omm und Exm (m ⱖ 1) korrespondieren den Quantoren: Ist etwa b zweistellige Relation, so ist Om1(Ex2(b)) die Proposition, daß es zu jedem Individuum ein weiteres gibt, zu dem das erste in der Beziehung b steht, und Ex2(Om1(b)) ist die Proposition, daß es ein Individuum gibt, zu dem jeder Gegenstand die Beziehung b hat. Die Wahrheit einer (Modell-)Proposition p ⫽ Plug(b, g) hängt davon ab, ob g zur Extension der Eigenschaft b gehört. Die Extension einer n-stelligen Beziehung (n ⱖ 1) ist die Klasse der n-stelligen Gegenstandsfolgen, deren Glieder in der Beziehung b zueinander stehen; die Extension einer Proposition ist ihr Wahrheitswert. Die Extensionen intensionaler Einheiten hängen voneinander ab; zum Beispiel konkurriert die Extension der Eigenschaft, weiblich zu sein, mit der der Eigenschaft, männlich zu sein. Ist e¥ Modellextension der ersten Eigenschaft, so paßt von den vielen möglichen Modellextensionen der zweiten Eigenschaft nur eine einzige eμ zu e¥: Wenn e¥ die tatsächliche Extension der Eigenschaft „Weiblich“ ist, so muß eμ die der Eigenschaft „Männlich“ sein. Die möglichen Extensionen der PEBen müssen also jeweils in Gruppen auf einem Schlag bestimmt werden. Eine solche Gruppe zusammengehöriger Extensionen ist die eigenschaftstheoretische
I. Systematik
Entsprechung zum Begriff der möglichen Welt, und es ist bequem, aber durchaus nicht unabdingbar, sich auch in eigenschaftstheoretischen Modellen der möglichen Welten als Indizes zu bedienen. Zu einem solchen Modell E gehört dann eine Klasse U möglicher Welten mit einem ausgezeichneten Element wO als wirklicher Welt. Ansonsten muß ein Modell E auch einen Gegenstandsbereich E und einen Bereich B der PEBen sowie eine Modellfunktion I zur Interpretation der deskriptiven Konstanten haben. Im folgenden soll Bn der Teilbereich der n-stelligen Beziehungen aus B sein. (Weitere Modellbestandteile werden benötigt, wenn man die Ergebnisse der Kontexttheorie, vgl. § 5.2., berücksichtigen will; s. Zalta 1988: 236⫺239). Die Zusammengehörigkeit der Extensionen läßt sich mit Hilfe von U und einem weiteren Modellbestandteil ext beschreiben. Dies ist eine Funktion, die jedem b aus B relativ zu jedem w aus U seine Extension extw(b) (⫽ ext(w, b)) in w zuordnet. Ein eigenschaftstheoretisches Modell ist demnach eine Struktur E ⫽ *E, B, U, wO, ext, Plugm, Neg, Konj, Adj, Subj, Nec, Pos, Omm, Exm, … I +. (Auf die Pünktchen komme ich sogleich zu sprechen.) Mit Hilfe von ext muß auch dafür gesorgt werden, daß die Operationen Plugm, Neg, Konj usw. mit den Wahrheitsbedingungen für Junktoren und Quantoren harmonieren. Für jedes Modell E müssen Bedingungen erfüllt sein, wie sie (96) exemplarisch formuliert. (96) Für g aus E, b aus B1, p1 und p2 aus B0 und w aus U gilt: (96a) extw(Plug1(b, g)) ⫽ W genau dann, wenn g zu extw(b) gehört. (96b) extw(Neg(p1 )) ⫽ extw(p1). (96c) extw(Konj(p1, p2 )) ⫽ (extw(p1) extw(p2)) usw. für Adj und Subj. (96d) extw(Nec(p1 )) ⫽ {extw'(p1) | w' aus U}, und Entsprechendes für Pos. (96e) extw(Om1(b)) ⫽ {extw(Plug1(b, g') | g' aus E}, und das Entsprechende für Ex1. Mit Hilfe der Junktoren lassen sich nun aber nicht nur aus Sätzen wiederum Sätze bilden, sondern beispielsweise aus zwei zweistelligen Prädikatoren wiederum ein Prädikator, und ebenso kann man mit den Quantoren aus Prädikatoren neue bilden. So kann man zum Beispiel aus den Prädikatoren „Va“ und „Mu“ für die Vater- und Mutterrelation (vgl. L(G) aus § 4.3.) mit Hilfe des Junktors „∨“ einen komplexen Ausdruck für die Elternbe-
155
3. Semantik
ziehung bilden. Diese Verwendungsweise der Junktoren war (wieder einmal) schon Analysegegenstand der stoischen Semantik (vgl. Egli 1979: 76). In eigenschaftstheoretischen Sprachen werden diese komplexen Prädikatoren mit Hilfe des l-Operators gebildet, z. B.: „lxy[Mu(x, y) ∨ Va(x, y)]“. ⫺ Um diese Verwendungsweise der Junktoren zu erfassen, müssen eigenschaftstheoretische Modelle noch in zweifacher Hinsicht ergänzt werden: (i) Die Anwendung der Operationen Neg, Konj usw. auf beliebige Elemente aus B (nicht nur solche von B0 ) muß erlaubt werden, und dabei muß zugleich geregelt werden, wie sich die Argumentstellen miteinander kombinierter Beziehungen zu denen des Kombinationsergebnisses verhalten. Die Vater- und die Mutterbeziehung sind zum Beispiel gleichermaßen zweistellig; die Elternrelation ⫺ ihre adjunktive Kombination ⫺ ist aber nicht vierstellig, sondern ebenfalls zweistellig. Offensichtlich werden bei der adjunktiven Kombination die beiden jeweils ersten Argumentstellen der Vater- und Mutterrelation zur ersten Argumentstelle der Elternbeziehung und ebenso die jeweils zweiten Argumentstellen der zu kombinierenden Beziehungen zur zweiten des Kombinationsergebnisses zusammengefaßt. Auf der Ausdrucksebene wird dies durch das Vorkommensmuster der Variablen und ihre Reihenfolge nach dem „l“ angezeigt. Um diese Querbezüge (vgl. oben § 4.1.) semantisch erfassen zu können, benötigt man sogenannte „Buchhalterfunktoren“ (engl.: „book keeping functors“), wie sie in der Zylinderalgebra und der algebraischen Logik untersucht werden (vgl. Henkin, Monk und Tarski 1971 und 1985 sowie Halmos 1962 und Quine 1971). Genau auf diese Operatoren sollten die Pünktchen in „E ⫽ *E, B, U, wO, ext, Plugm, Neg, Konj, Adj, Subj, Nec, Pos, Omm, Exm, …, I +“ hindeuten. (ii) Die Klauseln (96) müssen für die erweiterten Anwendungsmöglichkeiten der Operationen Neg, Konj usw. ergänzt werden. Es ist zum Beispiel genau anzugeben, wie die Extension einer adjunktiven Verknüpfung b ⫽ Adj(b1, b2 ) (in w) zweier Beziehungen b1 und b2 aus den Extensionen von b1 und b2 (in w) zu ermitteln ist. Je nachdem, welche Buchhalterfunktoren gewählt werden, gibt es dabei verschiedene Optionen, zu denen man die bereits angeführte Originalliteratur konsultiere (z. B. Bealer 1982: 49⫺58 sowie Zalta 1983: 113⫺123 und 1988: 236⫺239).
Welcher syntaktischen Kategorie gehören nun aber die l-Ausdrücke an, die komplexe Eigenschaften darstellen? Alle Eigenschaftstheorien gehen davon aus, daß man zum Beispiel mit „lxy[Va(x, y) ∨ Mu(x, y)]“ und „Elt“ in „Elt(1, 2)“ (um nochmals an L(G) angelehnte Beispiele zu verwenden) zwei Ausdrücke für ein und dieselbe Beziehung habe. Aber während in einigen Theorien (z. B. Zalta 1988: 52 und 54) auch beide Ausdrücke Prädikatoren sind, referiert in anderen (Bealer 1982, Menzel 1986; vgl. in diesem Zusammenhang auch Cocchiarella 1986: Kap. 4⫺6 und 1987: Kap. 2 und 4) der l-Term als e-Ausdruck auf eine nicht-prädikative, gesättigte Erscheinungsform der Eigenschaft, dessen prädikative Variante eben „Elt“ ausdrückt. Eigenschaftstheorien der letzteren Art sollen „nominalisierend“ heißen, denn sie bilden ja mit dem l-Operator Nominatoren. Mit so vergegenständlichten Eigenschaften und Beziehungen können nominalisierende Eigenschaftstheorien elegante semantische Erklärungen für Beispielreihen wie (97) liefern. (97a) Heiner joggt (97b) Joggen ist langweilig (97c) Heiner ist langweilig (97d) Jogg(heiner) (97e) Langweil(lx[Jogg(x)]) (97f) Langweil(heiner) In (97a) wird das Joggen dem Heiner zugesprochen (vgl. (97d)), während in (97b) die Eigenschaft, langweilig zu sein vom Joggen ausgesagt wird. Langweilig zu sein, kann man aber auch von normalen Individuen wie Heiner prädizieren, vgl. (97c) und (97f). Informationsmittel, die nur mit Prädikatoren höherer Typen oder (wie L(AL)) mit variablenbindenden Operatoren Eigenschaften von Eigenschaften aussagen können, müßten hier zwei homonyme Ausdrücke „Langweil“ annehmen: einen vom Typ e(t) für langweilige Individuen und einen vom Typ e(t)(t) für langweilige Eigenschaften. Nominalisierende Eigenschaftstheorien kommen mit einem Prädikator aus. Mit der l-Nominalisierung lassen sich sogar Selbstprädikationen wie (98b) ausdrükken. Da aber durch das „l“ prädikativer und referierender Gebrauch streng voneinander geschieden sind, ergeben sich (ohne Zusatzannahmen) keine eigenschaftstheoretischen Versionen der Russellschen Antinomie. (98a) Hans ist dumm (98b) Dumm zu sein ist dumm
156 (98c) Dumm(hans) (98d) Dumm(lx[Dumm(x)]) Durch solche Selbstprädikationen können im Rahmen nominalisierender Eigenschaftstheorien Phänomene semantischer Zirkularität (s. u. § 7. und § 8.) behandelt werden (vgl. Bealer und Mönnich 1989: 187⫺197; mit einem kritischen Vergleich des eigenschaftstheoretischen und des situationstheoretischen Ansatzes bei der Behandlung solcher Phänomene). Von einer Theorie der Eigenschaften, Beziehungen und Propositionen wird man erwarten, daß sie über die Identitätskriterien intensionaler Einheiten Aufschluß gibt. Wann sind die n-stelligen Beziehungen Q und R identisch? Auch auf diese Frage erteilen verschiedene Eigenschaftstheorien unterschiedliche Antworten. Zalta (1983 und 1988) geht dabei von der Unterscheidung zwischen „Erfüllen“ und „Determinieren“ (engl.: „exemplifying“ vs. „encoding“) aus, die von den österreichischen Vorbereitern der Phänomenologie, insbesondere von Ernst Mally, erarbeitet worden ist. Das Erfüllen ist einfach die Umkehrbeziehung des Zutreffens: Ein Gegenstand erfüllt also eine Eigenschaft, wenn diese auf ihn zutrifft. Man kann nun aber auch an Gegenstände denken, sich solche wünschen oder von welchen träumen, die zwar dem Denken, dem Wunsche oder Traum nach ganz bestimmte Eigenschaften besitzen, die es aber gar nicht gibt. Zalta sagt dann im Anschluß an die Phänomenologie und ihre Wegbereiter (vgl. Art. 103), daß hier intentionale Akte auf Gegenstände gerichtet seien, die die betreffenden Eigenschaften determinieren. Zu jeder Eigenschaftsgesamtheit gibt es einen Gegenstand, der genau die Eigenschaften der Gesamtheit und keine anderen determiniert. Ein solcher Gegenstand ist nicht wirklich (Zalta 1988: 21: „ordinary“), d. h. nicht in der Zeit lokalisiert; er ist abstrakt. Abstrakte Gegenstände sind die Individuen, auf die sich intentionale Akte (des Denkens, Wünschens, Träumens usw.) richten. Wirkliche Gegenstände sind nun identisch, wenn sie notwendigerweise und stets dieselben Eigenschaften erfüllen; abstrakte Gegenstände sind gleich, wenn sie notwendigerweise und stets dieselben Eigenschaften determinieren; Eigenschaften sind identisch, wenn sie notwendigerweise und stets von denselben abstrakten Gegenständen determiniert werden (Zalta 1988: 21 f). Diese Bestimmungen lassen sich auf mehrstellige Beziehungen ausdehnen (Zalta 1988: 52). In Zaltas Eigenschaftstheorie ent-
I. Systematik
scheidet also letztendlich die Theorie der abstrakten Gegenstände und der Determinationsbeziehung über die Identität intensionaler Einheiten. Bealer (1982: 53 f und 64⫺68) verfolgt einen anderen Zugang zu diesem Problem, der dem im folgenden Unterabschnitt zu besprechendem Vorgehen ähnelt und daher auch dort skizziert werden soll. 5.3.3. Sinnsemantik In § 5.1.2. wurden aufgrund der Zulässigkeit möglicher Substitutionen extensionale und intensionale Kontexte voneinander unterschieden. In natürlichen Sprachen gibt es aber auch Kontexte, die nicht intensional (und daher erst recht nicht extensional) sind und als „hyperintensional“ bezeichnet werden; vgl. Cresswell (1975), Bressan (1985), Bonotto und Zanardo (1989). Klassische Beispiele dieser hyperintensionalen Kontexte sind die sogenannten „Einstellungsaussagen“ (engl.: „propositional attitude reports“; eine umfassende Darstellung der Literatur findet man bei Cresswell 1985: 137⫺186). Mit einer Einstellungsaussage wird der intentionale Bezug einer Person zu einer Proposition beschrieben. Eine solche Aussage beinhaltet also zum Beispiel, daß die Person an die Wahrheit der Proposition glaubt, um sie weiß, an ihr zweifelt, sich ihre Wahrheit erwünscht, sie befürchtet oder ihr Eintreten verhindern will. ⫺ Ein Beispiel soll illustrieren, daß propositionale Einstellungen entweder nicht auf Propositionen im Sinne der MWA-Konzeption (s. o. § 5.1.4.) gerichtet sein können oder aber ihre Träger manchmal miteinander unverträgliche Einstellungen zur selben MWA-Proposition haben (sie zum Beispiel glauben und zugleich nicht glauben). Die Annahme erscheint plausibel, daß in L(AL) „1110“ und „1001“ dieselbe Intension haben (was man durch entsprechende A-Postulate sichern müßte). Sei nun in einer Erweiterung L(AL)' von L(AL) ep die Kategorie der sich auf Personen beziehenden Ausdrücke. Zu ep soll die Konstante „h“ für einen bestimmten Menschen gehören. Ferner soll es in L(AL)' die Konstante „G“ der Kategorie ept(t) geben, die die intentionale Beziehung zwischen Personen und den von ihnen für wahr gehaltenen (geglaubten) Propositionen darstellt. Dann sagt (99a), daß h glaubt, daß es in unserem Planetensystem neun große Planeten gibt, und (99b) behauptet von derselben Person, daß sie glaubt, es gäbe derer 32.
157
3. Semantik
(99a) G(h, 1001 ⫽ Carx[Pla(x, 䉺) ∧ ÿAoi(x)]) (99b) G(h, 1110 ⫽ Carx[Pla(x, 䉺) ∧ ÿAoi(x)]) Nun können ja durchaus die Rechenkünste von h so bescheiden sein, daß (99a) wahr, (99b) aber falsch ist, obwohl die (99a) und (99b) unterscheidenden Ausdrücke „1001“ und „1110“ nicht nur dieselbe Extension, sondern sogar dieselbe Intension haben und die t-Argumentoren des Funktors „G“ in (99a) und (99b) dieselbe Proposition der MWA-Konzeption ausdrücken. Mit anderen Worten: „G(h, … ⫽ Carx[Pla(x, 䉺) ∧ ÿAoi(x)])“ ist ein hyperintensionaler Kontext. (Die sogenannte „triadische Theorie des Glaubens“, s. Kaplan 1989: Sec. XVII und Zalta 1988: 181⫺184, versucht, der hier auftretenden Schwierigkeit mit der Unterscheidung zwischen Inhalt und Charakter, s. o. § 5.2.2., beizukommen; zu seiner Theorie hyperintensionaler Kontexte vgl. man noch Kaplan (1986).) Auch die revidierte Sub-Regel, die gemäß den in § 5.1.5. gegebenen Hinweisen die alte Regel Sub (s. o. (55)) ersetzt, versagt für hyperintensionale Kontexte. Dieses Versagen des modifizierten Substitutionsprinzips kann man in derselben Weise zu beheben versuchen wie das des ursprünglichen, indem man Hyperintensionen als neue semantische Einheiten einführt. Die Ausdrücke „1110“ und „1001“ hätten dann zwar dieselbe Intension aber unterschiedliche Hyperintensionen; in hyperintensionalen Kontexten dürfen nur Ausdrücke mit derselben Hyperintension gegeneinander ausgetauscht werden. Diese Hyperintensionen müßten epistemischer Art sein, denn offensichtlich hängt ja das erneute Substitutionsversagen mit den unterschiedlichen Rollen zusammen, die die hyperintensionalen Bedeutungen von „1001“ und „1110“ im System des von der Person h Gewußten und Geglaubten spielen. Damit sind die Hyperintensionen den Fregeschen Sinnen weitaus ähnlicher als die (MWA-)Intensionen, da Frege (1892: 25) Sinne als semantische Einheiten einführt, die den „Erkenntniswert“ eines Gedankens, also eines Satzsinnes, beeinflussen. Statt von „Hyperintensionen“ soll daher einfach von „Sinnen“ und dementsprechend von „Sinnsemantik“ gesprochen werden. ⫺ Wenn sie wirklich benötigt werden, sind Sinne neben Extensionen und Intensionen eine dritte Art semantischer Einheiten. In Carnaps Semantik gibt es neben den beiden
Funktionen Dese und Desi (s. o. § 5.1.3. und (78)) noch die dritte Dess, die Ausdrücken ihre Sinne zuordnet. Die meisten semantischen Theorien des Sinns knüpfen an die von Carnap (1947: § 14.) und von Church (1951: 7, 1954 und 1974: 149⫺153) entwickelten Vorstellungen an. Danach sind Sinne gegliederte Intensionen! Carnap nennt Ausdrücke, die in derselben Weise aus intensionsgleichen Ausdrücken aufgebaut sind, „intensional isomorph“: Sie haben dieselbe intensionale Struktur (engl.: „intensional structure“ und „intensional isomorphism“; Carnap 1947: 56). Der Sinn eines Ausdrucks ist die semantische Einheit, die er mit allen Ausdrücken derselben intensionalen Struktur teilt. Einer Idee von Lewis (1970: 33; vgl. auch van Heijenoort 1977) folgend könnte man den Sinn eines Ausdrucks durch einen Baumgraphen darstellen, an dessen Knoten die relevanten Teilausdrucksintensionen stehen. Ist zum Beispiel für eine Zahl n das Konzept in die Intension, die weltinvariant n als ihre Extension bestimmt, und sind entsprechend j.2, j(.2)' und jexp die Intensionen der Funktoren (also nicht der homonymen Ziffern) „0“, „1“ und „exp“ von L(A) (s. o. (72)), so ließen sich die Sinne von „1001“ und „1110“ wie in (100) veranschaulichen. i9 (100a) j(.2)'
i4 j(.2)
i2 j(.2)
i1
i9
(100b) jexp j(.2)'
i3
i2 i1
j(.2)
i1
Die Bäume von (100a) und (100b) stellen unterschiedliche Wege zur selben Intension i9 dar und repräsentieren daher unterschiedliche Sinne. Tichy´ (1988: 1) nennt solche Modi, zu etwas zu gelangen, „Konstruktionen“. Sinne sind dann Konstruktionen gegebenenfalls partieller Mögliche-Welten-Intensionen (vgl. Tichy´ 1988: Kap. 12). Eine Reihe von Problemen ergibt sich daraus, daß solche Sinne ihre Feingliederung de
158 facto vom syntaktischen Bau der zugehörigen Ausdrücke beziehen. Ist die Ähnlichkeit zwischen semantischer Sinnstruktur und syntaktischer Ausdrucksstruktur zu groß, besteht die Gefahr semantischer Antinomien (wie der des Lügners, s. o. § 5.3.1.; vgl. Church 1974: 149 und Anderson 1987b). Auch die Variablennotation zur Querbezugskodierung (vgl. oben § 4.1.) wirft wieder Probleme auf; van Heijenoort (1977: 94) eliminiert daher variablenbindende Operatoren aus seiner Rekonstruktion der Fregeschen Sinnsemantik. Ferner stellt sich die Frage, welche (wenn nicht alle) syntaktischen Beziehungen denn genau sinnstrukturierend sein sollten und welche rein ausdrucksbezogen und ohne Auswirkungen auf den Sinn sind (vgl. etwa die Unterscheidung zwischen interner und externer Prädikation bei Aczel (1989: 18⫺21)). Ganz erhebliche Schwierigkeiten sind zu überwinden, wenn man die Sinne solcher Funktoren wie „G“ von L(AL)' als Funktionen analysieren will, die strukturierte Sinne zu ihren Argumenten nehmen. Stellt man in seiner Semantik komplexe Einheiten als Mengen dar, die sich letztendlich aus Wahrheitswerten, Gegenständen und möglichen Welten als ihren Urelementen aufbauen, so wird man naheliegenderweise die Beziehung der Sinnkonstituenz mithilfe der Elementschaftsrelation repräsentieren: Ist der Sinn s Konstituente des Sinns s', so ist mengentheoretisch s Element von s', oder es gibt ein Element x von s', dessen Element s ist, oder es gibt ein Element y von s', das ein solches x zum Element hat, oder usw. D. h.: s 苸 x 苸 y … 苸 s'. Ist nun etwa G der funktional aufgefaßte Sinn von „G“, so muß G Paaren *i, P+ von Individuensinnen i und propositionalen Sinnen als Werte propositionale Sinne P' ⫽ G(i, P) zuordnen. Nach mengentheoretischer Funktionsauffassung heißt dies aber: **i, P+, P'+ 苸 G. Nun kann auch P Sinn einer Einstellungsaussage sein; dann wird P' von einer sogenannten „iterierten Einstellungsaussage“ ausgedrückt, vgl. (101). (101) G(h, G(h, 1001 ⫽ Carx[Pla(x, 䉺) ∧ ÿAoi(x)])) In einem solchen Fall müßte dann G 苸 … 苸 p sein, da G ja Konstituente des Sinns P ist. Also insgesamt: G 苸 … 苸 p 苸 … 苸 G. Die Existenz einer solchen Menge wird aber von den üblichen Mengentheorien ausgeschlossen, weil sie zu Widersprüchen führen kann (vgl. unten § 8.2.). Die in der Literatur diskutierten Auswege aus dieser Schwierigkeit
I. Systematik
(Bressan 1985, Tichy´ 1988: Kap. 12) sind ziemlich kompliziert. Sie knüpfen (in der einen oder anderen Form) an die sogenannte „verzweigte Typentheorie“ an und teilen Sinne nicht nur in propositionale, individuenbezogene, relationale (verschiedener Stelligkeit) ein, sondern unterteilen jeden Typ nochmals in Ordnungen, die gewissermaßen die syntaktische Einbettungstiefe der „daß“Sätze in Einstellungsaussagen natürlicher Sprachen widerspiegeln. Möglicherweise ist eine so komplizierte Theorie aber nicht nur aus dem hier angeführten, sondern aus einer ganzen Reihe von Gründen tatsächlich notwendig; vgl. neben der bereits angeführten Literatur noch Church (1976), Anderson (1987b) und Rheinwald (1988). Einen alternativen Lösungsversuch für das Problem iterierter Einstellungsaussagen hat im Rahmen einer nicht verzweigenden Logik Forbes (1993) entwickelt. Vielleicht gibt es aber auch eigenschaftstheoretische Alternativen. Bealer (1982: 52⫺58 und 64⫺67) erwägt die Möglichkeit, Identitätskriterien für Eigenschaften, Relationen und Propositionen so streng zu fassen, daß sie strukturierten Sinnen entsprechen. In Modellen E ⫽ *E, B, U, wO, Plugm, Neg, Konj, …, I + der Eigenschaftstheorie müßten dann die Operationen Plugm, Neg, Konj, … so durch Eindeutigkeitsforderungen eingeschränkt werden, daß sich die Elemente von B durch Bäume wie die von (100) darstellen ließen. Anderson (1987a: 131⫺136) weist auf einige Schwierigkeiten hin, die ein solches Vorgehen zu überwinden hätte. Zalta (1988: Kap. 9 und 10) versucht, das Problem der Einstellungsaussagen in seiner Theorie der Determination und der abstrakten Gegenstände zu lösen (vgl. den Schluß von § 5.3.2.). ⫺ Eins dürfte aus dieser skizzenhaften Darstellung verschiedener Ansätze zu einer Sinnsemantik wohl hervorgegangen sein: Die Analyse der Einstellungsaussagen gehört zu den Frontgebieten gegenwärtiger Semantikforschung und birgt eine Reihe noch ungelöster Probleme; vgl. noch Asher (1986) und Zeevat (1986), die einen DRT-Ansatz (s. § 4.8.) verfolgen, sowie Barwise und Perry (1983: Teil D) zum situationssemantischen Lösungsvorschlag. 5.4. Theorie kommunikativer Kräfte Nach den Erklärungen der Grundbegriffe der intensionalen Semantik können nun einige vorläufige Erläuterungen des 1. Abschnitts wieder aufgegriffen und präzisiert werden.
3. Semantik
Dort wurden zwei Komponenten des semantischen Systems S eines Informationsmittels I unterschieden: Die erste Komponente, für die nun das Kürzel „C(S)“ verwendet werden soll, interpretieren deskriptive Bedeutungen. Der Aufbau von C(S) wird durch einen semantischen Schlüsselbegriff (z. B.: Wahrheit, Folge) beherrscht. Die zweite Komponente, deren Abkürzung „F(S)“ sein soll, untersucht, wie die Benutzer von I mit den so interpretierten Ausdrücken tatsächlich kommunizieren, indem sie etwa mit ihnen Behauptungen aufstellen, Befehle erteilen, Wünsche äußern oder Fragen stellen. In Anschluß an Dummett (1976: 74) soll C(S) als „Kernkomponente“ von S bezeichnet werden; F(S) ist die mit I befaßte „Kraftkomponente“ (s. o. § 1.1.). Da I kein sprachliches Informationsmittel sein muß, soll hier statt von „illokutionären“ allgemeiner von „kommunikativen“ Kräften die Rede sein (zur semiotischen Analyse von Kommunikation vgl. Art. 4 sowie Posner 1993). Im folgenden sollen einige Begriffe aus der Krafttheorie auf dem Hintergrund der in diesem Abschnitt bisher besprochenen Theorien erklärt werden (§ 5.4.1.). In § 5.4.2. werden dann einige Hypothesen über den Zusammenhang zwischen F(S) und C(S) diskutiert, und in § 5.4.3. wird ein Vorschlag zur Klassifikation kommunikativer Kräfte skizziert. 5.4.1. Kommunikative Akte und Kräfte Sei I irgendein für diesen Abschnitt fest gewähltes Informationsmittel; dann soll L die Klasse derjenigen Ausdrücke jedweder Kategorie mit Bedeutungen jedweden Typs sein, die in I-Semiosen selbständig realisiert werden können. Die Ausdrücke aus L müssen also durchaus nicht der Kategorie t zugehören; für die Kommunikation spielen ja auch andere als wahrheitsfähige Ausdrücke eine Rolle. Für das Deutsche müßte etwa L auch Ausdrücke wie „Wer hat dieses Buch geschrieben?“, „John Searle!“ oder „Ein Amerikaner!“ zu L gehören. C soll die Klasse derjenigen Kontexte sein, in denen diese Ausdrücke realisierbar sind. Für die meisten Informationsmittel werden die Kontexte aus C reicher strukturiert sein müssen als die von L(LD) (s. o. § 5.2.5.). Für I soll insbesondere angenommen werden, daß ein c aus C neben einer Senderkoordinate cS auch eine für den Empfänger cR hat. Ferner nehme ich in diesem Abschnitt, um die Darstellung einfacher zu halten, die erste der zum Schluß von § 5.1.4. angesprochenen semantischen Ein-
159 stellungen an: C soll also kein bloßer Bestandteil irgendeines Modells für I, sondern wirklich die Gesamtheit der echten Kontexte für I sein. Dasselbe gilt für die im folgenden zu erwähnenden semantischen Einheiten (Propositionen usw.). Die in § 5.2. erläuterten Begriffe sollen entweder in der dort angegebenen Form oder in einer eigenschaftstheoretischen Reformulierung (vgl. etwa Zalta 1988: 61⫺88 und 196⫺202) zur Verfügung stehen. ⫺ Verwendungen sollen wieder Ausdrucks-Kontext-Paare v ⫽ *z, c+ (z aus L und c aus C) sein; V (⫽ L ⫻ C) ist die Klasse aller Verwendungen. Es ist nicht nötig, daß im Kontext c einer Verwendung v ⫽ *z, c+ tatsächlich ein token von z realisiert wird. Vielfach hat man es nämlich in der Theorie der Kraftkomponente (kurz: in der Krafttheorie) mit der Frage zu tun, welchen Effekt eine Realisation von z gehabt hätte, wenn es in c realisiert worden wäre. Aufgrund solcher Fragestellungen muß man den Verwendungsbegriff so allgemein bestimmen, daß auch kontrafaktische Verwendungen zugelassen werden (vgl. Kamp 1978: 260). Nach einer zentralen Hypothese der meisten Krafttheorien ist das, worauf der Sender in einer Verwendung mit einem Ausdruck überhaupt hinauswollen kann, überschaubar, d. h.: Es gibt eine definitorisch abgrenzbare Anzahl kommunikativer Kräfte f1, f2, …, fn, … einer Klasse F, so daß in jeder Verwendung *z, c+ der Sender cS mit einer mit z verknüpften semantischen Einheit j (einer Proposition, Eigenschaft usw.) auf den Empfänger cR eine Kraft f aus F ausübt. Dabei wäre die einfachste Verknüpfung zwischen z und j die, daß j der von z im Kontext c ausgedrückte Inhalt (s. o. § 5.2.2.) ist: j ⫽ {z}c. Aber es sind auch verwickeltere Beziehungen zwischen j und z denkbar, auf die ich gleich zu sprechen komme. Der Sender cS kann zum Beispiel den Inhalt j gegenüber cR als wahr behaupten; dann übermittelt er j mit der behauptenden Kraft f. Er kann sich aber auch gegenüber cR dazu verpflichten, für die Wahrheit von j in der Zukunft zu sorgen; dann versieht er j mit der kommissiven Kraft fK. Die Gesamtbedeutung des Ausdrucks z in der Verwendung c läßt sich somit durch ein Paar *f, j+ darstellen. Ein solches Paar nennt Gazdar (1981: 68) eine „Sprechaktzuweisung“ („speech act assignment“). Da I aber keine Sprache sein muß und in einem solchen Paar einem Inhalt eine kommunikative Kraft zugewiesen wird, soll hier der Terminus „Kraftzuweisung“ gebraucht werden. Nicht
160 jede Kraft ist jedem Inhalt zuweisbar. Ist J die Klasse der mit L-Ausdrücken übermittelbaren Inhalte, so umfaßt die Klasse Z der zulässigen Kraftzuweisungen nur einen Teil aller möglichen Kraft-Inhalt-Paare (Z 債 F⫻J; wobei Z ⫽ F ⫻ J für die meisten Informationsmittel gilt). Die von W-Interrogativen („Wer …?“, „Wo …?“ usw.) ausgedrückten Inhalte zum Beispiel sind nicht behauptbar. Polare Interrogative (Entscheidungsfragesätze) analysieren aber beispielsweise Frege (1918/1919: 62) und Tichy´ (1978: 282) so, daß ihre Inhalte auch behauptbar sind, während dies in der Fragesemantik Hamblins (1971: 133) nicht möglich ist. Dort sind die Inhalte polarer Interrogative Klassen behauptbarer Inhalte und daher selbst nicht behauptbar. Nach Hamblins Analyse unterscheiden sich also polare Interrogative und Assertive bereits in ihrer deskriptiven Bedeutung (s. o. § 1.1.), während nach Frege und Tichy´ lediglich ein in der Krafttheorie zu behandelnder Unterschied hinsichtlich ihrer Verwendbarkeit besteht. Man erkennt hieran die Konsequenzen unterschiedlicher Grenzziehungen zwischen C(S) und F(S). Ein kommunikativer Akt (in der Linguistik: Sprechakt oder illokutionärer Akt) ist eine vom Sender c'S unter Benutzung eines mit einer Kraft versehenen Inhalts verursachte Veränderung des Ausgangskontextes c' zu einem neuen Kontext c". Kommunikative Akte z* können also als Funktionen aufgefaßt werden, die Kontexte c' als ihre Ausgangslagen auf Kontexte c" ⫽ z*(z') als Resultate abbilden (vgl. Gazdar 1981: 68 f). Nicht jeder Akt ist in jedem Kontext vollziehbar. Einen Befehl kann cS z. B. nur dann erteilen, wenn er in c Befehlsgewalt hat. Kommunikative Akte sind also partielle Funktionen; die Klasse Z* aller kommunikativen Akte ist eine Teilklasse von C債(C). Welcher kommunikative Akt jeweils vollzogen wird, hängt wiederum funktional vom verwendeten Inhalt j aus J und der benutzten Kraft f aus F ab: f weist j den Akt z* als Kontextveränderung zu. Auch die Klasse F der kommunikativen Kräfte ist somit eine Funktionenklasse: F ist Teilklasse von Z*債(J) (⫽ (C債(C) )債(J). Kräfte sind partielle Funktionen, weil nicht jeder Inhalt entlang einer bestimmten Kraft kontextverändernd wirken kann. Das Verhältnis von Kraftzuweisungen Z und kommunikativen Akten Z* beschreibt die folgende Gleichung: Z* ⫽ {f(j) | *f, j+ aus Z} (s. Gazdar 1981: 70).
I. Systematik
Die Hauptzwecke von F(S) besteht darin, mit Hilfe einer Funktion $ anzugeben, welche Inhalte mit welchen Kräften mittels eines Ausdrucks z in einem Kontext c übermittelt werden: $ ordnet also jeder Verwendung v ⫽ *z, c+ aus V die Klasse $(z, c) aller Kraftzuweisungen *f, j+ zu, für die f(j) ein mittels z in c vollziehbarer kommunikativer Akt ist (vgl. Gazdar 1981: 71). Über die genauen Eigenschaften von $ besteht allerdings wenig Übereinstimmung. Hier können daher auch nur einige Probleme angesprochen, aber keine definitiven Antworten gegeben werden. ⫺ Ist $ eine totale oder partielle Funktion? Für den Fall sprachlicher Informationsmittel nimmt Searle (1975a: 359) zumindest dann, wenn v ⫽ *z, c+ wirkliche und nicht bloß kontrafaktische (s. o. § 5.3.1.) Verwendung ist, an, daß $(z, c) stets definiert ist: Jede Äußerung ist Vollzug mindestens eines illokutionären Aktes! Wird bei jeder Verwendung auch nur höchstens eine Kraft ausgeübt? Hat $(z, c), wenn es definiert ist, stets nur ein einziges Element? Searle (1975a: 359) läßt die Möglichkeit des gleichzeitigen Vollzugs mehrerer („one or more“) Akte zu. Levinson (1981: 476) verweist auf Dialogabschnitte wie (102), um zu zeigen, daß hier A zugleich ein Angebot abgibt und eine Frage stellt. (102) A: „Möchten Sie noch etwas zu trinken?“ B: „Danke, ja!“ Mit „Danke“ reagiere B auf A’s Angebot, mit „Ja“ auf dessen Frage. Zwei Probleme der Charakterisierung von $ haben besondere Aufmerksamkeit gefunden: Angenommen, daß *f, j+ zu $(z, c) gehört; was genau an z veranlaßt (i) die Wahl der Kraft f aus F, und wie wird (ii) der Inhalt j ermittelt? Die erste Frage soll in § 5.3.2. diskutiert werden; hier gehe ich nur auf das zweite Problem ein. Wie bereits gesagt, der einfachste Fall ist j ⫽ {z}c. Aber zum Beispiel Interrogative wie „Kannst Du das Fenster öffnen?“ werden fast nie als Fragen nach einer bestimmten Fähigkeit, sondern nahezu immer als Bitten um deren Ausübung interpretiert. D. h.: cR wird darum gebeten, das Fenster zu öffnen, nicht danach gefragt, ob er das Fenster öffnen könne! Solche Fälle werden in der Sprechakttheorie als „indirekte Sprechakte“ (Searle 1975b) bezeichnet. Sie werfen sowohl für die Zuordnung der richtigen Kraft ⫺ bittende Kraft fB! statt fragender fF! ⫺ wie auch für die Ermittlung des Inhalts ⫺ die Bedeutung des Modalverbs scheint
3. Semantik
ignoriert zu werden ⫺ schwierige Probleme auf. Wie man den Inhalt hier bestimmt, wird in der Theorie der Gesprächsandeutungen (konversationellen Implikaturen; s. Grice 1975 und 1978, Gazdar 1979: Kap. 3 sowie Posner 1979) untersucht. Die Differenzen zwischen den von C(S) gelieferten und den tatsächlich übermittelten Inhalten sollen in dieser Theorie aufgrund von Konversationsmaximen erklärt werden. Das sind Postulate, die die Globalstruktur von Gesprächen reglementieren. Die berühmteste Zusammenstellung solcher globalen Regeln stammt von Grice (1975), der seinen Regelkanon nach dem Vorbild der Kantischen Kategorientafel in vier Gruppen gliedert: Maximen der Quantität, Qualität, Relation und solche der Modalität. Die Maximen der letzten Gruppe verlangen zum Beispiel von Gesprächsteilnehmern, Unklarheiten, Mehrdeutigkeiten, Weitschweifigkeiten und Unordnung in ihren Gesprächsbeiträgen zu vermeiden. Das dritte dieser Postulate verbietet also auch, Gespräche dadurch ungebührlich in die Länge zu ziehen, daß man nach ohnehin Offenkundigem auch noch fragt. Da sich Gesprächsteilnehmer gewöhnlich im Interesse einer funktionierenden und effizienten Kommunikation nach den Maximen richten, wird die Verwendung eines z, mit dessen von C(S) bestimmtem Inhalt j der Sender cS in c gegen eine der Maximen verstößt, uminterpretiert, so daß nur ein vermeintlicher, aber kein tatsächlicher Verstoß vorliegt. Ist zum Beispiel in c klar, daß cR das gemeinte Fenster öffnen kann, wird eine Verwendung des angeführten Interrogativs eben nicht als Frage, sondern als Bitte verstanden; und da der Besitz der Fähigkeit offenkundig ist, wird cR nicht um deren Erwerb, sondern um deren Ausübung gebeten. Konkrete Anwendungen der Konversationsmaximen basieren demnach auf dem, was von allen Gesprächsteilnehmern als gemeinsamer Hintergrund vorausgesetzt und akzeptiert wird. Dazu zählen etwa die üblichen Annahmen über die körperlichen Fähigkeiten der Gesprächsteilnehmer (normalerweise können sie Fenster öffnen) und über den Zustand der Umgebung (normalerweise lassen sich Fenster in Nicht-Hochhäusern öffnen). Die gemeinsamen Hintergrundannahmen der Beteiligten können durch eine Klasse B von Auswertungsumständen des benutzten Informationsmittels I dargestellt werden (vgl. Stalnaker 1978: 322). Sind die Auswertungsumstände r von I so wie die von
161 L(LD) Zeit-Welt-Paare *t, w+, so bedeutet die Zugehörigkeit eines solchen Paares r zu B, daß die Beteiligten, nach allem, was ihnen bekannt ist, sich zur Zeit t in der Welt w befinden könnten. Damit die Funktion $ auf den gemeinsamen Hintergrund B zurückgreifen kann, muß dieser als zusätzliche Koordinate cB ⫽ B in Kontexten berücksichtigt werden. Dies ist auch deshalb notwendig, weil die geteilten Hintergrundannahmen typischerweise durch kommunikative Akte aus Z* verändert werden. Ist zum Beispiel die behauptende Kraft f für c definiert und c' ⫽ f(c), so sollte cB' echte Teilmenge von cB sein; mit anderen Worten: Durch Behauptungen sollten die Beteiligten besser informiert werden, indem einige Optionen aus cB eliminiert werden (vgl. Stalnaker 1978: 323). Nach Einführung der zusätzlichen Kontextkoordinate cB lassen sich die Konversationsmaximen partiell als Prinzipien verstehen, die das Zusammenspiel von cB mit den Charakteren (s. o. § 5.2.2.) der in c benutzten Ausdrücke regeln (vgl. Stalnaker 1978: 325) und dadurch die Zuordnungsmöglichkeiten von $ beschränken. Man erinnere sich, daß die Koordinaten der Auswertungsumstände zugleich Kontextkoordinaten sind: Wenn die Elemente von cB entlang einer semantischen Dimension (s. o. § 5.2.1.) variieren, so sind die an c Beteiligten unsicher, wie ihr eigener Kontext hinsichtlich dieser Dimension einzuordnen ist. Sie können sich etwa darüber im Unklaren sein, wie spät es ist; und normalerweise werden sie nicht wissen, welche Welt die wirkliche ist. Aber das, was in c mit einem benutzten z übermittelt wird, muß von solchen Unsicherheiten unberührt bleiben. Es darf zur Ermittlung des mit z verknüpften Inhalts keine Information notwendig sein, die den Beteiligten nicht zur Verfügung steht; denn dann könnten sie ja nie herausbekommen, was eigentlich gemeint ist. Für $ ergibt sich daraus das folgende Prinzip: Gehört *f, j+ zu $(z, c), ist r ein Auswertungsumstand aus cB und c' ein Kontext, der sich von c lediglich darin unterscheidet, daß er in den Auswertungsumständen und Kontexten gemeinsamen Koordinaten mit r übereinstimmt, so ist j ⫽ {z}c'. (Dieses Prinzip müßte in einer genaueren Fassung Abhängigkeiten zwischen verschiedenen Kontextkoordinaten entweder gänzlich eliminieren oder eben gebührend berücksichtigen; vgl. Lewis (1980: 5)!) D. h.: Der Sender cS soll sein z so wählen, daß bei aller bestehenden Unsicherheit dennoch klar ist, was er meint. Offensichtlich
162 trifft dies genau die Tendenz der oben angeführten Maximen der Modalität: Vermeide alles, was irgendwie zu Mißverständnissen führen könnte! Variiert nun der durch C(S) festgelegte Charakter {z} dennoch in Rahmen von cB, so müssen die an c Beteiligten z uminterpretieren, wozu ihnen als Ausgangsmaterial die verschiedenen Optionen j, j1, j2, … zur Verfügung stehen, die z in c ausdrücken könnte. Stalnaker (1978: 328) schlägt dazu eine Interpretationsstrategie vor, die von einer charaktersensitiven Operation ⫺ der sogenannten „Diagonalisierung“ ⫺ Gebrauch macht. Eine solche Operation verstößt natürlich gegen das Monsterverbot (s. o. § 5.2.5.). Wenn dieses also eine semantische Gesetzmäßigkeit ist, so befindet man sich nun mit der Uminterpretation von Ausdrücken, deren Verwendung prima facie gegen die Konversationsmaximen verstoßen, auf dem Gebiet der Pragmatik. ⫺ Damit sei hier die skizzenhafte Diskussion der Bedingungen beendet, die ein Inhalt j erfüllen muß, damit *f, j+ zu $(z, c) gehört. Die beiden Probleme, wie f zu ermitteln und dann in F(S) zu behandeln ist, thematisiert der folgende Unterabschnitt. 5.4.2. Semantik der Kraftindikatoren Zur Festlegung der Kraft f in einem Paar *f, j+ aus $(z, c) kann $ unter anderem ebenso auf die syntaktischen Eigenschaften von z zurückgreifen, wie dies { } zur Bestimmung des Charakters von z tut. Eine syntaktische Eigenschaft, die einen nicht notwendigerweise eindeutigen Hinweis auf eine bestimmte Kraft gibt, wird in der Sprechakttheorie als „IFID“ (⫽ „illocutionary force indicating device“; Searle 1969: 30) oder als „Illokutionsindikator“ bezeichnet. Unter Ausschaltung linguistischer Konnotationen soll hier allgemeiner von „Kraftindikatoren“ die Rede sein. Zu den Kraftindikatoren natürlicher Sprachen zählen etwa Verbmodus, Intonation und Wortstellung. Kraftindikatoren bei den in Europa üblichen Verkehrszeichen sind deren Farbe und Gestalt: So zeigen ein roter Rand und eine dreieckige Gestalt eine Warnung an, ein rundes Schild mit rotem Rand ist als Verbot aufzufassen, und ein rundes Schild mit blauem Hintergrund verweist auf ein Gebot. Die semantische Behandlung der Kraftindikatoren hängt wesentlich davon ab, wie das Verhältnis von C(S) zu F(S) konzipiert wird. Bereits in § 1.2. wurden hier monistische und dualistische Auffassungen unterschieden: Monistische Ansätze ordnen
I. Systematik die eine Komponente von S der jeweils anderen unter. Entweder ist C(S) lediglich eine Teiltheorie des S gänzlich ausschöpfenden Teils F(S), oder F(S) soll in irgendeiner Weise auf C(S) reduzierbar sein. Dualistische Ansätze gehen hingegen davon aus, daß beide Teile jeweils für sie typische und nicht reduzierbare Begriffe und Grundsätze besitzen. Monistische Ansätze haben mit den Kraftindikatoren keine prinzipiellen Schwierigkeiten; sie behandeln ja alle Ausdrücke letztlich in derselben Weise. Das heißt aber nicht, daß keine deskriptiven Probleme auftreten könnten. Vertreter dualistischer Positionen müssen sich für F(S) etwas Neues ausdenken. Leider muß gesagt werden, daß sie sich häufig darauf beschränken, F(S) für von C(S) verschieden zu erklären, ohne genauere Angaben über F(S) zu machen. Versuche, in einem monistischen (oder freundlicher: einheitlichen) Rahmen, C(S) auf F(S) zu reduzieren, findet man etwa bei Alston (1964: Kap. 2) oder bei Vanderveken (1983: insb. 384, Bed. (iv)); vgl. auch Vanderveken (1982: 11, Fn. 5), wo er das Projekt einer illokutionären Logik (Searle und Vanderveken 1985) dem reduktionistischen Programm zuordnet. Kernstück beider Reduktionsversuche ist die Angabe eines Kriteriums der propositionalen Identität, das rein krafttheoretisch formuliert ist. Wenn die propositionsbedeutenden Ausdrücke die Träger des den Aufbau von C(S) bestimmenden Schlüsselbegriffs sind, so wird mit Angabe dieses Kriteriums tatsächlich C(S) in F(S) eingebettet. Beide Versuche sind aber eher bedeutungstheoretischer und programmatischer als semantisch-deskriptiver Art. ⫺ Einen noch radikaleren Versuch als Alston und Vanderveken unternimmt Hamblin (1971: 144⫺151): Er möchte semantische Einheiten und Beziehungen aufgrund krafttheoretischer Prinzipien bestimmen, die nicht bloß einzelne kommunikative Kräfte oder Akte betreffen, sondern deren Abfolgemuster in Semiosen reglementieren. Hamblin zeigt sogar, wie einige wichtige C(S)-Begriffe aufgrund solcher Abfolgeregeln im Falle einfacher Informationsmittel definiert werden können. Allerdings wird man aufgrund der Einfachheit der behandelten Informationsmittel und der beschränkten Anzahl der mit ihren Ausdrücken ausübbaren Kräfte auch hier von einem eher programmatischen Ansatz sprechen wollen.
Der bekannteste Versuch, in gegenläufiger Richtung (also F(S) auf C(S)) zu reduzieren, ist die Performative Hypothese oder Performative Analyse (kurz: PA). Die PA ist in den 70er Jahren von Linguisten im Rahmen der Generativen Semantik entwickelt worden (vgl. etwa Ross 1970 und Sadock 1974). Eine neuere Darstellung der PA findet man bei Sadock (1988), der zwar einräumt, daß die meisten Semantiker die PA für gescheitert halten, aber zugleich auf das Fehlen tragfähiger Alternativen hinweist (insbesondere Sadock 1988: 189). ⫺ Die PA ist keine Einzelhypo-
3. Semantik
these, sondern ein Bündel syntaktischer und semantischer Annahmen. Sie räumt einer ganz besonderen Klasse von Kraftindikatoren eine hervorragende Rolle ein: den performativen Verben. Das sind Verben wie zum Beispiel „behaupten“, „fragen“, „befehlen“ usw., deren Substantivierungen gerade zur Benennung kommunikativer Kräfte verwendet werden. Mit einem Satz (einer indoeuropäischen Sprache), der ein solches Verb in der 1. Person Präsens Indikativ enthält, kann ein Sender einen Akt vollziehen, dessen Kraft die Substantivierung des betreffenden Verbs benennt. Mit (103a) kann er eine Behauptung aufstellen, mit (103b) einen Befehl erteilen und mit (103c) eine Frage stellen. (103a) Ich behaupte, daß die Anzahl der großen Planeten unseres Sonnensystems 9 ist. (103b) Ich befehle Ihnen, heute abend im Observatorium die großen Planeten unseres Sonnensystems einmal zu zählen! (103c) Ich frage Sie, ob die Anzahl der großen Planeten unseres Sonnensystems wirklich 9 ist. Ausdrücke dieser Art heißen „(explizit) performativ“; ihr jeweiliges Anfangsstück mit dem performativen Verb wird als „performativer Vorspann“ bezeichnet. Die PA sieht nun solche explizit performativen Ausdrücke sowohl syntaktisch als auch semantisch als Standardfälle der in Semiosen selbständig verwendbaren Ausdrücke an. In ihren frühesten Varianten nahm die PA an, daß die Ausdrücke z, die gewöhnlich zum Vollzug kommunikativer Akte verwendet werden, stets mithilfe syntaktischer Operationen gebildet werden, die z mit einem performativen Vorspann ausstatten. Daß dennoch nicht alle Ausdrücke explizit performativ sind, liegt lediglich an der Existenz von Tilgungsoperationen, mit denen diese Vorspänne löschbar sind (ähnlich wie z. B. die ambiguierenden Operationen von FO dort strukturierende Klammern streichen). Jeder Ausdruck besitzt also einen performativen Vorspann, der entweder tatsächlich als Teilausdruck vorkommt oder aber versteckt (durch anschließende Tilgungsoperationen gänzlich oder bis auf bestimmte Reste gelöscht worden) ist. Auf diesen Vorspann kann dann $ bei Zuordnung der Kraftzuweisungen zurückgreifen. Neuere Formulierungen der PA (z. B. Sadock 1988: 188) sind zurückhaltender: Es wird nur noch behauptet, daß nicht-performative Ausdrücke in ihren syntaktischen Eigenschaften
163 den Teilen performativer Ausdrücke ähneln („resemble“) würden, die den Vorspännen folgen. Die folgenden drei Annahmen machen die semantische Kernaussage der PA aus. PA1: Ist z ein nicht-performativer Ausdruck und gehört die Kraftzuweisung z ⫽ *f, j+ zu $(z, c), so gibt es eine explizit performative Reformulierung j von z (die z. B. in der Erweiterung von z um einen performativen Vorspann bestehen kann), so daß z auch zu $(j, c) gehört. PA2: Ist z ein performativer Ausdruck mit einem Vorspannverb, dessen Substantivierung die Kraft f benennt, so gilt für jeden Kontext c und jede Kraftzuweisung *f1, j+, die zu $(z, c) gehört, daß f1 ⫽ f ist. PA3: Den syntaktischen Kategorien, zu denen performative Ausdrücke gehören, ordnet die Typenzuordnung t zu; mit anderen Worten: Sie haben einen Wahrheitswert. Mit diesen drei Hypothesen erreicht die PA ihr Ziel: „[…] to reduce all force to ordinary sense and reference“, Sadock (1988: 188); vgl. auch Lakoff (1970: 261), der die Pragmatik (im Sinne von F(S)) wegen der PA als „garden variety“ der Semantik (⫽ C(S)) ansieht. Welche Kräfte $ Ausdrucksverwendungen zuweist, ist bestimmt durch die Zuordnungen, die diese Funktion für performative Ausdrücke trifft (PA1). Bei diesen hängt die jeweils zuzuweisende Kraft vom performativen Vorspann ab (PA2), der wahrheits- oder modelltheoretisch behandelbar ist (PA3). Hier soll lediglich auf eine Schwierigkeit der PA hingewiesen werden, die als „das Performadox“ (Boe¨r und Lycan 1980) bekannt geworden ist. Das Performadox hat die logische Form eines Dilemmas. Das eine Horn des Dilemmas ist die Annahme, daß der in C(S) festgelegte Inhalt des Vorspanns eines performativen Ausdrucks z zum übermittelten Inhalt eines mit z vollzogenen kommunikativen Akts gehört. Diese Annahme führt aber für einige Ausdrücke zu fehlerhaften Wahrheitsbedingungen. Für (103a) würde man zum Beispiel die Wahrheitsbedingungen unter Einbeziehung des Vorspanns ungefähr so formulieren: (103a) ist genau dann wahr in c, wenn cS in c behauptet, daß die Anzahl der großen Planeten unseres Sonnensystems 9 ist. Damit wird (103a) aber zum Selbstverifizierer: Um (103a) wahr zu machen, muß cS lediglich (103a) äußern. (Dabei wird vorausgesetzt, daß in c die für den Vollzug einer solchen Behauptung notwendigen Bedingungen ⫺ etwa daß cS an ihren Inhalt glaubt usw. ⫺ vorliegen.) Ein nicht-performativer Ausdruck, mit dem dasselbe wie mit (103a) behauptet wird, zum Beispiel: „Die Anzahl der gro-
164 ßen Planeten unseres Sonnensystems ist 9“, ist jedoch kein Selbstverifizierer. Da alle performativen Reformulierungen eines solchen Ausdrucks, die den Behauptungscharakter explizit machen, ebenso wie (103a) selbstverifizierend sind, können nach (PA1) und (PA2) die Inhalte der Vorspänne nicht zum übermittelten Inhalt gehören, andernfalls müßte der angeführte nicht-performative Ausdruck dieselben Wahrheitsbedingungen wie (103a) haben, was klarerweise nicht der Fall ist. Die erreichte Schlußfolgerung, daß der Vorspann nichts zum übermittelten Inhalt beiträgt, ist das zweite Horn des Dilemmas. Nun ist aber der Vorspann durch Sprechaktadverbiale (wie z. B. „ernsthaft“ in „Ich behaupte ernsthaft, daß …“) modifizierbar, und eine solche Modifikation betrifft den gesamten übermittelten Inhalt und nicht allein die Kraft. Niemand wird zwischen der kommunikativen Kraft der Behauptung und der der ernsthaften Behauptung unterscheiden wollen. Die Vielzahl der Sprechaktadverbiale würde, wären sie lediglich kraftmodifizierend, auch zu einer Inflation der kommunikativen Kräfte führen. Demnach trägt der performative Vorspann doch zum Inhalt bei, und seine Rolle erschöpft sich nicht in der Kraftindikation. Damit wäre man aber wieder beim ersten Horn des Dilemmas mit seinen unakzeptablen Konsequenzen! Eine Lösung des Performadoxes ist die Aufgabe oder Abschwächung von (PA2). Heim (1977: 52) und Vanderveken (1983: 377) vertreten zum Beispiel die Auffassung, daß mit Performativen (zumindest auch) die deklarationale Kraft verknüpft ist. Ein im Kontext c mit deklarationaler Kraft fD vollzogener Akt z* des propositionalen Inhalts j (also: z* ⫽ fD(j)) stellt durch seinen Vollzug gerade in z*(c) die Wahrheit von j her (vgl. Searle 1975a: 358). Typische Beispiele für Deklarationen sind Kündigungen („Hiermit erkläre ich, daß Ihr Arbeitsverhältnis am Ende dieses Monats erlischt.“) und die Schaffung institutioneller Fakten („Ich rufe Willy V. zum Karnevalsprinzen der Saison 94/ 95 aus.“). Zählen explizit performativ vollzogene Akte zu den Deklarationen, so steht der gesamte Inhalt der benutzten Ausdrücke ⫺ einschließlich des vom performativen Vorspann gelieferten Inhaltsanteils ⫺ unter fD. Die Eigentümlichkeit von fD, für die Wahrheit des übermittelten Inhalts im Vollzug des Aktes selbst zu sorgen, stellt dann gerade sicher, daß Deklarationen von Behauptungen, Befehlen, Fragen usw. auf dasselbe wie eine entsprechende einfache Behauptung, ein simpler Befehl oder eine schlichte Frage usw. hinauslaufen.
Die monistischen Positionen hinsichtlich der C(S)/F(S)-Unterscheidung hinterlassen das ungute Gefühl aller reduktionistischen Ansätze: Voneinander Verschiedenes soll über denselben Leisten geschlagen werden. Selbst wenn solche Vereinheitlichungen möglich sind, tragen sie doch zumeist bloß technischen Charakter. Für dualistische Positionen stellt sich dann aber die Frage: Wenn Kraftin-
I. Systematik
dikatoren nichts zur deskriptiven Bedeutung der Ausdrücke beitragen, in denen sie vorkommen, wie wirken sie sich dann semantisch aus? Da sie kommunikative Kräfte anzeigen und solche Kräfte ihrerseits Inhalten kommunikative Akte, also Kontextveränderungen, zuordnen, müssen semantische Regeln für die Kraftindikatoren diese mit Kontextkoordinaten und deren Veränderungen in Verbindung bringen. Um solche Regeln formulieren zu können, benötigt man also eine eingehendere Analyse der Kontexte und ihrer Koordinaten. In § 5.4.1. ist zum Beispiel bereits neben den in § 5.2. benutzten Kontextkoordinaten der gemeinsame Hintergrund cB als weitere Koordinate eingeführt worden. Aber man wird sicherlich noch weitere Faktoren in Kontextkoordinaten berücksichtigen müssen. Das Hauptproblem des dualistischen Ansatzes scheint in der Entwicklung einer systematischen Kontext- und Kontextveränderungstheorie zu liegen, die ad-hoc-Forderungen nach immer neuen Kontextkoordinaten überflüssig machen könnte. 5.4.3. Klassifikation kommunikativer Kräfte Zur Erläuterung des Begriffs der kommunikativen Kraft ist bislang exemplarisch auf Einzelfälle wie etwa f, fK, fB!, fF! und fD hingewiesen worden, und es ist ein Schema zur formalen Erfassung der Kräfte als Funktionen mit bestimmten Argument- und Wertebereichen angegeben worden. Ein erster Schritt zu einer etwas inhaltsreicheren Krafttheorie bestände in einer klassifikatorischen Übersicht, welche Arten von Kräften es überhaupt gibt und wie sie sich untereinander verhalten. Der wohl immer noch einflußreichste Versuch in dieser Richtung stammt von Searle (1975a). Searles Klassifikation ist von Vanderveken (1983) in Zusammenarbeit mit Searle (Searle und Vanderveken 1985) technisch verfeinert worden und dient in der illokutionären Logik Searles und Vandervekens zur Grundlage einer definitorischen Bestimmung aller möglichen illokutionären Kräfte. Diese Klassifikation soll im folgenden kurz skizziert werden. Searle klassifiziert zwar kommunikative Akte und nicht Kräfte; was jedoch in seiner Klassifikation einen Akttyp vom anderen unterscheidet, ist die Verwendung unterschiedlicher Kräfte oder sich hieraus ergebende Eigenschaften. Unter Zugrundelegung der Gleichung Z* ⫽ {f(j) | *f, j+ aus Z} (s. o. § 5.4.1.) induziert eine solche Aktklassifikation auch
165
3. Semantik
(104) Kraft
von cS verfolgter Kraftzweck
Anpassungsrichtung
ausgedrückter psychischer Zustand
Assertive Kraft f
den übermittelten Inhalt als wahr zu präsentieren
↓
Glauben
Direktive Kraft f!
cR zu veranlassen, für die Wahrheit des übermittelten Inhalts zu sorgen
↑
Wunsch
CR tut A
Kommissive Kraft fK
sich zu verpflichten, für die Wahrheit des übermittelten Inhalts zu sorgen
↑
Absicht
cS tut A
Expressive Kraft fE
seine Einstellung (zum übermittelten Inhalt) zu bekunden
π
mehrere Möglichkeiten
cR/cS ⫹ Eigenschaft
Deklarationale Kraft fD
durch den Vollzug eines kommunikativen Aktes einen Fakt zu schaffen
π
eine Einteilung der Kräfte, und umgekehrt ergibt sich aus einer Kraftklassifikation eine Akttypologie im Searleschen Stil. Der Searleschen Einteilung liegen zwölf Unterscheidungsaspekte zugrunde, von denen allerdings nur drei systematisch ausgenutzt werden. Eine Kritik dieser und weiterer Inkonsequenzen des Searleschen Vorgehens findet man zum Beispiel bei Ballmer (1979). Die durchgängig benutzten Einteilungsaspekte sind: (i) der Kraftzweck („illocutionary point“; Searle 1975a: 345), (ii) die Anpassungsrichtung („direction of fit“; ebenda 346) und (iii) der ausgedrückte psychische Zustand („expressed psychological state“; ebenda 347). In einigen Fällen spielt als vierter Gesichtspunkt auch der Aufbau des übermittelten Inhalts eine Rolle. Die Tabelle (104) gibt vorab einen Überblick über Searles Klassifikation; die Klassifikationsaspekte werden im Anschluß an die Tabelle erläutert. Kraftzweck: Der Kraftzweck ist die spezifische Absicht, die ein Sender beim Vollzug eines kommunikativen Aktes verfolgen muß, damit ein Akt mit der entsprechenden Kraft überhaupt zustande kommt. Searle unterscheidet die fünf in der zweiten Spalte von (104) aufgelisteten Zwecke. Für das Funktionieren der Klassifikation ist es wesentlich, den Kraftzweck als Senderabsicht aufzufas-
Form des übermittelten Inhalts
sen, obwohl dies Searle und Vanderveken nicht immer klar sagen. Es reicht nicht aus, den Kraftzweck als das zu kennzeichnen, was beim erfolgreichen Vollzug eines Aktes mit einer Kraft dieses Zwecks erreicht wird. (Dies ist die von Searle und Vanderveken bevorzugte Erklärung.) Ein Sender kann beispielsweise etwas versprechen, indem er es als wahr darstellt, daß er eine bestimmte Absicht hegt (vgl. Geach 1979: 225⫺277). In einem solchen Fall ist es für den erfolgreichen Vollzug des Versprechens wesentlich, daß auch die Präsentation der Absichtserklärung gelingt. Ein Versprechen unterscheidet sich aber von einer Behauptung dadurch, daß es dem Sender darum geht, sich gegenüber dem Empfänger zu verpflichten, und nicht darum, etwas als wahr zu präsentieren. Die Rolle der Senderintentionen beim Vollzug kommunikativer Akte ist besonders von Grice (1957, 1968, 1969) hervorgehoben worden; siehe auch die Systematisierung dieser Absichten bei Posner (1993). Anpassungsrichtung: Die Anpassungsrichtung betrifft das Verhältnis des in einem Kontext c übermittelten Inhalts j zur Welt cU und zur Zeit cT des Kontexts. Bei Ausübung von f zum Beispiel soll j als wahr präsentiert werden (also doch wohl: j(cT, cU ) ⫽ W). Daß j in cU wahr ist, hängt aber von der in cU
166 herrschenden Faktenlage ab. Der Sender cS muß also das z, welches er benutzt, in Abhängigkeit von dieser Faktenlage wählen; d. h.: er muß seine Ausdrücke der Welt cU anpassen. Bei Ausübung von f! hingegen soll cR durch seine Handlungen dafür sorgen, daß j in der Zukunft wahr wird (j(t, cU ) ⫽ W für ein t mit cT Ɱ t). D. h.: cR muß durch seine Handlungen die Welt dem vom cS benutzten z anpassen. Im ersten Fall ist die Anpassungsrichtung Ausdruck-zu-Welt (symbolisch: „↓“), im zweiten Welt-zu-Ausdruck („↑“; bei Searle heißt es: „word-to-world“ bzw. „world-to-word“). Im Falle der deklarativen Akte liegt nach Searle doppelte Anpassungsrichtung vor („“): Indem ein solcher Akt vollzogen wird, wird die Welt so dem benutzten Ausdruck angepaßt, daß umgekehrt auch der Ausdruck zur Welt paßt (nämlich wahr wird; man vergleiche das Beispiel der Kündigung). Bei expressiven Akten geht es weder darum, die Welt in Übereinstimmung mit den benutzten Ausdrücken zu bringen, noch darum, seine Ausdrücke nach Maßgabe der Wirklichkeit zu wählen. Der Sender drückt vielmehr seine Einstellung zu einem Inhalt aus, den er und der Empfänger als wahr voraussetzen. Hier liegt die leere Anpassungsrichtung („π“) vor. Zweierlei sei hierzu kritisch angemerkt: (i) So wie der Aspekt der Anpassungsrichtung von Searle an Beispielen erklärt wird, kann er nur für solche Kräfte eine Rolle spielen, mit denen Propositionen übermittelt werden. Nach Searles (1969: 66; vgl. die mit „Questions“ überschriebene Spalte) eigener Theorie gibt es jedoch auch Kräfte, mit denen nichtpropositionale Inhalte übermittelt werden. Wie steht es hier mit der Anpassungsrichtung? (ii) Wenn cS in c die von ihm für wahr erachtete Proposition j zum Beispiel mit behauptender Kraft übermitteln will, muß er ein z wählen, das in c j ausdrückt. Dann wählt er aber z nicht in Abhängigkeit von der Welt cU, sondern in Abhängigkeit von dem semantischen System des benutzten Informationsmittels. Der Sender kann die jeweils relevanten semantischen Einheiten auch nicht irgendwie beeinträchtigen. Ist j z. B. eine versprochene Proposition (der für L(LD) verwendeten Art), so ordnet j als mathematisches Gebilde Paaren *t, cU+, in denen t auf cT folgt (cT Ɱ t), bestimmte Wahrheitswerte zu, an denen cS ebensowenig etwas zu ändern vermag, wie an den Zahlen, die die Quadratfunktion (f: x 哫 x2 ) ihren Argumenten zuweist. Das Kriterium der Anpassungsrichtung scheint somit interessant und auf etwas Richtiges hinzuweisen. Aber man hat Mühe, wenn man ganz genau sagen will, was damit eigentlich gemeint ist. Auch sind vermutlich die semantischen Einheiten der MWA nicht (ohne weiteres) geeignet, das auszudrücken, worauf Se-
I. Systematik arle hinauswill. Das könnte allerdings eher gegen diese Einheiten als gegen Searles Unterscheidungen sprechen.
Ausgedrückter psychischer Zustand: Mit dem Vollzug eines kommunikativen Aktes einer bestimmten Kraft ist konventionell der Ausdruck einer bestimmten Sendereinstellung verbunden (vgl. Searle 1969: 60⫺65). Mit einer Behauptung zum Beispiel bekundet der Sender einen von ihm gehegten Glauben, mit einem Versprechen eine Absicht, mit einer Bitte einen Wunsch usw. Der Empfänger oder ein Dritter kann gegebenenfalls weitere Sendereinstellungen aus dem Vollzug eines Aktes erschließen, aber nur die in (104) angegebene Einstellung ist konventionell mit der jeweiligen Kraft verknüpft. Ohne große Schwierigkeiten wird man auch hier Fälle finden, die sich der Searleschen Systematik nicht ohne weiteres fügen. Wie ist etwa der psychische Zustand einzuordnen, den ein Sender bekundet, wenn er eine früher von ihm aufgestellte Behauptung zurückzieht, ohne sich auf deren Negation festzulegen (z. B.: „Das halte ich nicht mehr für ausgemacht.“)? Hier wird ja offensichtlich gesagt, daß man keine relevanten Glaubensannahmen (mehr) hat.
Form der übermittelten Proposition: Bei den direktiven, kommissiven und expressiven Akten nimmt Searle für den jeweils übermittelten Inhalt einen besonderen Aufbau an. In allen drei Fällen soll es sich um Propositionen handeln, wobei bei den Direktiven mit dieser Proposition cR eine Handlung zugeschrieben wird und bei den Kommissiven cS selbst. In den Propositionen, zu denen die Sender expressiver Akte ihre Einstellungen bekunden, wird jeweils dem Sender oder dem Empfänger eine Eigenschaft zugeschrieben. Die hier notwendigen Feindifferenzierungen ⫺ z. B. die zwischen Handlungs- und Eigenschaftszuschreibungen ⫺ machen mindestens einen weiteren Ausbau der Mögliche-Welten-Semantik, vermutlich aber sogar ein sinnsemantisches (s. o. § 5.3.3.) Vorgehen notwendig. Kritisch zu bedenken ist, daß Searles Annahmen der Funktion $ eine ganze Reihe schwieriger Aufgaben aufbürden. Zum Vollzug direktiver, kommissiver oder expressiver Akte werden häufig Ausdrücke benutzt, die nicht Propositionen der von Searle verlangten Art bedeuten. Alle auftretenden Differenzen müßte aber $ irgendwie überbrücken.
Aus dem in § 5.4. Gesagten wird man erkennen, daß die Theorie der Kraftkomponente F(S) viele ebenso schwierige wie interessante Probleme bietet, die einer zufriedenstellenden Lösung noch harren. Ein genaueres Bild darüber, wie eigentlich F(S) aufge-
3. Semantik
baut werden muß und wie F(S) sich zum tatsächlichen Zeichengebrauch verhält (F(S) berücksichtigt ja lediglich systembedingte Gebrauchseigenschaften von Ausdrücken), wäre umso wünschenswerter, da einige Semantiker für C(S) weitreichende Folgen aus dem Verhältnis zwischen Kerntheorie, Krafttheorie und Pragmatik gezogen haben. Danach müssen z. B. die kernsemantischen Eigenschaften solcher Ausdrücke, mit denen Behauptungen aufgestellt werden, mit den in F(S) zu behandelnden Regeln der Ausübung von f in besonderer Weise harmonieren. Dieser Problematik gilt der folgende Abschnitt.
6.
Konstruktive Semantik
6.1. Semantischer Realismus und Antirealismus Als semantische Schlüsselbegriffe sind bisher der Wahrheitsbegriff und die Folgebeziehung ausführlicher behandelt worden. Die jeweilige Begründung für die Wahl eines dieser beiden Schlüsselbegriffe (vgl. oben § 2.2. und § 4.2.) rekurrierte dabei durchaus auf die kognitiven Fähigkeiten der Zeichenbenutzer: Der Bedeutungsbegriff wurde in beiden Ansätzen an den Verstehensbegriff gekoppelt: Einen Ausdruck zu verstehen heißt, seine Bedeutung zu kennen. Dabei sollte Verständnis eines t-Ausdrucks entweder Kenntnis seiner Wahrheitsbedingungen oder der sich aus ihm ergebenden Konsequenzen sein. Beim Aufbau einzelner Semantiken ist von diesem kognitivistischen Grundsatz dann aber kaum etwas übrig geblieben! Zwar ging es jeweils um die Wahrheit von Ausdrücken und ihre Wahrheitsbedingungen (ggf. in Modellen), aber die Frage, wie die Zeichenbenutzer feststellen, ob diese Wahrheitsbedingungen erfüllt sind oder nicht, wurde nicht untersucht. Der Grundtendenz der bisher entwickelten Semantiken gemäß hat diese Frage auch eigentlich nichts mit Semantik zu schaffen: Wahrheitsbedingungen liegen in der Realität entweder vor oder nicht; sie würden auch in dem Falle bestehen oder nicht bestehen, wenn es keine Zeichenbenutzer gäbe, deren Ausdrücke sie semantisch interpretieren. Mit anderen Worten: Die Realität schert es nicht, daß sie als Objekt an Semiosen beteiligt ist. Weil sie der Realität Vorrang vor dem semiotischen Austausch über die Realität einräumt, wird diese Position als „realistisch“ bezeichnet. (Die oben in § 3.4. ebenfalls als „reali-
167 stisch“ gekennzeichnete Einstellung gegenüber den Bedeutungen prädikativer Ausdrücke ist eine besonders radikale Ausprägung der nun so bezeichneten Position. Man kann bezüglich der Wahrheitsbedingungen eine realistische Position vertreten, ohne zugleich Realist bezüglich der Prädikatorbedeutungen zu sein. Das semantische System S2, s. o. § 3.3., veranschaulicht so eine Haltung.) Es war gerade auch die Dominanz realistischer Einstellungen unter technisch und formal arbeitenden Semantikern dieses Jahrhunderts, die zur Vernachlässigung der Theorie der Kraft (s. o. § 5.4.) geführt hat: Das, was Zeichenbenutzer schließlich mit ihren Ausdrücken anfangen, kann ja nach realistischer Auffassung die Bedeutungen dieser Ausdrücke nicht beeinflussen. Der Vollzug kommunikativer Akte spielt semantisch bestenfalls für eine kleine Klasse von Ausdrücken, die sich gerade auf diese Akte beziehen (also z. B. die verba dicendi) eine Rolle. Insbesondere von Michael Dummett (z. B. 1975, 1976, 1979) und von Dag Prawitz (1972, 1981, 1982) sind demgegenüber antirealistische Bedeutungstheorien entwickelt worden, die (i) nach dem semantischen Status derjenigen Mittel (z. B. Beweis und Beobachtung) fragen, mit denen Zeichenbenutzer die Wahrheit bestimmter Ausdrücke feststellen, und die (ii) den Zusammenhang zwischen Bedeutung und Zeichengebrauch in den Vordergrund semantischer Überlegungen stellen. Dabei greifen sie einerseits auf die bedeutungstheoretischen Überlegungen Freges und Wittgensteins (s. Art. 102 bzw. 109) zurück, andererseits aber auch auf die konstruktivistischen und intuitionistischen Begründungsversuche der Logik und Mathematik (s. Art. 104, 107). Beim Aufbau ihrer Theorien machen sie auch intensiven Gebrauch von Ideen und Techniken der Beweistheorie (einer Spezialdisziplin der Logik; vgl. Prawitz 1971 und 1981). Gegenwärtig wird vor allem im angelsächsischen Sprachraum eine heftige Kontroverse zwischen Vertretern antirealistischer Bedeutungstheorien des Dummett/Prawitz-Typs und Anhängern realistischer Positionen (insbesondere der von Davidson) ausgefochten (vgl. Tennant 1987, mit ausführlicher Bibliographie S. 306⫺318; sowie Sundholm 1986: 478⫺485). In dieser Diskussion hat Dummett ein Argument vorgebracht, daß als „Dummettian Reductio“ (s. Tennant 1987: Kap. 11) berühmt geworden ist. Es soll zeigen, daß das Wahrheitskonzept zumindest für kompliziertere Informationsmittel kein
168
I. Systematik
adäquater Schlüsselbegriff ist. Dieses Argument baut auf bestimmten Vorstellungen darüber auf, wie eine adäquate Semantik eines Informationsmittels auszusehen hat. Die Darstellung von Dummetts reduktivem Argument muß also mit einer Erklärung dieser Annahmen beginnen. 6.2.
Dummetts Argument
6.2.1. Die Architektur einer umfassenden Semantik Semantische Fragen sind für Dummett Fragen nach den kognitiven Fähigkeiten von Zeichenbenutzern. Die Semantik eines Informationsmittels hat zu erklären, was jemand über die Bedeutung der Ausdrücke eines Informationsmittels weiß, wenn er über dieses Informationsmittel praktisch verfügt, d. h. im Falle einer Sprache: wenn er diese Sprache spricht. Gegenstand der Semantik eines Informationsmittels I sind mithin bestimmte praktische Fähigkeiten der Benutzer von I. Die Semantik ist korrekt, wenn die Benutzer von I dann, wenn sie diese Fähigkeiten ausüben, so handeln, als ob sie die Semantik kennen würden. In dem Verhalten, das sie in Ausübung ihrer I betreffenden semiotischen Fähigkeiten zeigen, manifestiert (Dummett 1976: 71) sich ihr semantisches Wissen. Eine wirklich umfassende Semantik (Dummett spricht von einer „theory of meaning“; der Terminus „Bedeutungstheorie“ wird in diesem Artikel aber anders verwendet; s. o. § 1.2.) muß demnach drei Komponenten enthalten: eine kognitionstheoretische, eine verhaltenstheoretische und eine Komponente, die zwischen diesen beiden Teilen vermittelt und eben gerade die Manifestationsbeziehung untersucht (vgl. Ullmann-Margalit 1979: 138). Die kognitionstheoretische Komponente behandelt das semantische Wissen der Zeichenbenutzer, und die verhaltenstheoretische Komponente untersucht die Umsetzung dieses praktischen Wissens bei Ausübung der in ihnen gespeicherten semiotischen Fähigkeiten. Die Manifestationsbeziehung korreliert bestimmtes Wissen mit bestimmten Verhaltensweisen. Sowohl aus semiotischen wie auch aus wissenschaftstheoretischen Gründen ist diese Dreiteilung der Semantik notwendig. Das konkrete semiotische Verhalten ist alles, was miteinander kommunizierenden Partnern zugänglich ist. Gleichgültig, wie die semantischen Einheiten bedeutungstheoretisch analysiert werden, sie müssen jedenfalls im se-
miotischen Verhalten erkennbar sein, damit Kommunikation überhaupt möglich wird. Prawitz (1982: 32⫺33) betont den wissenschaftstheoretischen Aspekt der Manifestationsforderung: Wenn eine Semantik S adäquat sein soll, so muß sie Beziehungen herzuleiten gestatten, die die Kenntnis der Bedeutung eines Ausdrucks z mit beobachtbarem Verhalten V(z) verbindet; zum Beispiel: Kennt P die Bedeutung von z, so zeigt er ⫺ unter ‘den und den’ Umständen ⫺ das Verhalten V(z). Prawitz (1982: 33) hebt hervor, daß „diese Adäquatheitsbedingung eine methodologische Version des Slogans ‘Bedeutung ist Gebrauch’ (‘meaning is use’)“ ist. „Bedeutung“ ist ein theoretischer Term, kein Beobachtungsterm; theoretische Terme müssen im Rahmen einer Theorie mit Beobachtungssätzen verknüpft werden, um ihre Signifikanz (ihr Sinnvollsein) zu sichern (vgl. Art. 124). Der kognitionstheoretische Teil der Semantik S umfaßt genau den Kern C(S) und die Kraftkomponente F(S) (s. o. § 5.4.). In der Kraftkomponente finden diejenigen in der verhaltenstheoretischen Komponente erfaßten Zusammenhänge ihre Erklärung, die systembedingt sind. Nicht in jeder Eigenschaft des semiotischen Verhaltens manifestiert sich ein semantischer Aspekt des Zeichengebrauchs, andernfalls würde Bedeutungskenntnis den Überblick über die unüberschaubar vielen Dimensionen verlangen, in denen sich die Verwendung eines Ausdrucks auswirken kann (vgl. Dummett 1976: 72). Der vermittelnde dritte Teil von S, der die Manifestationsbeziehung behandelt, ist Dummetts Theorie des Sinns, die zusammen mit der Kernkomponente das Zentrum („central part“) von S bildet (Dummett 1976: 73). (Diese an Frege angelehnte Terminologie betont den epistemischen Aspekt des Fregeschen Sinnbegriffs, während in der intensionalen Semantik, s. o. § 5.1.4., eher die Rolle des Sinns bei der Festlegung der Bedeutung hervorgehoben wird.) Die Theorie des Sinns behandelt, worin sich verhaltensmäßig die Kenntnis derjenigen Eigenschaften eines Ausdrucks zeigt, mit denen er Einfluß auf den S zugrunde gelegten Schlüsselbegriff ausübt. 6.2.2. Manifestation und verdeckte Wahrheitsbedingungen Ebenso wie Quine (z. B. 1960; vgl. Art. 109) ist Dummett der Auffassung, daß jede Semantiktheorie die wechselseitige Verbundenheit der Zeichen eines Informationsmittels
3. Semantik
berücksichtigen muß. Der Erwerb der Bedeutung einiger Ausdrücke wird in der Regel die Beherrschung anderer, semantisch grundlegenderer voraussetzen. Besonders einfache Beispiele für solche Voraussetzungszusammenhänge sind die in § 4.5. behandelten Erklärungsdefinitionen: Bevor ein Lernender die Bedeutung von „Km“, so wie sie (43b) erklärt, erfassen kann, muß er die Bedeutungen von „Elt“ und „Ml“ (sowie der Junktoren und Quantoren) erworben haben. Solche Voraussetzungszusammenhänge bieten eine Möglichkeit zur Manifestation semantischen Wissens. Kenntnis der Bedeutung eines „Km“ enthaltenden Ausdrucks von L(G) kann dadurch unter Beweis gestellt werden, daß man unter Benutzung von (43b) eine „Km“-freie Paraphrase angibt. Hier liegt explizites semantisches Wissen vor: Der Zeichenbenutzer kann das, was er weiß, explizit im selben Informationsmittel angeben. Aber irgendwann hat jedes (zirkelfreie) Erklären und Definieren (innerhalb ein und desselben Informationsmittels) sein Ende. Die Kenntnis der Bedeutung nicht mehr erklärbarer oder definierbarer Ausdrücke kann nur implizit sein; es kann sich nur in nicht-semiotischen Verhaltensweisen zeigen. Bei einem Prädikator wie „… ist größer als …“, der sich auf Beobachtbares bezieht, kann sich Verständnis etwa darin bekunden, daß ein Zeichenbenutzer nach der Aufforderung, zum Beispiel ihm vorgelegte Münzen nach ihrer Größe in Stapeln zu ordnen, diese Aufgabe löst. Der Zeichenbenutzer besitzt eine bestimmte Unterscheidungsfähigkeit, deren Ausübung (i) beobachtbar und (ii) in beobachtbarer Weise mit dem Gebrauch eines bestimmten Ausdrucks verbunden ist (er beginnt eben mit dem Aufstapeln nach einer entsprechenden Ausdrucksverwendung). Eine Semantik S für I, die gemäß § 6.2.1. aufgebaut ist, ist nur dann adäquat, wenn alle Ausdrücke von I in dieser Weise mit einer die beiden angegebenen Bedingungen erfüllenden Fähigkeit verknüpft sind oder ⫺ zum Beispiel definitorisch ⫺ auf Ausdrücke dieser Art rückführbar sind. Nun gibt es aber in den meisten komplexeren Informationsmitteln t-Ausdrücke, deren Wahrheitsbedingungen für die Zeichenbenutzer verdeckt, erkenntnistranszendent (Sundholm 1986: 480: „recognition-transcendent“) sind: „[…] the truth of many sentences of our language appears to transcend our powers of recognition“ (Dummett 1976: 88). Ob solche verdeckten Wahrheitsbedingungen vorliegen,
169 kann ein Zeichenbenutzer nicht sofort nach Aufforderung oder auch nur in einer übersehbaren Zeitspanne, die zum Nachrechnen, Nachschauen, Experimentieren oder ähnlichem benötigt wird, feststellen. Dummett nennt daher solche Sätze auch „effektiv unentscheidbar“, obwohl die in der Mathematik so bezeichneten Sätze (s. Art. 78) lediglich Spezialfälle der Schwierigkeit sind, auf die Dummett abzielt. Die Beispiele für Sätze mit verdeckten Wahrheitsbedingungen stammen aus bestimmten, semantisch als schwierig bekannten Bereichen: Es handelt sich bei ihnen etwa um (i) Aussagen über die Zukunft, (ii) irreale Konditionalsätze, (iii) Aussagen über sehr weit entfernte, uns nicht zugängliche Raum-Zeit-Regionen und (iv) um bestimmte All- und Existenzaussagen über unendliche oder nicht durch Auflistung erschöpfbare Gesamtheiten (vgl. Dummett 1976: 81). Das semantische Wissen um die Bedeutung solcher Ausdrücke kann sich nicht in allen Fällen in der Fähigkeit zu paraphrasieren manifestieren; denn ein Informationsmittel, in dem es nur Ausdrücke mit nicht-verdeckten Wahrheitsbedingungen gibt, läßt sich allein durch definitorische Erklärungen nicht zu einem solchen erweitern, in dem über Erkenntnistranszendentes geredet werden kann (vgl. Dummett 1976: 81). Also müßte für zumindest einige dieser Ausdrücke das semantische Wissen implizit sein. Aber hier kann ein solches implizites Wissen sich nicht in beobachtbarem Verhalten manifestieren: Daß die Wahrheitsbedingungen verdeckt sind, heißt ja gerade, daß der Zeichenbenutzer das, worauf er beobachtbar reagieren soll, nicht erkennen kann. Daß es aber überhaupt verstehbare Zeichen mit verdeckten Wahrheitsbedingungen gibt, ist ein „[…] claim accepted by all parties of the dispute“ (Tennant 1987: 111). (Man könnte die problematischen Ausdrücke ja auch für nicht verstehbar, für sinnlose Scheinzeichen erklären.) Dummetts Argument zielt also genau darauf ab, daß die Existenz von Ausdrücken mit verdeckten Wahrheitsbedingungen, die aber durchaus verstehbar sind und eine Rolle im semiotischen Austausch spielen, unvereinbar ist mit dem Prinzip, daß sich semantisches Wissen vollständig in beobachtbarem Verhalten manifestieren muß. Dieses Prinzip ist für ihn aber nicht nur wissenschaftstheoretisch unverzichtbar, sondern auch eine conditio sine qua non jeglicher Kommunikation, da die an einer Semiose Beteiligten nun einmal nicht einander in die Köpfe schauen können.
170 Da bei den problematischen Ausdrücken die Wahrheitsbedingungen verdeckt, dennoch aber diese Ausdrücke verstehbar sind, kann (zumindest hier) Kenntnis der Wahrheitsbedingungen nicht Kenntnis der Bedeutung sein. 6.2.3. Atomismus, Molekularismus, Holismus Könnte man nun nicht gegen Dummett einwenden, daß er von einer semantischen Theorie zu viel verlange: nämlich für jeden einzelnen Ausdruck ein nur ihn betreffendes, im Verhalten manifestierbares Wissen? Kann sich nicht gemäß der besonders von Quine (1960) hervorgehobenen, aber auch von Dummett anerkannten wechselseitigen semantischen Abhängigkeiten verschiedener Ausdrücke implizites semantisches Wissen hinsichtlich der problematischen Ausdrücke in einem solchen Verhalten bekunden, das die Problemfälle in ihrem Zusammenspiel mit unproblematischen Ausdrücken betrifft? Zwischen einzelnen Teilen eines Informationsmittels gibt es ja (s. § 6.2.2.) eine Voraussetzungsbeziehung. Die Beherrschung des Umgangs mit Ausdrücken eines Fragments des Informationsmittels setzt normalerweise voraus, daß der korrekte Umgang mit den Ausdrükken bestimmter anderer Fragmente bereits erworben ist. Die Voraussetzungsbeziehung ist für Dummett eine strikte partielle Ordnung und als solche asymmetrisch. Einige Ausdrücke lassen sich nur in Gruppen zusammen erwerben. Quines Position in Hinblick auf diese Voraussetzungsbeziehung ist holistisch; d. h.: nach Quine gibt es keine minimalen Elemente dieser partiellen Ordnung. Solche minimalen Elemente sind Gruppen zusammengehöriger Ausdrücke, zu deren Erwerb keinerlei semantisches Wissen über Ausdrücke außerhalb der Gruppe nötig ist. Der schrittweise, allmähliche Erwerb von Informationsmitteln ist für Dummett ein Grund, die Existenz solcher minimalen Elemente der Voraussetzungsbeziehung anzunehmen. Sie sind mögliche Ansatzpunkte zum Erwerb des jeweiligen Informationsmittels. Vom Holismus Quines grenzt Dummett seine Position als molekularistisch ab (vgl. Tenannt 1987: Kap. 5⫺7). ⫺ Das dem holistischen Grundprinzip entgegengesetzte Extrem vertritt der Atomismus, nach dem jeder Ausdruck eines Informationsmittels völlig unabhängig von den semantischen Eigenschaften der anderen Ausdrücke seine eigene Bedeutung hat. (Die Voraussetzungsbeziehung ist dann trivial: Es
I. Systematik
gibt ja nur lauter minimale Elemente, die jeweils einen einzigen Ausdruck umfassen.) Von atomistischer Warte aus wäre die Konzeption eines semantischen Schlüsselbegriffs abzulehnen; keine Ausdrucksart ist vor einer anderen semantisch ausgezeichnet. Der Holist Quine und der Molekularist Dummett stimmen darin überein, daß die Bedeutung eines Ausdrucks sich vollständig im Gebrauch manifestieren muß. Beide glauben auch, daß folgender Zusammenhang (vgl. Tennant 1987: 20) besteht: Falls jeder Ausdruck eines Informationsmittels eine bestimmte Bedeutung hat, die für t-Ausdrücke durch Wahrheitsbedingungen bestimmt sind, die unabhängig von den Zeichenbenutzern bestehen oder nicht bestehen, so kann die Bedeutung eines Ausdrucks nicht verhaltensmäßig eindeutig fixiert werden. Da sowohl Dummett (s. § 6.2.1.) als auch Quine die Konklusion dieses Zusammenhangs für falsch erachten, müssen sie zumindest eine der beiden Voraussetzungen ebenfalls als falsch verwerfen. Quine gibt die Existenz eines eindeutigen Bedeutungssystems auf; der beobachtbare Gebrauch von Ausdrücken reicht nicht aus, um ein System von Bedeutungen auszuzeichnen, dessen Elemente den Ausdrücken gerade als ihre Bedeutungen zugeordnet sind (vgl. Art. 109). Es sind stets mehrere Bedeutungszuweisungen mit den Beobachtungsdaten verträglich. Dummett verwirft die Annahme, daß sich die Bedeutungen wahrheitsfähiger Ausdrücke durch bivalente (d. h.: entweder statthabende oder nicht bestehende) Wahrheitsbedingungen charakterisieren lassen. 6.3.
Behauptungen, Beweise und Konstruktionen
6.3.1. Behauptbarkeitsbedingungen statt Wahrheitsbedingungen Akzeptiert man Dummetts Argumente, so kann man nicht mehr den Wahrheitsbegriff als semantischen Schlüsselbegriff verwenden; man muß einen Schlüsselbegriff wählen, dessen Kenntnis sich im beobachtbaren Verhalten der Zeichenbenutzer manifestieren kann. Beobachtbar ist aber zunächst die Ausübung kommunikativer Kräfte in kommunikativen Akten. Benutzer von Informationsmitteln, mit deren Ausdrücken Behauptungen aufgestellt werden können, haben beispielsweise bestimmte Verhaltensdispositionen, Behauptungen in geeigneten Situationen aufzustellen und in ungeeigneten zu unterlassen bzw. sie
171
3. Semantik
zu kritisieren, wenn andere Zeichenbenutzer sie in einer solchen Situation vollziehen. „In einer adäquaten Bedeutungstheorie sollte man daher aus der Annahme, daß eine Person die Bedeutung einer Aussage A kennt, folgern können, daß sie die Bedingung für das korrekte Behaupten von A kennt“ (Prawitz 1982: 33). An die Stelle von Wahrheitsbedingungen treten somit Bedingungen für die zulässige Behauptung. Im Falle mathematischer Informationsmittel wird zum Beispiel eine Behauptung als zulässig erwiesen, indem der Behauptende einen Beweis für das Behauptete vorlegt. Dieser Fall ist für Dummett und Prawitz paradigmatisch. Für nicht-mathematische Informationsmittel ist eine Verallgemeinerung naheliegend: „Proof is the sole means which exists in mathematics for establishing a statement as true: the required general notion is, therefore, that of verification“ (Dummett 1976: 110). Die von Dummett und Prawitz vertretene Bedeutungstheorie ist ihrer Tendenz nach verifikationistisch (s. o. § 1.2.). Als Beispiel, an dem gezeigt werden soll, wie eine den Vorstellungen von Dummett und Prawitz gerecht werdende Semantik aussehen könnte, soll die elementare Sprache L(A) (s. o. § 4.5.1.) der Arithmetik dienen. Ausgangspunkt für das semantische System S7 für L(A) ist die intuitionistische (s. Art. 104 und 108) Erklärung der Bedeutung mathematischer Aussagen. Im mathematischen Intuitionismus werden in Anlehnung an die Erkenntnislehre Kants die Untersuchungsgegenstände der Mathematik als „Konstruktionen“ bezeichnet. (Dieser Konstruktionsbegriff darf nicht mit Tichy´s Konstruktionsbegriff verwechselt werden, auf den in § 5.5.3. kurz eingegangen wurde.) Beweise sind als mathematische Objekte spezielle Konstruktionen. Semantischer Schlüsselbegriff ist die Beziehung zwischen einem Ausdruck und einer Konstruktion, die seine Behauptung rechtfertigt. Mit Hilfe dieses Konstruktionsbegriffs lassen sich die Bedeutungen komplexer t-Ausdrücke wie in der nachfolgenden Tabelle (105) erläutern (vgl. Prawitz 1970: 98 und Troelstra 1969: 5; vom Bisubjunktor wird im folgenden abgesehen). Eine Absurdität, s. (105a), ist etwas offensichtlich Falsches wie zum Beispiel 0 ⫽ 0. Unter den atomaren, d. h. junktor- und quantorenfreien t-Ausdrücken von L(A), soll das ehemals als „Falsum“ bezeichnete nun als Absurdität gelten. (Dies könnte man
durch eine Erklärungsdefinition, zum Beispiel: „ ↔ 0 ⫽ 0“, explizit machen.) def
(105)
Ein Ausdruck der Gestalt
wird gerechtfertigterweise von jemandem behauptet, der
(105a)
ÿz
eine Konstruktion kennt, die jede Konstruktion für z in eine Konstruktion einer Absurdität überführt;
(105b)
[z ∧ j]
zwei Konstruktionen kennt: eine für z und eine für j;
(105c)
[z ∨ j]
eine Konstruktion für z oder eine für j besitzt;
(105d)
[z → j]
über eine Konstruktion verfügt, die aus Konstruktionen für z solche für j bildet;
(105e)
(105f)
jz
eine Konstruktion besitzt, die für jede mit einem f bezeichnete Zahl eine Konstruktion des Spezialfalls Sø jf z| liefert;
jz
eine Zahl mit einer Bezeichnung f und eine Konstruktion für die f-Instanz Sø jf z| kennt.
Im Falle von (105a), (105d) und (105e) sind die Konstruktionen Verfahren oder konstruktive Funktionen. Entsprechend der Forderung, daß eine adäquate Semantik keine erkenntnistranszendenten Elemente enthalten darf, wird von einem konstruktiven Verfahren verlangt, daß es stets effektiv ausführbar sein soll. Dies unterscheidet konstruktive Verfahren von den bislang betrachteten Funktionen. Für die wurde ja keineswegs verlangt, daß die Zeichenbenutzer für vorgelegte Argumente stets die zugehörigen Werte ermitteln können müssen (zum Begriff der konstruktiven ⫺ oder auch: effektiven ⫺ Funktion, s. Art. 107). ⫺ Um mit der Tabelle (105) aber semantisch wirklich etwas anfangen zu können, ist noch eine Bestimmung zu ergänzen: Was zählt als Konstruktion eines atomaren t-Ausdrucks?
172
I. Systematik
6.3.2. Konstruktionen über Kalküle Atomare L(A)-Ausdrücke haben stets Gleichungsform: „0 ⫽ 0“ „S(0) ⫽ 0“, „S(0) ⫽ S(0)“ sind Beispiele solcher Ausdrücke. Bislang sind Ausdrücke dieser Art mit Hilfe der Referenz- und Prädikationsbeziehung oder ihrer modelltheoretischen Gegenstücke semantisch interpretiert worden. Aber die wahren atomaren Ausdrücke lassen sich auch dadurch charakterisieren, daß sie in einem Kalkül ableitbar sind (vgl. Curry 1951, Lorenzen 1955 und Prawitz 1970). Ein Kalkül K ist ein Verfahren, aus Grundfiguren nach exakt angegebenen Kalkülregeln weitere Figuren abzuleiten. Die Grundfiguren können dabei selbst aus einfacheren Figuren verschiedener syntaktischer Kategorien aufgebaut sein. („Figur“ verwende ich so, daß anders als bei einem Ausdruck bei einer Figur nicht vorausgesetzt ist, daß sie die Formseite eines Zeichens ist, welches auch einen Inhaltsaspekt besitzt. Eine Figur kann, muß jedoch nicht ein Ausdruck sein; vgl. Art. 117.) Ein Kalkül ist bereits aus § 4.6.1. bekannt: Im Kalkül NK werden aus Schlußfiguren (als Grundfiguren von NK) nach Schluß- und Deduktionsregeln NK-Ableitungen gebildet. Der arithmetische Kalkül N (vgl. Prawitz 1970: 103), den S7 zur Interpretation von L(A) benutzt, ist wesentlich einfacher: Seine Figuren sind genau die atomaren Ausdrücke von L(A), die mit Hilfe der Regeln R7,2 und R15,1 (vgl. (34a) und (47)) gebildet werden. Durch fünf Regeln zeichnet N einige dieser Figuren als (in N) ableitbar aus; s. (106). (106a) (106b) (106c) (106d) (106e)
⇒z⫽z z ⫽ j, f ⫽ j ⇒ z ⫽ f z ⫽ j ⇒ S(z) ⫽ S(j) S(z) ⫽ S(j) ⇒ z ⫽ j S(z) ⫽ 0 ⇒
Eine Ableitung ist einfach eine Folge von Ableitungszeilen, in denen jeweils eine Figur steht, die mit Hilfe einer der Kalkülregeln gewonnen wurde. Die Figur der letzten Zeile heißt (im betreffenden Kalkül) „ableitbar“. Für N erlaubt es etwa die Regel (106a), Ableitungen mit einer Zeile der Gestalt z ⫽ z zu beginnen und solche Zeilen an beliebigen Stellen in Ableitungen einzufügen. Genau die Figuren dieser Gestalt sind die Grundfiguren von N. Die Regeln (106b)⫺(106d) lassen es zu, eine Ableitung um eine Zeile zu verlängern, deren Figur die hinter dem Regelpfeil stehende Gestalt hat, wenn es bereits Ableitungszeilen mit Figuren gibt, deren Gestalten
den Angaben vor dem Regelpfeil entsprechen. Die Absurditätsfigur von (106e) soll eine für alle Kalküle einheitlich gewählte Figur sein, deren Ableitbarkeit als unerwünscht gilt. Sind die Regeln eines Kalküls dennoch so liberal, daß sie abzuleiten gestatten, so soll dieser Kalkül „inkonsistent“ heißen. Die Regel (106e) ist somit eine negative Charakterisierung von N: Da nur mit dieser Regel ableitbar ist, wären Figuren der Gestalt S(z) ⫽ 0 höchstens dann ableitbar, wenn N inkonsistent wäre (was N aber nicht ist). Arithmetisches Wissen der L(A)-Benutzer manifestiert sich nach entsprechender Unterweisung unter anderem in ihrem Verhalten gegenüber N-Ableitungen: Sie können Ableitungen auf ihre Korrektheit hin überprüfen oder selbst Ableitungen herstellen. Um ihren Gebrauch von L(A)-Ausdrücken semantisch erklären zu können, braucht man ihnen nicht eine dubiose Einsicht in eine Welt der Zahlen zuzuschreiben, deren Fakten unabhängig von den Rechenfähigkeiten der L(A)-Benutzer sind. ⫺ Arithmetisches Wissen ist natürlich erweiterbar. In N spiegelt sich auch nur ein kleiner Teil eines solchen Wissens wider. Der Wissenserweiterung entspricht eine Kalkülerweiterung zum Beispiel um neue Regeln oder um neue Figuren (oder um beides). N reflektiert nur Wissen über die Nachfolgeoperation. Sollen auch Kenntnisse über Addition und Multiplikation berücksichtigt werden, muß N um Figuren bereichert werden, deren Zahlbezeichnungen „⫹“ und „·“ enthalten, und man wird den Rechenoperationen entsprechende Kalkülregeln zu N hinzufügen. Auf solche Kalkülerweiterungen wird gleich noch einmal zurückzukommen sein. Ableitungen in N sollen als Konstruktionen atomarer Ausdrücke von L(A) gelten: Ist der atomare Ausdruck z als Figur in N ableitbar, so ist jede Ableitung von z in N Konstruktion für z über N. Eine solche Ableitung erweist z ja als wahr und ist somit eine Behauptungslizenz für z. Ableitungen sind also die speziellen semantischen Einheiten, mit denen S7 atomare Ausdrücke interpretiert; anders als bisher kann es zu einem z aber auch mehrere oder auch gar keine solche Einheit geben (z. B. ist ja gerechtfertigterweise nicht behauptbar). Die in S7 benutzten semantischen Einheiten sollen wie bisher in Typen (s. o. § 3.5.) klassifiziert werden. Dabei umfaßt der Grundtyp o Figuren aller Art: ableitbare und unableitbare Figuren, deren Teilfiguren, ganze Ableitungen und Ausdrücke von L(A). Ein erneuter Blick auf (105) zeigt
3. Semantik
nun schnell, daß man für S7 auf o ein Typensystem aufbauen muß, das komplizierter als die bisher benutzten ist. Nach (105b) muß zum Beispiel eine Konstruktion für eine Konjunktion atomarer Ausdrücke ein Konstruktionenpaar sein, dessen Glieder Ableitungen der Teilkonjunkte sind. Man benötigt also nun auch Typen für Paare. Zum Beispiel soll *o, o+ der Typ aller Figurenpaare sein; er umfaßt also speziell auch alle Ableitungspaare. Neben solchen Paartypen braucht man aber auch kompliziertere Funktionstypen! Nach der Erklärung (105d) und den bisherigen Festlegungen ist zum Beispiel eine Konstruktion für die Subjunktion [z → j] zweier atomarer t-Ausdrücke eine konstruktive Funktion des Typs o(o), die Ableitungen für z in solche für j überführt (dies muß noch präzisiert werden). Ist nun f ebenfalls atomar, so muß eine Konstruktion für [[z → j] → f] ein konstruktives Verfahren vom Typ o(o)(o) sein. Das ist bereits ein Typ zweiter Stufe (vgl. oben das Typensystem für L(AL) in § 5.1.1.). Aber auch die 2. Stufe reicht noch nicht, denn eine Konstruktion für [[[z → j] → f] → x] (x atomar) gehört zum Typ o(o)(o)(o) usw. Die für S7 benötigten Typen werden in (107) festgelegt. (107) Die Typen für L(A) gemäß S7 werden wie folgt bestimmt: (107a) o ist ein Typ. (107b) Sind t1 und t2 Typen, so sind auch t1(t2 ) und *t1, t2+ Typen. (107c) Typen gibt es ausschließlich nach (107a) und (107b). Der Konstruktionsbegriff ist gegenüber der syntaktischen Gestalt der L(A)-Ausdrücke viel sensibler als der Begriff der Wahrheit (in einem Modell). In S4 werden beispielsweise Ausdrücke, die mit „∧“ und „→“ gebildet sind, semantisch gleichermaßen durch zweistellige Operationen im Wahrheitswertverband ( und ⱷ) interpretiert. Sind aber z und j atomar, so sind bereits Konstruktionen für [z ∧ j] und [z → j] typverschieden (*o, o+ gegenüber o(o))! Die in § 4.6.1. vorgenommene Kategorisierung der L(A)-Ausdrücke ist für eine auf (105) aufbauende Semantik also viel zu grob. Bislang wurden durch Typenzuordnungen feinere syntaktische Kategorisierungen auf gröbere semantische Typisierungen bezogen: das geht nun nicht mehr. Um L(A)-Ausdrücken passende Konstruktionen zuweisen zu können, müssen sie erst mit Hilfe des in (107) bestimmten Typensystems feiner klassifiziert
173 werden, als dies zu Zwecken ihrer syntaktischen Beschreibung in § 4.5.1. notwendig war. Dies geschieht in (108). Dabei ist zu beachten, daß alle Ausdrücke von L(A) zwar als Figuren zum Typ o gehören aber keineswegs alle sind auch Ausdrücke dieses Typs. Von einem bestimmten Typ zu sein und zu einem bestimmen Typ zu gehören, sind also zwei unterschiedliche Ausdruckseigenschaften. Nur atomare Ausdrücke sind vom Typ o und gehören (als Objekte) zu diesem Typ. (108a) Die atomaren t-Ausdrücke von L(A) sind vom Typ o. (108b) Ist z ein t-Ausdruck des Typs t von L(A), so ist ÿz einer vom Typ t(o). (108c) Sind die L(A)-Ausdrücke z und j vom Typ t1 bzw. t2, so ist (i) [z ∧ j] vom Typ *t1, t2+, (ii) [z ∨ j] vom Typ **t1, t2+, o+, (iii) [z → j] vom Typ t1(t2 ). (108d) Ist z L(A)-Ausdruck vom Typ t, so ist (i) jz vom Typ o(t) und (ii) jz vom Typ *t, o+. Dem Ziel von S7, für jeden t-Ausdruck z anzugeben, welche Objekte des Typs von z Konstruktionen für z sind, hat uns (108) ein gutes Stück näher gebracht; denn offensichtlich steht die Klassifizierung der Ausdrücke in (108) in Übereinstimmung mit den semantischen Erklärungen von (105). Nach (108c) etwa müßte eine Konstruktion für [z ∧ j] ein Objekt des Typs *t1, t2+ sein; und (105b) sagt, was das für ein Paar sein muß: Sein erstes Glied k1 muß Konstruktion für z und sein zweites Glied k2 muß Konstruktion für j sein. (Der Buchstabe „k“ ⫺ ggf. mit Subskripten ⫺ soll als Variable für Konstruktionen dienen.) Mit Hilfe des Paarbildungsoperators p stellen wir nun ein solches Paar so dar: „p(k1, k2 )“ (die bisher verwendeten Winkelklammern „*“ und „+“ sind ja schon an die Typenindizes der Paartypen vergeben worden). In derselben Weise stimmen auch die anderen Klauseln von (108) mit den semantischen Erklärungen von (105) überein. Gehören zum Beispiel Konstruktionen für Ausdrücke, die aus z (vgl. (108d)) durch Ersetzung der Variablen j durch die Zahlbezeichnung f hervorgehen, zum Typ t, so sind nach (105e) Konstruktionen k0 für jz effektive Verfahren, die jeder Zahlbezeichnung f, das sind Objekte des Typs o, eine Konstruktion k1 für Sø jf z| zuweisen. Da k1 zu t gehört, ist k0 eine Konstruktion des Typs o(t). Eine Konstruktion für jz ist hingegen wieder ein
174 Paar p(k1, k2 ), wobei k2 eine spezielle Figur, nämlich eine Zahlbezeichnung f, sein muß, und k1 eine Konstruktion für Sø jf z| ist (vgl. (105f)): Das Paar p(k1, k2 ) gehört also zum Typ *t, o+. Schließlich sei noch die Klausel für die Adjunktion in (108c) erläutert! (Die entsprechenden Festlegungen für Negation und Subjunktion werden in § 6.3.3. erklärt; für sie muß man Kalkülerweiterungen betrachten.) Eine Adjunktion [z ∨ j] ist zwar wie eine Konjunktion durch ein Konstruktionenpaar p(k1, k2 ) interpretierbar (wenn nämlich zum Beispiel k1 Konstruktion für z und k2 eine für j ist). Aber das ist zugleich zuviel und zuwenig: Zuviel, weil eine Konstruktion für ein Adjunktionsglied als Behauptungslizenz ja schon hinreicht; zuwenig, weil in dem Falle, daß nur eines der Paarglieder von p(k1, k2 ) Konstruktion eines Adjunktionsgliedes ist, zweifelsfrei bestimmt sein muß, um welches der beiden Adjunkte es sich dann handelt. Daher werden Konstruktionen für Adjunktionen wieder als Paare bestimmt, deren erste Glieder Konstruktionenpaare und deren zweite Glieder jeweils mit einem der Adjunkte identisch sind. Eine Konstruktion für [z1 ∨ z2] ist ein Paar k ⫽ p(p(k1, k2 ), zi ) mit i ⫽ 1 oder i ⫽ 2. Ist i ⫽ 1, so ist k1 Konstruktion für z1; bei i ⫽ 2 ist k2 Konstruktion für z2. Sind zum Beispiel z1 und z2 beide atomar, so ist k vom Typ **o, o+, o+, und k1 Ableitung der Figur z1 oder k2 Ableitung der Figur z2, je nachdem ob das zweite Glied von k z1 oder z2 ist. Bislang ist nur anhand von Einzelfällen erklärt worden, was Konstruktionen sind, zum Beispiel: Ableitungen, Ableitungspaare, konstruktive Verfahren, die Zahlbezeichnungen Ableitungen zuordnen usw. Eine genaue Festlegung des Konstruktionsbegriffs erfolgt nun in (109), das die bisherigen Erklärungen zusammenfaßt; vgl. Prawitz (1970: 104 und 1971: 279), alternative Explikationen des Konstruktionsbegriffs liefern unter anderen Tait (1968), Goodman (1970) und Scott (1970b). In (109) werden Konstruktionen über beliebige Kalküle erklärt; sie werden nicht auf N eingeschränkt. Dies ist, wie bereits angedeutet wurde, notwendig, um mögliche Erweiterungen des arithmetischen Wissens berücksichtigen zu können, die sich in entsprechenden Kalkülerweiterungen von N niederschlagen. Zur semantischen Interpretation von L(A) muß man N und seine Erweiterungen betrachten. (109) Ist t ein Typ für L(A) gemäß S7 (s. o. (107)) und K ein Kalkül, so ist Ct, K die
I. Systematik
Gesamtheit der Konstruktionen vom Typ t über K wie folgt definiert: (109a) Ist t ⫽ o, so umfaßt Ct, K genau die Figuren von K, deren Teilfiguren, Ableitungen in K und die Ausdrücke elementarer Sprachen (s. o. § 4.5.1.), deren deskriptive Konstanten in Figuren von K vorkommen. (109b) Ist t ⫽ *t1, t2+, so umfaßt Ct, K genau die Paare p(k1, k2 ), bei denen k1 aus Ct1,K und k2 aus Ct2,K stammt. (109c) Ist t ⫽ t1(t2 ), so umfaßt Ct, K genau die konstruktiven Funktionen, die Konstruktionen aus Ct1,K solche aus Ct2,K zuordnen. Man beachte, daß es nach (107c) und (109c) auch konstruktive Verfahren gibt, deren Argumente selbst konstruktive Funktionen sind. Eine Funktion, deren Argumente selbst Funktionen sind, bezeichnet man auch als „Funktional“. Funktionale werden in S7 benötigt, um die beliebig komplexen Verschachtelungen von Junktoren und Quantoren semantisch zu interpretieren (vgl. oben die Erläuterungen vor (107)). Jeder endliche Verschachtelungsgrad ist möglich und daher benötigt man die Funktionale aller endlichen Typen. Die Theorie der konstruktiven Funktionale aller endlichen Typen geht auf Gödel (1958) zurück. 6.3.3. Konstruktionen für Ausdrücke Nun sollen zunächst einige konkrete Beispiele für Konstruktionen besprochen werden; dabei wird zugleich eine systematische Notation für sie eingeführt. Als Beispiele für durch Konstruktionen zu interpretierende L(A)Ausdrücke sollen formale Axiome eines als „Heyting-Arithmetik“ Th(HA) bezeichneten Kodifikats (s. o. § 4.6.) der Arithmetik dienen. In diesem Kodifikat wird „⫽“ nicht als logische, sondern als deskriptive Konstante arithmetischen Inhalts ⫺ eben als Zahlengleichheit ⫺ behandelt. Th(HA) unterscheidet sich auch durch seine Schlußregeln (s. u. § 6.3.4.) von der oben (s. § 5.9.) behandelten Peano-Arithmetik Th(PA). In (110) betreffen die drei ersten formalen Axiome „⫽“, HA4 und HA5 halten Eigenschaften der Nachfolgeoperation fest, und das Schema HA6 entspricht dem Prinzip der vollständigen Induktion. Jedem Axiom ist in (110) auch die Angabe seines Typs beigegeben. (110) HA1 x[x ⫽ x] Typ: o(o)
175
3. Semantik
HA2 HA3 HA4 HA5 HA6
x y z[[x ⫽ y ∧ z ⫽ y] → x ⫽ z] Typ: o(o(o(*o, o+(o)))) x y[x ⫽ y → S(x) ⫽ S(y)] Typ: o(o(o(o))) x[S(x) ⫽ 0] Typ: o(o(o)) x y[S(x) ⫽ S(y) → x ⫽ y] Typ: o(o(o(o))) [[Sø x0 z| ∧ x[z → Sø xS(x) z|]] → xz] Ist z vom Typ t, so ist HA6 vom Typ *t, o (t(t))+ (o(t)).
Eine Konstruktion für HA1 ist denkbar einfach: Jedes konstruktive Verfahren, welches Zahlbezeichnungen z als Argumenten Figuren z ⫽ z als Wert zuweist, ist eine Konstruktion für HA1. Eine Figur z ⫽ z ist gerade eine minimale Ableitung in N nach der Anfangsregel (106a). Da diese Konstruktion wie auch viele andere noch zu behandelnde eine Funktion ist, empfiehlt sich zu ihrer Bezeichnung wieder eine l-Notation (vgl. oben § 3.4.). Konstruktionsterme sind ⫺ ggf. mit Hilfe des l-Operators gebildete ⫺ Bezeichnungen für Konstruktionen. An den in Konstruktionstermen vorkommenden Konstruktionsvariablen soll auch jeweils der Typ der Konstruktionen vermerkt werden, über die die Variable läuft. Solche Terme nennt man „typisiert“ (engl.: „typed; vgl. Hindley und Seldin 1986: Kap. 13). Um im folgenden meta- und objektsprachlichen Gebrauch von „⫽“ klar zu unterscheiden, soll „⬅“ als metasprachlicher Name des L(A)-Ausdrucks „⫽“ gelten; andere L(A)-Ausdrücke werden soweit wie möglich autonym verwendet. Dann o(o) ist zum Beispiel kHA1 ⫽ lko[ko ⬅ ko] eine Konstruktion für HA1 der gerade beschrieo(o) benen Art: kHA1 ordnet jeder Figur k1o als Aro(o) gument die Figur kHA1 (k1o) ⫽ k1o ⬅ k1o als Wert zu. Zum Beispiel ist „S(0)“ ein Objekt o(o) vom Typ o, dem kHA1 die Figur S(0) ⬅ S(0) zuordnet. Bevor auch für die übrigen Axiome Konstruktionen angegeben werden können, muß nun genauer auf die semantische Interpretation des Subjunktors und des Negators eingegangen werden. Die einfachste Forderung an eine Konstruktion kt1(t2) für eine Subjunktion [z → j] wäre, daß sie eine Konstruktion kt1 für z über N in eine kt2 ⫽ kt1(t2)(kt1) für j über N überführen soll. Ähnliches gilt für die Negation, die nach der Erklärung (105a) semantisch mit der Subjunktion verwandt ist. Die naheliegendste Anforderung wäre aufgrund der Festsetzungen über die absurde Fi-
gur und deren unerwünschte Ableitbarkeit, daß ein kt(o) für ÿx über N jedem kt für x über N eine Ableitung von zuweisen muß. Gibt es nämlich eine Konstruktion für x über N, so ist ÿx nicht gerechtfertigterweise behauptbar und tatsächlich gibt es wegen der Konsistenz von N dann auch keine Konstruktion für ÿx über N. Dennoch ist sowohl für die Subjunktion als auch für die Negation das Naheliegendste nicht das Adäquateste. Kann man wirklich zu Recht den Zusammenhang zwischen z und j behaupten, den [z → j] formuliert, und ist x wirklich zu Recht als falsch zu verwerfen, so kann sich daran durch zusätzliches arithmetisches Wissen nichts mehr ändern. Ein Kenntniszuwachs wirft höchstens etwas nur vermeintlich Gerechtfertigtes um, aber nichts, was wirklich gerechtfertigt ist. Da sich Kenntniszuwächse in Kalkülerweiterungen niederschlagen, wird von Konstruktionen für [z → j] und ÿx das, was die naheliegendsten Anforderungen lediglich in bezug auf N postulierten, auch für alle Erweiterungen von N verlangt (vgl. Prawitz 1970: 99⫺102 und 1971: 276⫺277). D. h.: (i) kt1(t2) ist Konstruktion für [z → j] über N, wenn es jeder Konstruktion kt1 für z über einer Erweiterung N' von N ein kt2 ⫽ kt1(t2)(kt1) zuweist, das Konstruktion für j über N' ist. (ii) kt(o) ist Konstruktion für ÿx über N, wenn es jeder Konstruktion kt für x über einer Erweiterung K' von K eine Konstruktion ko ⫽ kt(o)(kt ) über K' für zuweist. Schauen wir uns zunächst ein einfaches Beispiel für den zweiten Fall an! Was wäre eine Konstruktion für S(S(0)) ⬅ S(0) (das ist ÿS(S(0)) ⬅ S(0))? Angenommen, man hätte in einer Erweiterung N' von N eine Ableitung k0o dieser Figur (s. (111) links). Nach den Regeln (106d) und (106e), die ja auch zu N' gehören, da N' den Kalkül N erweitert, könnte man k0o um zwei Zeilen zu einer Ableitung k o erweitern (s. (111) rechts): N' ist also 1 von keine konsistente Erweiterung von N. (111) k0o
k1o ⯗
S(S(O))⬅S(O)
⇒
⯗ S(S(O))⬅S(O) S(O)⬅O
(106d) (106e)
176
I. Systematik
⫽ p2(k*o,o+)
k*t1, t2+ ⫽ p(kt1, kt2) ihr erstes Glied kt1 ⫽ p1(k*t1, t2+) und p2 ordnet ihnen ihr zweites Glied kt2 ⫽ p2(k*t1, t2+) zu. Eine Konstruktion o(o(o(*o, o+(o)))) ⫽ für HA2 ist somit z. B. kHA2 o o o *o, o+ lk1 [lk2 [lk3 [lk [U(U(p1(k*o, o+ ), p2(k*o, o+ )), k1o ⬅ k3o)]]]]. Das interessanteste Problem ist es, für die Einzelfälle des Schemas HA6 Konstruktionen zu finden. Sei im folgenden z vom Typ t, t1 ⫽ *t, o(t(t))+ und kt1 eine Konstruktion x für [Sø 0 z | ∧ x[z → Sø xS(j) z|]]. Dann ist kt1 ein Paar p(kt, ko(t(t)) ), dessen erstes Glied kt eine Konstruktion der 0-Instanz von z ist. Das zweite Glied ko(t(t)) ist ein konstruktives Verfahren, mit dem man aus Konstruktionen kt2 einer k1o-Instanz von z Konstruktionen kt3 ⫽ ko(t(t))(k1o)(kt2) der S(k1o)-Instanz (also der Nachfolgerinstanz) gewinnen kann. Aus diesem Ausgangsmaterial ist eine Konstruktion ko(t) für xz zu bilden. Dieses ko(t) muß seinerseits jeder Zahlbezeichnung f als Wert eine Konstruktion kfo ⫽ ko(t)(f) für die f-Instanz Sø xf z| von z zuweisen. Ist f ⫽ „0“, so ist gerade das Erstglied kt ⫽ p1(kt1) ein passendes kfo . Hat f die Gestalt S(x), so ist es durch n-fache (n ⱖ 1) Anwendung der Regel R15,1 (s. o. (47)) auf „0“ gebildet worden. Dann erhält man ein passendes ktf durch sukzessive n-fache Anwendung des Zweitgliedes ko(t(t)) auf 0. Diesen iterativen Prozeß kann man durch ein konstruktives Verfahren It erfassen, das für Paare des Typs t1 als erste und für Figuren als zweite Argumente definiert ist und für welches man definitorisch festgelegt hat: (i) Ist f ⫽ „0“, so ist It(kt11, f) ⫽ p1(kt11). (ii) Ist f ⫽ S(x), so ist It(kt11, f) die Anwendung p2(kt11)(It(kt11, x)) des Zweitgliedes von kt11 auf den bereits ermittelten Funktionswert It(kt11, x) (vgl. Prawitz 1970: 107). Also ist t1(o(t)) ⫽ lkt1[lko[It(kt1, ko )]] eine KonstrukkHA6 tion für den t-Spezialfall von HA6. Nach diesen Beispielen dürfte die folgende Definition verständlich sein, in der die Beziehung con festgelegt wird: con(k, z, K) heißt, daß k eine Konstruktion für z über dem Kalkül K ist (vgl. Prawitz 1970: 105 f und 1971: 278).
Um für dieses Verfahren einen Konstruktionsterm angeben zu können, werden noch die Bezeichnungen „p1“ und „p2“ der Projektionsoperationen benötigt: p1 ordnet Paaren
(113) Ist z ein t-Ausdruck des Typs t und kt eine Konstruktion aus Ct, K (s. o. (108)), so gilt genau dann con(kt, z, K), wenn (113a) t ⫽ o und kt eine Ableitung der Figur z in K ist; oder (113b) z die Form [z1 ∧ z2] hat, t ⫽ *t1, t2+ und kt ⫽ p(kt11, kt22) ist
Das Verfahren U, Figuren untereinanderzuschreiben, ist sicherlich konstruktiv. Eine Konstruktion, die die Zuordnung von (111) leistet, ist also zum Beispiel das Verfahren lko[U(U(ko, S(0) ⬅ 0), )] (lies: Schreibe unter ein vorgelegtes ko die Figur S(0) ⬅ 0 und unter die so hergestellte Figur nochmals !). ⫺ Nun ist es auch nicht mehr schwierig, für o(o(o))) HA4 eine Konstruktion anzugeben: kHA4 ⫽ lk1o[lk2o[U(U(k2o, k1o ⬅ 0), )]]. Ist nämlich f eine Zahlbezeichnung von L(A), so ist o(o(o))) kHA4 (f) ⫽ lk2o[U(U(k2o, f ⬅ 0), )]; und diese Funktion ordnet in der gerade erläuterten Weise Ableitungen k2o von S(f) ⬅ 0 in Erweiterungen N' von N solche von in N' zu. Als Beispiel für die Interpretation einer Subjunktion soll HA3 dienen. Ist ko eine Ableitung der Figur k1o ⬅ k2o in einer Erweiterung N' von N, so ist eine Verlängerung von ko um die Zeile S(K1o) ⬅ S(k2o) nach (106c) eine Ableitung dieser Figur in N'. Also ist o(o(o(o))) kHA3 ⫽ lk1o[lk2o[lko[U(ko, S(k1o) ⬅ o S(k2 ))]]] eine Konstruktion für HA3. Aufgrund der Regel (106d) ergibt sich in derselben Weise ko(o(o(o)))) ⫽ lk1o[lk2o[lko[U(ko, k1o HA5 o ⬅ k2 )]]] als eine Konstruktion für HA5. Eine geeignete Konstruktion für HA2 erhält man mit folgender Überlegung: Angenommen k*o, o+ ⫽ p(k4o, k5o) ist eine Konstruktion für [k1o ⬅ k2o ∧ k3o ⬅ k2o], dann erhält man eine Konstruktion für k1o ⬅ k3o, indem man das zweite Glied k5o des Paares k*o, o+ unter das erste Glied k4o schreibt und unter das ganze die letzte Zeile k1o ⬅ k3o setzt. Die so hergestellte Figur ist eine Ableitung, deren letzter Schritt nach (106b) gerechtfertigt ist; vgl. (112). (112) k4o
k5o ⯗
⯗
k1o ⬅ k2o
k3o ⬅ k2o
⇒
⯗
⫽ p1 (k*o,o+)
k1o ⬅ k2o
ÚıııÛıııÙ k*o,o+ ⫽ p(k4o, k5o) ⯗ k3o ⬅ k2o k1o ⬅ k3o
177
3. Semantik
und sowohl con(kt11, z1, K) als auch con(kt22, z2, K) gilt; oder (113c) z die Gestalt [z1 ∨ z2] hat, t ⫽ **t1, t2+, o+ und kt ⫽ p(p(kt11, kt22), zi ) ist und i ⫽ 1 und on(kt11, z1, K) oder i ⫽ 2 und con(kt22, z2, K) gilt; oder (113d) z von der Gestalt [z1 → z2] und t ⫽ t1(t2 ) ist und für jede Erweiterung K' von K und jede Konstruktion kt1 aus Ct1, K' mit con(kt1, z1, K') auch con(kt(kt1), z2, K') gilt; oder (113e) z die Form ÿj hat und t ⫽ t1(o) ist und für jede Erweiterung K' von K und jede Konstruktion kt1 aus Ct1, K' mit con(kt1, j, K') , K') gilt; oder con(kt(kt1), (113f) z die Gestalt jx hat und t ⫽ o(t1 ) ist und für jede Zahlbezeichnung f con(kt(f), Sø jf x|, K) gilt; oder (113g) z die Form jz hat, t ⫽ *t1 o+ und kt ⫽ *kt1, f+ ist und dabei con(kt1, Sø jf z|, K) gilt. Da durch (113) komplexe Ausdrücke mit Funktionalen als ihren semantischen Einheiten korreliert werden, spricht man hier von einer „Funktionalinterpretation“. In einer Funktionalinterpretation lassen sich nicht nur einzelne Ausdrücke semantisch interpretieren, sondern es können auch Beweisen (also gewissermaßen Texten) semantische Einheiten zugewiesen werden, s. u. § 6.3.4. Eine Funktionalinterpretation ist zum ersten Mal von Gödel (1958) angegeben worden (vgl. Hindley und Seldin 1986: Kap. 18), um mit ihr die HeytingArithmetik als widerspruchsfrei zu erweisen.
Mit Hilfe der con-Beziehung kann man nun in S7 verschiedene Wahrheitsbegriffe definieren. Ein t-Ausdruck z (ohne freie Variablen) heißt „konstruktiv wahr“ über dem Kalkül K, wenn es ein k mit con(k, z, K) gibt. Den Begriff der intuitionistischen Wahrheit erhält man, wenn man fordert, daß der betrachtete Kalkül K konsistent ist, und dies auch von den in (113d) und (113e) zu erwägenden Erweiterungen von K verlangt (vgl. Prawitz 1970: 106). Konstruktiv (oder spezieller: intuitionistisch) gültig ist ein Ausdruck, wenn er über jedem (konsistenten) Kalkül konstruktiv (bzw.: intuitionistisch) wahr ist. Speziell für L(A) kann man Wahrheit als Wahrheit über N definieren. Daß ein Ausdruck wahr ist, heißt nun aber nicht mehr, daß er mit einer dubiosen arithmetischen
Realität übereinstimmt, sondern daß er begründbar behauptet werden kann. Es gibt eine Reihe anderer semantischer Analysen des intuitionistischen Wahrheitsbegriffs, von denen ein Ansatz Verfahren der Möglichen-WeltenSemantik (s. o. § 5.) benutzt: Diese Analyse geht auf eine Arbeit von S. Kripke (1965) zurück und wird in Dummett (1977: Kap. 5) diskutiert. In ihr werden mögliche Welten als formale semantische Gegenstücke der Kenntnisstände aufgefaßt, denen hier Kalküle entsprechen. Kenntniserweiterungen, die sich hier als Kalkülerweiterungen niederschlagen, werden im Möglichen-Welten-Ansatz durch eine Zugänglichkeitsrelation zwischen den Welten berücksichtigt; zu diesem Ansatz vgl. man auch Schütte (1968).
6.3.4. Beweise als Konstruktionen Zu Beginn von § 6.3.1. wurde gesagt, daß Beweise Konstruktionen seien. Die in § 6.3.3. betrachteten Konstruktionen sind aber ganz offensichtlich ziemlich weit von dem entfernt, was man normalerweise als „Beweis“ bezeichnen würde! Im Gegensatz zu Beweisen, wie sie zum Beispiel oben in § 4.6. (vgl. das auf (48) folgende Beispiel) besprochen wurden, sind die bisherigen Konstruktionen allesamt konstruktive, den schematischen Umgang mit Kalkülen, Figuren und Ableitungen betreffende Verfahren (oder im einfachsten Fall selbst Ableitungen). Trotz ihrer unterschiedlichen Erscheinungsweisen entpuppen sich aber bestimmte Konstruktionsterme und Ableitungen in Kodifikaten als unterschiedliche Darstellungen derselben Behauptungslizenzen. Dies soll nun erläutert werden! Als (extrem) einfaches Beispiel betrachten wir den formalen Beweis (114), der aus einer einzigen Anwendung der Schlußregel UE von (50) besteht. (114)
0 ⬅ 0 S(0) ⬅ S(0) UE [0 ⬅ 0 ∧ S(0) ⬅ S(0)]
In der Terminologie von § 4.5. ist dies eine Ableitung der Endformel [0 ⬅ 0 ∧ S(0) ⬅ S(0)] aus den Annahmeformeln 0 ⬅ 0 und S(0) ⬅ S(0). Für beide Annahmeformeln gibt es aber Konstruktionen über N: Seien diese etwa klo („l“ wie „links“) und kro („r“ wie o(o) „rechts“; man wähle etwa klo als kHA1 (0) und o o(o) kr als kHA1(S(0)); das sind jeweils die einzeiligen Ableitungen von N, die aus der linken und rechten Oberformel von (114) selbst bestehen). Der formale Beweis (114) zeigt nun gerade, daß es auch eine Konstruktion der
178
I. Systematik
Endformel gibt: nämlich das Paar p(klo, kro). D. h.: Einem Schritt nach UE in einem formalen Beweis entspricht konstruktionssemantisch die Paarbildung! ⫺ Ebenso leicht sieht man ein, daß konstruktionssemantisch den beiden Regeln UB (s. (50)) die Anwendungen der Projektionsoperationen p1 und p2 entsprechen. Dem Beweisschritt (115a) entsprechen eine Anwendung von p1, dem Schritt von (115b) die von p2. k*o,o(o)+ [0 ⬅ 0 ∧ S(0) ⬅ 0] UB 0⬅0 p1(k*o,o(o)+) k*o,o(o)+ [0 ⬅ 0 ∧ S(0) ⬅ 0] UB (115b) S(0) ⬅ 0 p2(k*o,o(o)+) (115a)
Auch für FB und FE (s. (52)) lassen sich konstruktionssemantische Gegenstücke finden. Nach den semantischen Erklärungen von § 6.3.1. und § 6.3.2. ist eine Konstruktion k2o(o) für [0 ⬅ 0 → S(0) ⬅ S(0)] ein konstruktives Verfahren, Konstruktionen von 0 ⬅ 0 in solche von S(0) ⬅ S(0) zu überführen. Das klo des Beispiels (114) ist nun gerade Konstruktion für 0 ⬅ 0; also wende man einfach k2o(o) auf diese Konstruktion an, um eine Konstruktion für S(0) ⬅ S(0) zu erhalten. Der Schlußregel FB entspricht konstruktionssemantisch die Applikation (Anwendung) einer Funktion auf ein passendes Argument, s. (116).
(116)
Zur Veranschaulichung der uneigentlichen Schlußregel (s. o. § 4.5.1.) FE und ihrer konstruktionssemantischen Entsprechung wird ein etwas komplizierteres Beispiel benötigt. Vorab sei erwähnt, daß der Regel AB (s. o. (55)) auf der Konstruktionsebene ebenso wie FB die Applikation entspricht. Aufgrund der Erklärung (105e) des Generalisators und der Klausel (113f) dürfte dies plausibel sein. Als Beispiel für eine FE-Anwendung dient der letzte Schritt in dem formalen Beweis (117a). Die Entsprechungen der einzelnen Beweisschritte auf der Konstruktionsebene gibt (117b) wieder. In (117) werden dabei für die formalen Axiome die in § 6.3.3. angegebenen Konstruktionen zugrundegelegt; die Konstruktionsvariable ko soll sich auf die im letzten Schritt abgebundene (vgl. oben § 4.5.1.) Annahmeformel beziehen. Der Bindung einer Annahmeformel in einem formalen Beweis entspricht somit die Bindung einer Konstruktionsvariablen durch den l-Operator (vgl. den mit „(1)“ markierten Schritt in (117a) und (117b)). FE korrespondiert also der l-Abstraktion, d. h. der
x y[S(x)⬅S(y)→x⬅y] y[S(S(S(0)))⬅S(y)→S(S(0))⬅y]
(117a) (1)
0 ⬅ 0 [0 ⬅0 → S(0) ⬅ S(0)] FB S(0) ⬅ S(0) k1o k2o(o) k2o(o) (k1o)
AB AB
S(S(S(0)))⬅S(S(0))
[S(S(S(0)))⬅S(S(0))→S(S(0))⬅S(0)]
x y[S(x)⬅S(y)→x⬅y] y[S(S(0))⬅S(y)→S(0)⬅y]
FB S(S(0))⬅S(0)
AB AB
[S(S(0))⬅S(0)→S(0)⬅0] FB S(0)⬅0 FE (1) [S(S(S(0)))⬅S(0)→S(0)⬅0]
o(o(o(o))) kHA5
(117b) (1)
o(o(o(o))) kHA5 („S(S(0))“)
ko
o(o(o(o))) kHA5 („S(S(0))“) („S(0)“)
o(o(o(o))) kHA5 („S(S(0))“) („S(0)“) (ko)
AB AB FB
o(o(o(o))) kHA5 o(o(o(o))) kHA5 („S(0)“) o(o(o(o))) kHA5 („S(0)“) („0“)
o(o(o(o))) o(o(o(o))) kHA5 („S(0)“) („0“) (kHA5 („S(S(0))“) („S(0)“) (ko)) o(o(o(o))) o(o(o(o))) lko[kHA5 („S(0)“) („0“) (kHA5 („S(S(0))“) („S(0)“) (ko))]
AB AB FB FE (1)
3. Semantik
Bildung eines l-Terms aus einem Ausdruck z durch Voranstellung eines ls und einer Variablen, die durch den l-Operator in z gebunden wird. Der kompliziert ausschauende Konstruktionsterm in der letzten Zeile von (117b) kodiert folgendes Verfahren: Verfahre mit einer vorgelegten Figur ko so, daß du zunächst o(o(o(o))) das Verfahren kHA5 auf „S(S(O))“ anwendest, das sich als Resultat dieser Anwendung ergebende Verfahren auf „S(O)“ und das so sich ergebende Verfahren auf ko. Auf das so erreichte Ergebnis mußt du dann das Verfaho(o(o(o))) ren anwenden, das sich aus kHA5 ergibt, wenn das Verfahren, das sich aus der Anwendung dieser Konstruktion auf „S(O)“ ergibt, auf „O“ angewendet wird. Die strukturelle Ähnlichkeit zwischen den Regeln FB und FE auf der einen und der Applikation und l-Abstraktion auf der anderen Seite ist zuerst von Curry und Feys (1958: 315⫺320) beobachtet worden. Howard (1969) hat die Beobachtung von Curry und Feys systematisiert und den Parallelismus auf ein umfassenderes Gebiet ausgedehnt. Dieser Parallelismus ist als „Formeln-als-TypenKonzept“ (engl.: „formulae-as-types-notion“) bekannt. Von den in § 4.5.1. behandelten Schlußregeln haben bis auf tnd alle ein konstruktionssemantisches Äquivalent der besprochenen Art (vgl. Prawitz 1970: 111 ff). (Die beiden „⫽“ betreffenden Regeln spielen hier keine Rolle, da „⫽“ ja als deskriptive Konstante behandelt wurde.) Für I, s. o. (53) gibt es nur ein Gegenstück, wenn man sich in der in Anschluß an (113) erläuterten Weise auf konsistente Kalküle beschränkt. Bevor auf die problematische tnd-Regel näher eingegangen wird, soll die Konsequenz des Parallelismus zwischen Schlußregeln UE, UB, FE, FB, … und den Operationen der Paarbildung, Projektion (p1, p2 ), der l-Abstraktion, der Applikation … beschrieben werden. Den Kalkül des natürlichen Schließens, den man erhält, wenn man auf das problematische tnd verzichtet, ist NJ (⫽ der intuitionistische Kalkül des natürlichen Schließens; s. Gentzen 1934: § 2.). NJ ist die zu den formalen Axiomen HA1⫺HA5 und dem Axiomenschema HA6 gehörige Logik, die die Angabe des Kodifikats der Heyting-Arithmetik vervollständigt. Für NJ ist der Parallelismus zwischen Schlußregeln und den Konstruktionsoperationen (Paarbildung, Projektion usw.) perfekt. Daher läßt sich für jede NJ-Ableitung von z0 aus den Annahmeformeln z1, …, zn (vgl. oben § 4.5.1.) ein Konstruktionsterm an-
179 geben, mit dem ein konstruktives Verfahren beschrieben wird, wie man aus Konstruktionen k1 für z1, …, kn für zn eine Konstruktion k0 für z0 bildet. Wie dies im Einzelfall funktioniert, ist am Beispiel (117a), (117b) bereits vorgeführt worden; für das genaue Verfahren und den zugehörigen Beweis vgl. Prawitz (1970: 111 ff). Die in NJ kodifizierte Logik ist also dadurch ausgezeichnet, daß ihre Beweise konstruktionserhaltend sind: Diese Beweise sind effektive Verfahren, um aus den Behauptungsberechtigungen für die Prämissen (formal: für die Annahmeformeln) eine solche für die Konklusion (formal: Endformel) herzustellen. (Es sei hier erwähnt, daß Gärdenfors (1988: Kap. 6), der vom semantischen Schlüsselbegriff der Akzeptanz, s. o. § 1.2., ausgeht, ebenfalls zu einer Auszeichnung der intuitionistischen Logik gelangt.) Formale Beweise, die mit Hilfe von tnd geführt werden (also: NK-Ableitungen) sind keineswegs konstruktionserhaltend, übertragen also auch keine Behauptungsberechtigungen. Damit für ein atomares z der Ausdruck [z ∨ ÿz] über einem Kalkül K wahr ist (vgl. oben (113a) und (113e)), muß die Figur z selbst in K ableitbar sein, oder es muß ein Verfahren ko(o) aus Co(o), K geben, das Ableitungen dieser Figur in Erweiterungen K' von K in solche von überführt. Im letzteren Fall wäre die Erweiterung von K durch die Anfangsregel ⇒ z inkonsistent. Damit also [z ∨ ÿz] in K wahr ist, muß z in K ableitbar oder die Erweiterung von K um die Regel ⇒ z inkonsistent sein. Dies ist aber eine sehr spezielle Eigenschaft von K; nicht jeder Kalkül K muß in diesem Sinne maximal sein. Die Regel tnd ist gerade der formale Ausdruck dafür, daß bivalente Wahrheitsbedingungen angenommen werden: Sie besagt ja, daß etwas der Fall ist oder aber nicht der Fall ist. Aufgrund von Dummetts Argument ist diese Annahme aber als Grundlage einer adäquaten Semantik zu verwerfen (s. o. § 6.2.). Die gerade angeführten Überlegungen führen genau zu demselben negativen Resultat: tnd ist nicht konstruktionserhaltend. (Allerdings kann die Anwendung von tnd in bestimmten Bereichen durch bereichsbezogene Untersuchungen gerechtfertigt werden.) Im Unterschied zu den vorher behandelten semantischen Systemen zeichnet sich S7 durch einen operationalen Zug aus: durch seine starke Betonung effektiv ausführbarer Operationen. Ein Informationsmittel zur Darstellung komplexer Operationen soll auch im nächsten Abschnitt behandelt wer-
180
I. Systematik
den. Seine Ausdrücke sind Flußdiagramme, die trotz aller graphischen Unterschiede den hier verwendeten Konstruktionstermen semantisch recht ähnlich sind.
7.
Monotonie und Dynamik: Domain-Theorie
7.1.
Verfahren und ihre Darstellung durch Flußdiagramme
7.1.1. Verfahren als semantische Einheiten Mit Ausnahme des nach S7 analysierten L(A) sind die bisher betrachteten Informationsmittel in gewisser Hinsicht statisch und deskriptiv orientiert. Ihre Ausdrücke dienen der Darstellung von Sachverhalten, aber sie geben ihren Benutzern keinerlei Instruktionen darüber, was mit den dargestellten Sachverhalten und den an ihnen beteiligten Gegenständen anzufangen ist. Aus einer Reihe von Gründen kann man damit unzufrieden sein: (i) Eine eher verfahrensorientierte, dynamische Betrachtungsweise empfiehlt sich bei der semantischen Analyse mit direktiver Kraft verwendeter Ausdrücke (s. o. § 5.4.). Vielfach wird in einem direktiven Akt dem Empfänger der zu erreichende Zielzustand ja nicht nur beschrieben, sondern er wird aufgefordert, durch ein bestimmtes Verfahren, eine bestimmte Handlungsweise diesen Zustand herzustellen (vgl. zur „manner-of-execution-specification“ Rescher 1966: 21). (ii) Bereits bei der Motivation von S7 ist auf den unkonstruktiven Charakter der in den anderen semantischen Systemen benutzten Einheiten hingewiesen worden. Welche Rolle soll aber eine als (mengentheoretische) Funktion aufgefaßte Einheit in der Semantik eines Informationsmittels I spielen, wenn die Benutzer von I bestenfalls für einige Argumente dieser Funktion auch tatsächlich die zugehörigen Werte ermitteln können? Wären nicht Verfahren (Prozeduren), die die Zeichenbenutzer wirklich ausführen können, plausiblere Kandidaten für die Rolle semantischer Einheiten? Eine positive Antwort gibt hier die prozedurale Semantik: „In finest detail the meaning of a word, phrase, or utterance is a procedure, or collection of procedures“ (Suppes 1980: 28; vgl. auch Winograd 1983: Kap. 1). (iii) In einer verifikationistischen (s. o. § 1.2.) Bedeutungstheorie wird Verfahren als semantischen Einheiten von vornherein eine ausgezeichnete Rolle zugewiesen: Die Bedeutung eines t-Ausdrucks besteht nach diesem Ansatz ja in ei-
nem Verfahren ⫺ dem Verfahren zu seiner Verifikation. ⫺ In diesem Abschnitt soll nun gerade ein Informationsmittel, FD, untersucht werden, dessen Ausdrücke der Darstellung von Verfahren dienen. Bei diesen Ausdrücken handelt es sich um Flußdiagramme. In allen drei gerade angesprochenen Punkten erweisen sich Flußdiagramme als nützlich: (i) Die Bedeutungen direktiv verwendeter Ausdrücke etwa kann man als Programme auffassen, deren Ausführung von den jeweiligen Empfängern verlangt wird. Flußdiagramme sind aber gerade Programmdarstellungen (vgl. Scott 1971 und Börger 1985: 2⫺29); man vgl. etwa, welchen Gebrauch Rescher (1966: Kap. 4) von Flußdiagrammen in seiner Imperativsemantik macht. (ii) Entsprechendes gilt auch für die prozedurale Semantik. Für die Kindersprache, also die zunächst erworbene Ausprägung einer natürlichen Sprache, sind Suppes (1974: 121) zufolge die adäquaten semantischen Einheiten für Personennamen Programme zur Ausführung perzeptueller Tests, mit denen der jeweilige Namensträger identifiziert wird. Auch ein solches perzeptuelles Programm kann man durch ein Flußdiagramm darstellen. (iii) In seiner kritischen Untersuchung der spieltheoretischen Semantik, die auf einer verifikationistischen Bedeutungstheorie aufbaut, repräsentiert zum Beispiel Posch (1987: 280⫺292) die Bedeutungen bestimmter Ausdrücke (der Form: „Alle z sind j“, „Kein z ist j“ usw.) durch Flußdiagramme und hebt so den Verfahrenscharakter dieser Bedeutungen, ihren dynamischen Aspekt hervor. Zur semantischen Analyse der Flußdiagramme von FD werden im folgenden Begriffe und Verfahren der von D. Scott entwikkelten Domain-Theorie (vgl. z. B. Scott 1972 und 1975 sowie Stoy 1977 und Gordon 1979) herangezogen. Am intensivsten ist die Domaintheorie bisher in der semantischen Analyse von Programmiersprachen angewendet worden; es gibt aber auch linguistische (z. B. Turner 1983) und wissenschaftstheoretische Anwendungen (z. B. Laymon 1987) der Domain-Theorie. 7.1.2. Flußdiagramme und ihre konkrete Syntaktik Ich gebe zunächst eine anschauliche Beschreibung von FD. ⫺ Flußdiagramme sind graphische Darstellungen von Verfahren, wie mit bestimmten Fließgrößen ⫺ z. B. Zahlen, Ausdrücken oder Bauklötzchen ⫺ umzugehen ist. Wie die elementaren Sprachen (s. o.
181
3. Semantik
Beginn
Beginn
f!
Ja
b?
FD Operationen sind, die an ihnen auszuführen sind (z. B. Addition oder Multiplikation; „Verfahren“ und „Operation“ verwende ich in diesem Abschnitt synonym). Ein Flußdiagramm von FD besteht aus Kästchen und Pfeilen, die die Kästchen miteinander verbinden. Jedes Flußdiagramm besitzt einen Eingangs- und einen Ausgangspunkt, die durch mit „Beginn“ und „Ende“ gekennzeichnete Kreise markiert sind. Zwei Kästchenarten sind zu unterscheiden: rechteckige Operationskästchen, die einfachste Teiloperationen symbolisieren, und sechseckige Alternativkästchen, die für Tests stehen, denen die Fließgrößen zu unterwerfen sind. Nur Tests mit Ja/Nein-Ergebnis sind zugelassen. Operationskästchen sind minimale Flußdiagramme, die Ein-Schritt-Verfahren darstellen: Sie haben Eingangs- und Ausgangspunkt; s. Abb. 3.8 (a). Alternativkästchen hingegen sind selbst keine Flußdiagramme: Sie besitzen zwar einen Eingangs-, aber keinen Ausgangspunkt. Statt dessen haben sie für die beiden möglichen Testergebnisse je einen mit „Ja“ und „Nein“ beschrifteten Ausgang; s. Abb. 3.8 (b). Das einfachste EinSchritt-Verfahren besteht darin, gar nichts zu tun und jede eintretende Fließgröße unverändert zu lassen. Dieses Verfahren wird durch
Beginn
Nein
Ende
I
Ende
(a)
(b)
(c)
Abb. 3.8: Grundbausteine der Flußdiagramme: (a) Ein Operationskästchen. (b) Ein Alternativkästchen. (c) Das identische Diagramm.
§ 4.6.) bilden auch die Flußdiagramminformationsmittel eine Familie, deren Mitglieder sich im Bestand ihrer deskriptiven Konstanten (bei FD: Ausdrücke für einfache Verfahren und Tests) unterscheiden. Das genaue Vokabular von FD soll (ausnahmsweise) nicht angegeben werden. Ich setze lediglich voraus, daß die Fließgrößen von FD positive ganze Zahlen (1, 2, 3, …) und die Verfahren von
Beginn
Q!
+2!
Beginn
Ja
gerade?
Q!
Beginn
Nein
+2!
Ja
prim?
Q!
Beginn
Nein
+2!
Ja
prim?
Q!
Nein
I
Ende
Ende
Ende
Ende
(a)
(b)
(c)
(d)
Abb. 3.9: Syntaktische Operationen zum Aufbau von Flußdiagrammen: (a) Produktbildung. (b) Summenbildung. (c) Eine von (b) verschiedene Summe mit denselben Summanden. (d) Das identische Diagramm I als Summand.
182
I. Systematik
das identische Diagramm (oder: die Identität) dargestellt; s. Abb. 3.8 (c). In FD gibt es verschiedene Ein-Schritt-Verfahren und Tests. Welches Verfahren oder welcher Test jeweils gemeint ist, wird durch Beschriftung der Kästchen angegeben. Neben mnemotechnischen Beschriftungen sollen dabei als Etikette der Operationskästchen „f!“, „f0!“, „f1!“ usw. und als Etikette der Alternativkästchen „b?“, „b0?“, „b1?“ usw. verwendet werden. „I“ ist Etikett der Identität. Kästchen, Tests und Verfahren werden gleichermaßen im folgenden durch ihre Etikette benannt. ⫺ Identität, Operations- und Alternativkästchen können in unterschiedlicher Weise zu syntaktisch komplexeren Diagrammen kombiniert werden. Ist Q! zum Beispiel das Verfahren, Zahlen zu Quadrieren, und ⫹2! die Operation, zu einer eingegebenen Zahl Zwei hinzuzuaddieren, so gibt Abb. 3.9 (a) das Diagramm des Verfahrens an, eine eingegebene Fließgröße zunächst zu quadrieren und das Quadrat dann um Zwei zu vermehren. Das Ergebnis d eines solchen Hinter-
einanderschaltens zweier Diagramme d1 und d2 (ggf. indizierte „d“-s sind Diagrammvariablen) bezeichnet man auch als „Produkt“ (d1; d2 ) von d1 und d2: (d1; d2 ) ⫽ d. Verweist „gerade?“ auf den Test, ob eine eingegebene Zahl gerade ist, so stellt Abb. 3.9 (b) das Verfahren dar, eine Zahl zunächst auf diese Eigenschaft hin zu untersuchen, bei positivem Testausgang zu quadrieren, aber bei negativem um Zwei zu vermehren. Diese Art der Kombination d zweier Diagramme d1 und d2 hinter einem Alternativkästchen b? nennt man „(b?-)Summe von d1 und d2“: d ⫽ (b? ⇒ d1, d2 ). Jedes Alternativkästchen bestimmt seine eigene Summenoperation. Ist prim? der Test auf die Primzahleigenschaft, so ist zum Beispiel auch das Diagramm von Abb. 3.9 (c) eine Summe, die sogar dieselben Summanden wie die Summe von Abb. 3.9 (b) hat; es handelt sich aber um eine andere Summe. ⫺ Abb. 3.9 (d) demonstriert eine Verwendung von I; dort taucht die Identität als einer der Summanden auf. Das Diagramm schreibt
Beginn
Ja
Ja
I
gerade?
Beginn
Nein
prim?
Nein
Ja
+2!
Q!
Ende
(a)
gerade?
Ja
Nein
Q!
Ja
I
gerade?
prim?
Nein
Nein
Q!
Ende
(b)
Abb. 3.10: Annäherungsbeziehung. Das Diagramm (b) ist eine Annäherung an das Diagramm (a). In der Annäherung wird offengelassen, was bei einem negativen Ausgang des ersten Tests zu geschehen hat.
183
3. Semantik
vor, Primzahlen zu quadrieren und Zahlen, die nicht prim sind, unverändert zu lassen. Flußdiagramme können sehr verwickelt werden, und beim Entwerfen solcher Diagramme erweist es sich daher oft als nützlich, zunächst einige Teile unausgeführt zu lassen und sich auf die Ausarbeitung anderer Teile zu konzentrieren. Den unausgeführten Teil kann man dann durch ein bloß gestrichelt gezeichnetes Rechteck kennzeichnen. Dieser Teil kann bei späterer Entwicklung durch ein konkretes Diagramm ausgefüllt werden. So hat man neben kompletten Diagrammen noch Annäherungen an diese. Diagramme, die sich von den durch sie angenäherten Diagrammen lediglich durch gestrichelte Bestandteile unterscheiden, sollen „unterbestimmt“ heißen. Das Diagramm, das nur aus einem gestrichelten Operationskästchen mit Eingangs- und Ausgangspunkt besteht, ist völlig unterbestimmt; es ist das unterbestimmte Diagramm ⊥. (Das unterbestimmte Diagramm ist also stets ⊥, ein unterbestimmtes Diagramm ist ein solches, das ⊥ als Teil enthält.) Abb. 3.10 (b) zeigt zum Beispiel ein ⊥ enthaltendes Diagramm, welches das Diagramm von Abb. 3.10 (a) annähert. Daß d1 eine Annäherung von d2 ist, soll mit „d1 d2“ wiedergegeben werden. Für jedes Diagramm d gilt d d, da d die beste Annäherung an sich selbst ist. Andererseits ist ⊥ die denkbar schlechteste Annäherung (die am wenigsten detaillierte), so daß für jedes d ⊥ d gilt und aus d ⊥ d ⫽ ⊥ folgt. Produkt- und Summenbildung führen lediglich zu Diagrammen recht einfacher Art: Mit so gebildeten Diagrammen lassen sich zum Beispiel keine Verfahren darstellen, bei denen ein gewisses Teilverfahren solange wiederholt werden soll, bis sich ein bestimmtes Ergebnis einstellt. Dazu benötigt man die Schleifenbildung. Sei zum Beispiel perfekt? der Test auf Perfektheit (eine Zahl ist perfekt, wenn sie die Summe ihrer echten Teiler ist; so ist etwa 6 ⫽ 1 ⫹ 2 ⫹ 3 perfekt, ebenso 28 ⫽ 1 ⫹ 2 ⫹ 4 ⫹ 7 ⫹ 14). Nun vergegenwärtige man sich folgendes Verfahren: Eine eingegebene Zahl wird zunächst geprüft, ob sie gerade ist. Falls dies nicht der Fall ist, wird sie mit dem Verfahren ⫹1! um Eins erhöht. Mit der so modifizierten Fließgröße wird dann so verfahren wie mit einer geraden Eingabe: Sie wird auf Perfektheit überprüft. Geht dieser Test positiv aus, so wird die erreichte Zahl über I ausgegeben; andernfalls wird sie um 2 erhöht (⫹2!) und das Ergebnis wird abermals auf Perfektheit getestet. Ist die erreichte Zahl
perfekt, so wird sie über I ausgegeben, andernfalls wiederholt man die Addition von Zwei und wiederholt das ganze anschließende Verfahren. Diese Operation wird von dp, s. (118), dargestellt. Es ergibt für jede Eingabe n als Ausgabe die erste gerade perfekte Zahl m ⱖ n (z. B. für die Eingaben 3, 14 und 127 die Ausgaben 6, 28 und 496; 496 ist die dritte vollkommene Zahl nach 6 und 28). Ob es überhaupt ungerade perfekte Zahlen gibt, ist ungewiß; man vermutet, daß dies nicht der Fall ist. (118) Beginn
Ja
gerade?
Nein
+1!
Ja
perfekt?
Nein
+2!
I
Ende
Das Diagramm dp enthält im unteren rechten Teil eine Schleife. Dort wird der Test perfekt? mit der Identität für positiven Testausgang und mit der Operation ⫹2! bei negativem kombiniert. Anders als bei einer Summenbildung (vgl. oben Abb. 3.9 (b)⫺(d)) werden aber die Ausgänge von I und ⫹2! nicht zusammengefaßt, sondern der Ausgang von ⫹2! wird zum Eingang von perf? zurückgeführt, so daß der Perfektheitstest mit anschließender Addition von Zwei solange wiederholt wird, bis eine perfekte Zahl erreicht wird, die dann als Verfahrensresultat ausgegeben wird. Das schleifenhaltige Teildiagramm von dp soll im folgenden als „ds“ bezeichnet werden. Schleifen, wie sie ds veranschaulicht, nennt man auch „while-loops“: Ist b? ein Alternativkästchen und d ein (ggf.
184
I. Systematik
selbst komplexes) Diagramm, so ist (b?*d), s. (119), die mit b? und d gebildete whileSchleife (s. Scott 1971: 341 und Börger 1985: 16; manchmal wird verlangt, daß die Schleife über den positiven Ausgang ⫺ und nicht wie hier über den negativen ⫺ des beteiligten Alternativkästchens läuft; durch Umkehrung der Testpolarität läßt sich aber eine Negativschleife in eine Positivschleife verwandeln). (119) Beginn
Ja
Ende
b?
Nein
f!
I
Die graphischen Effekte der syntaktischen Operationen F;, F⇒ und F*, mit denen Produkte, Summen und Schleifen gebildet werden (also (d1; d2 ) ⫽ F; (d1, d2 ), (b? → d1, d2 ) ⫽ F⇒(b?, d1, d2 ) und (b?*d) ⫽ F*(b?, d)) lassen sich leicht den als Beispielen abgebildeten Diagrammen entnehmen. Auch die Kategorialgrammatik von FD ist recht einfach: Sei D die Basiskategorie der Diagramme, dann gehören Operationskästchen selbst zu D und Alternativkästchen sind Funktoren der Kategorie D/(D, D). Die für FD einschlägigen Regeln gibt (120) an. (120a) R; ⫽ *F;, *D, D+, D+ (120b) R⇒ ⫽ *F⇒, *D/(D, D), D, D+, D+ (120c) R* ⫽ *F*, *D/(D, D), D+, D+ Damit ist die konkrete Syntaktik für FD bestimmt. Sie wird hier „konkret“ genannt, weil sie die tatsächlich anschaulich-geometrische Ausführung der Diagramme reglementiert. Zur semantischen Beschreibung von FD erweist sich eine abstrakte Syntaktik als sehr nützlich, die sich zur konkreten ungefähr so verhält wie die analytische Geometrie zur synthetischen (vgl. Art. 78). 7.2. Funktionen als Zuordnungsregeln: operationale Semantik Wenn gesagt wird, daß ein Diagramm d von FD ein Verfahren darstelle, so heißt dies, daß d angibt, was man mit einer Fließgröße tun muß, um das von d dargestellte Verfahren zu befolgen. Hierin besteht der dynamische („tun“) und regulative („muß“) Charakter der Flußdiagramme. Hebt man diese beiden Aspekte der Flußdiagramme hervor, so lautet
die für FD zu stellende semantische Schlüsselfrage: Wann steht ein bestimmtes Vorgehen im Einklang mit den von einem Diagramm erteilten Instruktionen? Eine Semantik S8 für FD, die von dieser Fragestellung ausgeht, wird „operationale“ Semantik genannt, vgl. Art. 23 § 5.f. Eine Vorgehensweise wird in der operationalen Semantik als „Berechnung“ oder „Berechnungsfolge“ bezeichnet, was aber keinesfalls heißt, daß die Fließgrößen Zahlen und die vorzunehmenden Operationen Rechenoperationen sein müssen. Der semantische Schlüsselbegriff für S8 ist also der der korrekten, mit einem Diagramm übereinstimmenden Berechnung. Um ihn etwas genauer erklären zu können, sollen folgende (auch für die weiteren Unterabschnitte verbindlichen) Vereinbarungen getroffen werden: E soll der Bereich der Fließgrößen, F die Gesamtheit der Operations- und B die der Alternativkästchen sein. Eine Ausgangsinterpretation für FD über E besteht aus zwei Abbildungen O (für Operationen) und T (für Tests): O ordnet den F-Elementen Funktionen zu, die ihrerseits Elementen von E wiederum Fließgrößen zuweisen, und T interpretiert die Kästchen aus B durch Attribute über E. (Die konkreten Beispiele gingen davon aus, daß (i) E ⫽ ⺞⬎o gilt (ii) O(⫹2!) die ebenfalls mit „⫹2!“ bezeichnete Operation, Zwei zu addieren, ist, (iii) T(gerade?) das auch mit „gerade?“ bezeichnete Attribut, gerade Zahl zu sein, ist usw.) Eine Berechnung c für eine Eingabe g aus E in ein Diagramm d kann dann zum Beispiel als Folge c ⫽ *g0, d0, g1, d1, …+ aufgefaßt werden, in der g ⫽ g0 und d ⫽ d0 ist. Im Übergang von gn zu gn ⫹ 1 zeigt sich die Modifikation der Fließgröße, die der durchflossene Teil von d bewirkt hat. Beginnt dabei dn mit einem Operationskästchen f! und ist O(f!)(gn ) ⫽ m, so ist das auf dn folgende gn ⫹ 1 ⫽ m; dn ⫹ 1 ist der auf f! folgende, noch abzuarbeitende Teil von d. Fängt dm aber mit einem Alternativkästchen b? an und trifft T(b?) auf gn zu, so ist das auf dn folgende gn ⫹ 1 gleich gn, und das auf dn folgende dn ⫹ 1 ist der noch zu durchlaufende Diagrammteil von d, der sich am positiven Ausgang von b? anschließt. Trifft hingegen T(b?) nicht auf gn zu, so ist zwar ebenfalls gn ⫹ 1 ⫽ gn, aber dn ⫹ 1 ist der sich am negativen Ausgang von b? anschließende Diagrammteil von d. Auf eine genaue Definition soll hier verzichtet werden (vgl. z. B. de Roever 1976: 4⫺13); statt dessen gibt (121) zwei Berechnungsbeispiele für die Diagramme d1 von Abb.
3. Semantik
3.10 (a) und dp von (118) an. In (121a) soll d2 das Teildiagramm von d1 sein, das sich in d1 an den positiven Ausgang des prim?-Kästchen anschließt, s. Abb. 3.10 (a). (121a) c1 ⫽ *7, d1, 7, d2, 7, Q!, 49+ Gib 7 in d1 ein! ⫺ Ist 7 prim? ⫺ Ja! ⫺ Dann gib 7 in d2 ein! ⫺ Ist 7 gerade? ⫺ Nein! ⫺ Dann gib 7 in Q! ein! ⫺ Ausgabe: 49. (121b) c2 ⫽ *4, dp, 4, ds, 4, (⫹2!; ds ), 6, ds, 6+ Gib 4 in dp ein! ⫺ Ist 4 gerade? ⫺ Ja! ⫺ Dann gib 4 in ds ein! ⫺ Ist 4 perfekt? ⫺ Nein! ⫺ Dann gib 4 in (⫹2!; ds ) ein! ⫺ Addiere also zunächst 2! Ergebnis: 6. ⫺ Gib 6 in ds ein! ⫺ Ist 6 perfekt? ⫺ Ja! ⫺ Ausgabe: 6. An den beiden Beispielen erkennt man, daß das operationale S8 (mit Hilfe der gewählten Ausgangsinterpretation) zu jedem Diagramm d eine Zuordnung Zd bestimmt, die einem g aus E genau dann den Wert g' zuweist, wenn es eine mit d übereinstimmende Berechnung c gibt, die mit der Eingabe g beginnt und zur Ausgabe g' führt. Man beachte aber, s. (121b), daß die in Berechnungen auftauchenden, jeweils noch abzuarbeitenden Teildiagramme nicht zunehmend kleiner werden. Auf das erste ds-Glied von c2 folgt das umfassendere Diagramm (⫹2!; ds ). Hierin spiegelt sich das zweifache Durchlaufen der Schleife wider. Daraus, daß die Diagrammteile in Berechnungen nicht stetig kleiner werden, ergibt sich, daß die von einem schleifenhaltigen Diagramm d festgelegte Zuordnung Zd selbst dann nicht für jede Eingabe eine zugehörige Ausgabe bestimmen muß, wenn O jedem Operationskästchen eine totale Funktion aus EE und T jedem Alternativkästchen ein totales Attribut über E zuweist. Angenommen zum Beispiel, p wäre die größte perfekte Zahl (man weiß zur Zeit nicht, ob es ein solches p wirklich gibt, doch vermutet man eher das Gegenteil, was allerdings an der folgenden Argumentation nichts ändert). Würde man dann p ⫹ 1 in dp eingeben, so würde das damit in Gang gesetzte Vorgehen niemals abbrechen: Es würden nacheinander alle geraden Nachfolgerzahlen von p ⫹ 1 auf Perfektion hin untersucht. Da es unendlich viele solcher Zahlen gäbe, käme eine solche Untersuchung nie zu einem Ende; die betreffende Berechnungsfolge wäre unendlich. Die partiellen Zuordnungen, die in der operationalen Semantik S8 Diagrammen als zugehörige semantische Einheiten zugewiesen
185 werden, sind also durch Berechnungen bestimmt, wobei Berechnungen ihrerseits nichts anderes als Regelbefolgungen sind. Es wäre daher angebrachter zu sagen: Diagramme bestimmen in der operationalen Semantik Zuordnungsregeln. Zuordnungsregeln sind Verfahrensrichtlinien, die sich aus Instruktionen für Einzelschritte aufbauen: Verfahrensweisen, die unterschiedliche Einzelschritte auszuführen vorschreiben, sind selbst dann voneinander verschieden, wenn durch sie denselben Argumenten dieselben Werte zugewiesen werden. Genau dieser Begriff der Zuordnungsregel ist nun aber der Funktionsbegriff, der in der Mathematik bis ins 19. Jahrhundert hinein gang und gäbe war, während die neuere Funktionsauffassung, nach der eine Funktion eine Gesamtheit von Argument-Wert-Paaren ist, sich erst mit dem Aufkommen der Mengenlehre durchsetzte (obwohl eine mengentheoretische Einkleidung dieser Auffassung nicht notwendig ist). 7.3. Funktionen als Zuordnungsgraphen: denotationale Semantik Nach mengentheoretischer Auffassung ist die Identität einer Funktion durch ihren Zuordnungseffekt bestimmt: Funktionen, die dieselben Zuordnungen herstellen, sind identisch, auch wenn die jeweils dabei befolgten Zuordnungsregeln ⫺ die Funktionen im älteren Sinne ⫺ sich voneinander unterscheiden. Manchmal reserviert man auch heute noch den Terminus „Funktion“ für die Zuordnungsregel und bezeichnet dann die Klasse der Argument-Wert-Paare *a, w+, die der Regel genügen, als den „Graph“ der Funktion. Eine Semantik S9 für FD, die von der Schlüsselfrage ausgeht, welchen Zuordnungsgraph ein Diagramm festlegt und wie dieser Graph kompositional aus den Graphen der Teildiagramme zu ermitteln ist, bezeichnet man als „denotational“. (Nach der in diesem Artikel benutzten Terminologie wäre „operativ“ ⫺ „designativ“ das passendere Gegensatzpaar; ich opfere hier die terminologische Stringenz dem eingebürgerten Sprachgebrauch.) Operationaler und denotationaler Ansatz basieren auf zueinander komplementären Fragestellungen und schließen einander keineswegs aus. Im Gegenteil, wird man ja von einer adäquaten denotationalen Semantik verlangen, daß sie einem Diagramm d den Graph der Zuordnungsregel zuweist, die d gemäß operationaler Auffassung festlegt (vgl. zum Äquivalenzproblem de Roever 1976: 9⫺17). ⫺ Im folgenden soll beschrieben werden, wie
186 ein denotationales S9 für FD vorgeht. „Funktion“ heißt dabei im folgenden stets soviel wie „Graph einer Zuordnungsregel“. 7.3.1. Schleifen als unendliche Diagramme Es ist nicht besonders schwer, den syntaktischen Operationen F; und F⇒ semantische Gegenstücke zuzuweisen. Bestimmen zum Beispiel die Diagramme d1 und d2 die Funktionen h1 bzw. h2, so sollte nach den Erklärungen von § 7.1.2. (d1; d2 ) die Komposition h3 ⫽ (h1 · h2 ) von h1 und h2 bedeuten: Für g aus E ist (h1 · h2 )(g) ⫽ h2(h1(g)). Ist weiter a das von b? bedeutete Attribut, so sollte die b?-Summe (b? ⇒ d1, d2 ) die Funktion h4 bedeuten, die man durch Fallunterscheidung nach a definiert: Ist a(g) ⫽ W, so ist h4(g) ⫽ h1(g); für a(g) ⫽ F ist hingegen h4(g) ⫽ h2(g) (diese Bestimmungen werden in § 7.3.5. noch ergänzt). Schwierigkeiten macht erwartungsgemäß die Interpretation von F*. Als Beispiel zur Erläuterung dieser Schwierigkeiten soll die Schleife ds des Diagramms dp dienen. Die von ds bestimmte Funktion hs ordnet jeder (un-)geraden Zahl m die kleinste perfekte (un-) gerade Zahl hs(m) ⱖ m zu. Wenn alle perfekten Zahlen gerade sind, ist hs für alle ungeraden Zahlen undefiniert. Die beiden syntaktischen Teile von ds sind das perfekt?-Kästchen, welches das Attribut perfekt?, und das ⫹2!-Kästchen, das die Funktion ⫹2! bedeutet. Wie erhält man aus diesem Material hs? Die zu ds gehörige Zuordnungsregel ist leicht zu beschreiben: Bilde für ein vorgelegtes g aus E sukzessive die ⫹2!-Werte g ⫽ ⫹2!0(g), g ⫹ 2 ⫽ ⫹2!1(g) ⫽ ⫹2!(g), g ⫹ 4 ⫽ ⫹2!2(g) ⫽ ⫹2!(⫹2!1(g)), g ⫹ 6 ⫽ ⫹2!3(g) ⫽ ⫹2!(⫹2!2(g)) usw. Bei dem ersten m aber, für welches ⫹2!m(g) eine perfekte Zahl ist, brich ab, denn ⫹2!m(g) ist der gesuchte Wert von hs für g! Der sukzessiven Wiederholung der Operation ⫹2! und des Tests perfekt? entspricht in Berechnungsfolgen für ds, daß das Diagramm ds selbst mehrfach als Folgeglied auftritt, zum Beispiel in c22 für die Eingabe 22 viermal: c22 ⫽ *22, ds, 22, (⫹2!; ds ), 24, ds, 24, (⫹2!; ds ), 26, ds, 26, (⫹2!; ds ), 28, ds, 28+. Damit solche mehrfachen Schleifendurchläufe in einem kompositionalen Interpretationsverfahren, das ja syntaxgeleitet ist, berücksichtigt werden kann, müßten sie sich in der syntaktischen Gestalt von ds irgendwie widerspiegeln. Da der denotationale Ansatz mit dem operationalen übereinstimmen soll, wäre es daher naheliegend, die jeweils noch abzuarbeitenden Diagrammteile in Berechnungsfolgen eines Diagramms d als syntaktische Teile von d aufzufassen. Tatsächlich ist ja auch zum Beispiel der Diagrammteil von ds, der sich an den negativen Ausgang des perfekt?Kästchens anschließt, das Produkt des ⫹2!-Kästchens mit d2 selbst: (⫹2!; ds ). Diese Teilausdrucksbeziehung ist aber nicht mehr fundiert: ds enthält den Teilausdruck (⫹2!; ds ), der wiederum den Ge-
I. Systematik samtausdruck ds als seinen Teil enthält! Andererseits verhilft diese syntaktische Zirkularität dem semantischen Umstand, daß zur Ermittlung von hs(22) das vom ⫹2!-Kästchen bedeutete Verfahren dreimal auf die Eingabe 22 anzuwenden ist, zu seinem syntaktischen Reflex: ds enthält sich selbst dreimal (und sogar beliebig oft) als Teil. Irgendeinen syntaktischen Ansatzpunkt dieser Art muß das kompositionale Verfahren haben. Allerdings hat die anschaulich-konkrete Syntaktik von FD, s. o. § 7.1.2., so etwas gerade nicht. Graphisch, vom Zeichenaufwand her, kann sich ein Diagramm nicht selbst (echt) enthalten! Im folgenden muß daher zunächst eine abstrakte Syntaktik (s. §. 7.1.2.) angegeben werden, die eine nichtfundierte Teilausdrucksbeziehung zuläßt, nach der ein Ausdruck sich selbst (nicht-trivial) als Teil enthalten kann.
Der abstrakten Syntaktik und der auf ihr aufbauenden kompositionalen Semantik S9 liegen zwei Ideen zugrunde (vgl. Scott 1971: 341⫺355). Sicherlich wird man sich kaum ein endliches Diagramm anschaulich vorstellen können, das sich selbst als Teil enthält. Andererseits läßt sich aber leicht ausmalen, wie ein unendliches Diagramm dieser Art aussehen müßte; Abb. 3.11 zeigt die unendliche Version d⬁ der Schleife ds. Streicht man in dem unendlichen Diagramm d⬁ der Abb. 3.11 die oberste, mit 1 numerierte Diagrammschicht, der das endliche Diagramm d'⬁1 ⫽ (perfekt? ⇒ I, ⫹2!) entspricht, so erhält man als Rest wiederum das Diagramm d⬁. Das Diagramm d⬁ enthält sich also selbst (unendlich oft) als Teil. Ein Ziel der abstrakten Syntax von FD wird es sein, das graphisch unendliche d⬁ durch eine abstrakte Repräsentation dⴥ zu modellieren, das die für die Semantik wichtigen Eigenschaften von d⬁ simuliert. Das ist die erste Idee, auf der S9 basiert. ⫺ Auf der syntaktischen Ebene hat dann zwar die semantische Eigenschaft der Schleifen, beliebig viele Durchläufe zu ermöglichen, einen Reflex in ihrer Eigenschaft, sich selbst als syntaktischen Teil zu enthalten, aber leider ist es gerade diese Eigenschaft, die erneut dem kompositionalen Interpretationsverfahren, wie es etwa S4 für L(G) exemplifiziert, ein unübersteigbares Problem in den Weg legt. Für das Funktionieren dieses Interpretationsverfahrens ist es ja wesentlich, daß sich ein Ausdruck in endlich vielen Schritten eindeutig auf seine Grundausdrücke zurückführen läßt. Wenn nun aber die Bedeutung von d⬁ eine Funktion der Bedeutungen der Teile von d⬁ ist und sich d⬁ selbst unter diesen Teilen befindet, so würde eine kompositionale Ermitt-
187
3. Semantik
strakte Modellierung erzwungen werden: dⴥ, das nach Maßgabe des Diagramms der Abb. 3.11 konstruiert wird, erweist sich als ⴥ Limes einer unendlichen Folge * dⴥn+ nⴝ0 immer besser werdender, aber endlicher Approximationen an dⴥ. Genau dies ist die zweite Grundidee von S9. Zunächst muß also erklärt werden, was es heißt, daß eine Diagrammodellierung eine andere annähert.
Beginn
Ja 1
Ja 2
3
• • •
Ja
perfekt?
perfekt?
perfekt?
• • •
Nein
Nein
Nein
+2!
+2!
+2!
• • •
Ende Abb. 3.11: Die unendliche Version d⬁ der Schleife ds.
lung der d⬁-Bedeutung eine Kenntnis dieser Bedeutung gerade voraussetzen. Die syntaktische Zirkularität von d⬁ (oder ds ) bedingt eine semantische, die fatal an die semantischen Antinomien (s. o. § 5.3.1.) erinnert. Nun reicht aber andererseits für jede Eingabe, für die ds überhaupt ein Ergebnis zeitigt, bereits ein endliches Teilstück von d⬁ hin, um dasselbe Resultat zu liefern: für perfekte Zahlen das gerade erwähnte Teilstück d'⬁1 der Schicht 1; für solche Zahlen m, bei denen schon m ⫹ 2 perfekt ist, reicht das durch die ersten beiden Schichten von d⬁ bestimmte Diagramm d'⬁2 ⫽ (perfekt? ⇒ I, (⫹2!; (perfekt? ⇒ I, ⫹2!))) usw. Jedes dieser Teilstücke ist aber ⫺ da schleifenfrei ⫺ völlig problemlos kompositional zu behandeln. Könnte man daher nicht diese endlichen Diagramme d'⬁1, d'⬁2, …, d'⬁n … syntaktisch und semantisch als immer bessere Annäherungen an d⬁ ansehen? Genau dies soll durch die ab-
7.3.2. Die Annäherungsbeziehung als Verbandsordnung Die Modellierungen konkreter Diagramme von FD werden im folgenden einfach „Ausdrücke“ genannt. Für Ausdrücke sollen die Fettdruckversionen der für konkrete Diagramme verabredeten Notationskonventionen gelten, so daß zum Beispiel „d“, „d0“, „d1“ usw. Ausdrucksvariablen sind, „⊥ ⊥ “ den unbestimmten Ausdruck bezeichnet, die Ausdrücke für Operationskästchen aus F und die für Alternativkästchen aus B stammen. Die Gesamtheit der Ausdrücke ist D. Nach dem zum Schluß von § 7.3.1. aufgestellten Programm soll zunächst für die Ausdrücke eine Beziehung der Annäherung bestimmt werden. Nun ist aus der konkreten Syntaktik von FD schon die Annäherungsbeziehung bekannt, und die Beziehung für die Ausdrücke sollte natürlich den Gesetzmäßigkeiten gehorchen, die auch die Beziehung zwischen Diagrammen befolgt, denn Ausdrücke modellieren ja Diagramme. Demnach gelten zunächst für die Gesetze von (122). (122) Für alle Ausdrücke d gilt: (122a) d d (Reflexivität); (122b) ⊥ d (Minimalität von ⊥ ); (122c) falls d ⊥ , so d ⫽ ⊥ (Eindeutigkeit von ⊥ als Minimum). Nach (122a) ist die Annäherungsbeziehung von D reflexiv; die Erläuterungen zur konkreten Annäherungsbeziehung legen sicherlich auch nahe, daß sie transitiv sein sollte, s. (123a). Ebenso motiviert man mit anschaulichen Überlegungen an konkreten Diagrammen die Antisymmetrie von : d1 d2 heißt ja, daß das vom Ausdruck d1 repräsentierte Diagramm höchstens so detailliert ist wie das, das d2 modelliert. Wenn nun die von d1 und d2 repräsentierten Diagramme in allen ausgeführten Bestandteilen übereinstimmen, das von d1 modellierte aber höchstens so detailliert wie das von d2 repräsentierte und umgekehrt das d2-Diagramm höchstens so detailliert wie das d1-Diagramm ist, so stellen d1 und d2 in D offensichtlich dasselbe konkrete
188
I. Systematik
To
Diagramm dar, und da man für die Modellierung keine Redundanzen wünscht, sollte d1 ⴝ d2 sein, s. (123b).
Eine reflexive, antisymmetrische und transitive Relation ist eine partielle Ordnung: ist also eine partielle Ordnung der Ausdrucksgesamtheit D. Diese Ordnung hat den unterbestimmten Ausdruck ⊥ zu ihrem minimalen Element (s. (122b) und (122c)). In D soll es nun in Entsprechungen zu ⊥ auch einen überbestimmten Ausdruck geben, für den (124) gilt. (124) Für alle Ausdrücke d gilt: (124a) d (Maximalität von ); (124b) ⴝ d, falls d (Eindeutigkeit von als Maximum) Inhaltlich läßt sich die Einführung von so rechtfertigen: Manchmal kommt es vor, daß man beim Entwurf eines Diagramms zuviel verlangt und ein Diagramm konzipiert, dessen Verwirklichung unvereinbare Eigenschaften haben müßte. Dann gibt es natürlich keine Verwirklichung des konzipierten Diagramms: soll als überbestimmter Ausdruck gerade diese Diagramme modellieren, denen zuviel abverlangt wird. ⫺ Für die Ausdrücke f!, f0!, f1! usw. aus F ist es kaum plausibel, neben den von (122a) geforderten trivialen Approximationen d d sowie ⊥ d und d weitere Annäherungsbeziehungen einzufordern. Würde in irgendeinem anschaulich-konkreten Sinn etwa das von f0! dargestellte f0! das Kästchen f1! annähern, das f1! modelliert, so könnte man ja von vornherein auf die bloße Annäherung f0! verzichten. Die Annäherungsverhältnisse für den Bereich der Ausdrücke F kann man also durch das Diagramm der Abb. 3.12 darstellen. Eine Darstellung einer partiellen Ordnung wie die von Abb. 3.12 nennt man ein „HasseDiagramm“. In einem solchen Diagramm werden die im Sinne der Ordnung kleineren Elemente in der Zeichenebene weiter unten, die ihnen übergeordneten Elemente weiter oben durch Knoten markiert. Führt von einem Knoten k1 ein Pfad (eine Kantenfolge) hinauf zu dem höheren Knoten k2, so ist das von k1 dargestellte Element dem von k2 dargestellten untergeordnet. Abb. 3.12 stellt die Einschränkung der Beziehung der Ausdrucksannäherung
f! o
f0!
o
f1!
……
o
fm!
o
o
T
(123) Für alle Ausdrücke d1, d2, d3 aus D gilt: (123a) falls d1 d2 und d2 d3, so ist auch d1 d3; (123b) falls d1 d2 und d2 d1, dann d1 ⴝ d2.
Abb. 3.12: Das Hasse-Diagramm des flachen Verbands F der einfachen Operationsausdrücke.
auf den Bereich ein, zu dem die Ausdrücke von F sowie und ⊥ gehören. Für D ist es völlig gleichgültig, was für Elemente es enthält; aber die Elemente der Teilklasse F von D müssen bezüglich die in Abb. 3.12 dargestellte Struktur aufweisen! ⫺ Das Hasse-Diagramm von F (und ⊥ , ) ist sicherlich wenig spektakulär; es weist aber auf eine interessante Eigenschaft von F hin: F ist ein Verband! ⫺ In § 4.4.1. wurde ausgehend von einer Verbandsstruktur V ⫽ *V, · , · + die zugehörige Verbandsordnung · definiert; man kann aber auch umgekehrt aufgrund einer Verbandsordnung VO ⫽ *V, · + den zugehörigen Verband V ⫽ *V, · , · + bestimmen. Eine Verbandsordnung V ist dabei ein Paar VO ⫽ *V, · +, bei dem · eine partielle Ordnung von V ist, für die es zu je zwei Elementen von V das zugehörige Infimum und Supremum (s. o. § 4.4.1.) in V gibt. Das Infimum von v1 und v2 ist im zugehörigen Verband V gerade v1 · v2, und das Supremum von v1 und v2 ist v1 · v2. Suprema und Infima für Ausdrücke von F lassen sich aus dem Hasse-Diagramm leicht ablesen (wie bei den Wahrheitswertoperationen sollen für die Ausdrücke „ “ und „ “ benutzt werden; Verwechslungen dürften ausgeschlossen sein, da die Wahrheitswertoperationen hier nicht vorkommen): Das Supremum d1 d2 besetzt den untersten Knoten, der (höchstens) oberhalb der von d1 und d2 besetzten Knoten liegt und von beiden durch einen Kantenzug zu erreichen ist, und das Infimum d1 d2 besetzt den obersten Knoten, der (höchstens) unterhalb der von d1 und d2 besetzten Knoten liegt und wieder von beiden durch Kantenzüge zu erreichen ist. Nach Abb. 3.12 gilt zum Beispiel: f! f0! ⴝ f0! f1! ⴝ , f! ⊥ ⴝ f!, ⊥ ⊥ ⴝ ⊥ , ⊥ ⴝ , f! f m! ⴝ ⊥ usw. Auch das ist noch nicht sehr aufsehenerregend; F ist ein sogenannter „flacher“ Verband“. Das Hasse-Diagramm eines flachen Diagramms benötigt zur Anordnung der Verbandselemente höchstens drei Schichten: eine untere für die Verbandsnull, eine obere für die Verbandseins und gegebenenfalls eine mittlere für die restlichen Verbandselemente, die bezüglich der Verbandsordnung sämtlich miteinander unvergleichbar sind.
189
3. Semantik
o
{0}
o
{1}
{2}
{1,2}
o
o
o
F
o o
o
o
W
{0,2}
o
{0,1}
TW+
W
o
o
{0,1,2}
o
o
F
T (a)
0
W+
(b)
(c)
Abb. 3.13: Hasse-Diagramme dreier Verbände: (a) Der Wahrheitswertverband W. (b) Der erweiterte Wahrheitswertverband Wⴙ. (c) Der Potenzmengenverband Pot(3) der Teilmengen von {0, 1, 2}. Seine Verbandsordnung ist die Teilmengenbeziehung 債, die Vereinigung ∪ ist die Verbandssumme, der Schnitt ∩ das Verbandsprodukt.
Beginn
Ja
b0?
Beginn
Nein
Ja
b0?
Beginn
Nein
Ja
b0?
f1!
Beginn
Nein
Ja
b0?
f1! f0!
f0!
Nein
f1! f0! f2!
Ende
Ende
Ende
Ende
d1
d2
d3
d4
Abb. 3.14: Veranschaulichung der Verbandssumme von D. Es ist d3 ⴝ d1 d2; zwar gilt auch d1 d4 und d2 d4, aber d4 repräsentiert ein detaillierteres Diagramm als d3.
Daß ein Verband flach ist, heißt aber nicht, daß er unwichtig sein muß. Einige sehr wichtige Verbände sind flach, zum Beispiel der hier schon häufig benutzte Wahrheitswertverband W ⴝ *{W, F}, , + (s. Abb. 3.13(a)) oder der erweiterte Wahrheitswertverband Wⴙ (s. Scott 1971: 337⫺338), der in § 7.3.5. benötigt wird (s. Abb. 3.13(b)). Neben den Wahrheitswerten W und F umfaßt Wⴙ noch
die beiden Verbandselemente W⫹ und ⊥W⫹ (überbestimmt bzw. unterbestimmt). Etwas weniger flach ist bereits der Teilmengenverband Pot(3) der Menge {0, 1, 2}, dessen Hasse-Diagramm Abb. 3.13(c) zeigt. Die Annäherungsbeziehung ist eine Verbandsordnung für die Teilklasse F (plus und ⊥ ) von D. Wird auch D selbst von verbandsgeordnet?
190
I. Systematik
Beginn
Ja
b0?
Beginn
Nein
Ja
b0?
Beginn
Nein
Ja
b0?
Beginn
Nein
Ja
b0?
Nein
f1! I
f3!
I
I
f2!
Ende
Ende
Ende
Ende
d6
d7
d8
d8
Abb. 3.15: Veranschaulichung des Verbandsprodukts von D. Es ist d8 ⴝ d6 d7; zwar gilt auch d9 d6 und d9 d7, aber d9 repräsentiert ein weniger detailliertes Diagramm als d8.
Wenn dem so ist, welchen inhaltlichen Sinn haben dann Infimum- und Supremumbildung (d. h.: Produkt- und Summenbildung in dem Verband D, also und )? Was inhaltlich hinter der Supremumbildung steckt, macht man sich anschaulich anhand konkreter Diagramme klar. Das Supremum d3 von d1 und d2 repräsentiert in D dasjenige Diagramm, das (i) sowohl detaillierter als das von d1 modellierte als auch das von d2 dargestellte ist, das aber (ii) weniger detailliert ist als jedes andere konkrete Diagramm, das ebenfalls die von d1 und d2 modellierten Diagramme an Detailtreue übertrifft. Die Supremumbildung hat auf der anschaulichen Ebene zumindest für Diagramme, die so miteinander vereinbar sind wie die beiden Diagramme der Abb. 3.14, einen guten inhaltlichen Sinn. Stellen aber d1 und d2 miteinander unverträgliche Diagramme ⫺ d1 zum Beispiel eine Summe und d2 ein Produkt ⫺ dar, so ist ihr Supremum (ihre Verbandssumme) der überbestimmte Ausdruck . ⫺ Eine ganz analoge Überlegung (technisch sagt man: eine duale) zeigt, daß auch die Infimumbildung anschaulich interpretierbar und stets definiert ist; ein konkretes Beispiel bietet hier die Abb. 3.15. Also ist D ein Verband mit der Annäherungsbeziehung als Verbandsordnung. Was für ein Verband D genau ist, soll im folgenden Unterabschnitt erklärt werden.
7.3.3. Die Konstruktion des syntaktischen Bereichs D Welche Elemente gehören nun genau zum Ausdrucksverband D? Wie bildet man Infima und Suprema von Ausdrücken, und wie ist
die Annäherungsbeziehung von D ganz allgemein (und nicht bloß für exemplarische Einzelfälle) bestimmt? Bislang ist lediglich gesagt worden, daß die Repräsentanten F der Operationskästchen völlig frei wählbar sind, solange sie nur mit dem unter- und dem überbestimmten Ausdruck einen flachen Verband der in Abb. 3.12 dargestellten Art bilden. Diese Forderung ist aber kaum eine echte Beschränkung: Man kann beliebige Objekte als abstrakte Modelle für die Operationskästchen wählen und bezüglich festlegen, daß kein Repräsentant mit einem anderen bezüglich vergleichbar sein soll, daß jeder von ⊥ angenähert wird und umgekehrt annähert. Ähnlich liberal soll auch für das noch weiter zur Modellierung der konkreten Diagramme benötigte Material verfahren werden: Auch die Repräsentanten B für die Alternativkästchen und die Darstellung I der Identität sind frei wählbar, solange auch sie mit ⊥ und flache Verbände bilden. Etwas genauer: Als Ausgangsmaterial zur Konstruktion des Ausdrucksverbandes D wählt man völlig frei drei flache Verbände F, B und I mit ihren jeweiligen trivialen Verbandsordnungen F, B und I und ihren eigenen Verbandseinsen F, B und I und Verbandsnullen ⊥ F, ⊥ B und ⊥ I. I besitzt dabei neben den beiden ausgezeichneten Elementen nur noch ein weiteres, das wie der Verband mit „I“ bezeichnet werden
191
3. Semantik
TF
TI
o
f1!
……
o
fm!
o
I +
f! =
o
o
o
F
T F
T
o
o
o
f0!
o
f1!
……
o
fm! o
I
o
o
T
f! o f0!
T(F+I)
o
I
+ I =
(F+I)
(F+I) = D0
Abb. 3.16: Summe D0 der beiden flachen Verbände F und I.
soll und verabredungsgemäß das identische Diagramm I repräsentiert. Aus diesen drei flachen Verbänden soll nun der Verband D mit seiner Ordnung und einheitlicher Verbandsnull ⊥ und Verbandseins konstruiert werden. Bei dieser Konstruktion werden immer wieder zwei Operationen angewendet, um aus Verbänden V1 und V2 erneut einen Verband V3 zu bilden: die disjunkte Summe (V1 ⫹ V2 ) und das Produkt (V1 ⫻ V2 ). Zunächst zur disjunkten Summe! Ein konkretes, syntaktisch einfaches Diagramm ist entweder ein Operationskästchen oder die Identität. Sein abstraktes Modell gehört daher zum flachen Verband F oder zum flachen Verband I: Es entstammt dem Summenverband D0 ⫽ F ⴙ I. Den Summenverband V1 ⫹ V2 zweier Verbände bildet man, indem man (i) zunächst an den Verbandselementen die Zugehörigkeit zu V1 oder V2 erkennbar macht, so daß für jedes Element aus der Summe kenntlich ist, aus welchem der beiden Summanden es kommt. D. h., daß gegebenenfalls gemeinsame Elemente irgendwie differenziert werden müssen; wie dies geschieht, ist gleichgültig. (ii) Nur sollen von dieser Differenzierung gerade die beiden Verbandseinsen und die beiden Verbandsnullen ⫺ also 1 und ⊥1 von V1 und 2 und ⊥2 von V2 ⫺ ausgenommen sein: Sie sollen im Gegenteil gerade miteinander identifiziert werden ⫺ also 1 ⫽ 2 und ⊥1 ⫽ ⊥2 ⫺, so daß V1 ⫹ V2 genau eine Eins und eine Null hat. Für den Summenverband faßt man dann (iii) die beiden Verbandsordnungen 1 und 2 von V1 und V2 einfach zusammen, wobei alte -Beziehungen erhalten bleiben und Elemente der Verbandssumme, die aus unterschiedlichen Summanden stammen (und von ⊥ und verschieden sind) als im Sinne der Summenverbandsordnung miteinander unvergleichbar gelten. Den Effekt der Summenbildung zeigt das Diagramm der Abb. 3.16. Der Produktverband V1 ⫻ V2 der Verbände V1 und V2 umfaßt genau die Paare *v1, v2+, bei denen
v1 Verbandselement von V1 und v2 ein solches von V2 ist. Die Produktordnung x für V1 ⫻ V2 bestimmt man gliedweise: *v1, v2+ x *w1, w2+ gilt genau dann, wenn v1 1 w1 und v2 2 w2. Die Eins ⫻ von V1 ⫻ V2 ist natürlich das Einsenpaar *1, 2+ und entsprechend die Null ⊥⫻ das Nullenpaar *⊥1, ⊥2+. Zweifaktorige Diagrammprodukte, wie sie Abb. 3.9(a) zeigt, können nun durch die Elemente des Verbandsprodukts D0 ⴛ D0 modelliert werden. So stellt in der abstrakten Syntaktik *Q!, ⴙ2!+ des konkrete Diagramm von Abb. 3.9(a) dar. Ganz entsprechend lassen sich konkrete Summen durch die Verbandselemente des Produktverbandes (B ⴛ D0 ⴛ D0) darstellen, wenn sie so einfach wie die in Abb. 3.9(b)⫺(d) gezeigten Summen sind. So wird das Diagramm von Abb. 3.9(d) vom Ausdruck * prim?, Q!, I++ modelliert. Insgesamt werden somit syntaktisch einfache Diagramme und Diagramme, die aus solchen durch einmalige Anwendung von F; oder F⇒ gebildet werden, von den Elementen des Summenverbandes D1 ⴝ D0 ⴙ (D0 ⴛ D0) ⴙ (B ⴛ D0 ⴛ D0) repräsentiert. Aufgrund der Definition der disjunkten Summe ist jedes Verbandselement von D0 auch eines von D1 (wobei gegebenenfalls an der D1-Variante des D0-Elements seine Zugehörigkeit zu D0 gekennzeichnet ist), und die Verbandselemente von D0 sind in dem Verband D1 gerade so angeordnet wie in D0 selbst: D0 ist Teilverband von D1. ⫺ In derselben Weise, wie man von D0 zu D1 gelangt, kann man nun für jeden syntaktischen Komplexitätsgrad einen entsprechenden Verband Dn modellierender Ausdrücke bestimmen, wobei diese Ausdrucksverbände immer umfassender werden: Dm ist Teilverband von Dn, wenn m ⱕ n (s. Scott 1971: 327). Das Bildungsgesetz dieser Verbandsfolge wird in (125) wiedergegeben. (125) D0 ⴝ F ⴙ I Dn ⴙ 1 ⴝ D0 ⴙ (Dn ⴛ Dn) ⴙ (B ⴛ Dn ⴛ Dn) Die Ausdrücke, die in endlich vielen Schritten mit F; und F⇒ bildbare Diagramme modellieren, liegen dann in der Vereinigung aller (Trägermengen) die-
192
I. Systematik
ser Verbände, s. (126): Man faßt alle Verbände der Folge zu Dⴥ zusammen. (126) Dⴥ ⴝ
ⴥ
Dn
nⴝ0
Daß Dm (für m ⱕ n) Teilverband von Dn ist, hat für Dⴥ die erwünschte Folge, daß sich die Ausdrücke von Dⴥ verbandsordnen lassen, so daß auch Dⴥ ein Verband ist. Gehören nämlich d1 und d2 zu Dⴥ, so muß es ja ein Folgeglied Dr geben, zu dem sowohl d1 als auch d2 gehört. Bezogen auf Dⴥ soll dann d1 ⴥ d2 genau dann gelten, wenn d1 r d2 für das kleinstmögliche r gilt. Da Dr Teilverband aller auf Dr folgenden Ausdrucksverbände ist, wird diese Ordnungsbeziehung nicht mehr in umfassenderen Verbänden umgestoßen. Dⴥ ist aber noch nicht das gesuchte D! Dⴥ enthält ja nur Ausdrücke für endliche Diagramme und keine Modellierung für das unendliche d⬁ der Abb. 3.11. Dem Verband Dⴥ fehlt noch etwas! Nach der zweiten der zum Schluß von § 7.3.1. erläuterten beiden Ideen zur Analyse der Schleifen, sollte ein Ausdruck dⴥ für d⬁ Limes einer unendlichen Folge * dⴥn+ ⴥ n ⴝ 0 endlicher, immer besser werdender Annäherungen an dⴥ sein, wobei die syntaktische Komplexität von einem Folgeglied dⴥm zu dem nächsten dⴥm ⴙ 1 jeweils um einen Formationsschritt zunimmt. D. h.: Der Ausdruck dⴥ0 gehört zu D0, dⴥ1 zu D1 usw. Daß die endlichen Annäherungen an dⴥ immer besser werden, heißt nun: dⴥ0 ⴥ dⴥ1 ⴥ dⴥ2 ⴥ … Eine solche Folge immer größer werdender Verbandselemente ist eine Kette des betreffenden Verbandes. Die Glieder der Folge * dⴥn+ ⴥ n ⴝ 0 bilden eine Kette. Daß dⴥ Limes dieser Folge sein soll, wird man nun so interpretieren: dⴥ soll Supremum aller Folgeglieder sein, d. h. dⴥ ⴝ ⴥ
dⴥn (ⴝ {dn | n ⱖ 0}; zur großen Supremums-
nⴝ0
operation (s. o. § 4.4.1.). Solche Suprema unendlicher Folgen gibt es aber in Dⴥ nicht immer; Dⴥ ist nämlich kein vollständiger Verband. (Ein Verband V ist summen- bzw. produktvollständig, wenn es in ihm für beliebige Klassen W von Verbandselementen stets das zugehörige Supremum
W bzw. Infimum W existiert.) Ein letzter Konstruktionsschritt ist noch notwendig, um von Dⴥ zu D zu gelangen. Als Verbandselemente von D werden nämlich die Folgen d ⴝ * dn+ ⴥ n ⴝ 0 von Dⴥ-Elementen bestimmt, in denen jeweils dm aus Dm stammt und dm die beste Approximation ist, die es in Dm für dm ⴙ 1 gibt. Dabei ist für ein d1 aus D1 seine beste Annäherung c0(d1) im Teilverband D0 von Dⴥ leicht bestimmt: Gehört d bereits zu D0, so ist dieser Ausdruck seine eigene beste Annäherung, d. h. d ⴝ c0(d); andernfalls nähert sich nur ⊥ von D0 d an, d. h. ⊥ ⴝ c0(d). Es ist auch klar, wie cn ⴙ 1 auf der Grundlage von cn zu bestimmen ist: Die beste Annäherung an eine Produktrepräsentation ist das Paar der besten Annäherungen an die Faktoren; die beste Approximation an eine Summendarstellung ist das Tripel der besten Annäherungen an die Summanden. Beste Annäherungen an die D0-Elemente,
die ein Dn ⴙ 2 ja (s. o. (125)) stets enthält, sind diese Elemente selbst; sie gehören ja bereits auch zu Dn ⴙ 1. Die Bestimmungen über cn ⴙ 1 faßt (127) zusammen.
Ï Ô cnⴙ1 (d) ⴝ Ì Ô Ó
(127)
d für d aus D0; * cn (d1), cn (d2)++ für d ⴝ * d1, d2+ aus (Dnⴙ1 ⴛ dnⴙ1); * b, cn (d1), cn (d2)++ für d ⴝ * b, d1, d2+ aus (BⴛDn).
Die Relation der syntaktischen Annäherung ⫺ also die Verbandsordnung von D ⫺ läßt sich nun wie folgt definieren: Für die Elemente d1 ⴝ ⴥ * d1n+ ⴥ n ⴝ 0 und d2 ⴝ * d2n+ n ⴝ 0 von D soll genau dann d1 d2 gelten, wenn für jedes n im Verband Dn d1n n d2n gilt. Die schrittweise erstellten Verbände D0, D1, D2, … sind zwar keine Teilverbände von D, aber ein zu Dn und nicht schon zu Dn ⴚ 1 gehörendes d läßt sich stets durch eine ab dem n ⫹ 1-ten Glied konstant werdende Folge ⫺ d0 ⴥ d1 ⴥ d2 ⴥ … ⴥdn ⴚ 1 ⴥ d ⴥ d ⴥ d ⴥ … ⫺ repräsentieren, in der für 1 ⱕ m ⱕ n cm ⴚ 1(dm) ⴝ dm ⴚ 1 ist. Jeder der Verbände Dm (m ⱖ 0) soll nun (im Nachhinein) als aus solchen konstant werdenden Folgen bestehend aufgefaßt werden, so daß alle diese Verbände Teilverbände von D sind. Damit ist dann jedes Element von D Limes (⫽ Supremum) einer Kette von D-Elementen. Nun muß aber noch gesagt werden, wie F; und F⇒ in D modelliert werden sollen. Da Ausdrücke von D Folgen * d1n+ ⴥ ⴥ n ⴝ 0, * d2n+ n ⴝ 0 sind, kann man Produkt- und bSummenbildung (b aus B) gliedweise bestimmen: das m-te Glied (d1; d2)m des Produkts (d1; d2) ist die Annäherung cm(**d1m, d2m+ ) an das Produkt der beiden m-ten Folgeglieder (**d1m, d2m+ gehört selbst zu Dm ⴛ Dm, also zu Dm ⴙ 1; mit „Produkt“ ist das Diagramm-, nicht das Verbandsprodukt gemeint). Das m-te Glied (b ⇒ d1, d2)m der b-Summe (b ⇒ d1, d2) ist die Approximation cm(**b, d1m, d2m+ ) der Summe der m-ten Glieder der Summanden (diese gehört selbst zu B ⴛ Dm ⴛ Dm, also zu Dm ⴙ 1; mit „Summe“ ist wieder die Diagrammsumme, nicht die Verbandssumme gemeint). Mit D ist man nun aber auch am Ziel! In D gibt es tatsächlich eine adäquate Repräsentation dⴥ für das Diagramm d⬁ der Abb. 3.11. Schaut man sich nämlich diese Abbildung noch einmal an, so wird man erkennen, daß für das nach dieser Abbildung konstruierte dⴥ in D die Gleichung (128a) gilt. (128a) dⴥ ⴝ (perfekt? ⇒ I, (ⴙ2!; dⴥ)) (128b) d ⴝ (perfekt? ⇒ I, (ⴙ2!, d)) Der Gleichungsbestandteil „(perfekt? → I, (ⴙ2!;“ beschreibt die obere, mit 1 numerierte Diagrammschicht, und auf diese folgt ja nochmals dⴥ selbst, ebenso wie auf den angeführten Gleichungsteil nochmals „dⴥ)) folgt. Mit anderen Worten: dⴥ muß sich in D als Lösung der Gleichung (128b) erweisen! Nun hat aber nicht jede Gleichung eine Lösung ⫺ warum also sollte (128b) eine haben? Die rechte Seite von (128b) bestimmt eine Funktion F ⴝ (ld苸 苸D)[(perfekt? ⇒ I, (ⴙ2!; d))] von D in D selbst. Ist ein Ausdruck Lösung der Gleichung
193
3. Semantik (128b), so ordnet ihm F sich selbst als Wert zu: Er ist dann Fixpunkt der Funktion F. Nun ist F eine sehr spezielle Funktion und D ein sehr spezieller Verband: Per constructionem ist nämlich D vollständig, und F ist eine stetige Funktion. Mit Stetigkeit meint man dabei folgendes: Eine Teilklasse W von Verbandselementen eines Verbandes V ⫽ *V, · , · + ist gerichtet, wenn W zu jeder endlichen Teilklasse seiner selbst ein Element v enthält, das im Sinne der Verbandsordnung mindestens so groß wie jedes Element dieser Teilklasse ist. Ketten sind also zum Beispiel Spezialfälle gerichteter Klassen. Eine Funktion c, die Verbandselemente von V ⫽ *V, · , · + auf solche von V' ⫽ *V', · ', · '+ abbildet, ist stetig, wenn für gerichtete Teilmengen W von V gilt: c( W) ⫽ '{c(v) | v aus W}. Das Supremum der c-Werte einer gerichteten Menge W ist also gleich dem Supremum der c-Werte ihrer Elemente. In der Verbandstheorie gibt es nun ein Theorem (den Satz von Knaster und Tarski), nach dem eine stetige Funktion c, die die Verbandselemente eines vollständigen Verbands V wiederum auf solche abⴥ
bildet, stets einen Fixpunkt hat, wobei vf ⫽ n⫽0
cn(⊥ ⊥ ) der im Sinne der Verbandsordnung von V minimale Fixpunkt ist. (Dabei ist wieder c0(v) ⫽ v und cn ⫹ 1(v) ⫽ c(cn(v)).) Dieser Satz sichert, daß (128b) tatsächlich lösbar ist, und er gestattet es sogar, die Glieder der Folge zu berechnen, deren Limes (⫽ Supremum) die minimale Lösung dieser Gleichung ist! Damit wird auch die zweite Idee des Programms von § 7.3.1. realisiert: Wählt man naheliegenderweise den minimalen Fixpunkt zum Repräsentanten des unendlichen Diagramms von Abb. 3.11, so berechnet man die endlichen Annäherungen an dⴥ wie in (129). (129) F0(⊥ ⊥) ⴝ ⊥ F1(⊥ ⊥ ) ⴝ (perfekt? ⇒ I, (ⴙ2!; ⊥ )) F2(⊥ ⊥ ) ⴝ (perfekt? ⇒ I, (ⴙ2!; (perfekt? ⇒ I, (ⴙ2!;⊥ ⊥ )))) ⯗ ⴥ
dⴥ ⴝ Fn (⊥ ⊥) nⴝ0
Aus diesem Beispiel ist nun auch zu ersehen, wie ganz generell die problematische Schleifenbildung F* in D zu modellieren ist: Die Schleife, die das von b? modellierte b? mit dem von d repräsentierten d bildet, wird durch den minimalen Fixpunkt (b?*d) der Funktion (ld苸 苸 D)[(b? ⇒ I, d)] dargestellt.
7.3.4. Ketten, Partialität, Monotonie Die Annäherungen an dⴥ, die die Folge * Fn(⊥ ⊥ )++nⴥⴝ 0 mit ihren Gliedern liefert, stimmen vielleicht nicht ganz mit dem überein, was man aufgrund der Abb. 3.11 erwartet hätte. Als Approximation an dⴥ erhält man ja stets einen unterbestimmten Ausdruck, während man aufgrund von Abb. 3.11 möglicherweise eher den bestimmten Ausdruck (perfekt? ⇒ I, ⴙ2!) als erste, den bestimmten
Ausdruck (perfekt? ⇒ I, (ⴙ2!; (perfekt? ⇒ I, ⴙ2!))) als zweite usw. Annäherung an dⴥ erwartet hätte. Semantisch gesehen ist aber, wie nun erläutert werden soll, das erzielte Ergebnis viel besser als das vielleicht erwartete! ⫺ Die semantische Interpretation der FD-Ausdrücke erfolgt nun über ihre Modellierungen, d. h.: Das semantische System S9 legt eine Funktion B fest, die jedem d von D eine Funktion h als seine Bedeutung zuweist, wobei h ⫽ B (d) natürlich nur dann gelten soll, wenn das von d repräsentierte d die Funktion h gemäß der anschaulichen Erklärung der Flußdiagrammnotation festlegt. ⫺ Welche Funktion soll unter dieser Voraussetzung dann aber B (⊥ ⊥ ) sein? Erinnert man sich, daß hinter einer von einem Diagramm d festgelegten Funktion h auch operational eine Zuordnungsregel Z steht, so ist es plausibel, h als „für das Argument g von E unterbestimmt“ zu bezeichnen, wenn die von Z erteilten Instruktionen nicht hinreichen, g einen Wert zuzuordnen. Denotational also: h ist eine für g nicht definierte Funktion. Die unterbestimmte Funktion wäre dann die Funktion, die völlig undefiniert ist und keinem g aus E einen Wert zuordnet. Sicherlich ist sie die naheliegendste Bedeutung für ⊥ ; sie soll im folgenden mit „⊥“ bezeichnet werden, was in Übereinstimmung mit der Verabredung steht, konkrete Kästchen und ihre Bedeutung gleich zu benennen. Also: ⊥ ⫽ B (⊥ ⊥ ). Damit ist die Bedeutung B(dⴥ0) der nullten Annäherung an dⴥ die völlig unterbestimmte Funktion ⊥. Folgt man weiter der zu Beginn von § 7.3.1. skizzierten Interpretationsstrategie, so ist die Bedeutung B(dⴥ1) der ersten Annäherung an dⴥ die partielle Funktion h1, die perfekten Zahlen n als Argumenten jeweils n selbst als Wert zuweist und ansonsten undefiniert ist. Trivialerweise ist h1 für alle Argumente definiert, für die auch h0 ⫽ ⊥ definiert war (denn ⊥ ist nirgendwo definiert) und weist ihnen dieselben Werte (nämlich keine) wie ⊥ zu. Diese Beziehung zwischen den Bedeutungen aufeinanderfolgender Approximationen an dⴥ wiederholt sich in nicht-trivialer Weise beim Übergang von dⴥ1 zu dⴥ2. Die Bedeutung h2 ⫽ B(dⴥ2) der Annäherung dⴥ2 an dⴥ ist eine partielle Funktion, die bereits für alle perfekten Zahlen und für solche Zahlen definiert, deren Summe mit 2 perfekt ist, und die ansonsten undefiniert ist. Diese Funktion h2 weist allen perfekten Zahlen m jeweils m selbst als Wert zu und den anderen Argumenten, für die sie erklärt ist, ihre Summe mit Zwei. D. h.: h2
194 erweitert den Anwendungsbereich von h1, übernimmt aber alle Zuordnungen, die schon h1 vorgenommen hat, unverändert. Genau dies gilt für alle aufeinanderfolgenden Ausdrücke von * dⴥn+ nⴥⴝ 0! Die Bedeutung B(dⴥn ⴙ 1) übernimmt monoton die Zuordnungen von B(dⴥn) und trifft gegebenenfalls neue. (Sollte es nämlich doch eine größte perfekte Zahl geben, sind irgendwann keine neuen Zuordnungen mehr zu treffen.) Diese Art der Monotonie, daß nämlich einmal getroffene Zuordnungen unverändert beibehalten und höchstens durch neue ergänzt werden, ist das semantische Gegenstück zur syntaktischen Annäherungsbeziehung : So wie dⴥn syntaktisch dⴥnⴙ1 annähert so nähert B(dⴥn) die von B(dⴥnⴙ1) getroffenen Zuordnungen an. Dieser Parallelismus zwischen Syntaktik und Semantik würde nicht bestehen, wenn man dⴥ durch bestimmte Ausdrücke ⫺ z. B. d'ⴥ1 ⴝ (perfekt? ⇒ I, ⴙ2!), d'ⴥ2 ⴝ (perfekt? ⇒ I, (ⴙ2!; (perfekt? ⇒ I, ⴙ2!))) usw. ⫺ annähern wollte. Z. B. ordnet die Bedeutung h2' ⫽ B(dⴥ2') dem Argument 2 den Wert 6 zu, dem die Bedeutung h2' ⫽ B(dⴥ1') den Wert 4 zuweist: h2' korrigiert hier Zuordnungen von h1'. Die syntaktische Annäherungsbeziehung von D hätte also kein semantisches Gegenstück mehr (oder zumindest nicht mehr ein so einfaches). Ein Parallelismus zwischen Syntaktik und Semantik ist aber stets willkommen, da er das semantische Interpretationsgeschäft so erleichtert! Wenn die syntaktische Approximation ein semantisches Gegenstück hat, bilden dann vielleicht auch die Ausdrucksbedeutungen (⫽ Diagrammbedeutungen) wie die Ausdrücke selbst einen Verband? Ja! Diese Bedeutungen sind ja partielle Funktionen aus E債(E), und in § 5.3.1. ist darauf hingewiesen worden, daß man den Umgang mit solchen partiellen Funktionen technisch wesentlich vereinfachen kann, wenn man ihre Definitionslücken durch ein Ersatzobjekt füllt und sie zu totalen Funktionen vervollständigt. Statt eines Ersatzobjekts wählen wir für E nun deren zwei ⫺ E und ⊥E ⫺ und verlangen, daß E mit ihnen einen flachen Verband (s. o. § 7.3.2.) mit der Verbandseins E und der Verbandsnull ⊥E bilden soll. Wegen des trivialen Charakters flacher Verbände ist dies keine restriktive Anforderung an E; der Verband soll wie die Fließgrößengesamtheit mit „E“ bezeichnet werden. Statt der partiellen Funktionen aus E債(E) (unerweitertes E)
I. Systematik
dienen nun die totalen Funktionen aus EE (Verbandserweiterung) als Ausdrucksbedeutungen. Tatsächlich werden aber noch nicht einmal alle Funktionen aus EE benötigt, die stetigen genügen vollauf! Sie bilden den vollständigen Verband [E → E], dessen Verbandsordnung [E → E] wie folgt festgelegt ist: h1 [E → E] h2 gilt genau dann, wenn für jedes g aus E h1(g) E h2(g) gilt. Auf diesem Hintergrund erweist es sich, daß E und ⊥E alles andere als bloße ad-hoc-Objekte sind, die nur aus Gründen technischer Konvenienz den Fließgrößen hinzugefügt worden sind. Zunächst einmal läßt sich nun die unterbestimmte Funktion ⊥ ⫽ B(⊥ ⊥) als Nullelement des Funktionenverbandes [E → E] bestimmen; sie ist diejenige Funktion, die jedem Argument aus E den Wert ⊥E zuweist. Auch für den merkwürdigen überbestimmten Ausdruck gibt es nun mit der Verbandseins von [E → E] eine plausible Bedeutung: B( ) ordnet jedem Element von E die Verbandseins E zu. Schließlich ⫺ und das ist das Wichtigste ⫺ läßt sich nun erklären, worin das monotone Verhalten der Bedeutungen h0 ⫽ B(dⴥ0), h1 ⫽ B(dⴥ1), h2 ⫽ B(dⴥ2) usw. der Approximationen an dⴥ genau besteht. Die Verbandsnull ⊥E füllt Definitionslücken. Daß also eine Funktion h' aus [E → E] von der Funktion h aus [E → E] alle Zuordnungen übernimmt und ihnen höchstens noch weitere hinzufügt, heißt nun, daß für alle g aus E h(g) Eh'(g), also h [E → E]h' gilt, wobei h'(g) höchstens dann überbestimmt ist, wenn h(g) dies ebenfalls oder aber unterbestimmt ist. Wie also syntaktisch die Annäherungen dⴥ0, dⴥ1, dⴥ2, … an d eine Kette bilden, so reihen sich auch die Bedeutungen dieser Ausdrücke auf der semantischen Ebene [E → E] zu einer Kette h0 h1 h2 … aneinander. Die Interpretationsfunktion B von S9 bildet dabei diese beiden Ketten gliedweise aufeinander ab. Generell heißt eine Funktion c, die Elemente eines Verbandes V0 auf solche eines Verbandes V1 abbildet, „monoton“, wenn aus v0 1 v1 folgt, daß auch c(v0) 2c(v1 ). B muß also monoton sein. Darüber hinaus wird man von B aber auch Stetigkeit verlangen, denn die Bedeutung von dⴥ soll ja sicherlich der Limes der Bedeutungen der Annäherungen an dⴥ sein: B(dⴥ) ⫽ B( nⴝ0
dⴥn) ⫽ B(dⴥn) ⫽ hn. Wie dieses B zu nⴝ0
n⫽0
definieren ist, soll im nächsten Unterabschnitt erklärt werden. Vollständige Verbände, insbesondere vollständige Verbände stetiger Funktionen zwi-
195
3. Semantik
schen Verbänden, werden, wenn sie in der Semantik und Syntaktik benutzt werden, auch als „Scott-Bereiche“ (engl.: „Scott domains“) bezeichnet. (Vielfach begnügt man sich auch mit schwächeren Strukturen: partiellen Ordnungen, in der es ein minimales Element ⊥ und zu jeder Kette ein Supremum gibt.) In ihrer Funktion ähneln Scott-Bereiche den bisherigen, durch Kategorien- und Typenindizes festgelegten Denotationsbereichen (und zwar Funktionenverbände den Funktionentypen bzw. Funktorkategorien und die Produktverbände den Paartypen). Im Gegensatz zu den Typen sind aber Scott-Bereiche intern (verbandstheoretisch) strukturiert. Diese Struktur macht sie besonders geeignet zur semantischen Analyse von Zirkularitäten und Selbsteinbettungen verschiedenster Art. FD bietet mit seinen Schleifendiagrammen ein Beispiel hierfür. 7.3.5. Die Interpretationsfunktion als Fixpunkt Wegen der syntaktischen und semantischen Zirkularität von FD sichert das kompositionale Interpretationsverfahren in seiner üblichen, etwa an S4 veranschaulichten Form keineswegs die Existenz einer geeigneten Interpretationsfunktion B. Nun sollte B, s. o. § 7.3.4., stetige Funktion des Scott-Bereichs [D → [E → E]] sein, also Ausdrücken (D-Elementen) stetige Funktionen aus [E → E] zuordnen. Die zentrale Idee bei der Definition von B ist es, dasselbe Verfahren, das die Existenz des Ausdrucks dⴥ sicherte, auch zur Bestimmung von B zu benutzen. Der Ausdruck dⴥ ist als Fixpunkt einer stetigen Funktion von D nach D ermittelt worden; entsprechend müßte also B Fixpunkt eines Funktionals (s. o. § 6.3.2.) aus dem Scott-Bereich [[D → [E → E]] → [D → [E → E]]] sein. Der erste Schritt zur Angabe eines passenden Funktionals J dieser Art besteht darin, jeden Ausdruck d von D als Fixpunkt aus dem Bereich [D → D] zu bestimmen. Dazu benötigt man die folgenden stetigen syntaktischen Hilfsfunktionen: oper, iden, prod und summ aus [D → Wⴙ], erst, zwei, link, rech aus [D → D], test aus [D → B] und die Auswahlsubjunktion 傻 aus [Wⴙ ⴛ D ⴛ D → D]. (Zur Erinnerung: Wⴙ ist der in Abb. 3.13(b) dargestellte, erweiterte Wahrheitswertverband.) Diese Operationen werden in (130) definiert. (130)
Ï W für d aus F;
oper (d) ⫽ Ì
Ó F andernfalls.
Ï W, falls d I ist;
iden (d) ⫽ Ì
Ó F andernfalls.
Ï W, falls es d1 und d2 aus D prod (d) ⫽ Ì mit d ⴝ (d1; d2); Ó F andernfalls. Ï W, falls es b aus B, d1 und d2 summ (d) ⫽ Ì aus D mit d ⴝ (b ⇒ d1, d2) gibt; Ó F andernfalls. Ï d1, falls d ⴝ (d1; d2);
erst (d) ⫽ Ì
Ó ⊥ Wⴙ sonst. Ï d2, falls d ⴝ (d1; d2);
zweit (d) ⫽ Ì
Ó ⊥ Wⴙ andernfalls. Ï b, für d ⴝ (b ⇒ d1, d2);
test (d) ⫽ Ì
Ó ⊥ Wⴙ andernfalls. Ï d1, falls d ⴝ (b ⇒ d1, d2);
link (d) ⫽ Ì
Ó ⊥ Wⴙ sonst. Ï d2 für d ⴝ (b ⇒ d1, d2);
rech (d) ⫽ Ì
Ó ⊥ Wⴙ andernfalls.
Ï d1, falls t ⫽ W; 傻 (t,d1,d2)⫽ Ì d2, falls t ⫽ F; Ó d1 d2 sonst. Notation: statt „傻 傻 (t, d1, d2)“ wird im folgenden „(t 傻 d1, d2)“ geschrieben. Mit den in (130) definierten Funktionen kann man nun den folgenden syntaktischen Sachverhalt als Gleichung formulieren: Jeder Ausdruck aus D ist entweder ein atomarer Ausdruck aus F (Modellierung eines Operationskästchens), oder der identische Ausdruck I, oder ein Produkt, oder eine Summe. Die Gleichungsform dieser Generalisierung über D ist (131). (131) d ⴝ (oper(d) 傻 d, (iden(d) 傻 I, (prod(d) 傻 (erst(d); zwei(d)), (summ(d) 傻 (test(d) ⇒ link(d), rech(d)), ⊥ Wⴙ)))) Damit ergibt sich jeder Ausdruck d von D als minimaler Fixpunkt einer Funktion, die in (131) durch die rechte Gleichungsseite bestimmt ist. Die syntaktische Grundgleichung (131) leistet aber mehr als die bisherige Methode, Wohlgeformtheit aufgrund syntaktischer Operationen und eines Kategoriensy-
196 stems rekursiv zu definieren. Sie berücksichtigt nämlich die für FD typische syntaktische Zirkularität; (132) zeigt eine mit der Grundgleichung erstellte syntaktische Analyse von d ⴥ. (132) dⴥ ⫽ (test (dⴥ) ⇒ link (dⴥ), rech (dⴥ)) Mit test (dⴥ) ⫽ perfekt? ƒ link (dⴥ) ⫽ I √ rech (dⴥ) ⫽ (erst (recht (dⴥ)); √ zwei (rech (dⴥ))) √ Mit erst (rech (dⴥ)) ⫽ ⴙ2! √¿ zwei (rech (dⴥ)) ⫽ dⴥ Die Grundgleichung (131) ist syntaktischer Ansatzpunkt zur Bestimmung der semantischen Interpretationsfunktion B: Semantisches Ausgangsmaterial sind dabei die Ausgangsinterpretationen O und F für die Fund B-Ausdrücke. O ordnet jeder Operationskästchenmodellierung f! aus F eine Operation f! ⫽ O(f!) aus [E → E] zu, und F weist jeder Alternativkästchenmodellierung b? aus B ein Attribut b? ⫽ F(b?) aus [E → Wⴙ] (also über dem erweiterten Wahrheitswertverband) zu. Produkt- und Summenbildung werden (s. o. § 7.3.1.) durch die funktionale Komposition · und die semantische Auswahlsubjunktion gedeutet. Dabei wird nun für genau wie für sein syntaktisches Gegenstück im Falle, daß bei (t f0!, f1!) t weder W noch F ist, festgelegt, daß (t f1!, f2!) ⫽ f1! [E → E] f2! gelten soll. Die syntaktische Auswahloperation 傻 stammt aus dem Bereich [Wⴙ ⴛ D ⴛ D → D], die semantische aus [Wⴙ ⴛ [E → E] ⴛ [E → E] → [E → E]]. Neben wird noch eine zweite, einfachere semantische Auswahloperation · benötigt, die aus dem Bereich [Wⴙ ⴛ E ⴛ E → E] stammt und analog zu 傻 und definiert ist: (t · g1, g2 ) wählt g1 für t ⫽ W, g2 für t ⫽ F und g1 E g2 sonst aus. ⫺ Kombiniert man nun die syntaktische Grundgleichung (131) mit dem semantischen Ausgangsmaterial O und F und den Interpretationsvorschriften für die Bildung von Diagrammprodukten und Diagrammsummen, so erhält man für die zu definierende Interpretationsfunktion B die Gleichung (133a), die so zu lesen ist: Der Wert der von d bedeuteten Funktion h für die Eingabe g ist das Resultat der Anwendung von O(d) auf g, falls g ein Operationskästchen repräsentiert; er ist g selbst, wenn d der identische Ausdruck ist; ist d ein Produkt, so ist h(g) der Wert, den die funktionale Komposition der Bedeutungen der Faktoren von d für g annimmt; ist d eine Summe, deren Test für g positiv ausgeht, so ist h(g) der
I. Systematik
Funktionswert, den die Bedeutung des linken Summanden von d g zuordnet; falls dieser Test negativ ausgeht, ist h(g) der Funktionswert der Bedeutung des rechten Summanden von d für g; in verbleibenden Fällen ist h undefiniert. (133a) B (d) (g) ⫽ (oper (d) · O (d) (g), (iden (d) · g, (prod (d) · (B (erst (d)) · B (zwei (d))) (g), (summ (d) · (T (test (d)) (g) B (link (d)), B (recht (d))) (g), ⊥ E)))) (133b) J(X) ⫽ (ld 苸 D) [(lg 苸 E) [(oper (d) · O (d) (g), (iden (d) · g, (prod (d) · X (erst (d)) · X (zwei (d))) (g), (summ (d) · T (erst (d)) (g) X (link (d)), X (rech (d))) (g), ⊥ E))))]] Die rechte Seite von (133a) legt ein Funktional J' dreier Argumente J' (X, d, g) ⫽ (… X … d … g …) fest, wobei das erste Argument X aus dem Bereich [D → [E → E]] der Interpretationsfunktion B stammt. Dieses Funktional J' ist in allen drei Argumenten stetig, weshalb auch das einstellige Funktional J von (133b) aus [[D → [E → E]] → [D → [E → E]]] stetig ist. Die Fixpunkte dieses Funktionals sind selbst Funktionen, die die Gleichung (133a) (so wie B) erfüllen. Besser noch: Aufgrund des Fixpunktsatzes von Knaster und Tarski (s. o. § 7.3.3.) ist auch sichergestellt, daß es solche Fixpunkte überhaupt gibt! Da man nun an B keine weiteren Ansprüche hat als den, (133a) zu erfüllen, kann man B einfach als minimalen Fixpunkt des Funktionals J wählen, also: B ⫽ J(B). Das so gewonnene B bildet damit, da es ja (133a) per constructionem erfüllt, den syntaktischen Bereich D genau in der gewünschten Weise in den semantischen Bereich [E → E] ab, womit die denotationale Semantik S9 für FD ihr Ziel erreicht hätte. Obwohl also Flußdiagramme in gewissem Sinne zirkulär sind, läßt sich dennoch eine kompositionale Semantik für sie entwickeln. Nichtfundiertheit und Zirkularität sind auch Phänomene, die zu den Analysegegenständen der Situationssemantik zählen, der der folgende, letzte Abschnitt gewidmet ist.
197
3. Semantik
8.
Situationstheorien und Situationssemantik
Ein Großteil der semantischen Bemühungen dieses Jahrhunderts ist von Tarskis (1935c) Analyse des Wahrheitsbegriffs beeinflußt (vgl. oben etwa die Abschnitte 2⫺5). Nun sieht zwar Tarski (1935c: 5 und 8 sowie 1936a: 1) selbst sein Vorgehen als im Rahmen der von ihm als „klassisch“ bezeichneten Adäquationstheorie der Wahrheit stehend an, nach der die Wahrheit einer Aussage in ihrer Übereinstimmung mit der Wirklichkeit besteht. Aber t-Ausdrücke stellen in Tarskis Theorie keine Wirklichkeitsausschnitte dar, weshalb von einer Adäquation ⫺ einer Übereinstimmung ⫺ von Darstellung und Dargestelltem eigentlich keine Rede sein kann. Weder Tarski, noch Frege oder Carnap erkennen semantische Einheiten an, die von wahren tAusdrücken wirklichkeitsgemäß, von falschen aber unsachgemäß dargestellt werden: Es gibt bei ihnen keine semantischen Einheiten, die die Rolle dargestellter Sachverhalte spielen, und dementsprechend keine semantische Beziehung der Sachverhaltsdarstellung. Frege (1918/1919: 60) lehnt sogar die Adäquationstheorie der Wahrheit gänzlich ab: Tatsachen sind für ihn nicht von Sätzen beschriebene Realitätsausschnitte, sondern wahre Gedanken (ebenda 74). Auch Carnap (1947: 28) sieht in Sachverhalten lediglich spezielle Propositionen und keine eigenständigen semantischen Einheiten: Eine Tatsache sei lediglich eine wahre Proposition, deren Wahrheit empirisch (und nicht logisch oder mathematisch) bedingt und deren Inhalt besonders detailliert sei. ⫺ Demgegenüber spielen Sachverhalte und Tatsachen als semantische Einheiten eine hervorragende Rolle in den Bedeutungstheorien Wittgensteins (1921) und Russells (1918/1919); eine philosophiegeschichtlich umfassendere Darstellung der Tatsachenproblematik und ihrer Rolle in Semantik und Bedeutungstheorie findet man bei Olson (1987). Es hat auch nicht an mehr oder minder beachteten und beachtenswerten Versuchen gefehlt, Semantiken aufzubauen, die t-Ausdrücke durch Sachverhalte oder sachverhaltsartige Realitätsausschnitte (Ereignisse, Fakten, Tatsachen, Situationen) interpretieren. In diese Tradition der Sachverhaltssemantiken ist auch die von Barwise und Perry entwickelte Situationssemantik (Barwise und Perry 1983) einzuordnen, die in vielerlei Beziehung gegenüber der durch Frege, Tarski und Carnap repräsentierten Tradition
einen radikalen Neuansatz darstellt. Sie soll im folgenden ⫺ nach einem kurzen Überblick über andere Konzeptionen einer Sachverhaltssemantik ⫺ eingehender besprochen werden. 8.1.
Sachverhalte als semantische Einheiten
8.1.1. Wozu Sachverhalte? Daß sich ⫺ gewissermaßen im semantischen Untergrund ⫺ eine Tradition der Sachverhaltssemantik erhalten hat, dürfte sicherlich vor allem daran liegen, daß Sachverhalte (und damit sollen ganz neutral Einheiten der gerade aufgezählten Art ⫺ also Fakten, Ereignisse usw. ⫺ gemeint sein) wohl die naheliegendsten Einheiten zur semantischen Interpretation vieler Ausdrücke sind, für die konkurrierende Theorien wenig anzubieten haben. Ein bekanntes Beispiel sind die Nominalisierungen natürlicher Sprachen (vgl. etwa Martin 1975 und 1981): Bezieht sich nicht der deutsche Ausdruck „die Ermordung Cäsars“ auf ein bestimmtes Ereignis? Und wenn dem so ist, sollte man dann nicht auch den Satz „Cäsar ist ermordet worden“ durch dasselbe Ereignis semantisch interpretieren? Dieses Ereignis hat doch wohl mit dem Satz inhaltlich mehr zu tun als der Wahrheitswert W (entweder ein bloßes Kode-Objekt oder eine recht dubiose Entität); und das Ereignis ist doch als etwas, was sich in Raum und Zeit einmal abgespielt hat, bei aller Schwierigkeit seiner genauen Abgrenzung immer noch eine vertrautere, der Anschauung zugänglichere Einheit als eine Proposition oder ein Gedanke! Ferner macht es für viele Sprachen einen bis in Details der grammatischen Form hinein sich auswirkenden Unterschied, ob mit einem t-Ausdruck (i) ein Zustand (z. B. Schlaf), ein Vorgang oder Prozeß (z. B. Regenfall), ein Ereignis (z. B. Cäsars Ermordung), eine Tätigkeit (z. B. Laufen) oder eine Handlung (z. B.: einen Brief schreiben) dargestellt werden soll und (ii) ob es dabei genauer noch um den Beginn, das mittlere Verlaufsstadium (ggf. mit einem Kulminationspunkt), um die Schlußphase oder den bereits erfolgten Abschluß des Vorkommnisses geht. Ganz offensichtlich handelt es sich hier um verschiedene Typen von Sachverhalten mit unterschiedlicher interner Struktur, und eine entsprechende Typologie sollte Teil einer umfassenden Sachverhaltstheorie sein, die das Fundament für eine adäquate Sachverhaltssemantik zu legen hätte.
198 Unterschiede der Sachverhaltsart (z. B. Zustand gegenüber Vorgang) werden in der Linguistik als „aktionsartlich“, Unterschiede des Sachverhaltsstadiums (z. B. Anfang gegenüber Kulminationspunkt) als „aspektuell“ bezeichnet. Für eine ganze Reihe von Informationsmitteln (neben sprachlichen wären vor allem musikalische zu nennen; vgl. ˚ qvist und Guenthner 1978: 180) müßten in etwa A einer zugehörigen adäquaten Semantik aktionsartliche und aspektuelle Unterschiede behandelt werden (zum situationssemantischen Vorgehen hierbei vgl. Cooper 1985). Da diese Unterschiede Sachverhalte betreffen, sollte man als Folge ihrer Behandlung eben eine Sachverhaltssemantik erwarten. ⫺ Die am häufigsten benutzte Klassifikation der Sachverhaltstypen ist im übrigen die sogenannte „Aristoteles-Vendler-Kenny-Klassifikation“ (vgl. Vendler 1957, Kenny 1963: Kap. 8 und Mourelatos 1978): Auf sie bauen fast alle anderen Klassifikationsversuche kritisch oder explizierend auf. Daß eine Theorie der Sachverhalte, der aktionsartlichen und aspektuellen Unterschiede ein semantisches Desiderat darstellt, ist natürlich auch Vertretern anderer Bedeutungstheorien und Semantikauffassungen nicht verborgen geblieben: So entwickelt etwa Fine (1982) eine Faktentheorie im Rahmen der intensionalen Semantik, und Tichy´ (1980a) so˚ qvist und Guenthner (1978) liefern Analysen wie A aspektueller und aktionsartlicher Unterschiede. Eine eigenschaftstheoretische Situationstheorie findet man bei Zalta (1988: Kap. 4).
Die Überlebensfähigkeit der Sachverhaltssemantik beruht aber nicht allein auf ihrer Angemessenheit zur Behandlung spezifischer semantischer Beschreibungs- und Analyseprobleme, sondern auch darauf, daß die konkurrierenden, klassischen Ansätze ein theoretisches Bedürfnis nicht hinreichend befriedigen: Da Semantik nun einmal eine Theorie der Ausdrucksbedeutungen ist, sollte doch zumindest eine der mit einem Ausdruck verknüpften semantischen Einheiten auch mit dem zu tun haben, worüber oder wovon der Ausdruck handelt. Denn ein mögliches Verständnis von „Bedeutung“ oder „Inhalt“ ist sicherlich „Thema“, „dasjenige, wovon gehandelt/gesprochen wird“. Dieses Postulat der Themenrelevanz semantischer Einheiten gehört sogar zu den Grundprinzipien der Fregeschen Bedeutungstheorie (vgl. Dummett 1973: 196⫺203, Carnap 1947: 98, „Principle 24-2: The principle of subject matter“ sowie Tichy´ 1988: sec. 25 und sec. 43): „Wenn man in der gewöhnlichen Weise Worte gebraucht, so ist das, wovon man sprechen will, deren Bedeutung“ (Frege 1892: 28; Hervorhebung K. R.). Die Bedeutungen selbst sind für Frege also die Themen der zugehörigen Ausdrücke. Dies ist sehr plausibel für referierende Ausdrücke: Sie handeln von ihren
I. Systematik
Bezugsobjekten. Wovon, wenn nicht eben von der Stadt Berlin, will jemand reden, wenn er den Ausdruck „Berlin“ verwendet? Dies ist sicherlich genau die Intuition, die zu den Russellschen (aber eben nicht zu den Fregeschen, s. o. § 5.2.) Propositionen führt. Aber Sätze würden dann Wahrheitswerte thematisieren, was völlig unplausibel ist, hätten dann doch alle wahren Sätze dasselbe Thema und ebenso alle falschen! Da Bezugsobjekte und Wahrheitswerte aber aufgrund des Kompositionalitätsprinzips zusammenhängen, hat man anscheinend keine andere Wahl: Akzeptiert man die Bezugsobjekte als thematische Einheiten referierender Ausdrücke, so liefert das Kompositionalitätsprinzip die Wahrheitswerte als Themen der Sätze. Dieser Zusammenhang wird in der semantischen Literatur durch ein Substitutionsargument belegt, das seine situationssemantischen Gegner als das „Steinschleuderargument“ bezeichnen. (Verschiedene Versionen der Steinschleuder findet man etwa bei Church 1956: 24⫺25, Davidson 1967: 306 und Quine 1953: 69⫺70; zur Kritik vergleiche man Goodman 1981: 12 sowie Barwise und Perry 1983: sec. 1.2.3; weitere Versuche, die Ungültigkeit der Steinschleuder nachzuweisen, führt McGinn 1976: 422 auf, der auch eine verschärfte Version des Arguments angibt.) Es gibt verschiedene Möglichkeiten, auf die Steinschleuder zu reagieren, um von ihr nicht getroffen zu werden. Tichy´ (1975 und 1988: sec. 43) gibt zum Beispiel die prima facie plausible Annahme auf, daß die Bezugsobjekte die Themen referierender Ausdrücke sind. Für Sachverhaltssemantiken ist die thematische Beziehung der Sachverhaltsdarstellung gegenüber dem Wahrheitsbegriff vorrangig. Stellt zum Beispiel ein t-Ausdruck z eine Situation s dar, so handelt z auch von jeder Konstituente von s. Thematisiert etwa der Satz „Die Sonne geht auf“ einen bestimmten Sonnenaufgang, so handelt er auch von der Sonne als einer Konstituente von s. Im vorliegenden Fall ist das Teilthema (die Sonne) sogar semantisch als Bezugsobjekt mit einem Teilausdruck des Satzes verknüpft; in einem solchen Fall spricht die Situationssemantik von einem „artikulierten Teil“ der dargestellten Situation. Gibt man also die Wahrheit als semantischen Schlüsselbegriff auf, so kann man durchaus beides haben: Situationen (oder Sachverhalte) als Satzthemen und Bezugsobjekte von Teilausdrücken als artikulierte Teile dieser Situationen, also als Teilthemen der entsprechenden Sätze.
3. Semantik
8.1.2. Sachverhaltssemantiken Ein erster Schritt zur Bewältigung der technischen Probleme einer mit Sachverhalten arbeitenden Semantik ist von McKinsey (1948/ 49) unternommen worden, und die ein oder andere Idee der Vorgehensweise McKinseys findet man in fast jeder Sachverhaltssemantik, wenn dabei auch nicht immer explizit auf ihn Bezug genommen wird. (McKinsey selbst nennt seine semantischen Größen allerdings „Propositionen“; da sie aber eher dem ähneln, was verschiedene Ansätze als „Sachverhalt“ bezeichnen, als dem, was im 5. Abschnitt unter dem Rubrum „Proposition“ behandelt wurde, wird hier McKinseys eigene Terminologie ignoriert.) Seine erste Idee besteht darin, Sachverhalte der einfachsten Art mit Folgen zu identifizieren. Ist etwa im Rahmen von S4, s. o. § 4., a¥ das Attribut, weibliches Tier der Stichprobe zu sein, so ist *a7, a¥+ der vom t-Ausdruck „Wl(7)“ von L(G) dargestellte Sachverhalt, daß das Tier a7 weiblich ist. Ist ap das Elternattribut über der Stichprobe, so stellt z. B. „Elt(7,3)“ den Sachverhalt *a7, a3, ap+ dar, daß a7 Elternteil von a3 ist. ⫺ Eine der größten Schwierigkeiten für eine Sachverhaltssemantik stellt die Negation dar: Wie ist zum Beispiel „ÿWl(7)“ zu interpretieren? Gibt es den negativen Sachverhalt, daß a7 kein weibliches Individuum ist, und wie würde sich der etwa zu dem positiven Sachverhalt verhalten, daß a7 männlich ist (und was wäre bei Zwittrigkeit)? Die Debatte um negative Sachverhalte ist vermutlich so alt wie die Vorschläge zu einer Sachverhaltssemantik selbst (vgl. Russell 1918/1919); aber auch die moderne Situationstheorie stößt hier auf nicht unerhebliche Probleme (vgl. Barwise 1989: 271⫺273). McKinsey akzeptiert negative Sachverhalte: Ist s ein Sachverhalt, so ist *ÿ, s+ sein negatives Gegenstück: Der Junktor dient hier lediglich als Markierung der Sachverhaltspolarität und übt nicht seine ausdrucksbildende Funktion aus. Konjunktionen wie z. B. „[ÿWl(7) ∧ Elt(2,7)]“ beschreiben komplexe Sachverhalte, die formal mit Mengen identifiziert werden; hier z. B. {*ÿ, *a7, a¥++, *a2, a7, ap+}. Dieselbe Idee kann man zur Interpretation der Quantoren verwenden (vgl. McKinsey 1948/49: 431). Man muß aber, um Quantorenschachtelungen semantisch analysieren zu können, variablenhaltige, sachverhaltsartige Gebilde zulassen (in der Situationssemantik gibt es dazu vergleichbare parametrisierte Sachverhalte; vgl. unten § 8.2.4.).
199 Diese Hinweise werden genügen, um anzudeuten, wie eine Interpretationsfunktion zu definieren ist, die t-Ausdrücken als semantische Einheiten die von ihnen dargestellten Sachverhalte zuweist. Ausgehend von einfachen Sachverhalten kann man schrittweise erklären, was es heißt, daß ein Sachverhalt besteht. (Der Sachverhalt *a7, a¥+ zum Beispiel besteht dann, wenn a¥(a7 ) ⫽ W ist.) Ein t-Ausdruck ist genau dann wahr, wenn er einen bestehenden Sachverhalt beschreibt (für die technischen Details sei hier auf McKinsey 1948/49: 432 verwiesen). Beachtenswert ist, daß man bei McKinseys Vorgehen auf die Zuhilfenahme von Belegungen verzichten kann, die ja im 4. Abschnitt (auch hinsichtlich des strengen Kompositionalitätsprinzips, vgl. die Erläuterungen zu (40)) einiges semantisches Kopfzerbrechen verursacht haben. McKinseys Ansatz ist von van Fraassen (1969) aufgegriffen und weiter ausgebaut worden. In der von van Fraassen entwickelten Sachverhaltssemantik lassen sich auch einige Grundbegriffe ⫺ Extension, Intension, Komprehension ⫺ der traditionellen Semantik so explizieren, wie sie etwa in der Logik-Tradition von Port-Royal (s. Art. 64) verstanden werden (vgl. van Fraassen 1973; weitere Anwendungen und Ausbaumöglichkeiten findet man bei Martin 1975 und 1981). ⫺ Die von McKinsey und van Fraassen verwendeten Methoden benutzt auch R. Wo´ jcicki (1984) zur Analyse der nicht-Fregeschen Logiken, die Roman Suszko (1971; 1975) entwickelt hat. Daß es für t-Ausdrücke nur zwei mögliche Designate ⫺ das Wahre und das Falsche ⫺ gibt, nennt Suszko das „Frege-Axiom“. Dem Frege-Axiom stellt er die Auffassung Wittgensteins (1921) entgegen, nach der sich Sätze jeweils auf einen aus einer ganzen Vielzahl von Sachverhalten (Suszko verwendet den Terminus „Situation“) beziehen können. Bei Frege gäbe es gewissermaßen nur zwei Situationen: die allumfassende (das Wahre) und die nicht-bestehende (das Falsche). Tatsächlich bezeichnet Frege seine beiden Wahrheitswerte auch einmal als „Umstände“ (s. Frege 1892: 34). In Suszkos nicht-Fregescher Semantik gilt weder das Frege-Axiom noch seine Negation: Die Frage nach der Anzahl der Situationen wird offen gelassen. Es gelten aber die üblichen, bivalenten (s. o. § 6.2.3.) Wahrheitsbedingungen. Um ausdrücken zu können, daß Sätze z und j dieselbe Situation darstellen, führt Suszko den Funktor „⬅“ ein; z ⬅ j besagt: Daß z, ist dasselbe wie, daß j. Zu Ehren Wittgensteins nennt Suszko Sprachen, die „⬅“ oder einen entsprechenden Funktor enthalten, „W-Sprachen“. In seiner Wittgenstein-Interpretation greift Suszko auf die Arbeiten von B. Wolniewicz zurück, der seinerseits versucht hat, mit Hilfe der von Suszko entwickelten nicht-Fregeschen Logik eine Wittgensteinsche Sachverhaltssemantik aufzubauen (vgl. Wolniewicz 1978; 1979).
200 8.2. Die Situationssemantik und ihre Situationstheorie Sachverhalts- oder Situationssemantiken haben also durchaus eine reiche Tradition. Die zur Zeit bekannteste Version dieses Semantiktyps dürfte allerdings die von Jon Barwise und John Perry entwickelte Situationssemantik sein. Sie ist die semantische Anwendung der umfassenderen Situationstheorie, die eine allgemeine Theorie der Bedeutung und des Informationsgehalts (Barwise 1989: 177) sein soll. Die Situationstheorie ist also das bedeutungstheoretische (s. o. § 1.2.) Fundament der Situationssemantik. 8.2.1. Der ökologische Ansatz Die Situationstheorie ihrerseits ist ökologisch fundiert; sie untersucht die kognitiven Tätigkeiten (z. B. Perzeption, Informationsverarbeitung und -austausch) von Organismen in ihrer jeweiligen Umwelt. Um hervorzuheben, daß diese Tätigkeiten sich in einer für die Organismen spezifischen Umwelt („environment“, Barwise 1989: 223) abspielen, bezeichnet die Situationstheorie sie als (eben in der Umwelt) „situiert“ („situated“; z. B. Barwise 1989: 223). Für ihren Ansatz berufen sich Barwise und Perry auf die ökologische Psychologie Gibsons (vgl. dazu Turvey und Carello 1985). Es gibt aber auch offenkundige (wenn auch nicht erwähnte) Parallelen zur Umweltlehre von Uexkülls (s. Art. 110), die insbesondere in den neueren Arbeiten von Barwise (1989) stärker hervortreten, in denen der anfängliche Realismus des situationstheoretischen Vorgehens (vgl. oben § 6.1.) zu Gunsten einer stärkeren Hervorhebung der subjektiven Leistungen, die die Organismen bei der Strukturierung ihrer Umwelt erbringen, zurücktritt. Situierte Tätigkeiten verlaufen also in einer Umwelt, die ihrerseits Teil der wirklichen Welt R ist. Jeder kognitiv tätige Organismus hat einen bestimmten Zugang („access“; Barwise 1989: 233) zu seiner Umwelt, wobei der ihm zugängliche Teil dieser Umwelt durch die Reichweite („reach“; Barwise 1989: 233) seiner perzeptiven und kognitiven Fähigkeiten bestimmt ist. Nur ausnahmsweise betrifft eine kognitive Tätigkeit den gesamten zugänglichen Umweltausschnitt, vielmehr richtet ein Organismus, wenn er kognitiv tätig ist, seine Aufmerksamkeit jeweils auf einen engeren Fokus („focus“; Barwise 1989: 233). Bei geteilter Aufmerksamkeit (z. B.: Telefongespräch und gleichzeitige Beobachtung der
I. Systematik
Straße durch ein Fenster) kann sich ein Organismus aber auch gleichzeitig auf mehrere Foki konzentrieren. Situationen sind nun Teile, die kognitiv Tätige in situierten Tätigkeiten durch Ausübung ihrer perzeptiven und kognitiven Fähigkeiten aus der Welt ausgrenzen. Die Gesamtheit dieser Situationen soll mit „Sit“ bezeichnet werden. Semiosen gehören zum Beispiel zu Sit; sie sind im Rahmen semiotischer Forschungstätigkeit von Semiotikern hergestellte Weltausschnitte. Unter den Elementen von Sit haben allerdings Semiosen eine besondere Eigenschaft: Sie sind bedeutungsvolle Situationen, d. h., daß sie durch bedeutungsstiftende Beziehungen (s. u. § 8.2.4.) mit anderen Situationen verknüpft sind. Signifikanz (Bedeutungshaftigkeit) ist eine extrinsische Eigenschaft von Semiosen: Sie hängt mit deren Beziehungen zu anderen Weltausschnitten zusammen. Aber Situationen haben auch intrinsische Eigenschaften, die ihren inneren Bau betreffen und die mit den bedeutungsstiftenden Beziehungen interagieren. Zunächst sollen nun die situationstheoretischen Annahmen über diesen inneren Bau skizziert werden. 8.2.2. Situationen und Infons Situationen sind Teile der wirklichen Welt R, die Organismen in ihren kognitiven Tätigkeiten aus R ausgrenzen. Entsprechend ihrem Teilcharakter (vgl. in diesem Zusammenhang auch § 5.3.1.) wird in der Situationstheorie angenommen, daß es eine partielle Ordnung ⱕı gibt, die Teile mit den zugehörigen Ganzheiten verbindet und die auch die Elemente aus Sit partiell ordnet. R ist ein Maximum dieser partiellen Ordnung; d. h.: Falls R ⱕı w, so gilt auch w ⱕı R und somit wegen der Antisymmetrie von ⱕı auch w ⫽ R. Eine Situation ist aktual („wirklich“ wird für eine andere Verwendungsweise, s. u. § 8.2.3., aufgespart), wenn sie Teil der Realität R (s ⱕı R) ist. Ob es überhaupt nicht-aktuale Situationen gibt, ist ein Verzweigungspunkt („branch point“; Barwise 1989: 255⫺276) der Situationstheorie: Je nach Anwendung der Theorie ist hier (jedenfalls nach bisherigem Erkenntnisstand der Situationstheorie) unterschiedlich zu entscheiden. Für einige Anwendungen kann es sich als günstiger herausstellen, nicht-aktuale Situationen auszuschließen, während andere solche geradezu verlangen. Ob etwa R zu Sit gehört und somit eine maximale, allumfassende Situation ist, ob es neben R noch weitere R-Maxima, also neben der wirklichen Welt noch weitere, mögliche
3. Semantik
Welten gibt, ob jeder Teil s0 eines Elements s1 von Sit wiederum eine Situation ist (ob Sit also bezüglich ⱕı abgeschlossen ist), das sind weitere Beispiele für Verzweigungspunkte. Insbesondere wenn man das Mögliche-Welten-Konzept (s. o. § 5.) ablehnt, wird man dazu neigen, Situationen als Ausschnitte aus der wirklichen Welt per definitionem für aktual zu halten. Jedoch ist hier zu erinnern, daß es kognitiv tätige Organismen sind, die R in Situationen zerlegen. Dabei können ihnen Fehler aller Art (Sinnestäuschungen und Denkfehler) unterlaufen. Eine Version der Situationstheorie, die nicht-aktuale Situationen und/oder von R verschiedene ⱕı-Maxima zuläßt, läuft wohl im Endeffekt auf eine Mögliche-Welten-Semantik hinaus, wie sie etwa Stalnaker (1984; dazu auch Barwise 1989: 79⫺96 und 262⫺263) oder Hintikka (z. B. 1975: 195) vertreten. Stalnaker und Hintikka konzipieren ihre möglichen Welten nämlich nicht als allumfassende Universen, sondern als kleine Welten („small worlds“) oder Milieus und nähern sich so dem ökologischen Ansatz der Situationstheorie an. ⫺ Zwei aktuale Situationen sind stets in dem Sinne miteinander kompatibel, daß es eine dritte gibt, die beide als Teil enthält. R enthält also keine Situationen, die einander ausschließen. Die bisherigen Annahmen über ⱕı, R und Sit faßt (134) zusammen. (134a) Die Teil-Ganzes-Beziehung ⱕı ist eine partielle Ordnung. (134b) Die Situationsgesamtheit Sit gehört zum Feld von ⱕı; d. h.: Jede Situation enthält einen Teil oder ist Teil eines Ganzen. (134c) Falls R ⱕı w, so ist auch w ⱕı R (und wegen (134a) somit w ⫽ R). (134d) Wenn für s1 und s2 aus Sit sowohl s1 ⱕı R als auch s2 ⱕı R gilt, so gibt es ein s3 ⱕı R aus Sit, so daß s1 ⱕı s3 und s2 ⱕı s3. Situationen werden von den kognitiv tätigen Organismen danach unterschieden, welche Sachverhalte in ihnen gelten. Sachverhalte sind also nichts weiter als klassifikatorische Merkzeichen der Organismen, und als solche werden sie in der Situationstheorie als „Infons“ (vgl. Barwise 1989: 250 sowie 225, Fn. 11) bezeichnet. Infon soll die Gesamtheit aller Infons sein. Gilt in s aus Sit das Infon s, so wird dies durch „s s“ symbolisiert. Man sagt, s sei eine Tatsache in s, s gelte in s oder auch s begründe oder trage s. Gelten in Situationen s1 und s2 dieselben Infons, gilt
201 also für jedes s aus Infon genau dann s1 s, wenn auch s2 s, so sind s1 und s2 infonisch äquivalent; s1 ⬵ s2. Ob äquivalente Infons auch identisch sind, ist ein weiterer Verzweigungspunkt der Situationstheorie. Für Anwendungen, in denen das Verhalten von Organismen mit eingeschränkten perzeptiven und kognitiven Fähigkeiten untersucht werden soll, erscheint es generell günstiger, äquivalente Infons nicht zu identifizieren, denn die Fähigkeiten der zu untersuchenden Organismen werden in solchen Fällen nicht ausreichen, um Situationen stets durch die in ihnen geltenden Infons zu unterscheiden. In einer allgemein anwendbaren, ausgearbeiteten Fassung der Situationstheorie („some ultimate version of the theory“; Barwise 1989: 264) wird man jedoch annehmen wollen, daß Äquivalenz Identität impliziert. Die Situation s1 ist infonisch in der Situation s2 enthalten, s1 s2, wenn für jedes s aus Infon mit s1 s auch s2 s gilt: Es ist also s1 ⬵ s2 genau dann, wenn sowohl s1 s2 als auch umgekehrt s2 s1. Wegen (134a) ergibt sich die Annahme, daß s1 ⬵ s2 bereits s1 ⫽ s1 impliziert, schon daraus, daß aus s1 s2 s1 ⱕı s2 folgt. Ob man dies (daß nämlich aus infonischem Enthaltensein auch schon Teilsein folgt) akzeptiert, wird ⫺ wie bereits erklärt ⫺ vom jeweiligen Anwendungsfall abhängen. Wie steht es mit der Umkehrung dieser Annahme: Enthält eine Situation ihre Teilsituationen auch infonisch? Dies ist ein weiterer Verzweigungspunkt! Ein s aus Infon ist persistent, wenn für alle s1 und s2 aus Sit mit s1 ⱕı s2 und s1 s auch s2 s gilt. Die gerade aufgeworfene Frage läßt sich also auch so stellen: Ist jedes Infon persistent? Die ersten Arbeiten zur Situationstheorie und -semantik gehen von einer positiven Antwort, dem Persistenzprinzip, aus. Ob man das Persistenzprinzip akzeptiert, hängt aber sicherlich davon ab, wie umfassend man die Gesamtheit Infon ansetzt. Vergegenwärtigen wir uns in Hinblick auf U (s. o. § 5.2.) zwei Ablesesituationen (in denen Uhren abgelesen werden) s1u und s2u, die beide dasselbe physikalische Labor betreffen. In s1u werden sämtliche Uhren eines bestimmten Raumes im Labortrakt abgelesen, und es wird das Bestehen des Infons su, daß nämlich alle Uhren korrekt gehen, festgestellt, also s1u su. Die Ablesesituation s2u soll das gesamte Labor mit all seinen Räumen betreffen; es gilt also s1u ⱕı s2u: Der Observator hat seinen Fokus (s. o. § 8.2.1.) erweitert. Wenn es in einem Raum des Labors eine defekte Uhr gibt, dann gilt
202 nicht s2u su! Demgegenüber ist Monotonie, die im 7. Abschnitt (s. insbesondere § 7.3.4.) eine so überragende Rolle spielte, ein Paradebeispiel für Persistenz. Mathematische Gebilde, wie etwa Mengen geordneter Paare, lassen sich durchaus als Situationen besonderer Art auffassen; vgl. dazu Barwise (1989: 177⫺200 und 289⫺292). ⫺ Sicherlich gründet sich das Persistenzprinzip auf eine einleuchtende Anschauung, daß nämlich eine Frage, die die Wirklichkeit einmal in einem bestimmten Sinn entschieden hat, stets in diesem Sinne entschieden bleibt. Die Wirklichkeit kann keine falschen Antworten geben, andernfalls wäre sie ja nicht die Wirklichkeit. Wie man dies jedoch in die Theorie inkorporiert, wird wiederum vom jeweiligen Anwendungsfall abhängen. Im Beispiel könnte man etwa Infons wie su verbieten, oder man könnte in su die Abhängigkeit von der Fokussituation s1u einbauen. Wie von McKinsey (s. o. § 8.1.2.) so werden auch von der Situationstheorie negative Sachverhalte anerkannt. Entweder beinhaltet ein Infon, daß sich etwas in gewisser Weise verhält, oder es beinhaltet, daß sich etwas eben nicht in einer bestimmten Weise verhält. Im ersten Fall liegt ein positives, im zweiten ein negatives Infon vor. Ist s⫺ das negative Infon, wonach der vom positiven Infon s⫹ erfaßte Sachverhalt gerade nicht besteht, so ist s⫺ das Negat von s⫹. Ist zum Beispiel su das Infon, daß eine Uhr u ⱔ2;16 (s. o. § 5.2.) anzeigt, so ist su⫺ das Infon, daß diese Uhr u gerade nicht diese Zeigerkonstellation darbietet. Mit dem Negatbegriff läßt sich neben dem Kompatibilitätsprinzip (134d) das Kohärenzprinzip (135) als weiteres Konsistenzprinzip formulieren. (135) Kein aktuales s aus Sit begründet ein Infon s zusammen mit dessen Negat s¯ . Hat überhaupt jedes Infon ein Negat? Auch dies ist wieder ein Verzweigungspunkt, der auf eine Reihe weiterer, an seine Entscheidung anknüpfende Fragen verweist. Welche Operationen gibt es, um aus Infons wiederum solche zu bilden? McKinsey (s. o. § 8.1.2.) nimmt zum Beispiel eine Sachverhaltskonjunktion an, die formal durch die Paarmengenbildung repräsentiert wird und die den Konjunktor semantisch interpretiert. Auch Barwise (1989) erwägt eine Infonkonjunktion ∧ und daneben eine Infonadjunktion ∨, die wie in (136) bestimmt sind und bezüglich derer die Infons einen Verband bilden sollen.
I. Systematik
(136) Für s aus Sit und s, t aus Infon gilt: (136a) s [s ∧ t] genau dann, wenn s s und s t. (136b) s [s ∨ t] genau dann, wenn s s oder s t. Operationen, wie (136) sie vorsieht, sind denen des Wahrheitswertverbandes und den propositionalen Operationen des 5. Abschnitts, die mit Hilfe der Wahrheitswertoperationen definiert wurden, strukturell natürlich sehr ähnlich. In allen drei Fällen handelt es sich mathematisch um Verbandsoperationen, was (vgl. auch den 7. Abschnitt) auf die besondere semantische Wichtigkeit der Verbandsstrukturen hinweist. Inhaltlich gesehen sind die Infonoperationen aber weniger abstrakt (positiv: weltlicher) als die Wahrheitswertoperationen und haben einen lokaleren Charakter als die propositionalen Operationen, da sie ja keine unüberschaubare Gesamtheit möglicher Welten voraussetzen. 8.2.3. Relationentheorie Ein Sachverhalt ist eine Objektkonstellation; also müssen Infons Objekte als Konstituenten enthalten. In der Situationstheorie nimmt man an, daß es eine Funktion Constit gibt (s. Barwise 1989: 264), die jedem Infon s die Gesamtheit Constit(s) seiner Objektkonstituenten zuordnet. Objekte werden dabei als wiedererkennbare Invarianten unterschiedlicher Infons angesehen. Sie sind kein ontologisch irgendwie vorgegebenes Baumaterial für Infons. Wie die Infons klassifikatorische Merkzeichen der sie tragenden Situationen sind, so sind Objekte Klassifikationsmerkmale für Infons. Ein Objekt aus Constit(s) muß nicht unbedingt in s raum-zeitlich anwesend sein: Man stellte sich etwa Infons vor, in denen Personen an gerade Abwesende denken o. ä. Die Gesamtheit Obj(s) der von einer Situation s betroffenen Objekte läßt sich dann als Klasse aller Konstituenten aller von s getragenen Infons definieren, s. (137). (137) Obj(s) ⫽ {Constit(s)|s s} Gilt nun s1 ⱕı s2, so kann s2 zum Beispiel ein umfassenderes Raum-Zeitgebiet als s1 betreffen oder auch eine gründlichere perzeptuellkognitive Durchdringung derselben Geschehnisse sein, die auch in s1 eingehen. In beiden Fällen wird aber s2 mindestens so viele Gegenstände betreffen wie s1; s. (138). (138) Ist für s1 und s2 aus Sit s1 ⱕı s2, so gilt Obj(s1 ) 債 Obj(s2 ).
3. Semantik
Was aus den Objekten eines Infons eine Konstellation bildet, ist eine Relation. Auch Relationen gehören nicht zu einem ontologisch-semantischen Grundmobiliar der Welt, sondern sind von den perzeptiv-kognitiven Fähigkeiten der Organismen vorgegeben oder werden in Ausübung dieser Fähigkeiten von Infons abstrahiert. Sie sind dann Gleichförmigkeiten, die übrig bleiben, wenn man von den Unterschieden zwischen Infons absieht; genau das heißt ja auch „abstrahieren“. Die Gesamtheit der Relationen wird mit „Rel“ bezeichnet. Nun läßt sich auch die interne Struktur der einfachsten Infons ⫺ der Basisinfons ⫺ genau beschreiben: Zu einem Basisinfon s gehört (i) eine Polarität i, die angibt, ob s ein positiver (i ⫽ 1) oder negativer (i ⫽ 0) Sachverhalt ist, (ii) eine Relation Q aus Rel und (iii) eine Besetzung a (engl.: „assignment“; dies ist auch der Terminus, mit dem das deutsche „Belegung“, s. o. § 4.4.1., wiedergegeben wird). Diese Besetzung a gibt an, wie die Relation Q die Objekte aus Constit(s) aufeinander bezieht. Mit Hinsicht auf eine Situation s hat nämlich ein Q aus Rel jeweils eine bestimmte Arität. Die Arität einer situationstheoretischen Relation ist also mit der Stelligkeit eines Attributs (s. o. § 3.4.) oder einer Beziehung (vgl. insbesondere § 5.3.2.) vergleichbar; im Gegensatz zu Stelligkeiten sind aber Aritäten situationsabhängig. In Alltagssituationen ist etwa die Eigenschaft von Uhren, korrekt zu gehen, eine unäre Relation oder eine (situationstheoretische) Eigenschaft. In kontrollierten Ablesesituationen, wie sie für experimentelle Wissenschaften typisch sind, ist sie jedoch ternär: Eine Uhr u geht zu einem Zeitpunkt t relativ zu einem Standard e korrekt. Im Gegensatz zu den Argumentstellen von Attributen und Beziehungen sind die situationstheoretischen Relationen nicht linear geordnet. Statt dessen geht die Situationstheorie davon aus, daß mit jeder Relation bestimmte Rollen vorgegeben sind, die die Objekte eines Infons, zu der die Relation gehört, spielen. So hat die Ableserelation mindestens drei Rollen zu vergeben: die des Observators, des Meßinstruments und der Ablesezeit. Solche thematischen Rollen sind in verschiedenen semantischen Theorien von großer Wichtigkeit. Auf ihnen basiert zum Beispiel die Kasusgrammatik, die Ch. J. Fillmore (1968 und 1977) entwickelt hat, oder auch die semantische Aktantenanalyse (vgl. etwa Art. 119). Auch ereignistheoretische Semantiken, die auf den von Davidson (1967
203 und 1980: Kap. 6⫺10) erarbeiteten Theorien aufbauen, bedienen sich vielfach solcher Rollen (vgl. Parsons 1985; 1990). Eine eher skeptische Analyse thematischer Rollen und ihrer Brauchbarkeit in der Semantik liefert vom Standpunkt der Montague-Semantik Dowty (1989). ⫺ In der Situationstheorie behandelt man Rollen mit Hilfe einer Funktion Arg, die Elementen s von Sit und Q von Rel jeweils die Gesamtheit Args(Q) (⫽ Arg(s, Q)) der von Q in s zu vergebenden Rollen zuweist. Dabei gilt das Prinzip (139). (139) Ist für Situationen s1 und s2 s1 ⱕı s2, so gilt auch Args1(Q) 債 Args2(Q). Umfassendere Situationen können gegebenenfalls also zusätzliche Rollen vergeben. Eine Besetzung a ordnet nun den Argumentrollen einer Relation Gegenstände zu, die diese Rollen spielen sollen. Eine s-Besetzung für Q ist also eine Funktion a, die jeder Rolle aus Args(Q) ein Objekt aus Obj(s) zuweist; ein Infon mit einer solchen Besetzung ist ein s-Infon. Zu jedem Infon s gibt es eine Situation s, so daß s s-Infon ist. Die allgemeine Gestalt eines Basisinfons ist also: s ⫽ Q, a; i˛. Unter Absehung der jeweils von a vergebenen Rollen gibt man statt a selbst häufig auch einfach eine Auflistung a1, a2, … der Rollenbesetzer an; also: s ⫽ Q, a1, a2, …; i˛. Bislang war es in der Situationstheorie üblich, die folgende Annahme (140) als gültig zu akzeptieren. Barwise (1989: 270) weist allerdings darauf hin, daß hier vielleicht ein Verzweigungspunkt vorliegt oder daß (140) vielleicht sogar aufgrund inhaltlicher und technischer Probleme gänzlich zu verwerfen ist. (140) Sind s1 ⫽ P, a; i˛ und s2 ⫽ Q, b; j˛ Basisinfons, so folgt aus P ⫽ Q, a ⫽ b und i ⫽ j, daß s1 ⫽ s2. Einer üblichen Annahme der Situationstheorie (vgl. aber wiederum Barwise 1989: 270⫺ 271) nach müssen Rollenbesetzungen in dem Sinne passend sein, daß Rollen stets durch geeignete Objekte, die die jeweiligen Rollen auch spielen können, ausgefüllt werden. So muß der Besetzer der Observatorrolle der Ablesesituation ein Instrument auch ablesen können und darf nicht prinzipiell von dieser Fähigkeit ausgeschlossen sein. Artefakte (z. B. Tische, Möbel) dürfen also diese Rolle nicht besetzen. Unter dieser Voraussetzung, daß alle Besetzungen passend sind, kann man dann das schwache Bivalenzprinzip (141) an-
204 nehmen. (Das Negat eines Basisinfons bildet man natürlich, indem man seine Polarität ⫺ von 1 in 0 oder von 0 in 1 ⫺ umkehrt.) (141) Ist s ⫽ Q, a; i˛ Basisinfon und ist Constit(s) 債 Obj(R), so gibt es ein s ⱕı R mit s s oder s s¯ . Um genauer zu erläutern, warum die Arität einer Relation als situationsabhängig analysiert wird, soll wieder die Verwendung des Informationsmittels U der Uhr (s. o. § 5.2.) betrachtet werden. Die in § 5.2. entwickelte semantische Analyse für U, die von vornherein alle Parameter berücksichtigt, die die Uhrzeit beeinflussen, ist wohl eben darum auch übergenau: In normalen Ablesesituationen kommt es zum Beispiel auf den Ort der Ablesung gar nicht an. Es wird den Ablesenden häufig auch gar nicht bewußt sein, daß die Uhrzeit von ihrem Aufenthaltsort abhängig ist. Nur in außergewöhnlichen Fällen (Flug in eine andere Zeitzone, Telefonat über mehrere Zeitzonen hinweg) wird diese Ortsabhängigkeit auffällig. Auch die gleichberechtigte Behandlung der Zeitkoordinate als uhrzeitbestimmender Faktor neben dem Ort und den herrschenden Umständen ist wenig befriedigend: Zwar bezieht sich die von einer Uhr dargebotene Zeigerkonstellation deiktisch auf den Zeitpunkt der Darbietung, aber einerseits kann der Observator nicht sicher sein, daß der durch die Zeigerkonstellation angegebene Zeitpunkt auch der richtige ist, andererseits geht er gerade davon in den meisten Fällen aus. Eine Uhr, die sich ebenfalls deiktisch auf den jeweiligen Zeitpunkt bezieht, indem sie auf ihrem Zifferblatt stets die Aufschrift „Jetzt“ darbietet (vgl. Smith 1987: 2), geht zwar im Gegensatz zu den üblichen Uhren stets richtig, ist aber zur Zeitermittlung völlig ungeeignet. Eine Uhr gibt die Zeit jeweils aus ihrer Perspektive an: von ihrem Ort, ihrer Ganggenauigkeit und ihrer Situierung im Zeitfluß aus gesehen. Von diesen perspektivischen Dimensionen ignoriert normalerweise der Beobachter die ersten beiden und nimmt die letzte für bare Münze, d. h., er geht davon aus, daß es so spät ist, wie es die Uhr zeigt. (Der Begriff der Perspektive spielt auch in Kaplans Theorie der Zeigehandlungen, vgl. Kaplan 1989: 526, eine Rolle, worauf in § 5.2. nicht näher eingegangen wurde.) In Hinblick auf eine Situation s0 wird in der Situationstheorie eine Relation Q als „perspektivisch“ bezeichnet, wenn Q in einer umfassenderen Situation s1 (s0 ⱕı s1 ) eine Rolle vergibt, die es in s0 nicht verteilt. Die
I. Systematik
Relationen der Infons normaler Ablesesituationen, etwa Zifferblattz oder Befind (s. o. § 5.2.; diese Relationen sollen nun aber situationstheoretisch und nicht mehr so wie in § 5.2. aufgefaßt werden), sind perspektivisch. Daß sich die Uhr u bezogen auf die Ablesesituation sua „hier“ befindet und „hier und jetzt“ die Zeigerstellung z darbietet, kommt in folgenden Begründungsbeziehungen zum Ausdruck: sua Befind, u; 1˛ (⫽ s1us ) und ua sua Zifferblattz, u; 1˛ (⫽ sua 2 ). Die von s getragenen Infons enthalten weder eine Ortsnoch eine Zeitkonstituente. Dies heißt nun aber keinesfalls, daß in sua die Polaritäten ua von sua 1 und s2 nicht von der Ablesezeit t und dem Ort o abhingen. Aber die Zeitrolle temp und die Ortsrolle lok von Befind und Zifferblattz werden in sua nicht auffällig (vgl. Barwise 1989: 251). Die Ablesesituation sua ist Projektion einer auf t datierten und in o lokalisierten umfassenderen Situation sud. Zwischen sua und sud besteht dabei der Zusammenhang, daß für ein Basisinfon s ⫽ Q, a; i˛, dessen Relation Q in sua weder die Rolle temp noch die Rolle lok hat, genau dann sua s gilt, wenn sud s' für s' ⫽ Q, a ⫹ (temp t) ⫹ (lok o); i˛. (Dabei ist a ⫹ (r g) die Besetzung, die zusätzlich zu den von a vergebenen Rollen die Rolle r an g vergibt.) Ein wichtiger Unterschied zwischen dem Zeit- und dem Ortsparameter beim Uhrengebrauch, der in § 5.1. nicht deutlich wird, besteht gerade darin, daß eine Ablesesituation unter anderem auf ihre eigene Datierung, auf eine Ergänzung (lok t) abzielt, während auch nach erfolgter Ablesung der Ort zumeist nur perspektivisch bestimmt bleibt. Neben anwendungsspezifischen Relationen wie Befind, Zifferblattz und Ables zählen auch die spezifisch situationstheoretischen Relationen wie zum Beispiel ⱕı und zu Rel. Alles, was generell für Relationen gesagt wurde, trifft auch auf sie zu. Insbesondere können auch sie in Infons, die gegenüber den bisherigen höherstufig sind, vorkommen, zum Beispiel: su2 ⫽ , s1u, su; 1˛. Man beachte, daß hier die Situation s1u und das Infon su zu Constit(su2 ) und somit zur Objektgesamtheit gehören! Es ist ein Charakteristikum der Situationstheorie, daß alles als Objekt, als wiedererkennbare Sachverhaltsinvariante auftreten kann. ⫺ Viele interessante Anwendungen der Situationstheorie machen von höherstufigen Infons Gebrauch. Nehmen wir wieder eine U-Verwendung als Beispiel! In der Ablesesituation sum 3 soll es um die ganz
3. Semantik
zweifelsfreie, objektive Ermittlung der exakten Uhrzeit gehen. Daher werden in sum 3 zwei Beobachter b1 und b2 beschäftigt, die sich bei ihren Ablesungen wechselseitig kontrollieren. Die Situation sum verläuft in der Zeitspanne 3 Dt und betrifft die Uhr u. Also gilt in sum 3 zunächst sum ⫽ Ables, Dt, b , u; 1˛ und sum 0.1 0.2 1 um um ⫽ Ables, Dt, b2, u; 1˛, d. h.: s3 s0.1 und sum sum 3 0.2 . Da sich b1 und b2 aber auch bei ihren Ablesungen kontrollierend beobachten, trägt sum auch die Infons sum 3 1.1 ⫽ Beobacht, um b1, Dt, s0.2 ; 1˛ und sum 1.2 ⫽ Beobacht, b2, t, sum 0.1 ; 1˛. Die genaue Ablesung liegt im gegenseitigen Interesse von b1 und b2, weshalb jeder der beiden Beobachter dem jeweils anderen sein Ableseverhalten völlig offen legt. Dazu muß er aber die Beobachtungstätigkeit seines Partners im Auge behalten, um sich dieser zum Beispiel nicht unbeabsichtigt zu entziehen. Daher gilt sicherlich auch: sum s 3 um u um 2.1 (⫽ Beobacht, b1, Dt, s1.2; 1˛) und s3 u sum 2.2 (⫽ Beobacht, b2, Dt, s1.1; 1˛). Die Situation sum kann aber noch komplizierter 3 sein: Man wird sich selbst leicht Umstände ausdenken können, unter denen die wechselseitige Beobachtung noch um eine weitere oder um mehrere Iterationsstufen (zu sum n.1 und sum n.2 ) fortgeführt werden muß; und generell läßt sich für die Iterationsstufe n keine obere Grenze angeben. Dies ist typisch für Situationen, in denen gemeinsames Wissen oder geteilte Sinneserfahrungen (alle hören oder sehen dasselbe) eine wichtige Rolle spielen (vgl. Lewis 1969, Harman 1977, Meggle 1980, Barwise und Etchemendy 1987: 125⫺ 126 sowie Barwise 1989: 201⫺220). Müssen nun etwa b1 und b2 in Dt bei Berücksichtigung aller Eventualitäten eine unendliche Anzahl wechselseitiger Beobachtungen vollbringen? Vielleicht ist das, was sie gemeinsam beobachten, Fixpunkt der Operation, die von den Infons der Iterationsebene n zu denen der Ebene n ⫹ 1 führt, wobei die einzelnen Infons das gemeinsam Beobachtete immer besser approximieren? Dann wären hier Analyseverfahren wie im 7. Abschnitt angebracht (vgl. auch Barwise 1989: 206⫺212; mit Bezug auf den eben angeführten Ansatz Harmans)! Der ökologische Ansatz (s. o. § 8.2.1.) der Situationstheorie bietet hier jedoch eine andere Lösung an: Die Beobachter teilen sich eine um gemeinsame Fokussituation sum be3 , und s3 gründet die Infons, daß b1 und b2 beide sum 3 wahrnehmen. Es gilt also (142). (142a) sum Wahrnehm, b1, Dt, sum 3 3 ; 1˛ (⫽ sum 1 )
205 (142b) sum Wahrnehm, b2, Dt, sum 3 3 ; 1˛ (⫽ sum 2 ) Nach (142) begründet jedoch die Situation sum Infons, zu deren Konstituenten sie selbst 3 zählt; und das führt zu schwierigen Grundlagenproblemen (vgl. oben S. 5.3.3. für vergleichbare Schwierigkeiten der Sinnsemantik). McKinseys einfachste Sachverhalte (vgl. oben § 8.1.2.) waren einfache mengentheoretisch aufgefaßte Folgen *g1, g2, …, gn, a+, und dasselbe traf auf ihre Negate *ÿ, *g1, g2, …, gn, a++ zu. Auch noch kompliziertere Sachverhalte waren mengentheoretische Konstrukte. Nun ist ja die Ähnlichkeit mit Basisinfons Q, a1, a2, …, an; i˛ und ihren Negaten auffallend. Lassen sich nicht auch die Infons und Situationen der Situationstheorie mengentheoretisch modellieren? Eine positive Antwort wäre angesichts des Erfolgs mengentheoretischer Modellierungen in der Semantik überaus wünschenswert. Die Situationstheorie nennt die Weltausschnitte, von denen sie handelt in diesem Zusammenhang „wirkliche Situationen“ und bezeichnet deren mengentheoretische Repräsentanten als „abstrakte Situationen“ (vgl. Barwise und Perry 1983: 43⫺50). (Dies ist der Unterscheidung im 7. Abschnitt zwischen konkreten und abstrakten Diagrammen völlig analog.) Die naheliegendste und auch von Barwise und Perry (1983: Part B) verfolgte Strategie zur mengentheoretischen Darstellung wirklicher Situationen besteht nun sicherlich darin, die zu einer wirklichen Situation s gehörige abstrakte Situation M(s) aus den Gegenständen von Obj(s) (s. o. (137)) aufzubauen. Ein Gegenstand aus Obj(s) soll selbst Element von M(s) sein (g 苸 M(s)) oder Element eines solchen Elements (g 苸2 M(s)) oder Element eines Elementenelements (g 苸3 M(s)) usw. (generell: g 苸n M(s)). Nun gilt jedoch, daß nach um (142) sum 3 selbst zu s3 gehört und daher M(s um um ) 苸 M(s ) sein müßte! Für die üblichen 3 3 (und auch für die von Barwise und Perry (1983) benutzte) Mengentheorien wird aber ein Grundsatz (das Fundierungsaxiom) angenommen, der gerade solche Klassen, die sich selbst als Element enthalten, verbietet, weil von ihnen die Gefahr von Widersprüchen ausgeht. Mengentheorien mit einem Fundierungsaxiom sind also zur Modellierung solcher Situationen wie sum ungeeignet. Will 3 man weder auf diese Situationen noch auf die mengentheoretische Modellierung verzichten, so bleibt die Frage nach Theorien, die nichtfundierte, sich selbst enthaltende Mengen zu-
206 lassen. Eine solche Theorie ist von P. Aczel (1988) zwar nicht entdeckt, wohl aber systematisch entwickelt worden (zur Wissenschaftsgeschichte s. Aczel 1988: Anhang A). Aczels Mengentheorie ist dann auch im Rahmen der Situationstheorie zur Erfassung solcher Situationen wie sum herangezogen wor3 den. Eine weitere Anwendung ist die Analyse der semantischen Antinomien (s. o. § 5.3.1.; vgl. Barwise und Etchemendy 1987). ⫺ Da die Situationstheorie aber auch mathematische Information als zu ihren Gegenständen gehörig reklamiert, ergibt sich die zur Anwendung der Mengentheorie komplementäre Frage, ob eine solche Theorie auch umgekehrt im Rahmen einer mengenfreien (bzw. Mengen erst erklärenden) Situationstheorie analysierbar ist. Barwise (1989: sec. 8 und 14) beantwortet diese Frage positiv: Man kann nicht nur Situationen und Infons als Mengen modellieren, sondern auch umgekehrt Mengen als Vergiß-Situationen auffassen. Das sind Situationen, die die strukturellen Konfigurationen zwischen ihren Konstituenten einfach vergessen („forgetful situations“; dieser Ausdruck ist in Anlehnung an die VergißFunktoren, engl.: „forgetful functors“, der Kategorientheorie geprägt, vgl. Mac Lane 1970: 14). 8.2.4. Bedeutungsstiftende Beziehungen Semiosen sind spezielle Situationen: Sie sind bedeutungstragend, signifikant. Die situationstheoretische Analyse signifikanter Situationen geschieht in der Situationssemantik. Anders als bisher besprochene Semantiken konzentriert sich die Situationssemantik nicht so sehr auf systematische, syntaxgeleitete Zusammenhänge zwischen Ausdrücken (wie z. B. deren kompositionales Verhalten), sondern setzt mit ihren Analysen beim konkreten Ausdrucksgebrauch in Semiosen an. Die semantische Schlüsselfrage der Situationssemantik lautet: Was leistet in einer Semiose die Verwendung eines speziellen Ausdrucks? Diese Leistung kann jeweils sehr unterschiedlich aussehen und braucht nicht fest mit einer semantischen Einheit korreliert zu sein. So kann (s. o. § 5.2.7.) die Zeigerstellung einer stehengebliebenen Uhr noch eine semantische Leistung erbringen, obwohl der systemkonforme Gebrauch dieses U-Ausdrucks nicht möglich ist: Er zeigt nicht die richtige Zeit an, aber kennt man die Zeit, so weist er auf den Zustand der Uhr hin. Die Frage nach semantischen Einheiten, die Ausdrücken durch Interpretationsfunktionen zu-
I. Systematik
gewiesen werden, ist für den Situationssemantiker eine fehlerhafte Fixierung auf einen vermeintlichen Normalfall. Nach der leistungsbezogenen Betrachtung der Situationssemantik ist die Bedeutung eines Ausdrucks z besser durch eine Relation 冀z冁 wiederzugeben, die Semiosen s, in denen z verwendet wird, jeweils mit den Leistungen l, die z in s erbringt, in Beziehung setzt: s冀z冁 l. Von dieser relationalen Bedeutung 冀z冁 von z ist der Inhalt l in s zu unterscheiden („content“; in Barwise und Perry 1983: 36⫺37 wird noch „interpretation“ verwendet, welchen Terminus Barwise 1989: 62 zu Gunsten von „content“ aufgibt). Gibt es mehrere l mit s冀z冁 l, so läßt sich deren Gesamtheit als Inhalt von z in s auffassen. Da ihre Bedeutungen Relationen sind, sprechen die Situationssemantiker von einer „relationalen“ oder von der „Relationentheorie der Bedeutung“ (s. Barwise und Perry 1983: 9⫺13 und Barwise 1989: 87⫺90; vgl. übrigens das situationssemantische „s冀z冁 l “ mit dem „{z}c“ von § 5.2.!). Wie Semiosen als erste Relata von Bedeutungsbeziehungen, so werden auch die Inhalte l als Situationen aufgefaßt. Daß nun für einen in s verwendeten Ausdruck z s冀z冁 l gilt, beruht auf Regelmäßigkeiten, die s mit l verknüpfen. Solche Regelmäßigkeiten zwischen Situationen werden als „Beschränkungen“ („constraints“, vgl. Barwise und Perry 1983: Kap. 5; die dort entwickelte Theorie der Beschränkungen umfaßt noch eine komplizierte Teiltheorie der Situationstypen, vgl. auch Gawron 1986, die nun aber aufgrund der reicheren Infon-Algebra, s. o. § 8.2.2., entfallen kann) bezeichnet, da sie die Art und Weise einschränken, wie die Wirklichkeit aus Situationen aufgebaut ist. Insofern Beschränkungen Semiosen mit Inhaltssituationen verbinden, sind sie also bedeutungsstiftende Beziehungen. Solche bedeutungsstiftenden Beziehungen können recht unterschiedlicher Art sein: Es kann sich etwa um notwendige, logisch-begriffliche Relationen handeln, um nomische Zusammenhänge oder um konventionell geregelte Beziehungen zwischen Situationen (vgl. Barwise und Perry 1983: 96⫺ 100). Für den Uhrengebrauch spielen Beschränkungen aller drei Typen eine wichtige Rolle. Verschiedene Zeigerstellungen schließen einander aus (logisch-begriffliche Beschränkung); Zeigerkonstellationen sind kausal von den Uhrwerken der sie darbietenden Uhren abhängig (nomische Beschränkung); Zeit- und Datumszonen sind durch internationale Vereinbarungen geregelt (konventio-
3. Semantik
nelle Beschränkung). Die Regelhaftigkeiten eines semantischen Systems S für ein Informationsmittel I sind lediglich Spezialfälle meist konventioneller Beschränkungen. Im konkreten Gebrauch eines I-Ausdrucks z in einer Semiose s werden von den Semiosebeteiligten normalerweise keinesfalls nur die aus S stammenden Beschränkungen für z benutzt, um den Inhalt von z in s aufzufinden. Die Organismen, die I verwenden, ziehen alle ihnen verfügbaren Beschränkungen heran, um aus z ein l zu extrahieren, das so informativ wie nur irgend möglich ist. Ist eine Beschränkung einem Organismus verfügbar, so sagt man in der Situationssemantik, dieser Organismus sei an die Beschränkung angepaßt („attuned“; Barwise und Perry 1983: 94, 268⫺269). In zweierlei Weise legen Beschränkungen dem Zusammenauftreten von Situationen in der Wirklichkeit Restriktionen auf: Wenn es eine Situation s0 mit dem (Infon ⫽) Merkmal s0 gibt, so kann gegebenenfalls eine Beschränkung verlangen, daß es auch ein s1 aus Sit mit dem Merkmal s1 gibt. Dies wäre ein Fall, daß eine Situation s0 eine andere s1 nach sich zieht. Gegebenenfalls kann eine Beschränkung aber auch bei Vorliegen eines s0 mit s0 verlangen, daß dann kein s3 mit dem Merkmal s3 auftritt. Hier blockiert s0 die Situation s3. Für jeden dieser beiden Beschränkungstypen gibt es in Rel eine dreistellige Relation ⇒ bzw. ⊥. Beschränkungen sind spezielle Infons der Gestalt C⫹ ⫽ ⇒, v, s, t; 1˛ (positive Beschränkung: Nachsichziehen) oder C⫺ ⫽ ⊥, v, s, t; 1˛ (negative Beschränkung: Blockieren). Die s- und t-Konstituenten solcher Beschränkungen sind parametrisierte Infons, d. h., daß ihre Besetzungen einige Rollen von Unbestimmten der Gesamtheit Par der Parameter spielen lassen (vgl. oben § 8.1.2. das über McKinseys Sachverhaltssemantik Gesagte). In Hinblick auf folgende Beispiele, die das Informationsmittel U betreffen, sollen hier x, x1, x2, … Uhren-, y, y1, y2, … Zeit- und z, z1, z2, … Ortsparameter sein. (Die Parameter können, müssen aber nicht Ausdrücke sein; wichtig ist hier lediglich, daß die Parameter in ihrer Funktion stets erkennbar und mit normalen Objekten nicht verwechselbar sind. Was die Parametergesamtheit Par genau enthält, ist ansonsten völlig gleichgültig. Ein Anker ist eine Funktion, die Parametern Objekte zuweist. Ersetzt man in einem parametrisierten Infon s ⫽ Q, a1, …, v1, …, v2, …, vm, …, an; i˛ die Parameter v1, v2, …, vm durch die
207 ihnen vom Anker f zugewiesenen Objekte, so erhält man s(f) ⫽ Q, a1, …, f(v1 ), …, f(v2 ), …, f(vm ), …, an; i˛. Dabei ist s(f) ein parameterfreies Infon, wenn f für jeden Parameter von s definiert ist. Die in einer Beschränkung C unmittelbar auf die Relationsangabe folgende Konstituente v ist jeweils eine Teilgesamtheit von Par, die sämtliche Parameter der s- und t-Konstituenten enthält. Sie dient der Buchführung (s. o. § 4.1.) über die anaphorischen Querbezüge zwischen den Merkmalsbestimmungen s und t. Wie Beschränkungen funktionieren, erklärt (143). (143a) Eine Beschränkung C⫹ ⫽ ⇒, v, s, t; 1˛ ist genau dann in R gültig, wenn für jede Situation s0 ⱕı R und jeden Anker f, der den Parametern aus v Objekte aus Obj(s0 ) zuweist, gilt, daß aus s0 s(f) folgt, daß es auch ein s1 ⱕı R mit s1 t(f) gibt. (143b) Eine Beschränkung C⫺ ⫽ ⊥, v, s, t; 1˛ ist genau dann in R gültig, wenn aus der Existenz einer Situation s0 ⱕı R und eines Ankers f, der den Parametern aus v Objekte aus Obj(s0 ) so zuweist, daß s0 s(f) gilt, folgt, daß es kein s1 ⱕı R mit s1 t(f) gibt. Ist ein s aus Sit in der von (143) beschriebenen Weise mit dem s einer positiven oder negativen Beschränkung C durch einen Anker verbunden, so macht s in bezug auf C Sinn. Ein s1, welches ein s0, das in bezug auf eine positive Beschränkung Sinn macht, so nach sich zieht, wie es (143a) beschreibt, ist eine sinnvolle Option von s0 bezüglich dieser Beschränkung. Ein s1, so wie es (143b) beschreibt, wird von dem dort beschriebenen s0 bezüglich der betreffenden Beschränkung blockiert (vgl. Barwise und Perry 1983: Kap. 5; Barwise 1989: 274⫺276). Abschließend soll zur Veranschaulichung des situationssemantischen Vorgehens skizziert werden, wie ein situationssemantisches System S10 für U auszusehen hätte (vgl. hierzu auch Smith 1987). ⫺ Für U zentral ist die semantische Beschränkung Cu, daß es z oder z ⫹ ⫹ 12 (s. o. § 5.2.) Uhr ist, wenn eine abgelesene Uhr ⱔz darbietet: Cu ⫽ ⇒, xy , su, tu; 1˛ mit su ⫽ Zifferblattⱔz, x; 1˛ und tu ⫽ Zeitz, y; 1˛ ∨ Zeitz ⫹ ⫹ 12, y; 1˛ (vgl. oben (136b) zur Infonadjunktion). Das parametrisierte Infon su enthält keinen Zeitparameter, womit der Perspektivität (s. o. § 8.2.3.) des Zeitbezugs in Ablesesituationen Rechnung getragen wird. Ebenso enthält tu keinen Ortsparameter, da bei gewöhnlichem Uhren-
208 gebrauch der Ortsbezug perspektivisch bleibt. Zu beachten ist auch, daß su und tu keinen gemeinsamen Parameter haben! Macht also s Sinn bezüglich Cu, so erhält man als sinnvolle Optionen von s bezüglich Cu irgendwelche Situationen, in denen die angezeigte Uhrzeit gilt. Mit (143a) ist keineswegs sichergestellt, daß diese Uhrzeit auch für s selbst richtig ist, was aber auch genau den tatsächlichen Gegebenheiten beim Uhrenablesen entspricht. Daß es zur Ablesezeit t gerade z oder z ⫹ ⫹ 12 Uhr ist, wird noch nicht durch ⱔz selbst mitgeteilt. Um zu dieser Information zu gelangen, muß man (vgl. A-Postulat (94o) in § 5.2.6.) wissen, daß die abgelesene Uhr korrekt geht. Bezogen auf Cu ist dann die Bedeutung von ⱔz die Relation 冀ⱔz冁, die zwischen den bezüglich Cu Sinn machenden Situationen und ihren Optionen besteht. Der Inhalt von ⱔz in der Ablesesituation sa ist die Gesamtheit der durch 冀ⱔz冁 mit sa verbundenen Situationen s (d. h. sa冀ⱔz冁s). Etwas anschaulicher gesagt: Der Inhalt einer Zeigerkonstellation ⱔz ist eigentlich nichts weiter als die Situationseigenschaft, die auf ein s genau dann zutrifft, wenn es in s z oder z ⫹ ⫹ 12 Uhr ist (vgl. auch Smith 1987: 18). Eine weitere Beschränkung Ck ist somit notwendig, um den Uhrengebrauch erklären zu können: Ck muß festhalten, daß eine Ablesesituation sa dazu verwendet wird, die datierte Situation sad aufzufinden, deren Projektion (s. o. § 8.2.3.) sie ist. Dies leistet Ck durch die Forderung, daß eine korrekte Uhr zur Ablesezeit t die für t richtige Zeitangabe darbieten muß (vgl. Smith 1987: 21), d. h., daß sa sinnvolle Option ihrer selbst bezüglich Cu ist. Ck läßt sich also so beschreiben: Wenn s eine Situation ist, die bezüglich Cu Sinn macht, und falls s Korrekt, x; 1˛ gilt, dann gehört s zu seinen eigenen sinnvollen Cu-Optionen. Offensichtlich ist Ck eine gegenüber Cu weitaus kompliziertere Beschränkung, da sie auch spezifisch situationstheoretische Relationen wie und die Beziehung zwischen einer Sinn machenden Situation und ihren Optionen betrifft! Auf ihre genaue Formulierung im situationstheoretischen Rahmen sei daher verzichtet. Sei nun aber C die Cu und Ck umfassende Gesamtheit der für U einschlägigen Beschränkungen. Übervereinfachend sei angenommen, daß C nur positive Beschränkungen enthalte und man auf den Gebrauch blockierender Beschränkungen verzichten kann. Durch diese Annahme wird das Persistenzproblem (s. o. § 8.2.2.) umgangen. Ein s
I. Systematik
aus Sit macht Sinn bezüglich C, wenn es bezüglich eines C aus C Sinn macht. Die auf C bezogene Bedeutung 冀ⱔz冁 von ⱔz ist dann die Relation, die zwischen s0 und s1 genau dann besteht (s0冀ⱔz冁s1 genau dann), wenn s0 hinsichtlich C Sinn macht und s1 bezüglich eines C aus C sinnvolle Option von s0 ist. Der Inhalt 冀ⱔz冁(s0 ) von z (bzgl. C) in s0 ist dann die Gesamtheit der s1 mit s0冀ⱔz冁s1. ⫺ Neben diesen ziemlich umfassenden Inhalten ist auch wohl noch ein stärker eingeschränkter Inhaltsbegriff denkbar. Bezogen auf eine Ablesesituation sa, die Projektion des auf t datierten sad ist, könnte etwa ein solcher weniger umfassender Inhalt von z darin bestehen, daß es, den korrekten Gang der abgelesenen Uhr einmal vorausgesetzt, in sa z oder z ⫹ ⫹ 12 Uhr ist; also: sa [Zeitz, t; 1˛ ∨ Zeitz ⫹ ⫹ 12, t; 1˛]. Die Verwendung eines „daß“-Satzes weist darauf hin, daß dieser minimale Inhalt der Zeigerkonstellation propositionalen Charakter trägt, und eine (Zeit- oder Datums-) Proposition ist es ja üblichem Verständnis nach auch, was ein Observator durch das Ablesen erfährt. Situationssemantisch gewendet erfährt er einen Begründungszusammenhang zwischen einer Situation und einem von ihr getragenen Infon. Daher wird in der Situationssemantik eine Instanz s s (s aus Sit und s aus Infon) der Begründungsbeziehung auch als „Austinsche Proposition“ (s. Barwise und Etchemendy 1987: 29, 121⫺126 sowie Barwise 1989: 229⫺230 und 273) bezeichnet: s ist die von der Proposition betroffene („concerned“ oder „situation about“; s. Barwise und Etchemendy 1987: 29) Situation und das Infon s ist Thema („subject matter“ oder „type“; s. Barwise und Etchemendy 1987: 29) der Proposition. Eine U-Proposition betrifft also eine Ablesesituation und hat ein kalendarisches Infon oder eine adjunktive Verbindung solcher Infons zum Thema. Im Unterschied zu den Propositionen der Mögliche-Welten-Semantik, die maximalen Situationen (Welten) Wahrheitswerte zuweisen, betreffen die situationstheoretischen Propositionen nur Weltausschnitte. Ein weiterer Unterschied liegt in der Auffassung der Indexikalität (vgl. oben § 5.2.). Der situationssemantische Ansatz ist in dieser Hinsicht von Austin (1950) inspiriert: Kontextabhängigkeit ist nicht etwas, was einige Ausdrücke berührt, für andere hingegen keine Rolle spielt. Nach Austin gibt es in einem Informationsmittel Zeigekonventionen, nach denen bei Verwendung eines Ausdrucks j zu bestimmen ist, um welchen Bereich der Realität es
3. Semantik
geht, was also j thematisiert. Nach situationssemantischer Interpretation legen die Zeigekonventionen in einer Austinschen Proposition s s gerade die betroffene Situation s fest. Neben den Zeigekonventionen gibt es aber noch die Beschreibungskonventionen, nach denen zu ermitteln ist, was über den betroffenen Realitätsausschnitt mitgeteilt wird. Sie bestimmen in der situationssemantischen Austin-Interpretation das Thema der Proposition. Insofern eine Proposition ein Thema auf eine betroffene Situation bezieht, ist jeder Ausdruck mit propositionalem Gehalt kontextabhängig: Die betroffene Situation ist sein Kontext. (Für eine Kritik des Austinschen Ansatzes vom Tarskischen Standpunkt vgl. Mates 1974; die situationssemantische Replik findet man bei Barwise und Perry 1983: 287⫺290.) Die Darstellung von Situationstheorie und Situationssemantik und zugleich dieser Artikel sei mit einer kurzen Bemerkung über Konkurrenzsituationen zwischen miteinander wetteifernden Theorien beschlossen. Sicherlich ist die Frage, welche Bedeutungstheorie oder Semantik nun die richtige sei, legitim und auch fruchtbar. Eine Möglichkeit, die Überlegenheit eines Ansatzes zu beweisen, besteht darin, eine semantische Analyse solchen Materials vorzulegen, das andere Ansätze nicht behandeln können. Der Wettbewerb führt also zu einer Verbreiterung der Materialbasis für die Semantik überhaupt. Demgegenüber ist jedoch ein anderer, häufig vernachlässigter Zugang zur Theorienvielfalt in der Semantik die Untersuchung intertheoretischer Beziehungen. Ist eine Theorie vielleicht Spezialfall einer anderen? Sind sie gänzlich miteinander unverträglich? Oder gibt es Anwendungsgebiete, auf denen sie sich als äquivalent erweisen? Die vielleicht zunächst verwirrend erscheinende Vielfalt verschiedener semantischer Ansätze erweist sich so als Ansatzpunkt metasemantischer Untersuchungen, und gewöhnlich zahlen sich metatheoretische Untersuchungen auch für die eigentlichen, objektbezogenen Fragestellungen einer Disziplin aus.
9.
Literatur (in Auswahl)
Aczel, Peter (1988), Non-Well-Founded Sets. Stanford. Aczel, Peter (1989), „Algebraic Semantics for Intensional Logics. Part I“. In: Gennaro Chierchia, Barbara Partee und Raymond Turner (eds.): Pro-
209 perties, Types and Meanings. Dordrecht, Boston und London: 17⫺45. Ajdukiewicz, Kasimierz (1935), „Die syntaktische Konnexität“. Studia Philosophica 1: 1⫺27. Alston, William P. (1964), Philosophy of Language. Englewood Cliffs NJ. Alston, William P. (1967), „Emotive Meaning“. In: Paul Edwards (ed.): The Encyclopedia of Philosophy. New York und London. Vol. 2: 486⫺493. Anderson, C. Anthony (1984): „General Intensional Logic“. In: Dov Gabbay und Franz Guenthner (eds.): Handbook of Philosophical Logic. Dordrecht. Vol. 2: 355⫺385. Anderson, C. Anthony (1987a), „Bealer’s Quality and Concept“. Journal of Philosophical Logic 16: 115⫺164. Anderson, C. Anthony (1987b), „Semantical Antinomies in the Logic of Sense and Denotation“. Notre Dame Journal of Formal Logic 28: 99⫺114. ˚ qvist, Lennart und Franz Guenthner (1978), A „Fundamentals of a Theory of Verb Aspect and Events within the Setting of an Improved Tense Logic“. In: Franz Guenthner und Christian Rohrer (eds.): Studies in Formal Semantics. Amsterdam: 167⫺199. Asher, Nicholas (1986), „Belief in Discourse Representation Theory“. Journal of Philosophical Logic 15: 137⫺189. Asser, Günter (1972), Einführung in die mathematische Logik. Teil II. Prädikatenkalkül der ersten Stufe. Leipzig. Asser, Günter (1981), Einführung in die mathematische Logik. Teil III. Prädikatenlogik höherer Stufen. Leipzig. Austin, John Langshaw (1950), „Truth“. ⫺ In: Proceedings of the Aristotelian Society. Supplementary Volume 24: 111⫺128. Deutsch von Joachim Schulte: „Wahrheit“. In: John Langshaw Austin: Gesammelte philosophische Aufsätze. Stuttgart 1986: 153⫺174. Austin, John Langshaw (1962), How to Do Things with Words. Oxford. ⫺ Deutsch von Eike von Savigny: Zur Theorie der Sprechakte. Stuttgart 1972. Bacon, John (1978), „The Logical Form of Perception Sentences“. Synthese 41: 271⫺308. Baldwin, Thomas (1979), „Interpretation of Quantifiers“. Mind 88: 215⫺240. Ballmer, Thomas T. (1979), „Probleme der Klassifikation von Sprechakten“. In: Günther Grewendorf (ed.): Sprechakttheorie und Semantik. Frankfurt a. M. 1979: 247⫺274. Bar-Hillel, Yehoshua (1967), „Review of The Structure of Language, ed. by Jerry A. Fodor and Jerrold J. Katz“. Language 43: 526⫺550. Barwise, Jon (1989), The Situation in Logic. Stanford.
210
I. Systematik
Barwise, Jon und John Etchemendy (1987), The Liar. Oxford.
Carnap, Rudolf (1934), Logische Syntax der Sprache. Wien. 21968.
Barwise, Jon und John Perry (1983), Situations and Attitudes. Cambridge MA. Deutsch von Claudia Gerstner: Situationen und Einstellungen. Grundlagen der Situationssemantik. Berlin und New York 1987.
Carnap, Rudolf (1942), Introduction to Semantics. Cambridge MA. Reprint zusammen mit „Formalization of Logic“. Two volumes in one. Cambridge MA und London 1958.
Bealer, George (1982), Quality and Concept. Oxford 1982. Bealer, George und Uwe Mönnich (1989), „Property Theories“. In: Dov Gabbay und Franz Guenthner (eds.): Handbook of Philosophical Logic. Dordrecht. Vol. 4: 133⫺251. Becker, Oskar (1952), Untersuchungen über den Modalkalkül. Meisenheim am Glan. Belnap, Nuel D. Jr. (1982), „Approaches to the Semantics of Questions in Natural Language. II“. In: Tom Pauli (ed.): Philosophical Essays Dedicated to ˚ qvist on his Fiftieth Birthday Uppsala: Lennart A 16⫺33. Belnap, Nuel D. Jr. (1990), „Declaratives Are not Enough“. Philosophical Studies 59: 1⫺30. Benthem, Johan van (1986), „The Relational Theory of Meaning“. Logique et analyse 29: 251⫺ 273. Benthem, Johan van und Jan van Eijck (1982), „The Dynamics of Interpretation“. Journal of Semantics 1: 3⫺20. Beth, Evert Willem (1955), „Semantic Entailment and Formal Derivability“. ⫺ In: Mededelingen van de Koninklijke Nederlandse Akademie van Wetenschapen, Efdeling Letterkunde, Nr. 18, no. 13: 309⫺342. Birren, Faber (1969), A Basic Treatise on the Color System of Wilhelm Ostwald. The Color Primer. New York. Blamey, Stephen (1986), „Partial Logic“. ⫺ In: Dov Gabbay und Franz Guenthner (eds.). Handbook of Philosophical Logic. Dordrecht. Vol. 3: 1⫺70. Boe¨ r, Steven E. und William G. Lycan (1980), „A Performadox in Truth-Conditional Semantics“. ⫺ In: Linguistics and Philosophy 4: 71⫺100. Bonotto, Cinzia und Alberto Zanardo (1989), „A Non-Compactness Phenomenon in Logics with Hyperintensional Predication“. Journal of Philosophical Logic 18: 383⫺398. Börger, Egon (1985), Berechenbarkeit, Komplexität, Logik. Braunschweig. Bressan, Aldo (1972), A General Interpreted Modal Calculus. New Haven und London. Bressan, Aldo (1985), „On the Interpreted Sense Calculus MCna“. ⫺ In: Paul Weingartner und George I. Dorn (eds.): Foundations of Logic and Linguistics. International Congress of Logic, Methodology, and Philosophy of Science 7. New York: 427⫺482.
Carnap, Rudolf (1947), Meaning and Necessity. Chicago. 2., erweiterte Auflage 1956. Deutsch von Wilhelm Bader: Bedeutung und Notwendigkeit. Wien und New York 1972. Carnap, Rudolf (1952), „Meaning Postulates“. Philosophical Studies 3: 65⫺73. Wieder als „Supplement B“ in der 2. Auflage von Carnap 1947: 222⫺229. Carnap, Rudolf (1954), Einführung in die symbolische Logik. Wien und New York 1954. 31973. Carnap, Rudolf (1972), „Notes on Semantics“. Philosophia 2: 1⫺54. Carnap, Rudolf (1980), „A Basic System of Inductive Logic. Part 2.“ In: Richard C. Jeffrey (ed.): Studies in Inductive Logic and Probability. Vol. 2. Berkeley: 7⫺155. Carnap, Rudolf und Yehoshua Bar-Hillel (1952), „An Outline of a Theory of Semantic Information“. Technical Report No. 247. Research Laboratory of Electronics. Massachusetts Institute of Technology. Wieder in: Yehoshua Bar-Hillel, Language and Information. London 1964: 221⫺274. Castan˜ eda, Hector-Neri (1967), „Indicators and Quasi-Indicators“. American Philosophical Quarterly 4: 85⫺100. Deutsch von Helmut Pape: „Indikatoren und Quasi-Indikatoren“. In: Hector-Neri Castan˜ eda, Sprache und Erfahrung. Frankfurt a. M. 1982: 160⫺201. Chang, Chen Chung (1974), „Model Theory 1945⫺1971“. In: Leon Henkin, John Addison, Chen Chung Chang, William Craig, Dana Scott und Robert Vaught (eds.): Proceedings of the Tarski Symposium. Providence RI: 173⫺186. Church, Alonzo (1951), „A Formulation of the Logic of Sense and Denotation“. ⫺ In: Paul Henle, Horace M. Kalen und Susanne K. Langer (eds.): Structure, Method, and Meaning. New York: 3⫺24. Church, Alonzo (1954), „Intensional Isomorphism and Identity of Belief“. Philosophical Studies 5: 65⫺73. Church, Alonzo (1955), „The Need for Abstract Entities in Semantic Analysis“. Proceedings of the American Academy of Arts and Sciences 80: 100⫺ 108. Deutsch von Walter Hoering: „Intensionale Semantik“. In: Wolfgang Stegmüller: Das Universalienproblem. Darmstadt 1978: 209⫺225. Church, Alonzo (1956), Introduction to Mathematical Logic. Princeton NJ. Church, Alonzo (1973), „Outline of a Revised Formulation of the Logic of Sense and Denotation. Part I“. Nouˆs 7: 24⫺33.
3. Semantik Church, Alonzo (1974), „Outline of a Revised Formulation of the Logic of Sense and Denotation. Part II“. Nouˆ s 8: 135⫺157. Church, Alonzo (1976), „Comparison of Russell’s Resolution of the Semantical Antinomies with that of Tarski“. The Journal of Symbolic Logic 41: 747⫺760.
211 Dummett, Michael (1975), „What Is a Theory of Meaning?“ In: Samuel Guttenplan (ed.): Mind and Language. Wolfson Lectures 1974. Oxford: 97⫺138. Deutsch von Joachim Schulte: „Was ist eine Theorie der Bedeutung?“ In: Michael Dummett, Wahrheit. Stuttgart 1982: 133⫺155.
Cocchiarella, Nino B. (1986), Logical Investigations of Predication Theory and the Problem of Universals. Neapel.
Dummett, Michael (1976), „What is a Theory of Meaning (II)?“ In: Gareth Evans und John McDowell (eds.): Truth and Meaning. Essays in Semantics. Oxford: 67⫺137.
Cocchiarella, Nino B. (1987), Logical Studies in Early Analytic Philosophy. Columbus OH.
Dummett, Michael (with the assistance of Roberto Minio) (1977), Elements of Intuitionism. Oxford.
Cooper, Robin (1983), Quantification and Syntactic Theory. Dordrecht.
Dummett, Michael (1979), „What Does the Appeal to Use Do for the Theory of Meaning?“ In: Avishai Margalit (ed.): Meaning and Use. Dordrecht: 123⫺135.
Cooper, Robin (1985), Aspectual Classes in Situation Semantics. Stanford (⫽ CSLI-Report. No. CSLI-84-146). Cresswell, Max J. (1975), „Hyperintensional Logic“. Studia Logica 34: 25⫺38.
Egli, Urs (1979), „The Stoic Concept of Anaphora“. In: Rainer Bäuerle, Urs Egli und Arnim von Stechow (eds.): Semantics from Different Points of View. Berlin und New York: 266⫺283.
Cresswell, Max J. (1985), Structured Meanings. Cambridge MA.
Elgin, Catherin Z. (1983), With Reference to Reference. Indianapolis.
Cresswell, Max J. (1990), Entities and Indices. Dordrecht, Boston und London.
Etchemendy, John (1988a), „Models, Semantics and Logical Truth“. Linguistics and Philosophy 11: 91⫺106.
Curry, Haskell B. (1951), Outlines of a Formalist Philosophy of Mathematics. Amsterdam. Curry, Haskell B. und Robert Feys (1958), Combinatory Logic. Vol. 1. Amsterdam. Davidson, Donald (1967), „Truth and Meaning“. Synthese 17: 304⫺323. Deutsch von Joachim Schulte: „Wahrheit und Bedeutung“. In: Donald Davidson: Wahrheit und Interpretation. Frankfurt a. M. 1986: 40⫺67. Davidson, Donald (1973), „In Defense of Convention T“. In: Hugues Leblanc (ed.): Truth, Syntax and Modality. Amsterdam 1973: 76⫺87. Deutsch von Joachim Schulte: „Zur Verteidigung von Konvention W“. In: Donald Davidson: Wahrheit und Interpretation. Frankfurt a. M. 1986: 106⫺120. Davidson, Donald (1980), Essays on Actions and Events. Oxford. Deutsch von Joachim Schulte: Handlung und Ereignis. Frankfurt a. M. 1985. Davies, Martin K. (1981), Meaning, Quantification, Necessity. London. Donnellan, Keith (1979), „The Contingent a priori and Rigid Designations“. ⫺ In: Peter A. French, Theodore Uehling und Howard Wettstein (eds.): Contemporary Perspectives in the Philosophy of Language. Minneapolis MN: 44⫺60. Dowty, David R. (1979), Word Meaning and Montague Grammar. Dordrecht. Dowty, David (1989), „On the Semantic Content of the Notion of ‘Thematic Role’ “. ⫺ In: Gennaro Chierchia, Barbara H. Partee und Raymond Turner (eds.): Properties, Types and Meaning. Vol. II. Dordrecht, Boston und London, 69⫺129. Dummett, Michael (1973), Frege. Philosophy of Language. London. 21981.
Etchemendy, John (1988b), „Tarski on Truth and Logical Consequence“. The Journal of Symbolic Logic 53: 51⫺79. Feferman, Solomon (1982), „Towards Useful TypeFree Theories. Part I“. The Journal of Symbolic Logic 49: 75⫺111. Fenstad, Jens Erik, Per-Kristian Halvorsen, Tore Langholm und Johan van Benthem (1987), Situation, Language and Logic. Dordrecht. Field, Hartry (1977), „Logic, Meaning, and Conceptual Role“. Journal of Philosophy 64: 379⫺409. Fillmore, Charles J. (1968), „The Case for Case“. In: Emmon Bach und Robert T. Harms (eds.): Universals in Linguistic Theory. New York 1968: 1⫺90. Fillmore, Charles J. (1977), „The Case for Case Reopened“. In: Peter Cole und Jerrold Sadock (eds.): Syntax and Semantics 8: Grammatical Relations. New York: 59⫺82. Fine, Kit (1977), „Prior on the Construction of Possible Worlds and Instants“. In: Arthur N. Prior und Kit Fine: Worlds, Times and Selves. London: 116⫺161. Fine, Kit (1982), „First-Order Modal Theories III. ⫺ Facts“. Synthese 53: 43⫺122. Fine, Kit (1985), Reasoning with Arbitrary Objects. Oxford. Fitch, Frederic Brenton (1973), „Natural Deduction Rules for English“. Philosophical Studies 24: 89⫺104. Forbes, Graeme (1987), „Indexicals and Intensionality: A Fregean Perspective“. The Philosophical Review 96: 3⫺33.
212 Forbes, Graeme (1993), „Solving the Iteration Problem“. Linguistics and Philosophy 16: 331⫺330. Foster, J. A. (1976), „Meaning and Truth“. In Gareth Evans und John McDowell (eds.): Truth and Meaning. Oxford 1976: 1⫺32. Fraassen, Bas C. van (1969), „Facts and Tautological Entailments“. Journal of Philosophy 66: 477⫺ 487. Fraassen, Bas C. van (1971), Formal Semantics and Logic. New York und London 1971. Fraassen, Bas C. van (1973), „Extension, Intension, and Comprehension“. In: Milton K. Munitz (ed.): Logic and Ontology. New York: 101⫺131. Fraenkel, Abraham Adolf und Yehoshua Bar-Hillel (1958), Foundations of Set Theory. Amsterdam. 2. Auflage (mit Azriel Le´ vy als drittem Autor) 1973. Frege, Gottlob (1892), „Über Sinn und Bedeutung“. Zeitschrift für Philosophie und philosophische Kritik 100: 25⫺50. ⫺ Wieder (mit Originalpaginierung) in: Gottlob Frege, Kleine Schriften. Ed. von Ignacio Angelelli. Hildesheim, Zürich und New York. 21990: 143⫺162. Frege, Gottlob (1893, 1903), Grundgesetze der Arithmetik. 2 Bde. Breslau 1983 (Bd. 1) u. 1903 (Bd. 2). Wieder (einbändige Ausgabe): Hildesheim und New York 1966. Frege, Gottlob (1918/1919), „Der Gedanke. Eine logische Untersuchung“. Beiträge zur Philosophie des deutschen Idealismus 2: 58⫺77. ⫺ Wieder (mit Originalpaginierung) in: Gottlob Frege, Kleine Schriften. Ed. von Ignacio Angelelli. Hildesheim, Zürich und New York. 21990: 342⫺362. Frege, Gottlob (1923), „Logische Allgemeinheit“. MS entstanden 1923 oder später. In: Gottlob Frege, Nachgelassene Schriften. Ed. von Hans Hermes, Friedrich Kambartel und Friedrich Kaulbach. Hamburg 1969: 278⫺281. Frege, Gottlob (1976), Wissenschaftlicher Briefwechsel. Ed. von Gottfried Gabriel, Hans Hermes, Friedrich Kambartel, Christian Thiel und Albert Veraart. Hamurg. Freudenthal, Hans (1960), Lincos. Design of a Language for Cosmic Intercourse. Amsterdam. Friedrichsdorf, Ulf (1992), Einführung in die klassische und intensionale Logik. Braunschweig und Wiesbaden. Frisch, Karl von (1965), Tanzsprache und Orientierung der Bienen. Berlin, Heidelberg und New York. Gaifman, Haim (1964), „Concerning Measures of First-Order Calculi“. Israel Journal of Mathematics 2: 1⫺18. Gärdenfors, Peter (1988), Knowledge in Flux, Modeling the Dynamics of Epistemic States. Cambridge MA. Garson, James W. (1984), „Quantification in Modal Logic“. In: Dov Gabbay und Franz Guenthner (eds.): Handbook of Philosophical Logic. Dordrecht. Vol. 2: 249⫺307.
I. Systematik Gawron, Jean Mark (1986), „Types, Contents, and Semantic Objects“. Linguistics and Philosophy 9: 427⫺476. Gazdar, Gerald (1979), Pragmatics: Implicature, Presupposition and Logical Form. London. Gazdar, Gerald (1981), „Speech Act Assignment“. In: Aravind Joshi, Bonnie Webber und Ivan Sag (eds.): Elements of Discourse Understanding. Cambridge: 64⫺83. Geach, Peter Thomas (1962), Reference and Generality. Ithaca und London. 31980. Geach, Peter Thomas (1979), „Kinds of Statements“. In: Cora Diamond und Jenny Teichman (eds.): Intention and Intentionality. Brighton: 221⫺ 235. Gentzen, Gerhard (1934), „Untersuchungen über das logische Schließen“. Mathematische Zeitschrift 39: 176⫺210 und 405⫺431. Gödel, Kurt (1929), Über die Vollständigkeit des Logikkalküls. Diss. Wien. Wieder in: Kurt Gödel, Collected Works. Vol. 1. Ed. von Solomon Feferman, John Dawson, Stephen C. Kleene, Gregory H. Moore, Robert M. Solovay und Jean van Heijenoort. Oxford 1986: 60⫺101. Gödel, Kurt (1958), „Über eine bisher noch nicht benützte Erweiterung des finiten Standpunktes“. Dialectica 12: 280⫺287. Wieder in: Kurt Gödel, Collected Works. Vol. 2. Ed. von Solomon Feferman et al. Oxford 1990: 240⫺251. Goodman, Nelson (1981), „Wege der Referenz“. Zeitschrift für Semiotik 3: 11⫺22. Goodman, Nicolas D. (1970), „A Theory of Constructions Equivalent to Arithmetic“. In: Akiko Kino, John Myhill und Richard E. Vesley (eds.): Intuitionism and Proof Theory. Amsterdam: 101⫺ 120. Gordon, Michael J. C. (1979), The Denotational Description of Programming Languages. New York, Berlin und Heidelberg. Grice, Herbert Paul (1957), „Meaning“. In: The Philosophical Review 66: 377⫺388. Deutsch von G. Dürselen, G. Falkenberg, F. Liedtke, F. Peters, M. Preprich, überarbeitet von G. Meggle: „Intendieren, Meinen, Bedeuten“. In: Georg Meggle (ed.): Handlung, Kommunikation, Bedeutung. Frankfurt a. M. 1979: 2⫺15. Grice, Herbert Paul (1968), „Utterer’s Meaning, Sentence-Meaning, and Word-Meaning“. Foundations of Language 4: 1⫺18. Deutsch von: Georg Meggle: „Sprecher-Bedeutung, Satz-Bedeutung und Wort-Bedeutung“. In: Georg Meggle (ed.): Handlung, Kommunikation, Bedeutung. Frankfurt a. M. 1979: 85⫺111. Grice, Herbert Paul (1969), „Utterer’s Meaning and Intentions“. Philosophical Review 78: 147⫺ 177. Deutsch von Georg Meggle: „Sprecherbedeutung und Intentionen“. In: Georg Meggle (ed.): Handlung, Kommunikation, Bedeutung. Frankfurt a. M. 1979: 16⫺51.
3. Semantik Grice, Herbert Paul (1975), „Logic and Conversation“. In: Peter Cole und Jerry L. Morgan (eds.): Syntax and Semantics 3: Speech Acts. New York: 41⫺58. Deutsch von Georg Meggle: „Logik und Konversation“. In: Georg Meggle (ed.): Handlung, Kommunikation, Bedeutung. Frankfurt a. M. 1979: 243⫺265. Grice, Herbert Paul (1978), „Further Notes on Logic and Conversation“. In: Peter Cole (ed.): Syntax and Semantics 9: Pragmatics. New York: 113⫺127. Groenendijk, Jeroen und Martin Stokhof (1991), „Dynamic Predicate Logic: Towards a Compositional, Non-Representational Semantics of Discourse“. Linguistics and Philosophy 14: 39⫺100. Gupta, Anil (1980), The Logic of Common Nouns. New Haven und London. Halmos, Paul R. (1962), Algebraic Logic. New York. Halvorsen, Per-Kristian (1983), „Semantics for Lexical-Functional Grammar“. Linguistic Inquiry 14: 567⫺615. Halvorsen, Per-Kristian (1987), Situation Semantics and Semantic Interpretation in Constraint-Based Grammars. Stanford CA (⫽ CSLI-Report No. CSLI-87-101). Hamblin, Charles Leonard (1971), „Mathematical Models of Dialogue“. Theoria 37: 130⫺155. Hamblin, Charles Leonard (1987), Imperatives. Oxford. Harman, Gilbert (1974), „Meaning and Semantics“. In: Milton K. Munitz und Peter K. Unger (eds.): Semantics and Philosophy. New York: 1⫺16. Harman, Gilbert (1977), „Review of Linguistic Behavior by Jonathan Bennett“. Language 53: 417⫺ 424. Harman, Gilbert (1987), „(Nonsolipsistic) Conceptual Role Semantics“. In: Ernest LePore (ed.): New Directions in Semantics. New York: 55⫺81. Heijenoort, Jean van (1977), „Sense in Frege“. Journal of Philosophical Logic 6: 93⫺102. Heim, Irene (1977), Zum Verhältnis von Wahrheitsbedingungen-Semantik und Sprechakttheorie. Konstanz (⫽ Forschungsberichte des Sonderforschungsbereichs 99 der Universität Konstanz 17). Heim, Irene (1982), The Semantics of Definite and Indefinite Noun Phrases. Ph. Diss. University of Massachussetts at Amherst. Auch als: Forschungsbericht des Sonderforschungsbereichs 99 der Universität Konstanz 73. Heim, Irene (1983), „File Change Semantics and the Familiarity Theory of Definiteness“. In: Rainer Bäuerle, Christoph Schwarze und Arnim von Stechow (eds.): Meaning, Use, and Interpretation. Berlin und New York: 164⫺189. Henkin, Leon, J. Donald Monk und Alfred Tarski (1971), Cylindric Algebras. Part I. Amsterdam. 2 1985.
213 Henkin, Leon, J. Donald Monk und Alfred Tarski (1985), Cylindric Algebras. Part II. Amsterdam. Hermes, Hans (1938), Semiotik. Eine Theorie der Zeichengestalten als Grundlage für Untersuchungen von formalisierten Sprachen. Leipzig (⫽ Forschungen zur Logik und zur Grundlegung der exakten Wissenschaften N. F. 5.). Hermes, Hans (1972), Einführung in die mathematische Logik. 3. Auflage. Stuttgart. Higginbotham, James (1985), „On Semantics“. Linguistic Inquiry 16: 547⫺593. Hindley, J. Roger und Jonathan P. Seldin (1986), Introduction to Combinators and l-Calculus. Cambridge. Hinst, Peter (1983), „Quines Ontologiekriterium“. Erkenntnis 19: 193⫺216. Hintikka, Jaakko (1963), „The Modes of Modality“. In: Proceedings of a Colloquium on Modal and Many-Valued Logics. Helsinki, 23⫺26 August, 1962. Helsinki: 65⫺82 (⫽ Acta Philosophica Fennica XVI). Hintikka, Jaakko (1975), „The Intentions of Intentionality“. ⫺ In: Jaakko Hintikka: The Intentions of Intentionality and Other New Models for Modality. Dordrecht: 192⫺222. Hintikka, Jaakko (1981), „Semantics: A Revolt against Frege“. ⫺ In: Guttorm Fløistad und Georg Hendrik von Wright (eds.): Contemporary Philosophy. A New Survey. Dordrecht. Vol. 1: 57⫺82. Hintikka, Jaakko und Lauri Carlson (1979), „Conditionals, Generic Quantifiers, and Other Applications of Subgames“. ⫺ In: Avishai Margalit (ed.): Meaning and Use. Dordrecht: 57⫺92. Hintikka, Jaakko und Jack Kulas (1983), „Semantical Games, Subgames and Functional Interpretations“. In: Jaakko Hintikka (in collaboration with Jack Kulas): The Game of Language. Dordrecht: 47⫺76. Hintikka, Jaakko und Jack Kulas (1985), Anaphora and Definite Description. Dordrecht. Hiz˙ , Henry (1973), „On the Rules of Consequence for a Natural Language“. The Monist 57: 312⫺327. Hiz˙ , Henry (1977), „Logical Basis of Semiotics“. In: Thomas A. Sebeok (ed.): A Perfusion of Signs. Bloomington und London: 40⫺55. Hiz˙ , Henry (1984), „Frege, Les´niewski and Information Semantics on the Resolution of Antinomies“. Synthese 60: 51⫺72. Hiz˙ , Henry (1985), „Information Semantics and Antinomies“. In: Paul Weingartner und Georg Dorn (eds.): Foundations of Logic and Linguistics. New York: 482⫺502. Hjelmslev, Louis (1961), Prolegomena to a Theory of Language. Aus dem Dänischen von F. J. Whitfield. Madison, Milwaukee und London. Hockett, Charles F. (1948), „A Note on ,Structure’ “. International Journal of American Linguis-
214 tics 14: 269⫺271. Deutsch von Elisabeth Bense: „Eine Bemerkung über ,Struktur’ “. In: Elisabeth Bense, Peter Eisenberg und Hartmut Haberland (eds.): Beschreibungsmethoden des amerikanischen Strukturalismus. München 1976: 299⫺302. Howard, William A. (1969), „The Formulae-as-Types Notion of Construction“. Ms. ⫺ Veröffentlicht in: Jonathan P. Seldin und J. Roger Hindley (eds.): To Haskell B. Curry: Essays on Combinatory Logic, Lambda Calculus and Formalism. New York 1980: 479⫺490. Hultsch, Friedrich (1958), „Abacus“. ⫺ In: Paulys Realencyclopädie der classischen Altertumswissenschaft. Neue Bearbeitung. Unter Mitwirkung zahlreicher Fachgenossen ed. von Georg Wissowa. Bd. I. 1. Halbband. Stuttgart: Sp. 5⫺10. Ifrah, Georges (1981), Histoire universelle des chiffres. Paris. Deutsch von Alexander von Platen: Universalgeschichte der Zahlen. Frankfurt a. M. 1986.
I. Systematik Kaplan, David (1989), „Demonstratives“. Ms. 1977. Veröffentlicht in: Joseph Almog, John Perry und Howard Wettstein (eds.): Themes from Kaplan. Oxford: 481⫺563. Kemeny, John (1953), „A Logical Measure Function“. The Journal of Symbolic Logic 18: 289⫺308. Kenny, Anthony (1963), Action, Emotion, and Will. London. King, Jeffrey C. (1987), „Pronouns, Descriptions, and the Semantics of Discourse“. Philosophical Studies 51: 341⫺363. Kretzmann, Norman (1982), „Syncategoremata, Exponibilia, Sophismata“. In: Norman Kretzmann, Anthony Kenny und Jan Pinborg (eds.): The Cambridge History of Later Medieval Philosophy. Cambridge: 211⫺245.
Janssen, Theo M. V. und Peter van Emde Boas (1984), „Compositionality of Meaning in Logic and Computer Science“. In: Gerd Wechsung (ed.): Frege Conference 1984. Berlin: 401⫺407.
Kripke, Saul (1963), „Semantical Considerations on Modal Logic“. ⫺ In: Proceedings of a Colloquium on Modal and Many-Valued Logics. Helsinki 23⫺26 August, 1962. Helsinki: 83⫺94 (⫽ Acta philosophica fennica XVI.). Deutsch von Wolf König: „Semantische Untersuchungen zur Modallogik“. In: Siegfried Kanngießer und Gerd Lingrün (eds.), Studien zur Semantik. Kronberg/Ts. 1974: 44⫺60.
Jubien, Michael (1989), „On Properties and Property Theory“. In: Gennaro Chierchia, Barbara H. Partee und Raymond Turner (eds.): Properties, Types and Meaning. Dordrecht. Vol. 1: 159⫺175.
Kripke, Saul (1965), „Semantical Analysis of Intuitionistic Logic I“. In: John N. Crossley und Michael Dummett (eds.): Formal Systems and Recursive Functions. Amsterdam: 92⫺130.
Kamp, Hans (1971), „Formal Properties of ,Now’ “. Theoria 37: 227⫺274.
Kripke, Saul (1972), „Naming and Necessity“. In: Donald Davidson und Gilbert Harman (eds.): Semantics of Natural Language. Dordrecht: 253⫺355 und 763⫺769. Deutsch von Ursula Wolf: Name und Notwendigkeit. Frankfurt a. M. 1981.
Kamp, Hans (1978), „Semantics versus Pragmatics“. ⫺ In: Franz Guenthner und Siegfried J. Schmidt (eds.): Formal Semantics and Pragmatics for Natural Language. Dordrecht: 257⫺287. Kamp, Hans (1981), „A Theory of Truth and Semantic Interpretation“. In: Jeroen A. G. Groenendijk, Theo M. V. Janssen und Martin B. J. Stokhof (eds.): Formal Methods in the Study of Language. Part 1. Amsterdam: 277⫺322. Kamp, Hans und Uwe Reyle (1993), From Discourse to Logic. Introduction to Modeltheoretic Semantics of Natural Language, Formal Logic and Discourse Representation Theory. 2 Vols. Dordrecht, Boston und London. Kanger, Stig (1957), Provability in Logic. Stockholm. Kaplan, David (1964), Foundations of Intensional Logic. Ph. Diss. University of California at Los Angeles. Kaplan, David (1975), „How to Russell a FregeChurch“. Journal of Philosophy 72: 716⫺729. Kaplan, David (1979), „Transworld Heir Lines“. In: Michael J. Loux (ed.): The Possible and the Actual. Ithaca und London: 88⫺109. Kaplan, David (1986), „Opacity“. In: Lewis Edwin Hahn und Paul Arthur Schilpp (eds.): The Philosophy of W. V. O. Quine. La Salle IL: 229⫺289.
Kripke, Saul (1975), „Outline of a Theory of Truth“. Journal of Philosophy 72: 690⫺716. Kripke, Saul (1976), „Is there a Problem about Substitutional Quantification?“ In: Gareth Evans und John McDowell (eds.): Truth and Meaning. Oxford: 325⫺419. Küng, Guido und John Thomas Canty (1970), „Substitutional Quantification and Les´niewskian Quantifiers“. ⫺ Theoria 36: 165⫺182. Kutschera, Franz von (1975), „Partial Interpretations“. In: Edward Keenan (ed.): Formal Semantics of Natural Language. Cambridge: 156⫺174. Kutschera, Franz von (1979), „Grundbegriffe der Metaphysik von Leibniz im Vergleich zu Begriffsbildungen der heutigen Modallogik“. In: Albert Heinekamp und Franz Schupp (eds.): Die intensionale Logik bei Leibniz und in der Gegenwart. Wiesbaden: 93⫺107. Lakoff, George (1970), „Linguistics and Natural Logic“. Synthese 22: 151⫺271. Deutsch von Udo Fries und Harald Mittermann. Ed. von Werner Abraham: Linguistik und natürliche Logik. Frankfurt a. M. 1971. Lambek, Joachim (1988), „Categorial and Categorical Grammar“. In: Richard T. Oehrle, Emmon
3. Semantik Bach und Deirdre Wheeler (eds.): Categorial Grammars and Natural Language Structures. Dordrecht: 297⫺317. Langholm, Tore (1988), Partiality, Truth and Persistence. Stanford. Laymon, Ronald (1987), „Using Scott Domains to Explicate the Notions of Approximate and Idealized Data“. Philosophy of Science 54: 194⫺221. Leblanc, Hugues und Bas C. van Fraassen (1979), „On Carnap and Popper Probability Functions“. The Journal of Symbolic Logic 44: 369⫺373. Leech, Geoffrey (1974), Semantics. Harmondsworth. Levinson, Stephen C. (1981), „The Essential Inadequacies of Speech Act Models of Dialogue“. In: Herman Parret und Marina Sbisa` (eds.): Possibilities and Limitations of Pragmatics. Amsterdam: 473⫺492. Lewis, David (1969), Convention: A Philosophical Study. Cambridge MA. Deutsch von Roland Posner und Detlef Wenzel: Konventionen. Eine sprachphilosophische Abhandlung. Berlin und New York 1975. Lewis, David (1970), „General Semantics“. Synthese 22: 18⫺67. Deutsch von Gerhard von der Straten: „Prinzipien der Semantik“. In: Siegfried Kanngießer und Gerd Lingrün (eds.): Studien zur Semantik. Kronberg/Ts. 1974: 136⫺197. Lewis, David (1980), „Index, Context, and Content“. In: Stig Kanger und Sven Öhman (eds.): Philosophy and Grammar. Dordrecht: 79⫺100. Lewis, David (1986), On the Plurality of Worlds. Oxford. Lieb, Hans-Heinrich (1968), Communication Complexes and Their Stages. Den Haag. Lindström, Per (1974), „On Characterizing Elementary Logic“. In: Sören Stenlund (ed.): Logical Theory and Semantic Analysis. Dordrecht: 129⫺ 146. Loar, Brian (1976), „Two Theories of Meaning“. In: Gareth Evans und John McDowell (eds.): Truth and Meaning. Oxford: 138⫺161. Lorenzen, Paul (1955), Einführung in die operative Logik und Mathematik. Berlin, Heidelberg und New York. 21969. Lyons, John (1977), Semantics. 2 Vols. Cambridge. Deutsch von Brigitte Asbach-Schnitker u. a.: Semantik. München 1980 (Bd. 1) und 1983 (Bd. 2). Machover, Maurice (1966), „Contextual Determinacy in Les´niewski’s Grammar“. Studia Logica 19: 47⫺55. Mac Lane, Saunders (1972), Kategorien. Begriffssprache und mathematische Theorie. Deutsch von Klaus Schürger. Berlin, Heidelberg und New York. Martin, John N. (1975), „Facts and the Semantics of Gerunds“. Journal of Philosophical Logic 4: 439⫺454.
215 Martin, John N. (1977), „A Fregean Interpretation of the Quantifiers“. Logique et analyse 20: 122⫺ 128. Martin, John N. (1981), „Facts and Events as Semantic Constructs“. Theoretical Linguistics 8: 259⫺285. Martin, Richard Milton (1953), „On Truth and Multiple Denotation“. The Journal of Symbolic Logic 18: 11⫺18. Martin, Richard Milton (1958), Truth and Denotation. Chicago. Reprint 1975. Mates, Benson (1974), „Austin, Strawson, Tarski, and Truth“. In: Leon Henkin, John Addison, Chen Chung Chang, William Craig, Dana Scott und Robert Vaught (eds.): Proceedings of the Tarski Symposium. Providence RI: 385⫺396. McCawley, James (1972), „A Programm for Logic“. In: Donald Davidson und Gilbert Harman (eds.): Semantics of Natural Language. Dordrecht: 498⫺544. McDermott, Drew und Jon Doyle (1980), „NonMonotonic Logic I“. Artificial Intelligence 13: 41⫺72. McGinn, Collin (1976), „A Note on the Frege Argument“. Mind 85: 422⫺423. McKinsey, John C. C. (1948/1949), „A New Definition of Truth“. Synthese 7: 428⫺433. McMichael, Alan (1983), „A New Actualist Modal Semantics“. Journal of Philosophical Logic 12: 73⫺99. Meggle, Georg (1980), Grundbegriffe der Kommunikation. Berlin und New York. Menzel, Chris (1986), A Complete Type-Free ,Second-Order’ Logic and Its Philosophical Foundations. Stanford (⫽ CSLI-Reports. CSLI-86-40). Mönnich, Uwe (1983), „Towards a Calculus of Concepts as a Semantical Metalanguage“. In: Rainer Bäuerle, Christoph Schwarze und Arnim von Stechow (eds.): Meaning, Use, and Interpretation of Language. Berlin und New York: 342⫺360. Montague, Richard (1960), „Logical Necessity, Physical Necessity, Ethics, and Quantifiers“. Inquiry 4: 259⫺269. Montague, Richard (1969), „On the Nature of Certain Philosophical Entities“. The Monist 53: 159⫺ 194. Montague, Richard (1970), „Universal Grammar“. Theoria 36: 373⫺398. Deutsch von Helmut Schnelle: Universale Grammatik. Braunschweig 1972. Montague, Richard (1973), „The Proper Treatment of Quantification in Ordinary English“. In: Jaakko Hintikka, Julius Moravcsik und Patrick Suppes (eds.): Approaches to Natural Language. Dordrecht: 221⫺242. Mostowski, Andrzej (1965), Thirty Years of Foundational Studies. Oxford (⫽ Acta Philosophica Fennica XVII).
216 Mourelatos, Alexander P. D. (1978), „Events, Processes, and States“. Linguistics and Philosophy 2: 415⫺434. Muskens, Reinhard (1989), „Going Partial in Montague Grammar“. In: Renate Bartsch, Johan van Benthem und Peter van Emde Boas (eds.): Semantics and Contextual Expression. Dordrecht: 175⫺ 220. Myhill, John (1963), „An Alternative to the Method of Extension and Intension“. In: Paul Arthur Schilpp (ed.): The Philosophy of Rudolf Carnap. La Salle IL: 299⫺310. Olson, Kenneth Russell (1987), An Essay on Facts. Stanford. Ostwald, Wilhelm (1944), Die Farbfibel. Berlin (⫽ 16. Auflage von „Die Farbenfibel“. Leipzig 1917). Padoa, Alessandro (1902), „Un nouveau syste`me irre´ ductible de postulats pour l’alge`bre“. In: Compte rendu du deuxie`me congre`s international des mathe´ maticiens tenu a` Paris du 6 au 12 aouˆ t 1900. Paris: 249⫺256.
I. Systematik Semiotic Aspects of Artificial Intelligence. Berlin und New York: 215⫺270. Potts, Timothy (1975), „Model Theory and Linguistics“. ⫺ In: Edward L. Keenan (ed.): Formal Semantics of Natural Language. Cambridge: 241⫺ 250. Potts, Timothy (1978), „Fregean Grammar: A Formal Outline“. Studia Logica 37: 7⫺26. Potts, Timothy (1994), Structures and Categories for the Representation of Meaning. Cambridge. Prawitz, Dag (1965), Natural Deduction. A ProofTheoretical Study. Stockholm. Prawitz, Dag (1970), „Constructive Semantics“. In: Proceedings of the 1st Scandinavian Logic Symposium. Uppsala: 86⫺114 (⫽ Filosofiska studier/Philosophical studies 8). Prawitz, Dag (1971), „Ideas and Results in Proof Theory“. In: Jens Eric Fenstad (ed.): Proceedings of the 2nd Scandinavian Logic Symposium. Amsterdam: 235⫺307.
Parks, Zane (1976), „Investigations into Quantified Modal Logic. Part I“. Studia Logica 35: 109⫺125.
Prawitz, Dag (1972), „Meaning and Proofs: On the Conflict between Classical and Intuitionistic Logic“. Theoria 48: 2⫺40.
Parsons, Terence (1985), „Underlying Events in the Logical Analysis of English“. In: Ernest LePore und Brian McLaughlin (eds.): Actions and Events: Perspectives on the Philosophy of Donald Davidson. Oxford: 235⫺267.
Prawitz, Dag (1981), „Philosophical Aspects of Proof Theory“. ⫺ In: Guttorm Fløistad und Georg Hendrik von Wright (eds.): Contemporary Philosophy. A New Survey. Vol. 1. Dordrecht: 235⫺277.
Parsons, Terence (1990), Events in the Semantics of English. A Study in Subatomic Semantics. Cambridge MA. Perry, John (1977), „Frege on Demonstratives“. The Philosophical Review 86: 474⫺497. Platts, Mark (1980), „Introduction“. ⫺ In: Mark Platts (ed.): Reference, Truth and Reality. London: 1⫺18. Popper, Karl Raimund (1974), „Some Philosophical Comments on Tarski’s Theory of Truth“. ⫺ In: Leon Henkin, John Addison, Chen Chung Chang, William Craig, Dana Scott und Robert Vaught (eds.): Proceedings of the Tarski Symposium. Providence RI: 397⫺409. Posch, Günter (1987), „Hintikkas spieltheoretische Semantik. Konstruktive und destruktive Kritik zu einigen Punkten“. Erkenntnis 26: 249⫺294. Posner, Roland (1979), „Bedeutung und Gebrauch der Satzverknüpfer in den natürlichen Sprachen“. In: Günther Grewendorf (ed.): Sprechakttheorie und Semantik. Frankfurt a. M.: 345⫺385. Posner, Roland (1984), „Die Zahlen und ihre Zeichen“. In: Klaus Oehler (ed.): Zeichen und Realität. Tübingen Bd. 2: 235⫺248. Posner, Roland (1993), „Believing, Causing, Intending: The Basis for a Hierarchy of Sign Concepts in the Reconstruction of Communication“. In: Rene´ J. Jorna, Barend van Heusden und Roland Posner (eds.): Signs, Search and Communication:
Prawitz, Dag (1982), „Beweise und die Bedeutung und die Vollständigkeit der logischen Konstanten“. Conceptus 16: 31⫺44 (⫽ leicht veränderte deutsche Version von: „Proofs and the Meaning and Completeness of the Logical Constants“. In: Jaakko Hintikka, Ilkka Niiniluoto und Esa Saarinen (eds.): Essays on Mathematical and Philosophical Logic. Dordrecht 1978: 25⫺40). Przełec˛ki, Marian (1980), „Set Theory as an Ontology for Semantics“. In: Rudolf Haller und Wolfgang Grassl (eds.): Sprache, Logik und Philosophie. Akten des 4. internationalen Wittgenstein-Symposiums. Wien: 115⫺123. Putnam, Hilary (1975), „The Meaning of ‘Meaning’ “. In: Hilary Putnam, Mind, Language and Reality. Philosophical Papers. Cambridge. Vol. 2: 215⫺271. Zugleich in: Keith Gunderson (ed.): Language, Mind, and Knowledge. Minneapolis 1975: 131⫺193 (⫽ Minnesota Studies in the Philosophy of Science VII). Quine, Willard V. O. (1940), Mathematical Logic. New York. 7. Auflage der revidierten Ausgabe. Cambridge MA: 1974. Quine, Willard V. O. (1951), „Two Dogmas of Empiricism“. The Philosophical Review 60: 20⫺43. Deutsch von Johannes Sinnreich: „Zwei Dogmen des Empirismus“. In: Johannes Sinnreich (ed.): Zur Philosophie der idealen Sprache. München 1972: 167⫺194. Quine, Willard V. O. (1953), „Three Grades of Modal Involvement“. In: Proceedings of the XIth.
3. Semantik International Congress of Philosophy. Amsterdam. Vol. 14: 65⫺81. Quine, Willard V. O. (1960), Word and Object. Cambridge MA. Deutsch von Joachim Schulte in Zusammenarbeit mit Dieter Birnbacher: Wort und Gegenstand. Stuttgart 1980. Quine, Willard V. O. (1971), Algebraic Logic and Predicate Functors. Indianapolis. Quine, Willard V. O. (1974), The Roots of Reference. La Salle IL. Deutsch von Hermann Vetter: Die Wurzeln der Referenz. Frankfurt a. M. 1976. Rankin, V. K. W. (1968), „Referential Identifiers“. American Philosophical Quarterly 1: 233⫺243. Rescher, Nicholas (1966), The Logic of Commands. London. Rheinwald, Rosemarie (1988), Semantische Paradoxien, Typentheorie und ideale Sprache. Berlin und New York. Richter, Manfred (1976), Einführung in die Farbmetrik. Berlin und New York. Roever, Willem-Paul de Jr. (1976), Recursive Program Schemes: Semantics and Proof Theory. Amsterdam. Ross, John R. (1970). „On Declarative Sentences“. In: Roderick Jacobs A. und Peter S. Rosenbaum (eds.): Readings in English Transformational Grammar. Waltham MA: 222⫺272. Russell, Bertrand (1905), „On Denoting“. In: Mind 14: 479⫺493. Deutsch von Ulrich Steinvorth: „Über das Kennzeichnen“. In: Bertrand Russell, Philosophische und politische Aufsätze. Stuttgart 1971: 3⫺22. Russell, Bertrand (1918/1919), „The Philosophy of Logical Atomism“. The Monist 28: 495⫺527 sowie 29: 33⫺63, 190⫺222 und 314⫺380. Deutsch von Johannes Sinnreich: „Philosophie des logischen Atomismus“. In: Bertrand Russell, Die Philosophie des logischen Atomismus. München 1976: 178⫺277. Rusza, Imre (1986), „Intensional Logic and Semantic Value Gaps“. Logique et analyse 29: 187⫺ 203. Sadock, Jerrold M. (1974), Toward a Linguistic Theory of Speech Acts. New York. Sadock, Jerrold M. (1988), „Speech Act Distinctions in Grammar“. In: Frederick J. Newmeyer (ed.): Linguistics: the Cambridge Survey. Cambridge. Vol. 2: 183⫺197. Salmon, Nathan U. (1981), Reference and Essence. Oxford. Schlick Moritz (1936), „Meaning and Verification“. The Philosophical Review 44: 125⫺146. Wieder in: Moritz Schlick, Gesammelte Aufsätze. Wien 1938. Reprint Hildesheim 1969: 337⫺368. Schmidt, Max C. P. (1906), Kulturhistorische Beiträge zur Kenntnis des griechischen und römischen Altertums. 1. Heft. Zur Entstehung und Terminologie der elementaren Mathematik. Leipzig.
217 Scholz, Heinrich und Gisbert Hasenjäger (1961), Grundzüge der mathematischen Logik. Berlin, Heidelberg und New York. Schütte, Kurt (1968), Vollständige Systeme modaler und intuitionistischer Logik. Berlin, Heidelberg und New York. Scott, Dana (1970a), „Advice on Modal Logic“. In: Karel Lambert (ed.): Philosophical Problems in Logic. Dordrecht: 143⫺173. Scott, Dana (1970b), „Constructive Validity“. ⫺ In: M. Laudet, D. Lacombe, Louis Nolin und Marcel-Paul Schützenberger (eds.): Symposium on Automatic Demonstration. Berlin, Heidelberg und New York: 237⫺275. Scott, Dana (1971), „The Lattice of Flow Diagrams“. In: Erwin Engeler (ed.): Symposium on Semantics of Algorithmic Languages. Berlin, Heidelberg und New York: 311⫺366. Scott, Dana (1972), „Continuous Lattices“. In: F. William Lawvre (ed.): Toposes, Algebraic Geometry and Logic. Berlin, Heidelberg und New York: 97⫺ 136. Scott, Dana (1975), „Data Types as Lattices“. In: Gert H. Müller, Arnold Oberschelp und Klaus Potthoff (eds.): ISILC Logic Conference, Kiel 1974. Berlin, Heidelberg und New York: 579⫺651. Searle, John R. (1969), Speech Acts. An Essay in the Philosophy of Language. Cambridge. Deutsch von R. und R. Wiggershaus: Sprechakte. Ein sprachphilosophischer Essay. Frankfurt a. M. 1971. Searle, John R. (1975a), „A Taxonomy of Illocutionary Acts“. ⫺ In: Keith Gunderson (ed.): Language, Mind and Knowledge. Minneapolis: 344⫺ 369. Deutsch von Andreas Kemmerling: „Eine Taxonomie illokutionärer Akte“. In: John R. Searle, Ausdruck und Bedeutung. Frankfurt a. M. 1982: 17⫺50. Searle, John R. (1975b), „Indirect Speech Acts“. In: Peter Cole und Jerry Morgan (eds.): Syntax and Semantics 3: Speech Acts. New York: 59⫺82. Deutsch von Andreas Kemmerling: „Indirekte Sprechakte“. In: John R. Searle, Ausdruck und Bedeutung. Frankfurt a. M. 1982: 51⫺79. Searle, John R. und Daniel Vanderveken (1985), Foundations of Illocutionary Logic. Cambridge. Seely, Robert A. G. (1987), „Categorial Semantics for Higher Order Polymorphic Lambda Calculus“. The Journal of Symbolic Logic 52: 969⫺989. Sluga, Hans (1980), Gottlob Frege. London. Smith, Brian Cantwell (1987), Semantics of Clocks. Stanford (⫽ CSLI-Report. CSLI-87-75). Stalnaker, Robert (1978), „Assertion“. ⫺ In: Peter Cole (ed.): Syntax and Semantics 9: Pragmatics. New York: 315⫺332. Stalnaker, Robert (1984), Inquiry. Cambridge MA. Stechow, Arnim von (1989), Syntax und Semantik. 2. Auflage. Konstanz (⫽ Fachgruppe Sprachwissenschaft der Universität Konstanz. Arbeitspapiere
218 Nr. 1). ⫺ Wieder in von Stechow und Wunderlich 1991: 90⫺148. Stechow, Arnim von und Dieter Wunderlich (eds.) (1991), Semantik: Ein Handbuch der zeitgenössischen Forschung. Semantics: An International Handbook of Contemporary Research. Berlin und New York. Stenius, Erik (1967), „Mood and Language Game“. ⫺ Synthese 17: 254⫺277. Stoy, Joseph E. (1977), Denotational Semantics: The Scott-Strachey Approach to Programming Language Theory. Cambridge MA. Strawson, Peter (1950), „On Referring“. Mind 59: 320⫺344. Deutsch von Joachim Schulte: „Bezeichnen“. In: Peter Strawson: Logik und Linguistik. Aufsätze zur Sprachphilosophie. München 1974: 83⫺116. Sundholm, Göran (1986), „Proof Theory and Meaning“. In: Dov Gabbay und Franz Guenthner (eds.): Handbook of Philosophical Logic. Dordrecht. Vol. 3: 471⫺506. Suppes, Patrick (1974), Probabilistic Metaphysics. Uppsala (⫽ Filosofiska studier. Philosophical Studies Nr. 22). Veränderte Fassung: Oxford 1984. Suppes, Patrick (1979), „Logical Inference in English: A Preliminary Analysis“. Studia Logica 38: 375⫺391. Suppes, Patrick (1980), „Procedural Semantics“. In: Rudolf Haller und Wolfgang Grassl (ed.): Sprache, Logik und Philosophie. Akten des 4. Internationalen Wittgenstein-Symposiums. Wien: 27⫺35. Suszko, Roman (1971), „Identity Connective and Modality“. Studia Logica 27: 7⫺39. Suszko, Roman (1975), „Abolition of the Fregean Axiom“. ⫺ In: Rohit Perikh (ed.): Logic Colloquium. Symposium on Logic Held at Boston, 1972⫺ 73. Berlin, Heidelberg und New York: 169⫺239. Tait, William W. (1968), „Constructive Reasoning“. In: Bob van Rootselaar und J. F. Staal (eds.): Logic, Methodology and Philosophy of Science. Amsterdam: 185⫺198. Tarski, Alfred (1930), „Fundamentale Begriffe der deduktiven Wissenschaften I“. Monatshefte für Mathematik und Physik 37: 361⫺404. Tarski, Alfred (1931), „Sur les ensembles de´ finissables de nombres re´ els I“. ⫺ In: Fundamenta mathematicae 17: 210⫺239. Tarski, Alfred (1935a), „Grundzüge des Systemenkalküls. Erster Teil“. Fundamenta mathematicae 25: 283⫺301. Tarski, Alfred (1935b), „Einige methodologische Untersuchungen über die Definierbarkeit der Begriffe“. Erkenntnis 5: 80⫺100. Tarski, Alfred (1935c), „Der Wahrheitsbegriff in den formalisierten Sprachen“. Studia philosophica 1: 261⫺405, mit gleichzeitiger Separatpaginierung 1⫺145. Wieder in: Karel Berka und Lothar Kreiser (eds.): Logik-Texte. Berlin 1971: 447⫺559.
I. Systematik Tarski, Alfred (1936a), „Grundlegung der wissenschaftlichen Semantik“. In: Actes du Congre`s International de Philosophie Scientifique. Paris. Vol. 3: 1⫺8. Tarski, Alfred (1936b), „Über den Begriff der logischen Folgerung“. ⫺ In: Actes du Congre`s International de Philosophie Scientifique. Paris. Vol. 7: 1⫺11. Tennant, Neil (1987), Anti-Realism and Logic. Oxford. Thomason, Richmond (1972), „A Semantic Theory of Sortal Incorrectness“. Journal of Philosophical Logic 1: 209⫺258. Tichy´ , Pavel (1975), „What Do We Talk about?“ Philosophy of Science 42: 80⫺93. Tichy´ , Pavel (1978), „Questions, Answers, and Logic“. American Philosophical Quarterly 15: 275⫺284. Tichy´ , Pavel (1980a), „The Semantics of Episodic Verbs“. Theoretical Linguistics 7:236⫺296. Tichy´ , Pavel (1980b), „The Transiency of Truth“. Theoria 46. 165⫺182. Tichy´ , Pavel (1982), „Foundations of Partial Type Theory“. Reports on Mathematical Logic 14: 59⫺ 72. Tichy´ , Pavel (1983), „Kripke on Necessity a Posteriori“. Philosophical Studies 43: 225⫺241. Tichy´ , Pavel (1986), „Frege and the Case of the Missing Sense“. Grazer Philosophische Studien 43: 27⫺47. Tichy´ , Pavel (1988), The Foundations of Frege’s Logic. Berlin und New York. Troelstra, Anne S. (1969), Principles of Intuitionism. Berlin, Heidelberg und New York. Turner, Raymond (1983), „Montague’s Semantics, Nominalizations and Scott’s Domains“. Linguistics and Philosophy 6: 259⫺288. Turner, Raymond (1987), „A Theory of Properties“. The Journal of Symbolic Logic 52: 455⫺472. Turner, Raymond (1990), Truth and Modality for Knowledge Representation. London. Turvey, M. T. und Claudia Carello (1985), „The Equation of Information and Meaning from the Perspective of Situation Semantics and Gibson’s Ecological Realism“. Linguistics and Philosophy 8: 81⫺90. Ullman-Margalit, Edna (1979), „Comments“ [on Dummett 1979]. In: Avishai Margalit (ed.): Meaning and Use. Dordrecht: 136⫺140. Vanderveken, Daniel (1982), „Some Philosophical Remarks on the Theory of Types in Intensional Logic“. Erkenntnis 17: 85⫺112. Vanderveken, Daniel (1983), „A Model-Theoretical Semantics for Illocutionary Forces“. Logique et analyse 26: 359⫺394. Vendler, Zeno (1957), „Verbs and Times“. Philosophical Review 56: 143⫺160.
4. Pragmatics Waldo, James (1979), „A PTQ Semantics for Sortal Incorrectness“. In: Steven Davis und Marianne Mithun (eds.): Linguistics, Philosophy and Montague Grammar. Austin und London: 311⫺331. Wallace, John (1970), „On the Frame of Reference“. Synthese 22: 61⫺94. Winograd, Terry (1983), Language as a Cognitive Process. Vol. 1: Syntax. Reading MA. Wittgenstein, Ludwig (1921), „Tractatus logicophilosophicus“. Annalen der Naturphilosophie 14: 185⫺262. Wieder in: Ludwig Wittgenstein, Schriften 1. Frankfurt a. M. 1969: 7⫺83. Wittgenstein, Ludwig (1958), Philosophische Untersuchungen. Oxford. Wieder in: Ludwig Wittgenstein, Schriften 1. Frankfurt a. M. 1969: 279⫺544. Wo´jcicki, Ryszard (1984), „R. Suszko’s Situational Semantics“. Studia Logica 43: 324⫺340. Wolniewicz, Boguslaw (1978), „Situations as the Reference of Propositions“. Dialectics and Humanism 1: 171⫺182. Wolniewicz, Boguslaw (1979), „A Wittgensteinian Semantics for Propositions“. ⫺ In: Cora Diamond
219 und Jenny Teichmann (eds.): Intention and Intentionality. Brighton: 165⫺176. Zaefferer, Dietmar (1979), „Sprechakttypen in einer Montague-Grammatik. Ein modelltheoretischer Ansatz zur Behandlung illokutionärer Rollen“. In: Günther Grewendorf (ed.): Sprechakttheorie und Semantik. Frankfurt a. M. 386⫺417. Zalta, Edward (1983), Abstract Objects. Dordrecht. Zalta, Edward (1988), Intensional Logic and the Metaphysics of Intentionality. Cambridge MA. Zeevat, Henk (1986), „A Treatment of Belief Sentences in Discourse Representation Theory“. In: Jeroen Groenendijk, Dick de Jongh und Martin Stokhof (eds.): Studies in Discourse Representation Theory and the Theory of Generalized Quantifiers. Dordrecht: 189⫺215. Zimmermann, Thomas E. (1991), „Kontextabhängigkeit“. In von Stechow und Wunderlich 1991: 156⫺229.
Klaus Robering, Berlin (Deutschland)
4. Pragmatics 1. Types of semiosis 1.1. Signaling and indicating processes 1.2. Signification 1.3. Sign manipulation 1.4. Communication 1.5. Conventionalization and the approaches of rhetoric, hermeneutics, and analytic philosophy 2. Roles of interpreters 3. Focal points of pragmatic research 3.1. Pragmatic processes 3.2. Pragmatic signs 3.3. Pragmatic information 3.4. Pragmatic messages 4. Strategies of pragmatic research 4.1. Code-maximalism versus code-minimalism 4.2. Signification-maximalism versus signification-minimalism 4.3. Radical pragmaticism 5. The pragmatics of non-communicative and non-signifying semioses 5.1. Codeless communicative signs 5.2. Codeless non-communicative signs 5.3. Coded natural signs 6. Morris and the Saussurian tradition 7. Selected references
According to Article 1 § 2. of this Handbook, pragmatics studies the conditions an entity must fulfil to be able to interpret signs as rep-
resenting meaning in semiosis. This characterization focuses on interpreters and the ways they must be structured for semiosis to take place. It brings into consideration the relevant physical and chemical properties and the biological equipment characteristic for interpreters as well as any additional tools they might use in order to interpret signs as representing meaning. It requires studying the internal processes of interpreters as well as the external relations they happen to be in, insofar as they influence the interpretation of signs. Since it is not possible to specify these factors without also describing the type of semiosis in which they occur, we devote § 1. to a rudimentary classification of types of semiosis. § 2. then discusses the specialized roles interpreters can take in the various types of semiosis. § 3. characterizes focal points of current pragmatic research, devoting a section each to pragmatic processes in semiosis, to the types of signs that have been called “pragmatic signs”, to pragmatic versus semantic information and to specifically pragmatic messages. § 4. surveys central strategies of pragmatic research applicable to coded communicative signs, and § 5. comple-
220
I. Systematik
ments this presentation by treating the pragmatics of codeless and of non-communicative signs.
1.
Types of semiosis
1.1. Signaling and indicating processes When someone or something takes something as a sign and interprets it as representing something else, a system i responds with behavior r to a stimulus z, which affects i through a medium m. This is what Morris (1938 and 1946) calls “a semiosis” (cf. Art. 5). The stimulus z can be an object, a property, relation, event, or state of affairs. Morris (1938 and 1946) refers to it as a “sign vehicle”. The system i can be a living being (or one of its parts) that is affected by a stimulus from its environment and responds by adjusting its body behavior; it can be a machine (or one of its parts) that changes its performance when it receives information through one of its channels; it can be a social institution (or one of its parts) that reacts to a new situation according to its own rules. Morris restricted his approach to living beings but was highly interested in the possibilities of extending it to machines and institutions (personal communication of August 1975; about machines as interpreters cf. Smythe 1990 and Posner 1993, about institutions as interpreters cf. Posner 1989). The medium m can be any material connection between i and z: the light which gives access to stimulus colors and forms, the air which transmits sound and smell, a liquid which has a taste and a temperature; there may also be direct contact without intervening materials, as when the pressure exerted by an object is sensed. For i to be affected by z, it need not have sophisticated organs of perception such as “the five senses” of humans; the process can be much more primitive, as when microbes react to acid components in the liquid surrounding them by moving away from these components. The attempt to include all media and to cover the interpretation processes of all living beings has been one of the persisting challenges of semiotics (cf. Chapter II, i. e., Art. 5⫺17). The behavior r with which i responds to z can be any change in the state of i which is caused by (and different from) the fact that i is affected by z. Such changes of state are called “interpretants”. They may be body
movements, machine performances or institutional actions. If i is equipped with specialized subsystems for perception and cognition, its response r to z may consist not in an overt performance but in the formation of a belief in a state of affairs d (which may itself be identical with or different from z). Generally we say that in every semiosis z functions as a signal for i to do r; every semiosis therefore is a signaling process. If the interpretant r consists in the formation of a belief in a state of affairs d, we say that z indicates d to i, d is a message indicated to i through z, z is an indicating sign (or indicator), and the semiosis as a whole is a process of indication. Thus if i is an organism and z is the fact of there being a dark area under a tree, z may function as a sign indicating to i that there is a shadow, or that there exists a source of light which throws the shadow, or that the light comes from a certain direction, or that it is cooler there than in the surroundings, etc. These are all possible messages indicated to i through the dark area. Such messages are called “designata” in Morris 1938, “significata” in Morris 1946, and “significations” in Morris 1964 ⫺ with some theoretical modifications to be discussed below in § 3.4. Let us now suppose that the organism i in the above example moves into the shadow. The semiotic concepts introduced so far allow two different explanations for this behavior. In the one case, seeing the dark area causes the belief in i that it is cooler there, which in turn causes i to move there. In this case, the dark area under the tree functions as an indicating sign; that it is cooler there is its message; the formation of a belief in this message by i is its interpretant; and the movement is only a further consequence. In the other case, i has an innate tendency or acquired habit of shunning bright light, and perceiving the dark area causes i to move, without any beliefs intervening. In this case the dark area functions only as a signaling sign and it is the movement that is its interpretant. Morris’s conception of the interpretant is similarly broad. Depending on the type of semiosis in question, he takes the interpretant to be an act at one time (cf. Morris 1939: 132 f ⫽ 1971: 416), and the activation of a disposition to act (which includes beliefs) at another time (cf. Morris 1946: 16 ff ⫽ 1971: 93 ff and 1964: 5 f ⫽ 1971: 405 f). In order to explain how such a disposition turns into an act, Morris assumes the organism to be in some stage of a purposive behavior,
4. Pragmatics
e. g., seeking a cool environment (cf. Morris 1946: 51 f ⫽ 1971: 127). In general, organisms take stimuli as indicating signs and postpone overt response when they are in what G. H. Mead (1938: 3 ff) calls “the perception phase” of an action. Such signs are called “designative signs” by Morris. The perception phase is then followed by the working and the consummation phases, within which stimuli are either taken as primitive signals or as indicating signs followed by immediate overt responses (cf. Morris 1964: 3 f ⫽ 1971: 403). 1.2. Signification Whether the interpretant which i produces in the reception of z is the formation of a belief or not, it can be either a unique response (which is not generalizable with respect to any property of z) or it can be a reaction governed by a code (cf. Art. 16). Codes are either innate in organisms, or programmed (into machines), or conventional (in individuals who are members of a group). Codes correlate signifiers with signifieds (cf. Saussure 1916 and Eco 1976), and where they intervene, i takes z as a token of a signifier, and i’s response is a performance of or a belief in a token of the signified. Examples of the functioning of innate and programmed codes are the growth of an organism according to the instructions stored in its chromosomes and governed by the genetic code, and the performance of a computer processing a given input according to its program, which is specified in a programming language. Examples of the functioning of conventional codes are the diagnosis of an illness by a doctor on the basis of a medical symptomatology, the interpretation of a verbal utterance according to the grammatical and lexical rules of a natural language, and the identification of the genre of a piece of music according to the contemporary genre code (cf. Lewis 1969 and Savigny 1983). Where the interpretant is determined by a code (which brings signifiers and signifieds into play), we say that the sign in question is a signifying sign and the semiosis as a whole is a process of signification. As shown by the above examples of the genetic code and of an innate tendency to react, not only indicating signs but also other signaling signs can be signifying. Although Morris does not use the term “code”, he knows Saussure’s (1916) distinction of “langue” (a system of signifiers paired with signifieds) versus “parole” (sign vehicles
221 interpreted as tokens of signifiers paired with signifieds), and he reconstructs it on a behavioral basis (1946: 37 f ⫽ 1971: 115). Instead of distinguishing between signs and signifiers, he claims that signs often belong to sign families, which are “sets of similar sign vehicles which for a given interpreter have the same significata” (1946: 19 f ⫽ 1971: 96). Missing in this approach, however, is a parallel distinction on the side of the significata between signifieds and the tokens thereof occurring in particular semioses ⫺ a distinction which should not be confused with the distinction of signifieds vs referents (“significata” vs “denotata” in the terms of Morris 1946). With this qualification, what is nowadays called “a code” can be taken to be equivalent with what Morris called “a lansign system”: It is “a set of plurisituational signs [sign families] with interpersonal significata common to members of an interpreter family [. . .] and combinable in some ways, but not in others to form compound signs” (1946: 35 f ⫽ 1971: 113). 1.3. Sign manipulation Whether a semiosis contains non-indicating signals or indicating signs, whether it is a process of signification or not, the sign involved can either result from unintended natural processes or it can have been produced by a living system, apparatus, or institution with the intention that it function as a signaling, indicating, or signifying sign for a certain interpreter. Examples are living beings that manipulate other living beings, machines, or institutions, as when a human experimenter puts acid into the water so that certain microbes take it as a signal to move away; or when a chimpanzee in a fight with another chimpanzee produces a body movement so that his partner take it as indicating a further movement (which he then may perform or fail to perform); or when a photographer directs his malfunctioning automatic camera toward the sun because bright light is a signal for it to react with the short shutter time he needs; or when a conscript commits selfmutilation so that the army take the state of his body as indicating unsuitability for military service; or when a murderer leaves a forged letter near the victim’s corpse so that it will signify to the law court that the victim committed suicide. In each of these cases we have to distinguish two interpreters with different roles: a sign producer (the human experimenter, chimpanzee, photographer, con-
222 script, murderer) who intends a sign to be a cause for an interpretant behavior in a certain interpreter; and a recipient who is affected by the sign and responds with his interpretant behavior (which may correspond to what the sign producer intended or not). Where there is intentional sign production, we say that the sign in question is a manipulating sign and the semiosis as a whole is a process of sign manipulation. Morris (1946) paid much attention to the difference between the coded significata of signs and their use, i. e., their “production […] as means-objects to accomplish some end” (1946: 96 f ⫽ 1971: 176). Taking as a guide Mead’s segmentation of action into the perception phase, working phase, and consummation phase, Morris distinguishes three modes of signifying: 1. Signs that convey information (therefore being particularly appropriate in the perception phase of a recipient’s action) are called “designative signs”; an example is a sentence such as: “Today, there is a steady westerly wind.” 2. Signs that incite a way of acting (therefore being particularly appropriate in the working phase of the recipient’s action) are called “prescriptive signs”; an example is the sentence: “Keep ahead of the wind!” 3. Signs that induce a valuation (and are therefore particularly appropriate in the consummation phase of a recipient’s action) are called “appraisive signs”; an example is the sentence: “What a wonderful wind!” The context of action within which an interpreter receives a sign may influence his interpretant behavior, but it leaves the sign’s signified unmodified. Coded signs change their significatum neither according to the phase of action the recipient happens to be in while receiving them nor according to the phase of action the sign producer happens to be in while emitting them. But the very fact that such signs have constant significata enables their producers to use them as instruments for their own goals. When a yachtsman in a harbor wakes his friends up in the morning and says to them “Today, there is a steady south-westerly wind of force 8” in order to make them go on a sailing trip with him, he is using a designative sign to incite a way of acting. When a yachtsman on a boat trip where the direction of the boat does not matter, says to the steersman “Keep ahead of the wind!” in order to make him aware of
I. Systematik
the fact that the wind has changed, he uses a prescriptive sign to convey information. When a guest on a sailing boat says “What a wonderful wind!” in order to make his hosts prolong the sailing trip, he uses an appraisive sign to incite a way of acting. Where the use a sign producer makes of a sign differs from its mode of signifying, Morris speaks of “secondary sign use” (1946: 94 f, 116 ⫽ 1971: 174, 193); primary sign use then is the production of designative signs to inform, of prescriptive signs to incite a way of acting, and of appraisive signs to induce a valuation. With these conceptualizations Morris was well ahead of his time in 1946; the distinction of primary and secondary sign use was only taken up two decades later by Jakobson (1960), Gordon and Lakoff (1971), and Searle (1975). 1.4. Communication In the discussion of secondary sign use a point emerged which had been underestimated by Morris: the complexity of intentional relations between sign producer and recipient that are necessary for them to perform what is generally called “communication” (cf. Morris 1946: 37 f, 117 ff ⫽ 1971: 115, 195 ff for his conception of “communization”). (1) In a communication process, the sign producer produces the sign not only with the intention of bringing about a certain interpretant behavior in the recipient, but also with the belief that this behavior will occur if the recipient recognizes that the sign producer produced the sign with this intention (cf. Grice 1957, Strawson 1964, Schiffer 1972, Bach and Harnish 1979, Meggle 1981, Kutschera 1983, Kuroda 1986 and 1989, and Posner 1993). This implies that the sign producer intends to bring about a certain interpretant by making the recipient aware that this is his intention. (2) If the recipient reacts with that interpretant, he does so because he recognizes that the sign producer intends him to do so on the basis of the fact that he recognizes the sign producer’s intention. An example is a standard request such as “Please close the door now”. Here the sign producer believes that the recipient will perform an action just because the sign indicates to him that the sign producer wants him to perform it. Another example is a standard statement such as “It is raining outside”, uttered in a room without access to the outside. Here the sign producer believes that the recipient will form the belief that it is raining outside just because the sign indicates to him that the sign
4. Pragmatics
producer wants him to form that belief. (For other types of speech acts cf. Searle 1969 and 1979: 1⫺29.) Non-linguistic examples of communication in this strict sense are body gestures of primates such as threats and appeasers (cf. Waal 1982), traffic signs (cf. Savigny 1980 and Krampen 1982), as well as house fronts, parades, and other means of self-presentation used by social institutions. Where the sign producer has a complex intention of the type described, we will call him “a sender”, the intended recipient “an addressee”, and the sign “a communicative sign”; if the addressee recognizes this intention, the resulting complex semiosis is called “a process of communication”; if he produces the intended interpretant, then the communication is called “successful”. Once reflexive intentions of the kind introduced are admitted, semiosis can reach unlimited levels of complexity which are restricted only by the interpreter’s internal structure (cf. Parret 1994). One immediate consequence is the ability of the addressee to correct errors, i. e., unintended deviances of the sign event from the sign design, and to complement incomplete signs (cf. Ringbom 1995). When someone says “Please pass the salt”, the coded meaning (i. e., the signified) of this sentence leaves the addressee options such as passing the salt immediately or an hour later. However, when he realizes the speaker’s intention to say something relevant to the present interaction in a meal, he will conclude that he should do it immediately and he will react as if the speaker had said, ”Please pass the salt now”. In this case the addressee takes circumstances of the communication situation as indicating signs that guide his interpretation of the communicative sign. The speaker can rely on such auxiliary sign processes to such a degree that he will anticipate the recognition of his intention by the addressee even on the basis of an incomplete communicative sign (for the concept of reflexive intentions cf., e. g., Harman 1977 and Barwise 1989). The assumption that the speaker intends to say something that is required by the purpose of the present interaction is what Grice (1975) calls “the cooperative principle”. Its validity explains not only the occurrence of corrections and complementations but also of reinterpretations of an utterance that are less straightforward. If at all possible, an utterance is taken as underlyingly cooperative
223 even when its coded meaning violates the cooperative principle (cf. Lakoff 1995). An example is the English sentence “Can you close the door?” It indicates, according to the grammatical and lexical rules of English, that its sender intends its addressee to react by stating whether he is able to close a certain door or not. But it is often uttered in a situation where it is obvious to the speaker that the addressee is able to close the door and where the addressee is aware of this. In this situation the speaker counts on the addressee’s assumption that he did not just want to make a pointless utterance, but to communicate something relevant. In trying to find out what this is, the addressee looks for a possible function of the utterance in the present interaction. He asks himself what would make a question such as “Can you …?” relevant. A possible answer is that it could be a preparation of the request “Please do …”, which would have a good chance of success if uttered after a positive response to the question. Since the addressee knows that the speaker knows that the response would be positive, he can conclude that the speaker wants to draw the addressee’s attention to the possibility of requesting him to close the door. Other mutually known features of the communication situation may function as indicators that confirm or disconfirm such a conclusion. If the door is already closed or if the speaker is known to insist on having discussions in his room with the door open, this would refute the assumption that he wants to prepare a request for closing the door. If that is not so, however, and if the addressee may assume that the speaker regards the topic they are discussing as secret, he can infer that the speaker wants the door closed, which would constitute another condition for a felicitous request. Reasoning of this kind may lead the addressee to interpret the pointless question “Can you close the door?” as an indirect way of making the relevant request “Please close the door”. Such reasoning is normally performed automatically and remains below the threshold of consciousness, but it has to be taken into account if communicative interaction is to be adequately explained. A process of communication where the sender intentionally produces a signifying sign whose signified is different from what he intends to communicate to the addressee is called “indirect communication”. Indirect communication is a special case of what Morris (1946: 94 f, 116 ⫽ 1971:
224 174, 193) calls “secondary sign use”. In secondary sign use the recipient can react to a sign in a way differing from its signified without knowing whether there is a sign producer and, should there be one, what he intends in producing the sign. In indirect communication, however, the recipient reacts to a sign in a way differing from its signified just because he believes that the sign producer intends him to react in this way and wants him to know this. Examples of indirect communication combining the Morrisian modes of signifying with incongruent modes of use are the following: a. Someone who is planning to sail to the other side of a lake and can assume that the people around him know of this plan, asks one of them: “What will the weather be like today?” and receives the answer: “The weather will be excellent today!” Whether or not he adopts this valuation, he will conclude from the fact of its utterance that, in the opinion of the person he is talking with, the weather will provide a fair sky and a steady wind, which are both excellent conditions for sailing. In this case the addressee makes an informative use of the appraisive sign. Similarly, he could have made an informative use of a prescriptive sign in an answer of the type “You should take the big sail today”. b. Someone who plans to go to the other side of a lake and has to decide if he can use his sailing boat or if he needs a motor boat, asks one of the people around him: “How do I get to the Eastern lake shore?” and receives only the answer: “Well, there is a steady westerly wind.” Whether or not he considers this description true, he will conclude from the fact of its utterance that in the opinion of his addressee he should use the sailing boat. He will assume that this message was to be communicated to him. In this case the addressee makes an incitive use of a designative sign. Similarly, he could have made an incitive use of an appraisive sign in an answer of the type “Look, what an excellent wind!” c. Someone who plans to sail to the other side of a lake and can assume that the people around him know of this plan, asks one of them: “Will the weather stay good?” and receives only the answer: “You should take the big sail today!” Whether or not he follows this advice, he will conclude from the fact of its utterance that, in the opinion of his addressee, the weather will stay good. He will assume that this message was to be commu-
I. Systematik
nicated to him. In this case his addressee makes a valuative use of a prescriptive sign. Similarly he could have made a valuative use of a designative sign in an answer of the type “There is a steady westerly wind today”. What is communicated in these examples is not only the signified of the sentences but also a message which differs from it. This makes the cases in question different from the sailor’s examples discussed earlier (§ 1.3.), where only the signified was communicated and the further response was intended by the sign producer without the recipients necessarily being aware of this intention. This shows that language is normally used for communicating a signified, but that this communication can itself serve either to communicate an additional message indirectly or to manipulate the addressee into a further response. In contrast with a widespread prejudice, communication (even in the strong sense of the term) does not rule out manipulation; on the contrary, it can be an effective instrument to accomplish just that. We must reckon with both indirect communication and manipulation through language especially when the signs used are not simple sentences but longer texts or discourses (cf. van Dijk 1985, Vanderveken 1988, and Schiffrin 1994). While the advantage of recipient manipulation for the sign producer is evident the question remains as to what advantage indirect communication has over direct communication. In agreement with Morris one can answer this question by referring to the conclusions of content analysis. It was empirically proven in the 1940s that the interpreter’s behavior depends not only on the purpose of the discourse but also on the dominant mode of a signifying of its constituent signs. The use of a designative discourse for valuative purposes (Morris 1946: 128 ff ⫽ 1971: 208 ff: “fictive discourse”) gives the impression of greater impartiality and is thus in many cases more effective than the use of an appraisive discourse for such purposes. The use of an appraisive discourse for incitive purposes (Morris 1946: 138 f ⫽ 1971: 217 f: “moral discourse”) gives the impression of being less obtrusive and is thus in many cases more persuasive than the use of a prescriptive discourse for such purposes. The use of a prescriptive discourse for informative purposes (Morris 1946: 143 f ⫽ 1971: 221 f: “technological discourse”) gives the impression of being less theoretical and is thus
4. Pragmatics
in many cases more convincing than the use of a designative discourse for such purposes. And so on. (On the criteria for judging the effect of informative, incitive, and valuative sign use, cf. Morris 1946: 94⫺105 ⫽ 1971: 174⫺183.) These conclusions can be further differentiated by determining how the modes of signifying of a discourse’s constituent signs vary in their percentage of distribution (cf. Morris 1946: 74 f, 123 ff ⫽ 1971: 152 f, 203 ff). However, an unsolved problem is still how and to what extent the distribution of modes of signifying in a text ⫺ analyzed independently of its grammatical structure ⫺ influences the recipient’s behavior. Nevertheless, the double characterization of signs according to their modes of signifying and their modes of use has become an efficient instrument for the classification of discourses. Notwithstanding the theoretical and methodological difficulties indicated, this instrument has remained irreplaceable, especially in journalism and media research (cf. Kaplan 1943 and the response in Morris 1946; see also Kaplan and Lasswell 1942, Berelson 1952, Bessler 1970, and Conville 1994). 1.5. Conventionalization and the approaches of rhetoric, hermeneutics, and analytic philosophy Indirect communication often occurs within well-regulated social institutions, because these determine specific features of the communication situation which can function as indicators of how the communicative sign produced by the sender is to be interpreted by the addressee. This has led to conventionalizations of the second degree: Certain ways of expressing a message indirectly have become so common that, instead of taking the expression at face value and going through the whole process of reinterpretation, the addressee expects it as the normal way of expressing the intended message. “Can you pass the salt?”, said during a meal instead of “Please pass me the salt”, and “I am sorry …”, said by a politician in Parliament instead of “I apologize …”, are examples of that kind. They have been studied and classified since Antiquity within the tradition of rhetoric (cf. Perelman 1977, Schreckenberger 1978, Groupe m 1982, Leech 1983, Reboul 1992, and Kienpointner 1995; see also Art. 42, 53, and 67). However, on the basis of modern pragmatic research the approach of rhetoric to make a list of such “rhetorical fig-
225 ures” can be shown to be inadequate: There is an infinite number of possible ways to express a message indirectly. That which can be finitely specified, if at all, is the number of principles followed in the transition between the signified coded meaning and the communicated message. In each indirect communication the addressee has to decide about the specific principles of inference he can use to reconstruct the sender’s intention on the basis of the signified and shared knowledge about the communication situation. A particular case of this problem is the task of hermeneutics (cf. Art. 131), which studies ways of reconstructing the sender’s communicative intentions on the basis of a written text, expecially when the sender has died long ago, his situation of communication and his way of life are no longer known, and only the text is left (cf. Betti 1955, Gadamer 1960, and Ricoeur 1965 and 1969, see also Bleicher 1980). Another academic field which has cultivated discussions and proposals for the explanation of sign-based inference processes in the last decades is analytic philosophy of language (cf. Bach and Harnish 1979 as well as Sperber and Wilson 1986, Burkhardt 1990, Blakemore 1992, and Sbisa` 1995; see also Art. 109). But the problems that are left are still considerable both from the logical and methodological points of view. We will not go into them here; instead we will summarize the rudimentary classification of types of semiosis given so far (for a formalized account see Posner 1993). Something functions as a sign only insofar as it has an interpreter in whom it elicits some interpretant. Therefore all semioses are signaling processes. For some signals the interpretant consists in the formation of a belief in some message. Where this is so, the semiosis is called “an indication” of this message. Some signs are tokens of signifiers which are correlated with signifieds through a code. If so, the semiosis is called “signification”. Some signs are not the result of natural processes but intentionally produced to cause certain interpretants. The resulting semiosis is called “manipulation”. Some manipulating signs are produced with the intention to cause an interpretant by means of a recognition of this intention through the interpreter. The resulting semiosis is called “communication”.
226
I. Systematik
Signaling, indicating, manipulative and communicative signs can, but need not, be signifying. Where someone intentionally produces a communicative sign which signifies something different from what he intends to communicate with it, the semiosis in question is called “indirect communication”.
2.
Roles of interpreters
As pointed out in Article 1, pragmatics was introduced by Morris (1938: 6 ⫽ 1971: 21 and 1939: 133 ⫽ 1971: 416 f) as that branch of semiotics which studies “the relation of sign vehicles to interpreters”. What this relation is depends on the type of semiosis involved, which generates specialized roles of interpreters. For signs of the simplest type, such as signals which trigger involuntary behavior, or indicators which indicate some natural state of affairs (as symptoms indicate the presence of an illness), the interpreter has the role of a recipient who reacts with a certain behavior. In signifying signs the interpretation consists partly or wholly in decoding the signified on the basis of the signifier, of which the sign in question is a token; here the interpreter has the role of a decoder. Where a sign is produced intentionally, there are two types of interpreter, the recipient who responds to the sign in question with an interpretant, and the sign producer who must be able to interpret the sign, since he anticipates the recipient’s response. Where the sign is a signifying sign, the sign producer has the role of an encoder. Where it is a communicative sign, the sign producer intends certain recipients to recognize his intention to make them respond with a certain interpretant. Thus communication implies that the sign producer is identified as a sender and that certain recipients are intended as addressees. In addition, a communicative sign may be interpreted by other recipients who are called “by-standers” when the communication is oral (cf. Goffman 1981, Levinson 1983: 68 and 90, and Clark 1992). But a semiosis may be even more complex, as in telegraphy where the sign produced by the sender passes through intervening stations, e. g., an emitter, a number of transducers and a receiver, before it reaches the addressee. In public communication, further stations, e. g., ghost writers, translators, proof-readers, editors, publishers, distributors, and reciters can be involved (cf. Posner 1985). Each of these may
or may not have a specific intention and may or may not use a recognized code to realize this intention. These examples show that a pragmatic analysis of a given sign may be a very complicated matter (cf. Art. 5 § 3.4.3. Art. 14 § 5. and Art. 17 § 5.3.). But even where there is only one sender and one addressee, as in letter writing, complex processes of interpretation may be involved (cf. Ettl 1984). For the sender the task is to choose an appropriate signifier for the intended message, taking into account the codes known by the addressee, the other letters that have been exchanged so far, the general interests the addressee has, and the background knowledge that may be available to him. For the addressee the task is to identify the signified on the basis of the signifier, taking into account previous letters, the general interest of the sender, and his background knowledge. Such inferences are complicated by the fact that each party tends to make higher level assumptions on what the other assumes in accomplishing his task. A field where the analysis of the complex relation between sign vehicles, senders, and addressees has become especially fruitful in the last decades is the study of literature. Literature may be analyzed as a business that involves the interaction between institutions such as a writer (possibly with a secretary and a team of assistants), a publishing house (including a proof-reading department, and production and public relations sections), a distribution system (including book stores in collaboration with wholesale firms, libraries with acquisition, catalogue and users’ sections as well as book clubs), a network of literary criticism (including, in some cases, state censors, as well as private literary critics who publicize their views in periodicals, broadcasts, and discussion meetings) and, last but not least, ordinary readers (who communicate about books with one another privately or in the context of readings, literary cafes, etc.). Even more interesting is the fact that the real writer of a literary text has to be distinguished from the special role of author which he gives himself in the text, and the real reader has to be distinguished from the special role of addressee which the text imposes on him. Such text-determined roles have been investigated thoroughly in the last decades in terms of the “implied”, “internal”, or “fictional” author (cf. Booth 1961, Stanzel 1964, Janik 1973, Krysinski 1977, Chatman
4. Pragmatics
1978) and the “implied”, “internal”, or “fictional” reader (cf. Iser 1972, Barthes 1973, Link 1976, Eco 1979, de Man 1979, and Culler 1981 and 1982). In ordinary communication the sender has a personal knowledge of his addressee, and if he uses the auditory medium, he can rely on the jointly experienced communication situation to supply indications that will help the addressee infer the intended message from the coded meanings signified by his words. Literary communication, however, tends to separate the sender from his addressee and has increasingly done so in the last centuries. The visual medium enables the sender to produce his signs in a situation different from that of their reception, and while authors formerly used to write for a closed set of addressees, among them the person who commissioned the work and to whom it was explicitly dedicated, they now write for an indefinite number of possible readers. The members of this open set of persons are nonetheless recipients intended by the author and thus deserve to be called “addressees”. But since the author does not know them personally and in most cases will never even know who they are, he is forced to make up for the lack of contextual indications by developing a system of textual indicators that show his readers how to interpret what he has written. He deliberately chooses specific verbal registers, inserts reflections and commentaries about his narrative techniques, alludes to other literary texts that require similar background knowledge and communicative attitudes, and thus makes the text itself indicate to the recipient what kind of sender he is to imagine and what kind of addressee he is supposed to be. When this strategy is successful, the real readers behave as if they were the author’s preferred addressees and they assume the writer to be like the author presented to them in the text. Real communication with literary texts thus becomes guided by the fictional communication implicated in the text. This introjective doubling of the senders and the addressees in literature has been noticed by various modern writers and thinkers (cf. Pagnini 1980 ⫽ 1987: 3). Stephane Mallarme´ declared that “an artist makes himself upon the page”; Paul Vale´ry affirmed that the author is never anyone in reality; Marcel Proust distinguished between the “I” of the writer and the “other I” of the page; Benedetto Croce separated the “practical person”
227 from the “poetic persona”. In earlier times people spoke of a “mask” used by the author, and they described the act of creation as “divine furor”, “enthusiasm”, or “inspiration”, implying that in poetic sign production another spirit slips into the poet’s body and forces him to produce signs that are not his own. A parallel process takes place when the addressee is supposed to be transferred to another landscape, time or mood by his reading the literary text. The greater the difference between the real reader’s character and the one required by the poet’s addressee, and the greater the difference between the real writer and the fictional author presented in the text, the greater the fascination of the reading experience (cf. Sell 1991). There is also a formal correspondence between the fictional author and the fictional addressee. When the writer explicitly introduces himself as author, as in first-person narrative, he can also address the reader explicitly and thereby specify his preferred role (this happens, e. g., in Fielding’s Tom Jones). When the writer steps back behind the reported action and remains anonymous (as, e. g., in Kleist’s novels), the reader can become aware of his preferred role only by implicature (cf. Kemmerling 1991). Special techniques which allow the relation between author and reader to disappear from the text altogether include the writing styles of interior monologue and discours indirect libre (cf. Leech and Short 1981: 318 ff). The reader’s communicative attitudes required for optimal literary communication are usually kept constant in a given text. This is why special effects can be produced when a writer changes them from one paragraph to the next. Laurence Sterne took joy in making the readers of his Tristram Shandy blatantly aware of their reading experience in this way. In the study of literature, there have been many attempts at defining what characterizes literary discourse in general. The introjection of the roles of sender and addressees into the text seems to be one of the few invariants. It is this introjection that enables the interpreter to set up fictional referents in the reading process. And it is this introjection that enables the interpreter to convert any given text into a means of literary reception. Such an approach to the pragmatics of literature was taken explicitly by Pagnini 1980, Segre 1985, and Johansen 1989. It is currently also discussed in musicology and art history.
228
3.
I. Systematik
Focal points of pragmatic research
The formula which specifies the subject matter of pragmatics as “the relation of signs to interpreters” (Morris 1938: 6) has been given various explications in semiotic research. Both the relata and the relationship itself have been understood in a number of ways. As far as “signs” are concerned, the interpretation depends on the general sign conception held by a researcher (cf. Art. 2 § 2.): (a) A “sign” can be understood as the individual object, property, relation, event, or state of affairs that affects the interpreter; in the literature a sign in this sense is also called “sign vehicle”, “sign event”, “sign token”, “utterance”, “occurrence”, “expression matter”, “expression substance”. (b) A “sign” can also be understood as the signifier manifested by a sign in the sense of (a); other terms for signs in this sense are “coded sign”, “sign design”, “sign type”, “sentence”, “expression form”. (c) A “sign” may be taken to be the combination of a sign in the sense of (a) with a message; other terms for signs in this sense are “concrete sign”, “actual sign”, “bi-facial sign”, “sign substance”. (d) A “sign” may be taken to be a combination of a sign in the sense of (b) with a signified; other terms for signs in this sense are “abstract sign”, “coded sign”, “bi-facial sign”, “sign form”. While Saussure (1916) used the term in the sense of (d) and Hjelmslev (1943) in the sense of (c) or (d), Carnap (1939) used it in the sense of (b) and Morris tended to use it in the sense of (a) or (b). In the following we will continue to use it in the sense of (a) (cf. § 1.). But, of course, signifiers, signifieds, and messages will enter our discussion via the signs which manifest the signifiers, carry the signifieds, and convey the messages, respectively. The situation concerning the various conceptions of interpreters and the relationship between signs and interpreters is less easily characterized. What can be generally observed is a tendency toward restrictive understanding of both concepts. Morris himself used to paraphrase his formula with “the relations of signs to their users” (cf. 1938: 29 ⫽ 1971: 43), a formulation which implies signs produced for a purpose and therefore seems to be inapplicable to signals and indicators which are not so pro-
duced (cf. Morris 1946: 93 ff ⫽ 1971: 172 ff). Carnap further restricted the scope of pragmatics to “the action, state and environment of a man who speaks or hears” a verbal sign (1939: 4). It was only later (cf. Carnap 1942, 1954, and 1955) that he explicitly included non-linguistic signs and non-communicative semiosis. Approaches such as those of Morris 1938 and Carnap 1939 make pragmatics part of the theory of human action (cf. Goldman 1970) and focus on speech acts and other ways of intentional signing which rely on the use of codes. Bearing this very special kind of semiosis in mind, analytic philosophers, linguists, anthropologists, sociologists, and psychologists have tended to characterize the task of pragmatics negatively as “the study of meaning insofar as it is not treated by semantics” (cf. Bar-Hillel 1971, Gazdar 1979, and Horn 1988). The idea behind this approach is that semantics describes the meaning signified by signs without reference to interpreters and pragmatics has to study what interpreters do in order to make sense of this meaning in the situations they are in. But there are also those who want to replace this negative delimitation of the subject matter of pragmatics with a positive characterization. They have pursued four different but related lines of research. 3.1. Pragmatic processes Assuming that the relation between sign vehicles and interpreters becomes manifest in the processes which interpreters perform in order to interpret a sign vehicle, one can make these processes the central object of investigation. In contrast to relations, it cannot be assumed that processes are the same for sign producers as for recipients, for senders as for addressees. Take the sender in a communication process: Intending to convey a message to an addressee, he makes sure that he is connected with him by a medium, chooses an appropriate code, and selects from it a signified that approximates the intended message. Since the signified is correlated through the code with a corresponding signifier, the sender then produces a sign vehicle that is a token of this signifier. The addressee, on the other side, perceives the sign vehicle through the medium and takes it as a token of the signifier, which refers him to the signified on the basis of the code. He then reconstructs the message from the signified with the help
229
4. Pragmatics
context
context code
message sender
signified signifier
addressee recipient
sign vehicle medium Fig. 4.1: Components of semiosis. The terms denoting the components whose presence is necessary and sufficient for semiosis to take place are underlined. The left-hand arrow indicates the sequence of choices in the sender, the right-hand arrow that in the addressee.
of indications given by the shared situation (see Fig. 4.1). Such a characterization, although oversimplified, shows that there are two types of processes involved which occur in inverse order, even if they cannot be separated from each other in time (cf. Posner 1980): (1) coderelated sign processing and (2) situation-dependent inferencing (cf. the distinction between character and intension in Kaplan 1989; see also Art. 3 § 5.2.). While the first takes the form of encoding in the sender and decoding in the addressee, the second can only be described as a complex of inference processes some of which occur in sequence, some of which occur simultaneously within one and the same interpreter (cf. Leech 1983, Sperber and Wilson 1986, and Kemmerling 1991). Strictly speaking, all processes involved in sign interpretation must be called “pragmatic” according to the Morrisian formula. But it has become customary to call the situation-dependent inferencing “pragmatic (in the narrow sense)” in order to contrast it with the processes of syntactic and semantic encoding and decoding (see Fig. 4.2). Pragmatic investigations which focus on the situation-dependent inferencing of the sign producer and the recipient usually concentrate on the principles that govern such inferences. Examples from the literature are ⫺ the felicity conditions on speech acts assumed by Austin (1962) and Searle (1969), ⫺ the conversational postulates introduced by Gordon and Lakoff (1971), ⫺ the principle of charity discussed by Davidson (1973 and 1975) and Lewis (1974),
sender interprets (through) sender encodes (in) sender produces (as)
message
signified
signifier
addressee interprets (as) addressee decodes (into) addressee receives (as)
sign vehicle medium Fig. 4.2: Pragmatic processes. The sender interprets the intended message through a signified, encodes the signified in a signifier, and produces the signifier as a sign vehicle. The addressee receives the sign vehicle as a signifier, decodes the signifier into a signified, and interprets the signified as a message. The sender’s and addressee’s interpretation activities are pragmatic processes in the narrow sense.
⫺ the cooperative principle and the conversational maxims formulated by Grice (1975; see § 1.4. above), ⫺ the principle of rationality characterized by Kasher (1976 and 1979), ⫺ the strategy of interactional pessimism described by Labov and Fanshel (1977) and Levinson (1983: 274), ⫺ the principle of transparency discussed by Ossowski (1979), Koj (1979), and Dascal (1983), ⫺ the politeness principle, explored by Leech (1983) and Brown and Levinson (1987), ⫺ the principle of relevance taken as basic by Sperber and Wilson (1986). 3.2. Pragmatic signs While the principles discussed by process-oriented pragmaticians are supposed to function independently of which signs are involved and which messages are communicated on the basis of which types of additional information, one can also focus on these signs, messages, and types of information. Researchers interested in codes such as the natural languages, the constructed languages of logic and artificial intelligence, the painting styles in art, and the rules of harmony in classical European music tend to pay special attention to those kinds of signs which require
230 complex pragmatic processes (in the narrow sense) for their interpretation. This option has been taken up especially by linguists. Suppose we find a bottle in the sea and inside it an English text which reads “Meet me here a week from now with a stick about this big”. The coded meaning of this sentence would be no problem for us, but nevertheless we do not know the message which the sender (if at all) intended to communicate to us (cf. Levinson 1983: 55). The reason is that while we know, on the basis of its lexical meaning, that “me” refers to the sender, we do not know who the sender is. While we know that “here” refers to the place and “now” to the time in which this word was produced, we do not know where and when this was. While we know that “this big” refers to a size that is specified by a gesture, we do not know what that gesture might have been like. This shows that personal pronouns, place and time adverbials, and demonstratives are among the verbal signs that require taking additional indicators in the communication situation into account for their interpretation (cf. Kaplan 1989 and Art. 3 § 5.2.). The need to rely on situational indicators for the interpretation of a sign is not restricted to language. A pointing finger which suggests looking in the direction it is pointing, a horn signal that is produced to draw immediate attention to the car from which it originates, an industrial product that is presented in a shop window in order to entice the onlooker to buy another product of that brand in the shop behind that window, these are all signs which refer to something relative to their own occurrence in time and space. It was Peirce who postulated a special class of signs to account for such examples (cf. Art. 100). He dubbed them “indexical signs“ in 1867 (cf. Peirce C.P. 1.558 ⫽ 1982 ff: II, 50), and Morris followed him in this (cf. Morris 1938: 24 ff ⫽ 1971: 38 ff and 1946: 189 ff ⫽ 1971: 271 ff). Later, other terms came into use such as “egocentric particulars” (Russell), “token-reflexive words” (Reichenbach) and “deictics” (in the wide sense). These terms should not mislead us into assuming that all indexicals function in the same way nor that a given indexical has only one use. An indexical such as the demonstrative adjective “this”, on one hand, can be used to refer to itself or another portion of the more complex sign of which it is a part, as when an author summarizes “this paragraph” or an interviewer expresses his thanks
I. Systematik
for “this interview”. On the other hand, the indexical sign “this” can refer to things which are different from it in character, as when someone says “This room is really a mess”, referring to the room he is in, or when he says “Do not sweep this room, but this one and this one and this one”, using a gesture with each mention of “this”. The first case is what Fillmore (1971) calls “a symbolic usage” while in the second we have “a gestural usage”. Both are called “deictic” in the narrow sense and contrast with the aforementioned non-deictic self-referential usages. Pragmatically most interesting are the gestural deictic usages. As indicated by the given example they can only be interpreted on the basis of an elaborate audio-visual-tactile monitoring of the speech event. Lyons (1977: 637 f) pointed out that “there is much in the structure of languages that can only be explained on the assumption that they have developed for communication in face-to-face interaction”. This observation shows the relevance that one canonical type of situation has acquired as a model for sign use in other types of situation. And this applies not only to sign use, but also to the coded meanings of lexical and grammatical morphemes in natural languages. Indexicals cannot only be classified with respect to what is done to specify their reference in a given situation, but also with respect to the kinds of information on which their reference depends (cf. Kerbrat-Orecchioni 1990⫺92: II, 9 ff and Moeschler and Reboul 1994: ch. 13 ff). Thus one can distinguish ⫺ cotextual indexicals, which encode part of the text structure in which they occur (examples are anaphoric uses of pronouns, sentence connectives, and utterance-initial adverbs such as “anyway”); ⫺ contextual indexicals, which encode the time and place of the sign production and sign reception, the personal roles of the sender and addressee(s) and the formality of the setting; ⫺ object indexicals, which encode special features of third parties dealt with in the sign exchange (examples are expressions such as “His Honor” in English and many of the honorific systems used in South East Asian languages). 3.3. Pragmatic information Instead of focusing on the principles which guide pragmatic inference processes or on the
4. Pragmatics
types of signs which give rise to such processes, one can investigate the types of factual information which the sender draws upon when using such signs and which the addressee relies upon when interpreting them. Is it possible to give a general characterization of the sources of knowledge which the addressee must take into account when he wants to infer the message intended by the sender from the meaning of the sign he produced? Examples of such knowledge have already been given. For cotextual indexicals it becomes accessible by carefully recording the output of the sign production. For contextual indexicals such knowledge can be gained by monitoring the production process itself. For object indexicals, the sources of the relevant knowledge are less easily specified. In natural languages they seem to depend on all that is relevant for the culture of the speech community concerned. Especially important are the social relationships existing between the sender and/or addressee and the persons talked about. These can be determined by kinship relations, totemic relations, clan membership, as well as rank differences in the various types of institutions the society in question has developed. Much use is also made of folk conceptions of psychology which pattern the assumptions tacitly made about the motivations and actions in stories (cf. Parret 1983: 93 ff; see also Morris 1946: 209 ff ⫽ 1971: 269 ff). Although indexicals are by no means the only types of signs whose interpretation requires information in addition to their signified, we can take them as a model for classifying the domains of such information: we are concerned with either ⫺ properties of the cotext or ⫺ properties of the context or ⫺ properties of the situation referred to in the communication. Since the situations referred to can be anything in the world, the delimitation of information that is of potential pragmatic relevance is an impossible task. Information-oriented pragmatics has therefore tended to converge with the ethnography of speaking (cf. Baumann and Sherzer 1974, SavilleTroike 1982, and Fitch and Philipsen 1995), with sociolinguists (cf. Gumperz and Hymes 1972, Mühlhäusler and Harre´ 1990, and Romaine 1995), with the psychology of language (cf. Hörmann 1976 and Levelt 1989),
231 and with anthropology at large (cf. Sweetser 1990). From what was said about the three focal points of pragmatic research, it may have become obvious that they differ greatly with respect to their scientific status. 1. Research in the principles of inference used in communication has resulted in a number of competing explanatory models and has received impulses from the expanding field of cognitive psychology and from artificial intelligence research. However, the generality of these models is endangered by a lack of reliable empirical data and by controversies about their methodological status. 2. Research in the types of pragmatic signs has resulted in a huge corpus of data and minute descriptions but yielded few explanatory generalizations. 3. Research in the sources of knowledge drawn upon in pragmatic processes has resulted in explications of intricate psychological, sociological, and ethnological folk conceptions but tended to treat them as a subject matter in its own right and separate them from their function in communication. With these developments in mind one is inclined to consider the sign- and informationoriented approaches as “substantive pragmatics” and contrast them with the “nonsubstantive pragmatics” of the process-oriented approach. Both directions of pragmatic research are necessary since they complement each other. But it seems that serious theoretical problems lie behind the basic concepts of a “pragmatic sign” and of “pragmatic information”. Reacting against Carnap’s (1942) definitions of “syntactical” and “semantical” sign systems, Morris already warned in 1946 that the way he introduced the terms “pragmatical”, “semantical”, and “syntactical” gives “no warrant for their utilization as a classification of kinds of signs (‘pragmatical signs’, ‘semantical signs’, ‘syntactical signs’); such extension of their signification is questionable, since it may blur the distinction between signs in various modes of signifying and the signs which make up [the metalanguages of] pragmatics, semantics, and syntactics, conceived as the three divisions of semiotic” (1946: 217 f ⫽ 1971: 301 f). Morris would have argued the same way against Montague’s concept of “pragmatic languages” (1968 and 1970). For Morris, every sign has a pragmatic dimension as well as a semantic
232 and syntactic one, and every system that deserves to be called “a language” can and must be desribed within pragmatics as well as semantics and syntactics. Thus one has to be careful not to be misled by the term “pragmatic sign”, even when one uses it in the sense introduced in § 3.2. Similar considerations hold for the concept “pragmatic information”. There is nothing intrinsically pragmatic in the pieces of information that tend to be called “pragmatic information”. Rather, this is a characteristic that pertains to the way such information is used in pragmatic processes (in the narrow sense). Of course, these epistemological caveats do not imply that it may not be useful to investigate which types of signs function prominently in pragmatic processes in the languages of the world, and which information is drawn upon in these processes. Such investigations may result in important empirically based generalizations about natural languages. In theory, however, indexical signs can belong to any syntactic category and can encode every possible information. This makes exclusively sign-oriented pragmatics theoretically uninteresting. For exclusively information-oriented pragmatics the situation is even worse: While the number of syntactic categories in a language is mostly finite or at least denumerable, the number of possible dimensions of reference (so-called “pragmatic indices”) of pragmatic signs is indefinite (cf. Cresswell 1973: 111 ff and Lewis 1979). This leaves the process-oriented approach of inference analysis as the only one that might lead to a general pragmatic theory with explanatory power. 3.4. Pragmatic messages Substantive pragmatics can be characterized as a direction of research that projects the relation between the sign vehicle and the interpreter onto either the signifier or the information used in inferring the message from the signified. But what about the signified itself? It seems to be a core concept of semantics. Nevertheless there have been many attempts to distinguish among the coded meanings of signs components which deserved to be called “core meaning”, “truthfunctional meaning”, or “designatum” from others which were called “emotive”, “expressive”, “interactive”, “instrumental”, or “social meanings” (cf. Art. 3 § 1.1.). Morris also
I. Systematik
attempted such a distinction in 1938, when he wrote: “Semantical rules correlate sign vehicles with other objects; pragmatical rules state the conditions in the interpreters under which the sign vehicle is a sign. [. . .] in some languages there are sign vehicles governed by rules over and above any syntactical or semantical rules which may govern those sign vehicles, and such rules are pragmatical rules. Interjections such as ‘Oh!’, commands such as ‘Come here!’, value terms such as ‘fortunately’, expressions such as ‘Good morning!’, and various rhetorical and poetical devices occur only under certain definite conditions in the users of the language; they may be said to express such conditions, but they do not denote them at the level of semiosis in which they are actually employed in common discourse” (Morris 1938: 35 ⫽ 1971: 48; emphasis R.P.). The question arises why Morris here discusses only utterances of linguistic expressions which have no truth value. He seems to have wanted to reduce non-designative signifieds to interpretants in 1938. This attempt vitiated the otherwise sound distinction between the signified of a sign and its conditions of use, which is also applicable to signs with truth-functional meaning. In his 1946 book Morris extended what he regarded as coded meaning from designata to significata, which allowed not only for designative but also for appraisive and prescriptive signifieds. This enabled Morris to recognize the coded meanings of all examples given in the 1938 quotation as signifieds. However, Morris did not give up the concept of an expressive sign, but applied it to other cases: “[. . .] there is often a close correlation between the production of a certain sign and certain states of the producer of the sign. This correlation may exist with respect to the way the sign is produced as well as with respect to the signification of the sign produced. An excited person may speak with greater intensity, shorter utterances, more rapid speech than a person who is not excited, but equally well he may differ as to what designators he utters and the number and kind of appraisors or prescriptors which he employs. Hence the manner of production of signs and the kinds of signs produced may themselves be to the producer of the sign or to other persons signals [viz., indicators] of the state of the producer of the sign. This is a common situation, and such signs can be called ‘expressive signs’. A sign on this usage
4. Pragmatics
is expressive if the fact of its production is itself a sign to its interpreter of something about the producer of the sign” (Morris 1946: 67 f ⫽ 1971: 146 f). This characterization of expressive signs can be generalized in the formulation: A sign is expressive to the degree to which the fact of its occurrence in a situation is itself a sign indicating a property of the situation. Understood in this way, any coded sign not only signifies but also expresses messages by the fact that it occurs in a given situation. This doctrine, together with the definition of the pragmatic dimension as the relation of sign vehicles to interpreters, made possible a fourth version of pragmatics. According to this approach, every occurrence of a sign indicates which states of affairs are brought about by a felicitous performance of the semiosis in question. The messages indicated in this way are often called “pragmatic messages”. An imperative such as “Come!” signifies the request to come, and the fact of its utterance in a given situation expresses the making of that request. Thus the pragmatic message of uttering this imperative is “the speaker requests someone to come”. A simple sentence such as “Paul closes the door” signifies the statement that Paul closes a certain door at the time of its utterance, and the fact of its utterance expresses that the sender is making that statement, that the sender is presupposing the existence of a person with the name “Paul”, that the sender is thinking of a certain door, that he believes that it was open until a moment ago, etc. According to this approach, these are all pragmatic messages expressed by the speaker in uttering that sentence. Now let us consider an example where not only the way a message is transmitted is pragmatic (as when it is expressed and not signified) but also the message itself is pragmatic (in that it specifies a relation between a sign vehicle and its interpreters). Such a case is the communicative relevance attributed to the constituents of a sentence by its speaker. Compare “That Umberto was elected President is auspicious” with “Umberto was, auspiciously, elected President”. The fact that the speaker encodes his appraisal as a predicate of the main clause and the appraised event as a dependent clause indicates that it is the appraisal which is the main point in the utterance of the first sentence. In the second sentence, the fact that the speaker encodes the event as a main clause and the appraisal
233 as a parenthetic adverbial indicates, by contrast, that the emphasis is on the event and the evaluation is given only concomitantly (cf. Posner 1972: 15 ff and 1982: 88 ff; see also Oh and Dinneen 1979). But what about the speaker uttering “I emphasize that it is auspicious that Umberto was elected President”? Here the message that the speaker emphasizes the evaluation is not expressed but signified. Is it still a pragmatic message? According to the message approach we have to answer this question with both yes and no. It is pragmatic insofar as the message concerns a relation between the sign producer and the sign produced. It is not pragmatic insofar as the message is no longer expressed but signified. This example shows that there are two competing criteria of pragmaticity at work here and we have to decide whether to abandon one or both of them. In accordance with the initial stipulation of § 3., we advocate the following solution: 1. It is always possible for someone to use a language in order to say something about himself or about others present in the situation of communication. This topic as such is not sufficiently different from other topics to be contrasted with them by calling it “pragmatic”. Thus we propose to give up interpreting the formula “relation of sign vehicles to interpreters” as requiring signs that convey a message about the interpreter or other parts of the situation of semiosis. 2. It is always possible that the fact of a sign’s production in a given situation becomes an indicator of something else. But two types of cases must be distinguished here. a. Often the signified of the sign requires reference to the fact of its production in a given situation for its interpretation. This is so in the case of the pointing finger and the honking car-horn, as well as in linguistic indexical expressions and interjections such as “Oh!”. Here the fact of a sign’s production functions as an indicator in the pragmatic process that determines the sign’s intended message. It may therefore be called “a pragmatic indicator with respect to that sign”. b. In other cases the fact of a sign’s production in a given situation indicates things that do not contribute to the interpretation of the message intended by the sign producer. Examples are the inferences drawn on the basis of a person’s linguistic competence, ethnic origin, physical or mental state of health, etc. The drawing of an inference that does not
234
I. Systematik
contribute to the identification of the message intended in producing a sign is not a pragmatic process with respect to that sign. It has to be analyzed as a sign process in its own right: a non-communicative semiosis. And it is evident that in most communication situations, a vast number of non-communicative semioses take place in addition to the communication itself. In conclusion we propose to call only those indicators and their messages “pragmatic” that contribute to the process of interpretation which connects the signified of a given sign with the message intended in its production. Concerning the examples discussed in this paragraph, the proposed criterion excludes the syntactic and lexical means of relevance attribution because they are themselves parts of the signifier. However, it leaves room for all those features of the speaker’s behavior that are not necessary parts of the communicated sign (i. e., of the signifier manifested by it) but can be used to interpret it. Let us now summarize the position arrived at by examining the four focal points of current pragmatic research on signifying communicative semioses: Since it relates sign vehicles to their interpreters, pragmatics studies the interpretant behavior of interpreters. In the case of coded intentional signs, the interpretant can be divided into encoding or decoding behavior on one hand and situationdependent inferencing on the other. The latter, which connects a sign’s signified with the message intended by its producer, may be called “a pragmatic process” in the narrow sense (see Fig. 4.3). context sender interprets (through)
message signified signifier
addressee interprets (as)
sign vehicle medium Fig. 4.3: Pragmatic processes in the narrow sense.
The principles of inference that guide this process may be called “pragmatic principles”. If the sign studied is a complex sign, partial signs which are especially relevant for this
pragmatic process may be called “pragmatic signs” (with the caveat of § 3.3.). The knowledge which is drawn upon in addition to the coded information given through the signifier of the sign studied may be called “pragmatic information”. Other signals and indicators which contribute to the process of interpreting a given sign may be called “pragmatic signals” and “pragmatic indicators” with respect to that sign. The messages of such signals and indicators may be called “pragmatic messages”.
4.
Strategies of pragmatic research
The analysis so far has shown that the semiotician has two theoretical instruments available for his research into sign meaning. One is code theory (cf. Art. 16); the other is the set of pragmatic principles (cf. § 3.1.). This raises the question of how these instruments should be applied in the description of actual semioses within semiotic fieldwork. 4.1. Code-maximalism versus code-minimalism Suppose you are in a foreign country and you want to study its traffic signs. You know which sign posts carry traffic signs and you have isolated signs which show the form of a white passenger car facing you on a blue background. But the signs vary with respect to their overall size (bigger versus smaller versions of what otherwise seems to be the same sign type), their color (dark versus light blue) and the pictograms used (front versus side views; realistic versus highly schematized forms of passenger cars). What are the criteria for you to decide whether these differences signify or not? Or in Morris’s terms: How do you know which of these sign vehicles belong to the same sign family? (1946: 19 f ⫽ 1971: 96) If you cannot ask anyone directly because you do not speak their language, you will have to observe the participants in the traffic, compare situations with signs that differ in the relevant respects and find out whether these differences matter in the behavior of the people. If they matter, these signs are manifestations of different signifiers. If they do not matter, the signs are all manifestations of the same sign type and the differences in size, color, and form are mere variants of some more abstract signifier, to be disregarded in
4. Pragmatics
the semantic description of the code. This procedure and conclusion are an application of the commutation test developed by Hjelmslev (1943: § 14. and 1947 ⫽ 1973: 143 ff) and refined by Prieto (1966: ch. 5), which serves to define the signifier by finding out which variation in the sign form changes the signified (cf. the elimination procedure of the Stoics, described in Art. 40 § 2.2., as an early version of the commutation test). The problem can also take the opposite form: You find the pictogram of a passenger car on a number of traffic signs which differ with respect to the other signs that occur on them. On the blue sign which has a white “P” in addition to the car pictogram, people read the car pictogram as standing for passenger cars. They take the sign as saying “Parking is allowed here only for passenger cars”. On the sign which has a circular red frame and shows a black car pictogram, people read the car pictogram as standing for motor vehicles in general including trucks. They take the sign as saying: “Entering this street is prohibited for motor vehicles”. Here we have variation in the message correlated with tokens of the same signifier. What should we conclude concerning the signified? There are three options:
Fig. 4.4: Pictogram of a car, standing for passenger cars in the parking sign (left-hand side) and for motor vehicles in general in the no-entry sign (right-hand side); cf. Hinweise 1992: 178 and 274.
(a) The car pictogram is ambiguous; it is a signifier with two different signifieds, which come into play in different cotexts. (b) The car pictogram is not ambiguous; it always signifies passenger cars, but the interpreters are expected to generalize from passenger cars to all motor vehicles when they read the no-entry sign. (c) The car pictogram is not ambiguous; it signifies motor vehicles, and the interpreters are expected to specialize motor vehicles into
235 passenger cars when they read the parking sign. Option (a) is that of a “code-maximalist”. He tries to incorporate as much as possible into the code component in his description of the sign system. He may agree that a code with ambiguous signs is not optimal and may hypothesize that there will be a change in the future which introduces two types of pictograms for motor vehicles, one signifying motor vehicles in general, the other one signifying only passenger cars. Options (b) and (c) are those of “codeminimalists”. They try to make as few assumptions about codes as possible and attribute the differences in the people’s behavior to their reasoning on the basis of pragmatic principles (cf. Ducrot 1980 and Cornulier 1985 as well as Moeschler and Reboul 1994: ch. 10). In option (b) they must explain why one would want to delete the semantic feature /for passengers/ when the signified /motor vehicles for passengers/ occurs in the cotext of “Entry prohibited” (for theories of syntactic features cf. Art. 2 § 5. and for theories of semantic features cf. Art. 3 § 4.5.). They could hypothesize the traffic participants reasoning as follows: “If entering the street is forbidden for passenger cars it will also be forbidden for trucks since the sign is intended to minimize molestation by traffic and trucks are even more of a molestation than passenger cars.” Such a reasoning cannot take place in the case of the parking sign because here the difference between cars and trucks has the opposite consequence: “Parked trucks are a more serious obstacle to city life than parked passenger cars and if parking is allowed for passenger cars, it need not be allowed for trucks. Therefore reinterpretation occurs only in the no-entry sign and in the parking sign the car pictogram stands for what it signifies.” In option (c), code-minimalists must explain why one would want to add the content feature /for passengers/ to /motor vehicles/ in the cotext of “Parking allowed”. Such an explanation seems to be harder than that sketched for (b) above, which can be used as an argument in favor of solution (b). 4.2. Signification-maximalism versus signification-minimalism Options (b) and (c) show that code minimalists have to decide whether it is better to cor-
236 relate a given signifier with a rich signified (such as /motor vehicle for passengers/) and devise pragmatic procedures that delete certain of its semantic features on special occasions, or whether it is better to assume only a minimal signified and devise pragmatic procedures that add certain content features on special occasions. The first of these two code-minimalist strategies is called “signification-maximalism” and the second “signification-minimalism”. (For an application of these concepts to the description of verbal signs such as sentence connectives in natural languages cf. Posner 1980: 180 ff. General guidelines for the researcher to decide which parts of the message to attribute to the signified and which to situation-specific reasoning are also given in Grice 1975 and discussed in Levinson 1983: 114 ff.) Maximalist semiotic descriptions differ from minimalist ones in their psychosemiotic consequences. If most of the relevant message is coded, it will be recoverable from memory and need not be constructed on the spot. The consequence is reliable functioning of the communication but lack of flexibility. If little of the relevant message is coded, the interpreter’s memory will not be overburdened, but his reasoning capacity will be occupied in the situation concerned. The message will not become available independently of the communication situation and will be less stereotyped. As a consequence there will be less reliable functioning but more flexibility (cf. Dascal 1983, Kasher 1984, Wilson and Sperber 1986). 4.3. Radical pragmaticism Now code-maximalism and code-minimalism (with the subcases of signification-maximalism and signification-minimalism) are rather moderate positions with respect to the question of what pragmatics can achieve. They assume the working of codes as well as of pragmatic inferences and disagree only when it comes to the question of how big their share is in the process of interpretation. This is why pragmaticians of this position are accused of half-heartedness by the more radical pragmaticists, who do not want to assume any entities such as signifieds in communication (cf. Cole 1981 and Stachowiak 1986: I, xxviii ff). For them communication does not function on the basis of signifiers and signifieds but because the participants remember how previous communication with similar
I. Systematik
signs worked. According to them it is not a code that guides our production and comprehension of communicative signs but our personal histories of communication. Written codifications such as the legal codes of traffic signs and the grammars used in the teaching of foreign languages are external prescriptive or descriptive devices; they cannot be used to explain what goes on in the interpreter during the processes of sign production and comprehension. It is the memory of previous communication (including teaching situations) plus situation-specific reasoning that is claimed to achieve all that is required in communication. Such a position has rarely been adopted by linguists (cf., e. g., Brown 1974 and Rollin 1976), but it determines much of the research conducted in ethnomethodology (Garfinkel 1967 and 1972, Cicourel 1973, Bergmann 1981, and Firth 1995), language acquisition (Vygotsky 1962 and Wertsch 1981), discourse hermeneutics (Bakhtin 1981), dialogue logic (Lorenzen and Lorenz 1978) and philosophical action theory (Wittgenstein 1953, Savigny 1969, Beckermann 1977, Meggle 1977 and 1979, and Allwood 1995). For radical pragmaticists, who tend to link their position with that of American Pragmatism (cf. Morris 1970, Scheffler 1974, Meltzer et al. 1975; see also Cole 1981 and Kleiber 1982), pragmatics is not one of three branches of semiotics but a basic discipline which can also serve to explicate the core notions of syntactics and semantics, as well as of psychology and of sociology: Signifiers are regarded as sign families whose members may change from communication to communication, signifieds as habitual interpretations, psychological attitudes are seen as results of the internalization of communicative roles, social conventions as habitualized practices of communication. Even the forms of logical inference are founded on strategies for winning dialogical arguments. Behind such controversies about the scope of pragmatic explanations lies another important question: What should be the direction of explanation in pragmatics? Morris (1938: 34 ff ⫽ 1971: 47 ff) claimed that pragmatic processes have psychological and sociological components and a physiological basis. Acts of inference are mental acts, conversational maxims are social conventions and the changes of state in the interpreter effected by a pragmatic process have a physiological
4. Pragmatics
aspect. Should one use the methods of physiology, psychology, and sociology to explain the mechanisms at work in the interpretation of signs or should one use pragmatic mechanisms to explain the physiological, psychological, and sociological facts? The first direction of research is called “physiopragmatics”, “psychopragmatics”, and “sociopragmatics”, respectively (cf. Dascal 1983: ch. 1); it has to be distinguished from the pragmatics of physical, mental, and social processes advocated by pragmaticists. In practice, however, a distinction between these two directions of research is possible only insofar as there are methods available that grant independent access to the physiological, psychological, sociological, and pragmatic aspects of the interpretation process (cf. Grundy 1995: 175 ff). And to meet this requirement seems difficult in many cases, if not principally impossible. The conclusion is that we should be tolerant and allow both directions of explanation, but insist that the methodological basis is specified each time (cf. Nerlich 1986).
5.
The pragmatics of noncommunicative and non-signifying semioses
The discussion in § 3. and § 4. of this article concentrated on pragmatic processes in the narrow sense (see Fig. 4.3), i. e., on the interpretation of signifying communicative signs. Thus it might seem that pragmatics studies only semioses that involve communication and signification. What about the other types of semiosis characterized in § 1.? Are they outside the scope of pragmatics? Let us examine the cases one after the other. 5.1. Codeless communicative signs Communication presupposes senders and addressees who are capable of having higher level intentions and beliefs. Codeless communication takes place if such a sender and such an addressee have no history of communication in common and cannot rely on any shared sign system. Situations of this type can be observed when ⫺ humans enter a foreign culture where the way of life and the corresponding “language games” are very different from what they are used to;
237 ⫺ humans meet primates of other species and want to overcome dangerous situations by communication; ⫺ humans intend to communicate messages to each other that seem inexpressable with the codes they have shared so far (think of intimate interaction between lovers which they experience as an exciting adventure because they lack prior means of expression for what they want to convey). Communication without a code rarely occurs for a longer time; if it is successful, it invariably leads to the establishment of sign conventions between the communicators, and often this is its primary purpose. But it would be wrong to project existing sign conventions back into the situations from which they originate. Even where there is a code used in communication, we have to account for the fact that new signifiers are often introduced without explicit definitions, or old signifiers are given new meanings which are comprehended without inquiry and tacitly added to the other signifieds of these signs. Code change often takes place in this way (cf. Art. 17). The examples given illustrate closely related but different cases: Sender and addressee must make a joint effort to achieve tacit agreement about either (1) a new signified for a given signifier, (2) a new signifier for a given signified, (3) a message for a sign without any signifier and signified intervening. This effort must be made without using a metacode. In cases (1) and (2) the addressee can take parts of a given code into account and base his inferences on shared knowledge about them. This is excluded in (3), which therefore is the most difficult case. Here the addressee has to find out which part of the sender’s behavior is intended as a sign and infer the intended message directly on the basis of the available non-communicative signals and indicators. If he succeeds, he does so by making assumptions on the purpose of the communication and the principles of action followed by the sender. Thus it seems that the general strategies used in achieving agreement about the message of an uncoded sign do not differ from those used within pragmatic processes in the narrow sense as discussed in § 3. and § 4. (cf. Fig. 4.5):
238
I. Systematik
context sender interprets (through)
message sign vehicle
addressee interprets (as)
medium Fig. 4.5: The interpretation of codeless communicative signs.
5.2. Codeless non-communicative signs If we leave sign production for manipulatory purposes aside, non-communicative semiosis is restricted to natural signals and indicators. Slightly modifying the examples discussed in § 1.1., we can assume that indication occurs, e. g., in the following cases: ⫺ The fact that the sun is shining indicates to someone that there are shadows under the trees. ⫺ The fact that there is a shadow under a given tree indicates to someone that the sun is shining. ⫺ The fact that pedestrians cross the main street indicates to a driver in the side street that there is no fast traffic on the main street. Here not only signifiers and signifieds are lacking, but there are also no senders. Interpretation is a matter of the recipient only, and he has to reason without recourse to a sender’s purpose or principles of action. Nevertheless his reasoning is not totally without basis. He can again rely on other signals and indicators and also take into account his knowledge of natural laws and social habits. Semioticians have tried to classify the types of inferences available in codeless semioses, e. g., by distinguishing ⫺ the inference from a manifest cause to a non-manifest effect (sun → shadow), ⫺ the inference from a manifest effect to a non-manifest cause (shadow → sun), ⫺ the inference from a given behavior to the presence of a constellation of circumstances in which it is possible. When such reasoning is repeated in similar situations, it may become habitual, i. e., knowledge-based inference is replaced by code-based comprehension (decoding). But this does not allow us to assume that the code was there in the beginning. If one examines the interpretive reasoning of the recipient in codeless indication, it
seems that all types of inference involved can also occur in the interpretation of communication. Thus we may conclude that the set of inference patterns used in the interpretation of codeless natural indicators is a subset of those applied in the case of communicative signs. Signal behavior as discussed in § 1.1. requires special consideration. In the example of a living being for whom a shadow under a tree functions as a signal to move into it, we excluded mediating beliefs. If such a semiosis takes place, it can only happen on the basis of a tendency to move away from bright light which is either innate or an acquired behavior that was automatized. In both cases we speak of codes. Therefore simple signals are not cases of codeless signs. The result about codeless indicators thus holds for codeless natural signs in general. In the format of Fig. 4.2, the interpretation of codeless natural signs takes the form of Fig. 4.6: context message sign vehicle
recipient interprets (as)
medium Fig. 4.6: The interpretation of codeless natural signs.
5.3. Coded natural signs Whether a code is an innate mechanism or an acquired system of rules, it introduces intermediate steps in the interpretation process that give it more stability and reliability. This is evident in simple natural signals. A human eye that winks when it is irritated (innate response), or a thoughtless driver who puts his foot on the brake when the brake lights in the car immediately in front of him flash (automatized acquired response), both perform predictable reactions. These result from the respective stimulus being received as a signifier which is correlated with a signified that determines a message designed for the situation: The eye must not be moved but covered by the eye-lid; the driver must not steer his car past the front car but only use the brake. The alternative reactions might be more adequate in the situation but they do not happen
239
4. Pragmatics
because the stimulus functions as a signal and not as an indicator. Coded natural indicators leave more room for variation in the subsequent behavior of the recipient, since they do not directly determine actions but beliefs. An example is the trapper who has learned to distinguish among a great many types of animal traces. The differences in size, form and depth of imprint enable him to distinguish at first sight which kind of animal was moving where, when, and with what speed. He knows this without having to go through time-consuming reasoning because the system of animal traces has become a code for him which he follows automatically. But even though a code is functioning here which correlates signifiers with signifieds, there are additional processes necessary for the trapper to cope with a given situation. What is required in the first place is the reception of the rugged ground as sign matter which carries signifiers. And when this has happened and the signifiers are identified and decoded into signifieds, the task is not finished: Animals’ tracks are indexical signs; even when their signified is known, one only knows what they indicate precisely when one knows where they occurred, when, on what kind of soil, and in which type of weather. Taking these circumstances into account and drawing inferences on the basis of them is a typical process of interpretation. In the format of Fig. 4.2, the functioning of coded natural signals and indicators takes the form of Fig. 4.7:
context messages
signified
signifier
recipient interprets (as) recipient decodes (into) recipient receives (as)
sign vehicle medium Fig. 4.7: The interpretation of coded natural signs.
In conclusion we can say that non-signifying and non-communicative semioses pose problems for the recipient that are no different in type from those posed by communicative and signifying signs. Even where there is no reasoning involved, as in natural signals, the sign must be recognized as a signifier and the signified must be transformed into a message in addition to the decoding process. That these additional processes cannot be taken for granted is shown by the errors that tend to happen. What is different from communicative semioses, however, is that there is no procedure for correcting errors other than redundancy, which requires performing the reception of the same signifier in more than one sign vehicle.
6.
Morris and the Saussurian tradition
As this article has shown, the Morrisian theoretical framework shaped pragmatic research in the second half of the 20th century. It is remarkable, however, that the very same research led to the discovery and correction of some basic errors in Morris’s approach to pragmatics: 1. His 1938 publication confused signification with designation; the modes of signifying were reduced to the designative one and nondesignated signifieds were wrongly taken to be interpretants (cf. § 3.4. above). 2. His 1946 publication reduced intention to purposive action; this prevented Morris from accounting for the intricate interplay of intentions and beliefs in communication (cf. § 1.4. above). 3. Both his 1946 and 1964 publications assimilated the signified (“significatum” or “signification”, respectively) to the message of a sign process, even though they distinguished the signifier (“sign family”) from the sign vehicle; this prevented Morris (like Peirce) from adequately analyzing the use of codes in indirect communication (cf. § 1.2. above). 4. In none of his works did Morris provide adequate distinctions between pragmatic relations, pragmatic processes, pragmatic information, and pragmatic messages; this lack of differentiation made the epistemological status of pragmatic research appear unclear at first (cf. § 3. above). As it turned out, the Morrisian approach was flexible enough to absorb the required correc-
240
I. Systematik
tions and to allow generations of scholars to integrate the results of their research. The main purpose of this article was to examine the Morrisian characterization of the subject matter of pragmatics by applying it to the various types of semioses. The concepts used in the classification of semioses were based not on the work of Morris (1938 and 1946) but on that of analytic philosophy (Strawson 1964, Grice 1968, 1975, 1978 and 1982, Searle 1969 and 1979 and Parret 1983) and of the Saussurian tradition in semiotics (Saussure 1916, Hjelmslev 1943 and 1947, Prieto 1966 and 1975 as well as Greimas 1966, 1970⫺83 and Eco 1968, 1976, 1979 and 1990). Thus it may be fitting to formulate the central conclusion of this article explicitly in the terminology of the latter tradition. Hjelmslev distinguishes between ⫺ ⫺ ⫺ ⫺
content matter, content form, expression form, expression matter
in a way that is analogous to our distinction between ⫺ ⫺ ⫺ ⫺
message, signified, signifier, sign vehicle.
these processes are pragmatic processes in the wide sense. The possible ways in which they establish a connection between expression matter and content matter is the subject matter of pragmatics. That it is possible to describe the input and output of pragmatic processes using the terminology of the Saussurian tradition indicates that the Morrisian approach shares many ideas with that of the Saussurian tradition (see also Art. 5, Art. 101, and Art. 113). A theoretical synthesis has proven less difficult than dogmatic adherents of the two schools of thought tend to claim. This should be emphasized without any attempt at assimilating the different empirical methodologies of the two schools: behaviorism and mentalism (cf. Posner 1987: 48, n. 12). Note, however, that it is exactly this difference which current research is attempting to overcome within the framework of cognitive science.
7.
Selected references
Allwood, J. (1995), “Action Theory”. In Verschueren et al. 1995 ff. Anscombre, J.-C. (1983), L’argumentation dans la langue. Brussels: Mardaga.
As argued in § 3.⫺5., not all four components of semiosis are present in all types of semioses, but there is no semiosis without expression matter (sign vehicles) and content matter (messages). This finding can be described by stating that the process leading the sign producer from content matter to expression matter can leave out certain steps, and the same is true for the process leading the recipient from expression matter (sign vehicles) to content matter (messages). In the format of Fig. 4.2, the alternative processes involved can be presented as in Fig. 4.8. Fig. 4.8 can be read as a flow diagram: The arrows leading from one component to another signify processes which take one component as input and the other as output. All
sender
Apel, K. O. (1974), “Zur Idee einer transzendentalen Sprachpragmatik”. In: J. Simon (ed.), Aspekte und Probleme der Sprachphilosophie. Freiburg i. B.: Alber: 282⫺326. Austin, J. L. (1962), How to Do Things with Words. Oxford: Clarendon Press. Bach, K. and R. M. Harnish (1979), Linguistic Communication and Speech Acts. Cambridge MA: The MIT Press. Bakhtin, M. (1981), The Dialogic Imagination. Austin: University of Texas Press. Bar-Hillel, Y. (1954), “Indexical Expressions”. Mind 63: 359⫺379 (Reprinted in Bar-Hillel 1970: 69⫺89). Bar-Hillel Y. (1970), Aspects of Language. Amsterdam: North Holland. Bar-Hillel, Y. (1971), “Out of the Pragmatic Wastebasket”, Lingustic Inquiry 2: 401⫺407.
content matter content form expression form expression matter
Fig. 4.8: The set of possible pragmatic processes.
recipient
4. Pragmatics
241
Bar-Hillel, Y. (ed.) (1971), Pragmatics of Natural Language. Dordrecht: Reidel.
Carnap, R. (1942), Introduction to Semantics. Cambridge MA: Harvard University Press.
Barthes, R. (1973), Le plaisir du texte. Paris: Seuil. English translation by R. Miller: The Pleasure of the Text. New York: Hill and Wang 1977.
Carnap, R. (1954), Einführung in die symbolische Logik, mit besonderer Berücksichtigung ihrer Anwendungen. Vienna: Springer. English translation by W. H. Meyer and J. Wilkinson, Introduction to Symbolic Logic and its Applications. New York: Dover 1958.
Barwise, J. (1989), “On the Model Theory of Common Knowledge”. In: J. Barwise, The Situation in Logic. Stanford CA: Center for the Study of Language and Information: 201⫺220. Bates, E. (1976), Language and Context: The Acquisition of Pragmatics. New York: Academic Press. Baumann, R. and J. Sherzer (eds.) (1974), Explorations in the Ethnography of Speaking. Cambridge, England: Cambridge University Press. Bean, A. (1978), Symbolic and Pragmatic Semantics. Chicago:University of Chicago Press. Beckermann, A. (ed.) (1977), Analytische Handlungstheorie II: Handlungserklärungen. Frankfurt/ M.: Suhrkamp.
Carnap, R. (1955), “On Some Concepts of Pragmatics”. Philosophical Studies 6: 89⫺91. Chatman, S. (1978), Story and Discourse: Narrative Structure in Fiction and Film. Ithaca: Cornell University Press. Cicourel, A. V. (1973), Cognitive Sociology, Language and Meaning in Social Interaction. Harmondsworth: Penguin. Clark, H. H. (1992), Arenas of Language Use. Chicago: The University of Chicago Press.
Bennett, J. (1976), Linguistic Behavior. Cambridge, England: Cambridge University Press.
Clark, H. and P. Lucy (1975), “Understanding What is Meant from What is Said. A Study in Conversationally Conveyed Requests”. Journal of Verbal Learning and Verbal Behavior 14: 56⫺72.
Berelson, B. (1952), Content Analysis in Communication Research. Glencoe: Free Press.
Cole, P. (ed.) (1978), Syntax and Semantics 9: Pragmatics. New York: Academic Press.
Berendonner, A. (1981), Ele´ments de pragmatique linguistique. Paris: Minuit.
Cole, P. (ed.) (1981), Radical Pragmatics. New York: Academic Press.
Bergmann, J. (1981), “Ethnomethodologische Konversationsanalyse”. In: P. Schroeder and H. Steger (eds.) (1981), Dialogforschung. Jahrbuch 1980 des Instituts für Deutsche Sprache. Düsseldorf: Schwann: 9⫺51.
Cole, P. and J. L. Morgan (eds.) (1975), Syntax and Semantics 3: Speech Acts. New York: Academic Press.
Bessler, H. (1970), Aussagenanalyse. Bielefeld: Bertelsmann. Betti, E. (1955), Teoria generale della interpretazione. 2 vols. Istituto di Teoria della Interpretazione presso le Universita` di Roma e di Camerino. Milan: Giuffre`. Blackburn, S. (ed.) (1975), Meaning, Reference, and Necessity. Cambridge, England: Cambridge University Press. Blakemore, D. (1992), Understanding Utterances. An Introduction to Pragmatics. Oxford: Blackwell. Bleicher, J. (1980), Contemporary Hermeneutics. Hermeneutics as Method, Philosophy, and Critique. London: Routledge and Kegan Paul. Booth, W. C. (1961), The Rhetoric of Fiction. Chicago: The University of Chicago Press. Brown, C. H. (1974), Wittgensteinian Linguistics. The Hague and Paris: Mouton.
Conville, R. L. (ed.) (1994), Uses of “Structure” in Communication Studies. Westport CT: Praeger. Cornulier, B. de (1985), Effets de sens. Paris: Minuit. Cresswell, M. (1973), Logics and Languages. London: Methuen. Culler, J. (1981), The Pursuit of Signs: Semiotics, Literature, Deconstruction. Ithaca: Cornell University Press. Culler, J. (1982), On Deconstruction. Theory and Criticism after Structuralism. Ithaca: Cornell University Press. Dascal, M. (1983), Pragmatics and the Philosophy of Mind. Amsterdam: Benjamins. Davidson, D. (1973), “Radical Interpretation”. Dialectica 27: 313⫺328. Davidson, D. (1975), “Thought and Talk”. In: S. Guttenplan (ed.), Mind and Language: Wolfson College Lectures 1974. Oxford: Oxford University Press: 7⫺24.
Brown, P. and S. C. Levinson (1987), Politeness: Some Universals in Language Use. Cambridge, England: Cambridge University Press.
Davidson, D. and G. Harman (eds.) (1972), Semantics of Natural Language. Dordrecht: Reidel.
Burkhardt, A. (ed.) (1990), Speech Acts, Meaning and Intentions. Berlin and New York: de Gruyter.
Deledalle, G. (1979), The´orie et pratique du signe. Paris: Payot.
Carnap, R. (1939), Foundations of Logic and Mathematics. Chicago: Chicago University Press.
Dijk, T. van (ed.) (1976), Pragmatics of Language and Literature. Amsterdam: North-Holland.
242 Dijk, T. van (ed.) (1985), Handbook of Discourse Analysis. New York: Academic Press. Dretske, F. J. (1981), Knowledge and the Flow of Information. Cambridge MA: The MIT Press. Ducrot, O. (1972), Dire et ne pas dire. Paris: Hermann. Ducrot, O. (1980), Les echelles argumentatives. Paris: Minuit. Ducrot, O. (1984), Le dire et le dit. Paris: Minuit. Eco, U. (1968), La struttura assente. Milan: Bompiani. Eco, U. (1976), A Theory of Semiotics. Bloomington IN: Indiana University Press. Eco, U. (1979), The Role of the Reader. Explorations in the Semiotics of Texts. Bloomington and London: Indiana University Press. Eco, U. (1990), The Limits of Interpretation. Bloomington IN: Indiana University Press. Ettl, S. (1984), Anleitungen zu schriftlicher Kommunikation. Briefsteller von 1880 bis 1980. Tübingen: Niemeyer. Facione, P. A. (1971), The Theory of Meaning as Intention. Ann Arbor MI: University Microfilms. Ferrara, A. (1985), “Pragmatics”. In: T. A. van Dijk (ed.), Handbook of Discourse Analysis. London and New York: Academic Press: II, 137⫺157. Fillmore, C. J. (1971), “Towards a Theory of Deixis”. The PCCLLU Papers (Department of Linguistics, University of Hawaii) 3, 4: 219⫺241. Fillmore, C. J. (1981), “Pragmatics and the Description of Discourse”. In Cole 1981: 143⫺166. Firth, A. (1995), “Ethnomethodology.” In Verschueren et al. 1995 ff. Fitch, K. L. and G. Philipsen (1995), “Ethnography of Speaking”. In Verschueren et al. 1995 ff. Fodor, J. D. (1977), Semantics: Theories of Meaning in Generative Grammar. New York: Crowell. Furberg, M. (1971), Saying and Meaning. Oxford: Blackwell. Gadamer, H.-G. (1960), Wahrheit und Methode. Grundzüge einer philosophischen Hermeneutik. Tübingen: Mohr. Gärdenfors, P. (1993), “The Emergence of Meaning”. Linguistics and Philosophy 16: 285⫺309. Garfinkel, H. (1967), Studies in Ethnomethodology. Englewood Cliffs NJ: Prentice-Hall. Garfinkel, H. (1972), “Remarks on Ethnomethodology”. In Gumperz and Hymes 1972: 309⫺324. Gazdar, G. (1979), Pragmatics: Implicature, Presupposition, Logical Form. New York: Academic Press. Goffman, E. (1981), Forms of Talk. Philadelphia: University of Pennsylvania Press. Goldman, A. I. (1970), A Theory of Human Action. Englewood Cliffs NJ: Prentice-Hall.
I. Systematik Gordon, D. and G. Lakoff (1971), “Conversational Postulates”. Papers from the Seventh Regional Meeting of the Chicago Linguistic Society: 63⫺84 (Reprinted in Cole and Morgan 1975: 83⫺106). Granger, G. (1976), “Syntaxe, se´mantique, pragmatique”. Revue Internationale de Philosophie 30: 376⫺410. Green, C. (1989), Pragmatics and Natural Language Understanding. Hillsdale NJ: Lawrence Erlbaum. Greimas, A. J. (1966), Se´mantique structurale: Recherche de me´thode. Paris: Larousse. Greimas, A. J. (1970⫺83), Du sens. 2 vols. Paris: Seuil. Greimas, A. J. and J. Courte´s (1979⫺1986), Se´miotique. Dictionnaire raisonne´ de la the´orie du langage. 2 vols. Paris: Hachette. Grice, H. P. (1957), “Meaning”. Philosophical Review 67 (Reprinted in Strawson 1971: 39⫺48). Grice, H. P. (1968), “Utterer’s Meaning. Sentence Meaning, and Word-Meaning”. Foundations of Language 4: 1⫺18. Grice, H. P. (1975), “Logic and Conversation”. In Cole and Morgan 1975: 41⫺58. Grice, H. P. (1978), “Further Notes on Logic and Conversation”. In Cole 1978: 113⫺128. Grice, H. P. (1981), “Presupposition and Conversational Implicature”. In Cole 1981: 183⫺198. Grice, H. P. (1982), “Meaning Revisited”. In: N. V. Smith (ed.), Mutual Knowledge. New York: Academic Press: 223⫺264. Groupe m (1982), Rhe´torique ge´ne´rale. Paris: Seuil. Grundy, P. (1995), Doing Pragmatics. London: Arnold. Gumperz, J. J. and D. H. Hymes (eds.) (1972), Directions in Sociolinguistics. New York: Holt, Rinehart and Winston. Harman, G. (1977), “Review of Bennett 1976”. Language 53: 417⫺424. Herrmann, Th. (1972), Sprechen und Situation. Berlin, Heidelberg, and New York: Springer. Hinweise für das Anbringen von Verkehrszeichen und Verkehrseinrichtungen. HAV. Verkehrstechnischer Kommentar. Bonn: Kirschbaum, 9th edition 1992. Hjelmslev, L. (1943), Omkring sprogteoriens grundlaeggelse. Copenhagen: Munksgaard. English translation by F. J. Whitfield: Prolegomena to a Theory of Language. Madison WI: The University of Wisconsin Press 1963. Hjelmslev, L. (1947), “The Basic Structure of Language”. In: L. Hjelmslev (1973), Essais linguistiques II. Copenhagen: Nordisk Sprog- og Kulturforlag: 119⫺153. Hörmann, H. (1976), Meinen und Verstehen. Grundzüge einer psychologischen Semantik. Frank-
4. Pragmatics
243
furt/M.: Suhrkamp. English translation by B. A. Jankowski: To Mean ⫺ To Understand. New York: Springer 1981.
Kleiber, G. (1982), “Les diffe´rentes conceptions de la pragmatique ou pragmatique ou` es-tu?” L’information grammaticale 12: 3⫺8.
Horn, L. R. (1988), “Pragmatic Theory”. In: F. Newmeyer (ed.), Linguistics: The Cambridge Survey. Cambridge, England: Cambridge University Press: I, 113⫺145.
Klibansky, R. (1974), Contemporary Philosophy. Florence: La Nuova Italia.
Iser, W. (1972), Der implizite Leser. Munich: Fink. English translation: The Implied Reader. Baltimore: Johns Hopkins Press.
Koj, L. (1981), “Logical Pragmatics”. In: W. Marciszewski (ed.), Dictionary of Logic as Applied to the Study of Language. The Hague: Nijhoff: 255⫺267.
Jakobson, R. (1960), “Linguistics and Poetics”. In: T. A. Sebeok (ed.), Style in Language. Cambridge MA: The MIT Press: 350⫺377. Janik, D. (1973), Die Kommunikationsstruktur des Erzählwerks. Ein semiologisches Modell. Bebenhausen: Rotsch. Johansen, J. D. (1989), “Zeichen, Text, Semiose und Kontext: Hjelmslev und Peirce”. Zeitschrift für Semiotik 11: 339⫺352. Kaplan, A. (1943), “Content Analysis and the Theory of Signs”. Philosophy of Science 10: 230⫺247. Kaplan, A. and H. D. Lasswell (1942), “The Politically Significant Content of the Press: Coding Procedures”. Journalism Quarterly 19, 1:12. Kaplan, D. (1989), “Demonstratives: An Essay on Semantics, Logic, Metaphysics, and Epistemology of Demonstratives and Other Indexicals”. In: J. Almog, J. Perry, and H. Wettstein (eds.), Themes from Kaplan. Oxford: Oxford University Press: 481⫺566. Kasher, A. (1976), “Conversational Maxims and Rationality”. In: A. Kasher (ed)., Language in Focus: Foundations, Methods, and Systems. Dordrecht: Reidel: 197⫺216. Kasher, A. (1979), “What is a Theory of Use?” In: A. Margalit (ed.), Meaning and Use. Dordrecht: Reidel: 37⫺55. Kasher, A. (1981), “Pragmatics, Semiotics, and Pragmaticism”. In: A. Lange-Seidl (ed.), Zeichenkonstitution. 2 vols. Berlin and New York: de Gruyter: I, 53⫺60. Kasher, A. (1984), “Pragmatics and the Modularity of Mind”. Journal of Pragmatics 8: 539⫺557. Katz, J. J. (1977), Propositional Structure and Illocutionary Force. New York: Crowell. Kemmerling, A. (1991), “Implikatur”. In: A. v. Stechow and D. Wunderlich (eds.), Semantik/Semantics. Berlin and New York: de Gruyter: 319⫺333. Kerbrat-Orecchioni, C. (1990⫺92), Les interactions verbales. Paris: Colin. Kiefer, F. (1978), “Zur Rolle der Pragmatik in der linguistischen Beschreibung”. Die neueren Sprachen 27: 254⫺268. Kienpointner, M. (1995), “Rhetoric”. In Verschueren et al. 1995 ff.
Koj, L. (1979), “The Principle of Transparency and Semantic Antinomies”. In Pelc 1979: 376⫺406.
Krampen, M. (1982), Icons of the Road. The Hague and Paris: Mouton. Krysinski, W. (1977), “The Narrator as a Sayer of the Author”. Strumenti critici 11: 32⫺33, 44⫺89. Kuroda, S.-Y. (1986), “A Formal Theory of Speech Acts”. Linguistics and Philosophy 9: 495⫺524. Kuroda, S.-Y. (1989), “An Explanatory Theory of Communicative Intentions”. Linguistics and Philosophy 12: 655⫺681. Kutschera, F. von (1983), “Remarks on ActionTheoretic Semantics”. Theoretical Linguistics 10: 1⫺11. Labov, W. and D. Fanshel (1977), Therapeutic Discourse: Psychotherapy as Conversation. New York: Academic Press. Lakoff, G. (1995), “Conversational Logic”. In Verschueren et al. 1995 ff. Leech, G. N. (1983), Principles of Pragmatics. London and New York: Longman. Leech, G. N. and M. H. Short (1981), Style in Fiction. A Linguistic Introduction to English Fictional Prose. London and New York: Longman. Levelt, J. M. (1989), Speaking: From Intention to Articulation. Cambridge MA: The MIT Press. Levinson, S. C. (1983), Pragmatics. Cambridge, England: Cambridge University Press. Lewis, D. (1969), Convention. Cambridge MA: The MIT Press. Lewis, D. (1974), “Radical Interpretation”. Synthese 27, 3⫺4: 331⫺344. Lewis, D. (1979), “Scorekeeping in a Language Game”. Journal of Philosophical Logic 8: 339⫺359. Link, H. (1976), Rezeptionsforschung. Eine Einführung in Methoden und Probleme. Stuttgart: Kohlhammer. 2nd edition 1980. Lorenzen, P. and K. Lorenz (1978), Dialogische Logik. Darmstadt: Wissenschaftliche Buchgesellschaft. Lyons, J. (1977), Semantics. 2 vols. Cambridge, England: Cambridge University Press. Man, P. de (1979), Allegories of Reading. Providence RI: Yale University Press. Martin, R. M. (1959), Toward a Systematic Pragmatics. Amsterdam: North-Holland.
244 Mayoral, J. A. (ed.) (1987), Pragmatica de la Communicatio´n Literaria. Madrid: Arco. Mead, G. H. (1938), The Philosophy of the Act. Ed. with introduction by C. W. Morris in cooperation with J. M. Brewster, A. M. Dunham, and D. L. Miller. Chicago and London: The University of Chicago Press. Meggle, G. (1981), Grundbegriffe der Kommunikation. Berlin and New York: de Gruyter.
I. Systematik Oh, C. K. and D. A. Dinneen (eds.) (1979), Syntax and Semantics 11: Presupposition. New York: Academic Press. Oller, J. W. (1972), “On the Relation Between Syntax, Semantics, and Pragmatics”. Linguistics 83: 43⫺55. Ossowski, S. (1979), “An Analysis of the Concept of Sign”. In Pelc 1979: 164⫺177.
Meggle, G. (ed.) (1977), Analytische Handlungstheorie I: Handlungsbeschreibungen. Frankfurt/M.: Suhrkamp.
Pagnini, M. (1980), Pragmatica della letteratura. Palermo: Sellerio. English translation: The Pragmatics of Literature. Bloomington and Indianapolis: Indiana University Press 1987.
Meggle, G. (ed.) (1979), Handlung, Kommunikation, Bedeutung. Frankfurt/M.: Suhrkamp.
Parret, H. (1980), “Les strate´gies pragmatiques”. Communications 32: 50⫺73.
Meltzer, B. N., J. W. Petras, and L. T. Reynolds (eds.) (1975), Symbolic Interactionism: Genesis, Varieties, and Criticism. London and Boston: Routledge and Kegan Paul.
Parret, H. (1981), “The Problem of the Delimitation of Semantics and Pragmatics. Round Table”. Quaderni di Semantica 1: 97⫺134.
Mey, J. (1993), Pragmatics. An Introduction. Oxford: Blackwell. Moeschler, J. and A. Reboul (1994), Dictionnaire encyclope´dique de pragmatique. Paris: Seuil. Montague, R. (1968), “Pragmatics”. In Klibansky 1974: 102⫺121. Montague, R. (1970), “Pragmatics and Intensional Logic”. Synthese 22: 68⫺94 (Reprinted in Montague 1974: 119⫺149).
Parret, H. (1982), “Nouveaux e´le´ments de pragmatique inte´gre´e”. In: Philosophie et Langage: Annales de l’Institut de Philosophie et de Sciences Morales. Brussels: Editions de l’Universite´ de Bruxelles: 61⫺75. Parret, H. (1983), Semiotics and Pragmatics. An Evaluative Comparison of Conceptual Frameworks. Amsterdam: Benjamin. Parret, H. (ed.) (1994), Pretending to Communicate. Berlin and New York: de Gruyter.
Montague, R. (1974), Formal Philosophy: Selected Papers. Ed. R. H. Thomason. New Haven: Yale University Press.
Parret, H. and M. Sbisa` (eds.) (1981), Possibilities and Limitations of Pragmatics. Amsterdam: Benjamins.
Morris, C. W. (1938), Foundations of the Theory of Signs. Chicago: Chicago University Press.
Peirce, C. S. (1931⫺66), Collected Papers. 8 vols. Ed. C. Hartshorne, P. Weiss, and A. W. Burks. Cambridge MA: Harvard University Press (quoted as “C. P.”).
Morris, C. W. (1939), “Aesthetics and the Theory of Signs”. Erkenntnis. Journal of Unified Science 8: 131⫺150. Morris, C. W. (1946), Signs, Language, and Behavior. New York: Prentice-Hall. 2nd edition Braziller 1955.
Peirce, C. S. (1982 ff), Writings of Charles S. Peirce. A Chronological Edition. Ed. M. Fisch et al. 5 vols. so far. Bloomington: Indiana University Press.
Morris, C. W. (1964), Signification and Significance. Cambridge MA: The MIT Press.
Pelc, J. (ed.) (1979), Semiotics in Poland: 1894⫺ 1969. Dordrecht and Boston: Reidel, and Warsaw: PWN ⫺ Polish Scientific Publishers.
Morris, C. W. (1970), The Pragmatic Movement in American Philosophy. New York: Prentice-Hall.
Perelman, C. (1977), L’empire rhe´torique: Rhe´torique et argumentation. Paris: Vrin.
Morris, C. W. (1971), Writings on the General Theory of Signs. Ed. T. A. Sebeok. The Hague: Mouton.
Posner, R. (1972), Theorie des Kommentierens. Eine Grundlagenstudie zur Semantik und Pragmatik. Frankfurt/M.: Athenäum. 2nd edition Wiesbaden: Athenaion 1980.
Mühlhäusler, P. and R. Harre´ (1990), Pronouns and People. Linguistic Construction of Social and Personal Identity. London: Blackwell. Nerlich, B. (1986), La pragmatique: Tradition ou re´volution dans l’histoire de la linguistique franc¸aise? Frankfurt/M.: Lang. Nuyts, J. and J. F. Verschueren (eds.) (1987), A Comprehensive Bibliography of Pragmatics. 4 vols. Amsterdam: Benjamin. Ochs, E. and B. B. Schieffelin (eds.) (1979), Developmental Pragmatics. New York: Academic Press.
Posner, R. (1980), “Semantics and Pragmatics of Sentence Connectives in Natural Language”. In Searle, Kiefer and Bierwisch 1980: 169⫺204. Posner, R. (1982), Rational Discourse and Poetic Communication. Methods of Linguistic, Literary, and Philosophical Analysis. Berlin and New York: Mouton. Posner, R. (1985), “Nonverbale Zeichen in öffentlicher Kommunikation”. Zeitschrift für Semiotik 7: 235⫺272.
4. Pragmatics Posner, R. (1986a), “Charles William Morris: A Summary of His Thought”. In T. A. Sebeok (ed.), Encyclopedic Dictionary of Semiotics. Berlin and New York: Mouton de Gruyter: I, 565⫺571. Posner, R. (1986b), “Syntactics”. In: T. A. Sebeok (ed.), Encyclopedic Dictionary of Semiotics. Berlin and New York: Mouton de Gruyter: II, 1042⫺1061. Posner, R. (1987), “Charles Morris and the Behavioral Foundations of Semiotics”. In: M. Krampen et al. (eds.), Classics of Semiotics. New York and London: Plenum: 23⫺57. Posner, R. (1989), “What is Culture? Toward a Semiotic Explication of Anthropological Concepts”. In: W. A. Koch (ed.), The Nature of Culture. Bochum: Brockmeyer: 240⫺295. Posner, Roland (1993), “Believing, Causing, Intending: The Basis for a Hierarchy of Sign Concepts in the Reconstruction of Communication”. In: R. J. Jorna, B. van Heusden, and R. Posner (eds.), Signs, Search, and Communication: Semiotic Aspects of Artificial Intelligence. Berlin and New York: de Gruyter: 215⫺270. Prieto, L. J. (1966), Messages et signaux. Paris: Presses Universitaires de France. Prieto, L. J. (1975), Pertinence et pratique. Paris: Minuit. Reboul, A. (1992), Rhe´torique et stylistique de la fiction. Nancy: Presses Universitaires de Nancy. Reichenbach, H. (1947), Elements of Symbolic Logic. New York: Macmillan. Ricoeur, P. (1965), History and Truth. Evanston: North-Western University Press. Ricoeur, P. (1969), Le conflit des interpre´tations. Essais d’herme´neutique. Paris: Seuil. English translation: The Conflict of Interpretations. Essays in Hermeneutics. Evanston: North-Western University Press 1974. Ringbom, H. (1995), “Error Analysis”. In Verschueren et al. 1995 ff. Rogers, A., B. Wall, and J. P. Murphy (eds.) (1977), Proceedings of the Texas Conference on Performatives, Presuppositions, and Implicatures. Washington DC: Center for Applied Linguistics. Rollin, B. E. (1976), Natural and Conventional Meaning: An Examination of the Distinction. The Hague and Paris: Mouton. Romaine, S. (1995), “Sociolinguistics”. In Verschueren et al. 1995 ff. Rorty, R. (1982), Consequences of Pragmatism. Minneapolis: University of Minnesota Press. Sadock, J. M. (1978), “On Testing for Conversational Implicature”. In Cole 1978: 281⫺298. Saussure, F. de (1916), Cours de linguistique ge´ne´rale. Ed. C. Bally, A. Sechehaye, and A. Riedlinger. Lausanne and Paris: Payot. English translation by W. Baslein: Course in General Linguistics. New York: Philosophical Library 1959.
245 Savigny, E. v. (1969), Philosophie der normalen Sprache. Frankfurt/M.: Suhrkamp. 2nd edition 1974. Savigny, E. v. (1980), Die Signalsprache der Autofahrer. Munich: Deutscher Taschenbuch Verlag. Savigny, E. v. (1983), Zum Begriff der Sprache: Konvention, Bedeutung, Zeichen. Stuttgart: Reclam. Saville-Troike, M. (1982), The Ethnography of Communication. Oxford: Basil Blackwell. Sayward, C. (1974), “The Received Distinction between Pragmatics, Semantics, and Syntax”. Foundations of Language 11: 97⫺104. Sbisa`, M. (1995), “Analytical Philosophy”. In Verschueren et al. 1995 ff. Scheffler, I. (1974), Four Pragmatists. London: Routledge and Kegan Paul. Schiffer, S. R. (1972), Meaning. Oxford: Clarendon Press. Schiffrin, D. (1994), Approaches to Discourse. Oxford: Blackwell. Schlieben-Lange, B. (1975), Linguistische Pragmatik. Stuttgart: Kohlhammer. Schmid, W. P. (1972), “Die pragmatische Komponente in der Grammatik”. Akademie der Wissenschaften und der Literatur. Abhandlungen der geistes- und sozialwissenschaftlichen Klasse 9 (Mainz): 407⫺424. Schmidt, S. J. (ed.) (1974⫺1976), Pragmatik/Pragmatics. 2 vols. Munich: Fink. Schreckenberger, W. (1978), Rhetorische Semiotik. Freiburg i. B. and Munich: Alber. Searle, J. F. (1969), Speech Acts. Cambridge, England: Cambridge University Press. Searle, J. R. (1975), “Indirect Speech Acts”. In Cole and Morgan 1975: 59⫺82 (Reprinted in Searle 1979: 30⫺57). Searle, J. R. (1979), Expression and Meaning. Cambridge, England: Cambridge University Press. Searle, J. R. (1983), Intentionality. An Essay in the Philosophy of Mind. Cambridge, England: Cambridge University Press. Searle, J. R., F. Kiefer, and M. Bierwisch (eds.) (1980), Speech Act Theory and Pragmatics. Dordrecht: Reidel. Searle, J. R. and D. Vanderveken (1985), Foundations of Illocutionary Logic. Cambridge, England: Cambridge University Press. Segre, C. (1985), Avviamento all’analisi del testo letterario. Turin: Einaudi. English translation by J. Meddemmen: Introduction to the Analysis of the Literary Text. Bloomington: Indiana University Press 1988. Sell, R. (ed.) (1991), Literary Pragmatics. London and New York: Routledge. Smythe, W. E. (1990), “Wie sind Symbole zu interpretieren? Repräsentation bei Frege und Peirce”. Zeitschrift für Semiotik 12: 47⫺62.
246
I. Systematik
Sperber, D. and D. Wilson (1986), Relevance: Communication and Cognition. Oxford: Blackwell. Stachowiak, H. (1986), Pragmatics: A Handbook of Pragmatic Thought. Hamburg: Meiner. Stalnaker, R. C. (1972), “Pragmatics”. In Davidson and Harman 1972: 380⫺397. Stalnaker, R. C. (1984), Inquiry. Cambridge MA: The MIT Press. Stanzel, F. K. (1964), Typische Formen des Romans. Göttingen: Vandenhoeck and Ruprecht.
Verschueren, J. F. and M. Bertuccelli-Papi (eds.) (1987), The Pragmatic Perspective. Amsterdam: Benjamins.
Stickel, G. (ed.) (1984), Pragmatik in der Grammatik. Düsseldorf: Schwann. Strawson, P. F. (1964), “Intention and Convention in Speech Acts”. Philosophical Review 73: 439⫺460. Sweetser, E. (1990), From Etymology to Pragmatics. Metaphorical and Cultural Aspects of Semantic Structure. Cambridge, England: Cambridge University Press. Thomason, R. H. (1977), “Where Pragmatics Fits in”. In Rogers, Wall, and Murphy 1977: 161⫺166.
Walker, R. (1975), “Conversational Implicatures”. In Blackburn 1975: 133⫺181.
Vanderveken, D. (1981), “A Strong Completeness Theorem for Pragmatics”. Zeitschrift für mathematische Logik und Grundlagen der Mathematik 27: 151⫺160. Vanderveken, D. (1988), Les actes du discours. Brussels: Mardaga. Verschueren, J. F. (1981), “The Pragmatics of Text Acts”. Journal of Literary Semantics 10: 10⫺19. Verschueren, J. F. (1987), Pragmatics as a Theory of Linguistic Adaptation. Antwerp: IPrA Working Document. Verschueren, J. F. (ed.) (1978), Pragmatics: An Annotated Bibliography. Amsterdam: Benjamins.
Verschueren, J. F., J.-O. Östman, and J. Blommaert (eds.) (1995 ff.), Handbook of Pragmatics. Amsterdam: Benjamins. Vygotsky, L. S. (1962), Thought and Language. Cambridge MA: The MIT Press. Waal, F. de (1982), Chimpanzee Politics. London: Cape.
Werth, P. (ed.) (1981), Conversation and Discourse. London: Croom Helm. Wertsch, J. V. (ed.) (1981), The Concept of Activity in Soviet Psychology. Armonk NY: Sharpe. Wettstein, H. K. (1984), “How to Bridge the Gap between Meaning and Reference“. Synthese 58: 63⫺84. Wilson, D. and D. Sperber (1986), “Pragmatics and Modularity”. In: A. M. Farley et al. (eds.), The Chicago Linguistic Society Parasession on Pragmatics and Grammatical Theory. Chicago: Chicago Linguistic Society: 67⫺84. Wittgenstein, L. (1953), Philosophische Untersuchungen. Ed. G. Anscombe and R. Rhees. Oxford: Basil Blackwell. Wunderlich, D. (1972a), “Pragmatik, Sprechsituation, Deixis”. Zeitschrift für Literaturwissenschaft und Linguistik 1: 153⫺190. Wunderlich, D. (ed.) (1972b), Linguistische Pragmatik. Frankfurt/M.: Athenäum.
Roland Posner, Berlin (Germany)
II. Gegenstand I: Aspekte der Semiose ⫺ Kanäle, Medien und Kodes General Topics I: Aspects of Semiosis ⫺ Channels, Media, and Codes 5. Models of semiosis 1. Introduction 1.1. Definitions 1.2. The elements postulated for semiosis 1.3. A semiosic matrix 2. Types of semiosis 2.1. Semioses for the extraction of information from the environment 2.2. Semioses for gaining second hand information 3. Semiosis and sign relations 3.1. The difference between semiosis and sign relations 3.2. Historical survey 3.3. Communication models and semiosis 3.4. Complex semioses 4. Function models of semiosis 5. Selected references
1.
Introduction
1.1.
Definitions
1.1.1. The importance of semiosis in semiotics The term “semiosis” dates back to antiquity. In Greek, “semiosis” refers to the occurrence of a sign or the act of its interpretation. In English, “semiosis” translates as “sign process” (cf. Art. 1 § 2., Art. 4, 39, and 40). It was only through Peirce that the term “semiosis” acquired its proper importance in semiotics (cf. Art. 100). For Peirce, a semiosis results from the triadic sign relation: “All dynamical action, or action of brute force, physical or psychical, either takes place between two subjects […] or at any rate is a resultant of such actions between pairs. But by ‘semiosis’ I mean, on the contrary, an action, or influence, which is, or involves, a cooperation of three subjects, such as a sign, its object, and its interpretant, this tri-relative influence not being in any way resolvable into actions between pairs. Shmei¬vsiw in Greek of the Roman period, as early as Cice-
ro’s time, if I remember rightly, meant the action of almost any kind of sign; and my definition confers on anything that so acts the title of a ‘sign’ ” (Peirce CP 5.484). Consequently, for Peirce semiotics (or “semiotic”, as he called it) was “the doctrine of the essential nature and fundamental varieties of possible semiosis” (CP 5.488). Thus Fisch (1978: 41) comes to the conclusion that for Peirce the central notion of semiotics was “semiosis” and not the concept of the “sign”. Morris (1938: 4) likewise considered semiotics (which he also referred to as “semiotic”) to be the science of semiosis: “The properties of being a sign, a designatum, an interpreter, or an interpretant are relational properties which things take on by participating in the functional process of semiosis. Semiotic, then, is not concerned with the study of a particular kind of object, but with ordinary objects in so far (and only in so far) as they participate in semiosis”. And in Signs, Language, and Behavior, Morris (1946 ⫽ 1971: 366) defines semiosis as: “a sign-process, that is, a process in which something is a sign to some organism. It is to be distinguished from semiotic as the study of semiosis. The terms ‘semiosical’ and ‘semiotical’ may be distinguished in a similar way” (cf. Art. 113). Contemporary semioticians, too, take semiosis to be the central issue of semiotics. Thus Eco (1976: 316) calls semiosis the “paramount subject matter” of semiotics (cf. Art. 120). 1.1.2. Semiosis and the search for information The processual characteristic of semiosis consists in living organisms actively seeking information directly from their environment. As a consequence of this search, the objects of the environment take on a direct meaning
248 for the organisms. The objects convey “first hand” information, and in this way, the sign process has its beginnings in the environment before continuing within the organism. However, because of its linguistic tradition (cf. Art. 101 and 117), semiotics has in the past concentrated on semioses serving the transmission of “second hand” experience: in the process of communication, the “sender’s” experiences are passed on to the “receiver” by means of verbal signs. But semioses are not always communication processes nor are they always observable from the outside. 1.1.3. Perspectives From the perspective of an outside observer, processes inside the organism, e. g., parts of semioses, remain inaccessible. From the perspective of an organism, events outside the subject, e. g., certain phases of semioses outside the organism, remain inaccessible. To a participant observer, however, internal phases of semioses are just as accessible as external ones, such that “internal” and “external” perspectives of both object levels can be integrated in a metaperspective (cf. Art. 19 § 5. and Art. 21 § 10.). 1.1.4. Models The title “models of semiosis” indicates that the conceptions of semiosis proposed by various authors are to be compared in the form of models. In the present context, the term “model” will be used neither in the strict sense of model theory (Stachowiak 1965), nor in the sense of mathematical logic (cf. Art. 3 § 4. as well as Suppes 1961). It is rather applied to various attempts at graphically representing the sign process. In particular, socalled process models in the form of flow charts and network diagrams (as they are known from the theory of organization; Wilhelm 1971) are taken into account. Some models of semiosis do not represent the sign process from a general semiotic point of view, i. e., as involving signs of any kind, but are restricted to the linguistic perspective. These models are to be examined here in order to establish the extent to which they may be semiotically generalized. 1.1.5. State description versus process description One difficulty involved in the task attempted here is how to describe a dynamic process. Herbert Simon (1962) distinguished between state descriptions and process descriptions. For him, pictures, plans, most diagrams as
II. Aspekte der Semiose
well as the structural formulas of chemistry are all state descriptions, whereas recipes, differential equations and equations for chemical reactions are process descriptions. A state description cannot simultaneously be used as a process description, nor vice versa. Nevertheless, state descriptions must be translatable into process descriptions (and vice versa). In semiotics, most models represent sign relations and are therefore state descriptions. A process model of semiosis should indicate where the sign process begins, where it ends and in what order it passes through which stages. This is done through a network consisting of nodes that represent the stages and arrows that connect them with one another. Thus a process model more closely resembles a railroad network than a static structure. In the following, those nodes will be pointed out which a flow diagram of semiosis is to contain in order to completely describe a sign process. The necessary and sufficient conditions for something to count as a case of semiosis will be considerably differentiated as compared with other authors (cf., e. g., Art. 2, 3, and 4 of this Handbook). What is lost in stricture, elegance and compactness will, however, be compensated by completeness and an increased comparability between the various semiotic authors. 1.2. The elements postulated for semiosis 1.2.1. Catalogue of the elements and their nomenclature In order to describe a semiosis completely, at least the following 14 elements are necessary, of which those designated by letters in parenthesis are located within the organism of the interpreter: the semiosis as a whole the organism of the interpreter the interpretandum (“signal”) the channel the signifier (the signal represented in the organism) the interpretant the signified (the object represented in the organism) the interpretatum (“object”) the disposition for instrumental behavior the disposition for signaling behavior instrumental behavior signaling behavior external context internal context
Z (O) S Ch (Rs) (I) (Rg) G (Rbg) (Rsg) BG SG C (c)
5. Models of semiosis
This list of elements may be conveniently subdivided into components of the symbolizing and referential parts of a semiosis on the one hand and components of the behavioral part of a semiosis on the other. Divided up accordingly, each element will be briefly defined in the following two sections. 1.2.2.
Components of the symbolizing and referential parts of a semiosis 1.2.2.1. The semiosis as a whole Z The semiosis as whole, designated by “Z”, comprises the entire process, which unfolds in two phases: symbolizing and referential processes on the one hand and behavioral consequences on the other. As a rule, several semioses Z1, Z2, Z3, …, Zn take place in concatenation. 1.2.2.2. The organism of the interpreter (O) Any process of semiosis passes through the living organism (O) of an interpreter (for the inclusion of social groups and machines as interpreters, cf. Art. 4 and 26). An unequivocal model of semiosis should differentiate events outside (O) from those inside (O). 1.2.2.3. The interpretandum S A model of semiosis should also distinguish between the semiosis Z as a whole and the material body of the signal, designated by “S”, which occurs as an episode outside (O). S is to be interpreted during the process of semiosis and is therefore called “the interpretandum”. 1.2.2.4. The channel Ch All interpretanda S must be realized in a channel Ch outside (O). Channels should be understood as material conditions to which the sensory perception of (O) is attuned. The channel Ch in which the interpretandum S materializes is always presupposed. Without some Ch, there cannot be any S (cf. Art. 6⫺15). 1.2.2.5. The signifier (Rs) The receptors located on the surface of (O) have the function of extracting S from Ch and transforming it into an element of that part of the semiosis which unfolds within (O). Other receptors may be located on a deeper level within (O), and may process signals generated within (O). Hence the model of semiosis should differentiate between the interpretandum S and
249 Ch outside (O) and its representation within (O) effectuated by the receptors (cf. Art. 24 § 2.). This distinction was made in the Cours de linguistique ge´ne´rale where the editors of Saussure’s lectures outlined a sign model of Saussure in which one component was called “the signifier” and described as “image” of a (speech) sound (cf. Art. 101). Accordingly, the representation of S within (O) will be called the “signifier (Rs)”. As the signifier is the result of the perception of the signal S through a receptor, the receptor itself need not be mentioned separately in the description which follows. The distinction between the interpretandum S and the signifier (Rs) is important because the material body of a signal is not identical with its factually perceived counterpart: S ⫽ (Rs). A signifier (Rs) may also be defined according to set theory as a set within a universe of signifiers to which variants of the interpretandum S are assigned by a (cognitive) act of classification. 1.2.2.6. The interpretant (I) According to Peirce (CP 8.179) and Morris (1946: 349), the model should contain, within the organism of the interpreter (O), an interpreting agency called “the interpretant (I)”. Where no such interpreting agency is assumed, explicit details about the very central event of semiosis are missing. It is not sufficient, for example, to talk about an “association” between a sign and the object for which it stands. It is the interpretant which “translates”, e. g., the sound image /tri:/, when it is heard by a speaker of English, into the internal representation of a tree within that person (see below, Fig. 5.22). An interpretant may function according to the principle of a biological need, as is the case when a hungry dog reacts to the ringing of a bell by salivating (Pavlov). It may also take the form of an inference of the “if … then” type, as is shown in the proverb “Where there is smoke, there is a fire” (cf. Art. 92 § 2.2.). In other cases the interpretant is a hypothesis by which perceived facts are associated with invisible causes. In communication, the interpretant mostly functions according to a conventional code, as is the case with road signs or language. 1.2.2.7. The signified (Rg) The model should provide, within the organism (O) of the interpreter, a representation (Rg) of the object referred to by the interpretandum S. This representation (Rg) is the
250
II. Aspekte der Semiose
signified which has been characterized by the editors of Saussure’s Cours as the image of an object, e. g., the image of a tree. The signified (Rg) is evoked by the interpretant (I) of a signifier (Rs). It may also be understood according to set theory as a set within the universe of the signifieds, to which objects of a specific type are assigned in the process of interpretation (through a cognitive act of classification on the part of the subject). 1.2.2.8. The interpretatum G The model should include, in analogy to the interpretandum S, an interpretatum G. The signifieds (Rg) are based on these interpretata G located outside the organism (O) of the interpreter. They are called “interpretata” since they are dealt with in the process of interpretation, and it is to them that the semiosis ultimately relates, although they are often “absent” or inaccessible to direct perception. However, interpretata can also be imagined objects, such as “unicorns”, which are only remotely connected to objects existing outside the organism. Theorists variously designate the interpretatum G as “object” (Peirce), “denotatum” (Morris), “referent”, etc. 1.2.3.
Elements of the behavioral consequences of semiosis
1.2.3.1. The disposition for instrumental behavior (Rbg) The description of semiosis would be incomplete if the consequences of the symbolizing and referential interpretation process were left out. A complete model of semiosis should, therefore, also include nodes indicating the consequences of interpretation. Ultimately, the semiosis unfolding within (O) leads to behavioral dispositions taking account of the interpretatum G of semiosis (Morris 1938: 4). These dispositions can be understood as “behavioral projects” or “behavioral anticipations” guiding the effectors in their execution of overt behavior. (Hereafter the term “project” will be used.) Following Tembrock (1971), a distinction is to be made between instrumental and signaling behavior; the model of semiosis should also differentiate between dispositions for both kinds of behavior. A disposition for instrumental behavior taking account of the object G of semiosis and controlling the appropriate effectors is designated by “(Rbg)”.
Examples of such effectors are the legs of animals or humans, which serve the instrumental behavior of either approach or avoidance. 1.2.3.2. The disposition for signaling behavior (Rsg) A disposition for signaling behavior which takes into account G should correspondingly be designated “(Rsg)”. Especially where signs are interpreted through further signs, as postulated in Peirce’s endless chain of signs (CP 2.29, 2.303), signs engender dispositions for generating other signs. A disposition for signaling behavior with regard to an object is an inner project for an outer signal emitted for purposes of communication. As an inner representation of that signal it is practically the same as a signifier, the inner representation of a perceived signal, which is written “(Rs)”. Dispositions for signaling behavior (Rsg) control the effectors that mediate the production of signals. An example of effectors for signaling behavior are the vocal cords serving the emission of speech or singing. To take another example, human hands may serve as effectors for instrumental behavior, as when molding an object, but they may also serve as effectors for signaling behavior, as is the case with gestures. Both types of effectors are implicit in the corresponding behavior dispositions and thus need not to be listed as separate nodes in the description of the semiosic process. 1.2.3.3. (Results of) Overt instrumental behavior BG A semiosis often terminates in overt and perceptible behavior outside (O); it is related to the object G of the semiosis and leaves its traces in different channels. If the overt behavior is instrumental, as in the case of fleeing from a hostile object, it is designated by “BG”. 1.2.3.4. (Results of) Overt signaling behavior SG If the behavior disposition terminates in a signal of communication produced for a receiver, as in the case of a cry or a verbal utterance, it is designated by “SG”. Signaling behavior regarding an object of semiosis has traditionally been the main subject matter of semiotic studies, because it can become an interpretandum in a channel accessible to a receiver. If it is produced to take account of the object G, it may be said to replace that object. As a rule, but not always, semiosis starts
5. Models of semiosis
with a signaling behavior SG containing an interpretandum S. The various authors use different terms for the SG: “sign” (Peirce), “representamen” (Peirce), “sign vehicle” (Morris), “signal” (Prieto), etc. Sometimes it is called the “external signifier” or the “substance” of a sign (Hjelmslev). 1.2.3.5. The external context C Neither the part of a semiosis occurring outside the organism (O) of the interpreter nor that unfolding within (O) take place in a vacuum. Thus, outside the organism, interpretata G are surrounded by other interpretata, interpretanda S by other interpretanda, channels Ch by other channels, instrumental behavior BG by other instrumental behaviors, and signaling behaviors SG by other signaling behaviors. The totality of the factors surrounding the elements of a semiosis outside the organism (O) is called “external context C”. In fact, every semiosis Z is surrounded by a context consisting of other semioses Z. Any reflection about semiosis must therefore take into account the context outside a given organism (O). There is no semiosis Z without its external context C. The external context can act to support or to hinder a given semiosis Z. 1.2.3.6. The internal context (c) Like the parts of the semiosis taking place outside (O), the segments of the semiosis unfolding inside (O) are surrounded by an inner context, which is designated by “(c)”. Signifiers (Rs) are surrounded by other signifiers, interpretants (I) by other interpretants, signifieds (Rg) by other signifieds, dispositions for instrumental behavior (Rbg) by other such dispositions and the same holds for dispositions for signaling behavior (Rsg). In fact, every part of a semiosis passing through the organism (O) is surrounded by parts of the internal context of the semiosis, all mutually modulating each other and being influenced by the external context C. 1.3. A semiosic matrix If the set of elements of a semiosis postulated so far is complete, the following definition results: A semiosis Z is a process involving a channel Ch with an interpretandum S, which is related to an interpretatum G by being perceived and represented as a signifier (Rs) within the organism (O) of its interpreter; the signifier (Rs) then being mediated by an in-
251 terpretant (I) to connect with the signified (Rg), which represents the interpretatum G within (O). Via the interpretant (I), this process of symbolizing and referring triggers dispositions for instrumental behavior (Rbg) and/or signaling behavior (Rsg); these are both related to the interpretatum G and terminate, via appropriate effectors, in overt instrumental behavior BG or signaling behavior SG, the latter supplying interpretanda for a further process of interpretation. Each semiosis Z is surrounded by other semioses and takes place in a context C external to (O) as well as a context (c) internal to (O). This complex definition may be illustrated graphically by a semiosic matrix which displays the various partial processes. It can be used to discuss the various types of semioses postulated in the history of semiotics (Fig. 5.1). As Fig. 5.1 shows, a semiosis Z starts with a first interpretandum S realized in a channel Ch which stands in an external relationship to an interpretatum G. Between the interpretandum S and the interpretatum G an imputed relation holds: S “stands for” G. S and G are both located outside the organism (O) of the interpreter, whose limits are indicated in the illustration of the semiosic matrix by the two vertical lines on either side of the rhombus that represents the interpretant I. Everything displayed between the two verticals occurs within the organism (O) of the interpreter. When the organism perceives the interpretandum S, it is represented within the organism (O) as a signifier (Rs). Semiotic authors who make no distinction between the interpretandum S and the signifier (Rs) call the segment [S, (Rs)] “a sign”. The semiosis Z as a whole is indicated by the upper horizontal line in Fig. 5.1, which covers both its external context C and its internal one (c). From the signifier (Rs) the semiosis continues its flow via the interpretant (I) (which certain authors call “meaning” or “sense”) to the signified (Rg) and terminates in the interpretatum G outside of (O), which is represented by (Rg) within (O). Authors who do not distinguish between the signified (Rg) and the interpretatum G designate the segment [(Rg), G] variously as “object”, “referent”, “designatum”, “denotatum”, sometimes also as “meaning”, etc. The “symbolization” of the interpretatum G is indicated by the segment [S, (Rs), (I)], the “reference” to G by the segment [(I), (Rg)]. In contrast to the imputed relation of
252
II. Aspekte der Semiose
Fig. 5.1: The semiosic matrix.
S “standing for” G, the segments [S, (Rs), (I)] and [(I), (Rg), G] represent causal relationships of meaning. The dashed line from G via (Rg) to (I) indicates that a G must first have been perceived and stored within the organism (O) before reference to it can be made. In the semiosic matrix (Fig. 5.1), the vertical line on the left indicates the perception phase of semiosis, while the vertical line on the right indicates the behavioral consequences resulting from the semiosis Z. These may take the form of a disposition to an instrumental behavior (Tembrock 1971) which “takes account” of the interpretatum G (Morris 1938: 4). It is designated by “(Rbg)” in the matrix because it comprises projected inner representations of the overt behavior BG being performed outside the organism (O) by means of an effector. Authors designating the segment [(Rbg), BG] as “behavior” do not distinguish between behavior disposition and overt behavior. On the other hand, a semiosis may lead to a disposition for signaling behavior, which is designated in the matrix by “(Rsg)”. It comprises the phase
of projecting an interpretandum SG which is then emitted by means of an effector into a channel Ch outside the organism (O). In the semiosic matrix, the space between the vertical lines on the left and on the right is reserved for the mediating phases of semiosis (called “cognitive” in higher organisms). Since every semiosis takes place both within an external context C and an internal one (c), these contexts are indicated in the matrix by two letters, having one placed outside and the other inside the (O) area.
2. 2.1.
Types of semiosis
Semioses for the extraction of information from the environment 2.1.1. Jakob von Uexküll’s function cycle as a semiosis The most general type of semiosis is the function cycle (cf. Art. 110) according to Jakob von Uexküll (Fig 5.2). It contains the “objective connecting structure” (“Gegengefüge”) G producing the “perceptual cue carrier”
253
5. Models of semiosis
Fig. 5.2: The function cycle after Jakob von Uexküll (cf. Th. von Uexküll 1987: 168).
(“Merkmal”) SG. This is represented within the organism (O) by a “perceptual mark” (“Merkmal”) (Rsg). Depending on the need (I) activated, (Rsg) is translated into an “operational cue carrier” (“Wirkmal”), the behavioral disposition (Rbg), which triggers an action BG inflicting an “action-mark” onto the “connecting structure” G and thus canceling the original “perceptual mark” (“Merkmal”) SG. Within the semiosic matrix, this process Z may be represented as a linear sequence (Fig. 5.3). 2.1.2. Pavlovian conditioning as a semiosis Pavlovian semiosis may be described in two phases. In the first phase, the object G (e. g., food) is perceived, i. e., represented as (Rg) within the organism (O). Through the need (I) of hunger, a behavior disposition (Rbg) is
built up which triggers a behavior BG (e. g., salivation). Hence, the semiosis Z of the first phase proceeds from G via (Rg), (I), and (Rbg) to BG (Fig. 5.4). This phase corresponds to Jakob von Uexküll’s function cycle. In the second phase, parallel to the object G (food), a second object S (e. g., the sound of a bell) is introduced, selected by the experimenter to become a signal “standing for” G (Fig. 5.5). This object, too, is perceived (Rs) but interpreted, through the need (I) of hunger, as (Rg). Thus the same behavioral disposition (Rbg) is generated as in the first phase, triggering the behavior BG (salivation). The second phase of the Pavlovian semiosis therefore comprises the stations SG, (Rs), (I), (Rbg) and BG. 2.1.3. The inference “if … then” as a semiosis A similar process, although somewhat more complicated than the Pavlovian semiosis, takes place during the cognitive inference “if … then”. A first object G1 (e. g., smoke) and a second object G2 (e. g., fire) are perceived at the same time and represented as (Rg1) and (Rg2) within the organism (O). The interpretation (I) of both objects leads to the same behavior disposition (Rbg) which terminates in the behavior BG (e. g., running away). This is the case of two parallel semioses Z1 and Z2 leading up to the same behavior disposition and to the same behavior (Fig. 5.6). In a second phase, the first object G1 may become a signal SG1 (smoke) “standing for”
Fig. 5.3: The function cycle after Jakob von Uexküll, presented within the semiosic matrix.
254
II. Aspekte der Semiose
Fig. 5.4: Pavlov, phase 1.
Fig. 5.5: Pavlov, phase 2.
object G2 (fire), if the inference (I) is drawn “if smoke, then fire” (Fig. 5.7). From this inference, a behavior disposition (Rbg2) may result, which is related to object G2 (fire) and terminates in an appropriate behavior BG2 (e. g., running away). The whole semiosis Z comprises the stages SG1, (Rsg1), (I), (Rbg2), and BG2. The segment [SG1, (Rsg1), (I)] is a symbolizing process. If the segment [(I), (Rg2)] occurs, there is also a referential process directed at G2. The second phase may, however, take a different course if, according to Tembrock’s (1971) proposal, we distinguish between instrumental and signaling behavior (Fig. 5.8).
In this semiosis, too, SG1 (e. g., smoke) is a signal “standing for” G2 (fire), because the inference (I) is drawn, “if smoke, then fire”. From this inference, however, a behavior disposition (Rsg2) may result which likewise refers to the object G2 (fire), but terminates in a signaling behavior SG2 (e. g., shouting /fajr!/). In this case, the semiosis Z comprises the stages SG1, (Rsg1), (I), (Rsg2), and SG2, i. e., the perception and production of a sign. The second phase may again conclude differently whenever the interpretation (I) “if … then” of the signal GS1 (smoke) standing for G2 (fire) terminates via the corresponding behavior dispositions both in an instrumental
255
5. Models of semiosis
Fig. 5.6: Semiosis “if … then”, phase 1.
Fig. 5.7: Semiosis “if … then”, phase 2.
behavior (e. g., running away) and in a signaling behavior (e. g., shouting /fajr!/). If we include the stages of all the sign processes discussed for this case, we arrive at a complete semiosic matrix (Fig. 5.9). 2.1.4. Hypothesis formation as a semiosis The formation of hypotheses, too, takes place in two phases. In the first phase, three objects G1 (e. g., smoke), G2 (fire), and G3 (people) are perceived simultaneously (Fig. 5.10). They are represented within the organism (O) as (Rg1), (Rg2), and (Rg3). The interpretation (I) leads to a common behavior
disposition (Rbg) and finally to a behavior BG which takes account of all three objects (e. g., approach if it is the campfire of one’s own tribe, avoidance if it is the campfire of another tribe). Two parallel semioses, Z1 and Z2, are involved, the first concerning the concomitant occurrences of G1 (smoke) and G2 (fire), the second the presence of G3 (people). Both semioses lead up to the same behavior disposition and behavior. In the second phase, the inference (I) “if … then” makes the object G1 (smoke) a signal SG1 “standing for” G2 (fire) and the hypothesis formation (I) turns it into a signal
256
II. Aspekte der Semiose
Fig. 5.8: Semiosis “if … then”, phase 2, with signaling behavior.
Fig. 5.9: Semiosis “if … then”, phase 2, with instrumental and signaling behavior.
for G3 (people). Depending on whether the hypothesis is “friend” or “foe”, a different behavior disposition (Rbg3) and a different overt behavior BG3 (approach or avoidance) result (Fig. 5.11). In the second phase of semiosis Z, the process of hypothesis formation contains the stages SG1, (Rsg1), (I), (Rbg3), and BG3; here [SG1, (Rsg1), (I)] symbolizes G3 and [(I), (Rbg3)] refers to G3. 2.1.5. A “chain of thought” as a semiosis In the examples given so far, the interpretant (I) directly generated a behavior disposition within the organism (O), which developed
into instrumental or signaling behavior outside the organism (O) through its effectors. But a given interpretation could also cause a second interpretation, this causing a third one, etc., until the “chain of thought” finally results in an overt instrumental and/or signaling behavior (Fig. 5.12). Accordingly, SG1 (smoke) via its representation (Rsg1) could lead to a first tentative hypothesis (I1), namely “friend?”. This hypothesis would be cancelled by a second hypothesis (I2), namely “foe!”, and evoke an appropriate behavior disposition (Rbg3). The process involved in recognizing the campfire of an enemy thus terminates, by
257
5. Models of semiosis
Fig. 5.10: Hypothesis formation, phase 1.
Fig. 5.11: Hypothesis formation, phase 2.
means of the effectors, in the behavior BG3 (running away). In this case, the chain of hypotheses with two segments contains the two semioses Z1 and Z2. Z1 includes the stages SG1, (Rsg1), (I1), (Rsg3). Z2 contains the stages (Rsg3), (I2), (Rbg3), BG3. As a rule, a chain of thought consists of more than two segments, e. g., [Z1, Z2, Z3, …, Zn]. Peirce (CP 2.303) writes: A sign “is anything which determines something else (its interpretant) to refer to an object to which itself refers (its object) in the same
way, the interpretant becoming in turn a sign and so on ad infinitum. No doubt, intelligent consciousness must enter into the series. If the series of successive interpretants comes to an end, the sign is thereby rendered imperfect, at least.” 2.2.
Semioses for gaining second hand information 2.2.1. Information through simple codes It has been shown already that interpretation may terminate in instrumental and/or in signaling behavior. In the latter case, a signal
258
II. Aspekte der Semiose
Fig. 5.12: Chain of thought with two hypotheses.
SG is introduced into the channel Ch outside a first organism (OS), and may be perceived by a second organism (OE), represented within it as (Rsg) and interpreted on the basis of a code (Ic). A simple code could require a smoke signal to be produced whenever an enemy is sighted (Fig. 5.13). In this case, the sender (OS) is in perceptual contact (Rg) with the object G (e. g., an enemy). The perception (Rg) is translated, according to a code (Ic), into a disposition for the signaling behavior (Rsg) to produce a smoke signal SG, which is subsequently realized.
Fig. 5.13: Information given by a smoke signal.
The receiver (OE), who is not in perceptual contact with the enemy, perceives the smoke signal SG realized by the sender (OS). The smoke signal SG is represented as (Rsg) within (OE) and is interpreted as the signified (Rg) of the interpretatum G (enemy) according to the code (Ic) common to both (OS) and (OE). Via an appropriate behavior disposition (Rbg), the interpretation (Ic) may result in an instrumental behavior BG (e. g., running away) and, via a disposition to signaling behavior (Rsg), the interpretation (Ic) may lead to the production of a signal SG (e. g., a warning cry); if both dispositions are
5. Models of semiosis
present, (Ic) may bring about both behaviors. In this example, the receiver (OE) is involved in a second hand process and thereby profits from the sender’s (OS) first hand experience. Similar semioses result when animals emit warning signals. The semiosis ZS of the sender (OS) proceeds through the stages G, (Rg), (Ic), (Rsg), and SG. The semiosis ZE of (OE) begins with the final stage of (OS)’s semiosis, i. e., with SG (smoke signal), and proceeds via its representation (Rsg), and via (Ic), (Rsg), and/or (Rbg) to a second SG and/or BG. The semiosis described here would not change in principle even if the code used were more complex, as is, for example, a natural language (cf. Art. 16 and 17). 2.2.2. Injunction using simple codes A similar sign process, but with a different interpretation and other behavioral consequences, results if the sender (OS) interprets his perception (Rg) of an approaching enemy G according to an injunctive code (Ic), emitting, via the disposition to signaling behavior (Rsg), a smoke signal SG meaning “help!” (Fig. 5.14). In this case, the smoke signal SG perceived as (Rsg) by the receiver (OE), is interpreted, according to the code (Ic) agreed upon by the sender (OS) and the receiver (OE), as an injunction to help. This interpretation engenders a behavior disposition (Rbg) to help and, possibly, a corresponding instrumental behavior BG. Here it is not the receiver (OE), but the sender (OS) who profits from the sign
Fig. 5.14: Injunction given by a smoke signal.
259 process. Similar semioses are conceivable for the cries for help emitted by animals. An injunctive semiosis ZS of the sender (OS) passes through the same stages as a semiosis of warning information. At the receiver’s end, the semiosis ZE passes through the stages SG, (Rsg), (Ic), (Rbg), and BG. This type of semiosis does not change in principle if the injunction is given according to a more complex code, e. g., in a natural language. The smoke signal would then be replaced by a cry such as /help!/. 2.2.3. Dialogue A dialogue commences with a sign SGn from a sender (OS), who is in contact with an object G and intends to communicate something about it (Fig. 5.15). The signal SGn is represented as a signifier (Rsgn) within the sender (OS) and interpreted in a (language or) code (Ic). This interpretation leads to the project of a new signal (Rsgn⫹1), which is then realized as SGn⫹1. The receiver (OE) perceives the signal SGn⫹1 as (Rsgn⫹1) and interprets it according to a (language or) code (Ic) in relation to the object G of the communication. The interpretation causes a disposition to respond (Rsgn⫹2), which is realized as a further signal SGn⫹2. The receiver is thus converted into a sender, and the first sender turns into a receiver. The signal SGn⫹2 is perceived by the latter as (Rsgn⫹2) and interpreted in relation to the object of the communication G according to the common (language or) code (Ic). This interpretation prompts a further response
260
II. Aspekte der Semiose
Fig. 5.15: Dialogue.
(Rsgn⫹3), which is sent as signal SGn⫹3. The signal SGn⫹3 causes the roles of the sender and receiver to be changed once again, and the process repeats itself until the signaling behavior comes to a standstill, i. e., when the semiosis terminates in an instrumental behavior. In a dialogue, the semiosis of one partner proceeds from SGn via (Rsgn), (Ic), and (Rsgn⫹1) to SGn⫹1. 2.2.4. Combinations The models described thus far must be taken as short episodes from virtually endless chains of semioses, in which the various types of semiosis are combined with each other. The “if … then” model may, for example, combine with the dialogue model if the semiosis of the former type triggers a signaling behavior. Likewise, within the dialogue model, “chains of thought” may also occur in the organisms of the participants. Hypothesis formation can connect with sending a piece of information or an injunction, etc.
3.
Semiosis and sign relations
3.1. The difference between semiosis and sign relations In the semiosic matrix, semiosis was presented as a process passing through different stations ⫺ like a train in a rail network ⫺ and having behavioral consequences. As mentioned earlier, such a strict process description of semiosis is unusual for the mainstream tradition of semiotics, since many authors are more interested in describing rela-
tionships between the stages of the process, i. e., supplying structural or state descriptions instead of process descriptions. The structure described in these approaches is called “a sign relation”. An n-ary sign relation (for n ⱖ 2) is a subset R of the Cartesian product C1 ⫻ C2 … ⫻ Cn of all sets of element tokens Cm (for 1 ⱕ m ⱕ n) that can enter a semiosis. For instance, often the relation Z between the signifier (Rs) and the signified (Rg) is taken as the paradigm sign relation. In this case we have n ⫽ 2, and C1 is the set of all signifiers (Rs) and C2 that of all signifieds (Rg). Clearly, Z is a subset of the Cartesian product of these two sets. A sign, then, may be defined as a pair from Z or, more generally, as an n-tuple from R. This implies that a sign is either simply a signifier-signified couple ((Rs), (Rg)), or an interpretanduminterpretatum couple (S, G), or a signifierinterpretant-signified triple ((Rs), (I), (Rg)), or an interpretandum-interpretant-interpretatum triple (S, (I), G), or an interpretandum-signifier-signified-interpretatum quadruple (S, (Rs), (Rg), G), or an interpretantum-signifier-interpretant-signified-interpretatum quintuple (S, (Rs), (I), (Rg), G) etc. In what follows, it is demonstrated that the sign relations on which various authors base their definitions of a sign or a sign process can be represented with respect to the semiosic matrix, i. e., their relata can be translated into stages of processes, and these stages be represented as nodes in the semiosic matrix.
5. Models of semiosis
3.2.
Historical survey
3.2.1. A tabular listing of sign relations A historical survey concerning the various nomenclatures of sign relations and their relata, based on the stages of the semiosic matrix, is given in Table 5.1. The table lists the names of semiotic authors, ordered according to central periods in the history of the human sciences, and displays the terms they employed for the relata of a sign. The stages of the semiosic matrix serve as points of reference and thus take the function of a standard for differentiating the various sign models. 3.2.2. Sign relations in Antiquity In Antiquity, the sign relation was called variously “se¯ meı˜on” (by Plato, ca. 429⫺347 B. C.), “see¯˜ ma” (Aristotle, 384⫺322 B. C., and the Stoics), or “o´noma” (Aristotle). The latter term indicates that sign relations were mostly considered in connection with linguistic sign processes. The interpretandum, the material body of the sign, was called “se¯maı˜non” (Plato and the Stoics) or unequivocally “pho¯ne˘ ” (Aristotle). However, no distinction was made between the interpretandum (i. e., the material body of the sign) and the signifier, its representation within the organism. The second relatum of the sign relation (in addition to the interpretandum) was the “se¯maino´menon” (Plato, the Stoics), or the “pa´the¯ma” (Aristotle). This was an instance of the mind within the organism of the interpreter, corresponding to the interpretant of the semiosic matrix. The third relatum was called “pra´gma” (Plato, Aristotle, the Stoics), or “tyncha´non” (the Stoics). It corresponded to the interpretatum, i. e., to a state of affairs outside the organism. Again, no distinction was made between the interpretatum as a material object, and the signified, its representation in the organism of the interpreter. An illustration of the way the authors of Antiquity conceived of the sign relation is given in a passage by Sextus Empiricus (200⫺250 A. D.; Adversus Mathematicos 8,11). He relates that the Stoics maintained “[…] that three things are connected with each other: (1) everything which is covered by language signs [to` se¯maı˜non], (2) the language sign itself [to` se¯maino´menon], and (3) the object or event [to` tyncha´non]”. Sextus further relates that (1) is a sound, that (2)
261 corresponds to the thoughts, and that (3) is a state of affairs outside the thoughts. Hence the triple sign relation of Antiquity corresponds to the sequence [S, (Rs)], (I), [(Rg), G] in the semiosic matrix, where the representations (Rs) and (Rg) within the organism are left out. The sound S is related to the object G by the thought (I). Behavioral consequences of sign production cannot be described in the framework of this “truncated semiosis” (for more details, cf. Art. 39⫺42). 3.2.3. Sign relations in Augustine In the fifth chapter of his Principia Dialecticae, Augustine (354⫺430), too, makes a distinction between three relata which form a meaning only when taken together. The entire triple sign relation he calls “signum”. To the interpretandum corresponds his term “verbum” (sometimes “verbum vocis”, “vox”, or “sonus”), i. e., an expression in a language. The stage of a “sound image” within the organism, i. e., of the signifier, is left out. The second relatum he calls “dicibile” (elsewhere “verbum mentis” or “significatus”); it is “[…] everything which in a word is perceived by the mind rather than by the ear and is kept in the mind.” This is obviously the interpretant of the semiosic matrix. The third relatum is called “res”, a thing which is located outside of the organism of the interpreter. Just like the conception of semiosis in Greek Antiquity, the Augustinian semiosis thus proceeds from “verbum” via “dicibile” to “res”, corresponding in the semiosic matrix to the segments [S, (Rs)], (I), [(Rg), G] minus (Rs) and (Rg). It remains confined to sign relations of the linguistic type; behavioral consequences are not an issue (cf. Art. 40 § 4.1. and Art. 49 § 2.1.). 3.2.4. Sign relations in the Middle Ages In the Middle Ages, the triple sign relation is maintained. The Modists call it “dictio”. To the interpretandum correspond the terms “vox” (the Modists) or “terminus” (William of Occam, 1285⫺1349). A signifier is not considered. The second relatum is labeled “conceptio” (Modists) or “conceptus” (Occam). It is difficult to decide whether this second relatum should be subsumed under the interpretant or the signified of the semiosic matrix, especially as the Grammarians in Scholasticism also employed a quadruple sign relation which contained the relata “significatio” (⫽ interpretant), “conceptus”
Table 5.1: Sign relations, a historical survey of the terminology
262 II.Aspekte der Semiose
5. Models of semiosis
263
(⫽ signified), and “res” (⫽ interpretatum) along with the relatum “vox” (cf. Art. 47⫺52). The semiosis of the mediaeval philosophers, like that of Augustine, proceeds through the segments [S (Rs)], (I), [(Rg), G], where the stages (Rs) and (Rg) are left out. Behavioral consequences or sign production do not feature in the mediaeval model (cf. Art. 52 and 53).
trix. The third relatum was called “Sache” (‘thing’). According to Locke, Wolff, Reimarus, and Lambert a semiosis starts with the “sign” and proceeds via an “idea” or “concept” to a “thing”, i. e., it passes through the segments [S, (Rs)], (I), [(Rg) G], leaving out (Rs) and (Rg). No information is provided on the behavioral consequences of the semiosis (see also Art. 65).
3.2.5. Sign relations in the Age of Enlightenment Important impulses were given to semiotics by John Locke (1632⫺1704). In his classification of the sciences he assigned equal importance to semiotics as he did to the philosophy of nature and ethics. His designation for the sign relation as a whole is “a sign”. The first relatum he calls “word” or “name” ⫺ an indication that also in Locke semiotics is still geared towards language signs. The second relatum is “an idea” or “nominal essence”. It cannot be unequivocally likened to the interpretant, nor to the signified of the semiosic matrix. The third relatum is called “a thing” and corresponds to the interpretatum of the semiosic matrix (cf. Art. 62). In the School of Port Royal (cf. Art. 65), the French rationalists Antoine Arnauld (1612⫺1694), Claude Lancelot (1616⫺1695), and Pierre Nicole (1612⫺1694) develop a mentalistic sign relation. This sign relation as a whole is called “signe”. The two relata are defined as “ide´e de la chose qui repre´sente” (‘idea of the thing which represents’), and “ide´e de la chose repre´sente´e” (‘idea of the thing represented’). These two terms correspond exactly to the signifier and the signified of the semiosic matrix. The semiosis starts with (Rs) and ends in (Rg) without an intermediate stage such as (I). The three German-language semioticians of the Enlightenment period, Christian Wolff (1679⫺1754), Hermann Samuel Reimarus (1694⫺1768), and Johann Heinrich Lambert (1728⫺1777) did not use a special term for the sign relation as a whole (cf. Art. 62 and 63). The term “Zeichen” (‘sign’) was used by them for the interpretandum only, and a signifier did not feature in their model. The second relatum was labeled “Begriff” (Wolff, Reimarus) or “Gedanke” (Lambert), i. e., “concept” or “thought” in English. It does not, however, correspond directly to the interpretant or the signified of the semiosic ma-
3.2.6. Sign relations in philosophy since the 19th century This section describes the concepts of sign relations of certain philosophers who made further contributions to semiotics in the 19th and early 20th centuries (cf. Art. 74 and 77). The very founders of modern semiotics will be reviewed in the section to follow. Of the philosophers of the 19th century, Bernard Bolzano (1781⫺1848) contributed the most voluminous work on semiotics. He did not use a particular term for the sign relation, but treated the interpretandum as a written or oral “Zeichen” (‘sign’). By means of the sign, the “Gegenstand” (‘object’) located outside the organism (i. e., the interpretatum according to the semiosic matrix) is evoked as a “gedachter Gegenstand” (‘object thought’), which corresponds to the signified. Hence in Bolzano the concepts of signifier and interpretant are missing. The semiosis proceeds directly from the signal S to the inner representation of the object (Rg) and to the object G itself. The stages (Rs) and (I) are left out. Gottlob Frege (1849⫺1925), too, used the term “Zeichen” (‘sign’) for the material body of the signal, i. e., the interpretandum. Instead of employing the notion of a signifier he prefered to talk about equiform signs (“gleichgestaltete Zeichen”; Frege 1903: 107) and proposed to equate the Peircean signtype with an equivalence class of equiform signs (“… so können wir alle gleichgestalteten Zeichen zu derselben Klasse rechnen”). As indicated by the terminology, this is a tokentype-distinction rather than a distinction between a physical interpretandum and a psychic signifier. With the one noted exception of “illuminations” (“Färbungen und Beleuchtungen”; Frege 1892: 31), Frege conceived of semiotic terms as signifying objective concepts, which are not to be identified with any psychic entities. “Illuminations”, which are subjective ideas accompanying the use of signs, appear not to be very important to
264 him. The relevant semantic units are his “Sinn” (‘sense’), which is similar to our interpretant (I) ⫺ but, as already mentioned, bears wholly objective character ⫺, and his “Bedeutung” (‘denotation’), i. e., the interpretatum or object in the semiosic matrix. The semiosis takes its course from the interpretandum S directly to the interpretant (I) without the intermediate stage (Rs), and from the (I) directly to the interpretatum G without the intermediate stage (Rg). Corresponding to the distinction between sense and denotation, two sign relations are distinguished by Frege: an expression “denotes” its denotation and it “expresses” its senses. Referring (“Bezeichnen”) is used as a three-term relation: in using an expression, the sender refers to the denotation denoted by that expression: “Ich sage ferner, ein Name drücke aus seinen Sinn and bedeute seine Bedeutung. Ich bezeichne mit dem Namen, was er bedeutet” (“Furthermore, as I use it, a name expresses its sense and denotes its denotation. Employing the name, I refer to that which it denotes”; Frege 1893: 7; cf. Art. 76 and 102). Edmund Husserl (1859⫺1938; cf. Art. 74 and 103) combined the interpretandum with the signifier in his concept of “Ausdruck” (‘expression’), and the interpretant with the signified in his concept of “Bedeutung” (‘meaning’); he called the interpretatum “Gegenstand” (‘object’), “Gedachtes” (‘object thought’), or “Gemeintes” (‘object meant’). In this case, the semiosis passes through the segment [S, (Rs)] via the segment [(I), (Rg)] to the interpretatum G, leaving out distinct concepts of the interpretandum and the interpretant (I). For Ernst Cassirer (1874⫺1945; cf. Art. 74 and 111), the sign relation constituted a “symbolic form” consisting of a “sinnliches Zeichen” (‘perceivable sign’), to be subsumed under the signifier, and its “geistiger Bedeutungsgehalt” (‘mental meaning’), corresponding to the interpretant of the semiosic matrix. The semiosis therefore starts with the perceived signal (Rs) and terminates with the interpretant (I). Rudolf Carnap (1891⫺1970) (cf. Art. 76 and 106) uses the term “designation” for several kinds of sign relations, which may, if needed, be distinguished with a system of superscripts (cf. Carnap 1972: 13). Thus an expression designatese its extension, designatesi its intension, and designatess its sense. Intension and sense are semantic units which are ⫺ except as regards their status as purely ob-
II. Aspekte der Semiose
jective entities ⫺ akin to our signified (Rg); their status is explained in more detail in Art. 3 § 5.1. (intension) and § 5.2. (sense). The extension corresponds to the interpretatum G. According to Carnap, the semiosis thus starts with the interpretandum S and proceeds directly via (Rg) to G without the intermediate stages (Rs) and (I). Charles K. Ogden (1889⫺1957) and Ivor Armstrong Richards (1893⫺1957) developed a sign relation which is frequently mentioned (Ogden and Richards 1923: 11) and consists of three relata (Fig. 5.16). They use the expressions “sign” or “symbol” interchangeably for the interpretandum S, the terms “reference”, “thought” or “mental process” for the interpretant (I), and the expression “referent” for the interpretatum G. According to this model, the semiosis proceeds through the stages S (interpretandum), (I) (interpretant), and G (interpretatum) without the intermediate stages (Rs) and (Rg). The relation between the “symbol” S and the thought, i. e., the interpretant (I), is a causal connection in which S “symbolizes” the interpretatum. It is postulated that this relation must be “correct”. The relation between the thought (I) and the referent G is also conceived as causal. In it, the interpretandum S “refers” to the referent G via the thought (I). This reference must be “adequate”. The (direct) relation between the symbol S and the referent G is not causal but “imputed”; in it the interpretandum S “stands for” the interpretatum G. This imputed relationship must be “true” (cf. Art. 104). Stephan Ullmann (1914⫺1976) took up the triple sign relation of Ogden and Richards in his work (1957: 69 ff). He conceives
Fig. 5.16: The sign relation after Ogden and Richards (1923: 11).
265
5. Models of semiosis
of the interpretandum SG as a “name”. His model does not distinguish between the interpretandum SG and its representation within the organism (O) of the interpreter, i. e., the signifier (Rs). He calls the segment [(I), (Rg)] of the semiosic matrix “sense”, and the interpretatum G “thing” (Fig. 5.17). Here, a semiosis involves the stages [S, (Rs)], [(I), (Rg)], and G. Ullmann designates the relation between name and sense [(I), (RG)] as “meaning”. sense
meaning
name
thing
Fig. 5.17: The sign relation after Ullmann (1957: 66).
3.2.7.
Sign relations in the classics of modern semiotics 3.2.7.1. Charles Sanders Peirce The actual founder of modern semiotics, Charles Sanders Peirce (1839⫺1914), considered the sign relation to be three-sided, or “triadic” to use his own term. He employed the expression “sign” for the entire sign relation as well as for its first relatum, the interpretandum in the semiosic matrix, which he sometimes also called “the representamen”. The second relatum he named “the interpretant”. It corresponds to the interpretant (I) of the semiosic matrix. The third relatum of the triad is “the object” and is to be subsumed under the interpretatum G of the semiosic matrix (cf. Art. 100). Peirce makes a distinction between three pairs of mutually inclusive interpretants: The “emotional” or “immediate” interpretant is a feeling evoked by the representamen. The “energetical” or “dynamical” interpretant is a bodily or mental action triggered by the representamen. It corresponds to the behavioral dispositions (Rbg) and (Rsg) of the semiosic matrix or to a chain of thoughts Z1, Z2, Z3, …, Zn. The “logical” or “final” interpretant consists either in making a habitual connection between a representamen and an object or else in a change of thinking habits. Peirce also makes a distinction between two kinds of objects. The “immediate object”
is the inner representation of the interpretatum, corresponding to the signified (Rg) of the semiosic matrix. The “dynamical object” is located outside the organism of the interpreter and coincides with the interpretatum G of the semiosic matrix. Peirce trichotomizes the relata (cf. CP 2.264). With respect to the representamen SG a sign may be a qualisign, a sinsign (or token) or a legisign (or type); with respect to the object G a sign may be an icon, an index or a symbol; with respect to the interpretant (I) a sign may be a rhema (predicate), a dicent (sentence), or an argument. A sign, according to Peirce, is only described completely if all three levels of the triad are specified. But since the specification of the level of the interpretant constrains the possible specifications of the other two levels, not all specifications of the three levels may occur together. On the basis of this combinatoric restriction ten “main classes of signs” result (Fig. 5.18). The Peircean semiosis is initiated by a dynamical object G (CP 5.473). The representamen SG is set either as an icon, or an index, or a symbol by the interpretant (I). A representation of the representamen within the organism, in the form of a signifier (Rsg), is not provided. There is, however, a representation of the “dynamical object” G within the organism in terms of the “immediate object” (Rg). Moreover Peirce alludes to behavioral consequences (Rbg) or (Rsg) in his concept of the “energetic” or “dynamical” interpretant and in his notion of “semiosis ad infinitum”, i. e., a chain of thought Z1, Z2,
(I)*
(V)
(VIII)
(X)
Rhematic Iconic
Rhematic
Rhematic Symbol
Argument
Iconic Legisign
Qualisign
Symbolic Legisign
Legisign
(II)
(VI)
(IX)
Rhematic
Rhematic Indexical Legisign
Dicent Symbol
Iconic Sinsign
Legisign
(III)
(VII)
Rhematic Indexical Sinsign
Dicent Indexical Legisign (IV)
Dicent Indexical
Sinsign
Fig. 5.18: The ten main sign classes after Peirce.
266
II. Aspekte der Semiose
Fig. 5.19: The model of the sign relation after Morris (1939; cf. Posner 1992: 1350).
Z3, … (cf. § 2.1.5.). Peirce’s model of semiosis corresponds to the progression through G, (Rg), (I) to SG, leaving out (Rsg). 3.2.7.2. Charles William Morris Based on Peirce’s semiotics, Morris (1901⫺ 1979) developed a behaviorist version of the science of semiosis (cf. Art. 113). Initially, he defined semiosis as a triple or quadruple sign relation which involves as its components a “sign vehicle”, “interpretant”, “designatum” or “denotatum”, and, in addition, an “interpreter”. The sign relation as a whole he called “sign”. His “sign vehicle” corresponds to the interpretandum S of the semiosic matrix, his “interpretant” to the behavioral dispositions (Rbg) and/or (Rsg), his “denotatum” to the interpretatum G, and his “interpreter” to the organism (O) in the semiosic matrix. Here, the semiosis proceeds from [S, (Rs)], to the segment [(I), (Rbg)] and then back via [(I), (Rg)] to G. The signifier (Rs) and the interpretant (I) in the strict sense of the semiosic matrix are left out. The segment [(I), (Rg)] is called a “designatum”. With reference to the components sign vehicle, interpretant and designatum, Morris (1938: 6 f) postulated three subdisciplines of semiotics (cf. Art. 2⫺4): syntactics (the study of the relations between sign vehicles), semantics (the study of the relations between the sign vehicles and their designata or denotata), and pragmatics (the study of the rela-
tions between sign vehicles and their interpretants or interpreters) (Fig. 5.19). Later on, Morris (1964: 2) described the semiosis as a quintuple relationship v, w, x, y, z. In it, “v” represented the sign vehicles, “w” the interpreters, “x” the interpretants or behavioral dispositions, “y” the “significations”, i. e., the meanings to which the behavior refers, and “z” the contexts in which the semioses take place and which consist of other signs and/or objects. According to Morris (1964), the significations y have three dimensions corresponding to three possible types of reaction towards the object of behavior. Either the signification is “designative”, i. e., it specifies observable properties, or it is “appraisive” (or “appreciative”), i. e., it specifies properties relevant for the satisfaction of given needs, or it is “prescriptive”, i. e., it specifies reactions toward the object which should lead to the satisfaction of such needs. In the semiosic matrix, the extended semiosis of Morris may be represented as follows. The sign vehicle v corresponds to SG; a representation (Rsg) of SG within the organism of the interpreter w ⫽ (O) is not given. The interpretant x corresponds to the segment [(I), (Rbg)], the signification y to the segment [(I), (Rg), G]. 3.2.7.3. Two supplements to Morris’s model of semiosis Just as Morris, in developing his model of semiosis, was influenced by behaviorist
267
5. Models of semiosis
psychology (especially by that of Clark L. Hull), he in turn influenced the development of this branch of behaviorist psychology. The results of mutual stimulation are visible especially in the work of Charles E. Osgood (1953, 1957). Osgood differentiates between the object S˙ (corresponding to the interpretatum G of the semiosic matrix) and the sign S (corresponding to the interpretandum 첸 SG). S˙ is a pattern of stimulation that elicits reactions from the organism. 첸 S is a pattern of stimulation different from S˙ but eliciting reactions pertaining to S˙. How does 첸 S become a sign for S˙? Osgood represented his conception of semiosis in a graphic model (Fig. 5.20). . S
S
A
rm
RT
sm
Rx
Fig. 5.20: The model of semiosis after Osgood (1957: 7).
In Osgood’s model, S˙ (⫽ G) may, for example, be an electric shock to which a rat in a laboratory reacts with a certain global reaction RT. A buzzer sound 첸 S can also elicit part of this global behavior, because the latter has become linked to that sound’s inner representation rm through the principle of conditioning. Osgood calls the segment rm … sm in Fig. 5.20 “a representational mediation process”. In his view, this mediation process is the “meaning” of the sign 첸 S . It mediates a behavior disposition sm which may, in the end, lead to an overt behavior Rx. In Osgood’s semiosis, S˙ corresponds to the interpretatum G, RT to the overt behavior BG, 첸 S to the interpretandum S, rm to the segment [(Rs), (I)], sm to the segment [(I), (Rg)], and Rx to (a part of) BG in the semiosic matrix. The semiosis functions like conditioning of the Pavlovian type (cf. § 2.1.2.). It supplements Morris’s model because Osgood takes into account the overt behavior Rx (⫽ BG) in addition to behavior dispositions. However, neither Morris nor Osgood make a distinction between instrumental and signaling behavior. A further supplementation to Morris’s model of semiosis was introduced by Georg Klaus (1921⫺1974). While Klaus (cf. Art. 113) took over directly from Morris the semiosic relata O ⫽ (material) object, Z ⫽ (lan-
guage) sign, M ⫽ human (interpreter), he redefined Morris’ designatum as A ⫽ mental image (concept, predicate, etc.), following the Marxist-Leninist theory of mental mirroring. The acknowledgment of a mirroring mental object A in addition to the material object O also led Klaus to distinguish between the subdisciplines of semiotics that study them. In addition to semantics, which analyzes the relationship between the sign vehicle Z and the mental object representation, there was a need for a further subdiscipline studying the relation between the sign vehicle Z and the material object O. This subdiscipline he called “sigmatics” (Fig. 5.21). Only by introducing sigmatics is it possible to examine the adequacy of the referential function and the validity of the imputed relation between the sign and its material object. In the semiosic matrix, the distinction Klaus makes concerns the object G and its mirroring, i. e., its representation (Rg) within the organism (O) of the interpreter; it corresponds to the assumption of a difference between a “dynamical” and an “immediate” object in Peirce and justifies the introduction of a “signified”, as attributed to Saussure in the Cours of 1916. This distinction is useful because it stresses the fact that a semiosis can only take place if the object for which a sign stands has indeed been perceived and stored. Seen from this perspective, it is surprising that Peirce, Morris, and even Klaus make no distinction between the material sign S (e. g., a speech sound) and the perceived sign, the signifier (Rs) (e. g., the sound-image). 3.2.7.4. The structuralist sign relation in the Cours de linguistique ge´ ne´ rale attributed to Ferdinand de Saussure In 1916, three students of the Swiss linguist Ferdinand de Saussure (1857⫺1913), Charles Bally, Albert Sechehaye and Albert Riedlinger, published a joint version of the Cours de linguistique ge´ ne´ rale, which Ferdinand de Saussure had given in three blocks from 1906 to 1911 at the University of Geneva (cf. Art. 101). The publication was compiled on the basis of their lecture notes. While some authors (e. g., Jäger 1976, Stetter 1986) have questioned the authenticity of the ideas attributed to Saussure in the Cours, the structuralist stance taken in this work has nevertheless had an important influence on the development of semiotics and on ideas of semiosis in general. According to the Cours, Saus-
268
II. Aspekte der Semiose Andere sprachliche Zeichen (andere Wörter, Sätze usw.) Z´
Syntax Pragmatik Menschen, Gesellschaft, die die Zeichen benutzen M
Sprachliche Zeichen (Wort, Satz usw.) Z
Sigmatik Objekt der Widerspiegelung (Gegenstände, Eigenschaften, Beziehungen, Sachverhalte) O
Semantik Gedankliches Abbild (Begriffe, Aussagen usw.) A
Fig. 5.21: The sign relation after G. Klaus (1973: 57).
sure proposed the following model of semiosis: The sign relation as a whole is called “signe”, it consists of two relata, the “signifiant” (‘signifier’) and the “signifie´ ” (‘signified’), corresponding to (Rs) and (Rg) in the semiosic matrix, respectively (Fig. 5.22).
Fig. 5.22: Semiosis according to the Cours de linguistique ge´ ne´ rale (1916).
Fig. 5.23: Semiosis as a dialogue according to the Cours de linguistique ge´ ne´ rale (1916).
This incomplete structuralist model of semiosis corresponds to that of the School of Port Royal (cf. § 3.2.5.) and results from the fact that in the Cours semiosis is seen as a communication process, within which the sign relation functions as a mental “association” (Fig. 5.23). 3.2.7.5. Prieto’s supplement to the structuralist model Admittedly, the semiology attributed to Saussure, or “the doctrine of signs in the framework of social life”, as the Cours calls it, did not progress beyond the planning during Saussure’s lifetime. The project was, however, completed by Buyssens (1943, 1967) and above all by Prieto (1966, 1968, 1975 a and 1975 b), who formulated a coherent semiotic system on the basis of Saussure’s ideas. The starting point for this system is Saussure’s dual sign relation, consisting of the signifier and the signified. For the description of dyadic semiosis, three basic terms of set theory, namely “universe (of discourse)”, “set”, and “element”, have proven useful. A universe is structured into sets, the elements of which have such properties that the sets are distinguished as standing in “opposition” to each other. A signifier is thus a set of perceived signals which are related to each other as tokens of the same type. For example, a signifier may include sound images differing slightly in tone, or visual images, such as the letters in different samples of handwriting. A signified is likewise a set of elements within a universe; it comprises concepts which are
269
5. Models of semiosis
tokens of the same type. To “recognize” something as a sign requires a double act of classification by the subject: the identification of a set of elements in a first universe as a signifier and its correlation with a set of elements in the second universe as its signified. The two correlated universes form a “semiotic structure” or “sign system”, and two correlated sets within these universes constitute a “sign” (Fig. 5.24). universe U1 of signifiers
universe U2 of signifieds
sets
sets
of
of
signals
messages sign
Fig. 5.24: A semiotic structure (sign system) after Prieto (1966; cf. Krampen 1991: 209).
As far as the process of classification by which perceived objects or signals are sorted into opposing sets is concerned, the Cours claims that the identity acquired by an object when seen as element in a set depends on the perspective from which the classification is made. In preparatory notes made in 1893⫺94 for a book he was planning, Saussure wrote (Godel 1957: 43, translation by M. K.): “There are various kinds of identity […]. No linguistic fact exists outside some relation of identity. But the relation of identity depends on the point of view one wishes to take; outside a certain point of view which precedes the differentiation, no traces of linguistic facts can be found.” Applied to the problem of semiosis, this means that there is no classification, no constitution of sets of perceived signals within a universe of signifiers without a specific point of view. The same applies, of course, to the universe of the signifieds. Now, since there is an infinite number of possible perspectives from which a classification of sets in a universe could be made, it is important to find the relevant perspective. It is the second universe, U2, which determines the perspective from which the first universe, U1, is to be classified. The signifiers of the universe U1 are, therefore, insolubly connected with the signifieds in a universe U2, because the latter supply the point of view for the structuring of the former. If one continues to think on these lines, one necessarily ends up with a process of
semiosis similar to the Peircean “chain of thought” and with the instance of an interpretant. According to Prieto (1975 a), the universe of the signified U2 furnishes, on the one hand, the meaning to the universe of the signifier U1. On the other hand, since no set can be formed without an original point of view, U2 must be a universe of signifiers in a further semiotic structure, i. e., if the universe U2 is classified into signifieds, this classification will have been made from a point of view represented by a further universe. U2 must, therefore, be a component of a second semiotic structure, in which it plays the role of a universe of signifiers. Each such universe is thus classified first into the signifieds of signifiers, and then into the signifiers of signifieds. Therefore, universes form links in a chain of semiotic structures, i. e., of a semiosis, in which one sign is interpreted by another, and this in turn by another, etc. According to Prieto (1975 a) such a chain of signs cannot continue ad infinitum, but must be based on something. Its base is the subject (“le moi sujet”) which posits itself from its own perspective as the ultimate “sense” of the semiosis (Fig. 5.25). In this final universe of signifieds one could recognize the same principle which constitutes the “final interpretant” in Peirce (cf. § 3.2.7.1.): the “interpretative result at which each interpreter should arrive if the sign is sufficiently examined” (Oehler 1981: 25, translation M. K.). In Prieto’s conception of a semiosis, the signal may be subsumed under the interpretatum S of the semiosic matrix. Just as in the Cours, the signifier in Prieto corresponds to (Rs) and the signified to (Rg) within the semiosic matrix. An interpretant (I) does not occur explicitly in Prieto’s semiosis. We can, however, assume it to have been taken into account implicitly as the classifying subject which stands at the beginning (or the end) of each chain of signs. The semiosis hence begins with an implicit interpretant (I) classifying, on the one hand, signals SG as members of a signifier (Rsg), and on the other hand sets of messages as signifieds (Rg), then signifieds as signifiers (Rsg2) of a further semiotic structure, etc. This process is of the “inner chain of thoughts” type (cf. § 2.1.3.). Although neither receptors, nor behavioral dispositions nor overt instrumental or signaling behavior are provided in this conception of semiosis, it offers a model for a continuous cognitive activity.
270
II. Aspekte der Semiose
Fig. 5.25: The chain of semiotic structures after Prieto (1975 a; cf. Krampen 1991: 211).
3.2.7.6. Louis Hjelmslev In a certain sense the “glossematics” of Louis Hjelmslev (1899⫺1965) ⫺ an attempt at a purely formal semiotics without behavioral components ⫺ may be regarded as a further addition to the model presented in the Cours (cf. Art. 117). Hjelmslev takes up the idea developed in the Cours that language is thinking organized in sound matter. Language can be represented as a series of patterns which are simultaneously imposed on the unarticulated field of vague ideas (A) and on the equally unarticulated area of sound (B) (Saussure 1916) (Fig. 5.26). The connection between ideas and sounds creates a form rather than a substance (Saussure 1916). Correspondingly, for Hjelmslev the sign relation consists of the two relata form of expression and form of content, corresponding to the signifier and the signified of the Cours. Only these two relata, according to Hjelmslev, should be the subject matter of semiotics in its strict sense. Hjelmslev indicates, however, that the form of expression is obtained by being carved out of a substance of expression, and the form of content out of a sub-
stance of content. The substance of expression in turn stems from an unarticulated matter of expression, the substance of content from an unarticulated matter of content. These two realms of unarticulated matter are the subject of non-linguistic sciences (for example physics and psychology), while the realms of substance pertain to linguistics since they are patterned differently in different languages. This patterning of the substance does, however, presuppose those forms which are subjects of semiotics proper. The Hjelmslevian model is summarized in Fig. 5.27. In analogy to the Cours, the form of expression corresponds to the signifier (Rs), and the form of content to the signified (Rg) of the semiosic matrix. With respect to the articulated substances of expression and content it could be hypothesized that they can be understood as the in-
content matter (CM)
content substance (CS)
content form (CF)
expression form (EF)
expression substance (ES)
expression matter (EM)
Fig. 5.26: The field of ideas (A) and the domain of speech sounds (B) according to the Cours de linguistique ge´ ne´ rale (1916 ⫽ 1971: 156).
Fig. 5.27: The sign model after Hjelmslev (1943; cf. Nöth 1985: 70).
5. Models of semiosis
terpretandum S and the interpretatum G respectively. In this case, the unarticulated matter from which the substances of expression and of content are obtained could correspond to the channel Ch of the semiosic matrix, i. e., any medium occurring outside the organism of the interpreter. As in the Cours, the interpretant (I) does not feature in Hjelmslev’s model. The Hjelmslevian conception of semiosis is thus based on the segment [(Rs), (Rg)], and it proceeds from there in the direction of the interpretandum S in the channel Ch. If an implicit interpretant (I) were introduced, the semiosis could be described with the arc from [Ch, S] via [(Rs), (I), (Rg)] to G. Behavioral consequences are not taken into account in this model. 3.2.7.7. Synopsis of sign relations in the classics of modern semiotics Using the semiosic matrix, a survey of the nomenclature of sign relations and their relata in the classics of modern semiotics is given in Table 5.2. Comparing Table 5.2 with Table 5.1 shows that the sign relations formulated by the classics of semiotics are more differentiated than those used in Antiquity and the Middle Ages, in that they consider the behavioral consequences of semiosis. In addition, the “mentalistic” models which emerged after Saussure’s Cours develop the fundamental models of Peirce and Morris even further, because they emphasize those organismic aspects (Rs) and (Rg) of semiosis which Peirce and Morris tended to neglect. 3.3. Communication models and semiosis 3.3.1. Communication and semiosis The communication process in which a sender transmits second hand experiences to a receiver is a sign process par excellence. In this sense, models of communication processes are always models of semioses, but not vice versa. Since in a communication process at least two partners are presupposed, mostly labeled “sender” and “receiver”, the semiosic matrix must be redoubled if the process of communication is to be described as a sign process, because the organisms of two interpreters (OS) and (OE) must be assumed. 3.3.2. The model of dialogue in the Cours de linguistique ge´ ne´ rale As has been pointed out, the model of semiosis attributed to Saussure in the Cours is in fact a model of communication or of dia-
271 logue, unlike the ones of Peirce and Morris. The model is described as follows: “Suppose that the opening of the circuit is in A’s brain, where mental facts (concepts) are associated
Fig. 5.28: The circuit of speaking according to the Cours de linguistique ge´ ne´ rale (1916: 28 ⫽ 1959: 11).
with representations of the linguistic sounds (sound-images) that are used for their expression. A given concept unlocks a corresponding sound-image in the brain; this purely psychological phenomenon is followed in turn by a physiological process: the brain transmits an impulse corresponding with the image to the organs used in producing sounds. Then the sound waves travel from the mouth of A to the ear of B: a purely physical process. Next, the circuit continues in B, but the order is reversed: from the ear to the brain, the physiological transmission of the sound-image; in the brain, the psychological association of the image with the corresponding concept. If B then speaks, the new act will follow ⫺ from his brain to A’s ⫺ exactly the same course as the first act and pass through the same successive phases […]” (Saussure 1916: 28 ⫽ 1959: 11 f). In the description given in the Cours, the signified (Rg) corresponds to the “idea” of the interpreter (OA), which triggers a soundimage. The sound-image itself is (the project of) the signifier (Rsg1) of the dialogue model (cf. Fig. 5.15). (Rsg1) is realized as the physical event SG1 and perceived as the signifier (Rsg1) by (OB). Within the organism of the interpreter (OB) a psychic process associates it with an idea of the interpreter (OB), i. e., with the signified (Rg). This process of association is described as occurring without a mediating agency, such that (Rg) takes over the function of the central stage in the semiosic matrix, the interpretant (I). In the second half of the dialogue, the signified (Rg) directly triggers a (new project of a) signifier (Rsg2) which is in turn realized as SG2, etc.
Table 5.3: Synopsis of communication models
Table 5.2: Synopsis of sign relations in the classiscs of semiotics
272 II.Aspekte der Semiose
273
5. Models of semiosis
3.3.3. A detailed description of a phonetic semiosis Following Shannon and Weaver (1949), Nöth (1990: 175) designed a detailed model of phonetic communication. In this model, the brain is the information source selecting a message, the transmitter is the organ of the vocal cords, and the signal is the sound waves transmitted through air as the channel. This process of transmission may be negatively influenced by noise. The sound waves (signal) finally reach the nerves of the ear (as their receiver) and are transmitted by them to the destination of the information, the brain of the listener (Fig. 5.31). In this model, the information source corresponds to the signified (Rg), the transmitter to the process by which the message, the signifier (Rsg), is transformed into the signal SG. SG is realized in the channel Ch (air). The noise of the transmission stems from unfavorable contextual conditions C. The receiver is the process by which the signal SG is changed into a signifier (Rs), which in turn is transformed into a message and reaches the destination of the information as the signified (Rg). The semiosis starts in the organism of the interpreter/sender (OS) and proceeds from (Rg) via (Rsg) to SG in Ch within the context C, is then perceived in the transformation of SG into (Rsg) and triggers (Rg).
The semiosis starts in (OA) with (Rg) taking on the function of (I), then it proceeds via (Rsg1) to SG1. In (OB), SG1 is perceived as (Rsg1) and directly associated with (Rg), which has taken over the position of (I) in (OB) and in turn evokes (Rsg2) which appears outside of (OB) as a pattern of sound waves SG2. While the Cours describes the model as a linguistic semiosis, it can be used for non-linguistic sign processes as well. Sound waves can take the place of the visual channel, and the production of gestures or written signs can be made using fingers and arms instead of the vocal cords and the mouth (cf. Fig. 5.29 and Fig. 5.30).
Fig. 5.29: Communication by gesture.
3.3.4. Sign repertory of sender and receiver (semiosis according to Meyer-Eppler) According to Meyer-Eppler (1959), communication takes place even in the case where an interpreter (O) receives signals from a source by means of a “peripheral perceptual organ” p [⫽ (R)] and processes them centrally z [⫽ (I)]. He calls this communication process “unilateral” (Fig. 5.32). According to Meyer-Eppler, communication also takes place if, for example, a doctor
Fig. 5.30: Communication by writing.
Information source
Transmitter Message
Channel Signal
Receiver Received signal
Destination Message
Noise source
Fig. 5.31: The communication model according to Shannon and Weaver (1949), after Nöth (1990: 175).
274
II. Aspekte der Semiose Expedient
Perzipient Signale
z
Fig. 5.32: The unilateral process of communication after Meyer-Eppler (1959; cf. Nöth 1985: 125).
observes symptoms which are emitted by the patient without intention. In this case, there is a sender and a perceiver both equipped with peripheral organs of perception and central organs of information processing, and yet the process remains unilateral (Fig. 5.33).
Fig. 5.33: Communication in the diagnostic process after Meyer-Eppler (1959; cf. Nöth 1985: 125).
According to the terminology proposed in the present article, these two cases are not communicative semioses in which a sender mediates second hand information to a receiver, but semioses serving the acquisition of first hand information directly from the environment (cf. Art. 4 § 5.3.). A further model proposed by MeyerEppler (1959), however, represents in fact a communicative semiosis. In addition to the sender and the receiver, both equipped with peripheral (p) and central (z) signal processing organs, and to the emitted signal, this model also contains sign repertories V1 of the sender and V2 of the receiver. Since the two repertories need not be identical, the shared supply is given by the intersection V3 of the two sets of signs (Fig. 5.34). Each set of signs, taken together with the rules for their combination, is called a “code” (cf. Art. 16). This model contains, in the sense of the semiosis of dialogue (cf. § 2.2.3.), the organism of an “Expedient”, i. e., the interpreter/ sender (OS), and the centrally (z) stored signified (Rg) associated with its corresponding signifier (Rsg), as determined by the repertory (i. e., the code) (Ic). Peripherally (in p), the disposition (Rsg) to emit a signal is trans-
p'
p
z
Zeichenvorrat
V1
V3
V2
Fig. 5.34: The model of communication after Meyer-Eppler (1959; cf. Nöth 1985: 132).
formed into the signal SG and, after having been peripherally perceived on the side of the “Perzipient”, i. e., the receiving interpreter (OE), it is translated into the signifier (Rsg) that is associated with the signified (Rg) through the repertory, or code (Ic); cf. Fig. 5.15. If the association of (Rg) with (Rsg) through the code (Ic) is the same in the sender (OS) and the receiver (OE), communication takes place. The semiosis thus proceeds from (Rg) via (I) and (Rsg) in (OS) to SG, and from SG via (Rsg), (I), and (Rg) in (OE). Compared with Shannon and Weaver’s (1949) model of communication (Fig. 5.31), Meyer-Eppler’s model provides an important additional factor by introducing the sign repertory or code (Ic), which includes the vocabulary of a language as a special case. However, it still lacks the interpretata G; they will be introduced in the next section. 3.3.5. Introduction of “designata” Based on the triangular scheme of the sign relation proposed by Ogden and Richards (cf. § 3.2.6.), in which a symbol is connected to a referent through mental reference, Colin Cherry (1957) developed a functional flow diagram that provides a place for the referent or “designatum” of the sign (Fig. 5.35). This flow diagram indicates the existence of a communication partner, but does not represent him explicitly. By doubling Cherry’s diagram, however, a complete semiosis of communication can be depicted (Fig. 5.36).
275
5. Models of semiosis
Fig. 5.35: The sign model after Cherry (1957: 110).
Fig. 5.36: The semiosis of communication after Cherry (1957).
The sender (and equally the receiver) of signals is causally connected with the designata through perception and, under the influence of memory and the external environment, selects in his thoughts a behavior which is either instrumental or signaling or both. The emitted signal is perceived by the receiver, who is also causally connected to the designata through perception and can connect them with a signal. He, too, selects an instrumental or signaling behavior in his thoughts. The emitted signal then returns to the former sender, who thus becomes a receiver himself. Instead of a dialogue, this process could ⫺ with the addition of a third or more interpreters ⫺ be depicted as a chain of communication. In the semiosic matrix, the “designatum” of Cherry’s model corresponds to the interpretatum G, the “signal” to the interpretan-
dum SG, and the “thoughts” to the interpretant (I). The signified (Rg) and the signifier (Rsg) are present in Cherry’s model only in the segments connecting the designatum G and the signal SG by perception with the thought (I). The “memory” is the internal context (c), while the “external environment” is the external context C. The selection of a behavior could be compared with the behavior dispositions (Rsg) and (Rbg) of the semiosic matrix. The overt behavior represented by the arc leading away from the triangle corresponds to the instrumental behavior BG or to the signaling behavior SG. Thus, for the sender (OS) the semiosis proceeds from G, via (Rg) and (I) to (Rsg1) and SG1, while for the receiver (OE) it passes from SG1 via (Rsg1) and (I) to (Rsg2) and SG2. Cherry’s model includes an interpretatum, but it does not explicitly mention the code (Ic).
276
II. Aspekte der Semiose
3.3.6. Jakobson’s model of semiosis in communication In his organon model of language, Bühler (1934) represented a sender producing signs Z to refer to objects and facts for a receiver (Fig. 5.37). The functions of communication based on this model will be treated in another context (cf. § 4. as well as Art. 110).
Fig. 5.37: The organon model of language after Bühler (1934: 28).
By extending Bühler’s model, Jakobson (1960) arrived at a schema of semiosis consisting of six elements, namely a sender, a message, a receiver, a context (i. e., referent), a contact (i. e., channel), and a code. The sender uses a code to produce a message about a referent and sends this message via a channel to a receiver who can relate it to the referent because he has the same code (Fig. 5.38). The referent (or context) in this model corresponds to the interpretatum G, the sender to the interpreter (OS), the code to the interpretant (Ic), the message to the interpretandum SG, the contact to the channel Ch, and the receiver to the interpreter (OE). The semiosis proceeds in (OS) from G via (Rg) and (I) to SG, and from there in (OE) via (Rsg) and (I) to G (cf. Art. 116).
CONTEXT ADDRESSER
MESSAGE
ADDRESSEE
CONTACT CODE
Fig. 5.38: Jakobson’s model of communication (1960: 353).
3.3.7. A synopsis of models of semioses in communication The various models of semioses in communication proposed by the authors discussed are presented in a synopsis above (Table 5.3). It can be seen here that the models largely complement each other. The use of the terms “sender” and “message” is not uniform, however. Shannon, for example defines a message as a selection of what is to be sent (Rsg), whereas Jakobson identifies it with the emitted signal SG. Also, the sender is understood by Bühler and Jakobson as the organism (OS) of the interpreter, while Cherry uses the term for the mechanism of emission [(Rsg), SG]. 3.4. Complex semioses 3.4.1. Direct face-to-face communication The models of semioses in communication discussed so far all begin with the fiction that communication takes place via one channel only. As a rule, the vocal-auditive, acoustic channel is meant (e. g., § 3.3.2. and § 3.3.3.). In each direct communication between two individuals (or in a group), however, semioses take place in several channels (cf. Art. 13). The term “channel” is often equated in the relevant literature with the term “medium”. Here it will be reserved for the complex of sense modalities, especially those of reception (i. e., optical, acoustic, touch, thermal, olfactory, gustatory, etc.) and for the corresponding matter (i. e., light waves, sound waves, pressure, biochemical and thermodynamical energy transport, electrical and electromagnetic waves, etc.). Which channels participate in communication and their relative importance depends primarily on the distance between the communication partners. Based on observation, Edward T. Hall (1966) postulated four categories of distance for humans, each containing a “close” and a “far” phase (cf. Art. 13 § 2.). He calls the first category “intimate distance”, estimating its span from 0 to 18 inches. In this category, which is used, e. g., in sexual or mother-child interaction, the channels of touch, thermal, olfactory and gustatory senses play a role equal to or even more important than the optical and acoustic senses. Skin contact, body heat, smells etc., i. e., the proximal senses, dominate the foreground, whereas the distal senses constitute the background: vision is blurred and the voice is reduced to a whisper.
5. Models of semiosis
The second category, called “personal distance”, ranges from 1 ½ to 4 ft. At this distance, the communication partners can still touch each other, for instance by holding their hands. They both see each other’s face very clearly including such details as complexion, eyes, teeth, etc. This distance requires only a moderate loudness of the voice, and facial expression plays an important role. The proximal senses begin to lose their importance. The third category, called “social distance”, ranges from 4 to 12 ft. This distance predominates in working relations. By means of a desk top, the working distance between a boss and his subordinates may be regulated, but also on such social occasions as a cocktail party this distance is generally maintained. At this distance, the whole person can be inspected. Gestures, body posture, and clothing take on their full importance. Talking needs to be loud and clear if it is to be understood. The fourth category Hall calls “public distance”. It spans from 12 to 25 ft or more. This is the distance separating teachers and their pupils, preachers and their congregation, rulers and their subjects. It is built into lecture halls, theatres and palaces (cf. Art. 68). The details of the communicator’s face and clothing are lost at this distance. He must speak very loudly. If the distance between the speaker and the public becomes too great, vocal communication breaks down and only large gestures remain visible. The speaker must now rely on a microphone or a megaphone, and direct voice contact becomes indirect by inserting a technical apparatus between him and his audience (cf. Art. 14). In animal and probably also in plant communication, haptic, thermal and olfactory senses, i. e., the proximal senses, play a more important role than in humans (cf. Art. 20⫺ 24). How the activities of the different channels are organized reciprocally has been modeled by Birdwhistell (1970) (Fig. 5.39). The model
Fig. 5.39: Birdwhistell’s model of multichannel communication (1970: 70).
277 shows that the semioses occurring in the different channels may be simultaneous, dephased, or alternating, etc. What is important is that they support each other reciprocally. If, for example, a sad message is told with a laughing facial expression, the mutual support between the optical channel and the acoustic one is suspended and communication becomes ambiguous. In one and the same channel, several semioses may occur simultaneously. Thus the frequently used term “nonverbal communication” refers to prosodic (intonation) and to paralinguistic (e. g., voice quality) events which take place simultaneously in connection with the production of verbal signs in the acoustic channel (Posner 1986). Likewise, the kinesic (Birdwhistell 1970) semioses of facial expression, gestures, body posture etc. occur simultaneously in the visual channel. The theoretical problem of how many channels may participate in direct communication raises the question of how many sense modalities humans have. Modern sensory physiology certainly recognizes more than just the classical five senses; mother-baby communication, for example, features at least six modalities (touch, thermic, olfactory, gustatory, optic, and acoustic). It is therefore wise not to limit the number of channels involved in direct communication (cf. Art. 6⫺13). In order to model direct communication in several channels, Birdwhistell’s multichannel system must be merged (Fig. 5.39) with the semiosic matrix (Fig. 5.1). The semiosis starts with the interpretanda SG1 in the channels Ch1, Ch2, Ch3, …, Chn (Fig. 5.40). It proceeds through their representations in the signifiers (Rsg1 Ch1), (Rsg1, Ch2), (Rsg1, Ch3), …, (Rsg1 Chn), which are united in the interpretant (I). The process continues through the inner representations of Gs, the signifieds (Rg Ch1), (Rg Ch2), (Rg Ch3), …, (Rg Chn), separated by the modalities, to the Gs themselves, which are located in the different channels Ch1, Ch2, Ch3, …, Chn. Through the interpretant, dispositions for instrumental and signaling behaviors in different channels are stimulated. Thus the dispositions for the instrumental behaviors (Rbg Ch1), (Rbg Ch2), (Rbg Ch3), …, (Rbg Chn) serve to prepare the overt behaviors BG Ch1, BG Ch2, BG Ch3, …, BG Chn, separated by channels, and the dispositions for the signaling behaviors (Rsg2 Ch1), (Rsg2 Ch2), (Rsg2 Ch3), …, (Rsg2 Chn) are the
278
II. Aspekte der Semiose
Fig. 5.40: Multichannel semiosis in direct communication.
projects for the signals SG2 Ch1, SG2 Ch2, SG2 Ch3, …, SG2 Chn, separated by their respective channels. 3.4.2. Codes The semioses occurring in the various channels are coded. There are linguistic, facial, gestural codes, etc. Very often, the term “code”, like the word “channel”, is not used with a uniform meaning (cf. “binary code”, “genetic code”, etc.). Here, “code” should be understood as a semiotic structure (cf. § 3.2.7.5.) in which two universes, that of the signifier and that of the signified, are correlated. The instance of correlation, i. e., the key according to which a given signifier is correlated with a given signified, is called the “interpretant” (I) in the semiosic matrix (but cf. Art. 16). Signifiers are (abstract) classes or sets of (perceived) signals, i. e., representations of signal types within the organism of the interpreter. The signals in the proper sense, which are realized in channels outside the interpreter, are “tokens” of these types. They are attributed to a signifier in the process of perception either by substracting non-coded properties or by adding those coded properties which are lacking. Thus the gesture of the raised index finger is attributed to the class of gestures with raised index fingers, whether it is executed by the large finger of a grownup or by the smaller finger of a child. Similar processes of abstraction or complementation should occur during the formation of signi-
fieds (e. g., the canonical inner representation of objects or classes of objects). Whether the code, i. e., the correlation of signifiers with signifieds, is the same for both the sender and the receiver, will determine the success of a communicative semiosis. Whether the code possesses a metric in the sense of information theory (cf., e. g., the “binary code”) or whether it is an open system in the sense of a natural language, appears unimportant in this respect. A certain systematization can be achieved by differentiating between spatio-dimensional and temporal-linear codes. Spatio-dimensional codes may be one-dimensional (e. g., a line), two-dimensional (e. g., a surface), or three-dimensional (e. g., a space). Spatio-dimensional codes do not occur in direct communication (unless we accept body painting as direct communication), but are typical for indirect medial semioses. Temporal-linear coding may be combined with spatio-dimensional coding if it does not occur by itself (as in language). Thus facial expression is a combination of temporal and two-dimensional coding, gesture or dance is a combination of temporal and three-dimensional coding. 3.4.3. Indirect, i. e., medial semioses 3.4.3.1. Defining the term “medium” The term “medium”, like the terms “channel” and “code”, is given different meanings in the relevant literature. Posner (1986) distinguishes six different conceptions of media:
279
5. Models of semiosis
The (1) biological conception (e. g., visual media) refers to the sense modalities of the receiver (eyes, ears, etc.), the (2) physical one (e. g., “optical” or “acoustic” media) referring to the matter of contact (such as light or sound waves, etc.). The media conceptions (1) and (2) cover the two areas which are represented by the term “channel” in this Article (cf. § 3.4.1.). But there is furthermore a (3) technological conception of media (e. g., print, projection, video media), a (4) sociological conception of media referring to institutions of communication (e. g., galleries, libraries, publishers, film distributors, etc.), a (5) culturally oriented conception of media referring to cultural “genres” (e. g., news, comment), and, finally, a (6) code-oriented conception of media referring to stylistic codes (e. g., tonal vs. atonal music, representational vs. abstract painting, etc.). In the present Article, “medium” will be used exclusively in its (3) technological sense (cf. Art. 14). Following Pross (1972), a distinction will be made between media in which only the sender uses technical equipment, and those in which both the sender and the receiver need such equipment. Among the former are: smoke (as in smoke signals), optical telegraphy (as in flag signals), pictures, writing, print media (posters, newspapers, books), etc. To the latter belong telegraphy, telephone, records, tapes, film, radio, television, videos, etc. If mediated communication is to be accounted for in the semiosic matrix, an extra node A1 must be introduced for the
medium (equipment) of the sender (OS) and/ or an additional node A2 for the medium (equipment) of the receiver (OE). In the case where both sender and receiver need technical equipment, two media (pieces of equipment) A1 and A2 are placed between (OS) and (OE), as in Fig. 5.41. In addition, “chains” of media may result (Knilli 1979, Hess-Lüttich 1981; cf. Art. 14 § 4. and 5.). If a show takes place in a television studio, the studio audience is experiencing the show directly, mainly through the visual and acoustic channels. In the television cameras, the visual and acoustic signals are electronically transformed and a transmission (1) takes place. The transmitted signals are then retransformed in the television receiver and a further transmission (2) to the people watching television results (which is nevertheless regarded as a “live” transmission). The result is a medial reception on the part of the television viewer. If he makes a recording from the screen, a further transformation takes place, the result of which is the storing of data on a video tape. If the tape is played on an appropriate video recorder, the electronic signals are retransformed a second time and again a transmission (3) to another viewer takes place. This chain could be continued further if a scientist were to transcribe the transmission of the recording using graphical notation, e. g., for the purpose of analyzing the “nonverbal communication” performed by the show’s host, etc.
Fig. 5.41: Sender and receiver utilizing technical equipment.
280
II. Aspekte der Semiose
Unlike Knilli (1979) and Hess-Lüttich (1981), we should regard the show in the studio as an example of direct communication and not as medial transmission. In the semiosic matrix, such medial chains can be represented by introducing the equipments A1, A2, A3, … An between the various semioses. 3.4.3.2. Multimedia semioses According to the technological definition (media as equipment for the transmission and reception of signals), the term “multimedia” refers strictly to media using at least two channels (i. e., sense modalities) (Posner 1986). In this sense, “audiovisual media” such as sound motion pictures, television and video are multimedia, silent movies and radio are not. In the semiosic matrix, this can be depicted by bundling the different codes of a sense modality into a string and thus dividing it from the bundled codes of another sense modality. If at least two such bundles are transmitted via a technical medium, this is a “multimedium” or more precisely a “bichannel multicoded medium” (Fig. 5.42). linguistic code prosodic code paralinguistic code
a dispersed public where the mass of participants must exceed a certain number. Both definitions exclude, by the postulate that the audience must be dispersed, such mass events as party rallies, papal mass celebrations, and also lectures for large audiences, which Posner (1986: 288) would call “public lectures” if at least some of the participants do not know each other personally. If mass events in the wider sense are to be included in mass communication, a specification of the following kind is recommended: There is a type of mass communication where only the sender uses equipment (e. g., mass rallies, the press), and another type where both the sender and receiver need equipment. In the latter case, aside from the medial criterion that the communication is “indirect”, the criterion that an event be public suffices. Also, the number of participants forming a mass may be operationalized by the necessity of equipment (e. g., for amplification of the speaker’s voice) and not only by the dispersion of the audience. The emphasis here is on the necessity of equipment and not on convenience for the speaker or public (but cf. Art. 14 § 1. 2. 3.).
acoustic channel A 1 (e.g., microphone) multimedium (sound-motion picture)
mimical code gestural code code of body posture
optical channel A 2 (e.g., movie camera)
Fig. 5.42: Example of a multimedium.
3.4.4. Mass communication and mass media Two-channel multicoded media may be used as mass media (e. g., motion pictures, television), but they need not be used that way (e. g., private video or hobby film). Moreover, mass communication not only employs bichannel media, but also one-channel ones (e. g., radio, the press). How mass communication is defined depends on the number of criteria deemed necessary for the definition. Thus Maletzke (1963) defines mass communication as public, diffused by (technical) media, indirect (because of the distance between the communication partners), one-sided and with a dispersed public. Posner (1986) holds that mass communication is communication with
As a rule, mass communication has institutional aspects. The speaker does not express his private opinion, but that of a party, of a church, etc. Very often his speech is not even written by him, but by a “ghost-writer”. The print media publish what has been decided by the editorial staff conference. The television or radio speaker reads only that part of the news which has been deemed “newsworthy” by the editors. Behind a movie screen the distributor, the director, the camera crew, etc. remain hidden. If a sender is mentioned in mass communication, this can only refer to an institution whose members are connected by a network of direct and indirect semioses; this all adds up, as it were, to a “supersemiosis”. Such a network is also connected to its social environment by numerous semioses.
5. Models of semiosis
A careful analysis of any event of mass communication, e. g., a television newscast or an issue of a daily newspaper, will lead to the conclusion that such an event is the result of many semioses Z of the kind which can be represented in the semiosic matrix. These semioses are either direct face-to-face dialogues between pairs or within groups (e. g., editorial staff meetings) or they are mediated by technical equipment (telephone, telefax, etc). They occur along the different stages in the preparation of the mass communication event (e. g., acquisition of news material, editing, elaborating, sequencing or layout, sending or printing). This may be formalized by writing it in the form of a matrix where the rows represent various forms of direct or mediated semioses Z while the columns represent stages in the preparation of the mass communication event along a time axis. Table 5.4: A matrix of semiosic matrices with n rows and m columns
S⫽
Z11 . . . Z12 . . . Z1j . . . Z1m Z21 . . . Z22 . . . Z2j . . . Z2m . . . . . . . . . . . . Zi1 . . . Zi2 . . . Zij . . . Zim . . . . . . . . . . . . Zn1 . . . Zn2 . . . Znj . . . Znm
After empirical field investigations (e. g., in a television station) in which all the single communication episodes are counted, the Zsigns could finally be replaced by numerical frequencies (number of dialogues, phone calls, fax messages, etc.). A mass communication event could thus be accounted for by a “supersemiosis” S written most generally as a matrix of semiosic matrices with n rows (kinds of channels) and m columns (stages of preparation). This complicated context has not been sufficiently dealt with by the usual models of mass communication. The problem will be pointed out here with respect to a few examples only. Thus Schramm (1955) more or less aptly depicts the dispersed nature of the mass public in his model, but does not take into ac-
281 count the internal and external network of the sender as an institution (Fig. 5.43). Maletzke (1963) shows a relatively complex picture of the influences acting on the communicator K and the recipient R of mass communication. But the model gives the impression that the communicator is more important than the institutionalized sender to which he belongs. This may perhaps apply in the case of a game-show host, but does not, for example, do justice to the role of a newsreader (Fig. 5.44). The model of Riley and Riley (1959) seems more pertinent, as it shows both the communicator and the recipient of mass communication under the influence of primary groups situated in the framework of comprehensive social structures that are in turn embedded within an entire social system. But here, too, the communicator is treated as an individual (Fig. 5.45). The production of mass communication as a system in which countless semioses take place is represented in all its complexity by De Fleur (1966), albeit limited to the circumstances of the United States (Fig. 5.46). Unfortunately, this model does not represent the counterpart on the receiver’s end. Mass communication cannot be represented in the semiosic matrix since the latter presupposes the involvement of an individual organism (O) as interpreter. This explains part of the difficulties semiotics has so far had with analyzing the mass production of semioses: The task is to describe collective semiosic phenomena in their full complexity (cf. Art. 4). A way of presenting a mass medial transmission without the semiosic matrix is exemplified in Fig. 5.47. 3.4.5. Aesthetic semiosis As mentioned under the heading of “code” (§ 3.4.2.), semioses usually pass through the various channels in a coded form. Nevertheless the realizations of interpretanda in these channels may possess non-coded properties, or lack properties which must then be complemented in the process of perception. The superfluous properties could be regarded as not yet coded but potentially codeable. The coding of semioses takes place on various levels. Thus, on a primary level, the medial semioses of printed texts are coded materially, i. e., graphically-typographically (1) and graphemically according to an alphabet (2). The graphic-graphemic material base furnishes the signifiers of the articulatory and
282
II. Aspekte der Semiose
Fig. 5.43: The model of mass communication after Schramm (1955: 21).
Fig. 5.44: The model of mass communication after Maletzke (1963).
Fig. 5.45: The model of mass communication after Riley and Riley (1959).
283
5. Models of semiosis
Financial Backers The role systems of those who purchase or otherwise obtain time and space as sponsors of media messages for the purpose of influencing the decisions of the audience with respect to consuming or other behavior.
Legislative Bodies The role systems of those who pass laws related to the media, hold hearings concerning the media, determine public policy related to the media, etc.
Production Subsystem The role systems of all groups which in any way create or produce media content, including television shows, magazine articles, newspaper stories, motion pictures, etc. Depending upon the medium, such roles are included as: writers, actors, directors, publishers, reporters, art directors, editors, foreign correspond-ents, cameramen, linotype operators, lighting specialists, etc.
National and Regional Distributors The role systems of those who distribute content to local outlets. Includes those of the broadcasting networks, newspaper syndicates, movie theater chains and wholesalers of magazines and books.
Local Distributors The role systems of groups that actually present media content to the public. Includes those of local newspapers, local theaters, radio and televisions stations, and retailers of books and magazines.
Fig. 5.46: The model of mass communication after De Fleur (1966).
linguistic code prosodic code paralinguistic code
mimical code gestural code code of body posture
multimedium (sound motion picture)
verbal code non-verbal codes
acoustic channel Ch 1 - A 1 (e.g., microphone) multimedium (sound motion picture)
kinesic codes, optical channel Ch 2 - A 2 (e.g., movie camera)
acoustic channel Ch 1
verbal code non-verbal codes
optical channel Ch 2
kinesic codes
A3 sound movie projector
linguistic code prosodic code paralinguistic code
facial code gestural code code of body posture
Fig. 5.47: Multimedial mass communication of a sound-motion picture, including the sender and receiver end.
acoustical level (3) of the phonetic code. This in turn forms the base of the phonemic code (4) consisting of distinctive features. On the morphemic level (5) the text is articulated into morphemes, i. e., the elements of the
morphemic code. On the syntactic level (6) the text is coded according to the grammatical functions of its parts. The semantic level (7) is the one which includes the meaning of the textual elements. Similar levels may also
284
II. Aspekte der Semiose
be found for non-linguistic interpretanda, for example simple geometric forms. A circle has: (1) a graphic and color coding, (2) a geometrical, (3) perceptual, (4) graphemic, (5) morphemic, (6) syntactic, and (7) a semantic coding. On the last level its meaning changes depending on the syntactic context in which it occurs, e. g., from ‘ball’ to ‘wheel’ or ‘head’. With regard to all these levels, interpretanda exhibit not only coded properties, but also non-coded ones. It is these “non-precoded” properties (Posner 1980) that are the subject matter of production and reception of aesthetic semioses. Aesthetic processes build on the properties of the material basis within a semiosis which are not precoded for normal communication and, therefore, may appear superfluous. By drawing the interpreter’s attention to these properties and by exploring their connection with non-precoded properties on other levels, an aesthetic context is created which hinders the usual automatic interpretation of the interpretandum: now the discovery of new and unusual combinations is at issue. “What” the interpretandum means becomes relatively unimportant in comparison with the question of “how” it is realized on the various levels and how its properties on these levels are related to each other. This means that during the processes of aesthetic production and reception the usual interpretants (Ic) based on precoding are put out of action and replaced by new aesthetic interpretants (Iae). In the semiosic matrix an aesthetic semiosis can be represented by detaching a nonprecoded aspect from the interpretandum SG, the aesthetic interpretandum Sae, which is represented as a specifically aesthetic signifier (Rsae) within the organism (O) of the interpreter, and is connected by the aesthetic interpretant (Iae) to the aesthetic signified (Rsae), which also represents the interpretandum Sae. In this way, the autoreflexive circle of the aesthetic semiosis is closed.
4.
Function models of semiosis
The example of aesthetic semiosis has shown that semioses not only render communication possible but can also fulfill other functions. Bühler (1934) distinguished three functions of language in his organon model (cf. § 3.3.6.). Thanks to its reference to objects and facts a sign becomes a “symbol”, i. e., it
fulfills a representational function. As it depends on a sender, it becomes a “symptom” or index, i. e., it fulfills an expressive function. In relation to the receiver, the sign becomes a “signal” that guides his behavior, i. e., it fulfills a directive function. Mukarˇovsky´ (1978) paid particular attention to the polyfunctionality of human action. He distinguished four basic functions in the interaction between subject and object. Taking the focus on subject or object as his parameter, he differentiated between immediate and mediated (i. e., semiotic) functions. With orientation towards the object this leads to (1) the practical and (2) the symbolic functions; with orientation towards the subject, (3) the theoretical and (4) the aesthetic ones result. In the practical and symbolic functions the object dominates, and reality is influenced either directly by means of the object or indirectly by means of signs. In the theoretical function the object is conceptualized cognitively, in the aesthetic function subjectively. In both cases the subject dominates. As regards architecture, Mukarˇovsky´ even envisaged five “functional horizons”. First, the use of a building is defined as its (1) practical function. Secondly, a (2) historical function plays a role, inasmuch as the execution of practical functions is determined by norms developed over time. Thirdly, a building has (3) a social function, which need not coincide with the practical and historical ones because it is determined by the collective organization to which the architect and client belong. Further, a building has (4) an individual function which often expresses itself in the violation of historical norms by the architect or client and therefore provides the potential for innovation. The final functional horizon is (5) the aesthetic purpose. Compared with Mukarˇovsky´’s first model, the scheme of the functional horizons of architecture does not distinguish between the practical and the aesthetic functions; it changes the symbolic function into a social one, and the theoretical one into an individual one. The historical “metafunction” newly appears as a purpose of its own. Drawing on Bühler’s (1934) trifunctional organon, Jakobson (1960) developed a sixtuple model of language functions. It is based on his communication model which has already been described (cf. § 3.3.6.) as featuring the elements “addresser” (sender), “context” (referent), “addressee” (receiver), “message”, “contact” (channel), and “code”. To each of
285
5. Models of semiosis
these elements Jakobson ascribes a special function which may dominate at the expense of the other functions whenever the sender of (verbal) communication concentrates on it. If he concentrates on himself, communication has an “emotive” (i. e., emotional) function, which is identical with what Bühler (1934) called an “expressive function”. If the “context” (referent) predominates, the communication has a “referential” function, which Bühler called a “representational” function. If the emphasis is put on the receiver, the function is predominantly “conative”, which corresponds to Bühler’s “directive function” (Fig. 5.48). REFERENTIAL EMOTIVE
POETIC PHATIC
CONATIVE
METALINGUAL
Fig. 5.48: Jakobson’s model of the six language functions (1960: 357), mirroring the six factors involved in communication (cf. Fig. 5.38).
To Bühler’s three functions Jakobson adds the “poetic”, “phatic” and “metalingual” ones. The poetic function is in the foreground if the sender concentrates on the structure of the “message”. If the communication serves the purpose of building up, prolonging or examining contact with the receiver, it fulfills a “phatic” function (cf. Malinowski 1923). The “metalingual” function fulfills the task of creating a consensus between the sender and the receiver about the code they are using. Preziosi (1979 a, b) employed Jakobson’s sixtuple model of language to describe architecture. Thus, he related Jakobson’s “referential” function to the use of the building, the “metalingual” function to the stylistic-historical allusions made by means of buildings, the “phatic” function to the territorial regulation of contact between users by buildings, the “emotive” function to the way the architect expresses himself individually through his building, the “conative” function to the architect’s behavior towards his client, and the “poetic” function to the building’s aesthetic use. This example shows that Jakobson’s model can be generalized beyond language. It has, in fact, served various authors as a guiding principle for describing the polyfunctionality of semiosis.
5.
Selected references
Aristotle: Aristotelis Opera, ed. Immanuel Bekker. Berlin: Reimer 1831. Arnaud, Antoine and Claude Lancelot (1660), Grammaire ge´ne´rale et raisonne´e. Paris: Estienne. Arnauld, Antoine and Pierre Nicole (1662), La logique, ou l’art de penser. Paris: Estienne. Augustinus, Aurelius: Ausgewählte Schriften. Munich: Kösel 1925. Birdwhistell, Ray L. (1970), Kinesics and Context. Essays on Body Motion Communication. Philadelphia: University of Philadelphia Press. Bolzano, Bernard (1837), Wissenschaftslehre. Sulzbach: von Seidel. English translation by B. Terrell: Theory of Science, ed. J. Berg. Dordrecht: Reidel. Bühler Karl (1934), Sprachtheorie. Jena: Gustav Fischer. English translation by D. F. Goodwin: Theory of Language. Amsterdam: Benjamins 1990. Buyssens, Eric (1943), Les langages et le discours. Brussels: Office de la publicite´ . Buyssens, Eric (1967), La communication et l’articulation linguistique. Brussels: Presses Universitaires. Carnap, Rudolf (1942), Introduction to Semantics. Cambridge MA: Harvard University Press. Carnap, Rudolf (1947), Meaning and Necessity. A Study in Semantics and Modal Logic. Chicago: Chicago University Press. Enlarged edition 1956. Carnap, Rudolf (1972), “Notes on Semantics”, ed. Yehoshua Bar Hillel. Philosophia 2: 1⫺54. Cassirer, Ernst (1923⫺29), Philosophie der symbolischen Formen. 3 vols. Berlin: Bruno Cassirer. Reprint Darmstadt: Wissenschaftliche Buchgesellschaft 1973⫺75. English translation by Ralph Manheim: The Philosophy of Symbolic Forms. 3 vols. New Haven: Yale University Press 1957. Cherry, Colin (1957), On Human Communication. New York: John Wiley. De Fleur, Melvin L. (1966), Theories of Mass Communication. New York: McKay. Eco, Umberto (1976), A Theory of Semiotics. Bloomington IN: Indiana University Press. Fisch, Max H. (1978), “Peirce’s General Theory of Signs”. In: Thomas A. Sebeok (ed.), Sight, Sound, and Sense. Bloomington IN: Indiana University Press: 31⫺70. Frege, Gottlob (1892), “Über Sinn und Bedeutung”. Zeitschrift für Philosophie und philosophische Kritik 100: 25⫺50. English translation: “On Sense and Reference”. In Farhang Zabeeh et al. (eds.), Readings in Semantics. Urbana IL: University of Illinois Press 1974: 118⫺140. Frege, Gottlob (1893), Grundgesetze der Arithmetik, begriffsschriftlich abgeleitet. Vol. 1. Jena. Reprint Hildesheim and New York: Olms 1966.
286 Frege, Gottlob (1903), Grundgesetze der Arithmetik, begriffsschriftlich abgeleitet. Vols. 2. Jena. Reprint Hildesheim and New York: Olms. Partially translated into English by Montgomery Furth: The Basic Laws of Arithmetic: Exposition of the System. Berkeley and Los Angeles: University of California Press 1964. Godel, Robert (1957), Les sources manuscrites du cours de linguistique ge´ ne´ rale. Geneva: Droz.
II. Aspekte der Semiose Morris, Charles W. (1938), Foundations of the Theory of Signs. Chicago: The University of Chicago Press. Morris, Charles W. (1939), “Esthetics and the Theory of Signs”. The Journal of Unified Science 8: 131⫺150. Morris, Charles W. (1946), Signs, Language, and Behavior. Englewood Cliffs: Prentice-Hall.
Hall, Edward T. (1966), The Hidden Dimension. Garden City NY: Doubleday.
Morris, Charles W. (1964), Signification and Significance. Cambridge MA: MIT Press.
Hess-Lüttich, Ernest W. B. (1981), Soziale Interaktion und literarischer Dialog. Vol. I: Grundlagen der Dialoglinguistik. Berlin: Erich Schmidt.
Morris, Charles W. (1971), Writings on the General Theory of Signs, ed. Thomas A. Sebeok. The Hague and Paris: Mouton.
Hjelmslev, Louis (1943), Omkring Sprogteoriens Grundlaeggelse. Copenhagen: Munksgaard. English translation by F. J. Whitfield: Prolegomena to a Theory of Language. Madison WI: University of Wisconsin Press 1961. German translation by R. Keller, U. Scharf and G. Stötzel: Prolegomena zu einer Sprachtheorie. München: Hueber 1974.
Morris, Charles W. (1972), Grundlagen der Zeichentheorie. Ästhetik und Zeichentheorie. Translation of Morris 1938 and Morris 1939 by R. Posner and J. Rehbein. Munich: Hanser.
Husserl, Edmund (1970), Gesammelte Werke. The Hague: Nijhoff.
Nöth, Winfried (1985), Handbuch der Semiotik. Stuttgart: Metzler. English edition: Handbook of Semiotics. Bloomington IN: Indiana University Press 1990.
Jäger, Ludwig (1976), “Saussures historisch-hermeneutische Idee der Sprache”. Linguistik und Didaktik 27: 210⫺244. Jakobson, Roman (1960), “Concluding Statement: Linguistics and Poetics”. In: Thomas A. Sebeok (ed.), Style in Language. Cambridge MA: MIT Press: 350⫺377. Klaus, Georg (1973), Semiotik und Erkenntnistheorie. Berlin: Deutscher Verlag der Wissenschaften. Knilli, Friedrich (1979), “Medium”. In: Werner Faulstich (ed.), Kritische Stichwörter zur Medienwissenschaft. Munich: Fink: 230⫺251. Krampen, Martin (1991), “Structure as Process”. Cahiers Ferdinand de Saussure 45: 201⫺212. Krampen, Martin (1996), “Semiosis in the Mass Media: Modeling a Complex Process”. In: Winfried Nöth (ed.), Semiotics of the Media: State of the Art, Projects and Perspectives. Berlin and New York: Mouton de Gruyter.
Mukarˇovsky´ , Jan (1978), Structure, Sign, and Function. Selected Essays. New Haven and London: Yale University Press.
Occam, William of: Opera Philosophica et Theologica, ed. G. Gal et al. New York: St. Bonaventura 1967. Oehler, Klaus (1981), “Idee und Grundriß der Peirceschen Semiotik”. In: Martin Krampen, Klaus Oehler, Roland Posner and Thure von Uexküll (eds.), Die Welt als Zeichen: Klassiker der modernen Semiotik. Berlin: Severin and Siedler: 15⫺50. English edition: Classics of Semiotics. New York and London: Plenum 1987: 1⫺22. Ogden, Charles K. and Ivor A. Richards (1923), The Meaning of Meaning. New York: Harcourt. Osgood, Charles E. (1953), Method and Theory in Experimental Psychology. New York: Oxford University Press. Osgood, Charles E., George J. Sucy and Percy H. Tannenbaum (1957), The Measurement of Meaning. Urbana IL: University of Illinois Press.
Lambert, Johann Heinrich (1764), Neues Organon. Leipzig: Teubner.
Pavlov, Ivan P. (1927), Conditioned Reflexes. London: Oxford University Press.
Locke, John (1690), An Essay Concerning Human Understanding. London: Basset. Ed. with a foreword by P. H. Nidditch. Oxford: Clarendon 1979.
Peirce, Charles S. (CP), Collected Papers, eds. Charles Hartshorne, Paul Weiss and Arthur W. Burks. 8 vols. Cambridge MA: Belknap Press of Harvard University Press 1931⫺1966.
Maletzke, Gerhard (1963), Psychologie der Massenkommunikation. Hamburg: Verlag Hans Bredow Institut. Malinowski, Bronislaw (1923), The Problem of Meaning in Primitive Languages. In Ogden and Richards 1923: 296⫺336. Meyer-Eppler, Werner (1959), Grundlagen und Anwendung der Informationstheorie. Berlin, Heidelberg and New York: Springer.
Platon: Jubiläumsausgabe sämtlicher Werke zum 2400. Geburtstag, ed. Rudolf Rufener. 8 vols. Zürich: Artemis Verlag 1974. Posner, Roland (1980), “Linguistische Poetik”. In: Hans P. Althaus, Helmut Henne and Herbert E. Wiegand (eds.), Lexikon der germanistischen Linguistik. Tübingen: Niemeyer: 687⫺698. English translation in R. Posner, Rational Discourse and
5. Models of semiosis Poetic Communication. Berlin, New York and Amsterdam: Mouton 1982: 113⫺127. Posner, Roland (1986), “Zur Systematik der Beschreibung verbaler und nonverbaler Kommunikation”. In: Hans-Georg Bosshardt (ed.), Perspektiven auf Sprache. Berlin and New York: Walter de Gruyter: 267⫺314. Posner, Roland (1992), “Syntactics, Semantics, and Pragmatics Revisited half a Century after Their Introduction by Charles W. Morris”. In: Michael Balat and Janice Deledalle-Rhodes (eds.), Signs of Humanity/L’homme et ses signes. Berlin and New York: Mouton de Gruyter: 1349⫺1354. Preziosi, Donald (1979 a), The Semiotics of the Built Environment. Bloomington and London: Indiana University Press. Preziosi, Donald (1979 b), Architecture, Language and Meaning. Berlin, New York and Amsterdam: Mouton. Prieto, Luis J. (1966), Messages et signaux. Paris: Presses Universitaires de France. Prieto, Luis J. (1968), “La se´ miologie”. In: Andre´ Martinet (ed.), Le langage. Paris: Gallimard 1968: 93⫺114. Prieto, Luis J. (1973), “Signe et instrument”. In: Litte´ rature, histoire, linguistique. Recueil d’e´ tudes offert a` Bernard Gagnebin. Lausanne: Editions l’Age d’Homme. Also in Prieto 1975 a: 179⫺196. Prieto Luis J. (1975 a), Etudes de linguistique et de se´ miologie ge´ ne´ rale. Geneva: Librairie Droz. Prieto, Luis J. (1975 b), Pertinence et pratique. Paris: Minuit. Pross, Harry (1972), Medienforschung. Darmstadt: Habel. Reimarus, Hermann Samuel (1756), Die Vernunftlehre als eine Anweisung zum richtigen Gebrauche der Vernunft in der Erkenntnis der Wahrheit, aus zween ganz natürlichen Regeln der Einstimmung und des Widerspruchs. Hamburg: J. C. Bohn. Riley, John W. and Matilda W. Riley (1959), “Mass Communication and the Social System”. In: Robert K. Merton, Leonhard Broom and Leonard S. Cottrell jr. (eds.), Sociology Today. New York: Basic Books: 537⫺578. Saussure, Ferdinand de (1916), Cours de linguistique ge´ ne´ rale. Paris: Payot. English translation by Wade Baskin: Course in General Linguistics. London: Peter Owen 1971.
287 Schramm, Wilbur (1955), “How Communication Works”. In: W. Schramm (ed.), The Process and Effects of Mass Communication. Urbana IL: University of Illinois Press: 3⫺26. Sextus Empiricus: Against Mathematicians. Cambridge MA: Harvard University Press 1949. Shannon, Claude E. and Warren Weaver (1949), The Mathematical Theory of Communication. Urbana IL: University of Illinois Press. Simon, Herbert (1962), “The Architecture of Complexity”. Proceedings of the American Philosophical Society 106: 467⫺482. Stachowiak, Herbert (1965), “Gedanken zu einer allgemeinen Theorie der Modelle”. Studium Generale 18: 432⫺463. Stetter, Christian (1986), “Linguistische Konsequenzen der Semiologie Saussures”. In: Ludwig Jäger and Christian Stetter (eds.), Zeichen und Verstehen. Aachen: Rader: 35⫺52. Suppes, Patrick (1961), “A Comparison of the Meaning and Uses of Models in Mathematics and Empirical Sciences”. In: Hans Freudenthal (ed.), The Concept and the Role of the Model in Mathematics and Natural and Social Sciences. Dordrecht: Reidel: 163⫺174. Tembrock, Günter (1971), Grundriß der Verhaltenswissenschaften. Berlin: Akademie-Verlag. Uexküll, Jakob von (1980), Kompositionslehre der Natur. Ausgewählte Schriften, ed. Thure von Uexküll. Frankfurt a. M., Berlin and Vienna: Ullstein. Uexküll, Thure von (1987), “The Sign Theory of Jakob von Uexküll”. In: Martin Krampen, Klaus Oehler, Roland Posner, Thomas A. Sebeok and Thure von Uexküll (eds.), Classics of Semiotics. New York: Plenum 147⫺159. Ullmann, Stephan (1957), The Principles of Semantics. 2nd edition Glasgow: Jackson, and Oxford: Blackwell. Wilhelm, Karl-Heinz (1971), Graphische Darstellung in Leitung und Organisation. Berlin (DDR): Verlag die Wirtschaft. Wolff, Christian (1755), Melemata MathematicoPhilosophica. Halle: Niemeyer.
Martin Krampen, Ulm (Germany)
288
II. Aspekte der Semiose
6. Der optische Kanal 1. Physikalische, geometrische und ökologische Optik 2. Biologie, Physiologie und Informatik des visuellen Wahrnehmens 3. Visuelles Wahrnehmen als interpretativer Zeichenprozeß oder als Registrierung verfügbarer Stimulus-Information 4. Die visuelle Wahrnehmung von Zeichen 5. Literatur (in Auswahl)
1.
Physikalische, geometrische und ökologische Optik
Die Quantenphysik beschreibt Licht als masselose elektromagnetische Wechselwirkung (Energie), die aufgrund von Lageänderungen von Elektronen in den äußeren Atomschalen (im Bohr-Rutherfordschen Atommodell) gerichtet emittiert und durch einen komplementären Prozeß punktuell absorbiert wird ⫺ bzw. reflektiert wird, was einer quasi-gleichzeitigen Absorption und Re-emission entspricht. Das einzelne Energiequant, Photon, oszilliert dabei quer zur jeweils betrachteten Ausbreitungsrichtung mit einer bestimmten Frequenz (Anzahl von Maxima pro Zeiteinheit) und Wellenlänge (Maxima pro Entfernungseinheit), deren Produkt, die Ausbreitungsgeschwindigkeit, im Vakuum konstant, in anderen Medien um einen je spezifischen Refraktärindex reduziert ist. Beim Übergang des Lichts von einem in ein anderes Medium ändern sich auch die Wellenlänge und die Ausbreitungsrichtung. Die Frequenz (mal
Plancksche Konstante) bestimmt den jeweiligen Energiebetrag der Strahlung, zu dem ein biotischer oder künstlicher Absorptionsmechanismus kompatibel sein muß. Die geometrische Optik betrachtet Licht als gradlinige Projektion von einem Emissions- oder Reflektionspunkt zu einem beliebigen anderen Reflektions- oder Absorptionspunkt. An bestimmten Reflektionspunkten ist eine angulare Deflektion oder Refraktion in der durch die Immissionsrichtung und das Lot im Reflektionspunkt definierten Ausbreitungsebene unter anderem derart beobachtbar, daß der Ausfall- dem Einfallswinkel des Lichts entspricht und der Sinus des Refraktionswinkels (unter üblichen Bedingungen) ein konstantes Verhältnis des Sinus des Einfallswinkels ist; gleichzeitig erfolgt eine ungerichtete Streureflektion. Die Refraktion des Lichts beinhaltet neben der Änderung der Ausbreitungsrichtung auch eine spezifische Änderung der Ausbreitungsgeschwindigkeit, mithin der Wellenlänge und Frequenz (chromatische Aberration). Die meisten gebräuchlichen technischen Anwendungen der Optik ⫺ wie etwa die Konstruktion von Brillen, Fernrohren, Mikroskopen, Fotooptiken usw. ⫺ beruhen auf dieser Art Strahlenoptik. Das (menschliche) Auge kann weitgehend als ein optisches Instrument beschrieben werden. Die ökologische Optik analysiert die Struktur der Umgebungsbeleuchtung, wie sie bei Tag auf der Erde durch die Reverberation des einfallenden Sonnenlichts an opaken und
Abb. 6.1: Die geometrisch-optische Projektion lichtreflektierender Oberflächen zu einem sich bewegenden Projektionszentrum, z. B. einem menschlichen Auge (Prinzip).
6. Der optische Kanal
semi-transparenten bzw. transluzenten Oberflächen entsteht. Auf der Basis spektraler Diskontinuitäten oder Diskontinuitäten der Lichtintensität lassen sich zu einem beliebigen Konvergenzpunkt (Projektionszentrum) verschachtelte Volumenwinkel definieren. Im Fall einer kontinuierlichen Verlagerung des Projektionszentrums erfolgt eine entsprechende Transformation dieser geometrischoptischen Struktur (vgl. Art. 12 sowie im vorliegenden Artikel Abb. 6.1, die auch den Zusammenhang zur geometrischen Optik veranschaulicht). Aufgrund der räumlichen Anordnung der lichtreflektierenden Oberflächen beinhalten die genannten Winkeltransformationen auch den Grenzfall des optischen „Außer-SichtGeratens“ und „Wieder-in-Sicht-Kommens“ eines Teils der Oberflächenanordnung (reversible Okklusion ⫺ umkehrbare Verdeckung). Über die Verlagerung des gerade betrachteten Projektionszentrums hinweg sowie unter veränderten Beleuchtungsbedingungen, Änderungen der Betrachtungsrichtung und lokalen Änderungen innerhalb der überdauernden Oberflächenanordnung bleiben interne Relationen der optischen Struktur unverändert ⫺ invariant; darüber sind komplementär die räumliche Anordnung der lichtreflektierenden Oberflächen, der Weg der Verlagerung des Projektionszentrums und der Weg der Lichtquelle spezifiziert. Ökologische Optik ist auf irdische Realbedingungen angewandte geometrische Optik, die sich ihrerseits quantenphysikalisch fundieren läßt.
2.
Biologie, Physiologie und Informatik des visuellen Wahrnehmens
Evolutionsbiologisch betrachtet ist organismische Lichtsensitivität nicht nur ein Selektionsvorteil, sondern ein Erfordernis. Jenseits einfacher Phototaxis findet sich bei höheren Pflanzen eine Optimierung der Lichtausnutzung entsprechend überdauernder Zyklen von Sonneneinstrahlung: die Pflanzen wachsen in der Regel so zum Licht, daß die besonnte Blattfläche relativ zur Gesamtblattfläche möglichst groß ist. Im Tierreich sind im wesentlichen zwei konträre Geometrien des visuellen Rezeptororgans realisiert: bei den Arthropoden entspricht die Gruppierung der Einzelrezeptoren angenähert einer Kugelaußenfläche, bei den Vertebraten invers annähernd einer Kugelinnenfläche. Beide Prinzi-
289 pien sind insofern äquivalent, als nur die Projektion auf eine Kugel eine gleichbleibend verzerrungsfreie Abbildung bei stationärer Rotation des Rezeptororgans garantiert (bei kompensatorischer Beibehaltung der Blickrichtung, was allerdings nur für die Innenprojektion definierbar ist; vgl. Abb. 6.2).
Abb. 6.2: Die Projektion einer Oberflächentextur auf eine Kugelinnenfläche und auf eine entsprechend, also 4pr2 große ebene Fläche und der Effekt der Rotation bzw. Neigung der Projektionsfläche unter Beibehaltung des Projektionszentrums.
Entsprechend der jeweiligen Lebensweise der verschiedenen Spezies entwickelten sich unterschiedliche Spezialisierungen: gejagte Pflanzenfresser etwa verfügen allgemein über ein panoramisches Blickfeld, und Tiere, die manipulative oder lokomotorische Tätigkeiten in spezifischer Weise visuell kontrollieren, haben in der Regel überlappende binokulare Blickfelder ⫺ bei den Katzen nach vorn, beim Kaninchen nach oben, beim Pferd nach unten gerichtet (vgl. Walls 1942, Gibson 1966, Hughes 1977; siehe auch Abb. 6.3, neu gezeichnet nach Hughes 1977: 624). Zweiäugiges Sehen entspricht einem gleichzeitigen Sehen von zwei disparaten Standorten; es erlaubt im Nahbereich eine genaue Wahrnehmung räumlicher Strukturen (zum Verhältnis zwischen dem Augenbewegungssystem und dem Gleichgewichtssinn vgl. Art. 12 § 3.1.). Biochemisch analysiert besteht der organismische Lichtabsorptionsmechanismus (bei allen bekannten Tierarten mit visueller Wahrnehmung) im wesentlichen in einer alternierenden Restrukturierung eines bzw. verschiedener organischer Moleküle, der Photopigmente (vgl. Pugh 1988). Einzelne Rezeptoren sind gegebenenfalls auf bestimmte Wellenlängen des Lichts spezialisiert (Farbwahrneh-
290
Abb. 6.3: Das vertikale Blickfeld eines Kaninchens (links) und eines Pferdes (rechts). oA ⫽ optische Achse; bF ⫽ binokulares Blickfeld.
mung). Jenseits der molekularen Lichtabsorption besteht visuelles wie alles andere Wahrnehmen nur noch in fließenden Strukturen wandernder elektrischer Potentiale, der relativen Konzentration freier Natrium- und Kaliumione beidseits der semi-permeablen, osmotischen Membran neuronaler Axone und Dendriten, der Sende- und Empfangsantennen der Nervenzellen (siehe Art. 10). Die Neurokybernetik beschreibt die Weiterverarbeitung der registrierten Information. Bis heute wird oft noch angenommen, das Ziel müsse eine abbildende Rekonstruktion des Input sein (siehe Art. 11 § 4. und Art. 84). Eine alternative Metapher ist, daß dem Organismus die empfangene (bzw. aufgesuchte!) Information so verfügbar gemacht werden muß, daß eine situationsangemessene Handlungsregulation und -steuerung möglich ist (vgl. Abb. 6.4). Von Holst und Mittelstaedt (1950) beschreiben die Arbeitsweise des zentralen Nervensystems mit den Begriffen Afferenz, Efferenz und Re-afferenz: die Efferenz reguliert die adäquate motorische Reaktion, und eine Re-afferenz (Rückmeldung an den Rezeptor) wird für die optimale Steuerung des Folgeinput benötigt. Die Afferenz muß dabei den Input in seinen wesentlichen geometrischen und Oberflächeneigen-
II. Aspekte der Semiose
schaften sozusagen analytisch repräsentieren; daß dies im Prinzip möglich ist, zeigen unter anderem die Befunde von Hubel und Wiesel (zusammenfassend 1979) über die kolumnenartige Anordnung kortikaler Zellgruppen (die einem euklidisch-kartesischen Koordinatensystem entspricht!) und die Analysen von Koenderink (1984 a, b) über die funktionale, zeitliche Ordnung in neuronalen Signalstrukturen (zur neuronalen Reizverarbeitung beim Blicken vgl. Art. 12, beim Hören vgl. Art. 7 § 3., beim Tasten vgl. Art. 8 § 4., beim Riechen vgl. Art. 9 § 2.2.).
3.
Visuelles Wahrnehmen als interpretativer Zeichenprozeß oder als Registrierung verfügbarer Stimulus-Information
Man mag annehmen, die Optik beschreibe die Relation von Welt zu Licht, die Biologie/ Physiologie jene von Licht zu Wahrnehmung. Vorausgesetzt, eine semiotische Relation ist erst dann konstituiert, wenn die abbildende Funktion nicht eindeutig umkehrbar (also X nicht eindeutig aus Y rekonstruierbar) ist, so ist die Relation von Welt zu Licht besser als Symmetrie- oder Kongruenzrelation zu bestimmen, denn eine einigermaßen komplexe Anordnung lichtreflektierender Oberflächen ist optisch spezifiziert. Die Relation von Licht zu Wahrnehmung kann unterschiedlich verstanden werden: benutzt man den Begriff Wahrnehmung nur zur Bezeichnung der Beziehung von Stimulus-Information zu beobachtbarem Verhalten, ist möglicherweise gar keine semiotische Beziehung definierbar (abhängig von der empirischen Etablierung von Regel- bzw. Gesetzmäßigkeiten); betrachtet man den Prozeß der neuronalen Signalübermittlung von der rezeptorischen Lichtabsorption bis zur motorischen Efferenz im Detail, bestehen zumindest zwei Möglichkeiten für die Bestimmung einer semiotischen Relation: (1) neuronaler Input und neuronale Signalübermittlung haben Zeichencharakter in bezug auf Licht und/oder Welt; (2) neuronale Organisation, d. h. die Art der neuronalen Analyse des sensorischen Input, ist Zeichen für Welt ⫺ gegebenenfalls erfolgt eine autochthone Semiose.
Abb. 6.4: Minimale Wahrnehmungs-HandlungsKoordination (Prinzip).
Historisch wurden noch weitere Modelle einer optischen Semiose ⫺ visuelle Wahrnehmung als Zeichenprozeß ⫺ entwickelt, die
6. Der optische Kanal
auf einer qualitativen Unterscheidung von Materiellem versus Psychischem beruhen: Aristoteles (384⫺322 v. Chr.) unterschied modalitätsspezifische Objekte der Wahrnehmung, „welche man mit keinem anderen Sinn wahrnehmen und worin man sich nicht täuschen kann“, wie Farbe, Töne, Geschmack usw., von den Sinnen gemeinsamen Objekten ⫺ diese seien: Bewegung und Ruhe (An-) Zahl, Form (Figur, Gestalt) und Größe sowie Einheit bzw. „Eins sein“ (De anima, II 6 und III 1). Gesehen würde demzufolge zunächst nur Farbe. ⫺ Descartes (1641: III 24) behauptete, scheinbar umgekehrt, daß Größe bzw. Ausdehnung in Länge, Breite und Tiefe sowie Gestalt, Bewegung usw. „klarer und deutlicher“ erkennbar seien als Licht, Farben usw. „Erkenntnis“ bezieht sich bei Descartes jedoch auf propositionale Urteile; die Wahrnehmung erscheint als anfällig gegenüber Täuschung. ⫺ Locke (1690: II 8 § 9. und 10.) schließlich unterscheidet explizit zwischen „primären und sekundären Qualitäten“ materieller Gegenstände, wozwischen keine „entdeckbare“ (inhärente) Beziehung bestehe (Locke 1690: IV 3 § 12.): „Qualities thus considered in Bodies are, First such as are utterly inseparable from the Body, […] Solidity, Extension, Figure, and Mobility; […], and Number. 2dly, Such Qualities, which in truth are nothing in the Objects themselves, but Powers to produce various Sensations in us by their primary Qualities, i. e., by the Bulk, Figure, Texture, and Motion of their insensible parts, as Colours, Sounds, Tasts, etc. These I call secondary Qualities“ (Locke 1690: II 8 § 9. und 10.). Den Positionen von Aristoteles bis Locke ist gemeinsam, daß die Wahrnehmung der für uns wichtigsten Eigenschaften der Welt (Form, Größe, Entfernung und Bewegung materieller Gegenstände) nur indirekt erfolgen könne; das Auge registriere nur Licht und Farben, und der „Gemeinsinn“ müsse die objektive Welt erst amodal erschließen oder konstruieren (vgl. Art. 46 § 2.). Berkeley (1709: XII f, IX f und II ff) befand introspektiv, daß Entfernung als solche visuell nicht wahrnehmbar sei und daß die visuelle Wahrnehmung der Entfernung bestimmter Gegenstände nicht auf geometrischer Triangulation beruhen könne (welche eine notwendige Wahrheit konstituieren würde); mithin müßten wir den Begriff der Entfernung aus anderen Erfahrungen gewinnen, z. B. durch die Assoziation wahrgenommener Augenbewegungen (binokulare Kon-
291 vergenz zur Betrachtung naher Gegenstände; XVI f) und/oder das Betasten der Gegenstände (XLV). Da aber visuelle und haptischtaktile Vorstellungen qualitativ verschieden seien (XLIX f, CXI f und CXXVII) und abstrakte Vorstellungen nicht existierten (CXXII f), könne nur gelten: „Visible figures are the marks of tangible figures, […] in themselves they are little regarded, or upon any other score than for their connexion with tangible figures, which by nature they are ordained to signify“ (Berkeley 1709: CXL). Lotze (1852: § 293.) setzt die Möglichkeit der „Raumanschauung“ im Sinne Kants voraus (vgl. jedoch Lotze 1881: 34 f); bestimmte Sinnesorgane, z. B. das Auge, erlaubten die gleichzeitige Registrierung vielfältiger Stimulation in geometrischer Ordnung, so daß, wenn diese Ordnung parallel zum optischen Stimulus registriert wird, ein Mittel zur Rekonstruktion räumlicher Anordnung gegeben sei: „Jeder Farbeindruck r, z. B. roth, bringt auf allen Stellen der Netzhaut, die er trifft, dieselbe Empfindung der Röthe hervor. Nebenbei aber bringt er an jeder dieser verschiedenen Stellen a, b, c einen gewissen Nebeneindruck a, b, g hervor, welcher unabhängig ist von der Natur der gesehenen Farbe und bloß abhängig von der Natur der gereizten Stelle. […] Diese associierten Nebeneindrücke würden nun für die Seele den Leitfaden abgeben, nach welchem sie dasselbe Roth bald an den einen, bald an den anderen Ort […] verlegt. […] Dies ist die Theorie von den Localzeichen“ (Lotze 1881: 31). Lotze (1852) betrachtete die von Charles Bell und Johannes Müller hypostasierte „Spezifität der Sinnesenergien“ (Nervenfasern) als adäquate physiologische Bestätigung seiner psychologischen Hypothese: die genannten „Nebeneindrücke“ könnten auf positiv phototaktischen, reflektorischen Augendrehungen beruhen oder der Erinnerung der „Stellungsgefühle“ der Augenpositionen: „etwas rechts oder links von dieser Richtung [der Stelle des deutlichsten Sehens] sehen, heißt eben gar nichts anderes, als sich der Größe der Leistung bewußt sein, welche nötig wäre, um es [das Auge] in diese Richtung zu bringen“ (Lotze 1881: 33). Helmholtz (1866 ⫽ 1910: 11) definierte, was wir heute „visuelles Wahrnehmen“ nennen, als die Ausbildung von Vorstellungen, Erinnerungsbildern, die sich zusammen mit den je aktuellen sinnlichen Empfindungen zu bestimmten Anschauungen, Wahrnehmungen, ergänzten; ausschließlich auf Sinnesemp-
292 findung basierende Anschauungen nannte Helmholtz „Perzeptionen“. Die „allgemeine Regel“, nach der sich dieser Prozeß gestalte, sei: „daß wir stets solche Objekte als im Gesichtsfeld vorhanden uns vorstellen, wie sie vorhanden sein müßten, um unter den gewöhnlichen normalen Bedingungen des Gebrauchs unserer Augen denselben Eindruck auf den Nervenapparat hervorzubringen“ (Helmholtz 1910: 4) und: „Die psychischen Tätigkeiten, durch welche wir zu dem Urteil kommen, daß ein bestimmtes Objekt von bestimmter Beschaffenheit an einem bestimmten Orte außer uns vorhanden sei, sind im allgemeinen nicht bewußte Tätigkeiten, sondern unbewußte. Sie sind in ihrem Resultate einem Schlusse gleich […]“ (Helmholtz 1910: 5), genauer: „unbewußt vollführte Induktionsschlüsse“ (Helmholtz 1910: 25) bzw. „Analogieschlüsse“ (Helmholtz 1910: 6). Der skizzierte Schlußfolgerungsprozeß hat allerdings nur begrenzt semiotischen Charakter, denn: „Jene unbewußten Analogieschlüsse treten aber ferner, eben weil sie nicht Akte des freien bewußten Denkens sind, mit zwingender Notwendigkeit auf, und ihre Wirkung kann nicht durch bessere Einsicht in den Zusammenhang der Sache aufgehoben werden“ (Helmholtz 1910: 6). ⫺ „Die Art dieses Zeichens ist […] mir durch die Natur meiner Sinnesorgane und meines Geistes aufgedrungen. Dadurch unterscheidet sich diese Zeichensprache unserer Vorstellungen von den willkürlich gewählten Laut- und Buchstabenzeichen unserer Rede und Schrift“ (Helmholtz 1910: 22). Wie diese naturgegebene Semiotik etwa in der „Raumwahrnehmung“ funktioniert, erläutert Helmholtz zum Beispiel für die Bewegungsparallaxe wie folgt: „Es ist leicht ersichtlich, daß die scheinbare Geschwindigkeit der Winkelverschiebungen der Gegenstände im Gesichtsfelde hierbei ihrer wahren Entfernung umgekehrt proportional sein muß, so daß aus der Geschwindigkeit der scheinbaren Bewegung sichere Schlüsse auf die wahre Entfernung gemacht werden können“ (Helmholtz 1910: 247; vgl. Art. 84 § 2.2.). Die empiristischen Theoretiker Berkeley, Lotze und Helmholtz nehmen an, daß optische Information per se keine hinreichende Basis zur Rekonstruktion von „Welt“ ist; diese Information müsse vielmehr mit anders gearteter Information assoziiert (Berkeley: Tastempfindung; Lotze: Augenbewegungen) oder mathematisch und deduktiv bearbeitet werden (Helmholtz).
II. Aspekte der Semiose
Köhler (1920) versuchte, auf der Basis seinerzeit neuerer feld- und systemtheoretischer Modelle der Physik, den bis dahin akzeptierten psychophysischen Parallelismus oder Dualismus monistisch aufzulösen. Die üblichen optischen Reizbedingungen seien „summativ geometrische Mannigfaltigkeiten“ (Köhler 1920: 194), die sowohl physisch/ physiologisch wie psychologisch/phänomenal eine zueinander isomorphe, übersummativ gestalthafte Gliederung derart erführen, daß „im Prinzip eine Hirnbeobachtung denkbar [ist], welche in Gestalt- und deshalb in wesentlichsten Eigenschaften Ähnliches physikalisch erkennen würde, wie der Untersuchte phänomenal erlebt“ (Köhler 1920: 193 Fußnote 1; Hervorhebungen nivelliert). Die phänomenale Organisation einer Reizvorlage in Figur und Grund läßt sich nach Köhler durch die größere elektrische Energiedichte der Figur erklären. Wahrnehmung erscheint in der Gestalttheorie nur noch als einstufiger Prozeß; die Relation zwischen Licht(reiz) und Wahrnehmung ist ebenso strikt gesetzmäßig wie die zwischen Welt und Licht. Wie sich die Reizgeometrie ordnet, ist jedoch von den Systemeigenschaften des Gehirns abhängig; deshalb ist eine objektive Erkenntnis von Welt letztlich unmöglich ⫺ mit anderen Worten: Wahrnehmung ist autochthones Zeichen für Welt. Gibson (1966; 1979) entwirft eine ökologische Theorie der Wahrnehmungs-Handlungs-Koordination; d. h.: die Relation Welt⫺ Licht⫺Wahrnehmung wird von Anfang an als eine reziproke, re-afferente, betrachtet (siehe auch Art. 8 § 4.). Geometrisch-optische Invarianzen spezifizieren Handlungsmöglichkeiten, statt Wahrnehmungserlebnisse zu determinieren. Durch aktive Exploration der verfügbaren optischen Information ist komplementär das beobachtende Subjekt ebenso spezifiziert wie die relativ überdauernde Oberflächenanordnung und Ereignisstruktur der Umgebung. Wiederum am Beispiel der Bewegungsperspektive läßt sich zeigen, daß die Geometrie des optischen Fließens direkt registrier- und neurokybernetisch nutzbar ist. Damit entfällt die Unterscheidung zwischen primären und sekundären Qualitäten ebenso wie die Notwendigkeit der Assoziation von Visuellem und Taktilem bzw. von Lokalzeichen oder unbewußten Schlußfolgerungen, und die Organisation des Wahrnehmungseindrucks erfolgt nicht länger autochthon im Gehirn, sondern koordiniert im Biotop (Le-
293
6. Der optische Kanal
bewesen-Umwelt-System) als Ganzem (siehe auch Art. 12 § 1. und 4.). Eine allgemein akzeptierte Auffassung des visuellen Wahrnehmungsprozesses existiert nicht. Die drei einflußreichsten Theorien ⫺ Empirismus (Helmholtz), Gestalttheorie (Köhler) und der ökologische Ansatz (Gibson) ⫺ analysieren Wahrnehmung auf unterschiedlichen Ebenen der physikalischen und biologischen Beschreibung der Stimulus-Information und des Organismus. Als Index oder Maß für eine erfolgte Wahrnehmung wird entweder der Erlebnisbericht von Versuchspersonen als phänomenales Datum akzeptiert oder aber nur ein beobachtbares Verhalten bzw. ein neuronales Geschehen (evozierte Potentiale). Den Stand der Diskussion zur Gestalttheorie repräsentieren Pomerantz und Kubovy (1981; 1986), eine Verteidigung der Helmholtzschen Position versuchen Rock (1977) und Hochberg (1979), und die Diskussion über den ökologischen Ansatz wird einerseits theoretisch-methodologisch geführt (Ullman 1980, Fodor und Pylyshyn 1981, Turvey u. a. 1981), andererseits publizierte Cutting (1986) empirische Forschung, die den Ansatz weiter präzisiert.
4.
Die visuelle Wahrnehmung von Zeichen
Die visuelle Wahrnehmung von expliziten Zeichen, z. B. von Bildern, Schrift, Gesten usw., ist ein gleichzeitiges Registrieren zweier Ebenen von Information und Spezifikation: ein Wahrnehmen der Tatsache, daß eine Zeichenrelation realisiert ist, und, worauf sie sich bezieht. Abbilden ⫺ zum Zweck von Kommunikation ⫺ erfolgt entweder abstraktiv oder mit dem expliziten Ziel der Replikation. Die in der Renaissance systematisch entwickelten Prinzipien exakt reproduzierenden Abbildens konnten später in der Synthese mit materialisierter geometrischer Optik in der Fototechnik und Computergraphik automatisiert werden; die Toleranz der meisten Betrachter gegenüber inkorrekten Betrachtungsstandpunkten kann mit der begleitenden Registrierung der Orientierung der Bildoberfläche erklärt werden. Nicht-replikatives Abbilden kommt durch jede andere Art (chiro-)graphischer Betätigung zustande. Viele Bilder, insbesondere des östlichen Kulturkreises, sind besser als Schriften oder Beschreibungen zu
sehen ⫺ „inkorrekte (Zentral-)Perspektive“ ist dann entweder ein tatsächlicher Fehler oder war von Anfang an nicht intendiert. Ähnlich wird beim Filmschnitt nicht versucht, Ereignisfolgen zu replizieren, sondern Aspekte zu verdichten. Dem Film eignet ebenso wie dem einzelnen Bild die Begrenzung, den Standort bzw. Beobachtungsweg des Betrachters vorauszubestimmen. Lesen erfordert in jedem Fall die Beherrschung des zugrunde liegenden Kodes, zusätzlich aber eine Einübung in Differenzierungen des Typs „Invarianzextraktion“ (Gibson 1966), z. B. bezüglich Handschriften. Tatsächlich handelt es sich um eine mehrfach semiotische Relation: das visuell wahrnehmbare, geschriebene Wort bezieht sich auf eine akustisch-auditive Invarianz mit bestimmter Pragmatik (Verwendung in der Umgangssprache in gegebenen Kontexten); Art, Anlaß und Kontext der schriftlichen Verwendung und Registrierung erlauben vielfältige Interpretationen über Autor, Referenz usw. Gestik und Mimik konstituieren ein Zeichensystem, das zum Teil direkte visuelle Wahrnehmung im Sinne von Handlungskoordination erlaubt, zum Teil jedoch wie eine Sprache gelernt werden muß (man vergleiche interkulturell die unterschiedlichen Begrüßungsgesten). Spezielle Zeichensysteme, bei denen es auf Eindeutigkeit und leichte Verständlichkeit ankommt, z. B. Verkehrszeichen, versucht man gestisch zu gestalten und ebenso darzubieten (als Piktogramme, d. h. quasi-realistische, aber verallgemeinernde Bilder) ⫺ am deutlichsten erkennbar beim sogenannten Richtungspfeil.
5.
Literatur (in Auswahl)
Aristoteles (384⫺322 v. Chr.), De anima. Deutsche Ausgabe. Ed. E. Rolfes. Bonn: Hanstein 1901. Berkeley, George (1709), An Essay towards a New Theory of Vision. Dublin: Pepyat. Cutting, James E. (1986), Perception with an Eye for Motion. Cambridge, MA: MIT Press. Descartes, Rene´ (1641), Meditationes de prima philosophia. Paris. Deutsche Ausgabe. Ed. Lüder Gäbe. Hamburg: Meiner 1904: 1959. Fodor, Jerry A. und Zenon W. Pylyshyn (1981), „How Direct Is Visual Perception? Some Reflections on Gibson’s ‘Ecological Approach’ “. Cognition 9: 139⫺196.
294 Gibson, James Jerome (1966), The Senses Considered as Perceptual Systems. Boston: HoughtonMifflin. Gibson, James Jerome (1979), The Ecological Approach to Visual Perception. Boston: HoughtonMifflin. Gregory, R. L. (1970), The Intelligent Eye. New York: McGraw Hill. Helmholtz, Hermann Ludwig Ferdinand von (1866), Handbuch der physiologischen Optik. Bd. 3: Die Lehre von den Gesichtswahrnehmungen. Ed. Johannes von Kries. Hamburg und Leipzig: Voss, 3. Auflage 1910. Hochberg, Julian E. (1979), „Sensation and Perception“. In: E. Hearst (ed.), Experimental psychology at 100. Hillsdale, NJ: Erlbaum. Holst, Erich von und Horst Mittelstaedt (1950), „Das Reafferenzprinzip“. Die Naturwissenschaften 37: 464⫺476. Hubel, David H. und Torsten N. Wiesel (1979), „Brain Mechanisms of Vision“. Scientific American 241: 130⫺144. Hughes, Austin (1977), „The Topography of Vision in Mammals of Contrasting Life Style: Comparative Optics and Retinal Organization“. In: Frederick Crescitelli (ed.), Handbook of Sensory Physiology. Bd. VII/5: The Visual System in Vertebrates. Berlin, Heidelberg, New York und Tokio: Springer: 613⫺756. Koenderink, Jan J. (1984 a), „Simultaneous Order in Nervous Nets from a Functional Standpoint“. Biological Cybernetics 50: 35⫺41. Koenderink, Jan J. (1984 b), „Geometrical Structures Determined by the Functional Order in Nervous Nets“. Biological Cybernetics 50: 43⫺50. Köhler, Wolfgang (1920), Die physischen Gestalten in Ruhe und im stationären Zustand. Braunschweig: Vieweg. Locke, John (1690), An Essay Concerning Human Understanding. London: Bassett.
II. Aspekte der Semiose Lotze, Rudolph Hermann (1852), Medicinische Psychologie oder Physiologie der Seele. Leipzig: Weidmann. Lotze, Rudolph Hermann (1881), Dictate aus den Vorlesungen. Leipzig: Hirzel [8 Einzelhefte]. Pomerantz, James R. und Michael Kubovy (1981), „Perceptual Organization: An Overview“. In: Michael Kubovy und James R. Pomerantz (eds.), Perceptual Organization. Hillsdale, NJ: Erlbaum: 423⫺456. Pomerantz, James R. und Michael Kubovy (1986), „Theoretical Approaches to Perceptual Organization ⫺ Simplicity and Likelihood Principles“. In: Kenneth R. Boff, Lloyd Kaufman und James P. Thomas (eds.), Handbook of Perception and Human Performance. Bd. 2: Cognitive Processes and Performance. New York: Wiley [Kap. 36, 46 S.]. Pugh, Edward N., Jr. (1988), „Vision: Physics and Retinal Physiology“. In: Richard C. Atkinson, Richard J. Herrnstein, Gardner Lindzey und R. Duncan Luce (eds.), Steven’s Handbook of Experimental Psychology. Bd. 1: Perception and Motivation. 2. Aufl. New York: Wiley: 75⫺163. Rock, Irvin (1977), „In Defense of Unconscious Inference“. In: William Epstein (ed.), Stability and Constancy in Visual Perception: Mechanisms and Processes. New York: Wiley: 321⫺373. Rock, Irvin (1983), The Logic of Perception. Cambridge, MA: MIT Press. Turvey, Michael T., Robert E. Shaw, Edward S. Reed und William M. Mace (1981), „Ecological Laws of Perceiving and Acting: In Reply to Fodor and Pylyshyn“. Cognition 9: 237⫺304. Ullman, Shimon (1980), „Against Direct Perception“. The Behavioral and Brain Sciences 3: 373⫺415. Walls, Gordon Lynn (1942), The Vertebrate Eye and Its Adaptive Radiation. New York: Hafner.
Klaus Landwehr, Wuppertal (Deutschland)
7. Der akustische Kanal 1. 2. 3. 4. 5.
Der physikalische Reiz Leistungen des Gehörs: Psychophysik Das Ohr und die neuronale Reizverarbeitung Wahrnehmung akustischer Zeichen Akustische Aspekte der Wahrnehmung gesprochener Sprache 6. Akustische Grundlagen der Musik 7. Richtungsweisendes und selektives Hören 8. Literatur (in Auswahl)
1.
Der physikalische Reiz
Ein akustisches Zeichen ist ein Schallereignis. Schall ist eine mechanische Schwingung, d. h. die Wechselbewegung von Molekülen eines elastischen Mediums wie Luft, Wasser oder Knochen, die sich wellenförmig ausbreitet. Es werden periodische und nichtperiodische Schwingungen unterschieden. Die einfachste
295
7. Der akustische Kanal
Form ist die harmonische Schwingung; sie wird auch „Sinuston“ oder „reiner Ton“ genannt.
Abb. 7.1: Harmonische Schwingung: Schalldruck (p) in Abhängigkeit von der Zeit (t) mit der maximalen Amplitude (pˆ) und der Periodendauer T ⫽ 1/f; f ist die Frequenz. Oben: Longitudinalwelle, unten: Transversalwelle.
Die Anzahl der vollen Schwingungen (Abstand der Maxima) pro Sekunde wird „Frequenz“ genannt und in Hertz (Hz) angegeben. Eine periodische Schwingung (Klang) setzt sich aus mehreren harmonischen Schwingungen zusammen, deren Frequenz in einem ganzzahligen Verhältnis zu der des Grundtons steht. Bei nicht periodischen Schwingungen unterscheidet man stochastische Schwingungen (Rauschen), deterministische Dauerschwingungen (Klangmuster, Sprache, Musik) und einmalige Schallvorgänge (Transienten, auch in Sprache und Musik enthalten). Die Zerlegung von komplexen Schwingungsformen in ihre Sinuskomponenten geschieht durch die Berechnung des Frequenzspektrums (Fourieranalyse). Mit Hilfe dieses mathematischen Ver-
Abb. 7.2: Periodische Schwingung (Klang) als Frequenzmischung: der Zeitverlauf der Amplitude (ps) setzt sich beispielsweise aus zwei harmonischen Schwingungen (p1 und p2) zusammen.
fahrens ist es möglich, jeden beliebigen Schwingungsvorgang als Summe von Sinuswellen zu beschreiben. Die wichtigste Schallfeldgröße ist der Schalldruck (genauer Schallwechseldruck). Er gibt an, wie sich am Ort der Messung (Ohr, Mikrofon) der Luftdruck ändert. Er ist dem sogenannten „Ruhedruck“ (dem atmosphärischen Druck) überlagert. Die Amplitude ist der Maximalwert des Schalldrucks, er wird in Pascal gemessen (s. Abb. 7.1). In der Akustik wird als Maß für die Schallintensität der Schalldruckpegel benutzt und in Dezibel (dB) angegeben. Der Schalldruckpegel ist das Zehnfache des dekadischen Logarithmus des Verhältnisses des Schalldrucks zu dem Bezugsschalldruck (20 mPa). Meßgeräte zur Bestimmung des Schalldruckes und des Schalldruckpegels bestehen aus einem Mikrofon, einem Verstärker, einem Frequenzfilter, einem Effektivwertbilder und einer Registrierung bzw. Anzeige. Als Frequenzfilter können ein A-Bewertungsfilter, das den Verlauf der Hörempfindlichkeit für Sinustöne mit niedrigen Schalldruckpegeln berücksichtigt, benutzt werden sowie zur Messung bei verschiedenen Frequenzen Oktav-, Terz- oder Schmalbandfilter.
2.
Leistungen des Gehörs: Psychophysik
Der für den Menschen hörbare Schall (Hörschall) liegt im Frequenzbereich von 16 bis 16 000 Hz (⫽ 16 kHz), zwischen der Hörschwelle von etwa 20 mPa und der Schmerzgrenze bei etwa 10 mPa, d. h. zwischen 0 und 130 dB. Die Schädigungsgrenze des Gehörs für langfristige Schalleinwirkungen liegt bei etwa 85 dB. Bei schwerhörigen Personen ist das Hörfeld insbesondere bei höheren Frequenzen stark eingeschränkt. Tiere können Töne mit wesentlich höheren Frequenzen wahrnehmen (Hunde bis 50 kHz, Vögel bis 21 kHz, Tümmler bis 150 kHz, Fledermäuse bis 120 kHz). Beim Hören wird ein Schallereignis durch die sensorische Erfassung (den Wahrnehmungsvorgang) in ein Hörereignis transformiert. Die Psychophysik untersucht seit Mitte des 19. Jahrhunderts diesen Zusammenhang (Weber, Fechner, Helmholtz). Die Lautstärke ist das Merkmal eines Hörereignisses, welches anhand einer Skala nach laut⫺leise bewertet wird. Der Lautstärkepegel, das Maß der Lautstärke, entspricht vor-
296 wiegend dem Schalldruckpegel des Schallereignisses. Der Lautstärkepegel ist der Schalldruckpegel eines 1 kHz Sinustons, welcher gleich laut wahrgenommen wird wie das zu beurteilende Schallereignis. Er wird in phon angegeben. Die Lautheit ist das Maß der subjektiven Lautstärke; sie wird durch die psychologische Beurteilung eines Schallereignisses als doppelt oder halb so laut wie ein anderes definiert. Die Einheit der Lautheit ist das son (nach Stevens): liegen die Lautstärkepegel über 40 phon, dann entspricht die Verdoppelung der Lautheit eines Schallereignisses der Zunahme des Lautstärkepegels von 10 phon. Wird der Schalldruckpegel um etwa 1 dB verändert, so entsteht ein für den Menschen gerade noch merkbarer Unterschied in der Lautstärke (Unterschiedsschwelle). Die Tonhöhe ist ein Merkmal des Hörereignisses, das anhand einer Skala nach hoch⫺tief bewertet wird und vorwiegend (aber nicht ausschließlich) der Frequenz des Schallereignisses entspricht. Das Maß für die Tonhöheempfindung ist die Tonheit, sie wird in mel angegeben. Die Richtung einer Schallquelle kann, vor allem aufgrund binauraler Interaktion, gut (5∞⫺10∞ Ungenauigkeit) bis sehr gut (auf etwa 1∞ genau) bestimmt wer-
II. Aspekte der Semiose
den. Die Entfernungswahrnehmung ist hingegen stark erfahrungsabhängig und oft großen Fehlern unterworfen.
3.
Das Ohr und die neuronale Reizverarbeitung
Das Ohr besteht aus dem äußeren Ohr, das als Resonator die Schallwellen 2- bis 3-fach verstärkt, dem Mittelohr, das den Schall vom Trommelfell kommend über die Gehörknöchelchen (Hammer, Amboß, Steigbügel) in der luftgefüllten Paukenhöhle zum ovalen Fenster und damit zum Innenohr vermittelt, und schließlich dem Innenohr, das die Schnecke (Cochlea) mit dem Gehörorgan (Basilarmembran und das Cortische Organ mit den Haarzellen) umfaßt und zusammen mit dem Vestibularapparat mit den drei Bogengängen des Gleichgewichtssinnes eine anatomische Einheit bildet. Die Gehörknöchelchen mindern die Auslenkung der Schwingungen im Verhältnis von 1,3 : 1 bei gleichzeitiger Kraftverstärkung von 1 : 20. Die Schallwellen treffen von außen auf das Ohr und werden in der Cochlea in neuronale Erregung transformiert. Dort versetzen sie,
Abb. 7.3: Hörfläche (Schalldruckpegel L, Schalldruck p, Schallintensität I über der Frequenz f) des menschlichen Gehörs, begrenzt durch die Hörschwelle für Sinustöne, sowie durch die Schmerzgrenze und die Grenze für eine Gefährdung des Gehörs; zusätzlich angegeben sind der Pegel-Frequenz-Bereich Sprache und Musik.
297
7. Der akustische Kanal
Abb. 7.4: Das menschliche Ohr: 1. Ohrmuschel, 2. Gehörgang, 3. Trommelfell, 4. Amboß, 5. Hammer, 6. Steigbügel, 7. Ovales Fenster, 8. Paukenhöhle, 9. Schnecke, 10. Bogengänge, 11. Hörnerv.
Abb. 7.5: Stark vereinfachtes Schema der Hörbahn im Gehirn des Menschen.
wie G. v. Be´ke´sy um 1930 untersucht hat, die Basilarmembran in Schwingungen, wodurch die Rezeptoren (Haarzellen) gereizt werden, wobei der Ort der Reizung entlang der Basilarmembran mit der Frequenz korreliert ist. Die neuronalen Signale werden über die Hörbahn (Stammhirn mit den Olivenkernen, Colliculus inferior im Mittelhirn) in das im Temporallappen des Cortex gelegene primäre Hörzentrum geleitet. Jede Hirnhälfte erhält
dabei Signale von beiden Ohren. Die Wirkungsweise der neuronalen Analyse ist noch nicht abschließend geklärt (vgl. Art. 6 § 2., Art. 8 § 4. und Art. 9 § 2. über die neuronale Verarbeitung optischer, taktiler und chemischer Reize). Das Richtungshören wird mit der oberen Olive (im Stammhirn) in Zusammenhang gebracht. Die Wahrnehmung von Lautheit und Tonhöhe ist auch ohne Mitwirkung des Cortex möglich, nicht jedoch die auf den zeitlichen Verlauf komplexer akustischer Signale bezogene Analyse, die Voraussetzung der Wahrnehmung von Sprache und Musik ist.
4.
Wahrnehmung akustischer Zeichen
Die neuronale Verarbeitung akustischer Reize resultiert normalerweise in einer mentalen Repräsentation, einem Wahrnehmungseindruck. (Eine der Ausnahmen stellt der Habituationseffekt dar: das gleichmäßige Ticken einer Wanduhr wird nach einiger Zeit nicht mehr wahrgenommen, wird aber bei entsprechender Ausrichtung der Aufmerksamkeit wieder hörbar.) Die Beziehungen zwischen dem Reiz und seiner Wahrnehmung sind komplex; selbst bei einfachen Beziehungen wie derjenigen von Frequenz und wahrgenommener Tonhöhe ergibt sich keine eindeutige, durch eine mathematische Funktion beschreibbare Entsprechung (Fusionseffekte, Schwebungen und Differenztöne oder virtuelle Grundfrequenzen sind Beispiele für diese Komplexität). Beeindruckend ist insbesondere die völlig unterschiedliche Repräsentation dynamischer, d. h. in der Zeit variierender Reizcharakteristika. Kurzzeitige Schalldruckschwankungen (ca. 20 Hz bis ⬎ 10 kHz, also 0,1 bis 50 msec) stellen die Hauptursache des Tonhöheneindrucks dar. Langsamere Schwankungen werden hingegen als Klangfarben- oder Intensitätsänderungen wahrgenommen (z. B. Vibrato, typischerweise 6⫺7 Hz). Binaurale Differenzen hinsichtlich der Ankunftszeit kohärenter Signale von etwa 23 bis 690 msec geben Anlaß zur räumlichen Repräsentation einer Schallquelle. Kohärente Signale, die 1 bis ca. 50 msec später eintreffen, ändern den Lokalisationseindruck nicht mehr, erhöhen aber die wahrgenommene Lautheit und Klangfülle; bei noch längerem Abstand stellt sich ein Echoeindruck ein. Nicht kohärente Signale ergeben im allgemeinen trennbare Repräsentationen, doch kann die schnelle Aufeinan-
298 derfolge zweier Signale erst dann zuverlässig beurteilt werden, wenn ihr Abstand mindestens 20 msec beträgt. Umgekehrt stellt eine Zeitspanne von etwa 2 sec eine Obergrenze dar, jenseits derer keine Integration verschiedener akustischer Reize in eine Repräsentation mehr möglich ist. Scheinbar autochthon erfolgen Gestaltbildungen. Selbst gleichmäßig repetierende Geräusche (Ticken, Pochen) fügen sich zu wechselnden rhythmischen Figuren, die sich vom Grund (z. B. Umgebungsgeräusche verschiedenster Art) abheben. Bereits um 1890 hat Chr. v. Ehrenfels auf die Gestaltqualität akustischer Figuren aufmerksam gemacht, vor allem auf ihre Transponierbarkeit: ein musikalisches Motiv ist auch in anderer Tonlage (und auch bei noch weitergehender Variation) erkennbar. Wenn unterschiedliche gestaltbildende Faktoren miteinander in Konflikt stehen, können illusionäre Gestalten zustande kommen (beispielsweise die von Diana Deutsch (1982) beschriebene Tonleitertäuschung, „scale illusion“). Bei der Gestaltbildung sind auch erworbene Schemata (sprachliche, musikalische usw.) von Bedeutung: musikalische Übung erleichtert das Wiedererkennen variierter Motive, Kenntnis der Sprache (Muttersprache) erlaubt es, zerstörte, etwa von einem Niesen überdeckte Phoneme zu ergänzen ⫺ und zwar so gut, daß das Niesen rückblickend nicht mehr zeitlich eingeordnet werden kann (Warren 1970: „phonemic restauration“). Akustische Reize geben auch zu Synästhesien Anlaß, beispielsweise zu Farbempfindungen (was individuell sehr unterschiedlich ausgeprägt ist). Wolfgang Köhler (1947) hat für das von ihm erfundene Lautpaar „maluma⫺takete“ konsistente Zuordnungen zu einem Figurenpaar gefunden (runde und spitze Figur, Abb. 7.6). Ähnliches gilt für
II. Aspekte der Semiose
lautmalerische Wörter („dumpf“, „klirren“). Im weiteren Sinn sind semantische Konnotationen bestimmter akustischer Signale zu werten, die z. B. ihre Eignung als Warnsignal bestimmen. Hier haben wir semiotische Qualitäten akustischer Reize vor uns.
5.
Bei der Sprachwahrnehmung geht man davon aus, daß verschiedene Stufen der Sprachverarbeitung simultan ablaufen müssen, denn nur so kann verstanden werden, daß ein Sprachlaut mit einer Frequenz von 1000 Hz je nach seiner Eingebundenheit in den sprachlichen Kontext als p vor i oder als k vor a wahrgenommen wird. Theorien der Sprachwahrnehmung haben das innere Nachsprechen des Gehörten oder die Analyse der phonetischen Muster durch Vergleich mit intern synthetisierten betont. Die Phonetik befaßt sich mit der Produktion (artikulatorische), der Übermittlung (akustische) und der Wahrnehmung von Sprache (auditive Phonetik). In der artikulatorischen Phonetik wird eine Lautanalyse nach ihrem Artikulationsort (Mund, Rachen, Lippen) und nach ihrer Artikulationsart (nasal, stimmlos, stimmhaft) vorgenommen. Die akustische Phonetik beschreibt den Sprachlaut nach seinen physikalischen Eigenschaften (Dauer, Frequenz, Intensität). Die auditive Phonetik umfaßt die Analyse der sprachlichen Zeichen durch die Wahrnehmung. Die von der artikulatorischen und akustischen Phonetik ausgearbeiteten Merkmale beschreiben in Kombination die Phoneme. So sind die 38 Phoneme der deutschen Sprache durch 12 distinktive Merkmale gekennzeichnet, die den Gruppen der Sonoritätsmerkmale (abrupt⫺dauernd) und der Tönungsmerkmale (tief⫺nicht tief) zugeordnet werden können.
6.
Abb. 7.6: Das von Wolfgang Köhler erfundene Figuren-Laut-Paar „maluma-takete“.
Akustische Aspekte der Wahrnehmung gesprochener Sprache
Akustische Grundlagen der Musik
Drei Grunddimensionen lassen sich unterscheiden: (1) aus Tonintervallen zusammengesetzte melodische Gestalten, mit der Stimmung (Kammerton a’, heute meist 440 Hz) als normativem Bezugspunkt der Tonhöhe, (2) durch Transienten, Pausen und Intensi-
299
7. Der akustische Kanal
tätsakzente markierte rhythmische Gestalten, deren Bezugssystem die Taktstruktur ist, (3) Klangfarbe (schon von H. v. Helmholtz als Obertonspektrum beschrieben). Die systematische kompositorische Nutzung von Klangfarbe ist relativ jung (Schönberg, Fünf Stücke für Orchester, op. 16), während die beiden erstgenannten Dimensionen von jeher konstitutiv für Musik sind (vgl. Art. 81). Hinzu kommt die stark von der abendländischen musikalischen Tradition, vor allem seit dem 18. Jahrhundert, ausgeprägte Dimension der Harmonik, d. h. des Zusammenklangs mehrerer in unterschiedlicher Tonhöhe geführter Stimmen vor dem Hintergrund einer Grundtonart als Referenz (die im 19. Jahrhundert zunehmend aufgelöst wird) und einer Kadenzform als zugehöriger normativer Gestalt. Neuere psychologische Untersuchungen haben ergeben, daß das Gefüge der Tonartbeziehungen nicht als eine Dimension, sondern eher als helixartige Struktur zu verstehen ist (Shepard 1982). Schließlich spielt in Ausnahmefällen auch die räumliche Anordnung der Schallquellen eine musikalisch bedeutsame Rolle.
7.
Richtungsweisendes und selektives Hören
Hören ist ungerichtet insofern, als wir ein akustisches Signal wahrnehmen können, ohne daß unsere Aufmerksamkeit bereits auf die Schallquelle gerichtet ist. Im Gegensatz zum Sehen ist das Hören nicht auf einen Ausschnitt der Umgebung begrenzt. Es ist aber wegen der Fähigkeit des Gehörs zur Lokalisierung einer Schallquelle auch richtungsweisend und kann z. B. durch Lenkung des Blikkes die Rezeption von Zeichen anderer Modalität ermöglichen. Darüber hinaus ist Hören auch selektiv. Die Aufmerksamkeit des Hörers kann auf akustische Zeichen gerichtet werden, die von einer bestimmten Quelle herrühren, was durch räumliche Lokalisierbarkeit, höhere Lautstärke und besondere Klangfarbe der Zeichen erleichtert wird. (Das von Cherry 1953 beschriebene „CocktailParty-Phänomen“ gehört hierher, nämlich unsere Fähigkeit, auf einer Party, wo alle reden, jemand Bestimmtem zuzuhören, ebenso die zahlreichen Versuche zum „dichotischen Hören“; Überblick bei Hawkins und Presson 1986). Die Ansicht, daß Sprache als artikulierter Laut prädestiniert ist, als Zeichen zu dienen,
ist oft vertreten worden (u. a. von Aristoteles, Herder, W. v. Humboldt; siehe Art. 40 § 3.2.2. und Art. 77 § 1.). Soeben ist eine biologischökologische Begründung für die besondere Eignung akustisch vermittelter Zeichen für die Kommunikation gegeben worden: die Ungerichtetheit des Gehörs. Ein zweiter Grund besteht darin, daß die Produktion komplexer Reizmuster (eine unerläßliche Voraussetzung für die Produktion einer Vielzahl arbiträrer Zeichen) möglichst schnell vor sich gehen muß und nicht mit der Ausführung handwerklicher Tätigkeit oder der Fortbewegung interferieren darf. Beide Bedingungen werden nur vom akustischen Kanal erfüllt.
8.
Literatur (in Auswahl)
Be´ke´sy, G. v. (1960), Experiments in Hearing. New York: McGraw-Hill. Blauert, J. (1974), Räumliches Hören. Stuttgart: Hirzel. Erw. Fassung: Spatial Hearing. Cambridge, MA: MIT Press 1983. Boff, K. R., L. Kaufman und J. P. Thomas (eds.) (1986), Handbook of Perception and Human Performance. 2 Bde. New York: Wiley [besonders Kap. 1, 14, 15, 26, 27, 32]. Carterette, E. C. und M. P. Friedman (eds.) (1974⫺78), Handbook of Perception. 10 Bde. New York: Academic Press [besonders Bd. 4: Hearing, sowie Bd. 3, Kap. 19, Bd. 7, Kap. 6, Bd. 8, Kap. 6 und 9]. Cherry, C. (1953), On Human Communication. Cambridge, MA: MIT Press. Deutsch von P. Müller: Kommunikationsforschung: eine neue Wissenschaft. Frankfurt a. M.: Fischer. Deutsch, D. (ed.) (1982), The Psychology of Music. New York: Academic Press. Hawkins, H. L. und J. C. Presson (1986), „Auditory Information Processing“. In: Boff, Kaufman und Thomas 1986: II 1⫺64. Helmholtz, H. v. (1863), Die Lehre von den Tonempfindungen als physiologische Grundlage für die Theorie der Musik. Braunschweig: Vieweg. Hörmann, H. (1967), Psychologie der Sprache. Berlin: Springer. Verbesserte 2. Auflage 1977. Keidel, W. D. und W. D. Neff (eds.) (1975), Handbook of Sensory Physiology. Bd. 5: The Auditory System. New York: Springer. Klinke, R. und Hartmann, R. (eds.) (1983), Hearing: Physiological Bases and Psychophysics. New York: Springer. Köhler, W. (1947), Gestalt Psychology. New York: Liveright. Moore, B. C. J. (1982), Psychology of Hearing. London: Academic Press.
300
II. Aspekte der Semiose
Rieländer, M. M. (1982), Reallexikon der Akustik. Frankfurt a. M.: Bochinsky. Shepard, R. (1982), „Structural Representations of Musical Pitch“. In: Deutsch 1982: 343⫺390. Skudrzyk, E. (1971), The Foundations of Acoustics. Wien: Springer. Stevens, S. S. and H. Davis (1938), Hearing: Its Psychology and Physiology. New York: Wiley.
Teas, D. (1989), „Auditory Physiology: Present Trends“. Annual Review of Psychology 40: 404⫺ 429. Warren, R. M. (1970), „Perceptual Restoration of Missing Speech Sounds“. Science 167: 392⫺393. Zwicker, E. (1982), Psychoakustik. Berlin: Springer.
Gerhard Strube, Freiburg, und Gerda Lazarus, Bochum (Deutschland)
8. Der taktile Kanal 1. Neurale Substrate des taktilen Kanals 1.1. Rezeptoren 1.2. Kortikale Projektionen 2. Die Empfindlichkeit des taktilen Kanals 3. Unmittelbare Verhaltenssteuerung 4. Innere Repräsentationen auf der Grundlage taktiler Information 4.1. Wahrnehmung von Formen 4.2. Wahrnehmung von Oberflächenmerkmalen 4.3. Wahrnehmung von räumlichen Anordnungen 4.4. Tastvorstellungen 5. Taktile Semiose und Wirklichkeit 6. Literatur (in Auswahl)
Die Rezeptorfläche des taktilen Kanals ist außerordentlich groß: die Rezeptoren sind über den gesamten Bereich der behaarten und unbehaarten Haut des Menschen verteilt. Sobald beim Tasten Körperglieder bewegt werden, kommen zusätzliche Rezeptoren in den Muskeln, Sehnen und Gelenken hinzu. Gemeinsam ist den Rezeptoren, daß sie mechanische Größen registrieren, z. B. Verformungen der Haut, Bewegung von Haaren, Spannung und Länge von Muskeln.
1.
Neurale Substrate des taktilen Kanals
1.1. Rezeptoren Die Rezeptoren in der Haut des Menschen lassen sich zum einen nach histologischen Gesichtspunkten klassifizieren. An einem Extrem finden sich verzweigte freie Nervenendigungen, am anderen Extrem relativ komplexe eingekapselte Strukturen. Zum anderen ist eine funktionelle Klassifikation möglich,
z. B. nach Art der rezeptiven Felder. In der menschlichen Hand beispielsweise lassen sich vier Typen unterscheiden (Vallbo und Johansson 1984). Jeweils zwei adaptieren schnell (FA) bzw. langsam (SA) an eine konstante Deformation der Haut. Die Typen FA I und SA I besitzen kleine wohldefinierte rezeptive Felder auf der Hautoberfläche, die Typen FA II und SA II große und weniger scharf definierte. Beim aktiven Tasten sind neben den Rezeptoren der Haut solche in den Muskeln, Sehnen und Gelenken (Propriozeptoren) von Bedeutung. Die Propriozeptoren erfassen in erster Linie Gelenkstellungen, Muskelspannungen und Muskellängen. Neben ihrer Rolle beim aktiven Tasten haben sie eine besondere Bedeutung für die Wahrnehmung von Körperbewegungen. 1.2. Kortikale Projektionen Die Rezeptoren der Haut besitzen unterschiedliche Dichte in den verschiedenen Regionen der Körperoberfläche. Diese ungleichmäßige Verteilung spiegelt sich in der Verzerrung der kortikalen Projektion wider; eine kortikale Projektion ist die Abbildung einer Rezeptorfläche auf die Oberfläche des Großhirns nach dem Kriterium, welche Orte von welchen Orten der Rezeptorfläche her erregt werden können (vgl. auch Art. 12 § 3.3.). Der sensorische Homunculus des primären somatosensorischen Cortex besitzt z. B. sehr große Hände und ein sehr großes Gesicht, während Arme, Beine und Rumpf sehr klein sind (siehe Abb. 8.1). Projektionen der Körperoberfläche finden sich nicht nur im somatosensorischen Cortex,
301
8. Der taktile Kanal
Abb. 8.1: Der „sensorische Homunculus“. Die unterschiedlich großen Projektionsfelder der verschiedenen Körperteile reflektieren die unterschiedliche Dichte von Rezeptoren (nach Penfield und Rasmussen 1950).
sondern auch im davor gelegenen primären motorischen Cortex (vgl. Brooks 1969). Die Funktion dieser Projektionen, die in der Regel komplizierter sind als die im primären somatosensorischen Cortex, kann in einer engen Kopplung zwischen der Information des taktilen Kanals und der Bewegungssteuerung gesehen werden.
2.
Die Empfindlichkeit des taktilen Kanals
Die Empfindlichkeit eines sensorischen Kanals läßt sich nach verschiedenen Kriterien beurteilen. Traditionell wird nach räumlicher, zeitlicher und Intensitäts-Auflösung gefragt. Die jüngsten umfassenden Daten zur Empfindlichkeit des taktilen Kanals werden von Weinstein (1968) berichtet. Intensitätsschwellen variieren zwischen 5 mg (Nase, Wange, Oberlippe von Frauen) und 355 mg (großer Zeh von Männern). Generell ist die Druckempfindlichkeit im Gesicht und am Rumpf am größten und am Fuß am kleinsten. Die Finger besitzen eine relativ geringe Druckempfindlichkeit; ihre Empfindlichkeit für Vibrationen ist dagegen außerordentlich groß verglichen mit der Empfindlichkeit anderer Körperregionen (Wilska 1954).
Die räumliche Auflösung wird traditionell mit Hilfe der Zweipunkt-Schwelle untersucht. Das ist der Abstand zweier Reizpunkte, bei dem der Beobachter mit gleicher Wahrscheinlichkeit eine oder zwei Berührungen erlebt. Mit einem Wert von 5 mm und weniger fand Weinstein (1968) die kleinsten Zweipunkt-Schwellen an den Fingerkuppen und der Oberlippe; die geringste räumliche Auflösung mit Zweipunkt-Schwellen von 40 mm und mehr fand sich an Wade, Rücken und Oberarm. Wichtig sind die Unterschiede zwischen den verschiedenen Körperregionen, nicht aber die absoluten Werte. Andere Methoden zur Untersuchung der räumlichen Auflösung lassen die Empfindlichkeit des taktilen Kanals wesentlich größer erscheinen als die relativ hohen Werte der ZweipunktSchwellen (z. B. Loomis und Collins 1978). Die zeitliche Auflösung des taktilen Kanals wurde u. a. mit einem Verfahren untersucht, das der Zweipunkt-Schwelle analog ist: bei zwei sukzessiv dargebotenen Reizen muß der Beobachter angeben, ob er eine oder zwei Berührungen erlebt hat. Bei Reizen von 1 ms Dauer fand Gescheider (1974) z. B. eine Schwelle im Bereich von 5⫺6 ms. Insgesamt ist die zeitliche Auflösung des taktilen Kanals besser als die des visuellen, aber schlechter als die des akustischen Kanals (siehe Art. 6 und 7). Den peripheren Teilen des taktilen Kanals kann man die Funktion einer räumlichen und zeitlichen Filterung zuschreiben. Die Filtereigenschaften sind teilweise durch die mechanischen Eigenschaften der Haut, teilweise aber auch durch die physiologischen Eigenschaften der Rezeptoren bedingt. Durch die räumliche Filterung wird zum Beispiel aus der scharfen Kante eines auf der Haut aufliegenden Gegenstandes eine allmähliche räumliche Änderung; analog wird durch die zeitliche Filterung aus einem abrupten Reizbeginn ein allmählicher Beginn. Der Signifikant, der schließlich als Grundlage einer Semiose zur Verfügung steht, weicht durch diese Filterung deutlich vom Interpretandum ab (siehe Art. 5 § 1.2.).
3.
Unmittelbare Verhaltenssteuerung
Taktile Information kann das Gebrauchsverhalten in direkter und automatischer Weise beeinflussen. Im Alltag ist ein solches Phänomen gelegentlich zu beobachten, wenn man beim Gehen gegen ein unerwartetes Hinder-
302
II. Aspekte der Semiose
nis stößt; die Reaktionen zur Aufrechterhaltung des Gleichgewichts scheinen in der Regel schon begonnen oder auch beendet zu sein, bevor sich das Erleben eines Hindernisses einstellt. Entsprechende angepaßte Reaktionen auf taktile Reizung der Bein-Vorderseite lassen sich bei Katzen beobachten, deren Zentralnervensystem im oberen Rückenmarkbereich durchtrennt ist; eine Vermittlung durch höhere Ebenen kann hier ausgeschlossen werden. Von besonderer Bedeutung ist die unmittelbare Verhaltenssteuerung durch den taktilen Kanal bei feinen Manipulationen mit Händen und Fingern. Wenn z. B. die Fingerkuppen anästhesiert sind, kann die Kraft beim Ergreifen eines Objektes mit Daumen und Zeigefinger nicht mehr adäquat an die Oberflächenstruktur angepaßt werden (glatte Flächen erfordern größere Kräfte als rauhe Flächen). Während eine solche Anpassung normalerweise vor und zu Beginn des Hebens vollzogen wird, erfolgt sie bei gefühllosen Fingern allenfalls allmählich im Verlauf mehrerer Hebungen (s. Johansson und Westling 1984).
4.
Zeichen (Muster in einer 3⫻2-Punkte-Matrix). Kompliziertere Geräte erlauben auch die Darstellung von Buchstaben durch das Muster aktiver Vibratoren in einer größeren Matrix. Insgesamt, so scheint es, sind die Leistungen beim taktilen und visuellen Erkennen von Buchstaben unterschiedlichster Art nicht dramatisch verschieden voneinander, sofern die geringere räumliche Auflösung des taktilen Kanals durch eine entsprechende optische Filterung der visuell dargebotenen Buchstaben ausgeglichen wird (vgl. Abb. 8.2). Beim normalen Braille-Lesen werden die Finger über die Zeichen bewegt, so daß ein dynamisches Reizmuster auf der Haut entsteht. Die relative Bewegung zwischen Haut
Innere Repräsentationen auf der Grundlage taktiler Information
Wahrnehmungen können sich auf Gegenstände in der Umwelt (objektiv) oder Zustände unseres eigenen Körpers (subjektiv) beziehen. Verschiedene sensorische Kanäle unterscheiden sich im Grad der Objektivierung ihrer Information; Sehen und Schmerz kennzeichnen die Extreme, bei denen zum einen der objektive Pol und zum anderen der subjektive Pol dominiert. Der taktile Kanal nimmt eine Zwischenstellung ein; Katz (1925) spricht von einer Bipolarität. Der Grad der Objektivierung hängt hier u. a. von der Körperregion ab, ganz wesentlich aber auch davon, ob der tastende Körperteil passiv ist oder bewegt wird. Wenn man z. B. mit der einen Hand die andere betastet, fühlt die aktive Hand ein Objekt, während die passive Hand befühlt wird. 4.1. Wahrnehmung von Formen Am gründlichsten untersucht ist das taktile Erkennen von Buchstaben. Dieser Forschungsschwerpunkt entstand aus dem Bemühen, Lesehilfen für Blinde zur Verfügung zu stellen. Im einfachsten Fall werden erhobene Buchstaben dargeboten oder Braille-
Abb. 8.2: Horizontale Fingerbewegungen beim beidhändigen Lesen von Braille-Schrift. Gezeigt sind die Positionen von linkem (obere Kurven) und rechtem (untere Kurven) Zeigefinger in Abhängigkeit von der Zeit bei vier verschiedenen Lesern. Im obersten Diagramm sind die Bewegungen parallel, im zweitobersten Diagramm findet sich eine leichte Lösung der Parallelität, die im zweituntersten Diagramm am deutlichsten ist: der erste Teil jeder Zeile wird von der linken Hand gelesen, der letzte Teil von der rechten, und in der Mitte gibt es einen Bereich, in dem die Zeichen von beiden Fingern gleichzeitig erfaßt werden. Im untersten Diagramm ist die linke Hand an der Erfassung der Buchstaben nicht beteiligt, unterstützt aber wohl vor allem das Treffen des Anfangs der jeweils nächsten Zeile und erhöht so die Geschwindigkeit gegenüber einhändigem Lesen (nach Bertelson u. a. 1985).
8. Der taktile Kanal
und Reizmuster läßt sich auch dadurch herstellen, daß bei ruhendem Finger das Zeichen über die Matrix von Vibratoren bewegt wird (sequentielle Darbietung). Wird der Finger zum Tasten benutzt, so bringt die sequentielle Darbietung in der Regel keinen Leistungsvorteil. Wird dagegen die Handfläche oder der Rumpf gereizt, so werden die Buchstaben bei sequentieller Darbietung genauer erkannt als bei simultaner Darbietung. Wahrscheinlich ist die räumliche Auflösung dieser Körperregionen für die simultane Darbietung zu gering, so daß Unterscheidungsmerkmale der verschiedenen Zeichen nicht mehr erkannt werden können (Loomis 1981). Unter bestimmten Bedingungen lassen sich beim taktilen Erkennen von Zeichen systematische Rechts-links-Vertauschungen beobachten. Das ist der Fall beim aktiven Betasten von Mustern, die vom Beobachter abgewandt sind (Oldfield und Phillips 1983), ferner beim Erkennen von Mustern, die auf die Stirn oder die nach vorn gerichtete Seite der Hand gezeichnet werden (Parsons und Shimojo 1987). Nach Corcoran (1977) werden die Zeichen so wahrgenommen, als würden sie von einer Stelle oberhalb und hinter dem Beobachter gesehen (jeweils auf einer transparenten Fläche). Diese Hypothese faßt einen großen Teil der vorliegenden Befunde adäquat zusammen. Das Erkennen eines Zeichens wird durch ein zeitlich und/oder räumlich eng benachbartes Muster beeinträchtigt. Dieses als Maskierung bezeichnete Phänomen findet sich auch im visuellen Kanal. Die Beeinträchtigung ist stärker, wenn ein zeitlich folgendes Muster ebenfalls ein Zeichen ist (z. B. ein Buchstabe), als wenn es sich um ein bedeutungsloses Muster handelt wie z. B. eine vollständig aktivierte Vibrator-Matrix (Craig 1982). Die Maskierung ist demnach zumindest teilweise auf zentrale Zeichenprozesse zurückzuführen. Seit der Untersuchung Gibsons (1962) ist die Auffassung verbreitet, daß aktives Tasten ein genaueres Erkennen von Formen erlaubt als passives Tasten (siehe auch Art. 6 § 3. und 4.). In den Untersuchungen zu diesem Problemkreis werden in der Regel keine Buchstaben verwendet, sondern bekannte oder unbekannte zweidimensionale Formen (etwa der Art, wie sie beim Ausstechen von Kuchenteig benutzt werden). Tatsächlich bestätigen die meisten nachfolgenden Untersuchungen die Überlegenheit des aktiven Tastens.
303 Die Ursache dieser Überlegenheit kann zum einen in der Dynamik der Reizmuster beim aktiven Tasten gesehen werden: beim Erkennen von Buchstaben erbrachten sequentielle Reizmuster aber nicht unbedingt Vorteile gegenüber statischen. Zum anderen kann die Beteiligung der Propriozeptoren zur Überlegenheit des aktiven Tastens beitragen. Bei relativ großen Formen zeigten Magee und Kennedy (1980), daß die Kinästhesie für das genauere Erkennen kritisch war. Das Erkennen war dann am genauesten, wenn die Hand passiv über den Reiz geführt wurde; die aktive Bewegung an sich führte zu einer Verschlechterung der Leistung, wahrscheinlich, weil die Information der Propriozeptoren in diesem Fall weniger genau der zu erkennenden Form entsprach. 4.2. Wahrnehmung von Oberflächenmerkmalen Der taktile Kanal liefert Information über Oberflächenmerkmale, die anderen sensorischen Kanälen nur schlecht oder gar nicht zugänglich sind. Katz (1925) berichtet z. B. von den Tastfertigkeiten „gewitzigter Tuch- und Teppichhändler“. Ein Problem bei der systematischen Untersuchung der Wahrnehmung von Oberflächenmerkmalen ist es, daß diese oft nur schwer mit Hilfe objektiver Begriffe zu beschreiben sind. Die Reizmerkmale für die Wahrnehmung von Härte, Elastizität, Viskosität, Klebrigkeit, Öligkeit, Zähigkeit usw. sind kaum bekannt. Nur das Merkmal der Rauheit ist umfassender untersucht. Auf den ersten Blick könnte man meinen, daß der Eindruck der Rauheit einer Oberfläche wesentlich mit der Reibung zwischen Haut und Fläche zu tun habe. Das scheint aber nicht der Fall zu sein; das Urteil über die Rauheit wird kaum von der Geschwindigkeit beeinflußt, mit der das Reizobjekt relativ zur Haut bewegt wird (Lederman 1983). Es steigt aber deutlich an, wenn die Kraft, mit der das Reizobjekt gegen die Haut gedrückt wird, steigt (Ledermann 1974). Vermutlich geht der Eindruck der Rauheit in erster Linie auf Merkmale der Momentan-Deformation der Hautoberfläche zurück. Dafür sprechen auch die Befunde von Johansson und Westling (1984), nach denen die Anpassung der GreifKraft an die Oberflächenmerkmale von Objekten teilweise schon erfolgt, bevor das Objekt gehoben wird. 4.3. Wahrnehmung von räumlichen Anordnungen Bei der Wahrnehmung der räumlichen Anordnung von Objekten tritt die Bedeutung der Haut-Rezeptoren gegenüber der der Pro-
304
II. Aspekte der Semiose
priozeptoren zurück. Blumenfeld (1937) zeigte systematische Verzerrungen, wie sie auch bei der visuellen Wahrnehmung in reduzierten Reizfeldern zu beobachten sind. Wenn z. B. Linien so eingestellt werden, daß sie parallel auf den Beobachter zuzulaufen scheinen, so wächst ihr tatsächlicher Abstand mit abnehmender Distanz; eine objektiv gerade Linie in einer frontoparallelen Ebene erscheint, wenn sie betastet wird, gekrümmt, und zwar mit der konvexen Seite zum Beobachter hin. Ausführlich untersucht ist die LTäuschung (vgl. z. B. Marchetti und Lederman 1983): Distanzen entlang der Tangente an einen Kreis um die Mitte des Rumpfes des Beobachters erscheinen kleiner als gleich große Distanzen entlang einer radialen Linie. 4.4. Tastvorstellungen Introspektive Berichte über Vorstellungen sind ein recht fragwürdiges Datenmaterial. Wenn z. B. Katz (1925) darlegt, daß Tastvorstellungen immer auch einen tastenden Körperteil einschließen, so ist die Gültigkeit einer solchen Aussage kaum zu überprüfen. Erst in den letzten Jahren ist es gelungen, nicht-introspektive Methoden zur Untersuchung von Vorstellungen zu entwickeln (vgl. Art. 13 § 2.3.). Eines der grundlegenden Ergebnisse betrifft den Zeitaufwand für die mentale Rotation (vgl. z. B. Shepard und Metzler 1971): wenn zwei Reize verglichen werden müssen, die mit unterschiedlichen Orientierungen dargeboten werden, so steigt die für den Vergleich benötigte Zeit mit dem Unterschied in der Orientierung. Grundlage dafür ist wahrscheinlich die mentale Rotation des einen Reizes in die Orientierung des anderen, die um so mehr Zeit erfordert, je größer der Orientierungs-Unterschied ist. Entsprechende Ergebnisse erhält man auch bei der Verwendung taktiler Reize (Carpenter und Eisenberg 1978). Im Hinblick auf die mentale Rotation scheinen taktile Vorstellungen also auf gleiche Weise transformiert werden zu können wie visuelle.
5.
Taktile Semiose und Wirklichkeit
Durch Philosophie und Psychologie zieht sich der Gedanke, daß der Tastsinn der „Lehrer“ der anderen Sinne sei; in den Worten von Katz (1925: 256): „Das Getastete ist das eigentlich Wirkliche“. Betrachtet man die Beziehungen verschiedener sensorischer Kanäle untereinander, so
entstehen Zweifel am Primat des taktilen Kanals. Normalerweise finden sich systematische Kovarianzen zwischen verschiedenen Kanälen, die durch die identische Umwelt, auf die sich die Kanäle beziehen, verursacht sind. Diese Kovarianzen lassen sich aber künstlich verändern, z. B. mit Hilfe von Prismenbrillen, die die visuelle Wahrnehmung verzerren. In diesem Fall dominiert die visuelle Information typischerweise über die taktil-kinästhetische („visual capture“); eine durch eine Prismenbrille gekrümmt erscheinende Kante fühlt sich tatsächlich gekrümmt an, obwohl sie in Wirklichkeit gerade ist (zur visuellen Wahrnehmung vgl. Art. 6). Die generelle Dominanz des visuellen Kanals ist kein zwingendes Argument dafür, daß er am besten die Rekonstruktion der Wirklichkeit erlaubt. Andererseits aber ist es nur schwer vorstellbar, daß im Verlauf der Evolution ein vergleichsweise wenig valider Kanal eine solche Dominanz entwickeln sollte. Auf alle Fälle liefern die Befunde zur Verarbeitung diskrepanter Information verschiedener sensorischer Kanäle keine Argumente für die These, daß dem Getasteten der Charakter des eigentlich Wirklichen zukomme (vgl. Abb. 8.3). Möglicherweise ist die Frage, welcher sensorische Kanal am ehesten eine veridikale Rekonstruktion der Umwelt erlaubt, von vornherein falsch gestellt. Wahrnehmung steht im Dienste der Handlungssteuerung; wichtig ist, daß sie ein erfolgreiches Handeln ermöglicht. Der taktile Kanal ist nun sehr eng an unser Verhalten, unsere Bewegungen, gebunden, und so kann es zu dem Eindruck kommen, er liefere das Validitätskriterium für alle anderen sensorischen Kanäle, während es in Wirklichkeit der Erfolg oder Mißerfolg unseres Handelns ist. Das sei am Beispiel der Größenkonstanz erläutert, das von Katz (1925: 256) als Beispiel der „Unterrichtung des Sehens durch das Tasten“ genannt wird. Wenn ein Objekt seine Entfernung von den Augen vergrößert, so schrumpft das Bild auf der Netzhaut proportional der Distanz. Trotz des kleiner werdenden Netzhautbildes sehen wir, bei nicht zu großen Entfernungen, ein Objekt konstanter Größe. Nach Katz könnte dieses Konstanzphänomen vom Tastsinn übernommen sein, denn die getastete Größe des Objektes ändert sich ja nicht mit der Distanz. Grundlage der Größenkonstanz könnte aber auch Erfolg/Mißerfolg unseres Handelns sein: beim Eingreifen eines Objek-
305
8. Der taktile Kanal
dann, wenn gesehenes und getastetes Muster übereinstimmen, auch das vorgegebene und das reproduzierte Muster übereinstimmen. Der Blick auf die Funktion der Wahrnehmung für die Handlungssteuerung statt für die Veridikalität innerer Repräsentationen wird selbstverständlich, sobald man nicht mehr nur Menschen betrachtet. Die Frage, ob die Wahrnehmung eines Krebses veridikal ist oder nicht, erscheint absurd. Veridikalität ist ja schließlich nur in Bezug auf eine nichtnaive Wahrnehmung der Welt definiert, eine Wahrnehmung mit Hilfe von Linealen, Waagen und anderen Hilfsmitteln der Physik. Welche Bedeutung könnte die Veridikalität der Wahrnehmung nach einem solchen Kriterium für einen Krebs haben, solange er sicher unter seinem Stein hockt?
Abb. 8.3: Vorgegebene Bewegungsbahn (durchgezogene Linie), gesehene Bahn der Handbewegung (gestrichelte Linie) und Endpunkte tatsächlich ausgeführter Bewegungen bei mit Hilfe einer Spiegelanordnung verfälschter visueller Lokalisation der eigenen Hand. Die verzerrte visuelle Wahrnehmung induziert eine Abweichung der Bewegung von der geraden Bahn, obwohl diese Abweichung im Prinzip taktil-kinästhetisch erfaßt werden kann (nach Nielsen 1963).
tes werden die Finger antizipatorisch geöffnet, und zwar mit einer Weite, die an seine Größe angepaßt ist (Jeannerod 1984). Diese Handlung wird nur dann erfolgreich sein, wenn Größenkonstanz vorliegt. Unter dem Gesichtspunkt, daß das Validitätskriterium für alle sensorischen Kanäle das erfolgreiche Handeln ist, tritt die Frage nach der Veridikalität der Interpretation sensorischer Information in den Hintergrund. Entgegen einem naheliegenden Eindruck erfordert eine erfolgreiche Handlungssteuerung nämlich keine veridikale Wahrnehmung der Umwelt. Erfolgreiche Handlungssteuerung und damit erfolgreiches Verhalten ist auch dann möglich, wenn es eine Komplementarität von Fehlern gibt. Damit sind Fehler bei der Interpretation verschiedener sensorischer Kanäle gemeint, die einander ausgleichen. Die sowohl beim Sehen wie auch beim Tasten vorhandene L-Täuschung ermöglicht es zum Beispiel, ein gesehenes L richtig abzuzeichnen (ohne Sehen der Hand): wenn das gesehene und das getastete Muster in gleicher Weise vom tatsächlichen Muster abweichen, werden
6.
Literatur (in Auswahl)
Blumenfeld, W. (1937), „The Relationship between the Optical and Haptic Construction of Space“. Acta Psychologica 2: 125⫺174. Bertelson, P., P. Mousty und G. D’Alimonte (1985), „A Study of Braille Reading: 2. Patterns of Hand-Activity in One-Handed and Two-Handed Reading“. Quarterly Journal of Experimental Psychology 37A: 235⫺256. Brooks, V. B. (1969), „Information Processing in the Motorsensory Cortex“. In: K. N. Leibovic (ed.), Information Processing in the Nervous System. Berlin: Springer. Carpenter, P. A. und P. Eisenberg (1978), „Mental Rotation and the Frame of Reference in Blind and Sighted Individuals“. Perception and Psychophysics 23: 117⫺124. Corcoran, D. W. (1977), „The Phenomena of the Disembodied Eye or Is It a Matter of Personal Geography?“. Perception 6: 247⫺253. Craig, J. C. (1982), „Vibrotactile Masking: A Comparison of Energy and Pattern Maskers“. Perception and Psychophysics 31: 523⫺529. Gescheider, G. A. (1974), „Temporal Relations in Cutaneous Stimulation“. In: F. A. Geldard (ed.), Cutaneous Communication Systems and Devices. Austin, Tex.: Psychonomic Society. Gibson, J. J. (1962), „Observations on Active Touch“. Psychological Review 69: 477⫺490. Jeannerod, M. (1984), „The Timing of Natural Prehension Movements“. Journal of Motor Behavior 16: 235⫺254. Johansson, R. S. und G. Westling (1984), „Role of Glabrous Skin Receptors and Sensorimotor Memory in Automatic Control of Precision Grip when Lifting Rougher or More Slippery Objects“. Experimental Brain Research 56: 550⫺564.
306
II. Aspekte der Semiose
Katz, D. (1925), „Der Aufbau der Tastwelt“. Zeitschrift für Psychologie, Ergänzungsband 11. Lederman, S. J. (1974), „Tactile Roughness of Grooved Surfaces: The Touching Process and Effects of Macro- and Microsurface Structure“. Perception and Psychophysics 16: 385⫺395. Lederman, S. J. (1983), „Tactual Roughness Perception: Spatial and Temporal Determinants“. Canadian Journal of Psychology 37: 498⫺511. Loomis, J. M. (1981), „Tactile Pattern Perception“. Perception 10: 5⫺27. Loomis, J. M. und C. C. Collins (1978), „Sensitivity to Shifts of a Point Stimulus: An Instance of Tactile Hyperacuity“. Perception and Psychophysics 24: 487⫺492. Magee, L. E. und J. M. Kennedy (1980), „Exploring Pictures Tactually“. Nature 283: 287⫺288. Marchetti, F. M. und S. J. Lederman (1983), „The Haptic Radial-Tangential Effect: Two Tests of Wong’s ‘Moments of Inertia’ Hypothesis“. Bulletin of the Psychonomic Society 21: 43⫺46. Nielsen, T. J. (1963), „Volition: A New Experimental Approach“. Scandinavian Journal of Psychology 4: 225⫺230.
Oldfield, S. R. und J. R. Phillips (1983), „The Spatial Characteristics of Tactile Form Perception“. Perception 12: 615⫺626. Parsons, L. M. und S. Shimojo (1987), „Perceived Spatial Organisation of Cutaneous Patterns on Surfaces of the Human Body in Various Positions“. Journal of Experimental Psychology: Human Perception and Performance 13: 488⫺504. Penfield, W. und T. Rasmussen (1950), The Cerebral Cortex of Man. New York: Macmillan. Shepard, R. N. und J. Metzler (1971), „Mental Rotation of Three-Dimensional Objects“. Science 171: 701⫺703. Vallbo, A. und R. S. Johansson (1984), „Properties of Cutaneous Mechanoreceptors in the Human Hand Related to Touch Sensation“. Human Neurobiology 3: 3⫺14. Weinstein, S. (1968), „Intensive and Extensive Aspects of Tactile Sensitivity as a Function of Body Part, Sex, and Laterality“. In: D. R. Kenshalo (ed.), The Skin Senses. Springfield, Ill.: Thomas. Wilska, A. (1954), „On the Vibrational Sensitivity in Different Regions of the Body Surface“. Acta Physiologica Scandinavica 31: 285⫺289.
Herbert Heuer, Dortmund (Deutschland)
9. Chemical channels 1. Biology of chemical channels 2. Chemical channels in primates and humans 2.1. The channel of taste 2.2. The channel of smell 2.3. Flavor combines smell, taste and other sensory channels 3. Selected references
1.
Biology of chemical channels
Chemical channels belong to the oldest tools of orientation in space and of interindividual interaction in the evolution of living beings. A well-known demonstration of a chemical channel in a simple single-cell living being is provided by the bacterium Escherichia coli. This cell is equipped with flagella, which enable it to freely move in fluids. When a small amount of a toxic substance, e. g., phenol, is dropped into water, we observe that the bacterium immediately stops moving and then changes its direction of movement away from the site of high phenol concentration. If glu-
cose or amino acids are dissolved in the fluid, the bacterium changes its arbitrary direction and moves towards the site of the highest concentration. Such behavior demonstrates that bacteria are able to detect the nature and concentration of chemicals in their environment and to transpose this information into appropriate motor actions. Usually, we name this simplest form of chemical channel “chemotaxis”. The chemicals function as signs of environmental conditions whose detection and interpretation help the cell to survive. Detection of chemical signs has been found in many other single-cell organisms (cf. Art. 20), and it is known that this ability plays an important role in the growth, organization and functioning of single cells within a complex organism. A good example is the system of defense against infection in mammals when bacteria have invaded the body through a small wound in the skin. White blood cells in high concentration then arrive at the site of the invading bacteria in order
9. Chemical channels
to destroy them. They detect the location of infection by means of chemical signs in the form of proteins released by the bacteria (cf. Art. 21). Another example of chemical channels comes from insects. Many insects produce chemicals in excretory glands which help
307 them to communicate with others of the same species. These chemical signs play a particularly important part in copulation, and the substances are regarded as being the outward counterpart of hormones (which regulate the internal body functions). They are named “pheromones” (Shorey 1976). For example,
Fig. 9.1: Molecules of soluble or vaporized substances function as signs in the sensory channels of taste and smell: a) Acetic acid tastes sour and smells pungent. b) Hydrogen sulfides often smell putrid. The shown substance buthylmercaptane was isolated from the skunk’s secretion. c) Many nitrogenous molecules taste bitter and many of them (the alkaloids), such as nicotine, are poisonous. d) The two chemicals shown in (1) and (2) were isolated from Bulgarian rose oil (Ohloff 1990). (1) is the substance damascenone, which is predominantly responsible for the floral odor of roses. A slight change in the molecule produces an odorless substance, which is also present in rose oil in high concentrations. Its structure diagram is identical with the odorous substance except for the lower left part. In the odorless substance the molecular component separated by dashed lines is replaced by the component shown in (2). e) The pheromone shown is the 9-oxodectrans-2-enoic acid produced by the honey-bee queen. On the purposes of the chemical signs: The role of the substances in a) and c) is to protect an individual mammalian living being from being injured or poisoned. The well-being of the individual is also protected by means of the putrid smell which hinders many animals and man from ingesting spoiled and poisoned food (some birds of prey do not perceive this particular kind of smell). The use of putrid smelling substances as in b) to repel enemies is the particular achievement of a single species, namely skunks. The floral odor as in d) is a sign which serves to attract insects to pollinate blossoms and ensure the plant’s propagation. Facilitation of copulation and propagation is the role of many pheromones, including the queen substance shown in e). In addition, these signs determine the social order and behavior of insects, e. g., within a bee colony, which is necessary for an entire animal species to survive. Guidance of copulation behavior is probably the function of the musk-deer and civet-cat’s secretions (cf. Fig. 9.2 a).
308
II. Aspekte der Semiose
in a colony of honey bees, the queen produces the ‘queen substance’ in its mandibular glands, which is perceived by the female worker bees. Its chemical structure is shown in Fig. 9.1 e. The presence of this substance in the air depresses (together with another substance) the worker’s fertility and elicits their retinue behavior. In other words, the queen’s ‘external hormone’ controls the internal body functions of other individual bees. Furthermore, during the queen’s nuptial flight this pheromone attracts the drones. In addition to this example, there is a long list of pheromones in insects, which regulate male rivalry, aggressive behavior against ‘foreign’ animals of the same species, etc. For instance, pheromones are the signs used for scentmarking the territory of animals and they are the signs which mark the trails of ants. The function of pheromones and chemical channels has also been described in the reproduction of mice. In humans, the role of chemical stimuli in regulating such autonomous
body functions is less prominent but probably not totally absent (cf. Fig. 9.2). In the following, I would like to confine the description of chemical signs and channels to primates and humans. Firstly, the wealth of the types of chemical signs which can be perceived by primates will be characterized. This is followed by a description of mechanisms that determine how the mammalian nervous system ‘reads’ these signs and transforms them into nerve cell activity (which is the internal representation of the signs). Finally, images of the perceived signs in consciousness will be dealt with, since they are what occurs at the end of a sensory channel in humans.
2.
Chemical channels in primates and humans
In 1942, Richter reported his observation of a child who suffered from a disturbance in his ability to maintain the concentration of
Fig. 9.2: a) The musky-smelling substance civetone, (z)-9-cycloheptadecan-1-on, is the secretion of the glands of the Ethiopean civet-cat. For comparison, in b) the human male sex hormone testosterone is shown. Its molecular structure has strong similarities with the musky-smelling secretions of the musk-deer and the civet-cat. The female sex hormone oestrogene (not shown) consists of the same four-ring structure as testosterone. However, compared to civetone and testosterone, oestrogene lacks the double-bound oxygen (besides some other differences in the molecule). The combination of this double-binding and of the outer shape of the molecules shown in a) and b) seems necessary for the musky smell.
9. Chemical channels
sodium chloride in his blood at a normal level. When such a disease is not accompanied by severe consecutive symptoms, humans never become aware of such a fault in the regulation of their body fluids. However, given the opportunity to taste and select some out of a variety of foods, this child preferred salty food. Later, Richter’s observation was accepted as proving a specific ‘hunger for salt’. His findings point out that at least one functional role of the chemical channels is to control the ‘milieu interieur’ of the living individual. In the case of the specific hunger, it is the gustatory channel which accounts for the observed innate ingestive behavior. The gustatory sensory channel analyzes the nature and the concentration of soluble molecules in food and drink before they are ingested. This channel is part of a complex neural control system (the homoeostatic regulation) responsible for controlling the concentrations of substances such as salt, oxygen or glucose in the internal body fluids and of many other autonomous body functions, e. g., the height of the arterial blood pressure. In humans, the information from a portion of the receptor cells of this system, namely the taste receptors, reaches conciousness. This is the reason why the gustatory system is regarded as belonging to the chemical channels. Stimulation of the other chemosensitive receptors remains unrecognized. Gustatory afferent nerve fibers, as well as the afferent nerve fibers from the heart, blood vessels and lung, belong to the same anatomical structures. They travel to the same circumscribed region in the lower part of the brain stem. This region in turn conveys the information to the same brain areas involved in autonomous body functions, which enable the elicitation of involuntary reflexes or reactions like retching or vomiting when tasting bad food. However, within the brain of vertebrates, the afferent information from the taste receptors additionally leaves the brain stem region (the nucleus of the solitary tract) and follows a second route to the cerebral cortex (neocortex). This second pathway is the anatomical basis for the fact that in man the signs of the channel of taste reach consciousness. The assumption that taste receptors basically contributed to the regulation of the body fluids in earlier stages of man’s evolution explains the ‘poorness’ of the gustatory channel. At an animal level, only a few essen-
309 tial components of food or drink needed to be distinguished when licked or taken into the mouth before ingestion. The taste receptors thus provide us with just four different categories of signs, namely the categories sweet, sour, salty and bitter. Since many toxic substances obtained from plants taste bitter (see Fig. 9.1 c), it seems reasonable to have a particular sensitivity for such substances. The second chemical channel is the olfactory system or the sense of smell. Smell receptors are located in the upper part of the nose cavity. In land-bound animals and in man this system provides the brain with information on the type and concentration of vaporized substances in the air. 2.1. The channel of taste In adults, the perception of taste is only possible when the substance touches the lateral parts or the back of the tongue. In these sensitive areas of the tongue are found specially shaped receptor cells. About 20⫺30 such receptor cells and other cells of the mucous epithelium form particular structures called “taste buds”. They received their name from the characteristic microscopic picture in which the cells are arranged like the leaves of a flower bud. On its upper part, i. e., the part directed to the tongue’s surface, the membrane of such a receptor cell constitutes the contact area with the tastant molecules. As these parts of the receptor cells are normally bathed in saliva, these molecules need to be dissolved in saliva before they come into contact with the membrane of receptor cells and are perceived. At their base, the receptor cells establish contacts with branches of afferent nerve fibers, which in turn send information of receptor cell stimulation to the brain. The taste-sensitive region of the tongue can be divided into four parts, one for each group of tastant substances, whereby considerable overlapping occurs. Fig. 9.3 shows a view of the tongue’s surface when extended, as well as the location of the four groups of perceived tastes. Typical members of the four categories of taste are sodium chloride (which tastes salty), acetic acid (sour; cf. Fig. 9.1 a) and glucose (sweet). Epsom salts (MgSO4 · 7H2O) and quinine taste bitter. Each of these substances represents a large class of similar tasting substances. We all know from experience that an increase in the concentration of a given tastant substance applied to the tongue causes an increase in the strength of perception. However, the per-
310
Fig. 9.3: Location of the four categories of tastant signs on the surface of a human tongue (after Hensel 1966). The locations of the sour, salty and sweet taste overlap considerably. The bitter taste is predominantly located at the base of the tongue, where the taste buds are organized on round papillae with a diameter of several millimeters. Depending on their location, taste buds are supplied by nerve fibers of three cranial nerves: the rear part of the tongue: the nervus vagus (X); the region of bitter taste: the nervus glossopharygeus (IX); the anterior part: the nervus facialis (VII).
ceived intensity of stimulating substances of one category depends not only on their concentration, but also on their molecular structure and chemical properties. The perceived intensity of substances of the category salty depends on the degree of dissociation into anions and cations. The perceived intensity of the sourness of an acid depends on the hydrogen (H⫹) concentration of its solution. Besides glucose and other types of sugar, there are many other organic substances which taste sweet, such as artificial sweeteners, some alcohols and particular aminoacids. The perceived intensity of the sweet taste, however, varies considerably. The classification of an organic molecule into one of the four groups can change with minimal alterations in the molecular configuration. For example, the aminoacid d-phenylalanin tastes sweet and its stereoisomer form l-phenylalanin tastes bitter. The classification of substances into one of the four phenomenological groups is supported by cross-adaptation between them. For example, after a continuous rinsing of a NaCl-solution over the tongue, the subjective perception of the strength of the stimulation
II. Aspekte der Semiose
decreases over a couple of minutes, but also the sensitivity for other salty tasting solutions, like potassium chloride (KCl) or lithium chloride (LiCl), becomes reduced. However, the sensitivity, e. g., for the bitter tasting substances quinine and nicotine (cf. Fig. 9.1 c), remains unchanged. This shows that our gustatory channel can reduce its sensitivity, i. e., it adapts to a constant stimulation strength. This adaptation always takes place simultaneously for all members of a category. Next, we should remind ourselves that the subjective perception of a given taste not only depends on the applied tastant but also on the tastant given before. Some observations on such sequential interaction of tastes lead some authors to propose a “water taste”. These considerations can be explained by means of a simple experiment: following the sustained application of a sweet compound in a tastant fluid, to rinse the tongue with pure water causes a sour-bitter taste. After the application of some sour compounds, the water used for rinsing sometimes tastes bitter. Thus, water is apparently not tasteless. Taken together, one has to bear in mind that in the everyday situation of experiencing taste solutions, the perceived taste of a given chemical depends on (1) the nature of the chemical (sometimes also on its concentration), (2) the cross adaptation to precedingly applied substances and (3) the “taste of water”. Thus, the recognition of a given chemical sign can vary and depends on the presence of other signs. The informationtransmitting properties of the gustatory channel depend on applied tastants. Recently obtained knowledge of the molecular structure and mechanisms of cell membranes support the idea that the membrane of a single receptor cell is equipped with at least one out of four different types of specialized molecules, called molecular receptors, which can bind with particular tastant molecules dissolved in saliva. Such receptor molecules are big proteins, which extend through the whole membrane bilayer of the cell like thick convolutes. The tastant acts like a key which fits in only one out of the four keyholes (these keyholes being the outer parts of the receptor molecules). If the right key, a given tastant, is put into the right key hole, a cascade of probably one out of four further intracellular chains of biochemical reactions begins. The overall effect of this chain of chemical reactions is an opening of a membrane pore which specifically lets natrium
9. Chemical channels
ions (Na⫹) or calcium ions (Ca⫹⫹) flow into the cell, which in turn reduces the membrane potential of the receptor cells. This potential is the small difference in voltage between the inner cell and the surrounding fluid. The potential reduction (the depolarization) can now become transposed into nerve impulses (action potentials), which travel along a nerve fiber (axon) to the central nervous system. Each of these afferent gustatory nerve fibers has connections to several receptor cells of several taste buds, and each receptor cell has connections to several nerve fibers. Furthermore, an afferent fiber from a given location of the tongue, e. g., in the sweet region, does not specifically respond to sweettasting substances. It can become activated during the application of substances of all four categories: its sensitivity to these chemical signs is however different, and the achievable neuronal activity is the highest for only one category of tastant substances. It is most probable that only a minority of cells is tuned to a single category, while the huge amount of afferent nerve fibers respond less selectively to single tastants. Thus, for example when one drinks a sugar solution, a stream of neuronal activity of many afferent fibers reaches the central nervous system. The nerve fibers stem from all parts of the gustatory region of the tongue. The highest neuronal activity, however, is present in fibers from the sweet region of the tongue. Via the nucleus of the solitary tract, information on the taste bud stimulation reaches the thalamus. The response characteristics of gustatory responsive nerve cells in the thalamus exhibit certain differences compared with those of the previous stage of information processing. For example, among other data, it has been reported in experiments with monkeys that 30% of the neurons are excited by only one category of tastants. However, other investigators found that the majority of nerve cells seems to exhibit a very broad spectrum of responses to different tastants. In addition, in many nerve cells the activity is found to be reduced when a variety of different tastants is applied. Generally, it seems that at the level of the thalamus the separation into four categories becomes weaker, and the neurons tend to establish classes of signs within one category: when two different stimuli of the category salty (e. g., NaCl and LiCl) were applied, the difference in neuronal activity was found to be more pronounced in thalamus neurons as compared to the gusta-
311 tory fibers. Simultaneously, the difference in the strength of responses between stimuli of different categories, e. g., salty (NaCl) and sour (acetic acid), became smaller (Norgren 1984). Thus it seems that, at the level of the thalamus and the cerebral cortex, the organization of the afferent channel changes. Instead of four parallel lines between thalamus and cortex, numerous lines now leave the thalamus, each one representing a given chemical sign or a small group of them. The projection of information from the gustatory receptors onto the cerebral cortex takes place in the vicinity of the cortex area where information from other sensory systems in the oral cavity (sensations of touch, mechanical pressure, temperature and pain) is represented. In addition, a second cortical target area has been reported to exhibit purely gustatory activity. This area sends the information to a further cortical area (the orbito-frontal brain); our knowledge of the function of this second-order sensory cortex is, however, not yet very advanced. 2.2. The channel of smell From the point of view of evolution, the sense of taste is an exceptional development which, over the course of time, was only brought out in vertebrates. The phylogenetically older chemical channel is the sense of smell. This chemical channel is preserved in all species, e. g., fish, insects and lower vertebrates as well as humans. Animals living in an aqueous environment perceive soluble compounds by means of this chemical channel. All of these animals and humans are equipped with a unique type of receptor cell which is a characteristically shaped bipolar nerve cell. The body of this receptor cell type contains two extensions, one of them being directed toward the inhaled air. The other extension is directed toward the brain and has connections to other nerve cells. In humans, an area of about 2.5 to 5 cm2 of the epithelium on the upper part of each nose cavity contains about 107 receptor cells arranged in one layer together with other cell types of a mucous membrane. This specialized area is the sense organ of the afferent channel and is called the “regio olfactoria”. The surface of the regio olfactoria is covered with mucus, and therefore all substances to be detected by the receptor cells have to be dissolved in this watery medium. The mucus covering the regio olfactoria contains soluble proteins, about 1% of which
312 is the unique group of so-called olfactory binding proteins (OBP). These proteins are believed to bind those odorous molecules which are lipophilic (less soluble in water) and would not otherwise be diluted in the watery mucus (Kinnamon and Getchell 1991). Thus, these proteins can increase the number of odorant molecules to reach the surface of the receptor cells. The receptor cell membrane contains the receptor molecules, and these molecules come into contact with the mucus. They build a three-dimensional outer surface (Shepherd 1990), and a stimulating molecule must then exhibit the complementary surface in order to be perceived. Thus it is a combination of many molecular properties of the stimulating molecule, such as molecular length, distribution of polar groups, branching, number of rings, steric hindrance etc., which constitutes the perceived odorous sign of chemicals. Molecules therefore smell similar when they contain components fitting into the keyhole of a special receptor molecule, irrespective of other molecular components which do not fit into this receptor molecule. Thus, chemically quite different substances can smell similar, and chemically closely related molecules can smell different. Fig. 9.1 d shows the main chemical components found in the famous Bulgarian rose oil, which is often used in perfumes (Ohloff 1990). A slight change in the molecule can change it from a pleasant smelling substance to an odorless one. Some receptor cells seem to be highly specialized and can perceive one or only a few odorants, whereas the majority of receptor cells responds to a broad range of odor molecules. In the membrane of these cells, there are probably various types of receptor molecules. Once an odorant molecule has bound with the respective receptor protein, this receptor molecule changes its chemical configuration which in turn initiates a cascade of intracellular information transmitting steps, ultimately causing an initiation of action potentials. Humans are able to discriminate probably several thousand different odors. Since the early psychophysical investigations of smell, researches have attempted to find a classification or structure for the wealth of different smells. In analogy to the channel of taste, several authors tried to find primary representatives of different classes of smell. Amoore (1970) distinguished a set of seven primary odors, which he designated as ethereal (peaches), camphoraceous (mothballs),
II. Aspekte der Semiose
floral (roses; Fig. 9.1 d), minty (eucalyptol), pungent (vinegar), putrid (rotten eggs), and musky (musk-root). Hydrogen sulfides often smell putrid and unpleasant, e. g., sulfuric hydrogen SH2 or dimethylsulfide. Another substance of this chemical group has been isolated from the skunk’s secretion (Fig. 9.1 b), which serves as an effective deterrent. The chemistry of musky-smelling substances is also well known. The musk-deer, which lives in the Himalaya mountains, produces a musky-smelling substance in glands located in the vicinity of the male sexual organs. This substance functions as a pheromone. Its molecular structure is similar to the substance civetone from the glands of the civet-cat shown in Fig. 9.2 a. The two substances are the main representatives of musky-smelling compounds and are used in many perfumes. Their structural relation to the human male sex hormone is illustrated in Fig. 9.2. As mentioned above, a promising method for the determination of phenomenological classes of signs is the investigation of crossadaptation. We are all familiar with the ability of our olfactory system to adapt to a given odorant, which under laboratory conditions is fully developed after 3 minutes. Basically, in cross-adaptation experiments it was found that adaptation to the test odorant itself was always much stronger than that to any other similar smelling substances. So far, no sufficient classification has been established in the phenomenology of odors (Doty 1991). A future classification can be based on the chemistry of odorants. As it turns out, there are often ‘families’ of similarly structured molecules which smell alike. The centrally directed extensions of the olfactory receptor cells leave the nasal cavity and penetrate through a sieve-like opening in the bone of the ceiling of the nose cavity and immediately enter an anatomically distinct structure of the brain, named “olfactory bulb”. The special arrangement of nerve cells and their connectivities in the olfactory bulb is one of the best known examples of the organization of information-transmitting neural networks (cf. Art. 143). Fig. 9.4 explains this ‘wiring diagram’. The olfactory bulb mainly consists of layers of different types of orderly arranged nerve cells. The main cells are called mitral and tufted cells. They send one arborization (the dendrites) of their cell body to the glomerular layer and establish
9. Chemical channels
313
Fig. 9.4: Schematic drawing of the micro-anatomy of the olfactory bulb. This bulb is located below the mass of the forebrain to either side and receives nerve fibers (labeled receptor cell axons), which belong to the olfactory receptor cells and which transmit information from the receptor cells to the first stage of information processing in the central nervous system. The olfactory bulb is uniformly organized in layers of wellknown neuron types. The nerve cells, excited by the receptor cells, are the mitral cells, which send their axon to the cortex areas of the brain. This straightforward transmission of information is accompanied by a lateral spread of information to neighboring mitral cells, which is mediated by periglomerular cells and granule cells. The dense contact region between many converging receptor cell axons and the one mitral cell is called “glomerulus”, because of the microscopically visible tangle of nerve fibers and contacts. An enlarged display of a glomerulus is given below, with m referring to a mitral cell, p to a peri-glomerular cell and o to a nerve fiber (axon) of an olfactory receptor cell. Olfactory receptor cells always excite mitral cells (excitation labeled by a plus-sign). But their effect is strongly controlled by the periglomerular cells, which inhibit mitral cells (negative sign) and in turn get excited by mitral cells. Granule cells have the same type of synaptic contact with mitral cells as found in periglumerular cells. Note that areas of the cortex themselves can modify the signal transmission within the olfactory bulb by inhibition of mitral cells, when fibers leaving the cortex excite the inhibiting interneurons (periglomerular and granule cells).
contacts with incoming axons (nerve fibers) of receptor cells in order to receive the information from the receptor cells. There is a considerable degree of convergence of information onto a single glomerulus, since axons of as many as 15,000 receptor cells contact one mitral cell, and a single receptor cell always ends in one glomerulus only. The axons of the mitral cells convey the information on odorous stimulation to the olfactory cerebral cortex. Electrophysiological measurements of the activity of single receptor cells and cells
of the olfactory bulb uncovered their role in information processing. The data show that in most cases, the receptor cells are not sensitive to a single odorant or a small group of substances which smell similar, but to a variety of smells belonging to various classes of primary odorants (Kauer 1987). A receptor cell accomplishes a profile of activity with one odorant creating the highest neuronal activity and many others eliciting weaker responses. The strength of olfactory stimulation, which depends on the odorant concen-
314 tration in the air, is coded in a two-fold way, namely, in the frequency of nerve impulses and in the number of nerve cells being stimulated. The conditions of transmission of chemical signs within the olfactory epithelium and the olfactory bulb become clearer when one considers the case of an inhaled single odorous compound. It stimulates many receptor cells of the olfactory region which then respond with depolarization and initiation of nerve impulses. Receptor cells sensitive to that odorous sign are not uniformly distributed over the sensory area of the regio olfactoria. Probably, there are a number of sensitive spots within this area, where receptors with the lowest threshold for that sign are clustered together (cf. for example Dodd and Castellucci 1991). The connection between the sensory epithelium and the olfactory bulb is not a simple imaging, where contiguous receptor cells would project to contiguous bulb locations. Instead, there is a re-sorting which causes all receptor cells sensitive to that particular odourous sign, irrespective of their locations in the regio olfactoria, to send their axons (the nerve fibers) to one or a few circumscribed places in the olfactory bulb. A modern technique to simultaneously monitor the activity in large areas of the olfactory bulb provides details of the connection between receptors and mitral cells. This technique (the 2-desoxy-glucose autoradiography) provides us with a microscopic map of the energy utilization of olfactory bulb neurons obtained in the presence of a defined odorous stimulation. It indicates that a given odorous sign is represented most densely in several circumscribed patches within broader projection zones in the bulb. Even punctate foci of activity related to one single glomerulus or mitral cell have been found, when the single odorant is applied in a very low concentration. Thus, the data give rise to the assumption that there is a spatial map of odorous signs in the bulb, in which a single sign is represented in a couple of distinct spots (cf. the neural activities involved in the processing of optical (Art. 6 § 2.), acoustical (Art. 7 § 3.) and tactile (Art. 8 § 4.) stimuli). Neural acitivity in such a spot is the internal sign for the presence of a given chemical in the air. Each spot consists of a mitral cell or of a small group of them. Intermingled with this spatial organization of odorous signs in the olfactory bulb is another principle of sign processing. The neuro-
II. Aspekte der Semiose
nal response of mitral cells to odorants can be divided into two classes: stimulated with an odorant, the impulse activity is either enhanced or reduced. This finding leads to the speculation that the mitral cells in the vicinity of a spot of excited mitral cells are inhibited. Such an organization, inhibition around a center of stimulation-dependent activation, is well-known in the nervous system and could probably sharpen the punctate representation of a given odorous sign in distinct groups of mitral cells. Altogether, these findings provide some understanding of how the molecular signs of different odors are reorganized and transposed into a pattern of nerve impulses which can be read by the cerebral cortex. The olfactory bulb sends the axons of mitral cells to areas of the cortex which all belong to a phylogenetically old part of the brain. This part did not undergo the considerable enlargement during evolution as did the other parts of the cerebral cortex (the neocortex). The main olfactory discrimination region is a small area on the medio-basal surface of the brain called “piriform cortex”. After some processing in this area, part of the information reaches other cortex areas, the final area being one involved in storing and releasing memorized items. A second pathway connects the olfactory afferent nerve fibers to brain regions which are involved in controlling functions like hunger, food-ingestive behavior, aggressive or defensive behavior, sleep and wakefulness, sexual behavior, etc. The third route finally reaches the thalamus, which is the general input relay station to the neocortex for all sensory signals. The thalamus mediates the signals to the fronto-basal part of the cerebral cortex, which is probably the part of the brain necessary to bring the presence of odorous signs into conciousness. Some authors assume a direct connection to those cortical areas from the piriform cortex. This fronto-basal part of the cerebral cortex is probably involved in processing information from odorant and other sensory channels of the mouth and nose, in order to provide us with a uniform impression of the type of sensory stimulation. In this cortex area a multi-channel integration takes place. 2.3. Flavor combines smell, taste and other sensory channels Obviously, the great diversity of differenttasting foods cannot be represented by means of the four taste categories alone. Instead, in-
315
9. Chemical channels
gestion of food or drink is a stimulus for many sensory channels, including the visual one. Moreover, before taking food into the mouth, some vaporized substances may enter the nose cavity, and during chewing or just through retaining food in the mouth, odorant substances reach the olfactory epithelium through the inner spaces of the throat (pharynx and larynx) which connect the oral and nasal cavity. Thus, the variation in the flavors of different foods is at least a combined result of gustation, olfaction and other sensory channels of the mouth. The mucous epithelium of mouth and nose is richly equipped with sensory receptors for touch, mechanical pressure, temperature and pain. The stimulation of these sensory endings participates in the final impression of flavor and mainly the trigeminal nerve sends these modalities to brain and conciousness. We know that, for example, a patient with a complete loss of olfactory discrimination can still perceive some vaporized compounds of the inhaled air. However, his remaining discrimination ability is very poor. Therefore, it seems likely that some chemosensitive endings belong to the trigeminal system and play a role in distinguishing flavors during eating. Substances which are able to stimulate trigeminal receptors usually taste and smell very pungent and burning; ammonia is a typical representative. Only in the case of a selective loss of one of the three sensory channels from the mouth and nose do we become aware of its contribution to our ability to discriminate flavors. We all know that the perception and recognition of different flavors tends to be accompanied by a strong affective component, which, in addition, underlies considerable variability. People of different cultures develop quite different aversive behavior or preferences with regard to certain foods, which are not innate. Nor is this affective component stable during one’s lifetime. Originally well-liked foods can become just the opposite if eaten in a very unpleasant situation, and even the awareness of the origin of the sudden aversiveness cannot reverse the affective component.
3.
Selected references
Ache, B. W. (1991), “Phylogeny of Smell and Taste”. In: T. V. Gretchell, L. M. Bartoshuk, R. L. Doty and J. B. Snow (eds.), Smell and Taste in Health and Disease. New York: 3⫺18. Amoore, J. E. (1970), The Molecular Basis of Odor. Springfield, Illinois. Dodd, J. and V. F. Castellucci (1991), “Smell and Taste: The Chemical Senses”. In: E. R. Kandel, J. H. Schwartz and T. M. Jessell (eds.), Principles of Neural Science. New York: 512⫺529. Doty, R. L. (1991), “Olfactory System”. In: T. V. Gretchell, L. M. Bartoshuk, R. L. Doty and J. B. Snow (eds.), Smell and Taste in Health and Disease. New York: 175⫺203. Hensel, H. (1966), Allgemeine Sinnesphysiologie, Hautsinne, Geschmack, Geruch. Berlin. Kauer, J. S. (1987), “Coding in the Olfactory System”. In: T. E. Finger and W. Silver (eds.), Neurobiology of Taste and Smell. New York: 205⫺231. Kinnamon, S. C. and T. V. Gretchell (1991), “Sensory Transduction in Olfactory Receptor Neurons and Gustatory Receptor Cells”. In: T. V. Gretchell, L. M. Bartoshuk, R. L. Doty and J. B. Snow (eds.), Smell and Taste in Health and Disease. New York: 145⫺172. Norgren, R. (1984), “Central Neural Mechanisms of Taste”. In: J. M. Brookhart, V. B. Mountcastle, I. Darian-Smith and S. R. Geiger (eds.), Handbook of Physiology, Section I, The Nervous System, III,2. Bethesda, Maryland: 1087⫺1128. Ohloff, G. (1990), Riechstoffe und Geruchssinn. Berlin. Richter, C. P. (1942), “Total Self Regulatory Functions in Animal and Human Beings”. Harvey Lecture 38: 63⫺103. Shepherd, G. M. (1990), “Computational Structure of the Olfactory System”. In: J. Davis and H. Eichenbaum (eds.), Olfaction as a Model System for Computational Neuroscience. Cambridge, Massachusetts: 3⫺42. Shorey, H. H. (1976), Animal Communication by Pheromones. New York.
Jürgen Kröller, Berlin (Deutschland)
316
II. Aspekte der Semiose
10. The electric and magnetic channels 1. A case for zoosemiotics 2. The electric channel 2.1. Sources of electric fields other than electric organs 2.2. Electric organs and electric organ discharges (EODs) 2.3. Electroreception 3. The magnetic channel 3.1. Sources of magnetic fields 3.2. Biomagnetic sensitivity 3.3. Sensing mechanisms 3.4. Negative results 4. Concluding comments 5. Selected references
which organisms obtain information directly from and about their environment, and (2) interactional semioses, involving at least two organisms exchanging information about their identity, motivational states, and aspects about their environment, the whereabouts of food and shelter, for example. ⫺ This article examines the importance of the electric and magnetic channels as they facilitate spatial orientation and social interaction in several groups of animals.
2. 1.
A case for zoosemiotics
Organisms survive through interaction with their environment. They are continually affected by local climatic conditions and by other organisms, and subjected to forces that are determined by the physical properties of our planet, among them gravity, magnetic and electric fields. Magnetic fields exist in the vicinity of permanent magnets, electric currents, and changing electric fields. The Earth’s magnetic field causes permanent magnets such as a compass needle to line up in the direction of the magnetic field. A magnetic force, as illustrated for example in the distribution of iron filings around a bar magnet, manifests itself in attraction or repulsion between electrically charged particles in motion. Electric fields, on the other hand, are characteristic properties of stationary electric charges. Such charges produce electric fields in their surrounding space, exerting an electric force on other electric charges. Since moving electric charges (as in electric currents) can induce magnetic fields, so can changing magnetic fields produce electric fields. This mutual interaction of electric and magnetic fields produces electromagnetic fields. To orient in space and to exchange information with one another, organisms are adapted to perceive and emit signs that provide the basis for semiosis (cf. Articles 1, 5, and 16). Transfer of information may involve one or several sensory channels (cf. Art. 12) and, depending upon the specific nature of the sending and receiving agents, this transfer can be one- or two-way (cf. also Art. 5). Accordingly, we distinguish between two types of semioses: (1) unidirectional semioses, in
The electric channel
Many aquatic organisms, fish and amphibians among them, respond to imposed electric fields (direct current) with directed movements towards the anode. This behavior is known as galvanotaxis. The electric field gradients that are necessary to elicit galvanotaxis (up to 1,000 mV/cm) are at least two orders of magnitude higher than naturally occurring electric field gradients (Kalmijn 1974). In the absence of such natural signs galvanotaxis cannot be considered a semiosis. However, the discovery of a specialized, true electric sense only some 30 years ago (Lissmann 1958) allowed us to comprehend the biological significance of naturally occurring electric fields that emanate from many aquatic organisms or are generated by an organism’s specialized electric organs. The electric signs are involved in both types of semioses, in one-way active or passive electrolocation and two-way electrocommunication (for further details see also Heiligenberg 1977; Scheich 1983; Westby 1984; Hopkins 1988; Fessard 1974; Bullock and Heiligenberg 1986; Bratton and Kramer 1989; Moller, Serrier, and Bowling 1989). The term communication as defined and used by students of semiotics implies an intent on the sender’s part to elicit a response from the receiver on the basis of a recognition of this intent (see Art. 4 § 1.4.). Although several cognitive ethologists have attributed such abilities to a number of animal species (for details see Griffin 1984), it remains difficult, conceptually and methodologically, to apply cognitive characteristics of human communication to interactions between/among animals. Therefore, in the context of this Handbook, I will use the terms interactional zoo-semiosis, information
10. The electric and magnetic channels
exchange or information transfer to describe behavioral changes in animal social encounters. 2.1. Sources of electric fields other than electric organs Electric fields abound in natural waters. Their origin can be physical, electrochemical, and organismic. Motional electric fields are induced when water is moving or when a fish is swimming through the Earth’s magnetic field (cf. § 3.2.2.). Tidal forces and tectonic processes cause strains in the Earth’s crust that can affect magnetization of rocks and changes in local electric fields. When two chemically dissimilar media come into contact potential differences across the interface arise. Such potential differences occur widely in the aquatic environment. In addition,
317 steady bio-electric fields exist in the vicinity of many aquatic organisms. Certain bony fishes, for example, generate direct currents with potentials in the order of 500 mV, crustaceans around 50 mV, and certain mollusks about 100 mV. 2.2. Electric organs and electric organ discharges (EODs) Several phyletically diverse groups of fish generate alternating electric fields (Fig. 10.1). The EODs are generated by specialized electric organs which (depending on the species) consist of serial and parallel arrays of several hundred to several million electrocytes that are with one exception (which is neurogenic) derived from muscle fibers. The electrocytes are innervated by motor neurons of the brain or the spinal cord (Bennett
Fig. 10.1: Representative weakly and strongly discharging electric fish and their electric organ discharge. The blackened areas indicate the location of the electric organ.
318 1971). ⫺ The marine torpedos (Torpedo marmorata), the African electric catfish, Malapterurus electricus (Fig. 10.2), the South American electric eel, Electrophorus electricus emit volleys consisting of brief, powerful discharges of several hundred volts or high amperage (several A in the black torpedo) that are used in predation (Rankin and Moller 1986). The South American gymnotiform knifefish and the African mormyriforms (Fig. 10.2), on the other hand, generate EODs (on the order of several hundred mV) which are too weak to be of offensive use. ⫺ The waveform and duration of the individual EOD is under peripheral control and determined by structure, innervation, and membrane characteristics of the electrocytes. Rate and temporal patterning of EODs are centrally controlled by command interneurons in the fish’s brain. We distinguish between wave and pulse species depending on the EOD emission rate. Some South American knifefishes (comprising both pulse and wave species) can generate up to 1,800 Hz. With one exception, Gymnarchus niloticus (cf. Fig. 10.2 on plate I), all African weakly electric fish (family: Mormyridae) are pulse species whose typical resting EOD rates during the day range from several pulses per second to about 40 Hz. While they are active
Fig. 10.3: Species and sex differences in electric organ discharge pulseform in mormyrid weakly electric fish. a. Marcusenius paucisquamatus; b. Marcusenius conicephalus; c. Mormyrops zanclirostris; d⫺f. Stomatorhinus walkeri (d: female; e: male; f: juvenile male).
II. Aspekte der Semiose
during the night, the fish increase their discharge activity. Species and sex differences in EOD activity are expressed in emission rate and/or waveform (Fig. 10.3). In captivity, under laboratory conditions, rapidly decreasing testosterone levels alter the EOD waveform in mormyrids, and can thus obscure an EOD-related sexual dimorphism (Landsman et al. 1990). In addition to the South American knifefishes and the African mormyriforms weak electric discharges are also generated by marine stargazers (Astroscopus sp.), electric skates, and a few African catfish species (Synodontis sp.) (Hagedorn et al. 1990). 2.3. Electroreception The ability to detect weak electric fields that originate from biological and inanimate sources (cf. § 2.1.) is widespread among aquatic organisms. Electroreception has been recognized as a specific sensory modality in cartilaginous fishes (sharks and rays) and some teleosts (catfish, African mormyriforms, and South American knifefish; see Fig. 10.2). However, there is good evidence that “electroreception arose with the common ancestor of cartilaginous and bony fishes, if not with the common ancestor of jawed fish and lampreys” (Northcutt 1986). Electroreception was also discovered in amphibians (Fritzsch and Münz 1986) and a primitive mammal, the duck-billed platypus (Scheich et al. 1986). The evidence for an electric sense is based on: (1) Identification of specialized electroreceptors such as the ampullae of Lorenzini in sharks and rays, and ampullary and tuberous electroreceptors in certain teleost fish (Fig. 10.4), (2) comparative functional morphology revealing physiological and anatomical electroreceptor homologies, (3) recording of evoked potentials in response to weak electric fields, and (4) behavioral data illustrating the role of electric signals in semiosis. ⫺ The behavioral evidence constitutes the last element in the semiotic process (cf. Art. 5). It is expressed in either dialogue (“Signalverhalten”) during which the receiver responds to the sender’s EODs with messages encoded with typical sequences of EODs, and/or consummatory behavior (“Gebrauchsverhalten”) where the receiver responds to the sender’s EODs with an adaptive display, such as courtship or flight, for example. ⫺ In the active electroreceptive mode, the animal obtains sensory information about its environment from its own activities either by generating electric fields
10. The electric and magnetic channels
319 electric current lines from a dipole source (Schluger and Hopkins 1987). Several amphibians respond to weak d. c. fields that emanate from moving prey (Fritzsch and Münz 1986; Roth and Schlegel 1988). Platypus that are common in muddy streams use their electroreceptors to obtain information about prey and obstacles (Gregory et al. 1987).
Fig. 10.4: Typical electroreceptors in weakly electric fish. The ampullary receptors (A) respond predominantly to low frequency stimuli and d.c. electric fields emanating from many aquatic organisms. The tuberous mormyromasts (B) serve in electrolocation and the knollenorgans (C) in electrocommunication. sc: sensory cell; n: nerve; bm: basement membrane. Arrow indicates fish’s body surface (from Szabo 1965, Journal of Morphology, with permission of Alan R. Riss, Inc.).
(EODs) or swimming through the Earth’s magnetic field (cf. § 3.2.2.). In the passive mode, foreign electric fields from conspecifics or other sources can provide sensory cues to facilitate group cohesion and spatial orientation. 2.3.1. Electrolocation Weakly electric fish are nocturnal and often found in turbid waters. Their electrosensory system allows them to explore such an environment. Objects that differ in conductivity from that of the surrounding water cause alterations in the self-generated dipole field that is continuously monitored by the mormyromast electroreceptors (Fig. 10.4). Objects conducting better than water increase the transepidermal voltage gradient (and thus the current flow) across these receptors; insulators decrease this gradient. Objects cast electric shadows on the fish’s body which provide the animal with an electric image of its environment (Fig. 10.5). The range of this electric viewing ability is limited to the immediate vicinity and does not exceed 10⫺20 cm under optimal conductivity conditions (30⫺ 100 mS/cm). ⫺ In passive electrolocation an organism responds to weak electric fields from the environment with directed locomotor behavior. Weakly electric fish can follow
2.3.2. Electric information exchange The fate of an electric signal in water is determined by physiological factors at the source and properties of the environment. The area within which an EOD can elicit responses from conspecifics (active space) is affected by the signal amplitude at the source, its attenuation in the medium, ambient noise, and the receiver’s receptor threshold (Hopkins 1988). The electric organ can be considered the source of an electric dipole field. The current from such a source decreases in proportion to the inverse of the cube of the distance from the source, thus considerably limiting the active space of the electric signal. The attenuation of this signal is greater than that of acoustic or chemical signals in water. However, while acoustic and chemical signals are subject to distortions, electric signals are not. Social interaction in weakly electric fish is mediated by tuberous receptors (knollenorgans in mormyrids; Fig. 10.4) whose threshold is about one magnitude lower than that of receptors involved in electrolocation (mormyromasts in mormyrids). Accordingly, the effective electric interaction range exceeds the electrolocation range by about the same factor. ⫺ Species-specific differences in EOD waveform and phase duration, as well as EOD rate contain a wealth of information about the sender. EODs play a role in sex-, species-, and possibly individual recognition, and also facilitate social spacing. Stereotyped sequences of EODs (displays) function in courtship, aggression, and submission. The evidence for an exchange of information based on electric discharges is gathered through observational studies of the fish in their natural habitat and in the laboratory using playback, stimulation, and conditioning techniques. Behavioral displays (e. g., attack, flight, courtship, object-probing) are accompanied by characteristic EOD displays in the same animal. Identity and motivational information is encoded with the EOD waveform and/or its temporal pattern. Fish exhibit specific consummatory behavior (e. g., approach, withdrawal; courtship, at-
320
II. Aspekte der Semiose
Fig. 10.5: Ranges in electrocommunication and electrolocation in mormyrid weakly electric fish. The shaded area around the fish indicates the extension of the electrolocation field to about 10⫺20 cm. Objects within this area (black dot) distort the self-generated field and cast their electric image on the fish’s electroreceptive body surface. The electrocommunication range is about 10 times larger than the electrolocation range (from Moller 1980, Oceanus, with permission of the Woods Hole Oceanographic Institute; modified).
tack) in response to playback of prerecorded EOD activity of known signal content. Mormyrids discriminate between playback of EOD patterns recorded from conspecifics during attack and those recorded from resting fish (Kramer 1979). The mormyrid Pollimyrus isidori seems to discriminate between complex discharge patterns during courtship behavior (Bratton and Kramer 1989; Crawford 1991). Dominant Gymnotus carapo (Fig. 10.2), for example, attack a dipole broadcasting threat displays, whereas submissive fish ignore it (Westby 1984). The analysis of dialogue EOD activity recorded
from mormyrid fish during social interaction revealed orderly changes: echo response, regularization, and social silence (Fig. 10.6) among others (Moller, Serrier and Bowling 1989). The jamming avoidance response, a dialogue EOD activity characteristic of wave species, is a temporary shift in discharge rate in the presence of the fish’s own or similar frequencies (Heiligenberg 1977). ⫺ The evidence gathered to date clearly demonstrates that weakly electric fish can exchange information about their identity and motivational state using their EODs and a uniquely adapted electrosensory system (Kramer
Fig. 10.6: Electric organ discharge activity of two socially interacting mormyrid fish (A, B): black dot, regularization (emission of successive EOD intervals with constant duration); triangle, social silence (cessation of EOD activity).
10. The electric and magnetic channels
1990). Such information exchange during social encounter serves in courtship, aggression, species- and individual recognition, as well as in group cohesion. The data unambiguously show that a receiver fish understands a sender’s message. It remains to be demonstrated whether or not the receiver actually recognizes the sender’s intent.
3.
The magnetic channel
Effects of the Earth’s magnetic field on living organisms abound and include all forms from bacteria to vertebrates including man. The evidence, however, for biomagnetic sensitivity and its adaptive use ranges from convincing to controversial (cf. reviews by Keeton 1974; Able 1980; Markl 1983; Gould 1980, 1984). 3.1. Sources of magnetic fields (1) The Earths’s main magnetic field is a bipolar, nearly homogeneous physical force field with its north-south axis tilted (declination) by about 11∞ from the Earth’s (geographic north-south) rotational axis. The various elements of this field such as density, polarity, horizontal vector, inclination, direction of lines of force, and variations over time contain a wealth of information. If animals could detect and exploit this information they would be able to determine their geographic location, the azimuth of any direction on the Earth’s surface, and could tell time of day, month, and year. (2) A second source of transient geomagnetic fields is due to solar and lunar daily magnetic variations (30⫺60 gamma). Arrhythmic solar storms result in much higher disturbances of about 1,000 gamma. Both intensities are small when compared to the geomagnetic field strength which is in the order of 50,000 gamma (0.5 Oe). 3.2. Biomagnetic sensitivity Strong, man-made, artificial magnetic fields (up to 105 Oe) affect metabolic processes, cell division, growth, mutation rates, and physiological phenomena (EEG). This is not surprising considering that organic molecules can have magnetic dipole properties. The Earth’s magnetic field in comparison is less than 1 Oe. 3.2.1. Bacteria When mud bacteria, (Aquaspirillum magnetotacticum), which normally live in marine and freshwater sediments, are placed in water
321 with high oxygen concentration, they swim along magnetic field lines following the inclination or “dip angle” (Blakemore 1975) seeking geomagnetic north (in the Northern Hemisphere) or south (in the Southern Hemisphere). These bacteria contain organelles (magnetosomes) with chains of 10⫺20 cubes of nearly pure magnetite (Fe2O3). Each cube represents a single ferromagnetic domain with a permanent magnetic dipole moment. The mechanical torque resulting from the alignment of this biological compass needle is sufficient to turn the entire organism into the adaptive direction guiding it into areas of lower oxygen concentration. 3.2.2. Fish The magnetic sensitivity of sharks and rays (Kalmijn 1974) is a direct consequence of the extreme sensitivity of these fish’s electroreceptors, the ampullae of Lorenzini (cf. § 2.3.). The ampullae of Lorenzini can detect minute (DC) voltage gradients as low as 0.01 mV/cm. When sharks swim through water crossing the Earth’s magnetic field lines, currents are induced, and at normal cruising speed, electric potentials of up to 10 mV/cm arise, more than sufficient to excite the fish’s electroreceptors. 3.2.3. Birds During migration birds accomplish astounding navigational tasks. They find their wintering range in the fall, many thousands of kilometers south, and return to their nesting areas in the spring. To accomplish this, birds need something comparable to a human’s map and compass. The map component is still elusive, although some progress points to a form of neural spatial mapping. Compass mechanisms involve visual, chemical, and auditory references. ⫺ The magnetic compass in birds (European robins, Erithacus rubecula) differs in two ways from man’s technical compass (Wiltschko and Wiltschko 1988; cf. Art. 27 § 3.1.): (1) Its functional range is narrowly tuned to the total intensity of the geomagnetic field (0.46 Oe; range: 0.14 to 0.81 Oe). (2) Birds do not obtain cues about the field’s polarity (north/south) from its horizontal component (as humans do!). The correct decision about north or south is based on the value of the magnetic dip angle between the horizontal component of the magnetic field and gravity. This makes evolutionary sense, considering that the polarity of the geomagnetic field has changed several times
322 during the last million years. ⫺ Homing pigeons return to their home loft after release at a site previously unknown to them. The birds’ homing ability involves several sensory channels, including visual, olfactory, and magnetic modalities (Keeton 1974). As in robins, the magnetic compass in homing pigeons only recognizes the north-south direction of the geomagnetic field lines but not their polarity. The pigeons’ magnetic compass works only under overcast conditions. When the sun is visible the sun-compass takes over. 3.2.4. Honey bees When a honey bee returns to the hive it transfers information about direction and distance of a food source to its fellow bees (waggle dance; cf. Frisch 1967). The dance is performed in the dark on the vertical comb surface. The dance-angle shows “errors” (“Restmißweisung”) which depend on the time of day, and the locations of the food source and the vertical comb with regard to the geomagnetic north-south and east-west axes. The errors disappear when the geomagnetic field is cancelled (Lindauer and Martin 1968). 3.2.5. Other organisms The geomagnetic force field influences the behavior of other organisms (Able 1980): termites, flies, beetles, hymenopterans, mollusks, amphibians, and reptiles. Many of these organisms prefer north-south or eastwest resting positions under natural or artificial magnetic fields. The claim that humans possess a magnetic compass remains highly controversial. 3.2.6. Structures built by magnetically sensitive organisms The effect of the Earth’s magnetic field is not restricted to immediate behavioral responses as in orientation, but is also manifest in biological structures assembled by magneto-sensitive organisms. The Australian compass termites, Amitermes, build and align their tall, slab-shaped nests almost perfectly to the magnetic north-south direction. When honeybees establish a new hive following swarming, they build the vertical sheets of their comb in the same magnetic direction as those in the parental hive. 3.3. Sensing mechanisms With the exception of the biological compass needles in magnetic bacteria and the electroreceptors in elasmobranch fishes, the magnetic
II. Aspekte der Semiose
sensing mechanisms are still unknown. Theoretically, magnetic field information could be transduced into biologically relevant information through induction, permanent magnetism, paramagnetism, and super-paramagnetism (Gould 1980; 1984). 3.3.1. Magnetic induction It is questionable whether organisms other than those with highly sensitive electroreceptors (cf. § 3.2.2.) use magnetic induction. Such a mechanism could not work in terrestrial organisms because of the high resistivity of air. 3.3.2. Permanent magnetism (or arrested paramagnetism) Such a mechanism would require detectors that contain either paramagnetic molecules which would align in an imposed external magnetic field or particle deposits serving as permanent magnets. Magnetite deposits, similar to those in magnetic bacteria, were found in several other species, including sockeye salmon (reported to be sensitive to the geomagnetic field), tuna, dolphins, sea turtles, snails, and bees. The neural mechanism to transduce the mechanical torque caused by these magnets remains to be discovered. 3.4. Negative results An entire issue of Animal Learning and Behavior (vol. 15) was devoted to biomagnetic sensitivity. All of the reported experiments yielded negative results. In a foreword, Griffin (1987) stated, “[…] the problem of magnetic sensitivity is of such general interest, and negative results of experiments of this sort are so common, that publication of detailed procedures and results is warranted in order to balance the published record and aid in the design of future experiments, […] the positive evidence is certainly suggestive, and the whole subject calls for more thorough and critical investigation.”
4.
Concluding comments
Semiosic processes in many organisms rely on electric and magnetic channels. The use of electric and magnetic signs facilitates both unidirectional and interactional semioses, providing organisms with information about their environment to orient in space and to exchange information with others. ⫺ The use of magnetic signs is restricted to one-way
323
10. The electric and magnetic channels
semioses providing many organisms with navigational cues and reference systems. While electric signs are similarly used as landmarks in one-way semioses, they play an important role in a true electric zoo-semiosis in weakly electric fish, in the African mormyriforms and the South American knifefishes. From behavioral and physiological evidence we are able to identify the specific properties of magnetic and electric fields that serve as (a) magnetic signs: direction and strength of the Earth’s magnetic field, its inclination and horizontal component, (b) electric signs in one-way semioses: direction, polarity, and strength of self-induced or foreign biogenic electric fields, and (c) electric signs (electric organ discharges) in two-way semioses: amplitude, waveform, and phase duration of individual discharges (electric fingerprints) as well as their specific, often stereotypic temporal patterning. ⫺ Because of the extremely high resistivity of the medium air to electric charges the electric channel is not useful for information transfer among terrestrial organisms. This barrier does not exist in an aquatic environment, and consequently the electric channel has been exploited by many amphibious organisms. Propagating electric signs in the form of electric organ discharges retain their specific temporal and waveform characteristics (information content) and are not distorted by vegetation or small objects as are acoustic and chemical signs for example. On the other hand, these electric signs attenuate much faster than do their acoustic and chemical counterparts. ⫺ As illustrated for some selected groups, the magnetic and electric channels play a major role in these organisms’ interactions with one another and their environment. However, it is important to realize that semiosic processes in complex organisms almost always involve several sensory channels acting in concert or providing back-up systems (cf. Art. 12). It is therefore not surprising to learn that in addition to the electric channel, acoustic, optic, chemical, and lateral line input facilitate social and nonsocial behavior in mormyrid fish. Finally, could the electric and magnetic channels lend themselves to transmission of communication as complex as human language? Structure and function in those organisms that have evolved to generate and perceive electric signs clearly exclude humanlike information transfer. The necessary cognitive elements in the semiosic matrix (cf. Art. 5) are simply missing in electric fish.
However, when humans are restricted to the use of electric and magnetic channels (the airwaves), we have no problems beaming the most complex aspects of human language around the globe and into outer space.
5.
Selected references
Able, K. P. (1980), “Mechanisms of Orientation, Navigation, and Homing”. In: S. A. Gauthreaux, Jr. (ed.), Animal Migration, Orientation, and Navigation. New York: Academic Press: 283⫺373. Bennett, M. V. L. (1971), “Electric Organs”. In: W. S. Hoar and D. S. Randall (eds.), Fish Physiology, vol. V. New York: Academic Press: 493⫺574. Blakemore, R. P. (1975), “Magnetotactic Bacteria”. Science 190: 377⫺379. Bratton, B. O. and B. Kramer (1989), “Patterns of the Electric Organ Discharge During Courtship and Spawning in the Mormyrid Fish, Pollimyrus isidori”. Behavioral Ecology and Sociobiology 24: 349⫺368. Bullock, T. H. and W. Heiligenberg (eds.) (1986), Electroreception. New York: Wiley. Crawford, J. D. (1991), “Sex Recognition by Electric Cues in a Sound-Producing Mormyrid Fish Pollimyrus isidori”. Brain Behavior and Evolution 38: 20⫺38. Fessard, A. (ed.) (1974), Handbook of Sensory Physiology. III/3: Electroreceptors and Other Specialized Receptors in Lower Vertebrates. Berlin, Heidelberg and New York: Springer. Frisch, K. von (1967), The Dance Language and Orientation of Bees. Cambridge, Mass.: Harvard Univ. Press. Fritzsch, B. and H. Münz (1986), “Electroreception in Amphibians”. In: T. H. Bullock and W. Heiligenberg (eds.), Electroreception. New York: Wiley: 483⫺496. Gould, J. L. (1980), “The Case for Magnetic Sensitivity in Birds and Bees (Such as It Is)”. American Scientist 68: 256⫺267. Gould, J. L. (1984), “Magnetic Field Sensitivity in Animals”. Annual Review of Physiology 46: 585⫺ 598. Gregory, J. E., A. Iggo, A. K. McIntyre, and U. Proske (1987), “Electroreceptors in the Platypus”. Nature 326: 386⫺387. Griffin, D. R. (1984), Animal Thinking. Cambridge, Mass., and London: Harvard Univ. Press. Griffin, D. R. (1987), “Foreword to Papers on Magnetic Sensitivity in Birds”. Animal Learning and Behavior 15: 108⫺109. Hagedorn, M., M. Womble and T. E. Finger (1990), “Syrodontid Catfish: A New Group of Weakly Electric Fish”. Brain Behavior and Evolution 35: 268⫺277.
324 Heiligenberg, W. (1977), “Principles of Electrolocation and Jamming Avoidance in Electric Fish. A Neuroethological Approach”. In: V. Braitenberg (ed.), Studies of Brain Functions, vol. 1. Berlin, Heidelberg and New York: Springer: 1⫺85. Hopkins, C. D. (1988), “Neuroethology of Electric Communication”. Annual Review of Neuroscience 11: 497⫺535. Kalmijn, A. J. (1974), “The Detection of Electric Fields from Inanimate and Animate Sources Other than Electric Organs”. In: A. Fessard (ed.), Handbook of Sensory Physiology. III/3: Electroreceptors and Other Specialized Receptors in Lower Vertebrates. Berlin, Heidelberg and New York: Springer: 147⫺200. Keeton, W. T. (1974), “The Orientational and Navigational Basis of Homing in Birds”. In: D. S. Lehrman, J. S. Rosenblatt, R. A. Hinde, and E. Shaw (eds.), Advances in the Study of Behavior, Vol. 5. New York: Academic Press: 47⫺132. Kramer, B. (1979), “Electric and Motor Responses of the Weakly Electric Fish, Gnathonemus petersii (Mormyridae), to Playback of Social Signals”. Behavioral and Ecological Sociobiology 6: 67⫺79. Kramer, B. (1990), Electrocommunication in Teleost Fishes. Berlin, Heidelberg and New York: Springer. Landsman, R. E., C. F. Harding, P. Moller and P. Thomas (1990), “The Effects of Androgens and Estrogens on the External Morphology and Electric Organ Discharge Waveform of Gnathonemus petersii (Mormyridae, Teleostei)”. Hormones and Behavior 24: 532⫺553. Lindauer, M. and H. Martin (1968), “Die Schwereorientierung der Bienen unter dem Einfluß des Erdmagnetfeldes”. Zeitschrift für vergleichende Physiologie 60: 219⫺243. Lissmann, H. W. (1958), “On the Function and Evolution of Electric Organs in Fish”. Journal of Experimental Biology 35: 156⫺191. Markl, H. (1983), “Geobiophysics: The Effect of Ambient Pressure, Gravity, and of the Geomagnetic Field on Organisms”. In: W. Hoppe, W. Lohmann, H. Markl, and H. Ziegler (eds.), Biophysics. Berlin, Heidelberg and New York: Springer: 776⫺787.
II. Aspekte der Semiose Moller, P. (1980), “Electroperception”. Oceanus 23: 44⫺54. Moller, P. (1995), Electric Fishes: History and Behavior. London: Chapman and Hall. Moller, P., J. Serrier and D. Bowling (1989), “Electric Organ Discharge Displays during Social Encounter in the Weakly Electric Fish Brienomyrus niger L. (Mormyridae)”. Ethology 82: 177⫺191. Northcutt, R. G. (1986), “Electroreception in Nonteleost Bony Fishes”. In: T. H. Bullock and W. Heiligenberg (eds.), Electroreception. New York: Wiley: 257⫺285. Rankin, C. and P. Moller (1986), “Social Behavior in the African Electric Catfish Malapterurus electricus during Intra- and Interspecific Encounters”. Ethology 73: 177⫺190. Roth, A. and P. Schlegel (1988), “Behavioral Evidence and Supporting Electrophysiological Observations for Electroreception in the Blind Cave Salamander. Proteus anguinus (Urodela)”. Brain, Behavior and Evolution 32: 277⫺280. Scheich, H. (1983), “Biophysics of Electroreception”. In: W. Hoppe, W. Lohmann, H. Markl, and H. Ziegler (eds.), Biophysics. Berlin, Heidelberg and New York: Springer: 764⫺776. Scheich, H., G. Langner, C. Tideman, R. B. Coles, and A. Guppy (1986), “Electroreception and Electrolocation in Platypus”. Nature 319: 401⫺402. Schluger, J. and C. D. Hopkins (1987), “Electric Fish Approach Stationary Signal Sources by Following Electric Current Lines”. Journal of Experimental Biology 130: 359⫺367. Szabo, T. (1965), “Sense Organs of the Lateral Line System in Some Electric Fish of Gymnotidae, Mormyridae and Gymnarchidae”. Journal of Morphology 117: 229⫺250. Westby, G. W. M. (1984), “Electroreception and Communication in Electric Fish”. Science Progress, Oxford 69: 291⫺313. Wiltschko, W. and R. Wiltschko (1988), “Magnetic versus Celestial Orientation in Migrating Birds”. Trends in Ecological Evolution 3: 13⫺15.
Peter Moller, New York NY (USA)
325
11. Der thermische Kanal
11. Der thermische Kanal 1. Funktionen des thermischen Kanals 2. Die Reizbedingungen 2.1. Hauttemperatur 2.2. Körperinnentemperatur, Thermoregulation und thermischer Komfort 3. Das neurophysiologische Korrelat des thermischen Kanals 3.1. Thermorezeptoren der Haut 3.2. Morphologische Struktur der Rezeptoren 3.3. Transduktionsmechanismus in Thermosensoren 3.4. Innere thermosensitive Strukturen 3.5. Fortleitung der thermischen Information zum Großhirn 4. Korrelation von Temperaturempfindungen mit thermischen Reizen und neuronalen Vorgängen 4.1. Phänophysik 4.2. Phänophysiologie 5. Literatur (in Auswahl)
1.
Funktionen des thermischen Kanals
Dem thermischen Kanal kommt unter den Sinneskanälen eine Sonderstellung zu, insofern als die durch ihn vermittelten Informationen zumindest dreierlei Funktionen erfüllen: (a) Sie erlauben ein Urteil über den thermischen Zustand der Umwelt sowie von Gegenständen, mit denen der Organismus in körperlichen Kontakt kommt; diese kognitive Funktion teilt der thermische Kanal mit anderen Sinneskanälen, insbesondere dem optischen und akustischen Kanal (vgl. Art. 6 und Art. 7). (b) Die thermischen Informationen stellen die Eingangsgrößen für ein biologisches Regelungssystem dar (Abb. 11.1), das die Konstanthaltung der Körpertemperatur der beiden homoiothermen Tierklassen (Säuger und Vögel) gewährleistet und bei niederen Klassen (z. B. Fischen, Reptilien) das Auffinden von thermisch günstigen Umgebungsbedingungen (Temperaturpräferenda) erlaubt. (c) Schließlich ermöglichen die vermittelten Informationen eine Einschätzung des thermischen Zustandes des eigenen Körpers, wodurch die emotionale Situation des Organismus sowie seine Verhaltensweisen (Abb. 11.1) beeinflußt werden („mir ist zu heiß, ich öffne das Fenster“). Da die Vermittlung von Temperaturempfindungen eine wesentliche Funktion des thermischen Kanals darstellt, wird im folgenden vorzugsweise auf Beobachtungen und
Abb. 11.1: Blockschaltbild der Temperaturregelung. Die mittels Thermorezeptoren der Haut und des Körperkerns aufgenommenen Temperatursignale werden einem zentralen Regler (Hypothalamus ⫺ umschriebene Struktur des oberen Hirnstamms) zugeleitet; es werden dort Ausgangssignale gebildet, die Wärmeabgabe- und Wärmebildungsmechanismen (⫽ „Stellgrößen“) so steuern, daß Konstanz der Körpertemperatur gewährleistet wird. Die Wärmeisolation der Körperschale kann durch Zu- bzw. Abnahme der Hautdurchblutung variiert werden. Die zur sensorischen Rinde ziehenden Temperaturinformationen sind Grundlage für die Temperaturwahrnehmung. Die gerasterten Teile des Schemas entsprechen dem „thermischen Kanal“ im engeren Sinne (nach Brück 1987, modifiziert).
Experimente an Primaten, insbesondere am Menschen, zurückgegriffen. Auch Pflanzen reagieren zwar auf Temperaturreize (vgl. Art. 23), doch gibt es bei diesen keine dem thermischen Kanal von tierischen Organismen vergleichbaren Systeme, und es kann bei Pflanzen nicht von Temperaturwahrnehmung gesprochen werden; in den folgenden Ausführungen werden deshalb Pflanzen nicht berücksichtigt. Für neuere Literatur zum Gesamtthema vgl. Fregley und Blatteis 1996.
2.
Die Reizbedingungen
Die physikalische Zustandsgröße Temperatur steht nicht in einfachem Zusammenhang mit Temperaturempfindungen und thermoregulatorischen Vorgängen; diese werden vielmehr durch eine komplexe Reizkonstellation („Reizklasse“, vgl. Hensel 1966, 60) bestimmt, in die neben der Haut- auch die Innentemperatur des Körpers eingeht. 2.1. Hauttemperatur Zur Analyse der Reizkonstellation werden temperierbare Platten (Thermoden; Abb.
326
II. Aspekte der Semiose
rischen Reaktionen aus, solange die Innentemperatur oberhalb eines Schwellenwertes bleibt (vgl. Brück 1987, 674). Auch die Körperempfindungen sind verschieden; im ersten Falle wird „thermischer Diskomfort“, im zweiten Fall „thermischer Komfort“ empfunden. Diese Abhängigkeit der emotionalen Wirkung einer gegebenen Reizkonstellation der Haut von der Körperinnentemperatur wird als „Alliästhesie“ (Hensel 1982, 110) bezeichnet.
3.
Abb. 11.2: Versuchsanordnung zur Ableitung von Nervenaktionspotentialen aus Temperaturfasern eines Hautnerven bei Reizung des rezeptiven Feldes (Sitz der zugehörigen Thermorezeptoren) mit einer Thermode (aus Konietzny 1982; die Aufnahme wurde dem Verfasser freundlicherweise von dem Autor zur Verfügung gestellt).
11.2) definierter Größe auf die Haut aufgesetzt. Es läßt sich damit zeigen, daß die Temperaturempfindung durch die stationäre Temperatur (T) der Haut, durch die Geschwindigkeit der Temperaturänderung (dT/ dt) sowie die Flächengröße (F) bestimmt wird (Hensel 1966, 167). In die Reizkonstellation geht ferner die Ausgangstemperatur (Adaptationstemperatur) ein. Bei niederer Hauttemperatur (z. B. 25 ∞C) ist eine größere Temperaturänderung, ca. ⫹1 ∞C, erforderlich, um eine Warmempfindung auszulösen, während bei 38 ∞C Ausgangstemperatur bereits ein Anstieg um 0,2 ∞C ausreicht. Die Adaptationstemperatur beeinflußt auch die Schätzung der wahren Temperatur eines Gegenstandes (Tritsch 1988, 531 ff). 2.2. Körperinnentemperatur, Thermoregulation und thermischer Komfort Bei der für die Auslösung thermoregulatorischer Vorgänge maßgeblichen Reizkonstellation ist auch die Innentemperatur zu berücksichtigen (Abb. 11.1). So löst bei normaler Körperkerntemperatur Eintauchen in ein kühles Bad Gänsehaut, Engstellung der Hautgefäße, eventuell Kältezittern aus; wird jedoch die Körperinnentemperatur vor Eintauchen in das Bad gesteigert (Sauna, körperliche Arbeit), so bleiben die thermoregulato-
Das neurophysiologische Korrelat des thermischen Kanals
Gemäß den in anderen Kapiteln dieses Handbuchs erörterten Semiosemodellen (s. Art. 4 sowie Art. 5, Abb. 5.5) ergibt sich die Frage nach den biologischen Strukturen, die eine Temperaturnachricht aufnehmen und weiterleiten. Am längsten bekannt sind thermosensitive Strukturen der Haut, die einer Analyse leichter zugänglich sind als die erst später indirekt erschlossenen inneren thermosensitiven Strukturen. 3.1. Thermorezeptoren der Haut Mit Hilfe von punktförmigen Reizthermoden läßt sich zeigen, daß die Temperaturempfindung von eng umschriebenen Stellen ⫺ Kaltpunkten, Warmpunkten ⫺ der Haut ausgeht. Die Dichte der Kaltpunkte ist größer als die der Warmpunkte. Besonders hoch ist die Dichte der Kaltpunkte im Gesicht (Hensel 1982, 11). Mit Hilfe elektrophysiologischer Methodik konnten jeweils eigene Rezeptoren für die Aufnahme von Kalt- und Warmreizen nachgewiesen werden. Mit sehr feinen Wolfram-Elektroden, die schmerzlos durch die Haut in einen Hautnerven eingestochen werden können (Abb. 11.2), sind selbst beim Menschen Aktionspotentiale von einzelnen Warm- und Kaltrezeptoren ableitbar (Hensel 1982, 35 ff). Bei sprunghafter Änderung der Hauttemperatur reagieren die Rezeptoren mit steil ansteigender Frequenz von Aktionspotentialen, die im Verlauf von Sekunden jedoch abklingt (Adaptation). Bei lang anhaltenden Reizen (statische Erregungsbedingungen) stellt sich die Impulsfrequenz proportional zur Temperatur auf konstante Endwerte ein. Die bei Erwärmung überschießende (dynamische) Reaktion ist ebenso wie die Temperaturempfindung eine Funktion der Änderungsgeschwindigkeit der Temperatur dT/dt (Abb. 11.3).
327
11. Der thermische Kanal
Abb. 11.3: Mittlere Impulsfrequenz von 2 Warmrezeptoren des Handrückens eines Menschen. Temperaturanstiege von 32∞ auf 37 ∞C mit den im Bild angegebenen Geschwindigkeiten. Nach 25 s in allen Fällen gleiche Erhöhung der Impulsfrequenz erreicht (aus Konietzny und Hensel in: Hensel 1982).
Die Abb. 11.4 zeigt die durchschnittliche Aktionspotentialfrequenz von Warm- und Kaltrezeptoren verschiedener Spezies, einschließlich Mensch, unter statischen Bedingungen. Die Rezeptoraktivität hat ⫺ in guter Übereinstimmung mit der Indifferenztemperatur (vgl. § 4.1.) ein Minimum bei 34∞⫺35 ∞C Hauttemperatur. 3.2. Morphologische Struktur der Rezeptoren Feine marklose Nervenendigungen an der Unterseite der Epidermis sind als morphologisches Korrelat von Kaltsensoren nachgewiesen worden. Lichtmikroskopisch nachgewiesene kompliziertere Endorgane von Hautnerven (Krausesche Endkolben, Ruffinische Körperchen), die früher als spezifische Thermorezeptoren angesehen wurden, nehmen taktile Reize auf.
3.3. Transduktionsmechanismus in Thermosensoren Der Mechanismus der Umwandlung eines Temperaturreizes in eine Aktionspotentialfolge (Transduktionsprozeß) ist noch nicht voll abgeklärt. Ein wesentlicher Faktor ist die Temperaturabhängigkeit der zellmembranständigen Elektrogenenpumpe, die Na⫹-Ionen aus der Zelle und K⫹-Ionen in die Zelle hinein transportiert, wodurch das Membranpotential stabilisiert wird. Die Abnahme der Pumpenaktivität sowie eine gleichzeitige temperaturabhängige Öffnung von Ionenkanälen bei Abkühlung von Kaltrezeptoren führen zur Depolarisation der Zellmembran und damit zur Auslösung einer AktionspotentialSalve (Schäfer, Braun und Rempe 1989). 3.4. Innere thermosensitive Strukturen Neben Haut-Thermorezeptoren können thermosensitive Strukturen im Körperinneren
328
II. Aspekte der Semiose
Abb. 11.4: Durchschnittliche statische Aktionspotentialfrequenz von Kalt- und Warmrezeptoren verschiedener Spezies (aus Hensel 1982).
nachgewiesen werden. So lassen sich durch Kühlung oder Wärmung einer eng umschriebenen Region des oberen Hirnstamms, des Hypothalamus, sowohl Wärme- wie Kälteabwehrreaktionen (Schwitzen, Hecheln, Kältezittern) auslösen. Elektrophysiologisch konnten temperaturempfindliche Strukturen auch im unteren Hirnstamm und im Rückenmark identifiziert werden (vgl. Brück 1987, 671 ff). 3.5. Fortleitung der thermischen Information zum Großhirn Die bei thermischer Reizung der Haut ableitbaren Aktionspotentiale werden zum Rükkenmark und von da über Zwischenstationen im unteren Hirnstamm und Thalamus zur sensorischen Rinde des Großhirns fortgeleitet. Es lassen sich im Hirnstrombild (Elektroenzephalogramm, EEG) bei thermischer Reizung der Haut charakteristische Potentialänderungen (thermisch-evozierte Potentiale) ableiten (Hensel 1982, 78).
4.
Korrelation von Temperaturempfindungen mit thermischen Reizen und neuronalen Vorgängen
In § 2. wurden die Reizbedingungen (R) erörtert, die zum Auftreten thermischer Empfindungen (E) führen. In der Terminologie der Semiotik (vgl. Art. 4 § 1.) würde der Reiz R dem Stimulus z entsprechen, der das System i ⫺ d. i. im vorliegenden Fall der tierische oder menschliche Organismus in seiner thermischen Umwelt ⫺ über den thermischen Kanal beeinflußt. Das Verhalten r des Systems i besteht aus physiologischen Reaktionen und Verhaltensweisen, die in Abb. 11.1 als Stellgrößen erscheinen. Das dort dargestellte Wirkungsgefüge läßt sich als Kausalkette im physikalischen Sinne verstehen (Generatorpotential, Aktionspotential, Transmitter etc.), während zwischen dem Reiz (R) (vermittelt über die zur Hirnrinde aufsteigenden Bah-
11. Der thermische Kanal
nen; Abb. 11.1) und der Empfindung (E) eine grundsätzlich andersartige Beziehung besteht, da die Empfindung (E) ein phänomenaler Gegenstand ist, der nicht unmittelbar im Begriffssystem der Physik dargestellt werden kann. In der Sinnestheorie (Hensel 1966, 56; vgl. auch Art. 84) wird diese besondere Relation mit dem Begriff Abbildung bezeichnet. Eine Gleichsetzung von naturkausaler Relation mit dem, was hier als Abbildungsverhältnis beschrieben ist, findet man in reduktionistischen (monistischen) Beschreibungen von Lebensvorgängen. Die Gebrauchsweise des Begriffes Abbildung im vorliegenden Zusammenhang deckt sich weitgehend mit seiner Anwendung an anderen Stellen des Handbuches, so z. B. in Art. 5 § 2.1.2. (die Pawlowsche Konditionierung als Semiose). Die Analyse der Beziehung zwischen (R) und (E) ist Gegenstand der Phänophysik (⫽ Psychophysik); die Analyse der Beziehung zwischen Vorgängen im neurophysiologischen Substrat des thermischen Kanals (N) und (E) derjenige der Phänophysiologie (Hensel 1982, 6). 4.1. Phänophysik Wie bei anderen Modalitäten läßt sich die Intensitätsdimension quantitativ durch die Stevenssche Exponentialgleichung (E ↔ [R/Ro] n, zitiert in Hensel 1982, 20) beschreiben, wobei R der Reiz (R ⫽ „Gegenstand“ im Sinne der Semiotik), z. B. sprunghafte Temperaturänderung um Beträge von 2, 4, …, n ∞C bei definierter Ausgangs(Adaptations)temperatur, Ro die Schwellenreizgröße, E die Empfindungsstärke, gemessen in einer eigenmetrischen arbiträren Größenskala, ist. Bei Wärmereizen wurde für den Exponenten n 1,6, für Kältereize durchschnittlich 1,0 bestimmt. Bei statischer Reizung (Thermodenfläche 75 cm2, 30 min Adaptationszeit) wird eine Temperatur von 34 ∞C als indifferent angegeben; zwischen 34 ∞C und 27 ∞C können mehrere Stufen der Kaltempfindung unterschieden werden, oberhalb 34 ∞C mehrere Stufen der Warmempfindung. Zwischen 23 ∞C und 27 ∞C ist eine Temperaturdiskriminierung nicht möglich, unterhalb 23 ∞C ist die Kaltempfindung durch ein qualitativ verschiedenartiges Gefühl ⫺ „eisig“, zum Teil mit Schmerz vermischt ⫺ bestimmt (Hensel 1982, 23). Am oberen Ende der subjektiven Temperaturskala tritt die qualitativ abgrenzbare Empfindung „heiß“ auf.
329 4.2. Phänophysiologie Ziel der Phänophysiologie (vgl. Art. 143) ist die Beschreibung des Abbildungsverhältnisses zwischen Empfindungen (E) und neuronalen Prozessen (N). Bei statischer Temperaturreizung der Haut mit Reiztemperaturen von 27 ∞C⫺38 ∞C ergab sich eine gute Entsprechung der statischen Entladungsfrequenz der Kaltrezeptoren der Affenhand (Abb. 11.4) mit Schätzungen der Temperaturintensität des Menschen bei gleichartiger thermischer Reizung. Die in § 4.1. beschriebene Unfähigkeit zur Temperaturdiskrimination im Bereich 23 ∞C⫺27 ∞C fällt annähernd mit der Umkehr des Temperaturkoeffizienten der Impulsfrequenzkurve (Abb. 11.4) zusammen. Die Unterschiedsschwellenempfindlichkeit bei Temperatursprüngen von ⫹2, 4, 6 und 8 ∞C liegt in der Größenordnung von (nur!) 0,03 ∞C und ist ⫺ entgegen der Weberschen Regel ⫺ praktisch unabhängig von der Ausgangsreizgröße. Die Empfindungen ließen sich korrelieren mit einer nach statistischen Kriterien eben nachweisbaren Differenz der durchschnittlichen Entladungsfrequenz von Nervenpräparaten der Affenhand, die 25⫺50 temperaturempfindliche Einzelfasern enthielten (Johnson et al. 1979, zitiert in Hensel 1982, 163). Weitere Untersuchungsergebnisse führten zu der Folgerung, daß die Zunahme der Rezeptoraktivität bis zu einem Schwellenwert ohne Empfindung bleiben kann, was zur Postulierung einer sogenannten „zentralen Verarbeitungsschwelle“ geführt hat. Bei dynamischer Reizung ist die Abklingdauer der Empfindung (Adaptation) länger als die der Impulsfrequenz der Hautrezeptoren. Es wird deshalb ein zwischen den Rezeptoren und den zentralen Verarbeitungsstrukturen lokalisiertes Integrationsglied postuliert, dessen Halbwertszeit für das Abklingen der Erregung größer als beim Rezeptor ist. Eine weitere Komplexitätssteigerung ergibt sich durch die mögliche Verstellung der Rezeptorempfindlichkeit durch Sympathikuserregung (Hellon 1989) und durch humorale Faktoren. Intermodale Aktionen: Gewisse Mechanorezeptoren (SA II, „slowly adapting receptors“), die auch auf Abkühlung mit einer Impulsfrequenzerhöhung reagieren, stellen möglicherweise das Korrelat für die sogenannte „Webersche Täuschung“ dar ⫺ ein kaltes auf die Stirn angelegtes Gewicht erscheint schwerer als ein warmes.
330
5.
II. Aspekte der Semiose
Literatur (in Auswahl)
Brück, Kurt (1987), „Wärmehaushalt und Temperaturregelung“. In: Robert F. Schmidt und Gerd Thews (eds.), Physiologie des Menschen. Berlin, Heidelberg und New York: Springer: 660⫺682. Fregley, Melvin J. und Blatteis, Clark M. (eds.) (1996), Handbook of Physiology. IV: Environmental Physiology. Oxford und New York: Oxford Univ. Press. Hellon, Richard (1989), „Processing of Thermal Information from the Face“. In: Karl-Heinz Voigt und John Bligh (eds.), Thermoreceptors and Thermoregulation. Berlin, Heidelberg und New York: Springer. Hensel, Herbert (1966), „Allgemeine Sinnesphysiologie, Hautsinn, Geschmack, Geruch“. In: Wilhelm Trendelenburg und Erich Schütz (eds.), Lehrbuch der Physiologie. Berlin, Heidelberg und New York: Springer.
Hensel, Herbert (1982), Thermal Sensations and Thermoreceptors in Man. Springfield, Ill.: Charles C. Thomas. Konietzny, Frithjof (1982), „Neurophysiologische Untersuchungen der cutanen Sensibilität beim Menschen“. Diss. Univ. Marburg. Gießen: Verlag Ferbersche Univ.-Buchhandlung. Schäfer, Klaus, Hans A. Braun und Ludgera Rempe (1989), „Mechanisms of Sensory Transduction in Cold Receptors“. In: Karl-Heinz Voigt und John Bligh (eds.), Thermoreceptors and Thermoregulation. Berlin, Heidelberg und New York: Springer. Tritsch, Mark F. (1988), „The Veridical Perception of Object Temperature with Varying Skin Temperature“. Perception and Psychophysics 43: 531⫺540.
Kurt Brück †, Gießen (Deutschland)
12. Die Organisation von Augenbewegungen: Fallstudie einer mehrkanaligen Semiose 1. Kommunikative Augenbewegungen in semiotischer Perspektive 1.1. Blickverhalten 1.2. Mehrkanal-Konflikte 2. Augenbewegungen als Output 2.1. Sakkaden 2.2. Augenfolgebewegungen 2.3. Efferenzkopie 3. Eingänge in das Hirnstamm-Augenbewegungssystem 3.1. Gleichgewichtsinformation 3.2. Visuelle Information 3.3. Akustische und taktil-kinästhetische Raumintegration 3.4. Kognitiv-mnestische Lokalisationen 4. Semiotische Aspekte der Augenbewegungsorganisation 5. Literatur (in Auswahl)
1.
Kommunikative Augenbewegungen in semiotischer Perspektive
Der optische Kanal dient der Rezeption von Reizen durch das Auge (vgl. Art. 6). Dieses Sinnesorgan kann aber seinerseits gesehen werden und dadurch selbst zur Erzeugung von Reizen verwendet werden. Dies geschieht durch die mehr oder weniger ostentativen Augenbewegungen im Blickverhalten des Menschen.
1.1. Blickverhalten Blickverhalten ist oft Bestandteil kommunikativer Semiosen: So ist das Flirten mit seiner Sequenz von Anblicken, interessiertem Anblicken und verschämtem Wegblicken, von scheinbarem Desinteresse durch demonstratives Betrachten neutraler Objekte, das Wiederhinblicken und das Wagen eines längeren Blickkontaktes eine durchaus ereignis- und erlebnisreiche Kommunikation zwischen entsprechend gestimmten Partnern, die gemäß einer semiosischen Matrix (vgl. Art. 5) analysiert werden kann. Das Zeichen Anblicken, dessen Syntaktik die gleichzeitige Ausrichtung des Partner-Augenpaares auf das meine erfordert (Schielen erschwert die Zeichenfunktion beträchtlich) hat nach Tembrock (1971, 215) zuerst die pragmatische Funktion des Sichtkontaktsignals im Nahfeld und die semantische Funktion der „Identifizierung eines Artgenossen“ (,Er/Sie sieht mich‘). Das länger dauernde Anblicken erhält die semantische Funktion ,Er/Sie interessiert sich für mich‘. Das erste Wegblicken könnte dann bedeuten ,Er/Sie will mich nicht bedrohen‘; das folgende Wiederhinblicken ,Aber er/sie interessiert sich wirklich für mich‘ usw. So erhalten dieselben Zeichen des Anblickens und Wegblickens im Verlaufe der semiotischen Se-
12. Augenbewegungen als mehrkanalige Semiose
quenz des Kommunikationsverhaltens immer spezifischere Bedeutungen durch Rückgriff auf gelernte, artspezifische und sogar artübergreifende Kodes, bis eine voll ausgeprägte Balzstimmung mit den entsprechenden Hormonauswirkungen aufgebaut ist oder aber auch eine Fluchtstimmung, weil der potentielle Partner, obwohl er nun angebissen hat, als eher bedrohlich und nicht mehr attraktiv erlebt wird. Teilweise ist die Semantik des Anblickens sogar artübergreifend: das unverwandte Anstarren wird nicht nur von Schimpansenmännchen, sondern auch schon von Hunden und Katzen als Drohgebärde verstanden und entsprechend meist mit Abwenden und Ausweichen, bei Schimpansen- und Gorillamännchen je nach dem Kontext (z. B. der Rangstellung) auch eventuell mit Angriffsverhalten beantwortet. Entscheidend ist hierbei nur die Dauer des Blickkontaktes. Auch wir Menschen empfinden es als befremdlich, ja eventuell als beängstigend, wenn wir unverwandt angeblickt werden, und den bösen Blick (im englischen Sprachgebrauch noch drastischer the evil eye genannt) attestieren ängstliche und abergläubische Menschen solchen sie durchdringend anblickenden Fremden, denen sie zutrauen, daß sie diese Macht über sie gewinnen könnten. Daraus folgt, daß die Kodes für das Verstehen und die Bedeutung des langen Blickes schon speziesübergreifend verankert sein müssen. Aber es gibt auch soziale Konventionen im Rahmen des Gespräches über das Anblicken und Wegblikken, durch das das normalerweise reibungslose Wechseln von Reden und Zuhören geregelt wird (vgl. Duncan 1972). Von dieser kommunikativen Funktion des Blickens soll im folgenden jedoch nicht die Rede sein; der interessierte Leser findet einiges dazu z. B. bei Kendon (1967) und Duncan (1972). Vielmehr soll hier die interne Organisation des Blickverhaltens im Organismus von Mensch und Tier besprochen werden, insofern es sich als Integration verschiedener Inputs (von Sinnessystemen wie auch vom Gedächtnis und von so etwas wie Intentionen) darstellt und damit als mehrkanalige Semiose betrachtet werden kann. Dabei bereitet die Explikation (siehe Art. 134) der herkömmlichen Begriffe der Physiologie und Psychologie im Rahmen einer semiotischen Terminologie für einen eher pragmatisch denkenden Fachwissenschaftler Schwierigkeiten. Denn auch die Neurowissenschaften kennen Kodes, z. B. wenn die zunehmende Reizintensität durch eine zunehmende Entladungsrate
331 und zunehmende Anzahl gleichzeitig aktivierter Neurone kodiert wird, aber hier ist nicht ein definierter Zeichenvorrat gemeint, sondern das evozierte Verhalten der jeweils folgenden Neurone (vgl. Art. 143 und Art. 145). Dennoch bleibt dieses Verhalten ja nicht gleich, sondern ändert sich z. B. durch Habituation, so daß im Prinzip jedes weiterverarbeitende Neuron und auch Neuronenketten als kontextabhängige Interpretanten angesehen werden könnten. So hat der semiotische Ansatz als ganzheitlicher Ansatz zwar eine ausgesprochene Attraktivität für das Überdenken der Terminologien und Konzepte der Fachwissenschaften. Er führt aber auch zu grundsätzlichen Fragen nach seiner Angemessenheit im fachwissenschaftlichen Kontext, die nicht ein für allemal beantwortet werden können. Hier werden zunächst die herkömmlichen Beschreibungs- und Erklärungsbegriffe benutzt und erst am Schluß die Konsequenzen einer semiotischen Betrachtung der untersuchten Mehrkanal-Integration untersucht. 1.2. Mehrkanal-Konflikte Wir haben alle als Kinder das Die-Weltdreht-sich-Spiel gespielt: wer sich längere Zeit um die eigene Achse dreht (oder drehen läßt) und plötzlich stillsteht, sieht die Welt in der ursprünglichen Drehrichtung sich weiterdrehen. Zeichnet man die Augenbewegungen des Getäuschten auf, sieht man einen sogenannten „postrotatorischen vestibulären Nystagmus“ (vgl. Abb. 12.1). Dieser besteht aus
Abb. 12.1: Ein Nystagmus (hier ein postrotatorischer vestibulärer Nystagmus) besteht aus sogenannten „langsamen Augenbewegungen“ (L) und Sakkaden (S und kleine Pfeile), die immer maximale Geschwindigkeit haben und während derer normalerweise keine Wahrnehmung besteht. Die Quelle für die langsamen Augenbewegungen ist hierbei die Nacherregung der sogenannten „Cupulaorgane“ (s. Abb. 12.3) des beschleunigungsempfindlichen Gleichgewichtsorgans bei einem Stop (negative Beschleunigung) nach gleichförmiger (d. h. auf die Dauer unwirksamer) Bewegung. Die Drehrichtung vor dem Stop ist durch den großen Pfeil gekennzeichnet.
332 langsamen Augendrehbewegungen ⫺ im folgenden abgekürzt „Augenbewegungen“ genannt ⫺ in der alten Drehrichtung, von Zeit zu Zeit unterbrochen von ruckhaften Augenbewegungen (Sakkaden) in der Gegenrichtung. Mit „Nystagmus“ werden in der Physiologie alle periodischen Augenbewegungen bezeichnet, die sich aus zwei Phasen, einer mit langsamen Augenbewegungen in die eine Richtung und einer mit Sakkaden in die Gegenrichtung, zusammensetzen. Als „vestibulär“ wird ein Nystagmus bezeichnet, wenn er aus dem Gleichgewichtsorgan (Vestibularorgan) des Innenohres ausgelöst wird. Postrotatorisch heißt dieser vestibuläre Nystagmus, da er erst nach Beendigung einer über längere Zeit gleichförmigen Drehung auftritt.
Diese Augenbewegungen machen erst Sinn, wenn wir uns den vestibulären Nystagmus nicht nach, sondern während einer Drehung des Kopfes und Körpers (z. B. im Dunkeln) anschauen: jetzt folgt die langsame Augenbewegung scheinbar einem Objekt in der Außenwelt, hält so dessen Bild auf der Netzhaut annähernd ruhig und ermöglicht damit dem das Bild (im Hellen) auswertenden Gehirn, in einem gewissen Zeitrahmen unabhängig von den Bewegungen des Organismus Identifizierungen der gesehenen Objekte ohne störende Verschiebungen in Ruhe vorzunehmen. Eine elegante Bestätigung der Annahme, daß es die wichtigste Funktion der Augenbewegungen ist, für einen Augenblick wenigstens für ein quasi-stabiles Netzhautbild trotz eigener Bewegung zu sorgen, erbrachten Versuche von Cynader (1985): bei Katzen, die unter 8 Hz Flickerlicht aufgezogen wurden, die also nie eine kontinuierliche Bewegung sahen, entwickelt sich eine unphysiologische, regelmäßige, 8 Hz-oszillatorische Augenbewegung von bis zu einem Winkelgrad, die annähernde Netzhautstabilität des Bildes für wichtige Klassen von Umweltverschiebungen garantiert. Obwohl also die Welt nach einer Drehung objektiv stillsteht, zeigt der vorher Gedrehte eine langsame Augenbewegung in die alte Drehrichtung (die man willentlich nicht herstellen kann) und erlebt eine entgegengesetzte visuelle Drehwahrnehmung. Offensichtlich setzt sich hierbei eine die Drehung überdauernde vestibuläre Information im Konflikt mit visueller und kinästhetischer Information beim Augenbewegungssystem durch (und nicht nur bei diesem, es entsteht auch eine Fallneigung!) und bestimmt das Geschehen.
II. Aspekte der Semiose
Ein anderer aufschlußreicher Konfliktfall ist die Scheinverschiebung der gesehenen Welt bei passiver Verschiebung eines Augapfels: drücken wir periodisch mit dem Zeigefinger durch das Unterlid auf den Augapfel, bewegt sich das Bild der Umwelt, das wir von diesem Auge erhalten, entgegengesetzt zur Verschiebung, während wir normalerweise bei aktivem Umherblicken eine ruhige Umwelt sehen, teilweise trotz erheblicher Auslenkungen des Auges. Schon Helmholtz (1866) forderte eine „Willensmeldung an die Augenmuskeln“ als Ursache für die nicht gesehene Bewegung: die tatsächliche Netzhautbildverschiebung und diese „Willensmeldung“ sollen sich durch gegenseitige Verrechnung aufheben; gibt es keine Willensmeldung wie bei der passiven Verschiebung des Auges, kommt es zur Scheinverschiebung. Dieses Konzept wird, meist unter dem Namen „Efferenzkopie“ nach von Holst und Mittelstaedt (1950), auch heute noch diskutiert (Jeannerod, Kennedy und Magnin 1979; Jeannerod 1988, 137). Und auch das dritte Beispiel solcher Sinnestäuschungen unter Einschluß der Augenbewegungen, hinter denen sich immer Konstruktionseigentümlichkeiten unserer Sinne und deren zentraler Integration verbergen, ist von den meisten Menschen schon erlebt worden: steht man auf einer Flußbrücke und schaut in das fließende Wasser, erscheint einem mit einem Male die Brücke sich stromaufwärts zu bewegen. Augenbewegungen selbst in die Gegenrichtung beim Verfolgen eines kleinen bewegten Objektes haben keinen Einfluß auf diese „Linearvektion“ genannte Täuschung (Dichgans und Brandt 1978), wichtig ist nur, daß ein genügend großer Ausschnitt des Gesichtsfeldes sich über eine gewisse Zeit in dieselbe Richtung bewegt. Hier erleben wir also die Vortäuschung einer im Normalfall aus dem Gleichgewichtsorgan stammenden Meldung einer Eigenbewegung. So zeigen denn auch Ableitungen aus den zweiten vestibulären Neuronen bereits deutlich eine visuelle Beeinflussung (Waespe und Henn 1985), so daß höhere Zentren, also auch die Wahrnehmung, nicht mehr zwischen einer tatsächlichen Bewegung und einer nur visuell vermittelten unterscheiden können. Superbreitwandkinos haben sich aus diesem Grunde nicht durchgesetzt, da sie soviel Bewegungskrankheiten (einschließlich Übelkeit und eventuell Erbrechen) induziert haben, daß man sie heute eigentlich nur noch
12. Augenbewegungen als mehrkanalige Semiose
in Erlebnisparks (wie Phantasialand) vorfindet. Mit diesen drei Beispielen sollte daran erinnert werden, daß unser Erleben und unsere Motorik das Ergebnis einer Verrechnung aus vielen Kanälen darstellen, die natürlich auch in Konflikt miteinander kommen können, wodurch wir häufig erst auf den konstruktiven Charakter unseres Verhaltens und Erlebens aufmerksam gemacht werden.
2.
Augenbewegungen als Output
In Abb. 12.1 haben wir die beiden wichtigsten Formen von Augenbewegungen kennengelernt: die geschwindigkeitskontrollierten Augenfolgebewegungen (im weitesten Sinne) und die positionskontrollierenden Sakkaden. Demgegenüber spielen zwei weitere Formen von Augenbewegungen, der Drift (oder das Augengleiten) als Ausdruck fehlender Nullpunktstabilität (die zunimmt z. B. bei nachlassender Aufmerksamkeit) und der sehr kleine feinschlägige Augentremor eine untergeordnete Rolle. Die generelle Zweiteilung in ein auf Position und ein auf Geschwindigkeit bezogenes System ist erst durch die neurophysiologische Analyse der Augenbewegungen offensichtlich geworden (Robinson 1975; 1981). Die Funktion der geschwindigkeitskontrollierten Augenfolgebewegung ist es, das Bild des interessierenden Objektes auf der Netzhaut annähernd konstant zu halten. Umgekehrt ist es bei den Sakkaden: ihre Geschwindigkeit ist immer maximal, entsprechend den jeweiligen Randbedingungen des Systems, nämlich der durchmessenen Winkelamplitude (im folgenden „Amplitude“ genannt) und in geringerem Maße der Vigilanz; bei Ermüdung sinkt die Sakkadengeschwindigkeit. Die Funktion der Sakkaden ist es, einen neuen Bildausschnitt oder ein neues Sehobjekt auszuwählen. 2.1. Sakkaden Alle schnellen Augenbewegungen „Sakkaden“ zu nennen, beruht auf dem Nachweis einer gemeinsamen neuronalen Entstehung. Nach den allgemein akzeptierten, wenn auch noch nicht in allen Einzelheiten bestätigten Modellvorstellungen von Robinson (1975; 1981) entstehen die Sakkaden im Hirnstamm in spezialisierten Neuronen (s. Abb. 12.2). Hier kann man Entladungssalven (sogenannte „Bursts“) in Burst-Neuronen (BN) registrieren, die zusammen mit einem tonischen
333 Entladungssignal aus dem postulierten neuralen Integrator (NI) das phasisch-tonische (auch als „Pulse-Step“ bezeichnete) Entladungsverhalten der Motoneurone (MN) der Augenmuskelnerven (N VI ⫽ VI. Hirnnerv) hervorbringen. Das Pulse-Step-Signal wird durch die Mechanik der Augenmuskeln und des Augapfels gedämpft und produziert die geglättete Bewegungsform der Sakkaden. Diese erreichen bei größeren Amplituden Winkelgeschwindigkeiten über 600∞/sec und dauern deshalb nur zwischen 15 und 100 ms je nach Amplitude. Als Eingang zu dem vereinfacht dargestellten neuronalen Netzwerk des Sakkadengenerators sind in diesem Modell zwei getrennte Informationen vorgesehen: ein Zeitpunkt-Signal (ZP), das den Beginn einer Sakkade durch Hemmung der dauerhemmenden sogenannten „Omni-Pause-Neuronen“ (ON) bestimmt, und ein Amplitudensignal, das in Kopfkoordinaten (KK) die Entfernung des Zielortes angibt; die nötige Augenpositionsänderung wird durch Rückkopplung des Neuralen Integrators (NI), der die momentane Augenposition (AP) in Relation zum Kopf darstellt, auf die Burst-Neurone bewirkt. Dieses Rückkopplungssignal erfüllt damit die Anforderungen an die bereits erwähnte Efferenzkopie (EK), die zum Aufbau einer Wahrnehmung benötigt wird und somit wahrscheinlich auch zentral gemeldet wird. Die in dem Schema fehlende Richtungsinformation einer Blickbewegung wird durch eine jeweils andere Auswahl an Zellen und Nervenfasern aus den 4 okulomotorischen Hirnnerven bzw. Muskelfasern aus den 6 äußeren Augenmuskeln repräsentiert (zur Anatomie der Augenmuskeln vgl. Kahle, Leonhardt und Platzer 1984, zur Anatomie der okulomotorischen Hirnzentren vgl. Büttner-Ennever 1988). 2.2. Augenfolgebewegungen Während die Geschwindigkeit der Sakkaden immer entsprechend der intendierten Amplitude (und der Vigilanz) maximal ist, diese also entsprechend kurze Dauern zeigen (während der auch unter Tagesbeleuchtungsbedingungen keine bewußte Wahrnehmung stattfindet!), sind die Augenfolgebewegungen immer unter Kontrolle eines bewegten Reizes bzw. eines Wahrnehmungskorrelates davon. Dieser Reiz kann die Drehung des Kopfes sein (beim vestibulären Nystagmus, der auch im Dunkeln oder bei geschlossenen Augen auftritt) oder die Verschiebung des gesamten
334
II. Aspekte der Semiose
Abb. 12.2: Ein neuronales Modell der Sakkadenentstehung mit 4 Klassen von Neuronen im Hirnstamm und ihrem Entladungsverhalten. Die Eingangsgröße zum Puls-Generator in den Burst-Neuronen (BN) ist eine Kopfkoordinate (KK), die in ein Sakkaden-Kommando (SK) des VI. Hirnnerven (VI) umgesetzt wird, wenn ein Zeitpunkt-Signal (ZP) die dauerhemmenden sogenannten „Omnipause-Neurone“ (ON) hemmt, so daß eine anfänglich maximale Entladungssalve in den Burst-Neuronen freigesetzt wird; diese werden zunehmend durch Rückwärtshemmung aus dem postulierten Neuronalen Integrator (NI) gehemmt, der die momentane Augenposition kodiert (die Step-Komponente). Die Rückmeldung aus dem Neuronalen Integrator stellt zugleich die Augenpositionsmeldung (AP) dar, welche als Efferenzkopie (EK) bezeichnet wird, wenn sie noch an anderen Stellen im visuell-motorischen System benötigt wird, z. B. um im Wahrnehmungssystem Scheinverschiebungen zu anullieren (modifiziert nach Robinson 1975).
visuellen Gesichtsfeldes (beim optokinetischen Nystagmus, der üblicherweise durch eine sich um den Probanden drehende Trommel mit Streifenmuster erzeugt wird), es kann aber auch der vorbeifliegende Vogel sein, dem mein Blick folgt (die Augenfolgebewegung im engeren Sinne). Hierzu muß das bewegte Objekt angeblickt werden, also in der sogenannten „Fovea centralis“ unserer Netzhaut, der Stelle des schärfsten Sehens, fixiert bleiben. Die Geschwindigkeit der Augenfolgebewegungen im weiteren Sinn folgt innerhalb bestimmter Grenzen der Vorgabe des Reizes. Diese Grenzen werden hauptsächlich durch
das sensorische System bestimmt und liegen z. B. beim vestibulären Nystagmus bei so hohen Werten (bis zu 300∞/sec nach Lisberger und Westbrook 1985), daß die früher benutzte Bezeichnung „langsame“ Augenbewegung zur Unterscheidung gegenüber der „schnellen“ Augenbewegung, den Sakkaden, nicht mehr gerechtfertigt ist. Die beiden Augenbewegungssysteme benutzen jedoch unterschiedliche neuronale Strukturen, was die generelle Zweiteilung rechtfertigt. So finden sich im Hirnstamm GeschwindigkeitsNeurone (Eckmiller 1987), die über den bereits erwähnten Neuralen Integrator, aber un-
335
12. Augenbewegungen als mehrkanalige Semiose
ter Umgehung der Burst-Neurone des Sakkadensystems die Motoneurone zur kontinuierlichen Positionsänderung veranlassen. Damit bleiben die Burst-Neurone exklusiv den Sakkaden und die Geschwindigkeitsneurone exklusiv den Augenfolgebewegungen vorbehalten. Die maximale Augenfolgegeschwindigkeit ist jedoch beim fovealen Verfolgen eines kleinen Objektes (z. B. eines fliegenden Vogels) erheblich langsamer mit etwa 30∞/sec (Robinson 1981) gegenüber der zehnfach höheren beim vestibulären Nystagmus, wofür die geringere zeitliche Auflösung des visuellen Analysators in den corticalen Sehzentren verantwortlich ist. 2.3. Efferenzkopien Man kann darüber streiten, ob ein Signal, das das Gehirn nicht verläßt, sondern nur an eine andere Stelle im selben Gehirn gemeldet wird, als Output desselben zu bezeichnen ist. Immerhin zweigt eine solche Efferenzkopie entsprechend der Modellvorstellung in Abb. 12.2 kurz vor dem Austritt aus dem Gehirn ab an einer Stelle, von der ab üblicherweise Entladungen nur noch in Muskelaktivität umgesetzt werden; im englischen Sprachgebrauch wird denn dieser „Output“ auch „Outflow“ genannt im Gegensatz zum „Inflow“ der sensorischen Reafferenz, auch „Propriozeption“ genannt; letztere ist z. B. die sensorische Information aus den Muskeln, die sich ja ändert, wenn diese bewegt werden. Die Propriozeption wird auch zentral ausgewertet, jedoch scheint sie zur weitgehend vorprogrammierten Zielbewegung nur selten nötig zu sein (Jeannerod 1988, 139). Als Nachweis des Vorhandenseins und der Wirksamkeit einer Efferenz-Kopie können die berichteten Scheinverschiebungen bei einer intendierten, aber durch Lähmung der Augenmuskeln nicht ausgeführten Bewegung dienen (Helmholtz 1866; Kornmüller 1931). Bei künstlich durch Curare gelähmten, beatmeten Versuchspersonen (Stevens u. a. 1976; Matin, Stevens und Picoult 1983) verschwanden jedoch anfänglich vorhandene Scheinverschiebungen nach kurzer Zeit bzw. vollständiger Lähmung im Hellraum. Auch über neurophysiologische Korrelate der Efferenz-Kopie liegen mehrere Berichte vor. So fanden Robinson und Wurtz (1976) visuell sensitive Neurone im colliculus superior, die zwar heftig auf einen optisch schnell bewegten Reiz antworteten, auf dieselbe Relativverschiebung des Bildes über die Netzhaut während
einer Augenbewegung aber keine Antwort zeigten. Auch im visuellen Cortex sind solche Beobachtungen gemacht worden (VanniMercier und Magnin 1982). Über den theoretischen Stellenwert der im allgemeinen akzeptierten Existenz einer Efferenzkopie gehen jedoch die Meinungen noch weit auseinander (kontra: Bridgeman 1983; pro: Matin, Stevens und Picoult 1983; Jeannerod 1988), zumal viele experimentelle Hinweise gegen eine einfache Verrechnung zwischen retinaler Afferenz und Efferenzkopie als wirksamen Mechanismus zur Aufrechterhaltung der Raumkonstanz sprechen (Galley 1974).
3.
Eingänge in das HirnstammAugenbewegungssystem
Ein motorisches System muß Anweisungen zum Handeln erhalten, und diese können für unsere beweglichen Augen sehr kognitiv, wie beim Lesen, oder sehr direkt, wie in der Gleichgewichtsregulation, sein. 3.1. Gleichgewichtsinformation Einen sehr unmittelbaren, nur 3 Synapsen umfassenden, und sehr kräftigen Eingang (siehe unser Anfangsbeispiel der sich weiter drehenden Welt) erhält das Augenbewegungssystem aus dem Gleichgewichtssinn. Da dieser in diesem Handbuch nicht an anderer Stelle abgehandelt wird, seien ein paar Tatsachen hierzu aufgeführt (ausführlich z. B. Kornhuber 1974). Der Gleichgewichtssinn erhält Lage- und Beschleunigungsinformation aus den Bogengangsorganen sowie aus den Maculaorganen im Innenrohr (s. Abb. 12.3). Die Bogengangsorgane sind drei in den drei Ebenen des Raumes aufgespannte, flüssigkeitsgefüllte Bögen, in die eine gallertige Cupula hineinragt. Nur bei Drehbeschleunigungen kommt es vektormäßig in einem oder mehreren der Bogengänge zu einer Verbiegung der Cupula und Abscherung der auf ihr sitzenden Sinneshärchen. Damit verbunden ist eine Modulation von Transmitterausstoß am anderen Ende der Haarzelle, die auf der nachgeschalteten Nervenfaser zu einer Erniedrigung oder Erhöhung der regelmäßigen, hohen Spontanaktivität von etwa 100 Impulsen/sec führt. Nur erwähnt werden sollen die vom Gehirn zu den Haarzellen ziehenden efferenten Nervenfasern, die die Erregungsbildung bereits an der Sinneszelle modifizieren können (Klinke und Galley 1974).
336
II. Aspekte der Semiose
Abb. 12.3: Das Gleichgewichtsorgan besteht aus den drei Bogengangsorganen und den beiden Maculaorganen im Innenohr. Die rechtwinklig zueinander stehenden Bogengänge nehmen aufgrund ihrer Konstruktion nur Drehbeschleunigungen, die Maculaorgane Linear- und Drehbeschleunigungen auf. In die gallertige Cupula, wie auch in die Macula, ragen Haarzellen hinein, die auf Auslenkung in die eine Richtung mit einer Depolarisation und in die entgegengesetzte Richtung mit einer Hyperpolarisation reagieren. Dadurch kommt es zur Modulation eines Transmitterausstoßes an dem unteren Pol der Haarzelle und einer entsprechenden Modulation der afferenten Entladungssalven auf dem nachfolgenden ersten vestibulären Neuron. Diese Neurone ziehen zusammen mit den Hörnervenfasern aus der benachbarten Schnecke im VIII. Hirnnerven in den Hirnstamm (modifiziert nach Galley 1986).
Daß Dreh-Beschleunigungen der adäquate Reiz für die Bogengangsorgane sind, kann man sich in einem kleinen Selbstversuch deutlich machen: Setzen Sie sich auf einen leichtgängigen Drehstuhl, schließen Sie die Augen, und lassen Sie sich für etwa 20 sec möglichst gleichmäßig und eher langsam, nicht zu schnell, drehen. Dann lassen Sie den Stuhl ausdrehen und öffnen die Augen, wenn Sie das Gefühl haben, er stünde still. Sie werden vermutlich überrascht sein, feststellen zu müssen, daß Sie sich noch drehen. Aber bei einem leichtgängigen Stuhl bestand während der letzten Sekunden eine annähernd gleichmäßige Drehgeschwindigkeit, und diese wird von dem Cupulaorgan nicht registriert und deshalb von uns auch mit geschlossenen Augen nicht wahrgenommen.
In den Maculaorganen sind die Haarzellen in eine mit Calcitsteinchen versehene Gallerte eingelassen, die dadurch ein anderes spezifisches Gewicht hat als die Umgebung und damit auf jede Beschleunigung, also auch auf gradlinige, mit Auslenkung der Sinneshärchen reagiert. Die ersten vestibulären afferenten Nervenfasern ziehen dann im 8. Hirnnerven in den Hirnstamm und werden hier in den Vestibulariskernen auf das zweite, zentrale Vestibularis-Neuron umgeschaltet, dessen Axon u. a. einen direkten Kontakt auf das in der entsprechenden Raumebene liegende Motoneu-
ron des Augenbewegungssystems hat. Insgesamt hat diese Kette also nur 3 Synapsen. Es gibt jedoch auch Abzweigungen zum Kleinhirn und längere Ketten zu den Augenmuskelneuronen. So führen Drehbeschleunigungen reflektorisch zu den der Drehrichtung entgegengesetzten Augenfolgebewegungen, wie wir sie im vestibulären Nystagmus schon kennengelernt haben. Dadurch wird das Bild auf der Netzhaut eine Zeitlang stabilisiert. Menschen ohne Gleichgewichtssinn sind deshalb nicht in der Lage, in einem fahrenden Bus Zeitung zu lesen, da ihnen die wirksame Kompensation der Erschütterungen durch vestibulär ausgelöste Augenbewegungen verlorengegangen ist. Im Hellen haben sie dagegen kaum Gleichgewichtsprobleme; hier ist der visuelle Kanal ausreichend zur Kompensation, ja häufig sogar dominant gegenüber dem vestibulären, wie bei der Eigenbewegungsillusion schon erwähnt worden war. Diese visuell-vestibuläre Interaktion greift nun auch dynamisch-plastisch in diesen klassischen Drei-Synapsen-Reflex ein (Berthoz und Melvill Jones 1985, sowie Keller und Zee 1986): So reduziert sich z. B. der postrotatorische vestibuläre Nystagmus nach ein paar Drehungen bereits drastisch, oder das Tragen von verkleinernden oder vergrößernden Lin-
12. Augenbewegungen als mehrkanalige Semiose
sen bringt nach einiger Zeit auch entsprechende Modifikationen des im Dunkeln (!) durchgeführten vestibulären Nystagmus mit sich, oder bereits die Vorstellung (!) eines sich mit mir drehenden Objektes, das ich im Dunkeln angestrengt fixiere, verringert den vestibulären Nystagmus bei niedrigen Geschwindigkeiten beträchtlich, ja kann ihn fast bis zum Verschwinden bringen. Diese Anpassungen sind richtungsspezifisch, und das Kleinhirn ist entscheidend an ihrer Ausbildung beteiligt. 3.2. Visuelle Information Nachdem wir zur Kenntnis genommen haben, daß Augenbewegungen sehr wirksam aus dem Gleichgewichtsorgan ausgelöst werden können, was normalerweise keine aufdringlichen bewußten Empfindungen produziert, ist für unser bewußtes Erleben und Verhalten die Steuerung der Augenbewegungen aus visueller Information und deren Verarbeitung viel eindrücklicher. Da wir die Exekutivorgane für Augenbewegungen im Hirnstamm (den Sakkadengenerator und die Geschwindigkeitsneurone) schon kennengelernt haben, können wir die übrigen zu Augenbewegungen führenden Informationsverarbeitungsprozesse mit gutem Grund auch als „Vorbereitungen“ bezeichnen, da es in vielen Fällen Hinweise auf Vorbereitungen für bestimmte Augenbewegungen gibt, die aber nicht ausgeführt werden, sondern noch vor ihrer Ausführung von anderen Zentren wieder wirksam gehemmt werden. 3.2.1. Sakkadenvorbereitung Erscheint in der Peripherie meines Gesichtsfeldes plötzlich ein Reiz, ist es wahrscheinlich, wenn auch nicht zwingend notwendig, daß sich mein Blick mittels einer Sakkade auf ihn lenkt. Wie man sich an einem Boulevard bei Nacht deutlich machen kann, muß ein Autofahrer solche Reize auch ignorieren können. Für die Bestimmung von Richtung und Amplitude einer solchen Sakkade scheint es nun naheliegend, der retinalen Koordinate des Reizes die entscheidende Rolle zuzuschreiben. Ein kleiner Gedankenversuch sollte uns vorsichtiger machen: Im Dunkelraum fixiert man ein Kreuz, zwei kurz nacheinander erscheinende Lichter soll man nacheinander anblicken; das erste Licht erscheint für nur 50 ms 5∞ rechts vom Fixationspunkt, wobei dieser erlischt, geht dann auch aus, und gleichzeitig geht in 10∞ Entfernung, wiederum für nur 50 ms, ein zweites Licht kurz an und
337 verlöscht wieder. Beide Lichter sind also aufgetaucht und bereits wieder erloschen, bevor die erste Sakkade zum ersten Ziel begonnen hat; diese startet demnach in völliger Dunkelheit und erreicht problemlos ihr Ziel bei 5∞ rechts. Wie steht es nun ⫺ und hier liegt das theoretische Problem ⫺ mit der Erreichung des zweiten Ziels? Würde man Augenbewegungen auf Grund retinaler Koordinaten machen, müßte man jetzt 10∞ nach rechts springen und würde dann natürlich fälschlich bei 15∞ rechts vom Ausgangsort landen. Da man jedoch mit dem Blick an der richtigen Stelle bei 10∞ landet (s. Hallet und Lightstone 1976), hat man keine retinalen, sondern Kopfkoordinaten benutzt, die jedoch aus den retinalen Koordinaten erst gebildet werden mußten.
In eleganten Versuchen an wachen Affen konnten Mays und Sparks (1980) ebenfalls nachweisen, daß Raumkoordinaten (in erster Näherung gleichzusetzen mit Kopfkoordinaten) und nicht Netzhautkoordinaten die Ausführung von Sakkaden initiieren: Nach dem Erlöschen eines Fixationspunktes wurde für 100 ms im Dunkelraum ein peripheres Ziel beleuchtet. Noch bevor die Blickzielbewegung begann, wurden die Augen durch gezielte elektrische Reizung im Colliculus superior (s. Abb. 12.4) in eine zufällige andere Position in der Augenhöhle versetzt (⫽ Quasi-Sakkaden): die erst später beginnende, vom Affen intendierte Sakkade erreichte jedoch die richtige Position im Raum, unabhängig vom erzwungenen Ausgangsort des Auges. Dies beweist einmal, daß Sakkaden auf Grund von zentral berechneten Raumkoordinaten veranlaßt werden, wie es ja auch im Robinson-Modell (s. Abb. 12.2) vorgesehen ist. Zum anderen zeigt sich deutlich, daß die relative Position des Auges im Kopf wenigstens kurzfristig genau bekannt sein muß, da die zufällige Abweichung ja korrigiert werden konnte; und diese Positionsinformation konnte nicht retinal gewonnen werden, da es dunkel war, vielmehr muß sie als Efferenzkopie (oder als Propriozeption aus den Augenmuskeln) vorgelegen haben. Und drittens beweist dieser Versuch unseres Erachtens auch, daß Sakkaden an erinnerte Ziele nicht über den Colliculus superior laufen (s. Abb. 12.4), da die vom Affen intendierten Sakkaden sonst mit den quasi-natürlichen Sakkaden, die bei der elektrischen Reizung dieses wichtigen Zentrums für Sakkadenvorbereitung ausgelöst wurden, hätten interferieren müssen. Aus dem stark vereinfachten Schema wird deutlich, daß direkte Zuflüsse aus höheren visuellen Zentren die Hirnstamm-Blickzentren
338
II. Aspekte der Semiose
Abb. 12.4: Ein konzeptuelles Nervensystem der Vorbereitung von sakkadischen Augenbewegungen. Drei mögliche Wege, eine visuelle Blickbewegung auszulösen, führen aus dem frontalen Cortex (FC) direkt (1) und aus diesem (2) über den Thalamus (T) und aus dem parietalen (PC) Cortex indirekt (3) über die tiefe Schicht des Colliculus superior (CS) zum Hirnstammblickzentrum (PPRF ⫽ pontine, paramediane ReticulärFormation für die horizontalen Blickbewegungen). Von hier aus wird die Sakkadeninformation über die Augenmuskelnerven (z. B. hier den VI. Hirnnerv (VI), Nervus abducens), zum Augapfel geschickt. Die primären Sehzentren im okzipitalen Cortex (OC), die ihre Information aus der Netzhaut des Auges über den Nervus opticus (⫽ II. Hirnnerven) und das Corpus geniculatum laterale (CGL) erhalten, sind danach nur über die beiden anderen Cortexareale an der Ausführung einer Sakkade beteiligt. Inhaltlich könnte die Bahn 1 die Information über Zeit und Ort einer geplanten Sakkade, die Bahn 2 die Hemmungs-Information, nicht geplante Orte zu unterdrücken, und die Bahn 3 die Information über interessante Orte im Gesichtsfeld repräsentieren (modifiziert nach Pierrot-Deseilligny u. a. 1987).
nur aus den Colliculi superiores und den frontalen Augenfeldern (im frontalen Cortex, FC, u. a. aus den Brodmann-Arealen 8; s. Kahle, Leonhardt und Platzer 1984) erreichen, indirekte aus den visuellen Sehzentren im Hinterhauptslappen, OC ⫽ Area 17⫺19, und den wichtigen parietalen visuellen Aufmerksamkeitszentren, PC ⫽ Area 7, den Hirnstamm nur über den Colliculus superior ansteuern. Solche Schemata erhält man u. a. durch neuroanatomische Techniken wie retrograde Markierung durch geeignete Markierungsstoffe, die im Blickzentrum von Affen depo-
niert wurden und die dann in den Axonen der dort ankommenden Neurone rückwärts zu deren Zellkörpern transportiert werden (Schnyder u. a. 1985). Dadurch kann man alle zu einem Zentrum gehörenden Zuflüsse feststellen. Schwieriger wird dann schon die Zuordnung von Verhaltensweisen zu den Bahnen und Zentren, zumal wenn es sich um höhere Zentren handelt, die immer viele Zuflüsse erhalten und sich auch teilweise wechselseitig ergänzen, unterstützen, ersetzen oder hemmen (vgl. Galley 1992; 1993). Versucht man dennoch spekulativ eine Zuordnung bestimmter Zentren zu bestimm-
12. Augenbewegungen als mehrkanalige Semiose
ten Funktionen, könnte dies folgendermaßen aussehen: die Colliculi superiores sind für die eher reflektorischen Ortungsbewegungen auf plötzlich auftauchende (Schiller, Sandell und Maunsell 1987) oder auch bewegte Reize zuständig, die parietalen Zentren bauen den extrapersonalen Raum durch multimodale Integration (Andersen 1987) aller Ortsinformationen (also auch überwiegend den erinnerten Raum) auf und gewichten die Ortskoordinaten darin enthaltener Objekte in interessante und uninteressante Orte, auf die es sich lohnt bzw. nicht lohnt zu blicken (Robinson, Goldberg und Stanton 1978). Die frontalen Blickzentren scheinen sich großteils hemmend zu betätigen (Guitton, Buchtel und Douglas 1985), z. B. alle möglichen irrelevanten Ortsvorschläge anderer Zentren zu kontrollieren, solange sie nicht in den momentan verfolgten Handlungsplan passen, und erst gezielt den Blick freizugeben, wenn ein Ortsvorschlag hierzu paßt und nicht nur interessant ist. 3.2.2. Vorbereitung einer visuellen Folgebewegung Wir hatten bereits festgestellt, daß das Auge einem verschwindenden Reiz auch im Dunkeln folgt, wenn wir uns drehen oder gedreht werden. Dieser vestibuläre Nystagmus arbeitet nun mit dem optokinetischen Nystagmus, also einer visuell ausgelösten Folgebewegung zusammen, so daß bei Kopfdrehungen im Hellen eine vollständige Kompensation üblich ist: das Auge ist an der unbewegten Umwelt wie angeheftet, allerdings nur solange wir uns diesem bewegten Reiz überlassen. Haben wir einen ruhenden Referenzpunkt, können wir den optokinetischen und auch den vestibulären Nystagmus (bei nicht zu starken Reizen, andernfalls s. § 1.1.) unterdrücken, die Augen still halten oder sogar einem kleinen bewegten Objekt in einer anderen Richtung folgen. Das bedeutet, daß beim optokinetischen Nystagmus zwei verschiedene Augenfolgesysteme beteiligt sein müssen: ein evolutionär altes, auf großflächige Verschiebungen in der Netzhautperipherie reagierendes Augenfolgesystem (von ter Braak 1936 als „Stier“-Nystagmus bezeichnet), sowie das evolutionär jüngere foveale Augenfolgesystem für kleine bewegte Reize (Augenfolgebewegungen im engeren Sinne, im englischen Sprachraum als „smooth pursuit system“ bezeichnet ⫺ vgl. Lisberger, Morris und Tychsen 1987; Eckmiller 1987 ⫺, von ter Braak als „Schau“-Nystagmus bezeichnet, um den bewußten Aspekt des
339 Schauens dem reflektorisch-unbewußten des Stierens gegenüberzustellen). Eine einfache und elegante Methode, beide zu trennen, ist, den optokinetischen Nachnystagmus zu messen. Erstaunlicherweise ⫺ wenn man nur an einen aktuellen optischen Reiz als Augenbewegungen verursachend glaubt! ⫺ zeigt sich nämlich nach längerer Exposition einer optischen Umweltdrehung, wie sie in der Drehtrommel vorliegt, beim Erlöschen des Lichtes ein oberflächlich betrachtet unverständlicher Nachnystagmus, als ob vorher eine Körperdrehung stattgefunden hätte. Dieser optokinetische Nachnystagmus entsteht jedoch nur, wenn vor dem Verlöschen des Lichts über mehrere Sekunden eine großflächige Verschiebung des visuellen Umfelds erfolgt war. Und dies auch, wenn durch Fixation eines ruhenden Punktes gar keine Augenbewegungen aufgetreten sind (Dichgans und Brandt 1978), nicht jedoch nach dem Verfolgen kleiner Objekte; das Entscheidende sind also gar nicht die verfolgenden Augenbewegungen, sondern die längere Zeit einwirkenden großflächigen Netzhautverschiebungen. In Laborversuchen lassen sich noch eine Reihe weiterer Unterschiede wie die Maximalgeschwindigkeit, die für den fovealen Augenfolgemechanismus bei 30⫺40∞/sec gegenüber mehr als 120∞/sec für den optokinetischen Mechanismus liegt, die foveale vs. periphere Entstehung und die Beteiligung bzw. das Fehlen der Eigenbewegungsempfindung aufführen, wie wir sie bereits beim Blick von der Brücke (s. § 1.1.) erwähnt hatten. Auch die Zeitkonstanten bei plötzlichem Beginn und Ende unterscheiden sich erheblich: so benötigt der foveale Mechanismus eine minimale Zeit von 20⫺80 ms (Lisberger und Westbrook 1985) zum Erreichen der Geschwindigkeit, während in der Gesichtsfeld-Peripherie bis zu mehreren Sekunden benötigt wird, um die Endgeschwindigkeit der Augenfolgebewegung zu erreichen (Robinson 1981). Wir haben also gute Gründe anzunehmen, daß die Vorbereitung einer Folgebewegung noch durch unterschiedliche neuronale Systeme erfolgt, deren Zusammenschaltung unter Umständen auch gegenseitige Hemmung implizieren kann, was sich eventuell als Wahlmöglichkeit für das sich erlebende Individuum auszahlt: So können wir uns auch für das Nicht-Verfolgen einer optischen Bewegung entscheiden, wenn wir an dieser nicht interessiert sind, eine Wahlfreiheit, die an die Intaktheit bestimmter Hirnareale gebunden ist, wie man am Zwangsverfolgen eines bewegten
340 Reizes bei Läsionen in bestimmten Neuhirnrindenarealen bei entsprechenden Patienten feststellen muß (Pilleri 1961). 3.3. Akustische und taktil-kinästhetische Raumintegration Wir können Geräusche und Berührungen auch im Dunkeln recht genau orten, wenn die Geräusche z. B. vor uns erscheinen (nach Mills 1961, auf etwa 1⫺3∞ genau). „Orten“ heißt ja, daß wir z. B. auf sie zeigen und dorthin blicken können. Es ist deshalb nicht uninteressant, ortende Augenbewegungen auf solche nicht-visuelle Ortsinformationen hin zu untersuchen, ob mehr das sakkadische oder mehr das Augenfolgesystem die Ortung unterstützt, was teilweise kontrovers diskutiert wird. So haben Schaefer, Süss und Fiebig (1981) Augenbewegungen auf nur akustisch sinusförmig hin- und herbewegte Reize registriert (z. B. im Dunkelraum mit Stereoeffekten). Hierbei ergaben sich nach diesen Autoren fast ausschließlich Sakkaden in treppenförmiger Anordnung, nicht jedoch die auf einen sinusförmigen bewegten Reiz zu erwartenden Augenfolgebewegungen, wie bei einem optischen Reiz üblich. Bei langsamer akustischer Bewegung ist die Gesamtexkursion der Augenbewegung aus kleineren, bei schnellerer aus größeren Sakkaden-Amplituden zusammengesetzt. Demgegenüber berichtet Grüsser (1983) über einen beträchtlichen Anteil von Augenfolgebewegungen, der jedoch geschwindigkeitsabhängig sei. Bei langsamen Geschwindigkeiten des akustischen Reizes betrage der Anteil der Augenfolgebewegungen bis zu 70%, bei hohen jedoch nurmehr 20%. Offensichtlich ist es schwieriger und verlangt mehr Konzentration, ist aber nicht unmöglich (nach Grüsser 1983 und auch Hennebert 1960), nur akustisch wahrgenommene Bewegung auch mit Augenfolgebewegungen zu verfolgen. Offen ist, ob hier mehr die optokinetische Form oder mehr die Folgebewegung im engeren Sinne benutzt wird. Damit erhebt sich auch die Frage nach den anderen Sinnesmodalitäten, die noch zur Raumorientierung beitragen: Sind auch taktil und kinästhetisch vermittelte egozentrisch wahrgenommene Bewegungen, wie zum Beispiel die einer Infrarotquelle über die Haut (Grüsser 1983) mit Augenfolgebewegungen zu verfolgen oder nur mit treppenförmiger Sakkadierung? Für Grüsser (1983) dominieren hierbei die Sakkaden, während Brandt, Büchele und Arnold (1977) über beträchtli-
II. Aspekte der Semiose
che Anteile von Augenfolgebewegungen und Eigenbewegungsempfindung beim sogenannten „arthrokinetischen“ (d. h., dem aus Empfindungen, die bei Gelenkbewegungen entstehen, stammenden) Nystagmus berichten, wenn der Proband im Dunkeln bei effektiver Ruhigstellung des Körperschwerpunktes durch Berühren einer sich drehenden Umwelt mit den Händen oder den Füßen zum Erlebnis einer Eigenbewegung kommt. Nach Messungen von Bles und Kotaka (1986) gibt es für diesen somato-sensorischen Nystagmus auch einen Nachnystagmus, wodurch eine Verrechnung und Verschaltung analog dem optokinetischen Nachnystagmus anzunehmen ist. Damit scheint auch für das Augenfolgebewegungs-System die egozentrische Raumlokalisation, also die erlebte wahrgenommene Richtung eines Objektes eine Führungsgröße für das ortende Augenbewegungssystem zu sein, wie wir es ja bereits vom sakkadischen System gehört hatten, wenngleich es von der Aufmerksamkeit erheblich schwieriger scheint, auch eine kontinuierliche Raumwahrnehmung zu erleben, wie sie vom visuellen und vestibulären System so unmittelbar induziert wird. Und durch die dann eher diskontinuierlich vorliegenden Rauminformationen scheint auch das sakkadische Ortungssystem mehr angestoßen zu werden. Die egozentrische Raumintegration einschließlich des Raumgedächtnisses ist, klinischen Befunden folgend, eng an das Areal 7 im oberen Scheitellappen gekoppelt (s. Abb. 12.4, PC). 3.4. Kognitiv-mnestische Lokalisationen Räumliche Beziehungen können wir auch aus dem Gedächtnis reaktivieren. So können wir die Nase unseres Gegenübers fixierend mühelos auf einen von diesem in unser peripheres Gesichtsfeld gehaltenen Gegenstand zeigen; selbst bei geschlossenen Augen weicht unser Zeigefinger nicht wesentlich von dem dann nur erinnerten Ort ab. Eine kleine Variation in diesem einfach nachzuvollziehenden Versuch deutet auf die Grenzen der Integration im egozentrischen Lokalisationssystem hin: Man fixiere die Nase seines Gegenübers, lasse dieses irgendwo in der Peripherie einen Gegenstand hochhalten, schließe die Augen und drehe nun den Kopf ein gutes Stück in die entgegengesetzte Richtung, um dann noch immer mit geschlossenen Augen auf den erinnerten Gegenstand zu zeigen: Macht man es einigermaßen sorgfältig, wird man regelhaft einen Zeige-Fehler in Richtung von zu weit außerhalb des Gegenstandes finden. Der Winkel der Kopfdrehung wurde intern im egozentri-
341
12. Augenbewegungen als mehrkanalige Semiose schen Lokalisationssystem zu groß veranschlagt und entsprechend der Arm überkompensatorisch innerviert.
4.
Ähnlich systematische Verzerrungen (wenn auch in umgekehrter Richtung) treten regelmäßig in der linken Gesichtsfeldhälfte bei rechtsparietalen Läsionen in Area 7 auf, wie auch entsprechend in der rechten Gesichtsfeldhälfte bei linksparietalen Läsionen. Man nennt sie „optische Ataxie“. Registrierungen von Augenbewegungen, wie auch von Greifbewegungen (Perenin und Vighetto 1983) zeigen, daß der Patient generell von der Mittellinie zur Seite der Läsion abweicht, ja sich üblicherweise mit dem Blick nur im Halbraum auf der Seite der Läsion aufhält. Sakkaden zur Seite der Läsion sind normal, entgegengesetzte zeigen jedoch erheblich verlängerte Latenzen, das Ziel wird nicht mit einer Sakkade, sondern mit „herantastenden“, treppenförmigen Sakkaden erreicht. Aber nicht nur aus der räumlichen Erinnerung eines gerade abgelaufenen Ortungsverhaltens resultieren unsere Blickbewegungen, es bilden sich aufgrund einer momentanen Erfahrung auch Erwartungshaltungen über zukünftige Blickamplituden: so fand Jacobs (1987), daß beim Suchen eines „C“ unter lauter „x“:
Neudefinitionen sind eine Chance und ein Ärgernis zugleich: eine Chance, weil sich eventuell einleuchtende Erklärungen finden lassen für Phänomene, die sich bisher nicht befriedigend erklären ließen; ein Ärgernis, weil das gewohnte und vertraute Begriffsinventar nicht mehr gültig ist und man sich nicht ohne langes Nachdenken und minutiöses Analysieren über die Korrespondenzregeln zwischen alter und neuer Terminologie zurechtfindet. Ein solches Beispiel von versuchter Neudefinition ist J. J. Gibsons Wahrnehmungspsychologie, „in der die überkommenen Theorien der Wahrnehmung gänzlich aufgegeben“ wurden (vgl. Art. 6 § 3. und 4.). „Die Jahrhunderte alte Lehre, daß zweidimensionale Netzhautbilder durch einen Prozeß, der sich Tiefenwahrnehmung nennt, in die dreidimensionale Realität zurückverwandelt würden, ist unhaltbar“ (Gibson 1982, 256). Aber da Gibson z. B. die Juleszsche Stereoskopie-Theorie (Julesz 1971) nicht zu kennen scheint, die genau diese abgelehnte Formulierung veranschaulicht (zwei nichtssagende zweidimensionale Rauschbilder werden bei stereoskopischer Fusion plötzlich zu dreidimensionalen Raumbildern von Treppen, Serpentinen usw.), diskreditiert der Autor seinen eigenen Ansatz selbst, und dieser bedarf erst wieder einer Neudefinition, um Gewinn und Nicht-Gewinn der intendierten Neu-Betrachtung zu trennen ⫺ ein aufwendiges und schwieriges Unterfangen. So ist es zweifelsohne richtig, daß die von Gibson monierte statische Betrachtungsweise Wichtiges übersieht; z. B. ergibt sich aus der Bewegungsparallaxe ein neuer eigenständiger Entfernungshinweis, ohne daß allerdings die statische Betrachtung dadurch ihre Legitimation verlieren würde. Gibson fügte der Wahrnehmungspsychologie neue Aspekte hinzu, er revolutionierte sie jedoch nicht, wie er behauptete. Auch eine semiotische Betrachtungsweise wahrnehmungspsychologischer und -physiologischer Phänomene verspricht aufgrund ihrer ganzheitlichen Ausrichtung einen Gewinn, wodurch sich eine Anziehung ergibt, der man sich kaum entziehen kann, wenn man z. B. die Biokommunikation (1971) von Günter Tembrock liest (vgl. Art. 27). Wie könnte eine solche Betrachtungsweise für die hier angeschnittene organismusinterne Mehrkanal-Integration im Augenbewegungsverhalten aussehen? Wir hatten den Drei-Syn-
xxxxxxCxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xCxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx in den Kontrollreihen ohne C erheblich größere Such-Sakkaden gemacht werden, als wenn es gilt, ein „z“ zu finden: xxxxxzxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxzxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx Hierbei werden auch in den Kontrollreihen ohne z erheblich kleinere Sakkaden gemacht. Das bedeutet, daß nicht nur die aktuellen Sichtbedingungen, sondern auch die erwarteten unser Blickverhalten entscheidend mitbestimmen.
Semiotische Aspekte der Augenbewegungsorganisation
342 apsen-Weg bei Körperdrehung erwähnt, der aus der Gleichgewichtsinformation des Vestibularis-Organs im Innenohr über das primäre und zentrale Vestibularis-Neuron den vestibulären Nystagmus induziert, ein Augenbewegungskommando, das auch als „vestibulookulärer Reflex“ bezeichnet wird, wobei das Auge auch im Dunkeln entsprechend der Drehung zurückbleibt ⫺ wie angeheftet auf dem angeschauten Blickobjekt. Das Zeichen, um dessen Weiterverarbeitung, Interpretation, Repräsentation es geht, sollte also hier die Kopfdrehung sein, die über eine mechanische Ankopplung in den Cupula- und/oder Maculaorganen des Innenohres zu einer entsprechenden Abscherung der dort befindlichen Sinneshaare führt, die ihrerseits in einer neuronalen Aktivierung bzw. Abnahme der Erregung des primären Vestibularis-Neurons resultiert. Kann man dieses induzierte neuronale Verhalten nun auch mit dem interpretierenden Verhalten eines Organismus gleichsetzen, das sich in einer Formulierung niederschlüge: „Die Erregung im primären Vestibularis-Neuron repräsentiert die Kopfdrehung“? Dann wäre bereits die Umsetzung von Kopfdrehung in Erregung des Neurons eine Semiose, wie auch jede weitere Verarbeitung an einer Synapse (vgl. Art. 4 § 1.). Aber fragen wir weiter: Eine Semiose schließt neben dem Zeichen (Kopfdrehung) und seiner Auswirkung (Erregung des Neurons) einen Interpretanten, einen Kode, eine Zuordnung, eine Umsetzungsregel ein, die rechtfertigt, zu sagen: „Die Erregung repräsentiert die Kopfdrehung“ statt: „… ist eine Folge von …“. Nun gibt es auch in der Semiotik mindestens zwei Möglichkeiten, die Beziehung zwischen Signal und Interpretation zu ändern. Entweder hat sich der Kode oder der Kontext (Disposition des Organismus) geändert. In unserem Beispiel kann nun durch efferente Innervation der Sinneszellen die Ankopplung der Neurone z. B. vermindert werden: Offensichtlich hat sich der Kode nicht geändert, die Erregung repräsentiert noch immer die Kopfdrehung, nur eine etwas weniger ausgeprägte. Eine Frage in diesem Zusammenhang ist, ab wann eine quantitative Änderung der Umsetzungsregeln eine qualitative Änderung des Kodes darstellt. Falsch scheint es zu sein, wenn man sagt: „Dann, wenn andere Schlußfolgerungen gezogen werden“, denn nach dem Beispiel in Art. 5 § 2. führt das Rauchsignal, das ‘Feinde’ bedeutet, je nach Disposition zu anderem Verhalten: Warnen, Flüchten oder Hilfeleistung. Steckt hier nicht auch für die Kommunikations-Semiotik ein ernsteres Pro-
II. Aspekte der Semiose
blem ⫺ das, zwischen Kontext- vs. Kodeänderung entscheiden zu müssen? Nehmen wir als Beispiel das erwähnte längere Anblicken, das speziesübergreifend als Drohgeste wirkt, aber je nach Kontext innerhalb einer Spezies ganz unterschiedlich beantwortet wird: vom untergeordneten Schimpansenmännchen mit Abwendung und Unterwerfungsgesten, vom dominanten mit Angriffsverhalten. Oder vom flirtenden Paar am Anfang ihrer Kommunikation als Registrierung, dann als flüchtiges Interesse, später als Wunsch zum Kennenlernen. Ist das eine Änderung des Kodes oder nur eine solche des Kontextes (vgl. Art. 14 § 3., Art. 16 und Art. 17). Bleiben wir noch bei unserem ersten Kopfdrehungsbeispiel: Stellen wir uns vor, wir würden in einem Tierversuch das VestibularisNeuron experimentell nicht mehr von den zugehörigen Sinneszellen, sondern von anderen Zentren oder elektrisch reizen. Objektiv gesehen hätte sich jetzt der Kode geändert, die Erregung repräsentiert jetzt keine Kopfdrehung mehr. Nach allem, was wir vom Nervensystem wissen (z. B. Phantomschmerz, Gesetz der spezifischen Sinnesenergien) würden der Organismus und das Zentralnervensystem und auch das erlebende Subjekt diese Erregungen aber weiterhin als Kopfdrehungen interpretieren. Der Kode für Sinneserfahrungen (diese Erregung bedeutet ‘Lichterscheinungen’, jene ‘Schmerzen’ usw.) scheint im Nervensystem erst durch interpretative Zentren, bei höheren Tieren sicher auch durch die corticalen Projektionen, aber schon aufgrund des Fehlens einer Neuhirnrinde bei einfacheren Lebewesen sicher auch durch einfachere interpretative Nervennetze realisiert zu sein. Als Schlußfolgerung aus diesen Überlegungen über das Verhältnis von Kode und Kontext ergibt sich, daß es so etwas geben muß wie ein minimales interpretatives Nervensystem, das so etwas wie eine Pars-pro-toto-Leistung erbringt, damit eine Semiose realisiert wird. Daraus folgt meines Erachtens aber auch eine Grenze der Angemessenheit einer semiotischen Betrachtungsweise: Nicht alle Informationsverarbeitungen, z. B. im biologischen Bereich an einer Synapse, eignen sich dazu, als Semiosen betrachtet zu werden. Und umgekehrt, liefert nicht die Definition der Semiose als triadisches System mit der Notwendigkeit des Vorliegens eines Interpretanten, eines Kodes, genügend Hinweise auch zum Ausschluß einer Semiose bei Informationsübertragungsprozessen, bei denen kein Kode vorliegt, kein Pars-pro-toto-Interpretationsverhalten? Ist es
12. Augenbewegungen als mehrkanalige Semiose
wirklich angemessen, unter diesen Umständen bei physikalischen und chemischen Prozessen von Semiosen zu sprechen? Ich sehe in der Semiotik eine realistische Chance, u. a. den nach wie vor ungeklärten Prozeß der Bedeutungszuordnung begrifflich und experimentell zu klären, der den Menschen und das Tier vom Computer unterscheiden soll (Searle 1990), ich vermag darin aber zur Zeit noch kein Metasystem zu entdecken, das fachwissenschaftliche Begriffssysteme ersetzen könnte.
5.
Literatur (in Auswahl)
Andersen, R. A. (1987), „Inferior Parietal Lobule Function in Spatial Perception and Visuomotor Integration“. In: V. B. Mountcastle, F. Plum und St. R. Geiger (eds.), Handbook of Physiology ⫺ The Nervous System. Vol. V. Bethesda MD: American Physiological Society: 483⫺518. Berthoz, A. und G. Melvill Jones (1985), Adaptive Mechanisms in Gaze Control (⫽ Reviews in Oculomotor Research, Vol. 1). Amsterdam: Elsevier. Bles, W. und S. Kotaka (1986), „Stepping Around: Nystagmus, Self-Motion Perception and Coriolis Effects“. In: E. L. Keller und D. S. Zee (eds.), Adaptive Processes in Visual and Oculomotor Systems. Oxford: Pergamon Press: 465⫺471. Brandt, T., W. Büchele und F. Arnold (1977), „Arthrokinetic Nystagmus and Ego-Motion Sensation“, Experimental Brain Research 30: 331⫺338. Bridgeman, B. (1983), „Mechanisms of Space Constancy“. In: A. Hein und M. Jeannerod (eds.), Spatially Oriented Behavior. New York: Springer: 263⫺280. Büttner-Ennever, J. A. (ed.) (1988), Neuroanatomy of the Oculomotor System (⫽ Reviews of Oculomotor Research, Vol. 2). Amsterdam: Elsevier. Cynader, M. (1985), „Effects of Visual Deprivation on Properties and Modifiability of Compensatory Eye Movement System“. In: A. Berthoz und G. Melvill Jones (eds.), Adaptive Mechanisms in Gaze Control. Amsterdam: Elsevier: 81⫺94. Dichgans, J. und Th. Brandt (1978), „Visual-Vestibular Interactions: Effects on Self-Motion Perception and Postural Control“. In: R. Held, H. Leibowitz und H. L. Teuber (eds.), Handbook of Sensory Physiology ⫺ Perception. Vol. 8. Berlin: Springer: 755⫺804. Duncan, S. (1972), „Some Signals and Rules for Taking Speaking Turns in Conversations“, Journal of Personality and Social Psychology 23: 283⫺292. Eckmiller, R. (1987), „Neural Control of Pursuit Eye Movements“, Physiological Review 67: 797⫺ 857. Galley, N. (1974), Die Richtungswahrnehmung von primärem Bild und Heringschem Nachbild im Ver-
343 lauf schneller Augenbewegungen (Unveröffentlichte Dissertation am Fachbereich 1, Vorklinik, der Freien Universität Berlin). Berlin. Galley, N. (1986), Biologische Grundlagen menschlichen Verhaltens. Physiologische Grundlagen (Kurseinheit 1). Hagen: Fernuniversität Hagen. Galley, N. (1992), „Augenbewegungsmessungen“. In: R. Knußmann (ed.), Anthropologie: Handbuch der vergleichenden Biologie des Menschen. I,2. Stuttgart: G. Fischer: 147⫺161. Galley, N: (1993), „Augenbewegungen: Antizipation und Leistung. Auf dem Wege zu einem neuropsychologischen Konzentrationsmodell“. In: J. Beckmann, E. Strang und H. Hahn (eds.), Aufmerksamkeit und Energetisierung. Facetten von Konzentration und Leistung. Göttingen: Hogrefe: 229⫺246. Gibson, J. J. (1982), Wahrnehmung und Umwelt. München: Urban und Schwarzenberg. Grüsser, O. J. (1983), „Multimodal Structure of the Extrapersonal Space“. In: A. Hein und M. Jeannerod (eds.), Spatially Oriented Behavior. New York: Springer: 327⫺352. Guitton, D., H. A. Buchtel und R. M. Douglas (1985), „Frontal Lobe Lesions in Man Cause Difficulties in Suppressing Reflexive Glances and in Generating Goal-Directed Saccades“, Experimental Brain Research 58: 155⫺172. Hallet, P. E. und A. D. Lightstone (1976), „Saccadic Eye Movements Towards Stimuli Triggered by Prior Saccades“, Vision Research 16: 99⫺106. Helmholtz, H. v. (1866), Handbuch der physiologischen Optik. Leipzig: Voss. Hennebert, P. E. (1960), „Nystagmus audiocinetique“, Acta Otolaryngologica 51: 412⫺415. Holst, E. v. und H. Mittelstaedt (1950), „Das Reafferenzprinzip“, Die Naturwissenschaften 37: 464⫺ 476. Jacobs, A. M. (1987), „On Localization and Saccade Programming“, Vision Research 27: 1953⫺ 1966. Jeannerod, M. (1988), The Neural and Behavioral Organization of Goal-Directed Movements. Oxford: Oxford University Press. Jeannerod, M., H. Kennedy und M. Magnin (1979), „Corollary Discharge: Its Possible Implications in Visual and Oculomotor Interactions“, Neuropsychologia 17: 241⫺258. Julesz, B. (1971), „Binocular Depth Perception in Man ⫺ A Cooperative Model of Stereopsis“. In: O. J. Grüsser und R. Klinke (eds.), Zeichenerkennung durch biologische und technische Systeme. Berlin, Heidelberg und New York: Springer: 301⫺316. Kahle, W., H. Leonhardt und W. Platzer (1984), Taschenatlas der Anatomie. Stuttgart: Thieme. Keller, E. L. und D. S. Zee (eds.) (1986), Adaptive Processes in Visual and Oculomotor Systems. Oxford: Pergamon Press.
344 Kendon, A. (1967), „Some Functions of Gaze-Direction in Social Interaction“, Acta Psychologica 26: 22⫺63. Klinke, R. und N. Galley (1974), „Efferent Innervation of Vestibular and Auditory Receptors“, Physiological Review 54: 316⫺357. Kornhuber, H. H. (ed.) (1974), Vestibular System (Handbook of Sensory Physiology. VI/1,2). Berlin: Springer. Kornmüller, A. E. (1931), „Eine experimentelle Anästhesie der äußeren Augenmuskeln am Menschen und ihre Auswirkungen“, Journal der Psychologie und Neurologie 41: 351⫺366. Lisberger, S. G., E. J. Morris und L. Tychsen (1987), „Visual Motion Processing and SensoryMotor Integration for Smooth Pursuit Eye Movements“, Annual Review of Neuroscience 10: 97⫺129. Lisberger, S. G. und L. E. Westbrook (1985), „Properties of Visual Inputs That Initiate Horizontal Smooth Pursuit Eye Movements in Monkeys“, The Journal of Neuroscience 5: 1662⫺1673. Matin, L., J. K. Stevens und E. Picoult (1983), „Perceptual Consequences of Experimental Extraocular Muscle Paralysis“. In: A. Hein und M. Jeannerod (eds.), Spatially Oriented Behavior. New York: Springer: 243⫺262. Mays, L. E. und D. L. Sparks (1980), „Saccades Are Spatially, not Retinocentrically Coded“, Science 208: 1163⫺1165. Mills, A. W. (1961), „On the Minimum Audible Angle“, Journal of the Acoustic Society of America 30: 237⫺246. Perenin, M. T. und A. Vighetto (1983), „Optic Ataxia: A Specific Disorder in Visuomotor Coordination“. In: A. Hein und M. Jeannerod (eds.), Spatially Oriented Behavior. New York: Springer: 305⫺326. Pierrot-Deseilligny, C., S. Rivaud, C. Penet und M. H. Rigolet (1987), „Latencies of Visually Guided Saccades in Unilateral Hemispheric Cerebral Lesions“, Annals of Neurology 21: 138⫺148. Pilleri, G. (1961), „Über das chronologische Auftreten von motorischen Schablonen des Oralsinnes, deren ontogenetische Bedeutung und klinisch-anatomische Zusammenhänge bei atrophisierenden Hirnerkrankungen“, Archiv für Neurologie, Neurochirurgie und Psychiatrie 88: 273⫺298. Robinson, D. A. (1975), „Oculomotor Control Signals“. In: G. Lennerstrand und P. Bach-y-Rita (eds.), Basic Mechanisms of Ocular Motility and Their Clinical Implications. Oxford: Pergamon Press: 337⫺378.
II. Aspekte der Semiose Robinson, D. A. (1981), „Control of Eye Movements“. In: J. M. Brookhart, V. B. Mountcastle und V. B. Brooks (eds.), Handbook of Physiology. Section 1: The Nervous System. Vol. II: Motor Control, Part 2. Bethesda, MD: American Physiological Society: 1275⫺1320. Robinson, D. L., M. E. Goldberg und G. B. Stanton (1978), „Parietal Association Cortex in the Primate: Sensory Mechanism and Behavioral Modulations“, Journal of Neurophysiology 41: 910⫺932. Robinson, D. L. und R. H. Wurtz (1976), „Use of an Extraretinal Signal by Monkey Superior Colliculus Neurons to Distinguish Real From Self-Induced Stimulus Movement“, Journal of Neurophysiology 39: 852⫺870. Schaefer, K. P., K. J. Süss und E. Fiebig (1981), „Acoustic-Induced Eye Movements“, Annals of the New York Academy of Sciences 374: 674⫺688. Schiller, P. H., J. H. Sandell und J. H. R. Maunsell (1987), „The Effect of Frontal Eye Field and Superior Colliculus Lesions on Saccadic Latencies in the Rhesus Monkey“, Journal of Neurophysiology 57: 1033⫺1049. Schnyder, H., H. Reisine, K. Hepp und V. Henn (1985), „Frontal Eye Field Projection to the Paramedian Pontine Reticular Formation Traced with Wheat Germ Agglutinin in the Monkey“, Brain Research 329: 151⫺160. Searle, J. R. (1990), „Künstliche Intelligenz I: Ist der menschliche Geist ein Computerprogramm?“, Spektrum der Wissenschaften 3: 40⫺46. Stevens, J. K., R. C. Emerson, G. L. Gerstein, T. Kallos, G. R. Neufeld, C. W. Nichols und A. C. Rosenquist (1976), „Paralysis of the Awake Human: Visual Perceptions“, Vision Research 16: 93⫺97. Tembrock, G. (1971), Biokommunikation. Informationsübertragung im biologischen Bereich. Berlin: Akademie Verlag. ter Braak, J. W. G. (1936), „Untersuchungen über optokinetischen Nystagmus“, Archives de Physiologie 21: 310⫺376. Vanni-Mercier, G. und M. Magnin (1982), „Retinotopic Organization of Extra-Retinal SaccadeRelated Input to the Visual Cortex in the Cat“, Experimental Brain Research 46: 368⫺376. Waespe, W. und V. Henn (1985), „Cooperative Functions of Vestibular Nuclei Neurons and Floccular Purkinje Cells in the Control of Nystagmus Slow Phase Velocity: Single Cell Recordings and Lesion Studies in the Monkey“. In: A. Berthoz und G. Melvill Jones (eds.), Adaptive Mechanisms in Gaze Control. Amsterdam: Elsevier: 233⫺250.
Niels Galley, Köln (Deutschland)
345
13. Body behavior as multichannel semiosis
13. Body behavior as multichannel semiosis 1. Introduction 2. Channels of communication and social acts 2.1. Speech 2.2. Paralanguage 2.3. Proxemic behavior 2.4. Time behavior 2.5. Gestures 2.6. Facial expression 2.7. Outward appearance 3. Methodological problems 3.1. Measuring cues 3.2. Measuring accuracy of decoding 4. Consistency of multichannel messages 4.1. Consistent cues 4.2. Inconsistent cues 4.3. Deceiving 5. Differences in integration of messages from different channels 5.1. Age 5.2. Sex 5.3. Psychopathological factors 6. Determiners of social interaction and information integration 6.1. Social interaction 6.2. Social interaction in psychotherapy 7. Concluding remarks 8. Selected references
1.
Introduction
It is an ancient tradition in the human sciences to consider the knowledge and the understanding of the world in terms of separate channels through which information arrives from the environment to the organism. When we read a treatise on perception or on communication, verbal or nonverbal, we find very often such a fragmented image of sensory modalities, that what comes from vision appears to have no relationship with inputs deriving from other modalities (hearing, touch, taste, and so on; cf. Art. 5 § 3.4. and Art. 6⫺11 of this Handbook). But for a long time it has been well-known that the facts are different. In 1688, the Irish astronomer and mathematician William Molyneux (1656⫺98) addressed the following question in a famous letter to John Locke: “Suppose a man born blind, and now adult, and taught by his touch to distinguish between a cube and a sphere […]. Suppose then the cube and sphere placed on a table and the blind man to see; query, Whether by his sight, before he touched them, he could now distinguish and tell which is the globe, which the cube?” The
answer was negative, both for Molyneux and Locke. With Molyneux’s question, for the first time in the history of Western thought, the problem of the integration of information deriving from different channels was introduced. We are never faced with information coming separately in discrete packages from different sensory modalities: sight, hearing, touch, and so forth. And even within the same modality we can distinguish different channels: for instance, in the verbal communication process, the receiver hears not only the words uttered by the source of the message, but also the modulations of the tone and the loudness of his or her voice (cf. the phenomena treated as codes in Art. 14 § 1.2.). At the same time, he or she can see the face, the body posture, the gestures, the directions of gaze, and so forth. As Weitz (1974, 263) points out, “What we are confronted with is an alive, reacting person giving off all sorts of messages simultaneously in competing channels”; therefore, “the understanding of multichannel communication […] is the ultimate goal of all research on the human communication system, both verbal and nonverbal” (1974, 267; on multimedia communication cf. Art. 169). When looking at the integration of information coming from different channels, one must also consider the importance of cognitive, or ideational, factors other than the sensory ones. As in an example by Rozin and Fallon (1987, 24), therefore, if we present a person with two vials containing the same substance, and say that one contains feces, the other cheese, and ask him or her to sniff and to judge the odors that are emanated by both, he or she will find the odor emanated by the supposed cheese pleasant, while judging the odor of the supposed feces disgusting, even though the two are in fact identical (cf. Art. 9 § 2.2.). Research on integration between different channels of communication, however, has witnessed a substantial development only in the last decades. Following a classic distinction by Duncan (1969), we can say that the most viable traditions in this field are basically two: on the one hand, there is a structural approach, which dates back to the 1950’s and to Ray Birdwhistell’s research (e. g., 1970); the most eminent representatives in this tradition are probably Dittman and
346
II. Aspekte der Semiose
Kendon. By applying kinesic analysis, the followers of this line of research mainly tend to determine a sort of grammar of body language, through a holistic and nonexperimental approach (cf. Art. 168). The other tradition can be chiefly ascribed to Paul Ekman and to the studies he began in the 1960’s. In this case, the interest is mainly addressed to the relationship between nonverbal behavior and inner states of the individual, as well as to the ability that others have to interpret such inner states by decoding nonverbal cues. Ekman is not particularly interested in the problem of relations between verbal and nonverbal cues; his concern is almost exclusively for the expression of emotions, in a line which derives directly from Darwin’s Expression of Emotions in Animals and Men (1872; cf. Ekman 1973; an account of the evolution-based hierarchy of channels is given in Art. 27 § 3.5.). He is also interested in the consistency of verbal and nonverbal cues, in the problem of deception, and so forth (cf. Ekman 1985). Such authors as Freedman (1971) or Mehrabian (1972) have moved along the same line; the latter has offered perhaps the most complete framework of integration between different nonverbal cues. In addition, the related fundamental work by Rosenthal (1976) and his colleagues is also to be mentioned, as regards in particular the problem of deception. The present paper does not aim to examine such contributions in a historical perspective, but to review the more interesting findings obtained until now in different research areas. An effort is made to consider the multiple channel research in terms of relative importance of various channels, and interactive and synergistic effects of different sources. We consider first the different channels through which humans send bodily messages. Second, we review the main methodological problems that one encounters in the field. Third, we examine the influence of the consistency of clues on the integration of information. Then we consider the individual differences in such behaviors. Finally, we look at how the integration of multiple sources of information influences social interaction. We begin with an outline of the different channels of human communication in social situations.
2.
Channels of communication and social acts
Normally, a message may consist of a verbal component (of course, taking into consider-
ation man only after the first stages of development) and some nonverbal components (cf. Art. 85 § 5.). The channel of the verbal component is visual or acoustic; the channels of the nonverbal components are numerous and are related to all sensory modalities. Let us see first how to classify the channels of the most important types of nonverbal communication, bearing in mind that the term channel of communication does not mean a sensory modality, but a specific way to convey information of a certain type inside communication as a whole; or, according to Danziger (1972, 57), “A channel involves some physical apparatus that transmits messages coded in a particular manner” (cf. also Posner 1986 as well as Art. 14 § 1.3.1.). In this sense, the apparatus constituted by human voice and hearing involves at least two channels, because there is one way of coding which involves words as such, and another way (but possibly one can discern many channels) which involves auditory nonverbal signals, like groans, laughter, hesitations, and so forth. Following Argyle (1975), we can first distinguish a series of “social acts” and corresponding communication channels, which convey information on their own, or inside a complex message (for further differentiation of communication channels in humans cf. Art. 27 § 3.). 2.1. Speech Among the social acts of this kind, the most complex at the human level is of course speech. We do not, however, cover this topic, for which the reader is referred to other parts of this Handbook (cf. Art. 2⫺4, Art. 42, Art. 53, Art. 65 and 67, Art. 77, 79 and 80 as well as Art. 149). Speech is not simply a single-channel communication: consider, e. g., the metacommunication aspects of speech including double bind messages (cf. Watzlawick, Beavin and Jackson 1968). 2.2. Paralanguage Speech also includes many nonverbal aspects: timbre, intonation, speed, quality (shortness of breath, breaks, etc.), harmony ⫺ prosodic aspects that convey information mainly of an emotional kind (cf. Frick 1985 as well as Posner 1986 und 1988). Moreover, there are codes which are typical of particular social groups, such as dialect vs. standard language (Baroni 1983), politeness (Baroni and D’Urso 1983), or the utilization of certain expressions
13. Body behavior as multichannel semiosis
that signal whether the speaker is a male or a female, as in Japanese (Smith 1979). In general, paralanguage is the term used when referring to such issues. Birdwhistell (1970, 110) proposes to call the prosodic aspects paralinguistic, and all the other nonverbal cues which accompany speech parakinesic. Paralinguistic and parakinesic aspects taken together “may be comprehended as a single system, paralanguage”. It has been known for a long time (cf. Davitz 1964, 13 ff) that subjects, by decoding the vocal cues of such social acts, are able to reconstruct the emotional value intended by the speaker in a neutral message with an accuracy of about 60⫺70%. As Scherer (1986, 143) points out, however, there is an apparent paradox in this kind of research: subjects seem rather accurate in decoding the emotional meanings conveyed by vocal cues, but at the same time psychoacoustic and psychophonetic research appears so far unable to identify the phonetic indicators responsible for differentiating reliably a number of emotions. In analyzing nonverbal aspects of speech, one should not disregard the elements that concern the global organization of speech. These include the amount of time spent to develop speech, the pauses due to hesitation or not (cf. Kowal 1991) and the regularities of interrupting others’ speech (cf. Markova` and Foppa 1991). 2.3. Proxemic behavior A kind of social act which until a few decades ago had been neglected by researchers is the set of spatial behaviors whereby people regulate, often unconsciously, their reciprocal position (cf. Art. 27 § 3.1.). This is called proxemics, a term which is today widely popular, especially after the work by Hall (1959; 1966). In particular, the interpersonal distance was intensively studied with respect to the social norms, varying from culture to culture, which assign different values (intimacy, intrusion, and so forth) to the different distances (cf. Art. 5 § 3.4.1.). Three problems are directly linked with the issue of interpersonal distances. First, there is a direct relationship between distance and the frequency of touching one another. It seems that cultures that favor greater distances also tend to discourage touching (Jourard 1964). In general, however, the meaning of touch can vary widely, according to a number of factors (cf. Heslin and Alper 1983, 50 ff). Among these, we can consider as particularly
347 relevant the part of the body which touches and which is touched, the relationship between persons involved in touching (from professional functions to sexual arousal), whether anyone else is present, and the situation in which touching occurs. Second, apparently the evaluation of physical interpersonal distance between a subject and other people is biased, whereby individuals tend to perceive themselves farther from others than they really are: the farther, the nearer the other people (Codol 1985, 518 ff). A third closely linked problem is bodily orientation (orientation of face and shoulders, positions around a table, etc.) and bodily posture (cf. Mehrabian 1969 and 1972; Argyle 1975). In this context, particularly significant is the problem of gaze and gaze direction, which was neglected until the sixties and is now recognized as one of the most important nonverbal signals (cf. Art. 12 § 1.). Gaze is now considered both as a signal and probably above all as a channel, which can be open or shut. The importance of gaze lies in the fact that there is a sort of psychological equivalence between eye contact and physical proximity. As in the case of distance, in the perception of direction of gaze there is also an asymmetry compared with a neutral physical situation. The farther away other people are, the more one tends to interpret the direction of gaze of others as directed towards one’s own eyes (Argyle and Cook 1976, 84 ff). According to Kleinke (1986), who refers to the framework of the sequential model of nonverbal exchange by Patterson (1983), gaze provides information, regulates interaction, expresses intimacy, exercises social control, and facilitates service and task goals. 2.4. Time behavior Hall (1966) has drawn our attention to another aspect of nonverbal communication, often neglected: time (cf. Art. 27 § 3.2.). Time can have many very important meanings in social interaction: the duration of a conversation, the duration of pauses, the time we make a person wait, and so forth. Today the importance of this dimension is largely recognized, but little effort has been made to give more precise specifications to its effects. 2.5. Gestures Apart from speech, the social acts which are probably most important in conveying information are gestures. “Gesture”, according to
348 Kendon (1983, 13), means “any visible bodily action by which meaning is given voluntary expression”. A more exact definition is hardly possible; the set of possible gestures actually is a fuzzy one. In social psychology, a variety of classifications of gestures have been proposed, beginning probably with Wundt (1900), who distinguished pointing gestures from symbolic gestures. According to Kendon, it is useful to distinguish between autonomous gestures, which are complete utterances per se, and gesticulation, referring to all gestures intimately associated with speech (parakinetics; see above). 2.6. Facial expression It is difficult to exaggerate the importance of facial expression. The human face has an unbelievable richness of expressions, many being very short, up to 40 msec or so of duration. As Rinn (1984, 56) points out, “although most observers would agree that facial behavior plays an important role in communication, few appreciate the immense complexity and richness of the messages conveyed”. It is not surprising that authors like Ekman, Friesen, and Ellsworth (1982) state that the problem of the accuracy of information provided by facial expressions is and always has been the central issue since research on this topic began. One autonomous facial expression is smiling, which has a social meaning similar to eye contact. However, there are some interesting differences in the use of smiling according to sex. Other such gestures are nodding, frowning, and so on. 2.7. Outward appearance The outward appearance, too, constitutes a source of messages. In many respects, appearance (height, weight, etc.) is not under the conscious control of the person, as are certain traits like style of dress or hairstyle. In any case, a person can use his or her appearance to strengthen the messages sent through other channels. This is possible because there exists a hierarchy of credibility according to the effort it takes for a person to change his or her appearance in a meaningful way (cf. Posner 1994, § 3.): the less permanent a personal feature is, the less credible is its message in case of conflict with a more permanent one.
II. Aspekte der Semiose
3.
Methodological problems
Research on multichannel integration has been largely focused on assessing the accuracy of the receiver’s judgment of messages coming from several channels at the same time. Yet, such assessment is not always easy, because there is no careful and unambiguous definition of the categories to which the cues present in a bodily message must be attributed, particularly when they refer to emotions or to other affective aspects of communication. In all these investigations the researcher must first assess the verbal and nonverbal information coming from the source of communication and afterwards evaluate the accuracy of the receiver’s decoding. 3.1. Measuring cues The measurement of cues sent by the source of communication is a very difficult matter in this context. We do not deal here with problems about information present in the verbal component of multichannel messages. Such problems are not easy to solve; there is a wealth of literature on this subject to which one can refer. The concern of the present paper is nonverbal cues. In some cases we can assess without difficulties the physical parameters to which a nonverbal cue could be related. This is the case for most prosodic features, physical distance, time spent in interaction, spatial location and orientation of the body, posture, many gestures, gaze, and so on. Other cues are very difficult to assess; there have been few attempts to give a standardized method which can be utilized in several different situations. In most cases, individual studies resort to different ways of measuring nonverbal cues, thus rendering it very often difficult (and dubious) to transpose the obtained results to the whole field of research. Moreover, we must emphasize that in this area the problem is never confined to assessing separately the verbal cues, but such cues interact with each other in a communication system. Let us confine ourselves to two issues particularly apt to illustrate this point: the assessment of the set of variables that define proxemic behavior, and the assessment of facial expression in its very rich complexity. The variables of the system of proxemic behavior have been identified with great accuracy by Hall (1963), to whom the reader is referred for a detailed treatment. We give
13. Body behavior as multichannel semiosis
here a short account, noting that the assessment in these terms has been used in several experimental studies (cf. Watson 1972, 444). In order to evaluate proxemic behavior we must therefore distinguish and assess eight aspects of behavior: (1) identifiers of sex and posture: relations between the interacting persons’ sex and bodily posture; (2) the sociofugal-sociopetal axis: relations between the interacting persons’ shoulders, from face-to-face to back-to-back; (3) kinesthetic factors: the distance between persons in terms of the potential for touching one another; (4) the tactile channel: the amount and kind of touching during interaction; (5) the visual channel: the amount of visual contact; (6) the acoustic channel: loudness of voice; (7) the thermal channel: the detection of thermal radiation or conduction from the interacting bodies; (8) the olfactory channel: detection of (undifferentiated) odors of body and breath. Clearly, this list is rather arbitrary, but at least it makes it possible to systematically detect a series of variables that could be reliably compared among different studies. It is important to note that none of these measures can be used separately to assess proxemic behavior: all must be taken together as a whole. This is perhaps the most important indicator of the fact that proxemic behavior requires an integration of information coming from multiply different channels. The problem for facial expression is quite similar. In this case, an attempt to offer a reliable way to score facial expressions was made by Ekman and Friesen (1978), with their so-called “Facial Action Coding System (FACS)”, in which they proposed seven emotions they consider to be “universal”: anger, fear, disgust, sadness, happiness, contempt, and surprise. They then found 33 combinations of facial actions, including all the facial configurations that one can find associated with the seven emotions ⫺ obviously, the score is not given in terms of emotions, but rather in terms of muscle actions, e. g., nose wrinkling, brow raising, etc. The scoring is done on the basis of a video tape, and it is time-consuming (about 100 minutes for each minute of recording). In a shortened version, this time can be reduced ten times (Ekman, Friesen and O’Sullivan
349 1988, 416). However, in this case too it should be noted that the face is not to be considered a single channel, but a multichannel system, with a plurality of messages often conflicting with one another (as in the case of deception, ambivalence, etc.). The value of considering the face a multidimensional system is well illustrated by the study of the so-called “micromomentary expressions (MMEs)”. For instance, Druckman, Rozelle and Baxter (1982, 61) have isolated the following MMEs: width of eye opening, pupil/eye position, head angle, head position up or down (nod), head position side to side (turn), brow to nose, brow elevation, cheek length, width of mouth, length of mouth, jaw reset up and down. The recordings of MMEs are particularly valuable, since their time frame is close to the duration of certain neurophysiological indexes, in particular the so-called “P 300”. By this is meant a specific component of event-related potentials of the electro-encephalogram (Donchin 1979), which turns out to be an index of the cognitive activity associated to stimulus evaluation, particularly evident in the case of disappointed expectations. The methodological problems raised by research into deception are particularly relevant. Apart from ethical problems, always delicate in this kind of research (on this subject, cf. the classic analysis by Kelman 1967, 6 ff), there are many difficulties in what Orne (1962) called the “ecological validity” of laboratory deceptions. In these studies the experimenters resort to confederates, and the results obtained are very often affected by the confederate’s ability to act out, as was demonstrated in the famous experiments by Milgram (1974) on obedience. One good way around such difficulties is to use normal subjects as deceivers. For instance, in the experiment by Ekman, Friesen and O’Sullivan (1988, 415) on smiles and lying (see § 4.3.), subjects had to watch a short film, which could be either pleasant or very unpleasant, with scenes of amputations and burns. The subjects were immediately rated as to their emotions; those who saw the first film felt very happy, and did not exhibit any fear, disgust, sadness or pain; the opposite was true for the subjects watching the second film. Both groups were interviewed after the film about their experience. The first group was instructed to answer “honestly”, while the second group was to conceal negative feelings, and try to convince the interviewer
350 that they too were watching a pleasant film. The interviews were videotaped and analyzed in order to detect the cues leaking deception, according to the FACS (see above). There were also other categorizations of emotions proposed in this field. For instance, Izard (1979) divides emotions into eight basic categories. He has constructed the “Emotion Recognition Test”, which consists of photographs representing each fundamental emotion. This test was cross-culturally standardized on eight samples of subjects coming from different countries (United States, Japan, Greece, and others). The subjects were given, to parallel the Emotion Recognition Test, the Emotion Attitude Questionnaire, in which they were asked which emotion they understand best or least, dread most or least, etc. As one might expect, the most widely cross-culturally understood emotion was joy, the least shame (cf. Izard 1979). 3.2. Measuring accuracy of decoding In general, in this kind of research there are very few standardized tests to assess the responses of subjects. A psychometric tool which has turned out to be useful in this context is the PONS test (Profile of Nonverbal Sensitivity; cf. Rosenthal et al. 1979). It consists of a black-and-white film, describing 20 affective situations portrayed by a young woman. During the test the subjects are presented with 220 audio and/or visual nonverbal stimuli. The subjects have a multiple choice task: they must choose between two different situational labels for each of the 220 items describing the situation enacted either as correctly or incorrectly. There are 11 “channels” of nonverbal communication involved: five “pure” ones (video: face, body and face plus body; audio: messages arranged with two techniques aimed at making the verbal messages incomprehensible, either by filtering certain critical frequencies of the voice, or by splicing the message and randomly rearranging it) and six “mixed” ones (any combination of the three visual channels with the two auditory ones). Therefore, through PONS it is possible to evaluate both cues deriving from single channels and from their combination. More recently, Blanck and Rosenthal (1982) have worked out the MOVANS (Measure of Verbal and Nonverbal Sensitivity). Here, we have visual and (altered) voice enactments, paired with verbal descriptions, that can be more, less, or nondiscrepant. The
II. Aspekte der Semiose
subjects are asked to rate the degree of discrepancy, positiveness and dominance perceived. Another psychometric tool, the SIT (Situation Interpretation Task; Archer and Akert 1977), has a similar function. In this task we have 20 videotaped real-life situations. For each scene, the subjects are asked to answer questions (e. g., “Which of the women is the mother of the infant?”) referring to elements to infer, not directly present in the scene. Both visual and audio cues are present in the SIT. The psychometric studies on the reliability of these tests (and others, like Buck’s CARAT, 1976) are fairly satisfying. Unfortunately, one cannot say the same for the correlational studies between them. Here the results are highly contradictory, leading Buck (1983, 217) to state that “apparently these instruments are sensitive to different aspects of receiving ability […]. Nonverbal receiving ability is not a unidimensional construct but instead involves a number of different ‘abilities’.”
4.
Consistency of multichannel messages
One important problem to analyze is the reciprocal support provided by the information deriving from different channels. It should be noted that, in the interaction, the receiver of the message normally assumes that such information is on the whole always consistent. This, however, should not be taken for granted. Moreover (as shown in § 4.1.), the absence of consistency opens one of the most interesting fields for experimental investigation, where we can also find interesting applied aspects (for instance, in the educational field cf. Galloway 1976; in psychotherapy cf. Ekman and Friesen 1982). 4.1. Consistent cues If, when discussing the integration of messages coming from different channels, one of the main problems is consistency, then the problem of the number of messages received (of the channels activated) is closely related to it. It is not difficult to predict (De Paulo and Rosenthal 1978) that if such messages are consistent with each other, it will be easier to integrate them, thus making the receiver’s judgment more accurate. Perhaps more interesting is that the accuracy of judgment
13. Body behavior as multichannel semiosis
is higher when more channels are evaluated simultaneously, lower when the single channels are assessed separately. The more channels to evaluate, the greater the accuracy (Rosenthal et al. 1979, 70 ff). However, one does not always find a greater accuracy with multiple channels and it depends on the channel to which the others are compared. For instance, Berman, Shulman and Marwit (1976) report that, when using only audio, only video, or audio plus video, the accuracy of judgments about the warmth of a message was the same in the last two conditions, but lower in the first one; similar results were previously found by Levitt (1964). 4.2. Inconsistent cues The study of the influence of inconsistent multichannel cues on accuracy of judgments has proved a powerful instrument to assess the modalities of integration of information and the relative prevalence of different channels. Another very important related topic is deception (see § 4.3.). In a classic study, Mehrabian and Ferris (1967) observed that in video and audio communication, the effects of video cues accounted for 40% of the variance of results, while the effects of (inconsistent) audio cues accounted only for 19%. Subjects were presented photographs of faces expressing various attitudes and a series of recorded voices, uttering the word “maybe” with positive, negative, and neutral intonation. Such prevalence of the visual channel has been confirmed in a number of studies. As regards visual stimulation too, the different visual channels have various effects on judgments. It is generally agreed that facial expression is the most important visual nonlinguistic cue in decoding attitudes (e. g., Mehrabian 1972; De Paulo and Rosenthal 1979 b). Putting together the results of the studies by Mehrabian and Ferris (1967) and Mehrabian and Wiener (1967), and adopting a multilinear model, one can say that attitudes are inferred for 55% through facial expression, for 38% through vocal nonverbal behaviors, and only for 7% through verbal behavior (cf. Druckman, Rozelle and Baxter 1982, 84 ff). Similar results are obtained on decoding emotions from multichannel behaviors. As Darwin (1872) already stated, the human face should provide information on emotions easily recognizable by other persons.
351 However, the evidence is by no means unambiguous. As Russell and Bullock (1986) maintain, in this field there are many methodological problems that are far from being solved; they emphasize that the concepts of emotions to which expressions are related in judgment are often “fuzzy”. Indeed, as Ekman and Friesen (1969, 98) point out, the multiple and very complex cues that one can observe in a facial expression often make it a very puzzling source of information. 4.3. Deceiving The problem of deception is one of the most interesting and widely studied ones in the field of integration of multichannel information. The main question is to detect what the nonverbal cues are that are used to strengthen lies and to deceive others more effectively. In general, research on deception could be divided into three main approaches (De Paulo and Rosenthal 1979 b): (i) research on the ability to deceive and on the ability to discover deception; (ii) research on channels (facial expressions, bodily movements, paralanguage) which allow one to detect deception; (iii) research on specific cues that characterize deceptive responses. In a study today considered classic, Ekman and Friesen (1969) found that bodily movements leak deception more easily than facial expression. According to these authors, the deceiver possibly better controls facial movements, and fails to censor hand and foot movements, thus allowing observers to notice deception. However, in this investigation, as well as in others where similar methods were used, results are far from being unequivocal, and the judgments are never too accurate (for a review, cf. Zuckerman, De Paulo and Rosenthal 1981). As Ekman and Friesen (1969, 98) pointed out, however, the face is very rich in cues which could be detected in deceiving. For this reason, Ekman and his collaborators have tried to analyze all the facial cues which are present in facial expression in such situations. The study on deception by Druckman, Rozelle, and Baxter (1982), in which the multichannel approach is explicitly stated and considered highly valuable, is particularly relevant in our context. In their first experiment, subjects had to play the role of a Soviet ambassador interviewed in a “Meet the Press” setting. Subjects were assigned to one of three conditions: deception, evasion, and honesty.
352
II. Aspekte der Semiose
The dependent variables consisted of 26 behaviors arranged in 10 categories, from speech, to gestures, to fidgeting with objects, and so forth. The multichannel strategy adopted by the authors makes their findings particularly difficult to summarize. Among the most interesting results, concerning the analysis of subjects’ behavior, we confine ourselves to the following: Evaders are better discriminated from both honest subjects and deceivers by leg movements and gazing elsewhere, which are more frequent in such subjects. Honest subjects are better discriminated from both evaders and deceivers since they spend less time looking away from the interviewer. Finally, deceivers are better discriminated from both honest subjects and evaders since they make more frequent speech errors. In a second experiment, focused on ability to decode the clues to deception, subjects looked at the same actor, who played either an honest, deceptive or evasive role. In the case of honesty, the actor had to look at the interviewer frequently, and exhibited occasional gestures and head shaking, with infrequent smiles and frowns. In the case of deception, the actor had to exhibit fidgeting with his glasses, occasional looking away from the interviewer, rocking movements, and several speech hezitations. Finally, in the case of evasion, the actor exhibited frequent leg and foot movements and occasional fidgeting and hand shaking. The subjects were divided into four groups, the first two with different levels of training in communication, the third with an “inference training” specific to this kind of experimental task, the fourth was presented with audio only. The best results were obtained by the third group, the fourth, with access limited to the verbal channel, achieved correct judgements in only about 50 % of cases.
5.
Differences in integration of messages from different channels
The ability to integrate information from different channels can differ according to various factors: age, sex, psychopathological disorders, and personality differences. Let us briefly consider them. 5.1. Age As already emphasized, the more channels there are, the greater the ability to integrate information. However, this is only typical of adults in the absence of psychological disor-
ders. Things look different when viewed in a developmental perspective. De Paulo and Rosenthal (1978), utilizing the PONS test, have demonstrated that, in a range between eight and thirty-three years of age, when increasing the number of channels, the accuracy of judgments also increases. The higher the subjects’ ages, the greater the effect. Such a result could be related to the greater difficulties which children encounter in processing input stimuli (cf. the model of transition between Piagetian stages proposed by Pascual-Leone 1970), with particular reference to the stimuli coming from different modalities. Such difficulty has been shown for hearing and sight in a number of studies, from Ruch and Levin (1979) to Levorato and De Zuani (1987). The question is whether this is due to a real inferiority in information processing or, on the contrary, to a greater distractibility. According to Ruch and Levin, who studied the effects of illustrations on the memory of tales, preschool children are unable to create visual images of the visual stimuli; at a successive stage, they form visual images, but appear unable to retrieve them. Only at eight years of age are they able to do both things. Furthermore, Duncan, Whitney, and Kunen (1982) have demonstrated that the influence on memory of a visual event on verbal information given by the experimenter to children increases with age, from six to ten years. This finding suggests that the younger children tend to activate a sensory and nonsemantic type of information processing, which makes the integration of verbal and visual information more difficult. 5.2. Sex The influence of sex on integration of messages from different channels has been widely studied. As Frieze et al. (1978, 320) point out, “the separation of people in our society into females and males is one of our most basic divisions. At a very young age boys begin to learn how to ‘act like boys’ and girls learn to ‘act as girls’.” It is absolutely natural that boys and girls learn different sets of social behavior that are considered appropriate for their sex. If a woman does not perform appropriately, she is labeled “unladylike” (Mehrabian 1972), and is harshly criticized by men as well as women (for feminist accounts of this difference in socialization cf. Art. 15 § 2.). Thus in Italy, for instance, a man can speak dialect in a wide variety of situations, while a woman has a very restricted space in which she can use dialect without being criticized,
353
13. Body behavior as multichannel semiosis
and she is usually expected to speak standard Italian (Baroni 1983). There is strong evidence of the differences between males and females in displaying different kinds of social acts in social interactions. In general, one can say that women tend to be more affiliative and males more assertive. Mehrabian and Ksionzky (1972), in the framework of Mehrabian’s (1972) model of determiners of social interaction (see below), found that females tend to have more expectations of positive reinforcement, interpreting more positively communications, and eliciting more positive social exchanges, compared with males. The evidence is more ambiguous when we consider sex as a factor influencing the ability to decode the messages coming from the various channels of communication. In some cases, research found women better than males, while in other studies no difference was found. In general, however, the majority of researchers agree that women are a little more responsive to nonverbal cues, but, as Frieze et al. (1978) point out, this could be related to the fact that in interaction between males and females usually males are in a dominant position, while those who are in a lower position must be more sensitive to social cues for their survival (Gitter, Black, and Mostofsky 1972). As a consequence, in general women are said to be more empathetic than men. As Eisenberg and Lennon (1983) point out, this stereotype is seldom unequivocally confirmed by empirical evidence and on the basis of a careful methodological analysis of research, we can attribute little importance to this difference. 5.3. Psychopathological factors As to psychopathological conditions, according to Rosenthal et al. (1979) psychiatric patients, from schizophrenics to alcoholics, benefit to a lesser degree than normal from multiplicity of channels. Here too we must ask ourselves if such lesser capacity is due to attentional difficulties; indeed, it is already demonstrated that nonparanoid schizophrenics find it difficult to process stimuli coming from different sensory modalities (Meiselman 1973). In general, however, schizophrenics are less able to perceive emotion, for instance when they are given Izard’s Emotion Recognition Test (Dougherty, Bartlett, and Izard 1974), with particular difficulties in recognizing shame, disgust, and contempt.
6.
Determiners of social interaction and information integration
6.1. Social interaction The study of social interaction is particularly important in this context. In social interaction people must integrate information deriving from different social acts and channels, to attain a certain relationship with other people. The effort has been to pick up the various behavioral aspects that act in social interaction, and to determine on this basis the main factors of social interaction. From this point of view, many researchers have referred to Bales’ Interaction Process Analysis, in which three factors were consistently isolated: power, affection, and contribution to group tasks (Bales 1950). A cornerstone in this line of research is represented by the factor-analytic study by Mehrabian (1972; cf. also Mehrabian and Ksionzky 1972). On the basis of 26 behavioral measures, Mehrabian was able to isolate six factors, of which the first three are particularly important. The first factor, called “affiliation”, included (on the positive side) social acts like frequency of declarative statements, duration of subject’s and of confederate’s speech, duration of eye contact, positive verbal content, head nods, head and arm gestures, pleasantness of facial expression; it largely overlaps Bales’ affection. The second factor, “responsiveness”, included (also on the positive side) vocal activity and speech rate and volume. It is interpreted as an index of one’s awareness of the presence of the other, and of one’s availability to react to him or her. The third factor, called “relaxation”, was closely related to Bales’ power factor, and included (on the positive side) body leaning, and (on the negative side) rocking and leg and foot movements. The other three factors are less important: ingratiation, distress and intimate position. The first is positively correlated with affiliative behavior, and tends to attain overall good relationships in the initial interactions with strangers. The second is related to the avoidance of the anxiety to interact with others. The last factor is a position of closure from others. These three factors also include positively or negatively social acts. In general, this model is consistent with the view that people have expectancies either
354
II. Aspekte der Semiose
of positive or of negative reinforcement. The first expectancy encourages affiliative behavior and positive interpersonal exchanges; so, one creates a positive feedback for social interaction, which in turn favors positive expectancies. The opposite occurs with expectancies of negative reinforcement, with the instantiation of a vicious cycle. 6.2. Social interaction in psychotherapy The importance of multichannel communication in social interaction has been stressed by Waxer (1979) for a specific setting: psychotherapy. As he points out, in psychotherapy there is a continuous mutual sending of verbal and nonverbal behaviors from both client and therapist, with a very large influence on the course of the therapeutic process itself. The communication sent from the patient is an important source of information in three different respects: (i) basic psychodiagnostics: for instance, depressed patients exhibit gaze aversion, tend to have a down-turned mouth, head angled down and absence of head movements; anxious patients exhibit in relation to patients who are not anxious more stroking, twitching and tremors in manual behavior, shorter duration of eye contact, less smiling, greater torso rigidity; (ii) rate of therapeutic progress: for instance, the frequency and duration of eye contact increase with recovery; (iii) client resistance: for instance, an increase in occurrence of so-called “self adaptors” (Ekman and Friesen 1969), that is, gestures addressed towards oneself. The communication sent from the therapist is also important from three points of view: (1) for establishing the initial rapport: e. g., Dong et al. (1976) point out that therapists are rated more positively when they exhibit long eye contacts, have a forward leaning of the torso, show a concerned expression, and stay close to the patient; (2) for facilitating therapy; (3) for modeling for psychological growth: for instance, through the SST (Social Skill Training) proposed by Trower, Briant and Argyle (1978). In any case, it is obvious that a specific training in decoding clues coming from patients and in sending messages should be a valuable help in psychotherapy.
7.
Concluding remarks
In this article I have tried to sketch the state of the art in the field of multichannel research in human bodily communication. The
tendency of this type of research is, of course, comprehensive and holistic, its aim is to give an integrated framework of a number of sources and reciprocal influences in a wide variety of contexts. Unfortunately, the very nature of any description is analytical. Therefore, I am afraid I have not been able to convey the flavor of comprehensiveness and of holism that should be typical of this domain. Concluding this chapter, let me emphasize once again that integrations and synergisms of different sources of information are more important than the understanding of the messages coming from single channels, which are mostly isolated only by artificial means.
8.
Selected references
Archer, D. and R. M. Akert (1977), “Words and Everything Else: Verbal and Nonverbal Cues in Social Interpretations”, Journal of Personality and Social Psychology 35: 443⫺449. Argyle, Michael (1975), Bodily Communication. London. Argyle, Michael and Mark Cook (1976), Gaze and Gaze Direction. Cambridge, England. Bales, Robert F. (1950), Interaction Process Analysis: A Method for the Study of Small Groups. Reading, MA. Baroni, Maria Rosa (1983), Il linguaggio trasparente. Bologna. Baroni, Maria Rosa and Valentina D’Urso (1983), “Appendice: Il linguaggio degli uomini e delle donne: l’intonazione cortese”. In: Maria Rosa Baroni, Il linguaggio trasparente. Bologna: 121⫺139. Berman, Harry J., A. D. Shulman, and S. J. Marwit (1976), “Comparison of Multidimensional Decoding of Affect from Audio, Video, and AudioVideo”, Sociometry 39: 83⫺89. Birdwhistell, Ray (1970), Kinesics and Context: Essays on Body Motion and Communication. Philadelphia. Blanck, Paul and Robert Rosenthal (1982), “Developing Strategies for Decoding ‘Leaky’ Messages”. In: Robert S. Feldman (ed.), The Development of Nonverbal Behavior in Children. New York: 260⫺286. Buck, Ross (1976), “A Test of Nonverbal Receiving Ability: Preliminary Studies”, Human Communication Research 2: 162⫺171. Buck, Ross (1983), “Nonverbal Receiving Ability”. In: John M. Wieman and Randall P. Harrison (eds.), Nonverbal Interaction. Beverly Hills, CA: 209⫺242. Codol, Jean-Paul (1985), “L’estimation des distances physiques entre personnes: suis-je aussi loin de vous que vous l’eˆtes de moi?”, L’Anne´e Psychologique 85: 517⫺534.
13. Body behavior as multichannel semiosis Danziger, Kurt (1972), Interpersonal Communication. New York. Darwin, Charles (1872), The Expression of Emotions in Man and Animals. London. Davitz, Joel R. (1964), The Communication of Emotional Meaning. New York. De Paulo, Bella M. and Robert Rosenthal (1978), “Age Changes in Nonverbal Decoding as a Function of Increasing Amount of Information”, Journal of Experimental Child Psychology 26: 280⫺287. De Paulo, Bella M. and Robert Rosenthal (1979 a), “Age Changes in Nonverbal Decoding Skills: Evidence for Increasing Differentiation”, MerillPalmer Quarterly 25: 145⫺150. De Paulo, Bella M. and Robert Rosenthal (1979 b), “Ambivalence, Discrepancy and Deception in Nonverbal Communication”. In: Robert Rosenthal (ed.), Skill in Nonverbal Communication: Individual Differences. Cambridge, MA: 204⫺248. Donchin, Emanuel (1979), “Event Related Potentials: A Tool in the Study of Human Information Processing”. In: Henri Begleiter (ed.), Evoked Potentials in Psychiatry. New York: 113⫺146. Dong, Yul Lee, Harvey Zingle, James G. Patterson, Allen E. Ivey, and Richard F. Haase (1976), “Development and Validators of a Microcounseling Skill Discrimination Scale”, Journal of Counseling Psychology 23: 468⫺472. Dougherty, Frank, Edmund S. Bartlett and Carol E. Izard (1974), “Responses of Schizophrenics to Expressions of the Fundamental Emotions”, Journal of Clinical Psychology 30: 243⫺246. Druckman, Daniel, Richard M. Rozelle, and James C. Baxter (1982), Nonverbal Communication. Beverly Hills, CA. Duncan, Starkey (1969), “Nonverbal Communication”, Psychological Bulletin 72: 118⫺137. Duncan, Edward M., Paul Whitney, and Seth Kunen (1982), “Integration of Visual and Verbal Information in Children’s Memory”, Child Development 28: 268⫺279. Eisenberg, Nancy and Randy Lennon (1983), “Sex Differences in Empathy and Related Capacities”, Psychological Bulletin 94: 100⫺131. Ekman, Paul (1985), Telling Lies: Clues to Deceit in the Marketplace, Politics, and Marriage. New York. Ekman, Paul and Wallace V. Friesen (1969), “The Repertoire of Nonverbal Behavior: Categories, Origins, Usage, and Coding”, Semiotica 1: 49⫺98. Ekman, Paul and Wallace V. Friesen (1978), Facial Action Coding System. Palo Alto, CA. Ekman, Paul and Wallace V. Friesen (1982), “Felt, False and Miserable Smiles”, Journal of Nonverbal Behavior 1: 56⫺75. Ekman, Paul, Wallace V. Friesen, and Phoebe Ellsworth (1982), “Does the Face Provide Accurate Information?” In: Paul Ekman, Wallace V. Friesen, and Phoebe Ellsworth (eds.), Emotion in the Hu-
355 man Face. 2nd edition Cambridge, England 1982: 56⫺97. Ekman, Paul, Wallace V. Friesen, and Maureen O’Sullivan (1988), “Smiles When Lying”, Journal of Personality and Social Psychology 54: 414⫺420. Ekman, Paul (ed.) (1973), Darwin and Facial Expression: A Century of Research in Review. New York. Freedman, Norbert (1971); “The Analysis of Movement Behavior during the Clinical Interview”. In: A. Siegman and B. Pope (eds.), Studies in Dyadic Communication. New York: 153⫺176. Frick, Robert W. (1985), “Communicating Emotion: The Role of Prosodic Features”, Psychological Bulletin 97: 412⫺429. Frieze, Irene H., Jacquelynne E. Parsons, Paula B. Johnson, Diane N. Ruble, and Gail L. Zellman (1978), Women and Sex Roles. A Social Psychological Perspective. New York. Galloway, Charles M. (1976), The Silent Language of the Classroom. Bloomington, IN. Gitter, George A., Harvey Black and David Mostofsky (1972), “Race and Sex in Perception of Emotion”, Journal of Social Issues 28: 63⫺78. Hall, Edward T. (1959), The Silent Language. New York. Hall, Edward T. (1963), “A System for the Notation of Proxemic Behavior”, American Anthropologist 65: 1003⫺10026. Hall, Edward T. (1966), The Hidden Dimension. New York. Heslin, Richard and Tari Alper (1983), “Touch: A Bounding Gesture”. In: John M. Wieman and Randall P. Harrison (eds.), Nonverbal Interaction. Beverly Hills, CA: 47⫺76. Izard, Carol E. (1971), The Face of Emotion. New York. Izard, Carrol E. (1979), “Facial Expression, Emotion and Motivation”. In: Aaron Wolfgang (ed.), Nonverbal Behavior. New York: 31⫺50. Jourard, Sidney M. (1964), The Transparent Self. Princeton, NJ. Kelman, Herbert C. (1967), “Human Use of Human Subjects: The Problem of Deception in Social Psychological Experiments”. Psychological Bulletin 67: 1⫺11. Kendon, Adam (1983), “Gesture and Speech: How They Interact”. In: John M. Wieman and Randall P. Harrison (eds.), Nonverbal Interaction. Beverly Hills, CA: 13⫺46. Kleinke, Chris L. (1986), “Gaze and Eye Contact: A Research Review”, Psychological Bulletin 100: 78⫺100. Kowal, Sabine (1991), Über die zeitliche Organisation des Sprechens in der Öffentlichkeit: Pausen, Sprechtempo und Verzögerungen in Interviews und Reden von Politikern. Bern.
356 Levitt, Eugen (1964), “The Relationship to Express Emotional Meanings Vocally and Facially“. In: Joel R. Davitz (ed.), The Communication of Emotional Meaning. New York: McGraw Hill: 78⫺100.
II. Aspekte der Semiose
Posner, Roland (1988), “Balance of Complexity and Hierarchy of Precision: Two Principles of Economy in the Notation of Language and Music”. In: Michael Herzfeld and Lucio Melazzo (eds.), Semiotic Theory and Practice. Proceedings of the Third International Congress of the IASS in Palermo, 1984. Berlin and New York: 909⫺920.
sion: “Humans as Signs”. In: Christiane Pankow (ed.) (1996), Indexical Signs. Gothenburg. Rinn, William E. (1984), “The Neuropsychology of Facial Expression: A Review of the Neurological and Psychological Mechanisms for Producing Facial Expressions”, Psychological Bulletin 95: 52⫺ 77. Rosenthal, Robert (1976), Experimenter Effects in Behavioral Research. New York. Rosenthal, Robert, Judith A. Hall, Dane Archer, M. Robin Di Matteo, and Peter L. Rogers (1979), “Measuring Sensitivity to Nonverbal Communication: The PONS Test”. In: Aaron Wolfgang (ed.), Nonverbal Behavior. New York: 67⫺98. Rozin, Paul and April E. Fallon (1987), “A Perspective on Disgust”, Psychological Review 94: 23⫺41. Ruch, Michael and James Levin (1979), “Partial Picture and Imagery Retrieval Cues in Young Children’s Prose Recall”, Journal of Experimental Child Psychology 28: 268⫺279. Russell, James A. and Merry Bullock (1986), “Fuzzy Concepts and the Perception of Emotion in Facial Expressions”, Social Cognition 4: 309⫺341. Scherer, Klaus R. (1986), “Vocal Affect Expression: A Review and a Model for Future Research”, Psychological Bulletin 99: 143⫺165. Scherer, Klaus R. and Paul Ekman (eds.) (1982), Handbook of Methods in Nonverbal Behavior Research. Cambridge, England, and Paris. Siegman, Aron W. and Stanley Feldstein (1985), Multichannel Integrations of Nonverbal Behavior. Hillsdale, NJ. Smith, Paul M. (1979), “Sex Markers in Speech”. In: Klaus R. Scherer and Howard Giles (eds.), Social Markers in Speech. New York. Trower, Peter, Richard Bryant, and Michael Argyle (1978), Social Skills and Mental Health. London. Watson, Michael O. (1972), “Proxemics”. In: T. A. Sebeok (ed.), Current Trends in Linguistics. The Hague. Waxer, Peter (1979), “Therapist Training in Nonverbal Behavior: Towards a Curriculum”. In: Aaron Wolfgang (ed.), Nonverbal Behavior. New York: 127⫺138. Weitz, Shirley (ed.) (1974), Nonverbal Communication. New York. Wundt, Wilhelm (1900), Völkerpsychologie. Part 1 and 2: Die Sprache. Leipzig. 4th edition Stuttgart 1921⫺22. Partial English translation by Arthur L. Blumenthal: The Language of Gestures. The Hague 1973. Zuckerman, Miron, Bella M. De Paulo, and Robert Rosenthal (1981), “Verbal and Nonverbal Communication and Deception”. In: Leonard Berkowitz (ed.), Advances in Experimental Social Psychology. New York: 1⫺59.
Posner, Roland (1994), “Der Mensch als Zeichen”, Zeitschrift für Semiotik 16: 195⫺216. English ver-
Riccardo Luccio, Trieste (Italy)
Levorato, Maria Chiara and Elisabetta De Zuani (1987), “Lo sviluppo dei processi di integrazione di informazioni visive e verbali congruenti, incomplete e incongruenti”, Giornale Italiano di Psicologial 14: 459⫺478. Markova`, Ivana and Klaus Foppa (eds.) (1991), Asymmetries in Dialogue. The Dynamics of Dialogue. London. Mehrabian, Albert (1969), “Significance of Posture and Position in the Communication of Attitude and Status Relationships”, Psychological Bulletin 71: 359⫺372. Mehrabian, Albert (1972), Nonverbal Communication. Chicago. Mehrabian, Albert and S. R. Ferris (1967), “Inference of Attitudes from Nonverbal Communication”, Journal of Consulting Psychology 31: 248⫺252. Mehrabian, Albert and M. Wiener (1967), “Decoding of Inconsistent Communications”, Journal of Personality and Social Psychology 6: 109⫺114. Mehrabian, Albert and Shelton Ksionzky (1972), “Some Determiners of Social Interaction”, Sociometry 35: 588⫺609. Meiselman, Karin C. (1973), “Broadening Dual Modality Cue Utilization in Chronic Nonparanoid Schizophrenics”, Journal of Consulting and Clinical Psychology 41: 447⫺453. Milgram, Stanley (1974), Obedience to Authority. New York. Orne, Martin T. (1962), “On the Social Psychology of the Psychological Experiment”, American Psychologist 17: 776⫺783. Pascual-Leone, Juan (1970), “A Mathematical Model for the Transition Rule in Piaget’s Developmental Stages”, Acta Psychological 32: 301⫺345. Patterson, Miles L. (1983), Nonverbal Behavior: A Functional Perspective. New York. Posner, Roland (1986), “Zur Systematik der Beschreibung verbaler und nonverbaler Kommunikation: Semiotik als Propädeutik der Medienanalyse”. In: Hans-Georg Bosshardt (ed.), Perspektiven auf Sprache: Interdisziplinäre Beiträge zum Gedenken an Hans Hörmann. Berlin and New York: 267⫺313.
14. Technische Medien der Semiose
357
14. Technische Medien der Semiose 1. Einleitung 1.1. Mediale Semiosen 1.2. Begriffsanalyse von „Medium“ 1.3. Begriffsnachbarn des technologischen Medienbegriffs 2. Geschichtliche Entwicklung der technischen Medien 2.1. Die Periode der Schreibmedien 2.2. Die Periode der Druckmedien 2.3. Die Periode der Telekommunikationsmedien 2.4. Die Periode der interaktiven Medien 3. Strukturelle Merkmale von technischen Medien 3.1. Visuelle Medien 3.2. Auditive Medien 3.3. Audiovisuelle Medien 4. Funktionsweisen von technischen Medien 4.1. Transport- und Fixiermedien 4.2. Reproduktive und umwandelnde Medien 4.3. Unidirektionale und interaktive Medien 5. Vom Sender zum Adressaten: Druckmedien als Beispiel 5.1. Manuelle und maschinelle Zeichenübermittlung 5.2. Elektronische Zeichenübermittlung 6. Semiotische Veränderungen durch technische Medien 6.1. Veränderungen auf der sozialen Mikroebene 6.2. Veränderungen auf der sozialen Makroebene 6.3. Ausblick: Verdrängt die indirekte Semiose die direkte? 7. Literatur (in Auswahl)
1.
Einleitung
Der Begriff „Medium“ wird in verschiedenen Wissenschaftsdisziplinen ähnlich inflationär gebraucht wie die Begriffe „Kommunikation“ oder „Interaktion“ (für einen Überblick, vgl. Posner 1985). Deshalb wird er zu Beginn dieses Beitrags erläutert, theoretisch verankert und an Beispielen erklärt. Für eine Klassifikation von Medientypen erweist es sich als hilfreich, einen historischen Überblick der Medienentwicklung nachzuskizzieren. Einordnungskriterien für eine semiotische Gliederung von technischen Medien sind ihre strukturellen und funktionalen Merkmale. Eine Kommunikationskette vom Sender zum Adressaten wird am Beispiel der Druckmedien aufgezeigt. Medien können auf verschiedenen sozialen Mikro- und Makroebenen den Charakter von Zeichenprozessen
(Semiosen) verändern. In diesem Zusammenhang drängt sich die Frage auf, ob im Informationszeitalter die indirekte Semiose (mediale Kommunikation) die direkte Semiose (Face-to-face-Kommunikation) verdrängt. 1.1. Mediale Semiosen Komplexe Kommunikationssemiosen (Zeichenprozesse) können unterschieden werden in direkte Semiosen und indirekte Semiosen (vgl. Art. 5 § 3.4.). Wenn zwischen Sender und intendiertem Empfänger keine anderen Sender (S) und Empfänger (E) zwischengeschaltet sind, handelt es sich um eine direkte Semiose. Bei Zwischenschaltung von S und E liegt eine indirekte Semiose vor. Diese zwischengeschalteten Sender (S) und Empfänger (E) können andere Organismen oder aber technische Geräte sein. Sie werden als Teil des Mediums angesehen. (Aber auch bei direkter Kommunikation gibt es ein Medium: die zwischen S und E befindliche Materie, über die die Nachrichten laufen.) Eine einfache mediale Semiose involviert nur einen Organismus (Sender und Empfänger sind identisch) und ein Medium. Eine technische Semiose liegt dann vor, wenn ein oder mehrere Sender und/oder ein oder mehrere Empfänger ein Gerät (Medium) oder mehrere Geräte (Medien) benutzen. Das wichtigste Merkmal für die technische Semiose im Dialogmodell (Empfänger und Sender benützen ein Gerät, vgl. dazu Fig. 5.42 in Artikel 5) ist die Vermittlungsfunktion eines Mediums zwischen Sender und Empfänger. Das bloße Vorhandensein eines Mediums in der Gegenwart von Sender und Empfänger genügt nicht. Technische Semiosen können nach Art und Anzahl der involvierten technischen Medien differenziert werden (s. u. § 1.2.3., § 3. und § 4.). 1.2. Begriffsanalyse von „Medium“ Obwohl es zahlreiche, unterschiedliche Erläuterungen des Begriffs „Medium“ gibt und sich verschiedene Wissenschaftszweige mit ihm auseinandersetzen (vgl. Art. 15), wird er gerade in den dafür zuständigen Disziplinen (Publizistik-, Medien- und Kommunikationswissenschaft) nicht näher beschrieben (vgl. etwa das kommunikationswissenschaftliche Standardwörterbuch von Silbermann 1982, das Lexikon von Noelle-Neumann, Schulz und Wilke 1989 oder die internationale, kom-
358 munikationswissenschaftliche Enzyklopädie von Barnouw, Gerbner, Schramm, Worth und Gross 1989). Der Begriff „Medium“ (lateinisch: medium ,das Mittlere‘, aber auch ,der öffentliche Weg‘) wird häufig synonym mit den Begriffen „Mittel“ oder „Mittler“ gebraucht (vgl. z. B. Kluge 1985; Wersig 1985; Kledzik 1990). „Medium“ ist jedoch ein Sonderfall von „Mittel“. Der Begriff „Mittel“ ist ein Oberbegriff, der die Unterbegriffe „Artefakt“ und „Medium“ umfaßt. Zivilisationen lassen sich durch die Gesamtheit der Artefakte einer Gesellschaft samt ihrer Herstellung und ihres Gebrauchs bestimmen. Artefakte sind künstliche, von Menschen (selten von Tieren) hergestellte Produkte, die Resultat intentionalen Verhaltens sind. Wenn ein Artefakt einem bestimmten Zweck dient, wird es zum Instrument. Nicht jedes Instrument ist ein Artefakt. So kann beispielsweise ein Stein auf einem Weg als Instrument zum Zeichnen verwendet werden. Zielgerichtete Handlungen erfordern einsichtsvolle Vorbereitung, Planung und die Verwendung von Instrumenten. Sie unterliegen den praxeologischen Effizienzbedingungen, die von der ethisch-moralischen Bewertung der Handlungsziele unabhängig sind (vgl. dazu Art. 108). Ein dauerhaftes Objekt, das sowohl Instrument als auch Artefakt ist, wird als „Werkzeug“ bezeichnet (Posner 1989). Werkzeuge sind also materielle, von Menschen oder Tieren hergestellte künstliche Mittel, die zur Erreichung eines gegebenen Ziels dienen (vgl. Bühler 1918). Ein Beispiel für ein Werkzeug bei Tieren gibt Köhler (1917): Menschenaffen steckten zwei herumliegende Stöcke zu einem langen Stock zusammen und holten sich mit ihm eine Banane. Posner (1989, 255) betont, daß die Entscheidung, was als „Werkzeug“ (tool) zu gelten habe, von kultureller Übereinkunft abhängig sei: „Functions are assigned to tools by culturespecific conventions, and therefore the answer to the question of whether a given object is a tool is culture-dependent.“ Der Begriff „Medium“ bezieht sich dagegen auf Kommunikationsmittel, also auf die Mittel zur Weitergabe von Zeichen. Kommunikationsmittel sind zum einen technische Geräte (Instrumente, Apparate) und zum anderen Zeichenkörper (⫽ Zeichenträger). Die Setzmaschine oder die Druckerpresse sind zum Beispiel technische Geräte des Mediums Buch, einzelne Bücher fungieren als Zeichenträger. Bei etlichen Medien kann nicht zwi-
II. Aspekte der Semiose
schen technischem Gerät und Zeichenträger unterschieden werden (Beispiel: Fernsehen hier im Sinne von „Fernsehapparat“ ⫺ und nicht im Sinne von „Institution“ oder „Rezeptionstätigkeit“ ⫺ ist sowohl ein technisches Gerät als auch ein Zeichenträger). Posner (1985, 257), der sich aus semiotischer Perspektive mit dem Medienbegriff auseinandersetzt, definiert „Medium“ als „ein System von Kommunikationsmitteln, das wiederholte Kommunikation eines bestimmten Typs ermöglicht“. Oder genauer: als „ein System von Mitteln für die Produktion, Distribution und Rezeption von Zeichen, das den in ihm erzeugten Zeichenprozessen bestimmte gleichbleibende Beschränkungen auferlegt“. Beschränkungen (constraints) kennzeichnen die wechselseitige, unentrinnbare Abhängigkeit von Semioseart und Medienbeschaffenheit. Im allgemeinen werden Zeichenprozesse durch Medien zwar eingeschränkt (so werden z. B. durch das Medium Fernsehen keine Geruchsreize übermittelt), aber Zeichenerweiterungen sind ebenso möglich (z. B. durch medienspezifische Darstellungsformen wie etwa akustische Spezialeffekte). Semiosen müssen bei ein und demselben Medium auch nicht immer gleichbleibende Beschränkungen haben. Die technischen Funktionsmöglichkeiten von Medien bestimmen, wie sehr die Zeichenprozesse der technisch vermittelten Kommunikation denen der direkten Kommunikation ähneln. So kann das Medium Fernsehen Zeichenprozesse schwarz-weiß oder farbig vermitteln, wobei die farbige Übertragung von Zeichen der direkten Kommunikation näherkommt. Je nach Wissenschaftsgebiet lassen sich drei Cluster des Medienbegriffs unterscheiden: der sozialwissenschaftliche Medienbegriff, der naturwissenschaftliche Medienbegriff und der technologische Medienbegriff. 1.2.1. Der sozialwissenschaftliche Medienbegriff Dem sozialwissenschaftlichen Medienbegriff können drei der Medienbegriffe, die Posner (1985, 256 ff) auflistet, zugeordnet werden: der soziologische, der kulturbezogene und der kodebezogene. Der soziologische Medienbegriff bezieht sich auf soziale Institutionen. Posner gruppiert die sozialen Medien nach der Art der Zeichenprozesse (vgl. dazu die Ausführungen zum biologischen Medienbegriff). Visuelle Zeichenprozesse werden zum Beispiel durch soziale Medien wie Museen, Galerien oder
14. Technische Medien der Semiose
Bibliotheken, die Ausstellungen veranstalten, organisiert. Auch Videotheken und Kinos mit ihren Filmangeboten sind soziale Medien, die visuelle Semiosen prägen. Für auditive Zeichenprozesse sind zum Beispiel Konzertagenturen, Schallplattenfirmen, Hörfunkabteilungen oder Synchronstudios zuständig. Aber auch andere Semiosen werden durch spezielle soziale Medien organisiert: olfaktorische zum Beispiel durch Parfum- und Seifenhersteller mit solchen Vertriebsquellen wie Drogerien, Kosmetikabteilungen in Supermärkten oder Kaufhäusern, gustatorische zum Beispiel durch Nahrungsmittelindustrie und Gastronomie und taktile durch Sportvereine, Schwimmbäder, Saunas und Massagesalons. Der kulturbezogene Medienbegriff betrifft den Kommunikationszweck und bezieht sich im allgemeinen auf das, was in geistes- und sozialwissenschaftlichen Disziplinen „Gattung“, „Genre“ oder „Textsorte“ genannt wird. Posner (1985, 256) nennt folgende Beispiele: „So unterscheidet man nicht nur in der Zeitung, sondern auch in Hörfunk und Fernsehen zwischen Nachrichten, Kommentaren, Kritiken, Reportagen und Erzählungen. Mit dem gleichen Recht, mit dem man Bücher in Sachbücher und Belletristik einteilt, unterscheidet man bei Filmen Dokumentarfilme und Spielfilme und bei Musik E(rnste)-Musik und U(nterhaltungs)-Musik.“ Der kodebezogene Medienbegriff bezieht sich auf die Regeln, mit denen die Zeichenproduzenten ihren Botschaften Zeichenkörper und die Rezipienten den Zeichenkörpern Botschaften zuordnen (vgl. Art. 16 und 17). Auch hier bringt Posner Beispiele (1985, 257): „Um eine kodebezogene Einteilung handelt es sich, wenn eine Institution wie das Fernsehen eine „Abteilung Wort“ einrichtet oder ein internationaler Verlag sich in eine deutsche, englische und französische Abteilung gliedert. Kodebezogen ist in der westlichen Musik die Unterscheidung in homophone und polyphone sowie in tonale und atonale Musik, in der Malerei die Gegenüberstellung von gegenständlichen und nichtgegenständlichen Bildern, in der Architektur die Einordnung eines Bauwerks als romanisch bzw. neuromanisch vs. gotisch bzw. neugotisch vs. sachlich bzw. neusachlich usw. Die Entscheidung eines Verlags, ob er ein Buch auf Deutsch, Englisch oder Französisch herausbringt, eines Komponisten, ob er tonal oder atonal komponiert, eines Malers, ob er gegenständlich oder nichtgegenständlich malt, oder eines Architekten, ob er ein Haus in neuromani-
359 schem, neugotischem oder neusachlichem Stil baut, wird häufig als Entscheidung zwischen verschiedenen Medien der Kommunikation hingestellt.“ Zum kodebezogenen Medienbegriff gehören auch solche Medienbegriffe, die nach den Kriterien Informationshaltigkeit, Soziabilität und Fachbezogenheit differenziert werden. Das Kriterium Informationshaltigkeit trifft für McLuhans Unterscheidung in „heiße Medien“ und „kühle Medien“ (McLuhan 1964, 36 ff) zu. Ein „heißes Medium“ („hot medium“) bringt dichtere Informationen einer Art von Zeichen (z. B. der visuellen) als ein „kühles Medium“ („cool medium“). Deshalb müssen Rezipienten bei einem heißen Medium weniger „dabei sein“ und können passiv bleiben. Zu den heißen Medien zählt McLuhan das Radio, die Photographie und den Film. Die kühlen Medien vermitteln ⫺ so McLuhan ⫺ nur eine begrenzte Informationsmenge. Deshalb muß der Rezipient selbst aktiv werden. Kühle Medien sind Comics, Fernsehen und Telephon. Dem Ansatz von McLuhan wird häufig „Pseudowissenschaftlichkeit“ (vgl. z. B. Silbermann 1982) vorgeworfen. Seine Differenzierung in „heiße Medien“ und „kühle Medien“ ist umstritten. Seine Behauptungen sind weder für den Bereich der Zeichenpräsentation noch für den der Zeichenwirkung empirisch belegbar, da er ironischerweise sein zentrales Konzept „Zeichendichte“ („definition“) nur unzureichend erläutert („High definition is the state of being well filled with data“, McLuhan 1964, 36). Auch die Unterscheidung zwischen „Sprachmedien“ einerseits und „Signal-/Symbolmedien“ andererseits von WinterhoffSpurk (1989, 14⫺15), die die Art der Informationen betrifft, kann dem kodebezogenen Medienbegriff zugerechnet werden. Wenn verbale, „möglichst aber weitere, nonverbale Zeichen“ vermittelt werden, dann handelt es sich um Sprachmedien. Hierzu muß angemerkt werden, daß nonverbale Zeichen ohne verbale möglich sind, aber verbale nicht ohne nonverbale (vgl. Böhme-Dürr 1985; 1987). Zu den Sprachmedien gehören ⫺ so Winterhoff-Spurk ⫺ die mit (elektromagnetischen) Wellen fungierenden „Transportmedien“ Funk, Rundfunk, Telephon und Fernsehen (und etliche neue Medien wie z. B. Videotext und Bildschirmtext) und die auf langlebigen Trägern Zeichen konservierenden „Fixiermedien“ Film, Video, Schallplatte, Druck- und Schriftmedien, aber auch neue Medien wie
360 etwa Computerdisketten (zu den „Transport-“ und „Fixiermedien“, vgl. § 4.1.). Im Gegensatz zu den Sprachmedien erfordern die Signal- oder Symbolmedien „die vorgelagerte Übersetzung in andere als die bei der FTF[⫽ Face-to-face, K. B.-D.]-Kommunikation verwendeten Zeichensysteme“. Signal-/ Symbolmedien sind beispielsweise solche Transportmedien wie Lichtsignale, Flaggensignale und Rauchsignale und solche Fixiermedien wie Bilder, Denkmäler und Fotos. Die Unterscheidung in Sprachmedien versus Signal-/Symbolmedien von Winterhoff-Spurk ist nicht ganz unproblematisch, da auch die von ihm aufgeführten Sprachmedien zumindest durch ihre medienspezifischen, formalen Angebotsweisen eine Zeichenübersetzung verlangen. Unklar ist auch, weshalb Bilder und Fotos nur als Signal-/Symbolmedien aufgeführt werden. Sie könnten ⫺ ähnlich wie die Druck- und Schriftmedien ⫺ auch Sprachmedien sein, z. B. dann, wenn auf ihnen Sprachliches zu sehen ist. Verschiedene Autoren weisen darauf hin, daß Medien nach Art ihrer sozialen Kodierung (nach Art des sozialen Umfelds) unterschieden werden sollten (Maletzke 1965; vgl. auch Schulz 1975; Salomon 1979). Maletzke nennt vier soziale Kategorien: 1. Freiheit oder Bindung in der Zeit (der Zeitpunkt der Rezeption bleibt dem Rezipienten überlassen, oder der Kommunikator setzt den Zeitpunkt für die Rezeption fest), 2. räumliche Situation (der Rezipient nimmt Informationen in einer bestimmten Umgebung, zu Hause oder im Rahmen einer „Veranstaltung“ in einem speziellen Raum auf), 3. soziale Situation (der Rezipient empfängt die Information als einzelner, in der Intimgruppe oder in einem versammelten Publikum) und 4. „Konserve“ oder „Live“ (zeitliche Distanz zwischen Ereignis und Erleben oder Gleichzeitigkeit). Die anderen Kategorien von Maletzke „Wahrnehmung“ (z. B. optische versus akustische Medien) und „Verhaltensfreiheit oder -bindung“ (z. B. optische Medien, die den Rezipienten zwingen, sich starr der Aussagequelle zuzuwenden, versus akustische Medien, deren Schall sich kugelförmig ausbreitet und den Raum ausfüllt, und die deshalb dem Rezipienten ermöglichen, sich frei im Raum zu bewegen) lassen sich dem physikalischen Medienbegriff zuordnen (s. u. § 1.2.2.). Knilli (1979, 237) unterscheidet zwischen „Ortsmedien“ und „Zeitmedien“. Ortsmedien unterteilen sich in „linienhaft gespeicherte“ (von einer Ortskoordinate getragene
II. Aspekte der Semiose
Information: z. B. Kerbstock, Knotenschrift, einspurige Nadel-, Licht- und Magnettonaufzeichnung), „flächenhaft gespeicherte“ (von zwei Ortskoordinaten getragene Information: Schriftzeichen in Büchern, Zeitschriften, auf Flugschriften und Plakaten, Zeichnungen und Fotografien, mehrspurige Nadel-, Lichtund Magnettonaufzeichnungen) und „räumlich gespeicherte“ (von drei Ortskoordinaten gespeicherte Information: Plastik, Architektur, Bühne, Diorama). Zeitmedien lassen sich einteilen in 1. solche mit Zeitkoordinate und irrelevanter Ortskoordinate: der Standort der Quelle für akustische, elektrische und elektromagnetische Schwingungen ist für die nur von der Zeitkoordinate getragene Information irrelevant (Beispiele: Funk- und Fernsehsendungen, Schallplatten- und Tonbandwiedergaben), 2. solche mit Zeitkoordinate und einer Ortskoordinate als Informationsträger (Radiosendungen im Ätherkrieg, für die der Standort des Senders eine Information tragende Ortskoordinate darstellt), 3. solche mit Zeitkoordinate und zwei Ortskoordinaten als Informationsträger (Schreibvorgang, Leseakt, Kino- und Fernsehbild, Stereophonie) und 4. solche mit Zeitkoordinate und drei Ortskoordinaten als Informationsträger (z. B. Bühnengeschehen, Gestik, Mimik). Auch Wersig (1985) nennt lokale und temporale Kriterien (räumliche Distanz, zeitliche Distanz). Weitere soziale Kriterien sind der Streuungsgrad (Menge der Rezipienten, die durch eine Aussage mit einem Kommunikationsmittel relativ gleichzeitig erreichbar sind), die Zielgenauigkeit (z. B. wird bei Kommunikationsmitteln mit Verteilcharakter eine Aussage relativ gleichzeitig relativ vielen Personen zugänglich gemacht; bei Kommunikationsmitteln mit Punktgenauigkeit wird nur ein spezieller Rezipient adressiert, auch wenn sie ⫺ wie der Ausrufdienst „Europiep“ ⫺ technisch Verteilcharakter haben), der Grad an Interaktivität (vgl. § 4.4.) und die auch dem physikalischen Medienbegriff zugehörige „Bandbreite“ (sie bestimmt, welcher Teil des Spektrums möglicher Aussageformen mit dem Kommunikationsmittel gleichzeitig bewältigt werden kann; Beispiele: Fest-/Einzelbildkommunikation versus Bewegtbildkommunikation). Medien lassen sich gemäß ihrer Zeitdimension (Simultanität oder Sukzessivität) und bezüglich ihrer Ortsdimension (Kopräsenz von Sender und Empfänger oder Ortsverschiedenheit von Sender und Empfänger) klassifizieren (vgl. Winterhoff-Spurk 1989,
14. Technische Medien der Semiose
14). Simultanität definiert sich über die zeitliche Präsenz von Sender und Empfänger. Allerdings, so Winterhoff-Spurk, wird die zeitliche Präsenz durch die Fixierung des Mitzuteilenden in Bilder, Symbole und Schriften hinfällig. Durch eine Fixierung kann es zu einer Änderung verschiedener publizistischer Kodes kommen (zu den publizistischen Kodes vgl. Bentele 1981; Bystrina 1981). Kopräsenz hängt vom räumlichen Abstand ab, der im allgemeinen für die direkte Wahrnehmbarkeit von Botschaften notwendig ist (zu verschiedenen Einteilungen von räumlicher Entfernung vgl. Hall 1966). Simultanität und Kopräsenz gibt es vor allem bei der direkten Semiose. Eine Signaländerung und Umkodierung der Zeichenträger (vgl. § 1.3.3.) ist in der direkten Semiose nicht erforderlich. Ein Beispiel für Zeit- und Ortsgleichheit (Simultanität und Kopräsenz) bei medialer Kommunikation ist die Lautübertragung durch ein Hörrohr, wenn die Äußerung einer Botschaft und ihr Empfang zum selben Zeitpunkt stattfinden, weil Sender und Empfänger nur wenig voneinander entfernt sind (die „public distance“ beträgt bis zu 7,50 Metern, vgl. Art. 5). Sukzessivität und Kopräsenz liegen beispielsweise bei Denkmälern und Schildern vor, Simultanität und Ortsverschiedenheit bei Rauch- und Flaggensignalen, bei Liveübertragungen im Hörfunk und Fernsehen oder beim Telephon und Sukzessivität und Ortsverschiedenheit bei Printmedien, Filmen oder Video-Bändern. Die fachbezogenen Medienbegriffe (dem kodebezogenen Medienbegriff zugehörig) sind differenzierbar in den unspezifischen „universalistisch-kulturphilosophischen“ Medienbegriff („jedwedes Mittel oder Zeichen/ Symbol menschlicher Erfahrung, Erkenntnis und Handlung, nicht zuletzt die Sprache selbst“), den „didaktischen“ („all jene Werkzeuge und Funktionen …, die in einem LehrLern-Prozeß spezifische Aufgaben und Funktionen erfahren oder explizit übernehmen“ wie etwa die Kreide, die Wandtafel oder der Lehrer selbst) und den „publizistik-, bzw. kommunikationswissenschaftlichen“ (der häufig mit dem technologischen und dem soziologischen Medienbegriff gleichgesetzt werden kann) (vgl. Kübler und Würzberg 1982, 96; zum didaktischen Medienbegriff vgl. auch Kledzik 1990). 1.2.2. Der naturwissenschaftliche Medienbegriff Zum naturwissenschaftlichen Medienbegriff gehören folgende Medienbegriffe: der biolo-
361 gische, der chemische und der physikalische (für Definitionen und Beispiele vgl. Posner 1985, 255). Der biologische Medienbegriff orientiert sich an den Körperorganen, die für die Zeichenproduktion, -distribution und -rezeption zuständig sind. Somit werden z. B. hinsichtlich des Rezeptionsvorgangs unterschieden: visuelle Medien (Rezeption von Zeichen über die Augen), auditive Medien (Rezeption von Zeichen über die Ohren), olfaktorische Medien (Rezeption von Zeichen über die Nase), gustatorische Medien (Rezeption von Zeichen über die Geschmacksknospen im Mund) und taktile Medien (Rezeption von Zeichen über den Tastsinn der Haut). Der Wahrnehmungskanal (vgl. § 1.3.1.) ist für eine Klassifizierung der biologischen Medien entscheidend (siehe auch Art. 6⫺11). Bei längeren Medienketten mit mehreren Umformungsprozessen (z. B. Tonbandaufnahmen von eigenen Videofilmen) werden verschiedene Produktions- und Rezeptionsorgane aktiviert, „es sei denn die Erfordernisse eines bestimmten Rezeptionsorgans werden als maßgeblich für die Adäquatheit der Umformungen angesehen“ (Posner 1985, 263). Der chemische Medienbegriff ist ein Sonderfall des physikalischen. Der physikalische Medienbegriff betrifft chemische Elemente und physikalische Zustände, die notwendig sind, um das Produktionsorgan des Senders mit dem Rezeptionsorgan des Empfängers physisch zu verbinden. So bedienen sich visuelle Zeichenprozesse elektromagnetischer Felder, die optische Wellen transportieren. Die entsprechenden Zeichensysteme sind dann „optische Medien“ (von der Entwicklung von optischen Telegraphen, die es bereits bei den Römern gab, bis zur faseroptischen Nachrichtenübermittlung, vgl. Geretschläger 1983; s. auch Oberliesen 1982). „Akustische Medien“ sind auditive Zeichensysteme, die für die physische Verbindung zwischen Kommunikator und Rezipient akustisch leitfähige feste, flüssige oder gasförmige Körper benötigen (für ein ausführliches Beispiel einer Übertragungskette von unregelmäßigen Wellen in Töne, vgl. Geretschläger 1983, 86⫺87). Olfaktorische Zeichensysteme sind besonders auf zusammengesetzte gasförmige Substanzen angewiesen, gustatorische auf flüssige und feste Substanzen (vgl. Art. 9) und taktile auf die Übertragung haptischer Reize durch das physische Medium Haut (vgl. Art. 8).
362 1.2.3. Der technologische Medienbegriff Der technologische Medienbegriff „charakterisiert die Zeichenprozesse nach den technischen Mitteln, die bei der Erzeugung von Zeichenprozessen zur Modifikation der Kontaktmaterie [z. B. Licht- und Schallwellen, elektrische und elektromagnetische Wellen, vgl. § 1.3.2., K. B.-D.] eingesetzt werden, die die physische Verbindung zwischen dem Produktionsorgan des Senders und dem Rezeptionsorgan des Empfängers herstellt“ (Posner 1985, 256). Im allgemeinen ist mit dem Terminus „Medium“ der technologische Medienbegriff gemeint („the term [medium] […] is increasingly being confined to technical media, particularly the mass media“, s. O’Sullivan, Hartley, Saunders und Fiske 1985, 134; vgl. auch Wersig 1985; Winterhoff-Spurk 1989). Die Massenmedien (vor allem Hörfunk, Fernsehen und Presse) sind die bekanntesten Beispiele für den technologischen Medienbegriff. Massenkommunikation „setzt sowohl voraus, daß die Kommunikationsteilnehmer der Zahl nach unbegrenzt oder füreinander nicht personell identifizierbar sind als auch daß sie in einem bestimmten Sinn eine Masse bilden. Dabei muß es sich um eine Menschenmenge von einer bestimmten Mindestgröße handeln, die dispers ist, d. h. deren Mitglieder sich nicht zur gleichen Zeit am gleichen Ort befinden […]. Öffentlichkeit und Dispersheit der Teilnehmer einer Kommunikation sind hinreichende Kriterien zur Definition von Massenkommunikation“ (Posner 1985, 253⫺ 254; für eine ähnliche Definition vgl. Bretz 1971). Auch die sogenannten „Neuen Medien“ (z. B. Bildschirmtext oder Telefax) werden meist mit den „neuen Techniken der Information und Kommunikation“ gleichgesetzt (Ratzke 1982, 14; vgl. auch Brepohl 1985). Obwohl sich die meisten Kommunikationsexperten über die Basisliste der Neuen Medien einig sind (dazu gehören vor allem Videorecorder, Bildplattenspieler, Computer, Bildschirmtext, Videotext, Satellitenfernsehen und Kabelfernsehen) und klar ist, daß die wissenschaftliche Analyse der Neuen Medien ohne die Berücksichtigung der Computertechnik nicht sinnvoll wäre (vgl. Abb. 14.1), ist „ein verläßliches begriffliches Instrumentarium zu ihrer Behandlung noch nicht vorhanden“ (Degenhardt 1986, 5; vgl. auch Meyn 1984; Rice 1984; Ratzke 1982). Meier und Bonfadelli (1987, 171) unterscheiden neue Distributionssysteme (z. B. Fernmelde-/
II. Aspekte der Semiose
Abb. 14.1: Infrastruktur eines drahtlosen lokalen Funknetzes (ISDN), das einen transparenten und sicheren Zugriff auf benötigte Information von beliebiger Stelle aus, insbesondere auch über mobile Stationen, durch Funkanbindung gewährleistet (siehe Diehl und Held 1995, 72).
Direkt-Satelliten, CATV-Systeme, ISDNNetz, Low-power UKW-Radio, Cellular Radio), neue Empfangs- und Speichersysteme (z. B. VCR, Walkman, Compact-Disc, Bildplattenspieler, Personal Computer) und integrierte Verknüpfungen derartiger Teilkomponenten (z. B. Videotext, Bildschirmtext, PayTV). „Technik“ wird „als eine Einheit von Apparaten, Anlagen, Geräten und ähnlichem, kurz: als Einheit zweckhafter Artefakte“ verstanden (Rühl 1988, 349). Pross (o. J., 128 ff) unterscheidet zwischen „sekundären Medien“, bei denen nur der Kommunikator ein Gerät braucht (z. B. optische Telegraphie, Plakat, Brief), und „tertiären Medien“, bei denen Kommunikatoren und Rezipienten Geräte in Anspruch nehmen (z. B. Telephon, Schallplatte, Radio, Fernsehen). Sein Begriff „primäre Medien“, der sich auf Mittel des menschlichen Elementarkontakts (wie etwa Mimik und Gestik) bezieht, gehört nicht zur technischen Semiose, da es sich dabei nicht um „technische Medien“, sondern um „direkte Kommunikation“ handelt (vgl. § 1.1.). Rapp (1988) betont, daß alles, was mit technischen Mitteln geschieht, direkt oder indirekt auf handelnde Individuen zurückgeht, deren Tun durch bewußte oder unbewußte Absichten und Zielsetzungen bestimmt wird (vgl. auch Slack 1984; Steinbuch 1966). Langenheder schreibt dazu (1988, 262 f): „Es gibt
14. Technische Medien der Semiose
keine Technik an sich, es gibt immer nur die Technik in ihrem Verwendungszusammenhang.“ Technik zeichnet sich demnach durch zwei Merkmale aus: durch Artefakte (Geräte, Werkzeuge, Instrumente) und durch Verwendung im Rahmen zweckrationalen Handelns. Der technologische Medienbegriff ist eng mit dem biologischen Medienbegriff verknüpft, da sich die technischen Mittel auf die Körperorgane beziehen lassen, die für die Produktion, Distribution und Rezeption von Zeichen verantwortlich sind. Die Apparatespezifika (medienspezifische Darstellungsformen, Signifikanten der medialen Semiose; vgl. Berger 1987) legen fest, welche Sinnesmodalitäten bei der Rezeption aktiviert werden und wie Wahrnehmung eingeschränkt oder erweitert werden kann. 1.2.4. Technische Medien: Beispiele Das wesentliche Kriterium für „technische Medien“ ist das Instrument (das Gerät, der Apparat, die Anlage), das für die Produktion, Distribution und Rezeption von Zeichen bestimmt ist (vgl. dazu auch die Begriffsbestimmung von Posner in § 1.2.3.). Beispiele für technische Medien sind Papier und Bleistift, Mikrophon, Diaprojektor, Litfaßsäule, Leuchtspurengeschoß u. dgl. Selbst Kutschen und Autos (technische Konstruktionen) können zu den technischen Medien gezählt werden, wenn sie zur Erzeugung von Zeichen dienen (vgl. Enninger und Scott 1985). Posner (1985) hat die technischen Medien auf verschiedene Zeichenprozesse bezogen. Von ihm stammen die meisten der nachfolgenden Beispiele. In visuellen Zeichenprozessen (zum optischen Kanal vgl. Art. 6 und 12) sind technische Medien u. a. Brille, Opernglas, Schreibmaschinen und Typoskripte, Textcomputer und Disketten, Photokameras und Diapositive oder Photos, Filmkameras mit Filmlabors, Schneidetischen, Filmstreifen, Filmprojektoren und Leinwänden sowie Druckmaschinen mit Druckerzeugnissen. Visuelle Zeichensysteme können je nach Apparatetypus zum Beispiel differenziert werden in Bildschirmmedien, Printmedien oder Projektionsmedien. Bei den Produkten dieser Apparate handelt es sich um solche technische Medien wie Filme und Videokassetten, Schreibmaschinenseiten und Zeitungen, Photos und Dias. In auditiven Semiosen (zum akustischen Kanal vgl. Art. 7) benutzt man als technische Mittel zum Beispiel Musikinstrumente, Kas-
363 settenrecorder mit Kassetten, Hupen oder Hörgeräte, in olfaktorischen (zu den chemischen Kanälen vgl. Art. 9) Duftspender, Zerstäuber oder Parfumfläschchen, in gustatorischen Geräte und Produkte der Zubereitung, des Servierens und des Verzehrs von Essen (Herde mit Töpfen, Warmhalteplatten, Besteck) und in taktilen Massagebürsten, Boxhandschuhe oder Lippenstifte (zum taktischen Kanal vgl. Art. 8). Kein technisches Medium ist zum Beispiel der Sand, auf dem ein Fußabdruck zu sehen ist. Obwohl durch den Sand Zeichen vermittelt werden, braucht man dazu keinen artifiziellen Gegenstand. Auch die Sprechwerkzeuge oder nonverbalen Kommunikationsmittel (wie z. B. Gestik oder Mimik) sind keine technischen Medien, weil sie kein technisches (⫽ künstliches) Gerät erforderlich machen. Wenn allerdings ein Gehörgeschädigter ein Hörgerät oder einen Lip-Reading Device benutzt, dann wären letztere technische Medien. 1.3. Begriffsnachbarn des technologischen Medienbegriffs Folgende Begriffe werden oft mit dem Begriff „Medium“ gleichgesetzt oder zumindest eng mit ihm assoziiert: „Kanal“, „Modalität“, „Kontaktmaterie“ und „Zeichenkörper“. Wie sind sie definierbar? 1.3.1. Kanal und Modalität In der kommunikationswissenschaftlichen Fachliteratur wird mitunter zwischen „Medium“ und „Kanal“ nicht unterschieden (für ein deutliches Beispiel, s. Posner 1985, 264). Vor allem beim biologischen Medienbegriff („visuelles Medium“ ⫽ „visueller Kanal“) und beim physikalischen Medienbegriff („optisches Medium“ ⫽ „optischer Kanal“), aber auch beim technologischen Medienbegriff („das Medium Fernsehen“ ⫽ „der Fernsehkanal“) finden Gleichsetzungen statt. Wulff (1979, 65) unterscheidet sie folgendermaßen: „Ein Kanal […] ist der materielle Träger, in dem Information sich ausbreitet; ein Medium ist dagegen die Form, die eine Information hat und die sie wesentlich erst zur Information macht.“ Damit kann zum einen zwischen verschiedenen (Zeichen-)Ereignissen in einem Kanal differenziert werden und zum anderen zwischen verschiedenen Kanälen bei einem Medium. Auch die Begriffe „Kanal“ und „Modalität“ werden von vielen Autoren synonym verwendet. So schreibt Scherer (1977, 233):
364 „Man kann die dem Menschen zur Informationsvermittlung zur Verfügung stehenden Übertragungskanäle oder -modalitäten durch die jeweils zur Rezeption benutzten Sinnesorgane charakterisieren und somit auditive, visuelle, olfaktorische, taktile, thermale und gustatorische Mitteilungen unterscheiden“ (für ähnliche Gleichsetzungen vgl. auch Graumann 1972; Schreiber 1980). „Kanal“ wird jedoch im allgemeinen als Oberbegriff für die Begriffe „Modalität“ und „Kontaktmaterie“ verwendet (vgl. Art. 5 § 1.). Der Terminus „Modalität“ (mitunter auch als „Ausdrucksmodalität“, „Übertragungsmodalität“ oder „Sinnesmodalität“ bezeichnet) bezieht sich auf Körperorgane, vor allem auf die der Rezeption. Während Modalitäten meist mit lateinischen Begriffen differenziert werden (z. B. auditive oder visuelle Modalität), werden Kanäle und Kontaktmaterien meist mit griechischen Begriffen gekennzeichnet (z. B. akustischer oder optischer Kanal). Die Sinnesmodalität ist das Kriterium beim biologischen Medienbegriff. Wenn bei der Wahrnehmung zum Beispiel das Ohr entscheidend ist, dann ist die Modalität auditiv (die Bezeichnung „auditiver Kanal“ ist, da es sich um einen Oberbegriff handelt, ebenso möglich). Unter dem Produktionsaspekt könnte man bei einer Übertragung von Lauten, die über den Vokaltrakt kommen (wie etwa Stöhnen oder Pfeifen), auch von „vokaler Modalität“ oder „vokalem Kanal“ sprechen. Wenn menschliche Stimmen nicht ungehört verschallen, sondern wahrgenommen werden, ist der Übertragungsweg (die Modalität bzw. der Kanal) vokal-auditiv (bzw. artikulatorisch-auditiv, da Stimmlaute über Artikulationsorgane produziert werden). 1.3.2. Kontaktmaterie Der Begriff „Kontaktmaterie“ ist ⫺ wie der Begriff „(Sinnes-)Modalität“ ⫺ ein Unterbegriff von „Kanal“ und bezieht sich auf physikalische Übertragungskörper, also auf Lichtwellen, Schallwellen, Druck, thermodynamischen Energietransport und dergleichen (vgl. dazu die Ausführungen zum physikalischen Medienbegriff). Je nach Art der physikalischen Kontaktmaterie kann man diverse Kanäle unterscheiden: optisch, taktil, akustisch, elektrisch, thermisch, usw. (vgl. Eco 1987 a, 234). Die Kontaktmaterie (Kanal) ist nicht mit dem „technischen Instrument“ (Gerät, Apparat) oder dem Zeichenträger (Zeichenkörper) identisch, auch wenn Eco (1972, 167) Bücher und Manuskripte als „Kanäle“ be-
II. Aspekte der Semiose
zeichnet. Der Unterschied zwischen Kanal und Apparat wird bei Kommunikationsketten, in denen ein technisches Gerät eingesetzt wird, deutlich: „Eine solche Kommunikationskette [Informationsquelle, Sendegerät, Signal, Kanal, Empfangsgerät, Botschaft, Empfänger, K. B.-D.] können wir aber auch bei einer Kommunikation durch das Radio feststellen: Die Informationsquelle ist der Sprecher der Botschaft, der, nachdem er eine bestimmte Menge von mitzuteilenden Ereignissen identifiziert hat, diese Ereignisse dem Sendegerät (Mikrophon) zukommen läßt, das sie in physikalische Signale umwandelt, die durch den Kanal geschickt werden (Hertzwellen) und von einem Empfangsgerät aufgefangen werden, welches sie wieder in Botschaft (artikulierte Laute) verwandelt, die der Empfänger erhält“ (Eco 1972, 48). Die Kontaktmaterie spielt in den verschiedenen Sinnesmodalitäten ganz verschiedene Rollen. So können z. B. beim Schreibtelegraphen, bei dem die Kontaktmaterie ein Elektromagnet ist, die Schriftzeichen auf einem Papierstreifen visuell oder haptisch (Buchdrucklettern als eine Art Sendeschablone) produziert werden (vgl. Oberliesen 1982, 106). 1.3.3. Zeichenkörper Der Zeichenkörper (⫽ Zeichenträger) ist (in der Erläuterung von Morris 1973, 424) ein besonderes Ereignis oder Objekt, das als Zeichen funktioniert. So kann etwa ein einzelnes physikalisches Ereignis ⫺ wie z. B. ein Ton oder eine Bewegung ⫺ Zeichenträger sein (vgl. Morris 1973, 96). Zeichenträger, die Teil eines Zeichens sind, werden meist auf die semantische Dimension reduziert, obgleich sie auch mit der syntaktischen und der pragmatischen Dimension der Semiose verbunden sind. Ein Zeichenträger kann eindeutig sein (wenn er nur ein Signifikat hat) oder mehrdeutig (Morris 1973, 97). Zeichenträger besitzen außer den kodierten Merkmalen zusätzliche Attribute, deren Einbeziehung in die Semiose zu Interferenzen mit den kodierten Botschaften führen kann. Diese zusätzlichen Attribute erhalten oft eine ästhetische Funktion und können die kodierte Botschaft verstärken (Posner 1982, 120 ff). „Poetisch“ hervorgehobene Botschaften zeichnen sich durch Mehrdeutigkeit aus und setzen Zeichenträger absichtlich so ein, daß ihre Mitteilung verändert wird (Eco 1987 b). Beobachtbare, materielle Zeichenkörper werden durch technische Medien (Apparate) über lokale und temporale Distanzen vermit-
14. Technische Medien der Semiose
telbar. Bei großen räumlichen und zeitlichen Entfernungen kommt es zu Signalveränderung und Umkodierung, die die Botschaft verändern können. So werden zum Beispiel bei einer Fernsehübertragung bereits beim Sender durch das Mikrophon Lautsignale verstärkt und im Studio durch das Abspielgerät und das Mischpult Zeitabläufe modifiziert. Der Empfänger kann Lautsignale durch einen Lautsprecher regulieren und durch ein Videogerät zeitliche Abfolgen ändern.
2.
Geschichtliche Entwicklung der technischen Medien
Rogers (1986) unterscheidet vier Perioden in der Entwicklung der technischen Medien: die Periode der Schreibmedien (vgl. Abb. 14.2), die der Druckmedien, die der Telekommunikationsmedien und die der interaktiven Medien. Diese Einteilung bezieht sich auf visuelle und auditive Zeichenprozesse (siehe auch Art. 159). Auffallend ist dabei, daß die Dauer der einzelnen Perioden immer kürzer wird. Die Zeit zwischen der Erfindung eines
365 technischen Mediums und seiner Verbreitung wird ebenfalls von Periode zu Periode kürzer. Bemerkenswert ist ferner eine Kumulation von Leistungen der Medien in der Geschichte der Kommunikationstechnologien (Rogers 1986, 26: „the history of communication is the story of more“). Neuere Medien haben ältere im allgemeinen nicht vollständig ersetzt, obgleich einige ältere Medien beim Vorhandensein neuerer Medien wesentlich seltener genutzt werden (vgl. Art. 26 § 4.). So werden zum Beispiel Botschaften in Zeitungsredaktionen nur selten über die häufig noch vorhandene Rohrpost vermittelt, weil Redakteure eher zum Telephon greifen. In der Schiffahrt spielt Telegraphie keine bedeutsame Rolle mehr, denn Nachrichten werden zumeist über Funk empfangen und gesendet. Zum Teil haben sich auch die Funktionen älterer Medien nach Einführung der neueren geändert. Riepl (1913, 4 f) beschreibt diesen Sachverhalt sehr anschaulich: „Trotz aller solcher Wandlungen ist indessen festzustellen, daß neben den höchstentwickelten Mitteln, Methoden und Formen des Nachrichtenverkehrs in den Kulturstaaten auch die einfachsten Urformen bei verschiedenen Na-
Abb. 14.2: Ägyptische Schreibstube (seit dem 3. Jahrtausend v. Chr.). Die hieroglyphische Inschrift im oberen Bildteil besagt, daß der Schreiberlehrling die Aufgabe hatte, den Raum bei großer Hitze mit Wasser zu besprengen (vgl. Schmitt 1990, 9).
366
II. Aspekte der Semiose
Abb. 14.3: Sumerische Buchungstafel aus der Zeit um 3100 v. Chr. Auf der Buchungsseite erkennt man die Kombination von Ideogrammen (Wortbildzeichen) mit Zeichen des sumerischen Zahldarstellungssystems (vgl. Haarmann 1990, 151 f).
turvölkern noch heute im Gebrauch sind, und um sie zu finden, braucht man nicht die Südseeinseln oder auch nur das Innere Marokkos aufzusuchen, in Europa selbst, in Gegenden, die sich schon vor den Römern einer verhältnismäßig hoch entwickelten Kultur erfreuten, so bei den Albanesen [sic] z. B. ist
das Nachrichtenwesen bis heute fast auf der Urstufe stehen geblieben. Andererseits ergibt sich gewissermaßen als ein Grundgesetz der Entwicklung des Nachrichtenwesens, daß die einfachsten Mittel, Formen und Methoden, wenn sie nur einmal eingebürgert und brauchbar gefunden sind, auch von den voll-
14. Technische Medien der Semiose
kommensten und höchst entwickelten niemals wieder gänzlich und dauernd verdrängt und außer Gebrauch gesetzt werden können, sondern sich neben diesen erhalten, nur daß sie genötigt werden, andere Aufgaben und Verwertungsgebiete aufzusuchen.“ Auch im Informationszeitalter der interaktiven Medien sind weder Schrift- oder Druckmedien noch Telekommunikationsmedien verschwunden, sondern werden allenfalls anders genutzt (für Beispiele zum Komplementaritätsgesetz von Riepl vgl. Bentele 1987, 85 f). Obwohl häufig davon ausgegangen wird, daß für neuere Medien erst ein Absatzmarkt geschaffen werden muß und sich erst dann die kulturellen Rezeptionsfertigkeiten entwikkeln, kommt Koszyk (1987) zu dem Schluß, daß bis weit ins 18. Jahrhundert soziale Faktoren die Verbreitung von (Druck-)Medien bedingt haben. Auch für spätere (Medien-) Entwicklungen gilt, daß eher die gesellschaftliche Struktur die Funktion der Medien bestimmt hat als umgekehrt (Beniger 1986, 435: „The Information Society has not resulted from recent changes, as we have seen, but rather from increases in the speed of material processing and of flows through the material economy that began more than a century ago. Similarly, microprocessing and computing technology, contrary to currently fashionable opinion, do not represent a new force only recently unleashed on an unprepared society but merely the most recent installment in the continuing development of the Control Revolution“). 2.1. Die Periode der Schreibmedien Rogers (1986) legt die Periode der Schreibmedien auf 4000 v. Chr. bis heute fest. Vermutlich gab es bereits 22 000 v. Chr. die ersten Höhlenmalereien (abstrakte Zeichen datieren sogar bis 32 000 v. Chr. zurück), und technische Schreibmedien existieren seit mindestens 6000 Jahren (4000 v. Chr.), als die sumerischen Tempelschreiber auf Knettafeln schrieben (vgl. Abb. 14.3). Durch neuere Verfahren der Altersdatierung muß man davon ausgehen, daß die im Balkangebiet gefundene Sakralschrift, die aus 200 individuellen Schriftzeichen (darunter Symbolen für Zahlen und Maßeinheiten) besteht, sogar noch älter ist und aus der Zeit 5300 bis 3500 v. Chr. stammt (Haarmann 1990; siehe auch Art. 32 § 7.C). Für die Zwecke des Alltags verwendete man in der Antike gern Wachstafeln (vgl. Abb. 14.4). Sie hatten eine viereckige Vertiefung, die mit Wachs ausgefüllt war und
367
Abb. 14.4: Wachstafel-Notizbuch, wie es bei den gebildeten Griechen und Römern in Gebrauch war. Geschrieben wurde mit einem Stift (lat. stilus), der an einem Ende spitz und an dem anderen abgeflacht war. Mit der Spitze schrieb man in das weiche Wachs; wenn man den Text nicht mehr brauchte, wurde mit dem stumpfen Ende wieder alles ,ausradiert‘. Diese Wachstäfelchen ließen sich durch Löcher an den Ecken zu einem Notizbuch zusammenbinden (vgl. Schmitt 1990, 10).
wechselnde Texte aufnehmen konnte. Im Jahre 1041 (n. Chr.) erfand der Chinese Pi Sheng bewegliche Lettern für den Buchdruck. Im 13. Jahrhundert (1241) wurden in Korea die Knettypen durch Metalltypen ersetzt (Pool 1983). Bis zur Erfindung der Gutenberg-Bibel im 15. Jahrhundert wurden wichtige Bücher (wie etwa die Bibel oder die Werke von Aristoteles oder Homer) zumeist von Klerikern und Hofbeamten handschriftlich kopiert und waren deshalb nur in geringen Mengen verfügbar. In den Bibliotheken des Mittelalters wurden Bücher, weil sie so wertvoll waren (selbst gute Kopierer schafften nicht mehr als zwei im Jahr), angekettet (vgl. Rogers 1986). 2.2. Die Periode der Druckmedien Die Periode der Druckmedien beginnt mit der Erfindung des Buchdrucks. Unabhängig von den Erfindungen in China und Korea hatte in der Mitte des 15. Jahrhunderts der Mainzer Johann Gensfleisch („Gutenberg“), ein Stempelstecher, Münzpräger und Goldschmied, die Idee, gleichförmige Einzellettern aus Blei zu gießen, die mehrere Vorteile gegenüber den herkömmlichen hölzernen hatten. Die beweglichen Metallbuchstaben hatten eine längere Lebensdauer, sie waren häufig wiederverwendbar und sie sicherten eine regelmäßige Zeilenführung. Außerdem be-
368
II. Aspekte der Semiose
Abb. 14.5: Die früheste Darstellung einer Druckerei in Europa (Holzschnitt aus dem Danse macabre von Lyon, 1499) zeigt nicht nur die Setzer- und Druckerwerkstatt sondern auch die angeschlossene Buchhandlung (vgl. Giesecke 1991, 70).
mühte sich Gutenberg um eine Verbesserung der Druckerschwärze und verwendete eine spindelförmige Presse, die ähnlich wie Weinoder Münzpressen funktionierte (Jürgens 1984). Durch den Buchdruck wurde die massenhafte Verbreitung von Texten möglich (vgl. Abb. 14.5). Die ersten zwei Zeitungsjahrgänge im Jahre 1609 (die Wochenzeitungen Aviso und Relation) machten Deutschland zum Ursprungsland der Zeitung. Auch in anderen europäischen Ländern gab es bereits zu Beginn des 17. Jahrhunderts regelmäßig erscheinende Zeitungen (in den Niederlanden 1618, in Belgien 1620, in England 1621, in der Schweiz 1622, in Frankreich 1631 und in Italien 1643). In den Vereinigten Staaten erschienen sie zuerst 1690 und in Rußland 1703. Die Ursprünge der Zeitschriften liegen ebenfalls im 17. Jahrhundert. Im 18. Jahrhundert verbreiteten sich die zur Sittsamkeit auffordernden Moralischen Wochenschriften, die daraus entstehenden ersten Frauenzeitschriften und literarische Zeitschriften. Sie hatten eine Durchschnittsauflage von 500 bis 1000 Exemplaren. Der Beginn der Massenpresse, die sich vor allem durch Anzeigen finanzieren konnte, war 1833 mit der New
York Sun von Benjamin Day. Die sensationslüsterne, nur ein Cent teure Penny Press hatte eine Auflage von 30 000 bis 40 000 Exemplaren. Fortschritte in Satz- und Drucktechnik ⫺ wie etwa die Schnellpresse von 1811, die Daguerre-Photographie von 1839, der Rotationsdruck von 1860, die Setzmaschine von 1869 und die gebrauchsfertige Linotype von 1884, vgl. Abb. 14.6 ⫺ sowie schnellere Distributionswege (wie z. B. die Eisenbahn ab 1835) sorgten dafür, daß Zeitungen immer mehr Leser(innen) fanden (Wilke und NoelleNeumann 1989; Rogers 1986; zur Entwicklung in Satz- und Drucktechnik vgl. auch § 5.). 2.3. Die Periode der Telekommunikationsmedien Rogers (1986) nennt als Beginn der Periode der Telekommunikationsmedien das Jahr 1844, als Samuel Morse eine elektrische Telegraphielinie entlang der 64 km langen Bahnlinie Washington⫺Baltimore baut. Unter Telegraphie versteht man „die Übermittlung von Nachrichten mittels Leiter oder drahtlos durch eine verabredete Zeichensprache“ (Geretschläger 1983). Der elektrische Telegraph hatte gegenüber dem optischen Telegraphen,
14. Technische Medien der Semiose
Abb. 14.6: Den Durchbruch zur maschinellen Satzherstellung brachte die Ein-Mann-Setzmaschine von Ottmar Mergenthaler (1886). Im Bild ein Linotype-Maschinensetzer mit seinem eisernen Kollegen an der Arbeit, um 1910 (vgl. Schmitt 1990, 48).
den es bereits bei den Römern gab, etliche Vorteile. Er war billiger zu bauen und zu betreiben, war wirtschaftlicher für lange Botschaften und konnte auch bei schlechtem Wetter oder in der Nacht eingesetzt werden (vgl. Abb. 14.7). Kommunikation über große Distanzen („Tele-Kommunikation“) wurde auch über das Telephon möglich, wobei auf der Senderseite akustische Signale in elektrische umgesetzt und auf der Empfängerseite diese akustischen Signale rückverwandelt werden. 1876 ließ sich der Taubstummenlehrer Alexander Graham Bell sein „speaking telephone“ patentieren. Der Amerikaner Elisha Gray kam mit einer eigenen Telephon-Entwicklung nur zwei Stunden später zum Patentamt. Zwar kam es bei dem Patentstreit später zum Vergleich, doch wurde Grays technische Lösung nicht ausgeführt (vgl. Oberliesen 1982). Obwohl die Erfindung des Telephons ursprünglich ohne konkreten gesellschaftlichen Bedarf gemacht wurde (zu den Konsequenzen vgl. jedoch Art. 88 § 6.2.), konnte die „Bell Telephone Company“ in den
369
Abb. 14.7: Schematische Darstellung der Verbindung zweier Morse-Stellen für die Telegraphie zwischen zwei Orten. Wenn der Ort B zum Ort A ein telegraphisches Zeichen senden will, wird der Stromschlüssel über die Morsetaste niedergedrückt. Der Strom fließt dann von dem einen Pol der Batterie B über den vorderen Arm der Taste zur Mittelschiene. Von dort fließt er durch die Fernleitung zur Mittelschiene im Ort A und bewirkt dort durch ein Anziehen des Ankerhebels, daß der Stift einen entsprechenden Eindruck auf dem Papierstreifen des Morse-Apparates hinterläßt (nach Brauner 1991, 256; zur Struktur des mit dieser Apparatur übertragenen Morse-Kodes vgl. Art. 16 § 1.2.).
ersten drei Jahren bereits 50 000 Telephone liefern und installieren. Am Ende des 19. Jahrhunderts und zu Beginn des 20. Jahrhunderts gab es eine Reihe weiterer Entdeckungen und Erfindungen, die Massenmedien ermöglichten: so etwa 1888 die Entdeckung elektromagnetischer Wellen durch Heinrich Hertz (Hörfunk), 1884 Nipkows Versuche zur Bildabtastung (Fernsehen), 1897 die Erfindung der Braunschen Röhre (Fernsehen) und 1907 die Entdeckung der Verstärkerröhre von Lieben und de Forest (Radiotelephonie, Fernsehen, verbesserter Plattenspieler und Tonfilm). Schallplatten gibt es seit 1887 (vgl. Abb. 14.8), Filme seit 1894, Hörfunk seit 1895 (1920 nahm der kommerziell orientierte Sender KDKA in Pittsburgh seinen ersten, regelmäßigen Programmdienst auf), Fernsehen seit 1929 (erste drahtlose Fernsehübertragung auf der Funkausstellung in Berlin; 1935 erster regelmäßiger und öffentlicher Programmdienst der Welt in Berlin), Tonbänder seit 1935, Tonkassetten(systeme) seit 1963 und CD-Platten seit 1979 (vgl. Rogers 1986; Geretschläger 1983; Ratzke 1982; Oberliesen 1982; Ludwig 1979). Obwohl die meisten frühen Massenmedien wie etwa Film, Radio, Fernsehen vorwiegend unidirektionale Medien mit großem Streu-
370
II. Aspekte der Semiose
Abb. 14.8: Erster serienmäßig hergestellter Plattenspieler (Patent von Emile Berliner, Modell von 1890; vgl. Kittler 1986, 132 f).
ungsgrad und Verteilcharakter („one-tomany“) sind, sind unter den Telekommunikationsmedien auch solche mit Punktgenauigkeit („one-to-one“) und interaktiven Möglichkeiten (wie etwa Telegraph und Telephon) zu finden. Aber erst bei den neuen Technologien wird Interaktivität zum Hauptcharakteristikum. 2.4. Die Periode der interaktiven Medien Interaktive Medien (vgl. dazu § 4.3.) mit Punktgenauigkeit wurden erst durch Computer möglich. Deshalb wird der Beginn der Periode der interaktiven Medien auf den Einsatz des ersten Elektronenrechners der Welt, ENIAC, im Jahre 1946 datiert. (Allerdings baute der Berliner Konrad Zuse schon 1941 den ersten funktionstüchtigen elektromechanischen Computer der Welt, die Zuse Z3; vgl. Abb. 14.9). ENIAC arbeitete mit 18 000 Elektronenröhren und 1500 Relais, bestand aus 500 000 Bauteilen, wog 30 t und nahm sehr viel Platz ein (etwa die Größe der Telephonzentrale einer Großstadt). Erst der Einsatz von Transistoren (1947 von William Shockley und zwei Mitarbeitern der Bell Telephone Laboratories erfunden) machte Rechenmaschinen kompakter, kleiner und leistungsfähiger. Als 1969 die NASA den ersten bemannten Mondflug wagte, war der hoch-
leistungsfähige Rechner an Bord dreitausendmal kleiner als ENIAC. Seit Beginn der siebziger Jahre macht die Computerentwicklung rasante Fortschritte. Die wohl wichtigste Erfindung war der Mikroprozessor von Marcian Hoff Jr. im Jahr 1971. Weitere Meilensteine in der Geschichte der Neuen Medien sind die Erfindung des Video Tape Recorders durch die Ampex Company in Kalifornien (1956), die Inbetriebnahme des ersten Videotexts in England (1974), die erste Vorführung des Bildschirmtexts „Viewdata“ (1973), die Vermarktung des ersten Mikrocomputers („Altair 8800“) (1975), die Ausstrahlung eines Pay-Cable-Dienstes durch das Home Box Office (HBO) (1975), wobei Satelliten die Verbindung zwischen den einzelnen Netzen herstellen, und das erste interaktive Kabelfernsehsystem Qube in Columbus, Ohio (1977) (vgl. Rogers 1986; Geretschläger 1983). Zu den (neuen) Kommunikationstechnologien der Zukunft gehören ISDN (ein digitales Fernmeldesystem, bei dem unterschiedlichste Fernmeldebotschaften ⫺ Sprache, Text, Bild, Daten ⫺ ein und dasselbe Netz benützen, auf einem einzigen Terminal ankommen und interaktiv sind, vgl. Abb. 14.1), wiederbespielbare Bildplatten (trotz hervorragender Bildund Tonqualität setzen sich die 1971 eingeführten Bildplatten wegen ihrer bisher
371
14. Technische Medien der Semiose
Abb. 14.9: Erste programmgesteuerte Rechenanlage Zuse Z3, Berlin 1941, Vorderseite (vgl. Kaufmann 1974, Tafel VII).
mangelnden Nutzungsflexibilität noch nicht durch, die Prognosen sind jedoch sehr günstig), HDTV (das hochauflösende Fernsehen ist durch eine verdoppelte Zeilenzahl schärfer und kann auch in kleinen Zimmern auf großen Bildschirmen präsentiert werden) und holographisches 3-D-Fernsehen (Ratzke 1982). Kennzeichnend für die Neuen Medien ist, daß sie einen hohen Grad an Interaktivität (vgl. dazu § 4.3.) aufweisen (Videotext ist allerdings nur begrenzt interaktiv, unidirektionales Kabel- und Satellitenfernsehen so gut wie gar nicht) und daß sie sich nicht mehr auf Massen beziehen (Ausnahme: unidirektionales Kabel- und Satellitenfernsehen). Welche strukturellen und funktionalen Merkmale sind denn für (traditionelle und neue) technische Medien überhaupt ausschlaggebend?
3.
Strukturelle Merkmale von technischen Medien
Die strukturellen Charakteristika von Medien betreffen (mediale) verbale und nonverbale (z. T. medienspezifische) Informationen (vgl. dazu Böhme-Dürr 1987). Mediale Kodes kommen auch in der interpersonalen Kommunikation vor, werden aber in verschiedenen Medien verschieden präsentiert. Verbale Informationen in Medien unterscheiden sich vor allem in ihrer Kodevariante (geschrieben oder gesprochen), in ihrer
Gesprächsform (monologisch oder dialogisch), in ihrer Varietät (Standardsprache, Fachsprache oder Dialekt), in ihrem Satzstil (vollständig oder unvollständig) und in ihren Referenzen (vage oder spezifiziert). Gesprochene Sprache in Hörfunk und Fernsehen unterscheidet sich nicht prinzipiell von Sprache in interpersonalen Kommunikationssituationen, wohl aber im Sprachstil. So basieren etwa die meisten Radio- und Fernsehtexte auf geschriebener Sprache (Burger 1984; zur zweiten Mündlichkeit bzw. impliziten Schriftlichkeit vgl. Kowal 1991). Geschriebene Sprache ist im allgemeinen weniger dialogisch als gesprochene, verwendet eher wohlgeformte Sätze und hat weniger Redundanzen, Abtönungspartikel und parataktische Satzverknüpfungen (Schank und Schoenthal 1976). Obwohl systematische Inhaltsanalysen noch ausstehen, ist anzunehmen, daß sich die Sprache in Hörfunk und Fernsehen nicht nur von der in direkten Kommunikationssituationen unterscheidet, sondern auch voneinander. (Im Fernsehen sind durch die bewegten Bilder z. B. ausführliche Beschreibungen von Ereignissen weniger notwendig als im Hörfunk.) Nonverbale Informationen in Medien (deren Ausprägungen nicht alle bei einem Medium vorhanden sein müssen) lassen sich entsprechend den zugrunde liegenden Zeichensystemen differenzieren (vgl. Art. 168) in:
372 ⫺ Verhaltenskodes (Mimik, Gestik, Körperhaltung, Körperbewegung, Parasprache und räumliches Verhalten; ob Parasprache zu den verbalen oder nonverbalen Informationen gezählt werden soll, ist umstritten; für eine Zuordnung zu den verbalen vgl. Art. 5 und Posner 1985; für eine Zuordnung zu den nonverbalen vgl. Knapp 1978; Scherer und Wallbott 1979; wenn Parasprache nicht unter die Verhaltenskodes subsumiert wird, dann sind Verhaltenskodes nur bei visuellen oder audiovisuellen Medien zu finden), ⫺ Künstliche Kodes (subsumieren Objekte, die vom Menschen hergestellt und manipuliert werden, wie etwa Kleidung, Autos, Schmuck, Musikinstrumente), ⫺ Kodes der natürlichen Umgebung (beziehen sich auf Phänomene der Natur, z. B. Vogelstimmen oder Pflanzen), ⫺ Medienspezifische Kodes (werden in interpersonaler Kommunikation nicht verwendet, sind aber bei verschiedenen Medien ⫺ und nicht nur bei einem ⫺ vorhanden; es sind z. B. Zooms, Kameraeinstellungen und -bewegungen, Schnitte, mikro- und makrotypographische Gestaltungsmittel, „special effects“), ⫺ Kontextkodes (ergeben sich aus raum-zeitlichen Anordnungen der anderen Kodes wie z. B. bei der Bildmontage; zum Problem von Kode und Kontext vgl. auch Art. 12 § 4.). Im folgenden wird für visuelle, auditive und audiovisuelle Medien eine Übersicht ihrer strukturellen Charakteristika gegeben. Da Forschung über Medien in olfaktorischen, gustatorischen und taktilen Zeichenprozessen noch aussteht, wird auf die strukturellen Charakteristika von olfaktorischen, gustatorischen und taktilen Medien hier nicht eingegangen. 3.1. Visuelle Medien Visuelle (optische) Medien sind nach der technologischen Definition Instrumente (Geräte, Apparate), bei denen die Kontaktmaterie optischer Art ist und die Sinnesmodalität visueller Art (vgl. Art. 6 und 12). Zu den visuellen Zeichenträgern bzw. Instrumenten gehören Papier und Bleistift, Opernglas, Brille, Photo, Buch, Plakat, Zeitung, Zeitschrift, Stummfilm, Bildschirmtext, Videotext und Computer mit Monitor, aber ohne Audiokomponente. Bei ihren verbalen Informationen (sofern vorhanden) dominieren bei der Ausdrucksmodalität die geschriebene Sprache, bei der Gesprächsform der Monolog, bei der Sprach-
II. Aspekte der Semiose
varietät die Standard- oder Fachsprache, beim Satzstil die vollständigen Sätze (beim Photo, Plakat und beim Computer mitunter auch unvollständige Sätze) und bei der Referenzart spezifizierte Referenzen (wenn bei den visuellen Medien Bildinformationen überwiegen, sind die Referenzen eher vage). Visuelle Medien zeichnen sich in ihren nonverbalen Verhaltenskodes, künstlichen Kodes und Umgebungskodes sowohl durch stark ausgeprägte Ikonizität (bei realitätsgetreuen Abbildungen, Photos und bewegten realitätsgetreuen Bildern) als auch durch schwach ausgeprägte Ikonizität (bei schematischen Bildern) aus („Ikonizität“ verweist auf Eigenschaftsähnlichkeiten zwischen Objekten oder Systemen, „wovon eines zumindest in Anzeichen- oder Zeichenfunktion und das andere in Designatfunktion steht“, vgl. Bentele 1984, 258). Medienspezifische Kodes von visuellen Medien sind vorwiegend mikround makrotypographische Kodes. Mikrotypographische Kodes sind Art, Stärke, Größe und Farbe von Drucktypen, Zeilenlänge und Zeilendurchschuß (Zeilenabstand). Makrotypographische Kodes betreffen das Layout, also die Unterteilung, Anordnung und Hervorhebung von Textmengen sowie graphische Darstellungen (Photos, Zeichnungen, Diagramme, Karten und Tabellen). Bei Bildschirmtext, Videotext und Computer kommen noch Flimmern, Blinkeffekte und andere spezielle visuelle Effekte hinzu und beim Stummfilm zusätzlich noch Kamerabewegung und Schnitt. 3.2. Auditive Medien Auditive (akustische) Medien sind nach der technologischen Definition Geräte (Apparate), bei denen die Kontaktmaterie akustischer Art ist und die Sinnesmodalität auditiver Art (vgl. Art. 7). Zu ihnen werden gezählt: Telephon, Radio und Tonträger (Schallplatten, Kassetten und Compact Discs). Die verbalen Informationen von auditiven Medien sind gesprochene Sprache und in der Regel spezifizierte Referenzen. Beim Telephon und bei den Tonträgern ist die Gesprächsform eher dialogisch und beim Radio eher monologisch. Die Sprachvarietät bei den auditiven Medien kann Dialekt, Standardoder Fachsprache sein und der Satzstil vollständig oder unvollständig. Liegt dem gesprochenen Text eine schriftliche Fassung zugrunde, dann ist Standard- oder Fachsprache wahrscheinlich, und die Sätze sind im allge-
14. Technische Medien der Semiose
meinen vollständig. Sprachliche Strukturen und Funktionen in Massenmedien sind allerdings noch weitgehend unerforscht (für Ansätze vgl. Wolf 1977; Goffman 1981; Burger 1984). Die Ikonizität der nonverbalen Informationen kann bei den auditiven Medien stark ausgeprägt sein (wie etwa bei realitätsgetreuen Geräuschen, parasprachlichen Phänomenen und Musiktönen) oder schwach ausgeprägt (wie bei „unnatürlichen“ Geräuschen oder Tönen). Medienspezifische Kodes bei auditiven Medien sind akustische Verfremdungen (Beispiel: Donald-Duck-Stimmen durch Veränderung der Tonbandgeschwindigkeit). 3.3. Audiovisuelle Medien Audiovisuelle Medien sind Multimedien (bzw. zweikanalige multikodierte Medien). Gemäß dem technologischen Medienbegriff sind Multimedien Geräte (Apparate), die mindestens zwei Kanäle (Kontaktmedien, Sinnesmodalitäten) einbeziehen (vgl. dazu Posner 1985). Beispiele für audiovisuelle Medien (mit optischer und akustischer Kontaktmaterie und mit visueller und auditiver
Abb. 14.10: Sprechende und singende Puppe (vgl. Kittler 1986, 130 f).
373 Sinnesmodalität) sind Tonfilm, Fernsehen (auch Kabel- und Satellitenfernsehen), Video, Videospiele mit Audiokomponenten und Computer mit visuellem Display und Audiokomponenten (vgl. Art. 169). Die auf dem Markt erhältlichen „sprechenden Taschenrechner“, die Rechenprozesse visuell und auditiv wahrnehmbar machen, sind Computer mit visuellem Display und Audiokomponenten. Auch „sprechende Medienspielzeuge“ gehören dazu („machines disguised to appear, on the surface, like ordinary dolls, stuffed animals, and robots. The toy designs include microprocessors, audio playback and recording devices, digital voice synthesizers, touch-sensitive keypads, and radio transmitters“, vgl. Brown 1989; siehe Abb. 14.10), wenn Kinder die Übermittlung von Signalen nicht nur hören, sondern auch gleichzeitig sehen können (z. B. durch Mundbewegungen der Puppen). Sprechen die Medienspielzeuge nur, dann gehören sie zu den Audiomedien. Selbst wenn die Puppen sprechen und den Mund bewegen können, in den Puppen aber kein Mechanismus eingebaut ist, der für eine Koordination von beidem sorgt, kann nicht von einem „zweikanaligen, multikodierten Medium“ gesprochen werden. Eine Grundbedingung für Multimedialität ist der simultane Ablauf von Zeichenprozessen über verschiedene biologische bzw. physische Medien, wobei die „dabei erzeugte Botschaft mehr ist als die Summe der Botschaften, die durch getrennte Rezeption jedes einzelnen Zeichenprozesses erzeugt werden würden“ (Posner 1985, 259). Obwohl in den audiovisuellen Medien alle Formen verbaler Informationen möglich sind (gesprochene und geschriebene Sprache, Monologe und Dialoge, Standard-, Fachsprache und Dialekt, vollständige und unvollständige Sätze, vage und spezifizierte Referenzen), dominieren ⫺ zumindest bei Fernsehen und Video ⫺ die gesprochene Sprache, Dialoge, Standardsprache, vollständige Sätze und wegen der Bildinformationen vage Referenzen. Die Ikonizität der nonverbalen Kodes (Verhaltenskodes, künstliche Kodes und Umgebungskodes) von audiovisuellen Medien kann stark oder schwach ausgeprägt sein (Photos, bewegte realitätsgetreue Bilder, realitätsgetreue Geräusche, Parasprache und Musik sowie schematische Bilder und spezielle Geräusche). Bei den medienspezifischen Kodes sind sowohl visuelle (mikro- und makrotypographische Gestaltungsmittel, Flimmern,
374
II. Aspekte der Semiose
Kamerabewegung, Schnitt, Blinkeffekte und spezielle visuelle Effekte) als auch auditive (akustische Verfremdung) möglich.
4.
Funktionsweisen von technischen Medien
Medien können nicht nur bezüglich ihrer strukturellen Merkmale (Welche Signale werden durch technische Medien übertragen?), sondern auch bezüglich ihrer Funktionsweisen (Wie werden Signale übertragen?) unterschieden werden: z. B. in Transport- und Fixiermedien, in reproduktive und umwandelnde Medien und in unidirektionale und interaktive Medien. 4.1. Transport- und Fixiermedien Winterhoff-Spurk (1989) differenziert visuelle, auditive und audiovisuelle Medien in Transport- und Fixiermedien. Wenn physikalische Wellen zum Transport kommunikativer Inhalte verwendet werden, handelt es sich um Transportmedien. Zu ihnen zählen solche Instrumente bzw. Zeichenträger wie Rauchund Flaggensignale, verschiedene optische Telegraphensysteme (für einen Überblick vgl. Oberliesen 1982), elektrische Telegraphen (Telegraphen mit Reibungselektrizität, elektrochemische und elektromagnetische Telegraphen), Telephon, Telex, Funk, Radio, Fernsehen, Videotext, Bildschirmtext, Telefax (Fernkopieren), Teletex (Bürofernschreiben) und Telekonferenzsysteme (Bildfernsprechen). Wenn Informationen auf einem langlebigen Träger (wie etwa Stein, Papier oder Filmmaterial) mit technischen Geräten konserviert (fixiert) werden, spricht man von Fixiermedien. Das sind beispielsweise Zeichenträger wie Denkmäler, Schilder, Briefe, Bilder, Plakate, Flugschriften, Zeitungen, Zeitschriften, Bücher, Filme, Videobänder, Tonbänder, Kassetten, Schallplatten, Compact Discs, Magnetplatten, Magnetbänder, Magnetblasenspeicher, Halbleiterspeicher, Lochstreifen, Lochkarten, Disketten, Mikrofilm-Fiches, Videoplatten und Bildplatten. Manche Medien sind Kombinationen von Transport- und Fixiermedien: so z. B. Fernsehfilme, Schallplatten im Rundfunk, Datenbanken, Videotext und Telefaxgeräte. Bei den Transportmedien kann man den Kanal (die Kontaktmaterie) als Unterscheidungskriterium nehmen und zwischen leitergebundenen Medien und leiterungebundenen Medien un-
terscheiden. Für die neuen Medien sind leitergebundene Übertragungstechniken (z. B. Telephonleitungen, Koaxialkabel, Glasfaserkabel) von größerer Bedeutung als die leiterungebundenen (z. B. elektromagnetische Schwingungen), da erstere weniger störanfällig, beliebig vermehrbar und technisch flexibler sind. Transportmedien können zudem nach dem Übertragungsmodus (analog oder digital) charakterisiert werden. In den (noch vorhandenen) Telephonen mit analoger Übermittlung werden auf der Sprecherseite Schallschwingungen durch ein Mikrophon in elektrische Schwingungen umgewandelt. Auf der Empfängerseite werden die analogen Schwingungen dann in Töne zurückverwandelt. Bei (zukünftigen) Telephonen mit digitaler Übermittlung (über ISDN) werden Schwingungen in Binärmuster transformiert (Degenhardt 1986). Der digitale Modus hat den Vorteil, daß mehrere Kodes gleichzeitig übertragen werden können (Beispiel: Bildtelephon) und daß die Informationsvermittlung schneller vor sich geht. 4.2. Reproduktive und umwandelnde Medien Reproduktive Medien (d. h. Medien, bei denen Zeichen durch den Vermittlungsprozeß für Kommunikator und Rezipient nicht „augenscheinlich“ verändert werden) haben durch die genaue Informationswiedergabe einen hohen Grad an Ikonizität. Zu den reproduktiven Medien der visuellen und auditiven Zeichenprozesse können gezählt werden: Kopiermaschine, Diaprojektor, Overhead-Projektor, Kassetten und Telefax. Reproduktive und umwandelnde Medien können nicht trennscharf voneinander unterschieden werden, da auch bei den reproduktiven Medien schwächere oder stärkere Umwandlungen von Zeichen möglich sind und bei den umwandelnden Medien Zeichenähnlichkeiten vorhanden sein können. So kann ein reproduktives Medium wie die Vielfarbenkopiermaschine Zeichen realitätsgetreuer wiedergeben als eine Schwarz-weiß-Kopiermaschine. Umwandelnde Medien verändern Signale in einem oder mehreren Kanälen (Kontaktmaterie, Sinnesmodalität) (z. B. durch Vergrößern, Verkleinern oder Übersetzen). Zu ihnen gehören beispielsweise Mikrophon, Lautsprecher, Mikrofilmlesegerät, Radio, Fernsehen, Videospiel und Compiler. Reproduktion und Umwandlung können bei ein und demselben Medium vorkommen (z. B. beim Fernsehen, wo Bilder und Töne nicht
14. Technische Medien der Semiose
nur reproduziert, sondern auch modifiziert werden). Umwandlungen können temporär oder dauerhaft sein. Medien, bei denen physikalische Wellen eine Rolle spielen ⫺ wie etwa bei Hörfunk und Fernsehen ⫺, wandeln Signale nur temporär um. Medien mit dauerhafter Umwandlung sind Lochkarten, nicht wiederbespielbare Video- und Filmbänder oder Schallplatten. 4.3. Unidirektionale und interaktive Medien Unidirektionale Medien (bei denen der Informationsfluß nur vom Sender zum Empfänger geht, aber nicht umgekehrt) gibt es streng genommen nicht, da bei allen ⫺ selbst bei Hörfunk und Fernsehen ⫺ zumindest ein verzögertes Feedback des Empfängers möglich ist (z. B. durch Briefe an die Redaktionen, Einschaltquotenmessungen und Rezipientenumfragen). Insofern sind Medien nur mehr oder weniger interaktiv (vgl. Art. 26 § 11.). Bretz (1983) differenziert zwischen quasiinteraktiven und interaktiven Medien. Bei vollständig interaktiven Medien müssen Sender und Empfänger austauschbar sein, und A muß auf B aufgrund von Bs Reaktion auf As Initiierung reagieren können. Deshalb sind für Bretz Videotext und Videospiel nicht vollständig interaktiv, da Rezipienten bei diesen Medien zwar Inhalte auswählen, aber nicht beeinflussen können. Ganz ähnlich schätzt Rogers (1986) die Position von Videotext auf dem Interaktivitätskontinuum ein. Während Printmedien, Radio, Fernsehen und Film einen relativ geringen Grad an Interaktivität haben (nur verzögertes Rezipienten-Feedback) und Videotext einen mittleren, sind verschiedene Computertechnologien (Bildschirmtext und Telekonferenzsysteme) voll interaktiv (wobei allerdings das von Rogers aufgelistete, zur Zeit empfangbare interaktive Kabelfernsehen eher eine mittlere Position einnehmen dürfte). Gagnon, Neumann, McKnight und Fryling (1986) unterscheiden verschiedene hierarchisch angeordnete Interaktivitätsstufen, wobei sie eine Analogie zu verschiedenen Rollen bei der Filmproduktion herstellen: (1) die Rezipientenstufe, (2) die Cutterstufe, (3) die Autorenstufe und (4) die Schauspielerstufe. Auf der niedrigsten Stufe (Rezipient) basiert Interaktivität auf der Rezeptionsentscheidung (z. B. Sehen oder Nicht-Sehen). Fernsehen (wie es derzeit zumeist noch empfangen wird) befindet sich auf dieser Interaktivitätsstufe. Selbst wenn der Rezipient mit
375 der Fernbedienung dem „Programmspringen“ („zapping“) frönt, hat er keine Kontrolle über einzelne Programme, sondern nur die Wahl zwischen Sehen oder Nicht-Sehen. Andere Medien auf der Rezipientenstufe sind z. B. Film oder Radio. Auf der nächsten Stufe (Cutter) kann der Rezipient die Abfolge und Zusammenstellung einzelner Teile kontrollieren. Medien auf der Cutterstufe sind Zeitungen, Zeitschriften, Bücher, Schallplatten, Kassetten, Bildplatten und Videokassetten. Fernsehen auf dieser Interaktionsstufe bedeutet, daß der Zuschauer etwa nur die Szenen aussucht, in denen sein Lieblingsschauspieler vorkommt. Dabei können zwar verschiedene Szenen (mit dem Lieblingsschauspieler) zusammengestellt werden, aber die Handlungen und das Ende der betreffenden Szenen können nicht beeinflußt werden. Auf der nächsthöheren Interaktivitätsstufe (Autor) kann der Rezipient das Ende von einzelnen Szenen bestimmen oder wählen. Bei einigen wenigen interaktiven Bildplatten und Videospielen ist das heute schon möglich. Die höchste Interaktivitätsstufe ist die vollständige Rezipientenbeteiligung (Schauspieler). Bei Computern, Bildschirmtext und bei einigen Videospielen können Kommunikationspartner direkt aufeinander eingehen. Bereits realisiert ist die Beteiligung von Zuschauern als Akteure in Fernsehfilmen. Möglich ist dies durch Echtzeit-Interaktion und transparenten Input (Gagnon et al. 1986, 10: „As the technology develops, interface devices such as the body tracking device developed at M. I. T. […] can be used within high resolution real time graphic or digitized environments to allow users to physically maneuver within scenes“). Andere Möglichkeiten, die die Szenen nicht durch direkt eindringende interaktive Strukturen unterbrechen, sind etwa physiologische oder emotionale Messungen, individuelle Charakteranalysen oder vor der Sendung erhobene Präferenzen. Aufgrund von derlei Erhebungen könnten selbst Fernsehfilme individuell „angepaßt“ werden. Auch interaktive Video-Datenbanken sind bei Fernsehfilmen einsetzbar. So kann ein Zuschauer sich zum Beispiel während einer Unterhaltungsserie Flußdiagramme über Familienstrukturen zeigen lassen, um die verwandtschaftlichen Beziehungen zwischen zwei Akteuren zu klären. Durlak (1987) berücksichtigt bei seiner Typologie interaktiver Medien nicht nur das Medium selbst, seine inhaltlichen Möglichkeiten und
376
II. Aspekte der Semiose
die Nutzer, sondern auch die Designer von Computern und ihre Absichten. So unterteilt er interaktive Mediensysteme nach den drei Designerzielen Simulation der direkten Faceto-face-Kommunikation, Erhaltung der Illusion (Aufgabeninvolvierung ohne Ablenkung durch das technische Gerät) und Denkerweiterung (vor allem im Bereich „Kreativität“). Diese Designerziele bezieht er wiederum auf Hardwarevariablen, Softwarevariablen, „Werkzeuge“ (z. B. natürliche Sprache) und Menschen (z. B. Techniker, Programmierer). Die Auflistung von Durlaks Designerzielen macht klar, daß interaktive Medien möglichst stark der direkten Kommunikation ähneln sollen, dabei aber effizienter und kreativer sein müssen. Gerade im Hinblick auf die zunehmende Nutzung voll interaktiver Medien und ihre immer größer werdende gesellschaftliche Bedeutung muß gefragt werden, inwiefern sie und auch die weniger interaktiven Medien Semiosen verändern (vgl. dazu § 6.).
5.
Vom Sender zum Adressaten: Druckmedien als Beispiel
Am Beispiel der Druckmedien (technische Apparate für Satz und Druck) soll die Kommunikationskette vom Sender zum Adressaten aufgezeigt werden (vgl. Art. 5 § 3.4.3.). Dabei soll vor allem auf die unterschiedlichen Satzverfahren eingegangen werden. An der Herstellung der Zeichenträger Zeitung und Zeitschrift sind heutzutage in der Kommunikationskette zahlreiche Personen beteiligt (vgl. van Peer 1994), die zum Teil interagieren, über visuelle Modalitäten und optische Kanäle Zeichen produzieren, rezipieren, reproduzieren und verändern (zu den dabei auftretenden Umkodierungen vgl. Art. 17 § 5.3.): ⫺ der Journalist (Sender, der verbale und nonverbale Zeichen, z. B. mikrotypographische Zeichen oder Photos, vermitteln möchte), ⫺ mitunter eine Schreibkraft (die die Texte des Journalisten eingibt, d. h. z. B. mittels einer Schreibmaschine oder eines Schreibcomputers reproduziert), ⫺ der Redaktionsleiter (der z. B. Zeilen- und Platzvorgaben macht und Texte redigiert, d. h. die vom Journalisten vorgegebenen Schriftzeichen verändert, und meist zusammen mit einem Layouter die Plazie-
⫺
⫺ ⫺ ⫺
⫺ ⫺ ⫺ ⫺ ⫺ ⫺
rung eines Textes auf einer Zeitungs- oder Zeitschriftenseite festlegt und somit die mikrotypographische Zeichengestaltung und den makrotypographischen Zeichenkontext bestimmt), der Erfasser (der prüft, ob alle Texte einer Redaktion auf die vorgegebenen Seiten passen, und dabei auch die vom Redaktionsleiter festgelegten Zeichen kürzen kann), der Korrektor (der fehlerhafte Zeichen verbessert), der Setzer (der mit Hilfe technischer Medien einen Text setzt), die Hilfskraft (die den durch die Maschine gesetzten Text schneidet und klebt, damit er variabel in den Zeichenkontext eingepaßt werden kann), der Umbruch-Redakteur (der das endgültige Layout, also die mikro- und makrotypographische Gestaltung, fertigstellt), der Drucker (der die Druck-, Falz- und Klebemedien bedient), der Packer (der die fertigen Zeitungen und Zeitschriften, die Zeichenträger, vom Fließband nimmt), der Auslieferer, der Zeitungs- und Zeitschriftenhändler und schließlich der Leser (Adressat, der die Zeichen des Zeichenträgers rezipiert).
Setz- und Druckmedien sind technische Kommunikationsmittel, die sich seit der Gutenbergschen Erfindung der beweglichen Lettern stark verändert haben (vgl. Abb. 14.5 und 14.6). Bis Ende des letzten Jahrhunderts kannte man nur den aufwendigen und unflexiblen Handsatz. Aber bereits im letzten Jahrhundert gab es Entwicklungen, die die Produktion von gedruckten Texten vereinfachten (vgl. dazu § 2.2. und Ratzke 1982): ⫺ 1811 baut Friedrich König die erste Druckmaschine mit Dampfantrieb („Schnellpresse“), ⫺ 1846 konstruiert Richard M. Hoe die „Type Revolving Press“, die die Nutzung von Rotationsdruckmaschinen einleitet, ⫺ 1881 erfindet Georg Meisenbach die Autotypie, die die gedruckte Wiedergabe von Fotografien ermöglicht, ⫺ 1884 baut Ottmar Mergenthaler die Zeilensatz- und Gießmaschine Linotype, ⫺ 1891 entwickelt Karl Klietsch das Rotationstiefdruckverfahren, und ⫺ 1897 wird die Einzelbuchstabensetz- und Gießmaschine Monotype erfunden.
14. Technische Medien der Semiose
Die Linotype- und die Monotype-Setzmaschinen lösten den Handdruck ab. Weitere technische Entwicklungen in diesem Jahrhundert revolutionierten die Satzherstellung und Textverarbeitung: ⫺ 1946 wird die erste Fotosetzmaschine installiert, ⫺ 1959 wird zum ersten Mal eine ganze Zeitungsseite von Tokio (Redaktionsort) nach Sapporo (Druckort) als Faksimile übertragen (dezentrales Drucken) und ⫺ 1962 wird damit begonnen, Computer (Satzrechner) für die automatische Satzherstellung einzusetzen. Durch die Elektronik wird es möglich, von immateriellen Druckformen zu drucken. 5.1. Manuelle und maschinelle Zeichenübermittlung Bis gegen Ende des 19. Jahrhunderts war der Handsatz die einzige Möglichkeit, Texte zu reproduzieren (zu den Satzherstellungs- und Druckverfahren vgl. Ratzke 1982; Stiebner, Zahn und Meusburger 1985; Siemoneit und Zeitvogel 1986). Bei der manuellen Textherstellung werden in Blei gegossene, bewegliche Einzelbuchstaben (Lettern) aus dem Setzkasten genommen, durch Füllmaterial ergänzt und in „Winkelhaken“ (gleichlange Zeilenvorgaben) eingepaßt. Die aneinandergereihten Zeilen ergeben die Druckform. Beim „Umbruch“ im Bleisatz werden dann Bilder und Texte nach vorgegebener Seitenbreite und -höhe zusammengestellt, eingeschwärzt und mit einer Maschine gedruckt. Ist das Druckmedium eine mechanische Schnellpresse, dann werden Zeichen dadurch abgedruckt, daß ein Druckhammer in dem Moment von hinten in das Papier schlägt, in dem gesetzte Zeichen die zu bedruckende Stelle passieren. Bei der maschinellen Textherstellung, die den Handsatz ablöste und bis Mitte der siebziger Jahre vorherrschte, gibt es zwei Systeme: das Zeilen-Setz- und Gießsystem (bei manueller Steuerung werden ganze Zeilen in einem Stück hergestellt) und das Einzelbuchstaben-Setz- und Gießsystem (eine von einem Lochband gesteuerte Gießmaschine reiht Buchstaben zu Zeilen aneinander). Beim ersten System (Zeilenguß/LinotypeSetzmaschine), bei dem das Produkt eine in Blei gegossene Zeile ist, muß bei einem fehlerhaften Zeichen die ganze Zeile ausgetauscht werden. Bei Einfügungen und Streichungen werden nachfolgende Texte umge-
377 setzt. Beim Einzelbuchstaben-Setz- und Gießsystem (Monotype-Setzmaschine) bekommt jedes Zeichen eine eigene Lochkombination. Die Setzer achten auf Wortzwischenräume, die sie dann auf die Lochstreifen am Ende der Zeile eintasten. Die Lochkombinationen entsprechen den Buchstabengießformen in der Gießmaschine. Für Zeitungen wurde in den fünfziger Jahren das Teletypesetting (TTS ⫽ Fernsetzer) entwickelt, bei dem in einem zweistufigen Verfahren Erfassungs- und Gießvorgang räumlich und zeitlich voneinander getrennt werden. Während Maschinensetzer das von einem Autor geschriebene und von einem Redakteur überarbeitete Manuskript lesen und das Gelesene simultan eintasten, steuert der elektronische Setzautomat die Setzmaschine. Er tastet die durch einen Perforator auf ein Lochband gestanzten Kodierungen ab und leitet sie an die Schnellsetzmaschine weiter, wo sie in mechanische Bewegungen umgewandelt werden. Das Lochband (Zeichenträger) steuert die Gießmaschine automatisch und unabhängig von der Tastgeschwindigkeit. Für Fernübertragung werden die Lochbandstanzungen in elektrische Impulse umgewandelt und am Empfangsort wieder umgesetzt. Sind die Druckformen für Zeitungstexte bestimmt, dann werden sie häufig auf Rollenrotationsmaschinen, die halbrunde Druckzylinder aus Metall verwenden, weiterverarbeitet. Die Farbzuführung wird dabei entweder elektromechanisch oder elektronisch geregelt. Auch der Papierwechsel (neue Papierrollen werden bei voller Laufgeschwindigkeit der Druckmaschine ausgewechselt) erfolgt elektromechanisch oder elektronisch. Die bedruckten Papierfahnen werden dann einem Falz- und einem Schneideapparat zugeführt, der schließlich die fertigen Zeitungsseiten zu einem Gesamtprodukt sammelt. 5.2. Elektronische Zeichenübermittlung Beim Fotosatz (häufig auch „Lichtsatz“ genannt), der Ende der fünfziger Jahre eingeführt wurde, werden die Texte wie auf einer Schreibmaschine eingegeben. Im Gegensatz zum Bleisatz ist für jeden Text nur ein einziger Zeichenträger notwendig. Änderungen von Schriften können mittels optischer Systeme oder unter Vorschaltung von Rastern erfolgen. Beim optomechanischen Fotosatz werden die Schriftzeichen auf lichtempfindliches Material projiziert und fotografisch entwickelt. Der Schriftbildträger (Zeichenträger) ist materiell als Negativ vorhanden.
378
II. Aspekte der Semiose
Heute verwendet man immer häufiger Fotosatz mit Lichtstrahlaufzeichnung, der überwiegend elektronisch funktioniert und bei dem ⫺ anders als beim optomechanischen Fotosatz ⫺ die Mechanik weitgehend ausgeschaltet wird. Beim Fotosatz mit Lichtstrahlaufzeichnung werden durch digitale Steuerung alle Buchstaben elektronisch erzeugt und ganze Zeitungsseiten innerhalb weniger Minuten montiert (umbrochen). Artikel können beliebig vertauscht, Überschriften geändert und Bilder eingesetzt werden. Das elektronische Seitenumbruchsverfahren erlaubt einen hohen Grad an Interaktivität. Damit ist ein Journalist nicht nur Autor, sondern auch Setzer. Durch sogenannte „Remotesysteme“ (Fernsysteme) und Reporterterminals können auch Texte von auswärtigen Redaktionen oder von Eingabegeräten reisender Reporter direkt aufgenommen und verarbeitet werden (vgl. Abb. 14.11). Beim Fotosatz mit Lichtstrahlaufzeichnung wird zwischen dem CRT-Satz und dem Lasersatz differenziert. Beide verwenden bei der Aufzeichnung immaterielle, elektronisch gespeicherte Zeichen. Beim CRT-Satz wird eine Kathodenstrahlröhre (Cathode Ray Tube) als Lichtquelle verwendet. Alle Zeichen werden nacheinander belichtet. Beim Laser-
satz werden per Laserstrahl Zeilen oder Seiten auf Film oder Fotopapier belichtet. Die Buchstaben und die Bildvorlagen werden für die Belichtung in den Fotosatzgeräten in Rasterpunkte zerlegt, die um so dichter sind, je dunkler die Vorlagen wirken sollen. In Zeitungsdrucken mit ihren weniger glatten Oberflächen sind die Rasterpunkte z. T. noch relativ gut erkennbar. Nachdem Bild- und Textvorlagen zusammengestellt sind, werden sie auf Druckplatten kopiert und auf Druckzylinder montiert. Danach läuft die Rotationsmaschine an. Zeitungen und Zeitschriften werden heute meist im Offsetdruck hergestellt. Die Druckfarbe wird dabei meist nicht direkt, sondern unter Zwischenschaltung eines Gummituchs auf das Papier übertragen. Die druckenden Teile werden für die Farbaufnahme chemisch-physikalisch präpariert, und der nichtdruckende Plattenuntergrund wird ständig befeuchtet, da er keine Druckfarbe annehmen soll. Die ersten hundert oder zweihundert Zeitungsexemplare werden meist aussortiert, weil Druckerschwärze und Farbe noch abgestimmt werden müssen. Nach dem Falzen und Schneiden können die Zeitungen ausgeliefert werden. Auch wenn für Zeitungen und Zeitschriften noch vorwiegend materielle Kontakt-
Abb. 14.11: Dem Ziel, interferierende Menschen durch Automatisierung aus der Kommunikationskette auszuschalten, kommt Raymond Kurzweils Entwurf eines „voice-activated typewritter“ nahe. Seine Verwirklichung würde den Journalisten wieder unabhängig machen von der Schreibkraft, dem Setzer und dem Drucker und ihn damit näher an den Leser seiner Texte heranrücken.
14. Technische Medien der Semiose
druckverfahren (Pressen einer Druckform auf Druckmaterial) verwendet werden, setzen sich immaterielle, elektronische Druckverfahren immer mehr durch. Dazu gehören der elektronische Tintendruck (Inkjet), der Laserdruck sowie thermographische, elektrographische und elektrophotographische Entwicklungen. Die Entwicklung von Satz- und Druckmedien in den letzten Jahren verdeutlicht, daß immaterielle Medien immer mehr zunehmen. Werden dadurch Semiosen verändert?
6.
Semiotische Veränderungen durch technische Medien
Die Frage, wie sich Semiosen durch diverse technische Medien verändern, kann auf zwei Ebenen bezogen werden: die soziale Mikroebene und die soziale Makroebene. 6.1. Veränderungen auf der sozialen Mikroebene Mit den Veränderungen der sozialen Mikroebene (also mit Auswirkungen von Medien auf Individuen) beschäftigen sich vor allem die Medienpsychologie, die Medienpädagogik und in den letzten Jahren verstärkt auch die interdisziplinäre Kognitionswissenschaft. Vor allem zwei Fragen werden von diesen Disziplinen immer wieder thematisiert: Für welche technischen Medien sind gegebene Individuen empfänglich? Und: Welche individuellen Wirkungen ergeben sich aus der Nutzung gegebener technischer Medien? Bei der ersten Frage geht es um die Beziehung Mensch⫺Medium und bei der zweiten um die Beziehung Medium⫺Mensch. Zur Mensch⫺Medium⫺Beziehung existieren in der Massenkommunikationsforschung etliche theoretische Ansätze, so etwa der uses-and-gratifications-approach (Welche Bedürfnisse, Interessen und Erwartungen der Rezipienten steuern den Medienkonsum?) oder diverse Informationsverarbeitungsmodelle (Wie können mediale Informationen in die kognitiven Schemata von Rezipienten integriert werden?). Auch zur Medium⫺ Mensch⫺Beziehung gibt es eine Vielfalt psychologischer Wirkungsmodelle, die unter den Begriff „Stimulus-Response-Ansatz“ subsumiert werden. Ein Beispiel für die Kombination beider Forschungsrichtungen (Mensch⫺ Medium⫺Mensch) ist das dynamisch-transaktionale Modell (Früh und Schönbach 1982; Schönbach und Früh 1984).
379 Fragt man sich, wie sich Semiosen durch Medien verändern, so muß man zuerst fragen, wer Zugang zu welchen Medien hat bzw. wer welche Medien nutzt. Nimmt man die Vierteilung der Medienarten von Rogers (1986) als Grundlage (Schreibmedien, Druckmedien, Telekommunikationsmedien, interaktive Medien), so zeigen sich folgende Gebrauchs- und Nutzungsmuster. Illiteralität ist zwar in den letzten Jahrzehnten bei den Erwachsenen drastisch zurückgegangen, aber dennoch kann etwa ein Drittel der Weltpopulation weder schreiben noch lesen. Vor allem Menschen in der Dritten Welt, und dabei insbesondere Frauen, sind davon betroffen (McBride Commission 1987). Den Druckmedien wenden sich im allgemeinen Menschen mit überdurchschnittlich hoher formaler Bildung und relativ hohem Einkommen zu (vgl. z. B. Stone 1987; Bogart 1989; Saxer, Langenbucher und Fritz 1989). Bei den Telekommunikationsmedien zeigt sich, daß das Telephon hauptsächlich von Europäern und Nordamerikanern, also von Menschen in Industrienationen, genutzt wird („approximately half of all telephones are in the United States alone“, vgl. McBride Commission 1987, 14), daß das Radio vor allem für Jugendliche attraktiv ist und Fernsehen für weniger gebildete, ärmere und ältere Menschen (vgl. z. B. Jeffres 1986; Berg und Kiefer 1987). Neue interaktive Medien werden vornehmlich von Reichen, Jüngeren, Gebildeten ⫺ und darunter vor allem von technisch interessierten Männern ⫺ genutzt (Rice 1984). Insgesamt zeichnet sich ab, daß ⫺ im Vergleich zu Hörfunk, Zeitungen und Büchern ⫺ Fernsehen und interaktive Medien die größten Zuwachsraten in den letzten Jahren hatten (McBride Commission 1987), wobei die Diffusion von interaktiven Medien von kontinuierlicher Vermehrung abhängt („the decision to adopt a communication innovation is not an independent one, as there is little value in using the medium if no one else does“; vgl. Steinfield 1987). Auch wenn die Diffusion verschiedener Medien nicht für alle Bevölkerungssegmente in derselben Weise verläuft, verdeutlichen die Mediennutzungstrends doch, daß vor allem der Konsum der Medien zunimmt, die eine Vielzahl struktureller Merkmale aufweisen (vgl. § 3) und die die direkte Kommunikation am besten simulieren können. Untersuchungsergebnisse zeigen, daß Medien alle Verhaltensbereiche (Kognition, Emotion, Sozialverhalten) beeinflussen können (vgl. z. B. Schenk 1987; siehe auch Abb. 14.12).
380
II. Aspekte der Semiose
Abb. 14.12: Welten im Netz: das Projekt der Infobahnen (aus: DER SPIEGEL 10/1994, 213).
6.2. Veränderungen auf der sozialen Makroebene Mit Veränderungen durch Medien auf der sozialen Makroebene (Gesellschaft) beschäftigen sich vor allem Mediensoziologie, Mediengeschichte, Medienökonomie und Medienpolitik. Die theoretischen Ansätze der Wirkungsforschung auf der Makroebene ähneln denen auf der Mikroebene (Gesellschaft⫺ Medium⫺Gesellschaft), gehen aber über die Individualebene und teilweise auch über die Analyse eines einzelnen Kulturkreises hinaus. Dazu zählen zum Beispiel Theorien der öffentlichen Meinung und des Meinungswandels oder die Wissenskluftthese, die in verschiedenen Kulturkreisen überprüft wurden.
Auffallend ist, daß die Wirkungsforschung in ihren Fragestellungen der öffentlichen Meinung folgte. So dominieren in der Bevölkerung bei Einführung eines neuen Mediums Befürchtungen vor Hoffnungen, und dementsprechend werden zuerst negative Wirkungen untersucht. Erst in einem späteren Stadium werden positive Effekte erforscht (vgl. z. B. Wartella und Reeves 1985). Semiotische Ansätze zu Medienwirkungen und zum Verhältnis zwischen Wirkungsforschung und Gesellschaft sind aber noch rar (vgl. Art. 144). Analysen von medialen Semiosen können sich nicht auf einen einzigen Medientypus (z. B. interaktive Medien) beschränken, sondern müssen der Tatsache Rechnung tragen,
381
14. Technische Medien der Semiose
daß in der bisherigen Kommunikationsentwicklung Medien einander ergänzen und nicht miteinander konkurrieren. So werden auch im Informationszeitalter nicht nur interaktive Medien, sondern auch „ältere Medien“, also Schreib-, Druck- und Telekommunikationsmedien, genutzt. Deshalb muß sich die Semiotik bei der Frage nach Veränderungen von Semiosen auf der Makroebene auch mit Vergleichen verschiedener indirekter Semiosen (d. h. mit intermediärer Kommunikation) auseinandersetzen. Allerdings ist fraglich, ob die Komplementaritätshypothese der Mediennutzung auch in Zukunft gelten wird, da sich schon jetzt abzeichnet, daß es aufgrund des sich immer weiter vermehrenden Medienangebots zu einer individuellen und sozialen „Informationsüberlastung“ kommen kann (vgl. z. B. Neuman und Pool 1986). Welche Medien werden dann bevorzugt und warum? Zukünftige Forschung wird zeigen, ob indirekte Semiosen immer mehr individuumszentriert und weniger massenorientiert werden (vgl. Rogers 1986 sowie Pool 1983; siehe auch Art. 15). 6.3. Ausblick: Verdrängt die indirekte Semiose die direkte? Da die Menschen den technischen Medien immer mehr Zeit widmen und technisch-mediale Semiosen immer häufiger werden, kann angenommen werden, daß die indirekte Semiose die direkte immer mehr verdrängt. Es dürfte wohl keinen Teil der direkten Semiose mehr geben, der nicht von Medien affiziert worden ist oder der gegen sie immun ist (vgl. Art. 31 § 3.5.). Auch wenn viele, vielleicht sogar die meisten gesellschaftlichen Prozesse nur mittels technischer Medien theoretisch faßbar sind, sind Gesellschaft und Technik dennoch verschiedene Phänomenbereiche. Und man kann Ropohl (1988, 95) nur beipflichten, wenn er sagt: „Technik kann als Objektivation sozialer Strukturen und Prozesse verstanden werden; und Gesellschaft kann als Konstrukt aus technischer Substanz aufgefaßt werden.“ Technische Medien können ⫺ wie Beniger (1986) klar nachweist ⫺ nicht ohne gesellschaftliche Prozesse begriffen werden (vgl. auch Mattelart und Stourdze´ 1982). Andererseits sind technische Medien Zeugen kommunikativer und damit kultureller Prozesse ⫺ ohne sie können gesamtgesellschaftliche Veränderungen nicht nachvollzogen werden.
7.
Literatur (in Auswahl)
Barnouw, Erik, George Gerbner, Wilbur Schramm, Tobia L. Worth und Larry Gross (eds.) (1989), International Encyclopedia of Communications. Bd. 1⫺4. New York: Oxford University Press. Beniger, James R. (1986), The Control Revolution. Technological and Economic Origins of the Information Society. Cambridge MA: Harvard University Press. Bentele, Günter (1981), „Semiotik und Massenmedien. Problemskizze einer Mediensemiotik“. In: Günter Bentele (ed.), Semiotik und Massenmedien. München: Ölschläger, 15⫺38. Bentele, Günter (1984), Zeichen und Entwicklung. Vorüberlegungen zu einer genetischen Semiotik. Tübingen: Narr. Bentele, Günter (1987): „Evolution der Kommunikation ⫺ Überlegungen zu einer kommunikationstheoretischen Schichtenkonzeption“. In: Manfred Bobrowsky und Wolfgang R. Langenbucher (eds.), Wege zur Kommunikationsgeschichte. München: Ölschläger, 79⫺94. Berg, Klaus und Marie-Luise Kiefer (1987), Massenkommunikation III. Eine Langzeitstudie zur Mediennutzung und Medienbewertung 1964⫺1985. Frankfurt a. M.: Metzner. Berger, Arthur A. (1987), „Semiological Analysis“. In: Oliver Boyd-Barrett und Peter Braham (eds.), Media Knowledge and Power. London: Croom Helm, 132⫺155. Böhme-Dürr, Karin (1985), „Verarbeitung von massenmedialen Informationen durch Kinder: ,Wald‘ oder ,Bäume‘?“ In: Günter Bentele und Ernest W. B. Hess-Lüttich (eds.), Zeichengebrauch in Massenmedien. Zum Verhältnis von sprachlicher und nicht-sprachlicher Information in Hörfunk, Film und Fernsehen. Tübingen: Niemeyer, 195⫺228. Böhme-Dürr, Karin (1987), „Wie wirken medienspezifische Darstellungsformen auf Leser, Hörer und Zuschauer?“ Zeitschrift für Semiotik 9, 363⫺395. Bogart, Leo (1989), Press and Public. Hillsdale NJ: Erlbaum. Brauner, Christian (ed.) (1991), Samuel F. B. Morse: Eine Biographie. Basel, Berlin und Boston: Birkhäuser. Brepohl, Klaus (1985), Lexikon der neuen Medien. Köln: Deutscher Instituts-Verlag. Bretz, Rudy (1971), A Taxonomy of Communication Media. Englewood Cliffs NJ: Educational Technology Publications. Bretz, Rudy (1983), Media for Interactive Communication. Beverly Hills: Sage. Brown, Barbara (1989), „Influence of Talking Media Toys on Children’s Perceptions of People and Machines“. Washington DC: Konferenzpapier bei der Association for Education in Journalism and Mass Communication.
382
II. Aspekte der Semiose
Bühler, Karl (1918), Die geistige Entwicklung des Kindes. Jena: Gustav Fischer.
stenweiterbildung (ed.), Fernstudium Kommunikationswissenschaft. München: Ölschläger, 59⫺134.
Burger, Harald (1984), Sprache der Massenmedien. Berlin: de Gruyter.
Kaufmann, Hans (1974), Die Ahnen des Computers: Von der phönizischen Schrift zur Datenverarbeitung. Düsseldorf und Wien: Econ.
Bystrina, Ivan (1981), „Kulturelle und filmische Codes“. In: Günter Bentele (ed.), Semiotik und Massenmedien. München: Ölschläger, 298⫺313. Degenhardt, Werner (1986), Akzeptanzforschung zu Bildschirmtext. München: Reinhard Fischer. Diel, Norbert und Albert Held (1995), Mobile Computing: Systeme, Kommunikation, Anwendungen. Bonn und Albany: Thomson. Durlak, Jerome T. (1987), „A Typology of Interactive Media“. In: Margaret L. McLaughlin (ed.), Communication Yearbook 10. Newbury Park: Sage, 743⫺757. Eco, Umberto (1972), Einführung in die Semiotik. München: Fink. Eco, Umberto (1987 a), Semiotik. Entwurf einer Theorie der Zeichen. München: Fink. Eco, Umberto (1987 b), Apokalyptiker und Integrierte. Zur kritischen Kritik der Massenkultur. Frankfurt a. M.: S. Fischer. Enninger, Werner und Stephen Scott (1985), „Kutschen als Dinge und Zeichen. Zur Semiotik des Fahrzeug-Designs“. Zeitschrift für Semiotik 7, 367⫺382. Früh, Werner und Klaus Schönbach (1982), „Der dynamisch-transaktionale Ansatz“. Publizistik 27, 74⫺88. Gagnon, Diana, Russell Neuman, Lee McKnight und Ann Fryling (1986), Interactive Entertainment Television: A Study Series. Cambridge MA: Massachusetts Institute of Technology, Audience Research. Geretschläger, Erich (1983), Medientechnik I. Nonprint-Medien. München: Ölschläger. Giesecke, Michael (1991), Der Buchdruck in der frühen Zeit: Eine historische Fallstudie über die Durchsetzung neuer Informations- und Kommunikationstechnologien. Frankfurt a. M.: Suhrkamp. Goffman, Erving (1981), Forms of Talk. Oxford: Basil Blackwell. Graumann, Carl Friedrich (1972), „Interaktion und Kommunikation“. In: Handbuch der Psychologie, VII, 2: Sozialpsychologie. Göttingen: Hogrefe, 1109⫺1262. Haarmann, Harald (1990), Universalgeschichte der Schrift. Frankfurt a. M.: Campus. Hall, Edward (1966), The Hidden Dimension. Garden City NY: Doubleday. Jeffres, Leo W. (1986), Mass Media. Processes and Effects. Prospect Heights IL: Waveland. Jürgens, Ekkehardt (1984), „Deutsche Mediengeschichte: Ein Überblick vom Buchdruck zum Hörfunk (1445⫺1945)“. In: Modellversuch Journali-
Kittler, Friedrich (1986), Grammophon, Film, Typewriter. Berlin: Brinkmann und Bose. Kledzik, Silke M. (1990), „Semiotischer versus technischer Medienbegriff. Das Medium als Konstituens des Zeichenprozesses“. In: Karin BöhmeDürr, Jürgen Emig und Norbert M. Seel (eds.), Wissensveränderung durch Medien. München: Saur, 40⫺51. Kluge, Alexander (1985), „Die Macht der Bewußtseinsindustrie und das Schicksal unserer Öffentlichkeit“. In: Klaus von Bismarck, Günter Gaus, Alexander Kluge und Ferdinand Sieger (eds.), Industrialisierung des Bewußtseins. Eine kritische Auseinandersetzung mit den „neuen“ Medien. München: Piper, 51⫺129. Knapp, Mark L. (1978), Nonverbal Communication in Human Interaction. New York: Holt, Rinehart und Winston. Knilli, Friedrich (1979), „Medium“. In: Werner Faulstich (ed.), Kritische Stichwörter zur Medienwissenschaft. München: Fink, 230⫺251. Köhler, Wolfgang (1917), Intelligenzprüfungen bei Anthropoiden. Berlin: Verlag der Königlichen Akademie der Wissenschaften. Koszyk, Kurt (1987), „Zur Soziologie der Medientechnik“. In: Manfred Bobrowsky und Wolfgang R. Langenbucher (eds.), Wege zur Kommunikationsgeschichte. München: Ölschläger, 223⫺234. Kowal, Sabine (1991), Über die zeitliche Organisation des Sprechens: Pausen, Redetempo und Verzögerungen in Fernsehinterviews und Reden von Politikern. Bern: Huber. Kübler, Hans-Dieter und H. Gerd Würzberg (1982), „Medienforschung“. In: Medienpsychologie. München: Urban und Schwarzenberg, 96⫺117. Langenheder, Werner (1988), „Wissenschaftssoziologische Perspektiven der Technikbewertung“. In: Walter Bungard und Hans Lenk (eds.), Technikbewertung. Philosophische und psychologische Perspektiven. Frankfurt a. M.: Suhrkamp, 261⫺282. Ludwig, Hans-Werner (1979), „Schallplatte/Tonband“. In: Werner Faulstich (ed.), Kritische Stichwörter Medienwissenschaft. München: Fink, 277⫺315. Maletzke, Gerhard (1965), Psychologie der Massenkommunikation. Hamburg: Hans Bredow-Institut. Mattelart, Armand und Yves Stourdze´ (1982), Technologie, culture et communication. Paris: La Documentation Franc¸aise. McBride Commission (1987), „Many Voices, One World“. In: Oliver Boyd-Barrett und Peter Braham (eds.), Media, Knowledge and Power. London: Croom Helm, 5⫺31.
14. Technische Medien der Semiose McLuhan, Marshall (1964), Understanding Media: The Extensions of Man. New York: The New American Library. Meier, Werner und Heinz Bonfadelli (1987), „Neue Medien als Problem der Publizistikwissenschaft“. In: Rundfunk und Fernsehen 35, 169⫺184. Meyn, Hermann (1984), Die neuen Medien. Berlin: Colloquium Verlag. Morris, Charles W. (1973), Zeichen, Sprache und Verhalten. Düsseldorf: Schwann. Neuman, W. Russell und Ithiel de Sola Pool (1986), The Flow of Communications into the Home. In: Sandra J. Ball-Rokeach und Muriel G. Cantor (eds.), Audience and Social Structure. Newbury Park: Sage, 71⫺86. Noelle-Neumann, Elisabeth, Winfried Schulz und Jürgen Wilke (1989), Fischer Lexikon Publizistik, Massenkommunikation. Frankfurt a. M.: Fischer. Oberliesen, Rolf (1982), Information, Daten und Signale. Geschichte technischer Informationsverarbeitung. Reinbek bei Hamburg: Rowohlt. O’Sullivan, Tim, John Hartley, Danny Saunders und John Fiske (1985), Key Concepts in Communication. London: Methuen. Peer, Willie van (1994), „Zeichenverstümmelung: Geschichte und Funktionen“. Zeitschrift für Semiotik 16, 319⫺332. Pool, Ithiel de Sola (1983), Technologies of Freedom. Cambridge MA: Harvard University Press. Posner, Roland (1982), Rational Discourse and Poetic Communication. Methods of Linguistic, Literary, and Philosophical Analysis. Berlin: Mouton. Posner, Roland (1985), „Nonverbale Zeichen in öffentlicher Kommunikation. Zu Geschichte und Gebrauch der Begriffe ,verbal‘ und ,nonverbal‘, ,Interaktion‘ und ,Kommunikation‘, ,Publikum‘ und ,Öffentlichkeit‘, ,Medium‘ und ,Massenmedium‘ und ,multimedial‘ “. Zeitschrift für Semiotik 7, 235⫺271.
383 Riepl, Wolfgang (1913), Das Nachrichtenwesen des Altertums. Leipzig: B. G. Teubner. Rogers, Everett M. (1986), Communication Technology. The New Media in Society. New York: The Free Press. Ropohl, Günter (1988), „Zur Technisierung der Gesellschaft“. In: Walter Bungard und Hans Lenk (eds.), Technikbewertung. Philosophische und psychologische Perspektiven. Frankfurt a. M.: Suhrkamp, 79⫺97. Rühl, Manfred (1988), „Zur Technisierung freiheitlicher Publizistik ⫺ jenseits von Neuen Medien und Neuer Technik“. In: Walter Bungard und Hans Lenk (eds.), Technikbewertung. Philosophische und psychologische Perspektiven. Frankfurt a. M.: Suhrkamp, 343⫺377. Salomon, Gavriel (1979), Interaction of Media, Cognition and Learning. San Francisco: JosseyBass. Saxer, Ulrich, Wolfgang Langenbucher und Angela Fritz (1989), Kommunikationsverhalten und Medien. Lesen in der modernen Gesellschaft. Gütersloh: Bertelsmann Stiftung. Schank, Gerd und Gisela Schoenthal (1976), Gesprochene Sprache. Tübingen: Niemeyer. Schenk, Michael (1987), Medienwirkungsforschung. Tübingen: Mohr. Scherer, Klaus R. (1977), „Kommunikation“. In: Theo Herrmann, Peter R. Hofstätter, Helmut P. Huber und Franz E. Weinert (eds.), Handbuch psychologischer Grundbegriffe. München: Kösel, 228⫺239. Scherer, Klaus R. und Harald G. Wallbott (eds.) (1979), Nonverbale Kommunikation: Forschungsberichte zum Interaktionsverhalten. Weinheim: Beltz. Schmitt, Günter (1990), Schriftsetzer, Typograph: Ein Beruf im Wandel der Zeit. Stuttgart und Aarau: AT-Verlag. Schönbach, Klaus und Werner Früh (1984), „Der dynamisch-transaktionale Ansatz II: Konsequenzen“. Rundfunk und Fernsehen 32, 314⫺329.
Posner, Roland (1989), „What is Culture? Toward a Semiotic Explication of Anthropological Concepts“. In: Walter A. Koch (ed.), The Nature of Culture. Bochum: Brockmeyer, 240⫺295.
Schreiber, Erhard (1980), Repetitorium Kommunikationswissenschaft. München: Ölschläger.
Pross, Harry (o. J.), Medienforschung. Film, Funk, Presse, Fernsehen. Darmstadt: Verlagsbuchhandlung.
Schulz, Winfried (1975), „Wirkungsqualitäten verschiedener Medien“. Rundfunk und Fernsehen 23, 57⫺72.
Rapp, Friedrich (1988), „Die Idee der Technikbewertung“. In: Walter Bungard und Hans Lenk (eds.), Technikbewertung. Philosophische und psychologische Perspektiven. Frankfurt a. M.: Suhrkamp, 98⫺117.
Siemoneit, Manfred und Wolfgang Zeitvogel (1986), Satzherstellung⫺Textverarbeitung. Frankfurt a. M.: Polygraph.
Ratzke, Dietrich (1982), Handbuch der Neuen Medien. Stuttgart: Deutsche Verlags-Anstalt. Rice, Ronald E. (ed.) (1984), The New Media. Communication, Research, and Technology. Beverly Hills: Sage.
Silbermann, Alphons (1982), Handwörterbuch der Massenkommunikation und Medienforschung. Bd. 1 und Bd. 2. Berlin: Volker Spiess. Slack, Jennifer Daryl (1984), Communication Technologies and Society. Conceptions of Causality and the Politics of Technological Intervention. Norwood NJ: Ablex.
384
II. Aspekte der Semiose
Steinbuch, Karl (1966), Die informierte Gesellschaft. Geschichte und Zukunft der Nachrichtentechnik. Stuttgart: Deutsche Verlags-Anstalt. Steinfield, Charles W. (1987), Theories of Organizations and Information Technology. Newburry Park CA: Sage. Stiebner, Erhardt, Heribert Zahn und Wilfried Meusburger (1985), Drucktechnik heute. München: F. Bruckmann. Stone, Gerald (1987), Examining Newspapers. Newbury Park: Sage. Wartella, Ellen und Byron Reeves (1985), Historical Trends in Research on Children and the Media: 1900⫺1960. Journal of Communication 35, 118⫺133. Wersig, Gernot (1985), „Das Feld der Begleitforschung: Neue Technologien, neue Medien, neue Dienste“. In: Petra Schuck-Wersig und Gernot
Wersig (eds.), Akzeptanz neuer Kommunikationsformen. München: Saur, 8⫺27. Wilke, Jürgen und Elisabeth Noelle-Neumann (1989), „Pressegeschichte“. In: Elisabeth NoelleNeumann, Winfried Schulz und Jürgen Wilke (eds.), Fischer Lexikon Publizistik, Massenkommunikation. Frankfurt a. M.: Fischer, 287⫺313. Winterhoff-Spurk, Peter (1989), Fernsehen und Weltwissen. Der Einfluß von Medien auf Zeit-, Raum- und Personenschemata. Opladen: Westdeutscher Verlag. Wolf, Mauro (1977), Gli apparati delle communicazioni di massa. Florenz: Guaraldi. Wulff, Hans J. (1979), „Medium und Kanal“. In: Zur Terminologie der Semiotik I. Münster: MAkS, 37⫺67.
Karin Böhme-Dürr, München (Deutschland)
15. Social media of semiosis 1. Introduction 2. Institutions, meaning, mediation 3. Defining and delimiting the social media of semiosis 4. Syntactics, semantics and pragmatics 5. Anthropology as a discipline (de-)constructing the social media of semiosis 6. Selected references
1.
Introduction
The explication of the notion “social media” in relation to “semiosis” is a particularly complex and contentious undertaking. Not one of the three main terms: “social”, “media”, “semiosis”, is easily delimited in this respect. Each of them circulates currently in a number of very different contexts, some of which would define themselves as within semiotics, others of which would not. Moreover the definition of all three terms and of their interrelationships is intricately bound up with a number of central disciplinary boundaries and a variety of discursive contradictions and conflicts within the human and social sciences as these are currently constituted. Thus in the first instance the term “social” cannot be separated from its construction within modern sociology itself and within a modernist paradigm of the human and social sciences. This paradigm involves all those
theoretical texts or metanarratives which have constructed the institutionalised and socially ratified versions of “modernity”. It includes the work of many men, from Hegel and Marx through Weber to Mead and Durkheim, with side glances at Freud, to Parsons and Luhmann and Habermas, to name only the major authors of modern theories of social differentiation. Beginning with Hegel’s division of modern ethical life into the spheres of the family, civil society and the state, their theories have reduced the plurality of social life to a hierarchy of differentiated spheres, commonly known as the social division of labour. The story is a patriarchal, middle-class story of meritocracy and equality, where harmony in the social order is based on the co-operation between interdependent, but autonomous, specialised vocations or spheres. What is occluded from this social division of labour, from this constructive classification and differentiation of the social, are the people, the heterogeneous and competing voices and sexed bodies, the racial, ethnic and class divisions, the conflict and the relations of power, the interpersonal labour of making and transmitting meanings, which a different classification and another story might make audible and visible. In the dominant modernist version however, it is Hegel’s and Durkheim’s state, the social sys-
385
15. Social media of semiosis
tem and its institutions (the body corporate/ the collective conscience) which embody the “ultimate values” of the social and which articulate and maintain them. The metaphors are not accidental: the individual who speaks, who means, who acts, and who does these things in specific contexts and in and through a socially constructed identity and sexed body, is thus disembodied, universalised and incorporated into the social as institution. One consequence of this is that none of these approaches has ever seriously taken up the question of semiosis, or rather that the business of semiosis has been carefully contained and controlled, in these narratives. It is contained by being framed and located within the social, and kept carefully apart from the cultural, the objective, reason and the system. That is, while the social may be conceived as a community of agents whose agency constructs the world in which they live (Yeatman 1987, 10), these other spheres are constructed (by these very world-constructing agents) as separate from the social and are thus cacooned from the processes of meaning-making. This happens because of the semantic dualisms that structure the dominant approaches. One realisation of this is the fact that social theory has so seldom concerned itself with language as a social medium of semiosis (if you exclude the people who talk and write this is relatively easily done) or indeed with the problem of non-verbal semiosis in its broadest sense. There are exceptions (cf., e. g., Art. 142, Art. 147, Art. 168 and Art. 169 in this Handbook) and I will discuss some of these below. The binary structure of modernist constructions of reality: individual/social, subjective/objective, reason/emotion and so on, is realised in sociology’s own versions of these dualisms: structure/agency, social structure/culture, social/psychological, and family/ society, for example. Anna Yeatman (1987, 17) has pointed to the fact that, “charged with the role of elaborating the idea of the social”, sociology has fallen back on the central dualistic convention of opposing the social and the natural, identifying the “natural” aspects of human actors with their individual aspects, and thus maintaining the modernist fiction of the opposition of individual and society. “The consequence is that the idea of the social is identified with transindividual, non-individual and, even, anti-individual values” (Yeatman 1987, 17). This is how it happens that institutions and organis-
ations, bureaucratic, political and economic systems, to name only a few, come to be identified as the social, “Durkheim’s great collective representations”, while precisely what needs explaining, “the similarity of millions of people”, is left out of account (Deleuze and Guattari 1987, 218). Exactly the same move was made by de Saussure (1916 ⫽ 1961, 15) when he constructed langue as the social and excluded parole from the purview of his synchronic linguistics. Now this has very precise effects, within this same modernist paradigm, on the way that “medium” has tended to be defined in relation to “semiosis”, or the making of meanings. Thus in Art. 4 of this Handbook “medium” is a regular category in the graphic representation of the elements of the communication situation. The author (Posner) characterizes it as what “connects” sender and addressee (Art. 4 § 3.1.). Here, then, the medium is very broadly defined as that materiality through which the process of semiosis will take place, the expressionmatter (Hjelmslev) through which meanings may be realised. Presumably natural languages in their written or spoken forms, forms of visual representation, aspects of the built environment, and bodily activities and behaviours including tactile, optic, or chemical channels of communication and so on would be media in this sense. Here then Posner is using the term “medium” to cover a whole range of channels and means of realising meanings which need further definition. In this section of the Handbook, the article headings already indicate one common way of defining these differences. Thus a channel is specified as the mode of access an organism or machine has to an object which it takes as a sign of something else; a code may be used to interpret this relationship; and the entire process will take place within a biological, social or technical medium (cf. Art. 14). With respect to the last two the assumption is that social institutions and technical instruments operate in various ways to constrain semiosis, but are not semiosic themselves. Just precisely what this means, and the consequences of again separating off the social, this time from the technical and the biological, needs further explanation and exploration.
2.
Institutions, meaning, mediation
The story of social differentiation is embedded in another story. This is the story that
386 Meaghan Morris has alluded to in her critique of Jean Baudrillard’s analysis of postmodernity and in her discussion of the nostalgia for “the lost referential” or a lost realism in other post-modernist critics (1988, 195 ff; 262 ff). It is the modernist narrative familiar from Marx and Weber, but ubiquitous in the major texts, of an originary historical moment of simplicity and harmony, a progress and an evolution towards greater and greater complexity, the associated processes of disenchantment and reification/alienation, and the system’s complexity which incorporates/engulfs the individual in the classic versions of “modernity”. The story ends with the loss of enchantment, the questioning and the end of legitimacy, but it is also, in Weber, a story of a modernist brave new world of intellectual freedom from magic, the sacred and other tyrannies. It is a story based on the unlikely assumption that legitimacy ever existed uncontested anywhere, that incoherence and doubt, and the fragmentation of identities are new arrivals, like the technologies of urbanisation and industrialisation. It is a story that Weber structured for us in terms of the institutions that we know (religion, the law, class, property, the economy, the division of labour, knowledge, the aesthetic and so on), so that the problems of rationality are presented as problems that only arise in the development and conflicts of these institutions. Societies which do not have them cannot be rational. It is thus a story that is profoundly structured by the binarism primitive/cultured and by the belief that a deep division separates our experience of society from that of those “others” who people the written records of the ethnographer, the anthropologist, or the missionary. And it is a story which never escapes its Hegelian origins in the assumption that the history of the world’s institutions records the steady evolution of self-consciousness from primitive forms of mental activity to modern ones. The ubiquity of the story ⫺ and Douglas points, in addition to the examples mentioned above, to its counterparts in Frazer’s mythological golden bough and River’s colonial model of the psyche ⫺, the fact that they all speak “in chorus”, is, so she argues, because the same institutions were doing their thinking (Douglas 1987, 94⫺100). Despite Durkheim’s participation in the telling of this communal story then, Douglas regards him as having provided a tool for discovering, making visible, our own otherwise
II. Aspekte der Semiose
unconscious collective representations: “The high triumph of institutional thinking is to make the institutions completely invisible” (1987, 98). When all the great thinkers of a period agree that the story I have outlined above is a believable one, then there is “incontestably a collective representation” (Douglas 1987, 99): and despite his belief in the difference between primitive and modern thought, Durkheim would have to agree that, in the case of this story, primitive solidarity based on shared classifications is not completely lost from the modern world. It is the same story that has been deconstructed and criticized recently in a number of feminist (Pringle 1988; Waring 1988; Pateman 1988; Diamond and Quinby 1988 ⫺ for example) and other publications (Hill 1988). Pringle has insisted on the relations between subjectivity, sexuality, work and culture, and has argued cogently for the importance of the ideological and the symbolic in the construction of the economic. She points to the persistence of Weber’s influence on the way that people still theorise bureaucracy and organisation, demonstrating just how hard it is to tell other than the dominant story of modernity. According to Weber, bureaucracy has a “rational” character: rules, means, ends, and matter-of-factness dominate its bearing … “The march of bureaucracy has destroyed structures of domination which had no rational character, in the special sense of the term” (Gerth and Mills 1958, 244). For Weber bureaucracy is progressive in that it breaks down older patriarchal structures and removes the arbitrary power held by fathers and masters in the traditional forms of society. According to him, “bureaucracies are based on impersonality, functional specialisation, a hierarchy of authority and the impartial application of rules”. “Above all there is a separation of the public world of rationality and efficiency from the private sphere of emotional and personal life” (Pringle 1988, 85⫺6). As Pringle points out, Weber has been given a favourable reading by liberal feminists (for example Kanter 1977) because he does appear to provide some basis for understanding the breakdown of patriarchal relations. Thus Equal Opportunity and Affirmative Action plans stress the importance of excluding the ‘private’ in favour of the impersonal application of rules. Secretaries are urged to reject sexual and familial images and focus on skills and careers: secretarial work
15. Social media of semiosis
is to be “rationalised” to fit the bureaucratic pattern, and sex or gender specificity is relocated in power relations and once again occluded. Pringle argues that even radical, “postmodernist” feminists find themselves reproducing, in that they are “being spoken by”, the “core” of “truth” in the Weberian narrative which makes it very difficult to tell a different story of the workplace, and of organisational behaviour. It is precisely the recalcitrance of such “stories” that Whorf’s much misunderstood and criticised theory of linguistic relativity is really about (Whorf 1956; Rossi-Landi 1973; Threadgold 1987). It is that “core” that Pringle sets out to deconstruct, demonstrating that the boss⫺secretary relationship counters every one of Weber’s criteria and suggesting that there are enormous problems with the way bureaucracy has been theorised (1988, 86 ff). She shows very convincingly that whereas organisation theory constructs bureaucracy as separate from sexuality and the family, it is not: that what she identifies as the three discourses, master⫺slave, nanny/ mother⫺child and “team”, operate across all the workplaces and organisations that she investigates, in juxtaposition with a variety of constructed styles of masculinity ranging from working-class brutality, gentlemanly sadism, paternalism, liberal rationality, socialist mateship to fraternal back-slapping (Pringle 1988, 130⫺31). It is against this different contextualisation of “work” and organisations that Pringle reassesses and retells the “modernist” narrative through the secretary⫺boss relationships that she investigates, exploring issues like technology and the labour process and the troubled question of women and class, work and home. In the first case she shows that these “decidedly masculine domains” which are usually constructed as the domain of the struggle for control between capital and labour, are in fact structured as much by gender and sexuality as by struggles about ownership and the means of production. In the second she argues that class is created out of the relations between work and other dimensions of people’s lives, including the divisions between work and home, public and private life, production and consumption, where the first term in each pair is usually associated with the masculine and positively evaluated, while the “other” terms remain part of a shadowy, feminine realm of existence.
387 Shadowy, that is, if one is a man, for whom the world is organised in this way, but not if one is a woman and lives this “other” side of the world of masculine experience. Thus her argument is that there is another story to be told which involves the fact that these divisions are experienced differently by men and women and which would deconstruct many of the standard “truths” of the core of the modernist Weberian story of organisations and bureaucracy with which we began (Pringle 1988, 212; ch. 10). The reason for digressing at such length over this feminist story is that it is an attempt to subvert the usual isolation of the social, defined as we saw it above as the institutional, the organisational, the system, from its “others”, nature, the individual, the everyday, women, sex, to name just a few. And it is not alone. Marilyn Waring’s book (1988) performs a similar function with respect to the masculine construction of economics, focussing on the United Nations System of National Accounts and the way in which it systematically excludes women, children and the environment from its very selective and partial view of the way the economic world works (for an account of the cultural consequences of sex differences in human communication cf. Art. 13 § 5.2.). When one turns to those areas of research which explore what goes on within institutions and organisations in terms of organisational behaviour, leaving the canonical texts of Weber and Durkheim aside for the moment, one finds now a range of approaches. These are as varied as: individualistic, economically-oriented cognitive educational psychology, socio-technical systems analysis and scientific method (Steers 1981); Habermas’ theory of communicative action (1984, 1987); the structuralist functionalism of Bourdieu (1984, 1990); the poststructuralism of Foucault (1963, 1966, 1972); the work on hegemony and discourse of Laclau (1990) and Laclau and Mouffe (1985); and the rewriting of organisational theory in radical sociology which emerges from these debates and differences (Clegg 1989). There are also approaches which start from another perspective to deconstruct the sociological bases of organisational theory in an “attempt to bring sociology back to its origins, namely an exploration of fellowship (socius) through the analysis of reciprocity against the revenge of institutions and rationalism”. The approach quoted here argues that Nietzsche is the ab-
388 sent giant of contemporary social thought (Stauth and Turner 1988). The first of these approaches (exemplified in Steers 1981) is very much concerned with the interaction between the social system (groups and individuals) and the technical system (the nature of jobs), and all of the emphasis is on individual and group behaviours and the management of these for higher productivity. The individual is conceived as a self-knowing subject. Power relations are left implicit and the accounts are specifically apolitical. The question of language and the way it might function in these interactions, or the question of semiosis, the way systems of meanings and typical practices of making meanings might be involved in any of the aspects of organisational behaviour is never addressed, except in the most unproblematic terms as taken-forgranted “communication systems” and “information control mechanisms”. Thus: “Systems receive information from the environment, employ coding procedures that screen out certain information, and receive feedback from the environment in response to system activities. Systems are directed and redirected based on information” (Steers 1981, 31). From Barnard’s (1938, 73) early definition of an organisation as “a system of consciously co-ordinated activities of two or more persons” organisations have been typically defined in this literature as “having stated purposes, communications systems and other coordinating processes, and a network of individuals who willingly cooperate on tasks that are necessary for specific goal attainment” (Steers 1981, 29). Organisations are also described as the “work setting”, the social and technological milieu in which employee behaviour occurs, a technological structure which constrains such behaviours (all involving a reification of the organisation as “real”, as context for behaviour, and as instrument or conduit which simply transmits information, discipline and so on) and as open systems which continually interact with their environments in a series of exchange relationships (inputs, throughputs and outputs) which are always aimed at furthering the well-being of the organisation and its members (this is a fundamentally economic metaphor) (Steers 1981, 28⫺30). Both conceptualisations depend on an essentially Weberian concept of organisations as bureaucracies which operate according to a means-ends instrumental rationality. The emphasis is always on goal-seeking, community, coordina-
II. Aspekte der Semiose
tion, coalition and cooperation, and on the satisfaction of individual and therefore of group (the logical connection is never questioned) needs and goals (Steers 1981, ch. 3). In this respect these approaches are also realisations of what Perrow calls “the new economic models based on individual competitive self-interest: agency theory and transaction-costs economics“ (1972, 220). Perrow (1972) himself provides an excellent early critical account of the vicissitudes of organisational theory from Weber’s rational-legal bureaucracy through the human relations model, the neo-Weberian model, the institutional school, theories of the environment, economic theories of organisation, to the issue of power in organizational analysis. His analysis provides the critical tools to analyze the intertextual history of a text like Steers’. It also foregrounds the problems inherent in Steers’ kind of a-semiotic approach to organisations for an account like this which would want to explore the possible meanings of the notion of organisations as the social media of semiosis. The Steers (1981) text is structured by a discourse which always subjects the interests of the individual to the common good. It is a discourse which Stauth and Turner (1988, 224⫺27) have identified, after Nietzsche and Baudrillard, as among the “discourses of simulation”. This is worth exploring here because it returns us to the question of the relationship between semiosis and the making of organisational practices and institutions, something which is elided altogether in Steers’ account of organisational behaviour. Stauth and Turner see the discourses of simulation as structured around two fundamental types of human activity identified in Nietzsche’s philosophical discourse, the aesthetic and the moral. The aesthetic is an affective, immediate and direct way of transforming one’s will into action; the moral is a form of action in which will is denied. In general, in the discourse of simulation, success has to be demonstrated to be the denial of will and personal interest. Human intention has to be masked or disguised to construct will as moral. Thus individual will is denied and will in general remains. Moral action comes to designate the interests of the general population and the universal community. In this way specific individual interests come to be constructed as synonymous with a general will. “This camouflage of the will is what
15. Social media of semiosis
Nietzsche called the ‘holy lie’ in The AntiChrist” (Stauth and Turner 1988, 224). Within Nietzsche’s philosophy, morality as a form of social behaviour is a form of simulation. Culturally specific discourses which attribute meaning to persons, things and beings (to action) become mechanisms of simulation and these can be called “the organisation”. These simulative discourses are regulating organisational discourses and they also produce forms of social regulation. They are the discourses in which the basic principles of the relation between individual and institution in modern society are represented. Stauth and Turner argue that it is because there is no fundamental system of meaning embedded in powerful organisations at the societal level within contemporary social systems that the individual seeks to rehabilitate archaic morals as a way of justifying action. Baudrillard (1981) has demonstrated how simulation becomes a fundamental aspect of the totality of modern society. As political economy collapses and organisational decisions and executions cease to be able to be regarded as necessities of economic objectivity, as the production of the sign becomes the basis of production in modern systems, so work and labour are transformed into various categories of simulation. Public services and organisational activities are now legitimised as individual sacrifices for the common benefit, the denial and reversal of individual will in the “general interest”. “It is on this basis that self-denial and sacrifice become an organisational principle of modernity” (Stauth and Turner 1988, 227). This is only one aspect of organisational behaviour, but the example illustrates an important aspect of institutions as social media of semiosis. This kind of organisation is accomplished discursively, through the semiotics of language and intersubjectivity. It is in this way that common-sense constructs institutions which go on reproducing the same patterns of commonly held beliefs and behaviours by reproducing in and through their agents the discourses which produced the institutions and the agents in the first place. Habermas too puts the question of semiosis, or communication, and its close relationship to kinds of organisations and institutional practices back on the agenda. His work participates in the discourse of a kind of speech-act theory and linguistic pragmatics which unproblematically accepts the same notions of consensus and agreement and co-
389 operation as are found in a-semiotic and apolitical accounts like Steers’ of the roles and functions of organisations in society. There are many accounts which would contest this position, but in this context it is perhaps most relevant to turn to a different way of theorising the question of speech-acts and pragmatics as forms of semiosis. Silverstein’s (1979) very complex arguments about speech-act theory and the performative analysis in linguistics is a case in point. What he argues, using Boas’ work and Whorf’s notion of cryptotypical linguistic categories, is that language always seems to native speakers to be potentially purposive, or actually effective, because of the way language is structured, and that speakers then project this cryptotypic organisation of their own language into their theorisations about the way language works. Thus he argues that it is no accident that the native theory (Austin’s) of speech-acts “matches precisely the syntactico-semantic and lexical properties of the metapragmatic discourse of the language under investigation” (1979, 213). Rumsey (1990) has followed up this work of Silverstein’s in a cross-cultural situation and comes up with the hypothesis that: “Linguistic ideologies in which there is a strongly valorised distinction between speech and action, words and ‘things’ are most likely to develop in conjunction with languages in which there are formal distinctions between (1) direct and indirect discourse and (2) ‘reference’ and ‘ellipsis/substitution’ in the sense of Halliday and Hasan (1976). […] In short, language structure and linguistic ideologies are not entirely independent of one another, nor is either entirely determined by the other. Instead the structure provides formal categories of a kind that are particularly conducive to ‘misrecognition’ (Bourdieu 1977)” (Rumsey 1990, 355; 357). This would seem to support Silverstein’s contention that the structure of language informs “linguistic ideology”. Silverstein then makes some very pertinent comments that need to be related to Habermas’ concept of a universal pragmatics. “Pragmatics cannot be done in a principled manner until the ‘Whorfian Paradox’, or Whorfian doubt ⫺ vs. Cartesian certitude ⫺ is faced squarely. This starts from seeing language as of the same ‘cultural’ order as the rest of social life” (1979, 254). This, I would suggest, is precisely what the range of other theorists I quoted above, as standing somewhat outside the Steers or Ha-
390 bermas type of approach to organisations and their relations to meaning, have been doing. It is to the work of Bourdieu, Foucault, Laclau und Clegg that I am referring here. Perrow provides a succinct account of the consequences of this kind of work for organisational theory: “Garbage can theory provides the tools to examine the process and [is] not be taken in by functional explanations. The decision process must be seen as involving a shifting set of actors with unpredictable entrances and exits from the ‘can’ (or the decision mechanism), the often unrelated problems that the actors have on their agendas, the solutions of some that are looking for problems they can apply them to, the accidental availability of external candidates that then bring new solutions and problems to the decision process, and finally the necessity of explaining the outcomes as rational and intended. […] As such, garbage can theory partakes of a general trend in the social sciences and humanities that is likely to be significant over the next decade or two. This trend can be labelled ‘deconstructionism’. For a couple of centuries we have been ‘constructing’ a world we view as organized on rational principles, where what happened was intended to happen, where interactions are discrete and quite atomistic, and where progress is continuous. The construction envisions a long age of enlightenment. The origins of this viewpoint are many. […] In psychology deconstructionism is painfully making its way by questioning our notions of personality, traits, character, and the very idea of human nature itself. […] In literature and history the work of Foucault, Claude Le´vi-Strauss, and the early Sartre attests to the importance of social context and myths and symbols ⫺ rather than conventional, unambiguous assumptions of linear development, national character and ‘real’ events ⫺ in explaining cultural production and social events. In anthropology the interaction of the anthropologist with the subjects is stressed, showing how Western values have been used to interpret the culture under examination […]. In social psychology the sudden popularity of ‘ethnomethodology’ (the ‘methods’ people use to interpret one another’s actions) deconstructed forever, for some of us, the notions of rationality, functionalism, and an accepted, empirical social reality” (Perrow 1972 ⫽ 1986, 137 f). Views of organisations and organisational practices then are multiple and often contradictory. What does seem to
II. Aspekte der Semiose
emerge clearly from these examples however is that it is when language itself is taken seriously as a form of social semiosis ⫺ as a way of constructing the social and the individual, rather than as a means of exchange of readymade meanings or a consensus-based cooperative effort in maintaining social relations and the status quo, or a transparent medium or instrument for accomplishing organisational ends ⫺ that realist, functionalist, empirical, positivist and rational theories of pragmatics, of communicative competence and of organisation and institutions begin to fall apart. The consensus-based cooperative metaphors which emerge from the folk-linguistic theories about communication that we looked at above are reinforced at all kinds of everyday and theoretical levels by a whole range of other metaphors and stories (what Perrow calls myths and symbols) which equally mediate against taking the business of semiosis seriously and at the same time contribute to the semiotic and metaphorical construction of realities and knowledges. Gareth Owen (1986) has provided a fascinating account of the way this works in organisational practice and theorisation. I want to focus now on the relations between the consensus and simulation arguments outlined above, in social theory and in linguistics and pragmatics, and another set of metaphors and stories. These center around the body politic, the idea of social contract, and the construction of the whole patriarchal order within which theories/stories/metaphors/myths of organisation, of the relations of individuals and institutions, and of language as semiosis and institutions, are produced and circulate as both common-sense and theory. This will return us to the feminist story of organisation with which this section began. It will begin to introduce some of the issues about the body, about sexuality and the complex relations between embodiment, exchange and reciprocity within the everyday life-world, and about the analysis of dominant institutions within the macro-social order, that a Nietzschean and feminist sociology of organisational practice would address. Let me quote Stauth and Turner here again to clarify some of these relations: “[…] our embodied existence is fundamentally and necessarily sustained only through social relations. My embodiment is highly individualized, but it is also simultaneously and inescapably social […]. Corresponding to my
15. Social media of semiosis
embodiment, there is the economic realm of production and reproduction. Corresponding to my empowerment there is the place of politics, which is both repressive and enabling. Related to my enselfment, there is the world of culture, consciousness and ideology which institutionalises thought and communication through a system of signs. Sociology attempts to comprehend the difficult relations which exist between the macro-world of institutional regulation and the everyday world of reciprocity” (1988, 201). Carole Pateman’s (1988) trenchant analysis of the patriarchal stories of social contract theory seems to me to be negotiating and practising the kinds of analysis that are outlined in Stauth and Turner’s programmatic arguments about a Nietzschean sociology. Her work also addresses the crucial issues of language and semiosis that have been foregrounded above. Her re-writing of the social contract as the sexual contract demonstrates the way the social has been constructed as masculine, and founded on the repression of the sexual contract, the primal scene of “coitus”, and the feminine power to give birth. These elements are absent from all the patriarchal stories. Pateman’s is a feminist story which argues that the supposedly social and contractual relations at the basis of civil society must be reexamined and that in the process the ways in which freedom, the social and the individual have been constructed will have to be made visible and re-assessed. Pateman’s complex argument is that the sexual is absent from and suppressed in these stories precisely so that sexual relations can be construed as consensual, non-political, private, so that slavery can be constructed as freedom, so that the marriage contract can preserve the notion of universal freedom and incorporate women into the masculine body politic (even as women are paradoxically denied the status of individuals), so that the fiction of man’s maternity, and the always problematic question of his genetic paternity, can be preserved and secured in his political genesis, by means of the social contract, of the masculine body politic, the social body. This is the way, according to her story, which is another re-telling of the masculine modernist story, that the obvious incompatibilities of juridical equality and social inequality ⫺ naturalised and de-sexualised in the semantic oppositions social/individual, public/private, civil/natural, men/women which structure and constrain the dominant stories
391 ⫺ are made to form the basis of the story of a coherent social structure. Like Pringle she argues that political and economic life is based on sexual difference, that the sexual division of labour which is naturalised in conjugal relations extends from the private home into the public arena of the capitalist market, and that attention has to be turned to the questions of subordination and slavery (the parts of the story that are never told) which continue to haunt contract theory. The value of this alternative story, this other construal of the social as sexual, is that it undoes many of the still constantly and consistently accepted categories, classifications and framings (Bernstein 1982) of social differentiation theory, and of the dominant, masculine and institutionalised stories of the social, and it begins to redress the balance by re-making the meaning of “social” so that it includes all that the earlier stories systematically excluded. In the process it tells a very different story about semiosis, about how meanings are made or merely reproduced, discursively and through narrative. It also tells a very different story about the nature of knowledges, which in this story are no longer isolated from the interpersonal dialogism (Bakhtin 1986) of the everyday, the private and the individual. It accomplishes then a considerable re-thinking of the meanings of the terms “social”, “media” and “semiosis”. In certain respects, Pateman’s work, and Pringle’s, owes a good deal to Foucault and it even has compatibilities with those aspects of Durkheim’s work which Mary Douglas has so lucidly analysed as his concern with “how institutions do the classifying”, with how the coercive strengths of institutions are based on classifications within the individual’s head, and with how the social origin of shared classifications explains the general question of individual commitment to the social order (Douglas 1987, ch. 8). In both cases, despite the fact that Durkheim never used his methodology to critique the dominant “modernist” story while Foucault’s work does unsettle it, there is a potential challenge to the liberal and modernising assumptions behind organisation theory as it has developed since Weber and thus a potential re-classification of the category of the social insofar as it has been restricted to the institutional, the organisational, the systemic, in the dominant stories.
392 Foucaultian analyses, like Pringle’s, locate bureaucratic rationality and therefore the social, in this definition, in a very much wider context of discursive and non-discursive strategies in which sexuality and pleasure are central to the operations of power. This effectively re-writes the social to include its excluded others. Durkheim, with Weber, locates the social in the relationship between rationality and institutional forms, but he reads this relationship as a form of social semiosis, as the relationship between consciousness and social discourse. He then also reads and re-writes institutions as semiosically constructed when he explains the mutually constructive way in which social discourse, that is conversation, people talking to one another, texts (semiosis), are constitutive of institutions which produce shared classifications which in turn produce people who “think” according to these classifications. Like Durkheim, Foucault is always concerned with the way the “discursive”, realised in both linguistic and bodily, behavioural and spatial, artifactual forms (his discursive/nondiscursive categories) as the socially ratified and institutionalised discourses of power, constrains and limits what can be said and meant in a given sociohistorical moment (Foucault 1972). With Mary Douglas, Foucault is concerned to understand how specifically Western forms of rationality are produced by and through subjected bodies and minds which are “not simply constituted but also invested and traversed by relations of power-knowledge” (Morris 1988, 62), relations authorised and maintained in and through institutions. The problem for Douglas is to move beyond Foucault to the question of resistance, to understanding how a critical agent can find a way of distinguishing the effects of a “current thought style” on her own thought and still justify her judgment (Douglas 1987, 92). Her question re-introduces the question of social agency into the discussion of the social media of semiosis. In this respect her problem is the same as that with which Stauth and Turner (1988) and feminists are struggling: but for them the answer is found somewhere else. It is found in a notion of embodiment which varies according to its intertextual history. Stauth and Turner argue that “in order to understand the agent within the sociology of action, we need a theory of the embodiment of persons. A theory of embodiment is a necessary component of a concept of resistance; it is the anti-
II. Aspekte der Semiose
dote to nihilistic determinism” (1988: 200). But the Nietzschean concept of the body, of the unique individuality of embodiment, with which they are working, is quite foreign in many ways to Foucault’s account of the body as an effect of anatomical maps, political practices and juridical procedures, the product of discursive and administrative practices. This latter concept of the body has provided the impetus to much interesting feminist work on the body (Diprose and Ferrell 1991) and in psychoanalysis (Gatens 1983, 1989). The Niezschean position, which is closer to the position of the young Marx, seeks to present an account of the lived body as the focus of moral debate rather than a Foucaultian history of the rationalisation of the body by discipline. Nietzsche also had an important commitment to the value of habitual, affectual action over against instrumental rationality. This emphasis on inter-subjectivity and reciprocity, on the primacy of the “little things” of everyday life was largely absent from Foucault’s work. Nietzsche’s view of the body brings us closer to the fundamental questions raised by phenomenology and to a social phenomenology of embodiment as the seat of resistance. While these approaches are different and in some ways incompatible they nevertheless offer useful insights into ways of answering the questions about agency, in relation to organisation and system theory, raised by Mary Douglas.
3.
Defining and delimiting the social media of semiosis
In a densely argued and wide-ranging paper Posner (1986) has recently surveyed the use of the term “medium” in its complex relations to the question of verbal and non-verbal communication. Surveying the literature, he is able to distinguish six quite distinct uses of the term medium: (1) biological media, or the sense modalities of the organism, through which signs are produced and received; (2) physical media, or the material means of contact between the organs of production of the sender and the organs of reception of the receiver, such as the electro-magnetic fields through which visual sign-processes are transmitted; (3) technical media, which mediate the production and reception of sign-processes, such as pencils and paper, spectacles, telescopes, film, video cameras and cassettes,
15. Social media of semiosis
and word processors, for example; (4) social media, which are the social institutions which organise the biological, physical and technical means of sign production (thus visual sign processes are organised by social media such as galleries, museums, and libraries, through the press and the review system, through the business of publication and book production, and so on; the theater, the opera house, the sports stadium and television are other social media of semiosis in this sense, all of which involve many different means of sign production, or multi-medial sign-production); (5) cultural media, defined in their commonest forms as the genres and text-types of high and popular culture in literature, art, film and music, but also recognised as characteristic of newspapers, radio and television, as circulating in and through biological, physical, technical and social media, and being sign-systems which have the goal of transmitting information; (6) coding media, or systems of rules which allow sign-users to code knowledge/information in sign-production and to decode it in sign-reception (examples are books or television programs in different languages, or different styles of musical or architectural composition, such as homophony/polyphony, tonal/atonal, romantic/neo-romantic/gothic and so on). Posner is well aware of the inadequacies of this sketch of a system for distinguishing different types of media (1986, 303), and of the way it tends to conflate the senses of code, channel, medium and text-type, and to leave the question of the differences between medium, mass media, and multi-medial unanswered (297 f). However it provides a useful starting point for this discussion because of the way in which it delimits social media as social institutions and thus relates to the arguments in the last section. Distinguishing the use of the term “media” from the sense of mass communication in the public sphere (290 f), he defines “medium” as a system that makes a certain type of communication possible: a system of means for the production, distribution and reception of signs which imposes certain constraints on sign-behaviour (293; 302). Then, depending on the kind of means which are constant for a medium it can be defined as a perceptual, physical, technical, social, cultural or coding medium. A technical or social medium which serves mass communication is called a “mass medium”. A communication which is mediated by technical media and requires at least
393 two perceptual modalities, is multimedial (302 f). The categories and separations of this account are congruent with the theoretical constructions of the social in sociology which I discussed above. While in fact there is a constant process of mise-en-abıˆme or embedding in Posner’s construction of these six categories, so that the fourth (the social) and the fifth (the cultural) are dependent on those that precede them for their means of production, nevertheless the dualisms nature/culture, culture/social, individual/social structure, and code/behaviour are central to Posner’s work. In this framework the meaning of “social media of semiosis” is restricted to the role of institutions, of organisations, of the social system, in the mediation of semiosis. In other models it is social agents, people ⫺ constructed within and constructing institutions, who also labour to produce, to use and to change technologies, systems of information and belief, knowledges, codes, genres and text-types and all the ‘languages’ of semiosis ⫺, who ‘mediate’ the social production of meaning. In such models things, products, cannot then be categorically separate from this social labour which produces them. All of them ⫺ institutions, technologies, codes and genres for example ⫺ are among the social media of semiosis in and through which the social and the individual are themselves constructed. This at least is the way a Bourdieu (1984, 1990), a Rossi-Landi (1973, 1977), a Greimas (1987), a Barthes (1967), a Kristeva (1980, 1984) or a Foucault (1979 ⫽ 1982, 1972 ⫽ 1985) would see it. There are thus several quite distinct and not entirely compatible paradigms which work with concepts that could be defined by the term “social media of semiosis”, ranging from linguistics and semiotics itself to anthropology and literary studies, action theory and systems theory in social theory, organisation and decision theory, the theory of institutions, theories of power and of ideology, economic theory and studies of mass media and communication. If we move into the interdisciplinary area of approaches like poststructuralism (cf. Art. 122), deconstruction, psychoanalysis, feminism and again semiotics then the concern with representation, with the way that knowledges, beliefs and realities are constructed, not given, and are reproduced, negotiated and transmitted through many different media, has meant that the interpreta-
394 tion of social media of semiosis has been very broad indeed. Concomitantly there has been a socio-cultural and theoretical breakdown of the boundaries between the actual media industries, and the institutions which were defined as social media of semiosis in Posner’s account, and the rest of the economy. The media and these institutions now have to be seen as part of a whole network of cultural and economic practices. They cannot simply be read any more in terms of their ‘constructedness’, or their function as transmitters of information or knowledge, an approach which has always been based on a belief in the possibility of naturalistic and undistorted representation. Nor will it do to only read the verbal as semiosis and other things as media or technologies for its production. The hierarchy of semiotics, which has always in Western culture placed the verbal at the top, and devoted all the means of analysis to it (cf. Art. 33 § 3. and Art. 61), is no longer sacrosanct. In the context of a multicultural society, or of transcultural multiculturalism, the question of hierarchies of sign systems, and of the sign systems which are dominant in different cultures, raises the issue of the need to analyse and understand media such as the visual, film, radio, television, sound, and so on, and institutions such as museums, libraries, theatres and universities, in their own right, as semiotic systems with the potential for meaning production and cultural transformation. In this sense what were once seen instrumentally as the only ‘social’ media of semiosis or as ‘only’ the social media of semiosis, are now read as technologies for the reproduction of culture and the formation of social subjects. The changing fortunes of the categories of the “social”, “medium” and “semiosis” then have to be seen as part of that postmodern condition which involves global changes in economic conditions and a radical change in the way culture is produced, circulated, read and consumed. These changes are part of a complex network of developments that have emerged out of conflicts between traditional economic models and new social formations, and the sets of competing and incompatible discourses which currently construct the domains of the modern and the postmodern respectively. But the struggle against the ideals and the aesthetic of modernity is not limited to the rewriting of its canonical texts, or to a call to open up texts to the heterogeneity
II. Aspekte der Semiose
of meanings which they embody and mediate, it is also firmly located in a political project and a political context: the need perceived by postmodernist cultural criticism and feminism to decenter the priviledging of Western patriarchal culture in a context where that culture is already being undermined by fundamental political and technological changes, transformations in the nature and forces of production, and the emergence of new forms of cultural theory and criticism. The semiotic and discursive consequence of these various ‘writings’ of the concepts of the system, the social and society, and of semiosis and media, is a whole complex repositioning in a semantic field and a social space of these concepts in relation to one another. The role of language in this process, of discourse, not as an abstract system, but as a social medium of semiosis, a set of recurring metaphors and narratives, a set of discursive statements, that set out to describe and analyse, and become a technology for constructing, a new social reality, cannot be underestimated. A number of recent accounts of what would once have been called technological media of semiosis (photography, or technology writ large) or social media of semiosis (the museum) actively contest the categorisations on which these descriptions in an older semiotics were based. Tagg (1988) writing on photography argues that a classical semiotic account of immanent systems and codes of meaning cannot specify the institutional nature of signifying practices, their patterns of circulation in social practice, or their specific modes of cultural production, but also refuses the hierarchical Marxist models, arguing that “there are no necessary and binding links between conditions of existence and modes of production and effects at the level of signification” (1988, 30), “only a complex of processes of production of meanings going on under definite historical constraints and involving the selective and motivated mobilisation of determinate means and relations of production in institutional frameworks whose structures take particular historical forms. The institutions, practices and relations offer multiple points of entry and spaces of contestation ⫺ and not just on the margins” (1988, 30). And the photographic medium in this account is very specifically not an innocent technology in the service of the transmission of a message or the repre-
15. Social media of semiosis
sentation of a reality. It is “a discriminatory technical, cultural and historical process in which particular optical and chemical devices are set to work to organise experience and desire and produce a new reality ⫺ the paper image, which through yet further processes may become meaningful in all sorts of ways” (1988, 3). The medium is semiosic as well as technological. Likewise in his book on technology, Hill (1988), re-writing the “tragedy of technology”, insists that the power of technology to command culture depends on a world-view that accepts system order over human autonomy and that this is only accomplished by the properties of technology “as cultural text, a text that according to the cultural values built into its original form and ‘grammar’, developed the power to emerge as a cultural frame for the constitution of cultural meanings across all reaches of contemporary life” (1988, 231). Technology too then is re-written as not merely instrument or use-value but as having cultural and semiosic properties. Lumley (1988) is one text that reads social medium in a more traditional way and talks of the museum as a medium, competing with the news media, television and radio as media for transmitting the cultural, and maintains the definition of writing, sound recording and so on as technologies. Yet even here there is a co-existence of a different discourse, when it is declared that the notion of the museum as a collection of scholarly objects “has been largely replaced by the idea of the museum as a means of communication”, that the notion of reference to the “real”, so fundamental a part of museology, is now in question as museums become multi-medial events which construct “models of the real without origin or reality: a hyperreality” (1988, 14). Thus instead of being instrumental sites or media for the transmission of knowledge or facts about reality, museums are re-written as signifying practices which mediate the production of culture as semiosis. Now I want to suggest that all of these texts in their various ways participate in the discursive metaphoricity and construction of semiotics itself. All of them construct new meanings for the categories social/society, medium and semiosis, and, in the process, for the categories technology and discourse. They construct a new semantic field of relations between those terms, which is non-hierarchical, without a centre, and in which the
395 terms are defined by the shifting and overlapping ways in which they circulate within it. It is a semantic field which in turn constructs a new semiotics of social space, and a radically new concept of the function of a semiotic medium within or in relation to that social space. One of the easiest ways to conceptualise what is happening here is to think in terms of a shift in metaphors for describing the social and cultural order. The work of Deleuze and Guattari (1987, 6; 21) is a classic site to view this process of metaphoric change in action as they re-write linguistic trees as rhizomes, and, with them, the Marxist base-superstructure hierarchy as a flattened-out network of multiple nodes in social space: “Principles of connection and heterogeneity: any point of a rhizome can be connected to anything other, and must be. This is very different from the tree or root, which plots a point, fixes an order. The linguistic tree on the Chomsky model still begins at a point S and proceeds by dichotomy. On the contrary, not every trait in a rhizome is necessarily linked to a linguistic feature: semiotic chains of every nature are connected to very diverse modes of coding (biological, political, economic, etc.) that bring into play not only different regimes of signs but also states of things of differing status. Collective assemblages of enunciation function directly within machinic assemblages […]. Our criticism of these linguistic models is not that they are too abstract, but, on the contrary, that they are not abstract enough, that they do not reach the abstract machine that connects a language to the semantic and pragmatic contents of statements, to collective assemblages of enunciation, to a whole micropolitics of the social field. A rhizome ceaselessly establishes connections between semiotic chains, organizations of power, and circumstances relative to the arts, sciences and social struggles.” As the hierarchical models which construct the social body, the state, on the model of a dominant individual will oppressing lesser bodies, begin to shift and change, as Althusser and Gramsci begin to construct institutions as mediating the relations between ideology and the economic base, there is a new focus on the way institutions “position” individuals by producing discourses which “interpellate” subjects. These are the beginnings of poststructuralist and specifically postmodern constructions of subjectivity and of the emergence of a new set of spa-
396 tial metaphors. The “social” order is flattened out, discourses and bodies begin to “circulate” in space, rather than be “constrained” from above or below, and power is also localised, institutionalised, operating in and through the discursive practices, the techniques of discipline and production, and the rules that fix membership and meaning that constitute institutions (Clegg 1989). Discursive practices then become not just representational practices but technologies for producing meanings and values and technologies for producing disciplined and docile bodies and subjectivities. The death of the concept of sovereign power entails the death of the author (who is reborn, Phoenix-like, as the reader who rewrites) and the death of the transcendental ethical intellectual, the author of the Marxist critique, who (1) can see that the consciousness of the collective is systematically distorted by the order which produces it and (2) locates that distortion in texts as representational practices, assuming the ideological effects these practices have on readers. The new story also involves a re-thinking of the hierarchical ordering of mind and body, text and context, discursive and non-discursive. Whereas the Marxist and other hierarchical stories concentrate on the level of consciousness, the way that contexts produce texts, and the way the discursive contains the nondiscursive as referent, the poststructuralist/ postmodernist story focusses on the discursive production of disciplined bodies, the way that texts produce realities in semiosis, and the way the discursive and the non-discursive interact as signifying practices. Texts as media of semiosis then are reconstituted, no longer as containers of meaning, but rather as technologies for the production of meaning through the disciplining of docile bodies. In this respect Foucault’s work has demonstrated that what are sometimes called the media of semiosis, as if they were simply neutral containers for social meanings, are always mediating and mediated processes and spaces, already diagrammed, mapped, to position, locate, distribute the other systems of meanings, the diagrams and the discourses, which they may encounter. Thus the institutional and non-discursive space of the library, already a panoptically diagrammed space, distributes and categorises the book according to a number of techniques and practices, which form and modify social relations, provide positions for subjects, contribute to the
II. Aspekte der Semiose
construction and differentiation of knowledges, and thus mediate the transmission of the discursive which is supported and preserved by the multiple technologies of the book itself (Foucault 1972, 123 f). At the same time the library is one of a series of non-discursive spaces which belong to the cline institutional/non-institutional (the city, suburbs, supermarket, shopping mall, university, school, home for example) and which are not equally accessible to all subjects. Its very mediation of semiosis then is located and locatable with respect to a whole range of complex and interacting sociohistorical, economic, political and sexual questions and to the heterogeneity and equivocal relations of apparatuses (institutions/media/genres) and ideologies (discourses/semioses) (de Certeau 1984 ⫽ 1988, 49). This kind of approach has provided a number of very useful starting points for recent work in these areas and begins to provide the theoretical framework for a bringing together of ethnographic and social semiotic work on genre and language with organisational and institutional theory and theories of discourse that the feminist work I examined at the outset of this chapter would seem to be demanding and that the questions raised by de Certeau (1984) would point to (for an account of other factors that determine social interaction cf. Art. 13 § 6.). It will be part of my argument that the social division of labour within the human and social sciences, their construction as disciplinary structures, and the institutionalisation and contestation of those structures by social actors for and through whom those structures produce subjectivities, spaces for action, technologies of mediation, knowledges and text-types which constrain and enable, silence and provide positions from which to speak, are themselves among the social media of semiosis which currently construct and constrain our stories of the social and of the media in and through which meanings are made in social systems. As such they limit and define, contain and control, our current understandings of all three terms “social”, “media” and “semiosis” and they require a good deal of careful analysis.
4.
Syntactics, semantics and pragmatics
I would like to continue the process of defining these three terms then by referring to the early articles of this volume and to the dis-
397
15. Social media of semiosis
tinctions that are established there between syntactics, semantics and pragmatics (cf. Art. 1⫺4). This three-way distinction which is characteristic not only of general semiotics (by which I intend that kind of semiotics that sees its function as that of describing both verbal and non-verbal or non-vocal sign systems and processes) but also of mainstream linguistics, from which indeed the divisions derive, already contains implicitly one possible and dominant way of defining “medium” (the material realisation of meaning, form; syntactics), “semiosis” (the process of producing meanings that are pertinent in a culture, content; semantics) and “social” (the interactions in which correlations between form and content, either signs or codes, are used or made, relations between signs and users or interpreters; pragmatics). Now this division of labour clearly separates the social from the first two domains, in ways that are closely related to a number of other binary rather than triadic divisions in the discourses of the human and social sciences, e. g., langue and parole, syntagm and paradigm, value and use, competence and performance, system and process, individual and social, culture and society, interaction and knowledge and so on. At the same time, it is a division of labour which repeats itself, in its triadic form, in the construction of disciplinary boundaries within the humanities/ social sciences, and in theory and model construction within those disciplinary frameworks. To understand then what the social media of semiosis might be we are going to have to explore this binarism and this triadic semantics in its forms of realisations in the discursive practices of a number of these disciplinary and theoretical frameworks. Posner (1987) has given a very clear account of the origins of the division in the work of Charles Morris, and of its derivation from three historical modes of thought, American pragmatism (Peirce, Mead, Dewey), concerned with “the social conventions of communication”, Anglo-American behaviorist empiricism, concerned with “the functiondependent substitution of signs for objects”, and Central European logical positivism (Wittgenstein, Carnap), concerned with “the formal structure of the language employed”. These Morris brought together as “semiotic”, defined as a general theory of behaviour (Posner 1987, 25 f). He himself was well aware of the dangers of this separation and of the need for synthesis (Posner 1987, 25),
but the fact remains that the historical inheritance of this has been the kind of separation and maintaining of boundaries that Morris warned against.
5.
Anthropology as a discipline (de-)constructing the social media of semiosis
Posner (1989) has recently made very explicit the connections that he sees as existing between semiotics (constructed as having the triadic structure derived from Morris that is articulated in Art. 1⫺4) and the sub-disciplinary divisions of anthropology. He defines both semiotics and anthropology as disciplines that offer approaches to the study of culture. The divisions Posner isolates within anthropology look very like those we have just looked at in sociology and linguistics and derive from the same intertextual resources. Posner quotes a long list of sources for this threefold distinction which is evidence enough of its persistence within discursive constructions of the discipline (1989, 10 f). It is perhaps worth noting here that such a representation of anthropology is not unrelated discursively and semantically to Boas’ fourfield division of the discipline into physical (biological) anthropology, archaeology, cultural (or social) anthropology and linguistics (quoted by Clifford 1986, 4), except that the physical and the linguistic have in interesting ways become elided from, or transformed in, Posner’s account and there is already in Boas a slippage between culture and the social which I shall point to again below. Briefly, what seems to be happening is that anthropology must institutionally claim a terrain for itself which is not the same as that of sociology: yet in the end precisely because they share so many of their founding fathers (or intertextual resources) what seems to happen is that they do the same things but in one case call this “the social” in the other “culture”: although that is a reduction to which I will return. With respect to the physical and the linguistic the differences are crucial: the body, and thus sexuality and labour cease to be questions of interest in the traditions of anthropology from which Posner’s account derives. It is the cultural artifact, the product as object, not the process of the making that is foregrounded, or the social institution, not the dialogic processes, the interplay of voices, the positioned utterances (in verbal or non-
398 verbal media) that are the focus of attention here. And the linguistic, which is both bodily and materially realised, is translated back into the realm of the mental, to be explained by the established codes of semiotics (or indeed the system of linguistics). Both the cultural and the social here are still prefigured visually, as objects, and there is little interest in the social relations of production that discursively construct the fields of cultural representation (Clifford 1986, 12 f). Given the history and genealogy of “culture” in anthropology from Herder through to the present and its evolutionary associations of cultivation and enlightenment (Posner 1989, 4), and given the still ubiquitous and recalcitrant division of the world into triads ⫺ code/culture/society ⫺ semantics/syntactics/pragmatics ⫺ which remain reminiscent of Kant’s knowledge/art/morals (Posner 1989, 5; 22), this is hardly surprising. Our own theoretical metalanguages and their discursive genealogies are among the most powerful and interesting of the social media of semiosis. In this discourse the function of both anthropology and semiotics would, according to Cassirer, be that of demonstrating “for each culture that it is not an incoherent conglomerate of various symbolic forms but unified by being a manifestation of the human mind” (Posner 1989, 5). This position is of course an exact reversal of the Durkheimian one outlined above where the mind and culture would be conceived as socially produced. It is also worlds apart from a Foucaultian position or indeed a position like Bourdieu’s (1984) which would see systems of knowledge and belief and material cultural production as first, embodied and next, similarly ideologically or discursively produced in everyday political, economic and social practice in ways that cannot be separated from the semiosis, the networks of signifying practices in which both artefacts and embodied subjects are produced. Cassirer’s position is also a long way from a view like Clifford’s which sees anthropology itself as a social activity involved in the construction of anthropological knowledge, and culture as a realm of contestation and alternative constructions, in no sense unified or neatly categorised into separate compartments: “The essays collected here […] see culture as composed of seriously contested codes and representations; they assume that the poetic and the political are inseparable,
II. Aspekte der Semiose
that science is in, not above, historical and linguistic processes. They assume that academic and literary genres interpenetrate and that the writing of cultural descriptions is properly experimental and ethical” (Clifford 1986, 2; see also Smith 1988, 83 ff). Posner isolates three basic areas in anthropology, the social, which studies society, institutions and their rituals, the material, which studies civilisations, artifacts and the skills of producing and using them, and the cultural, which studies mentalities manifested in civilisation, systems of ideas and values and the conventions governing their use and expression. These three divisions he correlates with the basic terminologies of the triadic division of semiotics so that society, as a set of sign users, becomes the subject matter of pragmatics; civilisation as a set of texts in many different media, the artifacts of the culture, becomes the subject matter of syntactics; and mentality as a set of codes which are used to make sense of the society and the civilisation, becomes the subject matter of semantics (Posner 1989, 9 f; 21). For him, as for other recent writers, anthropology is actually about the transmission of culture from one generation to the next (1989, 10). He is working, through these triadic analogies, with what Reddy (1979) has called a conduit model of semiosis. The separation in this model of the social labour of use, dialogue or contestation, from the syntactics and semantics of the system of material artifacts and meanings and their coded correlations in cultural and institutional texts, produces the metaphor of ready-made products, either being merely used, or being simply transmitted ready-made from sender to receiver, or from generation to generation (individuals, societies act as “carriers of culture”). It also produces the metaphor of individuals, institutions and societies as the media or instruments of semiosis ⫺ these things act as “sign users” (Posner 1989, 12). The conduit metaphor, and it is a dominant one, constantly elides the processes whereby these products have continually to be re-made, their meanings, and the codes which stabilise them renegotiated in and through social practice and social labour. It also elides the status of bodies, sites, institutions as semiosis. There is a text/context, semiosic/non-semiosic, opposition implicit in these constructions which runs counter to that other semiotic position which would see all of culture as semiosis, and in terms of which ‘everything
15. Social media of semiosis
is a text (semiotic)’ (Barthes 1967; Eco 1976; Greimas 1987, ch. 2). Although Posner emphasized the fact that sign users, texts and codes do not exist apart from each other and receive their functions only within semiosis, his position contrasts with poststructuralist and postmodernist positions which construct all these areas as interlocking networks of signifying practices (Deleuze and Guattari 1987; Morris 1988). In the anthropology which Posner explores here, the effects of the triadic division of labour again contribute to the persistence of a theoretical framework within which anthropology remains the science of the observation of culture, rather than an enterprise in which the focus on text-making and rhetoric would highlight the constructed, artificial nature of cultural accounts (Clifford 1986, 8). These then are two very different views of the specific social media of semiosis which is the institution of anthropology. Diane Austin-Broos (1987, Introduction) in her account of the subject, which, like Clifford’s, contests the observational, objectivist view of anthropology, traces the genealogy of this form of anthropology and of some of the contesting forms referred to briefly above, to precisely the same texts that Giddens (1976) isolates as the intertextual resources of sociology. Often describing what Giddens calls “social theory” as history or philosophy (e. g., her account of Marx and Weber, 1987, xxvi, and of others, 1987, xxx⫺xxxi), and thus pointing to the inappropriateness of these contemporary divisions to the classic texts, Austin-Broos locates her subject at the intersection of theories of society, theories of philosophy and theories of language and meaning, and declares that the object of anthropology is culture. The separation of the cultural and social media of semiosis which is evident in the construction of sociology and anthropology as separate spheres remains in place then in her account, but the cultural as cognitive/mental/knowledge/artifact, or as the privileged sphere of the knowledge/art/morality triad, or as conceived in Posner’s triadic semiotic account, is fairly radically questioned here. The effect of the questioning is to bring the social and the cultural closer together within anthropology and to begin to insist on the dialectic between them. One of the reasons for this rapprochement is to be located in some extra founding fathers in Austin-Broos’ genealogy of anthro-
399 pology. Significant here are de Saussure, Boas (and thence Sapir and Whorf; cf. Art. 101), and Ricoeur among others (1987, xxv), all of whom are concerned particularly with the systematic ways in which social action, mediated by language and symbolic (semiosic) systems, constructs and delimits the cultural and social and is constructed and delimited by the social and cultural in turn (see Darcy on Boas in Austin-Broos 1987, 3 ff). Some of these names also turn up in Giddens’ account of the genealogy of sociology and offer an intertextual explanation for the relationships between his social and linguistic view of the links between social action and social structure in sociology (1976 ⫽ 1982, 19 ff) and Austin-Broos’ view of culture as communication in anthropology. Giddens (1976 ⫽ 1982, 18 ff) adds to Austin-Broos’ list Mead, Wittgenstein, Heidegger and Gadamer (cf. Art. 74 § 20. and 22. as well as Art. 109), but specifies the interest of their work as residing in the elaboration from widely differing perspectives of an understanding, in social and linguistic terms, of “the internationalisation of values” such as was independently arrived at by Durkheim and Freud. The clue to the relationships between Giddens and Austin-Broos and current debates in sociology and anthropology is language, and certain ways of theorising what it is, or rather, certain ways of understanding communication and semiology and what they are, which give rise to a radical critique of representation and of the constructed and partial nature of disciplinary knowledges. Thus Austin-Broos, like Posner, would see anthropology and semiotics as having much in common, but for her what they share would not be culture as object, but an interest in culture as constructed in and through language, communication and semiosis, that is, through processes that are inherently social. She sees this paradigm of “social life as language”/“culture as communication” as having replaced, for example, Marxist causal and functional definitions of culture, and older notions of social life as organic and functional unity (1987, xxv). In her own writing, perhaps as a result, there no longer seems to be any very clear distinction between social life and culture, or between social life, knowledge and meaning, as the focus of anthropological study: “cultural analysis […] is aligned with epistemology and semiology” (xxv).
400 Thus these nineteenth and twentieth century modernist attempts to generate specifically distinct disciplines and institutions out of an intertextual set of discursive relationships that never did quite fit these categories begins again, at least discursively, semiotically, to crumble. This is of course not to argue that these discursive crumblings (social activities though they may be) are isomorphic with the institutions within which they emerge, and whose boundaries and classifications they begin to contest. These latter are the products, the constructions of earlier forms of social action in the realm of knowledge construction, and are now maintained, or paradoxically threatened by forms of social action in the political, organisational, legal and economic spheres which continue to realise, through praxis, and the social labour of forgetting, transmitting, and re-producing meanings, precisely those discourses of separation, objectivity, vocation and representation which constructed the disciplines as separate institutions in the first place. Straddling these divisions somewhat uncomfortably at present is a large body of work which contests and struggles with the older classifications. It exists “within” sociology as well as anthropology, but is not contained by either. It is often aligned with new readings of Marxist cultural theory (viz. Austin-Broos 1987, xxviiii, the emphasis in Marx on “human-kind as the history- (and culture-) makers”), involves an ethnography “repatriated” and focussed upon itself as well as on the new demands of a multi-culturalism that cannot be contained within the old categories, and contributes to a productive and constructive blurring of the distinction between sociology and anthropology at the disciplinary level which is like the semantic slippage between the social and the cultural in Austin-Broos’ individual work (Cliffort 1986, 22 f). What social labour has put asunder it is now weaving back together again. It is perhaps interesting just to recall here that all of this also encompasses another significant rewriting, the re-alignment of the social and the individual with quite different collocational sets and values. In de Saussure’s early formulations, the social was located in the system, the individual outside it. Now, individual action, dialogism, heteroglossia, conflict, institutions and society, all those individual and specific things which de Saussure’s system excluded, are actually defined as the social, as
II. Aspekte der Semiose
what constitutes the social and constructs the systematic. The social and the individual are seen as mutually constructive and as constructive of the systems in terms of which they are understood. There is no longer any inside and outside, only a constant dialectic between individual and social. The dynamic excluded other (the individual) has become the social and the system, and the static, synoptic, social system has now to be accounted for within the terms of that dynamic, as sets of products, codes, whose processes of production have been forgotten, and which maintain only a use-value within this dynamic economy. It is perhaps to a certain kind of French philosophy that we owe this semantic play and its real effects. And we really cannot conclude this discussion of the triadic and disciplinary construction of the social without a return to philosophy which has been constitutive not only of sociology (Giddens 1976 ⫽ 1982, ch. 1), anthropology (Darcy in AustinBroos 1987, 8⫺13) and linguistics (Lyons 1977), but also of the triadic divisions of labour with which we began. Philosophers are concerned with how we know the world (Darcy 1987, 10) and their labours have traditionally been aligned with metaphysics or epistemology. Thus mind, knowledge, reason, logic, the cognitive, truth, come to be within their ken, as do questions of the exclusive relations between these areas and aesthetics or morality/ethics (Kant’s science/art/morality triad), which has affinities with Posner’s mental/civilizational/social triad and thus with the duplication again of the triadic organisation of labour within the disciplines. The effect of this has been to insulate the study of “mental” processes and artifacts (knowledges) again from the effects of the social or the figurative/fictional, and thus from any critique of the representational bias which this inevitably involves, and from any critique in social, semiotic or linguistic terms, of the notion of representation itself. This construction of philosophy has not remained uncontested, and in many ways the new constructions of sociology, anthropology and literary studies are dependent on this new philosophical labour and on the questioning and re-classification of boundaries which it has involved. The subsequent use and critique of the contesting accounts of the discipline of philosophy, by and within feminism, has raised further important issues about sexuality and gender in relation to the
401
15. Social media of semiosis
continued elision and exclusion of these and other (equality, sexual difference, race and ethnicity etc.) questions from new and old philosophical categorisations of the social, the civilizational and the semantic/mental, to use Posner’s categories again. These are issues that are of course now also being raised and aired in anthropology, sociology, literary studies and linguistics (Cameron 1985; Clifford 1986; Austin-Broos 1987; Yeatman 1987; Threadgold 1987). These issues will mean that even if we reinstate the social ⫺ re-written as contestation, dialogue, debate, subjectivity, the individual, the emotional ⫺ from its generally marginalised position in the construction of our normally representationally biased disciplines, we are still going to need to engender it, to embody it and to acknowledge the sexual politics that motivate and are realised in the production of texts and knowledges. That is what is now going on in the feminist constructions and re-writings of the human and social sciences, which constitute some of the most radical challenges to the older understandings of the categories ‘social’, ‘semiosis’ and ‘media’, with which we began. The point I want to make in conclusion is that this writing and re-writing of disciplinary structures and knowledges, under institutional, economic, political and sexual constraints, this contestation and co-existence of competing and incompatible paradigms and discourses, this complex network of interacting discursive and non-discursive, verbal and non-verbal, corporeal and mental, contextual and textual, structural and social, elements, is demonstrating precisely how meanings are socially mediated in and through the rules of membership and meaning and the relations of power that constitute and are constituted by institutional and social structures. But this very complexity means that we cannot see social organisations and institutions as any longer, if they ever were, merely the social media of semiosis, the instruments, as it were, for the transmission of texts as cultural artifacts, a construction of things which mirrors and participates in the metaphors of instrumental bureaucracy and means ends legal rationality which constitute the human and social sciences themselves in their Weberian forms. Nor can we see them as the only social media of semiosis. Texts and cultural artifacts are themselves forms of social semiosis which mediate the construction of technologies and of institutions. They are the discur-
sive formations which, in a Foucaultian perspective, are the technologies for disciplining the populations which embody and speak the institutions. This is of course to turn the first set of metaphors on their heads. Both approaches to the question of the social media of semiosis co-exist and continue to contest one another and to evolve in relation to one another in and through different institutional sites and practices. Both need to be addressed as theoretical practices which construct the social system and its mediating processes of semiosis in different and often incompatible ways, and both are very much a part of the current construction of semiotics as a heterogeneous and flexible set of strategies for socio-cultural analysis in an equally heterogeneous postmodern context.
6.
Selected references
Austin-Broos, Diane (ed.) (1987), Creating Culture: Profiles in the Study of Culture. Sydney, London and Boston: Allen and Unwin. Bakhtin, Mikhail M. (1986), Speech and Genres and Other Late Essays. Transl. Vern W. McGee. Ed. Carl Emerson and Michael Holquist. Austin: University of Texas Press. Barnard, Chester J. (1938), The Functions of the Executive. Cambridge MA: Harvard University Press. Barthes, Roland (1967), Elements of Semiology. Transl. Annette Lavers and Colin Smith. New York: Hill and Wang 1968. Baudrillard, Jean (1981), For a Critique of the Political Economy of the Sign. St. Louis: Telos Press. Baudrillard, Jean (1968⫺83), Revenge of the Crystal: Selected Writings on the Modern Object and Its Destiny. Ed. Paul Foss and Julian Pefanis. Leichhardt, N.S.W.: Pluto Press 1990. Bernstein, Basil (1982), “Codes, Modalities and the Process of Cultural Reproduction: A Model”. In: Michael W. Apple (ed.), Cultural and Economic Reproduction in Education: Essays on Class Ideology and the State. London: Routledge and Kegan Paul: 304⫺55. Boas, Franz (1908), Anthropology. New York: The Columbia University Press. Böhme, Gernot (1989), “The Techno-Structures of Society”. In: Redefining Modernity: The Challenge to Sociology ⫽ Thesis Eleven 23: 105⫺116. Bourdieu, Pierre (1977), Outline of a Theory of Practice. Transl. Richard Nice. Cambridge, England: Cambridge University Press. Bourdieu, Pierre (1979), Distinction: A Social Critique of the Judgement of Taste. Transl. Richard
402 Nice. Cambridge MA: Harvard University Press 1984. Bourdieu, Pierre (1980), The Logic of Practice. Transl. Richard Nice. Cambridge, England: Polity Press 1990. Cameron, Deborah (1985), Feminism and Linguistic Theory. London and Basingstoke: MacMillan. Cassirer, Ernst (1923⫺29), The Philosophy of Symbolic Forms. 3 vols. Transl. Raphael Manheim. New Haven: Yale University Press 1953⫺57. de Certeau, Michel (1984), The Practice of Everyday Life. Transl. Steven Rendall. Berkeley: University of California Press 1988. Clegg, Stewart (1989), Frameworks of Power. London: Sage Publications. Clifford, James and George E. Marcus (eds.) (1986), Writing Culture: The Poetics and Politics of Ethnography. Berkeley: University of California Press. Darcy, Anthony (1987), “Franz Boas and the Concept of Culture: a Genealogy”. In: Diane J. AustinBroos (ed.), Creating Culture. Sydney: Allen and Unwin. Deleuze, Gilles and Felix Guattari (1987), A Thousand Plateaus: Capitalism and Schizophrenia. Transl. and Forword by Brian Massumi. Minneapolis: University of Minnesota Press. Diamond, Irene and Lee Quinby (eds.) (1988), Feminism and Foucault: Reflections on Resistance. Boston: Northeastern University Press. Diprose, Rosalyn and Robyn Ferrell (eds.) (1991), Cartographies: Poststructuralism and the Mapping of Bodies and Spaces. Sidney: Allen and Unwin. Douglas, Mary (1987), How Institutions Think. London: Routledge and Kegan Paul.
II. Aspekte der Semiose Foucault, Michel (1972), The Archaeology of Knowledge. Transl. A. M. Sheridan Smith. London: Tavistock 1985. Foucault, Michel (1976), The History of Sexuality. Volume 1: An Introduction. Transl. Robert Hurley. New York: Vintage Books 1980. Foucault, Michel (1979), Discipline and Punish: the Birth of the Prison. Transl. A. M. Sheridan Smith. Harmondsworth: Peregrine Books 1982. Freud, Sigmund (1924⫺25), The Standard Edition of the Psychological Works. Ed. James Strachey. London: Hogarth. Gatens, Moira (1983), “A Critique of the Sex/Gender Distinction”. In: Judith Allen and Paul Patton (eds.) Beyond Marxism? Interventions after Marx. Leichardt, N. S. W.: Intervention Publications: 143⫺62. Gatens, Moira (1989), “Woman and Her Double(s): Sex, Gender and Ethics”. Australian Feminist Studies 10: 33⫺48. Gerth, Hans H. and C. Wright Mills (eds.) (1958), From Max Weber: Essays in Sociology. New York: Galaxy. Giddens, Anthony (1976), New Rules of Sociological Method. London and Melbourne: Hutchinson. 2nd edition 1982. Greimas, Algirdas Julien (1987), “Towards a Semiotics of the Natural World”. Chapter 2 in: On Meaning: Selected Writings in Semiotic Theory. Minneapolis: University of Minnesota Press. Habermas, Jürgen (1981), The Theory of Communicative Action. Volume 1: Reason and the Rationalization of Society. Transl. Thomas McCarthy. Boston: Beacon Press 1984.
Durkheim, Emile (1893), Division of Labor in Society. Transl. George Simpson. New York: Academic Press 1933.
Habermas, Jürgen (1981), The Theory of Communicative Action. Volume 2: The Critique of Functionalist Reason. Transl. Thomas McCarthy. Cambridge MA: Polity Press 1987.
Durkheim, Emile (1895), Rules of Sociological Method. Transl. Sarah A. Solovay and John H. Mueller. New York: Free Press 1964.
Habermas, Jürgen (1987), The Philosophical Discourse of Modernity. Transl. Frederic Lawrence. Cambridge MA: Polity Press.
Durkheim, Emile (1938), The Evolution of Educational Thought: Lectures on the Formation and Development of Secondary Education in France. Transl. Peter Collins. London: Routledge and Kegan Paul 1977.
Halliday, Michael A. K. (1978), Language as Social Semiotic: The Social Interpretation of Language and Meaning. London: Arnold.
Eco, Umberto (1976), A Theory of Semiotics. Bloomington: Indiana University Press.
Herder, Johann G. (1784⫺91), Ideen zur Philosophie der Geschichte der Menschheit. In: Bernhard Suphan (ed.), Herder, Sämtliche Werke. Vols 13 and 14. Berlin: Weidmann.
Eco, Umberto (1973), Travels in Hyperreality. Transl. William Weaver. San Diego, New York and London: Harcourt, Brace, Jovanovich 1986.
Hill, Stephen (1988), The Tragedy of Technology: Human Liberation Versus Domination in the Late Twentieth Century. London: Pluto Press.
Foucault, Michel (1963), The Birth of the Clinic: An Archaelogy of Medical Perception. Transl. A. M. Sheridan Smith. New York: Vintage Books 1975.
Hjelmslev, Louis (1959), Essais linguistiques. Travaux du Cercle Linguistique de Copenhague, Vol. X111. Copenhagen: Nordisk Sprog- og Kulturforlag.
Foucault, Michel (1966), The Order of Things: An Archaeology of the Human Sciences. New York: Vintage Books 1973.
Kanter, Rosebeth M. (1975), “Women and the Structure of Organizations: Explorations in Theory
15. Social media of semiosis and Behavior”. In: Marcia Millman and R. M. Kanter (eds.), Another Voice. New York: Anchor. Kanter, Rosebeth M. (1977), Men and Women of the Corporation. New York: Basic Books. Kristeva, Julia (1974), Revolution in Poetic Language. Introd. Leon S. Roudiez. Transl. Margaret Waller. New York: Columbia University Press 1984. Kristeva, Julia (1977), Desire in Language: A Semiotic Approach to Literature and Art. Ed. Leon S. Roudiez. Transl. Thomas Gora, Alice Jardine and Leon S. Roudiez. New York: Columbia University Press 1980. Laclau, Ernesto (1990), New Reflections on the Revolution of Our Time. London and New York: Verso. Laclau, Ernesto and Chantal (1985), Hegemony and Socialist Strategy: Towards a Radical Democratic Politics. Transl. Winston Moore. London and New York: Verso 1989. Leech, Geoffrey N. (1983), Principles of Pragmatics. London and New York: Longman. Levinson, Stephen C. (1983), Pragmatics. Cambridge, England: Cambridge University Press. Lumley, Robert (1988), The Museum Time Machine: Putting Cultures on Display. London and New York: Routledge. Lyons, John (1979), Semantics. Volumes 1 and 2. Cambridge, England: Cambridge University Press. Lyotard, Jean-Francois (1979), The Postmodern Condition: A Report on Knowledge. Manchester: Manchester University Press 1984. Morgan, Gareth (1986), Images of Organisation. London: Sage. Morris, Charles W. (1938), Foundations of the Theory of Signs. Chicago: University of Chicago Press. Morris, Charles W. (1971), Writings on the General Theory of Signs. The Hague: Mouton. Morris, Meaghan (1988), The Pirate’s Fiancee: Feminism, Reading, Postmodernism. London and New York: Verso. Owen, Gareth (1986), Metaphors in Organizational Practice. New York: Fee Press. Parsons, Talcott (1949), The Structure of Social Action. New York: Free Press. Parsons, Talcott (1951), The Social System. London: Routledge. Parsons, Talcott (1971), The System of Modern Societies. Englewood Cliffs NJ: Prentice-Hall. Pateman, Carole (1988), The Sexual Contract. Oxford: Polity Press. Perrow, Charles (1972), Complex Organisations: A Critical Essay. New York: Random House. 3rd edition 1986. Posner, Roland (1976), “Poetic Communication vs. Literary Language or: The Linguistic Fallacy in
403 Poetics”. PTL: A Journal for Descriptive Poetics and Theory of Literature 1: 1⫺10. Posner, Roland (1986), “Zur Systematik der Beschreibung verbaler und nonverbaler Kommunikation: Semiotik als Propädeutik der Medienanalyse”. In: Hans-Georg Bosshardt (ed.), Perspektiven auf Sprache. Interdisziplinäre Beiträge zum Gedenken an Hans Hörmann. Berlin and New York: Walter de Gruyter: 267⫺313. Posner, Roland (1987), “Charles Morris and the Behavioral Foundations of Semiotics”. In: Martin Krampen et al. (eds.), Classics of Semiotics. London and New York: Plenum Press: 23⫺58. Posner, Roland (1989), “Semiotics vs. Anthropology: Alternatives in the Explication of ‘Culture’ ”. In: Walter A. Koch (ed.), The Nature of Culture. Bochum: Brockmeyer: 240⫺295. Pringle, Rosemary (1988), Secretaries Talk: Sexuality, Power and Work. Sidney: Allen and Unwin. Reddy, Michael J. (1979), “The Conduit Metaphor ⫺ A Case of Frame Conflict in Our Language about Language”. In: Andrew Ortony (ed.) Metaphor and Thought. Cambridge, England: Cambridge University Press: 284⫺324. Ricoeur, Paul (1976), Interpretation Theory: Discourse and the Surplus of Meaning. Fort Worth: The Texas Christian University Press. Rossi-Landi, Ferruccio (1973), Ideologies of Linguistic Relativity. The Hague and Paris: Mouton. Rossi-Landi, Ferruccio (1977), Linguistics and Economics. The Hague and Paris: Mouton. Rumsey, Alan (1990), “Wording, Meaning and Linguistic Ideology”. American Anthropologist 92,2: 346⫺61. Sapir, Edward (1949⫺51), Selected Writings in Language, Culture, and Personality. Berkeley: University of California Press. Saussure, Ferdinand de (1916), Course in General Linguistics. Ed. Charles Bally and Albert Sechehaye. Introd. Jonathan Culler. Transl. Wade Baskin. London: Peter Owen 1960. Schmidt, Siegfried J. (ed.) (1976), Media Genre. Special Issue. Poetics. Volume 16, No. 5: 369⫺470. Schmidt, Siegfried J. (1976), “Toward a Constructivist Theory of Media Genre”. Poetics. Volume 16, No. 5: 371⫺396. Silverstein, Michael (1979), “Language Structure and Linguistic Ideology”. In: Paul R. Clyne et al. (eds.), The Elements: A Parasession on Linguistic Units and Levels. Chicago: Linguistic Society. Smith, Paul (1988), Discerning the Subject. Minneapolis: University of Minnesota Press. Stauth, Georg and Bryan S. Turner (1988), Nietzsche’s Dance. Oxford: Blackwell. Steers, Richard M. (1988), Introduction to Organizational Behavior. Santa Monica: Goodyear.
404
II. Aspekte der Semiose
Tagg, John (1988), The Burden of Representation: Essays on Photographies and Histories. London: MacMillan. Threadgold, Terry (1987), “Rossi-Landi’s Higher Dialectical Level. Some Observations on Linguistic Alienation, Relativity and Ideology”. In: Susan Petrilli (ed.), Per Ferruccio Rossi-Landi. Il Protagora 1 V, 11⫺12: 81⫺98. Turner, Bryan S. (1984), The Body and Society: Explorations in Social Theory. Oxford: Basil Blackwell. Waring, Marylin (1988), Counting for Nothing: What Men Value and What Women Are Worth. London: Allen and Unwin. Weber, Max (1930), The Protestant Ethic and the Spirit of Capitalism. Transl. Talcott Parsons. London: Unwin University Books 1974. Weber, Max (1964), The Theory of Social and Economic Organisation. London: Free Press. Weber, Samuel (1987), Institution and Interpretation. Afterword by Wlad Godzich. Minneapolis: University of Minnesota Press. Weedon, Chris (1987), Feminist Practice and PostStructuralist Theory. Oxford: Blackwell.
Whorf, Benjamin Lee (1956), Language, Thought and Reality. Ed. John B. Carroll. Cambridge MA: M. I. T. Press 1967. Wolff, Janet (1981), The Social Production of Art. London: MacMillan 1985. Wuthnow, Robert et al. (1984), Cultural Analysis: The Work of Peter L. Berger, Mary Douglas, Michel Foucault and Jürgen Habermas. Boston, London and Melbourne: Routledge and Kegan Paul. Yeatman, Anna (1987), “A Feminist Theory of Social Differentiation”. Paper presented to the American Sociological Association Annual Meeting, Palmer House, Chicago, Illinois, 17⫺21 August, 1987. Yeatman, Anna (1990), Bureaucrats, Technocrats, Femocrats: Essays on the Contemporary Australian State. Sydney: Allen and Unwin. Yeatman, Anna (1991), “The Epistemological Politics of Postmodern Feminist Theorising”. Social Semiotics 1,1: 30⫺48.
Terry Threadgold, Clayton (Australia)
16. Codes 1. Introduction 1.1. Encoding, decoding, decipherment and information 1.2. Huffman Codes and the Morse Code 2. Codes as objects of specifically semiotic interest 2.1. Dyadic and triadic code concepts 2.2. Homeostasis and homeogeneity in codes 3. Conclusion 4. Selected references
1.
Introduction
Distilled to its formal essentials, a code is a set of substitution rules of the form: A ↔·⫺ B ↔⫺··· C ↔⫺·⫺· and so on (cf. the Morse Code). The rules direct the systematic substitution, if consistently read in one direction, of one set of symbols for another. To achieve such a systematic substitution, of course, in addition to the substitution equations one or more master-rules must be available, providing the instructions ⫺ normally left tacit ⫺ for applying the equations to each symbol in some
original text, in turn, until the original has been totally translated into the new format. These master-rules, plus the substitution equations, together compose a translation algorithm (or mapping function). Thus a code is a set of substitution equations comprising the interface component of a translation algorithm. 1.1. Encoding, decoding, decipherment and information The reader will already have noted that the set of equations can be used in either direction: replacing a symbol on the left by its counterpart on the right is generally called “encoding”; replacing a symbol on the right by its counterpart on the left is called “decoding”. The two together ⫺ and they are the same process ⫺ can be called simply “coding”. Generally, a code (with the rest of its translation algorithm) is used with the intention that anyone knowing (or deducing) the code (and algorithm) at issue can recover the original from the transformation. In many cases a code (and its algorithm) is used to translate from an original in order to make
16. Codes
the original less difficult of access, or more so. (Thought in the first instance, encoded as language; battle-plans in the second, encoded in the interests of secrecy.) Or they are used to extend access (over space, as with the Morse Code, or over time as with the transformations of speech called “writing” and “printing”; cf. Art. 14). In short, information is encoded to be conveyed. Thus the soundsystem of English is a code and algorithm that enable a speaker to convey English sentences; the English spelling-system is a code and algorithm that enable a writer to convey English sentences as expressed by the English sound-system; and the Morse Code is a code and algorithm that enable a transmitter to convey English sentences as expressed by the English spelling-system. When a code and algorithm are used to decrease access it is conventional to speak of “encrypting” the message, but this is just a special case of encoding, differing mainly in that an encrypting code typically complicates the original rather than merely representing it. For example it may vary, even within a single message, its substitution equations, “A” for instance being replaced now by one symbol, now by another. But after all any coded message is revealing to one who can read it, concealing otherwise. (Decoding an encrypted message is often called “decipherment”; cf. Art. 17 § 5.5. and Art. 173). The verb “convey” is really too strong, though, since something serves as a code just by virtue of its being able to convey information, irrespective of whether it is actually so employed; it is the representative or expressive function that is defining. It is largely in this wider sense that the term “code” has achieved its present currency in uses such as “genetic code” (which may or may not be transmitted to progeny in a given instance but whose essential characteristic is its ability to do so when the circumstances are propitious). On the other hand it would be perverse to accept as a “code” a means of expressing a message in such a way that it destroys it, conveying nothing to anyone. In the same vein we note in passing that the word “information” as used above is slightly deceptive, since information is such only to him who is informed by it; and we say that something has been encoded if it is putatively decodable even though nobody has ever done so and we are therefore quite ignorant of its content. However there is no
405 good synonym, and we will use “information” in what follows. It is a matter of practical interest whether a code and its associated algorithm convey well or poorly. To take a couple of obvious examples, the rules of English spelling are quite inadequate as a means of conveying the English sentence as spoken (stress and intonation are omitted, as are vocal qualifiers); and the sound-system itself is quite inadequate as a means of conveying the sentences by which we try to convey our thoughts (quantifier-scope and other structural information are conveyed crudely ⫺ by pause and intonation ⫺ or not at all; emotional coloring is omitted altogether except wherein it is carried by periphrasis). No doubt the same thing could be said of those sentential structures themselves, relative to the thoughts they encode, had we any clear access to those thoughts other than that provided by language. We exclude as being in modern speech a simple case of polysemy the remaining common use of “code” to mean a set of interrelated (“codified”) laws such as the “Napoleonic Code”. What the foregoing comes down to is that relative to a piece of information a code and its associated algorithm comprise any means of expressing that information, in such a way as to permit its decoding, other than the information itself. So relative to expressing an English sentence the English sound-system is a code and algorithm; but that same soundsystem is “information” when conveyed in turn by the code and algorithm that is the English spelling-system. Information can be encoded so as to be fully or partially preserved, and in one sense it can even be encoded so as to be enhanced. Re-encoding this article so that it was entirely set in italics, for example, would (trivially) preserve its information; recoding it in the Greek or Cyrillic alphabet (adapted so as to permit a one-for-one replacement of the original letters) would entirely preserve its information while at the same time encrypting it except for a reader willing to make the appropriate adjustment; removing all its vowelletters would partially preserve its information (in such a way that it could largely be recovered without much trouble); removing all its consonant-letters would make its content much more difficult of access, though not impossible (within obvious limits) for the unusually determined; pairwise inter-
406
II. Aspekte der Semiose
changing all of its letters at random would destroy it irretrievably; duplicating each of its sentences would leave the information unaffected but (since now it would better survive mistransmission) would improve the means of its conveyance. Clearly, however, this last would be a rather crude means of guarding against errors, since it is quite uneconomical. This introduces two issues: that of fortifying a coded message against mistransmission, and that of economy. These are not directly related, but they are two cardinal desiderata of coding and of coding theory, and they can well be discussed together by concentrating on so-called “Huffman Codes”. 1.2. Huffman Codes and the Morse Code A Huffman Code (Huffman 1952; Knuth 1973, 402⫺404; Standish 1980, 295⫺302), which can be established for a range of texts or derived individually for each, is a binary code produced by an associated algorithm. In any Huffman Code the more frequent a symbol the shorter its representation, a relationship that guarantees economy of transmission and storage. Furthermore, as we will see below, in a Huffman Code errors of substitution occurring during transmission are often explicitly signalled as such, and even when not they are at worst on a par (in probability and damage to the message) with the same degree of mistransmission of the original. To demonstrate the derivation of a Huffman Code, consider the following brief example. Suppose that some prototypical text is composed entirely of sequences of the letters A, F, H, M, N, and U, with the number of occurrences of those letters in that text being: F A N H M U
18 15 11 9 4 3
The optimal binary Huffman Code for messages using these letters with these incidences (hereafter taken as relative rates of occurrence) is easily (in fact, automatically) constructed. First, the sum of the two smallest values (3 and 4) is computed and substituted for them, so that 3, 4 followed by 9, 11, 15, 18 becomes 7 followed by 9, 11, 15, 18. This algorithm is applied iteratively until a single number is produced (continuing our exam-
Fig. 16.1: Constructing a Huffman Code: Step 1.
Fig. 16.2: Constructing a Huffman Code: Step 2.
ple, this yields in turn: 16, 11, 15, 18; 26, 16, 18; 34, 26; 60). This result can be presented graphically as in Fig. 16.1. Now, substituting the corresponding letters for their original occurrence-rates, we obtain the representation of Fig. 16.2. In Fig. 16.2 it is immediately evident that the closer a letter is to the top of the tree (the “root”), the higher is its frequency ranking. So if we want the more frequent letters to have shorter representations, thus attaining maximum economy of transmission, the tree of Fig. 16.2 offers an easy (and again automatic) way of achieving this. All that is necessary is to derive new labels for the letters from the position each occupies in the tree. This is done simply by assigning “1” to every left branch and “0” to every right branch ⫺ as in Fig. 16.3 ⫺ and then representing each letter by the sequence or path that leads to it from the root, branch by branch. Thus for example N is reached by first taking the right
407
16. Codes
Fig. 16.3: Constructing a Huffman Code: Step 3.
Decoding such a message can be viewed as starting at the root of the tree in Fig. 16.3 and following down its branches as indicated until they terminate. To begin decoding the “HUFFMAN” message, for example, one follows branches 1 (left), 1 (again left), and 0 (right), to arrive at H, the first letter of “HUFFMAN”. But supposing a mistransmission of one of these binary digits: what then? In many cases the resultant version will be patently absurd, and so will be flagged as an error. Thus for instance if the sixth digit of the above representation of “HUFFMAN” is mistransmitted as “0” instead of “1”, the result is 1101101101011101101,
or “0” branch from the root, then by taking the left or “1” branch, so that the representation for N in this instance will be “01”. Notice that this binary “name” of N also conveys the fact that N is the third most frequent letter, since “01” must be preceded by “10”, the most frequent, and by “00”, the secondmost-frequent (and just this is the case, “10” being the name for F and “00” being the name for A). In short, then, our illustrative Huffman Code is the algorithm from which is derived the code consisting of the set of substitution equations listed just below, plus the usual master rules for applying that code to some original until it is wholly transformed. The derived code is: F ↔ 10 A ↔ 00 N ↔ 01 H ↔ 110 M ↔ 1110 U ↔ 1111 Obviously any message composed of just the letters thus coded, assuming of course that they have the same frequency-rank in that message that they had in the prototypical message, will now be representable (as a sequence of 0’s and 1’s) with maximum economy. To illustrate with a fragmentary message (drawn from a message having the same letter-frequencies as the prototype), a message consisting of the words “MUFF” and “HUMAN” would be encoded as: 111011111010110111111100001 By the same token the name “HUFFMAN” itself would be: 1101111101011100001.
which decodes as “HHHFMAN”, plainly not anyone’s intended message, hence an error. In other cases, as for instance if the eighth digit is mistransmitted, the result is more equivocal ⫺ “HUAFMAN”, a possible if unlikely name, so not self-evidently mistaken; but at least in no case of mistransmission is the result worse than that produced by mistransmitting the corresponding letter itself. And, repeating an earlier point, in all cases the Huffman encoding, if derived from the text in question or from a prototype text exhibiting the same letter-frequencies, is the maximally efficient binary encoding. We omit from the present treatment any consideration of such developments as selfcorrecting codes and the like, since semiotically speaking they are essentially equivalent to those taken up elsewhere in this article. It may now be asked whether or not the Morse Code is a Huffman Code (allowing the “0” and “1” of Huffman’s original exposition to be replaced by dot and dash, respectively or counter-respectively). The answer is No. As originally devised by S. F. B. Morse before 1844, the code that bears his name was not even binary, since it used ·, ⫺, and (intraword) space; but even the revised “International Morse Code”, which (apart from interword space) is binary, does not obey strict Huffman principles, which is immediately obvious since the letters’ order of decreasing frequency fails to match the code-symbols’ order of increasing length. For example “O”, the fourth most-frequent letter in informal adult written text (Cartarette and Jones 1984, 35), is represented by three dashes, while “M”, only the eleventh most frequent letter, is represented by two. Of course the Morse Code could now be Huffmanized, but (just as
408
II. Aspekte der Semiose
with the standard typewriter and computer keyboard) such an improvement would probable be ill-advised in view of established habits.
2.
Codes as objects of specifically semiotic interest
2.1. Dyadic and triadic code concepts From the semiotic point of view the information to be conveyed by a code is the significatum (⫽ Chrysippus’ “se¯maino´menon” [Gould 1970], Saussure’s “signifie´” [1916], Peirce’s “object” [1935⫺1966], and so on); the code itself consists of a set of substitution equations relating significata to signs or signifiers; and the associated algorithm consists of a set of master-rules (tacit or explicit) governing the translation from significata to signifiers and vice versa and a set of combinatory rules specifying how (into what structures) those signifiers (for instance, the morphemes of English) are to be combined to form composite signs (for instance, sentences) to convey or “signify” the thing to be signified. (Much of the pragmatic nature of this process is described in Art. 5 of this Handbook, especially § 3.) With most writers of the past this process was regarded as dyadic; there were only the significatum and the signifier to be considered (e. g., Saussure 1916). In contrast, Peirce and his followers regard this as (at least) a triadic process, one in which (roughly speaking) the signifier both conveys (is directly decodable as) the significatum and ⫺ this is Peirce’s critical contribution ⫺ in addi-
tion prompts (is indirectly decodable as) a response in which the directly-coded relation between signifier and significatum is reformulated or even amplified (this response is the “interpretant”). What this comes down to in the usual pragmatic terms, expanding on Peirce’s somewhat gnomic remarks on the subject, is anecdotally illustrable in relation to Fig. 16.4: a sender uses a signifier (or sign) to convey his intended significatum and in the (generally inarticulated) hope of evoking a particular interpretant, to a receiver, who for his part receives the sign (ideally, as transmitted), relates it to a significatum (ideally, the one the sender had in mind), and relates both sign and significatum to an interpretant (yet again, ideally the one the sender had in mind, or tacitly hoped the receiver would). Of course if the process miscarries, the receiver’s significatum and/or interpretant will differ from those he was intended to infer, and the message he receives will as a result differ from the one sent. To which it is to be added that either sender or receiver may be missing: one may send a signifier but have no one hear it; one may receive a signifier (as, when one ‘reads’ mountains as being ‘majestic’) without any being sent (unless John Ruskin and the other Romantic Pantheists were right, of course). To bring this down to an example, the blueprint of a building is a signifier because it signifies or conveys the plan of that building (the significatum), which it does partly through occasioning in the mind of someone competent to read such a diagram a response (the interpretant) in which
Fig. 16.4: The Peircean triad, in bow-and-arrow notation.
16. Codes
how that blueprint is related to the plan is made more explicit, specifying perhaps what is omitted from such a diagram and what is included in it and added to it (e. g., the arc of a door’s swing) and many other details about how the diagram represents and misrepresents, iconically and symbolically, the building in question, and how it came to do so. The person who drew the blueprint (the sender) intended, let us say, the very significatum that the receiver inferred from it and the interpretant that he realized. And because this is how blueprints are used and because they work this way, we may speak of the substitution equations for translating from house-plans to blueprints and back again, with interpretants being evoked with every application of the substitution equations, as forming a code and associated algorithm in the sense used here. In fact, since in Peirce’s arguments every interpretant is a significatum in its turn, thus becoming involved at every turn in a new substitution equation (and algorithm), any blueprint or other signifier overlies an infinitely-nested set of codes and algorithms, each identical to its predecessor except for the new substitution equations and rules (if any) needed to code its interpretant. (This exposition springs from various remarks by Peirce but mainly from Peirce 1935⫺1966, 2.228.) It must be stressed that, on this triadic view, in prompting an interpretant the signifier has not really conveyed additional (amplificatory) information. Rather, the signifier’s recipient has amplified what he has received by having recourse to what else he already knew, his ‘world’. It is not the signifier that provides the interpretant, neither is it the significatum: it is the receiver. Thus one of the cardinal assets of the Peircean or triadic view is that it offers a conceptual entrance ⫺ albeit a rather forbidding one ⫺ into an aspect of coding that is otherwise often left tacit: namely, how a signifier works its magic with a recipient (signifex): how it conveys information to him. To return to our example, how does a blueprint convey the information it does? Certainly not by entering the recipient’s cranium. The best Peircean answer is: in part by being received as a reduced version of the information in question (the houseplan), in part by evoking in the recipient’s mind the rest of it, together with associated interpretants drawn from the world of architecture. Even a photograph may work this way, often evoking, so we are sometimes told,
409 little in someone who has never before seen one (for a related, but different account, cf. Art. 4 § 1.1. and 1.2.). 2.2. Homeostasis and homeogeneity in codes The most familiar and at the same time the most formidable semiotic code and associated algorithm is of course language itself (cf. Art. 2 § 2.⫺4.). But actually this is a set of interrelated (and mutually determining) codes and associated algorithms: for instance, a code associating a set of abstract meanings with a set of morphemes to convey them; a set of rules for combining those morphemes into words; a set of rules for combining those words and grammatical morphemes into phrases and sentences; a set of rules for turning those phrases and sentences into sound; and lastly sets of rules for reversing these processes so that the recipient may decode what he has heard. Though each of these constituent codes and associated algorithms is dependent for its utility on the others, in the course of time any one of them can undergo some change while leaving the others mostly unaffected. Adding a few new word-meanings need not affect either syntax or phonology, for example (frequencies and functional loads aside); a raising or lowering of several vowels need affect meaning not at all, unless the resultant vowels get in each other’s way; and even syntactic changes mostly substitute some new way of expression for some old one (Lass 1980, passim). Language and its constituent codes change but stay essentially the same: the status quo ante is generally restored in one way or another. In a word they are homeostatic (Nöth 1983). In discussing the stability or instability of such interrelated codes it might be useful to distinguish between homeostasis as an attribute of the system (language) as a whole ⫺ among its codes and associated algorithms ⫺ and homeostasis as a property of a particular one of its codes and/or associated algorithms. In either case it might be useful to distinguish between “semiotic homeostasis” and “formal homeostasis”, the first referring to over-all stability in respect to how signifiers convey significata, the second referring to over-all stability in respect to how some particular signifiers are interrelated (within one code or across more than one) or to how some particular significata are. Ordinary languagechange preserves semiotic and/or formal ho-
410 meostasis continually but not continuously (cf. Art. 17). Losses occur, but they are later redressed. If semiotic homeostasis is preserved despite language-change this is only because the need to maintain expressibility must exert a counter-pressure against any change that would adversely affect it. Of course since no such counter-pressure has ever been directly observed this might seem a rather vacant formulation, and it would be except that on occasion, when semiotic homeostasis has temporarily been threatened, new local language-changes have occurred that to all appearances have precisely the aim of restoring the status quo ante (per contra, see Lass 1980, 75⫺80). To set the stage, imagine a language-change in which /g/ and /k/ were interchanged everywhere in the language: this is a one-for-one replacement throughout the system, and both semiotic and formal homeostasis are of course maintained (putting to one side questions of functional load and the like). But now imagine a one-for-two replacement; suppose that /g/ and /k/ both become /k/. Here, formal homeostasis has been diminished, since the new phonology has one fewer contrast among the back consonants; but more importantly semiotic homeostasis has also been reduced, since (ceteris paribus) now /gad/ and /kad/ have merged (American English for “god” and “cod”, /a/ as in “father”) and so have all other word-pairs whose sole distinguishability depended on the distinguishability of /g/ and /k/. In a word, the functional utility of this language has been lessened ⫺ it can no longer unambiguously convey such essential significata as ‘cod’ and ‘god’ ⫺ and unless some new event occurs to restore the status quo ante this lessening will be permanent. Such a restoring event must be local, not global, since once /g/ and /k/ have unconditionally merged they cannot then be unmerged (unless elsewhere in the languagecommunity ⫺ in old spelling conventions or in some dialect or other ⫺ the knowledge is preserved of which words used to have /k/ and which /g/). Such an event is currently happening in American English, where, e. g., “bomb” and “balm”, long homophonous (as /bam/), are in many idiolects unmerging again due to a hypercorrect pronunciation of the “l”. Again, when alphabetic letters merge, as has occurred from time to time (in a writing-system’s earlier stages), it generally happens that some means is found of replacing the lost contrast. (Note that just as a phono-
II. Aspekte der Semiose
logical merger can be globally unmerged if the writing-system preserves the former phonological contrast, so by the same token a graphological merger can be globally unmerged if the pronunciation preserves the former graphological contrast. The writingsystem and the pronunciation, respectively, act as preserving dialects.) Thus when archaic Greek “aa ” and “ u” merged on the island of Rhodes, apparently as the result of homogenizing pressures, they were shortly afterwards differentiated again (Jeffery 1961: 345⫺349). Thus also, and closer to hand, while Americans handwrite “1” and “7” as “I” and “7”, most Europeans handwrite those numerals as “+I” and “7–”. The two numerals are paired signifiers both in European writing conventions and in the American: each is different because the other is. Quite as if the European one, having become more seven-like, forced “7” to become “7–” so as to maintain its identifiability. But if demerger is impossible, other means of disambiguation are still at hand. When through phonological changes the two Old English antonyms /lætan/ ‘allow’ and /lettan/ ‘prohibit’ merged as /let/, with the result that two diametrically-opposed concepts (significata) were now conveyed by identical signifiers, /let/ meaning ‘prohibit’ vanished from the common language (Nöth 1983, 112). These are all ways of combatting what has elsewhere (Watt 1984, 112) been called “homophoric clash”, cases where signifiers merge and thus undesirably cause their significata to be indistinguishable. Another and perhaps less hackneyed example of homophoric clash can be drawn from a very different semiotic domain, that of flags. It is possible to view the national flags of the home planet as in some measure constituting, not a mere hodgepodge of independently-derived hence arbitrary national designs, but a unified code, with fixed patterns of shapes and colors its signifiers and national identities its significata. This is so because to some extent the individual nations monitor the design of their flags in respect to the designs of the others. New nations generally insist on a distinctive design, and old ones sometimes modify their flag’s design in seeming acknowledgment that it is too similar to some other nation’s (Smith 1975, 159; 260). (The ‘flag-code’ is only partial, however, because maintenance of flag-distinction, being free of international regulation, is far from guaranteed. Sometimes the difference between two flags is negligible indeed: for example the
411
16. Codes
flags of both Monaco and Indonesia consist of two equal horizontal stripes, red over white; they differ only in their over-all proportions, a difference imperceptible under many circumstances and one, in any case, often disregarded in casual reproduction. Presumably this would change if Monaco and Indonesia went to war with each other.) Given that semiotic codes exist only to convey information and that they do this poorly if they do it ambiguously, it seems reasonable to say that homeostasis ⫺ in essence, preservation and (when necessary and possible) restoration of the ability to convey (or represent) information ⫺ can be taken as a common defining factor of such codes. This introduces us to the much-vexed question of the extent to which the elements of a code must or should differ from each other. We have already noted that a naturally-evolved code like a language or (in part) an alphabet is typically characterized by a certain degree of both homeogeneity and heterogeneity (inter-element similarity and inter-element differentiation): elements of such a code tend to have many attributes in common, while differing by enough attributes to be distinguishable. In principle, assuming for the moment that all attributes characterizing the relative homogeneity of a given code are of equal weight, obtaining a numerical expression of that code’s “degree of homeogeneity” ought not to be very difficult. Simplifying the issue somewhat, two naive measures of homeogeneity might be considered: (a) the mean interelement difference; and (b) some value expressing the relation between mean inter-element difference and mean inter-element similarity. (The superiority of the second measure has been forcefully argued by Tversky 1977.) For clarity’s sake the rest of this discussion can be conducted in terms of “ideal” codes, defined as codes in which each element is distinguished from every other and in which each element is minimally distinguished from its most-similar element, “minimal” meaning “by exactly one attribute”. (To put the same thing in other terms, an “ideal” code is one whose elements are evenly distributed in their space and where each is separated from its nearest neighbor(s) by the minimal distance of exactly one attribute.) So where N is the number of elements, F is the number of attributes (or features), and V is the uniform number of coefficients (or values) having those features as arguments, in an “ideal” code:
(1) N ⫽ V F For simplicity of exposition, let us take V to be 2, so that all features are binary. And let us also assume all elements to be defined in terms of the same set of F attributes, differing only in the coefficients (say ⫹ and ⫺) on those attributes. Obviously in an “ideal” binary code the mean inter-element difference, d, is: (2) d ⫽ N2 / 2(N2 ⫺ N) so that for an “ideal” code containing 4 elements and (therefore) 2 attributes, d ⫽ 1.33; for 3 elements and (therefore) 8 attributes, d ⫽ 1.714; for F ⫽ 4 and (therefore) N ⫽ 16, d ⫽ 2.133; and so on, with d increasing steadily. Since d and homeogeneity are inversely correlated, obviously as the number of elements in these “ideal” systems increases their homeogeneity (measured as the inverse of d) is constantly decreasing. Evidently, d is an unsatisfactory measure of homeogeneity. Passing then to the second obvious measure, which takes both similarities and dissimilarities into account, we define the new measure z as: (3) z ⫽ C / (C ⫹ D) where C (“concords”) is the sum of all instances where two elements share the same value on a particular attribute (including all instances where an element shares with itself the same value on a particular attribute) and D (“discords”) is the sum of all instances where they don’t. In an “ideal” binary code, clearly, C ⫽ D ⫺ the “ideal” ratio of similarities to dissimilarities is 1 to 1 ⫺ and therefore z ⫽ (C/[C ⫹ D]) ⫽ (C/2C) ⫽ (.5). (The foregoing discussion is based on Watt 1983.) We note parenthetically that self-comparisons are counted in computing z because otherwise few-element codes would get labelled as less homeogeneous and the “ideal” 1-to-1 ratio would then be approachable only as an asymptote. Admittedly such a state of affairs might be preferable in some respects, since it might be, for some observers at least, that in small codes Discords outweigh (are more salient than) Concords; but it is irrelevant to most considerations where larger codes are being appraised, and the point will not be taken further here. Lastly however it must be admitted that the foundational assumption on which the foregoing (like every similar) calculation is based, namely, that numerical expressions of
412 attribute-sharing are useful measures of something, is dubious even on the face of it, unless carefully hedged, since it rests on an unproven (almost unexamined) assumption that attributes are equally “unitary” or “atomic”, all contributing equally to inter-element similarity hence to the homeogeneity of the code as a whole. For some codes such atomicity could perhaps be deliberately provided for, by judicious choice of attributes and/or by weighting them; but it is certainly not the inevitable result of the sort of selection ⫺ whether or not principled ⫺ that usually takes place when attributes are being assigned. Supposing for instance that one wanted to characterize a set of alphabetic letters in terms of their visual attributes ⫺ a not unreasonable goal ⫺ and that one had on one’s desk the best result of the best psychological “confusion study” in which subjects confuse letters (identify one as the other) in putative proportion as they are intuitively similar (again, a not unreasonable assumption). Let us suppose that we want to characterize the letters {A, V, K, X, Z, Y} ⫺ a homeogeneous subset, all containing diagonals ⫺ and let us lastly suppose that the psychological record before us is the excellent one furnished by Townsend and his colleagues (Townsend 1971; Townsend, Hu and Evans 1984), in which the similarity relationships are ordered as in the list just given: “A” is closest to “V”, next-closest to “K”, next-closest in order to “X”, “Z”, and “Y”. (We obtain for each letter-pair the mean of two rates, that at which “A” is mistaken for “V” and that at which “V” is mistaken for “A”, and so on.) Now: what features do we assign to these letters to rationalize these judgments? We notice that “A” is more similar to “X” than it is to “Z”, and guess that this is because “A” has two diagonals in common with “X” but only one with “Z”; so “has two diagonals” looks to be one feature that will work properly. But “A” and “Z” must surely share the feature “has one diagonal” ⫺ and how then can “has two diagonals” be atomic or indivisible? Yet again, we notice that “A” is closer to “Z” than to “Y”; this must mean that though “Y” shares both diagonals with “A” and but one with “Z”, the diagonals of “Y” are only of half length, so “has two fulllength diagonals” must be another workable feature. So now “A” and “X” have two features in common ⫺ “has two diagonals” and “has two full-length diagonals” ⫺ while “A” and “Y” have but one ⫺ “has two diagonals”
II. Aspekte der Semiose
⫺ meaning that “A” and “X” are properly described as more similar than “A” and “Y” (they have more in common), precisely as desired. But “A” is more similar to “V” than to “X”, so that the two features that “A” and “X” have in common, which (so far) are exactly the same two that “A” and “V” have in common, can’t be the whole story. Moreover “A” shares the same two short diagonals with “K” and “Y”, yet is much more similar to “K” than to “Y”, so here again there must be more to be said. As is clear, (1) selecting features is scarcely an automatic product of knowing how similar a code’s elements have been judged; and (2) such features as “has two diagonals” and “has two full-length diagonals” are scarcely unitary in any case, since the second universally entails the first (concerning letter design, cf. also Art. 2 § 5.4.). Picking up a thread dropped earlier, obviously a code can function as a vehicle of communication only if its elements can be differentiated by the recipient. We understand, then, how it is that inter-element differences are maintained: they must be. But why are inter-element similarities maintained? Their function cannot be to add to the internal univocality (unambiguity) of messages cast in the code, so what is it? The best answer is that they apparently perform virtually no function at all (save for the generally minor one of serving as earmarks of the set of elements concerned, thus helping to identify one code in distinction from other codes; cf. Posner 1983). Apart from this they seem to be present not because of any need for them but because of an unconscious tendency on the part of their users to homogenize “irregular” elements belonging to the same code (Watt 1979, 1988): Similarity, then, as distinguished from dissimilarity, is an extrinsic attribute, making no contribution to communication (in fact, interfering with it) but resulting from an accidental response to a set of elements that people associate as members of the same set. Taking up another point, most experimentation on inter-element similarities is conducted on codes that are very familiar to the subjects ⫺ the alphabet is the all-time favorite ⫺ and it is natural for theoretical discussions of this issue to concern the same familiar set of elements. It might be that this is fatal: that people’s judgments about inter-element similarities depend critically on prior familiarity with the elements concerned. Cer-
413
16. Codes
tainly this notion is intuitively appealing, since our own judgments about inter-element similarity seem more hesitant when presented with (say) the Cyrillic alphabet rather than with the standard Western (“Roman”) one. Still, it seems possible that we compare the elements of a code (or any other element-set of comparable size and complexity) in response to something like “visual (or cognitive) universals”, unconditioned by how much contact we have had with those elements beforehand. Such a thesis can be assessed by testing people’s responses to unfamiliar elements, using instead of the usual letters, for instance, the letters of some unfamiliar (and very different) alphabet, or even the “letters” of some newly-minted pseudo-alphabet. In fact, both sorts of unfamiliar elements have been tested for similarity judgments and in both cases it turns out that, though judgments are naturally slowed by the unfamiliarity effect, inter-element similarities can nonetheless be gauged with great consistency, and when this is done they turn out to conform to predictions based on analysis and theory (e. g., Regan 1981; Jameson 1989). It seems possible that at least in this limited domain inter-element similarities are in fact being judged, not with respect to the particular code they are part of, whether or not familiar, but with respect to more general (perhaps universal) visual processing tactics. In short, it seems that the findings of inter-similarity experimentation in which the elements are the familiar alphabetic letters, apply beyond the scope of the code concerned: familiarity with the code whose signifiers are under examination need not compromise such results at all, hence is less than fatal.
3.
Conclusion
In sum, codes are basically the means by which what we have with some reluctance called “information” (a significatum, generally constructed of smaller significata) is superficially transformed (“encoded”) so as to be transmitted to an intended recipient, and by that recipient retransformed (“decoded”) so as to obtain the information thus conveyed, or a close approximation (as in Fig. 16.4; see also Art. 3). Since information in the most abstract sense is a purely mental (or electronic) phenomenon, unless mental and/or computational telepathy should be-
come possible no information can be conveyed save by being coded. So codes, the elements and combining rules by which their associated algorithms make information representable, are an essential part of semiosis (the act of performing a communication): it is codes, in fact, that translate thought from the ineffable to the effable.
4.
Selected references
Cartarette, Edward C. and Margaret J. Jones (1984), Informal Speech: Alphabetic and Phonemic Texts with Statistical Analyses and Tables. Berkeley: University of California Press. Gould, Josiah B. (1970), The Philosophy of Chrysippus. Leiden: E. J. Brill. Huffman, David A. (1952), “A Method for the Construction of Minimum Redundancy Codes”. Proceedings of the Institute of Radio Engineers 40: 1098⫺1101. Jameson, Kimberly A. (1989), An Empirical Investigation of Semiotic Characterizations of Alphabetic Systems. Unpublished Ph. D. Dissertation, University of California, Irvine (Department of Cognitive Sciences). Jeffery, Lilian H. (1961), The Local Scripts of Archaic Greece. London: Oxford University Press. Knuth, Donald E. (1973), The Art of Computer Programming, Vol. 1. Reading MA: AddisonWesley. Lass, Roger (1980), On Explaining Language Change. Cambridge, England: Cambridge University Press. Nöth, Winfried (1983), “Systems Theoretical Principles of the Evolution of the English Language and Literature”. In: Michael Davenport, Erik Hansen, and Hans Frede Nielsen (eds.), Current Topics in English Historical Linguistics (⫽ Odense University Studies in English, Vol. 4). Odense, Denmark: Odense University Press. Peirce, Charles S. (1935⫺1966), Collected Papers of Charles Sanders Peirce, ed. by Charles Hartshorne, Paul Weiss, and Arthur W. Burks. Cambridge MA: Harvard University Press. Posner, Roland (1983), „Kodes als Zeichen“. Zeitschrift für Semiotik 5: 401⫺408. Regan, Joan E. (1981), “Effect of Familiarity on Multielement Matching”. Journal of Experimental Psychology: Human Perception and Performance 7: 1273⫺1282. Saussure, Ferdinand de (1967 [1916]), Cours de Linguistique Ge´ne´rale, ed. by Rudolf Engler. Wiesbaden: Otto Harrassowitz. Smith, Whitney (1975), Flags. New York: McGraw-Hill. Standish, Thomas A. (1980), Data Structure Techniques. Reading MA: Addison-Wesley.
414
II. Aspekte der Semiose
Townsend, James T. (1971), “Theoretical Analysis of an Alphabetic Confusion Matrix”. Perception and Psychophysics 9: 40⫺50. Townsend, James T., G. G. Hu and R. J. Evans (1984), “Modeling Feature Perception in Brief Displays with Evidence for Positive Interdependencies”. Perception and Psychophysics 36: 35⫺49. Tversky, Amos (1977), “Features of Similarity”. Psychological Review 84: 327⫺352. Watt, W. C. (1979), “Iconic Equilibrium”. Semiotica 28: 31⫺62.
Watt, W. C. (1983), “Grade der Systemhaftigkeit”. Zeitschrift für Semiotik 5: 371⫺399. Watt, W. C. (1984), “Signs of the Times”. Semiotica 50: 97⫺155. Watt, W. C. (1988), “Canons of Alphabetic Change”. In: Derrick De Kerckhove and Charles J. Lumsden (eds.), The Alphabet and the Brain. Berlin: Springer-Verlag.
Gavin T. Watt and William C. Watt, Irvine, California (USA)
17. Kodewandel 1. Vorbemerkung 2. Drei Typen von Kodes 2.1. Natürliche Kodes 2.2. Künstliche Kodes 2.3. Kodes der dritten Art 3. Der Mechanismus des Wandels 3.1. Beispiel: der Kleiderkode 3.2. Stase und Dynamik, Homogenität und Heterogenität 3.3. Ein allgemeines Modell des Wandels von Kodes der dritten Art 4. Invisible-hand-Erklärungen 4.1. Beispiel: Stau aus dem Nichts 4.2. Beispiel: eine zyklische Drift in der Sprache 4.3. Die Erklärbarkeit kulturellen Wandels 4.4. Wandel und Evolution 4.5. Variation und Selektion 4.6. Die Selektionsebene 4.7. Zusammenfassung 5. Prinzipien des Kodewandels 5.1. Prolegomena 5.2. Klassifikation 5.3. Umkodierung 5.4. Die kulturelle Überformung von Sprache 5.5. Sprachbezogene Sonderkodes 6. Literatur (in Auswahl)
1.
Vorbemerkung
Es gibt Kodes, die permanentem Wandel unterliegen, wie etwa natürliche Sprachen, und solche, bei denen dies per definitionem nicht der Fall ist, wie beispielsweise logische Konstruktsprachen. Wenn ein Kode definiert ist als „a set of substitution rules“ (Art. 16 § 1.), so folgt daraus, daß zwei verschiedene Regelmengen, etwa solche, die sich durch eine Re-
gel unterscheiden, zwei verschiedene Kodes sind. Die Frage, ob man eine historische Umgestaltung als Wandel eines Kodes oder als Ersetzung eines Kodes durch einen anderen ansieht, ist (teilweise) eine Frage der Definition von „Kode“, eine Frage der Identitätskriterien. Für sogenannte natürliche Sprachen sind die Identitätskriterien nicht explizit festgelegt. Kontinuität des Gebrauchs ist vielfach ein Identitätskriterium, jedoch keineswegs immer. Althochdeutsch betrachtet man gemeinhin als eine Form des Deutschen, Lateinisch jedoch nicht als eine Form des Italienischen. Latein gilt als eine tote Sprache, während Althochdeutsch in Form des Neuhochdeutschen „weiterzuleben“ scheint (vgl. Denison 1977, 14). Oftmals spielen Kriterien eine Rolle, die mit den Kodes selbst und ihrem Gebrauch sehr wenig zu tun haben, wie beispielsweise politische Kriterien. Wandel impliziert Stase. Um von etwas sagen zu können, daß es sich gewandelt habe, muß einiges davon von Stadium zu Stadium unverändert geblieben sein, damit die Identität dessen, wovon behauptet wird, es habe sich gewandelt, gewährleistet ist (Keller 1990, Kap. 4.5). Die Sprache, die wir heute benutzen, hat mit der, die unsere Vorfahren vor 1200 Jahren sprachen, nicht mehr viel gemein; dennoch hat wohl nie eine Generation den Eindruck gehabt, eine andere Sprache als die vorhergehende Generation zu sprechen. Denn das allermeiste bleibt von Generation zu Generation konstant. Es empfiehlt sich deshalb, diese Kontinuität im Wandel „StafettenKontinuität“ zu nennen (Lüdtke 1980 a, 4). Die entscheidende Frage ist die nach dem Mechanismus von Wandel und Stase der
415
17. Kodewandel
Kodes. Die Frage nach der Funktion des Kodewandels ist, wie noch zu zeigen sein wird, meist fehl am Platze oder zumindest irreführend.
2.
Drei Typen von Kodes
Nach dem Mechanismus von Stase und Wandel kann man drei Typen von Kodes unterscheiden. (1) Natürliche Kodes, die in der belebten Natur vorkommen und dem Sender wie dem Empfänger angeboren sind: Bienentanz, Balzlaute, Farbsignale usw. (2) Künstliche Kodes, die von Menschen willentlich geschaffen wurden: Flaggenkode, Verkehrszeichen, Rangabzeichen, Computersprachen usw. (3) Kodes „der dritten Art“ (vgl. Keller 1990, Kap. 4.1), die nichtintendierte Ergebnisse menschlichen Handelns sind: sogenannte natürliche Sprachen, bestimmte Arten, sich zu kleiden, bestimmte Arten, Wohnzimmer einzurichten, usw. Je nachdem, welches Kriterium man zugrunde legt, lassen sich jeweils zwei der drei Typen unter einer gemeinsamen Oberkategorie zusammenfassen (vgl. Abb. 17.1 und 17.2; siehe auch Art. 1 § 1.1.). Mit anderen Worten: Diejenigen Kodes, die als nichtintendierte Ergebnisse menschlicher Handlungen entstanden sind, die Kodes „der dritten Art“, haben sowohl Gemeinsamkeiten mit natürlichen Kodes als auch mit künstlichen Kodes. Mit ersteren haben sie gemeinsam ihre evolutionäre Entstehungs- bzw. Veränderungsweise, mit letzteren haben sie gemein, daß sie Folgen menschlichen Handelns sind. Dank dieser Doppelmitgliedschaft wurden die Kodes der dritten Art, also diejenigen, die als nichtintendierte Ergebnisse menschlicher Handlungen entstanden und Gegenstand soziokultureller Evolution sind, meist nicht als eigenständige Kategorie gesehen. Dies zu tun, ist aber unbedingt erforderlich, will man das Wesen dieser Kodes und ihres Wandels verstehen. So wurden beispielsweise sogenannte natürliche Sprachen meist wahlweise den Naturphänomenen zugeordnet (vgl. Schleicher 1863; Müller 1862 ⫽ 1892), mit dem Argument, ihr Wandel sei vom Willen des einzelnen unabhängig, oder den Artefakten zugeordnet (vgl. Whitney 1875), mit dem Argu-
Abb. 17.1
Abb. 17.2
ment, sie seien Ergebnisse menschlichen Handelns. Die Besonderheit dieser Klasse von Kodes besteht jedoch gerade darin, daß beide Kriterien gemeinsam zutreffen (Haakonssen 1981, 24): Sie sind, in der klassischen Formulierung von Adam Ferguson (1767, 187 ⫽ 1904, 171), „the result of human action, but not the execution of any human design“. Betrachten wir die Mechanismen des Wandels der drei Typen von Kodes der Reihe nach. 2.1. Natürliche Kodes Natürliche Kodes sind solche, die nicht Ergebnisse menschlicher Handlungen sind. Hierzu gehört etwa der Tanz-Kode der Bienen, die sogenannte Bienensprache, mit der sich die Tiere über Art, Richtung und Entfernung von Futterquellen informieren können; oder das Paarungsverhalten der Stichlinge, bei dem der männliche Fisch durch einen Zickzacktanz das Weibchen lockt, das seinerseits durch Vorzeigen seines dicken Bauches Paarungsbereitschaft signalisiert. Natürliche Kodes sind angeboren, ihr Einsatz erfolgt nichtintentional, und der Mechanismus ihres Wandels ist der der biologischen Evolution. Er sieht vereinfacht dargestellt wie
416 folgt aus: Durch Kopierfehler in der Vererbung entsteht Mutation. Der durch Mutation entstandene neue Typus heißt Mutante. Der Zweck eines Lebewesens besteht darin, mehr Lebewesen seines Typus zu erzeugen. Wenn nun eine Mutation bewirkt, daß die neue Mutante in einer gegebenen Umwelt diesen Zweck besser zu erfüllen imstande ist als die bereits existierenden Typen, so ist zu erwarten, daß der relative Anteil des neuen Typus in der Population zunimmt, d. h. daß die Frequenz des neuen Typus steigt. Die Fortpflanzungswahrscheinlichkeit eines bestimmten Typus bezogen auf eine bestimmte ökologische Umgebung kann man „Fitness“ bzw. „biologische Tauglichkeit“ nennen (vgl. Maynard Smith 1972). Wenn man von fitnessneutralem zufälligem Kodewandel, den es vermutlich auch gibt, absieht, so ist Wandel in natürlichen Kodes immer dann zu erwarten, wenn neue Typen mit neuem Kodeverhalten auftreten, deren Fitness die der anderen Typen übertrifft. Dabei lassen sich zwei Selektionsinstanzen unterscheiden: die phänotypische Selektion (auch „survival selection“) und die genotypische Selektion (auch „reproductive selection“). Selektionsinstanz der phänotypischen Selektion ist die Umwelt; phänotypische Selektion führt zu Anpassung an die Umwelt. Selektionsinstanz der genotypischen Selektion sind die Geschlechtspartner(innen); sie führt zu Anpassung an die Auswahlkriterien durch die potentiellen Paarungspartner(innen) (vgl. Huxley 1963, XIX ff). So würde eine Optimierung der Kommunikationsmöglichkeiten der Bienen eine bessere Anpassung an die Umwelt bedeuten. Sie könnten Nahrungsressourcen effektiver nutzen. Eine Optimierung des Kommunikationsverhaltens eines männlichen Stichlings würde eine bessere Anpassung an die Partnerwahlkriterien weiblicher Stichlinge bedeuten. Er würde höhere Reproduktionschancen haben als seine minder ausgestatteten männlichen Konkurrenten. Dabei kann eine erhöhte Anpassung auf der einen Seite eine verminderte Anpassung auf der anderen Seite bedeuten. So können beispielsweise intensivere Signalfarben bessere Zugangsmöglichkeiten zu Paarungspartnern bewirken, gleichzeitig jedoch die Aufmerksamkeit der Feinde in verstärktem Maße erwekken. Die Chancen, eine Paarungspartnerin zu finden, erhöhen sich beispielsweise beim männlichen Hahnenschweif-Widah, einem kleinen afrikanischen Vogel, mit der Länge seiner Schwanzfedern. Gleichzeitig ver-
II. Aspekte der Semiose
schlechtern sich jedoch seine Flugeigenschaften so sehr, daß er bei Nässe bisweilen nicht einmal mehr in der Lage ist, sich in die Luft zu erheben (vgl. Dawkins 1987, 240). Bei natürlichen Kodes ist die Fähigkeit, in einem Kode zu senden, nicht notwendigerweise mit der Fähigkeit gekoppelt, in ihm auch zu empfangen, und umgekehrt. Die beiden Fähigkeiten sind vielfach komplementär verteilt. Es ist keineswegs ungewöhnlich, daß beispielsweise die Männchen einer bestimmten Art Balzsignale auszusenden in der Lage sind, die nur von den Weibchen dieser Art empfangen werden können, ohne daß diese in der Lage sind, die Signale von der Art, die sie empfangen können, auch auszusenden (vgl. Lyons 1980, 95). Daraus folgt, daß sich Sender- und Empfängerfähigkeiten getrennt voneinander (wenn auch nicht unabhängig voneinander) wandeln können. Für ein Küken kann es entscheidend sein, die Lockrufe seiner Mutter erstens als Lockrufe und zweitens als die seiner Mutter identifizieren zu können. Küken, bei denen diese Fähigkeit stärker ausgeprägt ist als bei anderen, haben unter sonst gleichen Bedingungen höhere Überlebens- bzw. Reproduktionschancen als die anderen. Auf diese Weise können sich Empfängerfähigkeiten verändern, ohne daß sich damit die Senderfähigkeit der zukünftigen Kükenmutter verändert. Auf der anderen Seite können die Fähigkeiten des Empfängers auch Selektionsinstanz des Senders sein. Eine Mutter, die ihre Küken mit geringerer Lautstärke aber dennoch mit Erfolg locken kann, wird in geringerem Maße die Aufmerksamkeit ihrer Feinde wecken. Auch im Bereich der menschlichen Kommunikation spielen natürliche Kodes eine Rolle: Kinesik (sogenannte „Körpersprache“), Gestik, Mimik, stimmliche nichtsprachliche Signale wie Zittern, Lachen, Weinen usw. Bei all diesen natürlichen Signalkodes handelt es sich jedoch mehr oder weniger ausgeprägt um Mischtypen, um kulturell überformte natürliche Kodes. Daß wir weinen, ist natürlich; unter welchen Bedingungen und wie wir (als Erwachsene) weinen, ist teilweise konventionell. Weinen hat somit nicht nur natürliche Signal-, sondern auch teilweise Symbolfunktion. Seine Signalfunktion kann sich ändern im Zuge und nach den Mechanismen der biologischen Evolution unserer Art; seine Symbolfunktion kann sich ändern im Zuge und nach den Mechanismen der kulturellen Evolution unserer Lebensformen.
17. Kodewandel
Die hier intendierte Unterscheidung zwischen Symbolen und natürlichen Signalen ist folgende: Symbole sind bedeutungsvoll in einer bestimmten Gemeinschaft bzw. Gruppe, weil ihr Gebrauch konventionell (vgl. Lewis 1969, Kap. II) oder artifiziell (d. h. durch Abmachung, Vorschrift, Edikt o. ä.) geregelt ist. Die Bedeutung eines Symbols kennen heißt, seine Gebrauchsweise kennen. Dabei kann die Ausdrucksseite eines Symbols motiviert, d. h. ikonisch sein, wie bei einigen obszönen Gesten, den römischen Ziffern oder den Wörtern „Kuckuck“ oder „O-Beine“ (vgl. § 3.), oder nichtmotiviert sein, wie beim byzantinischen Segensgestus, den arabischen Ziffern oder Wörtern wie „Schwein“ oder „als“. Natürliche Signale hingegen stehen mit dem, was sie signalisieren, in kausalem Zusammenhang (vgl. Klaus 1969, 630; Philosophisches Wörterbuch, 1194). Entweder sind natürliche Signale Teil dessen, was sie signalisieren, oder sie stehen in einer Verursacher-UrsacheWirkung-Relation. Somit ist beispielsweise Rauch nicht Symbol des Feuers, sondern Signal von Feuer und Teil des Feuers. Gesträubte Nackenhaare des Hundes sind Signal für Aggression und Teil seines Aggressionsverhaltens. Fußspuren oder Fingerabdrücke sind nicht Symbol der früheren Anwesenheit des Verursachers, sondern Signal derselben. Weinen ist primär Signal von Trauer und Teil des natürlichen Trauerverhaltens. Sekundär kann es aber auch symbolische Qualität bekommen, dann nämlich, wenn Anlaß und/ oder Art und Weise des Weinens, wie es in unserer Kultur der Fall ist, durch Konvention geregelt ist. Es sei noch auf einen weiteren zumindest theoretisch denkbaren Mischtypus hingewiesen: Da Menschen dazu in der Lage sind, in die biologische Evolution künstlich einzugreifen, indem sie gezielt selegieren ⫺ man nennt das „Zucht“ ⫺, sind gezielt gezüchtete natürliche Kodes denkbar (ganz abgesehen von Kodes, die Ergebnisse gezielter Genmanipulation sind). Hier muß es bei dem Hinweis auf dieses (nicht nur) klassifikatorische Problem bleiben. 2.2. Künstliche Kodes Künstliche Kodes sind solche, die planvoll von Menschen entworfen und geschaffen worden sind. Hierzu gehören logische und mathematische Kunstsprachen, Computersprachen, Kunstsprachen wie Volapük oder Esperanto, der Kode der Verkehrszeichen,
417 der militärischer Rangabzeichen, vereinbarte Erkennungszeichen von Pfadfindern, Freimaurern usw. Der Mechanismus des Wandels solcher Kodes ist der der gezielten intentionalen Veränderung. Unter dem Aspekt des Mechanismus des Wandels gesehen, sind künstliche Kodes die am wenigsten interessanten. Da künstliche Kodes willentlich geschaffene Artefakte sind, tritt bei ihnen auch am ehesten der eingangs erwähnte Fall der definitorisch bedingten Unwandelbarkeit ein: Wenn ein künstlicher Kode K definiert ist als genau eine bestimmte Menge von Einheiten und Regeln, so ist eben ein Kode, der sich von K durch ein Element unterscheidet, nicht mehr der Kode K, sondern ein anderer, weil die Referenz des Namens „K“ so festgelegt ist. Künstliche Kodes können unter Umständen beginnen, sich von ihrem Schöpfer zu befreien und ein Eigenleben zu führen. Dies ist in Ansätzen mit Esperanto geschehen (Sakaguchi 1983; Posner 1983). In dem Maße, in dem dies geschieht, entstehen Mischformen von künstlichen Kodes und Kodes der dritten Art. 2.3. Kodes der dritten Art Kodes der dritten Art sind solche, die Ergebnisse menschlichen Handelns sind, nicht aber willentlich (und meist auch nicht wissentlich) von Menschen geschaffen wurden (Hayek 1969 a). Hierzu gehören alle sogenannten „natürlichen“ Sprachen, das Preisgefüge in einer Marktwirtschaft, die Kleidermoden in einer liberalen Gesellschaft, das System der Statussymbole sowie der Imponierrepertoires usw. Kodes der dritten Art sind spontane Ordnungen eines bestimmten Typus (vgl. Hayek 1969 b). Spontane Ordnungen sind makrostrukturelle Systeme, die sich aufgrund mikrostruktureller Einwirkungen bilden, ohne daß die Einwirkungen auf die Bildung der betreffenden Systeme abzielten. D. h. der Prozeß der Bildung einer spontanen Ordnung vollzieht sich nicht als Realisierung eines irgendwie gearteten präexistenten Planes. Die aufgrund stetiger Westwinde entstehende Dünenstruktur in einem Teil der Sahara ist eine spontane Ordnung. Sandkörner sind mehr oder weniger gleichförmigen Kräften ausgesetzt und kumulieren zu einer bestimmten Makrostruktur, den Dünen. Spontane Ordnungen im Bereich des Sozialen, d. h. solche, die aufgrund menschlicher Handlungen entstehen, sind sogenannte „Phänomene der dritten Art“. Sie haben mit Naturphänome-
Abb. 17.3: 10 Minuten vor dem Centre Pompidou (aus: Nickl 1980, 1789⫺1792).
II. Aspekte der Semiose
Abb. 17.3: 10 Minuten vor dem Centre Pompidou (aus: Nickl 1980, 17891792).
418
17. Kodewandel
nen gemein, daß sie keine willentlichen Schöpfungen des Menschen sind, und unterscheiden sich von Naturphänomenen dadurch, daß sie aufgrund menschlicher Handlungen entstehen. Mit Artefakten haben sie gemein, daß sie Produkte des Menschen sind, und sie unterscheiden sich von Artefakten dadurch, daß sie nicht die Realisierung eines präexistenten Plans sind. Sie sind weder natürlich noch künstlich, sondern von der dritten Art. Phänomene der dritten Art sind eine Teilmenge der spontanen Ordnungen, eben die durch menschliche Handlungen erzeugten spontanen Ordnungen. Abbildung 17.3 zeigt ein Phänomen der dritten Art. Schaulustige formieren sich um Straßenkünstler zu zwei Ringen. Die Ringe sind Ergebnisse menschlichen Handelns, aber sie sind von den beteiligten Passanten nicht willentlich (und wohl auch für die meisten nicht wissentlich) geschaffen. Kodes der dritten Art sind eine Teilmenge der Phänomene der dritten Art, eben solche Phänomene der dritten Art, die von Menschen dazu verwendet werden, Informationen zu übertragen (s. Art. 16.). Der Mechanismus der Genese spontaner Ordnungen ist im allgemeinen identisch mit dem des Wandels (vgl. Keller 1990, Kap. 1.4). Das Prinzip ist stets das gleiche: Eine Ordnung emergiert dadurch, daß auf die individuellen Elemente unter bestimmten Rahmenbedingungen bestimmte Kräfte einwirken. Die Elemente, die Rahmenbedingungen, die Kräfte sowie der Emergenzprozeß können dabei sehr variieren. Betrachten wir einige einfachere und weniger einfache Beispiele spontaner Ordnungen. (i) Wenn wir auf ein Blatt Papier Eisenfeilspäne streuen und darunter einen Magneten halten, ordnen sich die Eisenteilchen zu einer bestimmten Struktur. Die Struktur ist abhängig von der Größe der Späne, der Art des Magneten sowie der Oberfläche des Papiers. Wenn die Bedingungen konstant bleiben, ist die so entstandene Struktur stabil. (ii) Wenn die Sandkörner einer Wüste konstanten Winden ausgesetzt sind, ordnen sie sich zu einer bestimmten Dünenstruktur. Die Struktur ist abhängig von der Größe der Sandkörner, der Feuchtigkeit, der Windstärke, der Richtungskonstanz usw. Wenn die Bedingungen konstant bleiben, unterliegt die entstandene Struktur permanentem Wandel. Es entstehen Wanderdünen. In beiden Fällen haben wir es mit spontanen Ordnungen zu tun, die rein naturgesetz-
419 lich entstehen. Die eine ist stabil, die andere dynamisch. Betrachten wir nun Fälle, bei denen die wirkenden Kräfte nicht Naturphänomene sind, sondern handelnde Individuen bzw. deren Intentionen: (iii) Passanten bemerken einen Straßenkünstler und beschließen (jeder für sich), einen Augenblick zu verweilen, um ihm zuzuschauen. Jeder einzelne stellt sich so hin, (1) daß er möglichst gut sieht, (2) daß er einen bestimmten Abstand hält (a) gemäß seinen kulturellen Distanzkonventionen und (b) so, daß eine hinreichende Anzahl anderer Passanten ebenfalls passable Sichtmöglichkeiten hat, (3) daß er niemandem unmittelbar die Sicht versperrt und (4) daß er sich nicht selbst exponiert. Auf diese Weise entsteht eine Kreisstruktur, wie sie in Abb. 17.3 zu sehen ist. Die Struktur ist abhängig von der Art des Spektakels, den räumlichen Rahmenbedingungen und vor allem von der Art der Handlungsmaximen der Passanten. Kindergartenkinder würden vermutlich nur nach der Maxime (1) handeln. Auf diese Weise würde keine schöne Kreisstruktur entstehen, sondern ein heilloses Durcheinander. Wenn die Bedingungen konstant bleiben, ist die Kreisstruktur stabil. Die der Kindergartenkinder unterläge vermutlich permanentem Wandel. Fall (iii) stellt eine spontane Ordnung dar, die nicht mehr rein naturgesetzlich entsteht. An ihr sind intentionale Handlungen freier Individuen beteiligt. Aber dennoch ist die Struktur kein reines Artefakt. Denn die Intentionen der Handelnden sind nicht auf die Erzeugung der Kreisstruktur gerichtet (den meisten wird sie verborgen bleiben), sondern auf die Realisierung der oben genannten Maximen (1) bis (4). Die so erzeugte Struktur ist weder natürlich (wie die Wanderdünen) noch künstlich (wie eine Ballettchoreographie), sondern ein Phänomen der dritten Art. Die Elemente der Ordnung sind die einzelnen Individuen, die auf sie wirkenden Kräfte sind die Handlungsmaximen, die erzeugte Struktur ist der Kreis. Er ist eine gesetzmäßige Konsequenz des intentionalen Handelns nach den genannten Maximen. Fassen wir das bis hierher Gesagte zusammen: Der Genese- bzw. Wandelmechanismus ist in allen drei genannten Fällen im Prinzip der gleiche (s. Abb. 17.4). Wir wollen die Ausgangsbedingungen des Kumulationsprozesses „die mikrostrukturelle
420
II. Aspekte der Semiose
Abb. 17.4
Ebene“ und die Ergebnisse des Kumulationsprozesses „die makrostrukturelle Ebene“ oder auch kurz „Mikrostruktur“ und „Makrostruktur“ nennen. Den Kumulationsprozeß werden wir später taufen; vgl. § 3. 3. Es hängt, wenn die Rahmenbedingungen konstant bleiben, im wesentlichen von den Kräften ab, ob die erzeugte Ordnung stabil wird oder permanentem Wandel unterliegt. Die ersten beiden Phänomene sind rein kausaler bzw. naturgesetzlicher Art, Phänomene der dritten Art haben intentionale und kausale Anteile. Sie sind kausale Effekte intentionaler Handlungen. Die Frage, ob Handlungen selbst verursacht sind, d. h. ob Intentionen Ursachen des Handelns sein können, oder, allgemeiner ausgedrückt, ob Gründe Ursachen sein können, wird ausgiebig diskutiert (vgl. z. B. Beckermann 1977). Da der Ausgang dieser Diskussion für das vorliegende Problem ohne Konsequenzen zu sein scheint, sei die Frage hier offengelassen.
3.
Der Mechanismus des Wandels
Über den Wandel der wichtigsten Kodes der dritten Art, der sogenannten „natürlichen“ Sprachen, kursieren zwei prominente Irrtümer, auf die sicherheitshalber hingewiesen werden soll. Es wird behauptet, Sprache ändere sich ständig, (1) weil sie kein e´rgon ist, sondern eine ene´rgeia, eine menschliche Tätigkeit, die nur „in dem Acte ihres wirklichen Hervorbringens“ (Humboldt 1836 ⫽ 1907, 46; vgl. Coseriu 1958, 24, 37 f, 58, 245 f, 255; Coseriu 1980, 143) existiere; (2) weil sie arbiträr sei (vgl. Saussure 1916 ⫽ 1967, 89; Eyer 1983). In beiden Argumenten werden notwendige Bedingungen irrtümlicherweise für hinreichend gehalten. Aus der Tatsache (unterstellt, daß es eine ist), daß die Menschen mit jedem Redeakt die Sprache in gewissem Sinne aufs
Neue erschaffen, folgt keineswegs, daß sie sie ständig anders, modifiziert erschaffen. Wie wäre sonst die Konstanz in der Sprache zu erklären und die Konstanz anderer Bräuche, die ebenfalls nur in und als Vollzug existieren (vgl. Keller 1988, 146 f)? Die Arbitrarität sprachlicher Zeichen ist ein Spezialfall der Arbitrarität von Regeln. Arbiträr wird gemeinhin mit willkürlich übersetzt. Eine Verhaltensregel ist willkürlich, wenn sie nicht von der Aufgabe her determiniert ist, deren Lösung sie dient; wenn es auf andere Weise genau so gut ginge. Regeln, die per Konvention gelten, sind notwendigerweise arbiträr. Denn „so etwas wie die einzigmögliche Konvention [gibt es nicht]“ (Lewis 1969, 71). Die Möglichkeit einer mindestens gleich guten Alternative zu einer bestehenden Konvention muß per definitionem bestehen; d. h. die Art der zu lösenden Aufgabe ist keine Rechtfertigungsinstanz für die gerade geltende Konvention. Wenn dies so wäre, würde man eine bestehende Verhaltensregularität einfach nicht „Konvention“ nennen. „Das ist auch der Grund, weshalb es redundant ist, von einer willkürlichen Konvention zu sprechen“ (Lewis 1969, 71), und deshalb ist es ebenfalls redundant, von einem konventionellen Zeichen zu sagen, es sei arbiträr. Die Frage der Arbitrarität wird aufgrund einer von Saussure begründeten Tradition mit der Frage der Motiviertheit vermischt. Daß wir den Kuckuck „Kuckuck“ nennen, macht dieses Zeichen zu einem motivierten. Aber die Motiviertheit eines Zeichens tut seiner Arbitrarität keinen Abbruch; und zwar nicht deshalb, weil (wie Saussure meint) andere Sprachgemeinschaften den Ruf des Kukkucks auf andere Weise onomatopoetisch abbilden (vgl. Saussure 1916 ⫽ 1967, 81), sondern weil es unsere Konvention ist, ihn „Kuckuck“ zu nennen. Wir hätten bei der früheren Bezeichnung Gauch bleiben können. Es ist arbiträr, onomatopoetische oder sonstige ikonische Verfahren oder nicht-moti-
17. Kodewandel
421
vierte oder sekundär motivierte Zeichen zur Bildung konventioneller Zeichen zu wählen. Zeichen wandeln sich nicht, weil sie arbiträr sind, sondern ihre Konventionalität und, darin eingeschlossen, ihre Arbitrarität macht sie wandlungsfähig. Was konventionell ist an unserer Sprache, ist für Wandel nach dem Modus soziokultureller Evolution offen; was an ihr natürlich ist, kann sich ändern in den Dimensionen der biologischen Evolution unserer Art. Nun ist das Terrain so weit vorbereitet, daß wir uns dem Mechanismus der Genese bzw. des Wandels von Kodes der dritten Art zuwenden können. Als Beispiel sei unsere Art und Weise, uns zu kleiden, also unser „Kleiderkode“ gewählt (vgl. Enninger 1983).
Verhüllungsfunktion hinausgehend beispielsweise nach folgenden Maximen: Kleide dich so,
3.1. Beispiel: der Kleiderkode Unsere Kleidung dient uns zum Schutz vor den „Unbilden“ der Witterung sowie zur Verhüllung unserer Blößen (Barthes 1985, 270). Wenn dies die einzige Funktion wäre, die wir mit ihr zu erfüllen trachteten, so wäre weder die relative Homogenität der Art und Weise, uns zu kleiden, noch ihr permanenter Wandel zu erklären (auch andere Erscheinungen nicht, die wir hier außer acht lassen wollen: der hohe Aufwand, die relative Unbequemlichkeit usw.). Diente unsere Kleidung lediglich dem Schutz und der Verhüllung, so könnte erstens jeder seine individuelle Methode wählen, beides zu gewährleisten (Leinenponchos, Wolldecken, Plastikfolie, Fellmantel usw.), und es könnten sich zweitens bezogen auf die Kosten, das Material und die Witterungsbedingungen optimale Lösungen herausbilden, die relativ stabil bleiben könnten (so wie es etwa für Berufstaucher bezogen auf die Materialtechnologie, die Wassertemperatur usw. optimale Taucheranzüge gibt). Die Bekleidungsweise jedes einzelnen bräuchte sich nur zu ändern mit dem Wetter und der technischen Entwicklung der Materialien. Die relative Homogenität unserer Kleiderkodes sowie der permanente Wandel ist ganz anderen Funktionen zu verdanken. Unsere Kleidung hat, wie unsere Sprache auch, Symbolfunktion; sie ist (neben anderem) Mittel der Selbstdarstellung. Diese Funktion ist es, der im wesentlichen ihre Dynamik zu verdanken ist. Dies läßt sich, wie beim Beispiel des Zuschauerkreises, in Form von Maximen darstellen. Wir kleiden uns über die Schutz- und
Wenn wir diese Auswahlliste betrachten, können wir folgendes erkennen: Einige Maximen wirken homogenisierend (etwa 1. und 2.), andere wirken eher heterogenisierend (3., 5., 10.), wieder andere homogenisierend und abgrenzend zugleich, also gruppenbildend (1., 4., 6., 7., 9.); viele der Maximen scheinen auf den ersten Blick miteinander unverträglich zu sein.
1. daß du als zur Gruppe X gehörig erkennbar bist; 2. daß du nicht (zu sehr) auffällst; 3. daß du dich von der Gruppe Y abgrenzt; 4. daß du Z gefällst; 5. daß du (ein wenig/stark) beachtet wirst; 6. daß dein sozialer Status sichtbar wird/relativ hoch erscheint; 7. daß dein Wohlstand erkennbar ist; 8. daß du Bescheidenheit signalisierst; 9. daß deine politische Haltung zum Ausdruck kommt; 10. daß du dich von allen anderen deiner Umgebung unterscheidest usw.
3.2. Stase und Dynamik, Homogenität und Heterogenität Wie entsteht nun daraus permanenter Wandel bei relativer Homogenität? Betrachten wir zunächst die vier theoretischen Möglichkeiten, die sich aus den beiden Parametern homogen/heterogen und stabil/dynamisch idealtypisch ergeben. (i) Der Kleiderkode einer Gruppe kann homogen und stabil sein. Dieser Typ entsteht, wenn sich jeder einzelne nach Maximen kleidet wie beispielsweise den folgenden: Kleide dich so wie die anderen der Gruppe; so, daß du nicht auffällst; so wie die Vorfahren. Bei beliebiger Ausgangslage entstünde, wenn diese Maximen zur Geltung gelangten, eine homogene, evolutionär stabile Bekleidungsweise. Die Maximen könnten durch eine Autorität befohlen sein (etwa durch den Abt eines religiösen Ordens), dann wäre der Kode ein Artefakt. Oder sie könnten sich als Konventionen (als Handlungspräferenzen aufgrund eines Systems wechselseitiger Erwartungen) etabliert haben; in diesem Fall wäre der Kode ein Phänomen der dritten Art. (ii) Der Kleiderkode einer Gruppe könnte heterogen und stabil sein. Dieser Ty-
422 pus entstünde beispielsweise, wenn sich jeder einzelne nach etwa folgenden Maximen kleiden würde: (a) Kleide dich so, daß du dich von allen anderen unterscheidest; und (b) kleide dich so, daß du an deiner Kleidung erkennbar bist. Beide Maximen zusammengenommen erzeugen Heterogenität plus Stabilität, denn (a) bewirkt Verschiedenheit und (b) bewirkt Konstanz. (iii) Der Kleiderkode einer Gruppe könnte homogen und dynamisch sein. Dieser Typus entstünde in einer Gruppe, in der eine Person absolutes Vorbild ist, sich alle anderen in ihrer Kleidung nach der Kleidung des Vorbilds richten, das Vorbild selbst aber seinen Bekleidungsstil (nach welchen Maximen auch immer) häufig ändert. (iv) Der Kleiderkode könnte heterogen und dynamisch sein; dann nämlich, wenn beispielsweise jeder nach der Maxime handelte: Kleide dich so, daß du möglichst auffällst und Aufmerksamkeit erweckst. Diese vier theoretisch möglichen Typen sind nicht so klar voneinander abgrenzbar, weil „heterogen“ und „dynamisch“ Bezeichnungen für Kontinua sind. Unser wirklicher Kleiderkode ist mit keinem der vier Typen identisch, enthält aber Züge von jedem: Wenn wir uns etwa die Gruppe der mittelständischen erwachsenen Bürger hierzulande anschauen, so stellen wir fest: Es gibt nahezu keine zwei Menschen, die gleich gekleidet sind, aber alle sind sehr ähnlich gekleidet. Es gibt beständigen Wandel, aber er bleibt in relativ engem Rahmen. Hosenbeine werden weiter und enger, Röcke werden kürzer und länger, Krawatten schmaler und breiter etc. Die besondere Form des moderaten Wandels bei moderater Heterogenität kommt dadurch zustande, daß jeder einzelne bei der Wahl seiner Bekleidung nach Maximen handelt, die sich in ihrer Wirkung wieder teilweise aufheben: auffallen wollen und Gruppenzugehörigkeit zum Ausdruck bringen, Wohlstand symbolisieren und Bescheidenheit kundtun usw. Auf diese Weise entstehen Kompromisse, und für jeden einzelnen ist die Art und Weise, wie die anderen sich kleiden, Teil der eigenen Entscheidungskriterien. Die so aufeinander bezogenen Entscheidungen vieler kumulieren zu einer relativ homogenen dynamischen Makrostruktur, dem Kleiderkode mit seinen kürzer- und längerfristigen Bewegungen, die wir „Moden“ nennen.
II. Aspekte der Semiose
3.3. Ein allgemeines Modell des Wandels von Kodes der dritten Art Der Mechanismus des Wandels des Kleiderkodes ist in seiner Grundstruktur identisch mit dem der bereits erwähnten spontanen Ordnungen: mikrostrukturelle Aktivitäten von Individuen bilden durch einen Kumulationsprozeß eine Makrostruktur. Betrachten wir diesen Mechanismus am Beispiel des Kleiderkodes nun spezifischer. Individuen leben in einer bestimmten Umwelt, einem bestimmten Klima, in einer bestimmten sozialen Ordnung und kulturellen Tradition (die selbst wieder Phänomene der dritten Art darstellen), einem bestimmten technologischen Entwicklungsstand; unter all diesen für den einzelnen gegebenen Bedingungen führt jedes Individuum Wahlhandlungen in Bezug auf seine Bekleidung aus. Die Rahmenbedingungen des Handelns seien „Handlungsökologie“ genannt. Die Wahl der Bekleidung ist eine strategische Unternehmung; sie bedarf einer Kosten-Nutzen-Kalkulation, einer Handlungsökonomie. Angestrebte Funktionen sollen erfüllt werden bei erträglichen Kosten (materieller Aufwand, Unbequemlichkeit usw.). Viele Funktionen sind dergestalt, daß der einzelne bei seinen Wahlhandlungen neben seinen Restriktionen und Präferenzen auch die tatsächlichen oder unterstellten bzw. erwarteten Wahlhandlungen und Präferenzen anderer in sein Kalkül ziehen muß (gefallen, imponieren, sich abgrenzen, sich anpassen wollen usw.). Die Wahlhandlungen kumulieren, ohne daß dies von einzelnen geplant oder auch nur reflektiert wird, zu einer „Kleiderordnung“ mit weitreichender Symbolfunktion. Einige der von den einzelnen Individuen verfolgten Handlungsmaximen erzeugen tendenziell mehr Homogenität, andere mehr Heterogenität und Dynamik. Sie verrechnen sich wie in einem Vektorraum zu einem Kleiderkode, der gekennzeichnet ist, je nach Gruppe, von Heterogenität bei mehr oder weniger großer Ähnlichkeit und mehr oder weniger starker Dynamik in relativ engen Grenzen. Graphisch läßt sich dieses Modell veranschaulichen wie in Abb. 17.5. Dies ist das allgemeine Modell des Wandels von Kodes, die weder natürlich noch künstlich sind, sondern Phänomene der dritten Art darstellen. (Ein adynamisches Kontrastprogramm hierzu, in dem der Kleiderkode eher als „tyrannisch“ (S. 256) oder „schicksalhaft“ (S. 276) dargestellt ist, liefert Barthes (1985; besonders das
17. Kodewandel
423
Abb. 17.5
im Anhang nachgetragene Kapitel „Geschichte und Diachronie der Mode“ (305⫺ 310).)
4.
Invisible-hand-Erklärungen
Dieses Modell steht in der Tradition des methodologischen Individualismus und der schottischen Moralphilosophie. „Methodologischen Individualismus“ nennt man die erkenntnistheoretische Position, welche besagt, daß kollektive Phänomene (wie Recht, Staat, Sprache, Sitte, Geschmack, Mode usw.) in einer Theorie mit explanativem Anspruch nicht als „gegeben“ hingenommen werden dürfen, sondern zurückzuführen sind auf Entscheidungen und Handlungen der sie erzeugenden Individuen. Ziel sind Erklärungen von unten; holistische bzw. kollektivistische Erklärungen werden als Scheinerklärungen angesehen (vgl. Hayek 1946; Vanberg 1982; Keller 1984; Albert 1990). Als philosophische Heimat des methodologischen Individualismus wird die schottische Moralphilosophie der zweiten Hälfte des 18. Jahrhunderts angesehen, deren prominentester Vertreter Adam Smith war. Nach ihm wird der Typ von Erklärungen, der die Genese und den Wandel spontaner sozialer Ordnungen (wie Sprache, Mode, Moral usw.) als das unreflektierte und ungeplante Resultat der Handlungen vieler einzelner zu erklären sucht, „invisible-hand-Erklärungen“ oder „Erklärungen mittels der unsichtbaren Hand“ genannt (Nozick 1975; Ullmann-Margalit 1978). Modell für diesen Erklärungsmodus war die Smithsche Überlegung, daß der Wohlstand des gesamten Volkes am stärksten gefördert wird, wenn der Staat zuläßt, daß jeder einzelne eigeninteressiert seinen Geschäften nachgehen kann. Denn so „verfolgt er lediglich seinen eigenen Gewinn und wird in diesem wie in vielen anderen Fällen von
einer unsichtbaren Hand geleitet, einen Zweck zu fördern, den er in keiner Weise beabsichtigt hatte“ (Smith 1776 ⫽ 1920, 235). Man streitet bis in die Gegenwart, ob Erklärungen sprachlichen Wandels kausaler oder finaler Natur sein müssen bzw. ob Sprachwandel als kulturgeschichtliches Phänomen überhaupt der Erklärung im strengen Sinne zugänglich ist. Letzteres wurde am scharfsinnigsten von Roger Lass (1980) bestritten. Die korrekte Antwort lautet: Erklärungen von Kodewandel im allgemeinen und Sprachwandel im besonderen können weder rein kausal noch rein final sein, wenn das Explanandum ein Phänomen der dritten Art ist. Naturphänomenen sind kausale Erklärungen angemessen; Artefakten sind finale Erklärungen angemessen; Phänomenen der dritten Art sind Erklärungen mittels der unsichtbaren Hand angemessen (Keller 1990, Kap. 4). Sind solche Erklärungen Erklärungen im strengen Sinne? Ja, denn sie erfüllen alle Forderungen, die gemeinhin an eine Erklärung gestellt werden: Sie enthalten eine Menge von Antezedensbedingungen (die Handlungs-Ökologie sowie die Handlungen der Individuen nach bestimmten Maximen), sie enthalten Gesetze oder allgemeine Prinzipien (die dem Prozeß der Kumulation, dem sogenannten „Invisible-hand-Prozeß“ zugrunde liegen), das Explanandum ist die notwendige Folge aus den Antezedensbedingungen und dem dem Invisible-hand-Prozeß zugrunde liegenden Gesetz oder Prinzip (Keller 1989). 4.1. Beispiel: Stau aus dem Nichts Betrachten wir zunächst ein einfaches nichtsprachliches Beispiel und dann ein komplexeres aus dem Bereich der natürlichen Sprache. Auf überlasteten Autobahnen entstehen bisweilen Staus, die Verkehrsforscher „Staus aus dem Nichts“ nennen. Solche Staus sind
424 Phänomene der dritten Art; sie sind von Menschen erzeugt, und zwar weder willentlich noch (im allgemeinen) wissentlich. Eine Invisible-hand-Erklärung eines (vereinfachten) Modells eines Staus aus dem Nichts könnte wie folgt aussehen: Auf einer (der Einfachheit halber) einspurigen Autobahn fahren Autos (sie bzw. die Fahrer seien a, b, c, …, x genannt) mit einer Geschwindigkeit von 100 km/h; der Abstand von Fahrzeug zu Fahrzeug betrage etwa 30 m. Nehmen wir an, irgendein Fahrer ⫺ nennen wir ihn samt seinem Auto a ⫺ tritt plötzlich auf die Bremse (die Gründe dafür sind irrelevant) und verringert seine Geschwindigkeit um 10 km/h auf 90 km/h. Der auf a folgende Fahrer b sieht a’s Bremslichter und sieht sich genötigt (unter anderem wegen des zu geringen Abstands), ebenfalls abzubremsen. Ideal wäre, wenn b seine Geschwindigkeit ebenfalls auf 90 km/h reduzieren würde, das wird er jedoch angesichts seines mangelnden Sicherheitsabstandes nicht tun. Er wird nach der Maxime handeln: „Lieber ein bißchen zu viel bremsen als zu wenig“, denn letzteres könnte teuer werden. Er wird seine Geschwindigkeit auf, sagen wir, 85 km/h reduzieren. Für c gilt das Analoge; er wird auf 80 km/h herunterbremsen. Wenn dieser Prozeß linear weitergeht, wird s die Geschwindigkeit auf 0 km/h reduzieren, und alle, die auf s folgen, werden ebenfalls zum Stillstand kommen. Fazit: a bis s haben den Stau aus dem Nichts erzeugt, und s bis x sind „in ihn hineingeraten“. Jeder der Miterzeuger hat nichts anderes getan, als angemessen und rational auf das Verhalten des Vordermanns unter den gegebenen Bedingungen zu reagieren. Die Erklärung folgt dem angegebenen Muster. Verkehrsverhältnisse, Abstände, Geschwindigkeit sowie das nach einer bestimmten Maxime erfolgende Bremsverhalten stellen die Antezedensbedingungen dar. Der Prozeß der kumulierenden Geschwindigkeitsabnahme ist der Invisible-hand-Prozeß. Das diesem Prozeß zugrunde liegende Gesetz ist die Subtraktionsregel (der gemäß gilt, daß 100 ⫺ 10 ⫺ 18 ⫻ 5 ⫽ 0). Das Explanandum, der Stau, ist die notwendige Folge aus dem Konjunkt von Antezedensbedingungen und Gesetz. 4.2. Beispiel: eine zyklische Drift in der Sprache Betrachten wir nun ein etwas komplexeres Beispiel aus dem Bereich der natürlichen Sprachen. Im Verlauf der Geschichte natürli-
II. Aspekte der Semiose
cher Sprachen sind mancherlei Entwicklungstrends, sogenannte „Drifts“ (Sapir 1921 ⫽ 1961) zu beobachten. Helmut Lüdtke (1980 a) ist es gelungen, für eine sehr prominente Drift eine plausible Erklärung zu finden. Sprachliche Ausdrücke tendieren dazu, sich mit der Zeit abzuschleifen (lat. hodie ⬎ afr. hui); schließlich werden sie zu Syntagmen aufgefüttert (au jour d’hui), und dann wird das Syntagma wieder als ein einziges Wort interpretiert (aujourd’hui), das sich nun mit der Zeit von neuem abschleift usw. ad infinitum. Warum ist das so? Lüdtkes Erklärung lautet wie folgt: Der Sprecher muß, damit seine Äußerung im intendierten Sinne vom Hörer wahrgenommen werden kann, diese mit hinreichend viel Schallstruktur (Signalnegentropie) ausstatten. Zu versuchen, das notwendige Minimum auf den Punkt zu treffen, wäre zu riskant. Denn sprachliches Kommunizieren ist eine strategische Unternehmung, und Strategie ist bekanntlich die Ökonomie der Kräfte. Wer eine kommunikative Handlung hervorbringt, der „erwartet, daß ihr Nutzen größer ist als der für sie notwendige Aufwand“ (Posner 1983, 311). Der Sprecher strebt, wie jeder Handelnde, einen positiven Nettonutzen an. Die strategische Aufgabe, vor der der Sprecher steht, ist sehr verschieden von der, der sich der Adressat gegenübersieht. Denn sprachliches Kommunizieren ist kein Vorgang, der dem Einpacken und Weiterreichen eines Dings (das Botschaft heißt und das der andere nur anzunehmen und auszupacken hat) vergleichbar ist. Was der Sprecher meint, die Botschaft seiner Äußerung, ist nicht in irgendeinem Sinne in der Bedeutung seiner Worte enthalten (so wenig, wie die Trauer in meiner schwarzen Krawatte oder der Sozialstatus in meinem Auto enthalten ist). Die Bedeutungen der Worte, die vom Sprecher verwendet werden, samt ihrer syntaktischen Verknüpfung sind für den Adressaten lediglich Schlüssel, die er, zusammen mit anderen Indikatoren, verwendet, um die Äußerung zu interpretieren, mit dem Ziel, ihre Botschaft, d. h. die Intentionen, die der Sprecher mit der Verwendung dieser Worte zu realisieren trachtet, zu verstehen. Es muß also das Ziel des Sprechers sein, dem Adressaten zu den ohnehin vorhandenen Interpretationsschlüsseln (der Situation, dem Kontext usw.) hinreichend viele in Form sprachlicher Äußerungen hinzuzugeben, damit dieser die Intentionen
425
17. Kodewandel
des Sprechers im gewünschten Ausmaß erkennen kann. Das exakt hinreichende Maß ist dabei schwierig zu treffen. Denn in die Kalkulation des hinreichenden Maßes müssen äußerst unsichere Faktoren, wie Hypothesen über das Wissen, die Aufmerksamkeit, die Situationswahrnehmung des Adressaten mit einfließen. Der Sprecher muß also mit einem gewissen Überschuß an verbalen Mitteln arbeiten; er versieht seine Äußerung mit einem gewissen Maß an Redundanz. Was ist das rechte Maß an Redundanz? Man könnte denken: je mehr, desto sicherer, und je sicherer, desto besser. Dem ist jedoch nicht so! Erinnern wir uns an das generelle Handlungsziel des positiven Nettonutzens. Die Bereitstellung von Redundanz stellt einen Kostenfaktor dar für den Sprecher. Aber auch für den Adressaten! Denn auch er macht eine Kosten-Nutzen-Rechnung auf. Als Nutzen kann er die empfangene Information, die Zuwendung, den Sozialkontakt und dergleichen verbuchen, seine Kosten sind die geopferte Zeit, d. h. die entgangenen Alternativhandlungen: Anstatt Dir zuzuhören, hätte ich fernsehen können! Redundanz beim Kommunizieren bringt also Kosten für beide Seiten. Während ich als Sprecher mit den eigenen Kosten von Fall zu Fall recht großzügig umgehen kann (ich kann den Nettonutzen längerfristig kalkulieren), sollte ich dem Adressaten möglichst geringe Kosten aufbürden. Denn wenn ich auf ihn als Adressaten Wert lege, ist es in meinem Interesse, daß sein Nettonutzen positiv bleibt. Das heißt, der Sprecher ist beim mündlichen Kommunizieren (beim schriftlichen ebenfalls, aber auf andere Weise) ständig damit beschäftigt, Redundanzkontrolle und Redundanzsteuerung zu betreiben. Die rein artikulatorischen Möglichkeiten sind jedoch nach oben begrenzt: Man kann mit [tax] grüßen oder mit [gunta:k]; oder man kann [gu:tn ta:k] sagen. Aber deutlicher als deutlich kann man nicht artikulieren. Wenn die lautliche Vollform etwa aufgrund ihrer Kürze oder des Geräuschpegels oder des feierlichen Anlasses (usw.) das Maß an Redundanz, mit dem der Sprecher seine Äußerung auszustatten wünscht, nicht zu tragen imstande ist, so bleiben ihm zur weiteren Anreicherung über das artikulatorisch Mögliche hinaus nur noch semantaktische Mittel („Ich wünsche Ihnen einen schönen guten Tag“). Während es ein artikulatorisches Maximum gibt, das man nicht überschreiten kann, jedoch kein artikulatorisches Mini-
mum, gibt es in den semantisch-syntaktischen Möglichkeiten ein Minimum (der Wohlgeformtheit), nicht jedoch ein Maximum. D. h. semantaktisch sind unsere Möglichkeiten nach unten begrenzt und nach oben offen, artikulatorisch sind sie nach oben begrenzt und nach unten offen. Damit ist die Richtung der möglichen Drift vorgezeichnet: Die Maxime, energiehaushaltend zu artikulieren, führt dazu, daß mit der Zeit artikulatorische Realisierungsweisen unterhalb der Vollform zur Normalform werden; d. h. Wörter schrumpfen. Das Bedürfnis des Sprechers, die korrekte Aufnahme seiner Äußerung durch Redundanz abzusichern, führt zu semantaktischer Auffütterung von Wörtern, die zu arm an Signalnegentropie geworden sind. Lüdtke nennt dies das „Prinzip der quantitativen Kompensation“. Die Prinzipien der lautlichen Schrumpfung und der quantitativen Kompensation sollten zusammengenommen dazu führen, daß statt lexikalischer Einheiten lauter nicht-kontinuierliche Sequenzen lautlicher Minimalformen entstehen. Faktisch ist dies nicht der Fall. Denn es ist ein Prinzip der Wahrnehmung, Einheiten größtmöglich zu konzipieren, d. h. zwei (oder mehr) nahezu stets kookkurrente Einheiten als eine Einheit aufzufassen. Lüdtke nennt dies das „Prinzip der Verschmelzung“. Auf diese Weise entsteht eine zyklische Drift (vgl. Abb. 17.6), ein endloser, gerichteter, irreversibler Kreislauf nach dem Muster hoc die ⬎ hodie ⬎ hui ⬎ au jour d’hui ⬎ aujourd’hui ⬎ …
Abb. 17.6
Diese Drift ist erklärt als Zyklus dreier Invisible-hand-Prozesse. Der makrostrukturelle Output des jeweils vorausgehenden Prozesses ist die entscheidende ökologische Bedingung für den jeweils nachfolgenden Invisible-handProzeß. Die Ergebnisse der einzelnen Pro-
426 zesse sind jeweils nicht-intendierte makrostrukturelle Konsequenzen individueller intentionaler Handlungen. 4.3. Die Erklärbarkeit kulturellen Wandels Es wurde behauptet, Erklärungen seien im Bereich des Kulturellen prinzipiell nicht möglich. Ist diese These falsch, oder ist die Lüdtkesche Erklärung eine Scheinerklärung? Roger Lass (1980) bringt folgende Argumente für diese These: ⫺ Deduktiv-nomologische Erklärungen kann es für Phänomene des Sprachwandels nicht geben, da es in diesem Bereich keine Gesetze gibt aufgrund der prinzipiellen Undeterminiertheit menschlichen Handelns. ⫺ Probabilistische Erklärungen sind Scheinerklärungen; sie haben ausschließlich post-hoc-Charakter. ⫺ Funktionale Erklärungen sind nicht möglich, da es in Bezug auf natürliche Sprachen keinen sinnvollen Begriff von Dysfunktion gibt und somit nicht definiert werden kann, worin „Funktion“ besteht. Betrachten wir die drei Argumente der Reihe nach: ⫺ Richtig ist, daß menschliches Handeln prinzipiell undeterminiert ist; falsch ist der daraus gezogene Schluß. Wenn Menschen (wie in Abb. 17.3) sich nach den genannten Maximen um einen Gaukler aufstellen, so folgt daraus nach den Gesetzen der Geometrie, daß eine Kreisstruktur entsteht. Ob sie sich so aufstellen, ist ungewiß, aufgrund der Undeterminiertheit menschlichen Handelns; daß eine Kreisstruktur entsteht, wenn sie sich so aufstellen, folgt mit Notwendigkeit. Das gleiche gilt mutatis mutandis für die Lüdtkesche Erklärung. Erklärungen fordern nicht die Vorhersagbarkeit der Antezedensbedingungen, sondern des Explanandums aus gegebenen Prämissen. ⫺ Probabilistische „Erklärungen“ sind in der Tat Scheinerklärungen. Daß 80% aller Kettenraucher an Lungenkrebs sterben, erklärt nicht den Lungenkrebstod eines einzelnen Kettenrauchers. Die 80%-Aussage ist keine Erklärungsinstanz, sondern eine statistische Generalisierung. Der Tod eines Kettenrauchers wird durch chemophysikalische Ereignisse in dessen Körper erklärt, nicht durch Statistik. Handelt es
II. Aspekte der Semiose
sich bei Lüdtkes Erklärung um eine Scheinerklärung dieses Typus? Wird der Wandel von hiu dagu ⬎ hiute ⬎ heute ⬎ heut (⬎ am heutigen Tage) durch Lüdtkes zyklische Drift erklärt? Nein! Dies anzunehmen hieße, den Fehlschluß der probabilistischen Scheinerklärung begehen. Die Lüdtkesche Erklärung erklärt den Trend; der Trend jedoch erklärt nicht den Einzelfall. Lüdtkes Theorie wird nicht falsifiziert durch den Nachweis eines Einzelfalls, der nicht dem Trend entspricht, sondern ⫺ vereinfacht gesagt ⫺ durch den Nachweis einer natürlichen Sprache, in der dieser Trend nicht besteht! ⫺ Funktionale Erklärungen im schlichten Sinne kann es für Kodes der dritten Art nicht geben, weil Wandel und Genese per definitionem außerhalb des Bereichs der Finalität der einzelnen Kodebenutzer sind. Invisible-hand-Erklärungen sind jedoch in einem abgeleiteten Sinne funktionale Erklärungen. Die Veränderung ist eine Funktion des Handelns und wird als solche erklärt. (Das ist teilweise ein Spiel mit der Mehrdeutigkeit des Ausdrucks Funktion.) Kodes der dritten Art sind nichtintendierte Folgen funktionalen Handelns. Jede Erklärung eines Wandelphänomens der dritten Art muß die Struktur einer Invisible-hand-Erklärung haben. Das Aufzeigen von Korrespondenzen in unterschiedlichen Zuständen eines Systems ist (ungeachtet sonstiger Verdienste) ohne explanative Kraft. 4.4. Wandel und Evolution Der Prozeß des Wandels von Kodes der dritten Art trägt evolutionäre Züge. Die Evolution eines solchen Kodes (zum Beispiel einer sogenannten „natürlichen“ Sprache) umfaßt Stase und Wandel gleichermaßen. Denn das eine ist nicht weniger erklärungsbedürftig als das andere. „It may be that the search for the causes of constancy in human affairs may prove as fruitful as has the comparable study of homeostasis in biology“, schreibt John Maynard Smith (1972, 42). Eine historische Entwicklung wird gemeinhin „Evolution“ genannt, wenn die folgenden Bedingungen erfüllt sind: (1) Der Entwicklungsprozeß darf nicht teleologisch sein; d. h. sein Verlauf darf nicht von einem Ziel her bestimmt sein. Dies schließt nicht aus, daß er gerichtet ist, wie das Beispiel der zyklischen Drift zeigt.
17. Kodewandel
(2) Der Prozeß muß kumulativ sein; d. h. er muß die makrostrukturelle Folge kumulierender mikrostruktureller Vorgänge sein. „By evolution we mean the cumulative process of small changes“, schreiben Gerard, Kluckhohn und Rapaport (1956, 14). (3) Die Dynamik des Prozesses muß aus einem Zusammenspiel von Variation und Selektion erwachsen. 4.5. Variation und Selektion Der letzte Punkt bedarf einer Erläuterung. Der Kodebenutzer trifft aus dem ihm zur Verfügung stehenden Repertoire an Zeichen, Regeln und Realisierungsformen die Auswahl, von der er sich den gewünschten Erfolg verspricht, wovon er hofft und erwartet, seine Intentionen realisieren zu können. Ein jeder Kode der dritten Art stellt im allgemeinen für eine gegebene Menge von Intentionen mehr als ein Mittel ihrer Verwirklichung bereit: Der Kaufmann kann seine Verpackung auf verschiedene Weise gestalten, er kann den Preis unterschiedlich festsetzen. Ich kann unter verschiedenen Kleidungsstücken wählen, unter mehr als einer Art, mein Wohnzimmer zu möblieren, unter mehr als einem Autotyp usw., um meine Kommunikations- und Signalisierungsziele zu verfolgen. Wenn die individuellen Wahlhandlungen, etwa aufgrund ähnlicher Handlungsmaximen, kumulieren, entsteht makrostrukturelle Ordnung und gegebenenfalls Bewegung in der Makrostruktur. Das Wirksam-Werden ähnlicher Handlungsmaximen bei der Genese und dem Wandel von Kodes wird zum einen dadurch begünstigt, daß es weitgehend universale Handlungsmaximen gibt (etwa gegebene Ziele mit möglichst geringen Kosten zu erreichen suchen). Zum anderen wird die Genese von Ordnung (statischer wie dynamischer) dadurch begünstigt, daß bei der Wahl der Mittel jeder einzelne die Wahlhandlungen der anderen (die tatsächlichen wie auch die unterstellten oder antizipierten) mit in sein strategisches Kalkül einbezieht. Etwa so: Ich möchte Dir mit meiner Kleidung gefallen. Also wähle ich die Kleidung, von der ich annehme, daß sie Dir gefällt. Woher weiß ich, was Dir gefällt? Unter anderem von der Art, wie Du Dich kleidest. Oder: Ich möchte von Dir verstanden werden. Also wähle ich die Wörter und Sätze, von denen ich annehme, daß Du sie verstehst. Woher weiß ich, was Du verstehst? Unter anderem von den Wörtern und Sätzen, die Du wählst. Wer hierzulande im-
427 ponieren will, sollte sich einen Mercedes kaufen; anderswo goldene Schneidezähne. Die Preisgestaltung des einen ist eine Funktion der Preisgestaltung des anderen usw. Das heißt, Variation und Selektion sind keine voneinander unabhängigen Prozesse, wie im Bereich der belebten Natur, sondern sie sind aufeinander bezogen. Der Kodebenutzer antizipiert die zu erwartende Selektion und versucht, den Ausgang durch günstige Wahl für sich zu entscheiden. Variation und Selektion sind, in Toulmins Worten (1972, 394), „gekoppelt“. Daraus folgt, daß es zwei Selektionsinstanzen gibt: eine Selektion, die von außen kommt, und eine, die der Kodebenutzer in Antizipation der ersteren selbst vornimmt. Diese Selektionsinstanzen betreffen unterschiedliche Selektionsebenen: die Selektion von außen betrifft die Person, die selbstvollzogene den Kode. Die erstere sei „soziale Selektion“ genannt, die zweite „Kodeselektion“, oder, wenn der Kode ein sprachlicher ist, „Sprachselektion“. Was das Verhältnis der beiden Selektionsinstanzen so kompliziert macht, ist die Tatsache, daß der Kodebenutzer, beispielsweise der Sprecher, seine Kodeselektion vornehmen muß auf der Basis äußerst ungewisser Diagnosen zurückliegender Fälle sozialer Selektion. Wer etwa ein Bewerbungsschreiben unangemessen formuliert, erhält keine Kritik seines sprachlichen Produkts, sondern er bekommt die Stelle nicht. Die Absage betrifft die Person, nicht die sprachlichen Mittel. Die Diagnose, die eventuell im nächsten Fall zu einer Modifikation der sprachlichen Mittel führt, muß der Betroffene selbst erstellen. Wir befinden uns als Kodebenutzer in einer ständigen Selektionsspirale: Kodeselektion ⫺ soziale Selektion ⫺ Diagnose ⫺ Kodeselektion ⫺ soziale Selektion ⫺ … usw. 4.6. Die Selektionsebene Neben der Frage der Selektionsinstanz (Wer selegiert?) spielt die Frage nach der Selektionsebene (Wer/was wird selegiert?) eine Rolle. Wie in der biologischen Evolutionstheorie wird auch in der Theorie der soziokulturellen Evolution die Frage diskutiert, ob es Gruppenselektion gibt. Hayek vertritt in verschiedenen Veröffentlichungen die These, daß bestimmte Regeln und Regelsysteme deshalb entstehen, „because the groups who practiced them were more successful“ (Hayek 1973, 18), „because the groups which acted on them prospered more than others“
428 (Hayek 1979, 161; vgl. auch Hayek 1967). Bis in seine letzten Veröffentlichungen vertritt er die Meinung, „cultural evolution operates chiefly through group selection“ (Hayek 1979, 202). Hayek hat diese These nie systematisch ausgeführt, geschweige denn begründet. Vanberg (1982) hat ihr heftigst widersprochen. Worin besteht das Problem? Bezogen auf das Problem des Kodewandels könnte Hayeks These wie folgt lauten: In Gruppen entstehen/emergieren und etablieren sich Kodes der dritten Art (nur von solchen ist hier die Rede), weil sie für die Gruppe vorteilhaft sind. So formuliert ist diese These in der Tat selbst-widersprüchlich, und zwar aus folgendem Grund: Phänomene der dritten Art und somit Kodes der dritten Art sind (im Gegensatz zu künstlichen Kodes) gerade dadurch definiert, daß sie nicht zielgerichtet entstehen und sich nicht auf einen Zweck hin wandeln; somit auch nicht entstehen, weil sie für die Gruppe vorteilhaft sind. Sie entstehen als unbeabsichtigte Folgen aus eigeninteressierten Handlungen einzelner. Wenn diese unbeabsichtigten Folgen sich im nachhinein als gruppennützlich erweisen sollten ⫺ um so besser; der einzelne jedoch hat nur sein eigennütziges Handlungsziel im Auge. Mit anderen Worten: Die Bedingung der Ateleologie schließt auch das Telos des Gruppenvorteils aus. Sollte Hayek dies alles verborgen geblieben sein? Das ist nicht anzunehmen. Vanberg (1982) stützt seine Kritik an Hayeks These vor allem auf das folgende (korrekte) Argument: (1) Menschen handeln normalerweise eigeninteressiert. (2) Entsteht durch eigeninteressiertes Handeln eine für die Gruppe vorteilhafte Makrostruktur, so ist dieser Fall für die Invisible-hand-Erklärung unproblematisch. (3) Problematisch hingegen ist die Annahme, daß Menschen ihre Handlungen in den Dienst des Gruppeninteresses stellen und nicht eigeninteressiert handeln. (4) Diese Annahme schafft das bekannte Free-rider-(Trittbrettfahrer-)Problem: Warum sollte der einzelne sich an den Kosten beteiligen, wenn er den Nutzen ohnehin bekommt? D. h. der Altruist hat stets einen geringeren Nettonutzen als der free rider. (5) Das heißt, daß es unter diesen Bedingungen rational wäre, die Free-rider-Strategie zu wählen.
II. Aspekte der Semiose
(6) Unter der Annahme, daß Menschen gemeinhin rational handeln, ist somit nicht zu erklären, wie Regelsysteme, die Gruppenvorteile bringen, entstehen können aus Handlungsweisen, die nicht auch für den einzelnen von Vorteil sind. Gibt es eine Vermittlung zwischen Hayeks These und Vanbergs korrekter Argumentation? Vanberg hat seinen Blick auf zwei von vier möglichen Fällen eingeengt und die andern beiden, von denen noch mindestens einer von Interesse ist, außer acht gelassen. Denn „nicht im Eigeninteresse handeln“ heißt nicht notwendig „im Gruppeninteresse handeln“, und „nicht im Gruppeninteresse handeln“ heißt nicht notwendig „im Eigeninteresse handeln“. Wir können die vier Kombinationen, die sich aus ⫾ Eigennutz und ⫾ Gruppenvorteil ergeben, in einer Matrix wiedergeben (vgl. Abb. 17.7):
Abb. 17.7
Vanberg betrachtet den Fall 1, den unproblematischen, und den Fall 3, den problematischen. Wenn wir annehmen, daß Fall 4 (die Lemming-Strategie) als in jeder Hinsicht irrational unberücksichtigt bleiben kann, so bleibt Fall 2 als zusätzliche Möglichkeit. Und wenn wir darüberhinaus annehmen, daß Fall 3 aus den von Vanberg genannten Gründen als Modell der Evolution sozialer Regeln nicht in Frage kommt, so bleiben die Fälle 1 und 2 als reale Möglichkeiten. Gruppen, deren Individuen (aus welchen Gründen auch immer) Verhaltensweisen vom Typ 1 pflegen, werden sich in Konkurrenz zu Gruppen vom Typ 2 als erfolgreicher erweisen. Der Witz der Theorie der unsichtbaren Hand besteht ja gerade darin, daß sie aufzeigt, daß und auf welche Weise Handlungen, die auf die unmittelbaren Ziele des einzelnen gerichtet sind, Strukturen und Institutionen
17. Kodewandel
hervorbringen können, die weit außerhalb der Reflexionsmöglichkeiten der sie erzeugenden Individuen liegen können. So ist es gar nicht verwunderlich, daß auf unreflektierte Weise vorteilhafte und nachteilige Makrostrukturen entstehen können, ohne daß den Gruppenmitgliedern der Zusammenhang zu ihrem mikrostrukturellen Handeln überhaupt in den Sinn zu kommen braucht. Welcher Hausfrau ist beispielsweise ihr Beitrag zur Inflation ihrer Währung klar? Welchem Sprecher sein Beitrag zur Veränderung seiner Muttersprache? Nicht nur Individuen stehen in vielfältiger Konkurrenz zu anderen Individuen ihrer Gruppe, sondern auch Gruppen untereinander. Deshalb ist trivialerweise zu erwarten, daß solche Gruppen anderen gegenüber in bestimmten Hinsichten unterlegen sind, deren Mitglieder Verhaltensweisen einzunehmen pflegen, die Makrostrukturen erzeugen, die sich in Konkurrenz zu anderen Gruppen als nachteilig erweisen. Selbst Gruppenbräuche können Handlungsweisen von Individuen positiv selegieren, die ihrerseits Strukturen erzeugen, die für die Gruppe selbst im Vergleich zu einer anderen konkurrierenden Gruppe von Nachteil sind. (Man denke etwa an nationalökonomische Auswirkungen religiöser Gebote, wie zum Beispiel des Armutsgebots.) So wird beispielsweise eine Gruppe, deren Sprecher durch ihre millionenfachen kommunikativen Akte über hunderte von Generationen eine Sprache wie das Deutsche erzeugt haben, in der den Substantiven nicht anzusehen ist, welcher von drei Genusklassen sie angehören und auf welche von etwa zehn möglichen Arten der Plural gebildet wird, in sprachpolitischer Hinsicht benachteiligt sein gegenüber konkurrierenden Gruppen, die lerner- und benutzerfreundlichere Sprachsysteme hervorgebracht haben. 4.7. Zusammenfassung Es gibt drei Typen von Kodes (wenn man von Mischtypen absieht) und drei damit korrespondierende Erklärungsmodi: ⫺ natürliche Kodes (Bienensprache …) ⫺ kausale Erklärungen ⫺ künstliche Kodes (Morsealphabet …) ⫺ finale Erklärungen ⫺ Kodes der dritten Art (Sprache …) ⫺ Invisible-hand-Erklärungen Während das Problem des Wandels bei den ersten beiden Typen keine besonderen theore-
429 tischen Probleme mit sich bringt, werden Kodes des dritten Typus bis auf den heutigen Tag noch vielfach in ihrem Wesen verkannt: Sie wurden und werden entweder den Naturphänomenen oder den Artefakten zugezählt; im ersten Fall mit dem Argument, sie seien nicht von Menschen willentlich gemacht, im zweiten Fall mit dem Argument, sie seien menschliche Erzeugnisse. Auch Chomsky schlug sich ohne Erfolg mit der Frage herum, ob Sprachen von Menschen „gemacht“ sind, und kommt zu der Einsicht: „Einer solchen Frage einen Sinn abzugewinnen, fällt schwer“ (Chomsky 1980 ⫽ 1981, 18 f). Was Phänomene der dritten Art für unsere Erkenntnis so sperrig macht, ist die Schwierigkeit zu begreifen, daß und wie höchst funktionale, intelligente und scheinbar durchdachte Institutionen und Strukturen entstehen können und immer wieder neu entstehen ohne einen auf ihre Entstehung bzw. Veränderung gerichteten (Gemein-)Willen. Ein solches Verständnis ist weder zu erreichen durch alleinige Untersuchung der Struktur der betreffenden Kodes und ihrer Funktionen, noch durch alleinige Betrachtung der Handlungsweise und Handlungsziele der Kodebenutzer. Einsicht in die Logik des Wandels und zugleich in das Wesen der betreffenden Kodes selbst schafft allein die Rekonstruktion des Zusammenhangs zwischen den vielfältigen Handlungen der einzelnen (in ihrem Handeln aufeinander bezogenen) Individuen und der durch diese Handlungen erzeugten Struktur, d. h. die Rekonstruktion des Weges der Genese: „Ihre wahre Definition kann […] nur eine genetische seyn“ (Humboldt 1836 ⫽ 1907, 46). Das „vielleicht merkwürdigste Problem der Socialwissenschaften“ ist nach Carl Menger: „Wieso vermögen dem Gemeinwohl dienende und für dessen Entwicklung höchst bedeutsame Institutionen ohne einen auf ihre Begründung gerichteten Gemeinwillen zu entstehen“, „welcher Natur […] sind nun alle die obigen Socialerscheinungen“, nämlich: „die Sprache, die Religion, das Recht, ja der Staat selbst […], die Erscheinungen der Märkte, der Concurrenz, des Geldes“, „und wie vermögen wir zu einem vollen Verständnisse ihres Wesens und ihrer Bewegung zu gelangen“ (Menger 1883 ⫽ 1969, 163 f)? Ein Gutteil dessen, was wir „Kultur“ nennen, besteht aus spontanen Ordnungen im allgemeinen und Kodes der dritten Art im besonderen. Aufgrund des solchen Phänomenen eigenen inhärenten Zusammenhangs von Wandel, Wesen und Genese (vgl. Keller 1990,
430
II. Aspekte der Semiose
Kap. 1.4) ist eine Theorie des Wandels stets Teil einer Theorie des Wesens und damit eine Theorie der raison d’eˆtre der betreffenden Ordnung (Ullmann-Margalit 1978). Mit anderen Worten, wer zum Verständnis einer Kultur gelangen will, muß sich um das Verständnis des Wandels ihrer Kodes bemühen.
5.
Prinzipien des Kodewandels
5.1. Prolegomena Wie schon oben dargelegt, sind Phänomene der dritten Art in der Semiotik zumindest insofern die interessantesten, als sie die meisten Probleme aufwerfen und am schwersten zu durchschauen sind; dabei steht Sprache an allererster Stelle, weil sie als Kode zwar der soziokulturellen Evolution unterliegt und durch nichtintendierte Nebeneffekte menschlicher Handlungen (s. oben Abb. 17.1 und 17.2) erzeugt wird, andererseits jedoch sowohl biologisch verankert (Lenneberg 1967, 371⫺395) als auch mit mannigfachen kulturellen Anreicherungen, nicht zuletzt durch Artefakte wie Schrift (Lüdtke 1985, 106⫺ 108), Trommel- und Pfeifkodes (Busnel und Classe 1976; Sebeok und Umiker-Sebeok 1976) versehen ist. Somit reicht der Phänomenbereich dessen, was sinnvoll unter „Sprache“ verstanden werden kann, vom nicht durch Menschen Beeinflußbaren („Natur“) über ⫺ als Kern ⫺ das ungeplant Erzeugte („dritte Art“) bis in das absichtlich Bewirkte hinein. Um das Ausmaß möglicher Mißverständnisse zu begrenzen, sei hier Sprache in engem biologischem Sinn als das dem Homo sapiens arteigene und innerhalb der Art universale natürliche phonoakustische Kommunikationsverfahren definiert. Mundarten sind also Sprache (und somit Kodes der dritten Art), Fortran und Cobol und LISP hingegen nicht (sondern willentlich geschaffene Kodes). Auch so wird es jedoch immer noch Schwierigkeiten der Abgrenzung geben, und zwar ⫺ ganz allgemein gesprochen ⫺ wegen der praktischen Verflechtung von Intention und Routine bei den Kommunikationshandlungen des Menschen. Es sei auch nicht verschwiegen, daß die nachstehenden Ausführungen mangels Vorarbeiten und mangels Konsens durchaus provisorischen Status haben.
5.2. Klassifikation 5.2.1. Kriterien Der komplexe Phänomenbereich Kodewandel läßt sich mit Hilfe von vier (in den nachfolgenden § 5.2.2.⫺5.2.5. zu erläuternden) Grundkriterien ordnen, und zwar: ⫺ genetisch, d. h. gemäß der Genese des/der betreffenden Kodes (also nicht im biologischen Sinn der Genetik); ⫺ „geometrisch“, hier in metaphorischer Verwendung des Wortes: gemäß den Verlaufsrichtungen von Kodewandel; ⫺ qualitativ, d. h. danach, ob systeminterne Veränderung oder Umkodierung oder Überformung erfolgt; ⫺ funktional, d. h. danach, ob die Effizienz des/der betreffenden Kodes verbessert oder beeinträchtigt wird bzw. ob der Kodewandel funktionsneutral (homöorhetisch) verläuft. 5.2.2. Genese und Wandel Auch im folgenden wird die in § 2. vorgenommene Zuweisung von Kodes (samt den Bedingungen der Möglichkeit ihres Wandels) gemäß nachstehendem Schema vorausgesetzt (vgl. Abb. 17.8):
Abb. 17.8
Neben den in § 2. dargelegten Gemeinsamkeiten der Kodes dritter Art sowohl mit den naturgegebenen (nämlich Evolution) als auch mit den künstlich hergestellten (Mensch als Verursacher) gibt es eine wichtige Übereinstimmung zwischen den meisten Artefakten und den natürlichen tierischen Kodes: die Geschlossenheit, d. h. Festlegung auf ein bestimmtes Repertoire möglicher Nachrichten bzw. Performanzakte. So ist genau definiert, was ein zulässiger Zug im Schachspiel ist und
17. Kodewandel
worüber eine Tänzelbewegung der Biene ihre Artgenossen informieren kann. In einer Sprache hingegen kann man alles sagen, was „der Fall ist“ (Wittgenstein) ⫺ und dafür gibt es keine Grenzen. Im Prinzip gilt das auch für Schrift, obwohl sie eindeutig ein Artefakt ist. Das Besondere an dieser Kodesorte ist ihr unmittelbarer Sprachbezug. Um dem angedeuteten Dilemma zu entgehen, müßte man der Sprache schon anstatt ihrer Unterordnung unter den Begriff Kode eine völlige Sonderstellung einräumen (worauf hier allerdings verzichtet werden soll). 5.2.3. Geometrische Metaphorik Wandel kann gerichtet (d. h. unumkehrbar) verlaufen, und zwar unilinear (vektoriell) oder spektral (in einem Bündel von Richtungen). Das gilt für die Grundprozesse des Sprachwandels, soweit sie quantitativer Natur sind (Lüdtke 1980 a, 14); es gilt aber auch z. B. für viele Phänomene biologischer Evolution (Monod 1970, 139), sei es hinsichtlich des Wandels von Arten, sei es hinsichtlich der Entfaltung und immer weiteren Differenzierung der Biomasse allgemein; und insofern gilt es auch für die Entstehung und den Wandel von Kodes in der Tierwelt (einschließlich der Hominiden) durch Mutation. Oszillatorischen Wandel finden wir in den Sprachen, wenn wir sie in Beziehung zu den universalen Rahmenbedingungen für Sprache setzen und sie unter dem Aspekt der jeweiligen, in Raum und Zeit variierenden Auswahlen betrachten, die eine hic et nunc gegebene Sprache konstituieren. So gibt es einen definierbaren Pool der artikulatorischen Möglichkeiten des Menschen (Catford 1970), von denen eine gegebene Sprache Li zu einem gegebenen Zeitpunkt ti jeweils nur einen Teil konventionell benutzt. Für jede einzelne dieser Möglichkeiten gilt, daß jede beliebige Sprache sie irgendwann wieder verlieren kann, wenn sie sie zum Zeitpunkt ti besitzt, und sie irgendwann bekommen kann, wenn sie sie zum Zeitpunkt ti nicht besitzt. So ist etwa für die Verbindung von Vorderzungenhebung und Lippenrundung (Vokal /ü/), für interdentale Reibung (wie engl. ‹th›) und für Nasalvokale bekannt, daß sie relativ oft entstanden und auch wieder aus dem Repertoire der betreffenden Sprachen verschwunden sind. Als starke Hypothese kann man formulieren: Es gibt keine spezifischen Dauereigenschaften bestimmter Sprachen; das Chinesische wird seine Töne verlieren und das Semitische die Dreikonsonantenstruktur seiner
431 Lexeme; in hinreichend langer Zeit wird jede Sprache jede sprachmögliche (aber nicht universale) Eigenschaft irgendwann erwerben und irgendwann auch wieder verlieren. Entsprechendes gilt für spezifische Verfahren in der Grammatik: Aller Repertoirewandel oszilliert zwischen jeweils zwei Zuständen. Die Beschaffenheit von Sprachen kann ⫺ teilweise und mit begrenztem Erfolg ⫺ auch intentional verändert werden (Lüdtke 1980 a, 8⫺9); Worttabu und Lancierung von Neologismen kommen häufig vor, sind allerdings für das Gesamtsystem einer Sprache marginal; stärkere Eingriffe hingegen sind selten. Solch geplanter Wandel erfolgt ungerichtet (streuend, chaotisch) und läßt sich weder vorhersagen noch in Regeln fassen. 5.2.4. Qualitätsveränderung Interner Kodewandel verläuft qualitätsneutral; der klassische Fall ist Sprachwandel (s. oben § 4.2.). Bei Artefakten muß unterschieden werden zwischen mehrerlei (willentlichen) Veränderungsweisen: ⫺ Umkodierungen reduktiver Art, wie z. B. Telegrammstil statt normaler Sprache oder Morsekode statt lateinischen Alphabets; im letzteren Fall verringert sich die Signalqualität, indem Abfolgen von ca. 30 verschiedenen Buchstaben und Interpunktionszeichen auf solche von nur vier verschiedenen Feldzuständen (kurzer Impuls, langer Impuls, kurze Pause, lange Pause) reduziert werden (vgl. Art. 16 § 1.); ⫺ Umkodierungen qualitätsneutraler Art, wie z. B. Transliteration aus irgendeiner anderen Schrift in lateinisches Alphabet (mit diakritischen Zeichen); ⫺ kulturelle Überformungen von Sprache, wie Standardisierung, Differenzierung von Registern u. a. (s. dazu § 5.4. und 5.5.), wodurch die Kommunikation höhere Qualität bekommt. 5.2.5. Funktional relevanter Wandel Es ist wohl trivial, daß Artefakte durch geeignete Umgestaltungen eine Steigerung ihrer Effizienz erfahren können; ein analoger Effekt kann im Tierreich durch Kodemutation entstehen. Weniger selbstverständlich, wenngleich begreiflich ist, daß künstlich geschaffene Kodes aus irgendwelchen (z. B. ästhetischen) Gründen Umgestaltungen erfahren, welche die Effizienz kaum tangieren. Schreibmoden, d. h. Veränderungen des Schriftduktus sind ein bekanntes Beispiel dafür.
432 Es gibt jedoch auch den ⫺ unseren normalen Handlungsmaximen eigentlich zuwiderlaufenden ⫺ Fall der Effizienzminderung bei willentlich geschaffenen Kodes. Ein noch wenig untersuchtes Beispiel ist die zwangsläufige Degeneration von Schriftsystemen, die nicht von Zeit zu Zeit reformiert werden. Der Grund dafür liegt in der Starrheit der Dreiecksbeziehung zwischen Schriftbild, Klanggestalt und Denotat bei ständig unerbittlich anfallender lautlicher Schrumpfung (Lüdtke 1980 a, 11⫺14; 1980 b, 187⫺195). Anders ausgedrückt: während das zur optischen Identifizierung eines gegebenen Bedeutungselements verwendete graphische Zeichen durch die Jahrhunderte hindurch konstant belassen werden kann, verringert sich die den beiden (d. h. Bedeutung und Graphie) zugeordnete lautliche Information (Signalnegentropie) mit der Zeit mehr und mehr. Beispiel: die lat. aquam tibi dabo vor 2000 Jahren entsprechende Lautung /akwa˜:tibidabo:/ wäre in Nordfrankreich heute bis auf /otdu/ lautgesetzlich geschrumpft, wenn man in der Zwischenzeit weder am graphischen Kode noch an der Sprache etwas geändert hätte. Die Chinesen haben tatsächlich über 2000 Jahre lang bis ins 20. Jahrhundert hinein auf Schriftsprachwandel verzichtet und sich dabei ein kommunikatives Kuriosum eingehandelt: es war schließlich unmöglich geworden, einen in der klassischen Schriftsprache des vorrevolutionären China abgefaßten Text einem Publikum vorzulesen, das ihn nicht gleichzeitig vor Augen hatte (Chao 1968, 120⫺121) ⫺ so sehr war die den einzelnen Ideogrammen zugeordnete lautliche Information geschrumpft, während gleichzeitig bei der Formulierung schriftlicher Texte an der Texttradition festgehalten wurde und keine Neuorientierung an der sich wandelnden gesprochenen Sprache erfolgte. Ganz ähnlich war es beim nachklassischen Latein. Auch hier schrumpften ⫺ mit regionalen Unterschieden, und zwar am meisten in Nordfrankreich ⫺ die den konstant belassenen Schriftbildern zugeordneten Klanggestalten so stark, daß eines Tages der bestehende Zustand (hinsichtlich der Zuordnungsverhältnisse zwischen Schriftbild und Lautung) als unerträglich empfunden und unter Karl dem Großen eine radikale Reform eingeleitet wurde (Lüdtke 1994, 13, 21 Anm. 26; Wright 1982, 104⫺107). Die in den beiden Fällen ⫺ China und Frankreich ⫺ eingeschlagenen Auswege waren ganz verschieden, ja sogar entgegengesetzt: während dort die Schrift-
II. Aspekte der Semiose
sprache an die Umgangssprache angepaßt wurde, was bei der Textproduktion eine Vergrößerung des Zeichenaufwandes beinhaltete, wurde hier, im Frank(en)reich Karls des Großen, umgekehrt unter Bewahrung der schriftsprachlichen Tradition für den Leseund Schreibunterricht eine neue, und zwar künstlich geschaffene Aussprache eingeführt, die keine unmittelbare Beziehung zur Volkssprache hatte; es entstand ein sprachkulturelles „Retortenbaby“, das Mittellatein (Wright 1982, 104, 208⫺211; Lüdtke 1994, Kap. 6), aus dem sich das moderne Schullatein aller Länder herleitet. Die beiden angeführten Fälle mögen auf den ersten Blick als kulturgeschichtliche Kuriosa erscheinen. Tatsächlich spiegeln sie eine allgemeine Gesetzlichkeit wider: angesichts der irreversiblen Dynamik des Lautwandels ist jeder einer bestimmten Sprache zugeordnete Schriftkode auf lange Sicht zur Dysfunktionalität verdammt, wenn er nicht von Zeit zu Zeit reformiert oder durch einen anderen ersetzt wird. 5.3. Umkodierung Gehen wir von der Koexistenz zweier verschiedener, d. h. wechselseitig nicht hinreichend verständlicher Sprachen Li und Lj aus, denen je ein Schriftkode Si und Sj zugeordnet ist, so ergeben sich für die Kommunikationspraxis nachstehende Möglichkeiten der Umkodierung eines vorliegenden gesprochenen bzw. geschriebenen Diskurses (Textes): Li Si Li Si Li Si
→ → → → → →
L j / Lj S j / Sj Si / Lj L i / Sj Sj / Lj L j / Sj
→ → → → → →
Li Si Sj Lj Si Li
Dolmetschen Übersetzen Protokollieren Vorlesen „Fremdprotokollieren“ „Fremdvorlesen“
Fremdprotokollieren kommt als Praxis gelegentlich vor bei Personen, die eine Fremdsprache gut verstehen, ohne sie auch flüssig schreiben zu können; dem Verfasser dieser Zeilen z. B. würde es nicht einfallen, russisch Gehörtes anders als auf deutsch (oder allenfalls in einer anderen lateinverschrifteten Sprache) mitzuschreiben. Was Fremdvorlesen betrifft, ist es in Portugal durchaus üblich, Passagen aus spanischen Büchern portugiesisch vorzulesen. Mehrstufige Umkodierung liegt vor, wenn ein normal gesprochener Text zunächst in Telegrammstil umgeformt, dann verschriftet, in Lateinschrift transliteriert und schließlich in Form von Morsezeichen an die erste Empfän-
433
17. Kodewandel
gerstufe übermittelt wird (vgl. die Ausführungen über Kommunikationsketten in Art. 14 § 1.3.2. und § 5.). Ob und inwieweit durch die Praxis des Umkodierens in den betroffenen Kodes Wandel ausgelöst werden kann, ist erst in geringem Maße erforscht. Offenkundig ist, daß die modernen europäischen Kultursprachen teils infolge langer gemeinsamer Überdachung durch Latein und Griechisch, teils aufgrund verbreiteter Zwei- und Mehrsprachigkeit unter den Eliten, nicht zuletzt aber auch durch eine Flut von Übersetzungen sich konvergent gewandelt haben, so daß heute die innereuropäischen Umkodierungen wesentlich glatter vonstatten gehen als die zwischen Sprachen verschiedener Kulturkreise. Wenn also ein polyglotter Europäer von sich sagt, eigentliche Fremdsprachen (wie z. B. Arabisch oder Chinesisch) könne er nicht (Enzensberger), ist das eine zwar zugespitzte, doch im Kern treffende Formulierung. 5.4. Die kulturelle Überformung von Sprache Der Mensch in der modernen Industriegesellschaft ist in seinen Verhaltensmustern wesentlich mitgeprägt durch Domestikation; das hat er mit Haustieren und Kulturpflanzen gemeinsam. Und auch sein sprachliches Verhalten ist davon nicht unberührt. Kultursprachen zeichnen sich gegenüber Mundarten und Sprachen von Naturvölkern außer durch zugeordnete Artefakte (Schriftkodes) vor allem durch zwei willentlich herbeigeführte Wandlungen aus: Standardisierung und (lexikalische) Bereicherung. Zugrunde liegt dabei als (notwendige, nicht hinreichende) Voraussetzung die Fähigkeit zur (infinit regressiven) Metasprache, die bereits im dritten Lebensjahr dazu führt, daß das Kind seinen Spracherwerbsprozeß aktiv mitgestaltet. Aus der Bewußtheit der (Erst-) Sprache und ihrer stattfindenden Erlernung erwächst sowohl die Möglichkeit gesteuerter Erlernung weiterer Sprachen als auch die eventuelle Bereitschaft, innerhalb des muttersprachlichen Systems ergänzende Kommunikationsansprüche anzumelden bzw. ⫺ falls sie von anderen Personen herangetragen werden ⫺ ihnen Genüge zu tun. Diese Disposition überträgt sich dann von der primären Sozialisation in der Familie auf das Sprachverhalten bei der sekundären Sozialisation in der Gesellschaft und eröffnet den Weg für die verschiedensten kulturellen Überformungen. Sie ist auch die Grundlage für sprachbezogene Sonderkodes.
5.5. Sprachbezogene Sonderkodes Hierzu gehört zunächst der schon kurz erwähnte Telegrammstil, der auf weitgehend ähnlichen Umsetzungsregeln wie beim foreigner talk und beim Pidgin beruht, nämlich: Vollständigkeit der Lexeme eines Satzes plus minimale Morphosyntax ⫺ mit dem Unterschied, daß für den Telegrammstil das gesamte Lexemrepertoire der normalen Sprache zur Verfügung steht, während beim foreigner talk und beim Pidgin aus Gründen der Lernökonomie die stark restriktive Auswahl einer Untermenge erforderlich ist. Ein weit verbreiteter Sonderkode ist die Versdichtung, deren Strukturen willentlich geschaffen sind und dementsprechend auch willentlich geändert bzw. vermehrt werden können. Außerdem unterliegen sie auch (ähnlich wie Schriftkodes, vgl. § 5.2.5.) Einflüssen des Lautwandels, der ein hic et nunc gültiges Verssystem beeinträchtigen, ja sogar ruinieren kann. Nur ganz selten führen lautliche Veränderungen zur Verbesserung und Aufwertung einer bestehenden Verspraxis; einem solchen Glücksfall verdankt der Endreim seinen Siegeszug durch die abendländische Dichtung des Mittelalters und der Neuzeit (Lüdtke 1991, Kap. 5). Ebenfalls weit verbreitet sind Geheimkodes, die mittels einfacher Umkodierungsregeln normalsprachliche Wörter für den Nichteingeweihten unkenntlich machen. Bekannt sind das Pig Latin im angelsächsischen und das Verlan im französischsprachigen Raum; sporadisch aber kommt es überall immer wieder vor, daß insbesondere Schüler eigene Umkodierungsregeln erfinden. Als literarisch notorischer Parallelfall sei Umberto Ecos Roman „Il pendolo di Foucault“ (1988) erwähnt, wo auf S. 27⫺28 mittels des Regelduos O → ULLA / A → AKKA Sätze wie „Akkabu fakka ullarakka unakka cullasakka“ (aus „Abu fa ora una cosa“) erzeugt werden (vgl. Art. 16 § 1.1. und Art 173).
6.
Literatur (in Auswahl)
Albert, Hans (1990), „Methodologischer Individualismus und historische Analyse“. In: K. Acham und W. Schulze (Hrsg.), Theorie der Geschichte. Band 6: Teil und Ganzes. München. Barthes, Roland (1985), Die Sprache der Mode. Frankfurt a. M. [Orig.: Syste`me de la mode (1967)]. Beckermann, Ansgar (1977), Gründe und Ursachen. Kronberg.
434 Busnel, Rene´ G. und Andre´ Classe (1976), Whistled Languages (Communication and Cybernetics, Vol. 13). Berlin, Heidelberg und New York. Catford, John C. (1970), „The Articulatory Possibilities of Man“. In: Bertil Malmberg (Hrsg.), Manual of Phonetics. Amsterdam und London: 309⫺333. Chao, Yuen Ren (1968), Language and Symbolic Systems. Cambridge, England. Chomsky, Noam (1980), Rules and Representations. New York. [Dt.: Regeln und Repräsentationen. Frankfurt a. M. (1981)]. Coseriu, Eugenio (1958), Sincronı´a, diacronı´a, e historia. El problema del cambio lingüistico. Montevideo [Dt.: Synchronie, Diachronie und Geschichte. Das Problem des Sprachwandels. München (1974)]. Coseriu, Eugenio (1980), „Vom Primat der Geschichte“, Sprachwissenschaft 5: 125⫺145. Dawkins, Richard (1987), Der blinde Uhrmacher. Ein neues Plädoyer für den Darwinismus. München [Orig.: The Blind Watchmaker. Oxford (1986)]. Denison, Norman (1977), „Language Death or Language Suicide?“, International Journal of the Sociology of Language 12: 13⫺22. Eco, Umberto (1988), Il pendolo di Foucault. Mailand. Enninger, Werner (1983), „Kodewandel in der Kleidung: Sechsundzwanzig Hypothesenpaare“, Zeitschrift für Semiotik 5: 23⫺48. Eyer, Peter (1983), „… und trampelt durch die Saaten“, Zeitschrift für Germanistische Linguistik 11: 72⫺77. Ferguson, Adam (1767), An Essay on the History of Civil Society. Edinburgh [Dt.: Abhandlung über die Geschichte der bürgerlichen Gesellschaft. Aus dem engl. Orig., und zwar der Ausgabe letzter Hand (7. Aufl. 1814) ins Deutsche übertragen von Valentine Dorn (Sammlung sozialwissenschaftlicher Meister, 2. Bändchen). Jena (1904)]. Gerard, Ralph W., Clyde Kluckhohn und Anatol Rapaport (1956), „Biological and Cultural Evolution. Some Analogies and ‘Explorations’“, Behavioral Science 1: 6⫺34. Haakonssen, Knud (1981), The Science of a Legislator. The Jurisprudence of David Hume and Adam Smith. Cambridge MA. Hayek, Friedrich August von (1946), „Individualism: True and False“. Dublin und Oxford [Dt.: „Wahrer und falscher Individualismus“. In: F. A. v. Hayek, Individualismus und wirtschaftliche Ordnung. Salzburg: 9⫺48 (1976)]. Hayek, Friedrich August von (1967), Studies in Philosophy, Politics and Economics. Chicago. Hayek, Friedrich August von (1969 a), „Ergebnisse menschlichen Handelns, aber nicht menschlichen Entwurfs“. In: F. A. v. Hayek, Freiburger Studien. Gesammelte Aufsätze. Tübingen: 97⫺107.
II. Aspekte der Semiose Hayek, Friedrich August von (1969 b), „Bemerkungen über die Entwicklung von Systemen und Verhaltensregeln“. In: F. A. v. Hayek, Freiburger Studien. Gesammelte Aufsätze. Tübingen: 145⫺160. Hayek, Friedrich August von (1973), Law, Legislator and Liberty. Vol. 1: Rules and Order. London. Hayek, Friedrich August von (1979), Law, Legislator and Liberty. Vol. 3: The Political Order of Free People. London. Humboldt, Wilhelm von (1907), „Über die Verschiedenheit des menschlichen Sprachbaues und ihren Einfluß auf die geistige Entwicklung des Menschengeschlechts“. In: W. v. Humboldt, Gesammelte Schriften. Bd. VII. Berlin [Erstausgabe 1836]. Huxley, Julian (1963), Evolution. The Modern Synthesis. 2. Aufl. London. Keller, Rudi (1984), „Bemerkungen zur Theorie des sprachlichen Wandels“, Zeitschrift für Germanistische Linguistik 12: 63⫺81. Keller, Rudi (1988), „Zu einem evolutionären Sprachbegriff“. In: Harald Thun (Hrsg.), Energeia und Ergon. Sprachliche Variation ⫺ Sprachgeschichte ⫺ Sprachtypologie. Band II: Das sprachtheoretische Denken Eugenio Coserius in der Diskussion (1). Tübingen: 143⫺158. Keller, Rudi (1989), „Erklärung und Prognose von Sprachwandel“, Zeitschrift für Phonetik, Sprachwissenschaft und Kommunikationsforschung 42: 383⫺396. Keller, Rudi (1990), Sprachwandel. Von der unsichtbaren Hand in der Sprache. Tübingen. 2. Aufl. 1994. Keller, Rudi (1992), „Zeichenbedeutung und Bedeutungswandel“, Zeitschrift für Semiotik 14: 327⫺366. Klaus, Georg (1969), Wörterbuch der Kybernetik. 2 Bde. Frankfurt a. M. und Hamburg. Lass, Roger (1980), On Explaining Language Change. Cambridge, England. Lenneberg, Eric H. (1967), Biological Foundations of Language. New York, London, and Sydney. Lewis, David (1969), Convention. A Philosophical Study. Cambridge MA [Dt.: Konventionen. Eine sprachphilosophische Abhandlung. Berlin und New York (1975)]. Lüdtke, Helmut (1980 a), „Sprachwandel als universales Phänomen“. In: H. Lüdtke (Hrsg.), Kommunikationstheoretische Grundlagen des Sprachwandels. Berlin und New York: 1⫺19. Lüdtke, Helmut (Hrsg.) (1980 b), Kommunikationstheoretische Grundlagen des Sprachwandels. Berlin und New York. Lüdtke, Helmut (1985), „Umstrittene Linguistik: Sieben Thesen“. In: Thomas T. Ballmer und Roland Posner (Hrsg.), Nach-Chomskysche Linguistik. Berlin und New York: 102⫺111. Lüdtke, Helmut (1991), „Kontinuität und Innovation: Zur Entstehung des Reimes in der abendlän-
17. Kodewandel dischen Dichtung“. In: Hildegard L. C. Tristram (Hrsg.), Metrik und Medienwechsel ⫺ Metrics and Media. Tübingen: 81⫺93. Lüdtke, Helmut (1994), „Theoretische und historische Bemerkungen zum Verhältnis von Mündlichkeit und Schriftlichkeit in der mittelalterlichen Romania“. In: Otmar Werner (Hrsg.), Probleme der Graphie. Tübingen. Lyons, John (1980), Semantik. Bd. I. München [Orig.: Semantics. Cambridge, England (1977)]. Maynard Smith, John (1972), On Evolution. Edinburgh. Menger, Carl (1969), Gesammelte Werke, hrsg. von Friedrich August von Hayek. Bd. II: Untersuchungen über die Methode der Socialwissenschaften und der politischen Ökonomie insbesondere. Tübingen [Orig. 1883]. Monod, Jacques (1970), „Le hasard et la ne´cessite´. Essai sur la philosophie naturelle de la biologie moderne“. Paris [Dt.: Zufall und Notwendigkeit: philosophische Fragen der modernen Biologie. München (1971)]. Müller, Max (1892), Die Wissenschaft der Sprache. Bd. 1 [Vom Verfasser autorisierte deutsche Ausgabe besorgt durch R. Fick und W. Wischmann]. 15. Aufl. Leipzig [Orig. 1862]. Nickl, Hans (1980), „10 Minuten vor dem Centre Pompidou“, Bauwelt 40⫺41: 1789⫺92. Nozick, Robert (1975), Anarchie, Staat, Utopia. München [Orig.: Anarchy, State, and Utopia. New York (1974)]. Philosophisches Wörterbuch, hrsg. von Georg Klaus und Manfred Buhr. 2 Bde. 11. Aufl. Leipzig 1975. Posner, Roland (1983), „Sprache ⫺ Schriftsprache ⫺ Plansprache“, Zeitschrift für Semiotik 5: 311⫺ 329. Sakaguchi, Alicja (1983), „Plansprachen zwischen Spontaneität und Standardisierung. Semiotik und
435 Interlinguistik“, Zeitschrift für Semiotik 5: 331⫺ 351. Sapir, Edward (1961), Die Sprache. Eine Einführung in das Wesen der Sprache. München [Orig.: Language. An Introduction to the Study of Speech. New York (1921)]. Saussure, Ferdinand de (1967), Grundfragen der allgemeinen Sprachwissenschaft. 2. Aufl. Berlin [Orig.: Cours de linguistique ge´ne´rale. Lausanne und Paris (1916)]. Schleicher, August (1863), Die Darwinsche Theorie und die Sprachwissenschaft. Weimar. Sebeok, Thomas A. und Donna Jean Umiker-Sebeok (Hrsg.) (1976), Speech Surrogates: Drum and Whistle Systems. 2 Bde. Den Haag und Paris. Smith, Adam (1920), Eine Untersuchung über Natur und Wesen des Volkswohlstandes, Bd. 2. In: H. Waentig (Hrsg.), Sammlung sozialwissenschaftlicher Meister. Bd. 12. Jena [Orig.: Inquiry into the Nature and Causes of the Wealth of Nations (1776). Reprint London (1812)]. Toulmin, Stephen (1972), Human Understanding. Vol. 1: The Collective Use and Evolution of Concepts. Princeton NJ [Dt.: Kritik der kollektiven Vernunft. Frankfurt a. M. (1978)]. Ullmann-Margalit, Edna (1978), „Invisible-Hand Explanations“, Synthese 39: 263⫺291. Vanberg, Viktor (1982), Markt und Organisation: Individualistische Sozialtheorie und das Problem des kooperativen Handelns. Tübingen. Whitney, William D. (1875), The Life and Growth of Language. London [Deutsch von A. Leskien: Leben und Wachsthum der Sprache. Leipzig (1876)]. Wright, Roger (1982), Late Latin and Early Romance in Spain and Carolingian France. Liverpool.
Rudi Keller (Kap. 1⫺4), Düsseldorf, und Helmut Lüdtke (Kap. 5), Kiel (Deutschland)
III. Gegenstand II: Arten der Semiose General Topics II: Types of Semiosis 18. The evolution of semiosis 1. What is semiosis? 2. The cosmos before semiosis 3. The origin of life and the origin of semiosis on Earth 3.1. “The language of life” 3.2. On endosemiosic systems and behavior 4. Semiosis in the superkingdoms 4.1. The microcosmos 4.2. Overview of the plant/animal/fungus trichotomy 5. Hominid forms 6. Biocommunication, and some implications 7. Selected references
1.
What is semiosis?
In Peirce’s usage (1960, Vol. 5, § 473), semiosis, or “action of a sign”, is an irreducibly triadic process, comprising a relation between (1) a sign, (2) its object, and (3) its actual or potential interpretant (cf. Art. 1 § 2.). It particularly focuses upon the way that the interpretant is produced, and thus concerns what is involved in understanding or teleonomic (i. e., goal-directed) interpretation of a sign. Similarly, Morris (1946, 253) defined semiosis as “a sign-process, that is, a process in which something is a sign to some organism”. These definitions imply, effectively and ineluctably, that at least one link in the loop must be a living entity (although, as we shall see, this may be only a portion of an organism, or an artefactual extension fabricated by a hominid). It follows, then, that there could not have been semiosis prior to the evolution of life. For this reason, one must, for example, assume that the report, in the King James version of the Bible (Genesis I.3), quoting God as having said “Let there be light”, must be a misrepresentation; what God probably said was “Let there be photons”, because the sensation of perception of electromagnetic radiation in the form of optical signals (Hailman 1977, 56⫺58), i. e., luminance, requires a living interpreter, and the
animation of matter did not come to pass much earlier than about 3,900 million years ago (on types of semiosis, see further Art. 4 § 1. and Art. 5).
2.
The cosmos before semiosis
The regnant paradigm of modern cosmology is the Big Bang theory of the origin and evolution of the Universe (e. g., Silk 1980; Barrow and Silk 1983). The genesis of the cosmos, in a singularity (i. e., the point at which something peculiar happens to a physical process represented by an equation when one or more variables have certain values), is thought to have occurred about 15 billion years ago. Prior to Planck time 10⫺43, we know nothing. What ensued afterwards is a bit clearer: from the time that the Universe was three minutes old until about a million years after its apparent beginning, it was dominated by the influence of photons (heat and light). The elementary particles multiplied, matter became ordered, and the Universe organized itself into ever more complex systems. The quasisemiotic phenomena of nonbiological atomic interactions and, later, those of inorganic molecules, were consigned by the late oncologist Prodi (1977) to “protosemiotics”, but this must surely be read as a metaphorical expression. Prodi’s term is to be distinguished from the notion “primitive communication”, which refers to the transfer of information-carrying endoparticles, such as exists in neuron assemblies, where it is managed in modern cells by protein particles (see, e. g., Fox 1988, 91). The age of the Earth is about 4.5 billion years, while the solar system is deemed to be a little older (4.6 billion). It becomes useful to briefly allude, at this point, to the conjoined ideas of information and entropy, which is a measure of disorder (Brooks and Wiley 1986; Wicken 1987, 17⫺28; Wright 1988, 87⫺91). These are mutually implicative technical terms
18. The evolution of semiosis which arguably belong on the margins of semiotics. Cosmic expansion is accompanied by a departure from a state of maximum entropy, and information (as a measure of the nonuniform, orderly properties of physical systems) evolved out of that initial state of utter chaos. Eventually, “information” came to be viewed as a measure of the number of alternative messages (Shannon 1948), and then the biophysicist Gatlin (1972) came to apply Shannon’s elegant, highly abstract and therefore powerful theorems to a theory of living organisms. She showed that, since information in the living system is transmitted from DNA to protein along a channel of biochemical processes in the cell, it can be subjected to Shannon’s equations. ⫺ On the other hand, Yates and Kugler (1984), eschewing terms like “information” and “communication”, because in them lies embedded the elusive property of “intentionality”, recently proposed a quite different and very promising scenario for the transition from a physical (kinetic) system to a semiosic (kinematic) system, that is, one incorporating significance. ⫺ “Meaning”, which is indeed a pivotal term in semiotics, played a crucial part in Niels Bohr’s model of a participatory universe, and significance has moved to center stage in the work of such contemporary theoretical physicists as Wheeler (e. g., 1984; 1986). Wheeler’s subtle “meaning model” of nature posits a circuit whereby particles owe their definition and existence to fields, fields owe theirs to phases, phases to distinguishability and complementarity, “and these features of nature going back for their origin to the demand for meaning […]”. Hence his dictum: “The past is theory.” In this model, meaning before the advent of life must, of course, be founded on construction: “Only by [life’s] agency is it even possible to construct the universe of existence or what we call reality” (1986). In sum, in Wheeler’s grand conception, physics is the offspring of semiosis, “even as meaning is the child of physics” (1984, 123).
3.
The origin of life and the origin of semiosis on Earth
The question of whether there is life/semiosis elsewhere in our galaxy, let alone in deep space, is wide open; since there is not a single example, one can but hold exobiology and extraterrestrial semiotics to be twin sciences that so far remain without a subject matter. ⫺ On the other hand, research into the origin and evolution of our terrestrial biosphere has made encouraging progress (cf. Art. 138), although, of course, untold unresolved problems require multidisciplinary analysis in the future (Schopf 1983). The earliest traces of life to be found so far date from the so-called Archean Aeon, from 3,900 to 2,500 million
437 years ago (cf. Art. 20 § 6.2.). The story of the quest for the origins of life is detailed in Margulis and Sagan (1986 a, ch. 2), and the molecular biological revolution is then deftly spelled out by them in the next chapter, tellingly titled “The Language of Nature” (1986a, 59⫺67). Cairns-Smith has recently shown, especially in his chapter titled “Messages, messages” (1985, ch. 2), that semiosis is at the heart of life, since messages provide “the only connection between life now and life a million or a billion years ago […]” (1985, 28). Messages are obviously much the most important inheritance, since only they can persist over the vast reaches of time. All living systems are composed of carbon, nitrogen, and hydrogen compounds in water; are bounded by lipid membrane; they are autopoietic systems, i. e., they self-maintain their organization and function by a ceaseless exchange of matter, energy, and messages, or, as Maturana (1980, 53) put it, “through their interactions recursively generate the network of productions that produced them, and […] realize this network as a unity by constituting and specifying its boundaries in the space in which they exist […]”. 3.1. “The language of life” The phrase in this subheading was the title of a book by Nobel Laureate George Beadle and Muriel Beadle (1966; the same tag was also used by Berlinski 1986). Much fruitless debate ensued in the following years about whether the genetic code (cf. Art. 16) is (like) a language or not. Thus Jakobson (1970, 437) asserted that the Beadles’ title was “not a mere figurative expression”, and then went on to stress the close similarities in the structure of these “two informational systems” (1970, 438), i. e., the genetic and the linguistic. By contrast, Lees (1980) for example argued that, although there is a very abstract and deep connection between the two, the similarities usually noted are superficial; “I advocate”, said Lees (1980, 226), “that linguistic competence be viewed analogously to the genetic code as a mechanism invented by minds to serve as a scratch pad […]”. There were also somewhat parallel discussions of this issue among some molecular biologists of that time. The question of an analogy between the two codes, the endosemiosic (molecular) and the anthroposemiosic (including a verbal component) seems, however, a secondary one. What matters is that both are productive semiosic systems. This is made
438 possible by the principle of double articulation, referred to by the Schoolmen, in linguistic contexts, as articulatio prima et secunda. In language, this concept refers (roughly) to the dichotomy between merely distinctive, or phonemic, units, and significative, or grammatical, units (such as morphemes or words; cf. Art. 2 § 3.). Duality can of course be expressed in radically different substances: say, polymeric molecules (the four nucleotides, which can generate the proteins which manufacture everything else alive) in the one; and sound waves in the other. (Double articulation, however, by no means presupposes animation of matter; on the contrary, its fundamental realization is embodied in Mendeleev’s periodic table of elements with related electronic configurations; cf. Art. 135). 3.2. On endosemiosic systems and behavior The substantive “endosemiotics” was coined by Sebeok (1976, 3; see also Sebeok 1989 a, ch. 1, part iii). As a consequence of Jakob von Uexküll’s consistent and elaborate doctrine of signs (Jerison 1986, 143⫺144; Sebeok 1988 b, ch. 10; see also Art. 19 and 108 in this Handbook), nothing exists for any organism outside its bubble-like private Umwelt (environment) into which, although impalpably to any outside observer, it remains, as it were, inextricably sealed. The behavior of an organism ⫺ behavior being definable as the commerce by means of signs among different Umwelten ⫺ has as its basic function the production of nonverbal signs for communication, and first of all for communication of that organism with itself. It follows that the primal universal sign-relation in the ontogeny of an organism is realized as an opposition between the self (ego) and the other (alter; cf. Sebeok 1989 b). This elementary binary split subsequently brings to pass the second semiosic dimension, that of inside vs. outside. It is this secondary opposition that enables an organism to “behave”, i. e., to enter into relations to link up with other living systems in its surrounding ecosystem. 3.2.1. Variety in endosemiosis Thure von Uexküll then wrote (1986, 204): “The overwhelming majority of objective evidence of a disease belongs to those types of processes taking place within the body, which, in turn, are subdivided into subsytems (organ systems, organs, tissue, cells, cellular organelles) […]. The participants in the exchange of signs that takes place on the bio-
III. Arten der Semiose
logical level are thus given”, and this fact is described by the adjective endosemiotic. He continues: “The sign processes use chemical, thermal, mechanical and electrical processes as sign carriers. They make up an incredible number. If one reflects upon the fact that the human body consists of 25 trillion cells, which is more than 2000 times the number of people living on earth, and that these cells have direct or indirect contact with each other through sign processes, one gets an impression of the amount. Only a fraction are known to us. Yet this fraction alone is hardly comprehensible […]. The messages that are transmitted include information about the meaning of processes in one system of the body (cells, tissues, organs, or organ systems) for other systems as well as for the integrative regulation systems (especially the brain) and the control systems (such as the immune system).” 3.2.2. The immune system Semiosis being at the pivot of the immune system, terms like “semioimmunology” and “immunosemiotics” are finding increasing application. Considering that the human immune system consists of about 1012 cells, dissipated over the entire body, the problem immediately arises how these cells form an orderly, finely regulated functional network operating via signs consisting of chemical substances. Moreover, the immune system (units of which, the lymphocytes, although they circulate among most other cells of the body, seem to be excluded from the brain) and the nervous system are known to mutually influence one another by means of signs. Niels Jerne, in his 1984 Nobel address (1985), not only proposed a far-reaching model of the vertebrate immune system as exhibiting the properties of any semiosic system, but described it as one that functions as an “openended” generative grammar: “The immense repertoire of the immune system […] becomes a vocabulary comprised not of words but of sentences that is capable of responding to any sentence expressed by the multitude of antigens which the immune system may encounter” (1985, 1058). The context for this approach was provided by Jerne’s idiotype network theory 20 years ago, suggested by a remarkable feature of the immune system: namely, that its receptors and specific secreted products, or antibodies, not only recognize the exosemiotic world of antigenic determinants (epitopes), but also recognize
18. The evolution of semiosis
antigenic determinants on the immune receptors themselves (the endosemiotic idiotopes). Jerne’s theory postulated that within the reflective symmetry of idiotopes, and so forth, formed within the organism’s immune system would be found representations, or indexical icons, of most of the epitomes of the external universe. Internal imaging, a fascinating type of biochemical mimicry performed by the immune system, is now of paramount interest to semiotics (cf. Art. 21). 3.2.3. Metabolic code This was an expression coined by Gordon M. Tomkins (1975) in the course of his discussion of biological symbolism and the origin of intracellular communication. Tomkins distinguished between simple and complex modes of regulation, both present in modern organisms. By the former, he meant a direct chemical relationship between regulatory molecules and their effects (equivalent to Peirce’s secondness). Complex regulation, on the other hand, involves metabolic symbols and their domains (or Peirce’s thirdness). By a symbol, Tomkins meant a specific intracellular effector molecule, cyclic AMP, which accumulates when a cell is exposed to a particular environment (or context). This symbol stands for a shortage of carbon; and the live organism, “upon processing the symbol, behaves so as to reconcile its well-being with that environmental condition (by heading elsewhere)” (Wright 1988, 104). The term is appropriate because “Metabolic symbols need bear no structural relationship to the molecules which promote their accumulation […]”; and, since a particular environmental condition is correlated with a corresponding intracellular symbol, “the relationship between the extra- and intracellular events may be considered as a ‘metabolic code’ in which a specific symbol represents a unique state of the environment” (Tomkins 1975, 761). Tomkins also pointed out that in most multicellular organisms (i. e., the eukaryotes), only certain cells are stimulated directly by the environment; but, in higher organisms, these in turn secrete specific effector molecules (the hormones), which signal other cells, presumably sequestered from the milieu exterieur, to respond metabolically, via a high number of intermediate steps, to the initial sign (cf. Art. 20). “Specifically, the metabolic state of the sensor cell, represented by the levels of its intracellular symbol, is ‘encoded’ by the synthesis and secretion of corresponding
439 levels of hormones. When the hormones reach responder cells, the metabolic message is ‘decoded’ into corresponding primary intracellular symbols” (1975, 762). It should finally be emphasized that, in many organisms, the endocrine and the nervous systems are intimately connected; thus hormone release is often a function of neural stimulation (e. g., Jankovic´, Markovic´, and Spector 1987, passim). 3.2.4. Neural code As Prosser (1985, 118) rightly observes, “Communication is what neurobiology is about. The modes of communication include membrane conductances, patterns of neuronal spikes and graded potentials, electric coupling between cells, electrical and chemical transmission at synapses, secretion, and modification of neural function.” Moreover, over the past three decades, neurobiology has moved increasingly into the orbit of semiotics, in the guise of a distinct discipline, named “neurocommunications”, regarded by its practitioners, who draw on many basic sciences, as a metascience (see Whitfield 1984, 4). In brief, this new field is apt to represent the (human) mind (the “software” level) and its underlying mechanism, the brain (the “hardware” level of the biological organ which allows cognition), as a pair of semiosic engines, or computational devices for processing verbal-and-nonverbal signs. However, there remains sharp disagreement about the representation of language and nonverbal systems, ranging from Chomsky’s theory, that we are born with genetically determined “mental organs”, requiring the rules being in some sense innate for generalization to be possible from impoverished samples, a view which received considerable support from the work of David Hubel and Torsten Wiesel, who discovered just such innate connections in the visual system, as well as from the distinguished researches of Colwyn Trevarthen on the prenatal growth of brain parts in infants, to Gerald Edelman and his colleagues’ researches on cell adhesion molecules (CAMs); this view accepts that the general patterns of neural connections are shaped by gene action, but suggests that the exact connections of individual cells are not genetically determined. At any rate, the critical questions ⫺ how are rules programmed genetically and how they are carried out by the intricate circuitry of the brain (let alone represented in the mind) ⫺ remain unan-
440
III. Arten der Semiose
swered at this time (cf. Art. 24 and Art. 139). Cook uses the phrase “brain code” to describe the set of fundamental rules concerning how signs are stored and transmitted from site to site within the brain, to distinguish this from “neuron code”, which is reserved for the manner in which the mechanisms by which large groups of neurons transmit “images, thoughts and feelings which we suspect are the fundamental units of our psychological lives” (1986, xiii, 2⫺4). Although the decipherment of the brain code remains the ultimate goal of most research in the neurosciences and psychology, in practice this often proceeds by clarification of aspects of the neural code (cf. Art. 141).
4.
Semiosis in the superkingdoms
According to one standard scheme for the broad classification of organisms (after R. H. Whittaker, discussed in Sebeok 1987; cf. Margulis and Schwartz 1988), five superkingdoms are now distinguished: protists (including microbes composed of nucleated cells); bacteria; plants; animals; and fungi. In each group, distinct but intertwined modes of semiosis have evolved, some of which are better understood than others; brief indications of general principles are given below, but no detailed discussion is possible in this paragraph. 4.1. The microcosmos This is the title of a superb book (Margulis and Sagan 1986 a) portraying four billion years of microbial evolution which, of course, is still in progress, both around, within, and, indeed, as us ⫺ human bodies, for instance, are composed of one hundred quadrillion (100,000,000,000,000,000) bacterial cells, and our endosemiosic systems, including the nervous system, are all derived from intercommunicating aggregations of bacteria. The microcosmos began to evolve four billion years ago, in the Hadean Aeon, out of debris of supernova explosions, spread to land 1.3 billion years ago (in the Protozoic Aeon) as composite organisms, and these microcosmic collectives evolved into our plant and animal ancestors a mere 0.8 billion years ago (in the Proterozoic Aeon). According to the modern view of semiosis in the microcosmos, or bacterial semiosis, all bacteria on Earth constitute the communications network of a single superorganism whose
continually shifting components are dispersed across the surface of the planet. Sonea and Panisset (1983, 85) liken the bacterial world to a global computerized communications network in extent, possessing an enormous data base ⫺ more than the brain of any mammal ⫺ which functions in a manner reminiscent of human intelligence. Bacterial social life takes three forms: localized teams, the global ensemble itself, and as a body interacting with eukaryotes (Sonea 1988, 42⫺ 43). Each of these types of associations is characterized by its appropriate form of semiosis, a rapid and continuous shuffling, which seems unrestricted by physical, chemical, or geographic boundaries of energy, matter, and signs (cf. Art. 20). The key to semiosis in the microcosmos is symbiosis. This is a quintessentially semiotic concept (Füller 1958; Margulis 1981; Margulis and Sagan 1986 a, especially ch. 8, 9) ⫺ together with such subsumed concepts as parasitism, mutualism, commensalism, and the like. The term refers to the living together of individuals of two or more species for most of the life cycles of each, and this cohabitation is clearly “often [in fact, invariably] facilitated by simple [?] forms of COMMUNICATION [sic] between the participants” (McFarland 1982, 540). Symbiotic alliances, in due course, became permanent, converting organisms (viz., prokaryotes, which share a kind of immortality, but at the expense of lacking individuality) into new, lasting collectives (viz., eukaryotes, which, on the contrary, pursue individuality but at the expense of an existence between the two poles of sex and death) that are more than simply the sum of their symbiotic parts. In brief, all visible organisms evolved through symbiotic unions between different microbes, which subsequently coevolved as wholly integrated communities, enduring sharing of cells and bodies; such mergers of diverse organisms can be regarded as thoroughly interwoven living “corporations” (Margulis and Sagan 1986 a, 127), harmoniously coordinated by means of nonverbal (and, in the case of hominids, also verbal) signs. These authors believe that “the concepts and signals of thought are based on chemical and physical abilities already latent in bacteria”, and are then moved to ask: “Could the true language of the nervous system […] be spirochetal remnants, a combination of autocatalyzing RNA and tubulin proteins symbiotically integrated in the network of hormones,
18. The evolution of semiosis
neurohormones, cells, and their wastes we call the human body? Is individual thought itself superorganismic, a collective phenomenon?” (Margulis and Sagan 1986 a, 150⫺ 151). Although their hypothesis is not proven, it is most congenial with modern semiotic thinking, as is their additional extrapolation, that perhaps “groups of humans, sedentary and packed together in communities, cities, and webs of electromagnetic communication, are already beginning to form a network as far beyond thought as thought is from the concerted swimming of spirochetes” (Margulis and Sagan 1986 a, 153). It is fascinating that as semiotically informed a student of the “information society” as Beniger suggests the same kind of “integrative machinery we might build from the spare parts amassed by our various disciplines” (1986, 105; semiotics and semiosis are discussed on pp. 89⫺90), and traces the beginnings of what he calls “the control revolution” to the DNA as a three-dimensional control model (Beniger 1986, 112⫺118). 4.2. Overview of the plant/animal/fungus trichotomy These three categories, distinguished by taxonomers according to the nutritional patterns of each class, that is, three different ways in which information (negentropy) is maintained by extracting order out of their environment, are complementary. Plants are the producers, which derive their food from inorganic sources by means of photosynthesis; animals, or ingesters, are the transformers, deriving their food, preformed organic compounds, from other organisms; fungi are the decomposers, which break their food down externally and then absorb the resulting small molecules from solution. On this macroscopic scale, we have two polar opposite life forms: the composer plants, or the organisms that build up, and the decomposer fungi, or the organisms that break down; animals, which became supreme experts at semiosis in interactions among their many cells, among one another, and with members of other life forms, can be seen as intermediate transforming agents midway between the other two. In passing, the remarkable parallelism between this systematists’ P-A-F model and the classic semioticians’ O-S-I model should be noted (but cannot be here explored). 4.2.1. Phytosemiotics The semiosic principles of the vegetative world were most thoroughly discussed, under this designation, by Krampen (1981; cf.
441 Uexküll 1986, 211⫺212). He argues that these are different from those of the animal world “in that the absence of effectors and receptors does not allow for the constitution of [Jakob von Uexküll’s] functional cycle, of object signs and sign objects, or of an Umwelt”, but that the vegetative world “is nevertheless structured according to a base semiotics which cuts across all living beings, plants, animals, and humans alike” (Krampen 1981, 203). Although plants are able to distinguish “self” from “nonself”, they are otherwise brainless solipsistic systems. However, plants “don’t really need brains”, for, as Margulis and Sagan (1986 a, 174⫺175) picturesquely point out, “they borrow ours. They have a strategic intelligence that resides more in the chemistry of photosynthesis and the ploys of the genes than in the tactics of the cerebral cortex; we behave for them”. Plant semiosis, as a matter of fact, incorporates the ancient microcosmos, a circumstance that accounts in part for botanical success (cf. Art. 23). A “unifying theory of intercellular communication” has recently been developed (Roth and LeRoith 1987), which aims to explain at a single stroke the many coincidences involving plant molecules and animal (including human) cells, by showing that both the endocrine system and the nervous system descended from a common, more generalized evolutionary ancestor. This theory provides the explanation, as well, for scores of coincidences in cellular communication in plants and in animals, for instance, accounting for the efficacy of various medicinal herbs and modern plant-derived drugs, and such circumstances as the presence of an insulin-like substance in spinach or that truffles produce molecules identical to a steroid in boars and the fact that sows detect and seek out even deeply buried truffles. Plants also have significant interactions with fungi as well as animals (Krampen also described some conspicuous examples of the latter). There is, however, a great deal of curious folklore about plant communication, the scientific basis of which remains to be investigated; see, for example, Montalverne (1984). 4.2.2. Mycosemiotics The general features of fungi are presented by Burnett (1968). Mycologists agree that all fungi are heterotrophic organisms, the vast majority of which are constructed of more or less microscopic, cylindrical filaments (hyphae), with well-designed cell walls; but they
442 disagree as to their taxonomic limits. Semiosis in fungi is not yet well understood, but their interactions with other organisms are basically known (Burnett 1968, ch. 12): these can occur without actual contact, by secretion or leakage, and by other means as well (cf. Art. 22). Fungi communicate with green plants (especially their roots), with algae, in particularly dense engagements (which have produced up to about 20,000 species of lichens), with warm-blooded animals (to which they are pathogenic), and with insects; “the essential steps in the establishment of any interaction appear to be governed by contact reactions and/or nutritional relationships” (Burnett 1968, 359), and competition among them is fierce. One of the most fascinating forms of semiosis was found in an excitingly relevant model species called Dictyostelium discoidium (which many, although not all, taxonomers class with the fungi). This was described in a classic paper by Bonner (1963), concisely pictured by Lewis Thomas (quoted here from Sebeok 1979, 23, where see also Fig. 1⫺11): “Slime-mold cells [join up to form an organism] in each life cycle. At first they are single amebocytes swimming around, eating bacteria, aloof from each other, untouching, voting straight Republican. Then, a bell sounds, and acrasin is released by special cells toward which the others converge in stellate ranks, touch, fuse together, and construct the slug, solid as a trout. A splendid stalk is raised, with a fruiting body on top, and out of this comes the next generation of amebocytes, ready to swim across the same moist ground, solitary and ambitious.” The sign carrier is cAMP (the ubiquitous molecule adenosine monophosphate), identical with the one Tomkins (1975) described in his article on the metabolic code, and which has assumed the twin functions of (physiological) epinephrine action and (semiotic) mediation of the intracellular actions of almost all those hormones that interreact with the cell membrane or, in the case in point, signify starvation. The aggregation of the slime molds in single cell form is coordinated by a sign system involving the cAMP receptor, the structure and activity of which is now clear (Klein et al. 1988). Significant homologies link the cAMP to sensory processes in higher organisms. The latest findings support the possibility that this relatively simple eukaryotic chemotactic semiosic system and various vertebrate sign systems evolved from a common ancestor.
III. Arten der Semiose
For fuller details of this remarkable story of cell-cell semiosis by cAMP, the earliest symbolic vehicle uncovered thus far, and the implications thereof for eukaryotic chemotaxis in general, see Devreotes (1982; and, in layman’s terms, Wright 1988, 196). The same molecule is at work as a so-called ‘second messenger’ secreted by human liver cells as soon as epinephrin molecules (‘first messengers’) bind to them. Second messengers of this sort are common in humans, mean different things in different contexts, but their Grundbedeutung (‘basic meaning’, in Jakobson’s sense) is always “emergency”. 4.2.3. Zoosemiotics This term dates from 1963, and is discussed, in some detail, in Sebeok (1973). Observe that it denotes semiosis in animals inclusive of the nonverbal semiosic component in man, in contrast to the anthroposemiosic component, which necessarily and additionally implicates language; for convenience, however, only the languageless creatures will be considered in this section (cf. Art. 24). The literature on this subject ⫺ virtually nonexistent before the early 1960s ⫺ has since grown hugely: Sebeok’s 1968 survey ran to almost 700 pages; his 1977 survey ran to more than 1,100; and it would now require a multivolume encyclopedia to encompass the accumulated scholarship. At the same time, no one has quite succeeded in producing a synthesis, in a biologically informed as well as semiotically interesting way, of the essential principles, taking fully into account what we know both of intraspecific, let alone the interspecific, aspects of how animals communicate (cf. Art. 163). Some useful recent texts on intraspecific communication are by Smith (1977), Lewis and Gower (1980) and Bright (1984); varieties of interspecific semiosis, with special emphasis on mutual interactions between man and animals, were lately discussed by Sebeok (1987), where further references will be found; see also the special issue of Zeitschrift für Semiotik 15, 1⫺2 (1993) on communication between man and animals. One overblown topic that received exaggerated media attention in the 1960s and 1970s, but which has proved a false trail and has since become essentially moribund, focused on the search for verbal semiosis in four species of great apes, and perhaps in certain pelagic mammals as well. For critical reviews of the mythology of language-endowed animals, see Sebeok and Umiker-Sebeok (1980),
18. The evolution of semiosis
Umiker-Sebeok and Sebeok (1981), Sebeok (1986 c), and Bouissac (1993). ⫺ Recent instructive researches in animal communication tend to view groupings ⫺ in particular, in such social animals as some insects, dolphins, wolves and lions, and of course primates ⫺ in a holistic way, as global semiosic systems. For example, honeybee colonies are now perceived as possessing “collective intelligence”, but one that arises from fundamentally decentralized sign processing (cf. Seeley and Levien 1987). Complementing the traditional description of the operation of a honeybee colony as one wherein each bee processes information in serial fashion (say, in evaluating flower patches one at a time), the colony as a whole is seen as working in parallel (say, with many patches being rated at once). The analogy is to the massively parallel computers many artificial intelligence researchers are now using, on the assumption (which is in good conformity with neurophysiological facts) that the human brain is a fundamentally social structure, its semiosic capacity arising from the interaction of many relatively simple sign processors (cf. Art. 19 § 7. and Art. 26).
5.
Hominid forms
Cartmill, Pilbeam, and Isaac (1986) wrote a convenient, concise survey of developments in paleoanthropology during the last hundred years. Hominid forms, which evolved out of the australopithecines, are commonly recognized in terms of three principal anatomical features: gradually increasing brain size; the modification of the limb and pelvic bones in adaptation to fully upright walking (“bipedal locomotion”); and a reduction in sexual dimorphism (i. e., the difference in body size between males and females). Besides from fossils, other important arguments derive from the archeological record. Forms which have thus far been identified include Homo habilis (“handy man”, 2.4 to 2.0 million years ago), first described in 1964, which is now generally recognized as a transitional form ancestral to all later Homo. Homo habilis is the first hominid with a distinctly enlarged brain (600⫺800 cm3). It appears virtually certain that habilis had language, although not speech (this corresponds, if roughly, to the distinction between Kognition and Sprache [language] drawn in Müller’s 1987 book). Language at its inception was
443 not used for exterior communication, but only as an interior modeling device. Members of early hominid species communicated amongst each other by nonverbal means, in the manner of all other primates; for details, see Sebeok (1986 a; 1988 a). Homo erectus (“upright man”, over 1.5 million years ago) had a brain volume of 800⫺1,200 cm3, and a far more elaborate tool kit, including fire, and there is no doubt that it had language (yet not speech). Hominids from the upper Middle Pleistocene, starting about 300,000 years ago, with brain volumes of about 1,200⫺1,400 cm3, were our own immediate archaic sapiens (‘wise man’) ancestors, with even more elaborate tools (e. g., hafting), ritual burials, and central-place foraging. Evidence for rule-governed behaviors indicates that they not only had language, but manifested this in the form of speech as well. Archaic sapiens divided into at least two subspecies, only one of which, modern sapiens sapiens, (i. e., ourselves) flourishes today, since about 40,000, with an average brain capacity of 1,5003; (the latter, it is thought, also replaced Homo sapiens neanderthalensis in Europe 35,000 years ago). Thus verbal semiosis, or language-as-a-modeling-system ⫺ a modeling system being a tool wherewith an organism analyzes its surroundings ⫺ having emerged on the scene perhaps 2.5 or 3 million years ago, now survives solely in Homo sapiens sapiens (a species that appeared only some 100,000 to 40,000 years ago), and seems to have always been an exclusive property of the genus Homo (Sebeok 1986 a, b); Jerison’s (1986, 155) remark, and attendant discussion, of a “uniquely human experience” (meaning species-typical) which arose “from our use of a cognitive system as a communication system” is right on the mark. The exaptation of language into speech and, later still, into other linear manifestations, such as script ⫺ all topics that belong to anthroposemiotics (cf. Art. 25) ⫺ will not be discussed here (but see Art. 33 § 1.1.), except to call attention to an important observation by Gould and Vrba (1982, 13) that applies a fortiori to the relationship of language as a biological adaptation (its historical genesis) to its current added utility as a communicative tool: “Most of what the [human] brain now does to enhance our survival lies in the domain of exaptation.” As to why this process of exaptation took several million years to accomplish, the answer seems to be that the adjustment of a species-specific mechanism for encoding lan-
444
III. Arten der Semiose
guage into speech, i. e., producing signs vocally, with a matching mechanism for decoding it, i. e, receiving and interpreting a stream of incoming verbal/vocal signs (sentences), must have taken that long to fine tune, a process which is far from complete (since humans have great difficulties in understanding each other’s spoken messages). Hence Geschwind’s remark (1980, 313), “that the forerunners of language were functions whose social advantages [i. e., communicative function] were secondary but conferred an advantage for survival [the modeling function]”, appears well taken (cf. Art. 32).
6.
Biocommunication, and some implications
The comprehensive (German) term Biokommunikation was employed by Tembrock (1971) to cover the flow of semiosis in the world of the living (see also Art. 19 and Art. 85 as well as Art. 138). While the domain of semiosis is essentially the same, it can also encompass, in any communicative loop, a human artifact, such as a computer, a robot, or automata generally. Moreover, the bold futuristic vision of Margulis and Sagan (1986 b, 44), according to which it is inevitable that human life and nonliving manufactured parts will commingle in new “lifeforms” within the next few decades, with molecules that, instead of turning into cell material “would turn [energy] into information”, by a novel progression they refer to as “cybersymbiosis”, likewise opens doors for an extension of evolutionary semiosis thus far into an eventual “cybersemiosis”. The Gaia hypothesis. ⫺ This expression refers to a unified planetary world-view proposed by James Lovelock (1979). According to this controversial hypothesis, the atmosphere, the hydrosphere, and the lithosphere mutually interact with the biosphere of the Earth, each being a compound component of a global unitary autopoietic, i. e., a homeostatic self-regulating system. In this view, all living entities, from their smallest limits to their largest extent, including some ten million existing species, form parts of a single symbiotic ecological body dubbed “Gaia”. Greenstein (1988) is concerned with the more general proposition of the existence of a symbiosis between the universe on the one hand and life on the other. Should a view, along these lines, of a modulated biosphere prevail,
it would in effect mean that all message generators/sources and destinations/interpreters could be regarded as participants in one gigantic semiosic web; and, if so, this would at the very least affect the style of future semiotic discourse (cf. Art. 27).
7.
Selected references
Albone, Eric S. (1984), Mammalian Semiochemistry. Chichester, New York, Brisbane, Toronto, and Singapore. Barrow, John D. and Joseph Silk (1983), The Left Hand of Creation: The Origin and Evolution of the Expanding Universe. New York. Beadle, George W. and Muriel Beadle (1966), The Language of Life: An Introduction to the Science of Genetics. Garden City, New York. Beniger, James R. (1986), The Control Revolution: Technological and Economic Origins of the Information Society. Cambridge, Mass. and London. Berlinski, David (1986), “The Language of Life”. In: John L. Casti and Anders Karlqvist (eds.), Complexity, Language, and Life: Mathematical Approaches. Berlin, Heidelberg, New York, and Tokyo: 231⫺267. Bonner, John Tyler (1963), “How Slime Molds Communicate”, Scientific American 209: 84⫺93. Bouissac, Paul (1993), „Semiotisches Wettrüsten: Zur Evolution artübergreifender Kommunikation“, Zeitschrift für Semiotik 15: 3⫺22. Bright, Michael (1984), Animal Language. London. Brooks, Daniel R. and E. O. Wiley (1986), Evolution as Entropy: Toward a Unified Theory of Biology. Chicago and London. Burnett, J. H. (1968), Fundamentals of Mycology. London. Cairns-Smith, A. G. (1985), Seven Clues to the Origin of Life: A Scientic Detective Story. Cambridge, New York, New Rochelle, Melbourne, and Sydney. Cartmill, Matt, David Pilbeam, and Glynn Isaac (1986), “One Hundred Years of Paleoanthropology”, American Scientist 74: 410⫺420. Cook, Norman D. (1986), The Brain Code. London and New York. Devreotes, Peter N. (1982), “Chemotaxis”. In: The Development of Dictyostelium discoideum. Paris, San Diego, San Francisco, Sa˜o Paulo, Sydney, Tokyo, and Toronto: 117⫺168. Fox, Sidney (1988), The Emergence of Life: Darwinian Evolution from the Inside. New York. Füller, H. (1958), Symbiose im Tierreich. Wittenberg. Gatlin, Lila L. (1972), Information Theory and Living Systems. New York. Geschwind, Norman (1980), “Some Comments on the Neurology of Language”. In: David Caplan
18. The evolution of semiosis (ed.), Biological Studies of Mental Processes. Cambridge, Mass. and London: 301⫺319. Gould, Stephen J. and Elizabeth S. Vrba (1982), “Exaptation ⫺ A Missing Term in the Science of Form”, Paleobiology B/1: 4⫺15. Greenstein, George (1988), The Symbiotic Universe: Life and Mind in the Cosmos. New York. Hailman, Jack P. (1977), Optical Signals: Animal Communication and Light. Bloomington and London. Hediger, Heini (1980), Tiere verstehen: Erkenntnisse eines Tierpsychologen. München. Hediger, Heini (1990), Ein Leben mit Tieren im Zoo und in aller Welt. Zürich. Ingold, Tim (ed.) (1988), What Is an Animal? Boston, Sydney, and Wellington. Jakobson, Roman (1970), “Linguistics”. In: Main Trends of Research in the Social and Human Sciences, Part One: Social Sciences. Paris: 419⫺463. Jankovic´, Branislav D., Branislav M. Markovic´, and Novera Herbert Spector (1987), Neuroimmune Reactions: Proceedings of the Second International Workshop on Neuroimmunomodulation. New York. Jerison, Harry J. (1986), “The Perceptual World of Dolphins”. In: Ronald J. Schusterman, Jeanette A. Thomas, and Forrest G. Wood (eds.), Dolphin Cognition and Behavior: A Comparative Approach. Hillsdale, New Jersey and London: 141⫺166. Jerne, Niels K. (1985), “The Generative Grammar of the Immune System”, Science 229: 1057⫺1059. Klein, Peter S., et al. (1988), “A Chemoattractant Receptor Controls Development in Dictyostelium discoideum”, Science 241: 1467⫺1472. Kommunikation zwischen Mensch und Tier (1993). Special issue of Zeitschrift für Semiotik 15, 1⫺2. Krampen, Martin (1981), “Phytosemiotics”, Semiotica 36: 187⫺209. Lees, Robert B. (1980), “Language and the Genetic Code”. In: Irmengard Rauch and Gerald F. Carr (eds.), The Signifying Animal: The Grammar of Language and Experience. Bloomington: 218⫺226. Lewis, D. Brian and D. Michael Gower (1980), Biology of Communication. New York and Toronto. Lovelock, James E. (1979), Gaia: A New Look at Life on Earth. Oxford, New York, Toronto, and Melbourne. Margulis, Lynn (1981), Symbiosis in Cell Evolution: Life and Its Environment on the Early Earth. San Francisco. Margulis, Lynn and Dorion Sagan (1986 a), Microcosmos: Four Billion Years of Microbial Evolution. New York. Margulis, Lynn and Dorion Sagan (1986 b), “Strange Fruit on the Tree of Life: How ManMade Objects May Remake Man”, The Sciences 4,2: 38⫺45.
445 Margulis, Lynn and Karlene V. Schwartz (1988), Five Kingdoms: An Illustrated Guide to the Phyla of Life on Earth. New York. Maturana, Humberto (1980), “Autopoiesis: Reproduction, Heredity, and Evolution”. In: Humberto Maturana and Francisco J. Varela (eds.), Autopoiesis, Dissipative Structures, and Spontaneous Social Orders. Boulder, Colo. and Washington: 45⫺ 107. McFarland, David (ed.) (1982), The Oxford Companion to Animal Behavior. Oxford and New York. Montalverne, Gil (1984), “A vida secreta das plantas”, Atlantas 4,4: 8⫺13. Morris, Charles (1946), Signs, Language and Behavior. New York. Müller, Horst M. (1987), Evolution, Kognition und Sprache. Berlin and Hamburg. Peirce, Charles S. (1960), Collected Papers of Charles Sanders Peirce, 8 Vols. Ed. Charles Hartshorne and Paul Weiss. Cambridge, Mass. Prodi, Giorgio (1977), Le basi materiali della significazione. Milano. Prosser, C. Ladd. (1985), “Modes of Communication”. In: Melvin J. Cohen and Felix Sturmwasser (eds.), Comparative Neurobiology. New York, Chichester, Brisbane, Toronto, and Singapore: 117⫺118. Roitblat, Herbert L., Louis M. Herman, and Paul E. Nachtigall (1993), Language and Communication: Comparative Perspectives. Hillsdale, Hove, and London. Roth, Jesse and Derek LeRoith (1987), “Chemical Crosstalk”, The Sciences 27,3: 51⫺54. Schopf, J. William (ed.) (1983), Earth’s Earliest Biosphere: Its Origin and Evolution. Princeton. Sebeok, Thomas A. (ed.) (1968), Animal Communication: Techniques of Study and Results of Research. Bloomington and London. Sebeok, Thomas A. (1973), Perspectives in Zoosemiotics. The Hague. Sebeok, Thomas A. (1976), Contributions to the Doctrine of Signs. Bloomington and Lisse. Sebeok, Thomas A. (ed.) (1977), How Animals Communicate. Bloomington and London. Sebeok, Thomas A. (1979), The Sign and Its Masters. Austin and London. Sebeok, Thomas A. and Jean Umiker-Sebeok (eds.) (1980), Speaking of Apes: A Critical Anthology of Two-Way Communication with Man. New York and London. Sebeok, Thomas (1986 a), “The Problem of the Origin of Language in an Evolutionary Frame”, Language Sciences 8: 169⫺176. Sebeok, Thomas A. (ed.) (1986 b), Encyclopedic Dictionary of Semiotics. Berlin and New York.
446
III. Arten der Semiose
Shannon, Claude E. (1948), “A Mathematical Theory of Information”, Bell System Technical Journal 27: 379⫺423, 623⫺656.
Smith, W. John (1977), The Behavior of Communicating: An Ethological Approach. Cambridge, Mass. and London. Sonea, Sorin and Maurice Panisset (1983), A New Bactereology. Boston and Portola Valley. Sonea, Sorin (1988), “The Global Organism”, The Sciences 28,4: 38⫺45. Tembrock, Günter (1971), Biokommunikation: Informationsübertragung im biologischen Bereich. Berlin, Oxford, and Braunschweig. Tomkins, Gordon M. (1975), “The Metabolic Code”, Science 189: 760⫺763. Uexküll, Thure von (1986), “Medicine and Semiotics”, Semiotica 61: 201⫺217. Uexküll, Thure von (ed.) (1992), (Special Issue:) “Jakob von Uexküll’s A Stroll through the Worlds of Animals and Men”. Semiotica 89: 277⫺391. Uexküll, Thure von, Werner Geigges, and Jörg M. Herrmann (1993), “Endosemiosis”. Semiotica 96: 5⫺51. Umiker-Sebeok, Jean and Thomas A. Sebeok (1981), “Clever Hans and Smart Simians: The SelfFulfilling Prophecy and Kindred Methodological Pitfalls”, Anthropos 76: 89⫺165. Wallman, Joel (1992), Aping Language. Cambridge, England. Wheeler, John Archibald (1984), “Bits, Quanta, Meaning”. In: A. Giovanni, F. Mancini, and M. Marinaro (eds.), Problems in Theoretical Physics. Salerno: 121⫺141. Wheeler, John Archibald (1986), “How Come the Quantum?” Foreword to John D. Barrow and Frank J. Tipler, The Anthropic Principle. Oxford: vii⫺ix. Whitfield, I. C. (1984), Neurocommunications: An Introduction. Chichester, New York, Brisbane, Toronto, and Singapore. Wicken, Jeffrey S. (1987), Evolution, Thermodynamics, and Information: Extending the Darwinian Program. New York and Oxford. Wright, Robert (1988), Three Scientists and Their Gods: Looking for Meaning in an Age of Information. New York and Toronto. Yates, F. Eugene and Peter N. Kugler (1984), “Signs, Singularities and Significance: A Physical Model for Semiotics”, Semiotica 52: 49⫺77.
Silk, Joseph (1980), The Big Bang: The Creation and Evolution of the Universe. San Francisco.
Thomas A. Sebeok, Bloomington IN (USA)
Sebeok, Thomas A. (1986 c), “Toward a Natural History of Language”, The World & I, October: 462⫺469. Sebeok, Thomas A. (1986 d), I Think I Am a Verb: More Contributions to the Doctrine of Signs. New York and London. Sebeok, Thomas A. (1987), “ ‘Animal’ in Biological and Semiotic Perspective”. In: Tim Ingold (ed.), What is an Animal? London and Winchester, Mass. Sebeok, Thomas A. (1988 a), “In What Sense is Language a ‘Primary Modeling System’?” In: Henri Broms and Rebecca Kaufmann (eds.), Proceedings of the 25th Symposium of the Tartu-Moscow School of Semiotics. Helsinki: 67⫺80. Sebeok, Thomas A. (1988 b), The Sign and Its Masters. Lanham (new edition of Sebeok 1979). Sebeok, Thomas A. (1989 a), American Signatures. Norman. Sebeok, Thomas A. (1989 b), “The Semiotic Self Revisited”. In: Benjamin Lee and Greg Urban (eds.), Sign, Self, and Society. Berlin, New York, and Amsterdam. Sebeok, Thomas A. (1990), Essays in Zoosemiotics. Toronto. Sebeok, Thomas A. (1991a), Semiotics in the United States. Bloomington and Indianapolis. Sebeok, Thomas A. (1991b), A Sign is Just a Sign. Bloomington and Indianapolis. Sebeok, Thomas A. and Jean Umiker-Sebeok (eds.) (1992), Biosemiotics. Berlin and New York. Sebeok, Thomas A. (1993), “What Do We Know about Signifying Behavior in the Domestic Cat (Felis catus)?”, Signifying Behavior 1: 3⫺31. Sebeok, Thomas A. (1994), Signs: An Introduction to Semiotics. Toronto. Seeley, Thomas D. and Roger A. Levien (1987), “A Colony of Mind”, The Sciences 27,4: 39⫺42. Sercarz, Eli E., Franco Celada, N. Avrion Mitchison, and Tomio Tada (eds.) (1988), The Semiotics of Cellular Communication in the Immune System. (NATO ASI Series H: Cell Biology, Vol. 23) Berlin, Heidelberg, and New York.
447
19. Biosemiose
19. Biosemiose 1. Vorüberlegung 2. Biosemiotik und die Zweiseitigkeit des Zeichens 3. Drei Formen von Semiosen 4. Die zwei Stufen biosemiotischer Analyse: Begreifen und Verstehen (das Modell der trivialen und der nicht-trivialen Maschine) 5. Innen und Außen als semiotische Kategorien 6. Signetik und Signemik 7. Systemtheorie und die Begriffe Emergenz und Integration 8. Systemtheorie und Zeichenlehre 9. Zusammenfassung 10. Literatur (in Auswahl)
1.
Vorüberlegung
Unter „Biosemiotik“ ist eine Lehre der Zeichen zu verstehen, die nicht auf den Bereich begrenzt ist, in dem der Mensch als Sender und Empfänger auftritt. Biosemiotik erhebt den Anspruch, eine Wissenschaft der Zeichenprozesse der gesamten belebten Natur zu sein. Damit ist ein grundsätzliches Problem aufgeworfen, das vorweg geklärt werden muß. Es betrifft die Frage, ob Semiotik außerhalb der Humanwissenschaften überhaupt möglich ist. Für Eco (1972) ist Semiotik eine Wissenschaft kultureller Vorgänge unter dem Aspekt zwischenmenschlicher Kommunikation. Nach ihm ist Semiotik „nur für die Bedingungen der Mitteilbarkeit und Verstehbarkeit der Botschaft“, aber nicht für die Frage zuständig, ob die Botschaft richtig oder falsch ist (1972, 73). Zeichen sind für ihn „kulturelle Einheiten“ (vgl. Art. 34). Das Gebiet der Naturwissenschaften liegt für ihn außerhalb der Grenzen der Semiotik; denn von den Naturwissenschaften müsse die Semiotik annehmen, daß sie sich mit Sachen befaßten, „die für sich selbst existieren“ (1972, 39). Dieser restriktiven Definition muß jedoch folgendes entgegengehalten werden: Die Frage, ob die Naturwissenschaften wirklich mit „Dingen an sich“ zu tun haben, wie das Problem bereits von Kant formuliert wurde, ist spätestens seit den Erfahrungen der Quantenphysik (vgl. Art. 84) von den Naturwissenschaften selbst eindeutig ⫺ und zwar in negativem Sinne ⫺ beantwortet worden. Nils Bohr (1931, 75) hat diese Antwort folgendermaßen formuliert: „Die Entdeckung des Wirkungsquantums zeigt nicht nur die
Begrenzung der klassischen Physik, sondern bringt die Naturwissenschaft in eine ganz neue Lage, indem die alte philosophische Frage nach der objektiven Existenz der Erscheinungen unabhängig von unseren Beobachtungen in eine neue Beleuchtung gestellt wird.“ An einer anderen Stelle (Bohr 1958, 25) fügt er hinzu: „Nicht nur die Physik, sondern die Naturwissenschaft als Ganzes ist in eine neue Erkenntnissituation gebracht, und das nicht durch Willkür eines individuellen Beobachters, sondern durch Grenzziehung seitens ‘der Natur selber’, insofern durch das Wirkungsquantum ein universales Naturgesetz symbolisiert wird: Die Grenze, von einem (von unseren Beobachtungen) unabhängigen Verhalten zu sprechen, ist eine prinzipielle Grenze.“ „Die neue Situation“ ist also die Konsequenz der im 19. Jahrhundert geflissentlich ignorierten Tatsache, daß der Beobachter immer ein Teil des Beobachtungsvorgangs ist, daß die Einführung des Beobachter-Subjekts in die wissenschaftliche Betrachtung aber keinerlei „Subjektivismus“ im Sinne von Willkürlichkeit der Interpretation des Beobachteten bedeutet. Nicht Subjektivität im Sinne von Beliebigkeit steht zur Debatte, sondern das Subjekt des Beobachters in Interaktion mit dem von ihm beobachteten Phänomen. Die Situation des Beobachters läßt sich also als die eines Menschen definieren, der seine Interaktion mit den Phänomenen seiner Beobachtung selbst beobachten und interpretieren muß. Diese Feststellung hat die Konsequenz, daß wir uns auch bei biosemiotischen Untersuchungen über den Beobachter und seine Situation Rechenschaft geben müssen. Beides ist untrennbar in unsere Aussagen über Biosemiosen hineingewoben.
2.
Biosemiotik und die Zweiseitigkeit des Zeichens
Die Situation des Beobachters, der seine Interaktion mit anderen Menschen beobachtet, wird von der Situation sehr verschieden sein, in der seine Beobachtung der Interaktion mit unbelebten Gegenständen gilt. Im ersteren Fall stellt er fest, daß er von seinem Gegenüber verbale und averbale Zeichen empfängt,
448 deren Bedeutung (⫽ Informations- oder Nachrichtengehalt) er entschlüsseln (dekodieren) muß. Im zweiten Fall konstatiert er, daß der unbelebte Gegenstand Wirkungen auf ihn ausübt, die es mit Methoden der Physik oder der Chemie zu analysieren gilt. Beide Situationen scheinen eindeutig. Aber wie steht es mit Situationen, in denen wir unsere Interaktion mit Zellen, Pilzen, Pflanzen oder Tieren beobachten? Gehören sie zu der ersten oder zu der zweiten Kategorie? Diese Frage stellt uns vor das prinzipielle Problem, wodurch sich Zeichenprozesse von physikalischen und chemischen Vorgängen unterscheiden, und ob sie grundsätzlich etwas anderes sind als diese. Viele ⫺ wenn nicht die meisten ⫺ Biologen vertreten die Meinung, alle Vorgänge, die wir beobachten können, seien mechanisch, d. h. als physikalische oder chemische Vorgänge erklärbar, und davon würden auch Vorgänge, die wir bei lebenden Systemen beobachten, keine Ausnahme machen. Die Mechanismen dieser Vorgänge seien zwar komplizierter als beispielsweise die Mechanismen, die hinter den Bewegungen vom Winde getriebener Wolken stecken, im Prinzip aber von der gleichen Kategorie. Man behauptet sogar, von einer wissenschaftlichen Erklärung für Naturzusammenhänge dürfe man erst sprechen, wenn die mechanischen Wirkungszusammenhänge aufgeklärt seien. Für diese Ansicht sind Zeichenvorgänge bestenfalls Metaphern, die unser Unwissen über die „wahren“ Zusammenhänge verbergen. Die Antwort auf dieses (positivistische) Argument fällt nach der Entscheidung der Naturwissenschaften gegen den Glauben an die Dinge, die „für sich selbst existieren“, nicht schwer. Sie besteht in der Feststellung, daß die Rede von „mechanischen Wirkungszusammenhängen“ ebenfalls metaphorisch ist ⫺ und daß alle Metaphern, die uns zur Deutung der Vorgänge in der Natur zur Verfügung stehen, letztlich auf menschliche Selbsterfahrung zurückgehen. Von diesen Selbsterfahrungen haben zwei exemplarische Bedeutung für die Vorstellungen, die wir uns von uns selbst und von der uns umgebenden Welt machen: (1) die Erfahrung, daß Eingriffe unserer Hand Veränderungen in der Umgebung bewirken, und (2) die Erfahrung, daß auch das Senden von Zeichen, z. B. das Aussprechen bestimmter Worte, die verstanden und beantwortet werden, solche Veränderungen zur Folge haben können.
III. Arten der Semiose
Spaemann und Löw (1981) haben darauf hingewiesen, daß aus der ersten Art dieser Erfahrungen der Begriff der „mechanischen Ursache“ entstanden ist. Sie betonen, daß Kausalität ⫺ wie schon Hume gezeigt habe ⫺ keineswegs in der Natur beobachtet werden kann. Die zweite Art Erfahrung wurde, wie sie hervorheben, die Basis für das, was Platon „Überredungs-Ursache“ nannte, und was wir heute als „psychische Intervention“ bezeichnen. Diese Feststellung gibt uns eine Antwort auf die Frage, wodurch sich Zeichenprozesse von physikalischen und chemischen Vorgängen unterscheiden, und damit auch auf das Problem, was wir uns unter der „Zweiseitigkeit des Zeichens“ vorstellen sollen. Dieser Ausdruck besagt, daß jedes Zeichen aus einem materiellen Zeichenträger oder Vehikel und einer immateriellen Bedeutung (Information bzw. Nachricht) besteht. Sebeok (1979, 91) hat diesen Sachverhalt folgendermaßen beschrieben: „Das Zeichen ist zweiseitig. […] Dieser Ausdruck besagt, daß das Zeichen aus zwei unentbehrlichen Hälften aufgebaut ist, von denen die eine aı´sthe¯ton, wahrnehmbar (oder empfindbar), und die andere noe¯to´n, verstehbar (oder rational), ist: das Bezeichnende, ein wahrnehmbarer Eindruck auf zumindest eines der Sinnesorgane des Interpreten, und der bezeichnete Inhalt.“ Die Einsicht in die Metaphorik der Begriffe Ursache und Wirkung lehrt uns, daß wir diese „Zweiseitigkeit“ nicht als Dualismus von Materie und Geist im Descartesschen Sinn interpretieren dürfen, sondern daß sie Ausdruck der Kombination von zwei verschiedenartigen Zeichenprozessen ist: einmal von Zeichenprozessen, die dem Beobachter Vorgänge als Zeichen für Wirkungen von Handgriffen (⫽ physikalischen oder chemischen Ursachen) deuten; und dann von Zeichenprozessen, mit deren Hilfe er sich in die Lage eines beobachteten Interpreten versetzt, um zu ergründen, wie dieser die Einwirkungen physikalischer und chemischer Ursachen (⫽ Handgriffe), die er erleidet, zu Zeichen kodiert, die eine Bedeutung z. B. für seine biologischen Bedürfnisse haben. Peirce macht zwar einen prinzipiellen Unterschied zwischen mechanischen Vorgängen und Zeichenprozessen. Für ihn sind Zeichenprozesse durch drei Elemente (das Zeichen, das Bezeichnete und den Interpretanten) definiert. Von mechanischen Vorgängen („Aktionen roher Gewalt“) sagt er, sie seien durch nur zwei Elemente (Ursache und Wirkung)
19. Biosemiose
charakterisiert, und die drei Elemente von Zeichenprozessen ließen sich in keiner Weise auf nur zwei Elemente reduzieren (vgl. Art. 100). Das ist zweifellos richtig. Nur führt die Feststellung, daß „mechanische Ursachen“ letztlich Metaphern für verändernde Eingriffe der menschlichen Hand sind, nicht zu einer solchen Reduktion; vielmehr werden die beobachteten Zusammenhänge jetzt als Beziehung gedeutet, die nicht zwischen zwei Elementen (Ursache und Wirkung), sondern zwischen drei Elementen bestehen: einer Wirkung (als Zeichen), ihrer Ursache (als das Bezeichnete) und der Muskelkraft der Hand ⫺ letztlich unserer Willkürmotorik ⫺ als dazugehörigem Interpretanten. Mechanische Ursachen ⫺ so können wir sagen ⫺ simulieren Handgriffe und lassen sich ⫺ was wichtiger ist ⫺ durch geeignete Handgriffe simulieren. Zwischen mechanischen und semiotischen Deutungen besteht also keine Alternative im Sinne eines Entweder/Oder, sondern beide Deutungen ergänzen sich gegenseitig (vgl. Art. 138 § 2.): Mit der Identifizierung der physikalischen bzw. chemischen Prozesse, welche auf die Rezeptoren eines lebenden Systems einwirken, identifizieren wir materielle Vehikel (Reize oder Signale) als Metaphern für Handgriffe, deren Wirkungen von dem betroffenen System zu den Zeichen kodiert werden, auf die es antwortet. Die semiotische Deutung setzt also die mechanische Analyse voraus. Aber ohne semiotische Interpretation stellt die mechanische Deutung biologische Zusammenhänge unvollständig und oft genug falsch dar. Im Gegensatz zu der herrschenden Auffassung ist das Problem also nicht die mechanische Aufklärung vermuteter Zeichenprozesse, sondern die zeichentheoretische Abklärung der Metaphern, mit denen mechanische Deutungen arbeiten.
3.
Drei Formen von Semiosen
Die zeichentheoretische Abklärung unserer Interaktion mit den Phänomenen unserer Beobachtung läßt sich vertiefen, wenn wir drei Semioseformen unterscheiden (Böttner 1980; Nöth 1985), die sich durch eine unterschiedliche Beteiligung von Sender und Empfänger charakterisieren lassen. In diesen Unterschieden kommen verschiedene Funktionen von Semiosen zum Ausdruck (vgl. auch Art. 4 § 1.).
449 (1) Semiosen der Information: In ihnen spielt die unbelebte Umgebung die Rolle eines Quasi-Senders. Sie übernimmt keinerlei semiotische Funktion. Sämtliche semiotische Funktionen müssen von dem Empfänger ausgeführt werden (Böttner 1980). Mit ihrer Hilfe erteilen lebende Systeme den empfangenen Signalen eine, ihren biologischen Bedürfnissen entsprechende, Bedeutung (z. B. als Medium, als Revier, als Feind usw.). Der menschliche Beobachter deutet die von der unbelebten Umgebung empfangenen Signale als Zeichen, die seine Umgebung als Medium für seine Willkürbewegungen (Gehen, Schauen, Greifen usw.) interpretieren. Irgendwann hat er entdeckt, daß die Signale sich nach bestimmten Regeln mani-pulieren lassen. Schließlich hat er angefangen, sie methodisch als Vorgänge zu interpretieren, welche Wirkungen von Handgriffen simulieren und sich durch Handgriffe simulieren lassen. Wir müssen Naturwissenschaft und Technik als Resultate des systematisch in Angriff genommenen, gigantischen Unternehmens sehen, das die Wirkungen, die unsere Handgriffe, anfangs ohne, dann mit zunächst einfachen, schließlich immer komplizierteren Hilfsmitteln, erzielen können, katalogisiert und als lehrbare, jederzeit verfügbare Formeln festgeschrieben hat. Diese Formeln zeigen uns die Natur nicht, wie sie für sich selbst ist, und auch nicht, wie sie anderen Lebewesen erscheint, sondern wie sie sich für unsere Möglichkeit darstellt, sie zu manipulieren. (2) Semiosen der Symptomatisation: In ihnen ist der Sender ein Lebewesen, das mit seinem Verhalten oder durch seine Haltung Signale aussendet, die sich an keinen Empfänger wenden und keine Antwort erwarten. Zeichen dieser Kategorie bezeichnen wir als Symptome (vgl. Art. 140 § 2. 3.). Sie informieren den Kundigen über den Zustand oder die Verfassung des betreffenden Lebewesens. Zeichen dieser Art spielen in der Medizin eine wichtige Rolle (Th. v. Uexküll 1984 b). Auch hier muß der Empfänger (z. B. der Arzt, der das Symptom feststellt) die Aufgabe der Interpretation allein übernehmen, aber jetzt genügt die Interpretation nach der Metapher des Handgriffs nicht mehr. G. H. Mead (1968) nennt Zeichen dieser Art „unintelligent gestures“ und stellt fest, daß sie noch keine Gemeinschaftshandlungen sondern nur Vorstufen solcher Handlungen ermöglichen. (3) Semiosen der Kommunikation: Erst in diesen Zeichenprozessen teilen sich Sender
450
III. Arten der Semiose
und Empfänger in die semiotischen Aufgaben, indem sie sich gegenseitig über den Interpretanten (bzw. den Kode) informieren, der den gesendeten Zeichen die von dem Sender intendierte Bedeutung erteilt. G. H. Mead (1968) nennt diese Zeichenprozesse „intelligent gestures“ und betont, daß sie Voraussetzung und Grundlage für Gemeinschaftshandlung sind. Sie sind auch Voraussetzung und Grundlage jeder wirklichen Kommunikation.
4.
Die zwei Stufen biosemiotischer Analyse: Begreifen und Verstehen (das Modell der trivialen und der nicht-trivialen Maschine)
Diese Gegenüberstellung macht klar, daß es sich bei den mechanischen Deutungen, mit deren Hilfe der Beobachter in der Umgebung lebender Systeme Ursachen für deren Verhaltensantworten zu identifizieren sucht, um Semiosen der Information handelt. Sie deuten Vorgänge, welche auf die Rezeptoren lebender Systeme einwirken (nach der Metapher des Handgriffs) als mechanische Ursachen, deren Wirkungen sich durch gleichartige Ursachen reproduzieren lassen. In Anlehnung an Diltheys Unterscheidung zwischen „Erklären“ (für naturwissenschaftliche Zusammenhänge) und „Verstehen“ (für geisteswissenschaftliche) können wir sagen, daß es bei diesen Unternehmungen um Erklären im Sinne eines „Be-greifens“ geht (vgl. Art. 31). Um zu einem Verstehen zu kommen, muß sich an die Semiose der Information eine Semiose der Symptomatisation anschließen, die das Verhalten oder die Haltung des beobachteten Lebewesens als Symptom für dessen Zustand oder Verfassung, und das heißt, für dessen biologische Bedürfnisse (Hunger, Nestbau, usw.) deutet. Die biologischen Bedürfnisse entsprechen den Interpretanten des Lebewesens. Sie erteilen den physikalischen oder chemischen Prozessen, die auf seine Rezeptoren wirken, die Bedeutungen, die sie zu Zeichen kodieren, auf die sein Verhalten antwortet. Der Unterschied zwischen Semiosen der Information und Semiosen der Symptomatisation läßt sich durch eine Gegenüberstellung von zwei Modellen anschaulich machen, die Heinz von Förster (1988) „triviale“ und „nicht-triviale“ Maschinen genannt hat (vgl. Art. 26 § 2. und § 3.). Unter Maschinen versteht er ganz allgemein begriffliche Apparate,
die logische Operationen durchführen. Das Modell der trivialen Maschine besteht aus drei Teilen: einem Input, einer Transferoder Übertragungsfunktion und einem Output. Als Transfer- oder Übertragungsfunktion dient die mechanische Kausalität: Sie transferiert Ursachen in Wirkungen und sorgt dafür, daß auf den gleichen Input immer der gleiche Output folgt. Diese Maschine bildet das „prototypische Modell“ für zuverlässige Vorhersagen. Wir haben uns daran gewöhnt, dieses Modell bei wissenschaftlichen Untersuchungen einzusetzen. Triviale Maschinen arbeiten unabhängig von ihrer Vergangenheit, d. h. sie lernen nicht aus Erfahrung, und das entspricht dem, was wir von kausalen Erklärungen erwarten. Zeichentheoretisch beschreibt das Modell der trivialen Maschine eine Semiose der Information, welche die Bedeutung, die Vorgänge der Umgebung für ein Lebewesen haben, nach der Metapher des Handgriffs als mechanische Ursache interpretiert: Ihr Input (die Ursache) entspricht dem Zeichen, ihre Übertragungs- oder Transferfunktion dem Interpretanten (der Kausalregel) und ihr Output (die Wirkung) dem Bezeichneten. Der Beobachter kann, wenn er die Maschine kennt, aus dem Input den Output vorhersagen. Er kann aber auch umgekehrt aus dem Output der Maschine die Übertragungsfunktion bzw. den Input erschließen. Nicht-triviale Maschinen verhalten sich völlig anders. Sie bestehen, dem triadischen Aufbau von Zeichenprozessen entsprechend, zwar wieder aus den drei Teilen der trivialen Maschine. Aber bei ihnen ist der Zustand der Maschine mit der Übertragungsoder Transferfunktion gekoppelt. Das hat den Effekt, daß jeder Arbeitsgang, der den Zustand der Maschine ändert, auch ihre Übertragungsfunktion ändert. Die Maschine antwortet dann auf den gleichen Input nicht mehr mit dem gleichen Output. Nicht-triviale Maschinen haben eine Vergangenheit. Sie lernen aus Erfahrung, d. h. sie können gewissermaßen mit jedem Arbeitsgang eine andere Maschine werden. Ein relativ einfaches Modell für eine nichttriviale Maschine ist der Regelkreis, in dem der Begriff des Sollwerts sowohl den Zustand des Systems wie dessen Übertragungs- bzw. Transferfunktion (⫽ den Interpretanten) beschreibt und in dem sich mit jedem Arbeitsgang der Sollwert ändern kann. Hier kann der Beobachter aus dem Input den Output nicht vorhersagen. Er kann nur aus dem In-
19. Biosemiose
put und dem Output der Maschine auf ihre Übertragungsfunktion (ihren Sollwert bzw. Interpretanten) schließen. Lebewesen verhalten sich wie nicht-triviale Maschinen. Auch sie können mit jedem Arbeitsgang eine andere Maschine werden. Ein hungriges Tier ist nach der Fütterung nicht mehr das gleiche Tier. Schon eine Immunzelle ist nach dem Kontakt mit dem passenden Antigen nicht mehr die gleiche Immunzelle. Zeichentheoretisch beschreibt das Modell der nicht-trivialen Maschine eine Semiose der Symptomatisation, in der ein Lebewesen mit seinem Verhalten oder seinem Zustand Signale aussendet, die den Beobachter über den Interpretanten informieren, nach dem das Lebewesen Einwirkungen, die es aus seiner Umgebung empfängt, zu Zeichen kodiert. Das Modell der trivialen Maschine hilft uns zu begreifen, wie Vehikel für Zeichen mechanisch übertragen werden. Aber erst das Modell der nicht-trivialen Maschine hilft zu verstehen, wie Vehikel zu Zeichen kodiert werden, die für das Lebewesen eine Bedeutung haben. Fremde Zeichen verstehen heißt jedoch nicht, sie auch empfinden (riechen, hören, schmecken oder sehen). Das verbietet der private Charakter, der jedem Zeichen eigen ist. Semiosen der Symptomatisation erlauben dem Beobachter zwar, sich in ein fremdes Lebewesen hineinzuversetzen. Sie erlauben ihm aber nicht, sich in das fremde Lebewesen zu verwandeln. Das erlauben nicht einmal Semiosen der Kommunikation.
5.
Innen und Außen als semiotische Kategorien
Bei der Untersuchung fremder Zeichenprozesse können wir nur die Vehikel, auf denen Nachrichten transportiert werden, den Organismus des Empfängers mit seinen Rezeptoren und dessen Antwortverhalten beobachten. Alles, was sich zwischen den Vorgängen auf den Rezeptoren und dem Antwortverhalten des Organismus abspielt, bleibt dem Beobachter verborgen. Der Zeichenempfänger ist für den Beobachter eine black box, über deren Inneres er nur Vermutungen anstellen kann. Alle Aussagen über Vorgänge in seiner Innenwelt, die erklären sollen, warum er gerade auf dieses Signal und mit diesem Verhalten antwortet, sind Konstruktionen des Beobachters, mit denen er seine eigenen Erfahrungen als Zeichenempfänger in den beobachteten Empfänger projiziert.
451 Wir stoßen hier auf ein Problem, das in der Medizin viel Verwirrung gestiftet hat (vgl. Art. 140 § 3.). Der Arzt steht ja immer wieder vor der Frage, was sich in dem Patienten abspielt, den er beobachtet oder untersucht. Wenn er keine Antwort findet, sagt er, man könne nicht wissen, was in dem Kopf eines anderen vorgeht. Dieser Ausdruck verführt aber zu einem folgenschweren Irrtum: Im Kopf eines Menschen laufen elektrophysiologische und biochemische Gehirnvorgänge ab, und die Frage, wie diese zu Gedanken in Beziehung gesetzt werden können, wird nicht dadurch beantwortet, daß man ⫺ wie die sogenannte ‘Identitätslehre’ ⫺ Gedanken mit Gehirnvorgängen gleichsetzt. Statt uns mit einem derartigen Kurzschluß zufrieden zu geben, müssen wir fragen, was wir mit den Begriffen innen und außen sagen wollen. Gewöhnlich bezeichnen wir mit diesen Begriffen räumliche Verhältnisse. In dem Fall, von dem wir sprechen, macht man sich aber nicht klar, daß mit diesen räumlichen Verhältnissen der Raum gemeint ist, den der Beobachter wahrnimmt, und in dem er den Transport der Vehikel, den Organismus des Empfängers und dessen Verhaltensantworten lokalisiert. Um jedoch in Erfahrung zu bringen, ob auch der Empfänger einen Raum aufbaut ⫺ so ist es z. B. höchst unwahrscheinlich, daß eine Immunzelle bereits einen Raum besitzt, der mit dem menschlichen Raum vergleichbar ist ⫺ müssen wir davon ausgehen, daß Raum (und Zeit) semiotische Erzeugnisse sind. (Vgl. Art. 110: „Jakob von Uexküll und die Umweltlehre”.) Aber was können die Begriffe innen und außen dann bedeuten? Jeder Zeichenprozeß setzt mit seinem Kode Grenzen. Nur wenn wir den Kode beherrschen, verstehen wir die Nachrichten, die seine Zeichen vermitteln. Wir sind dann ⫺ wie der englische Ausdruck insider anschaulich beschreibt ⫺ in den oder innerhalb der Grenzen seines Zeichensystems. Wer den Kode nicht kennt, ist für das System ein outsider. Er bleibt ausgeschlossen, das heißt außerhalb seiner semantischen Grenzen. Innen und außen sind ursprünglich semiotische Begriffe. Deshalb würde der Arzt, der nicht weiß, was in dem Kopf eines Patienten vorgeht, nicht klüger, wenn er über die elektrophysiologischen und biochemischen Abläufe in dem Gehirn des Kranken informiert würde. Für die Zeichen, die zwischen den Ganglienzellen des Gehirns ausgetauscht werden, bliebe er Outsider. Das Problem der
452
III. Arten der Semiose
Übersetzung außersprachlicher Zeichen, wie sie auch zwischen Zellen und Organen im Inneren des Körpers ausgetauscht werden, in erlebte Zeichen, wie Körpergefühle, und deren Übersetzung in eine Sprache, formuliert das psycho-physische oder Leib-Seele-Problem der Medizin als semiotische, und semiotisch lösbare (!), Aufgabe.
6.
Signetik und Signemik
Ich habe die These aufgestellt, physikalische, chemische, thermische und ähnliche Vehikel (Signale, Reize) seien für den beobachtenden Menschen Zeichen, die ihn über die Möglichkeiten unterrichten, die beobachteten Phänomene zu „mani-pulieren“. Diese These besagt, daß wir Insider eines Zeichensystems sind, dessen Kode wahrgenommene Phänomene mit den Möglichkeiten unserer Willkürmotorik verknüpft, der also dem Kode oder, mit anderen Worten, dem Schema der sensomotorischen Zirkulärreaktionen Piagets (1937) entspricht. Dagegen sind wir Outsider der Zeichensysteme, die Nachrichten anderen Inhalts für andere Empfänger und vor allem auch für Zellen und Organe eines Organismus vermitteln. Eine analoge Situation ist den Sprachwissenschaftlern geläufig. Sie haben für die beiden Zugangsweisen zu sprachlichen Phänomenen die Begriffe Phonetik und Phonemik geprägt. Die Phonetik untersucht die physikalischen Grundlagen der Töne, z. B. die Schwingungsgröße von Luftwellen, Eigenschaften der Stimmbänder, des Trommelfells usw., die bei der Produktion und dem Empfang von Tönen eine mechanische Rolle spielen. Die Phonemik untersucht stattdessen die bedeutungsdifferenzierende Funktion der Töne (Nöth 1985, 52, 148). So ist etwa „der phonetische Unterschied zwischen [r] und [t] die Grundlage dafür, daß wir den semantischen (phonemischen) Unterschied zwischen ‘Rat’ und ‘Tat’ erkennen“. Nöth weist darauf hin, daß Phoneme phonetisch hinreichend differenziert sein müssen, wenn keine Störung der Bedeutungsdifferenzierung entstehen soll (vgl. auch Art. 17 § 5.). Die Ethnologie hat diese Unterscheidung übernommen, um Unterschiede in der Zugangsweise zu kulturellen Phänomenen zu kennzeichnen (vgl. Art. 2 § 2.). Sie versteht unter dem Begriff etisch einen Zugang, der an eine fremde Kultur von außen herantritt und an die fremden Phänomene die Kriterien der
Kultur des Beobachters anlegt. Mit emisch bezeichnet sie dagegen eine Zugangsweise, welche die Perspektiven der fremden Kultur nachzuvollziehen und sich deren Kriterien zu eigen zu machen sucht (Albers 1989). Die Wichtigkeit dieser Unterscheidung wird bei Untersuchungen, welche über die Heilkunde einer fremden Kultur Aufschluß geben sollen, beispielhaft deutlich: Solange westliche Untersucher an dem Vorurteil festhalten, ihre Medizin sei (als „die objektiv richtige Medizin“) das adäquate Kriterum zur Beurteilung der fremden Heilkunde, bleiben sie in einer etischen Haltung außen. Erst die emische Haltung erschließt ihnen die Bedeutung, welche die von ihnen beobachteten Phänomene für die Menschen der fremden Kultur haben. Die Begriffe etisch und emisch entsprechen den Definitionen, die ich im letzten Abschnitt den Begriffen außen und innen gegeben habe, um die Unterschiede zu kennzeichnen, die durch die Tatsache entstehen, daß Zeichensysteme semantische Grenzen haben. Wenn wir die Begriffe der Ethnologie in die Semiotik übernehmen und die Haltung des Beobachters von Zeichen in analoger Weise als „sign-etisch“ oder „sign-emisch“ (von signum ‘Zeichen’) kennzeichnen, können wir Unterschiede, die für die Auffassung der Natur von Zeichenprozessen von zentraler Wichtigkeit sind, mit zwei kurzen Begriffen kennzeichnen. Wir können die Haltung des Forschers, der sich für die physikalischen und chemischen Eigenschaften der Zeichen-Vehikel interessiert, als „signetische Einstellung“ bezeichnen. Die Haltung, in der wir uns bemühen, die Bedeutungen zu entschlüsseln, welche Vehikel als Zeichen für fremde Lebewesen haben, können wir dann im Unterschied dazu „signemisch“ nennen.
7.
Systemtheorie und die Begriffe Emergenz und Integration
Mit diesen Unterscheidungen sind auch Übersetzungsprobleme und mit ihnen die Fragen der Systematik angesprochen, die der Einteilung dieses Handbuches (z. B. in Artikel über Mikrosemiose (Art. 20), Endosemiose (Art. 21), usw.) zugrunde liegt. Auf die Probleme, die damit aufgeworfen sind, hat erst die Systemtheorie überzeugende Antworten vorgeschlagen. Das soll im folgenden dargestellt werden. Die Systemtheorie hat das alte Konzept der scala rerum (vgl. Art. 57 § 1. und § 2.) zu
19. Biosemiose
dem Modell einer hierarchischen Ordnung weiterentwickelt (Bertalanffy 1968), in der einfachere Systeme, z. B. Zellen, als Elemente oder Subsysteme in komplexere Systeme oder Suprasysteme, z. B. Organe, integriert sind, die dann wieder als Elemente oder Subsysteme in den Verband noch komplexerer Einheiten, z. B. Organismen, eintreten. Auf einer noch komplexeren Ebene erscheinen Organismen dann wieder als Elemente in sozialen Einheiten, wie Familien, Gruppen usw. Mit komplexeren Einheiten entstehen „Integrations-Ebenen“, auf denen Systeme einer „tieferen“ Ebene als Elemente komplexerer Systeme integriert sind (Uexküll und Wesiack 1988). Damit rückt der Begriff Integration in das Zentrum unserer Aufmerksamkeit (vgl. Art. 138 § 4.). Wir stellen fest, daß er von dem lateinischen Wort integer (‘unverletzt, heil’) stammt, für die Medizin als Heil-kunde bzw. als Wissenschaft des Heilens also von zentraler Bedeutung ist (vgl. Art. 140). Der erste, der dem Begriff mit der Formulierung: „Das Ganze ist mehr als die Summe seiner Teile“ eine klare Definition gegeben hat, war Christian von Ehrenfels (1890; vgl. Brod 1932). Dieses „Mehr“ (als die Summe der Teile) ist die Ordnung oder Struktur, durch die sich das Ganze ⫺ das System, wie wir heute sagen ⫺ von einer bloßen Addition von Einzelphänomenen unterscheidet. Dieses Mehr wird überraschend in dem spontanen und unvorhersehbaren Auftreten neuer Eigenschaften sichtbar. Man hat dieses Phänomen „Emergenz“ genannt (Sperry 1969; Medawar und Medawar 1977; Popper und Eccles 1982). Der Begriff soll die Tatsache beschreiben, daß mit dem Zusammenschluß vorher isolierter Einzelphänomene zu einem System sprunghaft (emergent) Eigenschaften und Fähigkeiten auftreten, die es auf der Ebene der Einzelphänomene nicht gibt (vgl. Art. 138). Die genauere Betrachtung der auf jeder neuen Ebene neu auftretenden Eigenschaften zeigt auch Unterschiede in der Beziehung der Systeme zu ihrer Umgebung. Diese Unterschiede sind Ausdruck ihrer verschiedenen Organisation. So haben z. B. die Systeme auf der Integrationsebene des pflanzlichen bzw. vegetativen Lebens (zu der auch die Zellen gehören) kein Nervensystem und keine Fernsinne. Sie können über Rezeptoren, die auf der Zellmembran angeordnet sind, nur mit ihrer unmittelbaren Nachbarschaft in Kontakt treten. Sie
453 haben daher, wie J. v. Uexküll (1936) betont hat, noch keine „Umwelt“, sondern nur eine „Wohnhülle“. Bei den vielzelligen Pflanzen wird die Wohnhülle von den Rezeptoren auf den Membranen ihrer Oberflächenzellen gebildet (vgl. Art. 23). Auf der Ebene des tierischen Lebens finden wir Rezeptoren, die zu Fernsinnen ausgebildet sind, Effektoren, die gezielte Eigenbewegungen und Ortsveränderungen ermöglichen, und ein Nervensystem, das die rezeptorischen und effektorischen Funktionen zu „sensomotorischen Zirkulärreaktionen“ (Piaget 1937) koordiniert. Tiere können daher die Wohnhülle, die bei ihnen von den sensiblen Zellen ihrer Haut gebildet wird, zu einer „subjektiven Umwelt“ mit einem „Merk- und Wirkraum“ erweitern (vgl. Art. 24). Ihre Umwelten umschließen ihre Körper wie feste, aber für den außenstehenden Betrachter unsichtbare Schalen (J. v. Uexküll 1920). Die an Zauberei erinnernde Neuschöpfung vorher unbekannter Erscheinungen, die der Begriff Emergenz bezeichnet, läßt sich ⫺ allerdings erst retrospektiv ⫺ rational erklären. Medawar und Medawar (1977) sprechen von „Restriktionen“, welche die Möglichkeiten der Einzelphänomene einschränken, sobald sie als „Teile“ oder „Elemente“ in den Verband eines Systems eingebunden sind. Dafür gibt es auf jeder Integrationsstufe eindrucksvolle Beispiele. So können Moleküle im Verband von Zellorganellen nur eine streng limitierte Zahl der physikalischen und chemischen Möglichkeiten verwirklichen, die sie außerhalb des Verbandes haben. Das gleiche gilt für Zellen, die im Verband eines Gewebes die Fähigkeiten der Bewegung, der Phagocytose und vor allem der Vermehrung, über die frei lebende Zellen verfügen, verlieren oder nur in sehr beschränktem Umfang realisieren können. Organe müssen ihre Funktionen und ihr Wachstum in strenger Abhängigkeit von den übrigen Organen eines Organismus ausüben, und Organismen müssen ihre individuellen Möglichkeiten zugunsten der Möglichkeiten anderer Organismen begrenzen, sobald sie mit diesen ein soziales System bilden. Jedem System (auf der Ebene der Zellen, der Gewebe, der Organe, des Organismus und der sozialen Einheiten) droht der Untergang, wenn die Restriktionen nicht eingehalten werden (vgl. Art. 21 § 3. und 4.). Die Restriktionen selbst sind Ausdruck der Tatsache, daß die Aktivitäten, über welche die Elemente verfügen, als Teilfunktionen ei-
454 nes Ganzen, nur in vorgeschriebenen Kombinationen zum Tragen kommen, sich in allen anderen Kombinationen aber gegenseitig blockieren. Greifen, Gehen oder Stehen sind Resultate einer, jeweils nach spezifischen Programmen streng geordneten Zusammenarbeit zahlreicher, einander antagonistisch blockierender und agonistisch unterstützender Muskelgruppen. Jede Abweichung von diesen Programmen führt zu mehr oder weniger schwerwiegenden Behinderungen, wie wir sie als Symptome bestimmter Krankheiten kennen (vgl. Art. 12). Die Regeln, nach denen die Elemente sich gegenseitig blockieren, erreichen die Unterordnung der Elemente unter die höhere Ordnung des Systems. Im Bereich der sozialen Systeme der menschlichen Gesellschaft müssen diese Regeln durch Gesetze geschützt werden, deren Aufzeichnung oder Kodifizierung die Ordnung über Generationen hinaus sichern soll. Der Begriff Kode bezeichnet ursprünglich eine Sammlung von Gesetzen, die Ordnung durch Restriktionen schaffen. Er ist daher auch in der Semiotik nicht nur eine trockene Angelegenheit der Grammatik. Seine ursprüngliche Bedeutung zeigt sich in Biologie und Medizin in dem Zusammenhang zwischen den Begriffen System und Integration auf der einen und der Feststellung, daß Systeme nur heil sind, wenn sie ihre Integration aufrecht erhalten, auf der anderen Seite. Damit rückt ein weiterer wichtiger Punkt in unser Gesichtsfeld: Lebende Systeme erschaffen sich selbst. Sie sind „autopoietische Systeme“ (Maturana 1982). Gesundheit ist daher „Salutogenese“ (Antonovsky 1987), d. h. der Prozeß der Assimilation benötigter Teile der Umgebung und Ausscheidung nicht mehr brauchbarer Bestandteile. Krankheit ist der Zustand, in dem Gesundheit nicht mehr „erzeugt wird“ (Weizsäcker 1986: 94 f). Damit wird einsichtig, daß Pathologie nur vordergründig mit anatomischen Strukturveränderungen und Gewebsschnitten zu tun hat. Ihr eigentliches Gebiet sind Regelverletzungen biologischer, psychischer und sozialer Kodes (vgl. Art. 140 § 2., siehe auch Art. 45, Art. 56, Art. 70 und Art. 83). Trotzdem verstehen wir die Beziehungen zwischen Element und System bzw. zwischen zwei verschiedenen Integrationsebenen nur halb, solange wir nur die Restriktionen betrachten, die das System den Elementen auferlegt, oder wenn wir feststellen, daß die Elemente die Basis, und damit die Vorbedingung
III. Arten der Semiose
für die Existenz der Systeme bilden. Naiv formuliert muß man fragen, was die Elemente davon haben, daß sie sich den Restriktionen der Systeme unterwerfen. Die Antwort fällt für das System Organismus ähnlich aus, wie für die Interessengemeinschaft einer menschlichen Gesellschaft: System und Interessengemeinschaft können Probleme lösen, die das Subsystem (Element) oder der einzelne nicht lösen können. Der Organismus erschließt seinen Organen und Zellen Ressourcen der Umgebung, die Zellen und Organen nicht zugänglich sind. Außerdem erlaubt das System den Elementen (gewissermaßen als Kompensation für die Restriktionen) eine arbeitsteilige Beschränkung ihrer Aktivitäten und damit eine Spezialisierung, ähnlich wie in menschlichen Gesellschaften durch Arbeitsteilung Berufe mit spezialisierten Tätigkeiten entstehen.
8.
Systemtheorie und Zeichenlehre
Die enge Verbindung zwischen Systemtheorie und Zeichenlehre zeigt sich, sobald wir uns die Frage stellen, wie lebende Systeme die Interaktion ihrer Elemente aufrechterhalten und wie sie ihre ständig erforderliche Ergänzung aus der Umgebung sichern. Dann stellen wir fest, daß auf jeder Integrationsebene Zeichenprozesse ablaufen, die für das geregelte Ineinandergreifen der Aktivitäten der Zellen, der Organe, der Organismen usw. sorgen. Diese Zeichenprozesse gehorchen auf jeder Integrationsebene anderen Kodes, die dort die semantischen Grenzen für innen und außen festlegen. Dadurch wird verhindert, daß Zeichen bei falschen Adressaten oder zur Unzeit Antworten auslösen, welche die Integration stören oder gefährden, und zu Krankheiten als Übersetzungsfehlern führen könnten (vgl. Art. 20 § 3.5.2. und Art. 21 § 9.). Wenn wir uns vor Augen halten, daß wir von diesen Zeichenflüssen und den Zeichensystemen, denen sie angehören, nur Kenntnis erhalten, wenn es uns gelingt, sie in die Zeichen der menschlichen Sprache zu übersetzen, verstehen wir, warum es verschiedene Wissenschaften mit ihren spezifischen Wissenschaftssprachen gibt. Physiker, Biologen, Psychologen und Soziologen beschäftigen sich mit Zeichen verschiedener Integrationsebenen. Sie müssen diese Zeichen in ihre Terminologien übersetzen, um sich mit ihren Fachkollegen verständigen zu können. Diese
19. Biosemiose
Fachkollegen sind in dem System ihrer Wissenschaftssprache Insider, für die Sprachen der anderen Wissenschaften sind sie jedoch meistens Outsider. Wissenschaftler haben daher die Schwierigkeit, Inhalte ihrer Sprache in die einer anderen Wissenschaft zu übersetzen (vgl. Art. 174). Diese Schwierigkeit steht in einem eklatanten Gegensatz zu der erstaunlichen Leichtigkeit, mit der in der Natur solche Übersetzungen ablaufen. Wir können immer wieder feststellen, daß Zeichen von der Ebene der Zellen Aufwärts-Effekte auf den Ebenen der Organe, des Organismus bis hinauf zu den Ebenen sozialer Systeme haben und daß umgekehrt Zeichenprozesse von einer Ebene sozialer Systeme, z. B. einer Familie oder einer Arbeitsgruppe, Abwärts-Effekte auf den Ebenen des Organismus, der Organe und ihrer Zellen haben. Auch diese Übersetzungen sind lebenswichtig für die Salutogenese des Gesamtsystems. Hier können Übersetzungsfehler besonders leicht zu Krankheiten führen. Ein Modell, das solche „somato-psychosozialen Aufwärts-Effekte“ und die gegenläufigen „sozio-psycho-somatischen AbwärtsEffekte“ beschreiben kann, faßt Übersetzungen als „Bedeutungs-Koppelungen“ auf. Dieser Begriff entspricht dem Freudschen Konzept der „Überbesetzung“, das er zur Erklärung der Sprachentwicklung eingeführt hat (Loewald 1986). Das Modell selbst kann sich auf die bekannten Beobachtungen Pawlows stützen, daß in bestimmten Situationen Bedeutungskoppelungen zwischen physiologischen und psychischen Vorgängen in Form von „Konditionierungen“ zustande kommen (Th. v. Uexküll 1984 b). Damit stellt sich die Aufgabe zu untersuchen, ob und wieweit die Zeichen höherer Integrationsebenen bereits Integrationsprodukte sind, in denen Zeichen einfacherer Integrationsebenen komplexere Einheiten bilden. Dafür spricht die Feststellung, daß endosemiotische Zeichenträger, vor allem Hormone und die an den Verbindungsstellen der Nerven gebildeten Transmitter, die als Stoffe der Reizübertragung wichtige Aufgaben im Nachrichtenaustausch zwischen Zellen und Organen haben, auch im Verlauf einer sprachlichen Interaktion zwischen Menschen produziert werden. Weiter spricht dafür, daß diese Stoffe wiederum die gleiche chemische Struktur haben wie von Pflanzen erzeugte Stoffe. Die biochemischen Grundlagen der Zellkommunikation stammen nach
455 neuesten Forschungen aus einer Frühzeit der Erdgeschichte, in der die einzelligen Vorfahren der Pilze, Pflanzen, Tiere und Menschen die Möglichkeit entdeckten, Vehikel für Zeichenprozesse zu produzieren (Roth und LeRoith 1987). Die Ergebnisse der theoretischen Überlegungen zu der Situation des Forschers, der biosemiotische Zeichenprozesse beobachten und beschreiben will, seien wie folgt zusammengefaßt: (1) Mit dem Wegfall der „Sachen, die für sich selbst existieren“ als Objekte für Zeichenprozesse und als Maßstab für die Wahrheit von Aussagen ist das Problem der Verifizierung (und Falsifizierung) wissenschaftlicher Aussagen ⫺ und damit auch biosemiotischer Interpretationen ⫺ in eine kritische Situation geraten. (2) Die Lösung, welche die Zeichentheorie anbietet, ist das semiotische Kriterium der Selbstreferenz. Es geht von der Feststellung aus, daß lebende Systeme autopoietische, d. h. sich selbst aufbauende und erhaltende Systeme sind, die permanent Teile ihrer Umgebung auswählen, dem Bestand ihres Systems einverleiben (⫽ assimilieren) und nicht mehr brauchbare Teile ausscheiden. Auswahl und Assimilation der benötigten Umgebungselemente lassen sich als Zeichenprozesse beschreiben, deren Interpretanten den biologischen Bedürfnissen der lebenden Systeme entsprechen. Die Interpretanten lassen sich als Sollwerte auffassen, die sich (wie die Transferfunktion nicht-trivialer Maschinen) von Aktion zu Aktion ändern. Das Kriterium für die Richtigkeit der Interpretation, die der Zeichenprozeß beschreibt, ist die geglückte Assimilation. Eine „geglückte Assimilation“ entspricht entweder einer Bedeutungsverwertung, welche die Bedeutungserteilung (durch Veränderung des Sollwertes) aufhebt, z. B. wenn Speisen bei Sättigung ihre „Nahrungsbedeutung“ einbüßen; oder einer Bedeutungsverwertung, welche der Bedeutungserteilung (durch Einverleibung) das Vehikel entzieht, z. B. wenn die Speise verzehrt ist. Im ersten Fall, der Sättigung, wird das Merkzeichen durch das Wirkzeichen „subjektiv“ gelöscht. Im zweiten Fall, dem Verzehren der Nahrung, kommt es zu einer „objektiven“ Löschung des Merkzeichens (J. v. Uexküll und Kriszat 1936; vgl. auch Mead und Morris, Art. 113). (3) Das Modell für eine biosemiotische Analyse muß das vollständige Muster des Be-
456 obachtungs- und Interpretationsvorgangs vor Augen haben, das aus folgenden fünf Teilaspekten besteht: (i) einem Interpreten (dem beobachteten lebenden System; im endosemiotischen Bereich: eine Zelle, ein Gewebsverband oder ein Organ); (ii) seinem Interpretanten (dem Rezeptor bzw. dessen Gestimmtsein für ein spezifisches biologisches Bedürfnis); (iii) seinem Interpretandum (der Veränderung des Rezeptors, die zum Zeichen kodiert bzw. der eine Bedeutung erteilt wird); (iv) seinem Interpretatum (der Gegenleistung der Umgebung zu dem Gebrauchsoder Signal-Verhalten [Tembrock 1975] des Effektors, dem die Bedeutungsverwertung obliegt); und schließlich (v) dem Meta-Interpreten (dem menschlichen Beobachter, dessen signetische und signemische Deutung [⫽ Semiose der Information und Semiose der Symptomatisation], als Übersetzungen in die menschliche Sprache, hinter dem Resultat der Beobachtung stehen). Aus diesen Anteilen besteht das Modell (vgl. Art. 5), mit dessen Hilfe Zeichenprozesse als Interpretationen lebender Systeme beschrieben werden können, welche Einwirkungen ihrer Umgebung zu den Zeichen kodieren, die ihr Verhalten bei der Assimilation lebenswichtiger Teile dieser Umgebung oder in der Interaktion mit anderen lebenden Systemen dirigieren.
10. Literatur (in Auswahl) Albers, L. (1989), Das kulturgebundene Syndrom Naeng. Diss. Heidelberg. Antonovsky, A. (1987), „The Salutogenetic Perspective: Toward a New View of Health and Illness“. Advances 4: 47⫺55. Bertalanffy, L. v. (1968), General Systems Theory. New York: Braziller. Böttner, M. (1980), Zeichensysteme der Tiere. Ein Versuch angewandter Semiotik. Diss. Stuttgart.
III. Arten der Semiose Eco, U. (1972), Einführung in die Semiotik. München: Fink. Ehrenfels, C. (1890), „Über ‘Gestaltqualitäten’ “. Vierteljahresschrift für wissenschaftliche Philosophie 14: 242⫺292. Förster, H. v. (1988), „Das Konstruieren einer Wirklichkeit“. Zitiert in L. Segal, Das 18. Kamel. München und Zürich: Piper. Loewald, H. W. (1986), Psychoanalyse. Aufsätze aus den Jahren 1951⫺1979. Stuttgart: Klett-Cotta. Maturana, H. R. (1970), The Biology of Cognition. Urbana IL: University of Illinois, Biological Control Laboratory. Maturana, H. R. (1982), „Die Organisation des Lebendigen“. In: H. R. Maturana, Erkennen: Die Organisation und Verkörperung von Wirklichkeit, Wissenschaft und Philosophie. Braunschweig und Wiesbaden: Vieweg. Mead, H. G. (1968), Geist, Identität und Gesellschaft aus der Sicht des Sozialbehaviorismus. Frankfurt a. M.: Suhrkamp. Medawar, P. B. und I. S. Medawar (1977), The Life Science. New York, Hagerstown, San Francisco und London: Harper & Row. Nöth, W. (1985), Handbuch der Semiotik. Stuttgart: Metzler. Piaget, J. (1937), „Der Aufbau der Wirklichkeit beim Kinde“. In: Gesammelte Werke, Bd. II. Stuttgart: Klett 1975. Popper, K. R. und J. C. Eccles (1977), The Self and Its Brain: An Argument for Interactionism. Berlin, New York und London: Springer. Deutsch: Das Ich und sein Gehirn. München und Zürich: Piper. Roth, J. und D. LeRoith (1987), „Chemical Cross Talk. Why Human Cells Understand the Molecular Messages of Plants“. The Sciences 27,3: 50⫺54. Sebeok, Th. A. (1976), Contribution to a Doctrine of Signs. Bloomington: Indiana University Press und Lisse: Peter de Ridder Press. Sebeok Th. A. (1979), Theorie und Geschichte der Semiotik. Reinbek: Rowohlt. Spaemann, R. und R. Löw (1981), Die Frage Wozu? Geschichte und Wiederentdeckung des teleologischen Denkens. München: Piper. Sperry, R. W. (1969), „A Modified Concept of Consciousness“. Psychological Review 76: 532⫺ 536. Tembrock, G. (1975), Biokommunikation. Reinbek: Rowohlt.
Bohr, N. (1931), Atomtheorie und Naturbeschreibung I. Berlin: Springer. Englisch: Atomic Theory and Description of Nature. Cambridge MA: Harvard University Press.
Uexküll, J. v. (1920), Theoretische Biologie. Berlin: Paetel.
Bohr, N. (1958), Atomphysik und menschliche Erkenntnis I. Braunschweig: Vieweg.
Uexküll, J. v. (1940), „Bedeutungslehre“. Bios 10. Leipzig.
Brod, S. M. (1932), „Christian von Ehrenfels zum Gedenken“. Kant-Studien 37: 313.
Uexküll, J. v. und G. Kriszat (1936), Streifzüge durch die Umwelten von Tieren und Menschen. Ber-
20. Microsemiosis lin: Springer. Neudruck Frankfurt a. M.: Fischer 1970. Uexküll, Th. v. (1984 a), „Symptome als Zeichen für Zustände in lebenden Systemen“. Zeitschrift für Semiotik 6: 27⫺36. Uexküll, Th. v. (1984 b), „Was heißt Psychosomatik?“ Schweizerische Medizinische Wochenschrift 114: 1806⫺1809.
457 Uexküll, Th. v. und W. Wesiack (1988), Theorie der Humanmedizin. München und Wien: Urban und Schwarzenberg. Weizsäcker, V. v. (1986), „Soziale Krankheit, soziale Gesundung“. In: Gesammelte Werke, 8. Frankfurt a. M.: Suhrkamp.
Thure von Uexküll, Freiburg (Deutschland)
20. Microsemiosis ⫺ origins and properties: a survey Macroevolution vs. microevolution Monod’s view of life: dynamics Von Neumann’s view of life: information 1.4. Information vs. dynamics 1.5. The cell as irreducible, minimal unit of life 1.6. The central dogma of biology Microsemiosis What is significant to a cell? 3.1. Signs 3.2. Sign-events 3.3. Signals and information 3.4. Significance 3.5. Parsing a chemical field for significance Accuracy in the molecular processes of microsemiosis 4.1. Proofreading for errors 4.2. Lethal vs. creative errors Position as context Contextualism and microsemiosis 6.1. Root metaphors of Western philosophy 6.2. Context as operator Selected references
1. Life 1.1. 1.2. 1.3.
2. 3.
4.
5. 6.
7.
1. Life ⫺ origins and properties: a survey Microsemiosis begins and ends with the selforganizing living cell. According to present estimates, the Cosmos is 10⫺20 ⫻ 109 years old and the Earth is approximately 4.6 ⫻ 109 years old. The earliest life forms as complete cells so far found are fossils in rocks about 3.6 ⫻ 109 years old. ⫺ Self-organizing systems perplex because of their goal-directed behavior (Yates 1987). Such systems derive their apparent intentionality from random variation (including sudden fluctuations), natural selection and descent with modification. These are extraordinarily powerful shaping processes whose creative capacities are manifested by the diversity of the lithosphere, hydrosphere, atmosphere and biosphere, i. e., the surface of the Earth.
Note: In the following discussion, certain words such as creative, know, memory, lapsus linguae, information, decides, error, may appear set off by quotation marks. This convention will make explicit any unjustified anthropomorphisms, and warn readers that each term carries a vitalistic, theory-laden burden our science is obligated to remove when it can. Dennett (1978: 12) exposed this difficulty forthrightly: “Any time a theory builder proposes to call any event, state, structure, etc., in any system (say the brain of an organism) a signal or message or command or otherwise endows it with content, he takes out a loan of intelligence […]. This loan must be repaid eventually by finding and analyzing away these readers or comprehenders; for, failing this, the theory will have among its elements unanalyzed manalogues endowed with enough intelligence to read the signals, etc., and thus the theory will postpone answering the major question: what makes for intelligence?” Until we can eliminate the manalogues by reductionistic science, we are dependent on metaphor and metascience. (It does not help that quantum mechanics, in some interpretations, keeps injecting the human observer into the scheme.) Here I try to be as open and honest as I can by signaling to the reader through quotation marks that I have taken out a “loan of intelligence” for the cells as actors in a semiotic drama.
1.1. Macroevolution vs. microevolution The relative importance of microphenomena such as point mutations in genetic molecules (Desoxyribonucleic acid, DNA), as opposed to macroevolutionary processes such as global changes in climate has not been settled. No current microevolutionary hypothesis entails any particular macroevolutionary theory. 1.2. Monod’s view of life: dynamics Jacques Monod claimed that living systems have three defining properties: teleonomy (goal-directed behavior), autonomous morphogenesis, and reproductive invariance
458 (Monod 1971). Each of these properties is functional or dynamic, involving motion and change. However, a purely behavioral definition of life is vitiated by the fact that many forms of life have little behavior. 1.3. Von Neumann’s view of life: information The information-theoretic approach treats life as an example of self-reproducing automata of the von Neumann type (von Neumann 1966; Poundstone 1985). Six postulates support this construct: (a) A living system encapsulates a complete description of itself. (b) It avoids the paradox seemingly inherent in (a) by not trying to include a description of the description in the description. (c) Instead, the description serves a dual role. It is a coded description of the rest of the system. At the same time, it is a sort of working model (which need not be decoded) of itself. (d) Part of the system, a supervisory unit, “knows” about the dual role of the description and makes sure that the description is interpreted both ways during reproduction. (e) Another part of the system, a universal constructor, can build any of a large class of objects ⫺ including the living system itself ⫺ provided that it is given the proper directions. (f) Reproduction occurs when the supervisory unit instructs the universal constructor to build a new copy of the system, including a description. 1.4. Information vs. dynamics The tension between the dynamical and the informational views of life (Yates 1985) has been considered by Pattee, who sees them as complementarities (Pattee 1977; 1987). Because complementarity is not contradiction, but incompatibility and conflict, neither complementary model of a given phenomenon is complete (Blackburn 1971). Not all biologists accept this dualistic position; some are monists who argue that “information” is not a technical term in either physics or chemistry, though clearly it is in some engineering sciences. To these monists the problem is to provide a consistent and rational account of the spontaneous creation of information systems out of physical chemical dynamics without the intervention of a deus ex machina (Yates 1987). 1.5. The cell as irreducible, minimal unit of life By either the dynamic or informational definition of life, molecular particles, no matter how elaborate, are inanimate. Some primitive
III. Arten der Semiose
protein-nucleic acid packages (viruses) or proteinacious particles (prions) seem intensely intentional as they parasitize cells and take command of cellular metabolic processes, but they are structure without process. The living cell, in contrast, is a tangle of transports and transformations, a skein of syntheses and degradations. 1.6. The central dogma of biology The doctrine of biology (cf. Art. 138) makes the following claims regarding the cell as the minimal living unit: all cells come from cells (with the exceptional emergence of the first cell from the nonliving, prebiotic chemistry of heterogeneous phases); life is an historical process storing its past in DNA; command and control lie, in part, in informational macromolecules of the gene (DNA); cellular dynamics are executed by proteins (enzymes); the structure of both dynamic (enzymatic) proteins and structural proteins is mapped from structural patterns stored in nucleic acids; all cells have a membrane boundary with both passive and active properties separating, but not isolating, cellular constituents and processes from those of the external environment; the information content of the genome can be changed by random physical or chemical fluctuations, or experimentally by systematic selection or biochemical interventions; many, if not most spontaneous genetic mutations are initially neutral (neither improving nor degrading viability), but all must pass the test of compatibility with the antecedent cellular structures and functions (that is, the first selection is internal). The background of modern molecular biology can be found in books by Stryer (1988); Watson et al. (1987); Watson, Tooze, and Kurtz (1983); Darnell, Lodish, and Baltimore (1986).
2.
Microsemiosis
Microsemiosis addresses all those sign processes arising in complex cell operations (e. g., cell division, movement, secretion, metabolism, maintenance, growth, repair) even including temporary, reversible suspension of most, or all life processes (encystation, dehydration, freezing). It does not address communication between cells or among cell complexes (endosemiosis; see Art. 21). Though restricted in scope, microsemiosis engages great complexity. Simple explanatory
459
20. Microsemiosis
systems can offer a single, universal, overarching description, such as those postulated for ideal physical, mechanical systems in the Newtonian paradigm. Complexity, in contrast, depends on the modes of interaction (observation) with the system available to us. A complex system is one that cannot be comprehensively described as a whole, but which admits a multiplicity of partial descriptions. If we can interact with a system only in a few ways, it will look simple to us; if we can interact with it in many distinct ways, it will be complex (Rosen 1987). A single cell is complex.
3.
What is significant to a cell?
3.1. Signs A sign at its most primitive, for a single cell, is a physical or chemical entity, external or internal with respect to the organism as reference frame. The entity must possess level, magnitude or intensity of one or more simple properties. (For example, the concentration of a chemical can influence the shape and motion of a cell, as discussed in § 3.5.2.) 3.2. Sign-events Sign-events are changes in magnitudes of signs. The change may be all-or-none, or graded. Sign-events include rates-of-change of magnitudes, and may invoke rate-sensitive responses (Clynes 1961). (For example, the rate at which human blood pressure falls determines whether or not compensatory reactions will be turned on. How fast, rather than how far, is the sign-event.) They also may take the form of amplitude or even frequency modulation. (The frequency with which the brain releases pulses of certain releasing factors to the pituitary gland ultimately influences ovulation and other reproductive functions.) 3.3. Signals and information I use the term “signal” to designate an “informational” sign or sign-event, one with actual or potential significance to a cell (cf. the use of the term “sign” in Art 4 § 1.). If a magnitude or pattern is steady, either as a static level or a steady, repetitious oscillation, it lacks novelty and therefore possesses no information content (if there could be no other value or pattern). The concept of information necessarily includes the notion of surprise (things might have been different), or of sin-
gularity (a unique value in the set of possible values). A politician repeating his familiar stand on a social issue (e. g., “no new taxes”) conveys little information. But if he later proposes a new tax (surprise!), the information content is high. 3.4. Significance A signal is significant to a cell (which is a dynamic system) because it provokes a change in states or rates, or evokes memories; that is, it exposes previously masked stored information, as in genetic expression. (A cell that has no receptors for the female sex hormone molecule estradiol finds no significance in changes in estradiol levels. In contrast, cells of the uterine lining react to such changes. For them, there is significance.) 3.4.1. Dynamic systems In engineering, a dynamic system is a system open to matter, energy or information as inputs, to which it responds by changing its state in a lawful manner. Such lawful behavior is generically described by the relation: •
(1) X ⫽ f (X, m, pi) i ⫽ 1, …, n where X is the configuration or state vector of the system at the present moment, given by the magnitudes of all the state variables (independent degrees of freedom) that deter• mine the system; X is the rate of change of state; m is the set of (control) signals coupled to or detected by the system; pi is the set of parameters particularizing the dynamical laws (f) of the system by specifying the constraints. (This is a continuum mathematics view; there is a similar discrete mathematical view with slightly different notation.) 3.4.2. Shape as signal The scheme of equation (1) can be used as a framework to account for responses of cells to external signals, but it disappoints when it comes to accounting for certain remarkable capacities of some cells to “know” their own shape and determine, accordingly, whether or not to replicate and divide (Folkman and Greenspan 1975). The signal is a geometric change in surface area. The information about shape is conveyed to the genome by microfilaments and microtubules, internal molecular structures also responsible for cellular movements (see Darnell, Lodish, and Baltimore 1986, 815 ff).
460 3.4.3. Singularity as signal The above formula also fails to account for another remarkable capacity of some cells ⫺ that of parsing chemical fields for singularities. Singularities in chemical fields provide significant environmental features for some single-celled or multicellular creatures (Yates and Kugler 1984). Chemotaxis by the singlecelled organism Escherichia coli offers an example. (For details see Berg 1975; Adler 1976.) 3.5.
Parsing a chemical field for significance 3.5.1. Intentionality of E. coli A very difficult problem for reductionistic sciences is seeming intentionality or goaldirectedness in whatever we are observing. Even inanimate processes can seem intentional to us. For example, dropped objects seem to “want” to “embrace” the earth, falling by their gravity; balloons “want” to join the sky, rising by their levity ⫺ and these anthropomorphic views are intellectually sterile. Reductionistic science has explained them away. But, what about squirrels storing nuts to eat during the following winter? What about us ⫺ planning a house, a career, a trip …? In the following, I examine “intentionality” at the single cell level, remembering all the while Dennett’s caveat cited in § 1., above (see also Art. 19 § 2.). The single-celled bacterium E. coli has multiple flagellae (hairlike extensions) that it can rotate clockwise or counterclockwise. When the flagellae rotate clockwise, they fly apart and cause the tiny organism to tumble. When they rotate counterclockwise, they are drawn together into a single bundle which acts as a propeller to produce smooth, directed swimming. The organism explores a chemical field for nutrients by alternating between tumbling and directed swimming until it finds the singularly appropriate concentration of a chemical attractant, such as sugar or an amino acid, optimal for its replication. In doing so, it takes advantage of a memory lasting approximately 4 secs, allowing it to compare where it was with where it is over short times and distances. On that basis it “decides” whether to tumble (stay in place) or swim and make another comparison elsewhere. It is remarkable that this seemingly intelligent behavior on the part of a single cell will occur even if its single chromosome (genetic material in its genome) has been removed.
III. Arten der Semiose
It may be wondered why a significant event provoking a change in states or rates of cells differs from any other, more traditional causal process. The difference lies in the fact that traditional, classical physics assumes close connections by forces between causal inputs and their provoked outputs. However, living systems don’t act that way. They operate as systems whose degrees of freedom and interactions are mostly internal and whose responses are dominated by action (energy ⫻ time) rather than by momentum (mass ⫻ velocity) or external forces (mass ⫻ acceleration). As a result, living systems seem slow and “soft” in the sense of being characterized by transports and transformations only loosely coupled, with greatly delayed internal processing. The transformations are weak exchanges of chemical bonds of no more than a few electron volts per exchange. Given the soft couplings, it becomes difficult to ascribe sharply defined output behaviors (responses) to any particular set of inputs, present or past (stimuli). To the observer accustomed to the classical physical idea of close connections by forces between causal inputs and their provoked outputs, these nonclassical dynamic properties seem startling. Furthermore, energetically trivial inputs can cause enormous changes in throughput of resources. The wink of a woman across a room can start a war. We must draw upon a metaphysics or metabiology, invoking such concepts as information, message, signal, sign process, and context, to describe the responses of such complex systems. There is necessarily a semiosic or informational element in our description and analysis. 3.5.2. Microbial interpretation of chemical fields: the slime mold Tomkins (1975) pointed out that single-celled organisms, such as the free-swimming amoebic form of the slime mold Dictyostelium, operate in a very functional manner that can be thought of as an interpretation of chemical changes in their environment. He introduced the concept that there is a “metabolic code” influential at a higher hierarchical level than the genetic code. In the metabolic code, the “second messenger” chemical adenosine 3',5'monophosphate (also known as cyclic AMP or cAMP), may be a symbol for a state of carbohydrate fuel shortage. Extending his idea I have suggested that there may be at least ten levels of languages, including codes
461
20. Microsemiosis
and symbols, in multicellular organisms (Yates 1979; cf. Art. 19 § 8.). The behavior of the single-celled amoeba form of the slime mold lies at the border between microsemiosis and endosemiosis. As single-celled amoebae, these organisms are emblematic of microsemiotic processes as they parse their chemical fields and react to them, but what can happen next has an endosemiotic character ⫺ a new chemical field of cAMP is created by secretion of this chemical from the single-celled organisms. This new external chemical field has both spatial and temporal periodicities and inhomogeneities (see Fig. 20.1), and as the field is created the
individual cell models of this extraordinary property of the conversion of a population of single organisms into a single, larger organism, have been advanced (see Garfinkel 1987 for discussion). In summary, each amoeba in a worsening, food-depleted environment microsemiotically parses its chemical field and interprets its findings through the symbol cAMP in a manner that leads to a decision to broadcast to its neighbors (endosemiosis) a message that says, in effect, “To avoid deathly fate, aggregate!” Directed single-cell movements, provoked and guided by spatial and temporal variations, then lead to the extraordinary creation of the new organism ⫺ the slime mold. That organism later replicates DNA with great accuracy, generating fruiting-bodies as differentiated structures that deposit sealed-off packages of suspended-life forms that will, when conditions improve, again become a population of single cells, free-swimming and living independently, feeding on sources of carbon (cf. Art. 22 § 3.2.2.).
4.
Fig. 20.1: The distribution of cAMP in fields of aggregating amoebae of Dictyostelium discoideum revealed by an isotope dilution-fluorgraphic technique. cAMP acts as a symbol for the amoebae, and it organizes a chemical field into patterns of spiral or concentric circular waves centered on the foci of aggregation of its amoebae into a new, single organism, the slime mold. The shapes of the separate aggregating amoebae are dependent on location in the pattern of cAMP. In the organization of this chemical field, and the response of the amoebae to it, periodic dynamic signals provide an informational context. Calibration bar: 1 cm (reproduced with permission from Tomchik and Devreotes 1981; copyright 1981 by the American Association for the Advancement of Science).
individual amoebae aggregate, fuse and become a single, new multinucleated organism in which the identities of the amoebae are lost. During aggregation, the individual amoebae change their characteristic emission of cAMP from a steady low-level output to one consisting of periodic pulses of 2-second duration (“on”) and a regular “off” interval of about 300 seconds. Field models as well as
Accuracy in the molecular processes of microsemiosis
4.1. Proofreading for errors How does carbon chemistry support the concept of error and its correction? The modern answer to that question can be found in the book by Kirkwood, Rosenberger and Galas (1986). Some high points are given below. There are two information transfer processes centered on molecular DNA: replication of DNA into a complementary strand of DNA and transcription of DNA into messenger RNA (mRNA) ultimately leading to proteins. In the more accurate of the operations, the replication of DNA, the error rate is about one mistake in 108 base-pairing trials. Simple equilibrium calculations based on ordinary chemical considerations indicate that the reactions should lead to a chemical mix much more diverse than is actually observed in cells. There must be some “proofreading” mechanism. On a chemical basis alone, the discrimination between the amino acids isoleucine and valine provided by the interaction-free energies of substrate molecules falls far short of the discrimination actually seen in cells. This fact shows that although molecular recognition provides the starting point for discrimination, the achievement of the astonishing
462
III. Arten der Semiose
levels of accuracy seen in living cells appears to reside in some complex kinetic processes (Hopfield 1974; Gue´ron 1978). The proofreading features are both syntactic and semantic. 4.2. Lethal vs. creative errors A genetic point error (at the level of single atoms or molecules) can be thought of as a misspelled word or lapsus linguae. At that level only syntactics is involved. However, syntactic changes are interpreted in the context of the historically evolved structures and functions of the rest of the cell in which the “error” has occurred. According to context, the deformed lexical unit may be (rarely) executed as a lethal command; more likely, it is accepted as a (then neutral) lapse, a solecism to be politely overlooked. Those neutral solecisms may in later (evolutionary) times and contexts become the basis of new acceptance and usage, just as the English word nice has evolved from the Latin nescius (‘ignorant’) through Middle English (‘foolish, wanton’), through ‘dissolute’, ‘coy’, ‘reticent’, to ‘fastidious’, ‘finicky’, ‘particular’, ‘exacting’, ‘punctilious’, on to ‘well-executed’, ‘pleasing’ and ‘agreeable’ or ‘most appropriate’ (still leaving a whiff of its old bad odor as in “a nice one to talk”). Finally, there is the possibility that a point error will immediately pass selection by the preexisting structures and functions of the cell in which it occurred, and introduce a dynamical change perpetuated thereafter as the cell reproduces, giving it some competitive advantage that leads ultimately to its domination of its ecological niche. The preexisting structures and functions provide an internal context in which a point mutation (syntactic error) takes on its meaning. But context can also depend on external factors such as position or location (concerning principles of code change, cf. Art. 17).
5.
Position as context
A striking feature of highly developed organisms is that they contain many cells with identical genomes, but strikingly different phenotypes (manifested structures and functions). Different cells express different fractions of their total genetic information, but genetic information alone cannot control their differentiation. In almost all multicellular organisms the position of a cell in the
early embryo also determines its differentiation. (See Edelman 1988 for further discussion and references.) One explanation given is that an (informational) external chemical pattern is set up in the early embryo, by its own actions, which can somehow control gene expression. Again we observe single cells parsing a chemical field to find out where they are (and who they are to be). Location provides context as an operator.
6.
Contextualism and microsemiosis
6.1. Root metaphors of Western philosophy In 1942 Pepper suggested that each grand explanatory scheme of Western philosophy rests on a root metaphor from a set of four such metaphors. I list each of them below giving its names/root metaphor/type: (1) formism (platonic idealism)/similarity/analytic (with inadequate precision), (2) mechanism (naturalism, materialism, realism)/machine/analytic (with inadequate scope), (3) contextualism (pragmatism)/acts in a context (the historical event)/synthetic (with inadequate precision), (4) organicism (absolute or objective idealism)/integration as process, organic whole/ synthetic (with inadequate scope). Different branches of knowledge tend to emphasize one of the metaphors over the others; viz. reductionistic science depends heavily on mechanism; mathematics invokes formism; physiological sciences use organicism; psychological sciences require contextualism. 6.2. Context as operator Individual living cells, presumably arising from a prebiotic, simpler terrestrial chemistry, and persevering through vicissitudes in the atmosphere, hydrosphere, lithosphere and neighboring biosphere, survived, multiplied, evolved, diversified and prospered because they created microsemiosis out of quantum-chemical matter, thus becoming symbol-matter systems (Pattee 1982). Assuming that life originated on Earth and was not brought to it from elsewhere, we may wonder at what point in the evolution of the biosphere, between primitive, replicating macromolecules (probably ribonucleic acid, RNA, which can act both in an informational and
20. Microsemiosis
a dynamical sense) and the emergence of a complete, living cell (such as the blue-green algae, thought to be at least 3.2 ⫻ 109 years old as an evolutionary line) did microsemiosis begin? It is easy to guess the answer to that question: Microsemiosis began when prebiotic chemistry became walled off by a membrane boundary so that it had an external environment, and an internal milieu protected to some extent from vicissitudes in the external environment by internal active processes and those in the membrane. At the moment of appearance of a packaged cell bounded by a bimolecular lipid membrane having protein inserts, microsemiosis began. The cellular system, once bounded, required small-signal informational fluxes across its boundary to adjust internal dynamics gently in a manner adaptive and protective so that the cell could survive the “slings and arrows of outrageous fortune” perturbing it from outside. By that reckoning, microsemiosis began about 3.2 ⫻ 109 years ago. The study of cell biology from a microsemiotic perspective stands to enrich biological explanations. It provides a necessary step on the path from chemistry to consciousness through context as an operator. In natural language we require all four root metaphors to describe cellular achievements.
7.
Selected references
Adler, Julius (1976), “The Sensing of Chemicals by Bacteria”, Scientific American 234: 40⫺47. Berg, Howard (1975), “How Bacteria Swim”, Scientific American 233: 36⫺44. Blackburn, Thomas R. (1971), “Sensuous-Intellectual Complementarity in Science”, Science 173: 1003⫺1007. Clynes, Manfred (1961), “Unidirectional Rate Sensitivity: A Biocybernetic Law of Reflex and Numeral Systems as Physiologic Channels of Control and Communication”, Annals of the New York Academy of Sciences 92: 946⫺969. Darnell, James, Harvey Lodish, and David Baltimore (1986), Molecular Cell Biology (Scientific American Books). New York: W. H. Freeman. Dennett, Daniel C. (1978), Brainstorms. Montgomery, Vermont: Bradford. Edelman, Gerald M. (1988), Topobiology: An Introduction to Molecular Embryology. New York: Bose. Folkman, Judah and H. P. Greenspan (1975), “Influence of Geometry on Control of Cell Growth”, Biochemica et biophysica Acta 417: 211. Garfinkel, Alan (1987), “The Slime Mold Dictyostelium as a Model of Self-Organization in Social
463 Systems”. In: F. E. Yates (ed.), Self-Organizing Systems: The Emergence of Order. New York: Plenum Press: 181⫺212. Gue´ron, Maurice (1978), “Enhanced Selectivity of Enzymes by Kinetic Proofreading”, American Scientist 66: 202⫺208. Hopfield, John J. (1974), “Kinetic Proofreading: A New Mechanism for Reducing Errors in Biosynthetic Processes Requiring High Specificity”, Proceedings of the National Academy of Sciences USA 71: 4135⫺4139. Kirkwood, T. B. L., R. F. Rosenberger, and D. J. Galas (1986), Accuracy in Molecular Processes: Its Control and Relevance to Living Systems. London and New York: Chapman and Hall. Monod, Jacques (1971), Chance and Necessity: An Essay on the Natural Philosophy of Modern Biology (transl. from the French by Austryn Wainhouse). New York: Knopf. Pattee, Howard H. (1977), “Dynamic and Linguistic Modes of Complex Systems”, International Journal of General Systems 3: 259⫺266. Pattee, Howard H. (1982), “Cell Psychology: An Evolutionary Approach to the Symbol-Matter Problem”, Cognition and Brain Theory 5: 325⫺341. Pattee, Howard H. (1987), “Instabilities and Information in Biological Self-Organization”. In: F. E. Yates (ed.), Self-Organizing Systems: The Emergence of Order. New York: Plenum Press: 325⫺338. Pepper, Stephen C. (1942), World Hypotheses. Berkeley: University of California Press. Poundstone, William (1985), The Recursive Universe: Cosmic Complexity and the Limits of Scientific Knowledge. New York: William Morrow. Rosen, Robert (1987), “On Complex Systems”, European Journal of Operational Research 30: 129⫺134. Stryer, Lubert (1988), Biochemistry. 3rd ed. New York: Freeman. Tomchik, K. J. and P. N. Devreotes (1981), “Adenosine 3'5'-Monophospate Waves in Dictyostelium discoideum: Demonstration by Isotope Dilution Fluorography”, Science 212: 443⫺446. Tomkins, Gordon M. (1975), “The Metabolic Code”, Science 189: 760⫺763. von Neumann, John (with A. W. Burks) (1966), Theory of Self-Reproducing Automata. Urbana: University of Illinois Press. Watson, James D., John Tooze, and David T. Kurtz (1983), Recombinant DNA: A Short Course. New York: Freeman. Watson, James D., Nancy H. Hopkins, Jeffrey W. Roberts, John A. Steitz, and Alan Weiner (1987), Molecular Biology of the Gene. 4th ed., vols. I and II. Menlo Park, Calif.: Benjamin and Cummings.
464
III. Arten der Semiose
Yates, F. E. (1979), “Integrative Pharmacology ⫺ Beyond Structure-Activity Relationships into Pharmacolinguistics”, American Journal of Physiology: Regulatory, Integrative and Comparative Physiology 6: R 251⫺R 253. Yates, F. E. (1985), “Semiotics as Bridge between Information (Biology) and Dynamics (Physics)”, Recherches Se´miotiques/Semiotic Inquiry 5: 347⫺ 360.
Yates,F. E. (ed.) (1987), Self-Organizing Systems: The Emergence of Order. New York: Plenum Press. Yates, F. E. and Peter N. Kugler (1984), “Signs, Singularities and Significance: A Physical Model for Semiotics”, Semiotica 52: 49⫺77. F. Eugene Yates, Los Angeles CA (USA)
21. Endosemiose 1. Vorbemerkung 2. Der Bedarf nach einer endosemiotischen Anatomie 3. Der Körper als Netz aus Semiosen 3.1. Semiosen als Stränge eines Netzes, das Problem ihrer Dynamik und die Frage nach dem endosemiotischen Selbst 3.2. Das Körper-Selbst und der Körper als Werkzeug des Lebens: die Kode-Dualität 3.3. Ein Beispiel für eine endosemiotische „Ganzheit, die nach Vollendung trachtet“ 4. Die Integrationsebenen einer semiotischen Anatomie 4.1. Das Problem der Kriterien für Integration 4.2. Vier endosemiotische Integrationsebenen ⫺ ein Versuch 5. Das Prinzip der Selbstorganisation: das Atemzentrum als Beispiel für die Entstehung eines integrierten Kodes 6. Die Gegenwelt des Nervensystems und die Einheit von Wahrnehmen und Bewegen 7. Die Gegenwelt des Immunsystems: Erkennen, Gedächtnis, Selbst, Nicht-Selbst als biologische Funktionen 7.1. Die neue Terminologie und die Sprache 7.2. Die Semiotik des Immunsystems 8. Das Immunsystem als Abstimmungsrepublik: das Selbst als Urzeichen 9. Die Innenwelt des Körpers als Einheit aus den Gegenwelten des Nervensystems und des Immunsystems 9.1. Die beiden Gegenwelten 9.2. Die Psyche als Übersetzerin der Innenwelt in Welt 9.3. Der erlebte Körper als Übersetzung der Gegenwelt des Nervensystems. Phantomund Skotom-Glieder 9.4. Psycho-Neuro-Immunologie oder: die Vernetzung der Gegenwelten zu einer Innenwelt 10. Zusammenfassung: der Beobachter als Meta-Interpret 11. Literatur (in Auswahl)
1.
Vorbemerkung
Ein Beitrag über Endosemiose soll über Vorgänge der Zeichenübertragung innerhalb des
Organismus informieren. Das scheint eindeutig, setzt jedoch den Kontext einer bestimmten Systematik voraus. Auf die Probleme, die damit aufgeworfen sind, hat die Systemtheorie (Bertalanffy 1968) eine Antwort gegeben. Darauf, sowie auf die Frage nach den Beziehungen zwischen Systemtheorie und Zeichentheorie wird in Art. 19 eingegangen. Hier genügt es, folgendes festzustellen: Die Systematik der Systemtheorie beschreibt eine Stufen-Ordnung, in der aufsteigend von den Phänomenen der anorganischen Natur die Phänomene des Lebendigen bis hinauf zu den sozialen Systemen der Menschen verschiedenen Integrationsebenen zugeordnet werden. In dem Kontext dieser Ordnung ist der Beitrag über Endosemiose der zweiten dieser Integrations-Stufen oder -Ebenen zuzurechnen. Er setzt als einfachste integrierende Einheit die Zelle voraus. Die Zeichenprozesse, die in deren Innerem zwischen Zellorganellen ablaufen, werden in Art. 20 unter dem Titel „Mikrosemiose“ abgehandelt. „Endosemiotisch“ werden demnach alle Zeichenprozesse genannt, die in vielzelligen Organismen ablaufen, gleichgültig ob wir es mit Pilzen, Pflanzen, Tieren oder Menschen zu tun haben. Da sich die Organismen so verschiedenartiger Lebewesen in ihrem Aufbau und in der Differenzierung ihrer Teile erheblich unterscheiden, ist es sinnvoll, von hochdifferenzierten Organismen auszugehen, wie sie bei höheren Tieren und beim Menschen angetroffen werden. Wir finden bei ihnen ⫺ vor allem in einem Immunsystem, einem Nervensystem und einem Bewegungsapparat ⫺ Organe, die weder bei Pilzen noch bei Pflanzen anzutreffen sind. Alle endosemiotischen Zeichenprozesse sind indirekt mit Umgebungsphänomenen
21. Endosemiose
verknüpft. So enthält z. B. das Immunsystem eine fast komplette Liste möglicher Antigene, worunter man in der Umgebung vorkommende Stoffe versteht, die dem Organismus Schaden zufügen können. In den Zentralnervensystemen der höheren Lebewesen sind die Programme für den Aufbau ihrer subjektiven Umwelten mit allen für die Orientierung ihrer Motorik bedeutsamen Einzelheiten gespeichert. Auf diese Weise ist das Nervensystem eng mit dem Bewegungsapparat verknüpft. Der von J. v. Uexküll geprägte Ausdruck Umwelt (vgl. Art. 110) besagt unter semiotischem Aspekt zweierlei: (1) daß Tiere und Menschen von einem Netzwerk aus Zeichenprozessen umhüllt sind, die sie mit ihrer Umgebung verbinden und sie gleichzeitig vor ihr schützen, indem sie die Umgebung, ihrer subjektiven Bedeutung entsprechend, in ihre Umwelten bzw. ihre individuellen Wirklichkeiten transponieren; (2) daß diese Netzwerke, da sie aus Zeichen aufgebaut sind, deren privater Charakter nur dem kodierenden Subjekt zugänglich ist, für alle anderen nur „Rauschen“ bedeuten. Um die im Organismus gespeicherten UmweltProgramme zu bezeichnen, hat J. v. Uexküll (1909) von „Gegenwelt“ oder von „Innenwelt“ gesprochen. Wir wollen den Terminus Gegenwelt für Organsysteme reservieren, die (unabhängig von anderen Organsystemen) eigene Weltprogramme speichern (also für das Nervensystem und für das Immunsystem), und wollen von Innenwelt sprechen, wenn diese Gegenwelten auf der höheren Integrationsstufe des Organismus (durch zirkuläre Zeichenverbindungen zwischen Nervensystem und Immunsystem) zu einer Einheit vernetzt werden.
Die Innenwelt eines Lebewesens enthält gewissermaßen die Vorentwürfe für die Ausschnitte aus seiner Umgebung, die für es von Bedeutung sind. Diese Vorentwürfe sind in Zeichen festgehalten, die zwischen Zellen und zwischen Organen ausgetauscht werden. Trotz ihrer engen Beziehung zu der Umgebung des Organismus müssen wir sie daher als „endosemiotisch“ bezeichnen. Für den Zeichen-Austausch zwischen dem Individuum (Tier oder Mensch) und seiner Umgebung müssen diese endosemiotischen oder Innenwelt-Zeichen in die Zeichen anderer, zoooder anthroposemiotischer (und bei letzteren in die psychischer und sozialer) Zeichensysteme übersetzt werden.
2.
Der Bedarf nach einer endosemiotischen Anatomie
Im Terminus endosemiotische Anatomie steht der Ausdruck Anatomie zunächst als Meta-
465 pher für ein Orientierungssystem, das von zwei Annahmen ausgeht: (1) Organismus und subjektive Umwelt (bzw. individuelle Wirklichkeit) bilden zusammen ein einheitliches System. Bateson (1985) spricht von „Einheiten des Überlebens“ und weist darauf hin, daß ein Organismus, der seine Umwelt (und damit unter Umständen auch den für sein Überleben notwendigen Ausschnitt seiner objektiven Umgebung, d. h. seine „Nische“) zerstört, sich selbst zerstört. (2) Als Orientierungssystem muß eine semiotische Anatomie diese Einheit als ein, in Integrationsebenen gegliedertes, System darstellen. D. h. sie muß verschiedene Integrationsebenen und auf jeder Ebene Systeme (und die verbindenden Zeichenprozesse) beschreiben, die gleichzeitig auf einer höheren Integrationsebene als Subsysteme die Elemente komplexerer Systeme bilden (zwischen denen komplexere Zeichen ausgetauscht werden). Semiotisch läßt sich jede Integrationsebene als Supersystem von Zeichensystemen (Nöth 1985, 171 f) oder als Kontext im Sinne einer Ebene von Nachrichten über Nachrichten (Meta-Ebene) auffassen (Emmeche und Hoffmeyer 1987, 17). Dieses Programm läßt sich, solange unsere Kenntnisse über die Einzelheiten der unglaublich komplexen Nachrichtenprozesse im Körper noch so lückenhaft sind wie heute, nur bruchstückhaft und vorläufig durchführen. Es wird in Zukunft ständig erweitert und korrigiert werden müssen. Trotzdem ist es möglich und notwendig, mit einem ersten Entwurf den Anfang zu machen. Für unseren Versuch eines ersten Entwurfes bietet sich, gewissermaßen als Inhaltsverzeichnis, das folgende Programm an: Aufsteigend von einer ersten Ebene der erwähnten mikrosemiotischen Prozesse, die sich im Inneren der einzelnen Zellen abspielen, treffen wir in den Nachrichtennetzen der cytosemiotischen Prozesse auf eine zweite Ebene. Cytosemiosen integrieren Zellen als Subsysteme oder Elemente zu Geweben und in den Verband von Organen, mit denen eine dritte Integrationsebene entsteht. Auf ihr werden die Cytosemiosen (der Zellen) in Organ-Semiosen übersetzt oder in sie integriert. Dieser Ebene der Organe gehören das Immunsystem und das Nervensystem an, deren Zeichenprozesse zwei verschiedenartige Gegenwelten aufbauen, von denen die Gegenwelt des Nervensystems über zirkuläre sensomotorische Zeichenverbindungen (sensomotorische Zirkulärreaktionen nach Piaget
466
III. Arten der Semiose
1937) mit dem Organ Bewegungsapparat zu einer Einheit zusammengeschlossen ist. Außerdem ist die Gegenwelt des Nervensystems über zirkuläre neuro-endokrine Zeichenprozesse mit den inneren Organen verbunden. Auf einer nächsthöheren (vierten) Integrationsebene werden schließlich die (gewissermaßen als Programmtexte für jederzeit abrufbare Semiosen vorliegenden) Gegenwel-
ten des Immunsystems und des mit dem Bewegungsapparat verbundenen Nervensystems durch Zeichenverbindungen verknüpft und zu einer gemeinsamen Innenwelt des Organismus zusammengeschlossen. Die Abbildung 21.1 gibt einen Eindruck von der hochkomplexen Struktur des Netzwerkes aus endosemiotischen Zeichenverbindungen.
Abb. 21.1: Endosemiotische Zeichenprozesse. Das Diagramm zeigt einige der potentiellen Verbindungen zwischen dem Endokrinium, dem Nervensystem und dem Immunsystem. Die hellen Linien bezeichnen nervale Verbindungen, die schwarzen hormonale und die gestrichelten postulierte, für welche die zeichenübertragenden Moleküle noch nicht nachgewiesen sind (vgl. Roitt, Brostoff und Male 1989, Fig. 10.18).
21. Endosemiose
3.
Der Körper als Netz aus Semiosen
Wenn wir den Körper als Netz aus Semiosen beschreiben wollen, müssen wir die Metapher eines Netzes mit konkretem Inhalt füllen. Das heißt, wir müssen Semiosen als Fäden darstellen, die miteinander verknüpft sind und die auch die erforderliche Dynamik entfalten, um das Netz zusammenhalten zu können (zu entsprechenden Strukturbeschreibungen vgl. Art. 2 § 5.4.). 3.1. Semiosen als Stränge eines Netzes, das Problem ihrer Dynamik und die Frage nach dem endosemiotischen Selbst Endosemiosen haben ihre eigene Dynamik. Sie sind überdies, wie betont, selbst-referentiell, das heißt zirkulär: sie beziehen sich auf sich selbst (Maturana und Varela 1988). Aber wer oder was ist dieses Selbst, das sich bei lebenden Systemen seinen Sollwert setzt, und was hat es mit der Dynamik von Endosemiosen zu tun? In der Definition von Peirce für „Zeichen“ erscheint dieses Selbst als „jemand“: „A sign is something which stands to somebody for something in some respect or capacity“ („Ein Zeichen ist etwas, das zu jemandem in bestimmter Beziehung oder Eigenschaft für etwas (anderes) steht“; 1960, 2.228). Der „jemand“ ist ein Zeichenempfänger, dem „etwas“ fehlt, das ihm durch „etwas“ (anderes, das als Zeichen dient) gezeigt wird. Die Beziehung, in welcher der Zeichenempfänger (der Interpret) zu den anderen Elementen des Zeichenprozesses steht, wird durch ein Bedürfnis bestimmt. Läßt sich von ihm die Dynamik ableiten, die Endosemiosen innewohnt? Mit einem Bedürfnis verbinden wir gewöhnlich die Vorstellung einer Kraft, die uns von irgendwoher ergreift. Piaget (1936) legt dar, daß der Begriff falsch verstanden wird, solange wir ihn als eine Kraft verstehen, die von außen in Lebensvorgänge eingreift. Es verhalte sich gerade umgekehrt; das Bedürfnis sei nur ein Aspekt ihrer Dynamik: „Die primären Bedürfnisse existieren ja nicht vorgängig und außerhalb der Prozesse und Mechanismen, die zu ihrer Befriedigung führen. Im Gegenteil, sie treten erst während der Tätigkeit dieser Funktionen in Erscheinung. […] Es besteht also ein Kreis ohne Anfang und Ende. […] Vom psychologischen Standpunkt darf man daher das Bedürfnis nicht losgelöst von seiner Betätigung oder Aktivierung be-
467 trachten. Es bildet nur einen Teilaspekt dieser Tätigkeit. Vom physiologischen Standpunkt andererseits setzt das Bedürfnis eine Organisation von ‘beweglichem Gleichgewicht’ voraus, deren vorübergehendes Ungleichgewicht es verrät. Das Bedürfnis bezeichnet also in beiden Sprechweisen die Tatsache einer momentan unvollendeten Ganzheit, die nach Vollendung trachtet“ (Hervorhebung durch die Verfasser). Der zirkuläre Prozeß wird als „Kreis ohne Anfang und Ende“ und damit als in sich geschlossene Einheit oder „Ganzheit“ definiert. Betrachten wir derartige Ganzheiten, „die nach Vollendung trachten“, als Zeichenprozesse, so können wir sagen, daß die Vollendung der „Ganzheit“ erst mit der Bedeutungsverwertung geglückt ist. Mit der Definition des Interpretanten als Zustand eines lebenden Systems, dessen „unvollendete Ganzheit nach Vollendung trachtet“, haben wir eine synthetische Formel, die zirkuläre Prozesse als sich selbst herstellende Ganzheiten beschreibt. Aber auf die Frage, wer oder was der „jemand“ oder das Selbst ist, das die Sollwerte setzt, die den jeweiligen Zustand des lebenden Systems und damit den Interpretanten wiedergeben, haben wir noch keine Antwort. 3.2. Das Körper-Selbst und der Körper als Werkzeug des Lebens: die KodeDualität In Endosemiosen lassen sich die Vorgänge, welche die Einheit des Organismus erzeugen, so beschreiben wie die Worte oder Sätze, welche die Einheit eines Textes herstellen. Antonovsky (1987) hat daher diesen Vorgang „Salutogenese“ genannt (vgl. Art. 19 § 7.). Ein Text bestimmt die Worte und Sätze, aus denen er besteht, und wird gleichzeitig von ihnen realisiert. Die Übertragung dieser Formel auf biologische Zusammenhänge erfordert eine plausible Vorstellung davon, wie ein Ganzes und seine Teile sich gegenseitig bestimmen und erzeugen. Eine solche Vorstellung kann davon ausgehen, daß alle Zellen unseres Körpers von einer einzigen Zelle, der befruchteten Eizelle, der sogenannten „Zygote“, stammen. Von ihr haben alle den gleichen genetischen Kode als Mitgift bekommen. Er sorgt dafür, daß alle auf ihrer Oberfläche ein, für ihr biologisches Selbst spezifisches, individuelles Monogramm tragen: den sogenannten „MH-Komplex“ (Major Histocompatibility Complex), der sie von Zellen aller anderen Organismen
468 unterscheidet. Die Zellen des Immunsystems, als Wächter der Individualität des Organismus, „lesen“ diese Zeichenverbindung und richten ihre Aktivität, wie wir noch darstellen werden, gegen alle Zellen mit einem fremden Monogramm. Hier steuert das Ganze über die Verwandtschaft der Körperzellen die Aktivität der Teile und wird gleichzeitig durch sie erzeugt. Aber das ist noch nicht alles: Die DNS des genetischen Kodes, den alle Zellen eines Individuums von der befruchteten Eizelle als Mitgift bekommen haben, ist nur eine Variante der DNS, welche die Individuen der gleichen Generation von der Eltern- und Ur-ElternGeneration geerbt haben. Das Individuum verdankt das Ganze seiner Erscheinungsform (seinen Phänotypus) dem Genotypus des Gen-Pools seiner Generation. Er ist die umfassende Einheit, die semiotisch jedes Individuum dieser Generation pars pro toto repräsentiert und die gleichzeitig von diesen Individuen realisiert wird. Diese relativ abstrakte Vorstellung wird in einem Modell, das Hoffmeyer und Emmeche
III. Arten der Semiose
(1991) entwickelt haben, konkret: Das Modell geht von dem Gedanken einer „KodeDualität“ aus und sieht in dem genetischen Kode der DNS einen digitalen Kode, der beim Aufbau der Körperzellen und des Organismus in einen analogen Kode übersetzt wird. Diese Auffassung des Individuums als Werkzeug zum Testen der Eignung der DNS der befruchteten Eizelle ist, nach der Meinung von Hoffmeyer und Emmeche, eine Alternative sowohl zu einem übertriebenen Individualismus wie auch zu der modernen biologischen Lehre des Individuums als „Überlebens-Maschine für selbstsüchtige Gene“ (Dawkins 1976). Sie betonen, ihre Lehre sei keine Erneuerung alter feudaler Vorstellungen von dem höheren Wert der Familie (sie ist durch den Hinweis auf das gemeinsame Erbe aller lebenden Geschöpfe auch kein Versuch einer Wiederbelebung faschistischer Ideen von dem Vorrang eines Volkes). Sie kommt, wie die Autoren betonen, der Vorstellung unserer Verwandtschaft mit allen Lebensformen auf der Erde entge-
Abb. 21.2: Die DNS als Zeichenträger. Nach diesem Schema wird die DNS als Teil des evolutionären Stroms von Zeichen aufgefaßt. Das Empfänger-System, das befruchtete Ei, die reale ‘Person’ der Biologie, benutzt die Nachrichten, welche die DNS übermittelt, für den epigenetischen Prozeß, d. h. den Aufbau des Individuums oder des Phänotypus. Metaphorisch ausgedrückt: die Zygote liest das Buch ihrer DNS, interpretiert seinen Inhalt als eine Art Anweisung für den Aufbau des Körpers als Werkzeug zum Überleben. Nur mit der Hilfe dieses Werkzeugs kann die Eizelle hoffen, ihre Zell-Linie fortzusetzen. Voraussetzung ist eine hinreichende Eignung des Werkzeugs, in seiner ökologischen Nische zu überleben und sich zu reproduzieren. Die ökologische Nische ist das einzige reale Objekt in der Welt lebender Systeme (nach Hoffmeyer und Emmeche 1991, 23).
21. Endosemiose
gen, die heute wieder lebendig geworden sei und die Wurzel für unsere Verantwortung anderem Leben gegenüber bilde. Ihr Bild der befruchteten Eizelle ⫺ als Reinszenierung des ersten Schöpfungsvorgangs auf Erden ⫺ betone die zentrale Bedeutung von zwei Vorgängen und ihrer Verknüpfung: dem digitalen und dem analogen Nachrichtenprozeß und der Übersetzung des einen in den anderen. Auch Wieser (1990) betont, wie sehr die einseitigen Begriffe und linearen Konzepte des Dawkinsschen Ansatzes an der Realität der biologischen Evolution vorbeigehen, wenn man die Probleme in Rechnung stellt, die mit dem Aufbau lebender Systeme auftreten. Schließlich ist noch daran zu erinnern, daß das Individuum auf der Stufe anthroposemiotischer Zeichensysteme eine neue Bedeutung erhält; denn mit der menschlichen Sprache ist ein Bereich entstanden, in dem die vom Individuum zu leistende Aufgabe, neue Ideen und Konzepte zu entwickeln, für das Überleben der Art wichtiger geworden ist als die biologische Anpassung an eine Umgebung. Dieser Gesichtspunkt berührt das Thema der Endosemiosen zwar nur am Rande. Hoffmeyer und Emmeche (1991, 28) legen aber Wert darauf, daß ihre These die menschliche Kultur nicht zu einem bloßen Nebenprodukt von Geschlechtszellen abwertet. Semiotik der Natur dürfe nicht mit Semiotik der Kultur verwechselt werden (vgl. Art. 1 § 1.). Jedes menschliche Wesen sei zutiefst in beide Formen der Semiose verstrickt. Keine dürfe über der anderen vergessen werden. 3.3. Ein Beispiel für eine endosemiotische „Ganzheit, die nach Vollendung trachtet“ Wir stehen jetzt vor der Aufgabe, unsere Metapher eines Netzes, dessen Maschen von Semiosen gebildet werden, mit Inhalt zu füllen. Dazu müssen wir zunächst eine semiotische Vorstellung entwickeln, wie im Laufe der embryonalen Entwicklung aus der befruchteten Eizelle (der Zygote) Tochterzellen entstehen, die verschiedene Aufgaben übernehmen. Wir greifen dafür auf ein Modell zurück, das Jakobson (1969) für die Differenzierung der Lautäußerungen des Säuglings über eine „Lallsprache“ zu einer Erwachsenensprache entwickelt hat. Dieses Modell beschreibt, wie aus unartikulierten, aber gewissermaßen noch omnipotenten Lautäußerungen als erste Differenzierung Konsonanten und Vokale entstehen, aus denen sich dann die verschie-
469 den artikulierten Phoneme der Erwachsenensprache entwickeln. Wie jedes Phonem dann die Zugehörigkeit zu einer bestimmten Sprache verrät, so verraten die differenzierten Zellen des Körpers die Zugehörigkeit zu dem artspezifischen Bauplan eines ErwachsenenOrganismus. Darüber hinaus verraten sie zusätzlich ihre Zugehörigkeit zu der Individualität eines spezifischen Selbst. 3.3.1. Selbst und Nicht-Selbst Um diese abstrakten Überlegungen durch ein konkretes Beispiel zu illustrieren, wollen wir aus dem kaum entwirrbaren Netz unzähliger Endosemiosen einen Interaktionsprozeß zwischen verschiedenen Körperzellen herausgreifen. Wir wollen diesen endosemiotischen Prozeß dann unter dem Gesichtspunkt eines dynamischen Geschehens beschreiben, das zwischen verschiedenen Körperzellen eine Verbindung herstellt, die sie zu einer gemeinsamen Funktion verknüpft. Wir wählen dazu einen Immunvorgang, obgleich wir damit etwas vorwegnehmen, das später in einem größeren Zusammenhang ausführlicher dargestellt werden soll. Gehen wir davon aus, daß sich der Aufbau und die Erhaltung lebender Systeme auf allen Integrationsebenen in Form von „unvollendeten Ganzheiten vollzieht, die nach Vollendung trachten“, indem sie Nicht-Selbst in Form von Teilen ihrer Umgebung assimilieren, so sehen wir, daß dieser Prozeß durch Zeichen gesteuert wird. Diese Zeichen erteilen dem Nicht-Selbst je nach seiner Relevanz für die Autopoiese und das Überleben des lebenden Systems eine positive Bedeutung (⫽ förderlich) oder negative Bedeutung (⫽ schädlich). Das selektive Erkennen dieser unterschiedlichen Zeichenqualitäten ermöglicht dem lebenden System Erhalt und Verteidigung seiner Ganzheit. Im Bereich der Endosemiosen geht es um Auseinandersetzungen der Körperzellen mit einer Innenwelt-Umgebung oder einem „Milieu interne“, und hier hat das Immunsystem die Aufgabe, die Integrität des Körpers zu sichern und schädliches Nicht-Selbst zu erkennen und auszuschalten. „Milieu externe“ und „Milieu interne“ stehen zueinander in einer ikonischen Zeichenrelation. Die Zellen des Immunsystems stammen von Zellen ab, die sich im Laufe der Embryonalentwicklung zu blutbildendem Gewebe differenziert haben und in das Knochenmark gewandert sind. Dort haben sie die Funktion von Vorläufer- oder Stamm-Zellen übernom-
470 men, aus denen dann über Zwischenschritte die verschiedenen Zellarten des Immunsystems hervorgehen, unter denen die sogenannten Lymphocyten die größte Gruppe bilden. In den Antworten des Immunsystems auf eine Begegnung mit schädlichem NichtSelbst übernehmen sie im Zusammenspiel mit anderen Zellen spezifische Aufgaben: Einige produzieren Antikörper, andere zerstören Virus-infizierte Zellen; wieder andere steuern die Aktivität anderer Zellen. Alle diese Funktionen werden durch spezifische Erkennungsmechanismen ausgelöst und dienen der Abwehr schädlicher Nicht-Selbst-Faktoren. In einer Immunantwort sind die Lymphocyten mit einigen oder allen dieser Funktionen an dem Zusammenspiel mit anderen Zellen beteiligt. Dabei beeinflussen sie sich gegenseitig in komplexer Weise in positivem oder negativem Sinne. Sowohl das Erkennen der verschiedenen Arten von Antigenen (schädlichem NichtSelbst) wie die genaue Regelung des Zusammenspiels der verschiedenen Zellarten erfolgt durch Zeichenprozesse, deren Vehikel in den letzten Jahrzehnten in wachsender Zahl identifiziert werden konnten. Dabei hat sich herausgestellt, daß es außer den beiden globalen Gruppen von nützlichem Nicht-Selbst, wie Nahrungsstoffen, auf der einen Seite und schädlichem Nicht-Selbst, wie den FremdAntigenen, auf der anderen, eine Gruppe von „Nicht-Selbst im eigentlichen Sinne“ gibt. Während die beiden ersten Gruppen von Nicht-Selbst für alle lebenden Systeme mehr oder weniger die gleichen sind oder höchstens artspezifische Unterschiede aufweisen, handelt es sich bei der letzten Gruppe um streng individuelles Nicht-Selbst. 3.3.2. Selbst und individuelles Nicht-Selbst Wir sprachen bereits von dem MH-Komplex MHC, den jede Körperzelle eines Menschen und höheren Tieres als eine Art Monogramm auf ihrer Oberfläche trägt und der sie als Zelle dieses bestimmten Individuums ausweist, die sich von den Zellen jedes anderen Individuums unterscheidet: „Alle Zellen des Säugerorganismus, wie wahrscheinlich aller Vertebraten überhaupt, besitzen in ihrer Zellmembran einen Satz von Proteinen, die GenProdukte eines bestimmten genetischen Komplexes darstellen, der den Einbau von Zuckermolekülen in die Eiweißkörper regelt, des sogenannten ‘Major Histocompatibility Complexes’ (MHC). Diese Membranproteine steuern die Aktivität von T-Lymphocyten in
III. Arten der Semiose
der Weise, daß sie ein Antigen nur dann als ‘fremd’ erkennen, wenn es mit MHC-Molekülen assoziiert ist. Der MHC, der beim Menschen als HLA-System bekannt ist, zeichnet sich durch einen hohen Grad von Polymorphismus aus: Die Wahrscheinlichkeit, zwei nicht verwandte Individuen mit einem identischen Satz von MHC-Produkten zu finden, ist außerordentlich klein“ (Staines, Brostoff und James 1986). Der MHC steuert die Aktivität der T-Lymphocyten zunächst gegen Zellen des eigenen Körpers, die von einem Virus infiziert sind und die auf ihrer Oberfläche neben ihrem (zell-eigenen) MHCMonogramm ein Virus-Antigen als zweites Zeichen tragen. Die Zerstörung dieser Zellen verhindert, daß sich das Virus in ihrem Inneren vermehrt. Da Viren zu ihrer Vermehrung auf die Erbsubstanz einer Zelle angewiesen sind, ist das Opfer notwendig. Die Aktivität der T-Lymphocyten richtet sich aber auch gegen alle gesunden Zellen, die einen fremden MHC tragen. Daher werden alle Zellen eines fremden Organismus von unserem Immunsystem als gefährliches NichtSelbst behandelt. Das macht sich in der Transplantationsmedizin störend bemerkbar: Die MHC-Moleküle in einem transplantierten Gewebe wirken auf die Lymphocyten des Empfängers wie ein Antigen und bewirken die Abstoßung des Transplantats. Aus diesem Grund hat man diese Moleküle auch „Transplantations-Antigene“ genannt. Die Funktion des Immunsystems, die sich bei Transplantationen als so störend erweist, ist jedoch für den Schutz vor Krebsentstehung lebenswichtig. Dieser Schutz beruht auf der Fähigkeit, Körperzellen, deren MHCMonogramm bei Umwandlung in eine Krebszelle verändert wird, zu erkennen und zu zerstören. Monogramme aus lesbaren Proteinsequenzen auf der Zelloberfläche spielen auch bei Viren, Bakterien und ein- oder mehrzelligen Parasiten eine entscheidende Rolle als Erkennungszeichen für die Immunabwehr. Aber Viren können ihre Monogramme durch Mutation verändern, so daß sie bei einer neuen Infektion nicht erkannt werden und eine früher erworbene Immunität versagt. Manche Parasiten können den Wirt durch Mimikry täuschen, indem sie sich (wie der Wolf den Schafspelz) einen Überzug aus Proteinen der roten Blutzellen des Wirtes beschaffen (Staines, Brostoff und James 1986).
21. Endosemiose
3.3.3. Selbst und allgemeinbiologisches Nicht-Selbst Ein anderes, spezielles, MHC-Eiweißmolekül erscheint als Signal für andere an der Immunantwort beteiligte Zellen nur auf der Oberfläche bestimmter Immunzellen, den B-Lymphocyten und Makrophagen. Dieses Signal wird von einer Gruppe von T-Lymphocyten, den sogenannten Helferzellen, erkannt, und mit einer Stimulierung der Antikörper bildenden B-Lymphocyten beantwortet, die wiederum diese instand setzt, die für sie spezifischen Antigene zu erkennen. Alle diese Zellen bilden gemeinsam ein zirkuläres, von spezifischen Zeichen gesteuertes Zusammenspiel, das wir die „einfachste Grundmelodie“ oder den „Basistext“ des Immunsystems nennen können. Wir wollen dieses Zusammenspiel genauer beschreiben, weil es als Beispiel einer semiotischen Ganzheit, die nach Vollendung trachtet, die Kohärenz der beteiligten Elemente illustriert. Diese Kohärenz zeigt sich zunächst darin, daß Lymphocyten nicht selbständig gegen Nicht-Selbst vorgehen können. Sie können die Zeichen, die ihr Verhalten steuern, nur mit Hilfe anderer Zellen erkennen. Darüber hinaus muß ihr Beitrag zu einer Immunantwort von Beiträgen anderer Zellen ergänzt werden. Zu diesen anderen Zellen gehören in erster Linie die Makrophagen, große FreßZellen, die in begrenztem Ausmaß auch unabhängig von der Immunabwehr Krankheitserreger (Viren und Bakterien) durch Auffressen, Phagocytose, vernichten können. Diese Fähigkeit wird wesentlich gesteigert, wenn die Erreger durch spezifische Antikörper, die von den B-Lymphocyten geliefert werden müssen, gekennzeichnet sind. Der zirkuläre Prozeß beginnt mit der Begegnung eines Krankheitserregers (Bakterium oder Virus) mit einem Makrophagen, der den Erreger an einem spezifischen Zeichen als schädliches Nicht-Selbst erkennt. Das Vehikel für dieses Zeichen ist ein relativ kleiner Bestandteil des für den Erreger spezifischen Antigens und wird „Antigendeterminante“ oder „Epitop“ genannt. Signetisch besteht er aus einer bestimmten Sequenz von Aminosäuremolekülen an der Oberfläche eines, mitunter recht großen, Eiweißmoleküls. Die signemische Bedeutungserteilung oder Kodierung zu einem Zeichen für ein Objekt der Phagocytose hängt von dem Aktivitätszustand (dem Interpretanten) des Makrophagen (gewissermaßen der Intensität seines Appetits bzw. seinem Sollwert) ab, der, wie ge-
471 sagt, durch die Kombination mit einem von den B-Lymphocyten zu liefernden Antikörper, erheblich gesteigert wird (zum Unterschied zwischen Signetik und Signemik vgl. Art. 19 § 6.). Die Antwort des Makrophagen besteht in einer Phagocytose: der Erreger wird gefressen, kann aber in Abwesenheit der Antikörper nicht oder nur schwer verdaut werden. Gleichzeitig werden Antigenpartikel an der Oberfläche des Makrophagen ausgeschieden, und dort (als indexikalische Zeichen) anderen Zellen präsentiert. Die präsentierten Antigenpartikel dienen B-Lymphocyten (mit Unterstützung durch T-Helferzellen) als Zeichen, die sie veranlassen, die benötigten Antikörper zu produzieren. Bei der Antwort des Makrophagen handelt es sich semiotisch also um eine Kombination von „Gebrauchsverhalten“ (Phagocytose) und „Signalverhalten“ (Präsentation von Signalen) (Tembrock 1975) bzw. von „Bedeutungsverwertung“ und „Bedeutungserteilung“ (J. v. Uexküll 1940). Die Vehikel der Antikörper sind Immunglobuline. Sie haben die Fähigkeit, Antigene zu binden und zu neutralisieren. Vor allem aber heften sie sich wie ein Steckbrief an die Oberfläche der Antigene tragenden Bakterien und Viren. Sie bezeichnen sie damit als Beute für die Makrophagen, deren Appetit, wie gesagt, auf derart gezeichnete Erreger um ein Vielfaches gesteigert wird. Die B-Lymphocyten, welche die Antikörper produzieren, tragen auf ihrer Oberflächenmembran spezifische Rezeptoren, die exklusiv nur ein ganz bestimmtes Antigen erkennen (Näheres in § 7.2.). Wenn eine B-Zelle mit dem zu ihrem Rezeptor passenden Antigen zusammentrifft, beginnt sie sich zu teilen. Bei dieser Teilung entstehen zwei Zelltypen. Der eine Typus entwickelt sich zu reifen Plasmazellen, die große Mengen von Antikörpern produzieren, und an das Blut abgeben. Die Zellen des anderen Typus bleiben als sogenannte „Gedächtnis-Zellen“ in Reserve. Sie entwickeln sich bei einer erneuten Infektion mit dem gleichen Erreger außerordentlich schnell zu Antikörper produzierenden Plasma-Zellen und bilden so die Grundlage für eine erworbene Immunität gegen eine nochmalige Erkrankung durch den gleichen Erreger. Der Kreis zwischen dem Makrophagen, dem Erreger und der Antikörper produzierenden B-Zelle schließt sich aber erst mit dem Hinzutritt einer weiteren Zelle, der sogenannten „Helfer-Zelle“, da B-Lymphocyten allein
472 das für sie spezifische Antigen nicht zu erkennen vermögen. Ähnlich wie ein Antigen für Makrophagen erst in Kombination mit dem von den B-Lymphocyten produzierten Antikörper zu einem mühelos lesbaren Zeichen wird, so müssen Stoffe, die von den Helferzellen bei ihrem Antigen-Kontakt produziert werden, zu dem Antigen hinzutreten, um eine für die B-Zellen lesbare Zeichenkombination zu bilden. Zusammenfassend können wir sagen: „Die Ganzheit“ der „semiotischen Grundmelodie“ des Immunsystems, „die nach Vollendung trachtet“, besteht gewissermaßen aus drei Strophen: Auf die Interaktion des Erregers mit dem Makrophagen und dessen SignalAntwort als erste Strophe folgt als zweite Strophe die Kodierung der von dem Makrophagen präsentierten Signale durch die Helferzelle zu Zeichen für den Antikörper produzierenden B-Lymphocyten. Die letzte Strophe wird dann mit der Produktion der Antikörper durch die (inzwischen vermehrten) BLymphocyten eingeleitet, die von den Makrophagen wieder zu Zeichen für den Erreger kodiert werden, womit sich der Kreis schließt. Semiotisch kann man diese Grundmelodie als Text (Text im Sinne eines „Geflechts“ von Bedeutungszusammenhängen) auffassen. Wir sprechen auch von einem „Basis-Text“ des Immunsystems. Der Text läßt sich als semiotisches System analysieren, das nach Klaus (1973) aus einer „Menge von Elementen und einer Menge von Relationen zwischen den Elementen besteht“ und bei dem man eine paradigmatische und eine syntagmatische Dimension unterscheiden kann (Nöth 1985, 175). Die paradigmatische Dimension wird in unserem Beispiel durch die (möglichen) Erreger bzw. Antigene und die an dem Immunprozeß teilnehmenden Zellen gebildet. Die syntagmatische Dimension (vgl. Art. 2 § 3.) erfaßt die Kombination bzw. Komposition, d. h. den Ablauf des Zusammenspiels zwischen dem jeweiligen Erreger und den Zellen des Immunsystems. Wir meinen, daß es sich dabei weniger um eine Metapher als um die Anwendung einer elementaren erkenntnistheoretischen, ordnungstiftenden Operation handelt, die uns die Möglichkeit gibt, dynamische Abläufe als integrierte Einheiten wahrzunehmen. Die Beschreibung von endosemiotischen Prozessen als „komplexen Texten“ bzw. semiotischen Systemen eröffnet die Möglichkeit einer syntagmatischen Analyse, „die
III. Arten der Semiose
dann abgeschlossen ist, wenn eine Einheit nicht mehr in untergeordnete Einheiten zerlegt werden kann. Diese Einheit ist dann Element eines Paradigmas“ (Krampen u. a. 1981, 384). Unter dem Aspekt einer semiotischen Anatomie ist es von Interesse, daß Integrationsebenen sichtbar werden, sobald wir das Syntagma als Kompositionsform eines semiotischen Systems auffassen, das paradigmatisch aus Subsystemen als seinen Elementen besteht, und uns vergegenwärtigen, daß auch Subsysteme wieder in ihre Elemente und deren Relationen zerlegt werden können. Konkret würde beispielsweise die syntagmatische Analyse eines Zusammenspiels zwischen Immunsystem und Hormonsystem (als komplexer Text oder semiotisches System einer höheren Integrationsebene) ergeben, daß die Immunvorgänge (als eine Kategorie von Subsystemen) und die hormonellen Vorgänge (als eine andere Kategorie von Subsystemen) dessen paradigmatische Dimension und ihr Zusammenspiel dessen syntagmatische Dimension bilden. Auf der darunter liegenden Integrationsebene würde die syntagmatische Analyse des Immunvorgangs (als Text bzw. semiotisches System) dann zu den Elementen Erreger und Immunzellen als dessen paradigmatischer Dimension führen und so fort (vgl. Art. 2 § 3.).
4.
Die Integrationsebenen einer semiotischen Anatomie
4.1. Das Problem der Kriterien für Integration Die Systematik, die Phyto-, Zoo- und Anthroposemiotik unterscheidet (Sebeok 1979; Krampen 1981), geht von dem pragmatischen Zeichenaspekt aus, nach dem Zeichen etwas „für jemanden“ sind, d. h. sie nimmt den Adressaten als Kriterium für ihre Einteilung (vgl. Art. 4 § 2.). Ähnlich verhält es sich mit der Systematik der Mikro- und Endosemiotik. Dieses Vorgehen wirft keine Probleme auf, solange sich die Adressaten (wie Zelle oder Zellorganelle, Pflanze, Tier oder Mensch) phänomenologisch einwandfrei identifizieren lassen. Es wird aber schwierig, wenn es im endosemiotischen Bereich zu entscheiden gilt, ob ein Zellverband, ein Gewebe oder ein Organ als der Adressat angesprochen werden soll, „für den“ bestimmte Zeichenprozesse eine Bedeutung haben sollen.
21. Endosemiose
Wir sind hier wieder mit dem Problem der „scala rerum“ konfrontiert (vgl. Art. 19 § 7. und Art. 57 § 1. und § 2.) und stehen jetzt vor der praktischen Frage nach den Kriterien für eine Stufenordnung von Integrationsebenen im endosemiotischen Bereich. Für den Bereich der Zoosemiotik hat die Verhaltensforschung solche Kriterien entwickelt: Man kann bei Tieren mit Hilfe dieser Kriterien temporäre und permanente Kommunikationssysteme als Zeichen-Empfänger definieren und die letzteren in offene Verbände (z. B. Insekten- oder Vogel-Schwärme), Kolonien usw. einteilen. Man kann spezifische Systeme, die von Individuen der gleichen Gattung gebildet werden, von unspezifischen Systemen unterscheiden, die aus Individuen verschiedener Arten zusammengesetzt sind. Man hat auch Kriterien entwickelt, die es erlauben, unspezifische Systeme unterschiedlichen Kategorien zuzuordnen (z. B. einer Kategorie der Symbiosen und einer Kategorie des Parasitismus; s. Tembrock 1975). Ob und wieweit sich diese Einteilungskriterien für die Identifikation verschiedener Formen des Zusammenlebens von Zellen im Körper und damit für den endosemiotischen Bereich bewähren, ist noch nicht untersucht. Wir werden spezifischen bzw. relativ spezifischen Systemen bei der Besprechung endosemiotischer Prozesse im Nervensystem und im Immunsystem begegnen. Wir geraten aber aus zwei Gründen in Schwierigkeiten, wenn wir nach diesen Kriterien Organe, die ja aus Zellen verschiedener Abkunft und Funktion (Stützzellen, Gefäßzellen, Parenchymzellen usw.) bestehen, als unspezifische Systeme auffassen wollen: einmal weil alle diese Zellen körpereigene Zellen sind, d. h. von einer Zelle (der befruchteten Eizelle) abstammen, und dann weil der Begriff der Spezifität in der Physiologie anders definiert ist. Abgesehen von medizinischen Beobachtungen über Symbiosen (z. B. mit bestimmten Bakterien auf der Haut, im Mund und im Darm) und über Parasitismen (von Viren, Bakterien, MalariaPlasmodien usw.) wissen wir wenig über echte unspezifische Systeme im Körper. Beide spielen für Aktivitäten des Immunsystems eine wichtige Rolle, gehören streng genommen aber nicht mehr in einen endosemiotischen Bereich. Wenn wir im folgenden von „Integrationsebenen“ sprechen, so bewegen wir uns also auf einem noch relativ unsicheren Boden. Sicher ist jedoch, daß wir innerhalb des Körpers statt einer eindimensionalen hierarchi-
473 schen Ordnung mehrere verzweigte Ordnungen und zahlreiche Rückkoppelungsschleifen zwischen ihnen annehmen müssen (vgl. Art. 27). 4.2. Vier endosemiotische Integrationsebenen ⫺ ein Versuch Betrachten wir unter diesen Kautelen die wichtigsten Integrationsebenen einer endosemiotischen Anatomie in einem groben Überblick, so stellt sich als erste Integrationsebene der schon erwähnte „mikrosemiotische Dialog“ zwischen den Genen und den Aktivitäten der Enzyme im Zellkörper dar (vgl. Art. 20). Die Gene sind keine einseitig bestimmenden Befehlsgeber für den Aufbau der Zellstrukturen. Sie stehen mit den Enzymen des Zellkörpers in Wechselwirkung und sind über diese mit Vorgängen der Zellteilung während des Wachstums und der Entwicklung des Organismus vernetzt, der sich als autopoietisches System selbst aufbaut und organisiert. Überdies stehen Gene auch untereinander in dialogischer Beziehung: In normalen Körperzellen unterliegen Proliferation und Differenzierung einer komplexen genetischen Kontrolle, die u. a. durch das Zusammenwirken von zwei unterschiedlich wirkenden regulatorischen Genen, den wachstumsfördernden Protoonkogenen und antagonistisch wirkenden Suppressorgenen gesteuert wird. Die Protoonkogene sind z. B. ausschlaggebend für die Bildung von Wachstumsfaktoren, von Rezeptoren für Wachstumsfaktoren, oder es handelt sich um DNS-bindende Proteine, die auf die An- und Abschaltung von Genen einwirken oder eine Rolle in der Steuerung des Zellzyklus spielen (Welter, Zang und Blin 1989). Die biologische Tragweite des Zusammenwirkens verschiedener Regulationsfaktoren wird an deren Bedeutung für die Tumorentstehung deutlich, und damit wird auch bereits das Ineinandergreifen mikrosemiotischer und endosemiotischer Zeichenprozesse sichtbar: Werden Protoonkogene in normalen Zellen verändert oder unphysiologisch aktiviert, so werden sie zu Onkogenen, welche normale Zellen zu Krebszellen umbilden, aber auch das Verhalten von Tumorzellen zu anderen Zellen beeinflussen können. Die Tumorentstehung unterliegt jedoch stets einem Mehrschritt-Zeichenprozeß, bei dem zeichentheoretisch die Beeinflussung der Interpretanten von Zellen mit dem Effekt einer Aktivierung oder Inaktivierung von
474 Reaktionsbereitschaften bedeutsam ist. So konnte gezeigt werden, daß auch Störungen der Inaktivierung oder der Verlust der Suppressorgene, einer Gruppe von wachstumsregulierenden Genen, zur Entstehung von Tumoren führen. Diese Suppressorgene verhalten sich den Protoonkogenen gegenüber antagonistisch, die ja, wie gesagt, an der Tumorentstehung beteiligt sind, wenn sie zu Onkogenen aktiviert werden. Die entscheidende Rolle dieser Regulatorgene für die Tumorentstehung konnte zuerst am Beispiel des Retinoblastoms, einer bösartigen Entartung der Netzhaut des Auges, nachgewiesen werden (Knudson 1973). Mit dem Übergang von der ersten zu einer zweiten Integrationsebene betreten wir den endosemiotischen Bereich, und hier zunächst den der Zell-zu-Zell-Kommunikation durch cytosemiotische Prozesse. Dieser Übergang wird durch ein semiotisches Netz gebildet, dessen Zeichenprozesse durch spezielle Zellstrukturen, die sogenannten „gap junctions“, feine Kanäle in den Wänden der Zellen, ermöglicht werden, durch welche benachbarte Zellen unmittelbar miteinander kommunizieren. Sie eröffnen einen direkten metabolischen und elektrischen Kontakt. Sie haben vermutlich für Gruppen von Zellen die Funktion, gemeinsame Entwicklungs- und Differenzierungsschritte sowie einheitliche Reaktionen auf Regulationssignale zu ermöglichen. „Faßt man die vielen neuen Ergebnisse auf dem Gebiet der ‘gap junctions’ zusammen, so entsteht ein ganz neues Bild der Zell-zu-Zell-Kommunikation. Zu den fernwirkenden Hormonsystemen und den nahwirkenden (synaptischen) Transmittersubstanzen tritt nun die ‘gap junction’, die eine gekoppelte intrazelluläre Signal- und Metabolitentransmission ermöglicht, als wichtigste Komponente hinzu“ (Maelike 1985, 976 f). Ein Beispiel, aus dem die Bedeutung dieser Vorgänge für die Zellkommunikation hervorgeht, sind bestimmte Prozesse, die ein Glied in der Zeichenkette bilden, die bestimmte Immunzellen zu einem Zusammenspiel aktiviert. Autoradiographisch konnte gezeigt werden, daß die Makrophagen oder Freßzellen in diesem Zusammenspiel nicht nur mit einem Netz feiner Zytoplasmastränge am Einfangen der Feindstoffe oder Antigene beteiligt sind; sie treten auch mit den durch Helferzellen aktivierten großen B-Zellen (Plasmablasten) über „gap junctions“ in einen direkten Kontakt, die sich daraufhin zu Gedächtniszellen und Antikörper produzierenden B-Lymphozyten
III. Arten der Semiose
vermehren. Vermutlich genügt den Plasmablasten die bloße Berührung der Zelloberfläche der Freßzelle mit dem dort als Signal präsentierten Antigen, um sie zur Zellteilung (klonalen Selektion) zu veranlassen (Nossal 1988). Die Antikörper, die mit dem Blutstrom über weite Strecken transportiert werden, gehören bereits einer nächsten Integrationsebene endosemiotischer Netze an; denn sie können räumlich weit voneinander entfernte Immunzellen miteinander verbinden. Ihre Ähnlichkeit mit den Antigenen, die uns noch beschäftigen wird, weist sie als ikonische Zeichen aus. Jenseits der Ebene der „gap junctions“ lassen sich zwei Integrationsebenen unterscheiden, auf denen einmal nah-wirkende und dann fern-wirkende Stoffe als Zeichenvehikel auftreten. Unter den nah-wirkenden Stoffen stellen die Transmittersubstanzen eine besonders interessante und wichtige Gruppe dar, zu den fern-wirkenden gehören die verschiedenen Hormonsysteme. Zwischen beiden gibt es so viele Verbindungen und Überschneidungen der Aufgabenbereiche, daß die Trennung in verschiedene Ebenen einer semiotischen Anatomie eine mehr didaktische als faktische Bedeutung hat. So gehören z. B. die Katecholamine sowohl zu den nahwirkenden Transmittersubstanzen wie zu den fern-wirkenden Hormonen. Mit diesem Vorbehalt lassen sich als zweite Integrationsebene eines semiotischen Körpermodells die Verknüpfungen zwischen nicht unmittelbar benachbarten Zellen beschreiben. Von diesen sollen die Verknüpfungen durch Polypeptide und durch Transmitter genauer beschrieben werden. Bei den Polypeptiden handelt es sich um Stoffe, die in den letzten Jahren als Vehikel in einem Netz von Zeichenprozessen isoliert wurden, die durch ein subtiles Ineinandergreifen, die Vermehrung der Zellen in dem Gewebsverband eines Organs (z. B. der Leber, der Haut usw.) auf das genaueste regulieren. Dabei wird bereits ein wichtiges, semiotisches Prinzip deutlich: Teilungsvorgänge werden nicht durch ein einzelnes Polypeptid, sondern durch eine Kombination zweier (oder mehrerer) solcher Stoffe in Gang gesetzt. Nicht einzelne Buchstaben ⫺ so könnte man sagen ⫺, sondern erst bestimmte Worte bekommen eine Bedeutung als Zeichen, die als Nachricht verstanden und mit einer Teilung beantwortet wird.
21. Endosemiose
Die Beobachtung, daß Tumorzellen die semiotische Kompetenz verloren haben, kombinierte Zeichen zu lesen, zeigt die biologische Bedeutung dieses Prinzips. Tumorzellen antworten mit Zellteilung bereits auf einzelne Polypeptide ⫺ gewissermaßen schon auf einzelne Buchstaben ihres Alphabets (Kiefer und Havemann 1988). Eine zweite Form der Verknüpfung zwischen benachbarten Zellen finden wir bei den Transmitter-Substanzen. Sie sind die Vehikel für die Zeichenprozesse, die benachbarte Nervenzellen verbinden. Nervenzellen bestehen aus einem kleinen Zellkörper und einem bis zahlreichen langen, dünnen, oft weitverzweigten Fortsätzen, den sogenannten Dendriten. Jeder Dendrit ist an zahlreichen Stellen mit Dendriten benachbarter Nervenzellen verbunden. Zwischen den Kontaktstellen zweier Dendriten liegt ein Spalt, der als „Synapse“ bezeichnet wird. Dieser synaptische Spalt ermöglicht auf folgende Weise sowohl die Verbindung wie die Trennung des Nachrichtenflusses zwischen Nervenzellen: Zur Herstellung einer Nachrichten-Übertragung werden Transmitter-Substanzen in den Spalt sezerniert und stellen dort die chemischen Vehikel für die Zeichen her, die benachbarte Zellen verbinden. Ist die Nachrichtenübertragung beendet, werden die Substanzen von den Nervenendigungen, welche die Vehikel gebildet hatten, wieder aufgenommen und gespeichert, um bei der nächsten Nachrichten-Sendung wieder in den synaptischen Spalt sezerniert zu werden. Auf den Kontakt mit der Transmittersubstanz hin antwortet die Nervenzelle mit einer Änderung ihres Membranpotentials, wodurch, signetisch betrachtet, das chemische Vehikel (die Transmittersubstanz) in ein elektrisches Vehikel umgewandelt wird. Signemisch muß man den Vorgang als Antwort der Nervenzelle mit einem Signalverhalten (Tembrock 1975) auffassen: Die Nervenzelle kodiert die chemische Einwirkung der Transmittersubstanz auf ihren Rezeptor zu einem Zeichen und antwortet darauf mit einer Änderung ihres Membranpotentials als Signalverhalten. Die nächste Kodierung in der semiotischen Kette der Zeichenprozesse des Nervensystems wird dann von den Rezeptoren bestimmter Zell-Areale, als den Adressaten der elektrischen Signale, vorgenommen. Mit ihnen treffen wir bereits auf eine dritte Integrationsebene, auf der Zellen zu Organen zu-
475 sammengeschlossen sind. In diesen Nervenzell-Arealen erfolgt durch das Eingreifen eines neuen Kodes eine Integration der einzelnen Zeichen zu komplexen Zeichen einheitlich reagierender Organe: Nicht mehr die einzelne Entladung, sondern die Frequenz mehrerer Entladungen wird jetzt zu einem Zeichen kodiert. Wir treffen also wieder auf das Prinzip, nach dem einzelne Signale (quasi als Buchstaben) zu Kombinationen oder Abfolgen von Zeichen (quasi zu Worten) verknüpft werden. Man kann diesen Sachverhalt folgendermaßen formulieren: Das cytosemiotische Alphabet der einzelnen Nervenzelle besteht aus einem einzigen Buchstaben (der elektrischen Entladung). Die Alphabete der neurologischen Areale des Nervensystems bestehen, dem Alphabet des Morsekodes vergleichbar (vgl. Art. 16), aus verschiedenartigen Abfolgen einzelner cytosemiotischer Zeichen. Wir haben es, anders formuliert, also mit zwei Alphabeten zu tun: einem Alphabet, das Transmittersubstanzen zu Zeichen für benachbarte Nervenzellen kodiert, die darauf mit einem elektrischen Signal antworten; und einem zweiten Alphabet, das diese Antworten bündelt und die Entladungsfrequenz der elektrischen Signale zu Zeichen für komplexere Areale im Nervensystem kodiert. Auf diese Weise wird das Netz aus Nervenzellen zu einem Transportsystem für fernwirkende Nachrichten, die im Körper mit großer Geschwindigkeit über weite Strecken transportiert werden. Ein anderes, weit weniger schnelles Transportsystem für Zeichenvehikel bildet der Blutstrom. Er transportiert die schon erwähnten Antikörper, vor allem aber die Hormone, die ebenfalls eine Nachrichtenübertragung zwischen oft weit voneinander entfernten Gebieten ermöglichen. Die Kodierung der chemischen Vehikel der verschiedenen Hormonsubstanzen zu Zeichen, die Bedeutung bzw. Nachrichten übermitteln, bedient sich folgender Methode: Die Rezeptoren der Adressat-Zellen aktivieren beim Kontakt mit dem Hormon an ihrer inneren Oberfläche Enzyme, die dort unter geeigneten Bedingungen ein oder mehrere „second messenger systems“ zur Regulation intrazellulärer Aktivitäten in Gang setzen. Hier zeigt sich wieder die enge semiotische Vernetzung zwischen den verschiedenen Integrationsebenen. Eine Vernetzung zwischen dem ZeichenTransportsystem Blutstrom und dem Zeichen-Transportsystem Nervenbahnen bilden
476
III. Arten der Semiose
Dendriten von Nervenzellen in den Blutgefäßen für schnelle Nachrichtenübermittlung. Dort können sich Blutzellen, z. B. Lymphozyten mit ihren Rezeptoren an Dendriten der Gefäßwand anlagern und Informationen an das Gehirn übermitteln und von dort empfangen.
5.
Das Prinzip der Selbstorganisation: das Atemzentrum als Beispiel für die Entstehung eines integrierten Kodes
Für eine semiotische Anatomie ist die Frage nach dem Prinzip der Selbstorganisation, das im Rahmen des Organismus die Bildung komplexer Zeichensysteme ermöglicht, ein zentrales Problem. Hier vollzieht sich eine stille Revolution in unseren Vorstellungen vom Aufbau des Organismus. Denn hier erfahren wir, daß unsere bisherigen (reduktionistischen) Vorstellungen über neurale Steuerung falsch sind. Wie Lüscher (1983) betont, wurde das Zentralnervensystem lange Zeit als übergeordnetes Befehlszentrum aufgefaßt, das, wie in einer Diktatur, den abhängigen Organen und Organsystemen die Ordnung vorschreibt, nach der sie funktionieren sollen. Dieser Vorstellung einer Fremdorganisation liegt das Modell einer Addition trivialer Maschinen (vgl. Art. 19 § 4.) zugrunde, die auf den Input der Befehlszentrale immer wieder den gleichen Output produzieren. Diese Vorstellung vermochte jedoch nicht zu erklären, wie Lebewesen, die über kein zentrales Nervensystem verfügen, mit ihren Organen ebenfalls koordiniert auf Umgebungsreize reagieren. Für diese Lebewesen hat J. v. Uexküll (1905) den Begriff der Reflexrepublik geschaffen. Er beschreibt am Beispiel des Seeigels, bei dem jeder einzelne Stachel ein eigenes Nervenzentrum besitzt, wie dessen verschiedene Nervenzentren, durch gegenseitige Information über ihren Zustand (semiotisch formuliert: über ihren Interpretanten), wie durch Abstimmung in einer Republik, zu geordneten gemeinsamen Funktionen kommen. Er illustriert dieses Modell mit dem Satz: „Wenn der Hund läuft, so bewegt das Tier (bzw. dessen Gehirn) seine Beine. Wenn der Seeigel läuft, so bewegen die Beine das Tier“ (J. v. Uexküll 1905, 32). Für dieses Geschehen hat Konrad Lorenz (1927) mit der Beschreibung der Abstimmung
in einer Gruppe frei lebender Tiere ein anschauliches Beispiel geliefert. Es zeigt, daß wir es mit einem allgemeinen Prinzip zu tun haben, das auf den verschiedenen Integrationsebenen des Lebens Gültigkeit hat: „Der Dohlenschwarm, der am Tag aufs Feld zur Futtersuche und am Abend in den Wald zum Schlafen fliegt, stimmt sich durch die Rufe der einzelnen Tiere immer wieder als Ganzes auf ein einheitliches Verhalten ab. Wenn in den Morgen- und Abendstunden die Tendenzen der einzelnen Vögel divergieren, kann man beobachten, wie der Schwarm eine zeitlang hin und her fliegt. Überwiegen die Rufe ‘Djak’ über die Rufe ‘Djok’, so fliegt der Schwarm in Richtung Wald oder umgekehrt in Richtung Feld. Das geht so lange hin und her, bis plötzlich alle Vögel den gleichen Ruf ausstoßen, und der Schwarm jetzt als Ganzes entweder in den Wald oder aufs Feld fliegt. Dann ist der Schwarm durch Abstimmung entweder für das Verhalten ‘Aufsuchen der Schlafplätze’ oder das Verhalten ‘Futtersuche’ bereitgestellt. Es herrscht dann eine gemeinsame Stimmung oder so etwas wie eine gemeinsame Emotionalität“ (Th. v. Uexküll 1963, 174).
In diesem Beispiel beeinflussen die Rufe der Vögel als „Stimmungssignale“ die Stimmung der einzelnen Vögel und führen auf diese Weise zu einer Selbstorganisation des Ganzen (des Schwarms). Lüscher zeigt am Beispiel des Atemrhythmus, daß die Funktionsstruktur des Zentralnervensystems nach dem gleichen Prinzip, der Selbstorganisation durch semiotische Abstimmung definierter Gruppen von Nervenzellen, funktioniert und daß die Gruppen nicht auf einen übergeordneten Taktgeber angewiesen sind. Er schreibt: „Auf das Wesentliche reduziert besagt diese Auffassung, daß (in dem Atemzentrum) zwei verschiedene Neuronenpopulationen an der Entstehung des Atemrhythmus beteiligt sind: eine inspiratorisch und eine exspiratorisch wirksame (gestimmte) Zellpopulation. Von diesen beiden Populationen hat nur die inspiratorisch wirksame die Fähigkeit, selbständig aktiv zu sein (sie entspricht den Vögeln, die aufs Feld fliegen wollen). Im Gegensatz zur inspiratorischen Neuronenpopulation zeigt die exspiratorische Population die Tendenz, sich selbst zu inaktivieren (sie entspricht den Vögeln, die ihre Schlafplätze aufsuchen wollen). Sich selbst überlassen, wird ein vorhandener Aktivitätszustand in der exspiratorischen Population mit einer bestimmten Zeitkonstante gegen Null streben. Wesentlich für das Verständnis der Rhythmogenese ist nun die synoptische Verknüpfung der beiden Neuronenpopulationen. Dazu läßt sich zusammenfassend sagen, daß durch die autonome inspiratorische Aktivierung die exspiratorische Zellpopulation zunehmend erregt wird, welche ihrerseits rück-
21. Endosemiose wirkend auf die inspiratorische Population einen zunehmend hemmenden Einfluß ausübt. Der Erregungszustand im inspiratorischen System bildet sich unter diesem hemmenden Einfluß zurück, was […] ein Nachlassen des Erregungszustandes in der hemmenden Neuronenpopulation nach sich zieht. Es kommt so von neuem zur autonomen Entfaltung des Erregungszustandes in der inspiratorischen Neuronenpopulation, und der beschriebene Zustand wiederholt sich in rhythmischer Folge.“
In diesem Zusammenspiel hat der Kohlensäure(CO2)-Gehalt des Blutes eine ähnliche Wirkung auf den Erregungszustand der inspiratorischen Zellpopulation wie der Hunger auf den Erregungszustand der Dohlen, die aufs Feld fliegen wollen. Umgekehrt hat der Sauerstoff(O2)-Gehalt des Blutes eine Wirkung auf die hemmende Neuronenpopulation, die sich mit der Sättigung der Dohlen vergleichen läßt, die zu ihren Schlafplätzen im Wald streben. Betrachten wir die beiden Beispiele unter semiotischen Gesichtspunkten, so können wir folgendes sagen: Der biologische Zustand der einzelnen Nervenzelle (ihr O2-Bedarf bzw. CO2-Überschuß) entspricht der Abweichung von ihrem Sollwert, d. h. von ihrem Interpretanten. Für den einzelnen Vogel entspricht sein Sättigungsgrad bzw. sein Hunger der Abweichung von seinem Sollwert oder seinem Interpretanten. Der Interpretant kodiert die Einwirkungen der Umgebung auf die Rezeptoren der Vögel und der Nervenzellen als ikonische (und bei den Dohlen auch gleichzeitig als indexikalische) Zeichen für den Gehalt der Umgebung an Ressourcen. Semiotisch bedeutsam sind daran vor allem drei Punkte: (1) Aus der Interaktion der Cytosemiosen zahlreicher einzelner Nervenzellen entsteht durch Abstimmung der individuellen Interpretanten (⫽ Kode) der komplexe Kode eines Organs (des Atemzentrums), ähnlich wie durch den Nachrichten-Austausch über die Stimmung der einzelnen Vögel der Kode des Schwarms entsteht. Organ und Schwarm gehören als neue (emergente) Phänomene einer komplexeren Integrationsstufe an und antworten dort als Ganze auf Zeichen, die von den einzelnen Individuen empfangen und kodiert werden. D. h. die einzelnen Individuen fungieren als Rezeptoren der komplexen Einheiten. (2) Eine neue Integrationsstufe entsteht mit einem weiteren Abstimmungs-Prozeß zwischen dem komplexen Kode des Atemzentrums und dem Kode von Nervenzellen, de-
477 nen die Steuerung der Herz-Frequenz obliegt. Damit wird der Atemrhythmus in die Steuerung des Kreislaufs einbezogen. Das geschieht auf folgende Weise: Die präganglionären Herzvagusneurone liegen in enger Nachbarschaft zu den inspiratorischen Hirnstammneuronen. Sie zeigen ein atemrhythmisches Entladungsmuster mit exspiratorischer Aktivierung. Gleichzeitig ist bei vielen Sympathicus-Ästen, einschließlich des Herz-Sympathicus, der inspiratorische Teil des Atemzentrums einer der zentralen Antriebe. Hierbei handelt es sich nicht um einfache Erregungsüberlagerung oder „Irradiation“, sondern um einen komplexen Abstimmungsvorgang zwischen der sympathischen und der vagalen Herzinnervation einerseits und dem Atemrhythmus andrerseits. Beim ruhenden Menschen ist dieser Zusammenhang am deutlichsten und an der „respiratorischen Sinusarrhythmie“ am leichtesten zu erkennen. Aber selbst nach Denervierung der pressorezeptorischen Reflexe und Ausschaltung der atemmechanischen Faktoren läßt sich beobachten, wie der Herzvagus inspiratorisch gehemmt und exspiratorisch aktiviert wird, während das Verhalten des Sympathicus umgekehrt ist.
Diese Verbindung von Herzfrequenz und Atmung macht auch eine Konditionierung der Herzfrequenz über die Atmung möglich, da über die Atmung ein willkürlich steuerbarer Zugang in die autonome Innervation gegeben ist. Im komplexen Zusammenhang der nervalen Herzfrequenzsteuerung läßt sich der Effekt jeder Inspiration als eine Veränderung der Herzfrequenzsteuerung in Richtung auf eine „defence reaction“ deuten (Köpchen, Klüßendorf und Sommer 1981), d. h. eine Reaktion, die mit Aktivierung des Herzsympathicus und sofortiger Inaktivierung der vagalen Innervation einhergeht und die im Sinne der von Cannon (1953) beschriebenen affektiven „Bereitstellungsreaktionen“ (emergency patterns) gedeutet werden kann. (3) Die Stimmung des Atemzentrums, die sich endosemiotisch als Integral unzähliger zellulärer Semiosen darstellt, wird dann auf einer noch komplexeren Integrationsstufe (der des Organismus mit seiner Umwelt) in das psychische Zeichen eines vitalen Körpererlebens übersetzt. Da dieses Körpererleben als Atemnot unser Verhalten zu unserer Umgebung zu steuern vermag, sehen wir, wie eng auch hier die Beziehungen zwischen Endosemiose und Exosemiose sind. Das Beispiel zeigt auch, daß ein erlebter Körper, wie eingangs betont, Zeichenprozesse voraussetzt, die einer psychischen Integrationstufe angehören.
478
6.
III. Arten der Semiose
Die Gegenwelt des Nervensystems und die Einheit von Wahrnehmen und Bewegen
Wenn wir das Nervensystem als Organ einer semiotischen Anatomie des Körpers verstehen wollen, müssen wir uns seine InnenweltFunktion klar machen. Dazu müssen wir uns vorstellen, daß seine Zeichenprozesse als Ganzes gewissermaßen einen endosemiotischen Spiegel für die exosemiotische Umwelt (nicht jedoch die Außenwelt-Umgebung!) des Lebewesens darstellen. Mit der Außenwelt ist das Nervensystem nur durch die Sinnesorgane verbunden, die gewissermaßen spezialisierte Rezeptoren darstellen. Sie haben, wie alle Rezeptoren des Nervensystems, die gleiche Aufgabe, nämlich die Reize, die sie treffen, auszufiltern und in elektrische Erregung umzuwandeln. J. v. Uexküll (1909) hat diesen Zusammenhang folgendermaßen dargestellt: „Es tritt also im Nervensystem der Reiz selbst nicht wirklich auf, sondern an seine Stelle tritt ein ganz anderer Prozeß, der mit dem Geschehen in der Außenwelt gar nichts zu tun hat. Er kann nur als Zeichen dafür dienen, daß sich in der Umgebung ein Reiz befindet, der den Rezeptor getroffen hat. Über die Qualität des Reizes sagt er nichts aus. Es werden die Reize der Außenwelt samt und sonders in eine nervöse Zeichensprache übersetzt.“ Um die Reize dennoch unterscheiden zu können, werden für verschiedene Reizarten verschiedene Nervenbahnen (eine akustische, eine optische, eine taktile usw.) als Verbindungen zu entsprechenden Arealen im Gehirn verwendet (vgl. Art. 5⫺11). Diese Areale des Nervensystems werden auf diese Weise zu einem inneren Weltspiegel, der sich im Laufe der Entwicklungsgeschichte zwischen die Sinnesorgane, als Rezeptoren der Außenwelt, und die motorischen Teile des Nervensystems (den Bewegungsapparat) geschoben hat. Als Resultat dieser Entwicklung „dringen keine in Erregungszeichen verwandelte Außenreize mehr direkt zu den motorischen Netzen. Diese erhalten ihre Erregungen nur noch aus zweiter Hand, aus einer im Zentralnervensystem entstandenen Erregungswelt, die sich zwischen Umwelt und motorischem Nervensystem aufrichtet. Alle Handlungen der Muskelapparate dürfen nur noch auf sie bezogen und können nur durch sie verstanden werden. Das Tier flieht nicht mehr vor den Reizen, die der Feind ihm zusendet (wie das bei den primitiven Lebewesen der Fall ist), son-
dern vor einem Spiegelbild des Feindes, das in einer Spiegelwelt entsteht“ (J. v. Uexküll 1909, 194 f). J. v. Uexküll nennt diese Spiegelwelt auch „Gegenwelt“, weil die Gegenstände der Umwelt in dieser Gegenwelt durch Schemata vertreten sind, die nicht, wie bei einem Spiegel, Produkte der Umgebung, sondern „Werkzeuge des Gehirns“ sind, die dort bereitliegen, um auf passende Reize der Außenwelt in Tätigkeit zu treten. In diesen Schemata sind Sensorik und Motorik im Sinne der sensomotorischen Zirkulärreaktionen Piagets (1937) zu komplexen Programmen für die bedeutungsverwertenden Verhaltensantworten verknüpft. Sie werden abgerufen, wenn die Sinnesorgane bestimmten Reizen die entsprechende Zeichen-Bedeutung erteilen. Mountcastle, ein zeitgenössischer Hirnforscher, beschreibt eindrucksvoll, wie das Nervensystem seine Gegenwelt mit eigenen Zeichenprozessen hervorbringt und die Umgebung nicht passiv wie ein Spiegel abbildet: „Jeder von uns glaubt von sich selbst, daß er direkt in der Welt, die ihn umgibt, lebt, ihre Gegenstände und Ereignisse genau fühlt und in einer realen und gegenwärtigen Zeit lebt. Ich behaupte, daß dies Illusionen der Wahrnehmung sind, denn jeder von uns begegnet der Welt mit einem Gehirn, das mit dem, was ‘draußen’ ist, über einige Millionen gebrechliche sensible Nervenfasern verbunden ist. Diese sind die einzigen Informationskanäle, unsere lebendigen Verbindungen zur Realität […]. [Und] das zentrale Neuron ist im Vergleich zu den afferenten Nervenfasern ein Fabulierer; es ist niemals vollkommen glaubwürdig. […] Empfindung ist eine Abstraktion, nicht eine Replikation der realen Welt“ (Mountcastle 1975, zit. in Popper und Eccles 1982, 312).
7.
Die Gegenwelt des Immunsystems: Erkennen, Gedächtnis, Selbst, Nicht-Selbst als biologische Funktionen
7.1. Die neue Terminologie und die Sprache Die Selbst-Erfahrungen des Körpererlebens scheinen weitgehend an das Nervensystem gebunden zu sein. Sie bekommen aber durch die Entdeckungen der Immunologie ein biologisches Pendant, das mit großer Wahrscheinlichkeit die früheste biologische Basis für unser bewußtes Selbsterleben bildet. Man weiß schon lange, daß jeder Organismus die Fähigkeit hat, Selbst und Nicht-Selbst zu unterscheiden und daß diese Fähigkeit eine vi-
21. Endosemiose
tale Bedeutung für die Integration des Organismus hat. So informiert z. B. das Nervensystem unser bewußtes Körper-Erleben durch die Schmerzempfindung zuverlässig über die Grenzen zwischen Selbst und Nicht-Selbst. Bei einem Ausfall der Schmerzempfindung durch eine Nervenverletzung drohen dem Organismus Schädigungen, gegen die er sich nicht zur Wehr setzt oder die er sich sogar selbst zufügt. Aber schon einzelne Zellen haben die Fähigkeit, Selbst und Nicht-Selbst zu unterscheiden, und die Zellen des Immunsystems haben diese Fähigkeit zu einer spezifischen Funktion entwickelt: Sie können, wie wir schon dargestellt haben, körperfremdes Eiweiß, z. B. in der Oberflächenmembran von Viren, Bakterien und Parasiten, erkennen. Diese Fähigkeit ist die Voraussetzung für die Möglichkeit, sie rechtzeitig unschädlich zu machen. Die Frage, worauf diese Fähigkeit beruht, ist ein semiotisches Problem. Ein anderes semiotisches Problem begegnet uns in der Tatsache, daß der Organismus ein Gedächtnis für Krankheiten besitzt, die er durchgemacht hat. Wir sagen, der Organismus habe „eine Immunität“ gegen diese Krankheiten erworben. Aber erst seit einigen Jahrzehnten wissen wir, daß Immunität auf der Fähigkeit des Organismus beruht, endosemiotisch, d. h. auf der Ebene der Zellen, Selbst von Nicht-Selbst zu unterscheiden. Jerne (1985), der für seine Entdeckungen auf dem Gebiet der Immunologie mit dem Nobelpreis ausgezeichnet worden ist, hat anläßlich der Verleihung des Preises in Stockholm eine kurze Darstellung der Geschichte der Immunologie gegeben. Er schildert ⫺ sehr verkürzt wiedergegeben ⫺, wie 1890 v. Behring und Kitasato im Blut von Tieren, die mit Diphterie- und Tetanus-Toxin vorbehandelt waren, die ersten Antikörper entdeckt haben und wie sie zeigen konnten, daß diese Antikörper in der Lage sind, die betreffenden Toxine zu neutralisieren. Lange Zeit glaubte man, alle Zellen des tierischen und menschlichen Organismus könnten solche Antikörper produzieren. Erst seit 1960 weiß man, daß nur bestimmte Blutzellen, die sogenannten „Lymphocyten“, diese Fähigkeit besitzen. Ihre Zahl beträgt beim Menschen etwa 1012 und übertrifft damit die Zahl der Nervenzellen um eine Größenordnung. Insgesamt machen die Lymphocyten 1% unseres Körpergewichts aus! Sie zirkulieren in Blut und Lymphe durch den Körper und kommen
479 dabei mit fast allen Körperzellen in Berührung. Mit einigen von ihnen arbeiten sie in der Immun-Abwehr eng zusammen. Um die Beobachtungen über Vorgänge im Immunsystem beschreiben zu können, mußte man, wie schon zuvor in der molekularen Genetik, auf Begriffe zurückgreifen, die aus der Umgangssprache entlehnt sind. Hoffmeyer und Emmeche (1991) betonen, wie ungewöhnlich ein solches Vorgehen in der Biologie und der Medizin ist, die sich seit über hundert Jahren hartnäckig bemühen, ihre Terminologie der Physik anzupassen. In der Tat haben Begriffe wie Programm, genetischer Kode, Information, Gedächtnis oder Erkennen, die plötzlich respektable und sogar unentbehrliche Begriffe wurden, in der Physik eindeutig keinerlei Sinn. 7.2. Die Semiotik des Immunsystems Die Analogie zwischen Sprache und Immunsystem geht noch weiter als die zwischen Sprache und genetischem Kode. Dazu zunächst eine Vorbemerkung. Die Nucleotid-Sequenzen des genetischen Kodes können mit den Zeichen des MorseKodes verglichen werden (vgl. Art. 16 § 1.). Wir vergleichen dann die Tatsache, daß eine Dekodierung die Zeichen-Sequenzen des Morse-Kodes in die Buchstaben-Sequenzen einer Wortsprache übersetzt, mit der Tatsache, daß eine Dekodierung der Nucleotid-Sequenzen des genetischen Kodes diese Sequenzen in die 20 Zeichen-Sequenzen übersetzt, die das Alphabet des Aminosäuren-Kodes bilden. Aus diesen 20 Aminosäuren sind die unzählbar vielen und außerordentlich verschiedenen Eiweißkörper aufgebaut, aus denen die Körpersubstanz aller Lebewesen, von den Viren bis zu den Säugetieren, besteht. Diese Eiweißkörper können von den Lymphocyten gelesen werden. Die Lymphocyten müssen also über einen Kode verfügen, der außerordentlich komplizierte Alphabete entziffern kann. Eiweißkörper sind lange Kettenmoleküle, deren Glieder von Aminosäuren in wechselnder Folge gebildet werden. Faßt man jede Aminosäure als den Buchstaben eines Alphabets auf, so lassen sich Eiweißkörper mit Texten aus langen Buchstabenreihen vergleichen. Die Zahl der Aminosäuren in einem großen Eiweißmolekül entspricht etwa der Zahl der Buchstaben in einem Text von mehr als 100 Meter Länge.
480 In einem Zeitungsartikel sind die Buchstabenfolgen der Worte und Sätze in gleich lange Stücke zerbrochen und in Reihen untereinander angeordnet. Im Unterschied dazu sind die Sequenzen des Aminosäuren-Alphabetes ineinander gefaltet. In den Organismen sind die Eiweißmoleküle daher, auch dort, wo sie die Oberfläche der Zellen bilden, zu einem komplexen Knäuel aufgewickelt. Dort sind nur die wenigen Aminosäuresequenzen, welche an der Oberfläche der Zellen liegen ⫺ einzelnen Worten oder kurzen Sätzen vergleichbar ⫺ zu lesen. Diese Aminosäuresequenzen bilden für das Immunsystem gewissermaßen die Eigennamen in einem „Fahndungsbuch“, in dem die unzählbar vielen Eiweißmoleküle verzeichnet sind, aus denen die Organismen aller Lebewesen bestehen. Dieses „Fahndungsbuch“ entspricht dem Kode des Immunsystems. Die dort verzeichneten Eigennamen, die manchmal nur zehn Aminosäuren lang sind, werden von den Immunologen als „Epitope“ bezeichnet (von den griechischen Worten epı´ ‘auf’ und to´pos ‘Ort’). Da das Immunsystem eines Menschen die Epitope, d. h. die Eigennamen aller der vielen Millionen Eiweißkörper erkennen kann, die in der Körpersubstanz der Millionen verschiedener Organismen (vom Virus bis zum Säugetier) vorkommen, läßt sich der Umfang seines Kodes, seines Fahndungsbuches, mit dem der Telefonbücher aller Großstädte der Welt zusammengenommen vergleichen. Die Fähigkeit, alle diese Eigennamen zu lesen, setzt das Immunsystem in die Lage, Antikörper, die für alle diese Namen spezifisch sind, zu bilden. Die Antikörper werden den in den Körper eingedrungenen Viren oder Bakterien quasi als Etikette (oder als Steckbriefe) angeheftet, die auch für andere an der Immunabwehr beteiligte Zellen lesbar sind. Die Eindringlinge sind damit für die anderen Zellen als potentielle Opfer gekennzeichnet. Semiotisch betrachtet können wir sagen, daß das Immunsystem fremde Zeichen, mit denen es nie in Berührung gekommen ist, erkennen kann. Aber die Art und Weise, wie es dieses Problem löst, ist ein Argument für die These Platons, daß nur Bekanntes erkennbar sei: Die Lymphocyten (welche die Antikörper produzieren, die sich eingedrungenen Feinden als Etikett oder „Kains-Mal“ anheften), tragen auf ihrer Oberfläche Rezeptoren, die genau so gebaut sind, wie die von ihnen produzierten Antikörper. D. h. sie tragen die
III. Arten der Semiose
gleichen Aminosäuresequenzen, die den Eigennamen eines bestimmten Eiweißmoleküls identifizieren. Jacquemart und Coutinho (1988, 178) schreiben dazu: „Antigen und Antikörper sind, soweit ihre molekulare immunologische Basis gemeint ist, nur aufeinander bezogen zu definieren. Ein Molekül hat keine ‘Epitope’ (‘Eigennamen’ usw.). Diese Qualität wird dem Molekül erst durch ein ‘Paratop’ (‘Eigenname’ des Antikörpers) verliehen, das den Ort, die Größe, die molekularen Komponenten und andere Kennzeichen der Verbindung determiniert. Ein Paratop konkretisiert gewissermaßen eine von den theoretisch zahlreichen Realisationsmöglichkeiten, die durch ein vorgegebenes Molekül (als ‘Epitop’) ausgedrückt werden können […].“ Diese Feststellung unterstreicht den semiotischen Charakter dieser molekularen Reaktionen auf eindrucksvolle Weise gegenüber mechanistischen Vorstellungen. Kommt ein Lymphocyt mit einem zu seinen Rezeptoren passenden Eiweißkörper in Kontakt, so beginnt er sich in viele Tochterzellen zu teilen. Ein Teil dieser Zellen reift zu großen Lymphocyten heran, die in großer Zahl Antikörper an das Blut abgeben. Der andere Teil der Tochterzellen entwickelt sich nicht bis zu diesem Stadium, sondern bleibt in Reserve, die bei einem erneuten Eindringen der gleichen Art Eiweißmoleküle sofort mit einer massiven Antikörperbildung antworten kann. Diese Zellen bewahren gewissermaßen das Geheimnis des Eigennamens der Angreifer. Sie bilden das Gedächtnis des Immunsystems und lösen auf diese Weise das Problem des Wiedererkennens. Unser Bild, das den Kode des Immunsystems mit den Telefonbüchern aller Großstädte der Welt vergleicht, zeigt schon, daß es sich um ein sehr aufwendiges Verfahren handelt, mit dessen Hilfe Unbekanntes im Sinne von Substanzen, die mit dem Organismus noch nie in Berührung gekommen sind und für die noch keine Gedächtniszellen gebildet werden konnten, erkannt wird. Das Verfahren besteht darin, daß jeder der vielen Millionen Lymphocyten auf den Rezeptoren seiner Oberflächenmembran eine Aminosäuresequenz trägt, die den Eigennamen eines anderen Eiweißmoleküls lesen kann. Das Immunsystem hält also für viele Millionen Eiweißkörper, mit denen der Organismus im Laufe seines Lebens möglicherweise einmal in Kontakt kommen könnte, Millionen von Lym-
481
21. Endosemiose
phocyten mit verschiedenen Rezeptoren in Bereitschaft. Um ein Beispiel für diese beispiellose Verschwendung zu konstruieren, müssen wir uns vorstellen, das Bundeskriminalamt besäße eine Sammlung der Fingerabdrücke aller lebenden Menschen. Es hätte für jeden Fingerabdruck einen speziellen Beamten angestellt, der sich damit unter die Bevölkerung mischt und nach einem Menschen fahndet, dessen Finger zu diesem Abdruck passen. Weit über 90% der Beamten werden ihr Leben lang erfolglos nach ihrem Kandidaten Ausschau halten. Die Wenigsten werden irgendwann einmal fündig werden. Aber diese Wenigen haben dann nichts Unbekanntes, sondern den ihnen bekannten Fingerabdruck erkannt. Mit anderen Worten: das Erkennen des Unbekannten ist ein Wiedererkennen von Bekanntem. Nicht-Selbst ist eine mögliche Variante von Selbst! Diese Feststellung ist für den Semiotiker banal. Sie besagt, daß Unbekanntes durch ikonische Zeichen erkannt wird. Die Lymphocyten tragen in millionenfacher Zahl ikonische Abbilder der Aminosäuresequenzen eines Antigens auf ihren Rezeptoren. Aber erst die Berührung ⫺ die Kontiguität ⫺ mit dem Abbild auf dem Epitop des körperfremden Eiweißmoleküls fügt zu der ikonischen Qualität die für das Zeichen Nicht-Selbst erforderliche indexikalische Qualität hinzu. Bildlich gesprochen könnte man sagen, daß unser Körper in Form unentwickelter photographischer Platten die Bilder aller möglichen Feinde, denen er in seinem Leben begegnen kann, in sich trägt. Die Gegenwelt, die das Immunsystem aufbaut, besteht daher, bildlich gesprochen, aus einer gigantischen Sammlung aller Fingerabdrücke potentieller Feinde. Aber nur wenn eine Begegnung mit einem Feind erfolgt, wird eine der Platten entwickelt. Wie wir bereits (in § 3.3.2.) erwähnt haben, gibt es Krankheitserreger, die nicht mehr erkannt werden, wenn sie in eine Körperzelle eingedrungen sind. Von diesen haben die Viren darüber hinaus die Fähigkeit, der Zelle mit Hilfe ihrer DNS ihren Virus-Bauplan aufzuzwingen. Die Körperzelle beginnt dann, statt die eigene Funktion wahrzunehmen, das Virus in großer Zahl nachzubauen. Wie schon erwähnt, sind nur die sogenannten „Killerzellen“ (T-Lymphocyten) in der Lage, die infizierten Zellen zu erkennen und mitsamt den eingeschlossenen Viren zu vernichten. Wenn das geschieht, beginnen sich die
Killerzellen sehr schnell zu vermehren und der Infektion Herr zu werden. Das Aids-Virus kann sich nicht nur in Körperzellen sondern auch in Makrophagen und Lymphocyten (Helferzellen) verstecken und auf diese Weise unerkannt bleiben bzw. von der Immunabwehr als Selbst betrachtet und in Ruhe gelassen werden. Es ist dann so, als ob eine Feuersbrunst von einem Brand im Feuerwehrhaus ausgehen würde oder als ob Terroristen als Kriminalbeamte verkleidet das Bundeskriminalamt besetzen und für ihre Zwecke umfunktionieren würden.
8.
Das Immunsystem als Abstimmungsrepublik: das Selbst als Urzeichen
Der Rückgriff auf die geheimnisvolle Verwandtschaft zwischen Selbst und NichtSelbst stellt das Immunsystem nicht nur vor das Problem, wie Unbekanntes erkannt und als Nicht-Selbst identifiziert werden kann. Das Verfahren, mit dem dieses Problem gelöst wird, führt paradoxerweise dazu, daß es jetzt schwierig, wenn nicht unmöglich wird, Bekanntes zu erkennen! Die Antikörper verkörpern ja nur für den Lymphocyten, der sie produziert und der die gleichen Antikörper als Rezeptoren auf seiner Oberfläche trägt, Selbst. Für andere Lymphocyten verkörpern sie ein gesuchtes NichtSelbst als Fingerabdruck eines potentiellen Feindes. Sie wirken auf diese daher wie Antigene, gegen die wieder Antikörper produziert werden. Man hat in der Tat zeigen können, daß in dem Immunsystem eines Tieres die Produktion eines spezifischen Antikörpers gegen ein Antigen, die Bildung von Antikörpern gegen diesen von ihm selbst gebildeten Antikörper auslöst. Das Selbst eines Lymphocyten wird von einem anderen Lymphocyten als NichtSelbst behandelt. Dieser erstaunliche Vorgang geht immer weiter: Die von dem zweiten Lymphocyten gebildeten Anti-Antikörper veranlassen einen dritten Lymphocyten zur Bildung von Antikörpern gegen die AntiAntikörper und so fort, mit dem Effekt, daß sich das Immunsystem als gigantisches Netzwerk von Antigen-Antikörper-Interaktionen darstellt (Jerne 1985; Köhler, Urbain und Cazenave 1984). Das Resultat dieses Zeichenstroms, der bei dem Kontakt eines Lymphocyten mit einem Antigen wie ein Windstoß durch das ganze
482
III. Arten der Semiose
Immunsystem geht, ist ⫺ wieder ⫺ ein gegenseitiges Abstimmen der verschiedenen Zellen über ihre unterschiedlichen Interpretanten. Das heißt aber letzten Endes: Das Immunsystem ist ebenso eine semiotische Republik wie das Atemzentrum und der Dohlenschwarm. Die einzelnen Antigen-AntikörperInteraktionen bilden auf einer höheren Integrationsstufe wieder die Einheit eines Organs, das trotz seiner ungeheuren Komplexität als Ganzes auf Zeichen antworten kann, die eine einzelne Zelle empfängt. Die Tatsache, daß die Verhältnisse in Wahrheit noch komplizierter sind, weil in die Interaktionen der Antikörper produzierenden (B)-Lymphocyten noch Zellen mit anderen Funktionen (T-Lymphocyten, Monocyten usw.) eingeschaltet sind, macht diese erstaunliche Tatsache nur noch erstaunlicher. Sie drängt uns das Bild eines Vielvölkerstaates auf, dessen Nationen die verschiedensten Sprachen sprechen. Aber anstelle einer babylonischen Sprachverwirrung herrscht auf der Basis des semiotischen Prinzips einer Abstimmung durch Zeichen eine musterhafte demokratische Ordnung. Eine semiotische Besonderheit muß noch hervorgehoben werden: Die Antikörper, die von den B-Lymphocyten in das Blut abgegeben werden und dort als spezifisch gebaute Eiweißkörper (Gamma-Globuline) nachgewiesen werden können, sind in der weitaus überwiegenden Mehrzahl Zeichen für abwesende Adressaten. Der Adressat taucht erst auf, wenn ein passendes Antigen (z. B. ein Bakterium oder ein Virus mit dem passenden Oberflächen-Eiweiß (⫽ Epitop)) in die Blutbahn gelangt.
9.
Die Innenwelt des Körpers als Einheit aus den Gegenwelten des Nervensystems und des Immunsystems
9.1. Die beiden Gegenwelten Wir haben Semiosen des Nervensystems und des Immunsystems beschrieben und gesagt, sie würden zwei verschiedene Gegenwelten aufbauen. Ehe wir Beobachtungen diskutieren, die auf eine Integration dieser beiden Gegenwelten zu einer gemeinsamen Innenwelt hinweisen, müssen wir die Besonderheiten der beiden Gegenwelten noch einmal herausstellen. Der auffallendste Unterschied ist ihre Bewußtseinsfähigkeit. Die Gegenwelt des Ner-
vensystems enthält die Programme zum Aufbau einer Welt, die wir bewußt erleben und wahrnehmen können. Zu dieser Welt gehört auch unser Körper, soweit er als erlebter Körper deren Zentrum bildet (vgl. Art. 25). Dieser Punkt spielt, wie bereits angedeutet, für eine semiotische Anatomie eine wichtige Rolle. Im Unterschied dazu sind in der Gegenwelt des Immunsystems Programme für eine Auseinandersetzung mit der Umgebung gespeichert, die außerhalb unserer bewußten Erlebnismöglichkeiten liegen. Trotzdem gibt es Verbindungen zwischen beiden Systemen, die interessante Fragen bezüglich ihrer Integration zu einer gemeinsamen Innenwelt aufwerfen. Diese Fragen haben sogar eine neue wissenschaftliche Disziplin, die Psycho-Neuro-Immunologie ins Leben gerufen. Sie befaßt sich mit Wechselwirkungen zwischen Psyche und Immunsystem. 9.2. Die Psyche als Übersetzerin von Gegenwelt in Welt Aber was haben wir uns unter einer Psyche vorzustellen? Die Antwort lautet: Unsere Psyche ist eine Übersetzerin; sie übersetzt die neurale Gegenwelt, die unser Gehirn aus den Zeichen integriert, die ihm auf verschiedenen Nervenbahnen aus allen Teilen des Organismus und (über die Sinnesorgane) aus der Außenwelt zuströmen, in das, was wir als unseren Körper und unsere Welt erleben. Im Zusammenhang mit dem Begriff Psyche müssen wir uns auch den Begriff Bewußtsein genauer ansehen: Was ist gemeint, wenn wir sagen, Gehirnvorgänge seien im Unterschied zu Vorgängen des Immunsystems „bewußtseinsfähig“? Genau betrachtet, wird damit die paradoxe Situation angesprochen, daß wir für alle „inneren“ (⫽ endosemiotischen) Prozesse, ob sie im Nerven- oder im Immunsystem ablaufen, „Outsider“ sind (wir müssen sie uns durch komplizierte Methoden sichtbar machen und können ihre Botschaften nur verstehen, wenn wir sie biosemiotisch interpretieren), daß wir aber „Insider“ aller Zeichenprozesse sind, die uns eine äußere Welt und unseren Körper als bewußte Wirklichkeiten erleben lassen. Die Aussage, die inneren Zeichenprozesse des Gehirns seien zwar, genau wie alle inneren (⫽ endosemiotischen) Abläufe, unserem bewußten Erleben unzugänglich, sie seien aber im Unterschied zu allen anderen Endosemiosen bewußtseinsfähig, heißt daher im Klartext, daß alle bewußt erlebten äußeren Wirklichkeiten Übersetzungen der unserem Erleben und Verste-
21. Endosemiose
hen unzugänglichen inneren Zeichenprozesse des Gehirns sind! Das klingt kompliziert, wird aber verständlicher, wenn wir uns erinnern, daß innen und außen zunächst semiotische Begriffe sind, die erst im Zusammenhang mit unserer Motorik eine räumliche Bedeutung bekommen. Darüber hinaus wird hier deutlich, daß Bewußtheit und Bewußtseinsfähigkeit emergente Phänomene sind, d. h. Phänomene, die mit dem Sprung von einer (endosemiotischen) Integrationsebene zu der komplexeren (psychosemiotischen) unerwartet und unableitbar aus Elementarzuständen, gewissermaßen „aus dem Nichts“ heraus, in Erscheinung treten. Die folgenden Ausführungen sollen die Dynamik dieses Geschehens illustrieren. 9.3. Der erlebte Körper als Übersetzung der Gegenwelt des Nervensystems. Phantom- und Skotom-Glieder Wir haben dargestellt, daß in der Gegenwelt des Nervensystems die „Einheit aus Wahrnehmen und Bewegen“ (v. Weizsäcker 1950) durch den Aufbau von Programmen für „sensomotorische Zirkulärreaktionen“ (Piaget 1937) vorbereitet ist. Diese Gegenwelt muß in die Welt übersetzt werden, die wir als unsere Wirklichkeit wahrnehmen und bewußt erleben. Diese Welt hat eine wichtige biologische Funktion: Sie setzt uns instand, uns motorisch, d. h. durch aktive Eigenbewegungen mit unserer Umgebung auseinanderzusetzen, eine Fähigkeit, die (wie oben in § 1. betont wurde) einfachere Systeme, z. B. Pflanzen, noch nicht haben. Unser bewußtes Ich ist eine psychische Instanz, die in erster Linie sensorische Informationen des Gehirns in Orientierungs-Zeichen für unser motorisches Verhalten übersetzt (Freud 1911, 229). Unter diesen sensorischen Informationen sind die des Muskelsinnes von besonderem Interesse. Sie informieren das Ich in jedem Augenblick nicht nur über die genaue Lage aller Glieder des Körpers, sondern auch darüber, daß wir überhaupt einen Körper besitzen. Der Neurologe Oliver Sacks (1989) hat als Patient erlebt, was geschieht, wenn diese Informationen ausbleiben oder nicht mehr in ein Körper-Erleben übersetzt werden. Er hat diese Erfahrungen in einem spannenden Erlebnisbericht publiziert. Es gibt rätselhafte Krankheitsbilder, die als Störung des Körperschemas bzw. als Übersetzungsfehler verständlich werden. Das bekannteste von ihnen ist das oft und eingehend beschriebene, aber kaum verstandene
483 Krankheitsbild des Phantomschmerzes. Darunter versteht man Schmerzen in einem amputierten, d. h. gar nicht mehr vorhandenen Glied. Hier spielen die fehlenden Meldungen über Muskelbewegungen insofern eine Rolle, als die Patienten zwar Schmerzen in einem fehlenden Glied verspüren, aber über seine Lage keine sicheren Angaben machen können. Das Gegenstück zum Phantom-Glied bildet ein Krankheitsbild, das Sacks erlebt und als Skotom-Glied beschrieben hat. Dabei ist das Glied zwar anatomisch intakt, wird aber als ein nicht zum eigenen Körper gehöriges, fremdes Gebilde erlebt. Sacks schildert seine Erfahrung nach einer Operation, die durch einen Unfall notwendig geworden war. Während er das operierte Bein betrachtet, von dem der Gipsverband entfernt worden war, stellte er verwundert und äußerst befremdet fest: „Ja da war es! Es war nicht zu bestreiten. […] Ein Bein ⫺ und doch kein Bein: Irgendetwas war hier ganz falsch. […] In einem normalen, faktischen Sinn war es tatsächlich ‘da’. Es war sichtbar, aber es war nicht lebendig, stofflich, wirklich ‘da’. Was da vor mir lag, war kein wirkliches Bein, war überhaupt nichts Wirkliches. […] Mir wurde klar, daß ich ein dem Anschein nach anatomisch vollkommenes Bein hatte, das fachmännisch operiert und komplikationslos geheilt war und mir dennoch von Anblick und Gefühl gespenstisch fremd war, eine leblose Attrappe, die an meinem Körper hing“ (Sacks 1989, 91).
In diesem Augenblick erinnerte er sich an einen Patienten, zu dem er als junger Arzt gerufen worden war, dessen Beschwerden er damals nicht verstanden hatte: „Ich dachte an sein verängstigtes Gesicht und die Bestürzung, mit der er flüsterte: ‘Das ist nichts weiter als eine Fälschung. Es ist nicht echt. Es ist nicht mein Bein’ “ (Sacks 1989, 91).
Was war geschehen? In beiden Fällen waren die propriozeptiven Informationen ausgeblieben oder hatten die zuständigen Areale des Gehirns nicht erreicht. Beide Beispiele zeigen eindrucksvoll, daß unser lebendiger, von uns als Zentrum unserer Wirklichkeit erlebter Körper das Korrelat eines neuralen Gegenkörpers ist, der sich in unserem Gehirn ständig durch den permanenten Informationsfluß propriozeptiver Zeichen aus den Muskeln, Gelenken und Sehnen unserer Gliedmaßen bildet und umbildet. Dieser neurale Gegenkörper bildet das Zentrum in einer neuralen Gegenwelt, die unser Gehirn aus dem ebenso permanenten Zustrom senso-
484 rischer Zeichenprozesse unserer Sinnesorgane auf- und umbaut. Gegenkörper und Gegenwelt sind zu einer unlösbaren Einheit vernetzt, weil alle Vorgänge, die wir in der Welt wahrnehmen, Gegenleistungen zu realen oder potentiellen Leistungen unserer Motorik sind und mit diesen zusammen das Raster des Raumes aufbauen, in dem wir uns orientieren. Das erklärt die unheimliche Qualität im Erleben des Phantom-Gliedes: Es ist sichtbar und greifbar vorhanden und trotzdem unwirklich. 9.4. Psycho-Neuro-Immunologie oder: die Vernetzung der Gegenwelten zu einer Innenwelt Unsere Darstellung der Übersetzung einer unbewußten neuralen Gegenwelt in eine bewußt erlebte körperliche Wirklichkeit enthält eine Ungenauigkeit: Wir haben nicht erwähnt, daß sich in dieser Übersetzung auch Einflüsse widerspiegeln können, die vom Immunsystem stammen bzw. von der von ihm aufgebauten Gegenwelt für Programme zur Bekämpfung nicht wahrnehmbarer Schadstoffe unserer Umgebung. Für gewöhnlich bemerken wir von solchen Einflüssen nichts. Wenn wir aber z. B. im Verlauf einer Infektionskrankheit Fieber bekommen, kann unser Wirklichkeitserleben durch fiebererzeugende Stoffe, die von dem Immunsystem produziert werden, deutlich verändert sein. Umgekehrt gibt es auch deutliche Hinweise darauf, daß Vorgänge, die wir psychisch, d. h. in unserer Wirklichkeit erleben, das Immunsystem (über das Nervensystem) in Mitleidenschaft ziehen können. Den eindrucksvollsten Beweis dafür, daß Zeichenverbindungen die neurale und die immunologische Gegenwelt zu einer einheitlichen Innenwelt vernetzen, liefern Untersuchungen, die zeigen, daß Immunvorgänge konditioniert werden können. Semiotisch handelt es sich bei der Konditionierung um eine Bedeutungskoppelung zwischen psychisch erlebten Vorgängen und endosemiotisch gesteuerten Prozessen im Organismus. Das klassische Beispiel dafür sind die Versuche, in denen Pawlow zeigte, daß die Magensaftsekretion von Hunden durch einen Glokkenton hervorgerufen werden kann, wenn der Glockenton nur lange genug gleichzeitig mit angeborenen Sekretionsreizen, z. B. dem Geruch von Futter, gekoppelt war. Ader (1981) hat im Tierversuch nachgewiesen, daß es möglich ist, Immunvorgänge durch die Gabe von Süßstoff zu hemmen,
III. Arten der Semiose
wenn der Süßstoff vorher zusammen mit einem Mittel gegeben war, das eine hemmende Wirkung auf das Immunsystem ausübt. Umgekehrt war nun auch die Wirklichkeit der Versuchstiere verändert: Sie mieden den vorher begehrten Süßstoff! Das zeigt, daß die neurale und die immunologische Gegenwelt zu einer gemeinsamen Innenwelt integriert werden und daß erst diese in eine erlebte Wirklichkeit übersetzt wird. Diese gemeinsame Innenwelt würde dann einer vierten endosemiotischen Integrationsebene entsprechen. Inzwischen kennt man eine Reihe von Stoffen, die als Vehikel für Zeichenprozesse zwischen dem Nervensystem und dem Immunsystem dienen. Die erste Art dieser Stoffe sind die uns schon bekannten Neurotransmitter. Von diesen sind Noradrenalin und Adrenalin wesentlich an der Regulation des Immunsystems beteiligt. Man weiß aber noch nicht, welche Vorgänge dafür im einzelnen verantwortlich sind (Literatur bei Klosterhalfen und Klosterhalfen 1996). Eine zweite Art von Zeichenverbindungen wird durch die ⫺ mit psychischen Vorgängen assoziierten ⫺ Neurohormone hergestellt. Von ihnen weiß man, daß sie auf den Verlauf von Krankheiten einen Einfluß nehmen, bei denen das Immunsystem eine Abwehrfunktion hat. Sie werden gewöhnlich unter der Überschrift „Streßhormone und Immunität“ zusammengefaßt. Am bekanntesten sind die Glucocorticosteroide. Sie können in geringer Menge die Abwehr fördern; in höherer Konzentration haben sie jedoch einen immunosuppressiven, entzündungshemmenden Effekt und setzen die Resistenz gegen Infektionen herab (Literatur s. oben). Bei diesen und anderen, ähnlich wirkenden Stoffen muß man daran denken, daß sie die Ansprechbarkeit der Immunzellen auf Zeichen offenbar durch Veränderung ihres Interpretanten modifizieren. Darüber hinaus reagiert das Nervensystem auf Vorgänge im Immunsystem (Besedovsky u. a. 1986): Während einer Immunreaktion findet sich eine erhöhte neuronale Aktivität im ventromedialen Hypothalamus. Lymphocyten können einen „glucocorticoid releasing factor“ produzieren, der über die Hypophyse den Corticoid-Spiegel im Blut erhöht und auf diese Weise überschießende immunologische Reaktionen verhindert. Aber auch das von Lymphocyten gebildete Interleukin 1 kann die ACTH- bzw. Corticoid-Sekretion stimulieren (Besedovsky u. a. 1986).
Man hat bei Menschen, die verschiedenartigen Streß-Situationen ausgesetzt waren (bei
21. Endosemiose
Astronauten, bei Witwen und Witwern und bei Studenten in Prüfungssituationen) Reaktionen des Immunsystems untersucht. In allen diesen Studien wurden deutliche Effekte der belastenden Ereignisse auf das Immunsystem festgestellt: Bei Astronauten wurde die Mitogenstimulation gehemmt, d. h. ihre Lymphocyten reagierten nicht mehr auf Stoffe, die als Vehikel für Zeichen dienen, die gewöhnlich eine Teilung auslösen. Interessanterweise waren dafür nicht Streßhormone verantwortlich, sondern die Schwerelosigkeit schien einen direkten Effekt auf die Interpretanten der Zellen zu haben. Untersuchungen über die Auswirkung von Verlusterlebnissen bei Witwen und bei Männern, deren Ehefrauen an Brustkrebs erkrankt waren, zeigten deutliche Effekte auf das Verhalten der Immunzellen. Es war nicht nur die Teilungsrate der Lymphocyten vermindert; es kam auch zu einer Hemmung der Aktivität der Killerzellen, d. h. jener spezialisierten Lymphocyten, die eingedrungene Viren und Bakterien direkt vernichten können. Semiotisch muß man auch diese Reaktionen wieder als Ausdruck einer Änderung der Interpretanten deuten. Diese Untersuchungen gewinnen im Zusammenhang mit der Frage, ob psychische Faktoren bei Patienten, die mit dem HIV-Virus infiziert sind, den Ausbruch und den Verlauf der Erkrankung an Aids beeinflussen können, eine neue Aktualität. Gerade bei Aids-Erkrankungen, insbesondere bei dem ihnen zugrunde liegenden Immundefekt, läßt sich die Bedeutung der semiotischen Funktion des Erkennens von Zeichen eindrucksvoll bestätigen: Eine wichtige Spezifität des Aids-Virus, nämlich seine Vorliebe für einen bestimmten Zelltypus, die T4-Zellen, findet ihre Erklärung darin, daß ein bestimmter Bereich auf ihrer Zellmembran dem Virus als Rezeptor dient. Dieser Bereich ist mit dem T4-Marker assoziiert, also ein Protein, in dem sich T4-Zellen von anderen Lymphocyten unterscheiden. An dieser Stelle setzt sich das Virus als erstes fest, wenn es die Zelle befällt.
Auch die Frage, ob psychische Faktoren einen Einfluß auf den Ausbruch und den Verlauf einer Krebserkrankung haben, wird diskutiert. Zur Zeit fehlen dafür noch zwingende Beweise (Hürny 1996). Langfristig gesehen berechtigen diese Forschungen jedoch zu Hoffnungen auf präventive und therapeutische Möglichkeiten (Klosterhalfen und Klosterhalfen 1996). Auf kaum einem anderen Gebiet der Medizin wächst unsere Kenntnis so rasch wie auf
485 dem Gebiet der Psycho-Neuro-Immunologie. Je mehr wir über die hochkomplexen Zusammenhänge erfahren, umso deutlicher sehen wir aber auch, wie lückenhaft unser Erkenntnisstand noch ist. Ständige Auf- und Abwärtseffekte zwischen den verschiedenen endosemiotischen Integrationsebenen sowie zwischen den beiden Gegenwelten verlangen ein hochkomplexes, integratives Modell, dessen Entwicklung In-vitro- und In-vivo-Untersuchungen erfordert und das bisher nur bruchstückhaft zur Verfügung steht. Immerhin kann in der heutigen frühen Forschungsphase als gesichert gelten, daß 1) die neurale und die immunologische Gegenwelt intensiv miteinander interagieren, 2) Neurotransmitter- und endokrine Zeichenprozesse die Funktion des Immunsystems umfassend beeinflussen und 3) Zytokine als Teilaspekte der immunologischen Gegenwelt die neurale Gegenwelt ⫺ und zwar sowohl unter Gesundheits- wie unter Krankheitsaspekten ⫺ maßgeblich mitgestalten (Felten u. a. 1993).
10. Zusammenfassung: der Beobachter als Meta-Interpret Welche Antwort können wir zum Abschluß dieser Darstellung auf die biosemiotische Gretchenfrage geben, ob ein menschlicher Beobachter wirklich die Zeichen fremder Lebewesen entziffern kann? Wir haben gesehen, daß wir es mit Interpretationsproblemen zu tun haben und daß Interpretationsprobleme Übersetzungs-Probleme sind. Übersetzungen kann man als „Bedeutungs-Koppelungen“ auffassen. Übersetzungen, die uns endosemiotische Zeichenprozesse zugänglich machen sollen, müssen endosemiotische Bedeutungen mit Wortbedeutungen koppeln. Bei diesem Unterfangen handelt es sich um Meta-Interpretationen, bei denen der Beobachter seine Beobachtungen über das Verhalten von Zellen zu ihrer Umgebung als deren Reaktionen auf ihre Interpretationen interpretieren muß. Dazu muß er unterstellen, daß die Zellen Einwirkungen der Umgebung auf ihre Rezeptoren zu Zeichen kodieren und daß diese Zeichen ihr Verhalten zu ihrer Umgebung steuern. Um solche Unterstellungen in Aussagen zu verwandeln, die empirisch nachprüfbar sind, muß der Beobachter zunächst (in einer Semiose der Information; vgl. Art. 19 § 3.) die physikalisch-chemischen Eigenschaften der
486 Umgebung (in dem Beispiel des Immungeschehens die physikalisch-chemischen Eigenschaften des Antigens) und deren Einwirkungen auf den Rezeptor der beobachteten Zelle (⫽ die physikalisch-chemische Interaktion mit den entsprechenden Abschnitten des Rezeptors, die „Ideotope“ genannt werden) als quasi mechanischen Vorgang (d. h. signetisch; vgl. Art. 19 § 6.) deuten. Dann muß er (in einer Semiose der Symptomatisation, d. h. signemisch) aus dem Zustand oder dem Verhalten der Zelle auf deren Interpretanten schließen, der den Veränderungen des Rezeptors die Bedeutung als Zeichen erteilt, das die Antwort der Zelle steuert. Aber nachdem wir uns als Beobachter so verhalten und unser Verhalten in dieser Weise interpretiert haben, stehen wir vor dem erkenntnistheoretischen Problem: Wie sollen wir begründen, daß wir (als Menschen) lebenden Systemen, die biologisch weit von uns entfernt sind, Deutungen „übergestülpt“ haben, die aus unseren menschlichen Erfahrungen abgeleitet sind? Woher nehmen wir die Berechtigung, anthropomorph von „Zeichen“ und „Semiosen“ zu sprechen und endosemiotische Zeichen zu postulieren, deren Bedeutungen mit den Bedeutungen menschlicher Sprach-Zeichen gekoppelt bzw. in menschliche Zeichen übersetzt werden können? Die Antwort auf diese Frage ist durch die Feststellung vorbereitet, daß sich alle Lebensvorgänge zwischen Variationen eines Selbst abspielen, das sich als Nicht-Selbst begegnet. Eine Form der Variation, die für die Antwort auf unsere Frage wichtig wird, haben wir als Bildung komplexerer Zeichen aus einfacheren Zeichen kennengelernt. Es ist sicher noch eine Aufgabe der Zukunft, genau zu untersuchen, ob und wieweit Zeichen komplexer Integrationsebenen als Integrationsprodukte aufgefaßt werden können, in denen Zeichen einfacherer Ebenen zu komplexeren Einheiten zusammengeschlossen sind. Wir haben aber die Beobachtungen erwähnt, welche die Annahme stützen, daß einfachere Zeichen, wie sie z. B. auf einer endosemiotischen Ebene zwischen Zellen ausgetauscht werden, Stufe für Stufe zu komplexeren Zeichen „com-putiert“ und damit integriert werden. Auch die Beobachtungen über „semiotische Abstimmungs-Republiken“, in denen sich Zellen des Immunsystems, des Nervensystems und schließlich sogar frei lebende Vögel, zu komplexeren Einheiten integrieren, sind Beispiele für solche Vorgänge, die sich als Organisationsprinzipien des Lebens dar-
III. Arten der Semiose
stellen (vgl. Art. 18 § 4.2.3., Art. 20 § 6. und Art. 138 § 3.). Dem Einwand des Anthropomorphismus kann damit die genetische Antwort erteilt werden, daß sich eine systemisch-semiotische Naturordnung abzuzeichen beginnt, in welcher einfache Zeichen in immer komplexere integriert werden, und daß in diesem systemisch gegliederten Zeichen-Universum auch dem Menschen sein Platz als Empfänger und Sender von Zeichen zugewiesen ist (zum Begriff der Semiosphäre vgl. Art. 118).
11. Literatur (in Auswahl) Ader, R. (1981), Psychoneuroimmunology. New York: Academic Press. Antonovsky, A. (1987), „The Salutogenetic Perspective: Toward a New View of Health and Illness“, Advances 4: 47⫺55. Bateson, G. (1985), Ökologie des Geistes. Frankfurt a. M.: Suhrkamp. Bertalanffy, L. V. (1968), General Systems Theory. New York: Braziller. Besedovsky, H., A. Del Rey, E. Sorkin und C. A. Dinarello (1986), „Immunoregulatory Feedback between Interleukin-I and Glucocorticoid Hormones“, Science 233: 652⫺654. Cannon, W. B. (1953), Bodily Changes in Pain, Hunger, Fear and Rage. An Account of Recent Researches into Function of Emotional Excitement. Boston: Branford. Deutsch: Wut, Hunger, Angst und Schmerz. München: Urban und Schwarzenberg 1975. Dawkins, R. (1976), The Selfish Gene. Oxford: Oxford University Press. Deutsch: Das egoistische Gen. Berlin, Heidelberg und Wien: Springer 1978. Emmeche, C. und J. Hoffmeyer (1987), The Semiotics of Nature. I: The Linguistic-Genetic-Analogy. Unpublished. Felten, D. L., S. Y. Felten, D. L. Bellinger und K. S. Madden (1993), „Fundamental Aspects of Neuro-Immune Signaling“, Psychotherapy and Psychosomatics 60: 46⫺56. Freud, S. (1911), „Formulierungen über die zwei Prinzipien des psychischen Geschehens“. In: Gesammelte Werke, Bd. 8. Frankfurt a. M.: Fischer. Hoffmeyer, J. und C. Emmeche (1991), „Code Duality and the Semiotics of Nature“. In: M. Andersen und F. Merrell (eds.), On Semiotic Modeling. Berlin und New York: Mouton de Gruyter: 117⫺166. Hürny, Ch. (1996), „Psychische und soziale Faktoren in der Entstehung und im Verlauf maligner Erkrankungen“. In: Th. v. Uexküll u. a. (eds.), Psychosomatische Medizin. 5. Aufl. München: Urban und Schwarzenberg.
21. Endosemiose Jacquemart, F. und A. Coutinho (1988), „Observer, Immune System and Their Respective Objects (About Self ⫺ Non Self Discrimination)“. In: E. Sercarz u. a. (eds.), The Semiotics of Cellular Communication in the Immune System. (NATO ASI Series, Vol. H 23) Berlin und Heidelberg: Springer: 173⫺181. Jakobson, R. (1969), Kindersprache, Aphasie und allgemeine Lautgesetze. Frankfurt a. M.: Suhrkamp. Jerne, N. K. (1985), „The Generative Grammar of the Immune System“, Science 229: 1057⫺1059. Kiefer, P. und K. Havemann (1988), „Wachstumsfaktoren, Rezeptoren und Krebs“, Der Internist 29: 430⫺437. Klaus, G. (1973), Semiotik und Erkenntnistheorie. München: Fink. Klosterhalfen, W. und S. Klosterhalfen (1996), „Psychoimmunologie“. In: Th. v. Uexküll u. a. (eds.): Psychosomatik. München: Urban und Schwarzenberg. Knudson, A. G. (1973), „Mutation and Human Cancer“, Advances in Cancer Research 17: 317. Köhler, H., J. Urbain und P. A. Cazenave (eds.) (1984), Idiotypy in Biology and Medicine. New York: Academic Press. Köpchen, H. P., D. Klüßendorf und D. Sommer (1981), „Neurophysiological Background of Central Neural Cardiovascular-Respiratory Coordination: Basic Remarks and Experimental Approach“, Journal of the Autonomous Nervous System 3: 335⫺368. Krampen, M. (1981), „Phytosemiotics“, Semiotica 36: 187⫺209. Krampen, M. u. a. (1981), Die Welt als Zeichen. Klassiker der modernen Semiotik. Berlin: Severin und Siedler. Lorenz, K. (1927), „Beobachtungen mit Dohlen“, Journal der Ornithologie 75: 67⫺127. Lüscher, H. R. (1983), „Selbstorganisation als Ordnungsprinzip im Zentralnervensystem“, Vierteljahresschrift der Naturforschenden Gesellschaft Zürich 128: 167⫺180. Lüscher, H. R. (1984/85), „Komplexität und Stabilität im Zentralnervensystem“, Bulletin der Schweizerischen Akademie der Medizinischen Wissenschaften 85: 59⫺75. Maelike, A. (1985), „Zell-zu-Zell-Kommunikation durch Gap-junctions“, Nachrichten aus Chemie, Technik und Laboratorium 33: 976⫺977. Maturana, H. und F. Varela (1988), Der Baum der Erkenntnis. München: Scherz-Verlag. Mountcastle, V. B. (1975), „The View from Within. Pathways to the Study of Perception“, Johns Hopkins Medical Journal 136: 109⫺131.
487 Nossal, G. J. V. (1988), „Wie Zellen Antikörper bilden“. In: Immunsystem. Heidelberg: Spektrum der Wissenschaft. Nöth, W. (1985), Handbuch der Semiotik. Stuttgart: Metzler. Peirce, C. S. (1960), Collected Papers of Charles Sanders Peirce. Charles Hartshorne and Paul Weiss (eds.), 8 Vols. Cambridge MA: Harvard University Press. Peirce, C. S. (1988), Naturordnung und Zeichenprozeß. Aachen: Alano Verlag. Piaget, J. (1936), „Das Erwachen der Intelligenz beim Kinde“. In: Gesammelte Werke, Bd. I. Stuttgart: Klett 1969. Piaget, J. (1937), „Der Aufbau der Wirklichkeit beim Kinde“. In: Gesammelte Werke, Bd. II. Stuttgart: Klett 1975. Popper, K. R. und J. C. Eccles (1977), The Self and Its Brain. New York: Springer. Deutsch: Das Ich und sein Gehrin. München: Piper 1982. Roitt, I. M., J. Brostoff und D. K. Male (1989), Immunology. 2. Aufl. Edinburgh: Churchill Livingstone. Sacks, O. (1989), Der Tag, an dem mein Bein fortging. Reinbek: Rowohlt. Sebeok, Th. A. (1979), Theorie und Geschichte der Semiotik. Reinbek: Rowohlt. Staines, N., J. Brostoff und K. James (1986), Immunologisches Grundwissen. Stuttgart: Fischer. Tembrock, G. (1975), Biokommunikation. Reinbek: Rowohlt. Uexküll, J. v. (1905), Leitfaden in das Studium der experimentellen Biologie der Wassertiere. Wiesbaden: Bergmann. Uexküll, J. v. (1909), Umwelt und Innenwelt der Tiere. Berlin: Springer. Uexküll, J. v. (1940), „Bedeutungslehre“. Bios 10. Leipzig. Uexküll, Th. v. (1963), Grundfragen der Psychosomatischen Medizin. Reinbek: Rowohlt. Weizsäcker, V. v. (1950), Der Gestaltkreis. Theorie der Einheit von Wahrnehmen und Bewegen. 4. Aufl. Stuttgart: Thieme. Welter, C., K. D. Zang und N. Blin (1989), „Tumor-Suppressergene“, Deutsche Medizinische Wochenschrift 114: 1496⫺1502. Wieser, W. (1990), „Die Herausforderung der Evolutionsbiologie: an wen?“, Merkur 44: 58⫺63.
Thure von Uexküll, Freiburg, Werner Geigges, Glottertal, und Jörg M. Herrmann, Glottertal (Deutschland)
488
III. Arten der Semiose
22. Mykosemiose 1. Definition der Pilze als systematische Gruppe 2. Historische Zwischenbemerkungen 3. Semiose bei Pilzen 3.1. Signale aus der Umwelt und Irritabilität 3.2. Mykosemiose in Beispielen 4. Interaktionen zwischen Pilzen und Pflanzen 4.1. Parasitische Pilze und pflanzlicher Wirt 4.2. Flechten-Symbiose 5. Interaktionen zwischen Tieren und Pilzen 6. Das Verhältnis des Menschen zu Pilzen 7. Ökologischer Ausblick 8. Literatur (in Auswahl)
Es ist zweifellos ein recht kühnes, aber unbedingt reizvolles Unternehmen, semiotische Prozesse bei Pilzen in den Kontext des vorliegenden Handbuches einzugliedern, ohne den Rahmen zu sprengen. Andererseits bieten gerade die Pilze, die in ihren Ursprüngen vieles mit den Tieren gemein haben, eine erstaunliche Vielfalt an Struktur- und Funktionsentwicklungen, die in ähnlicher Form auch bei hoch entwickelten Vielzellern vorkommen, so daß sie schon häufig als „einfache Modellsysteme“ zum Studium grundlegender biologischer Fragestellungen herangezogen worden sind. Bevor auf das eigentliche Thema eingegangen wird, sollten zunächst die wesentlichen Kennzeichen der Pilze herausgestellt werden, um sie von den übrigen Organismengruppen ⫺ soweit möglich ⫺ abzugrenzen.
1.
Definition der Pilze als systematische Gruppe
Pilze sind ihren Eigenschaften entsprechend weder Pflanzen noch Tiere, ebensowenig sind sie Bakterien. So verwundert es nicht, daß diese Organismengruppe mit mindestens 90 000 derzeit bekannten und über 300 000 geschätzten Arten lange Zeit zwar von den Botanikern als „untypische Sporenpflanzen“ geduldet wurde, heute jedoch meist in einem zusätzlichen fünften Organismenreich (lat. „Fungi“) zusammengefaßt und dieses zwischen Pflanzen und Tiere eingegliedert wird (s. Abb. 22.1). Typische Pilze bilden wie Pflanzenzellen eine feste formgebende Zellwand aus, die sie bewegungsunfähig macht; bezeichnenderweise besteht das Zellwandgerüst meist jedoch nicht wie bei Pflanzen aus Cellulose, sondern aus Chitin, das z. B. Insekten und Krebse als Gerüstsubstanz benut-
zen. Im Gegensatz zu Pflanzen besitzen Pilze auch keine jener Pigmente (Chlorophylle u. a.), die den Pflanzen die Fähigkeit verleihen, unter Ausnutzung von Lichtenergie aus Wasser und Kohlendioxid (CO2 aus der Luft) organische Kohlenstoffverbindungen (Zukker) zu synthetisieren. Man nennt diese Fähigkeit der Pflanzen „Photosynthese“ und die darauf basierende Ernährungsweise „Kohlenstoff-Autotrophie“. Die Abhängigkeit von organisch gebundenem Kohlenstoff zur Dekkung des eigenen Bedarfes, welche die Pilze mit den Tieren ⫺ einschließlich des Menschen ⫺ und den meisten Bakterien gemein haben, nennt man „Kohlenstoff-Heterotrophie“. Durch das Vorhandensein einer den lebenden Teil der Zelle (Protoplast) umschließenden Zellwand sind die Pilze jedoch nicht in der Lage, partikuläre organische Nahrung aufzunehmen. Sie müssen vielmehr abbauende Enzyme ausschleusen, um außerhalb der Zellen die höhermolekularen Verbindungen (z. B. Stärke, Eiweiße) soweit zu spalten, daß sie aufgenommen werden können. Auf dieser Besonderheit beruhen die üblicherweise gebrauchten Begriffe, nach denen die zellwandlosen tierischen Zellen als Konsumenten (Verbraucher), die zellwandbildenden Pilze und die Mehrzahl der Bakterien als Destruenten (Zerstörer) charakterisiert und den Pflanzen als Primärproduzenten organischer Substanz, von der die anderen Organismen leben, gegenübergestellt werden. Gerade durch diese Zersetzer-Eigenschaft kommen Pilze oft in Konflikt mit den Interessen des Menschen und werden dann als Schädlinge bekämpft. Ökologisch betrachtet haben Pilze jedoch ihren festen Platz in der Erhaltung des Gleichgewichtes zwischen der Synthese und Remineralisierung organischer Verbindungen. Schließlich muß man fragen, warum man die Pilze nicht zu den Bakterien rechnet, zumal sie in der Natur aufgrund ähnlicher Bedürfnisse eigentlich immer mit Bakterien vergesellschaftet vorkommen. Dafür gibt es eigentlich nur einen Grund, dieser ist aber um so stichhaltiger: In der Evolution der Lebewesen kennen wir nur eine gravierende Diskontinuität, einen Bruch, der vor etwa einer Milliarde Jahren erfolgt sein mag und bis heute klar erkennbar geblieben ist. Danach unterscheidet man zwei grundsätzliche Organisationsstufen, die prokaryotische und die eukaryotische: Prokaryo-
22. Mykosemiose
489
Abb. 22.1: Schematische Einordnung der Organismen in 5 Reiche. Von den ca. 1,5 Mio. heute bekannten Arten gehören etwa 1,1 Mio. zu den Tieren (30 000 Urtiere ⫽ Protozoen), etwa 290 000 zu den Pflanzen (30 000 Algen), etwa 90 000 zu den Pilzen (2000 niedere Pilze) und etwa 17 000 zu den Bakterien. Geschätzt wird die Gesamtartenzahl jedoch auf 5⫺10 Mio., wobei weitaus höhere Zahlen bei den Bakterien (800 000?) und bei den Pilzen (300 000?) sowie bei den Insekten, die jetzt schon über die Hälfte der Tierarten stellen, geschätzt werden (aus der Denkschrift einer Expertenrunde der Deutschen Forschungsgemeinschaft, 1982).
tisch sind alle Bakterien, eukaryotisch alle übrigen, höher entwickelten Organismen. Obgleich diese Begriffe lediglich auf das Vorhandensein eines echten, von einer Doppelmembran abgegrenzten und sich nach den klassischen Regeln teilenden Zellkerns (Eukaryon) verweisen gegenüber einem primitiven, freiliegenden Kernäquivalent (Prokaryon), erstrecken sich die Unterschiede auf die gesamte zelluläre Organisation. Funktionell sind die meisten Grundfähigkeiten auch
bei Bakterien schon vorhanden, aber die dafür verantwortlichen Strukturen sind wesentlich undifferenzierter. Da es intrazelluläre Kompartimente (Organellen) in Eukaryontenzellen gibt, die eigene Gene besitzen und etwa die Organisationsstufe einer (ehemaligen) Prokaryontenzelle aufweisen, diskutiert man heute als plausible Möglichkeit die Entstehung der eukaryotischen Organismen durch eine bzw. mehrere Symbiosen. Dabei könnten prokaryotische Urformen aufge-
490
III. Arten der Semiose
nommen, in einem Evolutionsprozeß partiell degradiert und schließlich als semiautonome Organellen in die ehemalige Wirtszelle integriert worden sein.
2.
Historische Zwischenbemerkungen
Aus der heute wissenschaftlich begründeten Zwischenposition der Pilze kann man sich leicht vorstellen, wie schwer es in den Anfängen der Pilzgeschichte war, ihr Wesen zu erkennen. Theophrast (ca. 300 v. Chr.), berühmter Schüler von Aristoteles, war wohl der erste Grieche, der in seiner Historia plantarum Pilze erwähnte und sich ausgerechnet mit den Trüffelpilzen auseinandersetzte. Er beschreibt sie als „ohne Wurzeln, Stamm, Zweige, Blätter, Blüten oder Früchte, ohne Rinde, Mark, Fasern noch Adern“, und diese Negativdefinition zog sich als Kennzeichnung der Pilze über Jahrhunderte hin. Kaum eine andere Organismengruppe hat so viel Mystisches auf sich vereinigt wie die Pilze, deren Fruchtkörper nach herbstlichen Gewitterregen plötzlich aus dem Boden sprießen. Den eigentlichen Pilz, der jahrzehntelang im Boden oder im Holz lebt, erkannte man noch nicht. Insbesondere die Giftigkeit und halluzinogene Wirkung mancher Hutpilze (z. B. Amanita muscaria/Fliegenpilz oder Psilocybe mexicana/mexikanischer Rauschpilz) förderte über Jahrhunderte den Glauben an die außerirdische Herkunft der Pilze und ihre religiösen Kräfte. Über die „Pilzsteine“ der Mayas, das „Gottesfleisch“ (Teonanacatl) der Azteken und vieles andere berichtet Ainsworth (1976) in seinem faszinierenden Buch über die historischen Hintergründe der Pilze. Die eigentliche Mykologie wurde im Grunde erst durch Pier’Antonio Micheli begründet, dessen Schrift Nova plantarum genera 1729 erschien, zu einer Zeit also, wo Carl von Linne´ sich bereits mit den heute noch gültigen Grundlagen der taxonomischen Nomenklatur der höheren Pflanzen befaßte. Mit der Erfindung des Mikroskops (1590) waren erstmals die Voraussetzungen gegeben zum Studium der Mikropilze, zu denen die Mehrzahl der Pilze gehört. Aber erst 1665 veröffentlichte R. Hooke, der Begründer der „Zellenlehre“, die ersten Illustrationen eines Köpfchenschimmels und eines Rostpilzes in seiner Micrographia. Obwohl heute die meisten Pilze wegen ihrer Kleinheit (z. B. Hefen mit etwa 5⫺10 mm großen Individuen) als Mikroorganismen einzustufen sind, gibt
es andererseits die Großpilze, die schon durch ihre weithin sichtbaren Fruchtkörper auffallen. Hierzu gehört auch der Riesenbovist, dessen fußballähnliche Fruchtkörper bis 5 kg Gewicht und über 50 cm im Durchmesser erreichen können (geschätzte Sporenzahl eines Fruchtkörpers 7 ⫻ 1012!) und deren Lebensspanne einige 100 Jahre betragen soll. Auch bezüglich ihrer äußeren Größe nehmen also die Pilze eine breit gestreute Mittelstellung zwischen Mikro- und Makrobiologie ein. Trotz der erreichten Vielzelligkeit sind sie jedoch relativ primitiv geblieben und sind nicht bis zur Organisationsstufe echter Gewebe vorgedrungen.
3.
Semiose bei Pilzen
Um dem primären Anliegen dieses Handbuchs gerecht zu werden, müssen zunächst einige geeignete Teilaspekte aus der Mykologie für eine exemplarische Behandlung ausgewählt werden. Zur Beschreibung dieser Systeme soll der Begriff „Semiose“ als Zeichenprozeß verstanden werden, bei dem es sich ⫺ mehr oder weniger experimentell erwiesen ⫺ um eine funktionale Relation des in Abb. 22.2 skizzierten Typs handelt.
Abb. 22.2: Im Mittelpunkt steht der Signal-Empfänger (A), der über spezifische Rezeptoren für das informative Signal (B) verfügt. Das empfangene Signal wird von (A) entschlüsselt und seine Information (C) in Reaktionen umgesetzt. Signalgeber kann die undefinierte Umwelt sein bzw. ein anderer, definierter Organismus, der über einen SignalRücklauf (Antwort-Signal) mit (A) in Wechselwirkung tritt.
22. Mykosemiose
3.1. Signale aus der Umwelt und Irritabilität Bei den hier betrachteten Signalen handelt es sich in der Regel um chemische Signale (vgl. Art. 9). Faßt man die Signaldefinition sehr weit, fällt letztlich auch ein Substrat wie z. B. Glucose (Traubenzucker), die als verwertbare Kohlenstoff- und Energiequelle von den Rezeptoren des Pilzes „erkannt“ und aus der Umgebung selektiv aufgenommen wird, hierunter. Gerade ein so weit verbreitetes Molekül wie Glucose kann bei bestimmten Pilzen tiefgreifende Veränderungen hervorrufen und nicht nur seinen Stoffwechsel ⫺ z. B. Umstellung der Enzymausstattung von Atmungs- auf Gärungsaktivitäten bei vielen Hefen ⫺ sondern auch seine Wuchsform grundlegend verändern (s. § 3.2.1.). Abgesehen von diesem Beispiel gibt es natürlich unzählige andere Substanzen in der Umgebung, die bei Pilzen (und/oder anderen Organismen) artspezifische und experimentell reproduzierbare Reaktionen auslösen, ohne daß man solche Phänomene bereits als Semiosen bezeichnen möchte. Die Verläßlichkeit der jeweiligen Reaktion ist dennoch auffällig und ermöglichte in vielen Fällen eine wissenschaftliche Bearbeitung der beteiligten Mechanismen. Dabei dürfte eine (oder die) wesentliche Voraussetzung für die Entwicklung differenzierter Semiosen folgendes sein: Es gehört zu den Grundeigenschaften von Lebewesen, seien es einfache Einzeller oder komplexe Vielzeller, irritierbar zu sein. Unter der sogenannten „Irritabilität“ (Reizbarkeit) versteht man im biologischen Sinn „die Fähigkeit, auf eine Änderung der äußeren und inneren Lebensbedingungen in einer Weise zu reagieren, die sich aus der unmittelbar zugeführten Energie allein nicht erklären läßt, sondern auf Energiereserven zurückgreift, die der Organismus selbst zur Verfügung stellt (Auslösemechanismus)“ (Strasburger u. a. 1983, 1). Und so heißt es in der 1991 erschienenen Neuauflage dieses botanischen Standardwerks (Strasburger u. a. 1991, 2): „Alle Organismen und Zellen sind zur Erhaltung des Lebenszustandes darauf angewiesen, Umweltsignale mit Rezeptoren zu empfangen (Perzeption) und in geeignete Reaktionen umzusetzen. Die Vielfalt entsprechender Mechanismen ist außerordentlich groß.“ Diese Reizbarkeit bedeutet im Grunde nichts anderes als eine ständige Bereitschaft eines Individuums (Zelle, Organismus), Signale aus der Umwelt (einschließlich anderer Individuen im gleichen Lebensraum) sowie körpereigene genetisch und/oder biochemisch kodierte Si-
491 gnale wahrzunehmen und adäquat darauf zu reagieren. Nur durch diese Sensitivität und Reaktivität können zum Beispiel Mikroorganismen ihre hohe Anpassungsfähigkeit an Umweltänderungen optimal realisieren. Zum anderen gilt für Mikroorganismen generell, daß aufgrund des bei ihnen stark zugunsten der Oberfläche verschobenen Verhältnisses Volumen/Oberfläche die Wechselwirkungen mit der Umgebung sehr ausgeprägt sind. Dies erklärt nicht nur die bekannt hohen Umsatzraten, die beim mikrobiellen Stoffwechsel unter günstigen Lebensbedingungen erreicht werden. Es erleichtert vielleicht auch das Verständnis dafür, daß bereits auf diesen relativ primitiven Entwicklungsstufen Semiosen ⫺ einschließlich interzellulärer Semiosen ⫺ eine Lebensnotwendigkeit in der ständigen Auseinandersetzung mit der Umwelt darstellen. Über biologisch wirksame chemische Signale weiß man heute bereits eine ganze Menge. Im Bereich der Molekulargenetik geht es dabei um raffiniert verschlüsselte Signale, die z. B. im „Leseraster“ als „Startoder Stopcodons“ auftreten ⫺ und im Gesamtgeschehen der Transkription und Translation genetisch kodierter Informationen auch so verstanden werden (s. hierzu Art. 16 und 18). Demgegenüber ist unsere derzeitige Kenntnis über physikalische Signale ⫺ abgesehen von (sichtbarem) Licht unterschiedlicher Wellenlänge ⫺ als äußerst gering zu bezeichnen. Daß biologische Systeme sowohl auf elektromagnetische Felder reagieren können als auch selbst elektrische Potentiale aufbauen bzw. benutzen, ist zwar bekannt, aber die eigentliche Entwicklung der Biophysik als eigenständige Wissenschaft, wie sie bei der Biochemie seit etwa 20 Jahren in vollem Gange ist, steht wohl noch aus (s. hierzu Art. 10). Dies ist auch der Grund, weswegen die wenigen Beispiele, wo Pilze möglicherweise physikalische Signale benutzen, hier ausgeklammert wurden. 3.2. Mykosemiose in Beispielen Unter denjenigen dem Grundschema in Abb. 22.2 folgenden Semiosen sollen exemplarisch 4 Modellsysteme behandelt werden, die sich dadurch unterscheiden, daß das Signal und dessen biologische Interpretation beim Empfänger jeweils anders ist und modifiziert häufiger vorkommt. ⫺ Das Signal ist eine ubiquitäre, einfache chemische Substanz, hier Glucose (Traubenzucker), die aus der Umwelt stammt;
492 das spezifische Reaktionsmuster des Empfängers ist im Empfänger genetisch vorprogrammiert und gilt nur für diesen (siehe § 3.2.1.). ⫺ Das Signal ist ein spezifisches, entwicklungsstadienabhängig synthetisiertes Stoffwechselprodukt eines artgleichen Individuums; es induziert kooperatives Verhalten auf Populationsebene (siehe § 3.2.2.). ⫺ Das Signal ist wiederum ein spezifisches Stoffwechselprodukt eines artgleichen Partners; sein Empfang führt über ein Antwort-Signal zur sexuellen Erkennung und Verschmelzung der Fortpflanzungsorgane (siehe § 3.2.3.).
III. Arten der Semiose
⫺ Das Signal vermittelt wiederum eine interzelluläre Verständigung unter gleichartigen Individuen und führt zu einer physiologischen Synchronisierung auf Populationsebene. Über die interzelluläre Kopplung wird eine Minimierung der Energieverluste und eine Erhöhung der Überlebenschance erreicht (siehe § 3.2.4.). 3.2.1. Dimorphismus bei „Köpfchenschimmeln“ Bereits vor rund 100 Jahren entdeckte Louis Pasteur ein Kuriosum: Setzte er dem Kulturmedium eines üblicherweise fädig (hyphenförmig) wachsenden Köpfchenschimmels der
Abb. 22.3: Hefe-/Mycel-Dimorphismus eines Köpfchenschimmels (hier: Mycotypha africana). Glucosezusatz zu einem Wachstumsmedium wirkt hier als auslösendes Signal für die adaptive Umstellung des Energiestoffwechsels von Atmung auf alkoholische Gärung und von polar wachsender Mycelform auf apolare Sproßzellenbildung.
22. Mykosemiose
Abb. 22.4: Mikrofotografien der beiden Wuchsformen aus Abb. 22.3. Ohne Glucose im Nährmedium sind die Sporen (kleine Partikel im Bild) zu verzweigten Pilzfäden ausgewachsen, mit Glucosezusatz zu hefeartig sprossenden Kugelzellen (Durchmesser etwa 25 mm).
493
494 Gattung Mucor Glucose zu, dann änderte der Pilz drastisch seine Wuchsform. Statt der schlauchförmigen an der Spitze wachsenden Hyphen, die sich zum verzweigten Pilzgeflecht (Mycel) ausbreiten, entwickelte der Pilz eine hefeartig sprossende Kugelform. Er nannte diese Wuchsform „Mucor-Hefe“, zumal die charakteristische Sproßform nicht nur an echte Hefen erinnert, sondern gleichzeitig eine intensive alkoholische Gärung aufweist. Ist der Zucker im Medium verbraucht, hört der Pilz auf zu gären und wächst wieder zu Hyphen mit Sporenträgern aus. Diese Alternative zwischen einer atmungsaktiven polaren Wuchsform und einer gärungsaktiven apolaren Sproßform nennt man „Hefe-/Mycel-Dimorphismus“ (s. Abb. 22.3 und 22.4). Obgleich ein ähnlicher Wuchsformwechsel auch bei einigen anderen Pilzen vorkommt, ist die Koppelung mit der Anwesenheit/Abwesenheit von Glucose in keinem anderen Fall so überzeugend erwiesen. Das besondere Interesse an diesem System erklärt sich im übrigen aus der grundlegenden Relevanz der Polarität in allen differenzierten biologischen Systemen. So ist der erste Schritt in der Embryonalentwicklung vielzelliger Pflanzen und Tiere die für alle weiteren Differenzierungsschritte ausschlaggebende Festlegung der Polarität in der zunächst apolar erscheinenden Eizelle. Über den Glucoseeffekt im Dimorphismus von Mucorarten gibt es eine Fülle von Untersuchungen. Obgleich der molekulare Mechanismus der Übersetzung des Glucosesignals in ein morphogenetisches Reaktionsmuster auch heute noch keineswegs geklärt ist, weiß man zumindest, daß eine ganze Reihe am Symptomkomplex direkt oder indirekt beteiligter Gene über ein vernetztes Regulationsprogramm in ihrer Aktivität gesteuert wird. Daß der dabei von den Zellen betriebene Umstellungsaufwand sich als ökologisch zweckmäßig erwiesen hat, leuchtet ein, denn Glucose ist für die in Konkurrenz lebenden Pilze die günstigste Energiequelle, und bei ausreichendem Angebot kann ein Mucor in der gleichen Zeit über die Gärungsform (Hefe) bei geringerem Differenzierungsaufwand über zehnmal mehr davon umsetzen als über die Atmungsform (Mycel). Da die Köpfchenschimmel im allgemeinen zu den Erstbesiedlern gehören, haben sie sich auf leicht verwertbare Zucker, hohe Umsatzraten und besonders schnelles Wachstum spezialisiert.
III. Arten der Semiose
3.2.2. Dictyostelium discoideum, ein zeitweise „soziales Pilztier“? Besonders aufregend sind immer wieder solche Semiosen, bei denen nach unserem Evolutionsverständnis (noch) sehr einfache bzw. ursprüngliche Einzeller über Signalprozesse miteinander in Verbindung treten. Der dabei auftretende Signalaustausch wirkt so ausgeklügelt und zweckmäßig, daß man oft geneigt ist, darin eher teleologische Ambitionen als Darwinsche Selektionsergebnisse zu vermuten. So kam es auch bei dem vorliegenden Beispiel dazu, daß die Wissenschaftler selbst die an dem winzigen Schleimpilz Dictyostelium discoideum beobachteten Phänomene mit Begriffen belegten wie „social behavior“, eben weil das Verhalten dieser Mikroorganismen nicht treffender zu beschreiben war. Andererseits: Warum sollte nicht unter bestimmten (bedrohlichen) Bedingungen das kooperative Verhalten einer Einzellerpopulation einen positiven Selektionswert im Sinn einer verbesserten Überlebenschance haben und in der Evolution begünstigt worden sein? Dictyostelium discoideum gehört neben etwa 10 weiteren Arten systematisch-taxonomisch zu den niederen Pilzen (pilzähnliche Protisten im Schema Abb. 22.1), wozu man auch die Acrasiomyceten oder „zellulären Schleimpilze“ rechnet. Da die einzelligen Individuen (Myxamöben) in ihrer aktiven Lebensphase keine Zellwand besitzen und auf dem Substrat herumkriechen, könnten sie ebensogut den tierischen Einzellern, den Protozoen, zugeordnet werden, zumal sie feste Partikel, besonders Bakterienzellen, regelrecht „fressen“ (phagocytieren). Da aber am Ende des Entwicklungszyklus sporentragende Fruchtkörper ausgebildet werden, beanspruchen die Mykologen ⫺ früher die Botaniker ⫺ diese Organismengruppe für sich. Bezeichnenderweise ist dieser Streit auch heute noch nicht entschieden, obgleich molekulargenetische Daten den Ansprüchen der Zoologen eher recht zu geben scheinen. Vielleicht wird man sich auch mit der alten umfassenden Bezeichnung „Mycetozoa“ (‘Pilztiere’) für die Schleimpilze zufrieden geben müssen, die de Bary (1866) in seiner vergleichenden Studie über Pilze, Mycetozoen und Bakterien verwendete. Verfolgt man den Lebenszyklus von Dictyostelium discoideum, wie er in Abb. 22.5 skizziert ist, so erkennt man darin mehrere Phasen: Unter günstigen Lebensbedingungen schlüpfen aus den etwa 3 ⫻ 7 mm großen über-
22. Mykosemiose
Abb. 22.5: Entwicklungszyklus von Dictyostelium discoideum (zellulären Schleimpilzen). Der ganze Zyklus läuft in der Regel in etwa 24 h ab.
495
496 dauerungsfähigen Sporen nackte, formveränderliche Myxamöben aus. Auf der Suche nach Nahrung kriechen sie z. B. in der feuchten Streuschicht umher, wo sie genügend Bakterien und kleine Substratpartikel finden, die sie durch Umfließen aufnehmen und verdauen. Durch Zellwachstum und Zellteilung entwickelt sich bald eine Population aus einigen 100 bis 100 000 artgleichen Einzelindividuen, die keinerlei Beziehung zueinander erkennen lassen. Man hat diese Phase (Trophophase) mit einer Herde weidender Schafe verglichen. Dieses unabhängige Verhalten ändert sich geradezu sprunghaft, wenn der Nahrungsvorrat erschöpft ist. Der äußere Auslöser für die Umschaltung auf die folgenden Phasen des artspezifischen Differenzierungsprogramms ist ein etwa 8 Stunden anhaltender „Hunger“ (Starvation). 3.2.2.1. Aggregationsphase Primär ausgelöst durch die Starvation beginnt jeweils eine (die hungrigste) unter etwa 3000 Myxamöben damit, eine niedermolekulare Signalsubstanz in rhythmischen Pulsen an die Umgebung abzugeben. Diesen Stoff hat man zunächst nach der sagenhaften Hexe Acrasia (16. Jahrhundert), welche die Seefahrer an unsichtbaren Fäden zu sich lockte, „Acrasin“ genannt. Heute weiß man, daß es sich bei diesem sogenannten „social hormone“ um cyclisches Adenosinmonophosphat (abgekürzt „cAMP“) handelt. Diese Substanz ist in der Evolution offenbar sehr früh aufgetaucht und hat sich bei sehr unterschiedlichen Regulationsprozessen von den Bakterien bis zu den Säugetieren bewährt. Während cAMP jedoch bei Bakterien als Primärsignal die Genaktivität reguliert, übernimmt es bei der Signalübermittlung durch Peptidhormone in Säugetieren die Funktion eines „second messenger“. Freilebende satte Myxamöben sind für das cAMP-Signal kaum empfänglich, dagegen reagiert die hungrige Population nach Ausbildung von etwa 106 Signalrezeptoren pro Zelle gleich in mehrfacher Hinsicht darauf: ⫺ Die einzelnen Myxamöben bewegen sich aktiv und in regelmäßigem Rhythmus, der sich bei einigen Arten zur Wellenbewegung der ganzen Population im Wirkungsradius von etwa 1 mm synchronisiert, auf das cAMP-Sendezentrum zu. ⫺ Mit der Empfänglichkeit für das chemotaktische Signal entwickeln die Myxamöben im Aggregationsfeld (bis 105 Einzel-
III. Arten der Semiose
amöben) selbst die Fähigkeit, cAMP-Impulse abzugeben. Die Intensität der induzierten Impulse richtet sich dabei nach der jeweiligen Position der Einzelamöben im Aggregationsfeld, so daß sie als Relais (Signalverstärkung etwa um den Faktor 10) des Feldgradienten wirken. ⫺ Die Oberflächeneigenschaften der Aggregationsamöben ändern sich in charakteristischer Weise: Es treten cAMP-Bindungstellen (Rezeptoren) in der Zellmembran auf, die für den Signalempfang verantwortlich sind. Das Signal wird verarbeitet und nach Konzentration und Gradientenrichtung ausgewertet. Die Richtung wird durch aktive Suchbewegung neu eingestellt. Zur Erhaltung der Steilheit des chemotaktisch wirksamen cAMP-Gradienten im Amöbenfeld ist es ganz wichtig, daß das Signal nach dem Empfang in der Umgebung vorübergehend gelöscht wird, bevor dem komplizierten Signalverarbeitungsprozeß ein entsprechend verstärktes Sendesignal folgt. Darüber hinaus wird zwischen Signalinput und -output, die genaue Periode liegt zwischen 2 und 9 Minuten und wird von den Zellen im Aggregationszentrum festgelegt, das cAMP an der Zelloberfläche eliminiert, und die Rezeptoren werden so für den Empfang des nächsten Impulses wieder sensibilisiert. ⫺ Wie in Abb. 22.5 angedeutet, schließen sich die aggregierenden Myxamöben von D. discoideum schließlich zu fließenden Strängen zusammen. Das rührt daher, daß die Zelloberflächen in diesem Stadium klebrig reagieren, so daß die artgleichen Individuen beim Zellkontakt aneinander haften und einer zusätzlichen Kontaktleitung unterliegen. Auch diese Oberflächendeterminanten werden neben vielen weiteren Eigenschaften nur im Zuge der sequentiellen Genaktivierung innerhalb des Differenzierungsprogramms exprimiert. 3.2.2.2. Migrationsphase Ist die Aggregationsphase abgeschlossen, begibt sich ein scheinbar vielzelliges, an eine Nacktschnecke (engl.: slug) erinnerndes Gebilde aus etwa 105 Amöben mit einer Geschwindigkeit von 0,2⫺2 mm pro Stunde auf die Wanderschaft. Bei dieser Migration behält jede Zelle ihre relative Position bei; etwa das erste ins Zentrum eingewanderte Populationsdrittel (höchste cAMP-Bildner) bleibt an der Spitze, die zuletzt eingewanderten Myxamöben bilden das Ende. Findet ein solches
22. Mykosemiose
Amöbenaggregat auf seiner Wanderung neue Nahrung, so fällt es auseinander, und die Amöben kehren bis zur nächsten Mangelsituation in die Freßphase zurück. Die Wanderung kann wenige Stunden bis einen Tag dauern, wobei eine Orientierung zum Licht erfolgt. 3.2.2.3. Culmination Als „Culmination“ bezeichnet man den entscheidenden Übergang zur abschließenden Fruchtkörperbildung. Wie in vielen anderen Differenzierungsprozessen markiert die Culmination den „point of no return“. Haben sich bis zu diesem Zeitpunkt die ungünstigen Außenbedingungen nicht verändert, dann läuft das eingeschlagene Programm irreversibel zu Ende. Das bedeutet in diesem Fall, daß die Myxamöben der Spitzenregion nach innen durchwandern bis zur Substratoberfläche und sukzessive eine Zellwand und gemeinsam einen zelligen Stiel unter Verlust ihrer individuellen Überlebensfähigkeit ausbilden. An diesem Stiel kriechen die übrigen Myxamöben empor zu einem endständigen Häufchen (Sorus); jede Zelle kommt dann zur Ruhe und bildet eine feste Sporenwand aus. Dieser Anteil von etwa 2/3 der Population überlebt, und um dies zu realisieren, wurde ein Teil der Individuen geopfert. Die Stielzellen haben den Sporen die Ausbreitung durch die höhere Lage erleichtert, und die Basalzellen (Discus) haben wie bei dem Fuß eines Weinglases zur Standfestigkeit des Fruchtkörpers beigetragen. Dictyostelium discoideum und einige damit verwandte Arten werden heute in aller Welt mit molekularbiologischen Methoden intensiv untersucht. Dabei geht es einerseits darum, an einem leicht handhabbaren und (noch) relativ einfachen Modellsystem biologisch so grundlegende Fragen wie die Triggerfunktion so diffuser Außenfaktoren wie Substratmangel bei der Induktion physiologisch und morphologisch komplizierter Differenzierungssequenzen besser verstehen zu lernen. Neben spezifischen biochemischen Tests helfen Mutanten, die in einem der vielen Schritte blockiert sind, bestimmte Eigenschaften bestimmten Genen und bestimmten Stadien zuzuordnen. So schätzt man heute, daß etwa 300 der etwa 40 000 Gene von D. discoideum allein für die Morphogenese der Fruchtkörper zuständig sind, während an der Aggregation weitere 2000 Gene beteiligt sein dürften. Andererseits ist derzeit kein anderer Mikroorganismus bekannt, der so geeignet erscheint, den Übergang vom individuell
497 agierenden Einzeller zum selbstregulierten koordiniert reagierenden Vielzellsystem zu analysieren. Der Druck der evolutionären Selektion auf das adaptiv realisierte Kooperationsverhalten liegt hier für uns offenkundig in der nur so für Dictyostelium erreichbaren Überlebenssicherung der Art auf Kosten eines Teils der Individuen. Daß dieses Prinzip auch bei anderen Mykosemiosen verwirklicht ist, erscheint bei näherer Betrachtung nicht nur möglich, sondern durchaus plausibel. Im Fall von Dictyostelium könnte man argumentieren, daß es sich ja um einen eukaryotischen Organismus handelt, so daß er mit gewisser Berechtigung als Modellsystem für den Übergang vom Einzeller zum höher entwickelten Vielzeller herangezogen wird. Andererseits muß man wohl davon ausgehen, daß interzelluläre Semiosen, die zumindest zeitweise aus einer Summe von Einzelzellen ein kooperierendes Vielzellensystem mit neuen Eigenschaften entstehen lassen, unabhängig voneinander mehrfach in der Evolution entstanden sind. Nach Kaiser (1989) ist Vielzelligkeit mindestens fünfzehnmal entstanden. Ein Beispiel soll dies kurz beleuchten: Es gibt eine Bakteriengruppe, deren Verhaltensmuster dem von Dictyostelium so auffällig ähnelt, daß man sie in Analogie zu den Myxomyceten „Myxobakterien“ genannt hat. Das Alter dieser Prokaryonten wird auf ca. 2 Milliarden Jahre geschätzt. In der Natur findet man solche Myxobakterien regelmäßig z. B. auf Kaninchenkot. Auch diese winzigen, gleitbeweglichen Stäbchenbakterien werden durch Nährstoffmangel zur Kooperativität induziert. Auch sie kriechen aufgrund noch unbekannter chemischer Regulationssignale zu Aggregationszentren zusammen. Davon ausgehend bilden sie dann mehr oder weniger differenzierte Fruchtkörper, einfache Kügelchen oder gestielte Sporenträger. In seinem kürzlich erschienenen Artikel „Multicellular Development in Myxobacteria“ bezeichnet Kaiser (1989) die Verhaltensweise der Myxobakterien als den vielleicht ältesten Versuch, die Vorteile der Vielzelligkeit zu nutzen, ohne daß die Vielzelligkeit existentiell ist. Er begründet dies bei den Myxobakterien damit, daß die bereits in Schwärmen lebenden Einzelzellen einen Vorteil dadurch haben, daß sie die hochmolekularen Nährstoffe im Medium durch Ausschleusen von Enzymen spalten müssen, bevor sie sie aufnehmen können, und gemeinsam diese extrazelluläre Vorverdauung für die Einzelzelle
498 rationeller durchführen können. Den zweiten Vorteil bei der Massenfruktifikation sieht er analog zu Dictyostelium in der Arbeitsteilung, d. h. ein Teil der Population wird geopfert, um die Überlebenschance des anderen Teiles zu verbessern. (vgl. Art. 20 § 3.5.2.). 3.2.3. Sexualpheromone (Hormone) bei Pilzen In den letzten 10 Jahren sind erhebliche Fortschritte in der Aufklärung der chemischen Struktur und biologischen Funktion unterschiedlichster Signalsubstanzen erzielt worden (vgl. Art. 9). Bei Pilzen gilt dies insbesondere für die sogenannten „Sexualpheromone“, welche beim Kreuzungspartner die Ausbildung von Sexualorganen induzieren und das aktive Zusammenkommen sowie letztlich die sexuelle Verschmelzung steuern. Man hat diejenigen an zum Teil sehr komplizierten Wechselwirkungen beteiligten Signalsubstanzen, die über das freie Medium übermittelt werden, generell „Pheromone“ genannt, um sie formal von den Hormonen abzugrenzen, deren Synthese, Übermittlung und Wirkung sich in ein und demselben Organismus (höhere Pflanzen, höhere Tiere) abspielen. Abgesehen davon, daß also bei den Pheromonen im Regelfall ein Individuum als Signalsender über die im Signal enthaltene Information mit einem Signalempfänger in Kommunikationskontakt tritt, sind die Unterschiede zu echten Hormonen gering. Bezüglich der hohen Spezifität des Signals und der zur Reaktionsauslösung erforderlichen Mindestkonzentration arbeiten beide Systeme mit höchster Effizienz. Inwieweit auch die molekularen Wirkungsmechanismen analog sind, ist noch weitgehend ungeklärt. Dies gilt vor allem für die Pheromone, die von Pilzen und Algen benutzt werden. Zu den verschiedenen Pilzen, deren Sexualreaktionen seit Jahrzehnten morphologisch bekannt sind und heute zu molekulargenetischen und biochemischen Modellobjekten geworden sind, gehören auch einige Vertreter aus der Gruppe der Hefen, der sogenannte „Köpfchenschimmel“ sowie der „Wasserschimmel“. Die Gattung Achlya (Familie: Saprolegniaceae ⫽ „Wasserschimmel“) gehört zu den bevorzugt in Gewässern auf eiweißreichen Pflanzenresten oder abgestorbenen Insekten lebenden Oomyceten. Diese im weiblichen Geschlecht Eizellen (griech.: o¯o´n ‘Ei’) ausbildende Pilzgruppe zeichnet sich u. a. dadurch aus, daß der fädige Pilzkörper (Mycel)
III. Arten der Semiose
aus querwandlosen, verzweigten und vielkernigen Schläuchen (unseptierte Hyphen) besteht. Die feste Zellwand enthält ausnahmsweise Cellulose, was die Ableitung von bestimmten, ähnlich gebauten Schlauchalgen (Heterosiphonales) nahelegt. Wenigstens zwei Arten, Achlya bisexualis und A. ambisexualis sind bezüglich der Geschlechtsbestimmung zweihäusig (diözisch). Das heißt, es gibt männliche (männlichere) und weibliche (weiblichere) Individuen. Entwickeln sich zufällig nahe beieinander in einem Gewässer artgleiche Mycelkolonien beider Geschlechter, so sind alle Voraussetzungen dafür erfüllt, daß es am Ende der vegetativen Phase, in der begeißelte Zoosporen für die rasche Besiedlung des Areals sorgen, zur Umschaltung auf das sexuelle Entwicklungsprogramm kommt. Der morphologisch sichtbare Ablauf der durch Sexualpheromone gesteuerten Reaktionen läßt sich schon bei Lupenvergrößerungen leicht verfolgen und entspricht etwa dem Schema in Abb. 22.6. Bereits 1939 erkannte Raper, daß weibliche Mycelien unabhängig von der Anwesenheit eines geeigneten Partners eine im Wasser diffundierende Substanz ausscheiden. Dieses chemische Signal wird von einem männlichen Individuum über entsprechende Rezeptoren erkannt und löst bei diesem eine Reihe spezifisch männlicher Reaktionen aus. Raper nannte die postulierte Substanz zunächst „Hormon A“. Erst 1967 ergab die Strukturaufklärung, daß es sich um ein Steroid handelt, das entsprechend seiner Wirkung, die Ausbildung männlicher Sexualorgane zu induzieren ⫺ hier „Antheridien“ genannt ⫺, als „Antheridiol“ (Abb. 22.7) bezeichnet wurde. Als Sexualpheromon ist es hoch spezifisch und noch in einer Konzentration von etwa 0,6 mg auf 100 000 Liter Wasser wirksam. Bereits 10 Minuten nach Signalempfang treten am männlichen Mycel die ersten stark verzweigten Antheridialäste auf. Dazu ist es notwendig, daß bei dem männlichen Signalempfänger bestimmte Gene aktiviert und eine Reihe spezifischer Enzyme, darunter auch jene, welche die sichtbare Hyperverzweigung katalysieren, programmgemäß in Aktion treten. Man nimmt an, daß das von den Zellen aufgenommene Antheridiol in die Zellkerne transportiert wird und direkt auf Genebene ⫺ analog den tierischen Steroidhormonen ⫺ die charakteristischen Reaktionen auslöst, allerdings sind die experimentellen Beweise noch nicht schlüssig.
22. Mykosemiose
499
Abb. 22.6: Morphologisch sichtbare Entwicklung der Geschlechtsorgane, männliche Antheridien (links), weibliche Oogonien mit Eizellen (rechts) und Befruchtungsvorgang bei der Gattung Achlya (Erklärungen im Text).
500
III. Arten der Semiose
Abb. 22.7: Die Ausgangsverbindung für die Biosynthese der beiden Sexualpheromone bei Achlya ist Fucosterol. Die weiblichen Individuen bilden daraus Antheridiol, die männlichen Oogoniol (Einzelheiten im Text).
Zum Reaktionsmuster des männlichen Partners gehört auch die Beantwortung des empfangenen Signals. Sie besteht in der Bildung und Abgabe eines an den weiblichen Partner adressierten Pheromons („Hormon B“ nach alter Nomenklatur), das „Oogoniol“ genannt wurde. Dieses zweite Sexualpheromon induziert beim weiblichen Partner die Ausbildung der Oogonien (weibliche Sexualorgane). Darüber hinaus verstärkt offenbar Oogoniol in einer positiven Rückkopplung die Aussendung von Antheridiol und verstärkt damit die sexuelle Wechselwirkung. Auch Oogoniol ist wie Antheridiol ein 7Ketosteroid, jedoch mit abgewandelter Seitenkette (Abb. 22.7). Beide Sexualpheromone sollen im übrigen aus der gleichen Vorstufe (Fucosterol) synthetisiert werden. Soweit heute bekannt, sind noch mindestens zwei weitere Pheromone am Gesamtprozeß, der innerhalb von etwa 24 Stunden mit den befruchteten, überdauerungsfähigen Eizellen (⫽ Zygoten) endet, beteiligt. Ein in Abb. 22.6 eingezeichneter Faktor C, der von den Oogonienanlagen ausgeschieden wird, bewirkt einerseits als Sexuallockstoff eine
chemotropische Anziehung der Antheridialäste, zum anderen bei erfolgter Oogonienberührung die Abgrenzung der endständigen, handförmigen Antheridien durch eine Querwand. Dieser Vorgang erfordert die gleichzeitige Gegenwart von Oogoniol und Faktor C und katalysiert die irreversible Reduktionsteilung (Meiose) in den nun befruchtungsfähigen Antheridien. Für die entsprechende Abgrenzung der Oogonien, die Meiose und Ausbildung befruchtungsfähiger Eizellen (Oosphären) scheint das vierte Pheromon D, das von den reifen Antheridien ausgesandt wird, notwendig zu sein. Es wird angenommen, daß die Signalsubstanzen C und D ebenfalls Steroide sind, die sich jeweils in der Seitenkette unterscheiden. Insgesamt zeigt dieses Beispiel, wie fein die wechselseitigen Signale aufeinander abgestimmt wirken. Die hohe Spezifität ermöglicht es dabei, daß unter der Vielfalt unterschiedlicher Algen, Pilze und Bakterien, die nebeneinander im Gewässer leben, die artgleichen Partner sich verständigen und zueinander finden können.
22. Mykosemiose
3.2.4. Biologische Rhythmen und Selbstsynchronisierung Ein besonders faszinierendes Gebiet der Biologie sind die verschiedenen Rhythmen, die sich in der Evolution entwickelt haben und deren Periodenlängen von unter einer Minute bis zu Monaten reichen. Ein solches periodisches Verhalten ist nicht auf wenige Zelltypen beschränkt, sondern dokumentiert eher eine Grundeigenschaft der meisten biologischen Systeme. Rapp (1979) hat in einem Atlas 450 Beschreibungen allein für biologische Oszillationen mit Perioden von wenigen Stunden und kürzer (ultradiane Rhythmen) zusammengetragen. Am längsten bekannt sind die circadianen (‘circa tagesperiodischen’) Rhythmen, die sich auf den natürlichen Tag/ Nacht-Wechsel phasensynchronisieren lassen. Einmal auf 24 Stunden eingestellt, laufen sie in der Regel auch ohne äußeren Zeitgeber nach einer inneren Uhr mit nur leichter Phasenverschiebung weiter. Zu den molekularen Mechanismen der biologischen Zeitmessung gibt es zahlreiche Modelle, aber noch kein allgemeingültiges Prinzip (Edmunds 1988). Dabei ist vielleicht die wesentlichste Erkenntnis, daß bei einem komplexen System, das über Rückkopplungen reguliert wird, nur einige wenige Voraussetzungen erfüllt sein müssen, um es in einen oszillierenden Zustand zu versetzen. Bei Schimmelpilzen, deren Sporulation häufig durch Licht induziert werden muß, gibt es zahlreiche Beispiele für tagesperiodische Sporulationsrhythmen. Ein Beispiel dafür, wie genau solche „Clocks“ bei Pilzen der Uhrzeit folgen, zeigt die in Abb. 22.8 abgebildete Kolonie. Ohne besondere Vorkehrungen wuchs dieser Pilz auf einem Malzmedium mit Agar als Gelzusatz im Labor, wo er neben dem natürlichen Tageslicht allen lichtbedingten Störeffekten unterworfen war. Es handelt sich dabei um den Pilz Chaetomium robustum (systematische Gruppe der Schlauchpilze in Abb. 22.1), den wir aus einer Karstspalte in Mexiko isoliert haben. Die Mycelkolonie wächst mit konstanter Geschwindigkeit radial aus und bildet synchron über die ganze Peripherie einmal in etwa 24 Stunden einen Verzweigungsschub, aus dem sich später entsprechende Ringe mit Fruchtkörpern entwickeln. Es sind sozusagen „Hexenringe“ im Kleinen, wie sie jeder schon einmal an Hutpilzen im Freien beobachtet hat. Diese Clock-Rhythmik ist außerordentlich sensibel; geringe Änderungen im pHWert des Mediums vom Optimum bei pH 5,6
501 nach oben oder unten sowie eine Minderung der Diffusion durch höheren Agar-Zusatz reichen aus, um sie zu desynchronisieren oder ganz zu löschen. Abgesehen vom zelleigenen Zeitgeber ist mindestens noch ein diffusibler Signalfaktor beteiligt. Schaltet man ihn aus, zeigt die Kolonie asynchrone Flocken oder wächst scheinbar homogen weiter. Dabei bleibt das Clock-Phänomen an den einzelnen Hyphenästen durchaus erhalten, ist aber wegen der fehlenden Synchronität aller Hyphen makroskopisch nicht mehr erkennbar. Neben der Vielzahl tagesperiodischer Rhythmen haben bei Pilzen vor allem höher frequente oszillierende Prozesse immer wieder besonderes Interesse gefunden. Bei Saccharomyces cerevisiae (Reinkulturen von gewöhnlicher Bäckerhefe) ließ sich der primäre Oszillator der sogenannten „Glykolysekette“, die den Zuckerabbau über eine Serie von Zwischenprodukten umfaßt, identifizieren. Es handelt sich dabei um ein in seiner Aktivität sehr fein regulierbares Enzym (Phosphofruktokinase), dessen autonom pulsierende Aktivität sich als Zeitgeber auf alle folgenden Stoffwechselprodukte auswirkt. Aber diese einzellige Hefe zeigt noch weitere außergewöhnliche Phänomene, von denen hier nur eines aufgezeigt werden soll, die durch Aushungerung induzierbare Selbstsynchronisierung, die gewisse Analogien zum Verhalten von Dictyostelium aufweist: Bei einer frischen Hefekultur, die sich in der Wachstumsphase befindet, muß eine Synchronität z. B. der Zellteilung durch experimentelle Manipulationen erzwungen werden. Sowie man die Kultur sich selbst überläßt, geht diese Synchronität sehr schnell wieder verloren und ist nicht mehr meßbar. Bei nicht mehr teilungsaktiven beziehungsweise durch einen etwa 4-stündigen Substratmangel ausgehungerten Kulturen werden hingegen eine ganze Reihe verschiedener rhythmisch-synchroner Prozesse auf Populationsebene meßbar. Auch die oben genannten Oszillationen in der Glykolysekette sind im übrigen nur an Zellsuspensionen nachweisbar, die vorher ausgehungert wurden. Alles deutet darauf hin, daß die Zellpopulation unter Mangelbedingungen auf einen Grundzustand normiert wird. Dieser Grundzustand befähigt die Zellen, auf äußere Eingriffe ⫺ z. B. Substratzusatz (Glucose) ⫺ mit meßbaren Oszillationen (Periodenlänge je nach Bedingungen 2⫺6 Minuten) zu reagieren. Ohne hier auf experimentelle Details eingehen zu wollen, sollen einige wesentliche Punkte diskutiert werden:
502
III. Arten der Semiose
900 1300 1900
2300
300 700
1000 1300 1700
2100 100 500
Abb. 22.8: Pilzkolonie eines Chaetomium robustum mit ausgeprägter clock-Rhythmik: Über die Wachstumsfront erfolgen im ca. 24 h-Zyklus synchrone Verzweigungsschübe in den einzelnen Hyphenästen. Am rechten Bildrand ist die Uhrzeit des jeweiligen Fotos notiert (aus: Kraepelin und Franck 1973).
Wenn es keine geophysikalischen Faktoren sind, die eine solche Population in Phase halten, dann gibt es zwei mögliche Erklärungen für die physiologische Synchronität:
⫺ irgendeine Art interzellulärer Kommunikation muß auf Populationsebene das Netzwerk aus individuellen Oszillatoren synchron halten.
⫺ die freilaufende Periode des Oszillators in den einzelnen Zellen der Population muß extrem genau sein,
Die Frage, ob es einen „crosstalk among coupled oscillators“ oder sich selbst synchronisierende biologische „Clockshops“ gibt,
503
22. Mykosemiose
läßt sich experimentell bisher nicht eindeutig beantworten. Vieles spricht jedoch dafür, daß es in biologischen Systemen ⫺ sowohl bezogen auf das komplexe intrazelluläre Geschehen zwischen den Kompartimenten als auch bezogen auf Populationen vieler Zellen ⫺ in kritischen Situationen spontan zu einer interzellulären Selbstorganisierung kommt, die mit dem Auftreten autonomer Oszillationen verbunden ist. Im Fall der ausgehungerten, energetisch stark abgesenkten Hefe stellt man fest, daß die Zellen in diesem äußerlich stationären Zustand sehr lange überleben können und dementsprechend die sonst hohen Energieverluste offenbar sehr gering halten können. Es ist sehr verlockend, in diesem reproduzierbaren Reaktionsmuster geradezu einen Mechanismus zu vermuten, durch den eine das umgebende Medium übergreifende metabolische Kopplung der Zellen untereinander und damit wiederum eine Art Vielzellen-System hergestellt wird (s. Abb. 22.9). Im Gegensatz zur Amöbenpopulation von Dictyostelium ist diese temporäre Vielzelligkeit für das Auge nicht wahrnehmbar, weil Hefen
Abb. 22.9: Hypothetische Wechselwirkungen in einer hungersynchronisierten Hefepopulation: Die sich überschneidenden Linien symbolisieren die regulatorische Kopplung zwischen intrazellulären Kompartimenten K 3 (hier Atmungsorganellen ⫽ Mitochondrien) über das Cytoplasma K 2 und die resultierenden interzellulären Wechselwirkungen über das freie Medium K 1 (aus: Kraepelin 1972).
eben nicht aktiv beweglich sind. Die Frage, welche chemischen Signale in diesem Fall dazu führen, daß eine Hefesuspension wie eine Population (schwach) gekoppelter Oszillatoren reagiert, die sich auf eine bestimmte Frequenz synchronisieren, um möglicherweise dadurch die Energieverluste zu minimieren, muß freilich noch offen bleiben. Immerhin gibt es Hinweise darauf, daß zelleigene Stoffe, die als „informational molecules“ fungieren, in rhythmischem Wechsel frei im Medium bzw. an die Zellen gebunden vorliegen. Dabei könnte die Zellmembran über entsprechende Rezeptoren eine wesentliche Vermittlerfunktion ausüben oder sogar den Zeitgebermechanismus enthalten.
4.
Interaktionen zwischen Pilzen und Pflanzen
Pilze sind wegen ihrer heterotrophen Ernährungsweise auf organisch gebundenen Kohlenstoff angewiesen. In der Natur zersetzen sie vor allem bereits abgestorbene Pflanzenteile. Hindert man sie nicht durch entsprechende Vorkehrungen daran, besiedeln sie als Schimmelbelag aber auch unser Brot oder Obst, leben von der Zersetzung organischer Rückstände am Duschvorhang oder in feucht gelagerter Wäsche, wo sie sich als sogenannte „Stockflecken“ bemerkbar machen, oder zerstören wertvolle Literatur, indem sie Leimkomponenten und Zellulosefasern als Substrate für ihr Wachstum abbauen. Solche Zersetzungsprozesse könnten nur insofern als signalgesteuert angesehen werden, als z. B. ein Schimmelpilz, der sich auf einem Stück Brot entwickelt, das im wesentlichen aus hochmolekularer Stärke besteht, früher oder später probeweise ein stärkespaltendes Enzym (Amylase) ausscheidet. Kommt daraufhin als Rückmeldung das in die Zelle aufnehmbare Spaltprodukt (Zucker) an, wird die Produktion dieses Enzyms intensiviert und der Stoffwechsel darauf angepaßt. Dabei achtet der Pilz in der Regel darauf, daß er nicht mehr Energie für die Enzymsynthese aufwendet, als für die Anlieferung des erwünschten Zuckers notwendig ist. Steigt die Zuckerkonzentration an, wird die Enzymbildung entsprechend gedrosselt. Insofern verhält sich ein solcher Pilz nach unseren Maßstäben durchaus zweckmäßig. Was hier teleologisch vernünftig erscheint, hat sich demnach auch als Produkt von zufälligen Mutationen im Erbgut und Selektion durch die
504
III. Arten der Semiose
Umwelt im Lauf der Evolution herausentwikkelt. Um einiges raffinierter sind naturgemäß die Interaktionen zwischen Pilzen und lebenden Pflanzen (vgl. Art. 23). Seien diese Wechselwirkungen definitionsgemäß parasitischer oder symbiotischer Natur, in jedem Fall sind beide Partner (re)aktiv am Geschehen beteiligt. 4.1. Parasitische Pilze und pflanzlicher Wirt Nur wenige Pilzarten gehören zu den obligaten Parasiten, die ⫺ soweit wir wissen ⫺ auf eine höhere Pflanze (Samenpflanze) zur Erhaltung ihrer eigenen Lebensfähigkeit angewiesen sind. Zu den bekanntesten Beispielen gehören die vielen Mehltaupilze, die sich auf eine Wirtspflanzenart (oder -gruppe) spezialisiert haben (z. B. Rosen-, Eichen- oder Gurken-Mehltau). Die Mehrzahl Pflanzen parasitierender Pilze gehört jedoch in die Gruppe der fakultativen (oder opportunistischen) Parasiten. Sie sind nicht vital darauf angewiesen, tun es aber, wann immer sich dafür die Möglichkeit ergibt, d. h. wenn die Wirtspflanze bereits aus anderen Gründen geschwächt ist (Schwächeparasiten wie z. B. der Speisepilz Hallimasch) oder wenn der Parasitismus von der Pflanze „geduldet“ wird wie im Fall des sogenannten „Mutterkornpilzes“. In diesem Fall mogeln sich die Pilzsporen zur Blütezeit des Getreides in die weiblichen Samenanlagen, und anstelle eines Getreidekornes ernährt die Pflanze einen reinen Pilzkörper, der als dunkles, überwinterungsfähiges Sklerotium (Mutterkorn) in der sonst normalen Ähre auffällt und später mit den Körnern in unser Brot gelangen kann (Abb. 22.10). Wegen des Gehaltes an Mutterkornalkaloiden (Lysergsäurederivate wie das bekannte LSD) müssen solche Sklerotien aus Brot- und Futtergetreide eliminiert werden; der Wirtspflanze schadet lediglich der Ausfall einiger Nachkommen, nicht aber das vom Pilz produzierte Alkaloid. Ein weiteres Beispiel, bei dem der Pilz mit einem eigenen Stoffwechselprodukt in die zentrale (hormonale) Regulation der Wirtspflanze eingreift und ihr Wachstumsverhalten regelrecht manipuliert, war im Fernen Osten als Reiskrankheit „Bakanae“ („verrückte Keimlinge“) schon lange bekannt, bevor Ende der fünfziger Jahre die genaue chemische Natur des Wirkstoffes geklärt wurde. So ist es dieser von dem Pilz Gibberella fujikuroi benutzten Signalsubstanz (Gibberellinsäure) zu verdanken, daß damals eine ganz neue
Abb. 22.10: „Mutterkörner“, Überdauerungsstadien des Mutterkornpilzes (Claviceps purpurea), die sich nach der Infektion einiger Blüten eines Wildgrases entwickelt haben.
Gruppe Pflanzenhormone von inzwischen über 50 verschiedenen Gibberellinen entdeckt wurde. Die Pflanzengewebe können zwischen den selbst produzierten Signalsubstanzen (Gibberellinen) und den fremdproduzierten nicht unterscheiden und reagieren mit abnorm verstärktem, letztlich tödlichem Wachstum. Im übrigen setzt auch der Mensch inzwischen eine Vielzahl leicht modifizierter synthetischer Wachstumsregulatoren z. B. als Herbizide zur Bekämpfung unerwünschter Pflanzen ein, deren Wirksamkeit ebenfalls darauf beruht, daß die Pflanzen sie mit den selbst synthetisierten Analogen verwechseln und dadurch völlig aus dem Gleichgewicht geraten. 4.2. Flechten-Symbiose Eine der auffälligsten Symbiosen zwischen Pilzen und niederen Pflanzen ist die Lebensgemeinschaft von Pilzen und Algen, die zur Entwicklung von rund 20 000 verschiedenen Flechten geführt hat (Abb. 22.11). Die intensive wechselseitige Integration zwischen den
505
22. Mykosemiose
Abb. 22.11: Vergrößerter, blattartiger Teil einer Flechte (Lobaria laetevirens, Teneriffa). Auf der durch symbiotische Algen grün erscheinenden Oberfläche des Flechtenkörpers sind die schüsselförmigen Sexualstadien des Pilzes (Schlauchpilze s. Abb. 22.1) deutlich zu erkennen.
artfremden Partnern geht in vielen Fällen so weit, daß die Einzelteile allein nicht mehr entwicklungsfähig sind, aber zusammen Individuen mit ganz neuen Formen und Funktionen (z. B. Synthese verschiedenster Flechtenstoffe) erzeugt haben, die man taxonomisch als eigenständige Arten behandelt. Da sich in einer Flechte nur der Pilzpartner sexuell fortpflanzt, die Alge aber lediglich durch Zellteilung weitergegeben wird, ordnet man die Flechten formal bei den Pilzen ein. Überwiegend sind die Flechtenpilze Schlauchpilze (siehe Abb. 22.11). Das ist von der Ernährungsweise dieser Zwitterorganismen nicht korrekt, denn die Flechtenpilze haben sich ja dadurch, daß sie sich einen Algenpartner halten, in die Lage versetzt, Sonnenenergie zur Primärproduktion organischer Substanz zu nutzen. Aber das tun manche Tiere auch, wie z. B. die stockbildenden Korallen, die in den lichtdurchfluteten tropischen Küstengewässern leben und meist symbiotische Algen (Zooxanthellen) beherbergen. Auch hier wie im Beispiel der Flechtenpilze stehen die Algenzellen unter strenger Vermehrungskontrolle des dominierenden Partners.
5.
Interaktionen zwischen Tieren und Pilzen
Interessant aus der Sicht semiotischer Prozesse sind hier vor allem jene Wechselbeziehungen, die zu einer symbiotischen Verständigung der artfremden Partner geführt haben. Solche Symbiosen reichen von den staatenbildenden Ameisen, insbesondere den verschiedenen Blattschneiderameisen, die in ihren Erdnestern sogenannte „Pilzgärten“ anlegen und regelrecht kultivieren, bis zu den Endosymbiosen im Holz lebender Insekten, die zusätzliche Organe (Blindsäcke, Mycetome) ausgebildet haben, in denen Pilze (oder Bakterien) die für das Insekt sonst unverdaulichen Nahrungsbestandteile wie Zellulose zu verwertbaren Zuckern spalten. Es würde zweifellos den Rahmen sprengen, wollte man die Vielzahl solcher Symbiosen nach semiotischen Gesichtspunkten analysieren. Darüber hinaus wissen wir in den meisten Fällen noch viel zu wenig Konkretes über die dabei wirksamen Signale bzw. Signalsubstanzen.
506
6.
III. Arten der Semiose
Das Verhältnis des Menschen zu Pilzen
Abgesehen von den zahlreichen Beispielen, wo der Mensch die Fähigkeiten von Pilzen in biotechnologischen Produktionsprozessen gezielt nutzt (Bier- und Weinherstellung, Käsereifung, Penicillingewinnung, Champignonzucht u. a. m.), gibt es kaum differenzierte Wechselbeziehungen zwischen Menschen und Pilzen, die mit denen zwischen Pflanzen oder Tieren und Pilzen vergleichbar wären. Wenn ein Mensch von einem Pilz besiedelt wird und seine Haut lokal erkrankt oder ein Organ befallen wird, dann werden natürlich Abwehrreaktionen einsetzen und Antikörper gebildet werden wie bei anderen Infektionskrankheiten. Insofern gehört der Mensch ebenso zur Umwelt der Pilze wie die Pilze zur Umwelt des Menschen; man begegnet unweigerlich einander, und es kommt zu Auseinandersetzungen. Eine gemeinsame Evolution, wie sie sich aus dem engen ökologischen Zusammenleben so vieler artfremder Organismenpaare sonst herausgebildet hat, ist hier zumindest nicht erkennbar. Die intellektuell abwehrende Haltung des Menschen gegenüber Pilzen gilt aber gleichermaßen pauschal gegenüber den Bakterien, obwohl wir bei unserer Ernährung auf die Mitwirkung der richtigen Bakterien in unserer Darmflora angewiesen sind ⫺ ganz ähnlich, wie das Gedeihen der Mehrzahl unserer Waldbäume vom Funktionieren einer artspezifischen Wurzelsymbiose (Mykorrhiza) mit Pilzen abhängt (vgl. Art. 27 § 1.).
7.
Ökologischer Ausblick
Die wenigen hier angesprochenen Beispiele sollten zeigen, daß es bei Pilzen semiotische Prozesse gibt; und es ließen sich noch wesentlich mehr anführen. Sie reichen von der selektiven Erkennung bestimmter, für das Wachstum geeigneter Substrate in der Umgebung (vgl. § 3.2.1.) bis zur komplexen interzellulären Signalübermittlung durch spezifische Pheromone auf der Basis eines artspezifischen Sender-Empfänger-Prinzips (§ 3.2.3.). Allgemein ist wohl davon auszugehen, „daß das Empfängersystem das in der Evolution ältere ist und ursprünglich auf primitive Formen der Chemorezeption zurückgeht und insofern zunächst dem Auffinden von Nahrungsquellen diente“ (Karlson 1985). Aus ökologischer Sicht gehören potentielle Nähr-
substrate genauso zur individuellen Umwelt wie die übrigen artgleichen und artfremden Organismen eines Lebensraumes. Daher dürften Erkennungsmechanismen auf der Basis chemischer Oberflächenrezeptoren für die Diskriminierung der unterschiedlichsten Umweltfaktoren von entscheidender Bedeutung für die Lebens- und Konkurrenzfähigkeit sein. Dabei kann unter Umständen sogar ein und derselbe Rezeptortyp an der Zelloberfläche sowohl zur Erkennung eines Substrat-Signals als auch bei Substraterschöpfung eines Partner-Signals benutzt werden. Ein Beispiel dafür, daß auch die Signalsubstanz für beide Funktionen die gleiche sein kann, findet man wiederum bei Dictyostelium (§ 3.2.2.): Bakterienkolonien, in denen stets ein Teil der Zellen abstirbt, geben etwas von ihrem eigenen cAMP, das sie zur Genregulation benutzen, ans Medium ab und können so von hungrigen Myxamöben gefunden und gefressen werden. Das gleiche Erkennungssignal (cAMP) wird von den Dictyostelium-Amöben bei aufgebrauchtem Substrat in differenzierter Form zur Koordination der Aggregation und Fruchtkörperbildung benutzt. Gerade bei cAMP zeigt sich auch, daß manches, das sich in der Evolution schon sehr früh bewährt hat, bis zu den höchsten Entwicklungsstufen beibehalten worden ist ⫺ und sei es mit modifizierter Funktion (vgl. Art. 14 § 2. und Art. 26 § 4.).
8.
Literatur (in Auswahl)
Ainsworth, G. C. (1976), Introduction to the History of Mycology. Cambridge, England: Cambridge University Press. Edmunds, L. N. (ed.) (1988), Cellular and Molecular Basis of Biological Clocks. Models and Mechanisms for Circadian Timekeeping. New York: Springer. Kaiser, D. (1989), „Multicellular Development in Myxobacteria“. In: D. A. Hopwood und K. E. Chater (eds.), Genetics of Bacterial Diversity. London: Academic Press: 243⫺263. Karlson, P. (1985), „Evolution der chemischen Kommunikation im Tierreich“. In: Information und Kommunikation: naturwissenschaftliche, medizinische und technische Aspekte (Verhandlungen der Gesellschaft Deutscher Naturforscher und Ärzte, 113. Versammlung, Nürnberg 1984). Stuttgart: Wissenschaftliche Verlagsgesellschaft: 23⫺42. Kraepelin, G. (1972), „Der Atmungsdefekt bei Hefezellen: Eine kritische Betrachtung seiner Ursa-
23. Phytosemiosis chen, II“, Zeitschrift für Allgemeine Mikrobiologie 12: 235⫺266. Kraepelin, G. und G. Franck (1973), „Self-Synchronization in Yeast and Other Fungi“, International Journal of Chronobiology 1: 163⫺172. Rapp, P. E. (1979), „An Atlas of Cellular Oscillators“. In: M. J. Berridge, P. E. Rapp und J. E. Tre-
507 herne (eds.), Cellular Oscillators. Cambridge, England: Cambridge University Press. Strasburger, E. u. a. (1983), Lehrbuch der Botanik für Hochschulen. 32. Aufl. Stuttgart: Fischer. 33. Aufl. 1991.
Gunda Kraepelin, Berlin (Deutschland)
23. Phytosemiosis 1. Introduction 1.1. The phytosemiotic hypothesis 1.2. The background to the phytosemiotic hypothesis 2. The phytosemiotics of Jakob von Uexküll 2.1. Summary of Jakob von Uexküll’s theory of meaning 2.2. Jakob von Uexküll’s anthroposemiotics 2.3. Jakob von Uexküll’s zoosemiotics 2.4. Jakob von Uexküll’s phytosemiotics 3. Biosemiotic communalities 3.1. The problem of plant receptors 3.2. Intercellular communication 3.3. Imposition of meaning 3.4. Rules of correspondence 3.5. Endosemiotics 4. Plants’ involvement in semioses 4.1. Biocommunication defined 4.2. Plant to plant relationships 4.3. Animal to plant relationships 4.4. Human to plant relationships 5. Selected references
1.
Introduction
1.1. The phytosemiotic hypothesis While anthroposemiotics and zoosemiotics (Sebeok 1963, 1972) study sign use in humans or animals, phytosemiotics is the investigation of sign processes involving plants (phytosemioses). The phytosemiotic hypothesis goes back to the early 1980s (Krampen 1981, 1986). It is mainly based on the work of Jakob von Uexküll (e. g., 1922, 1940) but needs still further empirical confirmation. 1.2.
The background to the phytosemiotic hypothesis
1.2.1. Properties of living systems The task of research in phytosemiotics is to show that plants take part in all of the three interrelated processes common to the individualized open systems called “living sys-
tems”: firstly the exchange of matter (metabolism), secondly spatial and temporal form changes and thirdly the exchange of information (Tembrock 1975; cf. Art. 22 § 3.). That living systems take in and give off matter from and to their surroundings is basic. Nobody would deny this for plants. This metabolism is the basis of form change in living systems, the particular conditions of exchange of matter being determined by and contingent upon it. Spatial and temporal form changes are connected with the ontogeny and phylogeny of living organisms. Again, nobody denies this for plants. The question phytosemiotics has to answer is whether plants do exchange information with their surroundings. The information exchange of an organism depends on form change: a phylogenetically more complex organism requires more information exchange with its surroundings than a single cell. And since information exchange is based on energy it equally requires the exchange of matter. At the same time, information exchange facilitates form change and the exchange of matter of the living system by coordinating both processes with the environment. 1.2.2. Plants as living systems The assumption of phytosemiotics is one applying to the whole of biosemiotics (i. e., the semiotics of living systems; cf. Art. 19): that these systems do indeed exchange information with their environment. Such information becomes available to the organism by way of signals ⫺ those filtered out as relevant or “meaningful” to the organism being called “signs”, while those considered irrelevant are called “noise”. According to this biosemiotic tenet, the whole range of open systems from bacteria, to fungi, plants, animals (Margulis
508
III. Arten der Semiose
1981) and finally to humans, all live by filtering out information from the environment that is meaningful to them. Phytosemiotics has to demonstrate that plants carry on this type of meaningful interaction within themselves as well as between themselves and their environment, which includes other plants, animals and humans. It is to be expected that in plants this meaningful interaction occurs on a more fundamental level than in “higher” living beings such as animals. The importance of information exchange for a given species is determined by its specific variables of space and time. Accordingly, organisms moving about in space show a higher development of information seeking and signaling behavior (cf. Art. 27) than those not capable of locomotion. The latter condition holds, on the whole, for fungi (cf. Art. 22) and plants. Plants must survive by adaptation to the effects of whatever environment they emerge in. Escape, the most efficient means of many animals’ self-preservation, is not available to them. But not only aversive locomotion is precluded to plants. Appetitive and aggressive mobility seems to be lacking in plants as well. There are, however, examples to the contrary as in “carnivorous” plants capable of trapping insects. And plants do move, as shown by such phenomena as phototropism (e. g., Presti et al. 1977) or the adaptation to wind and water pressure. In fact, no lesser an authority than Darwin (1896) dedicated an entire book to The Power of Movement in Plants pointing particularly to their capacity of “circumnutation”, e. g., the circular motion of climber tendrils. Hence, a careful reconsideration of plant mobility might lead to the hypothesis that there could be more to information seeking in plants than hitherto believed.
2.
The phytosemiotics of Jakob von Uexküll
2.1. Summary of Jakob von Uexküll’s theory of meaning In order to give a theoretical frame to phytosemiotic research, it is useful to summarize the theory of meaning advanced by the biologist and ethologist Jakob von Uexküll (1864⫺1944; cf. Art. 110, see also Art. 21): (1) Living beings, from the cell to the most complex organism, are “autonomous”. They
do not react in a mechanical way to impingements from their environment, be they from objects or other living beings, as material objects do. Living beings react in a way that is meaningful in terms of their own needs. In the case of animals, for example, this means that they process information with their specific receptors, nervous systems and effectors according to their own codes. Therefore causal and mechanical explanations are applicable in biology only to a limited degree. Rather, the main task of the biologist is to reconstruct the meaning of a living being’s behavior. To accomplish this he must establish which impingements are treated as signs by the organism and which sign processes underly its behavior. Biology is hence biosemiotics (a term not yet used by Jakob von Uexküll; but cf. Art. 19). (2) There is a structural reciprocity between each living being as an autonomous subject and its meaningful surroundings called its “Umwelt”. Since the term refers to the subjective world of impingements, which become meaningful only in terms of the information processing equipment and the codes of a given organism, it should not be confused with “environment” and will be used here as a loan word. (3) There is a meaningful structural reciprocity between the Umwelts of different living beings within a species and those of other species according to a “general plan of nature”. (4) The ultimate task of the biologist is to reconstruct piece by piece, in keeping with and on the basis of experimental evidence, the hypothesized general plan of nature. 2.2. Jakob von Uexküll’s anthroposemiotics In order to describe in more detail Jakob von Uexküll’s biosemiotic theory, we will begin with the “higher” forms of living beings and work down to the “lower” ones. Thus, the (bio)semiotics of humans is the point of departure from which the semiotics of animals and plants can be reached by subtraction, following a suggestion of Marx (1857 ⫽ 1961: 636) that it is scientifically more fruitful and correct to explain apes by using knowledge about humans than to explain humans in terms of apes. Jakob von Uexküll’s anthroposemiotics (this term, again, is not used by him) describes the structural reciprocity of beings and their Umwelts as well as the relations between these Umwelts. One telling example is
23. Phytosemiosis
a stroll through a town (J. v. Uexküll 1913 ⫽ 1980: 249 f): “It is not without interest to start a stroll through town if one remains conscious of a certain question while looking at things. Thus, we want to ask which meaning have objects striking the eye and for whom do they have a meaning? ⫺ We pass a tailor ’s shop; the garments exhibited are not only adapted to the forms of the human body, but change with the different activities of civic life which they serve. ⫺ Next there is a watchmaker, exhibiting various sorts of watches. The time of sundials has long passed. Sunrise and sunset do not play a role in our civic life as they did formerly. Artificial illumination prolongs the day. And this little machine takes care of the regular distribution of our daily work dividing by its course day and night into time spans of equal length, whereas still for the Romans, depending on the seasons, either night or day had the longer hours. Thus, we have corrected the course of the sun, originally the master of time and hour, according to our needs. We choose to stop in front of the bookseller ’s display, where we are offered today’s most important object for communication between human beings ⫺ the book. We know that between all these covers, both large and small, words are slumbering which we can awaken at any time and which will tell us all about human life. ⫺ Now comes a butcher ’s shop. There we see the meat of animals, serving as our nourishment, ready for further treatment. How few of the passers-by know that this meat is an artful apparatus of unequalled precision which endowed the animal with movement and warmth. ⫺ A staircase of stone leads us to the terrace of a cafe´ where carefully trimmed trees afford shadow and well-cultivated flowers give pleasure to the eye. We sit down on comfortable chairs and let the picture of passing carriages impress us, which roll by, now pulled by horses, now driven by motors. ⫺ Everything, indeed everything which we get to see, is adapted to our human needs. The height of houses, of doors and windows can be reduced to the size of the human figure. The stair fits our gait and the bannisters the height of our arms. Each single object is endowed with sense and form by some function of human life. All over we find an ability of man which the object sustains by its counter-ability, i. e., the service it does in return. The chair serves sitting, the stair climbing, the vehicle riding, etc. We can talk
509 about something being a chair, a vehicle without misunderstanding, because it is the counter-ability of the human products which we really mean by the word which denotes the object. It is not the form of the chair, the vehicle, the house which is denoted by the word, but its counter-ability. ⫺ In the counter-ability lies the meaning of the object for our existence. This counter-ability is what the constructor of the vehicle has in mind, what the architect thinks of when designing the plan of the house, what the butcher thinks of who slaughters the ox, as also the writer writing the book, the watchmaker fabricating the watch. The gardener trimming the trees and planting the flowers prepares them for counter-ability. Everything surrounding us here in town only takes on sense and meaning through its relationship to us humans” (translation M. K.). The key role of anthroposemiotics in Jakob von Uexküll’s conception of biosemiotics arises from the fact that the biologist himself is a human subject, surrounded by his Umwelt as by a transparent bubble, on the surface of which appear his scientific observations in keeping with his own codes. When talking about the Umwelt of the scientist, Jakob von Uexküll (1940 ⫽ 1970) likes to quote the British astronomer and physicist Sir Arthur Stanley Eddington who said he had two desks, the one he used for writing on, the other a physical desk consisting of an immeasurably large number of particles. For that matter a biologist would have a still different desk to that of the physicist (Uexküll 1935). Being enclosed in his own Umwelt, the biosemiotic investigator must use a special method in order to arrive at reconstructing the Umwelt of the observed living being. This method would nowadays be called “participant observation” (Uexküll 1980). In fact, even in everyday perception the reciprocity of Umwelt and observer is constantly given by the fact that we cannot have exteroception without egoreception, we cannot leave the scene we regard (Gibson 1979). There are always parts of our body “in the picture”, our hands, part of our faces, etc. The structure of reciprocity between the living being and its Umwelt is described by Jakob von Uexküll for both humans and animals, as a “function cycle”. The subject literally “grasps” an object in a doublepronged attack, either directly with his receptors (e. g., the eyes) and effectors (e. g., the hands), or in the case of humans sometimes
510 indirectly with amplifications of his receptors (e. g., a microscope) and his effectors (e. g., a tool or a machine). The constant feedback from the effectors to the receptors is modified by their encounter with the object. The nervous system mediates between receptors and effectors according to the organism’s needs (cf. Art. 5 § 2.2.1.). The receptors receive afferent signals from the object, and the effectors are steered by efferent signals to carry out an action upon the object. Both kinds of signals are charged with meaning by the code constituted by the subject’s needs. An object may thus be sensed and acted upon differently, depending on the actual need. If this is to be translated into the usual semiotic terminology, the two faces of the object processed as a sign are the afferent signals as the signifier, the need state as the code and the efferent signals induced by the need as the interpretant. The semiosis proceeds because the afferent signals are constantly cancelled out by the efferent signals, either in terms of the object’s consumption, or in terms of a different “perspective” on it, or in terms of code-switching to another need (cf. Art. 27 § 2. and § 3.). The sum total of the object signals received and their corresponding action signals constitute the Umwelt of the organism which is mirrored by signs as a corresponding “inner” world or counterworld (cf. Art. 21 § 9.). As has already been stated, the task of the biologist is to investigate the codes according to which a living being, be it human or animal, imparts meaning to its Umwelt. This can be accomplished by studying the physical structure of receptors and effectors and by observing, through experimental variation, which signals are processed on each side, i. e., which signs belong to the codes of the subject. The role played by those particular objects in the Umwelt of human beings that are called “communicative signs” has been studied by Thure von Uexküll (cf. Jakob von Uexküll 1980). The specific characteristic of the human Umwelt is that it is structured according to the species’ framework of space and time; that, by re-afferent feedback processes, the phenomenon of “consciousness” (or self-awareness) exists; and that through the transmission of communicative signs, particularly of linguistic ones, a common social reality is established.
III. Arten der Semiose
2.3. Jakob von Uexküll’s zoosemiotics The step from anthroposemiotics to zoosemiotics (cf. Art. 24) becomes clear if a dog is observed during the same stroll through town (Uexküll 1913 ⫽ 1980: 250⫺251): “He runs past the tailor ’s shop. These clothes gain meaning for him only if his master has worn them and has endowed them with the smell of his body. Then they become important marks in the life of the dog. Our clocks and books do not form special objects. This unimportant jumble of colors and forms leaves him indifferent. Only the butcher ’s shop enjoys his full participation. The tart smell of the fresh meat, the sweet odor of the boiled sausages awaken his appetite, while the soft stink of rotting fishes generates the desire to root around in it. ⫺ As important as the butcher was the cornerstone for the dog (which we passed without paying attention), because every dog leaves his smelling calling card on it. The staircase the dog runs up as he would take any hill. The bannister has no meaning. Among the chairs he pays attention only to the padded ones. He prefers to rest at a place where the shadow of the trees does not bother him. The flower-bed only stimulates his attention if a little mouse makes itself conspicuous in the soft ground. Nobody will seriously maintain that the dog had strolled through the same town as we had done. Those very things which we consider most important and real are unimportant and void for the dog. His world has different accents, different marks stimulate his senses, the objects have different meanings.” Just as the objects encountered during the stroll through town have a different meaning for humans and dogs, thus Eddington’s desk means something different to a fly. It becomes in its Umwelt a mere horizontal walking surface, and is in that respect no different from the seat of the chair or the top of a cupboard. In fact, all objects in a human room are reduced, in the Umwelt of a fly, to objects to fly around in a play activity (like, for instance, hanging objects such as a lamp). As Jakob von Uexküll observes, the number of objects pertaining to the Umwelt of an animal corresponds exactly to the number of the types of actions carried out by it. But each animal, be it a fly or a lion, behaves meaningfully on the basis of sign processes with a function cycle forming signs from afferent signals as signifiers and corresponding efferent signals as interpretants (cf. Fig. 23.1⫺3 on plate II).
23. Phytosemiosis
2.4.
Jakob von Uexküll’s phytosemiotics
2.4.1. Specifications of plant semioses Plants are autonomous living beings in the sense of Jakob von Uexküll. But as zoosemiotics had to be established to mark the difference to anthroposemiotics (the classical field of semiotic inquiry), thus phytosemiotics must show the particular kind of semioses plants are involved with. The task is then to point out the characteristic features of plant semioses and the common ground of anthropo-, zoo- and phytosemiotics in biosemiotics. 2.4.2. Absence of locomotion As already mentioned, one of the most obvious differences between animals and plants impressing the human observer is the contrast of movement and being stationary. Jakob von Uexküll (1922 ⫽ 1980: 208) describes this impression as follows: “The confusing aspect offered by the thousands of animal worlds is due to the impossibility of finding a moment of rest anywhere. Everything is constantly in the process of breathtaking movement […] Again and again the animal must exercise its organs to respond to the requirements of the Umwelt. Sometimes the animal is the persecutor and sometimes the persecuted. But it is always active and thus burns the materials which its digestive cells have extracted in painstaking labor from the nourishment which it has acquired with such difficulty. ⫺ This aspect of the realm of plants is quite different. Hectic haste is replaced by comfortable calm. Not that work ceases for a moment, as long as the plant is alive. An uninterrupted stream of liquids enters by the roots, rising along the stem and branches out in all directions to the leaves where it evaporates again in a well-controlled fashion. This stream transports the nourishing salts gained from the earth into all those tissues of the plant which transform them into material of the plant’s body. ⫺ In the laboratory of the leafgreen, the important building block of carbon is produced with the help of the sun. Everything is handled by the fine detail of work of living cells which remain autonomous subjects as do those in the bodies of animals. They work in union, according to a plan, by transmitting stimuli and material.” The alleged lack of movement ascribed to plants is to a large extent the result of the inability of humans to see it. Arnheim (1932
511 ⫽ 1975) writes about a movie on plant behavior made with a time-lapse camera: “It results from these shots that plants have a mimic, which we do not see, because it reckons with times which are too slow. It becomes visible, if time lapse shots are taken. The swaying, rhythmical breathing movements of the leaves, the excited dance of the leaves around the blossom, the surrender in the opening of the blossom appearing almost obscene ⫺ the plants had all of a sudden become alive and showed expressive movements of the kind known from humans and animals. How a climbing plant feeling anxious and insecure seeks for a hold when its tendrils wind themselves up an espalier; how a withering cactus blossom almost with a sigh lowers its head and breaks down ⫺ it was the tremendous discovery of a new and living world, in an area of which one knew that it hosted life, but which one had never been allowed to see ‘in action’. The ranging of the plants into the world of living beings was suddenly visibly completed, one saw: the same principle reigned all over, the same behavior, the same difficulties, the same goals!” In conclusion, what is lacking in plants is not movement but locomotion over distances. The behavior of plants could be characterized as “stationary plasticity”. 2.4.3. Absence of the function cycle, objects and Umwelt Jakob von Uexküll maintains that plants do not have a function cycle. This is true if one insists that a function cycle is constituted by receptor organs connected to effector organs via a nervous system. The important issue of plant receptors will be taken up separately. Confusion in the terminology ensues only if more complex receptor organs are given the same name as receptor cells. What plants do have in any event are feedback cycles connecting sensors and regulators. If plants have no receptor organs connected to effectors by a nervous system, there cannot be any afferent signals as signifiers fitted to efferent signals as interpretants, forming signs of objects which would be represented by this double-pronged operation in an animal. Plants would thus live in a world without objects. Given the absence of a function cycle, plants cannot have an Umwelt. As Jakob von Uexküll (1940 ⫽ 1970) points out: “The plant does not possess Umwelt-organs, it is directly immersed into its habitat. The relationships
512
III. Arten der Semiose
of the plant are quite different from those of the animal to its Umwelt.” While humans and animals have their own Umwelts, plants are confined to their casing.
effectors. The superordinate rule of a living being’s needs, be it plant or animal, may be considered to be the code to which the subordinate rules relate as subcodes (cf. Art. 16).
2.4.4. Meaning factors in plant semioses A further consequence of the lack of a function cycle, an Umwelt, and of objects that could become sources of meaning for plants, is that meaning is mediated in them by what Jakob von Uexküll calls “meaning factors”. Meaning factors are those stimuli out of the stream of impingements pressing upon a plant from all sides that are relevant to its life. The plant does not counter, however, external impingements with the doublepronged operation of receptors and effectors, but uses the living cell tissue of its casing to filter out relevant impingements (cf. Art. 20 and Art. 21). These relevant impingements are the meaning factors, i. e., the semiotic factors, for the living plant. Using the example of the oak tree’s leaves, Jakob von Uexküll shows how phytosemiosis functions. One of the meaning factors for oak leaves is rain. After striking a leaf, raindrops follow the physical laws governing the flow of liquids. In this case, according to Jakob von Uexküll, the leaf is the “receiver of meaning” coupled with the “meaning factor” rain by a “meaning rule”. The form of the leaf is such that it accomodates the physical laws governing the flow of liquids. In addition, all oak leaves work together forming cascades in all directions in order to distribute the rain water on the ground for optimal use by the roots. To put it in the common semiotic terminology: the leaf’s form is the interpretant and the physical behavior of the raindrop is the signifier. The code coupling leaf and raindrop is the oak tree’s need of liquid for transporting nourishing salts into its cells. The difference between plants and animals is that the plant utilizes meaning by means of a form developed according to a “plan of nature” and enabling the leaf to accommodate the flow of liquids, while humans and animals utilize meaning through their function cycle. The code of a plant’s need is a superordinate rule coupling two subordinate rules, the physical laws governing the forming and flowing of drops and the biological formation rules according to which the leaves of a particular species of plants grow in their typical habitat. The code of an animal’s need couples relevant objects to its receptors and
2.4.5. Predominance of indexicality in plant semioses Jakob von Uexküll was not familiar with the Anglo-American or the French tradition of semiotics. As a biologist he developed his theory of meaning independently. It is possible, however, to translate his theory and terminology into the traditional semiotic framework. The classical trichotomy of possible relationships between the material realization of a sign and the object it stands for is, in Peirce, given by differing degrees of iconicity, indexicality and symbolicity (in the Saussurean tradition by degrees of motivation, indexicality and arbitrariness). If one wishes to extend this trichotomy to plants, animals and humans, differences in the coding of signs become evident. In plants, the absence of the function cycle would suggest that indexical coding predominates over iconicity. Thus, the form of the leaf models contiguously the flow of liquids. In animals, iconic coding predominates over symbolicity, since the doublepronged action of receptors and effectors models the object as a ‘concave’ image of the two actions. Finally, symbolicity predominates over iconity in humans because of their use of language and other arbitrary sign systems in the function cycle of social interaction. There are, then, three levels of meaningful cycles corresponding to the predominance of indexicality, iconicity and symbolicity. Indexicality, on the vegetative level, corresponds to sensing and regulating in a feedback cycle of meaningful impingements contiguously fitted to the form of plants. Iconicity, on the animal level, is produced by the function cycle, where receptor and effector activities represent, in a nervous system, the “image” of objects. Symbolicity, on the human level, comes about by perception and action in society involving communicative signs.
3.
Biosemiotic communalities
3.1. The problem of plant receptors The difference between plants on the one hand and animals and humans on the other (which makes the enterprise of phytosemio-
23. Phytosemiosis
tics necessary) rests on Jakob von Uexküll’s assumption that plants do not have a function cycle connecting objects to effectors via receptors and a nervous system. This assumption appears to be in contradiction with an increasing body of literature on “plant receptors”. Even in fungi photoreceptors have been found (cf. Art. 22; see also Delbrück et al. 1976 and Delbrück et al. 1977). As Presti et al. 1977 state, “the Phycomyces sporangiophore is a single cell and responds phototropically, adapting to various light levels […]. The authors have analyzed the kinetics of this adaptation, using a tracking machine for greater precision. Dark adaptation is exponential […], i. e., the threshold falls exponentially in the dark in contrast to scotopic vision where the logarithm of threshold falls exponentially in the dark.” When the chemical functioning of these photoreceptors was analyzed, the result was that “the bluelight receptor” of Phycomyces is not carotene as in animals but riboflavin. A similar topic in the literature is research on plant hormone receptors (cf., e. g., Dodds and Hall 1980, who review the problem with a bibliography of 65 titles). In contrast to the large number of hormones found in animals, so far only a few groups of plant hormones are known. These have a much simpler structure than animal hormones. According to Dodds and Hall (1980), “the very term ‘hormone’ is called into question in plants since the site of synthesis is not usually restricted to a specialized organ or tissue […]. Most if not all plant cells have had the capacity for hormone synthesis at some time in their development and many retain this capacity, even to a limited extent.” In addition, “there is usually no one distinct target for a given hormone since at any one time many different tissues and organs in the plant are capable of responding to it ⫺ often in a different way”. It is this “totipotency of plant cells”, a principle formulated by Haberlandt as early as in 1902 (Haberlandt 1902), that differentiates photo (and hormone) receptors of plants from those in animals. It is, however, typical for the modern conception of “plant receptors” in botany to refer to chemical “binding processes” between chemical “messengers” and “target substances”, rather than describing specialized cells, cell compounds or organs, as these are present in animals. Even if cell specialization is largely absent in plants, the fact of intercellular com-
513 munication cannot be denied and it is this fact that links them with the animal kingdom. 3.2. Intercellular communication Since the beginning of the twentieth century quite a few chemical messengers have been discovered in plants, which are similar to those found in animals and humans (cf. Art. 9). These structural or functional similarities have prompted the hypothesis that they are not due to chance: the basic biochemical elements of intercellular communication should be found at the beginning of the evolutionary process before plants and animals branched off. This “unifying theory of intercellular communication” (Roth and Le Roith 1987) holds that primordial messenger molecules are unicellular species ancestral to those in plants, animals and humans alike. Such a view has the merit of bringing order into the startling multitude of different messenger substances discovered since the beginning of the twentieth century, when it was thought that there were only two basic kinds ⫺ hormones and neurotransmitters. Roth and Le Roith (1987) report that quite a number of unicellular organisms contain substances like the hormones of vertebrate animals. Thus, a chemical substance similar to insulin was found in a protozoon (Tetrahymena pyriformis), and in a bacterium (Escherichia coli). Equally such neurotransmitters as acetylcholin have been found in one-celled organisms. The presence of hormone-like substances and receptors in single-celled beings raises the question of what kind of communication they engage in. According to Roth and Le Roith (1987) they exchange signals mainly to regulate feeding and reproduction. The means of communication of these cells are very simple: one cell secretes a substance that travels through a surrounding medium to an adjacent or more distant cell which binds it. Endocrine and neuronal communication are said to have developed from this generic type of communication by specialization. Both the nervous and the endocrine system descend from a common ancestor. This theory has the advantage of explaining the coincidences found in cellular communication of plants and animals. Plant cells communicate chemically among each other to regulate growth, the ingestion of nutrients and their responses to weather changes and daily or seasonal cycles. Since certain of the chemical messengers contained
514 in plants are also contained in the animal and human body, it might no longer be a surprise that some basic laws of human physiological psychology are paralleled in plants. France´ (1909) listed 21 such laws in his book on Plant Psychology which are all confirmed by experimental evidence. For example, weak stimuli need summation to become effective in man and plant; as nervous activity slackens in man through sustained functioning, irritability slackens in plants but is in both cases re-established through rest; light of different wave lengths gives different color sensations to the human eye while plants differentiate between different wave lengths by changing movement reactions. 3.3. Imposition of meaning The common biosemiotic basis of plants and animals is not only that they use a specific selection of impingements meaningful to
III. Arten der Semiose
them but also that they all undergo imposition of meaning. Jakob von Uexküll (1940 ⫽ 1970) shows this with the different roles a flower in a meadow may play as a meaningful object in various function cycles: it may be picked by a human for a flower bouquet, it can be used as a walkway and plant-louse farm by ants, the larva of the cicada may bore its nest into its stem, and the cow may swallow it down together with a bunch of grass. Suffering the imposition of meaning occurs analogously in animals and humans, as is proven by the roles of prey and predator among animals and among animals and humans as well as by the oppression of humans by humans (cf. Fig. 23.4⫺10). In the “plan of nature”, the imposition of meaning may function to reduce excess individuals in the interest of their own species or of a whole
Fig. 23.6: Fox and oak tree (Uexküll and Kriszat 1970: 96). Fig. 23.4: Forest ranger and oak tree (Uexküll and Kriszat 1970: 95).
Fig. 23.5: Girl and oak tree (Uexküll and Kriszat 1970: 95).
Fig. 23.7: Owl and oak tree (Uexküll and Kriszat 1970: 97).
23. Phytosemiosis
515
Fig. 23.8: Bark-beatle and oak tree (Uexküll and Kriszat 1970: 99).
ecological system, whereas social oppression among humans seems to be dictated by sociohistorical factors. 3.4. Rules of correspondence With the oak leaf and raindrop example, Jakob von Uexküll showed that meaning in nature is based on “rules of correspondence” bracketing subordinate biological formation rules and physical rules. His favorite metaphor for this meaningful correspondence is a musical composition of which nature itself is the composer. This whole composition, whose score the biologist is trying to write, i. e., whose syntagmatic rules he is to study, is based on the technique of counterpoint. The method is to find the counterpoint to each note of the composition by following the rule that wherever there is a point, its corresponding counterpoint can be found. The flow of raindrops is the counterpoint to the point of the leaf’s form, the soft skin of mammals corresponds to the tick’s bite, the path corresponds to man’s feet, nourishment to his mouth, an enemy to his weapon, as Jakob von Uexküll has pointed out. There is one fundamental rule of correspondence between humans and animals on the one hand and plants on the other: plants
Fig. 23.9: Ant and oak tree (Uexküll and Kriszat 1970: 98).
Fig. 23.10: Parasitical hymenopter (Ichneumon) and oak tree (Uexküll and Kriszat 1970: 100).
produce the oxygen humans and animals breathe. In other words, the life of plants corresponds as a counterpoint to the breathing lungs of humans and animals as a point.
516
III. Arten der Semiose
3.5. Endosemiotics It has been shown above that the semioses of the vegetative world are different from those of animals and humans. The absence of receptor- and effector-organs in plants does not allow the constitution of a function cycle, of object signs and communicative signs nor of an Umwelt. But it has also been shown that intercellular communication functions according to principles ancestral to both plants and animals (cf. Art. 21). The field of inquiry studying these sign processes has been labeled endosemiotics (Sebeok 1976, Uexküll 1980). Exosemiotics (Uexküll 1980) is the investigation of sign processes arising when by means of receptor and effector organs an Umwelt is constituted. But the mediation between receptor and effector organs through the nervous system depends on endosemiotic processes.
4.
Plants’ involvement in semioses
4.1. Biocommunication defined Apart from the concept of intercellular communication a second more macroscopic idea is proposed in biology in order to study biocommunication. According to Tembrock (1975) communication takes place when, between the effector system and the receptor system of living being A, a living being B enters which is capable of decoding information sent by A and sending information which A is capable of decoding. Communication in this form serves the purpose of gaining confirmation about information from an environment by means of other living beings sharing it. In the simplest case, the conditions of communication are satisfied by negative feedback between sender and receiver (transmission of information in one direction only) when the communication is completed with the reception of the sought for information. Tembrock’s conception of biocommunication presupposes that there is a function cycle with an effector and receptor system and that the organisms involved are furnished not only with functional systems but also with signaling systems ⫺ the functional systems serving the four basic codes (exchange of matter, reproduction, information seeking and defense), the signaling systems making possible the exchange of information (cf. Art. 27 § 2. and § 3.). Functional information seeking systems are geared to picking up potential non-addressed information present in the environment according to primary codes.
Signaling systems are phylogenetically younger and have been developed to address and receive “actual” information from other living beings according to secondary codes. Both kinds of codes may be described in terms of their syntactics (e. g., the channel, the spatiotemporal order, the sequence and the combination rules of its signs), in terms of their semantics (e. g., the meaning of its signs in terms of the identity, motivation or environmental perception of the sender), and according to their pragmatics (e. g., with respect to the behavioral effects or changes resulting from the reception of signs). There is little doubt that plants do engage in information seeking by means of primary codes. But very little is known about whether they address information in secondary codes to other plants, to animals or to humans. Given the requirement of a function cycle and specialized signaling systems in Tembrock’s (1975) definition it seems improbable. Nevertheless, phytosemiotics must examine, along the guidelines of syntactics, semantics and pragmatics, evidence of possible intraspecies and interspecies aspects of information exchange in plants. These aspects could be subdivided into meaningful relationships (based on primary and/or secondary codes) between plants (of the same or of different species), between animals and plants, and between humans and plants. On each of these levels, particular care must be taken to control the anthropocentrism of the observer who might be unable to perceive certain sign sequences emitted by a plant, for example, when he is confronted with a bat’s sonar signals or the ultraviolet-absorbing petal zones in a flower which are visible only to the pollinating insect landing on it in search of nectar (Thompson et al. 1972). 4.2. Plant to plant relationships Meaningful interactions can be expected to exist between plants of the same as well as of different species. Potential channels are chemical, electrical or mechanical. Mutual influences would probably occur through direct contact rather than over a larger distance. One group of phenomena to be investigated by phytosemiotics is that of phytozenosis. For example roses and lavender may form an alliance for mutual benefit (symbiosis) against mildew. But also such phenomena as parasitism (one plant living off the substance of another) may be grouped under phytozenosis. Probably every natural biotope
23. Phytosemiosis
should reveal, in contrast to a monoculture, quite a number of phytozenotic relationships. These have been studied thus far by the discipline of plant sociology. But nothing is known about the primary or secondary codes involved in these relationships. A hint as to what kind of processes could be involved in plant to plant relationships comes from what has recently been called “chemical ecology” (Eisner 1986). Already in 1937 Molisch published a short communication “On the influence of a plant on another one spatially separated from it”. He confirmed the practical experience that ripe apples and pears put next to unripe ones accelerated the process of ripening in the latter. But there was also a pronounced influence of the mature fruits on sprouts of the vetch, the pea, the broad bean and the potato. Their growth in length was decelerated but accelerated in width when the sprouts where kept under a glass bell together with the fruit. Only living fruit showed this effect, not ones which had been killed in boiled water. Repeated experiments showed that mature fruit exhaled the gas ethylene, the influence thus being attributable to gaseous molecules emitted by the living fruit and received as hormones by the other living plants, fruit or sprouts. This phenomenon, called “allelopathy” in the wide sense, is widespread among plants and animals (Whittaker and Feeny 1971). Since the early 1980s there has been growing evidence that plants not only partake in chemical warfare against their predatory insect enemies but also exhalate gaseous messages to their kind which are taken as “warning messages”. Studies by Rhoades, as reported by Winter (1982), showed that willows when attacked by tent caterpillars (Malacosoma californicum pluviale) not only affect their predators by using their own chemistry to make their leaves less nourishing, but also send messages to uninfested willows nearby, thus triggering their chemical defense mechanism. In the experiments conducted by Rhoades the caterpillars were treated under three feeding conditions: One group was given leaves from trees that had been infested for weeks, one from uninfested ones standing near the infested ones, and one group from uninfested ones a mile away from the infested ones. The dependent variable measured was the growth of the caterpillars. The result was that caterpillars fed with leaves from the infested willows and the unifested ones nearby grew markedly slower than the ones fed with
517 leaves from those further away. The conclusion was that the infested trees (or the insects themselves?) were sending a message to the uninfested ones, which reacted by mobilizing their chemical defenses. Since the test trees were not connected by roots (some of them grew up to 60 m apart) and there were no other trees growing in the middle, the messages could only be airborne ⫺ possibly by pheromones. In the meantime, the evidence that plants send warning messages to other plants has grown considerably (cf. Brownlee 1983). Eisner (1986) maintains that trees chemically ‘leavesdrop’ on their environment. If an individual in a group of trees is attacked by insects, not only does its own toxic defense accelerate but also that of neighboring trees ⫺ which need not even belong to the same species ⫺ because they detect certain chemicals involved in the attack. Whether trees send gaseous warning messages or chemically scan their surroundings, there must in any case be processes of communication involved which are at least similar to intercellular communication within plants and animal organisms. Whether these processes satisfy Tembrock’s (1975) strict definition, requiring a function cycle and signaling systems, is still too early to say. Phytosemiotics should one day be able to answer this question. 4.3. Animal to plant relationships Evidence from “chemical ecology” (Sondheimer and Simeone 1970) on the chemical warfare waged by plants against their insect predators has already been mentioned. There are two classes of defense which plants use. Either the chemical feeding deterrents are already present before the attack occurs, or such deterrents are mobilized in response to a particular attack. The first kind of defense occurs mostly in long-lived trees which in their leaves often combine toxins with less deadly chemicals that simply interfere with insect digestion. A group of chemicals called phenols (and among them the acid tannin) is present in almost all trees. Tannin is used in the leather trade to keep hides from rotting, but seems equally to prevent the extraction of nutrients during the insect’s digestion of leaves. Some trees even use double strategies. They mass toxins in certain boughs and shed attacked nontoxic leaves on others (Brownlee 1983). But some insects evolve their own counteradaptation against arboreal strategies by becoming immune to the toxins.
518 While the first kind of defense rests on strategies of long-lived plants, short-lived plants must kill their predators quickly. They have little time to grow and reproduce and therefore they must be either full of poison to begin with or mobilize toxins and send them to the attacked leaf in a relatively short time. The latter type of defense is called “induced resistance”. Carrol and Hoffman (1980) found that it takes the crookneck squash only about forty minutes to mobilize a chemical feeding deterrent and to send it to the area attacked by a lady bug. The latter is faster, however, and takes only ten minutes to cut out a limited area from the leaf before the deterrent can reach it. This seems to be a case of counteradaptation on the part of the bug. The fact that herbivores often move from one plant to another before having finished the leaves of the first could be an adaptive response geared to avoiding the arrival of defensive toxins at the feeding area. On the other hand, plant defense not only serves self-survival but also prevents an explosive propagation of insects by curtailing their food supply.
Fig. 23.11: Blossom of fly orchid (Ophrys insectifera); below: male bee attempting to copulate; above: head of the bee with pollen (P) attached (Wickler 1968: 212).
III. Arten der Semiose
The silent struggle of plants against their predators by counter-adapting in turn to their counter-adaptation gives the impression of an “arms race” taken with a time-lapse camera (cf. Bouissac 1993). For each deterrent the plant comes up with, insects evolve an adaptation. This forces the plant to evolve some new defense if it wants to survive. Insects tend to have shorter lives and must therefore evolve more quickly than plants. Hence the burden of counter-adaptation by inventing new chemical weapons time after time is on the plants (Brownlee 1983). In addition to the chemical channel, the optical channel is involved in the interaction of plants and insects. Wickler (1968) reports astonishing cases of plant mimicry. For instance, there are some species of orchids with flowers resembling the female bodies of their pollinators in such a way that the males are tricked into initiating copulation with them (cf. Fig. 23.11 and 23.12).
Fig. 23.12: Blossom of Australian Cryptostylis leptochila with male wasp Lissopimpla semipunctata; middle: the male in an action of pseudo-copulation; below with pollen (P) attached to the back (Wickler 1968: 213).
23. Phytosemiosis
Even in mammals the effect of plant odors has been shown. Hamsters learn to prefer plant odors to which they have been exposed early and transfer this preference to combinations of plant and hamster odors (Cornwell 1976). Many of the cases of plant-animal interaction may be viewed as meaning imposition on plants by animals in general and especially by insects furnished with a function cycle (cf. Art. 24). In that case the plant would constitute a sign object in the animal’s or insect’s Umwelt. The chemical state of the plant would become a matter of functional information seeking according to primary codes. But how plants react to insects by mobilizing toxins to the attacked area requires their sensing damage done to their leaves and regulating their chemistry household in response to it. Is this a case of intercellular communication in which the damaged cells (or their neighbors) send off messenger substances to other cells specialized in preparing toxins? Which cells are these? And how do they get the toxins back to the attacked area? Phytosemiotics should be able to answer these questions, too, by taking into account new developments in ecological research. 4.4.
Human to plant relationships
4.4.1. Imposition of human meanings on plants There are interactions with plants which are meaningful at least to the human partner of the interactants. Here, the optical and chemical channels would seem to be involved. They appear to be founded exclusively on the imposition of meaning upon plants by humans consuming or using them (cf. Art. 25). Plants ⫺ with a few exceptions ⫺ are autotrophous, i. e., they do not nourish themselves by consuming other living organisms. Animals and humans are heterotrophous, and thus plants and animals alike are ingested by animals and humans for nourishment. 4.4.2.
Plant ingestion
4.4.2.1. Plant ingestion for nourishment The ingestion of plants seems to have occurred in humans rather unsystematically prior to the neolithic agricultural revolution (10⫺12 thousand years ago; cf. Art. 32). Since that time, however, plants and animals alike have been bred systematically for nutri-
519 tion. But agriculture was probably preceded by gardening, which seems to have been an invention of women. 4.4.2.2. Plant ingestion for medicinal reasons The ingestion of plants for nourishment was perhaps even preceded by their medicinal use. When 60 000 year old bones of a Neanderthal man were found in a grave located in Iraq, they were surrounded by fossilized grains of pollen, which belonged to flowers of eight species, of which seven are still attributed with medicinal effects today (Roth and Le Roith 1987). Cultures all over the world have independently gained the knowledge that certain plants or plant ingredients could be used to influence human (and animal) health and behavior. In fact, the medical writings in antiquity of such authorities as Hippocrates and Galenus are largely treatises of phytodietetics and phytotherapy (cf. Art. 45). And phytotherapy has been replaced to a large extent by chemotherapy only since the 19th century. As has been pointed out, there are certain chemical messengers found in plants which are structurally or functionally similar to those found in animals and humans because they stem from the same ancestors. By this coincidence plant ingredients have a variety of effects on human health and behavior. It is now known that these effects are due to the fact that the plant ingredients “mimic” the body’s own chemical messengers. For instance, the opium found in poppies contains the alkaloid morphine. Attaching itself to the receptors of human nerve cells it induces the same cellular reactions which normally would be activated by the body’s own endorphines secreted under stress and pain. Interestingly, while scientists have studied over thousands of years what plant substances can do for the human body, there is still very little knowledge about what these substances mean to the plants in the first place (Roth and Le Roith 1987). 4.4.3. Psychological and aesthetic factors in human-plant relationships Plants are, of course, also bred as raw materials for building, textiles, rubber, perfumes etc. But as with animal pets, humans grow plants even for psychological and aesthetic purposes. They impose on them the meaning of being object signs with psychological meaning. For example, plants as “cherished
520 household possessions” (Csikszentmihalyi and Rochberg-Halton 1981) sometimes become “trophies” of their breeders’ ability to take care of them (cf. Art. 88). In psychoanalysis, plants experienced as sprouting from the own body (in the case of schizophrenics) or dreams of plants are sometimes taken as a healing symptom of “phylogenetic regression” to the earlier and healthier beginnings in babyhood when a differentiation from the “nonhuman environment” was not yet initiated (Searles 1960). Although the psychotherapeutic effects of human interaction with plants are still unknown, green surroundings are known to have a calming effect on people (cf. Fig. 23.13 on plate III). Visual aesthetic experience is heightened in human symbiosis with plants because of their form, color and odor. Plant forms, their foremost receiver of meaning, not only indexically represent their coupling with meaning factors (Jakob von Uexküll 1940 ⫽ 1970) but also depict iconically the forces to which these forms have adapted. 4.4.4. Plants as meaningful objects in philosophy and science Plants have always been objects of reasoning and communication for humans. In this way the meaning of being thought signs or messages of communication is imposed on them. Plants as signs of thought are not static, however, and their meaning has developed diachronically. Western philosophical and scientific thinking about plants has drastically changed since Antiquity (cf. Art. 46). Empedocles still thought that trees grew before the sun existed. Plato wrote in his Timaios that the plants were created after men to be their helping companions. But as early as in Aristotle a hierarchy of living beings had been consolidated (cf. Fig. 23.14 on plate III). The position of the plant in that hierarchy was above inanimate nature but below animals. Aristotle opened the discussion of whether plants have a soul. He came to the conclusion that they appear to be without a soul if compared to animals, as incapable of locomotion, but that a specific type of plant soul must be granted to them. Aristotle also speculated that the roots of plants paralled the heads of animals because both were equipped to take in nourishment. This idea was picked up by Thomas Aquinas. He compared the vertical stance of humans and plants, which are dia-
III. Arten der Semiose
metrically opposed as far as the organs for the intake of nourishment and sexual reproduction are concerned, while the animal takes a horizontal position with respect to both. This hierarchical paradigm has predominated up to the 19th century when the discussion on the soul of plants took on a new quality. The physicist and psychologist G. Th. Fechner (1866 ⫽ 1903) wrote a book on the soullife of plants, where he even grants them imagination. In a famous speech before the Imperial Academy of Sciences in Vienna on May 30, 1908, the biologist Haberlandt settled accounts with the Aristotelian hierarchization of life and gave many examples of the plants’ own irritability and sensibility (cf. Art. 22 §3.). In 1909 the aforementioned book on Plant Psychology by the plant physiologist R. H. France´ appeared. France´ was also the author of a book on the Plant as an Inventor (France´ 1920), in which the term “biotechnique” is used for the first time. In his popular book Plant and Planet the biologist Anthony Huxley (1974) cites experimental evidence for the sensibility of plants to vibrations of various frequencies which might ultimately account for different growing responses to different styles of music as reported sporadically in the literature. Thus in the course of centuries the concept of the plant, the thought sign plant, has changed: from being a member of the lowest level in the hierarchy of life it has now become recognized as a necessary partner in the systematic circulation of life in which also animals and humans participate. 4.4.5. The meaning of plants in poetry Plants have not only played a role as thought signs in philosophy and science, but individual plants have also been used as symbolic messages and frequently metaphoric meaning has been imposed on them. In folklore and poetry plants are often brought into connection with love. Elaborate flower codes have been devised for communication between lovers, in which each different type of flower is used as a sign for a different message (Gessmann 1899). In the poetry of male writers from antiquity to modern times, various flowers have been used as symbols for the loved woman. If this is interpreted in the light of Thomas’ speculation that, while the human sexual organs point down, the plants’ equivalents point up, this symbol may simply express subconscious desire.
23. Phytosemiosis
5.
Selected references
Arnheim, Rudolf (1975), “Pflanzen als Tiere”. In: Film als Kunst. Munich: Hanser, 136⫺138 (originally: Rowohlt 1932). Bouissac, Paul (1993), “Semiotisches Wettrüsten: Zur Evolution artübergreifender Kommunikation”. Zeitschrift für Semiotik 15: 3⫺21. Brownlee, Shannon (1983), “The Silent Battle”. Discoverer (September 1983): 28⫺32. Carrol, C. Ronald and Carol A. Hoffman (1980), “Chemical Feeding Deterrent Mobilized in Response to Insect Herbivory and Counteradaptation by Epilachna tredicimnotata”. Science 209: 415⫺ 416. Cornwell, Catherine A. (1976), “Selective Olfactory Exposure Alters Social and Plant Odor Preferences of Immature Hamsters”. Behavioral Biology 17: 131⫺137. Csikszentmihalyi, Mihaly and Eugene RochbergHalton (1981), The Meaning of Things. Domestic Symbols and the Self. Cambridge, England: Cambridge University Press: 78⫺82. Darwin, Charles (1896): The Power of Movement in Plants. New York: Appleton. Delbrück, Max, A. Katzir and David Presti (1976), “Responses of Phycomyces Indicating Optical Excitation of the Lowest Triplet State of Riboflavin”. Proceedings of the National Academy of Science 78: 1969⫺1973. Delbrück, Max, J. Degenkolbe and K.-H. Leser (1977), “Discussion to IV. Light and Dark Adaptation of the Photoreceptor Cell”. Biophysics of Structure and Mechanism 3: 181⫺182. Dodds, John H. and Michael A. Hall (1980), “Plant Hormone Receptors”. Scientific Progress 66: 513⫺533. Eisner, Thomas (1986), “Chemische Ökologie: Erforschung und Entdeckung einer schwindenden Welt”. In: Thomas Eisner, Bert Hölldobler und Martin Lindauer (eds.), Chemische Ökologie. Territorialität. Gegenseitige Verständigung. Stuttgart and New York: Fischer: 7⫺23. Fechner, Gustav Th. (1866), Nanna oder das Seelenleben der Pflanzen. Hamburg and Leipzig: Voß. 3rd edition 1903. France´, Raoul H. (1909), Pflanzenpsychologie (als Arbeitshypothese der Pflanzenphysiologie). Stuttgart: Franckh. France´, Raoul H. (1920), Die Pflanze als Erfinder. Stuttgart: Franckh. Gessmann, Gustav W. (1899), Die Pflanzen im Zauberglauben. Wien, Pest and Leipzig: Hartleben. Reprint The Hague: Couvreur. Gibson, James J. (1979), The Ecological Approach to Visual Perception. Boston: Houghton Mifflin. Haberlandt, Gottlieb F. J. (1902), “Kulturversuche mit isolierten Pflanzenzellen”. Sitzungsberichte der Akademie der Wissenschaften. Vienna: 69⫺92.
521 Haberlandt, Gottlieb F. J. (1908), “Über Reizbarkeit und Sinnesleben der Pflanzen”. Vortrag, gehalten in der feierlichen Sitzung der kaiserlichen Akademie der Wissenschaften am 30. Mai 1908. Vienna: 379⫺403. Huxley, Anthony (1974), Plant and Planet. London: Allen Lane. Krampen, Martin (1981), “Phytosemiotics”. Semiotica 36, 3/4: 187⫺209. Krampen, Martin (1986), “Phytosemiotics”. In: Thomas A. Sebeok (ed.), Encyclopedic Dictionary of Semiotics. Berlin, New York and Amsterdam: de Gruyter: 726⫺730. Margulis, Lynn (1981), Symbiosis in Cell Evolution: Life and Its Environment on the Early Earth. San Francisco: Freeman. Marx, Karl (1857), “Einleitung zur Kritik der politischen Ökonomie”. In: Werke, Vol. 13. Berlin, GDR: Dietz 1961. Molisch, Hans (1937), ”Über den Einfluß einer Pflanze auf eine andere räumlich davon getrennte”. Sitzung der Österreichischen Akademie der Wissenschaften vom 22. April 1937. Mathematisch-naturwissenschaftliche Klasse 8. Vienna: 53⫺54. Presti, David, Wan-Jean Hsu and Max Delbrück (1977), “Phototropism in Phycomyces Mutants Lacking b-Carotene”. Photochemistry and Photobiology 26: 403⫺405. Roth, Jesse and Derek Le Roith (1987), “Chemical Crosstalk”. The Sciences 27, 3: 50⫺55. Searles, Harold F. (1960), The Nonhuman Environment in Normal Development and Schizophrenia. New York: International University Press. Sebeok, Thomas A. (1963), “Communication among Social Bees: Porpoises and Sonar, Man and Dolphin”. Language 39: 448⫺464. Sebeok, Thomas A. (1972), Perspectives in Zoosemiotics. The Hague: Mouton. Sebeok, Thomas A. (1976), Contributions to the Doctrine of Signs. Bloomington: Indiana University Press, and Lisse: de Ridder. Sondheimer, Ernest and John B. Simeone (eds.) (1970), Chemical Ecology. New York: Academic Press. Tembrock, Günter (1975), Biokommunikation. Reinbek: Rowohlt. Thompson, W. R., Jerrold Meinwald, D. Aneshansley and Thomas Eisner (1972), “Flavonols: Pigments Responsible for Ultraviolett Absorption in Nectar Guide of Flower”. Science 177: 528⫺530. Uexküll, Jakob von (1913), “Tierwelt und Tierseele”. In: Jakob von Uexküll, Bausteine zu einer biologischen Weltanschauung. Munich: Bruckmann. Reprint 1980: 77⫺100. Uexküll, Jakob von (1922), “Wie sehen wir die Natur und wie sieht sie sich selber?” Die Naturwissenschaften 14: 316⫺322.
522
III. Arten der Semiose
Uexküll, Jakob von (1935), “Die Bedeutung der Umweltforschung für die Erkenntnis des Lebens”. Zeitschrift für die gesamte Naturwissenschaft 7: 257⫺272. Uexküll, Jakob von (1940), “Bedeutungslehre”. Bios 10. Leipzig. Reprint in: Jakob von Uexküll and Georg Kriszat, Streifzüge durch die Umwelt von Tieren und Menschen. Bedeutungslehre. Frankfurt a. M.: S. Fischer. 1970. Uexküll, Jakob von (1980), Kompositionslehre der Natur, ed. Thure von Uexküll. Frankfurt a. M., Berlin and Vienna: Ullstein.
Uexküll, Jakob von (1942), “The Theory of Meaning” (⫽ English translation of Bedeutungslehre, Uexküll 1940). Semiotica 42/1: 1⫺87. Whittaker, Robert H. and P. Feeny (1971), “Allochemics: Chemical Interactions between Species”. Science 171, nr. 3973: 757⫺770. Wickler, Wolfgang (1968), Mimikry ⫺ Nachahmung und Täuschung in der Natur. Munich: Kindler. Winter, Jonathan (1982), “Tree Talk”. The Sciences (5. November).
Martin Krampen, Ulm (Germany)
24. Zoosemiose 1. Einführung 2. Definitionen 3. Grundtypen und Grundprinzipien von Zoosemiosen 3.1. Formen der Tierkommunikation 3.2. Einfachere Zoosemiosen 3.3. Charakteristika und Entstehung spezialisierter Signale 3.4. Intentionalität 4. Kanäle 4.1. Der optische Kanal 4.2. Der akustische Kanal 4.3. Der chemische Kanal 4.4. Mehrkanalige Tierkommunikation 5. Kodes 6. Zeichengebrauch von Tier und Mensch im Vergleich 7. Literatur (in Auswahl)
1.
Einführung
Das Zetern der Amsel beim Auftauchen einer Katze, die auffallenden Scherenbewegungen bei Winkerkrabben, das Freisetzen von Lockstoff durch weibliche Seidenspinner sind Zeichen, mit denen ein Tier andere über einen Vorgang in der Außenwelt oder seinen eigenen Zustand informiert (Abb. 24.1). Die vielfältigen Formen dieses Zeichenverhaltens von Tieren stehen der menschlichen Kommunikation durch sprachliche und nicht-sprachliche Zeichen gegenüber. Frühe Beobachter benutzten bei der Beschreibung von Tierverhalten unbefangen den Begriff „die Sprache der Tiere“, der auch heute noch gebraucht wird. Er gab und gibt Anlaß zu einer immer wieder aufflammenden Kontroverse um die Frage, ob die höchstentwickelten Formen tierischen
Abb. 24.1: Zeichengebrauch bei Tieren: Zeichen wie das Zetern der Amsel, die Scherenbewegung einer Winkerkrabbe und das Aussenden von Lockstoff beim Seidenspinnerweibchen informieren andere über einen Zustand des Senders.
Zeichenverhaltens die wesentlichen Eigenschaften menschlicher Sprache aufweisen (Gould/Gould 1981; vgl. Art. 25 § 2.3.). Den Begriff „Kommunikation“ wenden manche Biologen in Anlehnung an die Informationstheorie auf alle Prozesse von
24. Zoosemiose
Signalverarbeitung bei Lebewesen an (Tembrock 1971: Biokommunikation). Neuerdings spricht man in diesem Zusammenhang besser von „(Bio-)Semiose“. Ein sehr enger Kommunikationsbegriff ist dem Zeichenverhalten von Tieren jedoch auch nicht angemessen, weil er komplexe Formen von Intention voraussetzt und damit die Antwort auf eine Frage an den Anfang stellt, die sich, wenn überhaupt, erst am Ende der Untersuchung ergibt. Zudem liefe er dem allgemeinen Gebrauch des Begriffs „Tierkommunikation“, selbst durch führende Semiotiker (Sebeok 1977: „How animals communicate“), zuwider. Tierisches Zeichenverhalten stellt eine eigenständige Gruppe von Erscheinungen dar, die unabhängig von menschlicher Kommunikation existieren und zum großen Teil lange vor ihr entstanden sind (vgl. Art. 4 § 1. und Art. 10 § 1.). Ihre Untersuchung kann primär die Eigenart tierischer Kommunikationssysteme aufzeigen. Sie liefert damit die Voraussetzung für angemessene Vergleiche, die fundierte Aussagen über Gemeinsamkeiten und Unterschiede des Zeichengebrauchs von Tier und Mensch ermöglichen. Diese begründen einerseits die Sonderstellung des Menschen, zeigen aber auch auf, daß Tiere über Fähigkeiten verfügen, die er von Natur aus nicht besitzt (Burkhardt/Schleidt/Altner 1966).
2.
Definitionen
Eine Semiose ist dadurch gekennzeichnet, daß A einem Zeichen B die Bedeutung C zuordnet (vgl. Art. 1 § 2.); eine Zoosemiose liegt dann vor, wenn A ein Tier ist. Sie kann in einer einfachen Reaktion auf einen Umweltreiz bestehen, etwa dann, wenn ein Regenwurm sich vom Licht abwendet. Sie kann aber auch ein kompliziertes Kommunikationsgeschehen darstellen, z. B. wenn ein Eisfuchsweibchen, ohne daß eine Gefahr besteht, einen Warnlaut ausstößt und damit seine halberwachsenen Jungen vom umstrittenen Beutestück ablenkt (Rüppell 1969). Aussagen über Vorstellungen und Absichten bei Tieren können wir nicht ohne weiteres machen. Deshalb müssen wir bei der Untersuchung ihres Zeichenverhaltens einige Begriffe anders fassen als in der vorwiegend am Menschen orientierten Semiotik. In ihr wird ein Zeichen „Indikator (Anzeichen)“ genannt, wenn es beim Interpreten zur Bildung
523 einer Vorstellung führt. Bei Semiosen von Tieren sprechen wir von einem „Anzeichen“, wenn es beim Zeichenempfänger zu einem Verhalten führt, das nicht als einfache Reizantwort anzusehen ist. Das Zappeln der Beute im Netz der Spinne ist für diese ein Anzeichen, auf dessen Botschaft („hier ist ein Insekt, das sich zu befreien sucht“) sie entsprechend ihrem jeweiligen Hungerzustand sowie je nach Art und Größe der Beute angemessen reagiert; sie handelt so, als ob das Anzeichen bei ihr zur Bildung einer Vorstellung geführt hätte (vgl. Art. 4 § 1.). Kommunikation i. e. S. setzt sowohl beim Produzenten als auch beim Rezipienten von Zeichen Intentionen höherer Ordnung voraus (s. Art. 15). Diese kann eine kognitive Ethologie bei uns nahestehenden Tieren wahrscheinlich machen (s. § 3.4.), bei uns fernstehenden Formen ist das aber kaum möglich. Wegen dieser Schwierigkeiten ist das Problem der Intentionalität bei Tieren gesondert zu behandeln und Tierkommunikation ohne Bezug auf sie zu definieren, etwa mit Slater (1983: 10) als die Übertragung eines spezialisierten Signals von einem Tier zu einem anderen, wobei der Sender im Durchschnitt vergleichbarer Fälle von der Reaktion des Empfängers profitiert. Äquivalente einfacher Intention stecken hierbei im aktiven Aussenden des Zeichens, in der Beschränkung auf für die Informationsübertragung spezialisierte Signale und im Selektionsvorteil, den die Reaktion des Empfängers dem Sender bringt. Die spezialisierten Signale (in der ethologischen Literatur werden nur sie als Signale bezeichnet) sind entweder ritualisierte Verhaltensweisen, das sind zur besseren Erkennbarkeit in ihrem Ablauf standardisierte und eventuell übertriebene Bewegungen, oder Auslöser, d. h. für die Informationsübertragung veränderte Körperstrukturen, wie z. B. farbig hervorgehobene Flächen oder aufrichtbare Anhänge. Die so definierte Tierkommunikation (zur Unterscheidung von Kommunikation i. e. S. wird sie im folgenden immer als solche bzw. als „Kommunikation bei … (Tiergruppe)“ bezeichnet) beschränkt sich einerseits auf Zeichenprozesse zwischen Tieren, umfaßt aber andererseits Vorgänge, die in ihren beobachtbaren Erscheinungen verschiedenen der in Artikel 4 definierten Semiosetypen entsprechen können: dem signaling process, wenn Tier T1 automatisch ein Zeichen S produziert, auf das Tier T2 ebenso automatisch reagiert; dem indicating process, wenn S für
524
III. Arten der Semiose
T2 ein Anzeichen ist; der signification, wenn S einem Kode zugehört; der manipulation, falls wir T1 eine Intention zuschreiben; und der Kommunikation i. e. S., falls sowohl bei T1 als auch bei T2 höhere Intentionsstufen vorliegen. Eine entsprechende Unterteilung der Tierkommunikation unterbleibt hier, weil sie Bewertungen erfordert, die beim heutigen Stand der Diskussion über Intentionen bei Tieren nur umstritten sein können. Slaters Definition läßt offen, ob der Prozeß für den Empfänger vorteilhaft oder nachteilig ist. Dawkins und Krebs (1978) haben Tierkommunikation unter dem Aspekt der Individual- bzw. Genselektion, die das ,Prinzip Eigennutz‘ betont, als Manipulation in dem Sinne betrachtet, daß der Sender durch sie auf Kosten des Signalempfängers profitiert. Diese Sichtweise ist dort angemessen, wo ein Dritter eine bestehende Signalbeziehung ausnutzt, wie z. B. der junge Kuckuck die Reaktion von Vogeleltern auf bettelnde Junge. Als generelle Konzeption ersetzt man sie besser durch die Vorstellung, daß Tiere spezialisierte Signale benutzen, um andere zu beeinflussen. Denn Tierkommunikation ist im allgemeinen für beide Seiten vorteilhaft, und zwar wohl deswegen, weil die natürliche Selektion einseitig nachteilige Reaktionen unterdrückt, weil die Rollen von Sender und Empfänger vielfach austauschbar sind und weil Kooperation für jeden einzelnen der Beteiligten vorteilhafter sein kann als einseitige Ausbeutung (Markl 1985).
3.
Grundtypen und Grundprinzipien von Zoosemiosen
3.1. Formen der Tierkommunikation Der Begriff „die Tiere“ bezieht sich auf mehrere Millionen Tierarten, deren Gestalt so verschieden sein kann wie die einer Amöbe und die eines Känguruhs (vgl. Art. 22 § 1.). Entsprechend vielfältig sind die Formen der Tierkommunikation, die vom Austausch einfacher chemischer Signale bei Einzellern bis zu der Verständigung über Art, Ergiebigkeit und Lokalisation weit entfernter Trachtquellen bei der Honigbiene, komplizierten Zeremonien bei der Balz von Paradiesvögeln, sowie der Verständigung durch Lautäußerungen, Mimik und Gesten innerhalb einer Gruppe von Menschenaffen reicht. Diese Vielfalt kann man erstens, je nachdem ob Sender und Empfänger zur selben oder zu verschiedenen Arten (Spezies) gehören, in in-
tra- und interspezifische Kommunikation einteilen, zweitens nach den Informationskanälen in optische, akustische, chemische und andere Formen von Kommunikation und drittens nach Tiergruppen in Kommunikation bei Bienen, Heuschrecken, Fischen, Vögeln, Huftieren, Primaten und vielen anderen gliedern. Intraspezifische Kommunikation ist naturgemäß bei sozialen Arten höher entwickelt als bei einzeln lebenden. Doch auch bei diesen ist sie für die Partnerfindung und -koordination im Rahmen der Fortpflanzung sowie in Konkurrenzsituationen um Territorien und andere Ressourcen wichtig. Interspezifische Kommunikation findet sich dort, wo die spezialisierten Signale einer Art für andere Bedeutung haben, etwa dann, wenn eine Kohlmeise auf den Ruf anspricht, mit dem ein Buchfink das Herannahen eines Sperbers anzeigt. Sie spielt bei mutualistischen Beziehungen eine besondere Rolle, z. B. bei der Putzsymbiose zwischen tropischen Raubfischarten und dem kleinen Lippfisch Labroides dimidiatus. Die „Putzkunden“ suchen Labroides aktiv auf; er gibt sich durch seine Färbung und eine spezielle Schwimmweise zu erkennen; daraufhin verfallen sie in eine Starre, die es ihm erlaubt, sich unbeschadet zu nähern und ihnen Parasiten und abschilfernde Hautstücke abzulesen. Wie zuverlässig die zugehörige Semiose abläuft, wird daran deutlich, daß eine andere Art sie als Parasit ausnutzt: der Schleimfisch Aspidontus taeniatus setzt dieselbe Färbung und Schwimmweise wie Labroides dazu ein, die Putzkunden zu beschwichtigen (Abb. 24.2), beißt ihnen dann aber Stücke aus den Flossen! Tiere, zu denen der Mensch Kontakt aufnimmt, kommunizieren auch mit ihm. Beide Seiten benutzen dabei zunächst ihre arteigenen Zeichen: der Hund bellt und wedelt mit dem Schwanz, und der Mensch spricht ihn an, gelegentlich ausdrücklich als Artgenossen (Abb. 24.3). Entwickelt sich zwischen Tier und Mensch ein enges Verhältnis, so kann dies zur Ausbildung hochdifferenzierter Kommunikationsformen führen (s. Art. 163). Der interspezifischen Tierkommunikation entsprechende Semiosen kommen auch zwischen Pflanzen und Tieren vor (und zwar nur in dieser Richtung): Blüten, die von Tieren bestäubt werden, sind in Form, Farbe, Nektargehalt und Duft auf die Sinne und Ansprüche ihrer jeweiligen Bestäubergruppe abgestimmte spezialisierte Signale (s. Kugler
525
24. Zoosemiose
Abb. 24.2: Aussehen und spezifische Schwimmweise des Putzerfisches Labroides dimidiatus und deren Nachahmung durch den Schleimfisch Aspidontus taeniatus.
Auch Zeichen, die ein Tier während der Interaktion mit einem anderen nutzt, müssen nicht im Dienste der Informationsübermittlung entstandene Signale sein. Sie können, wie z. B. heftiges Atmen, Symptome eines Zustandes sein, die es dem Tier gestatten, sein Verhalten auf das seines Partners einzustellen.
1970). Entsprechendes gilt für einen Teil der Früchte, deren Samen durch Tiere verbreitet werden (Pijl 1969; vgl. Art. 23).
3.3. Charakteristika und Entstehung spezialisierter Signale Bei einer Interaktion ist zunächst nicht erkennbar, auf welche Eigenschaften seines Gegenübers ein Tier anspricht und ob es sich dabei um Symptome oder spezialisierte Signale handelt. Eine Ausnahme stellt die Erscheinung der Mimikry dar, bei der sich am „gefälschten“ Signal des Nachahmers ablesen läßt, welche Merkmale für den Signalemp-
3.2. Einfachere Zoosemiosen Neben der Tierkommunikation gibt es Semiosen, bei denen ein Tier auf nichtspezialisierte Zeichen reagiert. Das Rascheln der Maus, das der nächtlich jagenden Eule als Anzeichen einer Beute dient, hat sich sicher nicht im Sinne der Übertragung dieser Information herausgebildet. Deshalb ist es kein spezialisiertes Signal und der Vorgang kein Fall von Tierkommunikation. Entsprechendes gilt allgemein für die Reaktion von Tieren auf Merkmale ihrer Nahrungsorganismen, sofern diese nicht die Tiere für eigene Zwecke einsetzen und dafür anlockende Signale entwickelt haben. Vergleichbare Zeichenprozesse lassen jedes Tier in angemessener Weise auf Merkmale seiner unbelebten Umwelt ansprechen. So führt die Reaktion auf die Neigung des Untergrundes, den Sonnenstand (unter Berücksichtigung der Tageszeit) und die Windrichtung den vom Austrocknen bedrohten Strandflohkrebs zur Wasserlinie zurück (Scapini/Ercolini/Boccacci 1988).
Abb. 24.4: Schwebfliege mit dem Zeichnungsmuster einer Wespe.
Abb. 24.3: Interspezifische Kommunikation: Einsatz arteigener Zeichen gegenüber artfremden Individuen.
526
III. Arten der Semiose
fänger relevant sind (Wickler 1968). So deutet das Erscheinungsbild einer wespenähnlichen Schwebfliege (Abb. 24.4) darauf hin, daß Vögel die für sie ungenießbaren Wespen an der schwarzgelben Querstreifung des Hinterleibes erkennen. Dabei ist ersichtlich, wie im Verlauf der Evolution spezialisierte Signale durch Mutation und Selektion geformt werden konnten: Mutationen führten bei den Vorfahren unserer Fliege zu Färbungsvarianten, von denen Vögel diejenigen verschonten, die ihrem Merkmalsbild einer Wespe entsprachen. Ethologische Analysen ergaben ferner, daß im intraspezifischen Bereich Symptome, die auf innere Vorgänge wie Erregung, widerstreitende Motivationen oder Vorbereitungen zu Handlungen hinweisen, also z. B. angespannte Körperhaltung, ambivalentes Verhalten, Übersprungreaktionen oder Intentionsbewegungen, oft Ausgangspunkt für die Entstehung von ritualisierten Signalen und Auslösern waren. Beispielsweise sträuben viele Vogelarten bei Erregung das Kopfgefieder. Dies wurde bei einigen zum ritualisierten Signal weiterentwickelt, dessen Wirkung durch einen Auslöser in Form einer aufrichtbaren Federhaube verstärkt sein kann (Abb. 24.5).
Abb. 24.6: Männlicher Witwenvogel: Ein Prachtkleid, das Fortpflanzungsfähigkeit und Vitalität anzeigt, kann seinem Träger offensichtlich hinderlich sein.
Abb. 24.5: Sträuben der Scheitelfedern als Symptom von Erregung bei einem Amazonenpapagei und die daraus entwickelte aufrichtbare Federhaube bei einem Kakadu.
Als besonders wirksamer Faktor ist in diesem Zusammenhang die (inter-)sexuelle Selektion anzusehen, bei der im typischen Fall Weibchen Männchen auswählen. Sie hat bei manchen Arten zu Prachtkleidern geführt, die ihre Träger offensichtlich behindern (Abb. 24.6). Nach Zahavis handicap-Prinzip zeigt das Männchen damit an, das es so lebenstüchtig ist, daß selbst diese Behinde-
rung es nicht beeinträchtigt. Tatsächlich wählen Weibchen die Männchen mit den am stärksten entwickelten Prachtkleidern, die ihrerseits Vitalität, z. B. Resistenz gegen Parasiten, anzeigen (Zuk 1992). Spezialisierte tierische Signale müssen nicht evolutionsgeformt sein. Sie können auch durch Lernprozesse verändert oder, wie die Gesänge mancher Vogelarten, ganz durch Lernen erworben werden. Schließlich kann die Evolution Zeichen auch unterdrücken. So sind bei Insekten mit Tarntracht Färbung, Form und Bewegungsweise so verändert, daß sie von Freßfeinden nicht ohne weiteres zu entdecken sind.
527
24. Zoosemiose
3.4. Intentionalität Es ist nicht anzunehmen, daß der in § 3.1. beschriebenen Täuschung größerer Fische durch Aspidontus eine Intention zugrunde liegt. Wir können vielmehr davon ausgehen, daß eine derartige Semiose, ebenso wie das wespenähnliche Aussehen unserer Schwebfliege, sich im Verlauf der Evolution herausgebildet hat, weil sie sich als vorteilhaft erwies. Entsprechendes gilt für durch Lernen am Erfolg geformte Zeichen. Diese Deutung folgt dem Prinzip der sparsamsten Erklärung (Morgan 1898, 53), das half, unbegründete Ansichten über die Fähigkeiten von Tieren zu überwinden. Ihm gemäß haben es Psychologen wie Ethologen lange Zeit streng vermieden, Vorstellungen oder Absichten zur Erklärung tierischen Verhaltens heranzuziehen. Dies war als Forschungsstrategie sinnvoll, heißt aber nicht, daß der Tierkommunikation in keinem Falle Intentionalität zugrunde liegt. Hinweise auf sie ergeben sich dort, wo ein Individuum ein spezialisiertes Signal im falschen Zusammenhang zur Täuschung anderer einsetzt, wie das Eisfuchsweibchen, das sich mit Hilfe eines Warnrufs ein Beutestück sicherte (s. § 2.), oder wie eine Grüne Meerkatze (eine Primatenart), die einen Kampf zwischen ihrer eigenen und einer überlegenen Gruppe durch einen ohne speziellen Anlaß ausgestoßenen Luftfeindalarmruf beendete. Kritiker tun solche Beobachtungen als nicht nachprüfbares, möglicherweise zufälliges Zusammentreffen von Ereignissen ab, oder sie führen den Vorgang, falls er wiederholt zu beobachten ist, auf Lernen am Erfolg zufällig zusammengetroffener Ereignisse zurück. Bei der intensiven Feldforschung an Primaten wurden immer wieder solche Fälle beobachtet, so daß Zweifel daran aufkommen, ob die sparsamste Erklärung von Verhalten immer die richtige ist (Kummer 1982). Neuerdings sucht man diese Beobachtungen systematisch zu sammeln und zu bewerten (Whiten/Byrne 1988) oder aber experimentell zu analysieren. Im Fall der Grünen Meerkatzen ergab eine sorgfältige Studie, daß diese einerseits auf den Anblick von Pythonschlange, Kampfadler und Leopard mit verschiedenen Warnrufen ansprechen und andererseits beim Hören jedes dieser Rufe in angepaßter Weise reagieren. Dies stimmt mit der Hypothese überein, daß sie mit den Rufen eine Vorstellung von den verschiedenen Gefahren verbinden (Seyfarth/Cheney/Marler 1980). Eine behavioristische Betrachtungsweise wird gegen diese Deutung immer Einwände finden, etwa den,
daß die drei Rufe einfach verschiedene Erregungsgrade ausdrücken könnten (vgl. McFarland 1985, 501). Dies zeigt, wie schwierig das Bemühen der Kognitiven Ethologie (Griffin 1985) ist, überzeugende Nachweise für Vorstellungen und Intentionen bei Tieren zu führen. Dennett (1983) schlägt vor, die Kontroverse zu lösen, indem man erstens die behavioristische und die intentionale Deutung als einander nicht ausschließende Betrachtungsweisen ansieht, zweitens verschiedene Stufen von Intentionen unterscheidet und drittens systematisch untersucht, ob sich Tiere in entsprechenden Situationen so verhalten, wie es beim Vorliegen einer Intention zu erwarten ist. Führt dieser Ansatz zum Erfolg, so wird man die Frage, ob und bei welchen Tiergruppen Kommunikation i. e. S. vorkommt, in Zukunft überzeugend beantworten können.
4.
Kanäle
Die vollständige Analyse eines Zeichen übermittelnden Kanals umfaßt die Vorgänge, die zur Erzeugung der Zeichen beim Sender führen, das Übertragungsmedium, die Zeichen selbst sowie ihre Aufnahme und Verarbeitung beim Empfänger. Die vergleichende Sinnesphysiologie hat die Leistungen einer ganzen Reihe verschiedener Kanäle aufgezeigt und bis in die jüngste Zeit neue entdeckt, z. B. die Kommunikation mit Substrat-Infraschall bei Kleinzikaden. Hier kann nur kurz auf einige allgemeine Eigenschaften der drei wichtigsten Kanäle eingegangen werden. 4.1. Der optische Kanal Der optische Kanal (vgl. Art. 6) kann hochkomplexe Zeichen mit hoher zeitlicher Auflösung übertragen, wie etwa die rasch aufeinanderfolgenden Körperhaltungen und -bewegungen bei den Balztänzen von Rauhfußhühnern. Seine Benutzung setzt (außer bei Tieren mit Leuchtsignalen) ausreichende Beleuchtung, ein freies Blickfeld und die Orientierung des Empfängers zum Sender hin voraus. Im Wasser erfordert die im Vergleich zur Luft höhere Lichtstreuung und -absorption kontrastreiche Signale und in größerer Tiefe zusätzlich eine Verschiebung der Empfindlichkeitsmaxima der Photopigmente zum kurzwelligen Ende des Spektrums hin. 4.2. Der akustische Kanal Der akustische Kanal (vgl. Art. 7) erlaubt die Übertragung komplexer, zeitlich rasch veränderlicher Zeichen. Er kann im Gegensatz
528 zum optischen auch bei Dunkelheit, in unübersichtlichem Gelände und unabhängig von der Blickrichtung des Empfängers benutzt werden. Da die Schallausbreitung durch Temperatur- und Luftfeuchtegradienten, durch Luftturbulenzen und Vegetation erheblich gestört werden kann, ist entweder eine Abstimmung der Signale in Bezug auf Frequenzgehalt und zeitliche Gliederung auf das Übertragungsmedium erforderlich (Gesänge mit vorwiegend reinen, langgezogenen Tönen bei Waldvögeln und mit mehr geräuschhaften, zeitlich variablen bei Arten der offenen Landschaft) oder eine Anpassung des Sendeorts (beim Heupferd von erhöhter Warte, bei der Maulwurfsgrille aus einer Resonanzhöhle) oder der Sendezeit (Vogelchor am frühen Morgen, wenn erhöhte Luftfeuchte und fehlende Turbulenzen unverzerrte Schallausbreitung begünstigen). Getrennte Sendezeiten können zudem eine wechselseitige Störung der Zeichen verschiedener Sender vermeiden. Stärker als beim optischen Kanal unterscheiden sich beim akustischen die empfangenden Sinnesorgane in Bezug auf ihre prinzipiellen Eigenschaften (Schallschnelle-, Schalldruckempfänger), was entsprechend angepaßte Zeichen erfordert. 4.3. Der chemische Kanal Der chemische Kanal (vgl. Art. 9) ist das ursprünglichste Kommunikationsmedium. Er wird schon von Einzellern genutzt. Ihre Zeichen entsprechen zum Teil den Stoffen, die bei vielzelligen Tieren als Hormone die Tätigkeit von Zellen und Organen koordinieren und als sogenannte „second messengers“ die Vorgänge im Zellinneren steuern. Bei vielzelligen Tieren können chemische Signale, weil sie unabhängig von der Anwesenheit des Senders wirken, zum Markieren sehr großer Territorien und zum Spurlegen eingesetzt werden. Wenig flüchtige Substanzen ergeben dauerhafte Zeichen, die nur im Nahbereich wirken; leicht flüchtige überbrücken, sofern sie durch Luftbewegungen getragen werden, wie z. B. die Sexuallockstoffe von Nachtschmetterlingen, auch größere Entfernungen. Die Zeichen können, wie beim Lockstoff des Seidenspinners, aus nur einer Substanz bestehen, oder aber aus einem Gemisch verschiedener Stoffe, dessen Informationsgehalt zum einen durch die Natur der beteiligten Komponenten und zum anderen durch deren Konzentration bestimmt werden kann. Interspezifisch werden chemische Signale, z. B. von vielen Insekten, zur Abwehr eingesetzt.
III. Arten der Semiose
Intraspezifisch dienen sie, z. B. oft bei Säugetieren, der Identifikation (Duftmarken von Krallenäffchen kodieren Art- und Unterartzugehörigkeit, Geschlecht und Fortpflanzungsstatus) oder, wie bei Ameisen und Termiten, der Rekrutierung und Alarmierung von Genossen. 4.4. Mehrkanalige Tierkommunikation Die Untersuchung einzelner Kanäle führt zur Einsicht in die Details des Kommunikationsgeschehens. Dieses ist jedoch nur selten auf einen Kanal beschränkt (vgl. Art. 12 und Art. 13). So schließt schon ein einfacher Vorgang wie das Erkennen des eigenen Lammes beim Schaf akustische, optische und olfaktorische Zeichen ein.
5.
Kodes
Die Methoden der Informationstheorie eignen sich dann zur Beschreibung von Tierkommunikation, wenn die auftretenden Zeichen und Reaktionen bekannt sind und sich in einer zweidimensionalen Häufigkeitsverteilung aufeinander beziehen lassen (vgl. Art. 16). So kann man z. B. abschätzen, daß beim Schwänzeltanz der Honigbiene etwa 2 bit an Richtungs- und 3 bit an Entfernungsinformation übermittelt werden. Diese Methoden sind jedoch nicht generell einsetzbar, weil man eine Reaktion oft nicht einem bestimmten Zeichen zuordnen kann, z. B. dann, wenn ein ständig sichtbares Statussymbol das gesamte Verhalten eines Partners beeinflußt oder wenn Zeichen, wie z. B. bei der Balz, beim Rezipienten zu langfristig wirksamen physiologischen Veränderungen führen. Alle folgenden Aussagen beziehen sich deshalb auf semantische Information und nicht auf die der Informationstheorie (vgl. Art. 125). Insgesamt gibt es bei Tieren unübersehbar viele verschiedene Signalbewegungen und Laute, bei den einzelnen Arten jedoch nur relativ wenige: nach Moynihan (1970) bei Vögeln und Säugetieren etwa 15 bis 40 pro Art. Zusätzliche Information ergibt sich aus dem Kontext eines Zeichens (z. B. aus dem Aufenthaltsort und der Orientierung des Senders), aus möglichen Abwandlungen, aus Details seiner Struktur und manchmal aus der Kombination mit anderen Zeichen. Nur wenige enthalten eine spezielle Botschaft. Zu ihnen gehören Warnrufe, bei denen auf Kontextinformation aus Zeitgründen oder zur Vermeidung von Übertragungsfehlern ver-
24. Zoosemiose
zichtet wird, und Zeichen von Tieren, die nur in bestimmten Situationen Kontakt zu Artgenossen aufnehmen, wie die Paarungsrufe von Amphibien. Die Art der übermittelten Informationen läßt sich einer geringen Anzahl von Kategorien zuordnen (Smith 1969 nennt 12), doch enthält das einzelne Signal immer Informationen aus mehreren Kategorien. So gibt das Röhren des Rothirschs Auskunft über Art, Geschlecht, Fortpflanzungsstatus und Kampfstärke des Senders. Nach Smith (1969) muß man im Sinne Jakob von Uexkülls die vom Sender ausgehende Botschaft eines Signals (message) von seiner Bedeutung (meaning) für den jeweiligen Empfänger unterscheiden. So hat der Gesang eines Amselmännchens je nach Art und Geschlecht des Empfängers ganz verschiedene Bedeutungen (Abb. 24.7). Aus der Funktion eines Zeichens ergeben sich gewisse Regeln für seine Struktur. Ein Lockruf z. B. sollte leicht lokalisierbar sein. Weiter sollten nach spieltheoretischen Überlegungen Drohsignale, die vor Beginn eines
529 Kampfes ausgetauscht werden, unverfälschbare Information über die Stärke der Kontrahenten enthalten und so aussichtslose Ernstkämpfe vermeiden helfen. Dementsprechend sind Drohlaute oft tiefe, rauh klingende Töne, die (aufgrund der Dimensionen der lauterzeugenden Organe) nur große Individuen hervorbringen können. Solche Betrachtungen und entsprechende Befunde gestatten allgemeine Aussagen über Eigenschaften von Signalen, die daraus abgeleiteten Regeln bilden jedoch, ebenso wie solche, die sich aus den Eigenschaften der Übertragungskanäle ergeben, nur einen Rahmen, innerhalb dessen die natürliche Selektion aufgrund der Struktur- und Verhaltenseigenschaften des jeweiligen Senders und der Reaktionsweisen des Empfängers die Vielfalt der tatsächlich vorhandenen Zeichen geformt hat (Guilford und Dawkins 1991). Bei genauer Kenntnis einer Tiergruppe kann man versuchen, ihre Zeichen den in der Semiotik gebräuchlichen Typen zuzuordnen. In seiner entsprechenden Studie an Spinnen kommt Schult (1986) zu dem Ergebnis, daß
Abb. 24.7: Message und meaning: Die Bedeutung der Botschaft „hier singt ein Amselmännchen“ hängt davon ab, ob der Empfänger ein anderes Männchen, ein Weibchen oder ein Freßfeind ist oder gar einer ganz anderen Art angehört.
530
III. Arten der Semiose
bei diesen von den Zeichenarten Sebeoks (1979) Signale, Ikone, Indizes, Symbole und Namen vorkommen. Dies deutet darauf hin, daß man das Auftreten einer bestimmten Zeichenart, etwa von Symbolen, wohl kaum einer bestimmten Entwicklungsstufe des Tierreichs zuordnen kann, z. B. nur den Primaten oder gar nur dem Menschen.
6.
Zeichengebrauch von Tier und Mensch im Vergleich
Die Kommunikation höherer Tiere ist, wie im vorigen Abschnitt beschrieben, dadurch gekennzeichnet, daß sich die übermittelte Information oft mehr aus der Struktur, aus Detailvarianten und dem Kontext des einzelnen Zeichens ergibt, als aus der Abfolge verschiedener Zeichen, wie dies beim genetischen Kode und bei menschlicher Kommunikation durch Sprache und Schrift der Fall ist. Tierkommunikation hat demnach strukturelle Ähnlichkeit mit der nichtsprachlichen Kommunikation beim Menschen, die sich auffällig in Gesten, Gebärden und Rufen äußert und in ihren feineren Ausprägungen jedes gesprochene Wort begleitet (vgl. Art. 13). Diese Zeichen bestimmen, dem Sprecher und Hörer meist unbewußt, die übermittelte Information wesentlich mit: Die Erfahrung zeigt, daß man einen Lügner durchschauen kann. Einige dieser Zeichen, wie etwa das Lächeln oder der Augengruß, sind als Erbkoordinationen im Sinne der Ethologie anzusprechen. Wenn andere auch kulturell geformt sind, so können wir doch die ganze nichtsprachliche Kommunikation beim Menschen als weiterentwickeltes Erbe seiner tierischen Vorfahren ansehen. Dementsprechend rechnet Sebeok (1979) sie zur Zoosemiotik. Läßt sich die Wortsprache ebenfalls aus dem tierischen Erbe des Menschen ableiten? Die auf Descartes zurückgehende Vorstellung, daß nur der Mensch sprachbegabt und zum Denken fähig ist, während Tiere sich wie Maschinen verhalten, muß heute als Vorurteil angesehen werden, weil sie nicht auf der Kenntnis der Fähigkeiten und Leistungen der Tiere aufbaut. Um einen sachlichen Vergleich zu ermöglichen, hat Hockett versucht, die wesentlichen Eigenschaften menschlicher Sprache zu bestimmen. Er kam zu einer Liste von 16 Merkmalen (Hockett/Altmann 1968). Thorpe (1972) überprüfte daraufhin eine Reihe tierischer Kommunikationssysteme und fand, daß sie in wechselnden Kombinationen einen erheblichen Teil dieser Eigenschaften aufweisen. Nach seiner Liste fehlen
z. B. bei der akustischen Kommunikation des indischen Beos nur drei, nämlich die Fähigkeiten, sich auf zeitlich entfernte Dinge zu beziehen, Lügen oder Unsinn zu übermitteln und über das Kommunikationssystem zu kommunizieren (displacement in time, prevarication und reflectiveness). Einschränkend ist festzustellen, daß abgesehen von graduellen Unterschieden der formale Nachweis eines Merkmals nicht bedeutet, daß zwei Kommunikationssysteme in dieser Hinsicht vollkommen übereinstimmen. So können Vogelgesänge durch Tradition weitergegeben werden, wobei der Lernvorgang eine Reihe von Parallelen zum Sprachlernen bei Kindern aufweist, jedoch anders als dieses zu einer Einengung des individuellen Lautrepertoires führt. Nach diesen Vergleichen kommen die einzelnen Bestimmungsmerkmale menschlicher Sprache auch bei Kommunikationssystemen von Tieren vor, wenn auch nirgends alle gleichzeitig und in derselben Ausprägung wie beim Menschen. Dennoch rechtfertigen es Thorpes Vergleiche, hochentwickelte tierische Kommunikationssysteme als Sprachen eigener Art zu bezeichnen und die betreffenden Tiere, weil ihre Leistungen nicht unmittelbare Vorstufen menschlicher Sprache sind, als ebenso einzigartig anzusehen wie den Menschen selbst. Dies verpflichtet uns, den eingeschlagenen Weg der Vernichtung von Tierarten durch Umweltzerstörung zu verlassen und Anstrengungen zu ihrer Erhaltung zu unternehmen. Auch das Lautsystem der dem Menschen nächstverwandten Tiere, der Menschenaffen, ist nicht als Vorstufe der Wortsprache anzusehen. Der Schimpanse verfügt über 15 verschiedene Laute, die nicht Wörtern, sondern Tierlauten entsprechen. (Das heißt nicht, daß Primatenlaute allein affektiver und nicht auch symbolischer Kommunikation dienen können; Marler 1985.) Versuche, junge Schimpansen sprechen zu lehren, schlugen fehl. Sie lernten maximal vier Wörter (mama, papa, up, cup). Ein Grund für diese schwache Leistung könnte sein, daß ihr Stimmapparat zu einfach gebaut ist. Da sie Gesten spontan nachahmen, versuchten Gardner/Gardner (1969) es mit Taubstummensprache. Ihre erste Schimpansin, Washoe, lernte in zweieinhalb Jahren 130 Zeichen und benutzte in einigen Fällen Kombinationen für ihr unbekannte Objekte (z. B. Wasser ⫹ Vogel für einen Schwan). Dieser Erfolg regte weitere Versuche an, in denen z. T. andere Menschenaffenarten und andere Methoden (Benutzung
24. Zoosemiose
von Plastiksymbolen anstelle von Gesten u. a.) eingesetzt wurden. Die Resultate dieser Forschungen wurden zunächst mit großem Enthusiasmus aufgenommen, später jedoch von einigen Autoren unter dem Hinweis, eine unbeabsichtigte Beeinflussung der Versuchstiere durch die Versuchsleiter sei nicht ausgeschlossen, ebenso heftig abgelehnt. Eine kritische Bewertung kommt zu dem Schluß, daß die Schimpansen Zeichen für Gegenstände und teilweise auch für abstrakte Begriffe anwenden lernten, daß sie aber die Zeichen nicht im Sinne grammatikalischer Strukturen kombinierten, während Kinder dies beim Spracherwerb schon früh tun (Ristau/Robbins 1982). Obwohl demnach diese Versuche ungeahnte Fähigkeiten von Menschenaffen nachwiesen, bleibt die Feststellung, daß die Wortsprache, für die grammatische Strukturen wesentlich sind, ein dem Menschen eigenes Merkmal ist (vgl. Art. 25).
7.
Literatur (in Auswahl)
Burkhardt, D., W. Schleidt und H. Altner (1966), Signale in der Tierwelt. München. Dawkins, R. und J. R. Krebs (1978), „Animal Signals: Information or Manipulation?“ In: J. R. Krebs und N. B. Davies (eds.), Behavioral Ecology. Oxford: 282⫺309. Dennett, D. C. (1983), „Intentional Systems in Cognitive Ethology: the ‘Panglossian Paradigm’ Defended“. Behavioral and Brain Sciences 6: 343⫺390. Gardner, R. A. und B. T. Gardner (1969), „Teaching Sign Language to a Chimpanzee“. Science 165: 664⫺672. Gould, J. L. und C. C. Gould (1981), „Language“. In: D. McFarland (ed.), The Oxford Companion to Animal Behavior. Oxford: 332⫺336. Green, S. und P. Marler (1979), „The Analysis of Animal Communication“. In: P. Marler und J. G. Vandenbergh (eds.), Handbook of Behavioral Neurobiology, vol. 3. New York: 73⫺158. Griffin, D. R. (1984), Animal Thinking. Cambridge, MA. Deutsch: Wie Tiere denken. München 1985. Guilford, T. und M. S. Dawkins (1991), „Receiver Psychology and the Evolution of Animal Signals“. Animal Behavior 42: 1⫺14. Halliday, T. R. und P. J. B. Slater (eds.) (1983), Animal Behavior, vol. 2: Communication. Oxford. Hockett, C. F. und S. A. Altmann (1968), „A Note on Design Features“. In: T. A. Sebeok (ed.), Animal Communication. Bloomington: 61⫺72. Kugler, H. (1970), Blütenökologie. 2. Auflage, Stuttgart. Kummer, H. (1982), „Social Knowledge in FreeRanging Primates“. In: D. R. Griffin, Animal Mind ⫺ Human Mind. Berlin: 113⫺130.
531 Markl, H. (1985), „Manipulation, Modulation, Information, Cognition: Some of the Riddles of Communication“. Fortschritte der Zoologie 31: 163⫺194. Marler, P. (1985), „Representational Vocal Signs of Primates“. Fortschritte der Zoologie 31: 211⫺221. McFarland, D. (1985), Animal Behavior. Harlow. Morgan, C. L. (1898), An Introduction to Comparative Psychology. London. Moynihan, M. H. (1970), „Control, Suppression, Decay, Disappearance and Replacement of Displays“. Journal of Theoretical Biology 29: 85⫺112. Pijl, L. van der (1969), Principles of Dispersal in Higher Plants. Berlin. Ristau, C. A. und D. Robbins (1982), „Language in the Great Apes: a Critical Review“. Advances in the Study of Behavior 12: 142⫺225. Rüppell, G. (1969), „Eine ‘Lüge’ als gerichtete Mitteilung bei einem Eisfuchs (Alopex lagopus L.)“. Zeitschrift für Tierpsychologie 26: 371⫺374. Scapini, F., A. Ercolini und R. Boccacci (1988), „Laboratory Experiments on Geotaxis, Phototaxis, and Anemotaxis in Two Species of Littoral Amphipods“. Monitore zoologico italiano 22: 89⫺103. Schult, J. (1986), „Zeichenvermitteltes Verhalten von Spinnen“. Zeitschrift für Semiotik 8: 253⫺276. Sebeok, T. A. (ed.) (1977), How Animals Communicate. Bloomington. Sebeok, T. A. (1979), Theorie und Geschichte der Semiotik. Reinbek. Seyfarth, R. M., D. L. Cheney und P. Marler (1980), „Monkey Responses to Three Different Alarm Calls: Evidence for Predator Classification and Semantic Communication“. Science 210: 801⫺803. Slater, P. J. B. (1983), „The Study of Communication“. In: Halliday und Slater 1983: 9⫺42. Smith, W. J. (1969), „Messages of Vertebrate Communication“. Science 165: 145⫺150. Tembrock, G. (1971), Biokommunikation. 2 Bde. Berlin, Oxford und Braunschweig. Thorpe, W. H. (1972), „The Comparison of Vocal Communication in Animals and Man“. In: R. A. Hinde (ed.), Non-Verbal Communication. Cambridge, England: 27⫺47. Wickler, W. (1968), Mimikry. München. Wilson, E. O. (1975), Sociobiology. Cambridge MA: 176⫺241. Whiten, A. und R. W. Byrne (1988), „Tactical Deception in Primates“. Behavioral and Brain Sciences 11: 233⫺273. Zuk, M. (1992), „The Role of Parasites in Sexual Selection: Current Evidence and Future Directions“. Advances in the Study of Behavior 21: 39⫺68.
Werner Schuler, Göttingen (Deutschland)
532
III. Arten der Semiose
25. Anthroposemiose 1. Einleitung 2. Biologische Grundlagen 2.1. Leben als Informationsprozeß 2.2. Semiosen als artspezifische Zeichenprozesse 2.3. Sprache bei Tieren? 2.4. Biologische Voraussetzungen menschlicher Zeichenprozesse 3. Der soziokulturelle Kontext 3.1. Organische und soziokulturelle Evolution 3.2. Soziokulturelle Rahmenbedingungen der Anthroposemiose 3.3. Eigenarten und Gesetzlichkeiten in der Entwicklung von Anthroposemiosen 4. Die Notwendigkeit interdisziplinärer Ansätze 5. Literatur (in Auswahl)
1.
Einleitung
Eine Untersuchung der vom Menschen entwickelten und verwendeten Zeichen muß sich auf zwei Ebenen beziehen: die biologische (vgl. Art. 6⫺13) und die soziokulturelle Ebene (vgl. Art. 14⫺15). Als biologische Spezies ist der Mensch ein Resultat der organischen Evolution, sein Kommunikationsvermögen ist von biologischen Faktoren entscheidend geprägt; die Entwicklung komplexer Sozietäten und Kulturen definiert aber neue, über die organische Evolution hinausgehende Bedingungen für Zeichenprozesse. Insbesondere sind die menschlichen Semiosen durch die Möglichkeit gekennzeichnet, Information auf exosomatischen, außerkörperlichen Trägern zu speichern und über diese Träger weiterzugeben, womit eine neue Dimension von Zeichenprozessen gegeben ist (vgl. Art. 33 § 1.). Im Kontinuum der Evolution informationsverarbeitender Mechanismen stellt diese Form der Informationsspeicherung und -weitergabe das höchste Niveau dar und hebt die Semiosen auf eine abstrakte Ebene, die mit den bei anderen Spezies beobachtbaren Zeichenprozessen ⫺ Phytosemiosen, Zoosemiosen (vgl. Art. 23 und 24) ⫺ bei weitem nicht erreicht ist. Mit einem berühmt gewordenen Satz, „Schon als Tier hat der Mensch Sprache“, kennzeichnete bereits Herder die enge Verbindung eines spezifisch menschlichen Merkmals mit vormenschlichen Organisationsstufen des Lebendigen (vgl. Art. 65 und 77). Tatsächlich können die Voraussetzungen menschlicher Zeichenprozesse nur durch Rückbezug auf die Evolution der Semiosen
in der Organismenwelt im allgemeinen ergründet werden. Informationsgewinn und Informationsweitergabe sind generelle Kennzeichen des Lebenden, das Leben kann als ein Informationsvorgang, als ein Erkenntnisprozeß im weitesten Sinne (Lorenz 1973) beschrieben werden (vgl. § 2.1.). Anthroposemiosen sind damit Gegenstand einer umfassenden Theorie der organischen Evolution. Denn auch die spezifische, durch die Sprache ⫺ als artikulierte Lautsprache mit grammatischen bzw. syntaktischen Regeln ⫺ dem Menschen gegebene Kommunikationsform ist hinsichtlich ihrer Voraussetzungen biologischer Natur: Sie ist als Funktion eines biologischen Organs, des Gehirns, zu begreifen, als Folge der Differenzierung bestimmter Regionen der Großhirnrinde (Oeser und Seitelberger 1988). Ist die Sprache aber auf der einen Seite die Grundlage für die Stabilisierung menschlicher Sozietäten und die Entwicklung von Kulturen, so sind es auf der anderen Seite eben die soziokulturellen Systeme, die nicht nur eine weitere Differenzierung der sprachlichen Kommunikation ermöglicht, sondern auch neue Typen der Anthroposemiose (z. B. Schrift) hervorgebracht haben. Daher muß das Studium menschlicher Zeichenprozesse auch der soziokulturellen Evolution Rechnung tragen: Die organische Evolution liefert zwar die notwendigen, aber nicht hinreichenden Bedingungen für die Anthroposemiosen mit ihren typischen und vielfältigen Ausprägungen. Da sich somit Anthroposemiosen durch ein Gefüge biologischer und soziokultureller Faktoren darstellen, erfordert ihre Beschreibung und Erklärung einen interdisziplinären Ansatz, der sich auf Ergebnisse und Konzepte der Biowissenschaften (Ethologie, Physiologie, Evolutionsbiologie) ebenso bezieht wie auf relevante Studien der Kulturanthropologie, Ethnologie, Soziologie und Linguistik. Der vorliegende Beitrag konzentriert sich demgemäß auf folgende Probleme: ⫺ Biologische Anfangs- und Rahmenbedingungen der Anthroposemiose („Vorgaben“ durch die organische Evolution); ⫺ soziokulturelle Bedingungen menschlicher Zeichenprozesse; ⫺ Eigenarten und Gesetzlichkeiten in der Entwicklung der Anthroposemiosen.
25. Anthroposemiose
2.
Biologische Grundlagen
2.1. Leben als Informationsprozeß Organismen sind informationsgewinnende und -verarbeitende Systeme. Jeder Organismus ist zunächst zu charakterisieren als Träger der seiner Art eigenen genetischen Information, die er durch den Prozeß der Fortpflanzung auf seine Nachkommen weitergibt; die individuelle Entwicklung eines Organismus (Ontogenese) bedeutet die Dekodierung eines genetischen Programms, das die jeweilige Art kennzeichnet. Die Evolution der Organismen führt zur Entstehung und Abwandlung genetischer Informationsprogramme (vgl. z. B. Wuketits 1989). Organismen nehmen aber auch fortgesetzt Information aus ihrer Umwelt auf, verarbeiten diese Information in Nervensystemen (oder diesen analog funktionierenden Systemen) und setzen darauf adäquate, d. h. lebensdienliche Reaktionen. Lebewesen müssen sich, um überleben zu können, in ihrer jeweiligen Umwelt orientieren, sie müssen überlebensrelevante Information verarbeiten, zum Beispiel die Beute vom Feind, den Geschlechtspartner vom Geschlechtsgenossen unterscheiden, Temperaturschwankungen wahrnehmen können usw. Daher kann die organische Evolution sowie das Leben jedes einzelnen Organismus als ein Informationsprozeß, als ein Kognitionsbzw. „Erkenntnis“-Vorgang beschrieben werden (vgl. z. B. Lorenz 1973; Plotkin 1982; Riedl 1980; Wuketits 1986; 1990). In diesem Vorgang spielen Semiosen eine hervorragende Rolle. Indem ein Organismus bestimmte Objekte oder Vorgänge in seiner Umwelt wahrnimmt und darauf reagiert, „versteht“ er sozusagen Zeichen. Doch zugleich kann sein Verhalten als das Aussenden von Zeichen betrachtet werden, was sich beispielsweise in Drohgebärden, im Ausdruck sexueller Bereitschaft usw. manifestiert. Die Veränderung der Körperhaltung oder der Färbung bestimmter Organe kann schon als Zeichenprozeß verstanden werden, in dem ein Lebewesen einem anderen seinen momentanen Zustand mitteilt. So ändern verschie-
Abb. 25.1
533 dene Fische, z. B. der über dem Korallenriff schwimmende Nashornfisch, ihre Farbe beim Balzverhalten. Ein um ein Weibchen werbendes Nashornfisch-Männchen verändert in Sekundenschnelle seine üblicherweise unauffällig düstere Färbung, indem es blaue Lippen, einen hellblauen Fleck am Rücken und ebensolche Querstreifen an den Seiten sowie eine blaue Schwanzflosse bekommt (vgl. Eibl-Eibesfeldt 1978). Dieser vorübergehende Farbwechsel signalisiert dem Weibchen die Paarungsbereitschaft und steht somit im Dienste der Arterhaltung. Schon daraus mag hervorgehen, daß die Gleichsetzung der Semiotik mit Anthroposemiotik nicht gerechtfertigt ist, da überall in der belebten Natur Zeichen, Signale ausgesendet und empfangen werden; Organismen gewinnen und verarbeiten Information und geben Information an andere Organismen weiter, woran vielfältige Zeichenprozesse beteiligt sind (vgl. Art. 18⫺24). Die Anthroposemiotik erweist sich mithin als das Studium der speziellen Zeichenprozesse, die eine bestimmte Spezies, Homo sapiens, entwickelt hat und die im Kontinuum der Evolution der Semiosen lediglich eine bestimmte, wenn auch sehr komplexe, Entwicklungsstufe darstellen. Die Gesamtheit der Semiosen in der Organismenwelt kann daher grob in folgende Kategorien mit steigender Komplexität (im Schema von Abb. 25.1 durch waagrechte Pfeile angedeutet) unterteilt werden. Die Anthroposemiotik ist dann als Teilgebiet der Semiotik zu betrachten, die u. a. auch die Phyto- und Zoosemiotik umfaßt. Wird also Leben als Informationsvorgang, ein Organismus als informationsverarbeitendes System begriffen, dann kann, da dieser Vorgang der Informationsverarbeitung mit Zeichenprozessen eng verknüpft ist, Leben auch als Zeichenvorgang, ein Lebewesen als „zeichenverarbeitendes“ System verstanden werden (vgl. Art. 18 § 3.). Dabei sind aber die folgenden zwei Ebenen der Information und Informationsweitergabe voneinander zu unterscheiden, wonach auch zwischen zwei Arten von Zeichen und Zeichenprozessen unterschieden werden muß (vgl. Oeser 1987):
534 (a) Auf der genetischen Ebene wird Information, als genetische Information, in der DNS (vgl. Art. 21 § 3.2.) gespeichert und durch die Vererbung von einer Generation auf die andere übertragen. Dieser Vorgang beruht bereits auf Signalen und hat insofern Signalcharakter, als (genetische) Information im sich entwickelnden Organismus dekodiert wird und gleichsam als „Bauanleitung“ vom sich entwickelnden Organismus „verstanden“ werden muß. (b) Auf der neuronalen Ebene wird Information, die der Organismus von seiner Umgebung aufnimmt, in einem Nervensystem gespeichert, das zugleich entsprechende Reaktionen auf bestimmte Umweltsituationen ermöglicht. Auf dieser Ebene tritt die Fähigkeit individuellen Lernens in Erscheinung. Die dabei beobachtbaren Zeichenprozesse sind bereits recht vielfältig, entsprechend der Komplexität des Organismus und seiner Umwelt. Erst beim Menschen aber begegnen wir der Fähigkeit, Information, als intellektuelle Information, auf außerkörperlichen Trägern zu speichern und durch diese Träger weiterzugeben. Die Semiosen heben sich damit sowohl von den genetisch kodierten als auch von den in neurodynamischen Systemen gespeicherten Zeichen ab. Somit erscheinen die Anthroposemiosen als die kompliziertesten Semiosen in der Organismenwelt und stellen in der Hierarchie semiotischer Prozesse die höchste Entwicklungsstufe dar (vgl. Art. 21 § 9. und § 10.). Selbstredend ist der Mensch aber, ebenso wie alle anderen Organismen, auch an die genetische und die neuronale Informationsspeicherung und -weitergabe gebunden: Diese bilden die notwendigen Voraussetzungen für die Entstehung intellektueller Information (vgl. § 2.4.). 2.2. Semiosen als artspezifische Zeichenprozesse Die Arten der Lebewesen können als Fortpflanzungsgemeinschaften definiert werden, als Gruppen von Individuen bzw. Populationen, die eine reproduktive Einheit darstellen (vgl. Mayr 1979). Semiosen sind artspezifische Zeichenprozesse, d. h. jedes Individuum verfügt über die im Rahmen seiner Art gegebenen ⫺ in der Evolution entwickelten ⫺ Möglichkeiten, Zeichen zu produzieren und zu empfangen. Da jede Art durch ein spezifisches genetisches Informationsprogramm gekennzeichnet ist, ist es auch verständlich, daß bereits im genetischen Bereich die Rahmenbedingungen für Zeichenprozesse
III. Arten der Semiose
definiert sind: Aufgrund der genetischen Bauanleitungen bringt ein Organismus immer nur seinesgleichen hervor, im Prozeß der sexuellen Fortpflanzung wird stets artgleiche Information ausgetauscht. Nur in langen Zeiträumen kommt es zu einer Abwandlung genetischer Informationsprogramme, d. h. zu einer Abänderung der Arten (Evolution). Auf der Verhaltensebene bedeutet das, daß die Signale, die ein bestimmtes Individuum aussendet, um seine Paarungsbereitschaft zu demonstrieren, nur vom jeweiligen Artgenossen verstanden werden können. Ein balzender Auerhahn beispielsweise wird nur von einem Weibchen seiner Art richtig verstanden, umgekehrt gilt sein Balzverhalten auch nur einem arteigenen ⫺ und nicht artfremden ⫺ Weibchen. Die Paarungsbereitschaft kann im allgemeinen entweder optisch (durch eine bestimmte Körperhaltung, durch Farbänderung an Körperteilen) oder akustisch (durch den Lockruf) signalisiert werden. Analog dazu senden Individuen vieler Arten Signale aus, um ihre Artgenossen vor Angreifern zu warnen (Alarmruf), was bei unterschiedlichen Vögeln und Säugetieren beobachtet werden kann (vgl. Eibl-Eibesfeldt 1978; Hinde 1973; Immelmann 1979). Gelegentlich kann eine Informations-Übermittlung auch zwischen Angehörigen verschiedener Arten stattfinden ⫺ die Alarmrufe vieler Singvogelarten können auch Angehörige anderer Arten warnen, selbst wenn diese nicht über entsprechende Möglichkeiten der Lautäußerung verfügen (Immelmann 1979). Bedingt durch die Vorgaben im artspezifischen genetischen Informationsprogramm sind die Möglichkeiten der Zeichensetzung begrenzt. Ein Organismus ist zunächst nur in der Lage, die im genetischen Repertoire seiner Art angelegten Potentiale zu nutzen. In der Ethologie spricht man vom „angeborenen auslösenden Mechanismus (AAM)“ (Eibl-Eibesfeldt 1978; Hinde 1973; Immelmann 1979; Lorenz 1978; Tinbergen 1972), um ein Teilsystem des Zentralnervensystems zu kennzeichnen, das angeborenermaßen beim Individuum das Erkennen bestimmter Reizkonstellationen als Auslöser ermöglicht und zur Aktivierung bestimmter Verhaltensweisen ⫺ als Reaktion auf den Auslöser ⫺ führt. Ein AAM kann also als angeborene, durch das genetische Programm der Art festgelegte Fähigkeit, Signale zu erkennen und zu interpretieren, gedeutet werden. Dank der Lernfähigkeit zumal bei höheren Tieren kann aber das angeborene Potential der Signal-
25. Anthroposemiose
wahrnehmung modifiziert und erweitert werden. Demnach können Teile der individuellen Erfahrung in die Auslösung einer Reaktion eingehen („erworbener auslösender Mechanismus, EAM“). Da aber die Lernfähigkeit eines Lebewesens naturgemäß von seiner biologischen ⫺ und abermals genetisch festgelegten ⫺ Grundausstattung abhängt (Ausstattung mit spezifischen Sinnesorganen usw.), ist die Modifikation und Erweiterung angeborener Fähigkeiten nicht unbegrenzt möglich. Ein Lebewesen kann also nur im Rahmen seiner artspezifischen, genetisch fixierten Reaktionsnorm Signale erkennen und darauf reagieren. Dazu kommt, daß jeder Organismus in einer spezifischen Umwelt lebt und daß seine Spezies in genau dieser Umwelt ⫺ und nicht darüber hinaus ⫺ sich zu bewähren hatte, so daß der jeweilige kognitive Apparat nur auf bestimmte Strukturen der realen Welt Bezug zu nehmen und nur bestimmte Zeichen zu interpretieren hat. Diese im Rahmen der modernen evolutionären Erkenntnistheorie (z. B. Lorenz 1973; Oeser 1987; Riedl 1980; Riedl und Wuketits 1987; Vollmer 1985⫺86; Wuketits 1990) vertiefte Einsicht wurde bereits in den zwanzinger Jahren von Jakob v. Uexküll im Ansatz vorweggenommen (vgl. Art. 19 und Art. 23; siehe auch Art. 110). Uexküll (vgl. 1973, 150) schrieb: „Jedes Tier ist ein Subjekt, das dank seiner ihm eigentümlichen Bauart aus den allgemeinen Wirkungen der Außenwelt bestimmte Reize auswählt, auf die es in bestimmter Weise antwortet. Diese Antworten bestehen wiederum in bestimmten Wirkungen auf die Außenwelt, und diese beeinflussen ihrerseits die Reize. Dadurch entsteht ein in sich geschlossener Kreislauf, den man den ‘Funktionskreis’ des Tieres nennen kann.“ Es erscheint gerechtfertigt, hierbei von einem „semiotischen Kreis“ zu sprechen, da es sich ja wesentlich darum handelt, daß Zeichen, Signale aus der Umwelt wahrgenommen und an die Umwelt ⫺ insbesondere natürlich an andere Lebewesen ⫺ wiederum Signale ausgesendet werden. Dieser semiotische Kreis ist nun maßgeblich bestimmt von jenen Potentialen, die als angeborene Reaktionsnorm beim Individuum zutage treten, und von der Spezies, der das fragliche Individuum angehört, in langen Zeiträumen evolutiv entwickelt wurden. Jede Spezies ist also durch einen semiotischen Kreis gekennzeichnet und hebt sich damit jeweils von anderen Spezies ab; jede Spezies hat den ihr eigenen Zugang zur realen
535 Welt, es werden stets bestimmte Ausschnitte aus der jeweiligen Umgebung verrechnet, und über diese Ausschnitte vermögen sich die Angehörigen einer Art auch meist zu verständigen, d. h. sie senden Zeichen aus, die ihre Artgenossen meist auch in lebenserhaltender Weise zu interpretieren vermögen, und der Interpretation folgt daher eine adäquate Reaktion (z. B. eine Fluchtreaktion als Zeichen dafür, daß eine Drohung bzw. eine Drohgebärde richtig verstanden wurde). Semiosen haben also, ganz allgemein, lebenserhaltenden Charakter. 2.3. Sprache bei Tieren? Ist es gerechtfertigt, aus der Allgegenwart von Zeichenprozessen in der belebten Natur auf die Existenz einer Sprache (oder verschiedener Sprachen) in der Tier- oder auch gar in der Pflanzenwelt zu schließen? Oder wäre ein solcher Schluß ein bloßer Anthropomorphismus? Die vielfältigen Verständigungsformen der Tiere (auf der Basis akustischer, optischer und olfaktorischer Leistungen) haben freilich immer wieder dazu verführt, zwischen der menschlichen Sprache und der Verständigung der Tiere untereinander Analogien zu sehen. In der Tat legen Studien tierischer Verständigung solche Analogien ja auch durchaus nahe. Beispielsweise zeigen die von Lorenz (1988) eindrucksvoll geschilderten Lautäußerungen der Graugänse, daß diese Tiere an ihren Stimmen einander erkennen, daß sie über ein beträchtliches „Vokabular“ verfügen und sich je nach eigener Stimmungslage durch unterschiedliche Laute (Jammerlaut, Warnlaut, Distanzlaut usw.) zu äußern vermögen. Man mag daher geneigt sein, von der „Sprache“ der Graugänse zu reden, ebenso wie gemeinhin von einer „Bienensprache“, „Delphinsprache“, „Affensprache“ usw. gesprochen wird. Die Frage ist allerdings, ob diese, systematisch und vom Gegenstand her der Zoosemiotik (vgl. Art. 24) zuzuordnenden Phänomene, bloß Analogien zur menschlichen Sprache bleiben oder ob dabei eine tiefere Affinität zwischen tierischer und menschlicher Verständigung besteht. Tatsache ist zunächst, daß Verständigung ⫺ als das Erzeugen von Zeichen mit der Fähigkeit, zugleich auf Zeichen, ausgesendet von anderen Systemen, mit eigenen Zeichen zu reagieren ⫺ in der Organismenwelt universell ist und lebenserhaltende Bedeutung hat. Definiert man Sprache so allgemein, also als Verständigung, als Austausch von Signa-
536 len zwischen zwei oder mehreren Systemen (Sender-Empfänger-Interaktion), dann ist es sicher legitim, von der „Sprache der Tiere“ zu sprechen. Für uns Menschen liegt dabei vor allem der Vergleich akustischer Verständigung der Tiere mit unserer eigenen Sprache nahe, da diese maßgeblich durch das gesprochene Wort (und nicht durch optische oder olfaktorische Signale) bestimmt ist. Da die akustische Kommunikation in der Tierwelt häufig ist, ist die Vermutung, daß es grundlegende Regeln der Entwicklung von Lautäußerungen gibt, die auf unterschiedliche Spezies (den Menschen eingeschlossen) anwendbar sind (Marler 1970 a; b), nicht abwegig. Auf der anderen Seite muß man sich vergegenwärtigen, daß wir vielleicht gerade deshalb die akustische Verständigungsmöglichkeit überschätzen, in anthropomorpher Weise dazu neigen, „akustische Signale für die eigentlichen Verständigungsmittel zu halten, weil unsere eigenen Kommunikationsformen weitgehend darauf beruhen“ (Bonner 1983, 138). Aber das würde nichts an der grundlegenden Tatsache ändern, daß Tiere sich verständigen können, sei es akustisch, optisch oder auf welche Weise auch immer, so daß Sprache ⫺ im Sinne jener allgemeinen Definition ⫺ nicht allein der menschlichen Sphäre zukommt. Insbesondere die Primaten (also die nichtmenschlichen Primaten), die in komplexen Sozietäten leben und das soziale Lernen mit Ansätzen zum Lehren und mit beginnender Traditionsbildung bereits weit entwickelt haben, verfügen über beachtliche Fähigkeiten der Verständigung, die sich über verschiedene Ebenen (Gestik, Mimik, Vokalisation) erstreckt, was zu verschiedenen Hypothesen betreffend das Sprachenlernen und die menschenähnliche Intelligenz vor allem der Schimpansen geführt hat. Über die Kommunikation der (nichtmenschlichen) Primaten gibt es eine sehr umfangreiche Literatur, nur stellvertretend genannt seien hier Hill (1968), Linden (1976), Ploog und Melnechuk (1969), Ploog (1972) und Premack (1976). Inzwischen aber scheint der Enthusiasmus über die Affensprache verklungen. Denn was allem voran die Versuche mit Schimpansen zeigten, ist nur die Fähigkeit, komplexe Assoziationsleistungen zu vollbringen und sich durch Lernen neuen Situationen anzupassen: „Menschenaffen sind daher zwar in der Lage ⫺ auf Grund eines äußeren Drucks ⫺ bestimmte Spielregeln einzuhalten, es scheint jedoch mehr als wahrscheinlich […], daß Schimpanse und Trainer nicht das gleiche
III. Arten der Semiose
Spiel spielen. Die vermeintliche sprachliche Kompetenz bei Menschenaffen ist daher nichts anderes als serielles Lernen“ (Müller 1987, 127). Tiere verfügen also über Sprachen in dem Sinne, daß sie zu unterschiedlichen Verständigungsleistungen fähig sind und sich sowohl olfaktorischer, optischer als auch akustischer Signale bedienen, wobei diese drei Kanäle auch einander ergänzend bei einer und derselben Spezies auftreten können. Dennoch fehlen in der Tierwelt verschiedene Kriterien, die für menschliche Zeichenprozesse charakteristisch sind, die sich wesentlich über die artikulierte Lautsprache abspielen und ⫺ gegenüber den Formen nonverbaler Verständigung (vgl. Hinde 1972) und den akustischen Verständigungsformen bei verschiedenen Spezies ⫺ abgehoben sind. Diese Kriterien zu untersuchen und hinsichtlich ihrer Voraussetzungen und Konsequenzen darzustellen, ist eine grundlegende Aufgabe der Anthroposemiotik. 2.4. Biologische Voraussetzungen menschlicher Zeichenprozesse Unbeschadet der Tatsache, daß beim Menschen verschiedene, auf unterschiedliche Stufen der Wirbeltier-Evolution ausgebildete Kommunikationsformen (olfaktorische, optische und akustische Kommunikation ohne Wortbildung) ihre Rolle spielen, ist die den Menschen primär kennzeichnende Kommunikationsform die Wortsprache, d. h. die (mehr oder weniger eindeutige) Zuordnung von Begriffen zu verschiedenen Objekten und Vorgängen der beobachtbaren Wirklichkeit (Porzig 1950). Die in bzw. mit der menschlichen Sprache verwendeten Zeichen sind Laute (vgl. allerdings Art. 13 § 2.); der „lautliche Charakter“ der Sprache (Martinet 1963) ist ihr erstes, wenn auch nicht hinreichendes Kennzeichen. Ein Laut ist noch nicht unbedingt ein Wort, jedoch bestehen umgekehrt alle Worte aus Lauten und werden zu Sätzen zusammengefaßt, wobei unterschiedliche grammatische (morphologische und syntaktische) Regeln Anwendung finden. 2.4.1. Grundlegende Merkmale der menschlichen Sprache Gegenüber den (akustischen) Kommunikationsmöglichkeiten anderer Lebewesen zeichnet sich die menschliche (Wort-)Sprache durch im wesentlichen folgende Merkmale aus, die zugleich ermöglichen, sie als einmalig in der Welt der Organismen zu bestimmen:
25. Anthroposemiose
(a) Die menschliche Sprache hat Symbolcharakter. Der Symbolismus, die Entwicklung von Symbolen, die für verschiedene Objekte und Prozesse stehen, ist generell eine Neuerscheinung in der Evolution organismischen Verhaltens und ist untrennbar verknüpft mit der Anthropogenese oder „Menschwerdung“ (Bertalanffy 1968). Die Sprache des Menschen hat den entscheidenden Vorteil, daß sie die Informationsweitergabe vom Objekt befreit. „Während bei der Weitergabe von Erlerntem durch Imitation (⫽ Modelllernen) der Lernende sein Vorbild am Demonstrationsobjekt handelnd beobachten muß, macht die Symbolsprache frei vom Objekt und damit auch unabhängig von Ort und Zeit. Durch Verwendung von Wortsymbolen kann man über Dinge sprechen, ohne daß diese zugegen sind“ (Osche 1987, 511). (b) Die (Symbol-)Sprache macht es möglich, über Dinge zu sprechen, deren Existenz durch die Beobachtung nicht erwiesen ist und auch niemals bewiesen werden kann (z. B. Gott, Jenseits usw.). Das bedeutet, daß unsere Sprache weit über die Unmittelbarkeit unserer Erfahrung hinausgeht. (c) Die menschliche Sprache reicht weit hinaus über die strikt biologisch festgelegten Ausdrucksformen einer Spezies. Die große Anzahl von Worten, die jeder Sprache eigen sind, gewinnt durch die nahezu unbegrenzten Kombinationsmöglichkeiten an neuen Dimensionen der Kommunikation, die damit zugleich unzählige Nuancen in der Vermittlung von Bedeutung gestattet. Die Sprache geht also weit hinaus über die genetisch festgelegte Reaktionsnorm der Entwicklung und Wahrnehmung von Zeichen. (d) Wie keine andere Kommunikationsform bestimmt die menschliche Sprache das Verhalten ihres Trägers. Die menschliche Sprache hat nicht nur rekonstruktiven, sondern auch konstruktiven Charakter. Durch sie konstruieren wir Wirklichkeiten, erfinden mögliche Welten usw. Unser Denken kann durch die Sprache sozusagen verführt werden, schon der Name einer Sache kann, worauf u. a. Whorf (1963) hingewiesen hat, unser Verhalten beeinflussen, in bestimmte Richtungen lenken. (e) Während Kommunikation in der Organismenwelt im allgemeinen als „biologisch zweckmäßig“, im Dienste der Lebens- bzw. Arterhaltung betrachtet werden kann, hat der Mensch mit seiner Sprache ein Ausdrucksmittel gefunden, das über das biologisch un-
537 mittelbar Zweckmäßige hinausgeht. Dabei bleibt an die Dichtkunst zu erinnern, in der sich zwar ein Organismus (der Dichter) anderen Organismen (seinen Lesern oder Zuhörern) mitteilt, allerdings nicht im Dienste des Überlebens im strikt biologischen Sinne. (f) Schließlich ist die menschliche Sprache die einzige Kommunikationsform in der Welt der Organismen, die auf sich selbst bezogen werden kann ⫺ mit den Mitteln unserer Sprache können wir über die Sprache selbst sprechen. Insgesamt gilt für die menschliche Sprache, daß sie die höchste Ebene der Abstraktion erreicht hat, die in der belebten Welt bisher mit Kommunikationsformen erreicht worden ist (vgl. Art. 65, Art. 77 und Art. 149). Indem nun einzelne Laute und/oder Worte symbolhaft, durch die Schrift, dargestellt werden können, ist aber eine noch abstraktere Ebene der Zeichenprozesse ermöglicht, die den Kommunikationsvorgang vollends vom Erzeuger der Zeichen loslöst. 2.4.2. Die biologische Evolution des Menschen Dennoch kann kein Zweifel darüber bestehen, daß den solcherart ins Abstrakte gehobenen menschlichen Zeichenprozessen Vorgänge im biologischen Bereich vorausgehen, also Vorgänge der natürlichen Entwicklung, die den Menschen erst zu einem sprachfähigen Wesen im engeren Sinne gemacht haben. Die (biologische) Evolution der Hominiden (Menschenartigen) ist ein Feld, auf dem in den letzten Jahren und Jahrzehnten bahnbrechende Ergebnisse erzielt werden konnten. Trotz vieler noch unbeantworteter Fragen und offener Probleme läßt sich die Stammesgeschichte des Menschen heute doch in groben Zügen rekonstruieren (vgl. z. B. die zusammenfassende Darstellung von Vogel 1987). Auch konnten, dank verschiedener Untersuchungen aus unterschiedlichen biologischen Disziplinen (von der Anatomie bis zur Molekularbiologie), die stammesgeschichtlichen, verwandtschaftlichen Beziehungen zwischen den Hominiden und Pongiden (Menschenaffen) erhellt werden (s. Abb. 25.2). Für die organische Evolution des Menschen gelten jedenfalls die gleichen Prinzipien bzw. Mechanismen, wie für die Evolution der anderen Arten. Zwar wird über die Mechanismen oder Triebkräfte der organischen Evolution im allgemeinen lebhaft diskutiert, und es gibt verschiedene Theorien, die diese
538
Abb. 25.2: Stammesgeschichtlicher (verwandtschaftlicher) Zusammenhang zwischen dem Menschen und den Menschenaffen
Probleme zu lösen versuchen und teils miteinander konkurrieren (vgl. Wuketits 1988 a); aber diese Uneinigkeit ändert nichts am Tatbestand der Evolution selbst. Und was den Menschen betrifft, so gibt es überhaupt keinen Grund zur Vermutung, daß er eine Ausnahme darstellt. Vielmehr gilt, daß, wenn man die Evolution ernst nimmt, die Sonderstellung des Menschen in biologischer Hinsicht erschüttert ist. Denn jede Spezies ist einmalig. Daher kann man auch nicht pauschal nach dem Unterschied zwischen dem Menschen und dem Tier fragen, weil es über eine Million verschiedener Tierarten gibt, die alle voneinander unterscheidbar sind (Wuketits 1989). Sehr wohl aber können wir fragen, welche speziellen evolutiven Tendenzen in der Hominidenreihe gegeben sind und welche besonderen Merkmale die Hominiden, verglichen insbesondere mit ihren nächsten Verwandten, den Menschenaffen, entwickelt haben. Unter diesen Voraussetzungen sind allem voran drei evolutive Tendenzen bzw. Merkmale zu erwähnen: (a) Erwerb der Bipedie, des aufrechten Ganges, also der Fortbewegung auf nur zwei ⫺ den hinteren ⫺ Extremitäten. (b) Befreiung der Vorderextremitäten von der Fortbewegung und damit ihre universelle Verwendbarkeit als Instrumente der Manipulation von Objekten. (c) Vergrößerung und Differenzierung des Gehirns (Cerebralisation). Besonders wichtig war hierbei zweifelsohne die Entwicklung des Gehirns. Diese Entwicklung, die ziemlich rasant verlaufen ist, war verantwortlich für die Entwicklung des Menschen als eines Wesens mit selbstreflexivem Bewußtsein, womit sich der Mensch qualitativ von allen anderen Arten, die diesen Planeten bevölkern, unterscheidet.
III. Arten der Semiose
Der Vergleich des Gehirns des Homo sapiens mit Gehirnen anderer Säugetiere macht sogleich die Größe jenes Gehirns deutlich (Abb. 25.3), wobei wir aber zur Kenntnis nehmen müssen, daß es nicht allein auf die Größe ankommt, sondern auf den Grad der Differenzierung, auf die Ausbildung bestimmter Gehirnzentren, die dann immer komplexere Leistungen ermöglicht haben. Erben (1988, 340) schreibt: „Ganz zweifellos ist gerade die Evolution des Gehirns diejenige Tendenz, die im Verlauf einer fortlaufenden, einsinnig ausgerichteten Steigerung jenes Ausmaß erreichte, das dem heutigen Menschen im Rahmen des gesamten Organismenreichs eine unverkennbare Sonderstellung verleiht.“ Also doch eine Sonderstellung; zwar nicht, wie schon gesagt, in bezug auf die grundlegenden Mechanismen der Evolution, die für den Menschen uneingeschränkt Gültigkeit haben, jedoch insofern, als durch die Evolution des Gehirns gleichsam neue Sphären erschlossen werden, nämlich die Sphären der Kultur, worauf weiter unten zurückzukommen sein wird. Ist also die Evolution der Hominiden ganz entscheidend durch die Gehirn-Evolution zu kennzeichnen, so ist zugleich hervorzuheben, daß die Evolution zum Menschen, wie wir
Abb. 25.3: Gehirne einiger Säugetiere im Vergleich zum menschlichen Gehirn. Oben (von links): Opussum, Kaninchen, Katze. Mitte links: Makak. Mitte rechts: Schimpanse. Darunter: Mensch.
539
25. Anthroposemiose
ihn in uns selbst kennen, ein multifaktorielles Bedingungsgefüge darstellt. Abb. 25.4 ist ein stark vereinfachtes Schema dieser Wechselwirkungen, dieser vernetzten Kausalität, die die Menschwerdung verursacht hat, wobei bereits der Faktor „Sprache“ Berücksichtigung findet. Wenn man die Reihe der fossilen Hominiden Revue passieren läßt (Abb. 25.5), dann hat man einen Zeitraum von etwa 5 Millionen Jahren zu überblicken, wobei der von uns praktisch nicht mehr unterscheidbare Mensch ⫺ der nach seinem französischen Fundort benannte Cro-Magnon-Mensch ⫺ vor etwa 40 000 Jahren auftritt. Die biologischen Änderungen, die sich in der Hominiden-Evolution abgespielt haben, sind zu diesem Zeitpunkt im wesentlichen abgeschlossen. Das kann nicht heißen, daß seither die organische Evolution des Menschen stillsteht, doch ist ein Zeitraum von 40 000 Jahren zu gering, um im biologischen Bereich umwäl-
Abb. 25.4: Vereinfachtes Diagramm der wichtigsten Komponenten der Menschwerdung und ihrer wechselseitigen Beziehung.
Hominide
Zeitliches Auftreten
Gehirnvolumen (in cm3)
Australopithecus
5 (?) bis 1 Mio. Jahre 2,1 bis 1,5 Mio. Jahre 1,8 bis 0,5 Mio. Jahre 0,4 Mio. Jahre bis Gegenwart 0,2 Mio. bis 35 000 Jahre
500
Homo habilis Homo erectus Homo sapiens Homo sapiens neandertalensis Homo sapiens sapiens
40 000 Jahre bis Gegenwart
590⫺770 700⫺1300 1400 1450 1400
Abb. 25.5: Übersicht über die Familie der Hominiden.
zende Änderungen zu verursachen. Daher hat sich der Mensch seit 40 000 Jahren biologisch nicht grundlegend geändert. Die gewaltigen Änderungen, die sich ⫺ insbesondere in den letzten Jahrtausenden ⫺ vollzogen haben, spielen sich auf kultureller Ebene ab. 2.4.3. Biologische Grundlagen der Sprachentstehung Die menschliche Sprache, gekennzeichnet nach den in § 2.4.1. angegebenen Kriterien, ist hinsichtlich ihrer Evolution ein Aspekt der Evolution kognitiver Fähigkeiten im allgemeinen, ein Aspekt der geistigen Evolution des Menschen, der diese gleichzeitig wesentlich mitbestimmt hat. „Es ist wahrscheinlich, daß die geistige Entwicklung von niederen zu höheren Tierformen und zum Menschen hin mit der Entwicklung der Nerven und Sinnesorgane und Gehirne parallel lief“ (Rensch 1970, 72). Es sei hier dahingestellt, inwieweit es gerechtfertigt ist, von einer „geistigen Entwicklung“ in der Tierwelt oder von „Vorstufen des Geistigen“ bei nichtmenschlichen Organismen zu sprechen. Sicher aber dürfen wir ⫺ eingedenk des Umstandes, daß alle Lebewesen informationsverarbeitende Systeme sind und Zeichenprozesse entwickeln (vgl. § 2.1.) ⫺ von einer, im allgemeinen Sinne, kognitiven Entwicklung in der Organismenwelt sprechen, die bei einfachen einzelligen Gebilden begann und sich dann, mit immer komplexer werdenden Leistungen (steigernde Assoziations- und Lernleistungen, Abstraktion usw.), bis zum menschlichen Bewußtsein als „Geist“ im engeren Sinn (vgl. Wuketits 1985 b) fortgesetzt hat. Und es ist anzunehmen, daß für alle kognitiven Leistungen biologische Korrelate, biologische Grundvoraussetzungen notwendig sind, insbesondere eben durch Gehirne, Nerven und Sinnesorgane. Für die Entstehung und Entwicklung der menschlichen Sprache sind demnach mehrere biologische Voraussetzungen auszumachen, die teils sehr komplex miteinander verknüpft sind (vgl. Burkhardt 1987; Goerttler 1972; Lenneberg 1972; Müller 1987; Starck 1979; Wind 1976; 1981; 1983): ⫺ ⫺ ⫺ ⫺ ⫺ ⫺ ⫺
Entwicklung des aufrechten Ganges; Entwicklung der Vorderextremitäten; Ausbildung der Stimmorgane; Kehlkopfsenkung; Rückbildung der Kiefer; Entwicklung der Gesichtsmuskulatur; Erweiterung des Gesichtssinns;
540 ⫺ Entwicklung des Gehörssinns; ⫺ Entwicklung komplexer Steuerungssysteme im Gehirn. Diese Faktoren treten bereits auf vormenschlichem Niveau, in der Evolution der Primaten, auf und kommen dann in der Evolution der Hominiden verstärkt zum Vorschein. (Die Entwicklung der Voraussetzungen der menschlichen Sprache erscheint als einmaliger Vorgang in der Evolution. Umgekehrt ist offenbar nur ein Wesen, bei dem alle genannten anatomischen und physiologischen Voraussetzungen erfüllt sind, der Sprache ⫺ im Sinne der menschlichen Sprache ⫺ mächtig. Daher sind beispielsweise sprechende Vierfüßler kaum vorstellbar.) Neben diesen Voraussetzungen, die im wesentlichen anatomischer und physiologischer Natur sind, spielen Mechanismen der sozialen Evolution eine sehr wichtige Rolle. Gewiß kann man die Anthropogenese vor allem auch als Soziogenese betrachten (Tembrock 1983): die Evolution des Menschen als die Entwicklung von der Kleingruppe zu immer komplexeren Sozietäten (zur Übersicht vgl. z. B. Wuketits 1985 a; 1988 b). Die Entwicklung von Zeichenprozessen ist jedenfalls untrennbar verbunden mit der Entwicklung von Sozietäten, deren Mitglieder miteinander kommunizieren. Dabei erleichtert die Existenz einer Gruppe, das Gruppenleben, die Entwicklung von Zeichen, die somit einen Aspekt des sozialen Lernens darstellt. Auf der anderen Seite ist eine Gruppe, deren Mitglieder miteinander effektiv zu kommunizieren imstande sind, einander verstehen, zweifelsohne im Vorteil gegenüber jenen Gruppen, die weniger effektive Kommunikationssysteme entwickelt haben. Das Auftreten einer Wortsprache hat unter diesen Voraussetzungen ganz entscheidende Vorteile mit sich gebracht: Durch die Wortsprache kann man wesentlich präzisere Mitteilungen machen als durch bloße Mimik und Gestik oder durch unartikulierte Laute. So wie die soziale Evolution also eine Vorbedingung für die Entwicklung der Sprache darstellt, so war diese auch ein wichtiger Motor der sozialen Entwicklung der Hominiden. Die Sprache ist gewissermaßen das Medium, das ein Funktionieren von komplexen Sozietäten, wie sie uns vom modernen Menschen bekannt sind, überhaupt erst ermöglicht (Henle 1975). 2.4.4. Zur Frage nach dem Zeitpunkt der Sprachentstehung Seit wann es nun Sprache nach den in § 2.4.1. festgelegten Kriterien gibt, welcher unserer Vorfahren sich also der Sprache in diesem en-
III. Arten der Semiose
geren Sinn bereits bediente, ist eine sehr komplexe Frage, die vielleicht nie wirklich befriedigend beantwortet wird. Andererseits kann man doch sagen, daß dort, wo einmal die genannten anatomischen Kriterien gegeben sind, Sprache möglich ist; und dort, wo sich Hominiden bereits mit abstrakten Dingen beschäftigt haben, beispielsweise metaphysische Denksysteme entwickelten, ist die Annahme der Existenz einer artikulierten Wortsprache zwingend. Die Frage nach dem Zeitpunkt der Sprachentstehung ist jedenfalls eng verknüpft mit der Frage nach dem ersten Auftreten komplexer kognitiver Fähigkeiten, insbesondere reflexiver Bewußtseinsleistungen. Solche Fähigkeiten schließen insbesondere das Vermögen eines Systems ein, über seine eigene Existenz nachzudenken, seinen Sinn in der Welt begreifen zu wollen, zu erkennen, daß es selbst verschiedene Vorgänge verursachen kann; eine wichtige Rolle spielt dabei gewiß auch das Todesbewußtsein und die damit verbundene Annahme eines Weiterlebens nach dem Tode. Eine Kommunikation über solche im weitesten Sinne metaphysischen Probleme ist sicher nur über eine artikulierte Wortsprache (mit ihrem Symbolcharakter) möglich. Die Neandertaler, die bereits ihre Toten bestattet und einen Jenseitsglauben entwickelt haben, müssen demnach auf jeden Fall schon im engeren Sinne als sprechende Wesen eingestuft werden (vgl. z. B. Lenneberg 1972). Ob hingegen bereits die Angehörigen der Spezies Homo erectus über eine artikulierte Wortsprache verfügten, ist mehr als fraglich. Zwar wurde auf dieser Entwicklungsstufe das Feuer „erfunden“; auch ist Homo erectus längst fähig gewesen, Werkzeuge herzustellen und wohl auch seine Fertigkeiten an die Mitglieder der jeweiligen Gruppe weiterzugeben. Das muß aber noch nicht zwangsweise die Existenz einer nach syntaktischen Regeln strukturierten (Wort-) Sprache zur Voraussetzung haben. Es spricht also einiges dafür, daß erst auf der Stufe des Homo sapiens Sprache im engeren Sinne entwickelt wurde. Ähnlich argumentiert z. B. Müller (1987, 130 f): „Die Verwendung von ‘modernen’, syntaktisch strukturierten Sprachen, im heutigen Sinne, kann […] nicht länger als 40 000 bis 70 000 Jahre zurückliegen.“ Weil, so ist zu ergänzen, eben das Denken des Menschen in abstrakten Kategorien (Metaphysik!), nach unseren heutigen Kenntnissen, nicht viel älter ist. Eine absolute Datierung des Sprachursprungs ist daraus freilich nicht zu gewinnen.
25. Anthroposemiose
3.
Der soziokulturelle Kontext
Die zweite Ebene, auf der nun Anthroposemiosen zu untersuchen sind, ist die der soziokulturellen Evolution der Hominiden, die, wie schon erwähnt, durch einen besonderen Mechanismus der Informationsspeicherung und -weitergabe zu kennzeichnen ist und über die organische Evolution demnach hinausgeht. In der Folge ist zunächst kurz das Verhältnis zwischen organischer und kultureller Evolution zu untersuchen und danach die Frage nach der spezifischen Abhängigkeit der Anthroposemiosen von soziokulturellen Kontexten. 3.1. Organische und soziokulturelle Evolution Eine Analogisierung der Entwicklung menschlicher Kultur mit der organischen Evolution war zwar immer wieder von großer Attraktivität, doch erscheint es wichtiger, sich die Unterschiede zu vergegenwärtigen, vor allem, um die Besonderheit im Mechanismus der Informationsspeicherung und -übertragung auf kulturellem Niveau zu verstehen. Dabei sind nun im wesentlichen die folgenden Unterschiede auf den Punkt zu bringen (zur Übersicht vgl. Wuketits 1988 b; 1990): (a) Der erste augenfällige Unterschied betrifft das Evolutionstempo. Während sich die organische Evolution relativ sehr langsam abspielt und sich die biologische Grundausstattung des Menschen seit etwa 40 000 Jahren kaum nennenswert geändert hat, sind gerade für diesen Zeitraum ⫺ und insbesondere für die seit der Entstehung der ersten Hochkulturen verstrichene Zeit ⫺ enorme Veränderungen auf kulturellem Niveau feststellbar, die sich in einer Vielfalt von Artefakten, Institutionen, Ideen usw. manifestieren. (b) Diese Entwicklungsbeschleunigung auf dem Niveau der kulturellen Entwicklung liegt darin, daß die Transmission der Information (intellektuelle Information!) nicht auf die genetische (Informations-)Speicherung angewiesen ist und des Prozesses der (biologischen) Fortpflanzung nicht bedarf. Die (intellektuelle) Information in Form von Ideen „ist allein durch Kommunikation im weitesten Sinn des Wortes übertragbar“ (Kunst 1982, 9), sie wird extrasomatisch (auf Tontafeln, in Büchern oder ⫺ inzwischen auch ⫺ in technischen Datenverarbeitungsanlagen) gespeichert und ist für jeden jederzeit abrufbar; Voraussetzung ist nur, daß der oder die Betreffende die Zeichen versteht, derer sich
541 der Sender bei der Festlegung seiner/ihrer Information bedient. (c) Während es in der organischen Evolution, nach allem, was wir heute darüber wissen, keine direkte Vererbung erworbener Eigenschaften gibt, beruht die (sozio-)kulturelle Evolution in der Hauptsache darauf, daß im Laufe des individuellen Lebens gesammelte Information den Nachkommen weitergereicht wird. (d) Für die organische Evolution gibt es a priori keine Richtung, während der bewußt reflektierende Mensch bestimmte Intentionen hat, durch die er der Evolution der Kultur auch bestimmte Richtungen vorzugeben versucht. (e) Die organische Evolution produziert eine Vielfalt von Arten, während die kulturelle Evolution von einer einzigen Spezies abhängt, die nun eine Vielfalt von Kulturen ⫺ gekennzeichnet durch die Vielfalt der Artefakte, Institutionen, Sitten, Bräuche usw. ⫺ hervorbringt. (f) Die Informationsübertragung im biologischen Bereich geht linear vor sich, Eltern können ihre (genetische) Information nur auf ihre unmittelbaren Nachkommen übertragen. In der kulturellen Entwicklung hingegen ist nicht nur eine „horizontale“ Übertragung von (intellektueller) Information möglich, also eine Übertragung der Information zwischen gleichzeitig lebenden Individuen, sondern der Prozeß kann auch umgekehrt werden, indem Eltern von ihren Kindern lernen (Boyd und Richerson 1985; Diettrich 1989). Damit erscheint die kulturelle Evolution von der organischen abgehoben und kann tatsächlich nicht auf biologische Vorgänge reduziert werden. Bestimmte Prozesse in der kulturellen Evolution können nicht in biologischen Termini hinreichend beschrieben und erklärt werden. Dennoch besteht zwischen der organischen und der kulturellen Evolution eine enge Verbindung: Stets sind es Strukturen lebender Organismen, nämlich Gehirne, die Kultur produzieren. So erscheint es durchaus plausibel, von einer Koevolution biologischer und kultureller Prozesse auszugehen (vgl. Lumsden und Wilson 1981). In der Tat steht die kulturelle Evolution nicht gegen die organische, vielmehr sind Wechselwirkungen auf unterschiedlichen Ebenen zu erwarten, die allerdings noch tiefergehende Untersuchungen erfordern. Tatsache bleibt indes, daß mit den spezifischen, in der kulturellen Evolution wirkenden ⫺ und in ihrer Wirkung durch die kultu-
542
III. Arten der Semiose
relle Evolution verstärkten ⫺ Mechanismen der Informationsspeicherung und -weitergabe eine neue Plattform für Zeichenprozesse gegeben ist. 3.2.
Soziokulturelle Rahmenbedingungen der Anthroposemiose
3.2.1. Angeborene und erlernte Verhaltensweisen In der vergleichenden Verhaltensforschung konnte die alte Kontroverse um angeborene und erlernte Verhaltensweisen, die insbesondere im Bereich der Diskussion menschlichen Verhaltens recht emotional geführt wurde (und zum Teil noch geführt wird), insoweit gelöst werden, als man Erbanlagen und Umwelt nicht mehr als Alternativen anerkennt, sondern vielmehr in ihrer wechselseitigen Beziehung betrachtet. Genetische Faktoren und Umweltfaktoren stellen also ein komplexes Bedingungsgefüge dar, das menschliches Verhalten in seiner Spezifität und Typik bestimmt. Der einzelne Mensch kommt demnach, wie jedes andere Lebewesen, mit angeborenen ⫺ in der Evolution seiner Gattung allmählich entwickelten ⫺ (genetischen) Dispositionen zur Welt, die aber durch die Wirkung der Umwelt (Erziehung, Tradierung kultureller Normen) in erheblichem Maße modifiziert und sozusagen überformt werden können. Insbesondere wird anerkannt, daß das menschliche Gehirn ein plastisches System darstellt und fähig ist, vielfältige Eindrücke jeweils neu zu verarbeiten, d. h. auf unterschiedliche Weise darauf zu reagieren. Die dem menschlichen Gehirn eigene Flexibilität und die darauf beruhende Lernfähigkeit sind enorm. Was freilich interessiert, ist die Beantwortung der Frage, inwieweit vor allem menschliches Sozialverhalten, ungeachtet seiner unterschiedlichen Ausprägungen im Detail, auf gemeinsame Grundmuster zurückzuführen ist, Grundmuster, die im Ethogramm (Verhaltensinventar) unserer Spezies festgelegt sind und eben erst sekundär durch die kulturelle Evolution überformt werden. Wenn daher Eibl-Eibesfeldt (1984) eine universale Grammatik menschlichen Sozialverhaltens darlegt, dann auf der Basis einer Vielzahl empirischer, im „Kulturvergleich“ erschlossener Erkenntnisse, die die Existenz von Universalien (des Sozialverhaltens) annehmbar erscheinen lassen (s. Abb. 25.6). Begrüßungsrituale, Rangordnungsprinzipien usw. zeigen, unterschiedlichen kulturellen
Kosmologische Vorstellungen: Vorstellungen über Weltanfang und Weltende; metaphysische und religiöse Vorstellungen. Religiöse Rituale und Jenseitsvorstellungen. Inzesttabu bzw. Inzestmeidung (mit nur ganz wenigen Ausnahmen). Zuordnung von Geschlechterrollen und Arbeitsteilung der Geschlechter. Rangordnung und Dominanzverhalten. Gruppenbewußtsein („Wir-Gefühl“; „in-group/ out-group differentiation“). Territorialität. Begrüßungsrituale. Strategien der Bandstiftung und Gruppenbindung (z. B. gemeinsames Spielen, Tanz, Überreichen von Geschenken usw.). Mutter-Kind-Interaktion („Brutpflege“). Lachen und Weinen. Trauerzeremonien. Olfaktorische (geruchliche) Verständigung (verschiedene Gerüche verursachen unterschiedliche Empfindungen). Akustische Verständigung; Musik. Taktile Verständigung (Streicheln, Umarmen, Tätscheln). Visuelle Verständigung (Gestik und Mimik). Sprache. Abb. 25.6: Die wichtigsten Universalien menschlichen (Sozial-)Verhaltens; allgemeine Kulturcharakteristika.
Differenzierungen zum Trotz, gemeinsame Grundmuster. Sie sind im Verhaltensinventar unserer Spezies festgelegte Strategien, die als funktional in einem biologischen Sinne zu deuten sind, daher auch entsprechend fest verankert erscheinen. Diese Bemerkung soll die Wirkungsweise der Umwelt nicht geringfügig erscheinen lassen. Vielmehr geht es darum, deutlich zu machen, daß selbst die subtilsten unserer Verhaltensweisen einen tieferen biologischen Sinn haben; daß die gemeinsame biologische (genetische) Wurzel durch Umwelteinwirkungen erst verstärkt oder in ihrer Wirkung auch abgeschwächt werden kann, historisch, genetisch jedoch zuerst ins Auge zu fassen ist. 3.2.2. Genetische versus kulturelle Wirkungen auf Sprache? Mutatis mutandis gilt nun für Zeichenprozesse, daß eine genetische Grundlage anzunehmen ist, daß in der organischen Evolution entstandene anatomische und physiologische Grundmuster die primären Rahmenbedingungen für Anthroposemiosen darstellen. Das Verhalten des Menschen ⫺ einschließlich
25. Anthroposemiose
vieler seiner Zeichenprozesse ⫺ ist vom Wirken der Affektivität durchzogen. „Die Instrumentierung bestimmter affektiver Lagen wird beim Menschen wie bei verschiedenen Primaten durch ähnliche mimische Signale und zum Teil identische hormonale Feinsteuerung erzeugt“ (Meyer 1987, 136). Demgegenüber jedoch erscheint die Wortsprache ⫺ wenn auch erst relativ spät in der Evolution entstanden ⫺ deutlich abgehoben. Gewiß ist auch unsere Wortsprache in vieler Hinsicht von einer Affektivität durchzogen, ja sie kann als besonders feines Werkzeug zur Handhabe affektiver Zustände verstanden werden. In ihrer Vielfalt aber geht sie fraglos über die Tiefenschichten kommunikativer Möglichkeiten hinaus. Da nun die menschliche Sprache, als artikulierte Wortsprache mit syntaktischer Struktur, gewisser biologischer Anfangsbedingungen bedarf (vgl. § 2.4.3.), liegt es nahe, eine genetische Disposition für Sprachfähigkeit bei jedem Individuum anzunehmen. Tatsächlich ist man sich heute weitgehend darüber einig, daß die Sprache eine im genetischen Repertoire des Homo sapiens vorgezeichnete Leistung eines komplexen biologischen Systems ist, daß aber die Frage, welche der vielen möglichen Sprachen das Individuum tatsächlich erlernt, nur durch kulturelle Einflüsse entschieden wird (vgl. z. B. Eibl-Eibesfeldt 1984; Hockett 1960; Lenneberg 1972; Müller 1987). In diesem Sinne kann man ⫺ ähnlich der Auffassung von Chomsky (1973), der eine universelle, generative Grammatik dem Erlernen einer bestimmten Sprache voranstellt ⫺ von Universalien ausgehen, d. h. die Sprachfähigkeit grundsätzlich auf elementare Verhaltensweisen des Menschen zurückführen. Zu diesen Verhaltensweisen gehört beispielsweise das Bedürfnis des Menschen, die Dinge um ihn herum zu benennen (Eibl-Eibesfeldt 1984). Die Befriedigung dieses Bedürfnisses findet letztlich Niederschlag in einer Orientierungsfähigkeit des Menschen, die ihm Geborgenheit in seiner Welt zu vermitteln vermag. Da somit die Sprachfähigkeit insgesamt auf einen genetischen Komplex zurückführbar ist, das Erlernen bestimmter Sprachen, die Bedeutung einzelner Wörter bzw. deren Sinngehalt soziokulturellen Einflüssen unterliegt, haben wir abermals von einer Wechselwirkung oder, besser gesagt, einem Zusammenwirken von zwei Determinationskomplexen auszugehen.
543 Der (sozio-)kulturelle Determinationskomplex wirkt aber so stark, daß die genetische Kodierung als Basis für die konkrete Entwicklung des gesprochenen Wortes nicht mehr ausreicht. Die Kodierung sprachlicher Signale übersteigt bei weitem die Möglichkeiten der genetischen Kodierung. Lumsden und Wilson (1981, 337) schreiben: „The grammatical and semantic structure of language at the human level does exceed the capacity of the genome to encode it. Although a very large number of symbols can be encoded separately, there is a strict limit to the length of the sentences that can be innately programmed in such a way that the truth value of each sentence is specified. For example, to possess a completely inborn vocabulary of 10 000 words and to speak in sentences of 10 words each would require a truly astronomical 1040 nucleotides, or 1016 kilograms of DNA, far more than the weight of the entire human species!“ In der Tat ist der Zahl der Wortkombinationen in einer Sprache kaum eine Grenze gesetzt. Zwar bilden grammatische bzw. syntaktische Regeln gewisse Systemzwänge, lassen aber dennoch sozusagen astronomische Möglichkeiten offen. Inwieweit nun kulturelle Determinanten die menschliche Sprache oder, allgemeiner, die Anthroposemiose beeinflussen, wird auf verschiedenen Ebenen deutlich. Zunächst hängt das Erlernen einer bestimmten Sprache trivialerweise davon ab, in welchen soziokulturellen Kontext der Mensch hineingeboren wird und wo er oder sie aufwächst. Welche Sprache ein Kind also als Muttersprache lernt, ist keineswegs genetisch vorgeschrieben. Darüber hinaus aber entscheidet die einen Menschen umgebende (soziokulturelle) Wirklichkeit auch über die Bedeutungen und den Sinngehalt der erlernten Wörter, sie formt und limitiert die „Verwendbarkeit“ von Wörtern (Campbell 1973). Dabei kann ein und dasselbe Wort in unterschiedlichen Kontexten auch unterschiedliche Bedeutung haben. Was den Wortschatz betrifft, erscheint es naheliegend, daß sein Umfang ebenfalls von jeweiligen soziokulturellen Kontexten bestimmt wird: in objekt- und beziehungsarmen Umwelten werden dem einzelnen weniger Wörter und Bedeutungen vermittelt als in komplex strukturierten und vielfältigen Umwelten. In komplex strukturierten Gesellschaften gilt für den einzelnen selbst innerhalb einer bestimmten Sprache, etwa innerhalb der Muttersprache (und besonders dort) eine „Mehrsprachigkeit“ (vgl. Wandruszka
544 1981), weil der einzelne in verschiedenen sozialen und kulturellen Bezügen lebt, sich im Beruf einer „Fachsprache“, innerhalb seiner Familie eines bestimmten Dialekts seiner Muttersprache bedient usw. Aber auch auf der Ebene der nonverbalen Kommunikation wirken soziokulturelle Einflüsse. Während etwa das Kopfnicken in Mitteleuropa Zustimmung bedeutet, bedeutet es in manchen anderen Ländern, z. B. in Bulgarien, Verneinung. Sowohl auf vorsprachlicher als auch auf sprachlicher Ebene (d. h. auf der Ebene der Wortsprache) üben Traditionen und Konventionen einen enormen Einfluß aus. Die Bezeichnung Schwein, angewendet auf einen Menschen, hat eine eindeutig soziokulturell bedingte negative Wirkung, so wie z. B. die Gesamtheit der als obszön bezeichneten Wörter nur aus bestimmten Traditionen heraus ⫺ mit der Überlieferung sittlicher Normen, Tabus usw. ⫺ auch als obszön verstanden werden kann. Doch so wie kulturelle Normen sich im Laufe der Zeit ändern können, ändern sich auch Bedeutungen für Wörter und Begriffe, ebenso wie für nonverbale Kommunikationselemente. Der Satz „Wasser ist feurig“ wird in unserer Kultur beispielsweise als unsinnig empfunden, weil „Wasser“ und „Feuer“ für uns gerade Gegensätze bedeuten. Es sind aber mythische Traditionen vorstellbar, in deren Zusammenhang dieser Satz sinnvoll wäre. Mitunter kann ein Ausdruck, der sich traditionellerweise eingebürgert hat, auch bestimmten anderen Erkenntnissen oder Erfahrungen widersprechen: Wir sprechen z. B. vielfach vom „Walfisch“, obwohl wir aus zoologischen Quellen längst wissen, daß es sich dabei nicht um einen Fisch, sondern um ein Säugetier handelt. Die traditionelle Wortverwendung ⫺ entstanden auf der Basis der Auffassung, daß Wale Fische sind ⫺ hat sich hier also erhalten. Es sind soziokulturelle Kontexte, die darüber entscheiden, ob Begriffe und Sätze als semantisch anomal empfunden werden oder nicht. Zu diesen Kontexten gehören verschiedene Erfahrungen und Anschauungen, sowohl auf der Ebene der naiven Alltagserfahrung als auch auf der Ebene der wissenschaftlichen Erkenntnis. Der Satz „Die Erde ist eine Kugel“ war eine semantische Anomalie, solange die überwiegende Mehrzahl der Menschen ein Paradigma vertrat, wonach die Erde eine Scheibe ist. Allgemein kann man sagen: „Es steht […] nicht für alle Zeiten fest, was operational semantisch korrekt und was
III. Arten der Semiose
anomal ist, und Veränderungen in der empirischen Beschreibung der Welt können Veränderungen in den operational semantischen Bedeutungen (der Umgangssprache) hervorrufen“ (Leinfellner und Leinfellner 1978, 273). Was die Frage nach genetischen und/oder (sozio-)kulturellen Faktoren in der Entwicklung von Anthroposemiosen betrifft, können wir jedenfalls nicht mehr Widersprüche zwischen genetischen und soziokulturellen Erklärungen sehen, weil sich beide auf verschiedene Ebenen beziehen. Der biologische Erklärungsansatz liefert ein Verständnis für die notwendigen Vorbedingungen jeder Anthroposemiose, für die funktionale Bedeutung nonverbaler Kommunikation und für die Entwicklung der Sprachfähigkeit. Auf der soziokulturellen Ebene hingegen ist die ungeheure Variationsmöglichkeit des gesprochenen Wortes zu untersuchen, wobei kulturanthropologische, ethnologische und vergleichend sprachwissenschaftliche Analysen und Vergleiche maßgeblich sind. Zur kulturellen Bedingtheit der Ontogenese von Anthroposemiosen vgl. Art. 128. Einen besonderen Status in der Entwicklung von Anthroposemiosen nimmt die Schrift ein, die die Sprachfähigkeit zur Voraussetzung hat und sich innerhalb einer relativ sehr kurzen Zeit in der Evolution des Menschen von der Bilderschrift zur Buchstabenschrift ⫺ und als Buchstabenschrift in sehr differenzierter und vielfältiger Weise ⫺ entwickelt hat (vgl. Jensen 1969). Die Bedeutung von Schriftzeichen kann, wie die Bedeutung gesprochener Wörter und Sätze, nur im jeweiligen soziokulturellen Kontext interpretiert werden. Für die Entwicklung der Schrift gilt, daß die verwendeten Zeichen zunehmend abstrakter wurden. Während die Bilderschrift des prähistorischen Menschen (Abb. 25.7) noch als der Versuch verstanden werden kann, wahrgenommene Objekte und Vorgänge naturgetreu abzubilden, hat die Buchstabenschrift ein abstraktes, von konkreten Gegenständen und Vorgängen abgehobenes Niveau erreicht. Zwei Prozesse haben dabei stattgefunden (Barber 1964): (a) Die Bilder sind vereinfacht und konventionalisiert worden, bis sie nicht mehr als Bilder erkennbar waren. (Ihre Konventionalisierung machte natürlich eine effektivere Kommunikation möglich.) (b) Die verwendeten Zeichen standen mehr und mehr für sprachliche Elemente (Wörter, Silben, Laute bzw. Phoneme).
25. Anthroposemiose
Abb. 25.7: Beispiele für Bilderschrift. Oben: Paläolithische Felszeichnung. Mitte: Etwa 6000 Jahre alte Schrift aus Alvao in Nordportugal. Unten: Altägyptische Schriftzeichen (nach Jensen 1969).
3.3. Eigenarten und Gesetzlichkeiten in der Entwicklung von Anthroposemiosen Mit der Entwicklung der Schrift ist bereits ein allgemeines Merkmal in der Entwicklung der Anthroposemiosen angedeutet: die Entwicklung zum Abstrakten (vgl. Art. 32). Und mit dieser Entwicklung ging eine Tendenz zur Linearität einher. Riedl (1986, 98 f) bemerkt: „Unsere Hochsprachen bleiben nicht nur eindimensional, ein einziger Faden von Schwingungen zwischen Mund und Ohr (oder Mikrophon); sie trachten zudem, sich von der begleitenden Körpersprache zu befreien (und in den formalen Sprachen sogar von den Dingen dieser Welt!).“ Mit dem Auftreten der formalen Sprachen ist schließlich eine weitere Entwicklungsstufe in der Evolution der Semiosen (s. Art. 18) erreicht, die nur mehr im Kontext abstrakter Begriffsbildungsprozesse in den Wissenschaften verstanden werden kann. Ist nun die kulturelle Evolution im allgemeinen dadurch gekennzeichnet, daß ein und dieselbe Spezies eine Vielfalt exosomatischer Strukturen schafft (vgl. § 3.1.), daß nicht eine Kultur entsteht, sondern daß sich viele Kulturen entwickeln und vielfältige Wandlungsprozesse durchlaufen (Linton 1955), so ist im besonderen für die Entwicklung der Anthroposemiosen derselbe Effekt beobacht-
545 bar. War die Entstehung einer Wortsprache zunächst für den Zusammenhalt der Sozietäten des Homo sapiens bedeutungsvoll, hatte also die Wortsprache sozusagen bindende Funktion, entstehen auf weiteren Entwicklungsstufen der Sprache Kommunikationsbarrieren. Denn die tausenden Sprachen, die sich praktisch innerhalb weniger Jahrtausende entwickelt haben, zeichnen sich durch ein jeweils spezifisches Vokabular, durch spezifische grammatische und syntaktische Strukturen aus, die oft weit voneinander entfernt liegen. In den einzelnen Sprachen wird wiederum ein jeweils spezifischer Zugang zur Welt gespiegelt; jede einzelne Sprache wird zum Zeugnis einer kulturspezifischen Weltsicht. So kommt es nicht weiter überraschend, „daß die Wörter einer Sprache in einer anderen keine genauen Entsprechungen haben. Das geht natürlich Hand in Hand mit der Verschiedenartigkeit der Analysen des in der Erfahrung Gegebenen“ (Martinet 1963, 26). Um also eine weltweite Kommunikation zu ermöglichen, ist der Mensch gezwungen, entweder eine der natürlichen Sprachen ⫺ sofern diese nicht schon seine Muttersprache ist ⫺ dazuzulernen (z. B. Englisch), oder eine Kunstsprache zu entwickeln, die für alle Angehörigen seiner Spezies, unabhängig vom jeweiligen soziokulturellen Kontext, verständlich ist. Ein generelles Merkmal der Anthroposemiosen in diesem Zusammenhang scheint zu sein, daß die stammesgeschichtlich älteren Zeichensysteme ⫺ vor allem die Zeichensysteme nonverbaler Kommunikation ⫺ weiter verbreitet sind: Sie sind artspezifische Systeme, während die später, im kulturell jeweils variierenden Kontext entstandenen Sprachen kulturspezifisch sind. So gibt es beispielsweise Grundmuster der MutterKind-Interaktion unabhängig von kulturspezifischen Variationen der Semiosen (vgl. EiblEibesfeldt 1983; 1984). Diese Grundmuster liegen sozusagen tiefer und haben eine stammesgeschichtlich ältere Funktion. Erst sekundär, durch die soziokulturelle Differenzierung, sind diese Grundmuster auf vielfältige Weise überlagert worden. Ein weiteres grundsätzliches Merkmal der Evolution der Anthroposemiosen ist aus der erwähnten Entfernung der Zeichen von ihrem Erzeuger abzuleiten. An die Stelle des Erzeugers tritt nun, durch Schriftzeichen, ein „totes Objekt“. Zugleich aber steht für natürliche Objekte, für beobachtbare oder beobachtete Vorgänge ein Symbol. Auf symbol-
546
III. Arten der Semiose
hafter Ebene wird aber die ⫺ durch vielfältige Differenzierung der Sprache in Sprachen ⫺ unmöglich gewordene Kommunikation zwischen allen Angehörigen unserer Spezies wieder möglich. Man denke etwa an Straßenverkehrsregeln, wo bestimmte Normen durch Symbole verständlich gemacht werden, die praktisch weltweit gleich sind.
4.
Die Notwendigkeit interdisziplinärer Ansätze
Man kann nicht sagen, daß bislang schon eine allgemeine Theorie der Anthroposemiosen entwickelt worden wäre. Das liegt daran, daß die unterschiedlichen Ebenen, auf denen das Auftreten von Anthroposemiosen zu analysieren ist, oft unabhängig voneinander betrachtet werden. Eine umfassende Theorie, die dem Phänomen Sprache im weitesten Sinne gerecht werden soll, kann indes nur entwickelt werden, wenn man die Schnittpunkte der verschiedenen Analyseebenen gefunden hat. Das heißt konkret, daß eine solche Theorie sowohl dem universalen Aspekt der Sprache (Sprachfähigkeit) als auch den tausenden Varianten, in denen sich Sprache entwickelt hat, in gleichem Maße Rechnung zu tragen hätte. Das aber wird nur erreicht, wenn mit jener alten Tradition, die die Kultur von der Natur scheidet, gebrochen wird. Finke (1987, 137) schreibt: „Unsere Sprachen sind so, wie wir sie heute kennen, zweifellos Kulturphänomene von besonderer Komplexität und strukturell-funktionaler Raffinesse; doch sie sind zu einem sicherlich erheblichen, aber den Linguisten noch heute fast unbekannten Ausmaße vor allem ein strukturelles Erbe der natürlichen Evolution.“ Es ist daher nur naheliegend, Biologie und Linguistik miteinander zu verbinden; denn die reale Entwicklung der Sprachfähigkeit und der Differenzierung dieser Fähigkeit in vielfältige Sprachen kennt die künstlich gezogene Grenze zwischen Biologie und Linguistik oder, allgemeiner, Naturwissenschaft und Geisteswissenschaft eben nicht. Die menschliche Sprache kann, so wie jeder Zeichenprozeß, nur als eine Aktivität eines komplexen Systems verstanden werden, die Zeichen für wahrgenommene Objekte verfügbar macht (Lange 1985). Das hinreichende Verständnis dieser Aktivität wiederum bedarf der Analyse kognitiver Fähigkeiten im allgemeinen, insbesondere der Analyse der Entwicklung menschlichen Erken-
nens und Denkens, wovon letztlich die Existenz der Sprache abhängt. Die Verbindung der verschiedenen Analyseebenen ⫺ der biologischen wie der soziokulturellen ⫺ und damit die Verbindung verschiedener Disziplinen ⫺ von der Ethologie über die Psychologie bis zur Kulturanthropologie ⫺ wäre freilich selbst wiederum ein komplexer anthroposemiotischer Prozeß, der indes davon Zeugnis ablegen würde, daß die in unterschiedlichen Disziplinen produzierten Zeichen ihre Empfänger finden und daß diese untereinander Zeichen auszutauschen in der Lage sind.
5.
Literatur (in Auswahl)
Barber, Charles (1964), The Story of Language. London. Bertalanffy, Ludwig von (1968), „Symbolismus und Anthropogenese“. In: Bernhard Rensch (ed.), Handgebrauch und Verständigung bei Affen und Frühmenschen. Bern und Stuttgart: 131⫺143. Bonner, John T. (1983), Kultur-Evolution bei Tieren. Berlin und Hamburg. Boyd, Robert und Peter J. Richerson (1985), Culture and the Evolutionary Process. Chicago und London. Burkhardt, Angelika (1987), „ ,Schon als Thier, hat der Mensch Sprache‘. Biologisch-anthropologische Aspekte der Sprachevolution“. Die Muttersprache 97: 1⫺15. Campbell, Donald T. (1973), „Ostensive Instances and Entativity in Language Learning“. In: William Gray und Nicholas D. Rizzo (eds.), Unity through Diversity. New York: 1043⫺1057. Chomsky, Noam (1973), Sprache und Geist. Frankfurt a. M. Diettrich, Olaf (1989), Kognitive, organische und gesellschaftliche Evolution. Gemeinsamkeiten und Unterschiede. Berlin und Hamburg. Eibl-Eibesfeldt, Irenäus (1978), Grundriß der vergleichenden Verhaltensforschung. Ethologie. 5. Aufl. München und Zürich. Eibl-Eibesfeldt, Irenäus (1983), „Patterns of Parent-Child Interaction in a Cross-Cultural Perspective“. In: Alberto Oliverio und Michele Zappella (eds.), The Behavior of Human Infants. New York: 177⫺217. Eibl-Eibesfeldt, Irenäus (1984), Die Biologie des menschlichen Verhaltens. Grundriß der Humanethologie. München und Zürich. Erben, Heinrich K. (1988), Die Entwicklung der Lebewesen. Spielregeln der Evolution. 3. Aufl. München und Zürich. Finke, Peter (1987), „Biologie und Linguistik kommen einander näher. Wissenschaftstheoretische Be-
25. Anthroposemiose
547
merkungen zur Interdisziplinarität“. Nachwort in: Horst M. Müller, Evolution, Kognition und Sprache. Berlin und Hamburg: 133⫺141.
Martinet, Andre´ (1963), Grundzüge der Allgemeinen Sprachwissenschaft. 5. Aufl. Stuttgart, Berlin, Köln und Mainz.
Goerttler, Karl (1972), „Stimme und Sprache“. Sitzungsberichte der Heidelberger Akademie der Wissenschaften. Mathematisch-naturwissenschaftliche Klasse: 185⫺195.
Mayr, Ernst (1979), Evolution und die Vielfalt des Lebens. Berlin, Heidelberg und New York.
Henle, Paul (ed.) (1975), Sprache, Denken, Kultur. Frankfurt a. M.
Meyer, Peter (1988), „Universale Muster sozialen Verhaltens: Wie entstehen aus genetischer Variabilität strukturell ähnliche Lösungen?“ Homo 38: 133⫺144.
Hill, W. C. Osman (1968), „Verständigungsmittel bei Affen“. In: Bernhard Rensch (ed.): Handgebrauch und Verständigung bei Affen und Frühmenschen. Bern und Stuttgart: 31⫺55.
Müller, Horst M. (1987), Evolution, Kognition und Sprache. Die Evolution des Menschen und die biologischen Grundlagen der Sprachfähigkeit. Berlin und Hamburg.
Hinde, Robert (ed.) (1972), Non-Verbal Communication. Cambridge, London, New York und Melbourne.
Oeser, Erhard (1987), Psychozoikum. Evolution und Mechanismus der menschlichen Erkenntnisfähigkeit. Berlin und Hamburg.
Hinde, Robert (1973), Das Verhalten der Tiere. 2 Bände. Frankfurt a. M.
Oeser, Erhard und Franz Seitelberger (1988), Gehirn, Bewußtsein und Erkenntnis. Darmstadt.
Hockett, Charles D. (1960), „The Origin of Speech“. Scientific American 203, 3: 88⫺96.
Osche, Günther (1987), „Die Sonderstellung des Menschen in biologischer Sicht: Biologische und kulturelle Evolution“. In: Rolf Siewing (ed.), Evolution. Bedingungen ⫺ Resultate ⫺ Konsequenzen. 3. Aufl. Stuttgart und New York: 499⫺523.
Immelmann, Klaus (1979), Einführung in die Verhaltensforschung. 2. Aufl. Berlin und Hamburg. Jensen, Hans (1969), Die Schrift in Vergangenheit und Gegenwart. 3. Aufl. Berlin. Kunst, Michael (1982), „Intellektuelle Information ⫺ Genetische Information“. Acta praehistorica et archaeologica 13⫺14: 1⫺26. Lange, Klaus-Peter (1985), Language and Cognition. An Essay on Cognitive Grammar. Tübingen. Leinfellner, Elisabeth und Werner Leinfellner (1978), Ontologie, Systemtheorie und Semantik. Berlin. Lenneberg, Eric H. (1972), Biologische Grundlagen der Sprache. Frankfurt a. M. Linden, Eugene (1976), Apes, Men, and Language. Harmondsworth.
Ploog, Detlev (1972), „Kommunikation in Affengesellschaften und deren Bedeutung für die Verständigungsweisen des Menschen“. In: Hans-Georg Gadamer und Paul Vogler (eds.), Neue Anthropologie 2. München und Stuttgart: 98⫺178. Ploog, Detlev und Theodore Melnechuk (1969), „Primate Communication. A Report Based on an NRP Work Session“. Neurosciences Research Program Bulletin 7: 419⫺510. Plotkin, Henry C. (1982), „Evolutionary Epistemology and Evolutionary Theory“. In: Henry C. Plotkin (ed.), Learning, Development, and Culture. Chichester und New York: 3⫺13.
Linton, Ralph (1955), The Tree of Culture. New York.
Porzig, Walter (1950), Das Wunder der Sprache. Probleme, Methoden und Ergebnisse der modernen Sprachwissenschaft. Bern.
Lorenz, Konrad (1973), Die Rückseite des Spiegels. Versuch einer Naturgeschichte menschlichen Erkennens. München und Zürich.
Premack, David (1976), „Language and Intelligence in Ape and Man“. American Scientist 64: 674⫺683.
Lorenz, Konrad (1978), Vergleichende Verhaltensforschung. Grundlagen der Ethologie. Wien und New York.
Rensch, Bernhard (1970), Homo sapiens: Vom Tier zum Halbgott. 3. Aufl. Göttingen.
Lorenz, Konrad (1988), Hier bin ich ⫺ wo bist du? Ethologie der Graugans. München und Zürich.
Riedl, Rupert (1980), Biologie der Erkenntnis. Die stammesgeschichtlichen Grundlagen der Vernunft. Berlin und Hamburg.
Lumsden, Charles und Edward O. Wilson (1981), Genes, Mind, and Culture: The Coevolutionary Process. Cambridge, Mass. und London.
Riedl, Rupert (1986), Begriff und Welt. Biologische Grundlagen des Erkennens und Begreifens. Berlin und Hamburg.
Marler, Peter (1970 a), „A Comparative Approach to Vocal Learning: Song Development in WhiteCrowned Sparrows“. Journal of Comparative and Physiological Psychology 71: 1⫺25.
Riedl, Rupert und Franz M. Wuketits (eds.) (1987), Die Evolutionäre Erkenntnistheorie. Bedingungen, Lösungen, Kontroversen. Berlin und Hamburg.
Marler, Peter (1970 b), „Birdsong and Speech Development: Could There Be Parallels?“ American Scientist 58: 669⫺673.
Starck, Dietrich (1979), „Die Phylogenese der menschlichen Sprachwerkzeuge als Voraussetzung der Sprachevolution“. Zeitschrift für zoologische Systematik und Evolutionsforschung 17: 249⫺261.
548
III. Arten der Semiose
Tembrock, Günter (1983), „Ethologie und Anthropogenese“. Das Altertum 4: 208⫺215. Tinbergen, Niko (1972), Instinktlehre. Vergleichende Erforschung angeborenen Verhaltens. Berlin und Hamburg. Uexküll, Jakob von (1973), Theoretische Biologie. Frankfurt a. M. Vogel, Christian (1987), „Evolution des Menschen.“ In: Rolf Siewing (ed.), Evolution. Bedingungen ⫺ Resultate ⫺ Konsequenzen. 3. Aufl. Stuttgart und New York: 415⫺452. Vollmer, Gerhard (1985⫺86), Was können wir wissen? 2 Bände. Stuttgart. Wandruszka, Mario (1981), Die Mehrsprachigkeit des Menschen. München. Whorf, Benjamin L. (1963), Sprache, Denken, Wirklichkeit. Reinbek. Wind, Jan (1976), „Phylogeny of the Human Vocal Tract“. Annals of the New York Academy of Sciences 280: 612⫺630. Wind, Jan (1981), „Primatenevolution und Sprachursprung“. Nova Acta Leopoldina 245: 791⫺800. Wind, Jan (1983), „Primate Evolution and the Emergence of Speech“. In: Eric de Grolier (ed.),
Glossogenetics: The Origin and Evolution of Language. Chur, London, Paris, Utrecht und New York: 15⫺35. Wuketits, Franz M. (1985 a), „Soziobiologie und Evolution des Menschen“. Biologie in unserer Zeit 15: 16⫺23. Wuketits, Franz M. (1985 b), Zustand und Bewußtsein. Leben als biophilosophische Synthese. Hamburg. Wuketits, Franz M. (1986), „Evolution as a Cognition Process: Towards an Evolutionary Epistemology“. Biology and Philosophy 1: 191⫺206. Wuketits, Franz M. (1988 a), Evolutionstheorien. Historische Voraussetzungen, Positionen, Kritik. Darmstadt. Wuketits, Franz M. (1988 b), Jenseits von Zufall und Notwendigkeit. Biologische und kulturelle Evolution des Menschen. Basel. Wuketits, Franz M. (1989), Grundriß der Evolutionstheorie. 2. Aufl. Darmstadt. Wuketits, Franz M. (1990), Evolutionary Epistemology and its Implications for Humankind. New York.
Franz M. Wuketits, Wien (Österreich)
26. Machine semiosis 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13.
1.
Introduction Machines as representamens Machines as interpretants A history of computer based signs Formal semantics of programming languages Operational semantics The implementation of programs The formal correctness of programs Domain orientation and correctness Further perspectives Human-Computer Interaction (HCI) Conclusion and speculations Selected references
Introduction
“Machine semiosis” denotes the semiotic processes that take place inside machines, between machines, and between them and their human users. In treating this subject we have to be very strict in our definitions, because we are trying to transfer a concept ⫺ that of semiosis, which was originally meant to describe typically human behavior (cf. Art. 25)
⫺ to cover also non-human behavior. So what is a machine and what is semiosis? According to the Concise Oxford Dictionary, a machine is an “apparatus for applying mechanical power, having several parts each with definite function (the part often being specified, as ‘sewing’, ‘printing’)”. An apparatus in its turn is defined as “mechanical requisites, an appliance, for doing something; organs by which natural processes are carried on”. As attested by this dictionary definition, machines must have a certain functional complexity (several parts) and differentiation (with definite function) and they must have a purpose (for doing something). Therefore, neither tools (too simple) nor chemicals (not sufficiently differentiated) are machines. Finally, living beings are not machines, since they are not designed by a human person and do not exist for a particular man-made purpose; they simply exist (Maturana and Varela 1980): the purpose of a hammer is to force a nail into something, but what is the technical rationality of a cat?
26. Machine semiosis
As for the notion of semiosis, we use the standard of this Handbook (cf. Art. 1 § 2.): “We therefore stipulate that the following is a necessary and sufficient condition for something to be a semiosis […]: A interprets B as representing C. In this relational characterization of semiosis, A is the interpreter, B is some object, property, relation, event, or state of affairs, and C is the meaning that A assigns to B.” However, we shall give the definition a Peircean twist, where A is viewed as a sign ⫺ the interpretant ⫺ that some interpreter uses to relate B ⫺ the representamen ⫺ to C ⫺ the object. Our discussion of machine semiosis concerns the roles machines can play in semiosis: we know they can be objects of signs, but can they be representamens and interpretants?
2.
Machines as representamens
Rossi-Landi (Rossi-Landi 1975, 1992) is probably the semiotician to have argued most vehemently in favor of a homology between tools and signs: tools and machines are signifiers that signify their use. Posner (1989: 24) reaches the same conclusion in discussing a semiotic approach to anthropology: “[…] all artificially produced instruments whose form signifies their function to the members of a culture can be regarded as texts of that culture.” Functional decomposition according to the means and ends of complex machinery is advocated by Lind (1990) as a useful representation for operators, complementing the traditional cause-effect engineering diagrams. If we use Eco’s suggestion (Eco 1977: 7) that a sign is everything that can be used to tell a lie, then tools and machinery can clearly be signs. The ceremonial axes mentioned in Posner 1989 are not axes since they cannot hew, but they stand for real axes. Rossi-Landi (1992: 221 ff) distinguishes five main levels of units (“parking lots of artifacts”): (1) Matteremes (⬇ phonemes): a limited set of basic operations man can perform on nature (pulling, adding, scraping, …) that have no use in themselves, but are used as building blocks for all other levels (RossiLandi 1992: 194); (2) Objectemes (⬇ morphemes): the smallest combinations of matteremes with a significance ⫺ a function. For example the head of a hammer consists in a face (for hammering), a peen (for extracting nails)
549 and an eye (for fastening the handle) (Rossi-Landi 1992: 197); (3) Utensils (⬇ sentences): the smallest units that lend themselves “to uses or working processes which are complete in their turn”. Utensils differ from objectemes in that objectemes are not used alone and therefore do not have an end in themselves; they are only instrumental parts for constructing higher level artifacts. In opposition, utensils are the smallest units that have a use in a real working process (Rossi-Landi 1992: 206); (4) Mechanisms (⬇ syllogisms): the smallest units whose use is already present or anticipated in its structure. Mechanisms differ from utensils in the number of uses they can be put to: whereas a hammer can be used in many working processes, looms can only be used for weaving. The worker is still necessary, but sometimes he is merely required for starting and stopping the process; (5) Automated machines: this is the level where artifacts are able to totally substitute the worker in the working process. Automated machines thus incarnate the whole working process: planning, execution, and monitoring (Rossi-Landi 1992: 215). There is no separate linguistic analogy, since “at this level of automation material and linguistic production are reunited” (Rossi-Landi 1992: 216). Although the analysis of artifacts as signcomplexes is feasible, we cannot conclude, as Rossi-Landi does, that artifacts form a similar hierarchy of levels as do the verbal signs (cf. Art. 2 § 3.). This is an empirical question. For example, the existence of matteremes seems rather dubious. In order to prove the existence of a mattereme m, it must pass the commutation test (cf. Art. 4 § 4.), which means that we must have minimal pairs of artifacts differing only in possessing and not possessing m, and with clearly different uses. Consider for example a pair of scissors. It can be turned into a knife by removing one of the legs, and turning the remaining eye into a handle. Neither qualifies as a mattereme, and in addition we had to make two changes, not one. This case is probably typical for the simple reason that utensils are subject to more severe physical constraints than words when used to signify something. Words are arbi-
550
III. Arten der Semiose
trary signs and can be constructed with little regard to the actual physical shape of their referent, whereas utensils must perform the operation they denote. “Horse” and “cheval” are equally good for denoting the same animal, but neither Englishmen nor Frenchmen can use a rubber band as scissors. Like many pictures, utensils may lack the first articulation, being directly composed of objectemes. The existence of objectemes, in contrast, seems obvious, at least in industrial production, where tools are often assembled of many parts with separate functions, which are in fact manufactured in different factories. However, there is still a problem with identifying them. One possibility would be to call upon language to help: only those parts of utensils that can be named by members of the culture are objectemes. We suspect that this is really the most popular method, but it does not support the theory of tools as signcomplexes, since it places the tool in the position of object, not representamen. In order to remain consistent with the theory, we must exchange one objecteme with another, and observe the change of physical use, not the verbal behavior. Using this correct methodology will probably be difficult, since only very few combinations of objectemes make sense at all. The differentiation between utensils and mechanisms can be defined by means of the relation they contract to actions. Whereas a utensil is presupposed (one-headed arrow) by a paradigm of actions (a hammer can be used for a long list of work processes), a mechanism is solidary (two-headed arrow) with only one type of action (cf. Fig. 26.1 and 26.2, see Andersen 1990 for task analyses of this kind based on glossematics). A similar functional differentiation emerges if we record events during the work process itself: we then find that the action is dependent upon a solidarity between utensil
Action Artifact
Action Action Action
Fig. 26.1: Utensils are presupposed by a paradigm of work processes.
Action
Artifact
Fig. 26.2: Mechanisms are solidary with one type of work processes.
and worker in handicraft work (a particular action requires the joint presence of both), whereas in industrial production the solidarity holds between mechanism and action. One can say that action and worker change place in the work structure (cf. Fig. 26.3 and 26.4): “The worker has gone outside of himself, he has inscribed himself in nature, he has ordered her to guide his own working steps.” (Rossi-Landi 1992: 209).
Artifact
Worker
Action Fig. 26.3: Utensils in handicraft. Action subordinate to a solidarity between artifact and worker.
Artifact
Action
Worker Fig. 26.4: Mechanisms in industrial production. Worker subordinate to a solidarity between artifact and action.
If we take a closer look at a concrete artifact it appears that we need to broaden the task analysis into a full-fledged narrative analysis. Take for example a hedge-trimmer (Fig. 26.5). The hedge-trimmer is a mechanism since it can only be used for cutting hedges, and does the cutting itself, but it resembles utensils in that the operator must be present all the time. It consists of easily definable objectemes, namely two handles (for grasping), a button (for stopping and starting), a shield (for protecting the operator from the blades), and the blades.
551
26. Machine semiosis
shield handle
scissor button Fig. 26.5: The objectemes of a hedge-trimmer.
The dependencies are as follows: we can grasp the trimmer without cutting, but not conversely. When we grasp it, we can press the button and make it cut. Pressing and cutting are solidary, since it stops cutting when we release the button (Fig. 26.6).
Grasping
Cutting
Pressing
Fig. 26.6: The syntax of hedge-trimming.
Fig. 26.6 depicts the smallest work process we do with a hedge-trimmer, and since its components (grasping and pressing) do not count as independent work processes, the parts that enable them (handle and button) are not utensils but objectemes. But what about the shield? The shield can only be interpreted if we unfold Fig. 26.6 into a real narrative of hedge-trimming, since the function of the shield is to prevent the operator from cutting himself. The story will have a goal we want to achieve (cutting), there will be a hero (the operator), a helper (the trimmer) and an antagonist (which is also the trimmer). Like all mechanisms, the trimmer is thus both helpful and dangerous, as attested in any law on worker safety (for a narrative approach to the design of artifacts, see § 11.). In order to design mechanisms that are more helpful than dangerous, we need to enact small narratives of possible trimmingevents, to identify harmful side-effects, and to add objectemes (e. g., the shield) that counteract possible tragedies.
Whereas Rossi-Landi’s approach seems sensible for levels 1⫺4, he is seriously mistaken regarding level 5. This level does not form a continuation of the preceding levels, but represents a whole new ladder. This is obvious alone from the fact that levels 2⫺4 are replicated in computers: modern computer systems are normally built by means of software libraries (computerized objectemes), and encompass utensils as well as mechanisms. For example, word processors, drawing programs, and spreadsheets must be classified as utensils, whereas large number-crunching systems (like economic simulators) or process control systems are mechanisms. Although Rossi-Landi recognizes that the hierarchies of language and artifacts merge in automatic machines, he has not grasped the fundamental change, namely that software ⫺ sign complexes ⫺ now defines the “machine” and that the hardware ⫺ the physical machine ⫺ plays a subordinate role: if you know that the software is Microsoft Word and not Word Perfect you can make detailed predictions about the work process, whereas you can make no predictions from the fact that the user employs an IBM system and not a Macintosh. Thus, the functional coherences in the work process have shifted from the physical machine to the sign system controlling it, and work has become symbolic work. It no longer consists of a socio-biological coupling, but of a socio-psychic coupling (Fig. 26.7 and 26.8). If we do not recognize this fundamental difference, we cannot understand the current revolution effected by the introduction of information technology: the essence of the information age is that interaction in the “biosphere” is replaced by interaction in the “semiosphere” (Lotman 1990). In order to emphasize the difference, let us make an informal analysis of a washing ma-
Sign system
Worker
Hardware
Action
Fig. 26.7: Computerized utensils in handicraft.
552
III. Arten der Semiose
Sign system
Action
Hardware
Worker
tion systems means that a real sign comes to occupy the position previously possessed by the physical machine which thereby forfeits some of its former importance.
3.
Fig. 26.8: Computerized automatic machines in industrial production.
Design: push-buttons R
I Manual
?
pump, motor, wiring
O Function: washing process
Fig. 26.9: Analysis of a washing-machine.
chine, and later compare it to a similar analysis of a computer system (§ 7.). The panel of the machine is a representamen (R) whose object is various kinds of functions (O): hot intensive wash, normal wash, wool-wash, etc. We do have a sign, since the panel can lie: the user rightly feels cheated if his lambswool sweater is reduced to half size despite his pressing the wool-wash button. As shown in Fig. 26.9, the buttons and the washing process are related in two ways: the manual is an interpretant describing the relation between buttons and washing, at least according to the intention of the manufacturer. The wiring, motor and pump of the machine can be viewed as another way of relating buttons to washing. This relation is causal, not intentional, since the washing machine does not care about the sweater. Whereas the manual is an intentional interpretant, the machinery could be said to form a causal interpretant. However, as the question-mark in Fig. 26.9 indicates, it is not clear whether we should call the machinery an interpretant at all, since pumps, motors and tubes are definitely not signs, although they do react to the buttons. The unique difference between mechanical machines and computers is that computers have a genuine causal interpretant, namely the compiler and run-time system. The transition from mechanical machines to informa-
Machines as interpretants
We shall now turn to Rossi-Landi’s level 5, the automated machines, and in particular computer systems. Computer systems can truly be called “semiotic machines”, since ⫺ as we shall later see in detail ⫺ they are built and used solely by means of signs. Semiotic treatment of computer systems can be found in Andersen (1990, 1991, 1992, 1993, 1995), Brandt (1993), Decle´s (1989), Figge (1991), Gorn (1968), Hasle (1993), Holmqvist et al. (1996), Nadin (1988), Piotrowski (1990 and 1993), Rasmussen (1986), Stamper (1973, 1991, 1992), and Zemanek (1966). We have already seen that tools and machines act as signs for their human users: but how should we tackle machines that seem to respond to signs? Should we place machines in the interpreter role? We often do that in colloquial speech when we talk of computers. The following interpretations were made spontaneously by a librarian while using her computer system. She clearly anthropomorphizes her machine using words like ask, answer, comment, know, want: (1) Well, then it asks for the number of my borrower’s card. (2) Here I become uncertain because it answers differently from what I expect it to do. (3) What it did now was that it dropped the connection, […] without further comments. (4) It means somehow that it knows itself what it should do. (5) [What is wrong with number 8, why is that an error?] Apparently it doesn’t want to make requisitions. According to her, semiosis naturally takes place inside her system, but is this scientifically tenable? After all, in other cases we often deviate from colloquial speech in scientific statements. Although everybody talks about a “sunrise”, we know from school that the earth, not the sun, moves. Can statements like “The computer (A) interprets the input (B) as representing a command (C)” be taken
553
26. Machine semiosis
to be a scientific statement? Or should they be rewritten as “The programmer (A) interprets the user-input (B) as representing a wish of the user to issue a command (C); the user (A) interprets the output (B) as representing a request from the programmer that the user input the data (C)”? Let us first consider two simple kinds of machine semioses. In both cases we assume that we can put data into the computer, which responds by writing, or drawing on the screen, or activating the loudspeaker. Meaning is assigned to the initial state, the process, and the final state. Thus, the representamen consists of three parts that as a whole are assigned a meaning. But how and by whom is this accomplished? Example 1. So-called direct manipulation programs often allow the user to use the mouse to “drag” objects across on the screen.
Fig. 26.10: Initial state of dragging.
As Fig. 26.10 and 26.11 show, I can move the cursor over the document, press the button, and move the mouse to the folder. The document follows the mouse until I release the button. The result is as shown in Fig. 26.11.
Fig. 26.11: Final state of dragging.
The initial and final states mean “a desktop” with folders and documents. The process means a change of location of the document. The relation between initial and final state is meaningful, because I can interpret the whole process as “I move the document”. My actions are interpreted as a physical cause of the changes on the screen. Example 2. The relation between input and output can be interpreted quite differently. Consider the following input and output pairs in Fig. 26.12.
Fig. 26.12: Example of input and output pairs. Lines preceded by “?” are typed by the user; lines without are written by the system.
My inputs are interpreted as questions, the outputs as answers, and the relation between the two as logical inferences depending on a database. The stream of alternating inputs and outputs is a representamen (B) which the user (A) tries to interpret. The object of the sign is the user’s interpretation (C), which in our two cases could either be an instance of physical causation or a logical inference. In both cases there is a gap between inputs and outputs that the users do not see. The gap is of course specified in a program, but since users do not see it they are ignorant of how input and output are related technically. Therefore they make qualified guesses, since humans are compulsory creators of meaning. This is what the librarian did. In our two examples, the gaps are filled by very simple pieces of code inside the computer. The document can be dragged by means of a program code that keeps recording the location of the mouse and adds the x and y-displacements to the x and y coordinates of the document. This code interprets the computer as a two-dimensional space where objects are located and change location. The logic example presents a different interpretation. The program is written in Prolog, which interprets data processing as logical inferences. It contains one hypothetical statement (major premise) and one categorical statement (minor premise):
Fig. 26.13: How to reason about Socrates.
554
III. Arten der Semiose
The examples show that not only input/ output pairs, but also the ‘hidden’ program are interpretable signs. A program expresses a specific interpretation of the machine, the data processing, and the domain of application. Theoretically, these interpretations can exist in three interpreters: (1) The user clearly creates them on the basis of what he sees and hears. (2) The programmer intends them. (3) But can the machine be said to have them too? (1) and (2) are obviously true; can we discard (3) as ‘folk psychology’? If so, the computer would be a medium, a sign-vehicle with as little knowledge of the meaning of the signs as a telephone line. Unlike telephones, computers are able to effect physical formal transformations of the signals, but that is all there is to it: they have no inherent semantics (Fig. 26.14).
S (F)
S (I) S I (initial state)
Thus the problem is not easily dismissed, particularly as we in fact meet it in other domains ⫺ for example, literature. If all the semantics of the novel Treasure Island is generated by the reader, then we should expect readings to show no constancy whatsoever, as they depend upon each reader’s background. But they do show constant elements. On the other hand, if all the meaning resides in the novel, then all readers ought to produce identical readings. But the history of literary criticism shows that readings change. Perhaps we should understand the inherent semantics of novels and computer systems as mechanisms that delimit the possible readings, but do not completely determine a unique one? The distinction between preferred readings, negotiated readings and oppositional readings seems relevant here: the preferred readings are the ‘proper’ readings intended by the author/programmer, the negotiated readings are local adaptations within the norm (the normal user, e. g., our
S P (transformation)
User or programmer
S F (final Computer state)
Fig. 26.14: Basic components of computer semiosis.
The lower transformation P is purely mechanical, but is designed in such a way that user and programmer can make an interpretation S, such that S(P)[S(I)] ⫽ S(P(I)) ⫽ S(F), that is: applying the interpretation of P (e. g., moving an object) to the interpretation of I (e. g., a folder) is equal to the interpretation of the result of applying P to I (e. g., a new location of the folder on the desktop). This is simply a recipe for creating consistent illusions! S in this context is the analogue of Peirce’s interpretant. The problem with this approach is simply that there is a huge literature on the formal semantics of programming languages that makes perfect sense. If Fig. 26.14 depicts all there is to it, this ought not to be the case! We shall take a further look at this literature ⫺ in particular the function P ⫺ in §§ 6 ff.
librarian), and the oppositional readings are consciously subversive and disloyal readings (hackers’ interpretations). One could say that the formal semantics belongs to the category of ‘proper, preferred’ readings, whereas the readings of the librarian are of the ‘negotiated’ kind. The question remains, however, of why it is so difficult to establish a contract concerning the interpretation of computer systems. Why do we so easily come to attribute an inherent semiosis to computers? Two characteristics of computer-based signs can help explain this. i. Computer-based signs have a larger iconic range than other signs. Computer-based signs possess four main classes of expression features: permanent, transient, handling, and action features. Like pictures and texts, they utilize features that do not change in time (for example, the docu-
555
26. Machine semiosis
ment shape in Fig. 26.11); like film and video, they also exploit features that do change (for example, the location or ‘highlight’ of documents in Fig. 26.11). But unlike any other signs, they can be handled by the user and respond in a meaningful way (Fig. 26.13). Pictures can only represent states iconically ⫺ that is, they can only simulate the visual impressions we get when we remain immobile. Film adds the possibility of iconic representations of the perceptions received by a moving body: the tilting and panning, traveling camera. But neither medium can create icons of us interacting with other minds or bodies, and this is precisely what computerbased signs can do: their increased iconic range consists in providing icons of our interaction with our environment. Artificial Intelligence (AI; see Fig. 26.13) creates icons of our interaction with our minds, whereas virtual reality takes care of our interaction with three-dimensional space. ii. Computer-based signs can create some of their physical referents. Although normal signs can create social referents (a marriage, an appointment, an academic degree), they certainly cannot create physical referents. Uttering the word cake does not produce a strawberry pie. But in an increasing number of cases computer-based signs can do exactly this. It is for example possible to draw a physical object in a CADprogram, push a button, wait a few minutes, and then have a metal or plastic replica in one’s hand. This was called “magic” a few hundred years ago. No wonder we sometimes confuse the map with the landscape.
4.
A history of computer-based signs
On the history of computer-based signs, see, e. g., Mainzer (1990) and Christensen (1993); cf. also Art. 78 § 5. To some degree, the history of computer systems is a history of their sign-function S. Signs must exist physically (B), they must stand for something other than themselves (C), and the relation between representamen and object must be related by laws and conventions and cause reactions in the interpreter (A). In addition, signs must be communicable, and they must be used by a social group of people for managing and co-ordinating the affairs of daily life. In their infancy in the 1940’s, the computer-based signs lacked most of these prop-
erties, and in fact could hardly be classified as signs at all. Invention of higher programming languages, beginning with the construction of assemblers, caused the object of program texts to change from the physical machine to the domain of application. The object of the assembler code below is the machine itself: registers, numbers ⫺ and the code itself (“jmp mloop” means that the program should return to the line named “mloop”):
Fig. 26.15: Assembly program.
By contrast, the next text, written in object-oriented notation, is interpretable as a description of an item in the application domain of the program, a bank account:
Fig. 26.16: Object-oriented program.
Whereas older programs referred to storage cells and registers, modern programs can be read as assertions about wages, addresses, and positions. This was achieved by creating layers of signs in the systems. The lower levels are still about the machine, but the higher levels concern the application domain. Higher levels are translated into lower levels (cf. § 7.; see also Art. 19, Art. 21 § 4. and Art. 174). Thus, the layers we can identify from a synchronic perspective have a diachronic explanation. They are like geological sediments, the upper ones being younger than the lower ones (Fig. 26.17). The historical process is often one of accumulation: although the older layers are modi-
556
III. Arten der Semiose
level
put, but with real-time interactive systems the physical handling of the system became a decisive factor in the interpretative process. In modern object-oriented programming, in particular the concurrent type, the basic division of a system is not between passive data and an active algorithm; instead, the basic building blocks are now objects consisting of cohering data and operations that can be handled by other objects or by users. The typical object of a system became the interactor (Andersen 1990) which consists of four central types of features mentioned in § 3.: (1) permanent, stable features, (2) transient, changeable features, (3) action features enabling the sign to influence itself and other signs, and (4) handling features enabling the user to influence the sign (cf. the example in Fig. 26.10 and 26.11). Only when this happens does the computer-based sign acquire the special characteristics that set it apart from all other known kinds of signs. Hypertext is a good example of this transition; although prophesied by Vannevar Bush as early as 1945, hypertext first appeared for the public in the 1980’s. Hypertext can be described as a computerbased version of a paper-based text, but hypertext can only function in an electronic environment adding handling and action features to the passive paper (cf. Andersen and Øhrstrøm 1994). Like all other signs, computer-based signs need to be physically communicated in order to reach their interpreters, but the digital messages had to stay within their plastic shells until the beginning of the 80’s. Only with the advent of digital telephone networks and local area networks did the computerbased signs come of age and were given the same traveling opportunities as their older relatives. Before that, computer-based signs were half-caste signs that had to be converted to other media, e. g., paper or tape, before being able to enter into a communicative process. Information technology became a general communication and management tool ⫺ as witnessed by the expanding discipline of information resources management. This is probably one of the most important and difficult phases in the maturation of the computer-based sign, a phase that only began in the 80’s and has not ended yet. Basically, sign systems are social phenomena, and computer-based signs first achieve the status of a true sign-system when they be-
Pascal assembler machine language time Fig. 26.17: Machine levels deposited in the historical process.
fied, they are still present (cf. Art. 14 § 2.). Users of software know this process as backward compatibility: new versions of a piece of software must of course offer new facilities, but in addition they must be able to handle the data produced by the older versions (similar relations between synchrony and diachrony have in fact been hypothesized in the domain of language, cf. Lightfoot 1979). This change is expressed in the heading “From data production to information handling” (Christensen 1993). By “data” is meant a formalized representamen of such nature that it can be communicated and transformed by means of a mechanical process ⫺ our B. By “information” is meant the human interpretation of data, based on a convention ⫺ our C. In the beginning, much effort was spent on designing the algorithms for producing the representamen, and less energy devoted to ensure that users were able to produce the relevant interpretants. Christensen argues that business needs knowledge, but that data in itself does not impart knowledge. The growing emphasis on object and interpretant means that the systems are required to ‘be about’ relevant issues, and that the computerbased signs must elicit relevant responses in their context of use. However, awareness of this issue first emerged in the mid-1980’s. The development of the handling features of computer-based signs (cf. § 3.) was caused by the need for new updated information. Early batch systems had a clean division between input, process, and output (a very simple example of this is given in § 5.). Input and output were seen as passive, manipulable objects that were transformed by an active, immutable program ⫺ a machine that consumes and produces data in the same manner as a factory consuming meat and producing canned beef. Users only saw the paper out-
557
26. Machine semiosis
come embedded into an organisation and are extensively used for practical daily communication and co-ordination. Since communication is an important part of organisations, change of communication means change of the organisation.
5.
Formal semantics of programming languages
In § 3. we raised the question of whether machines can be said to be interpreters of signs. We pointed to the existence of formal semantics for programming languages as evidence that at least the computer machine should be so conceived, and we will now take a closer look at this kind of semantics (cf. Bird 1976, Boyer and Moore 1981, Burstall 1974, Clark and Cowell 1976, de Bakker 1980, Hoare 1969, Parikh 1985 as well as Art. 3 § 7.). Formal semantics for programming languages is subdivided into three major areas: operational semantics, axiomatic semantics, and denotational semantics (cf. Art. 78 § 5.). Furthermore, temporal logic (Emerson 1990, Stirling 1992) may be applied within each of these areas, and constitutes a separate approach sufficiently important for singling it out in its own right. We shall focus exclusively on operational semantics, which is the simplest and most intuitive kind of formal semantics. It is formulated in relation to what actually goes on in a computer, whereas the other and more abstract semantic systems are
entirely independent of the notion of a machine. Operational semantics is, however, sufficient for making our semiotical points. Along the way, we shall omit a few formal details, which do not bear on the understanding and would be tedious to explain. Consider the program in Fig. 26.18, which computes the greatest common denominator (GCD) of two natural numbers A and B; when the program terminates, A ⫽ GCD of the two original input values. This kind of program is called a “flowchart-program”. It consists of an ordered sequence of instructions, each instruction having a unique label attached to it. The instructions themselves belong mainly to one of three forms: (1) assignment sentences of the form A := B, (2) selection sentences of the form if (condition) then goto Lj else goto Lk, (3) jump statements of the form goto L. Furthermore, there are some special instructions for input/output (L1⫺2, L10), starting (L0) and ending (L11). L11 is called a “terminal label”; when it is reached, program execution stops. Finally, assignments may be of a form more complicated than (1) (cf. L8). Now this sequence of instructions does not require the presence of a physical computer for its use in the first place; it can be carried out by a human being, using for instance pen and paper. It is no coincidence that the lan-
Fig. 26.18: Program computing the greatest common denominator.
558
III. Arten der Semiose
guage is of a form intelligible to a competent user of a human language, in this case English. Clearly program texts are also aimed at human interpreters. These facts reflect some of our observations in § 5.: the historical development of programming languages is to some degree a history of the development of their sign functions. Flowchart programs are in their immediate logic still very close to the machine and the assembly level; compare the above program with the assembler code in § 4. (Fig. 26.15). In order to carry out the program, one would need to keep track of two things: (1) where are we currently (at which label), and (2) what are the current values of the variables involved. This combined knowledge is called a “configuration”. For example, let us see how the program works for two input values A ⫽ 28 and B ⫽ 35. We may assume that initially some arbitrary (and unknown)
Program step
A
B
C
L0 L1 L2 L3 L4 L5 L6 L7 L8 L9 L3 L4 L5 L6 L7 L8 L9 L3 L4 L8 L9 L3 L4 L8 L9 L3 L10 L11
? 28 28 28 28 28 35 35 7 7 7 7 7 28 28 21 21 21 21 14 14 14 14 7 7 7 7 7
? ? 35 35 35 35 35 28 28 28 28 28 28 28 7 7 7 7 7 7 7 7 7 7 7 7 7 7
? ? ? ? ? 28 28 28 ⫺ ⫺ ⫺ ⫺ 7 7 7 ⫺ ⫺ ⫺ ⫺ ⫺ ⫺ ⫺ ⫺ ⫺ ⫺ ⫺ ⫺ ⫺
Fig. 26.19: An execution sequence of the program in Fig. 26.18.
natural number value, denoted by “?”, is assigned to all integer variables. Then one could keep track of the configuration sequence as indicated by the schema in Fig. 26.19. This figure establishes an execution sequence ⫺ a sequence of configurations occurring when applying the program to relevant input values. All the notions involved in these observations are of a fairly common-sensical nature. Operational semantics is a straightforward mathematization of this intuitive understanding of the meaning of programs. But before going into technicalities, the meaning of the GCD-program may be specified in quasi-natural language as follows: For any pair of natural numbers A and B, the program should compute the greatest common denominator (GCD) of A and B; when the program terminates, A ⫽ GCD. The specification links the program text to its input-output function (“I/O-function” for short) ⫺ that is, the relation between possible inputs and resulting outputs as established by this program. This is equivalent to linking the program text to its set of possible executions, as we shall see. Therefore, we have here identified a sign relation: the program text is the representamen, the specification is an interpretant, and the I/O-function (or the set of possible executions) is the object (see Fig. 26.20).
program text R
I specification
O I/O-function
Fig. 26.20: The specification as an interpretant of the program text.
The specification interpretant is intentional since it defines the purpose of the program. However, as we shall see in § 7., the unique nature of computer systems consists in the possibility of adding a causal interpretant that relates program text to I/O-function in the same way as the specification.
559
26. Machine semiosis
6.
Operational semantics
A :⫽ A⫺B. The set F is to contain for each operation identifier F a function
Formal operational semantics (cf. Art. 3 § 7.2.) is built upon the common-sensical notions introduced above. Its essential idea is to describe for any given program its set of possible executions. To achieve this, we need the idea of an abstract machine (only at a later stage will we be interested in some specific actual machine). This reflects the point made in § 2. about the importance of the sign system as opposed to the physical hardware. Let there be an abstract machine
FM: V → V,
M ⫽ *X,Y,V,I,O, F, T +, where X is the set of possible inputs, Y is the set of possible outputs, V is the memory of M, I is the input function of M, O is the output function of M, F is a set of operation symbols, T is a set of test symbols.
The output function thus provides all values in v associated with the output set Y. According to our decision that v1⫽v(A), O will provide v1 in our current case. (These primitive input and output functions must not be confused with the afore-mentioned I/O-function established by the program as a whole ⫺ an exact definition of the latter one is offered below.) In an actual computer, all input ⫺ e. g., characters typed in from the keyboard ⫺ will be transformed into bit patterns, and in output operations bit patterns will be transformed into suitable representations on the screen; being presently concerned with an abstract machine and simple arithmetical problems we need not bother with such transformations here. We now turn our attention to the flowchart program. This one contains a number of language constructs, plus a set L of labels. Configurations can be defined formally as members of the set
Let us explain this in more detail. For the GCD-program, we saw that the expected input was two natural numbers, and the output was one natural number; therefore, in this case X ⫽ N ⫻ N, and Y ⫽ N. We also saw that it was necessary to keep track of the changing values of three variables, all of which constantly denote natural numbers. So, V ⫽ N ⫻ N ⫻ N, corresponding to the A, B, and C entries of Fig. 26.19. Since V is ordered, we can associate the A, B, and C variables with some specific component of V. To put it in a more machine-oriented phraseology, each variable is in any configuration uniquely associated with some specific “memory cell” of V: if V ⫽ *v1,v2,v3+ in a configuration C, then v(A) ⫽ v1, v(B) ⫽ v2, and v(C) ⫽ v3 in C. We also saw that the program contains various tests, as in A ⫽ B or A ⬍ B. We call these constructs “test identifiers”. The set T is to contain for each test identifier T a function TM: V → {true, false}. That is, TM ‘inspects’ the current values in V to see whether the test T is currently true or false ⫺ at the intuitive level, this was exactly what was done during the simulation of the GCD-program (cf. Fig. 26.19). Similarly, the program contains various operations, for instance assignment and substraction: A :⫽ B,
describing the transformation of the memory set which results from the execution of FM. Finally, I and O denote the ‘special operations’ of input and output. Since we are dealing with an abstract machine it is sufficient to define them as follows: I(x) ⫽ v, for all x 苸 X and some v 苸 V; O(v) ⫽ y, for all v 苸 V and some y 苸 Y.
L ⫻ V. An execution sequence is a sequence of configurations. This is a straightforward formalization of the intuitions embodied in Fig. 26.19: from that figure we can directly read an entire execution sequence (L0,*?,?,?+,(L1,*28,?,?+), (L2,*28,35,?+), (L3,*28,35,?+),(L4,*28,35,?+), (L5,*28,35,28+),…,…,(L11,*7,7,7+). Finally, we need to define a so-called transition function that specifies how transitions from one configuration to another take place; we shall symbolize this one by “쏡”. Thus the transition function is a function from configurations into configurations: 쏡: L ⫻ V → L ⫻ V We are now in a position to define exactly the formal operational semantics of flow-
560
III. Arten der Semiose
chart programs of the type studied so far. This is done on the basis of the previous definitions of (i) the abstract machine M, (ii) configurations, and (iii) the transition function. We define the exact type of transition associated with each type of program instruction, where “(Li,v)” denotes the given configuration before the instruction is carried out: 1. Syntax: Semantics: 2. Syntax: Semantics: 3. Syntax:
Li: F (Li,v) 쏡 (Li⫹1,FM(v)) Li: goto Lj (Li,v) 쏡 (Lj,v)
Li: if T then goto Lj else goto Lk Semantics: (Li,v) 쏡 (L,v), where L ⫽ Lj for TM(v) ⫽ true, and L ⫽ Lk for TM(v) ⫽ false. 4. Syntax: Li: a := b Semantics: (Li,*v1,…,vj,…,vn+)쏡 (Li⫹1,*v1,…,vj⫺1, v(b),vj⫹1, …,vn+), where a at any time denotes the value vj. Explanations (Concerning 1) If the configuration is (Li,v) before executing this instruction, then the next configuration resulting from the execution will be (Li⫹1,FM(v)). This means that the operation FM has been applied to the memory set, and we pass control to the next instruction. (Concerning 2) The instruction labelled “Lj” will be the next one to be carried out, and the memory set is unchanged. (Concerning 3) If T is evaluated as true, control is passed to Lj, otherwise it is passed to Lk, and in both cases the content of the memory is unchanged. (Concerning 4) Control is passed to Li⫹1, and the memory value associated with “a” is replaced by the memory value associated with “b” (which thus becomes also the value denoted by “a”). This is really just a special case of 1. By applying these rules mechanically, we can, for any given input, construct the exact execution sequence ⫺ the formal analogue of what we did on a more intuitive level in our simulation of the GCD-program. We can now formally define the I/O-function P (anticipated in § 3.) of any given flowchart program P:
P(x) ⫽ y ⇔def (L0,I(x)) 쏡* (L,v), where (i) L0 is the start label, (ii) L is a terminal label, (iii) O(v) ⫽ y. In general, the formula “C1 쏡* CN” means that in a finite number of program steps ⫺ corresponding to a finite number of applications of the transition function ⫺ the configuration C1 is transformed into CN. In operational semantics, P is regarded as the meaning of the program text P. This I/Ofunction is obviously defined in terms of the set of possible execution sequences of P, which are systematically described by the operational semantics for flowchart programs. Thus this operational semantics constitutes a system for the interpretation of flowchart programs. In our terms, the operational semantic system in its entirety is an interpretant that links the representamen (the program text) to its object, the set of possible executions (Fig. 26.21). program text R
I operational semantics
O I/O-function, execution sequences
Fig. 26.21: Operational semantics as an interpretant of a program text.
It must be emphasized that, in this system, the meaning of programs is seen strictly from a data perspective (rather than an information perspective): the meaning is a transformation of data, a mapping of input onto output. Therefore, we should in general only call it the “operational meaning of programs”.
7.
The implementation of programs
The operational semantics as described in the previous section is an abstract system to be used by human beings, and is not present as such in the machine. However, for any version of any actual programming language installed on a given machine there is indeed an
561
26. Machine semiosis
analogue of this kind of system. For instance, a Pascal system will be associated with a compiler and a run-time system. These together define the actual execution sequences carried out by any Pascal program on this computer ⫺ as well as the program’s general set of possible executions. Therefore, the computer itself does contain a concrete implementation of that interpretant which we have above presented as the abstract operational semantics. This constitutes yet another sign relation, which may be characterized as entirely internal to the computer (Fig. 26.22).
program text R
I operational semantics
I
compiler and run-time system
O I/O-function, execution sequences
Fig. 26.23: The double interpretants of program texts.
program text R
I compiler and run-time system
O I/O-function, execution sequences
Fig. 26.22: The compiler as a causal interpretant of the program text.
We can now also specify what is called the correctness of the implementation of a programming language by adjoining the sign relations of Figures 26.21 and 26.22. The implementation of a language L is the software system which makes it possible to run L-programs on a computer ⫺ for instance, a compiler and a run-time system. The implementation (compiler plus run-time system) is the causal interpretant mentioned in § 5. The implementation is said to be correct, if it realizes L exactly as prescribed by an independent specification of the semantics of the language. Such a specification may be stated in terms of an operational semantics for L. In semiotic terms, the implementation is correct if for all program texts in the relevant language the relation in Fig. 26.23 holds. That is to say, for all program texts the I/ O-functions actually realized by the compiler and run-time system must be identical with the corresponding I/O-functions as specified by the operational semantics. Fig. 26.23 shows the two interpretants characteristic of computer systems, the intentional one and the causal one. Compare Fig.
26.9, § 2., where we had a motor, tubes and pumps instead of the compiler. The causal interpretant in Fig. 26.23 is a virtual machine. For example, if L is Pascal, then the machine is a virtual Pascal machine. Since a Pascal text clearly can have an object different from itself, Fig. 26.23 depicts a semiosis. However, we cannot buy Pascal machines from a computer dealer. The available machines can only execute a much simpler kind of language called the “machine language”. The virtual machine (compiler and run-time system) must therefore be defined in terms of the machine language of a real causal interpretant ⫺ a real machine. The representamens of this causal interpretant are machine instructions; however, it is not clear if it makes sense to talk about semiosis any longer because representamen and object seem to merge at this level. To see this, let us rewrite the operational semantics from § 6. in a form closer to the hardware. We have a set of numbered memory cells M, where we store our program (P ⫽ c1…cn), instruction counter (L) and variables (V⫽ v1…vn). Thus, M ⫽ c1…cn ⫹ v1…vn, where underline symbolizes the current instruction. From a physical point of view, there is no difference between instructions and variables ⫺ both consist of strings of bits. Instructions are passed on to the processor, which responds by changing the cells or programcounter. Since the current instruction is itself a part of M, the semiosis at this level is in principle self-referential: each instruction changes a part of M, and since it is itself part of M, an instruction can change or produce itself (cf. the concept of autopoiesis in Matur-
562
III. Arten der Semiose
ana and Varela 1980). We have in fact already seen self-reference in Fig. 26.15 and Fig. 26.18, namely in goto-instructions that direct the program counter to another line. Self-referentiality is the secret of the power of computers. The causal interpretant can only respond to a very limited and simple set of instructions that refer to the machine itself. Interpretants based on domain concepts are not possible on this level, since they require higher-level languages. But how can one make a computer respond to a ‘foreign’ language? The solution is compilation: 1. We place the ‘foreign’ text in the variables P1…Pn (with M ⫽ c1…cm⫹P1…Pn; lowercase: machine instructions; uppercase: data) and execute a program (a compiler) consisting of machine instructions. The output of this program is itself a sequence of machine-instructions whose I/O-function is identical to that given in the specification (see above: M ⫽ c1…cm⫹p1…pr). 2. Then we move these instructions from the position of variables to the position of instructions and execute them using a new set of variables, V1…Vs, representing the input of our new program (M ⫽ p1…pr ⫹ V1…Vs)! The basic self-reference means that representamen and object are identical in the sense that any program line can refer to any program line, including itself. This again makes it doubtful if we can talk about signs any longer, at least according to the definition we started with.
8.
The formal correctness of programs
A specification is a description relating the program text to its set of possible executions by specifying what the program is supposed to accomplish. We have already seen an example of a specification in quasi-natural language, namely the one we stipulated for the GCD-program. When the specification is stated in mathematical terms, it provides a formal description of the relation in question. The systematical study of this kind of relation is a crucial discipline within theoretical computer science, and is known as “program verification”. Its main problem can be stated as follows: given a program text, how can we assure ourselves that the program is actually going to do that which it should do according to its specification? Formal semantics for programming languages provides us with a
tool which can be used for the systematical study of this problem. Consider again the GCD-program and its specification. We can render that specification in mathematical terms by specifying the input-conditions CI and the output conditions CO of the program as follows: CI ⫽ {x0 ⫽ A ∧ y0 ⫽ B ∧ A,B 苸 N} CO ⫽ {x0 mod A ⫽ 0 ∧ y0 mod A ⫽ 0 ∧ ∀x.x 苸 N. (x0 mod x ⫽ 0 ∧ y0 mod x ⫽ 0 ⇒ x ⱕ A)} The variables x0 and y0 are introduced to ‘remember’ the original input-values of the program; propositions of the form “X mod A ⫽ 0” say that A is a denominator of X, and the last condition of CO states that A is in fact the greatest common denominator of A and B (their original values). Finally, we have followed established conventions and enclosed the conditions in curly brackets. Observe that CO can also be seen as a predicate true of any number A fulfilling its conditions, and similarly for CI ⫺ a fact which we use in the formula (1) below. Now the criterion for the correctness of the program can be given by the following formula: (1) ∀x.x 苸 X,∀y.y 苸 Y: (CI(x) ∧ PM(x) ⫽ y) ⇒ CO(y). This formula makes reference to our operational semantics of § 8. as follows: X and Y are the sets specified in our abstract machine M, and PM is the I/O-function of the GCDprogram obtained by applying the operational semantics of flowchart programs to P (with reference to M). What the formula says is that for any input satisfying the conditions specified in CI, the output will satisfy the conditions CO ⫺ the latter condition telling us that the output will be the greatest common denominator of the two original input values. By using the laws of arithmetic and an inductive proof we could in fact show that the GCD-program satisfies (1), and is therefore correct with respect to its formal specification. Except for one subtle restriction, (1) provides us with a completely general criterion of program correctness. Let P be any program in a language with an operational semantics, a suitable abstract machine M, and CI and CO as the respective input and output conditions for P; then the validity of (1) implies the correctness of P.
563
26. Machine semiosis
The restriction to this definition is that we should in fact have been talking about partial correctness all along. Our formalism can only express that a program is correct if in the course of execution it will eventually reach a terminal label; but operational semantics does not provide the linguistic means for expressing this presupposed condition of (total) correctness. The distinction may seem subtle, but is actually simple: here, we are dealing with a temporal relation, and classical logic has nothing to say on time and processes. This is the reason why temporal logic was mentioned in the very beginning of § 5., for there is a modern logical language in which time, change and processes can indeed be expressed (see Øhrstrøm and Hasle 1995). Formulae similar to CI and CO can be couched in temporal logic such as to express that a state satisfying CO will in time be reached from a previous state satisfying CI. A proof of that relation is then an immediate proof of total correctness. For these reasons temporal logic is being avidly studied within theoretical computer science. Moreover, temporal logic is also especially interesting in our semiotic context, since temporal signs are highly important in machine semiosis (see § 11.). Nevertheless, a proper understanding of the temporal semantics for programming languages presupposes operational semantics, so an exhaustive treatment of the former must await future work, and we return presently to dealing with the latter. In the following, operational correctness is understood to be in this sense only partial. Program verification lends itself to a semiotical interpretation in an obvious manner. Once again, we see the program text as the
program text R
I formal specification
I
compiler and run-time system
O I/O-function, execution sequences
Fig. 26.24: Semiotical characterization of operational program correctness.
representamen, the set of possible executions as its object, and the formal program specification as the interpretant. If we adjoin this sign relation to the diagram in Fig. 26.23, we obtain the semiotical characterization of operational program correctness (see Fig. 26.24). For the sake of simplicity, we presuppose that the implementation of the language is correct, cf. Fig. 26.23. Observe that we have restricted this definition to operational correctness. For it is an obvious semiotical observation that this notion of correctness is really not sufficient ⫺ full correctness also involves a relation of the program to a domain (at least). We shall devote the next section to some observations on this issue.
9.
Domain orientation and correctness
In § 5. we gave an example of a piece of program text, the “class account”, in what is known as “object-oriented notation”. It was pointed out that this segment of the program text can be interpreted as referring to an application domain, in this example, a domain of bank accounts. In fact, the class account also itself contained a reference to another type of entities in the relevant domain, namely persons. More accurately, we perhaps ought to speak of customers instead; not all persons are relevant as holders of accounts in any specific bank system, but on the other hand, some account-holders may be non- or super-personal ⫺ obvious examples being organizations and institutions. We point out these considerations explicitly, because they clearly show that we are analyzing a domain rather than merely contemplating a simple transformation of data. To be able to express concisely entities and relations within a domain, we need languages more structured than flowchart languages. Object-oriented languages are designed for this purpose, and are to be placed at the higher end of high level languages. We identified this shift of perspective in programming languages away from dataprocessing and towards information handling as a major motivation in the development of programming languages. Technically, there is nothing we can do with an object-oriented language which could not also be done in the flowchart language; but the whole point of introducing ever more structured and expressive languages is precisely to
564
III. Arten der Semiose
support (and almost compel) programmers towards focusing on the domain rather than the data-processing. This kind of observation corroborates our contention that the history of programming languages is to some degree a history of their sign-functions. So far, we have spoken of the specification of a program in a very restricted sense, relating it only to I/O-functions, respectively execution sequences. However, in most cases a specification will contain a detailed account of how the program text relates to an application domain. Therefore, as an interpretant the specification also comprehends another sign relation, whose reference is the domain (see Fig. 26.25). program text R
program text is systematically ambiguous: it refers both to events and objects in the domain and to data objects and processes in the machine. We can verify this by analyzing the comments of a program text. Comments are text pieces that are skipped by the machine, but serve as a help to the programmer. Comments are informal interpretants, and a closer study would reveal that the program text often falls into distinct sections; in some sections the comments interpret the text as referring to objects of the domain, in other sections as referring to internal data objects. Fig. 26.26 provides a background for understanding a good deal of the perceptions and metaphors arising among users and programmers of computer-based systems. Indeed, this picture comes full circle if we consider the fact that the execution sequences themselves can be perceived as sequential sign relations describing processes in the domain; or, as we would like to put it, as narratives about that domain (cf. § 11.):
O
I specification
domain
domain
program text
Fig. 26.25: Specification related to domain.
O O
R
Compare this with Fig. 26.20; once again, we can adjoin two sign relations, and in this case the combined picture in our view represents an important step towards obtaining a fuller picture of the semiosis associated with computer-based signs (Fig. 26.26). domain
program text R
O I specification
O execution sequences
domainoriented
machine-oriented
Fig. 26.26: A survey of the kinds of machine semiosis.
This figure illustrates how the semiosis connected with computer-based signs stretches from a domain external to the machine into the machine and computing technicalities themselves. The figure also shows how the
O R execution sequences
I specification I user's interpretation
Fig. 26.27: User’s interpretation related to domain.
Note that the program text is a meta-sign whose object, the execution sequence, is itself a sign. Thus, as we already saw above, one and the same specification can link the program text to its execution sequences as well as its domain. But the execution sequences can themselves be made manifest on the screen, which causes the user to view them as a representamen of objects and processes in the domain. The interpretant is in this case the user’s understanding of what is happening on the screen, as representing something going on in the domain, cf. the examples in § 3. and, e. g., Boland (1991). As mentioned in § 4., this interpretant has gained importance during the last decade.
565
26. Machine semiosis
A domain-oriented characterization of program correctness is rendered by the above diagram, which yields a fuller picture than the strict notion of operational correctness. In the real world, the correctness of a program is not merely a matter of its performing an I/O-function as specified; it must in most cases also correctly reflect a domain, such that its doings (execution sequences) can and will be perceived by its users as adequate with respect to the intended domain. There are exceptions to this rule; for instance, a program performing highly abstract algebraic operations may have no or only rudimentary domain-orientation; and process control programs may not involve users at all, or only very indirectly. We have combined previous observations on (1) the correctness of implementation (Fig. 26.23) and (2) operational program correctness (Fig. 26.24) with (3) domain-oriented program correctness (Fig. 26.27). Together these constitute a semiotical characterization of program correctness. At the same time, they provide us with a generalized picture of the overall semiosis associated with one particularly important computer-based sign, namely the program text. For completeness, we point out a slight difference between Fig. 26.27 and previous figures: for instance, in Fig. 26.23 the execution sequences under one and the same “O” are identical. In Fig. 26.27, it must be realized that the domain is denoted differently by the program text and the execution sequence. In the program text the processes in the domain are described symbolically, whereas they often occur as icons in the execution ⫺ since processes in the domain are represented by processes of the execution. The program text as a static structure cannot represent domain processes iconically, although their iconic representations in the execution are of course induced by the operational properties of the program text.
10. Further perspectives In order to demonstrate various aspects of semiosis related to program texts and program executions, we have quite deliberately chosen what may be termed a “minimalist approach”. The GCD-program is devoid of information handling in any serious sense, the flowchart language is the simplest type of high level programming languages, and operational semantics is the least abstract and
least elegant among formal systems for describing the semantics of programs. The reason for this kind of approach is obvious: if semiosis can be shown to take place in such a minimal setting, then a fortiori it can be shown to take place in connection with more advanced programs, languages and semantic systems. This is also true for artificial intelligence systems, which lend themselves to semiotical interpretation in many ways (Jorna 1990); in fact, the entire project of artificial intelligence may be semiotically interpreted as an endeavor to develop computer-based mental icons. The problem with all this is that a demonstration of semiosis in connection with, say, artificial intelligence and temporal logic, would probably not demonstrate that semiosis takes place even in trivial cases of data-transformation, whereas the converse certainly holds. Nevertheless, it must be admitted that our description is idealized. For instance, programmers are one important group of readers of specifications, and users are another such group; but what they actually gain from studying a specification will in most cases be different. Moreover, there may be several different kinds of specification involved; one type may be the formulation by an organization of what they wish the program to do; another type may be the programmer’s interpretation of those requirements, and yet another type may be the programmer’s exact description of his own implementation. Such observations do not at all detract from the semiotic points made here: rather, they substantiate them. They all emphasize the richness of semiotic relations in computer-based systems, and call for more research in this field.
11. Human-Computer Interaction (HCI) Let us return to Fig. 26.27, and take a closer look at the user’s interpretation of execution sequences, a topic studied in the expanding field of Human-Computer Interaction (HCI) (Nadin 1988, Andersen 1990, Figge 1991). As argued in § 2., we must develop full narrative scenarios, including subject, helpers and antagonists, in order to design useful machines. In this section we sketch a narrative analysis of human-computer interaction (Laurel 1986 and 1991 presents related ideas based on drama theory).
566
III. Arten der Semiose
A machine is a divided artifact, a Janusheaded entity, a bivalent function -O-, manifesting a certain autonomy in its way of linking its two interfaces. Semiotically, this hidden link between perceived SO-physics and OD-physics makes the machine a signifying object in a specific way. Whereas the ordinary technical artifact owes its efficacy to the user’s motor and mental performance (the knife), so that its meaning is derivable from its S- and D-relevant form (such as ‘handiness’ or ‘fitness’) and from its substantial properties (such as ‘solidity’ or ‘flexibility’; cf. Posner 1989: § 3.2.), the machine is efficient because it contains an autonomous performance as a substantial property. The interpretation of a machine, interposed in an intentional act S-D, is therefore necessarily different from the interpretation of the act of using it, and implies a mobilisation of mental images by which the user adapts and controls his own motor performance. In other words, there is necessarily a specific instance of semiosis, in which the subject has to rely on interpretative representations of what events and instances control inherently the machine’s performance and shape his own performance according to these imaginary creations. We can again use the Peircean sign concept to characterize the general principle of interactional semiosis. The sign is temporal in this case, it is the durative representamen perceived by the subject as a process running from the initial SO-syntagm to the terminal OD-syntagm, through an unknown sequence. The interpretant consists of explicative schemes that bridge this cognitive gap beween the initial and terminal instances of the sign, and fill in the syntactic slot (cf. the library example in § 3.). And the semantic result is a believed continuous global sequence (Fig. 26.28).
In any use of tools, there must be a subject actant S and a domain of objects D, defined by an intentional relation S-D. S wants to ‘do something’ concerning D. The technical artifact O takes on a specific meaning in this intentional context, if we consider it dynamically: S is ‘trying’ and D is ‘resisting’; but there is a syntagm SO and a syntagm OD, such that if SO does the trying, OD is no longer resisting. In this sense, O removes or diminishes D’s resistance. In modal terms, O transforms a ‘cannot do (easily)’ into a ‘can do (easily)’; it makes a task easier. O thus has a modal meaning in the context S-D (cf. Art. 88, § 4.1.). From the definition of mechanisms and machines in § 2., we can deduce that if O is a machine, there must be an energetic difference between the syntagmatic interaction SO and the syntagmatic interaction OD, in the mediation SO-OD. Whereas the energetic situation is essentially the same at the SO- and OD-ends when a murderer applies pressure to a knife in order to kill his victim, the pistol alternative relates the triggering finger differently to the target; an energetic transmission crosses the border between ontologically different causal realms. In other words, the interface SO is energetically different from the interface OD in the machine. What is called “mechanical” is the regularity of the transmission from realm to realm (from trigger mechanics to powder chemistry, for instance). In many cases, the mechanism of this transmission may be and remain unknown to the user of the machine; he only needs to know and to represent to himself the most important aspects of its regularity. Thus, the distinction between the intentional and the causal interpretant made in § 7., must also be the basis of an understanding of HCI.
User's interpretant: (SO)-X-(OD) I
Execution sequences Intentional SOact Situation created
-OD
R
O Domain object: "SOXOD"
Fig. 26.28: Interactional semiosis. The corresponding concepts from Fig. 26.27 are printed in boldface.
567
26. Machine semiosis
When I use a machine (SO) the ‘reaction’ of O (OD) affects the domain D, from which I take the motives that orient my intentional act, and if a new situation is created in D, my intentions will be reoriented. But this feedback D → S depends on my understanding of how the act ‘worked’ and by what forces or rules it obtained the situational result. A change ⫺ which is, in this analysis, a sign ⫺ must be intelligible to have any effect on the subject’s acts. Thus ‘good’ intentions can easily create ‘bad’ (unwanted) situations, if the change obtained is not intelligible; any interaction establishes an interpretative context, a semiosis of this kind, because the regulation of the flow of SO-acts draws on what is believed to really happen ‘inside’ O. A degenerated semiosis gives rise to ‘blind’ action, discontinuous flows, panic, perplexity, confusion. There is a cognitive demand for interpretative images (X), and they are constructed from certain schemes, with or without specific knowledge of O. A personalized O (an ‘Other Subject’) calls for fundamental pragmatic and narrative schemes, which may be independent of the domain they are supposed to operate on ⫺ since a person is basically a rather un-technical object ⫺ but a social, professional ‘technification’ can functionalize it by imposing institutional rules of procedure on X. These rules are impersonal and tend to neutralize the ‘free’ narrative schemes by referring to the domains (as in legal specialization, based on domain-sensitive traditions and the authority of precedents). The analysis of personal interaction must therefore distinguish ‘free’ and ‘bound’ interpretants, and accordingly, intelligibility referring to human reality (inter-personal, untechnical) and to institutional reality (impersonal, technical) as contents of obtained belief. This is an important dimension of social phenomenology. We could generalize the distinction and propose the notation “Xf” vs. “Xb” (free vs. bound interpretant) as a standard condition of interactional semiosis. “Xf” would indicate the more intentional part (related to natural patterns of finality), and “Xb” the more causal or coded (conventional: quasi-causal) part of the interpretant; both components are needed in a global interpretation. If the object O is a machine, the interpretation follows the same general lines.
There is, first, a causal path through the machine, which is a strong interpretative idea, stressing Xb. The SO-syntagm contains a series of acts of control, guiding a reference unit through a bifurcating path, in much the same way as if it were a person running through a physical landscape or a world of branching possibilities. It could be stipulated that the reference unit represents the user’s own body projected into the fictive, operative world ‘inside’ the machine. In this sense, ‘SO as SXb’ projects the user’s intentional acting into the causal Xb-world, the reference unit then being intentional and the path structure being causal. In this elementary, first semiotization of the interactional object which determines the regulatory flow of user operations, a transport model similar to the actant model in Greimas (1976: 180) accounts for the minimal user intuition needed. In terms of SXb-syntax, this actantial structure, with its axis of communication (Sender⫺Receiver), its axis of intention (Subject⫺Object), and its axis of conflict (Helper⫺Antagonist), can be represented as shown in Fig. 26.29. Reference unit Source
Effect
PROCESS
Compeller
Resistance DYNAMICS "S"
CONTROL Fig. 26.29: The actant model of interactional semiosis.
A narrative schema like this interprets the ‘inner’, black box world of the local process which the user must visualize (iconize) for himself in order to manipulate the machine. Second, there is a symbolic dimension relating the user-subject to the designer of the machine. As a machine is not a piece of pure nature, but rather an arranged disposition that makes use of natural processes and the possible gearing of its energetics for certain purposes, the user cannot but feel guided by an already instantiated, implemented intentionality, a designer subject, inscribed in the arrangements that determine the control of-
568 fered by the machine (as we have already seen, the intention of the designer subject is normally codified in the system’s specification). The user ‘will want to’ obtain certain quantities of the effect, and ‘will want to’ avoid certain other effects; the commands available are expressions of these intersubjective, projected ‘wants’ and are read as such by the user-subject. The functional connection between the variables of effect and the variables of control is designed by the ‘author’ of the machine, the designer subject (and concealed in the trademark). The dysfunctions and ‘eu-functions’ of the machine thus modulate a kind of communication between use and designer subject. This modulation ⫺ sometimes harmonic, sometimes conflictory ⫺ of machine semiosis can now be understood as an Xf-interpretative phenomenon, related to the dynamic axis of the actantial model: the designer subject is projected on the opposed instances of Helper and Antagonist, and now becomes both a factor of constructive Help and a factor of Obstruction ⫺ a Constructor and an Obstructor ⫺ in the perspective of the user. Some of his inventions are felt to be truly helpful, others to be obstructive, awkward, harmful, or directly evil; cf. the analysis of the hedge trimmer in § 2. The designer is divided into two opposed actants; this is also fundamentally what happens in direct human communication: the Other is helpful and harmful, lovable and dangerous; we must regulate this affective instability to be able to maintain a coherent attitude by a symbolic means, such as gestural and verbal politeness. The actantialization stresses the bound, causal representations (S-Xb) on the level of the process axis, but stresses the free, intersubjective, pragmatic representation (SXf) on the level of the conflict axis of the same interpretative model (for a similar approach cf. Art. 5 § 1.). In this full interpretation, the model becomes fully narrative. The resulting interpretant ⫺ SO(XbXf)OD ⫺ is therefore both cognitive and pragmatic; it combines inferential intuitions referring to physis and to polis, with causes (forces) and with intentions (rules).
12. Conclusion and speculations If we compare computer systems to physical tools and machines (for a comparison with living organisms cf. Art. 21 § 9.), we discover
III. Arten der Semiose
a series of new differentiations. Using a hedge-trimmer involves both intentional and causal processes, and the interpretant relating the trimmer to the actual cutting is of mixed psycho-biological nature, activating both body and mind. Computer technology creates the following real ⫺ not abstract ⫺ differentiations: (1) The psycho-biological interpretant of our bodies is differentiated into a separate psychic intentional interpretant (the formal semantics of a system) and physical, causal interpretant (the compiler and runtime system). (2) The praxis ⫺ habits and skills ⫺ underlying hedge-trimming is differentiated into a separate system that specifies the rules of the game and usage which applies the given rules. (3) The self-referentiality of our language (we use English to talk about English) is differentiated into a meta-sign (the program) that refers to an object sign (the execution) but not conversely. The latter differentiation may seem somewhat odd in view of the fact that the lowest level of a computer system is self-referential (§ 7.). The explanation is that unlimited selfreferentiality and self-modification are normally avoided in order to make the system predictable. The meta/object distinction is thus a secondary restriction imposed on most computer systems. Because of these differentiations, computer systems can be said to have meaning in a much stricter sense than other tools. The semantics of a computer system is an intention that is prescribed and imposed upon the hardware by human beings. However, given a correct implementation of the programming language, the computer hardware can act as a causal interpretant, enabling it to behave exactly according to the intentional specifications. It is unclear whether the causal interpretant at the actual hardware level can be said to be a sign-process, since it is mainly self-referential. Thus, meaning and intention may not be an inherent concept of a computer, but a property ascribed to it and imposed on it by designers and users. Could this be a possible way of characterizing machine-semiosis in opposition to human semiosis? No, at least not according to the work on autopoietic systems done by Maturana and Varela (1980) and their followers. They sub-
569
26. Machine semiosis
mit that exactly the same situation obtains in biological organisms (cf. Art. 25 § 2.4. and Art. 85 § 6.). Here, too, meaning and intention are properties that are ascribed to a particular form of behavior by an observer. Inside the organism itself we have only the closed, self-referential process of neurological autopoiesis. However, the very notion of autopoiesis could be a way of differentiating machine and human semiosis. Autopoietic systems are peculiar in that they must reproduce themselves. In opposition to hedge-trimmers, washing-machines and computer systems, they are not designed with a particular functionality in mind, nor are they turned out by a factory. Specifically, this means that the development and reproduction of the semiotic faculties of autopoietic systems is their own responsibility, which again entails that a theory of these faculties must include an account of how they came into being. A semiotic theory must explain how signs became possible at all ⫺ yes, even more: it must explain how it is itself possible, since theory-building is a semiotic activity. A similar logic is not required for analyzing machines: we shall not demand that a theory of washing-machines or spreadsheets explain how these commodities created themselves; the reason is that we know who made them, so their genesis need not be explainable on the basis of the systems themselves, but will involve their human manufacturers ⫺ human economics and technology. Only in autopoietic systems must the morphogenetic account be an integral part of the analysis, since there are no others to blame. Let us look a little more closely at the conception of semiosis as a “property that is ascribed to a particular form of behavior by an observer”. Since the property is ascribed, it is tempting to classify it as an emergent property, which is a property that is not explicitly represented in the neural net, but results from the complicated interactions of many cells. “Emergence” is not a mystical concept; in fact it is very easy to produce even very simple systems with that property (cf. Art. 19 § 7. and Art. 138). The pattern in Fig. 26.30 was produced by approximately 60 simple cellular automata with no internal representation of triangles. The hard part of the morpho-genetic account is to understand how the emergent property becomes conscious, and effectively changes the autopoietic process. By defini-
Fig. 26.30: Emergent triangles in cellular automata.
tion, the emergent property is merely an elusive pattern distributed over many cells, none of which can refer to it in their private metabolism. How can this pattern stabilize and form a unit which the metabolism of the cells can refer to and use to change their behavior? One might object that this need not happen, since emergent patterns only exist in the mind of the observer. But wait! Who might this observer be? The observer can only be a human being, so at least one human being must be able to form the triangle concept. Therefore, the very notion of autopoietic emergence logically entails that the autopoietic system ⫺ or at least a clone of it ⫺ can recognize and stabilize the property to an effective representation. A tentative conclusion could run as follows: the difference between human and machine semiosis may not reside in the particular nature of any one of them. Rather, it may consist in the condition that machine semiosis presupposes human semiosis and the genesis of the former can be explained by the latter. Human semiosis, however, does not demand a similar supporter it can refer to for its explanation. Therefore, only a theory of human semiosis needs to be morpho-genetic in its very structure, explaining both the present nature of semiosis, how it developed, and how it reproduces.
13. Selected references Andersen, P. Bøgh (1990), A Theory of Computer Semiotics. Semiotic Approaches to Construction and Assessment of Computer Systems. Cambridge, England. Andersen, P. Bøgh (1991), “A Semiotic Approach to Construction and Assessment of Computer Systems”. In: H.-E. Nissen, H. Klein and R. Hirschheim (eds.), Information Systems Research. Contemporary Approaches and Emergent Traditions. Amsterdam: 465⫺514.
570 Andersen, P. Bøgh (1992), “Computer Semiotics”. Scandinavian Journal of Information Systems 4: 3⫺30. Andersen, P. Bøgh (1993), “A Semiotic Approach to Programming”. In Andersen, Holmqvist and Jensen 1993: 16⫺68. Andersen, P. Bøgh and P. Øhrstrøm (1994), “Hyperzeit”. Zeitschrift für Semiotik 16: 51⫺68. Andersen, P. Bøgh (1995), “The Force Dynamics of Interactive Systems. Towards a Computer Semiotics”. Semiotica 103/1⫺2: 5⫺45. Andersen, P. Bøgh, B. Holmqvist and J. F. Jensen (eds.) (1993), Computers as Media. Cambridge, England. Ben-Ari, M., A. Pnueli and Z. Manna (1981), “The Temporal Logic of Branching Time”. In: Proceedings of the 8th ACM Symposium on Principles of Programming Languages: 164⫺176. Bird, Richard (1976), Programs and Machines. London. Boland, J. R. (1991), “Information System Use as a Hermeneutic Process”. In: H.-E. Nissen, H. Klein and R. Hirschheim (eds.), Information Systems Research: Contemporary Approaches and Emergent Traditions. Amsterdam: 439⫺458. Boyer, R. S. and J. S. Moore (eds.) (1981), The Correctness Problem in Computer Science. London. Brandt, P. Aa. (1993), “Meaning and the Machine. Towards a Semiotics of Interaction”. In Andersen, Holmqvist and Jensen 1993: 128⫺141. Burstall, R. M. (1974), “Program Proving as Hand Simulation with a Little Induction”. Information Processing 74: 308⫺312. Christensen, J. (1993), “Historical Trends in Computer and Information Technology.” In Andersen, Holmqvist and Jensen 1993: 422⫺452. Clark, K. L. and D. F. Cowell (1976), Programs, Machines, and Computations. London. de Bakker, J. W. (1980), The Mathematical Theory of Program Correctness. London. Decle´s, J-P. (1989), “Intermediate Representations in the Cognitive Sciences”. Semiotica 77/1⫺3: 121⫺135. Eco, U. (1977), A Theory of Semiotics. London and Basingstoke. Emerson, E. A. (1990), “Temporal and Modal Logic”. In: I. van Leeuwen (ed.), Handbook of Theoretical Computer Science. Dordrecht: 997⫺ 1072. Figge, U. L. (1991), “Computersemiotik”. Zeitschrift für Semiotik 13: 321⫺330. Floyd, R. W. (1967), “Assigning Meaning to Programs”. Proceedings of Symposia in Applied Mathematics 19: 19⫺32. Goldkuhl, G. and K. Lyytinen (1982), “A Language Action View of Information Systems”. SYSLAB Report 14. Göteborg, Sweden: Department of Computer Sciences, Chalmers University of Technology and the University of Göteborg.
III. Arten der Semiose Gorn, S. (1968), “The Identification of the Computer and Information Sciences: Their Fundamental Semiotic Concepts and Relationships”. Foundations of Language 4: 339⫺372. Greimas, A. J. (1976), Se´miotique et sciences sociales. Paris. Hasle, P. (1993), “Logic, Grammar and the Triadic Sign Relation”. In Andersen, Holmqvist and Jensen 1993: 104⫺108. Hoare, C. A. R. (1969), “An Axiomatic Basis for Computer Programming”. Communications of the ACM 12: 576⫺583. Holmqvist, B., P. Bøgh Andersen, H. Klein and R. Posner (eds.) (1996), Signs of Work: Semiosis and Information Processing in Organisations. Berlin and New York. Jorna, R. J. (1990), “Wissensrepräsentation in künstlichen Intelligenzen. Zeichentheorie und Kognitionsforschung”. Zeitschrift für Semiotik 12: 9⫺ 23. Laurel, B. (1986), “Interface as Mimesis”. In: D. A. Norman and S. Draper (eds.), User Centered System Design: New Perspectives on Human-Computer Interaction. Hillsdale, NJ. Laurel, B. (1991), Computers as Theater. Reading, MA. Lightfoot, D. W. (1979), Principles of Diachronic Syntax. Cambridge, England. Lind, M. (1990), “Representing Goals and Functions of Complex Systems. An Introduction to Multilevel Flow Modelling”. Institute of Automatic Control Systems. Technical University of Denmark 90-D-381. Lotman, Y. M. (1990), Universe of the Mind. Bloomington and Indianapolis. Mainzer, K. (1990), “Die Evolution intelligenter Systeme”. Zeitschrift für Semiotik 12: 83⫺106. Maturana, H. R. and F. J. Varela (1980), Autopoiesis and Cognition. The Realization of the Living. Dordrecht, Boston and London. Nadin, M. (1988), “Interface Design: A Semiotic Paradigm.” Semiotica 69: 269⫺302. Øhrstrøm, P. and P. Hasle (1995), Temporal Logic: From Ancient Ideas to Artificial Intelligence. Dordrecht. Ouellet, P. (ed.) (1989), “Semiotics, Cognition and Artificial Intelligence”. Semiotica 77 (Special issue). Parikh, R. (ed.) (1985), “Logics of Programs”. Lecture Notes in Computer Science 193. Heidelberg. Piotrowski, D. (1990), Structures applicatives et langage naturel. Recherches sur les fondements du mode`le: “Grammaire Applicative et Cognitive”. Ph.D thesis, Ecole des Hautes Etudes en Sciences Sociales, Paris. Piotrowski, D. (1993), “Structuralism, Computation and Cognition. The Contribution of Glossematics”. In: Andersen, Holmqvist and Jensen 1993: 68⫺91.
27. Ökosemiose Posner, R. (1989), “What is Culture? Toward a Semiotic Explication of Anthropological Concepts”. In: Walter A. Koch (ed.), The Nature of Culture. Bochum: 240⫺295. Rasmussen, J. (1986), Information Processing and Human-Machine Interaction. New York. Rossi-Landi, F. (1992), Between Signs and NonSigns. Amsterdam and Philadelphia. Rossi-Landi, F. (1975), Linguistics and Economics. The Hague. Stamper, R. (1973), Information in Business and Administrative Systems. London. Stamper, R. (1992), “Signs, Organizations, Norms and Information Systems”. In: Proceedings of the Third Australian Conference on Information Systems. Department of Business Systems, University of Wollongong, Australia.
571 Stamper, R. (1991), “The Semiotic Framework for Information Systems Research”. In: H.-E. Nissen, H. Klein and R. Hirschheim (eds.), Information Systems Research: Contemporary Approaches and Emergent Traditions. Amsterdam: 515⫺528. Stirling, C. (1992), “Modal and Temporal Logics”. In: S. Abramsky et al. (eds.), Handbook of Logic in Computer Science. Oxford: 478⫺563. Torrance, S. B. (1984), The Mind and the Machine. Philosophical Aspects of Artificial Intelligence. New York. Varela, F. J., E. Thompson and E. Rosch (1991), The Embodied Mind. Cambridge, MA. Zemanek, H. (1966), “Semiotics and Programming Languages”. Communications of the ACM 9/3: 139⫺143.
Peter Bøgh Andersen, Per Hasle, and Per Aage Brandt, Aarhus (Denmark)
27. Ökosemiose 1. Ökologie 2. Semiotische Struktur, Funktionskreis und Evolution 3. Typen von Ökosemiosen 3.1. Raum-Semiosen 3.2. Zeit-Semiosen 3.3. Semiosen im Dienst stoffwechselbedingten Verhaltens 3.4. Schutz-Semiosen 3.5. Erkundungs-Semiosen 3.6. Partner-Semiosen 4. Anthropogene Ökosemiosen 5. Literatur (in Auswahl)
1.
Ökologie
Ökosemiosen sind Zeichenprozesse, die in den Gegenstandsbereich der Ökologie fallen. Daher sei dieser hier kurz charakterisiert (vgl. Bick 1989; Schubert 1991; Begon, Harper, Townsend 1991): Ökologie wird gegenwärtig als Wissenschaft der Biosphäre des Planeten Erde definiert, womit drei Grundphänomene vorgegeben sind: ⫺ der Stoff- und Energiewechsel in der Biosphäre, der durch Fluktuationen charakterisiert ist, ⫺ der Formwechsel in der Biosphäre, der durch Strukturationen gekennzeichnet ist, und ⫺ der Informationswechsel in der Biosphäre, der sich mit Semiosen verbindet.
Die Biosphäre (vgl. Vernadskij 1967) unterliegt einer autonomen Entwicklung als Veränderung der drei genannten Klassen von Parametern, die wir als „Selbstorganisation“ (vgl. Art. 21 § 5. und Art. 26 § 6.) bezeichnen. Die Biosphäre ist hierarchisch organisiert, wobei die Elementareinheiten als „Biozönosen“ bezeichnet werden, die durch ihre Zusammensetzung aus Lebewesen in Kombination mit definierten abiotischen Vektoren gekennzeichnet sind mit den drei Grundklassen: Geosphäre, Hydrosphäre und Atmosphäre, zwischen denen ein komplexer Stoffaustausch besteht. Bei den Lebewesen werden heute meist 5 Reiche unterschieden (vgl. Art. 20⫺24): Die Vorzeller (Prokaryota ⫽ Monera), die Einzeller (Protoctista), die Pflanzen (Plantae), die Pilze (Fungi) und die Tiere (Animalia). Der Stoffwechsel der Organismen wird vor allem durch klimatische Faktoren und durch die Art des Energiegewinns bestimmt. Die Art des Energiegewinns hat bestimmenden Einfluß auf die Entwicklung der Organismen-Reiche genommen, während die klimatischen Faktoren die Biosphäre in große Bioregionen untergliedern; die sich daraus ableitenden hohen Einheiten der Biosphäre werden als „Biome“ bezeichnet. Ein bekanntes Beispiel dafür sind die immergrünen tropischen Regenwälder. Wir könnten also auch sagen, daß die Ökologie die Wis-
572
III. Arten der Semiose
senschaft von den supraorganismischen Systemebenen der Biosphäre ist. Analytische Untersuchungen dieser Zusammenhänge werden durch die Teildisziplin der Synökologie vorgenommen. Geht es um die OrganismenPopulationen bei der Erfassung der Dynamik und ihrer ursächlichen Vermaschung, ist die Demökologie gefordert. Richtet sich die Analyse auf die Organismus-Umwelt-Beziehungen im ökologischen Kontext, sind Aufgaben der Autökologie angesprochen. Sie untersucht die Zusammenhänge zwischen dem Form-, Stoff- und Informationswechsel der Lebewesen sowie den Umweltvektoren insgesamt und bezogen auf die spezielle „ökologische Nische“, die für die jeweiligen Organismen kennzeichnend ist (vgl. die Beispiele in Art. 22 § 4.⫺7.). Die Evolution des Planeten Erde ist durch eine Besonderheit gekennzeichnet: Aus der biologischen Evolution ging als spezielle Organismenart der Mensch hervor, dessen veränderter Bewußtseinsstatus (vgl. Art. 21 § 9. und Art. 25 § 3.) zu einer Eigendynamik im autökologischen Kontext geführt hat mit komplexen systematischen Eingriffen in die Umwelt, in deren Folge eine Noosphäre entstanden ist als Ergebnis der Ratio und der soziokulturellen Lebensformen. Die Noosphäre hat auf der gesellschaftlich organisierten Stufe der Evolution ein zivilisatorisches Potential entwickelt, das eine eigene Ökonomie konstituiert hat, in deren Gefolge destruktive Eingriffe in die Biosphäre mit inzwischen globalen Auswirkungen zustande kamen (vgl. Posner 1990: 259 ff). Wir erleben eine Konfrontation von Biosphäre und Noosphäre, die zu einer erheblichen Instabilität in der Gesamtevolution des Planeten Erde ge-
führt hat, so daß die Entwicklung gegenwärtig durch zwei Bedingungsgefüge bestimmt wird: Organismus/Umwelt und Gesellschaft/ Natur. Der zweite Aspekt erfordert eine eigene neue Teildisziplin der Ökologie, die Humanökologie. Das ist der Hintergrund für das zentrale Anliegen dieser Darstellung, das mit dem Begriff „Ökosemiose“ umschrieben ist.
2.
Semiotische Struktur, Funktionskreis und Evolution
Wir gehen dabei von dem an anderer Stelle (siehe Artikel 5 § 3.2.7.5., vgl. Prieto 1966 ⫽ 1972: 33 ff) bereits vorgestellten Modell der semiotischen Struktur aus (Abb. 27.1). Entsprechend unserer triadischen Konzeption der Selbstorganisation (Tembrock 1992, und im Druck) rechnen wir mit drei Dimensionen, den Ordnungsmustern, der Negentropie sowie den Bewertungskriterien, und überführen damit hier das duale Konzept des Zeichens von Sebeok (1979) in ein triadisches, zu dem gehört: ⫺ das Aistheton als die wahrnehmbare Dimension, ⫺ das Noe¨ton als die verstehbare Dimension und ⫺ das Ethiton als die bewertende (gewichtende) Dimension. Dies sind die Voraussetzungen für die drei Dimensionen unseres Bewußtseins, die ästhetische Dimension, die kognitive Dimension und die ethische Dimension. Damit sind zugleich Äquivalente der ‘klassischen’ Dimensionen der Information (vgl. Art. 1⫺4) be-
Abb. 27.1: Schematische Darstellung einer semiotischen Struktur in Anlehnung an Prieto (1966 ⫽ 1972: 33 ff).
573
27. Ökosemiose
schrieben, der Syntaktik, der Semantik und der Pragmatik (die Gewichtungen für Entscheidungen voraussetzt). Nach der vorangegangenen Darstellung der Sachverhalte, die für die Ökologie als Wissenschaft relevant sind, sollten wir auch die Semiosen ein wenig differenzieren, wobei die Unterscheidung von Biosphäre und Noosphäre (im Ergebnis menschlichen Seins, Bewußtseins und Handelns) zu zwei Grundklassen semiotischer Strukturen führt: Organismen und Menschen als Interpreten der Signifikate. Der zweite Typ schließt den ersten in abgewandelter Form ein, da der Mensch zwar noch immer ein Organismus ist, seiner Interpretationstätigkeit aber eine prinzipiell veränderte Bewußtseinslage (in der adulten Phase) zugrunde liegt, die sich mit dem ratiogenetischen Potential verbindet. Damit ist angesprochen, daß wir die Evolutionsebenen charakterisieren müssen, ehe wir die Ökosemiosen näher betrachten können. Wir haben dazu im Anschluß an die Konzepte von v. Hayek (1979) und von C. Vogel (1985) folgende Ebenen zur Diskussion gestellt (Abb. 27.2):
Entstehung eines „Zeitpfeiles“. Es handelt sich um eine Ordnung durch Fluktuation (Jantsch 1988), im Gefolge derer „harte Ereignisse“ auftreten, die zu qualitativen Änderungen der strukturellen und dynamischen Eigenschaften eines Systems führen; die Beziehung zur „fraktalen Evolution“ im Sinne von G. Binnig (1992) ist angesprochen. Die Thermodynamik dissipativer Strukturen gehört in diesen Kontext (Prigogine, Stengers 1986), insbesondere das Konzept der Selbstorganisation. Ebeling, Engel und Feistel (1990) bezeichnen entsprechend Evolution als „unbegrenzte Folge von Prozessen der Selbstorganisation“ (vgl. Art. 18). 2. Biogenetisches Potential: Es ist entstanden in der präbiotischen Evolution im Gefolge der Selbstorganisation (evolutives Potential) als Voraussetzung für die Evolution von Organismen (vgl. Art. 19). Hier lassen sich zwei Subpotentiale unterscheiden: 2.1. Phylogenetisches Potential: Es umfaßt genetische Vorgaben auf der Grundlage „geschlossener Programme“ und ihrer Selbstorganisation. 2.2. Ontogenetisches Potential: Es umfaßt phylogenetische Vorgaben für die Individual-
Abb. 27.2: Darstellung der vier im Text behandelten Potentialebenen, wobei rechts der Spracherwerb des Menschen als ein Beispiel eingesetzt ist.
1. Evolutives Potential: Es ist Voraussetzung für die materielle Evolution des Kosmos, verbunden mit Symmetriebruch und Strukturbildung, sowie Bedingung für die
entwicklung unter Einschluß der damit verbundenen inneren und äußeren Selektion, die auch obligatorische Anpassungen (z. B. Lernvorgänge) einschließt.
574 3. Tradigenetisches Potential: Es umfaßt tradierte Vorgaben prä- und soziokulturell fixierter Werte, Regeln und Normen des Verhaltens auf der Grundlage „offener Programme“ (vgl. Art. 17). Daraus leiten sich „Sekundärmotivationen“ ab. Die Umsetzung erfolgt interindividuell im nicht-anonymen sozialen Kontext (primär Mutter/KindDyade). 4. Ratiogenetisches Potential: Es umfaßt die bewußte soziale Aneignung von Wissen und Können unter Einschluß von Regeln, Werten und Normen des Handelns, deren Umsetzung institutionalisiert ist (vgl. Art. 25). Die Abb. 27.2 verzeichnet für den speziellen Weg der menschlichen Evolution die Voraussetzungen des Spracherwerbs als ein Beispiel der Umsetzung auf den einzelnen Potential-Ebenen. Damit ist die Spezifik des Interpreten Mensch angesprochen. Zu dieser gehört die interne Sprachbelegung der Signifikate, die Möglichkeit ihrer Bezeichnung, die dann als neue Ebene bei der Sprachkommunikation genutzt wird. Sie fehlt den tierischen Organismen. Das hat zur Folge, daß unsere sprachlichen Bezeichnungen für die organismischen Signifikate Vermenschlichungen sind. Das schließt jedoch nicht aus, daß bei Primaten die neurologischen Korrelate von Signifikaten den unseren ähnlich sein können, besonders, wenn die Signifikanten aus Mengen von natürlichen Objekten bestehen (vgl. Art. 24). Für die weitere Erörterung im Rahmen der Ökosemiotik bedarf es grundsätzlicher Bestimmungen für die betreffenden Parameter: 1. Die Signifikanten sind Struktureigenschaften, beispielsweise als „Balzkleid“ eines Entenerpels oder als Farbmuster einer Blüte. 1.1. Sie sind ein Epiphänomen, wie beim Aufrichten von Haaren, das in seiner Primärfunktion im Dienst der Thermoregulation steht. 1.2. Sie sind intendiert, etwa als Aufrichten der Haare beim „Imponieren“. 2. Die Signifikanten sind Prozeßeigenschaften: 2.1. epiphänomenal, z. B. als Atemgeräusche oder Begleitgeräusche einer Bewegung; 2.2. intendiert, z. B. als Stimmlaute oder als Bodentrommeln mit den Füßen. 3. Ein Zeichen liegt vor, wenn es eine Nachricht gibt; eine semiotische Struktur ist erst gegeben, wenn auch Signifikanten und Signifikate vorliegen. Hier möchten wir un-
III. Arten der Semiose
terscheiden zwischen zwei Elementarstrukturen: 3.1. Semiotische Informationsstruktur: Die Nachricht entsteht beim Interpreten, der Signifikant kann verschiedenen Signifikaten zugeordnet werden. 3.2. Semiotische Kommunikationsstruktur: Die Nachricht entsteht bereits beim Sender (Quelle, Expedient), die Zeichen realisieren das an den Signifikanten gebundene Signifikat (vgl. Art. 4 § 1.). 4. Semiotische Strukturen sind per definitionem an verhaltensfähige Systeme gebunden, da sie einen Informationsprozeß auslösen, der in einer „Handlungssituation“ abläuft (vgl. Morris 1975). Dabei werden in Anlehnung an G. H. Mead (vgl. Posner 1981) drei Phasen unterschieden: die Orientierungsphase, die Bearbeitungsphase und die Erfüllungsphase. In unserem Modell des Verhaltensprozesses (vgl. Tembrock 1992) heißen diese: Appetenzverhalten I (orientierendes Verhalten), Appetenzverhalten II (orientiertes Verhalten) und beendendes Verhalten (Endhandlung). Diese drei Phasen sind konzeptuell, diskriminatorisch und prozessual organisiert (Lernen eingeschlossen). Die erste Phase erfordert Suchstrategien, die zweite Phase hält Bewertungen und Entscheidungen über Alternativen bereit, die dritte Phase gewichtet das Ergebnis und kann damit die Motivation beenden. Wir haben jetzt Voraussetzungen verfügbar, das Phänomen der Ökosemiose analytisch zu betrachten (vgl. auch Art. 36 § 3.). Wir bewegen uns im Kontext der Biosphäre mit der speziellen, nur ihr eigenen Form der Umsetzung des evolutiven Potentials, die zu einer Stammesgeschichte der heute existierenden Lebewesen geführt hat, wobei vielfach der Begriff „Evolution“ auf diesen Ausschnitt der Gesamtentwicklung eingeschränkt wird, also auf die biologische Evolution. In diesem Zusammenhang bietet sich eine Kennzeichnung der Evolutionsebenen an, die wir jetzt unter dem Aspekt der semiotischen Strukturen betrachten können (Abb. 27.3): 1. Stufe: Metabolische semiotische Strukturen. Die Signifikanten bestehen aus Nukleinsäuren, die Signifikate aus Aminosäuren, in der „Erfüllungsphase“ werden Proteine gebildet (vgl. Witzany 1993). 2. Stufe: Neuro-endokrine semiotische Strukturen. Sie konstituieren den funktionellen Zusammenhang von Zellen und Organen und deren Leistungen, wobei die Zeichen bioelektrische Signale (Potentiale) mit zeitli-
575
27. Ökosemiose
Abb. 27.3: Evolutive Stufen semiotischer Strukturen, dargestellt als Enkapsis, jede tiefere ist auch (verändert) in den höheren Stufen erhalten. Die beiden oberen kennzeichnen die Humanevolution.
cher Musterbildung sein können. Da Lebewesen „offene Systeme“ sind, wird auf dieser Grundlage auch die Spezifik der Umweltverknüpfung für den Stoff- und Energiewechsel gesichert. 3. Stufe: Ethökologische semiotische Strukturen. Sie verknüpfen den Organismus über Verhalten mit der Umwelt über einen „Eingangsvektor“ (äußere Rezeptoren) und einen „Ausgangsvektor“ (Efferenzen, speziell Motorik). 4. Stufe: Kommunikative semiotische Strukturen. Sie verbinden die Organismen untereinander so, daß Zeichen des Senders den Empfänger „manipulieren“. 5. Stufe: Soziokulturelle semiotische Strukturen. Sie setzen menschliches Bewußtsein voraus und weisen metabiologische (vom Menschen erzeugte) Signifikate auf. 6. Stufe: Gesellschaftliche semiotische Strukturen. Sie beruhen auf einer nach neuen Regeln (Gesetzen) organisierten und institutionalisierten ökonomisch gestützten Form des Gemeinschaftslebens und sind weitestgehend an Sprachzeichen gebunden. Unsere Darstellung in Abb. 27.3 zeigt eine Enkapsis, die verdeutlicht, daß die tiefen Stufen auch die höheren umfassen, wobei ihre Gesetze weiter gelten, sich aber entsprechend dem jeweiligen Kontext, der bezeichnet wurde, umsetzen (vgl. Art. 14 § 2. und Art.
26 § 4.). Wir haben die Kernebene der hier vorgegebenen Fragestellung durch die Schrift besonders hervorgehoben. Die ethökologische Ebene mit den beiden tieferen Ebenen liefert das Bedingungsgefüge, das von der Ökosemiotik untersucht wird. Doch ist auch die kommunikative Ebene noch mit angesprochen; hier stehen die biosozialen Strukturen im Vordergrund, die Teildisziplin der Demökologie wäre tangiert. Wir nähern uns nun der Frage, wie wir die ökosemiotischen Phänomene strukturieren können. Dabei greifen wir auf ein Konzept von v. Uexküll zurück (vgl. 1921, 1928), das mit dem Begriff des Funktionskreises gekennzeichnet wurde (vgl. Art. 110). Diesen Begriff haben wir auf die moderne Verhaltensforschung übertragen (Tembrock 1956, 1982). Die Funktionskreise werden durch die elementaren Klassen der Umweltansprüche, die Lebewesen stellen müssen, definiert. Danach möchten wir unterscheiden: 1. Raumansprüche, 2. Zeitansprüche, 3. Stoffwechselansprüche, 4. Schutzansprüche, 5. Erkundungsansprüche und 6. Partneransprüche, differenziert in Sexualansprüche, Pflegeansprüche und Sozialansprüche. Nur die Partneransprüche bewegen sich essentiell auf der Ebene der kommunikativen semiotischen Strukturen, weil nur Artgenossen primär einen identischen Zeichenkode auf-
576
III. Arten der Semiose
weisen. Das schließt zwischenartliche Partneransprüche jedoch nicht aus, wie wir sie etwa bei Symbiosen kennen. Die anderen Umweltansprüche setzen sich auf den darunter liegenden Ebenen um (vgl. Abb. 27.3). Wir können damit die Ökosemiosen funktionell ordnen: 1. Raum-Semiosen, 2. Zeit-Semiosen, 3. Stoffwechsel-Semiosen, 4. SchutzSemiosen, 5. Erkundungs-Semiosen und 6. Partner-Semiosen.
Es bedarf noch einer kurzen Erläuterung des Begriffs der Erkundungsansprüche als Basis für Erkundungs-Semiosen. Gemeint sind Umwelt-Interaktionen, deren Vollzugsfunktion ausschließlich im Erwerb von Informationen per se liegt. Wir halten diese für elementar. Diese Hypothese hat eine Voraussetzung: die Annahme einer „dualen Strategie“ der Selbstorganisation (vgl. auch G. Binnig 1992). Weil sie für unser Thema hoch-rele-
Abb. 27.4: Darstellung der Hypothese von den beiden zusammenwirkenden Grundstrategien der Evolution (Selbstorganisation). Einzelheiten im Text.
Abb. 27.5: Grundschema semiotischer Strukturen im verhaltensgesteuerten Organismus/UmweltKontext. Einzelheiten im Text.
577
27. Ökosemiose
vant ist, sei sie in Abbildung 27.4, die sich weitgehend selbst erklärt, vorgestellt. Diese macht deutlich, daß es eine elementare Speicherstrategie gibt, die gleichzeitig mit der Replikationsstrategie wirksam wird. Sie muß sich auf der ethökologischen Ebene in einer Informationsaufnahme per se im Sinne einer Informations-Akkumulation umsetzen. Die Verknüpfung der Blöcke weist aus, daß sie essentiell zusammenarbeiten und sich zugleich in Richtung des unteren Zeitpfeiles umsetzen. „Short Sampler“ setzen die Speicher-Strategie schnell um, „Long Sampler“ reichern kreative Potenzen an, ehe sie mit der Umwelt interagieren. Im folgenden sei versucht, die hier aufgeführten Semiose-Typen in ihren Eigenschaften zu kennzeichnen und mit Beispielen zu belegen. Zuvor ist jedoch noch eine Kennzeichnung der semiotischen Struktur auf der Ebene der Organismen erforderlich. Wir versuchen in Abbildung 27.5 eine schematische Darstellung der dafür relevanten Parameter. Im Anschluß an Cherry (1957, 1966) können wir sagen: Nachrichten (vgl. Abb. 27.1) werden realisiert, wenn Zeichen, die physiologisch bei einem Rezeptor als „Reize“ wirksam werden und zur Bildung von Erregungsmustern führen, verfügbar für das Verhalten werden, also „interpretiert“ sind. Dabei ist die syntaktische Struktur des Signifikanten die Voraussetzung für einen oft als „Parsing“ bezeichneten Vorgang (vgl. Art. 2 § 4.), der unter Nutzung eines „lexikalischen Speichers“ das komplexe Signifikat konstituiert (vgl. Art. 3). Dieses Signifikat ist die Voraussetzung für die pragmatische Dimension, denn es kann im Situationskontext zur Botschaft (um)interpretiert und bewertet werden (vgl. Art. 4). Die Botschaft ist es, die den Verhaltensstatus ändert ⫺ motivationell, vielleicht auch emotionell und im Bezug zur Umwelt (Ausgangsvektor). Es geht also um die „Antwort“ auf die eingegangenen Signale. W. J. Smith (1977) hat diesen semiotischen Ansatz übrigens begrenzt auf die eigentliche Kommunikation mit intendierten Zeichen, deren Botschaften für den Empfänger beim Sender bereits vorgegeben sind. Die von uns vorgestellte ethökosemiotische Struktur impliziert dieses nicht, sie geht von der autonomen Bildung der Nachrichten im Rezipienten aus. Nach unserer Auffassung hat sich erst unter dieser Grundvoraussetzung die kommunikative semiotische Struktur entwickeln können. Wir fassen noch einmal die wesens-
bestimmenden Bedingungen der hier vorgestellten semiotischen Struktur zusammen: ⫺ Syntaktische Dimension: Signifikanten, realisiert durch Zeichen, die physiologisch als „Reize“ definiert sind; ⫺ Semantische Dimension: Signifikate, realisiert in Nachrichten beim Sender und beim Rezipienten; ⫺ Pragmatische Dimension: Botschaften und Wirkungen dieser Botschaften beim Rezipienten (Interpreten). Der verhaltensphysiologische Begriff „Kennreize“ bezieht sich auf solche Signifikanten, deren Nachrichten der Empfänger bestimmt (eine Fliege kann für fünf verschiedene Lebewesen gänzlich unterschiedliche Nachrichten darstellen und Wirkungen haben). Damit ist in unserem Sinne eine informationelle semiotische Struktur gegeben. Der Begriff „Signalreize“ bezeichnet in der Verhaltensphysiologie dagegen eine kommunikative semiotische Struktur (eine Fliege sondert Pheromone als „fly factor“ ab, die für Artgenossen die Nachricht tragen, daß am Ort ein reiches Nahrungsangebot besteht). Die Nachricht entsteht demnach bereits beim Sender. Er überträgt sie auf Artgenossen, indem er (hier chemische) Signifikanten aussendet, deren Signifikate bestimmte Empfänger (Artgenossen mit gleichem Grundalphabet, vielleicht sogar nur bestimmte genetisch mit dem Sender nahe Verwandte) „verstehen“ (vgl. Art. 9). Wir kommen darauf zurück. Es wurde hier angesprochen, weil die konventionellen Darstellungen der semiotischen Strukturen in der Verhaltensbiologie gewöhnlich von diesen kommunikativen Zusammenhängen ausgehen. Entsprechend heißt das zitierte Buch von W. J. Smith (1977) „The Behavior of Communicating“. Damit wird ein wichtiger evolutiver Aspekt aber zugedeckt: Die Signale, die eine Katze nutzt, um eine Maus zu erbeuten, werden gewiß nicht von der Maus für diesen Zweck abgegeben. Wir brauchen eine tiefe Einsicht in die ethökosemiotischen Strukturen, um die kommunikativen Semiosen angemessen interpretieren zu können.
3.
Typen von Ökosemiosen
3.1. Raum-Semiosen Die Voraussetzungen für ihre Kennzeichnung stellt Abbildung 27.6 zur Diskussion. RaumSemiosen 1. Ordnung beziehen sich auf den „Eigenraum“, das subjektive „Hier“. Wir be-
578
Abb. 27.6: Schematische Darstellung der Hypothese von den drei Raumklassen eines verhaltensfähigen Organismus.
zeichnen diese Raumklasse als „KontaktRaum“ (vgl. Art. 8, Art. 9 und Art. 11). Die Grunddimensionierung dieses Raums wird durch die Konstitution des individuellen Körpers vorgegeben. Die Kontaktbereiche können sein: (a) Boden oder andere aus festen materiellen Bestandteilen sich zusammensetzende Umgebungsstrukturen, (b) Wasser (flüssige Materie) und (c) Luft (gasförmige Materie). Bei fester Materie kann es einen Kontaktraum 2. Grades geben: er ist definiert durch die ohne Ortswechsel durch Körperanhänge (z. B. Extremitäten) erreichbaren Strukturen. Da bei vielen Tierarten kein Oberflächen-Sensorium für gasförmigen Raum existiert, können in diesem Kontext keine Semiosen entstehen, was jedoch bei flüssigen Medien gegeben ist. Für die Kontaktraum-Semiosen kann es art-, alters- und geschlechtsspezifische Erwartungswerte geben, so daß Extremalwerte (beim Menschen beispielsweise durch „Akzeleration“) zu Verhaltensbeeinträchtigungen im Sinne eines gestörten Eigenraumes führen können. Ferner gibt es artspezifische Grenzwerte für „Drucksemiosen“, die zu Ausweichbewegungen führen. Manche Insekten suchen in festen Umgebungsstrukturen Spalten auf, in die sie sich nur unter Kraftaufwand hineinzwängen können; ihre feste Cuticula ermöglicht ihnen dies (sie haben offenbar keinen „Schmerzsinn“). Säugetiere mit empfindlicherer Haut müssen sich anders verhalten. Die Kontaktraum-Semiosen sind offensichtlich an Exterorezeptoren gebunden, die Berührungen registrieren, wobei auch die „Raumschwelle“ wichtige Nachrichten liefern kann, also der noch getrennt erfaßbare Mindestabstand mechani-
III. Arten der Semiose
scher Hautreize. Unsere Fingerbeeren tragen pro Quadratzentimeter etwa 200 „Tastpunkte“. Bei Spinnentieren, Insekten, Krebsen, aber auch Säugetieren gibt es besondere Tasthaare. Bekannt sind die „Schnurrhaare“ bei Katzen, die zur Verarbeitung der von diesen gelieferten Informationen sogar eigene Projektionsfelder in der Hirnrinde aufweisen. Bei Insekten können solche Tasthaare mehrere Nachrichten getrennt verarbeiten: Richtung der Auslenkung, Grad der Auslenkung und Geschwindigkeit der Auslenkung. Solche Sensorien können auch dynamische Änderungen im Kontaktraum, beispielsweise Vibrationen, registrieren. Die Semiosen des Kontaktraumes können eine „Kontaktwelt“ konstituieren, etwa durch Differenzieren von Substrateigenschaften wie fest, flüssig, klebrig, hart, weich, um nur Beispiele zu nennen. Die Kontaktsemiosen tragen aber auch zur Eigenkontrolle der Körperdimensionierung bei und damit zur Körperbeherrschung und zum „konstitutionellen Selbstbild“. In der Humanevolution ist die Herausbildung des Bewußtseins tangiert. Semiosen des „Begreifens“, jetzt wörtlich genommen, sind wesentliche Konstituenten von Raumerfahrungen, die bei höheren Wirbeltieren Voraussetzungen ihrer kognitiven Leistungen darstellen. Diese Thematik setzt sich im Nah-Raum fort, doch mit dem entscheidenden Unterschied, daß hier die Semiosen Distanzrezeptoren voraussetzen, die also Umgebungseigenschaften und -vorgänge auf Abstand wahrnehmen können. Die drei bekanntesten und unter Lebewesen auch am weitesten verbreiteten Sinnesorgane mit diesen Voraussetzungen nennen wir „Nase“, „Auge“ und „Ohr“, womit wir zugleich die räumliche Anordnung bei den Wirbeltieren, die funktionell bestimmt ist, wiedergegeben haben (vgl. Art. 6, Art. 7 und Art. 9). Beim Ohr sollten wir auch an die Sensoren erinnern, die Schwerkraftfelder registrieren (vgl. Art. 12 § 3.1.). Riechen, Sehen und Hören sind auch in dieser Reihenfolge stammesgeschichtlich entstanden. Wir werden die mit ihnen verbundenen Semiosen noch bei den speziellen Funktionskreisen ansprechen, hier stehen sie für die Dimensionierung des Nah-Raumes, der in komplexer Weise durch ihre aktuellen Signifikate gegeben ist. Darauf nehmen Richtungsfelder wesentlichen Einfluß: auch wir haben einen „sehtoten Raum“, der jedoch akustisch präsent sein kann, wenn er eine oder mehrere Schallquellen enthält. Wir hätten hier ebenfalls wieder Semiosen 2. Grades, die zwar ak-
27. Ökosemiose
tualisiert werden können (wenn wir hinschauen), wenn die betreffenden Zeichen im Nah-Raum liegen, aber momentan unsichtbar sind (hinter uns oder durch Objekte verdeckt). Der Nah-Raum 1. Grades ist der aktuell präsente Ausschnitt aus dem NahRaum. Der Komplexitätsgrad wird auch noch durch die „Mehrkanaligkeit“ (vgl. Artikel 12 und 13) eines multisensorischen NahRaumes erhöht; es interferieren „Riechwelt“, „Sehwelt“ und „Hörwelt“, und dies beim Hund sehr verschieden von uns. Wir bewegen uns hier im „Brennpunkt“ der Ethökosemiosen. Und viele von uns wissen, wie sich die „Binnenstruktur“ nochmals verändert, wenn einer der Kanäle beeinträchtigt ist oder gar ausfällt. Semiosen im Nah-Raum werden natürlich zusätzlich noch von den Leistungseigenschaften der Sensoren mitbestimmt, bei Fledermäusen von Hörorganen, deren obere Frequenzgrenze weit über 100 kHz betragen kann, bei manchen Insekten durch optische Wahrnehmung für uns unsichtbarer Spektralbereiche des Lichtes (ultraviolett) oder durch die Möglichkeit, daß chemische Signale bis zur tiefsten Schwelle (ein Molekül) noch reizwirksam sein können. Diese Andeutungen möchten darauf verweisen, wie vielfältig die semiotischen Strukturen im Nah-Raum sein können, wobei die Frage nach den sich daraus ableitenden Signifikaten noch gar nicht angesprochen ist, und dies aus guten Gründen, denn bei Tieren sind ja die Umweltbeziehungen im Nah-Raum weitgehend kontextuell fixiert, also mit bestimmten Motivationen verbunden. Trotzdem müssen wir bei solchen Semiosen ⫺ etwa Blüten-Signalen als Zeichen für Nektar oder Pollen ⫺ immer bedenken, daß auch unspezifische Raum-Semiosen gegeben sind, vielleicht als Orientierungs-Hintergrund. Damit ist ein eigener Funktionalbereich der Raum-Semiosen angesprochen: Die Orientierung im Raum. Hier können vier Typen der Orientierung unterschieden werden: 1. Bestimmung der Raumlage des Körpers, 2. Ortsbestimmung, 3. Objektorientierung (im Nahbereich), 4. Zielorientierung ⫽ Navigation ⫽ Wegfinden oder Richtungsorientierung, wenn das Ziel im Distanz-Raum liegt. Daraus leiten sich natürlich funktionsspezifische Raum-Semiosen ab, deren Signifikanten sich bei den verschiedenen Organismenarten erheblich unterscheiden können (vgl. Art. 13 § 2.3.). Wir kennen die Sichtpeilung (auch Pilotieren genannt), die Hörpei-
579 lung, die Riechpeilung und die Magnetfeldpeilung (vgl. Art. 10 § 3.2.3.). Bei der Vektornavigation werden Signifikate über Richtung und Entfernung als Streckenwerte aufsummiert, woraus die relative Lage zum Startpunkt bestimmt werden kann. Signifikate können gewonnen werden aus Luftbewegungen, Wasserströmungen, Corioliskräften (als Trägheitskräften bei rotierenden Körpern), aus dem Schwerefeld der Erde, über den atmosphärischen Luftdruck, mittels Infraschall oder aus elektrischen Feldern, speziell im Wasser (vgl. Art. 10). Semiosen im Distanz-Raum stellen ein besonderes Problem dar, denn der DistanzRaum ist durch interne Repräsentanz gegeben (vgl. Art. 13 und 14). Die innere Selektion der Selbstorganisation ist im Spiel. Die semiotische Struktur entsteht auf Grund eines kontextuell selektiven Abrufens von Signifikanten aus den genetisch fixierten und/ oder individuell erworbenen Speicherinhalten; und daraus resultiert die „Handlungsanweisung“. Diese bedient sich beim Navigieren nach sensorisch nicht verfügbaren Zielen externer Signifikanten. Die internen Semiosen können „Suchbilder“ erzeugen; darauf werden wir noch beim Nahrungserwerb zurückkommen. 3.2. Zeit-Semiosen In Abbildung 27.7 wurde versucht, die ZeitSemiosen analog zu den Raum-Semiosen zu unterteilen. Dabei wurden dieselben Grundbegriffe gewählt, obwohl sie in diesem Fall sprachlich nur bedingt adäquat sind. Die „Kontakt-Zeit“ leitet sich wieder aus den konstitutionellen Eigenschaften des Individuums ab, ist artspezifisch und kann auch
Abb. 27.7: Schematische Darstellung der Hypothese von den drei Zeitklassen eines verhaltensfähigen Organismus.
580 altersspezifisch variieren. Sie hängt mit der „Zeitquantelung“ im jeweiligen Organismus zusammen. Bei manchen Vogelarten kann das zeitliche akustische Auflösungsvermögen etwa 10mal so hoch liegen wie beim Menschen, so daß Vögel bestimmte Laute noch als Impulsfolge erkennen, die für uns als Dauerton erscheinen. Bei Insekten liegt im optischen Bereich ebenfalls ein weit höheres zeitliches Auflösungsvermögen vor als bei uns. So würden Bienen oder Wespen einen Film mit 220 Bildern pro Sekunde noch als Folge von Einzelbildern sehen. Das sind Momente der „Eigenzeit“, zu denen sich noch komplexe interne Zeitmuster physiologischer Vorgänge gesellen, die ein komplexes hierarchisches Zeitgefüge im Organismus konstituieren. Wie sich dieses bei der Bildung von Signifikaten umsetzt, ist nur fragmentarisch bekannt, sieht man von den eben genannten wichtigen Leistungen der Rezeptoren ab. Die eigentlichen Oszillatoren werden als Schrittmacher bezeichnet. Angesichts der fundamentalen Bedeutung, die dem Zeitphänomen im Zusammenhang mit unserer Fragestellung zukommt, sei in Abbildung 27.8 versucht,
Abb. 27.8: Schematische Darstellung der Evolution der Zeitparameter.
den Hintergrund hypothetisch überschaubar zu machen. Diese Darstellung weist unseren Standort aus, der auf der Ebene der Selbstorganisation und dort (hier nicht differenziert) im Bereich der organismischen Evolution angesiedelt ist. Erst für diese können wir den Begriff der „subjektiven Zeit“ ins Kalkül bringen. Das Bewußtsein über die Zeit setzt humanspezifische Stufen der Evolution voraus: die soziokulturelle Ebene und die gesellschaftliche Ebene.
III. Arten der Semiose
Die Eigenzeit ist eine Voraussetzung für die Bildung der Ökosemiosen im Rahmen des aktuellen Verhaltens; damit ist die Ebene der „Nah-Zeit-Semiosen“ angesprochen. Die „subjektive Ereigniszeit“ markiert den Gegenwartsfluß im Rahmen von Aktualgenesen, dem Werden und Vergehen einer Verhaltenseinheit. Wichtige Semiosen in diesem Kontext sind die „Zeitgeber“: Äußere Signale ⫺ beispielsweise der Hell-Dunkel-Wechsel ⫺ werden zur Synchronisation interner Schrittmacher genutzt. Ein Kurzzeit-Arbeitsspeicher ermöglicht, Zeitfolgen bis zu einer Dauer von 15 bis 20 Sekunden als Ganzheit zu erfassen; damit können Zeitmuster Signifikate konstituieren. Diese über serielle Zeichenfolge gebildeten Signifikate sind besonders im akustischen Kanal dominierend, doch kommen hier speziell bei Säugetieren auch Parallelsysteme zum Einsatz, beispielsweise als Frequenzgemische. Auch bei Vibrationssignifikanten sind Zeitmuster die bestimmenden Elemente für die Signifikate. In allen Funktionskreisen, besonders jedoch im Kontext der Kommunikation sind Zeitmuster wichtige Bestandteile der Semiosen. Der subjektive Ereignisraum und die subjektive Ereigniszeit liefern entscheidende Voraussetzungen für die verhaltensbestimmte Organismus/Umwelt-Verknüpfung. Die Semiosen der Distanzzeit sind primär determiniert durch die biologisch vorgegebene Lebenserwartung des Individuums; sie bettet die gegenwartsgebundene subjektive Ereigniszeit in ein Kontinuum von Vergangenheit und Zukunft ein. Die Distanzzeit 1. Grades bezieht sich auf die Ontogenese als biologisch vorgegebene arttypische Lebenserwartung. Die Distanzzeit 2. Grades ist phylogenetisch angelegt: die Zukunft ist offen (es gibt kein „Omega“). Als Beispiel für Signifikate im Kontext der Distanzzeit 1. Grades seien die wegen ihres Schnabelbaus als „Kreuzschnäbel“ bezeichneten Singvögel genannt, die in unseren Breiten zu einer ungewöhnlichen Jahreszeit ⫺ im Winter ⫺ balzen; dadurch wird erreicht, daß die Jungen zu Zeiten eines reichen Nahrungsangebotes (Fichtensamen) schlüpfen. Ähnliches gilt auch für viele Arten der Säugetiere: die Tragzeit bestimmt den Zeitpunkt der Begattung, der sichern muß, daß die Jungen zu einer für ihre Entwicklung günstigen Jahreszeit zur Welt kommen. Infantizid als Tötung von Kindern fremder Väter ist dagegen ein Verhalten, das auf die Distanzzeit 2. Grades ausgelegt ist: der Durchsatz eigener Gene in künftigen Ge-
27. Ökosemiose
nerationen wird dadurch gefördert. Im übrigen sind auch in der Wahl des Zeitpunktes der Fortpflanzung beide Distanzen enthalten: die Dauer der Tragzeit (Distanzzeit 1. Grades) und die Sicherung der Generationenfolge als Distanzzeit 2. Grades (ultimate factor). 3.3. Semiosen im Dienst des stoffwechselbedingten Verhaltens Hier sind funktionell zu unterscheiden: Nahrungserwerb (Flüssigkeitsaufnahme eingeschlossen), Abgabe von Stoffwechselschlakken, Ruhe und Schlaf, Rekelsyndrom und Gähnen. Da die letztgenannten Verhaltensformen weitgehend physiologisch determiniert sind, sind in diesem Kontext Ökosemiosen eher die Ausnahme. Anders ist es bei Verhaltensweisen im Dienst von Ruhe und Schlaf. Hier sind bestimmte Umwelteigenschaften gefordert, wobei oft abiotische Signifikanten die semiotische Struktur konstituieren. Dazu gehören Bodenbeschaffenheit, die über spezielle Parameter angezeigt wird, oder auch Lichtverhältnisse, Temperaturbedingungen, Luftbewegung und oft auch eine Zeitbestimmung. Nicht selten werden Umwelteigenschaften aktiv verändert. Da wir jetzt beim motivierten Verhalten sind, sollten drei semiotische Ereignisfelder angesprochen werden, die für motiviertes Verhalten kennzeichnend sind (Abb. 27.9):
Abb. 27.9: Hypothese der Dreiphasenstruktur motivierten Verhaltens unter Berücksichtigung der relevanten Klassen von Semiosen.
1. Semiosen als Stützinformationen bei der Umsetzung von Suchalgorithmen im Appetenzverhalten I: orientierendes Verhalten,
581 2. Semiosen zur Sicherung der Diskrimination bei der Umsetzung von Verhaltensentscheidungen im Appetenzverhalten II: orientiertes Verhalten, 3. Semiosen als „Schlüsselreize“ zur Umsetzung des beendenden Verhaltens: Endhandlung (consummatory action). Diese drei Ereignisfelder nennen wir „Distanzfeld“, „Nahfeld“ und „Kontaktfeld“; sie sind durch die jeweils zugrunde liegende Motivation kontextuell definiert. Der Begriff „Schlüsselreize“ betrifft hier Semiosen, die ein artspezifisches Verhaltensmuster in Gang setzen, das die Zielfunktion der jeweiligen Motivation sichert. Das bedeutet, ein Schimpanse sucht abends einen Baum auf, um an geeigneter Stelle mit Hilfe von Zweigen in Pflanzenteilen ein Nest herzustellen, nicht „um zu schlafen“. Auch die Einnahme der Ruhestellung ist eigenmotiviert und schafft die Voraussetzung für den Schlaf. Wir können es auch anders sagen: Die Ökosemiosen sichern die letzten Gründe (ultimate causes), die dem sich verhaltenden Tier unbekannt sind. Ein Tier sucht Nahrung, um zu fressen, nicht um satt zu werden. Es sucht einen Partner, um zu kopulieren, nicht um Nachkommen zu erzeugen, obwohl das Verhalten genau darauf optimiert ist. Semiosen sichern die Interaktionen mit der Umwelt, die erforderlich sind, damit letzte Zwecke erfüllt werden. Dieser Exkurs war hier geboten, weil die nun zu behandelnden Funktionskreise genau diese Form der Umweltinteraktionen umsetzen. Zugleich weisen sie in Richtung Humanevolution: Wissen im Dienst des Voraussagens, Wissenschaft zur Erschließung der ultimate factors. Das setzt eine erweiterte Form des Bewußtseins voraus. Mit diesen Hinweisen kehren wir zu dem Funktionskreis des stoffwechselbedingten Verhaltens zurück, der für die Evolution tierischen Verhaltens eine Schlüsselstellung einnimmt, weil organische Substanzen als Grundlage der Ernährung an Lebewesen gebunden sind. Diese sind die Quellen der erforderlichen Signifikanten. Damit ist ein weiteres Grundproblem der Ökosemiosen im Kontext motivierten Verhaltens angesprochen. Motiviertes Verhalten hat Funktionsobjekte, die Nahrungsquellen. Nehmen wir Mäuse als Beispiel für Nahrungsobjekte eines Fuchses. Dann kann es zwei Funktionalbereiche geben (Abb. 27.10): 1. das Funktionsobjekt als Signifikant 1. Ordnung für das Signifikat Nahrungsquelle,
582
III. Arten der Semiose
Abb. 27.10: Relevante Signifikanten-Klassen in einer motivierten Umweltbeziehung eines verhaltensfähigen Organismus, dargestellt als Enkapsis.
Abb. 27.11: Relevante Signifikat-Klassen in einer motivierten Umweltbeziehung eines verhaltensfähigen Organismus, dargestellt als Enkapsis.
2. funktionelle Randbedingungen als Signifikant 2. Ordnung für das Signifikat Nahrungsquelle. Letztere wären beispielsweise Mäuselöcher, die optische Signifikanten liefern und vielleicht dann „belauert“ werden, wenn chemische Signifikanten hinzukommen, die anzeigen, daß der Gang noch benutzt wird. Im physiologischen Sinne könnten solche Signifikanten 2. Ordnung als „bedingte Reize“ bezeichnet werden, weil sie regelhaft mit dem „unbedingten Reiz“ (hier der Maus) als Signifikanten 1. Ordnung zusammen auftreten. In unserer Abbildung 27.10 sind zudem noch die unspezifischen Randbedingungen ausgewiesen als „Milieu“, gegeben durch wahrnehmbare Umwelteigenschaften, die für das betreffende Tier keinen regelhaften Zusammenhang mit dem aktuellen Kontext erkennen lassen, gleichwohl aber wahrgenommen werden, nicht nur als Quelle möglicher Störung oder Gefährdung, sondern auch im Sinne der erwähnten Speicherstrategie als Quelle potentieller Stützinformationen für das aktuelle Verhalten. Der Umfang dieser Semiosen hängt von der Organisationshöhe der betreffenden Tierart ab. Im Beispiel: Solche Randbedingungen könnten es in einem speziellen Fall fast unmöglich machen, sich unbemerkt dieser potentiellen Beute anzunähern. Auf der Pirsch sind brechende Zweige oder trockenes Bodenlaub zu meiden, ebenso auch Rückenwind. Also sind entsprechende Semiosen gefordert, um diese Randbedingungen zu umgehen. Eine besondere Form der Umweltbeziehungen ergibt sich für solche Tierarten, deren Nahrung lebende Tiere sind. Denn diese sind selbst verhaltensfähig und entwickeln als Beuteobjekte Überlebensstrategien.
Daraus leitet sich ein weiteres Grundproblem für die semiotischen Kontexte ab, die zwischenartlichen Interaktionen: 1. Semiosen bei Konkurrenz, z. B. Akquisition gleicher Ressourcen (competition), 2. Semiosen bei Antagonismus, z. B. Verhalten von „Räuber“ (Prädator) und Beute, 3. Semiosen bei Kooperation, z. B. Symbiose. Bei Konkurrenz um Ressourcen, wie etwa Nahrung, zeigen semiotische Strukturen die „biologische Rangordnung“ an: ein Gepard weicht aus, wenn Hyänen sich seiner Beute nähern. Sehr komplex sind Semiosen im Kontext des Prädator/Beute-Verhaltens. Das Schutzverhalten werden wir noch als eigenen Funktionskreis ansprechen; es dient der Erhaltungsstrategie bei der Beute. Spezielle Semiosen können jedoch das Verhalten des Prädators fördern: ⫺ somatolytische Semiosen: Es werden Signifikanten gebildet, die den Körper optisch auflösen oder Umgebungsstrukturen vortäuschen; ⫺ motorische Semiosen: Es werden Signifikanten gebildet (etwa durch „Zeitlupenbewegung“), die den Körper unsichtbar werden lassen bei Tierarten, die nur bewegte Objekte erkennen können; ⫺ Täuschungs-Semiosen: Es werden Signifikanten gebildet, die ein Objekt vortäuschen, das bei dem Beuteobjekt Annäherung auslöst, weil es für dieses ein Nahrungsobjekt simuliert. So gibt es bei Fischarten oder auch Wasserschildkröten fädige Anhänge in der Kiefer-Mund-Region, die wurmartige Bewegungen ausführen, während der Prädator selbst regungslos bleibt.
27. Ökosemiose
3.4. Schutz-Semiosen Der Schutzbedarf eines Lebewesens wird durch verschiedene Umweltbedingungen sowie Eigenschaften des eigenen Körpers bestimmt. Konkurrenz, Prädator-Druck und Ausmaß der Eigenbewegung sind wichtige Faktoren, die Schutzanforderungen stellen. Dabei ergibt sich ein besonderes Problem im Zusammenhang mit den kommunikativen Signalen, etwa bei der Balz, die Rivalen abwehren und Sexualpartner anlocken „sollen“. Sie haben einen „unerwünschten“ Nebeneffekt, da sie auch die Möglichkeit steigern, von Prädatoren bemerkt zu werden. Auch Warnsignale gefährden den Sender. Schutz-Semiosen können ähnliche Eigenschaften aufweisen wie bei den Prädatoren, die sich vor Beute sichtschützen. Es gibt also somatolytische Semiosen, die auch als Tarn-Semiosen bezeichnet werden können; einen Sonderfall stellt die Gegenschattierung dar mit heller Unterseite, die bei Belichtung des Körpers von oben den dreidimensional-räumlichen Körpereindruck aufhebt oder doch erheblich einschränkt. Und es gibt Täuschungs-Semiosen, wofür Insekten wie „Wandelnde Blätter“ oder Stabschnecken, aber auch manche Schmetterlinge, die in Ruhestellung wie tote Blätter aussehen, Beispiele sind. Einige ChamäleonArten bieten Signifikanten, die „toten Körper“ anzeigen, starr auf der Seite liegend; Tiere, die nur lebende Beute als Nahrung annehmen, beachten diesen reglosen Körper nicht. Bei Wirbeltieren sind Augen Signifikanten für „vorn“, und damit für Lauf- oder Fluchtrichtung bei Gefahr. Manche Fische weisen am Hinterkörper täuschende Augenflecke auf, so daß ein Prädator in diese Richtung schnappt, während der Fisch in Gegenrichtung flieht. Eindrucksvolle Darstellungen für diese Semiosen finden sich bei Zabka (1989) und Morris (1991). Ein Sondertyp der Täuschungs-Semiosen ist mit Vergrößerung der Kontur gegeben, wodurch eine Körpergröße vorgetäuscht wird, die real gar nicht gegeben ist. Das ist recht effizient, da für viele Beutegreifer die Körpergröße ein Aufwand-Kriterium ist, bei manchen Arten kann diese ab einer bestimmten Schwelle Fluchtverhalten auslösen. Abschreckende Täuschungs-Semiosen liegen vor, wenn bei Gefahr plötzlich Scheinzeichen gezeigt werden wie große Augen auf den Flügeln von Schmetterlingen, die damit einen Wirbeltierkopf vortäuschen. Es gibt Krötenarten, die bei Bedrohung sich aufblähen und zugleich dem Feind das Hin-
583 terteil zuwenden, wo nun große Augenflecke sichtbar werden und das Ganze einen Kopf vortäuscht, zu dem ein ungleich größerer Körper gehören müßte, als die Kröte ihn besitzt. Erinnert sei auch an die Warn-Semiosen, die auf ungenießbare oder mit Abwehrgiften ausgestattete Körper schließen lassen. Eng verwandt sind die Schutz-Mimikry-Semiosen, die wiederum Täuschungs-Semiosen sind, wobei die Zeichen die Signifikanten der wirklich durch die vorgenannten Eigenschaften geschützten Arten simulieren. Täuschungs-Semiosen im Sinne der Mimikry gehen freilich weit über das Schutzverhalten hinaus; so weisen bestimmte Orchideen-Blüten Zeichen auf, die Geschlechtspartner spezieller Insekten-Arten anzeigen. Dadurch wird der für die Orchideen lebenswichtige Anflug mit Pollenübertragung gewährleistet. 3.5. Erkundungs-Semiosen Wir wiederholen: diese Semiosen gehören in einen Kontext, der bei bestimmten Tierarten als eigenmotiviertes Erkundungsverhalten,
Abb. 27.12: Semiosen eines verhaltensfähigen Organismus, bezogen auf die drei Grundklassen möglicher Quellen für diese Semiosen.
auch „Exploration“ genannt, umgesetzt wird. Kennzeichnende Verhaltensmechanismen sind fakultative Lernvorgänge über „offene Programme“ sowie über das Spielverhalten, bei dem wir Solitärspielverhalten und Sozialspielverhalten als elementare Klassen unterscheiden. Bei den Solitärspielen liefert das Ökosystem den Bezugsrahmen, hier wären demnach spezielle Ökosemiosen zu erwarten. Funktionell können wir unterscheiden: ⫺ Neophobie-Semiosen: Die Zeichen bewirken ein Meideverhalten gegenüber den
584 Zeichenträgern (Sematophoren); ein diffuger (⫽ distanzvergrößernder) Status ist gegeben. ⫺ Neophilie-Semiosen: Die Zeichen bewirken Zuwendung, gegebenenfalls bis zur Aufnahme eines Objektkontaktes; ein affiner (⫽ distanzverringernder) Status liegt vor. In beiden Fällen wäre „Neuheit“ des Signifikanten per definitionem Voraussetzung. Diese impliziert, daß der Zeichenträger als solcher erkannt wird; da er sich im Nahfeld befindet, sind die bereits angesprochenen Bewertungs- und Entscheidungsleistungen gefordert, während das Erkennen eine Diskriminationsleistung voraussetzt (vgl. Abb. 27.9). An dieser Stelle sollten wir daran erinnern, daß es eine evolutiv bedingte KanalHierarchie gibt (Abb. 27.13):
Abb. 27.13: Enkaptisches Schema zur Darstellung der Evolutionsstufen der organismischen Semiosen, bezogen auf die Übertragungskanäle der Zeichen.
1. unimodale semiotische Strukturen mit akustischen Zeichen aktivieren beim wahrnehmenden Organismus semiotische Strukturen mit optischen Zeichen; 2. unimodale semiotische Strukturen mit optischen Zeichen aktivieren beim wahrnehmenden Organismus in affinem Status semiotische Strukturen mit chemischen Zeichen; 3. im Objektkontakt dominieren dann semiotische Strukturen mit chemischen sowie taktil-mechanischen Zeichen (Berührung) und bioelektrischen Feldern. Evolutiv ist Stufe 3 die älteste, sie ist ausschließlich gegeben bei Vorzellern (Prokaryota) und fast ausschließlich bei Einzellern (Protoctista), sie dominiert auch bei Pflanzen (Plantae) und Pilzen (Fungi). Daraus leitet
III. Arten der Semiose
sich bei den tierischen Organismen (Animalia), soweit sie über die hier angesprochenen Rezeptor-Modalitäten verfügen, eine „Bedarfshierarchie“ für semiotische Strukturen ⫺ also Informationen ⫺ ab: Wer etwas hört, versucht dies auch optisch wahrzunehmen (nicht aber umgekehrt), optische Semiosen aktivieren, falls Informationsbedarf besteht, chemischen und/oder taktilen Objekt-Kontakt; die bioelektrischen Semiosen vollziehen sich auf den metabolischen Ebenen (vgl. Abb. 27.3); sie unterliegen daher keiner Kontrolle durch die Verhaltensebene. Optische Semiosen bilden aber auch autonome Primärgestalten, die per se verhaltenswirksam sind als komplexe Raumwahrnehmungen und Orientierungshilfen, wie beispielsweise „Sternbilder“ für eine Astronavigation. Gleichwohl verbindet sich auch hier der Bedarf an Informationszuwachs mit der Distanzverringerung; der Mensch hat den dabei oft unüberwindlichen Hiatus durch optische Hilfsmittel überbrückt, die ihm schließlich auch den „Mikrokosmos“ erschlossen haben, wobei aber die Prinzipien der Konstruktion semiotischer Strukturen, die mit der Evolution unter äußerer Selektion an den „von Natur aus“ wahrnehmbaren „Mesokosmos“ angepaßt sind, auch dann wirksam sind, wenn sie den objektiven Bedingungen im Mikrobereich nicht angemessen sind, wir also „Gestalten“ oder Zusammenhänge wahrnehmen, die real nicht bestehen. Das gilt auch für den Makrokosmos, wie die „Sternbilder“ zeigen (vgl. Art. 46 § 5.). Mit diesem Exkurs haben wir jedoch unsere ethökologische Ebene der Semiosen nach oben überschritten (vgl. Abb. 27.3). Kehren wir also zu dieser zurück. Hier können wir bei den Erkundungs-Semiosen nur darauf verweisen, daß die semiotischen Strukturen maßgeblich von den Speichermechanismen mitbestimmt werden, die ihrerseits wieder einer Evolution unterworfen sind. Auf der ethökologischen Ebene sind es ausschließlich interne Vorgänge im neuro-humoralen Bereich („humoral“ steht für Transport von Mediatoren als chemischen Substanzen durch Körperflüssigkeiten). Erst der Mensch hat externe Informationsspeicher entwickelt. Nimmt man die unterschiedlichen Formen der Lernvorgänge hinzu, so ist ein komplexes Thema angesprochen, das gegenwärtig im Hinblick auf die Semiotik noch grundsätzlicher Analytik bedarf, besonders in bezug auf die organismische Evolution.
27. Ökosemiose
3.6. Partner-Semiosen Diese Semiosen stellen im klassischen Sinne den zentralen Themenbereich der Semiotik; hier soll daher nur der ökologische Aspekt angesprochen werden. Der Begriff „Partner“ ist mehrdeutig und bedarf auf der organismischen Ebene einer Untersetzung: 1. zwischenartliche Partnerschaft: 1.1. antibiotisch, z. B. Parasitismus, 1.2. probiotisch, z. B. Symbiose, 1.3. eubiotisch, z. B. Phoresie (Transportbeziehung), Ökie (Ansiedlung neben, auf oder in einem anderen Organismus), Kommensalismus (gemeinsame Nahrungsaufnahme); 2. innerartliche Partnerschaft: 2.1. sexuelle Partnerschaft, 2.1.1. heterosexuell, 2.1.2. homosexuell, 2.2. Alterspartnerschaft (Zusammenleben verschiedener Altersklassen etwa bei der Brutpflege), 2.3. Sozialpartnerschaft (Zusammenleben per se als Bindungsphänomen), 2.3.1. temporär (z. B. Wandergesellschaften), 2.3.2. periodisch (nur in bestimmten Lebens- oder Entwicklungsphasen, bei manchen Fliegen als Larven), 2.3.3. permanent (alle Stadien leben kontinuierlich sozial wie bei den „staatenbildenden“ Insekten). Damit sind die wesentlichen Formen der Partneransprüche ökologisch definiert als spezielle Klasse der Organismus/Umwelt-Beziehungen und als entsprechend evolutionsrelevanter Mechanismus. Die zwischenartlichen Beziehungen erfordern spezielle Semiosen, da sie meist artspezifisch sind (vgl. Art. 163). Bestimmte Milbenarten brauchen spezifische Signifikanten, die ihnen etwa einen Mistkäfer (Geotrupes) anzeigen, den sie als „Transportwirt“ besteigen, um per Flug zum nächsten „Merotop“, einem Dunghaufen, zu gelangen, wo sie wieder absteigen. Das gilt auch für Parasiten, von denen manche Außenparasiten (Ektoparasiten) wie die Flöhe stenoxen sind, also vielleicht nur auf einer einzigen Wirtsart leben. Das erfordert ein hochselektives Suchbild. Oder in der Sprache der Semiotik: Das Signifikat ist auf unaustauschbare Signifikanten angewiesen. Das gilt jedoch nicht für den Rattenfloh, der euryxen ist; so konnte er mit schwerwiegenden Folgen in der Geschichte der Menschheit den Erreger der Pest auch auf den Menschen übertragen. Sehr selektiv sind auch jene Se-
585 miosen, die Symbiosen sichern. Anemonenfische weisen eine Immunität gegenüber den toxischen Sekreten der Nesselkapseln der „Seerosen“ (Actinien) auf. Es gibt Beziehungen zwischen einem Schleimfisch und einem augenlosen Krebs, der Höhlen im Meeresboden gräbt, in denen beide zusammenleben. Der Fisch führt den Krebs zu gemeinsamen Nahrungsgründen, wobei der Krebs mit seinen langen Fühlern Kontakt zum Schwanz des Fisches hält. Man kann ahnen, welche speziellen Semiosen hier erforderlich sind, damit dieses Zusammenleben gesichert werden kann. Bei den Semiosen, die im Kontext der Kommunikation evolviert sind, gelten für Zeichen, die als konstitutionelle Struktureigenschaften vorgegeben sind, im optischen Kanal folgende Prämissen: 1. Offene Signifikanten: Die Zeichen liegen sichtbar an der Körperoberfläche 1.1. als Konturparameter (oft verweisen sie beim Adressaten auf Signifikate für den Geschlechts- oder Altersstatus), 1.2. als Flächenparameter (Zeichnungsund Farbmuster). 2. Verborgene Signifikanten: Die Zeichen werden erst durch Verhaltensvorgänge wahrnehmbar 2.1. physiologisch gesteuert (Farbwechsel, Rötung über Durchblutung, Schwellungen, Pilomotorik ⫽ Stellungsänderungen der Haare, entsprechend bei Federn), 2.2. motorisch gesteuert („Demonstrationsbewegungen“). Konstitutionelle Signifikanten können auftreten: a) temporär (Beispiel „Balzkleider“), b) periodisch (nur bei bestimmten Altersoder Entwicklungsstadien), c) permanent, dann mit drei Zuordnungen: c 1) bei allen Angehörigen der Art als ArtSignifikanten, c 2) geschlechtsgebunden als Sexual-Signifikanten, c 3) individuell als Individual-Signifikanten. Da solche Semiosen über die Artgrenzen hinaus auftreten (auch wir erkennen eine solche Zuordnung), haben sie auch eine ethökologische Valenz. Bei Greifvögeln sind die Weibchen gewöhnlich deutlich größer als die Männchen; damit sind Semiosen, die den Sexualstatus interpretieren, für Beutetiere durchaus relevant. Einen Spezialfall der Individual-Semiosen stellen die „Außenseiter-Se-
586
III. Arten der Semiose
Abb. 27.14: Beispiel für kommunikative Signifikanten, die IndividualSemiosen konstituieren. Gezeigt sind Sonagramme von zwei Männchen des Seriema (Cariama cristata), eines Kranichvogels; innen an der Ordinate (Frequenz in kHz) ist für den markierten Laut das gemittelte Spektrum abgetragen. Diese Darstellung zeigt damit drei differenzierende Parameter: das Zeitmuster der Sequenz, die interne Lautstruktur und das Frequenzspektrum.
miosen“ dar, die ein Individuum aus den Normbereich der jeweiligen Semiosen-Klasse herausfallen lassen, was zu „Außenseiter-Reaktionen“ führen kann (Neumann 1981). Solche Normabweichungen können Krankheiten indizieren. Natürlich liegt der Schwerpunkt der Individual-Semiosen im Bereich der eigentlichen innerartlichen Kommunikation. Wegen seiner Bedeutung möchten wir mit einem Beispiel für akustische Zeichen diese Betrachtung abschließen (Abb. 27.14). 4. Anthropogene Ökosemiosen Der Mensch hat die Biosphäre tiefgreifend umgestaltet. Die Konsequenzen sind noch unabsehbar. Das aber fordert uns auf, die Semiotik für die relevanten Fragestellungen einzubringen. Der hier bereits vorgestellte Kontext bietet zwei zentrale Problemkreise: a) Welche biologischen Hintergründe gehen in die anthropogenen Umweltsemiosen des Menschen ein?
b) Wie interagieren die nicht-menschlichen Lebewesen mit der vom Menschen geschaffenen Noosphäre? Zur ersten Frage steht hier nicht die Kultursemiotik zur Erörterung (vgl. Lotman et al. 1975 und Lotman 1990 sowie Posner 1992). Gefragt ist aber, in welchem Zusammenhang die beiden obersten Semiose-Ebenen der Abbildung 27.3 zu den tieferen und damit älteren stehen, denn die beiden höchsten ⫺ weil jüngsten ⫺ Ebenen semiotischer Strukturen sind Konstituenten der vom Menschen geschaffenen Noosphäre. Im Verhalten verbinden sie sich mit den „Sekundär-Motivationen“. Diese sind dadurch gekennzeichnet, daß sie sich umsetzen über anthropogen veränderte oder auch neu geschaffene Bedingungen im Umfeld: ⫺ veränderte oder neue Funktionsobjekte (beispielsweise chemisch und mechanisch behandelte Nahrung oder synthetisierte Nährstoffe),
27. Ökosemiose
⫺ veränderte oder neue funktionelle Randbedingungen (etwa Bestecke, Teller, Tassen bei der Nahrungsaufnahme), ⫺ verändertes oder neuartiges Milieu (wenn wir beispielsweise eine „Gaststätte“ aufsuchen). Gerade dieses Beispiel läßt eine komplexe „semiotische Erbschaft“ erkennen, wenn wir Speisen mit den Blicken fixieren oder Nahrung vor dem Einführen in den Mund optisch und mit der Nase chemisch prüfen oder in der Gaststätte ⫺ besonders ohne Gesellschaft ⫺ in regelmäßigen Folgen umherschauen. Das ist für ein einzelnes Individuum in der Natur lebenswichtig, weil Konkurrenten oder Prädatoren in der Nähe sein könnten. Auch bei Tieren liegt ein Gruppenvorteil darin, daß ein Individuum weniger Zeit für Sichern aufwenden muß. Was wir sagen wollen, ist dies: Sekundärmotivationen, eben im Beispiel vorgestellt, haben einen biologischen Hintergrund, werden aber über semiotische Strukturen umgesetzt, die essentiell individuelle Erfahrung anfordern. Damit sind im Sinne unserer Darlegungen (Abb. 27.2) tradi- und ratiogenetische Potentiale im Spiel. Tradigenetisches Potential kann „Prägungs-Semiosen“ erzeugen. Die Mutter bewertet Zeichen für vom Menschen produzierte Gegenstände, Vorgänge oder Milieubedingungen positiv oder negativ, das Kleinkind übernimmt diese informationellen Umweltbeziehungen. So konstituieren sich Appetenzen oder Aversionen gegenüber bestimmten Zeichenträgern, deren Quellen der heranwachsende Mensch nicht ins Bewußtsein überführen kann. Sie können vielleicht den Charakter von Phänokopien aufweisen: der Mensch verhält sich, als gäbe es angeborene Präferenzen und Aversionen gegenüber Umgebungsbedingungen, die er vielleicht erst in seiner Humanevolution verloren hat und die sich nun auf vom Menschen selbst veränderte oder gestaltete Umgebungseigenschaften oder Signifikanten beziehen. Ein anderes Element, das auf diese Beziehungen zu anthropogenen Zeichenträgern Einfluß nehmen kann, leitet sich aus der ästhetomorphen Dimension der Selbstorganisation ab. Daraus können stammesgeschichtlich entstandene Präferenzen für bestimmte Ordungsmuster resultieren, die räumliche wie auch zeitliche Parameter betreffen, welche den Wahrnehmungsprozeß systematisch beeinflussen. Erinnert sei in diesem Zusammenhang an das Lateralitätsphänomen, die prin-
587 zipiellen Unterschiede in der Arbeitsweise der Großhirnhälften: bei Rechtshändern ist die rechte Hirnhälfte vor allem für das Erfassen von „Komplexqualitäten“ verantwortlich. Mit solchen biologischen Vorgaben verknüpft sich als vielschichtiges semantisches Phänomen die Tendenz, in anthropogene Strukturen „Natur“ hineinzusehen, auch dann, wenn diese Gebilde von ihrer konstruktiven Idee her nicht als Symbole gedacht sind. Dieser Kontext führt uns geradewegs zu den Beziehungen zwischen Tieren und anthropogenen Erzeugnissen. Wenn Wanderfalken heute in unseren Städten als Brutvögel gelegentlich angetroffen werden, so deshalb, weil die Steinhäuser von ihnen als „Felsen“ interpretiert werden (zur gattungsspezifischen Interpretation von Welt vgl. Art. 21 § 5.⫺9.). Entsprechendes gilt für einen in Mitteleuropa typischen Stadtvogel, den Mauersegler, dessen Vorkommen in diesen Regionen erst durch die menschlichen Siedlungen möglich wurde. Einen Sonderfall stellt die dressurfreie Übernahme menschlicher Signale durch Tiere dar. Es gibt Feldlerchen, die in ihren Gesang Schäferpfiffe einbauen. Da Vögel ein absolutes Gehör haben, wiederholen sie diese dann präziser, als es den meisten Schäfern gelingt. Behalten wir den Menschen jedoch im Zentrum der Überlegungen und hinterfragen wir jetzt die Sekundärmotivationen nach den schon angesprochenen Funktionskreisen: 1. Raumansprüche 1. Ordnung. Sie beziehen sich auf den Körper und seine Dimensionen. Dabei stellt sich ein interessantes Problem im Kontext der gegenwärtigen Akzeleration, die sich mit einer im wesentlichen umweltbedingten Größenzunahme verbindet. Hier gibt es Erwartungswerte und zwar in zweierlei Hinsicht: (a) für den eigenen Körper und (b) bei Übergröße für den gleichgeschlechtlichen Sozialpartner. Wenn Männer mit überdurchschnittlicher Größe unerwartet einer deutlich noch größeren Person begegnen, sind sie sichtlich irritiert. Die Bedeutung solcher Suchbilder wird aber überzeugend, wenn man Größenwünsche von weiblichen Personen, die einen männlichen Lebenspartner suchen, einmal aufbereitet, wie dies in Abbildung 27.15 vorgestellt ist, die auf der horizontalen Achse die Anzahl der Frauen angibt, welche Wünsche an die Körpergröße ihres Mannes geäußert haben. Wir sind hier noch im Bereich der durch die menschliche zivilisatorische Umwelt bedingten Einflüsse auf die konstitutionellen Eigenschaften.
588
III. Arten der Semiose
Abb. 27.15: Wünsche von partnersuchenden Frauen für die Mindestgröße der Männer. Die Anzeigen aus den 80er Jahren entnommenen Daten wurden nach der Angabe der Größe der weiblichen Personen geordnet.
2. Raumansprüche 2. Ordnung: Sie haben den Verhaltensvollzug zu sichern und sind daher in hohem Maße vom Kontext her bestimmt, vernetzt über ein möglichst ökonomisches Wegesystem. Auch hier werden biologische Vorgaben (z. B. Primatennest) traditiv soziokulturell überschichtet (Ruhestätte, Bett, Schlafzimmer). 3. Raumansprüche 3. Ordnung: Sie haben ihre biologischen Wurzeln in den gegenüber Artgenossen abgegrenzten Arealen oder Territorien, deren Funktion auch in einer optimalen Nutzung von Ressourcen durch eine elementare soziokulturelle Einheit liegt. Beim Menschen haben sich in Großsiedlungen Substrukturen ergeben, aber auch Erwartungswerte gegenüber der Durchschaubarkeit und Differenzierbarkeit zwischen den Siedlungseinheiten der Subgruppen, die zu Spannungsfeldern führen bei architektonischen und stadtgestalterischen Angeboten, welche solchen Bedürfnissen nicht Rechnung tragen, da die Akzeptanz sich mit einem komplexen Erwartungsmuster verbindet, das über drei Ebenen ausgespannt ist: (a) der bio-ethosemiotischen, (b) der tradi-ethosemiotischen und (c) der ratio-ethosemiotischen. Nur die letztgenannte Ebene verbindet sich mit Moden oder Zeitstilen, die innerhalb einer Generation wechseln.
4. Zeitansprüche 1. Ordnung: Sie sind konstitutionell bedingt und wurden bereits angesprochen. Die spezielle Bewußtseinslage des Menschen bedingt aber auch hier Einstellungen, die sich beispielsweise auf Entwicklungsphasen oder auf die Lebenserwartung beziehen. 5. Zeitansprüche 2. Ordnung: Sie sind mit den Lebens- und Verhaltensprozessen verbunden, etwa in Perioden der Nahrungsaufnahme (oder allgemeiner: des Stoffwechsels) sowie von Wachen und Ruhen. Ein sehr komplexes, bis heute nur unzureichend bekanntes Phänomen in diesem Kontext sind Erwartungswerte für periodische Änderungen im sensorischen Angebot (vgl. Völz 1983, 185 ff). Bei Frauen gibt es zudem zyklische Änderungen bei Farbpräferenzen. 6. Zeitansprüche 3. Ordnung: Hier sind wieder tradi- und ratiogenetische Aspekte angesprochen, in deren Kontext die anthropogene Umwelt zur Noosphäre entwickelt wurde. Diese Umwelt gibt im Arbeitsprozeß in komplexer Weise Zeitmuster vor, die oft von der biogenen Zeitordnung abweichen, wie etwa bei der Schichtarbeit. Es manifestieren sich „technogene Zeit-Semiosen“. Tiefer verankert sind die tradigenen Zeit-Semiosen. Bei der Siebentagewoche kann eine biologische Vorgabe nicht ausgeschlossen werden,
27. Ökosemiose
nachdem in den letzten Jahren ein circaseptaner Rhythmus auch bei Ratten nachgewiesen wurde, die unter konstanten Bedingungen gehalten wurden. 7. Stoffwechselansprüche 1. Ordnung: Hier geht es um die artgemäße Zusammensetzung der Nahrung, beim Menschen freilich vielfältig überformt, erweitert, durchsetzt von Sekundärmotivationen mit entsprechenden semiotischen Strukturen, die sich sowohl auf das Aussehen der Nahrungsobjekte (die nicht selten künstlich eingefärbt werden) als auch auf das Verpackungsdesign beziehen. 8. Stoffwechselansprüche 2. Ordnung: Hier ist das Verhalten selbst angesprochen; die Semiosen beziehen sich besonders auf die funktionellen Randbedingungen, das Instrumentarium sowie die Behälter und die sich daraus ableitenden Formen des manuellen und oralen Umganges mit diesen, überformt durch regionale und modische Traditionen. Als Beispiel sei der gegenwärtig modische „Schimpansengriff“ erwähnt, mit dem auch mit Henkel ausgestattete Trinkgefäße beidhändig erfaßt werden, was bei Schimpansen auf Grund ihrer Hand die Norm ist. Was hier zur Diskussion steht, verweist auf ein grundsätzliches Phänomen: die Beziehung zwischen Signifikat und Motorik, die durch die artifizielle anthropogene Umwelt in besonderem Maß tangiert wird. Die ergomatische Dimension der Semiotik ist damit angesprochen. 9. Stoffwechselansprüche 3. Ordnung: Es geht um die soziokulturell sowie gesellschaftlich tradi- und ratiogenetisch determinierten Semiosen im Kontext des stoffwechselbedingten Verhaltens. Die Aufnahme der Nahrung in Sitzhaltung hat eine vielschichtige Kulturtechnik in Gang gesetzt, deren zentrale Komponenten die Sitzmöglichkeiten (Bänke, Stühle) sowie erhöhte Flächen zur Ablage der Nahrungsobjekte darstellen („Tische“). Diese sind nach dieser Vorstellung erst später multifunktionell geworden. Dazu gehört die Bereitschaft zur geselligen Nahrungsaufnahme, was eine rangabhängige Verteilung wertvoller Nahrung nicht ausschließt. Ein weiterer Kontext für komplexe anthropogene Semiosen leitet sich aus Jagd, Ackerbau und Viehzucht sowie schließlich aus der Vorratswirtschaft ab. 10. Schutzansprüche 1. Ordnung: Die konstitutionellen Schutzansprüche sind auf die Unversehrtheit des Körpers sowie die Optimierung seiner Leistungen orientiert. Das komplexe Gefüge der Semiosen der schützenden Kleidung ist damit angesprochen, aber
589 auch das Komfortverhalten 2. Ordnung, das die Verwendung von Gegenständen bei der Körperpflege anfordert. Dazu gehört auch die Nutzung des Wassers, also das Baden; eine lange Geschichte anthropogener Semiosen wurde damit in Gang gesetzt. 11. Schutzansprüche 2. Ordnung: Wieder ist das Verhalten im Zentrum, wir könnten sagen: die Störfreiheit des Verhaltens. Die anthropogenen Semiosen sind hier überaus vielschichtig und weitreichend, denn es sind drei Funktionalbereiche angesprochen: (a) schützende Flucht, zunächst in natürliche Schutzbereiche (z. B. Höhlen), dann eigene Herstellung solcher Schutzbauten sowohl gegen abiotische Einwirkungen als auch gegen „Feinde“ (und dies können natürliche Prädatoren oder auch andere Sozialeinheiten des Menschen selbst sein); (b) Verteidigung und (c) schützender Angriff (in beiden Fällen wurde die primär für die Jagd entwickelte Technik weiter ausgebaut). Das kombiniert sich mit den Schutzansprüchen 1. Ordnung, also Sicherung der Unversehrtheit des Körpers (von Rüstungen bis zum Strahlenschutz). 12. Schutzansprüche 3. Ordnung: Hier fassen wir wieder die tradi- und ratiogenetischen Semiosen zusammen. Semiosen im Kontext der Medizin sind angesprochen. Arbeitsschutz gehört ebenfalls in diesen Zusammenhang. Es geht schließlich auch um den Schutz des Lebensraumes des Menschen; Semiosen der Bioindikation haben einen hohen Stellenwert erlangt. 13. Erkundungsansprüche 1. Ordnung: Hier sind die biologisch vorgegebenen sensorischen Leistungen angesprochen. Für sie hat der Mensch „sensorische Prothesen“ entwikkelt, von der Brille bis zur Ultramikroskopie und dem Fernglas, oder auch Techniken im Dienst der Erweiterung der akustischen Perzeption. Hier ergibt sich die interessante Problematik, daß evolutiv entstandene Leistungsprinzipien für die Konfiguration der Signifikate auf Signifikanten bezogen werden, die weit unter- oder oberhalb der natürlichen Wahrnehmungsbereiche liegen, wir bilden damit Signifikate über mikro- und makrokosmische Zeichenmengen. 14. Erkundungsansprüche 2. Ordnung: Das große Spektrum der anthropogenen Informationsspeicher, von der Schrift bis zum Computer ist angesprochen (vgl. Art. 26). Dabei ist hier der verhaltenssteuernde Aspekt gemeint, beispielsweise über Semiosen, die Motivationen aktivieren oder lenken im
590 Sinne einer anthropogenen verhaltenssteuernden Informationstechnik, zu der auch die „Reklame“ gehört. 15. Erkundungsansprüche 3. Ordnung: Hier sind wieder die tradi- und ratiogenetischen Semiosen zusammengefaßt, und das bezieht sich nun auf die gesamte Vielfalt der Kommunikationstechnik, vom Telegrafen und Telefon bis zu den anonym adressierten „Medien“ (vgl. Art. 14). Dazu gehört auch das über optische und/oder akustische Zeichen vermittelte Angebot der Kunst im weitesten Sinne. 16. Partneransprüche 1. Ordnung: Hierher gehören die Semiosen im Kontext des Sexual- und Pflegeverhaltens. Dabei beziehen sich die anthropogenen Semiosen beispielsweise auf zusätzliche Farbauftragungen im Gesicht, in diesem Kontext auf das weibliche Geschlecht beschränkt, das damit die individuelle Attraktivität gegenüber Männern zu steigern sucht, während diese durch Signale den sozialen oder ökonomischen Status hervorheben und ihren Partnerwert anzeigen, durch den sie die Fähigkeit zur Sicherung der Nachkommenschaft bekunden. Dazu können auch technische Attribute ⫺ vom Tonträger bis zum Motorrad oder Auto ⫺ eingesetzt werden. 17. Partneransprüche 2. Ordnung: Hier geht es um das komplexe Verhaltensgefüge sozialer Interaktionen, der Bindung und des Gruppenverhaltens auf der Grundlage nichtanonymer sozialer Einheiten. Die soziokulturelle Evolution des Menschen bietet dazu ein überreiches Spektrum von Semiosen an, die in zahlreichen Fragestellungen der Semiotik angesprochen sind. 18. Partneransprüche 3. Ordnung: Wieder geht es um die tradigenetischen und ratiogenetischen Semiosen, jetzt aber zu artifiziellen Gruppierungen hin, wie sie in Kinderkrippen, Kindergärten, Schulklassen und anderen durch Ausbildung und Beruf konstituierten Gruppierungen konfiguriert werden. MilieuSemiosen haben hier einen hohen Stellenwert, wie beispielsweise durch den Vergleich zwischen Schule, Universität oder Kaserne unschwer erkennbar wird, was leicht verständlich ist, da ja die Belegschaften wechseln. Normen in Form von Gesetzen und Ordnungsmustern gestalten den Rahmen der menschlichen Interaktionen in diesen anthropogenen Umwelten. Mit ihnen verbindet sich auch das komplexe Gefüge der Urbanisation, die das Individuum in die Anonymität verweist, umgeben von anthropogenen Semio-
III. Arten der Semiose
sen, die sich an am anthropogenen Ökosystem orientierte Verhaltensklassen wenden, wie etwa „Fußgänger“, „Radfahrer“ oder „motorisierte Verkehrsteilnehmer“. Biologische Eigenschaften bestimmen nur in besonderen Fällen noch die Klasse der Adressaten, beispielsweise „Kinder“ oder „Körperbehinderte“, oder es wird ein Zugang verwehrt, wenn ein bestimmtes Mindestalter noch nicht erreicht ist. Sinn dieser Übersicht sollte es sein, die komplexen Wurzeln menschlichen Seins und der daraus resultierenden Semiosen überschaubar zu machen, auch wenn die vielfältigen Verflechtungen dabei nicht thematisiert werden konnten (zu den historischen und kulturspezifischen Verwirklichungen der Zeichenprozesse, die mit den verschiedenen Lebensansprüchen des Menschen verbunden sind, vgl. Kap. VI⫺XI dieses Handbuchs).
5.
Literatur (in Auswahl)
Begon, M., J. L. Harper und C. R. Townsend (1991), Ökologie. Basel, Boston und Berlin: Birkhäuser. Bick, H. (1989), Ökologie. Stuttgart und New York: Fischer. Binnig, G. (1992), Aus dem Nichts. Über Kreativität von Natur und Mensch. München und Zürich: Piper. Cherry, C. (1957), On Human Communication. New York: Wiley. Deutsch von P. Müller: Kommunikationsforschung ⫺ eine neue Wissenschaft. Frankfurt am Main: Fischer 1963. Cherry, C. (1966), On Human Communication. 2nd edition. Cambridge, Mass.: MIT Press. Ebeling, W., A. Engel und R. Feistel (1990), Physik der Evolutionsprozesse. Berlin: Akademie-Verlag. Hayek, F. A. v. (1979), Die drei Quellen der menschlichen Werte. Walter Eucken Institut Vorträge und Aufsätze 70. Tübingen: Mohr. Jantsch, E. (1988), Die Selbstorganisation des Universums. 4. Auflage München: Deutscher Taschenbuch-Verlag. Lotman, J. M. (1990), „Über die Semiosphäre“. Zeitschrift für Semiotik 12: 287⫺306. Lotman, J. M. et al. (1975), „Theses on the Semiotic Study of Cultures (as Applied to Slavic Texts)“. In: T. A. Sebeok (ed.), The Tell-Tale Sign: A Survey of Semiotics. Lisse: de Ridder: 57⫺84. Morris, C. W. (1975), Zeichen, Wert, Ästhetik. Düsseldorf: Schwann. Morris, D. (1990), Animal Watching. London: Cape. Deutsch: Warum hat das Zebra Streifen? Körpersprache und Verhaltensformen der Tiere. München: Heyne 1991.
27. Ökosemiose Neumann, G.-H. (1981), Normatives Verhalten und aggressive Außenseiterreaktionen bei gesellig lebenden Vögeln und Säugern. Opladen: Westdeutscher Verlag. Posner, R. (1981), „Charles Morris und die verhaltenstheoretische Grundlegung der Semiotik“. In: M. Krampen u.a. (eds.), Die Welt als Zeichen. Klassiker der modernen Semiotik. Berlin: Severin und Siedler: 51—97. Posner, R. (ed.) (1990), Warnungen an die ferne Zukunft. München: Raben. Posner, R. (1992), „Was ist Kultur? Zur semiotischen Explikation anthropologischer Grundbegriffe“. In: M. Landsch, H. Kornowski und Ivan Bystřina (eds.), Kultur-Evolution: Fallstudien und Synthese. Frankfurt am Main: Lang: 1—66. Prieto, L. (1966), Messages et signaux. Paris: Presses Universitäres de France. Deutsch von G. Wotjak: Nachrichten und Signale. München: Hueber 1972. Prigogine, I. und I. Stengers (1986), Dialog mit der Natur. München: Piper 5. erw. Auflage. Schubert, R. (ed.) (1991), Lehrbuch der Ökologie. Jena: Gustav Fischer 2. Auflage. Sebeok, T. A. (1979), The Sign and Its Masters. Austin, Texas: University of Texas Press. Smith, W. J. (1977), The Behavior of Communicating. Cambridge, Mass.: Harvard University Press.
591 Tembrock, G. (1956), Tierpsychologie. Wittenberg: Ziemsen. Tembrock, G. (1982), Spezielle Verhaltensbiologie der Tiere. Bd. I: Funktionskreise, Wirbellose. Jena: Fischer. Tembrock, G. (1992), „Verhaltensbiologische Aspekte der Sprachevolution“. In: P. Suchsland (ed.), Biologische und soziale Grundlagen der Sprache. Tübingen: Niemeyer: 105—116. Tembrock, G. (im Druck), Organismische Evolution und das Problem der Selbstorganisation. Uexküll, J. v. (1921), Umwelt und Innenwelt der Tiere. Berlin: Springer. Uexküll, J. v. (1928), Theoretische Biologie. Berlin: Springer. Vernadskij, V. I. (1967), Biosfera. Moskau: Nauka. Völz, H. (1983), Information II. Berlin: AkademieVerlag. Vogel, C. (1985), „Von der Natur des Menschen in der Kultur“. In: Studium generale. Vorträge zum Thema Mensch und Tier, Bde. 3 und 4. Hannover: Schaper: 138-149. Witzany, G. (1993), „Zeichenprozesse als Bedingungen der Möglichkeit von Leben und Evolution. Zur Notwendigkeit einer Molekularpragmatik“. Zeitschrift für Semiotik 15: 151—178. Zabka, H. (1989), Tarnung und Täuschung bei Pflanzen und Tieren. Leipzig, Jena und Berlin: Urania-Verlag. Günter Tembrock, Berlin (Deutschland)
IV. Methoden der Semiotik Methods of Semiotics 28. Methodenprobleme der Semiotik 1. Der Begriff der wissenschaftlichen Methode 2. Entdeckungsmethoden 2.1. Arten von Entdeckungsmethoden 2.2. Gibt es ausgezeichnete Entdeckungsmethoden für die Semiotik? 3. Entdeckungsmethoden in der Semiotik 3.1. Entwicklung und Gegenstand einer Theorie 3.2. Der Gegenstand der Semiotik 4. Anwendungsmethoden 4.1. Der Anwendungsprozeß 4.2. Meßmethoden und Bestätigung 5. Semiotik als analytische Disziplin 5.1. Analytische Theorien 5.2. Implikationen der Analytizität für die Semiotik 6. Das Verhältnis der Semiotik zu anderen Wissenschaften 7. Literatur (in Auswahl)
1.
Der Begriff der wissenschaftlichen Methode
Das Wort „Methode“ ist einigermaßen abgegriffen, so daß man es nicht ohne weitere Erläuterungen benutzen sollte. Im vorliegenden Kontext geht es um wissenschaftliche Methoden, worunter wir in erster Näherung sozial verankerte, systematische Vorgehensweisen verstehen, die zur Erreichung wissenschaftlicher Ziele beitragen (vgl. Art. 123). Wissenschaftliche Ziele wiederum lassen sich, sehr grob, subsumieren unter das Hauptziel der Systematisierung und Erweiterung von Wissen. Wissenschaft sucht Wissen zu systematisieren und zu erweitern, und eine systematische Praxis kann nur dann als eine wissenschaftliche Methode gelten, wenn sie hierzu beiträgt. Diese noch sehr allgemeine Charakterisierung wird durch eine zweite Bedingung verschärft, nämlich daß wissenschaftliche Methoden kritisierbar sein müssen. Eine soziale Praxis kann nur dann als wissenschaftliche Methode gelten, wenn sie Kritik zuläßt. Kritik kann auf viele verschiedene Weisen stattfinden. Ein von Philoso-
phen bevorzugtes Bild ist hier das des rationalen Diskurses oder der rationalen Begründung (vgl. Posner 1982: 205⫺222). Danach ist der Praktikant einer wissenschaftlichen Methode gehalten, auf Wunsch eines Opponenten in eine Diskussion einzutreten, die seine Praxis begründen soll. Ein realistischeres Bild von Kritik ergibt sich aus dem Studium der Wissenschaftsgeschichte (vgl. Kuhn 1970): Kritik zulassen heißt, alternative Praktiken (Methoden) zu einer Bewährungsprobe zuzulassen. Erst wenn eine alternative Methode nach einer „Probezeit“ sich als klar schwächer denn die bisher benutzte erweist, darf man sie zurückweisen. Insgesamt verstehen wir also unter einer wissenschaftlichen Methode eine soziale Praxis, die erstens zur Systematisierung und Erweiterung von Wissen beiträgt und zweitens Kritik zuläßt. Diese Charakterisierung läßt einen erheblichen Vagheitsspielraum. Was ist Wissen? Wann liegt ein Beitrag vor? Wann ist eine alternative Methode schwächer? Diese Fragen sind bislang im wesentlichen unbeantwortet geblieben. Die Nagelprobe für derartige begriffliche Abgrenzung ist stets in der Anwendung auf klare Fälle nicht-wissenschaftlichen Vorgehens zu finden. Inwiefern ist z. B. die Befolgung einer religiösen Vorschrift keine wissenschaftliche Methode? Nun, man muß eine gewaltige Streckung der Begriffe von Wissen und Beitrag zum Wissen vornehmen, um religiöse Praktiken als Beiträge zur Wissensvermehrung ansehen zu können. Ebenso sind wir überzeugt, daß in jeder konkreten wissenschaftlichen Anwendung religiöse Methoden sich als klar schwächer denn vorhandene wissenschaftliche Methoden erweisen.
2.
Entdeckungsmethoden
Wir unterscheiden zwei hauptsächliche Arten von Methoden: solche, die zur Aufstellung oder Veränderung einer Theorie führen (Ent-
28. Methodenprobleme der Semiotik
deckungsmethoden), und solche, die bei der Anwendung einer Theorie benutzt werden (Anwendungsmethoden). Die Unterscheidung ist nicht ausschließend; einige Entdekkungsmethoden, wie die deduktive und die hermeneutische, spielen auch in der Theorieanwendung eine wichtige Rolle (zum Begriff der Theorie vgl. Art. 30 § 1.; zu den Methoden der Semiotik vgl. Art. 30 § 2.3.). 2.1. Arten von Entdeckungsmethoden Unter den Methoden zur Theoriefindung und Änderung haben sich einige als besonders wichtig herausgestellt. Sie sind unter den Bezeichnungen „induktive“, „deduktive“, „operationale“, „experimentelle“ und „hermeneutische Methode“ bekannt. Diese Liste beansprucht keine Vollständigkeit, sie entspringt keiner systematischen Einteilung. Vielmehr sind die verschiedenen Methoden alle positiv, d. h. an Hand von Beispielen, gefunden worden. Beispiele von Methoden, die nicht in die Liste aufgenommen wurden, sind die Abduktion sowie die Methode der unmittelbaren Anschauung. Die von Peirce (vgl. Art. 100) eingeführte Abduktion liefert Übergänge von vorliegenden Einzeltatsachen zu Theorien, die diese erklären (d. h. aus denen Beschreibungen der Einzeltatsachen ableitbar sind). Zweifellos sind solche Übergänge nach bestimmten Methoden vollziehbar, Beispiele von entsprechenden Heuristiken spielen beim maschinellen Lernen eine große Rolle. Tatsächlich gibt es hier eine ganze Reihe verschiedener Methoden, die jedoch alle unter Methodologen (noch?) nicht sehr verbreitet sind (Morik 1990), weshalb wir sie hier nicht näher betrachten. Die Methode der unmittelbaren Anschauung dagegen ist problematisch. Zum einen bestehen Zweifel, ob sie sozial verankert (und damit erlernbar) ist, zum anderen ist sie nur indirekt, über den Erfolg, kritisierbar, und es ist zweifelhaft, ob sie sich in dieser Hinsicht anderen Methoden überlegen gezeigt hat. Die induktive Methode besteht darin, von einer in einigen beobachteten Einzelfällen vorliegenden Charakteristik zur allgemeinen Annahme überzugehen, daß diese Charakteristik in allen ähnlichen Fällen vorliege (Carnap und Jeffrey 1971; Osherson und Weinstein 1986). Es handelt sich also um eine Methode zur Aufstellung allgemeiner Hypothesen oder zur Einführung theoretischer Annahmen (zur Datengewinnung vgl. Art. 29). Zum Beispiel kann man von der Charakteristik, daß in den untersuchten Fällen von Zei-
593 chenproduktion Zeichen durch Lebewesen produziert wurden, induktiv zu der (nicht unproblematischen) Hypothese übergehen, daß alle Zeichen von Lebewesen produziert werden, oder von der Charakteristik, daß in den untersuchten Fällen Sätze syntaktisch mehrdeutig sind, zu der Hypothese, daß alle natürlichen Sprachen syntaktisch mehrdeutige Sätze enthalten. Eine weitere Differenzierung der induktiven Methode hätte spezielle Bedingungen zu untersuchen, unter denen man den Verallgemeinerungsschritt machen bzw. nicht machen darf, oder anders, Bedingungen, unter denen man eine allgemeine Hypothese einführen darf. Man muß feststellen, daß hierüber noch keine substanziellen Erkenntnisse vorliegen, daß aber in jüngster Zeit im Bereich des maschinellen Lernens eine rasche Entwicklung stattfindet (Plotkin 1970, Kodratoff 1988). Bei der deduktiven Methode als Entdekkungsmethode liegt die Betonung nicht auf der Auswahl einer neuen Hypothese, sondern auf deren Bewährung. Die deduktive Methode besteht darin, auf der Basis von beobachteten Einzelfällen irgendwie eine allgemeine Hypothese einzuführen, die sich sodann, um akzeptiert zu werden, in Tests zu bewähren hat. Ein Test für eine neue Hypothese besteht darin, aus dieser, zusammen mit dem schon vorhandenen Einzelfallwissen, durch logische Ableitung („deduktiv“, daher der Name) zu Sätzen zu gelangen, die man direkt durch Erfahrungsdaten als richtig oder falsch einstufen kann. Die spezielle Form der Hypothese ist also beliebig und nicht durch die Form des Einzelfallwissens vorgeschrieben. Der Kern der Methode besteht in der Deduktion empirisch testbarer Konsequenzen, an denen die Hypothese sich bewähren muß. Wenn solche Konsequenzen in Widerspruch zur Erfahrung treten, ist die Hypothese ⫺ im Prinzip ⫺ zu verwerfen. Popper (1971) versucht darüber hinaus, die zu wählenden Hypothesen durch weitere Bedingungen festzulegen. Sie sollen möglichst „kühn“ (im Sinne von unwahrscheinlich) und nicht „ad hoc“ sein. Im obigen Beispiel der Zeichenproduktion könnte eine kühne Hypothese etwa lauten, daß Zeichenproduzenten stets zu Intentionen fähig sein müssen. Ein Test der Hypothese bestünde in der Untersuchung, ob nicht-intentionale Wesen, wie etwa die Bienen, Zeichen produzieren. Falls man hier zu einem positiven Resultat kommt, wäre die Hypothese zu verwerfen.
594 Die experimentelle Methode dient der Auswahl zwischen alternativen Hypothesen (vgl. Art. 29). Bei gegebenem Einzelfallwissen und zwei oder mehreren vorgeschlagenen Hypothesen wird ein Experiment erfunden, welches je nach Gültigkeit der betrachteten Hypothesen anders abläuft. Wenn Hypothese H1 richtig ist, nimmt das Experiment einen durch H1 beschriebenen Verlauf und führt zu Daten e1, analog wenn H2 richtig ist, zu anderen Daten e2. Indem man das Experiment durchführt, kann man diejenigen Hypothesen ausscheiden, bei deren Richtigkeit andere Daten als die tatsächlich aufgetretenen zu erwarten gewesen wären. Denn wenn diese (auszuscheidenden) Hypothesen gültig wären, so hätte man einen Widerspruch zwischen den aus ihnen abgeleiteten und den tatsächlich beobachteten Daten. Im Bereich der Kommunikation entspricht dem Experiment oft eine Frage. Der Beobachter hat zwei Hypothesen über das Verhalten einer Person, etwa daß eine geäußerte Frage („Findest du es nicht ein bißchen kühl hier drinnen“?) als Aufforderung zu einer Handlung einer bestimmten Art (einen Pullover anzuziehen) oder als Aufforderung zu einer anderen Handlung (das Fenster zuzumachen) gedacht ist. Um zwischen den Hypothesen zu entscheiden, wird ein „Experiment“ entworfen: man stellt eine Frage, die geeignet ist, die eigentliche Absicht ans Licht zu bringen (etwa: Soll die angesprochene Person einen Pullover anziehen?). Die operationale Methode (vgl. Lorenzen 1987; Bridgeman 1927; siehe auch Art. 107) betrifft demgegenüber nicht die Auswahl von Hypothesen, sondern die von Begriffen (und damit von Daten). Nach ihr sollen Begriffe in der Wissenschaft stets durch operationale Definitionen eingeführt werden, d. h. durch Angabe eines regelmäßig anwendbaren Verfahrens (Operation), nach dem festgestellt wird, ob eine beliebige vorgelegte Entität unter einen Begriff fällt oder nicht. Ein Verfahren, die Intelligenz eines Menschen zu bestimmen, ist, einen Intelligenztest mit ihm zu machen. Die ermittelte Zahl gibt den Grad seiner Intelligenz an. Die operationale Methode setzt im Vergleich zu den vorherigen Methoden „weiter unten“ an. Um überhaupt Hypothesen (also Sätze) formulieren zu können, braucht man zunächst Begriffe, mit denen man solche Sätze bilden kann. Die operationale Methode empfiehlt eine bestimmte Art, Begriffe einzuführen. Sie ist in den Sozialwissenschaften, zumindest implizit, weit verbrei-
IV. Methoden der Semiotik
tet, denn alle Messungen durch Skalen oder Indizes lassen sich in Ermangelung einschlägiger erfolgreicher Theorien am natürlichsten als operationale Definitionen deuten (vgl. Art. 29). Die hermeneutische Methode (vgl. von Wright 1971; Gadamer 1960; Dallmayr und McCarthy 1977; siehe auch Art. 133) betrifft ursprünglich die Interpretation von Texten. Der Sinn eines Textes wird erschlossen aus seinen Teilen, die aber selbst wieder nur im Rahmen des gesamten Textes ihren Sinn erhalten. Ersetzt man „Sinn“ durch „Richtigkeit“ und „Text“ durch „Theorie“ oder „Hypothese“, so ergibt sich eine allgemeine wissenschaftliche Methode, die im Kern die dynamische Entwicklung von Hypothesen in Bereichen betrifft, in denen sich große Komplexität der Objekte mit einem großen vorhandenen Wissensvorrat verbindet. In solchen Bereichen sind neue Begriffe und Hypothesen einzubetten in das Gewebe der bereits vorhandenen. Sie können nicht operational eingeführt werden, sondern müssen von Anfang an durch begriffliche Verbindungen zu dem vorhandenen Wissen „verstanden“ sein. Die hermeneutische Methode empfiehlt ein dialektisches Vorgehen. Ausgehend vom schon vorhandenen Wissen (der „Interpretation“) werden neue Begriffe und Hypothesen eingeführt, die ihrerseits das Wissenskorpus anreichern und verändern. Hierbei auftretende Spannungen oder Widersprüche müssen ausgeglichen werden, so daß man ein neues Gesamtbild erhält. Dieses dient nun wieder als Ausgangsbasis für eine neue Runde. Die hermeneutische Methode wird zwar meist mit geisteswissenschaftlichen oder historischen Bereichen assoziiert, sie ist aber in der skizzierten, moderaten Form sehr weit verbreitet. Die meisten Zweige der Sozialwissenschaften und sogar weitentwickelte Naturwissenschaften enthalten hermeneutische Züge. Zum Beispiel erfolgte die Einführung quantenmechanischer Theorien auf der Basis von Experimenten, die zunächst nur mit Hilfe klassischer Theorien beschreibbar sind. Die sich hieraus ergebenden Spannungen haben zu der immer noch anhaltenden Grundlagendiskussion in der Quantenmechanik geführt. Weitere Beispiele für hermeneutisches Vorgehen werden durch das „Problem der theoretischen Terme“ verursacht (Sneed 1971). Jede der geschilderten Methoden ist mit überzogenen Ausschließlichkeitsansprüchen vertreten worden, zahlreiche Schriften versu-
28. Methodenprobleme der Semiotik
chen Argumente vorzubringen, warum nur diese oder jene Methode haltbar sei, alle anderen jedoch nicht. Natürlich gibt es dann auch Argumente, die zeigen sollen, daß solche Alleinvertretungsansprüche unhaltbar sind. Schließlich sind einige der Methoden mit anderen wissenschaftstheoretischen Problemen, wie dem der Gesetzesartigkeit oder des Holismus, eng verknüpft. Als Gegengewicht zu den zahlreichen in der Literatur vorfindbaren apriorischen Überlegungen ist ein Blick auf die wissenschaftliche Praxis heilsam. Er zeigt nämlich, daß, wenn man Ansprüche auf Monopol und Letztbegründung beiseite läßt, jede der genannten Methoden in klaren Ausprägungen in der Wissenschaft zu finden ist. Neben dem empirischen Nachweis des Vorkommens solcher Methoden in verschiedenen Episoden der Wissenschaftsgeschichte (der an dieser Stelle nicht erbracht werden kann, doch vgl. die Artikel der Kapitel VI bis X sowie XIII und XIV), gibt es noch zwei weitere Indizien für die Richtigkeit unserer Behauptung. Einmal kommen auch Wissenschaftsphilosophen (vgl. Feyerabend 1976) in neuerer Zeit zu solchen Ergebnissen ⫺ wenn auch auf anderem, weniger empirischem Weg. Zum anderen haben einige der Methoden bereits ganz selbstverständlich Eingang beim Programmaufbau im Bereich des maschinellen Lernens gefunden (vgl. Morik 1990). Da die positiven Behauptungen, diese oder jene Methode sei die allein empfehlenswerte, durch die wissenschaftliche Realität weitgehend diskreditiert sind, kommt den negativen Argumenten, die die Schwächen bestimmter Methoden aufzeigen, mehr Bedeutung zu. Der induktiven Methode wird vorgehalten, daß der Übergang zur Hypothese kein zwingender sei und daher gerechtfertigt werden müsse, warum gerade Hypothesen der empfohlenen Art und nicht andere Formen zu wählen seien. Ebenso existiert bei der deduktiven Methode ein Begründungsproblem dafür, warum man nur deduktiv vorgehen soll. Die operationale Methode hat mit dem Einwand zu kämpfen, daß man sich durch operationale Definitionen zu stark festlegt. Es ist zweckmäßig, sich bei neuen Begriffen von Anfang an einen gewissen Bedeutungsspielraum offen zu halten. Die hermeneutische Methode hat Mühe, den Eindruck von Zirkelhaftigkeit zu vermeiden, sie leidet vielfach auch unter der tiefsinnigen Ausdrucksweise ihrer Proponenten.
595 Als Fazit halten wir fest, daß es eine Vielfalt von Entdeckungsmethoden gibt, die sich zum Teil gegenseitig ergänzen, zum Teil in Konkurrenz zueinander stehen. 2.2. Gibt es ausgezeichnete Entdeckungsmethoden für die Semiotik? Aus der Vielfalt von Entdeckungsmethoden ergibt sich im Hinblick auf die Semiotik die Frage, ob nicht bestimmte Gegenstandsbereiche für eine oder mehrere der genannten Methoden besonders zugänglich sind. Wenn ja, dann könnte man vom speziellen Gegenstandsbereich her sagen, welche Methode ihm am angemessensten ist. Diese Frage ist jedoch im wesentlichen negativ zu beantworten. Für die induktive und deduktive Methode ist dies ziemlich klar. Beide Methoden setzen lediglich voraus, daß man Hypothesen formulieren kann und möchte und daß man Daten oder Einzelfallwissen hat. Dies ist in allen empirischen Wissenschaften der Fall. Auch die experimentelle Methode ist nicht, wie man zunächst meinen möchte, auf den naturwissenschaftlichen Bereich beschränkt. Sie hat dort zwar die größten Erfolge erzielt, aber dies liegt weniger an der Tatsache, daß Experimente gemacht werden, als daran, daß bei den Experimenten künstliche Apparate, die einen sehr zuverlässigen, voraussehbaren Ablauf haben, eingesetzt werden. Experimente sind zumindest auch im Bereich der Sozialwissenschaften und der Linguistik sinnvoll und möglich. Die operationale Methode betrifft wieder alle möglichen Disziplinen. Operationale Definitionen gibt es in großer Zahl auch außerhalb der Naturwissenschaften (typisches Beispiel: Intelligenzquotient), und es ist nicht zu sehen, wie ihre Möglichkeit durch den Gegenstandsbereich eingeschränkt werden könnte. Die einzige Einschränkung hinsichtlich der Anwendbarkeit ist bei der hermeneutischen Methode auszumachen. Diese setzt ein schon vorhandenes, umfangreiches Wissen sowie große Komplexität der Gegenstände voraus und ist deshalb nicht geeignet in Fällen, in denen ein neuer Phänomenbereich erstmals zum Gegenstand wissenschaftlicher Untersuchung wird (wie etwa elektrische Phänomene im 19. Jahrhundert oder Intelligenz im 20.). Wenn es im allgemeinen keine ausgezeichnete Entdeckungsmethode für bestimmte Gegenstandsbereiche gibt, dann gilt dies insbesondere auch für die Semiotik, unabhängig davon, wie man deren Gegenstandsbereich
596
IV. Methoden der Semiotik
genauer bestimmt. Mit anderen Worten heißt dies, daß man keiner der betrachteten Entdeckungsmethoden in der Semiotik a priori einen Sonderstatus zuerkennen kann. Hiermit ist natürlich noch nichts darüber gesagt, ob eine der Methoden im Rahmen der Semiotik leichter anwendbar ist oder mit größerem Erfolg eingesetzt werden kann.
3.
Entdeckungsmethoden in der Semiotik
Um eventuell zu einer Gewichtung der Entdeckungsmethoden im Bereich der Semiotik zu gelangen, ist der Gegenstandsbereich der Semiotik weiter zu klären (siehe auch Art. 5⫺27). Hierzu wiederum sind einige allgemeine Vorüberlegungen über die Konstitution der Gegenstände einer Theorie oder Disziplin angebracht (vgl. auch Art. 31). 3.1. Entwicklung und Gegenstand einer Theorie Jede Theorie oder Disziplin entwickelt sich in einem historischen Prozeß, in dem sich die folgende Grundfigur in verschiedenen Varianten wiederholt. Man hat in einer bestimmten Entwicklungsphase einen bestimmten Stand an Daten und theoretischen Modellen über einen in der vorherigen Entwicklung mehr oder weniger scharf abgegrenzten Phänomenbereich. Ganz am Anfang ist der Phänomenbereich sehr grob durch lebensweltliche Beschreibungen und Ziele gegeben, später wird er mit Hilfe der entwickelten Theorien und der gesammelten Daten schärfer strukturiert und eingegrenzt (vgl. Art. 123). Die Forschung führt auf dem gegebenen Niveau zu weiteren, neuen Daten oder zu neuen Modellen (für noch nicht untersuchte Varianten der Phänomene oder für eine genauere Beschreibung der schon untersuchten). In beiden Fällen ist ein Angleichungsprozeß zwischen den gesamten Daten (alten und neuen) und den gesamten Modellen (alten und neuen) erforderlich. Es ist zu prüfen, ob die Daten „in etwa, bei geeigneter Zuordnung“ zu den Modellen passen (vgl. Balzer, Moulines und Sneed 1987). Bei unbefriedigendem Resultat sind die Daten zu überprüfen und eventuell anzupassen oder die Modelle so abzuändern, daß ein befriedigendes Maß an Übereinstimmung erzielt wird. In besonders schlimmen Fällen können hierbei gewisse Daten auch für irrelevant erklärt werden, d. h. mit anderen Worten: die Theorie ist in bezug
auf diese Daten und die ihnen zugrunde liegende Realität nicht zuständig. Nach diesem Anpassungsprozeß ist man wieder in der Ausgangsposition, und die „nächste Runde“ kann beginnen. Die Gesamtentwicklung nach solchem Muster kann eine Vielzahl verschiedener globaler Formen annehmen, auf die wir jedoch nicht näher einzugehen brauchen (vgl. Balzer, Moulines und Sneed 1987). Man ersieht bereits aus dem skizzierten, groben Schema, daß die Gegenstände, die Phänomene, mit deren Untersuchung eine solche Folge von Entwicklungsstadien beschäftigt ist, keine konstante Größe bilden. Sie werden im Laufe der Entwicklung auf der einen Seite immer wieder theoretisch strukturiert, durch immer feinere Modelle erfaßt. Hierdurch erhalten sie neue Züge, Eigenschaften und Charakteristiken. Zum Beispiel weist die Einführung eines neuen theoretischen Terms in einem neuen Modell auf die Existenz vorher unbekannter oder nicht beachteter Teile der Phänomene hin, insbesondere wenn dieser Term sich in der weiteren Entwicklung konstant als relevant behauptet. Auf der anderen Seite können sich die Daten ändern, was einer unmittelbaren Änderung des Gegebenen entspricht. Es können Daten wegfallen, d. h. für irrelevant erklärt werden, es können neue Daten gewonnen werden, und es können Daten revidiert, also durch andere, verbesserte, ersetzt werden. Zumindest im ersten und letzten Fall hat sich auch das jeweilige Phänomen, der Gegenstand der Untersuchung, geändert. Schließlich können im Zuge neuer Modelle auch neue Begriffe eingeführt werden und alte wegfallen. Im dramatischsten Fall, dem einer wissenschaftlichen Revolution, kann dies eine ziemliche Veränderung der Objekte, die in den Modellen als existent angenommen werden, also der Ontologie, bedeuten. Dieses Bild, das von heutigen Wissenschaftsphilosophen (Kuhn 1970; Stegmüller 1986) gezeichnet wird, steht dem Bild eines naiven, metaphysischen Realismus gegenüber, bei dem die Gegenstände einer Disziplin unabhängig von ihrer Untersuchung und speziell unabhängig von ihrer Konzeptualisierung sind und im Verlauf der Entwicklung nur stets genauer und vollständiger theoretisch erfaßt werden. Nach dem skizzierten Bild werden die Gegenstände einer Theorie oder Disziplin in ständigem Wechselspiel von Einzelerfahrung und theoretischer Systematisierung immer feiner bestimmt und näher eingegrenzt. Man kann sagen, daß sie durch den Verlauf der theoretischen Entwicklung in die-
597
28. Methodenprobleme der Semiotik
sem Sinn konstituiert werden. Im idealen Grenzfall, der bei vielen mathematischen Theorien vorliegt, findet dieser Prozeß einen Abschluß, wenn ein gewisses Maß an Vollständigkeit erreicht ist, d. h. wenn genau alle in den Modellen gültigen Sätze aus den Hypothesen der Theorie ableitbar sind. 3.2. Der Gegenstand der Semiotik In der Anwendung auf eine konkrete Disziplin erfordert also die Frage, was deren Gegenstände seien, einen Rückblick auf ihre Entwicklung und einen Blick auf ihren gegenwärtigen theoretischen Stand. Speziell für die Semiotik ist dies vor allem in den Artikeln 2⫺4, 5, 34 und 35 dieses Handbuchs geleistet. Von der theoretischen Seite her, aber auch von der Entwicklung in diesem Jahrhundert, lautet die stichwortartige Charakterisierung der semiotischen intendierten Anwendungen: Semiose. Genau alle Semiosen sind intendierte Anwendungen. Semiosen haben keine einheitliche Ontologie. Die verschiedensten Entitäten können als Zeichen und Bezeichnete auftreten, und selbst bei den Interpreten gibt es einigen Spielraum (Roboter, Tiere, Pflanzen, soziale Institutionen). Es scheint im derzeitigen Stadium nicht angemessen, dem semiotischen Grundmodell ontologiestiftende Kraft zuzuschreiben, d. h. die Entitäten, die in solchen Modellen vorkommen, bilden nur deshalb, weil sie dort vorkommen, noch keine gemeinsame natürliche Art oder Familie. Aus dieser Beobachtung folgt, daß die operationale Methode in der Semiotik nur unter Schwierigkeiten anzuwenden ist. Denn eine operationale Definition soll ja für alle Entitäten des untersuchten Bereichs funktionieren. Sie muß regelmäßig anwendbar sein, und dies ist nur vorstellbar, wenn der Bereich ziemlich starke ontologische Gemeinsamkeiten aufweist. Hinsichtlich der experimentellen Methode hängt die Einschätzung davon ab, wie weit man diese mit Naturwissenschaft assoziiert. Wie oben bemerkt, sind im sprachlichen Bereich Experimente durch Fragen möglich. Dies gilt insbesondere für den in der Semiotik sehr starken Bereich von Anwendungen, die aus der Linguistik stammen. Wenn wir also bereit sind, die experimentelle Methode nur über ihren Inhalt ⫺ wie oben skizziert ⫺ zu definieren und nicht dadurch, daß sie typisch für gewisse Naturwissenschaften ist, dann hat sie in der Semiotik ein weites Feld von Anwendungen.
Die induktive Methode scheint unter den verbleibenden die relativ schwierigste zu sein. Bei ihr kommt es ja darauf an, aus dem Einzelfallwissen durch direkte Abstraktion oder Verallgemeinerung zu Hypothesen zu gelangen. Die Form der Hypothese ist also weitgehend von der Form oder den Formen des Einzelfallwissens bestimmt. Da das Einzelfallwissen im Bereich verschiedener Semiosen sehr heterogen sein kann, wird man nicht erwarten, durch bloße Abstraktion eine Gesetzmäßigkeit zu finden, die für alle Fälle verbindlich ist. Wenn diese Methode mit Gewinn eingesetzt werden kann, dann in eingeschränkten Anwendungsbereichen, wenn es darum geht, spezielle Gesetze zu finden, die nicht für alle, sondern nur für einen Teil der semiotischen Anwendungen gelten. Die deduktive Methode ist als die vielleicht variabelste unter allen in keinem Anwendungsbereich eingeschränkt, und speziell auch nicht im Bereich der Semiotik. Ihr liegt ja nur die deduktive Logik zugrunde, die überall und damit auch im semiotischen Bereich gilt, sowie die Bereitschaft, alternativen Ansätzen eine Chance zur Bewährung zu geben. Die hermeneutische Methode schließlich hat als Entdeckungsmethode in der Semiotik einen natürlichen Platz. Bei der Einführung neuer Begriffe und Hypothesen ist stets eine gewisse vorgängige Interpretation der betrachteten Systeme durch den Semiotiker nötig. Wichtig ist hier zum einen die Grundannahme, daß eine bestimmte Entität Zeichencharakter hat (im Gegensatz zu einem „bloß natürlichen“ Gegenstand). Zum anderen ist für die Erforschung von Kodes in der Regel eine vorgängige Interpretation der Bedeutung der Zeichen nötig, um den Spielraum der in Frage kommenden Modelle (etwa in der von Prieto 1972 vorgeschlagenen Form) hinreichend einzuengen. Wir halten fest, daß die operationale Methode als problematisch erscheint und die induktive als nicht sehr erfolgversprechend. Für die restlichen Methoden: die deduktive, die experimentelle und die hermeneutische ist aus der Betrachtung des Gegenstandsbereichs keine eindeutige Vorzugsstellung zu erschließen (vgl. auch Art. 29).
4.
Anwendungsmethoden
4.1. Der Anwendungsprozeß Um hier einen besseren Überblick zu erzielen, ist es nötig, kurz den Anwendungsprozeß einer Theorie zu erläutern, was am besten an
598 Hand des strukturalistischen Ansatzes in der Wissenschaftstheorie (Balzer, Moulines und Sneed 1987; Stegmüller 1986) geschieht. Nach strukturalistischer Metatheorie besteht eine Theorie im allgemeinen aus zwei Grundbausteinen: einer Menge I intendierter Anwendungen und einem formalen Kern K. Es genügt hier, beim Kern K zwei Komponenten zu unterscheiden: eine Klasse Mp von potentiellen Modellen und eine Klasse M von (echten) Modellen, so daß eine Theorie T die Form T ⫽ (Mp, M, I) annimmt. Modelle, potentielle Modelle und auch die noch zu erwähnenden partiellen potentiellen Modelle sind abstrakte (genauer: mengentheoretische) Gebilde, die nur in der Form sprachlicher Beschreibungen existieren (vgl. Art. 30 § 1.6.5.). Mp entspricht den Begriffen der Theorie. Die Definition von Mp beinhaltet Angaben darüber, welche Terme welcher Typen das Vokabular von T bilden, sowie weitere Bedingungen, die jeder Term (Begriff) für sich genommen erfüllen soll. M dagegen entspricht den (wahren) Sätzen der Theorie oder, wenn sie axiomatisierbar ist, deren Axiomen. In der Semiotik sind Modelle diejenigen abstrakten Systeme, die den von einem Autor formulierten Bedingungen für eine Semiose genügen, also etwa Systeme bestehend aus abstrakten Sendern, Empfängern, Signalen, Kodes, Merkmalen usw., wobei diese Entitäten die jeweiligen Grundannahmen erfüllen. Von den intendierten Anwendungen nehmen wir an, daß sie partielle potentielle Modelle, d. h. beliebige Teilstrukturen von potentiellen Modellen, sind (vgl. Balzer 1985). Am besten stellt man sich ein partielles potentielles Modell sprachlich als eine Menge von atomaren Sätzen vor. Eine solche Menge kann im endlichen Fall die Daten repräsentieren, die über ein gegebenes reales System vorliegen. Dies motiviert die strukturalistische Annahme, daß jede intendierte Anwendung die Form eines partiellen potentiellen Modells hat. Wir können uns damit intendierte Anwendungen als Datenmengen vorstellen, die von verschiedenen realen Systemen gewonnen wurden. Schreiben wir Mpp für die Klasse aller partiellen potentiellen Modelle von T (Mpp ist explizit durch Mp definiert), so läßt sich die Annahme über intendierte Anwendungen ausdrücken durch: I 傺 Mpp. In diesem minimalen Rahmen nimmt der Anwendungsprozeß der Theorie folgende Form an. Um Theorie T auf ein gegebenes reales System anzuwenden, sind mindestens
IV. Methoden der Semiotik
folgende Schritte erforderlich. Erstens ist zu prüfen, ob die Begriffe der Theorie (die durch Angabe von Mp eingeführt sind) sich im System überhaupt realisieren lassen. Können alle Begriffe der Theorie im System realisiert werden, so sammelt man im zweiten Schritt möglichst viele Daten über das System, die sich in Form von Atomsätzen in den Begriffen der Theorie formulieren lassen. In der Regel führt dieser Schritt nicht zu Daten über alle in der Theorie vorkommenden Begriffe. Für theoretische Begriffe lassen sich Daten meist nicht ohne Probleme aus dem untersuchten System ermitteln. Die ermittelten Daten bilden bei geeigneter Zusammenfassung ein partielles potentielles Modell. In einem dritten und letzten Schritt wird geprüft, ob das erhaltene partielle potentielle Modell sich in ein echtes Modell einbetten läßt. Bei sprachlicher Darstellung läuft dies darauf hinaus, die Konsistenz der Sätze, die das partielle potentielle Modell definieren, mit den Sätzen zu überprüfen, die die ganze Theorie ausmachen. Dies geschieht in der Regel in approximativer Weise, so daß man schon mit „Konsistenz bis auf ein e“ zufrieden ist. Wichtig für das richtige Verständnis des Anwendungsprozesses ist, daß die Theorie in diesem Fall als gegeben vorliegt. Ein Beispiel für den Anwendungsprozeß in der Semiotik muß also von einem bestimmten Modell ausgehen. Betrachten wir etwa das Modell der Semiose in der von Prieto vorgeschlagenen Form sowie als intendiertes System einen Fahrradfahrer, der auf eine Kreuzung mit Halteschild zufährt, dort kurz anhält und dann die Kreuzung überquert. Die Anwendung der Prietoschen Theorie auf dieses System erfolgt in den drei abstrakt geschilderten Schritten. Zuerst versucht man herauszufinden, ob die Begriffe der Theorie im System realisiert sind, hier also z. B. „Signal“, „Nachricht“, „Kode“ usw. (vgl. Prieto 1972). Es kann sein, daß dies nicht der Fall ist, etwa, wenn der Radfahrer hinter einem Lastwagen herfährt, so daß er das Schild nicht zu sehen bekommt. In diesem Fall gibt das Schild kein Signal, und das ganze System ist überhaupt kein intendiertes System für die Theorie. Nehmen wir jedoch an, die wichtigsten Begriffe seien in dem System realisiert, so besteht der zweite Schritt darin, diese Begriffe, oder mindestens einige von ihnen, im konkreten System genau zu bestimmen. Im Rahmen der Prietoschen Theorie wären etwa die wesentlichen Merkmale des Signals zu bestimmen, die sich aus dessen Stellung im Kode,
599
28. Methodenprobleme der Semiotik
sowie seiner Beziehung zu den Bedeutungen im Feld des Empfängers ergeben. Es ist unwahrscheinlich, daß man so alle Begriffe Prietos vollständig bestimmen wird. Einige, wie etwa die Bedeutungen oder die Gesamtheit aller wesentlichen Merkmale des Signals, werden sich nur zum Teil durch Untersuchung des Systems herausfinden lassen. Sie werden dann im dritten Schritt hypothetisch hinzugenommen, und es wird geprüft, ob die Hinzunahme mit den Grundannahmen der Theorie und den ermittelten Daten konsistent ist. 4.2. Meßmethoden und Bestätigung Der dritte Schritt eines solchen Anwendungsprozesses ist natürlich rein formal. Hier sind Logik und deduktive Methode einschlägig. Im ersten und zweiten Schritt können vielerlei Arten von Bestimmungs- oder Meßmethoden eine Rolle spielen. Dies sind Verfahren, die sich nach gewissen Regeln durchführen lassen und einen „Meßwert“ eindeutig durch andere „Werte“, die im System vorliegen, festlegen (vgl. Balzer 1985). Im obigen Anwendungsbereich würde sich etwa der Kommutationstest (vgl. Prieto 1972, Kapitel 5; siehe auch Art. 4 § 4.) als Methode zur Bestimmung der wesentlichen Merkmale des Signals anbieten. Über Meßmethoden gibt es reichlich Literatur, angefangen von formalen Ansätzen, bei denen Bedingungen zur Einführung von Skalen verschiedener Typen charakterisiert werden (Krantz u. a. 1971), über praktische Beschreibungen (Kohlrausch 1968) bis hin zu statistischen Meß- und Testverfahren (Bortz 1985). Der Zusammenhang zwischen Theorie bzw. Objektbereich einerseits und Meßmethoden andererseits ist bisher kaum systematisch untersucht worden. Man kann nur feststellen, daß Meßverfahren de facto, obwohl nicht notwendigerweise, bei numerischen Theorien eine Rolle spielen und daß solche Verfahren sich von Theorie zu Theorie stark unterscheiden. In der Semiotik werden Meßverfahren zunächst wohl nur dort eine Rolle spielen, wo sie sich mit numerischen Theorien, etwa aus der Linguistik, überlappt. Insbesondere scheint es keine für die Semiotik im allgemeinen typischen Meßverfahren zu geben. Einen letzten Bereich von Methoden, der mit dem Anwendungsprozeß in enger Verbindung steht, bilden die Methoden der Bestätigung einer Theorie. Bestätigung ist mehr als nur Erfolg bei der Durchführung des Anwen-
dungsprozesses. Der vorherrschende Bestätigungsbegriff ist der des „boot-strapping“. Danach wird eine Theorie bestätigt, indem man mit Hilfe dieser und anderer Theorien „Werte“ ableitet, die zum einen den beobachteten Werten nicht widersprechen und zum anderen auf mehreren verschiedenen Ableitungswegen erhalten werden (vgl. Glymour 1980). Zwar ist das allgemeine begriffliche Schema einer Bestätigung unabhängig von der jeweiligen Theorie. In der konkreten Anwendung werden im Zuge der Bestätigung jedoch spezielle Meßverfahren zur Ermittlung von Werten benutzt, so daß das konkrete Verfahren der angesprochenen Variation von Theorie zu Theorie unterliegt.
5.
Semiotik als analytische Disziplin
Unter Bezug auf den geschilderten Anwendungsprozeß bietet sich schließlich die Möglichkeit, eine Einordnung der Semiotik im Spektrum der Wissenschaften zu versuchen (vgl. Art. 123). Hierzu wenden wir uns der Unterscheidung von Erfahrungswissenschaften im engeren Sinn auf einer Seite und formalen oder apriorischen auf der anderen zu, die in den Wissenschaften fest etabliert ist. Zu letzteren gehören Mathematik und Logik als typische Fälle formaler Wissenschaft und Philosophie als typischer Fall von apriorischer Wissenschaft. Dabei scheint „apriorisch“ der Oberbegriff von „formal“ zu sein: jede Formalwissenschaft ist apriorisch, aber nicht umgekehrt (philosophieren kann man auch informell). Obwohl diese Unterscheidung historisch gewachsen und inhaltlich recht gut faßbar ist, bereitet sie in der Anwendung auf eine gegebene Disziplin Schwierigkeiten, vor allem, wenn diese ⫺ wie die Semiotik ⫺ keinen allgemein akzeptierten Platz im Spektrum der traditionellen Einzelwissenschaften einnimmt. 5.1. Analytische Theorien Vorbereitend fragen wir uns, in welcher Art die Menge I der intendierten Anwendungen einer Theorie gegeben ist bzw. wie diese Menge charakterisiert wird. Wie ist festgelegt, welche realen Systeme intendierte Anwendungen der Theorie sind, d. h. genauer: für welche der realen Systeme bilden die aus ihnen zu gewinnenden Daten ein zu I gehöriges partielles potentielles Modell? Im allgemeinen kommt man hier nicht mit einer rein verbalen und noch weniger mit einer axioma-
600 tischen Charakterisierung aus. Der normale Weg ist vielmehr der, daß zuerst einige wenige reale Systeme ostensiv als intendierte Anwendungen ausgezeichnet werden und daß andere Systeme dann als intendierte Anwendungen eingestuft werden, wenn sie den ostensiv ausgezeichneten Systemen ähnlich sind oder wenn sich die Theorie in den drei beschriebenen Schritten erfolgreich auf sie anwenden läßt. Durch dieses Verfahren wird die Menge I als eine relativ kleine Teilmenge von Mpp positiv bestimmt und aufgebaut. Bei den meisten Theorien gibt es unendlich viele verschiedene abstrakte partielle potentielle Modelle, so daß I als „Bild“ der nur endlich vielen real existierenden Systeme eine echte, ziemlich kleine Teilmenge von Mpp sein wird. Wir schreiben REALpp, um die Menge aller partiellen potentiellen Modelle zu bezeichnen, die einem realen System entsprechen. Ein Element von REALpp stellt man sich am besten vor als eine endliche Menge von atomaren Sätzen in der Sprache der Theorie, die aus der Untersuchung, Beobachtung oder Erforschung eines klar abgegrenzten, realen Systems erhalten wurde. Auf ein genaueres Verständnis dieses Erhaltens kommt es hier nicht an. Unter Bezugnahme auf die Menge REALpp unterscheiden wir nun zwischen Theorien, bei denen die Menge I der intendierten Anwendungen eine echte, meist immer noch ziemlich kleine Teilmenge von REALpp ist, und solchen, bei denen gilt: I ⫽ REALpp. Theorien der ersten Art nennen wir empirisch, die der zweiten Art analytisch. Diese Untersuchung läßt sich noch durch eine zweite Formulierung erläutern. Mit einer empirischen Theorie ist eine empirische Behauptung verbunden, nämlich die Behauptung, daß alle Systeme, mit denen sich die Theorie befaßt, auch unter die Theorie subsumierbar sind. Subsumierbar bedeutet hier, daß die Daten, die man aus einem System gewinnt, in ein Modell der Theorie (approximativ) eingebettet werden können (im Sinne des Anwendungsprozesses). Die Systeme, mit denen sich eine Theorie befaßt, sind natürlich jene, die die Vertreter der Theorie interessant finden und auf die sie die Theorie anzuwenden gedenken oder auf die sie die Theorie bereits angewandt haben. Der problematische Teil dieser Formulierung betrifft „die Systeme, auf die die Vertreter die Theorie anzuwenden gedenken“, wenn wir unterstellen, daß dies ein Interesse an jenen Systemen impliziert. Sicher läßt sich zu diesem Punkt
IV. Methoden der Semiotik
noch einiges aus der Psychologie und Soziologie sagen, aber im Kern kommen wir auf das bereits geschilderte Verfahren zur Bestimmung dessen, was intendiert ist. Die Vertreter gedenken, die Theorie auf jene Systeme anzuwenden, die den bereits untersuchten hinreichend ähnlich sind, und wenn Zweifel bestehen, ob hinreichende Ähnlichkeit vorliegt, entscheidet der Ausgang eines Anwendungsprozesses oder Versuchs. Wenn keine Einbettung erreicht wird, liegt auch keine intendierte Anwendung vor. Im allgemeinen wird man nicht erwarten, daß alle realen Systeme, in denen die Begriffe der Theorie realisiert sind, auch unter die Theorie subsumiert werden können. Hiergegen spricht zum einen die positive Ausrichtung des Verfahrens zur Bestimmung, ob etwas eine intendierte Anwendung sein soll oder nicht. Zum anderen spricht dagegen die Erfahrung mit vielen Theorien, die zeigt, daß die meisten Theorien mit Gegenbeispielen zu kämpfen haben. Gegenbeispiele sind aber reale Systeme, die zwar eine Anwendung der Begrifflichkeit der Theorie zulassen, die sich aber nicht unter die Theorie subsumieren lassen. In der vorher eingeführten Terminologie bedeutet also die Existenz von Gegenbeispielen, daß I eine echte Teilmenge der realen partiell-potentiellen Modelle ist: I 傺 REALpp. Unsere Unterscheidung von analytischen Theorien zeichnet daher einen Sonderfall aus, eben den Sonderfall, in dem man von allen Systemen, wo die Begrifflichkeit der Theorie anwendbar ist, auch schon vermutet, daß die Theorie erfolgreich angewandt werden kann: REALpp 債 I. Auf den ersten Blick möchte man meinen, daß dieser Sonderfall nicht eintritt, tatsächlich aber ist er weit verbreitet. Wir wollen dies an zwei Beispielen deutlich machen. Das erste Beispiel ist die Arithmetik, also eine mathematische Theorie (vgl. Art. 136). Zwar gibt es verschiedene Ansichten über den Status dieser Theorie heute, aber man kann nicht leugnen, daß entwicklungs- und erkenntnispsychologische Forschungen die empirischen Wurzeln der Arithmetik offenlegen (vgl. Balzer 1979). Jede Zählung von realen Objekten etwa benutzt elementare arithmetische Annahmen und kann daher als intendierte Anwendung aufgefaßt werden. Das obige Verfahren zur Auszeichnung der intendierten Anwendungen der Theorie macht auch hier Sinn. Wir finden es nach wie vor im Lernprozeß bei Kindern, die die arithmetischen Grundbegriffe internalisieren. Es werden also
28. Methodenprobleme der Semiotik
die intendierten Anwendungen auch hier positiv durch Beispiele und Ähnlichkeiten festgelegt. Neben dieser Feststellung ist jedoch noch eine zusätzliche Komponente wirksam, die uns glauben läßt, daß alle Systeme, in denen wir die arithmetischen Begriffe überhaupt realisieren können, auch schon die arithmetischen Grundannahmen erfüllen. Diese Komponente besteht in der Beobachtung, daß sich die arithmetischen Axiome direkt als Regeln ansehen lassen, die bei einer Interpretation der arithmetischen Begriffe zu beachten sind. Dies legt es zumindest auf einer psychologischen Ebene nahe, an die Gültigkeit dieser Axiome bei jeder korrekten Interpretation (bei der die Regeln ja beachtet werden) zu glauben. In gewisser Weise gehen also die arithmetischen Axiome (mit Ausnahme des Induktionsaxioms) ohne Rest in Anwendungsregeln auf. Als zweites Beispiel betrachten wir die Buchhaltung (vgl. Art. 86 und 148). Die Annahmen, die der doppelten Buchführung zugrunde liegen, haben zweifellos theoretische Form (vgl. Balzer und Mattessich 1991), nicht ohne Grund stammt ein frühes Werk über Buchhaltung von dem bekannten Mathematiker Wallis. Auch hier haben wir intendierte Anwendungen (Firmen und deren Warenflüsse), die auf der einen Seite positiv durch Beispiele definiert sind (Was ist eine Firma?). Auf der anderen Seite aber führt bereits die bloße Anwendbarkeit der Grundbegriffe der Buchführung (Konto, Saldo) in einem System zu der Überzeugung, daß dieses System konsistent in ein Modell der doppelten Buchführung eingebettet werden kann. Mit anderen Worten: jedes reale System, in dem sich die Begriffe der Buchhaltung anwenden lassen, läßt sich auch schon unter die Annahmen der doppelten Buchführung subsumieren. Die Gründe hierfür liegen wieder, wie bei mathematischen Theorien, darin, daß man die Grundannahmen (d. h. im wesentlichen den Satz, daß die Salden stets ausgeglichen sind) als Regeln für die korrekte Anwendung der Grundbegriffe (Kontensystem) auffassen kann. Diese Beispiele zeigen, daß es analytische Theorien gibt, daß diese sehr wohl für den praktischen Umgang mit der Welt relevant sind, daß ihre Relevanz aber hauptsächlich in Schritt eins des Anwendungsprozesses (Realisierung der Begriffe) zu sehen ist (im Gegensatz zu empirischen Theorien, bei denen Schritt drei: Konsistenz der Daten mit den Gesetzen, im Vordergrund steht).
601 5.2. Implikationen der Analytizität für die Semiotik Es liegt nahe zu vermuten, daß sich für empirische Theorien eine andere methodologische Ausgangslage ergibt als für analytische. Wenn dies zutrifft, dann wird man bei der Semiotik je nachdem, ob man sie als analytische oder empirische Theorie betrachtet, zu einer anderen Einschätzung ihrer methodologischen Situation kommen. Es kann nicht Aufgabe dieses Beitrags sein, eine Entscheidung über den methodologischen Status der Semiotik zu fällen und zu begründen. Abgesehen davon, daß eine Begründung umfangreiche inhaltliche und vor allem auch historische Studien von der Art der in diesem Werk zusammengestellten Arbeiten voraussetzt (vgl. insbesondere Art. 35), sollte die Beurteilung maßgeblichen Vertretern der Semiotik überlassen werden. Gegenwärtig scheint es hier noch keine einheitliche Meinung zu geben. Andererseits muß es erlaubt sein, zu dieser Frage eine Vermutung zu äußern. Wenn man von einem Entwicklungsstand ausgeht, wie er sich in den Arbeiten dieses Handbuchs widerspiegelt, dann scheint es nicht unplausibel, die Semiotik als analytische Theorie einzustufen. Die Lage in der Semiotik weist erhebliche Ähnlichkeiten mit der in den beiden vorherigen Beispielen auf, vor allem im ersten Schritt des Anwendungsprozesses (Realisierung der Begriffe). Auch in der Semiotik scheint die Anwendbarkeit der Grundbegriffe der Semiose auf ein reales System bereits hinreichend dafür zu sein, dieses auch als intendierte Anwendung der Semiotik aufzufassen. Auch hier haben wir zwei Arten der Auszeichnung intendierter Anwendungen. Einmal gibt es die positive, paradigmatische Auszeichnung. Alle Systeme, die von antiken und mittelalterlichen Autoren, wie in den Artikeln der Kapitel VI⫺XI dieses Handbuchs zu finden, im Zusammenhang mit Zeichen und deren Bedeutung diskutiert wurden, und vor allem die Systeme, die die „Klassiker“ Saussure und Morris als Beispiele betrachten, zählen als intendierte Anwendungen. Weiter all jene Systeme, die den genannten hinreichend ähnlich sind. Zum anderen aber besteht die Bereitschaft, Semiosen auch überall da zu vermuten, wo die Grundbegriffe sinnvoll angewandt werden können (vgl. Art. 30 § 1.6.). Das heißt, überall da, wo man die Grundbegriffe „Zeichen“, „Bezeichnetes“, „Interpret“ in einem System interpretieren oder realisieren kann, geht man davon
602 aus, daß die Semiotik erfolgreich auf das System angewandt werden kann. Dies ist aber gerade die Annahme, daß jedes partielle potentielle Modell schon eine intendierte Anwendung ist. Obwohl diese Überlegungen einer sorgfältigeren Begründung bedürften, um als Argument gelten zu können, wollen wir kurz den möglichen hypothetischen Implikationen nachgehen, die eine Einordnung als analytische Disziplin hätte. Bei einer analytischen Theorie ist jedes reale partielle potentielle Modell schon eine intendierte Anwendung der Theorie. Das heißt, daß die Theorie sich bei jedem System bewähren muß, in welchem man ihre Grundbegriffe ausmachen kann. Schon ein einziges reales System, in dem die Grundbegriffe realisiert sind, auf das sich die Theorie jedoch nicht erfolgreich anwenden läßt, stellt eine Widerlegung dar, zumindest im strengen Sinn des Deduktivismus. Jedenfalls steht im Fall eines Konflikts mit realen Daten die Strategie, die Daten als nicht-intendiert auszusondern, nicht mehr zur Verfügung. Die Theorie ist also scheinbar leichter zu widerlegen als eine empirische Theorie. Tatsächlich jedoch wird diese größere Falsifizierbarkeit durch einen anderen Umstand ausgeglichen, nämlich den Charakter der Axiome als Regeln zur Realisierung oder Konstruktion der Grundbegriffe in einem realen System. Wenn bei der Realisierung die Axiome als Regeln angewandt werden, garantiert dies in einem gewissen Umfang bereits die Gültigkeit der Axiome. Wie steht es mit diesem Punkt bei der Semiotik? Ohne uns auf ein bestimmtes Modell der Semiose festlegen zu wollen, besteht die Anwendung grob gesprochen darin, das Dreierschema „Zeichen“, „Bezeichnetes“, „Interpret“ nachzuweisen, in Verbindung mit den Kodes, aus denen die Zeichen stammen, sowie den Bedeutungen der Zeichen. Um in einem realen System ein Zeichen zu identifizieren, muß man es in Kontrast bringen zum gleichzeitig zu identifizierenden Bezeichneten und zum Interpreten, und man muß es im relevanten Kode einordnen. Gleiches gilt symmetrisch auch für den Begriff des Bezeichneten und für den des Interpreten (vgl. Art. 1 § 2.). Wenn dies gelingt, dann ist das System auch bereits ein Modell der Theorie. Wenn die Einordnung der Semiotik als analytisch sich bewähren sollte, dann erhält die hermeneutische Methode eine ausgezeichnete Rolle, denn dann nimmt die Theorie selbst die Stellung der vorgängigen Interpre-
IV. Methoden der Semiotik
tationen im hermeneutischen Schema ein, und Schritt 1 des Anwendungsprozesses, der bei analytischen Theorien der wichtigste ist, erfolgt nach hermeneutischem Muster.
6.
Das Verhältnis der Semiotik zu anderen Wissenschaften
Abschließend seien noch kurz zwei weitere Punkte angesprochen, die für eine methodologische Bewertung der Semiotik von Relevanz sind. Erstens ist dies die Frage, ob die Semiotik nicht vielleicht eine Meta-Wissenschaft oder Meta-Theorie sei (vgl. Art. 30 und 123). Diese Frage kann leicht mit einer anderen ähnlichen verwechselt werden, die in der Tat streng von der ersten zu trennen ist, nämlich ob die Objekte der Semiotik von höherer theoretischer Ordnung seien. Unter Objekten verstehen wir hier die intendierten Anwendungen. Diese sind von höherer Ordnung, wenn sie ganz oder teilweise durch andere Theorien konstituiert werden und in diesem Sinne epistemologisch „höher“ als direkt beobachtbare Objekte oder Dinge stehen. Das wichtigste Indiz für eine solche Konstitution der Objekte einer Theorie T besteht in der Existenz von intertheoretischen Beziehungen zu Vortheorien von T, d. h. Theorien, die von T nicht abhängen, in denen aber einige Begriffe von T in ihrer Bedeutung festgelegt werden. Von Balzer, Moulines und Sneed (1987) werden solche Beziehungen als (für T) „essential links“ bezeichnet. In diesem Sinn wirkt etwa die Geometrie konstitutiv für die Objekte (die intendierten Anwendungen, speziell für den Begriff des Raumes) der Mechanik. Sicher sind die Objekte der Semiotik in diesem Sinn oft von höherer Ordnung. Man denke an Anwendungen, in denen linguistische oder literaturtheoretische Annahmen vorausgesetzt und benutzt werden. Dies hat aber keinerlei Auswirkungen auf den Status der Semiotik als Meta- oder Objekt-Theorie. In der Wissenschaft gibt es zahlreiche Theorien, die sich mit Objekten höherer Ordnung befassen, in reifen Bereichen der Naturwissenschaften ist dies geradezu ein Regelfall. Eine Meta-Wissenschaft oder Meta-Theorie ist eine Theorie, deren Objekte selbst wieder Theorien oder theorienartige Wissenschaftszweige sind, also eine Theorie über andere Theorien. Diesen Status kann man der Semiotik nur bedingt zuschreiben. In den zahlreichen Fällen, wo sich ihre Anwendun-
28. Methodenprobleme der Semiotik
603
Balzer, W. und R. V. Mattessich (1991), „The Axiomatic Structure of Basic Accounting“. Theory and Decision 30: 213⫺243.
Bortz, J. (1985), Statistik. 2. Aufl. Berlin, Heidelberg, New York und Tokio. Bridgeman, P. W. (1927), The Logic of Modern Physics. Cambridge. Carnap, R. und R. C. Jeffrey (eds.) (1971), Studies in Inductive Logic and Probability, Vol. I. Berkeley, Los Angeles und London. Dallmayr, F. R. und T. A. McCarthy (1977), Understanding and Social Inquiry. London. Feyerabend, P. (1976), Wider den Methodenzwang. Frankfurt a. M. Gadamer, H.-G. (1960), Wahrheit und Methode. Tübingen. Glymour, C. (1980), Theory and Evidence. Princeton. Jeffrey, R. C. (ed.) (1980), Studies in Inductive Logic and Probability, Vol. II. Berkeley, Los Angeles und London. Kodratoff, Y. (1988), Introduction to Machine Learning. London. Kohlrausch, F. (1968), Praktische Physik. 22. Aufl. Stuttgart. Krantz, D. H., R. D. Luce, P. Suppes und A. Tversky (1971), Foundations of Measurement, Vol. I. New York und London. Kuhn, T. (1970), The Structure of Scientific Revolutions. 2. Aufl. Chicago. Lorenzen, P. (1987), Lehrbuch der konstruktiven Wissenschaftstheorie. Mannheim. Morik, K. (ed.) (1990), Proceedings of the Fourth European Working Session on Learning. London. Osherson, D. N. und S. Weinstein (1986), „Identification in the Limit of First Order Structures“. Journal of Philosophical Logic 15: 55⫺81. Plotkin, G. (1970), „A Note on Inductive Generalization“. In: B. Meltzer und D. Michie (eds.), Machine Intelligence 5. New York: 153⫺163. Popper, R. K. (1971), Logik der Forschung. 4. Aufl. Tübingen. Posner R. (1982), Rational Discourse and Poetic Communication: Methods of Linguistic, Literary and Philosophical Analysis. Berlin, New York und Amsterdam. Prieto, L. J. (1972), Nachrichten und Signale. Berlin. Sneed, J. D. (1971), The Logical Structure of Mathematical Physics. Dordrecht. Stegmüller, W. (1986), Theorie und Erfahrung, 3. Teilbd. Berlin, Heidelberg, New York und Tokio. Wright, G. H. von (1974), Erklären und Verstehen. Frankfurt a. M.
Balzer, W., C. U. Moulines und J. D. Sneed (1987), An Architectonic for Science. Dordrecht.
Wolfgang Balzer, München (Deutschland)
gen mit denen anderer Disziplinen überlappen, kann man kaum sagen, daß die Semiotik die theoretischen Modelle oder die Methoden dieser anderen Disziplinen als ihren eigentlichen Gegenstand hat. Zum Beispiel ist die Betrachtung gewisser formaler Grammatiken, wie sie in Linguistik und theoretischer Informatik entwickelt wurden, nicht primär darauf ausgerichtet, diese als Grammatiken zu untersuchen, das Hauptinteresse ist vielmehr, unter Einbeziehung solcher Grammatiken zu interessanten Einsichten in gewisse Typen von Semiose zu gelangen. Wenn die Semiotik also keine Meta-Wissenschaft im strengen Sinn ist, dann stellt sich die zweite Frage nach der Natur ihrer Beziehungen zu den vielen Disziplinen, mit denen sie verbunden ist. Diese Beziehung ist einerseits ziemlich einfach, wenn man sich auf das Verhältnis zwischen der Semiotik und einer einzigen anderen Theorie, etwa einer linguistischen, beschränkt. In diesem Fall liegt ein schon angedeutetes „Konstitutionsverhältnis“ vor: die Semiotik betrachtet Gegenstände, die von der anderen Theorie konstituiert, d. h. theoretisch strukturiert wurden. Anders aber als in den Naturwissenschaften, wo in der Regel die Objekte einer Theorie von einer einzigen anderen Theorie konstituiert werden, liegt dieses Verhältnis in der Semiotik zu einer Vielzahl von anderen Theorien vor. Kapitel XIV dieses Handbuchs legt hiervon eindrucksvoll Zeugnis ab. Mit Recht kann man die Semiotik deshalb als einen interdisziplinären Ansatz bezeichnen, wie dies in Artikel 123 genauer definiert und behauptet ist. Ein Konstitutionsverhältnis in umgekehrter Richtung, von der Semiotik zu anderen Wissenschaften, scheint dagegen nicht zu bestehen.
7.
Literatur (in Auswahl)
Balzer, W. (1979), „On the Status of Arithmetic“. Erkenntnis 14: 57⫺85. Balzer, W. (1985), Theorie und Messung. Berlin, Heidelberg und New York.
604
IV. Methoden der Semiotik
29. Daten und Hypothesen in der Semiotik 1. Analytisch-nomologisches vs. explorativinterpretatives Paradigma 2. Phasen empirischer Forschung 3. Hypothesenformulierung, Konzeptspezifikation, Operationalisierung und Formalisierung 3.1. Hypothesenformulierung 3.2. Konzeptspezifikation und Operationalisierung 3.3. Formalisierung 4. Messung und Skalierung 4.1. Messung als Modellbildung 4.2. Die Signalentdeckungstheorie 5. Datenerhebung und Datenanalyse 6. Gütekriterien empirischer Forschung 7. Literatur (in Auswahl)
chen Unschärfe vermieden werden (für eine Begründung vgl. Grotjahn 1993). Die folgenden Ausführungen beziehen sich in erster Linie auf das analytisch-nomologische Paradigma und dessen Anwendung in der empirischen Anthroposemiotik. Ich beschränke mich dabei zudem auf die sogenannte Aussagenkonzeption von Theorien (vgl. Art. 30 § 1.9. und 132). Weiterführende Hinweise zum explorativ-interpretativen Paradigma finden sich z. B. in Flick et al. (1991), Flynn (1991) und Grotjahn (1987, 1991, 1993). Eine Darstellung strukturalistischer Theorienkonzepte gibt z. B. Stephan (1990).
1.
2.
Analytisch-nomologisches vs. explorativ-interpretatives Paradigma
Für semiotische Disziplinen, die an der analytischen Wissenschaftstheorie und speziell am Kritischen Rationalismus orientiert sind, wie zum Beispiel die experimentelle Psychologie und weite Teile der empirischen Sozialforschung, besteht die eigentliche Aufgabe in der empirischen Überprüfung von Hypothesen, wobei in der Regel quantitative Verfahren zum Einsatz kommen. Gut bestätigte allgemeine Hypothesen ⫺ auch als „nomologische Hypothesen“ oder „Gesetze“ bezeichnet ⫺ können dann in Form von Erklärungen oder Prognosen auf die Realität angewendet werden. Dementsprechend kann man diese Richtung auch als analytisch-nomologisches Paradigma bezeichnen. Für Wissenschaftskonzeptionen wie die der verstehenden Soziologie, kommunikativen Sozialforschung oder Ethnomethodologie ist dagegen die möglichst unvoreingenommene Exploration des jeweiligen Gegenstandes von entscheidender Bedeutung. Zudem kommen bei der Datenanalyse zumeist interpretative Verfahren (z. B. hermeneutische Textinterpretation, qualitative Inhaltsanalyse) zum Einsatz. Es kann deshalb hier von einem explorativ-interpretativen Paradigma gesprochen werden. Häufig wird zur Bezeichnung des Gegensatzes zwischen analytisch-nomologischem und explorativ-interpretativem Paradigma auch die Dichotomie „quantitative vs. qualitative Forschung“ verwendet. Dieser Sprachgebrauch sollte allerdings u. a. wegen seiner begriffli-
Phasen empirischer Forschung
Betrachtet man, wie z. B. Bunge (1967) oder Herrmann (1993), Forschung als Problemlösungsprozeß und wissenschaftliche Methoden als Problemlösungsstrategien, dann läßt sich der Verlauf empirischer, d. h. erfahrungswissenschaftlicher, Forschung folgendermaßen charakterisieren (vgl. Bunge 1967 Bd. I, 9): Ausgangspunkt des Forschungsprozesses ist die Feststellung, daß es im Rahmen der bisherigen konzeptuellen Rekonstruktion der Realität, d. h. im Rahmen unseres verfügbaren (theoretischen) Wissens, nicht möglich ist, einen bestimmten Sachverhalt befriedigend zu erklären oder vorherzusagen. Der erste Problemlösungsschritt besteht in der Formulierung einer empirischen Hypothese als tentative Antwort auf die aufgeworfenen Fragen (vgl. Art. 28 § 2.). In einem nächsten Schritt ist die Angemessenheit der Hypothese an der Realität zu überprüfen. Dazu müssen unter Bezugnahme auf das verfügbare Wissen aus der Hypothese überprüfbare (beobachtbare) Konsequenzen abgeleitet sowie adäquate Überprüfungsmethoden gesucht bzw. entwickelt werden. Nach dem empirischen Nachweis der Adäquatheit (Problemrelevanz, Zuverlässigkeit) der Überprüfungsmethoden sind die aus der Hypothese abgeleiteten Konsequenzen anhand von Beobachtungsdaten zu überprüfen, und es ist zu entscheiden, ob die Hypothese bis auf weiteres zu akzeptieren oder zu verwerfen ist. Der Ertrag einer wissenschaftlichen Untersuchung läßt sich dann letztendlich an den herbeigeführten Veränderungen im Ausgangswissen und/oder den neu aufgeworfenen Problemen messen.
29. Daten und Hypothesen in der Semiotik
Das skizzierte Modell ist als ein relativ grobes und idealisiertes Sollmodell zu verstehen. In detaillierten, als Leitfaden für die konkrete Forschungspraxis geeigneten Verlaufsmodellen empirischer Forschung (vgl. z. B. Hager 1987, 47; Kromrey 1991, 58 ff; Bortz 1993, 3) werden u. a. folgende (sequentielle) Forschungsphasen unterschieden: Hypothesenformulierung, Konzeptspezifikation und Operationalisierung, Formalisierung, Messung und Skalierung, Datenerhebung, Datenanalyse. Häufig wird in diesem Zusammenhang unter Bezug auf Reichenbach (1938 ⫽ 1970, 6 f) auch zwischen dem Entdeckungszusammenhang und dem Begründungszusammenhang von Wissenschaft unterschieden, wobei dieses Begriffspaar zuweilen um das pragmatische Konzept des Verwertungs- und Wirkungszusammenhangs ergänzt wird (vgl. Kromrey 1991, 62 ff). Die analytische Wissenschaftstheorie hat sich lange Zeit vor allem mit der Logik der Begründung der Geltung von wissenschaftlichen Aussagen(systemen), d. h. mit dem syntaktisch-semantischen Aspekt wissenschaftlicher Zeichensysteme, beschäftigt (vgl. Art. 30 § 1.). Wie der Forscher zu seinen Hypothesen kommt und welchen Einfluß Verwertungsinteressen auf die Forschung haben, d. h. die Pragmatik wissenschaftlicher Zeichensysteme (vgl. Art. 28 § 2. und 3.), wurde dabei als für die Geltung von Aussagen letztendlich irrelevant angesehen (zur Wissenschaftspragmatik vgl. allgemein z. B. Groeben und Westmeyer 1975 ⫽ 1981, 26⫺33, 157⫺225; der bestimmende Einfluß des Entdeckungs-, Verwertungs- und Wirkungszusammenhangs auf die „Fabrikation“ wissenschaftlicher Erkenntnis wird u. a. von Knorr-Cetina 1991 herausgearbeitet).
3.
Hypothesenformulierung, Konzeptspezifikation, Operationalisierung und Formalisierung
3.1. Hypothesenformulierung Nach Bunge (1967 Bd. I, 222 ff) sind empirische Hypothesen Sätze, die in ihrem Gehalt über die in einem bestimmten Gegenstandsbereich bereits festgestellten Sachverhalte hinausgehen und zudem zumindest prinzipiell an der Realität überprüfbar sind. In einer empirischen Hypothese wird meist ein Zusammenhang zwischen zwei oder mehr Variablen formuliert (vgl. Schulz, Muthig und Koeppler 1981, 26 ff; Schnell, Hill und Esser
605 1992, 42 ff). Wird die Richtung der Abhängigkeit zwischen den Variablen spezifiziert, d. h. wird die Veränderung in einer Variablen Y auf den Einfluß einer Variablen X zurückgeführt, dann wird X als „unabhängige Variable“ oder auch „Prädiktorvariable“ und Y als „abhängige Variable“ oder auch „Kriteriumsvariable“ bezeichnet. Für das analytischnomologische Paradigma ist die Überprüfung von Hypothesen die zentrale Aufgabe. Die Exploration des Gegenstandsbereichs zwecks Hypothesenbildung spielt dagegen nur eine untergeordnete Rolle (vgl. § 6.; siehe auch Art. 28). 3.2. Konzeptspezifikation und Operationalisierung Damit eine Hypothese an der Realität überprüft werden kann, müssen die in ihr vorkommenden Variablen operationalisiert werden, d. h. es müssen sogenannte „Korrespondenzregeln“ angegeben werden, mit deren Hilfe eindeutig entscheidbar ist, welche empirischen Phänomene welchen Variablen zuzuordnen sind und wie die empirischen Phänomene zu messen sind (vgl. z. B. Opp 1993). Da die den Variablen entsprechenden Konzepte zumeist nicht eindeutig definiert sind, ist in der Regel eine vorgängige Konzeptspezifikation z. B. in Form einer Nominaldefinition oder einer Begriffsexplikation notwendig (vgl. Schnell, Hill und Esser 1992, 129 ff). Handelt es sich bei der Variablen um ein komplexes theoretisches Konstrukt, d. h. um einen nicht direkt beobachtbaren, mehrdimensionalen Begriff wie z. B. ‘Sprachverstehen’, dann ist die Zuordnung von Beobachtungsbegriffen, d. h. die sogenannte „Indikatorenbildung“, in der Regel umso schwieriger, je weiter der Begriff von der Beobachtungsebene entfernt ist und je größer die Anzahl der zu erfassenden Dimensionen ist. Welche Indikatoren wir zur Erfassung des Konstrukts auswählen, hängt von dem verfügbaren (theoretischen) Wissen und von der Zielsetzung der Untersuchung ab. Hinweise zur Operationalisierung und Messung einer Vielzahl von Variablen nonverbalen Verhaltens geben Scherer und Wallbott (1985). 3.3. Formalisierung Zur Überprüfung von Hypothesen ist häufig deren Übersetzung in ein mathematisches Modell nötig oder zumindest empfehlenswert (vgl. Art. 30 § 1.7.). So müssen empirische Hypothesen zur inferenzstatistischen Überprüfung zuerst in probabilistische Modelle
606
IV. Methoden der Semiotik
und darauf bezogene statistische Hypothesen (z. B. Null- und Alternativhypothesen) übersetzt werden (vgl. § 5.). Weiterhin ist es zur Prüfung der logischen Konsistenz von Hypothesensystemen oft hilfreich, eine Übersetzung in die Sprache der Prädikatenlogik vorzunehmen. Dies ermöglicht, auf einer rein syntaktischen Ebene zu operieren, wodurch die Konsistenzprüfung erheblich einfacher und weniger fehleranfällig wird (vgl. Art. 3 § 4.). Eine Vielzahl von Beispielen von Formalisierungen semiotischer Fragestellungen finden sich in Nowakowska (1983, insb. Kap. 4), die u. a. folgende Themenkreise behandelt: multimediale Kommunikation, Kontrollprozesse bei der Wahrnehmung, Repräsentationssysteme, Beobachtbarkeit und Veränderung von Zeichensystemen. Weitere Beispiele geben u. a. Altmann und Grotjahn (1988) sowie Hammerl (1991), die zeigen, wie sich auf der Basis des Zipfschen Prinzips der minimalen Anstrengung und dessen Spezifikation in Form der synergetischen Ordnungsparameter ‘Bedürfnis des Zeichenproduzenten nach Minimierung des Produktionsaufwands’ und ‘Bedürfnis des Zeichenrezipienten nach Minimierung des Dekodieraufwands’ Systeme von Differential- und Differenzengleichungen ableiten lassen, deren Lösung zu probabilistischen Modellen für zahlreiche Zeichenprozesse führen (vgl. auch Art. 127 sowie Pelc 1983 und Piotrowski, Lesohin und Lukjanenkov 1990).
4.
Messung und Skalierung
4.1. Messung als Modellbildung Im folgenden soll unter Bezug auf die grundlegenden Ausführungen von Gigerenzer (1981) Messung als eine spezifische Art der Modellbildung aufgefaßt werden, nämlich als Modellbildung mit Hilfe numerischer Systeme (vgl. auch Altmann und Grotjahn 1988). Unter einem numerischen System ⫺ häufig auch als „numerisches Relativ“ bezeichnet ⫺ ist dabei eine Menge numerischer Objekte (Zahlen, Vektoren) mit mindestens einer auf dieser Menge definierten numerischen Relation (z. B. die Größer-Relation „⬎“) zu verstehen. In Anlehnung an Gigerenzer soll von einer fünfstelligen Modellrelation M(S, Z, N, E, c) ausgegangen werden, in der S das Modellsubjekt (Forscher), N ein numerisches Relativ, E ein empirisches Relativ (empirisches System), c das Modelloriginal (semiotischer Gegenstandsbereich) und Z die
Zielsetzung ist, mit der S ein bestimmtes E als Modell für c benutzt. Weiterhin soll davon ausgegangen werden, daß der Gegenstandsbereich einer empirischen Semiotik konstituiert wird von prinzipiell dreigliedrigen theoretischen Konzepten bestehend aus Merkmal (Relation), Objekt und Sender/Empfänger (vgl. Art. 1 § 2.). Diese prinzipielle Dreigliedrigkeit soll auch dann gelten, wenn bei der semiotischen Modellbildung vom Sender/ Empfänger abstrahiert und lediglich die materielle Information betrachtet wird (wie z. B. bei bestimmten symbolstatistischen Fragestellungen). Das empirische Relativ E entsteht, wenn das forschende Subjekt S Daten bei den Sendern/Empfängern erhebt (vgl. § 5.). Es besteht aus dreigliedrigen Protokollsätzen ⫺ semiotisch als indexikalische Sätze charakterisierbar ⫺ z. B. folgender Art: „Der Text y hat auf den Leser x die emotionale Wirkung z“. Kennzeichnend für die vorgestellte Konzeption ist, daß S Modellbildung betreibt mit Hilfe von theoretischen Konstrukten auf der Basis der von den untersuchten Sendern/Empfängern benutzten Modelle. Weiterhin ist kennzeichnend, daß sowohl N und E als auch E und c in Interaktion stehen, d. h. sich wechselseitig bedingen. Der beschriebene Sachverhalt ist in Abb. 29.1 verdeutlicht. Die eigentliche Messung erfolgt durch die Abbildung des empirischen Relativs E in ein numerisches Relativ N. Dabei sind die empirischen Relationen derart in das numerische Relativ abzubilden, daß die numerischen Relationen die empirischen Relationen repräsentieren (z. B. daß die numerische Gleichheitsrelation „⫽“ eine empirische Ununterscheidbarkeitsrelation repräsentiert), d. h. es ist eine strukturerhaltende Abbildung ⫺ ein sogenannter „Homomorphismus“ ⫺ zu finden. Existiert ein Homomorphismus, dann spricht man auch von fundamentaler Messung. Eine abgeleitete Messung liegt dagegen vor, wenn man das über eine fundamentale Messung erhaltene numerische Relativ in ein anderes numerisches Relativ abbildet. Beispiele für abgeleitete Messungen sind deskriptive Statistiken wie das arithmetische Mittel. Entsprechend der dargestellten Konzeption ist Messung nur möglich, wenn die im jeweiligen numerischen System geltenden Relationen auch als empirische Gesetzmäßigkeiten in dem von S modellierten Gegenstandsbereich gelten (vgl. Art. 31 § 2.9.). Dies bedeutet, daß jede Anwendung eines numerischen Systems auf einen semiotischen Gegen-
607
29. Daten und Hypothesen in der Semiotik
Abb. 29.1: Die modellbildende Funktion der Messung (nach Gigerenzer 1981, 31).
standsbereich eine semiotische Theorie über diesen Gegenstandsbereich impliziert und daß die Meßwerte erst im Lichte von Theorien einen Sinn bekommen ⫺ ein Sachverhalt, der nicht nur in der Semiotik verstärkt Beachtung finden sollte (vgl. Gigerenzer 1981, 33; Gigerenzer und Murray 1987, Kap. 1). Bei einer Messung sind eine Reihe fundamentaler Probleme zu beachten (vgl. z. B. Gigerenzer 1981; Feger und Bredenkamp 1983, Bd. 3; Heidenreich 1993 a und b; Pedhazur und Pedhazur Schmelkin 1991, Teil 1; Orth 1992; Schnell, Hill und Esser 1992, Kap. 4; hinsichtlich der Reliabilitäts- und Validitätsproblematik vgl. § 6.). 4.1.1. Das Repräsentationsproblem Als erstes gilt es zu klären, ob eine Messung überhaupt möglich ist, d. h. ob ein empirisches Relativ in adäquater Weise durch ein numerisches Relativ repräsentiert werden kann (ob ein geeigneter Homomorphismus gefunden werden kann). 4.1.2. Das Eindeutigkeitsproblem Hier geht es darum, daß es in der Regel mehrere Funktionen gibt, die eine homomorphe Abbildung ergeben (z. B. Messung der Wärme auf der Celsius- oder Fahrenheit-
skala). Die Klasse der Funktionen f, die eine homomorphe Abbildung ergeben, bestimmt das Meßniveau oder Skalenniveau, wobei unter einer Skala das Tripel *E, N, f+ zu verstehen ist. Je kleiner diese Klasse ist, desto eindeutiger ist die Skala und desto höher ist das Skalenniveau (Meßniveau). Die Konstruktion einer Skala wird häufig als „Skalierung“ bezeichnet. So kann beispielsweise das u. a. zur Erfassung der Konnotation von Zeichen benutzte semantische Differential (vgl. z. B. Schäfer 1983) als eine spezielle Skalierungstechnik aufgefaßt werden. Die Nominalskala (auch „kategoriale“ oder „klassifikatorische Skala“ genannt) stellt den niedrigsten Skalentyp dar. Hier sind Zahlen nur Namen für Klassen von Objekten. Die Ordinalskala (Rangskala) erlaubt zusätzlich zur Klassifikation die Anordnung der Objekte in einer Rangordnung. Die Intervallskala (Einheitenskala) erfüllt zusätzlich zur Rangordnung auch das Kriterium der Gleichheit der Meßwertintervalle (Beispiel: Temperatur gemessen in Celsius). Während auf der Intervallskala die Wahl des Nullpunkts willkürlich ist, hat die Verhältnisskala (auch „Ratioskala“ oder „Proportionalskala“ genannt) einen absoluten (natürlichen) Nullpunkt (Beispiel: Temperatur gemessen in Kelvin). Intervall- und Verhältnisskala wer-
608 den häufig auch als „quantitative“ oder „metrische Skalen“, Nominal- und Ordinalskala als „qualitative“ oder „nichtmetrische Skalen“ bezeichnet. Analog wird auch zwischen qualitativen (nichtmetrischen) Begriffen und metrischen oder quantitativen Begriffen unterschieden. Da eine höhere Skala jeweils auch alle Eigenschaften, die die niedrigeren Skalen erfassen, miterfaßt, kann das Niveau der benutzten Skalen und Begriffe in gewissem Sinne als ein Zeichen für den Fortschritt einer Wissenschaft angesehen werden. Weiterhin ist ein möglichst hohes Skalenniveau häufig eine Voraussetzung für den Einsatz von stochastischen Verfahren hoher Effizienz. Für die Sozialwissenschaften und auch für die Anthroposemiotik ist kennzeichnend, daß vor allem nichtmetrische Skalen benutzt werden (vgl. Art. 25 und Art. 27). 4.1.3. Das Bedeutsamkeitsproblem Dieses Problem betrifft die Zulässigkeit bestimmter Statistiken (mathematischer Operationen) auf den einzelnen Skalen und die Bedeutsamkeit der aus den Statistiken abgeleiteten empirischen Aussagen. So ist z. B. die Berechnung eines arithmetischen Durchschnitts auf einer Nominalskala oder auch auf einer Ordinalskala unzulässig, da die Berechnung nicht zu einer empirisch bedeutsamen (empirisch sinnvollen) Aussage führt. In der Forschungspraxis lassen sich zahlreiche Beispiele für die Nichtbeachtung des Bedeutsamkeitsproblems finden. 4.2. Die Signalentdeckungstheorie Ein im Hinblick auf die Semiotik besonders interessantes Skalierungsmodell ist die sogenannte „Signalentdeckungstheorie“ ⫺ im weiteren als „SDT“ („signal detection theory“) abgekürzt. Die SDT ist Anfang der 50er Jahre aus der Anwendung der mathematischen Entscheidungstheorie auf die Problematik der Identifikation von Radarsignalen durch menschliche Beobachter entstanden. Die SDT erlaubt die Definition unterschiedlicher Typen von idealen Empfängern (Beobachtern, Hörern usw.) und die Analyse beobachteten Verhaltens im Hinblick auf das jeweils definierte Ideal. Die SDT wird in zunehmendem Maße auf unterschiedlichste Fragestellungen angewendet: zur Messung von Sinnesleistungen, bei Gedächtnisuntersuchungen, in der medizinischen Diagnostik, bei Schmerzmessungen, in der Zweitsprachenerwerbsforschung usw. (vgl. Velden 1982; Gigerenzer und Murray 1987). Die folgende
IV. Methoden der Semiotik
Darstellung verzichtet auf eine tiefergehende Behandlung der recht anspruchsvollen mathematischen und entscheidungstheoretischen Aspekte der SDT; Hinweise hierzu finden sich z. B. in den relativ gut lesbaren Einführungen von McNicol (1972) und Velden (1982). Die SDT weist enge Analogien auf zu dem Modell des statistischen Hypothesenprüfens im Sinne von Neyman und Pearson (vgl. § 5.) sowie zu Thurstones psychophysischen Skalierungsmodellen (vgl. z. B. Thurstone 1927). Allen Anwendungen der SDT ist folgendes Problem gemeinsam: Urteile, die von menschlichen Empfängern bei der Entdekkung oder auch Unterscheidung von Signalen verlangt werden, werden von Faktoren beeinflußt, die mit dem eigentlichen Leistungsaspekt, d. h. mit der Fähigkeit, zu entdecken oder zu diskriminieren, nichts zu tun haben. Wird eine Versuchsperson (Vp) z. B. dazu aufgefordert, bei mehrfacher Präsentation von sehr schwachen (akustischen oder visuellen) Signalen jeweils mit „ja“ zu antworten, wenn sie meint, ein Signal wahrgenommen zu haben, und mit „nein“, wenn sie meint, kein Signal bzw. nur ein Rauschen (noise) wahrgenommen zu haben, dann ist die Entscheidung zum einen von der sensorischen Leistungsfähigkeit abhängig, zum anderen jedoch auch von der sogenannten „Reaktionsneigung“ (Urteilsneigung) ⫺ z. B. von der Risikobereitschaft, fälschlich mit „ja“ zu antworten (vgl. Velden 1982, 10). Ein hoher Anteil falscher „Ja“-Antworten kann deshalb sowohl bedeuten, daß die Vp schlecht zwischen Signal und Rauschen unterscheiden kann, als auch, daß sie in starkem Maße generell zu „Ja“-Antworten neigt (oder beides). Für eine sinnvolle Dateninterpretation ist es deshalb unbedingt nötig, zwischen dem Leistungsaspekt und dem Reaktionsneigungsaspekt zu trennen und beide Aspekte separat zu messen. Das psychophysische Modell der SDT beruht auf der Annahme eines internen (sensorischen) Kontinuums X ⫺ auch als „Evidenzvariable“ oder „Entscheidungsvariable“ bezeichnet (vgl. Velden 1982, 12 ff sowie Sydow und Petzold 1982, 194 ff). Je nach Fragestellung kann die Variable X z. B. als subjektive Lautheit oder auch als subjektive Bekanntheit (z. B. bei Wortwiedererkennungsaufgaben) interpretiert werden. Meist wird angenommen, daß X einer Normalverteilung gehorcht, deren Mittelwert vom Reiz abhängt. Es können nun zwei sich überlappende
609
29. Daten und Hypothesen in der Semiotik
Normalverteilungen spezifiziert werden: die Wahrscheinlichkeitsdichte von X bei Darbietung eines Reizes s1 (z. B. Rauschen), d. h. f(x|s1), und die Wahrscheinlichkeitsdichte von X bei Darbietung eines Reizes s2 (z. B. Signal ⫹ Rauschen), d. h. f(x|s2). Je weniger sich s1 und s2 physikalisch unterscheiden und je geringer die Fähigkeit der Vp zur Unterscheidung ist, desto mehr überlappen sich die beiden Verteilungen. Wir können nun weiter annehmen, daß die Entscheidung der Vp, ob ein bestimmter interner Empfindungswert x eine Folge der Darbietung von s1 oder s2 ist, davon abhängt, welchen Wert die sogenannte „likelihood ratio“ l(x)⫽f(x|s2)/f(x|s1) annimmt. So könnte die Vp sich z. B. immer für s2 entscheiden, wenn l(x)⬎1, und für s1, wenn l(x)ⱕl. Dieser Sachverhalt ist in Abb. 29.2 il-
Abb. 29.2: Normalverteilungsmodell der Signalentdeckungstheorie (SDT).
lustriert, wobei xc den zu l(x)⫽1 gehörenden kritischen Empfindungswert bezeichnet, d. h. den Wert von x, der überschritten werden muß, damit sich die Vp für s2 entscheidet. Auf der Basis der likelihood ratio kann nun folgender, traditionell mit „b“ bezeichneter Index für die Reaktionsneigung einer Vp definiert werden: b ⫽ f(xc|s2)/f(xc|s1). Sind wie in Abb. 29.2 die Streuungen der beiden Verteilungen gleich, so bedeuten b-Werte größer als 1, daß xc rechts vom Schnittpunkt der beiden Dichtefunktionen liegt und daß die Vp dazu neigt, sich eher für s1 zu entscheiden. Entsprechend neigt die Vp im Fall von b⬍1 zu einer Entscheidung zugunsten von s2. Ist b⫽1, ist die Reaktionsneigung „neutral“. Beispiele dafür, wie Werte für b und für das Ausmaß der Überlappung der beiden Verteilungen und damit für die (sensorische) Leistungsfähigkeit eines informationsverarbeitenden Empfängers aus unterschiedlichen experimentellen Daten geschätzt werden können, finden sich in McNicol (1972) und Velden (1982). Für eine Verallgemeinerung der
SDT auf den multivariaten Fall mit Hilfe multivariater Normalverteilungen mit beliebigen Kovarianzmatrizen vgl. Kadlec und Townsend (1992).
5.
Datenerhebung und Datenanalyse
Es sollen im folgenden mit Bunge (1967 Bd. II, 177 ff) unter „Daten“ die unter Einhaltung erfahrungswissenschaftlicher Regeln gewonnenen und sprachlich als singuläre Aussagen (oder auch Existenzaussagen) über Merkmale eines Beobachtungsgegenstandes formulierten Resultate eines Beobachtungsaktes verstanden werden (vgl. auch Schulz, Muthig und Koeppler 1981, 41 ff). Ein Beispiel für ein semiotisches Datum in Form eines dreigliedrigen Protokollsatzes findet sich in § 4. Allgemeine Hinweise dazu, wie Beobachtungen in Daten mit bestimmten strukturellen Eigenschaften (z. B. Nähe- oder Ähnlichkeitsrelationen zwischen Zeichen) zu transformieren sind, gibt die Datentheorie, die im engen Zusammenhang zur Meßtheorie steht (vgl. Roskam 1983). Detailliertere Hinweise finden sich in den Beschreibungen spezifischer Untersuchungsdesigns und Datenerhebungsmethoden (z. B. Befragung oder Experiment). Beobachtungen und damit auch Daten als spezifische Beobachtungssätze haben eine zumindest zweifache Funktion: Zum einen dienen sie der Überprüfung von Hypothesen (Theorien); zum anderen können sie jedoch auch Anlaß zur Aufstellung von Hypothesen sein. Welche Funktion die Daten haben, hängt dabei primär vom Stand der Forschung und nur sehr bedingt von der Art der Daten ab. Da jede Beobachtung ein selektiver und interpretativer Prozeß ist, in dem konzeptuelles Wissen und Objekteigenschaften interagieren, gibt es keine „unmittelbar gegebenen“ Daten. Datenerhebung und Datenanalyse sind vielmehr stets von expliziten und/oder impliziten Hypothesen und Theorien geleitet. In der Regel haben theoretisch fruchtbare Hypothesen keinen direkt beobachtbaren Referenten. Die Überprüfung einer solchen Hypothese erfordert die Ableitung von unmittelbar testbaren Aussagen bis hin zu statistischen Null- und Alternativhypothesen. Hierfür ist eine längere Kette von Ableitungsschritten und Operationalisierungen unter Verwendung weiterer Hypothesen und aufgrund des Hintergrundwissens plausibel erscheinender Inferenzen nötig (vgl. Bunge
610 1967 Bd. II, 298 ff; Hager 1992, 32 ff). Stimmen Hypothese und Beobachtungsdaten (innerhalb bestimmter Fehlergrenzen) überein, gilt die Hypothese als durch die Daten gestützt. Anderenfalls gilt sie als entkräftet. Wichtig ist, daß in beiden Fällen die Entscheidung relativ zum verfügbaren Hintergrundwissen und den verwendeten Instrumenten erfolgt. Dies bedeutet u. a., daß wir Instrumententheorien benötigen, die eine Vorhersage erlauben über die Art des Einflusses der verwendeten Instrumente (z. B. unterschiedlicher Datenerhebungsverfahren) auf den Untersuchungsgegenstand (vgl. auch Westermann 1987 sowie die Diskussion der auf I. Lakatos zurückgehenden „Methodologie von Forschungsprogrammen“ bei Schnell, Hill und Esser 1992, 11 ff). Es gibt eine Reihe von typischen Untersuchungsanordnungen (auch „Forschungsformen“ oder „Untersuchungsdesigns“ genannt), die in der empirischen Forschung Verwendung finden. So wird u. a. zwischen folgenden Untersuchungsanordnungen unterschieden: Laborexperiment, Feldforschung, Einzelfallanalyse, Sekundäranalyse, Querschnitt- und Längsschnittmethoden (vgl. Roth 1993). Es ist allerdings darauf hinzuweisen, daß eine Reihe von Autoren z. B. Querschnitt- und Längsschnittmethoden nicht unter dem Stichwort „Untersuchungsanordnungen“, sondern unter dem Stichwort „Datenerhebungsverfahren“ behandeln. Untersuchungsanordnungen, die der Überprüfung von Hypothesen dienen, sollen im folgenden als „Experiment“ bezeichnet werden. Entsprechend diesem weiten Sprachgebrauch ist z. B. auch eine hypothesentestende Befragung ein Experiment (vgl. Schnell, Hill und Esser 1992, 224 ff). Nach dem Durchführungsort lassen sich weiterhin z. B. Laborund Feldexperimente unterscheiden. Daneben findet sich auch eine engere Verwendung des Begriffs ‘Experiment’. Danach ist das zentrale Unterscheidungsmerkmal des Experiments im Vergleich zu anderen empirischen Untersuchungsanordnungen vor allem im Kriterium der Manipulation zu sehen, d. h. in der willentlichen Herstellung und Veränderung bestimmter Untersuchungsbedingungen (vgl. jedoch Hager 1987, 71 ff; Stapf 1993, 230 ff). Dahinter steht die Überlegung, daß sich in Abhängigkeit von den jeweils hergestellten Bedingungen, d. h. in Abhängigkeit von den Werten der unabhängigen Variablen, bei Geltung der zu überprüfenden Hypothese auch bestimmte Sachverhalte, d. h. be-
IV. Methoden der Semiotik
stimmte Werte der abhängigen Variablen, ergeben sollten. Um allerdings das Ergebnis eines Experiments im Sinne einer (kausalen) Wirkung der unabhängigen Variablen auf die abhängigen Variablen und damit gleichzeitig auch als positive oder negative Evidenz in bezug auf die Untersuchungshypothese interpretieren zu können, bedarf es bestimmter Kontrolltechniken. So ist z. B. die Gruppe, die eine bestimmte Behandlung (treatment) erfährt, d. h. die sogenannte „Experimentalgruppe“, mit einer sogenannten „Kontrollgruppe“, d. h. mit einer Gruppe ohne entsprechende Behandlung, zu vergleichen. Weiterhin ist sicherzustellen, daß Experimentalund Kontrollgruppe in bezug auf die für das Experiment relevanten Variablen zumindest annähernd gleich sind. Um dies zu gewährleisten, kann z. B. eine Zufallszuweisung der Vpn zu beiden Gruppen vorgenommen werden (vgl. die weitergehende Diskussion in Schulz, Muthig und Koeppler 1981; Lüer 1987; Sarris 1990⫺92; Hager 1992). Das streng kontrollierte Laborexperiment gilt vor allem bei vielen Psychologen als Königsweg empirischer Forschung. Es hat gegenüber anderen Untersuchungsanordnungen den entscheidenden Vorteil, daß bei sorgfältiger Planung und Durchführung eine relativ eindeutige Interpretation der Ergebnisse hinsichtlich der unmittelbar geprüften Hypothese möglich ist. Allerdings wird dieser Vorteil meist durch eine relativ starke Künstlichkeit der Untersuchungssituation erkauft (zur Kritik des Experiments vgl. z. B. Groeben 1986, 241 ff; Dörner und Lantermann 1990). In der Semiotik hat das Experiment u. a. bei der Analyse verbaler und nonverbaler Verhaltensweisen (vgl. van Koolwijk und WiekenMayser 1974, Bd. 3; Scherer und Wallbott 1985; Jefferey und Patterson 1987) oder bei der Untersuchung des Zusammenhangs von Wahrnehmung, Vorstellung und Begriff Verwendung gefunden (vgl. Engelkamp 1981 sowie auch Watt 1984), wobei allerdings keine spezifisch semiotische Ausrichtung der experimentellen Methodologie erkennbar ist. Im Rahmen der verschiedenen Untersuchungsanordnungen können die Daten auf unterschiedlichste Weise erhoben werden. Entsprechend vielfältig sind auch die in der Literatur zu findenden Klassifikationsversuche von Erhebungsverfahren. So unterscheidet z. B. Bortz (1984, Kap. 2) folgende Hauptformen der empirischen Datenerhebung: Zählen, Urteilen, Testen, Befragen, Beobachten und physiologische Messungen
29. Daten und Hypothesen in der Semiotik
(z. B. der hirnelektrischen Aktivität). Die meisten empirischen Untersuchungen erfordern nach Bortz eine Kombination dieser Erhebungsarten ⫺ so z. B. von Beobachten und Zählen. Im Gegensatz zu Bortz (1984) sind nach Schnell, Hill und Esser (1992, 325) lediglich Befragung, Beobachtung und Inhaltsanalyse grundlegende Datenerhebungsmethoden der empirischen Sozialforschung. Die übrigen Erhebungsmethoden stellen nach Auffassung dieser Autoren nur eine bestimmte inhaltliche Anwendung der genannten drei Grundtypen bzw. einer besonderen Meßtechnik dar oder betreffen Fragen der Untersuchungsanordnung (vgl. auch Feger und Bredenkamp 1983, Bd. 2). In der empirischen Semiotik finden sich alle drei Grundtypen. So gibt es zahlreiche Beobachtungen verbaler und nonverbaler Kommunikation (vgl. van Koolwijk und Wieken-Mayser 1974, Bd. 3; Switalla 1979; Winkler 1980; UmikerSebeok 1985; Scherer und Wallbott 1985; Manning 1987; Ventola 1987; Flynn 1991) und auch zahlreiche inhaltsanalytische Arbeiten zur politischen Kommunikation oder zu den Massenmedien (vgl. z. B. Weber 1990; Mayring 1991). Verglichen mit der Befragung oder auch der teilnehmenden Beobachtung hat die Inhaltsanalyse den Vorteil, daß Sender und Empfänger durch die Datenerhebung nicht direkt betroffen sind und es somit nicht zu reaktiven Verzerrungen kommen kann. Allerdings wird der methodologische Vorteil der Nicht-Reaktivität u. a. dadurch erkauft, daß ohne eine zusätzliche Beobachtung oder Befragung von Sender und Empfänger der inhaltsanalytische Rückschluß von Eigenschaften der Nachricht auf Merkmale des Senders oder des Empfängers (z. B. auf Intentionen oder Wirkungen und damit auf die Symptom- und Signalfunktion von Zeichen) letztendlich spekulativ bleiben muß. Beobachtungen können Fremdbeobachtungen oder Selbstbeobachtungen sein. Selbstbeobachtung, die auf mentale Prozesse oder Zustände gerichtet ist, wird häufig auch als „Introspektion“ (im weitesten Sinne) bezeichnet. Als Folge der behavioristischen Ausrichtung der (amerikanischen) Psychologie galt die Introspektion lange Zeit als wissenschaftlich suspekt. Im Zuge der kognitiven Wende wird die Introspektion jedoch in jüngerer Zeit wieder im verstärkten Maße verwendet. Dabei wird allerdings versucht, die Introspektion z. B. in Form der sogenannten „Protokollanalyse“ auf eine gesi-
611 cherte methodologische Basis zu stellen (vgl. Ericsson und Simon 1984; Grotjahn 1987, 1991; Howe 1991; Mißler 1993, 78 ff). Wie das Beispiel der Kognitionspsychologie zeigt, dürfte es auch für die Semiotik, sofern diese auf ein tieferes Verständnis der im Zeichenbenutzer z. B. bei der Zeicheninterpretation ablaufenden mentalen Prozesse und damit auf eine tiefere Einsicht in den grundlegenden Vorgang der Semiose abzielt (vgl. Nasher 1990 sowie Art. 4), von Vorteil sein, verstärkt introspektive Daten zu erheben. Auf die Möglichkeit der Erweiterung unserer Perspektive des semiotischen Forschungsgegenstandes durch Einbeziehung introspektiver Daten hat übrigens auch Charles Morris hingewiesen ⫺ trotz seines am Behaviorismus ausgerichteten Wissenschaftsverständnisses (vgl. Posner 1979, 70). Ein weiterer Gesichtspunkt bei der Klassifizierung von Datenerhebungsverfahren bezieht sich auf die Art der Auswahl der Untersuchungseinheiten. Hat man festgelegt, auf welche Grundgesamtheit ⫺ auch „Population“ genannt ⫺ von Einheiten (z. B. Zeichenbenutzern, Texten) eine Untersuchung abzielt, ist zu entscheiden, ob eine Vollerhebung erfolgen soll oder eine Stichprobe, d. h. eine Teilmenge der Grundgesamtheit, entnommen werden soll. Entscheidet man sich ⫺ wie meist üblich ⫺ für eine Stichprobe, dann ist festzulegen, ob man z. B. eine willkürliche Auswahl oder eine zufallsgesteuerte Auswahl (z. B. anhand einer Zufallszahlentabelle) vornimmt. Bei einer zufallsgesteuerten Auswahl haben alle Elemente der Grundgesamtheit die gleiche oder eine vorher angebbare Chance, in die Stichprobe zu gelangen. Eine entsprechende Stichprobe gilt dann als (im stichprobentechnischen Sinne) repräsentativ (zu den unterschiedlichen Stichprobenverfahren sowie zum Begriff der Repräsentativität vgl. z. B. Kromrey 1991, Kap. 6; Frankfort-Nachmias und Nachmias 1992, Kap. 8; Schnell, Hill und Esser 1992, Kap. 6). Im Gegensatz zu einer willkürlichen Auswahl erlaubt eine zufallsgesteuerte Auswahl den Einsatz statistischer Auswertungsverfahren und damit sowohl die Abschätzung des Fehlers beim Schluß von Stichprobenkennwerten auf die entsprechenden Kennwerte der Grundgesamtheit, d. h. von Statistiken (wie z. B. vom arithmetischen Mittel) auf sogenannte „Parameter“, als auch die Abschätzung des Risikos einer Fehlentscheidung bei der Annahme oder Ablehnung einer statistischen Hypothese. Für die (semiotische) For-
612 schungspraxis ist kennzeichnend, daß die Stichprobenproblematik nur selten thematisiert wird und daß viele statistische Verfahren auch dann verwendet werden, wenn ihr Einsatz ⫺ wie z. B. bei willkürlicher Auswahl ⫺ streng genommen unzulässig ist. Die Statistik als zentrale Methode der Datenanalyse wird u. a. verwendet zur Beschreibung von Stichproben, zur Schätzung unbekannter Größen und zur wahrscheinlichkeitstheoretischen Absicherung von Hypothesen (vgl. z. B. Bredenkamp und Feger 1983; Pedhazur und Pedhazur Schmelkin 1991; Sachs 1992; Bortz 1993). Die Beschreibung und Informationskompression von Stichprobendaten in Form von Statistiken (z. B. in Form des arithmetischen Mittels als Maß für die zentrale Tendenz einer Eigenschaft oder der Varianz als Maß für die Streuung der Meßwerte um das arithmetische Mittel und damit für die Homogenität der Stichprobe in bezug auf die gemessene Eigenschaft) ist Aufgabe der deskriptiven Statistik. Weiterhin wird die deskriptive Statistik dazu benutzt, den Zusammenhang zwischen zwei oder mehr Stichprobenvariablen mit Hilfe von Korrelationskoeffizienten zu erfassen. Ein komplexeres Verfahren der Informationsreduktion ist die Faktorenanalyse. Diese zielt darauf ab, den Zusammenhang zwischen einer größeren Zahl von Variablen durch eine kleinere Zahl von unabhängigen oder seltener abhängigen Faktoren zu repräsentieren (technisch: die Dimensionalität des Datensatzes zu reduzieren) und damit den Zusammenhang zwischen den Variablen überschaubarer zu machen (für eine Anwendung in der Semiotik siehe Krampen et al. 1983). Die induktive Statistik ⫺ auch „Inferenzstatistik“ genannt ⫺ befaßt sich zum einen mit den Schlußmöglichkeiten von Stichprobenstatistiken wie dem arithmetischen Mittel auf Populationskennwerte, d. h. auf sogenannte „Parameter“ oder ⫺ in anderen Worten ⫺ mit der Schätzung von Parametern durch Statistiken. Entscheidend ist, daß die induktive Statistik Aussagen zur Güte einer Schätzung erlaubt, z. B. in Form von Vertrauensintervallen (Konfidenzbereichen) für die Populationsparameter. Zum anderen wird die induktive Statistik zur Prüfung von Hypothesen eingesetzt. Dazu muß die zu prüfende Hypothese zuerst in eine geeignete statistische Hypothese übersetzt werden. Im Fall von drei Gruppen, die jeweils einer unterschiedlichen Behandlung (z. B Präsentation unterschiedlicher Zeichenklassen) ausgesetzt
IV. Methoden der Semiotik
werden, könnte man folgende komplementäre Hypothesen formulieren (m steht für den Populationsmittelwert und ÿ bezeichnet den logischen Negator): H0: m1 ⫽ m2 ⫽ m3; H1: ÿ(m1 ⫽ m2 ⫽ m3). H0 wird als „Nullhypothese“ bezeichnet, H1 als „Alternativhypothese“. H0 behauptet im vorliegenden Fall die Gleichheit der drei Mittelwerte und damit die Wirkungslosigkeit der Variablen „Behandlungsmethode“. H1 behauptet dagegen, daß zumindest ein Mittelwert von den übrigen abweicht und daß somit ein Behandlungseffekt vorliegt. In der Forschungspraxis wird nun meist folgendermaßen vorgegangen: Mit Hilfe des inferenzstatistischen Modells der Varianzanalyse wird berechnet, wie wahrscheinlich die erhaltenen Daten bei Geltung von H0 sind. Ist die Wahrscheinlichkeit kleiner als eine vorher festgelegte Irrtumswahrscheinlichkeit a ⫺ auch „Signifikanzniveau“ genannt ⫺, wird die Nullhypothese verworfen und die Alternativhypothese angenommen. Ist die Wahrscheinlichkeit größer oder gleich a, dann wird umgekehrt entschieden. Meist wird a per Konvention mit 0,05 oder 0,01 angesetzt. Dadurch, daß a sehr klein gewählt wird, zielt die beschriebene Strategie in erster Linie darauf ab, folgenden Fehler zu vermeiden: H0 zu verwerfen (und damit H1 anzunehmen), obwohl H0 in Wirklichkeit richtig ist, d. h. im vorliegenden Fall irrtümlich auf einen Behandlungseffekt zu schließen. Der beschriebene Fehler wird auch als Verwerfungsfehler, Fehler erster Art oder aFehler bezeichnet. Bei der Entscheidung über eine statistische Hypothese kann jedoch auch folgender Fehler gemacht werden: H0 wird angenommen, obwohl H0 in Wirklichkeit falsch ist. Dieser Fehler wird mit b bezeichnet und „Annahmefehler“ oder „Fehler zweiter Art“ genannt. Das Komplement zu b, d. h. 1⫺b, wird auch als Teststärke (power) bezeichnet. Die Teststärke ist ein Maß dafür, wie wahrscheinlich die erhobenen Daten bei Geltung von H1 sind. Bei vorgegebenem a läßt sich die Teststärke vergrößern und damit das Risiko einer Fehlentscheidung senken, indem man den Stichprobenumfang erhöht (vgl. die differenzierteren Ausführungen in Cohen 1988; Hager 1987; 1992; Macdonald 1993). Obwohl eine Vielzahl von Autoren darauf hingewiesen hat, daß es methodologisch adäquater ist, beide Fehlertypen zu berücksichtigen, wird in einem Großteil der inferenzstatistischen Forschungspraxis und auch in nicht wenigen (einführenden) Lehrbüchern der angewandten Statistik lediglich
613
29. Daten und Hypothesen in der Semiotik
der a-Fehler berücksichtigt und zudem häufig noch falsch interpretiert (vgl. die Kritik in Gigerenzer und Murray 1987, Kap. 1; Hager 1992, 115 ff; Gigerenzer 1993). Die gleichzeitige Berücksichtigung von a und b beim statistischen Hypothesenprüfen geht auf J. Neyman und E. S. Pearson zurück (vgl. z. B. Neyman und Pearson 1933). Allerdings lassen sich auch gegen das Neyman-PearsonVerfahren eine Reihe von Einwänden vorbringen (vgl. die umfassende Darstellung der inferenzstatistischen Hypothesenprüfung bei Stegmüller 1973; Rettler 1985; Hager 1992). Eine vieldiskutierte Alternative ist der sog. Bayes-Ansatz (vgl. z. B. Pollard 1986), der allerdings in der Forschungspraxis bisher nur selten verwendet wird. Wegen der Bedeutung der verwendeten statistischen Prüfverfahren für die Entscheidung über Annahme oder Ablehnung einer Hypothese und damit für den Theoriebildungsprozeß in der Wissenschaft sollten methodologische Probleme der statistischen Inferenz in Zukunft verstärkt auch in der semiotischen Forschungspraxis Beachtung finden. Statistische Methoden werden in den unterschiedlichsten Bereichen der Semiotik verwendet. Einen zentralen Stellenwert hat die Statistik in der Quantitativen Linguistik (vgl. z. B. Orlov et al. 1982; Köhler und Altmann 1983; Wildgen und Mottron 1987; Altmann und Grotjahn 1988; Piotrowski et al. 1990; Köhler und Rieger 1993). Hier haben statistische Verfahren nicht nur eine untergeordnete Werkzeugfunktion (z. B. bei der inferenzstatistischen Hypothesenprüfung), sondern werden darüber hinaus in zunehmendem Maße auch zur quantitativen Modellierung sprachlicher Erscheinungen eingesetzt und als integraler Bestandteil linguistischer Theoriebildung betrachtet. Für viele quantitativ-linguistische Untersuchungen ist charakteristisch, daß vom Sender/Empfänger einer Nachricht abstrahiert wird. Dies ist z. B. in der bekannten Symbolstatistik von Meyer-Eppler (1969, Kap. 4) der Fall, mit Hilfe derer Symbole und Symbolketten (z. B. Buchstabenketten) u. a. hinsichtlich Informationsgehalt oder Kontingenz charakterisiert werden können. Andere Arbeiten berücksichtigen dagegen explizit auch Merkmale des Senders und/oder Empfängers ⫺ so z. B. Altmann und Grotjahn (1988) sowie Grotjahn und Altmann (1993) bei der Ableitung stochastischer Modelle für die Verteilung der Wortlängen in Texten und für die anstrengungsbedingte Lautveränderung (vgl. § 3.).
6.
Gütekriterien empirischer Forschung
Die Beantwortung der Frage, nach welchen Gütekriterien semiotische Forschung zu beurteilen ist, hängt u. a. davon ab, welches methodologische Paradigma und ⫺ damit zusammenhängend ⫺ welcher Begriff von Empirie und Realität zugrunde gelegt wird (vgl. zum Folgenden auch Grotjahn 1987, 1991, 1993; zum Empiriebegriff und zu unterschiedlichen Realitätsauffassungen vgl. Ransdell 1982; Deely und Lenhart 1983; Shank 1984; Kriz 1985; Karger 1991; Nüse et al. 1991; Varela et al. 1991; Kvale 1992; Bruder 1993). Für das analytisch-nomologische Paradigma und die hieran orientierte empirische Forschung (z. B. die experimentelle Psychosemiotik) spielt das forschungsmethodologische Kriterium der Objektivität eine zentrale Rolle (vgl. die Diskussion der analytisch-nomologischen Gütekriterien in Groeben und Westmeyer 1975 ⫽ 1981; Bunge 1974⫺85; Pähler 1986; Schnell, Hill und Esser 1992, Kap. 4). Wie u. a. von Peirce und Popper betont worden ist (vgl. Ransdell 1979; Scheffler 1984), ist Objektivität in diesem Kontext vor allem als Intersubjektivität der Methode, d. h. als prinzipielle Nachvollziehbarkeit von Forschung durch die am Forschungsprozeß Beteiligten, zu verstehen. In direktem Zusammenhang hiermit steht das Kriterium der Reproduzierbarkeit von Forschungsergebnissen. Eng verwandt mit den genannten Kriterien sind die meßtheoretischen Kriterien der Reliabilität (Zuverlässigkeit) und Validität (Gültigkeit), die auch als allgemeine forschungsmethodologische Gütekriterien verwendet werden. Validität gilt als Maß dafür, inwieweit Messungen oder auch Forschungsergebnisse den untersuchten Realitätsausschnitt abbilden. Notwendige, jedoch nicht hinreichende Voraussetzung für eine hohe Validität als zentrale Forderung empirischer Forschung ist eine hohe Reliabilität der Datenerhebung und Messung. Ein weiteres Kriterium ist die Repräsentativität/Generalisierbarkeit der Resultate. Hiermit verbunden ist auch die Forderung nach Quantifizierung und nach Verwendung stochastischer Methoden. Standardisierung der Untersuchungsmethode und Variablenkontrolle gilt als eine notwendige Voraussetzung für die Reproduzierbarkeit von Forschungsergebnissen. Dies bedeutet u. a., daß die soziale Interaktion zwischen Forscher und Erforschtem als potentielle
614 Störquelle (z. B. im Hinblick auf Validität und Reproduzierbarkeit) möglichst weitgehend zu eliminieren ist. Die Anwendung der genannten Kriterien in der Forschungspraxis hat u. a. zur Folge, daß bei den meisten Psychologen das Hypothesentesten mit Hilfe von möglichst weitgehend standardisierten und kontrollierten Experimenten als Königsweg empirischer Forschung gilt und andere Forschungsansätze lediglich als Defizitärformen experimentellen Vorgehens angesehen werden (vgl. die massive Kritik an der traditionellen psychologischen Methodologie z. B. in Kvale 1992 und Bruder 1993). Für die am explorativ-interpretativen Paradigma orientierte Forschung ist die Validität das zentrale Gütekriterium, obwohl Objektivität und Reliabilität für viele Forscher auch weiterhin wichtige Standards bleiben. Die genannten Kriterien erfahren allerdings eine partielle Uminterpretation (vgl. z. B. Kirk und Miller 1986 und Grotjahn 1987, 1993). So gilt meist nicht mehr das meßtheoretische Kriterium der Reliabilität und die Forderung nach Standardisierung, sondern vielmehr die Beachtung der Kriterien der Offenheit und Kommunikation als notwendige Bedingung zur Erreichung einer zufriedenstellenden Validität. Als Konsequenz ist bei der Datenerhebung auf eine vorgängige, feste Hypothesenbildung soweit wie möglich zu verzichten und die Untersuchungssituation so zu gestalten, daß eine möglichst herrschaftsfreie Kommunikation zwischen Forscher und Erforschten ermöglicht wird. Entsprechend gewinnen auch offene und wenig strukturierte Untersuchungsanordnungen, wie z. B. narratives Interview oder teilnehmende Beobachtung, an Bedeutung (vgl. z. B. Flick et al. 1991). Weiterhin ist bei der Frage der Gütekriterien auch das allgemeine Erkenntnisinteresse semiotischer Forschung zu berücksichtigen. So dürften z. B. Vertreter einer (strikt) behavioristisch orientierten Semiotik eine andere Antwort auf die Frage nach den Gütekriterien geben als Vertreter einer eher kritisch orientierten Semiotik (vgl. Ransdell 1979; Eschbach 1981). Letztendlich hängt die Entscheidung über Gütekriterien semiotischer Forschung auch vom jeweiligen Forschungsgegenstand ab. So ist das Kriterium der Offenheit wohl kaum auf endosemiotische Fragestellungen wie z. B. die genetische Informationsübertragung anwendbar. In Anbetracht der Disparität der aus semiotischer Perspektive betrachtbaren Gegenstände (vgl. z. B.
IV. Methoden der Semiotik
Koch 1990; Nöth 1990) sowie der unterschiedlichen Erkenntnisinteressen semiotischer Forschung dürfte es deshalb auch kaum möglich sein, eine allgemeine Antwort auf die Frage nach den Gütekriterien semiotischer Forschung zu geben ⫺ es sei denn, man vertritt das Konzept einer methodologisch definierten Einheitswissenschaft (vgl. hierzu auch Merrell 1987).
7.
Literatur (in Auswahl)
Altmann, Gabriel und Rüdiger Grotjahn (1988), „Linguistische Meßverfahren“. In: Ulrich Ammon, Norbert Dittmar und Klaus J. Mattheier (eds.), Sociolinguistics. An International Handbook of the Science of Language and Society. Vol. 2. Berlin: 1026⫺1039. Borbe´, Tasso (ed.) (1983), Semiotics Unfolding. 3. vols. Berlin, New York und Amsterdam. Bortz, Jürgen (1984), Lehrbuch der empirischen Forschung. Berlin. Bortz, Jürgen (1993), Statistik für Sozialwissenschaftler. 4., vollst. überarb. Aufl. Berlin. Bredenkamp, Jürgen und Hubert Feger (eds.) (1983), Enzyklopädie der Psychologie: Forschungsmethoden der Psychologie. Bd. 4: Strukturierung und Reduzierung von Daten. Bd. 5: Hypothesenprüfung. Göttingen. Bruder, Klaus-Jürgen (1993), Subjektivität und Postmoderne. Frankfurt a. M. Bunge, Mario (1967), Scientific Research. 2 vols. Berlin. Bunge, Mario (1974⫺85), Treatise on Basic Philosophy. 7 vols. Dordrecht. Cohen, Jacob (1988), Statistical Power Analysis for the Social Sciences. 2nd. ed. New York. Deely, John N. und Margot D. Lenhart (1983), „Fourth Annual Symposium on Empirical Semiotics“. In: John N. Deely und Margot D. Lenhart (eds.), Semiotics 1981. New York: 317⫺343. Dörner, Dietrich und Ernst D. Lantermann (1990), „Experiment und Empirie in der Psychologie“. In: Klaus Grawe et al. (eds.), Über die richtige Art, Psychologie zu betreiben. Göttingen: 37⫺57. Engelkamp, Johannes (1981), „Experimentelle Psychosemiotik: Wahrnehmung ⫺ Vorstellung ⫺ Begriff“. Zeitschrift für Semiotik 3: 289⫺293. Ericsson, K. Anders und Herbert A. Simon (1984), Protocol Analysis. Cambridge MA. Eschbach, Achim (1981), „Charles W. Morris und das Programm der behavioristischen Semiotik“. In: Achim Eschbach (ed.), Zeichen über Zeichen über Zeichen. Tübingen: 83⫺108.
29. Daten und Hypothesen in der Semiotik Feger, Hubert und Jürgen Bredenkamp (eds.) (1983), Enzyklopädie der Psychologie: Forschungsmethoden der Psychologie. Bd. 2: Datenerhebung. Bd. 3: Messen und Testen. Göttingen. Flick, Uwe et al. (1991), Handbuch qualitative Sozialforschung. München. Flynn, Pierce J. (1991), The Ethnomethodological Movement. Sociosemiotic Interpretations. Berlin. Frankfort-Nachmias, Chava und David Nachmias (1992), Research Methods in the Social Sciences. 4., überarb. Aufl. London. Gigerenzer, Gerd (1981), Messung und Modellbildung in der Psychologie. München. Gigerenzer, Gerd (1993), „Über den mechanischen Umgang mit statistischen Methoden“. In Roth 1993: 607⫺618. Gigerenzer, Gerd und David J. Murray (1987), Cognition as Intuitive Statistics. Hillsdale NJ. Groeben, Norbert (1986), Handeln, Tun, Verhalten als Einheiten einer verstehend-erklärenden Psychologie. Tübingen. Groeben, Norbert und Hans Westmeyer (1975), Kriterien psychologischer Forschung. München. 2. Aufl. 1981. Grotjahn, Rüdiger (1987), „On the Methodological Basis of Introspective Methods“. In: Claus Færch und Gabriele Kasper (eds.), Introspection in Second Language Research. Clevedon, England: 54⫺81. Grotjahn, Rüdiger (1991), „The Research Programme Subjective Theories: A New Approach in Second Language Research“. Studies in Second Language Acquisition 13: 187⫺214. Grotjahn, Rüdiger (1993), „Qualitative vs. quantitative Fremdsprachenforschung: Eine klärungsbedürftige und unfruchtbare Dichotomie“. In: Johannes-Peter Timm und Helmut J. Vollmer (eds.), Kontroversen in der Fremdsprachenforschung. Bochum: 223⫺248. Grotjahn, Rüdiger und Gabriel Altmann (1993), „Modelling the Distribution of Word Length: Some Methodological Problems.“ In Köhler und Rieger 1993: 141⫺153. Hager, Willi (1987), „Grundlagen einer Versuchsplanung zur Prüfung empirischer Hypothesen in der Psychologie“. In Lüer 1987: 43⫺253. Hager, Willi (1992), Jenseits von Experiment und Quasi-Experiment. Göttingen. Hammerl, Rolf (1991), Untersuchungen zur Struktur der Lexik. Trier. Heidenreich, Klaus (1993 a), „Entwicklung von Skalen“. In Roth 1993: 407⫺439. Heidenreich, Klaus (1993 b), „Grundbegriffe der Meß- und Testtheorie“. In Roth 1993: 342⫺374. Herrmann, Theodor (1993), „Methoden als Problemlösungsmittel.“ In Roth 1993: 20⫺48. Howe, Reed B. K. (1991), „Introspection: A Reassessment“. New Ideas in Psychology 9: 25⫺44.
615 Jefferey, Gary H. und Donna L. Patterson (1987), „Field Dependence and Sensitivity to Facial Affect Cues“. Semiotica 64: 335⫺341. Kadlec, Helena und James T. Townsend (1992), „Signal Detection Analyses of Dimensional Interactions“. In: F. Gregory Ashby (ed.), Multidimensional Models of Perception and Cognition. Hillsdale NJ: 181⫺227. Karger, Angelika (1991), „Semiotik ⫺ Vermittlung zwischen Evolutionärer Erkenntnistheorie und Radikalem Konstruktivismus“. Semiosis 61/62: 61⫺74. Kirk, Jerome und Marc L. Miller (1986), Reliability and Validity in Qualitative Research. London. Knorr-Cetina, Karin (1991), Die Fabrikation von Erkenntnis: Zur Anthropologie der Naturwissenschaft. Frankfurt a. M. Koch, Walter A. (ed.) (1990), Semiotik in den Einzelwissenschaften. Bochum. Köhler, Reinhard und Gabriel Altmann (1983), „Systemtheorie und Semiotik“. Zeitschrift für Semiotik 5: 424⫺431. Köhler, Reinhard und Burghard B. Rieger (eds.) (1993), Contributions to Quantitative Linguistics. Dordrecht. Koolwijk, Jürgen van und Maria Wieken-Mayser (eds.) (1974⫺86), Techniken der empirischen Sozialforschung. Bd. 2⫺8. München. Krampen, Martin et al. (1983), „Weitere Untersuchungen zur Mehrdimensionalität visueller Zeichen“. In Borbe´ 1983: 1471⫺1482. Kriz, Jürgen (1985), „Wie empirisch ist die Empirie?“ Siegener Periodicum zur Internationalen Empirischen Literaturwissenschaft 4: 1⫺40. Kromrey, Helmut (1991), Empirische Sozialforschung. 5. erw. Aufl. Opladen. Kvale, Steinar (ed.) (1992), Psychology and Postmodernism. London. Lüer, Gerd (ed.) (1987), Allgemeine Experimentelle Psychologie. Stuttgart. Macdonald, Ronald R. (1993). „Qualitative Generalizations from Quantitative Analyses“. British Journal of Mathematical and Statistical Psychology 46: 49⫺61. Manning, Peter (1987), Semiotics and Fieldwork. Newbury Park. Mayring, Philipp (1991), „Qualitative Inhaltsanalyse“. In Flick et al. 1991: 209⫺213. McNicol, Donald (1972), A Primer of Signal Detection Theory. London. Merrell, Floyd (1987), „Of Position Papers, Paradigms, and Paradoxes“. Semiotica 65: 191⫺223. Meyer-Eppler, Werner (1969), Grundlagen und Anwendungen der Informationstheorie. Berlin.
616 Mißler, Bettina (1993), Datenerhebung und Datenanalyse in der Psycholinguistik. Bochum. Nasher, Dan (1990), „Understanding Sign Semiosis as Cognition and as Self-Conscious Process: A Reconstruction of Some Basic Conceptions in Peirce’s Semiotics“. Semiotica 79: 1⫺49.
IV. Methoden der Semiotik Roth, Erwin (ed.) (1993), Sozialwissenschaftliche Methoden. Lehr- und Handbuch für Forschung und Praxis. 3., völlig überarb. und erweit. Auflage. München. Sachs, Lothar (1992), Angewandte Statistik. 7., neu bearb. Aufl. Berlin.
Neyman, Jerzy und Egon S. Pearson (1933), „On the Problem of the Most Efficient Tests of Statistical Hypotheses“. Philosophical Transactions of the Royal Society of London, Series A, 231: 289⫺337.
Sarris, Viktor (1990⫺92), Methodologische Grundlagen der Experimentalpsychologie. 2 vols. München.
Nöth, Winfried (1990), Handbook of Semiotics. Bloomington IN.
Schäfer, Bernd (1983), „Semantische DifferentialTechnik“. In Feger und Bredenkamp 1983, Bd. 2: 154⫺221.
Nowakowska, Maria (1983), Quantitative Psychology. Amsterdam. Nüse, Ralf, Norbert Groeben, Burkhard Freitag und Margrit Schreier (1991), Über die Erfindungen des Radikalen Konstruktivismus. Weinheim. Opp, Karl-Dieter (1993), Wissenschaftstheoretische Grundlagen der empirischen Sozialforschung. In Roth 1993: 49⫺73. Orlov, Ju. K., M. G. Boroda und I. Sˇ. Nadarejsˇvili (1982), Sprache, Text, Kunst. Bochum.
Scheffler, Israel (1984), „Pragmatism as Philosophy“. In: Klaus Oehler (ed.), Zeichen und Realität. Bd. 1. Tübingen: 29⫺43. Scherer, Klaus R. und Harald G. Wallbott (1985), „Analysis of Nonverbal Behavior“. In: Teun A. van Dijk (ed.), Handbook of Discourse Analysis. Vol. 2. London: 199⫺230. Schnell, Rainer, Paul B. Hill und Elke Esser (1992), Methoden der empirischen Sozialforschung. 3., erw. Aufl. München.
Orth, Bernhard (1992), „Meßtheoretische Grundlagen der Diagnostik“. In: Reinhold Jäger und Franz Petermann (eds.), Psychologische Diagnostik. 2. veränd. Aufl. Weinheim: 286⫺295.
Schulz, Thomas, Klaus-Peter Muthig und Karlfritz Koeppler (1981), Theorie, Experiment und Versuchsplanung in der Psychologie. Stuttgart.
Pähler, Klaus (1986), Qualitätsmerkmale wissenschaftlicher Theorien. Tübingen.
Shank, Gary D. (ed.) (1984), Paradigms for Empirical Semiotics. Toronto Semiotic Circle Monograph 3.
Pedhazur, Elazar J. und Liora Pedhazur Schmelkin (1991), Measurement, Design, and Analysis. Hillsdale NJ.
Stapf, Kurt H. (1993), „Laboruntersuchungen“. In Roth 1993: 228⫺244,
Pelc, Jerzy (1983), „On the Concept of Formal Semiotics“. In Borbe´ 1983, Bd. 1: 269⫺276.
Stegmüller, Wolfgang (1973), Personelle und Statistische Wahrscheinlichkeit. Berlin.
Piotrowski, R., M. Lesohin und K. Lukjanenkov (1990), Introduction of Elements of Mathematics to Linguistics. Bochum.
Stephan, Ekkehard (1990), Zur logischen Struktur psychologischer Theorien. New York.
Pollard, William E. (1986), Bayesian Statistics for Evaluation Research. Beverly Hills.
Switalla, Bernd (1979), „Die Identifikation kommunikativer Daten als sprachtheoretisches Problem“. Zeitschrift für Semiotik 1: 161⫺175.
Posner, Roland (1979), „Charles Morris und die verhaltenstheoretische Grundlegung der Semiotik“. Zeitschrift für Semiotik 1: 49⫺79.
Sydow, Hubert und Peter Petzold (1982), Mathematische Psychologie. Berlin.
Ransdell, Joseph (1979), „Semiotic Objectivity“. Semiotica 26: 261⫺288. Ransdell, Joseph (1982), „On the Paradigm of Experience Appropriate for Semiotics“. In: Michael Herzfeld und Margot D. Lenhart (eds.), Semiotics 1980. New York: 427⫺437.
Thurstone, Louis L. (1927), „Psychophysical Analysis“. American Journal of Psychology 38: 368⫺389. Umiker-Sebeok, Jean (ed.) (1985), Marketing and Semiotics. Berlin.
Reichenbach, Hans (1938), Experience and Prediction. An Analysis of the Foundations and the Structure of Knowledge. Chicago. 7. Auflage 1970.
Varela, Francisco, Evan Thompson und Eleanor Rosch (1991), The Embodied Mind. Cognitive Science and Human Experience. Cambridge MA (deutsche Übersetzung Bern 1992).
Rettler, Hans J. (1985), Zur statistischen Prüfung psychologischer Hypothesen. Braunschweig.
Velden, Manfred (1982), Die Signalentdeckungstheorie in der Psychologie. Stuttgart.
Roskam, Edward E. (1983), „Allgemeine Datentheorie“. In Feger und Bredenkamp 1983, Bd. 3: 1⫺135.
Ventola, Eija (1987), The Structure of Social Interaction. A Systemic Approach to the Semiotics of Service Encounters. London.
617
30. Theory formation in semiotics Watt, William C. (1984), „As to Psychosemiotics“. In: Robin P. Fawcett et al. (eds.), The Semiotics of Culture and Language. Vol. 2. London: 3⫺28. Weber, Robert P. (1990), Basic Content Analysis. 2nd. ed. Beverly Hills. Westermann, Rainer (1987), „Wissenschaftstheoretische Grundlagen der experimentellen Psychologie.“ In Lüer 1987: 5⫺42.
Wildgen, Wolfgang und Laurent Mottron (1987), Dynamische Sprachtheorie. Bochum. Winkler, Peter (1980), „Methodik der Gesprächsanalyse: Einzelinterpretationen und Datenintegration“. Kodikas/Code 2: 171⫺185.
Rüdiger Grotjahn, Bochum (Deutschland)
30. Theory formation in semiotics 1. Theory 1.1. The notion of theory and related notions 1.2. Explanation and prediction 1.3. Scientific laws and causes 1.4. The popular versus the mathematical notion of theory 1.5. Theory structure 1.6. The language of a theory 1.7. Proof: axiomatization and formalization of a theory 1.8. Empirical procedures 1.9. Traditional versus structuralist concepts of theory 1.10. The cognitive role of a theory 2. Semiotics 2.1. The semiosic properties of the sign 2.2. The semiotic study of the sign 2.3. Methods of semiotic study 2.4. Applied semiotics 3. Semiotic theories 3.1. Syntactic versus pragmatic understanding of semiotic terms 3.2. Syntactic versus pragmatic notions of theory 3.3. The abstract sign model of an empirical theory 3.4. A theory characteristic of a discipline versus a theory occurring within that discipline 3.5. Methodological types of semiotic theories 3.6. Typical features of a semiotic theory 4. Selected references
How are theories in semiotics constructed? Before this question can be answered, it is first necessary to realize what theory and semiotics are. If it turns out that the word “theory” has different meanings and the word “semiotics” has different meanings, then we must specify what we mean by theory in semiotics understood in such and such a way. Our first task will thus be to analyze the meanings of the word “theory”; the second ⫺ to analyze the meanings of the word
“semiotics”; the third will be to decide whether every notion of theory fits every notion of semiotics, or whether some particular notion of theory is to be linked with one notion of semiotics, and another notion of theory with another notion of semiotics. Thus prepared, we may begin to examine whether the construction of theories in semiotics differs significantly from the analogous procedure in other branches of knowledge or whether it is similar to this procedure.
1.
Theory
1.1. The notion of theory and related notions It is convenient to discuss the meanings of the word “theory” in the context of analyses of concepts such as explanation, understanding, law of science, definition, hypothesis and model. Each of these words is polysemic and vague in each of its meanings, and is thus in need of comments. 1.2. Explanation and prediction 1.2.1. Explanation I make a distinction between explanation and explication: the former concerns events, states of affairs or phenomena; the latter pertains to expressions. Explanation answers the question “Why is it so (Why did this happen)?”, and explication provides answers to the query “What does a given expression mean?” Two kinds of statements occur in explanation: the explanandum, i. e., a sentence or sentences referring to the event or phenomenon being explained (e. g., the fact that water in this vessel froze); and the explanans, i. e., sentences which we use to explain the explanandum. The explanans consists of: (a) sentences indicating conditions contempora-
618 neous with the event being explained or this event’s antecedents, and (b) a statement or statements that are a formulation of a pertinent general law of science. The explanation consists in demonstrating that the explained event occurred under the described conditions in accordance with a suitable law or laws. Hence, in explaining we subsume the explained under a general law or laws; accordingly, this manner of explaining is described as the covering-law model. That which is explained may be either an individual concrete event, or a phenomenon, i. e., a certain property of an individual event or set of events, or a regularity whose linguistic formulation is a law. In order for this explanation to be adequate, the explanans must have empirical content, i. e., it must be a sentence or sentences which may be tested by observation or experiment, and this testing must demonstrate the truth of the explanans. ⫺ The covering-law model of explanation described here was presented by Carl G. Hempel and Paul Oppenheim (Hempel and Oppenheim 1948 ⫽ 1965). There are two versions of this model: (a) the deductive-nomological and (b) the inductive-probabilistic one. (a) Deductive-nomological explanation answers the question on why the explained event had to occur, and hence why it was to be expected; the explanandum is here a logical consequence of the explanans. On the other hand, (b) inductive-probabilistic explanation contains a probability hypothesis in the role of covering law and therefore explains why what happened was to be expected; in this case the explanandum is not a logical consequence of the explanans; the explanandum is merely made more probable by the premisses. 1.2.2. Prediction Both procedures (a) and (b) may serve prediction. In the case of (a), knowing the initial conditions and the general law or laws we can predict the occurrence of the event to which the explanandum refers. In the case of (b) on the other hand we are able to justify with a suitable degree of probability our expectations or predictions concerning that which is described in the explanandum (Wright 1971: 11⫺14). Explanation and prediction differ in that in the explanation, or retrodiction, we know that the event to which the explanandum refers actually occurred, and on this we base our conclusion that its antecedent necessary conditions occurred in the past; hence we also explain how the event
IV. Methoden der Semiotik
described in the explanandum became possible. In prediction, on the other hand, we begin by stating that the explained event’s sufficient conditions have occurred and we conclude with reasons why this event will have to take place. 1.3.
Scientific laws and causes
1.3.1. Scientific laws What is a scientific law? It is a statement satisfying the following necessary conditions: (a) it has the form of a universal sentence, i. e., universal generalization, Every A is B; often, but not always, it is a conditional sentence, If A then B; (b) its scope is unlimited. Accordingly, in a formulation of a law ⫺ e. g., in Galileo’s law of falling bodies ⫺ there are no names of particular objects, points in space or moments of time that cannot be eliminated; hence in laws there can be no proper names or other individual constants of any kind nor predicates defined solely through reference to temporal and spatial localizations. A distinction is made between a law and a lawlike sentence (Goodman 1947: 113⫺128): the former, in addition to satisfying the conditions (a) and (b) just mentioned (which are also imposed on every lawlike sentence), also satisfies a third one: namely it is a true sentence. Not all, however, regard every sentence satisfying the above three conditions as a law of science. Objections are being raised against, among other things, sentences asserting actual rather than necessary relationships consisting in a constant coexistence of features, e. g., All whales are mammals, Every whale is a mammal, If something is a whale, it is a mammal. But not every sentence asserting a necessary relationship ⫺ e. g., Every man is a man ⫺ is considered to be a law. Analytical general sentences, explicit definitions and tautologies are usually denied the character of law. Also, not all true universal conditionals are regarded as laws. If such a conditional owes its truthfulness to the vacuosity of a conditional sentence, i. e., when it is vacuously satisfied (as in the case of If something is a unicorn, it is a hoofed animal) then despite its unlimited generality it ceases to be regarded as a law. On the other hand, some general sentences containing designations of an individual object or time, e. g., All planets of the solar system circle the Sun along elliptic orbits, are considered to be laws. This led to the distinction between fundamental lawlike
30. Theory formation in semiotics
sentences and derived lawlike sentences, and only the former are required to be nonanalytic true universal generalizations, i. e., to be devoid of proper names, individual constants, and predicates defined through reference to space and time parameters; in other words, it is required that their scopes be nonlimited. As for the derived lawlike sentences, it is enough for them to be consequences of a set of fundamental lawlike sentences. The distinction between laws of science and statements which are not laws of science is based on the distinction between nomological and fact-contingent generality. According to the advocates of this distinction, nomological generality is to be of necessary character. There are several notions of necessity however. Logical necessity amounts to the fact that if it is not how it must be, there arises a contradiction. For example, it is logically necessary for a triangle to have three bisectors, and if it were to have either more or fewer bisectors, it would not be a triangle. Physical, or dynamic necessity is sometimes linked with the notion of effective resistance: an ordinary glass dropped to the pavement from the second floor will smash to pieces since glass will not effectively resist the impact. Real or practical necessity is defined with reference to the effects of a contrary state of affairs, e. g., He must undergo appendicitis surgery or otherwise he will die. Even less tangible is the notion of causal necessity, since in analyzing the notion of cause we usually refer to the phenomenon whereby an event classified as effect must necessarily follow the event classified as cause. One can thus hardly expect an explication of necessity through reference to the notion of cause. The previous notions of necessity too prove to be of little use in analyses of the nature of nomological necessity, i. e., necessity based on regularity. We define each kind of necessity with regard to certain regularities and these may be given the form of laws. Contradiction in the case of logical necessity arises out of the rules or laws of a given system; physical necessity out of the laws of physics; and practical necessity out of an assumed system of evaluations. Thus, in explaining the notion of law with the notion of necessity we run the risk of committing the error of circularity. These difficulties prompted some methodologists to distinguish several types of laws: (1) laws of events’ succession: (a) causal, (b) noncausal, namely genetic or developmental ones which merely indicate the kind
619 of events always following an event of a given type without asserting however that the latter is a sufficient condition of the former; (2) laws of events’ cooccurrence: (a) stating that certain features accompany one another always and without exceptions, or (b) statistical laws of this kind stating an unvarying relative frequency of cooccurrence of events; (3) functional laws: of which some (a) specify a numerical measure of variability of cooccurring quantities, and some (b), which are dynamic laws, state changes taking place in time. 1.3.2. Causes The most rigoristic methodologists regard as laws only the causal laws (1 a), but fail to adequately define this type of law in view of the vagueness of the word “cause” and the controversial nature of the problem of causation. The existing definitions usually underline that cause (A) and effect (B) are features of events, namely that a cause is a significant component of a sufficient condition of phenomenon (B), and therefore (A) usually precedes (B) within some spatial-temporal system in which (A) and (B) either constitute interlocking links or are connected by a chain of intermediate causes and effects. They also require the relationship between (A) and (B) to be asymmetric, meaning that if (A) is the cause of (B) then (B) is not the cause of (A). In addition, the causal relationship is to be constant: whenever (A) takes place, (B) is bound to occur as well. Less radical methodologists also regard sentences of the other categories as laws on the condition that they are statements of the natural sciences, refusing to accept as laws all statements about regularities in behavior and actions of man. Opponents of this position claim that the notion of causation should be defined precisely in terms of action (Wright 1971: 65 ff). Given the diversity of views concerning the definition of law of science, it seems advisable to make decisions about which statement is to be recognized as a law of a given discipline dependent on this statement’s structure, its function within the discipline in question, its logical relationships with other statements of this discipline, and its cognitive value as a research tool. 1.3.3. Experimental laws versus theoretical laws The notion, or rather the various notions, of law occupy an important place in considerations about theory. Firstly, a law is a premiss
620 in explanation, and explanation is among the tasks of theory: explanations of laws using theories are analogous to explanations of individual events or phenomena with the use of laws. Secondly, it is believed that laws make up theories by being their general statements, well justified and applicable in various domains of the theories, or initial hypotheses; in an empirical theory, laws define and describe its scope (Wo´jcicki 1979: 138). Thirdly, one kind of law is being identified with theory, namely theoretical laws, as distinct from experimental laws, which describe relationships between observable objects or features thereof and can be substantiated by means of controlled observation. The borderline between experimental, or empirical laws and theoretical laws, i. e., theory, is not precise, for, on the one hand, experimental laws need not concern relationships between so called pure sense data obtained solely through direct perception without inference, and, on the other, theoretical laws are not purely speculative in nature, and although they refer to nonobservable entities, the features of these entities may be discerned in experiments. Moreover, the formulations of experimental laws may feature terms taken from theories or other experimental laws. For instance the experimental law, The speed of sound propagation is higher in gases of lower density than in gases of higher density, features, among other things, the theoretical term “density” and is based on the law stating that the ratio of gas mass to volume is constant (Nagel 1961: V, 1). Without forgetting that the expressions “experimental law” and “theoretical law” are vague, we may nevertheless point to certain features distinguishing laws of both types or at least to differences in degree of the features belonging to each type. Firstly, the meaning of descriptive terms, i. e., the so called non-logical constants occurring in an experimental law, is determined by observation, laboratory tests, or experiment. Thus, to these terms there belongs the so called operational meaning of empirical character. By contrast, in a theoretical law the meaning of terms, or at least some terms, is defined implicitly (cf. Art. 2 § 2.), that is to say by including these terms in statements called “postulates” which cannot be tested directly through observation or experiment; alternatively, the meaning of these terms is constructed by analogy to the meaning of terms in another theory which is related to or con-
IV. Methoden der Semiotik
stitutes a basis of the given theoretical law. Accordingly, it cannot be directly tested by means of experiments, and it is impossible to resort to observation to indicate objects to which it refers. Also, unlike an experimental law, a theoretical law cannot be an inductive empirical generalization of observational data, nor can it be substantiated with such a generalization. Secondly, it is pointed out that experimental laws often retain their meaning and truth value despite the fact that the theoretical laws (i. e., theories) used to explain them undergo changes. All the new theories replacing the previous revised ones must remain consistent with an experimental law which was accepted as true. Thirdly, the formulation of an experimental law is in most cases a single sentence, whereas theories are usually systems of statements. Fourthly, because of the above, an experimental law serves to explain and predict a smaller number of facts ⫺ facts which are also more homogeneous ⫺ than those dealt with by a theory. Theory, being more abstract and having a wider scope, is suited, among other things, to demonstrate relationships between various experimental laws referring to diverse phenomena (Nagel 1961: V, 1 and Hesse 1967a: IV, 404 ff). 1.4.
The popular versus the mathematical notion of theory
1.4.1. The popular notion of theory As just stated, a theory is a set of statements. This is how it is viewed in the traditional, standard approach. According to another opinion, a theory is a set of set-theoretic structures. The differences between these two approaches, stressed particularly strongly by commentators and advocates of the latter, more recent one, are in fact smaller than these authors claim. Naturally, not every set of statements is a theory, but only a particular set of statements (such as the theory of relativity or the theory of evolution of living organisms), that is a set in which logical relationships occur between at least some of the constituent statements (most importantly relationships of entailment) and in which laws are entailed by these statements; hence a theory is not only a system of statements but also of methods with which these statements are obtained or verified. Moreover, these statements ought to
30. Theory formation in semiotics
concern some definite, usually abstract set of events or phenomena classified as belonging to this set according to a criterion relevant in the given discipline or branch thereof, thanks to which the material ties between these phenomena are reflected in the thematic coherence of the statements. These statements ought to concern events or phenomena that are important in the given research. The statements of the theory ought to include laws of the given science or lawlike sentences or, finally, so called empirical generalizations; a theory cannot consist of singular sentences alone. All these conditions are usually assigned to the popular notion of theory. 1.4.2. Theory as a formalized axiomatic system A distinction must be made between the popular notion of theory and theory as a deductive system. This, as in the previous case, is a set of statements of a certain language consisting of these statements themselves and all their logical consequences, i. e., all statements which may be proved on the basis of the original statements used as premisses, arguing in keeping with logical rules of the system in hand and using the logical tools available in this system. This is one of the meanings of the word “theory” adopted in mathematical logic, connected with an approach that takes mathematical theories as systems of statements referring to certain idealizations, to certain abstract systems referred to as “theory models”. Most logicians and methodologists believe that all theories, both mathematical and empirical, may be characterized alike with respect to semantics as formalized axiomatic systems (cf. Art. 3 § 4.). Procedures adopted in mathematical logic ⫺ analyses of formal structure of language, the operations of proving and defining ⫺ are thus employed in empirical disciplines. As is known, the formalization of a theory’s language consists in listing its primitive symbols and formation rules for the construction of expressions composed of simpler expressions. If the theory whose language is being formalized is elementary, then the primitive symbols of this language include: (a) individual variables, (b) logical constants, namely sentential connectives, quantifiers, the symbol of identity, and, possibly, some additional variable-binding operators such as, e. g., the description operator, (c) descriptive constants, i. e., predicate constants and possibly, function constants
621 (including individual constants as the limiting case of 0-ary function constants). These primitive symbols are used to construct wellformed formulae of languages, and among these are distinguished formulae lacking free variables, i. e., sentences of this language. Once the theory’s language is formalized, the syntactic characteristics of the notion of logical consequence can be tackled. To this end, a complete set of axioms ⫺ consistent and mutually non-derivable ⫺ is selected, and rules of inference are formulated according to which the system’s theorems may be derived from the system’s axioms, and then further theorems from them; these rules are thus rules of transformation of sentences (cf. Art. 2 § 4.10.). The notion of proof is defined, and this serves as a basis for defining the notion of logical consequence of a given set of assumptions as a sentential formula for which there exists a proof on the grounds of this set. The logical theorems of this language are tautologies, i. e., sentences entailed by the empty set of assumptions. Since empirical theories are undecidable, in the sense that it is impossible to decide whether a given sentence is a theorem of the considered theory, we may characterize this theory adequately only by axiomatizing it. Empirical theories can be axiomatized, that is to say they can be presented in the form of an axiomatized system ⫺ a system in which axioms are listed ⫺ and when there is an infinite number of axioms, only their outlines are given; the system’s theorems are derivable from these axioms in keeping with the previously defined notion of consequence (Przełe˛cki 1969: 6⫺12). Formally, a theory presented as a formalized axiomatic system does not differ from a mathematical theory, and thanks to this the syntactic aspect of every theory may be investigated with metamathematical means. So much so that some physical theories are in fact regarded simply as applied mathematical theories (Wo´jcicki 1979: 137). But in other empirical theories too, those seemingly devoid of mathematical elements, it is possible to assign a numerical measure to every quantitative formulation, and a set-theoretical structure to every sentence. Because of this, empirical theories are often treated as based on set theory, and this paves the road to their abstract and very general treatment (cf. Art. 123). 1.5. Theory structure The following components are often distinguished in the theory structure scheme: (a) an abstract calculus constituting its structure,
622 (b) a set of semantic rules called also “correspondence rules” or “rules of interpretation”, which connect non-logical theoretical terms contained in the postulates with notions in experimental laws, and hence also with observational data, (c) a model of this calculus, i. e., a system of objects in which all descriptive terms have an interpretation (Nagel 1961: V, 2⫺3). In practice, this scheme is rarely realized: theories are not necessarily constructed with this particular sequence of steps, and rules and abstract postulates lacking interpretation are not always formulated with clarity. This is also true of the following more elaborate scheme of theory structure featuring five elements: (a) an uninterpreted formal calculus (e. g., a system of equations representing wave motion), (b) an intended interpretation of this calculus, often referred to as theory concerning nonobservables (e. g., the theory of light waves as an interpretation of the formal equations of wave motion), (c) rules of correspondence linking certain terms contained in the formal calculus or intended interpretation with observational terms, (d) experimental laws being deductive consequences of the formal calculus and the correspondence rules or of the intended interpretation and these rules, confirmed by observational data, (e) further interpretation of the formal calculus using various models (Hesse 1967a: 404 ff and 1967b: 354 ff). What is it then that characterizes a theory? The following are its most important elements, at least: (a) its language, (b) the set of statements accepted in it, sometimes called “theorems” and sometimes “laws”, (c) a set of rules of inference serving within the theory to justify certain sentences on the basis of others, (d) the measurement and diagnostic procedures used in it, (e) the set of domains that this theory describes or explains, i. e., its scope. This list of theory determinants is frequently represented in schematic form, this being a suggestion that a theory is a structure composed of at least language, statements, rules of inference, measurement and diagnostic procedures, and scope. Elements (a)⫺(c) together constitute the formal system corresponding to the theory, and together with (e) they form a semantic system corresponding to it (cf. Art. 3 § 1.3.). This is not to be treated literally, just as one should not understand literally the formulation that a sentence is a structure composed of language, the words used, grammatical rules, and the situation to which it refers.
IV. Methoden der Semiotik
1.6.
The language of a theory
1.6.1. Terms The language of a theory may be described by enumerating the constants which may occur in the sentences of this language, assuming that each well-formed and closed formula featuring these is a sentence of this language. The sentence is thus a particular case of a sentential formula, and is marked by a syntactic structure defined in the language’s grammatical rules, and by meaningfulness, i. e., the fact that it refers to at least one of its domains. The language of a theory is determined by the properties of these domains. Namely, in addition to formal or logical constants (e. g., quantifiers) and mathematical constants (such as numbers or symbols of mathematical operations) each theory language contains also non-formal, non-logical and non-mathematical constants peculiar to this theory, i. e., terms referring to the domain to which the theory refers and occurring in the statements describing this domain. In semiotic theories for example such nonformal constants are words like “sign”, “semiosis”, “meaning”, etc.; these are specific terms of semiotic theory (cf. Art. 28 § 5.2.). The non-formal constants comprise also specific terms of disciplines whose theories support the considered discipline. In the case of semiotics these include linguistic terms (e. g., “grammar”, “vocabulary”), psychological (e. g., “thought”), sociological (e. g., “society”), and praxiological ones (e. g., “agent”), to mention but a few. Noteworthy among non-formal constants are individual constants, i. e., symbols of individual objects, moments in time or places referred to by sentences describing a certain individual situation. Descriptive statements and theorems of the given theory are obtained from such singular sentences by means of generalizations. Constants are divided into observational and theoretical ones (especially in traditional approaches) or into elementary and abstract ones (Carnap’s terminology). An observational predicate, e. g., “hard”, is defined ostensively, i. e., by indicating some of the concrete objects belonging to its denotation and some of those which do not belong to it. We treat them as typical examples, and we present them directly without using words, for example by gesturing. The inevitable result of such a definition is a vague word. A theoretical predicate on the other hand, e. g., the word “symbol”, is defined indirectly and ver-
30. Theory formation in semiotics
bally on the basis of other expressions, namely by ascribing to it a denotation which is a set (in the set-theoretical sense) of individual entities to which the predicate refers (referents) and which satisfies the meaning postulates of the given language. If the predicate is to be empirical, however, these meaning postulates must contain observational expressions. Hence the language of an empirical theory must feature as its part an observational language whose non-logical terms are observational (Przełe˛cki 1969: 35⫺62). This view is based on the idealizing assumption that there exist observational terms thus understood. In fact, it must be pointed out that no precise definition of observability is available, and that even if such a definition is formulated, it would turn out that there are no purely observational terms, since every perception conforms to some theory applied in the particular case. For example, in observing a portrait, i. e., an iconic sign, we consider only some of its aspects, disregarding, say, the odor and temperature of the paint-covered canvas or board. Besides, as usual in the case of so called typological notions, the difference between terms as regards their observational or theoretical character is one of degree: the predicate “yellow” is less theoretical than the predicate “syntactic”, while the predicate “single-digit” is more observational than the predicate “metalinguistic”, but neither is entirely observational or purely non-observational. What remains to be explained therefore is the manner in which an understanding of a theoretical term is arrived at, and hence the manner in which the term is given a denotation. Various solutions have been proposed here: (a) we learn theoretical terms just as we learn all other expressions: by using them in the course of developing a given science; (b) theoretical terms have implicit contextual meaning resulting from the possible empirical consequences of a given theory (e. g., “connotation” denotes an entity related to other semantic entities in a manner defined within a formal system of semantics); (c) a theoretical term does not require interpretation of any kind since every given theoretical term is an arbitrary name of a certain part of the deductive machinery; (d) we derive the meaning of a theoretical term from the theory’s model and not from an observable explanandum (Hesse 1967 b: 357 f); (e) the meaning of a theoretical term is a function assigning to every possible model a denotation of this term in this
623 model; (f) the meaning of a theoretical term is a class of its denotations, both intended and unintended (Przełe˛cki 1976). 1.6.2. Definitions A universally used way of introducing new expressions to language or of bestowing new meaning on expressions already existing in language is defining. We are speaking here of nominal definition by which an expression is rendered understandable, i. e., which answers the question about what this expression means. This answer takes the form of a sentence or sentences in which the definiendum, or term that is being defined, is translated into the definiens, or defining term, that is synonymous or at least equivalent to the former and moreover features vocabulary comprehended by the recipient of the definition, as for example in the object-language formulation a gram is a thousandth part of a kilogram or in the metalinguistic formulation the word “gram” in our language means the same as the expression “a thousandth part of a kilogram”. Definitions thus formulated are called “explicit definitions”. In the definiendum of such a definition there occurs only the word which is to be defined, devoid of context. If however such a word occurs in a context, with the two together forming the definiendum, we are dealing with a contextual definition, as in the case of the following definitions of the word “designatum”: The designatum of name N in meaning M is each and only such an object about which this name N in meaning M may be truthfully predicated or: In language L the expression “designatum of name N in meaning M” means the same as “each and only such an object about which the name N in meaning M may be truthfully predicated”. As can be seen, in the definiendum of the above contextual definition the context of the defined word designatum consists only of the variables name N and meaning M. If this definition were to contain a constant expression, e. g., the name “pen” meaning a writing instrument, then the definition of the expression designatum would become a definition of the expression designatum of the name “pen” meaning a writing instrument. If on the other hand the given variable were to occur in this context more than once, this would limit the generality of this context, as for example in this definition of the mathematical symbol ⫹: a ⫹ a is such a number c that c ⫺ a ⫽ a; such a definition makes possible the translation of expressions such as 2 ⫹ 2 and 3 ⫹ 3, but is
624 not applicable to expressions such as 5 ⫹ 2, i. e., it does not always allow the elimination of the defined symbol ⫹. Precisely because of this, the contextual definition is required to satisfy the following conditions: (a) each variable in its definiendum is to occur only once; (b) if a free variable (i. e., one outside the scope of every operator) occurs on one side of the definition, then it occurs as a free variable also on the second side of the definition; (c) there is to be no vicious circle in the definition; (d) the definiens is a translation of the definiendum. The latter two conditions also apply to explicit definitions which together with contextual definitions are classified as normal definitions. Each normal definition is formulated in a language containing the defined word (“gram” or “designatum” in the examples given above) which is not part of the poorer language of the receiver. In the richer language the normal definition is a true sentence; in the poorer one it is neither true nor false since it contains a word which does not exist in this language; hence in this latter language the formulation of the definition is not a sentence at all. A variety of contextual definition is definition through abstraction, e. g.: The meaning of expression E1 is identical with the meaning of expression E2 if and only if E1 and E2 are interchangeable in every context salva veritate, i. e., provided the truth value of this context is preserved. As can be seen, abstraction is used to define certain features, in this case: meaning as a feature of the given expression. Moreover, we are not defining this feature directly but rather the identity of the two objects as regards this feature: in our case the equivalence of two expressions and hence a certain equivalence relation, i. e., a relation at once reflexive since it occurs between the given object and the object itself, symmetrical since if it occurs between a and b it also occurs between b and a, and transitive since if it occurs between a and b and between b and c then it also occurs between a and c. In defining we refer to another equivalence relation, in this instance the relation of mutual interchangeability taking place salva veritate between two expressions in every context. According to the abstraction principle, if there is some kind of equivalence relation between two objects, then these objects always have some kind of feature in common defined by this relation. It is possible to proceed from definition through abstraction to explicit definition, e. g., from a
IV. Methoden der Semiotik
definition of synonymous expressions to a definition of meaning: Meaning is the feature of expressions which these expressions share if and only if they are interchangeable in every context salva veritate. The category of nominal definitions also includes meaning postulates, e. g., A gram is a thousandth part of a kilogram, which are based on a terminological convention or on an arbitrary terminological decision to use such and such an expression in reference to a specific object or event or to endow a given expression with such and such a meaning. A consistent meaning postulate ⫺ formulated like the one above in the object language ⫺ is a true sentence if and only if an object exists which satisfies it. On the other hand, in a metalinguistic formulation ⫺ which in this case would be The term “gram” in language L means the same as the expression “thousandth part of a kilogram” ⫺ a consistent meaning postulate is true by virtue of the terminological decision alone. A meaning postulate formulated in the object language contains a translation of the definiendum into the definiens or vice versa if and only if it is univocal, that is to say when there exists one and only one object satisfying the conditions imposed by this postulate on the denotation of the defined expression. Such a meaning postulate becomes a nominal definition of this expression, and at the same time a univocal characterization of its denotation, i. e., a real definition of this denotation. A meaning postulate formulated in the object language which is at the same time a definition of a certain expression is called a “definitional tautology”, since it informs in a tautological manner about the fragment of reality to which the defined expression refers. This information is scant and trivial in comparison with the content of the terminological decision on which it is based. Tautological definitions and their logical consequences are called “definitional statements”. Unlike information on the object, the information on the proposed meaning of the term, namely the terminological declaration contained in the meaning postulate, is not trivial: we use it when introducing a term into the language of theory, among other things. As we see, a meaning postulate of language L is a sentence containing at least one term which, by virtue of the terminological conventions adopted in this language, is to be the name of an object or objects satisfying this sentence or the system of sentences to
30. Theory formation in semiotics
which it belongs. This term is called a “primitive term” of this system of postulates. A system of postulates that is at once consistent and univocal constitutes an implicit definition of terms embraced by the terminological convention. It is possible to obtain an explicit definition of the defined term from the implicit definition. If, however, the system of postulates is consistent and non-tautological but at the same time non-univocal, it is called an “implicit pseudo-definition” since although it does not provide a univocal characterization of the system of objects which are supposed to be the denotation of primitive terms, it nevertheless restricts the choice of their possible denotations. Definitions play an important role in deductive sciences, among others. The tasks of assigning a meaning to each primitive term often rests on the axioms of the deductive system, which then serve as postulates. Other terms of the system are created out of primitive terms with the help of definitions. Thus, to the system’s axioms, i. e., primitive theorems, and proved theorems we may add definitions. If the latter include a definition formulated in an object language, it may happen that from the axioms and theorems of a given language, in particular from a given deductive system, there will be inferred with the use of this definition, by virtue of the rules of inference valid in this system, a sentence that is impossible to prove without this definition. A definition of this kind is called a “creative definition”. Some creative definitions attached to a system make it possible to prove two contradictory statements. Accordingly, definitions ⫺ especially those in formalized deductive systems ⫺ are required to be noncreative. Prior to the introduction of a term’s definition, proof is demanded that there exists one and only one object satisfying it (concerning regulatory definitions and explications cf. Art. 31 § 2.2.). Rules of definition are sometimes formulated with the aim of guaranteeing that the introduced definition satisfies the conditions of translatability and consistency. The former condition ensures that the definition, i. e., a sentence containing both the defined terms and terms already incorporated in the system, can be translated into an equivalent sentence containing only terms previously accepted in the system. The consistency condition, on the other hand, makes sure that no contradictions arise out of the theorems incorporated in the system and the definition
625 that is being introduced. Among the rules of definition found in formalized deductive systems aside from those already mentioned ⫺ namely (a) each variable occurs in the definiendum only once; (b) a free variable occurring on one side of the definition must also occur on the other side; (c) there must be no vicious circle in a definition; (d) the definiens is a translation of the definiendum ⫺ there are also others. For example, it is required that in the definiendum no constant occurs other than the term being defined, or that the definition must have the form of an equivalence with the defined term on one side only, the other side featuring only those constant terms that have already turned up in previously accepted theorems (Ajdukiewicz 1974: 57⫺84 and 207⫺211). So far we have considered only equivalence definitions. Aside from these ⫺ particularly outside formalized deductive theories ⫺ partial definitions, or reduction sentences having the form of conditionals are also allowed. These serve to introduce a new predicate. To this end they state only some criteria of the predicate’s applicability, namely either its necessary or sufficient conditions. The partial definition sometimes has the form of a pair of sentences, e. g., For every x: if x has more than one designatum, then x is a general name; for every x: if x has less than two designata, then x is not a general name, or of a conjunction thereof. This definition is often used to provide an approximate explication of a theoretical term with the use of observational terms or of previously defined theoretical ones. Since, however, a definition of this kind usually fails to satisfy the condition of non-creativity, it does not give a theoretical predicate a univocal interpretation, the consequence being that it remains partly undetermined. Among partial definitions we also include reduction sentences in the narrow sense of the term, that is to say reduction definitions such as: For every x: if x is asked to say what is the designatum of a given term, we will say that x understands this term if and only if x correctly indicates at least one designatum of this term. The above sentence is an example of a conditional definition of a theoretical term, in this particular instance of the dispositional term “understands” in terms of the previously defined words “designatum” and “term”. The conditional definition is a logical consequence of the equivalence definition, it does not provide a translation of the defined word and hence does not
626 enable its elimination from an arbitrary context. The equivalence contained in it occurs only when its antecedent is satisfied; in the above example this happens only in the case of people asked to indicate the designatum of a given term. Despite this limitation, which means that the conditional definition does not univocally determine the interpretation of the defined predicate in cases other than when this interpretation is logically equivalent to the equivalence definition, this definition can be used to introduce new terms since it is non-creative. A meaning postulate sometimes consists of more than one conditional definition, but such a set of conditional definitions of a single term is then creative. A meaning postulate is sometimes of the form of a generalized reduction sentence, e. g., For every x: if x is a grammatical subject in a sentence, then x is a nominal expression or the infinitive. In the consequent either one or both clauses may be negated; the number of clauses may be more than two. Generalized reduction sentences of this kind are noncreative, and the conjunctions of such sentences are usually non-creative as well. ⫺ The role of meaning postulate may also be performed, among other things, by sentences of this structure: For every x: if x is a concrete object, then there exists a y such that y is similar to x and y is an icon (Przełe˛cki 1969: 47⫺87). 1.6.3. Sentences The next element of theory, following terms and definitions, are sentences, including sentences accepted as true, i. e., statements (theorems). Among statements there may be distinguished sentences occurring in the given theory and sentences which ⫺ although not present in the theory ⫺ may be proved with the former ones. This distinction partly overlaps with another, namely the distinction of sentences which the user of the theory knows to be this theory’s statements, and all the other sentences; the latter often include sentences which are not part of the theory but which may be inferred from it. A category of sentences accepted as true are also axioms, but only in assertive-deductive systems; in hypothetical-deductive systems, on the other hand, axioms are neither accepted nor rejected. Sentences suspected to be true but as yet not accepted as such due to insufficient grounds for such a judgment are called “hypotheses”. It must be born in mind, however, that the border between a statement
IV. Methoden der Semiotik
(theorem) and a hypothesis is not clear-cut, since the acceptance of sentences as true is gradable, especially in empirical theories as distinct from theories with a deductive structure. That is why in empirical theories hypotheses that are highly probable are treated as if they were sentences accepted as true, i. e., as statements. The role of hypotheses is played by synthetic sentences as distinct from analytical sentences, that is by ones which are logical consequences of the set of meaning postulates of the theory’s language, and from contradictory sentences, i. e., negations of analytical sentences. The truth value of a synthetic sentence depends on experiment. However, the vagueness of the terms occurring in such a sentence leads to difficulties in deciding for which particular interpretation the sentence is true and for which it is false. This problem prompts some to claim that this sentence is neither true nor false, but this would then have to apply also to its negation which would be a violation of the law of the excluded middle. ⫺ The notion of empirical decidability of a sentence may also serve to make another distinction, namely between a statement of a theory and an empirically decidable sentence ⫺ decidable, let us add, only as far as its indeterminacy allows. The former sentence, sometimes called a “law”, is, according to this distinction, a general sentence, theoretical in character, while the latter, sometimes called a “descriptive statement” or “empirical statement”, is more observational than the former, referring to specific objects in such and such a point of time. This distinction is vague, in proportion to the vagueness of the terms “theoretical” and “observational” used in it. The very theoretical and observational terms are themselves vague, and hence the sentences and languages in which these terms occur ⫺ namely theoretical sentences and observational sentences, and theoretical languages and observational languages ⫺ are vague as well. Terminology featuring the words “law”, “statement” and “hypothesis” is unstable. 1.6.4. The interpretation of a language, its domain and scope A formalized language, that is to say, one characterized only as regards its syntax through an enumeration of its primitive expressions and a formulation of rules for building complex expressions out of simpler ones, is still not a language of a theory. In
30. Theory formation in semiotics
order for it to become one, it must be interpreted, i. e., characterized also with respect to the semantic aspect. Thanks to this, the expressions of this language, its terms and sentences will start to refer to certain fragments of reality, i. e., objects, states of affairs, events, and phenomena (cf. Art. 3 § 4.). “State of affairs”, “event” and “phenomenon” may be understood in an individual or general manner. Understood individually, these words refer to something occurring in a specific time and place. If they are not used interchangeably, as is usually the case, the expression “state of affairs” is used to denote something static, i. e., something that does not change in some respect in a specific time (e. g., the fact that John is married at such and such a time); the word “event” is used to denote something changing in some respect in a specific time (e. g., John’s loss of weight); and the word “phenomenon” is used to denote the fact of some object possessing a certain feature (e. g., the electric conductivity of this specific piece of copper wire). The expressions “state of affairs”, “event” and “phenomenon” as understood generally refer to entities that are not localized in space and time. A state of affairs, event or phenomenon may be represented in the form of an abstract ordered structure consisting of individual objects and relations occurring between them; each of these relations has as many arguments as the predicate to which it corresponds. A structure of this kind is for example a set composed of two variously sized prints of the same photograph and such relations between them as geometrical similarity, the property of being larger, etc. A given language may refer both to a single structure of this kind and to various structures of such structures. Each structure as well as structure of structures is sometimes called a “model” (in one sense of this word) or “domain” of this language if it is a fragment of reality ⫺ either empirical or nonempirical ⫺ about which it is possible to speak in this language. In turn, the various possible domains of language are referred to, not very aptly, as its “possible interpretations”. Strictly speaking, an interpretation of a given language is the assignment of a truth value to each of the sentences of this language, of a range (i. e., a certain set) to each individual variable, and of a denotation (i. e., a certain relation) to each predicate of this language. An interpretation is thus a function assigning a domain to a language.
627 There are many different functions of this kind, that is to say many different interpretations of a given language: as many as there are ways of assigning to it that about which it is speaking, i. e., its universe, and that which it is claiming of it, i. e., the relations occurring between the elements of an individual universe. Of all the fragments of the broadly understood reality about which a given language may speak, we usually try to single out the one about which it actually speaks or about which we intend it to speak (cf. Art. 28 § 3. and 4.). We do not always succeed in this, and instead of one fragment we get a certain set of fragments. This is known as the intended or proper domain of this language, its intended or proper model, or, as it happens in most cases, a set of such domains. Although this proper domain of the language is obtained as a product of a certain activity, namely thanks to a selection of its so called “intended” or “actual” interpretation, this intended domain is called “the intended interpretation”. In fact, however, an indication of this domain, although being a relevant element of language interpretation, by no means constitutes the complete interpretation. This interpretation is purely extensional; it suffices to define the notion of truth for each firstorder logic language, but that does not take into account many phenomena typical for a natural language, which differs from the former mainly in that there occur in it intensional expressions, indexical expressions, empty nominal expressions, expressions belonging to syntactic categories other than the standard syntactic categories, expressions that are ambiguous, vague, etc. The first of these categories, that of intensional expressions, is particularly troublesome. Not everyone is happy with attempts to interpret them within model-theoretical semantics based on set-theoretical ontology, namely with defining the intension of an expression as a function from possible worlds to an extension which assigns to each possible world an extension of the expression in this world. Thus, according to one opinion, a solely extensional interpretation of a language is not a full interpretation thereof. Since the interpretation of a theory consists in interpreting its language, then ⫺ according to this opinion ⫺ an exclusively extensional interpretation of the theory’s language does not lead to a full interpretation of this theory.
628 If a given language is a language of a theory, then its domain constitutes the domain of this theory, and hence the structure to which it refers. In turn, the class of all its domains, also the possible ones, is the scope of this theory. In a structure that is a domain of some theory, the set of individual objects and relations is often accompanied by parameters of time, and if the theory is empirical, then these individual objects are of empirical character and the kinds of relations occurring between these objects are adapted to this character. 1.6.5. Semantic models versus sign models In the analysis of the notion of language interpretation the word “model” was used. This word has several meanings, of which two will be discussed here: the notion of a semantic model and the notion of a sign model. (1) There may be two kinds of semantic models: the semantic model of a language, and the semantic model of a sentence or set of sentences. (a) The semantic model of a language is all that may be spoken about in this language, both truthfully and otherwise, i. e., its entire universe of discourse. (b) A semantic model of a sentence or set of sentences is such a structure of individual objects, sets and relations in which this sentence or these sentences are true, or, putting it more generally, satisfied. Thus, if by theory we mean a certain set or system of sentences, then the semantic model of a theory, or its realization, is each and only such a structure of objects as well as sets and relations which this theory truthfully describes. If the theory is axiomatized, then the role of its semantic model is performed by every structure of denotations of the primitive terms and the ranges of variables, i. e., the sets of objects which each variable runs over, which occurs in the theory’s axioms. A common feature of semantic models, both (a) and (b), is that they are equivalents ⫺ concrete or abstract ⫺ of certain signs, namely of language in the case of (a), or of a sentence, set of sentences or theory in the case of (b). (2) An example of the second notion of model, that of a sign model, is a sentence, i. e., a kind of sign. A model of a given situation is here every sentence which refers to it: for example the sentence, Warsaw lies on the Vistula and the Old Town is on the left bank of this river, is a sign model of the state of affairs whereby Warsaw lies on the Vistula
IV. Methoden der Semiotik
and the Old Town is on the left bank of this river, while this state of affairs is a semantic model of the quoted sentence. In turn, the sentential formula p ∧ q is a sign model of, among other things, the sentence Warsaw lies on the Vistula and the Old Town is on the left bank of this river as one satisfying this scheme in that it is in agreement with it syntactically; this sentence is a substitute of the p ∧ q formula, and hence a kind of realization which may be included in the category of semantic models once the notion is suitably expanded. There is a formal analogy between the sign model and the semantic model corresponding to it, e. g., homomorphism or isomorphism, or also a material analogy, as for example between a small and simplified model of a car and an ordinary car patterned after this model if both are manufactured from the same materials. There is also an analogy between semantic models of the same sign model, and between different sign models of the same semantic model. The same goes for icons and their referents, and for the relationship of an icon to a symbol having the same semantic model: there is an analogy between them. Both the sign model (e. g., a globe) and the semantic model corresponding to it (the Earth) can be real objects or ⫺ as in the case of a mental plan for the decoration of a building’s interior ⫺ the sign model is abstract while its semantic equivalent is concrete. However, the semantic model may be an abstract construct too. Such an abstract semantic model is a semantic model of a theory that is a structure of set-theoretical constructs, namely sets and relations. The theory on the other hand, or description, recipe, instruction for use, map, scheme, are sign models. The construction of a sign model of the phenomena that are to be dealt with by the empirical theory is considered to be the basic task of this theory. A system of equations is an example of a mathematical sign model, and the curve corresponding to it constitutes a mathematical semantic model of the former, and itself it may act the role of a mathematical sign model of the process it illustrates. As we see, the notions of semantic model and sign model are relative, and this in two ways: entitity B is a model of entity C with respect to such and such an adopted conceptual apparatus; this same entity B which is a sign model of entity C may be a semantic model of entitity A. This is true of, among other things, the triad consisting of mental language, verbal language and reality.
629
30. Theory formation in semiotics
Depending on the point of view and the approach dictated by philosophical views, particularly as regards epistemology and ontology, as well as on the research task in hand, we either treat reality as a sign model of the thought in which this reality is reproduced or, conversely, we regard the conceptual apparatus of mental language as a sign model serving to grasp the analyzed reality in some specific manner. Similarly, we either believe that verbal speech develops according to a pattern provided by mental speech acting as a sign model of the former, or, conversely, we claim that the sign model of thought is verbal speech and that, accordingly, there can be no thought without language. Presenting any theory as a schematic set-theoretical structure composed of abstract set-theoretical constructs ⫺ the most important of which are the theory’s language, theorems, rules of inference, diagnostic and measurement procedures, and scope ⫺ we construct a sign model of this theory; its partial approximate concretizations are the various individual theories. 1.6.6. Object language versus metalanguage The language of a theory consists of an object language and a metalanguage (cf. Art. 3 § 2.1.). Object language sentences refer to all that the given theory is concerned with. A presentation of a theory usually contains ⫺ aside from theorems about the reality described by the theory ⫺ also methodological considerations and sometimes historical remarks. Both the latter are formulated in a metalanguage, e. g., description, analysis and evaluation of empirical procedures (that is to say experiments and measurements performed in the course of using the theory, among other things), terminological conventions, explications of terms, discussions concerning the selection of the conceptual apparatus, comments on the contents of theorems and relationships between them, assessments of the reliability of hypotheses, information about the origins of ideas and differences in opinions about the given theory, reports of controversies and criticisms, opinions about the usefulness of the given theory in some particular discipline, etc. Occasionally, some of the object statements within the theory are formulated in the metalanguage. In such a case this formulation is merely of stylistical character; it is not significant and should be treated as belonging to the object language. A distinction is sometimes made between the
language of a theory and the language of theory presentation, with the former lacking metalanguage, and the latter composed of both object language and metalanguage. 1.7.
Proof: axiomatization and formalization of a theory
1.7.1. Proof Methods of proof are the next element of the schematic structure that determines a theory. The previously discussed elements were presented as part of considerations concerning the language of a theory: its theorems form part of this language, and its scope is the set of reality fragments to which this language ⫺ and hence also the theory ⫺ refers. Can the remarks about the means of proof also be included in the description of the theory of language? Indeed they can, namely in the description of a formalized deductive theory. To this end, one must formulate rules of inference, rules of constructing proofs, treating them syntactically, namely as relationships between finite sets of sentences used as premisses and sentences obtained on their basis, i. e., conclusions (cf. Art. 2 § 4. and Art. 3 § 4.). In making inferences we rely on laws of logic formulated as tautological theorems of logic. In the empirical sciences we use not only rules of inference and theorems of logic but also selected theorems of mathematics. The proof of a given sentence in keeping with the methods of proof and set of premisses selected by the proving person amounts to a deduction of this sentence from the selected premisses. Thus, to say that a sentence has a proof within a certain set of sentences is to say that it is derivable from this set, i. e., that it is this set’s consequence. ⫺ By bringing into consideration the notions of a proving person and the action of inference (cf. Art. 4 § 2. and 3.), we define the notion of inference rule pragmatically, namely with respect to the notion of acceptance of sentences in the premisses, and on this basis of the sentence in the conclusion. 1.7.2. Primitive theorems In the deductive sciences, a proof serves to introduce derived theorems which are not definitions into a system already containing primitive theorems. Primitive theorems include axioms and theorems borrowed from theories on which the constructed system rests. To prove a new theorem, we put it as the last sentence in a sequence of sentences
630 in which all but the primitive theorems follow from the sentences directly before. The extension of the notion of proof will depend on which sentences are selected as primitive and on which relation will be regarded as the relation of direct consequence (cf. Art. 3 § 4.2.). For example in sciences less advanced methodologically, it is enough for the primitive theorems and direct consequence to satisfy the criterion of self-evidence used by some scholar or group of scholars. Both these notions ⫺ that of primitive theorem and that of direct consequence ⫺ are thus psychologically tainted. They lose this taint once, in more mature disciplines, the given theory is axiomatized by formulating certain sentences which are recognized as axioms and then adding to them selected theorems of those sciences which form a base for the given discipline. Neither the former nor the latter have to be self-evident or even appeal to anybody’s intuition. 1.7.3. The formalization of a theory Once a deductive science is axiomatized, it may be subjected to formalization by defining the relation of direct consequence occurring between sentences with respect to their shape only ⫺ in this case graphic shape. In this way the notion of consequence too loses its psychological content while retaining its structural, and hence syntactic character. For example in sentential calculus the relation of direct consequence is described as one occurring between a conjunction composed of the conditional if p then q and its antecedent p on the one hand, and the consequent q on the other, or between a formula containing a free variable and a sentence obtained from this formula by substituting in its place a meaningful expression belonging to the same syntactic category. Thus, the rules of proof here are the rule of detachment and the rule of substitution. Instead of defining the relation of direct consequence, one may give a full list of the rules of proof. Proceeding from the concept of direct consequence, one may arrive at the concept of indirect or inferential consequence, the latter occurring between a given sentence and the third and next sentences, in a sequence in which adjacent sentences are bound by such a relation of direct consequence that the second sentence results directly from the first, the third from the second, etc. Deductive theories belonging not to formal logic but to mathematics are formalized by adding to their mathematical axi-
IV. Methoden der Semiotik
oms all the axioms of formal logic and assuming all and only the rules valid in formal logic as rules of proof. A formalized deductive theory is thus constructed as follows: (a) Simple words, both constant and variable, that will become components of sentences are enumerated, and a definition of a meaningful sentence in the given theory is given, specifying the way a compound expression is to be built from simple expressions; this specification takes the form of formation rules defining the sufficient ⫺ but not necessary ⫺ conditions which a meaningful sentence of this formalized theory satisfies; (b) the theory’s axioms or structural rules characterizing the axioms’ structure are formulated; (c) the relation of direct consequence is defined or, alternatively, a complete list of rules of inference is drawn up; (d) rules of defining are given if object language definitions occur in the given theory. These conditions are necessary and sufficient to define the concept of proof in the given theory. Proof sequences are used to introduce derived theorems. In the deductive sciences these theorems follow logically from primitive theorems. The theorems of a given deductive theory must not contain a pair of contradictory sentences. An inconsistent theory contains false theorems, and aside from that two contradictory sentences may be used to prove any sentence. The system of axioms of such a theory ought to be independent, that is to say none of the axioms should follow from the others. The theory itself is required to be complete in two senses of the word. Firstly, each sentence or a negation thereof is a theorem of this theory, meaning either that it can be proved in it or that it is its axiom; and each correctly built sentential formula is either a theorem of the theory or will lead to contradiction when added to the theory’s axioms. Secondly, each true sentence that may be formulated in the given theory’s language can be proved in this theory (cf. Ajdukiewicz 1974: 194 ff). 1.8. Empirical procedures Unlike deductive theories, in empirical theories empirical procedures occur, constituting the last element of the schematic abstract structure serving as a sign model of the concept of theory. These procedures, like the means of proof described above, may be presented in the form of a set of sentences used as formulations of hypotheses and subse-
30. Theory formation in semiotics
quently verified or falsified with these procedures, e. g., with perception, observation, experiment, counting and measurement (cf. Art. 28 and 29). 1.9.
Traditional versus structuralist concepts of theory
1.9.1. The statement view In the preceding remarks, theory was treated as a set of statements, in keeping with the socalled statement view, according to which a theory consists of the sentences formulated and accepted by the theory’s author as well as all sentences logically following from them and together forming the kind of structure or system described here. In the standard version of this approach, concerning empirical theories, use is made (cf. Przełe˛cki 1969: 1 ff) of the conceptual apparatus of the conceptual system of standard model-theoretical semantics, the considerations are based on settheoretical ontology, and the interpretation of language is identified with the language’s semantic model, i. e., a certain set-theoretical structure. The theory’s scope is taken to be the class of intended models of its language; the universe of each model embraces all the objects which the theory concerns. This approach often goes together with what is known as logical empiricism, which leads to a distinction between observational and theoretical terms. In the nonstandard version of the approach (cf. Wo´jcicki 1979: 1 ff) this distinction vanishes, and the empirical interpretation of certain language expressions is assumed to be given in advance. In this case the scope of the theory is the set of domains, each of which represents one of the phenomena described by this theory, and, accordingly, comprises only the objects involved in the given phenomenon. 1.9.2. The structuralist view Distinct from the traditional statement view is the structuralist approach to theory, referred to as the non-statement view. Its pioneer is P. Suppes (1957), the main representative is J. Sneed (1977, cf. also Balzer, Moulines and Sneed 1987), and the main continuator and commentator is W. Stegmüller (1973 ⫽ 1976, 1979 and 1986). Sneed focuses on theories of mathematical physics, that is theories in which a certain mathematical structure is used to formulate statements about some fragment of the world, but there
631 are also applications of the structuralist view to, e. g., theories of literature (Balzer and Göttner 1983) and genetics (Balzer and Dawes 1986). It is claimed in this context that each theory of mathematical physics has associated with it a certain characteristic mathematical structure. The usual way to reveal this structure is to carry out a logical reconstruction of the theory, discovering the logical relations that occur between the statements of this theory (which is treated statically as one undergoing no changes in a given specific period). These logical relations are presented in the form of an axiomatic system. Sneed observes that the term “axiomatic system” is being used with reference to various things: (a) a certain kind of set of statements, (b) an axiomatized deductive theory in some formal language, (c) a definition of a set-theoretical predicate. It is generally assumed that the logical structure of any theory may be exhibited with a certain axiomatized deductive theory in formal language, in most cases closely related to first-order predicate calculus. Given the fact that very few theories could be axiomatized in this manner, Sneed, following Suppes, proceeds differently: he axiomatizes a mathematical theory non-formally, defining ⫺ adequately if possible ⫺ the set-theoretical predicate, that is to say the predicate that can be defined with set-theoretical concepts. According to advocates of this approach, such a definition will help exhibit the logical structure of a scientific theory if certain empirical statements of this theory are formulated in sentences containing this predicate. The term “empirical statement” is assumed to be primitive, and interpreted widely enough for it to cover more than just observation reports. Sneed claims that two components may be distinguished in every theory of mathematical physics: (a) its formal mathematical structure characterized by a set-theoretical predicate, and (b) a set of intended applications of the given theory, namely those physical systems to which, in agreement with this theory, the formal structure applies. The formal structure comprises the class of possible models of the given theory, the class of its possible partial models containing only functions that are non-theoretical with respect to it, the class of its models, and constraints for the class of its possible models ensuring that certain relations hold among values of theoretical functions employed in various applications (cf. Art. 28 § 3. and 4.). The fact that the class of these models, which are set-theoretical struc-
632
IV. Methoden der Semiotik
tures, is specified by defining the set-theoretical predicate makes this approach distinct from the traditional approach, where the models of the formalized deductive theory are models of this theory’s axioms, that is to say a class of structures in which primitive and derived theorems of the theory are true. The same set-theoretical predicate serves also to construct empirical theorems of the theory, that is theorems concerning the set of its intended applications, with each of these theorems being a possible model of the theory containing none of the functions theoretical with respect to this theory. As we see, the opposition “theoretical” versus “non-theoretical”, relativized to the given theory, is not given up here, although it does not have the form of a clear-cut distinction of theoretical and observational terms. In the structuralist approach it is the function contained in the structures whose sets form the system called the “empirical theory” that are theoretical or non-theoretical. Structures corresponding to the applications of such a theory contain only non-theoretical functions. There are no direct references to terms and theorems but rather to structures and functions. But both are introduced by means of verbal formulations, and thus, in a roundabout way, we arrive at the language of the theory. The approach described as statement view and the structuralist approach are equivalent, and to refer to the latter as the non-statement view seems unjustified in that in it too what actually matters are statements: statements, let us add which ⫺ as in the standard traditional approach ⫺ have an interpretation and hence also applications (cf. Przełe˛cki 1974: 91 ff). 1.10.
The cognitive role of a theory
1.10.1. Descriptive functions of a theory By referring to reality, a theory plays a role in its cognizance. There is no agreement, however, as to the nature of this role. Two positions are discernible here. According to the first position (a), pertaining primarily to empirical theories, a theory is a systematized set of statements containing theoretical terms to which ideal concepts correspond. These statements, being idealizations, do not refer directly to observable objects and hence are not directly testable. Moreover, some of these terms are not linked with the observable by any correspondence rule; they should therefore be treated as variables, and the statements in which they occur
be treated as sentential schemes rather than sentences. ⫺ For these two reasons, the individual statements may not, strictly speaking, be regarded as either true or false. Thus when a theory is said to be true, what is in fact meant is either that in its semantic model there occur relations analogous to those occurring in its sign model (this making the explanation or prediction based on this theory easier and fuller), or that it is relatively well substantiated empirically, and hence probable, by virtue of the fact that its theoretical statements are translatable into statements about observable objects. However, in upholding this latter view we tacitly assume that we are able to define theoretical terms using observational terms. As we know, this is very often impossible, not to mention the fact that we are not all willing to make the distinction between theoretical and observational terms. Despite the failure of such definitions and such translations, there are some who treat theory as a simplified and economical description of empirical data. Some see the latter as being sense data and contents of introspective experiences, and others mean by them concrete physical things, observable events and relations between them. Still others ⫺ and this is the weak version of this view ⫺ content themselves with reduction or operational definitions of theoretical terms. But these definitions fail too, as does defining with explicit definitions. 1.10.2. A theory as a tool of explanation or prediction According to the second position (b) on the cognitive character of a theory, it is a rule or system of rules according to which we organize experiments, analyze empirical data and present them in symbolic form, derive certain observational statements from others (such as predictions from sentences about data), and introduce order in experimental laws. A theory thus understood is often formulated as a formal calculus with appended rules of correspondence. In such a case it neither describes nor presents any objects, and refers to certain facts only insofar as it is applicable to them as a rule. Thus, neither any particular sentence of this theory, nor the theory as a whole is true or false. At best, one theory may be better than another as a tool of explanation or prediction (cf. Nagel 1961: VI and Hesse 1967a: 406 ff).
30. Theory formation in semiotics
1.10.3. The descriptive and explicatory character of a theory It seems positions (a) and (b) can be reconciled. Namely, as is known, a theory is a structure consisting of sentences or sentential formulae; from the latter it is possible to obtain sentences using existential quantification. In turn, sentences which are recognized as true become formulations of statements reproducing reality. It is also known that statements of a given theory or the entire theory are used as premisses in explaining or predicting. Moreover, we test empirically both the theory and its individual hypotheses, and this activity is also based on the assumption that they state something. We thus treat theories both as a description of reality and as a tool serving to explain and predict events. On the other hand, however, we may use this same theory or a part of it as a different tool, namely as a rule according to which we conduct empirical procedures. For example, Ajdukiewicz’s theory saying that the proposition is the connotation of a sentence is not only a description of a certain aspect of language and an explanation of the nature of the semantic function of language, but also a rule governing the analysis of these functions. This theory is a system of statements containing abstract theoretical terms such as “operator”, “argument”, “syntactic position” or “denotation”. These terms have no direct empirical reference and their presence in statements causes these statements to be idealizations. Nevertheless, such idealizations reflect reality, albeit indirectly. At the same time, we use this very same theory as a rule specifying the kind and order of analytical procedures, namely as a rule giving the following instructions: First and foremost, distinguish in the sentence its ultimate constituents, then single out the main operator and its arguments, label each argument with the number of its syntactic position within the analyzed sentences; next indicate the main operator and its arguments within each of the previously distinguished arguments, assign to them the appropriate syntactic positions, etc. (cf. Ajdukiewicz 1979: 81 ff). A theory is thus like a map: it reproduces reality and at the same time may be used to plan a journey (cf. Art. 123 § 2.4.). 1.10.4. Deductive versus inductive inference within a theory Considering the cognitive value of a theory, we focus our attention on the statements contained therein, particularly on their truth-
633 value and on the manner of accepting sentences as true. In an empirical theory new statements are derived from statements previously accepted by deduction and by induction. Acceptance by deduction consists in inference, whereby the conclusion follows logically or enthymematically (cf. Art. 53 § 4.4.) from the premisses; in other words, it follows not only from explicitly formulated premisses but also from tacitly assumed sentences which are true, which the inferring person recognizes as true; sentences satisfying these three conditions combine to form the knowledge of the inferring person. The use of deductive methods is based on the statements of logic, and hence also mathematics. Both these kinds of statements thus form the basis of the inductive sciences, i. e., all sciences except for logic and mathematics. In addition to the statements of logic and mathematics, the primitive statements of the inductive sciences also include the so called definitional statements (see § 1.6.2.). In these sciences ⫺ including the natural sciences and the humanistic disciplines ⫺ there occur empirical theories. The inductive manner of inference embraces: inferences by reduction, induction by incomplete enumeration, inference by analogy, and certain other inferences. In all of them, relying on the acceptance of premisses, we accept the conclusion in a less than definite manner, namely to a degree not exceeding the logical probability of this conclusion with respect to these premisses and our knowledge. 1.10.5. The cognitive value of perception sentences The fact that in an empirical theory some of its statements are obtained through inductive inferences affects the cognitive value of these statements (which do not guarantee categorically certain cognition) and hence also the cognitive value of the theory of which they form a part. The accepted basis for these statements consists of observational sentences based directly on experience, that is sentences which a given person regards as true at a given moment because at that precise moment he or she is experiencing a relevant sense perception. However, a sentence assumed by X at time t as true and a true sentence are two different things. The observational sentences that are less subjective and more intersubjective than others are those which a given person regards as true at a given time, motivated in a twofold manner: not only by some sense perception but also
634 by a certain empirical meaning rule; e. g., the sentence This is white uttered by someone seeing snow in daylight. In such cases the chances that a sentence regarded as true is in fact true is greater than when a sentence is accepted as true on the basis of perception only with no consideration given to the relevant meaning rule. Two reservations must be made here, however. Firstly, in ethnic language the empirical meaning rules are not specified precisely and assigned to expressions in one-to-one correspondence, which results in the vagueness of expressions, among other things. Secondly, the experiencing of perception depends to some extent on the conceptual apparatus used by the perceiving person, and hence on the language this person uses: in order to realize that we are perceiving something, and thus in order to accept as true the relevant perception sentence (described sometimes as “protocol sentence”), two elements must combine: the sensual and the conceptual. Given that the observational sentence reports an incidental and subjective rather than repeatable and intersubjective experience, it is not a statement (theorem) of science, and it does not form a part of an empirical theory if its only substantiation is someone’s direct experience. But this same observational sentence about some unrepeatable concrete event may become a scientific statement if it is substantiated in an intersubjectively coherent and repeatable manner; for example in history by reference to a source that was demonstrated to be authentic and originating from a competent, rational and honest informer; or in the natural sciences or in sociology by induction as a hypothesis whose consequences are there to be empirically verified by all wishing to do so, or as deductive conclusions from general statements substantiated by experiments. An observational sentence may be accepted as true or a hypothesis tested by way of: (a) observation, i. e., perception guided by a task and proceeding according to a predetermined plan; (b) experiment, i. e., the causing of the event which we wish to observe or the modification of this event with the intention of observation; and (c) measurement, which is a kind of diagnostic experiment and at the same time (together with counting) a kind of quantitative observation. Each of these inductive methods is intersubjective and repeatable, despite the fact that their concrete applications consist of a series of subjective
IV. Methoden der Semiotik
and unrepeatable perceptions, one of which is made by X at time t1, another by Y at time t2, etc. By generalizing individual statements based on such unrepeatable perceptions we arrive inductively at general statements and these, as we see, can be substantiated intersubjectively (cf. Ajdukiewicz 1974: 109 ff, 120 ff, 190 ff, 238 ff; see also Art. 29).
2.
Semiotics
2.1. The semiosic properties of the sign So far we have been trying to state what a theory is. Now we will attempt to characterize semiotics. To this end we will take a look at the actual uses of the word “semiotics”. In phrases such as “the semiotics of expression E” the word “semiotics” refers to (a) syntactic, (b) semantic, and (c) pragmatic properties of expression E. Such properties involve relations occurring (a) between expression E and other expressions of the given semiotic system (e. g., the language or a fragment thereof; cf. Art. 2), (b) between expression E and that to which it refers (e. g., to its designata, extensions or connotations as entities occurring outside the considered system of expressions; cf. Art. 3), and (c) between expression E and its users, and hence also interpreters (the receiver and sometimes also the sender in a given place and time; cf. Art. 4). Just as we use the formulation “the semiotics of expression E”, we also use the phrase “the syntactics of sentence S”, having in mind the syntactic relations occurring between the constituents of this sentence, i. e., its syntactic character. We also talk of “the semantics of word W”, thinking, for example, of this word’s meaning, or, more generally, of its semantic character. Analogously, the formulation “the semiotics of expression E” is about the expression’s semiotic or, more accurately, semiosic character, since the syntactic, semantic and pragmatic relations of expression E occur between this expression and other entities in the process of semiosis, that is to say in the activities of sign use: in sign processing and interpretation, and sometimes also in the sending of the sign. Thus, the phrase “the semiotics of expression E” denotes, firstly, the semiosic properties, semiosic functions, and semiosic relations of expression E within the considered semiotic system. This involves (a) the structure of the expression and its connection with the sign context, (b) its meaning and reference, and
30. Theory formation in semiotics
(c) its relations to the surrounding situation; the users, place, time, etc. In the same manner we use, for example, the phrase “the color of object O” when we want to speak of the object itself as one emitting a specific light wave and evoking specific visual reactions. 2.2. The semiotic study of the sign Secondly, the word “semiotics” is sometimes used as the name of a certain branch of knowledge, a science, discipline or interdisciplinary study having semiotics1 as its object (cf. Art. 123). We shall denote this branch of knowledge, science, discipline or interdisciplinary study with “semiotics2”. In most cases this is a structure with at least two levels. On its lower level (semiotics2.1) it describes semiotics1 in a metalanguage1, while on its higher level (semiotics2.2) it uses a metalanguage2, or metametalanguage, to describe and explain phenomena belonging to semiotics2.1. Each of these metalanguages consists of three sublanguages: the syntactic, the semantic, and the pragmatic metalanguage. In the syntactic metalanguage 1 there occur names of expressions of the object language described with it, e. g., “dog” as the name of the word dog, predicates referring to relations between these expressions, e. g., “is a constituent of sentence S”, and syntactic rules governing these expressions, e. g., “Adverbs of manner are usually formed in English by adding -ly to appropriate adjectives”. This metalanguage does not contain names of objects belonging to the reality described in the object language, or predicates referring to the relations between these objects. The semantic metalanguage 1 consists of the syntactic metalanguage1 and the object language containing, among other things, names of objects occurring in the extralinguistic reality (e. g., tree) and predicates referring to the properties of these objects (e. g., grows). This metalanguage also contains predicates referring to relations between expressions of the object language and the entities referred to by them (e. g., “designates”, “denotes”, “satisfies”) as well as, finally, rules defining these relations, i. e., semantic rules such as “The designatum of term T in meaning M is such and only such an object O about which T may be truthfully stated”. ⫺ Lastly, the pragmatic metalanguage 1 comprises the previous metalanguage ⫺ the semantic one and hence also the syntactic one ⫺ as well as names of users of expressions of the consid-
635 ered object language (e. g., “interpreter”), predicates referring to relations between these users and these expressions and vice versa (e. g., “accepts as true”), and rules (e. g., “Out of two contradictory sentences only one may be accepted as true”). The syntactic, semantic and pragmatic metalanguages2 as well as metalanguages of still higher levels are described analogously. Semiotics2, that is to say the hierarchical structure composed of semiotics2.1, its metasemiotics (i. e., semiotics2.2) and possibly of metasemiotics of higher levels is called “theoretical semiotics” and defined as a science of semiosis or science of signs, sign systems and sign processes (cf. Art. 1 § 1.2., Art. 2 § 2. and Art. 3 § 2.1.). Distinguished within theoretical semiotics are pure semiotics and descriptive semiotics (Morris 1938 ⫽ 1971: 23 ff; cf. also Carnap 1942: 11 ff and 1963: 861). The former “could be presented as a deductive system with undefined terms and primitive sentences which allow the deduction of other sentences or theorems”, and its branches would be pure syntactics, pure semantics, and pure pragmatics. Descriptive semiotics on the other hand is the application of the metalanguage in discussions of concrete instances of sign situations (cf. Art. 28 § 4.). According to a slightly modified view (Morris 1946 ⫽ 1971: 303), the distinction between pure and descriptive semiotics “marks the difference between the formative discourse of semiotic and its designative discourse, that is, the difference between semiotic as logic and semiotic as scientific discourse”. In pure semiotics we would have statements such as “Every sign has an interpretant”, while in descriptive semiotics there would be statements telling us, e. g., what a sign means to a given person, how signs are combined together in some specific language, or what their origins, uses and effects are. This distinction is also valid for syntactics, semantics and pragmatics. 2.3. Methods of semiotic study By semiotics is often meant one of the semiotic methods or some sets of these methods (cf. Art. 28 § 1.⫺3.). Among their number are the method of interpretation, the method of linguistic analysis, or the method of formalization. The first of these methods consists in assigning a meaning sensu largo to some object, property, event or phenomenon which, thanks to this operation, occur in the role of
636 signs even if they were not originally intended as such. Subject to occasional interpretation are thus natural phenomena (e. g., the eclipse of the sun) as well as cultural activities and products (such as burial ceremonies, or the interior decoration of a house). Phenomena subject to constant interpretation include expressions of ethnic languages and all elements of semiotic systems, e. g., maps or portraits. Interpretation is thus among the methods of language analysis which also includes, inter alia, the procedures of traditional philology: hermeneutics in the original sense of the word, i. e., establishing the correct form of the text, and exegesis, or providing this text with a commentary. Since as early as Antiquity the studies were not confined to verbal language and verbal speech alone, but also extended to the language of thought and the speech of thought as well as to the relation between lingua verbalis and lingua mentalis, and the relation of each of these two to reality, the method of language analysis and the method of interpretation drew closer together and partly merged, finding a common area of applications. The third semiotic method ⫺ formalization ⫺ stems from the analysis of language, both verbal and mental. This method focuses on the sign’s structure, disregarding its semantic and pragmatic functions, and considers it only with respect to its shape, particularly its graphic shape. This facilitates the discovery of structural analogy ⫺ e. g., isomorphism or homomorphism ⫺ between the thought, its verbal formulation, and the fragment of reality corresponding both to the thought and the sentence. All methods of language analysis ⫺ both the grammatical and the stylistic, rhetorical and versificational one, and the method of formalization ⫺ are semiotic methods. They are often called “semiotics”, but in a meaning different from those discussed so far. For the sake of distinction we will use the term “semiotics3”. One must not forget however the rather unstable interpretation of this name. Sometimes in describing a semiotic method as semiotics one has in mind the relevant concrete activities, sometimes the way of their execution, and sometimes their product; sadly, one often fails to realize that altogether different things are involved here. As we see, semiotics3 contains research procedures typical for the humanities (e. g., stylistic analysis) alongside those widely used in mathematics and symbolic logic, namely the methods of formalization. The various kinds of semiotics3, i. e., the various kinds of
IV. Methoden der Semiotik
semiotic methods and research procedures, should also be included in sciences differing in other aspects of methodology. 2.4. Applied semiotics “Semiotics4” is applied semiotics, e. g., semiotics of culture, sociosemiotics, praxiosemiotics, psychosemiotics or zoosemiotics. To each of these disciplines applies the remark by Morris (1946 ⫽ 1971: 303) that “the application of semiotic as an instrument may be called ‘applied semiotic’ ”. In saying that semiotics is sometimes used as a tool, one has in mind primarily semiotic methods, that is semiotics3. Each semiotics4 is thus the result of a systematic application of semiotics3 to some complex of objects, events and phenomena comprising a certain whole, e. g., a branch of art or knowledge, or a scientific discipline (cf. Art. 28 § 4.). By saying that “applied semiotic utilizes knowledge about signs for the accomplishment of various purposes” (Morris 1946 ⫽ 1971: 366) one may also have in mind not only semiotic methods but also definitions and statements contained in semiotics2, or theoretical semiotics, which then becomes a common basis for various semiotics4. In addition to that, each of the individual semiotics4 has its own theoretical foundations. And since some of the applied semiotics are humanistic disciplines (e. g., semiotics of theater), others are social sciences (e. g., sociosemiotics), still others natural (e. g., zoosemiotics) or formal sciences (e. g., the study of deductive formalized systems), their theories too differ as regards methodology (cf. Art. 1 § 1.). The outlined differentiation of the meaning of the word “semiotics” encourages the conclusion that any discussion of theory in semiotics must be preceded by a decision as to which meaning of “semiotics” we opt for, and also the conclusion that in each of the distinguished varieties there may occur further differences of a methodological nature. In some cases we are dealing with theories of a logical-mathematical type, in others with empirical theories which may in turn be of different kinds in the human and the natural sciences.
3. 3.1.
Semiotic theories
Syntactic versus pragmatic understanding of semiotic terms 3.1.1. Syntactic understanding In discussing the concept of theory we used terms such as “sentence”, “sentence asserted or accepted as true”, “axiom”, “theorem”,
30. Theory formation in semiotics
“consequence”, “relation of consequence”, “rule of transformation”, “proof”, “deductive system”, “axiomatic system”, etc. Each of these terms may be defined in two ways: either primarily from the point of view of syntactics with semantics coming second in certain instances, or primarily from the point of view of pragmatics; in this latter case, given that the pragmatic metalanguage contains semantic and syntactic metalanguages, the syntactic and semantic properties of the considered notions must be implicitly taken into account (cf. Art. 2 § 2.). Thus “sentence” defined in syntactic terms is an inscription shaped according to the rules for the formation of expressions. From the syntactic-semantic viewpoint, an asserted sentence is a sentence being a direct or indirect consequence of an empty class of sentences. The relation of consequence holds, from this same point of view, with respect to certain rules of transformation, with the given sentence being a consequence not of another sentence but of a class of sentences which do not necessarily have to be true; the reason why these sentences are not required to be true is that derivability according to the rules of transformation, understood syntactically, occurs between sentences exclusively with regard to their external form. An axiom is, from this viewpoint, an immediate consequence of an empty class of sentences. Hence a theorem is an asserted sentence that is not an axiom but a consequence of axioms. Proof in this syntactic approach is a sequence of sentences which are consequences of axioms. The notion of “deductive axiomatic system” is defined from the syntactic viewpoint as the totality of sentences which according to the rules of transformation are consequences of an empty class of sentences, and from the semantic viewpoint as a system satisfied by a model. This structural ⫺ mainly syntactic and to a lesser extent semantic ⫺ understanding turns the considered notions into abstract theoretical constructs; it belongs to formal logic and mathematics. 3.1.2. Pragmatic understanding From the pragmatic viewpoint, i. e., when users of expressions are taken into account (cf. Art. 4 § 2.), the terms listed above occur with different meanings. For example a “sentence” ⫺ in either this or that verbal formulation ⫺ is defined as expressing wishes, desires or other so-called propositional or, putting it more widely, pragmatical attitudes of the
637 sender. In this approach one should not speak of an asserted sentence but rather of a sentence accepted by X at time t as true, with this acceptance conditioned not by rules of transformation but resulting from the knowledge of X and the objective of his action, and also requiring a justification based on the norms of efficiency of this action. This explains the following terminological difference: the asserted (accepted) sentences which are called “theorems” in the deductive sciences are often described as “statements” in the natural and humanistic sciences. The pragmatic concept of “consequence” also differs from the syntactic one: if X asserts that sentence B is a consequence of sentence A, then X simultaneously expresses his conviction that the truth of A implies the truth of B. Accordingly, the definition of an “axiomatic system” also refers to the convictions of the system’s user, requiring not only that the system be a totality of sentences that are consequences of an empty class of sentences obtained in keeping with the rules of their transformation, but also that these rules always lead from true sentences to true sentences, and that the person using them, formulating axioms and deductively deriving theorems from them, be equally convinced of the truth of sentence A and of the truth of sentence B obtained in their virtue. This pragmatic approach to the notions discussed here is connected with a reconstruction of scientific procedures as ones based on the activity of explaining phenomena in the natural sciences, and on the process of understanding phenomena in the humanistic disciplines (Ajdukiewicz 1974: 185 ff and 1978: 282 ff). 3.2. Syntactic versus pragmatic notions of theory In descriptions of a theory as a structure composed of a language, theorems, proofs and a scope, the syntactic aspect of theory is considered foremost, with the semantic aspect relegated to a secondary position. In most of the notions of semiotics distinguished here, however, the pragmatic properties of theory are pushed to the forefront. The question thus arises whether the approach to the notion of theory that belongs to metalogic and metamathematics, and especially the treatment of a nonmathematical theory as if it were an applied mathematical theory, is in fact the most useful one in the methodology of semiotics, even if this approach were to be a correct logical reconstruction of the
638 theory’s formal character. This worry does not of course apply to such deductive and at the same time axiomatic semiotic systems as logical calculi since in their case the application of mathematical tools of analysis comes naturally. It is true that a certain deductive system is assumed in every science: formal logic is assumed in all, and in some cases (e. g., in physics) also mathematics; hence to every discipline there apply indirectly metalogical studies as ones directly concerning deductive systems. This no doubt very important common feature aside, there are so many fundamental methodological differences among the sciences that it comes as no surprise that, at the present stage of the development of science, the abstract formal scheme of a theory pertains only to a certain idealization of physics ⫺ so-called mathematical physics. One of these differences occurs between the ways of introducing derived theorems in sciences belonging to different methodological types. In deductive axiomatic systems the procedure is twofold: (a) we first accept axioms, and then derive from them by deduction statements which we also accept; alternatively (b) either we only change axioms, neither accepting nor rejecting them, and then derive from them by deduction ⫺ but not infer by deduction ⫺ theorems which we also neither accept nor reject. In reductive axiomatic systems, on the other hand, we give the data from observations or experiments the form of sentences which we treat as premisses, and through induction we obtain from them empirical generalizations from which, as from consequences, we arrive through reductive inference at their reason, namely universal theoretical laws of science; the latter become axioms of the system, while its statements are less universal theoretical laws and empirical generalizations (cf. Ajdukiewicz 1978: 289). Methodologists of science, philosophers of science, and specialists in the individual branches of science generally agree that in no science ⫺ except for deductive axiomatic systems ⫺ does one find theories that would be embodiments of the formal scheme peculiar to a mathematical or logical theory. It would also be hard to indicate a scheme shared by all the so-called empirical theories. 3.3. The abstract sign model of an empirical theory The name “empirical theory” encompasses theories within sciences as methodologically different as physics, the social sciences and
IV. Methoden der Semiotik
history. The theories of these sciences no doubt share important elements which were already mentioned: (a) the empirical character of statements, evident in the presence of terms which are perceptual or observational to a relatively high degree and useful in descriptions of the so called “empirical procedures” employed in these sciences (observation, experiment, measurement); and (b) the use in these sciences of inferences by reduction, inferences by induction by incomplete enumeration and inference by analogy. At the same time, however, there are many significant methodological differences between the natural sciences, the social sciences and humanistic history-type sciences, and because of this the abstract sign model of an empirical theory equally applicable to all these sciences could not contain important peculiarities of theories in the natural sciences as opposed to, say, sociological theories on the one hand and historical ones on the other. 3.4. A theory characteristic of a discipline versus a theory occurring within that discipline When considering methodological differences between theories in sciences belonging to different methodological types, it is worthwhile to make the distinction between (a) a theory peculiar to a given discipline or set of disciplines, and (b) a theory occurring in the given discipline or set of disciplines (cf. Art. 123 § 3.). Although a theory of type (a) always belongs to the class of theories of type (b), not every theory of type (b) is an instance of a theory of type (a). Whether or not a theory T is a theory characteristic of discipline D 1 ⫺ e. g., whether it is a semiotic, ethnographic or histological theory ⫺ depends on the kind of interpretation of the expressions of the theory’s language, and hence on the domain and scope of this theory. A given science may contain theories characteristic of this science, peculiar only to it, together with theories characteristic of sciences other than the one in which they are present; for example in history, theories that are uniquely historical occur side by side with economic or praxiological theories or fragments thereof. As regards theories characteristic of a given science and peculiar to it, they can, but need not, belong to the same methodological type as this science. The methodological type of a theory is seen to conform to various degrees to the methodological type of the science in which this theory occurs. A more
30. Theory formation in semiotics
general theory is apparently less conformable than a theory expounding the details of the former. For example, a theory of semantic functions of nominal expressions of a given ethnic language may be formulated on the basis of set theory; the former theory (i. e., that of semantic functions) is usually of the same methodological type as the discipline to which it belongs (i. e., descriptive semantics of the given language), and they are thus both of empirical and historical character. At the same time, the set theory which forms the basis for the less abstract semantic theory may be, and in fact is, a deductive theory and accordingly belongs to a different methodological type than the descriptive semantics of some ethnic language. So-called pure semiotics differs with regard to methodological type from descriptive semiotics: the former occurs as a theory in a discipline called “theoretical semiotics”, while the latter, which is based on pure semiotics, may be found, inter alia, in various applied semiotics with which it is usually highly compatible as regards methodology. 3.5. Methodological types of semiotic theories Semiotic theories belong to various methodological types. For example, zoosemiotic theories are mainly natural-scientific in character; sociosemiotic theories are to a great extent characterized by features typical of theories in the social sciences; certain linguistic theories or theories peculiar to the semiotics of art are by nature chiefly historical. Some semiotic theories may be placed at the intersection of these three fields; for example, certain psychosemiotic theories, containing physiological, sociological as well as linguistic elements, feature aspects of natural-science theories as well as of theories in the social and historical sciences. Finally, theories of deductive systems belong to theories of a priori sciences. Accordingly, when considering semiotic theories one should take into account all the aforementioned types of theories, and not remain content with an abstract scheme of empirical theory or with the still more abstract general pattern of theory (but cf. Art. 28 § 5. and 6.). When we construct a notion of semiotic theory wishing to go beyond a very general idealization, we try to keep an eye on the most important methodological differences between these theory types. To do this, we must be aware of the most important differences between the
639 methodological types of sciences in which the various types of theory are included. It is to be expected that a semiotic theory of, say, historical type will share certain important methodological features with nonsemiotic theories of this same type, and at the same time ⫺ just like these nonsemiotic theories ⫺ it will significantly differ methodologically from theories of another type (e. g., the natural science one), both semiotic and nonsemiotic, both occurring in semiotics and found outside semiotics. Semiotic theories are usually formulated in a natural language, and only in exceptional cases do they have the form of axiomatized systems: deductive in logic, and reductive in those branches of semiotics characterized by a methodological nature peculiar to the empirical sciences (including the natural sciences, among others). In the majority of cases, however, semiotic theories are unaxiomatized and unformalized, in the form of a set of sentences. Some of these sentences are accepted by the researcher as true on the basis of his own intuition, supported by his own experience and opinions circulating among scholars of the same or a related specialized field. The scholar treats these sentences as primitive statements of the theory, and from them he will be deriving, often intuitively, statements which he feels follow from the former. The primitive terms he introduces are expressions he understands without definition, and which are used in the same or similar meaning by other scholars. Relying on these terms he constructs the vocabulary of his theory, often availing himself of regulating definitions, expanding this vocabulary as the need arises during the development of the theory. In a similar manner he multiplies his derived statements and statements derived from the latter intuitively. As we see, obviousness and intuition accompany the construction of unformalized and unaxiomatized semiotic theories; in fact, intuition also guides scholars constructing axiomatized semiotic theories. The authors of both the unaxiomatized and the rare axiomatized theories make use of statements of other sciences (such as linguistics, psychology, sociology, acoustics or optics) as premisses of semiotic theories, and also employ terms of other sciences in constructing definitions of semiotic terms. The existing semiotic theories are usually marked by this kind of free, fragmentary and intuitive character, typical of numerous theo-
640 ries in the humanistic sciences, both social and (particularly) historical. Therefore, an analysis of a semiotic theory confined to its logical reconstruction, that is to say to the construction of a formalized system meant to reflect the logical structure of this theory, does not do the issue justice, since at times an analysis of this type strays too far from the analyzed theory. To restrict oneself to this job would be to imitate the man who lost his keys in a dark alleyway and went looking for them in an alleyway with a streetlight, since he only stood a chance of finding his lost property in an illuminated place. This analogy is only partly accurate, however. Logical reconstruction is no doubt useful, serving to demonstrate logical relationships and adding precision to the concepts used in the given theory; moreover, it serves to improve the reasoning performed in it. Besides this reconstruction, however, one has to carry out a semantic analysis of the terms used by the theory, and uncover the differences between the various methodological types of semiotic theory. What must be avoided is the use of mathematical and formalized language with the sole purpose of creating semblances of a scientific character of discourse. Having at our disposal a general abstract and schematic sign model of the theory on the one hand, and a characteristic of each of these types on the other, we are in a position to fathom the distance that separates a concrete semiotic theory from its ideal pattern, and to recognize the most important differences between a semiotic theory of the historical type and a semiotic theory of the sociological, the natural-science or, finally, the mathematical or logical type. 3.6. Typical features of a semiotic theory Keeping in mind the distinction made between a theory characteristic of a given discipline and a theory occurring in a given discipline (cf. § 3.4.), we must note that in theoretical semiotics we usually deal with theories characteristic of semiotics, whereas in applied semiotics we have in most cases theories characteristic of a given domain of application (cf. Art. 123 § 3.). Thus, if one wishes to examine typical properties of semiotic theories, the more useful field of observation is theoretical semiotics. A review of semiotic theories within theoretical semiotics prompts the conclusion that relatively few features characteristic of these theories can be indicated, if we have in mind features belonging
IV. Methoden der Semiotik
to all these theories and only to them. It would be easier to enumerate properties shared by all semiotic theories but exhibited also by nonsemiotic theories. It would be easier still to list typical features of semiotic theories, i. e., features which belong to most of them in a given respect. Strictly speaking, we are not looking here at a theory characteristic of theoretical semiotics, but rather at typical features of a semiotic theory belonging to theoretical semiotics. The most prominent such feature is the semiotic interpretation of terms. These are to a greater or lesser extent theoretical in character. Some of them, such as the word “sign”, are semiotic by their very nature (cf. Art. 2, 3 and 4). Others are to be found also outside semiotics, but on the grounds of semiotic theory they were endowed with a semiotic status; examples here are words like “sender”, “receiver”, “pragmatics”, “communication” and “association”. Also relatively frequent in semiotic theories are linguistic terms (such as “language”, “word”, “phrase”), as well as psychological (e. g., “thought”, “idea”, “perception”), philosophical (e. g., “cognition”, “truth”), logical (e. g., “set”, “class”, “relation”, “variable”) and praxiological ones (e. g., “behavior”, “action”). The meaning of terms in a given theory normally depends to a high degree on this theory’s context. Semiotic theories are usually formulated in natural language, suitably expanded and modified through the introduction of the terminology mentioned above. A semiotic theory consists of sentences, ordered in a way that makes them a description of its object, and sometimes also an explanation of the described events or phenomena. Although admittedly the author of a theory does not know whether some of the sentences are true, and usually is not aware of any of them being false, he believes that each one of them is either true or at least plausible to a satisfactory degree and at the same time significant, and that their set is an integrated whole suited to explaining the considered issues. The theory usually contains definitions of terms or at least their explications of some other kind (Achinstein 1968: 122⫺148). Semiotic theories usually attempt to answer questions such as “What is a sign?”. “What does semiosis consist in?”, and to arrive at classifications and typologies of signs and communication processes (cf. Art. 1 § 1. and 2.). They sometimes resort to stimulative
30. Theory formation in semiotics
definitions or normative sentences, and generally to regulating definitions. By referring to descriptions and analyses of examples taken from a selected ethnic language and to introspective and retrospective reconstructions of individual experiences connected with the interpretation of signs, they show themselves to be related to historical or psychological theories. They often try to convey an intuitive understanding of social behaviors such as communication, as well as of actions such as using linguistic means to affect attitudes and actions of listeners and readers ⫺ in this being similar to theories in the social sciences. Semiotic theories are often dynamic in character, examples here being Peirce’s theory of semiosis, Morris’ theory of signs, or Wittgenstein’s so called “second” philosophy of language. The understanding of theories of this kind is arrived at during their use. The semiotic theory, being empirical and humanistic, is usually closely connected to its author’s world view. In its semantic part it contains ontological commitments, and in its pragmatic part gnosiological assumptions. Moreover, its author is sometimes motivated by ideology, his own expectations and objectives (Toulmin 1953: 83⫺85, 144⫺148 and 1961: ch. V⫺VI). The dependences work both ways however. The manner in which we perceive the world is in part a function of the meaning we attach to terms in the context of a given theory that constitutes a certain pattern of conceptual organization. Since in science we formulate every observation using words, the observed object becomes for us a designatum of the appropriate term in a theory (Hanson 1958: 37⫺65, Suppe 1974: 153⫺ 166). This two-way influencing becomes apparent when we compare referential and mentalistic theories. Semiotic theories have the character of hypothetical descriptions of phenomena invented by us, and although, as Popper (1965: 103⫺119) claims, they are unverifiable, they may nevertheless be subjected to falsification, a procedure indicating just where the given theory departs from reality. Theories may be treated as our way of seeing the world, and hence this world is our own creation, since we endow it with features according to our own ideas in an effort to create order in our surroundings. In spite of this, however, we are able to approach objective reality by devising alternative theories of this reality, by
641 analyzing and comparing them with one another (Feyerabend 1962: 29). Semiotic theories usually claim that there is a close connection between cognition and communication, sometimes going as far as to say that perception and communication are inseparably bound into a whole and are not activities occurring in succession, with the perception of something preceding the communication of that which was perceived. The act of perception is brought about by the intention to communicate, with this intention shaping an act which is moreover accompanied by the awareness of all that reached us in the past in the form of messages. It is only during communication that we attain a profound understanding of the observed object, i. e., we uncover the meaning of that which is being observed (Bohm 1965: appendix). Observations, meanings and facts are theoryladen (Suppe 1974: 191), and because of this changes in a theory ⫺ some of them at least ⫺ lead to changes of meaning of the terms occurring in it. Regardless of whether we view a semiotic theory as an ordered set of statements or as a set of extralinguistic entities corresponding to these statements, its adequate understanding requires the analysis of the linguistic formulations that combine to form its text. Semiotic theories differ substantially as regards methodology, and accordingly it is hard to firmly decide whether the traditional scheme of theory (the axiomatic one in particular) is in their case applicable or useless. This depends on what the given semiotic theory is a fragment of. If it belongs to a discipline whose theoretical concepts are based on firm observational foundations and connected with a network of formal relations, then the view that a theory is a logical structure of the relevant fragment of reality seems justified. This does not have to be ⫺ and indeed rarely is ⫺ a formalized, and especially axiomatized, variety of this structure. More often semiotic theories are different in character, and their aim may for example be a classification or typology of the studied objects. If a semiotic theory has the tasks of explaining the nature of the relationship between the sign and that of which it is a sign, and also the nature of the correspondence rule, an important and sensitive issue is the definition of the relationship between theoretical terms and statements of semiotics on the one hand and the empirical equivalents
642
IV. Methoden der Semiotik
thereof on the other. Differences in opinion must be tolerated here if they arise out of differences in the areas under consideration. Alongside fragments of theoretical semiotics which are logical systems we encounter also others in which the relations between concepts and statements are not as rigorous. With reference to semiotic theories it usually seems more rational to treat the concept of logical structure not as a logical calculus or algorithm, but as a certain standard to which a semiotic theory should aspire, applying the rational directives contained in it: defining concepts, reasoning correctly, etc. Of these rational directives one should mention the following: Do not limit yourself to analyses of a static logical structure in a given theory, but investigate activities connected with the introduction and perfection of its concepts, with advancing and verifying hypotheses, and with formulating conclusions (Toulmin 1972: 600⫺614). A semiotic theory is not ⫺ and does not have to be ⫺ similar to the abstract ideal of a theory of mathematical physics. It does not have to be a calculus, it does not have to be a formalized calculus, it should not be formalized for the sake of ornamentation, it does not have to contain exact laws of science or predictions ⫺ but despite all this it can be a useful tool in describing and explaining semiotic facts.
4.
Selected references
Achinstein, Peter (1968), Concepts of Science. A Philosophical Analysis. Baltimore. Ajdukiewicz, Kazimierz (1974), Pragmatic Logic. Translated from Polish by O. Wojtasiewicz. Dordrecht and Boston: Reidel, and Warsaw: PWN ⫺ Polish Scientific Publishers. Ajdukiewicz, Kazimierz (1978), The Scientific World Perspective and Other Essays 1931⫺1963. Ed. and introduced by J. Giedymin. Dordrecht and Boston. Ajdukiewicz, Kazimierz (1979), “Proposition as the Connotation of Sentence”. In: Jerzy Pelc (ed.), Semiotics in Poland 1894⫺1969. Dordrecht and Boston: Reidel, and Warsaw: PWN ⫺ Polish Scientific Publishers: 81⫺95. Balzer, Wolfgang, and C. M. Dawes (1986), “Structure and Comparison of Genetic Theories. (1) Classical Genetics”. British Journal of Philosophy of Science 37: 55⫺69. (2) “The Reduction of Character-Factor Genetics to Molecular Genetics”. British Journal of Philosophy of Science 37: 177⫺ 191.
Balzer, Wolfgang and Heide Göttner (1983), “A Theory of Literature Reconstructed: Roman Jakobson”. Poetics 12: 489⫺510. Balzer, Wolfgang, Carlos Ulises Moulines and Joseph D. Sneed (1987), An Architectonic for Science. The Structuralist Program. Dordrecht and Boston. Beth, Evert W. (1948⫺49), “Analyse se´mantique des the´ories physiques”. Synthese 7: 206⫺207. Beth, Evert W. (1960), “Semantics of Physical Theories”. Synthese 12: 172⫺175. Bohm, David (1965), The Special Theory of Relativity. Heidelberg and New York (Lecture Notes and Supplements in Physics). Carnap, Rudolf (1936⫺37), “Testability and Meaning”. Philosophy of Science 3: 419⫺471 and Philosophy of Science 4: 1⫺40. Carnap, Rudolf (1942), Introduction to Semantics. Cambridge MA. Carnap, Rudolf (1956), “The Methodological Character of Theoretical Concepts”. In: Herbert Feigl and Michael Scriven (eds.), The Foundations of Science and the Concepts of Psychology and Psychoanalysis. Minneapolis: 38⫺76 (Minnesota Studies in the Philosophy of Science 1). Carnap, Rudolf (1958), “Beobachtungssprache und theoretische Sprache”. Dialectica 12: 236⫺248. Carnap, Rudolf (1963), “Carl G. Hempel on Scientific Theories”. In: Paul A. Schilpp (ed.), The Philosophy of Rudolf Carnap. La Salle IL: 958⫺966. Diederich, Werner, Andoni Ibarra and Thomas Mormann (1989), “Bibliography of Structuralism”. Erkenntnis 30: 387⫺407. Diederich, Werner, Andoni Ibarra and Thomas Mormann (1994), “Bibliography of Structuralism II: 1989⫺1994 and Additions”. Erkenntnis 41: 403⫺418. Fraassen, Bas C. van (1970), “On the Extension of Beth’s Semantics of Physical Theories”. Philosophy of Science 37: 325⫺339. Feyerabend, Paul K. (1962), “Explanation, Reduction and Empiricism”. In: Herbert Feigl and G. Maxwell (eds.), Minnesota Studies in the Philosophy of Science. Vol. 3: Scientific Explanation, Space and Time. Minneapolis: 28⫺97. Goodman, Nelson (1947), “The Problem of Counterfactual Conditionals”. The Journal of Philosophy 44: 113⫺128. Hanson, Norwood R. (1958), Patterns of Discovery. Cambridge, England. Hempel, Carl G. (1958), “The Theoretician’s Dilemma”. In: Herbert Feigl and Michael Scriven (eds.), Concepts, Theories and the Mind-Body Problem. Minneapolis: 37⫺98 (Minnesota Studies in the Philosophy of Science 2). Hempel, Carl G. and Paul Oppenheim (1948), “Studies in the Logic of Explanation”. Philosophy of Science 15: 135⫺175. Reprinted in: Carl
30. Theory formation in semiotics G. Hempel, Aspects of Scientific Explanation, and Other Essays in the Philosophy of Science. New York: 245⫺290. Hesse, Mary (1966), Models and Analogy in Science. Notre Dame IN. Hesse, Mary (1967 a), “Laws and Theories”. In: Paul Edwards (ed.), The Encyclopedia of Philosophy. New York and London. Vol. 4: 404⫺410. Hesse, Mary (1967 b), “Models and Analogy in Science”. In: Paul Edwards (ed.), The Encyclopedia of Philosophy. New York and London. Vol. 5: 354⫺ 359. Kuhn, Thomas S. (1962), The Structure of Scientific Revolutions. Chicago: The Chicago University Press (First edition published as an issue of: Foundations of the Unity of Science. Toward an International Encyclopedia of Unified Science. Vol. II. Ed. Otto Neurath, Rudolf Carnap, Charles Morris). Ludwig, Günther (1978), Die Grundstrukturen einer physikalischen Theorie. Berlin and New York. Morris, Charles W. (1971), Writings on the General Theory of Signs. The Hague. Nagel, Ernest (1961), The Structure of Science: Problems in the Logic of Scientific Explanation. New York. Niiniluoto, Ilkka and Raimo Tuomela (1973), Theoretical Concepts and Hypothetico-Inductive Inference. Dordrecht. Popper, Karl R. (1965), Conjectures and Refutations. 2nd edition, revised and enlarged. London. Przełe˛cki, Marian (1969), The Logic of Empirical Theories. London (Monographs in Modern Logic). Przełe˛cki, Marian (1974), “A Set Theoretic versus a Model Theoretic Approach to the Logical Structure of Physical Theories”. With comments by R. Wo´jcicki, J. Misiek and E. Skarz˙yn´ski. Studia Logica 33: 91⫺105 and 105⫺112 (comments). Przełe˛cki, Marian (1976), “Interpretation of Theoretical Terms: In Defence of an Empiricist Dogma”. In: Marian Przełe˛cki, Klemens Szaniawski and Ryszard Wo´jcicki (eds.), Formal Methods in the Methodology of Empirical Sciences. Proceedings of the Conference for Formal Methods in the Methodology of Empirical Sciences, Warsaw, June 17⫺21, 1974. Dordrecht: 158⫺169. Przełe˛cki, Marian and Ryszard Wo´jcicki (1969), “The Problem of Analyticity”. Synthese 19: 49⫺74. Scheibe, Erhard (1979), “On the Structure of Physical Theories”. In: Ilkka Niiniluoto and Raimo Tuomela (eds.), The Logic and Epistemology of Scientific Change. Amsterdam: 169⫺188 (⫽ Acta Philosophica Fennica 30). Scheibe, Erhard (1983), “Ein Vergleich der Theoriebegriffe von Sneed und Ludwig”. In: Paul Weingartner and Johannes Czermak (eds.), Erkenntnisund Wissenschaftstheorie. Epistemology and Philos-
643 ophy of Science. Akten des 7. Internationalen Wittgenstein-Symposiums, 22. bis 29. August 1982. Kirchberg am Wechsel (Österreich). Vienna: 371⫺ 383. Sneed, Joseph D. (1977), The Logical Structure of Mathematical Physics. Dordrecht. Stegmüller, Wolfgang (1970), Probleme und Resultate der Wissenschaftstheorie und Analytischen Philosophie. Vol. 2: Theorie und Erfahrung. Part 1: Begriffsformen, empirische Signifikanz und theoretische Begriffe. Berlin and New York. Stegmüller, Wolfgang (1973), Probleme und Resultate der Wissenschaftstheorie und Analytischen Philosophie. Vol. 2: Theorie und Erfahrung. Part 2: Theorienstruktur und Theoriendynamik. Berlin and New York. ⫺ English translation by W. Wohlhutter: The Structure and Dynamics of Theories. New York 1976. Stegmüller, Wolfgang (1979), The Structuralist View of Theories. A Possible Analogue of the Bourbaki Programme in Physical Science. Berlin and New York. Stegmüller, Wolfgang (1986), Probleme und Resultate der Wissenschaftstheorie und Analytischen Philosophie. Vol. 2: Theorie und Erfahrung. Part 3: Die Entwicklung des neuen Strukturalismus seit 1973. Berlin and New York. Suppe, Frederick Roy (ed.) (1974), The Structure of Scientific Theories. Urbana IL. Suppes, Patrick (1957), Introduction to Logic. New York. Toulmin, Stephen (1953), The Philosophy of Science. London. Toulmin, Stephen (1961), Foresight and Understanding. London. Toulmin, Stephen (1972), Human Understanding. Vol. 1. Oxford. Tuomela, Raimo (1973), Theoretical Concepts. Vienna and New York (Library of Exact Philosophy 10). Wo´jcicki, Ryszard (1974 a), “The Semantic Conception of Truth in the Methodology of Empirical Sciences”. Dialectic and Humanism 1: 103⫺116. Wo´jcicki, Ryszard (1974 b), “Set Theoretic Representation of Empirical Phenomena”. Journal of Philosophical Logic 3: 337⫺343. Wo´jcicki, Ryszard (1975), “The Factual Content of Empirical Theories”. In: Jaakko Hintikka (ed.), Rudolf Carnap, Logical Empiricist: Materials and Perspectives. Dordrecht: 55⫺82. Wo´jcicki, Ryszard (1979), Topics in the Formal Methodology of Empirical Sciences. Dordrecht. Wright, Georg Henrik von (1971), Explanation and Understanding. London.
Jerzy Pelc, Warsaw (Poland)
644
IV. Methoden der Semiotik
31. Understanding, explanation, and action as problems of semiotics 1. Understanding 1.1. Idiographism and culture sciences: structure, sense, and value 1.2. Explanation in history: practical syllogisms and objectives 1.3. Reasons versus causes of action: determinism versus free will 1.4. Genetical explanation 1.5. Historical description 1.6. Interpretation versus explanation 2. Explanation 2.1. Explanation of behavior and prediction of social phenomena 2.2. Explication 2.3. Function and functional analysis 2.4. The relationship between whole and part, holism and individualism 2.5. System and systems analysis 2.6. Type, typological concept, and typology 2.7. Index and indicator 2.8. Understanding in the social sciences 2.9. Measurement 3. Action 3.1. Activity, action, and behavior 3.2. Efficient action 3.3. Theories dealing with action 3.4. Acting in the social sciences 3.5. Communication and communication studies 4. Selected references
Within the realm of sciences, the distinct nature of the human sciences was opposed to that of the natural sciences in Dilthey’s (1833⫺1911), Windelband’s (1848⫺1915), and Rickert’s (1863⫺1936), writings of the last quarter of the 19th century, and in Spranger’s (1882⫺1963) works of the first quarter of the 20th century. According to all these authors, the prototypical humanities are the historical disciplines, and they all deal with human activities. Accordingly, the following methodological features are ascribed to them. The object of cognition in these sciences is psycho-physical historicalsocial reality, and it includes facts of awareness in addition to external events. As Dilthey believed, the former may be perceived only by means of a peculiar inner experience or inner perception, namely understanding, which consists in a projection of the self onto a studied person or an artifact created by that person. In order to understand another person’s psychic life expressed in gestures, in verbal utterances, in lasting mental creations such as scientific or literary works, or, finally, in objectifications of minds such
as social structures or institutions, one has to personally relive what the studied people lived through. Such an imitatory experiencing of psychic states of another person requires an inner affinity and sympathy towards this other person. Thanks to an imaginative presentiment of the milieu and situations in which the originator or participant of the studied historical events acts and based on this person’s deeds and influences on others, we begin to share his experiences by means of empathy and intuition and, by this roundabout way we arrive at their understanding. Likewise, we gain knowledge about ourselves only through actions expressive of us, namely by transferring onto these actions our own lived experience. Humanistic studies are based on the relation between experience, the expression thereof, and the understanding thereof, and within this relation that which is singular and individual is connected with universal regularities. This combination is externalized in historical narrative as an aggregation of statements of facts, judgments of value, and statements of structural regularities; the two latter kinds of statements lead to formulations of purposes of actions. Thanks to understanding we arrive at the ultimate elements of the studied object and then ⫺ through a synthesis of sensual stimuli ⫺ at the object’s unity. Understanding in the humanities corresponds to explanation in natural science, differing from the latter, according to Dilthey, in that it leads to descriptions of psychic wholes; explanation, on the other hand, would require the adoption of an atomistic conception of psychic life. Understanding concerns experience data and is a method of obtaining singular sentences, while explanation refers to phenomena, suppositions and a reasoning consisting in attaching other sentences to a singular sentence. Finally, understanding is largely emotional whereas explanation is intellectual in character. In what follows, various views of the concepts of understanding and of explanation in the human sciences are discussed and then contrasted with the concepts of understanding and of explanation in the social sciences. This discussion is presented with a view on how the human and social sciences take account of human sign use in actions constitutive of human society.
31. Understanding, explanation, and action
1.
Understanding
1.1. Idiographism and culture sciences: structure, sense, and value In later times additions were made to the preceding list of methodological features of the humanities, with some of them also being replaced by others. For example Windelband emphasized the unique character of historical events as opposed to the general character of natural events, and accordingly contrasted history and the natural sciences methodologically, the former as idiographic and the latter as nomothetic. He also pointed out that in humanistic disciplines we must know the values and purposes embraced by the actors in the actions; in other words we must understand the “sense” they attach to the individual things. In his turn Rickert, believing that sciences differ as to object and (mainly) method, introduced two overlapping divisions: into the individualizing as opposed to the generalizing, and into culture sciences (“Kulturwissenschaften”) as opposed to nature sciences (“Naturwissenschaften”). In the category of culture sciences he classified history as individualizing and sociology as generalizing. The study of reality assumes a natural character when reality is considered from the angle of the general; when it is considered with regard to that which is unique, detailed and possessing value ⫺ it becomes historical. For Spranger the object of the humanities is the universe of the spirit: nonmaterial but also nonpsychic; nonindividual, objective, lasting and shared by all people. Initially he was of the opinion that we understand the psychic universe, i. e., the universe of the soul, only through this universe of the spirit; namely, we come to realize that the content of another person’s experiences is the same as ours, since the same ideal content ⫺ or sense, as Spranger puts it ⫺ is being actualized in both our and this person’s experiences. The word “sense” was employed by Spranger in three roles, however: as the meaning of a sentence expressing an experience, as the objective of an activity, and as a value. Subsequently he maintained that one understands someone’s sensation, action or creation when one finds they possess sense, that is to say when they are an element of a certain structure and play a significant role in it. And structure in this approach is a value-possessing whole such that certain of
645 its properties do not result from any properties of its components, and one that is a whole because it has some objective value and sense (i. e., in this case aim or function). Thus, in order to understand something or somebody one has to perform a reasoning the conclusion of which would be: the necessary condition for the understood object to have value is that this object have such and such properties. Understanding thus treated, i. e., as a result of reasoning, would consist in seeking the value-possessing sufficient condition, either contemporaneous or subsequent, of that which we are striving to understand; in explaining, on the other hand, we match the explanandum (cf. Art. 30 § 1.2.) with a sufficient condition that is either contemporaneous or preceding. The activity of understanding on the grounds of the humanities involves the passing of utilitarian and emotional evaluations which are not to be found in the explanations carried out in the natural sciences. 1.2. Explanation in history: practical syllogisms and objectives Even if the cited methodologists are guilty of excessively emphasizing the humanities’ uniqueness and unjustifiably rejecting the logical scheme of explanation based on universal laws (cf. Art. 28), they nevertheless did much to uncover the typical features of history and the social sciences. The methodological character of the humanities stands out sharply in radical distinctions such as that (Popper 1952: 262) in which physics together with biology and sociology are regarded as pure generalizing sciences, while engineering is seen as an applied generalized discipline, with both these groups of sciences being contrasted with the historical disciplines on the grounds that sciences of the first category use the covering law model for testing ⫺ and thus formulate universal laws, referring to specific events only with this purpose in mind ⫺ while those of the second category predict such specific events, to this end using universal laws which they assume to be true; finally, the historical disciplines do not formulate laws but rather assume them, do not engage in prediction of events or testing hypotheses, and see their task in explanation of specific or particular events. The very fact that the historian concentrates on a particular event, and especially on the unique character making it different from
646 other events of the same type or kind, and the fact that this event is human behavior, and especially action, i. e., intentional behavior aimed at a goal the acting person is aware of ⫺ all this has bearing on the selection of the manner of explanation in history. Some point out that it is similar to explanation in everyday life, being sketchy and incomplete; laws of science, if invoked at all, are usually quoted with imprecise formulations; the same goes for initial conditions where universal hypotheses are taken from various disciplines or from practical experience and prescientific generalizations are used (Hempel 1949: 463 ff); finally, a single scheme of explanation is not adhered to but ⫺ depending on the circumstances ⫺ either the purpose of some thing is stated, or a nominal definition of some expression is formulated, or this expression is attributed to a context, or details or components of some event are enumerated, or the event’s occurrence is justified by pointing out that something is normal, or some view is corrected or interpreted anew or finally ⫺ but relatively rarely ⫺ the cause of the explained event or phenomenon is given. The common feature of all these different kinds of explanation is that they serve to rid us of the uncomfortable puzzlement brought about by something we do not understand (Passmore 1965: 16 ff). It is also pointed out that in the history of the social sciences causal explanations often occur alongside teleological explanations in which reasoning follows the scheme of the practical syllogism. In this syllogism the major premise specifies the object of activity, the minor premise the means leading to this objective, and the affirmation of the premisses leads not to conclusions but to activity remaining in agreement with them. Hence, an explanandum in explanations found in behavioral sciences is a sentence about behavior and action or products thereof; this action has an internal aspect, namely intention, and an external one ⫺ its indication or sign. These explanations usually answer the question: How did the explained event become possible? Accordingly, they refer to the event’s necessary conditions and not to its sufficient conditions, unlike explanations in the natural sciences, which answer questions about why something was necessary. In historical explanations necessary conditions are useless as bases for predictions but can be used in retrodiction, i. e., in the reasoning saying that since some event has occurred
IV. Methoden der Semiotik
there must have previously occurred some antecedent necessary conditions. At best, the explanations why something became possible may indirectly serve to make predictions: having ascertained that the necessary conditions of some event have not transpired, we predict that this event too will not transpire (von Wright 1971: ch. 3⫺4). Teleological explanations associate the objective of an action with the agent’s motives, dispositions, and will, with his beliefs and intentions. These are all subjective and individual. Because of this, in some cases we can only refer to that which is peculiar only to the event being explained as opposed to other events, to its peculiar history. In the course of such an explanation of an individual event we do not rely on universal laws that would connect motives of a given kind with the individual action of an agent having such and such dispositions because we are usually ignorant of such laws. We are thus forced to base our explanation on certain limited generalizations which we arrive at by analyzing transitory generalities (Joynt and Rescher 1965: 3 ff). In both causal and teleological explanations in history we assume universal laws and hypotheses (usually rather imprecise ones, incidentally) but we almost never discover them. Many of these laws and hypotheses arise from an intuitive knowledge of human nature, and some have their roots in psychology. 1.3. Reasons versus causes of action: determinism versus free will Even limited generalizations give rise to doubts, however: How is determinism in causality to be reconciled with the free will of the agent? And hence what relationship should we assume between this agent’s motives, wishes, intentions and convictions on the one hand and his will to act on the other, and next between this act and intentional action? This problem takes the form of the question: Are the reasons for action causes of this action? In other words, is the link between action and its reason only empirical, fact-contingent, or is it necessary? The assertion of a causal connection requires the invocation of some causal law as a sufficient or necessary condition of the considered event. Historians, however, are often content to treat as a sufficient condition and also as a cause of an action not an event that must necessarily lead to a given result but merely one which causes that the action becomes re-
31. Understanding, explanation, and action
quired for rational reasons; the necessary condition for them is one without which there would be no good reason to embark on the action in question (Collingwood 1946: 296 ff). We also know that historians rarely invoke causal laws and, if they do assume them, they rarely base their argument on a clearly formulated theory (Dray 1954, 1957: ch. 4 and 1963). The problems and doubts connected with the reason-cause dilemma have bearing on the character of theory in humanistic-type historical disciplines. They also affect the form of theory in semiotics when it is treated as a historical science, for both the interpreter and sender of a sign are guided by motives and act intentionally according to their individual and socially conditioned dispositions. 1.4. Genetical explanation The methodological difficulties inherent in a causal explanation are sometimes circumnavigated by abandoning it in favor of a genetical explanation, which indicates that the explained event is the last link in a series of events, usually following one another in time; in most cases each of these events is a necessary condition for one of the subsequent events in the series. An explanation of this kind consists of two kinds of premisses: singular sentences asserting the occurrence of the individual events, and statistical generalizations, often inferred, stating a dependence between the features of these events. The genetical explanation of a given event may thus be split into a series of probabilistic explanations of events preceding the event being explained. Only some of these preceding events, those that are important or interesting, constitute the necessary conditions of the explained event, and it is only the series of the antecedent events in its entirety that may constitute its necessary condition or ⫺ according to a different opinion ⫺ its sufficient condition; the explanation almost never consists of sufficient conditions, however. An explanation of a collective event is usually a series of partial explanations (Nagel 1961: ch. 4,2). 1.5. Historical description In history the place of explanation is often taken by a description of observed changes, as complete as possible, in which care is taken to demonstrate the continuity between the successive phases of the analyzed
647 event, to present as exhaustively as possible the relevant details in historical context, and to show how the various historical events interconnect. By capturing the mutual relationship of causal and conceptual interrelations occurring among the particular chronological facts, the historian tries to understand these facts, i. e., to interpret, classify and assess them; for the historian, generalization is thus a means of understanding specific phenomena (Joynt and Rescher 1965: 6 ff). The reconstruction of these phenomena aims at revealing the reasons, objectives, wishes, motives, hopes, fears, thoughts and feelings of the agent, and hence it reaches deeper down, beneath the surface of events. The ways of analyzing these events include empathy, introspection, insight, intuition, recreation in one’s mind, reliving, rethinking, and reenactment ⫺ all of which serve to uncover the inner qualitative properties of reality and not, as is the case with the natural sciences, the external, quantitative and experimental aspects ruled by the principle of mechanical causality, i. e., one independent of the agents’ will and common sense. 1.6. Interpretation versus explanation Interpretation plays an important role in the humanistic disciplines, but it by no means eliminates the other major methodological procedure ⫺ explanation based on theory, and hence on laws or lawlike statements. In interpretation we rely on empathy and behave intentionally, namely we strive to gain an understanding of the interpreted object. Although interpretation does not consist in resorting to empathy and is not intentional, we must bear in mind that a behavior or activity which appears intentional in one approach may lose this character in a different approach. For this reason the border between understanding and explanation is blurred, especially between teleological explanation and understanding: the notion of goal is connected with that of intention, and so teleological explanation is indirectly also intentional. When interpreting some object I make it a sign of something different from it. I try to indicate both the pragmatic and the semantic relations occurring between this object and its users on the one hand and the reality it refers to on the other. To this end I perform an inference which in most cases belongs to the same subclass of reasoning as an explanation. This is yet another fact to be included in discussions on the conceptual proximity of
648
IV. Methoden der Semiotik
understanding and explanation. They are also affined as methodological procedures: a teleological explanation of some action is usually preceded by an act of intentionalist understanding of behavioral data. Interpretation aimed at answering the questions: “What is this?” “What is something like?” is a prerequisite of causal explanation which answers the question: “Why is it so and so?” while interpretation meant to answer the query: “What does it mean?” is a prerequisite of teleological explanation. Understanding and explanation assist one another. Only by understanding some behavior as an action I am already explaining it in some way, namely I place it in a system of the agent’s cognitive acts and his objectives, and hence I provide a rudimentary teleological explanation of this behavior (von Wright 1971: 115 and 124). An explanation of some fact on one level opens the way to a reinterpretation of this same fact on a higher level. On the other hand, in order to begin explanation we must first understand the explanandum (von Wright 1971: 132 ff). Both these cognitive activities intertwine within a single process of reducing that which is unknown to that which is known, of simplifying and removing difficulties (cf. Art. 28). Semiotics treated as humanistic-type historical considerations shares with the historical sciences their methodological properties. The theories in this kind of semiotics ⫺ apart from generally conforming to the logical standards of all scientific theories, empirical theories in particular ⫺ exhibit the distinct character of historical theories.
2.
Explanation
2.1. Explanation of behavior and prediction of social phenomena Much of what applies to history may also be repeated when speaking of the methodological character of the social sciences. In both the former and the latter the logical scheme of explanation is the same; moreover, in both kinds of sciences use is made of the so-called “understanding” explanation based on the assumption that in each moment every person is in such and such a psychic state and that there is a specific relation between this state and this person’s behavior. In order to provide such an “understanding” explanation, the sociologist claims that he does not have to resort to empathy, although he can ⫺
since, as he believes, discoursive knowledge is not a matter of subjective sensations, imaginings or feelings, but is based on symbolic representation of certain phases or features of the analyzed object ⫺ ascribe certain inner states to the studied person which, although directly unobservable, may nevertheless be inferred from observations of objective events or phenomena. When resorting to explanation, the social sciences thus use the semiotic method, namely on the basis of signs or indices they formulate suppositions, i. e., hypotheses, concerning (a) that to which these signs or indices refer, and (b) that which they express. The laws on which such explanations are based are almost exclusively statistical and that is so because we are usually unable to list all the conditions determining the various types of behaviors, and especially actions. The latter are in part unpredictable since (a) each agent is endowed with a free will, (b) the behavior of an individual that is a member of a group is affected by this group, and (c) one often has to do with the action of an entire community, and communities may be different from the sum total of individual component actions. Also it often happens that we try to explain a given fact in the social sciences by invoking another fact and omitting a law or laws connecting these facts since we are either unable to indicate these laws or, if we do in fact point them out, it turns out that they would apply only under certain additional conditions, the full register of which we do not know. Thus what we get in many cases are partial explanations, that is to say ones in which the explanandum is not a logical consequence of the explanans and which do not provide a basis for prediction. Thus, in the social sciences the relatively rare explicit general sentences of unlimited scope, and hence lacking temporal or spatial determinants, and singular historical sentences are accompanied by the important category of historical generalizations restricted by the aforementioned determinants which include among their number reporting generalizations whose scope is included in the scope of the analyzed reality (Nowak 1965: 23; Ossowski 1967: 320). Compared with their physical or biological counterparts, sociological theories tend to have a modest scope. They concentrate on presenting data and proposing types of variables to be taken into account rather than on formulating clear and verifiable statements about the relationships between these vari-
31. Understanding, explanation, and action
ables. Thus, as Merton (1957 a: 5 ff and 86 ff) remarked, there are many concepts and approaches in them and fewer arrivals in the form of confirmed hypotheses. In addition, the name “sociological theory” is bestowed on many things, among them: methodological considerations, general sociological orientations concerning the selection of variable types and determinations of the context of study, analyses of sociological concepts, sociological interpretations of previously collected data, empirical generalizations in sociology, and ⫺ finally ⫺ sociological theory proper composed of logically combined theorems. Many sociologists, among them classics of this discipline such as Comte (1798⫺1857) or Weber (1864⫺1920), claim that one of its tasks is prediction. In sociology this takes the form of statistical projections based on empirical data and on behavior theory and concerning a certain aspect of social behavior which is then subjected to observation as a means of verifying this prediction or forecast (i. e., prediction containing dates). The purpose of both these operations is usually the exercise of a measure of control over the social situation; thus, both prediction and forecast are usually a means leading to a goal rather than the ultimate objective of research. The techniques of prediction include extrapolation (e. g., determination of future changes on the basis of existing findings), correlation (e. g., between the degree of adaptation in childhood and the degree of adaptation in marriage), and, finally, stochastic processes and Markov chains. Predictions may be classified according to whether they concentrate on features of a group or on features of a group’s individual members, or whether they stress exclusively or mainly case materials or statistical averages and rates. Two positions are apparent with regard to the relationship between prediction and explanation: that of those in favor of explanation, and those in favor of prediction. In fact, these two positions are not oppositional: explanation is a prerequisite of prediction (Schuessler 1968: XII, 418 ff), and this not only in the social sciences. 2.2. Explication Explanation of events is contrasted with explication of terms, i. e., a modification of the meaning of terms which turns prescientific into scientific ones. In the course of ex-
649 plication we explain tentatively what the explicandum (i. e., a given expression in the particular language) means and then we formulate the explicatum usually by means of a partial regulatory definition. This definition states which part of the everyday sense of the word will be included in the explicatum and what its extension will be. This extension has to differ from the explicandum’s extension since the explicatum should not be an equivalent of the former but an improved equivalent of the explicated expression adapted to scientific objectives. Hence, both the set of objects to which the explicatum is to refer as well as those of their properties which it is to take into account are selected bearing in mind the theory or system of notions and theorems which is to include the explicated expression as one of its elements. Explication thus depends on the research tasks. In the social sciences explications employ metric descriptions and feature measurement scales for sociological as well as psychological magnitudes (cf. Art. 29). Extreme behaviorists demand that psychological concepts be defined exclusively by means of descriptions of physical or physiological behaviors of organisms; operationists on the other hand would like to see definitions of sociological concepts to bring descriptions of activities the performance of which would indicate whether the given thing should be classified under the defined concept or not. Mentalists oppose the radical forms of behaviorism and operationism, maintaining that it is wrong to identify psychic phenomena and the resultant social ones with the physical or physiological processes in the organism that accompany them (Pawłowski 1986: 97 ff). 2.3. Function and functional analysis One of the kinds of explanation used in the social sciences is the so-called “functional explanation” to be found also in biology. Due to the polysemy of the word “function”, functional explanation takes on a variety of guises. A function is either (a) an interdependence between variables, (b) a set of processes or actions inside some system with no reference to their effects, (c) a vital process such as breathing, (d) the use or application of something, (e) the consequence of an event or activity for a given system, not necessarily intended or useful, (f) an actual or possible contribution of a thing or activity to the preservation of some property or state of the whole containing the said thing or activity as
650 its component (Nagel 1961: ch. 14,2). Functional explanation in the social sciences usually consists in indicating the role of some component of a social system in the preservation of an entire society, sometimes treated as if it were an organism, or in the preservation of some trait or state of this society. The concept of function, understood as the role of a given variable in a specific social system, is connected with the concepts of structure and objective, and indirectly with the concepts of disposition, motive, intention, value and effect, for if some system element plays such and such a role in this system, then this is with respect to someone’s interests or aspirations, and this requires that the gains and losses occasioned by the realization of intentions be assessed. Functional explanation or, putting it more generally, functional analysis, comprising also functional description and functional interpretation, is of teleological character. It deals with relations between elements which serve functions, with the position of each of these elements as components with respect to the system as a whole, as well as the relation of this system to the environment. The opinion is sometimes expressed that each social fact ⫺ be it an idea or material object, social practice or custom ⫺ serves, either evidently or latently, intentionally or otherwise, a vital function in the satisfaction of biological or psychological needs of both the individual members of the social group and of society as a whole (Malinowski 1926: 132 ff). Morris’ theory of signs is an example of a functional and teleological approach (Morris 1971: 85 ff; cf. Art. 113). One of the leading representatives of functional analysis in the social sciences, Robert K. Merton (1957 a: 50 ff and 60 ff), believes that the objects of such analysis may be and indeed are all kinds of sociological data provided they are of standard and repetitive character, such as social roles, institutional or cultural patterns, social norms or social structure. In subjecting all these to functional analysis we assume or even openly use a certain conception of motivation of individuals as elements of a social system. However, one should not confuse here subjective dispositions with objective consequences of attitudes, beliefs or behaviors; most importantly, one should not confuse the concepts of motive and function. The latter is tantamount to the observed consequences contributing to the adaptation of a given system, with a manifest function being consequences of which
IV. Methoden der Semiotik
the participants of this system were aware and which were intended by them, while the latent functions are the consequences these participants did not intend and of which they are ignorant. An example of the former category are the consequences that punishment has for a punished criminal, while an example of the latter are the consequences of this punishment for an entire milieu or society. The analysis of manifest and latent functions has semiotic aspects whenever it involves index analysis. Functional analysis finds application in communication studies, since in communication the messages exchanged by communicating partners serve specific semantic and pragmatic functions, with the entire process being intentional, goal-oriented, and social in character. 2.4. The relationship between whole and part, holism and individualism The sociological concepts of society, social groups and social structure, the biological concept of organism, and the semiotic notions of text or context and language are all entangled in the dilemma of whether the whole is more than the sum of its parts, and in the controversy putting holism against individualism (cf. Art. 28 § 2.1.). The words “whole” and “part” have several meanings, correlated with one another (Nagel 1957: 519 ff), among them: (a) something taking up space, e. g., the territory of the USA versus one of its material segments such as the State of Kansas and the State of Vermont; (b) the same kind of whole, e. g., a cube versus one of its properties such as an area; (c) a period of time, e. g., a century versus a stretch of time such as a decade; (d) set versus subset or element; (e) a property of an object or process versus a property of a piece of the object or a component activity. Analogous relations occur between the concepts of a sum and its components, e. g., (a) the result of an addition versus the components to be added in arithmetic, (b) resultant versus vectors in physics. If by “sum” we understand an unordered set of elements, e. g., tones, and by “whole” an ordered set, e. g., a melody, then the whole will have features which the sum lacks. If neither the sum nor the whole, e. g., a car engine, is treated as a set in the settheoretical sense, as is often the case in the social sciences, then the whole (e. g., World War II) will have properties which do not belong to the sum of its parts (in this case the various military actions and other events) if
31. Understanding, explanation, and action
it is not possible to deduce statements about this whole’s properties from the relevant theory and information about the arrangement of the parts within this whole. As can be thus seen, to consider properties, and especially functions of a given whole and the parts thereof, it is necessary to refer to a theory about this whole. In semiotics an example of a holistic theory is the pragmaticism of C. S. Peirce (cf. Peirce 1931⫺1958; cf. Art. 100). In the social sciences a holistic procedure is group study. When studying an individual we distinguish his attitude from features of his personality, and a biological feature from an economic one. While studying a group, however, one has to deal with averages of individuals’ attitudes, inferences from individual cultural products, theorems about relations between individuals, about collective features derived from information about each of the individuals, and about global features belonging to products of a whole group (Lazarsfeld and Rosenberg 1957: 28). The distinction of whole and part provided grounds for the dispute between holism, or collectivism, and individualism. Holists believe that the proper object of sociology and history are social wholes subject to social laws which are often described or explained with statistical statements featuring theoretical terms which cannot be translated into names of individual psychic experience, to say nothing of perceptible behaviors of individuals. On their part, the individualists claim that in order to understand the more significant social events one usually has to refer to the dispositions of individuals, at least to the typical dispositions of anonymous individuals, without necessarily connecting the reasons and motives of conduct with behaviors by means of psychological laws. The differences between the holistic and the individualistic positions are also apparent in semiotics, for example in the various views on the opposition between categorematic and syncategorematic expressions (cf. Art. 42 § 2.1.); the more holistic view (e. g., that of Carnap; cf. Art. 76 § 4.); has it that only sentences are categorematic, whereas the more individualistic view regards as syncategorematic only prepositions and conjunctions. The holistic attitude is apparent, among other things, in the opinion that ⫺ putting it imprecisely ⫺ language “consists” of sentences and not of names; the foundations of text grammar may be seen as containing evidence of holistic assumptions, while stressing the
651 role of linguistic constants (such as semantemes) betrays individualistic assumptions. One must not forget, however, that “holistic” and “individualistic” are typological and hence gradable terms and they should not be used to oppose mutually exclusive classes of phenomena. 2.5. System and systems analysis The concept of whole and the concept of function occur in the definition of the word “system”, denoting a set in which the relations between its elements are such as to make it possible to infer the occurrence of some relations from the occurrence of others, or the future from the past and the present state, or the behavior of the elements from that of the whole set. These relations are most often of functional character and cause energy exchange or communication, e. g., transmission of verbal information or goods or money between system elements, and also between these elements and the environment. An example of a semiotic system is language, treated as a set of entities of specific kinds, (e. g., phonemes, morphemes, words or sentences), and syntactic relations occurring between these elements of the system, as well as semantic relations between these elements on the one hand and intensions and extensions on the other, and also pragmatic relations between expressions with their intensions and extensions on the one hand and the interpreters of these expressions, or their users on the other. The systemic approach to the theory of signs is evident in Peirce’s pragmaticism (on the relation between systems theory and semiotics cf. Art. 126). An interdisciplinary branch of knowledge building a general theory of information processing in all systems and analyzing the assumptions and rules of this theory is cybernetics together with information theory (cf. Art. 125). By treating a certain whole as a system, we perceive in it a theoretical backbone, that is to say a logical structure composed of interconnected terms and statements, as well as its empirical, functional aspect, namely events and phenomena constituting a semantic model of this theoretical sign model. Not only ethnic or mimic or gesticulatory codes or artificial languages of algebra and formal logic may be treated as semiotic systems but also, among other things, economic structures (cf. Rossi-Landi 1983 and 1985) insofar as they are based on a code, i. e., a set of rules of transformation,
652 combination and sign use, the signs in this case being monetary means, the intension of which is financial value, and the extension the goods and services they can buy. Social systems are to some extent open, which means that the behaviors (especially human or animal actions) performed within the system interact with the system’s environment; there is also interaction among actions within the system itself. System analysis focuses on a set of interactive variables isolated from the environment; it uncovers and formulates in explicit manner the most important relations between the system’s elements and between these elements and the environment, and it subjects statement about these relations to empirical testing. 2.6. Type, typological concept, and typology One of the analytical tools in the social as well as the historical and the natural sciences is the concept of type. An empirical or real type is a concrete object, person, event or phenomenon, possessing ⫺ with respect to certain aspects chosen to match research interests or the task in hand ⫺ properties most often represented in the considered set. An ideal type on the other hand is a theoretical structure deliberately endowed with the typical features as defined above, or with average features, or, finally, features of the least or the greatest intensity in the studied set. The author of the concept of ideal type, Max Weber (1947 and 1949), employed two varieties of this concept: at first a holistic and then an individualistic one (Watkins 1953: 724 ff). The former is a limiting concept against which real situations are compared and measured, in order to determine the properties relevant for the researcher. Such a holistic ideal type is constructed by grasping the entirety of the considered social situation and then abstracting from this historical complex the properties we wish to include in our analysis. On the other hand, the starting point for an individualistic ideal type is the study of a concrete situation of individuals, followed by abstractions from this situation of features such as general schemes of personal preferences, knowledge of the various individuals about their own situation, the most frequent or in some respects important relations between individual persons and between an individual and his or her resources. In order to gain this information, we place hypothetical agents in simplified situations isolated from interfering factors, and assume
IV. Methoden der Semiotik
that the agents behave rationally, their behavior being guided by schematic preference patterns and being based on schematic knowledge. In effect, we gain an understanding of a complex social situation from an indirect cognition of dispositions, beliefs, relationships and interactions between individual persons, based on direct empirical observation of their behaviors. We are thus employing a semiotic method: relying on observable external indications, namely on an individual’s behavior, we make inferences about this individual’s personality, i. e., the system of unobservable psychic factors determining this behavior. Next we assume that society is a system composed of its members and of unobservable relations between them. According to sociologist-empiricists who favor natural science methods, the products of mutual interaction of individual persons are measurable, while the information about the individual dispositions, beliefs and relations between people enables a reconstruction of the social system. Weber believed that the concept of ideal type is constructed by stressing selected points of view, selected aspects, which leads to a selection of features which are to constitute this type after previous ordering and synthesis of these features. The emergent ideal type is not a description of reality but helps in formulating hypotheses by providing the means of arriving at such a description. Among the properties with which we endow the ideal type are those belonging to the whole species or kind, hence the similarity of this type to the general concept. The latter serves rather to classify and explain, whereas the former serves to order, create typologies, and understand events. This difference led to a distinction of classificatory concepts, such as the concept of metal, and typological concepts, such as those of icon, symptom or symbol. The typological concept is of ordering character, its content features the criterion of precedence with regard to a given aspect, that is to say an antisymmetric, transitive and in certain sets connected relation. It is also of classificatory character, namely it indicates the relation of equivalence with regard to this same aspect, i. e., a symmetric, reflexive and transitive relation. Within the typological concept the relation of precedence is antisymmetric and connected with regard to the equality relation; thus the typological concept “more intelligent” orders, at least partly, a considered set of people according to the
31. Understanding, explanation, and action
intelligence quotient (IQ) value and at the same time classifies this set indicating in it such subsets that any two elements of a single subset have the same IQ, and every two elements of different subsets have different IQs. In effect, the concept “more intelligent” partly orders and at the same time classifies a given set, and thus systematizes it. Typological concepts are useful in comparisons of objects with respect to the intensity of a property belonging to them. Hence, not only terms such as “more intelligent”, but also terms such as “intelligent”, “conventional” or “performative” that refer to a gradable property are applicable in descriptions of continuously changing objects (Pawłowski 1986: 168 ff), especially objects which are sets in the mereological sense (i. e., aggregates) or in the set-theoretical sense. A partial ordering coupled with a classification of a set, that is to say its systematization, provided with an indication of its limit members and then their sums, i. e., types, is called a “typology”. This procedure is frequently used in history which often borrows typological concepts from concrete orderings, as well as in sociology and psychology which sometimes construct such concepts within sociological or psychological theories. Examples of typology are to be found in various disciplines, e. g., on the grounds of sociology in Durkheim’s (1838⫺1917) and Mauss’ (1872⫺1950) social morphology, where the relations of social types to social structure are classified; in Levi-Strauss’ social anthropology; in the analytical psychology of Jung (1873⫺1961), who distinguished two types of personality (the extravertic and the introvertic); in the philosophy of Nietzsche, who opposed the dynamic Dionysian and the harmonious and balanced Apollonian attitudes in art; and in Morris’ theoretical semiotics in which the typology of discourse is based on the connection of the dominant mode of signification in discourse with its dominant use (Morris 1971: 203 ff). Semiotic relations are apparent in many typologies; e. g., in Hippocrates’ distinction between the phtisic and the apoplectic constitution, the body structure and the typical behavior connected with it are treated as external indexical signs of susceptibility to specific illnesses; Lombroso’s anthropological types are seen as featuring indexical signs of a proneness to crime; finally, the types of body build in Kretschmer (cf. 1921 and 1926) are supposed
653 to be indexical signs of personality types (concerning prototype theory in linguistics cf. Art. 105). 2.7. Index and indicator The concept of se¯meı˜on, known since the times of the Stoics, Epicureans and Sceptics, has resurfaced as a research tool in the social sciences universally using the semiotic method of index interpretation. This analysis uses the concept of variable, and some scholars employ two varieties of this concept: the variate and the quantitative variable. The former is an arbitrary means of distinguishing individual persons or groups from one another; primarily, however, it is a typological concept. The latter often serves to introduce distinctions using numerical measures, e. g., in the form of indices or coefficients. Typological concepts in sociology, sometimes referred to as traits, are transformed into variables with respect to which a typology is then performed. This is done in several steps: once connections between phenomena or regularities thereof are observed, their aspects, components or dimensions are enumerated; after an outline of the concept has been presented and the nature of the planned typology tentatively described, we perform a conceptual analysis which reveals several perceptible properties, or indicators, which allow the inclusion of the studied concrete objects in relevant subclasses. From the set of these indicators, i. e., symptoms, which is usually very large, we choose a subset to be used in empirical work. Finally, we combine appropriately selected indicators to form a syndrome called an “index”. We encounter indicators of two types: expressive and predictive. These are extreme types and in practice we often have indices of mixed character. An expressive indicator makes it possible to guess its underlying trait; the predictive indicator, on the other hand, serves to justify predictions. The majority of typological concepts are created on the basis of observed variations, and they serve to formulate their general explanation. In many analyses, expressive indicators play a greater role than the predictive ones. The same set of expressive indicators is confronted with various empirical observations, and this leads to the emergence of differentiated subsets of predictive indicators. Finally, the indicators are combined to form a generalized variate with an expressive function of its own. For example, we may combine ex-
654 pressive indicators in the form of answers to a query about the color and cut of clothes the respondent would like to buy with observations from rural, or working class, or white collar milieu, or ⫺ alternatively ⫺ with observations from various age groups in one particular milieu, and in each case we will get a different set of predictive indicators or different generalized variates. In studies of this kind there occur three kinds of collective traits: analytic ones, when a trait of a group is derived from a relevant trait of each of its members; structural ones when a group’s trait results from the relationships between the members of this group; and global ones when they pertain to a product of the entire community. An index of a given trait is created by mentally reconstructing the meaning of its name and ⫺ this being required by operationists ⫺ by realizing which actions should be undertaken to find whether the particular trait does indeed belong to the studied object. Many indicators are usually fit to be turned into indices. By choosing various combinations of indicators we get different indices, but these are mutually interchangeable insofar as their use ⫺ each being combined with the same variable ⫺ leads to similar empirical results. For example, when we apply different intelligence tests to the same person, our findings will be similar. A thorough study should take into account more than two variates, this making it possible to uncover the system of relations and the interaction thereof. By considering three variates we may study conditional relations, structures, and processes. An example of a conditional relation, i. e., a certain kind of system, is the dependence between the drop in main water consumption at a given time and the popularity of a television show broadcast at that time. This dependence is conditioned by the kind of weather or time of day when the show is aired: the magnitude of water consumption drop is an indicator of the show’s popularity; however, the numerical measure of water consumption compares differently with the number of the show’s viewers on sunny and rainy days, during office or shopping hours and typical leisure periods. A structure is described with contextual propositions describing the interplay between individuals and the group they comprise. To this end, the individual persons are characterized both with respect to their individual properties such as age, and contextual properties such as membership in
IV. Methoden der Semiotik
a religious sect. Lastly, process is studied using the so-called “panel analysis”, which consists in characterizing a person or a group with a certain number of variates, measuring each of these variates at specific time intervals in order to gain information about (a) the changes each of these variates undergoes ⫺ the determination of these is the objective of the so-called “analysis of concurrent trends”; (b) the correlations between variates and changes thereof over time; (c) the differences in each of these cases between component groups which initially differed with regard to the given variable; and (d) changes cooccurring in two or more variates (Lazarsfeld 1959: 39 ff). Terminological vagueness leads to certain conceptual differences in discussions of indices in the social sciences. Firstly, in some cases the role of index of some property or set of properties of some object is played by some other property or set of properties of this object, i. e., a single symptom or syndrome; in other cases it is not the property itself that is treated as an index but rather the fact that it belongs to the object in question (this fact is sometimes referred to as phenomenon). In both these cases we are dealing with so-called “real indices”, such as for example a characteristic hairdo, costume and diet ⫺ or the fact that someone is coiffured and dressed in some particular manner and eats a particular diet ⫺ as an index of belonging to some religious sect. Secondly, it happens that the function of index is performed not by the actual belonging of a given property to a concrete object, but by some theoretical structure being a realization of a resolution ⫺ e. g., in the form of a sentence expressing that resolution ⫺ to the effect that such and such properties be assigned to an object or event in our mind, even if nothing endowed with all the properties thus selected were to exist in reality. In this case we have what is known as a definitional index created by adopting a suitable meaning postulate which defines ⫺ usually with a partial definition ⫺ the sense of the term denoting the indicatum, i. e., that which is being indicated, with the aid of the term denoting the index. An example here would be the index of belonging to the category of practising Catholics, consisting of the following properties, which are supposed to belong to the indicatum: numerous progeny, observance of fasts, regular participation in religious rites (such as masses, sacraments, pil-
31. Understanding, explanation, and action
grimages), presence of cult objects at home, material assistance to the poor, etc. This index is akin to the ideal type, but it is also of empirical character insofar as the properties with which it was endowed are perceptible, or in any case easier to ascertain than the indicatum. This indicatum may be observable but does not have to be. It is often of psychic nature, as for example when the indicated is an attitude or disposition of a given individual or group. In the social sciences both the index and the indicatum often occur as variables. Metric indices are in universal use. The connection between the indicatum and its index is often of a cause-effect nature, but in most cases we deal with statistical regularity and hence with probabilistic indices, which are moreover gradable and interconnected in such a manner that the concept of index turns out to be syndromatic and typological. The concept of indicatum is often of this same character. It also happens that both the index and its indicatum are given a common name (Nowak 1965; Pawłowski 1986: 181 ff). 2.8. Understanding in the social sciences Max Weber, a leading representative of socalled “understanding sociology”, believed that in sciences dealing with psychic and social phenomena one must understand behaviors and interpret them rationally, taking into account criticisms of the reality of “sense”, i. e., the objective of action, as well as the assessment of the justifiability of means leading to this objective, and of the costs of those means; the objective of action was for him the conception of the outcome of that action which became its cause (Weber 1949: 40 ff and 83 ff). What this means is that the direct data of sociology or psychology are interpreted as indices of attitudes or thoughts of the studied person. This interpretation, i. e., the act of making things out, the working by the researcher towards understanding, consists in this case in inferring by this researcher about the studied person’s psychic experiences from the observed behaviors, and especially actions, of this person in a concrete situation. What matters here in particular is conscious experiencing, perceived by the studied person in introspection and revealing to him not only his present thoughts or emotions but also the experiences which triggered them, coupled with the conviction that a relation with such and such properties exists between these triggering experiences and their psychic consequences. Based on indices, the
655 researcher thus makes suppositions about a complex indicatum. He deals with these indices with the use of a theoretical concept, sometimes referred to as “intervening variable”, or “abstractum”, which refers to the conjunction of the observed data. He also uses theoretical concepts of another kind, the so-called “hypothetical constructs”, known as “illata”; these refer to objects, events, properties or phenomena that are unobservable ⫺ or at least imperceptible at the given moment due, for example, to their removal in space or time ⫺ the existence of which is being inferred from the observed empirical data. The terminology here is unstable: in some cases by intervening variables, or abstracta, and by hypothetical constructs, or illata, are meant certain theoretical terms, that is to say language expressions; in others concepts as meanings of these expressions; in still other cases the referents of the theoretical terms. Depending on how things stand, interpretation may be understood as a process of passing from acknowledging the truthfulness of sentences containing intervening variables (treated as premisses) to acknowledging the truthfulness of sentences containing hypothetical constructs (treated as the conclusion); or as a process of passing from statements about intervening variables (e. g., about someone’s actions in a given situation) to statements about hypothetical constructs (in this case psychic experiences or attitudes of the acting person). An attitude different from that of understanding sociology was adopted by behaviorists, especially the radical ones. They believed that all statements must be justified exclusively by extraspection, i. e., observation of behaviors carried out by an observer outside the studied object, and ruled out introspection, both in the researcher and the object of research. They went as far as to claim that to state something about a person or group of persons is to observe this person or group; hence a statement about either is nothing but a report of performed observations. Operationists in their turn demanded to include in definitions of terms of a given science a description of operations carried out in order to determine which objects belong to the extension of the definiendum. In both these positions the terms for states, experiences and psychic phenomena were names of perceptible behaviors or actions. The behaviors of studied persons were no longer treated as correlates of psychic ex-
656 periences since the latter do not exist. The abolition of the distinction between extraspection and introspection, as well as between sensual data and mental phenomena, and an external and an internal world, led to the redundancy of the concept of exterior index of psychic experiences. However, for several decades now extreme behaviorism and operationism are things of the past. A moderate empiricist accepted introspective concepts alongside extraspective ones, but demanded that conditions of the empirical applicability of the former be given. Today neither sociology nor psychology bar the use of introspection as long as caution is exercised in drawing conclusions from it. Also, psychological concepts are not identified with concepts referring to behaviors or dispositions to react to stimuli. Observation of behaviors, both the external and the internal, is used, but its results are treated as probable rather than certain. The hypothetical constructs obtained on the basis of these results are theoretical concepts, the meaning of which often differs from that of concepts referring to indices correlated with these constructs. At the same time, however, we try to define the theoretical concepts of both these kinds in a way enabling us, by applying correspondence rules to them, to infer with sufficient probability from the occurrence of the index the presence of an unobservable (or temporarily hidden) indicatum, or to predict the behavior of an experiencing person on the basis of an actually occurring mental state. The former activity is sometimes referred to as the understanding of indices, and the latter as the selection thereof. Among behaviors, especially those considered by psychology, particular notice is given to those whose motives cannot be indicated or are indicated wrongly by the behaving or acting person who resorted to so-called “rationalization” and, for example, replaced a real censurable motive by one he or she sees as a fictitious noble motive; behaviors of this kind are sometimes referred to as “symptomatic”. Distinct from them are instrumental actions in which the acting person correctly identifies his or her own motives, objectives and means. In addition to making-out actions ⫺ not infrequent also in history ⫺ which consist in introspection and projection of one’s own experiences, by analogy, onto persons whose activity we are trying to understand, the social sciences also feature understanding procedures that are less intuitive and more rigor-
IV. Methoden der Semiotik
ous and standardized. For example, the behavior or action that is being interpreted is split into components, each of which is treated as an index with which a certain number of indicata are correlated. Next, two things are being considered: (a) the degree of probability with which the individual indicata may be assigned to the given index; and (b) the question as to which indicatum or indicata correspond to the greatest number of distinguished component indices. By resorting to measurements and statistical methods, we try to construct an indicatum that would be a combination of the most probable and the most frequent unobservable (or temporarily hidden) correlates of the interpreted set of indices. We may also construct a summary index being a combination of diverse observable behaviors or actions, especially those strongly interconnected statistically; next we combine all the supposed indicata of these behaviors or actions to form a summary indicatum, consisting of components strongly correlated with their indices and strongly connected with each other, as well as of those that are less probable and loosely interconnected, and components that are correlates of many behaviors or actions and those that are correlates of few observable data. What we have in this latter case is a comprehensive summary understanding of the index, as opposed to the previous selective understanding. Depending on the research or practical task in hand, we create indices and indicata in various ways, sometimes splitting each into component parts, and sometimes combining elements to form larger wholes. The manner of understanding a given index depends on the kind and structure of this index and the indicatum (Nowak 1965: 183 ff and 245 ff). The analysis of indices applied in the social sciences expands the content and methods of the branch of theoretical semiotics dealing with the concepts of indication, index, symptom, syndrome and sign, and with the understanding thereof. Social institutions, groups, phenomena and processes become the object of sociology treated as a humanistic discipline only once we treat them as a correlate of awareness and subject them to interpretation, that is to say when we treat them as indications or signs (Ossowski 1967: 343 ff). The social sciences have developed statistical methods of studying correlations between variables, thus endowing the concept of index understanding with a probabilistic character not to be found in traditional semiotics or philosophy of language.
31. Understanding, explanation, and action
2.9. Measurement Initially, the prevailing view in the methodology of science was that only additive magnitudes are measurable, i. e., those kinds of properties to which real numbers may be assigned in a manner isomorphic with addition in arithmetic, with this activity being accompanied by physical actions such as bringing concrete objects into contact or placing them side by side. For example, the measurement of length consists in applying an object assumed to be the measurement unit to the object that is being measured, and then in combining further such units until they equal the length of the measured whole. This measurement procedure, referred to as “direct” or “basic”, consists in isomorphic mapping of the relationship of physical sum onto the relationship of arithmetic sum occurring between positive real numbers. The one-to-one relation which maps the first of these relationships onto the second is called the “measurement function” of the given kind of magnitude. Since physical actions of this kind cannot be performed to measure psychic phenomena, it was assumed that the objects of history, psychology or sociology cannot be measured. This opinion changed with the expansion of the concept of measurement. It came to be recognized that measurement is every operation isomorphic with addition, even if it is not accompanied by such physical activities as placing objects side by side or placing them on weighing scales. What is more, in order to perform a measurement it is enough to establish a correspondence between the set of measured concrete or ideal objects and a certain set of real numbers such that the relations between numbers correspond isomorphically or at least homomorphically to the relations between these objects. One thus has to determine an assignment-specifying function defined in the set of measured elements and taking values from the set of numbers. Various relations occur between numbers, e. g., of being equal or greater, and thanks to this it is possible to determine an isomorphic or homomorphic assignment with respect to the various properties of these numbers, and hence to create various measurement scales, i. e., sets of numbers assigned to properties ordered with respect to magnitude (cf. Art. 29 § 4.1.). The social sciences employ: (a) ordering scales, which make it possible to infer about the relationship between the relevant properties on the basis of the relationship of being
657 greater occurring among numbers; (b) metric scales, which, in addition to the above, indicate the relationship of arithmetical sum between numbers, allowing to infer that a corresponding relationship occurs between the magnitudes assigned to these numbers; (c) interval scales, composed of numbers whose differences form a metric scale of interval width (these scales make it possible not only to determine the equality of the measured objects with regard to a selected property thereof, and the relationship of precedence occurring between these objects with respect to this same property, but also to determine the relationships between their differences with respect to this property); finally, (d) quotient scales, serving to indicate multiples among the measured magnitudes. All these types of scales differ as to their power, and this in turn conditions the usefulness of measurements performed with their aid. For example, by employing the weak nominal scale of marking each banknote with a different number, we perceive relatively few empirical relations between them. Often employed in these sciences is indirect, or derived measurement, which is done as follows: in order to measure a given magnitude of some object one first measures other magnitudes and then one applies a known or just discovered dependence between these magnitudes ⫺ e. g., definition or law ⫺ and on this basis one makes inferences about the measure of the studied magnitude (Ajdukiewicz 1974: 280 ff, Davidson, Suppes and Siegel 1957, Pawłowski 1977: 72 ff, Suppes 1959, Suppes and Zinnes 1963, Krantz, Luce, Suppes and Tversky 1971⫺90). For example this was how the so-called “moral integration index” was measured indirectly: the crime index was measured on the basis of police reports from various towns, as was the welfare effort index on the basis of information about welfare spending in these same towns, and the dependence between crime and charity scores was given the form of a formula expressing the measure of the moral integration index (Angell 1957: 58 ff). When we compare procedures such as this with indirect measurements like the calculation of the measure of car speed on the basis of the ratio of the measure of distance covered to the measure of time used to cover this distance, we see that in the social sciences we are sometimes treading soft ground. On the other hand, however, the treatment of moral integration as a variable that is negatively
658 correlated with the crime variable and positively correlated with the welfare effort variable is superior to the purely intuitive treatment of this integration in that it indicates the direction of defining the vague concept of moral integration in terms of the other two concepts mentioned here, which are moreover used as indices of the former. The fact that similar studies resort to quantitative characteristics of events or phenomena, that phenomena are not treated as static but as variable, that gradable or continuous variables are considered alongside the dichotomous ones (i. e., the presence or absence of studied elements), that the degree of variable intensity is being measured, finally, that the dependences between changes of properties (e. g., those between the increase or decrease of one property and the increase or decrease of another) are not merely considered but also calculated by determining the probability of occurrence or the degree of intensity of the variable regarded as the dependent one (and sometimes as the effect) with respect to the probability of occurrence or degree of intensity of the variable regarded as the independent one (and sometimes as the hypothetical cause) ⫺ all this is seen as a way of providing the social sciences with a scientific character. It creates chances for a similar enrichment and enhancement of precision for semiotic theory analyzing the indicator-to-indicatum relationship and the concept of interpretation. In the social sciences the advocates of radical empiricism, behaviorism or operationism clung to the methodological patterns of the natural sciences. For example Otto Neurath (1931) expressed the view that a people resembles a constellation in which the individual celestial bodies are connected with one another more strongly than with stars of other constellations. Hence, sociology based on materialism treats people no differently than other disciplines studying reality treat animals, plants or stones. Introspection and empathetic understanding were shunned. Mathematization came into vogue, to attain peak popularity halfway through the 20th century. Its adherents, some of whom were virtual fanatics, applied counting, measurement and formalization to social sciences universally and without restraint. Pitrin Sorokin dubbed the fascination with such cognitive procedures “quantofrenia”. Soon criticism by humanist sociologists started to be heard. It was indicated that the mathemat-
IV. Methoden der Semiotik
ical guise of statements sometimes creates the impression that they were expressive of scientific discoveries, while the same statements formulated in ordinary language would turn out to be trivial; it was pointed out that the greatest sin against exactness was its semblance; it was emphasized that correct and exact computations become useless when the worth of material interpretation or of index scaling based on intuition is put in doubt; it was noted that the relative ease with which new empirical results expressed in numbers can be obtained is among the reasons for the intoxicating effect of the mathematization of sociology; there were calls to discard the erroneous view that precision is confined to mathematics alone, a view that does not favor efforts towards adding precision to the methods and language of the social sciences; it was argued that calculators and computers would not replace the intellectual plasticity of the researcher, his humanistic culture and criticism towards his own interpretations, a procedure that is indispensable given that even the most precise calculation does not strip sociology of its humanistic elements; it was pointed out that even in those sciences which deliver their main argument in formalized language, the commentaries are nevertheless in ordinary language. The advice given in this context was to improve the precision of language as the need arose, i. e., in the most important statements and in all cases when misunderstanding was likely. Metaphors were not condemned on the condition that they are not a sign of the author’s helplessness or his unwillingness to embark on the task of understanding what he wants to say, or his efforts to delude his reader or listener with sham profundity. It was repeatedly stressed that social sciences ignoring awareness phenomena would lose their object, while those rejecting the methods of inner experience would be incapable of studying these phenomena. It was asked (Woodger 1952: 283) why the knowledge accumulated over years of observing oneself should be rejected when it is being used constantly in everyday life (Ossowski 1967: 251 ff, 277 ff, 291 ff). It seems that the two attitudes outlined here ⫺ that of the sociologist who is an empiricist, operationist and behaviorist using formalization and statistical methods, and that of the humanist sociologist who embraces methods of interpreting indices as correlates of mental phenomena and resorts to
31. Understanding, explanation, and action
introspection and empathy in his quest for motives guiding actions ⫺ can be reconciled. The humanist sociologist seeks univocal, clear and lucid concepts and statements, trying to state conditions of empirical applicability of introspective concepts. He includes in the conceptual apparatus of the social sciences concepts which may be used to formulate many hypotheses. He takes pains to produce correct definitions, classifications, orderings and typologies. He is eager to translate metaphorical formulations of important statements, conclusions in particular, into ones devoid of metaphors. He does not shun inner experiment: he trusts intuition to a certain degree and tries to relive the attitudes and motives of the participants of social events while formulating hypotheses, but he puts the supposed dependences to empirical tests and makes predictions only on the verified ones. He interprets the behaviors of the studied persons, treating them as indices of their mental experiences, but whenever possible performs measurements, calculates coefficients of correlation, employs statistical methods. He justifies general statements both with statistically analyzed observational materials and inner experiences. If the need arises, he refers to the inner experience of the receivers when he wants to convince them of the truthfulness of his statements or the validity of norms. He devises measurement scales and simultaneously makes use of inner experience when interpreting data and formulating final conclusions (Ossowski 1967: 250 ff; Nowak 1965: 202). Semiotic theory may benefit from this “golden mean” program. In studying semiosic and semiotic relations it ought to take into consideration the social context of sign use, and in analyzing these relations it ought to use results of the social sciences in index study, resorting to measurement and statistical methods (cf. Art. 28).
3.
Action
3.1. Activity, action, and behavior An important role in theoretical semiotics is played by the concept of action. Semiosis is a process of sign use involving activities such as sending and receiving signs and consisting in interpreting a message (cf. Art. 4 § 1.). “Activity”, in one of the meanings of this noun, is related to the word “action”. Among the important semiotic activities is communica-
659 tion. The importance of the concept of action in semiotics is evident in theories such as Peirce’s pragmaticism; Austin’s (1962) theory of performatives (such as “I swear”, the utterance of which is a performance of an action and not only a description thereof); Wittgenstein’s (1958) views from the period of his so-called “second philosophy”, which urges us to cease inquiring about the meaning of words and concentrate on analyzing their uses instead; Searle’s (1969) speech act theory; Davidson’s writings (1984 a and 1984 b), which suggest the analysis of the concept of meaning to be based on Tarski’s (1935) theory of truth and action theory. “Behavior” is another term playing a significant role in semiotics: scholars speak of linguistic or, more generally, semiotic behavior; sometimes behavior is even equated with action, the former being regarded as purposeful, namely as “the sequence of responses (actions of muscles and glands) by which an organism seeks goal-objects that satisfy its needs” (Morris 1971: 360). Semiotic terminology features the expression “sign process”, denoting the structuring, interpretation and comprehension of signs. The term “process”, taken over from praxiology and action theory, reflects the pragmatic and active character of semiosis. 3.2. Efficient action Action is analyzed by many sciences: praxiology, sociology, economy, jurisprudence, psychology, to name but a few; the theory of efficient action is developed by the first of these ⫺ praxiology (cf. Art. 108). It distinguishes the following components of an action: (a) its agent or actor, i. e., a person or, according to some authors, an animal ⫺ generally a subject ⫺ that acts; (b) the goal of the action, i. e., an event intended by the agent of the action; (c) the result of the action, i. e., its effects, both intended and unintended, predicted or unpredicted, both the main and the side effects; (d) the means of the action, i. e., the ways or methods of performing this action, that is to say events, and especially those acts or deeds which are intermediary goals and carried out in order to attain a supreme goal; (e) external conditions of the action, i. e., a situation, especially the gradable situational ability of the agent at time a to cause at time b that such-and-such happens at time c (in other words: circumstances ⫺ i. e., changes and states of things ⫺ external with respect to the acting subject
660 that in themselves do not determine the event at time c nor its negation, with moment b not being earlier than a, and moment c not being earlier than b); (f) subjective conditions, i. e., a dispositional capability of action, e. g., the agent’s strength, his intellectual or manipulative ability, knowledge or skills, as well as the desire to perform the action; (g) apparatus (or gear, including instruments, motors, meters, rooms, cables, transformers, installations, supports, dams, etc.), i. e., artifacts which transmit the agent’s imprint onto a material, or which transmit and receive materials or energy (e. g., carrying information as is the case with linguistic expressions or acting as intermediaries in the reception of stimuli by the subject of action or replacing internal actions such as intellectual reflection), or which transform energy resources, or which, like a semaphore, are carriers of signals or other signs; (h) the raw material of which the object of action is made, and the stuff, i. e., the material out of which the object turned into a product was made; (i) the product, i. e., the object that is the result of action, whose state or change is the work of the agent of this action; it can be either animate, especially in cases of mental, informational imprints exerted on the person or animal to be influenced (e. g., a child brought up in some specific manner), or inanimate, called a “make”, created mainly by physical force applied to a stuff, and not able to be the subject of an action (e. g., a clay pot molded in such and such a way). Given this list of action components, we may reconstruct the form of the action concept in combination with the concept of causality which connects a cause (some energy process) with an effect (a change of some kind). Every action consists in a change of the so-called “discretionary impulse”, that is to say one depending on the agent, which is a necessary component of the sufficient condition of the subsequent result (i. e., the effect of this impulse). And this discretionary impulse consists either in some deliberate movement of the agent’s body (e. g., a pressure of the kind applied in kneading something with one’s hands) or in an act of mental exertion (e. g., focusing attention), or in ceasing, reducing or increasing this pressure, exertion or focusing. This impulse is consciously directed towards a certain goal, and is thus deliberate. An elementary action is called a “simple act”; it is an event consisting in a purposeful behavior of a single subject at a specific point
IV. Methoden der Semiotik
in time. A simple act is distinct from a complex act, either of a single subject (e. g., playing a violin, which involves simultaneously occurring simple acts as well as others occurring in succession) or of several subjects (as in the case of choir singing). A set of acts becomes a complex act when there occurs positive joint action between the various members (i. e., when one member causes, enables or facilitates another) or when negative joint action occurs (when one member prevents or hinders another or when both act in this manner towards a third member). Hence, in particular, two subjects act jointly when at least one of them helps or obstructs the other. When more than two agents act jointly, in each partial group distinguished in their team at least one member helps or obstructs at least one member of another partial group, or receives help or is obstructed. Jointly acting teams may differ as to the number of members and the number and diversity of simple acts performed. The actions may be energy-lending, such as leading a pen over paper or depressing typewriter keys, or informational, such as the transmission of thoughts by means of speech; also, actions may be autotelic, with the objective being the very performance of the action (e. g., play), and heterotelic, leading to a goal other than the action itself. In fact, it is easily seen that informational action (e. g., writing out a certificate) contains an admixture of energylending actions, and heterotelic action (e. g., a defense speech in court) has some autotelic elements in it, namely the oratory satisfaction derived by the speaker from the very action of speaking. Semiotics, a science analyzing communication processes among other things, is interested chiefly, but not exclusively, in actions that are highly informational and at the same time heterotelic in nature (cf. Art. 27). 3.3. Theories dealing with action Depending on its kind, action is the object of various theories. Some of these occur in semiotics, e. g., the theory of information, and especially a branch thereof, called the “theory of communication”, which deals with transmission, storage, reproduction and processing of information, including also electronic data processing, which is the domain of informatics (cf. Art. 125). The theory of games, treated generally as conflict situations and oppositions of interests (cf. Art. 127), has found for itself a place in semiotics, namely as game-theoretical semantics studied
31. Understanding, explanation, and action
by Jaakko Hintikka (cf. Saarinen 1979 as well as Hintikka and Kulas 1983). Agonology, or the theory of struggle, broadly understood as all kinds of negative cooperation (including competition) has applications in eristics ⫺ the art of conducting arguments, and discussions in particular ⫺ and also in the theory of argumentation, understood as rational persuasion, in sophistics as the art of persuasion with verbal deception and evasive argumentation, and in rhetoric as the theory of beautiful, ornate and captivating speech. On the grounds of game theory, theory of struggle and related theories, use is made of results of decision theory, which employs mathematical methods to determine the course of action that is optimal in the given situation, especially one that is most favorable from the practical, psychic, social or economic point of view (Pszczołowski 1978). The above theories are included in the theory of action, outlined as the philosophy of the act by G. H. Mead (1863⫺1931) in the 1920s (cf. Mead 1934) and analyzed with its sociological aspects (described as the structure of social action) by T. Parsons in the 1960s (cf. Parsons 1968 and 1971). The theory of efficient action, called “praxiology”, was put forward by T. Kotarbin´ski in his seminal opus originally published in Polish as Traktat o dobrej robocie, i. e., a treatise on good work (1965). In many articles Kotarbin´ski laid the foundations and devised the framework of this theory, created its conceptual apparatus, indicated the major problems and suggested solutions thereof, formulated metapraxiological remarks about the relations between praxiology and logic, methodology of science, philosophy of science, ethics, jurisprudence and other disciplines as well as the theory of events and systems theory. The theory of events is more general than the theory of action, which in turn comes before praxiology, since action is a kind of process or event and hence the analysis of actions, particularly efficient actions, is a special case of the analysis of processes (i. e., kinetic events consisting in changes of compound objects, also called “complexes”). The theory of action together with praxiology is a component of the theory of complexes and events postulated by Kotarbin´ski and, according to his proposal, embrace the theory of complexes and the theory of causal connection, that is to say ontological considerations of the regularities of object formation, and of processes in which these objects
661 are involved. A common ground of praxiology and semiotics is praxiosemiotics, the theory of optimal signs proposed by Tadeusz Wo´jcik (1969) together with its applications in the form of semiotechnology. 3.4. Acting in the social sciences In the social sciences action studies often take the form of analyses of interactions of members of a society treated as persons acting out various roles in this society. These interactions combine to form the cultural system ⫺ a system of verbalized beliefs and ideas of the individual agents, each of whom applies learned patterns of conduct. Every agent should be treated as both an acting subject and an object of action, both as an organism and as a personality; the latter is sometimes considered to be the sum of the contents of all the learned cultural and social patterns determining the behavioral system of a given individual. The cultural system serves to preserve these patterns, often through an institutionalization of moral values. Economic values, on the other hand, are stored and exchanged with the use of money, which plays the role of symbolic medium. The money system may be viewed as a semiotic system, and according to some even as a language, since, in keeping with a certain code treated here as a set of semiotic rules coupled with legal norms, it combines elementary units into meaningful compound wholes, expresses certain experiences of the senders and expectations of the receivers, conveys meanings, transforms certain expressions into others (e. g., the currency of one country into a currency of another), and defines the relations between money and goods according to correspondence rules. An analogous semiotic role is played by power in the domain of polity; the main relation in the suitable code is authority. In the sphere of culture the semiotic medium that is being indicated is commitment to certain values represented by specific institutions which create a network of interconnections and services, with this network serving as code. Another medium is influence on others, i. e., the ability to arrive at unanimity with them through persuasion, regulated according to a group solidarity code intended to justify allocations of loyalty. All these codes depend not only on the adopted system of values but also on external conditions and needs, since every communication and trans-
662 port ⫺ be it of people, goods or thoughts ⫺ requires physical media. Some of the latter occur in the region of interpenetration of the social and organic systems, e. g., erotic pleasure or affectation: on the one hand they are part of interpersonal relations, and on the other they belong to personal experiences of each individual. Other media ⫺ ideology, conscience, reputation, religion ⫺ are a bridge between social and cultural systems; family and kinship, upbringing, style of relaxation, and neighborliness link the social system and the personality. The social system may thus be viewed as a structure and process. Key tools of process analysis are concepts of symbolic media, with language among their number. Symbolic systems described as cultural are ⫺ according to many sociologists ⫺ a factor constituting human society since they are present in the actions of man, and they permeate the life of each individual and the community in the form of speech, ideas, expressive symbols in art, myth, ritual and religion (Parsons 1968: 458 ff). An important activity studied in social sciences is cognition of reality. Both this activity and its product ⫺ knowledge ⫺ are the object of sociology of knowledge. According to one paradigm (Merton 1957 b: 499 ff), the studies of this branch of sociology ought to focus on the following issues: (1) Where (in terms of social whereabouts) does mental production occur (e. g., in what professions, generations, social strata, historical situation, and cultural context)? (2) What is the object of study (e. g., beliefs, social norms, science), and what aspects of this object are to be taken into account? (3) What is the relation of this mental production to external conditions (is it causal, functional or, say, symbolic or expressive)? (4) What is the goal of this production (e. g., getting an idea of something, preservation of the encountered state of affairs, capture of power)? (5) When do relations between external conditions and knowledge take place? All these questions may be posed on the grounds of semiotics, which should come as no surprise since the concepts of cognition and knowledge are of semiotic character. 3.5. Communication and communication studies Sociology of knowledge deals with convictions as cultural products of social determinants (cf. Art. 15), whereas studies of com-
IV. Methoden der Semiotik
munication within the social sciences concentrate on the effect of mass media (such as the press, radio and television) on a mass audience (cf. Art. 14). The traditional approach of semiotics consists in considering a single sender of a message, a single receiver thereof, and the message, as well as relations between the message and the partners in the communication process and between the message and the sphere of reality to which it refers (cf. Art. 5). These data allow inferences about a specific, namely semiosic, aspect of relations between the communicating parties. In more recent and in-depth analysis the above elements ⫺ who communicates with whom and about what ⫺ are accompanied by four others: the context in which communication occurs, the channel through which it occurs, its objective and its effect. Sociological studies of mass communication add to this scheme. They strive to determine the channel used most often, or the one most often serving a particular kind of communication. They also try to learn who receives this message, who sends that message, how many viewers, listeners or readers does the message have, in which social circles are they to be found, in which places, and also at which times of day, week, month or year. Finally, much attention is given to the effects of communication, manifest in behaviors of the receivers prompted by the content of the message. A single act of communication is treated as one of many components of a process composed not only of repeated flows of information in both directions and between many partners but also of qualitatively different elements: logical, ethical, aesthetic, sociological, psychological, acoustic, optical and others. Both parties to the communication process act in accordance with their dispositions and are affected by specific motives. The analysis of predispositions and motives of individuals is complemented with studies of predispositions and motives of groups. The motivations concern primarily activities peculiar of the process of semiosis ⫺ the sending and receiving of messages. It turns out that we hear or see ⫺ or, more generally, perceive ⫺ only part of what we look at or listen to, depending on our psychic features, beliefs, current needs and wishes, and past experiences. We perceive more of what was sent or with greater intensity when we are intent on something, and with less intensity when we object
31. Understanding, explanation, and action
to something; we modify the meaning of the message in accordance with our own attitudes as determined by our social or cultural sphere. The motivations and predispositions of receivers also affect other activities of theirs which accompany semiosis but are outside the process itself, such as the selection of the channel of communication: whether to read the press or watch television, whether to tune in to a national or foreign radio station, etc. Connected with this is the receiver’s decision as to the selection of message senders: whether to hear, read or watch those who share our views and sympathies, those who are objective and independent, or those who are our opponents. This is also true of selections of information receivers performed by the information sender. However, these decisions are conditioned by the individual motivation and predispositions of the selecting person, who is under the influence of his own group and who may be guided by the sentiment of solidarity with it or by mindless adherence to it, and tends to make judgments, choose and decide just like the other members of the group, and even to adopt their hierarchy of values, being rewarded for all this as “one of us”; conversely, all deviations from the values accepted by the majority or from choices made by this majority are in one way or another punishable by the group. Some studies distinguish between those who communicate with others often and readily and those less willing in this respect. These two groups differ as to preferences in matters such as the selection of a television program to be viewed, and even as regards the very attitude to television. For example it was noted that communication “activists” watch television less, and when they do, the program selection they make is often in agreement with the tastes, and hence also expectations, of their communication partners. The whole issue is in fact more complex since an individual usually belongs to more than one group: to a family, colleagues from the workplace, friends outside the workplace, comrades in arms, etc. Communication with each of these sets has a diverse effect on the attitudes and behaviors of the individual partners of such dialogue. Some effects amplify each other, others reduce or even cancel each other out. Much depends here on the position and role of the given individual in each of the sets he or she communicates with, on the set’s objective and subjective impor-
663 tance for the individual, and on whether the set is liked or disliked by the individual, and on the intensity of this sentiment. This becomes apparent particularly when the expectations, wishes or effects of the various sets that are partners of the given person or group of persons are contradictory, this placing the person in a situation of conflicting solidarities or sympathies; or when the partners resort to different types of communication, some of which are appealing to the receiver and some repelling (e. g., straightforward matter-of-fact information, persuasion, pestering, threat, etc.). The relations connecting the receiver of the message, be it a person or a group of people, with these sets ⫺ either formal, such as organizations, or informal, such as a body of colleagues ⫺ to which the receiver belongs for various reasons, are considered against a larger background of effects and dependences manifest between these sets and other sets within a community. Although the receiver does not belong to the latter, it may be surmised that these may have an indirect effect on him. An example to hand is the effect of American and Western European broadcasting stations on those citizens of communist totalitarian states who were prevented from listening to them by effective jamming; being communication partners in their own group, e. g., the communist party, they received messages intent upon totally discrediting that socalled “imperialist venom”; and yet, contrary to this propaganda, these receivers were indirectly influenced by antitotalitarian ideology. The sender of a message is exposed to the same effects and dependences as the receiver, being under the influence of the social groups of which he is a member, and also of the groups with which his own groups cooperate or fight. The world outlook, convictions, ideology and education of the sender are the object of the sociology of knowledge. Other studies concern the effectiveness with which the sender communicates with his receivers; this depends, among other things, on the number of the latter. For example, it was found that as the number of receivers grows, the sender addresses more information to the whole group, and less information to its individual members. In order to keep transmitting information, he must continuously make sure that his previous messages have been received, and must monitor the response these generated. The reaction of the receivers af-
664 fects the subsequent process of communication; in particular, it affects the sender who often tailors his next messages to the expectations and actions of the environment, especially his audience or readers. We are thus dealing with feedback here, consisting in communicational interaction composed of numerous acts of sending a single message and receiving a single reply; some acts of such an exchange of messages between the sender and individual receivers take place simultaneously, others follow one another as component phases of the communication process. The messages within this process often reach its partners, the senders and receivers, in a roundabout way via other members of the group or groups to which they belong: the sender on the one hand, and the receiver on the other. Each of them is connected with his group by a network of dependences, and this also affects the course of communication. The structure of the process described here is also discernible, inter alia, in economy or politics. For example, in marketing, the consumer is treated as a receiver of such messages of the producer as sales offers, goods supplies, advertisements and price lists, and at the same time as a sender of replies, namely oscillations in demand for specific products. In nearly all instances what we have here is so-called “mass communication” that can be studied statistically (cf. Art. 5 § 3.4.4. and Art. 14 § 1.2.3.). Such studies are often prepared by analyses of communication in small groups revealing differences between face-to-face communication and communication between teams. In some analyses of communication in a small group a distinction is made between instrumental communication serving to convey instructions and information, and expressive communication aimed at defusing tensions and sustaining or restoring group solidarity. These two kinds of communication intermingle in a single communication process: instruction and information sometimes lead to tensions, with subsequent acts of expression leading to a calming of tempers. The concepts of behavior in trade or politics are particular cases of the concept of behavior in general. According to one theory, the latter consists in interaction of individual or collective partners, with one party making inferences about the thought or sentiment the other is trying to convey on the basis of the other’s behavior, and then reacting not to this
IV. Methoden der Semiotik
behavior of the other party but to its supposed thought or sentiment; the other party proceeds analogously. The entire process of interaction is thus of communicational character. It was observed that an active participation in communication of all parties, the receiver included, enhances the effectiveness of this process; moreover, the receiver who is also an active sender is more susceptible to the effect of the message. The nature of mass communication revealed by social studies differs from the traditional scheme: the sender and the receiver are not two distinct persons or two distinct groups but rather roles assumed in turn by each group, and often by individual members of these groups; each group is marked by a specific social structure; each of them is also a communication channel since communication takes place through the group’s members, often as follows: the sending team affects an individual or an opinion leader group which in turn affects the remaining receivers; the latter, reacting to the received message become senders and the communication process proceeds in the reverse direction (Riley, Jr., White and Riley 1959: 537 ff). For a comprehensive, competent and systematic treatment of the methodological character of the human and social sciences readers are advised to consult Coleman’s Foundations of Social Theory (1990); see also Art. 28, 29 and 30.
4.
Selected References
Ajdukiewicz, Kazimierz (1974), Pragmatic Logic. Translated from Polish by O. Wojtasiewicz. Dordrecht and Boston: Reidel, Warsaw: PWN ⫺ Polish Scientific Publishers. Angell, Robert C. (1957), “The Computation of Indexes of Moral Integration”. In: Paul F. Lazarsfeld, and Morris Rosenberg (eds.): The Language of Social Research: A Reader in the Methodology of Social Research. Glencoe IL: The Free Press: 58⫺62. Austin, John L. (1962), How to Do Things with Words. Oxford: Oxford University Press. Carnap, Rudolf (1942), Introduction to Semantics. Cambridge MA: Harvard University Press. Churchman, C. West, and Philburn Ratoosh (eds.) (1959), Measurement: Definitions and Theories. New York: Wiley. Coleman, James S. (1990), Foundations of Social Theory. Cambridge MA: Harvard University Press. Collingwood, Robin George (1946), The Idea of History. Oxford: Oxford University Press.
31. Understanding, explanation, and action Comte, Auguste (1968⫺71), Œvres comple`tes. 12 vols. Paris: Anthropos. Davidson, Donald (1984 a), Essays on Actions and Events. Oxford: Oxford University Press. Davidson, Donald (1984 b), Inquiries into Truth and Interpretation. Oxford: Oxford University Press. Davidson, Donald, Patrick Suppes, and Sidney Siegel (1957), Decision Making. An Experimental Approach. Stanford CA: Stanford University Press. Dilthey, Wilhelm (1914⫺1936), Gesammelte Schriften. 12 vols. Leipzig und Berlin: Teubner. Continued Stuttgart and Göttingen: Vandenhoeck and Ruprecht 1962 ff. Dray, William H. (1954), “Explanatory Narrative in History”. Philosophical Quarterly 4: 15⫺27. Dray, William H. (1957), Laws and Explanation in History. Oxford: Oxford University Press. Dray, William H. (1963), “The Historical Explanation of Actions Reconsidered”. In: Sidney Hook (ed.), Philosophy and History. New York: New York University Press: 105⫺135. Dray, William H. (1964), Philosophy of History. Englewood Cliffs NJ: Prentice-Hall. Durkheim, E´mile (1895), Les re`gles de la me´thode sociologique. Paris: Aleau. Durkheim, E´mile (1947), The Division of Labor in Society. Translated from French original (1893) by G. Simpson. New York: The Free Press. Hempel, Carl Gustav (1949), “The Function of General Laws in History”. In: Herbert Feigl and Wilfried Sellars (eds.), Readings in Philosophical Analysis. New York: Appleton-Century-Crofts: 459⫺471. Hintikka, Jaakko, and Jack Kulas (1983), The Game of Language. Studies in Game-Theoretical Semantics and Its Application. Dordrecht: Reidel. Hintikka, Jaakko, and Jack Kulas (1985), Anaphora and Definite Descriptions: Two Applications of Game-Theoretical Semantics. Dordrecht: Reidel. Joynt, Carey B., and Nicholas Rescher (1965), “The Problem of Uniqueness in History”. History and Theory 1 (1961): 150⫺162. Reprint in: George H. Nadel (ed.), Studies in the Philosophy of History: Selected Essays from “History and Theory”. New York: Harper and Row. Jung, Carl Gustav (1953⫺1979), Collected Works. 20 vols. Ed. by H. Read, M. Fordham and G. Adler. London and New York. Since 1966: Princeton: Princeton University Press. Kotarbin´ski, Tadeusz (1965), Praxiology. An Introduction to the Science of Efficient Action. Translation of Traktat o dobrej robocie (Wroclaw 1965). Warsaw: Ossolineum, and New York: Pergamon. Krantz, David H., R. Duncan Luce, Patrick Suppes, and Amos Tversky (1971⫺90), Foundations of Measurement. Vol. I: Additive and Polynomal Rep-
665 resentations. 1971. Vol. II: Geometrical, Threshold, and Probabilistic Representations. 1989. Vol. III: Representation, Axiomatization, and Invariance. 1990. New York and London: Academic Press. Kretschmer, Ernst (1921), Körperbau und Charakter. 25th edition 1967. Ed. by W. Kretschmer. Berlin: Springer. Kretschmer, Ernst (1926), Medizinische Psychologie. 13th edition 1930. Ed. by W. Kretschmer. Leipzig: Teubner. Lazarsfeld, Paul F. (1959), “Problems in Methodology”. In: Robert K. Merton, Leonard Broom and Leonard S. Cottrell, Jr. (eds.), Sociology Today: Problems and Prospects. New York: Basic Books: 39⫺78. Lazarsfeld, Paul F., and Morris Rosenberg (eds.) (1957), The Language of Social Research: A Reader in the Methodology of Social Research. Glencoe IL: The Free Press. Le´vi-Strauss, Claude (1958), Anthropologie structurale. Paris: Plon. English translation by C. Jakobson and B. Grundfest-Schoepf: Structural Anthropology. New York: Basic Books 1963. Le´vi-Strauss, Claude (1958), La pense´e sauvage. Paris: Plon. English translation by G. Weidenfeld: The Savage Mind. London: Weidenfeld and Nicolson 1966. Luce, Robert D., Robert R. Bush, and Eugene Galanter (eds.) (1963), Handbook of Mathematical Psychology. New York: Wiley. Malinowski, Bronisław (1926), “Anthropology”. In: Encyclopaedia Britannica. 13th edition. First Supplementary Volume. London and New York: The Encyclopedia Britannica Corporation. Markov, Andrej A. (1962), “O konstruktivnoi matematike” [On constructive mathematics]. Trudy Mat. Inst. Stekla 67. Mauss, Marcel (1924), “Essai sur le don, forme archaique de l’e´change”. Paris: Anne´e sociologique, N. S. Mauss, Marcel (1950), Sociologie et anthropologie. Paris: P. U. F. Mead, George H. (1934), Mind, Self and Society: From the Standpoint of a Social Behaviorist. Chicago: University of Chicago Press. Mead, George H. (1938), The Philosophy of the Act. Chicago: University of Chicago Press. Merton, Robert K. (1957 a), Social Theory and Social Structure. 2nd edition. Glencoe IL: The Free Press. Merton, Robert K. (1957 b), “A Paradigm for the Study of the Sociology of Knowledge”. In: Paul F. Lazarsfeld and Morris Rosenberg (eds.), The Language of Social Research: A Reader in the Methodology of Social Research. Glencoe IL: The Free Press: 498⫺510. Merton, Robert K., Leonard Broom, and Leonard S. Cottrell, Jr. (eds.) (1959), Sociology Today: Problems and Prospects. New York: Basic Books.
666 Morris, Charles W. (1971), Writings on the General Theory of Signs. Ed. by T. A. Sebeok. The Hague: Mouton. Nagel, Ernest (1952), “On the Statement ‘The Whole is More than the Sum of Its Parts’ ”. In: Paul F. Lazarsfeld and Morris Rosenberg (eds.), The Language of Social Research: A Reader in the Methodology of Social Research. Glencoe IL: The Free Press. Nagel, Ernest (1961), The Structure of Science: Problems in the Logic of Scientific Explanation. New York: Harcourt and Brace. Neurath, Otto (1931), Empirische Soziologie. Der wissenschaftliche Gehalt der Geschichte und Nationalökonomie. Vienna: Springer. Nietzsche, Friedrich (1967 ff), Kritische Gesamtausgabe (Approximately 30 vols. in 8 sections). Ed. by G. Colli and M. Montinari. Berlin and New York: de Gruyter. Nowak, Stefan (1965), Studia z metodologii nauk spo¢ecznych. Warsaw: PWN. Ossowski, Stanisław (1967), Dzie¢a. Tom. IV: O nauce (Works. Vol. IV: On Science). Warsaw: PWN. Parsons, Talcott (1949), The Structure of Social Action. New York: The Free Press. Parsons, Talcott (1951), The Social System. New York: The Free Press. Parsons, Talcott (1968), The Structure of Social Action: A Study in Social Theory with Special Reference to a Group of Recent European Writers. New York: The Free Press. Parsons, Talcott (1971), The System of Modern Societies. Englewood Cliffs NJ: Prentice-Hall. Passmore, John (1965), “Explanation in Everyday Life, in Science, and in History”. History and Theory 2 (1962): 105⫺123. Reprint in: George H. Nadel (ed.), Studies in the Philosophy of History: Selected Essays from “History and Theory”. New York: Harper and Row. Paw¢owski, Tadeusz (1977), Proje˛cia i metody wspo´¢czesnej humanistyki (Concepts and Methods in the Present-Day Humanities). Wroc¢aw: Ossolineum. Paw¢owski, Tadeusz (1986), Tworzenie poje˛c´ w naukach humanistycznych (Concept Formation in the Humanities). Warsaw: PWN. Peirce, Charles S. (1931⫺1958), Collected Papers. Vol. 1⫺6 ed. Charles Hartshorne and Paul Weiss. Vol. 7⫺8 ed. Arthur W. Burks. Cambridge MA: Harvard University Press. Peirce, Charles S. (1953), Letters to Lady Welby. Ed. I. C. Lieb. New Haven CT: Yale University Press. Peirce, Charles S. (1976), The New Elements of Mathematics. Ed. Carolyn Eisele. The Hague: Mouton and Atlantic Highlands NJ: Humanities Press.
IV. Methoden der Semiotik Peirce, Charles S. (1977), Semiotic and Significs: The Correspondence between C. S. Peirce and Victoria Lady Welby. Ed. Charles S. Hardwick. Bloomington IN: Indiana University Press. Popper, Karl R. (1952), The Open Society and Its Enemies. 2nd edition, revised and enlarged. London: Routledge and Paul. Pszczo¢owski, Tadeusz (1978), Ma¢a encyklopedia prakseologii i teorii organizacji (The Concise Encyclopedia of Praxeology and the Theory of Organization). Wroclaw: Ossolineum. Rickert, Heinrich (1896⫺1902), Die Grenzen der naturwissenschaftlichen Begriffsbildung. Tübingen: Mohr. Rickert, Heinrich (1899), Kulturwissenschaft und Naturwissenschaft. Tübingen: Mohr. Riley, John W., Jr. and Matilda White Riley (1959), “Mass Communication and the Social System”. In: Robert K. Merton, Leonard Broom and Leonard S. Cottrell, Jr. (eds.), Sociology Today: Problems and Prospects. New York: Basic Books: 537⫺578. Rossi-Landi, Ferruccio (1983), Il linguaggio come lavoro e come mercato (Language as Labor and Market). Milan: Bompiani. Rossi-Landi, Ferruccio (1985), Metodica filosofica e scienza dei segni: nuovi saggi sul linguaggio e l’ideologia (Philosophical Methodics and the Science of Signs: New Essays on Language and Ideology). Milan: Bompiani. Saarinen, Esa (ed.) (1979), Game-Theoretical Semantics. Dordrecht: Reidel. Schuessler, Karl F. (1968), “Prediction”. In: David L. Sills (ed.), International Encyclopedia of the Social Sciences. New York: Macmillan. Searle, John R. (1969), Speech Acts. An Essay in the Philosophy of Language. Cambridge, England: Cambridge University Press. Searle, John R. (1979), Expression and Meaning. Cambridge, England: Cambridge University Press. Searle, John R. (1984), Minds, Brains and Science. Cambridge MA: Harvard University Press. Sills, David L. (ed.) (1968), International Encyclopedia of the Social Sciences. New York: Macmillan. Spranger, Eduard (1914), Lebensformen. Geisteswissenschaftliche Psychologie und Ethik der Persönlichkeit. Halle: Niemeyer. 5th edition 1925. Suppes, Patrick (1959), “Measurement, Empirical Meaningfulness and Three-Valued Logic”. In: C. West Churchman and Philburn Ratoosh (eds.): Measurement: Definitions and Theories. New York: Wiley: 129⫺143. Suppes, Patrick (1969), Studies in the Methodology and Foundations of Science: Selected Papers from 1951 to 1969. Dordrecht: Reidel. Suppes, Patrick, and Joseph L. Zinnes (1963), “Basic Measurement Theory”. In: Robert D. Luce, Robert R. Bush, and Eugene Galanter (eds.),
31. Understanding, explanation, and action Handbook of Mathematical Psychology. Vol. 1. New York: Wiley: 1⫺76.
667
Weber, Max (1949), The Methodology of the Social Sciences. Translated by E. Shils and H. A. Finch. Glencoe IL: The Free Press.
Windelband, Wilhelm (1894), Geschichte und Naturwissenschaft. Strasbourg: Heintz. Wittgenstein, Ludwig (1958), Philosophische Untersuchungen. Philosophical Investigations. Translated by G. E. M. Anscombe. Ed. by G. E. M. Anscombe and R. Rhees. Oxford: Oxford University Press. Wo´jcik, Tadeusz (1969), Prakseosemiotyka. Zarys teorii optymalnego znaku (Praxeosemiotics. A Pre´cis of the Theory of the Optimal Sign). Warsaw: PWN. Woodger, Joseph H. (1952), Biology and Language. London: Cambridge University Press. Wright, Georg Henrik von (1971), Explanation and Understanding. London: Routledge and Kegan Paul.
Windelband, Wilhelm (1884), Präludien. Tübingen: Mohr.
Jerzy Pelc, Warsaw (Poland)
Tarski, Alfred (1935), “Der Wahrheitsbegriff in den formalisierten Sprachen”. Studia Philosophica 1: 261⫺405. Watkins, John W. N. (1953), “Historical Explanation in the Social Sciences”. British Journal for the Philosophy of Science 8: 104⫺117. Weber, Max (1947), The Theory of Social and Economic Organization (Vol. 1 of Wirtschaft und Gesellschaft. 2 Bde. Tübingen 1922). Translated by A. R. Henderson and T. Parsons. London: Hodge.
V. Geschichtsschreibung der Semiotik The Historiography of Semiotics 32. The development of sign conceptions in the evolution of human cultures 1. On the diversity of cultural symbolism in human relations 2. Toward a typology of sign systems as culture constituents 3. Evolutive processes of symbol-making since the Palaeolithic 4. Iconicity, writing and the European bias in sign theory 5. On the relationship of panchronic semiosis and cultural symbolism 6. On the fractal structure of culture, human adaptability and mnemotechnics 7. Toward a tentative typology of human culture 8. Culture planning and perspectives for applied semiotics 9. Selected references
1.
On the diversity of cultural symbolism in human relations
1.1. Man as a social being has created a multitude of symbols and sign systems to make culture work (cf. Art. 1 § 1.1.). If culture is comprised of the ways in which man lives in social groupings, his approaches to explain living conditions including the lifeand-death cycle and the ways in which he tries to understand and withstand this world, then cultural symbolism ranges from a simple stone artifact as an index of a certain level of technical advancement in lithic industries to the complex multidimensional models of the universe developed by modern astrophysics (see Sebeok 1986, 163 ff on culture as a complex issue). Therefore, when inspecting the creation and use of symbols against the background of human evolution, it is important to understand the term “cultural symbolism” in its broadest sense. Scholars in the fields of semiotics in general and of anthropology in a growing mainstream agree on the definition of culture as a shared system of symbols (for semiotics, see Cassirer 1923⫺29 and, for
more recent perspectives, the volume edited by Koch 1989; for anthropology, see Leach 1976, Arutjunov 1989). Symbolism is required in any community of human beings, regardless of space or time. Since telepathy is among the exceptional capacities found only in a few people, mankind’s cultural evolution has been depending on man’s capacities of abstract thinking and on the effectiveness of the symbolic systems created for his social organization. The use of symbols has been explained as a basic need of human beings, as “the need for symbolization” (Langer 1942, 32). In this view, symbolmaking is the fundamental process of the human mind, as fundamental as primary activities like eating or tool-making. The basicness of using symbols has been further stressed by stating that “symbols are essential for the development and maintenance of social order” (Cohen 1974, 8) which is a precondition for living in a group. Admittedly, the need for symbol-making is basic simply because, in processes of human interaction, there is no alternative to it. And yet to acknowledge the crucial role of symbol-making does not explain why human beings are in need of interaction. Symbol-making is a primary function of the human mind, and as such it depends on an underlying mental need, this being the need for identification. Recent findings in the fields of behavioral anthropology and ethnology (cf. Müller 1987) have highlighted the fact that orienting oneself as an individual in one’s surroundings is the most basic mental need from which all other activities of the mind derive. According to Watson (1989, 161), “human language and other forms of symbolic activity are logical consequences [my emphasis] of the possession of that kind of organization [that is, identity] which assigns every individual a certain singularity and re-
32. The development of sign conceptions in human cultures
veals talents inherent in its form” (cf. Art. 21 § 7.⫺9.). Identification enfolds in the dual process of finding the self as opposed to the non-self, which requires interaction by means of symbols. Thus the basic essence of cultural symbolism may be understood as providing individuals with items in which their need for identification can crystallize. In a methodological framework, “the theory of identity has to be regarded as the basic theory of all the humanities, on which the more specialized ethnological and other anthropological disciplines […] would have to be based and elaborated” (Müller 1987, 391). Since in any community there is a specific network of symbols and sign systems (language being one of them), identity is always delimited by the boundaries of a given local culture. The ethnic features of identity are thus among its most basic ingredients (Haarmann 1986). 1.2. As for the term “diversity”, this is understood here in its various senses. Diversity may be a parameter of the categorization of cultural symbolism, that is, it may refer to the nature of symbols which are associated with different levels of cultural development in human communities such as, for example, categories of tools in the Palaeolithic versus the Iron Age, categories of behavioral standards in traditional versus industrialized society, ideas about cosmogony (i. e., creation myths), marks of ownership or linguistic signs. Diversity may specify the variety of sign systems which are relevant in a given culture at a certain stage. These may be either language-related sign systems such as the spoken code, formal symbols in chemistry or the morse alphabet, or they may belong to the category of non-verbal systems such as body language, tribal heraldry or the digital processing of information. Mixed systems constitute a group of their own where language and non-language-related symbols combine (e. g., the system of traffic signs, the monetary system, heraldry in high cultures). Diversity may also refer to the differences between regional cultures in terms of a boundary marking between individual sets of locally bound sign systems. In this sense, the German and the Russian cultures are divergent because of their boundary marking in historical architecture, in craftsmanship, in civic institutions, in language (German versus Russian), religious symbolism (Protestantism/Catholicism versus Orthodox Christian-
669
ity), in the value system, in mentality and in other regards. Diversity in cultural patterns is a function of cultural pluralism which has increased ever since modern man adapted himself more sophisticatedly than archaic man to his surroundings. Among the early theoreticians to assign cultural pluralism a relevant role for theory-making was Cassirer (1944). From the standpoint of symbolism, cultural pluralism presents patterns so manifold as to spoil the neat classifications of universalists who elaborate inventories of “natural” symbols. Modern ethnological theorymaking, for instance, rejects the notion of universal symbols as unsubstantiated (cf. Douglas 1986). With respect to the time span of human evolution, diversity is a category for specifying developmental differences of sign systems involved in varying evolutionary stages in the history of man. If we are to understand modern man’s behavior, we have to look for its roots in the past (Gifford 1978 a). It is a truism that cultural symbolism and its diversity is a property of anthropologically modern man (i. e., Homo sapiens sapiens). But on the basis of recent findings in the fields of human biology and archaeology it has become apparent that cultural diversity must also be assigned to archaic man (i. e., Homo neanderthalensis and other earlier human subspecies). Archaic man created and used symbols in the same way as modern man. The earliest artifacts found in East Africa (Omo/Ethiopia, the Pleistocene basin of Lake Turkana/Kenya) are older than 2.5 million years (KiZerbo 1990, 177); the oldest finds made in Europe date back to about 0.9 million years (Lumley 1976 a). The cultural features in the communities of modern man, as compared to those among archaic man, differ in their degree of specialization and sophistication rather than in principle. Whoever is interested in discovering the basis of human culture today finds the roots in the cultural patterns of archaic man. 1.3. Since ancient times, at least since the evolutionary stage of Homo erectus (ca 1.6 million⫺ca 0.4 million years ago), man has used such sign systems as spoken language and a variety of non-verbal signs, i. e., body language (gestures, poses, mimicry, tactile means of communication). Judging from the importance of visual and tactile interaction among primates, human language “clearly evolved in a matrix of extensive non-verbal
670
V. Geschichtsschreibung der Semiotik
communication” (Tanner and Zihlman 1976, 474). These sign systems, verbal and non-verbal, may be called “primary sign systems” because the ‘tools’ for producing such signs form part of man’s anthropological structure (i. e., brain, motoric organs for uttering speech, limbs of the body). The primary sign systems of archaic man ⫺ in whatever rudimentary form they might have been elaborated in Homo erectus and Homo sapiens neanderthalensis ⫺ helped man to achieve the basic plan of social life in a community of archaic gatherers and hunters: group survival in surroundings which were
entirely dominated by the biological rhythm of nature. Archaic man did not yet interfere with this rhythm but had to conform to the laws of nature. Communication by means of the primary sign systems was indispensable for food gathering and hunting operations, for group membership, for the division of labor within the tribal organization, for the sharing of cultural patterns (e. g., animistic beliefs in otherworldly powers). In fact, the primary sign systems have proven basic in the traditional cultures around the world regardless of location or period, and in the societies of our
Fig. 32.1: A universal model of communicative competence. The alphabetical code reads as follows: AA ⫺ Social and cultural competence AAa ⫺ The range of social and cultural knowledge (including a conceptual framework which enables the individual to orient himself/herself in a community and to behave according to social and cultural conventions) AAaa ⫺ Social knowledge (including concepts which refer to items as well as relations of social life) AAab ⫺ Culture knowledge (including concepts which refer to items as well as relations in a community’s cultural patterns) AAac ⫺ Environmental knowledge (including concepts which are related to the individual’s orientation in his/her environment) AAb ⫺ The value system AAba ⫺ Culturally (i. e., ethnically) specific values AAbb ⫺ General values AAbc ⫺ Individual values AAc ⫺ The range of emotions and intentions AAca ⫺ The emotional disposition AAcb ⫺ The intentions to communicate AB ⫺ Behavioral competence ABa ⫺ Means of verbal communication ABaa ⫺ The register selection mechanism ABab ⫺ The language processing mechanism (including the capacity to encode/decode a message as well as to use language for contextualizing) ABb ⫺ Means of non-verbal communication ABba ⫺ The coordination center for non-verbal communication ABbb ⫺ The system of non-verbal means of communication (including gestures and poses)
671
32. The development of sign conceptions in human cultures
computer age the needs of basic communication are still fulfilled by speech and non-verbal signs (cf. Donald 1993, 169 f). Because of their relevance throughout all periods in cultural history and because of their reliance on basic capacities in human beings, the primary sign systems are universal to all of mankind. The attribute “universal” refers to the duality of verbal and non-verbal sign systems ⫺ as well as to the capacities for each ⫺ rather than to the organizational principles of these systems as revealed in a given culture. The universal aspect of the basic functioning of communication among human beings may be highlighted in a universal model of communication (cf. Fig. 32.1). While the number of primary sign systems is fairly restricted (e. g., speech; signs made with the help of hands and fingers; expressions of mimicry in the face; poses) the variety of secondary sign systems is practically unlimited. The significant difference of a secondary sign system as compared to a primary system is that man needs a tool for producing signs of the former. For drum communication one needs a drum, for fixating pictures and abstract symbols on the surface of a rock one needs tools for painting, scratching or incising, for writing you have to use a pen, and for making a digital system of information processing work computational equipment is needed. The more socially advanced a given culture is, the more sophisticated becomes its repertory of secondary sign systems, many of which are meant for specific use in professional fields (e. g., the sign systems in mathematics, chemistry or in meteorology), including a vast array of identification symbols (e. g., the system of logos and trademarks in the modern business world). The difference between primary and secondary sign systems lies in the use of tools or devices for secondary purposes rather than in the degree of specialization or in the restrictions of their application (cf. Art. 27 § 4.). A primary system is not necessarily less specialized only because it is more rudimentary. On the contrary, a primary system such as language may be among the most specialized of all systems. On the other hand, a secondary system is not more specialized only because it relies on additional elements. Traffic signs form a secondary system although their use is intended for anyone living in an industrialized society. Primary systems may develop specific functions as do secondary systems.
For example, the signs of Indians on the warpath are unintelligible to outsiders. A primary non-verbal system may even assume the function of a lingua franca, i. e., of serving intertribal communication. This is the case with the sign system of the North American Plains Indians (Taylor 1978). Also the repertory of gestures used by brokers in the stock exchange business is a specialized primary system. Language, the most common and widely used primary system, may likewise become specialized so that its signs become unintelligible to ordinary people. The degree of unintelligibility is a function of the increase in the terminological specialization in all fields of technology and science (e. g., of automobile industry or astronomy). Even the language used among experts in those fields which specialize in the social order of human society (e. g., law-making, practical jurisdiction, juridical implications of contracts or traffic regulations) is not necessarily meant for ordinary people’s understanding. In many cultures of the world, whistling does not play any significant role in communication. In others, however, whistle signs (without a pipe) may aid communication among human beings or among humans and animals. As a primary system, whistling is specialized, for example, to be used in business affairs among Mexican Indians in the region of Tlaxcala (Wilken 1979) or among the aborigines of the Canary Islands, the Gwanche.
2.
Toward a typology of sign systems as culture constituents
2.1. There is ample evidence that the differentiation of primary and secondary sign systems is historically related to the emergence of the duality of artifacts meant for primary and secondary use. Homo habilis only worked with implements for primary use (e. g., a stone scraper for cutting edible plants). Homo erectus was the first subspecies of man to produce not only artifacts for primary use but also for secondary use. A secondary use may be seen in the symbolic, perhaps religiously motivated function of hand axes which were elaborated with great skill but never used for any concrete purpose. One such specimen is the Acheulian hand ax found at Farnham (Surrey); with regard to its allegedly symbolic function, Campbell (1983, 23) says: “If so, the beginnings of ritual, as
672 well as of art, must together be assigned (in Europe, at least) to the era of Homo erectus.” As for the evolution of language and other symbolic activities, it has been assumed that their degree of structural development was associated with the technical progress in toolmaking. On the basis of Isaac’s (1976) classification of stone tools in the Pleistocene (i. e., the Middle Pleistocene beginning about 700,000 years ago, in particular), Foster (1990, 526 ff) elaborates presumed patterns of development in the set of distinctive phonological features (e. g., binarisms in phonology as parallel to the binarism of bifacial stone implements). Homo erectus was the first to scratch notches into a bear’s skull, which had the function of signs in a secondary system (see § 3.). The development of secondary cultural symbolism (e. g., the ritual hand ax) and of secondary sign systems (e. g., the notches on a skull) as evidenced for Homo erectus marks a decisive level of human evolution, one which has enabled man to build up ever more socially differentiated and technically advanced cultures. In the communities of Neanderthal man (ca. 400,000⫺ca. 35,000 years ago), secondary cultural symbolism is comparatively more elaborated than in Homo erectus, and also secondary sign systems are evidently more coordinated. As for secondary cultural symbolism, one may be inclined to associate the symbolic function of flowers, as in the so-called “flower burial” of Shanidar (northern Iraq) described by Solecki (1971), the custom of covering the body of deceased ones with red ochre (as a symbol of life) and the use of perforated teeth of wolves as amulets as belonging to the same magico-religious system. In the field of secondary sign use, there are instances of abstract symbols scratched onto the surface of various materials by Neanderthal man (e. g., the sign of a cross on a pebble; further examples are discussed in § 3.). Neanderthal man was also better organized than Homo erectus as far as implements for primary use are concerned. Technical skills were far more advanced, as evidenced by the higher quality and specialization of stone tools. Among others, the spear with an inserted sharp stone is an invention of Neanderthal man, a much more precise weapon than the spears with fire-hardened tips used by Homo erectus. 2.2. Whatever implements of primary and secondary use and whatever sign systems
V. Geschichtsschreibung der Semiotik
Homo erectus and Neanderthal man may have elaborated, they are all surpassed, in their effectiveness and sophistication, by the cultural symbolism and the sign systems of Homo sapiens sapiens, modern man. In the archaic cultures of modern man, the oldest dating back some 50,000 to 40,000 years, technical skills in tool-making were still similar in different parts of the world. Only as late as the Mesolithic age, a transitional stage between the Palaeolithic and the Neolithic, do regional differences become more marked, and the beginning of the Neolithic sees the formation of regional cultures with individual features. Although less visible and less broadly evidenced, cultural diversification according to regions is a characteristic not only of modern man but something which is already found in the communities of Homo erectus and of Neanderthal man. The more diversified the cultural symbolism was, as manifested in artifacts and/or sign systems, the more marked are local specifics. Since the cultural embedding of social life in the communities of Homo erectus and of Neanderthal man was less sophisticated than with modern Homo sapiens, their cultural patterns reveal a comparatively lesser degree of divergence. Cultural diversification is predominantly a matter of content and less so of the techniques applied. For instance, the outer shape of dwellings (e. g., a round hut) may be very similar in many regional cultures while local sign systems may differ significantly. As another example, rock carving techniques (i. e., painting, scratching, carving) are similarly used in many parts of the world although the contents of pictorial scenes, the ways in which pictures are composed and the selection of concrete and abstract motifs show great local variety. The phenomenon of cultural diversification is not surprising when inspecting the network of primary and secondary sign systems which have been devised by archaic and modern man from the earliest times of mankind up to the present (cf. Table 32.1). 2.3. According to their range of application, sign systems may be elementary or specialized. A sign system is elementary if it is used without restrictions, so that its functions are shared by all members in a given community. Language is a primary system by its nature (see § 1.) and an elementary system by its range of application. All human cultures function with language. At the same time,
Cultural stages
Traditional cultures
High cultures and industrialized society
⫺ Digital processing of information ¸
⫺ Symbolism in games (e. g., board games) ⫺ Identification symbolism (e. g., marks of ownership, trade marks) ⫺ Heraldry (e. g., symbols of authority, seals) ⫺ Numeric notation ⫺ Weights, measures and the monetary system
⫺ Magic and religious symbolism
⫺ Gestures and poses (minicry)
Elementary systems
⫺ Pictographic writing ⫺ Notation of music ⫺ Sign systems in professional fields using logographic symbols (e. g., mathematics, astronomy) ⫺ Traffic signs and signals ⫺ Sign ‘language’ for deaf and dumb people (gestural code)
⫺ System of gesture signs and symbols (used as a means of interethnic communication among the North American Plains Indians) ⫺ Drum ‘language’ ⫺ System of smoke signals ⫺ Whistle ‘language’ (e. g., among Mexican Indians in Tlaxcala) ⫺ Symbolism of pictorial literacy
⫺ Symbolism in ceremonial and ritual dances
Specialized systems
Non-verbal sign systems
Table 32.1: A systematic overview of cultural sign systems
¸
⫺ Phonographic writing systems (syllabic, alphabetic)
⫺ Language (signs of verbal behavior)
⫺ Flag signalling ⫺ Morse system ⫺ Sign systems in professional fields (e. g., chemistry) ⫺ Sign language for deaf and dumb people (finger spelling)
Systems related to alphabetic writing:
Language and language-related sign systems Elementary systems Specialized systems
32. The development of sign conceptions in human cultures
673
674
V. Geschichtsschreibung der Semiotik
language is a timeless requisite which has not lost any of its elementary functions from archaic times up to the present. Despite this outstanding property of language as a universal ingredient in human relations, its relative role in the making of culture has to be emphasized, that is to say that language never functions as the only elementary means of communication in any culture. Rather, language is always embedded in a network of elementary (and, if developed, secondary) sign systems. In each culture, there is the duality of language and non-language-related sign systems. The degree of complexity of the network in an individual culture is determined by the level of cultural evolution. In Table 32.1 a hierarchy of sign systems is proposed, ranging from the minimal duality of language and a system of gestures and poses in archaic culture to a complex network of elementary and specialized sign systems in industrialized society. In the framework of cultural evolution, the role of writing is ambiguous. From the standpoint of the transition to the stage of high culture (as in the archaic civilizations of antiquity) writing is a specialized sign system with a restricted use among the members of a literate elite. In industrialized society, writing is an elementary system which is promoted by public education. This is true for literacy in countries such as Germany, Sweden or Japan. As regards its range of application, writing may take over the role of a specialized system serving for a minority of the population even in an industrialized country. For example, only one third of India’s population is literate. In other words, the great majority of the people in India do not have access to literacy and do not share the benefits related to it.
3.
Evolutive processes of symbolmaking since the Palaeolithic
3.1. Arguably, Homo erectus was already quite successful in his adaptability since there are early manifestations of cultural innovations made by this species (see below). When inspecting the technical innovations achieved by Homo erectus one is surprised to learn that in the European context the pace of cultural evolution was more dynamic at crucial times than elsewhere. This observation, however, does not allow the assumption of a breaking off in the evolution of archaic man in Europe
from the development in the rest of the world. And yet, there has been what may be called a specific European impact on the cultural evolution of man since earliest times. The nature of this European impact can best be documented in terms of evidence of man’s adaptability to his environment. With regard to cultural diversity Europe holds the edge, as exhibiting a greater variety of local cultures in ancient times than other continents. One of the major achievements of Homo erectus was the use of fire, although its actual mastering may have taken a long time of experimenting (Posner 1990, 55 ff). The oldest evidence for the mastering of fire comes from Europe. Mankind’s oldest fireplace was found at Terra Amata (Maritime Alps), dating back to “the Mindel glaciation” (Roche 1991, 42). As regards the elaboration of secondary sign systems, the beginnings also lie with Homo erectus. In one of the caves in the mountainous region of Karabakh (western Aserbaijan), in the Azykh cave, the skull of a bear with man-made notches was found (cf. Fig. 32.2). The cultural strata with this par-
Fig. 32.2: The oldest man-made notches on a bear’s skull, from the Azykh cave in Aserbaijan. Age: ca. 430,000 years (Gusejnov 1985, 16 f).
ticular find dates back to the lower Acheulian period, to about 430,000 years ago. “All the notches are made by dented tools with bifacial edges. The notches seem to be related to some religious ideas of the Azykh people” (Gusejnov 1985, 68). Obviously, the abstract signs on the skull had some symbolic meaning. The positioning of the skull (whose lower jaw was deliberately removed) near the
32. The development of sign conceptions in human cultures
hearth is noteworthy, as is the assembling of two lower jaws from bear skulls in the form of a cross. Judging from circumstantial evidence one can assert some magical purpose in connection with the cult of the cave bear (Haarmann 1992 a, 55 f). Continuing into the cultural stage of Neanderthal man there is evidence of specific developments in the European context, and trends of cultural innovation in Europe are reinforced. As a general observation, “by 150⫺200 thousand years ago, European populations begin to diverge from archaic sapiens populations elsewhere” (Pilbeam 1988, 134). The anthropological properties of Neanderthal man are best evidenced from finds in Europe and west Asia. So is their primary and secondary symbolism, with its prominent features best documented in Eurasian sites. Most of the archaeological evidence for symbolic thought “comes from the Mousterian period and the Eurasian area of Neanderthal habitation” (Marshack 1990, 459). This, however, cannot be interpreted as a lack of the capacity of symbolic thought in Homo sapiens outside Europe. Rather is it indicative of a more flexible adaptability of archaic man in the European environment. Neanderthal man’s artistic skills are evidenced from early European sites, for instance a carved mammoth tooth plaque (ca. 100,000 years old at Tata, Hungary) or pendant beads with bored holes (ca. 110,000 years old at Bocksteinschmiede, Germany). Although still a matter of scholarly dispute, there may be evidence for archaic man’s skill in sculpturing, for instance figurines of bears made of flint stone. Among the inventions of Neanderthal man in Europe are objects with various functions made of bone material such as needles, flutes and drums. The use of red ochre is evidenced in Europe (since the late Acheulian, ca. 120,000 years ago) for archaic man (Marshack 1981), in other parts of the world, however, only for modern man (Boshier and Beaumont 1972 for the Mesolithic in Swaziland). As an example of archaic man’s sense of abstraction and symmetry, I mention the fossil nummulite from Tata (Hungary) on which a cross sign is engraved. With the appearance of modern man, the impact on symbol-making becomes more dynamic. Still in the period of the Upper Palaeolithic, the evidence for symbolic production comes predominantly from Europe (Belfer-Cohen 1986). Among the outstanding genres of artistic activities are sculpturing
675
and painting. The oldest evidence for these activities dates back to the Aurignacian period. From the very beginning of sculpturing in Europe there is variety in style and motif. Seemingly, human figures, female in particular, were preferred (e. g., the “Venus statuettes” from Lespugue, Willendorf, Modena or Mentone, and from other sites; cf. Graziosi 1987, plates 2⫺12, Champion et al. 1992, 85), but also animal carving was practised (e. g., the ivory carving of a male with a lion’s head from Vogelherd in Germany, antlers with elk’s head from the caves of Laussel and Lascaux in France; cf. Graziosi 1987, plate 13 ff). 3.2. European cave painting shows a great variety in motifs, style and in the complexity of pictorial compositions during the Upper Palaeolithic (Biedermann 1984). Cave and rock painting was also practised outside Europe, and some sites in Africa and Australia are among the oldest in the history of rock art (see Anati 1984 for a world report). This is true for the paintings in the Apollo 11 cave in Namibia (Wendt 1976) and for several sites in Arnhem Land (Northern Territories, Australia), for instance, for the one at Cleland Hills and the Yuwengayay Leichhardt Gallery (Walsh 1988, 68 f, 250 f). For a stylistic comparison of early rock art and for establishing relative evolutionary sequences in the composition of motifs there is, even today, more material available from European sites than from those in other continents. There are two facets by which early cave art distinguishes itself. One is the compositional technique of combining two categories of symbols, namely naturalistic or sub-naturalistic motifs with abstract symbols, linear and stylized. If man’s general capacity of using symbols is the key to culture, then the capacity of distinguishing between iconicity and abstractness as two cognitive procedures is man’s practical approach to symbol-making. In the early cave paintings, the two techniques are applied in compositions from the beginning. The other outstanding characteristic is that this duality in pictorial techniques exhibits a parallel manifestation in “the appearance of both representational and non-figurative mobile art” (Straus 1990, 293). Evidence for this is found in the caves of Levantine and Vasco-Cantabrian Spain as well as in the French Pyrenees.
676 3.3. The parallelism of iconic and abstract motifs is a manifestation of the cognitive capacity of distinguishing between motivated and arbitrary symbols (cf. the discussion of the ‘correctness’ of names in Plato, Art. 40 § 3.). There is no evidence for the traditional claim that naturalism is the oldest trend in painting and carving and that all abstract symbols somehow find their origin in figurative motifs. Among the earliest pieces of decorative art are ornamentations containing circles, dots and wavy lines. A noteworthy example is the “cosmogony” on a plaque from Malta in Siberia (ca. 30,000 years old; cf. Anati 1989, 57). In the chronological sequence established for the paintings in the cave of Lascaux, for example, sub-naturalistic motifs (“pre´figuratif ” in the French terminology applied by Leroi-Gourhan 1968) are the oldest (cf. Ruspoli 1987, 196). In a subnaturalistic picture, only the main traits of an object (e. g., an animal) are rendered, neglecting details, which provides a more or less stylized version of a thing in nature (cf. Anati 1979, 143 ff). Sub-naturalistic motifs require the command of both techniques, as a cognitive prerequisite for identifying the abstraction of a thing with the thing itself. As for the abstract symbols (square-, crossor circle-shaped motifs, strokes, dots, etc.), only few shapes can be identified as stylizations of real things without difficulty (e. g., the shape of a feather, a tree or a key; for examples see Haarmann 1990 a, 53). The latter comparison of certain Stone Age symbols with a key produces an anachronism and clearly shows the observer’s dependence on associational links found in his/her modern surroundings. Taking into consideration that modern man has, since he first emerged, possessed the capacity of producing abstract symbols, one has to acknowledge that our Palaeolithic ancestors already mastered the basics of notational systems including abstract signs to convey meaning. It has long been argued that the pictorial compositions of the cave paintings constitute a great deal more than “pure art”, although much of the meaning which underlies the repertory of naturalistic scenes and the alignment of abstract symbols remains hidden. Anati (1989, 161 ff) has categorized many compositions of cave paintings according to the nature of their symbol components. He distinguishes between pictograms (pictures of real things, animals, humans or mythical beings), ideograms (abstract forms which occur
V. Geschichtsschreibung der Semiotik
repetitively in the compositions, as individual symbols or in groups), and psychograms (symbols which stimulate sensational impressions in the observer). The latter category, according to Anati (1989, 173), conveys a more diffuse meaning than a sign, and a psychogram would be equal to the visualization of Jung’s category of the archetype (e. g., a spiral for expressing eternity, the imprint of a hand as a manifestation of the human spirit, a vulva for associating fertility). In Anati (1989, 184), a typology of cave and rock art is presented, relating techniques, motifs and the complexity of their ensembles to stages of cultural evolution (i. e., from the stage of archaic hunters to one of a complex economy). More system-oriented is Marshack’s approach (1972 a), which identifies certain sequences of abstract symbols as notations. Based on the assumption that individual abstract symbols in a given cultural setting must belong to a system with a limited number of conventional signs, Marshack (1972 a, 213 ff) interprets certain sign ensembles as notations of time, for instance, the strokes occurring in groups on a “commando stick” from Cueto de la Mina as fixating information about moon phases. Such notational systems ⫺ which Marshack (1990, 481 f) calls “one of the most complex cultural developments of a hunter-gatherer society in the record of anatomically modern man” ⫺ are, at least for the Palaeolithic period, only reported from European settings, and so far more than two dozen symbol systems are known. Ensembles of abstract motifs with possibly notational value are also known from Australia (Anati 1989, 198), but these date from the Mesolithic or Neolithic period. Regardless of whether Marshack’s daring interpretations are valid to the extent of precision that he claims, his approach of a notational interpretation seems highly probable and fits well into the pattern of modern man’s cultural evolution. The notational character of the early sign systems highlights the chronological sequence in sign-making: visual signs for numeric concepts precede those for visualizing speech. In the world’s cultural heritage, one finds notational experiments which illustrate how closely the needs to mark numeric and cognitive units are connected with the ways of man’s creative spirit to discharge a notational system of its depending on additional verbal explanations about the contents of messages.
32. The development of sign conceptions in human cultures
In the system of the Inca khipu (cf. Art. 99), a primary numeric notation has been combined with a secondary pictographic component. The main function of the khipu to visualize numeric concepts by a specific knot technique made most scholars believe that khipu was confined to this notational realm. However, a closer inspection of knot ensembles revealed a symbolic interplay of knots, colors and their combinative order which also makes it possible to record ideas associated with numbers. “In fact, by using different combinations of colors and twisting techniques, it is possible to establish several hundreds or even thousands of different categories, such as domesticated animals, cultivated plants, wild animals, etc.” (Pärssinen 1992, 37). Messages of a fair degree of complexity could thus be conveyed, such as the following: “When the marque´s went to Bombo´n [from Cajamarca] we gave him 826 men [and no women] and all of them were lost during the expedition” (cf. Fig. 32.3). The duality of iconicity (as expressed in pictures and motivated signs) and abstractness (as expressed in arbitrary symbols) has been a feature of cultural symbolism since Palaeolithic times. When writing systems originated as a transition from earlier pictorial-notational techniques to a language-ori-
677
ented fixation of information, the older duality of iconicity and abstractness was preserved and applied in the domain of symbolmaking for the purpose of visualizing speech. In the evolutive process of elaborating writing systems, it can be observed that the higher the degree of technical perfection of a system, the higher the proportion of arbitrary signs. The highest level of development in this regard is alphabetic writing, and perhaps the most “perfect” system is the Korean alphabet, hangul (cf. Art. 94 § 4). Among the early experiments with the duality of iconicity and abstractness in the sign repertory of a script, the Old European variant of writing has to be highlighted as outstanding because of its marked tendency toward high-degree stylization (see Haarmann 1992 b for details of the script and cf. § 7. for an outline of Old European civilization). As other archaic writing systems (e. g., the Indus script, Sumerian pre-cuneiform writing, as described in Art. 89 § 2.1. and ancient Chinese writing, as described in Art. 93 § 2.), the Old European system is also comprised of motivated and arbitrary signs (i. e., ideographic versus abstract signs). The Old European script distinguishes itself from the other mentioned systems in that the portion of abstract signs is exceptionally great. Only for
Fig. 32.3: The notational effectiveness of an Inca khipu.
678
V. Geschichtsschreibung der Semiotik
Table 32.2: Multiple variation of the Basic sign
Reference number
sign in the Old European sign repertory Simple variation
one fifth of the sign inventory can naturalistic origins be identified. The great majority of signs are abstract geometrical motifs which do not indicate their possibly motivated background. The only system to which the Old European script may be compared for its proportions of motivated and arbitrary signs
Reference number
Complex variation
Reference number
is the Indus script, which also contains a remarkably high proportion of abstract signs (cf. Haarmann 1990 a, 162 f). Of the motivated signs some depict animals, others plants, tools, structures (e. g., a ship), and natural phenomena (e. g., the sun, a river). For several of the motivated signs, pictorial
679
32. The development of sign conceptions in human cultures
sources as associated with the religious symbolism of Old Europe have been identified (cf. Haarmann 1994 a, chap. 2), for example, for the signs depicting a sacred ship (used in processions), a shrine near a spring, a riverine place as a natural sanctuary of the water goddess, a pair of protecting eyes and a cat’s head which, according to the mythological embedding in the Old European and Ancient Aegean context, is suspected to “stand in close association with astral beliefs” (Grumach 1967, 7). The great majority of signs in the Old European repertory are arbitrary; there are at least no clues yet which would allow for the reconstruction of iconic sources. It is not conclusive to assume an intermediary stage of hidden stylization of a former pictorial symbol for those signs the arbitrariness of which is obvious to a modern observer (e. g., geometrical forms such as a circle, a square, or a cross). Most of the abstract symbols may well have been arbitrary from the beginnings of their use as signs of the Old European script. As such, their external shape underwent little or no change during the almost two millennia of literacy in Old Europe. The distribution of motivated and arbitrary signs in the repertory has to be understood as representing a continuum of exclusively motivated elements, originally motivated elements which appear in different degrees of stylization, and exclusively arbitrary elements with no recognizable iconic origins. This continuum in the oldest writing system of mankind reflects the duality of iconic and abstract symbolism which has been present since the earliest manifestations of man’s organizational spirit in art, religious symbolism and notational systems. 3.4. In the Old European inventory of abstract signs is revealed a sophisticated organizational principle which may be termed “multiple variation”. A number of signs serve as the basis for variation which may be simple or complex. In a categorization of the signs according to their structural components, certain groups of signs consisting of a basic shape, simple and/or complex derivations can be identified. Among the basic signs which have produced a multitude of variants are the V sign, the vertical cross and the diagonal cross. As an example the group with the V sign as a basis is illustrated here (cf. Table 32.2). In most cases of variation, strokes serve as distinctive graphic markers while the
dot, the cross or other markers are less common. This technique of varying basic signs by markers resembles similar practices at later stages in the evolution of writing and deserves to be termed “diacritical”. Thus, the world’s oldest diacritical system originated out of the cultural settings of Old Europe. The great disproportion of motivated and abstract signs in the repertory finds its expressive parallel in the decorative art and religious imagery of Old Europe. In this domain a strong tendency toward stylization is also apparent. The artistic patterns which emerge are typical of incipient civilization. “As in the archaic art of many civilizations, the creation of recognizable and symbolic forms was already a sufficient achievement ⫺ easy verisimilitude, relaxed and informal, was in the future” (Renfrew 1972, 439). The “naturalism” of Old European art was rigid and dominated by stylistic features. This gives Old European art a strange flavor which, however, should be understood as an artistic feature resulting from societal constraints and one in its own right rather than as stylistic incompetence. A truly naturalistic style emerges later in ancient Crete, where the pictorial representation of human beings, animals, plants and other things in sculpturing and wall-painting (e. g., in the frescoes from Thera or Knossos) achieves a remarkable degree of individuality (cf. Art. 44 § 2.1.).
4.
Iconicity, writing and the European bias in sign theory
4.1. Pictures and pictorial representations ⫺ in artistic activities or as elements of notation ⫺ have never lost their importance as constituents of culture, regardless of whether a script exists in a given society or not and, if so, whether its signs are motivated or exclusively arbitrary. In literate societies, people have lived with icons and arbitrary signs whereby the semiotic impact of each category on local cultural patterns may vary considerably (cf. Haarmann 1990 b, 195 ff). In a world-wide comparison, a stable relationship between iconicity and writing becomes apparent. The more iconicity is preserved in the signs of a writing system the more the written word assumes features of the real thing it denotes in the mind of the users of the script. Thus, in cultures with ideographic writing or with a script that incorporates a considerable logographic component, writing readily ex-
680 ceeds the limits of being a mere practical device for rendering information in a reusable form. A typical example of writing as a crystallizing focus of cultural identity in form and content is found in the cultural sphere of Chinese literacy (see Haarmann 1990 b, 132 ff for the impact of writing on the Chinese mentality). In those countries where the tradition of Chinese writing has continued uninterruptedly (i. e., China, cf. Art. 93; South Korea, cf. Art. 94; and Japan, cf. Art. 95) culture is readily identified with the range of the written word. In a sublime form, the vitality of the written word and its floating boundaries with the domain of reality are manifested in the tradition of Egyptian hieroglyphic writing (cf. Art. 89 § 2.1.). Writing in ancient Egypt exhibited all those features we might associate with hieroglyphic signs: highly stylized graphic shapes of real things, regardless of whether the signs were used as logograms or as segmental units with phonetic value. Arguably, in no other script of the world has the written word been so strongly identified with the real thing as in ancient Egypt. Illustrative examples of this kind of identification are the innumerous reliefs found in Egyptian tombs in which offering scenes are depicted. The pictures of the individual goods are accompanied by their corresponding names written in hieroglyphs. In those settings, pictorial scenes and writing both serve the purpose of guaranteeing the exactness of specification of offerings and the ritual act (see Haarmann 1990 b, 249 ff for the analysis of a tomb relief). The tendency to identify the written word with the essence of the real thing it denotes is also observable in the cultures of the ancient Near East, although not as marked as in ancient Egypt. Repercussions of this tradition are still apparent in biblical symbolism. Although written in arbitrary letters, the name of the Jewish God, “Jahwe”, was considered to contain the essence of the divinity as if it were its epiphany. Therefore, no ordinary Jew was allowed to utter the holy name, and only Moses and the high priest Aaron, on special occasions, pronounced God’s name in the holiest of the holy. For the purpose of reading the Bible, synonyms for “Jahwe” were used, such as “Adonai” or “Elohim”. Another reflection of the Oriental syncrecy of iconic and arbitrary conceptualization is the mysticism of the Kabbala which assigns each of the letters of the Hebrew al-
V. Geschichtsschreibung der Semiotik
phabet a creative force which, in the totality of the 24 letters, is responsible for the creation of the world (cf. Art. 61 § 3.1.). 4.2. In Europe, with its alphabetical tradition of literacy, the arbitrariness of the letters has always dominated people’s attitude toward writing. Where, in the cultural history of Europe, there are instances of an acknowledgment of language as a creative force in its own right, this is associated with speech rather than with its written form. For example, in the sanctuary of Asklepios in Epidauros, the vowels of the Greek alphabet were pronounced by priests in a ritualistic act to serve therapeutic purposes. According to the gnostic tradition, in which elements of the Hellenistic and Oriental world views were merged, individual Greek letters and/or linear sequences of letters were assigned a protective function when appropriately aligned on a talisman (cf. Haarmann 1992 a, 253 f). In the later history of European cultures, however, only lingering traces of the belief in the immanent force of writing in general and of individual letters in particular survived, as in the secrets of magic runes, especially in Scandinavia, and in the association of the letters of the Ogham alphabet with the names of holy plants in Celtic mythology (cf. Daniels and Bright 1995 as well as Art. 36 § 9.1.). While meaning is associated with the written equivalent of linguistic signs in logographic-ideographic systems, it is dislocated when following the phonetic principle of writing. In syllabic and alphabetic writing, the written sign is as arbitrary as the phonic sequence of a linguistic sign (cf. Table 32.3). Europe has known all types of writing systems: the logographic-ideographic variant (e. g., Cretan hieroglyphics), the logico-syllabic variant (e. g., Linear A and B), the purely syllabic variant (e. g., Cypro-Minoan and Cypriot-Syllabic) and the alphabetic variant (e. g., Greek, Etruscan, Latin alphabet). As alphabetic writing has, since antiquity, dominated literacy in all parts of civilized Europe, it has exerted a profound impact on European people’s mentality, their reasoning about culture and their world view. In the classical Greek context, the alphabet with its arbitrary letters did not develop, as it has been claimed, the sense of abstractness or logical thinking among the Europeans (which had originated before the introduction of alphabetical writing), but it may be held responsible for the monopoly of the an-
32. The development of sign conceptions in human cultures
681
Table 32.3: A typology of mnemonic and writing systems
Selected examples illustrating the individual techniques for the fixation of ideas (as regards the techniques mentioned under 1⫺5): Technique
Specimen of writing
Explanations
Pictorial
Cultural context: Symbol from the Walam Olum, the tribal chronicle of the Delaware, recorded in the kekinowin technique of pictorial literacy Reading: Manitodasin mokol witcemap “palpal!” payat payat wemitcemap Translation: ‘The moon woman saved the people and took them into her boat’
Pictographic
Cultural context: Symbol from the inventory of Aztec glyphs Reading: tetl Meaning: ‘stone’
(picture of a stone)
Ideographic (a foot, water flowing from a jug) Logographic
Syllabic
&
Cultural context: Egyptian hieroglyphs Reading: wcb Meaning: ‘pure’
Cultural context: European tradition of literacy Reading: and (English), und (German), et (French) Meaning: ‘and’ Cultural context: Symbol from the Japanese syllabary hiragana Syllabic value: mi
682 tique tradition in reasoning based upon abstract thinking which modern Europeans still share and which has been termed “logocentrism” by Derrida (1967). The priority of the categories of the logos (thought, reason, logic) over those of the pathos (feeling, sensual experience, emotion) may be considered a repercussion of alphabetic abstractness on the human mind. Accordingly, writing has been appreciated as one among many features by which a modern culture characterizes itself. While in many African traditional cultures (cf. Art. 91), speech is evaluated (in its central function of interaction) as more vital for community life than the weak written word, and the spoken word is attributed the value of an authoritative force, the aim of achieving and elaborating literacy has been typical of any European culture, be it among the historical nations such as the French, Germans or Russians or among linguistic minorities such as the Lapps, the Sorbs or the Basques. The specific European facet in the literacy drive since antiquity is its association with the mother tongue. In the early Middle Ages large parts of Europe were already literate, but in languages which were foreign to most of their users (i. e., Latin in the western hemisphere, Greek in the eastern hemisphere). In an exceptionally powerful drive of ethnic selfawareness, the regional cultures of Europe elaborated written standards for their local languages which, via a phase of literary diglossia, eventually led to the abandonment of the former vehicles of high culture, Latin and Greek (see Haarmann 1993 a, 144 ff for an historical outline). At those times when writing was adopted for the larger and smaller mother tongues of Europe, with active periods particularly during the Middle Ages, the age of the religious controversies in the sixteenth century, the age of Enlightenment, and the nineteenth century, there was no alternative to the alphabet. In Europe, the cultural conditions did not offer the alternative of choosing between ideographic and alphabetic writing as, for example, in Korea (cf. Art. 94 § 4.) and Vietnam (cf. Art. 96 § 6. and 7.). Literacy, achieved through the adoption of the alphabet in association with Christianity’s civic institutions, has been the basis of cultural evolution in most parts of Europe into the twentieth century. Also in areas of Islamic culture (i. e, among the Turkic peoples in the Volga re-
V. Geschichtsschreibung der Semiotik
gion, in Aserbaijan), alphabetic literacy was the only choice (cf. Art. 90 § 3.5.). Language-oriented nationalism, particularly geared to the needs of written communication, has been a characteristic facet in the cultural history of Europe since at least the Middle Ages. There are many instances of disputes over the role of the national language and its written form which bear witness to early language-oriented nationalism in Europe. Let us recall that the monk Chrabr, in his treaty O pismenech (‘About the letters’) of the ninth century, defended the Cyrillic (Christian) script and the Old Church Slavonic language in the Slavic state of Bulgaria against the Greek alphabet with its pagan (!) origin and against the ByzantineGreek media of Christianity. Another instance of state language nationalism is the monopoly of French as the only official language in France which was achieved via a series of royal language decrees in the fifteenth and sixteenth centuries. In eastern Europe, tsar Peter the Great (d. 1724) became a radical promoter of language-oriented nationalism. He instigated the radical shift from Church Slavonic to Russian, and the modernization of the latter in the early eighteenth century involved all manner of comprehensive national language planning (see Haarmann 1993 a, 271 ff for details). 4.3. The national language ideology prevailed, as a concept of philosophical and political thought, when the comparative study of language emerged out of the tradition of reasoning about the constituents of culture. There were two branches of linguistics from the beginning, the historical-comparative and the typological one (Haarmann 1976, 9 ff). Since the historical-comparative approach of the study of genealogical affiliations merged with the trend of cultural historicism among the European nations that were in search of their ethnic roots, this branch of linguistics enjoyed greater attention and was regarded as playing a more important part in the study of language. The branching of general historical linguistics into individual disciplines (i. e., Romance, Slavonic, Celtic, Germanic linguistics) in the nineteenth century definitely was a supporting mechanism for the increase in national self-awareness among the nations whose members spoke those languages (Haarmann 1993 a, 248 ff). The emergence of structuralism toward the end of the nineteenth century has to be evaluated
32. The development of sign conceptions in human cultures
against the background of the national language tradition with its alphabet-bound literacy in Europe. Associating structuralism with the French linguistic tradition in the twentieth century and with F. de Saussure as its initiator has been a custom ever since structuralist ideas spread with the Cours de linguistique ge´ne´rale of 1916 (cf. Art. 101). This linkage is a stereotype which needs modification. The essence of linguistic structuralism is found as early as 1891, namely in the comprehensive work Die Sprachwissenschaft by G. v. d. Gabelentz (see Coseriu 1969). Among the differences between the two basic sources of early structuralist ideas (i. e., Gabelentz versus Saussure) is the higher degree of radicality with which concepts are introduced and categories applied in the Cours. For example, the written equivalent of the linguistic sign is neglected in the Cours, whereas Gabelentz is aware of the Far Eastern tradition of Chinese literacy and its impact on culture. The Cours presents much less data for a cultural embedding of language than the text of Die Sprachwissenschaft. In addition, relating Saussure’s name directly to the Cours as if he were its author is in need of modification too. Judging from the way in which Saussure’s pupil Sechehaye organized the text on the basis of his notes, the question is reasonable to ask whether Saussure was a pupil of Sechehaye, and not vice versa (Wunderli 1976). All in all, the Cours owes much of its attractiveness as a source of theoretical reasoning to Sechehaye’s skillful presentation. Regardless of whether Gabelentz or Saussure is regarded as the father of structuralism, the basic ideas elaborated by them amounted to a rebellion against the historical method. In the opinion held by the representatives of historical linguistics, synchronic linguistics was simply regarded as impossible or as yielding no substantial results. The rejection of the written language as the basis of theoretical reasoning and of writing as a quantite´ ne´gligeable meant a deep cut into the roots of historical linguistics which, in the nineteenth century, mainly depended on the written equivalents of words as older sources. Typically European is the thinking in terms of the exclusive binarism of the linguistic sign, something which is as typical of Gabelentz as it is for Saussure. The differentiation of signifiant and signifie´ (in the Saussurian terminology) and the equation of the arbitrary sign with the phonic (that is, not writ-
683
ten) sequence is a true European bias resulting from the Europeans’ dependence on the alphabetic principle. Structuralists have neglected writing and the written code for decades. Until recently, only the members of the Prague School have taken the duality of the spoken and written code seriously (e. g., Vachek 1973). The repercussions of classical structuralist ideas in America were even stronger than in Europe. As late as the 1970s, the situation was described by Minkoff (1975, 194) as follows: “Writing systems as such are virtually ignored by modern American linguistics”. If Saussure and the other representatives of European and American structuralism had not been Europeans but educated in a sphere of non-alphabetic writing (e. g., in the Far East) and if they had taken into consideration the role of language in a magico-mythical context (cf. § 5.), then they would definitely not have elaborated and applied such a limited concept of the linguistic sign. Europeans and Americans, generally speaking, lack the cultural background which is needed for understanding that the written equivalent of the linguistic sign is a category in its own right, and that the phonic and the written equivalents have to be reconciled in a sign theory which claims to be comprehensive. In Haarmann (1990 b, 35 ff), a fundamental distinction is made between the basic structure of the linguistic sign (⫽ phonic sequence) and its extended structure (⫽ written equivalent; cf. Fig. 32.4). Taking into consideration writing systems other than the highly specialized alphabetic script, one becomes aware that the extended structure of the linguistic sign presents a continuum of motivation and arbitrariness. Stylization of the shapes of signs determines the degree of motivation as against arbitrariness. This continuum produces a matrix which differs from the corresponding continuum (i. e., motivation versus arbitrariness) as valid for the basic structure of the linguistic sign. When applied to languages embedded in differing cultural environments, the distinction between a basic and an extended structure of the linguistic sign yields varying patterns of correlating continua of motivation versus arbitrariness. From a universalist standpoint there are four main categories of the linguistic sign with variations for the basic and extended structure of each (cf. Haarmann 1990 b, 52 ff): 1) the microstructure of onomatopoetic expressions, 2) signs in-
684
V. Geschichtsschreibung der Semiotik
1. All components in the graph are theoretical constructs. This is also true for all relations which are indicated by arrows. As a theoretical construct the graph implies any component and any relation which might, in practice, participate in the process of signification, regardless of the concrete configuration of components and relations in the formation of individual variants of linguistic signs. 2. In the graph, two kinds of relations between single components are indicated, each of which is essential in the process of signification. Arbitrariness (i. e., an arbitrary relation) is symbolized by a dashed arrow, while motivation (i. e., a motivated relation) is indicated by a solid one. 3. The large circle marks the boundaries of the linguistic sign. The basic components of the microstructure of the linguistic sign are the sound structure, the written equivalent and the conceptual basis. As for the latter, it has to be admitted that an ideal graphic illustration of its association to the linguistic sign cannot be given. It is reasonable to assume that concepts exist, independent from linguistic signs, in the individual’s mind. The experience of practical thinking, nevertheless, suggests that single items of conceptual knowledge (i. e., ideas) readily crystallize in linguistic signs. In exact terms the component “conceptual basis” in the graph indicates an interrelation between the material basis of a linguistic sign, that is, its substance, and a concept. Fig. 32.4: Basic components and relations in the microstructure of the linguistic sign.
32. The development of sign conceptions in human cultures
volving concrete concepts, 3) signs involving abstract concepts (including grammatical categories), and 4) signs involving names. The microstructure of the linguistic sign thus differentiated provides a methodological instrument (i. e., parameters of cultural relativity) for categorizing the cultures of the world according to the degree in which the essence of local cultural patterns coagulates in linguistic signs. This kind of categorization must form an integral part of an overall typology of cultures (cf. § 7.). 4.4. In some cultural contexts where, with the adoption of the alphabet for writing, the priority had been with abstract signs and arbitrariness, the linkage with iconicity has been restored. A prominent example of this is the calligraphic tradition in Islamic countries (cf. Art. 90 § 10.3.). Given the prohibition of figurative painting and sculpturing in orthodox Arabic Islam, the aesthetic sense for iconic representation was satisfied by introducing the holy Arabic script as a means of art. The Arabic script, with its external arbitrariness of letters and its internal motivation by the association with the holy Koran, underwent a metamorphosis to become the medium of figurative form. The calligraphic concept in the Arabic countries, as it has been preserved thoughout the ages, encompasses a greater range of figurative aspects than calligraphy in the Chinese cultural sphere, where figurative variation is basically derived from the dominating ideographic tradition of writing. It is noteworthy that orthodox Arabic calligraphy, with its high-grade stylization of figurative motifs, represented the artistic mainstream only in the central areas of Islamic culture. On the periphery, the Arabic tradition of calligraphy has merged with indigenous traditions of figurative art, making the script an additional, rather than exclusive, means of iconic representation. Well-known are the masterpieces of unorthodox Islamic figurative art in Turkey, Iran, Islamic areas of central Asia (Usbekistan, Tadzhikistan, etc.), Mughal India, Malaysia and Indonesia (e. g., book illustrations, miniatures, sculptures). The splendor of Samarkand, for example, would not be the same without its figurative wall decorations (Samarkand 1986, 40 ff). Mughal painting in India became known throughout the Islamic world for its masterpieces which were created by artists under the rule of Akbar (1556⫺1605), the most impor-
685
tant of the Mughal rulers (Beach 1992, 39 ff). Akbar admired Hindu art, and Mughal painting during his time shows much affinity with this tradition. “An important category of Akbar’s paintings are illustrations to de luxe volumes of the literary classics” (Welch 1978, 21). While the holy script and miniatures in the book illustrations form an aesthetic symbiosis, pictures were also made as independent compositions. Significantly enough, the population of non-Arabic Muslims in the world outnumbers the Arabs. Consequently, orthodox Islamic concepts of art and calligraphy have become cultural trends of an Islamic minority. The idea of reconciling iconic representation and arbitrary writing has produced another artistic variant, the tradition of the carmen figuratum as a medium of visual poetry. Arguably, this differs from the Islamic variant of calligraphy in that the visual form and the text unit with which it is associated form a symbiosis while, in the orthodox Arabic tradition, the aesthetics of the script governs the figurative expression. According to Ernst (1991, 7), the carmen figuratum is “intermedially conceived as a text-picture composition where, as a rule, a versed and, in the widest sense lyrical text forms a graphic figure which is of a mimetic nature and which takes over a coordinate function together with the verbal message” (cf. Art. 50 Fig. 50.3 as well as Art. 61 § 3.2. and Fig. 61.5). In the carmen figuratum, the picture is thus a visual signifier of the contents of the written text. The oldest evidence of a figurative usage of a phonographic script comes from Egypt, dating back to the second millennium B. C. In the European context, the oldest specimen is the spiral text on the disk from Phaistos (ca 1700 B. C.). In this context, the spiral, a Minoan sacred symbol, is the mold into which the presumedly invocational text is ‘cast’. The text itself is associated with the Minoan funeral ritual (see Haarmann 1990 b, 220 ff for a tentative interpretation). In the tradition of visual poetry since antiquity, a great variety of figurativecontextual symbiotic forms have originated. Despite its uninterrupted continuity up to the present, the carmen figuratum, as a specialized medium of artistic aesthetics, has always remained in the shadow of the major trends in literature and figurative art. This in part explains why the arbitrary character of alphabetic writing has governed the mainstream in the European tradition of reason-
686
V. Geschichtsschreibung der Semiotik
ing about language and culture. In a similar way, the Europeans’ aesthetic sense of visual forms has depended on the classical antique heritage. Until the twentieth century, classical Greek-Roman aesthetics used to dominate most domains of artistic activity (cf. Art. 44, Art. 48 and Art. 60 § 5. as well as Art. 69 and 82). Among the outstanding artists who are not only willing to deviate from traditional aesthetics but have also gained a world-wide reputation because of their deviation is Henry Moore who, in his human sculptures, revived the pre-Greek spirit of the Cycladic figurines, the aesthetics of which had long been rejected as “primitive” (see Renfrew 1991 for a rehabilitation of the Cycladic spirit).
5.
On the relationship of panchronic semiosis and cultural symbolism
5.1. If semiosis is the process in which some external object functions as a sign, the capacity of participating in sign processes is restricted to man and some other animal species (see below for a specification). Since, by his biological nature, man has adopted an anthropocentric attitude of orienting himself in his surroundings, sign processes among humans are considered the most important subject of study (anthroposemiosis, studied by anthroposemiotics; cf. Art. 25). In addition to anthropocentric semiosis, sign processes among animals (zoosemiosis, studied by zoosemiotics; cf. Art. 24), i. e., “signaling behavior in and across animal species” (Sebeok 1972, 61), has been paid more attention since the 1960s. The realm of semiosis involving humans as well as other animals has mainly been investigated by concentrating on the teaching of human sign systems to chimpanzees (cf. Savage-Rumbaugh et al. 1980 and Pepperberg 1993). Resulting from the cognitive experiments with chimpanzees, man has been taught the lesson that he, as a primate, shares with other species of primates basic capacities in symbol-making and in creating cognitive constructs. “Humans and some other animals are capable of using true symbolic representations, but humans differ from other animals in being much more interested in and successfull at acquiring and using language” (D’Andrade 1990, 68). Other domains of signaling behavior, for instance, the whole range of communication between
humans and household pets, seems to have been hitherto neglected as a field of semiotic study (as exceptions cf. Bouissac 1993 as well as Fleischer 1987 and 1993). Semiosis presupposes the role of an interpreter (sign user; A); and interpreters tend to share, with other interpreters, a repertory of conventionalized signs, that is an understanding of which (B) stands for what (C) (cf. Art. 1⫺4). Relying on this assumption, the modern observer automatically asserts that the sign user is a person or an animal capable of identifying signs and that there is no meaningful target of semiotic investigation outside the realm of the living (cf. Art. 18⫺25). However, when using the categories of natural sciences in order to distinguish a living thing that can function as an interpreter from what is non-living, semioticians lead themselves into a deadlock. According to the natural sciences, semiosis would even be delimited to certain domains of the living world. Communication, as we understand it in our modern world, would exclude plants although they range among the living things (see, however, Art. 24, “Phytosemiosis”). Moreover, the category of living things has, throughout the history of mankind, been culturally specific. In Sumerian grammar, for instance, the category “animate” in nouns is reserved for persons only while objects, plants and animals are classified as “inanimate” (Thomsen 1984, 49). In Russian, plants are treated as “inanimate” while words for dead persons (e. g., pokojnik ‘deceased person’) fall under the category of “animate” nouns (Vinogradov et al. 1960, 102 f). In modern industrialized society, noone “communicates” with a tree in the sense that one expects a tree to “understand” signs used among humans. For a worker in the timber industry a tree is only worth as much as its size and quality for construction. For an archaeologist, a tree is an index from the standpoint of the value of its year rings for dendrochronological dating. However, semiosis thus delimited is a construct which, in fact, distorts the picture of reality which human beings have formed with their cultural categories. At least from the standpoint of cultural history, the concept of semiosis as defined according to the paradigm of industrialized society has to be extended considerably. If semiotics intends to analyze cultural processes in a comprehensive perspective, and if it intends to avoid the European-type bias in sign theory (cf. § 4.), then it is required
32. The development of sign conceptions in human cultures
to include aspects of semioses that connect the living with beings in the world of the non-living. In the magico-mythical world of traditional cultures and in the mythology of the ancient civilizations, man communicates with natural beings, with plants and animals (cf. Art. 47 as well as Art. 89⫺99). For example, a tree may be the epiphany of a spirit or the home of a divinity with which people may communicate in the true sense of the word. This means that a plant supposedly shares signs with human beings who establish ritualistic forms of respectful interaction with it. In many cultures of the world, people have thus been seriously engaged in communicating with plants, for instance in the form of a venerated holy tree to which are brought offerings and for the spirit of which rituals and prayers are performed. In addition, a tree may be understood as the seat or dwelling place of spirits, which demands respect to be expressed in ritual and personal devotion. Cultural history tells of supernatural beings (e. g., ghosts, divinities, demons, souls of ancestors) which, in their animated appearance, are supposed to communicate with humans. For example, when, at the beginning of November, Mexicans gather on the graveyards in order to celebrate the Days of the Dead and to invite the souls of their ancestors to their homes, they definitely communicate with them in mind and spirit (cf. Ruiz et al. 1988 for an outline of this pre-Spanish tradition; see also Art. 99 § 5.2.). Similarly, Vietnamese communicate with their ancestors on the occasion of the Tet festival in spring (see Art. 96 § 4.5.). Thus, the categorical framework of a magico-mythical world view provides instances of interactional settings involving humans and supernatural phenomena. If deceased persons, remote ancestors or spirits are assumed to share signs with living human beings, then semiosis extends into spheres which lie beyond the horizon of rationalist thinking. Semiosis definitely involves non-living things to the extent that these are incorporated in the cultural framework of objects with which man is, by his own intention or by social constraint, accustomed to communicate. For the most part of cultural history, man has been closely associated with nature in the sense that he formed part of it, was subject to the rhythm of its life-cycle and did not dominate it in the ways industrialized man has attempted. Resulting from the
687
working of identity as the most basic dynamic force in humans, man has had to strive, in association with physical survival, for spiritual survival as well. Tribal hunters of Palaeolithic times could not afford a world view such as the one publicized by J. Monod (1972), for whom the existence of mankind in the universe is a negligeable factor. For the archaic hunter-gatherer, the world was centered on his tribe, which was believed to be the origin of all mankind, created by mythological beings who also protected him under the condition that they were properly venerated, and this attitude has persisted until historical times (cf. Art. 58 § 2.). Man, the microcosm, was totally dependent on the animate forces of the macrocosm, his environment, and he had to communicate with the forces of nature (with mountains, trees, wind, thunder, rain, the sun, etc.) in a proper way, that is using language- and non-language-related sign systems, for guaranteeing his physical and spiritual survival (Ritz 1988, 45; cf. Art. 91⫺99). It lies in the nature of the concept that semiosis between human beings and natural phenomena is regarded as metaphorical communication. Man in a traditional culture is not ready to understand the working of the natural forces in scientific terms, that is, as being unrelated to his doings (e. g., a lightning bolt, a volcano erupting, the re-awakening of nature in spring). The natural forces and their effects must be interpreted, their meanings must be transferred into human symbols, and evaluated according to anthropocentric standards. For this purpose man personified the forces of nature and created a realm of spirits and mythological beings with whom he can communicate in his language. Semiosis is therefore also a matter of communicating with imagined phenomena of the supernatural (e. g., the dreamworld of the Australian aborigines, cf. § 6.4.; see also Art. 98 § 2.), of the otherworld. Magical beliefs and ritualistic practices not only in traditional cultures but also in the world’s ancient civilizations cannot be properly understood and evaluated in their relevance for cultural evolution unless one acknowledges the participation of natural and supernatural phenomena in the semioses of human beings (cf. Haarmann 1992 a, 64 for a conceptual framework; for more detailed examples see Art. 36 § 6., Art. 37 § 3.1., Art. 47 § 2.⫺5., Art. 58 § 2., Art. 89 § 4., Art. 90 § 2., as well as Art. 91⫺99).
688 Extending the perspective of semiosic processes to times before the appearance of Homo sapiens sapiens and to the intercommunication between humans and supernatural phenomena provides background knowledge required for understanding recent societies. In the human sciences “there is an agreement that an adequate understanding of how we have adapted, adjusted, and coped with our natural and social environments through time will be the key to explaining why we function and behave the way we do. In fact, barring chance and the supernatural, no other cause can be suggested” (Baker 1988, 445). Admittedly, there is no space for the supernatural in the scientific instrumentarium of modern research. However, incorporating man’s imaginations about supernatural forces and the associated metaphorical semioses as objects of study into the semiotic analysis is a methodological ‘must’ in order to avoid a distorted interpretation of cultural processes. Semiosis including communication with the supernatural and man’s attempts at influencing supernatural forces by devising and applying magical techniques are universal features of human cultures in the sense that they are found in every society of the world, be it traditional or industrialized (Müller 1987, 372). 5.2. To a modern observer’s understanding, synchronicity is a basic aspect in semiosis. Those who participate in a meaningful interaction share the synchronicity of place and time, and the awareness of this basic condition has become a truism in the sciences of communication. And yet, the most basic aspect in this regard is not synchronicity but rather panchronicity. Evidently, synchronicity is valid for all settings of semiosis in which human beings and/or animals participate. However, when investigating the involvement of supernatural phenomena in the cultural processes of man, the boundaries of synchronic settings expand to a panchronic dimension. Personified supernatural forces are ageless and not bound to the time dimension in terms of a category of the natural sciences. Communicating with such forces is a panchronic experience, associating man’s imagination with past as well as future events. The fact that, in magical beliefs, the search for knowledge about the realm of prebirth and afterlife is of great relevance may be interpreted as man’s spiritual rebellion
V. Geschichtsschreibung der Semiotik
against the constraints of synchronicity to which he is obliged in the world of the living. Among the highly frequented domains of panchronic semiosis in cultural history is intercommunication with ancestors, which may be considered an anthropological archetype. There are, nevertheless, some exceptions to this generalization. According to the available ethnological data, bushmen in southern Africa do not venerate their deceased (Baumann 1975 a). They rather fear death as an inexplicable phenomenon, and they do not engage in any communication with their ancestors. In most communities of the world, regardless of place or time, semiosis between the living and the deceased has produced multifaceted patterns of magical beliefs in the afterlife. The idea that ancestors do not only influence the fate of people living at present but also the community’s destiny in the future is widespread and, in many societies, the cult of the ancestors is a social constraint sine qua non. Life without intercommunication with the ancestors is unthinkable in those traditional cultures where it is believed that the ancestors’ souls enter the bodies of newborn children to participate in community life. Such beliefs are still nowadays adhered to among the Chaco Indians (Ache´, Xokleng) of Paraguay. A new-born child is given the name of an honored ancestor, and it is expected that the young human being, together with the name, also assumes the ancestor’s social behavior and inherits his qualities (cf. Lindig and Münzel 1976, 262). Semiosis with one’s ancestors in this cultural setting is thus more than a matter of intercommunication freed of the restrictions of synchronicity, it has the value of an anthropological parameter. Panchronic semiosis involving ancestors typically manifests itself in events where the living establish ‘social contact’ with their ancestors (as an aspect of the past) in order to receive advice for the handling of current affairs (as an aspect of the present) and/or to achieve oracular knowledge about future happenings (as an aspect of the future). In a sublime form, this pattern of social contact with the ancestors was elaborated in the cult of the dead among the Minoans in ancient Crete. On certain occasions (e. g., a funeral), the ancestors’ epiphanies were evoked and social contact established in a specific ritual. The ritualistic text in Cretan hieroglyphics on the disk from Phaistos is associated with this
689
32. The development of sign conceptions in human cultures
ritual (see Haarmann 1990 b, 216 ff for a contextual reconstruction). Man has created many varieties of panchronic semiosis between the living and the realm of the dead, and has elaborated a multifaceted metaphoric symbolism associated with it. If one wants to align the pertinent patterns found in the world on an imagined continuum of cultural pluralism, two extreme positions manifest themselves at either end. On the one hand, there is the world view of the afterlife in ancient Egypt (cf. Art. 89 § 4.), which obliged the living to strive for a proper place in the otherworld. The preparation for the afterlife had top priority over all affairs among the living. The key concept in this world view was the Egyptian ma’at (‘right/ rightous way of living’, ‘way of proper conduct’) according to which any Egyptian “breathed” the air of proper conduct by intercommunicating with the gods via the appropriate symbolism (i. e., rituals, offerings, general behavior; see Assmann 1990 for a scrutinous analysis of the social implications). After death, the soul of each individual was measured on scales by the gods whether it was worthy of entering the realm of the dead or not (cf. Haarmann 1992 a, 103 ff for this ritual). On the other hand, there is the extremist view held by orthodox communism whose ideologists officially deny the possibility of any kind of communication with the otherworld but who, nevertheless, profess a covert semiosis with the ancestors via the evocation of the spirit of “communist heroes” (Karl Marx, Lenin, Mao TseDong, etc.) in their pictorial representation (sculptures, pictures) and in their authoritative writings. These basic patterns of an extremist world view are both historical. This is true for communism also, despite lingering traces of it in some countries with varying degrees of a socialist society which still officially adhere to its doctrine. The fact that these experiments with civilization are historical may not be a coincidence. Life on earth becomes cumbersome if semiosis with the otherworld produces too many commitments for the living (as in ancient Egypt) or if this semiosis produces a bias in the sense that people are allowed only to communicate with a few spirits of dead persons which are purified by ideology to the extent of assuming the features of substitute saints (as in orthodox communism). The most stable cultural settings are, arguably, provided in societies where pan-
chronic semiosis involving intercommunication between the living and the otherworld is uninhibited in the private sector. This does not necessarily exclude social constraints on panchronic semiosis in the public domain (e. g., the marginalization of spiritism in modern societies of the Western world). As a dynamic force, semiosis modulates cultural processes, but what makes up culture is not limited to semiosis alone. Culture is also a function of the consequences of semiosis, in the form of attitudes, values and stereotyping patterns of social behavior; they result from semiosis and form part of the totality of culture. For instance, no Hindu communicates with a cow directly although she might be, according to his beliefs, the reincarnation of his grandmother. However, a Hindu’s attitude toward a cow and his taboo behavior as regards the integrity of this animal as a holy symbol form part of a metaphorical semiosis between this world and the otherworld. A Hindu would not eat the meat of a cow, and the punishment for slaughtering a cow is the same in India as for manslaughter. Cultural continuity in a given society is based not only on the perseverance of conventional patterns of semiosis but also on symbolism, practical and/or metaphorical, on attitudes and the value systems associated with it. Semiosis in the wide sense outlined here has not been fully exploited by theorymaking and the methodology of semiotic sciences as they are currently applied. In order to cover the whole range of anthropocentrically relevant cultural processes and to highlight them in their complexity and multiplicity, semiotics has to expand to encompass more domains of cultural history than has hitherto been the case.
6.
On the fractal structure of culture, human adaptability and mnemotechnics
6.1. For many reasons, “culture” is among the most complex cognitive constructs which the human mind has ever chosen as an object of reasoning (see Posner 1989, 268 ff for a discussion of the mechanism of culture). In order to provide an appropriate description of what culture involves, one would have to categorize the totality of all the semiotic spheres occupying various segments of reality (Lotman 1985), that is, the whole range of
690 what man produces in terms of material substance (i. e., artifacts), items of social behavior coagulating in the structures of a given society, language in terms of a model of the universe and in terms of all ideas and cognitive activities relating to a given world view. The factors which govern culture as an entity are innumerable, they are phaenotypical and cryptic, and their functions may have differing weight in local cultures. The functioning of culture as a man-made construct is thus so complex that any attempt to provide a comprehensive catalogue of cultural items, patterns and governing factors of their interplay is doomed to failure. In the light of an ideal description, all previous approaches to a “comprehensive” view on culture are highly fragmentary. Since the totality of factors governing cultural processes is not known, it follows that culture is not measurable. If culture is not measurable, then it cannot be predicted either. Extrapolations of current developments for a future perspective may produce assumptions about some general trends, the value of which is comparable to that of weather forecasts. As a general experience weather forecasts fall into the category of accidental prognoses. Culture and weather have an important property in common, though, and this is their complex functioning, which is chaotic. Scholars have long been convinced that the chaotic ways in which weather functions would ultimately prevent analysts from ever producing reliable forecasts. And yet, after chaos theory has been established in the fields of the natural sciences (Mandelbrot 1982) new perspectives have developed also for weather research. There is more theoretical space now for thinking of models that include accidental developments (Washington and Parkinson 1986). Admittedly, the factors governing weather conditions will never be completely known nor measurable. The awareness, however, that the lack of an overall understanding of weather is due to its chaotic property rather than to a lack of factor measurement has provided new incentives for research efforts. By assuming that the functioning of culture is chaotic, one acknowledges that the interplay of “major” (i. e., central) and “minor” (i. e., peripheral) factors produces an unlimited number of alternative impulses which may eventually turn into a trend. It is not known which factor may interact with any other factor at a given time. Theoretic-
V. Geschichtsschreibung der Semiotik
ally speaking, a factor which is considered negligeable today or is even unknown may, through its interplay with other factors, produce a cultural trend. Innovative impulses in cultural evolution resulting from the complex interplay of a multitude of single factors are hardly predictable. Consequently, any a priori categorization of culture constituents as central or peripheral factors is futile. In order to pay due tribute to the complexity of the phenomena involved, the most reasonable alternative for semiotics to cope with culture as a complex construct may be seen in the application of chaos theory to cultural processes. This allows for a proper view on the role of creative innovations, that is, on aspects of the unforeseen. To introduce the chaotic, that is the irregular, accidental and innovative aspects of culture into semiotic theory-making requires breaking away from the mainstream of European scientific reasoning, which has been criticized by Derrida (1967; 1972) as the “logocentrism” of Western metaphysics. Within the confines of a logocentric paradigm, all that is irregular or accidental is “regularly” excluded from theory-making. As a consequence there is no theory available on logocentric grounds which would allow for the explanation of the accidental, Nor can creativity, another complex phenomenon which is strongly associated to the accidental, be explained. Its accidental nature has provoked a statement such as the one by Gerd Binnig, winner of the Nobel prize in physics, who says that creativity originates “out of nothing” (Binnig 1989). Thus, although creativity has always been needed for the progress of scientific reasoning, Europeans have never managed to introduce this driving force of nature and the human mind into their logical calculi. Applying chaos theory to the field of semiotics would be equal to taking a preliminary step toward a new, not logocentrically dominated perspective in reasoning about cultural processes. 6.2. As an integral part of chaos theory, categories of fractal geometry will have to be associated to the cultural network. Fractal geometry is the system of the algorithms produced by chaos theory. Deviating from traditional Euclidian geometry with its limited set of basic forms, fractal geometry comprises an unlimited number of individual forms (i. e., fractals). In the realm of nature, every organism has its individual structure, its specific
32. The development of sign conceptions in human cultures
fractal. This specific fractal reproduces itself on any level of inspection, ranging from a macroperspective to a microperspective. In the fractal is inherent the essence of the organizational principles which govern the whole organism (cf. Peitgen and Saupe 1988). Given the complexity of natural phenomena (e. g., a cloud formation, a mountain range, a fir tree) it is most probable that no fractal of an organism equals that of another one precisely. Based on the methodology of chaos theory, one has to assume a specific fractal structure for every individual culture. Directing research efforts to the identification of specific fractals and their eventual comparison would pave the way for a deeper understanding of cultural processes and intercultural relations. The challenge provided by the methodology of applied chaos theory, i. e., fractal geometry, is prone to widen the horizon of semiotic analysis and will definitely affect the quality of future research. Along the lines of an investigation of the chaotic structures of culture, efforts have to be intensified to include relationships which have so far been touched upon rather superficially by semiotic analysis: e. g., the impact of gene frequency in populations on cultural evolution, the underlying effect of ethnic identity on symbol-making, the overall influence of mentality on intercultural interaction. Semiotics today is far from identifying even one specific cultural fractal, and is still further away from a comprehensive comparison of fractals. If reasoning about culture includes aspects of chaos theory, then the fractal as a construct has to be included in any approach to culture typology. Given the limited nature of our present knowledge about how culture works, any reliable culture typology based on fractals seems utopian by ideal standards. Any effort toward identifying fractals and comparing them requires the utmost exploitation of all aspects of culture-related life and, at the same time, of all available cultural settings, should the goal of a genuine culture typology ever be achieved. Given this precondition for further research, it is self-evident that the efforts to gain knowledge about cultural processes have to be unbiased, that is, avoid a priori weighting of the cultural value of important or negligeable cultural settings and of their governing factors as central or peripheral. In the fractal structures of remote cultures in space and time clues may be hid-
691
den for a proper view on the semiotician’s home culture. Therefore, any culture in whatever part of the world is worth being investigated for a better understanding of human relations. 6.3. Although seemingly daring, in the following, an attempt is made toward identifying at least some fragments of a fractal structure which may be used in a tentative culture typology (cf. § 7.). To this end, I want to elaborate on factors such as adaptability and man’s mnemotechnical creativity. At least from the standpoint of theoretical reasoning, these factors and their relationships are crucial for the functioning of any culture. Any kind of evolution in human society, be it in terms of human biology or cultural development, is a function of man’s adaptability, which is the human response to the challenges posed by environmental conditions. Humans have taken on many challenges since Palaeolithic times. They have populated five continents, they live in regions of eternal winter (e. g., the Eskimos of northern Canada) as well as in the most arid zones (e. g., the Touareg in the central Sahara). Humans have developed extremely complex social structures (e. g., in a modern industrialized state), and they have used their technical skills for a total planning of their living conditions. Man is no longer dependent on specific natural conditions for setting up a home, a township, an industrial plant or for the exploitation of natural resources. If adaptability is the key force, for understanding how cultural progress and social advancement work, then what is the motor of this force, which has made man probably the most adaptable of all creatures on earth? Adaptability requires the knowledge of the familiar to be used for experiencing the unknown. The knowledge of the familiar may be understood here as an elliptic expression for covering all items of experience which, at a given time at a given level of cultural development, are at the disposal of individuals who share the particular knowledge of living conditions with others in the same group. As an example, during the last ice-age man left the natural shelters (e. g., caves, abris) and started to construct huts. The oldest known Palaeolithic man-made shelters (found in southern Moldavia) are made of mammoths’ tusks which were most probably covered with the hide of the animal. Thus man had used his experience of the familiar (i. e., the
692 knowledge of the shape and function of a natural shelter) and applied this knowledge in constructing an artificial shelter out of material which he came across during his hunting expeditions. The application of knowledge about the living-conditions for the purpose of their improvement ⫺ which is the motivation for adaptation ⫺ depends largely on the capacity of how such knowledge is preserved and transmitted from one generation to the next. If the capacity of storing information is vital for any attempt to alter familiar livingconditions, then the amount of information, its quality and its availability for reuse determine the pace of adaptation as the driving force of biological as well as cultural evolution. Resulting from the overall experience with man’s evolution as a cultural being, some general observations can be made as regards his capacity of controlling knowledge: (a) The more specific and extended the knowledge of the familiar is, the greater the chances for a flexible adaptation. (b) The more advanced cultural evolution is, the greater the demand for available information for reuse in order to increase adaptability. (c) The greater the demand for available information becomes, the greater is the challenge for devising means of an unlimited storing of needed knowledge. The outline of the essential preconditions of adaptability presented so far may appear to reproduce truisms of cultural history which have been formulated in traditional anthropology. According to this theoretically assumed “spiral” of evolutionary progress, the stage of high culture is a natural consequence of the working of adaptation, and the path leads directly to the emergence of writing as an institutional ‘must’ for sophisticated adaptation. And yet the categories involved in any process of adaptation are all subject to cultural relativity. 6.4. In fact, cultural relativity heavily interferes with cognitive processes and with the elaboration of the value system; even the realm of imagination in the human mind is deeply affected by it. Everything is, either deliberately or unconsciously, measured by man against the conditions governing his surroundings, including all the ingredients of the belief system which may encompass religious ideas, elements of the moral code as well as
V. Geschichtsschreibung der Semiotik
items of the scientific world view. Any scientific world view ⫺ like everything that man creates ⫺ is subject to changes in orientation and is thus a product of its cultural environment. As an example of how even man’s imagination is patterned by his self-created cultural environment, popular astronomical terminology may be mentioned here, which is not only used by ordinary people but also forms part of the jargon among astronomers and astrophysicists. As a rule, people are used to denominating star configurations according to the items of the world view which dominates their living conditions. In a society where man lives on hunting and fishing, human imagination will choose comparisons from that domain. In Finland, an old name for the northern star configuration with seven stars has been preserved: Otava, which, in the language of the Finnish fishermen, means ‘net for catching salmon’. Different is the level of imagination among people living in an environment with technically advanced material culture. Those people tend to associate, in their imagination, the star configuration under discussion with items of their material world (Sagan 1989, 58 f): central Europeans have known the northern star configuration with seven individual stars as the Big Wagon (e. g., in German: Großer Wagen); in England, the same configuration is called The Plough, in France La Casserole, which corresponds to the expression Big Dipper as used among English-speaking North Americans. In societies which preserve a solid link to their natural surroundings, the configuration is associated with phenomena of nature, as for instance among the North American Indians, in whose imagination the stars have the shape of the tail of a big bear (cf. the Latin term Ursa major, which originated in Roman antiquity). In societies governed by considerable social-hierarchical or mythical constraints, the imagination may draw comparisons to basic social or mythological settings. In ancient China, The Plough was imagined by people to represent an imperial official who sits on a cloud and generously listens to the pleas of humble peasants. Astronomers in ancient Egypt, for their part, associated the stars of The Plough to another configuration which together, in their minds, represented a procession of holy animals, a bull in front, followed by a hippopotamus with a crocodile on its back.
32. The development of sign conceptions in human cultures
As regards man’s mentality in surroundings formed by modern civilization, all outside cultural settings are evaluated against one’s own culturally purported set of values. This is true not only for the ordinary mind but also, in general, for scholarly attitudes and the implied awareness of scientific achievements (Posner 1989, 271 f). Under the conditions outlined here, the values associated with fundamental concepts of the social sciences such as the following have to be understood as culturally bound: “improvement of living-conditions”, “cultural advancement”, “flexibility and/or increase of adaptation”, “evolutionary progress”, etc. When looking back into the history of cultural evolution, the modern observer is impressed by the diversity of value systems which have originated vis-a`-vis a pulsating cultural development in different parts of the world, a relative pace of evolution in individual cultures and a panorama of multifaceted technologies elaborated by man’s creative spirit for serving the needs of adaptation. Against the background of cultural relativity as a crucial variable, the analyst of cultural evolution is advised to handle the terminology of culture typology with great care, recalling that the quality of culture and social progress are subjective categories. In the evaluation of cultures throughout the world, any traditional Europe- or America-bound chauvinism, although common-place, hinders the understanding of the essence of “exotic” cultures. As an example, aboriginal cultures of Australia are easily apostrophied by Europeans as Neolithic, which involves a description in terms of what those cultures “lack”. They “lack” the use of metal, they “lack” weaving, they “lack” pottery, they “lack” agriculture, and they “lack” many institutions which are considered inevitable for the level of higher culture. And yet, when inspecting this “lacking” cultural sphere from the standpoint of the quality of ideas which have come together in mythology, ethnojuridical categories, etc., that is, when inspecting the implications of the Australian aboriginal world view, then one is amazed at the sophistication of the orally recorded knowledge about the world in which the experiences of hundreds of generations are summarized (cf. Art. 98 § 2.). In the Australian creation myths, for example, the sense of metaphorical abstractness equals that of ancient Greek myths (Roberts and Roberts 1989). There is another domain
693
of orally transmitted knowledge which is still more impressive in its sophistication, and this is the code of natural laws and human social behavior. This code has the character of a vision of the order of the traditional world which is thought of as having been created according to the needs of the aborigines. “The creation period (the tjukurrpa,) is remembered as an age when the consequences of the heroes’ behavior established the form of the everyday world” (Layton 1989, 14). Man has to conform to the then established world order if he does not want to offend the culture’s heroes. Surprisingly enough, in the ideas about world order in tjukurrpa, one finds the essence of ideas about the working of law-giving and jurisdiction in a culturally specific society which were expressed in the Age of Enlightenment by Montesquieu (1689⫺1755) in his De l’esprit des loix (1748). The oral tradition among Australian aborigines is rich in information about the creation of the world (cosmogony), about its structure (cosmology), about the purpose of life, about man’s role in nature (moral code). Since this is a magico-mythical world, all the information is preserved in genres of oral literature such as myths, legends, variants of ritual speech, etc. In addition, verbal mnemotechnics are supported by visual means such as paintings on rock or bark, and decoration on objects made of wood. In the central Australian desert, at the foot of Ayers Rock, which is called “Uluru” (‘wind-breaker’) by the aborigines, there are richly “decorated” caves where mothers teach their children about the basics of aboriginal symbolism, about the role of animal heroes in the creation of the world and about human interaction with the animate spirits of such cultural heroes. A closer inspection of aboriginal symbolism reveals that, besides naturalistic motifs of the surrounding flora and fauna, a great number of abstract symbols are used, especially when rendering relations between different agents in a pictorial composition. In the ways in which the Australian aborigines store their essential information about the world, we find the basic elements of mnemotechnics which are present, in different degrees of elaboration and sophistication, in all the cultures of the globe, historical or present. Although the degree to which a culture relies on either oral tradition or visual means of fixating information may differ, that is, although the balance of the mnemotechnical potential may vary from one cul-
694 ture to another, the basicness in the combination of the two mnemotechnical resources makes them a universal feature of human culture. The universal character of the resources in question can be readily acknowledged for historical cultures, and for older stages of cultural evolution (e. g., archaic traditional culture, archaic civilization). As for modern times, many observers may argue that mnemotechnics on a combined verbal (⫽ oral) and non-verbal (⫽ pictorial) basis is only valid for traditional illiterate cultures. And yet, oral tradition (e. g., the wealth of local tales and anecdotes) and visual means of information storage (e. g., logograms at airports for international traffic signalling) are resources of mnemotechnics also in the computer age, regardless of the extent to which modern society relies on them for functioning. 6.5. Except for the computerizing of data, the technology of storing knowledge about the world by means of writing has undoubtedly been the most comprehensive and effective in historical times. However, there is no direct path from illiterate to literate culture, simply because the need of a collective expansion of a group’s knowledge about the world as a function of adaptability which may lead an illiterate group into literacy is subject to cultural relativity, as are all other parameters of scientific analysis. The Australian aborigines developed a level of highly abstract thinking, which they reserved for their dreamtime myths. They made skillful inventions such as the boomerang, which serves as a weapon and cult object. And yet they did not use their abstract creativeness and their technical skills for building rafts and ships in order to explore the wide ocean to the east, something the Polynesians did instead. The ocean did not challenge the Australian aborigines who confined themselves to the environment which was familiar to them and to living conditions where neither nautical skills nor writing was needed. Even where writing exists, it does not necessarily follow that it will be used there as an overall technology to amass information for reuse in every possible domain in order to extend man’s potential capacities in his quest for the domination of nature. For centuries after its emergence, writing in ancient China was confined to the sphere of divination, although it might have served very practical purposes in commerce, in the recording of laws and in other cultural affairs from the be-
V. Geschichtsschreibung der Semiotik
ginning (Keightley 1985). Chinese writing was thus for a long time subject to cultural constraints which did not allow its profanization. The conditions of incipient literacy in Old Europe, ancient Egypt and pre-Columbian Mesoamerica resemble the Chinese settings closely. The scenario of a materialistic approach to literacy as a response to economic needs of temple bureaucracy in Mesopotamia, favored by Goody (1990, 94 ff, 159 ff), cannot be generalized. Those settings are an exception rather than the typical state of ancient society. In a comparative view of cultural history, economic needs were felt the least pressing of all needs for establishing writing in the ancient civilizations of the world. Instead, within the patterns of thinking in a world determined by magical beliefs, the use of writing to serve the reassurance of the good will of supernatural beings (for the benefit of the people) was considered to override any objective economic need for information processing. Restrictions in the use of mnemotechnical resources caused by cultural constraints are manifold, and they can widely affect the production and reception of information stored by whatever means. The orally transmitted narratives about the world order as inherited from tjukurrpa, the ethics code of the Australian aborigines, is, to a great extent, known to white anthropologists who gained the confidence of the bearers of that oral tradition. However, they were not allowed to disclose certain details which were barred from being publicized even in scientific writing. A similar cultural restriction, that is the prohibition of writing down holy texts, is typical of the pagan Celtic world. Although surrounded by high cultures with extended literacy (i. e., Greek and Roman civilizations) local literacy in Celtic Gaul and later in Ireland was limited to practical purposes such as calendars, contracts, epitaphs. The extensive tradition of Celtic laws was not allowed to be rendered in writing, not even in the indigenous Irish Ogham system. Only after the collapse of pagan society and the shift to Christianity were the ancient laws finally recorded in Irish and written in the Latin alphabet (cf. Art. 36 § 10.).
7.
Toward a tentative typology of human culture
The universal model of combining verbal and non-verbal mnemotechnics (that is oral tradi-
32. The development of sign conceptions in human cultures
tion and visual means of recording information) may be considered a basic parameter of human adaptability, one which may be integrated, as a stable component, in a typology of culture. Taking mnemotechnics as the clue, one arrives at the following framework of tentative culture types. A. Mnemotechnics relying on oral tradition and visual means of rendering information (excluding literacy) The combination of oral tradition and of the visual recording of items of knowledge without the technology of writing is the most general and widely spread type in the cultural evolution of mankind. Starting with the rudimentary elaboration of this type of combined mnemotechnics in the communities of Homo erectus and archaic man (i. e., Homo neanderthalensis), its sophistication already reaches a high level with the emergence of modern man in Upper Palaeolithic times. As regards rock painting, scratching and carving, i. e., the basic visual means of rendering information, the simultaneous use of icons and of abstract symbols is fully developed, as evidenced by the early artistic manifestations of modern man. The duality of using iconic and abstract symbols which is clearly distinguishable in the early cultural strata of Homo sapiens sapiens in Upper Palaeolithic times continues into the Mesolithic and becomes more sophisticated in the Neolithic Age. It is noteworthy that there is no cultural sequence at any site where rock painting or carving would have continued uninterruptedly from the Upper Palaeolithic into the Mesolithic and beyond (i. e., into the Neolithic) although stylistic interpretation of rock art seems to speak in favor of artistic continuity. In any case, Mesolithic rock carvings (see Dams 1984 for Levantine Spain) as well as the abundant material from Neolithic sites display the tradition of using symbols of the two categories separately, and in combination. The degree of complexity of the information which is stored in Neolithic compositions is astounding and in certain settings equals the effectiveness of writing systems. An example of this is the composition of figurative motifs and abstract symbolism on the so-called “roof stone” from Lake Onega (dating back to the late 3rd and 2nd millennia B. C.) which contains elements of a calendar, a year chronicle, and components of the Neolithic people’s mythology (see Haarmann 1990 a, 24 ff for an interpretative approach).
695
The mnemotechnical potential of this culture type does not necessarily rely on the separate functioning of oral memorizing versus visual fixating of ideas. Rather the overall effectiveness of the two mnemotechnical sets results from their intrinsic interplay. An example is the contract set up in 1682 between William Penn, the founder of Pennsylvania, and the Delaware (cf. Fig. 32.5a). In the version of this contract as recorded by the Indians (Fig. 32.5b), naturalistic pictures such as the two human figures feature alongside abstract symbols which stand for the shape of the landscape (including rivers and mountains) purchased by the white man. These three belts conveyed, for the Indians, as much information as the decorated sheet of paper on which the white men wrote their version. The white man’s text abounds with words serving as ornaments but which have no direct bearing on the contents of the contract. The ornamental symbolism in the Indian belts concentrates, arguably, more on the essence of the occasion instead, namely memorizing the friendly atmosphere of the encounter. The belts served as mnemotechnical devices where the orally transmitted memory about the event was visually stimulated, recalled and where it could crystallize. B. Mnemotechnics relying on oral tradition and visual means of rendering information, including pictorial literacy Pictorial literacy is not language-related, yet it can be much more effective for recording information than the casual alignment of concrete or abstract symbols in a figurative composition (e. g., in a rock painting). The term “literacy” is usually applied to language-related techniques of recording information, but it is used here in a metaphorical association with the attribute “pictorial”, and this because pictorial literacy has a property which it shares with language-related forms of literacy (see C, D and E): the technique of organizing symbols in a linear sequence. As an example I refer here to the mnemotechnics called “kekinowin” (an Ojibwa term) by the North American Indians. A famous specimen of recording where this technique is applied is the “Walam Olum” (lit. ‘truthful painting’), the tribal chronicle of the Delaware (Vasˇcˇenko 1989, 17 ff). The alignment of pictorial symbols in this document (cf. Fig. 32.6) which stand for contextual units such as phrases or clauses reveals linearity as in lan-
696
V. Geschichtsschreibung der Semiotik
guage-related writing because “the relationships between the successive drawings […] suggest a continuous metamorphic chain: the syntax of a fundamental grammar of forms” (Maclagan 1977, 79). There are many cultural settings where pictorial literacy serves the needs of storing information for reuse or as a mnemotechnical support for oral memorizing. In connection with traditional cultures where pictorial literacy is wide-spread, especially in Eurasia and North America, this type of visual
mnemotechnics has been referred to as “pictographic art” by anthropologists (see Fitzhugh and Crowell 1988: 308 ff for this tradition among the Siberian and Alaskan Eskimos). C. Mnemotechnics relying on oral tradition and visual means of rendering information, including logographic literacy Among the institutions which give profile to the evolutionary stage of “high culture” is writing. When inspecting the incipient phases
Fig. 32.5a: The contract (1682) between William Penn, the founder of Pennsylvania, and the Delaware: English text.
32. The development of sign conceptions in human cultures
of logography, which, as opposed to phonography, is the most basic and archaic form, one is surprised to learn that logographic literacy is but a short step from pictorial literacy to a more advanced level of organizing
697
information for reuse. In pictorial literacy there is already the tendency toward assembling pictorial symbols in a linear sequence which suggests the flow of ideas. While a pictorial symbol stands for a contextual unit, a
The Indian version of the contract consists of three belts, called “wampum” (an Algonquian expression). The belts are made of shells which are arranged in strings. The designs (featuring living things as well as geometrical forms) are created by the deliberate alignment of shells in different color and of different size. Wampum belts served as a mnemotechnical device for Algonquians as well as for other Indians of the East and North-East of North America. Fig. 32.5b: The contract (1682) between William Penn, the founder of Pennsylvania, and the Delaware: Indian version.
698
V. Geschichtsschreibung der Semiotik
1. Sayewitalli wemiguma wokgetaki ‘In the beginning, at all times, above the earth, in this place. 2. Hackung kwelik owanaku wak jutali kitanitowit essop Upon the earth there was a huge mist, and there was the Great Manito. 3. Sayewis hallemiwis nolemiwi elemamik kitanitowit essop In the beginning, for ever, lost in space, was the Great Manito. 4. Sohalawak kwelik hakik owak awasagamak He made the huge earth and the sky. 5. Sohalawak gishuk nipahum alankwak He made the sun, the moon and the stars. 6. Wemi sohalawak julikyuchaan He made everything move in harmony. 7. Wichowagan kshakan moshakwat kwelik kshipehelep Then the wind blew violently, it became lighter, and water flowed strongly and from afar. 8. Opeleken mani-menak delsin-epit And groups of islands emerged and remained. 9. Lappinup kittanitowit manito manitoak One again, the Great Manito spoke, one Manito to other Manitos.’ Fig. 32.6: The beginning of the first chant in the chronicle Walam Olum of the Delaware.
logogram is equal to one single cognitive construct. Logographic literacy thus provides a still higher degree of precision in recording ideas than does pictorial literacy, which requires much more support from oral memorizing. The emergence of high culture is, from the standpoint of information storage capacity, characterized by a thrust toward greater precision in the use of visual symbols. Writing is thus not the great “invention” of civilization but rather one of the items of its specialization. Recording information on the basis of logography (which encompasses the variants of pictography and ideography) has produced a wealth of techniques, the elaboration of which is embedded in the cultural settings of the local experiments with civilization in
the ancient world (Haarmann 1990 a, 150 ff). Important instances of this evolutionary stage in writing technology are the Old Sumerian pictography (which precedes cuneiform writing), the ancient Indus script, writing in ancient China, Cretan hieroglyphics and the variants of Olmec and early Mayan writing in Mesoamerica. Due to the working of cultural relativity and environmental factors, the threshold of civilization was crossed, in different parts of the world, at different times and with differing approaches. The interplay of adaptability and mnemotechnics thus reveals patterns of cultural diversity which are indicative of man’s creativity in producing alternative responses to environmental challenges. The heritage of this experience of ancient experiments with organizing high cul-
32. The development of sign conceptions in human cultures
ture is valuable specifically because of its variability. The oldest known experiment with high culture is associated with the transition to a sedentary life in southeastern Europe. Since the dating of the archaeological evidence has been clarified only recently and since the social institutions of that old civilization, among them the script, are little known outside a small circle of experts, I elaborate on the cultural settings in some detail. The old European experiment with high culture is not only a local specimen in the rich heritage of ancient civilizations, but it is likely to teach the modern observer an impressive lesson in cultural relativity. One speaks of the Neolithic “revolution” when referring to the change in economy from the stage of hunting-gathering to food production in connection with the elaboration of agricultural techniques. There is good reason to apply this descriptive term also to the progress made in the field of arbitrary symbolism. At least in Europe, the revolutionary transition from the use of notational systems with a limited inventory of signs for specific purposes to a full-scale writing system with a versatile repertory of signs for representing numeric concepts and language-related ideas is rooted in the tradition of Neolithic symbolism. The Europeans adopted agricultural techniques from western Asia (southern Anatolia) in the seventh millennium B. C. It is noteworthy that the pace of social and technical development was swifter in the communities of the European agriculturalists than in the Asian region where agriculture was first practised. Although on the periphery of the part of the world with stable settlements, the communities in southeastern Europe passed the threshold of higher culture as early as the sixth millennium B. C., and the prominent features of archaic civilization patterned part of social life in the Danube basin and adjacent regions. They included (1) a hierarchical social structure, (2) specialization of handicraft and professional domains, (3) agriculture as the main basis for living, (4) urban settlements of up to 20,000 inhabitants, (5) mining and metalworking (i. e., gold and copper), (6) a differentiated religious system, (7) religious centers for worship and ritual, (8) sacral architecture, (9) distinguishable art styles, (10) writing (see Haarmann 1992 b for the latter).
699
This oldest of the world’s archaic civilizations was given the name “Old Europe” by Gimbutas (1974). The cultural progress in western Asia and Mesopotamia was comparatively slower than in Old Europe. Let us recall that the agriculturalists in the Near East organized their social life for several thousand years before achieving ⫺ rather late in the fourth millennium B. C. ⫺ the properties mentioned in the foregoing and one of the prominent technologies of archaic civilization: writing. The notational system which was applied in early trade relations (Schmandt-Besserat 1979) only allowed for the rendering of numeric concepts and, in a rudimentary ideographic form, of a limited set of goods. When the archaic Sumerian pictographic writing was elaborated toward the end of the fourth millennium B. C. ⫺ either simultaneously with the Old Elamite stroke writing or later ⫺ the old notational system fell into decline, this being clear evidence that writing in Mesopotamia did not emerge directly out of the tradition of an older notational system (Ehlich 1980, 338 f). Literacy in Old Europe was a means of power among the priest elite, and writing remained restricted to predominantly religious purposes, in burial rituals in particular, for as long as it was in use, from about 5,300 B. C. to about 3,500 B. C. (Haarmann 1990 a, 72 ff). As regards the religious functions of Old European writing, this may be compared to the cultural settings of the early oraclebone inscriptions of Shang-China (from ca. 1,200 B. C.). It is known that, in ancient China, writing served oracular purposes, supporting the process of asking questions of the divine ancestors and spirits and of interpreting their answers. Writing in Shang-China was a magical reinforcement of man’s religious practices. Although no direct evidence is available from Old Europe, a similar function may be assumed for writing there. Hundreds of inscriptions in the Old European writing system were found on figurines, cult vessels, stamp seals, loom-weights and other objects, many of which most probably had a dedicatory content. Most inscriptions are short, consisting only of one, two or three signs. Some are longer, and there are sequences comprising over a dozen individual signs. With respect to the shortness of the inscriptions, Old European writing resembles that of the ancient Indus culture (ca. 2,600⫺ca. 1,800 B. C.)
700 where also one- and two-sign ensembles prevail. The linear character of the Old European writing system is another feature which finds its closest affinity with the Indus script. As for the shapes of the Old European signs, there are resemblances in the repertory of Indus signs. Given the extreme age of the Old European system, which is at least two thousand years older than the archaic Sumerian pictography, any similarity with other writing systems of the world cannot be interpreted as historical influence from outside Europe on European settings. The available archaeological evidence supports the assumption that Old European writing is an original system, that is, a sign system which originated within the confines and out of the social needs of the Old European cultural settings. The system is comprised of some 230 individual signs, a number high enough to indicate its belonging to either a restricted ideographic system, to a phonetic (i. e., syllabic) system or to a logico-phonetic system, incorporating signs from both categories. The latter alternative, that is, the combination of ideographic signs (e. g., determinatives, logograms) as word signs and of phonetic signs (e. g., rendering syllable segments as in Egyptian hieroglyphics or entire syllables as in Akkadian cuneiform), is the most wide-spread in the archaic civilizations of the world. Circumstantial evidence speaks in favor of the latter alternative, that is, the Old European script combined ideograms and a certain number of signs the phonetic value of which cannot be identified. Ideographic symbols undoubtedly prevailed, and the phonetic component was additional. This resembles the structures of the archaic system of Sumerian pictography, where the rendering of phonetic values remained occasional (Sampson 1985, 55). The phonetic principle of syllabic writing did not even prevail in Sumerian cuneiform writing although it later dominated Akkadian cuneiform. D. Mnemotechnics relying on oral tradition and visual means of rendering information, including phonographic literacy In theory, the transition from logography to phonography is characterized by a thrust toward a greater union between the visual symbol and the sound structure of a given language. The motivation for this specialization of writing lies in the need for an appropriate recording of names, both geographical and personal, and in a tendency toward
V. Geschichtsschreibung der Semiotik
greater economy of the sign repertory in a system. Cultural relativity, however, determines the pace of phoneticization and the degree to which the whole writing system shifts toward phonography. As a general observation, all writing systems of the ancient world had at least a phonographic component. This is also true for Chinese writing (cf. the rebus principle; see Haarmann 1990 a, 181 f), which has preserved its predominantly logographic character up to the present day. Balanced systems, such as Akkadian cuneiform writing and Egyptian hieroglyphic writing, are comprised of a logographic component (i. e., the use of determinatives and logograms) and of a phonographic component (i. e., syllabic value of signs in Akkadian, segmental value of signs in Egyptian). With greater precision, one can specify Akkadian writing as logico-syllabic, and Egyptian as logico-segmental. According to recent findings, also Mayan writing seems to be logico-syllabic (Coe 1992). Cretan Linear B is, arguably, the most perfect of all the phonographic systems which were in use before the emergence of the alphabetic script (see Bennett 1963 for an analysis). It still has a logographic component. Technically more specialized are the Cyprian writing systems of the late second and early first millennia B. C., which are purely syllabic without any logograms. Cypriot-Syllabic, the younger of the Cyprian systems, was used alongside the Greek alphabet for several centuries, which may be taken as an indicator of its effectiveness. The alphabet is the most specialized of all phonographic variants. Although the identification of the sounds of a language with the signs of the script is the organizing principle with top priority, there is no written language in the world where, in the writing system, a full-scale ratio of a one-to-one correlation of sound and visual sign would be revealed. Finnish is among the few languages with only a few exceptions to the one-to-one correlation in writing. From a historical standpoint, the emergence of the alphabet cannot be thought of without the previous phonographic experiments with syllabic and segmental writing in the Aegean, in the Near East and Egypt. The modern analyst, therefore, is not surprised to find elements of earlier phonographic writing from these cultural areas in the alphabetic tradition of the latter half of the second millennium B. C. As a general observation, the one-to-one correlation of sound and visual
32. The development of sign conceptions in human cultures
sign finds its origin in the use of Egyptian one-consonant symbols in the hieroglyphic system, while, in the Near East, the repertory of the alphabetic system was elaborated by relying on the inventory of Egyptian as well as of Aegean signs (see Haarmann 1994 a, chap. 7). The alphabet is a flexible technology which does not depend on the nature of the signs applied. Some of the ancient writing systems were used in alphabetic function, for example, the cuneiform script in Ugarit, the Egyptian hieroglyphs in Nubia for writing Meroitic, and fragments of the Aegean syllabic system for writing Carian in Asia Minor. Given this flexibility and the fact that, in the evolutionary process of adapting the Semitic alphabet to contact languages of Phoenician, the forms of the letters underwent a rigid stylization, many scholars have assumed that the sense of abstractness as a formative force of culture might have originated from the adoption of the alphabet. According to recent findings, however, this is a misconception. As an example I refer to the discussion of this subject in connection with the emergence of the Greek alphabet. Greek “ingenuity” associated with the alphabet did not originate out of a cultural vacuum. The tradition of the sense of abstractness has different roots, and the elaboration of classical Greek institutions is another illustrative indicator of how cultural relativity works. Unaware of the depth of Europe’s cultural history and the transformations of the cultural mainstream from Old Europe to classical Greek civilization, traditionalists have it that the adoption of the Semitic alphabet caused significant cultural changes. The ultimate conclusions even lead to the claim that all the basic ingredients of Greek civilization (i. e., the sense of abstractness in art and philosophy, logical thinking, the distinction of basic geometrical forms) originated under the impact of the alphabetic principle on the human mind (Donald 1993, 340 f). Among the prominent supporters in favor of the evaluation of the alphabet as a revolutionary breakthrough for the progress in civilization are M. McLuhan and R. K. Logan (1977). They go as far as to attribute the development of codified law, monotheism, abstract theoretical science, formal logic, and individualism to the effect of the alphabet. Logan (1986, 233 ff) re-emphasizes and reinforces earlier claims that the use of alphabetic writing stimulates left-brain patterns, including “rational-
701
ity, logic, linearity, sequence, mathematics, and analysis”. Such a kind of “truism” concerning the alphabet effect, as it has been willingly accepted by the ruling doctrine of antiquity research, is deceptive in many respects. Its deceptiveness is, first of all, rooted in the imaginative division of cultural periods, namely a time when the Greeks did not yet possess writing and one when they definitely did. The former is called “preliteracy” and “primitive” Greek culture in the “dark ages”, the latter is called “literacy” and is associated with Greek “civilization”. This division and the associated values are a typical product of the Romanticist movement of the nineteenth century, and its repercussions can still be experienced today. Despite its successful perseverance in people’s minds, the “miracle” of the rapid emergence of Greek civilization is a myth which lacks a pragmatic touch of reality. In addition, Logan’s exaggerated claims fall flat when one inspects the Old European heritage of abstract symbolism and the contemporary environment provided by the Greek cultural institutions such as the polis, geometry, temple architecture and poetry, which were already developed before the adoption of the alphabet (Havelock 1990, 78). The roots of the sense of abstractness, of rationality and of logical thinking can be attested already for Old Europe, and they are revealed in the organizing principles of the repertory of linear signs (cf. § 5.). As for the continuity of abstract symbolism from Old Europe into classical Greek times, there is ample evidence from the structuring of the Cypriot-Syllabic writing system for rendering Greek (see Haarmann 1994 a, chap. 5). It is noteworthy that the organizing principles of the Old European script and the graphic repertory of its linear signs have been revived in Cypriot-Syllabic. This includes the striking presence of all basic forms of Greek classical geometry, the stroke (i. e., line), the circle, the square, and the triangle, in the inventory of linear signs. Thus, there is direct evidence for the diffusion of such forms among the Greek population, at least in Cyprus, before the times when the alphabet was used. The diffusion of the knowledge of these abstract forms from the Aegean world to the Greeks on the mainland is more than probable. However, it is even more reasonable to assert that the geometric forms in question were known among the mainland Greeks from their local
702 tradition, although the diffusion on the continent cannot (yet) be proved. As regards the presumed stimulating effect of the alphabet on the codification of laws, this can also be rejected as unsubstantiated. The oldest Greek laws come from Crete, a cultural area where law-making is rooted in the Minoan past. There is some indirect evidence supporting the view of a Greco-Minoan synthesis in Crete (Alsop 1970). Indicative of this is the Greek word “kurbhis” for which meanings such as ‘ancient laws’, ‘ancient commandments’, ‘instructions’ (in poetic speech since the fifth century B. C.) or ‘tall stele with inscription’ (since the times of Theophrastos) have been proposed. The preGreek origin of the term “kurbhis” is emphasized by the uncertainty with which it is treated in the classical texts, sometimes as masculine, sometimes as feminine. In all likelihood, the expression was borrowed “from the pre-Greek language of Crete; for Crete’s well-established pre-eminence in the framing of laws during the archaic period may rest ultimately upon the great law-givers of the Minoan period” (Jeffery 1961⫽1990, 53 f). The pre-Greek (⫽ Minoan) language in Crete persisted well into the era when the Cretan version of the alphabet was elaborated. This is evidenced by the fact that both Greek and Eteocretan, the indigenous language of ancient Crete, were written with the same script in the archaic period. E. Mnemotechnics relying on oral tradition and visual and invisible means of rendering information, including literacy and computerization of data For about three thousand years the alphabet has served manifold purposes of information processing. Until recently, its effectiveness has never been seriously challenged. And yet, within a few years writing has been definitely outweighed in its importance by the modern invisible means of rendering information, that is by computerized data processing (cf. Art. 26 and Art. 78). The amount of contemporary computerized data outnumbers by far the information that has ever been stored in written form throughout the entire history of mankind. Society has expanded its range of information control to enormous new dimensions. The technological advance in data processing which we are experiencing was unthinkable still half a century ago. Against the background of the technological progress in data processing, many observers
V. Geschichtsschreibung der Semiotik
tend to believe that the old-fashioned technology of writing is about to lose its traditional functions, doomed to vanish and to be eventually superseded by computer software. The proclamation of a future world without literacy seems to be the only reasonable extrapolation of trends in progress. And yet an inspection of cultural history and the role of sign systems in organizing society does not confirm such a view. The culture typology outlined in the above discussion, which is comprised of a hierarchy of cultural stages (from A as the most basic to E as the most specialized type) is in itself a proof that writing, once it has fulfilled so many functions in human relations, will not vanish, for similar reasons for which the other mnemotechnical means will not vanish, once they have been established in community life (for a similar argument, cf. Art. 27 § 4.). No form of visual means of recording information has decisively weakened or even suppressed oral memorizing, no matter to what extent earlier specimens of oral tradition have been transferred to the medium of visual memorizing (e. g., from epic folklore to written epics, from the oral codification of laws to their written recording) and regardless of functional changes in the relevance of oral tradition. If oral mnemotechnics had been abandoned, there would be no current oral memorizing in theatre or opera performances, in film dialogues, in rock concerts, etc. As for writing, it did not, in whatever variant, displace pictorial literacy; up to the present, cartoons as well as certain strategies in commercial advertising work on the basis of the same old principle. In theory, phonographic writing could have been expected to supersede logographic writing worldwide, but in fact it did not. More than one fifth of the world’s population (i. e., people in the Chinese sphere of literacy) use logography up to the present. In addition, the Western world has restored logography to a significant degree (cf., e. g., logograms in the business world, in international traffic signalling, in the symbolism of the natural sciences). The invisible means of processing data and recording information will not supersede writing because the input and the output of computerized data have to be made accessible for the human mind, and this works through the transmission of data in traditional writing. Computerized data processing is a more specialized and overall more effective technology
32. The development of sign conceptions in human cultures
than writing. The complex mechanism of modern society has to rely on more specialized systems than writing, but it will not do without the latter, as long as human beings make plans and decisions for interacting in community life. In the course of cultural evolution in human society, the mnemotechnical means of earlier stages have been continuously preserved in later stages although their individual function and range may have undergone changes, in part considerable ones. As regards the categorization in the tentative outline of culture types, the features of type A are found in all other types (i. e., B, C, D, and E). Type C is more diversified in its potential of mnemotechnical means than type B, type D incorporates all the means of type C plus a specific extension by which its cultural stage is characterized. In the cultural framework of type E, all the previous mnemotechnical means are at man’s disposal, with the significant expansion of the panorama into modern computer technology. Although a potential type *F, reaching beyond the present cultural stage E, is not in sight, it would hypothetically incorporate all previous means of mnemotechnics plus a technique of information control which cannot yet be imagined. Whether or not such a culture type *F will ever emerge depends on man’s adaptability under changing environmental conditions.
8.
Culture planning and perspectives for applied semiotics
8.1. About one hundred years ago, Europeans thought of the Europeanization of the world as the ideal perspective for mankind’s future: “The Europeanization of the earth is the ultimate goal which modern history is firmly approaching” (Philippson, Neumann and Sievers 1894, 344); this goal was termed a “world mission” by the authors. The notion of Europeanization was wide-spread not only among politicians but also among academics. Then, contemporary European culture was the measure of progress in civilization, and most cultures outside Europe fell below those standards or even into the category of nonculture (see Posner 1989, 271 f, for a critical inspection of this term). The turn of the century was the high tide of imperialism and colonialism, a time when also non-Europeans (e. g., the Japanese) voluntarily admired the
703
standards and civic institutions of European societies. Since then the world has changed dramatically. The former colonial empires of the Europeans have crumbled, first the German one in 1918, then the British in the 1940s, the French, the Belgian and the Netherlandic in the 1950s and 1960s, the Portuguese in the 1970s; and the Soviet Empire with its internal colonies dissolved itself in 1991. The Europeans who once set out to dominate the world have left behind a puzzling mosaic of incomplete Europeanization (for examples, cf. Art. 96 § 7. and 8.). It will be up to future generations to judge whether the benefits of European civilization outweigh the damage inflicted on previous cultural settings in different parts of the world. All in all, the European attempt to plan the culture of non-Europeans seems to have stirred up more resentment than satisfaction among African, Asian and American peoples. The Europeans did not have much time to mourn over the ruins of their imperialistic enterprises, because the newly emerging states in the Third World demanded their share of compensation and developmental aid. In addition, the peoples in the “south” have announced their claims for the sharing of natural resources, wealth and living standards with the peoples in the “north”, the former colonial powers. In Europe, in North America and elsewhere, the highly industrialized societies have managed to ruin vast regions of their natural environment by pollution. The secure depositing of atomic and toxic waste poses ever increasing problems (cf. Posner 1990). Air pollution in the northern hemisphere, together with an increasing industrial pollution in the Third World, and the devastation of rain forest areas in South America and Africa are about to change the world climate. A radicalization of the climate has become apparent in many parts of the world already, in the form of heavy rains in some regions, droughts in others, storms and floods, etc. The world explodes with uncontrollable overpopulation. Mass starvation and food shortage in many parts of the world are a daily experience. World peace has been unstable and ⫺ as a consequence of endless militant clashes, civil wars and surrogate wars nourished by the ideologically rivalling superpowers ⫺ a steadily increasing flow of refugees coming from all parts of the world has swept industrialized societies and strained ethnic
704 identity among indigenous majorities. Many democratic societies have come under the pressure of rising racism, a social “virus” which has turned into a modern kind of spiritual pollution. The extrapolation of current trends of global development into the future envisages gloomy settings for humanity. Man has managed to bring the world to the edge of ecological catastrophe, and his pressing problems may be compared to those which he had to cope with in the early phases of mankind’s evolution: once again, man lives under conditions which force him to struggle for survival, both physical and spiritual. In Palaeolithic times, nature still dominated man; now man suffers from his own violation of nature. Against the background of this scenario of a rapidly changing world which seems to lack stable parameters of orientation for the future, and with a deteriorating rhythm of nature, semioticians may ask themselves “What is the use of semiotics?” or “Can semiotics participate in solving the pressing problems of world society?”. Delimiting the efforts of semiotic study to traditional subjects such as the interpretation of existing or historical cultures, and to explaining how culture works, seemingly lacks a sense of social responsibility. As such, semiotics has the value of an academic field of study comparable in its status to formal linguistics, art history or the social sciences, without any prescriptive impetus. If the findings and insights gained from semiotic studies so far are to be actively used for creating cultural perspectives for tomorrow, the task of semiotics has to be extended to also encompass parameters of planning as well (cf. Art. 27 § 4.). 8.2. A natural development in an adjacent field of study which deals with the social functions of language, namely sociolinguistics, may provide clues as to why such planning is needed. Language planning emerged from the experience of a descriptive sociology of language the findings of which have been exploited and applied to solve pertinent problems of standardization, the legal status of languages and interaction in a multilingual surrounding. As a field of applied sociolinguistics, language planning has been exercised in many parts of the world where the situation would be less favorable today without such planning (Rubin et al. 1977). This is true for many countries of the Third World (Jernudd 1981), India for one. In Europe, the
V. Geschichtsschreibung der Semiotik
widest panorama for language planning opened up in the Soviet state, where language as well as culture were means of social planning (Haarmann 1993 a, 303 ff). Regardless of the fact that, by its ideological constraints, Soviet society planned itself ad absurdum, the organizational impetus of planning, the social ideals involved and the overall results speak in favor of the efforts made to gain balance in the intercultural functioning of Russian and non-Russian languages. The greatest challenge for culture planning as a field of applied semiotics arises from the unresolved problems of societal orientation. Every society in the world is more or less strained by environmental problems. Culture planning would have to provide a framework of maxims concerning man’s relations in and with nature. The essence of such planning reaches far beyond the diffuse goals of environmentalists implied in slogans such as “Save nature!”, or “Save wildlife!”, or “Save the rain forest!”. Moreover, most societies in the world have to cope with ethnic conflicts, ranging from tribal clashes in Somalia, unrest among the religious groups in India to violent Neo-Nazism in Germany. Culture planning would have to provide a framework of maxims concerning the balancing of man’s ethnic identity in intercultural interaction. This aim reaches further than any casual action taken against racism (e. g., police operations against right-wing radicals, demonstrations in favor of the acceptance of refugees). Comparable to the distribution of relevant domains in language planning where corpus planning, status planning, and prestige planning are distinguished (Haarmann 1990 c, 105 ff), culture planning would, ideally, coordinate efforts in these domains in order to guarantee an effective impetus. Culture corpus planning deals with the selection of elements and ingredients of a given culture which need institutional support for functional restoration or expansion. An example is the strife among autochthonous ethnic groups in many countries for sharing the economic benefits resulting from the exploitation of natural resources in their homeland and the legal granting of pertinent claims by government institutions (e. g., concerning the Eskimos in Canada, the Indians in the USA, the regional groups of Lapp population in Scandinavian countries). Corpus planning may also be concerned with the acknowledgment of identification symbols which are relevant to minority cultures, for instance, the
32. The development of sign conceptions in human cultures
acknowledgment of Ayers Rock as a holy place by the Australian government and its return to the ownership of the aborigines in November 1983. Culture status planning has to deal with problems of status which ultimately shapes the profile and quality of a given culture. In the wider sense, status planning affects the quality of social life in a community. For instance, a matter of status of great concern in modern overindustrialized society is the raising of governmental measures against pollution, their institutional control, the enforcement of sanctions and the raising of violations against laws of environmental protection to the level of a criminal offence. In an ideal sense, sanctions against pollution would be reconciled with a mentality according to which violations of nature would be treated in terms of a taboo (tapu in Tahitian), thus reviving the classical Polynesian tradition. In the historical dictionary of Tahitian compiled by J. Davies (1851⫽1991, 253), the term tapu is explained in the following way: “An oath or a certain solemn engagement […] not to perform certain things”. Culture prestige planning copes with the entire cultural process, with trends of continuity versus those of change; it has to do with aspects of the value system and attitudes and, ultimately, it may affect people’s mentality. The awareness that man forms part of nature, that he is dependent on it and that he should not reasonably aim at destroying his own resources is a complex cognitive construct to which only prestige planning can give a proper profile. In this regard, corpus and status planning both fall short of the necessary repertory of categorical reasoning, although applied semiotics in the two domains may provide valuable background information. A target of prestige planning relating to problems of prestige is the intentional selection of patterns found in mankind’s cultural history in which the relationship between man and his place in nature is inherent. Highlighting pertinent instances, finding out about the applicability of such patterns to the conditions of the modern world, and exploiting experiences of universal value from their comparative study marks the way for a more comprehensive understanding of man as a cultural being with his creative forces working against his biological limitations. In this sense, culture prestige planning provides a mental instrument for organizing a balance between man’s activities and nature.
705
Prestige planning, for one, has to strive for a filtering out of universal values as regards basic attitudes of respect toward the essence of life (i. e., the natural environment) as found in the cultures of the world. And yet any planning has to pay tribute to the principle of cultural pluralism, which means that not all valuable experience which may be selected from a local cultural tradition can be deliberately transferred to any other part of the world where it might be felt desirable to have it incorporated in people’s mentality. For example, Taoism provides enviable elements of wisdom about the balance of natural forces and of man’s role in the world. However, transferring the essence of Taoism to Europeans or Americans in their societies would possibly not work because the wisdom to be transferred lacks the appropriate world view. Chinese people’s readiness to believe in magico-mythical phenomena (i. e., animate supernatural forces, the working of fate) is located, by tradition, at a much higher mental level than in the rationalistic world of Europe or North America where logocentrism still dominates. What a European would reject as superstition or “fatalism” is what is involved in the respect for nature of a Chinese or Japanese person who professes Taoism (cf. Art. 93 § 5.4. and Art. 95 § 3.). Culture planning at its best would strive to maximize, for any local culture or at least for certain cultural areas, the crucial awareness of living in balance with the rhythm of nature, in accordance with the historical background and the essentials of historical world views which still contain such wisdom. This would culminate in the restoration of aspects of such world views in which the balance with nature is an essential ingredient. Speaking of the restoration of a world view suggests the revival of a past awareness in order to help mankind in the present struggle for physical and spiritual survival. This does not require the abandonment of the modern world view as a cultural pattern; indeed, in cultural pluralism a multiplicity of traditional plans for solving problems in the natural habitat is implied, and modern man’s mentality has to assume a sense of appreciation for the mechanism of problem-solving which was (or has been) activated in different parts of the world at different times. Examples of world views with an inherent philosophy of the relationship of man and nature can be found all over the world. As for the European settings, a world view of
706 such quality once dominated the ancient Mediterranean civilization. This is true for the Minoan model of the universe which enhances man’s awareness of the creative forces of nature (Haarmann 1994 b, chap. 3). In the sphere of former Egyptian culture, certain aspects of the ma’at world view (e. g., the antimaterialistic way of thinking about the matters of this world) would have to be substantiated (cf. § 5.), for the Australian cultural area it is the balanced world order of tjukurrpa (cf. § 6.), Hinduism in India, Taoism in the Chinese cultural sphere, etc. In addition to aspects of world view there are practical lessons which modern mankind can (and, fortunately, does) learn from the cultural heritage of the past. As an example, medical scientists have become aware of the benefits of traditional medicine in many parts of the world (Ndeti 1978), and the accumulated knowledge from generations of healermagicians about curing plants and their substances is being exploited for modern healthcare. 8.3. If mankind wants to avoid the dangers involved in a narrow cognitive base caused by adherence to a single ideological world view, cultural pluralism in the world has to be secured. This awareness is a favorable basis for the elaboration of maxims relating to the preservation of endangered cultures and an indispensable prerequisite for orientation in planning. Against the background of United Nations’ resolutions on the protection of minorities and general humanitarian considerations, the balance of cultural interests of ethnic majorities and minorities in a given society will have to be made a crystallizing focus of culture planning in the future. As things are, man cannot afford to lose any of the local cultures by assimilation, discrimination or cultural genocide. For the sake of an effective culture planning, a reliable inventory of the world’s cultures in terms of their semiotic impact on the relationship of man and his natural habitat has to be elaborated. It is the semiotician’s demanding task to highlight the heritage of the world’s cultures, historical and present, in a comparative perspective. Furthermore, the semiotician has to select those items of world views in which the balance of man with nature is manifest. The selection of such items is, of course, subject to individual evaluation. However, no authority other than the researcher’s critical mind and common sense can be thought of as a reasonable instance of control. The semi-
V. Geschichtsschreibung der Semiotik
otician may provide an analysis of the scenario from which experiences for planning may be drawn by those who have the authority for such planning and who provide planning measures. Equally demanding is the semiotician’s task to point out settings of contemporary cultures which require planning. Support provided by state authorities or private organizations will be essential for, say, establishing scientific institutes whose members specialize in comparative research on culture planning. Planning committees authorized by the state would profit from the research institutes by consulting them as an advisory board, or by assigning individual researchers official authority in planning affairs. Although semioticians do not share the responsibility for planning with state authorities, they can, nevertheless, provide incentives as culture planning activists and motivate the activities of popular movements. In this regard, the semiotician engaged in culture planning research is in a similar position to that of a researcher in the field of language planning. Both have the fundamental alternatives of delimiting their activities to the academic discussion of planning or of engaging in concrete planning. Doing one or the other or both will, of course, be a matter of individual inclination and attitude. The Euro-American way of rationalist thinking and behavior has led man to compete with nature, and the destructive ideas involved in this attitude have strained the world’s cultures for too long. There is the need for a change in mentality so that the human mind would become susceptible to the benefits resulting from multicultural heritage in world history and its exploitation for the task of mastering the future. “Diversity in mental propensity may hold distinct advantages for the Homo sapiens’ genetic base of the future, especially in a societal context where imaginative or creative forethought may be a paramount asset to a constructive cultural continuity” (Gifford 1978 b, 281). Man’s interest in the cultures of the world is vital, since essential clues to an effective adaptation of humans to the conditions in their future environment may be identified in any of them.
9.
Selected references
Alsop, J. (1970), From the Silent Earth. Harmondsworth. Anati, E. (1979), La pre´histoire des Alpes. Les Camuniens, aux racines de la civilisation europe´enne. Milan.
32. The development of sign conceptions in human cultures Anati, E. (1984), “The State of Research in Rock Art.” Bollettino del Centro Camuno di Studi Preistorici 21: 13⫺56. Anati, E. (1989), Origini dell’arte e della concettualita`. Milan. Arutjunov, S. A. (1989), Narody i kul’tury. Razvitie i vzaimodejstvie. Moscow. Assmann, J. (1990), Ma’at. Gerechtigkeit und Unsterblichkeit im Alten Ägypten. Munich. Baker, P. T. (1988), “Human Adaptability”. In: Harrison et al. 1988: 439⫺547. Baumann, H. (1975 a), “Kulturprovinzen”. In: Baumann 1975 b: 375⫺382. Baumann, H. (ed.) (1975 b), Die Völker Afrikas und ihre traditionellen Kulturen, Teil I: Allgemeiner Teil und südliches Afrika. Wiesbaden. Beach, M. C. (1992), The New Cambridge History of India. Mughal and Rajput Painting. Cambridge, England. Belfer-Cohen, A. (1986), “The Evolution of Symbolic Expression through the Upper Pleistocene in the Levant as Compared to Western Europe”. In: Otte 1986: 25⫺29. Bennett, E. L. (1963), “Names for Linear B Writing and for Its Signs”. Kadmos 2: 98⫺123. Biedermann, H. (1984), Höhlenkunst der Eiszeit. Wege zur Sinndeutung der ältesten Kunst Europas. Cologne. Binnig, G. (1989), Aus dem Nichts. Über die Kreativität von Natur und Mensch. 2nd ed. Munich and Zurich. Bonfante, G. and L. Bonfante (1983), The Etruscan Language. An Introduction. Oxford. Boshier, A. and P. Beaumont (1972), “Mining in Southern Africa and the Emergence of Modern Man”. Optima: Quarterly of the Anglo-American Corporation 22: 2⫺12. Bosinski, G. (1985), Der Neandertaler und seine Zeit. Cologne. Bouissac, P. (1993), “Semiotisches Wettrüsten: Zur Evolution artübergreifender Kommunikation”. Zeitschrift für Semiotik 15: 3⫺22. Campbell, J. (1983), The Way of the Animal Powers. Historical Atlas of World Mythology, vol. 1. London. Cassirer, E. (1923⫺1929), Philosophie der symbolischen Formen, 3 vols. Berlin. Cassirer, E. (1944), Essay on Man. An Introduction to a Philosophy of Human Culture. New Haven CN. Champion, T., C. Gamble, S. Shennan and A. Whittle (1992), Prehistoric Europe. London et al. (sixth printing of the 1984 ed.). Chang, K. C. (1983), Art, Myth, and Ritual. The Path to Political Authority in Ancient China. Cambridge MA and London. Coe, M. D. (1992), Breaking the Maya Code. New York.
707
Cohen, A. (1974), Two-Dimensional Man: An Essay on the Anthropology of Power. Berkeley. Coseriu, E. (1969), “Georg von der Gabelentz et la linguistique synchronique”. In: Gabelentz 1901⫽ 1969: 5⫺40. Coulmas, F. (1991 a), “European Integration and the Idea of the National Language”. In: Coulmas 1991 b: 1⫺37. Coulmas, F. (ed.) (1991 b), A Language Policy for the European Community. Prospects and Quandaries. Berlin and New York. Dams, L. (1984), Les peintures rupestres du levant espagnol. Paris. D’Andrade, R. (1990), “Some Propositions about the Relations between Culture and Human Cognition”. In: Stigler, Shweder and Herdt 1990: 65⫺129. Daniels, P. T. and W. Bright (eds.) (1995), The World’s Writing Systems. Oxford. Davies, J. (1851), A Tahitian and English Dictionary with Introductory Remarks on the Polynesian Language and a Short Grammar of the Tahitian Dialect. London (reprint 1991 in Papeete). DeFrancis, J. (1989), Visible Speech. The Diverse Oneness of Writing Systems. Honolulu. Derrida, J. (1967), De la grammatologie. Paris (Engl.: Of Grammatology, Baltimore 1974). Derrida, J. (1972), Marges de la philosophie. Paris (Engl.: Margins of Philosophy, Chicago 1982). Donald, M. (1993), Origins of the Modern Mind. Three Stages in the Evolution of Culture and Cognition. Cambridge MA and London. Douglas, M. (1986), Ritual, Tabu und Körpersymbolik. Sozialanthropologische Studien in Industriegesellschaft und Stammeskultur. Frankfurt a. M. (Engl.: Natural Symbols: Explorations in Cosmology, London 1970). Duhoux, Y. (1981), “Les Ete´ocre´tois et l’origine de l’alphabet grec”. L’Antiquite´ Classique 50: 287⫺294. Ehlich, K. (1980), “Schriftentwicklung als gesellschaftliches Problemlösen”. Zeitschrift für Semiotik 2: 335⫺359. Ernst, U. (1991), Carmen figuratum. Geschichte des Figurengedichts von den antiken Ursprüngen bis zum Ausgang des Mittelalters. Cologne, Weimar and Vienna. Fitzhugh, W. W. and A. Crowell (1988), Crossroads of Continents. Cultures of Siberia and Alaska. Washington and London. Fleischer, M. (1987), Hund und Mensch: Eine semiotische Analyse ihrer Kommunikation. Tübingen. Fleischer, M. (1993), “Kommunikation zwischen Mensch und Hund”. Zeitschrift für Semiotik 15: 23⫺40. Foster, M. L. (1981), “Culture as Metaphor: A New Look at Language and Culture in the Pleisto-
708 cene”. Kroeber Anthropological Society Papers 59/ 60: 1⫺12. Foster, M. L. (1990), “Symbolic Origins and Transitions in the Palaeolithic”. In: Mellars 1990: 517⫺539. Gabelentz, G. v. d. (1891), Die Sprachwissenschaft, ihre Aufgaben, Methoden und bisherigen Ergebnisse. Leipzig (reprint of the 2nd ed. of 1901: Tübingen 1969). Gifford, J. C. (1978 a), “The Prehistory of Homo sapiens: Touchstone for the Future”. In: Maruyama and Harkins 1978: 71⫺100. Gifford, J. C. (1978 b), “Ideas Concerning Maya Concepts of the Future”. In: Maruyama and Harkins 1978: 273⫺282. Gimbutas, M. (1974), The Gods and Goddesses of Old Europe 7000 to 3500 B. C.: Myths, Legends and Cult Images. London. Gimbutas, M. (1989), The Language of the Goddess. San Francisco. Goody, J. (1986), The Logic of Writing and the Organization of Society. Cambridge, England. Goody, J. (1990), Die Logik der Schrift und die Organisation von Gesellschaft. Frankfurt a. M. (transl. of Goody 1986). Graziosi, P. (1987), L’arte dell’antica eta` della pietra. Florence (reprint of the edition of 1956). Grolier, E. de (ed.) (1983), Glossogenetics: The Origin and Evolution of Language. Paris. Grumach, E. (1967), “Neue Schriftsiegel der Sammlung Metaxas, Herakleion”. Kadmos 6: 6⫺14. Guilaine, J. (ed.) (1991), Prehistory. The World of Early Man. New York and Oxford. Gusejnov, M. M. (1985), Drevnij paleolit Azerbajdzˇana (Kul’tura Kurucˇaj i etapy ee razvitija). 1500000 ⫺ 70 tysjacˇ let nazad. Baku. Haarmann, H. (1976), Grundzüge der Sprachtypologie. Methodik, Empirie und Systematik der Sprachen Europas. Stuttgart et al. Haarmann, H. (1986), Language in Ethnicity. A View of Basic Ecological Relations. Berlin, New York and Amsterdam. Haarmann, H. (1990 a), Universalgeschichte der Schrift. Frankfurt a. M. and New York (2nd ed. 1992). Haarmann, H. (1990 b), Language in Its Cultural Embedding. Explorations in the Relativity of Signs and Sign Systems. Berlin and New York. Haarmann, H. (1990 c), “Language Planning in the Light of a General Theory of Language: A Methodological Framework”. International Journal of the Sociology of Language 86: 103⫺126. Haarmann, H. (1991), Basic Aspects of Language in Human Relations. Toward a General Theoretical Framework. Berlin and New York.
V. Geschichtsschreibung der Semiotik Haarmann, H. (1992), Die Gegenwart der Magie. Kulturgeschichtliche und zeitkritische Betrachtungen. Frankfurt and New York. Haarmann, H. (1993), Die Sprachenwelt Europas. Geschichte und Zukunft der Sprachnationen zwischen Ural und Atlantik. Frankfurt a. M. and New York. Haarmann, H. (1994 a), Early Civilization and Literacy in Europe. Old Europe ⫺ the Ancient Aegean ⫺ Ancient Cyprus ⫺ Archaic Italy (manuscript of a book monograph). Haarmann, H. (1994 b), Die Madonna und ihre Töchter. Rekonstruktion einer kulturhistorischen Genealogie (manuscript of a book monograph). Hall, E. (1989), Inventing the Barbarian. Greek SelfDefinition through Tragedy. Oxford. Harnad, S. R., H. D. Steklis and J. Lancaster (eds.) (1976), Origins and Evolution of Language and Speech. New York. Harrison, G. A., J. M. Tanner, D. R. Pilbeam and P. T. Baker (1988), Human Biology. An Introduction to Human Evolution, Variation, Growth, and Adaptability. Oxford, New York and Tokyo. Havelock, E. A. (1990), Schriftlichkeit. Das griechische Alphabet als kulturelle Revolution. Weinheim. Isaac, G. L. (1976), “Stages of Cultural Elaboration in the Pleistocene: Possible Archaeological Indicators of the Development of Language Capabilities”. In: Harnad et al. 1976: 275⫺287. Jeffery, L. H. (1961), The Local Scripts of Archaic Greece. A Study of the Origin of the Greek Alphabet and its Development from the Eighth to the Fifth Centuries B. C. Oxford (2nd ed. 1990). Jernudd, B. (1981), “Planning Language Treatment: Linguistics for the Third World”. Language in Society 10: 43⫺52. Keightley, D. N. (1985), Sources of Shang History. The Oracle-Bone Inscriptions of Bronze Age China. Los Angeles and London. Ki-Zerbo, J. (ed.) (1990), General History of Africa, vol. I: Methodology and African Prehistory. Berkeley. Koch, W. A. (ed.) (1989), The Nature of Culture. Bochum. Langer, S. K. (1942), Philosophy in a New Key: A Study in the Symbolism of Reason, Rite and Art. New York. Layton, R. (1989), Uluru. An Aboriginal History of Ayers Rock. Canberra (reprint of the 1986 ed.). Layton, R. (1991), The Anthropology of Art. 2nd ed. Cambridge, England. Leach, E. (1976), Culture and Communication. Cambridge, England. Leroi-Gourhan, A. (1968), The Art of Prehistoric Man in Western Europe. London.
32. The development of sign conceptions in human cultures Lindig, W. and M. Münzel (1976), Die Indianer. Kulturen und Geschichte der Indianer Nord-, Mittelund Südamerikas. Munich. Logan, R. K. (1986), The Alphabet Effect: The Impact of the Phonetic Alphabet on the Development of Western Civilization. New York. Lotman, Y. (1985), La Semiosfera. L’assimetria e il dialogo nelle strutture pensanti. Venice. Lumley, H. de (1976 a), “Les premie`res industries humaines en Provence”. In: Lumley 1976 b: 765⫺776. Lumley, H. de (ed.) (1976 b), La pre´histoire franc¸aise. Paris. Maclagan, D. (1977), Creation Myths ⫺ Man’s Introduction to the World. London. Mandelbrot, B. B. (1982), The Fractal Geometry of Nature. New York. Marshack, A. (1972 a), The Roots of Civilization. New York. Marshack, A. (1972 b), “Cognitive Aspects of Upper Paleolithic Engraving”. Current Anthropology 13: 445⫺477. Marshack, A. (1981), “On Paleolithic Ochre and the Early Uses of Color and Symbol”. Current Anthropology 22: 188⫺191. Marshack, A. (1990), “Early Hominid Symbol and Evolution of the Human Capacity”. In: Mellars 1990: 457⫺498. Maruyama, M. and A. M. Harkins (eds.) (1978), Cultures of the Future. The Hague and Paris. McLuhan, M. and R. K. Logan (1977), “Alphabet, Mother of Invention”. Et Cetera 34: 373⫺383. Mellars, P. (ed.) (1990), The Emergence of Modern Humans. An Archaeological Perspective. Edinburgh. Minkoff, H. (1975), “Graphemics and Diachrony: Some Evidence from Hebrew Cursive”. In: Afroasiatic Linguistics 1: 193⫺208. Müller, K. E. (1987), Das magische Universum der Identität: Elementarformen sozialen Verhaltens. Frankfurt a. M. Monod, J. (1972), Chance and Necessity. An Essay On the Natural Philosophy of Modern Biology. London. Ndeti, K. (1978), “The Relevance of African Traditional Medicine in Modern Medical Training and Practice”. In: Maruyama and Harkins 1978: 179⫺193. Niederehe, H.-J. and H. Haarmann (eds.) (1976), In Memoriam Friedrich Diez. Akten des Kolloquiums zur Wissenschaftsgeschichte der Romanistik (Trier, 2.⫺4. Okt. 1975). Amsterdam. Ong, W. J. (1982), Orality and Literacy: The Technologizing of the Word. London. Otte, M. (ed.) (1986), L’homme de Ne´andertal, vol. 5: La pense´e. Lie`ge.
709
Pärssinen, M. (1992), Tawantinsuyu. The Inca State and Its Political Organization. (Studia Historica 43) Helsinki. Peitgen, H.-O. and D. Saupe (eds.) (1988), The Science of Fractal Images. Heidelberg. Pepperberg, J. M. (1993), “Kommunikation zwischen Mensch und Vogel: Eine Fallstudie zu den kognitiven Fähigkeiten eines Papageis”. Zeitschrift für Semiotik 15: 41⫺67. Philippson, A., L. Neumann and W. Sievers (1894), Europa. Eine allgemeine Landeskunde. Leipzig and Vienna. Pilbeam, D. R. (1988), “Human Evolution”. In: Harrison et al. 1988: 3⫺143. Posner, R. (1989), “What is Culture? Toward a Semiotic Explication of Anthropological Concepts”. In: Koch 1989: 240⫺295. Posner, R. (ed.) (1990), Warnungen an die ferne Zukunft: Atommüll als Kommunikationsproblem. Munich. Renfrew, C. (1972), The Emergence of Civilisation. The Cyclades and the Aegean in the Third Millennium B. C. London. Renfrew, C. (1991), The Cycladic Spirit. New York. Ritz, U. (1988), Das Bedeutsame in den Erscheinungen. Divinationspraktiken in traditionalen Gesellschaften. Frankfurt a. M. and New York. Roberts, A. and M. J. Roberts (1989), Dreamtime Heritage. Australian Aboriginal Myths. Blackwood, South Australia. Roche, H. (1991), “The Beginnings of the Human Adventure”. In: Guilaine 1991: 31⫺46. Rubin, J. et al. (eds.) (1977), Language Planning Processes. The Hague, Paris and New York. Ruiz, E. C. et al. (1988), The Days of the Dead: A Mexican Tradition. Mexico City. Ruspoli, M. (1987), The Cave of Lascaux. The Final Photographic Record. London. Sagan, C. (1989), Unser Kosmos. Munich. Samarkand. (1986), Ocˇik osmon ostidagi muzej/Samarkand. A Museum in the Open. Tashkent. Sampson, G. (1985), Writing Systems. London. Saussure, F. de (1967), Cours de linguistique ge´ne´rale (e´dition critique par R. Engler). Wiesbaden. Savage-Rumbaugh, E. S. (1986), Ape Language: From Conditioned Response to Symbol. New York. Schmandt-Besserat, D. (1979), “An Archaic Recording System in the Uruk-Jemdet Nasr Period”. American Journal of Archaeology 83: 19⫺48, 375. Sebeok, T. A. (1972), Perspectives in Zoosemiotics. The Hague. Sebeok, T. A. (ed.) (1986), Encyclopedic Dictionary of Semiotics, 3 vols. Berlin, New York and Amsterdam. Solecki, R. (1971), Shanidar, the First Flower People. New York.
710 Solecki, R. (1975), “Shanidar IV: A Neanderthal Flower Burial in Northern Iraq”. Science 190: 880⫺881. Stigler, J. W., R. A. Shweder and G. Herdt (eds.) (1990), Cultural Psychology. Essays on Comparative Human Development. Cambridge, England. Straus, L. G. (1990), “The Early Upper Palaeolithic of Southwest Europe: Cro-Magnon Adaptations in the Iberian Peripheries, 40 000⫺20 000 B. P.”. In: Mellars 1990: 276⫺302. Tanner, N. and A. Zihlman (1976), “The Evolution of Human Communication: What Can Primates Tell us?”. In: Harnad et al. 1976: 467⫺480. Taylor, A. R. (1978), “Nonverbal Communication in Aboriginal North America: The Plains Sign Language”. In: Umiker-Sebeok and Sebeok 1978: 223⫺244. Thomson, M.-L. (1984), The Sumerian Language. An Introduction to Its History and Grammatical Structure (Mesopotamia 10). Copenhagen. Umiker-Sebeok, D. J. and T. A. Sebeok (eds.) (1978), Aboriginal Sign Languages of the Americas and Australia, vol. 2. New York and London. Vachek, J. (1973), Written Language: General Problems and Problems of English. The Hague. Vasˇcˇenko, A. V. (1989), Istoriko-epicˇeskij fol’klor severoamerikanskich indejcev. Tipologija i poetika. Moscow.
V. Geschichtsschreibung der Semiotik Vinogradov, V. V. et al. (1960), Grammatika russkogo jazyka, t. I: Fonetika i morfologija. Moscow. Walsh, G. L. (1988), Australia’s Greatest Rock Art. Bathurst. Washington, W. M. and C. L. Parkinson (1986), An Introduction to Three-Dimensional Climate Modeling. Mill Valley. Watson, L. (1989), Der unbewußte Mensch. Gezeiten des Lebens ⫺ Ursprung des Wissens ⫺ Lifetide. Frankfurt a. M. Welch, S. C. (1978), Imperial Mughal Painting. New York. Wendt, W. E. (1976), “ ‘Art Mobilier’ from the Apollo 11 Cave, South West Africa: Africa’s Oldest Dated Works of Art”. South African Archaeological Bulletin 31: 5⫺11. Wetzel, R. and G. Bosinski (1969), Die Bocksteinschmiede im Lonetal. Stuttgart. Wilken, G. C. (1979), “Whistle Speech in Tlaxcala (Mexico)”. Anthropos 74: 881⫺888. Wunderli, P. (1976), “Saussure als Schüler Sechehayes?”. In: Niederehe and Haarmann 1976: 419⫺474.
Harald Haarmann, Helsinki (Finland)
33. Probleme der Erfassung von Zeichenkonzeptionen im Abendland 1. Allgemeines 1.1. Semiotik und Anthropologie 1.2. Semiotik und Kulturwissenschaft 1.3. Kulturelle semiotische Praxis: Text-Semiotik, Welt-Semiotik, Verhaltens-Semiotik 1.4. Semiotische Diskurse im Abendland 2. Zeichenkraft 2.1. Manifestation (indexikalische Zeichen) 2.2. Abbildung (ikonische Zeichen) 2.3. Stellvertretung (symbolische Zeichen) 2.4. Entleerung (asemantische Zeichen) 2.5. Vergegenwärtigung (magische Zeichen) 3. Zeichenrevolutionen 3.1. Die jüdische Zeichenrevolution 3.2. Die christliche Zeichenrevolution 3.3. Die Zeichenrevolutionen der Neuzeit 3.4. Die Zeichen(r)evolutionen der Moderne 4. Die (Un-)Lesbarkeit der Welt 4.1. Gott als Zeichengeber 4.2. Der Mensch als Zeichengeber 4.3. Natur, Geist, Information 4.4. Hermeneutik und Semiotik 5. Zusammenfassung: einige Kennzeichen des abendländischen Sonderwegs 6. Literatur (in Auswahl)
1.
Allgemeines
1.1. Semiotik als Teil der Anthropologie In anthropologischer Perspektive empfängt ‘der Mensch’ als ein Gattungswesen seine spezifischen Merkmale in Abgrenzung vom Tier. Der Gebrauch von Zeichen kommt als relevantes Unterscheidungskriterium bekanntlich nicht in Frage, wohl aber die Ausgestaltungen dieses Gebrauchs, deren markanteste die natürlichen Einzelsprachen sind. Tierische Zeichenpraxis leistet Informationsübermittlung durch sinnliche Repräsentation von Abwesendem. Von den Tieren trennt den Homo significans jedoch die „Exkarnation“ von Zeichen. „Inkarnierte Zeichen“ sind solche, die körperlich erzeugt werden und in der Regel nur so lange präsent sind, wie sie von einem Zeichengeber vollzogen werden; „exkarnierte Zeichen“ sind dagegen vom Körper abgelöst, sie haften auf einem Informationsträger, der vom Zeichengeber ablösbar ist. Diese technische Erweiterung eröffnet neue Dimensionen des Zeichenge-
33. Zeichenkonzeptionen im Abendland
brauchs über die reine Interaktion hinaus (vgl. Art. 27). Vor allem können Zeichen dadurch ⫺ sogar unabhängig vom Zeichengeber ⫺ wiedergebraucht werden. Der amerikanische Kulturanthropologe Kenneth Burke hat dies an einem Beispiel illustriert. Eine Amsel, die durch Zufall oder langwierige Versuche einen Trick entdeckt hat, wie sie ihr säumiges Junges aus dem Nest befördern kann, ist nicht in der Lage, selbst von diesem Wissen zu einem späteren Zeitpunkt wieder Gebrauch zu machen, geschweige denn, es an andere mögliche Nutznießer weiterzugeben (Burke 1966: 4). Die mnemotechnische Funktion von „Bildern und Zeichen, welche die Handlungen über den Augenblick hinaus festhalten“ (Herder 1774 ⫽ 1967⫺68: V, 140), scheint mithin ein Merkmal des Menschen zu sein. Mit der Fixierung von Wissen durch Zeichen wird der Kommunikationsraum in Raum und Zeit drastisch erweitert (vgl. Bonner 1980 ⫽ 1983: 191 ff). Kulturen basieren auf solchen Zeichen, die Informationen zum Wiedergebrauch organisieren. Diese Organisation betrifft sowohl die synchrone Dimension (die Gesellschaftsbildung im Raum, die Integration vieler Menschen zu einem Gemeinwesen) als auch die diachrone Dimension (die Kontinuierung der Gesellschaft mithilfe der Traditionsbildung) durch Aufbau eines transindividuellen Gedächtnisses, an dem Individuen über die Zeit hinweg teilhaben können. Der Mensch ist anthropologisch nicht nur als Homo significans, als zeichengebendes, sondern auch als Homo interpres, als symbolempfangendes Wesen zu bestimmen, das die Welt als eine latent bedeutsame und zu entziffernde Botschaft erfährt. Es ist ein semiotisches Grundaxiom, daß sich Zeichenhaftigkeit nicht aus bestimmten Merkmalen eines Objekts ableiten läßt, sondern erst aus der Beziehung zwischen einem deutenden Betrachter und einem Objekt hervorgeht (vgl. Art. 4). Betrachterbezogene Zeichendefinitionen gibt es seit Aristoteles und der an ihn anknüpfenden Scholastik: „Zeichen ist, was dem Vermögen eines Erkennenden etwas repräsentiert“ (vgl. Art. 35 § 2.3. und Art. 62 § 2.1.). Der deutende Mensch lebt in einer Umwelt, die er als auf sich zugerichtet und daher als interpretationspflichtig erfährt. Die zeichenhafte Welt geht dabei weit über die sozial konstruierten Räume der Interaktion hinaus; Umweltsignale müssen zur Sicherung des Überlebens ständig gelesen werden, aber
711 auch auf die Signale von Göttern, Geistern, Ahnen wird geachtet, die ihre Mitteilungen in Zeichen verschlüsseln. 1.2. Semiotik und Kulturwissenschaft Da der abstrakte Mensch in dieser Form nirgendwo auf dem Globus real existiert, bedarf die anthropologische Beschreibung umgehend einer kulturwissenschaftlichen Perspektivierung. Sowohl die zeichengebende Kompetenz als auch die auf Bedeutsamkeit hin angelegte Aufmerksamkeit erhalten ihre spezifische Ausprägung erst durch die jeweilige kulturelle Rahmung. Deshalb muß die anthropologische in eine kulturwissenschaftliche Betrachtungsweise einmünden. Die einzelnen Kulturen geben die Grammatiken der Zeichenpraxis vor; sie stecken den Rahmen ab, innerhalb dessen bestimmte semiotische Systeme zur Entfaltung kommen und andere nicht. Sowenig ein Zeichen außerhalb seines Systems bedeutungskräftig ist, sowenig existiert menschliche Zeichenpraxis jenseits ihrer kulturellen Fundierung. Das bedeutet, daß die Kultur als Setzungs-Rahmen der jeweiligen Semiosen zu betrachten ist, und die jeweiligen Semiosen umgekehrt auch als Index kultureller Optionen aufgefaßt werden können. Kulturen treffen Vorentscheidungen, wie Umweltinformationen verarbeitet werden; die Identität einer Kultur bemißt sich nach der Art und Weise, wie Zeichen gebraucht werden. Kulturen als Kontexte für Zeichensysteme konditionieren AufmerksamkeitsDispositionen, Wahrnehmungsraster und Relevanzhorizonte, die der Orientierung des einzelnen immer schon vorgegeben sind. Solche Vorentscheidungen werden mit dem Begriff der „cultural constraints“ (‘kulturelle Zwänge’) bezeichnet, wir sprechen im folgenden lieber von „kulturellen Optionen“. Um diese näher zu veranschaulichen, empfiehlt es sich, auf die von Le´vi-Strauss getroffene Unterscheidung von „kalten“ und „heißen“ Kulturen zurückzugreifen, der damit die unhaltbare Klassifikation nach „geschichtsfähig“ und „geschichtslos“ ersetzte (Le´viStrauss 1962 ⫽ 1973: 270). Die beiden Typen von Kulturen entwickeln eine grundsätzlich verschiedene Zeichenpraxis. Kalte Kulturen sind adaptive Kulturen; sie setzen einen beseelten Kosmos voraus und sind auf Anpassung und Einbettung in die Umwelt ausgerichtet. Zu diesem Zweck wird die Umwelt in eine sprechende verwandelt, mit der eine permanente Kommunikation aufrechterhalten wird.
712 Heiße Kulturen sind demgegenüber expansive Kulturen, die darauf eingestellt sind, ihre Zeichenpraxis zu universalisieren (vgl. dazu das Stichwort „Europeanization“ (in Art. 32 § 8.). Heiße Kulturen sind umweltindifferent und umweltabstrakt; sie lassen sich nicht auf bestehende Umwelten ein, sondern entwickeln die Zwischenwelt der Technik als die ihnen spezifische Umwelt. An die Stelle eines beseelten Kosmos tritt die entzauberte Welt, die sich als Objekt der Weltbemächtigung darbietet. Zielbestimmung der expansiven Kultur ist die Beherrschung der Natur, nicht die Anpassung an sie. Die Kategorie der Bedeutungshaftigkeit wird damit auf das vom Menschen Gemachte eingeschränkt. Freilich darf man bei der schlichten Typologie von kalten (oder adaptiven) und heißen (oder expansiven) Kulturen nicht stehenbleiben. Sie hat die heuristische Funktion, gegensätzliche Richtungen zu akzentuieren, ist jedoch kaum geeignet, komplexere Phänomene zu beschreiben. Ein solches hochkomplexes Phänomen aber stellen die „Zeichenkonzeptionen im Abendland“ dar. Hier handelt es sich keineswegs um einen einheitlichen Kulturtyp mit einer einheitlichen Zeichenpraxis. Im Gegenteil ist die Kulturgeschichte Altund Neu-Europas eher als Schauplatz einander teils überlagernder, teils sich gegenseitig bekämpfender und gewaltsam verdrängender Zeichenkonzeptionen zu beschreiben. Die Kulturentwicklung dieses Raumes wird in dieser Perspektive als ein Prozeß des Widerstreits gegensätzlicher Zeichenkonzeptionen und -praktiken sichtbar. Das soll weiter unten an einigen Konstellationen verdeutlicht werden (§ 3.). 1.3. Kulturelle semiotische Praxis: Text-Semiotik, Welt-Semiotik, Verhaltens-Semiotik Die Frage nach der Erfassung von Zeichenkonzeptionen, wie sie in der Überschrift dieses Artikels gestellt ist, macht gewisse Eingrenzungen im Begriffsumfang des Wortes „Zeichen“ nötig. Im weiteren Sinne beruht jegliche Kommunikation und kulturelle Praxis auf Zeichen; in dieser unspezifischen Inklusivität wurde der Begriff oben verwendet und in dieser allgemeinen Weite ist er Gegenstand der Meta-Disziplin Semiotik. Um Semiotik in einem engeren Sinne handelt es sich, wenn auf dem Boden einer bestimmten Kultur bestimmte Erscheinungen als Zeichen qualifiziert werden, die einer dafür auszubildenden Kunst der Deutung bedürfen. In die-
V. Geschichtsschreibung der Semiotik
sem Falle wollen wir von „kultureller semiotischer Praxis“ sprechen. In einem noch eingeschränkteren Sinne beziehen wir das Wort „Semiotik“ auf die theoretische Reflexion über Zeichen im Allgemeinen. Im Hinblick auf diese Fälle werden wir im Folgenden von „semiotischen Diskursen“ sprechen. Den semiotischen Diskursen geht die kulturelle semiotische Praxis voran. Die rationalisierten Zeichendiskurse haben die kulturelle Zeichenpraxis zum Teil systematisiert, zum Teil aber auch ignoriert oder sogar verdrängt. So wird die Magie ⫺ von wenigen Ausnahmen abgesehen ⫺ als ein zentraler Bereich kultureller semiotischer Praxis in der Regel in den historischen semiotischen Diskursen, die sich das Gepräge der Wissenschaftlichkeit geben, übergangen. Semiotische Praxis stellt sich in der Geschichte der Kultur dort ein, wo Zeichen existieren, die als zugleich bedeutsam und unlesbar erfahren werden. Semiotische Praxis beginnt mit der Erfahrung der Unlesbarkeit bedeutsamer Zeichen. Wenn die Bedeutung der Zeichen nicht spontan zu entziffern ist, dann muß die Kultur entsprechende Deutungshilfen entwickeln. Diese Deutungsanleitungen sind nicht das Ergebnis theoretischer Spekulationen, vielmehr sind sie von einem vitalen pragmatischen Interesse geleitet. Geht es bei dieser Kunst der Zeichendeutung doch darum, wichtige Entscheidungen zu ermöglichen, Heilung und SinnSignale zu empfangen, sowie sich in einer unsicheren Welt zu orientieren. Wir wollen die Frage nach der semiotischen Praxis in der Geschichte der Kultur vom Ende her aufrollen und mit einem Beispiel beginnen. Ein beamteter Literaturwissenschaftler liest in einer Kurzgeschichte von James Joyce mit dem Titel „Araby“ die Beschreibung, die der Erzähler, ein Schulbub, von einem verlassenen Garten gibt: „In der Mitte des verwilderten Gartens stand ein Apfelbaum, außerdem gab es da einige wuchernde Büsche, unter einem davon fand ich die verrostete Fahrradpumpe des verstorbenen Bewohners“. Als Interpretations-Spezialist muß sich der Literaturwissenschaftler nun den Kopf zerbrechen, ob die Pumpe für die Schlange im Paradiese steht oder doch eher ein Phallus-Symbol ist. Welche Deutung im einzelnen gefunden oder vorgezogen wird, ist nicht entscheidend, wichtig ist allein, daß im Rahmen der Institution Literaturwissenschaft Texte als pansemiotische Bedeutungsträger aufgefaßt werden. Diese pansemiotische Aufmerksamkeit endet an der Grenze
33. Zeichenkonzeptionen im Abendland
des Textes. Kein noch so sensibler Literaturwissenschaftler wird sich beim Anblick einer rostigen Luftpumpe in seinem Garten fragen, ob er es eher mit der Paradiesesschlange oder einem verkappten Phallus-Symbol zu tun hat. Die Deutungsbereitschaft hat sich aus der empirischen Alltagswelt zurückgezogen und konzentriert sich auf bestimmte Texte, die zum Interpretieren freigegeben sind. Die exegetische Sucht hat eine lange Tradition (vgl. etwa Art. 61, 62 und 63). Sie wurde entwickelt nicht an Texten der schönen Literatur sondern an solchen, die die normative und formative Grundlage des Lebens einer Gesellschaft bildeten, an heiligen Texten und Rechtstexten. Um beide Textsorten rankte sich die Kunst des Kommentars. Ihr gesellschaftlicher Auftrag bestand darin, der fortschreitenden Fremdheit der erstarrten Buchstaben entgegenzuwirken und den dunkel gewordenen Zeichen des Textes ihre Transparenz und Leuchtkraft zurückzugeben. Die exegetische Tradition ist eine Schöpfung der Schriftkulturen; die zweigleisige Parallelführung von Haupt- und Nebentext ist in einer mündlich verfaßten Gesellschaft so nicht denkbar. Indem sich die Energie der Interpretation auf die Texte als bedeutungsvolle und deutungspflichtige Zeichenträger konzentrierte, zog sie sich aus Bereichen zurück, die zuvor semiotische Relevanz beanspruchten. Das Interpretieren von Zeichen taucht in der Kulturgeschichte nicht erstmals in der Gestalt der Text-Semiotik auf, sondern in der der Welt-Semiotik. Dabei geht es sicher nicht wie bei den existentialistischen Philosophen unseres Jahrhunderts um ein diffuses Angesprochensein von Sinnhaftigkeit, sondern um konkrete Botschaften, die es zu entschlüsseln gilt. Die älteste semiotische Praxis in der Kultur ist die Divination. Damit ist eine kulturelle Institution gemeint, die darauf eingestellt ist, bedeutungsvolle Zeichen aus einer anderen Welt zu empfangen und Techniken für ihre Deutung zu entwickeln. Diese Mitteilungen schlagen sich in der Erfahrungswelt nieder: Als „Zeichen und Wunder“ in den Naturerscheinungen oder als Eingebung von Stimmen. Wichtigste Voraussetzung der Divination ist, daß Kommunikation mit nichtempirischen Wesen wie Göttern, Dämonen, Ahnengeistern und Toten möglich ist. Da deren Sprache jedoch nicht unmittelbar zugänglich ist, bedarf es einer besonderen Technik der Übersetzung solcher Zeichen in verständliche Bedeutung. Die Priester und Scha-
713 manen boten ihre Hilfe an, und es gab, wie wir nicht zuletzt aus der Josephs-Geschichte wissen, besondere Experten der Traumdeutung. Sogenannte „Traumbücher“ waren im antiken Griechenland beliebt (Dodds 1970: 55⫺71); sie belehrten darüber, wie man bedeutungsvolle Träume zu induzieren und entziffern habe. Ähnliches gilt für das Orakelwesen. Bei diesen verschiedenen Formen der Mantik handelt es sich um die wohl ältesten semiotischen Praktiken der Kulturgeschichte, von deren Faszination in der Folklore noch etwas bis in unsere Tage fortlebt (vgl. Art. 160). Neben der Text-Semiotik und der Welt-Semiotik gibt es einen dritten Bereich, in dem sich so etwas wie eine semiotische Praxis entwickelt hat: die Semiotik zwischenmenschlichen Verhaltens. In diesem Falle dringt das Problem der Deutung in die Interaktion zwischen Menschen ein. Deutung wird auch hier erforderlich, sobald Intransparenz, Fremdheit erfahren wird. Das primäre Problem ist das der fremden Sprache, die des Dolmetschers bedarf. Als semiotische Praxis hat sich der Umgang mit dem Fremden entlang der kulturellen Grenzen und interkulturellen Knotenpunkte etabliert, wo wir uns vorstellen müssen, daß es Systeme kultureller Zweiund Mehrsprachigkeit gegeben hat wie im hellenistischen Alexandrien oder in der Bukowina der K. u. K.-Monarchie. Es gibt auch das Problem fremden Verhaltens und fremden Brauchtums als semiotische kulturelle Praxis lange, bevor der Ethnologe auftaucht, der sich auf fremdes Denken spezialisiert. Clifford Geertz hat seine ethnologische Semiotik bezeichnenderweise mit einer philologischen Metapher beschrieben. Damit macht er zugleich deutlich, daß die Text-Exegese in der westlichen Kultur zum Paradigma jeglicher Zeichendeutung geworden ist: „Doing ethnography is like trying to read (in the sense of ‘construct a meaning of’) a manuscript ⫺ foreign, faded, full of ellipses, incoherencies, suspicious emendations, and tendentious commentaries, but written not in conventionalized graphs of sound but in transient examples of shaped behavior“ (Geertz 1973: 10). Zwischenmenschliche Fremdheit ist allerdings nicht auf den Träger einer fremden Kultur und Sprache beschränkt. Semiotisch relevant wird das Problem vor allem dort, wo man mit einem Gesprächspartner rechnen muß, der sich nicht offenbart, sondern verstellt, der seine Absichten aus strategischen
714 Gründen klug zu verdecken weiß. Während Hugo von St. Victor Anfang des 12. Jahrhunderts eine Ethik der Gestik entwickelt hatte, die auf einer Ausdrucksanalogie zwischen Körper und Seele beruht, stellt sich das Problem in der Renaissance bereits ganz anders dar. Im Horizont der Anforderungen höfischen Lebens entstand eine semiotische Praxis der Verstellung und eine entsprechende Kunst der Verhaltensdeutung. Ihre Grundsätze hat Gracia´n so zusammengefaßt: „Das praktischste Wissen besteht in der Verstellungskunst. Wer mit offenen Karten spielt, läuft Gefahr zu verlieren. Die Zurückhaltung des Vorsichtigen kämpfe gegen das Aufpassen des Forschenden“; Gracia´n 1982: 63 f). Handbücher untermauerten diese Praxis der Interaktion, die zu einer komplexen semiotischen Übung ausartete, bei der auch die Physiognomik nicht fehlte (Geitner 1992; vgl. Art. 69). 1.4. Semiotische Diskurse im Abendland Der kanonische Text, die Signale außerweltlicher Botschaften in dieser Welt und die Unklarheit menschlichen Verhaltens lassen sich als drei heterogene Quell-Bereiche semiotischer Praxis in der abendländischen Kultur ausmachen. Neben dieser Praxis und in teilweise sogar weitgehender Unabhängigkeit von ihr entwickelten sich semiotische Diskurse, die das Zeichen selbst zum Gegenstand ihres Nachdenkens machten und über Vorkommen, Status und Vielfalt von Zeichen reflektierten. In der abendländischen Geschichte beginnen diese semiotischen Diskurse in der griechischen und römischen Antike, wo erstmals das Zeichen als Medium kultureller Sinnbildung in den Blick rückte. Diese Diskursgeschichten verbinden sich jedoch nicht zu einer kontinuierlichen Disziplingeschichte, wenn der Begriff der Disziplin eine Kontinuität des Gegenstands- und Problembereichs, des begrifflichen Instrumentariums und der institutionellen Autorisierung voraussetzt (vgl. Art. 35 § 1.2.). Bis an die Schwelle der Moderne bleiben die semiotischen Diskursgeschichten unterschiedlichen Thematisierungsrahmen und Interessenlagen untergeordnet. In der griechischen und römischen Antike gilt die Zeichenkunde als ein Gebiet, das kein eigenes Interesse beansprucht, sondern anderen grundsätzlichen Reflexionen unterstützend zu Hilfe kommt: der Sprachlehre, der Erkenntnislehre, der Wahrnehmungslehre und der Ontologie. Zeichen als untergeordnete
V. Geschichtsschreibung der Semiotik
Medien des Sprechens, Denkens, Erkennens besitzen noch keinen autonomen Status (vgl. Art. 40 § 2.). Die Stoiker interessieren sich für das Zeichen besonders im Rahmen ihrer Lehre von der Sprachentstehung. Sie führen jedes Wort auf eine Entstehungssituation zurück, die es als ihren unhintergehbaren Ursprung in sich festhält, und zu dem das Verfahren der Etymologie sich behutsam zurückarbeiten kann. Zwischen Sprache und Dingwelt besteht keine feste Grenze; die sprachlichen Zeichen sind von den Dingen, die sie vorstellen, imprägniert, auch wenn diese Beziehung aufgrund des korrumpierenden zeitlichen Wandels nicht unbedingt immer transparent bleibt. Neben den semiotischen Diskursen der Philosophen gibt es die der Theologen (vgl. Art. 47, 58, 72 und 87). Diese beginnen nicht erst mit der Ausarbeitung einer jüdischen oder christlichen Hermeneutik. Als frühes Beispiel sei hier die Diskussion über den Status der Götternamen erwähnt, die in der Kontroverse zwischen Origenes und Celsus angestoßen wurde. Götternamen, so lautete die These, die zunächst von Origenes und später von Jamblichus vertreten wurde, seien prinzipiell unübersetzbar, womit ihnen ein Sonderstatus jenseits der sprachlichen Zeichen zuerkannt wurde. Dieser Sonderstatus beruhe auf ihrer besonderen Kraft, die eine Ersetzung des Signifikanten prinzipiell ausschließe (J. Assmann 1995). Die Unterordnung der Zeichentheorie unter vorrangige philosophische Probleme wie Sprache, Wahrheit und Erkenntnis endet mit Augustin, der gewöhnlich als Begründer der Semiotik genannt wird (Art. 35 § 2.). Neu an dem von ihm begründeten Diskurs ist der Zusammenschluß von Sprach- und Zeichentheorie. Augustin ist der erste, der Sprache als ein Zeichengefüge deutet (vgl. Art. 40 § 4., Art. 49 § 2.1. und Art. 53 § 1.1.). Das bedeutet, daß er Worte nicht mehr wie Platon als (sekundäre) Abbilder oder Manifestationen von Sachen auffaßte, sondern als Elemente eines eigenen Systems. Daneben entwickelte er eine eigene Verstehenslehre (Hermeneutik) für die schriftlich niedergelegten Zeichen des biblischen Textes. Die Scholastik führte die Zeichentheorie als Subdisziplin der Grammatik und Logik weiter (vgl. Art. 53). Das Studium der Zeichen diente der Anleitung zum richtigen und wahrheitsgetreuen Sprechen (Grammatik) und Denken (Logik); in der protestantischen Tradition wurde der semiotische Diskurs
33. Zeichenkonzeptionen im Abendland
der theologischen Metaphysik untergeordnet (vgl. Art. 72). Mit den Anfängen einer neuzeitlichen Epistemologie im 16. und 17. Jahrhundert stand das Interesse an den Zeichen im Dienste der Erkenntnistheorie (vgl. Art. 62). Die christliche Tradition der Texthermeneutik wurde in der neuzeitlichen Hermeneutik wieder aufgenommen, wobei das allegorische Verfahren der Sinnerzeugung immer stärker textuellen Interpretationen wich. Die wohl wichtigste Wandlung in der Geschichte der semiotischen Diskurse ist die von einer hier und da in Dienst genommenen Hilfswissenschaft zu einer generalisierten, andere Disziplinen fundierenden Theorie, ein Status, der mit Peirce als erreicht gilt (vgl. Art. 35 § 4. sowie Art. 74 § 7. und § 23.). Im folgenden soll unter dem Stichwort „Zeichenkraft“ eine Systematisierung unterschiedlicher Zeichentypen versucht werden (§ 2.). Anschließend soll die Untersuchung in die Geschichte zurückführen, wo sie einige exemplarische Konfrontationen abendländischer „Zeichenrevolutionen“ festhält (§ 3.). Bevor abschließend nach dem abendländischen Sonderweg in bezug auf die Zeichenkonzeptionen (§ 5.) gefragt wird, geht § 4. auf die Verschiebungen jener Grenze ein, die in der abendländischen Geschichte einen zeichenhaften von einem nicht-zeichenhaften Bereich trennt.
2.
Zeichenkraft
Die Grundfragen der semiotischen Diskurse betreffen neben den Funktionen der Zeichen auch die ihnen eigene Struktur. Was macht überhaupt etwas zu einem Zeichen, worauf beruht die Zeichenhaftigkeit einer Gestalt, einer Sache, einer Wahrnehmung, eines Ereignisses? In Analogie zum Begriff der Gesetzeskraft, zum autoritativen Wort, kann man von der „Zeichenkraft“, der Fähigkeit zur Repräsentation, sprechen. Worauf beruht diese Zeichenkraft? Sie beruht offensichtlich auf unterschiedlichen Beziehungen, die eine Sache zu einer anderen unterhalten kann. Die Anzahl solcher möglicher Relationen ist begrenzt. Sie dienen von jeher als wichtigstes Instrument der Klassifikation von Zeichentypen. Am berühmtesten ist die dreifache Klassifikation von Peirce geworden, der die Vielfalt der Zeichen in die Rubriken Index, Ikon und Symbol einordnete (vgl. Art. 100). Dabei ist festzuhalten, daß in denselben Signifikanten unterschiedliche Zeichenkraft wohnen
715 kann. Worte etwa können sowohl als Äußerung einer Mitteilung (symbolisches Zeichen) als auch als Anzeichen für den Gemüts- oder Geisteszustand eines Sprechenden aufgenommen werden (indexikalisches Zeichen). Das Peircesche Klassifikationsschema, das ältere semiotische Ordnungsmodelle in sich aufgenommen hat, soll im folgenden kurz skizziert und um zwei Stellen erweitert werden. 2.1. Manifestation (indexikalische Zeichen) Indexikalische Zeichen beruhen auf einer metonymischen Relation; sie sind als Wirkungen oder Symptome ein Teil der Sache, die sie bezeichnen. In diesem Fall wird etwas Unsichtbares durch etwas Sichtbares angezeigt, das aus verschiedenen Gründen der direkten Evidenz in der Gegenwart entzogen ist ⫺ sei es, daß es in der Vergangenheit liegt (z. B. das Laktieren als Indiz für stattgehabte Mutterschaft), daß es erst später eintritt (die Gewitterwolke als Indiz für bevorstehendes Unwetter) oder überhaupt unsichtbar ist (die Flekken auf der Haut für einen verborgenen Krankheitsherd im Körper, die Schamröte für emotionelle Erregung). Diese Zeichen wurden auch „natürliche“ genannt, weil sie nicht eigens vom Menschen hergestellt werden, sondern sich von selbst einstellen, bzw. „Universalzeichen“, weil man annahm, daß sie für alle Menschen dieselben sind (vgl. Art. 62 § 2.1.). Bei natürlichen Ursache-WirkungsZusammenhängen spricht man in der Regel von Anzeichen, bei somatischen Vorgängen von Symptomen, bei unsinnlichen Subjekten (wie Geist, Geschichte oder Transzendenz) von Objektivationen bzw. Chiffren. Ein absichtlicher Mitteilungswille wird in keinem der Fälle vorausgesetzt, vielmehr „zeigt sich etwas“. Die Erscheinungen sind Zeichen überhaupt nur für denjenigen, der sie als solche zu lesen weiß. Einem Teil dieser Zeichen, zum Beispiel den körperlichen Symptomen, kann nachträglich aufgrund von Beobachtung und Erfahrung eine Gesetzmäßigkeit unterstellt werden, weshalb Aristoteles sie unter dem Begriff des Enthymems für syllogistische und juristische Beweisverfahren in Anspruch nahm (vgl. Art. 40 § 2.1.). Ein anderer Teil wie die physiognomischen Zeichen bleiben in ihrer Bedeutung umstritten (man denke an die Kontroverse zwischen Lavater und Lichtenberg über die (Un-)Lesbarkeit körperlicher Merkmale, vgl. Barta Fliedl und Geissmar 1992). Ein dritter Teil, wie Kants „Geschichtszeichen“, Heideggers „Sprechen der
716 Sprache“ oder Jaspers’ „Chiffren der Existenz“ (vgl. Art. 74) gelten als unerschöpflich bedeutungsvoll, sind aber auf keine eindeutigen Bedeutungen zurückführbar. 2.2. Abbildung (ikonische Zeichen) Ikonische Zeichen fungieren als Abbilder. Ihre Zeichenhaftigkeit beruht auf der Ähnlichkeit mit der Sache, die sie bezeichnen. In jede Abbildung gehen notwendig mehr Merkmale ein, als für eine eindeutige Identifikation des Abgebildeten nötig sind; andererseits kann immer nur ein Teil der Merkmale des Darzustellenden erfaßt werden. Daraus ergibt sich, daß abbildende Zeichen auf Mehrdeutigkeit angelegt sind. Ähnlichkeitsbeziehungen beruhen nicht unbedingt auf rein optischer Evidenz; sie können auch durch eine kulturelle Semantik wie die Allegorese organisiert und vorgegeben sein. Platon, der die Worte als Abbilder von Sachen auffaßte, setzte eine Kongruenz zwischen der Zeichenform und dem Wesen der Sache voraus. Auf dieser Annahme beruht das in der Antike und im Mittelalter so beliebte Verfahren der Etymologie, das diesen Ähnlichkeitsbeziehungen in der Lexik nachgeht (vgl. Art. 59 § 1.). 2.3. Stellvertretung (symbolische Zeichen) Symbolische Zeichen (auch „konventionelle“, „willkürliche“, „arbiträre“ genannt) fungieren als Stellvertreter. Ihre Verbindung zur Sache, die sie bezeichnen, beruht auf einem Kode. Durch das vom Kode definierte Beziehungsgefüge sind sie von allen abbildenden Aspekten befreit. Zwischen Signifikanten und Signifikat wird keine wie auch immer geartete Ähnlichkeit unterstellt. In scholastischer Terminologie heißen diese Zeichen „signa ad placitum“ oder „ex impositione“ (vgl. Art. 49). Man nahm an, daß sie ihre Zeichenkraft entweder durch einen förmlichen Einsetzungsakt nach dem Modell der Gesetzgebung („institutio“) oder durch Gewohnheit („usus“, „consuetudo“, „habitus“) erhalten (Art. 62 § 2.3.). Die Semiotik faßt heute beide Modi unter dem Begriff des Kode zusammen. Das Interesse verlagert sich dabei vom Ursprung der Zeichen auf ihre Funktionsweise. In diesem Licht, das vor allem die strukturalistische Forschung verbreitete, ließ sich die Zeichenkraft der symbolischen Zeichen auf ihren differentiellen Wert innerhalb eines Systems zurückführen. Die symbolischen Zeichen sind aufgrund ihres distinktiven Charakters eindeutig. Sie tendieren zur Reduktion. Entscheidend ist allein
V. Geschichtsschreibung der Semiotik
die Qualität der Wiedererkennbarkeit. Idealiter schrumpft ihr Bedeutungsumfang auf ein einziges Merkmal zusammen. Diese Schematisierungsstufe ist bei festen Bildformeln, Buchstaben sowie identifizierenden Attributen erreicht (vgl. Art. 55 § 9. und 20.). 2.4. Entleerung (asemantische Zeichen) Neben den manifestierenden, den abbildenden und den bedeutenden Zeichen gibt es eine weitere Gruppe, die asemantischen Zeichen. Für die Annahme, daß es sich auch bei den „Leerzeichen“, wie man sie nennen könnte, wirklich noch um Zeichen handelt, spricht die Tatsache, daß diese Figuren aufgrund starker Typisierung sofort wiedererkennbar sind und zu einem festen Repertoire gehören. Allerdings ist diesen Signifikanten weder ein Signifikat noch ein Referent zuzuordnen. Als „Zeichen, die nichts bezeichnen“ stehen sie am Rande des semiotischen Universums, gehören als Grenzphänomene aber unbedingt zu diesem dazu. Ihre Zeichenkraft verdanken sie der negativen Semiose, der Entleerung (vgl. Even-Zohar 1983). Sie setzen die Anwesenheit semantisch investierter Zeichen voraus, von denen sie sich absetzen. Die Entleerung setzt andere Kräfte frei, vom freien Spiel der Phantasie auf den romanischen Kapitellen bis zur entkoppelten Ästhetik der Arabeske. Ihr bevorzugter Ort sind die Ränder als Grenzbereiche von Bedeutungsund Bewußtseinsräumen. Auf den Randfeldern der mittelalterlichen Buchmalerei entfalten monströse Figuren und arabeske Ornamente ein exuberantes Eigenleben, bevor sie den Reinigungsmaßnahmen der Vernunft zum Opfer fallen (vgl. Art. 36 § 10. sowie Art. 55 § 2.1. und 2.5.). Neuzeitlich ließe sich an Goyas phantastische Gestalten denken, die die träumende Vernunft gebiert. Die griechische Semiotik räumte den Nonsensworten noch einen besonderen Platz ein (Art. 40 § 3.1.1.). Besonders wichtig sind die asemantischen Zeichen in der jüdischen Kabbalah geworden, die die Signifikanten des biblischen Textes ihrer semantischen aber eben nicht semiotischen Dimension enthob. Dadurch verwandelte sich der bekannte Text der Bibel in die Signifikantenkette unbekannter aber wirkmächtiger Gottesnamen (vgl. Art. 61 § 3.2.). 2.5. Vergegenwärtigung (magische Zeichen) Zwischen den asemantischen und den magischen Zeichen gibt es eine Parallele, die darin besteht, daß beide die Dimension der Signifi-
33. Zeichenkonzeptionen im Abendland
kate überspringen. Magische Zeichen stellen eine unmittelbare Verbindung zum Referenten her, allerdings sind Referenten hier nicht die üblichen Bezugsgrößen menschlicher Kommunikation, nämlich Gegenstände und Sachverhalte, sondern wirkmächtige, übersinnliche Aktanten. Geister werden dadurch beschworen, daß man mittels eines Zeichens auf sie einwirkt, auf welches diese hören, weil es ihnen wesenhaft zugehört. In einem solchen Zeichen, das als Teil oder Attribut zum Referenten gehört, kann er sich jederzeit verkörpern. Das Zeichen ist das Lockmittel, das ihn in die Gegenwart zwingt, vergegenwärtigt. Das magische Zeichen holt eine unsichtbare Potenz in sinnliche Präsenz, um sie der menschlichen Einwirkung zugänglich zu machen, bzw. um eine Kommunikation zu ermöglichen, um eine Kommunion zu vollziehen. Seine Zeichenkraft beruht darauf, daß der Referent dem Zeichen einwohnt, Zeichen und Referent sind ⫺ wie im kontroverstheologischen Problem des Abendmahls ⫺ durch Konsubstantialität miteinander verbunden. Die wichtigsten magischen Zeichen sind das Bild und der Name. Beim Bild kommt es nicht auf Ähnlichkeit an sondern Wesensgleichheit (in englischer Terminologie: es geht nicht um „icon“, sondern um „idol“). Im Judentum, wo der Bilderkult tabuisiert war, füllte sich dafür der Gottesname mit magischer Energie auf (vgl. Art. 32 § 4.). In der Alltagskultur besteht eine Anzahl von Praktiken fort, die von der Aufklärung als „abergläubisch“ diffamiert wurden; tatsächlich ist im Zentrum der kulturellen Zeichen im Abendland das Abendmahl der letzte Ausläufer einer magischen Zeichenpraxis. Im Mittelalter waren magische oder idolatrische Zeichen unverzichtbar und genossen im östlichen Europa in der Form der Ikone höchste kulturelle Dignität (siehe Belting 1990 und Barasch 1992; vgl. auch Art. 38).
3.
Zeichenrevolutionen
Im Rahmen einer Mediengeschichte (vgl. Art. 14 und 15) stellen sich die Geschichten von Zeichen meist in der Perspektive der Evolution dar ⫺ als Optimierung von Werkzeugen, als Abstraktionssteigerung von Schrifttypen, als Rationalisierung von Informationssystemen (vgl. Landsch et al. 1992). Eine solche Darstellung orientiert sich an einer der Technologie der Zeichen immanenten Evolu-
717 tionslogik (vgl. Goody 1977, dazu die Kritik von Elwert 1987 sowie A. und J. Assmann 1990). Sie unterschätzt die kulturellen Rahmenbedingungen, die solche Zeichensysteme regulieren. Im Bereich zwischen Vorderasien und Europa, wo es durch Mobilität und Handel, aber auch durch Expansionsbewegungen wenig Raum für autonome Kulturentwicklung gab, waren kulturelle Optionen in der Regel von der Erfahrung des Kulturkontakts bestimmt. Das Christentum zum Beispiel, das sich als das schlechthin ‘Neue’ darstellte und den Bruch mit allem Vorangehenden betonte, legte sich über autochthone archaische Kulturen, die es auf vielfältige Weise in sich aufnahm. Bereits in die christliche Liturgie sind antike und spätjüdische Elemente eingegangen, das Abendmahl ist von hellenistischen Mysterienkulten inspiriert (vgl. Art. 47). Obwohl sich somit oftmals als absolut andersartig darstellt, was tatsächlich bruchlos zusammengehört, verdient doch auch das kulturelle Selbstverständnis Beachtung. In der Innenperspektive spielt die bewußte Abkehr von einem Zeichenmodus zugunsten eines anderen eine besondere Rolle. Kulturelle Optionen schließen immer die Möglichkeit der Verwerfung von Alternativen, die bewußte Absperrung gegen bestimmte Entwicklungen ein. Diese Entscheidungen und Verwerfungen sind mit dem Begriff der Zeichenrevolution gemeint. Dabei geht es nicht nur um die Ersetzung verschiedener Zeichenmodi, sondern auch um die Markierung von bestimmten Zeichenmodi als „eigenen“ oder „fremden“. 3.1. Die jüdische Zeichenrevolution Das wohl bedeutendste Beispiel für die Erfindung einer eigenen Zeichenpraxis auf dem Wege der Durchstreichung einer fremden bietet die Geschichte Israels. Das Bilderverbot, das im ersten Gebot der hebräischen Bibel ausgesprochen wird, errichtet eine kulturelle Barriere gegen die Zeichenpraxis der kanaanäischen Umwelt. Es gibt viele rationalisierende Erklärungen dieses Tabus; entscheidend ist jedoch, daß der Umgang mit Kultbildern unmittelbar mit dem Polytheismus verknüpft ist, weshalb Idolatrie als schwerster Frevel gegen die Grundstruktur der Religion, den Monotheismus, gewertet wird. Bildhaftigkeit und Sichtbarkeit werden als falsche Wahrnehmungsformen Gottes denunziert, was jedoch nicht heißt, daß Gott ohne Zeichen auskommt. Die Gestaltlosigkeit und Unsichtbarkeit Gottes wird im Judentum
718 zum Fundament der Buchreligion. Die Augen werden von der Welt auf Text und Geschichte umgelenkt, die nunmehr als Quelle der Offenbarung gelten. Darüberhinaus bedarf der Bund zwischen Gott und Mensch der Versicherung durch einen Zeichenkode, der menschliche Körper ebenso wie Häuser oder Speisen rituell „beschriftet“ (Art. 61 § 2.3.5.). Im Judentum gelten nicht mehr nur die Heiden als signifikante Gegenkultur, sondern auch die Christen. Während der christliche Gott einerseits im Geist pneumatisiert und andererseits im Fleisch inkarniert ist, ist der jüdische Gott in der Schrift „inkarniert“. Für die esoterische Variante des Judentums, die Kabbala, sind Schöpfung und Offenbarung im Wortsinne literale Ereignisse. Nach dieser Schrift-Ontologie sind Gott und Welt ausschließlich durch die Buchstaben entstanden und in den Buchstaben vorhanden. Der Text verliert dadurch den Status einer in Zeichen kodierten Botschaft und gewinnt die Qualität einer „lebendigen Textur“ (G. Scholem; vgl. Art. 61 § 3.2.), einer dynamischen und für das menschliche Fassungsvermögen offenen Zeichenmenge, die in einem berühmten kabbalistischen Wort als „schwarzes Feuer auf weißem Feuer“ beschrieben wird. Im Judentum hat der Übergang vom Bild zur Schrift also nicht zu einer fortschreitenden Rationalisierung der kulturellen Zeichenpraxis geführt. Das Bilderverbot ist ja nicht in erster Linie (wie es vielleicht die Protestanten lesen) ein Verbot magischer Zeichenpraxis, sondern ein Verbot der Verehrung fremder Götter. Für die Kabbalisten sprach nichts dagegen, den richtigen Gott auf magische Weise zu verehren. Aber auch im rabbinischen Judentum zeigt sich, wie nach der Zerschlagung der Bildmagie der Umgang mit dem heiligen Text magisch aufgeladen wurde. So entstand neben dem Kult für die heilige Schrift auch ein Kult der heiligen Schrift, die nach rabbinischer Lehre der Entstehung des Universums vorgeordnet war. Der Umgang mit der Torah zum Beispiel ist durch viele Tabu-Vorschriften reglementiert; wenn sie aus dem kultischen Verkehr gezogen wird, muß sie rituell bestattet werden. 3.2. Die christliche Zeichenrevolution Die christliche Tradition setzte sich vom jüdischen Schrift-Kult ab, indem sie die Zeichen ihrer eigenen heiligen Schrift vergleichgültigte. Diese Vergleichgültigung der Zeichen war vom griechischen Denken vorgegeben, das strikt zwischen dem äußeren materiellen
V. Geschichtsschreibung der Semiotik
Zeichen und der inneren immateriellen Idee unterschied, wobei dem Inneren vor dem Äußeren die klare Priorität zukam. Mit Hilfe dieser Basisunterscheidung, der sich auch hellenistische Juden wie Philo befleißigten, ließ sich die jüdische Religion christlich delegitimieren und überbieten; sie wurde als materielle Außenseite (das geschriebene Gesetz) eingestuft, während die immaterielle Innenseite dem pneumatischen Logos vorbehalten war. Man konnte sich in dem Maße von den materiellen Zeichen distanzieren, wie man sich des zeichenlosen Geistes sicher war. Bekanntlich hat die griechische Trennung von Außen und Innen in der paulinischen Scheidung von Buchstabe und Geist ihre geschichtsmächtige Form erhalten (vgl. Abb. 33.1 auf Tafel IV). Je potenter und immaterieller der Geist, desto äußerlicher und materieller der Buchstabe. In dieser Tradition steht abendländisch das Zeichen, dem immer wieder das Epitheton „bloßes“ angehängt wurde. Wie kulturrelativ diese Bewertung von Außen und Innen ist, wird sofort deutlich, wenn wir sie neben eine talmudische Unterscheidung halten, die das Außen mit der schriftlichen, das Innen mit der mündlichen Torah verbindet. Schriftliche wie mündliche Torah sind Moses nach rabbinischer Lehre beide von Gott am Sinai übergeben worden. In dieser Doppelung des heiligen Textes in eine geschriebene und eine ungeschriebene Seite bekundet sich ein Denken in komplementären Hälften; Außen und Innen, fixierte Schriftlichkeit und offene Mündlichkeit, Materialität und Immaterialität werden nicht dualistisch gegeneinander ausgespielt, sondern als zwei Aspekte einer Sache aufeinander bezogen. Die Vergleichgültigung der Zeichen hatte praktische Konsequenzen für den Umgang mit dem Heiligen Text. In besonders zwei Aspekten unterscheidet sich die christliche von der jüdischen Bibel: im Variantenstatus und in der Mehrsprachigkeit. Der Inhalt des neuen Testaments, die Jesus-Überlieferung, ist in vier Varianten niedergelegt. Dadurch wird die instrumentelle Zeichenbeziehung zwischen Text und Referent markiert: die unterschiedlichen Zeichen beziehen sich auf eine Sache, den immateriellen Kern des Evangeliums, der von den Zeichen immer nur partiell repräsentiert, aber niemals in ihnen verkörpert sein kann. Ferner: indem das neue Testament in Griechisch neben das hebräische, nunmehr „alte“ genannte Testament tritt, wird die besondere Aura des Hebräi-
33. Zeichenkonzeptionen im Abendland
schen als kosmischer Ursprache zerstört. In der Mehrsprachigkeit der Bibel ist ein Nominalismus der Zeichen angelegt, der sich in der Bereitschaft zur Übersetzung fortsetzt, von der hellenistischen Septuaginta und christlichen Vulgata bis zur vorläufig letzten Einzelsprache in einem entfernten Winkel der Welt. Luther nannte die vielen Muttersprachen „die Segel, mit denen das Evangelium um die Welt fährt“ (Assmann 1996). Dieses Expansionsprojekt, das mit dem Missionsauftrag verbunden ist, beruht auf einer relativistischen Zeichentheorie, die ihr Komplement in der zentrierenden Kraft des immateriellen Geistes hat. Für dieses Verhältnis von spiritueller Einheit und Vielfalt der Zeichen gibt es eine anschauliche Bildformel in der mittelalterlichen Buchmalerei (vgl. Abb. 33.2 auf Tafel IV). In den vier Eckfeldern quadratisch angelegter Kosmos-Darstellungen erscheinen die vier Evangelisten ⫺ gewissermaßen als Emanationen des im Zentrum thronenden Logos, der als Majestas-Typus in der Gestalt des Kosmokrator dargestellt ist. Die vier aus dem Zentrum des Paradiesquells entsprungenen Paradiesflüsse sowie die in die vier Weltgegenden blasenden Winde unterstreichen die zentrifugale, kosmisch expansive Dynamik des Christentums (vgl. Art. 55 § 1.4.). Die These, daß Zeichenrevolutionen kulturelle Optionen zugrunde liegen, ist nicht so zu verstehen, daß hier ein für allemal geltende Entscheidungen festgelegt worden wären. Vielmehr wird in einer Umbruchsituation ein neues Verhältnis zu den Zeichen entdeckt, das von nun an der Kultur als prägendes Element angehört. Es gehört ihr auch dann noch an, wenn es wieder dialektisch vom Gegenprinzip verdrängt worden ist, denn aus der Latenz kann es wieder abgerufen werden. Im Raum der Kulturentwicklung, wo es weder ein-für-allemalige Entscheidungen noch absolut einheitlich verbindliche Optionen gibt, bleibt das Spannungspotential zwischen gegensätzlichen Optionen produktiv. Darum ist die Rede vom „westlichen Kulturtyp“ oder der „okzidentalen Option für Arbitrarität“ eine unzulässige Vereinfachung (vgl. aber Art. 32 § 4.). Der Weg westlicher Kulturentwicklung, der auf weite Strecken der Vergleichgültigung und Instrumentalisierung des Zeichens verpflichtet ist, wurde immer wieder von der Faszination nicht-arbiträrer Zeichenmodelle gekreuzt, die die offizielle Zeichenlogik auf den Kopf stellen. Die Suspendierung der Ar-
719 bitrarität ist besonders in der Renaissance wirksam geworden, wo kabbalistisch-hermetischer Einfluß gerade außerhalb der offiziellen Institutionen eine breite Aufnahme fand. Die Laut- und Schriftzeichen der hebräischen wie zunehmend auch der Muttersprache wurden als wirkmächtige Energien betrachtet. Die Opposition zwischen Buchstabe und Geist mit dem zwischen beiden Gliedern eingebauten Gefälle wurde zwischenzeitlich immer wieder aufgegeben. „Jeder Buchstabe ist ein Geist“, schrieb Jakob Boehme (Coudert 1987: 89, A. Assmann 1994). 3.3. Die Zeichenrevolutionen der Neuzeit Eine Fülle von Einzeldaten zusammenfassend, lassen sich in den verschiedenen Zeichenrevolutionen der Neuzeit drei deutliche Tendenzen ausmachen: 1. Die Entwicklung zu immer größerer Arbitrarität der Zeichen; dabei geht die Rolle der Ähnlichkeit als eines verknüpfenden Bandes zwischen Signifikant und Signifikat immer mehr zurück. 2. Die Entwicklung zur Vergleichgültigung der Materialität des Zeichens; das bedeutet, daß die Gegenständlichkeit, Ortsgebundenheit oder immanente Ästhetik des Zeichenträgers zugunsten des Ideals einer klar dekodierbaren Nachrichtenübermittlung immer weniger „mitspricht“. 3. Die Ausdifferenzierung von Zeichensystemen in voneinander nunmehr unabhängigen kulturellen Teilbereichen. Auf die ersten beiden Punkte werden wir zum Schluß noch einmal zurückkommen; der letzte Punkt soll im folgenden in drei Bereichen illustriert werden: im Bereich der (protestantischen) Religion, wo der Kult auf das verständliche Wort ausgerichtet wird, im Bereich der Kunst, wo die Zentralperspektive als neue Konstruktionsform des Bildes eingeführt wird, und im Bereich der Wissenschaft, wo nach einem maximal transparenten Zeichensystem gesucht wird. 3.3.1. Der logozentrische Protestantismus Aufschlußreich für die Zeichenpraxis einer Kultur ist die Frage, wie sich der jeweilige heilige Text zur technischen Medien-Evolution verhält. Bekanntlich versperrt sich die Torah (worunter der Kanon im Kanon der hebräischen Bibel, die 5 Bücher Moses, zu verstehen sind) dieser Medien-Evolution; bereits der Schritt von der Buchrolle zum Kodex wurde bei diesem liturgisch zentralen Text nicht vollzogen, ebensowenig der von der Handschriftlichkeit zur Druckschriftlich-
720
V. Geschichtsschreibung der Semiotik
keit. Entsprechend widersetzt sich der Koran, an den sich eine elaborierte Kalligraphie heftet, einer fortschreitenden Entmaterialisierung der Zeichen. Die christliche Bibel mußte ihren auratischen Objektcharakter ⫺ man denke an die aufwendigen Illuminationen und Einbände mittelalterlicher Buchkunst ⫺ verlieren, bevor sie zum Objekt der Vervielfältigung und Ausbreitung im Medium des Buchdrucks werden konnte. Die christliche Bibel kann ebenso verlustlos im ASCII-Kode notiert werden. Diese Praxis wird von einer Zeichentheologie autorisiert, die nicht aus dem Nichts kommt. In gewisser Hinsicht „wiederholt“ die Zeichenrevolution der Reformation die israelische mit ihrem Ikonoklasmus und der strikten Rückführung kultischer Zeichenpraxis auf das Wort. Auch hier geht mit der pauschalen Delegitimierung der Bilder und Zeichen die Privilegierung des gesprochenen und geschriebenen Wortes einher. Die Ordnung des protestantischen Gottesdienstes wurde (in Entsprechung zum synagogalen Gottesdienst) tendenziell vom Schauen auf das Hören, vom Ritus auf das Wort, von der Magie auf die Semantik umgestellt. Da-
für sorgt eine entsprechende Kanalisierung der Aufmerksamkeit: Kanzel und Bestuhlung bilden das Szenario des protestantischen Logozentrismus (vgl. Abb. 33.3). Bei der Zentralstellung des Wortes geht es um das hörende und lesende Verstehen; ersterem wird die Übersetzung der Liturgie aus dem Lateinischen in die Muttersprache gerecht, letzterem die Ausarbeitung einer Text-Hermeneutik (vgl. Art. 72 § 1.1.). Die Vorrangstellung des heiligen Textes vor rituellen Handlungen ermächtigt die Laien. Das protestantische Projekt, das sich in der Verbund-Formel von Zeichenrationalität und immateriellem Geist, von äußerlichen Zeichen und innerlicher Illumination („sola scriptura ⫺ sola fide“) ausspricht, ersetzt die Autorität des Lehrers durch die Methodisierung der Lektüre. Zu diesem Zweck bedarf es einer Hermeneutik, die das autonome Lesen durch klare Deutungsregeln absichert. Die christliche Hermeneutik, von Tikonius entworfen und von Augustin weiterentwikkelt, diente in ihrer vorreformatorischen Phase dem Übergang vom Sinnlichen zum Übersinnlichen; das System des vierfachen
Abb. 33.3: Der protestantische Gottesdienst stellt vom Bild auf das Wort um. Sichtbar bleiben im nüchternen Kirchenraum allein die Sakramente und die „inneren Bilder“ der Höllenvisionen. Der Holzschnitt „Die falsche und die rechte Kirche“ (um 1546) stammt von Lucas Cranach d. J. Dresden, Staatliche Kunstsammlungen, Kupferstich-Kabinett; Inv.-Nr. A 66-28 (nach Kunst der Reformationszeit. Ausstellungskatalog, Staatliche Museen zu Berlin, Hauptstadt der DDR. Berlin 1983, F 41, 421).
33. Zeichenkonzeptionen im Abendland
Schriftsinns bildete die Brücke, auf der man schrittweise von den materiellen Zeichen zum immateriellen Logos hinüberwandeln konnte (vgl. Art. 58 § 3.). Nach der Reformation wurde eine Verstehenslehre entwickelt, die nicht mehr wie die mittelalterliche von isolierbaren Zeichen mit festen Korrespondenzen und Bedeutungen, sondern von der Selbstevidenz und Kohärenz des Textes ausging (Art. 72 § 2.2.). In einer auf Verstehen eingeschworenen Semiotik ist das gute Zeichen das bewußt gemachte und auf rationale Erfaßbarkeit ausgerichtete Zeichen, das schlechte dagegen das auf magischen Vollzug und Selbstwirksamkeit angelegte Zeichen. Diese Zeichenrevolution beschreibt eine Tendenz, nicht eine vollständige Umstellung kultureller Zeichenpraxis, zumal man in der Sphäre des Kults nicht ganz auf das Geheimnis verzichten zu können scheint. Das belegt die Diskussion um die Sakramentalzeichen, die bezeichnenderweise seit dem Mittelalter von sieben auf drei reduziert wurden (vgl. Art. 58 und Art. 72). Dieses semiotische Problem ist in den Rang einer brisanten theologischen Kontroverse aufgestiegen. Hier scheiden sich bekanntlich die protestantischen Geister; auf der einen Seite steht Luther, der auf den magischen Geheimnischarakter nicht verzichten möchte, auf der anderen Calvin und Zwingli, die auch in diesem Zeichen noch den rationalen Verweischarakter hervorheben und es als Gedächtniszeichen von magischer Verwandlung und Verkörperung gänzlich freihalten wollen. 3.3.2. Die Neuorganisation des Bildes durch die Zentralperspektive Nicht weniger einschneidend als die protestantische Wendung vom Sehen zum Hören und Lesen ist jene, die sich gleichzeitig in der Neuorganisation des Bildes vollzog. Mit der Erfindung der Zentralperspektive (vgl. Abb. 33.4 auf Tafel IV) wird eine Ordnung der Dinge nach Größenverhältnissen eingeführt, die sich nach der Distanz vom Auge des Betrachters bemessen. Dieser steht zwar außerhalb des Bildes, geht aber als fester Bestandteil in die Bildkonstruktion ein (Art. 55 § 4.5.). Die Bildwelt der Zentralperspektive ist anthropozentrisch, sie wird vom Auge des Betrachters her erschaffen. Der so zum Teil der Konstruktion gewordene Blick wird vom sequenziellen und einsammelnden Lesen auf das zentrierende Sehen umgestellt. Mit dieser fast unmerklichen Umkonditionierung des
721 Blicks läuft eine tiefgreifende Umkodierung der Zeichen parallel. Denn die Zentralperspektive setzt eine komplexe Bildsemiotik außer Kraft, die mit topologischen Valenzen (oben, unten; West, Ost) ebenso arbeitete wie mit Bedeutungsmaßstab und einem komplexen System von Ähnlichkeiten, die als feste Entsprechungen zwischen Sinnlichem und Unsinnlichem kodiert waren. Die Desemantisierung der Bildelemente und ihrer Komposition ist die Voraussetzung für die perspektivische Neuorganisation des Bildes, die die Dreidimensionalität der Objekte im Raum mittels geometrischer Projektionsregeln auf die Fläche überträgt (Art. 55 § 7.3.). Mit der Neuorganisation des Bildes geht eine Verschiebung von der sequenziell zu erfassenden Bedeutung zur immediaten Wirkung einher. Gewiß wird man nicht von einer abrupten Revolution der Darstellungsund Sehgewohnheiten sprechen dürfen, sondern muß, wie Panofsky es mit seinem Begriff des „disguised symbolism“ getan hat, von Mehrschichtigkeit, Überlappungen und KippPhänomenen ausgehen (Barasch 1991: 272 f; vgl. auch Loprieno 1988). Die hier begonnene Ausdifferenzierung in einen Lese- und einen Bild-Kode ist nicht zuletzt für die abendländische Technik-Geschichte wichtig geworden. Eine Erfindung wie die Photographie setzt die vollständige Desemantisierung des Bild-Kodes voraus. Lessing hat in seinem berühmten Laokoon-Manifest eine unterschiedliche Ästhetik für Bild und Text entworfen (Lessing 1766 ⫽ 1886 ff, vgl. Utz 1990: 42⫺46). Für die zugrunde liegenden kulturellen Optionen ebenso aufschlußreich wie die Erfindung der „Zentralperspektive als symbolischer Form“ (Panofsky) ist ihre Verwerfung. Die aus der Ikonographie des byzantinischen Herrscherbildes entwickelte Ikonenmalerei des slawischen Altertums bedient sich der „umgekehrten Perspektive“ für eine Kunst, die nicht ausdifferenziert wurde, sondern Teil liturgischer Devotion geblieben ist. Diese Kunst widersetzt sich den obengenannten Tendenzen neuzeitlich westlicher Zeichenrevolution; sie ist dem Kollektiv und nicht dem Individuum verpflichtet, sie ist theozentrisch statt anthropozentrisch begründet, und sie hält fest an der auratischen Qualität des magischen Zeichens (vgl. Art. 38 § 5.). 3.3.3. Die Sprachkritik der neuen Wissenschaften Wie im Bereich der Religion oder Kunst, so scheint auch im Bereich der Wissenschaft kulturelle Innovation vorwiegend in Zeichen-
722 kritik sowie der Ersetzung eines älteren Zeichensystems durch ein neues zu bestehen. Die Institutionen der neuen Wissenschaften, die gegen Ende des 17. Jahrhunderts gegründeten Akademien, waren von dem Interesse geleitet, die konfessionspolitischen Wirren hinter sich zu lassen und auf universalistische Wahrheiten zuzusteuern. Den mittelalterlichen Universitäten und ihrem Curriculum stellten sie ein Kontrastprogramm gegenüber. Der Kanon der Disziplinen wurde aufgebrochen, „Scholastik“ wurde zu einem Schimpfwort, ein traditionsreiches Fach wie die Rhetorik wurde delegitimiert. Die Zeichenrevolution der neuen Wissenschaften richtet sich gegen die mittelalterliche „Wortgläubigkeit“ (vgl. Art. 59 § 1.). Das Programm eines voraussetzungslosen Sehens, wie es mit der Bildkonstruktion der Perspektive verbunden ist, wird von den neuen Naturwissenschaften radikalisiert. Die menschliche Zeichenproduktion wurde daraufhin untersucht, wie sie sich zur Weltstruktur verhielt und welchen Einfluß sie auf das Denken ausübte. Die Sprachzeichen, die auf ihre Glaubwürdigkeit und Zuverlässigkeit geprüft wurden, schnitten dabei schlecht ab. Mit ihrer Erblast an impliziten Vorstellungen und Vorurteilen verzerrten sie die Wahrnehmung und korrumpierten das Denken. Sprachkritik war verkappte Traditions- und Wissenskritik. Es ist interessant, daß Bacon im Zusammenhang der naturwissenschaftlichen Zeichenkritik die fürs Abendland archetypische Zeichenkritik Israels ‘wiederholte’. Der Zentralbegriff seiner Sprachkritik lautet „idol“, worunter er das Verhaftetsein an ungeprüfte überlieferte Vorstellungen verstand. Das monotheistische Reinheits- und Exklusionsgebot schimmert durch den wissenschaftlichen Zeichenpurismus hindurch; der alte ikonoklastische Affekt steckt auch noch hinter der neuen Zeichenrevolution (vgl. Art. 35 § 3.1.). Den verworrenen Worten waren die abstrakten und numerischen Kodes vorzuziehen, die nicht mehr und nichts anderes sagen, als was sie ihrer Bestimmung nach sagen sollen. Die Revolution der neuzeitlichen gegenüber der mittelalterlichen Zeichentheorie besteht in der strikten Trennung der Logik von der Sprache. Zeichen galten für Semiotiker wie Zabarella, Locke, Leibniz und Lambert als unhintergehbar, doch mußten die Zeichen, die die Alltagskommunikation in Gang hielten, von denen kategorial geschieden werden, die zum Denken bestimmt waren. An die
V. Geschichtsschreibung der Semiotik
Stelle der vielfältigen, kontroversen und geschwätzigen Worte sollte ein absolut transparentes Zeichensystem treten, das Wahrheiten irrtumsfrei kodieren und Erkenntnisse unmißverständlich übermitteln konnte. Das Projekt neuzeitlicher Sprachkritik reicht vom Stil-Ideal des „plain style“ bis zu den abstrakten Notationssystemen universeller BegriffsSchriften (vgl. Art. 62 § 6.). Es wurden also nicht die Zeichen selbst verworfen (wie dies auf der Suche nach mystischer Unmittelbarkeit geschah), vielmehr galt das semiotische Interesse einer mentalen Zeichensprache, die das Urteilen, Erfinden und Denken derart regulieren sollte, daß falsches Denken ebenso sichtbar und eliminierbar werden würde wie falsches Rechnen. Einer solchen Zeichentheorie liegt das Postulat einer absoluten Kongruenz von Weltstruktur und Zeichenstruktur zugrunde (vgl. Art. 35 § 3.1. und 3.2.). 3.4. Die Zeichen(r)evolutionen der Moderne Die neuzeitlichen Zeichenkonzeptionen waren mit einer bestimmten Metaphysik (mathesis universalis, Gott als Vermittler zwischen Erscheinungen und Ideen) liiert. Die moderne Semiotik gibt diesen (Hinter-) Grund auf. Der andere Punkt, in dem sich die modernen Zeichenkonzeptionen von ihren Vorgängern unterscheiden, betrifft das Desinteresse an den natürlichen Sprachen. Während die logische Tradition der Zeichentheorie in Freges Begriffsschrift und der Analytischen Philosophie wieder aufgenommen wird, wendet sich ein anderer Teil der Philosophie der Sprachverfaßtheit menschlicher Erkenntnis und Welterfahrung zu. Sprache wird dabei als den Sprechern übergeordnet aufgefaßt: „indem sie selbst spricht, [kann sie] vielseitig gedeutet werden und jedem nach seinem Gesichtspunkt etwas Neues“ sagen (Herder, vgl. Art. 72 § 2.4.). Die linguistische Wende verbindet so unterschiedliche Denker wie Heidegger und Wittgenstein. Die strukturalistische Linguistik trennt sich von der etymologisierenden Semiotik mit ihrem Ähnlichkeitsprinzip und untersucht die differentielle Bedeutung innerhalb homologer Strukturen. Bedeutung entsteht in dieser Zeichentheorie jenseits der sinnstiftenden Subjekte, die lediglich an bestehenden Kodes (wie Mythen, Verwandtschaft, Tischsitten, Mode) partizipieren (Art. 74 § 20.). Damit ist auch der Schritt zur Semiotik des Alltags gemacht. Die moderne Semiotik, die mit dem Namen „Peirce“ verbunden ist (vgl. Art. 100), konzentriert sich auf die systemische Logik der
33. Zeichenkonzeptionen im Abendland
Zeichen und ihrer Beziehungen untereinander und blendet die Bezugsebene der Sachen, auf die das wissenschaftliche Interesse sich vorwiegend gerichtet hatte, aus. Nach Peirce grenzen Symbole nicht an Sachen, sondern an andere Symbole. Denken besteht für ihn in einer zukunftsoffenen Transformation von Symbolen (Art. 74 § 23.). Die moderne Semiotik trennt sich damit von der neuzeitlichen Ontologie, welche glaubte, die Zeichen an einer zeichentranszendenten Ordnung der Dinge eichen zu können. Sie geht davon aus, daß „Zeichen immer nur durch Zeichen verdeutlicht werden und niemals zur Sache kommen“ (Borsche und Stegmeier 1992: VII). Die moderne ebenso wie die postmoderne (vgl. Art. 122) Phase semiotischer Diskurse und Praktiken läßt sich eher mit dem Begriff der Evolution als dem der Revolution fassen. Das hängt damit zusammen, daß bestimmte kulturelle Basis-Optionen der Neuzeit institutionell und technologisch verfestigt wurden, wodurch sie der Eigenbewegung immanenter Systemlogik unterlagen. Zu dieser Logik gehört ebenso die fortschreitende Ausdifferenzierung kultureller Teilsysteme, die zur gegenseitigen Abschottung wissenschaftlicher Disziplinen führt, wie die fortschreitende Entdifferenzierung aller Zeichensysteme durch ihre Rückführung auf einen einzigen binären Universalkode. Schlagworte wie die vom „Ende der Buchkultur“ oder dem „Verschwinden der Schrift im Medienrauschen“ (Wetzel 1991) signalisieren weniger kulturelle Optionen als die Eigenbewegung eines von allen Wertbestimmungen und Zielrichtungen freigesetzten technischen Fortschritts.
4.
Die (Un-)Lesbarkeit der Welt
Die Epochen der abendländischen Kulturgeschichte unterscheiden sich nicht zuletzt durch die Verlagerung der Grenze zwischen semiotisch relevanten und semiotisch indifferenten Bereichen. Eine Tendenz zur Desemiotisierung, zur Weltentzauberung in Verbindung mit dem Prozeß der Zivilisation wird den abendländischen Zeichenkonzepten allgemein nachgesagt. Bei näherer Betrachtung rastert sich diese Grundtendenz in unterschiedliche, ja entgegengesetzte Bewegungen auf, wobei auch zu berücksichtigen ist, daß Zeichenhaftigkeit in jeder Epoche anders ausgelegt wird.
723 4.1. Gott als Zeichengeber Der Exodus ist der Ursprungsmythos der jüdisch monotheistischen Bewegung. Diese Selbstbeschreibung ist nicht zuletzt in semiotischer Hinsicht aufschlußreich. Nach dieser Geschichte zog das Volk Israel aus Ägypten aus und wanderte 40 Jahre durch die Wüste, wo es seine neuen Gesetze empfing. Ägypten ist der Ort eines von Göttern bewohnten Kosmos; die ägyptischen Götter manifestieren sich in den Naturerscheinungen. Der monotheistische Gott dagegen artikuliert sich durch Stimme und Schrift. Diese Stimme kann erst vernommen werden, wenn die kosmischen Stimmen zum Schweigen gebracht sind. Die Wüste ist das Symbol dieses kosmischen Schweigens. Sie ist die entsemiotisierte Welt, die die Neutralität einer leeren Schrifttafel hat, welche der Beschreibung harrt. Der Monotheismus verlegt die Qualität der Zeichenhaftigkeit von der Welt ins Buch. Gelesen und gedeutet werden soll fortan nicht mehr die Welt, sondern ausschließlich der heilige Text. Die kosmische Hermeneutik weicht der Text-Hermeneutik. Das christliche Mittelalter hat diese klare Grenze wieder verwischt. Der Topos von der Welt als Buch signalisiert die Lesbarkeit der Welt. Dieser Topos taucht im 12. Jahrhundert auf (vgl. Abb. 33.5). Hugo von St. Victor stellt das Buch der Schöpfung (die Welt) neben das Buch der Offenbarung (die Bibel) und erweitert so den für die christliche Andacht relevanten Zeichenraum; gleichzeitig dehnt er die allegorische Texthermeneutik auf die Welt aus: „Universus enim mundus iste sensibilis quasi quidam liber est scriptus digito Dei, hoc est virtute divina creatus, et singulae creaturae quasi figurae quaedam sunt […] divino arbitrio institutae ad manifestandam invisibilium dei sapientiam“ („Die gesamte sinnlich erfahrbare Welt ist gewissermaßen ein Buch, das mit dem Finger Gottes geschrieben ist, es ist durch göttliche Kraft geschaffen, und die einzelnen Geschöpfe sind gewissermaßen die Zeichen, die nach göttlichem Willen eingesetzt sind, um die Weisheit des unsichtbaren Gottes zur Schau zu stellen“; De tribus diebus, cap. III, Patr. lat. Bd. 176: 814 b; zitiert nach Illich 1991: 121). Die Homologie von Welt und Buch ist im göttlichen Schöpfungswort begründet, das allen Kreaturen, als es sie in die Existenz rief, zugleich das Siegel einer spirituellen Bedeutung eingedrückt hat (Art. 59 § 1.). Folglich sind in die sinnlich erfahrbare Welt geheime Botschaften eingeschrieben, die gelesen sein
724
Abb. 33.5: Der Mönch Hugo aus der Pariser Vorstadtabtei St. Victor (12. Jh.) hat den augustinischen Topos von der Welt als Buch symbolisch ausgestaltet. Die Miniatur aus dem Leidener Codex ms Vulcanianus 46, f. 130, die 1176 in Fulda entstanden ist, zeigt ihn mit dem Incipit seines Werks Didascalicon (nach Jeremy Taylor, The Didascalicon of Hugh of St. Victor. A Medieval Guide to the Arts. Transl. from the Latin, with an Introduction and Notes. New York 1961, Frontispiz).
wollen. Sie geben über den Heilsweg der Seele ebenso Aufschluß wie über okkulte Kräfte in Pflanzen und Steinen (vgl. Art. 57 § 2.). Die Lesbarkeit dieser Zeichen wird neben dem Büchertopos auch mit der Bild- und Spiegelmetapher umschrieben. Für Alanus ab Insulis im 12. Jahrhundert hat die gesamte Schöpfung Zeichenstatus: „omnis creatura significans“ (Alanus ab Insulis, 53 A; vgl. Art. 58 § 3.). Sie wird vorgestellt als ein Netz untereinander verknüpfter und sich gegenseitig abbildender oder beeinflussender Zeichenebenen; alles ist potentiell Zeichen eines anderen (vgl. Art. 55 § 1.1.). Diese erhebliche Erweiterung des Zeichenraumes war von Augustin vorbereitet worden, der zwar zwischen Zeichen und Sachen unterschieden, jedoch zugleich anerkannt hatte, daß grundsätzlich jedes Ding zu einem Zeichen werden könne.
V. Geschichtsschreibung der Semiotik
4.2. Der Mensch als Zeichengeber In der Renaissance steigerte sich die Zeichenhaftigkeit der Welt zu einem Pansemiotismus. Jede Sache konnte zum Zeichen von etwas anderem werden. Die zu entschlüsselnden Botschaften betrafen dabei nicht nur das heilsrelevante Wissen, sondern zunehmend auch esoterische Wege zur Selbstvervollkommnung und Selbsterlösung. Gegen solche Häresien richtete sich die protestantische „Rückkehr zum Text“ ebenso wie die Entsemiotisierung der Welt durch die neuen Wissenschaften. Das „Verstummen“ der Welt wurde zur Bedingung der Möglichkeit empirischer Naturerkenntnis. Diese vollzieht im Raum der Naturforschung eine grundsätzliche Wendung vom „Lesen“ zum „Messen“ (vgl. Art. 71 und 84). Mit der Neuzeit wird die Eigenschaft der Lesbarkeit der Welt wieder abgesprochen und auf den Raum des menschlich Gemachten eingeschränkt. Ausschließlich das vom Menschen Gemachte kann Zeichenträger sein, der Mensch wird zur zentralen zeichengebenden Instanz. Jenseits des mit menschlichen Zeichen übersäten Raumes verbleibt die stumme Natur. Ihr sind Gesetzmäßigkeiten, Zahlenverhältnisse und Gleichungen abzuringen, aber nicht mehr Gleichnisse und Bedeutungen. Die Bedeutungen, die man weiterhin der Natur abringt, muß man jetzt selbst in sie hineinlegen. Parallel zur Verwissenschaftlichung der Natur entsteht die Psychologisierung der Natur; die Landschaft wird ⫺ nunmehr menschlich kodiert ⫺ zum Stimmungsträger (vgl. Abb. 33.6 auf Tafel IV). Der Prozeß, den Max Weber „Weltentzauberung“ genannt hat, betrifft, genauer besehen, zwei unterschiedliche Formen der Desemiotisierung: zum einen den Übergang von einem beseelten Kosmos zu einer „toten“, materiellen Natur, zum anderen den Übergang von einer mitteilenden Schöpfung zu einer „stummen“ Welt. Die Semiotik des beseelten Kosmos geht auf die (ägyptische) Spätantike zurück, die als hermetisches Wissen in der Renaissance wiederentdeckt und in der Goethezeit gegen das mechanisierte Weltbild aufgeboten wurde. Die Semiotik des von Gott mit Heilszeichen überschriebenen Kosmos dagegen kennzeichnet vom Mittelalter bis zur Gegenwart die Haltung christlicher Weltfrömmigkeit. Es gibt einen Raum, der ganz unabhängig von solchen kulturgeschichtlichen Rahmenveränderungen auf Lesbarkeit angelegt ist und bleibt: der Raum sozialer Interaktion. Da dieser auf Zeichen angewiesen ist, ist hier
33. Zeichenkonzeptionen im Abendland
die Zeichen-Produktivität universal. Bereits das Recht zur Zeichensetzung ist ein soziales Privileg; während sich die Herrscher mit ihren Herrschaftszeichen von den monumentalen Bauten über den Repräsentationsprunk bis zu den Münzen in diesen Raum dominant einschreiben, werden die Entprivilegierten selbst zur Schreibfläche für die Zeichensetzungen anderer; ein Beispiel dafür ist der Judenstern im Nationalsozialismus (vgl. Abb. 33.7). Die mittelalterliche Gesellschaft kann
Abb. 33.7: Zeichensetzungen markieren unsichtbare Distinktionen: der Judenstern als Ausgrenzungsund Todeszeichen.
als eine „Gesellschaft der Kennzeichnung“ (Clastres 1976: 175) beschrieben werden, weil hier die einzelnen Menschen durch bestimmte Zeichen (Kleiderordnung, Sprache, Umgangsformen) eindeutig als Mitglieder eines der drei Stände identifiziert waren (Art. 59 § 4.). Mit der Erschütterung der mittelalterlichen Ordo-Struktur durch die Dynamisierung der gesellschaftlichen Schichten kommt es zu einer gewissen Eigenregie über die gesellschaftlichen Zeichen (vgl. Greenblatt 1984). Das bedeutet eine semiotische Verlagerung von „affirmativen“ zu „ostentativen“ Zeichen, die vielleicht einer verallgemeinerbaren kulturgeschichtlichen Tendenz entspricht (vgl. Art. 73 und 88). In der industrialisierten Massen-Gesellschaft verlieren die ostentativen Zeichen ihre
725 Bedeutung nicht; sie haben die Funktion, in einem Feld, das ständig zur Nivellierung von Merkmalen neigt, Distinktionen zu markieren. Zeichensetzungen kanalisieren Aufmerksamkeit im sozialen Wahrnehmungsraum, gleichzeitig führt die Überproduktion von Zeichen zu einem Diffuswerden dieses Raumes. Die Zeichen des modernen Alltags (Werbung, Umgangsformen, Idiome) unterliegen einer immer größeren Wandlungsbeschleunigung, deren Paradigma die Mode ist (vgl. Art. 88 § 6.1. sowie Vinken 1993). 4.3. Natur, Geist, Information Im 19. und 20. Jahrhundert wird im Abendland die Trennung von zeichenloser und zeichenhafter Welt mit dem Begriffspaar „Natur und Geist“ gekennzeichnet. Die Geist-NaturOpposition fundiert ein Zwei-Welten- bzw. Zwei-Kulturen-Modell. Die beiden Welten erfordern unterschiedliche Annäherungsformen, die als „Erklären“ und „Verstehen“ voneinander abgesetzt worden sind (vgl. Art. 31). Diese einst so fundamentale Differenz zwischen den beiden Denkformen wird aus Hegels Kritik am Leibnizschen Kalkül deutlich. Die Methode des Schließens nach Regeln und Gesetzen sei, so Hegel, „nicht viel besser als ein Befingern von Stäbchen ungleicher Länge, um sie nach ihrer Größe zu sortieren und zu verbinden“. Eine derart mechanische Logik, die keine Komponente von (Be-)Deutung enthalte, sei „geistloses Tun“ (Hegel 1812: 49, vgl. Art. 74 § 5.). Dem reinen Computieren fehle der Sinn, dessen Träger allein die Sprache als ein mit menschlichem Bedeuten investiertes Zeichensystem sei; Zeichen im vollen Sinne gebe es nur im Raum der Sprache, denn die Sprache ⫺ und das ist der entscheidende Punkt ⫺ sei der Ort des Geistes. Die aus den Naturwissenschaften verbannte Sprache schlägt also zurück; Hegel bringt sie als exklusive Domäne des Geistes und der Zeichendeutung zur Geltung. Offensichtlich geht es beim Zwei-Kulturen-Modell nicht um zeichenhafte und zeichenlose Bereiche der Erfahrung, sondern um zwei ausdifferenzierte Zeichenbegriffe: einen naturwissenschaftlichen und einen geisteswissenschaftlichen. In der Tat haben sich entlang dieser Grenze die abendländischen Wissenschaften gespalten in solche, die es im weitesten Sinne mit menschlichen Äußerungsformen zu tun haben, und solche, bei denen dies nicht der Fall ist. Als Sammelbegriff für die erste Gruppe wurde das Präfix „Geist“ gewählt. Geist galt in dieser Epoche als Quelle
726 und Inbegriff menschlicher Zeichenhaftigkeit. Auf diese Grundkraft richtete sich eine eigene Verstehenslehre, die Hermeneutik. Sie bildet das Rückgrat der Geisteswissenschaften (vgl. Art. 131). Die Trennung von Geist und Natur markiert die harte Differenz zwischen menschlich bezogener und nicht bezogener Welt. Sie treibt zwei Formen von Wissenschaft hervor, eine, in der sich der Mensch ausdrückt, und eine, aus der er sich ausschaltet. „Natur“ heißt in diesem Modell „Abwesenheit von Geist“. Die apparative Wahrnehmung verschiebt die sinnliche; mechanistische, kausale und materialistische Erklärungsmodelle eliminieren den menschlichen Geist als Störfaktor und machen die Verstehensabstinenz zum wichtigsten Kriterium für „Objektivität“. Der harte Dualismus von Geistes- und Naturwissenschaften wurde in den 20er und 30er Jahren dieses Jahrhunderts von den Neukantianern überwunden, die Kant um eine semiotische Dimension ergänzten. Zu ihnen gehört der Philosoph Ernst Cassirer, der den Symbolbegriff als missing link zwischen die beiden einander entfremdeten Kulturen setzte. Das Symbol ist für ihn unhintergehbares Organ der Welterfahrung. Bereits für Helmholtz stand der Primat der Zeichen fest; unter Wahrnehmung verstand er einen Vorgang, bei dem der psychische Apparat Umweltreize in dekodierbare Informationen übersetzt (vgl. Art. 74 und 77). Von hier aus ist es nur noch ein Schritt zum Zeichenkonzept der Informationstheorie, die das Zeichen in größtmöglicher Abstraktion als „kodierte Information“ definiert. Diese Zeichen-Definition gilt für alles Bestehende vom Zellgewebe bis zur Gesteinsformation und von Schillers Werken bis zur Computer-Datei. Die Opposition von Natur und Geist ist im Namen eines Dritten überwunden, welches „Information“ heißt. Was Information ist und was nicht, das entscheiden nicht mehr die Menschen, sondern die Dekodierungsmaschinen. Die Technik ist zur Instanz geworden, die heute über die (Un-) Lesbarkeit der Welt entscheidet. Die einst so unüberwindliche Differenz von Natur und Geist wird obsolet in einer Welt, die die Materie entmaterialisiert, indem sie darunter nur noch eine Informationsstruktur versteht. Auch der Geist verflüchtigt sich, wo der Mensch nur noch ein Spezialfall informationsverarbeitender Systeme ist. Erkennen und Errechnen sind in dieser Welt tatsächlich deckungsgleich geworden.
V. Geschichtsschreibung der Semiotik
Der Zeichenbegriff, soviel läßt sich aus diesen knappen Andeutungen einer Geschichte der Zeichenkonzeptionen erkennen, erhält seine Bestimmung jeweils von der zeichengebenden bzw. -deutenden Instanz, die im Mittelpunkt der Kulturbewegungen steht. Der Zeichenbegriff einer technozentrischen Semiotik unterscheidet sich von dem einer theozentrischen oder anthropozentrischen Semiotik. In der technozentrischen Semiotik heißt es nicht mehr: „Im Anfang war der Logos“, sondern: „Im Anfang war die Information“. 4.4. Hermeneutik und Semiotik Die Semiotik bildet eine Disziplin, auf deren Grundlage entschieden werden kann, was überhaupt ein Zeichen ist und auf welche Weise es eines ist. Sie hat eine Theorie ausgearbeitet, die die Frage beantwortet, wo Zeichen zu suchen sind und wo nicht, und wie sie im einzelnen zu lesen sind (vgl. Art. 1). Bereits ein oberflächlicher Blick auf das Inhaltsverzeichnis dieses Handbuchs zeigt, daß die Semiotik in der belebten Welt keine zeichenlosen Bereiche kennt. Religion, Psychologie, Technik, Kunst, Alltagsleben, Musik, Mathematik, Naturwissenschaften ⫺ all dieser Bereiche nimmt sie sich an. Für die Semiotik gilt die Welt als durchschaubar, insofern sie Zeichenprozesse ermöglicht. In dieser Hinsicht ist die Semiotik die Rivalin der Hermeneutik. Hermeneutik und Semiotik sind Schwestern, die sich beide dem Umgang mit Zeichen widmen, dabei aber sehr unterschiedliche Zeichenbegriffe zugrunde legen. Dem weiten Begriff des Zeichenprozesses in der Semiotik steht ein eng umschriebener Zeichenbegriff der Hermeneutik gegenüber. Für letztere ist nicht alles lesbar, was Zeichenprozesse ermöglicht, sondern nur, was textförmig ist und als Äußerung eines (wie auch immer zu definierenden) Geistes aufzufassen ist (vgl. Art. 131). Zu den Grundsätzen der (von Denkern wie Schleiermacher, Dilthey, Gadamer entwickelten) Hermeneutik gehört ⫺ die Ausrichtung auf intentionale Äußerungen sinnstiftender Subjekte; ⫺ die Voraussetzung der Empathie zwischen dem Subjekt der Äußerung und dem Subjekt des Verstehens; ⫺ die Affirmation von „Geist“ als regulativem Prinzip aller Kommunikation. Neben dieser „direkten“ Hermeneutik entstand auch eine „indirekte“ Hermeneutik, die sich auf nichtintentionale Äußerungsformen
33. Zeichenkonzeptionen im Abendland
spezialisierte. Nach dem Modell der Physiognomik, die innere Zustände an äußeren Manifestationen abliest, werden die Zeichen der Verstellung (Geitner 1992) wie die des Unbewußten einer systematischen Lektüre unterworfen. Im Rahmen einer indirekten Hermeneutik entzifferte Marx die Zeichen der Warenwelt (vgl. Art. 74 § 19.), Freud die Zeichen der Träume (vgl. Art. 130) und Benjamin die Zeichen von Paris als „Großstadt des 19. Jahrhunderts“ (vgl. Art. 122). Die direkte und die indirekte Hermeneutik stimmen darin überein, daß sie eine zeichengebende Instanz voraussetzen, deren Äußerungsformen zu verstehen bzw. zu entziffern sind. Als zeichengebende Instanz kann neben dem Subjekt auch ein (metaphysisches) ‘Mega-Subjekt’ wie die Epoche, die Geschichte, die Sprache, bzw. ein ‘Unter-Subjekt’ wie der Trieb auftreten. In dieser Prämisse unterscheidet sich die Semiotik von der Hermeneutik. Sie löst sich vom Subjekt als zeichengebender Instanz und setzt an seine Stelle den Kode (vgl. Art. 3 und 4). Der Geist (als Sammelbegriff für alles Subjekthafte) weicht dem Kode als einer in den Zeichen selber verankerten Logik. Während der Geist immer ‘hinter’ den Erscheinungen und Zeichen bleibt, wirkt der Kode ‘in’ ihnen und ‘durch’ sie. Die Differenz zwischen Hermeneutik und Semiotik beruht auf dieser Ersetzung des Geistes durch den Kode. Die Entgrenzung des Zeichenbegriffs durch die Semiotik hängt in direkter Weise mit der Durchstreichung von Subjekt und Geist zusammen. Indem sie sich von der subjektzentrierten Perspektive der Hermeneutik löste, die den Menschen als Zeichengeber oder als Zeichenempfänger voraussetzte, konnte die Semiotik ihren Gegenstandsbereich in neue Bereiche, allen voran die Alltagskultur, ausdehnen und auch die bis dahin unvermeidlich scheinende Eurozentrik in der Analyse von Zeichen überwinden.
5.
Zusammenfassung: einige Kennzeichen des „abendländischen Sonderwegs“
Die Semiotik konstituiert sich als moderne Wissenschaft mit ihrem Interesse an Zeichen als solchen, die sie in einer universalistisch generalisierten Perspektive erforscht. Dem vorliegenden Artikel liegt die These zugrunde, daß die Semiotik von dieser allgemeinen Ebene immer wieder auf die Stufe der kultur-
727 spezifischen Rahmenbedingungen zurückgeführt werden muß, will sie der Gefahr entgehen, sich in abstrakten Typologien zu verlieren. Ihre Stärke liegt gerade darin, daß sie der vergleichenden Kulturbetrachtung ein analytisches Instrumentarium anbietet und so gerade auch zu einer differenzierteren Erkenntnis kultureller Besonderheiten beitragen kann. Abschließend ist deshalb die Frage nach den Kennzeichen des sogenannten „abendländischen Sonderwegs“ aus semiotischer Perspektive zu stellen. Die eingangs vorgeschlagene Unterscheidung zwischen adaptiven und expansiven Kulturen verhilft hier zu keinen eindeutigen Ergebnissen; vielmehr lassen sich in der Geschichte der abendländischen Kultur sowohl adaptive wie expansive Tendenzen ausmachen, die miteinander in ein Spannungsverhältnis treten. Adaptive Tendenzen zeigen sich (im mittelalterlichen, aber auch im neuzeitlich hermetischen Universum der Zeichen) in der Bereitschaft, die Welt als lesbar einzustufen und auf sie mittels Deutungen zu reagieren; expansive Tendenzen zeigen sich in der Desemantisierung der Welt, die die Voraussetzung für ihre Berechenbarkeit war. Zeichen sind dabei immer im Spiel, jedoch ist ihre Stoßrichtung entgegengesetzt; im einen Falle dienen sie zur Anthropomorphisierung, d. h. zur Anpassung der Welt an den Menschen, wobei dieser als ein integraler Bestandteil der Welt aufgefaßt wird; im anderen Fall dienen die Zeichen zur Mathematisierung, d. h. zur Berechnung einer Welt, von der sich der Mensch mit Hilfe der Technik fortschreitend emanzipiert. Es gilt als allgemein anerkannt, daß der abendländische Sonderweg etwas mit der in diesem Kulturraum forcierten Entwicklung von Notationssystemen zu tun hat. Dabei ist die Lokalisierung bestimmter ZeichenErfindungen weniger entscheidend als die tatsächliche kulturelle Ausarbeitung solcher Entdeckungen; die Null ist eine Gabe aus Indien, das Alphabet stammt (für eine entgegengesetzte These vgl. Art. 32 § 7., D) aus dem Vorderen Orient. Der alphanumerische, aber auch der musikalische Kode stellen gegenüber anderen Notationssystemen einen qualitativen Sprung dar; diese Kodes erlauben eine immer komplexere Fixierung von Inhalten in weitgehender Unabhängigkeit von einer ausübenden Praxis. Von den Homerischen Epen über die hebräische und christliche Bibel bis hin zu Kants Philosophie und Bachs Musik ist die künstlerische und
728 geistige Produktion des Abendlands nicht, wie in anderen Kulturen, schriftbegleitet, sondern schriftfundiert. Die expansive Potenz des Alphabets hat man mit der Entikonisierung der Zeichen in Verbindung gebracht und in der Ablösung vom Abbildungsprinzip den Motor für eine fortschreitende Rationalisierung der Zeichen gesehen, die von den sinnlichen Wortschriften über das unsinnliche Alphabet bis zu den immateriellen bits führt. Gegen eine solche Darstellung spricht, daß ikonische und anikonische Modi der Zeichen-Repräsentation gleichursprüngliche menschliche Vermögen sind (vgl. Art. 32 § 3.). Wenn Arbitrarität des Zeichens von Anfang an belegt ist, kann diese nicht als Konzept einer höheren Entwicklungsstufe in Anspruch genommen werden. Deshalb muß das Phänomen des abendländischen Sonderwegs auf andere Weise plausibel gemacht werden. Dabei kann vielleicht die Unterscheidung zwischen einer Manifestationslogik und einer Ersetzungslogik der Zeichen weiterhelfen. Im Rahmen der Manifestationslogik gilt, daß die Sache selbst in den (ikonischen wie anikonischen) Zeichen in irgend einer Weise anwesend ist. Die Sache selbst motiviert, animiert, beseelt, bewohnt das Zeichen, das ihr Erscheinungsfenster, ihr Ort der Verkörperung und Anwesenheit ist. Mit anderen Worten: die Sache manifestiert sich im Zeichen. Eine radikale Ablösung des Signifikanten vom Referenten ist ohne Verdunklungsgefahr und Bedeutungsverlust nicht möglich. Deshalb behalten im Rahmen der Manifestationslogik die Sachen die Zeichen im Griff und lassen keine ganz freie Entwicklung der Zeichen zu. ⫺ Im Rahmen der Ersetzungslogik wird die Sache durch das Zeichen vertreten (vgl. Carnap 1928). Man geht nicht mehr mit einer durch Zeichen vermittelten Ordnung der Dinge um, sondern mit einer selbständigen Ordnung der Zeichen, die nur noch mittelbar mit der Welt der Sachen verbunden sind. Diese Mittelbarkeit schlägt sich in einer neuen semiotischen Einheit nieder: dem Signifikat. Mit der Erfindung des Signifikats endet die Manifestationslogik und beginnt die Ersetzungslogik. Erst mit der Einrichtung des Signifikats wird die Ordnung der Dinge ins System der Zeichen übersetzt. In diesem Schritt zur Übersetzung und nicht in dem Schritt zur Abstraktion liegt der Schlüssel für die evolutive Dynamik der Zeichen. Übersetzung setzt die Existenz zweier voneinander prinzipiell
V. Geschichtsschreibung der Semiotik
unabhängiger Systeme voraus. Ebenso bedeutet Ersetzung, daß zwei Systeme zuerst einmal voneinander abgekoppelt werden müssen, bevor das eine für das andere einstehen kann. Diese Bereitschaft zur Entkoppelung ist kulturgeschichtlich nicht nur eminent folgenreich, sie ist auch höchst voraussetzungsreich. Die wichtigste kulturelle Voraussetzung der Ersetzungslogik ist die Vergleichgültigung der Zeichen. Dieser Schritt ist im christlichen Abendland mit der Annahme eines extramundanen Gottes bzw. eines immateriellen Geistes (Paulus) oder einer unvermittelten Wahrheit (Platon) verbunden. Für all diese Formen eines Absoluten gilt, daß sie transzendent sind, daß sie sich grundsätzlich aus der Stofflichkeit der Welt zurückgezogen haben. Diese Transzendenz findet ihren Niederschlag in einer Theorie und Praxis des Zeichens, die den Signifikanten als „unreines“ weil materielles Außen einem Signifikat gegenüberstellt, das als reines Innen vorgestellt wird. Auf dieser Zeichenbasis beruht die expansive Kraft einer Kultur, die sich aufs Überbieten des Älteren, aufs Überspringen des Stofflichen und aufs Überwinden des Weiblichen verlegt hat (vgl. Art. 15). Mit der systematischen Trennung von Signifikant und Signifikat werden Zeichen einer systemhaften Ordnung zugänglich. Darüber hinaus kommt es durch die Distanzierung von den Dingen zu einer Vergleichgültigung der Materialität der Zeichen. Nachdem die Verweisungsrelation hinreichend klar etabliert ist, brauchen die Signifikanten in ihrer Qualität nicht mehr mitzusprechen; ja sie dürfen es gar nicht mehr, weil dies die zeichenlogische Verweisungsrelation nur stört. Die Signifikanten verlieren zugunsten der Signifikate rapide an Relevanz, womit das kulturelle Interesse an der Außenseite der Zeichen beseitigt ist und ihrer rigorosen technischen Rationalisierung kein metaphysischer Widerstand mehr entgegensteht. Die Unterscheidung von Manifestationsund Ersetzungslogik ist eine mögliche begriffliche Annäherung an jene Tendenz, die sich im Abendland als geschichtsmächtig erwiesen hat. Diese Beschreibung will nicht suggerieren, daß sich diese Tendenz mehr oder weniger von selbst durchgesetzt hätte. Sie ist immer wieder durchkreuzt und kritisiert, ja sogar vergessen worden, so daß man nicht von einer einheitlichen Entwicklung, sondern nur von Bewegungen und Gegenbewegungen sprechen kann. Diese in ihren widersprüchlichen und
33. Zeichenkonzeptionen im Abendland
zum Teil antagonistischen Gestalten zu Gesicht zu bekommen, ist das Ziel einer kulturwissenschaftlich orientierten Semiotik.
6.
Literatur (in Auswahl)
Alanus ab Insulis (1855), In Cantica Canticorum. In: J. P. Migne (ed.), Patrologia latina. Bd. 210. Paris. Assmann, Aleida und Jan (1990), „Schrift ⫺ Kognition ⫺ Evolution. Eric A. Havelock und die Technologie kultureller Kommunikation“. In: Aleida und Jan Assmann (eds.), Eric A. Havelock, Schriftlichkeit. Das griechische Alphabet als kulturelle Revolution. Weinheim: 1⫺35. Assmann, Aleida (1994), „Schriftkritik und Schriftfaszination. Über einige Paradoxien im abendländischen Medienbewußtsein“. In: Gabi Rippl und Susi Kotzinger (eds.), Arabeske. Wien: 327⫺336. Assmann, Aleida (1996), „The Curse and Blessing of Babel. Visions of Universalism Revisited“. In: Sanford Budick und Wolfgang Iser (eds.), The Translatability of Cultures. Stanford CA. Assmann, Jan (1996), „Translating Gods. Religion as a Factor of Cultural (In-)Translatability“. In: Sanford Budick und Wolfgang Iser (eds.), The Translatability of Cultures. Stanford CA. Barasch, Moshe (1991), „The Religious Symbol in the Interpretation of Art“. In: Hans G. Kippenberg und Brigitte Luchesi (eds.), Religionswissenschaft und Kulturkritik. Marburg: 265⫺280. Barasch, Moshe (1992), Icon. Studies in the History of an Idea. New York und London. Barta Fliedl, Ilsebill und Christoph Geissmar (eds.) (1992), Die Beredsamkeit des Leibes. Zur Körpersprache in der Kunst. Salzburg und Wien. Belting, Hans (1990), Bild und Kult. Eine Geschichte des Bildes vor dem Zeitalter der Kunst. München. Bonner, John Tyler (1980), The Evolution of Culture in Animals. Princeton NJ. Deutsch von I. Horn: Kultur-Evolution bei Tieren. Berlin und Hamburg 1983. Borsche, Tilman und Werner Stegmeier (eds.) (1992), Zur Philosophie des Zeichens. Berlin und New York. Burke, Kenneth (1966), Language as Symbolic Action. Essays on Life, Literature, and Method. Berkeley und Los Angeles. Carnap, Rudolf (1928), Scheinprobleme in der Philosophie. Das Fremdpsychische und der Realismusstreit. Berlin. Clastres, Pierre (1976), Staatsfeinde. Studien zur politischen Anthropologie. Frankfurt am Main. Coudert, Allison (1978), „Some Theories of a Natural Language from the Renaissance to the Seventeenth Century“. In: Magia Naturalis und die Entstehung der modernen Naturwissenschaften. Studia Leibnitiana, Sonderheft 7. Wiesbaden: 56⫺118.
729 Dodds, Eric Robertson (1963), The Greeks and the Irrational. Berkeley. Deutsch von H.-J. Dirksen: Die Griechen und das Irrationale. Darmstadt 1970. Elwert, Georg (1987), „Die gesellschaftliche Einbettung von Schriftgebrauch“. In: Dirk Becker et al. (eds.), Theorie als Passion. Niklas Luhmann zum 60. Geburtstag. Frankfurt am Main: 238⫺268. Even-Zohar, Itamar (1983), „Sinnentleerung“. Zeitschrift für Semiotik 5: 63⫺74. Goody, Jack (1977), The Domestication of the Savage Mind. Cambridge, England. Geitner, Ursula (1992), Die Sprache der Verstellung. Studien zum rhetorischen und anthropologischen Wissen im 17. und 18. Jahrhundert. Tübingen. Geertz, Clifford (1973), The Interpretation of Cultures. New York. Deutsch von B. Luchesi: Dichte Beschreibung. Frankfurt am Main 1983. Gracia´n, Baltasar (1653), Hand-Orakel und Kunst der Welt-Klugheit. Deutsch von A. Schopenhauer. Bremen 1982. Greenblatt, Stephen (1984), Renaissance Self-Fashioning. From More to Shakespeare. Chicago und London. Hegel, Georg Wilhelm Friedrich (1812), Wissenschaft der Logik, Bd. 1. In: G. W. F. Hegel, Sämtliche Werke. Ed. H. Glockner, Bd. 4. Stuttgart und Bad Cannstatt 1965. Herder, Johann Gottfried (1877⫺1913), Sämtliche Werke. Ed. B. Suphan u. a. Berlin. Neudruck Hildesheim 1967⫺68. Illich, Ivan (1991), Im Weinberg des Textes. Als das Schriftbild der Moderne entstand. Frankfurt am Main. Landsch, Marlene et al. (eds.) (1992), Kultur-Evolution: Fallstudien und Synthese. Frankfurt am Main. Lessing, Gotthold Ephraim (1766), Laokoon. In: G. E. Lessing, Sämtliche Schriften, Bd. 9. Ed. K. Lachmann. Stuttgart, 3. Auflage 1886 ff. Le´vi-Strauss, Claude (1962), La pense´e sauvage. Paris. Deutsch von H. Naumann: Das wilde Denken. Frankfurt am Main 1973. Loprieno, Antonio (1988), Topos und Mimesis. Zum Ausländer in der ägyptischen Literatur. Wiesbaden. Scholem, Gershom (1970), On the Kabbala and Its Symbols. New York. Deutsch: Zur Kabbala und ihrer Symbolik. Frankfurt am Main 1973. Utz, Peter (1990), Das Auge und das Ohr im Text. Literarische Sinneswahrnehmung in der Goethezeit. München. Vinken, Barbara (1993), Mode nach der Mode. Kleid und Geist am Ende des 20. Jahrhunderts. Frankfurt am Main. Wetzel, Michael (1992), Die Enden des Buches und der Anfang der Schrift. Weinheim.
Aleida Assmann, Konstanz (Deutschland)
730
V. Geschichtsschreibung der Semiotik
34. History and historiography of semiotics 1. On the subject matter 1.1. Natural versus human sciences 1.2. Semiotics 1.3. Reasons for an ostracism 2. Sources 2.1. Explicit general semiotics 2.2. Explicit particular semiotics 2.3. Cosmological semiotics 2.4. Implicit semiotics 2.5. Insights from semiosic experiences 3. The comparability of theories 3.1. An example: symbol ⫺ a web of ambiguities 3.2. Greece 3.3. Mediaeval pan-semiotic metaphysics 3.4. Scriptural interpretation 3.5. The Thomistic reaction 3.6. Dante 3.7. Renaissance Hermetism 4. Secondary sources 5. Conclusion 6. Selected references 6.1. Sources 6.2. Secondary literature
1.
On the subject matter
A history of semiotics should be a critical survey of all the cases in which a given author or a group of authors have explicitly or implicitly dealt with the proper object of semiotics. This definition sounds merely truistic since one knows that there is a continuing debate on the definition of the object. It would certainly be sufficient to accept the guideline proposed by the editors of this Handbook (cf. Art. 1) and to recognize as a characterization of the proper object of semiotics the notion of sign. Semiotics should therefore be identified as a theoretical approach to the notion of sign. In this sense a semiotic investigation is witnessed every time someone is theoretically concerned with the definition of signs, their structure and function, and the processes in which signs are involved. In other words it could be said that a history of semiotics is interested in all the cases in which an author critically focuses on the process of semiosis and/or the sign-systems that make semiosis possible. Every instance of such critical attention can then be defined as a (partial or global) semiotic approach. The historian is entitled to consider also the cases in which the semiotic approach is neither systematic nor explicitly presented as such but meets
certain requirements of originality, perceptivity, and suggestive force. Unfortunately, those attempting to investigate semiotic ideas can easily discover that many authors who are certainly concerned with signs (at least from the point of view of the investigator) (i) do not mention the concept of sign; (ii) challenge the very notion of sign; (iii) say that semiotics is concerned with something different from signs; (iv) maintain that signs are only a subspecies of semiotic entities and that semiotics concerns a broader field of interrelated phenomena; (v) blatantly deny the existence of a unified field of interests labelled as semiotics; (vi) are polemically assuming that their approach has nothing to do with semiotics. 1.1. Natural versus human sciences The natural sciences are in a better situation. Take for instance the case of chemistry (cf. Art. 135). The members of the scientific community have a clear idea about the nature of chemical phenomena as they are recognized and studied today. They also know where their discipline overlaps other sciences, that is, they know that there are certain boundaries to their science which remain or are increasingly becoming sub iudice, and others that are definitely accepted as unchallengeable (at least until the unpredictable advent of change of paradigm). Thus a historian of chemistry knows that he can take into account the history of alchemy insofar as (i) it represents a series of unscientific attempts which encouraged or delayed the arrival of modern chemistry, (ii) it can be revisited in order to discover that it in some way posited problems which are still unsolved or suggest possible criticism to the present state of the art. The humanities enjoy (or suffer from) a different situation, for here the state of the art as a whole is constantly in question (cf. Art. 33). The natural sciences are bodies of notions that can be studied and enlarged independently of their own history. It is possible to be a good researcher in chemistry (if probably not the best mind in the field) without knowing the story of the now obsolete phlogiston theory. It is impossible for a good student in historiography to ignore the history of historiography, just at it is impossible for a good cultural anthropologist to ignore
34. History and historiography
the way in which the first European explorers approached and described non-European cultures. The erroneous theory of phlogiston did not affect the present structure of physical bodies, while the behavior of Hernando Cortez, of Walter Raleigh or of the Jesuit missionaries affected the actual structure of non-European societies. A human science is always obliged to comprehend its own history. The development of the natural sciences is cumulative but very seldom does such a cumulation proceed by a piling up of notions: usually a science proceeds by subtraction and addition. At every step certain notions are rejected as obsolete, some are radically revised, many are added ex novo. In the natural sciences it is clear what has been rejected and what has been added, and according to the dominant paradigm it is unusual to recover a rejected scientific principle. It is improbable that modern astronomers will return to the Ptolemaic system; at most one rediscovers neglected ideas and cautiously considers the possibility of alternative approaches (for instance, Chinese acupuncture can be seriously considered as complementary to some procedures of Western medicine). In the human sciences the process is far more ambiguous. From an idealistic point of view the history of a discipline, like history as the whole process of human events, has been seen as a dialectics between revision and reformulation: human thinking challenges an old idea and produces a new one which, in a certain sense, does not destroy the previous one but re-elaborates it at a higher degree of theoretical awareness. Modern historians are less confident in a linear progress of both human thought and social history. It is readily agreed that contemporary physics is better (more explanatory) than Greek physics, but any ethical or political science can today discover that the Greek idea of polis or the Aristotelian idea of prudence are still more appropriate that many modern doctrines. The idea of eros in Plato is not necessarily obsolete if compared with the idea of eros in de Sade. The most advanced contemporary views on rhetoric are more similar to the classical views than to those of the 19th century. The human sciences have dealt with these problems in various ways. A historian of historiography can start from the very tolerant assumption that there is historiography every time an author relates what has hap-
731 pened in a given part of the world. Furthermore the historian will be interested in distinguishing between different ways of telling the past, different criteria for ascertaining the historical truth, for trusting or distrusting traditional data, or for identifying a document as being authentic. However, he will probably not deny that Xenophon and Thucydides ought to be duly considered in the first chapters of his work, and that Homer should be discussed in a chapter on the borderlines between historiography, myth and poetry (cf. Art. 147 as well as Art. 89 § 6.1.). A historian of philosophy will have a more difficult task (cf. Art. 40, 49, 62, and 74). According to present standards, Aristotle was undoubtedly a philosopher (even though it is debatable whether his Historia animalium is as philosophical or less or more philosophical than his Rhetorics). Porphyry’s Isagoge is a philosophical text but few histories of philosophy take into account his De antro Nympharum, which appears to be a piece of literary criticism ante litteram or of mythological interpretation. In spite of this common opinion, De antro Nympharum had a remarkable impact on the development of the allegorical tradition, and within this tradition many philosophical problems were debated, from Philo of Alexandria to contemporary and modern hermeneutics. What should a historian of philosophy do with an author who speaks against philosophy? Certainly the historian can decide, on the grounds of an explicit theoretical assumption, that even the assertion “philosophy is impossible” is a philosophical one. As for authors who do not define themselves as philosophers, the historian can decide that, in the light of his own preliminary definition of philosophy, they are in fact contributing to the progress of philosophical research, or that they have in some way profoundly influenced other philosophical theories. But he must also decide how indirect an influence can be tolerated in order to be recognized as a ‘philosophical’ influence. Comenius’s thought was undoubtedly influenced by the death of his wife and children during the Thirty Years’ War but no one would recognize these events as having had a philosophical influence. However, Comenius was also influenced by the Rosicrucian controversy. Is the Rosicrucian utopia a philosophical matter? Should the Fama and the Confessio (cf. Andreae 1614⫺15 ⫽ 1972⫺73) be quoted and analyzed within a history of philosophy? Alche-
732 mists call themselves “The Philosophers”, even when they are only speaking of practical procedures for distilling herbs. Is that terminological self-appointment a sufficient reason for devoting a consistent chapter to them? Most of the histories of philosophy either ignore them, or mention them only in passing. On the other hand, the same handbooks deal consistently with mystics, or with scientists who have never proclaimed themselves to be philosophers. Thus a history of philosophy usually opens with a sort of comprehensive, tolerant and frequently tentative definition of its own object, and deals with different, if not mutually incompatible ideas of philosophy. In other cases the historian assumes that the subject matter of philosophy is the ens in quantum ens, and drastically reduces the scope of his reconstruction. However, a historian of philosophy is helped by the fact that ⫺ at least from the time of Aristotle ⫺ when people argue about the definition of philosophy they use the name, and are generally agreed that philosophers do indeed exist. Moreover, people continue to follow the Greek tradition in their acceptance of the idea that philosophy is a way, albeit obscure and never definitely defined, of approaching our human experience. A more dubious case is that of a history of aesthetics (cf. Art. 50, 63, 75). Aesthetics as a discipline, or at least as the investigation of a certain field of phenomena, is a rather recent approach and the word itself was only coined during the 18th century. Naturally, since we know that America existed long before it was discovered and named, we are entitled to ask what happened beyond the Atlantic ocean before Columbus’ travels: we accept the idea of a history of the American continent before its so-called discovery. But a discipline is not a continent. In order to say that Plato speaking of the beauty of the natural world, Aristotle speaking of the rules for a good tragedy and Pseudo-Longinus speaking of the feelings aroused by poetry were all discussing aesthetic problems (without using such a denomination), the historian must provide a definition of aesthetics. We know how controversial any definition of aesthetics can be. Croce (1902) assumed that aesthetics is the philosophical speculation about creative intuition or about “the lyrical expression of human feelings”: thus his historical reconstruction of the discipline takes
V. Geschichtsschreibung der Semiotik
into serious consideration only those cases in which the object of aesthetics coincides with philosophical reflection on art, and disposes of every theory of natural beauty and practically every theory of art before Baumgarten as a sort of naive attempt to discover the very nature of aesthetic experience. On the other hand, Bosanquet (1892: ch. 1) assumes that even if “it was not before the latter half of the eighteenth century that the term ‘Aesthetics’ was adopted with the meaning now recognized [. . .] the thing existed before the name [. . .]. If, then, ‘Aesthetics’ means the Philosophy of the Beautiful, the History of Aesthetics must mean the History of the Philosophy of the Beautiful; and it must accept as its immediate subject-matter the succession of systematic theories by which philosophers have attempted to explain or connected together the facts that relate to beauty”. Notwithstanding, Bosanquet was bound to the reconstruction of explicitly philosophical views, and had a very peculiar idea of what a philosophical discourse is. Thus he devoted no more than ten pages to the period from Augustine to Dante. De Bruyne (1946) wrote three impressive volumes on the same period which showed that important ideas about artistic, natural and divine beauty, as well as about artistic procedures, can be found in the work of the Schoolmen, of the rhetoricians, of the artists reflecting on their own work. In this sense De Bruyne not only wrote a history of philosophical doctrines, but also of general aesthetic sensibility and of the implicit theoretical awareness displayed by artists concerned with the nature of their practical activity. In spite of the many difficult methodological choices that historians of aesthetics must make, there are at least two facts that can help them: even though the sense of many terms has changed during the course of history, it is certain that Western culture has constantly spoken of the experience of Beauty and of the practice of Art. Certainly the Greek, Latin, and Mediaeval cultures did not distinguish between art, crafts and technique, and frequently did not clearly distinguish between the beautiful and the merely pleasurable. However the historian is entitled to identify an aesthetic discussion every time a given author speaks in terms of beauty or of art. 1.2. Semiotics Semiotics is in an even more difficult situation because of a double embarassment: (i) modern semioticians are still questioning
34. History and historiography
the main categories of the field and (ii) there has been no common agreement in the course of so-called semiotic investigations about a reduced list of basic categories (as happened for art and beauty in aesthetics). With regard to (i), many contemporary authors (for instance, Malmberg 1977: 21) have decided to call every element representing something else “a symbol” and to retain the term “sign” to refer to “those units which, like the signs of language, have a double articulation and owe their existence to an act of signification.” Prieto (1966) has widened the field of sign analysis by documenting the existence of systems without articulation and systems which have only a single articulation. Buyssens (1943) maintains that for a semiotic theory the format of the sign is far too minute and that the problems of communication must be investigated at least on the level of larger units called “semes”, which correspond to sentences if not, as some would say today, to large textual units (see Kristeva 1969: 69 ff). Cassirer (1923⫺29) identifies general semiotics with a theory of every symbolic form. Harman (1977: 23) says that general theories of signs like that of Peirce “comprise at least three rather different subjects: a theory of the intended meaning, a theory of evidence, and a theory of pictorial depiction”. As for (ii), the sign was not a comprehensive semiotic category from the beginning of Western thought (not to speak of other civilizations; cf. Art. 89⫺99). From early Greek thought until Augustine there is a sharp division between se¯meı˜a (let us call them “natural signs”) and ono´mata (linguistic signs or words); see for instance Eco 1984: 26⫺34. Many scholars today recognize that the Sophists (cf. Untersteiner 1949⫺54) elaborated in their own terms the first approach to pragmatics, and at least from the time of Morris (1938) there has been a line of thought ranking pragmatics among the branches of semiotics: but the Sophists ⫺ who were interested in language ⫺ were not interested in se¯meı˜a as elementary linguistic units, but rather in the perlocutionary force of discourses. In the Hippocratic tradition and subsequently in Galen (cf. Galen 1821⫺33 and Edlow 1977) there are many important observations about symptoms, but no attention was given to linguistic phenomena. (Galen would undoubtedly have been surprised to learn that his te´chne¯ se¯meio¯tike˘ was connected with the study of language.)
733 As for a comparison between (i) and (ii), many contemporary authors complain about the undue extension of the notion of linguistic sign to other semiotic systems (for instance Segre 1969: 43) while others (see Eco 1984: ch. 1), maintain that the opposite happened, namely, that at the beginning there was the original concept of a natural and nonlinguistic sign which was further extended in order to explain even linguistic phenomena. If such is the state of the art, a historian of semiotics must initially spell out what he is looking for in the course of his exploration through different disciplines and mutually conflicting theories. Let us say that semiotics is a Doctrine of Signs (for historical reasons for this choice see Jakobson 1974 and Sebeok 1976). But in order to proceed in this direction one should provide a very tolerant notion of sign to take into account even those approaches where the notion of sign is either ignored or challenged. A starting point could be the assumption made by Jakobson (1974) when opening the First Congress of the International Association for Semiotic Studies. Semiotics is any type of study interested in a “relation de renvoi” (‘a relation of referral’): wherever aliquid stat pro aliquo there is a semiotic problem. This definition is not dissimilar from that of Peirce (1931⫺66: § 2.228.), according to which a sign is “something which stands to somebody for something in some respect or capacity”. The word dog stands for something else in the same way as the whole Iliad stands for a series of facts, feelings and values. At this point, no preliminary decision is necessary as to whether the something else is a state of affairs, a thing, a truth or an idea, a third-world entity, or a cultural unit resulting from the ideal segmentation of our world experience. Neither is it important to reach a preliminary decision as to what is the format of any something which stands for something else. In order to recognize a relation of referral it is irrelevant whether the referring unit is a minimal element (like a lexematic unit in verbal language) or a maximal textual body. A straight line in Euclidean geometry is as much a sign as the Sistine Chapel. A simple communicational strategy (like a courtesy gesture) is as much a sign as a complex ritual. This does not mean that semiotic theories are not interested in ascertaining when semi-
734 otic units can be split into minor constituent elements. It only means that one is entitled to recognize prima facie a semiotic phenomenon every time one witnesses a relation of referral, and a semiotic investigation every time an author is concerned with the nature of such relations (cf. Art. 1⫺4). Such a tolerant notion of sign can entitle a historian to explore the whole of human culture in order to identify all the cases in which a relation of referral has become the object of theoretical awareness, irrespective of whether such an awareness is the explicit subject matter of a theory, or should be inferred by the historian as an evident background assumption and/or as the unavoidable consequence of other discourses. 1.3. Reasons for an ostracism It seems rather evident that human cultural life (not to speak of more controversial phenomena taking place in the processing of information machines, in animal or vegetal societies, or at inter-organic levels) is mainly based upon referral relations (cf. Posner 1989). In other words it seems obvious that the ability to produce, exchange and understand signs represents a central feature of mankind (so that even when one speaks of semiosic processes in machines or animals, one can do so in so far as one compares them to a higher human semiosic behavior). At the beginning of Western philosophical speculation, when Aristotle establishes that the subject matter of his “first philosophy” is Being, the definition of such an object is a semiotic one. It is told in Metaphysics (IV 1003 a21 ff) that “there is a science which studies Being qua Being” and that “to de on le¬getai me¡n pollako˜ w”, that is, that Being is what is said in different ways. This statement can be taken as the simple symptom of a linguistic difficulty but can also be taken as the assertion that Being is a semiotic effect. In both cases, at the dawn of Western philosophical speculation, there is a semiotic question, and this question concerns the basic relationship of thought, being, and language. This should have been sufficient to show how indispensable the existence of a discipline studying every instance of such a constitutive relationship is. It cannot be said that this problem has been eluded in the course of the following two thousand years. But it is interesting to note that it was not usually approached under the heading of semiotics. Every time an
V. Geschichtsschreibung der Semiotik
author has proposed a Doctrine of Signs or even a name like semiology or semiotics (and the list of such proposals is impressively large, from Roger Bacon to Wilkins, from Locke to Peirce and Husserl), the proposal has been further repressed (in the Freudian sense of Verdrängung). The task of a history of semiotics is to rediscover the various discussions on the nature and function of semiosis, but its duty is also to show: (i) when a given theory was in some way transversally obsessed by the semiotic problem without daring to recognize it as such; (ii) when a given theory explicitly advocated semiotic endeavor and the subsequent interpretations of that theory focused only on its non-semiotic aspects (as was the case of Locke and of many interpreters of Peirce); (iii) why in both cases the semiotic awareness was repressed. A history of semiotics could then become either the story of a millenary attempt to avoid a definite commitment to the central problem of human experience or the explanation of the reasons why such a commitment is far too difficult, or even impossible.
2.
Sources
We should now decide what is meant by implicit and explicit primary semiotic sources. 2.1. Explicit general semiotics Certain authors have explicitly recognized semiosis and signs as phenomena which recur in the whole of culture (and maybe of nature) and have chosen these phenomena to be the main subject of their inquiry (or a relevant part of it). Thus they have outlined a general theory of signs or a project for it, considering such a theory as a crucial node for the human sciences. The Stoics, Augustine, Roger Bacon, Kircher, Locke, Lambert, Peirce, Saussure, Hjelmslev, and Husserl as the author of Semiotik, among others, belong to this group. 2.2. Explicit particular semiotics Certain authors have limited their study of semiosis and signs to a few cultural systems (for instance only to verbal language) and may not have realized that their results can be applied to other systems (they might even have explicitly denied that application to other systems was possible). In any case they were aware of the existence of semiotic phe-
34. History and historiography
nomena in spite of the limits of their investigations. We can rank in this category various authors and cultural currents coming from different domains. To give only a few examples: ⫺ philosophers of verbal language, from Plato, Aristotle, the Sophists, through Boethius, Abelard, and Ockham to Frege as well as Husserl as the author of Logische Untersuchungen, Wittgenstein, Carnap, and Analytic Philosophy in general; ⫺ classical, medieval and modern rhetorics; ⫺ most of the classical (Western and Eastern) and modern linguistics, as well as the medieval modistae and any advocate of a universal grammar; ⫺ patristic and scholastic theories of scriptural interpretation; ⫺ divination, oneiromancy, chiromancy, metoscopy, physiognomics, and other forms of interpretation by symptoms, including medicine; ⫺ language of visions, prophecy, glossolaly; ⫺ the whole tradition of formal logic; ⫺ the Baroque theorists of wit, Witz, esprit, aqudeza, concettismo, such as Tesauro and Garcian; ⫺ iconology and emblematology; ⫺ the theorists of the ars magna from Lullus to Leibniz, those searching for a lingua adamica, of a characteristica universalis linguarum, the inventors of cryptographies, steganographies, new general taxonomies and of the around 200 international languages coined in the last two centuries, etc.; ⫺ artes memoriae (from Rhetorica ad Herennium to the 17th century); ⫺ philosophers of science of any age who discussed analogy, metaphor, models, etc. as tools for scientific discovery; ⫺ scientific formalization of languages; ⫺ ancient zoosemiotics; ⫺ all the other anticipations of contemporary particular semiotics, such as kinesics, proxemics, musical, medical or architectural semiotics, etc.; ⫺ psychoanalysis and psychological (as well as neurological) investigation on language; ⫺ military strategy; ⫺ scientific discussions on the revealing power of visual prostheses (mirrors, telescope, microscope, radar, etc.); ⫺ Baroque optical theaters and visual machines (from Kircher to Baltrusaitis);
735 ⫺ theories of visual perception (from the Vitruvian discussions through the theories of perspective and anamorphosis until Gestalttheorie); ⫺ theories of poetry and literature; ⫺ theories of performing arts, from Aristotle, through his Renaissance commentators up to Ejzenstein, etc. This list is obviously not complete. 2.3. Cosmological semiotics There are entire philosophical, religious, and cosmological world-views that are based upon the assumption that the whole universe is a semiosic process. These theories frequently use terms such as “sign”, “symbol”, “cosmis” or “divine language”, but even when they do not do so, they imply that the universe is a divine writing (liber scriptus digito Dei) or a self-expressing system. Among these world-views let us mention at least: ⫺ Platonism as an interpretation of the physical world as an image or an imitation of the ideal world; ⫺ the Hermetic tradition, from the Corpus Hermeticum (see Nock and Festugie`re 1945⫺54) to the late alchemists, with their attempt to interpret through symbols the correspondences between micro- and macrocosm; ⫺ various forms of neoplatonism (PseudoDionysius, Scotus Erigena, Ficino and Pico); ⫺ astrological traditions, theurgy, the theory of talismans as a powerful operative link between the upper and lower worlds; ⫺ primitive magic and Renaissance magic in particular, as far as it was concerned with the whole universe as a network of signaturae (Paracelsus, Agrippa, Della Porta, Crollius and so on); ⫺ Greek, Jewish, Patristic and Mediaeval theories of universal symbolism and allegorism (as well as their Eastern congeners); ⫺ Kabbalah; ⫺ pansophic visions and projects of a theater of the world (Camillo, Bruno, Fludd); ⫺ Berkeley and many idealistic systems; ⫺ contemporary interpretations of the cosmological structure in terms of a mathematics of fractals. 2.4. Implicit semiotics It is possible to infer a series of background assumptions about signification and communication from every philosopher, even
736 when he never spoke ex professo of language and other semiotic matters. A typical example is provided by Kant. At first glance it seems difficult to extrapolate from his work a Kantian semiotics (cf. Art. 35 § 3.3.). However, the whole of the third Kritik can be viewed as a theory of interpretation, and the notion of reflecting judgement can now be re-examined in the light of the semiotic notion of abduction. Moreover, many contemporary semantic theories, especially after the experiences of Artificial Intelligence, are speculating again about the set of mental categories which at the same time govern our perceptual activity and the understanding of meaning. Independently of whether these categories are intended as a priori universals or as the effect of cultural heritage, one can say that Kant posited (in a nonsemiotic way) problems that are crucial for a semiotic enquiry (cf. Art. 74 § 2.). It is difficult to say whether similar theories presuppose an implicit semiotics as their background or suggest a possible semiotics as their consequence. In any case many of them are more important than a good deal of the explicit but repetitive semiotic theorizing. The research on implicit semiotics should start from a clear methodological assumption: frequently a past theory becomes semiotically relevant from the point of view of our present problems. Thus a historical reconstruction of semiotics should follow a twofold path: (i) from the past to the present, to discover archaeological evidence that can better explain the present situation; (ii) from the present to the past, to understand the semiotic purport of theories which, when they were elaborated, were extraneous to the development of semiotics. 2.5. Insights from semiosic experiences Every semiosic practice presupposes an ideal awareness of its semiotic laws. This is true not only for verbal language but for every kind of signification system. It is not necessary for the historian to study the nature and function of every possible system of signification, from visual language to lithurgy, from card games to etiquette. This is the task of particular semiotics. However, in many cases certain authors who provided rules and examples of specific semiosic practices displayed a strong awareness of their procedures. The Mediaeval treatises on liturgy or on the interpretation of
V. Geschichtsschreibung der Semiotik
bestiaries and herbaries, the Renaissance artists’ reflexions on perspective, many artes poeticae, the discussions on theater, cinema or other arts, are rich in theoretical remarks. We know that many pages of Leonardo, Poe, Strawinsky or Klee contain precious and perceptive theoretical insights. The historian of semiotics should not only analyze what artists have written about their art; equally perceptive insights on signification and communication can be extrapolated from their poetic, narrative, pictorial or theatrical works. It is not preposterous to say that important ideas on the way we understand signs are provided by narrative pages of Proust or Mann, that Joyce’s Finnegan’s Wake contains provocative suggestions about the nature of language, that every play by Pirandello represents an explicit reflection on pragmatic and semantic problems, that the last novels of Calvino are clear instances of meta-narrative discourse, that Borges’ stories say more about intertextuality than many theoretical treatises.
3.
The comparability of theories
One of the tasks of a history of semiotics will certainly be to show how and to what extent certain ideas, frequently believed to be very modern, have a millenary pedigree. It is fascinating to discover that certain discussions on similitude and identity, on the differences between to-be-similar-to and to-be-an-imageof, as well as on the difference between various forms of so-called iconicity (imprints, symptoms, ostension, and images) took place during the Middle Ages (cf. Art. 60 § 4.7. and Art. 61 § 3.). The same set of basic concepts, borrowed from Greek philosophy (cf. Art. 40 § 3.), nourished the work of many different authors. It is fascinating to discover that the difference between signifier and signified was absolutely clear to the Stoics, as well as the notion of linguistic articulation (cf. Art. 42 § 2.1.4.). But if the first task is to show the unity of the semiotic tradition, the second is to stress the differences, that is, to show when and in which sense the same linguistic term conveyed ideas that, once inserted in a particular theoretical framework, became very different from each other (cf. Art. 35 § 2.⫺4.). There certainly is a semiotica perennis, but mainly in the sense that certain basic problems were discussed in every historical period
34. History and historiography
(cf. Art. 35 § 1.). Such a continuous appearance of the same questions is surely proof that they were and are crucial to the understanding of human and natural experience. But there is a difference between the continuity of a question and the continuity of a solution. The permanence of a term can frequently be evidence of the continuity of the question but not of the continuity of the response. Many examples could be given. Let us follow as a mere example for some centuries the tortured story of the category of symbol. 3.1. An example: symbol ⫺ a web of ambiguities If we understand the term “symbol” in the same sense as logicians and mathematicians, then a symbol is known (i) as that which is a signifier correlated to its meaning by a law (by a precise convention) and as such is interpretable through other signifiers, or (ii) as a variable that can be bound in many ways but, once it has acquired a given value, cannot represent other values within the same context. If we take symbol in the sense of Hjelmslev (1943), then examples are the Cross, the Hammer and the Sickle, emblems and heraldic images. In this sense symbols are allegories (cf. Art. 58 § 2. and 3. as well as Art. 60 § 4.3.). There is, however, a further sense of the word, according to which symbols are signifiers that convey imprecise clouds or nebulae of meanings that are left unexploited or are unexploitable. According to Goethe “symbolism transforms the experience into an idea and the idea into an image, so that the idea expressed through the image remains infinitely active and unattainable [. . .]. Allegory transforms an experience into a concept and the concept into an image, but so that the concept remains always defined and expressible by the image” (Maximen und Reflexionen 1112 and 1113 in Goethe 1948⫺71: IX, 639; cf. Posner 1982: 171 ff). Goethe’s definition seems perfectly in tune with that advanced by idealistic philosophy, even though the idealists did not fully agree on the nature of the symbolism: for instance, the symbol was identified by Schelling with the higher form of art, while for Hegel it was the form that art assumes at its lower and more primitive stages. However, for both symbolism was either the meeting point of the finite and the infinite, or the moment in
737 which art, aiming at expressing the infinite, shows the inadequacy of its own images and alludes to something greater and higher, without being able to express it fully. In present times when we speak of symbols in poetry, in psychoanalysis, and even in the criticism of our unconscious ideological attitudes, it seems we use this term in the Romantic sense. But when we speak of symbols in logic or mathematics we use it in a totally different way. In order to understand the ambiguity of the word “symbol” it is necessary to revisit its origins. In this sense a historiographical reconstruction helps us to understand what happened in the past and also what is happening in the present. 3.2. Greece Such ambiguity has its roots in the Greek etymology (cf. Art. 39). Originally a symbol was a token, the present half of a broken table or coin or medal, that performed its social and semiotic function by recalling the absent half to which it could potentially be reconnected. This potential was indeed crucial because as the two halves could have been reconnected it was no longer necessary to yearn for reconnection. But the present half of the broken medal evoked the ghost of its absent companion and of the original wholeness, thus encouraging the formation of other senses of “symbol”. The verb symba´llein meant ‘to meet’, ‘to try an interpretation’, ‘to make a conjecture’, ‘to solve a riddle’, ‘to infer from something imprecise, because incomplete, something else that is suggested, evoked, revealed, but is not conventionelly said’. In this sense a symbol was an ominous and sudden experience that allowed vague consequences to be tentatively forecast. It was a se¯meı˜on, but a s¯emeı˜on of an impalpable quality. When in the Stoic milieu the first attempts were made to read allegorically the old poets in an effort to find evidence of natural truths hidden within the myths, or when Philo of Alexandria started the allegorical reading of the Bible, there was no clear-cut distinction between symbol and allegory. Pepin (1969) and Auerbach (1944) say that the classical world took “symbol” and “allegory” as synonymous expressions and that they also called “symbols” certain coded images produced for educational purposes. Behind such a linguistic usage there was the idea that symbols, too, were rhetorical devices endowed
738 with a precise meaning: obscurely given, but precise when found. And the same was true within the tradition of the Church Fathers and within Mediaeval culture. 3.3. Mediaeval pan-semiotic metaphysics In the patristic and medieval tradition there is an idea of symbolism as a way of speaking of something unknowable: in the neo-Platonic line of thought, as represented by Pseudo-Dionysius, the divine source of all beings, the One, is defined as “the luminous dimness, a silence which teaches secretly, a flashing darkness which is neither body nor figure nor shape, which has no quantity, no quality, no weight, which is not in a place and does not see, has no sensitivity, is neither soul nor mind, has no imagination or opinion, is neither number nor order, nor greatness, is not a substance, not eternity, not time, not obscurity, not error, not light, not truth [. . .]” (Theol. myst., passim; cf. Art. 50 § 3. and Art. 55 § 2.). How can one speak of such a non-entity and non-identity if not by a language whose signs have no literal and univocal meaning but are open to contrasting interpretations? In his negative theology, Dionysius includes symbols which are non-translatable allegories. Since the neo-Platonists regard the source of the cosmic emanation as being beyond any rational knowledge and appearing to us as a mere Nothingness, we cannot help but say something which is true and false at the same time, when we speak of It (cf. Art. 61 § 1. and 2.). With its contradictoriness the neo-Platonic symbol seems to have the same ambiguity as the Romantic symbol. Nevertheless, the neoplatonism of Dionysius ⫺ and furthermore that of his commentators such as Thomas Aquinas ⫺ is not a ‘strong’ one: mediaeval neoplatonist philosophers tried to translate the pantheistic idea of emanation into one of participation. For them, it is true that the One is absolutely transcendent and infinitely far from us, that we are made of different fabric since we are the mere litter of His creative energy, but He is not contradictory in Himself. Contradictoriness belongs to our own discourses about Him and arises from our imperfect knowledge of Him. But the knowledge He has of Himself is totally unambiguous. This is a very important point because, as we shall see, the Hermetic Platonism of the Renaissance maintained that the very core of every secret knowledge is the belief in the
V. Geschichtsschreibung der Semiotik
deep contradictoriness of reality (cf. Art. 62 § 5.). Against that, for mediaeval theology both contradictoriness and ambiguity are merely semiotic, not ontological. Naturally, if we want to speak of the Unspeakable, we name it “Goodness”, “Truth”, “Beauty”, “Light”, “Jealousy” and so on, but these terms, says Dionysius, can be applied to Him only “supersubstantially”. And what is more: since the names that we attribute to God will always be inadequate, it is indispensable to choose them according to a criterion of dissimilarity (cf. Art. 52 § 2.). It is dangerous to name God “Beauty” or “Light”, because one can believe that such appelations do convey some of His real qualities, which they do not. We should rather call Him “Lion”, “Panther”, “Bear”, “Monster”, we should apply to Him the most provoking adjectives so that it be clear that the similarity we are looking for escapes us or can only be glimpsed at the cost of a disproportioned proportion (De coel. hier. 2; cf. animal symbolism in the Germanic and in the Judaic tradition, Art. 37 § 7.1. as well as Art. 55 § 4.2. and Art. 61 § 2.1., respectively). However, this symbolical way of speaking has nothing to do with the sudden illumination, with the cognitive ecstasy, with the flashing vision of which the modern theories of symbolism speak. The mediaeval metaphysical symbol is neither epiphany nor revelation of a truth concealed under the clothes of a myth. Symbolism must make rationally conceivable the inadequacy of our reason and of our language. Challenged by this difficulty, Dionysius’ commentators tried to translate his approach into rational terms: when Scotus Erigena (De divisione naturae 5,3) says that “nihil enim visibilium rerum, corporaliumque est, ut arbitror, quod non incorporale quid et intelligibile significet” (“I contend there is nothing among the visible and corporeal things which does not signify something uncorporeal and intelligible“), he is no longer speaking of a network of ungraspable similitudes, but rather of the uninterrupted sequence of causes and effects that will later be called the “Great Chain of Being”. Thomas Aquinas was to definitively transform this approach into the doctrine of analogia entis, which aimed at being a proportional calculus. Thus at the very root of mediaeval pansemiotical metaphysics, which was sometimes characterized as universal symbolism,
34. History and historiography
there is the quest for a code and the will to transform a poetic approximation into a philosophical statement (cf. Art. 50). 3.4. Scriptural interpretation Parallel to the neo-Platonic line of thought there is the hermeneutic tradition of scriptural interpreters, interested in the symbolic language by which the Holy Scriptures speak to us (cf. Art. 58 § 4., Art. 60 § 4.3. and Art. 61 § 1. and 2.). The Holy Scriptures were two in number: the Old and the New Testament. Initially the Gnostics assumed that only the New Testament was true, and Origenes wanted to keep the continuity between the two testaments, but he had to decide in which way they said the same things, since they seemed to be speaking differently. Thus he made the decision to read them in a parallel way: the Old is the signifier, the letter of which the New is the signified or the spirit. At the same time the New was the letter whose spirit concerned salvation and moral duties. Since the Holy Books were fundamentally polysemic, their symbolical nature had to be tamed, and in order to do so the symbolic mode had to be identified with the allegorical one. This is a very delicate point, because without this profound need of a code, the scriptural interpretation would look very similar to our modern interpretative drift, misprision, libidinal reading, free jouissance. The Scriptures had potentially every possible meaning, but their reading had to be governed by a code and that is why the Fathers proposed the theory of the allegorical senses. Later, according to verses attributed to Nicholas of Lyra, “littera gesta docet quid credas, allegoria/moralis quid agas, quo tendas anagogia” (“the letter teaches what you should believe, the moral allegory teaches what you should do and the anagogy teaches where you should head”). The theory of the four senses (cf. Art. 55 § 2.4., Art. 58 § 4. and Art. 60 § 4.3.) provided a sort of guarantee for the correct decoding of the Books. But the Patristic and Scholastic mind could never avoid the feeling of inexhaustible profundity of the Scriptures, frequently compared to a forest or to an ocean. Gilbert of Stanford (In Cant. 20, 225) compared the Holy Scriptures with a rapid river that flows by producing new senses which, as waves and whirls, come one after the other in such a way that no single one annuls the others; instead they accumulate
739 and increasingly enrich this immense treasury of divine wisdom; everyone, according to one’s own intellectual ability, can glean something from this inexhaustible storage of senses. Once again we confront here something which recalls the modern fascination of an open textual reading and even the post-Heideggerian (see Gadamer 1960) hermeneutic idea that a text magnetizes upon itself, so to speak, the whole of the readings it has elicited in the course of history. But the Patristic and Mediaeval problem was how to reconcile the infinity of interpretation with the univocality of the message; i. e., how to read the books by discovering in them not new things but the same everlasting truth rephrased in ever new ways: non nova sed nove. The task of the Church Fathers was to reduce the openness of the symbolic language by providing rules for a non-literal interpretation. Augustine was the first to put forth a list of interpretative procedures for ascertaining whether und when a fact told by the Scriptures had to be taken not literally but figuratively (cf. Art. 40 § 4.1. and Art. 49 § 2.1.). Augustine knew that verbal tropes such as metaphor can be easily detected because, if we take them literally, the text would look mendacious. But what was to be done with a report of events that make sense literally but could still be interpreted symbolically? Augustine says that one is entitled to smell a figurative sense every time the Scriptures say things that are literally understandable but contradict the principles of faith and morals. Jesus at one point allows himself to be honored and ointed by a courtesan, and it is impossible that our Savior encouraged such a lascivious ritual. Therefore the story stands for something else. In the same way one should smell a second sense when the Scriptures play upon inexplicable superfluities or use literally poor expressions, such as proper names or series of numbers. This eagerness to conjecture the presence of a symbolical mode when facing trivial events or blatantly useless details cannot but recall modern poetic devices such as the Joycean epiphany or Eliot’s objective correlative. We look for the symbolic mode not at the level of rhetorical figures but at the level of a more macroscopic textual strategy, when a text displays a sort of uncanny liberality, of otherwise inexplicable descriptive generosity. It should be clear from this that Augustine looked for symbols not in the case of verbal
740 machineries but in the case of trivial events. From the beginning, scriptural symbolism aimed at privileging the allegoria in factis over the allegoria in verbis. The words of the Psalmist can certainly be read as endowed with a second sense ⫺ because the Holy Scriptures frequently recur to rhetorical devices; but what must necessarily be read beyond the letter are the series of historical events told by the Scriptures. God has predisposed the sacred history as a book written by Himself, and the characters of the Old Testament were pulled to act as they did in order to announce the characters and the events of the New one. Augustine took from the classical tradition the rhetorical rules allowing him to decode the allegories in verbis, but he did not have precise rules for the allegories in factis. Thus in order to understand the meaning of the facts told by the Bible, Augustine had to understand the meaning of the things that the Bible mentions. This is the reason why the Mediaeval civilization, extrapolating from the Hellenistic Physiologus or Pliny’s Naturalis historia, elaborated its own encyclopedical repertories, bestiaries, herbaries, lapidaries, imagines mundi, in order to assign a symbolic meaning to every piece of the furniture of the real world (cf. Art. 57 and 58). In these encyclopedias the same object or creature can assume contrasting meanings, but the work of the mediaeval commentators was to provide rules for a correct textual disambiguation. Symbols were ambiguous within the paradigm, never within the syntagm. An elephant, a unicorn, a jewel, a stone, a flower can assume many meanings but when they show up in a given context there is only one possible way of decoding them correctly. Thus the rise of a scriptural hermeneutics encouraged the growth of a universal symbolism and the real world became as much ‘perfused with signs’ as the Holy Scriptures; but in both cases one should more rigorously speak of scriptural and universal allegorism. The Middle Ages could not understand the antinomy outlined by Goethe. 3.5. The Thomistic reaction This the universal allegorism did, however, implement a sort of hallucinatory experience of the world according to which mundane creatures and historical facts did not count as ‘these’ creatures and ‘these’ facts, but insofar as they were standing for something else.
V. Geschichtsschreibung der Semiotik
Such an attitude could not be accepted by the naturalism of the 13th century. Thomas Aquinas was harshly critical of profane poetry and allegorism in verbis. But since he was a poet himself, and a gifted one, he admitted that sometimes divine mysteries, insofar as they exceed our comprehension, must be revealed by rhetorical figures (Summa Th. I, 1, 9). However, concerning the Holy Text, he recommends looking first of all for its literal or historical sense. When the Bible says that the Hebrew people escaped from Egypt, it literally tells the truth. Only when one has grasped this literal sense can one catch, through it and beyond it, the spiritual senses, that is, the senses that the scriptural tradition assigned to the sacred books, namely the allegorical, the moral and the anagogical or mystic ones. Up to this point Aquinas does not seem to have been so original with respect to the previous tradition (cf. Art. 49 § 10.). But he makes two important statements: (a) The spiritual sense only holds for the facts told by the Scriptures. Only in the course of the sacred history has God acted upon mundane events so as to make them signify something else. There is no spiritual sense in profane history, nor in the individuals and facts of the natural world. There is no mystical meaning in what happened after the Redemption. Human history is a sequence of facts and not of signs (Quodl. VII, 6, 16). The universal allegorism is thus liquidated. Mundane events are restituted to their naturality. If they are meaningful, then only in the eyes of the philosopher who sees them as natural proofs of the existence of God, not as symbolic messages. With Aquinas one witnesses a sort of secularization of the post-biblical history and of the natural world. (b) If there is a spiritual sense in the Holy Scriptures, where facts mean something else, there is no spiritual sense in profane poetry. Poetry displays only its literal sense. The poetical second sense is a subspecies of the literal one, and Aquinas calls it “parabolic”. This sense (the one of tropes and allegories) “non supergreditur modum litteralem” (“does not transcend the literal mode”) (Quodl. VII, 6, 16). It is simply a variety of the literal sense. When the Scriptures represent Christ using the image of a goat one is not facing a case of allegoria in factis but of simple allegoria in verbis. In this case, “goat” is not a fact that symbolizes future events but only a
34. History and historiography
word that parabolically (literally) stands for the name “Christ” (Summa Th., I, 1, 10 ad 3). This statement seems undoubtedly too crude and radical; however, in order to understand this point, one must understand what Aquinas meant by “literal sense”. He meant the sense “quem auctor intendit”. The literal sense is not only the meaning of a sentence, but also the meaning of its utterance. Clearly for Aquinas sentence meaning and utterance meaning belong both to the literal sense, since they represent what the utterer of the sentence had in his mind. Thus the sense conveyed by tropes and allegories, insofar as it represents exactly what the author wanted to say, can be easily reduced to the literal sense. The spiritual senses of the Scriptures are not equally literal because the biblical authors were unaware of conveying through their historical report the senses that (in the mind of God) facts should assume for the future reader able to read, in the Old Testament, the forecast of the New. The authors of the scriptures wrote under divine inspiration, ignorant of what they were really saying. It does not seem that Aquinas’ proposal was very influential, however. A first disquieting instance of it is given by the theory of allegorical reading put forth by Dante in the “Epistula XIII” of his Divina Comedia. 3.6. Dante When presenting his poem to Cangrande della Scala, Dante makes immediately clear that it has to be read as a “polisemos” (‘polysemic’) message. One of the most celebrated examples of what Dante means by polysemy is given in his analysis of some verses of Psalm 113, In exitu Israel de Aegypto. Following the mediaeval theory, Dante says concerning the first verse of the Psalm: “If we look at the letter it means the exodus of the sons of Israel from Egypt at the time of Moses; if we look at the allegory, it means our redemption through Christ; if we look at the moral sense it means the conversion of the soul from the misery of sin to the state of grace; if we look at the mystical sense it means the departure of the sanctified spirit from the servitude of this corruption to the freedom of the eternal glory.“ Apparently there is nothing, in this analysis, which contradicts the main lines of the scriptural tradition. But many interpreters sensed something uncanny. Here Dante (who is usually supposed to be a faithful Thomist)
741 is taking a way of reading the Bible as an example of how to read his own mundane poem! The most obvious solution according to some interpreters, is that the letter had to be a forgery. This was indeed the case, but the forgery had been taken as authentic from the beginning, which means that it did not sound repugnant to the ears of Dante’s contemporaries. Moreover, the Convivio is certainly not a forgery and in this treatise Dante provides clues for interpreting allegorically his own poems ⫺ even though maintaining a distinction between the allegory of poets and the allegory of theologians, which the “Epistula XIII” disregards. In the Convivio Dante explains what he intentionally meant in writing his poems (the allegorical sense of his poems is still a parabolic one because it represents Dante’s intended meaning). As against that, the examples he gives in the letter make one think of blatant cases of allegoria in factis. Furthermore, we know that Dante had always read the facts told by mythology and the works of classical poets as if they were allegoriae in factis. In such terms he speaks of the poets in De vulgari eloquentia, and in the Comedy it is said that Statius is “as the one who proceeds in the night and bears a light, not for himself but for those who follow him” (Purgatory XXII, 67⫺69). This means that Statius was conceived by Dante as a seer: his poetry, and pagan poetry in general, conveyed spiritual senses of which the authors were not aware. Thus for Dante poets are continuing the work of the Holy Scriptures, and his poem is a new instance of prophetical writing. His poem is endowed with spiritual senses in the same way in which the Scriptures were, and the poet is divinely inspired. If the poet writes what love inspires in him, his text can be submitted to the same allegorical reading as the Holy Scriptures, and the poet is right in inviting his reader to guess what is hidden “sotto il velame delli versi strani” (“under the veil of the strange verses”). Thus, just at the moment when Aquinas devaluates the poetical mode, poets, escaping from his intellectual influence, start a new mystical approach to the poetic text, opening a new way of reading that, through various avatars, will survive until our times (cf. Art. 33 § 1.3.). What makes Dante remain mediaeval is the fact that he still believes that a poem has
742 no infinite or indefinite meanings; Dante seems to maintain that there are four spiritual meanings, and that they can be encoded and decoded according to encyclopedical conventions. 3.7. Renaissance Hermetism A relevant epistemological break (cf. Art. 35 § 1.) was to take place during the Renaissance. The heraldic world of bestiaries and lapidaries had not fully lost its appeal. The natural sciences were on the verge of becoming more and more mathematically oriented; Aristotle seemed not to have anything more to say, but the new philosophers begin exploring a new symbolical forest where living columns whisper, in Baudelarian terms, confused but fascinating words, coming from a Platonism revisited under the influence of the Kabbalah and of the Corpus Hermeticum. In this new philosophical milieu the very idea of symbol underwent a profound change (cf. Art. 61). In order to conceive of a symbol as something that sends one back to a mysterious reality that cannot be conceptually expressed since it is self-contradictory, one needs a ‘very strong’ neo-Platonism. The mediaeval neoPlatonism was not strong enough, because it was moderated by a strong idea of the divine transcendence. On the contrary the original neo-Platonism, at least until Proclus, and its gnostic versions, is ‘strong’ because it holds that at the top of the Great Fall of Beings there is a One who is not only unknowable and obscure but who, being independent of any determination, can contain all of them and is consequently the place of all contradictions. If we merge these three lines of influence, namely, (i) the neo-Platonic doctrine of emanation (where there is a continuity between every element of the world and the original One), (ii) the idea that this One is self-contradictory and that in it one can find coincidentia oppositorum, and (iii) the idea that the One can only be expressed by negation and approximation (so that every possible representation of It cannot help but refer back to another representation, equally obscure and contradictory), then we meet the requirements for the development of a philosophy, of an aesthetics, and of a secret science of symbols as intuitive revelations that can be neither verbalized nor conceptualized. The main features of the so-called Hermetic tradition, which spread out from the
V. Geschichtsschreibung der Semiotik
Renaissance and permeated Romantic philosophy and many contemporary theories of artistic interpretation, are: ⫺ a rejection of the metric measure, and an opposition of the quantitative to the qualitative, as well as the belief that nothing is stable and that every element of the universe acts over any other through reciprocal action; ⫺ a rejection of causalism so that the reciprocal action of the various elements of the universe does not follow the linear sequence of cause and effect but rather a sort of spiral-like logics of mutually sympathetic elements (if the universe is a network of similitudes and cosmic sympathies, there are no longer privileged causal chains); ⫺ a rejection of dualism, so that the very identity principle collapses, as well as the one of the excluded middle, and tertium datur; ⫺ a rejection of agnosticism (Hermetic thought is ‘gnostic’, in the sense that it respects the whole of traditional wisdom so that even where there is contradiction between different assumptions, each of them can bear part of the truth, truth being the whole of a field of contrasting ideas). The Hermetic tradition is based on the principle of similitude: sicut superius sic inferius (‘as above, so below’). And once one has decided to fish for similitudes, one can find them everywhere: under a certain description, everything can be seen as similar to everything else. Renaissance symbols were thus inexhaustible (like the old ones, and unlike the mediaeval allegories), full of half glimpsed meanings, self-contradictory. They were so fraught with meanings that one could never say what they definitely mean. Such a vagueness was so constitutive of their nature that, according to traditional Hermetic principles, in order to preserve their unrevealed secret they had to borrow from exotic cultures, since an exotic image or sentence, insofar as it looks unfamiliar, still keeps an aura, a mana. If a socalled symbol became univocally interpretable, it had lost its power. So the Renaissance Magus re-discovered the Ieroglyphica of Horapollus (see Boas 1950) or the Chaldaic Oracles and worshipped everything written or spelled in Hebrew. Thus a new symbolism grew up in the Hermetic atmosphere, from Pico della Mirandola
743
34. History and historiography
and Ficino to Giordano Bruno, from Reuchlin and Robert Fludd up to French Symbolism, Yeats and many contemporary theories. Speaking of the unshaped, symbols cannot have a definite meaning. At the very moment in which theology, with Thomas Aquinas, was destroying the bases of universal symbolism and allegorism, and the new science began to speak of the world in quantitative terms, a new feeling was born among poets, Platonic philosophers, religious thinkers, magicians and Kabbalists. The new symbolism meant a new quest for analogy and universal kinship that influenced the new theories or the new practices of poetry and art, as well as new theories of myth. It definitely provided a new religion for many laymen who, in a secularized world, no longer believed in the symbols of theology and needed some other form of worship (cf. Art. 62 § 5. and Art. 63).
4.
Secondary sources
This overview of the concepts of symbol and allegory aimed at being a mere example of the incompatibility of theories which at first glance make use of the same terms. At the same time this example shows at least two other things: (i) a historical reconstruction of semiotic concepts is not only an erudite contribution to archives for historians, but is one of the ways to clarify many of our present theoretical puzzles; (ii) in order to understand what happened to the concept of symbol between the Middle Ages and Renaissance one is obliged to take into account, among other things, philosophical and theoretical texts, pieces of scriptural interpretations, and reflection of poets on their own work. A historical reconstruction of semiotics must be an interdisciplinary enterprise which requires the identification of many primary sources that escape the competence of a single scholar. This means that the complete identification of the primary sources must be mediated by a comprehensive survey of secondary sources, that is, many historical works in various disciplinary fields. It ought to be stressed that many secondary sources relating to non-semiotic disciplines are more revealing than the few existing semiotic sources. One of the best introductions to the relationship between language and Being is Bren-
tano’s Von der mannigfachen Bedeutung des Seienden nach Aristoteles (1862). Semioticians will find many clues (concerning sixteen centuries of Western and Arab cultural history) in the seminal History of Magic and Experimental Science by Thorndike (1923⫺58). In order to understand at least half of the semiotic problems that haunted the Mediaeval mind, three historiographical works may prove useful: De Bruyne’s Etudes d’Esthe´tique Me´die´vale (1946), De Lubac’s Exe´ge`se Me´die´vale (1959) and Bochenski’s Formale Logik (1956, parts 1⫺3). None of these three studies deals explicitly with semiotics. To understand many fundamental semiotic aspects of Jewish Kabbalism, one should start with Scholem’s Kabbalah (1974) as well as with all the other works of this author. This list could be continued ad libitum. One could say that the same holds for the history of philosophy, of literature, of art. Naturally, no discipline is straightforwardly separated from the rest of culture and every thinker in every domain receives innumerable and imponderable influences from everywhere. A history of philosophy must take into account scientific sources, and a history of literature must take into account the fact that many Romantic novelists were influenced by Lavater. However in our case it is not only a question of documenting remote influences. The secondary sources mentioned above do not document lines of thought that in some way influenced semiotic writers. They deal with genuine semiotic problems, sometimes explicitly recognized as such, sometimes implicit, disguised, repressed, concealed. They are doing what a still non-existent historiography of semiotics did not do. Since they are doing it marginally, and in an incomplete way, they remain only ‘sources’ for the future historians of semiotics. But they can tell them many things that present-day semiotic theories have forgotten or are still searching for.
5.
Conclusion
It is probably too early to expect a complete and coherent historiographical monument in our field, since a complete history of semiotics cannot be undertaken by a single author. But the above remarks can be read as guidelines for a collective work in progress, a collection of documents, a still uneven map of a
744
V. Geschichtsschreibung der Semiotik
still largely unknown land (cf. Chapter VI⫺ XI, Art. 36⫺99 of this Handbook). We should not expect this work to be definitive, because the field will undoubtedly change under the pressure of new historical discoveries: the historical survey modifying the present status of semiotics, this latter will in turn influence the future of the former.
6.
Selected references
6.1. Sources Andreae, Johann Valentin (1614 f), Fama Fraternitatis R.C. 2nd edition 1614. ⫺ Confessio Fraternitatis. 1615. ⫺ Both works are included in: Johann Valentin Andreae (1972⫺1973): Werkausgabe in drei Bänden. Ed. and introduced by Richard von Dülmen. Stuttgart. Aristotle (1965⫺1970), Historia animalium. In three volumes. With an English translation by A. L. Peck. Vol. I 1965. Vol. II 1970. London: Heinemann, and Cambridge MA: Harvard University Press 1965⫺70. [⫽ The Loeb Classical Library] (The Historia animalium, peri¡ zv¬vn «istori¬a, is a medieval collection of zoological writings; most of them are by Aristotle but there are also some which are nowadays considered to be of other origin.) Aristotle (1967), Rhetorica. Ed. L. Cooper. New York. Aquinas, cf. Thomas Aquinas. Augustine (1841⫺1864), Opera omnia. In vols. 32⫺47 of Patrologiae cursus completus. Series I: Ecclesia latina. Ed. by J. P. Migne. Paris. Baumgarten, Alexander Gottlieb (1750⫺1758), Aesthetica. 2 vols. Frankfurt a. M. Reprint Hildesheim 1961. Boas, George (1950), The Hieroglyphics of Horapollo, Translated. New York. Bochen´ski, Joseph I. M. (1956), Formale Logik. Freiburg and Munich [⫽ Orbis Academicus. III.2.] ⫺ English translation: History of Formal Logic. Ed. and translated by Ivo Thomas. Notre Dame 1961. Bosanquet, Bernard (1892), A History of Aesthetics. 2nd edition 1904. London. Reprint New York 1966. Brentano, Franz (1862), Von der mannigfachen Bedeutung des Seienden nach Aristoteles. Freiburg. Reprint Hildesheim, New York and Darmstadt 1962. Cassirer, Ernst (1923⫺1929), Philosophie der symbolischen Formen. 3 vols. Berlin. Cornificius (1969), Rhetorica ad C. Herennium. Ed. G. Calboli. Bologna. Croce, Benedetto (1902), Estetica come scienza dell’espressione e linguistica generale. Teoria e storia. Milano.
Dante Aligheri (1956 ff), Opere di Dante (Aligheri). Ed. Vittore Branca, Francesco Maggini and Bruno Nardi. ⫺ Vol. 4 and 5: Convivio. Vol. 6: De vulgari eloquentia. Florence. Dante Aligheri (1977), The Divine Comedy. Italian and English. Translated, with commentary, by Charles S. Singleton. 6 parts in 3 vols. Princeton NJ. De Bruyne, Edgar (1946), Etudes d’Esthe´tique Me´die´vale. Brugge. De Lubac, Henri (1959), Exe´ge`se Me´die´vale. Les quatre sens de l’e´criture. 4 parts in 2 vols. Paris. [⫽ The´ologie. 59] Edlow, R. B. (1977), Galen on Language and Ambiguity. An English translation of Galen’s “De captionibus (On Fallacies)” with Introduction, Text and Commentary. Leiden. Gadamer, Hans-Georg (1960), Wahrheit und Methode. Grundzüge einer philosophischen Hermeneutik. Tübingen. Galen (1821⫺1833), Opera omnia. 20 vols. Ed. C. G. Kühn. Leipzig. Reprint Hildesheim 1964⫺ 1965. Goethe, Johann Wolfgang von (1809⫺1832), Maximen und Reflexionen. In: J. W. von Goethe, Gedenkausgabe der Werke, Briefe und Gespräche. 27 vols. Zürich and Stuttgart 1948⫺71. Hippokrates (1923⫺1931), Hippocrates. 4 vols. Ed. W. H. S. Jones and E. T. Withington, with an English translation. London. Hjelmslev, Louis (1943), Omkring sprogteoriens grundlaeggelse. Copenhagen. English by F. J. Whitfield: Prolegomena to a Theory of Language. Madison 1961. Husserl, Edmund (1890), “Zur Logik der Zeichen (Semiotik)”. Published in: Husserliana. Vol. 12. The Hague 1970: 340⫺373. Husserl, Edmund (1900⫺1901), Logische Untersuchungen. ⫺ Vol. I: Prolegomena zur reinen Logik. Halle 1900. 2nd ed. 1913. ⫺ Vol. II: Untersuchungen zur Phänomenologie und Theorie der Erkenntnis. 1. Teil. Halle 1901. 2nd ed. 1913. 2. Teil (Elemente einer phänomenologischen Aufklärung der Erkenntnis). Halle 1901. 2nd ed. Halle 1921. ⫺ Engl. translation: Logical Investigations. 2 vols. London and New York 1970. Kant, Immanuel (1790), Critik der Urtheilskraft. Berlin and Libau. 2nd edition Berlin 1793. 3rd edition Berlin 1799. ⫺ Kritik der Urteilskraft. 7th edition. Hamburg 1990. Lavater, Johann Caspar (1834⫺1838), Sämmtliche Werke. 6 vols. Augsburg and Lindau. Morris, Charles W. (1938), “Foundations of the Theory of Signs”. In: Otto Neurath (ed.), International Encyclopedia of Unified Science, vol. 1, no. 2. Chicago. Nock, Arthur D. and Andre´ J. Festugie`re (1945⫺1954), Corpus Hermeticum. 4 vols. Paris. 2nd edition 1962.
34. History and historiography Origines (1857⫺1912), Opera. In vols. 1⫺7 of Patrologiae cursus completus. Series I: Ecclesia graeca. (Includes Latin translations.) Ed. J. P. Migne. Paris. Peirce, Charles S. (1931⫺66), Collected Papers. Ed. C. Hartshorne, P. Weiss and A. W. Burks. Cambridge MA. Pliny the Elder (1938⫺1963), Natural History. 10 vols. Ed. and translated by H. Rackham et al. London and Cambridge MA. [⫽ The Loeb Classical Library] Porphyry (1887), Porphyrii Isagoge et in Aristotelis Categorias commentarium. Ed. A. Busse. Berlin. [⫽ Commentaria in Aristotelem Graeca, edita consilio et auctoritate academiae litterarum regiae Borussicae. IV 1] Porphyry. Excerpts from Porphyry’s minor works can be found in the following two books: Joannes Stobaeus (1884⫺1912), Florilegium. Ed. A. Meineke. Leipzig 1855. Josef Bidez, Vie de Porphyre. Le philosophe ne´o-platonicien. Ghent and Leipzig 1913. Reprint Hildesheim 1964. (Pseudo-)Dionysius the Areopagite. The works of Pseudo-Dionysius are edited as vol. 3 of Patrologiae cursus completus. Series I. Ecclesia graeca. (Includes Latin translations.) Ed. by Jacques P. Migne. Paris 1857⫺1912. Pseudo-Longinus (1960), Longinus on the Sublime. Ed. W.-H. Fyfe. London and Cambridge MA. [⫽ The Loeb Classical Library] Scholem, Gershom (1974), Kabbalah. Jerusalem and New York. Thomas Aquinas (1882 ff), S. Thomae Aquinatis Doctoris Angelici Opera Omnia. Iussu impensaque Leonis XIII, P. M. edita. Rome. ⫺ The Summa theologiae makes up vols. 4⫺12 of this so-called “Leonine Edition”. Thomas Aquinas (1949), Quaestiones quodlibetales. Ed. R. M. Spiazzi. 9th, revised edition 1956. Turin. Thorndike, Lynn (1923⫺1958), A History of Magic and Experimental Science. 8 vols. London and New York. Untersteiner, Mario (1949⫺1954) (ed.), Sofisti, testimonianze e frammenti. Florence.
6.2. Secondary literature (This list includes a selection of publications on the historiography of semiotics that are not explicitly mentioned in the article.) Aarsleff, Hans (1982), From Locke to Saussure. Minneapolis: University of Minnesota Press. Auerbach, Erich (1946), Mimesis. Dargestellte Wirklichkeit in der abendländischen Literatur. Bern and Munich: Francke. Balat, Michel and Janice Deledalle-Rhodes (eds.) (1992), Signs of Humanity/L’homme et ses signes. 3 vols. Berlin and New York: Mouton de Gruyter.
745 Beuchot, Mauricio (1987), Aspectos Histo´ricas de la Semiotica y la Filosofı´a de Lenguaje. Mexico: Universidad Nacional Auto´noma de Me´xico. Borbe´, Tasso (ed.) (1983), Semiotics Unfolding. Proceedings of the Second Congress of the IASS, Vienna, July 1979. 3 vols. Berlin, New York and Amsterdam: de Gruyter. Buyssens, Eric (1943), Les langages et le discours. Essai de linguistique fonctionnelle dans le cadre de la se´miologie. Brussels: Office de Publicite´. Chatman, Seymour, Umberto Eco and Jean-Marie Klinkenberg (eds.) (1979), A Semiotic Landscape/ Panorama se´miotique. The Hague and Paris: Mouton. Dascal, Marcelo (1983), “A Semiotically Relevant History of Semiotics”. In Borbe´ 1983: 61⫺65. Dutz, Klaus D. (1986), “Historiographie der Semiotik: Fragen und methodische Probleme.” In Dutz und Schmitter 1986: 11⫺37. Dutz, Klaus D. and Peter Schmitter (eds.) (1985), Historiographia Semiotica. Studien zur Rekonstruktion der Theorie und Geschichte der Semiotik. Münster: MAks. Dutz, Klaus D. and Peter Schmitter (eds.) (1986), Geschichte und Geschichtsschreibung der Semiotik: Fallstudien. Münster: MAks. Eco, Umberto (1983), “Proposals for a History of Semiotics”. In Borbe´ 1983: 75⫺90. Eco, Umberto (1984), Semiotics and the Philosophy of Language. Bloomington: Indiana University Press. Eco, Umberto and Costantino Marmo (eds.) (1983), History of Semiotics. Amsterdam: Benjamins. Formigari, Lia and Franco Lo Pipero (eds.) (1988), Prospettive di Storia della Linguistica. Roma: Editori Riuniti. Harman, Gilbert (1977), “Semiotics and the Cinema”. Quarterly Review of Film Studies 2: 15⫺24. Reprint in G. Mast and M. Cohen (eds.), Film Theory and Criticism. New York: Oxford University Press 1979: 204⫺216. Herzfeld, Michael and Lucio Melazzo (eds.) (1988), Semiotic Theory and Practice. Proceedings of the Third International Congress of the IASS, Palermo 1984. 2 vols. Berlin, New York and Amsterdam: Mouton de Gruyter. Jakobson, Roman (1974), Coup d’oeil sur le de´veloppement de la se´miologie. Bloomington: Indiana University Publications. Koerner, Konrad (ed.) (1980), Progress in Linguistic Historiography. Amsterdam: Benjamins. Kristeva, Julia (1969), Semiotike´. Recherches pour une se´manalyse. Paris: Seuil. Malmberg, Bertil (1977), Signes et symboles. Les bases du langage humain. Paris: Picard.
746
V. Geschichtsschreibung der Semiotik
Nöth, Winfried (1990), “History of Semiotics”. In: W. Nöth, Handbook of Semiotics. Bloomington and Indianapolis: Indiana University Press: 11⫺38. Parret, Herman (ed.) (1976), History of Linguistic Thought and Contemporary Linguistics. Berlin and New York: de Gruyter. Pepin, Jean (1969), Mythe et alle´gorie. Les origines greques et les contestations jude´o-chre´tiennes. Paris: E´tudes Augustiennes. 2nd edition 1976. Posner, Roland (1982), Rational Discourse and Poetic Communication. Berlin, Amsterdam and New York: Mouton. Posner, Roland (1989), “What is Culture? Toward a Semiotic Explication of Anthropological Concepts”. In: Walter A. Koch (ed.), The Nature of Culture. Bochum: Brockmeyer: 240⫺295. Posner, Roland and Martin Krampen (1983), “Semiotic Circles in Germany: From the Logic of Science to the Pragmatics of Institutions”. In Borbe´ 1983: 281⫺320. Prieto, Luis J. (1966), Messages et signaux. Paris: Presses Universitaires de France.
Rey, Alain (1988), “What Does Semiotics Come From?” In Herzfeld and Melazzo 1988: 1023⫺ 1036. Schmitter, Peter (1982), Untersuchungen zur Historiographie der Linguistik: Struktur, Methodik, theoretische Fundierung. Tübingen: Narr. Schmitter, Peter and H. Walter Schmitz (eds.) (1989), Innovationen in Zeichentheorien. Münster: Nodus. Sebeok, Thomas A. (1976), Contributions to the Doctrine of Signs. Bloomington: Indiana University Press. Segre, Cesare (1969), I segni e la critica. Torino: Einaudi. Trabant, Jürgen (1981), “Monumentalische, kritische und antiquarische Historie der Semiotik”. Zeitschrift für Semiotik 3: 41⫺48. Voigt, Vilmos (1983), “On the History of Semiotics”. In Borbe´ 1983: 405⫺408.
Umberto Eco, Bologna (Italy)
35. The beginnings of scientific semiotics 1. Introduction 1.1. A process-oriented approach 1.2. Ingredients of the scientifization process 1.3. Sciences and traditions 2. Medieval beginnings 2.1. Ancilla grammaticae 2.2. Ancilla logicae 2.3. Ancilla scientiae 3. Modern beginnings 3.1. Critical and applied semiotics 3.2. Philosophical semiotics 3.3. Discontinuation 4. Semiotics and world science 5. Selected references
1.
Introduction
1.1. A process-oriented approach To be able to call a field of studies ‘a discipline’ is important because the application of this term assigns to it a position in a system of disciplines and implies properties such as having a homogeneous domain, a specific perspective, a definite set of methods, or a consistent theory (cf. Art. 123 as well as Posner 1987). To be able to call a discipline ‘a science’ is also important because this term is ⫺ and has been ⫺ an honorific epithet. To be able to
pin down a moment in the history of the discipline where it became a science projects onto the past the characteristics which we currently consider as defining ‘science’. Such a move bestows upon that past moment (part of) the honor one feels entitled to enjoy for practising the discipline within a scientific tradition. It also implies, inadvertently or self-consciously, a choice of heroic figures, a choice of paradigm, and a sense of continuity. In this article, we want to avoid such suggestive terms as much as possible. We believe, with Formigari (1988) and Schmitter (1983), that historiographic reconstruction requires, at all times, demystification as well as deconstruction. For that purpose, we propose to replace the honorific ‘science’ and the static ‘discipline’ by process-oriented terms such as ‘scientifization’ and ‘disciplinarization’. More specifically, we adopt the following cautionary measures: 1.1.1. First, we recall the commonplace that the very notion of scientificity, with its definitory criteria, varies historically. It may well be that, at some point in its history, semiotics was a ‘science’ by the then prevalent criteria of scientificity, whereas, if viewed from an-
35. The beginnings of scientific semiotics
other vantage point, the same stage of the discipline counts as ‘non-scientific’. Moreover, one could claim that there has never been a scientific semiotics or even a discipline of this name in the past, but only certain trends or concerns which might be interpreted by today’s standards as semiotically relevant. Consequently, the question of the beginning(s) of semiotics immediately splits into four distinct questions: (a) (when) was semiotics scientific by the standards of the time?; (b) (when) was semiotics scientific by present standards?; (c) (when) was semiotics constituted as a discipline by the standards of the time?; (d) (when) was semiotics constituted as a discipline by present standards? ⫺ For simplicity, we neglect the (very real) possibility that ‘present standards’ are not uniform. If one is interested in (a), then talk of the beginning of scientific semiotics loses much of its force, since it presupposes a continuity that a change in standards of scientificity may prevent. The outcome of an inquiry into (a) may result in the acknowledgment that there have been, in the course of history, several different ‘scientific’ semiotics, some of them possibly overlapping. In that case, insisting on finding a single line of tradition connecting all of them would be bad historiography. This is also partially true if one is interested in (b), but for different reasons: at a given historical moment, semiotics may have achieved a scientific status by present standards. If, however, for some reason, this achievement was not followed by a tradition that developed the discipline up to its current state, we cannot speak of a true beginning; at most we will then be justified in viewing that historical stage as a ‘precursor’ of (our brand of) scientific semiotics. But again, we have to ask whether this search for precursors is historiographically sound, since, besides the danger of anachronism, it implies a view of the development of (semiotic) science as at least thematically homogeneous and continuous. However, what we consider development (‘Fortschritt’) is likely to imply, from another point of view, some sort of regression or deprivation (‘Verlust’), and disciplinary ⫺ no less than thematic ⫺ continuity is crucial for the constitution of a science. That is to say, the questions (a) and (b) are inseparable from the questions (c) and (d). The issues of scientificity and disciplinarity cannot be separated from each other.
747 1.1.2. Second, we contend that the concept of science, apart from its historicity, is not, in its normal use, reducible to a neat definition in terms of necessary and sufficient conditions or of well-established ‘criteria’. There have been, of course, attempts to define science (cf. Art. 123), but there is no supra-historical definition that captures the ‘essence’ of this concept. At certain points in history, science required the certainty of logical demonstration, rather than empirical validation or mathematization, whereas at other times, logical certainty was no longer a requirement and mathematization and empirical evidence loomed large; at some points, the cumulative character of scientific knowledge was emphasized, while at others its irregular growth through ‘revolutions’ or ‘refutations’ was seen as primordial. Changes in these parameters imply changes in the disciplines taken to be paradigm-cases of science. The concept ‘science’ is thus better construed as naturalkinds concepts (e. g., ‘water’, ‘gold’, ‘bird’) should be, i. e., in terms of a set of semantically and non-semantically relevant features, none of which is per se necessary and no subset of which is per se sufficient for letting something count as a science, though some are more ‘central’ than others. (Cf. Achinstein (1968, 3⫺46) for the notions of semantic and non-semantic relevance, and, in general, for this model of meaning. On the development of ‘scientificity’ from Aristotle to early modern times, see Randall (1961) and Dutz (1985, 27⫺68), where more bibliographical information is given.) If something has enough (central) features of the set, it qualifies as falling under the concept. Paradigm-cases are those which display a large number of features of the set. Both the set of features and the relative centrality of its members vary historically, though not necessarily in an abrupt way. On this view, the location of a precise beginning of scientific semiotics is quite problematic, for strictly speaking such a location would require one to be able to say that at moment t0 semiotics had n⫺1 features of scientificity, which were not enough to qualify it as scientific, while at the subsequent moment t1, a further feature was added (bringing the number of features to n), so that it did then become scientific. But that would place undue weight upon the n-th feature, which, according to the proposed model, is just one in the list.
748 1.1.3. To speak of scientifization as a process, then, is to say that a discipline has ‘become a science’ when it has advanced ‘fairly much’ ⫺ a deliberately vague notion ⫺ along the process of acquiring features accepted as central to the then prevalent concept of science. There is no single moment in the process that can be pinned down as the beginning of its scientific status, or as the decisive ‘turning point’, where the ‘crucial’ n-th feature is added. One might compare scientifization with other processes that have similar characteristics, such as urbanization, democratization, depopulation, aridification, etc. 1.2. Ingredients of the scientifization process Viewed as a process, scientifization involves several kinds of factors. Some have to do with the organization of knowledge and the establishment of a specific disciplinary matrix, while others have to do with granting this matrix the status of a ‘science’. Yet others are the social, political and economic conditions that directly or indirectly influence the scientifization process. In what follows, we will neglect the role of the latter kind of factors (not because we think they are immaterial, but due to lack of space) and focus on the two other kinds of ingredients. 1.2.1. Differentiation and identity-formation To become a discipline, a field must develop a ‘separate identity’. This requires the determination of its position vis-a`-vis other areas of knowledge and culture, involving a process of differentiation and specification of the field, paralleled by efforts to unify and homogenize what was previously dispersed among other fields. At different times, different thematic elements look more promising than others as far as their ability to grant semiotics a separate identity is concerned. For Locke and the Ide´ologues, such an element was the notion of ‘idea’ and the whole field of mental operations it evokes. For the neo-scholastic Jean Poinsot (1589⫺1644) and for Peirce, semiotics was to be a branch of the logic of relations. For Lady Welby and her Significs Movement, as well as for Saussure, it should be concerned with the communicative function of sign systems. 1.2.2. Inner structuration A disciplinary matrix also involves the ability to structure itself in terms of subfields. For example, the distinction ‘icon/index/symbol’
V. Geschichtsschreibung der Semiotik
was well-known since the Stoics and had been seriously discussed, under different cover-terms, in the late Middle Ages, but only in the 20th century did it become a principle for the structuration of semiotics into active subfields. The same is true of the distinction between animal and human sign systems. This distinction was clearly set up by Aristotle (Politica); in the seventeenth and eighteenth centuries it served as the background for the discussion of human language functions, of the language of science, and of the higher cognitive achievements of man as compared to animals; and yet only recently it was taken up as a ‘discipline-building’ feature for the subfield of zoosemiotics. The discipline must also be able to expand systematically, e. g. in what may be called ‘applications’ of its key principles and methods, without impairment of its unity. Terms such as ‘semiotics of music’, ‘of architecture’, ‘of fashion’, etc. can be easily conceptualized in this way nowadays, though it is doubtful whether this would have been possible in earlier times. 1.2.3. Institutionalization Science is a socially institutionalized activity (cf. Art. 15). Only those attempts at self-conceptualization that are successful in becoming implemented socially carry the process of scientifization far enough. But this, in and by itself, is no guarantee for success along the scientifization path, for some institutionalizations may not achieve continuity over a significant period of time. A case in point is that of the Ide´ologues, whose attempts were institutionally oriented, but whose institutionally created science of Ide´ologie was abandoned because of their founders’ political defeat. ⫺ Institutionalization involves, essentially, the establishment, within science, of a structure of ‘legitimate authority’. Such a structure varies in the course of history. Redner (1987), relying on research in the sociology of science, has provided a thorough analysis of the forms of authority governing the current state of science, which he calls ‘world science’ (as distinct, say, from ‘classical science’). Legitimate authority is a necessity for insitutionalized science to work. Abuses of authority within science, which are not uncommon, lead to ‘pathologies’. Awareness of these facts should contribute to defuse the still accepted image of science (and of the scientist) as exclusively and ‘purely’ concerned with knowledge.
749
35. The beginnings of scientific semiotics
1.2.4. Acknowledged ‘scientific’ status What was said above applies to any disciplinary matrix, be it ‘scientific’ or not. Literary studies have existed as a differentiated, structured and institutionalized discipline for a long time, but only recently has the ‘theory of literature’ claimed scientific status (for a critical discussion of the state of literary theory in this respect, see Mignolo 1988). The ‘acquisition’ of this status depends on the discipline’s conformity with accepted norms of what counts as science at the time. Such norms do not only vary historically. They may also be non-uniform at a given time. Semiotics today, for example, is drawn to the paradigm of the exact and natural sciences, which stresses formalism, mathematization, and experimentation, and to the paradigm of the Geisteswissenschaften (cf. its recent ‘invasion’ by Poetics), which emphasizes other virtues. Such different poles of attraction may hamper the homogenization and unification efforts. They require perhaps a new model, say that of a non-homogeneous science. According to Redner (1987, 64), five features characterize the rise of ‘world science’: technification, formalization, abstraction, problem-solving, and finalization. Possession of such features is a matter of degree; and, according to the cluster concept of science introduced above, none of them is necessary, and possession of a significant number of them, to a significant degree, is sufficient for becoming a member in the club of world science. Therefore, the question whether semiotics has begun to belong to this club is a question about the degree to which it possesses the above characteristics, within the ‘proper’ institutionalized framework.
of an evolutionary tradition, concerned with the origin and development of semiotic systems (Vico, Comparative Grammar, Darwin, paleo-semiotics, Lenneberg), a psycho-social tradition, concerned with the social basis and role of signs (Saussure, Significs, Wittgenstein), an ontological tradition, concerned with signs as constituents of reality (Pythagoras, Nicholas of Cusa, Galilei, Heidegger), etc. But the existence of such traditions ⫺ often recognizable only in retrospect ⫺ cannot be equated with the existence of a scientific discipline, for the reasons explained in the preceding section. Nor can the use of the term ‘sign’ and its cognates, used in describing such traditions, be construed as indicating the existence of a well-defined and constant ‘object’ investigated (under different approaches) by all ‘semioticians’, since the construction of the ‘object’ is theory- and tradition-dependent (see Dutz 1989 as well as Dascal and Borges 1991). The main point of this introductory discussion is that the process of scientifization (of semiotics) must be analyzed in terms of the convergence of the factors discussed above (and others). It cannot be appropriately studied at the level of pure conceptualization nor at that of pure institutionalization. It is the correlation between both which to our mind more accurately describes the process in question. Consequently, the best way to approach the issue of the scientifization of semiotics is by looking at the different constellations of these factors at different periods. This is what we purport to do here, confining ourselves to semiotics in the West, and selecting ⫺ for obvious reasons ⫺ a very limited number of examples.
1.3. Sciences and traditions It is possible to recognize in the history of ideas a number of recurrent themes dealing with what we consider today to be the thematic field of semiotics. It is also possible to identify a number of recurrent ways of approaching such themes (cf. Chapter XII of this Handbook). Thinkers who, at different times, adopt such approaches may be considered as belonging to a certain ‘tradition’ within semiotics, whether they are directly influenced by their predecessors in the same tradition or not. Thus, one might speak of an epistemic tradition, concerned with the role of signs in knowledge (the Stoics, the Skeptics, Locke, Leibniz, the Ide´ologues, Peirce),
2.
Medieval beginnings
“In Augustine there begins to take shape a science of the signum, as the highest genus, wherein both symptoms and words, mimetic gestures of actors as well as the sounds of a military trumpet, all become species” (Eco et al. 1989, 4). It is our contention that the process of scientifization of this incipient semiotics reaches its peak around the 14th century. Retrospectively, Augustine may be credited as its ‘founder’, but it is only through an evaluation of the whole process and of its mature achievements that its ‘scientificity’ can be assessed (cf. Art. 40 § 4.1., Art. 49 § 2.1., Art. 52 § 1. and Art. 53 § 1.1.).
750 From the 12th to the 15th centuries, in Western Europe, one can discern a thematically coherent and cumulative body of doctrine concerned with the definition, classification, and roles of signs. Though it is based on earlier sources (Aristotle, Galen, Priscian, Boethius, Augustine), it is in the period under consideration that this body of doctrine becomes codified as established knowledge, satisfying the then prevalent standards of ‘scientificity’. It is repeated in textbooks, taught in educational institutions, discussed as a research topic. Individual scholars contribute to its evolution and refinement through relatively minor changes or additions. The convergence of these factors thus makes this cluster of doctrine and research a serious candidate for the title of (perhaps the first in history) scientific semiotics. What it most conspicuously lacks, in order to fully deserve this title, is an autonomous disciplinary identity. Signs and signfunctioning are studied not for their own sake, but with respect to the theoretical needs of other disciplines, notably (but not only) grammar, logic, and an incipient epistemology (cf. Art. 52, Art. 53, Art. 56 and Art. 57). 2.1. Ancilla grammaticae As one of the foundations of medieval education and scholarship, the study of grammar had mainly a practical and normative purpose. It is true that the partes orationis were often defined not only formally but also notionally, i. e. in terms of the kinds of entities each was supposed to refer to, but little attention was paid to a precise characterization of the various forms of the signification relation (cf. Art. 46). This situation changed drastically in the late 12th century, when grammarians (e. g., Peter Helias, d. after 1166), no longer satisfied with the description of the rules and categories of Latin as laid down by Prician or Donatus, began to inquire into their ‘reasons’ or ‘causes’. A direct appeal was then made to logic and philosophy as the disciplines that should be able to grant grammar a sounder theoretical basis. This new perspective led to the development of a tradition of ‘speculative grammars’ in the 13th and 14th centuries, which produced a series of treatises on the ‘modes of signifying’ (De modis significandi), sharing a single theoretical viewpoint and a coherent conceptual apparatus (cf. Art. 53 § 4. and 5.). In this framework, the rationale for linguistic phenomena (e. g., parts of speech, syntactic
V. Geschichtsschreibung der Semiotik
structure) was sought on the semantic level, i. e., in the specific way in which each kind of linguistic expression represents reality, that is in its peculiar modus significandi. Naturally, within a tradition that emphasizes the analysis of the sign-relation, semiotic themes were important but they were strictly subordinated to the aims of grammatical theory. The term “signum” is systematically used in order to define the dictio, the basic unit of modist grammars, but is itself left undefined. Thomas of Erfurt (1300⫺ 1320), for example, says that the mind bestows on the vox a double ability, that of signifying and consignifying. The first, called “significatio”, is that which makes of the vox a signum, which is ‘formaliter’ a dictio (cf. Bursill-Hall 1971: 70). The “consignificatio”, i. e., the ability of the vox to signify in combination with other voces (what might be called ‘syntactic meaning’), makes it a consignum, which grants it the status of a part of speech (1971, 75). Though some Modistae acknowledge that signum refers to a broader class, of which dictio (a signum manifested in vox) is only one species (1971, 81), no exploration of this class is undertaken, since it is irrelevant for linguistic purposes. In this respect, the modistae did not follow their predecessor, Roger Bacon (ca. 1214⫺ 1293; cf. Art. 49 § 8.2.), one of the few medieval authors to have produced a treatise specifically devoted to signs (De signis), where an elaborate classification of all sorts of signs is offered. Some commentators (e. g., Eco et al. 1989) consider Bacon’s classification as a turning point in the history of semiotics, in that it abandons the traditional intensional point of view (which views signification as the relation between signs, especially words, and concepts) and suggests an extensional approach (where words signify res extra animam). Though this shift may have paved the way to Ockham’s nominalism (cf. Eco 1989, 64), the special importance Bacon assigned to a comprehensive study of signs of all sorts had no impact on either logicians or grammarians. At most, a quick general discussion of signs became an obligato part of every later medieval treatise. 2.2. Ancilla logicae Petrus Hispanus (Pedro Julia˜o/Pope John XXI; ca. 1220⫺1277) begins his Summulae logicales with a very brief discussion of meaningful and meaningless voces, the former being divided into naturally and conventionally
35. The beginnings of scientific semiotics
meaningful, which is reminiscent of the more elaborate earlier classifications of signs (cf. Art. 52 § 2.⫺4.). Thence he rapidly proceeds to definitions of nouns, verbs, sentences, and propositions. The rest of the book deals with the traditional logical topics both of the logica antiquorum (predicabilia, predicamenta, syllogisms, topica, fallacies) and of the logica modernorum (the so-called ‘proprietates terminorum’, such as suppositio, appelatio, distributio, etc.). ⫺ Following the Porphyrian school of commentators, the part of the Aristotelian organon influencing thought in Europe, through the mediation of Pappus Alexandrinus (ca. 320), Proklus Diadochus (412⫺485), Martianus Capella (ca. 430), (Anicus Severinus Manlius) Boethius (ca. 480⫺525) and Cassiodor (ca. 500), constituted the so-called logica vetus (comprising the Categories and the De interpretatione). Around 1150 the additional Aristotelian logical texts, among them the important Analytica, were introduced to Christian Europe by Arab commentators such as Avicenna (Abu ’Ali ibn Sina, ca. 980⫺1037), Averroes (Mohammed ibn Rushd, 1126⫺1198) and al-Farabi (Abu Nasr Mohammad ben Mohammad ben Jarkhan al-Farab, 870⫺950), being called logica nova. Together with the logica vetus, they came to be known under the name logica antiqua, a term coined to distinguish it from the logica moderna of later medieval logicians (often dubbed “terminists”; cf. Art. 49 § 5.) such as Petrus Abaelardus (1079⫺ 1142), Albertus Magnus (Albert von Bollstaedt, 1193⫺1280), Petrus Hispanus and William of Ockham (ca. 1285⫺1347/8). Essentially the same kind of treatment of signs and signification, though somewhat more elaborate, is to be found in Albert the Great (1193⫺1280), in William of Shyreswood (1200/10⫺1266/71), in William of Ockham (1285(?)⫺1347), in John Buridan (ca. 1295/1306⫺after 1358), and in other logicians of the period. It might be argued that the emphasis of these authors on the proprietates terminorum significantly enriched the study of key semiotic notions such as that of reference. Equally important is these logicians’ concern with ‘mental language’, which bears the potential of a semiotic treatment of ‘ideas’, along lines later to be developed by such thinkers as Locke and Condillac. Nevertheless, their main concern was to provide a basis for logic proper, i. e., for the theory of consequentiae or valid argumentation. In this
751 sense, their semiotic investigations remained strictly subordinated to the needs of another discipline. 2.3. Ancilla scientiae From the point of view of the historiography of semiotics, the rediscovery in the 12th century of Aristotle’s Analytica, especially the Analytica posteriora, led to a change in thought on methodology in science, which bore the seeds of a semiotic conception of scientific research. According to Aristotle, scientific knowledge is obtained via demonstratio (cf. Art. 41 § 2.3.). There are two main forms of demonstration, demonstratio quia (tou ho`ti), the way from the effects back to causes, and demonstratio propter quid (tou diho`ti), the way from the causes to the effects (cf. Anal. post. II,1,89 b; the same in Pietro d’Abano (1257⫺1316), Conciliator, Diff. 8, Intro. & Prop. 3). Aristotle spells out his view of scientificity in terms of the strict use of a “scientific form”, a syllogism that proceeds from premisses that are true, immediate, better known than, prior to, and causative of the conclusion (Anal. post. I.71b17⫺19; 20⫺25). By choosing the syllogism, he stresses the role of the medium: “[the medium] is the object of all our investigations”, since the medium is the cause every scientific investigation looks for (Anal. post. I.90a6⫺12; cf. Art. 41 § 4.2.). Two lines of development stem from these remarks. The first, which yields a tradition of little semiotic interest, focuses on pure logical reasoning; it uses the medium as a technical device in the frame of syllogisms, and, with the growth of formal logic in later centuries, loses its epistemological connotations. It should be stressed that Aristotle’s theory of science is far from being reducible to this formalistic conception (cf. Granger 1976, 75). The second understanding of medium, more akin to epistemological (and, later, semiotic) concerns, had to fence its way by changing not only conceptual attitudes but also the terminological cover. Ockham’s defence of Aristotle’s Anal. post., against some of his predecessors (e. g., Johannes Saresberiensis, d. 1180, Opera omnia 832 B⫺C, 859 C⫺D, 919 C⫺920 A) is a prelude to this approach. The whole third part of Ockham’s Summa logicae is devoted to the “demonstrative syllogism”; reference to the Aristotelian opinion is in Summa logicae III.2.1, 505; see also III.2.17, 532⫺534 for background material, and III.2.18 ff for a discussion of contemporary knowledge of demonstratio. The latter
752 was more fully developed by Zabarella (see below). Another current of thought, in fact also originating with Aristotle, but mediated by the ancient medical schools, was influential in the shaping of medieval epistemology. Galen of Pergamon (129⫺ca. 200; cf. Art. 45), whose theory of methodical reasoning was introduced in Europe only via Arabic sources, was influential first in Sicily and later in Padua, a stronghold of Aristotelianism (cf., e. g., Crombie 1969, Randall 1961, Temkin 1973). Galen himself, and later the translator of his Ars parva (see Von Müller 1895) as well as Constantinus Africanus (1015⫺1087) and Gerard of Cremona (1113/4⫺1187) equated demonstratio quia and demonstratio propter quid with the methodological terms “analysis” and “synthesis”, respectively, and their Latin equivalents “resolutio” and “compositio”. Demonstrative knowledge, meaning scientific knowledge, was still conceived in the frame of syllogisms, but now “cause” and “effect” refer ⫺ as they will do later in Hume ⫺ to observables, to what is experienced. The connection between cause and effect through the medium is no longer bound to logical necessity or apodeictic premisses. It is to be performed at the ‘surface’ level of experience, where sensation acquires a significant role. In this epistemological context, the term “sign” becomes a central ⫺ albeit somewhat obscure ⫺ technical term. In Jacobo Zabarella’s (1533⫺1589) work, the Aristotelian and the Galenian influences combine to produce a significant semiotic shift in epistemology. From the many writings of Zabarella, the following three are the most important in this discussion, all to be found in the posthumous edition of his Opera logica (Cologne 1597): De methodis libri quatuor, pp. 134⫺334, Liber de regressu, pp. 479⫺498, and Liber de speciebus demonstrationis, pp. 411⫺480. For further details, see his Secundum Arist. Lib. Post. Anal. Commentarii, pp. 1033⫺1284. Zabarella calls the demonstratio quia (tou ho`ti) “demonstratio a signis”. The familiar ‘signum’ thus becomes a term of direct epistemological relevance; furthermore, by giving it an explicit role in demonstratio, Zabarella leads the discussion about scientific reasoning into a different, properly ‘semiotic’ direction: human knowledge and reasoning always implies “mediated” information, because neither “cause” nor “effect” are always at hand. The effect, in Zabarella’s demonstratio a signis, fulfills a sign function regarding the cause; its func-
V. Geschichtsschreibung der Semiotik
tional role within this demonstrative framework thus amounts to a ‘semiotization’ of the ‘phenomenon’. Zabarella contrasts the individual level of cognition leading from the perception of things already known to things to be known, with the ontological connection of prior to posterior ‘existence’ of things. Demonstratio a signis, of course, starts from posterior entities, from singularities, from effects, from “signs”, and looks for basic causes and principles. Therefore, according to Zabarella, it is really an ‘inventive method’. For him, sensations of things or events are always acts of interpretation. Sensation is selection, giving the thing perceived a reference or meaning. This Sinnzuweisung becomes both a criterion of choice and a legitimation of choice. As Zabarella states, every perceived object, act or event, if perceived ‘scientifically’, embodies its own cause. In other words, every object or event stands for something else, without the possibility of reading this property from the phenomenon itself. Therefore, the state of being a sign (Zeichenhaftigkeit) is not defined by properties of objects, but is conceived to be a relation between ‘interpreter’ and object, thus forming a constitutive unit and building up a paradigmatic semiosis (in Peirceian terms; cf. Art. 100). Zabarella’s ideas produced no tradition or school of semiotics, possibly because of the general rejection of the Aristotelian framework within which he worked. But his influence on Galilei (1564⫺1642) ⫺ explicitly acknowledged by the latter ⫺ may help to understand some of Galilei’s statements about science as an endeavor to break the mathematical code in which the ‘great book of nature’ is written. It may also help to understand the new 17th century scientists’ concern for a development of a ‘language of science’. Zabarella certainly paved the way to the epistemologically related semiotic work of such figures as Joachim Jungius (1587⫺ 1657), Gottfried Wilhelm Leibniz (1646⫺ 1716) and Johann Heinrich Lambert (1728⫺ 1777). But these developments belong to a new framework, the ‘modern’ age, whose founders, in the 17th century, stressed its radical discontinuity with the earlier medieval and renaissance ways of thought.
3.
Modern beginnings
3.1. Critical and applied semiotics The intellectual history of Modernity begins with the rediscovery and diffusion of the writings of the skeptics, notably those of Sex-
35. The beginnings of scientific semiotics
tus Empiricus (cf. Popkin 1979; see also Art. 40 § 2.2.). The skeptical mood thus introduced in Europe, in conjunction with other factors, leads to a critical attitude towards past (Scholasticism) as well as more recent (Renaissance) ways of thought. This attitude has important consequences for semiotics. The critique of Scholasticism involves a rejection of its alleged ‘verbalism’, which leads to a generalized distrust of language, now viewed as a misleading and unreliable guide in our pursuit of knowledge (cf. Art. 59 § 1.). The critique of the Renaissance’s all-embracing conception of the universe (and of language therein) as a network of natural analogical ‘signs’, whose deciphering is what science is all about, leads to suspicion towards ‘semiotic’ theories of scientific method (on ancient examples of this ‘semiotic method’ cf. Art. 46 § 2. and 3.). The critique was also directed against the widespread belief in a kabbalistic view of creation as actually consisting in the production of ‘words’ written by God in a ‘sacred language’ (which might be Hebrew, an ‘innate language’, or the natural language of Adam), whose remnants could still be found ⫺ and with them true knowledge ⫺ in existing languages (cf. Art. 61). Although Logosmystik authors such as Cornelius Agrippa von Nettesheim (1486⫺1535), Jacob Böhme (1575⫺ 1624) and others remained popular in the first half of the 17th century, scientifically oriented thinkers shunned them, contending that, after Babel, languages had been created anew by vulgar minds, not endowed with the intimate knowledge of the nature of things attributed to the first name-giver. Though Francis Bacon (1561⫺1626) still employed the phrase “the interpretation of nature” to describe the scientific endeavor, he made clear that his method had nothing to do with the verbal manipulations typical of Scholastic Aristotelianism or with the secrecy of the alchemist’s readings of nature’s signs (cf. Art. 62 § 5. and 6.). In this respect, it is interesting to compare Bacon with, for instance, Albert the Great, who, in his commentary to the De interpretatione, defines “interpretation” in a characteristically verbal manner: “Interpretation is the sentence that speaks about the thing as it is in words” (Perihermeneias 1.1.1, 373 b). ⫺ Instead, Bacon required all relevant observations to be explicitly and clearly arranged in ‘tables of presentation’, from which step-by-step justified generalizations about the ‘forms’ or ‘laws’ underlying phenomena could be drawn. This
753 procedure would provide ‘helps’ for the understanding, correcting the endemic weaknesses of the human mind (which he called “idols”), the most dangerous of which being the tendency to accept blindly the non-scientific conception of nature entrenched in our languages. Bacon’s critical stance left room, however, for a positive attitude towards semiotic systems. Once divested of their mystical pretentions and properly designed, such systems could become valuable additional helps to science. Soon the construction of such artificial systems was to become one of the main activities of the 17th and 18th century ‘applied semioticians’ (for the concept of ‘applied semiotics’ see Art. 1 § 1.2.). In this spirit, “philosophical languages”, “universal languages”, “real characters”, “pasigraphies”, etc. were developed one after the other by authors such as Francis Lodwick (1620⫺1694), George Dalgarno (1615(?)⫺1687), John Wilkins (1614⫺1672), Johannes Joachim Becher (1635⫺1682), Athanasius Kircher (1602⫺ 1680), Leibniz, and many others (cf. Knowlson 1975 for a survey of this kind of work in France and England; for specific information on some of the authors mentioned, see Salmon 1972, Asbach-Schnitker’s introduction to Wilkins 1984, Aarsleff 1982, 239⫺277, Formigari 1988 a, Couturat 1901, Dascal 1978, Pombo 1987). The scientific relevance of this kind of endeavor was institutionally acknowledged by the prestigious Royal Society in London, which, in a meeting held on 29 October 1662, commissioned Wilkins “to prosecute his design of an universal language” on the Society’s behalf. Though the result ⫺ Wilkins’s Essay Towards a Real Character and a Philosophical Language (1668) ⫺ proved to be useless for scientific purposes, interest in projects of this kind did not fade until the end of the 18th century (cf. Art. 64 and 65). The construction of scientific languages was not the only kind of work in ‘applied semiotics’ in the period under consideration. Cryptographical codes, mnemonic devices, heraldics, the study of writing systems, the attempts to decipher Egyptian hieroglyphs, and many similar endeavors exercised the best minds of the time. Though both the scientifically and the practically oriented projects were usually accompanied by general discussions on how signs work, the nature of communication systems and the kinds of signs most suited to
754 being easily learned and memorized, etc. (cf. Aarsleff 1982, 248), for the most part (with the notable exceptions of Leibniz and Condillac) they were neither based on a general semiotic theory, nor did they lead directly to the development of such a theory. To be sure, theoretically minded ‘philosophical semioticians’ were aware of this kind of work, and were presumably influenced by it. Nevertheless, we may say that, in a sense, the work of these applied semioticians shows that it is sometimes possible to do ‘applied science’ quite separately from its theoretical counterpart. 3.2. Philosophical semiotics John Locke’s (1632⫺1704) proposal (Essay 4.21.1⫺5) of a threefold division of sciences into physike´ (concerned with “bare speculative truth”), praktike´ (concerned with “the skill of right applying our own powers and action”), and se¯meiotike´ (concerned with “the nature of signs the mind makes use of for the understanding of things, or conveying its knowledge to others”), suggests, at least at the conceptual level, an entirely new status and role for semiotics. It no longer is a marginal, at best auxiliary, sub-discipline, but a major ‘science’, one of the “three great provinces of the intellectual world” (Essay 4.21.5). Locke’s innovative drive was somewhat dampened by an unfortunate terminological concession: “se¯meiotike´, or the doctrine of signs ⫺ he says ⫺ is aptly enough termed logike´”, for words are the most usual kinds of signs (Essay 4.31.4.). As Leibniz was quick to point out (Nouveaux Essais 4.21; GP V 504), though the Ancients themselves indeed subsumed under ‘logic’ “tout ce qu’on rapporte aux paroles et a` l’explication de nos pense´es”, the study of word etymology and of language usage, which involve arbitrariness, has nothing to do with logic proper, i. e., the science of reasoning, judgment and invention (see Dutz 1985 a, 260 ff). Locke’s semiotics, however, was for the most part intended to deal neither with the study of words in the sense suggested by Leibniz, nor with the more specific (and traditional) tasks of logic. Its main task was to be an investigation of both words and ideas in their capacity of ‘signs’ or ‘representations’. To treat ideas and words as signs was not new, of course. What was new was Locke’s combination of his epistemological/metaphysical criticism of essentialism with this semiotic outlook. The result was the daring step of considering not only words,
V. Geschichtsschreibung der Semiotik
but also ideas as varieties of conventional signs (cf. Formigari 1988, 113 and Dascal 1993). Leibniz, who had earlier criticized Thomas Hobbes’s (1588⫺1679) conventionalism as a form of ‘super-nominalism’, on the grounds that it would make truth itself arbitrary because dependent on words (cf. Dascal 1987, 22 ff, 61 ff), could not accept Locke’s proposed unification of semiotics under the banner of conventionalism. He argued that Locke’s threefold scheme was not really a classification of the sciences, for each science could be considered from any of the three points of view (descriptive, normative, terminological), so that each of Locke’s ‘sciences’ would “swallow” the others. He thus reinterpreted Locke’s scheme as a classification of ways of exposition, and reduced Lockean ‘semiotics’ to the art of conveniently arranging the results of science for easy retrieval. Leibniz acknowledged that such ‘repertoires’ ⫺ much like Bacon’s ‘tables of presentation’ ⫺ would also be of great help for the art of discovery, but this early acknowledgment of the importance of semiotic methods of information retrieval remained a minor component of his own grandiose semiotic pursuits. Indeed, Leibniz was much more deeply involved in semiotic research than Locke (or anyone else in his time), because he considered signs as a crucial factor in all forms of thought and knowledge (cf. Dascal 1978). But, for this to be the case, signs could not be, ultimately, conventional or arbitrary: “la repre´sentation a un rapport naturel a` ce qui doit eˆtre repre´sente´” (Theodice´e 웕 356; GP VI 326). This ‘natural’ or ‘intrinsic’ relation between representandum and representatum Leibniz called “expressio”. It should govern not only phenomena usually subsumed under the term ‘sign’, but also the very structure of the world. In this sense, Leibnizian semiotics was connected with his metaphysics, which in turn provided the basis for his theory of knowledge. The contrast between Leibniz and Locke sheds light on the agenda of what might have been called ‘philosophical semiotics’ at the time. Once the ‘transparency’ or ‘naturalness’ of mental signs (e. g., ‘ideas’) had been questioned by conventionalists, the issues became: how do mental signs represent?; how similar or different are they from other forms of representation (e. g., linguistic signs)?; and what kind of role do these other forms play in cognition (cf. Dascal 1990 a)?. As a result, the
35. The beginnings of scientific semiotics
most ubiquitous philosophical term of the time, ‘idea’, pace the Port Royal Logic’s (1664) declaration that it is one of those terms that “sont si clairs qu’on ne peut les expliquer par d’autres” (Arnauld and Nicole 1965, 39), was up for intense debate. All the major philosophers of the 17th and 18th centuries took part in this foundational debate in one way or another (cf., for instance, Dascal 1990 c), until it faded in the wake of Kant’s ‘silence’ (see § 3.3. below). Since we cannot pursue here the intricacies and wealth of this debate (but cf. Art. 62 § 8.2., see also Art. 76 § 1.1.), only a few indications will be given. For Leibniz, as for Locke, ideas and words are to be subsumed under a single category, since both are instantiations of expressio. But, unlike Locke, Leibniz developed an elaborate analysis of different modes of expressio, ranging over metaphysics (the relationships between monads), the theory of knowledge (of special interest is his theory of ‘blind’ or ‘symbolic’ knowledge), methodology (the idea of a ‘universal characteristic’ as the culmination of his efforts to develop a scientific method), logic (the role of formalism), mathematics (the importance of a suitable mathematical notation), linguistics (e. g., his attempt to define a level of ‘linguistic form’ between purely ‘syntactic’ or ‘surface’ form and non-linguistic ‘logical form’ ⫺ cf. Dascal 1990 b), and a host of other semiotic topics such as emblematics, numismatics, cryptography, etc. Eventually, Leibniz came to the conclusion that signs are not merely external tools for the expression of thoughts; they are indispensable for the process of thinking itself. At any rate, he deepened, enriched, and to some extent systematized semiotics. Unfortunately, most of his semiotic writings remained unpublished until recently and thus had only a limited immediate influence. In Johann Heinrich Lambert’s Neues Organon (1764), Semeiotica is elevated to the rank of one of the four divisions of his epistemology, which is to be a mathesis universalis, i. e., an axiomatically organized science that provides the foundations for all particular sciences. He purports to generalize and systematize, following some suggestions of Christian Wolff (1679⫺1754), Leibniz’s semiotic ideas. After an analysis of “symbolic knowledge in general”, where he surveys a wide variety of semiotic systems and lays down general principles, Lambert proceeds to analyze language. Like Leibniz, he stresses
755 that signs are necessary not only for communication, but for thought itself, especially in abstract and general matters (Neues Organon III 웕 12). Consequently, language grows with knowledge, both always having “the same extension” (웕 124). He emphasizes that Universal Grammar ⫺ as opposed to Grammar tout court ⫺ should focus on that which is “natural and necessary” in language (웕 71). The more a language contains only such necessary elements, the more it is a ‘characteristic’, and the more it is appropriate for science. Ideally, a scientific language must be such that “the theory of the object must be substitutable by the theory of signs” (웕 23, 웕 128). Under these conditions, science becomes a well constructed language, and thinking a manipulation of the signs of such a language according to its rules. All this echoes many of Leibniz’s statements (most of them unknown to Lambert). In other writings, the term ‘sign’ is discussed at length (e. g., in the section “Zeichen und Bedeutungen” in Architectonic (1771)), where Lambert characterizes a sign as “principium cognoscendi”, since a thinking being needs signs in order to draw the connection between cause and effect. Here he seems to revert to the kind of Aristotelianism found in the work of Zabarella (see above § 2.3.). At any rate, Lambert’s philosophical semiotics ⫺ of which Kant was aware ⫺ had no noticeable influence. Perhaps the reason is its entire subservience to a metaphysics that was soon to be considered ‘dogmatic’. In the 18th century, the central figure in the tradition of philosophical semiotics is, doubtless, Etienne Bonnot de Condillac (1715⫺1780; cf. Art. 62 § 8.2.5. and Art. 65 § 6.2.). He declared his allegiance to Locke, but went much further in his analysis of the role of signs ⫺ especially language ⫺ in the operations of the mind. Condillac contended that sensations are not simple but complex, and that the operation whereby we form concepts from sensations, namely ‘analysis’, depends on language, which through its ‘articulation’ is in fact a ‘method of analysis’ (cf. Sgard 1982 for various essays on Condillac’s semiotics). Condillac’s influence on the French encyclopedists, on Rousseau, and on the group of philosophers later known as the “Ide´ologues” was immense (cf. Aarsleff 1982, 146⫺209; Dascal 1983). The latter, who associated themselves with the French Revolution, pressed for an educational reform which was to draw upon their semiotic views on the
756 relevance of signs and language for knowledge (cf. Labarrie`re 1986; Dougnac 1986). In 1795, they created, at the newly founded Institut National des Sciences et des Arts, a special section devoted to “the science of the analysis of sensations and ideas”. In the same year, the Institut set up an official prize for the best essay on the influence of signs on the formation of our ideas, won by Joseph-Marie Dege´rando (1772⫺1842), with the essay Des signes et de l’art de penser conside´re´s dans leurs rapports mutuels (Dege´rando 1800). This incipient institutionalization of philosophical semiotics in France, through the work of the Ide´ologues, was however cut short by the rise of Napoleon, who opposed their linguistic and educational policies. Though the Ide´ologues’ influence elsewhere in Europe was not negligible (cf. Aarsleff 1982, 335⫺355; Schlieben-Lange et al. 1989⫺91; Formigari 1986), it did not lead to the establishment of a semiotic science, as they presumably had hoped for. The philosophical discussion about the relationship between signs and knowledge in the Modern Age was often dressed in a historical guise, in the form of hypotheses about the origin of language, as in the essays of Adam Smith (1723⫺1790), Jean-Jacques Rousseau (1712⫺1778) and Johann Gottfried Herder (1733⫺1803) on this subject. The latter’s was the prize-winning essay in a competition set up by the Berlin Academy in 1769 on the topic: “En supposant les hommes abandonne´s a` leurs faculte´s naturelles, sont-ils en e´tat d’inventer le langage? Et par quel moyen parviendront-ils a` cette invention? On demande une hypothe`se qui explique la chose clairement et qui satisfasse a` toutes les difficulte´s”. This competition followed a long series of discussions in the Academy on language and knowledge, stimulated by its president’s, Pierre-Louis Moreau de Maupertuis (1698⫺1759), interest in the issue. An indication of the popularity of the topic is the fact that 31 entries were submitted. In fact, a very large number of books were published in the 18th century about the ‘origin of language’, most of which have little semiotic or philosophical interest (cf. Stam 1976). Herder, who after writing the Abhandlung über den Ursprung der Sprache (1770) became enthusiastic about Leibniz’s work, defends the view that language and thought develop simultaneously, in intimate interaction and mutual dependence, both being manifestations of man’s ‘reason’, i. e., the
V. Geschichtsschreibung der Semiotik
ability not to be bound (like the other animals) to a restricted ‘sphere’ of activity, but to “spread the powers of his soul over the world” (Herder 1966, 105). Philosophical semiotics was thus, for two hundred years, a quite well defined, homogeneous, partly institutionalized, and extremely active field of inquiry. Broadly speaking, it might be seen as a serious candidate to become, in its heyday, the science of representation in general, and in particular the science of ‘mental representations’, the core of a ‘science of the mind’ ⫺ albeit not necessarily a naturalistic science of the mind in the sense intended by David Hume (1711⫺ 1776). It is not surprising, therefore, that those claiming nowadays to have created a ‘new science of the mind’ in the form of what is called “cognitive science” (cf. Gardner 1987) focus on the concept of representation (cf. Fodor 1981) and ⫺ explicitly or implicitly ⫺ relate their pursuit to the classical tradition of philosophical semiotics (cf. Jorna 1990 and the thematic issues of Semiotica 77/1⫺3 (1989) and Zeitschrift für Semiotik 12/1⫺2 (1990) on Artificial Intelligence; see also Art. 141). 3.3. Discontinuation One of the great mysteries and scandals of the history of ideas is Immanuel Kant’s (1724⫺1804) silence about philosophical semiotics in general (but cf. Art. 74 § 2.) and the philosophy of language in particular (cf. De Mauro 1966, 61 ff). That this silence could not be casual is evident from the fact that Kant was well aware of the debate on these issues at his time, both as expressed in the prize essays of Herder and Rousseau, and, more directly, in Johann Georg Hamann’s (1730⫺1788) Metacritik ueber den Purismus der Vernunft (1784), directed against Kant’s own first Kritik der reinen Vernunft. It stands to reason that Kant refused to discuss the role of language and signs in knowledge because such a discussion would reveal possibly unsurmountable difficulties in his system (cf. Dascal and Senderowicz 1990 and 1992). Whatever the explanation, Kant’s influence was decisive in the discontinuation of interest in the kind of philosophical semiotics so intensively practiced in the 17th and 18th centuries. Formigari (1988 b), analyzing the discontinuity between language theories of the early 19th century and the 18th century philosophical tradition, attributes it directly to the introduction in the former of the Kantian
757
35. The beginnings of scientific semiotics
notion of a transcendental subject. Attempts by thinkers such as Wilhelm von Humboldt (1767⫺1835) to combine an allegiance to Kantian principles with the semiotic concerns of the Ide´ologues remained largely ineffective and, in any event, without immediate influence (cf. Art. 77 § 1.). The very success of comparative grammar at the beginning of the 19th century, which promoted linguistics to a scientific status, may have been another reason for the discontinuation of interest in philosophical semiotics (cf. Art. 79 § 2.1.2). For the scientifization of linguistics as a historical discipline depended on (a) the delegitimation of philosophical speculations about the origin of language, and (b) the concentration of attention on the phonetic forms of language which are of little philosophical interest. This last point also applies to another close relative of philosophical semiotics, psychology. The scientifization of this discipline, in the second half of the 19th century, emphasized such quantifiable phenomena as the physiology of sensation and brought into disrepute the mentalistic discourse characteristic of philosophical semiotics (cf. Art. 77 § 2.2.). The interest in constructing scientific, philosophical, and other kinds of pretentious semiotic systems also decreased considerably by the end of the 18th century. Presumably one of the reasons is the record of failures of such projects, in spite of some local achievements, such as Lavoisier’s reform of chemical notation (cf. Art. 135). Another is the rise of romanticism, which, with its praise of ordinary languages as the expression of national characters, made the critique of language, which had provided the drive for projects of linguistic improvement, unpopular ⫺ to say the least (cf. Art. 77 § 2.1.). Add to the above the fact that the earlier forms of institutionalization and disciplinarization (awards, academy debates, sponsored projects, etc.) did not crystallize in the form of an academic or educational structure, and you have perhaps an explanation for the discontinuation of the process of scientifization of Modern semiotics. Of course, as Bacon observed, traditions of thought never disappear. They remain, as it were, in cold storage, waiting for a new chance. Indeed, various themes of classical semiotics have been revived later on, notably in the 20th century, once the intellectual conditions prevailing in the 19th century changed. We already noticed cognitive sci-
ence’s concern with the problem of representation. Among other revivals of classical themes are: Frege’s Begriffsschrift (1879; cf. Art. 76 § 3.1.), an attempt to implement Leibniz’s dream of a characteristica universalis with new logical foundations; the renewed interest in universal languages (cf. Couturat and Le´au 1903; cf. Art. 175); Logical Positivism’s interest in the ‘language of science’ as a foundation for its program of a ‘Unified Science’, to which both Charles Morris’s Foundations of the Theory of Signs (1938) and Leonard Bloomfield’s Linguistic Aspects of Science (1939) were major contributions (cf. Art. 106); and Ernst Cassirer’s Philosophie der symbolischen Formen (1923⫺1929), an attempt to revise Kantianism by ‘adding’ to it a semiotic dimension (cf. Art. 111). But it is the theoretical work of Saussure (cf. Art. 101) and Peirce (cf. Art. 100) that, according to most present-day semioticians, has led to the emergence, at last, of a ‘scientific semiotics’, to which we now very briefly turn our attention.
4.
Semiotics and world science
No doubt the term ‘semiotics’ refers today to a burgeoning and rapidly expanding field of intellectual activity (cf. Chapter XII, Art. 100⫺122). How does it fare with respect to the four ingredients of scientifization we discerned in the introduction? Regarding institutionalization, the record of present-day semiotics is quite impressive. The field has international and regional associations, specialized journals, regular congresses, an Encyclopedic Dictionary (complemented by the present Handbook), recognized authorities and paradigmatic ‘heros’, and even opposing schools or sects. It has begun also to acquire a foothold in academic institutions. Though there are ⫺ as far as we know ⫺ only few departments of semiotics in major universities, there are a number of research institutes and doctoral programs in semiotics, so that soon there will be individuals officially qualified as ‘professional semioticians’, i. e., holders of a Ph. D. in semiotics (whereas up to now all ‘declared’ semioticians hold degrees in other disciplines). One may safely say that, in so far as institutionalization is concerned, semiotics is fairly advanced in the process of scientifization. As for inner structuration and organization of the field, the process seems to be fairly
758 advanced too. There are recognized subfields, such as zoosemiotics, the semiotics of law, the semiotics of the arts, etc. (cf. Chapter XIV, Art. 132⫺158), and there are systematic applications of semiotic concepts and methods to the analysis of several cultural phenomena and sign systems (e. g., fashion, theatre, advertisement, etc.; cf. Chapter XV, Art. 159⫺176). As for self-identity and relations with neighboring fields, the situation is somewhat more problematic. Except for a universal allegiance to the scientific study of ‘signs’ (cf. Martinet 1973, 7), present-day semioticians diverge about practically all the rest: should semiotics investigate sign-systems or signprocesses?; should it restrict itself to the study of the communicative function of signs or should it consider any signs, regardless of their function?; should it employ methods of analysis similar to those of structural linguistics, of logic, of textual analysis, of psychology, of mathematics, etc.? Relations with neighboring fields ⫺ especially with linguistics ⫺ are also far from clear. If conceived as a sub-discipline of semiotics, linguistics has developed far beyond the ‘mother’ discipline, and has achieved an acknowledged scientific status which the latter still longs for. Furthermore, while there has been a close relationship between structuralist linguistics and semiotics, it seems that today’s dominant trend in linguistics ⫺ generative grammar ⫺ is totally indifferent to semiotics (and not only by accident). If, as contended by the Greimasian school (cf. Art. 119), the ‘semiotic’ is a subcomponent of the linguistic, it remains difficult to see how semiotics could develop into a ‘general theory of signs’. Relations with philosophy, psychology, poetics, sociology, anthropology, and logic are not easy to define either. Though one should not expect or require complete thematic and methodological homogeneity nor absolutely clear borders as a necessary condition for scientifization, it seems that on this account semiotics has not yet advanced enough. What about self-ascribed and externally acknowledged scientific status? Here, semioticians themselves are skeptical, as are ‘external’ observers. An indication of this skepticism is the fact that the newly ‘created’ cognitive science was conceived as a federation of four disciplines ⫺ linguistics, philosophy, psychology, artificial intelligence; semiotics, as a discipline, has been offensively excluded from such a federation ⫺ a development
V. Geschichtsschreibung der Semiotik
which only now begins to be corrected (cf. Jorna, van Heusden and Posner 1993; see also Art. 74 § 17.). In terms of the five parameters proposed by Redner to characterize the present-day paradigm of science, how does semiotics fare? It does not depend heavily (like physics) on a ‘technology of research’; though it sometimes tends to be formal, it is far from abiding by an ‘arithmomorphic’ ideal (cf. Redner 1987, 71); it certainly tends ⫺ in its theoretical endeavor ⫺ to a high level of abstraction, but it has not yet evolved into a sufficiently continuous and structured activity, so as to propose a series of clearly defined problems to which the practitioners’ problem-solving skills are mainly addressed; and lastly, it is not a ‘finalized’ science in the sense of following a course of theoretical development influenced mainly by external purposes and demands (e. g., by the pressure to produce certain applications). Clearly, then, semiotics is far from sharing these characteristics of present-day science. Of course, several objections might be raised against our analysis. Other criteria of scientificity (e. g., based on the philosophy or history of science, rather than on the sociology of science) might be adopted (cf. Art. 123), or one might argue that no such criterion can be rigorously applied (cf. Van de Velde 1980). In particular, the parameters used in the last paragraph could be dismissed as being relevant only for the natural sciences. The social and behavioral sciences, and semiotics in particular, could be judged by other standards. But if there were no acceptable criteria or, alternatively, if semiotics had its own standards of scientificity, defined at will, what would be the point of looking for ‘the beginnings of scientific semiotics’?
5.
Selected references
Aarsleff, Hans (1982), From Locke to Saussure. Minneapolis: University of Minnesota Press. Abelard cf. Petrus Abaelardus. Achinstein, Peter (1968), Concepts of Science: A Philosophical Analysis. Baltimore: The Johns Hopkins Press. Albertus Magnus [Albert von Bollstädt] (1890 ff), Liber I Perihermenias. Opera Omnia. Cura ac labore Steph. Caes. Aug. Borgnet. Parisiis apud Lodovicum Vives. Arens, Hans (1984), Aristotle’s Theory of Language and Its Tradition. Texts from 500 to 1750. Selection,
35. The beginnings of scientific semiotics Translation and Commentary. Amsterdam: Benjamins. Aristoteles of Stageira (1960/61), Aristotelis Opera. Ex recensione Immanuelis Bekkeri edidit Academia Regia Borussica. Editio altera quam curavit Olof Gignon. Berolini apud W. de Gruyter et Socios. Arnauld, Antoine and Pierre Nicole (1664), La logique ou l’Art de penser. 2nd edition Paris. Edition critique par P. Clair and F. Girbal. Paris: Presses Universitaires de France 1965. Bacon, Francis (1857⫺1874), The Works of Francis Bacon. J. Spedding, R. L. Ellis, D. D. Heath (eds.). London: Longman. Bacon, Roger ([1897⫺1900]), Opus maius. J. H. Bridges (ed.). Oxford: University Press. Bacon, Roger ([1978]), “An Unedited Part of Roger Bacon’s ‘Opus maius’: De signis”. K. M. Fredborg, L. Nielsen, Jan Pinborg (eds.). Traditio 34: 75⫺136. Benthem, Barbara van (1991), “Friedrich Wilhelm Nietzsche (1844⫺1900) und die heutige Wissenschaftshistoriographie”. Beiträge zur Geschichte der Sprachwissenschaft 1, 2: 159⫺163. Beuchot, Mauricio (1987), Aspectos Histo´ricos de la Semio´tica y la Filosofı´a del Lenguaje. Mexico: Universidad Nacional Auto´noma de Me´xico. Boethius [Anicius Manlius Severinus Boetius] (1877), Commentarii in librum Aristotelis Peri hermeneias, rec. Carolus Meiser. Pars prior versionem continuam et primam editionem continens. Lipsiae: Teubner. Boethius [Anicius Manlius Severinus Boetius] (1880), Commentarii in librum Aristotelis Peri hermeneias, rec. Carolus Meisner. Pars posterior, secundam editionem continens. Lipsiae: Teubner. Boethius [Anicius Manlius Severinus Boetius] (1934), Philosophiae Consolationis libri quinque. Rudolfi Peiperi atque Georgii Schepssii copiis et Augusti Engelbrechti studiis usus ad fidem codicum recensuit Guilelmus Weinberger. Vindobonae: Hoelder⫺Pichler⫺Tempsky et Lipsiae: Akademische Verlagsgesellschaft. Borbe´, Tasso (ed.) (1984), Semiotics Unfolding. Proceedings of the Second Congress of the International Association for Semiotic Studies. Vienna, July 1979. Berlin, New York and Amsterdam: Mouton. Bossong, Georg (1990), Sprachwissenschaft und Sprachphilosophie in der Romania. Tübingen: Narr. Bursill-Hall, Geoffrey L. (1971), Speculative Grammars of the Middle Ages. The Hague: Mouton. Bursill-Hall, Geoffrey L. (1975), “The Middle Ages”. In Current Trends in Linguistics III, ed. Thomas A. Sebeok. The Hague and Paris: Mouton: 179⫺230. Busse, Winfried and Jürgen Trabant (eds.) (1986), Les Ide´ologues: Se´miotique, the´ories et politiques
759 linguistiques pendant la Revolution Franc¸aise. Amsterdam: John Benjamins. Cassirer, Ernst (1923⫺1929), Philosophie der symbolischen Formen. Berlin: Cassirer. Couturat, Louis (1901), La logique de Leibniz. Paris: Presses Universitaires de France. Couturat, Louis and Leopold Le´au (1903), Histoire de la langue universelle. Paris: Hachette. Crombie, A. C. (1962), Robert Grosseteste and the Origins of Experimental Science. Oxford: Clarendon Press. Dascal, Marcelo (1978), La se´miologie de Leibniz. Paris: Aubier-Montaigne. Dascal, Marcelo (1983), “Signs and Cognitive Processes: Notes for a Chapter in the History of Semiotics”. In Eschbach and Trabant 1983: 169⫺190. Dascal, Marcelo (1984), “A Semiotically Relevant History of Semiotics”. In Borbe´ 1984: 61⫺65. Dascal, Marcelo (1987), Leibniz. Language, Signs and Thought. Amsterdam: John Benjamins. Dascal, Marcelo (1990 a), “Leibniz and Spinoza: Language and Cognition”. Studia Spinozana 6: 103⫺145. Dascal, Marcelo (1990 b), “Leibniz on Particles: Linguistic Form and Comparatism”. In De Mauro and Formigari 1990: 31⫺60. Dascal, Marcelo (1990 c), “The Controversy about Ideas and the Ideas about Controversy”. In F. Gil (ed.), Controve´rsias Cientı´ficas e Filoso´ficas. Lisbon: Fragmentos: 61⫺100. Dascal, Marcelo (1993), “The Conventionalization of Language in Seventeenth-Century British Philosophy”. Semiotica 96: 139⫺147. Dascal, Marcelo and Jose´ Borges Neto (1991), “Do que trata a lingüı´stica, afinal?”. Histoire, Episte´mologie, Langage 13, 1: 13⫺50. Dascal, Marcelo and Yaron Senderowicz (1990), “Language and Thought in Kant’s Epistemology”. Iyyun 39: 151⫺175 (in Hebrew). Dascal, Marcelo and Yaron Senderowicz (1992) “How Pure is Pure Reason? Language, Empirical Concepts, and Empirical Laws in Kant’s Theory of Knowledge”. Histoire, Episte´mologie, Langage 14, 2: 129⫺152. Deely, J. (1982), Introducing Semiotics. Its History and Doctrine. Bloomington: Indiana University Press. Dege´rando, Joseph-Marie (1800), Des signes et de l’art de penser conside´re´s dans leurs rapports mutuels. Paris: Goujon et fils. De Mauro, Tullio (1966), Introduzione alla semantica. Bari: Laterza. De Mauro, Tullio and Lia Formigari (eds.) (1990), Leibniz, Humboldt, and the Origins of Comparativism. Amsterdam: John Benjamins. Donatus (1981), Ars maior & Ars minor. In Louis Holtz (ed.), Donat et la tradition de l’enseignement
760 grammatical. E´tude sur l’Ars Donati et sa diffusion (IVe⫺IXe sie`cle) et e´dition critique. Paris: CNRS. Dougnac, Franc¸oise (1986), “Les societe´s linguistiques fonde´es par F.-U. Domergue a` Paris de 1791 a` 1811”. In Busse and Tranbant 1986: 299⫺ 322. Dutz, Klaus D. (1983), Zeichentheorie und Sprachwissenschaft bei G. W. Leibniz: eine kritisch annotierte Bibliographie der Sekundärliteratur. Münster: Institut für Allgemeine Sprachwissenschaft der Westfälischen Wilhelms-Universität. Dutz, Klaus D. (1983 a), “Die Semiotiken des Charles William Morris und ihre Rezeption”. In Dutz and Wulff 1983: 47⫺109. Dutz, Klaus D. (1985), “Demonstratio. Zum semiotischen Gehalt eines (fast) vergessenen wissenschaftstheoretischen Begriffs”. In Dutz and Schmitter 1985: 27⫺68. Dutz, Klaus D. (1985 a), “Schlüsselbegriffe einer Zeichentheorie bei G. W. Leibniz”. In Dutz and Kaczmarek 1985: 259⫺310. Dutz, Klaus D. (1989), “Verschiedene Spiralen, der ‘Coriolis-Effekt’ und die phaenomena bene fundata: Leibnizsche Theorie und ‘semiotische Kreativität’ ”. In Peter Schmitter and H. Walter Schmitz (eds.), Innovationen in Zeichentheorien. Münster: Nodus Publikationen: 151⫺173. Dutz, Klaus D. and Ludger Kaczmarek (eds.) (1985), Rekonstruktion und Interpretation. Problemgeschichtliche Studien zur Sprachtheorie von Ockham bis Humboldt. Tübingen: Narr. Dutz, Klaus D. and Peter Schmitter (eds.) (1985), Historiographia Semiotica. Studien zur Rekonstruktion der Theorie und Geschichte der Semiotik. Münster: MAkS. Dutz, Klaus D. and Peter Schmitter (eds.) (1986), Geschichte und Geschichtsschreibung der Semiotik. Fallstudien. Münster: MAkS. Dutz, Klaus D. and Hans J. Wulff (eds.) (1983), Kommunikation, Funktion und Zeichentheorie. Zur Terminologie der Semiotik. Münster: MAkS. Eco, Umberto (1984), “Proposals for a History of Semiotics”. In Borbe´ 1984: 75⫺89. Eco, Umberto (1989), “Denotation”. In Eco and Marmo 1989: 43⫺77. Eco, Umberto, R. Lambertini, C. Marmo and A. Tabarroni (1989), “On Animal Language in the Medieval Classification of Signs”. In Eco and Marmo 1989: 3⫺41. Eco, Umberto and Costantino Marmo (eds.) (1989), On the Medieval Theory of Signs. Amsterdam: John Benjamins. Eschbach, Achim and Jürgen Trabant (eds.) (1983), History of Semiotics. Amsterdam: John Benjamins. Fodor, Jerry A. (1981), Representations: Philosophical Essays on the Foundations of Cognitive Science. Cambridge MA: MIT Press.
V. Geschichtsschreibung der Semiotik Formigari, Lia (1986), “Les ide´ologues italiens. Philosophie du langage et he´ge´monie bourgeoise”. In Busse and Trabant 1986: 219⫺230. Formigari, Lia (1988), “L’oggetto ‘linguaggio’ nella storia delle idee”. In Formigari and Lo Piparo 1988: 3⫺10. Formigari, Lia (1988 a), Language and Experience in 17th⫺Century British Philosophy. Amsterdam: John Benjamins. Formigari, Lia (1988 b), “De l’ide´alisme dans les theories du langage. Histoire d’une transition”. Histoire, Episte´mologie, Langage 10, 1: 59⫺80. Formigari, Lia (1990), L’Esperienza e il Segno. Roma: Editori Riuniti. Formigari, Lia and Franco Lo Piparo (eds.) (1988), Prospettive di storia della linguistica. Roma: Editori Riuniti. Francis Bacon cf. Bacon, Francis. Frege, Friedrich Ludwig Gottlob (1879), Begriffsschrift, eine der arithmetischen nachgebildete Formelsprache des reinen Denkens. Halle: Nebert. Galen of Pergamon (1487), Te´chne¯ iatrike¯. Galeni qui dicitur micro Tegni cum commento Hali Rodoham liber, traductus per Gerardum Cremonensem. Venetiis, per Baptistam de Tortis. Gardner, Howard (1987), The Mind’s New Science: A History of the Cognitive Revolution. New York: Basic Books. Grabmann, Martin: (1943), “Thomas von Erfurt und die Sprachlogik des mittelalterlichen Aristotelismus”. Sitzungsberichte der bayerischen Akademie der Wissenschaften. Phil.-hist. Klasse. Heft 2. Munich: Beck. Granger, Gilles-Gaston (1976), La the´orie Aristote´licienne de la science. Paris: Aubier-Montaigne. Guillelmus de Ockham, Summa logicae. In Opera Philosophica I, ed. Ph. Boehner, G. Ga´l and S. F. Brown. St. Bonaventure NY: The Franciscan Institute. Heath, T. (1971), “Logical Grammar, Grammatical Logic, and Humanism in Three German Universities”. Studies in the Renaissance 18: 9⫺64. Heijerman, Erik and H. Walter Schmitz (eds.) (1991), Significs, Mathematics and Semiotics. The Signific Movement in the Netherlands. Münster: Nodus Publikationen. Herder, Johann Gottfried (1770), Essay on the Origin of Language. In On The Origins of Language, two Essays by Rousseau and Herder. Transl. A. Gode. New York: F. Ungar 1966. Humboldt, Wilhelm von (1903⫺1936), Gesammelte Schriften. Albert Leitzmann (ed.). Berlin: Behr. Hume, David (1874⫺1875), The Philosophical Works. I⫺IV. T. H. Green, T. H. Grose (eds.). London. Isermann, Michael (1991), Die Sprachtheorie im Werk von Thomas Hobbes. Münster: Nodus Publikationen.
35. The beginnings of scientific semiotics Jacobo Zabarella cf. Zabarella, Jacobo. Jean Poinsot cf. Johannes a Sancto Thoma. Johannes a Sancto Thoma [Jean Poinsot] (1930), Cursus Philosophicus Thomisticus. T. I. B. Reiser (ed.). Torino: Marietti. Johannes Sarisberiensis [John of Salisbury] ([1900]), Joannis cognomine Sarisberiensis Opera Omnia juxta editionem Oxiniensem quam nuper ad fidem codicum mss. exigit J. A. Giles. Parisiis, apud Garnier fratres editores, et J.-P. Migne, succ. (Patrologia latina 199). John of Salisbury cf. Johannes Saresberiensis. Jorna, Rene´ J. (1990), Knowledge Representation and Symbols in the Mind. An Analysis of the Notions of Representation and Symbol in Cognitive Psychology. Tübingen: Stauffenburg. Jorna, Rene´, Barend van Heusden and Roland Posner (eds.) (1993), Signs, Search and Communication: Semiotic Aspects of Artificial Intelligence. Berlin and New York: Walter de Gruyter. Kaczmarek, Ludger (1986), “ ‘Quid sit aliquid repraesentari in verbo’. Zum sprachtheoretischen Gehalt mittelalterlicher und moderner Repräsentationsbegriffe”. In Dutz and Schmitter 1986: 85⫺100. Knowlson, James (1975), Universal Language Schemes in England and France 1600⫺1800. Toronto: University of Toronto Press. Koerner, Konrad (ed.) (1980), Progress in Linguistic Historiography. Amsterdam: John Benjamins. Kretzmann, Norman, Anthony Kenny and Jan Pinborg (ed.) (1982), The Cambridge History of Later Medieval Philosophy. From the Rediscovery of Aristotle to the Desintegration of Scholasticism 1100⫺1600. Cambridge, England: Cambridge University Press. Labarrie`re, Jean-Louis (1986), “Le signe e´crit, l’e´ducation et la democratie. Quelques remarques a` partir du chapitre V de la Grammaire de Destutt de Tracy”. In Busse and Trabant 1986: 167⫺179. Land, Stephen K. (1974), From Signs to Proposition: The Concept of Form in Eighteenth-Century Semantic Theory. London: Longman. Law, Vivien (1992), “Language and Its Students: the History of Linguistics”. In Neville E. Collinge (ed.), An Encyclopedia of Language. London and New York: Routledge: 784⫺842. Le Guern-Forel, Odile (1982), “Aux origines de la se´miologie: Condillac et Costadau”. In Sgard 1982: 137⫺140. Leibniz, Gottfried Wilhelm (1875⫺1890). Die philosophischen Schriften von G. W. Leibniz, 7 vols., ed. C. I. Gerhardt. Berlin (reprint G. Olms, Hildesheim 1965). [Abbreviated “GP”]. Leibniz, Gottfried Wilhelm (1923 ff), Sämtliche Schriften und Briefe. Reihen I⫺VIII. Darmstadt: Reichl [later: Berlin: Akademie-Verlag].
761 Leibniz, Gottfried Wilhelm (1982 ff), Vorausedition zur Reihe VI ⫺ Philosophische Schriften ⫺ in der Ausgabe der Akademie der Wissenschaften. Bearbeitet von der Leibniz-Forschungsstelle der Universität Münster. Heinrich Schepers (ed.). Münster: Selbstverlag der Leibniz-Forschungsstelle. Locke, John (1823), The Works of John Locke. A new ed., corrected. 10 vols., T. Tegg (ed.). London: Wotridge. Marmo, Costantino (1987), “The Semiotics of John Poinsot”. Versus 46: 109⫺129. Martinet, Jeanne (1973), Clefs pour la se´miologie. Paris: Seghers. Martinus de Dacia ([1961]), Opera. Ed. H. Roos. (Corpus Philosophorum Danicorum Medii Aevi 2). Copenhagen: Gad. Mignolo, Walter D. (1988), “Fuzzy and Theoretical Domains: An Essay in Conceptual Elucidation”. Proceedings of the XIIth Congress of the International Comparative Literature Association. Munich. Morris, Charles William (1938), Foundations of the Theory of Signs. Chicago: University of Chicago Press. Nicholas of Cusa cf. Nikolaus von Kues. Nikolaus von Kues (1966), Philosophisch-theologische Schriften. Ed. Leo Gabriel. Translated and commented by Dietlind and Wilhelm Dupre´. Wien: Herder. Ockham, William of cf. Guillelmus de Ockham. Ong, Walter J. (1983), Ramus, Method, and the Decay of Dialogue. Cambridge MA: Harvard University Press. Panaccio, Claude (1983), “Guillaume d’Occam: Signification et supposition”. In Lucie Brin d’Amour and Euge`ne Vance (eds.), Arche´ologie du signe. Toronto: Institut Pontifical d’E´tudes me´die´vales: 265⫺286. Petrus Abaelardus (1956), Dialectica. First Complete Edition with Introduction by L. M. de Rijk. Assen: Van Gorcum. Petrus Heliae ([1975]), “Summa super Priscianum, Books I⫺III”. In J. P. Reilly, Petrus Helias’ “Summa super Priscianum I⫺III”, an Edition and Study. Unpublished Ph. D. dissertation, University of Toronto. Petrus Heliae ([1978]), “Summa super Priscianum, Books XVII⫺XVIII”. In J. H. Tolson (ed.), The Summa of Petrus Helias on Priscianus Minor. Copenhagen: Cahiers de l’Institut du Moyen Age Grec et Latin 27⫺28: 1⫺210. Petrus Hispanus (1972), Tractatus, Called afterwards Summulae logicales, ed. L. M. De Rijk. Assen: Van Gorcum. Pinborg, Jan (1967), Die Entwicklung der Sprachtheorie im Mittelalter. Münster/Copenhagen: Aschendorff/Frost-Hansen. Pinborg, Jan (1975), “Die Logik der Modistae”. Studia Mediewistyczne 16: 39⫺97.
762 Pinborg, Jan (1982), “Speculative Grammar”. In N. Kretzmann et al. (eds.), The Cambridge History of Later Medieval Philosophy. Cambridge, England: Cambridge University Press: 254⫺269. Poinsot, Jean cf. Johannes a Sancto Thoma. Pombo, Olga (1987), Leibniz and the Problem of a Universal Language. Münster: Nodus Publikationen. Popkin, Richard H. (1979), The History of Scepticism from Erasmus to Spinoza. Berkeley: University of California. Posner, Roland (1987), “What is an Academic Discipline?” In: Regina Claussen und Roland DaubeSchackat (eds.), Gedankenzeichen. Tübingen: Stauffenburg: 165⫺185. Priscianus (1855), Institutionum grammaticorum libri XVIII. H. M. Hertz (ed.). Leipzig: Teubner. Randall, John H. (1961), The School of Padua and the Emergence of Modern Science. Padova: Ed. Ante´nore. Redner, Harry (1987), The Ends of Science: An Essay in Scientific Authority. Boulder CO: Westview. Risse, Wilhelm (1965), Bibliographia Logica. Hildesheim: Olms. Roger Bacon cf. Bacon, Roger. Roos, Heinrich (1952), Die Modi Significandi des Martinus de Dacia. Münster: Aschendorff. Salmon, Vivian (1972), The Works of Francis Lodwick. London: Longman. Saresberiensis, Johannes cf. Johannes Saresberiensis. Schlieben-Lange, Brigitte et al. (eds.) (1989⫺1991), Europäische Sprachwissenschaft um 1800, vols. 1 and 2. Münster: Nodus Publikationen. Schmitter, Peter (1983), “Plädoyer gegen die Geschichte der Semiotik ⫺ oder: Vorüberlegungen zu einer Historiographie der Zeichentheorie”. In Eschbach and Trabant 1983: 3⫺23. Schmitz, H. Walter (1990), De Hollandse significa. Een reconstructie van de geschiedenis van 1892 tot 1926. Assen and Maastricht: Van Gorcum. Schuling, H. (1969), Die Geschichte der axiomatischen Methode im 16. und 17. Jahrhundert. Hildesheim: Olms. Sebeok, Thomas A. (1986), Contributions to the Theory of Signs. Bloomington: Indiana University Press. Semiotica 77/1⫺3 (1989). Berlin: Mouton de Gruyter. Sgard, Jean (ed.) (1982), Condillac et les proble`mes du langage. Gene`ve and Paris: Slatkine.
V. Geschichtsschreibung der Semiotik Stam, James J. (1976), Inquiries into the Origin of Language: The Fate of a Question. New York: Harper and Row. Swiggers, Pierre (1982), “La se´miotique de Condillac ou la pense´e dans la pense´e”. In Sgard 1982: 221⫺242. Swiggers, Pierre (1986), “Port-Royal: Autour du signe”. In Dutz and Schmitter 1986: 119⫺132. Temkin, Owsei (1973), Galenism. Rise and Decline of a Medical Philosophy. Ithaca NY: Cornell University Press. Thomas of Erfurt ([1972]), Grammatica speculativa. Ed. G. L. Bursill-Hall. London: Longman (The Classics of Linguistics). Trabant, Jürgen (1981), “Monumentalische, kritische und antiquarische Historie der Semiotik”. Zeitschrift für Semiotik 3: 41⫺48. Van de Velde, Roger G. (1980), “The Concept of ‘Scientific’ in the Development of the Language Sciences”. In Koerner 1980: 395⫺402. Vineis, Edoardo and Alfonso Maieru` (1990), “La linguistica medievale”. In Giulio C. Lepschy (ed.), Storia della linguistica. Vol. II. Bologna: Il Mulino: 11⫺168. Von Müller, Iwan (1895), Über Galens Werk vom wissenschaftlichen Beweis. Munich: Bayerische Akademie der Wissenschaften. Welby, Victoria Lady (1903), What is Meaning? Studies in the Development of Significance. Reprint of the London edition 1903, with an introductory essay by Gerrit Mannoury and a preface by Achim Eschbach. Amsterdam: John Benjamins 1983. Welby, Victoria Lady (1911), Significs and Language. The Articulate Form of our Expressive and Interpretative Resources. Reprint, with an introduction by H. Walter Schmitz. Amsterdam: John Benjamins 1985. Wilkins, John (1641), Mercury: Or the Secret and Swift Messenger, with an introduction by Brigitte Asbach-Schnitker. Amsterdam: John Benjamins. William of Ockham, cf. Guillelmus de Ockham. Zabarella, Jacobo (1597), Iacobi Zabarellae Patavini Opera Logica: Quorum argumentum, seriem & utilitatem ostendet tum versa pagina, tum affixa Praefatio Ioannis Ludovici Hawenreuteri. Editio tertia. Coloniae, sumptibus Lazari Zetzneri. Zeitschrift für Semiotik 12/1⫺2 (1990). Tübingen: Stauffenburg.
Marcelo Dascal, Tel Aviv (Israel), and Klaus D. Dutz, Münster (Germany)
VI. Geschichte der abendländischen Semiotik I: Keltisches, Germanisches und Slavisches Altertum History of Western Semiotics I: Celtic, Germanic, and Slavic Antiquity 36. Zeichenkonzeptionen im keltischen Altertum 1. Parameter antiker Kulturen und ihrer Zeichenprozesse 2. Varianten des ethnischen Prozesses 2.1. Varianten ethnischer Differenzierung 2.2. Varianten ethnischer Fusion 3. Kulturelle Entwicklung und die Rolle ökologischer Variablen 4. Kulturelle Konvergenzen in der Keltike und das Problem der Ethnogenese 5. Zeichenkonzeptionen im keltischen Makrokosmos: Ritualsymbolik und Ikonographie 6. Druidentum und Orakelwesen 7. Interkulturelle Kontakte mit den mediterranen Zivilisationen und die romano-keltische Kultursymbiose 8. Die Annahme des Christentums und christlicher Weltanschauung in der Spätantike 9. Keltische Schriftlichkeit der Antike 10. Zur Kontinuität keltischer Kulturtraditionen im nachantiken Europa 11. Literatur (in Auswahl)
1.
Parameter antiker Kulturen und ihrer Zeichenprozesse
1.1. Als die Aufklärer des 18. Jahrhunderts, insbesondere Hamann, Herder und Fichte, die Historizität der Sprache als Traditionsund Kulturträger in den Mittelpunkt ihres philosophischen Interesses stellten (vgl. Art. 65 § 6.), postulierten sie Sprache als das wesentliche Kennzeichen der nationalen (d. h. ethnischen) Eigenarten. Die Priorität, die Sprache als ethnisches Kennzeichen in der Vorstellung der Europäer seither genießt, hat die Kategorisierung nicht nur des wissenschaftlichen Denkens beeinflußt, sondern über die Schulerziehung auch das Selbstbewußtsein der europäischen „Sprachnationen“ geprägt (Kloss 1969, 44). Mit der aufstrebenden philologischen Tätigkeit seit Ende des 18. Jahrhunderts wurden insbesondere die gene-
tischen Affiliationen der Sprachen Europas erforscht, es bildete sich eine Tradition heraus, die Kulturen dieses Kontinents nach dem Kriterium der Sprachverwandtschaft zu gruppieren, und auf diese Weise formierten sich nicht nur die bekannten philologischen Einzeldisziplinen, sondern es verbreiteten sich auch volkstümliche Vorstellungen von der kulturellen Einheit sprachlich verwandter Gemeinschaften. Man spricht von den Kelten, Germanen und Slaven und meint damit jeweils die Gruppen, die verwandte Sprachen sprechen, unabhängig davon, wie unterschiedlich die Regionalkulturen dieser Völker ansonsten sind. Die Kelten der Antike treten für den modernen Betrachter primär aufgrund der Verwandtschaft ihrer Idiome in Erscheinung (Dillon und Chadwick 1972, 2 f), während etwa die materiellen Charakteristika der „keltischen“ La-Te`ne-Kultur (seit Ende des 5. Jahrhunderts v. Chr.) lediglich im Kerngebiet zu finden sind (zum Unterschied zwischen Sprache und Artefakten als Kulturkennzeichen vgl. Art. 32 § 2.). Ein Zusammengehörigkeitsgefühl der Kelten als Gruppe von Menschen mit verwandten Sprachen und ähnlichen kulturellen Institutionen entsteht erst im Zusammenhang mit dem Celtic Revival des 18. Jahrhunderts. Allerdings haben die Aufklärer die Idee der Sprache als Kennzeichen der Nationalkultur nicht „erfunden“, sondern lediglich einen essentiellen Trend des europäischen Sprachbewußtseins, der sich teilweise schon in der Antike abzeichnet (Haarmann 1993, 122 f), in rationalen Begriffen ausgedrückt. Für die Kelten gilt seit der Zeit ihrer frühen Kontakte mit den mediterranen Zivilisationen, daß sie ihr sprachliches Erbe und das Bewußtsein ihrer regionalen kulturellen Identität auch auf dem Festland
764 bis in die Spätantike tradiert haben. In der Bretagne ist die festlandkeltische Sprachkontinuität selbst während der Zeit der intensiven Romanisierung nicht abgerissen. Als Substrat hat sich das gallische Keltisch in der Sprache der inselkeltischen Immigranten erhalten (Falc’hun 1981). Außer der Sprache, durch die sich die Kelten von Griechen, Römern und Germanen unterschieden, waren auch die mit der keltischen Religion und ihrem Götterpantheon assoziierten Anschauungen wichtig für die Selbstidentifizierung und Abgrenzung der Kelten gegenüber den Nachbarkulturen (zum Problem der ethnischen Identität vgl. Art. 32 § 1.). Erst in der Spätantike transzendieren die Kelten durch die Christianisierung die älteren ethnischen Schranken ihrer einheimischen polytheistischen Tradition. Der Spracherwerb war und ist ethnisch-spezifisch, und bereits in der Antike gab es regionale Sprachbarrieren zwischen dem Festlandkeltischen und dem Inselkeltischen (s. u.). Der Charakter dieser innerkeltischen Barrieren verstärkte sich in der Nachantike im Sinn einer zunehmenden Regionalisierung der Sprachgemeinschaften, wodurch die grammatischen Strukturen, die sprachlichen Handlungsstrategien und die Kontaktbedingungen des Irischen andere wurden als die des Kymrischen in Wales oder des Bretonischen in der Bretagne. 1.2. Der Gegenstand dieses Artikels sind die Zeichenprozesse und -konzeptionen in den älteren Keltenkulturen, für die sich der Ausdruck „Keltike“ eingebürgert hat. Dies ist eine moderne Adaptation eines griechischen Terminus für die Wohngebiete der Kelten, der schon von Herodot verwendet wurde. Obwohl „Keltike“ in seiner morphologischen Struktur dem Terminus „Antike“ ähnelt, handelt es sich um einen primär kulturgeographischen Terminus (vgl. Spindler 1991, 15). Mit dem Wortgebrauch assoziiert ist allerdings auch ein chronologischer Aspekt, denn von der Keltike ist im allgemeinen nur die Rede im Zusammenhang mit den antiken Keltenkulturen, d. h. mit den Kelten des Altertums vor deren mittelalterlicher Ausgliederung in regionale Kulturen. Insofern ist „Keltike“ ein kulturgeographischer Ausdruck wie „Romania“ oder „Germania“, der darüber hinaus das zeitlich begrenzte Moment der keltischen Ökumene einschließt, und diese löst sich in der Nachantike auf. Zur Zeit ihrer maximalen Ausdehnung (Ende des 3.
VI. Keltisches, Germanisches und Slavisches Altertum
Jahrhunderts v. Chr.) erstreckte sich die Keltike geographisch von Westen nach Osten über etwa 4000 km, und von Süden nach Norden über mehr als 1500 km aus. Das Gebiet umfaßte das nördliche Spanien (keltiberisches Kulturareal), Frankreich (gallisches Areal), die britischen Inseln, Süddeutschland, den Donauraum bis in den nördlichen Balkan sowie eine Enklave in Kleinasien (galatisches Areal). Sprache ist seit jeher ein Element der Selbstidentifizierung wie auch der Abgrenzung gegenüber Nachbarkulturen bei den Kelten gewesen. Vom Standpunkt der Sprachverwandtschaft stellt sich das Keltische als Sprachzweig relativ isoliert dar. Es gibt keine stichhaltigen Argumente dafür, die keltischen Sprachen mit anderen Untergruppen der indoeuropäischen Sprachfamilie in engere Beziehung zu setzen (vgl. Dillon und Chadwick 1966, 371 ff zu Auffassungen der älteren Forschung). So ist es zwar berechtigt, von einer slavisch-baltischen Sprachperiode zu sprechen (Senn 1966, 33 ff), das „italo-keltische“ Konstrukt der früheren Forschung wird aber heutzutage nicht mehr aufrechterhalten (Watkins 1966, Bednarczuk 1988). Ebenso wenig stichhaltig erscheint die Hypothese von einer „germano-keltischen“ Sprachperiode. Einer kritischen Überprüfung älterer Vergleichsdaten halten nur wenige lexikalische Isoglossen stand (Polome´ 1983). Die ökologischen Bedingungen der keltischen Ethnogenese (vgl. § 4.) legen auch die Annahme einer engeren sprachlichen Einheit mit anderen regionalen Gruppierungen des Indoeuropäischen nicht nahe. Die Vertreter der neueren Forschung sind sich bewußt geworden, daß die Genese und Entwicklung einer Kultur nicht einseitig sprachbezogen erschlossen werden kann und daß andererseits eine ausschließlich an materiellen Artefakten orientierte Analyse nicht dazu ausreicht, das Eigenprofil einer Kultur sinnvoll zu kategorisieren. Der Erforschung des Identitätspotentials einer Kultur wird heutzutage in den verschiedensten Fachdisziplinen immer mehr Aufmerksamkeit gewidmet, so in der Sozialpsychologie (Giles 1977), in der Ethnosoziologie (Bromlej 1983 und Edwards 1985, hauptsächlich über die modernen keltischen Kulturen), in der Soziolinguistik (Haarmann 1983; 1986), in der Ethnologie (Müller 1987), in der Archäologie (Renfrew 1987, 214 ff, mit speziellem Bezug zur Ethnogenese der Kelten). Einig ist man sich dahingehend, daß eine Kulturbetrach-
765
36. Zeichenkonzeptionen im keltischen Altertum
tung unter dem Gesichtspunkt der Identitätsproblematik nur sinnvoll ist, wenn man Kultur als dynamische Kraft (vgl. Posner 1990; 1991), die in einem solchen Milieu stattfindenden Semiosen in ihrem prozessualen Ablauf und die daran gekoppelte ethnische Identität nicht als statische Größe, sondern als kontinuierlichen Prozeß auffaßt. Für immer wichtiger bei der Beurteilung des Eigenprofils einer Kultur wird die Analyse von Symbolen erachtet, und zwar unter dem Gesichtspunkt des Wertes, den diese für die Identifikation ihrer Benutzer in der ihnen vertrauten Umgebung besitzen. Somit sind nicht nur Sprache oder materielle Kulturformen von Belang, sondern alle Identifikationssymbole in einem breiten Spektrum von rein materiellen über interaktive bis hin zu rein ideellen Bereichen. Diese von Menschen geschaffenen materiellen, interaktiven und ideellen Symbolrepertoires sind integrativer Bestandteil der Semiosen, an denen sich Personen mit gleicher Kultur in ihrem Siedlungsmilieu beteiligen. Soweit eruierbar, d. h. anhand von Artefakten beweisbar, aus archäologischen Ensembles interpretierbar oder sprachhistorisch rekonstruierbar, sollen die Zeichensysteme der antiken Keltenkulturen erschlossen werden. Wichtig dabei ist die Betonung des prozessualen Charakters der Semiosen im keltischen Kulturkreis, deren Dynamik Aspekte der Kontinuität wie des Wandels einschließt. Aus den Analysen zum Eigenprofil der Keltenkulturen und der Bedingungen ihrer Semiosen entstehen Kulturmuster, die mit denen in Kontaktkulturen (z. B. griechischen, etruskischen, römischen Zivilisationen) kontrastiert werden. Als Konsequenz der dynamischen Kulturentfaltung im ethnischen Prozeß nimmt eine gegebene Kultur ein bestimmtes Eigenprofil an, was soviel bedeutet, als daß die kulturellen Muster einer Gemeinschaft ein ethnischspezifisches Gepräge entfalten. Unabhängig davon, ob bestimmte konstitutive Elemente einer Kultur auch anderswo auftreten können, ist die Kombinatorik der konstitutiven Elemente in einer Regionalkultur jeweils ethnischspezifisch (Haarmann 1990 a, 2 ff). Die Spezifik begründet sich damit, daß sich tradierte Lebensgewohnheiten und Interaktionsmuster auf die Gemeinschaft beschränken, deren Mitglieder sich desselben Kommunikationsmediums bedienen, sich derselben religiösen Tradition verpflichtet fühlen und/oder gleichartige soziale Werte und Weltanschauung teilen. Unter dem Gesichtspunkt der
Ethnogenese von Kulturen ist davon auszugehen, daß die ethnische Spezifik ein Produkt des dynamischen Entfaltungsprozesses ist, in dessen Verlauf sich kulturelle Muster ausformen. Dies gilt für Kulturen der Antike ebenso wie für solche der Moderne. Die Dynamik kultureller Entwicklung drückt sich prinzipiell in Trends aus, deren stärkere oder schwächere Manifestation von der Wirkungsweise einzelner ökologischer Faktoren sowie von deren Wechselspiel abhängig ist (vgl. § 3.). Kulturelle Trends sind eine Funktion des Zeitintervalls zwischen zwei gegebenen Entwicklungsstadien, und sie manifestieren sich in allen Domänen einer Kultur, sei es im materiellen Bereich (z. B. Tradition des Hausbaus oder der Textilverarbeitung), im sozialen Sektor (z. B. Hochzeitsbräuche oder Rechtssystem), im religiösen Bereich (z. B. Rituale und Jenseitsvorstellungen), in der Interaktion (z. B. Rolle der Sprache und anderer Zeichensysteme) und im Wertsystem (z. B. Inhalte der Selbstidentifizierung und der Fremdkategorisierung). Die erwähnten Kulturmuster sind konstitutive Elemente einer jeden Kultur, obwohl es bei der Betrachtung der antiken keltischen Kulturen in der zeitlichen Retrospektive nicht möglich ist, verbindliche Aussagen über alle Aspekte der keltischen Religion zu machen, von der Unmöglichkeit einer Stellungnahme zur Selbstidentifizierung der Kelten in der Antike einmal abgesehen. Sofern man aber der interpretativen Kapazität der empirischen Forschung einen angemessenen Stellenwert einräumt, vervollständigt sich durch Rückschlüsse aus Indizienbeweisen sowie unter Auswertung von Hinweisen bei antiken Autoren auch das Mosaikbild der antiken Keltenkulturen.
2.
Varianten des ethnischen Prozesses
Die kulturellen Entwicklungstrends, die sich im Zeitablauf abzeichnen, können ganz unterschiedlicher Art sein. Es kann sich im Sinn kultureller Kontinuität um eine geradlinige Evolution handeln oder um eine Transformation älterer einheimischer Kulturmuster. Außerdem besteht im interkulturellen Kontakt eine große Wahrscheinlichkeit, daß einheimische Kulturmuster durch solche der Kontaktkultur beeinflußt oder sogar überlagert und ersetzt werden (Haarmann 1986, 41 ff, 155 ff). Mittel- und Südeuropa waren bereits in der Antike relativ dicht besiedelt, so
766
VI. Keltisches, Germanisches und Slavisches Altertum
daß der Kulturaustausch über die ethnischen Grenzen hinweg sehr rege war. Die Spezifik der Kontaktbedingungen war maßgebend für das Verhältnis von Kontinuität und Wandel von Regionalkulturen. Das Besondere an den frühen Entwicklungstrends im ethnischen Prozeß der Keltenkulturen ist, daß deren keltischer Charakter nicht von Anbeginn vorgegeben war, sondern sich erst graduell herauskristallisiert (vgl. Karte 36.1). Seit wann und wo zuerst von keltischer Kultur die Rede sein kann, ist ein brisantes Problem der ethnogenetischen Forschung.
Der ethnische Prozeß schließt das gesamte Repertoire von konstitutiven Elementen ein, die relevant sind für die Identitätsfindung in einer Gemeinschaft. Somit gehören Sprache als Kommunikationsmittel, religiös-mythologische Vorstellungen und Praktiken, soziale Verhaltensmuster, Rechtsbewußtsein, das Wertsystem und andere Konstituenten dazu. In der im folgenden angestrebten Systematik ethnischer Prozesse in der Keltike können nicht sämtliche Spezifika berücksichtigt werden. Wichtige Entwicklungstrends werden vorrangig anhand sprachlicher Ausglie-
Keltisches Kerngebiet 6.⫺5. Jahrhundert v. Chr. Gebiete der keltischen Expansion 4.⫺1. Jahrhundert v. Chr. Nichtkeltische Gebiete Karte 36.1: Das keltische Siedlungsgebiet in Europa im 4. und 3. Jahrhundert v. Chr. (nach Elue`re 1987, 86).
767
36. Zeichenkonzeptionen im keltischen Altertum
derungs- und Fusionsprozesse, d. h. für eine verhältnismäßig einfach abgrenzbare Einzelkonstituente, illustriert. Theoretisch ist damit zu rechnen, daß konkrete Entwicklungstrends in der einen oder anderen Richtung mit Bezug auf einzelne Konstituenten derselben Kultur nicht in jedem Einzelfall synchron verlaufen müssen, daß vielmehr jede Einzelkonstituente ihr eigenes prozessuales Gepräge aufweist, gleichsam eine spezifische Matrix innerhalb des Gesamtprozesses. Aus der Summe der Einzeltrends in Gestalt einer Matrix für Sprache, Wertsystem, Verhaltensmuster usw. ist die Entwicklungsdynamik im Gesamtprozeß zu ermitteln. Auf eine Detailanalyse des ethnischen Gesamtprozesses in der Keltike muß hier verzichtet werden, da eine solche bislang ein Forschungsdesiderat ist. Allerdings wird der Versuch unternommen, zumindest zwei ethnische Hauptprozesse der Keltenkulturen in ihrem Gesamtumfang zu skizzieren. Dabei geht es um solche Gesamtprozesse, die für alle Keltenkulturen von Bedeutung waren. Es handelt sich einerseits um den fundamentalen Prozeß des mit der Ethnogenese assoziierten „Keltischwerdens“ bestimmter europäischer Kulturformen. Da in den Keltenkulturen sowohl indoeuropäische als auch nichtindoeuropäische Elemente verschmolzen sind, wird der Analyse der Ethnogenese der Kelten besondere Aufmerksamkeit gewidmet (vgl. § 4.). Der Prozeß des Verschmelzens der Basiselemente, die das Keltische der historischen Zeit ausmachen, läßt sich als Amalgamierung (vgl. Punkt 2.2.1. der Typologie) identifizieren. Der andere ethnische Hauptprozeß in der Keltike war die Romanisierung (vgl. § 7.), die sich auf allen Ebenen vollzog. Dieser Prozeß ist als Inkorporation (vgl. Punkt 2.2.2. der Typologie) zu charakterisieren, und zwar vom Standpunkt des dominanten römisch-lateinischen Kulturkreises. Bezogen auf eine Systematik ethnischer Prozesse mit universaler Gültigkeit (s. u.) sind deren Varianten nicht sämtlich in den Entwicklungstrends der antiken Keltenkulturen vertreten, wohl aber die beiden Hauptrichtungen der Differenzierung (bzw. Ausgliederung) und der Fusion (bzw. Assimilation). Die Ausrichtung einzelner konkreter Prozesse der Differenzierung oder Fusion ist jeweils räumlich und zeitlich spezifisch. Aufgrund solcher spezifischen Bedingungen der Entwicklungsdynamik kristallisieren sich die folgenden Varianten im ethnischen Prozeß der Keltenkulturen heraus. Der Charakter der
hier postulierten Varianten des ethnischen Prozesses als theoretische Konstrukte wird durch Formeln symbolisch veranschaulicht. 2.1.
Varianten ethnischer Differenzierung
2.1.1. Profilierung [A ⬎ A1 ⫹ A2 (⫹ A3 …)] Im Vergleich eines älteren Stadiums der geringeren Differenzierung mit einem jüngeren Stadium der stärkeren Differenzierung signalisiert jeweils die Profilierung das Anfangsstadium der Ausgliederung. Will man Ausgliederungsprozesse wie die Differenzierung der indoeuropäischen Sprachfamilie (A) in ihre Untergruppen (u. a. A1 ⫽ keltische ⫹ A2 ⫽ germanische ⫹ A3 ⫽ slavisch-baltische Gruppe) in Betracht ziehen, die lediglich rekonstruiert, nicht aber archäologisch dokumentiert werden können, so kann man die Profilierung eines keltischen Komplexes in einer sehr vage zu bestimmenden Periode (nach 3500 v. Chr., aber nicht später als 2000 v. Chr.) ansetzen. Der Prozeß der sukzessiven Ausgliederung des älteren keltischen Kulturkomplexes in Areale (A ⫽ gesamtkeltisch ⬎ A1 ⫽ festlandkeltisch ⫹ A2 ⫽ inselkeltisch) und dieser Areale in regionale Kulturprovinzen (A ⫽ inselkeltisch ⬎ A1 ⫽ gälisch/goidelisch ⫹ A2 ⫽ britannisch; A ⫽ festlandkeltisch ⬎ A1 ⫽ gallisch ⫹ A2 ⫽ rätisch ⫹ A3 ⫽ keltiberisch) ist ebenfalls im Anfangsstadium als Entwicklungstrend zu charakterisieren, der hier als Profilierung bezeichnet wird (s. u. zur Terminologie). Bereits seit der Zeit der ältesten sprachlichen Überlieferungen des Keltischen in Inschriften, verstreuten Ausdrücken und Namen in den Werken antiker Autoren (seit dem 3. Jahrhundert v. Chr.) besteht die deutliche Trennung in die Sprachvarianten des P- und Q-Keltischen. Die Differenzierung des indoeuropäischen Gutturals [*kw] als entweder [p] oder [q] (geschrieben *c+) „is structurally trivial“ (Watkins 1966, 32). Trotzdem bedient sich die Sprachwissenschaft dieser praktischen Kategorisierung bis heute. Unter Berücksichtigung älterer Sprachzustände stellt sich die Ausgliederung des Keltischen ⫺ hier erläutert an den Ordinalzahlen von 1 bis 10 ⫺ auf der Basis der Isoglosse zwischen Pund Q-Varianten wie folgt dar (vgl. Tabelle 36.1). Vergleicht man die Zahlwörter für 4 und 5 in der Aufstellung, wird deutlich, daß das Gallische und Kymrische Varianten des P-Keltischen sind, das Irische eine Variante des Q-Keltischen.
768
VI. Keltisches, Germanisches und Slavisches Altertum
Tab. 36.1: Die Ordinalzahlen in älteren Sprachstadien des Keltischen (nach Schmidt 1983, 81) Gallisch Altirisch (1. Jh. n. Chr.) (8. Jh.) 1 cintuxo(s) 2 al(l)os 3 trito(s), tr(itios) 4 petuar(ios) 5 6 7 8 9 10
pinpetos suexos sextametos oxtumetos name(tos) decametos
ce´tn(a)e ta´n(a)ise, aile tris cethramad co´iced se(i)ssed sechtmad ochtmad no´mad dechmad
Mittelkymrisch (13. Jh.) kyntaf eil trydyd, f. tryded pedwyryd, f. pedwared pymhet chwechet seithvet wythvet nawvet decvet
Die keltischen Sprachvarianten der Antike zeigen folgende Differenzierung: P-Keltisch: Gallisch (Sprache der Kelten in Frankreich), Lepontisch (Sprache der Kelten in Norditalien), Britannisch (in der Antike noch undifferenziertes Inselkeltisch, woraus sich später das Kymrische und das Kornische sowie das Bretonische in Frankreich ausgegliedert haben), Q-Keltisch: Keltiberisch (Sprache der Kelten auf der Pyrenäenhalbinsel), Gälisch bzw. Goidelisch (in der Antike noch undifferenziertes Inselkeltisch in Irland, woraus sich das Irische entwickelt hat, aus dem sich ihrerseits das Schottisch-Gälische und ManxGälische ausgegliedert haben). Anhand der sprachgeographischen Verteilung von P- und Q-Keltisch kann vermutet werden, daß die Lautentwicklung [*kw] ⬎ [q] den älteren Zustand manifestiert, der sich an der Peripherie (Irland, Spanien) gehalten hat. Die lauthistorische Innovation [*kw] ⬎ [p] hat diese peripheren Gebiete nicht mehr erreicht. 2.1.2. Separation [A ⬎ B ⫹ C (⫹ D …)] Während sich das ältere Stadium des Inselkeltischen in der Antike zum Goidelischen und Britannischen profiliert (vgl. 2.1.1.), erfolgt die weitere Differenzierung dieser Sprachzustände in Richtung auf eine Ausglie-
derung in Einzelsprachen teilsweise nach dem Prinzip der Separation. Dies gilt für die Entwicklung des Britannischen (A), das sich in der Nachantike zur Ausgliederungsstufe der Einzelsprachen Kymrisch (B), Kornisch (C) und Bretonisch (D) ausdifferenziert. Die Differenzierung des Britannischen in eine westliche (⬎ Kymrisch) und eine südwestliche Variante (⬎ Kornisch, Bretonisch) beginnt im 5. Jahrhundert n. Chr., aber die regionalen Varianten bleiben noch jahrhundertelang wechselseitig verständlich. Dagegen ist die Differenzierung des Goidelischen durch Proliferation charakterisiert (vgl. 2.1.3.). 2.1.3. Proliferation [A ⬎ A ⫹ B] oder [A ⫹ B ⬎ A ⫹ B ⫹ C] Die meisten Fälle von ethnischer Differenzierung beruhen entweder auf Profilierung oder auf Separation oder auf einer zeitlichen Aufeinanderfolge beider Prozesse (vgl. 2.1.1. und 2.1.2.). Dies gilt nicht nur mit Bezug auf die keltischen Kulturen, sondern durchaus in einem weiten Vergleichsrahmen ethnischer Ausgliederung. Dagegen kann die Proliferation als spezieller Sonderfall der Differenzierung eingestuft werden. Die Ausgliederung des Schottisch-Gälischen als individueller Einzelsprache hängt direkt mit der irischen Mission und Siedlungsbewegung im Mittelalter zusammen. Von der Basis des mittelalterlichen irischen Gälisch (A), das sich kontinuierlich im Mutterland Irland weiterentwikkelt, spaltet sich die gälische Variante in Schottland (B) ab, und zwar im Verlauf des 10. Jahrhunderts. Noch später, nämlich erst im Verlauf des 15. Jahrhunderts, erfolgt die Abspaltung des Manx-Gälischen (C) von der gemeinsamen gälischen Basis. Das Irische setzt das Westgälische fort, während das Schottisch-Gälische und ManxGälische Repräsentanten des Ostgälischen sind. Bis zum Ende des Mittelalters verwendeten Iren und Schotten eine gemeinsame gälische Schriftsprache. Noch heute stehen sich Irisch und Schottisch-Gälisch näher als vergleichsweise Kymrisch und Bretonisch. Als Vergleichsfall sei hier auf das Beispiel der bosnischen Nationalität als einer komplexen Proliferation hingewiesen. Die Angehörigen der bosnischen Nationalität (C), die Bosniaken, unterscheiden sich von den Kroaten (A) und Serben (B) sprachlich nicht wesentlich. Das markanteste Kennzeichen ihrer Nationalkultur ist ihr islamischer Glaube.
36. Zeichenkonzeptionen im keltischen Altertum
2.2.
Varianten ethnischer Fusion
2.2.1. Amalgamierung [A ⫹ B ⬎ C] Ein Merkmal der keltischen Kulturen der Antike ist deren nichtindoeuropäisches Amalgam. Insofern ist die prähistorische Ethnogenese der Kelten (C) nicht als alleinige Ausgliederung aus dem Blickwinkel des internindoeuropäischen Kulturkomplexes zu verstehen, sondern speziell als Fusionsprozeß indoeuropäischer (B) und vorindoeuropäischer (A) Kulturmuster. In der Terminologie („indoeuropäisch“ versus „vorindoeuropäisch“) wird die chronologische Stratigraphie der am Amalgamierungsprozeß beteiligten Kulturkomplexe deutlich. Die hier postulierte Amalgamierung von Kulturen, die sich nicht nur materiell, sondern vor allem auch ideell erheblich voneinander unterschieden, ist der entscheidende Prozeß zur Ausformung des Eigenprofils dessen, was man „Keltenkulturen“ nennt. Dieser ethnische Prozeß war langwierig und resultierte in komplexen Transformationen des vorindoeuropäischen Kulturguts in der Gebrauchskeramik, in den Sozialstrukturen, in den mythologischen Traditionen und in der Herausbildung des keltischen Götterpantheons. Ältere Vorstellungen, wonach Indoeuropäer mit klar definierbarer „keltischer“ Kultur von irgendwoher nach Mittel- und Westeuropa sowie auf die britischen Inseln gewandert seien, sind nicht mehr vertretbar. Migrationen sind allerdings eine entscheidende Variable für den Grad kultureller Amalgamierung in den verschiedenen Siedlungsgebieten. Soweit es die Ethnogenese der Kelten betrifft, kann man diesen ethnischen Prozeß als primäre Amalgamierung von anderen Prozessen der Amalgamierung unterscheiden, die sekundär wirksam wurden. Als Indoeuropäer im 7. Jahrhundert v. Chr. begannen, in die iberische Halbinsel einzuwandern, waren sie bereits Träger einer materiellen Kultur (des Hallstatt-Typs), die für die formative Periode des Keltentums charakteristisch ist. Der anschließende Amalgamierungsprozeß zwischen der indoeuropäischen Kultur keltischer Prägung und der vorindoeuropäischen Kultur iberischer Prägung resultierte in der vorrömischen Symbiose der keltiberischen Kultur (Tovar 1977 b). Mit einem sekundären Amalgamierungsprozeß haben wir es möglicherweise im Fall der Kultursymbiose zwischen Pikten und Kelten im vorrömischen Schottland zu tun. Während das Piktische in der
769 älteren Forschung als inselkeltische Sprache klassifiziert wurde (Thurneysen 1909 ⫽ 1946, 3), geht man heute davon aus, daß die vorindoeuropäische Bevölkerung (Pikten) sprachlich und kulturell von den nach Norden vordringenden Inselkelten beeinflußt wurde (Jackson 1980, 151 f). 2.2.2. Inkorporation [A ⫹ B ⬎ A] oder [A ⫹ B ⬎ B] Bereits in der Antike waren die keltischen Regionalkulturen Fusionsprozessen ausgesetzt, die in einer teilweise vollständigen Inkorporation in dominante koterritoriale Kulturen resultierte. Die stärksten Auswirkungen in dieser Richtung gingen von der römischen Kultur (B) aus, deren Dominanz sich unter anderem in der sprachlichen Assimilation großer Teile der festlandkeltischen Bevölkerung (A) in Gallien, in Hispanien, in Rätien und im Rheintal ausdrückt. Der Romanismus ist während der Antike der wichtigste Inkorporationstrend ganz Westeuropas, d. h. nicht nur für die Kelten, sondern auch für die westlichen Germanen, die Proto-Basken, Iberer, Etrusker u. a. Allerdings waren die keltischen Regionalkulturen in Irland und im nördlichen England bis zur Spätantike noch nicht dem Assimilationsdruck des Romanismus ausgesetzt. Der römisch-lateinische Einfluß drückte sich an der Peripherie des Imperium Romanum als Kulturadstrat und -superstrat aus, ohne daß die Kelten ihre kulturelle Identität verloren. Im Verlauf des Mittelalters allerdings gerieten alle keltischen Gruppen in den Sog eines sich beständig verstärkenden Assimilationsdrucks koterritorialer Nachbarvölker. In den inselkeltischen Sprachgemeinschaften nahm die Dominanz des Englischen zu, bei den Bretonen verstärkte sich der Druck des Französischen. 2.2.3. Konglomeration [A ⫹ B ⬎ A ⫹ Ba] oder [A ⫹ B ⬎ Ab ⫹ B] In der Geschichte der Keltenkulturen findet sich für diesen speziellen Typ ethnischer Fusion lediglich ein klares Beispiel. Dies ist die Periode der irisch-lateinischen Kultursymbiose zwischen dem 5. und 8. Jahrhundert n. Chr., als die einheimische keltische Kultur Irlands (A) durch das Christentum römischlateinischer Tradition (B) entscheidend geprägt wurde. Die Entfaltung der Schriftkul-
770
VI. Keltisches, Germanisches und Slavisches Altertum
tur, das Kulturschaffen im frühmittelalterlichen Irland (Ab) und der Beitrag der irischen Mission für die zivilisatorische Entwicklung Mitteleuropas sind ohne die Adaptation der lateinisch-christlichen Kultur als konstitutives Element im Konglomerat der damaligen irischen Kultur nicht vorstellbar.
3.
Kulturelle Entwicklung und die Rolle ökologischer Variablen
3.1. Kultur entfaltet sich jeweils in Abhängigkeit von der Umwelt ihrer Träger, das heißt, die konstitutiven Elemente einer Kultur stehen in Wechselwirkung zu den Umweltfaktoren. Es ist bislang eine offene Frage, wie viele Umweltfaktoren eine Kultur beeinflussen und welche eventuell wichtiger sind als andere (doch vgl. Art. 27). Zumindest sind Vorschläge für eine Inventarisierung solcher Faktoren gemacht worden, die für die Ausformung jeder beliebigen Kultur von Belang sind (Haarmann 1986, 7⫺16). Zusätzlich zu den dort aufgeführten 35 Hauptvariablen sind eine Vielzahl spezieller Faktoren in Betracht zu ziehen, deren Wichtigkeit jeweils aus der Spezifik regionaler Bedingungen resultiert. Von fundamentaler Bedeutung ist die Bindung einer jeden Kultur an die Verhältnisse von Raum und Zeit. Die Geographie der Wohngebiete schafft spezifische Bedingungen für Siedlungskontinuität, Wirtschaftsformen, Interkommunikation und Handelsbeziehungen, Kontakte mit Nachbarkulturen usw. Die Einbindung einer Kultur in den Phasenablauf menschlicher Evolution bedingt ihren zivilisatorischen Entwicklungsstand, ihre relative evolutive Distanz zu zeitgenössischen Nachbarkulturen und die Möglichkeiten sozialer sowie technologischer Innovation. Was die Anwendung des Grundrasters ökologischer Variablen für das Studium der antiken Keltenkulturen betrifft, so gelten ähnliche Einschränkungen, wie sie für die Kenntnis des allgemeinen ethnischen Prozesses bereits angesprochen wurden. Da die damaligen Keltenkulturen lediglich aufgrund ihrer Artefakte, weniger zuverlässiger Schriftquellen, sprachverwandtschaftlicher Vergleiche und durch interpretative Versuche zur Sozialstruktur und Religion rekonstruiert werden können, entfallen dementsprechend Aussagen über Phänomene, die aus der Beobachtung realer Zustände gewonnen werden müssen. Dazu gehören Variablen wie das Maß an ethnischer Homogenität bzw. Hete-
rogenität in Gebieten mit keltischen Siedlungen, die soziale Stratifikation der Bevölkerung sowie der Anteil einzelner sozialer Gruppen am Kulturschaffen, Entwicklungstrends der oralen literarischen Tradition u. a. Ein Rekonstruktionsversuch der Keltenkulturen auf der Basis eines umfangreichen Variablenrepertoires wird wohl noch lange ein Desiderat bleiben. Im folgenden werden lediglich einige Grundvariablen diskutiert. 3.2. Die Siedlungsräume der Kelten waren in der Frühzeit andere als in der Spätantike. Die geographischen Verschiebungen in den keltischen Kulturarealen lassen sich allgemein durch Migrationsbewegungen erklären, als deren Folge sich in vielen Regionen eine Überschichtung älterer Siedlungen, Formen von Siedlungsmischung und Akkulturationserscheinungen einstellten. Die ältesten typisch keltischen Kulturformen findet man in einem Gebiet, das Teile Ostfrankreichs, der nördlichen Schweiz, Baden-Württembergs und Mainfrankens umschließt. Von diesem Kerngebiet aus, das sich nach archäologischen Erkenntnissen seit Ende des 8. Jahrhunderts v. Chr. von den Nachbarregionen abhebt, erweitert sich die Einflußsphäre keltischer Kultur nach Norden (bis nach Schottland und Irland), nach Westen (bis nach Nordwestfrankreich und Südwestspanien), nach Süden (bis in die Poebene) und nach Osten (bis nach Westungarn, an die Küste des Schwarzen Meeres und bis nach Kleinasien). Die größte Ausdehnung hatten die von Kelten besiedelten Gebiete im 4. und 3. Jahrhundert v. Chr. Es ist schon lange Tradition in der Keltistik, die Verbreitung keltischer Ortsnamen als Gradmesser für die Siedlungsdichte einerseits und als Indikator für die Kontinuität von Siedlungen andererseits aufzufassen. Über weite Teile Westeuropas findet man die fossilen Spuren keltischer Sprachreste, die in regionalen Ortsnamen erhalten sind. Zu den Elementen mit großer Häufigkeit gehören briga ‘Hügel’ (ir. brı´ ), dunum ‘Festung’ (ir. du´n), magos ‘Feld’ (ir. mag), nemeton ‘Heiligtum’ (ir. nemed), ritum ‘Furt’ (kymr. rhyd), seno- ‘alt’ (ir. sen), uindo- ‘weiß’ (ir. find) und andere. Am Beispiel der Verbreitung der Ortsnamen auf -dunum ergeben sich für Frankreich, die nördliche Schweiz und Südwestdeutschland die größte Dichte und längste Tradition keltischer Besiedlung (vgl. Karte 36.2).
771
36. Zeichenkonzeptionen im keltischen Altertum
왌 ⫽ antike Namen, ⫹ ⫽ mittelalterliche Namen, 쐌 ⫽ jüngere Namen Karte 36.2: Die Verbreitung keltischer Ortsnamen auf -dunum in Westeuropa (nach Rix 1954).
Die Migrationen der Kelten vom Kerngebiet aus hat man sich nicht als organisierte Fernwanderungen vorzustellen. Vielmehr kam es durch sukzessive Siedlungsschübe zur Ausdehnung des Kerngebietes. Der Transfer von Bestattungsformen der Urnenfelderkultur von Mitteleuropa nach Katalonien wird als Folgeerscheinung der ältesten Keltenmigration in die Pyrenäenhalbinsel gewertet, während Elemente der eisenzeitlichen Hallstatt-Kultur mit einem zweiten Migrationsschub keltischer Siedlung nach Südwesteuropa gelangten (Bosch-Gimpera 1940). Die Bewegung der Kelten von Süddeutschland aus über die Alpen in die norditalienische Tiefebene im 4. Jahrhundert v. Chr. scheint die einzige massive und gezielte Migration von Teilen der keltischen Bevölkerung gewesen zu sein (Vitali 1991). Die Gründe für diese Migration sind allerdings bis heute ungeklärt (Spindler 1991, 367). Für die keltischen Streusiedlungen in Anatolien, deren Bewohner von den Griechen Gala´tai (als Äquivalent zu Keltoı´ ) genannt wurden, gibt es nur einige vage Berichte antiker Autoren und wenige keltische Personennamen (Weisgerber 1931, Neumann 1980, 176 ff), allerdings keine eindeutigen archäologischen Beweise. Ein indirekter Hinweis auf die militärische Machtstellung der Galater ist
die historische Überlieferung, wonach sich die Pergamener im 2. Jahrhundert v. Chr. mit Erfolg den Tributforderungen der Kelten Kleinasiens widersetzten. In den mythologischen Bildszenen des Kampfes der Götter gegen die Giganten am großen Altar von Pergamon werden die Kämpfe gegen die Kelten metaphorisch ausgedeutet. Der Hinweis des heiligen Hieronymus aus dem 4. Jahrhundert n. Chr., wonach die Galater den gleichen Dialekt gesprochen hätten wie die Bewohner der Stadt Augusta Treverorum (Trier), ist umstritten (Greene 1964, 14). Immerhin besteht Einigkeit in der Beurteilung des historischen Sachverhalts, daß Kelten im 3. Jahrhundert v. Chr. bis nach Griechenland vorgedrungen sind. Es waren keltische Marodeure, die im Jahre 279 v. Chr. nur mit Mühe daran gehindert werden konnten, das Heiligtum von Delphi zu plündern. Die Migrationen richteten sich einerseits auf Gebiete, die entfernt vom damaligen griechisch-etruskisch-römischen Kulturkreis lagen, andererseits auf solche Regionen, die den mediterranen Hochkulturen benachbart waren. Ein gemeinsames Motiv für die Siedlungsbewegungen war vermutlich die Erschließung und kontinuierliche Ausweitung des keltischen Fernhandels. Die sukzessive Ausdehnung des keltischen Areals vom Kern-
772
VI. Keltisches, Germanisches und Slavisches Altertum
gebiet nach Westen (Spanien) und Nordwesten (britische Inseln) sowie nach Osten entlang des Donautals folgte ungefähr den Hauptrichtungen der intereuropäischen Handelsrouten, die bereits in der Bronzezeit von der vorkeltischen Bevölkerung benutzt wurden. Eine potentielle Motivation für die Südwanderung der Kelten nach Oberitalien kann man in der Attraktivität der etruskischen Zivilisation und ihrer materiellen Kulturgüter für die Kelten jenseits der Alpen suchen, die bereits seit dem 7. Jahrhundert v. Chr. Waren aus dem Süden importierten (Spindler 1991, 23 f). Obwohl sich die Zahl der vorrömischen Kulturimporte (d. h. etruskischer und durch Etrusker vermittelter Waren griechischer Herkunft aus der Magna Graecia in Süditalien) aus Italien erst in der La-Te`ne-B-Periode (seit 400 v. Chr.) häufen, bestanden diese Handelskontakte zur Keltike schon vorher. 3.3. Ein großes Problem ist die zeitliche Abgrenzung der keltischen Frühkultur von den vorkeltischen Kulturen. Versuche, die Eigenarten der keltischen materiellen Kultur bereits in archäologischen Strata zu suchen, die in Perioden vor dem 7. Jahrhundert v. Chr. zurückreichen, bleiben spekulativ. Zweifellos wurzelt das, was man später als „keltisch“ betrachtet, in den spätbronzezeitlichen Siedlungen der Urnenfelderkultur, deren Periodisie-
rung mit 1200⫺750 v. Chr. angesetzt werden kann und deren Traditionen sich im älteren Hallstatt-Kreis (750⫺600 v. Chr.) fortsetzen. Entscheidend für die Identifizierung der keltischen Frühkultur sind aber Innovationen, die die ältere Hallstatt-Kultur (Ha A⫺C) von ihrer jüngeren oder späten Phase (Ha D) trennen. Archäologische Leitformen, deren Auftreten die Entwicklungsstufe der jüngeren Hallstatt-Kultur einleiten, sind die allgemein verbreitete Fibel (als praktische Gewandschließe oder als Schmuck), die Häufung von Schwertbeigaben in keltischen Männergräbern und die auf die aristokratische Elite beschränkten Goldhalsreife der frühkeltischen Fürstengräber (Spindler 1991, 22 f, 32 f und Elue`re 1987, 106 f). Aus der Bündelung dieser Leitformen und anderer Chrarakteristika der materiellen Kultur seit der Zeit um 600 v. Chr. entsteht das Mosaik einer Kultur mit Merkmalen, wie sie von den antiken Autoren den Kelten (griech. Keltoı´, lat. Celti) zugeschrieben wurden und deren Verbreitung von der modernen Archäologie durch Grabungsfunde genauer lokalisiert worden ist (vgl. Tabelle 36.2). Aus der chronologischen Abfolge der Kulturschichten im keltischen Kerngebiet ergibt sich, daß die Ausprägung des keltischen Kulturtyps aufs engste mit den materiellen Kulturformen einer Gesellschaft assoziiert ist, für
Tab. 36.2: Die Chronologie der späten Hallstatt- und La-Te`ne-Kultur (nach Spindler 1991, 31) Dendro-Daten 727 v. Chr.
Kulturstufen
Importdatierung 750
Ha C
622 v. Chr.
Dauer 150 Jahre
600
607⫺596 v. Chr.
Ha D 1
wichtige Befunde Grubenhölzer Hallstatt Prächting
50⫺100 Jahre
Magdalenenberg
50⫺100 Jahre
Hochdorf
50⫺100 Jahre
Vix Kleinaspergle
550/500 Ha D 2 500/450 Ha D 3/Lt A 400 Lt B 250 v. Chr.
150 Jahre 250
Lt C
100 Jahre 150
Lt D
150 Jahre Chr. Geb.
Westlicher Hallstattkreis ⫽ Ha D Chronologische Einordnung bzw. Dauer einzelner Stationen
Heuneburg
36. Zeichenkonzeptionen im keltischen Altertum
die die Eisenverarbeitung von zentraler Bedeutung war. Die Verwendung von Eisengeräten war bereits charakteristisch für die ältere Hallstatt-Kultur (750⫺600 v. Chr.). Die Kelten setzen die früheisenzeitliche Tradition fort. Insofern ist die frühkeltische Kultur typisch eisenzeitlich, obwohl die Eisenverarbeitung selbst keine technologische Innovation der Kelten ist. Die Bedeutung des Eisens im Alltagsleben, und zwar im Handwerk (Geräte für den praktischen Gebrauch, Schmuck) sowie vorrangig im Kriegswesen (Waffenformen), spiegelt sich in der keltischen Mythologie. In keltischen Heiligtümern, insbesondere in Gallien und in Britannien, wurden Skulpturen von Kriegern in eisernen Rüstungen gefunden, die offensichtlich ebenso wie Eisenwaffen in Originalgröße oder in Miniaturnachahmung als Opfergaben für keltische Kriegsgottheiten dienten (vgl. Green 1992, 152 und 222 f). Die spezielle Funktion solcher Opfergaben war die von Votiven, d. h. von Gegenständen, die durch ihre Präsenz in der Kultstätte die Gottheit günstig stimmen und an den Spender erinnern sollten oder die den Dank des Spenders an die Gottheit für einen errungenen Sieg zum Ausdruck brachten (vgl. auch Art. 47 § 4.). Eiserne Waffen und Rüstungsteile wurden auch als Opfergaben an heiligen Wasserstellen versenkt (z. B. der Schild von Battersea und der Helm von Waterloo, die aus der Themse geborgen wurden). Caesar berichtet in De bello gallico (VI, 17), daß der Kriegsgott Mars bei den Galliern beliebt sei, was soviel bedeutet wie, daß die dortigen Kelten einen mit dem römischen Mars vergleichbaren Kriegsgott verehrten. Die ebenfalls von ihm hervorgehobene Sitte der Gallier, nach einem Kampf Eisenwaffen vor dem Sieger aufzuschichten (wie Vercingetorix vor Caesar), ist wohl als Verehrung des siegreichen Kriegsgottes durch den Unterlegenen zu interpretieren. 3.4. Bis vor kurzem war die Sozialstruktur der keltischen Gesellschaft der Antike lediglich in Bruchstücken bekannt. Bereits aus verschiedenen Berichten antiker Autoren (z. B. Polybios im 3. Jahrhundert v. Chr.) wußte man, daß die Kelten von einer aristokratischen Kriegerelite geführt wurden, deren Prestige sich offensichtlich nach ihren militärischen Erfolgen und dem Reichtum der Kriegsbeute bemaß. Die Gräber der aristokratischen Elite sind besonders in der Späthallstatt-Zeit und in der frühen La-Te`ne-Periode durch Goldschmuckbeigaben ausgezeich-
773 net (Elue`re 1987, 87 f). Von mythischer Bedeutung war die Erbeutung von Kriegsgefangenen, denen in einem rituellen Akt der Kopf mit einem Messer abgeschnitten wurde. Dies läßt sich aus der Exaktheit der Halswirbeltrennung schließen. Köpfe wurden in die Wände von Häusern oder Heiligtümern eingebaut, auf Gestelle in Wohnräumen montiert oder in Hausschreinen aufbewahrt (vgl. Abb. 36.1). Die Kopfjagd und die Sitte des
Abb. 36.1: Das Schädeltor des vorrömischen Heiligtums von Roquepertuse in der Provence (nach Green 1992, 117).
Kopfabschneidens des Feindes war ursächlich mit magischen Vorstellungen verbunden, wonach der Kopf eine Kraftquelle und ein Glücksbringer für seinen „zweiten“ Besitzer war. Anspielungen auf die talismanische Bedeutung finden sich in irischen und kymrischen Sagen. Der erbeutete Kopf fungierte somit als Kraftquelle und Statussymbol bei den Vertretern der Führungselite. Die keltische Kopfjagd wurde von den mediterranen Nachbarn als unverständliche, grausame Sitte beurteilt, und davon hat sich schon früh die Vorstellung von den Kelten als „blutrünstigen Barbaren“ abgeleitet. In ihren militärischen Planungen und Unternehmungen waren die Vertreter der Kriegerelite abhängig von den Priestern (Druiden), die wegen des Monopols ihres Augurenwesens eine gleichermaßen wichtige Rolle in der Hierarchie der
774
VI. Keltisches, Germanisches und Slavisches Altertum
keltischen Gesellschaft innehatten (zu den germanischen Tötungsritualen vgl. Art. 37 § 5.). Lange nahm man an, daß es außer diesen beiden Führungsgruppen nur noch die Schicht der unfreien Bauern gegeben hätte (so noch bei Kahrstedt 1938). Die Annahme einer solchen Sozialgliederung steht aber im Widerspruch zur Differenzierung der Kulturgüter und der Wirtschaftsformen, zur Verzweigung handwerklicher Tätigkeit sowie zur Organisation der ausgedehnten und intensiven Handelsbeziehungen der Kelten zu den mediterranen Kulturen. Die Kategorisierung archäologischer Funde aus keltischen Gräberfeldern hat in den vergangenen Jahrzehnten mehr Einblick in die Differenzierung der sozialen Gruppen vermittelt. Seit den sechziger Jahren verfügt die Archäologie über verschiedene Modelle zur vermuteten Sozialstruktur der keltischen Gesellschaft, die sich untereinander hauptsächlich durch die Untergliederungen der Hauptgruppen unterscheiden (vgl. Tab. 36.3). Auffällig ist, daß importierte Luxusgüter und Goldschmuck auf die Aristokratie beschränkt waren, während der Wagen ein Kennzeichen auch der freien Bauern war. Die unteren sozialen Gruppen lassen sich nach dem Gräberbefund nur anhand der Ausstattung ihrer Trachten differenzieren. Die Stellung der Frau in der keltischen Gesellschaft unterschied sich merklich von der in den meisten mediterranen Kulturen. Nach
dem archäologischen Befund zu schließen, wurden die Gräber vornehmer Frauen besonders reich ausgestattet. Beispiele dafür finden sich in der späten Hallstatt- und La-Te`neZeit (Spindler 1991, 102 ff). Hinweise auf die gesellschaftliche Gleichrangigkeit von Mann und Frau bei den Kelten gibt es in den Werken antiker Autoren, unter anderem bei Diodorus Siculus und Posidonius (beide 1. Jahrhundert v. Chr.; vgl. Tierney 1960). Der Einfluß aristokratischer Frauen ist historisch bezeugt durch die Erbfolgeansprüche der britannischen Fürstin Boadikea, die im 1. Jahrhundert n. Chr. eine Revolte der Kelten gegen die Römer anführte. Keltische Aristokratinnen hatten auch das Recht auf persönliches Eigentum und Erbe (Markale 1984, 39 f), obwohl dieses Prinzip im indoeuropäisch geprägten Eigentumsrecht der Kelten ansonsten eine Ausnahmeerscheinung ist. Besonders deutlich tritt in historischer Zeit die matrilineare Erbfolge hervor. Dies ist unter anderem an der Rolle des Bruders der Mutter und des Sohns der Schwester in den alten Rechtskodifikationen von Irland und Wales zu erkennen. „There can be no doubt that matrilineal succession was the immemorial rule with Celtic speaking peoples“ (Gimbutas 1989 b, 212). Der Grad an weiblicher Emanzipation in den Kreisen der keltischen Führungselite ähnelt den Verhältnissen, wie sie von der etruskischen Gesellschaft bekannt sind (Bonfante 1990, 369 f).
Tab. 36.3: Die soziale Struktur der frühkeltischen Gesellschaft (nach Spindler 1991, 358) Kahrstedt
Sangmeister
Zürn
1938
1964
1970
„große Herren“
„Adelsherren“
KilianDirlmeier 1974
Summe
Kennzeichen
„erste Garnitur“
1. erste Garnitur
Gold, Wagen, südl. Import
„zweite Garnitur“
2. zweite Garnitur
Gold, Wagen
3. freie Hofbauern
Wagen, Schwein
„privilegiert“
4. privilegierte Schicht
reichere Tracht
„untergeordnet“
5. untergeordnete Schicht
ärmere Tracht
6. Unfreie
beigabenlos
„freie Hofbauern“ „armselige Kätner“
„Hintersassen“
„arme, unfreie Leute“
„Gesinde“
36. Zeichenkonzeptionen im keltischen Altertum
3.5. Schriftlichkeit ist zwar eine soziale Institution bereits der älteren keltischen Festlandkultur, eine kontinuierliche, bis heute bestehende Schrifttradition setzt aber erst gegen Ende der Spätantike ein. Zur Schreibung des Festlandkeltischen wurden frühzeitig das etruskische Alphabet (lepontische und rätische Variante), das griechische Alphabet (Texte aus Marsilia), die iberische Schrift (keltiberische Texte) und später die Lateinschrift (hauptsächlich in Gallien) adaptiert (vgl. § 9.). Erst aus der Spätantike ist ein einheimisches keltisches Schriftsystem überliefert, die in Inschriften seit dem 4. Jahrhundert überlieferte Oghamschrift. Heutzutage ist Schriftlichkeit ein kulturelles Spezifikum fast aller europäischen Sprachgemeinschaften. Von wenigen Sprachen wie dem Livischen, Vepsischen, Ingrischen oder dem kürzlich ausgestorbenen Votisch abgesehen, haben alle Sprachgemeinschaften Europas einen nationalen Schriftstandard ausgebildet. Verschriftet wurden alle nachantiken keltischen Sprachen, einschließlich des Manx-Gälischen, das heute lediglich als Zweit- und Fremdsprache, nicht aber als Muttersprache weiterlebt (Stephens 1976, 103). Die neuzeitlichen Verhältnisse einer durch die Schulausbildung vermittelten Kenntnis der nationalen Schriftsprache unterscheiden sich wesentlich von den Bedingungen der skribalen Gesellschaft der Antike, als Schriftlichkeit ein Kriterium einiger weniger Sprachen Europas war und gleichzeitig auf elitäre Kreise einer professionellen und gebildeten Schicht beschränkt blieb. Die Bedingungen der Entfaltung keltischer Schriftsprachen waren jeweils regionalspezifisch. Dies betrifft ebenfalls die Entwicklung des Schrifttums, das außer durch europäische Trends durch unverwechselbare regionale Innovationen charakterisiert ist. Schließlich sind die Bedingungen, unter denen die Schriftsprachen koterritorial-dominanter Kulturen adaptiert worden sind, jeweils regionalspezifisch (irisch-englische literarische Zweisprachigkeit, bretonisch-französische Schriftsprachenkontakte usw.).
4.
Kulturelle Konvergenzen in der Keltike und das Problem der Ethnogenese
4.1. „The question ‘Who were the Celts?’, for all its apparent, indeed deceptive, simplicity has turned out to be a rather complicated
775 one“ (Renfrew 1987, 237). Die Beantwortung dieser Frage hängt dabei ursächlich mit einer Stellungnahme zu dem Problem zusammen, von welchem prähistorischen Zeitpunkt es überhaupt möglich und sinnvoll ist, von Kelten als einer ethnischen Kollektivität zu sprechen. Die im vorhergehenden Abschnitt vermittelten Daten zur Einbindung der keltischen Kulturen in Raum und Zeit vermitteln bereits eine Vorstellung von der Komplexität dieses Problems. Die Berichte der antiken Autoren (angefangen mit Hekataios aus Milet Ende des 6. Jahrhunderts v. Chr., Herodot, Avienus, Posidonius, Diodorus Siculus, Ammianus Marcellinus, Caesar, Tacitus, Strabo, Dio Cassius) über die Kelten sind für die Frage nach deren Ethnogenese unergiebig (Dobesch 1991). Bereits Herodot (5. Jahrhundert v. Chr.) berichtet allerdings von einem einheitlichen barbarischen Volk, das jenseits der Alpen lebte. Die Einheitlichkeit von Lebensweise und Sprache wird auch in späteren Quellen betont. Die archäologischen Funde bestätigen die antiken Vorstellungen von den Kelten als einer selbständigen Kulturgemeinschaft, die schon seit den frühesten Kontakten mit den Griechen bestand. Da der Beginn der eindeutig als keltisch identifizierbaren Westhallstatt-Kultur im ausgehenden 7. Jahrhundert v. Chr. anzusetzen ist, muß die Periode der Ethnogenese lange davor begonnen haben. Vieles spricht dafür, daß die Ethnogenese der Kelten ein langwieriger Prozeß war, der sich vielleicht sogar mit der Zeit der Verbreitung des Ackerbaus nach Nordeuropa assoziieren läßt. Die Anfänge dieser Wirtschaftsform liegen in Südosteuropa in der Mitte des 7. Jahrtausends v. Chr., im Norden der britischen Inseln um etwa 3500 v. Chr. (Renfrew 1987, 148 f). Danach wären die Kelten die Nachkommen von Generationen, die seit dem 4. Jahrtausend v. Chr. in Mittel- und Nordeuropa Ackerbau betrieben haben (Burgess 1974, 196 f). Nach Schmidt (1979, 190 f) entstammt das Keltentum einer Fusion von Elementen der bronzezeitlichen Hügelgräberkultur (1550⫺1250 v. Chr.) mit solchen der Urnenfelderkultur (13. Jahrhundert v. Chr.). Der für die britischen Inseln archäologisch bezeugte Gebrauch von Eisen (seit etwa 600 v. Chr.) und die sukzessiven Migrationen vom Festland seit dem 6. Jahrhundert v. Chr. sind daher nicht als der Beginn der Keltenkulturen dort aufzufassen, sondern als Verfestigung und Spezialisierung bereits bestehender
776 Kulturmuster der Inselbevölkerung (Hutton 1991, 139 ff). Zieht man derart lange Zeiträume für die Ethnogenese der Kelten in Betracht, wird man zwangsläufig mit der Frage der Ausbreitung der Indoeuropäer in Europa konfrontiert. In der Kontroverse der letzten Jahre über diesen strittigen Problemkomplex haben sich zwei Standorte herauskristallisiert, deren Perspektiven unvereinbar sind. Renfrew (1987) hat neuerlich die These vertreten, daß die Besiedlung Europas durch Indoeuropäer sehr alt ist, wobei sich die Ausbreitung in Raum und Zeit in etwa mit der Verbreitung des Ackerbaus deckt. Demzufolge wäre die Ethnogenese der Kelten ein intern-indoeuropäischer Prozeß. Der Kurgan-Theorie von Gimbutas (1970, 1973) zufolge wanderten die Indoeuropäer relativ spät, und zwar um 3500 v. Chr., aus den Gebieten nördlich des Schwarzen Meeres nach Süd- und Mitteleuropa ein. Demnach wären die frühen Ackerbauer Europas keine Indoeuropäer gewesen, und für die Ausbildung der frühkeltischen Kultur stellt sich die Frage nach einer Beteiligung vorindoeuropäischer Elemente. Diese neuere Diskussion über die Fragestellung nach der Siedlungskontinuität in Europa hat verdeutlicht, daß eine Antwort darauf nur dann sinnvoll ist, wenn sie sich nicht ausschließlich mit archäologischen Fakten begnügt und sich auch nicht allein auf sprachliche Rekonstruktionen verläßt. Renfrews Indoeuropäerthese krankt daran, daß in ihr das vorindoeuropäische sprachliche Substrat, angefangen von den vorgriechisch-ägäischen Lehnwörtern des Altgriechischen bis hin zum iberischen Bestandteil des baskischen Wortschatzes, keine Berücksichtigung findet. Auch von den sprachtypologischen Residuen Alteuropas in den keltischen Sprachen ist bei Renfrew keine Rede (s. u.). Ebensowenig werden von ihm die zahlreichen nichtindoeuropäischen Wesenszüge in der Mythologie, Religion und in der dekorativen Kunst der antiken Völker Europas, unter anderem bei den Kelten, in Betracht gezogen. Obwohl sich eine Aussage zu den ethnischen Prozessen vom ausgehenden Neolithikum bis in die frühe Bronzezeit nur auf Indizien, nicht aber auf eine direkte Beweisführung stützen kann, verdichtet sich die Argumentation trotzdem durch die Beachtung interdisziplinärer Forschungsergebnisse. Die vergleichende Interpretation verfügbarer archäologischer, linguistischer, sozioökonomischer und kunsthistorischer Daten vermittelt das Bild eines umfassenden
VI. Keltisches, Germanisches und Slavisches Altertum
Kulturwandels in Europa, der die Infiltration der Indoeuropäer in alteuropäische Siedlungsräume widerspiegelt. 4.2. Die Periode des großen europäischen Kulturwandels setzt um die Mitte des 4. Jahrtausends v. Chr. ein, als Indoeuropäer von Osten her nach Südosteuropa einwandern und die vorindoeuropäische Kultur überlagern. Der Prozeß der Indoeuropäisierung zieht sich bis ins 3. Jahrtausend v. Chr. hin. Gimbutas (1974) kennzeichnet die vorindoeuropäischen Kulturschichten als „alteuropäisch“ („Old European“). Die wichtigste Wirtschaftsform der Alteuropäer war der von Anatolien übernommene Ackerbau, an dessen Verbreitung in Europa die Indoeuropäer also keinen Anteil hatten. Zu den Besonderheiten der sozialen Strukturen jener Zeit gehörte eine hierarchisch gegliederte matrifokale Gesellschaft und eine Priesterelite. Dadurch und durch die Zentriertheit der religiösen Vorstellungen im Kult einer dominanten weiblichen Gottheit unterscheidet sich die Kultur Alteuropas prägnant von der patriarchalischen Gesellschaftsform und dem von männlichen Gottheiten dominierten Götterpantheon der Indoeuropäer. Die Kulturmuster Alteuropas in den Regionen an der unteren Donau und auf dem Balkan haben sich bereits im Verlauf des 6. Jahrtausends v. Chr. zum Mosaik einer Hochkultur verdichtet (vgl. Art. 32 § 3.). Anhand der neueren dendrochronologischen Datierung, womit ältere unzuverlässige Radiokarbondaten kalibriert wurden, stellte man das hohe Alter dieser ältesten Zivilisation der Welt fest (Gimbutas 1991, 436 ff nach dem neuesten Stand), die somit wenigstens zweitausend Jahre älter ist als die elamische und sumerische in Mesopotamien. Kennzeichen der alteuropäischen Zivilisation waren städtische Siedlungen, Ackerbau, eine hierarchische Gliederung der Gesellschaft, ein differenziertes und spezialisiertes Handwerkswesen, die Bearbeitung von Metall (Kupfer und Gold), ein ausgeprägter Ahnenkult, religiöser Symbolismus in Verbindung mit der Verehrung einer weiblichen Hauptgottheit und der Gebrauch von Schrift (vgl. Haarmann 1992 b zur Tradition der Schriftlichkeit in Alteuropa). Ihre Blütezeit erlebte diese Zivilisation im 5. Jahrtausend v. Chr. Der älteste Goldschatz der Welt, der in einem Gräberfeld bei Varna gefunden wurde, stammt aus jener Periode (und zwar zwischen 4500 und 4400 v. Chr.; vgl. Gimbutas 1991, 119 f).
36. Zeichenkonzeptionen im keltischen Altertum
Von den Irradiationszentren der alteuropäischen Zivilisation in Südosteuropa (Vincˇa in Serbien, Tartaria und Turdas¸ in Transsilvanien, Karanovo in Bulgarien, u. a.) strahlte deren kultureller Einfluß nach Süden (bis Süditalien und Malta) und Westen (Ungarn und Süddeutschland) aus. Der Gebrauch der alteuropäischen Sakralschrift blieb auf das Kernland beschränkt. Diese zivilisatorische Innovation gelangte erst im 3. Jahrtausend v. Chr. nach Süden, in die Ägäis. Die Rekonstruktion des Repertoires der dekorativen Kunst der Megalithkultur und der Religion ihrer Träger legt die Vermutung nahe, daß diese für Westeuropa so wichtige Kulturstufe, jedenfalls in ihrer Spätphase (4. und 3. Jahrtausend v. Chr.), unter dem Einfluß der alteuropäischen Kultur gestanden hat (Mohen 1989, 216 ff), falls sie nicht sogar als eine ihrer regionalen Varianten aufzufassen ist (Gimbutas 1991, 185 ff). Eine späte Nachblüte erlebten alteuropäische Kulturtraditionen (u. a. Schriftlichkeit, religiöse Symbolik und ornamentale Motive in der dekorativen Kunst) in der Altägäis, insbesondere im minoischen Kreta (Haarmann 1992 b). Die kulturellen Umwälzungen in Südosteuropa, die durch die Migrationen der Indoeuropäer in drei Hauptwellen (Kurgan-IWanderung zwischen 4400 und 4300 v. Chr., Kurgan-II-Wanderung zwischen 3500 und 3400 v. Chr., Kurgan-III-Wanderung um 3000 v. Chr.) von Osten her ausgelöst wurden, erfaßten das Areal der späteren Keltike erst im 3. Jahrtausend v. Chr. Ausgelöst durch den indoeuropäischen Siedlungsschub aus dem Osten, und insbesondere als Folge der Kurgan-III-Wanderung, verlagerten sich die alteuropäischen Siedlungszentren nach Westen. In den materiellen Hinterlassenschaften der Badener Kultur Süddeutschlands (auch „Vucˇedol-Kultur“ nach einem ihrer Hauptfundorte in Ostkroatien genannt) sind alteuropäische Gefäßformen und Dekor (Vogelkopfvasen, glasierte Keramik, V-Ornament, Netzmuster) erhalten. Gleichzeitig manifestiert sich bereits indoeuropäischer Einfluß (Sonnensymbol auf Bechern, Zickzakkornamente, Wagenmodelle). Die Glockenbecherkultur, deren Ursprungsgebiet wahrscheinlich in Südungarn, Österreich und Kroatien zu suchen ist, reflektiert ebenfalls die Hybridisierung des alteuropäischen Repertoires von Gefäßformen und Ornamenten durch indoeuropäische Innovationen (Gimbutas 1991, 390 ff). Im Verlauf des 3. Jahrtausends v. Chr. beeinflußt die
777 Glockenbecherkultur die Gebiete im Westen. Dies beruht einerseits auf der Vermittlung von Waren und Ideen in Richtung Westeuropa, andererseits auf Migrationsbewegungen in diese Räume. Die Verbreitung der für diese Kultur namengebenden Leitform weist die gleichen Zielgebiete aus, in die später Kelten von Mitteleuropa aus eingewandert sind (Spanien, Frankreich und die britischen Inseln). Träger der Glockenbecherkultur wanderten zwischen 2500 und 2000 v. Chr. in sukzessiven Wellen vom Kontinent auf die britischen Inseln, wo ihre Traditionen die ältere Kulturschicht der einheimischen Megalithkultur (u. a. Steinkreis von Stonehenge, Monumentalbauten in Irland) überlagerten (Hutton 1991, 88 ff). Eine mythische Erinnerung an eine vorkeltische Bevölkerung auf den britischen Inseln findet man in irischen Sagen. Beispielsweise ist im Book of Invasions, dessen Text im 12. Jahrhundert aufgezeichnet wurde, sich aber inhaltlich auf viel ältere mündliche Überlieferungen stützt, von Invasionen des Inselarchipels die Rede (Green 1992, 216). Die letzte Gruppe waren die „Tuatha De´ Danann“ (‘die Leute der Göttin Danu’), die Irland vor den Gälen, den ‘Söhnen des Mil’, bewohnt haben sollen. Die Tuatha De´ galten als Beherrscher magischer Künste und als Bewahrer druidischen Wissens. Bei ihrer Landnahme sollen sie der Sage nach die Hilfe von vier mächtigen Talismanen in Anspruch genommen haben, dem Stein von Fa´l, dem Speer von Lugh, dem Schwert von Nuadu und dem Kessel von Daghda. Diese mythischen Bezüge auf eine vorkeltische Bevölkerung sind wegen der Anspielung auf die Nachkommenschaft einer Göttin (Danu) von Interesse, während die Gälen zu einer männlichen Gottheit in Beziehung gesetzt werden. 4.3. Wenn man die Ethnogenese der Kelten mit der Tradition der agrarischen Gesellschaft des 4. und 3. Jahrtausends v. Chr. assoziiert, steht dieser ethnische Prozeß räumlich und zeitlich im Zusammenhang mit den Transformationen der vorindoeuropäischen Kulturen Westeuropas und deren Indoeuropäisierung während der Bronzezeit. Es gibt in den antiken Keltenkulturen vielerlei Spuren dieses gemischt-ethnischen Prozesses, als dessen Dominante sich mit fortschreitender Entwicklung das indoeuropäische Element erwiesen hat. Die Hybridisierung alteuropäischer und indoeuropäischer Elemente manifestiert sich dabei nicht allein in konkreten
778 Ausdrucksformen (z. B. im alteuropäischen Spiralmotiv anstelle des indoeuropäischen Radmotivs im Dekor keltischer Schmuckstücke), sondern auch in den sozialen Strukturen der frühkeltischen Gemeinschaft und ihrer Mythologie. In bemerkenswerter Abweichung von indoeuropäisch-patriarchalischen Traditionen stellt sich die Beachtung der Weiblichkeit in der keltischen Kultur dar. Dies drückt sich sowohl in matrifokalen Zügen der keltischen Gesellschaft als auch in vielen Bereichen der Mythologie aus. Der Versuch von Graves (1948), die „Urreligion“ der Kelten zu erschließen und auf den Kult einer dominanten dreifaltigen Göttin zu reduzieren, hat sich als schriftstellerisches Konstrukt erwiesen. Ebensowenig überzeugend sind Versuche, auf der Basis von Graves’ Hypothese auf die Existenz eines keltischen Matriarchats zu schließen. Solche Argumentationen kranken an ihrem Ausschließlichkeitsanspruch. Dennoch steckt in ihrem Kern die wichtige Beobachtung von der besonderen sozialen Stellung der Frau bei den Kelten. Die keltische Gesellschaft der Frühzeit trägt matrilineale Züge, was auch die antiken Autoren hervorheben. Matrilinealität ist zweifellos ein Erbe der alteuropäischen Zivilisation, und sie findet ihren symbolischen Ausdruck in der keltischen Mythologie. So ist beispielsweise in der mythischen Erzählung von Culhwch und Olwen aus Wales (datiert um 1100 und überliefert in dem Zyklus der Mabinogion genannten Prosaerzählungen aus dem 14. Jahrhundert) von Modron, der göttlichen Mutter, und ihrem Sohn Mabon die Rede. Die Abstammung von der weiblichen Linie wird hier in den Vordergrund gestellt, während Mabons Vater gar nicht erwähnt ist. Die matrilineale Komponente steht in auffälligem Kontrast zur Institution der keltischen Kriegerelite, einem Element der indoeuropäischen hierarchischen Tradition. In der vorchristlichen keltischen Mythologie findet man auch die sublime und für patriarchalisch organisierte Gesellschaften ganz ungewöhnliche Assoziation einer weiblichen Gottheit mit dem Kriegswesen. An der Peripherie der Keltike haben sich derartige Vorstellungen besonders lange gehalten. „In the heroic society of Ireland, as portrayed in the mythological tradition, most of the prominent war-deities were female: thus we have the Morrigan, Macha, Nemhain, the Badbh and Medb, all of whom combined the attributes of fertility/sexuality and pugnacity“ (Green 1992, 223).
VI. Keltisches, Germanisches und Slavisches Altertum
In der gesamten Keltike wird der grundlegende Lebenszyklus von Leben, Tod und Wiedergeburt mit weiblichen Muttergottheiten in Verbindung gebracht. Hier sind sowohl die Zentriertheit auf den Kult der Lebensspenderin als auch die Vorstellung vom Lebenszyklus als Naturkreislauf vorindoeuropäische Elemente. Auf die Dreifaltigkeit des Lebenszyklus spielt die sakrale Kunst und Mythologie in verschiedener Weise an. Das in Dreiergruppen auftretende Spiralsymbol an dem Megalithbau von Newgrange in Irland, der Ende des 4. Jahrtausends v. Chr. gebaut wurde und wohl nicht nur als Kammergrab, sondern auch als Heiligtum für den Ahnenkult diente, kann als Vorläufer der späteren keltischen Tradition gewertet werden. Die von den Kelten besonders verehrten Muttergottheiten treten in der romano-keltischen Kunst häufig in Dreiergruppen auf (Green 1992, 155). Dies gilt für die Matres Domesticae der Kelten im römischen Britannien (z. B. im Heiligtum von Chichester) ebenso wie für die Matronae Aufaniae der keltisch-germanischen Siedlungsgemeinschaft im Rheinland (z. B. im Heiligtum von Bonn). In den Dreiergruppen werden den einzelnen Göttinnenskulpturen spezifische Attribute zugeordnet, die auf diese Weise in einer Dreierkombination auftreten (z. B. Schlange, Früchte und Lebensbaum). Die Rolle der Muttergöttin wird in den Skulpturen dadurch unterstrichen, daß sie mit einem Säugling im Arm dargestellt wird. Die vorchristliche Rolle der irisch-schottischen Göttin Brigit wird in der Nachantike umgedeutet, und die keltischen Christen fassen sie als Amme von Jesus auf. Auf den 1. Februar fällt das Imbolc-Fest, an dem Milch auf die Erde geschüttet wurde, als Symbol der Fruchtbarkeit und des Lebens(wieder)beginns (Gimbutas 1989 a, 110 f). Die weiblichen Gottheiten zeichnen sich durch Attribute und assoziierte Symbole aus, die den chtonischen Charakter ihrer Funktionen unterstreichen. Die Vorstellungen der Kelten von der Göttin als Lebensspenderin, als Gebärerin und Mutter, als Hüterin der irdischen und menschlichen Fruchtbarkeit, als Todesgöttin und als Erneuerin des Lebens verbinden sich mit Naturphänomenen wie Wasser (z. B. Regen, Quelle, Flußlauf) oder landschaftlichen Merkmalen (z. B. Erde, Hain, Berg), mit Pflanzen (z. B. Eiche, immergrüne Nadelhölzer, Mistel/mistletoe) und Tieren (z. B. Schlange, Schwein, Ziege). Komplex ist der Symbolgehalt solcher Attribute, die sich
36. Zeichenkonzeptionen im keltischen Altertum
mit mehreren der genannten Bereiche assoziieren, wie beispielsweise Wasservögel (Ente oder Gans). Zum Kreis der religiösen Symbole gehört unter anderem das Motiv der Doppelaxt, das in Anlehnung an die Form eines Schmetterlings dessen Metamorphose symbolisiert und damit als Symbol für Wiedergeburt steht. Das Doppelaxtmotiv, das aus Alteuropa und Kreta bekannt ist, findet sich bei den Kelten ausschließlich in Miniaturform. Abweichend vom alteuropäischen Symbolgehalt steht das Doppelaxtmotiv bei den Kelten vermutlich in Bezug zur Astralsymbolik der Sonne. Kleine Modelläxte, nämlich solche, die nicht an Kultstätten gefunden wurden, dienten vielleicht als Talismane. Andere abstrakte Symbole sind das Hakenkreuz und das einfache Kreuz, Motive, die ebenfalls zum alteuropäischen Repertoire gehören. Die Kreuzmotive in der keltischen religiösen Ornamentik stehen wohl ebenfalls in Beziehung zur astralen Symbolik (insbesondere zur Sonnensymbolik; vgl. Green 1992, 68 f). Verschiedene sakrale Attribute, die in der Tradition Alteuropas getrennt fungieren, werden in der keltischen Mythologie symbiotisch verknüpft. Ein typisch keltisches Motiv ist die Schlange mit Widderhörnern. Ursprünglich ist dabei von zwei alteuropäischen Sakralsymbolen auszugehen, von der Schlange und vom Widder als heiligem Tier (Gimbutas 1989 a, 75 ff und 121 ff). Der Widder ist ebenso wie der Stier als Symbol des männlichen Parts im Fruchtbarkeitskult zu verstehen. Die widdergehörnte Schlange ist somit ein komplexes Symbol, das aus einer sekundären Kombination von Originalsymbolen resultiert. Die Kultplätze, wo Göttinnen verehrt wurden, bezeugen ebenfalls die chtonischen Assoziationen. Man findet sie in Hainen, an Flußauen und Seeufern (vgl. Art. 47 § 2.1.). Der Name der keltischen Wassergöttin ist in römischer Zeit bei den Inselkelten als Cov(v)entina überliefert (vgl. Abb. 36.2). Die Beziehung weiblicher Gottheiten zum Wasser drückt sich bei den Kelten in vielfacher Weise aus. Die weiblichen Namen der Flüsse in der Keltike sind ein sprachlicher Ausdruck dieser innigen Verbindung. Auf dem Festland sind die keltischen Namenformen von Flüssen bis in die Moderne mit ihrem femininen Geschlecht überliefert wie im Fall der Isar in Süddeutschland oder der Seine in Frankreich. Die Schutzherrin der Seine war die Göttin Sequana, die auch als Krankenheilerin verehrt wurde. Auf den britischen Inseln
779
Abb. 36.2: Die keltische Wassergöttin Covventina auf einer Weihtafel aus dem Quellheiligtum in Carrowburgh (nach Dillon und Chadwick 1966, 431).
häufen sich die weiblichen Flußnamen. „For instance, the various Avons are called after Abnoba, goddess of the sources of the Danube. The Irish rivers, the Liffey and the Shannon, took their names from the goddesses Life and Sinnann. The Goddess Brigit gave her name to the rivers Brigit, Braint, and Brent in Ireland, Wales, and England respectively“ (Condren 1989, 26 f). Typisch keltische Kultplätze sind Quellheiligtümer. Solche hat man im Quellgebiet der Seine, des Rheins und anderer Flüsse gefunden. Angesichts der Kombination von Eigenschaften wie Fruchtbarkeit, Sexualität und kriegerischem Gebaren in der Gestalt keltischer Göttinnen verwundert es nicht, daß Waffen als Opfergaben an Flußauen oder Seeufern versenkt wurden, also an heiligen Plätzen weiblicher Gottheiten. Der Fundort La Te`ne am See von Neuchaˆtel, nach dem die Hauptperiode der keltischen Kultur benannt worden ist, war nicht nur ein wichtiger Sied-
780 lungsplatz, sondern es gab dort auch ein bedeutendes Heiligtum. An einer Stelle am Ufer des Sees wurden Reste von hölzernen Stegen und Plattformen gefunden, im Wasser zahlreiche Votivgaben. Darunter waren viele Metallgeräte, Schmuckstücke, aber auch Eisenwaffen. Die matrilineale Komponente der keltischen Gesellschaftsstruktur und die Rolle weiblicher Gottheiten, die in der mythisch-religiösen Tradition bis in die Nachantike besondere Aufmerksamkeit genießen, stehen nicht in Opposition zu den Eigenschaften des indoeuropäisch-patriarchalischen Erbes, sondern fügen sich zu einem kulturellen Gesamtspektrum. Insofern kann man beispielsweise vom funktionellen Standpunkt aus nicht von einer Dialektik der Sakralmotive sprechen. Vielmehr treten Symbole alteuropäischer Herkunft (z. B. Spirale, Hakenkreuz oder Quelle) in zwangloser Verbindung mit solchen indoeuropäischer Prägung auf (z. B. Sonnensymbol, Waffenmodelle als Votivgaben, Donner). In der keltischen Mythologie und in der ornamentalen Kunst verbinden sich beide kulturhistorischen Trends, ohne Widersprüche hervorzurufen. Durch die Wechselbeziehungen von typisch chtonischen Elementen, die hauptsächlich mit weiblichen Gottheiten assoziiert sind, und astraler Symbolik, die vom indoeuropäischen Götterpantheon geprägt ist, stellt sich die mythische Tradition der Kelten vielschichtiger dar als in solchen Kulturkreisen, wo diese mit einer homogenen Ethnogenese verknüpft ist. Das Unverwechselbare an der keltischen Kultur ist gerade, daß man die alteuropäischen Elemente zwar nach ihrer Herkunft von den indoeuropäischen unterscheiden kann, auf funktionaler Ebene ist die Kultursymbolik der Kelten aber nicht teilbar. 4.4. Die keltischen Sprachen besitzen, wie andere indoeuropäische Sprachen, eine Reihe lautlicher, grammatischer und lexikalischer Charakteristika, die man als typisch indoeuropäisch ansieht. Darüber hinaus aber manifestieren sich im Keltischen grammatische Strukturen, die vom Typ der indoeuropäischen Grundsprache abweichen und die sich als sekundäre Innovationen herausgebildet haben. Hierzu gehört die Architektur des Verbsystems, die man als polysynthetisch charakterisieren kann. Im keltischen Verbalkomplex findet man folgende Elemente: Präverbien (obligatorische Personalpronomen), Personalendungen, pronominale Objekte in
VI. Keltisches, Germanisches und Slavisches Altertum
Form von Infixen oder Suffixen, Adverbien (in Form von Präfixen) und Partikeln (wie etwa Demonstrativpronomen als emphatische Elemente); z. B. ir. mosriccubsa ‘ich werde bald kommen’ (sa ⫽ emphatische Partikel), ro-m-gab ‘er hat mich genommen’ (-m⫽ infigiertes Objektpronomen). Bezieht man zusätzlich den nominalen Charakter der keltischen Verbkonstruktionen in die Betrachtung ein (z. B. kymr. y mae a ferch yn casglu blodau ‘das Mädchen pflückt Blumen’, wörtl. ‘es ist das Mädchen im Pflücken Blumen’), deren Prinzip sich ebenfalls in der englischen Progressivform und in nominalen Ausdrucksweisen vom Typ I am cold ‘ich friere’ oder he is seated ‘er sitzt’ manifestiert, fügen sich die Beobachtungen über typologische Konvergenzen zum Bild eines britischen Sprachbundes (Haarmann 1976, 117 ff). Die polysynthetische Technik des keltischen Verbs findet nach Wagner (1959, 152 ff) ihre Parallele in der Verbalsyntax des Französischen (vgl. die Stellung des Präverbs und der Objektpronomen in il me l’a dit ‘er hat es mir gesagt’), im Baskischen sowie im Berberischen. Bei den Konvergenzen handelt es sich um Sprachtechniken, „welche die Wortstellung, den gruppenflektierenden Charakter des Verbums (in- und suffigierte Objekte, Lokaladverbien, Relativpartikeln), das Wesen der Copula, der Verbalpraefixe (funktionelle, verbale Praefixe im Gegensatz zu den idg. semantischen Praefixen) und des Relativsatzes betreffen“ (Wagner 1959, 181 f). Auf diese Weise erweitert sich der britische Sprachbund zum Konstrukt eines eurafrikanischen Arealtyps (Haarmann 1976, 135 ff), der Sprachtechniken eines älteren westeuropäischen Sprachtyps adaptiert hat. „Eine europäischindogermanische Sprache hat in Westeuropa den dort altheimischen, den westeuropäischen Typus erworben und weiter entwickelt; aber daneben und durch diese beiden Gruppen von Sprachzügen, die europäisch-indogermanischen und die westeuropäischen, drängen sich hindurch und verschränken sich mit ihnen Züge noch älterer und entfernterer strukturaler Typik“ (Lewy 1942, 41). Sehr wahrscheinlich sind die vom Indoeuropäischen abweichenden Sprachtechniken ein Residuum der Sprache(n) der Alteuropäer, die sich später assimilierte(n). Immerhin wird ein altes westeuropäisches Substrat auch in der Indoeuropäerthese von Renfrew (1987, 242 f) nicht ausgeschlossen. Zusätzlich zu den sprachtypologischen Residuen sind lexikalische Elemente aus vorkel-
36. Zeichenkonzeptionen im keltischen Altertum
tischer Zeit erhalten geblieben. Hierbei handelt es sich um Ausdrücke verschiedener Bezeichnungsbereiche, die zumeist isolierte Streuwörter sind, also nicht um konstitutive Elemente kompletter Wortfelder. Als Beispiele seien die folgenden vorkeltischen Substratwörter erwähnt: *calmis im gallischen Keltisch, das vom Sprechlatein adaptiert wurde und im Französischen als chaume ‘Hochplateau ohne Vegetation’ erhalten ist (zumeist in Ortsnamen), *pauta ‘Pfote’, *pottus ‘Topf’ (vgl. Müller und Frings 1968, 111, 371 und 531 f).
5.
Zeichenkonzeptionen im keltischen Makrokosmos: Ritualsymbolik und Ikonographie
5.1. Der mit der keltischen Kultur assoziierte Makrokosmos gliederte sich ähnlich wie in anderen antiken Kulturen, die Bedingungen der Semiose zwischen dem Menschen und den Elementen des Makrokosmos waren jedoch bei den Kelten andere als etwa im germanischen (siehe Art. 37), im slavischen (siehe Art. 38) oder im griechisch-römischen (siehe Art. 39⫺60) Kulturkreis (vgl. Kruta 1991b). Ähnlichkeiten zwischen den keltischen und beispielsweise römischen Vorstellungen vom Makrokosmos betreffen im wesentlichen die äußere Strukturierung der Welt in eine diesseitige und in eine jenseitige Sphäre, wobei die jenseitige wiederum untergliedert ist in eine überirdische, die von Göttern und Geistern bevölkert ist, und in eine unterirdische, das Reich der Toten. Die symbolische Bedeutung der Bereiche des Makrokosmos und seiner Elemente für die Menschen ist aber bei den Kelten der Antike spezifisch für ihre Kultur. Eine wichtige Grundorientierung der Menschen im Makrokosmos waren die Himmelsrichtungen, die jeweils als Omina gedeutet wurden. Die Seite des Sonnenaufgangs (Osten) war die wichtigste und gleichzeitig glückverheißende. Links davon lag die Welt der Dämonen, der unglückbringende Norden. Der Süden symbolisierte mit seiner Lichtfülle die Essenz des Lebens, und der Westen wurde als Symbol der dunklen, unterirdischen Mächte gedeutet (Markale 1988, 180 f). 5.2. Ein wesentliches Element der Verbindung zwischen dem Diesseits mit seiner konkret erfahrbaren Umwelt und dem Jenseits mit seinen transzendentalen Kräften war die
781 Vorstellung von der Seelenwanderung, die bei keinem anderen Volk der europäischen Antike in so ausgeprägter Form in Erscheinung tritt wie bei den Kelten (zu verwandten Vorstellungen in nichteuropäischen Kulturen vgl. Art. 32 § 5.2., Art. 94 § 2., Art 95 § 3. und Art. 99 § 7.). Das Prinzip der keltischen Seelenwanderung stellte den Menschen im wahrsten Sinn des Wortes an einen „transzendentalen“ Platz im Makrokosmos, wobei ein direkter und gleichsam zwangloser Zugang von der diesseitigen Lebenssphäre zum jenseitigen Totenreich bestand (vgl. Abb. 36.3). Nach keltischer Auffassung, wie sie von Lucan (Pharsalia I, 446 ff) überliefert wird, ist der Tod lediglich die Beendigung eines bestimmten Abschnitts im Kontinuum der Unsterblichkeit der Seele. Begräbnisrituale, die nach Caesars Beobachtungen (De bello gallico VI, 19) in Gallien pompös und aufwendig veranstaltet wurden, besaßen eher die Funktion eines Übergangsritus. Diodorus Siculus (Bibliotheke V, 28, 6) erwähnt ein wichtiges Element der keltischen Mentalität, und zwar die
Abb. 36.3: Stein mit Bildsequenzen von Trecastle in Wales, die als Darstellung der Seelenwanderung von der irdischen (unten) zur jenseitigen Sphäre (oben) gedeutet werden (nach Green 1992, 213).
782 Auffassung, daß die Seelen der Menschen, über die die Verstorbenen ebenso frei verfügen wie als Lebende, nach einiger Zeit wieder in die Körper von Lebenden zurückkehren und sich somit „wiederbeleben“. Der Aspekt der Unsterblichkeit der Seele wurde von den Druiden in ihren rituellen Akten bewußt herausgestellt, um die Unerschrockenheit der keltischen Krieger als besondere Tugend zu pflegen. Von allen Nachbarvölkern wurde der Mut und die Verwegenheit, mit der Kelten kämpften, geachtet und gleichzeitig gefürchtet. 5.3. Bestimmt durch die Vorstellungen von der Seelenwanderung war die Idee von der Transzendenz der Sphären und damit der Offenheit des Makrokosmos mit Sicherheit tief im Bewußtsein der frühen Kelten verwurzelt. Aus der Frühzeit ist das Ideengut dieser Art von Makrokosmos bis in die Spätantike und das frühe Mittelalter tradiert worden. Dies läßt sich aus der religiös-mythologischen Symbolik, aus der Ikonographie und auch sprachlich erschließen. Selbst noch in der modernen Phase der Sprachentwicklung kann man erkennen, daß sich in der Terminologiebildung für Zeichenprozesse die Grenzen zwischen dem konkret Erfahrbaren und dem Transzendentalen verwischen. Der Ausdruck für „Zeichen“ ist im Irischen comhartha, das auch konkret ‘Signal, Anzeichen’ sowie ‘charakteristisches Merkmal’, im abstrakten Sinn auch ‘Andenken’ bedeuten kann. Bezogen auf verschiedene Kontexte umfaßt der Bedeutungsumfang des Terminus ir. samhail einerseits konkrete semantische Merkmale wie ‘Ähnliches, Gleichartiges’ (z. B. eine Reproduktion oder Kopie) und ‘Abbild’, Abstraktionen wie ‘Symbol’ und ‘Ähnlichkeit, Gleichartigkeit’, dann auch ‘Erscheinung’ und ‘Geist, Gespenst’. Dem ir. comhartha entspricht in dessen Grundbedeutung kymr. arwydd, bezüglich der spezialisierten Bedeutung ‘charakteristisches Merkmal, Markierung’ kymr. nod, ein lateinisches Lehnwort (⬍ lat. nota). Das Symbolhafte findet in kymr. symbol (im älteren Sprachgebrauch auch symblen), die beide Adaptionen von lat. symbolum sind, und arwyddlun (zusammengesetzt aus arwydd ‘Zeichen’ und llun ‘Bild’) seinen Ausdruck. Der lateinische Terminus signum ist ins Keltische entlehnt worden, und zwar in volkstümlicher Form ins Kymrische als swyn (‘magisches Zeichen, Zauberwort oder -formel’), als gelehrte Adaptation ins Irische: sı´n (‘geschriebenes Zeichen’, aber
VI. Keltisches, Germanisches und Slavisches Altertum
auch ‘Symbol’, z. B. ein mathematisches Symbol). Zu den Bezeichnungen für Zeichen in anderen Kulturen vgl. Art. 37 § 5. (germanisches Altertum), Art. 39 (griechische Vorklassik), Art. 40 § 1., Art. 45 § 2., Art. 47 § 3.1. und § 6.2. sowie Art. 60 § 2. (griechische und römische Klassik), Art. 61 § 2. (Judentum), Art. 90 § 1. (Islam), Art. 92 § 1. (Hinduismus) und Art. 95 § 3. (Schintoismus). 5.4. Eine grundsätzliche Voraussetzung für das kulturspezifische Funktionieren der Semiose im Makrokosmos war die Einstellung der Menschen zu der sie umgebenden Natur. Das Verhältnis der antiken Kelten zu ihrer natürlichen Umgebung war innig, und dies galt für die Interaktion des einzelnen wie für rituelle Handlungen in der Gruppe. In der vorrömischen Keltike kamen Formen von Raubbau an der Natur, wie sie aus den römischen Siedlungsgebieten bekannt sind (z. B. die Abholzung und Verkarstung ganzer Landstriche in Italien, Spanien und Kroatien), nicht vor. Ein wesentlicher Grund hierfür war die den Kelten eigene respektvolle Haltung gegenüber allen Naturphänomenen. Das Wirken animistischer und theistischer Mächte wurde in den Erscheinungsformen der Natur symbolhaft erkannt und inmitten eines natürlichen Milieus verehrt. Die ältesten Ritualplätze der Kelten sind auch keine Gebäude mit klar festgelegter Architektur und entsprechenden Funktionen wie seit den ältesten Überlieferungen der römischen Kultur, sondern naturgebundene Orte wie Berge, Flüsse, Seen, Aulandschaften, Quellen, Haine u. ä. Die religiöse Symbolik und Ikonographie war mit Elementen der für die Keltike typischen Fauna durchsetzt (vgl. Green 1989, 131 ff). Zwar teilt die keltische Religion mit der römisch-griechischen polytheistischen Tradition den Charakterzug, daß jede wichtige Gottheit mit einem bestimmten Tier assoziiert wurde, die Verflechtung der göttlichen Symbolik mit Aspekten heiliger Tiere führte aber im keltischen Kulturkreis weit über diesen allgemeinen Vergleichsrahmen hinaus (vgl. auch die Tierornamentik im germanischen Altertum, Art. 37 § 7.1.). Im Fall der Pferdegöttin Epona, deren Namen von der keltischen Wurzel für das Wort „Pferd“ abgeleitet ist und die man hauptsächlich in Gallien und im Rheinland verehrte, ist die Ikonographie „untrennbar mit Pferdsymbolen“ (Green 1992, 90) verknüpft. Ähnlich symbiotisch verknüpft sind die Hirschsymbole (Ge-
36. Zeichenkonzeptionen im keltischen Altertum
weih, Ohren) mit der Gestalt des gehörnten Gottes Cernunnos, der ikonographisch bereits seit dem 4. Jahrhundert v. Chr. erscheint. Man hat sogar vermutet, daß Epona und Cernunnos ursprünglich vergöttlichte Tiergestalten waren (d. h. Pferd und Hirsch), die später in anthropomorphe Gestalt transformiert wurden (de Vries 1963, 181 ff). Die Schwierigkeiten mit einer adäquaten Definition, ob etwa das Pferd bei den Kelten selbst ein heiliges Tier war oder aber als göttliches Attribut unverzichtbar für die Rolle der Epona, machen jedenfalls deutlich, daß die Tiersymbolik in der keltischen Religion nicht zu trennen ist von der Rollenverteilung im Götterpantheon. Andererseits gibt es rituelle Zusammenhänge in der keltischen Religion, wo Naturelemente ohne Beteiligung anthropomorpher Gestalten in einen wichtigen Ritus integriert sind. Dies ist der Fall in einer Version des Fruchtbarkeitskultes, bei dem bestimmte Pflanzen und Tiere eine zentrale Rolle spielen. Aus der Historia Naturalis (XVI, 95) des Plinius erfahren wir, daß am 6. Tag nach Neumond der Druide auf eine heilige Eiche klettert, mit einer goldenen (bzw. vergoldeten) Sichel einige Zweige der dort rankenden Mistel abschneidet und daß nach diesem rituellen Akt mit „floraler“ Symbolik zwei weiße Stiere geopfert werden, dies als Part der Fruchtbarkeitssymbolik im Bereich der Fauna (Markale 1988, 137 ff). Das Verhältnis der Kelten zur Natur war somit ein eigentlich symbiotisches: die Natur bestimmte nicht nur die ökologischen Grundbedingungen des Lebens, sondern sie war auch Gegenstand der metaphorischen Kommunikation zwischen Mensch und Biotop. In vorrömischer Zeit war die Zahl ritueller Gebäude (in Kreisform oder rechteckig gebaut) in der Keltike mit Sicherheit kleiner als die heiliger Orte unter freiem Himmel. Gebäude mit ritueller Funktion erkennt man archäologisch an ihrer Nachbarschaft zu römisch-keltischen Heiligtümern. Eine Sakralarchitektur im Sinn einer funktionell-stilistischen Festlegung von Bauelementen gab es vor der Zeit des Kontaktes mit den Römern nicht. Die romano-keltischen Schreine und Hausaltäre, die vor allem aus Gallien und Britannien stammen, sind also eigentlich nicht typisch für die ursprüngliche Kultur der frühen Kelten, sondern weisen stattdessen auf deren Akkulturation unter römischem Einfluß hin (vgl. Art. 47 § 2.1.). 5.5. Die Anfänge der keltischen Ikonographie liegen im Dunkeln. Mit einiger Berechtigung
783 kann man wohl in einigen der jüngeren Felsbilder der Alpenregion, wie in der Val Camonica (nördlich von Brescia in den italienischen Alpen gelegen), keltisch inspirierte Motive ausdeuten (vgl. die Synopse der anthropomorphen Motive bei Anati 1979, 72). Eine wichtige keltische Assoziation in den Bildsequenzen ist eine gehörnte anthropomorphe Gestalt, die an die keltische Gottheit Cernunnos erinnert (s. o.). Eine derartige Gestalt fehlt in den nichtkeltischen Kulturen der Eisenzeit. Andere Medien der Ikonographie in der Keltike waren Standbilder aus Holz oder Stein, Steinreliefs sowie verschiedene Formen der Kleinplastik, vorzugsweise aus Metall. In der gesamten ikonographischen Tradition fällt die besondere Sorgfalt auf, mit der jeweils der Kopf, vor allem von Menschen oder Gottheiten darstellenden anthropomorphen Gestalten modelliert worden ist. Die besondere Aufmerksamkeit, die der Gestaltung dieses Körperteils zuteil wurde, fügt sich in das Gesamtbild der keltischen Kulturszene ein, wo ebenfalls im Opferritual (s. Kopfabschneiden) und in der Mythologie der Kopf als wichtige Kraftquelle betrachtet wird. Eine späte Quelle der keltischen Ikonographie ist die irische Buchmalerei der Nachantike. Die norditalienisch inspirierte Formgebung und Stilistik der ornamentalen Motive (d. h. Menschen- und Tiergestalten) lehnt sich stark an die kontinentale Tradition an (vgl. § 10.). Trotz der Übernahme römischer Elemente der Sakralarchitektur wie Schreine, Opferaltäre und Grabdenkmäler bleiben viele von keltischen Künstlern hergestellte sakrale Skulpturen insbesondere der älteren Zeit in ihrer Stilistik und Ästhetik unberührt vom römischen Kunstsinn. Der keltischen Tradition verpflichtet, stellen sich die Reliefprofile und Skulpturen keltischer Gottheiten auffällig schematisch und abstrakt dar. Teilweise dienen lediglich Umrißlinien zur allgemeinen Identifikation einer Gestalt. Der naheliegende Gedanke künstlerischer Inkompetenz kann verworfen werden, denn die Qualität der keltischen Kleinplastik (Darstellung von Tieren und Menschen) sowie die Präzision der technischen Ausgestaltung von Metallschmuck widersprechen einer solchen Annahme. Die keltische religiöse Ikonographie unterscheidet sich in ihrem Schematismus deutlich von der römischen bildenden Kunst, deren wichtigste Priorität darin bestand, einen hohen Grad an realistischer Skulpturierung zu erreichen. Moderne Interpretationen des Schematismus in der keltischen Ikono-
784
VI. Keltisches, Germanisches und Slavisches Altertum
graphie sehen darin berechtigterweise eine Art rituelle Vorschrift, durch die Vagheit im Ausdruck der Gottheit deren mystisch-verklärte Präsenz hervorzuheben (Green 1989, 214 ff). Das Bild der Gottheit sollte somit nach keltischer Auffassung nicht durch bestechenden Realismus, sondern in seiner abstrakten Verklärtheit den Betrachter beeindrucken. In der Spätphase des romanokeltischen Kultursynkretismus überwiegt römische Ästhetik auch in der Ausgestaltung der keltischen Götterskulpturen.
6.
Druidentum und Orakelwesen
6.1. Die Kommunikation mit den Elementen des Makrokosmos, mit den personifizierten Gottheiten wie mit den lebenden und nichtlebenden Dingen der Natur (vgl. Art. 32 § 5.) wurde durch Spezialisten kontrolliert und gesteuert, durch die Druiden. Sie waren die wichtigsten Mittler in den Semiosen zwischen Mensch, Natur und der transzendentalen Welt. Das Druidenwesen der Kelten, das aus den Berichten antiker Autoren wie Strabo (Geographika IV, 4, 4), Diodorus Siculus (Bibliotheke V, 31, 2⫺5), Caesar (De bello gallico VI, 13⫺14), Tacitus (Annales XIV, 30) und anderer bekannt geworden ist, war von zentraler Bedeutung für den Zusammenhalt der Gemeinschaft, und dies aufgrund der unantastbaren Autorität der religiösen Führungselite in rituellen Angelegenheiten. Aus Caesars Werk wissen wir, daß die Druiden sich an einem bestimmten Tag im Jahr an einem heiligen Ort im Gebiet der Carnutes (Zentralgallien) versammelten, was als ein Ritual zur Bekräftigung der druidischen Autoritätsfülle verstanden werden kann. Die bevorzugte Stellung der Frau erkennt man unter anderem darin, daß keltische Aristokratinnen bis zur höchsten Stufe der Sozialhierarchie aufsteigen konnten, d. h. sie konnten das Druidenamt übernehmen, insbesondere in der Funktion der Seherin (Markale 1984, 40). Die Sonderstellung des Druiden in der keltischen Gesellschaft kann gar nicht überschätzt werden. Sie spiegelt sich in der religiös-mythischen Überlieferung. Die Göttin Brigit wurde im Haus eines Druiden geboren, und den Helden der irischen Sagenwelt, Finn, so heißt es, zog eine Druidin auf. Druiden erfüllten in der keltischen Gesellschaft Funktionen, wie sie von den Magiern in traditionellen Kulturen bekannt sind (z. B. Krankenheilung, Wahrung ritueller Traditio-
nen, Wettervorhersage). Für die Durchführung der chthonischen Rituale benötigten die Druiden besondere Kenntnisse der Phänomene im Lebenszyklus der Natur, für ihre Verantwortlichkeit in Sachen Krankenheilung war ein erfahrener Umgang mit Heilpflanzen erforderlich. Die Druiden übernahmen auch gesellschaftlich zentrale Aufgaben wie das Richteramt in privaten und öffentlichen Auseinandersetzungen. Schließlich kontrollierten Druiden das für die Kelten so wichtige Orakelwesen. Gerade die Rollen im öffentlichen Leben, die den Druiden zum Garanten der Stabilität in der keltischen Gesellschaft machten, waren den römischen Kolonialherren in der Keltike durchaus bewußt. Augustus tolerierte das Druidenwesen, Tiberius dagegen lehnte es als möglichen Ausgangspunkt für eine antirömische Sammelbewegung ab, und Claudius bemühte sich, es abzuschaffen. Die Druiden konnten ihre gemeinschaftsstabilisierende Rolle aber nur so lange wahrnehmen, wie die keltische Sozialhierarchie Bestand hatte. Und die löste sich im Zuge der Romanisierung zunehmend auf. Die Rolle der Druiden als religiöse und teilweise auch politische Führungspersönlichkeiten schwächte sich zunächst in Gallien, dann auch in Britannien ab. Zur Rolle der Priester in der griechischen und römischen Antike vgl. Art. 47 § 2.2. Darüber hinaus verwalteten die Druiden das gesamte mythisch-religiöse Wissen der Kulturgemeinschaft und kontrollierten die Erinnerung an historische Ereignisse im Generationenwechsel in Form epischer Gesänge und des volkstümlichen Legenden- und Sagenschatzes. Damit waren sie prädestiniert als die Wahrer der oralen Literatur. Die Gedächtnisschulung in diesem Bereich war rigoros. Caesar (De bello gallico VI, 13 f) berichtet, daß die Ausbildung zu einem Meister der mündlichen Erzählkunst zwanzig Jahre dauern konnte. Verglichen mit den Dokumenten des eher spärlichen Schriftgebrauchs (z. B. mit dem Ritualkalender von Coligny als Gedächtnisstütze; vgl. § 9.) nimmt sich die orale Tradition der episch-mythischen Literatur seit der Antike reichhaltig und verzweigt aus (Dottin 1920, IX f). Welchen Umfang und welche literarische Qualität diese orale Literatur der Antike gehabt haben mag, kann man erahnen, wenn man die Reichhaltigkeit ihrer nachantiken Verschriftung in den altirischen Sagenzyklen bedenkt (Dillon und Chadwick 1966, 421 ff). Die Abgrenzung des Bereichs der oralen Literatur in der Keltike
36. Zeichenkonzeptionen im keltischen Altertum
folgt nicht der modernen Definition dessen, was Literatur ist. Außer Mythen, Sagen und Legenden als Erzählstoffen gehörten dazu rituelle Formeln und die Überlieferung von Rechtskodices. Das gesprochene Wort hatte eine ursprüngliche Bedeutung als Kraftquelle (Markale 1988, 179 ff). Wie Caesar (De bello gallico VI, 14) berichtet, war es den Druiden untersagt, die Elemente der religiösen Lehre schriftlich aufzuzeichnen, obwohl die Druiden durchaus mit der griechischen und lateinischen Schrift vertraut waren (vgl. § 9.). Am längsten hielt sich die Autoritätsfülle der druidischen Elite in Irland, und zwar bis ins frühe Mittelalter. In der Zeit der Spätblüte des Druidenwesens als sozialer Institution der keltischen Gesellschaft in Irland kommt es zu einer funktionalen Spezialisierung, bei der die Rolle des religiösen Führers, des Barden und des Wahrsagers (ir. fili Sg., filidh Pl.) jeweils verschiedenen dafür geschulten Personen übertragen wird (Mytum 1992, 54). Auch ein fili besaß, wie ein Barde, Kenntnisse der oralen Literatur. Sein Anteil an deren mündlicher Wiedergabe betraf aber den einfachen Erzählstoff, und er schrieb auch gelehrte Lyrik. Der irische Barde dagegen rezitierte Heldengesänge in Reimform. Die filidh waren Spezialisten des Augurenwesens mit teilweise hellseherisch-medialen Fähigkeiten. Zudem waren sie Satiriker. Vertreter der filidh wurden sorgfältig ausgewählt und erhielten eine besondere Ausbildung in Rhetorik (Byrne 1973, 13 f). Ihre Stellungnahmen zu den Geschehnissen in der irischen Gesellschaft wurden allseits respektiert und von der aristokratischen Elite auch gefürchtet. Denn eine vernichtende öffentliche Kritik an einem der politisch Verantwortlichen durch einen der filidh führte unweigerlich zu dessen Sturz. Vor allem in Irland hat das Druidenwesen eine Hochblüte erlebt, und es blieb ⫺ in der Rollenverteilung der filidh ⫺ bis ins christliche Mittelalter lebendig. Obwohl sich die irischen filidh des frühen Mittelalters zunächst dem neuen Glauben widersetzten, blieb dieser Elite bald keine andere Wahl, als sich ebenfalls zu bekehren. Damit gaben sie zwar ihr heidnisches Priesteramt und ihre rituellen Funktionen im Orakelwesen auf, als Kompensation für diesen Prestigeverlust wurde aber die Rolle als Wahrer der historischen, juristischen und literarischen Tradition gestärkt. Die OghamSchrift durfte nicht zur Aufzeichnung von Rechtstexten verwendet werden. Alles, was die Lehren der Vorväter betraf, wurde durch
785 die Kraft des gesprochenen Wortes tradiert. Die mnemotechnische Leistung mancher filidh nahm teilweise sagenhafte Dimensionen an. So sollen manche in der Lage gewesen sein, nicht weniger als 250 wichtige Erzählungen (primscela) und etwa 100 Anekdoten (foscela) vorzutragen (Mytum 1992, 54). Die Rechtskodices wurden vielfach in Versform auswendig gelernt, wobei deren Inhalt in Form von Maximen und Anweisungen gegliedert war. Der letzte Teil des in Versen aufgezeichneten irischen Rechtskodex Bretha De´in Che´cht ist nach Binchy (1966, 3 f) vorchristlich, da in dessen Text keine, für die christliche Periode so typischen, lateinischen Lehnwörter vorkommen. Die Druiden überwachten alle Opferhandlungen und führten die wichtigsten Opferakte selbst durch. Die Rituale waren häufig von Musik begleitet, die der Druide auf einem harfenähnlichen Instrument spielte (Megaw 1991). „Bei den Kelten wurden nicht nur Pflanzen, Zweige und Blumen als Opfergaben verwendet (diese Bräuche leben noch heute weiter), sondern auch Tiere, vor allem Stiere und Widder“ (Markale 1988, 167). Auch das Schwein und gelegentlich der Hund gehörten zum Kreis der geopferten Tiere. Nach der Opferhandlung wurde das Fleisch von Opfertieren meist gegessen, eine Brühe daraus gekocht, die man trank. Im Zusammenhang mit dem Ritual der Königswahl aß ein Auserwählter das Fleisch eines weißen Opferstieres, trank die daraus gekochte Brühe und legte sich zum Schlafen nieder. Nach keltischer Tradition würde diesem rituell vorbereiteten Seher im Traum die Gestalt des zukünftigen Königs erscheinen. Aus der Position der Innereien in den Opfertieren wurden auch zukünftige Ereignisse vorausgesagt. Die Eingeweideschau, die bei den Römern unbekannt war, findet sich in ausgeprägter Form nur in einer Kontaktkultur der Kelten, und zwar in Gestalt der Leberschau bei den Etruskern (Haarmann 1992 a, 144 f). Zum Herrschaftsritual gehörte die rituelle Sodomie. Der König vereinigte sich mit einer Stute, die anschließend geopfert wurde. Dann badete der Herrscher in der ausgekochten Brühe des Opfertieres und aß dessen Fleisch. 6.2. Obwohl in seiner Wichtigkeit für öffentliche Angelegenheiten dem griechischen und römischen Orakelwesen ähnlich, basierte das keltische auf weitgehend anderen Ritualen. Darunter waren auch solche, bei denen sich die Völker im mediterranen Zivilisationskreis besonders schockiert zeigten, so wegen der
786
VI. Keltisches, Germanisches und Slavisches Altertum
keltischen Sitte der Menschenopfer, die in Krisenzeiten dem Orakel dienten. Angesichts grassierender Krankheiten oder einer Bedrohung von außen (z. B. eines feindlichen Angriffs) konnte nach keltischer Vorstellung das Schicksal nur mittels eines Menschenopfers ergründet werden. Nach Diodorus Siculus (Bibliotheke V, 31, 2⫺5) und Strabo (Geographika VII, 2, 3) gab es verschiedene Todesarten, die für die Opfer gewählt wurden (z. B. Halsdurchschneiden oder Erdolchen). Die Zuckungen im Todeskampf sowie die Bewegungen des Blutflusses wurden als Omina interpretiert und entsprechend den situationellen Bedingungen ausgedeutet. In bestimmten Zusammenhängen wurde auch eine Eingeweideschau der menschlichen Opfer zum Zweck des Wahrsagens veranstaltet. Tacitus (Annales XIV, 30) berichtet von einem Altar in Anglesey (Nordwales), der bedeckt gewesen sei mit Blut und Eingeweiden. Für die Menschenopfer waren bestimmte heilige Bezirke ausgewählt. Lucan (Pharsalia III, 399 ff) erwähnt einen heiligen Hain in der Nähe des antiken Marsilia (heutiges Marseille), in dem jeder Baum mit Menschenblut besprengt war. Unter dem Eindruck dieser Sitte des Menschenopfers, die eine vom Kopfabschneiden bei Gefangenen (vgl. § 3.) unabhängige rituelle Funktion erfüllte, verstärkte sich bei den Römern die Meinung von der Blutrünstigkeit der Kelten. In keiner Kultur der alten Welt hatten Menschenopfer eine solche weitreichende Bedeutung im Orakelwesen wie bei den Kelten. Die Erinnerung an jene Zeiten, als die Erschließung des zukünftigen Schicksals durch druidische Orakelpraktiken ein essentieller Bestandteil des öffentlichen Lebens in der keltischen Gesellschaft war, lebt nicht nur in der durch christlichen Einfluß stark transformierten Mythologie fort, sondern es finden sich auch sprachliche Fossilien wie der kymrische Ausdruck dewin ‘Magier, Wahrsager’, ein Lehnwort aus lat. divinus, womit eine der Hauptrollen des frühkeltischen Druiden beschrieben wurde. Im modernen Wortschatz des Kymrischen gibt es eine Reihe von Ableitungen von dieser Basis: dewino ‘wahrsagen’, dewiniaidd ‘prophetisch, magisch’, dewiniaeth ‘Magie, Zauberei’ u. a.
7.
Interkulturelle Kontakte mit den mediterranen Zivilisationen und die romano-keltische Kultursymbiose
7.1. Die Kelten waren den Griechen bereits seit dem 6. Jahrhundert v. Chr. bekannt, d. h. seit der Spätphase ihrer Ethnogenese im
westlichen Hallstattkreis. Damals siedelten die Kelten in Süddeutschland und Ostfrankreich, also noch getrennt von den Griechen und Italikern. Griechische Importware in der Keltike ⫺ entweder erworben auf dem Handelswege entlang der Donau oder vermittelt über die Etrusker in Norditalien ⫺ ist bereits für die Hallstattzeit bezeugt (Spindler 1991, 26 f). Erst im Verlauf der keltischen Siedlungsexpansion während der La-Te`ne-Periode (seit dem 4. Jahrhundert v. Chr.) traten diese Völker in direkten Kontakt miteinander. Für die keltische Bevölkerung wirkten sich diese Kontakte sehr verschiedenartig aus. Während die Nachbarschaft mit Griechen und Etruskern für die Kelten eine Belebung des Handels und die Einführung zivilisatorischer Institutionen wie der Schrift zur Folge hatte, kulminierten die Kontakte mit italischen Siedlern im Zuge der römischen Kolonisation Westeuropas in einem ständig wachsenden Akkulturationsdruck, der sich im Sprachwechsel bei den meisten Festlandkelten während der Spätantike auswirkte. Die Beziehungen zwischen Römern und Kelten waren seit der Eroberung Roms durch den legendären Keltenführer Brennus im Jahre 387 v. Chr. („Gallierkatastrophe“) verstrickt in militärische Auseinandersetzungen. In der Einstellung, die das Geschichtsbild der Römer von den Kelten geprägt hat, dominiert nicht von ungefähr die Vorstellung von einem kriegerischen Volk. Angesichts der zunehmenden Erstarkung der römischen Vormacht in Mittelitalien kämpften Etrusker und Kelten als Koalitionspartner im 3. Samnitenkrieg (298⫺290 v. Chr.) zusammen gegen die Römer, allerdings erfolglos. Die Senonen, der führende Stamm der Kelten in Oberitalien, wurden im Krieg von 285⫺282 v. Chr. endgültig unterworfen. Damit war die militärische Vorherrschaft der cisalpinen Kelten gebrochen. Außerhalb Italiens unterwarfen die Römer zunächst die Keltiberer. Deren Hauptsiedlungsgebiet stand seit 181 v. Chr. unter römischer Kontrolle. Das nördlich davon gelegene iberische Siedlungsgebiet wurde wenige Jahrzehnte später dem römischen Machtbereich einverleibt (133 v. Chr. Eroberung Numantias). Caesars wichtigste Eroberungen lagen in den von Kelten bewohnten Regionen. Im Jahre 22 v. Chr. wurde die Provinz Gallia Narbonensis eingerichtet, es folgten 16 v. Chr. Aquitania, Gallia Lugdunensis und Belgica, im selben Jahr Noricum in den Ostalpen, 15 v. Chr. Raetia. Damit stand der größte Teil des festlandkeltischen Siedlungs-
36. Zeichenkonzeptionen im keltischen Altertum
gebiets bereits vor der Zeitenwende unter römischer Herrschaft. Schließlich erfolgte 43 n. Chr. die Eroberung des südlichen Britannien, wodurch auch die Inselkelten einem direkten römischen Einfluß ausgesetzt wurden. Nach der militärischen Eroberung und der administrativen Erschließung der Kolonialgebiete entfaltete sich der römische Kultureinfluß auf der Grundlage der „Pax romana“. Die wichtigsten Faktoren im Prozeß der fortschreitenden Romanisierung der Kelten waren die römische Militärmacht (vertreten durch Einheiten der Armee und deren regionale Führung), die römische Zivilverwaltung, das römische Handelsmonopol, römisches Erziehungswesen, die Dominanz römischer Kolonisten in den städtischen Zentren, die religiösen Staatskulte, die griechisch-römische Kunsttradition, römische Lebensweise, das Christentum und die weltanschauliche Neuorientierung der Spätantike (Haarmann 1979, 26). Da alle öffentlichen Sprachfunktionen, in Schrift und Wort, vom Lateinischen ausgefüllt wurden, verblieb dem Keltischen lediglich die Privatsphäre. Jahrhundertelang behielt das Festlandkeltische seine Rolle als Medium der ethnischen Intimität, d. h. als Heimsprache, bei. Bis zum Ende der Römerherrschaft gab es keltischsprachige Enklaven in Gallien. In Britannien konnte sich der Romanismus nirgendwo entscheidend durchsetzen. Bis auf eine kleine Region im Südosten lebten Römer und britische Kelten nicht in Siedlungsnachbarschaft oder -gemeinschaft wie in Gallien. Das südliche Schottland und die Region Wales waren bis zum Abzug der römischen Truppen zu Beginn des 5. Jahrhunderts n. Chr. Militärzonen (Millett 1990, 127 ff). Die Auswirkungen der romano-keltischen (bzw. gallo-römischen) Kultursymbiose, die weniger auf Wechselseitigkeit als auf die Dominanz des römischen Lebensstils gegründet war, sind an der Umstrukturierung des Zeichenrepertoires der keltischen Sprachen erkennbar, die Tausende von lateinischen Entlehnungen adaptiert haben (vgl. die lexikostatistischen Übersichten bei Haarmann 1979, 34 ff). Obwohl zahlreiche Lehnwörter im Laufe der zweitausendjährigen Sprachgeschichte außer Gebrauch gekommen sind, lassen sich die Spuren der römischen Kolonisation in Form von vielen hundert Ausdrükken lateinischer Herkunft und deren Ableitungen bis in den Wortschatz der modernen keltischen Einzelsprachen verfolgen. Die Einflußnahme des Lateinischen zeigt in allen kel-
787 tischen Sprachen gemeinsame Eigenheiten der Lehnwortadaptation auf der Grundlage eines allgemeinen Kulturaustausches. Aus dieser Kategorie von Sprachkontakt resultieren zahlreiche Termini im verzweigten Bezeichnungsnetz der materiellen Kultur. Dabei entfällt der größte Teil der Entlehnungen auf die Bereiche von Handwerk und Technik (z. B. dolatorium ⬎ bret. daladur ‘Beil’, centrum ⬎ mittelkymr. cethr ‘Nagel’, martellu ⬎ kymr. morthwyl ‘Hammer’), auf das Bauwesen und die Hauseinrichtung (z. B. muru ⬎ kymr. mur, bret. mur ‘Mauer’, mensa ⬎ mittelkymr. mwys ‘Tisch’, cathegra/cathedra ⬎ kymr. cadair, bret. kador ‘Stuhl’), auf die Bezeichnungen von Tieren (z. B. asinu ⬎ kymr. asyn, bret. asen ‘Esel’, leo/leonem ⬎ kymr. llew, bret. leon ‘Löwe’, cornicella ⬎ bret. kernigell ‘Kiebitz’) und Pflanzen (z. B. cerasia/ *ceriasa ⬎ kymr. ceirios(en), bret. kerez(enn) ‘Kirsche’, linum ⬎ kymr. llin, bret. linenn ‘Flachs’, malva ⬎ bret. malv(enn) ‘Malve’). Im Wortschatz der keltischen Sprachen spiegelt sich auch die Akkulturation, von der alle Kelten im römischen Machtbereich betroffen waren. Lateinische Lehnwörter findet man daher auch in Bereichen, wo eine einheimische keltische Terminologie existierte, deren Elemente aber sukzessive ersetzt wurden. Aus dem Prestigedruck des Lateinischen erklärt sich die Übernahme von Ausdrücken in der Verwandtschaftsterminologie (z. B. planta ⬎ kymr. plant ‘Kinder’, gemellu ⬎ kymr. gefell, bret. gevell ‘Zwilling’, privatu ⬎ kymr. priod, bret. pried ‘Ehepartner (Ehefrau oder -mann)’), im Repertoire der Zeitbestimmungen (z. B. hora ⬎ kymr. awr, bret. eur ‘Stunde, Uhrzeit’, (dies) lunae kymr. Dydd Llun, bret. Lun ‘Montag’, augustus ⬎ kymr. Awst, bret. Eost ‘August’) und in der Farbterminologie (z. B. coccum ⬎ kymr. coch ‘rot’, viride(m) ⬎ kymr. gwyrdd, bret. gwer ‘grün’, densu ⬎ kymr. dwys ‘dunkler Farbton’). Einen höheren Grad an Akkulturation signalisieren lateinische Lehnwörter im keltischen Bezeichnungsinventar der Körperteile (z. B. bucca ⬎ kymr. boch ‘Mund’, bret. boc’h ‘Backe’, bracchium ⬎ kymr. braich, bret. brec’h ‘Arm’, cuneu ⬎ kymr. cyn, bret. genn ‘Penis’), der Sinnesempfindungen und Gefühlsregungen (z. B. sensu ⬎ mittelkymr. swys ‘Gefühl, Sinn’, consolor ⬎ kymr. cysur subst. ‘Trost, Frohsinn’, dolore(m) ⬎ kymr. dolur ‘Kummer’). Was den Umfang der Akkulturation in den regionalen keltischen Sprachgemeinschaften betrifft, so gibt es darüber aus antiken Quel-
788 len keine nennenswerten Aufschlüsse. Bekannt ist nur das Endergebnis in Gallien, nämlich die fast vollständige Assimilation der einheimischen Bevölkerung und der Sprachwechsel zum Sprechlateinischen. In den inselkeltischen Sprachen drücken sich graduelle Unterschiede der Akkulturation in den Strukturen des lateinischen Lehnwortschatzes aus. Vergleicht man beispielsweise die Verteilung der Lehnwörter nach Bezeichnungsbereichen im Kymrischen und Bretonischen, so ergeben sich einzelsprachliche Variationen bei der Adaptation lateinischer Elemente (Haarmann 1979, 38 ff). Im kymrischen Wortschatz wurden beispielsweise dreimal so viele lateinische Lehnwörter im Bereich der sozialen Terminologie adaptiert wie im Bretonischen. Ein Grund für diesen erheblichen Unterschied ist womöglich darin zu suchen, daß die aus Südengland in die Bretagne emigrierten Inselkelten einen Teil ihrer Terminologie für soziale Beziehungen im Zuge der Neuorganisation ihrer Gesellschaft aufgaben. Auf dem Festland stand ihr gesellschaftliches Leben schon bald unter dem kulturellen Einfluß der gallo-romanischen Bevölkerung, was die Übernahme französischer Entlehnungen erklärt. Als inhärenter Bestandteil des Lehnwortschatzes gelangten auch Elemente des flexivischen Systems in die keltischen Kontaktsprachen. Der Bestand entlehnter Formantien lateinischer Herkunft, die in die Wortbildung des Kymrischen, Bretonischen und Irischen integriert worden sind, umfaßt Präfixe (z. B arc(h)i- ⬎ kymr. arch-, bret. arc’h-) und Suffixe (-atorium ⬎ bret. -adur, -(i)tatem ⬎ kymr. -dod, bret. -ded, -osus ⬎ kymr. -us, bret. -us; Haarmann 1979: 16 ff). Einige dieser Formantien haben sich in der keltischen Wortbildung besonders produktiv entwickelt. Dies gilt beispielsweise für lat. -arius, das ins Kymrische als -or, ins Bretonische als -er und ins Irische als -(a)ire (in Lehnwörtern der ioStammklasse) bzw. als -o´ir (in Lehnwörtern der i-Stammklasse) übernommen wurde (vgl. Thurneysen 1946, 172 zur letzteren Unterscheidung). 7.2. Die zunehmende Akkulturation und Assimilation der Gallier und vieler Inselkelten ist ohne Zweifel der dominante Trend der römisch-keltischen Kontakte. Allerdings hat sich auch wechselweise keltischer Einfluß im Lateinischen manifestiert, nur ist diese Beeinflussung sporadischer Natur. Wörter des Sprechlateinischen wie camminus (⬎ franz.
VI. Keltisches, Germanisches und Slavisches Altertum
chemin ‘Weg’), camisia (⬎ franz. chemise ‘Hemd’) oder carrus (⬎ altfranz. char ‘Wagen’), die sich in den meisten romanischen Sprachen verbreitet haben, sind gallischer Herkunft. In den gallo-romanischen Sprachen ist der Anteil gallischer Substratwörter entsprechend größer. Hierzu gehören carruca ‘gallischer Wagen’ (⬎ franz. charrue ‘Pflug’), *cassanus (⬎ franz. cheˆne ‘Eiche’), *tamisium (⬎ franz. tamis ‘Sieb’) und viele andere Elemente. Gallische Einflüsse finden sich unter anderem in der Struktur des französischen Numeralsystems. Im Französischen zählt man soixante ‘sechzig’, soixante-dix ‘siebzig’ (wörtl. ‘sechzig-zehn’), quatre-vingts ‘achtzig’ (wörtl. ‘vier Zwanziger’), quatre-vingts-dix ‘neunzig’ (wörtl. ‘vier Zwanziger-zehn’). Das diesen Konstruktionen zugrunde liegende Prinzip einer Zwanzigerzählung ist ein keltisches Residuum. Im wallonischen Französisch ist die Bezeichnungsreihe rein lateinischer Herkunft (vgl. soixante ‘sechzig’, septante ‘siebzig’, octante ‘achtzig’, novante ‘neunzig’). Schließlich beruht die periphrastische Fragekonstruktion im Französischen (nach dem Muster est-ce que …) auf einer entsprechenden Ausdrucksweise des Keltischen, wo das Verbnomen in Aussage- und Fragesätzen regelmäßig mit dem Hilfsverb ‘sein’ konstruiert wird (Haarmann 1976, 119 f). Auch an der östlichen Peripherie der Keltike wirkt das Keltische auf die griechische Kultursprache ein. Keltischer Herkunft sind folgende altgriechische Ausdrücke: iorkos, iorkes ‘Reh’, loghche ‘Lanzenspitze, Lanze’, mannos ‘Halsband’ und riskos ‘Kiste’. Letzteres Lehnwort stammt wohl aus der Sprachvariante der Galater (Hofmann 1966, 299).
8.
Die Annahme des Christentums und christlicher Weltanschauung in der Spätantike
Entscheidend für die Durchsetzung des Romanismus in der Spätantike war die Konfrontation der Kelten mit einer neuen Weltanschauung, dem Christentum (Ryan 1991). Im vorchristlichen Polytheismus gab es zahlreiche romano-keltische Parallelismen, wobei die Kelten römische Gottheiten (vgl. Art. 47 § 5.) mit den ihren identifizierten. Beispielsweise genoß der römische Waldgott Silvanus besondere Verehrung, der Attribute des keltischen Hammergottes annahm, des Schutzpatrons der Tiere und des Inbegriffs der üppi-
36. Zeichenkonzeptionen im keltischen Altertum
gen Vegetation: Wolfsfellumhang und Blätterkrone (Green 1992, 190 f). Der monotheistische Charakter des Christentums und seine Erlöserlehre waren nicht der wesentliche Gegensatz zur älteren Religion, denn auch der so beliebte Mysterienkult des Lichtgottes Mithras trug monotheistische Züge, und auch hier gab es eine Lehre von der Befreiung der Seele nach dem Tod. Während Frauen vom Mithraskult ausgeschlossen waren, stand die christliche Heilslehre allen offen, unabhängig von Alter oder Geschlecht. Hiermit begründet sich wohl die Attraktivität der neuen Religion in den Kolonialgebieten des römischen Imperiums, ebenso ihre Stärke, die in den früheren polytheistischen Vorstellungen gebundenen Hoffnungen und Wünsche der Menschen zu absorbieren (vgl. Art. 47 § 7.). Das Christentum verbreitete sich schon in den ersten Jahrhunderten unserer Zeitrechnung in Gallien. In Britannien wurde die Lehre, einer Textstelle in Tertullians Adversum ludaeos (c. 7) zufolge, im 2. Jahrhundert n. Chr. bekannt. Zunächst fungierte es als Geheimlehre, bis es im 4. Jahrhundert römische Staatsreligion wurde. Der wesentliche Unterschied der neuen gegenüber der alten Religion war, daß sie in der westlichen Hemisphäre sprachlich an das Lateinische als eine ihrer heiligen Sprachen gebunden war. Mit der zunehmenden Verbreitung des Christentums bei den Kelten wuchs auch die Bedeutung des Lateinischen für die Rituale und für die Alltagskommunikation. In der Spätantike wird die christliche Weltanschauung zum Motor der Romanisierung. Symbolisch für diese Neuorientierung ist die semantische Entwicklung des lateinischen Ausdrucks ba(p)tizati ‘die (christlich) Getauften’ im Keltischen zu verstehen: kymr. bedysawd bedeutet ‘Christenheit’, dann auch ‘zivilisierte Welt; Universum’ (Haarmann 1970, 204). Die religiöse Terminologie (z. B. e(c)clesia ⬎ kymr. eglwys ‘Kirche’, episcopu ⬎ kymr. esgob, bret. eskob ‘Bischof’, angelu ⬎ kymr. angel, bret. ael ‘Engel’) und das Bezeichnungsinventar ethisch-moralischer Handlungskategorien (z. B. deficio ⬎ kymr. diffyg subst. ‘Unterlassungssünde’, poena ⬎ kymr. poen ‘Strafe (für eine begangene Sünde)’, effectu ⬎ kymr. effaith ‘Tugend’) wurde mit lateinischen Elementen umstrukturiert. Die Überlagerung durch christliches Gedankengut drückte sich auch in der christlichen Umdeutung vormals „heidnischer“ Termini aus. Der vorchristliche Ausdruck oratio ‘Rede,
789 Redekunst’ beispielsweise bedeutet als Lehnwort im Kymrischen (arawd) ‘Predigt’; lat. virtus/virtute(m) wird im Kirchenlatein als Synonym von miraculum ‘Wunder’ verwendet; in dieser Bedeutung ist es vom Kymrischen (gwyrth) adaptiert worden. Der allgemeine Ausdruck lat. plebs/plebem ‘einfaches Volk, Leute’ wurde in seiner christlichen Umdeutung als plwyf ‘Kirchensprengel’ (‘Gemeindemitglieder’ im Mittelkymrischen) ins Kymrische entlehnt. Im Bretonischen bedeutet das aus plebem entlehnte ploue ‘Landbezirk’, eine administrative Einheit, die sich aus der früheren Gliederung der Kirchensprengel ableitet. Als Bestandteil in Ortsnamen ist Plou- das häufigste Element in der Toponymie der Bretagne (Falc’hun 1949, 9). Entsprechend der Verteilung der Ortsnamen auf Plou- nach der modernen De´partement-Gliederung der Bretagne entfällt die größte Zahl der Namen (d. h. 73) auf das De´partement Coˆtes-du-Nord, es folgen Finiste`re (mit 56 Namen auf Plou-) und Morbihan (mit 22) (vgl. Gourvil 1968, 48). Der christlich-lateinische Trend der Romanisierung in der Spätantike ist der entscheidende Impuls für die Akkulturation der Kelten in Irland gewesen. In Irland setzen die Latinisierung der kultursprachlichen Bezeichnungsbereiche und die Christianisierung erst im 5. Jahrhundert n. Chr. ein, zu einer Zeit, als die Römer bereits ihre Truppen und die Zivilverwaltung aus Britannien abgezogen hatten und die römische Vorherrschaft in Westeuropa erschüttert ist. Nicht nur die irische Weltanschauung, sondern auch die materielle Kultur verändern sich spürbar. „There is little doubt that many of the changes that occurred in Ireland in the fifth and sixth centuries which produced a rich material culture where there had not been such before were caused by external contact, and mainly from Britain“ (Mytum 1992, 23). Irland war nie römisches Territorium, und die Christianisierung wurde auch nicht von römischen Missionaren betrieben. Es waren keltische Priester unter der Führung des heiligen Patrick, die, mit Unterstützung der keltischen Kirche in Britannien, die Christianisierung auf der Nachbarinsel vorantrieben. Insofern hat die Akkulturation der Iren durch christlich-römisches Kulturgut nicht die Intensität erreicht, die zur sprachlichen Assimilation der Gallier geführt hat. Die Beeinflussung des Keltischen in Irland durch das christliche Latein setzt chronologisch später ein als im benachbarten Britan-
790
VI. Keltisches, Germanisches und Slavisches Altertum
nien. Dies kann man unter anderem an der jüngeren Terminologie des lateinischen Lehnwortschatzes im Irischen erkennen. Die Bezeichnung des Kirchengebäudes ist im Altirischen baislec (⬍ basilica). Basilica ist als christlicher Terminus jünger als das aus dem Griechischen entlehnte ecclesia im klassischen Kirchenlatein, das in den britannischen Sprachen (Kymrisch, Kornisch, Bretonisch) weiterlebt (s. o.). Während im Britannischen die ältere vorchristliche Bezeichnung für ‘Sonntag’, lat. (dies) solis (kymr. Dydd Sul, bret. Sul), erhalten ist, hat sich im Irischen der jüngere christliche Terminus (dies) dominicus (ir. De´ Domhnaigh) durchgesetzt. Auch bei anderen Bezeichnungen der Wochentage weicht das Irische mit seiner christlich geprägten Ausdrucksweise von den britannischen Sprachen ab. Während die Bezeichnungen für ‘Montag’ (ir. Luain ⬍ (dies) Lunae), ‘Dienstag’ (ir. Ma´irt ⬍ (dies) Martis) und ‘Samstag’ (ir. Sathairn ⬍ (dies) Saturni) vorchristliche Prägung zeigen, sind die Termini für ‘Mittwoch’ (ir. De´ Ce´adaoin wörtl. ‘Tag des ersten Fastens’), ‘Donnerstag’ (ir. De´ardaoin wörtl. ‘Tag zwischen den Fasttagen’) und ‘Freitag’ (ir. De´ hAoine wörtl. ‘Tag des letzten Fastens’) auf der Basis des Ausdrucks für ‘Fasten’ (ir. o´ine ⬍ ieiunium) konstruiert. Im Kymrischen und Bretonischen ist dagegen das gesamte vorchristliche Inventar der lateinischen Wochentagsbezeichnungen erhalten.
9.
Keltische Schriftlichkeit der Antike
9.1. Die frühe Schriftverwendung in der Keltike ist eindeutig von den mediterranen Zivilisationen beeinflußt. (Die parallelen Ansätze zu einer Schriftlichkeit im germanischen Altertum beschreibt Art. 37 § 3. und im slavischen Altertum Art. 38 § 1.) Bereits in der Zeit vor der römischen Kolonisation haben Kelten die griechische Schrift adaptiert (Texte aus Massilia), Variationen des etruskischen Alphabets in Norditalien verwendet, sich in Spanien der iberischen Schrift bedient und in Südfrankreich die Lateinschrift benutzt (wie z. B. im Text des Kalenders von Coligny). Der Schriftimport aus dem mediterranen Kulturkreis steht gleichermaßen symbolisch für die Abhängigkeit der Keltike von den Kulturgütern des Südens und für das Kulturgefälle zwischen beiden Regionen (Kruta 1991 a). Ein inhärentes Element der keltischen Abhängigkeit von der Schrifttradition des Südens ist die Fixierung auf das Alpha-
betprinzip. Seit Kelten überhaupt Schrift verwenden, ist diese alphabetorientiert. Die einzige Ausnahme ist die iberische Schrift mit ihrem begrenzten Repertoire von Silbenzeichen, die das Basisinventar von Buchstabenzeichen ergänzen (Haarmann 1990 b, 419 ff). Auch die einzige keltische Originalschrift, das Ogham-Zeichensystem als Innovation der Spätantike, findet im Alphabetprinzip der antiken Schriften (Schreibung von Konsonanten und Vokalen), insbesondere des lateinischen Alphabets, ihre Vorlage. Die ältesten Zeugnisse in dieser Schrift stammen aus dem 4. Jahrhundert n. Chr., vielleicht schon aus dem 3. Jahrhundert n. Chr. Obwohl die keltische Schrifttradition in vorrömischer Zeit einsetzt, erlebt sie ihre eigentliche Blüte erst in der Übergangszeit von der Spät- zur Nachantike (s. u.). Kontrovers ist bis heute die Frage, wann die ältesten Schriftdenkmäler in keltischer Sprache entstanden sind. In diesem Zusammenhang soll das Mysterium der „Schrift von Glozel“ nicht unerwähnt bleiben. In der Nähe des Ortes Glozel im französischen De´partement de l’Allier (zwischen Lyon und Vichy) wurden in den zwanziger Jahren dieses Jahrhunderts Kieselsteine und Bruchstücke von Tontafeln gefunden, die in einer Schrift linearen Typs beschriftet sind. Auf der Basis einer Thermolumineszenzanalyse wurde die Bearbeitungszeit einiger der Fundstücke auf ca. 600 v. Chr. datiert (Hitz 1988, 14 ff mit Abbildungen). Falls die Fundstücke authentisch sind, ließe sich die Schrift nach ihrem Duktus in Beziehung setzen zu den alpinen Derivationen des etruskischen Alphabets (vgl. Tab. 36.4), von denen die älteste Adaptation, die venetische Schrift, aus dem 5. Jahrhundert v. Chr. stammt. Insofern könnte es sich bei der „Schrift von Glozel“ um eine sehr frühe Adaptation des etruskischen Alphabets handeln. Die Datierung beinhaltet jedoch etliche Unsicherheiten, ebenso wie eine protokeltische Ausdeutung der Texte (Hitz 1988, 160 ff). Gesichert ist die Adaptation des etruskischen Alphabets durch die Kelten in Norditalien, die im 3. Jahrhundert v. Chr. erfolgte. Inschriften in dieser „lepontisch“ genannten Schriftvariante wurden in der Gegend von Lugano gefunden (Lejeune 1970). Zeitlich später erfolgt die Übernahme der rätischen Schriftvarianten. Von den keltischen Texten in iberischer Schrift ist die erst kürzlich gefundene längere Inschrift von Botorrita (benannt nach ihrem Fundort zwanzig km südlich von Zaragoza) von besonderem Interesse
791
36. Zeichenkonzeptionen im keltischen Altertum Tab. 36.4: Alpine Adaptationen des etruskischen Alphabets (nach Haarmann 1990 b, 456)
(Fleuriot 1975, de Hoz 1982). Erst mit diesem Dokument konnte die Sprachvariante der Keltiberer (Hispano-Keltisch) mit Sicherheit identifiziert werden (Schmidt 1992). Es handelt sich um eine Bronzetafel, die auf beiden
Seiten einen längeren Text trägt (vgl. Abb. 36.4). Obwohl Details der Lesung noch unklar sind, handelt es sich vermutlich um eine Landbesitzurkunde oder um einen Pachtvertrag.
792
VI. Keltisches, Germanisches und Slavisches Altertum
Abb. 36.4: Die Bronzetafel von Botorrita mit keltiberischem Text (nach Kruta 1991a, 492).
9.2. Der vielleicht bekannteste Text in Festlandkeltisch ist der Kalender von Coligny (vgl. Abb. in Kruta 1991a, 495), ein keltischer Ritualkalender aus dem 1. Jahrhundert v. Chr., der in Lateinschrift auf einer Bronzetafel aufgezeichnet wurde. Die Zahlenschreibung folgt der römischen Tradition. Der Kalender, zweifellos ein Produkt druidischer Gelehrsamkeit, besteht aus einer Tabelle von 62 Monaten, was in etwa fünf Sonnenjahren entspricht. Die Monate haben entweder 30 oder 29 Tage, wobei die ersteren als glückverheißend, die letzteren als unglückbringend ausgewiesen sind. Die Verteilung der Tage innerhalb der Einzelmonate zeigt allerdings auch Unglückstage in Glücksmonaten und umgekehrt Glückstage in Unglücksmonaten. Die Reihenfolge der Monate zeigt, daß nach jedem dritten Jahr ein ergänzender 13. Monat eingeschaltet wurde. Dem Schöpfer des Kalenders war offensichtlich bekannt, wie man den Mondumlauf und den Sonnenumlauf für die Zeitmessung in Übereinkunft bringen kann (Dillon und Chadwick 1966, 34 ff). Die Funktion des Kalenders war die eines Ritualkalenders, d. h. er diente sehr wahrscheinlich als Gedächtnisstütze für die Einhaltung wichtiger Monats- und Tagesriten. In seinem System verbinden sich weitreichende astronomische Kenntnisse mit magischen Vorstellungen über die Einwirkung astraler Mächte auf die Geschicke der Menschen (zu den Kalen-
dern anderer Kulturen vgl. Art. 89 § 3.2., Art. 96 Tab. 96.6, Art. 99 § 4.). 9.3. Die Spezialisierung des Druidenwesens in Irland (vgl. § 6.) manifestiert sich unter anderem in einer Innovation des Schriftwesens, nämlich in der Schaffung des Ogham-Systems (vgl. Abb. 36.5). Obwohl die Ursprünge dieser Schriftschöpfung in heidnischmythischem Dunkel liegen, kann man aus der Chronologie der ältesten Schriftdenkmäler, ihren Funktionen und gesellschaftlichen Bezügen Rückschlüsse auf ihre mögliche Entstehung ziehen. Die älteste Dokumentation der Ogham-Schrift findet man in Wurfhölzern aus Knochen und Holz, in die Zahlzeichen eingekerbt sind (vgl. Abb. 36.6). Die Fundschicht am Grabungsort (Ballinderry) wird auf das 2. Jahrhundert n. Chr. datiert. Carney (1975) vermutet sogar ein noch höheres Alter für die Entstehungszeit von Ogham, nämlich das 1. Jahrhundert v. Chr. Da die Ogham-Schrift unter anderem für die Aufzeichnung von Flüchen verwendet wurde, kann man annehmen, daß dieses System ursprünglich als Geheimkode der Druiden konzipiert worden ist. Dafür spricht auch der Name, der mit dem keltischen Gott Ogmios bzw. Oghma assoziiert wird. Beispielsweise wird dieser Gott in Fluchtafeln („defixiones“) aus römischer Zeit, die bei Bregenz am Bodensee gefunden wurden, angerufen mit der
36. Zeichenkonzeptionen im keltischen Altertum
793 wo auch Pflanzennamen eine Rolle spielen (vgl. Haarmann 1990 b, 463). Ob zwischen den Buchstabenbenennungen im keltischen und germanischen Kulturkreis historische Beziehungen bestanden haben oder ob es sich um analoge Entwicklungen handelt, ist bis heute ungeklärt. Die Richtung der OghamSchrift ist nicht festgelegt. Es gibt rechtsläufige wie linksläufige Texte. Inschriften in Ogham finden sich seit dem 4. Jahrhundert n. Chr. besonders häufig auf Grab- und Gedenksteinen, auf denen die Zeichenfolgen wie auf Kerbhölzern eingeschnitten sind. In dieser Funktion erfüllt Ogham die Rolle einer „Zeremonialschrift“ (Dillon und Chadwick 1966, 369). Die meisten Steine mit OghamInschriften (etwa 300) stammen aus Irland (vgl. Karte 36.3). Weitere 60 sind in Wales, Schottland und auf der Insel Man gefunden worden. Die Kontakte der christlichen Kelten zwischen Wales und Irland entfalten sich erst zu einer Zeit, als die Römer bereits aus Britannien abgezogenen waren, d. h. nach 410 n. Chr. Während in Irland Ogham-Inschriften in der Zeit vor und nach der Christianisierung entstanden sind, sind sämtliche Steininschriften aus Britannien in die christliche Periode zu datieren.
Abb. 36.5: Das Ogham-Alphabet (nach Haarmann 1990 b, 467).
Bitte um Schadenzauber (Green 1992, 165). Oghma wird in der altirischen Literatur auch als Schöpfer der nach ihm benannten Schrift erwähnt. Die Buchstaben des Ogham werden in der irischen Tradition nach Bäumen und anderen Pflanzen benannt (z. B. B nach beithe ‘Birke’, C nach coll ‘Stechpalme’, D nach daur ‘Eiche’, usw.). Die Assoziationen dieser Art von Namengebung weisen auf die chtonischen Attribute des weiblichen Götterkults. Typologisch ähnelt die keltische Bezeichnungsreihe der Buchstaben der Ogham-Schrift der für die germanischen Runen (siehe Art. 37 § 3.1.),
9.4. Zu einer Zeit, als sich an der Peripherie der Keltike die archaisch-irische Schriftkultur in keltischer Sprache und Ogham-Schrift entwickelte, hatten die Kelten auf dem Festland im Akkulturationsprozeß ihre einheimische Schrifttradition fast ganz aufgegeben. Als Schriftsprache verwendeten sie das Lateinische, das einzige Medium, das den Galliern den Zugang zu römischer Bildung, zu den römischen Handelskontakten und zu sozialem Aufstieg ermöglichte. Aus römischer Zeit sind zahlreiche Weihinschriften in lateinischer Sprache für keltische Gottheiten überliefert. Auch bei den britannischen Kelten spielte das Lateinische eine zentrale Rolle als Schriftsprache. Daß die Verbreitung des christlichen Bildungsguts und der Schriftkultur in Britannien unter dem Patronat des Lateinischen stand, kann man an den Spuren erkennen, die die lateinische Schriftlichkeit im Lehnwortschatz der keltischen Sprachen hinterlassen hat (z. B. abecedarium ⬎ kymr. egwyddor ‘Alphabet; Katechismus’, bret. digouegor ‘Alphabet’, littera ⬎ kymr. llythyr(en) ‘Buchstabe’, llythyr ‘Brief’, bret. lizher(enn) ‘Buchstabe’, lizher ‘Brief; Sendschreiben’, scribendum ⬎ kymr. ysgrifennu, bret. skrivan ‘schreiben’, librum ⬎ kymr. llyfr, bret.
794
VI. Keltisches, Germanisches und Slavisches Altertum
Abb. 36.6: Mit Zahlzeichen beschriftete Orakelhölzer von Ballinderry (nach Mytum 1992, 55).
Karte 36.3: Die Verbreitung von Ogham-Inschriften in Irland (nach Mytum 1992, 32).
levr ‘Buch’, legendum ⬎ kymr. llen ‘Literatur’, calamu ⬎ kymr. calaf ‘Schilfrohr (zum Schreiben)’). Die Bildung lag in christlicher Zeit bei den Vertretern des Klerus. Darauf weist etwa die Bedeutung des aus cleru ent-
lehnten kymr. clwyr (Kollektivbegriff) ‘Barden, Dichter’. Es gibt aber Hinweise darauf, daß das Keltische in Gallien noch im 3. und 4. Jahrhundert n. Chr. als Schriftsprache verwendet
36. Zeichenkonzeptionen im keltischen Altertum
wurde, und zwar in der speziellen juridischen Funktion zur Abfassung von Testamenten. In einer Verfügung des Präfekten Ulpianus aus den zwanziger Jahren des 3. Jahrhunderts heißt es: „Fideicommissa quocunque sermone relinqui possunt, non solum latina vel graeca lingua, sed etiam punica vel gallicana vel alterius cuiusque gentis“ („Testamentarische Bestimmungen können in jeder beliebigen Sprache aufgezeichnet werden, nicht nur in Lateinisch oder Griechisch, sondern auch in Punisch, Gallisch oder in der Sprache irgendeines anderen Volkes“; lat. Text zitiert nach Reichenkron 1965, 259). In moderner Auslegung dieser Bestimmung würde man von einem Rechtsschutz für die nichtlateinischen Sprachen im Imperium Romanum sprechen. Die Verfügung des Ulpianus ist somit die älteste Schutzbestimmung für Minderheitensprachen in einem europäischen Staatswesen.
10. Zur Kontinuität keltischer Kulturtraditionen im nachantiken Europa 10.1. In Irland, wo der christlich-lateinische Einfluß erst im 5. Jahrhundert spürbar wird, wird die vorchristliche Gesellschaft auf friedlichem Wege transformiert (Mytum 1992, 53 ff). Die Ogham-Schriftkultur ist ähnlich flexibel wie die Runenschrift in Skandinavien und paßt sich den neuen religiös-weltanschaulichen Gegebenheiten der christlichen Periode an. Seit dem 5. Jahrhundert rivalisiert die einheimische irische Schriftkultur in Ogham erfolgreich mit den Symbolträgern des Christentums, mit der Lateinschrift und dem Lateinischen. Das frühmittelalterliche Irland erlebt eine Zeit der Kultursymbiose
795 von einheimischen und importierten Elementen. Auf die Gleichrangigkeit der Schriftsysteme in bestimmten Funktionen im frühchristlichen Irland weisen unter anderem zweisprachige Grabinschriften in zwei Schriftsystemen (vgl. Abb. 36.7). Allerdings ist der Schriftgebrauch ansonsten funktionell klar unterschieden. Ogham wird für Grabinschriften, Besitzdokumente und Landmarkierungen gebraucht, die Lateinschrift ist Medium der christlichen Literatur. Die keltischen Rechtsbräuche werden nicht in Ogham aufgezeichnet, wahrscheinlich um zu verhindern, daß Uneingeweihte Zugang zu den Kodices erhalten. Die einheimischen Rechtstexte werden erst zu einer Zeit in irischer Sprache und in lateinischer Schrift kompiliert, als das Ogham-System nicht mehr in Gebrauch ist. In Irland werden Texte in der Ogham-Schrift noch in der ersten Hälfte des 7. Jahrhunderts n. Chr. aufgezeichnet. Nach etwa 650 kommt das einheimische Alphabet außer Gebrauch, vielleicht, weil es damals in einer puristischen Bewegung von den Kirchenvertretern als Relikt aus „heidnischer“ Zeit geächtet wurde und damit sein ehemaliges Prestige verlor. Die passive Kenntnis der Ogham-Schrift blieb aber das ganze Mittelalter hindurch lebendig. Die Aktivitäten der Kirchenvertreter in den aufstrebenden christlichen Gemeinden Irlands bestimmen bald das Tempo der zivilisatorischen Entwicklung im keltischen Siedlungsgebiet. Vertreter des irischen Klerus pflegen enge Kontakte mit den im Abwehrkampf gegen die Germanen stehenden Kelten in Wales, vor allem in den Klöstern Llancarvan und Menevia in Südwales. Iren kolonisieren Schottland sowie die Orkney-Inseln und siedeln sogar in Island. Als die Wikinger in der zweiten Hälfte des 9. Jahrhunderts dort-
Abb. 36.7: Zweisprachige Inschrift mit lateinischem Alphabet und Ogham-Schrift. Die lateinische Inschrift lautet: „Sagrani fili Cunotami“, die irische: „Sagramni maqi Cunotami“; Übersetzung: ‘[Grab] des Sagran, des Sohnes von Cunatam’.
796 hin gelangen, treffen sie irische Mönche und Siedler an. Der irischen Mission stellt sich in den „heidnischen“ Germanenreichen des Kontinents eine große weltanschauliche Her-
VI. Keltisches, Germanisches und Slavisches Altertum
ausforderung. Im Rheinland findet man noch Spuren ihres Wirkens. Beispielsweise stammt der Ausdruck clocca (⬎ dt. Glocke) aus der von den Iren verwendeten Kirchensprache
Abb. 36.8: Blatt des Codex Usserianus Primus, eines frühmittelalterlichen Evangeliars aus dem Kloster Bobbio (nach Porcher 1969, 173).
36. Zeichenkonzeptionen im keltischen Altertum
797
und hat sich vom Rhein-Mosel-Gebiet aus in die anderen deutschen Dialekte verbreitet (Müller und Frings 1968, 513). Iren gelangen bis nach St. Gallen in der Schweiz und Bobbio in der Lombardei. Im dortigen Kloster ist eines der irischen Evangelien entstanden, in dem die Ornamentation norditalienisch-germanisch, die kalligraphische Ausgestaltung rein irisch ist (vgl. Abb. 36.8). 10.2. Hier zeigt sich exemplarisch die Fähigkeit der frühmittelalterlichen irischen Kunst zur Symbiose mit kontinentalen Elementen. In der Lombardei wurde die Buchornamentation insbesondere von dem Kopisten Valerianus im 7. Jahrhundert beeinflußt (Porcher 1969, 137, 165). Die Stilistik der valerianischen Tradition beeindruckte nicht nur die Vertreter der irischen Mission in Norditalien, sondern auch die klerikalen Künstler in wichtigen Zentren der Buchmalerei außerhalb Italiens, und zwar in Luxeuil und Corbie. Die Ornamentik der irischen Buchillustrationen lehnt sich auffällig an die valerianische Richtung an, die Schriftgestaltung, wozu auch der Kult der Initialmodellierung gehört, ist dagegen typisch irisch geprägt. Künstlerisch ausgereifte Meisterwerke von Buchstabenmodellierungen unter Verwendung von floralem Design und stilisierten Tierdarstellungen finden sich unter anderem im Book of Kells, einer reich illuminierten Textausgabe der vier Evangelien nach der Vulgata-Version, die im 8. Jahrhundert entstand (vgl. Abb. 36.9 und 36.10 auf Tafel V ⫹ VI). „On account of the lavish abundance and exceptional perfection of its artistic work this book is justly regarded […] as by far the costliest relic of ancient Celtic art that has come down to our time“ (Bruun 1986, 137). Bedenkt man den technischen und künstlerischen Aufwand, der mit der Buchherstellung und -ornamentierung in Irland betrieben wurde, kann man vom Schriftdekor Irlands berechtigterweise sagen, daß dieser Kult der Buchkunst im zeitgenössischen Westeuropa keine Parallele findet (zu Parallelen in der islamischen Welt vgl. Art. 90 § 10.3.). Die Schrifttype der heiligen Bücher Irlands, die irische Halbunziale, bleibt als Zeremonialschrift auf die Buchkultur beschränkt (vgl. Abb. 36.11 auf Tafel VII). Daneben prägte sich eine Minuskelvariante aus, die ebenfalls im späten Buchstil Verwendung findet (vgl. Abb. 36.12). Aus diesem Schriftstil entsteht eine Kursive, die bis heute im wesentlichen unverändert geblieben ist.
Abb. 36.12: Irische Minuskelschrift des 8. Jahrhunderts n. Chr.: Text aus dem Salabergapsalter (vgl. Haarmann 1990 b, 470).
Zur höchsten Blüte gelangte die Buchkunst mit ihren vielfältigen Ornamenten und ihrem auf der lateinischen Halbunziale des 5. Jahrhunderts basierenden unverwechselbaren Schriftstil, der irischen Buchschrift, die in den Werken der sakralen Literatur schon gegen Ende des 6. Jahrhunderts auftritt, in Irland selbst, und zwar im Verlauf des 7. und 8. Jahrhunderts. „Nowhere and in no other period was there so ardent a desire to produce a perfect script, worthy of the sacred text, no matter what the cost and labour this involved. Taking over the decorative elements ⫺ geometric motifs and forms adapted from the animal kingdom [Irland] ⫺ used by the metal-workers practising in the British Isles, the painter developed them methodically, combined and contrasted them, giving free play to his imagination implemented by a fine sense of the appropriate colours“ (Porcher 1969, 157). 10.3. Äußere Zeichen der keltisch-christlichen Kultursymbiose in Irland sind die Verwendung zweier Sprachen (Irisch, Lateinisch),
798 zweier Schriftsysteme (Ogham-Alphabet, Lateinschrift) sowie zweisprachiger christlicher Inschriften und die Entstehung einer nach Sprachen getrennten Literatur mit einerseits antik-christlicher und andererseits einheimisch keltisch-mythischer Thematik. Während die frühen Grabinschriften sehr kurz sind und im wesentlichen Eigennamen, Verwandtschaftsbezeichnungen und einige Schlüsseltermini des christlichen Vokabulars beinhalten, entstehen längere Texte in Irisch erst gegen Ende des 6. Jahrhunderts. Das lateinisch geschriebene Schrifttum des frühmittelalterlichen Irland ist reichhaltiger als die Schrifttradition im zeitgenössischen Gallien der Merowinger. Die seit etwa 650 n. Chr. in Lateinschrift aufgezeichnete irisch-sprachige Literatur ist die älteste des nachantiken Westeuropa in einer Volkssprache. Die irische Schriftkultur lehnt sich zwar an die lateinische an, ist aber nicht von dieser abhängig. Dies kann man unter anderem daran erkennen, daß im Verlauf des 8. und 9. Jahrhunderts neben der religiösen Lyrik eine neue literarische Gattung populär wird, die Sagendichtung mit keltisch-„heidnischer“ Thematik. Die irischen Heldensagen, die erst aus Handschriften des 12. Jahrhunderts bekannt sind, werden in drei Hauptzyklen eingeteilt (Dillon und Chadwick 1966, 422 ff). In Anlehnung an die lateinische Hymnendichtung entsteht auch eine metrische Form typisch irischer Prägung, die nuachrotha (‘neue Formen’). 10.4. Die Kelten in Britannien durchleben im 5. Jahrhundert n. Chr. eine Periode der Unruhe (Millett 1990, 229). Die Migrationsbewegung der Völkerwanderung auf dem Kontinent greift nach Britannien über. Der Südosten Britanniens fällt schnell in die Hände der landnehmenden Angeln und Sachsen. Die Angeln drängen nach Norden vor, die Sachsen nach Südwesten. Der römische Kaiser Honorius fordert die keltischen Civitates auf, die Verteidigung des christlichen Britannien selbst zu übernehmen. Ein letztes Gesuch der Kelten um römische Militärhilfe im Jahre 446 n. Chr. bei Aetius bleibt fruchtlos. Die Weltmacht Rom steht damals selbst in ihren letzten Abwehrkämpfen gegen die Germanen. Viele keltische Christen flüchten nach Westen, nach Wales und von Cornwall aus in die Ar(e)morica, in das ‘Land am Meer’, das später von den Franzosen Bretagne genannt wird. Nur die Kelten in Wales können sich gegen die „heidnischen“ Germanen erfolg-
VI. Keltisches, Germanisches und Slavisches Altertum
reich verteidigen. Der größte Teil des bereits von den Römern christianisierten Britannien geht allerdings verloren. Die Inselkelten, die aus Britannien in die Armorica fliehen, treffen dort auf Festlandkelten, von denen nur noch wenige ihre einheimische Muttersprache sprechen. Die meisten haben sich bereits assimiliert und sprechen Lateinisch. Aus jener Zeit der ersten Siedlungskontakte zwischen keltisch-sprachigen Inselkelten und lateinisch sprechenden Galliern stammt eine beträchtliche Zahl lateinischer Lehnwörter des Bretonischen, die keine Parallelen im Lexikon des Kymrischen finden wie beispielsweise anticu ⬎ altbret. entic ‘alt’, calatorium ⬎ bret. kaladur ‘Haspel’ oder cunic(u)lu ⬎ bret. konikl ‘Kaninchen’ (vgl. Haarmann 1973, 31 ff mit einer Gesamtübersicht dieser Elemente). Die meisten dieser erst in der Armorica entlehnten Ausdrücke leben auch in den gallo-romanischen Sprachen weiter. Hierzu gehören unter anderem Entlehnungen, die bereits eine lautliche Beeinflussung des gesprochenen Altromanisch jener Region zeigen (z. B. cotoneu/ *codoneu ⬎ bret. kouzoin ‘Quitte’, metallea/ *medallea ⬎ bret. mezhel ‘kleine Münze’, seta/*seda ⬎ bret. seiz ‘Seide’). Die inselkeltisch-sprechlateinischen Kontakte in der Armorica leiten bruchlos über zu den keltischaltromanischen und später zu den altbretonisch-altfranzösischen Kontakten (Jackson 1967). Mit zunehmendem Einfluß des Nordfranzösischen wächst auch die Tendenz zur Zweisprachigkeit, und bereits im 16. Jahrhundert dominiert das Französische als Schriftsprache in der Bretagne. 10.5. Nicht nur über die irische Mission haben Kelten auf die europäische Kultur eingewirkt, sondern auch noch zu einer Zeit, als die französische Literatur in Nordfrankreich ihre mittelalterliche Hochblüte erlebte. Ein wichtiger Bereich des damaligen literarischen Schaffens ist thematisch und motivgeschichtlich aufs engste mit dem keltischen Sagenkreis verknüpft. Die altfranzösische Literatur gliedert sich in drei Stoffgebiete, deren Einteilung schon von Jehan Bodel d’Arras in seinem zwischen 1196 und 1200 verfaßten Sachsenlied (Chanson des Saisnes) vorgenommen wird: die Heldenepen, die Antikenromane und die Ritterromane. Die Themen des letzteren Stoffgebietes werden im Cycle Breton zusammengefaßt, den man im Deutschen „Artusepik“ nennt (Brogsitter 1965). Motive der keltischen Mythologie erfreuten sich da-
799
36. Zeichenkonzeptionen im keltischen Altertum
mals in Frankreich besonderer Beliebtheit. Eine wichtige Rolle für die Verbreitung dieses „exotischen“ Gedankenguts in der Romania dürfte die Eroberung Englands durch die Normannen im Jahre 1066 gespielt haben, so daß die altfranzösische Schriftkultur nicht nur im Mutterland, sondern auch in Britannien in direktem Kontakt mit dem keltischen Kulturkreis stand. Die Beziehung zur christlich-höfischen Kultur Frankreichs wurde über die legendäre Person von König Artus hergestellt, der als keltischer Heerführer im 5. Jahrhundert die Verteidigung des christlichen Britannien gegen die Angeln und Sachsen organisierte. Daß es sich bei Artus nicht um eine nebensächliche Figur gehandelt hat, geht allein daraus hervor, daß er kürzlich als (vermeintlicher) Begründer des britischen Königshauses in dessen Genealogie aufgenommen worden ist. Artus war berühmt wegen seiner Tafelrunde, deren Mitglieder sich um die Erfüllung des im Mittelalter hochgeschätzten Kodex ritterlicher Tugenden bemühten. Die Thematik der Heldentaten jener Ritter wurde literarisch meisterhaft in den Romanen des Chre´tien de Troyes (um 1135 bis 1190), des bekanntesten champagnischen Hofdichters, verarbeitet, zu dessen Hauptwerken die Erzählung vom Gral (Perceval le Gallois ou Le conte du Graal, entstanden um 1180) gehört. Von Frankreich aus wanderte der PercevalStoff nach Deutschland, wo die bis Wagners Parsifal reichende Tradition von dem Minnesänger Wolfram von Eschenbach begründet wurde. Weltrang haben auch die Lais (Les lais) der Äbtissin Marie de France (um 1130 bis 1200) erreicht, die in England lebte und ihre Werke der Artusepik in Anglonormannisch schrieb. Noch einmal hat die keltische Kultur die Weltliteratur beeinflußt, nämlich als der rationale Zeitgeist der Aufklärung in der empfindsamen Literatur mit ihrer Emanzipation des Gefühlvollen und Nostalgischen sein Gegengewicht fand. Die angeblichen Nachdichtungen des gälischen Barden Ossian, die James MacPherson (1736⫺1796) in englischer Sprache veröffentlichte (Fragments of Ancient Poetry, 1760; Temora, 1763), die Ossiantexte, die sich erst viel später als Fälschung erwiesen, sind eine nostalgische Rückblende in die episch-heroische Zeit der Kämpfe der Iren gegen die Wikinger. Die empfindsame Besinnung im wolkig-romantischen Stil auf die Werte der alten keltischen Kultur fand bei den Europäern des 18. Jahrhunderts, die sich
ebenfalls auf die nostalgische Suche nach den Wurzeln ihrer Nationalkulturen begeben hatten, weiten Anklang. In der englischen Literatur erleben die Adaptationen der gälischen Bardenlyrik einen wahren Boom, die Ossiandichtung entwickelt sich zu einem eigenen literarischen Genre der Vorromantik. Bereits 1764 liegt MacPhersons Ossiansammlung in deutscher Übersetzung vor. Auf die englische und deutsche Version stützen sich zahlreiche Nachdichtungen. Die zeitgenössische Bewegung des Celtic Revival speist sich aus der nostalgischen Stimmung, die durch die Ossiandichtungen verbreitet wird. Zwar bewirken philologische Traktate wie die Archaeologia Britannica (1707) von Edward Lhwyd das Ihre für die Entstehung eines Zusammengehörigkeitsgefühls in den keltischen Sprachgemeinschaften, die Gattung der Ossiandichtung spielt aber insbesondere auf die Gefühlswelt an, die in letzter Konsequenz den Ausschlag in der nationalen Bewegung bei allen europäischen Nationen gegeben hat. Die Hinwendung zum gallischen Erbe bringt auch in Frankreich im 18. Jahrhundert den Durchbruch zur „modernen“ Identität der Franzosen. Das bis dahin vorherrschende Bewußtsein des Romanismus wird mit der Besinnung auf das vorrömische Kulturgut erweitert. Die Popularität der Comic-Serie Asterix begründet sich nicht zuletzt mit der gallischen Komponente im Nationalbewußtsein der Franzosen. Das Celtic Revival hat nicht nur den Zusammenhalt zwischen den keltischen Sprachgemeinschaften gestärkt, sondern auch eine umfangreiche Sprachpflege aktiviert, die im modernen Irland die Organisationsformen einer systematischen Sprachplanung entfaltet hat (O Baoill und O Riagain 1990). In allen keltischen Sprachgemeinschaften der Moderne überflügeln allerdings Prozesse von Sprachwechsel die Resistenzkräfte der Sprachloyalität (vgl. Lewis 1981, 83 ff mit einer Synthese zum „Decline of Celtic Languages“, Berger 1988 zu den Verhältnissen in der Bretagne, Dorian 1981 zum Sprachentod in Schottland).
11. Literatur (in Auswahl) Anati, E. (1979), La pre´histoire des Alpes. Les Camuniens, aux racines de la civilisation europe´enne. Mailand. Assmann, A. und D. Harth (eds.), (1991), Kultur als Lebenswelt und Monument. Frankfurt a. M. Antiquities of Roman Britain (Trustees of the British Museum). London 1964 (3. Aufl.).
800 Bammesberger, A. (1983), A Handbook of Irish, vol. 2: An Outline of Modern Irish Grammar. Heidelberg. Bednarczuk, L. (1988), „The Italo-Celtic Hypothesis from a Linguistic Point of View“. In: MacLennan 1988: 175⫺189. Berger, M. (1988), Sprachkontakt in der Bretagne: Sprachloyalität versus Sprachwechsel. Tübingen. Binchy, D. A. (1966), „Bretha De´in Che´cht“. E´riu 20: 1⫺66. Boardman, J. (1964), The Greeks Overseas. Their Early Colonies and Trade. London (erweiterte Neuauflage 1980). Bonfante, L. (1990), „Etruscan“. In: Reading the Past 1990: 321⫺378. Bosch-Gimpera, P. (1940), „Two Celtic Waves in Spain“. In: Proceedings of the British Academy 26: 29⫺148. Bosch-Gimpera, P. (1961), Les Indo-Europe´ens. Paris. Brogsitter, K. O. (1965), Artusepik. Stuttgart. Bromlej, J. V. (1983), Ocˇerki teorii etnosa. Moskau. Bruun, J. A. (1986), „An Enquiry into the Art of the Illuminated Manuscripts of the Middle Ages“. In: The Book of Kells 1986: 100⫺138. Budinszky, A. (1881), Die Ausbreitung der lateinischen Sprache über Italien und die Provinzen des Römischen Reiches. Berlin. Burgess, C. (1974), „The Bronze Age“. In: Renfrew 1974: 165⫺232. Byrne, F. J. (1973), Irish Kings and High-Kings. London. Caesar, De bello gallico. Vgl. Edwards 1963. Cardona, G. et al. (eds.) (1970), Indo-European and Indo-Europeans. Philadelphia. Carney, J. (1975), „The Invention of the Ogam Cipher“. E´riu 26: 53⫺65. Condren, M. (1989), The Serpent and the Goddess. Women, Religion, and Power in Celtic Ireland. San Francisco. Dauzat, A. und C. Rostaing (1963), Dictionnaire e´tymologique des noms de lieux en France. Paris. Dillon, M. und N. K. Chadwick (1966), Die Kelten. Von der Vorgeschichte bis zum Normanneneinfall. Zürich. Dillon, M. und N. K. Chadwick (1972), The Celtic Realms. London (2. Aufl.). Diodorus Siculus, Bibliotheke. Vgl. Oldfather 1939. Dobesch, G. (1991), „Le fonti letterarie“. In: Moscati et al. 1991: 35⫺41.
VI. Keltisches, Germanisches und Slavisches Altertum Edwards, H. J. (ed.) (1963), Caesar, the Gallic War. (Loeb Classical Library) London. Edwards, J. R. (1985), Language, Society and Identity. Oxford. Elue`re, C. (1987), Das Gold der Kelten. München. Falc’hun, F. (1949), L’histoire de la langue bretonne d’apre`s la ge´ographie linguistique. Rennes. Falc’hun, F. (1981), Perspectives nouvelles sur l’histoire de la langue bretonne. Paris. Fleuriot, L. (1975), „L’inscription celtibe`re de Botorrita“. E´tudes celtiques 14: 405⫺442. Fodor, I. und C. Hage`ge (eds.) (1990), Language Reform. History and Future/La re´forme des langues. Histoire et avenir/Sprachreform. Geschichte und Zukunft. Bd. 5. Hamburg. Geiriadur Prifysgol Cymru (Dictionary of the University of Wales). Aberystwyth 1950 ff. Giles, H. (ed.) (1977), Language, Ethnicity and Intergroup Relations. London. Gimbutas, M. (1970), „Proto-Indo-European Culture: the Kurgan Culture during the 5th to the 3rd Millennia B. C.“. In: Cardona et al. 1970: 155⫺ 198. Gimbutas, M. (1973), „Old Europe c. 7000⫺3500 B. C., the Earliest European Cultures before the Infiltration of the Indo-European Peoples“. The Journal of Indo-European Studies 1: 1⫺20. Gimbutas, M. (1974), The Gods and Goddesses of Old Europe 7000 to 3500 B. C.: Myths, Legends and Cult Images. London (2. Aufl. 1982). Gimbutas, M. (1989 a), The Language of the Goddess. San Francisco. Gimbutas, M. (1989 b), „The Social Structure of Old Europe“. The Journal of Indo-European Studies 17: 197⫺214. Gimbutas, M. (1991), The Civilization of the Goddess. The World of Old Europe. San Francisco. Gourvil, F. (1968), Langue et litte´rature bretonnes. Paris (3. Aufl.). Graves, R. (1948), The White Goddess. London. Green, M. J. (1989), Symbol and Image in Celtic Religious Art. London und New York. Green, M. J. (1992), Dictionary of Celtic Myth and Legend. London. Greene, D. (1964), „The Celtic Languages“. In: Raftery 1964: 9⫺22. Haarmann, H. (1970), Der lateinische Lehnwortschatz im Kymrischen. Bonn. Haarmann, H. (1973), Der lateinische Lehnwortschatz im Bretonischen. Hamburg.
Dorian, N. C. (1981), Language Death. The Life Cycle of a Scottish Gaelic Dialect. Philadelphia.
Haarmann, H. (1976), Aspekte der Arealtypologie. Die Problematik der europäischen Sprachbünde. Tübingen.
Dottin, G. (1920), La langue gauloise. Grammaire, textes et glossaire. Paris.
Haarmann, H. (1979), Der lateinische Einfluß in den Interferenzzonen am Rande der Romania. Ver-
36. Zeichenkonzeptionen im keltischen Altertum gleichende Studien zur Sprachkontaktforschung. Hamburg. Haarmann, H. (1983), „Kriterien der ethnischen Identität“. Language Problems and Language Planning 7: 21⫺42. Haarmann, H. (1986), Language in Ethnicity. A View of Basic Ecological Relations. Berlin, New York und Amsterdam. Haarmann, H. (1990 a), Language in Its Cultural Embedding. Explorations in the Relativity of Signs and Sign Systems. Berlin und New York. Haarmann, H. (1990 b), Universalgeschichte der Schrift. Frankfurt a. M. und New York (2. Aufl. 1992). Haarmann, H. (1992 a), Die Gegenwart der Magie. Kulturgeschichtliche und zeitkritische Betrachtungen. Frankfurt a. M. und New York. Haarmann, H. (1992 b), Early Civilization and Literacy in Europe. Old Europe, the Ancient Aegean, Ancient Cyprus, Archaic Italy (Buchmanuskript). Haarmann, H. (1993), Die Sprachenwelt Europas. Geschichte und Zukunft der Sprachnationen zwischen Atlantik und Ural. Frankfurt a. M. und New York. Helm, R. et al. (eds.) (1931), Natalicium Johannes Geffcken. Heidelberg. Hemon, R. (1958 ff), Geriadur istorel ar brezhoneg (Dictionnaire historique du breton). La Baule. Hemon, R. (1964), Dictionnaire breton-franc¸ais. Brest (3. Aufl.). Hess-Lüttich, E. W. B. und J. Papio´r (eds.) (1990), Dialog: Interkulturelle Verständigung in Europa. ⫺ Ein deutsch-polnisches Gespräch. Saarbrücken. Hitz, H.-R. (1988), Les inscriptions de Glozel. Essai de de´chiffrement de l’e´criture. Te´moignages d’une civilisation proto-celtique. Ettingen. Hofmann, J. B. (1966), Etymologisches Wörterbuch des Griechischen. Darmstadt. Hoz, J. de (1982), „Cro´nica de lingüı´stica y epigrafia de la Penı´nsula Ibe´rica“. Zephyrus 34⫺35: 295⫺311. Hubert, J. et al. (eds.) (1969), Europe in the Dark Ages. London. Hutton, R. (1991), The Pagan Religions of the Ancient British Isles. Their Nature and Legacy. Oxford und Cambridge, Mass. Jackson, K. H. (1953), Language and History in Early Britain. Edinburgh (2. Aufl. 1963). Jackson, K. H. (1967), A Historical Phonology of Breton. Dublin. Jackson, K. H. (1980), „The Pictish Language“. In: Wainwright 1980: 129⫺166, 173⫺176. Jones, H. L. (1928), The Geography of Strabo V. (Loeb Classical Library) London. Kahrstedt, U. (1938), „Eine historische Betrachtung zu einem prähistorischen Problem“. Praehistorische Zeitschrift 28/29: 401⫺405.
801 Kimming, W. (ed.) (1954), Festschrift für Peter Goessler. Stuttgart. Kloss, H. (1969), Grundfragen der Ethnopolitik im 20. Jahrhundert. Wien und Stuttgart. Kruta, V. (1991a), „La scrittura“. In: Moscati et al. 1991: 491⫺498. Kruta, V. (1991b), „La religione“. In: Moscati et al. 1991: 499⫺507. Lejeune, M. (1970), „Documents gaulois et paragaulois de Cisalpine: Lepontica“. E´tudes celtiques 12: 357⫺500. Lewis, E. G. (1981), Bilingualism and Bilingual Education. Oxford. Lewis, H. (1946), Datblygiad yr laith Gymraeg. Caerdydd. Lewis, H. (1989), Die kymrische Sprache. Innsbruck. Lewis, H. (1990), Handbuch des Mittelkornischen. Innsbruck. Lewis, H. und H. Pedersen (1961), A Concise Comparative Celtic Grammar. Göttingen. Lewy, E. (1942), „Der Bau der europäischen Sprachen“. In: Proceedings of the Royal Irish Academy 48, C, 2. Dublin (Neudruck Tübingen 1964). Lucan, Pharsalia. Text mit Übersetzung herausg. von W. Ehlers (Tusculum-Ausgabe). München und Zürich 1973. MacLennan, G. W. (ed.) (1988), Proceedings of the First North American Congress of Celtic Studies. Ottawa. Map of Roman Britain. Chessington: Ordnance Survey 3. Auflage 1956 (Erstes Teilstück des TIRProjekts Tabula Imperii Romani). Map of Southern Britain in the Iron Age (5. Jh. v. Chr.⫺1. Jh. n. Chr.). Chessington: Ordnance Survey 1962. Map of Britain in the Dark Ages (5. Jh.⫺8. Jh. n. Chr.). Southampton: Ordnance Survey 2. Auflage 1965. Markale, J. (1984), Die keltische Frau. Mythos, Geschichte, soziale Stellung. München (2. Aufl.). Markale, J. (1988), Die Druiden. Gesellschaft und Götter der Kelten. München (2. Aufl.). Matthews, C. (1989), The Elements of the Celtic Tradition. Shaftesbury. Megaw, J. V. S. (1991), „La musica celtica“. In: Moscati et al. 1991: 643⫺648. Meid, W. (1986), „The Celtic Languages“. In: Schmidt 1986: 116⫺122. Millett, M. (1990), The Romanization of Britain. An Essay in Archaeological Interpretation. Cambridge, England. Mohen, J.-P. (1989), Megalithkultur in Europa. Geheimnis der frühen Zivilisationen. Stuttgart und Zürich. Moscati, S. et al. (eds.) (1991), I Celti. Milano.
802 Müller, G. und T. Frings (1968), Germania romana II. Halle.
VI. Keltisches, Germanisches und Slavisches Altertum
Schmidt, K. H. (1979), „On the Celtic Languages of Continental Europe“. Bulletin of the Board of Celtic Studies 28: 189⫺205.
Schmidt, K. H. (1992), „Zur Inschrift von Botorrita“. Indogermanische Forschungen 97: 236⫺241. Schmidt, K. H. (ed.) (1986), Geschichte und Kultur der Kelten. Heidelberg. Senn, A. (1966), Handbuch der litauischen Sprache, Bd. I: Grammatik. Heidelberg. Sims-Williams, P. (1992), „The Celtic Languages“. In: Ramat und Ramat 1992. Spindler, K. (1991), Die frühen Kelten. Stuttgart (2. Aufl.). Stephens, M. (1976), Linguistic Minorities in Western Europe. Llandysul. Strabo, Geographika. Vgl. Jones 1928. Tacitus, Annales. Textedition von E. Koestermann. (Bibliotheca Teubneriana) Leipzig 1960 ff. The Book of Kells (described by Sir Edward Sullivan). London 1986. Thurneysen, R. (1946), A Grammar of Old Irish. Dublin (Übersetzung der deutschen Ausgabe von 1909). Tierney, J. J. (1960), „The Celtic Ethnography of Posidonius“. In: Proceedings of the Royal Irish Academy 60, C. Dublin: 189⫺275. Tovar, A. (1949), Estudios sobre las primitivas lenguas hispa´nicas. Buenos Aires. Tovar, A. (1977 a), Einführung in die Sprachgeschichte der iberischen Halbinsel. Tübingen. Tovar, A. (1977 b), „Indogermanisch, Keltisch, Keltiberisch“. In: Schmidt 1977: 44⫺65. Tovar, A. (1986), „The Celts in the Iberian Peninsula: Archaeology, History, Language“. In: Schmidt 1986: 68⫺101. Untermann, J. (ed.) (1980), Die Sprachen im römischen Reich der Kaiserzeit. Köln. Vineis, E. (ed.) (1983), Le lingue indoeuropee de frammentaria attestazione. Pisa. Vitali, D. (1991), „I Celti in Italia“. In: Moscati et al. 1991: 220⫺235. Vries, J. de (1963), La religion des Celtes. Paris. Wagner, H. (1959), Das Verbum in den Sprachen der britischen Inseln. Ein Beitrag zur geographischen Typologie des Verbums. Tübingen. Wainwright, F. T. (ed.) (1980), The Problem of the Picts. Perth (2. Aufl.). Watkins, C. (1966), „Italo-Celtic Revisited“. In: Puhvel und Birnbaum 1966: 29⫺50. Watkins, T. A. (1961), Ieithyddiaeth. Agweddau ar astudio iaith. Caerdydd. Weisgerber, L. (1931), „Galatische Sprachreste“. In: Helm et al. 1931: 151⫺175. Williams, A. H. (1962), An Introduction to the History of Wales, vol. 1: Prehistoric Times to 1063 A. D. Cardiff.
Schmidt, K. H. (1983), „Grundlagen einer festlandkeltischen Grammatik“. In: Vineis 1983: 65⫺90.
Harald Haarmann, Helsinki (Finnland)
Müller, K. E. (1987), Das magische Universum der Identität. Elementarformen sozialen Verhaltens. Ein ethnologischer Grundriß. Frankfurt a. M. und New York. Mytum, H. (1992), The Origins of Early Christian Ireland. London und New York. Neumann, G. (1980), „Kleinasien“. In: Untermann 1980: 167⫺185. O Baoill, D. und P. O Riagain (1990), „Reform of the Orthography, Grammar and Vocabulary of Irish“. In: Fodor und Hage`ge 1990: 173⫺195. Oldfather, C. H. (1939), Diodorus of Sicily, III. (Loeb Classical Library) London. Polome´, E. C. (1983), „Celto-Germanic Isoglosses (Revisited)“. The Journal of Indo-European Studies 11: 281⫺298. Porcher, J. (1969), „Book Painting“. In: Hubert et al. 1969: 105⫺206. Posner, R. (1990), „Gesellschaft, Zivilisation, Mentalität“. In: Hess-Lüttich und Papio´r 1990: 23⫺42. Posner, R. (1991), „Kultur als Zeichensystem: Zur semiotischen Explikation kulturwissenschaftlicher Grundbegriffe“. In: Assmann und Harth 1991: 37⫺74. Powell, T. G. E. (1958), The Celts. London (Neuausgabe 1980). Puhvel, J. und H. Birnbaum (eds.) (1966), Ancient Indo-European Dialects. Berkeley und Los Angeles. Raftery, J. (ed.) (1964), The Celts. Cork. Ramat, G. A. und P. Ramat (eds.) (1992), Le lingue indoeuropee. Milano. Reading the Past. Ancient Writing from Cuneiform to the Alphabet (introduced by J. T. Hooker). London 1990. Reichenkron, G. (1965), Historische latein-altromanische Grammatik, Bd. I: Einleitung. Wiesbaden. Renfrew, C. (ed.) (1974), British Prehistory: A New Outline. London. Renfrew, C. (1987), Archaeology and Language. The Puzzle of Indo-European Origins. London. Rix, H. (1954), „Zur Verbreitung und Chronologie einiger keltischer Ortsnamentypen“. In: Kimming 1954: 99⫺107. Ryan, M. (1991), „I Celti cristiani“. In: Moscati et al. 1991: 621⫺637. Schmidt, K. H. (ed.) (1977), Indogermanisch und Keltiberisch. Wiesbaden.
803
37. Zeichenkonzeptionen im germanischen Altertum
37. Zeichenkonzeptionen im germanischen Altertum 1. Begriffserklärung 1.1. Bezeichnungen für Zeichen 1.2. Zeichenkonzeptionen 1.3. „Germanisch“ 1.4. „Germanisches Altertum“ 2. Quellen und Quellenproblematik 3. Schrift 3.1. Die Runenschrift 3.2. Die gotische Schrift 4. Symbolik 5. Religion und Mythos 6. Institutionen und Gebräuche 7. Kunst und Literatur 7.1. Tierornamentik und Skaldendichtung 7.2. Semiotische Beschreibungsansätze zur Literatur 8. Literatur (in Auswahl)
1.
Begriffserklärung
1.1. Bezeichnungen für Zeichen Für Zeichen gibt es in der deutschen Sprache zahlreiche Bezeichnungen (onomasiologischer Aspekt). Das Wort Zeichen geht auf german. *taikna- n. ‘Merkmal, Anzeichen, Zeichen’ zurück, „meist in magisch-religiöser Bedeutung“ (Lehmann 1986, 340) und ist einzelsprachlich gut bezeugt: got. taikn n. ⫽ gr. endeigma ‘Anzeichen’ und taikns f. ⫽ gr. shmei˜on ‘Zeichen, Wunder’, an. teikn ‘Zeichen’, ae. ta¯cen ‘Zeichen, Wunder, Beweis’, ahd. zeih(h)an ‘Zeichen, Siegeszeichen; Bild; Wunder, Sternbild, Tierkreiszeichen’, mhd. zeichen ‘Zeichen, Anzeichen, Merkmal’ und „ein unkörperliches, aber sinnlich wahrnehmbares abbild eines dinges oder einer sache, woran die sache erkannt oder auf sie hingewiesen wird; also auch etwas, was willkürlich als erkennungszeichen oder merkmal bestimmt ist“ (Grimm und Grimm 1956, 476). Zu den Bezeichnungen für Zeichen in anderen Kulturen vgl. Art. 36 § 5. (keltisches Altertum), Art. 39 (griechische Vorklassik), Art. 40 § 1., Art. 45 § 2., Art. 47 § 3.1. und § 6.2. sowie Art. 60 § 2. (griechische und römische Klassik), Art. 61 § 2. (Judentum), Art. 90 § 1. (Islam), Art. 92 § 1. (Hinduismus) und Art. 95 § 3. (Schintoismus). 1.2. Zeichenkonzeptionen Im folgenden wird ein weiter Zeichenbegriff zugrunde gelegt (pansemiotische Zeichenkonzeption vgl. Nöth 1985, 87 ff) und im einzelnen terminologische Unschärfe in Kauf ge-
nommen. Sowohl Zeichenkonzeptionen, die Zeichensystemen (wie der Runenschrift, s. u. § 3.1.) zugrunde liegen, als auch solche, die nicht in einen systematischen Zusammenhang zu bringen sind (wie bei den verschiedenartigen Symbolen, s. u. § 4.), sollen berücksichtigt werden. Diese Zeichenkonzeptionen sind vielfach sprachbezogen, wozu im weiteren Verständnis die Schrift gehört (vgl. Nöth 1985, 322), aber auch nicht-sprachlich/ non-verbal (Signa, Bilder usw. betreffend). Sie fungieren jeweils in einem Kommunikationszusammenhang, der entweder vornehmlich der zwischenmenschlichen Verständigung, in besonderen Fällen aber auch der Kommunikation mit übermenschlichen Wesen wie Göttern, Dämonen oder Geistern dient (vgl. Art. 32 § 5.2. und Art. 47 § 1.3.). Bei der zwischenmenschlichen Kommunikation besteht eine auf Konvention beruhende geregelte Beziehung zwischen Ausdrucksund Inhaltsseite von Zeichen, während in der Kommunikation mit übermenschlichen Wesen im Einzelfall auch Besonderheiten vorkommen können (s. u. § 3.1.). Grundsätzlich ist zwischen eigenständigen kulturspezifischen Zeichenkonzeptionen und solchen zu unterscheiden, die aufgrund genereller anthropologischer Dispositionen unabhängig voneinander entstehen (wie religiöse oder magische Zeichenkonzeptionen), aber auch entlehnt werden können (wie bestimmte Formen der Mantik; vgl. Art. 160), wenngleich das im einzelnen schwer zu entscheiden sein dürfte. Zu den eigenständigen germanischen Zeichenkonzeptionen rechne ich auch diejenigen, die, wie die germanische Runenschrift, von fremden ⫺ d. h. nicht-germanischen ⫺ Schriftsystemen angeregt bzw. aus ihnen entlehnt worden sind, aber dennoch eine typische, unverwechselbare Ausprägung erhalten haben, so daß sie als „germanisch“ bezeichnet werden und erkennbar sind. Der Schwerpunkt der Darstellung wird auf diesen eigenständigen, auf Vereinbarung beruhenden Zeichenkonzeptionen der Germanen liegen, wozu auch Symbole und Tierornamentik gehören, während andere bei ihnen vorkommende eher aufgezählt werden. 1.3. „Germanisch“ Es gibt keine einheitliche Auffassung, was unter „Germanen“, „germanisch“ genau zu verstehen ist (Wenskus 1986, 1 ff). In der phi-
804 lologisch akzentuierten Forschung werden die sprachlichen Merkmale betont, vor allem die Entstehung der charakteristischen Reibelaute im Zuge der Ersten oder Germanischen Lautverschiebung sowie die Akzentfestlegung auf die Stammsilbe, ohne daß dafür ein exakter Zeitpunkt angegeben werden kann. In der archäologischen Forschung gibt es das Problem der sogenannten ethnischen Deutung vor- und frühgeschichtlicher Fundgruppen (Eggers 1986, 199 ff; vgl. auch Art. 36 § 3.). Häufig wird die germanische Ethnogenese in dem Zeitraum vom Beginn der Eisenzeit (8. Jh. v. Chr.) bis um die Mitte des 1. vorchristlichen Jahrtausends angesetzt, wobei die Jastorf-Kultur als älteste germanische Kultur gilt (Ament 1989, 1340). „Es ist nicht ganz unwahrscheinlich, daß die Entstehung der Urform der Sprache jener Völker, die die Römer von Cäsar an am ehesten unter dem Namen Germanen subsumierten, um die Mitte des 1. vorchristlichen Jahrtausends im Zusammenhang mit der Herausbildung der sogenannten ‘Jastorfkultur’ zwischen Dänemark und Böhmen zu sehen ist“ (Reichert 1989, 120). 1.4. „Germanisches Altertum“ Im Vergleich zu den Kennzeichnungen „griechisch-römische Antike“ bzw. „klassisches Altertum“ ist für den germanischen Bereich von Anfang an die Bezeichnung „germanisches Altertum“ geläufig, während „germanische Antike“ nicht vorkommt. Die Benennungen der wissenschaftlichen Disziplinen lauten „klassische Altertumswissenschaft“ gegenüber der seit Beginn der Germanistik üblichen „germanischen Altertumskunde“, die in Jacob Grimms Terminologie „deutsche Altertumskunde“ hieß (Ebel 1974, 18). Während der zeitliche Anfang des germanischen Altertums mit der Mitte des 1. vorchristlichen Jahrtausends in etwa umrissen werden kann, gibt es für sein Ende keine einheitliche Zeitgrenze. Bei Heusler (1969, 14), der unter „germanischer Altertumskunde“ die Erforschung der „Gesittung der Germanen“ versteht, ist „altgermanisch“ ein kulturbezogener Begriff, der bis in die späte Ritterzeit reicht. Hinsichtlich der zeitlichen Abgrenzung schließen sich die folgenden Ausführungen dem Reallexikon der Germanischen Altertumskunde an: Für den Kontinent und England gilt das 9. Jahrhundert, für Skandinavien das 11. Jahrhundert als Endpunkt (vgl. Beck u. a. 1973 a, X).
VI. Keltisches, Germanisches und Slavisches Altertum
2.
Quellen und Quellenproblematik
Archäologische Quellen liegen für das gesamte germanische Altertum vor, geben aber in erster Linie Aufschlüsse über die materielle Kultur. Aus einzelnen Fundkategorien (Grab, Moor, Hort) lassen sich bestimmte, meist religiöse Vorstellungen rekonstruieren. Autochthone Schriftquellen bilden seit dem Ende des 2. nachchristlichen Jahrhunderts Runeninschriften. Im Laufe des Mittelalters, früher im Süden, später im Norden, wird die Runenschrift von der mit der christlichen Mission einhergehenden Lateinschrift verdrängt bzw. abgelöst. Lesung und Deutung der in der ältesten Überlieferung meist kurzen Inschriften sind schwierig und umstritten. Neben diesen epigraphischen Quellen gibt es seit vorchristlicher Zeit germanische Sprachzeugnisse (Appellative, Götter- und Personennamen, geographische Namen, deren weitere Erforschung neue Erkenntnisse für die Ausgliederung der Germanen erbringen kann, vgl. Udolph 1995) bei antiken Autoren. Diese bieten auch die ältesten literarischen Zeugnisse zum germanischen Altertum, wie Cäsars Germanenexkurs in De bello Gallico (lib. VI) und insbesondere die Germania des Tacitus. Der Gebrauch ethnographischer Topoi, die „interpretatio Romana“ und die jeweils eigene Wirkungsabsicht solcher Schriften machen ihre Quellenproblematik für die germanische Altertumskunde aus. Dies gilt entsprechend für von Christen stammende Angaben zu germanischen religiösen und superstitiösen Praktiken. Das erste zusammenhängende sprachlich-literarische Zeugnis von germanischer Seite stellen die erhaltenen Teile der gotischen Bibelübersetzung durch den Bischof Ulfila (4. Jahrhundert) dar. Anspielungen auf Mythen und Sagen begegnen in der nordgermanischen Skaldendichtung seit dem 9. Jahrhundert. Sie werden in den Götter- und Heldenliedern der Edda überliefert, die, im 13. Jahrhundert erst aufgezeichnet, vielfach bereits vor der Bekehrung (um 1000) entstanden sein dürften. Eine systematisch angelegte Mythologie stellt die Prosa-Edda des Isländers Snorri Sturluson (gest. 1241) dar. Jedoch ist Quellenkritik und Rücksicht auf die Einbindung in christliche Interpretationsmuster bei diesem Spätwerk in besonderer Weise angezeigt (Weber 1986 a, 408 ff). Spät aufgezeichnete Mythen können im Einzelfall mit Hilfe anderer Quellen, wie den Bildformeln auf Brakteaten ⫺ einseitig gepreßten dünnen Goldblechen, mit figürlichen Darstellungen
37. Zeichenkonzeptionen im germanischen Altertum
und oftmals mit Inschriften versehen, aus der Völkerwanderungszeit ⫺, als alt ausgewiesen werden (Hauck 1988, 22 ff).
3.
Schrift
3.1. Die Runenschrift Ein Zeichensystem ist seit dem ausgehenden 2. nachchristlichen Jahrhundert in breiter Überlieferung greifbar: die Runenschrift. Sie umfaßt eine Reihe von 24 Zeichen, die in relativ gleichbleibender Form und Ordnung auf 9 Inschriftenträgern (4.⫺6. Jh.) überliefert ist (Krause 1966, Nr. 1⫺8, IK 392). In idealtypischer Wiedergabe sieht diese ältere Runenreihe folgendermaßen aus:
Abb. 37.1: Die Runenreihe (nach Krause 1966, 2).
Eckige Formen kommen neben runden vor. Meist werden die eckigen Zeichenformen auf die ursprüngliche Beritzung von Holz zurückgeführt. Jede Rune repräsentiert einen bestimmten Laut, kann jedoch auch als Zeichen für einen eigenen Begriff stehen, der mit dem Namen der Rune identisch ist. Diese Runennamen beginnen bis auf zwei Ausnahmen mit dem Laut, den die jeweilige Rune repräsentiert (akrophonisches Prinzip): z. B. , Lautwert f, Begriffswert ⫽ Runenname germ. *fehu ‘Vieh, Besitz (Fahrhabe)’. Erstmals Handschriften (seit dem 9. Jh.) überliefern diese Namen auf der Grundlage einer veränderten und erweiterten anglofriesischen (Derolez 1954, 360 f u. ö.) sowie der auf nur 16 Zeichen im Skandinavischen verkürzten jüngeren Runenreihe. Obwohl die Runennamen mit den Zeichen von Anfang an verbunden gewesen sein dürften, bietet die epigraphische Überlieferung nur vereinzelt Beispiele dafür,
805 daß Einzelrunen mit ihrem Begriffswert, d. h. ihrem Runennamen, aufgelöst werden können (Düwel 1976, 150 ff). Dagegen finden sich auch ausgeschriebene Runennamen (z. B. Krause 1966, Nr. 27). Nach den ersten 6 Runen heißt die Reihe auch „(das) Futhark“. Eine Alphabetisierung findet epigraphisch und handschriftlich erst im Mittelalter statt. Die Entsprechung zwischen Runenreihe und Lautsystem scheint nicht in jedem Falle adäquat (z. B. ist der Lautwert der Eibenrune umstritten). Die Reduktion der 24er Reihe auf 16 Runen in Skandinavien seit dem 9. Jahrhundert führt zu lautlicher Mehrdeutigkeit. Möglicherweise hängt damit auch ein Ausweichen von der Runenschrift auf die Lateinschrift zusammen. Für die Frage nach der Vorlage des Runenzeichensystems gibt es keine einheitliche Auffassung. Drei ältere Ansichten stehen sich nach wie vor gegenüber: (a) Nordetruskisch-These (vgl. Düwel 1983, 90 ff; Rix 1992, 411ff), (b) Latein-These in der von Moltke (1985, 62 ff) modifizierten Form: Entstehung im heutigen Dänemark in Anlehnung an die lateinische Schrift (s. auch Seebold 1991, 16 ff), (c) Griechisch-These, die jetzt wieder bezogen auf archaische griechische Alphabete eine Rolle spielt (Antonsen 1982, 8 ff; Morris 1988, 150 ff). Die Ordnung der Runenzeichen in der Futhark-Folge ist unerklärt. Zuletzt wurde erwogen, sie aus einer mystischen Verwendungsweise herzuleiten, bei der abweichend vom Alphabet der Schule und der Gebrauchsschrift dieses zu Paaren mit je einem Zeichen aus der ersten und der zweiten Hälfte umgeordnet wird. Nach jüdischer Terminologie wird dieses Verfahren als „Atbasch“ bezeichnet. In Abwandlung dieses Prinzips könnte in einem komplizierten Verfahren die f/u⫺th/a⫺r/k Zeichenfolge entstanden sein (Seebold 1986, 541 ff; 1993, 415 ff). Die ältere Runenreihe ist auf zwei Brakteaten (5.⫺6. Jh.) mittels vertikal bzw. horizontal angebrachter Punkte in drei Gruppen oder Geschlechter (an. ætt, pl. ættir) zu je 8 Runen eingeteilt. Diese Einteilung erlaubt die Verschlüsselung von Mitteilungen, ohne Runenzeichen direkt zu benutzen. Dieses Metasystem der sogenannten Geheimrunen beruht auf folgenden beiden Koordinaten: (a) der Angabe der Achtergruppe (1⫺3) und (b) der Bezeichnung der Platzziffer, die die gemeinte Rune darin hat (jeweils 1⫺8). Innerhalb der älteren Runenperiode scheint dieses Verfahren nur einmal inschriftlich realisiert worden zu sein (vgl. Krause 1966, Nr. 46). In mittelal-
806 terlichen Handschriften (9.⫺11. Jh.) findet sich das System der hahalruna (vgl. ahd. hahal(a) ‘Kesselhaken’) (Derolez 1954, 133), z. B. 2/3 ⫽ i. Neben dieser Art von handschriftlich und epigraphisch (in der jüngeren Runenreihe) überlieferten Zweigrunen, z. T. in Kreuzform ⫽ ⫹ 2/2 ⫹ 2/3 ⫽ ni, gibt es runenschriftlich eine Reihe von Varianten wie 2/3 ⫽ i und 2/2 ⫽ n (Derolez 1954, 143), wobei im späteren Mittelalter auch skurrile Zeichenformen vorkommen: Strichmännchen, Fratzen, Fische, bei denen jeweils die von Armen herabhängenden Striche, die nach links und rechts herabhängenden Bartsträhnen bzw. Stachel auf Rücken- und Bauchseite die Koordinaten bilden (Page 1973, 65). Gleiche oder verschiedene, jedenfalls in der Größe oder Ausrichtung sich unterscheidende Zeichen können ebenfalls die Funktion von Koordinaten übernehmen, wie kleine i und große I im Isruna-Traktat (Derolez 1954, 120 und Tafel V). In derselben Weise werden weiter lagoruna (kleine und große Runen, nach dem Runennamen lago, ae. lagu ‘Wasser’) angeführt. Dazu kommen stopfruna (ahd. stupf, stopf ‘Punkt’), bei denen übereinander stehende, horizontal angeordnete Punkte Geschlecht und Platzziffer markieren. Schließlich werden clophruna (vgl. ahd. klopfon ‘klopfen’) erwähnt, offenbar eine Art Morse-Alphabet, das nicht zu Schriftzwecken benutzt wurde. Der Gebrauch von Klopfzeichen zur Verständigung auf der Basis des lat. Alphabets wird von Mönchen berichtet, die sich vor allem aber der „signa loquendi“ als monastischer Zeichensprache bedienten (Jarecki 1981, 9 ff), und begegnet noch auf der Grundlage der jüngeren Runenreihe in der ´ lafsson (18. Jh.; Derolez Runologie von Jo´n O 1954, 165 ff). In der epigraphischen Verwendung der jüngeren Runenreihe zu kryptographischen Zwecken werden die Geschlechter 1 und 3 regelmäßig vertauscht (vgl. Düwel 1983, 97 f). In den antiken Alphabeten und auch noch im gotischen (s. u. § 3.2.) von Ulfila (4. Jh.) geschaffenen Alphabet haben die Buchstaben auch Zahlwerte (zu den Zahlwerten des hebräischen, griechischen und arabischen Alphabets vgl. Art. 61, Art. 41 § 2.1. bzw. Art. 90 § 17.1.). Für die Runenschrift wurde dies ebenfalls angenommen (Agrell 1932, 155 ff und besonders Klingenberg 1973, 69 ff, mit innerer Buchstabenrechnung, Addition der Zahlwerte innerhalb einer Runensequenz). Es ist jedoch nicht zu sichern, daß die Runenschrift auch eine Zahlenschrift darstellt
VI. Keltisches, Germanisches und Slavisches Altertum
(Düwel 1979, 238 ff). Demgegenüber wurde schon früher der magische Charakter von Runeninschriften mit Hilfe der äußeren Buchstabenrechnung zu bestimmen versucht (Nielsen 1985, 76 ff). Dabei war das Ziel, die Anzahl von 24 Runen wie in der älteren Reihe oder das Vielfache von 8 (Anzahl der Runen in einem Geschlecht) in Inschriften wiederzufinden. Jedoch steht dieser Methode die neuere Forschung skeptisch gegenüber (Bæksted 1952, 173 ff, vgl. weitere Hinweise bei Düwel 1983, 112 f; 145 sowie Düwel 1992 a, 92 ff). In unterschiedlicher Weise mischen sich verschiedene Zeichensysteme, wenn Runen mit anderen Zeichen vergesellschaftet sind: (1 a) Eine einfach geritzte Runenfolge rahmen ein senkrechter Strich und eine Swastika, beide in Tremoliertechnik, wobei die Swastika möglicherweise syntaktisch zu integrieren wäre (Krause 1966, Nr. 11). (1 b) Runen stehen zwischen Schiffszeichnungen, Symbolen (Swastika mit mehrfach geknickten Armen) und Ornamenten (treppenartiges Gebilde), die zu unterschiedlichen Zeiten bis zum Zeitpunkt der Runenritzung eingetragen wurden, ohne daß syntaktischer Zusammenhang oder Sinnsummation ermittelt werden können (Krause 1966, Nr. 53). (1 c) Bei einigen Lanzen- und Speerblättern des 3. Jahrhunderts treten Runeninschriften neben Symbolen (Hachmann 1993, 373 ff), vereinzelt auch unbestimmbaren Zeichen auf (vgl. Abb. 37.2); auch hier ist der Zusammenhang unklar (Krause 1966, Nrn. 32⫺35). (2) Auf wikingerzeitlichen Runendenkmälern stehen die Inschriften oft mit Kreuzen, ThorsHämmern, Schiffen, Tieren und anderen Gegenständen und Wesen zusammen (vgl. Abb. 37.3), die sich gelegentlich als Bildprogramme (Düwel 1983, 61) oder als Bildzyklen (Hauck 1973, 520 f) verstehen lassen (vgl. Abb. 37.4). Solche zeigen die gotländischen Bildsteine (Lindqvist 1941/42; z. B. Fig. 81, 86, 91, 97 u. ö.; Nyle´n und Lamm 1981, 38 ff), bei denen Runeninschriften kaum vorkommen. Die verschiedenartigen Zeichen (Wirbelräder, Spiralen, Schiffe, Tiere usw.) verweisen auf Christliches und Heidnisches, Mythen- und Sagengeschehen sowie Totenvorstellungen. (3) Vermischung lateinischer und runischer Schrift (auch in imitativer bzw. schriftähnlicher Form) läßt sich seit dem 5. Jahrhundert beobachten. Die Brakteaten-Inschriften zeigen, daß mit der barbarischen Nachahmung römischer Vorbilder im Zuge einer zunehmenden Um- und Neugestaltung Kapitalis-Zeichen samt deren Imitation immer mehr zugunsten
807
37. Zeichenkonzeptionen im germanischen Altertum
Abb. 37.2: Lanzenblatt von Kowel (nach Krause 1966, Taf. 17).
korrekter durchgehender Runen-Folgen zurücktreten, wobei Vermischungen durchaus vorkommen (Düwel 1988, 73 ff). Auch bei den Brakteaten spielen Zeichen und Bilder die Hauptrolle (Hauck 1988, 22 ff) gegenüber
den Inschriften, auch wenn ein unmittelbarer Zusammenhang zwischen beiden zu bestehen scheint. Oft ergeben die Schriftzeichen semantisch nicht interpretierbare Sequenzen. Neuere Forschung (Düwel 1988, 101 ff) hat
808
VI. Keltisches, Germanisches und Slavisches Altertum
Abb. 37.3: Stein von Tjängvide (nach Wilson und Klindt-Jensen 1980, Pl. XXVI).
zu zeigen versucht, daß dabei buchstabenmagische Kommunikation in der „Sprache der Götter und Geister“ (Güntert 1921, 1 ff) vorliegen dürfte. Es handelt sich um eine Kommunikation zwischen Menschen in der Funktion von Priestern, Magiern oder Zauberern und übermenschlichen Wesen wie Göttern, Dämonen oder Geistern. Bei der En- und Dekodierung spielen Formprinzipien der Arkanisierung wie Akrostichon, Alphabet-Reihen, Anagramm, Anlautvariation, Palindrom, Vokalvariation u. a. eine Rolle. Während für das heutige Verständnis die Zeichenfolgen als Vokal- oder Konsonantenreihen häufig willkür-
lich erscheinen, dürfte im Verständnis der damaligen Hersteller und vielleicht auch der Benutzer durchaus eine Vereinbarung über Sinn und Funktion vorgelegen haben, die man sich auf seiten der Götter und Dämonen getroffen und an ausgewählte Menschen weitergegeben vorgestellt haben mag. In gleicher Weise wird die Erfindung der Schrift ⫺ auch in germanischer Vorstellung ⫺ einem Gott, der dieses Wissen an seine Auserwählten vermittelt, zugeschrieben (Bertholet 1949, 12). Diese Traditionen bleiben ein durch Geheimnis geschütztes Wissen (Düwel 1992 b, 77). Die Runen stellen ein eigenes germanisches Zeichen-
809
37. Zeichenkonzeptionen im germanischen Altertum
Abb. 37.4: Stein von Ramsund (nach Ploss 1966, Taf. 13, Abb. 15).
system dar, was sich in Formgebung, Anordnung und Bedeutung der Zeichen dokumentiert. Ihre Verbreitung erstreckt sich über den gesamten europäischen Raum mit einer Konzentration im Norden. Sie sind ein Phänomen oberer Gesellschaftsschichten (Düwel 1992 b, 58 ff). Inhalt und Funktion der Runeninschriften liegen in verschiedenen Bereichen: magisch (Flowers 1986, 1 ff, mit semiotischem Ansatz), religiös, rechtlich, Sachverhalte (z. B. Herstellung, Besitz) feststellend, gedenkend. 3.2. Die gotische Schrift Während die Runenschrift zu epigraphischen Zwecken anonym geschaffen und erst spät und marginal als Buchstabenschrift verwendet wurde, erfand der Westgotenbischof Ulfila (4. Jahrhundert) nach dem Zeugnis griechischer Kirchenhistoriker die gotischen Buchstaben, die zum Beschreiben von Pergament bestimmt waren. Die einzig erhaltene umfangreichere Handschrift, der bekannte Codex argenteus (Uppsala), und einige Fragmente in gotischer Schrift (Stutz 1966, 16 ff; Krause 1968, 16 ff) stammen aus Oberitalien und datieren vorwiegend in das 6. Jahrhundert. Die Buchstaben haben die in Abb. 37.5 und Abb. 37.6 gezeigten Formen. Es handelt sich in Abb. 37.5 (Codex argenteus) um den jüngeren Typ II mit geraden, symmetrischen Unzialen, darunter in Abb. 37.6 (Codex Ambrosianus B) um den älteren
Typ I, einen unzial-kursiven Schriftduktus. In der Salzburg/Wiener Alcuin-Handschrift (9.⫺10. Jahrhundert) finden sich die gotischen Schriftzeichen mit ihren Zahlwerten und Buchstabennamen (vgl. Krause 1968, 63 f). Ulfila hat die gotischen Schriftzeichen auf der Grundlage antiker Alphabete und der germanischen Runenschrift geschaffen. Der jeweilige Anteil wird kontrovers diskutiert (vgl. Ebbinghaus 1979, 15 ff). Aufbau, Reihenfolge und die Verwendung griechischer Zahlzeichen (für 90 und 900) auch ohne Lautentsprechung deuten auf das griechische Alphabet (siehe Art. 41 § 2.1.) als Ausgangspunkt. Von dort aus lassen sich auch die meisten Buchstabenformen erklären. Lateinischen Buchstaben dürften die gotischen Zeichen für h, r und s (Typ II) nachgebildet worden sein. Runischen Ursprung nimmt man für p, j, u, f und o an (Krause 1968, 64 f). Die den Goten gelegentlich abgesprochene Kenntnis der Runenschrift wird durch eine Reihe von Runeninschriften belegt. Die gotischen Buchstabennamen repräsentieren weder die Runennamen des 4. Jahrhunderts noch gar die ursprünglichen altgermanischen Runennamen, doch gibt es eine Reihe von bemerkenswerten Übereinstimmungen. Ein vorulfilanisches gotisches Alphabet wird gelegentlich angenommen. Da sich das überlieferte gotische Alphabet am ehesten aus dem griechischen erklären läßt, ist nicht anzunehmen, daß ihm eine eigenständige germanische
810
VI. Keltisches, Germanisches und Slavisches Altertum
Abb. 37.5: Die gotischen Buchstaben, jüngerer Typ mit geraden, symmetrischen Unzialen (nach Braune 1981, 14).
Abb. 37.6: Die gotischen Buchstaben, älterer Typ mit unzial-kursivem Schriftduktus (nach Braune 1981, 14).
Zeichenkonzeption zugrunde liegt. Dasselbe gilt für die neuen Schriftzeichen, die König Chilperich zusätzlich zur genaueren Lautdifferenzierung einführte (darunter ein der wRune ähnliches Zeichen) (Sanders 1972, 82). Zu den Schriften der Kelten und Slaven vgl. Art. 36 § 9. bzw. Art. 38 § 1.
4.
Symbolik
Die vieldeutigen Begriffe „Symbol“ und „Zeichen“ (Lurker 1991, 552; 1982, 95 ff; Nöth 1985, 90) werden in diesem Zusammenhang, einem in der germanischen Altertumskunde üblichen Gebrauch folgend, gleichbedeutend verwendet (Much 1967, 160; de Vries 1957, 127 f u. ö.). Im einzelnen wird dabei auch von „Sinnbildern“ (Nußbeck 1993, 8, 17 ff), „Sinnzeichen“ und „Begriffszeichen“ (Krause 1966, 6) sowie „Heilszeichen“ (Zeiss 1941, 27 u. ö.) und „Signa“ (Beck 1965, 1 u. ö.) gesprochen, in bestimmten Funktionen begegnet weiter der Terminus „Marke“ (z. B. Eigentumsmar-
ken; vgl. Schmidt-Wiegand 1986, 566 f). Symbole oder Sinnzeichen zeigen Formbeständigkeit (wie Swastika, Triskele u. a.), haben eine meist unbekannte, aber vorauszusetzende und gelegentlich rekonstruierbare ursprüngliche Bedeutung. Sie unterscheiden sich dadurch von Ornament oder Verzierung, für die bedeutungslose Strichkombinationen geometrischer Struktur mit Wiederholungstendenz wichtige Merkmale sind (Düwel 1981, 152). Die Unterscheidung läßt sich jedoch nicht immer streng durchführen, wie etwa der Begriff „Tierornamentik“ (Salin 1935, 175 ff; s. u. § 7.1.) und der Titel Tiere als Symbol und Ornament (Michel 1979, 3) andeuten. Für die Überlieferungsgruppe der mehr als 900 Goldbrakteaten der Völkerwanderungszeit wurde außerdem der Begriff „Beizeichen“ eingeführt: „Sie stehen neben oder ‘bei’ einem Bild, nie jedoch im Zentrum, und es handelt sich um Zeichen in verschiedenen Formen. Ob sie heilig, mystisch oder magisch sind, ob es sich um Symbole, Sinnzeichen, Heilszeichen, Attribute oder Ornamente zum Füllen
811
37. Zeichenkonzeptionen im germanischen Altertum
Abb. 37.7: Beizeichen (auf dem Brakteaten Lellinge Kohave-B; nach IK 105 b,1).
von leeren Flächen handelt, sind Fragen der Interpretation“ (Behr 1991, 24; vgl. Abb. 37.7.). In den Brakteatendarstellungen wird „der Ring als Botenzeichen der Sendung in die Anderwelt“ verstanden (Hauck 1992, 111 uns 134 ff), wie denn überhaupt das Zeichenhafte der Brakteaten-Bildelemente immer deutlicher wird. Symbole verschiedener Art (gegenständlich: Schiffe, Wagen, Tiere, Waffen, Luren u. a. und ungegenständlich: Kreise, Kreuze, Triskele ⫽ Dreiwirbel, Swastika ⫽ Hakenkreuz, Kreisaugen, Rosetten, Spiralen, Voluten, Fußsohlenabdrucke, Handzeichen u. a.) wurden auf später germanischem Gebiet seit der Bronzezeit ⫺ obwohl dort zu der Zeit germanische Ethnien nicht nachgewiesen werden können ⫺ gesammelt und zumeist in religiöse oder brauchtümliche Zusammenhänge gestellt, oder auch tiefenpsychologischer Deutung in der Art C. G. Jungs (1976, 12 ff) zugeführt. Insbesondere
folgende Überlieferungsgruppen haben dabei eine Rolle gespielt: bronzezeitliche Felszeichnungen in Skandinavien (Almgren 1934, 1 ff); zahlreiche Waffen, vor allem Lanzen- und Speerspitzen, besonders aus der jüngeren Römischen Kaiserzeit, die mit Punktkreisen, Triskelen und Swastiken versehen sind (Raddatz 1985, 311 f u. ö., Abb. 9), Goldbrakteaten der Völkerwanderungszeit mit vielen Beizeichen (Behr 1991, 81 ff; 183 ff), gotländische Bildsteine aus der Zeit des 5.⫺8. Jahrhunderts mit Wirbelrädern, Spiralen, Knoten u. a. (auch gegenständlichen) Symbolen (Nyle´n und Lamm 1981, 20 ff; vgl. Abb. 37.8), um nur einige Beispiele zu nennen. Es kann nicht gesichert werden, ob die Symbole in den genannten Fällen als „religiöse Urkunden“ von Totenkult und Fruchtbarkeitszeremonien (Almgren 1934, 362 ff; Schier 1992, 162 f und 211 ff), als Zeichen „von Wertschätzung und Bedeutung von Lanze und Speer“
812
VI. Keltisches, Germanisches und Slavisches Altertum
Neben den bisher genannten Symbolen gibt es „Marken“, deren Funktion in der Regel eindeutig bestimmt werden kann, etwa um Eigentum an Haus und Hof sowie an beweglicher Habe (Gegenstände und Tiere) zu bezeichnen (Schmidt-Wiegand 1986, 566). Haus- und Hofmarken (ebd. 571 ff; vgl. Abb. 37.9) lassen sich kaum auf Runenzei-
Abb. 37.8: Stein aus der Kirche von Bro (nach Nyle´n und Lamm 1981, 23).
(Raddatz 1985, 311), als zusätzliche Mittel, um „die magische Wirkung“ der BrakteatenAmulette zu verstärken (Behr 1991, 186, vgl. 211) oder als „Sonnendarstellungen“ und „magische Zeichen“ (Nyle´n und Lamm 1981, 20; 24; 64) zu verstehen sind. Die diesen Symbolen zugrunde liegende Bedeutung ⫺ sie wird immer wieder vorausgesetzt ⫺ ist nicht überliefert und nur im Ansatz rekonstruierbar. Damit erklärt sich der meist versuchsweise und in der letzten Zeit durchweg zurückhaltende Deutungszugriff in der Forschung. Dies darf auch als eine Reaktion auf eine im 19. Jahrhundert sich ausbreitende und zur Zeit des Nationalsozialismus wild spekulierende Sinnbildkunde (Hunger 1984, 180 ff; Nußbeck 1993, 59 ff) verstanden werden, in der Dilettantismus und politische Ideologie zusammentrafen. Zur Symbolik bei den Kelten vgl. Art. 36 § 5., bei den Slaven Art. 38 § 2.; zur Symbolik der mediterranen Kulturen vgl. Art. 47, 60, 61 und 89; zur Symbolik der außereuropäischen Kulturen vgl. Art. 90⫺99.
Abb. 37.9: Hausmarken aus Hamburg (nach Schmidt-Wiegand 1986, Abb. 96).
37. Zeichenkonzeptionen im germanischen Altertum
chen zurückführen. Eigentumsmarken verschiedenster Formen stellen ein kulturübergreifendes Phänomen dar und werden in schriftloser oder schriftarmer Zeit aller Kulturen angetroffen. Im einzelnen lassen sich Personen- und Sachenzeichen unterscheiden. Als Grenzzeichen kommen natürliche (Baummarken) wie künstliche (Steinhaufen, Pfähle usw.) Marken vor (Kehr 1964, 125 ff). Der Gebrauch von Marken ursprünglich zur Eigentumsbezeichnung von Waren setzt sich als Kennzeichnung der Herkunft und Qualität von Produkten in Handelsmarken fort (vgl. Art. 171). In diesen Zusammenhang gehören auch Zeichen und Marken aus dem Kunst- und Bauhandwerk, insbesondere Münzmeister, Goldschmiede und Steinmetze, die, in Zünften organisiert, auch deren Schauzeichen und Stempel übernahmen (Schmidt-Wiegand 1986, 572 f). Bei diesen Handwerken kann es zu exklusiven (Kult-)Gemeinschaften kommen wie bei den spätmittelalterlichen Bauhütten mit spezifischen Erkennungszeichen ihrer Mitglieder (Birkhan 1968, 22 ff). In Anlehnung an Steinmetzzeichen und Hausmarken treten seit dem 16. Jahrhundert die sogenannten Gaunerzinken auf, die, auf einen kleinen Kreis eingeweihter Fahrender beschränkt, bis in die Gegenwart ⫺ inzwischen zu einer Bilderschrift weiterentwickelt ⫺ fortleben (Puchner 1974, 22 f). Die aufgeführten Symbole und Marken kommen durchweg in vielen Kulturen vor. Man kann dafür entweder mit unabhängiger Entstehung rechnen, vielfach wird jedoch auf germanischer Seite eine Anregung von außen und ‘barbarische Nachahmung’ bzw. einheimische Umgestaltung angenommen. Es ist deshalb fraglich, ob bei einigen der in der Germania aufweisbaren Phänomene genuin germanische oder eher kulturenübergreifende Zeichenkonzeptionen vorliegen. Zur Rolle von Marken und Namen in anderen Kulturen vgl. Art. 60 § 3., Art. 61 § 1., Art. 89 § 2.2., Art. 90 § 8., Art. 92 § 6.2., und Art. 93 § 3.1.
5.
Religion und Mythos
Polytheismus ist bereits in den ältesten Quellen bezeugt (Tacitus, c. 9; vgl. zu Tacitus jeweils Lund 1991 a und b). Nach Dume´zil (1973, XI f u. 3 f) verteilen sich die drei Funktionen der Souveränität (Herrschaft), des Kriegerischen und der Fruchtbarkeit (nährende Funktion) auf Wodan/Odin und Tyr, Thor/Donar und Njoœ rÎr/Freyr (vgl. Tacitus,
813 c. 40; Ström 1975, 52 f; 83 ff; 113 ff). In der nordischen Mythologie findet sich eine Einteilung in Asen- und Wanengottheiten mit je eigenen Zuständigkeitsbereichen. Der Mythos von einem Krieg zwischen Asen und Wanen und ihrem Friedensschluß (Vries, 1957, 208 ff) ist unterschiedlich interpretiert worden (zuletzt Dronke 1988, 223 ff). Grundsätzlich kann als Aufgabe des Mythos mit Weber (1990, 454) „die aitiologische primordiale Setzung des gesellschaftlichen Normensystems und so die Begründung aller Kultur“ gesehen werden. Götterverehrung durch Bilder ist archäologisch bezeugt (Buchholz 1976, 570 ff; Hauck 1976, 577 ff). Opferriten werden sprachlich (Düwel 1970, 219 ff) und literarisch (I. Beck 1967, 88 ff) greifbar. Ein erst später überlieferter Tempelkult wird aus christlicher Sicht als Vor-Zeichen der Erfüllung im neuen Glauben verstanden (Düwel 1985, 121 ff). Wie der Kult generell die Funktion hat, das Wohlwollen der Götter zu sichern, so liegt auch die Bedeutung des Opfers wie in anderen Religionen in der Beschwichtigung göttlicher Mächte, die sprachlich auch durch neutrale Plurale bezeichnet werden (Düwel 1978, 332 ff). Andere kommunikative Funktionen gelten für die mit dem Opfer verbundenen Zeremonien (Opfergelage). Während Menschenopfer Wodan/Odin vorbehalten waren, sind Tieropfer für Thor/Donar und Tyr bestimmt (Tacitus, c. 9; Vries 1956, 408 ff; H. Beck 1970 a, 240 ff). Kimbrische Priesterinnen sollen Kriegsgefangenen die Kehle durchgeschnitten und aus dem fließenden Blut geweissagt haben (Vries 1956, 392 f; 408; zu den keltischen Tötungsritualen vgl. Art. 36 § 3.). Die Tötung von Kriegsgefangenen und -gegnern ist als typisch nordgermanische Sitte im Ritus des Blutaar-Ritzens bezeugt (ebd. 411 f; anders Frank 1988, 287 ff), wobei mit dem Schwert der Rücken aufgeschnitten und die Lunge herausgerissen wird. Soweit die Quellen erkennen lassen, wird die grausame Tötung vor allem zur Vaterrache und in der Regel an sozial hochstehenden Personen geübt. Die Bedeutung dieses Tötungsritus bleibt dunkel, falls nicht das Bild des Adlers auf Odin verweist (Vries 1956, 412). Riten sind zeichenhaft zu verstehen, z. B. wenn man den Semnonenhain nur gefesselt betreten darf, „um seine Unterwürfigkeit und die Macht der Gottheit zu bekunden“ (Tacitus, c. 39), oder wenn man zur Kampferöffnung nach Wort- und Bildzeugnissen einen Speer (den Speer des Gottes) über das feindliche Heer fliegen läßt, um dieses dem
814
VI. Keltisches, Germanisches und Slavisches Altertum
Totengott zu weihen (Kuhn 1978, 248 f; Düwel 1981, 166 f). Den Vorzeichen und dem Losorakel wird große Bedeutung zugemessen (Tacitus, c. 10). Ob die „notae“ auf den zum Losorakel benutzten Zweigen Runen waren, ist umstritten (Seebold 1986, 554 ff). Göttliche Entscheidungshilfen brachte die Beobachtung von Vorzeichen („auspicia“), die man nicht nur dem Flug und der Stimme von Vögeln, sondern auch dem Wiehern von Pferden entnahm, die als Vertraute der Götter galten. Die Ausprägungen des „Irreligiositäts-Motivs“ in der nordgermanischen Literatur, dessen Grundstruktur drei wesentliche Elemente enthält: „die demonstrative Abscheu vor dem Götzenkult“, „der Glaube an die eigene Kraft“ und „der Glaube an die Herrschaft des Schicksals oder Glücks“ (Weber 1981, 478), hat Weber in ihrer signifikanten Bedeutung für die nordische Interpretation des Glaubenswechsels erkannt (Weber 1981, 474 ff). Dieser markiert keinen historischen Bruch, „vielmehr gibt es in der nordischen Vorzeit Tendenzen, die zwar erst in christlicher Zeit sich voll entfalten, aber zuvor schon latent vorhanden waren (Weber 1986 b, 310). In den genannten Beiträgen werden darin christlich typologische Denkstrukturen aufgewiesen (vgl. auch Weber 1987, 95 ff; anders See 1988, 69 ff).
6.
Institutionen und Gebräuche
Königtum und Fürstenherrschaft („principes“) werden von Tacitus (c. 7; 11) bezeugt, Art und Funktion werden im einzelnen diskutiert. Für die gesamte Germania ist die Annahme eines Sakralkönigtums (Picard 1991, 220 ff) umstritten, das am ehesten noch in nordgermanischer Überlieferung greifbar scheint (Steinsland 1992, 736 ff). Unterschiedlich beurteilt die Forschung die Institution der Gefolgschaft (Tacitus, c. 13; Wenskus 1992, 311ff), die auch archäologisch nachzuweisen versucht wird (Steuer 1992 a, 203 ff). Nachweis und Zuordnung bestimmter Herrschaftszeichen (Schramm 1956, 769 u. ö) sind problematisch. Die Kampfesweise zeichnet sich durch folgende Merkmale aus, die auch aus anderen Kulturen bekannt sind: Zu den wenigen akustischen Zeichen gehört der Schildgesang, dessen Vortrag „barditus“ genannt wird (Tacitus, c. 3). Einerseits reizt er den Mut, andererseits entnimmt man aus seinem Klang einen Hinweis auf den Ausgang der Schlacht, also ein selbstgesteuertes
„augurium“. Die Gottheit wird in der Schlacht als Kampfeshelfer anwesend gedacht. „Deshalb nehmen die Germanen auch gewisse Bilder und Zeichen, die sie aus den heiligen Hainen holen, mit in die Schlacht“ (Tacitus, c. 7). Diese „effigies et signa“ verweisen auf die Anwesenheit der Gottheit, was römischen Vorstellungen entspricht (Picard 1991, 107; vgl. auch Art. 47 § 3.). Eine zeichenhafte Beziehung zwischen Vergehen und Strafe berichtet Tacitus (c. 12): Verräter und Überläufer werden aufgehängt, Feiglinge, Kriegsscheue und Unzüchtige im Moor versenkt. Er sieht darin den Grundsatz befolgt, „man müsse Verbrechen zur Schau stellen, wenn man sie bestrafe, Schandtaten hingegen dem Blicke entziehen“. Das verbreitete Prinzip der spiegelnden Strafe ist kennzeichnend für germanisches Rechtsdenken (Kaufmann 1990, 1762). Spezifische Kleidung (Tacitus, c. 17) begegnet bei Naharnavalen (c. 43), Färben der Körper bei den Hariern (c. 43). Auffällig sind Bart- (Langobarden) und Haartracht der Chatten (c. 31) sowie vor allem der Sweben, bei denen „ein Kennzeichen des Stammes ist, das Haar seitwärts zu streichen und in einem Knoten hochzubinden“ zum Zweck sowohl ethnischer wie sozialer Differenzierung (c. 38). Erwähnenswert sind Spiele wie der Schwerttanz (c. 24), der auf frühe kriegerische Übung verweist, und Eß- und Trinksitten (c. 23; vgl. Düwel 1989, 579 ff), bei denen eine Korrespondenz zwischen einfacher Kost und naturnaher Lebensweise hergestellt wird. Schon in Runeninschriften (Fluchformel in den Inschriften von Stentoften und Björketorp; vgl. Krause 1966, Nr. 96 u. 97) und im Hildebrandslied (Z. 58) wird der Vorwurf der ‘Argheit’, der Perversität (Homosexualität, Weibischkeit) erhoben und in der altnordischen Sagaliteratur darüber hinaus zeichenhaft verdeutlicht (z. B. durch symbolische Ringübergabe; vgl. Clunies Ross 1973, 75 ff; Meulengracht Sørensen 1983, bes. 20 ff; Weber 1990, 461 f).
7.
Kunst und Literatur
7.1. Tierornamentik und Skaldendichtung Charakteristisch für germanische Kunst, in der das Ornament gegenüber dem Bild vorherrscht, und Literatur sind Tierornamentik und Skaldendichtung. Besonders in dem Bemühen einer „wechselseitigen Erhellung der Künste“ hat man Entsprechungen zwischen den verschiedenen Tierstilen (I: 5. Jahrhun-
815
37. Zeichenkonzeptionen im germanischen Altertum
dert bis 600; II: 600 bis 650; III: 650 bis 800) und Eigenheiten germanischer Dichtung wie Stabreim, Zeilen- und Hakenstil aufzudecken versucht. Doch nur die Gegenüberstellung des Stils III (vgl. Abb. 37.10) und des zeitlich anschließenden Greiftierstils (Wilson und Klindt-Jensen 1980, 48 ff; vgl. Abb. 37.11) ⫺ beide auf Skandinavien beschränkt ⫺ mit seinen Raubtierverschlingungen (ebd. 57) in
verschiedenen zeitlichen und regionalen StilAusprägungen und der Skaldendichtung erweist sich als tragfähig. Die Merkmale beider stimmen überein „in ihrer Haltung zur Wirklichkeit, die sich vom Einmalig-Konkreten, Historischen abwendet zum Allgemeinen, Abstrakten, zum A-Historischen“, samt einer Neigung zum A-Naturalismus (Marold 1976, 474). Den typischen „Umformungen zum Or-
Abb. 37.10: Stil III (Beschlag von Gotland; nach Salin 1935, Abb. 607).
Abb. 37.11: Greiftierstil (Detail eines Tierkopfes aus dem Oseberg-Fund; nach Wilson und Klindt-Jensen 1980, Fig. 21).
816 nament liegt ein allgemeines Prinzip zugrunde, ein System, an dem Künstler und Betrachter Anteil haben. Die Tierornamentik wie die Kenningar der Skaldendichtung beruhen auf einem konventionellen Zeichensystem, und erst innerhalb dessen genießt der Künstler seine Freiheit in Auswahl und Variation. Dieses Zeichensystem, dem Eingeweihten und dem Kenner bekannt, ist die Voraussetzung, daß diese Kunstwerke über rein ästhetische Impressionen hinaus auch inhaltlich erfaßt werden konnten“ (ebd. 470). In der Tierornamentik sind infolge der starken Stilisierung die Tiere kaum einmal ⫺ anders als in der figürlichen Kunst ⫺ zoologisch bestimmbar, doch weisen einzelne Merkmale auf Raubtiere und Raubvögel, „wobei die Deutung auf den Adler hin wohl immer gegeben war“ (H. Beck 1973 b, 83). Neben vergleichbaren Variationen und Formen der Verschlingung von Tierkörpern und -extremitäten gegenüber derjenigen von syntaktischen Bestandteilen entsprechen vor allem die Stilisierungstypen in der Tierornamentik dem Kenningsystem, dem Bildemodelle für die artifiziellen Umschreibungen zugrunde liegen. Bei der einfachen zweigliedrigen Kenning wird ein Grundwort durch ein genitivisches Bestimmungswort charakterisiert („Pferd des (Seekönigs) Ekkil“ ⫽ Schiff), daneben rechnet man auch Zusammensetzungen („Erzversammlung“ ⫽ Schlacht) und mehrgliedrige Umschreibungen zu den Kenningar (See 1980, 33 f). Die Ursprünge der Kenning werden in wortmagischen Vorstellungen oder in tabusprachlichen Zusammenhängen gesucht (ebd. 48 ff). Im Blick auf die Beziehung zwischen Tierornamentik und Kenningsystem fällt auf, daß in den Kenningar für ‘Mann’ keine Tierbezeichnungen als Grundwort vorkommen, wohl aber der Mann z. B. als „Fütterer des Wolfes / der Raben“ umschrieben wird (Meissner 1921, 286; vgl. 283, 293 f u. ö.), wobei die Tiere der Walstatt eindeutig hervortreten (vgl. ebd. 310, 325, 346). Wenn es in semiotischer Perspektive darum geht, die diesen Ausdrucksformen innewohnenden Verweisungen inhaltlich zu erfassen, dann sind die theriophoren Personennamen einzubeziehen, zumal bei bestimmten Tierkombinationen in Namen wie Eber-Bär-, EberWolf-Namen „gewisse Parallelen mit den sogenannten germanischen Tierstilen“ vorliegen. Obwohl im einzelnen unterschieden, darf „hinter diesen eigenständigen Ausprägungen […] aber doch eine gemeinsame Anschauung vermutet werden“ (H. Beck 1986, 335; zur Tierverehrung in anderen Kulturen
VI. Keltisches, Germanisches und Slavisches Altertum
vgl. Art. 36 § 5.4. (Kelten), Art. 38 § 2. (Slaven), Art. 91 § 4. (Afrika), Art. 96 § 4. (Südostasien) und Art. 99 § 6. (Altamerika)). Diese „theriophore Weltsicht“ (ebd.) zeigt drei Haupterscheinungen archaischer Tierverehrung: „1. Glaube an besondere physisch-psychische Fähigkeiten des Tieres, die der Mensch nicht oder in geringerem Maße besitzt, 2. Funktionen im Kult und im Mythos (Opfertier, Attributtier, Tier-Dämon usw.), 3. Wunsch des Menschen, diesem Tier ähnlich zu werden, oder der Glaube, mit ihm wesenhaft verbunden zu sein (Tierabstammungs- und Tierverwandlungssagen, Maskierung, rühmende Benennung nach dem Tier, heraldische Bildsymbolik u. a.)“ (Müller 1970, 201). Die Tiersigna, die wie der Eber „ungestüme Kraft und Angriffslust“ (H. Beck 1986, 335) bedeuten, sind Kennzeichen einer auf Jagd und Krieg ausgerichteten Kriegergemeinschaft (H. Beck 1970 b, 73; Müller 1970, 210), deren Heldenideal „die Bewährung als vollkommener Jäger und tapferer Krieger fordert“ (H. Beck ebd.). Darüber hinaus führt eine vergleichende Gegenüberstellung von Bilddenkmälern der Vendelzeit (550⫺ 800) mit der literarischen Überlieferung zu der Einsicht: „Die drei auf dem Vendelhelm dargestellten Themen des Kampfes gegen die Schlange, der göttlichen Schlachthilfe und des Bärenfangs zeigen nach dem Zeugnis von Edda, Skaldik und Saga Kraft- und Ruhmestaten, durch die der Kämpfer sich als Held erweist. Sie sind Chiffren für den Waffengang, der mit Hilfe der lenkenden und leitenden Götter bestanden wird […]. Demzufolge sind die drei Themen als topoi, bzw. im Ornamentalen als ‘Bildformeln’ zu verstehen, als Modelle, die zum Formenschatz der Heldenrühmung gehören. In ihrer symbolischen Struktur und archetypischen Ordnung weisen diese typischen Heldentaten […] auf ein dem germanischen Kriegeradel der Vendelzeit eigentümliches Leitbild“ (H. Beck 1964, 50); vgl. insgesamt Naumann 1991, 49 ff). 7.2. Semiotische Beschreibungsansätze zur Literatur Semiotische Zugänge, vor allem zur nordgermanischen Literatur, wurden vereinzelt, zunehmend in letzter Zeit versucht, doch findet sich auch in der älteren Forschung Vergleichbares, ohne daß ausdrücklich von „Semiotik“ die Rede ist. Folgende Ansätze und Bereiche sind zu nennen. „Heldendichtung und Semiotik“ behandelt Weber (1990, 44 ff) am Beispiel von Iring und
817
37. Zeichenkonzeptionen im germanischen Altertum
Gunnar. Ein grundlegendes, allgemeingültiges Wertesystem (Norm) werde in der Heldensage „konkret anschaulich […] als komplexe semiotische Struktur, deren ‘Sinn’, ‘Aussage’, ‘Bedeutung’ erst aus dem ⫺ im kollektiven Bewußtsein der Zuhörerschaft sich vollziehenden Diskurs der heterogenen semiotischen Bestandteile dieser Struktur ⫺ als ‘geistige Leistung’ und ‘Synthese’, also als Ergebnis von Deutung durch ‘Wiedererkennen’, entsteht“ (Weber 1990, 453). Dem hat See widersprochen und erneut für eine individualistische Konzeption des Helden votiert: die Zählebigkeit und Wanderfreudigkeit der Heldensage erkläre sich „am wenigsten aus der Rolle, die sie für das Selbstgefühl einzelner ethnischer und sozialer Gruppen zu spielen vermag. Vielmehr erlebt sich im Helden der Mensch […] als ein in der Geschichte handelndes, seiner selbst mächtiges Wesen“ (1993, 4). Als Beispiel der altnordischen Sagaliteratur untersucht Marold (1989, 399 ff) die Hœnsa-po´ris-Saga „von einem semiotischen Literaturverständnis aus, demzufolge literarische Texte Zeichensysteme zweiter Ordnung sind, d. h. daß jeder literarische Text als Bedeutungsträger in einer literarischen Kommunikation fungiert“. Der Analysemethode von A. Greimas (1966) folgend, untersucht sie ausgehend von den Personenbeschreibungen „die Isotopie des Eigentums, der sozialen Beziehungen, der Fähigkeiten und des Rechts“. Sie kommt für den ‘Bedeutungsraum’ der Saga zu dem Ergebnis, „daß die grundlegende Thematik der Saga nicht im Bereich der Gestaltung von heroischen Einzelfiguren, sondern in der Darlegung des sozialen Gefüges zu suchen sei, in dem der Einzelne steht“ (ebd. 424 f). Uecker (1989, 390 ff) fragt nach Intertextualität und Dekonstruktion in der altnordischen Prosaliteratur, wobei es vor allem um die Verweisfunktion von Zeichen auf andere Zeichen bzw. von Texten auf andere Texte geht. Ein Beispiel bieten die Rittersagas mit dem Motiv der Zeichnung eines Vogels mit dem Schwert auf den Rücken eines Menschen; die Bedeutung erschließt sich erst über den Verweis auf das Ritzen des Blutaars (s. o. § 5.). Die Begegnung Thors mit dem Riesen Geirröd analysieren Clunies Ross und Martin (1986, 56 ff) intertextuell auf dem Erzählmuster des Märchens mit Zitatanspielungen aus Edda und Skaldik. Die Riesen in ihrer Schlauheit stehen für die Verkehrung von
Normen, während Thor die Feinde bezwingt und Stabilität und Normalität wiederherstellt. Für die literarische Überlieferung vom Tod des Königs Domaldi erarbeitet Lönnroth (1986, 73 ff) drei verschiedene Deutungen. Daß diese in der Heimskringla des Snorri Sturluson (ca. 1230) nebeneinander vorkommen, sei ein Zeichen für die Eignung der Sagas, „eine Collage von unvergleichbaren Strukturen darzustellen oder vielleicht ein patchwork von intertextuellen Schichten, die nicht immer leicht zu entwirren sind. In dieser Hinsicht sind sie [die Sagas] der ideale Gegenstand poststrukturalistischer ‘Dekonstruktion’ “ (Lönnroth 1986, 93; vgl. Art. 122). Es handelt sich hier um vereinzelte zeittypische Ansätze, die keine nennenswerte Fortsetzung gefunden haben.
8.
Literatur (in Auswahl)
Agrell, Sigurd (1932), „Die spätantike Alphabetmystik und die Runenreihe“. In: Kungliga humani˚ rsberättelse stiska vetenskapssamfundet i Lund. A 1931⫺1932. Lund, 155⫺210. Almgren, Oscar (1934), Nordische Felszeichnungen als religiöse Urkunden. Frankfurt a. M. Ament, Hermann (1989), „Germanen“. In: Lexikon des Mittelalters, Bd. 4. München und Zürich, 1338⫺1344. Antonsen, Elmer H. (1982). „Zum Ursprung und Alter des germanischen Fuparks“. In: Kurt R. Jankowsky und Ernst S. Dick (eds.), Festschrift für Karl Schneider. Amsterdam und Philadelphia, 3⫺15. Axboe, Morten, Klaus Düwel, Karl Hauck und Lutz von Padberg (1985⫺1989), Die Goldbrakteaten der Völkerwanderungszeit. Ikonographischer Katalog (IK 1⫺3), Einleitungsband sowie je 1 Textund je 1 Tafelband. (Münstersche Mittelalter-Schriften 24,1,1⫺24,3,2) München. Bæksted, Anders (1952), Ma˚lruner og troldruner. Runemagiske studier. (Nationalmuseets skrifter. Arkæologisk-historisk række IV) Kopenhagen. Beck, Heinrich (1964), Einige vendelzeitliche Bilddenkmäler und die literarische Überlieferung. (Bayerische Akademie der Wissenschaften. Philologischhistorische Klasse. Sitzungsberichte. Jahrgang 1964, H. 6) München. Beck, Heinrich (1965), Das Ebersignum im Germanischen. Ein Beitrag zur germanischen Tier-Symbolik. (Quellen und Forschungen zur Sprach- und Kulturgeschichte der germanischen Völker. NF 16 (140)) Berlin. Beck, Heinrich (1970 a), „Germanische Menschenopfer in der literarischen Überlieferung“. In: Herbert Jankuhn (ed.), Vorgeschichtliche Heiligtümer und Opferplätze in Mittel- und Nordeuropa. (Ab-
818 handlungen der Akademie der Wissenschaften in Göttingen. Philologisch-historische Klasse. Dritte Folge Nr. 74) Göttingen, 240⫺258. Beck, Heinrich (1970 b), „Die Tiere der Jagd und Walstatt in den eddischen Liedern“. In: Ute Schwab (ed.), Das Tier in der Dichtung. Heidelberg, 55⫺73, Anm. 259⫺267. Beck, Heinrich u. a. (1973 a), „Vorwort zur 2. Aufl.“ In Hoops 1973 ff, I: VIII⫺XII. Beck, Heinrich (1973 b), „Adlersymbolik“. In Hoops 1973 ff, I, 82⫺83. Beck, Heinrich (1986), „Eber. II. E. im germ. Bereich.“ In Hoops 1973 ff, VI, 330⫺336. Beck, Inge (1967), Studien zur Erscheinungsform des heidnischen Opfers nach altnordischen Quellen. Diss. phil. München. Behr, Charlotte (1991), Die Beizeichen auf den völkerwanderungszeitlichen Goldbrakteaten. (Europäische Hochschulschriften. Reihe 38, Archäologie. Bd. 38) Frankfurt a. M. Bertholet, Alfred (1949), Die Macht der Schrift in Glauben und Aberglauben. (Abhandlungen der Deutschen Akademie der Wissenschaften zu Berlin. Philosophisch-historische Klasse. Jahrgang 1948, Nr. 1) Berlin. Birkhan, Helmut (1968), „Die Bauhütte als exklusive Kultgemeinschaft“. In: Helmut Birkhan und Otto Gschwantler (eds.), Festschrift für Otto Höfler zum 65. Geburtstag, I. Bd. Wien, 17⫺41. Braune, Wilhelm (1981), Gotische Grammatik. Mit Lesestücken und Wörterverzeichnis. 19. Aufl. neu bearb. von Ernst A. Ebbinghaus. (Sammlung kurzer Grammatiken germanischer Dialekte, A. Hauptreihe Nr. 1) Tübingen. Buchholz, Peter (1976), „Bilddenkmäler. III. Thematische gegliederte Zusammenfassungen. § 7. B. Zur Religion in den Rhein- und Donauprovinzen“. In Hoops 1973 ff, II, 570⫺577. Caesar, Gaius Iulius (1987), Gaii Iulii Caesaris Commentarii rerum gestarum. Vol. I: Bellum Gallicum, ed. Wolfgang Hering. Leipzig. Clunies Ross, Margaret (1973), „Hildr’s Ring: A Problem in the Ragnarsdra´pa, Strophes 8⫺12“. Mediaeval Scandinavia 6, 75⫺92. Clunies Ross, Margaret und B. K. Martin (1986), „Narrative Structures and Intertextuality in Snorra Edda: The Example of Thor’s Encounter with Geirrødr“. In: John Lindow, Lars Lönnroth und Gerd Wolfgang Weber (eds.), Structure and Meaning in Old Norse Literature. New Approaches to Textual Analysis and Literary Criticism. Odense, 56⫺72. Derolez, Rene´ (1954), Runica Manuscripta: The English Tradition. (Rijksuniversiteit te Gent. Werken uitgegeven door de faculteit van de wijsbegeerte en letteren. 118e aflevering) Brügge. Dronke, Ursula (1988), „The War of the Æsir and Vanir in Vo˛luspa´“. In: Gerd Wolfgang Weber
VI. Keltisches, Germanisches und Slavisches Altertum (ed.), Idee. Gestalt. Geschichte. Festschrift Klaus von See. (Studien zur europäischen Kulturtradition) Odense, 223⫺238. Düwel, Klaus (1970), „Germanische Opfer und Opferriten im Spiegel altgermanischer Kultworte“. In: Herbert Jankuhn (ed.), Vorgeschichtliche Heiligtümer und Opferplätze in Mittel- und Nordeuropa. (Abhandlungen der Akademie der Wissenschaften in Göttingen. Philologisch-historische Klasse. 3. Folge Nr. 74) Göttingen, 219⫺239. Düwel, Klaus (1976), „Begriffsrunen“. In Hoops 1973 ff, II, 150⫺153. Düwel, Klaus (1978), „Zur religionsgeschichtlichen Deutung der germanischen Götterbezeichnungen auf der Grundlage des nordgermanischen Wortschatzes“. In: John Weinstock (ed.), The Nordic Languages and Modern Linguistics. Proceedings of the Third International Conference of Nordic and General Linguistics. The University of Texas at Austin. April 5⫺9, 1976. Austin, 332⫺345. Düwel, Klaus (1979), „Heinz Klingenberg, Runenschrift⫺Schriftdenken⫺Runeninschriften“. Göttingische Gelehrte Anzeigen, 231. Jahrgang, H. 3/4, 238⫺249. Düwel, Klaus (1981), „Runeninschriften auf Waffen“. In: Arbeiten zur Frühmittelalterforschung, ed. Karl Hauck. Bd. 1: Wörter und Sachen im Lichte der Bezeichnungsforschung, ed. Ruth SchmidtWiegand. Berlin und New York, 128⫺167, Taf. VIII⫺XIII. Düwel, Klaus (1983), Runenkunde. 2. um einen Anhang vermehrte Aufl. (Sammlung Metzler; M 72: Abt. C, Sprachwissenschaft) Stuttgart. Düwel, Klaus (1985), Das Opferfest von Lade. Quellenkritische Untersuchungen zur germanischen Religionsgeschichte. (Wiener Arbeiten zur germanischen Altertumskunde und Philologie 27) Wien. Düwel, Klaus (1988), „Buchstabenmagie und Alphabetzauber. Zu den Inschriften der Goldbrakteaten und ihrer Funktion als Amulette“. Frühmittelalterliche Studien 22, 70⫺110. Düwel, Klaus (1989), „Eßsitten“. In Hoops 1973 ff, VII, 579⫺586. Düwel, Klaus (1992 a), „Runen als magische Zeichen“. In: Peter F. Ganz (ed.), Das Buch als magisches und als Repräsentationsobjekt. Wiesbaden, 87⫺100. Düwel, Klaus (1992 b), „Zur Auswertung der Brakteateninschriften. Runenkenntnis und Runeninschriften als Oberschichten-Merkmale“. In: Karl Hauck (ed.), Der historische Horizont der Götterbildamulette aus der Übergangsepoche von der Spätantike zum Frühmittelalter. (Abhandlungen der Akademie der Wissenschaften in Göttingen. Philologisch-historische Klasse. 3. Folge Nr. 200) Göttingen, 32⫺90. Dume´zil, Georges (1973), Gods of the Ancient Northmen. (Publications of the UCLA Center of the Study of Comparative Folklore and Mythology 3) Berkeley und Los Angeles.
819
37. Zeichenkonzeptionen im germanischen Altertum Ebbinghaus, Ernst A. (1979), „The Origin of Wulfila’s Alphabet“. General Linguistics 19, No. 1, 15⫺29. Ebel, Else (ed.) (1974), Jacob Grimms Deutsche Altertumskunde. (Arbeiten aus der Niedersächsischen Staats- und Universitätsbibliothek Göttingen. Bd. 12) Göttingen. Edda. Die Lieder des Codex Regius nebst verwandten Denkmälern, ed. Gustav Neckel. 5., verb. Aufl. ed. Hans Kuhn. (Germanische Bibliothek. 4. Reihe. Bd. 1) Heidelberg 1983. Eggers, Hans Jürgen (1986), Einführung in die Vorgeschichte. 3. erw. Aufl. (Serie Piper Bd. 93). München und Zürich. Flowers, Stephen E. (1986), Runes and Magic. Magical Formulaic Elements in the Older Runic Tradition. (American University Studies. Series I: Germanic Languages and Literature Vol. 53) New York, Bern und Frankfurt a. M. Frank, Roberta (1988), „The Blood-Eagle again“. In: Saga-Book of the Viking Society for Northern Research 22, Part 5, 287⫺289. Greimas, Algirdas Julien (1966), Se´mantique structurale. Recherche de me´thode. Paris. Grimm, Jacob und Wilhelm Grimm (1956), Deutsches Wörterbuch. Fünfzehnter Bd., bearb. v. Moriz Heyne, Henry Seedorf und Hermann Teuchert. Leipzig. Güntert, Hermann (1921), Von der Sprache der Götter und Geister. Bedeutungsgeschichtliche Untersuchungen zur homerischen und eddischen Göttersprache. Halle a. d. Saale. Hachmann, Rolf (1993), „Verzierte Lanzenspitzen der Jüngeren Kaiserzeit. Die Vor- und Frühgeschichte und die Runeninschriften im älteren Fupark“. In: Amei Lang, Hermann Parzinger und Hansjörg Küster (eds.), Kulturen zwischen Ost und West. Das Ost-West-Verhältnis in vor- und frühgeschichtlicher Zeit und sein Einfluß auf Werden und Wandel des Kulturraums Mitteleuropa. Festschrift für Georg Kossack zum 70. Geburtstag. Berlin, 327⫺423. Hauck, Karl (1973), „Auzon, das Bilder- und Runenkästchen“. In Hoops 1973 ff, I, 514⫺522. Hauck, Karl (1976), „Bilddenkmäler. III. Thematische gegliederte Zusammenfassungen, § 8. B. zur Religion, § 9. B. zur Heldensage“. In Hoops 1973 ff, II, 577⫺598. Hauck, Karl (1988), „Zwanzig Jahre Brakteatenforschung in Münster/Westfalen. Zur Ikonologie der Goldbrakteaten, XL“. Frühmittelalterliche Studien 22, 17⫺52, Tafel I⫺XIII. Hauck, Karl (1992), „Fünens besonderer Anteil an den Bildinhalten der völkerwanderungszeitlichen Brakteaten. Zur Ikonologie der Goldbrakteaten, XLIX“. Frühmittelalterliche Studien 26, 106⫺148. Hauck, Karl (1993), „Die bremische Überlieferung zur Götter-Dreiheit Alt-Uppsalas und die bornholmischen Goldfolien aus Sorte Muld. Zur Ikonolo-
gie der Goldbrakteaten LII“. Frühmittelalterliche Studien 27, 409⫺478. Heusler, Andreas (1969), „Antrittsrede in der Preußischen Akademie der Wissenschaften“. In: Ders., Kleine Schriften, Bd. 2. (Kleinere Schriften zur Literatur- und Geistesgeschichte) Berlin, 14⫺15. Hildebrandslied. In: Althochdeutsche Literatur. Mit Proben aus dem Altniederdeutschen. Ausgewählte Texte mit Übertragungen. Hrsg., übersetzt mit Anmerkungen und einem Glossar von Horst Dieter Schlosser. Erw. Neuausgabe Frankfurt a. M. 1989, 264⫺267. Hoops, Johannes (ed.) (1977 ff), Reallexikon zur Germanischen Altertumskunde. 2., völlig neu bearbeitete und stark erweiterte Auflage ed. Heinrich Beck. Berlin und New York. Hunger, Ulrich (1984), Die Runenkunde im Dritten Reich. Ein Beitrag zur Wissenschafts- und Ideologiegeschichte des Nationalsozialismus. (Europäische Hochschulschriften. Reihe III. Geschichte und ihre Hilfswissenschaften Bd. 227) Frankfurt a. M., Bern, New York und Nancy. IK s. Axboe u. a. 1985⫺1989. Jarecki, Walter (1981), Signa loquendi. (Saecula spiritalia. Bd. 4) Baden-Baden. Jo´nsson, Finnur (ed.) (1931), Edda Snorra Sturlusonar. Udg. efter handskrifterne af Komissionen for det Arnamagnæanske Legat. Kopenhagen. Jung, Carl G. (1976), Aion. Beiträge zur Symbolik des Selbst. In: Gesammelte Werke. IX. Bd., zweiter Halbbd. ed. Lilly Merker u. Elisabeth Rüf. Olten. Kaufmann, Ekkehard (1990), „Spiegelnde Strafen“. In: Adalbert Erler und Ekkehard Kaufmann (eds.), Handwörterbuch zur deutschen Rechtsgeschichte, Bd. IV. Berlin, 1761⫺1763. Kehr, Kurt (1964), Die Fachsprache des Forstwesens im 18. Jahrhundert. Eine wort- und sachgeschichtliche Untersuchung zur Terminologie der deutschen Forstwirtschaft. Diss. phil. Marburg. Gießen. Klingenberg, Heinz (1973), Runenschrift ⫺ Schriftdenken ⫺ Runeninschriften. (Germanische Bibliothek. Dritte Reihe. Untersuchungen und Einzeldarstellungen) Heidelberg. Koestermann, E. (ed.) (1970), P. Cornelii Taciti libri qui supersunt. Tom. II: Fasc. 2: Germania ⫺ Agricola ⫺ Dialogus de oratoribus. 3. Aufl. Leipzig. Krause, Wolfgang (1966), Die Runeninschriften im älteren Futhark. I. Text. II. Tafeln. Mit Beiträgen von Herbert Jankuhn. (Abhandlungen der Akademie der Wissenschaften in Göttingen. Philologischhistorische Klasse. Dritte Folge, Nr. 65) Göttingen. Krause, Wolfgang (1968), Handbuch des Gotischen. Dritte, neubearb. Auflage. (Handbücher für das Studium der Germanistik) München. Kuhn, Hans (1978), „Philologisches zur altgermanischen Religionsgeschichte: IV. Der Todesspeer“. In: Ders., Kleine Schriften, IV. Bd. Berlin und New York, 247⫺258.
820 Lehmann, Winfried P. (1986), A Gothic Etymological Dictionary. Based on the third edition of Vergleichendes Wörterbuch der Gotischen Sprache by Sigmund Feist. Leiden. Lindqvist, Sune (ed.) (1941⫺42), Gotlands Bildsteine. I/II. (Kungl. vitterhets historie och antikvitets akademien) Stockholm. Lönnroth, Lars (1986), „Do´maldi’s Death and the Myth of Sacral Kingship“. In: John Lindow, Lars Lönnroth und Gerd Wolfgang Weber (eds.), Structure and Meaning in Old Norse Literature. New Approaches to Textual Analysis and Literary Criticism. Odense, 73⫺93. Lund, Allan A. (1991 a), „Zur Gesamtinterpretation der Germania des Tacitus“. In: Wolfgang Haase und Hildegard Temporini (eds.), Aufstieg und Niedergang der römischen Welt. Teil II: Principat. Bd. 33.3. Berlin und New York, 1858⫺1988. Lund, Allan A. (1991 b), „Kritischer Forschungsbericht zur Germania des Tacitus“. In: Wolfgang Haase und Hildegard Temporini (eds.), Aufstieg und Niedergang der römischen Welt. Teil II: Principat. Bd. 33.3. Berlin und New York, 1989⫺2382. Lurker, Manfred (1982), „Zur symbolwissenschaftlichen Terminologie in den anthropologischen Disziplinen“. In: Ders. (ed.), Beiträge zu Symbol, Symbolbegriff und Symbolforschung (Bibliographie zur Symbolik, Ikonographie und Mythologie. Ergänzungsbd. 1). Baden-Baden, 95⫺108. Lurker, Manfred (ed.) (1991), Wörterbuch der Symbolik (Kröners Taschenausgabe Bd. 464). 5. Aufl. Stuttgart. Marold, Edith (1976), „Skaldendichtung und bildende Kunst der Wikingerzeit“. In: Helmut Birkhan (ed.), Festgabe für Otto Höfler zum 75. Geburtstag. (Philologica Germanica 3) Wien und Stuttgart, 449⫺478. Marold, Edith (1989), „Personenbeschreibung und Bedeutungsstruktur“. In: Otmar Werner (ed.), Arbeiten zur Skandinavistik. 8. Arbeitstagung der Skandinavisten des Deutschen Sprachgebiets 27. 9.⫺ 3. 10. 1987 in Freiburg i. Br. (Texte und Untersuchungen zur Germanistik und Skandinavistik 22) Frankfurt a. M., Bern, New York und Paris, 399⫺425. Meissner, Rudolf (1921), Die Kenningar der Skalden. Ein Beitrag zur skaldischen Poetik. (Rheinische Beiträge und Hülfsbücher zur germanischen Philologie und Volkskunde Bd. 1) Bonn und Leipzig. Meulengracht Sørensen, Preben (1983), The Unmanly Man. Concepts of Sexual Defamation in Early Northern Society. (The Viking Collection. Vol. 1) Odense. Michel, Paul (1979), Tiere als Symbol und Ornament. Möglichkeiten und Grenzen der ikonographischen Deutung, gezeigt am Beispiel des Zürcher Großmünsterkreuzgangs. Wiesbaden. Moltke, Erik (1985), Runes and Their Origin. Denmark und Elsewhere. Kopenhagen.
VI. Keltisches, Germanisches und Slavisches Altertum Morris, Richard L. (1988), Runic and Mediterranean Epigraphy. (Nowele. Supplement Vol. 4) Odense. Much, Rudolf (1967), Die Germania des Tacitus. Dritte, beträchtlich erw. Aufl., unter Mitarbeit von Herbert Jankuhn ed. Wolfgang Lange. (Germanische Bibliothek. Fünfte Reihe. Handbücher und Gesamtdarstellungen zur Literatur- und Kulturgeschichte) Heidelberg. Müller, Gunter (1970), Studien zu den theriophoren Personennamen der Germanen. (Niederdeutsche Studien. Bd. 17) Köln und Wien. Naumann, Hans-Peter (1991), „Altgermanische Tiersymbolik und Probleme ihrer Deutung“. In: Paul Michel (ed.), Tiersymbolik. Bern, Berlin, Frankfurt a. M. und Wien, 49⫺76. Nielsen, Karl Martin (1985), „Runen und Magie. Ein forschungsgeschichtlicher Überblick“. Frühmittelalterliche Studien 19, 75⫺97. Nöth, Winfried (1985), Handbuch der Semiotik. Stuttgart. Nußbeck, Ulrich (1993), Karl Theodor Weigel und das Göttinger Sinnbildarchiv. Eine Karriere im Dritten Reich. (Beiträge zur Volkskunde in Niedersachsen. Bd. 8) Göttingen. Nyle´n, Erik und Jan Peder Lamm (1981), Bildsteine auf Gotland. Neumünster. Page, Raymond I. (1973), An Introduction to English Runes. London. Picard, Eve (1991), Germanisches Sakralkönigtum? Quellenkritische Studien zur Germania des Tacitus und zur altnordischen Überlieferung. (Skandinavistische Arbeiten, Bd. 12) Heidelberg. Ploss, Emil (1966), Siegfried⫺Sigurd, der Drachenkämpfer. Untersuchungen zur germanisch-deutschen Heldensage. Zugleich ein Beitrag zur Entwicklungsgeschichte des alteuropäischen Erzählgutes. (Beihefte der Bonner Jahrbücher Bd. 17) Köln und Graz. Puchner, Günter (1974), Kundenschall. Das Gekasper der Kirschenpflücker im Winter. Übersetzungen ins Rotwelsch. München. Raddatz, Klaus (1985), „Die Bewaffnung der Germanen vom letzten Jahrhundert v. Chr. bis zur Völkerwanderungszeit“. In: Wolfgang Haase und Hildegard Temporini (eds.), Aufstieg und Niedergang der römischen Welt. Teil II: Principat. Bd. 12.3. Berlin und New York, 282⫺361. Rausing, Gad (1992), „On the Origin of the Runes“. Fornvännen 87, 200⫺205. Reichert, Hermann (1989), „Rez. von Heinrich Beck (ed.), Germanenprobleme in heutiger Sicht“. Kratylos 34, 117⫺121. Rix, Helmut (1992), „Thesen zum Ursprung der Runenschrift“. In: Luciana Aigner-Forestı´ (ed.), Etrusker nördlich von Etrurien. Etruskische Präsenz in Norditalien und nördlich der Alpen sowie ihre Einflüsse auf die einheimischen Kulturen. Akten des Symposions von Wien ⫺ Schloß Neuwaldegg 2. bis 5. Oktober 1989. (Österreichische Akademie der Wissen-
37. Zeichenkonzeptionen im germanischen Altertum schaften. Philosophisch-historische Klasse. Sitzungsberichte. Bd. 589) Wien, 411⫺441. Salin, Bernhard (1935), Die altgermanische Thierornamentik. Neudruck, erweitert um ein Ortsregister. Stockholm. Sanders, Willy (1972), „Die Buchstaben des Königs Chilperich“. Zeitschrift für deutsches Altertum und deutsche Literatur 101, 54⫺84. Schier, Kurt (1992), „Skandinavische Felsbilder als Quelle für die germanische Religionsgeschichte?“ In: Heinrich Beck, Detlev Ellmers und Kurt Schier (eds.), Germanische Religionsgeschichte. Quellen und Quellenprobleme. (Ergänzungsbände zum Reallexikon der Germanischen Altertumskunde. Bd. 5) Berlin und New York, 162⫺228. Schmidt-Wiegand, Ruth (1986), „Eigentumsmarken und -bezeichnungen. I. Eigentumsmarken“. In Hoops 1973 ff, VI, 566⫺573. Schramm, Percy Ernst (1956), Herrschaftszeichen und Staatssymbolik. (Schriften der Monumenta Germaniae Historica. Bd. 13/3) Stuttgart. See, Klaus von (1980), Skaldendichtung. Eine Einführung. München und Zürich. See, Klaus von (1988), Mythos und Theologie im skandinavischen Hochmittelalter. (Skandinavische Arbeiten Bd. 8) Heidelberg. See, Klaus von (1993), „Held und Kollektiv“. Zeitschrift für deutsches Altertum und deutsche Literatur 122, 1⫺35. Seebold, Elmar (1986), „Was haben die Germanen mit den Runen gemacht? Und wieviel haben sie davon von ihren antiken Vorbildern gelernt?“ In: Bela Brogyanyi und Thomas Krömmelbein (eds.), Germanic Dialects: Linguistic and Philological Investigations. (Current Issues in Linguistic Theory. Vol. 38) Amsterdam und Philadelphia, 525⫺583. Seebold, Elmar (1991), „Die Herkunft der Runenschrift“. In: John Ole Askedal, Harald Bjorvand und Eyvind Fjeld Halvorsen (eds.), Festskrift til Ottar Grønvik pa˚ 75-a˚rsdagen den 21. oktober 1991. Oslo, 16⫺32. Seebold, Elmar (1993), „Fupark, Beith-Luis-Nion, He-Lamedh, Abgad und Alphabet. Über die Systematik der Zeichenaufzählung bei BuchstabenSchriften“. In: Frank Heidemanns, Helmut Rix und Elmar Seebold (eds.), Festschrift für Jürgen Untermann zum 65. Geburtstag. Innsbruck, 411⫺444. Snorri Sturluson s. Jo´nsson 1931. Steinsland, Gro (1992), „Die mythologische Grundlage für die nordische Königsideologie“. In: Heinrich Beck, Detlev Ellmers und Kurt Schier (eds.), Germanische Religionsgeschichte. Quellen und Quellenprobleme. (Ergänzungsbände zum Reallexikon der Germanischen Altertumskunde. Bd. 5) Berlin und New York, 736⫺751. Steuer, Heiko (1992 a), „Interpretationsmöglichkeiten archäologischer Quellen zum Gefolgschaftsproblem“. In: Günter Neumann und Henning Seemann (eds.), Beiträge zum Verständnis der Germania des Tacitus. Teil II. Göttingen, 203⫺257.
821 Steuer, Heiko (1992 b), „‘Objektwanderung’ als Quelle der Kommunikation. Die Möglichkeiten der Archäologie“. In: Kommunikation und Alltag in Spätmittelalter und früher Neuzeit. Internationaler Kongreß Krems a. d. Donau 1. bis 12. Oktober 1990. (Veröffentlichungen des Instituts für Realienkunde des Mittelalters und der frühen Neuzeit Nr. 15. Österreichische Akademie der Wissenschaften. Philosophisch-historische Klasse. Sitzungsberichte Bd. 596) Wien, 401⫺440. Streitberg, Wilhelm (ed.) (1965), Die gotische Bibel. I. Teil: Der gotische Text und seine griechische Vorlage. Mit Einleitung, Lesarten und Quellennachweisen sowie den kleineren Denkmälern als Anhang. 5., durchgesehene Aufl. II. Teil: Gotisch-griechisch-deutsches Wörterbuch. 4., unver. Aufl. Darmstadt. ˚ ke V. (1975), „Germanische Religion“. In: Ström, A ˚ ke V. Ström und Haralds Biezais, Germanische A und baltische Religion. (Die Religionen der Menschheit. Bd. 19,1) Stuttgart, Berlin, Köln und Mainz, 11⫺306. Stutz, Elfriede (1966), Gotische Literaturdenkmäler. (Sammlung Metzler. Realienbücher für Germanisten. Abteilung Literaturgeschichte. M 48) Stuttgart. Tacitus, Germania s. Koestermann 1970. Udolph, Jürgen (1995), Namenkundliche Studien zum Germanenproblem. (Ergänzungsbände zum Reallexikon der Germanischen Altertumskunde. Bd. 9) Berlin und New York. Uecker, Heiko (1989), „Intertextualität und Dekonstruktivismus in der altnordischen Prosaliteratur?“ In: Otmar Werner (ed.), Arbeiten zur Skandinavistik. 8. Arbeitstagung der Skandinavisten des Deutschen Sprachgebiets 29. 9.⫺3. 10. 1987 in Freiburg i. Br. (Texte und Untersuchungen zur Germanistik und Skandinavistik 22) Frankfurt a. M., Bern, New York und Paris, 390⫺398. Ulfila s. Streitberg 1965. Vries, Jan de (1956), Altgermanische Religionsgeschichte. Bd. I. Zweite, völlig neu bearb. Aufl. (Grundriß der germanischen Philologie 12/I) Berlin. Vries, Jan de (1957), Altgermanische Religionsgeschichte. Bd. II. Zweite, völlig neu bearb. Aufl. (Grundriß der germanischen Philologie 12/II) Berlin. Weber, Gerd Wolfgang (1981), „Irreligiosität und Heldenzeitalter. Zum Mythencharakter der altisländischen Literatur“. In: Ursula Dronke u. a. (eds.), Specvlvm norroenvm. Norse Studies in Memory of Gabriel Turville-Petre. Odense, 474⫺505. Weber, Gerd Wolfgang (1986 a), „Edda, Jüngere“. In Hoops 1977 ff, VI, 394⫺412. Weber, Gerd Wolfgang (1986 b), „Sidaskipti. Das religionsgeschichtliche Modell Snorri Sturlusons in Edda und Heimskringla“. In: Rudolf Simek, Jo´nas Kristja´nsson und Hans Becker-Nielsen (eds.), Sagnaskemmtun. Studies in Honour of Hermann Pa´ls-
822
VI. Keltisches, Germanisches und Slavisches Altertum
son on His 65th Birthday, 26th May 1986. Wien, Köln und Graz, 309⫺329. Weber, Gerd Wolfgang (1987), „Intellegere historiam. Typological Perspectives of Nordic Prehistory (in Snorri, Saxo, Widukind and Others)“. In: Tradition og historieskrivning. Konference om kilderne til Nordens ældste historie. Aarhus Universitet 5.⫺6. maj 1986. (Acta Jutlandica LXIII: 2. Humanistisk serie 61) Aarhus, 95⫺141. Weber, Gerd Wolfgang (1990), „‘Sem konungr skyldi’. Heldendichtung und Semiotik. Griechische und germanische heroische Ethik als kollektives Normensystem einer archaischen Kultur“. In: Hermann Reichert und Günter Zimmermann (eds.), Helden und Heldensage. Otto Gschwantler zum 60. Geburtstag. (Philologica Germanica 11) Wien, 447⫺481. Wenskus, Reinhard (1986), „Über die Möglichkeit eines allgemeinen Germanenbegriffs“. In: Heinrich
Beck (ed.), Germanenprobleme in heutiger Sicht. (Ergänzungsbände zum Reallexikon der Germanischen Altertumskunde. Bd. 1) Berlin und New York, 1⫺21. Wenskus, Reinhard (1992), „Die neuere Diskussion um Gefolgschaft und Herrschaft in Tacitus’ Germania“. In: Günter Neumann und Henning Seemann (eds.), Beiträge zum Verständnis der Germania des Tacitus. Teil II. Göttingen, 311⫺331. Wilson, David M. und Ole Klindt-Jensen (1980), Viking Art. 2nd ed. Minneapolis. Zeiss, Hans (1941), Das Heilsbild in der germanischen Kunst des frühen Mittelalters. (Sitzungsberichte der Bayerischen Akademie der Wissenschaften. Philosophisch-historische Abteilung Jahrgang 1941. Bd. II, H. 8) München.
Klaus Düwel, Göttingen (Deutschland)
38. Zeichenkonzeptionen im slavischen Altertum 1. 2. 3. 4. 5. 6.
1.
Mündlichkeit vs. Schriftlichkeit Der slavische Mythos Vom mythischen zum christlichen Weltmodell Der mittelalterlich-christliche Kulturtyp Literatur und Kunst Literatur (in Auswahl)
Mündlichkeit vs. Schriftlichkeit
Die in Osteuropa nördlich der Karpaten beheimateten Urslaven hatten die Balten, Illyrer und Kelten, die Thraker und iranische Stämme als Nachbarn. Dabei bestand wohl eine baltisch-slavische Spracheinheit. Das Altkirchenslavische ist erste und älteste slavische Schriftsprache (seit 863). Der byzantinisch-griechische Einfluß wird zunehmend prägend. Die erste Schrift, die Glagolica (rund und eckig; siehe Abb. 38.1) wird frei erfunden. Sie wird im (10.⫺)11. Jahrhundert durch die Kyrillica ersetzt. Diese basiert auf der griechischen Unziale. Bei den westlichen Slaven dominiert hingegen die lateinische Schrift (zur griechischen Schrift vgl. Art. 41 § 2.1., zur hebräischen Schrift Art. 61 § 3., zu den altorientalischen Schriften Art. 89 § 2., zu den Schriften der Inder Art. 92 § 1.3., der Chinesen Art. 93 § 2., der Koreaner Art. 94 § 5., der Japaner Art. 95 § 2., der Araber Art. 90 § 3., zu den Schriften der Kelten vgl. Art. 36 § 9. und der Germanen Art. 37 § 3.). Die Schrift kommt aber erst mit dem Christentum zu den Slaven. Zuvor herrscht die
Abb. 38.1: Glagolitisches Alphabet (Glagolica).
mündliche Volkskultur. Die Folkloretradition mit ihren materiellen Artefakten und Mentefakten (mythologische Bedeutungsebene) dient wesentlich der Rekonstruktion archaischer Weltanschauung (zur hier verwendeten kultursemiotischen Terminologie
823
38. Zeichenkonzeptionen im slavischen Altertum
vgl. Posner 1992). Die Transmissionsmechanismen freilich sind verschieden: Die Artefakte wechseln stadial, die Mentefakte überlagern sich zu einer mythologischen Tiefensemantik. Die mündliche, nicht in äußeren Zeichen entfremdete Kommunikation wird als eigene, die schriftliche als fremde, autoritative Semiose gewertet (vgl. auch die Rollenverteilung zwischen schriftlicher und mündlicher Kommunikation im Islam, Art. 90, und im nicht-islamischen Afrika, Art. 91). Dennoch steht die Schriftsprache ⫺ anders als das Latein bei den westlichen Slaven ⫺ den Dialekten nahe. Das Kirchenslavische ist die gemeinsame Sprache, die lokale Sprachtraditionen verbindet. Seine semantische Breite ist größer als die der nationalen Dialekte: es vermag nicht nur konkrete, sondern auch abstrakte Bedeutungen auszudrücken. Der Gebrauch der Buchsprache dominiert und steht so im Zentrum der Kultur. Die gemeinsame Sprache normiert und homogenisiert bis dahin zersplitterte Gemeinschaften ebenso wie die damit institutionalisierte confessio. Die Mission von Kyrill und Method läßt im 10. Jahrhundert erstmals ein Bewußtsein der Einheit aller Slaven entstehen. Der Übergang vom momentanen mündlichen Mentefakt zum persistenten Artefakt des Buches, von der Zersplitterung der Dialekte zur Ganzheitlichkeit der Schriftsprache, von der Holzkirche zur persistent Steinkirche (in der Kiever Rus’ seit 989) findet in der politischgesellschaftlichen Entwicklung eine Parallele: In der „Kiever Rus’“ (womit das ursprüngliche russische Land und Volk bezeichnet wird) einigt sich der zersplitterte Fürstenstaat. Mit dem Übergang zum Feudalismus werden dort auch die Beziehungen zwischen den sozialen Gruppen dauerhaft geordnet und normiert. Schrift, Buch und Christentum (Kirche, Klöster) stehen im Zentrum der Kultur und bilden mit der politischen Autorität der Fürsten das Machtzentrum (vgl. die Verhältnisse im lateinischen und griechischen Mittelalter, Art. 59 § 4.⫺6. und Art. 60 § 4.⫺6.). Die hierarchische gesellschaftliche Ordnung findet im hierarchischen Zeichen- und Textcharakter eine Entsprechung: die Sprache hat nur ganzheitliche, wahre Bedeutungen zu schaffen. Diese Synsemie wird durch das Zitat höherrangiger, sakraler Texte erreicht. Der Mensch kann selbst nur niedrige Bedeutungen hervorrufen, die hohen vermag er nur passiv zu empfangen. Jedes Zeichen ist einem göttlichen Modell nachgebildet. Historische Ereignisse und Personen werden nur als figurale
Interpretationen eines im Ursprung göttlichen Modells interpretiert (siehe Art. 58 § 3.). In der Synsemie schafft das Zeichen Ganzheitlichkeit.
2.
Der slavische Mythos
Das Weltmodell der slavischen Kultur bestimmt die Verhaltensregeln von einzelnem und Kollektiv. Das Weltmodell setzt sich aus allen semiotischen Systemen, die ein Kollektiv umfaßt, zusammen. Weltmodell meint die geordnete Vorstellung von der Welt innerhalb einer gegebenen Tradition. Historisch ist es auf den Kosmos ausgerichtet und setzt die Beschreibung der Grundparameter des Universums voraus: raumzeitliche, kausale, ethische, quantitative, semantische und personelle. Diese Parameter fallen mit grammatischen Kategorien zusammen. Das mythopoetische Bewußtsein arbeitet ein System binärer Unterscheidungsmerkmale aus, die das universalste Mittel bei der semantischen Beschreibung des Weltmodells darstellen: Es handelt sich um 10⫺20 Paare vom Typ hoch/ niedrig, rechts/links, gerade/ungerade oder eigen/fremd (zu verwandten Ansätzen vgl. im europäischen Bereich etwa Art. 36 § 4. sowie Art. 37 § 4. und § 7.1., im außereuropäischen Bereich Art. 93 § 4. sowie Art. 99 § 8.). Die universalen Zeichenkomplexe werden in verschiedenen Kodesystemen realisiert: im astralen, vegetativen, zoomorphen usw. Alle Kodes lassen sich auf einen gemeinsamen Nenner bringen, jenen der Sprache. Sie strukturiert das Weltmodell, und das Weltmodell strukturiert sie. Sie ist autonomer Kode im Weltmodell und zugleich einziger Metakode. Die Urslaven entwickeln ein eigenes Weltmodell, das sich freilich nur über sekundäre schriftliche und materielle (folkloristische) Quellen erschließen läßt. Bei den baltischen (West-)Slaven und den Ostslaven hat sich die spätere urslavische Mythologie am besten erhalten. Verschiedene Ebenen können bestimmt werden: nach der Funktion der mythologischen Personen, nach dem Charakter ihrer Verbindung zum Kollektiv, nach der Stufe ihrer individualisierten Verkörperung, nach Besonderheiten ihrer historischen Charakteristik und nach dem Grad ihrer Aktualität für den Menschen. Es lassen sich fünf, nach Ebenen hierarchisch gegliederte religiöse Systeme unterscheiden: Die höchste Ebene bezeichnet den am meisten verallgemeinerten Typ der Funk-
824 tionen von Göttern. Ihr gehören die obersten Götter Perun und Veles sowie eine weibliche Gottheit (Mokosˇ) an. Sie verkörpern zum einen die kriegerische, zum anderen die wirtschaftlich-natürliche Funktion. Perun, als Gott des Donners im Himmel oder auf den Höhen lebend, verfolgt seinen schlangengleichen Feind, der unten, auf der Erde zu Hause ist. Beide liegen im Streit, weil Veles das Vieh, auch die Frau Peruns gestohlen hat. Der Streit endet in einem der Erde Fruchtbarkeit bringenden Regen, bzw. zerstört Perun seinen Gegner durch Verbrennen eines Baumes (Veles) oder Zerschlagen eines Steins, hinter dem sich Veles verbirgt. Zu diesem Pantheon gehören auch Svarog, der Gott Zuarisiz der baltischen Slaven, der altrussische Dazˇ’bog bzw. der serbische Dabog. Die Gliederung der obersten religiösen Ebene läßt sich mit der Gliederung des Kollektivs in soziale Gruppen korrelieren: Herrschen bei den Ostslaven Kriegsgötter (Perun, Sventovit), so hingegen in der nördlichen Rus’ und zum Teil bei den baltischen Slaven Götter mit natürlichen, wirtschaftlichen Funktionen. Die besonders intensive Verbindung zum Kollektiv, zur Ganzheit, die besondere Autorität schafft, verleiht dieser religiösen Ebene die größte Offizialität. Gilt Perun als Gott des fürstlichen Gefolges, so Veles ⫺ bei den Ostslaven ⫺ als Gott der übrigen Rus’. Die zweite religiöse Ebene zeigt sich spezialisierter. Ihre Oppositionspaare können in bezug auf die inhaltlichen der ersten Ebene als Ausdrucksebene verstanden werden. Diese Inhalt-Ausdruck-Relation setzt sich durch alle Ebenen fort. Die Elemente dieser zweiten Ebene sind nur mit Mikrokollektiven oder mit landwirtschaftlichen Zyklen, saisonalen Ritualen verbunden: so etwa die Geburt und Geschlecht denotierende Gottheit Rod. Sie entfernen sich bereits weiter vom Einfluß der höheren Macht. Die Elemente der dritten Ebene zeigen den höchsten Abstraktionsgrad der Funktionen: Oft handelt es sich nur noch um Benennungen bzw. Personifikationen von Oppositionsgliedern der Grundparameter, z. B. russ. „Pravda“ (‘Wahrheit’) und „Krivda“ (‘Falsch, Lüge’). Auf der vierten religiösen Ebene sind alle Elemente anthropomorph. Es handelt sich um die Helden des mythischen Epos, das mit Beginn der mythisch-historischen Tradition erscheint. Diese Helden sind nur mehr in einzelnen slavischen Traditionen bekannt. Bei
VI. Keltisches, Germanisches und Slavisches Altertum
den Ostslaven etwa Kij, S˘cˇek und Choriv, bei ˘ ech, Ljach und Krak. Anden Westslaven C ders als diese genealogischen Helden sind ihre Gegenspieler oft Schlangenungeheuer wie Vuk bei den Serben oder Werwölfe. Auf der fünften religiösen Ebene, der niedrigsten, sind Märchenfiguren angesiedelt wie die Hexe (Baba-Jaga). Den niederen Mythen gehören auch verschiedene Klassen nicht individualisierter Geister (duchi) an, die mit mythischen Räumen wie Haus, Wald oder Sumpf fest verbunden sind. Diese niederen mythischen Figuren stellen bei den (Ost-)Slaven das Götterpantheon durch ihre Bedeutung in den Schatten (vgl. zum Dualismus zwischen persönlichen Gottheiten und unpersönlichen Naturmächten in den Mythen der Kelten Art. 36 § 5., der Germanen Art. 37 § 5., der Römer Art. 47 § 5.1., der Chinesen Art. 93 § 4. und 5., der Japaner Art. 95 § 3. der Malaien Art. 96 § 4. und der präkolumbianischen Amerikaner Art. 99 § 7.). Neben den mythischen Figuren gibt es eine Reihe lokal bekannter Götter, so besonders bei den Balten, wo der Kriegsgott Sventovit, aber auch Triglav (3 Köpfe) als höchste Götter verehrt werden. In der polnischen Mythologie ergeben sich sowohl Entsprechungen mit der römischen als auch mit der ostslavischen Mythologie (die poln. Göttin Nya entspricht wohl der russ. Nav’). Die heutige Kenntnis der südslavischen Mythologie ist bescheiden, weil das Christentum früh angenommen wurde. Die Deformation und Zerstörung des mythologischen Systems erfolgt in verschiedene Richtungen: Häufig wechselt die mythische Figur von der höheren (Inhalts-)Ebene auf die niedrigere (Ausdrucks-) Ebene. Dies verbindet sich meist mit einer Umwertung von positiv zu negativ, mit einer Bewegung vom Zentrum zur Peripherie des Weltmodells. Insgesamt verteilt sich ein geringes Inventar von Funktionen (Inhalten) auf ein weitaus größeres Inventar von Personen (Ausdrücken).
3.
Vom mythischen zum christlichen Weltmodell
Die Einführung des Christentums (in Rußland 988) zerstört in erster Linie das kulturelle Zentrum, also die Personen der höchsten Ebene. Sie werden zum einen negativ umgewertet, zum anderen in der Identifikation mit christlichen Heiligen beibehalten (vgl. Abb. 38.2): Perun wird mit dem heiligen
825
38. Zeichenkonzeptionen im slavischen Altertum
Abb. 38.2: Masken und Heiligenfiguren an der Georgskathedrale von Jur’ev-Pol’skij (um 1230).
Elias (Il’ja), Veles mit dem heiligen Vlasij identifiziert. Die Peripherie der slavischen Mythologie, also die niederen Ebenen haben länger Bestand. Sie verbinden sich mit der ins kulturelle Zentrum rückenden christlichen Religion und schaffen so eine Situation des Doppelglaubens („dvoeverie“). Vgl. die Verhältnisse bei der Christianisierung der Kelten (Art. 36 § 8.) und des Mittelmeerraumes (Art. 58 § 5. und 60 § 4.4.3.) sowie bei der Ausbreitung anderer Weltreligionen (zum Islam Art.
90 § 3., zum Hinduismus Art. 92 § 1, zum Buddhismus Art. 93 § 4 und § 5., Art. 95 § 3. und Art. 96 § 4.). Von Perun, dem Beschützer des Fürsten, weiß man aus administrativen Zentren. Seine hauptsächlichen Waffen sind Stein und Blitz (vgl. poln. strzała piorunowa). Er wird der Ganzheit der vier Himmelsrichtungen zugeordnet. Sein Novgoroder Heiligtum hat eine viergliedrige Struktur (vgl. Abb. 38.3). Sein Name verschwindet ebenso wie jener von Ve-
826
VI. Keltisches, Germanisches und Slavisches Altertum
Abb. 38.3: Viergesichtiger Kopf des heidnischen Gottes von Zbrucˇ.
les, doch das Sujetschema ihres Kampfes bleibt. Der Perunmythos muß als ätiologischer über die Herkunft von Donner, Regen und Fruchtbarkeit verstanden werden. Schon innerhalb des mythologischen Weltmodells erscheinen Perun und Veles als Funktionen, Inhalte für verschiedene Hypostasen (Ausdruck) auf den verschiedenen Ebenen. Diese Spezifik als Alloperson gewährleistet die Kontinuität ihrer Funktionen im Chri-
stentum: Perun ist sowohl Donner als auch Gott, Heiliger Elias, Hl. Georg und Märchenheld. Veles ist Schlange, Teufel, Dämon, böser Mensch, aber auch Hl. Vlasij. Die christlichen Hypostasen der Allopersonen behalten bestimmte Charakteristika bei: Perun und Elias werden gleichermaßen die Attribute Bart, Pferd und Donner zugeschrieben, Perun und Hl. Georg verbindet das Attribut des Pferdes. Selbst der Held der russischen
38. Zeichenkonzeptionen im slavischen Altertum
epischen Gesänge (Bylinen) Il’ja Muromec erscheint als Hypostase Peruns. Die Distribution der beiden Allopersonen läßt sich mit der kulturell-geographischen und der sozialen Struktur korrelieren: Der heilige Georg wird wie Perun mit dem Oben (Strenge), dem fürstlichen Leben verbunden und vor allem im Zentrum, in der Kiever Rus’ verehrt. Der heilige Nikolaus (Nikolaj) repräsentiert das Unten (Barmherzigkeit), übernimmt vor allem (land-)wirtschaftliche Funktionen ⫺ besonders auch im Rahmen von Festen ⫺ und wird besonders im Norden, an der Peripherie verehrt. Auch die Volksfeiertage des Kalenderbrauchtums werden vom Kirchenkalender adaptiert. Bei diesen Feiertagen stehen gleichbleibende Funktionen als Inhalte im Zentrum. Doch werden sie in unterschiedlichen Ereignis-Hypostasen realisiert. Der Kampf zwischen Donnergott und Schlange ist auf die Zeit um Neujahr (russ. svjatki, ukr.-weißruss. koljadki) festgelegt. Es ist dies ebenso eine Zeit des Totengedenkens wie die Butterwoche (russ. maslenica) vor der Fastenzeit, wie die „radunica“, der zweite Tag der Woche nach Ostern oder Pfingsten (russ. semik). Zu ähnlichen Strategien bei der Festlegung der Feiertage im Kalender der griechisch-orthodoxen und der römischen Kirche vgl. Art. 60 § 4.4.3. und Art. 36 § 8. sowie Art. 58 § 5. Der Begräbnisritus wird in diesen und anderen Festen variativ wiederholt. Man kann somit auch von Allohandlungen und Alloereignissen sprechen. Wird im Rahmen des Semik das Objekt des Wachstums, der Baum (Birke) zerstört, so bei der Maslenica das Zeichen, nämlich das anthropomorphe Äquivalent, die Puppe. Da im Mythos Sache und Zeichen identisch sind, kann einmal das Ding, dann das Zeichen des Dings zerstört werden. Insofern ist das Zeichen nur Hypostase des Gegenstands und umgekehrt. Die Zeichenkomplexe werden also hier in verschiedenen Kodesystemen realisiert. Auch die Handlung des für russische Feiertage so wichtigen Zerstörens kann als Allohandlung durch Zerreißen, Ertränken, Verbrennen, Begraben und ähnliches realisiert werden. Auch hier zeichnet sich eine gemeinsame Bedeutung, eine Tiefensemantik der verschiedenen Kodesysteme ab.
4.
Der mittelalterlich-christliche Kulturtyp
Trotz des unbestreitbaren Bruchs beim Übergang vom Mythos zum Christentum ändern sich die Zeichenkonzeptionen nicht wesent-
827 lich. Die den Menschen umgebende Welt wird weitgehend als Zeichen aufgefaßt. Die unterschiedlichen Zeichen sind nur verschiedene Träger (Ausdrucksebene) einer Bedeutung (Inhalt). Dieser semantische (symbolische) Kulturtyp negiert jede Syntaktik; Bedeutungsveränderungen gibt es nur als Bedeutungsvertiefungen, als stufenweise synsemantische Annäherung an das Absolute. Die Welt wird in zwei Bereiche geteilt: „mit Bedeutung“ ist das zeichenhafte Leben, „ohne Bedeutung“ das praktische Leben (vgl. Art. 33 § 1.3.). Zwar mußte auch der Mensch des frühen Mittelalters nach praktischen Resultaten wie der Eroberung einer Stadt streben. Doch hatte er als soziales Wesen diese praktischen Dinge als bedeutungslos zu betrachten, schreckliche Realitäten (Morden, Hunger) zu ignorieren. Diese hohe Zeichenhaftigkeit wertet in der russischen Rechtsprechung („Russkaja pravda“) den durch eine Beleidigung erlittenen, zeichenhaften Schaden nicht geringer als einen realen Schaden. Auf die Beleidigung eines ⫺ praktisch ungefährlichen ⫺ Schlags mit der Schwertscheide darf mit einem ⫺ eventuell tödlichen ⫺ Schwerthieb geantwortet werden. Hauptmerkmal des Zeichens ist seine Stellvertreterfunktion. Das Vertretene wird als Inhalt, das Vertretende als sein Ausdruck begriffen. Letzteres erhält seinen Wert allein aus der hierarchischen Stellung seines Inhalts im Weltmodell. Der Teil wird damit dem Ganzen homomorph. Er stellt nicht wirklich einen Teil, sondern ein Symbol des Ganzen dar. Der Teil repräsentiert das Ganze und geht nicht in das Ganze ein. Erkenntnis, Vermehrung des Wissens wird deshalb auch nicht quantitativ über Vereinigung vieler Teile zu einem Ganzen erzielt, sondern durch Vertiefung, durch mehrfaches Wahrnehmen. Diese hierarchisch gestufte Erkenntnis vollzieht sich als Aufstieg von den semantischen Teilen zum synsemantischen Ganzen der Wahrheit, des Absoluten (zu einer vergleichbaren Strategie der Wissensorganisation in der jüdischen Tradition siehe Art. 61 § 8. in Altamerika vgl. Art. 99 § 8.). Auch die sozialen Systeme folgen diesem Prinzip. Der Mensch als individuelle Persönlichkeit existiert nicht, etwa im Rechtssystem. Die Ausstattung mit Rechten hängt von der Zugehörigkeit zu einer Gruppe, einem Kollektiv ab. Der Familienverband (bei den Südslaven: zadruga), das Geschlecht (rod), die Dorfgemeinschaft bilden auf der horizontalen Sozialstruktur die Grundeinheit. Die
828
Abb. 38.4: Evangelist Lukas. Miniatur aus dem Ostromir-Evangeliar (1056⫺1057).
Strafe wird nicht am praktischen Schaden, am materiellen Artefakt, sondern je nach Person und sozialer Stellung des Adressaten unterschiedlich bemessen. Zwar repräsentiert auch der einzelne das Ganze, doch die strikte Trennung von biologischer und gesellschaftlicher Person in diesem so zeichenhaften Kulturtyp läßt den einzelnen ohne Rechte. Auch die politischen Ämter werden nach dem Geburtsrecht besetzt, die Rangfolge im Feldzug wie beim Festmahl ist eine streng hierarchische. Der hierarchischen Struktur des Zeichens entspricht so eine hierarchische soziale und politische Gliederung. Zwischen dem immer materiellen Ausdruck und dem ideellen Inhalt besteht eine Analogiebeziehung: Der Ausdruck wird zum Abbild des Inhalts. Der insgesamt christliche Ursprung dieses Kulturtyps wird hier besonders deutlich, da schon der Mensch als Ebenbild Gottes als materieller Ausdruck eines ideellen Inhalts geschaffen ist. Eine syntaktische Verbindung schließt sich von selbst aus: allein achronische Analogie ist vorstellbar. Dementsprechend wirkt auch der Künstler als Nach-Schöpfer und Vermittler (vgl. Abb. 38.4). Darin ist er nur Ausdruck des eigentlichen Schöpfers. Die nationale Geschichte mit ihren herausragenden Repräsentanten ist als materieller Ausdruck der biblischen Heilsgeschichte zu verstehen. Diese Abbildrelation wird schon in der byzantinischen Kultur konstituiert. Ihr wird von den Slaven in der Orthodoxie und ihrer
VI. Keltisches, Germanisches und Slavisches Altertum
Zeichenpraxis (Liturgie, Bildersprache), in dem Parallelismus von politischem und religiösem System, vor allem in Sakralarchitektur und Kirchenmusik, aber auch in der Literatur entschlossen gefolgt. Bei dieser Adaptation ⫺ besonders bei Russen und Serben ⫺ bedarf es freilich der Vermittlung durch die bulgarische Kultur. Auch diese wird ⫺ einem Lehrer-Schüler-Verhältnis vergleichbar ⫺ Vorbild für die ostslavische Kultur. Freilich kommt es bei der Adaptation der bulgarisch vermittelten byzantinischen Kultur zu signifikanten Veränderungen. Philosophische Zeichenkonzeptionen und Rhetorik gehen verloren. Metaphysik und metaphysische Fundierung der Politik (Dynastie) verschwinden aus dem Zentrum der Kultur. Das byzantinische Christusbild ist jenes des gefürchteten Weltenherrschers und himmlischen Richters (Pantokrator). Das byzantinische Bild der Gottesmutter ist vor allem das der Himmelskönigin. Weltliche Macht als Abbild transzendent-religiöser Macht steht im Zentrum byzantinischer Kultur (vgl. Art. 60 § 3. und § 4.). In das Zentrum der süd- und ostslavischen Kultur rückt hingegen weltlich-konkrete Ethik. Christus hat sich selbst erniedrigt, indem er auf die Erde gekommen ist, vom Gott zum Menschen geworden ist. Im Zentrum der slavischen Kultur steht dennoch nicht Christus, sondern die in Rußland überwiegend so genannte Gottesgebärerin (bogorodica), die in erster Linie als die ihr Kind liebende Mutter auf so zahlreichen Ikonen dieses Typus (umilenie) dargestellt, in so vielen Festen gefeiert wird. Bei Kontinuität der Heiligenverehrung öffnen sich die Heiligen dennoch erst in Rußland den irdisch-realen Bedürfnissen der Menschen. Nicht sakramentale Heilung von oben wird erwartet ⫺ wie in Byzanz ⫺, sondern ein ethisches, liebendes Leben. In dieser irdischen Transformation gewinnt auch die sinnlich unmittelbare Zugänglichkeit des Göttlichen in sakralen Gegenständen (Kreuz, geweihtem Wasser, Reliquien) nachhaltig an Bedeutung. Die Gottesmutter verbürgt den Schutz (pokrov) der sozialen Mikro- (Haus, Familie) wie auch Makroeinheit (Staat).
5.
Literatur und Kunst
Das Analogieprinzip liegt auch dem MimesisBegriff der Kunst des slavischen Altertums zugrunde. In verbaler und bildender Kunst
829
38. Zeichenkonzeptionen im slavischen Altertum
stehen nicht konkrete Werke oder Gattungen im Zentrum, sondern vorgegebene morphologische und syntaktische Ausdrucksschablonen (vgl. die Literatur und Kunst im lateinischen und griechischen Mittelalter, Art. 53 und Art. 55 bzw. Art. 60 § 6., sowie in den Kulturen des Islam, Art. 90 § 4. und § 10., des Hinduismus, Art. 92 § 4., und Buddhismus, Art. 93 § 7.). Sie werden von autoritativen religiösen Texten adaptiert. Dieses slavische Schrifttum, diese Literatur hängt demnach von Vorlagen ab. Sie zeigt sich äußerst konservativ in Produktion und Rezeption. Die Dominanz der Konfession über die jeweilige
Nation garantiert die Vorherrschaft von Traditionen des Kollektivs gegenüber der Innovation durch das Individuum. In diesem Mimesisbegriff kommt die Normiertheit dieses Schrifttums zum Ausdruck. Aufgrund der Abbildfunktion offenbart sich auch diese Normiertheit als eine höheren Ursprungs. Religiöse und ästhetische Funktion lassen sich nicht trennen, sondern bilden eine synsemantische Ganzheit. Denotat und eigentlicher Inhalt sind dabei im Religiösen, Konnotate und Ausdruck im Ästhetischen angesiedelt. Auch die religiös-ästhetische Einheit ist also hierarchisch strukturiert.
Abb. 38.5: Heiliger Nikolaus (Nikolaj). Rußland, 17. Jahrhundert.
830 Als die im slavischen Altertum höchste Kunst gilt die Ikonenmalerei. In der Sakralarchitektur oder in der vokalen, homophonen Musik unterscheidet sich die Kunst nicht wesentlich von jener in Byzanz (vgl. Art. 60 § 4.6. und § 6.5.). Auch die grundlegenden ikonographischen Typen werden von dort übernommen. Doch im slavischen Altertum wird die Ikone noch höher gewertet. In ihrer Monumentalität nähert sie sich dem byzantinischen Mosaik an. Zu Beginn des Malprozesses wird das Ikonenbrett in eine Wand verwandelt. Die Ikone übernimmt damit auch Funktionen des Freskos. Die für die slavische Kultur so grundlegende Kollektivität verschafft sich stärker Geltung. Wie in der Liturgie, in welche die Ikone eingebunden ist, wird die Gemeinschaftlichkeit (sobornost’) ihrer Produktion und Verehrung unterstrichen. Anders als in byzantinischen Ikonen verbinden sich Engel, Menschen und Erde zu einer Gemeinschaft. Auch die Wahrnehmung der Ikone mit ihrer umgekehrten Perspektive (Bedeutungsperspektive) soll religiöse Objektivität ausdrükken. Ein individuelles Begreifen der Ikone gibt es nicht. So macht die umgekehrte Perspektive das Erkennen von Einzelheiten unmöglich, die von der Gesamtdarstellung losgelöst sind. Die spezifische Mimesis erfordert eine im Ganzen ⫺ nicht im individuellen Detail ⫺ ähnliche Welt. Der Teil definiert sich allein über seine Korrelation mit dem Ganzen. Die umgekehrte Perspektive geht von einer Vielzahl von Betrachterpositionen aus. Der visuelle Eindruck entsteht synsemantisch durch Summierung, durch Herstellen der Ganzheitlichkeit, durch Synthese des visuellen Eindrucks. Die geweihte Ikone ist Ort der Anwesenheit des Dargestellten im Bild (vgl. Abb. 38.5). Die Ikone ist damit nicht nur Zeichen, sondern auch Referent. Das Zeichen, das Bild des Heiligen, wird mit dem Referenten, seiner wirklichen Person, identifiziert (vgl. dagegen die Auseinandersetzungen der Ikonoklasten in Byzanz, Art. 60 § 4.7.). Auch in den heiligen Gaben der Liturgie ist Christus real gegenwärtig (vgl. dagegen den Ausgang des Abendmahlsstreits im Westen, Art. 72 § 1.1.). Aufgrund der Gebundenheit an einen Archetypen bleibt die Zahl der Ikonensujets eng begrenzt, können in neuen Ikonen die autoritativen, inhaltlichen Archetypen nur in neue Ausdrücke übersetzt, kopiert werden. Der Ikonenmaler erweist sich darin ebensowenig als Schöpfer wie der Schreiber: Beide können als Nachschöpfer nicht Neues schaf-
VI. Keltisches, Germanisches und Slavisches Altertum
fen, sondern nur die begrenzte autoritative Tiefensemantik immer neu aufdecken. Die Kunst des slavischen Altertums fügt sich damit in die allgemeingültigen Zeichenkonzeptionen ein.
6.
Literatur (in Auswahl)
Civ’jan, T. V. (1989), „O lingvisticˇeskich osnovach modeli mira (na materiale balkanskich jazykov i tradicij)“. Slavjanskij i balkanskij fol’klor. Moskva, 192⫺206. Dvornik, Francis (1959), The Slavs. Their History and Early Civilization. Boston. Godja, Martin (1991), The Ancient Slavs. Settlement and Society. Edinburgh. Kulikowski, M. (1989), A Bibliography of Slavic Mythology. Columbus OH. Ivanov, V. Vs. und V. N. Toporov (1965), Slavjanskie jazykovye modelirujusˇcˇie semioticˇeskie sistemy (Drevnij period). Moskva. Ivanov, V. Vs. und V. N. Toporov (1974), Issledovanija v oblasti slavjanskich drevnostej. Moskva. Lenhoff, G. (1982), „The Aesthetic Function and Medieval Russian“. In: P. Steiner u. a. (eds.), The Structure of the Literary Process. Amsterdam und Philadelphia, 321⫺340. Lipatov, A. V. (1990), „Obsˇcˇie zakonomernosti istorii slavjanskich literatur i koncepcija R. Pikkio“. Izvestija Akademii Nauk. Serija literatury i jazyka 49,4, 318⫺327. Lotman, Ju. M. (1981), „Zeichen und Zeichensystem in bezug auf die Typologie der russischen Kultur (11. bis 19. Jahrhundert)“. In: Ju. M. Lotman, Kunst als Sprache. Leipzig, 149⫺174. Mansikka, V. J. (1922), Die Religion der Ostslaven I: Quellen. Helsinki. Mathauserova´, S. (1988), Cestami staletı´. Syste´move´ vztahy v deˇjina´ch ruske´ literatury. Prag. Posner, R. (1992), „Was ist Kultur? Zur semiotischen Explikation anthropologischer Grundbegriffe“. In: M. Landsch, H. Karnowski und I. Bystrina (eds.), Kultur-Evolution: Fallstudien und Synthese. Frankfurt a. M., 1⫺66. Preidel, H. (1961), Slawische Altertumskunde des östlichen Mitteleuropas im 9. und 10. Jahrhundert. Gräfelfing. Propp, V. Ja. (1963), Russkie narodnye prazdniki (opyt istoriko-e˙tnograficˇeskogo issledovanija). Leningrad. Tolstoj, N. I. (1989), „Nekotorye soobrazˇenija o rekonstrukcii slavjanskoj duchovnoj kul’tury“. Slavjanskij i balkanskij fol’klor. Moskva, 7⫺22. Uspenskij, B. A. (1976), The Semiotics of the Russian Icon. Lisse.
Walter Koschmal, Regensburg (Deutschland)
VII. Geschichte der abendländischen Semiotik II: Griechische und Römische Antike History of Western Semiotics II: Ancient Greece and Rome 39. Sign conceptions in pre-classical Greece 1. Inventory of meanings 2. Production and reception of se˘ mata 3. Complex signs, with partially symbolic functions 4. Absence of philosophical reflection on the sign 5. Mythical values of semiosis 6. Selected references 6.1. Primary sources 6.2. Secondary literature
1.
Inventory of meanings
The word expressing the concept of sign in ancient and late Greek culture is see¯˜ ma (sh˜ ma, sa˜ ma, nomen actionis), whilst se¯meı˜on (shmei˜on, the derivative nominal form) is secondary and does not appear before the time of Aeschylus. Etymologically it may derive from the Indic root dhiya-, dhy-, relating to the idea of ‘thinking’ (Chantraine 1968⫺ 80: 998, Nagy 1983: 35 et passim). See˜¯ ma means ‘something which represents something for somebody’, thus expressing a phenomenon of semiosis in its broadest sense. From its first occurrence, this word comprises an even broader semantic field than the subsequent Latin signum, with its abundant neo-Latin developments (sign, signe, signo, segno, etc.), yet in all their considerable variety, the meanings of see¯˜ ma all express a relation of referral. Here follows a relatively complete inventory, attempting to supply a range of both simple and complex meanings, and presenting a spectrum of contexts in which see˜¯ ma and derivative forms are used from the time of Homer to the 5th century B. C. For basic terms denoting signs in other cultures cf. Art. 36 § 5 (Celtic), Art. 37 § 1.1. (Germanic), Art. 61 § 2. (Judaic), Art. 90 § 1. (Islamic), Art. 92 § 1. (Hinduistic), Art. 95 § 3. (Shintoistic).
1. See¯˜ ma as a physical sign: There is a white sign “round and like the moon” on the forehead of a bay horse, Hom. Il. 23, 455: leyko¡n sh˜ ma te¬tyxto hœy¬» te me¬nh. Another example is the scar Odysseus shows in order to prove his identity to Eumeus and Philoetius, Hom. Od. 21, 217⫺219: eiœ d1 age dh¡ kai¡ sh˜ ma aœrifrade¡w allo ti dei¬jv / ofra m1 eœy¬» gnv˜ ton pistvuh˜ to¬n t1 eœni¡ uymì˜ / oyœlh¡n … (“Nay, come, more than this, I will shew you also a manifest sign, that you may know me well and be assured in heart, even the scar …”). The wet nurse Eurycleia recognizes Odysseus by touch, gnv˜ r«1 eœpimassame¬nh, at an inopportune moment, Od. 19, 467⫺75, cf. Fig. 39.1. In other texts, signs of puberty are mentioned, Sol. Eleg. 23, 4 Gent.-Pr.: hÕbhw … sh¬mata.
Fig. 39.1: The wet-nurse Eurycleia recognizes Odysseus by touching the scar on his leg. Thessalian relief (4th century B. C.). Athens Nat. Mus. No. 1914. Cf. O. Touchefeu, The`mes odysse´ens dans l’art antique. Paris: de Boccard 1968: pl. 35, no. 459.
832 2. See¯˜ ma as a modelled or drawn form: It can be the trace of a seal, Soph., Trach. 614⫺615: kai¡ tv˜ nd1 aœpoi¬seiw sh˜ m1, oÕ kei˜now eyœmaue¡w / sfragi˜dow eÕrkei tì˜ d1 eœpo¡n mauh¬setai (“And as a token point him out this seal / the impress of my signet-ring, that he / will surely recognize”), cf. shmanth¬rion, ‘seal’ in Aesch. Agam. 609. It can be a monetary coin, as we may deduce from the use of eœpi¬shmow in contrast to ashmow to indicate the metal minted as opposed to the raw material, “not minted”, Herod. 9, 41: eœpi¬shmow kai¡ ashmow xry˜ sow. It can also be a personal sign, a scratched mark for the drawing of lots, which Ajax recognizes as his own when lots are cast
VII. Griechische und Römische Antike
lows Nagy), which was “evident and visible from a distance” (thlefanh¬w, Hom. Od. 24, 83), perhaps even as a reference point in navigation, cf. Eur. Hec. 1273: “The wretched Dog’s Grave [sh˜ ma], sign [te¬kmar] to the seafarers”, where the association with te¬kmar ‘sign, token’ seems of interest.
Fig. 39.3: The tumulus as a see¯˜ ma of the dead Patroclos, his soul (cyxh¬) flying around assuming the shape of a small warrior. Black-fig. Hydria from Arch. Mus. d. Westfälischen Wilhelms-Universität Münster. Photo: Archäologisches Seminar, Münster.
Fig. 39.2: A monetary coin as an example of minted (eœpi¬shmow) metal. Stater of Sybaris (ca. 525 B. C.). Cf. C. Kraay, Archaic and Classical Greek Coins. London: Methuen 1976: pl. 33 no. 572.
and his graffito is extracted from a helmet, Hom. Il. 7, 175: oi« de¡ klh˜ ron eœshmh¬nanto eÕkastow (“and they marked each man his lot”) and 7, 189: gnv˜ de¡ klh¬roy sh˜ ma iœdv¬n (“and Aias knew at a glance the token [sign] on the lot”). 3. See¯˜ ma as a tomb, sepulchre or gravestone (ste˘ le¯ ), sometimes also that part of the burial place which retains the name, permitting recognition of who is buried there: In its most archaic form, we may imagine a hill, a manmade tumulus, the accumulation of matter; cf. Hom. Il. 24, 799, r«i¬mfa de¡ sh˜ m1 exean (“Then with speed heaped they the mound”): they built a tumulus (see the excellent analysis by Nagy 1983: 50 and Fig. 39.3, which fol-
4. See¯˜ ma as writing: In this sense, the word is applied to alphabetic or other types of signs, which are decipherable by the addressee on the basis of a specific competence or expertise, i. e., more simply, capable of being read. Even if classical scholars are not totally sure about the type of writing dealt with, Iobates’ reading of the written message from Proetus seems certain, Hom. Il. 6, 168⫺69: po¬ren d1 oÕ ge sh¬mata lygra¡ / gra¬caw eœn pi¬naki ptyktì˜ (“and gave him baneful tokens, graving [writing?] in a folded tablet many signs and deadly”). Signs with syllabic values such as those from the writing systems called “Linear A” and “Linear B” were already used in Greece from the second half of the 2nd millennium, and the Phoenician alphabet was adopted by the Greeks at least as early as the 8th century B. C. (cf. Fig. 39.4). 5. See¯˜ ma as a natural phenomenon: A bolt of lightning or thunder, a scene of animal hunting, the song or flight of birds can be used by someone as a means of inference about
39. Sign conceptions in pre-classical Greece
833
Fig. 39.4: Alphabetic inscription from Athens. Attic stele (about 550⫺525). New York M. M. A. II. 185. Cf. G. M. A. Richter, The Archaic Gravestones of Attica. London: Phaidon 1961: fig. 204.
something which will happen in the near future, e. g., Hom. Il. 2, 308, eœfa¬nh me¬ga sh˜ ma (“then appeared a great portent”): a snake kills a sparrow and its young, and is turned to stone. The interpreter usually belongs to a professional class of privileged persons (cf. Art. 47 § 6.) to whom the community has attributed the competence and ability, conferred by a supernatural entity, to interpret precisely the meaning of a presage or omen (cf. Fig. 39.5). 6. See¯˜ ma as a constellation: In a starry sky, one can recognize images representing characters or objects of a (mythological) tale; e. g., in the Orion constellation, the Dog, Syrius, is called sh˜ ma kako¡n (“evil [astrological]
Fig. 39.5: Divination scene with flying birds (as an omen?). Amphora from Attica (ca. 520 B. C.). Rome, Villa Giulia 20482. Photo: Gabinetto fotografico.
omen”) since it heralds the Autumn and fevers, Hom. Il. 22, 27⫺31. Celestial signs such as the Pleiades, Arcturus (the ‘Tail of the Bear’), Orion or Syrius may indicate the opportune moment for undertaking particular agricultural tasks, such as ploughing, harvesting etc., cf. Hesiod, Op. 383⫺87 (Pleiades) and 609⫺10 (Arcturus, Syrius, Orion). As we read in a fragment from Sophocles (fr. 432 Radt ⫽ 399 Nauck), the Greek hero Palamedes discovers “celestial signs” (v. 3, oyœra¬nia¬ te sh¬mata) which are “signals” (v. 9, shmanth¬ria) for nocturnal navigation and for changes of season. This proves the existence of an already well-developed “science of celestial signs” in ancient Greek culture, destined to evolve into astrology (cf. Art. 46 § 5.). 7. See¯˜ ma as a prophecy or response, a verbal utterance, often in verses or ambiguously formulated, requiring an interpretation, professional or otherwise (cf. Art. 47 § 6.): The replies of an oracle may be expressed clearly and explicitly (although they hardly ever are), and if so the verbs le¬gein and katale¬gein are used, or by allusion (ambiguously and “symbolically”), and in this case we find the verb shmai¬nein (Simonid. fr. 511/6 Page, “the god Apollo … samai¬nei”; Heraclitus, fr. 93. D.⫺K., cited below; Herodotus, 5, 92 g). An obscure or indecipherable response is called a´se¯mon or ate´kmarton (ashmon or aœte¬kmarton xrhsth¬rion, Herod. 5, 92 g); cf. Aesch. Prom. 661⫺662: aiœolosto¬moyw / xresmoy¬w, aœsh¬moyw dyskri¬tvw t1 eiœrhme¬noyw (“riddling / oracles, obscure [i. e., without se˘ mata], and darkly worded”). 8. See¯˜ ma as circumstantial evidence: Such information can permit recognition, can refer to exclusive and shared knowledge kept hidden from others, can help to identify someone thanks to a discourse which reveals some
834
VII. Griechische und Römische Antike
Fig. 39.6: The head of the seer Teiresias rising up from the underworld to give a response (sh¬mata) to Odysseus. Lucanian Crater (ca. 430 B. C.). Paris, Bibliothe`que Nationale 422. Cf. A. Furtwängler and K. Reichhold, Griechische Vasenmalerei. Rome: L’Erma di Bretschneider 1967: pl. 60, 1.
element of proof. This is the case of the “signs” Penelope asks of Odysseus, who is dressed as a beggar (and who recounts having seen Odysseus with his own eyes), in order to check the reliability of the fake mendicant, Hom. Od. 19, 215⫺218: eiœpe¬ moi, o«ppoi˜1 assa peri¡ xroi eiÕmata eÕsto /[…] kai¡ e«tai¬royw (“tell me what manner of raiment he wore about his body, […] and tell me of the comrades who followed him”). When she becomes aware that the replies are correct (Od. 19, 250, sh¬mat1 aœnagnoy¬sñ ta¬ oi« empeda pe¬frad1 ÅOdyssey¬w; “as she recognized the sure tokens that Odysseus told her”), Penelope bursts into tears.
2.
Production and reception of se˘ mata
In its more complex meanings (types 7 and 8), see¯˜ ma involves communication by conventional means with two or more actants, in which an addresser (or utterer) encodes a message (Nagy 1983: 43⫺44 et passim) which the addressee (by himself or with the help of some form of mediation) must know how to decipher, i. e., recognize (aœnagignv¬skein) by means of a cognitive act of decoding, which requires specific psychic qualities (no¬ow, no¬h-
siw, ‘mind, sense, perception’, intus-legere; Nagy 1983: 35⫺39), hence an act of ‘intelligence’. From this recognition, the deciphering of graphic signs (aœna-gignv¬skein, legere) appears to be a secondary process, a relatively simple selective activity of recognition. Often the subject is conceived as situated in a universe of human and divine signs, generally highly articulated, whose reading is often laden with consequences and invested with strong “pathemic” (emotive) and cultural values, thus justifying the institution of professional interpreters (priests and/or prophets). The sign may be constituted (tey¬xesuai) by a divine Archi-Sender (cf. Art. 32 § 5.), or it may be constructed (made, tetygme¬non) with a contract, a pact or agreement between two actors who agree to “recognize” certain meanings. Thus, the correspondence of two parts of an object broken in two allows two people to recognize each other by means of the comparison, the matching of these two parts. Given that the term sy¬mbolon in the sense of ‘a meeting interpretable as a favorable omen’ and ‘a pact, or solemn convention’ occurs in a poetic work (the Hymn. Merc., 30 and 527) dating from between the 7th and 6th centuries B. C., one can infer that the use of symbo¬laion or sy¬mbolon gained currency for this latter type of conventional meaning from the 6th century onward (on the problem of sign versus symbol cf. Eco 1981 a and b). We take pre-classical Greece to be the time before the rise of specialized speculative philosophy (such as that of Socrates, who died in 399 B. C., and Plato, who died in 347 B. C.), and on the basis of the pre-classical texts we can say that, from the beginnings, the Greek language had available a word which connected a wide spectrum of meanings relevant for a genuinely semiotic perspective of the world. The semantic spectrum of see˜¯ ma extended from a simple index (a white star on the forehead indicates So-andSo’s horse), to the most elaborate texts (whether descriptive, narrative, or prescriptive). Thus the meaning of see¯˜ ma varied in relation to the degree of ambiguity and “symbolicity” of its referents. They include even oracular responses (Vernant 1974, Manetti 1987: 27⫺56), secrets and tests of recognition.
3.
Complex signs, with partially “symbolic” functions
Beyond the many and well-known cases of professional ambiguity in oracular signs, the
835
39. Sign conceptions in pre-classical Greece
lay use of see˜¯ ma is of interest as found in the Odyssey. Characteristically, a see˜¯ ma was used as a test to find out a person’s authentic identity, of the type “if you are truly who you say you are, tell me which shirts I put in the case when you left and what the cufflinks and tiepins were like”. At its most complex, the test takes on the aspect of a snare. For example: 1) Penelope utters a false sentence: “I will move our bed from the room”, which seems possible to all eventual impostors and which only one person, namely Odysseus, will know to be impossible. 2) If the beggar really is Odysseus, then he will not fall into the trap and will tell the truth, i. e., recount how things are: the bed cannot be moved because it is made in and of an olive tree whose roots extend into the bedroom floor. 3) The right evaluation of Penelope’s utterance will reveal the identity of the stranger, and she will “recognize” him as the true Odysseus: This will provoke pathemic effects of a euphoric type (or, as the case may be, dysphoric). The knowledge kept hidden (kekrymme¬non) from others, is shared only by Penelope and Odysseus, and when they put together (sym-ba¬llein) their individual pieces of knowledge, they “recognize each other” (gnvso¬meua) because there are signs which can prove his identity, sh¬mata which only they know. This is the point of the story of Odysseus’ bed in the Odyssey 23.
4.
Absence of philosophical reflection on the sign
The present author does not believe (pace Romeo 1976: 88) that Pre-Socratic philosophers laid the “foundations of theoretical semiotics” or produced any form of conscious semiotic investigation. The fragments of Heraclitus and Parmenides normally cited when the use of sh˜ ma and shmai¬nein is documented do not prove any such assumption. The first, the famous fragment 93 D.⫺K., asserts that the God of the oracle of Delphi (Apollo) “neither speaks out nor conceals, but makes allusions by means of signs”, which must be read, deciphered, recognized and interpreted: o« anaj oy√ to¡ mantei˜o¬n eœsti to¡ eœn Delfoi˜w oyte le¬gei oyte kry¬ptei aœlla¡ shmai¬nei, cf. Calabi 1977⫺78: 19⫺22 and note 3. A few decades later, the verb se¯maı´nein is found in current use for describing the practice of a (necro-)mantic consultation,
the interrogation of a ghost who refuses both to speak (katale¬gein, fra¬zein) in an explicit manner and to express himself or herself in signs (shmai¬nein). Se¯maı´nein here refers to a more or less ambiguous, allusive and enigmatic language, constructed in such a way as to contain within itself the conventionally shared components (common isotopic elements) which would facilitate recognition and deciphering, thus making the message a “sign worthy of faith”, pisto¡n symbo¬laion. It seems that these are both cases of common usage, rather than an innovative influence of Heraclitean thought on the field of oracular signs. In the fragments of Parmenides we may find two facets of see˜¯ ma, (a) with reference to ‘indices’ which are found along the “way which proclaims that it is”, fr. 8, 1⫺2, D.⫺K., and (b) with reference to celestial signs, or ‘constellations’, fr. 10, 1⫺2, D.⫺K. Neither of these two occurrences of see˜¯ ma seems to deviate from current usage in the Greek language of the 6th⫺5th centuries B. C. For language conceptions in Parmenides and Heraclitus, see Kraus 1987: 57⫺135 ⫺ For the uses of Greek sign terminology in Byzantium cf. Art. 60 § 2.
5.
Mythical values of semiosis
The study of the entire semantic field of see˜¯ ma and of correlated terms (te¬kmar, shmei˜on, sy¬mbolon, symbo¬laion, aiÓnow, ainigma, etc.) would go far beyond the scope of this article. It would necessitate the analysis of the entire system of communication by signs expressed in archaic Greek (or better, in the written texts we have inherited from this culture), in relation to the Greek conceptions of human cognitive functions. Gregory Nagy (1983: 35⫺39) has shown that for the Greeks, “recognition” (aœna-gignv¬skein) is performed by the “mind” (no¬ow) by means of signs that withdraw from truth the possibility of remaining “hidden” (lanua¬nein). If the etymology suggesting a common derivation of no¬ow and no¬stow (‘return’) from a root such as *nes- (which more or less means ‘to return to life and light’; Frame 1976: 81⫺115) is correct, one may be justified in assuming that semiosis involves the following mythical ideas in early Greek culture: 1) a portrayal of the Beyond, a “place of obscurity and forgetfulness” (the river Le˘ the¯, river of Oblivion), with death as “the loss of meaning”, the absence of semiosis;
836
VII. Griechische und Römische Antike
2) a religious value of truth as aœ-lh¬ueia (cf. Detienne 1967: 45⫺40), i. e., the emergence from obscurity and forgetfulness through knowledge (that is, recognition on the basis of semiosis) thanks to the removal of factors which hide, and hence: 3) a conception of cognition as “apocalyptic” practice (or “ana-calyptic”, i. e., re-velatory, in the sense of ‘removing a veil’), a sort of re-reading of the universe of ambiguous signs which an Archi-Sender continuously emits into the world. Semiosis can then be understood as a “return to light and life” in (“symbolic”) analogy to the Descent (kata´basis) to the Reign of Death and the successive resurrection, the return of the hero into the world of the living. After the “journey into the Realms of the Obscure”, one is reborn to light, enriched with knowledge and abilities which remain hidden to those who did not undertake this test and did not have this (“symbolic”) experience. Odysseus, the hero of astuteness, tricks and ambiguous and false signs, will return from Hades, the underworld, replete with new knowledge and prophetic se˘ mata.
6.
Selected references
6.1. Primary sources Aeschylus. Aeschyli septem quae supersunt tragoediae, ed. D. Page. Oxford 1972. Heraclitus, in: Die Fragmente der Vorsokratiker, vol. 1, ed. H. Diels and W. Kranz. Berlin, sixth edition 1956: 139⫺190 (abbreviated D.-K.). Herodotus. Herodoti Historiae, ed. C. Hude. Oxford 1908. Hesiod, Hesiodi Carmina, ed. F. Solmsen. Oxford 1970. Homer, Homeri Carmina, ed. D. B. Monro and T. W. Allen. Oxford 1902⫺12. Hymn. Merc., in: Homeri Carmina, vol. 5, ed. D. B. Monro and T. W. Allen. Oxford 1902⫺12. Parmenides, in: Die Fragmente der Vorsokratiker, vol. 1, ed. H. Diels and W. Kranz. Berlin, sixth edition 1956: 217⫺246.
Simonides, in: Poetae melici graeci, ed. D. L. Page. Oxford 1962: 237⫺323. Solon, in: Poetae elegiaci graeci, vol. 1, ed. B. Gentili and C. Prato. Leipzig 1979: 61⫺126. Sophocles, Fabulae, ed. A. C. Pearson. Oxford 1924.
6.2. Secondary literature Calabi, Francesca (1977⫺78), “Il signore, il cui oracolo e` a Delfi, non dice ne´ nasconde, ma indica”. Bollettino dell’Istituto di Filologia Greca 4 (Padova): 14⫺34. Chantraine, Pierre (1968⫺80), Dictionnaire e´tymologique de la langue grecque. Paris: Klincksieck. Detienne, Marcel (1967), Les maıˆtres de ve´rite´ dans la Gre`ce archaı¨que. Paris: Maspero, second edition 1973. Eco, Umberto (1981 a), “Segno”. In: Enciclopedia Einaudi, vol. 12. Torino: Einaudi: 628⫺668. Reprinted in: U. Eco, Semiotica e filosofia del linguaggio. Torino: Einaudi 1984: 354. English version in: U. Eco, Semiotics and the Philosophy of Language. Bloomington IN: Indiana University Press 1984: 14⫺45. Eco, Umberto (1981 b), “Simbolo”. In: Enciclopedia Einaudi, vol. 12. Torino: Einaudi: 877⫺915. Reprinted in: U. Eco, Semiotica e filosofia del linguaggio. Torino: Einaudi 1984: 199⫺254. English version in: U. Eco, Semiotics and the Philosophy of Language. Bloomington IN: Indiana University Press: 130⫺163. Frame, Douglas (1978), The Myth of Return in Early Greek Epic. New Haven CT: Yale University Press. Kraus, Manfred (1987), Name und Sache. Ein Problem im frühgriechischen Denken. Amsterdam: Grüner. Manetti, Giovanni (1987), Le teorie del segno nell’antichita` classica. Milano: Bompiani. English translation by Christine Richardson: Theories of the Sign in Classical Antiquity. Bloomington IN: Indiana University Press. Nagy, Gregory (1983), “Sema and noesis: Some Illustrations”. Arethusa 16: 35⫺55. Romeo, Luigi (1976), “Heraclitus and the Foundations of Semiotics”. Versus 15: 73⫺90. Vernant, Jean-Pierre (ed.) (1974), Divination et rationalite´. Paris: Seuil.
Ezio Pellizer, Trieste (Italy)
837
40. Zeichenkonzeptionen in der Philosophie
40. Zeichenkonzeptionen in der Philosophie der griechischen und römischen Antike 1. Einleitung 2. Das Zeichen als Indiz 2.1. Aristoteles über shmei˜a (Zeichen) 2.2. Nacharistotelische Zeichenkonzeptionen 3. Die Sprache als Zeichen 3.1. Der Gegenstand der sprachtheoretischen Reflexion 3.2. Sprache und Ontologie: die Semantik des sprachlichen Zeichens 4. Von der Antike zum Mittelalter 4.1. Augustinus 4.2. Boethius 5. Literatur (in Auswahl)
1.
Einleitung
Die Semiotik leitet ihren Namen aus dem Griechischen her; und sie geht heutzutage von einem ungemein umfangreichen Zeichenbegriff aus. Deshalb könnte man vermuten, daß der umfassende Sinn, in dem die moderne Semiotik von shmei˜a (Zeichen) spricht, durch den altgriechischen Sprachgebrauch gerechtfertigt ist. Eine solche Vermutung trifft im Prinzip zu (vgl. Art. 39). Zwar wird man nicht jede semiotisch überhaupt mögliche Rede von Zeichen auch schon in der Antike nachweisen können; aber der moderne Sprachgebrauch geht nicht über das hinaus, was bereits damals denkbar gewesen wäre. In Griechenland und Rom ging man nämlich wie in allen Kulturen (vgl. die Art. 36⫺38, 61 und 89⫺99) auf vielfältige Weise mit Zeichen um und hat die verschiedenen Zeichen auch häufig als solche gekennzeichnet (vgl. Art. 39 über Bezeichnungen für Zeichen im vorklassischen Griechenland). Man sprach dann von sh¬mata (in der Dichtung) oder shmei˜a (in der Prosa) bzw. im Lateinischen von signa. Das Bedeutungsfeld dieser Wörter ist entsprechend breit gefächert ⫺ ähnlich wie bei dem Wort Zeichen im Deutschen und bei sign im Englischen. Das gleiche gilt für die zugehörigen Verben shmai¬nein, significare, bezeichnen und signify: Die einschlägigen Lexika geben darüber ausführlich Auskunft. Was dann die antiken Philosophen angeht, zeigen die Wortindizes zu Platon, Aristoteles etc., daß sie diese Wörter ebenfalls in der allgemein üblichen Weise benutzten. Dabei versteht sich, daß sie mit den Wörtern sh˜ ma oder shmei˜on des öfteren Gründe kennzeichneten, die sie für bestimmte Gedan-
ken anführten (z. B. Parmenides, Frgm. 28 B 8,2. 55 D.-K.; Platon, Politeia II 368 b 5; Theaitetos 153 a 6; für Aristoteles hat Bonitz 1870, 677 die Stellen zusammengetragen): Philosophen argumentieren gerne und sagen das auch. Trotz des Sprachgebrauchs und ungeachtet ihrer Reflexionsfreude haben die antiken Philosophen keine Überlegungen über die Zeichen oder die Zeichenprozesse im allgemeinen angestellt. Solchen Untersuchungen wären sie vermutlich mit der Frage begegnet, welche analytische Kraft oder Erklärungsleistung von einem wirklich allgemeinen Zeichenbegriff zu erwarten sei. Erst Augustinus sah das anders. Vorher studierte man die Verwendung von shmei˜on und shmai¬nein, signum und significare nicht im allgemeinen, sondern erörterte in getrennten Untersuchungen nur bestimmte Arten von Zeichen: (a) Soweit es explizit um shmei˜on (signum, Zeichen) ging, diskutierte man unter diesem Titel bloß das Indiz. Da auch dies noch ein ziemlich weiter Begriff ist, gab es bei der Ausarbeitung unter Umständen sogar Anlaß, den Zeichenbegriff nochmals zu präzisieren (vgl. Art. 45 § 2. und Art. 46 § 1. und 2.). Aristoteles hat als erster in dieser Art über shmei˜a nachgedacht, und man ist ihm darin lange Zeit gefolgt. Was in der Antike also über das Indiz gesagt wurde, galt vor Augustinus als die Konzeption ‘des’ Zeichens. Für die Semiotik sind diese Erörterungen von der Nomenklatur her einschlägig, wenn auch vom Inhalt her nicht so bedeutend. Gerade umgekehrt verhält es sich (b) bei der Sprache. Deren philosophische Explikation erfolgte erst bei Augustinus in zeichentheoretischen Termini. Vorher wurde das Wort shmei˜on (signum, Zeichen) in sprachphilosophischem Zusammenhang nur selten gebraucht. Man vermied es lieber, verwendete aber unbefangen das Verb shmai¬nein (significare, bezeichnen). Insofern gehören die sprachphilosophischen Untersuchungen der Antike von der Nomenklatur her nur in einem eingeschränkten Sinne zur Semiotik. Indes haben sich schon die Vorsokratiker an diesen Studien beteiligt und dann alle namhaften Philosophen; das Thema hat eine längere Tradition als die Frage der Indizien. Vor allem aber ist es vom Reichtum der Fragestellungen her von erheblich größerer Relevanz und verlangt eine ein-
838 gehendere Erörterung. Darüber hinaus (c) hat die antike Philosophie auch in anderen Bereichen zeichentheoretisch gedacht und entsprechende Begriffe entwickelt, oder sie hat in einer Weise reflektiert, die sich mit zeichentheoretischen Mitteln gut beschreiben läßt. Genannt seien zwei solche Bereiche, die auch in der Sprachphilosophie gestreift werden. Der eine ist die Erkenntnislehre und speziell die Wahrnehmungslehre, wo beispielsweise noch die frühen Stoiker lehrten, die Vorstellung sei ein durch die Sinneswahrnehmung vermittelter Eindruck in der Seele und dieser Eindruck entspreche dem Eindruck eines Siegelrings in Wachs (FDS 259 ff; siehe Hülser 1987⫺88). Der andere Bereich ist die Ontologie, die wie etwa bei Platon und Aristoteles zum Teil den jeweiligen sprachphilosophisch-semantischen Konzeptionen entsprach (vgl. § 3.2.1. f) oder die wie im Neuplatonismus eine Hierarchie des Seienden annahm, bei der die Stufenfolge zugleich als Folge von Zeichenbeziehungen gedeutet werden kann (vgl. § 4.1.); die Ontologie konnte aber auch noch auf manch andere Weise mit Zeichenkonzeptionen zu tun haben. Wenn wir schließlich (d) einen weiten Zeichenbegriff unterstellen, können wir fragen, wo die antike Philosophie eine Semiose anerkannte und wo nicht, ob dazu Vernunft erforderlich ist oder Sinnlichkeit genügt oder noch schwächere Voraussetzungen ausreichen. Daß man von den alten Philosophen auch hierzu eine Auskunft erwarten darf, zeigt z. B. Aristoteles, De sensu 1, 436 a 1 ff. Schon aus Raumgründen ist es hier unmöglich, alle angedeuteten Themenbereiche vorzustellen. Der Fragenkomplex (d) muß ganz übergangen werden und (c) wird nur insoweit angesprochen, wie es im Rahmen der Ausführungen zur antiken Sprachphilosophie nötig erscheint. Im Grunde beschränkt der Beitrag sich auf die beiden ersten Gebiete. Der Bereich (a), das Zeichen als Indiz, bildet den Gegenstand des 2. Abschnitts; der Bereich (b), die sprachphilosophische Thematik bzw. die Sprache als Zeichen, wird im 3. Abschnitt erörtert. Dieser ist zwar ungleich umfangreicher als der Abschnitt über das Indiz; das entspricht dem unterschiedlichen semiotischen Gewicht. Aber nachdem schon der 2. Abschnitt arg knapp gefaßt werden mußte, ist auch der 3. eigentlich sehr kurz. Er kann auf den wenigen Seiten nur einige Grundlinien nachzeichnen und bedürfte der Vertiefung; manche Ergänzungen bietet bereits das Handbuch, das K. Lorenz und Mitarbeiter in
VII. Griechische und Römische Antike
dieser Reihe zur Sprachphilosophie herausgeben (Lorenz et al. 1992). Ein 4. Abschnitt geht ganz gedrängt auf Augustinus und Boethius ein. Sie bildeten die Brücke von der Antike zum Mittelalter (zu letzterem vgl. Art. 49, 52 und 53); und Augustinus hat, indem er die Sprache ausdrücklich als ein Zeichengefüge deutete, die Problemstränge des 2. und 3. Abschnitts in gewisser Weise zusammengeführt.
2.
Das Zeichen als Indiz
2.1. Aristoteles über shmei˜a (Zeichen) Über den Begriff des Zeichens äußerte Aristoteles sich in argumentations-, wissenschafts- und erkenntnistheoretischer Perspektive. Am Ende der Ersten Analytiken und in der Rhetorik erläutert er die Eigenart des Enthymems, d. h. des rhetorischen Syllogismus, und versichert, ein solcher Schluß beruhe auf Wahrscheinlichem oder auf Zeichen („eœj eiœko¬tvn h shmei¬vn“: Anal. pr. B 27, 70 a 10; Rhet. A 2, 1357 a 32 f). Das Wahrscheinliche kennzeichnet er als eine einleuchtende Aussage, die auf respektabler Meinung beruht (70 a 3⫺6; vgl. 1357 a 34⫺b1), und schreibt dann über das Zeichen: „shmei˜on de¡ boy¬letai eiÓnai pro¬tasiw aœpodeiktikh¡ h aœnagkai¬a h endojow∑ oyy˜« ga¡r ontow estin h oyy˜« genome¬noy pro¬teron h yÕsteron ge¬gone to¡ pra˜ gma, toy˜ to shmei˜o¬n eœsti toy˜ gegone¬nai h eiÓnai“ („Das Zeichen tendiert seiner Natur nach dahin, eine für einen Aufweis verwendbare Aussage zu sein, entweder eine notwendige oder eine einleuchtende; denn bei dessen Sein eine Sache ist oder bei dessen Eintreten eine Sache früher eingetreten ist oder später eintreten wird, das ist ein Zeichen dafür, daß sie eingetreten ist oder ist“; Anal. pr. B 27, 70 a6⫺9).
Von den zitierten Sätzen charakterisiert der zweite das Zeichen auf eine informelle, nicht-technische Weise, und der erste setzt diese nicht-technische Beschreibung in eine logisch-technische Definition um (Burnyeat 1982, 197 f). Schon die grundlegende informelle Erklärung schränkt den Begriff des Zeichens sowohl gegenüber dem griechischen Sprachgebrauch als auch gegenüber dem Zeichenverständnis der heutigen Semiotik ein (vgl. § 1.) und versteht darunter lediglich das Indiz: Eine Sache (ein Sachverhalt oder ein Ereignis) X gilt genau dann als Zeichen einer anderen Sache Y bzw. als Zeichen für deren gegenwärtige, vergangene oder zukünftige Realität, wenn man, falls X gegeben ist, mit einer gewissen Berechtigung oder Sicherheit
40. Zeichenkonzeptionen in der Philosophie
auf die Existenz oder das frühere oder spätere Eintreten von Y schließen kann. Entsprechend hebt die logisch-technische Definition hervor, daß das Zeichen bzw. die Aussage, die es ist, aœpodeiktikh¬ (für einen Aufweis verwendbar) sei. Dieser Zeichenbegriff schließt semantische, syntaktische und pragmatische Gesichtspunkte ein und ist insofern semiotisch vollständig. (1) Der semantische Aspekt ist offenkundig: X ‘bedeutet’ in gewisser Weise Y. Ergänzend ist anzumerken, daß nach der Rhetorik an Alexander, die zwar unter den Werken des Aristoteles überliefert ist, nach langem Streit heute aber einmütig Anaximenes von Lampsakos zugeschrieben wird, das Vorliegen von X nicht nur Zeichen für die gegenwärtige, vergangene oder zukünftige Existenz von Y sein kann, sondern gegebenenfalls auch für die Nicht-Existenz von Y; ebenso kann auch das Nicht-Vorliegen von X etwas anzeigen (Rhet. Al. 12,2, 1430 b 34 ff). Aristoteles würde diesen Zusatz wohl akzeptieren und darin kein prinzipielles Problem sehen (anders Sprute 1982, 107); er sollte dann nur später auf der logisch-technischen Ebene das absolut zuverlässige Indiz auch mit Beispielen erläutern, die nicht nach dem Modus Barbara gebildet sind. (2) Die syntaktische Dimension des definierten Zeichenbegriffs steckt nicht allein darin, daß X und Y verschieden und wohlunterscheidbar sein müssen. Wie vielmehr der argumentationstheoretische, rhetorische Kontext und die Beispiele zeigen, wird ebenfalls vorausgesetzt, daß X für sich betrachtet und unabhängig von Y auf seine Existenz oder auf sein früheres oder späteres Eintreten hin beurteilt werden kann; dazu muß X sich auch von allem anderen, was vorliegt, gewesen ist oder eintritt, hinreichend deutlich abheben. Um also identifizierbar zu sein, muß X in gewisser Weise gestaltet sein und eine syntaktische Struktur besitzen. (3) Die pragmatische Dimension kommt in zwei Punkten zum Tragen: (a) X kann einerseits für sich betrachtet und unabhängig von Y beurteilt werden und andererseits außerdem zum Ausgangspunkt eines Schlusses auf etwas anderes werden und als Zeichen für Y dienen. Die Zeichendefinition impliziert also einen doppelten Hinblick auf X und setzt jemanden voraus, der X zweifach ansieht. Insofern ist die pragmatische Dimension für sie konstitutiv. Die logischtechnische Definition des Zeichens unterstreicht diesen Zug, indem sie das Zeichen als Aussage faßt, die nämlich auf einer Etwas-
839 als-Etwas-Struktur beruht und im Unterschied zu einem Term wahr oder falsch sein kann (vgl. § 3.2.2.). Dabei scheint Aristoteles allerdings die wahrheitsrelevante Etwas-alsEtwas-Struktur mit einer funktionalen zu konfundieren. Und da die Zeichen-Aussage als Obersatz in einem kategorischen Syllogismus verwendet werden soll (siehe unten), wird außerdem unklar, ob in ihr als Zeichen weiterhin X angesetzt wird oder nicht vielmehr so etwas wie: X indiziert Y. (b) Die pragmatische Dimension kommt ferner darin zum Tragen, daß das Zeichen zu einem Erkenntnisfortschritt verhelfen kann und das Indiz bekannter ist als das Indizierte. Aristoteles sagt das nicht ausdrücklich. Aber er unterstellt es. Es ergibt sich zwingend sowohl aus dem Kontext als auch aus den Beispielen. Als Überzeugungsmittel der Rhetorik wäre das Zeichen-Enthymem untauglich, wenn das Indiz nicht evidenter wäre als das Indizierte. Von den Beispielen ist gerade auch das beweiskräftig, bei dem daraus, daß eine Frau Milch hat, gefolgert wird, daß sie kurz zuvor geboren hat (Anal. pr. B 27, 70 a 13⫺16; Rhet. A 2, 1357 a 15 f). Dieses berühmte Beispiel kommt schon in Platons Menexenos vor (237 e 2⫺5) und ist von daher klarerweise ein juristisches Beispiel: Die Milch beweist Mutterschaft und widerlegt unter Umständen die Ansprüche einer anderen Frau auf ein bestimmtes Kind (Ebert 1987, 115). Daher ist das Indiz auch in diesem Fall evidenter als das Indizierte; das Zeichen ermöglicht einen Erkenntnisgewinn. Wie die logisch-technische Definition sagt, ist das Zeichen „eine für einen Aufweis verwendbare Aussage, entweder eine notwendige oder eine einleuchtende“. Der Zusatz am Ende greift auf die Einteilung der Zeichen vor und ist folgendermaßen zu verstehen (vgl. Anal. pr. B 27, 70 a 11⫺b 6; Rhet. A 2, 1357 b 1⫺25; B 25, 1403 a 10⫺16; Burnyeat 1982, 198 f; Sprute 1982, 88⫺109; SchweinfurthWalla 1986, 45⫺49): Die Zeichen-Aussage ist für einen Schluß verwendbar und bildet dort den Obersatz, z. B.: „Jede Frau, die Milch hat, hat vor kurzem geboren“. Wenn dann auch der Untersatz bekannt ist, z. B. „Diese Frau hat Milch“ oder „Diese Frau hat vor kurzem geboren“, steht fest, ob das Zeichen die Position des Mittelbegriffs oder eines Außenbegriffs innehat, in welcher Schlußfigur zu folgern ist und wie der Schlußsatz aussieht. Nur in der ersten Figur ist der Schlußsatz formal einwandfrei; in allen anderen Fällen ist er formal angreifbar. Nach diesem Un-
840 terschied teilte Aristoteles die Zeichen ein: Ist die Folgerung formal korrekt, so ist das Resultat „notwendig“ und das Zeichen untrüglich; dieser Fall gilt als systematische Rekonstruktion des tekmh¬rion, d. h. des absolut untrüglichen Zeichens im üblichen Sprachgebrauch. Wenn die Folgerung dagegen formale Mängel aufweist, ist das Ergebnis nicht zwingend, höchstens „einleuchtend“ und beruht auf einer zweiten Art von Zeichen, für die Aristoteles keinen besonderen Namen hat; man könnte sie „Zeichen im engeren Sinne“ nennen. ⫺ Bei dieser Einteilung versucht Aristoteles, die Zuverlässigkeit eines Zeichenschlusses mit den Mitteln seiner Syllogistik zu überprüfen; andere Mittel stehen offenbar nicht zur Verfügung. Die syllogistischen indes sind unbefriedigend, weil die Rekonstruktion des tekmh¬rion kaum überzeugt und weil in keiner Weise einsichtig wird, warum formallogisch fehlerhafte Zeichenschlüsse nicht verworfen werden, sondern immerhin zu „einleuchtenden“ Ergebnissen führen. Indem Aristoteles letzteres anerkennt, räumt er ein, daß es respektable Schlußweisen gibt, die mit syllogistischen Mitteln nicht angemessen zu deuten sind, und ebnet so den Weg zu einer nicht-deduktiven Logik (Burnyeat 1982, 199⫺206; vgl. auch Art. 53 § 4.4.). Was ferner die „Zeichen im engeren Sinne“ betrifft, muß eine solche Bezeichnung mit Vorsicht verwendet werden. Denn nachdem Aristoteles das zuverlässige Zeichen (tekmh¬rion) bestimmt zu haben glaubt, besteht er nicht mehr auf der vorherigen Terminologie und läßt offen, ob unter einem shmei˜on (Zeichen) weiterhin der zuvor definierte Gattungsbegriff verstanden und das tekmh¬rion als eine bestimmte Art des Zeichens aufgefaßt werden soll oder ob nur noch das als Zeichen gelten soll, was bisher als Zeichen im engeren Sinne erschien. Den ohnehin sehr weiten Begriff des Indizes einzuengen und immer nur das als shmei˜on (Zeichen) anzusehen, was nicht bereits eine präzisere Bezeichnung erhalten hat, mag unter Umständen vorteilhaft sein. Von daher konnte auch Aristoteles selbst das shmei˜on dem tekmh¬rion gelegentlich in aller Form entgegensetzen (Rhet. B 25, 1402 b 12⫺20) und den Zeichenbegriff an anderen Stellen seines Werkes kontextbedingt auch durch andere passende Gegenbegriffe einschränken (Anal. post. A 6, 75 a 31⫺35; B 17, 99 a 2 f; Div. Somn. 1, 462 b 27). ⫺ Argumentationstheoretische Überlegungen zum Zeichenbegriff bietet auch die indische Philosophie, vgl. Art. 92 § 2.
VII. Griechische und Römische Antike
2.2. Nacharistotelische Zeichenkonzeptionen Was in der Rhetorik und in der hellenistischen Philosophie über Zeichen gesagt worden ist, läßt sich von Aristoteles her recht gut charakterisieren und einander gegenüberstellen. Aristoteles sprach über Zeichen im Zusammenhang des Enthymems und folgte dabei sowohl rhetorischen als auch wissenschaftstheoretischen und epistemologischen Fragestellungen. Den hellenistischen Philosophen ging es in ihren Zeichentheorien vor allem um die Probleme der zweiten Art; zugleich orientierten sie sich vornehmlich an der logisch-technischen Darstellung des Zeichenbegriffs und lassen insgesamt eine Tendenz erkennen, den Zeichenbegriff auf die absolut zuverlässigen Zeichen einzuengen. Die antike Rhetorik tendierte in allen Punkten zu der entgegengesetzten Möglichkeit: Bei der Darstellung der rednerischen Argumentation kam man auch auf Indizien und Indizienbeweise zu sprechen. Dabei war man verständlicherweise kaum an einer logisch-technischen Beschreibung des Zeichens interessiert, sondern blieb auf der Ebene der informellen Definition des Aristoteles. Eine solche Definition auch ausdrücklich zu formulieren war offenbar nur selten nötig. Ernsthafte Diskussionen gab es jedoch über den Anwendungsbereich des informellen Zeichenverständnisses. Hermagoras von Temnos (2. Jh. v. Chr.) hat zwar noch an dem weiten Zeichenbegriff des Aristoteles festgehalten und alles ein Zeichen genannt, was für einen beliebigen juristischen Tatsachenbeweis verwendet werden kann (Frgm. 8 Matthes). Aber die römischen Benutzer seiner Schriften haben den Begriff bewußt eingeengt, so daß er nur noch Indizien umfaßte, die alleine keine volle Beweiskraft haben, und auch von denen eventuell nur einen Teil: Cicero, De inventione I 29, 44 ff; Auctor ad Herennium II 2, 3; 4, 6; 18, 27 ff; Quintilian, Institutio oratoria V 9 (von allen Abhandlungen über das Zeichen ist dies die differenzierteste). Insofern neigte die antike Rhetorik dazu, den ursprünglich weiten Begriff des Zeichens in der Weise einzuschränken, wie schon Aristoteles selbst das gelegentlich getan hatte. Mindestens bei Cicero entsprach dem auch die Definition des Zeichens: „Signum est, quid sub sensum aliquem cadit et quiddam significat, quod ex ipso profectum videtur, quod aut ante fuerit aut in ipso negotio aut post sit consecutum et tamen indiget testimonii et gravioris confirmationis” („Zeichen ist dasjenige, was in den Bereich einer Sinneswahrnehmung fällt
40. Zeichenkonzeptionen in der Philosophie und was etwas bezeichnet, das aus ihm hervorzugehen scheint und das entweder vorher war oder gerade aktuell ist oder hernach folgt, das aber trotzdem eines Zeugnisses und einer eindrücklicheren Bestätigung bedarf“; De inventione I 30, 48).
Diese Definition engt den Zeichenbegriff erst in ihrem letzten Teil auf diejenigen Indizien ein, die das Indizierte nicht zwingend zu erschließen gestatten. In dem, was vorher steht, gleicht sie einerseits schon ein wenig der Definition, die später Augustinus geben wird und die dann zur zeichentheoretischen Deutung der Sprache taugt (§ 3.1.2.). Andererseits ähnelt sie der Definition des Aristoteles (§ 2.1.). Dabei scheint das Merkmal „quid sub sensum aliquem cadit“ gegenüber Aristoteles nicht so sehr restriktiv als vielmehr explikativ gemeint zu sein und zwei Punkte herauszuheben, die Aristoteles lediglich voraussetzt, nämlich daß das Indiz unabhängig vom Indizierten festgestellt werden kann und evidenter als dieses ist (anders SchweinfurthWalla 1986, 142). So einfach es ist, die zeichentheoretische Position der hellenistischen Philosophen wie zu Beginn von § 2.2. zu umreißen, so schwierig ist es, ihre Auffassungen im einzelnen zu rekonstruieren. Sie sind uns nämlich nur indirekt und bruchstückhaft überliefert. Schon bei Theophrast (ca. 371⫺287 v. Chr.) wissen wir nur, daß er ein Buch peri¡ shmei¬vn (Über Zeichen) geschrieben hat (Diog. Laert. V 45), aber nicht, was darin stand. Was die anschließenden Diskussionen angeht, liegt das Kernproblem darin, daß man die Nachrichten von Sextus Empiricus und Ps.-Galen (FDS 1026⫺1031) ohne zusätzliche Qualifikation den Stoikern zuzuschreiben pflegt und dann mit vielen Konsistenzproblemen fertig werden muß. Demgegenüber hat Th. Ebert das Quellenmaterial kürzlich (1987) neu analysiert und eine ganz andere Einschätzung begründet, die wegen ihrer großen Evidenz im folgenden zugrunde gelegt wird. Danach kommt das erste Verdienst einem Mitglied der Dialektischen Schule (darüber Sedley 1977, 74⫺78) zu, vermutlich Philon. Dieser bekannte Schüler des Diodoros Kronos (gestorben nach 285 v. Chr.) definierte das Zeichen als „aœji¬vma eœn y«giei˜ synhmme¬nì (pro)kaqhgoy¬menon eœkkalyptiko¡n toy˜ lh¬gontow“ („eine Aussage, die in einer wahren Konditionalaussage den (Vor-) Vordersatz bildet und die den Nachsatz zu enthüllen vermag“; FDS 1027 aus Ps.-Galen; dazu Ebert 1987, 112 f).
Diese Definition wurde kanonisch, und aus den verschiedenen Erläuterungen geht
841 zweifelsfrei hervor, daß das Zeichen hier als der wahre Vordersatz in einer Implikation bestimmt wird, die ihrerseits nach den Kriterien Philons wahr ist, also den Bedingungen der materialen Implikation genügt. Philon explizierte also die aristotelische Idee, das Zeichen als Aussage zu verstehen, mit Hilfe seiner wahrheitsfunktionalen Aussagenlogik und stellte dadurch auf der logisch-technischen Ebene erstens klar, daß eine Sache, die als Indiz für etwas anderes dienen soll, für sich festgestellt werden können muß, und zweitens, daß als Zeichen weiterhin die Sache X gilt und nicht so etwas wie: X indiziert Y (vgl. § 2.1.). Drittens wies die neue Definition ausdrücklich auf den von Aristoteles nur unterstellten Erkenntnisfortschritt hin, den ein Zeichen ermöglichen muß; das Indiz muß evidenter sein als das Indizierte und diesem zu größerer Evidenz verhelfen. Auf dieses Merkmal gründete sich der hohe epistemologische Rang des Zeichenbegriffs in der hellenistischen Philosophie. Daß Philons Zeichenbegriff auch Schwächen hatte, versteht sich; damit befaßte sich erst Chrysipp (FDS 194: § 191.). Nach der Definition legte Philon auch eine neue Einteilung der Zeichen vor. Er unterschied erinnernde und anzeigende Zeichen (y«pomnhstika¡ vs. eœndeiktika¡ shmei˜a), je nachdem ob man sein Gedächtnis bemühen oder allein die Fähigkeit zu logischem Denken einsetzen muß, um die Beziehung des Zeichens zu dem herzustellen, was es indiziert. Erinnernd ist z. B. Rauch als Zeichen für Feuer, anzeigend die Milch als Zeichen einer Entbindung. Das zweite Beispiel überzeugt wieder in juristischem Zusammenhang; für die Hebamme wäre die Milch eher ein erinnerndes Zeichen. Nach Philon kann unter Umständen dasselbe Zeichen je nach Benutzer in die eine oder andere Klasse fallen. Die frühen Stoiker machten sich Philons Definition des Zeichens zu eigen (FDS 1029 f) und übernahmen auch seine Einteilung (FDS 1026), allerdings mit Vorbehalten (zur stoischen Theorie der Wahrnehmung durch Zeichen vgl. Art. 46 § 3.). Zenon von Kition (FDS 1026 ⫹ 1029 aus Sextus Empiricus, Adv. Math. VIII 141⫺155, 245⫺256; dazu Ebert 1987, 91 ff; 97 ff; 119 ff) interpretierte sie völlig neu allein von den Erkenntnisgegenständen her. Indem er die Einteilung vom Wissens- und Erfahrungshintergrund der die Zeichen verwendenden Personen ablöste, verwickelte er sich freilich in schlimme Ungereimtheiten, so daß Kleanthes oder Sphairos (FDS 1026 aus Sextus Empiricus,
842 Pyrrh. Hypot. II 97⫺101; dazu Ebert 1987, 84 ff; 97 ff; 123 ff) nur bestimmte Positionen Zenons beibehielt und im übrigen um den Preis einer Inkonsistenz zu Philons alter Einteilung zurückkehrte. ⫺ Chrysipp hat die Zeichenkonzeption seiner Vorgänger nicht geschätzt. Das ergibt sich zwingend aus einer Reihe signifikanter Einzelheiten (vgl. Ebert 1987, 103⫺106; 108⫺112; auch 125). Aber worin seine Kritik im einzelnen bestand, wie grundsätzlich sie war oder welche Verbesserungsvorschläge sie hatte, wissen wir nicht. Sicher ist in dieser Hinsicht nur, daß Chrysipp dem Philonischen Begriff der wahren Implikation einen eigenen entgegengestellt hat (FDS 956 ff), daß er den Astrologen empfahl, ihre Theoreme nicht länger als Konditionalaussagen zu formulieren, sondern als negierte Konjunktionen (FDS 473; dazu Burnyeat 1982, 213 f; Sedley 1982, 253⫺256), und daß zwei oder drei Generationen später die Stoiker um Dionysios v. Kyrene zeichentheoretische Auffassungen vertraten, die ohne einen Einfluß Chrysipps undenkbar gewesen wären. Diese Gruppe setzte sich mit den Epikureern über den Zeichenschluß auseinander (s. FDS 959 a; 1032⫺1035; De Lacy und De Lacy 1978; Sedley 1982, 242⫺256; Long und Sedley 1987 § 42; Burnyeat 1982, 218 ff). Im Mittelpunkt der Diskussion stand das shmei˜on idion (spezifische Zeichen). Ein solches Zeichen ist eindeutig, zeigt zuverlässig genau eine Sache an und gestattet, zwischen ihrer Existenz oder Nichtexistenz zu entscheiden; es kann nur existieren oder wahr sein, wenn auch die angezeigte Sache existiert oder wahr ist (vgl. Aristoteles, Anal. pr. B 27, 70 b 11⫺38). Die Gruppe um Dionysios erklärte nun, ein wissenschaftlicher Zeichenschluß sei allein mit einem spezifischen Zeichen möglich und der einzig angemessene Test für dieses Zeichen sei o« katÅ aœnaskeyh¡n tro¬pow (die Eliminationsmethode). Um es zu überprüfen, müsse man also die angezeigte nicht-evidente Sache hypothetisch eliminieren („aœnaskeya¬zein“) und dann feststellen, ob allein dadurch die anzeigende Sache miteliminiert wird („synanaskeya¬zesqai“). Ist das der Fall, so ist das Zeichen ein zutreffendes spezifisches Zeichen; seine Beziehung zum Bezeichneten gilt als notwendig und logisch. Die Eliminationsmethode (vgl. den Permutationstest in der strukturalistischen Semiotik, siehe Art. 4 § 4.1.) sollte aber auch der einzig angemessene Test für eine wahre Implikation sein. Von den Leuten um Dionysios wurde also die Wahrheit einer Implika-
VII. Griechische und Römische Antike
tion wie von Chrysipp nach der syna¬rthsiw (dem Zusammenhang) beurteilt, d. h. danach, ob der kontradiktorische Gegensatz des Nachsatzes mit dem Vordersatz unverträglich ist. Und das spezifische Zeichen wurde anstatt mit der Philonischen mit der Chrysippeischen Implikation gedeutet. Daraufhin schließt die logisch-technische Darstellung des Zeichens nicht mehr an den allgemeineren Zeichenbegriff des Aristoteles an, sondern grenzt alle Zeichen aus, die nicht absolut zuverlässig anzeigen. Zwar können einige von ihnen mithilfe einer Wesensklausel salviert werden; aber alle anderen ⫺ Aristoteles’ „Zeichen im engeren Sinne“ ⫺ gehören in eine andere Abteilung und gelten nicht als Zeichen im eigentlichen Sinne des Wortes. Die stoischen Versionen der Zeichentheorie erzeugten zwischen den philosophischen Schulrichtungen auch Streit. Von diesen Kontroversen sei zum Abschluß zweierlei festgehalten: (1) Die Epikureer vertraten eine induktiv ausgerichtete Methodologie; grundlegend war für sie o« kaqÅ o«moio¬thta tro¬pow (die Ähnlichkeitsmethode; vgl. Long und Sedley 1987 § 18.). Wie bereits angedeutet, sahen sie sich durch die Stoiker massiv angegriffen, und Philodemos berichtet, wie Zenon von Sidon, Demetrios Lakon und ein dritter Epikureer die stoischen Einwände zu entkräften suchten (s. De Lacy und De Lacy 1978). Sie wollten unter anderem nachweisen, daß auch die Eliminationsmethode auf induktiven Voraussetzungen beruhe, und deckten dabei eine Schwäche der stoischen Konzeption auf. Die Stoiker hatten das mit der Eliminationsmethode getestete Apriori-Wissen nicht auf seine Grundlagen hin befragt und nicht geklärt, welche Rolle Erfahrungen bei der Konstitution von Wortverwendungsregeln oder überhaupt bei der Gewinnung „logischer“ Zusammenhänge spielen (Sedley 1982, 256⫺263). ⫺ (2) Die Skeptiker wandten sich von Anfang an gegen die stoische Erkenntnislehre (vgl. z. B. FDS 114) und spätestens seit dem 1. Jahrhundert v. Chr. auch speziell gegen die Zeichentheorie, als nämlich Ainesidemos argumentierte, es gebe nichts Beobachtbares, das als Zeichen zur Erkenntnis von etwas Nicht-Evidentem verwendbar wäre (Sextus Empiricus, Adv. Math. VIII 141 ff; Pyrrh. Hypot. II 97 ff; Glidden 1983; Long und Sedley 1987 § 72). Von den zum Teil gewiß alten stoischen Antworten auf solche Kritiken sind einige erhalten (FDS 1031; 1077; 1185), und auf zwei dieser Argumente
843
40. Zeichenkonzeptionen in der Philosophie
verdient hingewiesen zu werden (beide in FDS 1031): Das erste begründet die Existenz des Zeichens aus der spezifisch menschlichen Fähigkeit, Vorstellungen zusammenzusetzen und zwischen ihnen Übergänge zu schaffen. Das zweite versucht, die skeptischen Bedenken ad absurdum zu führen. Es spielt mit der Mehrdeutigkeit des Verbs shmai¬nein (‘bezeichnen’, versus ‘bedeuten’) und ist mißglückt. Aber es erweitert unversehens den Zeichenbegriff, betrachtet die sprachlichen Laute rundheraus als Zeichen und tut das erstmals mit zeichentheoretischem Anspruch.
3.
Die Sprache als Zeichen
Die antiken Philosophen haben in bezug auf die Sprache zwar kaum von Zeichen gesprochen. Aber da die Sprache zu gebrauchen als semiotischer Prozeß par excellence gilt, haben sie ihr Zeichenverständnis nach Auffassung moderner Semiotiker trotzdem im wesentlichen anhand ihres Sprachverständnisses entwickelt (z. B. Walther 1979, 13). In der Tat ist dieses Sprachverständnis einer zeichentheoretischen Interpretation sehr zugänglich; und wie wir sehen werden, sprach man in bezug auf die Sprache immerhin gern von Symbolen. Zur Auffassung sprachlicher Ausdrücke als Zeichen in anderen alten Kulturen vgl. Art. 61 § 3. (Judentum), Art. 90 § 5.⫺7. (islamische Welt) und Art. 92 § 3. (Indien). Gleichwohl sollte auch erwogen werden, ob es damals wohl gute Gründe gab, mit dem Zeichenbegriff bezüglich der Sprache zurückhaltend umzugehen. Auch unter Beachtung dieses Gesichtspunktes ist also im folgenden die antike Sprachphilosophie auf ihren semiotischen Gehalt hin auszuwerten. Um dieser sehr komplexen und mit zahlreichen Schwierigkeiten behafteten Aufgabe in der gebotenen Kürze nachzukommen, wird als erstes dargestellt, wie man den Gegenstand der sprachtheoretischen Reflexion in der Antike zu charakterisieren pflegte, daß die antike Sprachphilosophie um die bekannten drei Dimensionen eines semiotischen Prozesses gewußt hat und was sie über deren Zusammenhang zu sagen hatte (§ 3.1.). Obgleich sie gern in unzertrennlicher Verbindung gesehen wurden, spielten semantische Fragen eine besonders prominente Rolle. Deshalb werden im zweiten Teil des Abschnitts drei bedeutende semantische Konzeptionen der Antike skizziert, die Konzeptionen von Platon, Aristoteles und den Stoikern; sie stehen darüber
hinaus in einem systematischen Verhältnis zueinander und lassen auch differenzierende Einstellungen zu syntaktischen und pragmatischen Fragen erkennen (§ 3.2.; vgl. auch Art. 42). 3.1.
Der Gegenstand der sprachtheoretischen Reflexion
3.1.1. Drei Charakterisierungen der Sprache Die antiken Philosophen haben sich zwar auf vielfältige Weisen über die Sprache geäußert. Einig waren sie sich jedoch darin, daß unter Sprache in erster Linie die gesprochene Sprache zu verstehen sei. Diese erste Kennzeichnung wurde spätestens seit Platon (428/ 427⫺349/348 v. Chr.) in drei Richtungen ausgearbeitet; und was dabei zu sagen war, wurde trotz vieler Unterschiede im Detail doch im großen und ganzen von allen Beteiligten unterstützt. Die erste Art der Ausarbeitung ist zugleich wohl die älteste und führte zu einer der dauerhaftesten Betrachtungsweisen der Sprache. Dabei wird die (gesprochene) Sprache als Stimmphänomen oder noch allgemeiner als eine Art des Schalls bestimmt. Schon bei einer Reihe von Vorsokratikern ist diese Sicht bezeugt; sie wurde von ihnen im Bereich einer erkenntniskritisch interessierten Wahrnehmungslehre entwickelt, ferner im Bereich der Musiktheorie (siehe Art. 43) und im Bereich der Welt- und Kulturentstehungstheorie (näheres bei Ax 1986, 60⫺102). Natürlich verfolgte man in den drei Gebieten jeweils eigene Interessen und trug entsprechend unterschiedliche Gesichtspunkte zusammen. Aber schon Platons Umgang mit dem Wort fvnh¬ (‘Stimme’) zeigt, daß die in den verschiedenen Diskussionssträngen gesammelten Beobachtungen über die Sprache zusammengezogen wurden (Ax 1986, 102⫺113). Bei Aristoteles führte die systematisierende Absicht schon zu einigen Kapiteln entsprechenden Inhalts (bes. De anima II 8, 419 b 3 ff; Historia animalium IV 9, 535 a 26 ff; dazu Ax 1986, 122⫺130). Und der Stoiker Diogenes v. Babylon gestaltete aus dem überkommenen Material ein System, das dann zu hohem Ansehen gelangt ist. Es hatte die Form einer Dihärese der Stimme und sah folgendermaßen aus (bes. FDS 476; vgl. Ax 1986, 151⫺211): Die Stimme („fvnh¬“) im weitesten Sinne, d. h. der Schall („co¬fow“), ist ⫺ so die Definition ⫺ erschütterte Luft („aœh¡r peplhgme¬now“) oder auch das individuelle Wahrnehmungsobjekt des Gehörs („to¡ idion aiœsqhto¡n aœkoh˜ w“). Wenn sie/er, was
844 die Schallquelle betrifft, aus der Luftröhre eines Lebewesens kommt, handelt es sich um die Stimme eines Lebewesens, also um die Stimme im eigentlichen Sinne („fvnh¬“). Diese ist entweder bedeutsam oder nicht bedeutsam. Ist sie bedeutsam, so kommt sie entweder vom Verstand und ist die Stimme eines (erwachsenen) Menschen; oder sie wird von einem Trieb verursacht und ist die Stimme eines Tieres (oder Kindes). Die Stimme im eigentlichen Sinne wurde von Diogenes außerdem nach linguistischen Gesichtspunkten eingeteilt. Sie ist dann entweder artikuliert oder nicht artikuliert. Wenn sie nicht artikuliert ist („fvnh¡ anarqrow“), handelt es sich um bloße Laute („hÓxow“). Wenn sie dagegen artikuliert ist („fvnh¡ enarqrow“), handelt es sich um einen sprachlichen Ausdruck, eine Phonemreihe („le¬jiw“), die dann entweder etwas bezeichnet oder nichts bezeichnet. Wenn sie etwas bezeichnet („le¬jiw shmantikh¬“), handelt es sich um eine Rede („lo¬gow“). Und wenn sie nichts bezeichnet („le¬jiw ashmow“), hat man den Fall von bli¬tyri und skindaco¬w, die frühzeitig zu Paradebeispielen für Unsinnswörter geworden sind. ⫺ Obwohl diese Stimmdihärese des Diogenes v. Babylon große Resonanz fand, wurde sie nicht von allen Philosophen vorbehaltlos anerkannt (es gab schon Schwierigkeiten wegen der Schalldefinitionen: FDS 480⫺ 484). Andere hielten sie für verbesserungsbedürftig und schlugen vor, auch die nicht artikulierten Stimmen in bezeichnende und nicht bezeichnende zu unterscheiden (FDS 504 f). Überdies berücksichtigt die Dihärese nicht alle einschlägigen Gesichtspunkte der älteren Diskussionen; sie übergeht das noch für Chrysipp wichtige Kriterium, ob eine Stimme aufschreibbar oder nicht aufschreibbar ist (vgl. FDS 476; Ax 1986, 191 ff), und hat auch für die Musikstimme (Instrumente!) keinen angemessenen Platz. Des weiteren lief die vorausgegangene Entwicklung keineswegs so zielstrebig auf die Dihärese des Diogenes zu, wie es hier den Anschein haben könnte; zum Beispiel führte von Platon herkommend ein wichtiger Traditionsstrang auch über die Akademie des Xenokrates und die alte Stoa zu Diogenes (Ax 1986, 203 f). Schließlich war die Terminologie nicht immer so fest gefügt wie in der skizzierten Dihärese, und natürlich wurde, zumal bei den Vorsokratikern, oft nur ein bestimmter Ausschnitt aus ihr betrachtet, wobei etwa ein Nomen auch unmittelbar als Stimmphänomen oder als Schall behandelt werden konnte. Aus diesen Gründen reprä-
VII. Griechische und Römische Antike
sentiert das System des Diogenes die antike Diskussion nicht in jeder Hinsicht. Trotzdem führt es auf exemplarische Weise vor, wie die (gesprochene) Sprache in der Antike mit dem Begriff der Stimme oder gar mit dem des Schalls analysiert wurde. Dabei ging es erstens darum, der Akustik und der Sprachphysiologie oder auch der Sprachpsychologie einen angemessenen Platz in der Sprachtheorie zuzuweisen, oder zumindest darum, die Beziehung der Sprachtheorie zu jenen Disziplinen aufzuzeigen; und zweitens bemühte man sich, die lautliche Seite der Rede (Sprache) in verschiedene Ebenen zu differenzieren („lo¬gow“, „le¬jiw“, „fvnh¬“, co¬fow“), diese Ebenen einer jeweils eigenen Untersuchung zugänglich zu machen und sie nach Möglichkeit in einem dihäretisch aufgebauten System zu ordnen (so vor allem Diogenes v. Babylon). Nachdem die Sprache, genauer die gesprochene Sprache, als ein bestimmtes Stimmund Schallphänomen charakterisiert ist, sollte auch ihr Verhältnis zu anderen Erscheinungsweisen von Sprache geklärt werden, etwa das Verhältnis zur Schrift oder das zu den korrespondierenden psychischen Gegebenheiten. Zu diesem Problemkreis sei ein bekannter Text des Aristoteles angeführt: „ÔEsti me¡n oyÓn ta¡ eœn tñ˜ fvnñ˜ tv˜ n eœn tñ˜ cyxñ˜ paqhma¬tvn sy¬mbola, kai¡ ta¡ grafo¬mena tv˜ n eœn tñ˜ fvnñ˜ . kai¡ vÕsper oyœde gra¬mmata pa˜ si ta¡ ayœta¬, oyœde¡ fvnai¡ ai« ayœtai¬∑ v√n me¬ntoi tay˜ ta shmei˜a prv¬tvn, tayœta¡ pa˜ si paqh¬mata th˜ w cyxh˜ w, kai¡ v√n tay˜ ta o«moiv¬mata pra¬gmata hdh tayœta¬“ („Es ist also das Stimmliche Symbol der Eindrücke in der Seele und das Geschriebene Symbol des Stimmlichen. Und wie die Schriftzeichen nicht bei allen dieselben sind, so sind auch die Stimmlaute nicht bei allen dieselben. Wofür freilich diese in erster Linie Zeichen sind, die Eindrücke der Seele, das sind bei allen dieselben; und so sind auch die Sachen, deren Abbilder diese sind, dieselben“; De interpr. 1, 16 a 3⫺8).
Dieser kurze Abschnitt ist einer der am meisten zitierten und interpretierten Aristotelestexte. Er gibt viele Fragen auf, die hier noch nicht einmal angedeutet werden können. An dieser Stelle wird er herangezogen, insofern er auf repräsentative Weise ausdrückt, was die antiken Philosophen durchweg über den Zusammenhang und den Unterschied von geschriebener Sprache, gesprochener Sprache, psychischen Vorgängen und Sachen dachten. Am einfachsten ist das Verhältnis von gesprochener Sprache und Schrift: Die gesprochene Sprache ist die eigentliche Sprache; sie hat gegenüber der ge-
40. Zeichenkonzeptionen in der Philosophie
schriebenen eine Priorität und wird durch sie, je nachdem um welche Schrift (Handschrift) es sich handelt, auf diese oder jene Weise dargestellt; die Schrift ist von der Sprache verschieden und steht für sie (vgl. 24 b 2; 165 a 6⫺13); sie ist ihr Symbol oder auch ihr Zeichen. Die anderen antiken Philosophen schätzten das Verhältnis im wesentlichen genauso ein. Für Platon beispielsweise ergibt sich das schon aus seiner Kritik der Schriftlichkeit (Phaidros 275 c ff; Ep. VII 343 a); für die Stoiker finden wir es noch in den Resten ihrer Phonem- und Buchstabenlehre bezeugt (FDS 476; 519 f); und von Augustinus liegen uns dazu ausdrückliche Erklärungen vor (De dialectica 5, p. 86⫺88 Pinborg). Eine Ausnahme machten allenfalls die alexandrinischen Grammatiker, die sich an der geschriebenen Sprache orientierten (vgl. Ps.-Dionysius Thrax, Ars gramm. § 1, p. 5 Uhlig). ⫺ Schwieriger ist das Verhältnis der gesprochenen Sprache zu den psychischen Vorgängen oder zum Denken. Entsprechend der Vielfalt der Stimmen nimmt Aristoteles auch hier ein Symbol- (oder auch Zeichen-)Verhältnis an; nach Ausweis seines sonstigen Sprachgebrauchs vermeidet er in diesem Zusammenhang gern den Ausdruck shmei˜on und spricht im allgemeinen lieber von sy¬mbola. Nach De sensu 1, 437 a 3⫺17, scheint er dadurch unterstreichen zu wollen, daß die Zeichenrelation im Fall der Sprache nicht durch die Laute determiniert, sondern willkürlich oder konventionell festgelegt ist (vgl. auch § 3.2.2.). Die Sprache steht also für Gedanken, Wahrnehmungen oder überhaupt für psychische Vorgänge; sie hängt von diesem Bereich in gewisser Weise ab und ist ihm insofern nachgeordnet. So weit waren sich die antiken Philosophen wiederum einig: Schon der Sophist Gorgias v. Leontinoi unterstellt in seiner Schrift Über das Nichtseiende, daß die Sprache Gedanken oder Wahrnehmungen kundtut (s. u. § 3.1.2.); Platon spricht mehrfach von dem Gefälle Denken⫺Sprechen (z. B. Politeia 2, 382 b 7⫺c 1; Theaitetos 206 d 1⫺5; Sophistes 263 e 3⫺9; Philebos 38 e 1⫺5); Epikur nahm an, die Sprache sei dadurch entstanden, daß die Menschen mit der Stimme ihre Affekte ausdrückten (Long und Sedley 1987 § 19); für die Stoiker genügt es, an die Stimmdihärese des Diogenes v. Babylon zu erinnern; und Augustinus problematisiert sogar den Nutzen der Sprache, wenn doch das, wofür sie Zeichen ist, uns vertrauter sein müßte als sie selbst (De magistro II, 3 ff). Damit zeichnet sich freilich auch schon ab, was
845 an diesem Verhältnis problematisch ist: Es ist nicht klar, für was die Sprache des genaueren Symbol oder Zeichen ist. In der Antike hat man hier gern eine zusätzliche Unterscheidung eingeführt und gesagt, die gesprochene Sprache sei als äußere Rede („lo¬gow proforiko¬w“) Ausfluß einer inneren Rede („lo¬gow eœndia¬qetow“), die einem Selbstgespräch zu vergleichen sei; man halte sie ohne den Gebrauch der Stimme still bei sich (vgl. z. B. Platon an den angeführten Stellen; FDS 528 ff). Möglicherweise hat auch Aristoteles an der zitierten Stelle diese Unterscheidung im Sinn. Dann versteht sich nämlich sehr gut, warum er zwischen Sprache und Denken (innerer Rede) ebenso eine Symbolrelation annimmt wie zwischen Schrift und Sprache und warum er in unmittelbarem Anschluß an die zitierte Passage eine strukturelle Ähnlichkeit von Sprache und Denken beschreibt (De interpr. 1, 16 a 9 ff; vgl. auch 14, 24 b 1 ff). Wenn die Sprache also in erster Linie die innere Rede symbolisiert, wird deren Verhältnis zu den Eindrücken in der Seele („ta¡ eœn tñ˜ cyxñ˜ paqh¬mata“) fragwürdig, die Aristoteles an der zitierten Stelle erwähnt oder die man sonst im Umkreis der inneren Rede annahm. ⫺ Zuletzt sagt Aristoteles etwas über den Sachbezug des sprachlich symbolisierten Denkens. Davon halten wir hier wieder nur das fest, worüber sich die antiken Philosophen einig waren: (a) Zwar gibt es Wörter mit fiktionalen Bedeutungen, z. B. trage¬lafow (‘Bockhirsch’; Aristoteles, De interpr. 1, 16 a 16). Doch wenn die Sprache Anspruch auf Objektivität erhebt, muß sie einen Sachbezug haben. Dieser wächst ihr noch nicht durch ihre direkte Bedeutung zu, also nicht schon dadurch, daß sie Gedanken ausdrückt, sondern erst dadurch, daß die Gedanken sich darüber hinaus auf eine außerpsychische Realität beziehen, wobei die Sinneswahrnehmung von besonderer Bedeutung ist. (b) Man könnte die Gedanken auch als ‘Zeichen’ der außerpsychischen Realität ansehen. Aristoteles tut das nicht, sondern spricht an der zitierten Stelle von o«moiv¬mata (Abbildern), was gewiß bedenklich ist. Aber er hat doch sicherlich recht, wenn er deutlich macht, daß die Beziehung der Gedanken zur Wirklichkeit sich erheblich von den vorher erörterten Symbolrelationen unterscheidet. Darin hätte ihm ebenfalls niemand widersprochen. Insbesondere hatte bei den Stoikern die sogenannte vernünftige Vorstellung („fantasi¬a logikh¬“) in allen sprachtheoretisch wichtigen
846 Hinsichten dieselben Eigenschaften wie die äußere Rede (Long 1971, 82 f). Die antiken Philosophen vertraten einmütig die Auffassung, daß die (gesprochene) Sprache in sich zwei Komponenten zu einer Einheit verbindet; denn wie die beiden ersten Erläuterungen zeigen, besteht sie einerseits aus einem lautlichen Ausdrucksträger, der Stimme, und andererseits aus einem Ausdrucksinhalt, der vom Denken in die Stimme eingeprägt wird. Die so entstandene Einheit kann in beiden Richtungen auch differenzierter beschrieben werden und ist ziemlich komplex. Doch gibt es darin wenigstens eine Struktur, die von den alten Sprachtheoretikern einverständlich herausgestellt wurde: Konzentriert man sich auf die Artikuliertheit der Sprache und faßt nur die le¬jiw ins Auge, dann läßt diese sich in Einheiten unterschiedlicher Komplexität gliedern, in die sogenannten me¬rh th˜ w le¬jevw (Ausdruckssegmente). Den Schlüsselbegriff für diese Analyse lieferte Platon. Nach dem Beispiel der Buchstabenschrift betrachtete er die le¬jiw (den sprachlichen Ausdruck) als eine Anreihung von nicht weiter zerlegbaren Phonemen, führte für diese die Bezeichnung stoixei˜on (‘Element’) ein und unterschied sie scharf von der daraus zusammengesetzten nächst größeren Einheit der syllabh¬ (‘Silbe’) (so vor allem im Kratylos 393 d 6 ff; 424 b 7 ff u. ö.; vgl. zu Platons Einführung des Terminus stoixei˜on in die philosophische Literatur Schmitz 1985, I,2 28; II 46⫺52). Bei Aristoteles werden die Ausdruckssegmente dann erstmals vollständig klassifiziert: Die kleinsten, nicht mehr weiter segmentierbaren le¬jeiw sind die stoixei˜a (Phoneme, Buchstaben) ⫺ im Griechischen 24 Stück, die in verschiedene Unterklassen zerfallen. Die nächst größere Einheit bilden die segmentierbaren Laute ohne Bedeutung: die Silben und (offenbar unter der stillschweigenden Voraussetzung eines eingeschränkten Bedeutungsbegriffs) die Konjunktionen. Auf der dritten Stufe folgen die segmentierbaren Laute mit Bedeutung: die Nomina, die Verben, die Sätze und die Texte. Die Untergliederung dieser Laute richtet sich danach, ob außerdem wenigstens einer ihrer Teile Bedeutung hat: Nomina und Verben sind nicht teilbedeutsam, Sätze und Texte sind es (Poetik 20, 1456 b 20 ff; dazu Ax 1986, 133 f). Soweit sich das aus den spärlichen Zeugnissen noch erkennen läßt, haben die Stoiker die Ausdruckssegmente ganz ähnlich nach aufsteigenden Komplexitätsgraden klassifiziert (vgl. FDS 519 ff), und so wurde diese
VII. Griechische und Römische Antike
von den stoixei˜a (Phonemen, Buchstaben) ausgehende Beschreibung des sprachlichen Ausdrucks Allgemeingut der antiken Sprachtheorie, wenn sie auch nicht immer so gründlich durchgeführt wurde wie bei Aristoteles. 3.1.2. Die drei Dimensionen der Semiose im antiken Sprachverständnis Aus der dritten Beschreibung der Sprache folgt unmittelbar, daß die Sprache im Verständnis der griechischen Philosophie eine syntaktische Struktur besitzt, deren weitere Ausarbeitung allerdings eng mit semantischen Fragen verknüpft war; bei den Stoikern wurde sie sogar weitgehend auf die Ebene der Bedeutungen verlagert. Wir kommen darauf in § 3.2. zurück. Ferner kommt in allen drei Beschreibungen des Gegenstandes der sprachtheoretischen Reflexion die semantische Dimension vor. Die voll ausgeprägte Sprache, d. h. der lo¬gow (die ‘Rede’) hat eine Bedeutung; sie bezeichnet etwas von ihr Verschiedenes, zumindest „etwas in der Seele“ und möglicherweise eine Sache in der Wirklichkeit. Schließlich ist auch die pragmatische Dimension für die antike Beschreibung der Sprache wesentlich. Denn im Unterschied zur inneren Rede dient erst die äußere Rede der Kommunikation; nur sie teilt anderen mit, was jemand denkt oder fühlt, und nur durch sie kann er versuchen, auf andere Menschen Einfluß zu nehmen. Aus den Standardbeschreibungen der Sprache folgt also, daß im Sprachverständnis der antiken Philosophie von Anfang an alle drei Dimensionen vorhanden waren, die die heutige Semiotik für eine Semiose verlangt (vgl. Art. 1 § 2.), und daß auch die Sprachzeichenrelation von Anfang an als dreistellig angesehen wurde. Nicht erst Theophrast oder gar erst Augustinus hat auf die dritte, pragmatische Dimension der sprachlichen Semiose aufmerksam gemacht und den Sprachbenutzer als dritten Faktor der Sprachzeichenrelation in die Diskussion eingeführt, wie das verschiedentlich gesagt worden ist (so z. B. von Bochen´ski 1956, 114 f; Ruef 1981, 84⫺86; bzw. von Markus 1957, 72). Vielmehr haben sie die Dreidimensionalität der sprachlichen Semiose und die Dreistelligkeit der Sprachzeichenrelation nur besonders deutlich zum Ausdruck gebracht. Aber gut nachweisen läßt sich eine theoretische Berücksichtigung dieser Seite der Sprache spätestens seit dem Sophisten Gorgias v. Leontinoi. Gorgias macht davon (a) in seiner Schrift Über das Nichtseiende einen systematischen
40. Zeichenkonzeptionen in der Philosophie
Gebrauch (vgl. Frgm. 82 B 1⫺5 Diels-Kranz; dazu Newiger 1973). Dort beabsichtigt er, gegen die eleatischen Philosophen das alltägliche Weltverständnis zu rehabilitieren, und argumentiert zu diesem Zweck, daß nichts ist; wenn aber doch, dann ist es nicht erkennbar; wenn aber doch, dann nicht mitteilbar. Mit dem dritten Schritt kommt die Sprache ins Spiel, und außer einer Syntax gehört zu ihr offensichtlich auch eine Semantik und vor allem eine Pragmatik. Dasselbe ergibt sich ebenso schnell (b) aus Frgm. 82 B 23 D.-K. (dazu Barnes 1982, 463 f). Darin entwirft Gorgias zumindest für die Literatur, vielleicht auch für die anderen Künste, eine ästhetische Theorie; danach ist Kunst wesentlich auf Illusion aus und um so wertvoller, je besser das Publikum getäuscht wird. Außer Gorgias wurden oben auch Theophrast und Augustinus erwähnt. Theophrast teilt vor dem Hintergrund von Aristoteles, De interpretatione 4, 17 a 2⫺7, die Wissenschaften ein: „ditth˜ w […] oyshw th˜ w toy˜ lo¬goy sxe¬sevw […] th˜ w te pro¡w toy¡w aœkrovme¬noyw, oi√w kai¡ shmai¬nei ti, kai¡ th˜ w pro¡w ta¡ pra¬gmata, y«pe¡r v√n o« le¬gvn proti¬qetai pei˜sai toy¡w aœkrovme¬noyw“ („aufgrund des Umstandes, daß die Rede eine zweifache Beziehung hat, […] eine zu den Hörern, für welche sie etwas bezeichnet, und die andere zu den Sachen, über die der Sprecher berichtet, um die Hörer zu überzeugen“),
erklärt er, die Beziehung zu den Hörern sei maßgeblich für die Poetik und die Rhetorik, die Beziehung zu den Sachen sei die Domäne des Philosophen (Frgm. 1 Graeser). Was schließlich Augustinus betrifft, so reiht er in De dialectica die folgenden Definitionen aneinander: „Verbum est unuscuiusque rei signum, quod ab audiente possit intellegi, a loquente prolatum. Res est quidquid vel sentitur vel intellegitur vel latet. Signum est quod et se ipsum sensui et praeter se aliquid animo ostendit. Loqui est articulata voce signum dare. Articulatam autem dico quae comprehendi litteris potest“ („Das Wort ist Zeichen für eine Sache jedweder Art, welches Zeichen ⫺ vom Sprecher geäußert ⫺ vom Hörer verstanden werden kann. Die Sache ist, was immer entweder wahrgenommen oder verstanden wird oder aber verborgen ist. Das Zeichen ist etwas, was sowohl sich selbst einem Sinn als auch etwas außer sich dem Geist zeigt. Zu reden heißt, mittels der artikulierten Stimme ein Zeichen zu geben. Und artikuliert nenne ich diejenige Stimme, die mit Buchstaben festgehalten werden kann“; De dialectica V, 7,6⫺9, p. 86 Pinborg).
Damit wird die Sprache im üblichen Verständnis der antiken Philosophie in aller
847 Form als Zeichen definiert, ebenso wie kurz darauf die Schrift als Zeichen der gesprochenen Sprache gilt (7,11⫺13, p. 88 Pinborg). Und das Zeichen wird als dreistellig aufgefaßt, insofern es sich der Sinneswahrnehmung als es selbst zeigt, sich außerdem dem Geist (des Sprechers und Hörers) präsentiert und diesen auf etwas Drittes, die bezeichnete Sache verweist (siehe auch 7,13 f, wo die Zeichendefinition wiederholt wird, und die anders formulierte, aber sinngleiche Definition Augustins in De doctrina Christiana II,I,1; dazu Ruef 1981, 82 ff). Das Gesagte erfordert drei Ergänzungen: (a) Wenn das Sprachverständnis der Antike von Hause aus ein Zeichenverständnis einschließt, dann könnte die oben besprochene Symbolkette dazu veranlassen, auch die antiken Auffassungen über das Denken und die Sinneswahrnehmung auf eine Zeichenkonzeption hin zu untersuchen und zu prüfen, ob schon die antike Lehre von der Sinnlichkeit die Aufmerksamkeit der Semiotik verdient. Auf dieses weitläufige Thema sei hier wenigstens hingewiesen. ⫺ (b) Die Sprache konnte in Griechenland zwar als shmei˜on (‘Zeichen’) beschrieben werden; aber wie das Beispiel des Aristoteles zeigt, vermied man das: „In general, no one would dispute that words are signs; but for no writer is the theory of signs primarily a theory of language, nor a reflection on language carried on in terms of ‘signs’ “ (Markus 1957, 64). Bei Augustinus wurde das anders. Er entwickelte die Sprachkonzeption sehr entschieden in zeichentheoretischer Terminologie und scheint sich davon auch einen theoretischen Gewinn versprochen zu haben. Denn wie Markus vermutet, könnte es für ihn verlockend gewesen sein, auf diese Weise in der Bibelexegese die verschiedenen Schriftsinne unter einem einzigen Dach zu vereinen (1957, 65; zur Lehre von den Schriftsinnen vgl. u. a. Art. 57 § 2., Art. 58 § 4. und Art. 60 § 4.3.). Ein solches Ziel gab es vorher nicht, und so entfiel der Reiz, die Wörter oder die Rede als Zeichen zu charakterisieren. ⫺ (c) Man kann sich jedoch darüber hinaus fragen, ob es nicht spezifische sachliche Gründe gegeben haben könnte, mit der Zeichenterminologie in bezug auf die Sprache zurückhaltend umzugehen. Von der Antike bis heute unterscheiden fast alle ausformulierten Zeichenbegriffe deutlich zwischen dem Zeichen und dem, wofür es steht (vgl. § 2. und § 3.1.2.). Um daher die Sprache zeichentheoretisch zu deuten, muß sie entsprechend deutlich von dem abgehoben wer-
848 den, was sie zu verstehen gibt. Dadurch wird sie vergegenständlicht, und für das, was sie zu verstehen gibt, wird mehr oder weniger bestimmt unterstellt, im Prinzip könne man davon auch ohne die Vermittlung der (vergegenständlichten) Sprache einen Begriff bilden. Bis zu einem gewissen Grade mag das möglich und angemessen sein. Nicht zuletzt von der Philosophie L. Wittgensteins her (siehe Art. 109) fragt sich jedoch, ob eine solche Konzeption nicht erheblich den Beitrag der Sprache zur Konstitution unserer Welt unterschätzt, ob also die Sprache und das, was sie zu verstehen gibt, nicht wesentlicher zusammengehören, als der übliche Zeichenbegriff annimmt, und ob die griechischen Denker etwa aus diesem Grunde die zeichentheoretische Terminologie so zögerlich auf die Sprache angewendet haben. Das bringt uns auf die Frage, wie ursprünglich die drei Dimensionen der Semiose im Sprachverständnis der antiken Philosophie zusammengehören. 3.1.3. Von der Unzertrennlichkeit der drei Dimensionen der Semiose Die antiken Standardbeschreibungen der Sprache wurden aus den Beobachtungen der Wahrnehmungslehre, der Musiktheorie und der Kulturentstehungslehre zusammengezogen. Daher wird man im 5. Jahrhundert v. Chr. in keiner der drei Sparten für sich wesentliche Auskünfte über die Sprache erwarten. Eine tiefere Einsicht in sie ist damit jedoch nicht ausgeschlossen, wenn auch unklar ist, wo und wie man sie aufweisen könnte. Nun ist Platons Kratylos (entstanden ab etwa 385 v. Chr.; vgl. Schmitz 1985, II 25 ff) die älteste uns heute noch vorliegende sprachphilosophische Untersuchung der Griechen. Der Dialog deutet allerdings auf ältere Diskussionen zurück, da er von einer bereits etablierten Kontroverse ⫺ dem fy¬sei / qe¬sei-Streit ⫺ ausgeht und die zugrunde liegende Fragestellung weiterentwickelt (vgl. § 3.2.1.). Wenn man die Geschichte also zurückverfolgt, stößt man auf den historischen Kratylos, der ein Herakliteer war (Aristoteles, Metaph. A 6, 987 a 32 f; G 5, 1010 a 12 f; Diogenes Laertius III 5) und bei dem sich, wie Platons gleichnamiger Dialog und wie Aristoteles (Metaph. G 5, 1010 a 12⫺15) zeigen, eine Unvereinbarkeit der Flußlehre und einer Namentheorie abgezeichnet zu haben scheint. Von daher sucht man den Anfang der Sprachphilosophie seit der ersten Hälfte des vorigen Jahrhunderts gern bei Heraklit (ein detaillierter Überblick bei Schmitter 1984, 3⫺14) und
VII. Griechische und Römische Antike
läßt dort gelegentlich auch die Vorgeschichte der Semiotik beginnen (so z. B. Walther 1979, 12 f). Inhaltlich wird das durch einige andere antike Zeugnisse und etwa durch die Heraklit-Fragmente B 1, 48 und 93 D.-K. abzustützen versucht. Jedoch wirken die Interpretationen in jedem Fall gezwungen und philologisch einseitig, wenn sie nicht überhaupt unhaltbar sind. Trotzdem scheinen Heraklit und ebenso Parmenides Wesentliches über die Sprache gesagt zu haben. Nur liegt es in einer anderen Richtung, als man bisher vermutet hat, und wurde, wenn ich recht sehe, erstmals von K. Held herausgearbeitet. In Griechenland war der Glaube verbreitet, daß die Bezeichnung einer Sache einen beträchtlichen Teil ihrer Natur offenbare (vgl. § 3.2.1. und § 3.2.3.). Nicht zuletzt bei Heraklit und Parmenides sah man diesen Glauben darin begründet, daß sie es nicht verstanden hätten, zwischen den Sachen und den in ihren Bezeichnungen artikulierten menschlichen Ansichten zu unterscheiden oder überhaupt eine grundsätzliche Trennung zwischen der Sprache und den Dingen vorzunehmen; solche Nichtunterscheidung sei Ausdruck einer längst überwundenen Stufe vorreflexiven, archaischen Denkens (Belege bei Held 1980, 154; 500 f). Dann wäre sie allerdings nicht mehr philosophisch nachvollziehbar und hätte fatale Konsequenzen. Indes könnten die alten Denker auch gute Gründe gehabt haben, mit der Trennung von Bezeichnung und Sache zu zögern und stattdessen eine Identität ins Auge zu fassen. Diese Gründe und was Heraklit und Parmenides über die Sprache auch heute noch Gültiges zu sagen hatten, treten nach Held (1980, 153 ff; 184 ff; 198 ff; 500 ff u. ö.) sofort zutage, wenn wir uns auf einen grundlegenden Umstand im Aufbau unserer Welterfahrung besinnen: die Situationsbefangenheit des vorwissenschaftlich-vorphilosophischen Lebens und ihre Ursprünglichkeit. In der ursprünglichen Erfahrungsssituation bilden der subjektive Eindruck, die Benennung und die objektiv vorliegende Sache eine ungeschiedene Einheit. Da wird die Sache in situationsgebundener Weise für jemanden offenbar; im Vollzug des Benennens erhält sie für ihn zuständliche Bestimmtheit, und er gewinnt eine Ansicht von ihr. Diese begründet eine doxahafte Erfahrung, die nicht falsch, aber einseitig ist und die eine philosophische Kritik deshalb verdient, weil sie dazu neigt, an der bloß situationsbedingten zuständlichen Bestimmtheit länger als angebracht festzuhalten. Die
40. Zeichenkonzeptionen in der Philosophie
so umrissene ursprüngliche Situationsbefangenheit verhilft, wie Held vorgeführt hat, zu einer profunden Heraklit- und ParmenidesInterpretation. Was die beiden über die Sprache gedacht haben, läßt sich dann, soweit sie übereinstimmten, so kennzeichnen: Von ihrem Ursprung im situationsgebundenen Benennen her ist es geradezu geboten, eine wesentliche Zusammengehörigkeit von Sprache und Sache zu behaupten und eine fundamentale Trennung beider zu vermeiden. Im übrigen orientieren die Menschen sich durch die Sprache sowohl im sozialen Bereich als auch in bezug auf die Dinge. Die Sprache regelt also das Verhältnis von Ansichten und ist Vollzug dieses Verhältnisses; indem darüber hinaus der Philosoph seine Kritik an der Ansicht etwa durch ein Buch einsichtig darzulegen sucht, betrifft sie außerdem das Verhältnis von Einsicht und Ansicht. Heraklit hat seine Gedanken mit vielen, zum Teil recht geheimnisvollen Bildern und Gegensätzen ausgedrückt; Parmenides schrieb weniger dunkel, war aber ebenfalls noch weit von den späteren Standards begrifflicher Klarheit entfernt. Helds Interpretation ist daher nicht in dem Sinne textnah, daß ihre zentralen Begriffe auch schon in den alten Texten vorkämen oder daß sie an wenigen ausgewählten Texten leicht zur Evidenz gebracht werden könnten. Mit Blick auf den beschränkten Raum ist es deshalb auch im gegenwärtigen Zusammenhang nicht möglich, sie an einzelnen Texten zu entfalten. Soweit sie auch ohne solche Nachprüfung Anerkennung verdient, findet man in der heraklitischen und parmenideischen Sprachauffassung mühelos die syntaktische, die semantische und die pragmatische Komponente. Insofern läßt sich ein Zeichenverständnis, wie es die heutige Semiotik vorsieht, bereits bei Heraklit und Parmenides aufweisen. Zugleich wird deutlich, wie eng die drei Komponenten von der Situationsbefangenheit des alltäglichen Lebens her ursprünglich zusammenhängen. Es ist von daher undenkbar, etwa auf die pragmatische Dimension zu verzichten und die Sprache mit einem bloß zweistelligen Zeichenbegriff zu deuten, wie das vor Theophrast gewesen sein müßte, wenn erst er zur Dreistelligkeit übergegangen wäre. In der ursprünglichen Erfahrungssituation sind die drei Aspekte allerdings so eng miteinander verknüpft und so unmittelbar aufeinander bezogen, daß der begegnende Gegenstand noch gar nicht anders als nur durch die situationsgebundene Benennung identifiziert wer-
849 den könnte und von ihr noch nicht unterscheidbar ist; und umgekehrt besitzt sie ihm gegenüber noch kein eigenes Dasein. Deshalb können die drei Faktoren der Zeichenrelation auf dieser Stufe noch nicht getrennt werden. Möglicherweise ist das der tiefere Grund, warum die antiken Philosophen sich von einer zeichentheoretisch formulierten Analyse der Sprache nicht viel versprachen. Denn was sie oder jedenfalls Heraklit und Parmenides über die Sprache zu sagen hatten, könnte ihnen grundlegender erschienen sein als das, was sich mit dem Zeichenbegriff verstehen läßt. Daß die Sprache in der Situationsbefangenheit des alltäglichen Lebens verwurzelt ist, blieb auch über Heraklit und Parmenides hinaus bewußt und wirkte sich in dem berühmten Problem aus, ob die Sprache bzw. die Bezeichnungen der Natur zu verdanken seien oder auf eine Art Setzung zurückgingen. Demokrit scheint sich als erster damit befaßt zu haben (Frgm. 68 B 5. 26. 142. 145 D.-K.; dazu Barnes 1982, 466⫺470). Allerdings ist nicht ohne weiteres klar, worum es bei diesem Problem ging. Es bezog sich auf mindestens zwei Fragen. Die erste betrifft den entstehungsgeschichtlichen Ursprung der Sprache, die zweite ihr Verhältnis zur Welt. Bei der ersten Frage handelt es sich um die Alternative, ob die Sprache von einem Sprachschöpfer erfunden und den Menschen wie ein Gesetz verordnet wurde oder ob sie auf natürliche Weise im Verlauf einer evolutionären Entwicklung entstanden ist. Diese Frage läßt sich mit Epikur eindeutig entscheiden: ein Namengeber setzt, um sein Werk erfolgreich tun zu können, bereits eine Sprache voraus; daher ist die erste Variante logisch unmöglich; die Sprache hat sich notwendigerweise natürlich entwickelt. Der Prozeß der Sprachentwicklung kam nach Epikur des genaueren dadurch in Gang, daß die Menschen in Reaktion auf verschiedene Gefühle und Eindrücke instinktiv verschiedene Laute äußerten, die sie im Rahmen erster Formen sozialen Lebens zu differenzieren begannen, bis sich über viele Stufen schließlich die heutige Sprache entwikkelte (Long und Sedley 1987, § 19.). Dies war damals eine höchst innovative Sprachtheorie. Worauf es hier ankommt, ist, daß die Sprache ihr zufolge nur aus der Situationsbefangenheit des urzeitlichen Alltags entspringen konnte und dort bei rudimentärer Syntax sogleich auch einen semantischen und vor allem einen pragmatischen Charakter hatte, ohne den sie sich niemals entwickelt hätte. Das-
850 selbe ist bei der Lösung der Stoiker zu beobachten, obwohl sie von der Sprachentstehungslehre Epikurs deutlich abweicht. Nach den Stoikern sind die ersten Wörter ⫺ ähnlich wie das schon Platon im Kratylos 422 ff erwogen hat ⫺ in der Weise natürlich entstanden, daß die Menschen mit ihren Stimmlauten die Dinge nachahmten. Die dafür maßgebliche Ähnlichkeit erstreckte sich entweder auf die akustischen Eigenschaften der Dinge und der Laute (Onomatopöie) oder auf die Eigenschaften des zu bezeichnenden Dings und desjenigen psychischen Eindrucks, der bei der Rezeption der dieses Ding bezeichnenden Laute entsteht. Aus solchen Ursprungswörtern sei dann auf mehrerlei Weise das zeitgenössische Vokabular hervorgegangen (FDS 639 ff; dazu Barwick 1957, 29⫺33). Diese Sprachentstehungslehre ließ sich auch für die zweite Teilfrage des fy¬sei /qe¬sei-Problems nutzen, bei der allerdings nicht so viel auf die pragmatische Dimension der Sprache ankommt und auf die deshalb erst in § 3.2.1. und § 3.2.3. eingegangen wird. 3.2. Sprache und Ontologie: die Semantik des sprachlichen Zeichens Die syntaktische, die semantische und die pragmatische Dimension gehörten für das Sprachverständnis der antiken Philosophie sehr eng zusammen. Trotzdem spielten die semantischen Probleme häufig eine vorherrschende Rolle. Deshalb rücken sie nun ebenfalls ins Zentrum, doch so, daß die anderen Aspekte bei Bedarf angesprochen werden können. Zugleich wendet sich die Darstellung verstärkt einzelnen Philosophen oder Schulen zu; es werden die semantischen Konzeptionen (und entsprechende ontologische Annahmen) von Platon, Aristoteles und den Stoikern behandelt. Sie stehen außer in einem historischen vor allem in einem systematischen Verhältnis. Im Hinblick darauf ist es nützlich, im folgenden die dritte antike Standardbeschreibung der Sprache im Auge zu behalten, die Ausdruckssegmentierung (§ 3.1.1.). An ihr wird deutlich, daß die Entwicklung der semantischen Fragestellung nach Platon von einer bemerkenswerten Aufwertung der syntaktischen Struktur der Sprache begleitet wurde. 3.2.1. Platon Platons Kratylos, entstanden ab etwa 385 v. Chr., ist die älteste uns erhaltene sprachphilosophische Studie der Griechen, aber auch ein sonderbarer Dialog. So hat er seit
VII. Griechische und Römische Antike
über 150 Jahren zu immer wieder neuen Untersuchungen herausgefordert; die Fülle der Arbeiten darüber ist erdrückend ⫺ und deutet als solche schon an, daß das wenige, was hier über die Schrift gesagt werden kann, in vielfacher Weise vertieft werden müßte. Das Thema des Dialogs ist die oœrqo¬thw tv˜ n oœnoma¬tvn (‘Richtigkeit der Namen oder Bezeichnungen’), ob sie von Natur aus („fy¬sei“) ⫺ so die These des Kratylos ⫺ oder ob sie durch Konvention und Setzung („synqh¬kñ“, „qe¬sei“) existiere ⫺ so die These des Hermogenes ⫺ (Krat. 383⫺385); der Zweck der Erörterungen scheint nach dem Ende (439 f) der zu sein, die Verbindung einer radikalisierten heraklitischen „Alles fließt“-Lehre mit grenzenlosem Vertrauen in die Richtigkeit der Namen als unhaltbar zu erweisen und dadurch eine Alternative zur Ideenlehre abzuwehren (Schmitz 1985, II 32⫺35; vgl. Gaiser 1974, 11 f). Das Thema setzt sowohl einen Bezug der Namen zu den Sachen voraus als auch eine gewisse Differenz, beide undurchschaut (vgl. als Beispiel die Diskussion über Krankheitsnamen, Art. 45 § 3.). Die Bezeichnungen werden also nicht in den ursprünglichen Verwendungssituationen gesehen, an die Heraklit und Parmenides gedacht haben werden; vielmehr sind sie vergegenständlicht. Trotzdem wirkt die ältere Sicht nach, weil es im Kratylos (ebenso wie an vielen anderen Stellen, an denen Platon über den Dialektiker spricht) auch darum geht, welches Verständnis der Sachen durch die Bezeichnungen vermittelt wird und worauf sich die Lehre von der ‘wahren Wortbedeutung’, die Etymologie, stützen kann; auch dies sind Leitfragen des Dialogs. Dieser beginnt, indem Sokrates von Hermogenes und Kratylos ins Gespräch gezogen wird, die ihre eigenen Auffassungen zunächst nur kurz kennzeichnen; dann vertritt er gegen Hermogenes eine fy¬sei-These und später umgekehrt gegen Kratylos eine qe¬sei-These. Dabei ergeben sich einesteils immer wieder neue Ansätze zu untersuchen, worin eine Übereinstimmung oder Nichtübereinstimmung zwischen Namen und Sachen bestehen könnte; andererseits schwankt „der Gesprächsverlauf […] zwischen der Behauptung und der Bestreitung einer ‘von Natur’ in den Namen angelegten Möglichkeit der Sachadäquatheit“ (Gaiser 1974, 26). Eine befriedigende Lösung wird aber nicht erreicht, es sei denn, man begnüge sich mit den negativen Resultaten, daß es angesichts einer unbestreitbaren Verbindlichkeit der Sprache nicht genügt, sie schlechthin konventionell zu
40. Zeichenkonzeptionen in der Philosophie
nennen, und daß es wegen der Vielfalt der Sprachen und aus zahlreichen anderen Gründen nicht möglich ist, in den Bezeichnungen, mögen sie auch wichtige Aspekte der Dinge vermitteln, deren Beschaffenheiten verläßlich ausgedrückt oder abgebildet zu sehen. Unbeschadet der vielen anregenden Gedanken, die Platon im einzelnen vorbringt (vgl. die facettenreiche Interpretation von Gaiser 1974), zeigt das dürftige Gesamtresultat, daß etwas an der Fragestellung nicht stimmt. War das vorzuführen und die beiden diskutierten Thesen als unsinnig zu erweisen Platons eigentliche Absicht? Man hat das vermutet (z. B. Coseriu 1975, 59 mit weiteren Belegen), und es mag so gewesen sein. Aber auch dann wußte Platon die Fragestellung nicht nachhaltig zu ändern. Er wird selbst tiefer begründete Schwierigkeiten mit ihr gehabt haben. Bezeichnend ist, wie Sokrates gegenüber Hermogenes die Ansicht begründet, daß die Richtigkeit der Bezeichnungen in einer maßgeblichen Hinsicht ein natürliches Fundament haben müsse, und gegenüber Kratylos die Ansicht, daß sie ebenfalls in einer maßgeblichen Hinsicht auf Konvention beruhen müsse. In beiden Fällen argumentiert er damit, daß wegen der Aussagenwahrheit und -falschheit auch die Wörter wahr oder falsch sein können; wenn sie ihre Bedeutung nur qe¬sei hätten, könnten sie nicht wahr sein, wenn nur fy¬sei, nicht falsch (Krat. 385 bzw. 429 ff). Dieses Argument stellt die Aussagesätze und ihre Teile, die Wörter, semantisch weitgehend gleich. Dem entspricht an anderer Stelle die Erwägung, ob die Ähnlichkeit oder Unähnlichkeit zwischen den Wörtern und den Dingen nicht auf die Phoneme oder Silben und deren Bedeutung (!) gestützt werden könnte (Krat. 424⫺427; 434 f). Natürlich führt auch diese probeweise semantische Gleichstellung der Wörter und ihrer Teile nicht zu dem gewünschten Erfolg, und Platon mißt ihr offenbar keine ernsthafte Bedeutung zu. Dagegen bringt das Argument über die Aussagesätze und Wörter den Dialog allererst in Gang und verdient größere Aufmerksamkeit, obwohl Platon es nie wiederholt hat. Wir werden sehen, daß er die Wörter und die Rede in der Tat nicht nachhaltig zu unterscheiden verstand, sondern semantisch im wesentlichen als gleich ansah. Nur betrachtete er dabei anders als in dem angeführten Argument eigentlich nicht die Wörter von der Rede her (das war nur eine sekundäre Perspektive). Vielmehr betrachtete er umgekehrt die Rede grundlegend von den Wörtern her,
851 die in ihr ‘gereiht’ sind. So ist nicht der Satz oder gar der Text dasjenige Ausdruckssegment, an dem sich Platons Sprachtheorie orientiert; sein Paradigma ist stattdessen nur das viel weniger komplexe Wort. Im Spätwerk sieht es einmal so aus, als ob die Wörter und die aus ihnen zusammengefügte Rede für Platon nicht mehr semantisch im wesentlichen gleich, sondern deutlich voneinander abgehoben seien. Gegen Ende des Sophistes unterscheidet er zwei Arten von Wörtern: oœno¬mata (Benennungen von Handelnden) und r«h¬mata (Benennungen von Handlungen). Die ersteren alleine können, auch wenn sie angehäuft werden, keine Rede bilden, ebensowenig die letzteren. Aber wenn Wörter beider Arten gemischt werden, mindestens eins von jeder Sorte, bedeuten sie auch in ihrer Zusammenstellung etwas und fügen sich zu einer Rede zusammen. Diese nennt nicht mehr bloß, muß vielmehr von einer eigenen Beschaffenheit sein, nämlich wahr oder falsch (261c6⫺263d5). Gegenüber dem Frühwerk sind diese Ausführungen bemerkenswert. Hier werden erstmals syntaktische Strukturen angesprochen, und daß sie eine semantische Funktion haben, bleibt nicht unbemerkt. So scheint Platon die Aussage von den Wörtern entscheidend abzugrenzen und die Rede wenigstens in ihren einfachsten Formen als Prädikation zu erkennen. In der Tat wird der Text gelegentlich so verstanden (Belege bei Schmitz 1985, I,2 47; auch 49). Gleichwohl handelt es sich dabei um ein schwerwiegendes Mißverständnis. Denn wie zuletzt Schmitz gezeigt hat (1985, I,2 26⫺54, bes. 45⫺50), sind die zur Rede verbundenen Wörter im Sinne Platons zwar von verschiedener Art, aber ansonsten vollkommen gleichrangig; sie sind aneinander angereiht, und keins von ihnen ist irgendwie ausgezeichnet. „Platon versteht die Rede als eine Liste vom Typ des Inventars, die aus Namen besteht, aber nicht aus müßig daliegenden Namen, sondern aus Namen, die die Funktion des Anrufens, Ansprechens, Angebens von Vorliegendem haben“ (1985, I,2 45); die Information, die die Rede als Inventar liefert, ist der vergleichbar, die wir heute Frachtbriefen, Lagerverzeichnissen, Steuererklärungen und dergleichen mehr entnehmen (1985, I,2 27). Wieweit dieser Begriff der Rede von einem Verständnis der Prädikation entfernt ist, geht gerade im Sophistes deutlich aus der Art hervor, in der Platon die Leute widerlegt, die nur genau zwei Dinge als seiend gelten lassen wollen (243e8⫺244a3): Ihr
852 Dualismus schlägt bloß deshalb in einen Monismus um, weil Platon den Ausdruck „Seiendes“ in „a ist etwas Seiendes“ wie einen Eigennamen behandelt. Weil er auch im Spätwerk Aussagen und Benennungen noch nicht wirklich zu unterscheiden vermag, kommt er auch zu dem sonderbaren Schluß, daß, wer den Ausdruck „Nichtseiendes“ gebrauche, anstatt zu reden nur Schall hervorbringe (Soph. 237 e 4⫺6; 238 c 8⫺10). Es gibt in Platons Ausführungen noch andere signifikante Merkwürdigkeiten, auch solche in der skizzierten Beschreibung der Rede und nicht zuletzt in den Erörterungen über Wahrheit und Falschheit, die gerade von einer Inventaroder Aggregattheorie der Rede her bestens zu verstehen sind (besonders Soph. 237 a⫺ 264 b). Im übrigen hat er diese Theorie auch schon im Frühwerk vertreten (z. B. Euthyd. 284 a⫺c; Krat. 385 b 7 f; 387 c 6 f; 388 b 7⫺ c 1; 429 d 5 f) und vermochte, selbst wenn sich eine Gelegenheit dazu bot, nicht die durch sie gesteckten Grenzen zu durchbrechen (vgl. Theaitetos 208 c⫺209 c; Epist. VII 342 a⫺ 343 d). Endlich ist das ontologische Pendant der Theorie ein Elementarismus, der dem logischen Atomismus unseres Jahrhunderts gleicht und der, wie Prauss (1966) entdeckt hat, bei Platon ebenfalls deutlich ausgeprägt ist. Aus alledem folgt, was angekündigt war: Platon denkt über die Sprache am Leitfaden der Benennungen nach und faßt die Rede als eine verknüpfende Anreihung von Benennungen auf. Darüber kommt er auch im Alter nicht hinaus. 3.2.2. Aristoteles Auch Aristoteles hat sich mit vielerlei Beiträgen in die sprachtheoretische Diskussion eingeschaltet. Auf einige davon wurde bereits hingewiesen (§ 3.1.1.; vgl. auch Art. 42 § 2.1.3.). In der fy¬sei/qe¬sei-Frage vertrat er eine einfache Konventionalitätsthese: Sprachlaute sind nicht wesensgemäß oder instrumentell, sondern willkürlich und konventionell gewählte Symbole (De interpr. 1⫺4, 16 a. 17 a 1 f; etwas anders die Deutung z. B. von Coseriu 1975, 72 ff; 106 ff). Die größte und folgenreichste Leistung des Aristoteles war aber wohl die Überwindung der Platonischen Inventartheorie und des isomorphen Abbildcharakters der Rede. Er lernte und lehrte, die Aussage (den „lo¬gow aœpofantiko¬w“: De interpr. 4, 17 a 2 u. ö.) als Prädikation zu verstehen. Die neue Sicht wurde möglich „durch die bahnbrechende Entdeckung verschiedener Richtungen des Fragens, denen Gattungen oder Figu-
VII. Griechische und Römische Antike
ren der Prädikation (ge¬nh, sxh¬mata th˜ w kathgori¬aw) entsprechen: die Kategorien im technischen Sinn der Kategorienlehre“ (Schmitz 1985, I,2 55; vgl. bes. Top. A 9, 103b20⫺104a2; dazu auch Kapp 1968, 219⫺223). Die Aussage wird also (1) als Antwort auf eine Frage verstanden. Ob schon als Reaktion darauf oder nicht, jedenfalls sah Platon noch im VII. Brief zwischen Fragen und Antworten (aussagenden Reden) einen grundsätzlichen Widerspruch, weil die Antworten immer auch bestimmte Teile der Fragen wiederholen, nach denen nicht gefragt ist: „Was ist F?“/„Das ist F“. Für die Inventartheorie disqualifiziert diese Wiederholung die Aussage und bildet ein Argument gegen die Sprache überhaupt (342 a⫺343 d). Dagegen zeigt die Wiederholung für Aristoteles, daß die Aussagen, indem sie zugleich etwas Neues enthalten, auf Fragen antworten und ähnlich wie diese asymmetrisch verfaßt sind. Damit ist der entscheidende erste Schritt zum Verständnis ihrer logischen Eigenart getan. (2) Entsprechend den vielen Fragewörtern gibt es allerdings eine Reihe von Fragetypen und von daher ebenso viele Antworttypen: die Typen der Prädikation, die Kategorien des Aristoteles. Diese ergeben sich ursprünglich daraus, daß die Aussage als Antwort einem durch ein Fragewort vorgezeichneten Fragetyp entspricht, was freilich zugleich bedeutet, daß in die prädikative Form typische Einstellungen eingehen, denen wir im Erkenntnisvollzug folgen. Doch wegen der Vielzahl der Kategorien eröffnet die neue Sicht (3) zugleich die Möglichkeit, diese „Einstellungen von dem, worauf man sich erkenntniswillig einstellt, im Prinzip abzuheben, also gleichsam des Schattens und der eigentümlichen Beleuchtung inne zu werden, die das prädizierende Sprechen schon als solches auf das Besprochene wirft. Damit gewinnt die Reflexion eine neue, eigenständige Perspektive“, in der „das sprachgebundene Erkennen […] sich selbst thematisieren und so seine Stellung zum Seienden grundsätzlich und kritisch in den Blick nehmen [kann]“ (Schmitz 1985, I,2 55; zur Aristotelischen Logik vgl. Art. 41 § 4.2.). Als Prädikation aufgefaßt ist die Aussage eine originäre sprachliche Einheit mit einer irreduziblen Eigenart; sie sagt etwas von etwas und hat eine charakteristische syntaktische Struktur. Soweit Aristoteles deshalb über die Sprache insgesamt von der Aussage her nachdenkt, expliziert er sie von einem völlig anderen Ausgangspunkt her als alle
40. Zeichenkonzeptionen in der Philosophie
seine Vorgänger. Was das Aussagenverständnis selbst betraf, konnte er insbesondere angeben, wieso Aussagen und nur sie wahr oder falsch sein können: weil sie und nur sie Sachverhalte ausdrücken, auf deren Bestehen oder Nichtbestehen sich das Wahr- oder Falschsein der Aussagen bezieht. Den erforderlichen Sachverhaltsbegriff entwickelte er in seiner berühmten Ausarbeitung von vier Forschungsrichtungen (Anal. post. B 1, 89 b 23⫺35). Unter den vier Fragen, nach denen diese sich richten, sind zwei Arten von „ob“Fragen: die po¬teron- und die eiœ-Fragen. Erstere leiten die erste Forschungsrichtung und sind Fragen danach, ob bestimmte Sachverhalte bestehen oder nicht, während letztere für die dritte Fragestellung maßgeblich sind und sich auf die Existenz oder Nichtexistenz konkreter Gegenstände beziehen. Damit unterscheidet Aristoteles auf das deutlichste die von den Aussagen (z. B. „p“) ausgedrückten Sachverhalte (im Beispiel: daß p) von den durch Namen und Kennzeichnungen (wie wir heute sagen würden) bezeichneten konkreten Gegenständen. An anderer Stelle unterstreicht er den Unterschied, indem er die Seinsweise bestehender und nichtbestehender Sachverhalte von der Seinsweise existierender konkreter Gegenstände abhebt und darauf genau eine der Bedeutungen bezieht, die die Wörter „wahr“ und „falsch“ in der Umgangssprache haben (Metaph. U 10, 1051 a 34 ff; D 29, 1024 b 17 ff). Darüber hinaus erledigte sich das bei Platon mehrfach diskutierte Scheinproblem der angeblichen Unmöglichkeit falscher Rede. Bei Aristoteles taucht dieses Problem nicht mehr auf, weil er den Begriff des Seienden zu differenzieren verstand, wie das gerade bei der Aussagenwahrheit zu sehen war. Doch hatte er darüber noch einiges mehr zu sagen und bezog darin auch die Bedeutung der Satzteile ein. Platon meinte, die Rede bestehe mindestens aus der Bezeichnung für einen Handelnden (onoma) und aus der für eine Handlung (r«h˜ ma), und erklärte vor allem, jedes sinntragende Wort in der Rede bezeichne gleichermaßen etwas Seiendes. Demgegenüber bestimmte Aristoteles die Satzteile neu: die oœno¬mata (Nomina) bezeichnen pra¬gmata (Sachen) und die r«h¬mata (Verben) zusätzlich eine Zeit (De interpr. 2/3, 16 a 19 ff/b 6 ff). Außerdem erläuterte er, wieso die Sprache eine wichtige Quelle bloß scheinbarer Schlüsse sei: Weil in der Argumentation anstatt der Sachen deren Symbole verwendet werden, glaube man leicht, was für die Worte
853 gelte, müsse wie bei den Rechensteinen auch für die Dinge gelten. Aber in Wirklichkeit bestehe da keine Gleichheit, weil mit einer begrenzten Zahl von Worten und Begriffen eine unbegrenzte Zahl von Sachen zum Ausdruck gebracht werde (Soph. El. 1, 165 a 4⫺19). Das mindeste, was an semantischer Differenzierung erforderlich ist, ist also eine Unterscheidung ähnlich der von Bedeutung und Referenz, so daß ein und dasselbe Wort bei gleicher Bedeutung für beliebig viele Gegenstände derselben Art verwendet werden kann. Wie die Trugschlüsse und andere Beobachtungen zeigen, muß aber gegebenenfalls auch die Bedeutungsbeziehung selbst differenziert werden, und Aristoteles hat eine längere Reihe semantischer Relationen unterschieden: Homonymie, Synonymie, Paronymie (wird in der Topik anders definiert als in der vermutlich unechten Kategorien-Schrift), Systoichie, pro¡w eÕn-Relation und anderes mehr (z. B. Top. A 15, 106 a 1 ff; B 4, 111 a 33 ff; 9, 114 a 26 ff; Metaph. G 2, 1003 a 33 ff; weitere Stellen und mehr Information bei Bonitz 1870 unter den verschiedenen Stichwörtern, Oehler 1984, 158⫺168 und Schmitz 1985, I,2 4⫺6; 68 ff). Dabei bilden die Wörter und die Sachen keine ungeschiedene Einheit mehr, sondern werden ganz im Gegenteil in gewisser Weise einander gegenübergestellt. Auch wenn dieser Übergang damals schon etwas Alltägliches war, ist er erstaunlich, weil er aus der ursprünglichen Sprachverwendungssituation herausführt; jedenfalls verlangt er eine Erklärung. Anscheinend sind es die Kategorien, durch die er für Aristoteles grundlegend ermöglicht wird. Deren Entdekkung hatte aber noch eine weitere Folge. Um die Kategorien zu ordnen, bedurfte es eines Prinzips. Aristoteles fand es nach langem Suchen im pro¡w eÀn le¬gesqai (‘im Hinblick auf ein Eines gesagt werden’) und konnte der platonischen Position dann eine voll entwickelte eigene Auffassung entgegenstellen (vgl. Metaph. G 2, 1003 a 33 ff). Nach ihr bezeichnet ein Wort dann und nur dann etwas Seiendes im eigentlichen Sinne, wenn es das Wesen („oyœsi¬a“) bezeichnet; in allen anderen Fällen, wenn Akzidentien bezeichnet werden, bezeichnet es etwas Seiendes im uneigentlichen Sinne, das im eigentlichen Sinne kein Seiendes ist. Auch wenn damit noch nicht entschieden ist, was Aristoteles unter dem Wesen verstand, ist doch soviel klar, daß das, was als Qualität, Quantität, Lage oder dergleichen von einem Wesen prädiziert wird, nicht in demselben Sinne ‘ist’ wie dieses selbst, viel-
854 mehr nur in uneigentlichem Sinne. Daher verbietet es sich, länger dem Schein zu folgen und „alles von etwas Ausgesagte für ein Diesda-was zu halten und so zu verstehen, als ob es ein Eines wäre“ (vgl. Soph. El. 7, 169 a 33⫺35). Die Aussage ist in ihrer Struktur kein Spiegel des Seienden, auf das sie sich bezieht. Vergleichen wir das mit den Teilen eines ‘einfachen’ Aussagesatzes wie „Sokrates ist weise“, „Ein Mensch geht spazieren“ oder „Der Durchschnittsbürger trinkt so und so viel Bier“, dann betrifft die erreichte Differenzierung in erster Linie das Prädikat und den ontologischen Status des dadurch ausgedrückten Attributs. Indes sind auch auf der Seite des Subjekts Unterscheidungen nötig. Denn wie Aristoteles ausführt, entsteht der beschriebene Schein auch dort, wenn man die Bedeutung von Subjektsausdrücken aller Art verdinglicht. Nach Maßgabe des zweiten der drei Beispiele könnte man dann nämlich den viel diskutierten tri¬tow anqrvpow (‘Dritten Menschen’) einführen, der gegen alle Grammatik weder die Idee des Menschen noch ein bestimmter Mensch wäre, sondern einfach nur ‘ein Mensch’ und nichts sonst (vgl. Soph. El. 22, 178 b 36 ff; Metaph. Z 13, 1038 b 34 ff). Und nach Maßgabe des dritten Beispiels müßten zu jedem beliebigen allgemeinen Ausdruck platonische Ideen angenommen werden, die bei näherem Zusehen ganz entbehrlich sind (vgl. Metaph. M 9, 1086 a 31⫺b 2). Mit dieser Kritik an der Ideenlehre Platons beginnt, was die fernere Zukunft anlangt, die Vorgeschichte des Universalienstreits (vgl. Art. 49 § 10.2. und Art. 52 § 5.). Da die Kategorienlehre einen wesentlichen Zusammenhang zwischen Fragen und Aussagen herstellt, hätte es vielleicht nahegelegen, auch über die Fragen und die anderen Formen der Rede ausführlicher nachzudenken. Das hat Aristoteles leider nicht getan, sie vielmehr nur in die Poetik oder Rhetorik verwiesen (De interpr. 4, 17 a 2⫺7). Ebenso wenig hat er, was vielleicht auch zu erwägen gewesen wäre, den Sprachbenutzer stärker in die Aussagentheorie einbezogen. Zwar geht er ins Verständnis der Prädikation und der Kategorien ein; aber was der Umstand, daß die Aussage die an einen Hörer gerichtete Rede eines Sprechers ist, für ihren Begriff ausmachen könnte, wird nicht ausgelotet. Nichtsdestoweniger baut Aristoteles die pragmatische Dimension der Rede ein Stück weit aus und überläßt es der Interpretation, wie die Aussagen oder überhaupt die Formen der Rede darin als Sprechakte zurückgebunden werden
VII. Griechische und Römische Antike
könnten. In der Rhetorik unterbreitet er nämlich ansatzweise ein Modell der sprachlichen Kommunikation, das zum Schluß kurz skizziert werden soll: Für eine Rede im Sinne der Rhetorik braucht man dreierlei, einen Redner, einen Gegenstand und eine Zuhörerschaft, wobei letztere sich zu dem behandelten Gegenstand auf die eine oder andere Weise verhalten soll und deswegen für die Konzeption der Rede maßgeblich ist. Daraus leitet Aristoteles drei Redegattungen her, die Beratungs-, die Gerichts- und die Festrede, die sich sowohl in der allgemeinen Redesituation als auch in wichtigen Einzelheiten unterscheiden. Denn in jeder Gattung verfolgt die Rede einen charakteristischen Gesichtspunkt und soll der Zuhörer zu einem typischen Verhalten bewogen werden; die das Verhalten empfehlende Stellungnahme des Redners muß dem entsprechen; und weil der Gegenstand der Rede alle diese Einstellungen erlauben muß, muß er im Verhältnis zum Zeitpunkt der Rede unter Umständen vergangen oder zukünftig sein. In der Beratungsrede beispielsweise geht es um das Nützliche oder Schädliche; der Zuhörer soll eine Entscheidung treffen, und der Redner muß zu- oder abraten; dies alles setzt voraus, daß der Gegenstand, um den es geht, zukünftig ist. Bei der Gerichtsrede sind die vier Punkte so bestimmt: Gerechtes/Ungerechtes; urteilen; anklagen/verteidigen; vergangen ⫺ und bei der Festrede so: Ehrenvolles/Tadelnswertes; zur Kenntnis nehmen; loben/tadeln; der Zeitpunkt des besprochenen Gegenstandes ist beliebig (Rhet. A 3, 1358 a 36 ff). 3.2.3. Die Stoiker In der Akademie des Xenokrates (Schulhaupt 339⫺312 v. Chr.) wurde die Philosophie in drei Teile geordnet, in Logik, Ethik und Physik. Die Stoiker knüpften an diese Tradition an und erörterten deshalb alle sprachtheoretischen Fragen in der Logik, vor allem in der Dialektik, die neben der Rhetorik das zweite Teilgebiet dieses Zweigs der Philosophie war (vgl. Art. 42 § 2.1.4.). Damit wurde die Sprache erstmals zusammenhängend studiert und in einer einigermaßen geschlossenen Theorie expliziert (FDS 1; vgl. Hülser 1979, 284⫺ 286). Allerdings hat diese Theorie im Laufe mehrerer Stoikergenerationen auch erhebliche Wandlungen durchgemacht, und was uns davon heute noch an Fragmenten vorliegt, vermittelt kaum noch einen Eindruck von der Genese der stoischen Auffassungen und von der Lebendigkeit der Diskussion. Wichtige
40. Zeichenkonzeptionen in der Philosophie
Grundlinien der stoischen Sprachtheorie sind jedoch noch gut zu erkennen; auch läßt sich noch zeigen, daß die Stoiker aristotelische Gedanken erst verhältnismäßig spät aufgegriffen haben (vgl. die Stimmdefinitionen des Diogenes v. Babylon: § 3.1.1.) und daß sie vorher eher an Platon und an die Dialektische Schule anknüpften. Von dem vielen, was sie zur Sprachphilosophie und speziell zur Semantik beigetragen haben, streifen wir kurz die Etymologie und bereiten dann mit einer Skizze zur Ontologie den Übergang zum Kernstück vor, der Lektontheorie. ⫺ Mit dem, was in § 3.1.3. von der Sprachentstehungslehre der Stoiker berichtet wurde, ist auch schon das Entscheidende über ihre Etymologie gesagt (FDS 639⫺680; 73 f; 560⫺562; 921; dazu Barwick 1957, 29⫺79; Pinborg 1962, 161⫺165; Pfaffel 1981, 17⫺ 31). Denn obwohl die Stoiker in der Sprachgeschichte auch Brüche einräumten und für ihre Erforschung mit Informationslücken rechneten, erklärten sie, daß die Wörter im Prinzip alle auf eine Entstehungssituation zurückgeführt werden könnten, die sich durch ihre unhintergehbare Ursprünglichkeit selbst ausweise. Natürlich erscheinen uns die einzelnen Etymologien vielfach als gezwungen oder willkürlich, jedenfalls nicht als methodisch akzeptabel. Jedoch sollen sie aufweisen, daß die Lautgestalt der Wörter auf einen wichtigen Aspekt der bezeichneten Dinge hinweist, durch den sie zugleich motiviert und gerechtfertigt ist. Außerdem ist das Programm mit einer Wortbildungs- und einer Flexionslehre verknüpft, die die Vielfalt der für jedermann offensichtlichen Wortzusammensetzungen und Wortableitungen zu handhaben gestatten, bevor der methodisch fragwürdige Teil der Suche nach der wahren Wortbedeutung (‘Etymologie’) beginnt. Schließlich erscheint die stoische Lehre zwar so, als nehme sie den alten Streit um die Richtigkeit der Namen wieder auf und vertrete eine klassische fy¬seiThese. Aber sie behauptet nicht, daß die bezeichneten Dinge unmöglich andere Urwörter ‘provoziert’ haben könnten, und räumt der Gegenthese in Gestalt der Sprachgeschichte einen beachtlichen Raum ein. Deshalb läßt die stoische Etymologie sich auch als eine neue Art verstehen, den fy¬sei/qe¬seiStreit beizulegen. Jedenfalls benötigen die Stoiker ihre natürliche Richtigkeit der Bezeichnungen nicht, um damit den Sachbezug und die Wahrheit der Rede aufzuklären. In der Ontologie (s. FDS 315 ff; 699⫺753; dazu Long und Sedley 1987, § 27.⫺30.) setz-
855 ten auch die Stoiker sich nicht zuletzt mit Platon auseinander, aber anders als Aristoteles. Sie entwickelten ihre Alternative vom Begriff des Körpers aus, den sie als ein dreidimensionales Gebilde mit Widerständigkeit definierten und der daher auf anderes Wirkungen ausüben oder auf den von anderem eingewirkt werden kann. So wurde in Abrede gestellt, daß Unkörperliches Wirkungen ausüben könne. Als nächstes legte man fest, daß nur ein Körper etwas Seiendes sei, und bestritt dadurch, daß etwas schon allein aufgrund seiner begrifflichen Bestimmtheit, Einheit und Denkbarkeit als etwas Seiendes betrachtet werden dürfe. Was deshalb die Semantik allgemeiner Ausdrücke betrifft, so bezeichnen diese Ausdrücke, von welcher Art sie auch sein mögen, nicht als solche etwas Seiendes, sondern müssen in ihrem kognitiven Gehalt vollständig auf die individuellen Gegenstände, die Körper, zurückgeführt werden, aus denen das Universum allein besteht. Dabei denken die Stoiker vor allem an diejenigen allgemeinen Ausdrücke, die in unseren Sätzen als grammatische Subjekte vorkommen, an Ausdrücke wie „Pferd“, „Mensch“, „Europäer“, „Heer“, „Volksversammlung“, „Gymnasium“, „Durchschnittsbürger“ u. a. m. Alle diese Ausdrücke sind hinsichtlich ihres Realitätsgehaltes entbehrlich und haben in ihrer Allgemeinheit nur den Status von Fiktionen. Was sie als Fiktionen repräsentieren, sind bloß, wie die Stoiker sagen, Quasi-Etwasse, die im Unterschied zu Platons Ideen keinerlei Folgen in der Wirklichkeit haben. In der stoischen Ontologie bilden sie eine von den Körpern verschiedene Klasse. Unter unseren Ausdrücken, Begriffen und Vorstellungen kommen allerdings einige vor, die sich nicht auf körperliche beziehungsweise auf seiende Individuen zurückführen lassen und sich trotzdem auf etwas beziehen, was an solchen Individuen auftritt und in dieser Weise zur Konstitution der Realität gehört. Das sind die unkörperlichen Etwasse, die zwar keine Wirkungen ausüben und die auch nicht ‘sind’ („eiÓnai“), die aber in Abhängigkeit von Körpern Bestand haben und ‘subsistieren’ („y«festa¬nai“), wie die Stoiker sich ausdrücken. Solche Etwasse sind der Ort, das Leere, die Zeit und schließlich das Lekton, das Herzstück der stoischen Semantik. Die stoische Ontologie geht also von materiellen Gegenständen und ihren Wechselwirkungen aus und unterscheidet dann dreierlei: körperliche Etwasse, unkörperliche Etwasse und Quasi-Etwasse, die weder kör-
856 perlich noch unkörperlich sind, weder ‘sind’ noch ‘subsistieren’. Das lekto¬n (Lekton, d. h. das ‘Gesagte’ oder ‘Sagbare’), wird in den Quellen auch gern dem shmaino¬menon (‘Bezeichnetes, Bedeutung’) und dem pra˜ gma (‘intendierte Sache’) gleichgestellt (z. B. FDS 67; 696). Es ist, wie gesagt, eins der vier unkörperlichen Etwasse. Ich überspringe die Gründe für diese Klassifizierung, verzichte auch auf eine Erläuterung der Definition, daß es to¡ kata¡ logikh¡n fantasi¬an y«fista¬menon sei: „das, was nach Maßgabe einer vernünftigen (redetauglichen) Vorstellung subsistiert“ (FDS 33; 696; 699; auch 67), und komme sofort zur Extension des Lektonbegriffs. Die Lekta sind teils vollständig („ayœtotelh˜ “), teils unvollständig („eœlliph˜ “) (FDS 696; 699; s. a. 33; 695). Vollständige Lekta sind die Aussagen, Entscheidungs- und Bestimmungsfragen, Aufforderungen, Eide und anderes mehr, also in erster begrifflicher Annäherung die Bedeutungen der zum Vollzug (vollständiger) illokutionärer Sprechakte eingesetzten Reden. Unvollständige Lekta sind die kathgorh¬mata (‘Prädikate’), d. h. die Bedeutungen der Verbphrasen. Nun haben die meisten Stoaforscher die Liste der unvollständigen Lekta erweitert, so daß entweder die Bedeutungen aller sinnvollen Wörter unvollständige Lekta sind oder doch wenigstens außer den Prädikaten die sogenannten ptv¬seiw (Kasus), mit denen zusammen die Prädikate nämlich Aussagen bilden; Kasus im Sinne der Stoiker wären dann die Bedeutungen der grammatischen Subjekte unserer Sätze. Inauguriert von A. A. Long (1971, 78; 104⫺106; 1974, 135 f; Long und Sedley 1987, I 200) gewinnt dagegen neuerdings die Aufassung an Boden, daß die überlieferte Liste unvollständiger Lekta abgeschlossen sei und nicht erweitert werden dürfe. Diese Einschätzung scheint richtig zu sein und die besseren Gründe für sich zu haben. Um sie zu unterstützen, muß es an dieser Stelle genügen, an die stoischen Etymologien (siehe § 3.2.3. und § 3.1.3.) zu erinnern; die dabei angenommene Wortentstehungssituation setzt voraus, daß die Bedeutungen der Nomina Körper sind (Onomatopöie!), also keine Lekta. Wenn daher allein die Prädikate unvollständige Lekta sind, haben das grammatische Subjekt unserer Sätze einerseits und die Verbphrase andererseits Bedeutungen mit unterschiedlichem ontologischen Status. Zwischen den Nominal- und den Verbphrasen besteht nach den Stoikern ähnlich wie nach Aristoteles und im Gegen-
VII. Griechische und Römische Antike
satz zu Platon eine wesentliche semantische Asymmetrie. Deshalb ist es auch, wie Seneca im Sinne der Stoiker betont, ein himmelweiter Unterschied, ob man einen Gegenstand lediglich nennt oder ob man darüber spricht (FDS 892). Daß die Prädikate nur unvollständige Lekta sind, beruht darauf, daß sie nicht auf irgendetwas referieren, sondern eine entsprechende Leerstelle haben, wohingegen vollständige Lekta kein solches Defizit aufweisen. So sind die Prädikate im Sinne der Stoiker ergänzungsbedürftige Funktionen im Sinne G. Freges (vgl. Art. 106). Damit daraus Aussagen werden, müssen in die Leerstellen ‘Kasus’ eingesetzt werden, d. h. Wörter bzw. Nominalphrasen in einem bestimmten grammatischen Fall; ohne selber etwas ‘Gesagtes’ zu sein, verschaffen sie dem bis dahin unvollständigen ‘Gesagten’ die nötige Referenz. Die Sätze schließlich haben in dieser Konzeption ebenfalls keine dinglich-körperliche Bedeutung, sondern bezeichnen ein unkörperliches Lekton, die Aussage, die entweder wahr oder falsch ist. Auch die Stoiker sind zum Begriff des Sachverhalts vorgestoßen und haben erkannt, daß das kein konkreter Gegenstand ist, sondern ein abstrakter (vgl. FDS 874; 887; Long 1971, 88⫺94; Bobzien 1986, 15⫺17; 25⫺28). Schließlich ist in die ganze Theorie eine Syntax eingearbeitet, freilich mehr auf der Ebene der Bedeutungen als auf der des sprachlichen Zeichens. Diese Syntax ist dank der stoischen Unterscheidung dreier nominaler Wortarten und mehrerer Prädikatarten sehr differenziert und hält modernen Ansprüchen stand; sie läßt sich auch als förmliches Regelwerk darstellen (siehe Egli 1986, 283⫺304). In der dritten Beschreibung des sprachlichen Zeichens (§ 3.1.1.) bildeten die segmentierbaren Laute mit Bedeutung den dritten Komplexitätsgrad. Die Stoiker nannten diese Laute durchweg „lo¬gow“ (‘Rede’) und teilten sie anscheinend nicht weiter ein wie Aristoteles (FDS 476). Nachdem es aber nicht möglich ist, die Liste der unvollständigen Lekta zu erweitern, muß eine Rede, die ein Lekton bedeutet, stärkeren Anforderungen genügen als nur der, eine Bedeutung zu haben. Sie muß darüber hinaus mindestens ausgeprägte syntaktische Züge besitzen, und ihr Begriff muß ein syntaktisches Merkmal aufweisen; sonst wären die Prädikate keine Funktionen im Sinne Freges und könnte es keine Syntax der Lekta geben. Doch muß dieser Redebegriff auch pragmatisch bestimmt sein, dies zumindest dann, wenn das von der Rede be-
40. Zeichenkonzeptionen in der Philosophie
zeichnete Lekton ein vollständiges sein soll. Denn (a) sind uns von einem Teil der vollständigen Lekta die Definitionen erhalten, und die haben auffallend häufig die Form: „Dadurch, daß wir das vollständige Lekton x sagen, x-en wir“ (FDS 874 ff). Besonders instruktiv ist (b) die Anrede, z. B. „Tapferster Atride, Herrscher der Menschen, Agamemnon“ (FDS 874). Sie gilt als vollständiges Lekton, obwohl sie kein unvollständiges Lekton enthält. Die in ihr vorkommenden Wörter bedeuten zwar allesamt keine Lekta; aber indem sie zur Anrede gebraucht werden, bedeuten sie ein vollständiges Lekton. Demnach setzt dieses einen sprachpragmatisch ausgerichteten Redebegriff voraus. Man kann (c) auf die hypothetische Annahme und auf die Ekthese verweisen, zwei vollständige Lekta, deren Unterschied nur pragmatisch einsichtig zu machen ist (vgl. FDS 874; 897 ff). Ob nämlich „Dies sei eine Gerade“ normativ als Ekthese oder hypothetisch als diskussionsbedürftige Annahme zu verstehen ist, hängt von dem jeweiligen Verwendungszusammenhang in der Geometrie ab. Die soweit aufgewiesene pragmatische Dimension der Lekta und der sie bezeichnenden Rede spielt möglicherweise auch in die schwer zu deutende stoische Definition der Aussage („aœji¬vma“) hinein (vgl. Bobzien 1986, 11⫺13). Sie weiter auszuloten, steht noch aus, scheint nach den Ansätzen von Schenkeveld (1984, 326⫺331) aber aussichtsreich zu sein.
4.
Von der Antike zum Mittelalter
Mit Augustinus (354⫺430 n. Chr.) und Boethius (480⫺524 n. Chr.) klingt die Antike aus. Beide haben viel antikes Gedankengut aufgenommen und es der Nachwelt auf sehr unterschiedliche Weise vermittelt. So war es auch in bezug auf zeichentheoretische Fragen. Da haben sie ebenfalls alte Lehrstücke so verarbeitet, daß daraus neue Anregungen hervorgingen. Zum Schluß soll deshalb noch auf ihre Beiträge zur Semiotik eingegangen werden (vgl. auch Art. 49 § 2.). 4.1. Augustinus Nach den Untersuchungen von C. P. Mayer (1969⫺1974) spielten die Zeichen im weitesten Sinne des Wortes in der geistigen Entwicklung und in der Theologie Augustinus eine außerordentlich große Rolle; das drückte sich auch in einer reich differenzierten Termi-
857 nologie für verschiedene Arten von Zeichen aus. Insgesamt erscheint Augustinus „als der größte Semiotiker der Antike […] und zugleich als der eigentliche Begründer dieser Forschungsrichtung“ (Coseriu 1975, 123). Dabei hat er mehrere Traditionen aufgenommen. Genannt seien der griechische und lateinische Sprachgebrauch (vgl. § 1.), die shmei˜on-Theorien der Philosophen und Rhetoren (vgl. § 2.), die Sprachlehre der Stoiker (vgl. § 3.2.3.; Baratin 1981) und Plotin. Dieser hatte in den Schriften, die Augustinus mit Sicherheit früh von ihm gelesen hat (Enn. I, 6; V,1), Aufstiege zum All-Einen beschrieben, denen als ontologisches Prinzip die Emanation zugrunde lag und bei denen jede niedere Stufe des Seienden auf eine höhere verwies. Augustinus hat sich das Muster solcher Aufstiege angeeignet (etwa Confess. IX,10) und wird von daher ebenfalls angeregt worden sein, seine Reflexionen in ausgeprägt zeichentheoretischen Termini zu entwickeln. Wie auch die Wortstatistiken belegen (Mayer 1969, 37; 1974, 44), haben von diesen Termini imago (‘Bild’), similitudo (‘Ähnlichkeit’) und sacramentum (‘Sakrament’) eine beachtliche Häufigkeit. Aber der bei weitem wichtigste Terminus ist für uns der des signum (‘Zeichen’). Wie Augustinus das Zeichen definierte und daß er mit diesem Begriff die Sprache deutete, wissen wir schon (§ 3.1.2.); das Mittelalter ist ihm in beiden Punkten gefolgt (vgl. Art. 49 § 4.1., Art. 52 § 1. und Art. 53 § 1.1.). Darüber hinaus hat er in dem Dialog De magistro auch die Zeichen überhaupt eingeteilt. Das Ergebnis dieser in die Diskussion eingestreuten Bemühungen läßt sich mit Coseriu (1975, 128 f) folgendermaßen systematisieren: Die Zeichen sind entweder deiktisch oder bezeichnend. Deiktische Zeichen sind insbesondere Zeigegesten wie das Ausstrecken des Fingers, aber auch deiktische Wörter; sie zeigen mehr einen Zeigevorgang als die gezeigten Sachen (De mag. X,34). Die bezeichnenden Zeichen unterteilen sich einerseits in die verba (Worte), andererseits in sonstige Zeichen. Zu den letzteren gehören etwa die Buchstaben und alle nichtsprachlichen bezeichnenden Zeichen, vor allem die militärischen (De mag. IV,9). Dagegen gliedern sich die bezeichnenden Zeichen vom Typ der verba in Zeichen für andere Zeichen und in Zeichen für Sachen, die ihrerseits keine Zeichen sind (De mag. IV,7). Die Worte, welche Zeichen für andere Zeichen sind, können wiederum in zwei Klassen unterteilt werden. Dann steht auf der einen Seite die „sprachli-
858 che Metasprache“ (Coseriu); sie umfaßt Wörter wie z. B. Sprache, Nomen, Pronomen, Verb, Konjunktion usw., durch die sprachliche Gegebenheiten bezeichnet werden. Auf der anderen Seite steht die „Metasprache der Rede“ (Coseriu); sie bezeichnet die Sprache als bezeichnende Wirklichkeit und umfaßt alle Wörter, mit denen über sie selbst als bezeichnende gesprochen wird, z. B. das erste Wort in den Sätzen „‘Nomen’ ist ein Nomen“ und „‘Fluß’ bezeichnet ein bestimmtes Gewässer“. Augustinus kennt beide Arten der Metasprache, unterscheidet sie aber nicht klar, sondern behandelt sie zum Teil durcheinander. Deshalb sieht Coseriu die Unterscheidung von Sprache und Metasprache hier noch nicht voll ausgebildet, aber immerhin deutliche Ansätze zu dieser Unterscheidung. Außerdem wurde die noch unausdrückliche zweite Art der Metasprache von Augustinus doch so ausführlich dargestellt, daß diese Behandlung als Vorbote der mittelalterlichen Suppositionslehre gelten darf (1975, 133 f; siehe Art. 52 § 3.⫺5.). 4.2. Boethius Boethius sah es als seine Aufgabe an, die philosophische Literatur im lateinischen Sprachbereich auf den Stand zu bringen, den sie damals bei den Griechen erreicht hatte. Er wollte diese Aufgabe von Grund auf neu angehen, also zu einer kompletten Serie grundlegender Quellentexte Übersetzungen anfertigen und in Gestalt von Kommentaren und Monographien die erforderlichen Hilfsmittel für die Lektüre bereitstellen, darunter auch eine Arbeit zur Verträglichkeit der aristotelischen und der platonischen Philosophie (In Aristotelis De interpr. II a ed. p. 79 f Meiser; Ebbesen 1987, 287 f). Wegen seines frühzeitigen Todes konnte er nur einen kleinen Teil des Vorhabens verwirklichen, nämlich nur den größten Teil von Aristoteles’ Organon und Porphyrios’ Einleitung übersetzen sowie einige Kommentare und Monographien schreiben. Das meiste davon ist erhalten. Es verrät allerdings wenig Originalität; denn Boethius hat praktisch alles aus griechischen Quellen übernommen, wenn auch anzuerkennen ist, daß er dabei einer gängigen Praxis folgte und aus dem zur Verfügung stehenden Material gelegentlich kritisch auswählte (dazu Chadwick 1981, 129⫺131; Ebbesen 1987, 289 ff). Jedenfalls war er kein origineller Logiker; vielmehr wollte er lediglich eine traditionelle peripatetische Logik vermitteln (Barnes 1981, bes. 84). Mit seiner Neigung zu
VII. Griechische und Römische Antike
einer platonischen Ontologie und mit der Meinung, daß die aristotelische und die platonische Philosophie verträglich seien, gerät diese Absicht allerdings da in Konflikt, wo die beiden kaum zu versöhnen sind, nämlich in der Frage nach dem ontologischen Status von Gattungen, Arten und anderen allgemeinen Begriffen, kurz: von Universalien. Hierzu hat Boethius nicht eindeutig Stellung bezogen, sondern sich dazu mit wechselnden Quellen teils aristotelisch und teils platonisch geäußert (Genaueres darüber, wie er wo spricht, z. B. bei Chadwick 1981, 124; 130; 133; 147 f; 215). Diese Unentschiedenheit wurde bei seinen Lesern zum Ausgangspunkt des Universalienstreits (vgl. Art. 49 § 10.2. und Art. 52 § 5.). Die griechischen Autoren, deren Kultur Boethius den Lateinern vermitteln wollte, sind uns heute zum größten Teil unmittelbar zugänglich; von seiner immensen Mühe haben wir wenig Gewinn. Seine eigentliche Bedeutung liegt daher in seinem Einfluß auf das Mittelalter (vgl. Art. 49 § 2.2.). Durch sein Werk hat er als einziger dafür gesorgt, daß das Organon des Aristoteles im Westen nicht völlig in Vergessenheit geriet. Allerdings fanden die Arbeiten des Boethius erst knapp 300 Jahre später Eingang in den Schulbetrieb, als Alkuin von York in Aachen Karl den Großen in die Dialektik einführen wollte und dabei auf einige Schriften des Boethius zurückgriff. Was er von ihm im einzelnen benutzte und wie die Boethius-Lektüre während der folgenden Jahrhunderte allmählich umfangreicher wurde, hat Lewry (1981) sorgsam nachgezeichnet. Hier genügt es festzuhalten, daß Boethius seit Alkuin die „logica vetus“ prägte, d. h. die Logik des Frühmittelalters bis zum Bekanntwerden weiterer Schriften des Aristoteles in der Mitte des 12. Jahrhunderts. Diese Logik stützte sich nur auf die folgenden Quellen bzw. Werke des Boethius: auf seine Übersetzungen von Aristoteles’ Kategorien und De interpretatione sowie von Porphyrios’ Einleitung, auf seine Kommentare zu diesen Schriften und auf seine fünf logischen Monographien. Das war dürftig. Aber die Universalienfrage wurde erkannt und kontrovers angegangen, bis sie durch Abaelard (1079⫺1142) eine neue Qualität bekam (vgl. Art. 49 § 4. und Art. 52).
5.
Literatur (in Auswahl)
Anaximenes (⫽ Pseudo-Aristoteles), Ars rhetorica quae vulgo fertur Aristotelis ad Alexandrum, ed. M. Fuhrmann. Leipzig: Teubner 1966.
40. Zeichenkonzeptionen in der Philosophie Arens, Hans (1984), Aristotle’s Theory of Language and Its Tradition: Texts from 500 to 1750, Selection, Translation and Commentary. Amsterdam und Philadelphia: Benjamins. (Studies in the History of Linguistics 29) Aristoteles, Categoriae et Liber de interpretatione, ed. L. Minio-Paluello. Oxford: University Press 1949. (OCT) Aristoteles, Analytica priora et posteriora, ed. W. D. Ross, mit einer Einleitung und einem Anhang von L. Minio-Paluello. Oxford: University Press 1964. Verbesserter Nachdruck 1968. (OCT) Aristoteles, Topica et Sophistici elenchi, ed. W. D. Ross. Oxford: University Press 1958. Jeweils verbesserte Nachdrucke 1963 und 1970, 1974. (OCT) Aristoteles, De anima, ed. W. D. Ross. Oxford: University Press 1956. (OCT) Aristoteles, Parva naturalia, ed. W. D. Ross. Oxford: University Press 1955. Aristoteles, Historia animalium, ed. P. Louis. Vol. I⫺III. Paris: Socie´te´ d’E´dition „Les Belles Lettres“ 1964. Aristoteles, Metaphysica, ed. W. Jaeger. Oxford: University Press 1957. (OCT) Aristoteles, Ars rhetorica, ed. R. Kassel. Berlin und New York: de Gruyter 1976. Aristoteles, De arte poetica liber, ed. R. Kassel. Oxford University Press 1965. (OCT) Aubenque, Pierre (1967), „Aristote et le langage“. Annales de la faculte´ des lettres et sciences humaines d’ Aix-de-Provence, Serie classique 43, 85⫺105. Augustinus, A., Confessiones, ed. M. Skutella. Leipzig: Teubner 1934. 2., verbesserte Aufl. von H. Jürgens und W. Schaub, Stuttgart 1969. Augustinus, A., De dialectica, mit einer englischen Übersetzung, Einleitung und Anmerkungen von B. D. Jackson, ed. J. Pinborg. Dordrecht und Boston: Reidel 1975. Augustinus, A., De doctrina Christiana (libri quattuor), ed. H. J. Vogels. Bonn: Hanstein 1930. (Florilegium Patristicum 24) Augustinus, A., De magistro. De vera religione, ed. P. Domenico Bassi. Florenz: Edizione Testi Cristiani 1930. Ax, Wolfram (1986), Laut, Stimme und Sprache. Studien zu drei Grundbegriffen der antiken Sprachtheorie. Göttingen: Vandenhoeck und Ruprecht. (Hypomnemata 84) Baratin, Marc (1981), „Les origines stoı¨ciennes de la the´orie Augustinienne du signe“. Revue des E´tudes Latines 59, 260⫺268. Barnes, Jonathan (1981), „Boethius and the Study of Logic“. In: M. Gibson (ed.), Boethius. His Life, Thought and Influence. Oxford: Basil Blackwell, 73⫺89. Barnes, Jonathan (1982), The Presocratic Philosophers. London: Routledge und Kegan Paul. Erstausgabe 1979.
859 Barwick, Karl (1957), Probleme der stoischen Sprachlehre und Rhetorik. Berlin: Akademie Verlag. (Abhandlungen der Akad. d. Wiss. zu Leipzig, Philol.-hist. Kl. 49,3) Belardi, Walter (1975), Il linguaggio nella filosofia di Aristotele. Rom: Univ. degli Studi di Roma/ Libreria editrice. Bobzien, Susanne (1986), Die stoische Modallogik. Würzburg: Königshausen und Neumann. Bochen´ski, Josef M. (1956), Formale Logik. Freiburg und München: Alber. Boethius, A. M. S., In librum Aristotelis De interpretatione ⫺ secunda editio, ed. C. Meiser. Leipzig: Teubner 1880. Bonitz, Hermann (1870), Index Aristotelicus. Berlin: Reimer. Repr. Darmstadt: Wiss. Buchgesellschaft 1955. Burnyeat, Myles F. (1982), „The Origins of NonDeductive Inference“. In: J. Barnes et al. (eds.), Science and Speculation. Studies in Hellenistic Theory and Practice. Cambridge, England: University Press, 193⫺238. Calogero, Guido (1936), „Eraclito“. Giornale critico della filosofia italiana, Serie 2, Vol. 4, 195⫺224. Calogero, Guido (1977), Studi sull’eleatismo. Florenz: „La Nuova Italia“ Editrice. Erstausgabe Rom 1932. Chadwick, Henry (1981), Boethius. The Consolations of Music, Logic, Theology and Philosophy. Oxford: Clarendon Press. Cicero, M. Tullius, Rhetorici libri duo qui vocantur De inventione, ed. E. Stroebel. Leipzig: Teubner 1915; Stuttgart 1965. Pseudo-Cicero (Incerti Auctoris), De ratione dicendi ad C. Herennium, ed. G. Achard. Paris: Les Belles Lettres 1989. Colish, Marcia L. (1968), The Mirror of Language. A Study in the Medieval Theory of Knowledge. New Haven und London: Yale University Press. Colish, Marcia L. (1983), „The Stoic Theory of Verbal Signification and the Problem of Lies and False Statements from Antiquity to St. Anselm“. In: L. Brind’ Amour und E. Vance (eds.), Arche´ologie du signe. Toronto: Pontifical Institute of Mediaeval Studies, 17⫺43. Coseriu, Eugenio (1975), Die Geschichte der Sprachphilosophie von der Antike bis zur Gegenwart. Eine Übersicht. Teil I: Von der Antike bis Leibniz. Tübingen: Narr. Erstausgabe 1969. (Tübinger Beiträge zur Linguistik 11) De Lacy, Phillip H. und Estelle A. De Lacy (1978), Philodemus: On Methods of Inference. Edited with Translation and Commentary. Neapel: Bibliopolis. Derbolav, Josef (1972), Platons Sprachphilosophie im ‘Kratylos’ und in den späteren Schriften. Darmstadt: Wiss. Buchgesellschaft. Diels, Hermann, Die Fragmente der Vorsokratiker. Griechisch und Deutsch. Berlin 1903. 2. Aufl. in
860 3 Bdn. (davon der dritte neu). 1906/1907/1912, 4. Aufl. mit Nachträgen (z. T. von Walter Kranz) 1922, ab 5. Aufl. (1934⫺1938) ed. W. Kranz, 6. verbesserte Aufl. 1951/1952, seither zahlreiche unveränderte Neuauflagen. (⫽ D.-K.) Diogenes, Lae¨rtius, Vitae philosophorum, ed. H. S. Long. Vol. I⫺II. Oxford: Clarendon Press 1964. (OCT) Pseudo-Dionysius Thrax, Ars grammatica ⫺ Supplementa Artis Dionysianae vetusta, ed. G. Uhlig. Leipzig 1883. Nachdruck Hildesheim: G. Olms 1965. (Grammatici Graeci I/I) Ebbesen, Sten (1987), „Boethius as an Aristotelian Scholar“. In: J. Wiesner (ed.), Aristoteles. Werk und Wirkung. P. Moraux gewidmet. Berlin und New York: de Gruyter. Band 2, 286⫺311. Ebert, Theodor (1987), „The Origin of the Stoic Theory of Signs in Sextus Empiricus“. Oxford Studies in Ancient Philosophy 5, 83⫺126. Egli, Urs (1986), „Stoic Syntax and Semantics“. Historiographia Linguistica 13, 281⫺306. Frede, Michael (1977), „The Origins of Traditional Grammar“. In: R. E. Butts und J. Hintikka (eds.), Proceedings of the Fifth International Congress of Logic, Methodology, and Philosophy of Science. London/Ontario, Canada 1975; pt. 4. Dordrecht und Boston: Reidel, 51⫺79. Frede, Michael (1978), „Principles of Stoic Grammar“. In: J. M. Rist (ed.), The Stoics. Berkeley, Los Angeles und London: University of California Press, 27⫺75. Gaiser, Konrad (1974), Name und Sache in Platons „Kratylos“. Heidelberg: C. Winter Universitätsverlag. (Abhandlungen der Heidelberger Akademie der Wiss., Philos.-hist. Kl. 1974, 3) Glidden, David (1983), „Skeptic Semiotics“. Phronesis 28, 213⫺255. Graeser, Andreas (1977), „On Language, Thought, and Reality in Ancient Greek Philosophy“. Dialectica 31, 359⫺387. Graeser, Andreas (1978), „The Stoic Theory of Meaning“. In: J. M. Rist (ed.), The Stoics. Berkeley, Los Angeles und London: University of California Press, 77⫺100. Heinimann, Felix (1987), Nomos und Physis. Herkunft und Bedeutung einer Antithese im griechischen Denken des 5. Jahrhunderts. Darmstadt: Wiss. Buchgesellschaft. Erstausgabe Basel 1945. Heitsch, Ernst (1970), Gegenwart und Evidenz bei Parmenides. Aus der Problemgeschichte der Äquivokation. Abhandlungen der Akademie der Wiss. und der Literatur in Mainz. Geistes- und sozialwiss. Kl., Jg. 1970, Nr. 4. Held, Klaus (1980), Heraklit, Parmenides und der Anfang von Philosophie und Wissenschaft. Eine phänomenologische Besinnung. Berlin und New York: de Gruyter.
VII. Griechische und Römische Antike Hermagoras ‹Temnites›: Hermagorae Temnitae testimonia et Fragmenta adiuncta et Hermagorae cuiusdam discipuli Theodori Gadarei et Hermagorae minoris fragmentis collegit Dieter Matthes. Leipzig: Teubner 1962. Hülser, Karlheinz (1979), „Expression and Content in Stoic Linguistic Theory“. In: R. Bäuerle, U. Egli und A. v. Stechow (eds.), Semantics from Different Points of View. Berlin, Heidelberg und New York: Springer, 284⫺303. Hülser, Karlheinz (1987⫺88), Die Fragmente zur Dialektik der Stoiker. Neue Sammlung der Texte mit deutscher Übersetzung und Kommentaren. 4 Bände. Stuttgart: Frommann-Holzboog. (⫽ FDS) Kapp, Ernst (1968), „Die Kategorienlehre in der aristotelischen Topik“. Habil.-Schrift München 1920. In: Ausgewählte Schriften, ed. H. und I. Diller. Berlin: de Gruyter, 215⫺253. Kretzmann, Normann (1974), „Aristotle on Spoken Sound Significant by Convention“. In: J. Corcoran (ed.), Ancient Logic and Its Modern Interpretations. Proceedings of the Buffalo Symposium on Modernist Interpretations of Ancient Logic, 21 and 22 April, 1972. Dordrecht: Reidel, 3⫺21. Larkin, Miriam Th. (1971), Language in the Philosophy of Aristotle. Den Haag und Paris: Mouton. Lewry, Osmund (1981), „Boethian Logic in the Medieval West“. In: M. Gibson (ed.), Boethius. His Life, Thought and Influence. Oxford: Basil Blackwell, 90⫺134. Lieb, Hans-Heinrich (1981), „Das ,semiotische Dreieck‘ bei Ogden und Richards: eine Neuformulierung des Zeichenmodells von Aristoteles“. In: H. Geckeler u. a. (eds.), Logos Semantikos. Studia linguistica in honorem Eugenio Coseriu 1921⫺1981. Berlin und New York: de Gruyter sowie Madrid: Editorial Gredos, Vol. I, 137⫺156. Lloyd, Antony C. (1978), „Definite Propositions and the Concept of Reference“. In: J. Brunschwig (ed.), Les Stoı¨ciens et leur logique. Actes du colloque de Chantilly, 18⫺22 sept. 1976. Paris: J. Vrin, 285⫺295. Long, Anthony A. (1971), „Language and Thought in Stoicism“. In: A. A. Long (ed.), Problems in Stoicism. London: The Athlone Press, 75⫺113. Long, Anthony A. (1974), Hellenistic Philosophy. Stoics, Epicureans, Sceptics. London: Duckworth. Long, Anthony A. und David N. Sedley (1987), The Hellenistic Philosophers. 2 Bde. Cambridge, England: Cambridge University Press. Lorenz, Kuno, Marcelo Dascal, Dietfried Gerhardus und Georg Meggle (eds.) (1992), Sprachphilosophie. Bd. 1. Berlin und New York: de Gruyter. Markovic, Miroslav (1967), Artikel „Herakleitos“ in Real-Encyklopädie der classischen Altertumswissenschaft. Supplement-Band X. Stuttgart: A. Drukkenmüller, 245⫺320. Markus, Robert A. (1957), „St. Augustine on Signs“. Phronesis 2, 60⫺83.
40. Zeichenkonzeptionen in der Philosophie Marrone, Livia (1984), „Proposizione e predicato in Crisippo“. Cronache Ercolanesi 14, 135⫺146. Mayer, Cornelius P. (1969⫺1974), Die Zeichen in der geistigen Entwicklung und in der Theologie Augustins. I. Teil: Der junge Augustinus. II. Teil: Die antimanichäische Epoche. Würzburg: AugustinusVerlag. Newiger, Hans-Joachim (1973), Untersuchungen zu Georgias’ Schrift über das Nichtseiende. Berlin und New York: de Gruyter. Oehler, Klaus (ed.) (1984), Aristoteles: Kategorien. Übersetzt und erläutert von K. O. Darmstadt: Wiss. Buchgesellschaft. Pfaffel, Wilhelm (1981), Quartus gradus etymologiae. Untersuchungen zur Etymologie Varros in „De lingua Latina“. Königstein i. Ts.: A. Hain. Pinborg, Jan (1962), „Das Sprachdenken der Stoa und Augustins Dialektik“. Classica et Mediaevalia 23, 148⫺177. Platon, Opera, ed. J. Burnet. Vol. I⫺V. Oxford: Clarendon Press 1900⫺1907. (OCT) Plotinus, Opera, ed. P. Henry und H.-R. Schwyzer. Vol. I⫺III. Oxford: Clarendon Press 1964⫺1982. (OCT) Prauss, Gerold (1966), Platon und der logische Eleatismus. Berlin: de Gruyter. Quintilianus, M. Fabius, Institutiones oratoriae libri duodecim, ed. M. Winterbottom. Vol. I⫺II. Oxford: Clarendon Press 1970. (OCT) Ruef, Hans (1981), Augustin über Semiotik und Sprache. Sprachtheoretische Analysen zu Augustins Schrift „De dialectica“ mit einer deutschen Übersetzung. Bern: K. J. Wyss Erben A. G. Schadel, Erwin (1975), Aurelius Augustinus: De magistro. Einführung, Übersetzung und Kommentar. Diss. Würzburg 1975. Bamberg: o. V. Schenkeveld, Dirk M. (1984), „Stoic and Peripatetic Kinds of Speech Act and the Distinction of Grammatical Moods“. Mnemosyne 37, 291⫺353. Schmitter, Peter (1984), „Zum Heraklitverständnis in der gegenwärtigen Geschichtsschreibung der Linguistik. Einige Aspekte der Bedingtheit des historiographischen Urteils“. In: K. D. Dutz und P. Schmitter (eds.), Fallstudien zur Historiographie der Linguistik: Heraklit, d’Ailly und Leibniz. Arbeitsberichte Nr. 2 des Instituts für allgemeine Sprachwissenschaft der Westfälischen WilhelmsUniversität Münster, 3⫺20.
861 Schmitz, Hermann (1985), Die Ideenlehre des Aristoteles. 2 Bde. Bonn: Bouvier. Schweinfurth-Walla, Sigrid (1986), Studien zu den rhetorischen Überzeugungsmitteln bei Cicero und Aristoteles. Tübingen: G. Narr. (Mannheimer Beiträge zur Sprach- und Literaturwissenschaft 9) Sedley, David N. (1977), „Diodorus Cronus and Hellenistic Philosophy“. Proceedings of the Cambridge Philological Society 203, NS 23, 74⫺120. Sedley, David N. (1982), „On Signs“. In: J. Barnes u. a. (eds.), Science and Speculation. Studies in Hellenistic Theory and Practice. Cambridge, England: University Press, 239⫺272. Sextus, Empiricus, Opera, ed. H. Mutschmann und J. Mau. Vol. I: Pyrrhoniae Hypotyposeis, ed. H. Mutschmann. Leipzig: Teubner 1912. 2., verbesserte Aufl. mit Addenda und Corrigenda ed. J. Mau, 1958. ⫺ Vol. II: Adversus Dogmaticos libri V (⫽ Adversus Mathematicos libri VII⫺XI), ed. H. Mutschmann. Leipzig: Teubner 1914. Unveränderter Nachdruck 1984. ⫺ Vol. III: Adversus Mathematicos libri I⫺VI, ed. J. Mau. Leipzig: Teubner 1954. 2. Aufl. 1961. ⫺ Vol. IV: Indices, von K. Jana´cˇek. Leipzig: Teubner 2., erweiterte Aufl. 1962. Sprute, Jürgen (1982), Die Enthymemtheorie der aristotelischen Rhetorik. Göttingen: Vandenhoeck und Ruprecht. Theophrast, Die logischen Fragmente des Theophrast, ed. Andreas Graeser. Berlin und New York: de Gruyter 1973. (Kleine Texte für Vorlesungen und Übungen 191) Verbeke, Gerard (1978), „La philosophie du signe chez les Stoı¨ciens“. In: J. Brunschwig (ed.), Les Stoı¨ciens et leur logique. Actes du colloque de Chantilly, 18⫺22 sept. 1976, Paris: J. Vrin, 401⫺424. Versteegh, Cornelis H. M. (1980), „The Stoic Verbal System“. Hermes 108, 338⫺357. Walther, Elisabeth (1979), Allgemeine Zeichenlehre. Einführung in die Grundlagen der Semiotik. Stuttgart: Deutsche Verlags-Anstalt. Erstausgabe 1974. Weidemann, Hermann (1982), „Ansätze zu einer semantischen Theorie bei Aristoteles“. Zeitschrift für Semiotik 4, 241⫺257. Weltring, Georg (1910), Das SHMEION in der aristotelischen, stoischen, epikureischen und skeptischen Philosophie. Ein Beitrag zur Geschichte der antiken Methodenlehre. Diss. Bonn: Hauptmannsche Buchdruckerei.
Karlheinz Hülser, Konstanz (Deutschland)
862
VII. Griechische und Römische Antike
41. Zeichenkonzeptionen in der Mathematik der griechischen und römischen Antike 1. Implizite und explizite Zeichenkonzeption 2. Rechenpraxis und wissenschaftliche Arithmetik 2.1. Darstellungen ganzer Zahlen 2.2. Brüche 2.3. Populäres Rechnen vs. mathematisches Beweisen 3. Pythagoräische Strukturtheorie 3.1. Geometrische Algebra oder Formalisierung der Geometrie? 3.2. Anthyphairetische Proportionenlehre 3.3. Inkommensurabilität 4. Die Repräsentation allgemeiner Formen durch Schemata, figürliche Zeichen 4.1. Platons (spätere) Ideenlehre 4.2. Aristotelische Logik 4.3. Synthetische Geometrie 4.4. Euklids ‘Axiomatik’ 4.5. Eudoxos’ Proportionenlehre 4.6. Zur ‘heterodoxen’ Mathematik im Hellenismus 5. Literatur (in Auswahl)
1.
Implizite und explizite Zeichenkonzeption
Die Zeichenkonzeption einer Disziplin wie der Mathematik der griechischen Antike (zur Mathematik im alten Orient vgl. Art. 89 § 3.1.) läßt sich auf zwei Weisen betrachten: Man kann einen Zeichengebrauch in unserer Analysesprache darstellen und mit unseren Gebräuchen vergleichen, insbesondere wenn er historischer Vorläufer dieser oder jener inzwischen weiter entwickelten und von uns auf eine bestimmte Weise beschriebenen semiotischen Praxis ist. Auch wenn die Beschreibung dann vielfach unsere Kenntnisse und Ansichten voraussetzt, die früher nicht zur Verfügung standen, kann sie im Prinzip oder der Idee nach, also in gewissen allgemeinen Zügen, treffend sein. Andererseits kann auch das explizite Selbstverständnis des jeweiligen Sprach- bzw. Zeichengebrauchs zum Thema werden: Was man über ihn in der Epoche gesagt hat, oder, da wir häufig gezwungen sind, aus den Quellen zu extrapolieren, vermutlich gesagt hätte; wie auf das Verhältnis zwischen Zeichen und Bezeichnetem, Form und Inhalt geachtet wurde und welche Folgen sich aus derartigen ⫺ semiotischen bzw. philosophischen ⫺ Reflexionen ergeben haben. In unserem Fall wurde allem Anschein nach das methodologische Selbstverständnis
der Mathematik durch die Philosophie (insbesondere die Platons) beeinflußt, nachdem diese sich selbst in Auseinandersetzung mit dem rechten semiotischen Verständnis mathematischer Redeweisen und Beweismethoden entwickelt hatte. ⫺ Die zentralen systematischen Lehrstücke der klassischen griechischen Mathematik sind die Formentheorie der elementaren Planimetrie und die (zunächst arithmetische, dann logisch-algebraische) Theorie der Proportionen. Die Entwicklung der Zeichenkonzeption der Mathematik ist eher an ihnen, weniger als rhapsodischer Bericht über Zeichengebräuche der Rechenpraxis darzustellen.
2.
Rechenpraxis und wissenschaftliche Arithmetik
2.1. Darstellungen ganzer Zahlen In verschiedenen Kulturen haben sich verschiedene Notationen für Zahlen entwickelt. Die gesprochene griechische oder lateinische Sprache gebraucht wie viele andere Sprachen und wie die indoeuropäischen Sprachen generell (trotz lokaler Ausnahmen wie „elf“, „zwölf“) ein dezimales Zahlwortsystem. Für die schriftliche Zahldarstellung benutzen die Griechen im allgemeinen die Zeichen P (pente) für 5, D (deka) für 10, H (hekaton) für 100, so daß etwa die Zahl 243 durch „HHDDDDIII“ notiert wurde. Die bekannten lateinischen Zahldarstellungen auf der Basis der Grundzeichen I (1), V (5), X (10), L (50), C (100), D (500), M (1000) übernehmen diese Schreibweise im wesentlichen. Zahlen bis Fünf- oder vielleicht Zehntausend lassen sich so hinreichend überschaubar notieren. Die lateinischen Fünfer-Schritte sind übrigens an das Abakusrechnen mit zweigeteilten Reihen (s. u.) angepaßt. Um dann auch größere Zahlen in überschaubarer Länge zu notieren, macht die (wissenschaftliche) griechische Arithmetik seit dem 3. Jahrhundert Gebrauch von der Buchstabenfolge des Alphabets und zwar eines, das neben den gebräuchlichen noch die drei altertümlichen Buchstaben Stigma å (6), Koppa ä (90) und Sampi ã (900) enthält, um die Anzahl der Charaktere auf 27 zu erhöhen. Diese Grundzahlzeichen vertreten lautsprachliche Zahlworte (oder,
41. Zeichenkonzeptionen in der Mathematik
wenn man will, Zahlen) nach den aus folgender Liste ersichtlichen Regeln: 1⫺9 10⫺90 100⫺900 1000⫺9000 10 000⫺90 000
a, b, g, d, e, å, z, h, u i, k, l, m, n, j, o, p, ä r, s, t, y, f, x, c, v, ã 0a, 0b, 0g, …, 0q oder auch /A, /B, … a¨ , b¨ , g¨ , …, q¨ oder auch a
b
M, M, …
Die Tausender werden also durch einen vorangesetzten Strich markiert, die Zehntausender durch ein M (wie „Myrias“). Folgen derartiger (markierter) Buchstaben (ursprünglich wurden Großbuchstaben verwendet) sind dann einfach additiv zu lesen, wobei man wie in der Lautsprache die Zehntausender vor die Tausender und diese vor die Hunderter, Zehner und Einer schreibt, also etwa „0etow“ für die Zahl 5376. ⫺ Additionen wurden nun in der Antike (in Asien vielfach bis heute) im allgemeinen auf einem Rechenbrett oder Abakus ausgeführt (vgl. Art. 51 Abb. 51.1). Es läßt sich nach einiger Übung auf diesen Geräten sehr schnell rechnen, und zwar durch Verschiebungen von Kugeln (bei Cicero: kupferne „aera“) in Kugelreihen. Ursprünglich verschob man „calculi“, (Kalk)Steinchen (griechisch: „psee˜¯ phos“), auf einem Brett, auf dem wahrscheinlich die Reihen durch Führungshölzer oder Kerben markiert waren: Nach Herodot addierten die Ägypter von rechts nach links, die Griechen von links nach rechts. Während die Reihen des älteren („griechischen“) Abakus im allgemeinen aus neun Kugeln bestanden, welche je nach Reihennummer die Einer, Zehner, Hunderter usw. markierten, wurden die des neueren („römischen“) zur Erhöhung der Übersicht und Rechengeschwindigkeit unterteilt in eine Gruppe von fünf Einserkugeln und zwei Fünferkugeln. Ansonsten werden ähnlich wie im Dezimalsystem zunächst die Einer, dann die Zehner und so fort durch Kugelverschiebungen der jeweiligen Reihe addiert, nachdem man Summanden zwischen fünf und neun additiv zerlegt hat. Der Bereich der auf einem Abakus darstellbaren Zahlen hängt natürlich von der Anzahl der Kugelreihen ab, ist aber im Prinzip beliebig erweiterbar. ⫺ Die Basis für Multiplikationen ist damals wie heute entweder ein auswendig gelerntes Einmaleins, das als solches lautsprachlich formuliert und somit unabhängig von den schriftlichen Zahldarstellungen ist, oder eine schriftliche Tabelle für Multiplikationen, etwa der (neun bzw. zehn) Grundzahlzeichen A, …, I,
863 wie sie sich zum Beispiel in der Eisago¯ge¯ Arithmetike˘ des Nicomachus von Gerasa (ca. 100 n. Chr.) findet. Um Multiplikationen griechisch notierter Zahlen (a1 … an) · (b1 … bn) zu berechnen, mußte man nur alle Summanden der Form ai · bj aufaddieren. Benutzte man dazu den Abakus, so ließen sich Multiplikationen durchaus schnell ausführen: Neben dem Rechnen nach dem kleinen Einmaleins muß man nur die zu ai bzw. bj gehörigen Stellennummern der schriftlichen Zahldarstellung ‘im Kopf’ addieren, da diese den Reihennummern auf dem Abakus entsprechen. Während Additionen, Multiplikationen und Subtraktionen kleinerer von größeren Zahlen auf dem Abakus sehr schnell ausführbar sind ⫺ für sie spielt die Zeitdauer einer laut- oder schriftsprachlichen Interpretation einer Abakusstellung oder die der verarbeitenden Umwandlung geschriebener oder gesprochener Zahlzeichen kaum eine Rolle ⫺, taugt er für das Rechnen mit Brüchen und negativen Zahlen schlecht. Die Stellenschreibweise unter Verwendung der Null, also eines p-adischen Schreibsystems wie des uns geläufigen indisch-arabischen Dezimalsystems, hat gegenüber der griechischen zwei Vorteile: Erstens reduzieren sich die Grundzeichen von 30 (und mehr) auf 10, ohne die Länge der Zahlzeichen zu vergrößern, zweitens läßt sich die Multiplikation zweier schriftlich notierter Zahlen mit Hilfe des kleinen Einmaleins direkt dadurch ausführen, daß man neben dem Übertragsrechnen auf höhere Stellen jeweils nur zwei Grundzahlen zu addieren hat, während man beim schriftlichen Addieren und Multiplizieren griechisch notierter Zahlen im allgemeinen kaum ohne die Notierung von Zwischenergebnissen auskommt. Das Stellensystem ermöglicht damit ein hinreichend schnelles schriftliches Rechnen in allen vier Grundrechenarten (vgl. Posner 1984, 245). Neben den Zahldarstellungen in Lautsprache, Schrift und auf dem Abakus waren allerdings noch andere in Gebrauch: Mit Hilfe gewisser Positionen der Finger der linken Hand repräsentierte man die Zahlen 1 bis 100, mit der rechten die von 100 bis 10 000; an anderer Körperstelle gehalten drückte man mit der linken Hand dann auch Zahlen von 10 000 bis 100 000 aus und mit der rechten größere Zahlen (vgl. Smith 1963, 31 f). Benutzt wurden diese Zeichen sicher auch als Hilfe zur Erinnerung von Zwischenergebnis-
864 sen beim Rechnen mit dem Abakus, auf dem sich ja immer nur eine Zahl notieren läßt. In der wissenschaftlichen Arithmetik (etwa bei Euklid) werden ganze Zahlen im allgemeinen durch gerade Linien, deren Längen als ganzzahliges Vielfache einer Einheitsstrecke aufzufassen sind, exemplarisch (also: als unbestimmte Zahlen) angedeutet. Die Zahlen werden daher vielfach gleich wie die repräsentierenden Strecken durch die Grenzpunkte AB oder dann auch durch kleine Buchstaben a, b … (schematisch bzw. variabel) benannt. Andere, beweistechnische, Zahlrepräsentationen sind die zu Quadraten, Rechtecken, Dreiecken oder anderen geometrischen Figuren zusammengelegten Steinchen der sogenannten „psee˜¯ phoi“-Arithmetik, die, wie so vieles, babylonischen und ägyptischen Ursprungs ist: Eigenschaften additiver und multiplikativer Zahldarstellungen wurden dabei nicht etwa durch formallogisch-deduktive Operationen auf der sprachlichen Ausdrucksebene bewiesen, sondern anschaulich, „epagogisch“, durch Betrachtung der Formen sogenannter „Gnomone“ (Winkeloder Randfiguren, vgl. Becker 1966, 40 ff) an exemplarischen Reihen von Mustern wie:
Das erste zeigt, daß sich die Quadratzahlen m ⫽ n2 als Summe der ungeraden, das zweite, daß sich die Zahlen m ⫽ n(n⫹1) als Summe der geraden Zahlen darstellen lassen. Dies sind übrigens vollständige Beweise, und sie wurden von den Griechen als solche anerkannt. Kein axiomatisch-deduktiver Beweis, der irgendwelche arithmetisch wahre Axiome oder das arithmetische Induktionsschema benutzt, hat irgend größere Beweiskraft. Ein solches epagogisches Beweisen ist nicht zu verwechseln mit dem etwa schon von Platon kritisierten empirisch-induktiven Schließen von Einzelfällen auf allgemeine Aussagen ⫺ weswegen die häufige Übersetzung des Wortes „epago¯ge˘ “ durch „Induktion“ irreführt.
VII. Griechische und Römische Antike
2.2. Brüche Im Prinzip kannte die klassische griechische Mathematik überhaupt kein systematisches (allgemeines) Rechnen mit Brüchen, geschweige denn alle Regeln des Rechnens mit rationalen Zahlen. Dies liegt indirekt am Vorzug, den man dem Rechnen mit dem Abakus gab, direkt am relativ niederen Grad der Verschriftlichung der klassischen griechischen Mathematik: Ein systematisches Rechnen mit Brüchen (rationalen Zahlen) und auch mit negativen Zahlen gibt es nämlich erst in einer entsprechend weit entwickelten Praxis des schriftlichen Operierens mit Bruch-Notationen bzw. mit Vorzeichen. Platon hält z. B. in der Politeia (525 e) eine Teilung der (unbenannten!) Eins oder Einheit (wie sie in einer rein arithmetischen Bruchrechnung notwendig wäre) für sinnlos, und das heißt: für nicht definiert. Teilungen gebe es nur für benannte Größen, für Längen oder Flächen etwa. Es ließ sich also eine (unbenannte) Zahl m nur dann durch eine Zahl n teilen, wenn das Ergebnis ganzzahlig ist. Allerdings rechneten (griechische oder phönizische) Händler wie schon die Ägypter mit (zunächst besonders einfachen) Stammbrüchen und dann auch mit speziellen Brüchen wie 2/3 oder 3/4. Dabei wurden aber die Nenner immer als Teil der Benennung der gezählten Größen verstanden, d. h. sie bildeten neue benannte Einheiten und konnten daher addiert werden. Diese Einheiten sind entweder weiter teilbare Einheitsgrößen, z. B. ein Längenmaß wie das des Fußes, oder diskrete (unteilbare) Gegenstände, die durch die Bezeichnung der jeweils zu zählenden Menge als deren Elemente charakterisiert sind, wie z. B. die Buchstaben auf dieser Seite. Eine benannte Zahl ist also immer gegeben durch den Zahlausdruck und die Benennung der (Zähl-)Einheit. ⫺ Noch Archimedes gebrauchte wortsprachliche Darstellungen für den Nenner und schrieb den Zähler davor, benutzte also die in folgendem Beispiel dargestellte Ausdrucksform „15 Siebzehntel“ ⫺ allerdings dann auch schon ohne weitere Benennung einer speziellen in Teile geteilten Größe. Als Nenner treten dabei besonders häufig die 12 und die 60 auf: Seit babylonischer Zeit waren deren Vorteile bekannt, nämlich daß sich die Basiszahl durch 2, 3, 4 (bzw. 5) und 6 (bzw. 10) teilen läßt, so daß sich, bei Bedarf, viele (Stamm-)Brüche schnell in Brüche der Form n/60 umschreiben und damit addieren ließen. In der babylonischen Mathematik
865
41. Zeichenkonzeptionen in der Mathematik
notierte man n/60 sogar vielfach (in sogenannter Gleitkommadarstellung) einfach durch n; d. h. es wurde jeweils als klar unterstellt, welche Einheit zu wählen ist. Römisch ist die Teilung von Länge und Gewicht (des Fußes bzw. des Pfundes) in 12 gleiche Teile, in je eine „uncia“ (vgl. engl.: „inch“ bzw. „ounce“). Man notierte auch auf Münzen 1/ 3 („triens“) eines Asses vielfach durch vier uncia-Punkte. Kleinstes Gewichtsmaß war ein „scrupulum“, 1/24 einer „uncia“. In der griechischen Astronomie wurde der Radius des Einheitskreises in 60 Teile geteilt und die Kreiszahl mit 3 approximiert, woraus sich die 360 Grade des Kreises und die 90 Grade des rechten Winkels ergeben. 1/60 eines Grades war eine „Minute“, die wieder in „Sekunden“ geteilt wurde („pars minutae secunda“, griechisch: „deu´tera hexe¯kosta´“). ⫺ Erst Diophant gebrauchte eine relativ moderne Notation, schrieb statt unseres Bruchstrichs die Abkürzung „MOP“ für „mo´rion“ (‘Teil’), etwa für „12/224“: „IB MOP SKD“ und rechnete mit (positiven) Brüchen gemäß den uns bekannten Regeln der Addition und (zumindest ganzzahligen) Multiplikation. 2.3. Populäres Rechnen vs. mathematisches Beweisen Platon macht an vielen Stellen, etwa im Philebos (56 d), den Unterschied zwischen einer reinen, beweisenden Arithmetik und einem volkstümlich-praktischen Rechnen (der „logistike¯ techne¯“ als Kunst des schematischen Umgangs mit (Zahl-)Ausdrücken) daran fest, daß letztere immer nur mit benannten Zahlen rechnet. Den minderen Wert dieser bloß praktischen Weise des Rechnens und Messens sieht er darin, daß sie ihre Verfahrensregeln nicht (selbst) als allgemein gültig kontrollierte und entwickelte. Der explizite Verzicht der Arithmetik (und Geometrie) auf einen direkten Praxisbezug (und damit auch auf konkrete Zahlbenennungen!) markiert also nur den formalen Unterschied zwischen der reinen und der auf konkrete Fälle angewandten Mathematik; inhaltlich liegt er im bewußten Streben nach einem Nachweis der invarianten Gültigkeit der schematischen (Argumentations- und Rechen-)Regeln, wie sie in mathematischen Aussagen ausgedrückt sind. Wie berechtigt eine solche Reflexion war, sieht man etwa daran, daß z. B. gemäß der ägyptischen Feldmessung die Fläche eines durch die geraden Linien a, b, c, d gerade begrenzten Feldes oft einfach durch die Formel (a ⫹ c)/2 · (b ⫹ d)/2 (auch bei nicht or-
thogonalen Ecken) angegeben wurde. ⫺ Die Römer betreiben dann (fast) überhaupt keine genuine Mathematik im Sinn der Griechen, beschränken sich, wie schon Cicero (Gespräche in Tusculum I, 2.5) konstatiert, auf bloßes Messen und Rechnen nach überlieferten Regeln.
3.
Pythagoräische Strukturtheorie
3.1. Geometrische Algebra oder Formalisierung der Geometrie? Nach einer von Zeuthen (1896, § 4.) und dann auch von Becker (1966, 52 ff) oder van der Waerden (1983, 75 ff) propagierten, aber etwa von Unguru (1975, 69 ff) und Szabo´ (1978, 332 ff) kritisierten Ansicht beschäftigt sich die griechische Mathematik mehr mit der Geometrie als der Arithmetik, weil in ihr gewisse aus Babylonien bekannte algebraische Gleichungen eine Lösung erhalten, welche sich arithmetisch (noch) nicht lösen ließen. In einer derartigen „geometrischen Algebra“ verträten dann geometrische Konstruktionen algebraische Rechnungen. Wie wenig aber etwa Euklid „algebraisch“ dachte, zeigt sich z. B. daran, daß bei ihm in II, 1 die einfache Regel a · (b1 ⫹ b2 ⫹ b3 …) ⫽ a · b1 ⫹ a · b2 ⫹ a · b3 … zur Berechnung des Flächeninhalts eines entsprechend zerlegten Rechtecks aufgewiesen wird, ohne daß II, 2: (a ⫹ b)2 ⫽ (a ⫹ b) · a ⫹ (a ⫹ b) · b als Spezialfall erkannt wäre. ⫺ Die griechische Mathematik bemüht sich wohl eher um eine Arithmetisierung und dann, allgemeiner, um eine Formalisierung geometrischer Überlegungen. Sie beginnt gewissermaßen mit der Einsicht der Pythagoräer, daß sich durch Zahlverhältnisse ganz unterschiedliche strukturelle Verhältnisse arithmetisch repräsentieren lassen. Der nach Pythagoras benannte Satz (der allerdings schon in der babylonischen Mathematik bekannt war) ermöglicht es zum Beispiel, die geometrische Form des rechtwinkligen Dreiecks arithmetisch durch die bekannte Beziehung der Seitenlängen x2 ⫹ y2 ⫽ z2 zu charakterisieren. Einsichten dieser Art führen zur (hier) so genannten pythagoräischen Semantik, nach welcher man eine konkrete geometrische Figur (etwa eine Zeichnung) als Abbild, Repräsentant und dann auch als symbolische Benennung einer idealen geometrischen Form auffaßte. Deren Eigenschaften, etwa die Verhältnisse ihrer Streckenlängen, Winkel- und Flächengrößen sollen dann, so war
866 das Programm, allgemein arithmetisch charakterisiert werden. ⫺ Die Frage nach der Existenz(art) bzw. Verfassung (Konstitution) derartiger abstrakter und idealer Gegenstände und nach dem rechten Verständnis dieser Abbildbeziehung ist dann schon bei Platon und Aristoteles ein zentrales Thema und bleibt übrigens bis in die neuesten Philosophien der Mathematik (und Semantik) kontrovers (vgl. Art. 78 und 136). Doch auch ohne endgültige Antwort auf diese Frage ließ sich Mathematik betreiben. 3.2. Anthyphairetische Proportionenlehre Becker (1933 bzw. Becker 1966, 102 ff) folgt einer Entdeckung von Zeuthen (vgl. dazu auch Thaers Euklid-Ausgabe 450 ff), nach welcher es eine frühe pythagoräische Definition der Zahlproportion gegeben haben muß, die bei Aristoteles (Topica 158 b 29 ff) „antanaı´resis“, ‘wechselseitiger Rückgang’ sonst aber (besser) „anthyphaı´resis“, ‘Wechselwegnahme’, heißt. In Abkürzung der normalsprachlichen griechischen Umschreibungen notieren wir hier ein Größenverhältnis, genauer: eine Proportion, zwischen zwei Größen A und B durch „A : B“ (bzw. durch „n : m“, falls es sich um Zahlen handelt). Um ein solches Verhältnis zu charakterisieren ⫺ zunächst zwischen zwei (positiven ganzen) Zahlen, dann auch zwischen (addier- und subtrahierbaren) Strecken, Flächen, Winkel oder Volumina ⫺ kann man nun prüfen, um wieviel Mal die kleinere Größe (sagen wir: B) ganz in die größere A paßt. Danach untersucht man, wieviel Mal der entstehende ‘Rest’ X1 ⫺ der dann offenbar kleiner als B ist ⫺ ganz in B paßt. Dieses Verfahren läßt sich auf offenkundige Weise fortsetzen. Einem Zahlverhältnis wie 60 : 26 entspricht so z. B. auf eineindeutige Weise die anthyphairetische Folge [2, 3, 4] (vgl. dazu etwa auch Fowler 1987, 25 ff). Nachdem wir heute mit Unbekannten in Gleichungen und Brüchen rechnen können, erhalten wir aus einer solchen Folge [n1, n2, …] positiver ganzer Zahlen über das Gleichungssystem: A ⫽ n1 · B ⫹ X1; B ⫽ n2 · X1 ⫹ X2; X1 ⫽ n3 · X2 ⫹ X3 usf. eine Darstellung des Verhältnisses A : B in der Form eines Kettenbruchs. Aber auch ohne dies läßt sich die genannte Eineindeutigkeit epagogisch einsehen, wenn auch nicht formal beweisen. ⫺ Die Gleichheit zwischen Proportionen bzw. zwischen Proportionsbenennungen „A : B“ und „C : D“ ist also durch gleiche Ergebnisse der Wechselwegnahme definierbar. Es gilt für die entstehen-
VII. Griechische und Römische Antike
den ‘Reste’: A ⬎ B ⬎ X1 ⬎ X2 ⬎ …, und es ist offenbar genau dann Xk⫺1 ⫽ nk⫹1 · Xk, wenn kein Rest mehr auftritt, wenn also Xk⫹1 ⫽ 0 ist. Für ganzzahlige Verhältnisse n : m ist die anthyphaı´resis gerade der sogenannte Euklidische Algorithmus (Euklid VII,2), der arithmetisch zum größten gemeinsamen Teiler Xk von n und m führt, so daß die anthyphairetische Folge [n1, n2 …] in diesem Fall immer mit einem Glied nk⫹1 abbricht. Ist Xk gleich 1, so sind n, m relativ prim (Euklid VII,1). Szabo´ (1978, § 2.2. ff) weist nun schon an der Terminologie die enge Verknüpfung der (arithmetischen) Lehre von den Proportionen mit der Untersuchung musikalischer Harmonien und den korrespondierenden geometrischen Verhältnissen auf, wobei er allerdings den Unterschied zwischen einer Proportion und einem Abstand nicht richtig wiedergibt: Ein Glied n, m bzw. A, B einer Zahl- bzw. Größenproportion n : m bzw. A : B heißt „ho´ros“, die variable Begrenzung einer Saite, deren eine Seitenbegrenzung wie auf einer Gitarre konstant bleibt. Platon nennt im Philebos (17 c, d) ein musikalisches Intervall „dia´ste¯ma“: Das ist der Abstand zweier ho´roi, also zweier variabler Begrenzungen, welcher den Übergang von dem einen Ton zu einem anderen auf der Saite bestimmt. Dieser Abstand ist natürlich eine Längendifferenz, nicht, wie Szabo´ meint, eine Proportion, die im Griechischen nicht „dia´ste¯ma“, sondern „lo´gos“ heißt. Differenzen und Proportionen sind also zwei verschiedene in ihrer Definition streng zu unterscheidende Verhältnisse zwischen zwei Größen. Dies betont Platon selbst an anderer Stelle, nämlich im Dialog Parmenides (154), wo er den Unterschied so erläutert: Werden zwei verschieden alte Dinge oder Personen älter, so bleibt die Altersdifferenz konstant, aber die Proportion (das ‘Altersverhältnis’) ändert sich, sie (es) wird offenbar kleiner. Zunächst heißen nur Zahlproportionen n : m „lo´gos“, „Ausdruck“, womöglich weil nur dann die entstehende anthyphairetische Zahlfolge endlich ist und daher als arithmetischer (Standard-)Ausdruck einer Proportion angesehen werden kann. (Ausdrücke der Art „4 : 3“ gab es ja noch nicht!) Nachdem man Verhältnisse zwischen geometrischen Größen (etwa Längen), kennenlernte, denen kein derartiger (Zahl-)Ausdruck (lo´gos, rhee¯˜ ma) entspricht, nannte man sie „a´logos“ oder „a´rre¯tos“; die Araber nannten sie in wörtlicher Übersetzung „ausdruckslos“, und
41. Zeichenkonzeptionen in der Mathematik
auch noch im Englischen heißen irrationale Größenverhältnisse oder Zahlen „surd“, „stumm“. Unendliche anthyphairetische Folgen sind ja jedenfalls keine ‘normalen’ Namen; zumindest zunächst konnte man für sie keine Gleichheit definieren, jedenfalls nicht so, daß diese endlich kontrollierbar ist, was man aber damals verlangte. ⫺ Das Wort „analogı´a“ bedeutet nun allgemein „Gleichheit (bzw. Ähnlichkeit) des Ausdrucks“, woraus sich über den lo´gos oder den Ausdruck der anthyphairetischen Folge die spezielle Bedeutung „Proportionsgleichheit“ direkt ergibt. ⫺ Nun konnte es natürlich auch irrationale Verhältnisse nicht ohne jeden Ausdruck geben, auch sie mußten irgendwie beschrieben sein. Und sie waren schon gar nicht irrational im Sinne von ‘unvernünftig’ ⫺ obwohl dies die üblichen Übersetzungen einer Stelle in Platons Politeia (VII, 534 d) fälschlicherweise suggerieren. Tatsächlich sagt Platon in Anspielung auf die Ausdrucksprobleme der anthyphairetischen Proportionenlehre gewissermaßen das Gegenteil, nämlich daß jeder Wissensanspruch explizit und endlich artikuliert sein muß, so daß man sich die Gebildeten nicht sprach- und ausdruckslos (‘stumm’) wie irrationale Linienverhältnisse („a´logous ho´sper gra´mmas“) wünscht. So kann denn auch nach Entwicklung der Eudoxischen Proportionenlehre, welche für beliebige (Beschreibungen von) Größenverhältnisse(n) A : B eine Gleichheit definiert (s. u. § 4.5.), eine Proportion weiterhin „lo´gos“ heißen und zugleich „a´logos“ im alten Sinn sein, wenn sie nämlich keinen endlichen anthyphairetischen Ausdruck besitzt. Explizit benannt wird sie durch eine der griechischen Ausdrucksvarianten für die von uns gebrauchte Schreibweise „A : B“. Aufgrund von weiteren Hinweisen bei Platon, nämlich die auf die erheblichen technischen Schwierigkeiten der Arithmetik als Lehre vom Geraden und Ungeraden, vermutet Fowler (1987, 113 und 117 ff) wohl nicht ganz zu Unrecht, daß Platon auch dabei an Probleme des Argumentierens mit den auf ‘alte’ Weise notierten Proportionen gedacht haben könnte. Für sie läßt sich nämlich die lineare Ordnung, die Platon an der oben erwähnten Stelle aus dem Parmenides als bekannt unterstellt, dadurch definieren, daß wir unterscheiden, ob der Index i der verglichenen Zahlen ni und mi in der anthyphairetischen Folge gerade oder ungerade ist: Den uns geläufigen Ungleichungen 60 : 16 ⬍ 60 : 15 ⬍ 60 : 14 ⬍ 60 : 13 entsprechen ja
867 z. B. die Ungleichungen [3, 1, 3] ⬍ [4] ⬍ [4, 3, 2] ⬍ [4, 1, 1, 2]. Diese Ordnung ist auf der Ebene der Standardausdrücke der Proportionen und gerade daher ganz abstrakt definiert. Ihre Deutung ist zumindest zunächst wenig anschaulich, worauf Platon die von ihm beklagte Tatsache zurückführt, daß die Wissenschaft vom Geraden und Ungeraden zu wenige Interessenten finde. ⫺ Für anthyphairetisch notierte Proportionen ist, wie man leicht einsieht, eine rein arithmetische Definition einer Addition oder Multiplikation außer Reichweite. Dies macht verständlich, warum auch noch in der Eudoxischen Neufassung der Proportionen bei Euklid (s. u. § 4.5.) an die Definition einer Addition und Multiplikation gar nicht gedacht wird ⫺ obwohl in beiden Fällen die Identität von ganzzahligen Proportionen mit der uns bekannten Identität rationaler Zahlen zusammenfällt. 3.3. Inkommensurabilität Mit der „anthyphaı´resis“ und erst mit ihr ist der Weg frei zur Entdeckung (geometrischer) Größenverhältnisse, die „a´logoi“ sind. Einer Überlieferung nach (vgl. v. Fritz 1945 und Becker 1966, 71 ff mit Fowler 1987, 33 ff) war es der Pythagoräer Hippasos von Metapont (manche meinen aber, Pythagoras selbst), der herausgefunden hat, daß dieses Verfahren der Wechselwegnahme nicht abbricht, wenn a die Länge der Diagonale und b die der Seite im regelmäßigen Fünfeck ist. Es reproduziert sich nämlich im Pentagramm die Form des Pentagons sofort, jetzt mit der Länge x1 ⫽ a⫺b als Diagonale und mit der Länge b⫺x1 ⫽ c als Seite usf.:
Das Pentagramm, das Emblem der Pythagoräer, symbolisiert also die denkbar einfachste (‘vollkommene’, ‘harmonische’) unendliche anthyphairetische Folge [1, 1, …]. Da die „anthyphaı´resis“ geometrisch als systematische Suche nach einem größten gemeinsamen
868
VII. Griechische und Römische Antike
Maß für zwei Längen (Euklid X,2) angesehen werden kann, ergibt sich: Bricht sie für geometrische Längen a und b nicht nach endlich vielen Schritten ab, gibt es keine Länge c, so daß sich a und b exakt als ganzzahlige Vielfache von c darstellen lassen. Daher hat eine Längenproportion keinen arithmetischen „lo´gos“ genau dann, wenn die Längen (idealiter) „inkommensurabel“ sind. ⫺ Die Entdeckung irrationaler Längenverhältnisse soll (so meint schon Aristoteles) die Euphorie des pythagoräischen Programms erschüttert haben, das angeblich möglichst alle (geometrischen) Verhältnisse als ganzzahlige Proportionen repräsentieren wollte. In Wirklichkeit wird jetzt der Unterschied erst deutlich zwischen einem idealen und einem empirischen Längenverhältnis. Mit Hilfe von Maß-Stäben lassen sich ja immer nur ganzzahlige Längenverhältnisse messen und zwar unter Bezugnahme auf je fest gewählte und noch deutlich wahrnehmbare Maßlängen, z. B. von Zentimetern oder Millimetern. Vielleicht sahen die Pythagoräer ihr Emblem daher sogar als Beweis der (innermathematischen) Existenz idealer Formen und des Unendlichen an.
4.
Die Repräsentation allgemeiner Formen durch Schemata, figürliche Zeichen
4.1. Platons (spätere) Ideenlehre Platon scheint nun das Grundproblem der Rede über Formen in der pythagoräischen Semantik im Zusammenhang der folgenden epistemischen Aporie bemerkt zu haben: Über hypostasierte Bereiche ewiger Formen, Ideen oder Strukturen läßt sich überhaupt nichts oder bestenfalls Beliebiges aussagen, wenn keine allgemein verfügbaren Kriterien der Kontrolle der Wahrheit von Aussagen über sie bekannt sind, oder, anders gesagt, wenn nicht klar ist, wie sie real erkennbar sind. Dazu bedarf es, so scheint es, einer Art des Vergleichs zwischen den konkreten, wahrnehmbaren, Darstellungen und den dargestellten Ideen („eı´de¯“, ‘Gestalten’) oder Urbildern. Es ist zu erläutern, was die ersteren mit den letzteren ‘gemein’ haben. Platon spricht hier von einer „me´thexis“, einer ‘Teilhabe’. Seine neue Grundeinsicht formuliert er im Dialog Parmenides 133 c⫺d: Die Urbilder existieren nicht an und für sich, sondern nur in den allgemeinen, wiedererkennbaren, Verhältnissen, die durch die als Zei-
chen gedeuteten Abbilder zum Ausdruck gebracht werden. Daß z. B. verschiedene Realisierungen einer Idee (etwa einer geometrischen Form) an dieser „teilhaben“, bedeutet faktisch nur, daß sie als (form)gleich zu werten sind. Aussagen über abstrakte Formen und ihre Eigenschaften urteilen damit nicht auf esoterische Weise über eine ‘höhere’ oder ‘tiefere’ Wirklichkeit. Vielmehr ‘gibt’ es z. B. geometrische Formen, weil es überwältigende Übereinstimmungen in den (erfahrungsbezogenen) Urteilen über die gemeinsamen Eigenschaften formgleicher Körper bzw. ihrer Oberflächen gibt. Diese Übereinstimmungen werden epagogisch erzielt, was Platon schon im Dialog Menon aufzeigt, wo ein (noch ungebildeter) Sklavenjunge mathematisch zu überlegen (konkret: die Fläche eines Quadrats zu verdoppeln) lernt, und zwar auf der Basis der Wiedererinnerung („ana´mne¯sis“), die nichts anderes ist als die jedem Menschen mögliche Einsicht in den rechten Umgang mit den durch Beispiele und Bilder repräsentierten Mustern und Formen. Platon spielt damit gewissermaßen die epagogische Beweispraxis in Geometrie und psee˜¯ phoiArithmetik gegen metaphysische Kommentare über diese Praxis aus, die sich aus einer abbildtheoretischen Deutung der Rede über Formen ergeben: Eine Idee oder Form ist ab jetzt immer nur das Allgemeine, Generische, das in seinen unterschiedlichen Erscheinungsweisen identifiziert werden kann. Und nur wegen der intendierten Allgemeinheit einer mathematischen Aussage lassen sich Beweise in der Geometrie nicht einfach durch Messungen an einer Zeichnung führen: Es muß immer von der situationsabhängigen Unschärfe des empirischen Abbildes abgesehen, abstrahiert, werden zugunsten von Invarianzen bezüglich der Formgleichheit, eben der (richtig zu verstehenden) me´thexis des Konkreten mit dem Allgemeinen. ⫺ Was hier als Einsicht dem späteren Platon zugeschrieben wird, artikuliert Aristoteles schärfer in seiner Kritik an den sogenannten dritten Dingen des Pythagoräismus, welche angeblich als abgetrennte, absolute, neben der Welt der Zeichen (der Bilder und der Sprache) und (quasi als Realerklärungen) hinter den konkreten Erscheinungen existieren und durch die Vermittlung der Mathematik erkennbar sein sollen. Er versteht die Formen und Ideen dabei im Grunde schon als Klassen von Dingen oder Figuren, zusammengehalten durch angemessene Analogien („ana´logos“ heißt auch nicht von Ungefähr „angemes-
41. Zeichenkonzeptionen in der Mathematik
sen“). Diese sind nicht etwa bloß zufällige Ausdrucksgleichheiten oder Homonymien, sondern wirklich erfahrbare Strukturgleichheiten. Da er dabei auch pythagoräistische Restbestände der Lehren der Akademie (etwa auch eines Speusipp) kritisiert, die, wie auch noch Platons Timaios, allerlei mathematische Spekulationen an die Stelle philosophisch-logischer Analysen und empirischer Untersuchungen setzen, und da er Platons Rede von der me´thexis für unklar hält, gilt jener bis heute vielfach als metaphysischer Pythagoräer, obwohl ohne ihn die geschilderte Einsicht des Aristoteles kaum möglich gewesen wäre (vgl. auch Art. 40 § 3.1.). 4.2. Aristotelische Logik Außerdem ist es ein Verdienst Platons, die Notwendigkeit einer Reflexion auf die semantischen Grundlagen der gebräuchlichen Schlußformen erkannt zu haben, die sich am „schee¯˜ ma“, der Figur des Ausdrucks, orientieren. Seine Überlegungen dazu wurden dann, so könnte man sagen, von Aristoteles in den Analytica priora ausgearbeitet. In diesen wird zum ersten Mal explizit zwischen konfigurativen Schlußformen und der (letztlich definitionstheoretischen) Grundlage ihrer semantischen Gültigkeit unterschieden. Die dabei (implizit) benutzte formale Semantik der Begriffsextensionen ist als solche schon in Platons Dialog Parmenides (131 b⫺c) veranschaulicht: Die Gegenstände (die bei Aristoteles bezeichnenderweise „hypokeı´mena“, ‘Darunterliegende’ heißen) liegen unter den Begriffen wie unter Segeltüchern. Diese haben eine Grenze (zwischen außen und innen) und können auch (partiell oder ganz) übereinander liegen. Den Begriffswörtern bzw. Begriffen sind in dieser (uns übrigens vertrauten, weil naheliegenden) Analogie formal Flächen auf einer Ebene zugeordnet; den Begriffsverhältnissen entsprechen Flächenverhältnisse. Aristoteles benutzt dann Buchstaben als schematische Variable: Sie sind zunächst syntaktische Platzhalter für Begriffsworte und dienen damit der expliziten Angabe (leicht normierter) syntaktischer Satzformen der Art „A kommt jedem/keinem/manchem B zu (bzw. nicht zu)“. Zugleich stehen sie für Begriffsumfänge, die in der genannten Analogie als Flächen vorgestellt werden: Daß bei Aristoteles ein Begriff „ho´ros“ (‘Grenze’) heißt, liegt demnach weniger an der ⫺ seit Kapp (1942, Kap. 2) von vielen Autoren behaupteten ⫺ Analogie zwischen den syntaktischen Satzgliedern A und
869 B (also den in den Sätzen der geschilderten Art vorkommenden Begriffswörtern) und den, wie wir schon wissen, ebenfalls als „ho´roi“ bezeichneten Gliedern einer Proportion A : B, sondern zumindest auch daran, daß eine Begriffsbestimmung (eine Definition, die ja ebenfalls „ho´ros“ oder „horismo´s“ heißt) semantisch als Ausgrenzung eines Teils aus einem Ganzen (aus einer Gattung, einem „ge´nos“, d. i. einer gemeinsamen Obermenge) von Dingen aufzufassen ist. Aristoteles unterscheidet nun zwischen den syntaktischen Verhältnissen der Begriffsworte in den beschriebenen Standardsätzen und den ‘semantischen’ Verhältnissen, die durch diese ausgedrückt werden, und zwar auf folgende Weise: Jeder der vier Satzformen: „A kommt keinem B zu“ (a), „A kommt jedem B zu“ (b), „A kommt manchem B zu“ (c) und „A kommt manchem B nicht zu“ (d) ist als formale Wahrheitsbedingung eine Klasse von möglichen semantischen Begriffsbeziehungen zugeordnet, die man sich durch Flächenverhältnisse dar- oder vorstellen kann. Dabei entspricht eigentlich nur der ersten Satzform (a) genau ein Begriffs- bzw. Flächenverhältnis, während in den anderen (b⫺d) Fallunterscheidungen zu berücksichtigen sind. Wenn z. B. jedes A ein B ist, kann entweder manches B kein A sein, oder es kann jedes B ein A sein. ⫺ Vor diesem Hintergrund beweist Aristoteles (letztlich epagogisch!) seine syllogistischen Schlußregeln als allgemeingültige Schlußformen, z. B. die folgenden: „Wenn A jedem B zukommt und B jedem C, so kommt A jedem C zu“ (‘Barbara’) oder „Wenn A keinem B zukommt, aber B jedem C, so kommt A keinem C zu“ (‘Celarent’). Dabei unterstellt er stillschweigend, daß die Begriffsumfänge nicht leer sind. Das heißt nicht etwa, daß immer etwas ‘Reales’ unter den Begriff fallen müßte (die Logik gilt auch, wenn wir fabulieren), sondern nur, daß das Begriffswort B definiert sein soll, d. h. daß Kriterien bekannt sind, die sagen, wann einem möglichen Gegenstand g (eines „ge´nos“ G) B zukommt, wann nicht. In der formalsemantischen (geometrisch-analogen) Repräsentation bedeutet dies: Es ist allen in einem „ge´nos“ definierten einstelligen Prädikatworten und nur diesen eine Fläche zuzuordnen. Daher betrachtet Aristoteles konsequenterweise auch Regeln wie: „Wenn A jedem B zukommt, so kommt es auch manchem B zu“ als gültig. Dies würde irreführen, wenn der Schlußsatz etwa in „Es gibt ein B mit der Eigenschaft A“ umformuliert würde,
870 und zwar dann, wenn B zwar definiert, aber leer ist, wenn kein Gegenstand g aus G ‘unter B’ liegt. Es ist dies übrigens der logische Hintergrund, warum Aristoteles im Rahmen seiner formalen Logik eine eigene ‘Ontologie’ braucht, welche die Bedeutung von Sätzen der Form „Manche A sind B“ (etwa: „Manche Einhörner sind weiblich“) in einer eigenen Untersuchung der Existenzweise dieser A bzw. B weiter klärt. Auch wenn dies üblicherweise nicht so gesehen wird, ist die aristotelische Syllogistik selbst ein Stück antiker Mathematik, sie ist die erste wirklich mathematische Logik. Sie besteht nämlich aus einer syntaktischen Normierung der Bildung von Satzformen (1). Diese gehen in Sätze über, wenn man Buchstaben durch Begriffsworte ersetzt (2). Die Sätze werden ihrerseits in Analogie zu Verhältnissen von Flächen (Begrenzungen, „ho´roi“) interpretiert (3). Auf diese Interpretation gründen sich die Grundregeln des schematischen Schlußkalküls der Syllogistik (4). Aristoteles zeigt dann sogar, daß jeder begriffslogisch allgemeingültige Beweis eines Satzes aus einer Menge von Sätzen (der zugelassenen Formen) durch einen direkten deduktiven Beweis gemäß den syllogistischen Regeln ersetzt werden kann. Mit anderen Worten, die Syllogistik ist korrekt und vollständig in Bezug auf die formale Flächensemantik für die einstelligen Begriffsworte oder, was das gleiche ist, für Benennungen nichtleerer Mengen einer festen Obermenge. Das aristotelische Tertium non datur, die scharfe begriffliche Begrenzung der Termini („ho´roi“, ‘Begriffswörter’), ist daher primär nicht etwa ein ‘logisch wahrer Satz’, sondern ein definitionstheoretisches Prinzip, das erfüllt sein muß, wenn man syllogistisch-deduktiv schließen möchte. Für ein angemessenes Verständnis der Zeichenkonzeption und des Beweisbegriffs der klassischen griechischen Mathematik ist nun die Tatsache von wesentlicher Bedeutung, daß erst viel später, letztlich erst in der Neuzeit, das folgende ‘aristotelische Programm’ allgemein auf die Mathematik angewendet wird (vgl. Art. 78 § 5.): Nach diesem sollen Theorien möglichst als axiomatisch-deduktive dargestellt werden, in denen aus (als wahr erkannten oder postulierten) Grundsätzen Lehrsätze nach schematischen, aber logisch allgemeingültigen, Schlußregeln zu beweisen sind. Das Programm macht allerdings eine wesentliche Weiterentwicklung der mathematischen Logik notwendig, da (besonders in Geometrie und Arithmetik) aussagen-, relations- und gleichheitslogische
VII. Griechische und Römische Antike
Schlußschemata viel bedeutsamer als begriffslogische sind. Im Unterschied zur Moderne ist das Paradigma eines Beweises der antiken Mathematik aber überhaupt nicht die formallogische Deduktion, sondern die inhaltliche Einsicht in die Allgemeingültigkeit einer Argumentation(sform) für einen je umgrenzten Redebereich, eben die epago¯ge˘ . 4.3. Synthetische Geometrie Der Überlieferung nach soll die besondere Auszeichnung der einfachen und vollkommenen Formen Gerade und Kreis der klassischen griechischen Geometrie auf Platon zurückgehen. Es handelt sich dabei keineswegs bloß um eine gewisse Vorliebe, sondern um das Bemühen (wenn nicht Platons, dann eben vielleicht des Eudoxos) um ein strenges und zugleich nicht-spekulatives Verständnis geometrischer Formen („eı´de¯“). Durch die Bestimmung einfacher und eindeutiger Grundformen, oder, operativ gelesen, Grundkonstruktionen, lassen sich nämlich komplexe geometrische Formen (in unserem Fall: der elementaren ebenen Geometrie) als Zusammensetzungen oder Zerlegungen verstehen. Ihre ‘Benennungen’ durch komplexe Konstruktionsbeschreibungen, wie sie uns auch aus der Schulgeometrie bekannt sind, erhalten damit gewissermaßen eine syntaktische Struktur. Semantisch gedeutet werden diese natürlich dadurch, daß sie als Anweisungen gelesen werden, die sagen, wie ebene Zeichnungen sukzessive ausgeführt werden sollen. Dementsprechend formulieren Euklids Postulate mit den Nummern 1⫺3 die Grundkonstruktionen, aus denen sich die komplexen Konstruktionsanweisungen (syntaktisch bzw. semantisch) zusammensetzen, nämlich die gerade Verbindung zweier (i. a. schon konstruierter!) Punkte (1), die gerade Verlängerung einer (schon konstruierten) Strecke (2) und die Konstruktion eines Kreises um einen Punkt durch einen Punkt (3). Die genannten Postulate sind also keineswegs Grundsätze, mit denen behauptet oder unterstellt würde, in einem hypostasierten idealen Punktraum gebe es zu zwei Punkten (genau) eine Gerade durch sie und es gebe immer (genau) einen Kreis, so daß der eine Punkt Mittelpunkt ist, der andere auf der Kreislinie liegt. Vielmehr sind sie Grundbestandteile von Form- bzw. Konstruktionsbeschreibungen. In diese sind im allgemeinen epagogisch aufweisende, manchmal auch deduktive, Kommentare eingefügt, die sukzessive zeigen (sollen), daß bzw. warum die komplexe Instruktion (wenigstens ‘im Prinzip’) allge-
41. Zeichenkonzeptionen in der Mathematik
mein (d. h. unabhängig von der Situation und der Wahl der Größe der Realisierung) befolgbar ist, womit dann die Existenz der Form (allererst) bewiesen wird. Geometrische Formen werden also weder einfach als existent vorausgesetzt, noch sind sie bloße Gestalten, erzeugt durch eine mehr oder minder subjektive Bewertung von Wahrnehmungen als gestaltgleich. Eine Form ist vielmehr das durch realisierbare Formbeschreibungen allgemein und abstrakt Benannte, sie läßt sich an allen (guten, formgleichen) Realisierungen aufweisen. Konkrete Figuren, „sche˘ mata“, sind also anschauliche Repräsentationen einer idealen Form immer nur in Bezug auf eine Beschreibung. Nur was dann allgemein für eine solche Form gilt, unabhängig von Besonderheiten ihrer Realisierungen (sofern diese die formkonstitutive Konstruktionsanweisung hinreichend gut befolgen, also nicht allzu große Mängel zeigen), ist eine geometrische Eigenschaft der Form. Auch wenn man den Bereich der elementaren Planimetrie verließ, blieb die ‘orthodoxe’ (platonische?) griechische Geometrie an einfache geometrische Standardformen gebunden, aus denen komplexere Formen durch Kompositionen oder Zerlegungen (etwa ebene Schnitte) entstehen. Derartige Standardformen sind die Kugel, der Kegel, der Quader, die Pyramiden, ferner alle regelmäßigen ‘platonischen Körper’. Methodologisch war dies durchaus sinnvoll, und zwar weil man nur so die Formen situationsinvariant beschreiben bzw. benennen konnte. Z. B. lassen sich an einer nur irgendwie aufgemalten Kurve ohne Angabe eines ‘Kurvengesetzes’ nur empirische, nicht allgemeine Eigenschaften klar und deutlich bestimmen, es ist unklar, welche Form (welches eı˜dos, welche Analogieklasse von Figuren) intendiert, ‘bezeichnet’, ist. Erst die neuzeitliche analytische Geometrie erlaubt es, Gesetze von Kurven (oder auch Flächen und Volumina) durch Benennungen (stetiger) Zahlabbildungen zu charakterisieren, so daß wir weitgehend unabhängig werden von der antiken Methodologie der Formdefinition durch Zusammensetzung oder Zerlegung von Grundformen. 4.4. Euklids ‘Axiomatik’ Euklids vieldiskutierte Definitionen: „Ein Punkt ist, was keine Teile hat, eine (gerade) Linie breitenlose Länge“ (Euklid Def. I.1⫺2) sagen dann auch nichts Tiefsinniges über das Wesen idealer Punkte oder Linien aus, sondern sind (mehr oder minder geglückte und
871 immer unvollständige) Erläuterungen des rechten Umgangs mit entsprechend kommentierten Zeichnungen (zur heutigen Behandlung derartiger Strukturen und Strukturoperationen in Graphengrammatiken vgl. Art. 2 § 5.4. und Art. 78 § 4.): Linien (bzw. Punkte) einer Zeichnung zählen in der Geometrie immer nur als Begrenzungen, nicht als (nach I, Ax. 8: in eine Größenordnung eingereihte) Teile von Flächen (bzw. von Linien). Die durch ihre je wirkliche Ausdehnung in Zeichnungen möglicherweise entstehenden Unschärfen (besonders bei kleinen Schnittwinkeln und Kreistangenten) sind zu berücksichtigen, wenn an der Zeichnung etwas über die repräsentierte allgemeine oder ideale Form (das eidos) gezeigt werden soll. Ansonsten setzt Euklid voraus, daß man weiß, was durch (gerade oder kreisförmige) Linien begrenzte (besser: gegebene) ebene Figuren sind, was ein Nebenwinkel ist und wie die Deckungsgleichheit für Winkel oder Strecken oder Figuren (Flächen) in der Anschauung kontrolliert werden kann: Nach Euklid (I, Ax. 7) ist, was einander deckt (seien es ebene Flächen, Strecken oder Winkel) gleich und es entsteht Gleiches, wenn Gleiches zu Gleichem hinzugefügt wird oder wenn Gleiches von Gleichem weggenommen wird (I, Ax. 2, 3), d. h. es entstehen deckungsgleiche Figuren, wenn deckungsgleiche Figuren zu deckungsgleichen (bei Flächen natürlich: an der gleichen Stelle) hinzugefügt oder von ihnen weggenommen werden. Da man nun ideale Formen als solche offenbar weder bewegen noch zur Deckung bringen kann ⫺ was etwa die Eleaten und auch Platon immer wieder betont haben ⫺, lassen sich diese Axiome zumindest zunächst nicht als Wahrheiten über Formen verstehen. Zusammen mit der in Axiom 1 artikulierten allgemeinen Bedingung für eine (abstrakte) Gleichheit: „Was demselben gleich ist, ist auch einander gleich“ sagt Axiom 7 vielmehr, daß die Dekkungsgleichheit ebener Figuren („sche˘ mata“) zunächst erfahrungsgemäß, dann idealiter eine Äquivalenzrelation ist (bzw. normativ gewendet, sein sollte), wenn man bei Flächen sowohl Passungen von ihrer ‘Ober-’ als auch von ihrer ‘Unterseite’ betrachtet, die Flächen also wie dünne, vom Körper abziebare, Folien ansieht. Wenn nun zwei in einer Form- oder Konstruktionsbeschreibung K charakterisierte Linien (oder Winkel oder geradlinig begrenzte und in Dreiecke zerlegte Flächen oder Teilflächen eines Kreises) einsehbar in jeder ‘guten’ figürlichen Realisie-
872 rung deckungsgleich sind (oder sein sollten), dann kann man von der Kongruenz der ‘idealen’ Linien, Winkel etc. sprechen. Die Konstruktion der Streckenantragung (Euklid I, 2 f) ohne die Bewegung eines Konstruktionsgeräts (!) definiert eigentlich erst die ideale Streckenkongruenz in Formen. Die ideale Kongruenz von Dreiecken und damit von geradlinig begrenzten Flächen ergibt sich dann aus den in Euklid (I, 4 ff) entwickelten allgemeinen Kriterien der Deckungsgleichheit von Dreiecksfiguren. Die Formulierungen der Postulate, der so genannten ‘Axiome’, die Euklid selbst bezeichnenderweise “allgemeine Einsichten” („koinaı´ e´nnoiai“) nennt, und dann auch der Lehrsätze haben also eine zweifache, eine ‘wahrheitssemantische’ und eine normative, Deutung: Zunächst artikulieren sie Aussagen über wirkliche Konstruierbarkeiten, die in der anschauenden Erfahrung als allgemein ‘wahr’ einsehbar sind. Erst vermöge dieser Allgemeinheit sagen sie etwas über die durch die Beschreibung charakterisierte (abstrakte oder ideale) Form selbst. Nur in Kenntnis dieser Allgemeinheit macht ihre normative Verwendung Sinn: Sie sagen dann, welche Eigenschaften gute Konstruktionen haben (sollten). Dies gilt z. B. auch für das vieldiskutierte Parallelenpostulat. Nach diesem schneiden sich, grob gesagt, zwei in eine Richtung verlängerte gerade Linien einer Ebene genau dann (irgendwann), wenn die Summe der ‘inneren’ Schnittwinkel mit einer dritten Geraden kleiner als 180∞ ist. Zunächst artikuliert das Postulat damit eine aufweisbare Eigenschaft gerader Linien auf hinreichend ebenen Flächen: Diese schneiden sich, je nachdem, ob sie in einem anschaulich signifikanten Sinne auf einer dritten Linie orthogonal bzw. nicht orthogonal stehen. Dann kann es auch als Kriterium dafür dienen, wann sich in hinreichend guten Ausführungen einer komplexen Konstruktionsbeschreibung (je nach einer abschätzbaren Verlängerung der Zeichenebene) zwei gerade Linien schneiden (sollten) oder nicht schneiden (dürfen). Ohne ein derartiges Postulat wäre, drittens, der Bereich der idealen geometrischen Formen nicht hinreichend scharf bestimmt: Für eine Kontrolle der Ausführbarkeit einer Instruktion und damit der Existenz einer Form stehen uns nämlich in der wirklichen Anschauung nur Figuren zur Verfügung, die in Größe und Exaktheit begrenzt sind. Das Parallelenpostulat erlaubt es dagegen, auch über anschaulich nicht mehr (direkt) darstell-
VII. Griechische und Römische Antike
bare (in Formen: ideale) Linienschnittpunkte zu reden, da es für Sätze der Art „es gibt einen Schnittpunkt der Geraden g und g’“ in einer Konstruktion ideale Wahrheitsbedingungen festlegt. Der idealisierende, die anschaulich kontrollierbaren Verhältnisse transzendierende, Charakter dieses Postulats war den Griechen wohlbekannt. Daher wurde sein Gebrauch in Argumenten möglichst vermieden, was aber nur dann klappt, wenn sich alle relevanten Linienschnittpunkte in einer Figur anschaulich vorführen lassen und wenn kein Argument benutzt werden muß, das sich auf eine Nichtexistenz von Geradenschnittpunkten stützt: Diese läßt sich offenbar nicht direkt zeigen. Geometrische Lehrsätze werden nun nicht etwa durch formallogische Ableitungen aus Grundsätzen bewiesen, sie werden epagogisch demonstriert: Auf der Grundlage von schon erkannten allgemeinen Eigenschaften der bisher schon als existent (konstruierbar) nachgewiesenen komplexen geometrischen Formen wird einsichtig gemacht, daß jede gute Realisierung einer gewissen Konstruktion K (und damit die durch K bezeichnete oder benannte ideale Form) eine gewisse Eigenschaft F besitzt. Eine solche Eigenschaft F kann auch darin bestehen, daß man aus K über weitere Konstruktionen eine Figur (bzw. Form) erhält, welche eine Eigenschaft G besitzt. Indirekt kann hier geschlossen werden, wenn man gewisse Formbeschreibungen hypothetisch (d. h.: verbal) für realisierbar erklärt und zeigt, daß sich daraus über allgemein als ausführbar erkannte weitere Konstruktionen ein Widerspruch zu schon Bekanntem ergeben würde. Dann kann es die unterstellten Formen so nicht geben, bzw. alle Formen, die es gibt, haben dann ‘entgegengesetzte’ Eigenschaften. ⫺ Euklids Geometrie ist also keine axiomatische (deduktive) Theorie, und es ist ein Anachronismus, wenn man vielfach glaubt, sie wolle es sein. Stattdessen muß man z. B. schon bei der Konstruktion eines gleichseitigen Dreiecks über einer Strecke AB (Euklid I, 1) (ein)sehen, daß sich die Kreise um A und B mit Radius AB schneiden, dies ‘folgt’ aus keinem Axiom und keinem Postulat ‘rein logisch’. Deduktive Argumentationen sind natürlich trotzdem zugelassen. Wenn etwa ein Verhältnis zwischen gewissen Beschreibungen von (Teil-) Formen als (abstrakte) Gleichheit (Kongruenz) erwiesen ist, dann kann man mit der Transitivitätsregel des 1. Axioms schematisch argumentieren.
41. Zeichenkonzeptionen in der Mathematik
4.5. Eudoxos’ Proportionenlehre Die gegenüber der „anthyphaı´resis“ sowohl einfachere als auch allgemeinere (neue) Definition des Begriffes der Proportion im V. Buch Euklids, welche dem Eudoxos zugeschrieben wird, ist ein weiteres Beispiel, wie bewußt die griechische Mathematik auf das Verhältnis zwischen einer Angabe der Ausdrucksform (‘Syntaktik’; vgl. Art. 2) und einer allgemeinen Angabe sinngebender Wahrheitskriterien (‘Semantik’; vgl. Art. 3) reflektierte, auch wenn die Ausdrücke noch weitgehend der Normalsprache entstammen, also ohne eigene formale Zeichen, aber mit eigener Terminologie formuliert sind. Im einzelnen geht Euklid so vor: Zunächst artikuliert er allgemeine Anforderungen dafür, daß von Größen A, B in einem Größenbereich G gesprochen werden kann, um dann für Gleichungen zwischen (‘Benennungen’ von) Größenverhältnissen (wir schreiben: „A : B“) Wahrheitswerte festzulegen. In einem Bereich G von Größen muß dabei immer eine Addition, zumindest eine ganzzahlige Multiplikation definiert sein (V, Def. 1, 2), und die Größen müssen (passend zur Addition) linear (das formuliert Euklid nicht explizit) und archimedisch geordnet sein. Das heißt: Zu je zwei Größen A, B des Bereiches G muß es eine Zahl n geben, so daß n · A ⬎ B ist (V, Def. 4). Beispiele für Größen dieser Art sind natürliche Zahlen und dann auch die über den Kongruenzbegriff in geometrischen Formen definierten idealen Längen, Flächenoder Winkelgrößen. Wenn A und B Namen von Größen eines solchen Bereiches G sind (V, Def. 3), können sie in Proportion stehen, d. h. der Ausdruck „A : B“ (bzw.: „das proportionale Verhältnis von A zu B“) ist wohlgebildet. Aber erst die Definitionen V.5 und V.7 legen den Begriff der Proportion fest, und zwar durch die Angabe allgemeiner Wahrheitsbedingungen für die Identität und zugleich für die Ordnung von wohlgeformten Proportionsbenennungen, also für Gleichungen „A : B ⫽ C : D“ und Ungleichungen „A : B ⬍ C : D“. Die Regeln lauten in leicht verkürzter Formulierung: Gibt es natürlichzahlige Vielfache m und n, so daß m · A ⬎ n · B gilt, aber nicht m · C ⬎ n · D, genau dann gelte A : B ⬎ C : D. Gilt weder A : B ⬎ C : D noch C : D ⬎ A : B, so gelte A : B ⫽ C : D. ⫺ Euklid definiert also die Proportionen nicht über Approximationen durch rationale Zahlen ⫺ die gab es ja für ihn gar nicht. Er sagt auch nicht: A : B ⬎ C : D gelte genau dann, wenn es Zahlen n, m gibt, so daß A : B ⬎ n : m ⬎ C : D gilt, und zwar weil einer Un-
873 gleichung A : B ⬎ n : m noch kein Wahrheitswert zugeordnet ist. Vielmehr wird hier der mathematische Begriff der Proportion allererst definiert durch Festlegung der Wahrheitsbedingungen für Gleichungen A : B ⫽ C : D zwischen Proportionsbenennungen, wobei A, B und C, D auch Paare von Größen (-benennungen) aus verschiedenen Bereichen sein dürfen, etwa A und B Zahlen oder Längen, C und D Flächen- oder Winkelgrößen. Damit ist die neue Definition der Proportionen zumindest so allgemein wie die alte anthyphairetische. In V, 11 zeigt Euklid, daß nach den Definitionen V.1⫺V.7 für die Gleichungen A : B ⫽ C : D das für abstrakte Gleichheiten oder Äquivalenzrelationen konstitutive Gleichheitsaxiom (I, Axiom 1) erfüllt ist, womit der Gebrauch des Gleichheitszeichens allererst begründet ist. Ein solcher Beweis wäre kaum sinnvoll, wenn man annehmen würde, es gäbe Proportionen schon als abstrakte Gegenstände, die es nur noch zu benennen gälte. Anders als in der anthyphairetischen Proportionenlehre erhalten jetzt alle möglichen Proportionen eine lineare Ordnung, in welche die ganzzahligen Proportionen eingeordnet sind, und es lassen sich wichtige allgemeine Rechen- und Schlußregeln herleiten. Wir finden bei Euklid u. a. die Regeln: A : B ⫽ C : D gilt genau dann, wenn A : C ⫽ B : D gilt (V, 16), und dies gilt genau dann, wenn (A⫹/⫺B) : B ⫽ (C⫹/⫺D) : D gilt (V, 17, 18). Ferner gilt n · A : n · B ⫽ A : B (V, 15). ⫺ In manchen Größenbereichen ⫺ etwa für Streckenlängen aufgrund des proportionstheoretisch leicht beweisbaren Strahlensatzes ⫺ gibt es immer eine konstruktive Lösung für die Proportionsgleichung a : b ⫽ x : c. Würde man nun eine ‘Einheitslänge’ e in einer geometrischen Form wählen, so könnte man über die nach x auflösbare Gleichung a : b ⫽ x : e und die Identifikation x : e ⫽ x auch die Addition, Multiplikation und Division von Längen bzw. Längen-Proportionen definieren, so daß sich am Ende fast alle algebraischen Rechenregeln eines Körpers, nämlich der euklidischen Längen, ergäben. (Ein Rechnen mit ‘negativen Längen’ war grundsätzlich nicht bekannt.) Die orthodoxe griechische Mathematik erlaubte eine solche allgemeine Identifikation aber aus zwei Gründen nicht: Erstens ist die Eudoxische Definition der Proportion A : B unabhängig davon, ob A eine Zahl, eine Linie, ein Winkel oder eine Fläche ist. Zweitens sind die geometrischen Sätze Euklids alle ‘formeninvariant’: Es wird von fixen Ein-
874 heitslängen praktisch kein Gebrauch gemacht. Erst Descartes erkannte den ungeheueren rechen- und beweistechnischen Vorteil, der sich ergibt, wenn wir die ‘Punkte’ in beliebigen geometrischen Formen durch die (positiven oder negativen) Koordinatenlängen in Bezug auf ein festes Achsenkreuz mit Einheitslänge repräsentieren: Dann kann man mit den (gerichteten) Längen letztlich genau so rechnen wie wir mit rationalen (und dann auch reellen) Zahlen; man kann sie nicht nur addieren, sondern auch multiplizieren und dividieren (vgl. Art. 66 § 3.). Die häufig im Überschwang vertretene These, der griechische Begriff der Proportion sei im Prinzip schon der Begriff der reellen Zahl, ist aber in vielerlei Hinsicht ein Anachronismus. 4.6. Zur ‘heterodoxen’ Mathematik im Hellenismus Es gibt nun nicht eigentlich eine eigene hellenistische, geschweige denn lateinische, Zeichenkonzeption der Mathematik. Wohl aber gibt es gegenüber dem Kanon bei Euklid inhaltliche Fortschritte, besonders bei Archimedes und Diophant. Diese sind nicht zuletzt darin begründet, daß man Euklids orthodoxen Rahmen überschreitet, die ‘populäre’ Rechenkunst, heterodoxe Konstruktionsmittel und Formenbeschreibungen und auch unendliche Approximationen stärker berücksichtigt. Schon Hippias aus Elis und später Archimedes betrachteten z. B. die Bahnen gewisser überlagerter Bewegungen. Diophant löst Gleichungen auf ‘babylonische’ Weise, d. h. durch (algebraische) Umformungen, und benutzt dabei schon ein (Sonder-)Zeichen für (noch) unbekannte Zahlen, also eine Variable, nach welcher die Gleichungen aufzulösen sind (vgl. etwa Becker 1966, 115). Dies ist ein neuer Zeichengebrauch: Er unterscheidet sich von den bloß schematischen Variablen der aristotelischen Syllogistik und der Proportionenlehre dadurch, daß dort die Buchstaben nur Platzhalter für (beliebige) Begriffsworte bzw. Größenbenennungen sind. Zwar wird auch bei der Konstruktion der dritten oder vierten Proportionale diese zunächst als ‘unbekannt’ betrachtet. Die Proportionsgleichung bestimmt dann die (geometrisch-konstruktive) Lösung eindeutig, so wie Gleichungen mit Unbekannten Lösungsmengen bestimmen. Diophant aber rechnet mit der Variable wie mit einer Zahl. Und er konstruiert die Lösung auch nicht als Länge. Seine Lösungen liegen (anders als bei den modernen „diophantischen Gleichungen“) dabei nicht bloß im Bereich der ganzen Zah-
VII. Griechische und Römische Antike
len sondern im Bereich der durch (unbenannte, also rein arithmetische) Brüche gegebenen positiven rationalen Zahlen. Seine Rechenkunst ist damit schon wirkliche (arithmetische, nicht-geometrische) Algebra und wurde von den Arabern als solche tradiert und weiterentwickelt (vgl. Art. 90 § 17.). Die algebraische Konstitution von Gegenstandsbereichen, nach welcher man gewisse Gleichungen durch fiktive, weil nicht zu einem vorgängig charakterisierten Gegenstandsbereich gehörende, Gegenstände formal für ‘lösbar’ erklärt, (etwa die Gleichung x2 ⫽ 2 durch die ‘Zahl’ 2 oder gar x2 ⫽ ⫺1 durch die ‘Zahl’ i) lag allerdings noch weit außerhalb des Horizonts der antiken Mathematik.
5.
Literatur (in Auswahl)
Allen, Reginald E., (ed.) (1983), Plato’s Parmenides. Translation and Analysis. Oxford. Archimedes, Opera, gr. et lat., ed. J. L. Heiberg. 2. Auflage, Leipzig 1910⫺15. Aristotelis Opera, ed. I. Bekker, 2 Vols. Berlin 1831. Aristotle’s Prior and Posterior Analytics, ed. (with introduction and commentary) by W. D. Ross. Oxford 1949. Becker, Oskar (1933), „Eine voreudoxische Proportionenlehre und ihre Spuren bei Aristoteles und Euklid“. Quellen und Studien zur Geschichte der Mathematik, Astronomie und Physik, Abteilung B: Studien 2, 311⫺333. Becker, Oskar (1954), Die Grundlagen der Mathematik in geschichtlicher Entwicklung. Freiburg, 2. Auflage 1964. Becker, Oskar (1966), Das mathematische Denken der Antike. 2. Aufl. mit einem Nachtrag v. G. Patzig, Göttingen. Berggren, J. L. (1984), „History of Greek Mathematics: A Survey of Recent Research“. Historia mathematica 11, 394⫺410. Burnet, John (1914), Greek Philosophy. I: From Thales to Plato. London. Capelle, Wilhelm (ed.) (1969), Die Vorsokratiker: Die Fragmente und Quellenberichte. Stuttgart. Cherniss, Harold (1945), The Riddle of the Early Academy. Berkeley. Cherniss, Harold (1951), „Plato as a Mathematician“. The Review of Metaphysics 4, 395⫺425. Corcoran, John (ed.) (1974), Ancient Logic and its Modern Interpretations. Dordrecht und Boston. Dedekind, Richard (1872), Was sind und was sollen die Zahlen? und: Stetigkeit und irrationale Zahlen. Nachdruck Braunschweig 1965. Diels, Hermann und Walter Kranz (eds.) (1951), Die Fragmente der Vorsokratiker, gr. und dt. Berlin, 6. Auflage.
41. Zeichenkonzeptionen in der Mathematik Diophantus, gr. et lat., ed. P. Tannery. Leipzig 1893⫺95. Euklid, Opera omnia, ed. J. L. Heiberg, 5 Bde 1883⫺88; 9 Bde: J. Heiberg, H. Menge, M. Curtze, Leipzig (bis 1916). (Die im Text gebrauchten Buchund Paragraphen-Nummern beziehen sich auf die 13 Bände der Elemente des Euklid und deren übliche Gliederung.) Euklid: Elemente, hrsg. u. übers. v. Clemens Thaer, Ostwald’s Klassiker der exakten Wissenschaften Nr. 235, 236, 240, 241, 243. Leipzig 1933⫺37. Nachdruck: Braunschweig 1973. Fowler, David H. (1987), The Mathematics of Plato’s Academy. A New Reconstruction. Oxford. Fritz, Kurt von (1945), „The Discovery of Incommensurability by Hippasus of Metapontum“. Annals of Mathematics 48, 242⫺264. Fritz, Kurt von (1971), Grundprobleme der Geschichte der antiken Wissenschaft. Berlin. Heath, Thomas L. (1910), Diophantus of Alexandria: A Study in the History of Greek Algebra. Cambridge, England, 2. Auflage. Heath, Thomas L. (1931), A Manual of Greek Mathematics. Oxford. Abdruck auch unter dem Titel Greek Mathematics. New York 1963. Heath, Thomas L. (1949), Mathematics in Aristotle. Oxford. Heath, Thomas L. (1956), The Thirteen Books of Euclid’s Elements. Transl. from the text of Heiberg, with introduction and commentary, 3 vol., 2. rev. ed. New York. Hilbert, David (1899), Grundlagen der Geometrie. Stuttgart, 9. Auflage 1962. Inhetveen, Rüdiger (1983), Konstruktive Geometrie. Eine formentheoretische Begründung der euklidischen Geometrie. Zürich. Kapp, Ernst (1942), Greek Foundations of Traditional Logic. New York. Knorr, Wilbur R. (1980), „Archimedes and the PreEuclidean Proportion Theory“. Archives internationales d’histoire des sciences 28, 183⫺244. Knorr, Wilbur R. (1983), „‘La Croix des mathematiciens’: the Euclidean Theory of Irrational Lines“. Bulletin of the American Mathematical Society (new series) 9, 41⫺69. Knorr, Wilbur P. (1985), „Euclid’s Tenth Book: An Analytical Survey“. Historia Scientiarum 29, 17⫺35. Lear, Jonathan (1980), Aristotle and Logical Theory. Cambridge, England. Lorenz, Kuno und Jürgen Mittelstraß (1966), „‘Theaitetos fliegt’. Zur Theorie wahrer und falscher Sätze bei Platon (Soph. 251 d⫺263 d)“. Archiv für Geschichte der Philosophie 48, 113⫺152. Lorenzen, Paul (1984), Elementargeometrie. Das Fundament der Analytischen Geometrie. Mannheim. Mainzer, Klaus (1980), Geschichte der Geometrie. Zürich.
875 Mainzer, Klaus (1983), „Natürliche, ganze und rationale Zahlen“ (Kap. 1); „Reelle Zahlen“ (Kap. 2). In: H.-D. Ebbinghaus et al. (eds.), Grundwissen Mathematik I: Zahlen. Berlin, Heidelberg und New York. Pappus, Collectio mathematica, ed. Fr. Hultsch. Berlin 1876⫺78. Plato, Critical edition. Oxford Classical Texts. Oxford. Posner, Roland (1984), „Die Zahlen und ihre Zeichen. Geschichte und Ökonomie der Zahldarstellung“. In: Klaus Oehler (ed.), Zeichen und Realität. Tübingen, 235⫺247. Proclus Diadochus, In primum Euclidis elementorum commentarii, ed. G. Friedlein. Leipzig 1875. Engl.: A Commentary on the 1st Book of Euclid’s Elements. Tr. G. R. Morrow. Princeton 1970. Reidemeister, Kurt (1949), Das exakte Denken der Griechen. Hamburg. Smith, David Eugene (1963), Our Dept to Greece and Rome: Mathematics. New York. Stekeler-Weithofer, Pirmin (1986), Grundprobleme der Logik. Elemente einer Kritik der formalen Vernunft. Berlin. ´ rpa´d (1978), The Beginnings of Greek MaSzabo´, A thematics. Dordrecht und Boston. Taylor, Alfred E. (1927), Plato: The Man and His Work. New York. 5. Auflage, London 1948. Unguru, Sabetai (1975), „On the Need to Rewrite the History of Greek Mathematics“. Archive for History of Exact Sciences 15/1, 67⫺114. Unguru, Sabetai und David E. Rowe (1981⫺82), „Does the Quadratic Equation Have Greek Roots? A Study of ‘Geometric Algebra’, ‘Application of Areas’ and Related Problems“. Libertas Mathematica, Vol. 1 (I, II) und Vol. 2 (III, IV). Arlington, Texas: American Romanian Academy of Arts and Sciences. van der Waerden, Bartel L. (1950), Ontwakende Wetenschap. Groningen. Dt.: Erwachende Wissenschaft. Basel und Stuttgart 1956. van der Waerden, Bartel L. (1983), Geometry and Algebra in Ancient Civilizations. Berlin. Wieland, Wolfgang (1982), Platon und die Formen des Wissens. Göttingen. Zeuthen, Hieronymus G. (1896), Geschichte der Mathematik im Altertum und Mittelalter. Kopenhagen. Zeuthen, Hieronymus G. (1910), „Sur la constitution des livres arithme´tiques des e´le´ments d’Euclide et leur rapport a` la question de l’irrationalite´“. Oversigt over det Kgl. Danske Selskabs Forhandlinger 5, 395⫺435.
Pirmin Stekeler-Weithofer, Leipzig (Deutschland)
876
VII. Griechische und Römische Antike
42. Sign conceptions in grammar, rhetoric, and poetics in Ancient Greece and Rome 1. Three arts concerning language 2. Grammar 2.1. Origins and development of ancient grammar 2.2. Analogy and anomaly 2.3. Lexicography and philology of the works of Homer 3. Rhetoric 4. Poetics 5. Selected references 5.1. Sources 5.2. Secondary literature
1.
Three arts concerning language
Grammar, rhetoric and poetics, the three arts concerning language in the ancient Greek and Roman world (alongside dialectic, with its own special position) do not become separate subjects with their own complementary notional fields in any definitive manner until the Alexandrian era (3rd until 1st century B. C.; concerning grammar, rhetoric and poetics in other cultures cf. Art. 37 § 7., Art. 38 § 5., Art. 89 § 5.1., Art. 90 § 4. and § 5., Art. 92 § 3. and § 4., Art. 93 § 2. and § 7., Art. 94 § 4.⫺6., and Art. 95 § 4.1.). At the end of this process of individuation they take the form of three disciplines, analyzing three distinct uses or functions (Jakobson 1981, 22 ff) of language. Grammar, which broke away from the main corpus of dialectic, provides an analysis of the ordinary use of language and is to be seen in relation to the metalinguistic function. Rhetoric analyzes the pragmatic use of language and should be linked to the emotive and conative functions. Poetics examines the aesthetic use of language and relates not only to the poetic function of Jakobson, but also to the theory of narrative and to a theory of passions (see, for example, the concept of ka´tharsis in Aristotle’s Poetics). Though established in theory, however, these distinctions do not appear at all clearcut, even in the Alexandrian era: there is a pragmatic aspect in rhetoric just as there is in poetics, while the role of the emotions is fundamental to both; similarly a theory of narrative is presupposed not only by one of the traditional parts of rhetoric (the inventio) but also, for example, by Aristotle’s Poetics (cf. Art. 40 § 3.1.).
The most thorny problem, however, is the question of grammar. Prior to the Alexandrian era, grammar as an autonomous discipline does not seem to exist, though many of the themes that were later to become part of the traditional study of grammar are scattered in the writings of philosophers dealing with linguistic concepts: emblematic in this respect is the 20th chapter of Aristotle’s Poetics, which is entirely devoted to grammatical problems (cf. Art. 40 § 3.2.2.), and the Stoic treatment of dialectic, which includes a part (as reported by Diogenes Lae¨rtius, VII, 55⫺59) in which we find the essential outline of what was later to become traditional grammar (cf. Art. 40 § 3.2.3.).
2.
Grammar
2.1. Origins and development of ancient grammar Strictly speaking, once it had established its own basic forms, traditional grammar developed into a tripartite theory of language, the three parts of which deal with phonetics, morphology and syntax. It was further characterized by the treatment of a series of concepts such as the “principal” grammatical categories (parts of speech) and the “secondary” categories (notions of gender, number, case, time, etc.). The only ancient text that corresponds fully with these characteristics is Priscian’s Institutiones grammaticae, dating from the beginning of the sixth century A. D. Naturally, we know that earlier scholars of language had covered an equally wide field in their writings (if we consider them altogether), but the origins of grammar as an autonomous science are lost in obscurity; we may recall that the authenticity of the first text where the name of the discipline actually appears in the title, the Te´chne¯ grammatike˘ of Dionysius Thrax (who lived around the late second and early first century B. C.) has been the subject of considerable doubt (Di Benedetto 1958⫺59, 171 ff and 1973, 796 ff), today, however, many scholars accept the text as genuine (Pfeiffer 1968, 267⫺272; Wouters 1979, 36). Furthermore, the term “grammar” in the ancient world is ambiguous. It may be used
42. Sign conceptions in grammar, rhetoric, and poetics
to mean no more than the simple art of reading and writing: this, for example, is the meaning of the term in Plato, and it corresponds to that which was later to be called “low grammar”. Both during and after the Hellenistic era, the term is equivalent to what we would define today as “philology” or “scholarship”, i. e., the restitution, interpretation and explanation of ancient texts (later this was also called “high grammar”). Finally, within this latter category we find a discipline called “methodical grammar” or “the technical part of grammar”, which corresponds exactly to what we have defined as traditional grammar (Frede 1977, 52). Many of the concepts involved in this technical grammar, of course, developed at different times over a very long period, from the fifth century B. C. onwards, and it was their accumulation that finally formed the structure of the future discipline. Nevertheless it would be a mistake to consider the history of ancient grammar as one that followed an uninterrupted line of development (as suggested in many treatises): this prevents us from appreciating the distinction between those thinkers who fortuitously hit upon some particular grammatical notions, and those who attempted to elaborate a systematic grammar. In fact, it was the Stoics who first elaborated a corpus of concepts that correspond to traditional grammar (Frede 1977, 76 and 1978, 28 ff) and this must be borne in mind in the following historical outline which traces the development of grammatical ideas in the ancient world. An important presupposition for the birth of grammatical analysis in Greece was, as has been correctly observed (Robins 1967, 12 ff), the development of a phonetically-based alphabet; this made it possible to think of a language as an atomistic system in which the elements are combined together to form increasingly complex units: syllables, words, sentences (cf. Fig. 42.4 a and b). The individuation of the smallest elements of language (stoicheı˜a) also contributed to the elaboration of an embryonic theory of phonology: Plato, for example, distinguishes in his Cratylus between vowels, semivowels and consonants, as does Aristotle in his Poetics, though while the former assumes an acoustic point of view, the latter is framed in an articulatory perspective (Baratin and Desborbes 1981, 19). Further progress was subsequently made in this field (Gentinetta 1961, 112⫺13), though on a strictly phonetic plane there remained many gaps (cf. Robins 1967, 24 ff and Posner 1985).
877 2.1.1. The Sophists It was the Sophists, with their emphasis on the teaching of effective speaking, who were the first to show particular interest in the categories of language. Through the analysis of poetical texts which they considered authoritative, they discovered a number of important distinctions. Protagoras (ca. 485⫺ca. 415 B. C.) is credited with distinguishing between the various types of utterance or forms of linguistic act (prayer, question, answer and command) (Koller 1958) and with identifying the categories of noun gender; while an analysis of synonymic structures is attributed to Prodikos (active about 431/421 B. C.). 2.1.2. Plato Language becomes a central theme in Platonic philosophy: one dialogue, the Cratylus, is wholly dedicated to the subject, and there are also several references to it in the Sophist, the Theaetetus, and the Seventh Letter. The basic view from which Plato starts is of the logical-ontological type, as he is interested, especially in the Cratylus, in examining the relationship between language, thought and reality. Plato considers language as a kind of instrument that is used to effect a particular type of action: the le´gein (‘saying’) and the onoma´zein (‘naming’) ⫺ a reference to the pragmatic dimension of linguistics that was not to be further developed in the ancient world. However, the dialogue ends with the conclusion that language is incapable of providing any proof of the essence of things (cf. Art. 40 § 3.2.1.). This kind of philosophical approach to the question of language leaves little space for grammatical analysis in a strict sense. In the Sophist, Plato only mentions the distinction between the notion of o´noma and that of rhee˜¯ ma, as constituent parts of an utterance; but the theoretical expressions used are fundamentally ambiguous, in as much as the former may mean ‘noun’, ‘nominal form’, ‘subject’, ‘logical subject’, while the latter may signify ‘verb’, ‘verb form’, ‘predicate’ or ‘logical predicate’ (Dinneen 1967, ch. IV). The notions of o´noma and rhee¯˜ ma also appear in the Seventh Letter as components of the lo´gos, here intended as “definition” and inserted in a process of progressive acquisition of knowledge that closely resembles the “unlimited semiosis” of Peirce (cf. Manetti 1987, 102 and Lozano-Miralles 1988, 74).
878 2.1.3. Aristotle None of Aristotle’s works deals either specifically or thoroughly with the problem of language; his thought must thus be culled from references scattered throughout his vast oeuvre (cf. Art. 40 § 3.2.2.). Two passages, however, are of particular importance and provide the basis for considerable successive development: the opening chapters of De interpretatione and chapter 20 of the Poetics, in which the subject is treated from two fundamentally divergent viewpoints. In De interpretatione, Aristotle is concerned with the logical analysis of statements and is therefore interested in establishing guarantees that the operations practised on the elements of language may furnish knowledge about the referents themselves (Belardi 1975, 198 ff). In this context Aristotle replaces the dyadic relationship between language and things with a triadic relationship that requires the mediation of mental elements. Words, in fact, are symbols (sy´mbola), that refer first of all to psychic content (pathe˘ mata en tee¯˜ i psychee¯˜ i) (“passions in the mind”) which, in turn, are images or copies (homoio˘ mata) of the objects (pra´gmata) of the external world (De int. 16 a, 1⫺10). Thus the relationship of resemblance is no longer sought between words and things, as in Plato’s Cratylus, but between meanings (mental images) and referents, which prove to be linked by an iconic relationship or one of motivation. Between linguistic expressions and psychic content, on the other hand, there is an unmotivated, conventional relationship (kata` synthe˘ ke¯n). It would, however, be a mistake to identify the thesis of the conventionality of the elements of language, which Aristotle holds, too directly with the thesis of the arbitrary nature of the linguistic sign as developed in modern times by Saussure (cf. Art. 101). In actual fact, in Saussure’s theory there is an arbitrary relationship between two entities that exist strictly within language: the signifier and the signified are the two faces of the sign as a linguistic unit. In Aristotle, on the other hand, we find a conventional relationship between the elements of language (noun, verb, lo´gos) and elements that do not properly belong to language, as they are mental entities. It is symptomatic that Aristotle here adopts the expression sy´mbolon (‘symbol’) to designate linguistic expressions, a term that indicates a unit divisible into two perfectly interchangeable halves (Eco 1984, 130); this ac-
VII. Griechische und Römische Antike
cords well with his desire to ensure a perfect reciprocity between language on the one hand and thought/reality on the other. In addition to a theoretical definition of the linguistic sign, Aristotle also provides a list of the elements of language. In De interpretatione, where the prevailing interest lies in the meaningful parts of speech (me´re¯ tou˜ lo´gou), only the noun (o´noma), the verb (rhee¯˜ ma) and the sentence (lo´gos) are mentioned. By contrast, in the Poetics, where the expressive aspects of language are placed in the foreground, Aristotle provides a longer list which, however, describes not so much different classes of words as segments of speech (me´re¯ tee˜¯ s le´xeo¯s) (Pinborg 1975, 72). In the complex glottological summary in the 20th chapter of his Poetics, Aristotle follows a classificatory criterion that sets out from non-significative, non-divisible units to reach significative, divisible ones (MorpurgoTagliabue 1967, 33). The first unit to be considered is the letter (stoicheı˜on), conceived as an articulatory vocal phenomenon, that can be combined with others in such a way as to form part of an intelligible voice (pho¯ne˘ ): this characteristic distinguishes it from the sounds emitted by animals which, not being combinable, are therefore not “voices”, even though they may be significative (Tabarroni 1988, 103⫺108; Lo Piparo 1988, 83⫺87). This is followed by the syllable, defined as the combination of one or more consonants and a vowel. Then, in a passage considered to be a corrupt interpolation, we come to the sy´ndesmos and the a´rthron. The former has been interpreted as a category that includes both the modern concept of conjunction (as appearing in a passage in the Rhetorica, III, 5, 1407 a, 19 ff) and that of preposition. The expression a´rthron has been thought by some commentators to refer to the article; by others, however, it has been disregarded (Rostagni 1945, 117), while others have interpreted it as a non-technical and/or alternative name for the conjunction (Gallavotti 1974, 72 ff and Pagliaro 1955, 88⫺103), as Aristotle is traditionally credited with the individuation of only three parts of speech: the sy´ndesmos, the o´noma and the rhee˜¯ ma. The o´noma (noun) is defined as the smallest unit having meaning, the parts that form it having none in themselves; in this definition we may find an embryonic formulation of the modern principle of the double articulation of language (as presented by Martinet 1960, ch. 1.8). The rhee¯˜ ma (verb) has the same
42. Sign conceptions in grammar, rhetoric, and poetics
characteristics as the noun, but expresses also an idea of time. Examining these grammatical facts from the point of view of logic, Aristotle is led to establish the basic form of verbs in the present indicative and that of nouns in the nominative case, as it is in this form that they are found in a predicative statement. Thus he distinguishes the forms that do not fall into these cases by the name of ptoo˜¯ sis, an expression including the notions of the declined form of nouns (‘case’), the inflected form of verbs and, lastly, of a linguistic act other than that of statement. The lo´gos corresponds both to the notion of ‘sentence’ (a single unit of speech) and to that of ‘text’ (a single discourse resulting from some connecting factor), of which the Iliad is given as an example (Thornton 1986). Unfortunately Aristotle does not develop this second notion, which would have paved the way for the textual dimension of linguistics, a sphere in which the unity of a text is examined in terms of “coherence”, “connection”, etc. (Violi and Manetti 1979, 19 ff). 2.1.4. The Stoics It is generally accepted that grammar in a strict sense begins with the Stoics (Frede 1977, 76 and 1978, 28 ff), even though they did not establish a discipline separate from philosophy that bore such a name. In their minds, philosophy was divided into three broad areas: Physics, Ethics and Logic; the last of these was further divided into Rhetoric and Dialectic. It was in the sphere of Dialectic that the Stoics placed both the theory of linguistic signs and the body of truly grammatical notions (cf. Art. 40 § 3.2.3.). In the account of Sextus Empiricus (Adv. Math., VIII, 11⫺12) the Stoic theory of linguistic signs, related also to a theory of truth, involves three terms: the signifier (se¯maı˜non), the signified (se¯maino´menon, also called lekto´n, ‘that which is said’) and the external object (tyncha´non). This theory lends itself to various observations. First of all the terms “signifier” and “signified” appear (as in the modern theory of Saussure), but the term “sign” (se¯meı˜on) does not. For the Stoics, as previously also in Aristotle, the notion of se¯meı˜on belongs not to the sphere of strictly linguistic relations, but rather to the field of the relations of logical inference from antecedent to consequent, dealing largely with non-linguistic signs (Manetti 1987, 2 and 135⫺60). Secondly, although it involves three
879 terms, like the Aristotelian theory, it differs from the earlier theory through the particular nature of the term that mediates between the plane of language and that of external reality: in Aristotle this was formed of psychological entities of substantial character which, moreover, were identical for all men; for the Stoics, on the other hand, the agent of mediation is the lekto´n, a kind of formal meaning that has something in common with Hjelmslev’s concept of “form of content”, with which it shares the characteristic of variation according to different cultures (the barbarians, indeed, says Sextus, do not understand the lekto´n, even if they can hear the vocal sound and see the object to which it refers). Furthermore, considered from another point of view, the lekto´n assumes the form of a statement (as suggested also by the etymology of the word) that an utterance makes with reference to an external object (Long 1971, 77) and has therefore more the scope of a proposition than of a semantic component. In Diogenes Laertius’ account of Stoic dialectic (VII, 55⫺59), there is a section that contains a general theory of diction dealing with the aspects of ordinary language. This is followed by a consideration of “poetic” diction (VII, 60), which is a necessary condition for a theory of the rhetorical use of language; here the author expounds a theory concerning the correct use of Greek (“Hellenism”) and considers aspects of technical grammar. The Stoics considered ordinary language to be of particular importance since they held that it was the specific means by which reason is articulated. The major innovations of Stoic grammar, however, are to be found in the fields of morphology and syntax. The total number of parts of speech was expanded from three to six (cf. Steinthal 1890⫺91, I 297⫺319): o´noma, prose¯gorı´a, rhee˜¯ ma, a´rthron, sy´ndesmos, meso´te¯s. Nouns were divided into two categories: the o´noma was defined as the part of speech signifying an “individual” property (as in “Dion”), while the prose¯gorı´a was defined as the part of speech signifying a “common” property (as in “man”). The rhee¯˜ ma was defined both in semantic terms as the part of speech that signifies a simple predicate and in formal terms as a category with no case. The a´rthron included both the article and the pronoun; this played an important role in the theory of logic, in that it corresponded to the category of the ousı´a (‘substance’) and ensured the deictic function (it was typically
880 represented by the pronoun hou˜tos, ‘this’). The sy´ndesmos was defined in formal terms as a part of speech with no case that connects other parts of speech. Lastly, the meso´te¯s corresponded to adverbs derived from nouns. The Stoics were also the first to distinguish between the upright case (ptoo˜¯ sis orthe˘ ), represented by the nominative, and the oblique cases (pto˘ seis pla´giai). Unlike Aristotle, the Stoics limited the category of ptoo˜¯ sis to nouns, using another terminology for verbs. These were subdivided, on the basis of their syntactic construction, into ortha´ (corresponding to transitive verbs in the active), hy´ptia (passives) and oude´tera (neutral, corresponding to intransitive or reflexive verbs). Stoic analysis of the verb goes beyond the tense categories, also taking into consideration mode and ⫺ according to some scholars, but not all ⫺ aspect (cf. Berrettoni 1989 a, 33⫺35 and 1989 b, 161 ff). Also connected to the notions of verbal mode are the different linguistic functions of statement (axı´o¯ma), such as order, request, question, wish, etc., which already, in embryo, assume the form of a conscious theory of speech acts (cf. Art. 109). 2.1.5. Alexandrian grammar and Dionysius Thrax Unlike the Stoics and earlier philosophers, the particular contribution of the school of Alexandria to the study of language was the fruit of their interest in the field of literary criticism. Alexandria, founded on the Nile delta by Alexander the Great (cf. Fig. 42.1), became, after his death in 323 B. C., the cultural capital of the Greek world, partly thanks to two important institutions: the Museum, where the intellectuals lived and worked, and the Library, the first and the richest in the ancient world, which counted as many as 700,000 volumes. It remained the most important centre of Hellenistic culture until its conquest by the Romans in 31 B. C. at the battle of Actium. One of the most important representatives of this school was Dionysius Thrax, to whom is attributed, though not without controversy (Di Benedetto 1958⫺59 and 1973, 797 ff; Taylor 1986, 182⫺88), a te´chne¯ grammatike˘ (ca. 100 B. C.), which has influenced the study of grammar for nearly two thousand years (Kemp 1986, 343 ff). Dionysius does not define grammar as an episte˘ me¯ (‘science’) but as an empeirı´a (‘empirical knowledge’) (Langendoen 1966, 33), relating to the linguistic expressions of the poets and prose writers, and he divides it into six parts: the reading of
VII. Griechische und Römische Antike
prosody; the explanation of literary figures; the interpretation of idioms and ancient usage; the study of etymology; the calculation of regular analogical patterns; and the aesthetic appraisal of literary works. In the text that has come down to us, however, the only part that is developed is the one concerning regular analogical patterns. Dionysius is, in fact, interested in the linguistic analysis of the Stoics, but only considers those elements which allow the classification of regular elements, such as the “letters” and the “lexical categories”. He records eight parts of speech, no longer identifying them on the basis of their content, as in earlier philosophical approaches, but on a formal basis, i. e., in terms of morphological differences (for example the noun is “that part which is inflected according to case”, while the verb is “that part which is inflected according to tense, person, number”, etc.). The complete list is as follows: o´noma (‘noun’); rhee¯˜ ma (‘verb’); metoche˘ (‘participle’); a´rthron (‘article’); anto¯nymı´a (‘pronoun’); pro´thesis (‘preposition’); epı´rre¯ma (‘adverb’); sy´ndesmos (‘conjugation’). The grammar of Dionysius Thrax also contains an analysis of the secondary categories that accompany (parepo´mena) the various parts of speech (gender, number, case, type and form in the case of the noun; mode, voice, type, form, number, person, tense and conjugation in the case of the verb); there is, however, a serious gap, in that it does not deal with syntax at all. Syntax was developed in the second century A. D. by Apollonius Dyscolus, and his is the only Greek treatise to have been handed down to us on this subject. 2.1.6. Varro Grammar penetrated the Latin world through Stoic sources. These profoundly influenced Varro (116⫺27 B. C.), the first important Latin author who dealt with grammar and the only grammarian of the ancient world to reflect upon the general nature of language. For Varro, indeed, language develops from a limited group of words, originally given to things, and grows by means of phonetic and semantic mutations. Morphology in both its forms ⫺ inflection (declinatio naturalis) and derivation (declinatio voluntaria) ⫺ is seen as an extremely important factor of linguistic productivity. It is morphology that renders possible the production and comprehension of an infinite number of forms starting from a finite group of words. Hence
Fig. 41.1: A plan of the city of Alexandria. Alexandria was built on a strip of land between the sea and the Mareotis Lake. Pharus island was connected with the mainland by a mole, thus forming a second harbor. Probably the Library and the Museum as well as the other most important buildings were located b this eastern harbor (cf. Pauly-Wissowa 1893, 1379ff)
42. Sign conceptions in grammar, rhetoric, and poetics
881
882 Varro sets himself on the road that was to lead to Humboldt (cf. Art. 77 § 1.), and seems also to be aware of the principle of “economy” which, according to Martinet, characterizes the natural languages (Belardi 1985, 225 ff). Among the modern aspects of Varro we may also note his observance of the social and pragmatic nature of language, based on the different development of specific lexical areas in relation to the cultural interests of a particular society. Finally, in his theory of the parts of speech, Varro distinguishes four basic classes (the noun, the verb, the participle and the adverb), defining them in formal terms (Collart 1978, 10⫺14; Taylor 1986, 188 ff). 2.1.7. Priscian Less original than Varro, Priscian is the last great Latin grammarian (ca. 500 A. D.). His attempt to make the grammar of Dionysius fit the Latin language enjoyed great success throughout the Middle Ages (cf. Art. 53 § 1.2.). In the field of phonology he considered the letter of the alphabet (littera) as the smallest part of the articulated language, and returned to the distinction of Stoic origin between the written form of the letter (figura), its phonetic value (potestas) and its name (nomen). In the field of morphology he defined the word (dictio) as the smallest unit in the structure of the sentence, and the sentence (oratio) as the expression of a completed thought. The number of word classes was set at eight, as in the grammar of Dionysius Thrax, but the modifications introduced by earlier Latin grammarians were now definitively codified: the class corresponding to the article, which in Latin did not exist, disappeared, while the new class of interjections, which the Greeks had included in the same group as adverbs, was introduced. Influenced both by the Alexandrians and by Aristotle, Priscian mixed formal and content-based criteria in his definitions (for example, the verb is defined not only as the part of speech that “indicates an action or the suffering of an action”, but also as the part that “has forms of tense and mode, and is not inflected by case”). 2.2. Analogy and anomaly The study of language in the ancient world was marked by two celebrated controversies. The first was more philosophical in character
VII. Griechische und Römische Antike
and concerned the presumed relation between language and the objects of reality (cf. Art. 40 § 3.1.); according to some, language has a natural basis (phy´sis), while others maintained that it has a conventional basis (no´mos or the´sis). The second controversy had a more specifically grammatical character and concerned the internal nature of language, which some held to be characterized by regularity (analogı´a), and others by irregularity (ano¯malı´a). The two last-mentioned positions characterized respectively the two most important schools of the Hellenistic period. The scholars associated with the library of Alexandria upheld the analogy thesis in grammar, just as they tended towards the conventionalist view, a position easily understood in the light of their grounding in Aristotle. The scholars associated with the library of Pergamum (cf. Fig. 42.2 and Fig. 42.3), on the other hand, supported the anomaly thesis and, directly influenced by the philosophical background of the Stoics, favored the naturalistic position. It must be emphasized, however, that the Stoic thesis with regard to anomaly, as developed by Chrysippus, was originally set in a different perspective from that on which the analogy thesis was based, for there were many ambiguities from ancient times onward: indeed it concerned more the relationship between language and reality than the internal relationships within language itself, considering, for example, “anomalous” the fact that the city of Athens, singular both logically and ontologically, was denoted by a plural noun (Athee˜¯ nai). The notion of analogy, as may be seen from Plato and Aristotle, had a logical and mathematical basis; in the field of linguistics, however, it consisted of the observation of regular patterns which served as a basis for the construction of a te´chne¯ and as a criterion for determining the purity of the language. On the basis of analogy, in fact, the Alexandrians corrected the errors in the sphere of the emendation and reconstruction of ancient texts, such as those of Homer. The formal method of the analogists in constructing a grammar involved the elaboration of paradigms of nouns and verbs with the same ending. However, since they followed the example of Aristotle, concentrating on the final letters of the forms alone, without recognizing the morpheme, they were not able to demonstrate fully the role of the regular patterns in the language.
883
42. Sign conceptions in grammar, rhetoric, and poetics
Fig. 42.2: A plan of the acropolis of Pergamum: (1) Temple of Athena Polias; (2) Theater; (3) Northern Stoa; (4) Dwelling places; (5) Library; (6) Fountain; (7) Street; (8) Eastern Stoa; (9) Propylon; (10) Gate of the acropolis (cf. Enciclopedia dell’arte antica classica e orientale 1965, VI 42).
Fig. 42.3: Pergamum, reconstructive view of the acropolis (cf. Enciclopedia dell’arte antica classica e orientale 1965, VI, 39).
The antagonistic viewpoint of the anomalists involved emphasizing the role of irregularity and, to some extent, that of the individual rather than the collective. The anomalists seemed particularly convincing in one of
the two areas that were placed under the label of klı´sis (inflection): that of derivation, where there is no doubt that irregularity plays a greater role than in the declension of nouns or in the conjugation of verbs.
884 The controversy was not characterized, however, by the kind of permanent violent conflict suggested by Varro, our principal source of information on this matter, but should be seen as a reflection of two different attitudes with regard to language which, far from being mutually exclusive, can in theory be integrated, just as the langue is integrated into the parole in Saussure’s system (Collart 1954, 132⫺149; Cavazza 1981, 106⫺121). Nowadays there are also scholars who deny that there was ever such a quarrel at all (Taylor 1986, 180 ff). 2.3. Lexicography and philology of the works of Homer The importance of the Homeric epics in Greek culture and civilization in general is well-known; more particularly, the Homeric text was the first object of study in grammar, criticism and literary exegesis. The most interesting results in this field, however, were achieved by the Alexandrian school, to whose members may be attributed a method of philological research that has all the characteristics of modern scientific method. Zenodotus of Ephesus (ca. 325⫺245 B. C.) was the first to prepare a critical edition (dio´rtho¯sis) of the works of Homer, basing it on the study and comparison of a number of manuscripts. A corollary of this work was the composition of a Homeric glossary which involved the listing and explanation of difficult or rare lexical forms. Works of this kind are common ⫺ and typical ⫺ in the Alexandrian school. The methods they adopted involved operations which are still of considerable interest today. First of all there was that of substitution (anthypa´gestai) which consisted in replacing the form or the syntagm to be explained with one or more known words, supposedly of similar semantic value (cf. the elimination method of the Stoics, described in Art. 40 § 2.2., as well as the commutation test of structuralist semiotics, described in Art. 4 § 4.1.). Secondly they also had an operation for the disambiguation of homonyms (synempto˘ seis). In addition to this, recourse could be made in the work of exegesis to etymology (Pinborg 1975, 120). Of great interest in the field of lexicography is the work of Aristophanes of Byzantium (ca. 257⫺180 B. C.), whose works include a new critical edition of Homer and a work divided into several parts entitled simply Le´xeis. The latter contains, for example,
VII. Griechische und Römische Antike
descriptions of the various lexical fields, these being made up of terms sharing a common semantic-associative relationship, such as the groups of terms denoting the ages of men, women and animals (Ono´mata he¯likioo˜¯ n), and the group of terms of kinship (Perı` syngenikoo˜¯ n onoma´to¯n) and that of terms concerning civil life (Perı` politikoo˜¯ n onoma´to¯n). In his analysis of terms presumably unknown to ancient writers (Perı` too˜¯ n hypopteuome´no¯n me¯ eiree¯˜ sthai toı˜s palaioı˜s) (for example, sa´nnas, ‘insane’, the history of which is traced through several different poetic texts), Aristophanes also dealt with questions that could be defined as concerning linguistic chronology (or even historiography). He was especially interested in questions of a dialectological nature, such as when he attributed certain morphological verb endings used by the poet Lycophron of Chalcis to his regional origins. His lexical studies involved Aristophanes in a good deal of broad theoretical research which he dedicated above all to etymology and inflectional morphology. In the latter field, he discovered recurrent patterns in Greek declension and established five general rules valid in regular declension (or kano´nes, as they came to be called later: gender, case, ending, number of syllables, and accent). Additionally, the principle of regularity was defined as analogı´a, and he used the expression pa´the¯ tee˜¯ s le´xeo¯s to designate modifications of word form (a phenomenon that, as generally used in the ancient world, included both declension and derivation; cf. Pfeiffer 1968, 197 ff). However, recent historical criticism (Taylor 1986, 186) denies that Aristophanes ever gave his kano´nes a sense other than the philological one or that he ever coined the term analogı´a. The successor to Aristophanes of Byzantium and the master of Dionysius Thrax was Aristarchus of Samothrace (ca. 216⫺144 B. C.). There has long been controversy among scholars as to whether two successive new critical editions of Homer or only one may be attributed to him. There would seem to be greater evidence in favor of the second hypothesis. In any case, Aristarchus may certainly claim to be the first to have produced a written commentary (hypomne˘ mata), i. e., an edition with explanations which followed the original text line by line, unlike his predecessors who wrote only gloo˜¯ ssai, i. e., lists of obscure words, each one followed by an explanation. Nevertheless, we may assume that textual interpretation began
42. Sign conceptions in grammar, rhetoric, and poetics
885
Fig. 42.4 a: Part of a papyrus teaching manual of the third century B. C., showing the layout of syllables (cf. Bonner 1977, 170).
Fig. 42.4 b: Part of a papyrus teching manual, showing the division of words into syllables (cf. Bonner 1977, 171).
886
VII. Griechische und Römische Antike
junction’), and pro´thesis (‘preposition’). Moreover, he is credited by Charisius (Grammatici Latini I, 117) with adding a sixth rule of noun inflection to the five established by Aristophanes. However, these two testimonies ⫺ referred to as the main evidence for Alexandrian contributions to technical grammar prior to Dionysius Thrax ⫺ have raised strong doubts among modern scholars (Frede 1977, 54 ff; Taylor 1986, 185 ff). The concept of analogy was considered later, by Aristarchus, as a general principle of interpretation. This is well illustrated by the idea that the best guide to the use and interpretation of the texts of a particular author is the whole corpus of works of the author himself (his maxim Ho´me¯ron ex Home˘ rou saphe¯nı´zein, “understand Homer by means of Homer”, is well-known; cf. Pfeiffer 1968, 210 ff and Ferraris 1988, 14).
3.
Fig. 42.5: Epaphroditus of Chaeronea, Greek “grammarian”. He taught in Rome from the time of Nero to that of Trajan (cf. Bonner 1977, 50).
not with Aristarchus but with his predecessors, as it is likely that they produced commentaries on the texts viva voce in front of their students. In the field of grammar, Aristarchus is said by Quintilian (Inst. Or., I, 4, 20) to have distinguished eight parts of speech: o´noma (‘noun’), rhee¯˜ ma (‘verb’), antonymı´a (‘pronoun’), epı´rre¯ma (‘adverb’), metoche˘ (‘participle’), a´rthron (‘article’), sy´ndesmos (‘con-
Rhetoric
Rhetoric forms a large metalinguistic apparatus, the subject of which is “speech”; as such it involves various skills (cf. Barthes 1970, 173). These include (i) a te´chne¯, i. e., an art or method to induce the listener to persuasion; (ii) a “science”, able to classify the effects of language; (iii) a “teaching”, so that rhetoric formed, in the ancient world, the equivalent of the present day high-school and university system. A fundamental merit of rhetoric ⫺ one that accounted for its attraction ⫺ is the recognition of the sovereignty of language in society: indeed, rhetoric does not merely make use of speech, but uses it in the fullest, most complete manner possible (Barilli 1979, 1). Hence the way in which rhetoric subdivides the discursive dimension
Fig. 42.6: A grammar lesson. A pupil is coming into the classroom during the reading-session and salutes the teacher (a relief from Neumagen, 3rd century A. D.; cf. Bonner 1977, 56).
42. Sign conceptions in grammar, rhetoric, and poetics
Fig. 42.7: Caricature of a school (terracotta): a donkey with his class of young monkeys (cf. Bonner 1977, 124).
of language into an innumerable series of aspects, whether from the syntagmatic or the paradigmatic point of view, so as to render it a pliable instrument in the hands of the orator or rhetor. Language must be elaborated and manipulated until it becomes the mediator between three functions: docere, transmitting knowledge; movere, stirring the sentiments and emotions; and delectare, holding the attention of the audience whom one is addressing. Popular legend would have it that rhetoric was developed in the fifth century B. C. after the defeat of the tyrants in Sicily, in order to provide the citizens of Syracuse with legal assistance in their claim to the property confiscated by the tyrants. The same legend attributes to one of its mythical founders, Corax, the syntagmatic arrangement of the te´chne¯, i. e., the division of the oratio into five parts: (i) introduction; (ii) narration of the facts; (iii) argumentation of proof; (iv) digression; (v) conclusion. In actual fact, however, the real merit of the founders consists above all in their basing the art of rhetoric upon the he´uresis (“inventio”, ‘discovery’), that is, the guide for the rhetor in his search for the most effective arguments for his subject from within the existing repertory (Riposati 1973, 93).
887 The successive phase, the rhetoric of the Sophists (Protagoras, Gorgias, Hippias, Thrasymachos, etc.) was to give prominence to the idea that the real object of rhetoric is not truth (ale¯the´s), but likelihood (eiko´s). Aiming primarily at the psychagogic effect of enchantment through language, the Sophists especially developed the le´xis (“elocutio”, ‘art of speaking well’). This constitutes the paradigmatic aspect of rhetoric, in that it essentially consists in choosing the most effective expressions from within the class of terms considered as having equivalent denotative value but different connotations. In its complete form, rhetoric was presented as the organic set of five techniques (the first four are already present in Aristotle’s treatment; the fifth was not to appear until the first century B. C. in the Rhetorica ad Herennium of Cornificius): apart from (i) inventio and (ii) elocutio, which we mentioned above, it also involved (iii) dispositio (Greek ta´xis), the structuring of the material both into the five parts of a formal oration and within each part, (iv) actio (Greek hypo´krisis), the recitation of the speech in conformity with the semiotics of intonation, gesture and even the dress of the orator, and (v) memoria, (Greek mne˘ me¯ ), a complex apparatus of memory arts (Yates 1966, ch. I and II) which, associating the arguments with the individual parts into which an imaginary space was theoretically divided, enabled the orator to recall them in the correct order in which they were to be formulated. From Aristotle onward, however, rhetoric was enriched by a new element of semiotic interest: the theory of se¯meı˜on, non-linguistic sign or clue. In Aristotle, rhetoric is considered primarily a theory of circumstantial paradigms, a view resulting in a conception in which reasoning is given more importance than the figures of speech. Aristotle enters into the very heart of the mechanism of persuasion, formulating his theory of enthymeme, or rhetorical syllogism, a logical mechanism that leads to persuasion, but not necessarily to truth, as opposed to scientific syllogism that leads to infallible demonstration. Scientific syllogism, in fact, sets out from premisses recognized by everybody as true, while the enthymeme sets out from probabilities (eiko´ta) and from clues (se¯meı˜a): the former are epistemologically valid elements only in terms of probability (e. g.: “if one is loved, he loves in turn”); the latter, on the other hand, is the fruit of intuitive rea-
888
VII. Griechische und Römische Antike
Fig. 42.8: The allegory of Lady Rhetoric (cf. Clarck 1957, preliminaries).
soning (or abduction, to use a term of Peirce) and takes the shape of the typical form of inference “from the consequent”, i. e., tending to infer the cause from the effect (e. g., “if a woman is pallid, she is pregnant”). Both eiko´ta and se¯meı˜a may lead us to the truth, but not necessarily; in this they are distinct from tekme˘ ria, “necessary and incontrovertible signs”, which constitute a proof of the facts to which they refer (Manetti 1987, 118 ff). The aspect of rhetoric as a theory of circumstantial paradigms (i. e., paradigms based on clues) was to be developed particularly in the Latin world, where prominence was given to legal rhetoric, in which the presence of evidence is an essential element (Crapis 1988, 175 ff). The first Roman trea-
tise on rhetoric, the Rhetorica ad Herennium, attributed to Cornificius (Calboli 1969, 3⫺11 and 60), has a section dedicated to the constitutio coniecturalis, ‘conjectural type of case’) which specifically classifies the signs indicating the guilt or innocence of the accused; these range from evidence of premeditation to the facts of the crime itself, and finally to what may be gleaned from the reactions of the accused during the trial. Cicero also deals with this aspect of rhetoric in his works, particularly in De inventione and Partitiones oratoriae. First of all, he confirms the conception of the sign as a form of inference from antecedent to consequent, established by Aristotle; he also confirms the importance of involuntary signs (turning
889
42. Sign conceptions in grammar, rhetoric, and poetics
pale, blushing, stuttering) as evidence of guilt; finally he sets out the circumstantial paradigm in its triple time dimension (antecedence, contemporaneity, posteriority) with respect to the criminal act (Manetti 1986 a, 107 ff). Quintilian, too, dedicates a section of his twelve-book Institutio oratoria (ca. 93⫺95 A. D.) to the subject of signs. A characteristic of Quintilian is the minute detail of his classificatory system, which leads him to further subdivide the logical scheme of Aristotle on the basis of empirical criteria. Thus, for example, non-necessary signs (signa non necessaria) are classified in three different categories according to the degree of the connection that is established between antecedent and consequent: firmissimum (‘absolutely certain’), corresponding to the statistical norm, as in “if they are parents, they love their children”; propensius (‘very likely’), as in “if a person is in good health, then he will live to see the following day”; and non repugnans (‘not contradictory’), i. e., not conflicting with common sense, as in “if there has been a theft inside the house, then it has been committed by someone who was in the house” (Inst. or. V, 10, 16) (Manetti 1986 b, 785⫺ 788). Writers of treatises after Quintilian’s time accept the systems and themes of the earlier classical tradition as a block, often merely repeating them listlessly. From the semiotic point of view, the most interesting fact is the progressive intensification of the relationship (that sometimes becomes superimposition) between rhetorical and grammatical material. Thus when, in the fourth century A. D., a theory of rhetorical figures appears in the Ars grammatica of Donatus (in which it takes up the whole of the third book), this is a sign of the fact that skill in the matter of ornate discourse is now considered a necessary part of the art of correct speech. Finally, in the fifth century, it was Martianus Capella who, in his De nuptiis Philologiae et Mercurii, definitively confirmed the close links between grammar, rhetoric and dialectic as the three arts concerning language, as opposed to the four arts concerning mathematical concepts (geometry, arithmetic, astronomy and music), thus providing for the Mediaeval world the typical model of the trivium and the quadrivium (Mortara Garavelli 1988, 42 ff) (cf. Art. 1, § 2., and Art. 50 § 2. as well as Art. 3 § 1.).
4.
Poetics
In classical antiquity, poetics is a discipline with many points of contact with rhetoric, and there were often disputes between the two disciplines over the boundaries of their respective fields of application; in certain periods, indeed, they even achieved a hierarchical structure as one discipline was temporarily absorbed by the other (concering the relation of poetics and musicology cf. Art. 43 § 1.). The Sophist Gorgias can be considered the first to set himself the problem of the relation between rhetoric and poetry, when, studying the efficacy of lo´gos (‘speech’), he made a distinction between a “speech without metre” and a “speech with metre”. However, as well as this extrinsic distinction there is another that assigns to rhetoric the quality of peitho˘ (‘persuasion’) which leads to action, while assigning to poetics the quality of apa´te¯ (‘illusion’) which draws man away from reality to imagine actions that are not real (as is the case in tragedy; cf. Plebe 1968, 28 ff). Returning to the argument about the relationship between the two disciplines, Plato associates them from a negative point of view: they are not te´chnai in the strict sense of the word, but simply human skills, similar to the ability to “joke” (Phaedrus 277 e). In the Phaedrus and the Republic, however, Plato redeems the best part of poetry, on an ideal plane at least, setting it near to the divine “mania”, that transports man into an unreal dimension. Aristotle is the first to dedicate a separate book to the art of poetry, the Poetics, just as he had dedicated a treatise to the art of persuasion in the three books of the Rhetoric. The differences between the two arts for Aristotle may be summarized by the representative characterization of Barthes (1970, 178 ff), according to which in rhetoric the discourse is organized as a progression from one idea to the next, while in poetics the work progresses from one image to another. In assigning this imaginative quality to poetics, Aristotle refers back to an earlier tradition; but he makes a clear break with it, opposing Gorgias’ conception of art as a bewitching illusion and the Platonic conception of art as a “mania” with his own conception of poetry as a logical, motivated construction involving emotional states of universal value. The means of construction are many; but Aristotle particularly highlights language (to the
890 structure of which he dedicates chapters 19⫺22) and my˜thos (‘narrative structure’). Poetry is not distinguished from the other arts for the presence of versification but for the fact that it takes the form of mı´me¯sis (‘imitation’), through language, of likely or necessary facts (eiko´s and anankaı˜on), which are organized into a narrative structure (the my˜thos) with clearly defined rules (cf. Ricoeur 1983, 55⫺84 and Marrone 1988, 11 ff). In this structure we may recognize a distant ancestor of the narrative model of Propp: in order for the model to function, Aristotle, too, believes that it must follow a carefully controlled path; and this happens by means of the imitation not of particular true events (as in the case of history), but rather of possible events of general value. Finally, Aristotle esteems the pragmatic, almost perlocutionary aspect of poetry very highly, in that it must lead to ka´tharsis (‘purification of the emotions’), what Eco defined as a sort of “homeopathic cure” (1986, 54 ff), achieved through the experience of the poetic language. After Aristotle, poetics and rhetoric cease to be opposed to one another, to the advantage of a notion that transcends them both: that of “style”. The unifying element becomes a theory of writing and a classification of the literary forms. This unifying transformation may be traced back to five historical moments (Barthes 1970, 182 ff): (i) in the Roman world, the works of Ovid and the Ars poetica of Horace postulate a close relationship of rhetoric and poetics; (ii) the De compositione verborum of Dionysius of Halikarnassus, which follows Aristotelian principles but abandons all interest for the argumentative aspect of rhetoric, concentrates on an analysis of the stylistic effects of word order; (iii) Plutarch’s Quomodo adulescens poetas audire debeat attempts to overcome Plato’s censure of poets by making use of a complex argument in order to assimilate poetics and rhetoric; (iv) the anonymous treatise On the Sublime (first century A. D.) associates rhetoric and poetics in terms of the pathetic nature of their expression, though they are distinguished for the fact that whereas poetry aims at surprise, rhetoric aims at evidence; (v) in his Dialogus de oratoribus, Tacitus, noting the impossibility of practicing rhetoric because of adverse political conditions, advises the reader to dedicate himself to poetry; and thus, in the end, rhetoric finishes by itself becoming the very basis of poetics (cf. Art. 53 § 3. and 4.).
VII. Griechische und Römische Antike
5.
Selected references
5.1. Sources Apollonius Dyscolus: Apollonii Dyscoli quae supersunt, 3 vols., ed. R. Schneider and G. Uhlig (Grammatici Latini 2.1 and 2.2). Lipsiae 1878⫺ 1910. Aristoteles, Poetica ⫺ Aristotle’s Poetics, ed. J. Hutton. New York and London 1982. Aristoteles, De Interpretatione ⫺ Aristotelis Categoriae et Liber de Interpretatione, ed. L. Minio Paluello. Oxonii 1949. Aristoteles, Rhetorica ⫺ Rhetoric, ed. W. R. Roberts in: The Works of Aristotle, vol. IX. Oxford 1946. Aristoteles, Rhetorica ⫺ The “Art” of Rhetoric, ed. J. H. Frese (The Loeb Classical Library). London and Cambridge, Mass. 1957. Cicero, Marcus Tullius, Partitiones oratoriae ⫺ Division de l’art oratoire. Topiques, ed. H. Bornecque. Paris 1960. Cicero, Marcus Tullius, De inventione. De optimo genere oratorum. Topica, ed. M. H. Hubbell (The Loeb Classical Library). London and Cambridge, Mass. 1949. Cornificius, Rhetorica ad G. Calboli. Bologna 1969.
C. Herennium,
ed.
Diogenes Laertius, Vitae ⫺ Diogenes Laertius’ Lives of Eminent Philosophers, 2 vols., ed. R. D. Hicks (The Loeb Classical Library). London and Cambridge, Mass. 1958⫺59. Dionysius of Halicarnassus, De compositione verborum ⫺ On Literary Composition, ed. W. Rhys Roberts. London 1910. Dionysius Thrax, Techne Grammatike ⫺ Ars Grammatica, ed. G. Uhlig (Grammatici Graeci 2.1). Lipsiae 1883. Donatus, Aelius, Ars minor. Ars Maior, ed. H. Keil (Grammatici Latini 4). Lipsiae 1961. Horatius, Quintus Flaccus, Satyrae. Epistulae. Ars poetica, ed. H. R. Fairclough (The Loeb Classical Library). London and Cambridge, Mass. 1966. Horatius, Quintus Flaccus, Arte poetica di Orazio, ed. A. Rostagni. Torino 1930. Martianus Capella, De Nuptiis Mercurii et Philologiae, ed. A. Dick. Lipsiae 1925 (reprint 1969). Plato, Cratyl. ⫺ Cratylus. Parmenides. Greater Hippias. Lesser Hippias, ed. H. N. Fowler (The Loeb Classical Library). London and Cambridge, Mass. 1970. Plato, Ep. VII ⫺ Timaeus. Critias. Cleitophon. Menexenus. Epistles, ed. R. G. Bury (The Loeb Classical Library). London and Cambridge, Mass. 1966. Plato, Phaedr. ⫺ Euthyphro. Apology. Crito. Phaedo. Phaedrus, ed. H. N. Fowler (The Loeb
42. Sign conceptions in grammar, rhetoric, and poetics Classical Library). Mass. 1966.
London
and
Cambridge,
Plato, Resp. ⫺ Republic, 2 vols., ed. P. Shorey (The Loeb Classical Library). London and Cambridge, Mass. 1963⫺69. Plato, Soph. ⫺ Plato’s Sophist. A Commentary, ed. G. C. Neal. Manchester 1975. Plato, Soph. ⫺ Le sophiste, ed. A. Die`s. Paris 1955. Plato, Theaet. ⫺ The´e´te`te, ed. A. Die`s. Paris 1967. Plutarchus, Quomodo adulescens poetas audire debeat ⫺ Plutarch’s Moralia in Sixteen Volumes, (vol. I) ed. F. C. Babbit (The Loeb Classical Library). London and Cambridge, Mass. 1969. Priscianus, Inst. ⫺ Prisciani grammatici Caesariensis institutionum grammaticarum libri XVIII, ed. M. Hertz (Grammatici Latini 2 and 3). Lipsiae 1859 (reprint 1961). Ps.-Longinus: Longinus On the Sublime, ed. W.-H. Fyfe (The Loeb Classical Library). London and Cambridge, Mass. 1960. Quintilianus, Marcus Fabius, Institutio oratoria ⫺ Institutionis oratoriae libri duodecim, 2 vols. ed. M. Winterbottom. Oxford 1970. Sextus Empiricus, Adv. Math. ⫺ Sexti Empirici opera, ed. H. Mutschmann (vol. II). Lipsiae 1914. Sextus Empiricus, Against the Logicians, ed. R. G. Bury (The Loeb Classical Library). London and Cambridge, Mass. 1961. Tacitus, Dialogus de oratoribus ⫺ Dialogus de oratoribus. In: Tacitus in Five Volumes. Vol. I (with Agricola and Germania) ed. W. Peterson and M. Winterbottom (The Loeb Classical Library). London and Cambridge, Mass. 1970. Varro, Marcus Terentius, De lingua latina ⫺ On the Latin Language, 2 vols. ed. R. Grubb Kent (The Loeb Classical Library). London and Cambridge, Mass. 1938. Varro, Marcus Terentius, SVF ⫺ Stoicorum veterum fragmenta, part. I ed. von Arnim, 4 vols. Lipsiae 1923⫺24.
5.2. Secondary Literature Baratin, Marc and Franc¸oise Desbordes (1981), L’analyse linguistique dans l’antiquite´ classique. Paris. Baratin, Marc and Franc¸oise Desbordes (eds.) (1982), “Signification et re´fe´rence dans l’antiquite´ et au moyen aˆge” ⫽ Langages 65: 1⫺128. Barilli, Renato (1979), La retorica. Milan.
891 Berrettoni, Pierangiolo (1989 a), “An Idol of the School: the Aspectual Theory of the Stoics”. Rivesta di Linguistica I/1: 33⫺68. Berrettoni, Pierangiolo (1989 b), “Il perfetto come segno: una considerazione metastorica”. AION, Annali del Dipartimento del Mondo Classico e del Mediterraneo Antico. Sezione linguistica 11: 161⫺ 196. Bonner, Stanley F. (1977), Education in Ancient Rome. London. Calboli, Gualtiero (ed.) (1969), Cornifici Rhetorica ad C. Herennium. Bologna. Cavazza, Franco (1981), Studio su Varrone etimologo e grammatico. Florence. Clarck, D. Lemen (1957), Rhetoric in Greco-Roman Education. New York. Collart, Jean (1954), Varron grammairien latin. Paris. Collart, Jean (1978), “L’oeuvre grammatical de Varron”. In: Jean Collart (ed.), Varron. Grammaire antique et stylistique latine. Paris: 3⫺21. Crapis, Claudio (1988), “La the´orie des indices dans la rhe´torique latine”. Versus 50/51: 175⫺197. Di Benedetto, Vincenzo (1958⫺1959), “Dionisio Trace e la Techne a lui attribuita”. Annali della Scuola Normale Superiore di Pisa, Ser. II, 27: 169⫺210 and 28: 87⫺118. Di Benedetto, Vincenzo (1973), “La techne spuria”. Annali della Scuola Normale Superiore di Pisa. Ser. III, 3: 797⫺814. Dinneen, Francis P. (1967), An Introduction to General Linguistics. New York. Eco, Umberto (1984), Semiotics and Philosophy of Language. Bloomington IN. Eco, Umberto (1986), “Aristotle: Poetics and Rhetoric”. In: Thomas A. Sebeok (ed.), Encyclopedic Dictionary of Semiotics. Berlin, New York and Amsterdam: 54⫺55. Egli, Urs (1967), Zur stoischen Dialektik. Basel. Enciclopedia dell’arte antica e orientale, vol. VI. Rome 1965. Ferraris, Maurizio (1988), Storia dell’ermeneutica, Milan. Frede, Michael (1977), “The Origins of Traditional Grammar”. In: Robert E. Butts and Jaakko Hintikka (eds.), Historical and Philosophical Dimensions of Logic, Methodology and Philosophy of Science. Dordrecht and Boston: 51⫺79.
Barthes, Roland (1970), “L’ancienne rhe´torique”. Communications 16: 172⫺229.
Frede, Michael (1978), “Principles of Stoic Grammar”. In: John M. Rist (ed.), The Stoics. Berkeley, Los Angeles and London: 27⫺76.
Belardi, Walter (1975), Il linguaggio nella filosofia di Aristotele. Rome.
Gallavotti, Carlo (ed.) (1974), Aristotele. Dell’arte poetica. Milan.
Belardi, Walter (1985), Filosofia, grammatica e retorica nel pensiero antico (Lessico intellettuale europeo 37). Rome.
Gentinetta, Peter M. (1961), Zur Sprachbetrachtung bei den Sophisten und in der Stoisch-Hellenistischen Zeit. Winterthur.
892 Jakobson, Roman (1981), “Linguistics and Poetics”. In: Stephen Rudy (ed.), Selected Writings, III, Poetry of Grammar and Grammar of Poetry. The Hague, Paris and New York: 18⫺51. Kemp, Alan (1986), “The Tekhne Grammatike of Dionysius Thrax: English Translation with Introduction and Notes”. Historiographia Linguistica XIII/2⫺3: 343⫺363. Koller, Hermann (1958), “Die Anfänge der griechischen Grammatik”. Glotta 37: 5⫺40. Lallot, Jean (1985), “Etudes sur les grammairiens grecs”. Histoire, Episte´mologie, Langage 7: 47⫺81. Langendoen, Terence D. (1966), “A Note on the Linguistic Theory of M. Terentius Varro”. Foundations of Language 2: 33⫺36. Lausberg, Heinrich (1960), Handbuch der literarischen Rhetorik. Eine Grundlegung der Literaturwissenschaft. 2 vols. Ismaning near Munich. Long, Anthony A. (1971), “Language and Thought in Stoicism”. In: A. A. Long (ed.), Problems in Stoicism. London: 75⫺113. Lo Piparo, Franco (1988), “Aristotle: The Material Conditions of Linguistic Expressiveness”. Versus 50/51: 83⫺102. Lozano-Miralles, Helena (1988), “Sign and Language in Plato”. Versus 50/51: 71⫺82. Manetti, Giovanni (1986 a), “Cicero”. In: Thomas A. Sebeok (ed.), Encyclopedic Dictionary of Semiotics. Berlin, New York and Amsterdam: 107⫺109. Manetti, Giovanni (1986 b), “Quintilian”. In: Thomas A. Sebeok (ed.), Encyclopedic Dictionary of Semiotics. Berlin, New York and Amsterdam: 785⫺788. Manetti, Giovanni (1987), Le teorie del segno nell’antichita` classica. Milan. English translation: Theories of the Sign in Classical Antiquity. Bloomington IN 1993. Manetti, Giovanni (ed.) (1988), “Signs of Antiquity/Antiquity of Signs” ⫽ Versus 50/51:1⫺223. Marrone, Gianfranco (1988), “Due problemi aristotelici”. Quaderni del circolo semiologico siciliano 31. Martinet, Andre´ (1960), Ele´ments de linguistique ge´ne´rale. Paris. Morpurgo-Tagliabue, Guido (1967), Linguistica e stilistica di Aristotele. Rome. Mortara-Garavelli, Bice (1989), Manuale di retorica. Milan. Pagliaro, Antonino (1955), “Il capitolo linguistico della Poetica di Aristotele”. In: Nuovi saggi di critica semantica. Florence: 77⫺131. Pauly-Wissowa: Georg Wissowa (ed.) (1993), Pauly’s Realencyclopädie der classischen Alterthumswissenschaft in alphabetischer Ordnung. 10 vols. 1st half volume. Stuttgart.
VII. Griechische und Römische Antike Pfeiffer, Rudolf (1968), History of Classical Scholarship from the Beginning to the End of the Hellenistic Age. Oxford. Pinborg, Jan (1975), “Classical Antiquity: Greece”. In: Thomas A. Sebeok (ed.), Current Trends in Linguistics, vol. 13: Historiography of Linguistics. The Hague and Paris: 69⫺126. Plebe, Armando (1968), Breve storia della retorica antica. Bari. Posner, Roland (1985), “Syntactics: Its Relation to Morphology and Syntax, to Semantics and Pragmatics, and to Syntagmatics and Paradigmatics”. In: Thomas T. Ballmer and Roland Posner (eds.), Nach-Chomskysche Linguistik. Berlin and New York: 247⫺265. Ricoeur, Paul (1975), “Entre rhe´torique et poe´tique: Aristote”. In: La me´taphore vive. Paris: 13⫺61. Ricoeur, Paul (1983), “La mise en intrigue. Une lecture de la Poe´tique d’Aristote”. In: Temps et re´cit, vol. I. Paris: 55⫺84. Riposati, Benedetto (1973), “La retorica”, in A. A. V. V., Introduzione allo studio della cultura classica. Milan: 93⫺115. Robins, Robert H. (1967), A Short History of Linguistics. London. Romeo, Luigi (1975), “Classical Antiquity: Rome”. In: Thomas A. Sebeok (ed.), Current Trends in Linguistics, vol. 13: Historiography of Linguistics. The Hague and Paris: 127⫺177. Rostagni, Augusto (1945), Aristotele. Poetica, introduzione, testo e commento. Turin. Steinthal, Heymann (1890⫺91), Geschichte der Sprachwissenschaft bei den Griechen und Römern. Mit besonderer Rücksicht auf die Logik. 2nd edition Berlin. 2 vols. Reprint Bonn 1961. Tabarroni, Andrea (1988), “On Articulation and Animal Language in Ancient Linguistic Theory”. Versus 50/51: 103⫺121. Taylor, Daniel J. (1986), “Rethinking the History of Language Science in Classical Antiquity”. In: D. J. Taylor (ed.), The History of Linguistics in the Classical Period, Historiographia Linguistica XIII/ 2⫺3: 175⫺190. Thornton, Anne M. (1986), “Logos-phrase et logostexte chez Platon et Aristote”. In: H. Joly (ed.), Philosophie du langage et grammaire dans l’Antiquite´. Brussels: 165⫺179. Violi, Patrizia and Giovanni Manetti (1979), L’analisi del discorso. Rome. Wouters, Alfons (1979), The Grammatical Papyri from Graeco-Roman Egypt: Contributions to the Study of the ‘ars grammatica’ in Antiquity. Brussels. Yates, Frances A. (1966), The Art of Memory. London.
Giovanni Manetti, Siena (Italy)
893
43. Zeichenkonzeptionen in der Musik
43. Zeichenkonzeptionen in der Musik der griechischen und römischen Antike 1. Musike´ 1.1. Melos 1.2. Logos 1.3. Harmonie 1.4. Rhythmus 1.5. Ethos 2. Musikalische Zeichen 2.1. Die Notenschrift 2.2. Geschichtliche Fragen 2.3. Beispiel 2.4. Rhythmische Zeichen 2.5. Die Bedeutung des Klangs 3. Literatur (in Auswahl)
1.
Musike´
Alles spricht dafür, daß in der 2. Hälfte des 5. vorchristlichen Jahrhunderts in Griechenland die ‘alte Musik’ abgelöst worden ist (zu den Konzeptionen der Musik in anderen Kulturen vgl. Art. 89 § 5.2.: Alter Orient, Art. 92 § 4.4.: Indien, Art. 93 § 10.1.: China, Art. 95 § 4.3.: Japan und Art. 97 § 7.: Indonesien). In den Augen der meisten damaligen Zeugen ⫺ von der Zeit des Sokrates und des Aristophanes an ⫺ wurde die neue Musik als dekadent und als die alten musikalischen Grundlagen zerstörend angesehen. Aufgegeben wurde in ihr der alte Begriff von Musik ⫺ das Wort mousike˘ ist erstmals 476 v. Chr. in Pindars erster Olympischer Ode belegt ⫺, das heißt die Einheit des Musischen, sofern Musik, Dichtung, Schauspiel, Tanz usw. zuvor als unauflösbar ineinander verwoben aufgefaßt waren. Als Symptome des Niedergangs gelten unter anderem die Verselbständigung der Instrumentalmusik und der Aufschwung des Virtuosentums. Gleichgültig, ob und inwiefern jene neue Musik (wie so viele neue Kunst eben deshalb, weil sie neu ist) bloß für konservative Haltung ins Zwielicht geraten ist und welche Veränderungen die Musik in ihrer Beschaffenheit damals tatsächlich erfuhr, es vollzog sich im Laufe jenes Übergangs zweierlei: Das Musikalische ⫺ der hörbare Kosmos ⫺ trat als eigenständiges Bezugssystem schärfer ans Licht, und damit einhergehend verselbständigte sich die in ihren Wurzeln wohl noch bis ins 7. Jahrhundert zurückreichende Musiktheorie zu einer Fachdisziplin, die man Musikwissenschaft nennen kann und die durch zusammenhängende Texte für uns zugänglich ist durch den Aristoteles-Schüler
Ariostoxenos von Tarent in der 2. Hälfte des 4. Jahrhunderts v. Chr. (zum Status der Poetik in Griechenland vgl. Art. 42 § 4.). 1.1. Melos Spätestens seit Aristoxenos gehört me´los zum Bestimmungsgrund der antiken Musike´ als Kunst (te´chne¯ ) oder Wissenschaft (episte˘ me¯ ). Platon (Politeia III, 398 c/d) definiert das Melos als aus lo´gos, harmonı´a und rhythmo´s zusammengesetzt; gemeint sind hier: Wort (der Text zur Musik), Tonart (die Harmonie) und Rhythmus. In dieser Definition von ‘Gesang’ räumt Platon dem Logos als der ‘Rede’, die die Erzählung (die˘ ge¯sis) und die Fabel (my˜thos) trägt, Vorrang ein. (Der reinen Instrumentalmusik mangelt dieser Logos.) Im Unterschied zu melo¯dı´a ⫺ wörtlich: dem gesungenen Melos ⫺ ist Melos ‘Lied’, ‘Weise’ ungefähr in der Verallgemeinerung, in der man auch im Deutschen für ein ganzes Musikstück „Melodie“ sagen kann. Es darf nicht wunder nehmen, daß die platonische Bestimmung des Melos bis heute als Musik-Definition zitiert wird. Schon in der Antike selbst wurde hie und da Melos durch Musik (und lo´gos durch le´xis, den sprachlichen Ausdruck) ersetzt; und in einer weiteren Variation konnte dann das frei gewordene Melos in Form der später geläufigeren Melodie den anfänglichen Definitionsbestandteil Logos/ Lexis ersetzen, der nur solange unverzichtbar war, als das Musikalische wesentlich oder sogar ausschließlich als (modern gesprochen) Vokal-Musik bestimmt werden sollte. Damit gelangt man zu jener Dreidimensionalität ⫺ Musik bestehe aus Melodik, Harmonik und Rhythmik ⫺, die noch immer gebräuchlich ist, auch wenn das Bewußtsein für jene anfängliche Einheit der Musike´ längst unwiderruflich verschwunden ist. 1.2. Logos Der griechische Terminus für Sprache, Rede, Vernunft usw. ⫺ lo´gos ⫺ zielt jedoch nicht nur auf die an der gesungenen Musik beteiligte Sprache ⫺ den gesungenen Text ⫺, sondern ist in der Bedeutung von ‘(mathematischem) Verhältnis’ auch Grundlage der Musiktheorie überhaupt, insbesondere pythagoreischer Observanz. Für die Überzeugung, daß alles Zahl sei, bietet die Musik sich
894 als ein ausgezeichnetes Anschauungsmodell an, soweit die Tonverhältnisse bzw. Tonbeziehungen auf Zahlenverhältnisse zurückgeführt werden können, und zwar in allererster Linie im Blick auf das Tonsystem (die Tonhöhenordnung bzw. die Harmonik), daneben aber auch, damals in bescheidenerem Maße, im Blick auf die Rhythmik. Die Ordnung der Töne in der Musik galt als Ausdruck ⫺ als Abbild, Darstellung, Zeichen usw. ⫺ rationaler Verhältnisse (lo´goi), versinnbildlicht vor allem durch die ersten drei Konsonanzen (sympho¯nı´ai) 2 : 1 ⫽ Oktave, 3 : 2 ⫽ Quinte, 4 : 3 ⫽ Quarte usw. Immerhin ließen sich die Konsonanzen bis zur Oktave durch die pythagoreische Tetraktys (die ersten vier ganzen Zahlen 1, 2, 3, 4 mit der Summe 10) darstellen, während die größeren Konsonanzen mit Hilfe der Oktave auf die kleineren Konsonanzen zurückgeführt werden konnten, z. B. die Duodezime (3 : 1) als Summe aus Oktave und Quinte: (2 : 1) ⫻ (3 : 2) ⫽ 3 : 1. Umgeht man die harmonische Teilung der Oktave in Quinte und Quarte (2 : 1) ⫽ (3 : 2) ⫻ (4 : 3) ⫺ sie enthält die drei Grundkonsonanzen ⫺ und versucht man die Oktave in zwei gleiche Intervalle zu teilen, dann entsteht ein a´logon, ein irrationaler Wert (冪2), und für eine auf die Rationalität des Kosmos der Töne eingestellte Erklärungsweise blieb dies so beunruhigend wie die Entdeckung der Inkommensurabilität, die in der Geometrie bei leicht zu konstruierenden Strecken wie der Seite und der Diagonale im Quadrat begegnet (vgl. Becker 1957, 157 ff; siehe auch Art. 41, § 3.3.). Die Bestimmung der Tonhöhen- bzw. Intervallverhältnisse geschah „mathematisch“, nicht im heutigen Sinne „physikalisch“. Ablesbar sind die Zahlenverhältnisse beispielsweise am Verhältnis von Saitenlängen: Die halbierte Saite ergibt einen Ton, der eine Oktave höher klingt, als wenn die ganze Saite angeschlagen wird: 1 : 1/2 ⫽ 2 : 1. Die Saitenteilung läßt sich am Monochord ⫺ dem kano˘ n ⫺ demonstrieren, das zum Meßinstrument der Musik in der Antike geworden war. Allerdings deckt sich der Anfang der erst in der neuzeitlichen Akustik entdeckten Obertonreihe (1, 2, 3, 4) mit den antiken Grundkonsonanzen Oktave, Quinte und Quarte (1 : 2 : 3 : 4). In der Antike, die von den Frequenzverhältnissen noch nichts wußte, wurde darüber gestritten, ob die Intervalle (Strekken-)Abstände (diaste˘ mata) oder bloße Verhältnisse (lo´goi) sind (vgl. Riethmüller 1985, 18 ff).
VII. Griechische und Römische Antike
1.3. Harmonie Wie der Rhythmus als eine kunstvolle Mischung aus schneller und langsamer Bewegung erklärt werden kann, so ist harmonı´a in der griechischen Musik eine „kunstvolle Mischung aus dem ‘Hohen’ und ‘Tiefen’ des Klanges (im Griechischen als oxy´s ‘scharf’ und bary´s ‘schwer’ qualitativ bezeichnet)“ (Lohmann 1970, 103). Jenseits des allgemeinen Horizonts, in dem auch heute noch von Harmonie als gefügter Ordnung in verschiedenen Bereichen gesprochen wird, jenseits auch der schieren Synonymität von Harmonie und Symmetrie hat harmonı´a früh speziell musikalische Bedeutung erlangt: Zunächst (bei Philolaos B 6 Diels-Kranz) heißt harmonı´a Oktave, sodann (bei Platon und anderen) Oktav-Struktur bzw. ⫺ wie to´nos ⫺ Tonart und bezeichnet außerdem im Unterschied zum diatonischen und chromatischen das enharmonische Tongeschlecht (auch: ge´nos enharmo´nion). Die auf die Ordnung und Organisation der Tonhöhen gerichtete Idee der musikalischen Harmonie ⫺ Platon (Symposion 187 b) nennt sie auch eine sympho¯nı´a (lat. consonantia) ⫺ hat der gesamten theoretischen Beschäftigung mit dem Tonsystem den Namen Harmonik (harmonike˘ ) gegeben, die Aristoxenos (Elementa harmonica 1 Meibom) als der Reihe und dem Rang nach erste Teildisziplin der Musiktheorie bzw. der Wissenschaft vom Melos (perı` me´lous episte˘ me¯ ) bezeichnet. 1.4. Rhythmus Der zunächst vom Wort abhängige und eng an die Versmetrik gekettete griechische Rhythmus ⫺ eine Quantitätsrhythmik ⫺ kennt im wesentlichen nur aneinandergereihte Längen und Kürzen, die sich zueinander wie das Doppelte zum Einfachen verhalten (vgl. Georgiades 1958, 11). Zwischenwerte ⫺ das Anderthalbfache ⫺ begegnen ebenfalls; Aristoxenos spricht in diesem Zusammenhang vom rhythmisch Irrationalen (a´logon; vgl. Westphal 1883, 26; 1893, 82). Das rhythmische Prinzip der Antike, genau gesagt der Zeit jener alten Musik, „beruht nicht auf einer Trennung zwischen Zeitgliederung (Takt, Betonungssystem) und Ausfüllung (durch verschiedene Notenwerte), sondern auf der von Hause aus erfüllten Zeit“ (Georgiades 1954, 5). Beim Rhythmus handelt es sich um ein „formales Prinzip: die temporale Ordnung, in deren Sinne die Elemente der musischen Künste, die Silben,
895
43. Zeichenkonzeptionen in der Musik
Töne und Schritte, aufeinander zu beziehen sind“ (Seidel 1980, 7), wobei der Zusammenhang von Rhythmus und Zahl schon von Platon und Aristoteles betont worden ist; im lateinischen Mittelalter ist numerus sogar der eigentliche Rhythmus-Begriff. Vor dem Hintergrund der Behandlung von Bewegung und Zeit in der griechischen Philosophie herrscht in der musikalischen Rhythmik (wie in der Harmonik) die systematische Ordnung vor, wie die hauptsächliche Definition von Aristeides Quintilianus (De musica I, 13) exemplarisch belegt: „Rhythmus ist ein System (sy´ste¯ma) aus Zeiten (chro´noi), die gemäß einer Ordnung (ta´xis) zusammengesetzt sind.“ Wie für die Darstellung der Tonhöhen sind für die rhythmische Darstellung Zeichen eingeführt worden (vgl. § 2.4.). 1.5. Ethos Eine Besonderheit der ‘alten Musik’ besteht in der Lehre vom Ethos der Musik, die wohl pythagoreischen Ursprungs und vor allem durch Platon (Politeia, Nomoi) und Aristoteles (Politik, Buch VIII) überliefert ist. Sie besagt, daß Musik einerseits bestimmte Charaktere (e˘ the¯ ) zum Ausdruck bringt, darstellt oder nachahmt und daß die Seele, der Charakter andererseits auf diese Weise gebildet oder erzogen wird. Dies kann verschieden geschehen: durch die Musik im ganzen (durch bestimmte Tonstücke) oder durch einzelne ihrer Teile, etwa durch die verwendeten Musikinstrumente, insbesondere jedoch durch Rhythmen und Tonarten (harmonı´ai), unter denen zum Beispiel dorisch als tapfer und männlich, andere Tonarten wiederum als verweichlichend und verweiblichend angesehen worden sind. (Die damit angesprochene antike Tonartencharakteristik ⫺ die Auffassung, die verschiedenen Tonarten seien Träger je eigener Ausdrucks-Inhalte ⫺ gehört wie die neuzeitliche zu den nicht zureichend erklärten musikalischen Phänomenen; vgl. Art. 68 und 81.) Den Hintergrund für eine solche Lehre von den psychischen bzw. ‘ethischen’ Wirkungen der Musik bildet neben dem Konzept der Katharsis (vgl. Art. 42 § 4.) ⫺ der therapeutischen Reinigung des Körpers und/oder der Seele von belastenden Zuständen, deren Effekt wohl eher durch Abreaktion als durch Läuterung erzielt worden ist ⫺ das auf die Musik bezogene Erklärungsmodell der Mimesis, die je nach Kontext und Akzentuierung als Prozeß der Präsentation, Imitation oder Reflexion (Abbildung) erscheint. Die ge-
wissermaßen direkte Abbildung ist nach Aristoteles (Politik VIII, 5, 1340 a) sogar hauptsächlich eine Angelegenheit der Musik, da sie in anderen Sinnesbereichen nicht vorkomme, weder beim Tast- noch beim Geschmackssinn und nur eingeschränkt im Visuellen. Farben und gesehene Formen sind eher Zeichen (se¯meı˜a), nicht Abbilder (homoio˘ mata, mı´me¯ma) der Charaktere. Während, so folgt daraus, im visuellen Bereich ⫺ in der Malerei etwa ⫺ die Gegenstände in ihren Formen und Farben abgebildet werden können, die Charaktere (e˘ the¯ ) aber nur nebenher, ist es in der Musik gerade umgekehrt: Sie kann Gegenstände nur beiläufig tonmalerisch (also symbolisch oder durch Zeichen) abbilden, dafür aber zentral die Charaktere. Zusammen mit dem Wandlungsprozeß von der alten zur neuen Musik traten auch die Kritiker der Ethos-Lehre auf, von denen etwa schon die um 400 v. Chr. verfaßte sogenannte Hibeh-Rede über die Musik stammt. Die Gegner sahen die Bestimmung der Musik weder darin, den Charakter des Menschen heben, veredeln oder überhaupt beeinflussen zu wollen, noch darin, sie zu besseren Staatsbürgern zu machen, worauf die Doktrin hauptsächlich abgezielt hatte. Die Kritik setzt bei den vielfältigen Beispielen musikalischer Wunderwirkungen ⫺ biblisch etwa die „Posaunen von Jericho“ ⫺, aber auch bei den realeren physischen und psychischen Wirkungen an, um die Bildung des Charakters durch Musik zurückzuweisen. Durch Musik wird niemand ⫺ Soldaten etwa ⫺ tapferer oder feiger, und sofern Musik bzw. das Melos, wie es bei Philodemos von Gadara heißt, ohne Sprache ist (a´logos, wortlos; Hauptbedeutung: unvernünftig, irrational; vgl. Art. 41 § 3.2.), fällt sie aus der ethisch-moralischen Hauptbeeinflussung des Charakters, nämlich durch Sprache, ohnehin heraus (zit. nach Abert 1899, 28 Anm.). Die die antik-abendländische Geschichte durchziehenden, ja bestimmenden beiden Positionen einer notwendigen Verbindung des Ethischen und des Ästhetischen einerseits und ihrer Trennung andererseits war damit im Blick auf die Musik formuliert.
2.
Musikalische Zeichen
Der Begriff zugleich des Buchstabens und des Zeichens (se¯meı˜on) bezieht sich im griechisch-antiken Musikschrifttum in erster Linie auf das Notenzeichen. Dies liegt nahe, da
896 die griechische Notenschrift sich nicht eines beliebigen Zeichen- oder Symbolsystems bedient hat, sondern ⫺ wie auch im System zur Darstellung von Zahlen ⫺ grosso modo der Buchstaben des Alphabets. Auch heute noch werden zur Bezeichnung von Tönen bzw. Tonstufen dem Alphabet entnommene Tonbuchstaben verwendet (c, d, e, f, g, a, [b], h) und die erforderlichen Modifikationen dieser Stammtöne (die Hoch- und Tiefalterationen) durch Abänderungen der Buchstaben angezeigt (z. B. bei a durch ais, aisis, as, asas). Der radikale Unterschied besteht jedoch darin, daß die griechischen Tonstufen Namen hatten (wie Me´se¯, Ne˘ te¯ und Hypa´te¯ ) und die die Töne bezeichnenden Buchstaben die Notenzeichen der Notenschrift selbst bildeten, während wir für die Notenschrift ein eigenes Aufschreibsystem jenseits der Sprache kennen, mit dem Noten-‘Texte’ hergestellt werden können und in dem Buchstaben keine, allenfalls eine marginale Zeichen-Rolle spielen, während die Töne keine Namen mehr haben, sondern durch Buchstaben bezeichnet werden. 2.1. Die Notenschrift Unterscheiden lassen sich eine noch bis ins 6. vorchristliche Jahrhundert zurückreichende „Instrumentalschrift“ und eine wohl noch im 5. Jahrhundert entwickelte „Vokalschrift“. Beide Male liegt ein Alphabet zugrunde, ein altdorisches dort, das ionische hier (vgl. Pöhlmann 1960, 5). Das Zeichenrepertoire besteht aus den Buchstaben selbst sowie aus Angaben von Modifikationen, darunter Lageveränderungen wie Drehungen, Spiegelungen usw. Das gesamte Zeichenmaterial der Instrumentalschrift
und der Vokalschrift
erhält im Bereich des Doppeloktav-Grundsystems, das in modernen Tonbuchstaben gewöhnlich mit a’⫺A wiedergegeben wird, eine Gruppierung, sofern die je dritten Zeichen die diatonischen Stammtöne bedeuten:
(nach Gombosi 1939, 20). Eine mehr oder weniger auf dem Alphabet beruhende Notenschrift („Buchstaben-Notenschrift“) eignet sich am ehesten für die Darstellung einer im
VII. Griechische und Römische Antike
Prinzip einstimmigen Musik wie der der griechischen Antike. Sie ist weder (verglichen mit den späteren Liniensystemen) besonders anschaulich, noch lassen sich durch sie kompliziertere, etwa mehrstimmige Strukturen übersichtlich abbilden (vgl. Art. 54 § 3. und Art. 60 § 6.5.). 2.2. Geschichtliche Fragen Die mit der griechischen Notenschrift und ihrer Überlieferung aufgeworfenen Probleme sind schwierig und vielleicht nicht (mehr) vollständig auflösbar. Die Quellen für die griechischen Notenzeichen stammen ausschließlich aus der Spätantike, musikalische Fragmente hingegen schon aus hellenistischer Zeit (3. Jh. v. Chr.⫺3. Jh. n. Chr.). Wenn es sicher ist, daß im 5. Jahrhundert „nach Noten musiziert“ und im Hellenismus „schriftlich komponiert“ wurde (Pöhlmann 1960, 10) ⫺ es ist fraglich, ob es sinnvoll wäre, von einem schriftlosen Komponieren, das im Improvisieren bestünde, zu sprechen: einen eigenen Begriff musikalischer Komposition kennt die Antike nur eingeschränkt ⫺, dann verwundert es nicht nur, warum aufs ganze gesehen nur ein verschwindender Teil von Musikfragmenten überliefert ist (zuletzt hrsg. von Pöhlmann 1970), sondern auch, warum die Notenzeichen erst so spät im musiktheoretischen Schrifttum begegnen (wenigstens, soweit uns dies erhalten ist). Die Hoffnung darauf, durch Entzifferung der Notenschrift besser in die Lage versetzt zu sein, die griechische Musik klanglich zu rekonstruieren, ist ebenso verlockend wie trügerisch. „Es wäre falsch, jene Notierungen als heutige Musik wiederzugeben“ (Georgiades 1958, 20). Vielfach auch wird die sachliche Argumentation von Meinungen und Positionen der Untersuchenden bestimmt und die griechische Notenschrift so immer wieder in den Werte-Streit hineingezogen, der angesichts der musikalischen Notation überhaupt herrscht. Gegenwärtig besteht, befördert durch die musikethnologischen Fortschritte mit ohnehin schriftlosen Kulturen (vgl. Art. 2 § 2.) und unter positiv gesetzten Stichworten wie Spontaneität und Unmittelbarkeit, (wieder einmal) die Tendenz zur Geringschätzung aufgeschriebener Musik, gegen die manche teils versteckte, teils offene Ranküne selbst unter Musikern verbreitet war und ist, zumal da notierte Musik geschichtlich gesehen nie conditio sine qua non des Musizierens war. Stellt man die Notation hingegen einerseits in den Horizont einer entwicklungsgeschicht-
43. Zeichenkonzeptionen in der Musik
lichen künstlerischen Vervollkommnung und bemißt man die Bedeutung der Erfindung der Notenschrift in der Musik andererseits parallel zur Herausbildung von Schrift in der Sprache, dann ist der „Semiographie (Notation) der Griechen“ jener hohe Rang einzuräumen, den Johann Nikolaus Forkel (1788, 364) so formuliert: „Unter allen Hülfsmitteln, die Musik auf einen gewissen Grad von Vollkommenheit zu bringen, war gewiß die Erfindung der Notenschrift die wichtigste.“ Trotz der „mangelnden Beschaffenheit“ derselben erblickt Forkel in ihr den entscheidenden Grund für alles, was die Griechen den anderen Völkern damals „voraus hatten“. In der Antike selbst scheint es Divergenzen über Sinn und Nutzen der Notenschrift gegeben zu haben. Pöhlmann (1960, 13) ist der Auffassung entgegengetreten, die griechische Notenschrift sei ein an der musikalischen Praxis bzw. am Musikleben vorbeizielendes „Reservat der Musiktheorie“ gewesen, und hat deutlich gemacht, daß gerade die Laien auf sie angewiesen waren, während sie den Theoretikern nicht ausgefeilt genug erschien. (In Fragen der musikalischen Notation durchkreuzen sich stets wieder pädagogische, theoretische und künstlerische Aspekte.) Für Aristoxenos (Elemente harmonica 39 f Meibom) werden durch das Notieren (parase¯maino´menon) notwendig nur die Größen der Intervalle ⫺ mit anderen Worten die bloßen Unterschiede der Tonhöhen ⫺ deutlich; anderes Wesentliche der Musik werde durch eine solche Art Aufzeichnung überhaupt nicht verständlich, so die Funktionen der Tetrachorde und Töne, die Unterschiede der Genera und vieles andere. 2.3. Beispiel Ein kleineres Musikfragment eines Papyrus des 3./2. Jahrhunderts (Pap. Wien 29 825 a/b recto) zeigt die Notenzeichen wie üblich über dem (hier anapästischen) Text. Tonwiederholungen sind (in diesem Stadium) nicht notiert, auch fehlt eine rhythmische Notierung (vgl. § 2.4.). Eine Modulation (von lydisch diatonisch nach hypophrygisch chromatisch) findet sich in Zeile 6; darauf weist auch die Inskription phrygistı´ zwischen den Notenzeichen dieser Zeile (vgl. Abb. 43.1). 2.4. Rhythmische Zeichen Das Vorhandensein von den Tonhöhenzeichen unabhängiger rhythmischer Zeichen ist spätestens seit Aristoxenos zu veranschlagen. Die wenigen vorkommenden Zeichen ⫺ etwa
897 der Disemos für die Länge (⫺) oder das Stigma für die Arsis (·) ⫺ sind im Vergleich zu den Tonhöhenzeichen leicht zu verstehen und zu memorieren. Es ist schwer zu sagen, ob die Überschneidungen mit der älteren, im 2. Jahrhundert v. Chr. dann von den alexandrinischen Philologen um Zeichen ergänzten Prosodie mehr ins musikalisch-musiktheoretische oder ins grammatische Fach einschlagen. Jedenfalls bezieht, theoretisch gesehen, Aristeides Quintilianus (De musica I, 14) den se¯meı˜on-Begriff auch auf den Rhythmus. Den erstmals durch Aristoxenos bezeugten chro´nos pro˘ tos ⫺ die ‘erste Zeit’ bzw. kleinste und nicht weiter teilbare musikalische Zeiteinheit ⫺ wurde auch se¯meı˜on genannt, und zwar so, wie auch die Geometer von ihrem Unteilbaren (amere˘ s) sagten, es sei ein Zeichen (gemeint ist der Punkt), und dieser unteilbare chro´nos nimmt den Platz gewissermaßen einer Monade (mona´s), einer Eins, ein. Das in den Texten zur Musik vielfältig belegte Operieren mit der musikalischen Ein(s)heit analog dem Punkt in der Geometrie, der Eins in der Arithmetik und dem Buchstaben in der Grammatik ist jedoch nicht immer eindeutig, verursacht durch die verschiedenen Möglichkeiten, Element und System (oder Gestalt) bzw. Teil und Ganzes ins Verhältnis zu setzen. Für Aristeides Quintilianus (I, 14) bezieht sich das unteilbar Kleinste in den drei musikalischen Dimensionen Wort, Melos und Rhythmus daher so: im sprachlichen Ausdruck (le´xis) auf die Silbe, im Melos auf den Ton (Einzelton, phtho´ngos) oder auf ein einzelnes Intervall, bei der Körperbewegung auf eine einzelne Stellung (sche˘ ma). ⫺ Zur Analogie zwischen Sprache und Musik in der Antike vgl. Art. 54 § 2. 2.5. Die Bedeutung des Klangs Angaben zur Bedeutung der Musik fußten vor allem auf der Tonarten-Charakteristik im Rahmen der Ethos-Lehre (oben § 1.5.). Klänge und Intervalle waren davon kaum betroffen: Die empfindsame Vorstellung ausdrucksmäßiger Bedeutungen einzelner Intervalle („Intervallästhetik“) ist modern. Bemüht war man jedoch darum, die Bedeutung des Klingenden bzw. der Musik von anderen Bereichen kategorial zu unterscheiden, voran vom Sprechen und von der Sprache, die in der pho¯ne˘ (Stimme, Laut, Klang, lat. vox) ein Element besitzen, das sie mit dem musikalischen Bereich teilen. In einer seiner Parallelisierungen von Grammatik und Musik unterscheidet Platon
898
VII. Griechische und Römische Antike
Abb. 43.1: Griechisches Musikfragment: Original und Übertragung (nach Pöhlmann 1970, 84 f).
43. Zeichenkonzeptionen in der Musik
(Kratylos 423 b ff), daß das Nachahmen (mimeı˜sthai) von etwas mit der Stimme (pho¯ne˘ ) zwar in Musik genauso vorkomme wie in der Sprache, aber weder in der Musik noch in der Malerei (sondern eben nur in der Sprache) zu einem Benennen (onoma´zein) führe, das allein das Wesen (ousı´a) eines Dinges durch Buchstaben (gra´mmata) und Silben (syllabaı´ ) nachahmen (darstellen) könne. Aristoteles (De anima II, 8, 420 b) wiederum versucht die Begriffe für die elementaren akustischen Ereignisse zu klären und bemerkt, daß Stimme bzw. Klang (pho¯ne˘ ) ein dadurch ausgezeichneter Schall (pso´phos; Ton, Geräusch als Oberbegriff) sei, daß er etwas bedeute (se¯mantiko`s pso´phos). Da er gleichzeitig davon ausgeht, daß pho¯ne˘ der von etwas Lebendigem hervorgebrachte Schall sei, ist er gezwungen, darauf hinzuweisen, daß man den Klang von Musikinstrumenten nur metaphorisch (kath’ homoio´te¯ta) als pho¯ne˘ bezeichne. Die sich für Aristoteles daraus ergebenden Konsequenzen bis hin etwa zum arbiträren oder konventionellen sprachlichen Zeichen (pho¯ne¯ se¯mantike¯ kata` synthe˘ ke¯n; De interpretatione 2, 16 a 19) sind nicht musikalisch ausgerichtet. Pho¯ne˘ ist das akustische Substrat für Sprache, für Logik und für Musik gleichermaßen. Da aber die pho¯ne˘ nur im Blick auf die Sprache in der Lage ist, den Logos aufzunehmen, trennen sich die semantischen Wege.
3.
Literatur (in Auswahl)
Abert, Hermann (1899), Die Lehre vom Ethos in der griechischen Musik. Ein Beitrag zur Musikästhetik des klassischen Altertums. Leipzig. Barker, Andrew (1984⫺89), Greek Musical Writings, 2 Bde. Cambridge, England. Becker, Oscar (1957), „Frühgriechische Mathematik und Musiklehre“. Archiv für Musikwissenschaft 14: 156⫺164.
899 Comotti, Giovanni (1989), Music in Greek and Roman Culture. Baltimore und London. Forkel, Johann Nikolaus (1788), Allgemeine Geschichte der Musik, Bd. 1. Leipzig. Georgiades, Thrasybulos (1954), Musik und Sprache. Das Werden der abendländischen Musik. Dargestellt an der Vertonung der Messe. Berlin, Göttingen und Heidelberg. Georgiades, Thrasybulos (1958), Musik und Rhythmus bei den Griechen. Zum Ursprung der abendländischen Musik. Hamburg. Gombosi, Otto Johannes (1939), Tonarten und Stimmungen der antiken Musik. Kopenhagen. Lohmann, Johannes (1970), Musike´ und Logos. Aufsätze zur griechischen Philosophie und Musiktheorie. Zum 75. Geburtstag des Verfassers hrsg. von Anastasios Giannara´s. Stuttgart. Pöhlmann, Egert (1960), Griechische Musikfragmente. Ein Weg zur altgriechischen Musik. Nürnberg (Erlanger Beiträge zur Sprach- und Kunstwissenschaft 8). Pöhlmann, Egert (1970), Denkmäler altgriechischer Musik. Sammlung, Übertragung und Erläuterung aller Fragmente und Fälschungen. Nürnberg (Erlanger Beiträge zur Sprach- und Kunstwissenschaft 31). Riethmüller, Albrecht (1985), „Logos und Diastema in der griechischen Musiktheorie“. Archiv für Musikwissenschaft 42: 18⫺36. Riethmüller, Albrecht und Frieder Zaminer (eds.) (1989), Die Musik der Antike. Laaber (Neues Handbuch der Musikwissenschaft 1). Seidel, Wilhelm (1980), Artikel „Rhythmus/numerus“. In: Handwörterbuch der musikalischen Terminologie. Im Auftrag der Kommission für Musikwissenschaft der Akademie der Wissenschaften und der Literatur zu Mainz hrsg. von Hans H. Eggebrecht. Wiesbaden 1972 ff. West, Martin Litchfield (1992), Ancient Greek Music. Oxford. Westphal, Rudolf (1883⫺93), Aristoxenos von Tarent. Melik und Rhythmik des classischen Hellenentums. 2 Bde. Leipzig.
Albrecht Riethmüller, Berlin (Deutschland)
900
VII. Griechische und Römische Antike
44. Sign conceptions in architecture and the fine arts in Ancient Greece and Rome 1. A note on periodization 2. Greece 2.1. The Aegean world and the oscillation of styles 2.2. The Geometric period and the transition from class to individual 2.3. Symmetrı´a and Greek artistic structuralism 3. Italy 3.1. The specificity of Roman art as the expression of individual status 3.2. Semantization and desemantization in sculpture 3.3. Cosmic power and urban space 4. Selected references
1.
A note on periodization
As its title indicates, the present article concentrates on Greek and Roman antiquity. However, both Greek and Roman society were not formed in a vacuum and can only be understood against the background of pre-existing societies, with which they show a greater or lesser affinity. It is therefore useful to include some references to these societies (though in a very brief manner due to lack of space), references which aim particularly at giving a more complete historical and systematic form to the semiotic analysis of the fine arts, architecture and urban space. These extensions include the Aegean world beyond the Mycenean, and the Etruscans in addition to the Romans. In order to orient the reader historically, the main periodization used is presented here, and additional information is provided whenever needed in the text. With respect to the Aegean world, the beginnings of the Thessalian Neolithic have recently been pushed back almost to the middle of the 7th millenium B. C., and the Late Neolithic is dated between 4200/4100 B. C. and 3200 B. C. The Cycladic culture was formed in the 3rd millenium B. C., while the Minoan one extends from 3000 B. C. to 1200 B. C. The life of the Mycenean culture was shorter, covering a period of only 550 years (1600⫺1050 B. C.). The Mycenean period was succeeded in Greece by the Geometric period (1050⫺700 B. C.), which opens with the ‘Dark Age’ of the Protogeometric period (1050⫺900 B. C.), and is followed by the Archaic period, starting in 750 B. C. and ending with the Persian
Wars of the early 5th century B. C. What follows is the apogee of Greek democracy, the Classical period (480⫺323 B. C.), while the splendor of ancient Greece comes to an end with the closing of the Hellenistic period (323⫺31 B. C.), marked by the completion of the Roman conquest. On Italian soil, the appearance of the Etruscans is dated back to the 9th century B. C. thus preceding the foundation of Rome in 754 B. C., The latter date opens for the Romans, whose culture absorbed many Etruscan elements, the period of the Kings (754⫺510 B. C.). This period was followed by the Republic (509⫺31 B. C.), followed in turn by the Empire (31 B. C.⫺476 A. D.), whose first phase, the Early Empire, lasted from 31 B. C. to 193 A. D.
2.
Greece
2.1. The Aegean world and the oscillation of styles The study of the processes of semiosis in the Aegean world is handicapped by an almost complete lack of evidence from written sources. It is not easy to know what the Aegean peoples thought about their art and what kinds of signification they attributed to it, but we are nevertheless able to establish certain points and advance certain hypotheses. Thus, we are able to follow the transformation of figurines in the round from what has been considered primitive naturalism to the schematization of the so-called Larissa phase of the Thessalian Late Neolithic of the 5th and (mainly) 4th millennia B. C. (cf. Demargne 1964, 31 ff). On the basis of this morphological transformation, we can assume a change (whose exact character escapes us) in the ideological approach to art objects. The oscillation between nonrepresentational and representational art and, in the context of the latter, between schematization and naturalistic style, characterizes not only the whole of Aegean art but also the development of art in the Geometric period and from it to the Classical period. The marble Cycladic ‘idols’ of the Early Bronze Age (3rd millennium B. C.) are characterized by abstraction and geometricity (Fig. 44.1), thus
901
44. Sign conceptions in architecture and the fine arts
Fig. 44.1: Statuette of a harper from Keros, Cyclades (2400⫺2200 B. C.). By permission of the National Archeological Museum of Athens and Hannibal Editions.
being radically differentiated from the simplified naturalism of the Neolithic. At the other extreme, the Minoan frescoes of the Middle Minoan III period (1700⫺ca. 1550 B. C.) and their Theran equivalents are strikingly naturalistic (cf. Fig. 44.2 on plate VIII), as is the case with many motifs of the pottery (Marinatos 1971, 363 f), even though this natural-
ism does not seem to have gone so far as to result in individual portraits. A deeper analysis of these frescoes allows us to elaborate on the concept of naturalism. The plants depicted in the landscape scenes cannot generally be identified; but in the few cases when they can, as with lilies and crocuses, we observe hybridization and stylization ⫺ as well
902 as standardization (Marinatos 1984, 85; 93 f; 118). Similarly, the human figure is flat and the pictorial space two-dimensional, without depth, an observation equally applicable to Mycenean art (cf. Richter 1971, 9). We should thus differentiate between realistic naturalism, such as the later Greek naturalism, and the general impression of naturalism. We find a further oscillation of styles as we pass from Minoan to Mycenean art. Undoubtedly the latter was subject to strong Minoan influences. However, it acquired its own personality, one which runs parallel to an increasing stylization and geometricity (cf. Fig. 44.3 on plate VIII), with the exception of the naturalistic golden masks moulded directly on the face (Demargne 1964, 137; 175; 185 ff; 235). 2.2. The Geometric period and the transition from class to individual The pictorial system of Geometric pottery uses a series of conventions in order to convey signification. The painters of the blackfigure Dipylon amphorae from just before the mid-8th century, which corresponds to the peak of the Geometric style, operated with a limited set of main pictorial signs: standing women and men and their few accessories such as shields, horses and chariots, certain other animals and, later, ships. The human figure as a signifier is generally composed of a triangular torso corresponding to a front view, and a head and legs seen in profile, while the drawing technique is the uniform filling-in of a surface (cf. Carpenter 1962, 46, Demargne 1964, 333 and Richter 1971, 11 f; 14). ⫺ Passing from the signifier to the signified, Hurwit observes that the Dipylon figures follow a proportional canon, that is, a set of rules defining the proportions between their parts, and between the parts and the whole (see the concept of symmetrı´a described in § 2.3.); they are an assemblage of discrete parts, demonstrating a conception of man as composed of head, chest and limbs found also in Homer, and an interest in what is constant in man (Hurwit 1985, 98 ff). On the other hand, in the second half of the 8th century legendary narratives, related to the propagation of epic poetry and the hero cults, appear on vases, bronzes, fibulae and seals, and call for a development of the pictorial systems. The reason is that the generic types at the disposal of the artists, corresponding to a class of similar objects, needed
VII. Griechische und Römische Antike
to be specified as particular individuals, members of this class ⫺ something which earlier would have been achieved through contextual relations. The transitional step in this direction was the use of the name of the individual, that is, of a complementary semiotic system, natural language. This device was used from the end of the 7th century to as late as the 5th century in wall paintings, carved reliefs (like the figured frieze of the Siphnian Treasury at Delphi) and red-figure vases. By the Classical period, however, the artistic codes had become self-sufficient ⫺ a fact which should be attributed to the multiplication and the relative standardization and socialization of the new individualized human forms (cf. Carpenter 1962, 106 ff; 213, and Hurwit 1985, 106 ff; 121). These codes establish for the pictorial arts a conventional relation between signifieds and pictorial signifiers, and rules for the combination of the resulting signs, being thus formally a subcase of the concept of the semiotic code. Example of this multiplication of subjects are the archaic grave reliefs of men, where nudity is often abandoned for the depiction of specifying attributes (Holloway 1973, 42). However, the use of natural language was not abandoned, as can be seen, for instance, from the hellenistic Megarian bowls. 2.3.
Symmetrı´a and Greek artistic structuralism
2.3.1. From classical formalism to hellenistic subjectivism One of the fundamental aspects of Greek thought has been the tendency to discover a cosmic order behind the chaotic appearances of things. While this tendency may have existed since the Protogeometric period, it took a new form under the impact of philosophy. The essential characteristic of order in Greek philosophy is measure, that is the definition of unitary elements and their measurable relationships. Thus, for Pythagoras and the Pythagoreans, numbers and their relations (proportions) are the essence of things and make up the cosmos (ko¬smow) ⫺ whose center is occupied by a hearth of fire; each object is composed of a specific number of particles corresponding to geometric points. Representative of the Pythagorean cosmology is the number 10, the sacred tetrakty´s, considered by the Pythagoreans as the perfect number, and composed of the sum of the numbers 1 (related to the point) and 2, 3 and 4 (all re-
44. Sign conceptions in architecture and the fine arts
lated to the line); to these numbers also corresponds the geometric series from point to solid, and from their proportions follow the basic harmonies of the musical scale, which are also found in the heavenly sphere (cf. Raven 1951, 147 f and Pollitt 1974, 15 ff; 167). Less than a century after Pythagoras, in the mid-5th century, Empedocles and Democritus held that all things in the universe derive from the four fundamental elements fire, water, earth and air, which are also found in Pythagoreanism (Raven 1951, 147 f). For Empedocles these elements through their particles compose a threefold structure (see below), being united by love and separated by hate. The combination of these elements in different proportions leads to all things in the universe, which are mixtures governed by harmony and equilibrium (Bollack 1965, 18 ff; 35 f; 39; 81 ff; 238 f). The artistic equivalent of this philosophical order is the concept of symmetrı´a (symmetri¬a), that is the (cosmological, unifying principle of the) commensurability of the parts of a work of art to each other and to the whole. Symmetrı´a refers to precise mathematical proportions and is the nucleus of a semantic field that includes concepts such as ale˘ theia, denoting the true nature of a work of art expressed through its proportions; (arithmo`s) te´leios, denoting the ‘perfect number’ governing symmetrı´a; the 4th-century concept of akrı´beia, indicating mathematical precision in the application of arithmetical and geometrical formulas; and me´son, maybe denoting ideal balance (Pollitt 1974, 15; 26; 88; 126; 162 ff; 182). In this case, we can literally speak of a philosophical structuralism, which operates with initial elements and deep structures and rules generating surface structures on the basis of logicoproportional relations, as well as of a corresponding artistic structuralism that realizes surface structures through the empirical expression of these elements on the basis of equivalent rules. Symmetrı´a is the key concept for understanding the artistic and spatial semiotic systems of Classical and, to a certain degree, Hellenistic Greece. Let us now follow its use in the systems of the fine arts and architecture and begin with sculpture. The treatise on the Canon by Polyclitus, from the second half of the 5th century, provided a set of proportions for the production of perfect sculptural works ⫺ a procedure which the patterned nude archaic kou˜roi may also have followed. The Canon was material-
903
Fig. 44.4: The Doryphorus by Polyclitus. From Bianca Maiuri (1957), Museo Nazionale di Napoli, Italia (Musei e Monumenti). By permission of the publishers, Istituto Geografico de Agostini, Novara.
ized par excellence in Polyclitus’ Doryphorus (Fig. 44.4). Beauty and measure (symmetrı´a) are here identical, as they are for the Pythagoreans and later for Plato, and the Canon seems both to have influenced and to have been influenced by the Pythagoreans (Raven 1951, 150 ff). There were different classical approaches to the ideal sculptural form, but all of them were based on the concept of symmetrı´a (used even before Polyclitus by the sculptor Pythagoras, first half of the 5th century) (cf. Schulz 1955, 202 f; 213, Carpenter 1962, 158 ff; 186 f, and Pollitt 1974, 14 ff; 88; 162; 187). While the artistic concept of symmetrı´a applies to the semiotic system itself, the key philosophical concept for the domain of the
904 arts, mı´me¯sis (mi¬mhsiw) as used and propagated by Plato and Aristotle, concerns essentially the relation between a semiotic structure (whether literary, musical, sculptural or pictorial) and its referent, that is, the imitation of reality. Following Pollitt, one can distinguish two types of imitation in Plato, which were also retained by Aristotle: literal imitation, i. e., copying, and the associational recreation of psychological characteristics. Speaking semiotically, in the sense of Hjelmslev, Barthes, and Eco, the first kind of imitation has a denotative orientation, whereas the second has a connotative one. That is, in the first case the artistic semiotic system tends to be biplanar and the signifieds are limited to primary signification only, while in the second case, it is pluriplanar, the plane of the expression being itself biplanar, and the emphasis is on the associational signification. In Plato, each type is subdivided into two further types, namely a productive type relating to the artist’s use of mı´me¯sis, and a receptive type relating to the participant in it. For Aristotle, mı´me¯sis also imitates the teleological processes of nature, in which case it has a cosmological dimension (Else 1958, 78; 85 ff and Pollitt 1974, 31; 35 f; 38 ff). Besides these sophisticated views on art, there is, according to Pollitt, also popular criticism (extending as far as 4th-century A. D. Roman culture), which uses three criteria to evaluate the work of art. The first criterion corresponds to a simplified version of mı´me¯sis, according to which the realism of the work of art should be such that it makes the difference between art and reality disappear. The second criterion is a magical extension of mı´me¯sis and consists in the recognition of magical forces in the work of art, based on the assumption that the realism of the works of art provides them with life. The final criterion is the market value of the work or its material (Pollitt 1974, 63 f). It is interesting to note here the dualism which has been observed in relation to Greek thought in general between the rationalism of the few and the magical thought of the masses, important already from the Classical period onward. The austerity of the sculptural canons finds its counterpart in the restrictions of the four-color system, attributed by Bruno to Polygnotus (500⫺440 B. C.) and his circle, and by Pollitt to the Late Classical and early Hellenistic periods (Hellenistic period: 323⫺ 31 B. C.). The system is based on the exis-
VII. Griechische und Römische Antike
tence of four primary colors, from the combination of which an unlimited number of secondary combinations could be produced. Bruno concludes that the theoretical elaboration of the system must have been achieved by Democritus and perhaps Empedocles, and that it relates to a knowledge of painting practices. He points out that the four colors correspond to the four initial elements, to the four seasons and to the four cardinal points of the horizon. Indeed, for Empedocles, the color white corresponds to fire, yellow to air, red to earth, and black (dark blue, following Bruno) to water. While the elements are considered as equal, fire is dominant, and its opposition to the three other elements constitutes a dualist cosmological structure. A second dualist structure emerges through the relation of air to fire and earth to water; to this opposition corresponds the one of light colors (white and yellow) to dark ones (red and black). There is finally a tripartite structure, fire vs. air/earth vs. water, to which corresponds the primary polarization of white (light) and black (night) around a middle term, two intermediary hues. With this structure Empedocles tries to explain the fact that we can recognize both colors and degrees of light intensity. Each possible hue is produced by mixing the primary colors in different proportions; and then figures are produced as images of things produced by the mixing of the four elements (Bollack 1965, 238 f, Pollitt 1974, 23; 111; 244 and Bruno 1977, 56 ff; 63 f; 83; 96). One striking example of the fourcolor system is the Alexander mosaic from Pompeii, which is a copy of a Greek original of the late 4th or early 3rd century (cf. Fig. 44.5 on plate IX). Thus we can conclude that symmetrı´a and harmony determine the generation of colors as well as the final pictorial product, acting both as esthetic and cosmological principles. These structuralist approaches to art of the 5th century are strongly related to rationalism, model-building, and formalism, in the sense that they concentrate on the construction of abstract models. Indeed, what has been called classical idealism, that is the whole classical approach to representational art, aims at the formalist perfection of a nonindividualized model-type, corresponding to the unity behind the variety of appearances (cf. Carpenter 1962, 21 f). The same ideology lies behind the formal treatment of sculptural drapery. This formalism (the term being used now in the art-historical sense of abstract
44. Sign conceptions in architecture and the fine arts
geometrical representation, that is, schematization ⫺ not to be confused with 20th century nonfigurative abstract art) should not be mistaken for immobility, as is attested from the interest of the Early Classical sculptors in the dynamic condensation of movement in seemingly still and balanced positions (“rests” for the Greeks), the winged Victory from Olympia, and the Phidian style (Holloway 1973, 141; 173 and Pollitt 1974, 139 ff). While this approach influenced the whole of ancient art, we can discern, toward the end of the 5th century, a gradual departure from symmetrı´a as an artistic principle and an attempt at individualized portraiture (Carpenter 1962. 138; 157 ff; 182 ff). This reorientation of Greek art is connected with the general internal transformation of Greek society ⫺ Holloway draws our attention to Sophist philosophy. And this development finds its parallel in art criticism, which tends toward subjectivism from the 4th century on. There is now an increased interest in the effects of symmetrı´a on the viewer and his reactions, that is in appearances as opposed to essence. Painters and sculptors producing monumental works were altering the canon to take account of visual distortions, studying optical illusions in particular. This development is related to the importance given to eurythmı´a (eyœryumi¬a), the quality of being visually wellproportioned as evaluated personally by the artist, an approach attributed by Pliny to Lysippus (on this point, see also Ferri 1940, 129 ff; 138 f, and Schulz 1955, 207 ff). 4thcentury subjectivism was accompanied by an emphasis on the subject, the non-measurable characteristics of the work of art, which were thought to be approachable through intuition, and on the presentation of character (ee˜¯ thos) and emotion (pa´thos). The interest in subjectivity dominates the Hellenistic period in two diverging ways: as an interest in individualized portraiture, and as what Pollitt calls the “phantası´a (creative imagination, intuitive insight) theory”. This classicizing theory of the 2nd century B. C. with Platonic, Aristotelian and Stoic elements ⫺ corresponding to a type of late hellenistic sculpture and coinciding with a growing mass-production of art objects ⫺ is characterized by a mystical respect for the great artists of the classical past as visionaries moved by inspiration unrelated to the senses, able to catch divine essence and transcendental beauty and to render them physically (Pollitt 1974, 27 ff; 52 ff; 82 ff; 96; 153 f; 186 f; 204).
905 The development from model-type to individuality within realistic naturalism is analogous to the movement from class to individual that we observed in the development of schematic naturalism from the Geometric to the Archaic period. On the other hand, if we accept that the mı´me¯sis and the phantası´a approaches in some way correspond to certain ideas current in their times, we diachronically find, on the consumption (reception) side, a differentiation in the semantizations of classical art, just as we can synchronically observe a similar differentiation between intellectual and popular criticism. These phenomena are the rule in the history and sociology of semiotic systems. 2.3.2. Commensurability, cosmology, politics, esthetics and space The shift from the fine arts to spatial organization and form, both architectural and urban, is a shift from semiotic systems to functional systems, that is, systems whose primary function is not to signify but to be socially used. However, these systems do not lack semantization. Vitruvius writes that a well-planned temple follows a system of symmetrı´a, founded on the human body, and that this is also the case for columns of the various orders (De architectura 3, 1, 2⫺5; 3, 5, 5; 4.1.10⫺12). Indeed, the Greek architectural orders ⫺ among the extant examples of which the earliest cases of the Doric order date from around the mid-7th century and those of the Ionic one from the second quarter of the 6th (Hurwit 1985, 182 ff) ⫺ seem to have been canonically regulated, and Holloway (1973, 55) assumes that mathematical proportions were introduced in Ionic temple architecture in the 4th century. The profile of the orders is based on standardized proportions and elements, and a similar standardization characterizes many other architectural constructions. Variety exists, but within the limits set by the canon. More specifically, the Ionic order presents a multiple tripartite organization, which could be related to ancient cosmological views: in Hesiod’s Theogony the spherical universe is tripartite, the number 3 plays an important role in Anaximander’s cosmology, and the heavenly sphere for Pythagoras is also tripartite. ⫺ Eurythmı´a (cf. § 2.3.1.) also appears in connection with architecture and refers to its good visual quality, achieved by counteracting visual distortions following from the application of the rules of symmetrı´a, that is by the morpholog-
906
VII. Griechische und Römische Antike
Fig. 44.6: The omphalo´s at Delphi. From Basil Petrakos (1977), Delphi, Athens. By permission of the publishers, Clio Editions.
ical adaptation of the theoretical pattern of a building to visual exigencies. While, according to Pollitt, this term seems to appear in visual art criticism toward the end of the 5th or in the beginning of the 4th century, it should be noted that five corrective interventions of this kind were used during the third quarter of the 5th century in the building of the Parthenon (cf. Pollitt 1974, 142 ff). One of the main architectural elements, the column, is accompanied by four connotative codes, a religious, a cosmic, an anthropomorphic and a vegetal code. An important
cosmological pattern widespread in ancient Greece is the association between the center of the universe, the zero-point of space and time, and the cosmic axis, passing through it and supporting the sky. On the basis of an analogy between the human body and the universe, the center of the universe and the earth was identified with the navel, omphalo´s, a notion also found in Homer (cf. Roscher 1913, 10; 54 ff). Anaximander believed that the earth is shaped like a column and that men live on its upper surface. This complex of cosmological ideas is connoted by the cir-
907
44. Sign conceptions in architecture and the fine arts
cular hearth and the four columns surrounding it in the Mycenean megaron (Vernant 1974, 167 ff; 183). Atlas, the bearer of the sky, is identified with or even replaced by a column, whence the column acquires an anthropomorphic connotation (cf. Carpenter 1962, 83). On a similar line, Vitruvius compares the Ionic column to the female body. The same ideological principles underlie settlement space. The polis is seen spatially as the expression of two dimensions, the one cosmological and the other political. Thus, it is round like the earth and the universe, and like them it has a center, the agora. This cosmic organization is geometrically isomorphic to a political one, based on the concepts of the equidistance of all citizens from the political center, and of symmetry, equilibrium and reciprocity. This conception of the polis is exemplified by the reform of Cleisthenes in the second half of the 6th century, who created in Athens a socially tripartite space, which was approximately concentric. The four numbers 3 (universe, totality), 5, 10 and 102 play a fundamental role in this reform. The aim of Cleisthenes was the actualization of the principle of isonomı´a (iœsonomi¬a), the equality of political rights (Le´veˆque and Vidal-Naquet 1964, 10 ff; 77 ff; 91 ff; 123 ff and Vernant 1974, 179 ff; 203 ff). In the same period, isonomı´a was also used in relation to health to express the right proportions and the equilibrium of the opposing elements of the body; it is closely connected in this sense to Pythagoreanism, and overlaps with symmetrı´a (cf. Raven 1951, 150). Thus, commensurability can be seen as a totalizing concept integrating and articulating philosophy, cosmology, politics, aesthetics, and medicine. ⫺ The Pythagorean numbers 3 and 10 are also basic for the urban model of Hippodamus (5th century). The same interrelationship between cosmology and politics is found in the first poem of the Pythian Odes by Pindar, dedicated to the foundations of the small city of Etna in 470 B. C. The new city is located on the heavenly cosmic column that unites the three cosmic planes, and the poet conceives as an indivisible whole the foundation of a city, the notion of the center of the world, the victory over the dragon and the legislature of the ideal city (Trumpf 1958, 129 ff; 157). Both the ideal city in the Laws and Atlantis in Critias show that the same interrelationship was one of the main concerns of Plato. These ideal spatial organizations are governed by certain numbers and the perfection of the cir-
cular form; they are used to produce an image of the universe, comprising its center (L’Orange 1953, 9, Herter 1953, 2; 3; 6 ff; 12 ff; 19 and Lagopoulos 1978, 112). Thus, the same cosmological notions which are associated with architecture also operate in urban space. Many cities and sites were considered as omphaloı´, as was the case for Delphi, with its omphalos stone, the grave of the dragon Python and the “meso¬mfalow ajvn” (Fig. 44.6). The complete model of Greek space is a series of concentric circles developping from a center through which passes a vertical axis. But the unity underlying the Greek semiotic systems is much broader, at least for the period around the 5th century B. C., encompassing also all of the arts and based on the totalizing concept of commensurability. One and the same general world view structures all the semiotic systems and is differentiated according to the nature of social groups and to the material and technical specificities of these systems.
3.
Italy
3.1. The specificity of Roman art as the expression of individual status Each civilization is a unique and specific historical phenomenon and never a reflection of another civilization as a whole (cf. Lotman et al. 1975, 73 f and Posner 1989, 268 ff). This is also the case with Roman society, in spite of the strong influences from Greece. In the domain of the theory of art and architecture this Greek influence is evident. The central Roman theory of art, the decor theory, incorporates Greek classical rationalism and was probably founded on the rhetorical theory of Greek peripatetic philosophy; it appears in Roman sources from the end of the Republic and in the Early Empire. The decor theory encompasses the concepts of symmetrı´a and eurythmı´a, it demands that art be faithful to nature and that cult images have an appropriate scale in their relation to a temple. The other art theory found among the Romans, which Pollitt calls the museographic theory, also involves the notion of realism. ⫺ Roman art theory presents the same movement from rationalism to subjectivism that we observed in Greece. Indeed, late antiquity moved away from the classicism of the decor theory toward transcendental mysticism and an intuitional approach to art, related to the phantası´a theory. The latter appears in Roman
908 sources with the histories of Greek art by Cicero (106⫺44 B. C.) and Quintilian (35⫺95 A. D.) (Pollitt 1966, xiv ff and 1974, 68 ff; 83 ff). But if Roman art criticism presents these Greek influences, the social function of art for the Romans was very different from its function in Greek society. The Romans, in contrast to classical Greece, did not give art any central role in their life, quite the contrary; and the Roman attitude toward art should be explained through the history of Rome. Rome was economically backward in the early 5th century and in spite of the policy of expansion adopted in the 4th and 3rd centuries, both the state and individual families were of very limited means up to the 1st century B. C. This poverty, which was turned into a virtue, did not leave much space for art. But the situation was reversed in this same century, when Rome reached a peak of public and private wealth, and was flooded with art objects from all over the Mediterranean. In view of the dominant traditional attitude to art, Roman collectors were apologetic about their artistic interests, and there was a feeling that a contradiction existed between art and the traditionally austere Roman way of life. This negative attitude toward art goes back at least to the Elder Cato (243⫺149 B. C.). Thus, Roman art did not function as an essential part of life and an esthetic product as in Greece. In fact, at some moment in Roman history, art and architecture acquired a social function as individual status symbols. At least from the 1st century B. C. the Romans show a strong consciousness of history and of their position in it. This consciousness combined with the old commemorative function of Roman art, which came to reinforce the new status function of art. State art and architecture ⫺ sculpture, painting, cameos, coins, buildings ⫺ now commemorate military and political achievements and state personalities, thus becoming part of the structure of power relations and serving the policies of the ruling class. This propagandistic art is found already in the Republican period and continues throughout the Empire. Similar trends are found in the private domain. Individual portraits commemorated an individual to his descendants; through the selection of subjects, decorative art in private spaces seems to have been functioned as a status symbol; and decorative art in public buildings, which was financed by the citizens,
VII. Griechische und Römische Antike
Fig. 44.7: Realistic bust of an adolescent, probably a member of the Gens Popidia, owner of the house of Citarista at Pompeii; end of the Augustan period. From Bianca Maiuri (1957), Museo Nazionale di Napoli, Italia (Musei e Monumenti). By permission of the publishers, Istituto Geografico de Agostini, Novara.
had exactly the same character. It then becomes clear that the dominant codes of Roman art and architecture, both in their production and consumption, are, at least from the 1st century B. C. onward, the socio-political and the personal-historical code (cf. Fig. 44.7); these codes are complemented by the religious code (cf. Pollitt 1966, xi ff and Hannestad 1986, 9 ff; 77). This Roman specificity pervades the whole domain of Roman art, from what has been considered its most to its least hellenized part. Indeed, it has been argued that Roman art is split between a state ‘high’ art with strong Greek influences, and a middle-class less sophisticated art extending from the late Republic to late antiquity. This second type of Roman art would be a descendant of an idiosyncratic middleItalian version of hellenistic art, producing specifically Roman themes, and having its own attributes, such as an axial and paratac-
44. Sign conceptions in architecture and the fine arts
tic syntax, non-illusionistic perspective and the use of the size of a figure to connote its importance (Bianchi-Bandinelli 1960, 272 ff). Another important trait of the specificity of the Roman approach to art is, ironically, the use and reproduction of Greek art. By the late 2nd and 1st centuries B. C. the habit of acquiring Greek art objects became widespread and was accompanied by a growing art market, and it is in this context that the activity of copying Greek originals began. Many Greek masterpieces would have been lost if this Roman copying practice had not preserved them for us. 3.2. Semantization and desemantization in sculpture One of the principal functions of sculpture in Rome during the period of the Kings was the commemorative function, which accompanied portrait statues erected in public spaces. It has been argued that these statues show Etruscan influences. However, the portrait sculpture of the late Republic and the Empire shows to a greater or lesser degree a native Roman realism in spite of the different influences to which it was subject (Pollitt 1966, xiii; 12; 53). The portrait statue holds a dominant position in Roman sculpture, and a deeper study of the semiotic processes related to it reveals central traits of Roman values. Thus, a portrait denoted a specific person, but this signification was coupled with a connotative signification of a glorifying nature. This nature is clear from the political and spatial context of honorific public statues, since they were authorized by the state, and located in public spaces and the forum. Glorification, however, was selective since it concerned in the beginning only men, while the erection of female statues was denounced by Cato in the early 2nd century B. C. We have here an opposition to a positive semantization process, which was turned in the mid2nd century against non-authorized statues erected around the forum. The concept of semantization used here is affiliated to Greimas’ concept of ‘semanticism’, the semantic investment of a linguistic unit, and to that of semiosis (cf. Art. 119). In its neutral form, it is almost synonymous to semiosis. But, when used as desemantization or resemantization, as below, it refers to the loss or addition of signification in respect to a previous state. The pragmatic result of this kind of attitude could take the milder form of removing the statues, or the more violent forms of defacing
909 or breaking them or melting them down. We can find behind this behavior a magical attitude toward art objects as almost animated doubles of the depicted persons. ⫺ The combination of glorification and magical animation seems to characterize the habit of removing the portrait statues of famous citizens from the public buildings where they were kept to exhibit them in public processions. Magical animation appears in many other instances. Thus, for example, the Senate voted in 176 A. D., according to Dio Cassius, that a golden statue of the deceased Faustina, wife of Marcus Aurelius, should be carried in the theater when the emperor was present and put in the front box, “from which she used to look on when she was living” (cf. Pollitt 1966, 54 f). Scale was a morphological component related to the glorifying connotation of portrait statues and, following Pliny, a height of three feet seems to have been considered enough in the 3rd century B. C. to convey this signification. But the head of the empire was not limited to this moderate scale in later times. Nero ordered a statue of himself probably 120 feet high which he put in his palace, the Domus Aurea; and Alexander Severus in the 3rd century set up colossal statues of deified emperors which functioned as a metaphor for himself (cf. Pollitt 1966, 54; 144; 163; 200). Imposing scale was associated for the Romans with size and height, and height could also be achieved through physical elevation on horseback, or on a chariot, a column, or a triumphal arch. ⫺ Other physical characteristics of a statue also had a connotative signification. An important one was the material of the statue, a fact also acknowledged by Pliny. The direct relation between the market price of the material and its cultural evaluation is an instance of the commercialization of art in ancient Rome. Beyond the semantization and desemantization processes examined above, there are, as a special case of the former, resemantization processes. In the 1st century A. D., Caligula intended to remove the heads of outstanding Greek statues, including the Zeus of Olympia, and replace them with his own. We have here an attempt at a double resemantization, of himself as incarnation of supreme values through the statue and of the statue which would associate its values with a specific person. It is manifest that both operations converge in the same result: the glorification of the emperor (concerning the glorification of the emperor
910 in Byzantium cf. Art. 60 § 3.2.). This kind of practice was rather common in Roman society. Pliny complains about it, deploring the replacement of the heads of statues (cf. Pollitt 1966, 134; 156; 165). 3.3. Cosmic power and urban space The triumphal arches are a typical example of the combination of history, commemoration, propaganda and above all the demonstration of imperial power in the Roman semantic universe, although some of them are known from the Republic. This character is stressed when a statue of the emperor on his chariot, quadriga, or a rampant equestrian statue of him, both connoting ‘victory’ and ‘power’, is placed on the attic of an arch. Once more the ‘superiority’ of the emperor is connoted by physical elevation (cf. § 3.2.), which also characterizes the temple of Jupiter on the Capitol, the Capitolium, whose name derives from caput, ‘head’, and which is the eternal head of the city and the place from which the gods inspect and protect it. But caput also signifies the high status of an individual, who as such possesses manus, power (cf. also Brilliant 1963, 56; 215 f). Thus, height, head, superiority, and power are associated, and this ideological complex can be extended. A digression on the matter of Etruscan and Roman urban planning is needed in order to clarify the nature of this extension. In spite of the difficulties in detecting the Etruscan elements in the descriptions of the Roman texts, we could argue convincingly that the form and functional organization of the Etruscan settlement obey a cosmological model, realized through a foundation rite and consisting of a set of standardized elements. The geometrical and symbolic center of the model was called mundus, possibly an Etruscan word denoting the entrance to the underworld, connoting ‘hell-mouth’ and probably ‘center of the world’ and ‘quadripartite world’. The model governing the Roman settlement seems to have been a direct descendant of the Etruscan model. It was realized through the foundation rite which aimed at transforming the settlement into an image of the universe. While the old Etruscan settlements were probably circular, the Roman settlements from the 4th century B. C. onward had a chessboard plan, taken from the Etruscans ⫺ who used it since the late 6th century B. C., following Greek influences ⫺ and a
VII. Griechische und Römische Antike
square or rectangular contour. The Roman surveyors, the agrimensores, who operated parallel to an augur, used a kind of system of Cartesian coordinates to trace the roads, which evolved around three crucial elements: two vertical axes oriented toward the four points of the compass and the mundus; the same system was used for the division of the fields. ⫺ The East-West axis is the decumanus; it was considered as splitting the universe in the middle, and was the main axis of the settlement during the Empire. The NorthSouth axis, the cardo, had probably been the main axis in earlier times; it was identified with the cosmic axis that was considered to pass through the highest point in the universe, the polar star. Thus, the cardo represented the projection of the ‘vertical’ cosmic axis on a horizontal plane and there was a close association between North and ‘up’. These two axes ended in four gates. The four parts thus obtained, the four parts of the world, were considered as emanating from the intersection of the two axes, which connoted the center of the world; the latter was associated, as for the Greeks, with the notion of umbilicus, navel, the zero-point in space and time (cf. § 2.3.2.). A similar symbolism was apparently also attached to the mundus, which connoted the revolving heaven above and the quadripartite world; it has been argued that these significations were restricted during the empire to the earth and humanity (Müller 1961, 9 ff, Rykwert 1976, 45 ff; 117 ff, and Lagopoulos 1978, 117 ff). The Capitolium, as the forum, is spatially related to the center of the settlement, as maximal (cosmic) height is related to (cosmic) centrality (through the cosmic axis). ‘Up’ is the heaven, and it is exactly this connotation which is carried by the superior part of a structure shaped in the form of a dome. The emperor was closely associated with the heavenly dome and his throne was covered by a dome. The dome of the main dining room of Nero’s “golden” palace could rotate “like the heaven”, while the “heaven and the north pole” which Martial associated with Domitian’s palace should equally be conceived of as a dome. According to the same author, the height of this palace equals that of the heaven and the stars (Lehmann 1945, 11; 22 ff and Pollitt 1966, 93; 143; 162). We can now characterize the central ideological complex that animated the Roman sign systems of art and space. It operated fully at least during the Empire, and from the
44. Sign conceptions in architecture and the fine arts
911
Hurwit, Jeffrey M. (1985), The Art and Culture of Early Greece, 1100⫺480 B. C. Ithaca and London.
Lehmann, Karl (1945), “The Dome of Heaven”. The Art Bulletin 27,1: 1⫺27. Le´veˆque, Pierre and Pierre Vidal-Naquet (1964), Clisthe`ne l’Athe´nien. Essai sur la repre´sentation de l’espace et du temps dans la pense´e politique grecque de la fin du VIe sie`cle a` la mort de Platon. Paris (Annales Litte´raires de l’Universite´ de Besanc¸on 65). L’Orange, Hans P. (1953), Studies on the Iconography of Cosmic Kingship in the Ancient World. Oslo. Lotman, Yuri M., B. A. Uspensky, V. V. Ivanov, V. N. Toporov and A. M. Piatigorsky (1975), “Theses on the Semiotic Study of Cultures”. In: T. A. Sebeok (ed.), The Tell-Tale Sign: A Survey of Semiotics. Lisse: 57⫺84. Marinatos, Nanno (1984), Art and Religion in Thera. Reconstructing a Bronze Age Society. Athens. Marinatos, Spiros (1971), “Life and Art in Prehistoric Thera”. Proceedings of the British Academy 57: 351⫺368. Müller, Werner (1961), Die heilige Stadt. Stuttgart. Pollitt, Jerry J. (1966), The Art of Rome, c. 753 B. C.⫺337 A. D. Englewood Cliffs NJ. Pollitt, J. J. (1974), The Ancient View of Greek Art: Criticism, History, and Terminology. New Haven and London. Posner, Roland (1989), “What is Culture? Toward a Semiotic Explication of Anthropological Concepts”. In: W. A. Koch (ed.), The Nature of Culture. Bochum: 240⫺295. Raven, John E. (1951), “Polyclitus and Pythagoreanism”. The Classical Quarterly 45: 147⫺152. Richter, Gisela M. A. (1971), Perspective in Greek and Roman Art. London and New York. Roscher, Wilhelm Heinrich (1913), Omphalos. Eine philologisch-archäologisch-volkskundliche Abhandlung über die Vorstellungen der Griechen und anderer Völker vom Nabel der Erde. Leipzig. Rykwert, Joseph (1976), The Idea of a Town. The Anthropology of Urban Form in Rome, Italy and the Ancient World. Princeton NJ. Schulz, Dietrich (1955), “Zum Kanon Polyklets”. Hermes. Zeitschrift für klassische Philologie 93: 200⫺220. Trumpf, Jürgen (1958), “Stadtgründung und Drachenkampf. Exkurse zu Pindar, Pythien I”. Hermes. Zeitschrift für klassische Philologie 86: 129⫺157. Vernant, Jean-Pierre (1974), Mythe et pense´e chez les Grecs. Vol. 1. Paris.
Lagopoulos, Alexandros Ph. (1978), “Analyse se´miotique de l’agglome´ration europe´enne pre´capitaliste”. Semiotica 23, 1⫺2: 99⫺164.
Alexandros Ph. Lagopoulos, Thessaloniki (Greece)
earliest times without yet being appropriated by the individual status component. It exalted individual power and associated it with the hand and with height, which was expressed through physical elevation and associated with the head and the navel, and with a cosmological complex including the heavens with the stars and the polar star, cosmic directions, and cosmic centrality. This cosmic power complex activated the art and architecture of the Empire and most eminently their state variants, and, as the unifying ideology underlying them, it was comparable to the Greek symmetrı´a.
4.
Selected references
Bianchi-Bandinelli, Ranuccio (1960), “Römische Kunst, zwei Generationen nach Wickhoff”. Klio 38: 267⫺283. Bollack, Jean (1965), Empe´docle. Introduction a` l’ancienne physique. Paris. Brilliant, Richard (1963), Gesture and Rank in Roman Art. The Use of Gestures to Denote Status in Roman Sculpture and Coinage. New Haven (Memoirs of the Connecticut Academy of Arts and Sciences 14). Bruno, Vincent J. (1977), Form and Color in Greek Painting. New York. Carpenter, Rhys (1962), Greek Art. A Study of the Formal Evolution of Style. Philadelphia. Demargne, Pierre (1964), Aegean Art. The Origins of Greek Art. London. Else, Gerald F. (1958), “ ‘Imitation’ in the Fifth Century”. Classical Philology 53, 2: 73⫺90. Ferri, Silvio (1940), “Nuovi contributi esegetici al ‘Ca`none’ della scultura greca”. Rivista del Istituto d’Archeologia e Storia dell’Arte 7, 1⫺3: 117⫺152. Hannestad, Niels (1986), Roman Art and Imperial Policy. Aarhus (Jutland Archaeological Society Publications 19). Herter, Hans (1953), “Die Rundform in Platons Atlantis und ihre Nachwirkung in der Villa Hadriani”. Rheinisches Museum für Philologie 96: 1⫺20. Holloway, A. Ross (1973), A View of Greek Art. Providence RI.
912
VII. Griechische und Römische Antike
45. Zeichenkonzeptionen in der Medizin der griechischen und römischen Antike 1. Quellen 2. Der Begriff „Zeichen“ explizit und implizit 3. Semiosen 3.1. Nichtkommunikative Semiosen 3.2. Kommunikative Semiosen 4. Literatur (in Auswahl)
1.
Quellen
Die historischen Quellen für die Erforschung der Zeichenkonzeptionen in der altgriechischen und römischen Medizin sind überwiegend schriftliche: (1) Am wichtigsten sind antike medizinische und nichtmedizinische Schriftstellertexte. Diese sind entweder, wie z. B. das Corpus Hippocraticum oder Galens Werke, in mittelalterlichen bzw. frühneuzeitlichen Kodizes überliefert; oder sie sind, wie z. B. der ‘Anonymus Londinensis’ mit seinen medizinhistorischen Texten des AristotelesSchülers Menon, auf antiken griechischen Papyri aus Ägypten erhalten geblieben; oder sie liegen, wie z. B. der arabische Galen, in Form von mittelalterlichen Übersetzungen vor. Manche Texte sind nur fragmentarisch überliefert, z. B. Quellen in Zitat- oder Referatform, die die Empirische Ärzte-‘Schule’ betreffen. (2) Ebenfalls wichtig sind antike Inschriftentexte. Hinter den schriftlichen Quellen stehen zurück (3) Bilder, z. B. Vasenmalerei, Reliefs, Handschriftenillustrationen; (4) chirurgische Instrumente, insbes. diagnostische, z. B. Sonden; (5) sonstige Quellen, z. B. Architektur und Reste menschlicher Körper. Aus Raumgründen wird vorliegender Artikel sich darauf beschränken, einige besonders informative literarische Quellen der griechischen und römischen Zeit auf ausgewählte Aspekte hin auszuwerten. Der hohen Bedeutung der antiken Medizin für die Geschichte der Semiotik kann er nicht erschöpfend gerecht werden (zu den Zeichenkonzeptionen in der Medizin anderer Kulturen vgl. Art. 90 § 16., Art. 91 § 4., Art. 92 § 3. und Art. 93 § 5). Eine umfassendere Darstellung (bisher nicht vorhanden) verlangte Berücksichtigung der bekannten Tatsache, daß die Medizin seit Platon und Aristoteles als Modell-Disziplin angesehen wurde, an der sich exemplarisch Methoden, Ziele und auch Grundwerte anderer Disziplinen, insbesondere der Philosophie, überprüfen ließen (vgl. Fiedler 1978, 168 ff; siehe auch Art. 123).
Die aus dem Altertum überlieferten medizinischen Schriften dienen mannigfachen Zwecksetzungen. Im Corpus Hippocraticum (ca. 70 griechische Traktate in ionischem Dialekt, zumeist um 400 v. Chr., deren Zuordnung zu Hippokrates problematisch ist; vgl. Potter 1988, 13 ff) beabsichtigen die aphoristischen und nicht-aphoristischen prognostischen Traktate, den Arzt für die Bekanntgabe (pro´rre¯sis) des Krankheitsverlaufs zu rüsten. Die Schriften über innere Krankheiten und Gynäkologie dienen diagnostischen Zwecken und geben Therapieanweisungen; ähnlich ist das Ziel der knochenchirurgischen Bücher. Wiederum andere Traktate haben die Regelung der Lebensweise (Ernährung, körperliche Übung, Schlaf u. a.) in Gesundheit und Krankheit zum Thema. Daneben gibt es Schriften über allgemeine Probleme der Physiologie, Anatomie, Pathologie. Nicht selten werden Probleme der Erkenntnistheorie und Theoriebildung angesprochen. In nachhippokratischer Zeit kommen sowohl in Griechenland als auch in Rom neue Themengebiete kaum hinzu, bestehende werden vertiefend erforscht, z. B. die Anatomie (von Staden 1989, 138⫺241). Zielgruppen der medizinischen Literatur in Griechenland und Rom waren teils Ärzte, teils Laien. Das Corpus Hippocraticum weist Besonderheiten auf, da es Schriften enthält, die nicht zur Veröffentlichung bestimmt waren: Teile der Epidemien z. B. sind in ihrer Darstellung so knapp und skizzenhaft, daß der Schluß naheliegt, daß sie als Notizen für den privaten, vielleicht nur persönlichen Gebrauch bestimmt waren oder für die Benutzung innerhalb einer kleinen, eng zusammenarbeitenden Gruppe. In einer solchen Kommunikations- oder ‘Selbstkommunikations’Situation konnte nicht nur sprachlich im Bereich der Syntax und Semantik (Langholf 1977, 9 ff), sondern auch sachlich vieles stark verkürzt und sogar ohne jede Andeutung weggelassen werden. Größere Passagen der Epidemien und anderer Texte, z. B. In der Arztpraxis, scheinen Konzepte eines Lehrers (oder mehrerer Lehrer) zu sein, der in der Ärzteausbildung ein bestimmtes Pensum des Medizinunterrichts zu absolvieren hatte und mit seinem Stoff gründlich vertraut war, so daß er kaum inhaltliche Notizen benötigte, der aber eine schriftliche Aufstellung der zu
913
45. Zeichenkonzeptionen in der Medizin
erörternden Punkte benutzte, um sicherzustellen, daß er keinen ausließ (Langholf 1990, 136⫺145). In gynäkologischen Rezepten (Natur der Frau, Frauenleiden) wird ein so hoher Grad der Schulung des Lesers vorausgesetzt, daß es möglich ⫺ wenngleich nicht beweisbar ⫺ erscheint, daß diese Rezepttexte, an eine bestimmte Zielgruppe gerichtet, mündliche Überlieferung (oral tradition) oder Unterricht zwar schriftlich stützen wollten, dabei jedoch probate Heilverfahren als Berufsgeheimnisse eher verschleiern wollten, indem sie bisweilen Rezept-Ingredienzen nur so knapp andeuteten, daß dem Kenner die Identifikation des Medikaments möglich, dem Außenseiter jedoch seine Herstellung unmöglich war (vgl. dazu den Eid, der die Arztausbildung nur für eng umgrenzte Personengruppen vorsieht und für die Allgemeinheit ausschließt). An zahlreichen Einzelheiten der Texte des Corpus Hippocraticum erkennt man, daß sie verfaßt wurden, als die Schriftlichkeit der Kultur noch nicht alle Bereiche erfaßt hatte und Begriffe wie ‘Urheberrecht’ oder ‘geistiges Eigentum’ noch nicht existierten. ⫺ Je nach Zweck und Ausführlichkeit stellen diese Dialekttexte, obwohl sie nicht eigentlich in einer Fach- oder Sondersprache geschrieben sind, verschieden hohe und teilweise erhebliche Anforderungen an das Vorverständnis. Um 200 v. Chr. begann daher im Umkreis der Bibliothek von Alexandria die lexikographische Erschließung (HippokratesGlossar des Arztes Bakcheios, nur zitatweise bekannt) und setzte sich bis in römische Zeit fort (Glossare des Erotian und des Galen, erhalten) (Wellmann 1931, 85 f). Auch die philologische und medizinische Kommentierung von Texten des Corpus Hippocraticum begann in alexandrinischer Zeit. Die frühesten Kommentare sind bis auf Zitate verloren, erhalten sind die der Griechen Apollonios von Kition (1. Jh. v. Chr.) und Galen (2. Jh. n. Chr.) sowie einiger spätantiker griechischer Erklärer. Die Überlieferung des griechischen und römischen medizinischen Schrifttums ist für die einzelnen Epochen sehr ungleich: Während die Zeit um 400 v. Chr. durch die Schriften des Corpus Hippocraticum reichlich vertreten ist, stehen für die unmittelbar nachfolgenden Jahrhunderte außer Zitaten nur einige Pseudo-Hippocratica zur Verfügung. Unschätzbar ist z. B. der Verlust der Schriften des Herophilos (von Staden 1989, 67⫺88) und des Erasistratos (3. Jh. v. Chr.). Erhalten sind außer den genannten Kommentaren
Werke u. a. folgender Schriftsteller: Celsus, Plinius d. Ä., Scribonius Largus (alle in lateinischer Sprache, 1. Jh. n. Chr.); Dioskurides, Aretaios (beide griechisch, 1. Jh. n. Chr.), Soranos, Rhuphos (⫽ Rufus) (beide griechisch, um 100 n. Chr.), Galen. Auch aus nachgalenischer Zeit sind griechische und lateinische Werke bedeutenden Umfangs überliefert (zur medizinischen Überlieferung des Islam vgl. Art. 90 § 16.).
2.
Der Begriff „Zeichen“ explizit und implizit
Zahlreich sind die Erwähnungen von Zeichen im Corpus Hippocraticum; aber wie im Grundlegenden unsystematisch die medizinische Lehre vom Zeichen um 400 v. Chr. war, erhellt daraus, daß in vielen Textzusammenhängen nicht geschieden wird zwischen anzeigender Funktion, bewirkender Funktion und zeitlicher Aufeinanderfolge: Die Ausdrücke „Kr(ankheitsphänomen) A zeigt B an“, „Kr A bewirkt B“ und „Nach Kr A folgt B“ sind vielfach austauschbar. Das liegt im Wesen vieler Krankheitszeichen: tatsächlich zeigt eine Funktionsstörung Zukünftiges nicht nur an, sondern hat unmittelbare, eigene Konsequenzen. Im Vordergrund des ärztlichen Interesses bei der Prognose stand, Tod und Gefahr vorherzusagen, um sich gegen Regreßansprüche, Rufschädigung oder Strafverfolgung abzusichern (daher finden sich häufiger ungünstige als günstige Prognosen: falls der Patient genas, lief der Arzt kein Risiko). Der Inhalt und die Verläßlichkeit der Prognose waren also wichtiger als jedwede formale Theorie. So legen die aus dem griechisch-römischen Altertum überlieferten PrognoseHandbücher den Akzent ganz einseitig auf das Inhaltliche und Handwerkliche. Typisch sind die aphoristischen Traktate des Corpus Hippocraticum, u. a. Aphorismen, Prorrhetikos I und Prognosen aus Kos. Beispiele aus letzterem Buch mögen veranschaulichen, wie unstetig in Krankheitserscheinungen zugleich Zeichen, Bewirkendes und Aufeinanderfolgendes gesehen wurde (siehe auch Art. 40 § 1. und 2. sowie Art. 46 § 2.). § 8: „Häufige Schüttelfröste vom Rücken her […] künden schmerzhafte Harnverhaltung an (se¯maı´no¯ ).“ 17: „Schüttelfrost und Atemnot bei den Schmerzen sind Zeichen der Schwindsucht (se¯meı˜on).“ 101: „Die, die bei phrenı˜tisKrankheit unter Frostgefühl Speichelfluß haben, weisen (damit im voraus) hin (de¯lo´o¯ ) auf
914 schwarzes Erbrochenes.“ Wenn von medizinischen Zeichen explizit die Rede ist, so werden zumeist Verben oder Substantive der Wortfamilie se¯meı˜on, se¯man- gebraucht, daneben seltener auch andere Wörter. Sprachliche Zeichen, ‘Wörter’, heißen im Griechischen nicht se¯meı˜on, sondern o´noma (wörtl. ‘Name’), le´xis oder rhe˜ma. In der Mehrzahl der Aphorismen ist jedoch von Zeichen explizit keine Rede, vielmehr werden kausale oder zeitliche Verknüpfungen von Tatsachen angegeben. Die Ausdrucksmittel sind vielfältig. § 23: „Schüttelfrost bei Starrkrampf bringt um.“ 30: „Bei denen mit Schüttelfrost kommt es zu Harnverhaltung.“ 52: „Schnelle Erwärmung nach kaltem Schweiß ist schlecht.“ 123: „Bei den galligen Konstitutionstypen lassen starke Atmung und akutes Fieber mit Anspannung des Oberbauchs Schwellungen am Ohr entstehen.“ 134: „Die (ersten) 14 Tage sortieren unter den kau˜sos-Kranken, bringen Erleichterung oder bringen ums Leben.“ 135: „Die kau˜sos-Krankheit übersteht man kaum, wenn sich nicht ein eitriger Abszeß am Ohr bildet.“ 216: „Die Schwellungen am Auge in den Rekonvaleszenzen lassen den Stuhl abgehen.“ Nicht alle derartigen aphoristischen Formulierungen werden wörtlich gemeint sein; so ist der Schüttelfrost bei Starrkrampf insofern todbringend, als der Tod nach ihm eintritt, und die ersten 14 Tage bei kau˜sos haben insofern eine „sortierende“ Funktion, als sie besonders gefährlich sind. Dergleichen Erfahrungstatsachen lassen sich ebensowohl als Semiosen wie als zeitliche oder kausale Verknüpfungen nach dem Schema „post hoc, ergo propter hoc“ interpretieren. Nur formal beruht diese Mannigfaltigkeit des Ausdrucks auf verschiedenen Perspektiven. In den monographieartig durchkomponierten prognostischen Schriften des Corpus Hippocraticum (Prognostikon, Prorrhetikos II) spielt der Begriff des ‘Zeichens’ (se¯meı˜on) keine wichtigere Rolle. Auch dort wird über den Vorgang der Semiose nicht grundsätzlich reflektiert. In der Empirischen Ärzte-‘Schule’ des Hellenismus seit dem 3. Jh. v. Chr. (deren Lehre nur fragmentarisch überliefert ist, s. o. § 1.) sind die Zeichen insofern systematischer berücksichtigt worden, als diese Ärzte Spekulation über Ätiologie und innerkörperliche Mechanismen (z. B. über Säfte oder das pneu˜ma, die im Corpus Hippocraticum wichtig sind) ablehnten und stattdessen unmittelbar aus den Krankheitszeichen Hinweise auf die notwendige Therapie abzuleiten versuch-
VII. Griechische und Römische Antike
ten. Die bewirkende Funktion trat hier in der Betrachtung zurück zugunsten der anzeigenden. Die Empiriker sprachen daher öfter explizit von ‘Zeichen’ (se¯meı˜on) und gebrauchten, wie es auch andere Ärzte taten (von Staden 1989: Index), statt dia´gno¯sis den Ausdruck se¯meı´o¯sis. Sie schieden ferner streng zwischen sy´mpto¯ma (einzelnem Krankheitszeichen) und syndrome¯ (oder a´throisma) sympto¯ma´to¯n (Symptomkomplex ⫽ Krankheit); Symptome (z. B. ‘Rippenschmerz’) haben gemäß empirischer Lehre ebenso wie Krankheiten (z. B. pleurı˜tis) Namen. Sowohl einzelne Krankheitszeichen als auch Symptomkomplexe haben Zeichenwert (Deichgräber 1965, 56 ff; 140 ff; 308 ff; siehe auch Art. 38, Art. 47 § 3.1. und § 6.2. sowie Art. 60 § 2.). ⫺ Das Adjektiv se¯meio¯tiko´s, auf das der moderne Begriff ‘Semiotik’ zurückgeht (wie z. B. klassisch ‘Rhetorik’ auf das Adjektiv rhe¯toriko´s, eigentlich ‘rhetorische Kunst’), ist zuerst in medizinischem Kontext bezeugt: Der früheste, leider nicht genau datierbare Quellenbeleg stammt aus der Zeit zwischen dem späten 3. und dem frühen 1. Jh. v. Chr. als Titel Se¯meio¯tiko´n (‘Diagnostisches’) eines verlorenen Werkes des nicht zu den Empirikern gehörenden Arztes Demetrios (von Staden 1989, 506⫺511). Das Fehlen früherer Bezeugungen könnte am fragmentarischen Zustand der Quellen (s. o. § 1.) liegen, allerdings bezeugt Galen ausdrücklich (18 B 633 Kühn), der Terminus se¯meio¯tiko`n me´ros (‘diagnostischer Teil der Medizin’) sei „jüngeren“ Datums, eine chronologisch unpräzise Formulierung, mit der er die Epoche des frühen Hellenismus ebenso wie eine spätere meinen könnte. Die Empiriker scheinen das Adjektiv gleichfalls in der Bedeutung ‘diagnostisch’ benutzt zu haben (Deichgräber 1965, 381).
3.
Semiosen
Die folgenden Ausführungen sollen unter dem in § 2. gemachten Vorbehalt stehen, daß nicht immer explizit von „Zeichen“ die Rede ist. Unter nichtkommunikativen Semiosen (§ 3.1.) werden kognitive Prozesse verstanden, in denen Phänomene entweder des menschlichen Körpers (Krankheitszeichen u. ä., § 3.1.1.) oder der Umwelt (Wetterlage, Landschaft, Sternenhimmel u. ä., § 3.1.2.) als Zeichen gedeutet bzw. für Schlußfolgerungen genutzt werden (zum Symptombegriff vgl. Art. 144 § 2.3.); unter kommunikativen Semiosen (§ 3.2.) wird beabsichtigte Informa-
45. Zeichenkonzeptionen in der Medizin
tionsvermittlung zwischen Individuen verstanden (zur Opposition zwischen nichtkommunikativen und kommunikativen Semiosen vgl. Art. 4 § 5.). Semiosen des letzteren Typs haben oft solche des ersteren zum Inhalt. 3.1.
Nichtkommunikative Semiosen
3.1.1. Zeichen am menschlichen Körper Zu den ältesten erhalten gebliebenen griechischen Prosatexten gehören einige allgemeine Krankheitsbeschreibungen des Corpus Hippocraticum, insbes. in den Traktaten Krankheiten II (ab § 12) und Natur der Frau (Hippokrates 1983, 7 ff; Grensemann 1975, 195 ff; Grensemann 1987, 66⫺73). Ausdrücke für ‘Zeichen’ spielen in diesen frühen Texten noch kaum eine Rolle, wenngleich ärztlicherseits die dargestellten Fakten und deren Verknüpfung wie Zeichen gedeutet wurden. Als Beispiel diene Krankheiten II § 68: „(1) Graue Krankheit: (2) Trockenes [d. h. schweißloses] Fieber und Schüttelfrost befallen von Zeit zu Zeit den Kranken, und der Kopf tut weh, und die Eingeweide schmerzen, und er erbricht Galle, und immer wenn der Schmerz vorhanden ist, kann der Kranke nicht sehen, sondern empfindet Schwere, und der Bauch wird hart und Haut und Lippen grau, und das Weiße der Augen wird grau, und er sieht aus, als würde er stranguliert; bisweilen wechselt er die Farbe und wird grünlich-gelblich statt grau. [(3) Folgt Therapieanweisung.] (4) Die Krankheit stirbt im allgemeinen mit dem Menschen [d. h. begleitet ihn bis ins Alter].“ Solche ältesten Texte des Corpus Hippocraticum zeichnen sich dadurch aus, daß sie nur wenig Spekulation, dafür um so mehr Beobachtung enthalten: alle in dem zitierten § 68 aufgezählten Symptome sind direkt oder indirekt der klinischen Beobachtung zugänglich. Derselbe frühe Traktat bietet Belege u. a. für die differentialdiagnostische Verwendung der Auskultation (unmittelbares Anlegen des Ohres an den Thorax; siehe auch Art. 70 § 5. und Art. 83 § 4.), durch die mehrere Geräusch-Typen unterschieden wurden (§ 47; 59; 61), und für den Gebrauch von Sonden bei der Untersuchung. Die allgemeine nosologische (nicht auf ein bestimmtes Individuum bezogene) Krankheitsbeschreibung des zitierten § 68 ist strukturell und inhaltlich in mehrfacher Hinsicht typisch. Sie besteht aus 4 Teilen: (1) Bezeichnung (Name) bzw. identifizierendes Merkmal der Krankheit, (2) Krankheitszeichen, (3) Therapie, (4) Prognose. (Die Rei-
915 henfolge ist anderswo variiert.) Die in solchen Beschreibungen gegebene Kombination von nosologischen Zeichen bzw. Fakten galt auf einer frühen Entwicklungsstufe der griechischen medizinischen Theorie (die jedoch noch vor 400 v. Chr. in eine neue Entwicklungsstufe integriert wurde, s. u. § 3.1.1.) als hinreichend zur Charakterisierung des Krankheitsgeschehens. Man ging dabei von vorgegebenen Krankheitsbildern aus, die jeweils eine identifizierende Bezeichnung hatten, in Krankheiten II außer in dem zitierten Text z. B. in § 15: „Wenn Wasser im Gehirn entsteht“, 51: „Rückenmarkschwindsucht“. Die Anpassung solcher mehr oder weniger starrer Beschreibungen an die Fülle der Möglichkeiten des in der Praxis tatsächlich Beobachteten geschah eine Zeitlang u. a. durch die Vervielfachung der Beschreibungen von Krankheitsbildern und die Numerierung von Krankheiten. Man erweiterte also die traditionellen Bezeichnungen durch numerische. So enthält im Corpus Hippocraticum der Traktat Innere Krankheiten 3 Schwindsuchtarten (§ 10⫺12), 4 Nierenkrankheiten (§ 14⫺ 17), 4 Gelbsuchtarten (§ 35⫺38), 3 Starrkrampfarten (§ 52⫺54). Dieser Weg mußte jedoch in eine Sackgasse führen, wie es ein Autor des Corpus um 400 v. Chr. (Akute Krankheiten § 1) unter ausdrücklicher Bezugnahme auf das ältere Paradigma formulierte: „Einige [der älteren Ärzte] waren sehr wohl vertraut mit den zahlreichen Varianten bei jeder Krankheit und mit ihrer Differenzierung. Sie gingen aber fehl in ihrer Schriftstellerei, indem sie die Variantenzahl jeder Krankheit präzise angeben wollten: Denn man kann nicht Zahlenangaben machen, wenn man die Krankheit jedes Patienten nur unter dem Gesichtspunkt identifiziert, daß das eine Leiden sich vom anderen irgendwie unterscheidet, und daß angeblich nicht dieselbe Krankheit vorliegt, wenn sie nicht denselben Namen hat.“ Impliziert ist hier, Krankheiten seien auch unter dem Gesichtspunkt zu identifizieren, daß ein Leiden Gemeinsamkeiten mit einem anderen hat, sogar wenn traditionell diese Leiden verschiedene Namen tragen. Die vom Verfasser kritisierte Differenzierung zwischen Krankheitsvarietäten hätte, stetig fortgesetzt, in letzter Konsequenz dazu geführt, in jedem individuellen klinischen Krankheitsfall eine eigene Krankheits-Entität mit einem eigenen Namen oder zumindest einer eigenen Identitätsnummer zu sehen. So hätte das traditionelle nosologische Paradigma sich schließlich selbst aufgelöst (Langholf 1990,
916 150⫺164). Das einfache semiotische Modellschema Name⫺Sache, wie es charakteristisch für das frühgriechische (vorklassische) Denken ist, führte sich also in der Medizin um 400 v. Chr. von selbst ad absurdum (allgemein dazu, ohne Bezug zur Medizin, Kraus 1987/1988, 46⫺56; vgl. Abb. 45.1). Der jeweilige konkrete Krankheitsfall F wird wahlweise einem von mehreren traditionell vorgegebenen und mit sprachlichen Mitteln bezeichneten Krankheits-Zeichenkomplexen (Krankheitsbildern) K zugeordnet:
Diese einzelnen Krankheitsbilder werden nach Bedarf in weitere Krankheitsbilder untergliedert und durch zugesetzte Ziffern bezeichnet: Ka1, Ka2, … Kan; Kb1, Kb2, … Kbn … Kn1, Kn2, … Knn. Jedes Krankheitsbild unterscheidet sich von den anderen durch Krankheitszeichen S in spezifischer Kombination, so daß für jedes K gilt:
Abb. 45.1: Krankheitsfall und Krankheitszeichen, ältere Betrachtungsweise im Corpus Hippocraticum.
Die Lösung der Aporie bestand darin, das Augenmerk statt auf Unterschiede nunmehr verstärkt auf Gemeinsamkeiten der klinischen Fälle zu richten, unabhängig davon, welche Namen die traditionelle Nosologie den Krankheiten der individuellen Patienten beilegte. Die Epidemien und das Prognostikon (beide um 400 v. Chr.) bieten im Corpus Hippocraticum Beispiele für das neue Verfahren. Auf unterschiedliche Krankheiten wird dort ein und dieselbe Krankheitszeichen-‘Checkliste’ angewandt: auf Fieber allgemein (Epidemien I § 3 Littre´ ⫽ § 3 Jones), auf nichtintermittierende Fieber (Epidemien I § 4 Littre´ ⫽ § 7⫺8 Jones), auf Schwindsucht (Epidemien I § 2 Littre´ ⫽ § 2 Jones) und nochmals auf Schwindsucht (Epidemien III § 13). Der Traktat Prognostikon, der allgemein von der Prognose akuter Krankheiten handelt, ist großenteils nach dem Schema ebenderselben ‘Checkliste’ aufgebaut (die auf eine ältere,
VII. Griechische und Römische Antike
verlorene Quelle zurückgeht). In gleicher Reihenfolge werden in den genannten 5 Texten folgende Befunde beschrieben (mit individuellen Zusätzen und Weglassungen in jedem der Texte): Liegen im Bett. Atmung. Frösteln. Fieber. Schüttelfrost. Schweiß. Oberbauch. Wassersucht. Kälte der Extremitäten. Schlaf. Stuhl. Urin. Erbrechen. Husten. Expektoration. Krise. Rachen. Appetit. Durst. Rückfall und apo´stasis (dazu s. u. § 3.1.1.). Delirium in der Agonie. Diese offensichtlich der Praxis, nicht der Theorie entstammende (nicht logisch aufgebaute) ‘Checkliste’ erlaubte es, auch das Fehlen von Krankheitszeichen systematisch zu erfassen (Langholf 1990, 157⫺ 164). Der nosologische Ansatz, der von Krankheits-Entitäten mit jeweils eigenen Krankheitsbildern ausging, wurde trotz dieser Neuerung nicht aufgegeben, sondern blieb weiterhin gültig als eine unter mehreren Betrachtungsweisen, blieb auch produktiv: Die ärztlichen Verfasser der hippokratischen Schriften, insbesondere der Epidemien, beobachteten und beschrieben anläßlich von Epidemien neue Krankheits-Entitäten. (Ähnlich beschrieb der Historiker Thukydides die athenische „Pest“ von 430/429 v. Chr. als neuartige Krankheit.) Maßgeblich waren hierbei in erster Linie die Übereinstimmungen der Krankheitszeichen zwischen den einzelnen Fällen, nicht deren Abweichungen. In Epidemien VI § 3,12 wird dementsprechend die methodische Forderung formuliert, Ähnlichkeiten zwischen Krankheitsfällen festzustellen und Unähnlichkeiten darauf hin zu prüfen, ob sie einander ähnlich seien, „damit aus den Unähnlichkeiten eine Ähnlichkeit werde“. Gesichtspunkte, unter denen sich Krankheiten, die auf den ersten Blick verschieden scheinen mochten, als gleichartig oder ähnlich betrachten ließen, waren das übereinstimmende Auftreten von Krankheitszeichen, z. B. denen der genannten ‘Checkliste’, und insbesondere das Übereinstimmen im Zeitablauf der Krankheiten. Nach einer in der zweiten Hälfte des 5. Jahrhunderts v. Chr. in variierenden Ausprägungen entstehenden medizinischen Lehre haben Krankheiten ⫺ unabhängig von ihrem Namen ⫺ Regelmäßigkeiten ihres Verlaufs, insbesondere der krı´sis (‘Entscheidung’), in der sich entscheidet, ob der Patient gesund wird oder stirbt (Langholf 1990, 79⫺135). Eine Krise konnte nicht an einem beliebigen Tage, sondern nur an einem numerisch festgelegten sogenannten „kritischen Tage“, gezählt vom Krankheitsbeginn, stattfinden. Listen solcher potentiell
45. Zeichenkonzeptionen in der Medizin
kritischen Tage sind ⫺ mit Varianten ⫺ in mehreren Traktaten des Corpus Hippocraticum überliefert. Zum Zeitpunkt der Krise wurde, so glaubte man, der ‘Krankheitsstoff’ (materia peccans nach späterer Terminologie) im Körper abgesondert und/oder aus ihm ausgeschieden. Der Vorgang hieß apo´stasis. Geschah dies nicht an einem der „kritischen Tage“, so führte es zu Rückfall oder Tod. Daß Fieber in Relation zur Krise gemäß drei Typgruppen verlaufen können, wird in Epidemien I § 11 Littre´ ⫽ § 25 Jones dargelegt. Der Verfasser unterscheidet: (1) Heftiges Einsetzen, Abnahme zur Krise; (2) schwaches Einsetzen, stetige Zunahme, Höhepunkt zur Krise; (3) schwaches Einsetzen, Zunahme, Höhepunkt für einige Zeit, Abnahme zur Krise. Diese Typen des Fieberverlaufs zwischen Anfang und Krise (die freilich nicht als schematische Kurven wiedergegeben wurden) gelten nach Meinung des Verfassers „für alle Fieber“ und seien von Bedeutung für die Therapie. Der Arzt glaubte somit, anhand von zeitlich determinierten Fieberzeichen einen ‘Verlaufstrend’ abschätzen zu können. Die prognostischen Zeichen am Patienten waren also komplex. Bei ihrer Deutung hatte der Arzt nicht nur abzuwägen, welche von ihnen mehr oder weniger im Vordergrund standen (z. B. ob die günstigen oder die schlechten überwogen, Prognostikon § 25), sondern er hatte auch den zeitlichen Rahmen des individuellen Krankheitsfalles zu berücksichtigen, wobei er zur Bestimmung der Krise elementare arithmetische Operationen vornehmen mußte. Ferner mußte der Arzt zur richtigen Einschätzung des Einzelfalles feststellen: den nosologischen Typ der Krankheit (z. B. Lungenentzündung, Mumps), die Ernährung und Lebensweise des Kranken, seinen Konstitutionstyp (z. B. Vorwiegen eines der 4 Säfte Blut, Galle, Schwarze Galle, Schleim; Haar-, Augen-, Hautfarbe) und anderes, insbesondere seine Umwelt (dazu s. u. § 3.1.2.). ⫺ Die so gewonnenen prognostischen Zeichen gehörten demnach zahlreichen Beobachtungsbereichen oder -dimensionen an und waren oft inkommensurabel, so daß der Intuition des ärztlichen Praktikers ein weites Feld blieb, zumal abgesehen von den Krankheitstagen die Zeichen selten numerisch, sondern fast nur nach subjektiver Einschätzung quantifiziert waren. In Epidemien VI 8,26 wird hinsichtlich der Prognose so formuliert: „Die Kalkulation ist schwierig, [selbst] wenn man die Methode kennt: z. B. wenn er [der Patient] spitzköpfig, flachnasig, spitznasig,
917 gallig ist, nur schwer erbricht, Schwarze Galle hat, jung ist, planlos gelebt hat. Man muß das alles miteinander zur Deckung bringen und dabei auch den quantitativen Aspekt berücksichtigen“ (vgl. Art. 45 § 2.; siehe auch Sebeok in Uexküll 1984). In hellenistischer Zeit vergrößerte sich das Zeichenrepertoire; insbesondere kam unter Herophilos’ Einfluß die Pulslehre hinzu (von Staden 1989, Index). Der jeweilige konkrete Krankheitsfall F wird analysiert nach den Krankheitszeichen S, die in spezifischer Kombination auftreten. Aufgrund von Ähnlichkeit der Kombination ist es möglich, aber nicht notwendig, den Fall F entweder einem Krankheitsbild K der älteren Betrachtungsweise (die weiterhin gültig bleibt) zuzuordnen oder den Fall F zu anderen Fällen F1, F2, … Fn in Beziehung zu setzen und so neue, bisher unbekannte Krankheitsbilder zu entdecken.
Abb. 45.2: Krankheitsfall und Krankheitszeichen, jüngere Betrachtungsweise in Corpus Hippocraticum.
3.1.2. Zeichen in der Umwelt Nicht nur der Körper des Patienten bot dem Arzt der griechisch-römischen Antike Zeichen, die sich prognostisch verwerten ließen. Auch die Beobachtung der Umwelt des Patienten lieferte solche Aufschlüsse. In der Schrift des Corpus Hippocraticum über Luft, Wasser, Ortslagen zählt das Eingangskapitel die Gesichtspunkte programmatisch auf: „Wer die Heilkunst richtig betreiben will, muß […] erstens in Betracht ziehen, welche Wirkung jeweils von der Jahreszeit ausgehen kann […]; sodann die warmen und kalten Winde […] und die Wirkungen der Wässer […]. Wenn man [als reisender Arzt] in eine unbekannte Stadt kommt, muß man ihre Ortslage zu den Winden und zur Sonne berücksichtigen.“ Die 4 Himmelsrichtungen haben, so fährt der Verfasser fort, spezifische Wirkungen; ebenso das Trinkwasser, je nachdem ob es im Sumpf entspringe und weich oder im Gebirge und hart sei oder ob es salzig und schwer verdaulich sei; ferner die Geländebeschaffenheit ⫺ entweder kahl und trocken oder mit reicher Vegetation und feucht oder in der Niederung und heiß oder hoch und kalt. Bemerkenswerterweise be-
918
VII. Griechische und Römische Antike
nutzt der Autor in seinem gesamten Traktat für diese dem Wanderarzt als prognostische Zeichen dienenden Gesichtspunkte den Begriff ‘Zeichen’ nur ein einziges Mal (se¯meı˜on, § 10; Synonyme kommen nicht vor): Die geschilderten Phänomene wurden offenbar nicht in erster Linie als ‘Zeichen’ gesehen und gedeutet, sondern als Fakten, aus denen andere Fakten zwangsläufig folgten (z. B. daß Augenentzündung und dysenterı´e¯ die notwendige Konsequenz sind, wenn auf einen trockenen, von Nordwind beherrschten Winter ein Frühjahr mit Regen und Südwind folgt, § 10⫺11). 3.2.
Kommunikative Semiosen
3.2.1. Medizinische Terminologie Eine allgemein verbindliche Terminologie hat sich in der griechischen und römischen Medizin nie herausgebildet. Die Ärzte griffen von Anfang an auf Ausdrücke der Alltagssprache zurück, was dazu führte, daß einerseits manche Bezeichnungen mehrdeutig waren (z. B. kardı´e¯ ⫽ ‘Herz’, ‘ventriculus’, ‘ostium cardiacum’), andererseits zahlreiche Synonyme verwendet wurden (z. B. ‘Menses’ ⫽ e´mme¯na, emme˘ nia, epime˘ nia, katame˘ nia, gynaikeı˜a). Mit beiden semantischen Phänomenen hatte noch Galen zu kämpfen, der von fruchtlosen Ärztedebatten um Terminologisches berichtet (Galen 1931, 10 ff). Auch speziell für Krankheitsbezeichnungen gab es Synonyme, lehrreich ist im Corpus Hippocraticum die Abhandlung Krankheiten II § 58, wo ein Leiden benannt ist als „Wenn die Lunge gefüllt ist“; dasselbe schwer behandelbare Leiden, bei dem ein kaum erträglicher Schmerz samt Atemnot im Vordergrund der Symptomatik steht, trägt in Krankheiten III § 7 und Innere Krankheiten § 7 die Bezeichnung „Schwellung der Lunge“, die sich schon im 7. Jahrhundert v. Chr. bei dem Dichter Archilochos findet und zu dessen Zeit jedermann geläufig gewesen sein muß, denn er wendet sie in übertragenem (metaphorischem) Sinne an (Frg. 13 West; der Autor von Akute Krankheiten betont in § 2, daß einige Krankheitsbezeichnungen auf alte Zeiten zurückgehen). Es erübrigen sich Beispiele dafür, daß antike Krankheitsbezeichnungen mehrdeutig im Sinne moderner Diagnostik sind (zu nephrı˜tis vgl. exemplarisch Grmek und Wittern 1977, 3⫺32). Für den Arzt um 400 v. Chr. bezeichneten die Krankheits-‘Namen’ ebenfalls nicht eindeutig bestimmte Affektionen, wie sich aus der oben in § 3.1.1. zitierten Diskussion um Namen
und um Ähnlichkeiten und Verschiedenheiten der Krankheitsbilder ergibt: jeder individuelle Fall wich vom anderen ab, und Krankheiten, die einander unter bestimmten Gesichtspunkten, z. B. dem der Prognose, ähnlich waren, konnten dennoch traditionell verschiedene Namen tragen. Deshalb empfiehlt der Verfasser des Prognostikon an wichtiger Stelle in seinem Schlußsatz, sich bei der Prognose nicht um die Namen von Krankheiten zu kümmern, abgesehen von solchen Namen, die er selbst in seiner Schrift gebraucht habe. Damit wendet er sich jedoch nicht generell gegen die herkömmlichen Krankheitsbezeichnungen. Nur in Umrissen wird hier eine um 400 v. Chr. geführte Diskussion über die Berechtigung und den Wert von Namen (Appellativa) erkennbar. Die Details sind verloren und lassen sich höchstens erraten. Den Rahmen bot die bei den griechischen Denkern des 5./4. Jahrhunderts vielfach erörterte Opposition zwischen ‘Natur’ (phy´sis) und ‘Konvention’ (no´mos). Die Namen, so behauptet im Corpus Hippocraticum der Verfasser des Traktats Die Kunst, § 2, seien „Konventionen der Natur“. Die menschlichen Künste, auch die Heilkunst, hätten, weil sie real und sichtbar seien, Namen; das Umgekehrte anzunehmen sei absurd und unmöglich: daß nämlich die Realität und Sichtbarkeit einer Kunst durch den Namen dieser Kunst erzeugt werde. Realität und Sichtbarkeit einer Kunst seien keine Konventionen, sondern Erzeugnisse der Natur. Was hier über den Begriff ‘Heilkunst’ ausgeführt wird, hat im selben Traktat in § 6, eine Entsprechung: der ‘Zufall’ komme in der Heilkunst nicht vor, denn in ihr geschehe alles nach Kausalität und Finalität; er existiere nicht, abgesehen davon, daß er als Name existiere (Hippokrates 1988, 176 f; 226; 230; 254). ⫺ Nach Meinung dieses Autors sind Namen also dann sinnvoll, wenn sie Existierendes bezeichnen. Das Appellativum ‘Heilkunst’ sei sinnvoll, weil die Heilkunst existiere, das Appellativum ‘Zufall’ existiere qua Bezeichnendes, jedoch ohne Bezeichnetes. Es leuchtet ein, daß dem Arzt, dem Namen des Existierenden als „Konventionen der Natur“ (und nicht etwa als menschliche Konventionen) galten, die Namen auch bei der Deutung und Erklärung der Natur und der Krankheit von autoritativer Wichtigkeit waren. So darf man annehmen, daß z. B. die oben erwähnten traditionellen Bezeichnungen der nosologischen Krankheitsbilder ihren Teil dazu beitrugen, diese Krankheitsbilder als naturgegeben zu betrachten; und auch
45. Zeichenkonzeptionen in der Medizin
Ausdrücke wie krı´sis (‘Krise’) und apo´stasis (‘Absonderung/Ausscheidung des Krankheitsstoffes’) mögen dazu beigetragen haben, das, was sie bezeichneten, als regelmäßige, natürliche Gegebenheiten in allen individuellen Krankheitsfällen zu suchen. Wenngleich diese Ausdrücke sämtlich vage und mehrdeutig waren, so ist ihre Funktion um 400 v. Chr. bei der Strukturierung und Systematisierung des Beobachtbaren doch nicht zu unterschätzen. In späteren Jahrhunderten änderte sich die Einstellung zur Terminologie. Während viele Ärzte unreflektiert-naiv am archaischen semiotischen Modellschema Name/Sache festhielten, war für Galen der Name etwas eher Nebensächliches und Entbehrliches, da „der Ausdruck eines Dinges durch Beschreibung gleichfalls ein Name ist“ (Galen 1931, 14). Zweck der medizinischen Terminologie sei es, die Verständigung zu erleichtern, was jedoch wegen Homonymie und Synonymie vielfach unerreicht bleibe: klammere man sich an die Termini, so täusche Homonymie eine geringere, Synonymie eine größere Anzahl von Dingen vor als tatsächlich vorhanden seien (Galen 1931, 16). „Namen zwingen […] zur Erniedrigung und Versklavung vor ihnen und verhindern […], einen anderen Weg als sie zu suchen“, weil sie suggerierten, daß die Zahl der Sachen ebenso groß sei wie die der Termini (Galen 1931, 15). Im medizinischen Unterricht dürfe man nicht mit den Namen anfangen ⫺ dies jedoch war die Position des Rhuphos gewesen (Rufus 1879, 133 f) ⫺, sondern müsse „mit den Sachen selbst beginnen […], welche Namen tragen“ (Galen 1931, 14). Zuerst solle man die dem Lernenden bekannten Termini benutzen und dann zu unbekannten fortschreiten. Für bisher Unbenanntes müsse man notfalls neue Termini einführen und dabei solche wählen, die möglichst aus sich heraus verständlich seien (Galen 1931, 15⫺17; vgl. auch die Diskussion darüber, ob Wörter von Natur aus (phy´sei) oder durch menschliche Setzung (the´sei) die Dinge bezeichnen, Art. 40 § 3.2., und die Bildung onomastischer Ketten in der islamischen Tradition, Art. 90 § 8.). 3.2.2. Eine Methode der Kodierung klinischer Daten Über das in § 3.1. Dargestellte hinaus sei hier ergänzend auf eine antike Methode der ‘Datenerfassung’ eingegangen. In den individuellen Krankheits-Fallbeschreibungen der Epidemien-Bücher des Corpus Hippocraticum
919 spielen klinische Einzelbeobachtungen nach Krankheits-Zeichenkategorien der medizinischen Praxis und Theorie eine herausragende Rolle. Die Beobachtungen sind dort allerdings in einem notizenhaften und bisweilen unübersichtlichen Textzusammenhang dargestellt. In nachhippokratischer Zeit, spätestens schon im 3. Jahrhundert v. Chr., entstand daher ein System der ‘Datenerfassung’, das es ermöglichte, die in der jeweiligen hippokratischen Krankengeschichte enthaltene Information auszugsweise und übersichtlich durch Buchstaben-Siglen darzustellen. Offenbar ist das System nur für diesen ganz speziellen Zweck (vielleicht gar nur für Epidemien III) erfunden worden. Praktische Bedeutung erlangte es nicht. Erhalten haben sich Siglen zu Epidemien III abschriftlich sowohl in den mittelalterlichen Hippokrates-Kodizes als auch in einem Papyrus-Buchfragment aus dem 2./ 3. Jahrhundert n. Chr.; ferner hat Galen die Siglen in seinem (erhaltenen) Kommentar zu Epidemien III zitiert und unter Bezugnahme auf ältere Literatur ausführlich erläutert (Quellennachweise bei Langholf 1977, 21). Die Deutung der Siglen bleibt trotzdem rätselhaft, zumal die für Handschriftenkopisten sinnlosen Buchstabensequenzen durch Fehler beim jahrhundertelang wiederholten Abschreiben teilweise entstellt sind, so daß die Textzeugen einander widersprechen. Die Bedeutung des einzelnen Buchstabenzeichens war definiert in Abhängigkeit von seiner Position in der aus durchschnittlich einem halben Dutzend Zeichen bestehenden Siglenfolge. So scheint z. B. das letzte Zeichen der Sequenz in der Regel den Ausgang der Erkrankung, das vorletzte ihre Dauer in Tagen anzugeben (Gardthausen 1923, 60⫺68).
Abb. 45.3: Siglen-Sequenz aus Hippokrates, Epidemien III (aus einem Papyrus-Buchfragment des 2./3. Jh. n. Chr., ca. 87% der Originalgröße). Die Krankheitszeichen Sa, Sb, … Sn (vgl. oben Abb. 45.2) sind durch Buchstaben symbolisiert: Iota/Pi (in Ligatur), Theta, Delta, Ypsilon, Alpha.
3.2.3. Kommunikation Arzt⫺Patient, Arzt⫺Arzt Der Arzt des Altertums war nicht durch eine staatliche Qualifikationsbescheinigung geschützt. Sein beruflicher Erfolg beruhte völlig auf der fachlichen und sozialen Anerkennung von seiten des Patienten, die gegebenenfalls
920 auch mittels Polemik gegen Arztkollegen zu erringen war (sehr häufig z. B. bei Galen). Schon aus hippokratischer Zeit liegen Texte zur ärztlichen Sittenlehre und Etikette vor (Eid, In der Arztpraxis). Auch in ihrer Sprache erfüllten die Ärzte seit dem 5./4. Jahrhundert v. Chr. Erwartungen der Öffentlichkeit: Die Schriften des Corpus Hippocraticum sind alle im ionischen Dialekt des Griechischen abgefaßt (s. o. § 1.), obwohl sie teilweise in Regionen lokalisierbar sind, in denen man den dorischen Dialekt sprach; z. B. schrieb Hippokrates, der von der dorischen Insel Kos stammte, als Verfasser medizinischer Schriften ionisch. Das lag in literarischen Konventionen begründet. Erst nach Hippokrates wurde im 4. Jahrhundert v. Chr. der attische Dialekt Athens zur Sprache auch der medizinischen Literatur (z. B. Diokles von Karystos). Aber noch lange im 4. Jahrhundert war nach Zeugnis des Komödienautors Alexis der dorische Dialekt im mündlichen Ausdruck des Arztes ein Statussymbol, das dem Patienten Beziehung zu dem maßgeblichen Zentrum der Arztausbildung, Kos, signalisieren mochte; und in der schriftlichen Produktion der Mediziner seit hellenistischer Zeit finden sich trotz des Vorherrschens des attisch-gemeingriechischen Dialekts (koine˘ ) archaisierende Texte in einem buchhaften, künstlichen Ionisch, das den Lesern wohl hippokratische Fachkompetenz der Autoren andeuten sollte (einige spätere Traktate des Corpus Hippocraticum; außerdem wichtig der Arzt Aretaios, s. o. § 1.). Bevorzugte Publikationssprache der Ärzte römischer Zeit blieb das ‘dialektfreie’ Standard-Griechisch (koine˘ ), doch sind auch zahlreiche lateinische Texte erhalten (s. o. § 1.). Erfolgreiche, d. h. richtige Prognosen gehörten zu den wichtigsten Mitteln der Vertrauenswerbung (zu Inhalt und Funktion der Prognose s. o. § 2.). So heißt es im Prognostikon des Corpus Hippocraticum, § 1: „Wenn der Arzt bei den Kranken Gegenwart, Vergangenheit und Zukunft vorhererkennt [d. h. erkennt, bevor ihn jemand informiert] und vorhersagt, und wenn er das explizit äußert, was die Patienten ungesagt lassen, dann glaubt man ihm eher, daß er ihren jeweiligen Fall verstehe, und die Leute wagen es, sich dem Arzt anzuvertrauen.“ Der Begriff pro´gno¯sis bezog sich im Corpus Hippocraticum also nicht nur auf die Zukunft. Er umfaßte zum Teil auch die heutige Diagnose. Der Autor von Akute Krankheiten kritisiert an den „alten“ Ärzten, deren Paradigma er an-
VII. Griechische und Römische Antike
greift (s. o. § 3.1.1.), sie hätten in ihren allgemeinen Krankheitsbeschreibungen nur solche Symptome berücksichtigt, die auch ein „Nicht-Arzt“ durch geschicktes Befragen seiner Patienten hätte feststellen können (§ 1). Der wirkliche Arzt, so wird öfters betont, unterscheide sich von den lediglich aufgrund von Berufserfahrung praktizierenden Heilern dadurch, daß er Einsicht in die Gründe habe und so sein Handeln rechtfertigen könne (Kudlien 1985, 427 ff). Kam er auf seinen Reisen in eine fremde Stadt, so erlaubte ihm die Feststellung der Umweltbedingungen sogleich Rückschlüsse auf die Krankheiten (s. o. § 3.1.2.). Ermöglicht wurde dies durch eine Reduktion der beobachtbaren Phänomene auf wenige, oft dichotomische Prinzipien, z. B. trocken/feucht; kalt/warm; nördlich/südlich. Hierin zeigt sich der Einfluß der vorsokratischen Philosophie (z. B. des Alkmaion von Kroton). Diese Doktrinen waren ebenso wie die Lehren über die Körpersäfte (z. B. Blut/Galle/ Schwarze Galle/Schleim) auch für Laien leicht zu verstehen. Der kurz nach 400 v. Chr. zu datierende, im Corpus Hippocraticum überlieferte Traktat des Arztes Polybos Natur des Menschen schildert eingangs (§ 1⫺2), wie dergleichen Themen vor Publikum vorgetragen wurden und wie die Auditorien Stellung bezogen. So sind im Corpus öffentliche Reden (Bewerbungsreden um öffentliche Arztpositionen?) überliefert (Die Luft, Die Kunst) (Hippokrates 1988, 10 ff; 167 ff), die um 400 v. Chr. gehalten wurden und philosophischallgemeinverständlich sind; und die etwa gleichzeitige Schrift Affektionen richtet sich ausdrücklich an Laien-Leser (§ 1; hier Reduktion der Ätiologie auf die Wirkung von Schleim und Galle). Vor diesem Hintergrund wird verständlich, warum die Heilkunde im Altertum so oft als Modell-Disziplin angeführt wurde (s. o. § 1.). Die Öffentlichkeit stellte also erhebliche Anforderungen an das theoretische Wissen der Ärzte, weil sie an diesem Wissen in hohem Maße teilhatte. Von Bedeutung wird hierbei gewesen sein, daß im Krankengut des Corpus die soziale Oberschicht überrepräsentiert ist (Deichgräber 1982, 38). Diese Gegebenheiten um 400 v. Chr. müssen sich auf die Semiosen zwischen Arzt und Patient stark ausgewirkt haben. Schon die Patienten werden ihre eigenen Symptome oft im Rahmen der gültigen Doktrinen (über deren Grundzüge ⫺ wenngleich nicht Details ⫺ damals in weiteren Kreisen ein gewisser Konsens bestand) beobachtet und gedeutet
45. Zeichenkonzeptionen in der Medizin
haben; auch der Arzt tat dies, und so darf man in jedem individuellen Krankheitsfall mit einem (im einzelnen nicht rekonstruierbaren) Rückkopplungsmechanismus bei der Beobachtung und Deutung der Symptome (z. B. der in Erscheinung tretenden Körpersäfte) rechnen: Die Semiosen zwischen Arzt und Patient hatten das beiden Seiten nicht unerwünschte Ergebnis, daß Anwendbarkeit und ‘Richtigkeit’ der medizinischen Doktrinen sich regelmäßig bestätigten. Die erstaunliche Tatsache, daß (trotz der gegenüber Theorie und Ätiologie skeptischen und enthaltsamen Empiriker, s. o. § 2.) die hippokratisch-galenische Medizin des griechischen und römischen Altertums bis weit in die Neuzeit einflußreich blieb (vgl. Art. 56, Art. 70 und Art. 90 § 16.1.), hat hier eine ihrer Ursachen.
4.
Literatur (in Auswahl)
Deichgräber, Karl (1965), Die griechische Empirikerschule. Berlin und Zürich (Neudruck der Ausgabe Berlin 1930). Deichgräber, Karl (1982), Die Patienten des Hippokrates. Mainz und Wiesbaden (Akademie der Wissenschaften und der Literatur, Abhandlungen der geistes- u. sozialwissenschaftlichen Klasse 1982, 9). Fiedler, Wilfried (1978), Analogiemodelle bei Aristoteles. Amsterdam (Studien zur antiken Philosophie 9). Flashar, Hellmut (ed.) (1971), Antike Medizin. Darmstadt (Wege der Forschung 221). Galen, Über die medizinischen Namen, arabisch und deutsch, ed. Max Meyerhof und Joseph Schacht. Berlin 1931 (Abhandlungen der Preußischen Akademie der Wissenschaften, Philosophisch-historische Klasse 1931, 3). Gardthausen, Victor (1923), „Die Unterschrift hippokratischer Krankengeschichten“. Zeitschrift des Deutschen Vereins für Buchwesen und Schrifttum 6: 60⫺68. Grensemann, Hermann (1975), Knidische Medizin, Teil I. Berlin und New York (Ars medica II 4,1). Grensemann, Hermann (1987), Knidische Medizin, Teil II. Stuttgart (Hermes Einzelschriften 51).
921 Grmek, Mirko D. und Renate Wittern (1977), „Die Krankheit des attischen Strategen Nikias“. Archives internationales d’histoire des sciences 26: 3⫺32. (Hippokrates:) Hippocrate, Tome X 2: Maladies II, ed. Jacques Jouanna. Paris 1983. (Hippokrates:) Hippocrate, Tome V 1: Les vents. De l’art, ed. Jacques Jouanna. Paris 1988. (Hippokrates:) Hippocrate, Tome II 1: De l’ancienne me´decine, ed. Jacques Jouanna. Paris 1990. Koelbing, Huldrych M. (1977), Arzt und Patient in der antiken Welt. Zürich und München. Kraus, Manfred (1987⫺88), Name und Sache. Ein Problem im frühgriechischen Denken. Amsterdam (Studien zur antiken Philosophie 14). Krug, Antje (1984), Heilkunst und Heilkult. Medizin in der Antike. München. Kudlien, Fridolf (1967), Der Beginn des medizinischen Denkens bei den Griechen. Zürich und Stuttgart. Kudlien, Fridolf (1985), „‘Klassen’-Teilung der Ärzte bei Aristoteles“. In: Jürgen Wiesner (ed.), Aristoteles. Werk und Wirkung, Paul Moraux gewidmet. Bd. 1, Berlin und New York: 427⫺435. Langholf, Volker (1977), Syntaktische Untersuchungen zu Hippokrates-Texten. Mainz und Wiesbaden (Akademie der Wissenschaften und der Literatur, Abhandlungen der geistes- und sozialwissenschaftlichen Klasse, Einzelveröffentlichung). Langholf, Volker (1990), Medical Theories in Hippocrates. Early Texts and the „Epidemics“. Berlin und New York (Untersuchungen zur antiken Literatur und Geschichte 34). Phillips, Eustace D. (1987), Aspects of Greek Medicine. Philadelphia, London und Sydney. Potter, Paul (1988), Short Handbook of Hippocratic Medicine. Quebec. Rufus d’Ephe`se, ed. Charles Daremberg und Emile Ruelle. Paris 1879 (Neudruck Amsterdam 1963). Sigerist, Henry E. (1963), Anfänge der Medizin. Zürich. Staden, Heinrich von (1989), Herophilus. The Art of Medicine in Early Alexandria. Cambridge, England. Wellmann, Max (1931), Hippokratesglossare. Berlin (Quellen und Studien 2). Uexküll, Thure von (ed.) (1984), „Semiotik und Medizin“ ⫽ Zeitschrift für Semiotik 6,1⫺2: 1⫺70.
Volker Langholf, Hamburg (Deutschland)
922
VII. Griechische und Römische Antike
46. Sign conceptions in natural history and natural philosophy in Ancient Greece and Rome 1. 2. 3. 4. 5.
Introduction Inference and perception Semiotic aspects of atomist physics The mathematical chemistry of the Timaeus The signs of the heavens 5.1. Astronomy 5.2. Astrology 6. The science of the earth 7. Natural phenomena as signs 8. Selected references 8.1. Sources 8.2. Secondary Literature
1.
Introduction
In the ancient Greek and Roman world all the natural sciences were grouped together under the one term “physike˘ ”; this term was used to characterize not only research that would today be described as belonging to modern physics, but also research into other areas including botany, chemistry, biology, astronomy and geography. Concerning the basic assumptions of other cultures about the phenomena of nature cf. Art. 36 § 5., Art. 37 § 4., Art. 38 § 2. and 3., Art. 89 § 3., Art. 90 § 15.⫺17., Art. 91 § 4.2., Art. 92 § 5., Art. 93 § 4., Art. 95 § 3., Art. 96 § 4., and Art. 99 § 6. Ancient Greek and Roman studies in the natural sciences were complicated by a number of factors. Physics and cosmology were closely intertwined and were often colored by general philosophical or even ethical values (Lloyd 1985, 109). Moreover the manner in which physical phenomena were treated was often determined by an influential metaphysics, which became all the more intrusive if one considers the negative impact of the following factors: (i) the non-accessibility to the senses of many of the phenomena and objects considered, as in the case of atoms or the void; (ii) the lack of technical and scientific instruments advanced enough to measure phenomena that are only partially or faintly accessible to observation, such as the heavenly bodies and their movements; (iii) the fundamental lack of empiricism and empirical method in Greek science, resulting in the fact that even when texts suggest the possibility of experimentally testing the phenomena described in theory, there is never any mention of such tests actually having been carried out (for this it proved necessary
to wait until Galileo, almost twenty centuries later; cf. Art. 71). The combination of these factors, however, served to increase the weight and importance of semiotic procedures in the definition of scientific research: if phenomena could not be observed directly or reproduced experimentally, then the only possibility was to grasp them by inferences drawn from “signs” (for similar arguments in the Indian tradition cf. Art. 92 § 2.3.). This method of inferring facts not accessible to the senses through the observation of phenomena used as signs (cf. Art 100 about Ch. S. Peirce, who terms this kind of inference “abduction”) extends far back into Greek culture; it appears both in the medical texts of the Corpus Hippocraticum and in the writings of the pre-Socratic philosophers. It was Anaxagoras (ca. 500⫺ca. 428 B. C.) who formulated the method with his famous motto “the phenomena are a sight of what is non-apparent” (“o´psis ade˘ lo¯n ta` phaino´mena”; DK 59 B 21 a), and it is to him that Aristotle attributes the experiment of the inflated goatskin, used as a sign to prove the non-existence of the void (Physics 213 a 22⫺27). Examples of the use of phenomena as signs may also be found in Democritus (born ca. 460 B. C.), Anaximenes (active around 546 B. C.), Empedocles (ca. 493⫺ca. 433 B. C.), Alcmaeon (ca. 500 B. C.) and Diogenes (active around 440 or 430 B. C.), as has been thoroughly documented in a fundamental study by Hans Diller (1932, 35⫺42; cf. also Lloyd 1966, 315⫺319, 322⫺336 and 337 n. 1). In the fourth century, this method of semiotic inference went into decline. In Plato (ca. 429⫺ca. 347 B. C.) we find a method of scientific research totally opposed to it, and Aristotle (384⫺322 B. C.), too, regards it unfavorably. The latter, however, does make two important concessions to the “method of signs”: (i) first of all he furnishes a fairly accurate description of its theoretical basis (An. pr. 70 a 3⫺70 b 38). This leads him to identify it as having less validity (that is, less epistemic certainty) than true scientific proof, in that it is an “inference from the consequent” (Soph. el. 167 b 1⫺5) and not from the cause. Thus the “method of signs” is depicted as reasoning of the ho´ti, “the knowledge that something is”, as opposed to reasoning of the
46. Sign conceptions in natural history and natural philosophy
dio´ti, “the knowledge of why something is” (An. post. 78 a 22⫺79 a 16), and originates in properties that are not inherent in an essential manner (kath’hauto´ ) in the object studied (An. post. 75a 28⫺37); (ii) secondly, though in theory disparaging it, in practice Aristotle actually makes extraordinarily frequent use of it in his scientific research (cf. Art. 40 § 3.2.2. and Art. 42 § 2.1.3.). After Aristotle, the method of semiotic inference flourished once more. The Hellenistic philosophers placed it at the centre of their methods of scientific discovery and tried to rebut the criticisms formulated by Aristotle. In particular, it was the Epicurean school that developed the semiotic method (understood as inferences concerning non-perceptible phenomena drawn from observed data) as a fundamental method of scientific investigation. Indeed Philodemus (Epicurean author of an important treatise on signs in the first century B. C.) even went as far as to suggest that the results obtained by means of semiotic inference were as certain as those obtained through direct experience (De signis fr. 2). In the Hellenistic period, however, the semiotic process in scientific investigation was not a particular prerogative of the Epicureans; it appears, indeed, to have been in widespread use. Broadly speaking, it also characterizes Stoic epistemology, although the differences between the two schools (thoroughly treated in the treatise De signis of Philodemus) are considerable: while the Stoics viewed the process as an inference of an analytic-deductive type (cf. Art. 40 § 2.2.), for the Epicureans it was an inference of an analogic-inductive type (De Lacy and De Lacy 1978, 211, 217, 221; Manetti 1987, 181⫺182). A cognitive programme which specifically takes semiotic inference into account is linked, in Hellenistic philosophies, to a precise classification of being from an epistemological point of view. The Epicurean classification (Sext. Emp., Adv. math. VIII, 316⫺19, not unlike that of the Stoics, cf. Sext. Emp., Adv. math. VIII, 144⫺46) divided reality first of all into that which is evident (enarge´s) and that which is not. The latter class was then subdivided into three categories: (i) those things which are absolutely unknowable because of the limitations of human nature, such as whether the number of stars is odd or even; (ii) those things which lie outside the realm of perception (obscure per se, a´de¯la),
923
but which may be known through “signs” and inferences, such as atoms and the void; (iii) those things which await confirmation (prosme´nonta, a term specific to Epicurean philosophy), by which is meant those objects that lie immediately and temporarily beyond our experience (Epicurus, Ep. Hdt. 38), the knowledge of which is limited to factors such as distance in space or the fact of their being situated in the future. Semiotic inference is relevant to objects belonging to the second and third categories and, in the case of objects that are “obscure per se” assumes the form of conjecture in the classic sense, i. e., inference as to the non-perceivable; as regards objects that “await confirmation”, on the other hand, it takes the form of perceptive inference, in that it involves a conjecture that is introduced within the processes of perception. Elisabeth Asmis (1984, 190) suggests that the type of sign used in drawing inferences as to the non-perceivable broadly corresponds to the indicative sign, while the type of sign used in drawing inferences as to what awaits confirmation corresponds to the rememorative sign. Such a distinction is normally attributed to the Stoics, who related the indicative sign to the category of things which are “obscure by their very nature” (for example “the pores” or “the void”), and the rememorative sign to “things which are temporarily obscure” (such as, for example, the city of Athens, temporarily invisible because of its distance, or a fire which we cannot see, but the existence of which may be inferred from the smoke) (Sext. Emp., Adv. Math. VIII, 145⫺46; Hyp. Pyrrh. II, 98). For similar attempts at a classification of being from an epistemological perspective in ancient India cf. Art. 92 § 2.
2.
Inference and perception
Semiotic elements are to be found playing various roles in theories of perception, especially in the Hellenistic period (cf. also Art. 90 § 2.1. on Islamic conceptions of signs as indicators of that which is not perceptible). The Stoics linked mental representations (phantası´ai) which had been formed as a result of external stimuli more closely to language than to reality: the logikaı` phantası´ai (“rational representations”), i. e., the perceptions that characterize rational beings endowed with language, had the following characteristics: (i) they were correlated to the
924 lekto´n (‘what is meant’), the central element of the Stoic theory of linguistic meaning (Sext. Emp., Adv. Math. VIII, 70); (ii) they were expressed (perhaps even directly elaborated) in propositional terms; (iii) they could be true or false (as a direct consequence of the preceding point) (Manetti 1988 a, 139⫺ 43). Epicurus (342/41⫺271/70 B. C.) and the atomists, on the other hand, explained the processes of perception by recourse to mechanisms involving both a sort of abduction and iconicity. They asserted, in fact, that objects emit a continuous flow of extremely fine atoms which form configurations identical in every respect to the external shape of the solid bodies, these being called “simulacra (eı´dola)”. Travelling extremely fast, these may penetrate our sense organs or our mind, where they produce a more or less exact image (phantası´a) of the body from which they emanated. This theory of Epicurus has been characterized by Long (1971, 117) as a “causal” theory of perception, in that the objects are responsible for the existence of the simulacra which, in turn, directly cause the formation of images in the mind. The relationship between objects and mental images is, however, indirect, and the latter may thus differ from the former. There may indeed be solutions of continuity in the flow of atoms as a result of collisions with other atoms as they travel through the air, or there may be reductions in the size of the atoms at the moment in which they penetrate a person (in this case, too, they collide with other atoms). These factors may produce differences between the image received and the object itself, especially if the latter is at some distance from the person concerned; a simple example would be that of a tower that appears as a small round construction when viewed in the distance but which, as one approaches, turns out to be a large building of square construction (Sext. Emp., Adv. Math. VII, 208⫺209). It is at this point that abduction comes into play within the process of perception. As long as I limit myself to describing the mental image I have received, as for example when I say “That seems to be a small round tower”, I am describing a sensation and cannot be mistaken; but if I wish to express a judgement with regard to the object by saying “That is a small round tower”, then I am adding to the sensation an element of opinion ⫺ i. e., conjecture ⫺ that may be proved or disproved (for example by approaching
VII. Griechische und Römische Antike
the tower). What Epicurus calls “prosme´nonta” are indeed entities in which an element of opinion is added to an existing sensation. Such prosme´nonta, however, are not things that already exist and that may be confirmed immediately, but entities awaiting confirmation which exist as expectations, and which must wait to come into existence as they become evident (Asmis 1984, 191). Modern semiotics has again taken up this theme of the involvement of conjectural factors in processes of perception. Eco (1975, 222⫺3), for example, puts the question thus: “Suppose I am crossing a dark street and glimpse at an imprecise shape on the sidewalk. Until I recognize it, I will wonder ‘What is it?’. But this ‘What is it?’ may be (and indeed sometimes is) translated as ‘What does it mean?’. When my attention is better adjusted, and the sensory data have been better evaluated, I finally recognize that it is a cat. I recognize it because I have already seen other cats. Thus I apply to an imprecise field of sensory stimuli the cultural unit //cat//.” Here, too, the perceptive framework is reproduced by means of recourse to abductions based on previous experiences. It should also be noted that the “cultural unit” mentioned by Eco broadly corresponds to the “element of opinion” in the writings of Epicurus, the only difference being, perhaps, that Eco’s “cultural unit” is more strongly codified and socially shared than the “element of opinion” in Epicurus (cf. Art. 120). Epicurus provides a criterion for testing the prosme´nonta (just as he furnishes one for the a´de¯la ⫺ see below): they are proved by “witnessing” (epimarty´re¯sis) and disproved by “no witnessing” (ouk epimarty´re¯sis). According to Sextus (Adv. Math. VII, 212) this “witnessing” consists of an apprehension obtained by means of evidence ⫺ a clear vision (ena´rgeia) ⫺ that the object of opinion is exactly that which it was previously thought to be. To illustrate this concept, Sextus takes as an example the conjecture that the figure that is approaching is Plato, and claims that this “witnessing” is obtained when the elimination of the distance and a clear vision prove that the approaching figure was indeed Plato. The contrary case, that of “no witnessing”, is found when something other than the conjectured object appears.
3.
Semiotic aspects of atomist physics
The semiotic method was an indispensable tool in establishing the majority of the fundamental notions of atomist physics. Here we
46. Sign conceptions in natural history and natural philosophy
find two subtypes of “objects obscure per se” (a´de¯la): (i) objects that are not perceptible in themselves, such as atoms or the void, and (ii) objects that we are unable to view from close up, but which are not imperceptible in themselves, such as the celestial bodies. This distinction does not concern the mechanism by means of which we come to our knowledge of such objects, for in both cases they are known through signs. The real difference lies in the fact that in the case of atoms or the void ⫺ the two fundamental concepts of the whole theoretical framework of atomism ⫺ we may, according to Epicurus, arrive at a single, absolutely certain theory; in the case of the celestial bodies, on the other hand, there may be various different theories, all in accordance with the evidence supplied by the senses, and all of which have an equal probability of being true. In the latter case, of course, only one of the theories is true in our world, but each of the others is true in the various different possible worlds that may exist ⫺ or have existed ⫺ at some point in space and time (Rist 1972, 40). The fundamental reason for drawing this distinction between the two types of a´de¯la lies, more exactly, in the particular mechanism used for testing the signs. In effect, the signs that allow us to infer the a´de¯la, and by means of which a scientific theory may be constructed, are proved if there is “no counterwitnessing” (ouk antimarty´re¯sis) and are disproved if there is “counterwitnessing” (antimarty´re¯sis). Epicurus seems to have explained “no counterwitnessing” in terms of compatibility or accordance between the phenomena that are imperceptible and those which fall into the realm of observation; “counterwitnessing”, by contrast, involves the incompatibility or disaccord between that which is perceptible and that which is not. Normally the celestial bodies are explained in terms of “no counterwitnessing”, namely by their compatibility with the phenomena which may be directly observed: thus it comes about that a number of alternative explanations may be compatible with the visible phenomena, and this justifies the fact that there may be several different explanations of a certain event in the heavens (cf. Fig. 46.1). As Jean-Paul Dumont points out (1982, 300), Epicurus proposes for the first time an astronomical physics that implies a logic with more than two values, in which alongside truth and falsehood appear intermediate values (cf. Art. 76 § 4.2.2.).
925
Fig. 46.1: Heaven, earth and the oceans according to verses 19⫺22 of the poem Phaenomena, written by Aratus in the third century B. C. (cf. Herren 1971, 145).
With regard to a proof for the fundamental theories of physics, however, Epicurus relies largely on the criterion of “counterwitnessing”: whereas in the previous case it was the compatibility between theory and phenomena that was demonstrated, now it is the incompatibility between the contradictory hypothesis of the theory and the visible phenomena that is stressed. One example of the use of this criterion of “counterwitnessing” is to be found in the formulation of the first principle of Epicurean physics: “nothing is born of nothing”, for which Epicurus advances the proof that were it not so “anything could be born of anything, without any need for generative seeds” (Ep. Hdt. 38). In the elaboration of this principle furnished by Lucretius (94⫺55 B. C.) in De rerum natura (1,159⫺214) we find a much more explicit clarification of the use of this proof. Lucretius demonstrates that if we were to assume that the Epicurean principle is not true, our observations would be very different from what they are. For exam-
926 ple, if we suppose that something derives from a state of non-being, anything we please could derive from anything else, or anything could come into existence at any time; our observation, however, tells us that men are not born of the sea, nor fish of the land, and that the rose does not flower except in spring, etc. This proves, therefore, that the contradictory hypothesis of the stated principle is incompatible with the visible phenomena. In this way the phenomena are thus used as signs: Epicurus does not consider his first principle self-evident, nor does he derive it from non-empirical assumptions; instead he proves it by inference from observable signs. The universe of atomist physics consists of only two types of entity: the body and the void. (Similar assumptions can be found in Buddhist and Taoist cosmology, cf. Art. 95 § 3.) The existence of each of these two entities is scientifically established in a different manner. The existence of bodies, which in Epicurean physics as in earlier philosophical tradition are objects of the sense of touch, is established by means of “witnessing” (epimarty´re¯sis) by perception alone; in fact the sense of touch alone, which all men possess, is sufficient to confirm the opinion that bodies exist. The existence of the void is, on the contrary, inferred from two specific types of sign: the localization of bodies and their movement (Ep. Hdt. 40). The proof here is once again that of “counterwitnessing” (antimarty´re¯sis): if the void did not exist, the bodies would have nowhere in which to stay and through which to move; but this hypothesis is incompatible with the data that we obtain through observation. The ancient atomists seem to have used a method of inference similar to that used by the Epicureans, and to have reached analogous conclusions. Aristotle quotes their arguments on the subject of the existence of the void, citing in this context Democritus and Leucippus (active around 440 B. C.) (Phys. 213 b 4⫺22). The existence of the void is affirmed on the basis of the existence of motion, and is proved by the argument that if the real world consisted solely of fullness it would not be able to receive anything, a fact that is incompatible with visible data. Other arguments, all based on visible data used as signs, are added to the first; among these is the argument that food, which is a body, is the cause of bodily growth: hence its destina-
VII. Griechische und Römische Antike
tion must be empty spaces in the body, for one full body cannot receive another. The central thesis of atomism, from which indeed it takes its name, is that bodies are ultimately indivisible (i. e., they are “atoms”) and unchanging. The argument used to prove this thesis of the atomic nature of bodies is substantially common both to the ancient atomists such as Democritus and Leucippus (cited by Aristotle in De generatione et corruptione 316 a, 10 ff), and to Epicurus (Ep. Hdt. 40⫺41): if we assume that we may carry on dividing bodies to infinity, the result could no longer be a magnitude, as this could be subdivided further; neither could it be a collection of points, as points by their very nature possess no magnitude: it would therefore be total nothingness ⫺ the body would be destroyed into non-being. This argument is not specifically semiotic except for the fact that it is used in an attempt to save the existence of perceptible bodies by placing a limit on divisibility. Lucretius, however, in elaborating the concept furnishes arguments such as the following that are founded on the use of phenomena as signs (De rerum natura 1, 551⫺64): if there were no limit to divisibility, the destructive power of time would have reduced bodies to such an extent that none would be able to reach maturity, whereas, on the contrary, we can see that everything is reformed and reaches its maturity (argument by antimarty´re¯sis). Alongside antimarty´re¯sis there is another type of semiotic inference to be found in the work of Epicurus which was later to be developed by his followers, and by Philodemus in particular: induction. Epicurus makes use of it when he moves from the treatment of fundamentals to that of details (Asmis 1984, 293 ff). For example, considering the properties of atoms (Ep. Hdt. 54⫺55), Epicurus asserts that with the exception of shape, weight and size, atoms have none of the properties possessed by perceptible bodies. All the other properties of perceptible bodies derive from the results of aggregations of atoms, their increases and their decreases. The inductive argument is used to support the thesis of the immutability of shape: we note, claims Epicurus, that when something in our realm of experience (par’he¯mı˜n) undergoes some change ⫺ the removal of material from all around it, for example ⫺ the shape remains the same while other qualities disappear. The fundamental justification of all inductive arguments is that there is no reason to suppose
46. Sign conceptions in natural history and natural philosophy
927
that the state of the phenomena observed is the case, while the state of imperceptible things is not the case.
4.
The mathematical chemistry of the Timaeus
Our analysis of the cosmology and physics of the atomists has led to a theory that is semiotic in the inferential-analogic sense, and which attempts to construct entities pertaining to the theory on the basis of inferences from perceptible entities, thereby assuming a substantial analogy between the world of visible beings and that of the a´de¯la. Now let us consider instead another theory of physics and cosmology that we may define as semiotic in a rather different sense, namely that put forward by Plato in the Timaeus. This forms part of that type of theory which Eco (Art. 34 § 1.5.3.) considers “based upon the assumption that the whole universe is a semiotic process”. In effect, the theory Plato advances in the Timaeus manages to be both “iconic” and hypothetical-deductive at one and the same time, for it interprets the sensible world as an image or imitation of an ideal world, the hypothetical construction of which provides its principal point of departure. Let us examine how Plato, by means of a series of successive deductions, develops that “geometric atomism” in which he works out the physical composition of the cosmos. It is in fact a type of atomism which, though different from that of Democritus and Epicurus, nevertheless attempts to provide a description of the smallest, indivisible elements of material, elements which for Plato are formed of triangles. In the hypothetical-deductive process which leads to the construction of his atomism, Plato (Tim. 53 d ff) sets out from the definition of “body” as an entity possessing the dimension of depth; he then adds the further premisses that the notion of depth involves the presence of a base formed by a plane, and that a plane surface is composed of triangles: thus he reaches the conclusion that all bodies are formed of triangles (cf. Fig. 46.2). Each triangle, continues Plato, is derived from two basic sorts: the scalene triangle and the rightangled isosceles triangle. The four elements (those of the Empedoclean tradition ⫺ fire, air, water and earth) have their origins in these two types of triangle, each element cor-
Fig. 46.2: The five platonic solids according to Timaeus 53 d⫺55 c. Tetrahedron is the shape of “fireatoms”; hexahedron is the shape of “earth-atoms”; octahedron is the shape of “air-atoms”, icosahedron is the shape of “water-atoms”; dodecahedron is not the shape of an element, but is a sort of decoration of the universe (cf. Coxeter 1963, 190).
responding to a particular regular geometric solid. Thus the scalene triangle generates the regular tetrahedron, which constitutes the specific form of fire, the regular octahedron, that of air, and the regular icosahedron, that of water. These three elements are able to transform themselves into each other since they are formed from the same sort of triangles which, if divided up, can re-form in different shapes. The right-angled isosceles triangle, on the other hand, is the constructional basis of the cube which constitutes the specific form of earth. As Kurt von Fritz (1971 ⫽ 1988, 283 f) has observed, providing one ignores the shape of the basic particles, Plato’s atomism has a number of important elements of affinity with modern atomic theory: in particular the fact of assigning atoms that are always the same to the different elements, and the hypothesis that these atoms may be broken up so that one element may be transformed into another (cf. Art. 84). The atomism of Democritus, on the other hand, assumed a diversity in the form of the
928
VII. Griechische und Römische Antike
atoms that was totally without order. The fundamental difference between the two theories, however, lies in the fact that the primary concern of the atomists and Epicurus was to use the phenomena themselves as a point of departure, whereas for Plato they are a point of arrival. In effect what Plato is proposing when he speaks throughout the dialogue of eiko´ta, i. e., of likelihood and plausibility, and when he defines the discourse of Timaeus as a “likely myth” (Tim. 29 d), is something very close to the concept of hypo´thesis in the modern sense, a preliminary theoretical framework that accounts for the phenomena in question in a plausible manner, but which is not founded directly upon observation of the said phenomena. Thus, having constructed the framework of his theory of physics, Plato ⫺ almost as a corollary, and in order to “maintain verisimilitude” (Tim. 55 a ff) ⫺ attempts to relate the increasing complexity of the geometric solids to the growing intensity of some characteristics that may be observed in the different elements. Hence fire, formed of the solid having the fewest triangles, enjoys an abundance of the following properties: (i) mobility; (ii) smallness; (iii) keenness; (iv) lightness. The other elements, formed of more triangles, are progressively less mobile, less light, and so on; and thus we have a type of proof or “sign” belonging to the sensible world which serves to confirm the construction made at the level of the intelligible world. ⫺ For similar ideas about the relationship of the five elements in China and Korea cf. Art. 93 § 4.1. and Art. 94 Table 94.2. Concerning alchemy cf. Art. 90 § 15.
5.
The signs of the heavens
5.1. Astronomy Simplicius (In Aristot. de caelo, ed. Heiberg, 488 ⫽ Fr. 121 Lasserre) relates an anecdote according to which Plato confronted Eudoxos (408⫺355 B. C., the founder of mathematical astronomy in Greece) with the following problem: “what are the uniform, regular movements which, used as a hypothesis (hypotetheı´son), will completely save the phenomena?” According to Lloyd (1973 ⫽ 1978, 83 ff) the problem posed by this question is how it is possible to combine uniform, circular motions in such a way that the outcome corresponds to the visible movements of the planets (which appeared to be neither
Fig. 46.3: Diagram illustrating the spiral movements of the planetary bodies referred to in Timaeus 39 a. AB and DC are the tropics in the celestial sphere; EF is the equator. Each planetary body moves in a spiral included between the limits of the tropics. For example, a celestial body revolving around P at the first twist, will not remain exactly on the same plane after a twenty-four-hour revolution, but will move to a plane passing through P1, and after another revolution to a plane passing through P2, and so on, describing a number of descending spirals of increasing radius, reaching a maximum at the equator, and then again decreasing to B (cf. Dicks 1970, 122).
uniform nor regular; cf. Fig. 46.3). Kurt von Fritz has pointed out (1971 ⫽ 1988, 188 ff) that the attribution of this anecdote, thus formulated, to Plato, is questionable inasmuch as Plato viewed ideal or “a priori” postulates as being of greater worth than observed phenomena. Among the former, for example, we find the postulate that the motion of the heavenly bodies is perfectly circular, that their velocity is absolutely constant, and that the periods of revolution of the various bodies may be expressed as whole number ratios. The origins of postulates of this type may be traced back to Pythagorean concepts, and their application may be seen in the theory of astronomy of the Pythagorean Philolaus, a contemporary of Socrates (DK 44 a 16), whose work on astronomy was known to Plato (according to the doxographic tradition, Plato is supposed to have purchased a copy for a high price during one of his journeys in Italy). Furthermore the doctrine of the “harmony of the spheres”, mentioned in
46. Sign conceptions in natural history and natural philosophy
both the Republic (VII, 530 d) and the Timaeus (35 a⫺36 b), is also of Pythagorean origin. According to this doctrine, which was to be taken up again several times during the centuries that followed, the intervals that divide the heavenly spheres from one another are analogous to the intervals that divide the musical scales. From a semiotic point of view both the sounds and the analogous arrangement of the heavenly bodies form a plane of manifestation of and access to an invisible, secret order of things, and hence are a sign (Repellini 1985, 129 ff). In any case, the greater importance given by Plato to “a priori” elements does not mean that he completely neglected phenomena, if for no other reason than for the role he assigns to bodies located in time and space; these he regards, in the final analysis, as images, i. e., signs, however imperfect, of eternal ideas; and it is, in particular, the heavenly bodies and their movements which in his mind furnish the most perfect images of these eternal ideas. Furthermore, as both von Fritz (1971 ⫽ 1988, 193) and Giannantoni (1985, 57) point out, the criterion expressed in the formula “save the phenomena” (so˘ zein ta` phaino´mena) is to be understood in relation to the well-known formula of Anaxagoras “o´psis ade˘ lo¯n ta` phaino´mena”. In the field of astronomy, in fact, the idea that things may not be what they seem, and that behind the phenomena lies a reality which, though it may not be put to the test directly, may be known by means of semiotic hypotheses, is already to be found in the first certain contribution to the subject, that of Anaximander (born in 610 B. C.). He solves the problem of the setting of the stars by making the hypothesis (in accord with the phenomena, albeit very weakly) that the stars are always present in the form of rings of fire located around the earth, but that it is only possible to see a small part of them at any one time through a hole that rotates around the earth with a regular motion (DK 12 A 10 and 12 A 11). It is this distinction between the apparent motion and the real motion of the heavenly bodies that distinguishes Greek astronomy from that of Babylonia (cf. Art. 89 § 3.2.). Moreover, unlike the Babylonian model, which was of a mathematical type, the astronomical model developed by the Greeks was principally of a geometric-cinematic type, by means of which events in the heavens were
929
Fig. 46.4: System of the homocentric spheres of a planet, according to the theory of Eudoxos (the celestial sphere is oriented on the horizon of Rhodes, whose plane is represented in the figure by the two horizontal hyphens). The most external sphere is that of the fixed stars; the second one is that of the average own motion of the planets. The dark band represents the zodiacal band, within which the latitudinal oscillations of the moon and of the five planets (Mercury, Venus, Mars, Jupiter, Saturn) take place. Only the first and the second sphere constitute the common model of the planetary motion, apart from differences in periodicity and irregularity in relation to average motion. The considered planet is revolving on the equator of the most internal sphere (cf. Repellini 1985, 138).
explained as the “visible effects” of the movements of spheres and circles with respect to other spheres and circles (Repellini 1985, 128). Circles and spheres formed a kind of semantic system reconstructed from the visible astral signs. The astronomy of Eudoxos (elaborated around 370⫺360 B. C.) is of this type (cf. Fig. 46.4). Eudoxos tried to explain celestial phenomena with the aid of a model comprising 27 homocentric spheres. By means of this system he attempted to solve the problem posed by Plato of discovering the uniform circular motions by which it is possible to “save the phenomena” regarding motion in the heavens. In passing from the phenomena to the model of circles and spheres Eudoxos responded to Plato’s invitation to the “true astronomer” (Resp. 530 a) to look no longer at the phenomena of the heavens with the eye as they are no more than imperfect copies of the true motions, but to grasp them with the intellect. In order to explain more adequately the phenomena observed, in the
930 second half of the fourth century B. C. the astronomer Callippus (ca. 370⫺300 B. C.) increased the number of spheres to 33 while Aristotle raised it further to 55 (Metaph. XII, 8). Nevertheless, despite these perfections, the system conceived by Eudoxos was criticized with an appeal to the very principle of “saving the phenomena” (Giannantoni 1985, 59⫺ 60); many other alternative models continued to invoke the same principle, including those of Aristarchus of Samos (ca. 310⫺230 B. C.), Appollonius of Perga (ca. 262⫺190 B. C.), Hipparchus of Nicaea (active from 161 to 126 B. C.) and Ptolemy (active from 121 to 151 A. D.). Aristarchus of Samos (ca. 310⫺230 B. C.), often called “the precursor of Copernicus in antiquity” (cf. Art. 71), indeed revolutionized the system by putting forward a heliocentric hypothesis, placing the sun at the centre of the cosmos and the earth rotating in a circle around it (although we do not know if Aristarchus extended his heliocentric hypothesis to the motions of the five planets which formed part of the system). This hypothesis, adopted by Seleucus (active around 170 B. C.) but criticized by the Stoic Cleanthes (331⫺232 B. C.) as “impious”, was substantially rejected by Ptolemy (author of the Mathe¯matike¯ Sy´ntaxis or Almagestus around the middle of the second century B. C.) and his predecessors on the grounds of various objections; one of these, a proof of a physical nature, had particular weight: it is improbable that a body as heavy as the earth should move itself so rapidly, while it is more plausible that the stars can do so as they are composed of light, i. e., volatile materials such as fire and ether. A basic semiotic characteristic of the models of Hipparchus and Ptolemy consists in their rediscovery and development of the “predictive capacity”; this, typical of ancient calendarial knowledge, had been lost in the early phase of the geometrization of the motions of the heavenly bodies, as a result of the combined action of Plato’s interpretation of the model as an ideal norm and the period’s lack of skills in calculation (Repellini 1985, 146). ⫺ Concerning the calendars developed in the cultures of the world cf. Art. 60 § 4.4.3., Art. 89 § 3.2., Art. 96 Table 96.6 and Art. 99 § 4. 5.2. Astrology As the precepts of astronomy gained ground in the Hellenistic world, the foundations were
VII. Griechische und Römische Antike
laid for the birth and development of what in the modern world is considered a pseudoscience, but was in antiquity treated very seriously indeed: astrology. As Mario Dal Pra has pointed out (1977, 1061), it is important to underline the fact that the relationship between astronomy and astrology is not as current opinion, enlightened by modern science, would tend to suggest: the common idea that astrology preceded astronomy is the result of a conception that sees the phase of the arbitrary, superstitious construction (astrology) appearing before the rational, scientific one (astronomy). In fact, however, from a historical point of view, the procedures that were to lay the foundations for the practice of horoscopy and form the basis of Greek astrology date back no earlier than the second century B. C., to the time after Appollonius of Perga in which Hipparchus was active. Indeed it is only upon the basis of the developments in astronomy in that period that the elaboration of tables showing the positions of the planets in the signs of the zodiac becomes possible (Repellini 1985, 151; Ioppolo 1985, 76; Long 1982, 169). Astrology, however, is also the fruit of other components. First of all it witnesses the merging of the philosophical traditions of Pythagoras and Plato with their doctrine of the harmony of the spheres, in which the sky is seen as the place where the signs of a secret, intelligible order of things are visible. Secondly astrology marks the culmination of a tradition of divinatory knowledge that dates back to a time beyond Greek culture. One fundamental element that emerges in this tradition is the conception of “universal sympathy”, according to which each part of the cosmos is linked to and influenced by another so that each thing is a sign of something else. As we know, this doctrine of “universal sympathy” forms part of Stoic philosophy, according to which the pneu˜ma, which is lo´gos, pro´noia heimarme´ne¯, pervades the whole universe and rules with inviolable laws both the eternal course of the stars and the simple flight of a dove ⫺ hence the fact that the various parts of the cosmos act dynamically on one another. This doctrine provides the basis for the general Stoic theory of divination, defined by Chrysippus (ca. 280⫺207 B. C.) as “the faculty of recognizing, seeing and explaining the signs that God gives to man” (Cicero, De divin. II 63, 130; cf. Fig. 46.5⫺7). It was this faculty of recogniz-
46. Sign conceptions in natural history and natural philosophy
931
Fig. 46.5: The constellation of two bears and the dragon according to Aratus’ Phaenomena v. 28⫺62 (cf. Herren 1971, 146).
Fig. 46.6: The constellation of “Engonasin” or “The man on his knees” according to Aratus’ Phaenomena v. 63⫺73 (cf. Herren 1971, 147).
ing the signs of God that furnished the basis for theological proof (Ioppolo 1985, 77). As Long has demonstrated (1982, 177 ff), however, the points of convergence between astrological theories and Stoic philosophy are not sufficient to justify the view that the Stoics were wholehearted supporters of astrology (as historiographic tradition has until recently held): their consensus is not unanimous. Panaetius (ca. 185⫺109 B. C.), for example, is a detractor. But the historiographic tradition gives particular emphasis to the favorable attitudes of Diogenes of Babylon (ca. 240⫺152 B. C.) and Posidonius (ca. 135⫺51/50 B. C.). In any case, what is asserted by both Diogenes and Posidonius is not a causal relationship between the configurations of the heavens and human events, but the possibility of prediction on the basis of “signs in nature” (Cicero, De Divin. I 57, 130). In this regard, Long (1982: 170, n. 19) suggests a very interesting distinction between “hard astrology”, according to which the
heavenly bodies are at once both signs and causes of human events, and “soft astrology”, in which they are only signs of human events but have no deterministic character. Examples may be found in Hellenistic astrology to support either of these positions. Both, for that matter, are present in the work which marks the culmination of the discipline, an astrological treatise in four books called the Tetrabiblos, by the great astronomer of the second century A. D. Claudius Ptolemaeus. And both again are present in the Astronomica of Manilius, a didactic poem on astrology written at the time of Augustus and Tiberius (first century A. D.). The basic argument of the supporters of “hard astrology” was to stress first of all the undeniable influence of the sun and the moon over earthly events (the seasons, the seas, etc.) and then to hypothesize an extension to the other heavenly bodies of analogous influences over every aspect of human life. Ptolemy, for example, assigned to every planet the specific qualities (heat, dryness, cold, wet)
932
Fig. 46.7: The constellation of “Ophiunchus” according to Aratus’ Phaenomena v. 74⫺90. Ophiunchus is firmly dutching the Serpent, which encircles his knees, and with both his feet well set he is trampling the Scorpion (cf. Herren 1971, 148).
with which it influences the earth: the action of the sun is to heat and to dry; the moon moistens and warms, as do Jupiter and Venus, which thus prove to be benevolent planets. Mars and Saturn, on the contrary, are malevolent planets with extreme qualities of dry heat and dry cold. Mercury’s power is ambivalent ⫺ either to dry or to moisten according to its proximity to the sun or the moon (Tetr. I.4, pp.35⫺9 Loeb Ed.). The basic argument of the supporters of “soft astrology” on the other hand was to consider the events of the heavens as “rememorative signs”, whose code was constructed on the basis of repeated observations of similar events. The sky, indeed, lent itself to such an interpretation as the cyclic nature of its events allowed links to be established between signs and their presumed significance (Cicero, De Divin. II 46, 97; Sextus Empiricus, Adv. Math. V, 105). Unlike Ptolemy and Manilius, who accepted both the hard and the soft versions of
VII. Griechische und Römische Antike
astronomy, Plotinus (205⫺269/70 A. D.) was a relentless opponent of the hard version but accepted the soft one. In his work On Destiny he maintained that the movement of the stars creates a kind of writing which allows us to discover certain meanings relating to the future by means of the systematic use of similarity (analogı´a), just as when the flight of a bird high up in the sky is interpreted as a sign of high or noble deeds (III I.6). Similar considerations are expressed in a later work, On whether the stars are causes (II 3). A particular position in this context is that of St. Augustine (354⫺430 A. D.), who in his City of God (V 7) recognizes that astrologers sometimes make valid predictions from signs in the heavens, but puts this down to the power of evil spirits (in accordance with his theory of demonic divination: cf. Crevatin 1988, 209 ff) rather than to the art of horoscopy (cf. Fig. 46.8). A further aspect of semiotic interest to be found in ancient astrological literature is the fact that astrology is often defended as a “conjectural science” and linked to a type of “weak” sign that does not guarantee infallibility. At the opening of the Tetrabiblos (I 1, pp. 3⫺5, Loeb Ed.) Ptolemy compares the weakness and uncertainty of astrological questions with the certainty that may be reached in the field of astronomy, so that the two disciplines serve to repropose exactly the Aristotelean distinction between weak sign and necessary sign. As Maria Sassi points out (1988, 181), Ptolemy’s presentation of the predictive capacity of astrology echoes the defense which the Hippocratic doctors had made of their art nearly six centuries previously: the defense of the discipline in the face of its abuse by charlatans and the admission of a weak epistemological condition. In this sense astrology is brought close to a whole field of conjectural knowledge (including medicine, navigation and agriculture) in which practical specialization had allowed the development of effective, albeit fallible, techniques of prediction. ⫺ Concerning the cosmological conceptions of other cultures of the world cf. especially Art. 93 § 4.1. and Art. 99 § 6.
6.
The science of the earth
The birth of geography in the ancient world is heralded by the inclusion in a single book of a drawing of the earth and a periegesis by
46. Sign conceptions in natural history and natural philosophy
933
Fig. 46.8: Planisphaerium from Vaticanus gr. 1087 (cf. Boll 1967, Table I).
Hecataeus of Miletus (ca. 500 B. C.) (Repellini 1985, 152). The periegetic writings were accounts of voyages presented in the form of narrations, such as that of Scilaces of Carianda, a sailor in the service of the Persian king Darius I (521⫺486 B. C.), and one of the few authors whose names are known to us today. The drawing of the earth was the result of the cosmological research of the early Ionian philosophers, and it was to Anaximander that the elaboration of the first map was attributed. Thanks to a fragment from an Ionian author of the fourth century B. C., Ephorus, it is possible to reconstruct this drawing (cf. Fig. 46.9). The earth as it was then known was inserted into the cosmos
and represented as a flat disc. At the center of the disc there was a rectangle, representing the area that then formed the known world; this was subdivided by three lines, called tropics and equator, and completely surrounded by ocean which covered the rest of the disc until its edge. Greece and Ionia were placed in the centre of the rectangle, while near the four sides four peoples were placed in dual opposition: on the upper side, that marks the limits of the “uninhabitable cold”, were the Scythians; on the lower side, that corresponds to the “uninhabitable heat”, were the Ethiopians; on the other sides, respectively above and below the equator, were the Celts and the Indians. It is clear here
934
VII. Griechische und Römische Antike
Fig. 46.9: The map of the world according to Hecataeus (ca. 500 B. C.) (cf. Forbiger 1942, Table II).
that the symbolic character and love of closed systems prevail over any similarity to the facts. Such a procedure should not surprise us; indeed, the ‘scientific’ character of this picture becomes clear when it is compared with a curious geographical representation of astrological character to be found in a Hermetic text of Egyptian origin (Festugie`re 1942, 93; Sassi 1988, 177) in which the symbolic elements reach paroxismal dimensions. The earth is depicted as a human figure lying on its back, staring at the sky and absorbing its rays. The head points to the south, the right arm to the east, the left arm to the west, and the feet lie under the Bear. As a
proof (se¯meı˜on) of the veracity of this picture it is argued that men who live in the south have the most beautiful heads and hair; men from the east have more strength in their right arm, as is clear from their skill as bowmen; men from the west are particularly able in defense, for which the left arm is used; the peoples of the north have strong, elegant legs and feet; further south the Italics and Greeks have well-turned thighs and buttocks (a fact that explains for the author their inclination to homosexual relationships); finally, in the center of the earth, at a point corresponding to the heart, we naturally find the Egyptians, abounding in intelligence and wisdom.
46. Sign conceptions in natural history and natural philosophy
935
Fig. 46.10: The map of the world according to Herodotus (5th century B. C.) (cf. Forbiger 1942, Table III).
Clearly the use of “se¯meı˜on” in this context appears incorrect and lacking in any kind of scientific corroboration. It does, however, provide clear evidence of the normality and frequency of recourse to semiotic procedures in the field of geography. In a somewhat more ‘scientific’ milieu we find a clear example of the use of the semiotic method in the conjectures of Herodotus (5th century B. C.) concerning the river Nile (cf. Fig. 46.10). Having first established an analogy between the Nile and the river Danube, he then proceeds to draw conclusions about the former ⫺ whose path, sources and length are all unknown to him ⫺ by using as evidence the known qualities of the latter. As Diller (1932, 16) has pointed out, Herodotus here was basing his ideas on the geography of Hecataeus, the fundamentals of which were already constructed by means of a system of analogies. As the study of geography developed in the ancient world, this semiotic approach proved to be fundamental, and as time went on it was accompanied by two other components: the increase in the amount of informa-
tion available and the use of mathematical processes. It was, for example, by semiotic inference that the spherical nature of the earth was discovered, on the basis of the observation ⫺ considered as a sign ⫺ that the horizons are not constant. On the other hand, the new information that became available (especially as a result of the expeditions of Alexander the Great) and the introduction of mathematics to the study of geography (for estimating the relative distances between different places and for measuring the circumference of the earth) together resulted in the Geography and the new map of Eratosthenes (chief librarian of the library of Alexandria from 245 B. C.). The earliest example of a completely mathematical approach, however, is to be found in the Geography of Ptolemy, conceived from the viewpoint of an astronomer, in which all the localities are identified by indications of latitude and longitude. Though Ptolemy’s map is not without errors ⫺ both in the calculation of distances and in its conjectures as to lands not then known ⫺ it is nevertheless the most thorough, accurate geographic work of antiquity.
936
VII. Griechische und Römische Antike
Fig. 46.11: The map of the world according to Ptolemy (active from 121 to 151 A. D.) (cf. Forbiger 1942, Table VI).
In the geographic works of the ancient world we may note one final semiotic aspect in the conception of a map as a tool that provides information about the signs left by men. This is one of the fundamental aspects of the work of Strabo (64 B. C.⫺23 A. D.), and it is no accident that he was a historian as well as a geographer: for him the earth is like a field of signs at once synchronic and diachronic, by means of which it may be read as a text that is both descriptive and narrative at the same time. ⫺ A continuation of this approach to geography can be found in the cosmographies of the Middle Ages, cf. Art. 57 § 2.5.
7.
Natural phenomena as signs
One branch of ancient knowledge that appears to have been based wholly on signs is meteorology. The term (“meteo¯rologı´a”) is first found in Plato’s Phaedrus (230 a), but many earlier studies of the Pre-Socratic philosophers had turned around natural atmospheric phenomena. Democritus, for example, explained the wind as the filling of a
void with many atoms and the absence of wind as the presence of few atoms, justifying his explanation by the comparison (analogous sign) of the square now full, now empty (68 A 93 a). In a similar manner Anaximenes explained the luminosity of the lamp as the passage of air through a dark mass, using the analogy of the luminous sea ruffled by oars (13 A 17). The Meteorologı´a of Aristotle marks the birth of a true science of the earth that includes atmospheric phenomena. One particular development of meteorology, however ⫺ one which was to lead to the meaning of the term as used today ⫺ is the idea of prognosis. This subject appears in the work On the signs of the weather by Aristotle’s successor Theophrastus (372/369⫺288/285 B. C.), and it is also the subject of the third section into which the poem of Aratus (ca. 315⫺240/239 B. C.) Phaino´mena (early third century B. C.) is usually divided, which deals with forecasting from signs (diose¯mı´ai) (Martin 1979, 93). That the poem of Aratus remained a sacred text for meteorology is demonstrated by its widespread diffusion not only in the
46. Sign conceptions in natural history and natural philosophy
Hellenistic world but also in the Roman world, where it was translated numerous times by authors such as Cicero (106⫺43 B. C.), Varro (116⫺27 B. C.), Ovid (43 B. C.⫺ 17 A. D.), Germanicus (15 B. C.⫺19 A. D.) and Avienus (4th century A. D.); it was also used by Virgil (70⫺19 B. C.) in his Georgica (I 351⫺463) and by Plinius (23/4⫺79 A. D.) in his Naturalis Historia (XVIII, 78⫺79). So vast was its echo that Isidorus of Seville (602⫺36 A. D.) dedicated a chapter in his De natura rerum to the signs that forecast storm or calm. Weather forecasting is a discipline based on signs par excellence; it is a part of practical knowledge, of the mee¯˜ tis of sailors and farmers, and is often incorporated into the broad field of conjectural knowledge that includes everything from medicine to political and military skills and even to astronomy (Detienne and Vernant 1974 ⫽ 1984, 112⫺ 115). Its fundamental characteristic is that of making predictions on the basis of signs and codes constructed for recurrent use. It is a typical science of the ho´ti, for it does not set out from the “causes” but may manage to infer them by starting out from the “effects”. In this sense it may be distinguished from technical divination (another discipline based, for the ancients, on conjecture from signs): according to Cicero’s rationalism, divination, unlike meteorology, never reaches the level of causes and is only apparently based on signs and records of recurring events (nulla signa sint ⫺ “they are not really signs [those of divination]”, De Div. II 16, 46⫺47, 97). Detienne and Vernant have argued (1974⫽1984, XII) that in the fourth century B. C. the writings and teachings of philosophers broke away from knowledge linked to the mee˜¯ tis. This learning, however, was not lost; it remained as a sort of underground stream destined to re-emerge in the Hellenistic world in the guise of treatises on sectorial or “regional” semiotics (cf. Art. 1 § 1.3.), among which the writings on meteorology indeed constitute a fine example.
8.
Selected references
8.1. Sources Aratus, Phainomena. Sternbilder und Wetterzeichen, ed. M. Herren. Munich 1971. Aratus, The Phaenomena of Aratus (with Callimachus, Hymns and Epigrams […], ed. G. R. Mair (The Loeb Classical Library). London and Cambridge, Mass. 1960.
937
Aristoteles, An. pr. ⫺ Prior Analytics (with The Categories and On Interpretation), ed. H. Tredennick (The Loeb Classical Library). London and Cambridge, Mass. 1962. Aristoteles, An. post. ⫺ Posterior Analytics (with Topica), ed. H. Tredennick (The Loeb Classical Library). London and Cambridge, Mass. 1966. Aristoteles, De caelo ⫺ De caelo ⫺ On the Heavens, ed. W. K. G. Guthrie (The Loeb Classical Library). London and Cambridge, Mass. 1971. Aristoteles, De gener. et corr. ⫺ Aristotle’s De generatione et corruptione, ed. C. J. F. Williams (Clarendon Aristotle Series). Oxford 1982. Aristoteles, On Coming-to-be and Passing-away (De generatione et corruptione), ed. H. H. Joachim. Oxford 1922. Aristoteles, Metaph. ⫺ The Metaphysics, ed. H. Tredennick (The Loeb Classical Library). London and Cambridge, Mass. 1968. Aristoteles, Meteor. ⫺ Meteorologica, ed. H. D. P. Lee (The Loeb Classical Library). London and Cambridge, Mass. 1962. Aristoteles, Soph. el. ⫺ Aristotelis Topica et Sophistici Elenchi, ed. W. D. Ross. Oxford 1958. Aristoteles, Phys. ⫺ The Physics, 2 vols., ed. P. H. Wicksteed and F. M. Cornford (The Loeb Classical Library). London and Cambridge, Mass. 1968⫺70. Augustinus, De civitate Dei, in Corpus Christianorum. Series Latina, vols. XLVII⫺XLVIII. Turnhout 1955. Cicero, De divinatione libri duo, ed. A. S. Pease. Urbana 1920⫺23 (reprint Darmstadt 1963). Corpus Hippocraticum, Oeuvres comple`tes d’Hippocrate, 10 vols., ed. E. Littre´. Amsterdam 1839 (reprint 1961). DK, Die Fragmente der Vorsokratiker, 3 vols., ed. H. Diels and W. Kranz. Berlin 1951. Epicurus, Ep. Hdt. ⫺ Epicurus. The Extant Remains, ed. C. Bailey. Hildesheim and New York 1970. Isidorus, Isidore de Seville. Traite´ de la nature, ed. J. Fontaine. Bordeaux 1960. Lucretius, Titi Lucreti Cari De natura rerum, 3 vols., ed. C. Bailey. Oxford 1947. Lucretius, La natura delle cose (with an Italian translation by L. Canali, an introduction by G. B. Conte, text and comment by I. Dionigi). Milan 1990. Manilius, Astronomica, ed. G. B. Goold (The Loeb Classical Library). London and Cambridge, Mass. 1977. Plato, Phaedr. ⫺ Phaedrus (with Euthyphro, Apology, Crito, Phaedo), ed. H. N. Fowler (The Loeb Classical Library). London and Cambridge, Mass. 1966. Plato, Resp. ⫺ Republic, 2 vols., ed. P. Shorey (The Loeb Classical Library). London and Cambridge, Mass. 1963⫺69.
938
VII. Griechische und Römische Antike
Plato, Tim. ⫺ Timaeus (with Critias, Cleitophon, Menexenus, Epistles), ed. R. G. Bury (The Loeb Classical Library). London and Cambridge, Mass. 1966.
Dicks, D. R. (1970), Early Greek Astronomy to Aristotle. London.
Plinius Secundus, Pliny Natural History in Ten Volumes (The Loeb Classical Library). London and Cambridge, Mass. 1958⫺62.
Dumont, Jean-Paul (1982), “Confirmation et disconfirmation”. In J. Barnes, J. Brunschwig et al. (eds.), Science and Speculation. Studies in Hellenistic Theory. Cambridge, England: 273⫺304.
Plotinus, Plotinus in Six Volumes, ed. A. H. Armstrong (The Loeb Classical Library). London and Cambridge, Mass. 1967. Ptolemaeus Claudius, Geogr. ⫺ Claudii Ptolemaei Geographia, 3 vols., ed. C. F. A. Nobbe. Hildesheim 1966. Ptolemaeus Claudius, Synt. math. ⫺ Claudii Ptolemaei opera quae extant omnia, (vols. 1.1 and 1.2) ed. J. L. Heiberg. Lipsiae 1898⫺1903. Ptolemaeus Claudius, Tetr. ⫺ Tetrabiblos, ed. F. E. Robbins (The Loeb Classical Library). London and Cambridge, Mass. 1980. Sextus Empiricus, Adv. math. ⫺ Sexti Empirici opera, ed. H. Mutschmann (vol. II). Lipsiae 1914. Sextus Empiricus, Adv. math. ⫺ Against the Logicians, ed. R. G. Bury (The Loeb Classical Library). London and Cambridge, Mass. 1961. Sextus Empiricus, Hyp. Pyrrh. ⫺ Outlines of Pyrrhonism, ed. R. G. Bury (The Loeb Classical Library). London and Cambridge, Mass. 1961. Simplicius, Simplicii in Aristotelis De caelo commentaria, ed. I. L. Heiberg (Commentaria in Aristotelem graeca 7). Berolini 1894. Theophrastus, Enquiry into Plants and Minor Works on Odours and Weather Signs, ed. A. Hort (The Loeb Classical Library). London and Cambridge, Mass. 1961. Vergilius, Maro Publius, Vergil. The Eclogues and Georgics, ed. R. D. Williams. New York 1979.
8.2. Secondary Literature Asmis, Elizabeth (1984), Method. Ithaca NY.
Epicurus’
Scientific
Boll, Franz (1967), Sphaera. Neue griechische Texte und Untersuchungen zur Geschichte der Sternbilder. Hildesheim. Coxeter, Harold S. (1963), Unvergängliche Geometrie. Basel. Crevatin, Giuliana (1988), “Agostino e il linguaggio dei sogni”. In: G. Manetti (ed.), Signs of Antiquity / Antiquity of Signs ⫽ Versus 50/51: 199⫺215. Dal Pra, Mario (1977), “Astrologia”. In: Enciclopedia Einaudi. Turin: 1061⫺71.
Diller, Hans (1932), “Opsis adelon ta phainomena”. Hermes 67: 14⫺42.
Eco, Umberto (1975), Trattato di semiotica generale. Milan (engl. tr.: A Theory of Semiotics. Bloomington IN 1976). Eco, Umberto (1984), Semiotics and the Philosophy of Language. Bloomington IN. Festugie`re, A. J. (1942), La re´ve´lation d’Herme`s Trisme´giste, vol. I: L’astrologie et les sciences occultes. Paris. Forbiger, Albert (1942), Handbuch der alten Geographie. Leipzig. Fritz, Kurt von (1971), Der Ursprung der Wissenschaft bei den Griechen. Berlin (it. tr.: Le origini della scienza in Grecia. Bologna 1988). Giannantoni, Gabriele (1985), “Su alcuni problemi circa i rapporti tra scienza e filosofia nell’eta` ellenistica”. In: G. Giannantoni and M. Vegetti (eds.), La scienza ellenistica. Naples: 41⫺71. Giannantoni, Gabriele and Mario Vegetti (eds.) (1985), La scienza ellenistica. Naples. Ioppolo, Anna M. (1985), “L’astrologia nello stoicismo antico”. In: G. Giannantoni and M. Vegetti (eds.), La scienza ellenistica. Naples: 75⫺91. Isnardi Parente, Margherita (1985), “Epicuro: L’atomo fra apriorismo ed empirismo”. In: A. Ceresa Gastaldo (ed.), L’atomo fra scienza e letteratura. Genua. Lloyd, Geoffrey E. R. (1966), Polarity and Analogy. Cambridge, England. Lloyd, Geoffrey E. R. (1970), Early Greek Science. Thales to Aristotle. London. Lloyd, Geoffrey E. R. (1973), Greek Science after Aristotle. London. (it. tr.: La scienza dei Greci. Bari 1978). Lloyd, Geoffrey E. R. (1985), “Materia e moto”. In: M. Vegetti (ed.), Il sapere degli antichi. Milan: 109⫺125. Long, Anthony A. (1971), “Aisthesis, Prolepsis, and Linguistic Theory in Epicurus”. Bulletin of the Institute of Classical Studies, University of London 18: 114⫺33.
De Lacy, Phillip H. and A. Estelle De Lacy (1978), Philodemus. On Methods of Inference. Naples.
Long, Anthony A. (1982), “Astrology: Arguments Pro and Contra”. In: J. Barnes, J. Brunschwig et al. (eds.), Science and Speculation. Studies in Hellenistic Theory. Cambridge, England: 165⫺92.
Detienne, Marcel and Jean-Pierre Vernant (1974), Les ruses de l’intelligence ⫺ La me´tis des Grecs. Paris (it. tr.: Le astuzie dell’intelligenza nella Grecia antica. Rome and Bari 1984).
Manetti, Giovanni (1987), Le teorie del segno nell’antichita` classica. Milan. English translation: Theories of the Sign in Classical Antiquity. Bloomington IN 1993.
939
47. Zeichenkonzeptionen in der Religion Manetti, Giovanni (1988 a), “Perception, Encyclopedia, and Language among the Stoics”. In: G. Manetti (ed.), Signs of Antiquity / Antiquity of Signs ⫽ Versus 50/51: 123⫺44. Manetti, Giovanni (ed.) (1988 b), Signs of Antiquity / Antiquity of Signs ⫽ Versus 50/51: 1⫺223. Martin, Jean (1979), “Les phe´nome`nes d’Aratos”. In: G. Aujac and J. Soubiran (eds.), L’astronomie dans l’antiquite´ classique. Paris: 91⫺104. Repellini, Ferruccio F. (1985), “Cielo e terra”. In: M. Vegetti (ed.), Il sapere degli antichi. Turin: 126⫺62.
Rist, J. M. (1972), Epicurus: An Introduction. Cambridge, England. Sassi, Maria M. (1988), La scienza dell’uomo nella Grecia antica. Turin. Sorabji, Richard (1983), Times, Creation and the Continuum. London. Vegetti, Mario (ed.) (1985), Il sapere degli antichi. Turin.
Giovanni Manetti, Siena (Italy)
47. Zeichenkonzeptionen in der Religion der griechischen und römischen Antike 1. Einleitung 1.1. Zeitrahmen 1.2. Eigenarten antiker Religion 1.3. Religion und Zeichen 2. Zeichen des Sakralen 2.1. Der Ort 2.2. Die Person 3. Das Götterbild 3.1. Allgemeines 3.2. Das Kultbild im Ritual 3.3. Bilderkritik 4. Ritual als Zeichen 4.1. Das Opfer 4.2. Gestik 4.3. Andere Riten 5. Das Wort als verbales Ritual 5.1. Götternamen 5.2. Gebete und Kultrufe 6. Divination 6.1. Orakel, Traum 6.2. Zeichen 7. Der Aufstieg des Christentums 7.1. Die historische Entwicklung 7.2. Das Bilderproblem 8. Literatur (in Auswahl) 8.1. Quellen 8.2. Sekundärliteratur
1.
Einleitung
1.1. Zeitrahmen Der vorliegende Überblick über die Zeichenkonzeptionen in der griechischen und römischen Religion setzt seine zeitlichen Grenzen rückwärts mit dem Beginn der dichterischen (Homer, Hesiod) und künstlerischen (geometrische Kunst) Äußerungen des 8. Jahrhunderts v. Chr., nach vorne mit der Christiani-
sierung, deren äußerliches Signal das Verbot paganer Kulte durch Theodosius I. im Jahre 395 n. Chr. war. Ausgespart bleibt nach vorne der ganze Bereich der Rezeption paganer Vorstellungen im Christentum (vgl. dazu Art. 58 § 5. und Art. 60 § 3.2.2. und § 6.7.), nach hinten die Religion der griechischen Bronzezeit („minoische“ Religion vor allem Kretas, „mykenische“ Religion; vgl. Art. 32 § 4.): sie stellt ihre eigenen Probleme, da sie nur bedingt durch schriftliche Äußerungen erfaßbar ist (überliefert und lesbar sind bloß die sogenannten „Linear B-Texte“, zufällig erhaltene Verwaltungsnotizen lokaler Paläste), Architektur und Ikonographie teils eigenständig, teils von den Hochkulturen des Vorderen Orients mitgeprägt sind und die Frage der religiösen Kontinuität durch die radikalen politischen, sozialen und kulturellen Brüche am Ende der Bronzezeit noch nicht zufriedenstellend gelöst ist (Burkert 1977, 48⫺98; Marinatos 1992). 1.2. Eigenarten antiker Religion Die griechische und römische Religion ist resolut anthropomorph: die Götter haben Menschengestalt und sind nach Menschenart reagierend gedacht; Mythos, Ikonographie der Kultbilder und indigenes Verständnis des Kultes richten sich danach. Zentrale Ausdrucksform ist der Mythos, der auch weitestgehend die Ikonographie bestimmt; auch in Rom folgt der Mythos wesentlich griechischen Modellen. Zwar sind die Götter ein Gegenbild der Menschen, indem sie alterslos und unsterblich sind, Kraft zum wunderba-
940 ren Eingreifen und Befähigung zum sorgenlosen, „leichten Leben“ (Homer) haben. Doch drückt sich dies nicht (wie etwa in Ägypten oder Indien) in nichtmenschlichem Aussehen, Denken und Fühlen aus; vielmehr wird auf die Gottheit eine von menschlichen Defizienzen gereinigte Idealgestalt des Menschen projiziert. Auch bei den Sozialstrukturen der Götterwelt ist die elementarste Struktur wie beim Menschen die Familie (die allerdings bei den Olympiern, vor allem den männlichen, von den Zwängen monogamer Ehebindung befreit ist). Die politische Struktur aber übernimmt auch nach der Transformation der archaischen Adelsstaaten in Demokratien nie die demokratischen Strukturen der Menschenwelt, der Olymp bleibt ein Königreich unter König Zeus; diese Asymmetrie spiegelt sich im Kult, wo auch in demokratischer Zeit ´ rcho¯n Bain Athen ein „Beamter König“ („A sileu´s“), in Rom ein „Rex Sacrorum“ in ritueller Funktion erhalten bleiben. Der religiöse Symbolismus des hellenistischen Königtums und des römischen Kaisertums konnten leicht wieder hier anknüpfen. Gleichzeitig zeigt die kosmo- und theogonische Mythologie seit Hesiods Werken und Tagen (Anfang des 7. Jahrhunderts v. Chr.) den Menschen in einer ambivalenten hierarchischen Stellung den Göttern gegenüber. Zwar wird die jetzige Ordnung der Welt durch die Funktionen definiert, die die Generation der jetzt herrschenden Götter im Prozeß der Götter- und Weltwerdung erworben hat, doch ist kein Gott für die Schöpfung des Menschen verantwortlich, gibt es keinen bedeutenden Menschenschöpfungsmythos; wenn in antik eher marginalen und späten Mythen etwa Prometheus auch Menschenschöpfer ist, ist er eine göttliche Gestalt einer früheren Generation ohne bedeutenden Kult: der Mensch ist also nicht Geschöpf der Götter (wenigstens nicht derer, die die jetzige Weltordnung determinieren), anders als in Israel und im Alten Orient, wo der Mensch eindeutig Kreatur und Untergebener der Götter der Jetztzeit ist, geschaffen zum Dienst an ihnen, um ihnen harte Arbeit abzunehmen, wie mesopotamische Mythen formulieren. Entsprechend sind auch im rituellen Verkehr von Gott und Mensch die Hierarchien ambivalent: in der Ideologie von Opfer und Weihgeschenk mischen sich Vorstellungen von der reziproken Gabe zwischen sozial Gleichgestellten, welche Bindungen schafft, mit solchen vom Geschenk des sozial Tieferstehenden an den Höherstehenden und sogar des
VII. Griechische und Römische Antike
Fütterns eines sozial Abhängigen; in der komischen Brechung der aristophanischen Vögel können die Vögel, angestiftet von ihren menschlichen Führern, gar die Nahrungszufuhr zwischen irdischen Opferstätten und himmlischer Götterwohnung abschneiden und die Götter erpressen. Die fast ausschließlich anzutreffende Religionsform Griechenlands und Italiens im ersten Jahrtausend v. Chr. ist die der Polisreligion, d. h. ein System, das grundsätzlich auf den Raum eines einzigen Stadtstaates ausgerichtet ist und nur sekundär (und weit stärker in der Ideologie als in der religiösen Praxis, wo dies nur punktuell geschieht) sich mit anderen Polissystemen zu überlokalen, gar überregionalen Systemen vernetzt; streng genommen ist eine Einheit „griechischer Religion“ Postulat, nicht Realität. Immerhin geht wenigstens in Griechenland der kosmogonische und genealogische Mythos schon früh weit über den Polisrahmen hinaus zur Konstruktion einer panhellenischen Einheit: bereits in den nachhesiodeischen Ehoien (Mitte des 6. Jahrhunderts v. Chr.?) wird eine Genealogie gesamtgriechischer heroischer Ahnen aufgestellt. Die Stadt Rom ihrerseits ist bis in spätrepublikanische Zeit eine Polis am Rande der griechischen Welt, zwar außerhalb des hellenischen Gemeinsamkeitsgefühls, das sich institutionell in panhellenischen Festen und Riten äußerte, doch soweit innerhalb ihrer, daß eine kulturelle und religiöse Durchdringung ebenso faßbar ist wie die Inanspruchnahme überlokaler griechischer Heiligtümer (Delphi; Delos; Epidauros) durch individuelle Römer und den römischen Staat. Spezifische Eigenheiten Roms liegen nicht völlig, aber weitgehend in der Spannweite der Unterschiede unter den lokalen Religionen der griechischen Poleis; größte Einschränkung ist, daß in Rom keine umfassenden kosmogonischen Mythen wichtig sind, sondern Entstehungsmythen der eigenen Stadt. Die grundsätzliche Einheit der beiden Religionen erlaubt also nicht, im hier betrachteten Zeitraum von rund zwölf Jahrhunderten zwischen griechischer und römischer Religion grundsätzlich zu trennen; und seit der frühen Kaiserzeit verschmelzen die beiden Kulturen jedenfalls in sehr großem Maß. 1.3. Religion und Zeichen Religion kann verstanden werden als ein Mitteilungssystem, das sich symbolischer Aussa-
941
47. Zeichenkonzeptionen in der Religion
gen bedient; zumeist wird dabei die konnotative Ebene der verwendeten Zeichen ausgenützt und privilegiert. Angesichts der dominanten Form der Polisreligion kann es in einer Übersicht nur darum gehen, Gemeinsamkeiten und gegebenfalls signifikante Besonderheiten aufzuzeigen (zur Verwendung der griechischen Wörter für Zeichen vgl. Art. 39). Die antiken Religionen Griechenlands und Roms sind polytheistische Systeme; der Raum des Religiösen wird durch eine Vielzahl von aufeinander bezogenen übernatürlichen, personell gedachten Akteuren (Göttern, „daı´mones“, Heroen, in einer im Lauf der Zeit sich festigenden und verkomplizierenden Hierarchie) bestimmt. Grundsätzlich kann man dementsprechend unterscheiden zwischen (a) Zeichen für die Götter usw. und den ihnen zugehörigen sakralen Bereich, also Zeichen, mit denen die Menschen das Göttliche und seinen Bereich kennzeichnen (siehe unten § 2.⫺5.), und (b) Zeichen von den Göttern usw. her, also Zeichen, welche die Menschen als von den Göttern gesandt deuten (siehe unten § 6.): das Erkennen und Deuten dieser Zeichen von den Göttern her ist Aufgabe der Wahrsage- und Zeichendeutungskunst, Divination. Im ersten, umfassenden und hier vornehmlich behandelten Bereich der Zeichen für das Göttliche sind Zeichen (1) materielle Objekte ⫺ natürliche Gegenstände, Bauten, rituelle Paraphernalia, Kleidungsstücke; privilegiert sind dabei die Götterbilder nicht zuletzt deswegen, weil sich an sie seit dem späten 6. Jahrhundert v. Chr. eine ausführliche und verästelte Reflexion über die Funktion des Bildes in der Religion anschließt, die auch nach dem Ende der paganen Religion nicht zur Ruhe kommt; (2) rituelle Handlungen, einschließlich Gesten und Gebärden, deren spezifisch religiöse Funktion noch ungenügend erforscht ist; (3) sprachliche Zeichen, Götternamen ebenso wie verbale Riten (Gebete, Flüche, Zaubersprüche, Hymnen, Ausrufe); an die Namen schloß sich wie an die Bilder eine intensive antike Reflexion an. Im zweiten Bereich, den Zeichen von den Göttern her, die Objekt der Deutung („divinatio“) sind, unterscheidet die griechisch-römische Theorie nach der Art der Deutung zwischen kunstmäßiger Divination („artificialis“), wo die Deutung einem ausgebildeten Spezialisten obliegt (Eingeweideschau, Auguralwesen, Astrologie, Losorakel, Wunderzei-
chen und Blitze), und natürlicher („naturalis“), wo keine kunstmäßige Deutung zwingend ist (Traum, Ekstase) (zur Klassifikation der religiösen Zeichen im Christentum vgl. Art. 58 § 3.).
2.
Zeichen des Sakralen
2.1. Der Ort Religion ist an Orte gebunden. Kult findet im sakralen Raum, an bestimmten sakralen Objekten statt (vgl. Abb. 47.1). Solche Objekte sind entweder natürliche, gewachsene (Bäume, Quellen, Grotten) oder vom Menschen gesetzte Gegenstände (Steine, Steinhaufen) oder aber Artefakte (Pfeiler, Altäre, Tempel, Statuen). Die Heiligkeit der natürlichen Gegenstände wird durch rituelle Aktionen (Begießen mit Öl, Wein und anderen Flüssigkeiten, Opfer) punktuell, durch besondere Auszeichnung (Aufhängen von Kränzen, Bändern oder Votivbildern; Versenken von Opfergaben wie Münzen; Einsalben mit Öl) mehr oder minder permanent markiert: dadurch wird der Zeichencharakter des Verweises auf eine Gottheit eindeutig gemacht (vgl. Abb. 47.2). Fehlen solche Attribute, so bleibt der Verweis jedoch auch möglich (Seneca, Epistulae morales 41,3). Wichtiger ist der ausgegrenzte sakrale Raum (gr. te´menos, lat. templum, fanum, delubrum): eine Quelle kann Teil eines solchen größeren sakralen Raums sein (Clitumnus: Plinius, Epistulae 8, 8; vgl. auch Art. 36 § 4.3. und § 5.4.). Grenzsteine markieren seine Peripherie, Altäre, Weihgeschenke, Statuen, Tempel seinen Binnenraum. Verschiedene Bereiche des sakralen Raums werden durch verschiedene Zugänglichkeit differenziert: es gibt im Temenos Bereiche, wo Gläubige bloß nach Vollzug besonderer Rituale (Opfer vor dem Eintritt in den Schlafsaal in Inkubationsheiligtümern) oder wo allein Priester zugelassen waren (Adyta, „Allerheiligste“ in verschiedenen Tempeln); im Extremfall ist der durch Grenzsteine markierte Raum leer und für den Menschen unbetretbar (gr. a´baton als ‘Ort des Blitzeinschlags’). Zentral ist der Altar als Ort des Opfers (Homer, Ilias 8, 48; Ovid, Metamorphosen 6,325 f); die griechische Dichotomie von aufgemauertem, durch Stufen hervorgehobenem Brandaltar und ebenerdiger Eschara bzw. Opfergrube übernimmt die Dichotomie von himmlischen und unterirdischen Opferemp-
942
VII. Griechische und Römische Antike
Abb. 47.1: Pinax (Holztafel als Ex Voto) mit Darstellung der Opferprozession, aus einem Nymphenheiligtum bei Sikyon, 6. Jahrhundert v. Chr. (nach Hausmann 1960, 14). Die Opfernden halten den einmaligen rituellen Akt für die Zukunft fest: In der mit einem Zweig als Sakralraum markierten Grotte nähern sich von links zwei Frauen mit Zweigen und Binden in der Rechten, die Linke zum Gruß an die Gottheiten erhoben; vor ihnen gehen bekränzt Flöten- und Kitharaspieler und ein Opferdiener mit Opfertier (als Sklave kleiner dargestellt); an der Spitze eine Frau mit Opferkorb und Spendekrug vor dem Brandopferaltar mit Blutflecken.
Abb. 47.2: Ostgriechisches Weihrelief, 2. Jahrhundert v. Chr. München, Glyptothek (nach Hausmann 1960, 90). In einem Heiligtum, das durch den mit einer Binde ausgezeichneten Baum, einen Pfeiler mit zwei Götterstatuen und einen Brandopferaltar bezeichnet ist, thronen rechts die Götter als Inhaber des Bezirks (Isis und Sarapis). Am Altar ist eine Gruppe von Verehrern mit dem Opfer beschäftigt, von links kommt eine weitere Gruppe im Ausgehkostüm hellenistischer Frauen. Das Relief zeigt ein interessantes Nebeneinander von real präsenten Statuen (auf dem Pfeiler) und ideal präsenten Gottheiten.
943
47. Zeichenkonzeptionen in der Religion
Abb. 47.3 a: Der Hera-Tempel in Paestum (erbaut vor 450 v. Chr.) als Beispiel eines griechischen Tempels auf niedrigem Stufenunterbau (nach Kähler 1964, Tafel 5).
Abb. 47.3 b: Athen, Hephaistos-Tempel an der Agora; sogenanntes Theseion (nach Kähler 1964, Tafel 4 c). Grundriß eines griechischen Normaltempels mit umlaufender Säulenstellung (sogenannter Peripteros) und einem Hauptraum mit Innensäulen zur Aufnahme des Kultbildes.
fängern (Gott versus Heros, olympisch versus chthonisch), während römisch die feste Verbindung von „ara“ (Brandopferaltar, gebaut oder ad hoc aus Rasenziegeln errichtet) und „focus“ (tragbarer und ad hoc aufgestellter Herd für Weihrauch und Libation) ist (Dume´zil 1974, 321 f). Ein Tempel (nao´s/neo˘ s, aedes sacra ‘heiliges (Wohn-)Zimmer’; vgl. Art. 163) wird erst im Lauf der Zeit wichtig und fast obligatorisch (vgl. Abb. 47.3 a und b). Zwar ursprünglich wohl herzuleiten von den Formen der profanen Wohnhütte, unterscheidet er sich durch die Form (einräumig oder zweiräumig mit einem sogenannten a´dyton, einem unbetretbaren Raum), die Größe (hekato´mpedos, 100-Fußtempel), das Material (Stein
statt Holz; zum Übergang vgl. Pausanias 5,16,1; Marmor statt Ziegel, vgl. Gros 1976) sowie bestimmte Formelemente (Apsis, Giebel mit Rundskulpturen, Säule, Treppenpodest, das, in Italien weit höher als in Griechenland, den Bau in die Höhe hebt; vgl. Abb. 47.4 a und b). Auf besondere Kultformen oder theologische Auffassungen verweisen besonders Architekturformen (quadratisches Mysterienheiligtum von Eleusis mit Schautreppen im Innern als Ort eines geheimen Gruppenrituals, vgl. Abb. 47.12; Rundbau mit halbkugelförmiger, oben offener Kuppel beim Pantheon in Rom, einem Tempel „aller Götter“, wobei Kreis und Kugel Universalität konnotieren) (vgl. Abb. 47.5 a und b; zur Fortsetzung der Sakralarchitektur im Christentum vgl. Art. 58 § 4., Art. 60 § 4.6. und Art. 72 § 1.4.; zur Tempelbaukunst in den anderen Weltreligionen vgl. Art. 90 § 10., Art. 92 § 1., Art. 93 § 9.3., Art. 96 § 5. und Art. 97 § 8.). Konstitutiv für den Sakralraum sind weiter die Weihgeschenke (gr. anathe˘ mata, lat. donaria votiva; Van Straten in Reverdin und Grange 1992, 247⫺384). Sie verweisen auf die helfende Gegenwart der Gottheit und perpetuieren zugleich das Dankopfer des so von der Gottheit unterstützten Menschen. Im einzelnen finden sich alle möglichen Einzelformen ⫺ vom Alltagsgegenstand, der durch die Aufstellung neue spezifische Konnotationen erhält, bis zu dem eigens für die Aufstellung hergestellten abbildenden Kunstwerk,
944
VII. Griechische und Römische Antike
Abb. 47.4 a: Die sogenannte Maison Care´e in Nıˆmes (erbaut um 20 v. Chr.) als Beispiel eines römischen Tempels mit hohem Podest und vorgelagerter Freitreppe (nach Kähler 1970, Tafel 38).
der Götterstatue oder dem Weihrelief, das häufig die Opfergruppe abbildet; selten sind allerdings symbolische Zeichen, wie das Relief eines Zopfpaars, das auf ein Haaropfer nach Rettung aus Seenot verweist.
Abb. 47.4 b: Pompeji, Apollo-Tempel (nach Kähler 1970, Abb. 4). Grundriß eines römischen Normaltempels mit Cella in umlaufender Säulenhalle und einer großen Freitreppe vor der Hauptfassade, die vom Altar her in die Höhe führt; die ganze Anlage ist von einem Säulenhof umgeben.
2.2. Die Person Bestimmte Menschen können durch besondere Zeichen permanent oder temporär von der Gruppe geschieden und als sakral ausgezeichnet werden; in der griechisch-römischen Antike gilt dies insbesondere für die Priester (Beard und North 1990). Der griechische Priester ist ein Polisbürger, der wie ein anderes Amt auch ein Priestertum zeitweilig oder lebenslang bekleiden kann. Entsprechend ist er durch Zeichen bezeichnet, die umfassender, aber nicht spezifisch religiös einen höheren Status innerhalb der Bürgerschaft ausdrücken (weißes Gewand, Goldkranz; Ehrenplatz im Theater, in dessen Sitzordnung sich die Bürgerschaft abbildet). Diese Tracht trägt er gewöhnlich nur an den Festtagen seines Gottes, erst hellenistisch auch als besondere Ehre an allen Festen der Polis. Besondere Zeichen gehören zu besonderen, auch sonst weit stärker abgesonderten
Priestern wie dem eleusinischen Hierophanten (dem obersten Kultfunktionär, „der das Heilige erscheinen läßt“; vgl. Abb. 47.6), der durch Haartracht und Kopfbinde (gr. stro´phion) und ein besonderes Gewand, wenigstens in der Kaiserzeit auch durch Verlust seines bürgerlichen Namens (Hieronymie) ausgezeichnet war (Mylonas 1961, 229 f). ⫺ Gelegentlich hören wir davon, daß Priester bei Amtsantritt eine besondere Initiation zu vollziehen hatten; generell wird man dies bei Kulten annehmen dürfen, wo der Priester privilegierten Zugang zum sakralen Raum hatte. Ähnlich wird in Rom gewöhnlich ein Priesteramt („sacerdotium“; Beard in Beard und North 1990, 19⫺48) von einem Vollbürger zusammen mit anderen Ämtern ausgeübt (Scheid 1985, 36⫺57, 66⫺74). Dabei wird der Ausübende mithin nur während des entspre-
47. Zeichenkonzeptionen in der Religion
Abb. 47.5 a: Das Pantheon in Rom: Vorderansicht mit der nach dem Vorbild eines rechteckigen „Normaltempels“ vorgeblendeten Eingangshalle (nach Kähler 1970, Tafel 63).
chenden Rituals besonders gekennzeichnet, und zwar gewöhnlich durch dieselbe purpurgesäumte Toga wie jeder Magistrat, dazu aber ⫺ anders als der Magistrat, der mit unbedecktem Haupt agierte ⫺ durch eine besondere Kopfbedeckung („tutulus“ bzw. „galerus“; vgl. Abb. 47.7 und 47.8). Die Sonderstellung entspricht der anderen, daß ein Priester gewöhnlich lebenslänglich, ein Magistrat auf eine beschränkte Zeit gewählt war. Stärker gekennzeichnet sind einzelne Priestertümer, die bestimmte momentane rituelle Sonderfunktionen haben (so die „Salii“ als kriegerische Waffentänzer mit Ovalschild, Lanze und Kegelhelm, deren Formen waffentechnisch längst obsolet waren, und die „Luperci“ als nackte Läufer mit Fellschurz in einem karnevalsartigen Ritual) oder die strukturell aus der Bürgerschaft ausgesondert sind wie etwa die „virgines Vestales“ oder, besonders auffallend, der Priester des kapitolinischen Iupiter („flamen Dialis“), des obersten Stadtgottes. Besondere Gewandung und Kopfbedeckung gehen hier zusammen mit einer Reihe von rituellen Zeichen (Verbot, zu reiten und ein Heer unter Waffen zu sehen, woraus Unfähigkeit zur Bekleidung von höheren Magistraturen resultiert; Speise- und Kleidertabus und dgl.), die seine Sonderstellung markieren (vgl. die Liste bei Wissowa 1912, 498⫺500).
945
Abb. 47.5 b: Das Pantheon in Rom: Querschnitt mit eingezeichnetem Kreis, der den kugelförmigen Raumkörper andeutet (nach Kähler 1970, Abb. 11).
Abb. 47.6: Weingefäß (Sta´mnos, rotfigurig) um 460 v. Chr. Im Museum von Eleusis (nach Mylonas 1961, Abb. 78). Ein eleusinischer Priester, der Dadou˜chos (‘Fackelträger’) in der Amtstracht eleusinischer Priester, dem langen bestickten Gewand mit der Kopfbinde und speziellem Haarknoten, trägt Fackeln vor einem Mysten, der ein Zweigbündel („ba´kchos“) trägt.
946
VII. Griechische und Römische Antike
Abb. 47.7: Teil des Frieses der Ara Pacis in Rom, geweiht 13 v. Chr. (nach Turcan 1988, Teil 2, Nr. 46). In der Prozession zur Altarweihung schreiten hinter dem Kaiser Augustus (links, an der Bruchstelle) bekränzt die Consuln und weitere Senatoren; vier Priester („flamines“) sind an ihrer Kopfbedeckung erkennbar, ein weiterer hat den Kopf verhüllt und trägt eine Opferaxt.
Abb. 47.8: Altar aus Rom, geweiht 2 v. Chr. Florenz, Uffizien (nach Turcan 1988, Teil 2, Nr. 20). Im Zentrum der Augur mit verhülltem Kopf, in der Rechten den Krummstab („lituus“) als Zeichen seines Amts, zu Füßen ein pickendes Huhn (Vorzeichen); links ein weiterer Mann mit verhülltem Kopf, rechts eine Frau, die aus einer Schale eine Spende ausgießt.
Einige orientalische Priestertümer verlangten eine weit stärkere Hingabe der gesamten Existenz an den Dienst der Gottheit; das drückte sich auch in weit auffälligeren Zeichen aus: Kastration, Barfüßigkeit und bunte Gewänder im Kult der Magna Mater, geschorener Kopf und weißes Leinengewand im Isis-Kult. Ähnliche Zeichen wurden in manchen Mysterien- und ekstatischen Kulten wenigstens während der Dauer des Ritus von allen Kultteilnehmern verlangt: Barfüßigkeit, altes Kleid, aufgelöstes Haar (d. h. Aufhebung sozialer Grenzen) in den eleusinischen Mysterien, Haarschur und Leinengewand bei den ägyptischen Göttern Isis und Osiris, Barfüßigkeit, aufgelöstes Haar, Tierfell und Thyrsos (Stab mit Fichtenzapfenknauf) in den Mysterien des Dionysos-Bacchus (Burkert 1990, 35⫺55). Zur Rolle des Priesters bei den Kelten vgl. Art. 36 § 6., bei außereuropäischen Kulturen vgl. Art. 91 § 4., Art. 94 § 2. und Art. 99 § 5.
3.
Das Götterbild
3.1. Allgemeines Privilegiert unter den Zeichen des sakralen Raums ist das Götterbild, im Normalfall eine
947
47. Zeichenkonzeptionen in der Religion
Abb. 47.9: Mischgefäß (Glockenkrate˘ r) aus Süditalien (Lukanien), 440⫺430 v. Chr. (nach Lexicon Iconographicum Mythologiae Classicae Bd. 5, 1990, „Hermes“ Nr. 440). Eine Herme, durch den aufgemalten Hermesstab eindeutig als Bild des Gottes Hermes bezeichnet, wird von zwei Männern verehrt. Der zuschauende Mann rechts trägt einen Kranz als Zeichen der Kultteilnahme, der Mann links überreicht dem Gott einen Zweig; ein schematischer Stierschädel neben dem Kopf der Herme markiert den sakralen Raum.
völlig anthropomorphe Statue (stehend oder sitzend), in ganz seltenen Fällen ein tiergestaltiges oder wenigstens tierköpfiges Bild oder aber ein nicht bildhaftes (anikonisch: Steinhaufen, Pfeiler) oder nur teilweise anthropomorphes Kultmal (Herme: Pfeilerschaft mit Phallos und Kopf; vgl. Abb. 47.9). Beides gilt in den Quellen als Rest eines früheren Zustands und wurde lange auch in der evolutionistisch denkenden Forschung so aufgefaßt (zu Griechenland vgl. de Visser 1900; zu Rom vgl. Taylor 1931). Grundfrage ist das Verhältnis des Bildes zur Gottheit; die Spannweite reicht von der völligen Identität (Homer, Ilias 6, 303) über die Vorstellung, daß das Bild von der Gottheit bewohnt wird (gr. he´dos, ‘Wohnsitz’; Graf 1985, 83) bis zur Ansicht, es sei bloßes Zeichen (lat. signum als häufiges Wort für das Kultbild, neben ebenso häufigem simulacrum, ‘Ebenbild’; wohingegen von den gr. Termini für ‘Zeichen’ se˜ma nie, se¯meı˜on nur ausnahmsweise die Kultstatue bezeichnet) für
das Göttliche, woran sich dann die Diskussion um die Adäquatheit dieses Zeichens schließt (siehe unten § 3.2.; vgl. Abb. 47.2, vgl. auch Art. 72). Neben dem Kultbild stehen andere Medien als Vermittler eines visuellen Gottesbildes (Gladigow 1985⫺86, 119⫺121): Weihreliefs (vgl. Abb. 47.10), Gemälde und Vasenbilder, nicht zuletzt auch Münzen. Dabei stellen diese Medien aber nur zum Teil autonom anthropomorphe Götter dar, in vielen Fällen greifen sie dagegen auf das durch die Kultstatue geprägte Bild zurück (zu Vasen vgl. Alroth 1992; zu Münzen vgl. Lacroix 1949). Im Falle der Münzen ist die hauptsächliche Konnotation auch keine strikt religiöse; es geht um die Selbstdarstellung der Polis nach außen durch das Bild der Hauptgottheiten oder ihrer ⫺ oftmals und besonders in der Kaiserzeit sehr berühmten ⫺ Kultstatue (zur Entwicklung der Münzen in Byzanz vgl. Art. 60 § 3.).
948
VII. Griechische und Römische Antike
Abb. 47.10: Terrakottaplatte (sogenanntes Campana-Relief). Rom, 1. Jahrhundert v. Chr. (nach Turcan 1988, Teil 1, Nr. 72). Büste der Göttin Demeter (Ceres) mit ihren Attributen in den erhobenen Händen: Ähren, Mohnkapseln und Schlangen. Mohn und Schlangen verweisen auf die Mysterien der Göttin, die Ähren auf den Getreidebau als den Bereich ihrer besonderen Zuständigkeit.
3.2. Das Kultbild im Ritual Im Ritual ist das Kultbild Objekt einer Reihe von Riten nach dem Modell der soziomorphen Interaktion (Gladigow 1985⫺86, 114⫺ 118). Im Opfer und im Ritual der Götterbewirtung (griech. theoxenı´a, lat. lectisternia) wird das Bild gefüttert (zu Griechenland vgl. Graf 1985, 40 f; zu Rom vgl. Scheid 1990, 475⫺676), in Ausnahmeriten wird es gewaschen, neu eingekleidet und geschmückt (Graf 1985, 19); es wird bekränzt (Blech 1982, 269⫺272) und parfümiert (Scheid 1990, 624 f), erhält Räucherungen und Weihgeschenke (Weinreich 1909, 137 f); einzelne Verehrer begrüßen es, küssen es, flüstern ihm ihre Wünsche ins Ohr (Kassel 1983). Diese soziale Interaktion mit dem Bild behandelt es als vollgültiges Äquivalent der Gottheit. Gewöhnlich ist das Kultbild im Tempelinnern aufgestellt, wenigstens seit spätarchaischer Zeit (frühere Aufstellung im Freien im tempellosen heiligen Bezirk ist erschlossen; Graf 1985, 46). Das Erscheinen besonderer, altertümlicher Kultbilder im Freien wird zum Signal des Ausnahmefests; kulturinterne Deutung kann von Wahnsinn und Verheerung re-
den, die das Sichtbarwerden solcher Bilder bewirkt. Strukturell analog ist die ausnahmsweise rituelle Losbindung von gewöhnlich an das Heiligtum gefesselten Bildern (Graf 1985, 83⫺96). Wenigstens in solchen Riten wird das Bild zum Zeichen, dessen Konnotation von Aufhebung sozialer Normalität die Denotation (bestimmte Gottheit) in den Hintergrund drängt. Freilich handelt es sich fast immer um Bilder von Göttern, in deren Mythologie blutige Gewalt (Artemis, Dionysos, Kronos) oder umgekehrt das schrankenlose Glück außerhalb der jetzigen Ordnung (Kronos/Saturnus und das goldene Zeitalter) wichtig sind. ⫺ Zur Verwendung von Statuen im magischen und apotropäischen Ritual (zur Beeinflussung anderer Menschen und zur Abwehr negativer Beeinflussung) siehe unten § 4.3. 3.3. Bilderkritik Seit einzelne vorsokratische Philosophen ein von der Polisreligion und ihrer Mythologie emanzipiertes Gottesbild entwickelten und daraus eine radikale Kritik an den anthropomorphen Kultbildern ableiteten, diskutierte
949
47. Zeichenkonzeptionen in der Religion
die griechisch-römische Philosophie, inwieweit das Kultbild die Gottheit überhaupt adäquat abbilde (Geffcken 1916⫺19). Dabei hakt die Kritik zum einen an der anthropomorphen Form ein (Xenophanes von Elea, etwa 570⫺460 v. Chr.), zum anderen an dem Umstand, daß ein von Menschenhand Gemachtes im Ritual als identisch mit der Gottheit behandelt werde (Heraklit von Ephesos, um 500 v. Chr.). Der zweite Vorwurf berührte nur den Kult, der sich der philosophischen Kritik gegenüber als resistent erwies; nur bei einigen besonders altertümlichen und ehrwürdigen Bildern (Palladion; Bild der taurischen Artemis; Statuette der Magna Mater in Rom) spricht der aitiologische Mythos davon, daß das Bild vom Himmel gefallen sei ⫺ wobei diese Mythen nicht zwingend als Reaktion auf die philosophische Kritik zu verstehen sind. Die Philosophie ihrerseits gab sich mit der Vorstellung einer wie immer gearteten Identität von Bild und Gottheit schon gar nicht ab, konzentrierte sich vielmehr auf die Frage, ob ein Bild eine Gottheit überhaupt abzubilden vermöge. Dabei geht es lange nicht um die radikale Frage, ob überhaupt die Gottheit im Bild faßbar sei, sondern um das Problem der anthropomorphen Form. Neben der völligen Verwerfung des Bildes (Sokratiker, Stoa) und der Theorie, daß ein ursprünglich guter bilderloser Kult sekundär durch Bilder korrumpiert wurde (Varro frg. 18 und 38, Cardauns 1976, 22, 31, 146⫺148) stehen verschiedene Versuche, anthropomorphe Bilder zu rechtfertigen: (1) Die Menschengestalt und die damit einhergehende anthropomorphe Motivierung göttlichen Handelns habe moralische Gründe: die Masse der nicht philosophisch Gebildeten reagiere mit Angst oder Verehrung, fühle sich in jedem Fall im Handeln durch die Götter beaufsichtigt (Cicero, De natura deorum 1,77). (2) Die menschliche Gestalt als die Gestalt, in der sich der göttlichen Logos für eine Weile ausprägt, komme der Gottheit am nächsten (Poseidonios). (3) Das Bild sei eine korrekte Annäherung an die Gottheit, weil der bildende Künstler wie der Dichter in ekstatischer Inspiration ein Wissen um das Wesen der Gottheit besitze (Dio von Prusa, Oratio 12,44). (4) Mit der neuplatonischen Spekulation taucht dann das Problem der materiellen Bilder für immaterielle Götter wieder auf, während dasjenige der anthropomorphen Gestalt etwas zurücktritt. Plotin (etwa 205⫺270
n. Chr.) versteht die Bilder als Spiegel des Göttlichen (4, 3, 11), Porphyrios (2. Hälfte des 3. Jahrhunderts n. Chr.) als Symbole des Göttlichen in materieller Form, so wie die Buchstaben materielle Symbole für die Sprache sind (Porphyrios, De statuis, Bidez 1913: *1). Daneben steht die Überzeugung, daß die Götterbilder durch rituelle Akte von kultischer oder theurgischer (magischer, jedoch durch philosophische Absichten gereinigter) Weihung belebter Sitz wenigstens bestimmter Gottheiten geworden sind, wie dies der hermetische Traktat Asclepius (3. Jahrhundert n. Chr.) deutlich macht, der in gut neuplatonischer Art von einer Trennung in immaterielle und materielle Götter ausgeht (Ps.-Apuleius, Asclepius 24). Zur Frage der Abbildbarkeit Gottes im Christentum vgl. Art. 60 § 4.7., im Judentum vgl. Art. 61 § 2. und im Islam vgl. Art. 90 § 10.
4.
Ritual als Zeichen
Rituale kann man verstehen als Zeichenprozesse, deren Botschaft der Sender sich weitgehend selber vermittelt (Podeman Sœrensen 1993). 4.1. Das Opfer Das zentrale Ritual der griechisch-römischen Religion ist das Tieropfer; das Opfer ist ein Komplex von einzelnen Riten, welche die Tötung eines Opfertieres umgeben und vom prozessionshaften Zug (vgl. Abb. 47.1) der opfernden Gruppe an den Altar bis zum gemeinsamen Verzehr des Opferfleisches gehen (zu Griechenland vgl. Burkert 1972; zu Rom vgl. Latte 1960, 379⫺392; siehe auch Reverdin und Grange 1981). Einzelne Riten in diesem Komplex sind auch in anderen Kontexten verwendet, wie der den Tötungsakt begleitende rituelle Klageschrei (gr. ololyge˘ ) der Frauen, das Gußopfer (Libation, gr. sponde˘ ; Burkert 1977, 121⫺125) und das gemeinsame Mahl. Teile des geopferten Tieres werden oft zur Markierung des sakralen Raums und zur Erinnerung an das einzelne Opfer verwendet: aus Asche (Olympia), Blut oder Gehörn (Delos) wächst ein spezifischer „Altar“ als permanente Bezeichnung der Opferstelle heran; der Gesichtsschädel von Rindern mitsamt den Hörnern wird im Heiligtum aufgehängt; insbesondere in Rom wird dann die künstlerische Darstellung des bekränzten Rinderschä-
950
Abb. 47.11: Grabcippus aus der Stadt Rom, 41⫺50 n. Chr. Paris, Louvre (nach Turcan 1988, Teil 2, Nr. 11). Zwei Lorbeerzweige, Girlanden und ein Stierschädel zeigen den sakralen Raum an, in dem ein Opfertisch mit rituellem Gerät (Opfermesser, Spendeschale, Krug) steht.
dels zum permanenten Zeichen für das Sakrale schlechthin (vgl. Abb. 47.11). Die Bestandteile des Opfers haben Konnotationen, die sowohl auf Charakter und Funktion der involvierten Gottheiten als auf die Funktion des Rituals im Gruppenganzen weisen (vgl. Abb. 47.1 und 47.2). Eine wichtige Rolle spielen binäre Differenzierungen etwa bei den Teilnehmern (Freie/Sklaven, Männer/Frauen), den Opfertieren (männlich/ weiblich, weiß/schwarz, wobei in Rom ausnahmsweise auch andere Farben wie rot wichtig sein können, siehe unten), bei den Libationen (weinlos/weinhaltig; Graf 1980), bei der Verwendung des Opferfleisches (vollständiger Verzehr im Heiligtum versus Möglichkeit, das Fleisch mitzunehmen) oder bei dem zur Verbrennung verwendeten Holz (Fruchtbäume/Bäume, die aus dem kategorialen Netz fallen: arbor felix vs. arbor infelix); sie trennen Normalopfer von Ausnahmeriten. Weitere Differenzierungen betreffen Art, Kombination und Einzelheiten der geopferten Tiere: neben den gewöhnlichen Schaf und Rind im
VII. Griechische und Römische Antike
staatlichen Opfer von Griechenland und Rom (wo daneben in einer Reihe von Opfern die Reihe Schwein-Schaf-Rind, suovetaurilia, sich findet) gehören spezifische Tiere zu spezifischen Gottheiten (Schwein besonders zu Demeter, Widder zu Kore, Ziegenbock zu Dionysos und Bacchus; umgekehrt ist die Ziege im Kult von Asklepios oder Minerva ausgeschlossen). Nicht eßbare Tiere finden sich bei besonderen Gottheiten und in speziellen Opfertypen (Hundeopfer griech. für Hekate, röm. für Robigo; Vogelopfer; seltenes Opfer von nicht domestizierten Tieren). Gelegentlich sind trächtige Tiere oder Tiere besonderer Farbe vorgeschrieben: wenigstens ein Teil der Konnotation solcher Opfertiere beruht auf dem Gegensatz zum Normalopfer. Andere Differenzierungen werden durch Weglassen einzelner Bestandteile (etwa Verzicht auf Bekränzung, auf Flötenmusik, auf Weinlibation) erreicht; auch hier erwachsen die Konnotationen aus dem Gegensatz zum Normalopfer. In derselben Opposition können auch Opferinstrumente oder Einzelheiten der Bekleidung Zeichencharakter gewinnen. In der römischen Eidzeremonie beim zwischenstaatlichen Vertrag wird das Opfertier nicht mit der Opferaxt oder einem Stahlmesser getötet, sondern mit einem Silexmesser (siehe unten); in einem marginalen griechischen Ritual dient eine Sichel zur Tötung (Hermio´ne¯: Pausanias 2,35,5). Im Bereich der Opferriten wird in Rom das gewöhnliche Opfer unterschieden von einem solchen, das „ritu Graeco“ vollzogen wird: zentraler Ausdruck dafür ist der barhäuptige Vollzug („capite aperto“, während das traditionelle römische Opfer vom Opferherrn mit über den Hinterkopf gezogener Toga („capite velato“) vollzogen wird. Nicht alle Gottheiten, denen ritu Graeco geopfert wird, sind griechisch: wichtiger als die diachronische Herkunft ist die synchronische Opposition zum Opfer „capite velato“. Das griechische Normalopfer wird als Ehrengabe an die Gottheit verstanden; deswegen bringt die Reflexion schon sehr früh die Kritik vor, daß auf dem Altar der Gottheit gerade die nicht eßbaren Teile (Fett, Knochen, Haut) verbrannt werden (Mythos vom Opferbetrug des Prometheus: Hesiod, Theogonie 535⫺561). Auf das römische Opfer, das als Bewirtung der Gottheit verstanden wird und wo auch eßbare Teile verbrannt werden, erstreckt sich diese Kritik nicht.
47. Zeichenkonzeptionen in der Religion
951 trieben und ganz verbrannt werden. Als Empfängerin solcher Opfer, mit denen sich auch der Mythos vom Menschenopfer als indigenes Deutungselement verbindet, gilt oft Artemis (Graf 1985, 411⫺417). In Opposition zum Tieropfer steht weiterhin die bloße Libation oder die unblutige Gabe von Früchten, Kuchen und dgl.
Abb. 47.12: Eleusis: der wachsende Grundriß des Mysterienheiligtums (Mylonas 1961, Abb. 78). Typisch für diesen Mysterienkult und sein nur einer beschränkten Zahl offenes Ritual im Weihehaus ist einerseits die fast quadratische Pfeilerhalle mit umlaufender Schautreppe, andererseits das unverrückbare Allerheiligste („Ana´ktoron“), auf das Kult und Architektur sich ausrichten.
Schließlich sind einzelne Opfertypen zu unterscheiden. Neben dem griechisch-römischen Normalopfer auf dem Altar, das einer olympischen Gottheit gilt, das den Bürgern der Polis und ihren Frauen (oder den Mitgliedern eines Haushalts) offensteht und das mit dem gemeinsamen Bankett endet, aber erlaubt, Fleisch mitzunehmen (Grundlage der antiken Fleischversorgung; Plinius, Epistulae 10,96,10), gibt es noch andere Typen. In Griechenland steht dem olympischen Opfer an die Götter oben das chthonische (an Heroen und Götter der Erde und Erdtiefe) gegenüber, bei dem das (meist schwarze) Tier in einer Grube oder auf einem flachen Altar ganz verbrannt wurde. Solche völlige Zerstörung erfahren auch Tiere (meist Ferkel), die in Reinigungsriten verwendet werden. Nicht in dieses binäre Schema passen eine Reihe von Riten, in denen verschiedenartige, auch undomestizierte Tiere in ein riesiges Feuer ge-
4.2. Gestik Zu den rituellen Zeichen gehören auch die Zeichen der Körpersprache, die Gestik (Sittl 1890). Hand- und Fingerbewegungen sind wichtig, wenn auch ungenügend erforscht: der christliche Polemiker jedenfalls charakterisiert die pagane Religion damit, daß „ihre Riten völlig in Hand und Finger“ liegen (Lactantius, Institutiones divinae 4,3,9). Die meisten Gesten kommen nicht nur in der Götterverehrung vor; gut belegt sind nur die auffälligsten mimetischen Gesten, kaum dokumentiert konventionelle Fingerzeichen. (a) Im Gebet dominieren Gesten der Selbstauslieferung und -erniedrigung: die Arme werden ausgebreitet und erhoben, mit gegen die Gottheit geöffneten Handflächen; man kniet, in Griechenland (Van Straten 1974) seltener als in Rom, und wirft sich völlig auf den Boden; wie man als Schutzflehender die Knie eines mächtigen Menschen umfaßt, so auch diejenigen einer Statue (Gould 1973). ⫺ Umgekehrt hockt man sich bei der Anrufung der Unterirdischen auf die Erde und schlägt den Boden. (b) Ausdruck von intimer Vertrautheit und sorgender Zuneigung ist der Kuß. Beim Gebet küßt man die Füße der Statue (Rom); körperlich unerreichbaren Gottheiten (Helios, Selene, Gestirnen) ebenso wie sakralen Gegenständen, an denen man in Distanz vorbeigeht, wirft man eine Kußhand zu. (c) Das Gelübde ist eine Selbstverpflichtung zu einer Gabe an die Gottheit. Beim Ablegen berührt man die Brust, bezieht sich derart selbst ein, oder man hebt die offene Hand, wie wenn sie etwas hielte; weiht man die geschuldete Gabe, so hält man sie in die Höhe und zeigt sie der Gottheit („suscipere vota“; vgl. Abb. 47.9). Zu den religiösen Gesten im Christentum vgl. Art. 58 § 2. 4.3. Andere Riten In Prozessionen werden Objekte mitgetragen, die teils auf das Ziel der Prozession weisen, teils diese selber charakterisieren. In der Opferprozession werden die Opferinstru-
952 mente mitgetragen, auf der panathenäischen Prozession in Athen der Mantel der Athena, den die Stadt der Göttin verehrt. Phallosprozessionen in Griechenland (athenische Dionysia) und Italien ziehen mit einem überdimensionalen Bild des männlichen Glieds durch die Straßen: die damit denotierte Sexualität konnotiert den Einbruch ungezügelter, antizivilisatorischer Kräfte. Lichtprozessionen, Fackelumzüge und -läufe beuten die Konnotation von Rettung und Neuanfang aus, die der antiken Lichtsymbolik (vgl. Art. 50 § 3., Art. 58 § 5., sowie Art. 60 § 4.4.2. und § 4.6.) inhärent ist. Die mitgeführten Gegenstände reichen vom komplexen Artefakt (Opfergerät, Mantel, Phallos) bis zum Naturobjekt. Es können einfache Zweige („thallophorı´a“, „dryophorı´a“) sein, aber auch ganze Bäume („dendrophorı´a“); im Kult der Magna Mater in Rom wird die so eingebrachte Pinie im Heiligtum aufgestellt und geschmückt. Die eleusinischen Mysten tragen auf dem Weg nach Eleusis Zweigbündel („ba´kchoi“) mit sich (vgl. Abb. 47.1 und 47.6). Stärker bearbeitet ist die „eiresio˘ ne¯“ (ein Öl- oder Lorbeerzweig, an dem Wollbinden, Erstlingsfrüchte und Töpfchen mit Wein, Honig und Öl hingen): offenkundig Zeichen des elementaren Reichtums. Stilisiertes Abbild der wilden Natur hingegen ist der Thyrsos der Dionysosmysten, ein efeuumwundener Stab mit einem Pinienzapfen als Spitze. Eine argivische Hera-Prozession trägt einen Schild mit sich, so wie die römischen Salii mit ihren zwölf urtümlichen Schilden (den „ancilia“), von denen eines vom Himmel gefallen, die übrigen ununterscheidbare Kopien seien, im Waffentanz durch Rom ziehen. Zu Parallelen im nicht-islamischen Afrika vgl. Art. 91 § 4.1. Besonders hervorzuheben sind Riten, in denen das rituelle Handeln in der Meinung der Akteure zukünftiges Geschehen abbildet. Es sind dies besonders Eidzeremonien: beim Eid, einer Selbstverfluchung, wird die Vernichtung eines Lebewesens oder eines Gegenstandes durch das verbale Ritual zum Vorbild für die Selbstvernichtung im Fall des Eidbruchs. So ersticht beim römischen zwischenstaatlichen Vertrag (foedus ferire, ‘ein Bündnis schlagen’) der Eidpriester in Gegenwart der Parteien das Opferferkel mit dem Silexmesser und wirft dieses dann von sich: wie das Ferkel totgeschlagen wurde („ut ego hunc porcum hic hodie feriam“; Livius 1,24,8), so solle beim eigenen Eidbruch das Volk totgeschlagen werden, und wie das Mes-
VII. Griechische und Römische Antike
ser weggeworfen wurde, so solle der Priester aus seinen Gütern verworfen werden („me Diespiter […] bonis eiciat“; Festus 102 L). In anderen Riten ist die Aktion gleichzeitig symbolischer Vollzug. In einem Reinigungsritual von Kyrene, bei dem ein unbekannter Totengeist ausgetrieben werden soll, ruft man ihn an („Mensch, wer du auch immer seist, Mann oder Frau“), formt eine männliche und eine weibliche Ton- oder Holzfigur, läßt sie an einem Mahl teilnehmen und setzt sie dann draußen in der Wildnis aus. Was an ihnen getan wird, wird gleichzeitig am unbekannten Geist getan, er wird in der Mahlzeit versöhnt und dann außerhalb der Grenzen ausgesetzt (Sokolowski 1962 Nr. 115 B 29⫺39). Ähnlich wird man die Verwendung der Zwiebel in kathartischen Riten zu beurteilen haben (Burkert 1977, 131). Noch prägnanter ist dieser Vollzug beim magischen Umgang mit Puppen, die mit Nägeln durchstochen und in Gräbern niedergelegt werden (Faraone 1988). Wie die Texte der Zauberpapyri zeigen, ist dieses Durchstechen nicht wahllos, sondern trifft jene Glieder, auf die der Magier Einfluß nehmen will; umgekehrt trete die Heilung dann ein, wenn die Statuette aufgefunden und die Nägel entfernt sind (Audollent 1904: CXXII f). Zu Parallelen in anderen Kulturen vgl. Art. 91 § 4.3. und Art. 99 § 8.
5.
Das Wort als verbales Ritual
Teil eines jeden Rituals sind verbale Äußerungen; unter den Zeichen ist das sprachliche durch seine Präzision privilegiert. 5.1. Götternamen Neben dem visuellen Zeichen der Gottheit, der Götterstatue, steht das sprachliche, der Göttername. Im Ritual erscheint der Göttername appellativ zur Anrufung der Gottheit. Es ist dies die primäre Funktion des Götternamens, und Besonderheiten in der Flexion des Vokativs erklären sich aus der Häufigkeit und Bedeutung der Anrufung. Eine Eigenheit der Eigennamen ist in den meisten Sprachen die arbiträre Beziehung zwischen Namen und Namensträger; das gilt auch für griechische und römische Götternamen und auch dann, wenn Name oder Beiname der Gottheit sprechend sind. Nur wenige Namen der großen Götter sind sicher etymologisierbar ⫺ etwa griech. Zeu´s, lat. Iup-piter vom idg. Stamm diw-, ‘heller Taghimmel’; griech. Hestı´a, lat. Vesta
47. Zeichenkonzeptionen in der Religion
vom idg. Ausdruck für ‘Herd, Herdfeuer’, griech. Apo´llo¯n von a´pella, dem dorischen Terminus für die ‘Volksversammlung’, lat. Venus, Personifikation des neutralen Appellativums *venus, *veneris, ‘Schönheit, Liebreiz’. In anderen Namen scheinen verständliche Bestandteile auf: ‘Mutter’ in De-meter, ‘Vater’ in Dies-piter, ‘Gatte’ (po´sis) vielleicht in Posei-do¯n. In Griechenland wie in Rom läßt sich dabei eine Tendenz zur Verunklärung etymologisch durchsichtiger Götternamen fassen: (1) im Griechischen wird etwa regelrechtes Ape´llo¯n zu Apo´llo¯n, Eleu´thyia zu Eileı´thyia verdunkelt (Burkert 1977, 283). (2) In Rom ist der Name der Venus vom Nomen *venus abgeleitet ⫺ doch sind zwar seine Ableitungen venus-tus und venus-tas lebendig, das Nomen selber wird in der belegten Sprache nicht mehr verwendet (Radke 1965, 311), und die Etymologien der römischen Gelehrten für den Götternamen variieren, ohne jedoch auf *venus oder auch nur venustus zu rekurrieren. Es wird also Sorge dafür getragen, daß der Name eines großen Gottes nicht zugleich Appellativum ist, auch wenn die Ableitungen ihn sprachlich durchsichtig bleiben lassen würden. Denotat des sprachlichen Zeichens soll eine vollständig personenhaft gefaßte individuelle Gottheit sein, nichtanthropomorphe Konnotationen sind verpönt. Eine Sonderstellung nehmen die Zaubernamen ein. Von außen gesehen, sind es unverständliche, öfters kaum aussprechbare Lautungetüme, bei denen teilweise Lautspielereien wichtig sind, hinter denen aber auch tatsächliche ägyptische oder semitische Götternamen und Beinamen erkennbar sind. Für den Magier selber sind es „barbarische Namen“ („ono´mata barbarika´“) in einer der Ursprachen (vor allem Ägyptisch), welche der Sprache der Götter am nächsten sind. Im kaiserzeitlichen, insbesondere neuplatonischen Denken ist der Göttername als sprachliches Zeichen, das willkürlich gesetzt auf einen bestimmten Gott verweist, verschieden problematisiert worden, teilweise entsprechend der Problematisierung des Kultbilds (s. o. § 3.3.). (1) In theologischer Spekulation wird der Name als Ausdruck des göttlichen Seins aufgefaßt, er ist also nicht arbiträr gesetzt. Es folgt, daß die in antiken Kulturen übliche Übersetzung von Götternamen (Zeu´s ⫽ Iuppiter) abgelehnt wird, weil eine bestimmte einzelsprachliche Namensform die wahre ist ⫺ für den Heiden Iamblichos (etwa 250⫺325
953 n. Chr.) die in ägyptischer Sprache (De mysteriis 7,5), für den Christen Origenes (etwa 185⫺254 n. Chr.) die in hebräischer (Contra Celsum 1,25). (2) Verstärkt wird dies durch eine performative Auffassung des Namensgebrauchs, wie sie Origenes kennt: für ihn evoziert jede Namensnennung die entsprechende Gottheit, unabhängig von der Intention des Redenden (das betrifft auch pagane Götter). Der Name ist nicht mehr Verweis, sondern immer sich erfüllende Herbeirufung. Da dabei der mächtige christliche Gott immer in der dem Griechen Origenes fremden und bedeutungslosen hebräischen Namensform genannt werden mußte, lag in letzter Konsequenz die Kraft des Namens in der Lautgebung, nicht in einer möglichen (und übersetzbaren) Bedeutung (Origines, Contra Celsum 5,45; vgl. Janowitz 1991, 360⫺364). Man kann dies als Radikalisierung der oben aufgezeigten Tendenz zur etymologischen Verdunkelung des Götternamens ansehen. (3) Ein Göttername kann derart bedeutsam sein, daß ihn die Götter nur ganz wenigen Menschen offenbarten; dann dient die Kenntnis des geheimen Namens auch als Beweis besonderen Wissens und einer besonders engen Beziehung zum Göttlichen. Paulus erläutert den Athenern ihren Altar „Agno˘ sto¯i Theo˘ i“: ihre eigentliche Intention sei gewesen, auch dem versehentlich nicht genannten, weil nicht gekannten Gott einen Kult zu widmen ⫺ so, wie das Gebet auch den nicht genannten, weil nicht gekannten Namen oder Beinamen mitberücksichtigt. Die paulinische Predigt macht daraus einen Macht- und Wissenserweis des christlichen Missionars (Apostelgeschichte 17,22⫺31): den Gott, den die Athener nicht kennen, weiß der Prediger Paulus zwar nicht zu benennen, aber doch in seiner Rolle und Funktion zu beschreiben. ⫺ Kenntnis des Namens erst bedeutet die Möglichkeit des Anrufs, damit aber auch der menschlichen Verfügbarkeit. Kennt man einen Götternamen, so kann man die Gottheit aus ihrer Stadt evozieren und die Stadt schutzlos machen. Die Römer hielten den Namen ihrer Schutzgottheit geheim, um ein solches Schicksal zu vermeiden. ⫺ Der Magier kennt die geheimen, nur der Gottheit und ihren Vertrauten bekannten Zaubernamen und bedient sich ihrer, um durch seine Vertrautheit mit den großen Göttern die Dämonen einzuschüchtern oder sie in seinen Dienst zu rufen.
954
VII. Griechische und Römische Antike
Zum Umgang mit dem Namen der Gottheit im Judentum vgl. Art. 61 § 3. und im Islam vgl. Art. 90 § 8.
Willen offenbaren, besonders was die Zukunft betrifft (vgl. umfassend Bouche´-Leclerq 1879⫺82).
5.2. Gebete und Kultrufe Zentrales verbales Ritual ist das Gebet (Versnel 1981, 1⫺64). Das Ziel der Anrufung ist es, die Aufmerksamkeit der Gottheit auf das eigene Anliegen zu lenken ⫺ das teilt der Göttername mit der appellativen (vokativen) Funktion von Eigennamen überhaupt. Anders als in der normalen Gesprächssituation hat dieser Anruf performativen Charakter: der Anrufung leistet die Gottheit unmittelbar Folge. Das gilt auch, wenn sie von einem entfernten Ort hergerufen werden muß, was die natürliche Konsequenz davon ist, daß in einem überlokalen polytheistischen System dieselbe Gottheit über eine Vielzahl lokaler Heiligtümer verfügt und ihre Anwesenheit in Tempel und Kultbild nicht unmittelbar gegeben ist. Die Gottheit muß dabei so präzis wie möglich genannt werden, um zu vermeiden, daß sie sich nicht wirklich angesprochen fühlt. Also genügt nicht einfach der eine Name, es gehören auch die einschlägigen Epiklesen hinzu (was seit dem Hellenismus zu langen Epiklesenketten führt) sowie die allfälligen geheimen Namen (magische Rituale, „evocatio“). Daraus kann die Aufforderung an den Gott werden, selber den ihm gefälligsten Namen zu wählen, die im griechischen wie im römischen Gebet reich belegt ist. Neben dem artikulierten Gebet gibt es artikulierte oder unartikulierte Kultrufe. Mysterienrituale kennen stereotype Sätze, die von Priestern oder Zelebranten an Schlüsselpunkten des Rituals gerufen werden müssen (zusammengestellt in Dieterich 1923, 213⫺218). Andere, oft ekstatische Riten sind durch einzelne Rufe gekennzeichnet: das Jauchzen in der eleusinischen Prozession, den Ruf „euoı˜ saboı˜“ im ekstatischen Sabzioskult, „hymen o¯ hymenaie“ im Hochzeitslied, „io triumpe“ im Triumph (Versnel 1970, 11⫺55). Daraus können sich schließlich Götter emanzipieren: Iakchos, Paredros der Demeter in Eleusis; Hymenaios, Sohn der Aphrodite im Hochzeitsbrauch.
6.1. Orakel, Traum Zwar offenbart sich die Gottheit im Traum und im ekstatischen Orakel (Delphi) direkt; das bedeutet aber, selbst wenn der Gott sich in verbaler Form äußert, nicht, daß keine Deutung nötig ist: „der Herr, dem das Orakel in Delphi gehört, sagt nichts und verbirgt nichts, sondern er gibt ein Zeichen [se¯maı´nei]“ (Heraklit frag. 93). Vor allem die individuelle Traumdeutung entwickelt sich zur spezialisierten Wissenschaft (ausführlich Artemidoros von Daldis, Onirocritica, 2. Hälfte des 2. Jahrhunderts n. Chr.). Bei nichtverbalen Orakeln (Würfel, Los und dgl.) ist die professionelle Deutung fast unentbehrlich.
6.
Divination
Für sich stehen die Zeichen von den Göttern her, mit denen diese den Menschen ⫺ Gesamtstaaten ebenso wie Individuen ⫺ ihren
6.2. Zeichen Daneben steht eine ganze Reihe anderer Zeichen. Antike Theorie unterscheidet Zeichen, die man selber sucht (insbesondere in der griechisch-römischen Opferschau und dem römischen „augurium“) von solchen, die sich einem ohne eigenes Zutun anbieten (gr. te´ras, lat. ostentum ‘Vorgezeigtes’, prodigium ‘Vorzeichen’). Privilegiert ist der Blitz, daneben stehen alle möglichen Vorkommnisse, die aus dem Rahmen alltäglicher Erfahrung und dem kategorialen Netz der Wahrnehmung fallen. Bei jedem Opfertier werden die Innereien, insbesondere die Leber auf ihre Beschaffenheit untersucht, denn durch sie drücken die Götter Zustimmung oder Ablehnung des Opfers aus; im Fall der Ablehnung wird das Opfer bis zur Zustimmung wiederholt. Das Lesen der entsprechenden Zeichen ist Sache des Spezialisten. Entsprechend gehört zum staatlichen Opferpersonal der griechische „ma´ntis“ bzw. der römische (ursprünglich etruskische) „haruspex“, der auch aus der Beobachtung der Art, wie das Tier getötet wird, wie das Feuer brennt und wie die der Gottheit gegebenen Teile verbrannt werden, geeignete Schlüsse ziehen kann. Vor jeder wichtigen Unternehmung holt der römische Magistrat zudem durch einen Augur das „augurium“, in der Regel ein Vogelzeichen, ein: in einem ausgezeichneten Bezirk, dem „templum“, wird der Vogelflug beobachtet; hinter der zufälligen Erscheinung bestimmter Vögel wird eine ordnende Hand gesehen (vgl. Abb. 47.8). Außerdem hält man nach Wunderzeichen Ausschau, besonders häufig in Krisen- und
47. Zeichenkonzeptionen in der Religion
Entscheidungssituationen, wo man auch die Hilfe des Orakels einholt. Im Griechischen ist es häufig ein Blitz oder Donner aus heiterem Himmel, durch den „Zeu`s Phante˘ r“ (‘Anzeiger’) oder „Zeu`s Se¯mantiko´s“ (‘Zeichengeber’) Warnung, Zustimmung oder Ablehnung anzeigt. Hinzu kommen andere Dinge: als Odysseus am Morgen vor dem Freiermord zu Zeus betet, bittet er um ein Lautzeichen („phe˘ me¯“) im Haus und ein anderes Zeichen („te´ras“) draußen. Zeus donnert in der Ferne, und eine Sklavin an der Mühle, die den Donner hört, erstaunt und betet zu Zeus um die Rückkehr des Odysseus; der aber freut sich über diese Äußerung („kle¯do˘ n“; Homer, Odyssee 20,95⫺121; vgl. Art. 39). Danach heißt Zeus „Phe˘ mios“ oder „Panomphaı˜os“ (‘Herr aller Laute’); es gibt auch einen „Hermee¯˜ s Kle¯do´nios“. Rein zufällige Ereignisse hingegen (etwa wenn Mäuse einen Mehlsack aufnagen) hält bloß der allzu Abergläubische (der „deisidaı´mo¯n“) für bedeutsam und sucht den Rat des Experten (Theophrast, Charakter 16). Im Alltag muß man mithin auswählen, was wirklich Zeichencharakter hat. Das gilt auch in Rom. Auch hier ist nicht von vornherein in jedem Fall festgelegt, was als Zeichen zu gelten hat; nur ist der Umfang dessen, was nicht beachtet wird, viel kleiner. Besonders in Krisenzeiten achtet man auf alle auffallenden Erscheinungen, nicht nur auf spektakuläre Erscheinungen wie Blitzeinschläge, Finsternisse, Kometen, Erdbeben und alle möglichen Mißgeburten, sondern bereits irreguläre Verfärbungen der Sonne, seltsame Wolkenformen, ungewöhnliches Verhalten von Tieren und Menschen. Um diese Zeichen identifizieren und deuten zu können und um Ratschläge zu erhalten, welche rituellen Maßnahmen den sich äußernden Zorn der Götter beruhigen würden, sucht man wieder den etruskisch-römischen Spezialisten („haruspex“) auf, dessen Tradition eine sehr komplexe Interpretationsmethode bereithielt (Thulin 1905⫺1909).
7.
Der Aufstieg des Christentums
7.1. Die historische Entwicklung Die Auseinandersetzung des römischen Staates mit dem aufsteigenden Christentum setzt nach christlichen Zeugnissen (Apostelgeschichte) schon vor der Mitte des 1. Jahrhunderts n. Chr. ein. Seit den mit dem Brand von Rom im Jahre 64 n. Chr. ausgelösten Verfolgungen sind die Christen in paganen Quellen
955 faßbar. Im 2. Jahrhundert entsteht erst in griechischer, dann in lateinischer Sprache ein wichtiges christliches Schrifttum. Es handelt sich um die sogenannten „Apologeten“, die das Christentum gegen pagane Polemik und Unkenntnis verteidigen, gleichzeitig aber auch das Heidentum mit Methoden der paganen Dialektik und Argumenten der philosophischen Religionskritik angreifen (vgl. Art. 58 § 5.). Aus heidnischer Sicht war die christliche Religion „superstitio“, übereifrige Religiosität, die ihr Anliegen ⫺ gegen traditionelle pagane Toleranz ⫺ unter Ausschluß aller anderen Religionsübungen verfolgte. Damit schlossen sich die Christen vom gemeinsamen Opfer und vom Kaiserkult aus, welche für die soziale und politische Identität bestimmend waren. Das brachte ihnen den Vorwurf der Illoyalität und Asozialität („Haß auf das Menschengeschlecht“) ein. Die radikale Ablehnung der offiziellen paganen Kultübung provozierte den Staat auch deswegen, weil sie den staatlichen Anspruch auf die Regelung der Kommunikation zwischen Menschen und Göttern verneinte. Die Auseinandersetzung bis zum Durchbruch unter Konstantin und zum endgültigen Sieg der christlichen Religion unter dem Eiferer Theodosius I. kann hier nicht nachgezeichnet werden (ausführlich Fox 1986, mit Bibliographie). In einem langen Prozeß von Auseinandersetzung mit paganem Denken öffneten sich die christliche Theologie und Literatur seit den Apologeten auf die pagane Welt hin, markant etwa durch die Übernahme (neu-)platonischen Philosophierens in die christliche Theologie im Lauf des 4. Jahrhunderts und die gleichzeitige Nachschöpfung paganer Literaturformen besonders für die Schule. Im religiösen Bereich ist zu unterscheiden zwischen radikaler Ablehnung von Theologie und Kult einerseits und vorsichtiger Übernahme des Mythos anderseits. Den paganen Mythos hatten die Christen zunächst als pagane Theologie radikal abgelehnt ⫺ mit Argumenten, die weitestgehend aus der paganen Mythenkritik bezogen waren. Mit der Öffnung zur paganen Literatur stellte sich die Frage des Mythos neu, hatte die pagane Literatur den Mythos doch zu ihrem Inhalt. Entsprechend wurde mit dem Mythos umgegangen: durch Anwendung des schon paganen Instrumentariums von Historisierung (Euhemerismus) und physikalischer (Stoa) oder moralischer Allegorese ließ sich der Mythos
956 in entschärfter Form rezipieren. Mythen wurden verstanden als Geschichten historischer Persönlichkeiten oder Verschlüsselungen moralischer, gar theologischer Wahrheiten (Rahner 1957). Daraus entwickelte sich eine spezifisch christliche Allegorese, welche pagane Themen gar für die christliche Ikonographie nutzbar machte und durch Vermittlung der Kirchenväter bis ins 18. Jahrhundert fruchtbar bleiben sollte (vgl. Art. 55 § 1.3. und § 2.4., Art. 58 § 3. und Art. 60 § 4.2. und § 4.3.). Radikal abgelehnt wurden hingegen alle als pagan verstandenen Kultformen, insbesondere die des blutigen Opfers. Der Kampf gegen heidnische Riten begleitete das Christentum bei seiner ganzen Expansion. Übereinstimmungen wie rituelle Waschung und Taufe oder das gemeinsame Mahl der Kultgruppe sind phänomenologisch, nicht genetisch zu erklären, und mit einem direkten Einfluß antiker Mysterienkulte auf christliches Ritual, wie ihn die (betont säkularisierende) Religionsforschung des späteren 19. Jahrhunderts postulierte, ist nicht zu rechnen (Wiens 1980). Das schließt neuplatonische oder gnostische Ritualdeutung nicht aus. Übernommen wurden lediglich die äußeren Formen der Weihreligion, die besonders die antiken Heilkulte mehr und mehr geprägt hatten; sie lagen der Heiligenverehrung zugrunde, in der teilweise bewußt pagane Heilgottheiten durch christliche Heilige ersetzt wurden. 7.2. Das Bilderproblem Symptomatisch für den geschilderten Prozeß war die christliche Auseinandersetzung mit der bildlichen Darstellung des Göttlichen (Belting 1990). Dabei drehte sich die Diskussion einerseits um die Legitimität von Darstellungen des Göttlichen überhaupt, zum andern um die Verehrung der Bilder. Im Rahmen der jüdischen Tradition (vgl. Art. 61 § 2.2.) hatte das frühe Christentum Bilder abgelehnt und sich als bilderlose Religion verstanden. Die Apologeten polemisierten gegen die heidnische Verehrung von „Göttern aus Stein, Holz und Metall“, bezogen ihre Argumente allerdings auch hier aus der paganen Bilderkritik. Unter platonisierendem Einfluß veränderte sich diese Haltung grundlegend. Erlaubt war nun nicht nur die bildliche Darstellung Christi, sondern auch die Bilderverehrung, in deren Form dann auch pagane Elemente eingehen konn-
VII. Griechische und Römische Antike
ten. Legitimiert wurde dies dadurch, daß Christus, der göttliche Logos, als Bild Gottes gesehen, d. h. Christi historische Menschengestalt als Bild gedeutet wurde, das Christus von sich entwarf, um den Menschen die Nachfolge leichter zu machen. In Extrapolation auf die Bilder kann damit auch die Herstellung von Bildern Christi gerechtfertigt werden, wie sie früh belegt ist, vor allem im Verlauf des 4. Jahrhunderts auch als Folge christlicher repräsentativer Bautätigkeit nach paganen Modellen. Kaum Rechtfertigung brauchen seit jeher nur die Bilder der Apostel und Heiligen: es sind Darstellungen genuin historisch verstandener Menschen. Mit dem Bild geht der Bilderkult einher. Er wird gegenüber jüdischer Bilderfeindlichkeit mit denselben Argumenten wie der pagane Bilderkult begründet: das Bild ist symbolischer Verweis auf die Gottheit, nicht Gott selber; die rituellen Zeichen gelten der Gottheit, nicht dem Bild. Das lateinische Christentum nach Konstantin hatte nie ernsthafte Zweifel an der Legitimität des so verstandenen Bilds und seines Kults, während im byzantinischen Osten die Bilderfrage erst nach den Stürmen der Ikonoklasten im 2. Konzil von Nicaea 787 abschließend und im selben Sinn geklärt wurde (vgl. Art. 60 § 4.7.). Von da an verfügten das östliche wie das westliche Christentum über ein rituelles Instrumentarium, das (mit Ausnahme der Divination) in seiner Fülle dem paganen ebenbürtig war, sich im Detail freilich dezidiert von ihm abhob, auch wenn Einzelformen, und vielmehr noch die theologische Deutung, deutlich antik-pagane Züge trugen.
8.
Literatur (in Auswahl)
8.1. Quellen Aufgeführt sind möglichst zweisprachige Ausgaben mit kritischem Text. Artemidoros von Daldis: Artemidori Daldiani Onirocriticon libri V, hrsg. v. R. A. Pack, Leipzig: Teubner 1963. Deutsch: A. v. D., Traumbuch, übers. v. F. S. Kraus, Basel und Stuttgart: Schwabe 1965. Asclepius, Corpus Hermeticum, hrsg. v. A. D. Nock und A.-J. Festugie`re, Bd. 2, Paris: Les Belles Lettres, 1945, 259⫺401. Cicero, Vom Wesen der Götter, hrsg. v. W. Gerlach und K. Bayer, München und Zürich: Artemis 1990. Dio von Prusa: Dionis Chrysostomi Orationes, hrsg. v. G. de Bude´, Leipzig: Teubner 1916⫺1919.
47. Zeichenkonzeptionen in der Religion Festus: Sextus Pompeius Festus, De verborum significatu, hrsg. v. W. M. Lindsay, Leipzig: Teubner 1913. Heraklit: H. Diels und W. Kranz, Die Fragmente der Vorsokratiker, Bd. 1, Zürich und Berlin: Weidmann, 5. Aufl. 1934, Kap. 22. Hesiod, Theogonie. Erga, hrsg. v. A. v. Schiernding, München und Zürich: Artemis 1991. Homer, Ilias, hrsg. v. H. Rupe´, München und Zürich: Artemis, 9. Aufl. 1989. Homer, Odyssee, hrsg. von A. Weiher, München und Zürich: Artemis, 9. Aufl. 1990. Iamblich: Jamblique, Les myste`res d’Egypte, hrsg. v. E. de Places, Paris: Les Belles Lettres 1966. Lactantius, Institutiones divinae, hrsg. v. S. Brandt und G. Laubmann, 2 Bde., Wien: Hölder 1893⫺ 1897. Livius, Römische Geschichte, hrsg. v. H. J. Hillen u. a., München und Zürich: Artemis 1983 ff. Origenes: Orige`ne, Contre Celse, hrsg. v. M. Borret, Paris: Editions du Cerf 1967⫺1969. Ovid, Metamorphosen, hrsg. v. E. Rösch, München und Zürich: Artemis, 13. Aufl. 1992. Pausanias, Description of Greece, hrsg. v. W. H. S. Jones, Cambridge (Mass.): Harvard University Press. Plinius, Briefe, hrsg. v. H. Kasten, München und Zürich: Artemis, 6. Aufl. 1990. Plotin: Plotini Opera, hrsg. v. P. Henry und H.-R. Schwyzer, Oxford: Clarendon Press 1964⫺1982. Porphyrios, De statuis, in: Bidez 1913: *1 ff. Seneca, Ad Lucilium epistulae morales, hrsg. v. F. Pre´chac, übers. v. M. Rosenbach, Darmstadt: Wissenschaftliche Buchgesellschaft 1985.
8.2. Sekundärliteratur Alroth, Brita (1992), „Changing Modes in the Representation of Cult Images“. Kernos. Supplement 1: 9⫺46. Audollent, Augustus (1904), Defixionum tabellae. Paris: Fontemoing. Beard, Mary und John North (eds.) (1990), Pagan Priests: Religion and Power in the Ancient World. London: Duckworth. Belting, Hans (1990), Bild und Kult: Eine Geschichte des Bildes vor dem Zeitalter der Kunst. München: Beck. Blech, Michael (1982), Studien zum Kranz bei den Griechen. Berlin und New York: de Gruyter. Bidez, Joseph (1913), Vie de Porphyre, le philosophe ne´oplatonicien. Gent: van Goethem und Leipzig: Teubner. Bouche´-Leclerq, Auguste (1879⫺82), Histoire de la divination dans l’antiquite´. Paris: Leroux. Burkert, Walter (1972), Homo necans: Interpretationen altgriechischer Opferriten und Mythen. Berlin und New York: de Gruyter.
957 Burkert, Walter (1977), Griechische Religion der archaischen und klassischen Epoche. Stuttgart: Kohlhammer. Burkert, Walter (1990), Antike Mysterien. Funktion und Gehalt. München: Beck. Cardauns, Burkhart (1976), M. Terentius Varro: Antiquitates Rerum Divinarum. Teil I: Text, Teil II: Kommentar. Wiesbaden: Steiner. Dieterich, Albrecht (1923), Eine Mithrasliturgie. 3. Auflage. Ed. Otto Weinreich. Leipzig und Berlin: Teubner. Dume´zil, George (1974), La religion romaine archaı¨que, suivi d’un appendice sur La religion des Etrusques. 2. Auflage. Paris: Payot. Faraone, Christopher A. (1988), Talismans, Voodoo, Dolls and other Apotropaic Statues in Ancient Greece. Diss. Stanford Univ. (Microfilm). Fox, Robin Lane (1986), Pagans and Christians. Harmondsworth: Viking. Geffcken, Johannes (1916⫺19), „Der Bilderstreit des Altertums“. Archiv für Religionswissenschaft 19: 286⫺315. Gladigow, Burkhard (1985⫺86), „Präsenz der Bilder ⫺ Präsenz der Götter. Kultbilder und Bilder der Götter in der griechischen Religion“. Visible Religion 4/5: 114⫺127. Gould, John (1973), „Hiketeia“. Journal of Hellenic Studies 93: 74⫺103. Graf, Fritz (1980), „Milch, Honig und Wein. Zum Verständnis der Libation im griechischen Ritual“. In: Perennitas. Studi Angelo Brelich. Rom: Ateneo: 209⫺221. Graf, Fritz (1985), Nordionische Kulte: Religionsgeschichtliche und epigraphische Untersuchungen zu den Kulten von Chios, Erythrai, Klazomenai und Phokaia. Rom: Schweizerisches Institut. Gros, Pierre (1976), Aurea templa. Recherches sur l’architecture religieuse de Rome a` l’e´poque d’Auguste. Rom: Ecole Franc¸aise. Hausmann, Ulrich (1960). Griechische Weihreliefs. Berlin: de Gruyter. Janowitz, Naomi (1991), „Theories of Divine Names in Origen and Pseudo-Dionysius“. History of Religions 30: 359⫺372. Kähler, Heinz (1964), Der griechische Tempel. Berlin: Mann. Kähler, Heinz (1970), Der römische Tempel. Berlin: Mann. Kassel, Rudolf (1983), „Dialoge mit Statuen“. Zeitschrift für Papyrologie und Epigraphik 51: 1⫺ 12. Lacroix, Le´on (1949), Les reproductions de statues sur les monnaies grecques. Lie`ge: Faculte´ de Philosophie et Lettres. Latte, Kurt (1960), Römische Religionsgeschichte (Handbuch der Altertumswissenschaft V: 4). München: Beck.
958 Lexicon Iconographicum Mythologiae Classicae. Bd. 5. 2 Teile. Zürich: Artemis 1990.
VII. Griechische und Römische Antike
Sittl, Carl (1890), Die Gebärden der Griechen und Römer. Leipzig: Teubner.
Van Straten, Folkert T. (1974), „Did the Greeks Kneel before Their Gods?“ Bulletin van de Vereeniging tot Bevordering van de Antieke Beschaving 49: 159⫺189. Taylor, Lilly Ross (1931), „Aniconic Worship among the Early Romans“. In: Classical Studies in Honour of J. C. Rolfe. Philadelphia: University of Pennsylvania Press: 305⫺314. Thulin, Carl O. (1905⫺09), Die etruskische Disziplin. Göteborgs Högskolas Arsskrifter 11, 12, 15. Göteborg. Reprint Darmstadt: Wissenschaftliche Buchgesellschaft 1968. Turcan, Robert (1988), „Religion Romaine“. Iconography of Religion 17, 1. Teil 1 und 2. Leiden: Brill. Versnel, Hendrik S. (1970), Triumphus. An Inquiry into the Origin, Development and Meaning of the Roman Triumph. Leiden: Brill. Versnel, Hendrik S. (ed.) (1981), Faith, Hope and Worship: Aspects of Religious Mentality in the Ancient World. Leiden: Brill. de Visser, Marinus Willem (1900), De Graecorum diis non referentibus speciem humanam. Leiden: Los. Weinreich, Otto (1909), Antike Heilungswunder. Untersuchungen zum Wunderglauben der Griechen und Römer. Gießen: Töpelmann. Wiens, D. H. (1980), „Mystery Concepts in Primitive Christianity and Its Environment“. In: Hildegard Temporini u. a. (eds.), Aufstieg und Niedergang der Römischen Welt. II. 23, 2: 1248⫺1284. Wissowa, Georg (1912), Religion und Kultus der Römer (Handbuch der Altertumswissenschaft V: 4). München: Beck.
Sokolowski, Franciszek (1962), Lois sacre´es des cite´s grecques. Supple´ment. Paris: de Boccard.
Fritz Graf, Basel (Schweiz)
Marinatos, Nanno (1992), Minoan Religion. Ritual, Image and Symbol. New York: Columbia University Press. Mylonas, George E. (1961), Eleusis and the Eleusinian Mysteries. Princeton: Princeton University Press. Podeman Sørensen, Jørgen (1993), „Ritualistics: A New Discipline in the History of Religions“. In: ˚ bo: Tore Ahlbäck (ed.), The Problem of Ritual. A The Donner Institute: 9⫺25. Radke, Gerhard (1965), Die Götter Altitaliens. Münster: Aschendorff. Rahner, Hugo (1957), Griechische Mythen in christlicher Deutung. Zürich: Rhein-Verlag. Rappaport, Roy A. (1992), „Ritual, Time, and Eternity“. Zygon 27: 5⫺30. Reverdin, Olivier und Bernard Grange (eds.) (1981), Le sacrifice dans l’antiquite´. Gene`ve: Fondation Hardt. Reverdin, Olivier und Bernard Grange (eds.) (1992), Le sanctuaire grec. Gene`ve: Fondation Hardt. Scheid, John (1985), Religion et pie´te´ a` Rome. Paris: Ed. la De´couverte. Scheid, John (1990), Romulus et ses fre`res: Le colle`ge des fre`res arvales, mode`le du culte public dans la Rome des empereurs. Rom: Ecole Franc¸aise.
48. Zeichenkonzeptionen im Alltagsleben der griechischen und römischen Antike 1. Zum Begriff des Alltags 2. Griechische Kultur 2.1. Homerische Zeit (8. Jh. v. Chr.) 2.2. Archaik (7. und 6. Jh. v. Chr.) 2.3. Klassik (5. und 4. Jh. v. Chr.) 2.4. Hellenismus (3. bis 1. Jh. v. Chr.) 3. Römische Kultur 3.1. Besonderheiten römischen Alltags 3.2. Etrusker und Römer der Republik (6. bis 2. Jh. v. Chr.) 3.3. Späte Republik (1. Jh. v. Chr.) 3.4. Römische Kaiserzeit (1. bis 4. Jh. n. Chr.) 3.5. Militärischer und kaiserlicher Alltag 4. Literatur (in Auswahl) 4.1. Quellen 4.2. Sekundärliteratur
1.
Zum Begriff des Alltags
Alltag im Sinne von ‘everyday life’, ‘everyday culture’ hat es in der griechisch-römischen Antike nur bedingt gegeben, setzt er doch als Arbeitstag im Wechsel den Ruhetag bzw. Sonntag voraus, und der ist erst am Ende der Antike festgeschrieben worden. Am Anfang und Ende der knapp anderthalb Jahrtausende währenden Entwicklung der antiken Kultur stehen stark abstrahierende Beschreibungen dessen, was man im Sinne des Alltags besser mit „Jedertag“ menschlicher, gesellschaftlicher Existenz bezeichnen würde. Da-
48. Zeichenkonzeptionen im Alltagsleben
Abb. 48.1: Helmschmied. Bronzestatuette. Höhe 5,2 cm, um 700 v. Chr. New York, Metropolitan Museum of Art (nach Himmelmann-Wildschütz 1964, Abb. 49). Die kleine Statuette zeigt einen Handwerker der homerischen Epoche bei der Arbeit. Die Formen von Körper und Kopf sind im Stil der Zeit auf klare geometrische Grundmuster zurückgeführt; der Gesamtumriß nähert sich einem rechtwinkligen Dreieck an. Kontrastierend zu diesen Zügen der Vereinfachung hat der unbekannte Künstler die Tätigkeit des Schmiedes sehr differenziert wiedergegeben: Der Mann sitzt zu ebener Erde mit untergeschlagenem linken Bein und stützt mit dem angewinkelten rechten die Standplatte des niedrigen Ambosses. Die linke Hand fixiert den fast fertig geschmiedeten Helm in seiner Lage, die rechte führte den Hammer, der bis auf den Stielansatz verloren ist. Das komplizierte Sitzmotiv ist für diese Zeit ungewöhnlich geschickt bewältigt. Trotz der typisierenden Körper- und Bewegungssprache läßt die Darstellung an Detailgenauigkeit nichts zu wünschen übrig.
bei schwingt in den frühgriechischen Jahrhunderten noch erheblich das urgesellschaftliche Erbe mit, das der Verbindlichung des Alltags enge Grenzen setzt. In der spätrömischen Zeit dagegen basiert die Generalisierung des Menschen- bzw. Gesellschaftsbildes auf einer unverrückbaren Festschreibung der ausdifferenzierten sozialen Ränge, die aber in der Darstellung eher stilistisch gerafft, ja negiert erscheinen. Zwischen diesen Anfangs- und Endstadien, also dem 8. Jahrhundert vor Christus und dem 4. Jahrhundert nach Christus, entfaltet sich, zunächst in der griechischen Kultur, ein zunehmend individueller gestaltetes Menschenbild und im Gefolge davon ein immer spezifizierteres Alltagsbild, das der wach-
959
Abb. 48.2: Die sogenannte Prothesis-Amphora. Attisch-geometrische Bauchhenkelamphora des Dipylonmeisters. Höhe 1,62 m, um 760 v. Chr. Athen, Nationalmuseum (nach Simon 1981a, Taf. 4). Gefäße aus gebranntem Ton von vielerlei Gestalt spielten im Alltag der Antike eine wichtige Rolle und sind in großer Zahl überliefert. Den unterschiedlichen Verwendungszwecken entsprechend, prägten sich schon früh bestimmte Grundtypen aus; die Form des Gefäßes verweist daher auf dessen Bestimmung. So diente die Amphora, ein Gefäß mit zwei seitlich angebrachten Henkeln, vorwiegend als Vorrats- und Transportbehälter. Während die Masse des Gebrauchsgeschirrs in der Regel unverziert blieb, schmückte man die wertvolleren Stücke mit reicher Bemalung. Bis zum Ende des 8. Jahrhunderts v. Chr. überwog dabei ornamental-geometrischer Streifendekor (häufig der sog. Mäander); seit reifgeometrischer Zeit wurden aber auch figürliche Szenen eingefügt. Die hier gezeigte fast mannshohe „Vase“ (von lat. vas ‘Gefäß’) diente als Grabmonument und ist deshalb als Vorläufer der späteren Grabstelen und -statuen anzusehen. Der straffe Aufbau und die gespannte Kontur erinnern an die Statuarik frühgriechischer Skulptur; man bezeichnet deshalb die Teile derartiger Vasen mit den Termini des menschlichen Körperbaus (Fuß, Körper, Bauch, Hals, Lippe).
senden Spezialisierung in der menschlichen Lebensweise und der damit verbundenen Verfestigung der Gruppen und Schichten Rechnung trägt. In der römischen Kultur ist von Anfang an der Sinn für die dargestellte Menschen-Spe-
960
VII. Griechische und Römische Antike
Abb. 48.3: Aufbahrung einer Toten („Pro´thesis“). Detail der Amphora von Abb. 48.2 (nach Hampe und Simon 1980, Abb. 235). In dem ⫺ gleichsam selbst als Schmuckelement ⫺ in den geometrischen Dekor der Prothesis-Amphora eingefügten Bildfeld ist die Klage an der Bahre einer Verstorbenen (durch den Rock als Frau gekennzeichnet) wiedergegeben, das häufigste Thema figürlicher geometrischer Vasenmalerei. Die Tote liegt ausgestreckt auf einer hochbeinigen Kline. Das schachbrettartig gemusterte Leichentuch hat der Künstler wie eine im Hintergrund aufgespannte Folie dargestellt und den Körper der Toten dabei sorgfältig ausgespart. Um die Bahre herum stehen, sitzen und knien die Trauernden. Sie sind silhouettenhaft und „wechselansichtig“ wiedergegeben, d. h. ihre typisiert dargestellten Körperteile bieten sich abwechselnd frontal und im Profil dar. In den zum Kopf erhobenen Armen ist ein schon aus dem 2. Jahrtausend v. Chr. überlieferter weiblicher Klagegestus zu erkennen. Die aufs Wesentliche reduzierte, fast überdeutliche Bildsprache hat man als „hieroglyphenhaft“ charakterisiert.
zies voll entwickelt, auch wenn die künstlerischen Voraussetzungen für die bildliche Erfassung derselben erst allmählich sich entfalten und automatisieren. Hier ist die Literatur möglicherweise der Bildkunst vorausgeeilt. Was gäbe es etwa in der Beschwörung von Alltäglichkeiten einer Plautuskomödie Vergleichbares in der römischen Bildkunst, die ja auch in anderer Hinsicht erst viel später zur Eigenleistung gelangt! Römischer Wirklichkeitssinn provoziert eine Aufsplitterung in private, handwerkliche, militärische, senatorische, ja selbst kaiserliche Alltäglichkeiten, die den Begriff ‘Alltag’ im herkömmlichen Sinne stark strapazieren, ja ad absurdum führen. Erst mit der Einsetzung des christlichen Sonntags durch Konstantin den Großen im 4. Jahrhundert n. Chr. als des den Alltag im stets gleichen Rhythmus ablösenden Ruhetages stellt sich jene Polarität her, die den modernen Gebrauch des Begriffes und seine Bedeutung als ‘Alltag’ begründet haben. In der heidnischen Antike hatten schon die Götterfeste und Opferhand-
lungen, die kultischen Begehungen und Spiele die Funktion der späteren Sonn- und Feiertage, vor allem der hohen Feste (Ostern, Pfingsten, Weihnachten), vorausgenommen. Diese bleiben also bei der folgenden Darstellung ausgespart, ebenso der Mythos als Kultlegende, als Text des Althergebrachten, seiner Genesis und Begründung, obwohl auch hier sich eine Art Alltäglichkeit im Umgang mit den Götterbildern, Kultsymbolen und heiligen Handlungen herausgebildet hatte (zum Begriff des Alltags vgl. auch Art. 59 § 2., Art. 73 § 1. und Art. 88 § 1.⫺3.).
2.
Griechische Kultur
2.1. Homerische Zeit (8. Jh. v. Chr.) Die Anfänge der griechischen Literatur sind in den Epen Homers (8. Jh. v. Chr.), der Ilias und Odyssee, zu fassen (vgl. auch Art. 39). Was in diese Dichtungen an Alltagsschilderung eingeflossen ist, steht im Zwielicht der beiden vorchristlichen Jahrtausende (Schind-
48. Zeichenkonzeptionen im Alltagsleben
ler 1991 a). Der epische Kontext bezieht sich auf eine Lebenswelt, die eine hochentwickelte Kultur, nämlich die der reifen Bronzezeit des 2. Jahrtausends v. Chr., zur Voraussetzung hat. Höfisches Treiben an den Palastzentren (Mykene, Pylos, Phäakenhof) gerät ebenso in die Optik dichterischer Darstellung wie die kriegerischen Vorbereitungen und Anstrengungen bei der Belagerung von Troja. Man muß sich fragen, wie die Adressaten des homerischen Sprechgesanges dieses heroische Ambiente rezipiert haben, in einer Zeit also, in der die frühen Polisgründungen (Kleinasien: 9. Jh., griechisches Festland: 8. Jh.) dafür nur beschränkte soziale Voraussetzungen boten. Im Gegensatz dazu reflektierten die homerischen Gleichnisse, die in die epischen Schilderungen Homers zur schlaglichthaften Erläuterung komplizierterer Vorgänge eingefügt sind, viel unmittelbarer zeitgenössische Sachverhalte der homerischen Zeit. Hier begegnen wir dem Alltag des Landmanns, Jägers, Handwerkers (vgl. Abb. 48.1), gewinnen Einblick in Haus und Hof, Handel und Schiffahrt. Im Gegensatz zu diesen miteinander verzahnten Erzählschichten, der epischen und der in Gleichnissen angelegten Schicht, deren erstere gelegentlich auf das Niveau minutiöser Beschreibung angehoben wird ⫺ etwa bei der liebevollen Durchmusterung der Darstellungen auf dem Schild des Achill, Ilias 18, 478⫺608 (Schindler 1987, 23 f) ⫺, fallen die Bildschöpfungen dieser Zeit auf Tongefäßen, Metallblechen, Elfenbein und anderem Material überraschend einfach aus. Sie erscheinen im Stil geometrischer Vereinfachung auf die Grundprinzipien menschlichen Gestaltbaus und sozialer Hantierung zurückgeführt. Die strichmännchenhafte Wiedergabe der Menschenfigur bedient sich am Anfang sogar nur eines einzigen gleichlautenden Zeichens für beide Geschlechter, z. B. auf der Athener Prothesis-Amphora aus der 1. Hälfte des 8. Jahrhunderts v. Chr. (siehe Abb. 48.2; vgl. auch Arias und Hirmer 1960, Taf. 4). Erst allmählich werden die Geschlechter bildlich voneinander unterschieden. Das geschieht durch strichhafte Andeutung der Brüste an den Flanken der den Oberkörper bezeichnenden Dreiecke (Simon 1981a, Abb. 8 und 9). Raumbezogen sind diese Darstellungen überhaupt nicht. Die Figurationen beanspruchen nicht einmal Wechselansichtigkeit, d. h. Vorder- und Rückansicht z. B. des Rumpfes sind nicht eindeutig festgelegt. Das
961
Abb. 48.4: Attisch-schwarzfigurige Bauchamphora des Exekias mit Darstellung der Heimkehr der Dioskuren. Höhe 61 cm, um 530 v. Chr. Rom, Vatikan, Museo Gregoriano Etrusco (nach Simon 1981a, Taf 74). Der berühmte athenische Vasenmaler schildert eine Szene aus dem Heroenmythos in friedlichem Alltagsambiente: Die Begrüßung aus dem Krieg heimkehrender junger Athener könnte sich in der Realität ähnlich abgespielt haben wie der Empfang der halbgöttlichen Zwillinge durch das königliche Elternpaar auf dem Vasenbild. Der sterbliche Sohn Kastor führt den reichgezäumten Hengst Kylaros am Zügel und wendet sich zu seiner Mutter zurück. Diese, mit einem prachtvollen Gewand bekleidet, reicht ihm zur Begrüßung eine Blüte. In der anderen Hand hält sie einen Zweig, wodurch die Empfangsszene zugleich als Dankfest an die Götter gekennzeichnet wird. Der Vater streichelt dem Pferd beruhigend die Nüstern. Ein kleiner Diener trägt auf dem Kopf einen Hocker für den König herbei. Gleichsam entrückt vom eigentlichen Geschehen steht am gegenüberliegenden Bildfeldrand der göttliche Sohn Polydeukes und spielt selbstvergessen mit einem Hund. In feiner Nuancierung sind die Spezifik der Situation und die unterschiedliche Befindlichkeit der einzelnen Personen durch Gesten und Haltungen angedeutet.
Ensemble von konstituierenden Elementen (Kopf, Rumpf, Gliedmaßen), die die Menschengestalt fixieren, bezeichnet auch zunächst nicht etwa nur ein Individuum, sondern eine unbestimmte Vielzahl der Vertreter
962
VII. Griechische und Römische Antike
Abb. 48.5: Götterzug zur Hochzeit von Peleus und Thetis; Achilleus verfolgt Troilos. Ausschnitte von zwei Friesen eines attisch-schwarzfigurigen Volutenkraters des Klitias (sog. Franc¸ois-Vase). Gesamthöhe des Gefäßes 66 cm, um 570 v. Chr. Florenz, Museo Archeologico (nach Simon 1981a, Taf. 56). Auf dem mit Darstellungen aus unterschiedlichen Mythen reich geschmückten Gefäß wird das Geschehen der Götter- und Heldensage häufig in die Szenerie einer zeitgenössischen griechischen Stadt versetzt. So ist im oberen Fries die göttliche Braut Thetis am Morgen nach der Hochzeit in einem Palast sitzend wiedergegeben, dessen Architektur Formen des frühgriechischen Tempelbaus aufweist. Der vor dem Haus stehende Bräutigam Peleus empfängt die in langem Zug, zu Fuß und im Wagen, herannahenden Götter mit grüßend erhobenem Arm. Besonders herzlich ist die Begegnung mit dem als ersten ankommenden Kentauren Chiron, der die Hand seines früheren Zöglings ergreift. Die Frauen tragen außerordentlich reich verzierte Gewänder; zur Unterscheidung von der der Männer ist ihre Haut mit weißer Farbe gemalt. Die Interaktion der Figuren wird durch ausdrucksvolle, rhythmisch aufeinander abgestimmte Handbewegungen angedeutet. ⫺ Der untere, stark beschädigte Fries zeigt, zwischen einem Brunnenhaus und der Stadtmauer von Troja, eine dramatische Szene aus dem Kampf um die kleinasiatische Stadt: die Verfolgung des trojanischen Königssohnes Troilos durch den griechischen Helden Achilleus in Anwesenheit verschiedener Götter.
dieser Gattung, ist also Gattungsformel (Schindler 1987, 20 f). Von einem individuell eingekreisten Alltag kann in dieser Bildwelt also nicht die Rede sein. Vielmehr handelt es sich um eine Art ritueller Abbildungsweise, die unter dem Aspekt der ewigen Wiederkehr des Gleichen, ohne den Anspruch näherer Individuation, Grundvorgänge andeutet ⫺ mit Blick etwa auf die Prothesis (Aufbahrung) der Athener Amphora, vgl. Abb. 48.3: Immer wenn einer gestorben ist, wird er aufgebahrt, treten die Nächstverwandten heran, plazieren sich, stimmen den Klagegesang an, kommen auch die anderen herbei, nähern sich auch schon die Bahrenträger usw. Keine einmalige Begebenheit ist ins Bild gesetzt, sondern eine immer wiederkehrende Handlung, die nach einem bestimmten Ritus abläuft. Dort trifft sich diese geometrisierende Bezeichnungsweise mit dem Impetus der homerischen Gleichnisse insofern, als auch diese mit wenigen Worten kompliziertere Vorgänge ansprechen (Hampe 1952).
Am Anfang der griechischen Kultur steht in der bildlichen Ausformung demnach eine kollektive Verschlüsselung des Menschenbildes, eine rigorose Reduktion der Lebensvorgänge auf ihre elementare Prozeßhaftigkeit. Der Begriff ‘Alltag’ kehrt hier womöglich zu des Wortes eigentlichster Bedeutung (als ‘Jedertag’) zurück. In diesem Sinne ist er in dem geometrischen Kürzel auf hoher Abstraktionsebene zur Verallgemeinerung gebracht. 2.2. Archaik (7. und 6. Jh. v. Chr.) In den beiden archaischen Jahrhunderten, dem Zeitalter der Herausbildung und Festigung der griechischen Poleis (Bürgergemeinden), wird der Schritt von der Zeichengestalt geometrischer Prägung zur leibhaftigen Verkörperung von Menschen-, Tier- und Pflanzenbild bewältigt. Die Griechen erprobten unter dem neuen Gestaltungsaspekt das Organisationsprinzip der „Symmetrı´a“ (vgl. Art. 44 § 2.3.). Sie bezeichneten damit die Durchproportionierung des Menschen-, Tier-
963
48. Zeichenkonzeptionen im Alltagsleben
Abb. 48.6: Herakles begrüßt den Kentauren Pholos. Von einer attischschwarzfigurigen Halsamphora des Antimenesmalers. Gesamthöhe des Gefäßes 40,4 cm, um 520 v. Chr. London, British Museum (nach Burow 1989, Taf. 55B). Der Händedruck war für den antiken Griechen keine gewöhnliche und abgenutzte Geste, sondern ein deutliches Zeichen der Zuneigung und Verbundenheit. Mit ihm begrüßte und verabschiedete man Gastfreunde und besiegelte später auch Verträge. In der dargestellten Szene empfängt der Kentaur (sagenhaftes Mischwesen aus Mensch und Pferd) Pholos den auf der Verfolgung des Erymanthischen Ebers bei ihm einkehrenden Herakles, um ihn zu bewirten. Der gesenkte Kopf deutet wohl nicht nur die Erschöpfung, sondern auch die friedlichen Absichten des häufig so aufbrausenden Helden an. Der im Hintergrund sitzende Gott Hermes wiederholt die Handbewegung der Hauptfiguren, doch ist seine Geste wohl deiktisch zu verstehen: sie weist auf das einträchtig beginnende und blutig endende Geschehen hin.
und Pflanzenkörpers nach einem ganz bestimmten Maßsystem, d. h. die größenmäßige Aneinanderpassung (Symmetrisierung) der einzelnen Teile eines Gebildes, um ein funktionsfähiges Ganzes herzustellen. Der Begriff, der in der Proportionslehre des Philosophen Pythagoras (570/60⫺ca. 490) systematisiert und als Bauprinzip der Welt definiert wurde, hat übergreifende Bedeutung, ist vor allem auch im Musikverständnis angesiedelt. Er gilt auch für die Mehrfigurensysteme archaischer Provenienz, die erst auf dieser Stufe als symmetrisierte Kompositionen ein Bildganzes im funktionellen Sinne zu konstituieren vermögen. Dieser erste Schritt in Richtung eines individueller konkretisierten Ganzen vollzieht sich auch in der zunehmend mythischen Thematisierung der Figurenensembles, die dadurch episch erzählenden Charakter erlangen. In homerischer Zeit (8. Jh. v. Chr.) ist
mythische Darstellung gegenüber der rituellen wenig belegt. Selbst wenn ein solches Defizit durch unser Unvermögen bedingt sein sollte, alle Darstellungen korrekt zu deuten, scheint dies kein Zufall, denn mythische Figuration hat eine individuellere Erfassung der abgebildeten Vorgänge notwendig im Gefolge, indem die ins Bild gesetzten Figuren auf mythische Personen eingegrenzt sind. Darin liegt die große Neuerung der archaischen Zeit, daß sie mit der Ausgestaltung der mythischen Bilderkreise diesem von der geometrischen Phase der Realitätserfassung wegführenden Individuationsprinzip zum Durchbruch verhilft. Darin ist auch der Fortschritt beschlossen, der sich nicht zuletzt auf die Formierung von Alltagsbildern positiv ausgewirkt hat (Schindler 1987, 26). Alltag präsentiert sich nun zunächst im Mythos verschlüsselt. Er ist abgerückt von seiner rituellen Bindung, ist vielmehr einge-
964
VII. Griechische und Römische Antike
Abb. 48.7: Achilleus’ Rüstung durch Thetis. Von einer attischschwarzfigurigen Bauchamphora des Amasis-Malers. Gesamthöhe des Gefäßes 44 cm, um 540 v.Chr. Berlin, Staatliche Museen Preußischer Kulturbesitz (nach Karouzou 1956, Taf. 26). Ein von Homer (Ilias 19, 1 ff) geschildertes Ereignis aus dem Kampf um Troja gibt die hier gezeigte Szene wieder: Thetis, durch Kleidung, Schmuck und helle Hautfarbe von den übrigen Personen unterschieden, überbringt ihrem Sohn Achilleus die von Hephaistos geschmiedeten neuen Waffen. Also ein mythisches Geschehen, in das aber Elemente intimer menschlicher Beziehungen eingefügt sind, wie sie sich sonst zumeist nur auf Vasenbildern mit Alltagsdarstellungen finden. Der neben der Göttin stehende junge Mann berührt mit den Fingern den Bart des Achilleus ⫺ eine kaum mißzuverstehende Geste zärtlicher Annäherung. Auch die Handbewegung des gerüsteten Kriegers am linken Bildrand ist als Zeichen erotischer Kontaktaufnahme zu verstehen. Mythos und Alltag beginnen sich in der Darstellung zu durchdringen.
lassen in das mythische Bedingungsgefüge. Das immerwährende Bedeutungsmuster, vormals in geometrischer Abbreviatur gegeben, erfährt im Mythos eine vorgangsmäßig engere Eingrenzung, zugleich eine personenbezogenere und damit individuellere Realisierung. Wenn beispielsweise auf der vatikanischen Amphora des Töpfers und Malers Exekias (3. Viertel 6. Jh.) Kastor und Polydeukes als Heimkehrende in der Begegnung mit ihren Eltern Leda und Tyndareos gezeigt werden (siehe Abb. 48.4; vgl. auch Schindler 1987, Abb. 17), so ist dieser Vorgang bis hin zur Sicherung durch Inschriften auf den Mythos bezogen. Das Alltägliche, jedermann betreffende Rückkunftsmotiv ist auf das mythisch Alltägliche festgelegt. Abgrenzungsmöglichkeiten gegen das mythisch Festtägliche, Außerordentliche (Götterhochzeiten, -prozessionen,
-schlachten, Heldentaten u. a.; vgl. Abb. 48.5 und 48.6) ergeben sich erst dann, wenn die mythischen Darstellungsmuster transparent zu werden beginnen für die Begebenheiten des Alltags, und zwar des menschlichen Alltags. Das läuft auf einen Dissoziierungsprozeß hinaus, bei dem das vormals im Heroisch-Göttlichen paradigmatisierte Geschehen in die menschliche Sphäre entlassen wird. Dieser Prozeß ist im weiteren Verlauf der Archaik offenbar auch ganz gezielt vorangetrieben worden. Er äußert sich darin, daß man die mythisch fixierenden Beischriften nach und nach fortläßt. Achills Rüstung z. B. (vgl. Abb. 48.7) gerät so auf der Berliner Amphora des Amasis-Malers (3. Viertel 6. Jh.) (Karouzou 1956, pl. 26; Schindler 1987, Abb. 24) in das Zwielicht nach beiden Richtungen hin, einmal zum Mythischen (das ist die Vorgabe, die langsam verblaßt), zum anderen aber auch ins unmythisch Alltägliche.
965
48. Zeichenkonzeptionen im Alltagsleben
Abb. 48.8: Frauen im Schwimmbad. Von einer attisch-schwarzfigurigen Bauchamphora des Priamosmalers. Ende 6. Jh. v. Chr. Rom, Museo Nazionale di Villa Giulia (nach Be´rard et al. 1985, Abb. 128). Frauen bei der Toilette am Brunnen oder vor einem Waschbecken sind auf Vasenbildern mit Alltagsszenen häufig dargestellt; seltener findet sich die Wiedergabe eines Schwimmbads im Freien. Man hat deshalb bei der hier gezeigten Szene auch an badende Nymphen gedacht, doch widersprechen dem die in den Zweigen der Bäume neben den Kleidern der Badenden aufgehängten Sportutensilien (Schwämme, Ölfläschchen). Mit Freude an der Vielfalt der Aktionen und Bewegungen hat der Maler das muntere Treiben am und im Wasser dargestellt: Die Frauen schwimmen, springen, waschen und kämmen sich. Das Ganze spielt sich an einem idyllischen Platz, wohl einer Bucht, zwischen aufragenden Felsen und weit verästelten Bäumen ab. Die weiße Farbe der Frauenkörper ist an vielen Stellen verlorengegangen.
In der 2. Hälfte des 6. Jahrhunderts, speziell im letzten Viertel, begegnen vermehrt ambivalente Darstellungen, die am Ende die mythische Aureole ganz abstreifen: Da erleben wir Frauen im Schwimmbad (vgl. Abb. 48.8), Palästraszenen, Schuster in der Werkstatt (vgl. Abb. 48.9), Landmänner beim Ackern, Olivenernte (vgl. Abb. 48.10), Gelage von Zechern, die dann ausschwärmen, Frauen am Brunnen, Töpfer beim Formen und Brennen der Gefäße. Die Handwerkerdarstellungen gehen von Anfang an vom Mythos getrennte Wege, wären aber ohne diesen Entmythologisierungsprozeß nicht denkbar. Die Gestalt- und Gegenstandsauffassung verhält sich bei diesen Darstellungen ganz im Sinne der archaischen Syntax und Komposition. Raum- und Zeitkoordinaten bleiben konzeptuell ausgespart. Der Bildgrund ist nicht Raumträger, sondern Erzählfolie, auf der die figürlichen Elemente durch ihre An-
ordnung und Zuordnung, Drehung und Wendung, aussagereich zueinander und zum Bildganzen in Beziehung gesetzt erscheinen (vgl. Abb. 48.11). Auch hier ist nicht Einmaligkeit des gezeigten Vorganges angestrebt. Aber das Immerwährende erfährt in der Konkretisierung des mythischen Paradigmas, das eher nur exponiert und handlungsmäßig durchgeführt wird, zunehmende Visibilisierung und feingliedrigere Ausarbeitung, die in der dekorativen Balance, auch in der Verfeinerung des Lineaments, gelegentlich in Bahnen der Formalisierung gerät. Die Emanzipierung der archaischen Alltagsbilder vom Mythos hat offenbar aus den kulturpolitischen Auseinandersetzungen, besonders im Athen der Tyrannenzeit, nachhaltigen Auftrieb erfahren (Schindler 1987, 35 ff). Ging es dabei doch auch um die Entmachtung aristokratischer Gruppierungen, deren mythisch-genealogische Legitimierung
966
Abb. 48.9: Attisch-schwarzfigurige Pelike des Eucharides-Malers mit Darstellung einer Schusterwerkstatt. Höhe 40 cm, Anfang 5. Jh. v. Chr. Oxford, Ashmolean Museum (nach Burford 1985, Abb. 3). Das Bild gibt den Blick in die Werkstatt eines athenischen Schusters frei. Der Meister sitzt mit nacktem Oberkörper vor einem kunstvoll verzierten Tisch und schneidet mit einem Messer ein Stück Leder zu, dabei genau dem Fußumriß seines Kunden, eines kleinen Jungen, folgend, der vor ihm auf dem Tisch steht. Ein zweiter Erwachsener, wohl der Vater des Jungen, schaut zu, mit verschränkten Beinen lässig auf seinen Stock gelehnt. Das Mobiliar der Werkstatt (Tisch, Hocker, Klappstuhl) und das Arbeitsgerät des Handwerkers (Bord mit Werkzeugen an der Wand, Gefäß für Lederabfälle, Arbeitsplatte auf dem Tisch) hat der Maler minutiös wiedergegeben. In der Haltung und den Gesten der Figuren drückt sich ein Kontrast zwischen konzentrierter Tätigkeit, neugieriger Teilnahme und entspannter Ruhe aus.
angetastet und in Frage gestellt wurde. Wie mythosgebunden in der Propaganda politische Machtkämpfe ausgetragen wurden, zeigt z. B. die Frühgeschichte des tragischen Chorgesanges, der Tragodia, in Sikyon auf der Nordpeloponnes, wo der Tyrann Kleisthenes in der 1. Hälfte des 6. Jahrhunderts v. Chr. unter ganz bestimmten außenpolitischen Konstellationen und im Zuge von daraus resultierenden innenpolitischen Maßnahmen die kultpolitische Bindung der Tragödie an den Kult des Dionysos durchsetzte (Herodot
VII. Griechische und Römische Antike
5,67) ⫺ eine Synthese, die für die großartige Entwicklung dieser Gattung in Athen den Grund gelegt hat (Schindler 1987, 60 f). Solche Vorstöße einer Freisetzung von alteingefleischten Mythen oder zumindest einer Manipulierung des mythischen Bedingungsgefüges lassen sich auch in der politisch motivierten Lyrik des athenischen Politikers Solon (ca. 640⫺ca. 560) oder aber in der Liebeslyrik der für dieses Genre weltberühmt gewordenen Sappho (7./6. Jh.) beobachten, deren Liebesnöte ⫺ mögen sie oft auch nur im Wechselgespräch mit der Liebesgöttin Aphrodite zum Ausdruck kommen ⫺ ihren Alltag durchziehen. Schon im 7. Jahrhundert v. Chr. hatte der Dichter Hesiod in seinen „Werken und Tagen“, einer Art Bauernkalender, Elemente des bäuerlichen Alltags sichtbar werden lassen. Bemerkenswert sind auch die Verse des Dichters Archilochos von Paros (nach 700), der in ihnen, frei von mythischen Bezügen, seine bewegten Alltagsszenen hat plastisch werden lassen. Alltagsszenerie, in Wort und Bild, als Ergebnis einer sukzessiven Lösung von der mythischen Vorgabe, mutet im weiteren Verlauf der Archaik wie eine Vorwegnahme dessen an, was im 5. Jahrhundert v. Chr. stets als Ausdruck weitgreifender Demokratisierung der Polis begriffen worden ist, nämlich die einzigartige Dokumentation der Lebenswelt der klassischen Griechen, einerseits bezeugt auf ihrer Keramik, speziell auf den Vasenbildern, andererseits in den Alltagsbezügen ihrer dramatischen Inszenierungen, speziell der Komödie. Sie bildet zweifellos einen ersten Höhepunkt in der authentischen Erfassung des griechischen Alltags. 2.3. Klassik (5. und 4. Jh. v. Chr.) In den klassischen Jahrhunderten der griechischen Kultur vollzieht sich die Emanzipation der Alltagsschilderung aus mythischer Bindung mit sichtbarer Vehemenz. Das gilt sowohl für die Bildkunst als auch für die Literatur. Die oben genannten Vasenbilder der in Athen getöpferten und bemalten Keramik breiten eine ganze Palette von Alltagsszenen vor dem Betrachter aus: Zahlreich sind Abbildungen der Palästra (Sportstätte), des Schulunterrichts, der militärischen Ausbildung (Ephebie), von Symposien (Gelagen) und Komoi (Umzügen; vgl. Abb. 48.12), aus dem Frauenleben, von Produktionsstätten (Musiolek und Schindler 1980, 203 ff). Was die klassischen Alltagsbilder gegenüber den archaischen auszeichnet, ist die zu-
967
48. Zeichenkonzeptionen im Alltagsleben
Abb. 48.10: Olivenernte. Rückseitenbild der Amphora von Abb. 48.6 (nach Burow 1989, Taf. 55A). Oliven als Ausgangsprodukt der Ölherstellung bildeten eine Grundlage der Ernährung im antiken Griechenland. Der Besitz von Olivenbäumen galt als Zeichen des Wohlstands; unberechtigtes Fällen stand unter Strafe. Bei der Ernte schlug man die Früchte mit langen Stangen von den Zweigen und sammelte sie in Körbe. Auf dem Bild ist ein Junge auf den Baum geklettert, um auch die höheren Äste zu erreichen. Obwohl die Arbeit in der Landwirtschaft als eine besonders ehrenhafte und des freien Bürgers würdige galt, finden sich in der bildenden Kunst nur wenige Darstellungen aus diesem Bereich.
nehmende Vergegenwärtigung des Gezeigten im nunmehr klassischen Raum- und Zeitmaß, d. h. die Figuren lösen sich aus der dekorativen Befangenheit gegenüber Grund und Rahmen des Bildfeldes und bewegen sich aus eigenem Impetus, dem der klassische Kontrapost (vermitteltes System von gegenstrebigen Bewegungen) zugrunde liegt. Der dadurch gesicherte Gewinn an individuellerer Fassung hält sich allerdings in den Grenzen klassischer Verallgemeinerung. Lebensalter werden verdeutlicht, die Figuren aber nicht näher personalisiert. Soziale Rangigkeit ist nur schwach oder gar nicht angedeutet. Innenbewegung eröffnet psychisch differenziertere Ausdrucksmöglichkeiten (vgl. Abb. 48.13). In die Monumentalkunst hat Alltagsdarstellung dieser Zeit keinen Eingang gefunden. Dort blieb der Mythos als allgemeinverständlicher Darstellungsinhalt die Regel. Dieser Tatbestand macht deutlich, daß das Freikommen vom mythischen Weltbild und Gesellschaftsdenken in der Polisdemokratie nicht überschätzt werden darf, ein Korrektiv, das in der zurückhaltenderen Beurteilung der
Aufklärungs- und Demokratisierungstendenzen durch die neuere Forschung seine Entsprechung findet (Schindler 1991 b, 122 ff). Literarisch gefaßte Alltäglichkeit begegnet in Ansätzen in der altattischen Komödie, auch in den spätklassischen Tragödien, etwa des Euripides (485/84⫺406), in größerer Ausführlichkeit und bahnbrechender Neuerung dann aber in der neuattischen Komödie des 4. Jahrhunderts v. Chr., deren Anfänge aufs engste mit dem Schaffen Menanders (342/ 41⫺293/90) verbunden sind. Hier ist ein Medium erprobt worden, das im breiten Strom durch die Antike, über Plautus (um 250⫺ 184) und Terenz (um 190⫺159) den Römern vermittelt, dann auch wieder im Klartext Menanders, bis in die römische Kaiserzeit hinein wirksam geblieben ist und sich in dem Spruch verdichtet hat: Menander, das sei das Leben selber; so unmittelbar schien jede Zeile seiner Dichtungen das Leben in seiner Alltäglichkeit eingefangen zu haben. Die Bilderwelt der Keramik ist im 4. Jahrhundert v. Chr. freilich ganz andere Wege gegangen. Schon im späteren 5. Jahrhundert setzt ein rückläufiger Prozeß ein, der vormals
968
VII. Griechische und Römische Antike
auf ihren Gefäßwänden in äußerst origineller Manier Szenen des Alltags oder des veralltäglichten Mythos auf die Bühne gebracht und parodiert haben (vgl. Abb. 48.14; siehe auch Arias und Hirmer 1960, Taf. 240; Trendall 1990, 223 ff).
Abb. 48.11: Attisch-rotfigurige Pelike aus dem Umkreis des Euphronios mit Darstellung einer Alltagsszene. Höhe 37,5 cm, Ende 6. Jh. v. Chr. St. Petersburg, Staatliche Ermitage (nach Simon 1981a, Taf. 116). Drei unterschiedliche Lebensalter und drei verschiedene Weisen des Reagierens auf ein Naturereignis ⫺ das Erscheinen des ersten Frühlingsboten ⫺ zeigt das Vasenbild. Die Ausrufe der Personen sind in Inschriften auf dem Gefäß festgehalten. Der junge Mann auf dem Klappstuhl links hat den Vogel, der am oberen Bildrand erscheint, zuerst gesehen und ruft: „Sieh da, eine Schwalbe!“ „Da ist sie“, antwortet der Knabe rechts und wirft den Arm in die Höhe. Nun wendet auch der ältere Mann in der Mitte den Kopf nach oben und stellt fest: „Beim Herakles, der Frühling hat begonnen.“ Subtile Körpersprache und eine feine Differenzierung der Gesten des Zeigens prägen das Bild. Durch die inschriftlich fixierte Kommunikation der Personen wird zudem die Dimension des zeitlichen Ablaufs der Handlung in die Darstellung hineingenommen.
profan referierte Alltäglichkeit in das mythische Ambiente zurückbindet. Man könnte von einer Remythisierung der Alltagsszenen sprechen (Schindler 1974, 229 ff). Eine solche Mythosbezogenheit gilt auch für die Mehrzahl der Bildschöpfungen des 4. Jahrhunderts v. Chr. Darstellungen profanen Alltags treten demgegenüber zurück. Eine Sonderthematik bestreiten die oft behandelten Grabszenen, die aber nicht selten in die heroische oder göttliche Sphäre eintauchen. Eindeutiger alltagsbezogen sind die Theaterdarstellungen auf den unteritalischen Phlyaken-Vasen, die
2.4. Hellenismus (3. bis 1. Jh. v. Chr.) Was sich im 4. Jahrhundert v. Chr. im Hinblick auf die erscheinungsbildhaftere Gestaltung der Gegenstandswelt und ihrer raumzeitlichen Realisierung im Bild angebahnt hatte ⫺ kein Geringerer als Platon (427⫺ 347) hatte gegen diese sinnenhafter erfaßte Welt als eine Scheinwelt in seiner Ästhetik polemisiert ⫺, kommt in den hellenistischen Jahrhunderten zum vollen Austrag. Erst jetzt gerät das dargestellte Sujet in jenes unentrinnbare Koordinatensystem vertieften, ja zunehmend unbegrenzten Raumes und eines augenblickshafter verknappten Zeitmaßes, die es in seiner unverwechselbaren Einmaligkeit konstituieren. Hinzu kommt der Psychologismus, der aus den Tiefen der Leiber die feinsten Regungen an die Oberfläche, vor allem des Gesichts, zu holen vermag. Auch in der Intimsphäre wird bis in den letzten Winkel hineingeleuchtet. Die ars amatoria (Liebeskunst) ist ein beliebter, variationsreich angebotener Darstellungsgegenstand. Das reicht bis zur Pornographie (‘Schmutzmalerei’). Einen Begriff von dem minutiösen Charakter dieser Bildäußerungen geben die Mosaiken des Dioskurides in Neapel (Curtius 1929, Taf. 9 und 10; Schefold 1967, Abb. 247), die als musivische Reproduktionen (des Späthellenismus) nach Theaterbildern des frühen 3. Jahrhunderts v. Chr. erkannt und als Theaterszenen nach Menanderstücken identifiziert worden sind (Menander 1975, Abb. 7 und 8). Einmal sind es Frauen beim Frühstück, deren illustre Runde in aller Ausführlichkeit durchgezeigt wird. Zum anderen werden Straßenmusikanten präsentiert, deren soziales Kolorit meisterhaft eingefangen ist (vgl. Abb. 48.15). Die beteiligten Personen auf beiden Mosaiken tragen sämtlich Masken, die typologisierten Physiognomien verpflichtet sind. Hier nun stehen bzw. sitzen Figuren aus Fleisch und Blut vor dem Betrachter. Bis zum letzten Detail sind sie verlebendigt. Die zu den in diesen Mosaiken zitierten Komödien hinzugefundenen Verse ⫺ es sind nur wenige ⫺ stehen an Frische und Unmittelbarkeit den Bildern in nichts nach.
969
48. Zeichenkonzeptionen im Alltagsleben
Abb. 48.12: Attisch-rotfigurige Schale des Brygos-Malers mit Darstellung eines Komos. Höhe 14 cm, um 480 v. Chr. Würzburg, Martin-von-Wagner-Museum (nach Simon 1981a, Taf. 155). Trinkschalen, die beim Symposion (Gelage) verwendet wurden, bemalte man in der griechischen Antike gern mit Szenen, die den Verwendungszweck der Gefäße mittel- oder unmittelbar spiegeln: entweder im Gewand des Mythos (der Weingott Dionysos mit seinem Gefolge von Satyrn und Mänaden) oder als Abbild realen Lebens (Symposion bzw. Komos ⫽ Umzug nach dem Gelage). Auf dem Außenbild der Würzburger Schale bewegen sich die betrunkenen Zecher im Tanzschritt vorwärts; die Musik dazu liefern zwei junge Männer mit Aulos (Doppelflöte) bzw. Barbiton (Saiteninstrument). Körperhaltung und Gestik der Figuren sind von Tanz und Rausch bestimmt; der ausgestreckte Arm des einen Komasten verweist auf das Geschehen auf dem Bild der gegenüberliegenden Gefäßseite.
Abb. 48.13 a: Tanzende Zecher. Von einer attisch-schwarzfigurigen „Komastenschale“. Gesamthöhe des Gefäßes 9,5 cm, um 580⫺70 v. Chr. New York, Metropolitan Museum of Art (nach Richter 1953, Taf. I b).
Nicht minder sensibel ist der Alltag in der Literatur beschworen worden. Von den Komödien Menanders war schon die Rede. Unter den Idyllen des syrakusanischen Dichters Theokrit (1. Hälfte 3. Jh.) erleben wir z. B. in den „Frauen am Adonisfest“ (Theokrit 1973, 111 ff) die Drums und Drans eines bis in die letzten Nuancen durchgefeilten Frauengesprächs, ehe diese sich einig werden können und endlich zur Besichtigung des Umzugs
aufzubrechen beschließen. In dieser reich entfalteten Lebenswelt des Hellenismus wird zweifellos die Aussagefähigkeit bis zur letzten Faszination ausgereizt. Eine Steigerung ist kaum denkbar. Mit der im mittleren Hellenismus des 2. Jahrhunderts v. Chr. einsetzenden Rückbesinnung auf die klassischen Darstellungsmuster wird dieser breite Strom der realistischen Abspiegelung des Lebens wieder spürbar eingedämmt. Er bricht aber nicht ab
970
VII. Griechische und Römische Antike
und wird von den Römern in der späten Republik und frühen Kaiserzeit mit unverkennbarer Zuwendung reproduziert.
3.
Abb. 48.13 b: Attisch-rotfigurige Bauchamphora des Euthymides mit Darstellung tanzender Zecher. Höhe 60,5 cm, um 510 n. Chr. München, Staatliche Antikensammlungen (nach Simon 1981a, Taf. 113).
Abb. 48.13 c: Attisch-rotfiguriger Stamnos des Dinosmalers mit Darstellung tanzender Mänaden. Höhe 49 cm, um 420 v. Chr. Neapel, Museo Nazionale Archeologico (nach Simon 1981a, Taf. 213).
Römische Kultur
3.1. Besonderheiten römischen Alltags Der ausgesprochene Sinn der Römer für die Trennung der Staatsgeschäfte („res publica“) von der Privatsphäre („res privata“) prädisponierte sie für die kulturellen Anstrengungen des Privatbereichs. Dazu gehörte auch die künstlerische Verewigung dieser Sphäre, deren veristische Erfassung Unterpfand der geforderten Authentizität war. So gesehen erfährt der Alltag sein typisch römisches Gepräge. Er läßt sich aber andererseits nicht auf den Privatbereich eingrenzen. Neben den privaten Alltag traten der politische, juristische, militärische und natürlich auch der handwerkliche Alltag. Den Alltäglichkeiten liegt die Spezifik der jeweiligen Beschäftigung („negotium“) bzw. Nichtbeschäftigung („otium“) zugrunde. Die durch Kaiser Konstantins Begründung des christlichen Sonntags (im Jahre 321) geschaffene Dichotomie von Feiertag und Alltag ist auf den früheren Stufen der antiken Entwicklung ⫺ wie wir bisher sehen konnten ⫺ nicht vollkommen einzulösen, obwohl natürlich die heidnischen Feste, die ja die Funktion des späteren Sonntags als eines Ruhetages vorwegnahmen, sich durchaus vom Arbeitsalltag unterscheiden lassen. Auch die Kriegstage lassen sich vom friedlichen Alltag trennen. Dabei ist zu bedenken, daß ⫺ wie G. Klaffenbach einmal errechnet hat ⫺ zumindest in der griechischen Antike mehr Zeit auf Krieg verwendet als im Frieden gelebt worden ist. Demnach wäre für diesen Zeitraum Krieg das Alltägliche, Frieden das Außergewöhnliche gewesen. Die Auffassung, daß Krieg das Anomale, Frieden das Normale sei, hat sich in der Antike allgemein erst seit der Zeitenwende durchgesetzt. Ausnahmen des Aufrufs und Bekenntnisses zu friedlicher Normalität, etwa im 5. und 4. Jahrhundert, bestätigen nur die Regel, daß es grundsätzlich eben anders war. So trifft sich die augusteische Friedensideologie als Ausdruck ganz realer Friedenssehnsucht mit der Friedensbotschaft Christi im frühen 1. Jahrhundert n. Chr. als Symptom des großen Umdenkens, das zugleich als der äußerste Beginn des Endes der Antike angesehen werden kann. Der Schriftsteller
971
48. Zeichenkonzeptionen im Alltagsleben
Abb. 48.13 d: Neuattisches Relief mit tanzenden Mänaden. Marmor. Höhe 59 cm, 1. Jh. v. Chr. Florenz, Galleria degli Uffizi (nach Mansuelli 1958, Abb. 15). Die Abbildungen a)⫺d) aus unterschiedlichen Epochen zeigen viermal das gleiche Thema: Tanz. Der früharchaische Maler der New Yorker Schale stellt den Vorgang mit drastischer Deutlichkeit, sowohl in der Körpergestaltung als auch im Figurenbezug, dar. Die Interaktion der Tänzer wird durch Blickrichtung und markant hervorgehobene Handbewegungen unmittelbar anschaulich. Dagegen bevorzugt der spätarchaische Meister Euthymides kompliziertere Körpermotive und eine subtilere Gestik. Seine Tanzdarstellung ist zugleich zurückhaltender und in den Figurenbeziehungen differenzierter. Die Mänaden des spätklassischen Dinosmalers drehen sich, von langen, faltenreichen Gewändern umflattert und den Kopf in den Nacken geworfen, in ekstatischer Verzückung. Sie erscheinen stärker auf sich selbst ⫺ oder genauer: auf ihr rauschhaftes Erfülltsein von der Gottheit ⫺ bezogen als auf ihr jeweiliges Gegenüber. Vollendet ist die Tendenz zur Isolation an den Figuren des späthellenistischen „neuattischen“ Reliefs. Die komplizierten Bewegungen der sich selbstvergessen ihrem Taumel hingebenden Gestalten dienen nicht der Verdeutlichung eines Handlungszusammenhangs. Der Künstler hat die Motive seiner Figuren von älteren Vorbildern übernommen, die Körpersprache in manieristischer Weise übersteigert (besonders deutlich sichtbar an den „kalligraphischen“ Faltenschwüngen der dünnen, den Körper mehr entblößenden als verhüllenden Gewänder) und ⫺ ganz überwiegend dekorative Zwecke verfolgend ⫺ auf die Andeutung jeder Interaktion verzichtet.
Plutarch (um 46 bis nach 119) läßt uns wissen (Vom Aufhören der Orakel c. 17), daß zur Zeit des Kaisers Tiberius (reg. 14⫺37) Schiffer in der Nähe der Insel Korfu den Ruf vernommen haben sollen, der große Pan (Gott Pan als Inbegriff männlicher Geschlechtspotenz) sei tot. Das ist wohl eines der markantesten Signale vom entfernt anbrechenden Ende der Antike. 3.2. Etrusker und Römer der Republik (6. bis 2. Jh. v. Chr.) Ein unmittelbareres Verhältnis zur Alltagsschilderung hatten die Italiker, speziell die Römer, von vornherein. Selbst aus den spärlich erhaltenen Denkmälern kann dennoch auf eine ungebrochene Tradition seit den do-
minant etruskischen Jahrhunderten (6. und 5. Jh.) geschlossen werden. So bezeugen etwa die Wandgemälde mit Jagdszenen und Fischfang in dem danach benannten Grab in Tarquinia (Tomba della caccia e pesca) aus dem späteren 6. Jahrhundert (vgl. Abb. 48.17) einen hellwachen Sinn für alltägliches Geschehen. Auch Konversations-, Gelage- und Tanzszenen (Tomba del barone, delle leonesse, del triclinio, dei leopardi: sämtlich in Tarquinia) geben ⫺ in einer gewissen Synchronie zur griechischen Entwicklung des späteren 6. und frühen bis mittleren 5. Jahrhunderts ⫺ Affinitäten zur bildlichen Festschreibung des Alltags zu erkennen (Pallottino 1952, 43 ff, 55 ff, 67 ff und 73 ff). Das ist eine Beobachtung, zu der man sich die Gattung der
972
Abb. 48.14: Paestanisch-rotfiguriger Kelchkrater des Asteas mit Darstellung einer Szene aus einer Phlyakenposse. Höhe 41 cm, um 350 v. Chr. Lipari, Museo Eoliano (nach Arias 1962, Taf. 240). Das Vasenbild aus dem griechisch besiedelten Unteritalien stellt eine Theaterszene dar. Die sitzende Figur links verkörpert den Gott Dionysos; sein über den Kopf erhobener rechter Arm signalisiert Erstaunen über das vor seinen Augen ablaufende Geschehen: Auf einem kleinen Hocker vollführt eine Akrobatin einen Handstand. Ein Possenreißer betrachtet eingehend den nackten Körper der Frau, ein anderer lehnt gelangweilt im Hintergrund. In zwei Fenstern am oberen Bildrand werden die Köpfe zweier Schauspieler mit Frauenmasken sichtbar. Ein realer Vorgang wird hier in doppelter künstlerischer Brechung wiedergegeben: inszenierte Theaterhandlung als Thema der Bildkomposition eines Vasenmalers.
etruskischen „satura“ hinzugereimt denken könnte, auf die die spätere römische Satirendichtung zurückzuführen sein wird. Auf welch fruchtbaren Boden in der Gattung des Dramas die griechische Vorleistung in der Verlebendigung von Alltäglichkeiten fiel, beweisen die Komödien des Plautus (um 250⫺184) und Terenz (um 190⫺159) zur Genüge. Aus ihnen sind sogar verlorene Komödien Menanders rekonstruiert worden. So zuverlässig waren die Vorlagen in den lateinischen Bearbeitungen aufgehoben. Die hellenistischen Errungenschaften dieser Gattung, die wie kaum eine andere von den neuen Lebens- und Bewußtseinslagen geprägt war,
VII. Griechische und Römische Antike
Abb. 48.15: Straßenmusikanten. Mosaik des Dioskurides von Samos aus der „Villa des Cicero“ in Pompeji. Höhe 43,7 cm, um 100 v. Chr. (nach einem Vorbild des 3. Jh. v. Chr.). Neapel, Museo Nazionale Archeologico (nach Curtius 1929, Taf. IX). Auch dieses pompejanische Fußbodenmosaik stellt ⫺ wie schon das verlorene hellenistische Gemälde, auf das es zurückgeht ⫺ einen Bühnenvorgang dar, wohl den Auftritt von Musikanten im Zwischenspiel einer Komödie. Auf dem Umweg über das Theater haben jetzt Angehörige unterer Volksschichten Eingang in das Themenrepertoire der bildenden Kunst gefunden: Die Masken der Schauspieler und die Szene selbst deuten auf umherziehende Straßenmusikanten, eine Art Bänkelsänger. Diesem sozialen Milieu entspricht die Schlichtheit und Unmittelbarkeit von Gestik und Körpersprache, die auf nichts anderes verweist als auf den dargestellten Vorgang selbst.
fanden bei den Vertretern eines expandierenden Imperiums um so mehr Anklang, als diese nach der Okkupation Griechenlands in die Phase kultureller Auseinandersetzung mit dem griechischen Erbe eintraten. 3.3. Späte Republik (1. Jh. v. Chr.) Der italisch-römische Hang zum pragmatisch bezeugten Alltag tritt für uns erst in der Zeit der späteren Republik mit markanten Denkmälern ins Licht bildkünstlerischer Überlieferung. Heraus ragt unter diesen Zeugen das Grabmal des römischen Bäckers M. Vergilius Eurysaces (spätes 1. Jh. v. Chr.). An dem backofenähnlichen Bau sind Reliefs erhalten, die Stationen vom gemahlenen Korn bis zum gebackenen Brot ausführlich dokumentieren (Kähler 1958, Taf. 107; Kraus 1967, Abb. 186 a). Neben den politisch-propagandistisch
48. Zeichenkonzeptionen im Alltagsleben
Abb. 48.16: Schematische Darstellung eines hellenistischen „Wunderaltars“ (nach Müller 1976, Abb. 73). Aus antiken Schriftquellen ist bekannt, daß in den hellenistischen Jahrhunderten bedeutende naturwissenschaftliche (vor allem physikalische) und technische Erkenntnisse gewonnen wurden, die man jedoch nicht zur Produktivitätssteigerung, sondern allenfalls zur Konstruktion von spielzeugartigen Automaten und zur Vorspiegelung von „Wundern“ ausnutzte. So beruht zum Beispiel der Effekt, daß sich beim Entzünden bzw. Löschen des Feuers auf einem Altar die Tempeltür scheinbar von selbst öffnet und schließt, auf dem Prinzip der Wärmeausdehnung erhitzter Luft und auf der abwechselnden Erzeugung von Über- und Unterdruck.
inszenierten Staatsreliefs dieser Zeit nehmen diese Produktionsszenen in der unverblümt drastischen Schilderung des Mahlvorgangs, des Teigknetens, Brotformens und -backens, der kontrollierenden Arbeitsanweisung, der kontrollierten Ausführung derselben als Zeugnisse des Alltags im Mühlen- und Bäckergewerbe einen unbestritten hohen Rang ein. Sie bezeugen aber auch, daß die plebejische Linie der Kunst, wie sie von R. Bianchi Bandinelli (1975, 43 ff) benannt worden ist, selbst in der augusteischen Zeit nicht abgerissen ist. Sie hat sich auch in den folgenden Jahrhunderten der römischen Kaiserzeit als entwicklungsträchtig und fruchtbar im Hinblick auf Alltagsdarstellungen erwiesen, auch wenn sie stets im Schatten der großen Ströme offizieller Staatskunst geblieben ist. Bester Literaturbeleg zur Beurteilung römischen Sensoriums für die Reize und Tükken, die Vielfalt und Buntheit des Alltags sind wohl unbestritten ⫺ unter dem erhaltenen Schrifttum ⫺ die Satiren des Horaz (65⫺ 27 v. Chr.). In unvergleichlicher Weise führt
973 er in Klein- und Feinmalerei alle möglichen Situationen des römischen Alltags vor, so zum Beispiel des Dichters Alltag in der Hauptstadt (I.6,110⫺128) oder den Alltag einer diplomatischen Reisegesellschaft auf der Strecke von Rom nach Brundisium im Frühjahr 37 v. Chr. Teil nahmen daran Maecenas, Vergil, Plotius Tucca, Heliodor und Horaz selbst. Ein faszinierendes Denkmal hat Horaz in der Satire I.8 einem nächtlichen Spuk in den Gärten des Maecenas auf dem Esquilin gesetzt. Das Ganze rankt sich um eine Priapus-Statue, an der sich zwei Frauen mit abergläubischen Praktiken zu schaffen machen. Am Ende ergreifen sie entsetzt die Flucht. Kann es darüber hinaus noch eine Steigerung der Intimauskunft geben, die hier nicht schon in den kleinsten Facetten eingefangen wäre? Zweifellos sind solche Höhepunkte der Alltagsschilderung ohne die Vorleistung der hellenistischen Dichtung kaum denkbar. Was Dichter wie z. B. Philodem (110⫺40/35) im 1. Jahrhundert v. Chr. dem römischen Publikum an exzellenter Situationsbeschreibung lyrisch präsentiert hatten, mußte reichlich Frucht bringen, die selbst bei dem Klassiker Horaz nichts an atemberaubender Brisanz eingebüßt hat. Philosophisch steht dahinter das wahrnehmungstheoretische Konzept des Epikureismus. Mit ihm eröffnete sich die ganze Breite der sinnlich erfahrbaren Lebenswelt. Lucretius Carus (um 96⫺55) hat diesen philosophischen Materialismus in seinem Werk De rerum natura („Über das Wesen der Dinge“) dichterisch einschmeichelnd verewigt. 3.4. Römische Kaiserzeit (1. bis 4. Jh. n. Chr.) Die Bild- und Literaturwerke der frühen Kaiserzeit schöpfen aus dem Spannungsbogen eines unter hellenistischen Einfluß geratenen Sensualismus und der auf Rationalität und Verallgemeinerungsfähigkeit basierenden Prinzipatsideologie der augusteischen Ära ihre einmalige Plastizität, zugleich Präzision und Transparenz. Die vormals großzügigen Bildentwürfe erstarren aber bald im Linearen, Dekorativen, Lehrhaften und vermitteln nur noch delikates Formen- und Bildungsgut. Am ausführlichsten hat diesen Prozeß die Wandmalerei festgehalten. Man vergleiche etwa die Odysseelandschaften vom Esquilin (vgl. Abb. 48.18; siehe auch Pfuhl 1923, III, 329 ff) aus dem 3. Viertel des 1. Jahrhunderts v. Chr. mit den auf dunklen Grund hingehaucht wirkenden Sakrallandschaften der schwarzen Wand aus der Villa Farnesina in Rom (vgl. Abb. 48.19; siehe auch Curtius
974
VII. Griechische und Römische Antike
Abb. 48.17: Vogeljagd und Fischfang. Etruskisches Wandgemälde in der Tomba della caccia e pesca in Tarquinia, um 510 v. Chr. (nach Pallottino 1952, 51). Tätigkeiten aus dem Alltag der Lebenden in den Gräbern der Toten darzustellen, war schon in der ägyptischen Kunst des 3. Jahrtausends v. Chr. üblich. Auch in etruskischen Grabmalereien seit dem 6. Jahrhundert v. Chr. finden sich derartige Themen. Dabei überwiegen Szenen, die sich auf das Leben der aristokratischen Oberschicht beziehen lassen: häufig Bankette, daneben auch Tänzer, Musikanten u. ä. Das Sujet des hier vorgestellten Bildes stammt dagegen aus dem Milieu der Fischer und Landleute; der aristokratische Grabinhaber wollte wohl seine Verbundenheit mit dem Landleben dokumentieren. Mit archaischer Erzählfreude wird der Vorgang des Fischens und der Vogeljagd detailreich, beinahe naiv, geschildert.
1929, 193) aus den Jahren um 20 v. Chr. Der Substanz- und Realitätsverlust der letzteren wird kaum durch den Zauber der Formalisierung und Spiritualisierung aufgewogen. Dabei handelt es sich bei den Garten- und Flußlandschaften der Farnesina durchaus um Szenen ländlichen Alltags, freilich gedämpft durch die Atmosphäre sakraler Hantierungen und Rituale. Ähnliche Kompositionen, die sich in dieser Zeit offenbar großer Beliebtheit erfreuten, sind, in Stuckrelief gefertigt, gleichfalls in der Villa Farnesina als Gewölbedekoration erhalten (Kähler 1958, Taf. 99; Kraus 1967, Abb. 158 und 159). Handfester nehmen sich Handwerkerszenen aus, die zahlreich in der pompejanischen Wandmalerei des 1. Jahrhunderts n. Chr. erhalten sind, etwa Marktszenen, Brotverkauf, Dienstleistung u. a. (Maiuri 1953, 139 ff). Aber auch sie unterliegen gelegentlich, zur Ausgestaltung dekorativer Wandfriese, der Verniedlichung durch Besetzung des Szenariums mit Putten (Amoretten), die alle möglichen Gewerbe durchspielen; sie sind dargestellt als Tuchmacher oder Parfümhersteller, beim Weinabfüllen und -probieren (Curtius 1929, 141 und 143).
Reich ist auch das Bildrepertoire auf Grabsteinen, das sich oft kürzelhaft auf Alltäglichkeiten, Lieblingsbeschäftigungen des verewigten Toten, bezieht (Ausritt, Jagd, Arena, Feldbau, Wagen- und Schiffahrt) (Fitz 1970, Abb. 58 und 67). Diese Bildauskünfte, die den Alltag streiflichthaft antippen, reichen im Prinzip bis in die klassisch-griechische Zeit zurück, werden dort mitunter im beigefügten Grabgedicht in wenigen Zeilen paraphrasiert (vgl. Peek 1960). Allerdings gelangen diese Lebensbilder griechischer Intention zu schicksalhafter Vertiefung, indem die Beiläufigkeit, ja Zufälligkeit der aufgezeigten Situation im Vorgriff auf die Jenseitigkeit transzendiert wird. In den Alltag bricht dann ein anderes Zeitmaß ein, es wird eine die Räumlichkeit außer Kraft setzende Transparenz spürbar. Solche Qualitätssteigerungen bleiben allerdings den klassischen Jahrhunderten vorbehalten. Sie setzen klassisches Zeit- und Raummaß voraus. Die Römer haben solche Prognostik, solche Auspizien, bildhaft handfester begriffen, eher nur attributiv angedeutet. Komplettiert werden derartige Auskünfte oft durch Inschriften. Aber auch hier domi-
975
48. Zeichenkonzeptionen im Alltagsleben
Abb. 48.18: Odysseus und seine Gefährten im Land der Laistrygonen. Wandgemälde aus einem Haus auf dem Esquilin in Rom. Höhe 1,16 m, um 40⫺30 v. Chr. Rom, Biblioteca Vaticana (nach Maiuri 1953, 33). Die Abbildung zeigt eines der wenigen antiken Gemälde, die man ohne Einschränkung als Landschaftsdarstellungen bezeichnen kann; die agierenden Personen erscheinen dem Raumkontinuum untergeordnet. Die Szene am linken Bildrand könnte an eine Schäferidylle denken lassen, tatsächlich aber bereitet sich ein grausames Geschehen vor: Die Laistrygonen, menschenfressende Riesen, suchen Waffen zusammen, um die Schiffe des Odysseus zu vernichten und seine Gefährten zu töten. Das Bild, dessen Gestaltung unmittelbarer Beobachtung zu entstammen scheint, ist in Wahrheit ein Produkt literarischer Bildung: Es hat einen Mythos zum Thema und illustriert eine Passage aus Homers Odyssee (10, 77⫺132).
niert das Prinzip der sparsamen Andeutung, oft der formelhaften Verkürzung (Geist und Pfohl 1976). Erhalten sind auch qualitätvolle Reliefbilder, die zum Beispiel den Feierabend eines heimkehrenden Bauern (München), Bauleute bei der Bedienung eines Hebebaums (Rom, Museo Profano Lateranense), Ladenbesitzer beim Verkauf von Tuchen (Florenz; vgl. Abb. 48.20) zeigen. Hier handelt es sich wie in der Wandmalerei um ausgesprochene Alltagsbilder, die die Spezifik des dargestellten Metiers mit der für die Römer unentbehrlichen Realistik festzuhalten versuchen. Man muß mit einer Vielzahl solcher Bilder, bis hin zur Fertigung von Firmenschildern in dieser Art, für die Kaiserzeit rechnen, deren Produktionskapazität ⫺ wie allein schon die römischen Großbauten beweisen ⫺ sprunghaft gestiegen war und allgemeinen Wohlstand hervorgebracht hatte. Den Sättigungsgrad der Kultur spiegelt wohl am besten die Literatur wider. Man muß sich nur an das Oeuvre eines Lukian
(um 120 bis nach 180) halten, um sich von dem Verfügungs- und Bildungsreichtum, dem ausgeweiteten Kulturhorizont des bewohnten Erdkreises, der da überall hereinspielt, eine angemessene Vorstellung zu machen. Auch die Welt des Alltags ist durch den Griffel dieses wohl talentiertesten Spötters der Antike mit aufgespießt worden. Daneben wird ländlicher Alltag als Kehrseite des ausufernden und sich abnutzenden Urbanisierungsprozesses schon seit der mittleren Kaiserzeit als heilbringende und zukunftsträchtige Utopie angepriesen, etwa in der euböischen Novelle (Euboikos) des Dio Chrysostomus (um 40 bis um 120). Am bekanntesten ist unter diesem Aspekt die Erzählung des Dichters Longus von Daphnis und Chloe. Sie gehört gleichfalls dem 2. Jahrhundert n. Chr. an. In ihr wachsen die titelgebenden Romanhelden in ländlicher Abgeschiedenheit auf. Liebevoll wird der Hirtenalltag geschildert. Auch hier hat der Hellenismus vorgearbeitet. In Theokrits Hirtendichtung scheinen diese Idyllen vorgeprägt. Ver-
976
VII. Griechische und Römische Antike
Abb. 48.19: Wanddekoration mit Sakrallandschaften aus dem „Schwarzen Oecus“ der Villa Farnesina in Rom. Höhe etwa 1,85 m, um 19 v. Chr. Rom, Museo Nazionale Romano (nach Kraus 1967, Taf. 126). Die wie hingehaucht wirkende Szenerie dieser Landschaftsdarstellung augusteischer Zeit ist ganz ihrer dekorativen Funktion untergeordnet. Inmitten von Tempeln, Toren und Götterstatuen sind Menschen mit Kulthandlungen und ländlichen Arbeiten beschäftigt. Ein Bild paradiesischen Friedens, Ausdruck der Herrschaftspropaganda des ersten Kaisers Augustus: Die römische Ordnungsmacht sichert einer befriedeten Welt Wohlstand und Glück.
gils Eklogen (Hirtengedichte) stehen dazwischen. Sie bezeugen schon für die frühe Kaiserzeit den Hang zur Erneuerung in alternativer Szene. Provinzialrömische Kunst der Kaiserzeit hat eine Fülle von Alltagsbildern beschert, die das Schaffen und Treiben des einfachen Mannes, aber auch die Aktivitäten und Geschäfte des Mittelstandes festhalten. Das Denkmal von Neumagen (bei Trier) aus dem 2./3. Jahrhundert n. Chr. überliefert auf Reliefs vorzüglicher Qualität Szenen aus dem Schulhaus (vgl. Art. 42, Fig. 42.6), der Eintreibung von Pachtgeldern, der Schiffahrt auf der Mosel (Kähler 1958, Taf. 243; Kraus 1967, Abb. 230 b). Auf den Reliefs der Igler Säule, einem Grabmal aus der Mitte des 3. Jahrhunderts n. Chr., gleichfalls in der Nähe von Trier, gewinnen wir Einblick in die Küche, sodann in die Zurüstung eines Mahles im Herrenhaus, erleben die Abführung des
Zehnten (Kähler 1958, Taf. 243). Dem Sachbezug solcher Berichte im Bild ist übrigens auch zu verdanken, daß wir von dem Gebrauch einer Mähmaschine eine Vorstellung haben: Zwei in Gallien gefundene Reliefs lassen sich zu einem Ganzen zusammenfügen (Müller 1978, 323). Übrigens könnte ein solcher in der Landwirtschaft verwendeter Sichelwagen von ähnlich konstruierten Verteidigungsmaschinen abgeleitet worden sein, wie sie etwa auf der Trajanssäule bezeugt sind (Florescu 1969, Taf. 97). 3.5. Militärischer und kaiserlicher Alltag Unsere Kenntnisse römischen Militärwesens würden nicht so reichhaltig sein, wenn nicht die Bildhauer mit dem Sinn fürs Detail auf dieser Spezialstrecke alle möglichen Situationen, Geräte, Ausrüstungen, Waffen ins Bild gesetzt hätten. Der im Sinne römischer Spezifizierung verstandene militärische Alltag hat
977
48. Zeichenkonzeptionen im Alltagsleben
Abb. 48.20: Marmorrelief mit Darstellung eines Tuchladens. Höhe 48 cm, um 40⫺50 n. Chr. Florenz, Galleria degli Uffizi (nach Technau 1940, Abb. 109). Das Relief, wohl der Grabstein eines Tuchhändlers, gibt in nüchtern-realistischer Weise eine Szene aus dem städtischen Alltag wieder. Zwei Verkäufer präsentieren ihre Ware, die von dem auf einer Bank sitzenden Käuferpaar zurückhaltend-kritisch begutachtet wird. Drei weitere Personen stehen an den Seiten und im Hintergrund des Raumes, dessen merkantile Funktion durch die an einer Stange aufgehängten Bänder, Stoffe und Kissen dem Betrachter unmißverständlich vor Augen geführt wird.
seine grandioseste bildkünstlerische Ausformung auf den Ehrensäulen des Kaisers Trajan (reg. 98⫺117) und des Kaisers Marcus Aurelius (reg. 161⫺180) erfahren. Die Reliefs der Trajanssäule, die seit dem Jahre 113 n. Chr. das Trajansforum bekrönte, winden sich spiralig in 200 m Länge als fortlaufender Bildfries (Bildhöhe um 1 m) am Schaft der aus parischen Marmortrommeln zusammengesetzten Säule nach oben. Auf ihnen sind die beiden unter Trajan gegen die Daker geführten Kriege (101⫺102 und 105⫺106) bildlich dokumentiert. Es wird vermutet, daß diesem einzigartigen Bildbericht die Kriegschronik des Kaisers zugrunde gelegt worden ist (vgl. Abb. 48.21). Die Reliefs geben ausführliche Information über die Spezifik des militärischen Alltags (Kähler 1958, Taf. 175⫺179; Florescu 1969): Wir erleben Truppen beim Marsch, beim Brücken- und Straßenbau, beim Errichten von Stationen und Lagern, beim Transport von Heeresgut und Verpflegung, in den verschiedensten Lagen des Angriffs und der Verteidigung, bei der Belobigung und Auszeichnung durch den Kaiser, beim Triumph, ja sogar beim Sterben. Das
alles sind exzellente Streiflichter aus dem Alltag des Soldaten. Auf der Marc-Aurel-Säule in Rom, entstanden etwa um 180 n. Chr., ist die Palette der Berichterstattung zurückgedämmt, dafür die Skala emphatischer Ausdruckssteigerung ausgeweitet (vgl. Abb. 48.22). Allerdings kündigt sich streckenweise auch schon die Monotonisierung der Stilmittel an, jene spätantike Abstraktion, wie sie dann an den zeitgenössischen Reliefs des Konstantinsbogens (Giuliano 1955, Abb. 30⫺44; Kähler 1958, Taf. 262) anzutreffen ist. Die kürzelhafte Vereinfachung der Darstellungsweise, wie sie auch auf den Sarkophagreliefs und in der Katakombenmalerei Roms begegnet, signalisiert Tendenzen des Übergangs zur Spätantike. Mit der Vereinfachung des Formenaufwands, der freilich nicht für alle Gattungen gleichermaßen zutrifft ⫺ die Toreutik etwa verharrt in anspruchsvolleren Traditionen ⫺ geht eine symbolhafte Vertiefung der Semantik einher, in der sich die Durchdringung heidnischer Darstellungsobjekte mit christlichem Ideengehalt in dem Sinne vollzieht, daß alles Zeitliche nur ein Gleichnis des Ewigen ist. Auch
978
VII. Griechische und Römische Antike
Abb. 48.21: Schlachtszene. Relief von der Trajanssäule in Rom (Ausschnitt). Marmor. Höhe des Reliefbandes 90 cm⫺1,25 m, 113 n. Chr. (nach Kraus 1967, Taf. 206). Ein dichtes Figurengewühl läßt die Dramatik des hier dargestellten Kampfes zwischen Dakern und römischen Hilfstruppen erahnen. Bei genauerem Hinsehen löst sich das Ganze in einzelne Gruppen auf, die verschiedene Stadien des blutigen Geschehens verdeutlichen. Links bedrängt ein Römer einen ins Knie gesunkenen Barbaren, daneben schlagen zwei Gegner weit ausholend mit ihren Schwertern aufeinander ein, rechts versetzt ein Römer dem mit abwehrend erhobenem Arm zu ihm aufblickenden Feind den Todesstoß. Die Körper Gefallener und Verwundeter bedecken den Boden. Gestikulierend eilt im Hintergrund eine Gruppe Daker vorüber.
das Alltagsbild gerät unter diesen Aspekt sich wandelnder Bedeutung. Aufwertung erfährt vor allem die Darstellung des guten Hirten als Metapher für den Heiland der Welt. An dem in den Jahren 312⫺315 erbauten Konstantinsbogen in Rom, der das Ende der Antike, zugleich den Beginn der Spätantike markiert, sind wie in einem Brennpunkt die Leistungen der Reliefkunst aus der mittleren bis späteren Kaiserzeit versammelt. Es sind Spolienreliefs (aus anderem Bauzusammenhang gerissene Reliefs) aus trajanischer, hadrianischer und antoninischer Zeit, die von den schmaleren Bildstreifen konstantinischer Zeit begleitet sind. Die antoninischen Platten lassen sich einem Ehrenbogen Marc Aurels zuweisen. Sie zeigen den Kaiser ⫺ meist in bildbeherrschender Stellung ⫺ in jeweils spezifischem Handlungskontext (Giuliano 1955,
Abb. 17⫺24; Oppermann 1985, Abb. 32⫺ 42): so beim Ausmarsch, beim Reinigungsopfer, bei der Ansprache an die Soldaten, bei der Unterwerfung der Barbaren (vgl. Abb. 48.23), bei der Vorführung der Gefangenen, bei der Verhandlung mit Barbarenfürsten, bei der Einsetzung von Klientelfürsten, bei der Rückkunft, beim Triumph, beim Opfer auf dem Kapitol, bei der Spende an das Volk. Sicher ist es ein Wagnis, diese Reliefs als Darstellungen des kaiserlichen Alltags anzusprechen. Aber im römischen Sinne ist es der Arbeitsalltag des Kaisers, der unter den verschiedensten Aspekten hier vorgeführt wird. Es ist ein eingeübtes Darstellungsprogramm, das schon auf früherer Stufe, etwa am Trajansbogen in Benevent (Simon 1981 b; Oppermann 1985, Abb. 15⫺28), ähnlich abgehandelt worden ist. Auch auf der Trajans-
979
48. Zeichenkonzeptionen im Alltagsleben
Abb. 48.22: Hinrichtung von Markomannen. Relief von der Marc-Aurel-Säule in Rom (Ausschnitt). Marmor. Höhe des Reliefbandes etwa 1,30 m, um 180 n. Chr. (nach Kähler 1958, Taf. 220). Die Enthauptung gefangener germanischer Verschwörer durch ihre eigenen Landsleute unter der Aufsicht berittener römischer Soldaten: das Relief zeigt eine besonders grausame Szene aus den Markomannenkriegen des Kaisers Marc Aurel. Die teilweise zu beobachtende Monotonie der Körpermotive, der Gleichklang der Bewegungen, die Beschränkung auf das Wesentliche in der Figurenwiedergabe verleihen der Darstellung eine große dramatische Wucht. Auf jedes räumlich-landschaftliche Detail ist verzichtet. Der am Boden liegende, vom Rumpf getrennte Kopf deutet unmißverständlich das Schicksal an, das die herangeführten Delinquenten, einen nach dem anderen, ereilen wird.
säule sind die Auftritte des Kaisers in eine bestimmte Typologie der kaiserlichen Repräsentation eingebunden (vgl. Gauer 1977). Andererseits muß natürlich berücksichtigt werden, daß eine solche Betrachtungsweise eingeschränkt wird durch den römischen Dokumentationssinn, der die einzelnen Begebenheiten eben auch mit Bezug auf ihre historisch-kalendarische Fixierung abgebildet wissen will. So gesehen sind wir nicht immer in der Lage, eindeutig zu entscheiden, ob diese historischen Bezugspunkte auszumachen oder in der alltäglichen Verallgemeinerung verschliffen sind. Werfen wir unter diesem Gesichtspunkt einen letzten Blick auf die zeitgenössischen Reliefs am Konstantinsbogen (vgl. Abb. 48.24; siehe auch Giuliano 1955, Abb. 30⫺44). Es fällt auf, daß der Kaiser bei aller zentralen Positionierung in der monotonen Figurenreihe des Bildkontexts reichlich zurücktritt. Er muß sich dem spätantiken Uniformie-
rungszwang bis zu einem gewissen Grade beugen. Das leitet sich von dem Gleichberechtigungskonzept christlicher Auffassung her. Es schließt andererseits die Hervorhebung der kaiserlichen Stellung als „dominus et deus“ (‘Herr und Gott’) nicht aus. Auch hier sind die Mittel, dieses zu bewerkstelligen, eher sparsam. Die Bezeichnung und Durchzeichnung der neuen Lebenswelt, die zum Sieg des Christentums geführt hat, steht in diesem Spannungsfeld, indem sie nämlich einmal der Gleichstellung vor Gott Rechnung zu tragen, andererseits dem nunmehr unverrückbar festgelegten System der gesellschaftlichen Ränge zu entsprechen hat. Unter beiden Gesichtspunkten erscheint die Bewegungsfreiheit des Individuums gegenüber seiner vormaligen Flexibilität abgebaut, ja negiert. Das ist das untrügliche Merkmal spätantiker Zwangsstaatlichkeit. Es ist das Zeichen des Endes der Antike (zur Zeichensprache der Kaisermacht in Byzanz vgl. Art. 60 § 3.2.).
980
VII. Griechische und Römische Antike
Abb. 48.23: Kaiser Marc Aurel mit unterworfenen Barbaren. Marmorrelief von einem Ehrenbogen des Kaisers. Höhe 3,12 m, 176 n. Chr. Rom, Palazzo dei Conservatori (nach Technau 1940, Abb. 180). Die Rache an dem besiegten Gegner, wie sie Abb. 48.22 zeigt, war nur eine Seite des Verhältnisses zwischen Römern und Barbaren von mehreren, die in der offiziellen Kunst dargestellt wurden. Eine andere war die Milde („clementia“), eine der in Wort und Bild immer wieder propagierten kanonischen Staatstugenden des Herrschers. Auf dem Relief im Konservatorenpalast haben sich zwei Germanenfürsten vor dem herbeireitenden Kaiser auf die Knie geworfen und erflehen mit erhobenen Händen Gnade, die ihnen dieser mit huldvoll ausgestrecktem Arm (Handhaltung allerdings falsch ergänzt) gewährt. Die beredten Gesten des Siegers und der Besiegten sind vom Künstler absichtsvoll ins Zentrum der Komposition gerückt.
Abb. 48.24: Spendenverteilung durch Kaiser Konstantin I. Marmorrelief vom Konstantinsbogen in Rom (Ausschnitt). Höhe 1,02 m, zwischen 312 und 315 n. Chr. (nach Kraus 1967, Taf. 253 a). In strenger Frontalität sitzt der Kaiser auf seinem Thron. Auf gleicher Höhe mit seinem (heute verlorenen) Kopf erscheinen die Köpfe der Senatoren, die sich ihm von beiden Seiten her zuneigen. In der unteren Bildzone sind Angehörige des Volkes von Rom zu sehen, mit weit in den Nacken gelegten Köpfen zu dem Kaiser aufblickend. Dieser hält in den vorgestreckten Händen, mehr präsentierend als agierend, eine Schriftrolle und die Tabula mit den Geldstücken für die Spende. Angesichts der kargen, aufs Wesentlichste reduzierten, monotonen Bildsprache erscheinen die Bewegungen und Gesten nur um so ausdrucksvoller.
48. Zeichenkonzeptionen im Alltagsleben
4.
Literatur (in Auswahl)
4.1. Quellen Archilochos von Paros. Archiloque. Ed. A. Bonnard, F. Lasserre. Paris: Les Belles Lettres 1958. Archilochus. Griechisch und deutsch. Hrsg. und übersetzt von Max Treu. München: Heimeran 2 1979. [⫽ Tusculum.] Dio Chrysostomus. Dionis Prusaensis quem vocant Chrysostomum quae exstant omnia. Edidit apparatu critico instruxit Johannes de Arnim. Berlin: Weidmann 21962. Dio Chrysostomus, Werke. Deutsch von W. Elliger. Zürich und München: Artemis 1967. Euripides. Euripide. Texte e´tabli et trad. par Louis Me´ridier et al. Paris: Les Belles Lettres 1925⫺1983. [⫽ Collection des Universite´s de France.] Euripides, Werke in drei Bänden. Aus dem Griechischen übertragen, eingeleitet und erläutert von Dietrich Ebener. Berlin und Weimar: Aufbau-Verlag 1966. [⫽ Bibliothek der Antike. Griechische Reihe.] Herodot. Herodoti Historiae. Recognovit brevique adnotatione critica instruxit Carolus Hude. Oxford: Clarendon Press 31957⫺58. [⫽ Scriptorum classicorum Bibliotheca Oxoniensis.] Herodot, Historien. 2 Bde. Griechisch und deutsch. Hrsg. von Josef Felix. Zürich und München: Artemis 41988. [⫽ Tusculum.] Hesiod. Hesiodi Opera et dies. Rec. Aristides Colonna. Mailand usw.: Istituto editoriale Cisalpino 1959. [⫽ Testi e documenti per lo studio dell’antichita`.] Hesiod, Theogonie/Erga. Griechisch und deutsch. Hrsg. und übersetzt von Albert von Schirnding. Mit einer Einführung, Erläuterungen und Literaturhinweisen von Ernst Günther Schmidt. Zürich und München: Artemis 1991. [⫽ Tusculum.] Homer. Opera, recogn. brevique adn. crit. instr. D. B. Monro et Th. W. Allen. Oxford: Oxford University Press 21916. [⫽ Scriptorum classicorum Bibliotheca Oxoniensis.] Homer, Ilias. Griechisch und deutsch. Hrsg. von H. Rupe´. Zürich und München: Artemis 91989. [⫽ Tusculum.] Homer, Odyssee. Griechisch und deutsch. Hrsg. von A. Weiher. Zürich und München: Artemis 9 1990. [⫽ Tusculum.] Horaz. Quinti Horati Flacci Opera. Tertium recognovit Fridericus Klingner. Leipzig: Teubner 1959. [⫽ Academia Scientiarum Germanica Berolinensis. Bibliotheca Scriptorum Graecorum et Romanorum Teubneriana.] Horaz, Sämtliche Werke. Lateinisch und deutsch. Hrsg. von Hans Färber und Wilhelm Schöne. Zürich und München: Artemis 101985. [⫽ Tusculum.] Longos, Hirtengeschichten von Daphnis und Chloe. [Pastoralia.] Griechisch und deutsch von Otto
981 Schönberger. Berlin: Akademie-Verlag 1960. [⫽ Schriften und Quellen der Alten Welt.] Lukian. Luciani Opera. Recogn. brevique adnotatione critica instruxit M. D. Macleod. Oxford: Clarendon Press 1972⫺1980. [⫽ Scriptorum classicorum Bibliotheca Oxoniensis.] Lukian, Die Hauptwerke. Griechisch und deutsch. Hrsg. von Karl Mras. Zürich und München: Artemis 21980. [⫽ Tusculum.] Lukrez. Titi Lucreti Cari De rerum natura libri sex. Conradus Müller rec. et adnotavit. Zürich: Rohr 1975. Lukrez, Welt aus Atomen. De rerum natura. Lateinisch und deutsch. Eingeleitet und übersetzt von Karl Büchner. Zürich: Artemis 1956. [⫽ Bibliothek der Alten Welt. Römische Reihe.] Lukrez, Werke. Deutsch von J. Martin. Berlin: de Gruyter 1972. Menander. Menandri quae supersunt. Ed. Alfredus Körte. Leipzig: Teubner 1957. Menander, Stücke. Deutsch von Kurt und Ursula Treu. Leipzig: Teubner 1975. Menander. Herondas, Werke in einem Band. Aus dem Griechischen von Kurt und Ursula Treu. Berlin und Weimar: Aufbau-Verlag 1980. [⫽ Bibliothek der Antike. Griechische Reihe.] Platon, Oeuvres comple`tes. Texte e´tabli et trad. par Maurice Croiset et al. Paris: Les Belles Lettres 1953 ff. [⫽ Collection des Universite´s de France.] Platon, Werke in acht Bänden. Griechisch und deutsch. Hrsg. von Gunter Eigler. Darmstadt: Wissenschaftliche Buchgesellschaft 1970⫺1981. (Der griechische Text dieser Ausgabe folgt dem der französischen; die deutsche Übersetzung ist die Schleiermachers, die vom jeweiligen Bandherausgeber kommentiert wird.) Plautus. Plaute, Come´dies. Texte etabli et trad. par Alfred Ernout. Paris: Les Belles Lettres 1932⫺ 1940. [⫽ Collection des Universite´s de France.] Plautus. Die Lustspiele des Plautus. 3 Bde. Dt. in den Versmaßen der Urschrift von Johann Jacob Christian Donner. Leipzig und Heidelberg: Winter 1864⫺1865. (Vgl. auch die zweite Literaturangabe zu Terenz!) Plutarch. Plutarchi Vitae parallelae. Recognovit Cl. Lindskog et K. Ziegler. Leipzig: Teubner 1914⫺ 1939. 21957 ff. [⫽ Bibliotheca scriptorum Graecorum et Romanorum.] Plutarch, Parallele Lebensbeschreibungen. 6 Bde. Eingeleitet und übersetzt von Konrad Ziegler. Zürich und Stuttgart: Artemis 1954⫺65. Pythagoras. Kranz, Walter (Hrsg.), Die Fragmente der Vorsokratiker. Griechisch und deutsch von Hermann Diels. 12., unveränd. Auflage. Zürich und Dublin: Weidmann 1966⫺1967. Darin: Bd. I. Nr. 14. (⫽ S. 96⫺105.) Sappho. Poetarum lesbiorum fragmenta. Ed. E. Lobel et D. L. Page. Oxford: Clarendon Press 1955.
982 [⫽ Scriptorum classicorum Bibliotheca Oxoniensis.] Sappho, Lieder. Griechisch und deutsch. Hrsg. von Max Treu. Zürich und München: Artemis 1991. [⫽ Tusculum.] Solon. Text, Kommentar und engl. Übersetzung der Gedichte in: Ivan M. Linforth: Solon the Athenian. 1919. Berkeley: University of California Press. S. 103⫺245. Terenz. Te´rence. Texte e´tabli et trad. par Jules Marouzeau. Paris: Les Belles Lettres 1963⫺1966. [⫽ Collection des Universite´s de France.]
VII. Griechische und Römische Antike Fitz, Jenö (1970), Gorsium. Sze´kesfehe´rva´r. Florescu, Florea Bobu (1969), Die Trajanssäule. Grundfragen und Tafeln. Bukarest und Bonn. Gauer, Werner (1977), Untersuchungen zur Trajanssäule I: Darstellungsprogramm und künstlerischer Entwurf. Berlin. Geist, Hieronymus und Gerhard Pfohl (1976), Römische Grabinschriften. Gesammelt und übersetzt von H. Geist, betreut von G. Pfohl. 2. Auflage. München. Giuliano, Antonio (1955), Arco di Costantino. Mailand.
Terenz, Antike Komödien. Plautus. Terenz. Hrsg. und mit einem Nachwort versehen von Walter Ludwig. (Plautus in einer grundlegenden Neubearbeitung der Übersetzung von Wilhelm Binder durch Walter Ludwig. Terenz in der Übertragung von J. J. C. Donner). Darmstadt: Wissenschaftliche Buchgesellschaft 1969.
Hampe, Roland (1952), Die Gleichnisse Homers und die Bildkunst seiner Zeit. Tübingen.
Theokrit. Theocritos. Ed. with a translation and commentary by Andrew Sydenham Farrar Gow. Cambridge: Cambridge University Press 1950.
Kähler, Heinz (1958), Rom und seine Welt. Bilder zur Geschichte und Kultur. München.
Theokrit, Werke. Griechisch und deutsch. Ed. F. P. Fritz. München: Heimeran 1970. [⫽ Tusculum.] Theokrit, Sämtliche Dichtungen. Hrsg. und übersetzt von Dietrich Ebener. Leipzig: Teubner 1973. Vergil. Publi Vergili Maronis Opera. Recogn. brevique adnotatione critica instruxit R. A. B. Mynors. Oxford: Clarendon Press 1972. [⫽ Scriptorum classicorum Bibliotheca Oxoniensis.] Vergil, Aeneis. Lateinisch-Deutsch. In Zusammenarbeit mit Maria Götte hrsg. und übersetzt von Johannes Götte. München und Zürich: Artemis und Winkler 71988. [⫽ Tusculum.] Vergil, Landleben (Catalepton; Bucolica; Georgica). Lateinisch und deutsch hrsg. von Karl Bayer. München und Zürich: Artemis und Winkler 51987. [⫽ Tusculum.]
4.2. Sekundärliteratur Arias, Paolo Enrico und Max Hirmer (1960), Tausend Jahre griechische Vasenkunst. München. Arias, Paolo Enrico (1962), A History of Greek Vase Painting. London. Be´rard, Claude et al. (1985), Die Bilderwelt der Griechen: Schlüssel zu einer „fremden“ Kultur (Kulturgeschichte der antiken Welt 31). Mainz. Bianchi Bandinelli, Ranuccio (1975), Die römische Kunst. Von den Anfängen bis zum Ende der Antike. München. Burford, Alison (1985), Künstler und Handwerker in Griechenland und Rom (Kulturgeschichte der antiken Welt 24). Mainz.
Hampe, Roland und Erika Simon (1980), Tausend Jahre frühgriechische Kunst. München. Himmelmann-Wildschütz, Nikolaus (1964), Bemerkungen zur geometrischen Plastik. Berlin.
Karouzou, Semni (1956), The Amasis Painter. Oxford. Kraus, Theodor (1967), Das römische Weltreich (Propyläen Kunstgeschichte Bd. 2). Berlin. Maiuri, Amadeo (1953), La peinture romaine. Aus dem Italienischen übersetzt von R. Skino-Venturi. Genf. Mansuelli, Guido A. (1958), Galleria degli Uffizi. Le sculture, Bd. 1. Rom. Müller, Reimar (ed.) (1978), Kulturgeschichte der Antike. Bd. 2: Rom. Berlin. Musiolek, Peter und Wolfgang Schindler (1980), Klassisches Athen. Leipzig. Oppermann, Manfred (1985), Römische Kaiserreliefs. Leipzig. Pallottino, Massimo (1952), Etruscan Painting. Geneva. Peek, Werner (1960), Griechische Grabgedichte. Griechisch u. deutsch von W. Peek (Schriften und Quellen der Alten Welt, hrsg. von der Sektion für Altertumswissenschaften. Deutsche Akademie der Wissenschaften zu Berlin). Berlin. Pfuhl, Ernst (1923), Malerei und Zeichnung der Griechen. München. Richter, Gisela Marie Augusta (1953), Corpus vasorum antiquorum: USA. Fasc. 11 (New York, Metropolitan Museum, 2). Cambridge MA. Schefold, Karl (1967), Die Griechen und ihre Nachbarn (Propyläen Kunstgeschichte Bd. 1). Berlin.
Burow, Johannes (1989), Der Antimenesmaler (Kerameus 7). Mainz.
Schindler, Wolfgang (1974), „Bemerkungen zu Bernhard Schweitzers ‘Mythische Hochzeiten’ ⫺ Eine Interpretation des Bildkreises an dem Epinetron des Eretriameisters“. Klio 56: 229⫺232.
Curtius, Ludwig (1929), Die Wandmalerei Pompejis. Eine Einführung in ihr Verständnis. Leipzig.
Schindler, Wolfgang (1987), Mythos und Wirklichkeit in der Antike. Leipzig.
48. Zeichenkonzeptionen im Alltagsleben Schindler, Wolfgang (1991 a), „New Evidence for the Trojan War“. E´tudes et travaux 15: 364⫺370. Schindler, Wolfgang (1991 b), „Mythos als Massenkommunikationsmittel in der griechischen Antike“. Ästhetik und Kommunikation 20: 122⫺126. Simon, Erika (1981 a), Die griechischen Vasen. 2. Aufl. München. Simon, Erika (1981 b), Die Götter am Trajansbogen zu Benevent (Trierer Winckelmannsprogramme Heft 1/2, 1979/80). Mainz.
983 Technau, Werner (1940), Die Kunst der Römer (Geschichte der Kunst. Altertum). Berlin. Trendall, Arthur D. (1990), Rotfigurige Vasen aus Unteritalien und Sizilien ⫺ Ein Handbuch (Kulturgeschichte der antiken Welt Bd. 47). Mainz.
Wolfgang Schindler † und Detlef Rößler, Berlin (Deutschland)
VIII. Geschichte der abendländischen Semiotik III: Das Mittelalter History of Western Semiotics III: The Middle Ages 49. Zeichenkonzeptionen in der Philosophie des lateinischen Mittelalters 1. Einleitung und Überblick 2. Verbindungsstellen zwischen antiker und mittelalterlicher Zeichentheorie 2.1. Augustinus (354⫺430) 2.2. Boethius (480⫺528) 3. Anselm von Canterbury (1033⫺1109) 4. Pierre Abaelard (1079⫺1142) 5. Die terministische Logik 6. Die grammatica speculativa 7. Zeichenkonzeptionen in der Ethik 8. Die Entstehung einer ausgebildeten Zeichentheorie in der 2. Hälfte des 13. Jahrhunderts 8.1. Pseudo-Kilwardby (nach 1230 bis vor 1270) 8.2. Roger Bacon (ca. 1214⫺ca. 1293) 9. Die geistigen Begriffe als Zeichen 10. Präsenz und Repräsentation in der mittelalterlichen Theorie der Erkenntnis 11. Das Zeichen als zentraler Begriff der Logik des 14. Jahrhunderts ⫺ Wilhelm von Ockham (ca. 1285⫺1347/49) 11.1. Oratio mentalis und oratio vocalis 11.2. Die Konsequenzen des logischen Zeichenbegriffs 12. Zeichenkonzeptionen in der scholastischen Philosophie des 15. und frühen 16. Jahrhunderts 12.1. Die Bestimmung des terminologischen Feldes von signum, significare und repraesentare 12.2. Die Strukturierung des Begriffsfeldes von significare und repraesentare 12.3. Die Termini 13. Nicolaus Cusanus (1401⫺64) 14. Zusammenfassung 15. Literatur (in Auswahl)
1.
Einleitung und Überblick
Nicht selten verbindet sich die Rede von „Mittelalter und Zeichen“ mit der klischeehaften Vorstellung eines ganz und gar in einem „symbolischen“ Weltbild befangenen Mittelalters. Zwar ist eine solche, im frühen Mittelalter verbreitete, „symbolische Weltsicht“, in der „alles Zeichen, Symbol oder
Allegorie ist“ (Biard 1989, 10 f) auch in späterer Zeit noch anzutreffen, dann jedoch fast ausschließlich im Rahmen der symbolischen Theologie und der Theorie der Interpretation der Hl. Schrift. Nach der besonders von der Viktorinerschule im 12. Jahrhundert ausgearbeiteten Theorie der Bibelexegese ist es eben das Charakteristikum der Hl. Schrift, daß in ihr nicht allein die Wörter vermittels der Begriffe Dinge bezeichnen („voces tantum mediantibus intellectibus res significant“; Speculum ecclesiae, vgl. Ohly 1958 ⫽ 1977, 4 f), sondern daß auch die so bezeichneten Dinge selbst symbolische Zeichen für andere Dinge sind („ipsae res alias res significant“; ebd.). Dieses hermeneutische Modell bildet die Grundlage für die Annahme eines umfassenden symbolischen Zusammenhangs der Dinge, in welchem diese als von Gott eingesetzte Zeichen fungieren (vgl. Art. 33 § 4.1. und Art. 59 § 1.). Die „significatio rerum“, d. h. die von den Dingen geleistete Bezeichnung, übertrifft dabei die durch menschlichen Gebrauch eingesetzte Bedeutung der Wörter sowohl an Dignität („in sacra pagina excellentior valde est rerum significatio quam vocum“; Hugo von St. Victor, De scripturis et scriptoribus sacris, cap. 14) als auch an Prägnanz. Denn die Dinge haben, anders als die sprachlichen Ausdrücke, nicht lediglich zwei oder drei Bedeutungen, sondern ebensoviele, wie sie Qualitäten besitzen („voces non plus quam duas aut tres habent significationes. Res autem tot possunt habere significationes quot habent proprietates“; Richard von St. Victor, Excerptiones II, 5; vgl. Ohly 1958 ⫽ 1977, 6). Ein solcher „symbolischer Kosmos“ indes ist weder repräsentativ für „das“ Mittelalter, noch ist er allein im Mittelalter zu finden. Denn zum einen verbannt die scholastische Philosophie, die eine durchaus rationale Theorie des Zeichens und seiner Funktionen ausbildet, das symbolisch-allego-
49. Zeichenkonzeptionen in der Philosophie
rische Denken an die Ränder des philosophischen Diskurses. Und zum anderen wird gerade in der frühen Neuzeit ⫺ und in ausdrücklicher Opposition zur scholastischen Philosophie ⫺ im Umkreis der hermetischplatonischen Naturphilosophie das Konzept eines umfassenden innerweltlichen Symbolzusammenhanges wieder durchbrochen (vgl. Art. 62 § 5.). Für explizit zeichentheoretische Erörterungen gab es im mittelalterlichen Kanon der Wissenschaften verschiedene Systemstellen (vgl. Maieru` 1981). Die wichtigsten liegen im Bereich des Triviums (Grammatik, Rhetorik, Logik; vgl. Art. 52 und 53), vornehmlich in der Logik, wo die einleitenden Bestimmungen des Gegenstandes der Logik sowie die Darstellung der logischen Grundbegriffe vielfach Anlaß zu näheren Ausführungen über das Zeichen boten. Neben der Erörterung der Termini und ihrer Signifikation in mehr oder weniger engem Anschluß an die sogenannten Summulae des Petrus Hispanus (ca. 1230) ist hierbei besonders die Kommentierung des Einleitungskapitels der Aristotelischen Schrift Peri hermeneias (De interpretatione, Lehre vom Satz) von Wichtigkeit. Darüber hinaus finden sich in der Logik ⫺ allerdings eher vereinzelt ⫺ zeichentheoretisch relevante Ausführungen in der Kommentierung der aristotelischen Darstellung des Zeichenschlusses im Schlußkapitel der ersten Analytik. Weitere wichtige Systemstellen für explizit zeichentheoretische Erörterungen liegen innerhalb der Theologie (vgl. Art. 58), insbesondere der Sakramentaltheologie, wo die augustinische Bestimmung des Sakraments als „signum rei sacrae“ („Zeichen einer heiligen Sache“) häufig generelle Ausführungen zum Begriff und der Einteilung des Zeichens motivierte. Daneben liefert die Theologie vielfach die Systemstellen (z. B. die Bestimmung der zweiten trinitarischen Person als „Verbum“, die Kommunikation und Erkenntnis der Engel, die Schau der Seligen), an denen zeichentheoretisch relevante Themen, wie etwa das der kognitiven Repräsentation (Hübener 1968) oder der Unterscheidung von intuitiver und abstraktiver Erkenntnis, verhandelt werden. Außerhalb von Philosophie und Theologie finden sich explizite Aussagen zum Zeichenbegriff besonders in der Medizin (siehe Art. 56; vgl. Maieru` 1981, 64 ff).
2.
Verbindungsstellen zwischen antiker und mittelalterlicher Zeichentheorie
Für die Übermittlung der antiken Ansätze zu einer Theorie des Zeichens und der Bezeich-
985 nung an die Philosophie des Mittelalters sind besonders zwei Autoren von Bedeutung: Augustinus und Boethius. 2.1. Augustinus (354⫺430) Aurelius Augustinus ist nicht nur eine der wichtigsten Verbindungsstellen von antiker und mittelalterlicher Zeichentheorie. Seine für das Mittelalter grundlegenden zeichentheoretischen Ausführungen blieben bis ins 13. Jahrhundert die einzige ausgearbeitete Lehre vom Zeichen und darüber hinaus bis in die Neuzeit eine zentrale Größe der Zeichentheorie, auf die man sich ⫺ affirmativ oder kritisch ⫺ zu beziehen hatte (vgl. Art. 33 § 1.4., Art. 40 § 4.1. und Art. 53 § 1.1.). 2.1.1. Sprache als Zentrum der Zeichentheorie Deutlicher als in der hellenistischen Semiotik steht bei Augustinus die Sprache im Zentrum der zeichentheoretischen Ausführungen (vgl. Markus 1957, 64 f; Colish 1983, 45). Ihm geht es dabei jedoch weniger um die Exposition einer allgemeinen Theorie des Zeichens als um die Situierung des Sprachzeichens im Rahmen einer allgemeinen Zeichenklassifikation (vgl. Colish 1983, 46). 2.1.2. Res und signa Die Dinge und die Zeichen bilden und strukturieren zusammengenommen den Gegenstandsbereich jeglichen Wissens: „Omnis doctrina vel rerum est vel signorum, sed res per signa discuntur“ („Jede Lehre handelt von Dingen oder von Zeichen, aber die Dinge werden durch die Zeichen gelernt“; 1963, 9). Die Unterscheidung von Dingen und Zeichen ist jedoch nicht im strikten Sinne disjunktiv: „Jedes Zeichen ist auch ein Ding, denn was kein Ding ist, ist gänzlich nichts. Nicht aber ist jedes Ding auch ein Zeichen“ (ebd.). Die Grenze zwischen Dingen und Zeichen ⫺ und damit das Zeichen selbst ⫺ ist nicht ontologisch, sondern funktional bestimmt: Zeichen sind Dinge, die dazu dienen, etwas zu bezeichnen („res […] quae ad significandum aliquid adhibentur“; ebd.). Dinge dagegen im eigentlichen Sinne sind nach Augustinus solche, die nicht zur Bezeichnung von etwas verwendet werden („quae non ad significandum aliquid adhibentur; 1963), wie ein Stück Holz, ein Stein, ein Tier usw. So stehen den Dingen im eigentlichen Sinne, die keine unmittelbare Zeichenfunktion haben, wenngleich sie auch als Zeichen verwendet werden können und denen somit neben ihrer Brauch-
986 barkeit als Dinge auch Zeichenfunktion zukommen kann, die Zeichen im eigentlichen Sinne als diejenigen Dinge gegenüber, die, wie die Wörter, keinerlei Funktion als Dinge haben, sondern deren ganzer Nutzen allein im Bezeichnen besteht („Sunt alia signa quorum omnis usus in significando est, sicut sunt verba. Nemo enim utitur verbis nisi aliquid significandi gratia“; ebd.). 2.1.3. Die Definition des Zeichens Die klassisch gewordene Zeichendefinition des Augustinus lautet nach ihren beiden Varianten: „Signum est quod se ipsum sensui et praeter se aliquid animo ostendit“ („Zeichen ist, was sich selbst dem Sinn und über sich hinaus etwas dem Geist zeigt“; 1975, 86) bzw. „Signum […] est res praeter speciem quam ingerit sensibus, aliud aliquid ex se faciens in cogitationem venire […]“ („Ein Zeichen ist ein Ding, das neben dem Erkenntnisbild, das es den Sinnen mitteilt, aus sich heraus etwas anderes in das Denken kommen läßt“; 1963, 33). Exemplifiziert wird diese Definition durch die bekannten Beispiele von vestigium (Spur) als Zeichen des Tieres und fumus (Rauch) als Zeichen des Feuers. Das Zeichen ist damit per definitionem auf sinnliche Erfaßbarkeit festgelegt. 2.1.4. Die Klassifikation der Zeichen Augustinus unterteilt die Zeichen zunächst in natürliche und gegebene („signa naturalia, signa data“; 1963, 34). Kriterium für die natürlichen Zeichen ist, daß sie ohne eine Bezeichnungsabsicht über sich selbst hinaus etwas anderes erkannt sein lassen („sine voluntate atque ulla appetitu significandi praeter se aliquid aliud ex se cognosci faciunt“; ebd.) (Beispiele: Rauch⫺Feuer; Spur⫺Tier; Gesichtsausdruck⫺Gemütsverfassung). „Signa data“ dagegen sind jene, „die sich Lebewesen gegenseitig geben, um so gut wie möglich ihre Gemütsbewegungen, Gefühle und Kenntnisse aller Art anzuzeigen“ („quae sibi quaequae viventia invicem dant ad demonstrandos quantum possunt motus animi sui, vel sensa aut intellecta quaelibet“; ebd.). Sie sind nicht ohne weiteres als „konventionelle“ Zeichen zu verstehen (Jackson 1969, 14). Ihr Kriterium ist nicht ihr etwaiger konventioneller Charakter sondern das Vorhandensein einer Bezeichnungsabsicht beim Zeichensender, d. h. für Augustinus in erster Linie beim Menschen. Inwieweit im Falle tierischer Zeichenkommunikation (z. B. beim Lockruf von
VIII. Das Mittelalter
Vögeln) eine förmliche Zeichenabsicht („voluntas significandi“) anzusetzen ist, läßt Augustinus offen (1963, 34). 2.1.5. Das gesprochene Wort als wichtigstes Zeichen der menschlichen Kommunikation Die zur menschlichen Kommunikation verwendeten Zeichen werden weiter eingeteilt gemäß den Sinnesvermögen, an die sie adressiert sind: „einige gehören zum Gesichtssinn, die meisten zum Gehör, nur sehr wenige zu den übrigen Sinnen“ (ebd. 35). Die herausragende Rolle der Wörter („verba“) unter den gegebenen Zeichen gründet nach Augustinus jedoch nicht allein in ihrem quantitativen Übergewicht, sondern auch in dem Umstand, daß sich alles durch nichtsprachliche gegebene Zeichen Bezeichenbare auch mit Hilfe von Wörtern ausdrücken läßt, nicht aber umgekehrt. 2.1.6. Die Depotenzierung der Schrift Wort im eigentlichen Sinne ist für den frühen Augustinus gesprochenes Wort. Die Schrift („litterae“), vom Menschen eingeführt, um den Wörtern Dauerhaftigkeit zu verleihen, ist lediglich ein sekundäres Zeichensystem, das nicht aus Wörtern, sondern aus „Zeichen von Wörtern“ („signa verborum“) besteht (ebd.; vgl. 1975, 86 ff; zur Ausbildung dieser Auffassung bei Aristoteles vgl. Art. 40 § 3.1.1.). 2.1.7. Die kommunikative Bestimmung der Sprache In De dialectica definiert Augustinus das verbum als „uniuscuiusque rei signum, quod ab audiente possit intelligi, a loquente prolatum“ („Ein Wort ist von irgendeinem beliebigen Gegenstand ein Zeichen, das von einem Sprecher ausgesprochen ist und von einem Hörer verstanden werden kann“; 1975, 86). Die kommunikative Funktion der Sprache (vgl. Simone 1972, 15 ff bes. 18; Ruef 1981, 86) ist damit konstitutives Moment der Definition des im Sinne eines dreistelligen Zeichenbegriffs (vgl. hierzu Markus 1957, 72; Jackson 1969, 22, 25; Simone 1972, 16; Ruef 1981, 83 ff) aufgefaßten Verbum: „Denn es gibt keinen anderen Grund des Bezeichnens […] als den, das, was der Zeichenträger in seinem Geist trägt, […] in den Geist eines anderen zu übertragen“ („Nec ulla causa est nobis significandi […] nisi ad […] traiciendum in alterius animum id quod animo gerit qui signum dat“; 1963, 34).
49. Zeichenkonzeptionen in der Philosophie
2.1.8. Verbum, dicibile und res als Momente des sprachlichen Zeichenprozesses Vom verbum, das im Akt der Bezeichnung vom Gehör als artikulierter stimmlicher Laut („vox articulata“) wahrgenommen wird, ist das dicibile (Sagbare) als dasjenige zu unterscheiden, was der Geist aus dem Wort wahrnimmt oder erkennt und was im Geist beschlossen gehalten wird („quidquid autem ex verbo non aures sed animus sentit et ipso animo tenetur inclusum, dicibile vocatur“; 1975, 88). Es ist zugleich das, was im Geist des Sprechers vor dem Aussprechen des Wortes vorhanden war (ebd. 90), also der Bedeutungsgehalt des Wortes als geistige Konzeption („verbi in mente conceptio“; 88). Das, was vom verbum bezeichnet wird, ist nach Augustinus allerdings nicht das geistige dicibile, sondern die von ihrem Erkanntsein unabhängige äußere Sache (86; vgl. 90; vgl. Ruef 1981, 109), die, wie die verwendeten Beispiele (Schlachten, 90) zeigen, jedoch nicht auf konkrete Dinghaftigkeit festgelegt ist. Verschiedentlich wurde versucht, das Augustinische dicibile als Äquivalent des stoischen lekto´n zu interpretieren (Barwick 1957, 12; Duchrow 1965, 55; Jackson 1969, 47 f). Eine nähere Analyse liefert jedoch gewichtige Argumente gegen eine solche Gleichsetzung (Ruef 1981, 109). Daß bei Augustinus, besonders in De dialectica, auch Einflüsse der stoischen Zeichenkonzeption und Terminologie (vgl. Art. 40 § 3.2.3.) wirksam sind, wird allgemein zugestanden. In welchem Umfang diese jedoch bestimmend für seine Sprachund Zeichentheorie sind, ist ⫺ bedingt durch den Deutungsspielraum der augustinischen Ausführungen einerseits sowie die schwierige Quellenlage für die stoische Logik andererseits ⫺ kaum definitiv entscheidbar (vgl. Pinborg 1962; Duchrow 1965, 45 ff; Jackson 1969, bes. 40 ff; Simone 1972, 6 ff). 2.1.9. Die gnoseologische Funktion der Zeichen Die gnoseologische Funktion der Zeichen, insbesondere der Sprache, für den Menschen hat Augustinus in De magistro erörtert (vgl. Borsche 1986). Er konstatiert zunächst zwei Gründe für den Gebrauch von Sprache: (1) Lehre („docere“), d. h. Mitteilung von Information; (2) etwas ins Gedächtnis rufen („commemorare“), d. h. Aktivierung von bereits Bekanntem. Im weiteren Verlauf des Dialogs wird jedoch, nachdem es zunächst so scheint, als könne nichts ohne Zeichen ge-
987 lehrt werden („nondum prorsus exstat quod sine signis doceri posse videtur“; 1974, 72), die erkenntnisvermittelnde Funktion der Zeichen im allgemeinen und der Sprache im besonderen zurückgewiesen und die radikale ⫺ in De doctrina christiana wiederum zurückgenommene (vgl. 1963, 9) ⫺ These vertreten, daß nichts durch Zeichen erlernt wird: „Denn wenn mir ein Zeichen gegeben wird und ich nicht weiß, von welchem Ding dieses ein Zeichen ist, kann es mich nichts lehren. Wenn ich es aber weiß, was lerne ich dann durch das Zeichen?“ („fortasse nihil invenies, quod per sua signa discatur. Cum enim signum mihi datur, si nescientem me invenit, cuius rei signum sit, docere me nihil potest, si vero scientem, quid disco per signum?“; 1974, 76). So zeige insbesondere die Betrachtung der kindlichen Spracherlernung, daß die Bedeutung der Wörter erst durch die wiederholte Erfahrung des konstanten Gebrauchs derselben in Rücksicht bereits durch unmittelbare Anschauung bekannter Dinge erlernt wird (ebd. 76 ff), wir also „durch jene Zeichen, die Wörter genannt werden, nichts lernen, sondern vielmehr eher die im Laut verborgene Bedeutung durch die erkannte Sache, die bezeichnet wird, erlernen, als daß wir diese durch jene Wortbedeutung erfassen („per ea signa, quae verba appellantur, nos nihil discere; potius enim […] significationem quae latet in sono, re ipsa, quae significatur, cognita discimus, quam illam tali significatione percipimus“; 1974, 80; vgl. 78). Die Kenntnis der Dinge geht der Kenntnis der Zeichen notwendig vorauf. Wörter und Zeichen haben daher lediglich admonitive, auf die Dinge hinweisende oder erinnernde Funktion („verba […] admonent tantum, ut quaeramus res“; 80) bzw. dienen als Stimuli (excitamenta) für die von Augustinus postulierte Wendung nach Innen. Instanzen der Vermittlung von Erkenntnis sind die unmittelbare sinnliche oder geistige Erfassung (1974, 84), sowie ⫺ und dies ist letztlich der illuminationstheoretische Skopus von De magistro ⫺ Christus als der „innere Lehrer“ (vgl. Markus 1957, 68 f). 2.1.10. Das verbum mentis als eigentliches Wort Die Depotenzierung der Zeichen gegenüber der Innensphäre geistiger Erkenntnis drückt sich bei Augustinus später in De trinitate in der Lehre vom „verbum mentis“ („Wort des Geistes“) aus. In analoger Weise, wie in De dialectica das geschriebene Wort als das nur uneigentliche vom eigentlichen, gesprochenen
988 Wort abgesetzt wird, erscheint letzteres hier als defizienter Modus des geistigen Wortes, „das wir im Herzen sprechen und das weder griechisch noch lateinisch noch irgendeiner anderen Sprache zugehörig ist“ („quod in corde dicimus; quod nec graecum est nec latinum, nec linguae alicuius alterius […]“, De trin. XV, 10, 19 (1968, 486)). Hiermit liegt die paradoxe Situation vor, daß „linguistische“ Terminologie („verbum“, „locutio“, „oratio“, „dicere“ etc.) in metaphorischer Weise auf den Bereich des Denkens („cogitatio“) übertragen wird, dessen Sprachfreiheit gerade von Augustinus nachdrücklich betont wird. Für Augustinus wie für die augustinische Tradition des Mittelalters stellt sich indes auf der Grundlage der theologischen Verbum-Spekulation der metaphorische Charakter einer solchen Redeweise nicht als solcher dar. Vielmehr ist gerade das verbum mentis Wort im eigentlichen Sinne, während das gesprochene Wort als Zeichen des Inneren („signum verbi“ bzw. „index cogitationis“) nur „Stimme des Wortes“ („vox verbi“) ist und lediglich aufgrund seiner manifestierenden Funktion hinsichtlich desselben als Wort bezeichnet wird (De Trinitate XV, 11, 20 (1968, 486 f). 2.1.11. Das zeichentheoretische Erbe von Augustinus Das augustinische Erbe hinsichtlich der Zeichenkonzeption des Mittelalters läßt sich durch folgende Stichpunkte zusammenfassen: (1) Entwicklung einer Zeichenklassifikation; (2) Festlegung des Zeichens auf sinnliche Wahrnehmbarkeit; (3) Depotenzierung der äußerlichen Zeichen gegenüber dem inneren geistigen Wort, das eben nicht Zeichen ist; (4) Betonung der Sprachfreiheit des Denkens; (5) Sprache als Zentrum der Erörterung von Zeichenthematik; (6) Sprache als System rememorativer Zeichen; (7) Dinge (nach De dialectica) bzw. Konzepte (nach De Trinitate) als Signifikate sprachlicher Ausdrücke. (8) Mit seiner Bestimmung des Sakraments als „sacrae rei signum“ („Zeichen einer heiligen Sache“) liefert Augustinus die Grundlage für die zahlreichen zeichentheoretischen Erörterungen im Rahmen der mittelalterlichen Sakramentaltheologie. 2.2. Boethius (480⫺528) Die Übersetzung und Kommentierung von Teilen des aristotelischen Organons durch Boethius, besonders der Schrift Peri hermeneias (De interpretatione, Lehre vom Satz),
VIII. Das Mittelalter
bilden die wichtigste ⫺ und bis ins 12. Jahrhundert einzige ⫺ Quelle für die mittelalterliche Rezeption der aristotelischen Semantik. Anders als bei Augustinus ist die Semantik bei Boethius nicht an eine allgemeine Erörterung des Zeichens zurückgebunden, sondern bleibt auf eine Theorie der significatio, der sprachlichen Bezeichnung, wie sie durch den Aristotelischen Text vorgegeben war, beschränkt (vgl. Art. 40 § 4.2. und Art. 53 § 1.2.). 2.2.1. Die Übersetzung von Peri hermeneias Durch die Boethianische Aristoteles-Übersetzung wurden einige für die Geschichte der Semantik bedeutsame interpretatorische Entscheidungen getroffen: (1) Boethius übersetzt, wo das griechische Original die gesprochenen Wörter als „se¯meı˜a“ der geistigen Begriffe und die geschriebenen Wörter als „sy´mbola“ der gesprochenen bestimmt, beides unterschiedslos mit „notae“ und verstellt damit von vorneherein die Frage, ob beide Bezeichnungsverhältnisse gänzlich analog konzipiert sind oder die sprachlichen Ausdrücke als „se¯meı˜a“ der Begriffe diese nicht eher, wie Kretzmann (1974) ⫺ und vorher bereits Roger Bacon ⫺ nahelegte, in lediglich indexikalischer Weise bezeichnen (vgl. dagegen jedoch Magee 1989, 36 ff. (2) Er übersetzt die aristotelische Charakterisierung der Bezeichnungsweise der Wörter als „kata` synthe˘ ke¯n“ (gemäß Übereinkunft) mit „secundum placitum“ und prägt damit die historisch wirksam gewordene Terminologie für die Bestimmung des „willkürlichen Zeichens“ („signum ad placitum“) (vgl. Engels 1963). (3) Er legt den hinsichtlich des Signifikats sprachlicher Ausdrücke nicht ganz eindeutigen und in verschiedenen Varianten überlieferten Aristoteles-Text (Peri herm. 16 a 6) auf unmittelbare und vorrangige Konzeptbezeichnung fest (Magee 1989, 49 ff). 2.2.2. Der Ordo orandi Boethius eröffnet seinen Kommentar mit einer detaillierten Erörterung des Verhältnisses der vier von Aristoteles erwähnten Elemente des Bezeichnungsvorganges: res (Dinge), intellectus (geistige Begriffe), voces (sprachliche Ausdrücke), scripta (geschriebene Wörter). Diese vier Elemente unterliegen einer feststehenden naturgemäßen Ordnung, einem „ordo orandi“ (vgl. Magee 1989, 64⫺92). Denn: „die Sache geht dem Begriff voraus, der Begriff aber dem sprachlichen Ausdruck, der sprachliche Ausdruck der Schrift“ (Boethius
989
49. Zeichenkonzeptionen in der Philosophie
1880, 21.28⫺30), d. h. ohne Dinge gäbe es keine Begriffe oder Verständnisse, ohne Begriffe keine sprachlichen Ausdrücke und ohne diese keine Schrift. Dies ist jedoch nicht in dem Sinne umkehrbar, daß in jedem einzelnen Fall die Verwendung von Schriftzeichen notwendig die Kenntnis der durch sie bezeichneten vox impliziert, daß den sprachlichen Ausdrücken immer ein Begriff zugrunde liegt oder daß für jeden Begriff eine res als Referent gegeben ist (Boethius ebd.). Der „Ordo orandi“ legt zugleich die Bezeichnungsrichtung der ihn bildenden Elemente fest: Die Schrift bezeichnet die sprachlichen Ausdrücke, diese vornehmlich die Konzepte sowie in zweiter Linie die Dinge, die Konzepte endlich bezeichnen ausschließlich die Dinge, wobei Boethius allerdings den voces, genauer, den Nomina und Verben hinsichtlich des Bezeichnens einen Vorrang gegenüber den scripta und intellectus einräumt („Cum igitur haec sint quattuor: litterae, voces, intellectus, res, proxime quidem et principaliter verba nominaque significant. Haec vero principaliter quidem intellectus, secundo vero loco res quaque designant. Intellectus vero ipsi nihil aliud nisi rerum significativi sunt“; 1880, 24). Die Priorität der Konzeptbezeichnung und der sekundäre Charakter der Bezeichnung der Dinge sind dabei nach dem Modell des semantischen Dreiecks konzipiert, d. h. so, daß die sprachlichen Ausdrücke „die Dinge in einer sekundären Bezeichnung durch die Vermittlung der Begriffe“ („res […] secundaria significatione per intellectuum medietatem […]“; 1880, 33) bezeichnen. Wenn die Sprachäußerungen nicht Zeichen für die Begriffe sind, dann für überhaupt nichts („praeter intellectum […] vox penitus nihil designat“; 21). Die im Zusammenhang mit der Exposition des ordo orandi getroffene Unterscheidung der Oratio (Rede) in eine geschriebene, eine gesprochene und eine geistige Rede, wie er sie als Lehre des Porphyrius (1880: 36. 10 ff) sowie der Peripatetiker (1880: 29. 17⫺21) referiert, ist besonders für die spätmittelalterliche Logik wichtig geworden. Die geistige Rede ist dabei ebenso wie das Augustinische „verbum mentis“ und die spätere „oratio mentalis“ (vgl. Hübener 1981) nicht aus Wörtern natürlicher Sprachen gebildet, sondern aus den transidiomatischen, bei allen Menschen identischen Gedanken oder geistigen Begriffen. Besonders deutlich formuliert findet sich dies später bei Anselm von Canterbury.
3.
Anselm von Canterbury (1033⫺1109)
Anselm von Canterbury, einer der bedeutendsten Philosophen und Theologen des 11. Jahrhunderts, trifft eine an Augustinus orientierte Unterscheidung von drei Weisen der Rede („locutio“). Hierbei macht er deutlich, daß die Rede des Geistes oder des Verstandes nicht als stummes Memorieren sprachlicher Ausdrücke zu verstehen ist, sondern als die gedankliche Erfassung der Dinge selbst („Mentis autem sive rationis locutionem hic intelligo, non cum voces rerum significativae cogitantur, sed cum res ipsae […] acie cogitationis in mente conspiciuntur“; Anselm von Canterbury 1938 a, 24). Die drei Weisen des Sprechens vollziehen sich nach Anselm somit entweder durch die Verwendung äußerer, sinnlich wahrnehmbarer Zeichen oder durch die innere Vorstellung dieser Zeichen oder aber so, daß die Dinge selbst, sei es in Form körperlicher Vorstellung oder verstandesmäßiger Einsicht im Geiste „gesprochen“ werden („res ipsas vel corporum imaginatione vel rationis intellectu […] intus in mente nostra dicendo“; ebd. 25). Die Elemente dieses geistigen Redens bezeichnet er als „verba […] naturalia […] et apud omnes gentes eadem“ („natürliche und bei allen Völkern identische Wörter“; ebd.). Sie gelten, wie bei Augustinus, als Worte im eigentlichsten Sinne („maxime proprium et principale verbum“; ebd.), da sie, indem sie zugleich „similitudines et imagines rerum“ („Ähnlichkeiten und Abbilder der Dinge“; 48) sind, aufgrund dieser ihrer Ähnlichkeit zu den Dingen ihre Objekte ausdrücklicher bezeichnen („expressius signant“; 25) als alle anderen Wörter. Sie bilden nicht nur, da die anderen Wörter um ihretwillen erfunden sind, die Grundlage allen Sprechens, sondern die jeder Erkenntnis: Wo sie gegeben sind, bedarf es keiner anderen Wörter zur Erkenntnis der Sache, und wo sie unmöglich sind, ist keines derselben geeignet, die Sache zu zeigen (25).
4.
Pierre Abaelard (1079⫺1142)
Abaelard, der ⫺ nicht nur ⫺ in Rücksicht auf die Zeichentheorie bedeutendste Autor des 12. Jahrhunderts, macht deutlich (1956, 111), daß die in den Kompetenzbereich der Logik fallende Signifikation sprachlicher Ausdrücke („significatio vocum“) nicht den Gesamtbereich von Bezeichnungsvorgängen
990 abdeckt. Denn auch die Dinge bezeichnen; sei es, daß sie ebenso wie die Wörter eigens zur Ausübung von Zeichenfunktion („significandi officium“) eingesetzt worden sind (Beispiele: Laubkranz vor der Taverne als Zeichen des Weinverkaufs; gestische Zeichen der Mönche; 1927, 335), sei es, daß sie aufgrund einer gewohnheitsbedingten Assoziation („secundum consuetudinem“; Beispiel: zwei mehrfach zusammen beobachtete Gegenstände) oder eines zwischen ihnen und anderen Dingen bestehenden Verhältnisses („secundum aliquam earum ad se habitudinem“; Beispiel: Vater⫺Sohn) diese durch ihr eigenes Erkanntsein zur Erkenntnis kommen lassen (vgl. Jolivet 1969, 62 ff). Es ist bei Abaelard gleichwohl eine Tendenz sichtbar, den auf Einsetzung beruhenden Zeichen hinsichtlich ihres Zeichenseins einen Vorrang einzuräumen. So spricht er diesbezüglich von einem „proprie significare“ („Bezeichnen im eigentlichen Sinne“; 1956, 111) oder grenzt etwa die eingesetzte vox (stimmliche Äußerung) als die allein signifikative von der nicht eingesetzten ab, die ohne als significativa ausgezeichnet zu sein, etwas bezeichnen kann. Denn das significare ist bei Abaelard in Anlehnung an Aristoteles (Peri hermeneias 16 b 20) konzipiert als die Hervorbringung eines Verständnisses oder Begriffs („constituere intellectum“) beim Hörer. Und in diesem allgemeinen Sinn vermag jede lautliche Äußerung ⫺ ohne signifikativ im beschriebenen Sinne zu sein ⫺ etwas zu bezeichnen, da sie uns in jedem Fall versichert, daß der- oder dasjenige, von dem sie hervorgebracht worden ist, ein Lebewesen ist. Der Begriff der institutio („Einsetzung“) ist dabei jedoch seinerseits denkbar weit gefaßt und läßt die Alternative von menschlicher „institutio ad placitum“ und natürlicher Einsetzung zu („significativum autem dicitur, quidquid habile est ad significandum ex institutione aliqua sive ab homine facta sive natura“; 1927, 335). Als eingesetzt gilt demzufolge alles, was um einer Bezeichnung willen existiert. So handelt es sich auch beim Hundegebell („latratus canis“; vgl. Eco et al. 1989, 15 f), weil von der Natur zur Bezeichnung des Zornes eingesetzt, um eine „vox significativa ex institutione“ (336). Abaelard unterteilt (vgl. Abb. 49.1) damit die sprachlichen Ausdrücke, wie die Zeichen im allgemeinen, in (bloß) signifizierende und signifikative. Während erstere ohne eine Einsetzung etwas bezeichnen, sind letztere aufgrund einer Einsetzung, sei es durch die Natur (bzw. Gott) oder den Menschen, in welchem Fall
VIII. Das Mittelalter
signa
significantia sine institutione: secundum consuetudinem vel aliam habitudinem (vox → suum prolatorem, pater → filium)
significativa
ex institutione naturae (latratus canis → iram, gemitus infirmorum → dolorem)
ex institutione hominis ⫽ ad placitum (nomen → intellectum, nomen → rem) Abb. 49.1: Abaelards Klassifikation der Zeichen.
ihnen das „ad placitum“ im eigentlichen Sinne zukommt (340), signifikativ, ohne freilich dadurch in jedem Fall etwas aktualiter oder gegenwärtig bezeichnen zu müssen. Denn „sicut non omnia significativa actualiter significant, ita non omnia actu significantia sint significativa, sed ea sola quae ad significandum sunt instituta“ („so, wie nicht alles Signifikative gegenwärtig bezeichnet, ist auch nicht alles gegenwärtig Bezeichnende signifikativ, sondern nur dasjenige, das zum Bezeichnen eingesetzt worden ist“; 336). Hinsichtlich des alten Problems der Signifikation der sprachlichen Ausdrücke geht Abaelard (wie Boethius) von einer duplex significatio (doppelten Bezeichnung) aus, indem er zwischen einer significatio rerum (Bezeichnung der Dinge) und einer significatio intellectuum (Bezeichnung der geistigen Begriffe) unterscheidet (307). Beide Bezeichnungen sind jedoch nicht gleichrangig. Die für die kommunikative und das heißt: für die reguläre Funktion der Sprache vorrangige Bezeichnung der sprachlichen Ausdrücke ist die Bezeichnung der Begriffe. Denn der Grund der Einführung und die Funktion von Sprache ist eben allein die Konstitution eines Verständnis oder Begriffs (vom bezeichneten Gegenstand) auf seiten des Hörers: „Officium […] [vocum], ad quod institutes sunt, significare est, hoc est intellectum constituere. Unde bene secundum causam inventionis et officii vocum intellectus principalis est earum significatio, res vero secundaria […]“ („Die Funktion, zu der die sprachlichen Ausdrücke eingesetzt
991
49. Zeichenkonzeptionen in der Philosophie
sind, ist das Bezeichnen, d. h. die Hervorbringung eines Begriffs. Von daher ist, gemäß dem Grund der Erfindung sprachlicher Ausdrücke und ihrer Funktion, die Bezeichnung der geistigen Begriffe die vorrangige, die der Dinge jedoch die sekundäre“; 309; vgl. 112; 307). Der Vorrang der Konzeptbezeichnung ist für Abaelard nicht zuletzt darin begründet, daß nur sie die Konstanz der Signifikation sprachlicher Ausdrücke unabhängig von der Existenz eines äußeren Referenten garantiert: „Rerum […] significatio transitoria est, intellectus vero permanens. Destructis enim rebus subiectis, si quis hoc nomen proferat ‘rosa’ vel ‘lilium’, licet rerum quas nominabat, significationem iam non teneat, significatio intellectuum non vacuatur, quia sive res sit, sive non, intellectus semper constituuntur“ („Die Bezeichnung der Dinge ist vergänglich, die Begriffe jedoch sind beständig. Wenn nämlich jemand die Nomina ‘Rose’ oder ‘Lilie’ äußert, während es keine solchen Dinge gibt, dann werden jene zwar die Bezeichnung der durch sie benannten Dinge nicht beibehalten, doch wird die Bezeichnung der Begriffe dadurch nicht aufgehoben, denn ob die Sache nun existiert oder nicht, stets werden die Begriffe konstituiert“; 309). Der konstitutionssemantische Ansatz Abaelards (vgl. Hübener 1981, 495) impliziert hinsichtlich der significatio intellectuum die Präzisierung, daß es sich hierbei um das Verständnis („intellectus“) des Hörers, nicht das des Sprechers handelt. Zwar kann gesagt werden, daß der Begriff im Geiste des Sprechers durch eine vox insofern bezeichnet wird, als dieser ihn dem Hörer manifestiert, indem er bei ihm einen entsprechenden Begriff hervorbringt (1927, 307 f). Der Maßstab und der Grund von Signifikation ist jedoch allein die Konstitution eines Hörerverständnisses („intellectus audientis“; 308), wie Abaelard gegen den expressionssemantischen Ansatz Priscians ausführt, der diese in der Mitteilungsintention eines Begriffs seitens des Sprechers begründet sein ließ. Denn nur so können auch die tierischen Laute, bei deren Produzenten kein geistiger Begriff gegeben ist, als signifikativ charakterisiert werden (308). Die Weite des semiotischen Feldes, wie sie in der Zulassung der Natur als Zeicheninstitutor aufscheint, wird begrenzt durch die für jede Bezeichnung geforderte Vernunftbegabtheit des Zeichenrezipienten. Denn nur hier kann sinnvollerweise von einem „constituere intellectum“ die Rede sein.
5.
Die terministische Logik
Vielfach im Anschluß an Abaelard entwickelt die Logik des 12. Jahrhunderts Ansätze und Grundlagen der terministischen Logik, wie sie um die Mitte des 13. Jahrhunderts bei Autoren wie Petrus Hispanus (ca. 1230) und Wilhelm von Sherwood (bzw. Shyreswood; † 1249) entfaltet vorliegt (vgl. de Rijk 1962⫺67, II,1.123 ff; Pinborg 1972, 55 ff). Die wichtigste Entwicklung der von der terministischen Logik durchgeführten Analyse der „proprietates terminorum“ („Eigenschaften der Termini“; vgl. Pinborg 1972, 58 ff; Dumitriu 1977, 130 ff) ist die Theorie der Supposition, die bis ins 17. Jahrhundert zum festen thematischen Bestand der Logik gehört (vgl. Ashworth 1969). Charakteristisch für diese ist jenes Moment, für das sich in der Forschung der von de Rijk geprägte Ausdruck des „contextual approach“ durchgesetzt hat. Gemeint ist damit die Betonung der Wichtigkeit einer klaren Unterscheidung zwischen der allgemeinen (modern gesprochen: lexikalischen) Bedeutung eines Wortes und seinem vom Satzkontext abhängigen Einstehen für etwas („supponere pro aliquo“) (vgl. Art. 52 § 5.). Die vorrangig verfolgte Intention ist dabei freilich nicht die Analyse eines semantischen Kontextes, sondern die Festlegung der Auffassungs- oder Verständnisweise (d. h. der Supposition) eines Terminus gemäß den Wahrheitsbedingungen der ihn enthaltenden Aussage („Suppositio est acceptio termini pro aliquo de quo verificatur juxta exigentiam copulae“) („Die Supposition ist die Auffassung [oder Verwendung] eines Terminus für etwas, von dem er gemäß den Erfordernissen der Kopula wahrheitsgemäß ausgesagt wird“; Wilhelm von Sherwood; vgl. Dumitriu 1977, 130), d. h. die Klärung, bei welchem Verständnis der Termini ein Satz wahr oder falsch bzw. ein syllogistischer Schluß gültig oder ungültig ist („finis suppositionis est per eam cognoscere an oratio sit vera vel falsa“; Bartholomaeus Arnoldi 1507, fol. f 6 r). Die Funktion der Suppositionstheorie für die Logik besteht damit insbesondere in der Aufdeckung von Trugschlüssen oder Sophismata, die in der Regel durch einen unzulässigen Wechsel der Suppositionsweise ihrer Termini entstehen. Die Suppositio ist von der Significatio in mehrfacher Hinsicht unterschieden: Ein Wort besitzt außerhalb einer Aussage Signifikation, jedoch ⫺ zumindest nach der vorherrschenden Auffassung ⫺ keine Supposition. Die significatio entsteht
992
VIII. Das Mittelalter
6.
Abb. 49.2: Die wichtigsten Arten der Suppositio (vgl. Dumitriu 1977, 131 f).
durch eine Einsetzung, die suppositio durch die Verwendung des bereits signifikativen Wortes für etwas („acceptio ipsius termini iam significantis rem pro aliquo“; Petrus Hispanus 1972, 80). Die Signifikation ist damit der Supposition vorgeordnet („significatio prior est suppositione“; ebd.). Die Differenzierung der Suppositionsweisen hat im Laufe ihrer Behandlung zum Teil äußerst komplexe Klassifikationssysteme ausgebildet (vgl. Dumitriu 1977, 131 f). Die wichtigsten Suppositionsweisen sind folgende (vgl. Abb. 49.2): Zunächst unterscheidet man zwischen s. [⫽ suppositio] materialis (materiale S.; wenn ein Terminus für sich selbst steht, z. B. „homo est dissylabus“; „‘Mensch’ ist einsilbig“) und s. formalis (formale S.; wenn ein Terminus für anderes steht). Sofern diese keine s. impropria (uneigentliche S.; übertragene Verwendung, z. B. „homo pictus“; „gemalter Mensch“) ist, wird letztere unterteilt in s. simplex (einfache S.; Verwendung für ein universale, d. h. je nach vertretener Ontologie für eine extramentale Realität oder einen intramentalen Begriff; z. B. „homo est species“; „Mensch ist eine Spezies“) und s. personalis (personale S.; Verwendung für Einzelnes); diese wiederum teilt sich in s. discreta (diskrete S.; Suppositionsweise der singulären Termini, z. B. „Sor currit“; „Sokrates läuft“) und ‘s. communis’ (allgemeine S.) und letztere weiter in ‘s. determinata’ (bestimmte S.; z. B. „aliquis homo currit“; „ein bestimmter [oder bestimmbarer] Mensch läuft“) und s. confusa (unbestimmte S., z. B. „aliquis oculus est necessarius ad videndum“; „Zum Sehen braucht man ein Auge“ (wobei nicht bestimmbar ist, welches)). Gegenstand von Kontroversen bildete aufgrund der ontologischen bzw. universalientheoretischen Implikationen insbesondere die Unterscheidung von ‘s. simplex’ und ‘s. personalis’.
Die grammatica speculativa
Die mittelalterliche Grammatiktheorie steht zunächst in der Tradition Priscians, dessen Grammatik fester Bestandteil des universitären Lehrcurriculums war. Seit der Mitte des 11. Jahrhunderts formiert sich jedoch eine wachsende Kritik an den Lehren Priscians (de Rijk, 1962⫺67, II/1. 255⫺63), die im späteren 13. Jahrhundert zu einem deutlichen Neuansatz führt, zur Konstitution der „grammatica speculativa“ (vgl. Pinborg 1967; Bursill-Hall 1971). Dieses ca. 1270 in Paris ausgearbeitete Konzept der Grammatik begreift diese nicht als propädeutische Hilfsdisziplin, sondern weist ihr den Status einer Wissenschaft zu, was angesichts der geltenden aristotelischen Bestimmung von Wissenschaft als Erkenntnis von Allgemeinem nur unter der Voraussetzung einer allen Sprachen gemeinsamen Grammatik möglich war (vgl. Art. 53 § 4.3.). Explizit stellt Boethius von Dacien (tätig um 1275), der wichtigste Theoretiker der spekulativen Grammatik (vgl. Pinborg 1967, S. 86; Bursill-Hall 1971, S. 164 ff), fest: „omnia idiomata sunt una grammatica. Et causa huius est, quia cum tota grammatica accepta sit a rebus […] et quia naturae rerum sunt similes apud omnes, ideo et modi essendi et modi intelligendi sunt similes apud omnes illos, apud quos sunt illa diversa idiomata, et per consequens similes modi significandi, et ergo per consequens similes modi construendi vel loquendi. Et sic tota grammatica, quae est in uno idiomate, est similis illi, quae est in alio idiomate“ („alle Sprachen sind hinsichtlich der Grammatik identisch. Der Grund dafür ist, daß die gesamte Grammatik von den Dingen her entwickelt ist […], und weil die Naturen der Dinge bei allen Menschen ähnlich sind, so sind auch die Seinsweisen und die Erkenntnisweisen [selbst] bei all jenen ähnlich, bei denen die Sprachen unterschiedlich sind, und folglich sind auch die Bezeichnungsweisen ähnlich und somit ebenfalls die Weisen der Sprachkonstruktion oder des Sprechens. Und somit ist die ganze Grammatik, die sich in einer Sprache findet, ähnlich der in einer anderen Sprache“; Boethius de Dacia 1969, 12). Die grammatica speculativa entwickelt damit die allgemein anerkannte aristotelische Auffassung, daß ebenso wie die Natur der Dinge auch die geistigen Begriffe bei allen Menschen dieselben („passiones eaedem apud omnes“) sind, weiter zu der These von der der Universalgrammatik aller Sprachen zu-
993
49. Zeichenkonzeptionen in der Philosophie
grunde liegenden Isomorphie zwischen den Seinsweisen der Dinge („modi essendi“), den Erkenntnisweisen des Intellekts („modi intelligendi“) und den Bezeichnungsweisen („modi significandi“) der verschiedenen Wortklassen (nomina, verb, adiectiva, adverbia etc.) und syntaktischen Bestimmungsmomente der Wörter (numerus, casus). Obwohl es sich bei den Wörtern an sich um willkürliche, eingesetzte Zeichen handelt (daher die Verschiedenheit der Idiome), stehen die Bezeichnungsweisen derselben doch, vermittelt über die Erkenntnisweisen, mit den Seinsweisen der bezeichneten Dinge in einem natürlichen Korrespondenzverhältnis (daher die grammatikalische Identität der Idiome). Denn die Einsetzung der sprachlichen Ausdrücke zum Bezeichnen („impositio ad significandum“) ist hinsichtlich der Bezeichnungsweisen letztlich durch die Eigenschaften der Dinge motiviert, da, wie Thomas von Erfurt (tätig um 1300) meint, der Intellekt, die Instanz der Spracheinsetzung, als passives und von sich selbst her unbestimmtes Vermögen hierzu erst durch die Dingeigenschaften determiniert und motiviert werden muß. Insofern korrespondiert jedem modus significandi eine Eigenschaft oder Seinsweise des bezeichneten Dinges. Die grammatische Struktur jeder Aussage ist bis in ihre einzelnen Komponenten hinein damit gleichsam Abbild eines extramentalen sachlichen Ordnungszusammenhanges. Im Gegensatz zu der von der terministischen Logik geleisteten „kontextuellen“ semantischen Analyse, die die Aussage als bestimmend für das Verständnis der sie bildenden Wörter und den Kontext als bestimmend für das Verständnis der Aussage betrachtet, betreibt die modistische Grammatik eine Art Konstituentenanalyse (vgl. Pinborg 1972, 111⫺26), deren Hauptinteresse den Bestandteilen der Aussage als für sich bestehenden Einheiten gilt. Wörter besitzen ihr zufolge eine unveränderliche, aus dem Einsetzungsakt herrührende Bedeutung, die durch den Kontext nicht oder allenfalls in äußerst eingeschränktem Maße beeinflußt werden kann. Dieses Konzept des modus significandi als einer den Wörtern zwar vom Intellekt verliehenen, ihnen aber nach Art einer Qualität inhärierenden Eigenschaft wird später zum Hauptkritikpunkt an der modistischen Lehre (vgl. Pinborg 1972, 140). So leugnet etwa Johannes Aurifaber (tätig um 1330) die Existenz eines solchen, da ein sprachlicher Ausdruck allein aufgrund seines Gebrauchs bezeichnet und nicht kraft etwas, was ihm we-
sensmäßig oder wie eine Qualität zugeeignet ist: „[…] negatur modus significandi, quia vox ex solo usu et exercitio significat et non ex aliquo, quod sibi formaliter vel subiective acquiratur“ (vgl. Pinborg 1967, 227).
7.
Zeichenkonzeptionen in der Ethik
In der Ethik, bzw. der Moraltheologie, kommt zeichentheoretische Thematik in erster Linie im Zusammenhang mit der Bestimmung der Lüge („mendacium“) zum Tragen. Grundlegend hierfür waren bis in die frühe Neuzeit die diesbezüglichen Ausführungen der beiden Augustinischen Schriften De mendacio (über die Lüge; 1900 a) und Contra mendacium (Gegen die Lüge; 1900 b). Augustinus bestimmt zunächst: „Es lügt derjenige, der etwas anderes, als er im Geiste hat, durch Worte oder irgendwelche andere Zeichen zum Ausdruck bringt“ („ille mentitur, qui aliud habet in animo et aliud verbis vel quibuslibet significationibus enuntiat“; 1900 a, 415). Nicht jeder, der etwas Falsches sagt, lügt; so etwa derjenige nicht, der irrtümlich von der Wahrheit des von ihm Gesagten überzeugt ist (414 f). Lüge ist mehr als nur unwahre Äußerung. Charakteristisch für die lügenhafte Zeichenverwendung ist die beim Lügenden vorliegende „duplex cogitatio“, d. h. zum einen das Bewußtsein von jener Sache, die er als wahr weiß oder annimmt, aber nicht äußert, und zum anderen das Bewußtsein von jener Sache, die er an Stelle der ersteren äußert, und von der er weiß oder doch annimmt, daß sie unwahr ist (415). Für die moralische Bewertung ausschlaggebend ist nicht die Wahrheit oder Unwahrheit sondern die Täuschungsabsicht („cupiditas fallendi“; 415). Dabei ist es gleichgültig, ob tatsächlich eine Täuschung stattfindet oder nicht, denn es kann sehr gut eine solche Täuschungsabsicht ohne eine tatsächliche Täuschung vorliegen, etwa wenn dem Lügner nicht geglaubt wird oder aber er aufgrund eines Irrtums mit der Absicht zu täuschen die Wahrheit sagt und ihm geglaubt wird (415). Täuschung ist ein Phänomen, das entscheidend von der Auffassungsweise der Mitteilung durch den Zeichenempfänger abhängt. Damit aber ist klar, daß willentliche Täuschung sich vollständig nur im Rahmen einer komplexen kommunikativen Situation beschreiben läßt, zu der die Überzeugung und die Intention des Zeichensenders ebenso gehört, wie die Auffassungsweise seitens des Rezipienten und die
994 Einschätzung derselben durch ersteren. Innerhalb dieses komplexen Zusammenspiels können die Bestimmungsmomente der Wahrheit und der Täuschungsabsicht durchaus in ein spannungsreiches Verhältnis geraten. Augustinus spielt das anhand subtiler Kasuistik durch, wie etwa der sich angesichts der Situation, daß der Sprecher weiß, daß der Angesprochene ihn für einen Lügner hält und ihm folglich nicht glauben wird, stellenden Frage: „Wer lügt eher: derjenige, der die Unwahrheit sagt, um nicht zu täuschen, oder der, welcher die Wahrheit sagt, um zu täuschen?“ (416). Insgesamt geht Augustinus’ Antwort dahin, die Definition der Lüge auf die subjektiven Momente der willentlichen Unwahrheit und der willentlichen Täuschung zu legen: „Mendacium […] est falsa significatio cum voluntate fallendi“ (Lüge ist eine unrichtige Zeichenkundgabe mit der Absicht des Täuschens“; 1900 b, 507). Wenn es unter Vermeidung beider Momente trotzdem zu einer Täuschung kommt, dann allenfalls zu einer wissentlichen, nicht aber zu einer ⫺ allein in der Verantwortlichkeit des Zeichensenders liegenden ⫺ willentlichen Täuschung. Hierbei ist es gleichgültig, ob die Äußerung in sprachlicher Form oder mittels sonstiger Zeichen erfolgt. Letztere müssen keine willentlich eingesetzten Zeichen sondern können, wie die von Augustinus verwendeten Beispiele zeigen, beliebige Handlungen sein. Daß nicht nur die gewöhnlich so genannten Zeichen sondern prinzipiell jede Handlung zur Bezeichnung von Wahrem und Falschem fähig ist, hat auch Anselm von Canterbury bemerkt („non solum in iis quae signa solemus dicere, sed et in aliis omnibus [sc. actionibus] est significatio vera vel falsa“; Anselm von Canterbury 1938 b, 188) und betont, daß letzteren im Falle einer Unstimmigkeit zwischen beiden sogar die größere Glaubwürdigkeit zukommt: „Wenn Du an einem Ort wärest, von dem Du wüßtest, daß es an ihm heilsame und tötliche Pflanzen gibt, Du sie aber nicht zu unterscheiden wüßtest, und es wäre jemand da, von dem Du überzeugt wärest, daß er sie zu unterscheiden weiß, und er, von Dir gefragt, welche heilsam und welche tötlich seien, die einen mit Worten als heilsam bezeichnen und die anderen essen würde: Wem würdest Du mehr glauben, seinen Worten oder seinen Taten?“ (189) Auch Thomas von Aquin macht in seiner sich eng an Augustinus anlehnenden Erörterung von Wahrheit und Lüge deutlich, daß hinsichtlich beider das verwendete Zeichen-
VIII. Das Mittelalter
medium keine Rolle spielt. Thomas unterscheidet hier zwei Arten von Wahrheit: zum einen die Wahrheit, der gemäß etwas wahr genannt wird und die in einer gewissen Angemessenheit des Intellekts oder Zeichens zu der erkannten oder bezeichneten Sache besteht („aequalitas quaedam intellectus vel signi ad rem intellectam et signatam“; Summa theologiae II.II q. 109, a. 1 conc.), und zum anderen jene Wahrheit (im Sinne der Ehrlichkeit), durch die jemand etwas Wahres sagt. Dieses „Sagen“ kann mittels beliebiger, in einem sehr weiten Verständnis genommener Zeichen erfolgen: „ille qui dicit verum, profert aliqua signa conformia rebus, scilicet vel verba, vel aliqua facta exteriora, aut quascumque res exteriores“ („Jener, der Wahres sagt, bringt gewisse den Dingen gemäße Zeichen hervor, nämlich entweder Worte oder gewisse äußere Tätigkeiten oder irgendwelche äußeren Dinge“; q. 109, a. 1 ad 3). Entscheidend für die moralische Beurteilung ist nicht die Art der Zeichen, sondern nur, daß sie durch Handlungen gegeben werden, die der Herrschaft des Willens („imperium voluntatis“) unterliegen (ebd.). Entsprechend beziehen sich seine Ausführungen über die Lüge sowohl auf sprachliche Aussagen wie auf nichtsprachliche Täuschungen, wie etwa die „simulatio“ (Verstellung). Entscheidend ist nur, daß diese Manifestationen bewußt intendiert sind, und nicht, wie bei den Tieren, die eben deshalb nicht lügen können, auf einem natürlichen Instinkt beruhen. Das Feld der lügentheoretisch relevanten Zeichen ist damit weit gefaßt; es deckt sich präzis mit dem von Eco bestimmten „semiotischen Bereich“: „Eine Zeichen-Funktion liegt immer dann vor, wenn es eine Möglichkeit zum Lügen gibt. […] Die Möglichkeit zum Lügen ist für die Semiose das proprium […]. Wo Lüge ist, da ist auch Signifikation. Wo Signifikation ist, da ist auch Möglichkeit zum Lügen. Wenn das stimmt (und es ist methodologisch notwendig, das zu behaupten), dann haben wir eine neue Grenze des semiotischen Bereichs gefunden […]“ (Eco 1976 ⫽ 1987: 89). Zur Bestimmung der Lüge als eines moralischen Akts muß nach Thomas an dieser eine dreifache Falschheit unterschieden werden: 1. die Falschheit im materialen Sinne (falsitas materialiter) als die objektive Unwahrheit der Äußerung, 2. die Falschheit im formalen Sinne (falsitas formaliter) als die willentlich intendierte Falschheit und 3. die Falschheit im effektiven (oder pragmatischen) Sinne (falsitas effective) als die inten-
49. Zeichenkonzeptionen in der Philosophie
dierte Wirkung („voluntas falsitatem imprimendi). Diese drei Momente kommen zwar in der Regel zusammen. Das wesentliche Bestimmungsmoment der Lüge ist für Thomas jedoch allein die formale Falschheit, d. h. daß jemand die Absicht hat, Falsches zu äußern („quod aliquid habet voluntatem falsum enuntiandi“; q. 110, a. 1 conc.).
8.
Die Entstehung einer ausgebildeten Zeichentheorie in der 2. Hälfte des 13. Jahrhunderts
Seit der Mitte des 13. Jahrhunderts zeichnet sich, besonders in Oxford, eine offenbar durch augustinischen Einfluß motivierte zunehmende Berücksichtigung des Zeichens als eines Grundbegriffs der „scientia sermocinalis“ ab (vgl. Biard 1989, 25⫺51): „Sermo totaliter signum est“ („Rede ist ganz und gar Zeichen“; Kilwardby 1976, 160). Zwar ist das Bewußtsein von der Zeichenhaftigkeit der Sprache als solches nichts Neues. Aus diesem erwachsen nun jedoch, zunächst im Rahmen der Grammatik, zeichentheoretische Erörterungen, die über das vorher übliche Maß deutlich hinausgehen. 8.1. Pseudo-Kilwardby (nach 1230 bis vor 1270) Pseudo-Robert Kilwardby eröffnet seinen Kommentar zum Priscianus maior ausgehend von Augustinus’ Dichotomie des Gegenstandsbereiches von Wissen („scientia omnis aut est de signis aut de rebus significatis“; Ps.-Kilwardby 1975, 1), mit einer ausführlichen Diskussion über die Möglichkeit einer eigenen Wissenschaft von den Zeichen („an possit esse scienta de signis“; 2 ff) und deren Verhältnis zu den Realwissenschaften (6 ff). Hierbei macht er deutlich, daß es gemäß den unterschiedlichen Arten des Zeichens verschiedene Wissenschaften von den Zeichen gibt („diversae sunt scientiae de signis“; 3). Da es Wissenschaft ausschließlich vom Allgemeinen geben kann, gründet deren Wissenschaftscharakter jeweils unter Abstraktion von den materiellen, zufälligen Bedingungen der Zeichen in der Betrachtung des Zeichens „sub ratione universalis abstracti a particularibus signis“ („im Begriff eines von den einzelnen Zeichen abstrahierten Allgemeinen“; 4). Während hinsichtlich der nicht auf einer Einsetzung beruhenden Zeichen, wie den natürlichen (z. B. Wirkung als Zeichen der Ursache) oder „moralischen“ (z. B. äußere
995 Handlungen als Zeichen des guten oder schlechten Willens), die Theorie der Zeichen nicht von der der Signifikate abgetrennt werden kann, so daß diese in den Gegenstandsbereich der „scientia naturalis vel moralis“ fallen (6), existiert für diejenigen Zeichen, die der Verstand sich als Instrument der Mitteilung seiner Begriffe bildet, eine eigenständige, als Verstandeswissenschaft („scientia rationalis“; 4) bestimmte Wissenschaft von den Zeichen (6). 8.2. Roger Bacon (ca. 1214⫺ca. 1293) Roger Bacon ist vielleicht der wichtigste, zumindest aber ⫺ soweit bekannt ⫺ der ausführlichste Autor der mittelalterlichen Zeichentheorie (vgl. Pinborg 1981; Maloney 1983; Howell 1987). Bacon entwickelt in De signis (ca. 1267; Bacon 1978), ausgehend von einer detaillierten Analyse des Zeichens und seiner Typologie, eine allgemeine Konzeption der „significatio“ („Bezeichnung“) sowie eine präzis ausgearbeitete Theorie des sprachlichen Zeichens (vgl. Biard 1989, 26). Die Theorie des Sprachzeichens ist damit wie bei Augustinus, auf den er sich beruft, integriert in eine allgemeine Theorie des Zeichens. Seine Bedeutung für die Geschichte der Zeichentheorie liegt dabei nicht so sehr in der Originalität der einzelnen Thesen als darin, daß er die über logische, grammatische und theologische Schriften verstreuten und zum Teil durchaus heterogenen Traditionssträngen entstammenden zeichentheoretischen Diskussionsansätze bündelt und zu einer allgemeinen Theorie des Zeichens systematisiert (vgl. Pinborg 1981, 405; Biard 1989, 30). 8.2.1. Die Bestimmung des Zeichens als Relation Nach Bacon gehört das signum in die Kategorie der Relation. Eine solche Konstatierung des relationalen Status des Zeichens hat durchaus Tradition. Bereits bei Sextus Empiricus deutlich formuliert (Adv. Math. VIII, 164; Pyrrh. Hypot. II, 117 ff). findet sie sich im 12. Jahrhundert z. B. im anonymen Tractatus de proprietatibus sermonum (vgl. de Rijk 1962⫺67, II/2.710). Ungefähr zeitgleich mit Bacon betont auch Bonaventura (ca. 1217⫺ 1274) ⫺ im sakramentaltheologischen Kontext ist dies nicht ungewöhnlich ⫺ den relationalen Charakter des Zeichens, wobei er den beiden Teilaspekten der dreistelligen Zeichenrelation, d. h. dem Signifikatsbezug einerseits und dem Rezipientenbezug andererseits, unterschiedliche Bedeutung zumißt:
996 „Signum duplicem habet comparationem: et ad illud quod significat, et ad illud cui significat, et prima est essentialis et habet ipsam semper in actu, secundum autem habet in habitu; et a prima dicitur signum, non a secunda. Unde circulus super tabernam semper est signum, etiam si nullus aspiciat“ („Das Zeichen hat eine zweifache Beziehung: sowohl zu demjenigen, das es bezeichnet, als auch zu demjenigen, dem es bezeichnet, und die erste ist die wesentliche und kommt dem Zeichen immer aktual zu, die zweite aber hat es habituell; und aufgrund der ersten wird es ein Zeichen genannt, nicht aufgrund der zweiten. Von daher ist der Kranz vor der Taverne [ein gebräuchliches Zeichen des Weinverkaufs] immer ein Zeichen, auch wenn ihn niemand betrachtet“; Bonaventura 4 Sent. d. 1 p. 1 art. un. q. 2 ad 3). Während bei den genannten Autoren mit der Bestimmung des Zeichens als Relation stets die Beziehung zum Signifikat in den Vordergrund gestellt wird, legt Bacon die Gewichtung anders und erklärt die Bezogenheit des Zeichens auf einen Zeichenrezipienten zur wesentlichen Relation des Zeichens: „Signum est in praedicamento relationis et dicitur essentialiter ad illud cui significat […]. Quia nisi posset aliquis concipere per signum, cassum esset et vanum, immo non erit signum, sed maneret signum solum secundum substantiam signi et non esset in ratione signi, sicut substantia patris manet quando filius est mortuus et non relatio paternitatis.“ („Das Zeichen gehört zur Kategorie der Relation und wird wesensmäßig auf das hin ausgesagt, dem es etwas bezeichnet […]. Denn könnte niemand etwas durch das Zeichen erfassen, wäre es unnütz und nichtig, ja es wäre gar kein Zeichen, sondern bliebe nur seiner Substanz, nicht aber seinem Begriff nach ein Zeichen. So, wie auch die Substanz des Vaters bestehen bleibt, wenn der Sohn gestorben ist, nicht aber die Relation der Vaterschaft“; Bacon 1978 § 1). Anders als der essentielle Bezug zum Zeichenrezipienten ist derjenige zur bezeichneten Sache („res significata“ meint hier tatsächlich existierende Dinge der äußeren Realität) nur akzidentiell und dem des Wissbaren zum Wissen vergleichbar. Denn ebensowenig, wie die Existenz wissbarer Dinge ein tatsächliches Wissen von ihnen impliziert, kann, da man sowohl Seiendes wie Nichtseiendes zu bezeichnen vermag (§ 19), aus dem aktuellen Gegebensein eines Zeichens auf die wirkliche Existenz der bezeichneten Sache geschlossen werden. Erfordert wird lediglich ein gewisses
VIII. Das Mittelalter
Sein des Gegenstandes im Intellekt oder in der Vorstellung, da das, was in keiner Weise Gegenstand der Erkenntnis ist, auch nicht bezeichnet werden kann (§ 1). 8.2.2. Die Definition des Zeichens Bacon definiert das Zeichen als „illud quod oblatum sensui vel intellectui aliquid designat ipsi intellectui, quoniam non omne signum offertur sensui ut vulgata descriptio signi supponit, sed aliquod soli intellectui offertur“ („jenes, das, indem es dem Sinn oder dem Intellekt vorliegt, diesem Intellekt etwas bezeichnet. Denn nicht jedes Zeichen wird dem Sinnesvermögen dargeboten, wie die gewöhnliche Beschreibung des Zeichens voraussetzt, sondern es gibt auch eines, das allein dem Intellekt dargeboten wird“; § 2). Bacons Zeichendefinition scheint sich zwar in ihrer Formulierung an die augustinische anzulehnen. Sie modifiziert diese jedoch in einem entscheidenden Punkt, da sie vor dem Hintergrund der Bestimmung der geistigen Begriffe als Zeichen die Existenz nicht sinnlich erfaßbarer Zeichen zuläßt. Anders als in der Logik und Semantik des 14. Jahrhunderts spielen die geistigen Begriffe als Mentalzeichen bei Bacon aber noch keine zentrale Rolle innerhalb der zeichentheoretischen Erörterungen. 8.2.3. Die Klassifikation der Zeichen In bis dahin nicht anzutreffender Ausführlichkeit entwickelt Bacon in Anlehnung an die augustinische Einteilung des Zeichens, diese jedoch wiederum auf interessante Weise modifizierend, ein komplexes System der Zeichenklassifikation (vgl. Howell 1987, 76 ff; Eco et al. 1989, 17 ff) (siehe Abb. 49.3). Die oberste Einteilung ist die zwischen I., den signa naturalia (natürlichen Zeichen), und II., den signa ordinata ab anima ad significandum, d. h. den von der Seele zum Bezeichnen bestimmten Zeichen (§ 3) bzw. dem „signum datum ab anima“ („von der Seele gegebenen Zeichen“; 1988, 58). I. Das signum naturale: Die natürlichen Zeichen sind dadurch charakterisiert, daß sie aus ihrem eigenen Wesen und nicht durch eine Absicht der Seele den Begriff des Zeichens annehmen („ex essentia sua et non ex intentione animae signi rationem recipiunt“; 1978 § 3). Das signum naturale ist, gemäß den Gründen, die es als Zeichen konstituieren, in drei Gattungen („genera“) geteilt, nämlich in I.1. Zeichen der Schlußfolgerung („illatio“), I.2. Zeichen aufgrund einer Übereinstimmung („conformitas“) zum Signifikat
997
49. Zeichenkonzeptionen in der Philosophie
Abb. 49.3: Die Klassifikation der Zeichen nach Roger Bacon.
und I.3. Zeichen aufgrund eines kausalen Abhängigkeitsverhältnisses vom Signifikat. Das inferentielle Zeichen (I.1) ⫺ später im Compendium studii theologiae spricht er vom signum „ex concomitantia naturali respectu sui signati“ („Zeichen aufgrund einer natürlichen Begleitung hinsichtlich seines Signifikats“; 1988, 56) ⫺ vermag sein Signifikat deshalb auf natürliche Weise zu repräsentieren, weil dieses entweder mit Notwendigkeit oder mit Wahrscheinlichkeit aus dem Zeichen erschlossen werden kann („propter hoc quod aliud necessario vel probabiliter infert“; 1978 § 4). Es ist damit weiter unterteilt in I.1.1 notwendige und I.1.2 wahrscheinliche Zeichen, welche sich nach den drei möglichen zeitlichen Verweisungsrichtungen (Gegenwart, Vergangenheit, Zukunft) weiter ausdifferenzieren. In seiner Bestimmung der ersten und für ihn wichtigsten Art des natürlichen Zeichens lehnt sich Bacon eng an die aristotelische Exposition des Enthymems am Ende der ersten Analytik (II c. 27, 70 b) an. Zugleich übernimmt Bacon hiermit die in den theologischen Darstellungen der Sakramentalzei-
chen gebräuchliche Unterscheidung von signum demonstrativum (anzeigendem Zeichen), signum prognosticum (vorausbedeutendem Zeichen) und signum rememorativum (Erinnerungszeichen) (vgl. Bonaventura 4 Sent. d. 1 p. 1 art. un. q. 2 ad 4; Thomas von Aquin, Summa Theologiae III, q. 60 a. 3; 4 Sent. d. 1 q. 1 a. 1). So kann sowohl das notwendige Zeichen Gegenwärtiges (Beispiel: große Extremitäten als Zeichen der Stärke), Zukünftiges (Beispiel: Morgendämmerung als Zeichen des Sonnenaufgangs) und Vergangenes (Beispiel: Milchhaben der Frau als Zeichen einer voraufgegangenen Geburt) bezeichnen, wie auch das wahrscheinliche Zeichen (Beispiel: Krankheitssymptome; Abendrot als Zeichen für schönes Wetter; aufgeweichte Erde als Zeichen für Regen). Die Zeichen der zweiten Gattung des signum naturale (I.2) gründen in der Übereinstimmung und Gleichförmigkeit in den Teilen und Eigenschaften einer Sache in Hinsicht einer anderen („conformitas et configuratio unius rei ad aliud in partibus et proprietatibus“; 1978 § 5). Hierzu zählen die Bilder, Gemälde und
998 Ähnlichkeiten (imagines, picturae, similitudines) ebenso wie die sinnlichen Erkenntnisbilder (species colorum). Diese beiden Gattungen des inferentiellen und ikonischen natürlichen Zeichens sind nach Bacon im eigentlicheren Sinne Zeichen als die dritte Gattung der auf einem Kausalitätsverhältnis beruhenden signa naturalia (I.3). Als Grund für die lediglich eingeschränkte Anerkennung der Kausalbeziehungen als Bezeichnungsverhältnis (im Compendium studii theologiae fällt diese Zeichengattung dann ganz aus) verweist Bacon auf eine fundamentale Differenz zwischen den Kausal- und den Zeichenrelationen: Während Zeichenrelationen erst durch einen Interpreten konstituiert werden, existieren Kausalrelationen auch unabhängig von einem solchen allein aufgrund der Naturordnung („secundum ordinem naturae una res est causa alterius non habita comparatione ipsarum ad virtutem cognoscentem, sed solum facta comparatione eorum inter se. Relationes autem signi et significati et eius cui fit significatio attenduntur per comparationem ad animam apprehendentem“; 1978 § 6; vgl. 1988, 58; vgl. Maloney 1983, 10 f). II. Das von der Seele gestiftete Zeichen: Die zweite Hauptklasse bildet das signum ordinatum ab anima (von der Seele gesetzte Zeichen) als jenes, das sein Zeichensein einer intentio animae (Intention der Seele) verdankt („ex intentione animae recipiens rationem signi“; 1978 § 7), wobei mit „intentio animae“ hier offenbar weder ausschließlich ein geistiger Begriff noch ein Willensakt gemeint ist, sondern allgemein ein Zustand der Seele. Denn das Vorhandensein oder Fehlen eines solchen Willensaktes oder einer Überlegung wird zum Kriterium der weiteren Unterteilung dieser Zeichenklasse in solche, die (II.1) „cum deliberatione rationis et electione voluntatis, sive ad placitum, sive ex proposito“ („mit einer Überlegung des Verstandes und einem Willensentschluß bzw. willkürlich oder vorsätzlich“; § 7) bezeichnen, und solche, die (II.2) auf einem unmittelbaren Impuls der Seele und einem natürlichen Instinkt beruhen („subito per privationem temporis sensibilis et quoddam instinctu naturali et impetu naturae“; § 8). Gehören zu der ersten Gattung z. B. die eingesetzten sprachlichen Ausdrücke oder als Zeichen instrumentalisierte Dinge, wie die im Schaufenster ausgestellten Waren als Zeichen für den Verkauf, so zur zweiten die tierischen aber auch viele menschliche Laute, wie z. B. die des Schmerzes oder der Bewunderung (§ 8). Eine Misch-
VIII. Das Mittelalter
form der beiden Gattungen bilden die Interjektionen (§ 9 f). Bacons Klassifikation erscheint inhomogen, da die von den erstgenannten signa naturalia unterschiedenen, auf seelischen Vorgängen beruhenden Zeichen ihrerseits Zeichen umfassen, die als natürlich charakterisiert werden können und traditionell zu den signa naturalia gezählt wurden (vgl. Eco et al. 1989). Diese Problematik der Duplizität des natürlichen Zeichens ist auch Bacon nicht entgangen, denn er legt ausführlich dar, daß sie aus der Äquivozität des Naturbegriffs resultiert, der einmal als „Substanz oder Wesen irgendeines Dinges“ („substantia sive essentia cuiuslibet“), ein anderes Mal als „ohne Überlegung handelnde Kraft“ („virtus agens sine deliberatione“; § 14, vgl. 1988, 58) definiert wird. Während die erste Auffassung von Natur für die signa naturalia bestimmend ist, bildet die letztere das Kriterium für die auf natürliche Weise von der Seele gegebenen Zeichen. Bacon übernimmt nicht einfach die gängige Opposition von signum naturale und signum ad placitum, offenbar weil er sieht, daß einem so bestimmten natürlichen Zeichen wegen der Äquivozität des Naturbegriffs heterogene Klassifikationskriterien zugrunde liegen würden. Er lehnt sich eher an die das Faktum der Hervorbringung durch die Seele zum Kriterium machende augustinische Bestimmung des signum datum als Gegenbegriff zum signum naturale an (vgl. 1988, 58), weicht von Augustinus jedoch insofern ab, als er jene Bestimmung von „Natur“ (als „virtus agens naturaliter“), die er zwecks Vermeidung der Äquivozität vom signum naturale abgezogen hat, dem signum ordinatum subsumiert und hier zur Differenzierung des Modus der Zeichenproduktion verwendet. Anders als beim Augustinischen signum datum muß der Stiftungsakt nicht in jedem Fall überlegt oder vorsätzlich sein. Bacon erhält durch diese Neuordnung ein System der Zeichenklassen, von denen die einen, die signa naturalia, ihr Zeichensein der Natur oder dem Wesen des Zeichens und seiner Relation zum Signifikat verdanken, während die anderen, die signa ab anima ordinata, in der Relation des Zeichens zum Zeichenproduzenten gründen. Hierbei ist jedoch zu berücksichtigen, daß hinsichtlich der Baconschen Zeichenklassifikation dasselbe gilt wie für die übrigen mittelalterlichen Distinktionsmodelle: Die von Augustinus seinem klassisch gewordenen Diktum „omnis doctrina est de rebus vel signis“ angefügte Be-
49. Zeichenkonzeptionen in der Philosophie
merkung, daß jedes Zeichen zugleich auch ein Ding ist, impliziert nach dem Verständnis der mittelalterlichen Zeichentheorie keineswegs, daß die von ihr aufgestellten Zeichentypologien die Zeichen als Dinge oder Zeichenträger in eindeutiger Weise den Zeichenklassen zuordnen. Die Zeichenklassen distinguieren ⫺ wenngleich dies nicht explizit ausgesprochen wird ⫺ die Zeichen nicht als Zeichenvehikel, sondern funktional gemäß ihrer Zeichenrelationen und sind damit eigentlich Einteilungen der Bezeichnungsweisen. D. h. ein und dasselbe Ding, Ereignis etc. kann Zeichen in mehrfacher Hinsicht und damit in verschiedenen auch unmittelbar entgegengesetzten Zeichenklassen vertreten sein. So kann etwa ein sprachlicher Ausdruck 1) willkürliches oder gegebenes Zeichen eines äußeren Dinges, 2) auf alle drei Arten des signum naturale Zeichen des im Geist des Sprechers vorgestellten Lautbildes sowie 3) inferentielles signum naturale des dort vorhandenen Sachbegriffs sein. Auch kann, wie hiermit impliziert ist, etwas auf dieselbe Weise Verschiedenes bezeichnen. Der sprachliche Ausdruck bezeichnet als natürliches Zeichen der Inferenz sowohl das vorgestellte Lautbild wie den geistigen Sachbegriff. Worauf es für die Klassifizierung ankommt, ist der Grund des Zeichenseins, nicht der Seinsgrund desjenigen, das als Zeichen fungiert. So sind die kunstvoll produzierten Bilder oder Gemälde, obwohl sie vorsätzliche Produkte des Künstlers sind, natürliche und nicht gegebene Zeichen des durch sie Dargestellten. Denn daß sie Produkte des Künstlers sind, ist ihnen als Werken, nicht aber als Zeichen wesentlich. Umgekehrt ist es ihnen als Werken akzidentiell, Zeichen zu sein. Denn daß sie bezeichnen, gründet nicht in der Tatsache ihrer Produktion durch den Künstler sondern in ihrer Ähnlichkeit gegenüber dem Dargestellten: Ob der Künstler will oder nicht, stets bezeichnet das Bild dasjenige, zu dem es in einer Ähnlichkeitsbeziehung steht (1978 § 15; vgl. 1988, 58). Bacon scheint sich zudem durchaus bewußt zu sein, daß auch ein und dasselbe Zeichen auf verschiedene Weise dasselbe Signifikat bezeichnen und somit zugleich mehreren Zeichenklassen zugeordnet werden kann. So, wenn in einem Heiligenbild etwa ikonische und konventionelle Momente zusammenkommen (vgl. 1988, 58; § 34). 8.2.4. Theorie der Sprachzeichen Die vornehmliche Intention („intentio principalis“) der zeichentheoretischen Analysen ist auch bei Bacon die Klärung semantischer
999 Fragen hinsichtlich der willkürlichen Zeichen, d. h. der sprachlichen Ausdrücke als Elemente natürlicher Sprachen (1978 § 16). Die Frage nach dem Signifikat der sprachlichen Ausdrücke ist das meistdiskutierte Problem der mittelalterlichen Semantik (vgl. Art. 50 § 4.). Nach Bacon muß die Klärung der Frage nach dem Signifikat sprachlicher Ausdrücke dreierlei berücksichtigen: 1) die Zeichenhaftigkeit der sprachlichen Ausdrücke unter Absehung von ihrer „impositio“ („Einsetzung“), 2) die Signifikation der sprachlichen Ausdrücke gemäß ihrer Einsetzung und 3) die Signifikation der sprachlichen Ausdrücke über ihre Imposition hinaus: 1) Jeder sprachliche Ausdruck kann unabhängig von seiner impositio als natürliches Zeichen fungieren (1978 § 16⫺18). Die Wörter sind Zeichen des Sprechers (z. B. als Anzeichen für sein Nahen) und sagen etwas über ihn (so, wie das qualitätsvolle Artefakt Zeichen des guten Künstlers ist). Darüber hinaus bezeichnen die sprachlichen Ausdrücke auf alle drei Arten des natürlichen Zeichens die Vorstellung des entsprechenden Lautbildes („species vocis“) im Geist des Sprechers sowie nach Art des inferentiellen natürlichen Zeichens den Begriff der bezeichneten Sache im Geist des Sprechers. Denn die signifikative Verwendung eines sprachlichen Ausdrucks setzt, weil, was nicht erkannt ist, nicht bezeichnet werden kann, die geistige Präsenz eines der bezeichneten Sache entsprechenden Erkenntnisbildes voraus (§ 165; vgl. 1988, 64). Die signifikative Beziehung zwischen dem sprachlichen Ausdruck („vox“) und dem geistigen Begriff („conceptus“) ist somit nurmehr eine der Inferenz. Der sprachliche Ausdruck ist Indiz oder Symptom des ihm notwendig in der Seele des Sprechers zugrunde liegenden geistigen Konzepts (Eco 1988, 197 ff). 2) Unter Berücksichtigung der impositio gewinnt bei Bacon das „ad placitum“ grundlegende Bedeutung (vgl. de Libera 1981, 212 f; Fredborg 1981, 87 ff). Bacon betont mit Nachdruck, daß die sprachlichen Ausdrücke als eingesetzte und damit gänzlich unserem Belieben unterworfene Zeichen alles mögliche, d. h. sowohl sich selbst, als auch a