170 9 15MB
German Pages 184 [188] Year 1997
Kooperation unter Egoisten
Scientia Nova Herausgegeben von Rainer Hegselmann, Gebhard Kirchgässner, Hans Lenk, Siegwart Lindenberg, Julian Nida-Rümelin, Werner Raub, Thomas Voss
Bisher erschienen u.a.: Robert Axelrod, Die Evolution der Kooperation Karl H. Borch, Wirtschaftliches Verhalten bei Unsicherheit Churchman/Ackoff/Arnoff, Operations Research James. S. Coleman, Grundlagen der Sozialtheorie Morton D. Davis, Spieltheorie für Nichtmathematiker Erklären und Verstehen in der Wissenschaft Evolution und Spieltheorie Bruno de Finetti, Wahrscheinlichkeitstheorie Robert Frank, Strategie der Emotionen Peter Kappelhoff, Soziale Tauschsysteme Bernd Lahno, Versprechen. Überlegungen zu einer künstlichen Tugend Klaus Manhart, KI-Modelle in den Sozialwissenschaften Moralische Entscheidungen und rationale Wahl Moral und Interesse Nagel/Newman, Der Gödelsche Beweis John v. Neumann, Die Rechenmaschine und das Gehirn Julian Nida-Rümelin, Kritik des Konsequentialismus Ökonomie und Moral Howard Raiffa, Einführung in die Entscheidungstheorie Erwin Schrödinger, Was ist ein Naturgesetz? Thomas Voss, Rationale Akteure und soziale Institutionen Hermann Weyl, Philosophie der Mathematik und Naturwissenschaft
Rudolf Schüßler
Kooperation unter Egoisten: vier Dilemmata 2. Auflage
R. Oldenbourg Verlag München 1997
Die Deutsche Bibliothek - CIP Einheitsaufnahme Schüßler, Rudolf: Kooperation unter Egoisten : vier Dilemmata / von Rudolf Schüßler. 2. Aufl. - München : Oldenbourg, 1997 (Scientia nova) Zugl. Kurzfassung von: München, Univ., Diss. ISBN 3-486-56325-4
© 1997 R. Oldenbourg Verlag GmbH, München Rosenheimer Straße 145, D-81671 München Internet: http ://w w w. oldenbourg .de Das Werk einschließlich aller Abbildungen ist urheberrechtlich geschützt. Jede Verwertung außerhalb der Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Dies gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Bearbeitung in elektronischen Systemen.
Umschlaggestaltung: Dieter Vollendorf Gedruckt auf säurefreiem, alterungsbeständigem Papier (chlorfrei gebleicht). Gesamtherstellung: WB-Druck, Rieden am Forggensee ISBN 3-486-56325-4
Inhalt Vorwort
VII
Einleitung
1
Allgemeines Eine Kette von Dilemmas
1 6
Kapitel 1: K o o p e r a t i o n z w i s c h e n w e n i g e n Partnern
18
1.1. 1.1.1. 1.1.2. 1.2.
22 26 33 38
Axelrods „Die Evolution der Kooperation" Das „Leben-und-leben-lassen-System" Diskussion von Axelrods Ergebnissen Colemans offenes Modell
Kapitel 2 : K o o p e r a t i o n in g r o ß e n G e m e i n s c h a f t e n 2.1. 2.2.
Kooperation im n-Personen-Gefangenendilemma ohne Ausschlußoption Kooperation im n-Personen-Gefangenendilemma mit Ausschlußoption
44 45 52
K a p i t e l 3 : K o o p e r a t i o n auf a n o n y m e n Märkten
61
3.1. 3.2. 3.2.1. 3.2.1.1. 3.2.1.2. 3.2.1.3. 3.2.2. 3.2.3. 3.2.4. 3.2.4.1. 3.2.4.2
61 66 68 68 71 76 78 89 91 91 93
Freiwillig iteriertes Spiel versus unfreiwilliges Superspiel Ein Modell atomistischer Kooperation Das Modell freier Kooperation Die Spielstruktur Der evolutionäre Prozeß Die Strategien Simulationsergebnisse Eine zweite Evolutionsdynamik Diskussion der Ergebnisse Die Notwendigkeit von Normen Minimale Bedingungen egoistischer Kooperation
Kapitel 4 : D e g r a d a t i o n s s p i e l e u n d e i n D i l e m m a der Teamproduktion 4.1. 4.1.1. 4.1.2.
Finites Gefangenendilemma und Degradationsspiel Die evolutionäre Stabilität von Degradationsspielen Eine dynamische Analyse eines Degradationsspieles
96 98 104 107
VI
Inhaltsverzeichnis
4.2. 4.2.1. 4.2.2.
Ein Dilemma der Gemeinschaftsproduktion eines kollektiven Gutes Das Degradationsdilemma Computersimulation des Degradationsdilemmas
Schluß Anmerkungen Anmerkungen Anmerkungen Anmerkungen Anmerkungen
114 115 119 135
zur Einleitung zu Kapitel 1 zu Kapitel 2 zu Kapitel 3 zu Kapitel 4
146 148 150 153 156
Anhang
159
Literatur
165
Register
175
Vorwort zur zweiten Auflage
Das Vorwort zur zweiten Auflage eines Buches ermöglicht es einem Autor, in der Regel aus der Distanz mehrerer Jahre, rückblickend zum eigenen Werk Stellung zu nehmen. Diese Chance möchte ich im folgenden ergreifen und einige zentrale Thesen des Buches im Lichte von Entwicklungen kommentieren, die seit der Erstveröffentlichung eingetreten sind. Das Modell des dritten Kapitels zur freiwilligen Wiederholung eines Gefangenendilemmas mit demselben Partner unter den Bedingungen weitgehender Anonymität der Individuen, bildet den Teil des Buches, der weitaus am meisten Beachtung gefunden hat. Es behandelt die strategischen Möglichkeiten in sozialen Dilemmasituationen zwischen zwei Partnern, die durch die Drohung mit dem Wechsel des Partnern entstehen. Diese - recht naheliegende - Drohung war von spieltheoretischen Untersuchungen lange sträflich vernachlässigt worden. Ein Bild, das sich jedoch aufgrund einer wachsenden Zahl von Untersuchungen wandelt, die einer Trennung von Partnern Rechnung tragen. Die Option des Ausstiegs aus einer Partnerschaft ist in diesem Zusammenhang inzwischen als Grundlage einer wirksamen Drohung anerkannt worden, die zum Entstehen egoistischer Kooperation führen kann. Insofern freue ich mich, eine neue Entwicklung in der spieltheoretischen Analyse von kooperationsfbrdernden strategischen Mechanismen mit vorangetrieben zu haben. Was im Lichte weiterer Entwicklungen überrascht, ist die extreme Robustheit der egoistischen Kooperation bei gegebener, einfacher Trennungsmöglichkeit, die eigene Folgeuntersuchungen mit immer wieder variierten Modellen ebenso bestätigen wie die Untersuchungen anderer. Diese Robustheit der egoistischen Kooperation in verschiedenen Modellen freiwillig wiederholter Interaktion scheint geeignet, die im Buch vorgebrachte Kritik an normativistischen Blickverengungen in der sozialwissenschaftlichen Theoriebildung zu unterstreichen. Während die kürzlich auch nach Deutschland gelangte Diskussion um den amerikanischen Kommunitarismus im wesentlichen nur die älteren (und überlegenen) Positionen z.B. eines Dürkheim aufwärmt, zeigt es sich, daß zweierlei klar unterschieden werden sollte: die moralische Erwünschtheit der Wertbindung von Individuen und die
Wertbindung als Erfordernis der Funktionstüchtigkeit moderner Gesellschaften. Beides zu vermengen mag gute Politik sein, aber es ist schlechte Sozialwissenschaft, zumal spieltheoretische Gedankenexperimente der Annahme einer selbstverständlichen Verschränkung beider Fragestellungen widersprechen. Zuletzt sei noch allen Kommentatoren und Diskussionspartnern Dank gesagt, die mich nach dem Erscheinen des Buches beim Nachdenken über seine Thematik vorangebracht haben. Es sind zu viele, als daß ich sie hier einzeln aufführen könnte. Gesondert erwähnen möchte ich aber doch die Mitglieder der Duisburger studentischen Arbeitsgruppe "Evolution der Kooperation", mit denen zusammen ich in den letzten Jahren meine Untersuchungen zur freiwillig wiederholten Kooperation fortgeführt und an neuen Untersuchungen teilgenommen habe. Rudolf Schüßler Duisburg, im Juli 1997
EINLEITUNG Allgemeines Eine namhafte Tradition sozialtheoretischen und -philosophischen Denkens beschäftigt sich mit den Gefahren des individuellen Egoismus für die Gesellschaft. Ihre Thesen wurden vielfach von der politischen Alltagsdiskussion übernommen. So erscheint zweifelhaft, ob unter reinen Egoisten überhaupt ein geordnetes Sozialleben stattfinden kann (vgl. Dürkheim 1977; Parsons 1949). Anarchistische Gesellschaftstheorien werden immer wieder als weltfremd abgestempelt, weil ihr optimistisches Bild des Individuums dessen eigensüchtige Tendenzen ungenügend berücksichtigt. Und Hoffnungen auf freiwillige Anstrengungen der Individuen in Sachen Umweltschutz erfahren eine qualifizierende Einschränkung durch den Hinweis auf die zu erwartende Dominanz der Einzelegoismen. Zu diesen klassischen Problemen egoistischer Kooperation wird die vorliegende Arbeit Stellung nehmen. Sie folgt dabei einem "neoutilitaristischen" Forschungstrend, der die sozialen Folgen des Egoismus der Individuen mit Hilfe formaler Modelle zweckrationalen Verhaltens untersucht (vgl. Becker 1976, Boudon 1979, Coleman 1973, Lindenberg 1983, Opp 1978, Raub/ Voss 1981, Wippler 1978)1. Dabei treten vor allem einfache Modelle strategisch interdependenten Handelns in den Vordergrund, wie sie im Rahmen der Spieltheorie (vgl. Friedman 1986; Luce/Raiffa 1957; v.Neumann/Morgenstern 1944) entwickelt wurden. Computergestützte Gedankenexperimente zeigen ausgehend von Axelrod (1987), Olson (1968), Raub und Voss (1986), Taylor (1976,1987) und anderen, inwieweit soziale Dilemmas des individuellen Egoismus gelöst werden können, ohne auf die Annahme zu verzichten, daß die Akteure allein ihr Eigeninteresse verfolgen. Mit dem Ziel, einen eigenen Beitrag zu leisten, greift die Untersuchung aber auch neue, in der Literatur noch nicht abgehandelte Probleme auf. Ihre wichtigsten Fragen lauten: Ist ein atomistisch-anomischer Kapitalismus zum Scheitern verdammt? Welche Mechanismen sichern egoistische Kooperation auf freien Märkten gegen Betrug und Gewalt? Werden die sozialen Dilemmas, die moderne Gesellschaften bedrohen, immer bösartiger?
2
Einleitung
Die Erörterung dieser Fragen darf allerdings keine einhellige Unterstützung erwarten. Das skizzierte neoutilitaristische Programm in der Soziologie steht in deutlichem Widerspruch zu den Intuitionen des soziologischen common sense und der Hauptströmung des Faches. Unter vielen Soziologen gilt die Existenz normativ vermittelter, nichtegoistischer Motive ebenso wie die Fehlerhaftigkeit und Irrationalität vieler Handlungen als gesichertes Wissen. Die Annahme rein egoistischen, rationalen Verhaltens wird als weltfremd abgelehnt. Hinzu kommt eine verbreitete Abneigung gegen formale Modellbildung, die erstens mathematisch schwierig werden kann und zweitens einen Verzicht auf die liebevolle Kolorierung von Lebenswelten erfordert. Es scheint daher angebracht, einleitend etwas Legitimationsarbeit für die hier gewählte Perspektive zu leisten. Grundsätzlich sei für eine vorsichtige Interpretation der Möglichkeiten und Ergebnisse des neoutilitaristischen Programmes plädiert, denn auch auf seinem Boden wachsen die Theoriebäume nicht in den Himmel. Dennoch wird hoffentlich im Verlauf der Untersuchung deutlich werden, daß einige für die allgemeine sozialwissenschaftliche und -philosophische Diskussion interessante Resultate nur auf dem hier eingeschlagenen Weg der formalen Analyse erreicht werden können. Die Annahme rein egoistischen Verhaltens läßt sich wahrscheinlich am leichtesten aufrechterhalten, wenn ihre empirische Falschheit eingestanden wird. Menschen sind weder vollständig rational, noch allzeit egoistisch. Trotzdem macht es Sinn, das Modell des homo oeconomicus in den Sozialwissenschaften zu verwenden, und sei es nur als "Was wäre, wenn"-Betrachtung zum Risiko der egoistischen Entgleisung sozialer Systeme. Dazu reicht es aus, daß soziale Akteure tatsächlich oft den Eigennutz über die Gebote solidarischen oder moralischen Handelns stellen. Gesellschaftliche Dilemmas sind dadurch charakterisiert, daß egoistisches Verhalten besondere Probleme für die Wohlfahrt einer Gemeinschaft aufwirft. Die Unterstellung des rationalen Egoismus bietet sich daher auf natürliche Weise zur Untersuchung von möglichen, ungünstigen Entwicklungen in diesen Dilemmas an. Der Erkenntnisstand der Sozialwissenschaften weckt zudem kaum Vertrauen in ihre Fähigkeit zur zuverlässigen und flächendeckenden Vorhersage von menschlichem Verhalten. Nicht zuletzt um sich gegen diese Prognosedefizienz zu wappnen ist es ratsam, die Gefahren des individuellen Egoismus als schlimmsten Fall
Einleitung
3
menschlichen Handelns in vielen sozialen Dilemmas zu untersuchen^. Empirische Daten, die gegen den rationalen Egoismus sprechen, schränken die Angemessenheit des risikoscheuen "Was-wäre-wenn"-Kalküls nur begrenzt ein. Angenommen Akteurin X möchte sich einen Gebrauchtwagen kaufen. 70% der Gebrauchtwagenhändler sind immer ehrlich, während 30% ab und zu ihre Kunden über's Ohr hauen. Trotz der größeren Prozentzahl aufrichtiger Händler wird eine kluge Kundin dem Verkäufer mißtrauen, ihn behandeln, als ob er nur an seinem Profit interessiert wäre, und den Wagen gründlich inspizieren. Eine rationale Kundin legt das Modell des amoralischen, rationalen Egoisten ihrer Situationsbeurteilung zugrunde, obwohl sie weiß, daß es nur in der geringeren Zahl der Fälle zutrifft. Ähnliche Überlegungen scheinen angebracht, wenn Vorkehrungen gegen bestimmte gefährliche Entwicklungstendenzen von sozialen Systemen zur Debatte stehen. Soziologische Klassiker wie Dürkheim nehmen an, daß die normative Sozialisation der Individuen zum Verfall tendiert. Sie wird unterminiert von der unablässig wühlenden Kraft egoistischer Triebe, gegen die ein Sicherungsnetz sozialer Bindungen eingerichtet und ständig verteidigt werden muß. Jedes Nachlassen der moralischen Spannkraft im Individuum und jede Nachlässigkeit der Gesellschaft hinsichtlich der Aushöhlung ihrer Grundwerte kann das Sicherungsnetz zum Reißen bringen^. Heute wie zu Dürkheims Zeiten dient diese Argumentation dazu, individualistische und libertinistische Tendenzen in einer Gesellschaft zu bekämpfen. Ein Nachweis der prinzipiellen Möglichkeit rein egoistischer Kooperation würde Bestrebungen zur Verteidigung ewiger Werte viel von ihrem Impetus rauben. Wenn soziale Ordnung auch ohne Moral und normative Sozialisation möglich ist, warum nicht etwas mehr freien Geist wagen? Wie immer man zu dieser Frage stehen mag, sie zeigt, daß auch die sozialtheoretische Argumentation auf prinzipieller Ebene in gesellschaftspolitischen Debatten eine wichtige Rolle spielen kann. Außerdem läßt sich die Rechtfertigung der Egoismusannahme nun zusammenfassen. Das Modell des rationalen Egoismus wird relevant, wenn - angenommen werden darf, daß Menschen sich tatsächlich wie rational kalkulierende Egoisten verhalten.
4
Einleitung
- die mehr oder weniger akute Gefahr besteht, daß der Egoismus sich als Handlungsmotiv stark ausbreitet und die soziale Solidarität beeinträchtigt. - ungewiß ist, wie Menschen in bestimmten Situationen handeln werden, und egoistisches Verhalten häufig auftritt oder besondere Risiken birgt. Die gegenwärtige Untersuchung wird den Blickwinkel der beiden letzten Alternativen einnehmen, und nicht nach empirisch prüfbaren Modellen suchen. Sie behandelt soziale Dilemmas, in denen die Verfolgung des Eigeninteresses mit der Wohlfahrt der Gemeinschaft konfligiert unter einem "Was wäre, wenn"-Gesichtspunkt. Was wäre, wenn die Anonymität moderner Gesellschaften und der Egoismus ihrer Akteure immer weiter zunimmt? Was geschieht, wenn ein Staat die normative Akzeptanz bei seinen Bürgern verliert? Dürfen wir erwarten, daß sich die Dilemmas des Umweltschutzes durch moralische Einsicht aller Beteiligten lösen lassen? Von den äußerst restriktiven Prämissen vollständiger Information und vollkommener Zweckrationalität, die dem Kern der neoklassischen Ökonomie entstammen, nehmen die hier behandelten eigenen Modelle so gut es geht Abstand. Sie unterscheiden sich auch in anderer Hinsicht deutlich von den Marktmodellen der herrschenden ökonomischen Lehre. Sie stellen eine Art computergestützter Gedankenexperimente dar und bekämpfen oft intuitiv plausible und von der Sozialtheorie weithin akzeptierte Thesen. Eben deshalb erscheint die formale Methode unverzichtbar, denn das unmittelbar Plausible gibt man zugunsten des Unerwarteten nur auf, wenn ein halbwegs strenger und präziser Nachweis dafür spricht. Die formalen Modelle, von denen so viel abhängt, entstammen der mathematisch-ökonomischen "Theorie der Spiele". Die Spieltheorie beschäftigt sich - was ihr harmloser Name nicht zu erkennen gibt - mit Problemen der strategischen Interdependenz von Individuen, denen verschiedene Handlungsalternativen zur Verfügung stehen. Sie läßt sich immer dann anwenden, wenn das Ergebnis des Handelns eines Akteurs von der Handlungswahl anderer Akteure abhängt. Kennzeichnend für die Spieltheorie ist der Einsatz eines mathematisierten Entscheidungskalküls. Mögliche Handlungen und Handlungsergebnisse werden als strategische
Einleitung
5
Determinanten bestimmter Interaktionssituationen in einer quantifizierten "Spielstruktur" zusammengefaßt und Anleitungen für zweckrationales, meist egoistisches Verhalten in diesem "Spiel" entwickelt. Auf diese Weise lassen sich Kooperationsprobleme präziser fassen und analysieren als im Rahmen verbaler Argumentation. Zugleich bedingt die spieltheoretische Modellierung strategischer Interdependenz, daß eine Vielzahl in der sozialen Realität gegebener Einflußfaktoren ausgegrenzt werden. Der Chance eines präzisen Nachweises der Möglichkeit egoistischer Kooperation in einem Spielmodell steht damit die Gefahr des mangelnden Realitätsbezuges gegenüber. Sowohl mit der Chance, wie mit der Gefahr wird sich die vorliegende Arbeit befassen, wenn sie die prinzipielle Möglichkeit von egoistischer Kooperation in bestimmten Dilemmas erörtert. Die Kenntnis der grundlegendsten spieltheoretischen Konzepte wie der Matrixnotation von Spielen in Normalform, des Nash-Gleichgewichtes, der Dominanz etc. wird im weiteren vorausgesetzt. Wer sie nicht kennt, findet im Anhang einen kurzen, lexikonartigen Abriß einiger in der Arbeit häufiger verwendeten Grundbegriffe der Spieltheorie. Besser wäre es natürlich, diese Konzepte ausführlicher in der einschlägigen Einführungsliteratur nachzulesen. Der Verzicht auf spieltheoretische Präliminarien erleichtert das erklärte Ziel der Arbeit, mit möglichst wenig formaler Darstellung auszukommen. Nur an wenigen Stellen wird es nötig sein auf tieferliegende Techniken der Spieltheorie zurückzugreifen, und selbst dann werden die technischen Teile der Analyse nicht vorgeführt. Die vielleicht etwas schwieriger zu verstehende qualitative Analyse eines Systems von Differentialgleichungen in Abschnitt 4.1.2. kann ohne allzu große Verluste für den Gesamtzusammenhang der Arbeit übergangen werden. Spieltheoretische Analysen zur Kooperationsproblematik beziehen sich meist auf das Gefangenendilemmaspiel (Prisoner's Dilemma = PD), das paradigmatisch für die formale Behandlung von sozialen Dilemmas geworden ist^. Das Gefangenendilemma erfaßt in maximal vereinfachter Schematisierung den Widerspruch zwischen kollektiver und individueller Rationalität, der unter der Annahme rational egoistischen Verhaltens der Akteure entsteht. In einer Gruppe von Individuen, die gemeinsam etwas produzieren wollen, besitzt jeder rationale Egoist^ einen Anreiz, wenig zum Gesamtprodukt beizutragen und von den Anstrengungen der anderen mit zu profitieren. Sofern jedoch alle Akteure diesem Kalkül folgen, wird das erstrebte Produktionssoll nicht erbracht, worunter alle mehr lei-
6
Einleitung
den, als wenn jeder einen angemessenen Beitrag geleistet hätte. Alle hier vorgestellten Dilemmas sind Erweiterungen auf der Basis des PDGrundmodells. Das Feld spieltheoretischer Kooperationsanalysen wurde in den letzten Jahrzehnten fleißig bestellt, und die Untersuchung profitiert von mehr Arbeiten, als sie selbst wiederzugeben vermag. Die Vielzahl der Beiträge setzt einen kumulativen Erkenntniszuwachses in Gang, der die Grundprinzipien und Probleme egoistischer Kooperation nach Art eines vollständiger werdenden Puzzles besser verstehen hilft, wobei an tausend mehr oder minder bedeutsamen Enden Forscher an der Komplettierung des Puzzles arbeiten. Für die gegenwärtige Darstellung erwachsen daraus Schwierigkeiten der Integration und Gewichtung verschiedener Forschungsrichtungen und Modellierungsideen. Grundsätzlich wurde sozialtheoretisch relevanten Fragestellungen der Vorzug vor mathematischtechnisch interessanten Problemen gegeben. Den Kern der Arbeit bildet eine historische Stufenfolge sozialer Dilemmas, deren chronologische Ordnung den Leitfaden für den Aufbau der Untersuchung abgibt. Diese innere Struktur der Darstellung soll nun etwas genauer beleuchtet werden.
Eine Kette von Dilemmas Die Probleme egoistischer Kooperation, die hier und teilweise in der spieltheoretischen Literatur im Mittelpunkt des Interesses stehen, lassen sich chronologisch nach der Reihenfolge ordnen, in der sie für menschliche Gesellschaften virulent werden. Es handelt sich um vier strukturell verwandte Dilemmas, die jedoch in der Sozialphilosophie und -theorie weitgehend unabhängig voneinander prominent geworden sind. Untersucht werden die Fragen: - der Entstehung und Stabilität egoistischer Kooperation in kleinen Gruppen. - der sozialen Ordnung bzw. Kooperation in größeren Gemeinschaften, und ihrer Stabilität in einem moralfreien Machtstaat (Hobbes' Problem 6 ).
Einleitung
7
- der Ausbreitung von Betrug und Gewalt in einem egoistischen und anonymen System des Tausches auf freien Märkten. - der Gruppenproduktion unter hierarchischer Kontrolle, aber ohne internalisiertes Arbeitsethos. Ein weiteres Problem wird erst im Schlußteil vor dem Hintergrund der erzielten Ergebnisse angesprochen: die Umweltdilemmas moderner Gesellschaften. Die Auflistung der einzelnen Problemkomplexe entspricht - in grober Näherung - ihrem Auftreten im Evolutionsprozeß von Gesellschaften. Primitive Gesellschaften müssen zunächst Solidarität unter wenigen Individuen schaffen, um zu überleben. Strukturell wird diese Aufgabe immer schwieriger, je größer eine Gesellschaft wird, und schließlich muß eine hierarchische Gliederung mit einem "Erzwingungsstab" entstehen, der über Sanktionsmittel gegen Akteure verfügt, die von sozialen Normen abweichen. Auf dieser Stufe treten zwei charakteristische Probleme auf. Kann man die Stärke dieses gefährlichen und potentiell unterdrückerischen Machtapparates in engen Grenzen halten, oder kann vielleicht ganz auf ihn verzichtet werden? Und: Reicht die Sanktionsgewalt von zentralisierten Instanzen aus, den individuellen Egoismus zu zügeln, selbst wenn die soziale Solidarität immer mehr nachläßt? Bei noch späteren Gesellschaften industriellen Typs gewinnen vor allem Dilemmas der wirtschaftlichen Interaktion an Bedeutung. Kapitalistische Systeme werden durch das Risiko bedroht, daß die Dynamik freier Märkte, die den Egoismus und den anonymen Austausch fördert, die für sie selbst konstitutive Vertrags- und Vertrauenssicherheit beim Wirtschaftshandeln untergräbt. Markt- und Planwirtschaften gemeinsam ist das Problem, ob durch Kontrolle allein die Leistungskraft von Teams gesteigert oder erhalten werden kann, oder ob die Schwierigkeiten der Leistungsüberprüfung es erforderlich machen, die Akteure via Sozialisation mit einem angemessenen Arbeitsethos "auszustatten". In neuester Zeit kommen schließlich vermehrt die Probleme der Umweltverschmutzung und der gemeinsamen Nutzung erschöpfbarer Ressourcen hinzu, die moderne Gesellschaften vor früher ungeahnte Existenzprobleme stellen. Im Rahmen dieser Untersuchung soll deutlich werden, daß
8
Einleitung
die historische Abfolge auch eine qualitative Steigerung der Bösartigkeit der sozialen Dilemmas in einem spieltheoretisch, strukturellen Sinn beinhaltet. Es lohnt sich daher vorab, auch die Modellierung der behandelten Dilemmas etwas genauer zu betrachten. Das erste Problem der egoistischen Kooperation in kleinen Gruppen wurde in spieltheoretischen Untersuchungen bislang intensiv erörtert und als ein wiederholtes Zwei-Personen-PD schematisiert^. Es ist besonders deshalb interessant, weil es nicht nur primitive Gesellschaften, sondern die prinzipielle Möglichkeit des Entstehens von Kooperation aus einem hypothetischen Hobbesschen Urzustand verstreuter, rein egoistischer Akteure heraus betrifft. Seine Lösung stellt einen ersten Schritt zur Erklärung der evolutionären Genese von sozialer Kooperation auch in größeren Gesellschaften dar. Wie die Diskussion von Beiträgen von Axelrod und Coleman in Kapitel 1 zeigt, konnte der spieltheoretische Ansatz auf diesem Gebiet einen ersten, großen Erfolg erringen. Kooperation in kleinsten Gruppen ist prinzipiell mit rein egoistischen Motiven der Individuen verträglich. Als schwieriger erweist sich die Lage hinsichtlich der Lösbarkeit des Hobbesschen Ordnungsproblems in größeren Gruppen bzw. Gesellschaften, obwohl auch hier bereits einige wichtige spieltheoretische Untersuchungen vorliegen. Man muß zwischen einzelnen Teilaspekten des Hobbesschen Problemkonglomerates unterscheiden. Ein Teilproblem betrifft die Möglichkeit der Kooperation einer größeren Zahl von Egoisten durch einen Gesellschaftsvertrag auf freiwilliger Basis. Dabei wird postuliert, daß noch keine staatliche Instanz existiert, die die Einhaltung des Vertrages kontrollieren oder erzwingen könnte (vgl. die Analyse von Taylor in Kapitel 2). Im übrigen ist der Inhalt, auf den sich die erwünschte Kooperation rationaler Egoisten bezieht von größter Bedeutung für die Analyse selbst. Bei Hobbes und dem Problem sozialer Ordnung generell geht es im wesentlichen um eine staatliche Garantie des inneren Friedens, der sonst nicht aufrechterhalten werden könnte. Innerer Frieden bedeutet Schutz vor ungerechtfertigten Übergriffen anderer gegen Leben und Eigentum. Dieser Schutz stellt aber kein Problem öffentlicher Güter im engeren Sinne dar, wie es z.B. Taylors Untersuchung zugrunde liegt. Von Schutzleistungen können Individuen ausgenommen werden, und diese Ausschlußmöglichkeit führt zu neuen Chancen für das Entstehen von Kooperation, was anhand von Arbeiten von Bendor, Mookherjee und
Einleitung
9
Hirshleifer gezeigt wird (Kapitel 2). Bendor und Mookherjees Analysen erlauben es darüberhinaus, eine weitere Teilfrage der Hobbesschen Problematik aufzugreifen. Kann eine Zentralmacht nach ihrer Etablierung allein durch Sanktionsgewalt eine Gemeinschaft reiner Egoisten in Zaum halten? Die beiden ersten Kapitel begnügen sich damit, die vorhandene Literatur selektiv und kritisch zu referieren. In Kapitel 3 wird nun das erste eigenständige Modell dieser Arbeit vorgestellt und die Möglichkeit freiwilliger Austauschkooperation in einem atomistischen und anonymen sozialen System untersucht. Vor dem Hintergrund der soziologischen Theoriegeschichte erscheint diese Fragestellung nicht weniger bedeutsam, als das von der spieltheoretischen Modellierung einseitig bevorzugte Hobbesproblem. Seit Ende des 19.Jahrhunderts nähren führende Sozialwissenschaftler die Angst vor den destruktiven Nebenwirkungen eines immer umfassender und anonymer werdenden Kapitalismus. Um die Bedeutsamkeit dieser Furcht zu verdeutlichen, sei ein kurzer theoriegeschichtlicher Exkurs gewagt. Exkurs. Zweifel an der politischen, normativen und ökonomischen Stabilität einer Gemeinschaft reiner Egoisten existieren seit den Anfängen der Sozialtheorie. In der zweiten Hälfte des 19. Jahrhunderts gewann die Problemstellung jedoch eine neue Qualität. Die industrielle Revolution hatte ein verstärktes Bewußtsein von der Dominanz ökonomischer Zusammenhänge in modernen Gesellschaften geschaffen. Die Gesellschaft der Zukunft, deren Keime in der damaligen Gegenwart bereits erkennbar waren, wurde von führenden Sozialwissenschaftlern als reine Industriegesellschaft aufgefaßt. Ihr Gesicht wurde durch die Extrapolation säkularer Tendenzen der Moderne wie Individualisierung, Anonymisierung und Ökonomisierung bestimmt. Der mit dieser Projektion eng verbundene Verhaltenstypus des rationalen Egoismus galt entweder als zu erwartende Folge oder als nur mit Mühe vermeidbare Entgleisung der Entfaltung einer Industriegesellschaft. In beiden Fällen erhielt das Problem egoistischer Kooperation eine große Bedeutung für die Frage, ob man sich vertrauensvoll der Entwicklung der Moderne anvertrauen konnte, oder ob bremsende und steuernde Anstrengungen unternommen werden mußten. Anhand der drei Beispiele Tönnies, Spencer und Dürkheim®* soll dieser historisch geprägte, aber immer noch aktuelle Wandel der Egoismus(und Individualismus-) Problematik betrachtet werden.
10
Einleitung
Tönnies berühmte Unterscheidung zwischen "Gemeinschaft" und "Gesellschaft" dient nicht zuletzt der Analyse zeitgenössischer gesellschaftlicher Entwicklungen. Das läßt sich bereits an der Bedeutung des Begriffes "Gesellschaft" erkennen, der ein System individueller Akteure mit atomistischen Interessen bezeichnet (vgl. Tönnies 1935: 45). Im Gegensatz zur "Gemeinschaft" fehlt hier eine einheitliche, normative Ausrichtung der Individuen. Der soziale Wille, um Tönnies Terminologie zu gebrauchen, entbehrt in der "Gesellschaft" eines konkreten Inhaltes, während die "Gemeinschaft" natürliche, gemeinsame Ziele kennt. Die "Gemeinschaft" wird als vertrautes, heimliches, ausschließliches Zusammenleben (vgl. Tönnies 1935: 3) gedacht. Die "Gesellschaft" dagegen "ist die Öffentlichkeit, ist die Welt" (vgl. Tönnies 1935: 3). Der einzige materiale Inhalt des sozialen Willens in der "Gesellschaft" ist der freie Tausch (vgl. Tönnies 1935: 42). Tönnies definiert "Gesellschaft" damit immer schon gleichbedeutend mit Marktgesellschaft, deren oberstes Gebot in der Aufrechterhaltung des Marktsystems besteht, und die sich dem Weg überläßt, auf den die anonymen Kräfte des Marktes sie führen. Natürlich wußte Tönnies, daß selbst das radikalste laissez-faire-Marktsystem des 19. Jahrhunderts seinen Begriff von "Gesellschaft" nicht völlig widerspiegelte. Diese Konstruktion darf jedoch nicht allein als idealtypisch angesehen werden. Die von Tönnies beschriebene Form der "Gesellschaft" ist (Tönnies 1935: 53) "vielmehr ein fernes Ziel, in bezug worauf die Entwicklung der Gesellschaft begriffen werden muß." Der Begriff "Gesellschaft" umschreibt die erwartete Zukunft der Moderne. Als Endpunkt einer extrapolierten Entwicklung bleibt er als nie ganz erreichbare Grenze ideal, und gleichzeitig wird dieser Typus eines sozialen Systems in asymptotischer Näherung immer vollständiger realisiert. Explizit führt Tönnies den rationalen Egoisten als Repräsentanten des typischen Individuums in dieser "Gesellschaft" ein (Tönnies 1935: 163): "Der unbedingte Wille, sich zu bereichern macht den Kaufmann rücksichtslos und zum Typus des egoistisch-willkürlichen Individuums ... er ist der eigentlich gesellschaftliche Mensch".
Einleitung
11
Es zeigt sich, daß auch der homo oeconomicus für Tönnies kein idealtypisches oder direkt aus der empirischen Beobachtung gewonnenes Verhaltensmodell darstellt, sondern die kommende Form des universalen Kaufmanns in einer nur auf freiwilligen Tauschbeziehungen aufgebauten Gesellschaft. Er wird einst an die Stelle heutiger Mischtypen und Übergangsformen treten, an denen das geübte und weitblickende Auge allerdings schon den Charakter des zukünftigen ökonomischen Menschen erkennen kann. Gerade unter dieser Prämisse begründet das Faktum der empirischen Unauffindlichkeit eines echten homo oeconomicus nicht die generelle Zurückweisung des Modells. Sofern man der Extrapolation zustimmt, wird es interessant, nach den Implikationen der Universalisierung des rationalen Egoismus zu fragen. Zunächst nahm Tönnies an, daß kaum Gefahr vom Vordringen des ökonomischen Denkens ausgehen würde. Er betonte die positiven Züge des egoistischen Individualismus und sah den Kaufmann als ersten denkenden und freien Menschen, der im sozialen Leben erscheint (vgl. Tönnies 1935: 57). Das führt ihn in die Nähe eines Motives, das weiter oben bereits angesprochen worden ist. Wer die Bindungen an die Normen und Regeln des Gemeinschaftslebens negativ als Hindernisse für die Freiheit des Individuums auffaßt, wird ein System vorziehen, in dem diese Bindungen minimal werden und das dennoch stabil und geordnet funktioniert. Er muß daher an einem Nachweis der Möglichkeit, oder wenigstens an der Widerlegung der Unmöglichkeit, rein egoistischer Kooperation höchst interessiert sein. Dementsprechend erachtete Tönnies die gesamte, hier skizzierte Entwicklung als (Tönnies 1935: 185) "Bewegung hin zu einer Phase der sozialen Ordnung, die der freiwilligen Übereinstimmung von Individuen entspringt." Später gelangte er jedoch, ebenso wie Dürkheim, zu einer kritischeren Einschätzung der Selbststeuerungsfähigkeiten einer radikalisierten Marktgesellschaft. In einem Zusatz von 1922 zu "Gemeinschaft und Gesellschaft" spricht Tönnies von den (Tönnies 1935: 203) "furchtbaren Zerrüttungen, die das kapitalistisch-gesellschaftliche Weltsystem erfahren hat".
12
Einleitung
Optimistisches Vertrauen in die friedliche und befreiende Selbstentfaltung der abendländischen Industriegesellschaften erscheint ihm nicht mehr angebracht (was nach den Erfahrungen des I. Weltkrieges kaum verwundert). Es gilt, Momente der Gemeinschaft im Sozialleben zu stärken, um die Entwicklung der Gesellschaft zu stabilisieren. Ein Mittel zu diesem Zweck könnte die Förderung des Genossenschaftswesens darstellen (vgl. Tönnies 1935: 203). Tönnies Weg verläuft hier parallel zu dem Dürkheims. Er betont ausdrücklich die Rolle des Staates und einer nicht kodifizierten Moral des Wirtschaftslebens für die Sicherung der gesellschaftlichen Ordnung (vgl. Tönnies 1935: 236). Anzustreben ist ein (Tönnies 1935: 243) "Zustand der gesellschaftlichen Zivilisation, in welchem Friede und Verkehr durch Konvention und in ihr sich ausdrückende Furcht erhalten wird, welche der Staat beschützt,.." Spencers und Tönnies' Sicht der zukünftigen, modernen Gesellschaft unterscheiden sich in einigen zentralen Punkten kaum. Auch bei Spencer weist diese Gesellschaft die Züge des industriellen Typs auf und wird durch freiwillige Kooperation zusammengehalten. Für Spencer ist die (Spencer 1888: 618) "freiwillige Kooperation, das Organisationsprinzip des industriellen Typs." Kennzeichen freiwilliger Kooperation sind der freie Tausch und freie Vertragsbeziehungen zwischen den Individuen (Spencer 1888: 603): "Vertragliche Beziehungen ... werden im voll entwickelten industriellen Typ universell." Wieder läßt sich nirgends ein realisiertes Beispiel einer entwickelten, industriellen Gesellschaft finden. Der voll industrielle Typ ist die Fiktion einer erwarteten Zukunft für die abendländische Moderne. Die (Spencer 1888: 603) "Züge des industriellen Typs sind so verdeckt durch die des immer noch dominierenden militärischen Typs, daß ihre Natur nirgends mehr als partiell verkörpert ist."
Einleitung
13
In seiner Ansicht über die Stabilität des industriellen Typs hängt Spencer jedoch einem ungebrochenen Evolutionsoptimismus an. Das wird nicht zuletzt dadurch erleichtert, daß Spencer den vorindustriellen Gesellschaftstypus deutlich negativer zeichnet als Tönnies. Der militärische Typ, aus dem der industrielle hervorgeht ist durch ein Regime des Status (vgl. Spencer 1888: 638) und der Gewaltverhältnisse charakterisiert. Der Prozeß der Industrialisierung und der Dominanz wirtschaftlicher Interaktionsbeziehungen verspricht vor diesem Hintergrund einen Zuwachs an Frieden und Freiheit. Im Gegensatz dazu repräsentiert Tönnies' "Gemeinschaft" von Haus und Familie das Bild einer harmonischen Vergangenheit, das sich leicht mit einer kulturpessimistischen Kritik der Moderne verbinden läßt. Nach Spencer reicht die Kraft des universalen Prinzips des Überlebens der Besten aus, um eine zwangsläufige Höherentwicklung einer Gesellschaft zu gewährleisten (Spencer 1893: 150): "...Die Wohlfahrt der existierenden Menschheit und ihre Entfaltung zur endgültigen Perfektion, werden beide durch die gleiche wohltuende aber strenge Disziplin gewährleistet, der die belebte Schöpfung im ganzen unterworfen ist." Die einzige Aufgabe der Gesellschaftspolitik besteht darin, darauf zu achten, daß die Arbeit dieses Auslesemechanismus nicht behindert wird. Ein radikales wirtschaftliches laissez-faire-System stellt seine konkrete Verkörperung dar. Die Politik und gesellschafliche Gruppen sollen sich der Intervention zugunsten der Unterlegenen in diesem Prozeß enthalten. Die Stabilität und Harmonie der industriellen Gesellschaft wird am besten erreicht, indem man sie ihrer evolutionären Selbstorganisation überläßt. Der Prozeß der zunehmenden Individualisierung folgt bei Spencer notwendig aus dem Wachstum der gesellschaftlichen Komplexität im Verlauf der sozialen Evolution (vgl. Spencer 1893: 253). Der Mensch im entwickelten, industriellen Typ ist individualisiert, aber in ein enges Geflecht von Austauschbeziehungen eingebunden:
14
Einleitung
"Jedoch muß dieser größte Individualismus mit der größten gegenseitigen Abhängigkeit verbunden sein." (Spencer 1893: 260) "Diese Interdependenz, die das soziale Leben nach sich zieht, macht die Angelegenheiten aller Menschen auf indirekte Art zu seinen Angelegenheiten." (Spencer 1893: 265) Dürkheims Erkenntnis, daß die Teilung der gesellschaftlichen Arbeit nicht nur die wirtschaftliche Effizienz, sondern auch die sozialen und normativen Bindungen zwischen den Individuen steigert war also schon Spencer bekannt. Spencers Optimismus bezüglich der Zukunft industrieller Gesellschaften wird von seinem Menschenbild gestützt. Bei ihm ist ein System des Individualismus und der freiwilligen Kooperation nicht gleichbedeutend mit einem Regime des rationalen Egoismus. Im Menschen sind sowohl prosoziale und altruistische als auch antisoziale und egoistische Kräfte angelegt. In Analogie zur physikalischen Mechanik^ sieht Spencer in jeder Gesellschaft zwischen den Individuen attraktive und repulsive Kräfte wirken, die im besten Fall zu einem Gleichgewichtszustand führen (vgl. Spencer 1893: 48). Das Verhältnis dieser Kräfte wird von den evolutionären Erfordernissen auf dem jeweiligen Stand der gesellschaftlichen Entwicklung bestimmt. Das gleiche gilt für die Ausbildung der gegensätzlichen Anlagen im Menschen. Im militärischen Gesellschaftstyp ist eine hohe Aggressivität für Individuen ein Vorteil, aus diesem Grund wird ein entsprechender Menschentyp evolutionär selegiert. In der industriellen Gesellschaft verspricht ein hohes Aggressionspotential keine Vorteile mehr. Es ist daher zu erwarten, daß der aggressive Menschentypus mit der Zeit von friedlicheren und erfolgreicheren Varianten verdrängt wird. Eine solche Entwicklung besäße positive Folgen für die Stabilität und Friedfertigkeit des ganzen sozialen Lebens. Dürkheims Position zum Problem egoistischer Kooperation ist bereits weiter oben angesprochen worden, und es soll deshalb hier nur noch gezeigt werden, daß die Interaktion von Individuen in einer fortgeschrittenen Industriegesellschaft auch bei ihm den Rahmen für dieses Problem liefert. Im Vorwort zur zweiten Ausgabe von "Die Teilung der gesellschaftlichen Arbeit" schließt sich Dürkheim in Fragen des Gesellschaftstyps den Zukunftsperspektiven von Tönnies und Spencer an (Dürkheim 1977: 42):
Einleitung
15
"Darum hat man von unseren Gesellschaften behaupten können - und dies nicht ohne Grund -, daß sie im wesentlichen industrielle Gesellschaften sind oder dahin streben." Dürkheims Angriffe auf den Utilitarismus tragen dieser Ansicht Rechnung, wenn er behauptet, daß das Modell des rationalen Egoisten nicht einmal ausreicht, die Kooperation zwischen Individuen im industriellen oder geschäftlichen Bereich zu erklären. Die folgende Passage Dürkheims findet sich in einem Abschnitt, in dem er über Fehlentwicklungen im ökonomischen Sektor spricht (Dürkheim 1977: 40): "Da nichts die konfligierenden Kräfte zurückhält und nichts ihre Grenzen festlegt, die sie zu respektieren hätten, haben sie die Tendenz, sich maßlos zu entwickeln. Sie stoßen aneinander, um sich gegenseitig zurückzudrängen und zu entmachten." Im gleichen Kontext bemerkt er später (Dürkheim 1977: 41): "Wenn aber jede Autorität dieser Art fehlt, dann herrscht das Recht des Stärkeren und der latente oder offene Kriegszustand ist notwendigerweise chronisch." Der kurze Abriß der Argumentation von Tönnies, Spencer und Dürkheim zeigt, daß die Problematik einer radikal individualisierten und ökonomisierten Gesellschaft eine große Rolle im Denken der soziologischen Klassik gespielt hat. Dort, wo die Entwicklung hin zu einer solchen Gesellschaft letztlich mehr als Gefahr denn als prästabilierter Fortschritt zur besten aller möglichen Welten angesehen wurde, tritt der homo oeconomicus als Negativfiktion eines bedrohlichen und vielleicht zukünftig dominierenden Verhaltenstypus auf. Obwohl die Diskussion in diesem Exkurs theoriegeschichtlich orientiert war, sollten ihre Implikationen für gegenwärtige Analysen zur egoistischen Kooperation nicht unterschätzt werden. Die Momente der Individualisierung, der Atomisierung, der Anonymisierung und des Vordringens ökonomischer Beziehungen und Denkschemata haben ihre Bedeutung als zentrale Kennzeichen der Entwicklung der Moderne in der neueren, soziologischen Debatte nicht verloren1®. Man findet auch heute
16
Einleitung
die Ansicht, daß ein Nachlassen der normativen Integration und moralischer Autoritäten in einer Gesellschaft zu ihrer Destabilisierung führt (vgl. Klages 1975; Noelle-Neumann 1978:12; Noelle/Strümpel 1984). Die Frage nach der Stabilität reiner Industrie- oder Marktgesellschaften ist immer noch aktuell. Ende des Exkurses. Die Modellierung dieser Problematik wird nicht nur Aufschlüsse über die Stabilität eines idealtypisch anonymen Tauschsystems bringen, sondern auch über grundlegende Mechanismen, die die egoistische Kooperation auf freien Märkten stärken. Bislang wurde in spieltheoretischen Untersuchungen angenommen, daß soziale Kooperation zerfallen muß, wenn Akteure Vorteile aus unkooperativem Verhalten realisieren und in der Anonymität einer großen Gesellschaft davontragen können. Ein "Prinzip der späteren Vergeltung" wurde implizit unterstellt 11 , nachdem gelingende Kooperation voraussetzt, daß unkooperative Akteure wiedererkannt und durch den Geschädigten oder durch andere bestraft werden. Im Modell des Kapitel 3 wird das ganz andere "Prinzip der selektiven Fortsetzung" von Kooperation in den Mittelpunkt gerückt. Es beruht darauf, daß Akteure frei sind, sich schnell von unkooperativen Partnern zu trennen, aber auch mit bewährten Partnern auf Dauer zusammenzuarbeiten. Diese Annahme erfaßt ein Grundcharakteristikum einer freien Wirtschaftsordnung, und sie entfaltet eine beträchtliche Kraft, was die Förderung egoistischer Kooperation betrifft. Kapitel 4 schließlich thematisiert ein Modell zu Problemen der Leistungskontrolle in Teams, die für jede Art moderner Gesellschaften bedeutsam sind. Es wird angenommen, daß die Kontrolle der individuellen Leistungsbeiträge zu einer Gemeinschaftsproduktion immer nur unvollkommen gelingen kann, und daß Schwellenwerte existieren, unter denen ein Nachlassen der Leistung eines Akteurs nicht wahrgenommen werden kann. Aus diesen Prämissen und der Unterstellung rein egoistischen Verhaltens resultiert ein allmählicher Verfall der Teamleistung. Diese Zerfallstendenz läßt sich jedoch überraschend einfach aufhalten und in zyklische Schwankungen der Gruppenproduktivität umwandeln, wenn allgegenwärtige Einflüsse zufälliger Umweltveränderungen im Modell berücksichtigt werden. Der bisherige Ausblick verweist auf recht optimistische Weise auf vier verschieden gravierende, aber doch nicht allzu schwer lösbare Dilemmas.
Einleitung
17
Im Schlußteil wird jedoch vor einer voreiligen Entwarnung hinsichtlich der Probleme egoistischer Kooperation gewarnt. Die spieltheoretische Analyse zeigt, daß Dilemmas des Umweltschutzes, die erst in neuester Zeit in den Vordergrund der Debatte um die Selbsterhaltung sozialer Systeme getreten sind, mit den hier beschriebenen Mitteln nicht entschärft werden können. Die Untersuchung zeichnet das Bild einer strukturell immer bösartiger werdenden Abfolge von Dilemmas und liefert damit last not least einen Beitrag zu Zeitdiagnose. Zitate aus englischsprachigen Orginaltexten wurden durchweg von mir selbst übersetzt. Ob ein Orginaltext benutzt wurde, ist aus dem Literaturverzeichnis ersichtlich.
KAPITEL 1: KOOPERATION ZWISCHEN WENIGEN PARTNERN
In spieltheoretischen Analysen wurden eine Vielzahl verschiedener Wege zur Untersuchung der Probleme egoistischer Kooperation eingeschlagen, obwohl die Spieltheorie erst im zweiten Weltkrieg durch das gemeinsame Werk von Oskar Morgenstern und John v. Neumann (v.Neumann/Morgenstern 1944) geschaffen worden ist. In diesem Kapitel werden einige wichtige Entwicklungen zur Problematik egoistischer Kooperation in kleinen Gruppen bzw. zwischen wenigen Partnern herausgegriffen. Üblicherweise wird hierfür das Zwei-Personen-PD als idealisiertes Modell verwendet. Einige Vorbemerkungen scheinen in diesem Zusammenhang angebracht. Es wird nicht versucht, einen Überblick über alle einschlägigen Arbeiten der spieltheoretischen Literatur zu vermitteln 1 . Die Menge solcher Literatur ist inzwischen explosionsartig angewachsen und ein verläßlicher Literaturüberblick würde eine umfangreiche, eigene Arbeit erfordern. Stattdessen werden Analysen diskutiert, deren Inhalt nicht zuletzt im Hinblick auf die eigenen Modelle in den Kapiteln 2 und 3 wichtig und zukunftsträchtig erscheint . Spieltheoretisch gesehen bilden zwei Personen die kleinste mögliche Gruppe. Wann immer eine Gemeinschaft so klein ist, daß zwei Individuen unvermeidlich häufiger miteinander interagieren, läßt sich diese Situation strategisch vereinfacht als wiederholtes Zwei-Personen-Spiel darstellen. Dabei wird die Abwesenheit von starken Machtdifferenzen in der Gruppe unterstellt. Diese Vereinfachung wirkt zugegebenermaßen in vielen Fällen grob, aber die modelltechnischen Vorteile dieser Behandlungsweise sind beträchtlich und sie beinhaltet spezifische Chancen für das Entstehen egoistischer Kooperation. Aus strategischer Sicht läßt sich das Problem der Kooperation zweier Egoisten relativ einfach lösen, weil im n-Personen-Gefangenendilemma zwischen n = 2 und n > > 2 fundamentale Unterschiede hinsichtlich den Voraussetzungen kooperativen Verhaltens existieren. Die später zu diskutierenden, gravierenden Probleme für den Fall vieler Akteure > > 2 lassen sich nicht auf den Zwei-Personen-Fall übertragen. Dieser bedarf einer eigenen, eingehenden Analyse, die ihm seit den Anfängen der Spieltheo-
1. Kooperation zwischen wenigen Partnern
19
rie auch zuteil geworden ist (vgl. v.Neumann/Morgenstern 1944). Dabei wurde bald klar, daß bereits die häufigere Wiederholung des gleichen Spieles zwischen den gleichen Partnern kooperatives Verhalten zu induzieren vermag (vgl. Rapoport/Chammah 1965). Diese Möglichkeit besteht, weil unkooperatives Verhalten nicht nur zur versuchten Ausbeutung des Partners eingesetzt werden kann, sondern auch zur Bestrafung von Defekteuren. Ihnen kann in den Spielen nach ihrer Defektion die hohe kooperative Auszahlung entzogen werden. In Spielen mit vielen Beteiligten wirkt dieser Sanktionsmechanismus diffus, weil nicht nur der Defekteur, sondern immer alle anderen Spieler mit bestraft werden. Im ZweiPersonen-PD betrifft die Wirkung nur den Ausbeuter und den Ausgebeuteten selbst und stellt deshalb unter bestimmten Bedingungen eine wirksame Drohung und ein eindeutiges Signal dar. Die Analysen zum iterierten Zwei-Personen-Gefangenendilemma verwendeten zunächst ein rationales GleichgewichtskalküP zur optimalen Wahl zwischen zwei zu vergleichenden Gesamtstrategien (= Superspielstrategien bzw. Superstrategien) für das wiederholte Spiel. Neuere Untersuchungen wie Axelrods "Die Evolution der Kooperation" (1987) gehen von dieser Methode ab und verzichten auf Rationalitätspostulate und eine rein analytische Betrachtung der Strategieninteraktion. Stattdessen werden Computerwettkämpfe zur Ermittlung erfolgreicher Strategien durchgeführt. Diese neue Entwicklung stellt einen Fortschritt dar für die Analyse der Kooperation im Zwei-Personen-Gefangenendilemma mit dem (mehr oder weniger fernen) Ziel, Lösungen für reale Kooperationsprobleme zu gewinnen. Analytische Untersuchungen zur Kooperationsentstehung im iterierten Zwei-Personen-PD (z.B. Schotter 1981) werden deshalb nicht mehr behandelt, was einer vertieften Erörterung von Axelrods Simulationen und darauf aufbauender Computerwettkämpfe zugute kommt. Die Vorteile von Axelrods Vorgehensweise sollen nun kurz dargelegt werden. Evolutionäre Betrachtungen von Prozessen der strategischen Interaktion geben generell die strengen Rationalitätsannahmen der traditionellen Spieltheorie auf. Die evolutionäre Spieltheorie erlebte in den letzten Jahren eine Blüte in der theoretischen Biologie (vgl. Hofbauer/Sigmund 1984; Zeeman 1980, 1981), kann aber auch allgemein zum Vergleich des Erfolges konkurrierender Strategien herangezogen werden, wie Axelrod in seinen Computerwettkämpfen gezeigt hat. Dadurch wird es möglich,
20
1. Kooperation zwischen wenigen Partnern
von einer rationalen, wohlinformierten Verhaltensplanung der Akteure abzusehen. Diese Annahme hatte lange Zeit die gleiche Kritik auf sich gezogen, wie sie gegenüber den Modellen der neoklassischen Ökonomie geäußert wird. Real existierende Akteure, so das Argument, verfügen weder über die perfekte, langfristige Kalkulationsfähigkeit, noch über die vollkommene Information, die ihnen in der Spieltheorie unterstellt wird. Lösungen von strategischen Dilemmas, die in Einklang mit der spieltheoretischen Rationalität stehen, könnten deshalb bestenfalls normativ-präskriptiven Charakter besitzen. Experimentelle Untersuchungen zur Spielund Entscheidungstheorie bestätigten die ungenügende Rationalität, Informiertheit und Informationsverarbeitungskapazität realer Spieler (vgl. Kahneman et al. 1982; Tversky 1975). Doch selbst im Bereich normativ-präskriptiver Ratschläge geriet die Spieltheorie bald in Schwierigkeiten. Die Suche nach gleichgewichtigen Lösungen für beliebige Spiele führte (vor allem für Nicht-Nullsummenspiele)^ zu einer Proliferation unterschiedlicher Gleichgewichts- oder Lösungskonzepte, und damit zu widerstreitenden Auffassungen, welche Handlung in einer bestimmten strategischen Situation rational sei (vgl. Brams et al. 1979: 5; van Damme 1987). In einigen Fällen erweist sich die spieltheoretisch-rationale Vorgabe als reichlich kontraintuitiv. So fordert die rationale und einzig gleichgewichtige Lösung eines Gefangenendilemmas mit einer genau bekannten Zahl von Iterationen, daß die Spieler von Anfang an nur ihre D-Strategie wählen, was sie um ihre - vielleicht sehr hohen - Kooperationsgewinne bringt (vgl. Luce/Raiffa 1957: 98). Bei geeigneten Auszahlungsverhältnissen läßt sich aus der Sicht des normalen Menschenverstandes behaupten, daß kein vernünftiger Mensch sich in diesem Kontext spieltheoretisch rational verhalten würde (vgl. auch Selten 1978: 133). Die Frage was rational sei, läßt sich unter egoistischen Prämissen letztlich nicht von der des Erfolges trennen. Die Wahl von Gleichgewichtsstrategien muß aber nicht immer zum größten oder auch nur zu einem akzeptablen Auszahlungserfolg führen. Einen möglichen Ausweg aus den Problemen einer präskriptiven, spieltheoretischen Rationalität stellt die Aufgabe allgemein festgelegter Verhaltensstandards dar, und der nachträgliche Rekurs auf Strategien, die sich in der Analyse als erfolgreich erwiesen haben. Ähnlich wie im Schach gibt es in der Spieltheorie viele Theorien über die richtige Strategiewahl, aber nur ein endgültiges Be-
1. Kooperation zwischen wenigen Partnern
21
urteilungskriterium der Richtigkeit: der (Auszahlungs-) Erfolg. Es bietet sich daher an, wie im Schach Wettkämpfe um den Erfolg z.B. in iterierten Gefangenendilemmaspielen durchzuführen und ex post die Merkmale der siegreichen Strategien zu analysieren. Axelrod (1987) hat diese Methode gewählt und ihr zu allgemeinem Interesse verholferr\ Die Rationalitätsprämissen der klassischen Spieltheorie sind eng mit dem Modell des homo oeconomicus verbunden. Auf der Basis des Wettkampfansatzes muß generell nicht mehr von einer bestimmten Handlungstheorie ausgegangen werden. Das Verhalten der Spieler kann wahlweise genetisch, von Traditionen oder von einem rationalen Kalkül bedingt sein. Beschränkungen der individuellen Strategiewahl ergeben sich erst, wenn der Erfolg dieser Wahl über einen Evolutions- oder Lernprozeß mit der Verbreitung von Strategien bzw. Verhaltensweisen in Verbindung gebracht wird. Dann wird es wichtig, daß die Verhaltensstrategien eine gewisse zeitliche Stabilität aufweisen und nicht zu schnell und zu chaotisch gewechselt werden, denn die Evolutions- oder Lernmodelle sehen von einer expliziten Berücksichtigung eines rationalen Verhaltenskalküls ab und unterstellen nur einen allgemeinen Zusammenhang zwischen Erfolg und Ausbreitung einer Verhaltensweise. In evolutionären Betrachtungen liegt das Augenmerk auf der Strategie, d.h. auf dem Erfolg bestimmter Verhaltensroutinen. Das Individuum interessiert nur noch als Träger von Strategien. Wechselt es die Strategie, breitet sich eine Routine aus, während eine andere an Boden verliert. Aufgrund dieses eindeutigen Trägerverhältnisses wird im folgenden oft nur von Strategien als von Handelnden gesprochen. Veränderungen in den von den Akteuren gespielten Strategien können aufgrund verschiedener Mechanismen in Abhängigkeit vom Auszahlungserfolg der Strategie oder des Akteurs erfolgen. Vor jeder genaueren Spezifizierung wird zunächst nur ein monotoner Zusammenhang zwischen Erfolg und Ausbreitung bzw. Niedergang einer Strategie postuliert: Je erfolgreicher eine Strategie ist, desto stärker wächst die Zahl ihrer Repräsentationen an; mit zunehmender Erfolglosigkeit nimmt die Zahl der Repräsentationen dagegen mit der Zeit ab. Gegenüber dem rational-actorAnsatz besitzt dieses Grundgerüst von Annahmen den Vorteil einer höheren allgemeinen Plausibilität und der besseren Kompatibilität mit verschiedenen Handlungstheorien. Dabei ist es nicht notwendig, das oft fruchtbare rational-actor-Modell völlig aufzugeben. Aspekte des Nutzen-
22
1. Kooperation zwischen wenigen Partnern
kalküls können gewinnbringend in die evolutionäre Perspektive integriert werden. Im Vergleich zu formalen, spieltheoretischen Untersuchungen können in Simulationswettkämpfen auch mehr und komplexere Superspielstrategien in Konkurrenz getestet werden. Analytische Studien beschäftigen sich, um die Berechenbarkeit des Problems zu gewährleisten, in der Regel mit soweit vereinfachten Strategien, daß ein Einsatz durch halbwegs intelligente Akteure fraglich erscheint. Regeln wie "Kooperiere immer!", "Defektiere immer!" oder "Kooperiere bis dein Partner defektiert, dann kooperiere nie mehr!" geben den strategischen Einfallsreichtum der Spezies Mensch kaum hinreichend wieder^. Ironischerweise wurden Axelrods Computerwettkämpfe jedoch von einer ähnlich simplen Strategie gewonnen. Das ist sicherlich ein interessantes Ergebnis, aber man sollte sich hüten, es als These bereits in die Prämissen der Analyse einfließen zu lassen. Der Schluß von Simplizität auf Erfolg ist gewiß nicht allgemeingültig. Die Fähigkeit, Interaktionen zwischen komplexen Strategien zu berücksichtigen, bleibt trotz allem ein Vorteil der simulativen Methode. Aus den genannten Gründen erscheint es sinnvoll, die Erörterung der Kooperationsproblematik im iterierten Zwei-Personen-Gefangenendilemma mit der Arbeit von Robert Axelrod zu beginnen.
1.1. Axelrods "Die Evolution der Kooperation" Den Kern von Axelrods Analysen zum iterierten Zwei-Personen-Gefangenendilemma bilden zwei Computerwettkämpfe von Superspielstrategien. Ausgetragen wurde das Turnier auf der Basis einer PD-Matrix M l mit den Auszahlungen (Axelrod 1987: 8): C
D
C
3,3
0,5
D
5,0
1,1
Diese symmetrische Matrix zeigt für x = 3, y = 5, z = 0, w = 1 die Ordnungen y > x > w > z und 2x > y+z, die üblicherweise ein Gefangenen-
1.1. Axelrods „Die Evolution der Kooperation"
23
dilemma definieren (vgl. Rapoport/Chammah 1965: 35). Es wird angenommen, daß jeweils zwei Spieler, die eine feste Verhaltensstrategie verfolgen, für eine größere, aber ihnen nicht genau bekannte Zahl von Spielen miteinander interagieren. Keinem der Spieler ist es möglich die Interaktion vorzeitig abzubrechen, d.h. die Situation wird als Superspiel ohne Ausstieg definiert. Wie bereits erwähnt, kann die Aussicht zukünftiger Kooperationsgewinne in einem Superspiel die Akteure von der Wahl von D abhalten. Dazu bedarf es allerdings einer genügenden Wertschätzung zukünftiger Erträge. Zur Repräsentation dieses Sachverhalts wird üblicherweise ein Gewichtungs- bzw. Diskontfaktor eingeführt, mit dem erwartete zukünftige Auszahlungen zu multiplizieren sind (vgl. Axelrod 1987: 12). Bei einem hohen Diskontfaktor steigt der Einluß der Zukunft, und so kann Axelrod zu einem ersten Theorem gelangen. Es besagt, daß keine allgemein beste Strategie im Superspiel existiert, sondern daß der Erfolg einer Strategie von der Strategie des Partners abhängt (Axelrod 1987: 14). Damit erscheint der Einsatz einer Wettkampfsimulation hilfreich. Vierzehn Teilnehmer, meist Spieltheoretiker aus verschiedenen Disziplinen, reichten jeweils eine Strategie für den Wettkampf ein. Zusammen mit einem reinen Zufallsmechanismus, der C und D mit Wahrscheinlichkeit 0.5 spielte, traten diese Strategien nach dem Modus "Jeder gegen Jeden" sukzessive gegeneinander an. Die einzelnen Interaktionen dauerten 200 Runden, dann erfolgte eine neue Paarung. Der Sieger des Wettkampfes war TIT FOR TAT. Diese sehr einfache Strategie folgte der Regel: "Beginne kooperativ, und wiederhole dann den Zug, den dein Opponent im vorherigen Spiel gemacht hat!" (vgl. Axelrod 1987: 12). III' FOR TAT gelang es, eine ganze Reihe wesentlich komplexerer Strategien zu schlagen. Aufgrund der Erkenntnisse des ersten Computerwettkampfes wurde ein zweiter mit nunmehr 62 Teilnehmern durchgeführt, die über den Erfolg von TIT FOR TAT informiert waren. Auch in diesem Feld konnte allein TIT FOR TAT den ersten Platz erringen. Die Umstände des Sieges erscheinen dabei besonders interessant. Im zweiten Wettkampf wurden Strategien eingereicht, denen es im ersten Turnier gelungen wäre TIT FOR TAT zu schlagen, für die aber nun gleichzeitig geeignete Ausbeu-
24
1. Kooperation zwischen wenigen Partnern
tungsstrategien nominiert waren. Dadurch scheiterten alle aufgrund des ersten Wettkampfes unternommenen Versuchen, die Schwächen von TIT FOR TAT auszunutzen (vgl. Axelrod 1987: 39f.). Die Suche nach bestimmten Erfolgsmerkmalen von Strategien anhand der Gesamtrangliste des Wettkampfes offenbarte, daß weder die Komplexität, noch die Nationalität, noch der berufliche Status des Einsenders, oder die Computersprache, in der das Programm abgefaßt war, signifikant mit dem Erfolg korrelierten (Axelrod 1987: 38). Die Gründe des Erfolges lagen in der Spieltaktik einer Strategie selbst. Die fünfzehn erfolgreichsten Strategien begannen mit einer Ausnahme nie als erste zu defektieren. Axelrod hebt vier Punkte hervor, die den Erfolg einer Strategie bestimmen. Eine Strategie sollte - freundlich sein, d.h. nicht als erste defektieren (Axelrod 1987: 30, 102ff.) - Nachsicht zeigen (Axelrod 1987:32): "Nachsicht kann man informell als die Neigung beschreiben, in den Zügen nach einer Defektion des anderen Spielers zu kooperieren." - bei Ausbeutungsversuchen zurückschlagen, also nur bedingt kooperieren (Axelrod 1987: 39, 106ff.) - und schließlich verständlich, d.h. für einen Partner berechenbar, sein (Axelrod 1987: 47, 108ff.). TIT FOR TAT besitzt alle diese Eigenschaften in hohem Maße. Auch in einer evolutionären (oder populationsökologischen) Betrachtung, in der das Wachstum des Anteils von Strategien an der Wettkampfpopulation einfach proportional zu ihrem Auszahlungserfolg angesetzt wurde, konnte sich TIT FOR TAT durchsetzen (Axelrod 1987: 44ff.). TIT FOR TAT hielt die Spitze beim Größenwachstum der freundlichen, kooperativen Strategien, während defektive Konkurrenten mit der Zeit ausstarben. Sofern es TIT FOR TAT gelingt, sich über die gesamte Population auszubreiten, ist diese Strategie kollektiv stabil. Kollektive Stabilität^ stellt eine Adaption des Konzeptes der evolutionären Stabilität dar (vgl. Maynard Smith 1974), das sich in evolutionären, spieltheoretischen Analysen eingebürgert hat. Eine Strategie ist genau dann kollektiv stabil, wenn kein (Axelrod 1987:50) "Neuling einen höheren Punktwert mit einem Einheimischen erhält als
1.1. Axelrods „Die Evolution der Kooperation "
25
ein Einheimischer mit einem anderen Einheimischen." Axelrod meint, daß keine andere Strategie in eine kollektiv stabile Population eindringen, d.h. sich dort vermehren, kann. Im dritten Teil seines Buches beschäftigt sich Axelrod mit der empirischen Erklärungskraft spieltheoretischer Erkenntnisse. Am Fall des "Leben-und-leben-lassen"-Systems im Grabenkrieg des ersten Weltkrieges (Axelrod 1987: 67ff.) verdeutlicht Axelrod, wie die relative Dauerhaftigkeit der Interaktion bestimmter Truppeneinheiten und die Möglichkeit der wechselseitigen Vergeltung bei aggressiven Akten zu einem unerlaubten de facto Waffenstillstand führen konnten. Dies galt natürlich nur für Frontabschnitte, in denen die jeweiligen militärischen Oberkommandos gerade keine Offensive planten oder durchführten. Axelrod faßt die strategische Situation der Frontsoldaten als Gefangenendilemma auf. Er zeigt auch, wie sehr sich die Soldaten des Vergeltungsprinzips bewußt waren, nach dem ein Schuß von ihrer Seite einen des Gegners auslösen würde. Es werden Augenzeugen zitiert, die von festen Verhältnissen der Vergeltung berichten, wie z.B. drei Granaten als Antwort auf einen Angriff mit einer Granate (vgl. Axelrod 1987: 72). Als Folge versuchten Frontsoldaten oft, keine "echten" Feindseligkeiten auszutauschen, d.h. es entwickelte sich ein System der ritualisierten Aggression, bei dem willentlich fehl geschossen wurde. Selbst Artilleriebeschuß wurde bis zur Ungefährlichkeit ritualisiert, indem eine täglich gleiche Anzahl von Granaten zur genau gleichen Zeit auf immer den gleichen Punkt gefeuert wurde (vgl. Axelrod 1987: 78). Axelrods spieltheoretische Analyse des "Leben-und-leben-lassen"-System im ersten Weltkrieg erscheint zunächst als eine der eindrucksvollsten empirischen Belege für die Bedeutsamkeit der Ergebnisse aus den Computerwettkämpfen. Gerade weil das Beispiel intuitiv so überzeugend wirkt, soll es weiter unten nochmals eingehender auf seine Tragfähigkeit untersucht werden. Die Probleme die sich dabei zeigen, sind paradigmatisch für die Schwierigkeiten einer empirisch erklärenden spieltheoretischen Analyse. Nachdem Axelrod versucht hat, sich zu vergewissern, daß seine aus der Simulation gewonnenen Resultate auch in der Realität Gewicht haben, leitet er Ratschläge für das Verhalten in realen Situationen ab, die einem
26
1. Kooperation zwischen wenigen Partnern
Gefangenendilemma ähneln (Axelrod 1987: 97ff.). Den Kernpunkt seiner Ratschläge bildet ein Plädoyer für Reziprozität als Verhaltensmaxime^. Akteure sollten Gutes mit Gutem und Schlechtes mit Schlechtem vergelten, und dabei nicht zu nachlässig sein. TIT FOR TAT selbst berücksichtigt diese Ratschläge. Die Strategie ist eine genaue Verkörperung des Prinzips "Auge um Auge". Allerdings erkennt Axelrod, daß zwei Akteure, die "Auge um Auge" spielen und in unkooperatives Verhalten abgeglitten sind, dazu tendieren, den Konflikt zu perpetuieren. Ihre alttestamentarische Moral führt, falls nicht mehr erkannbar ist, wer ursprünglich Schuld am Konflikt hatte, gleichsam zur Fortsetzung einer Blutrache bis auf Kinder und Kindeskinder. Er schlägt vor, etwas weniger heimzuzahlen, als man erhalten hat, um diesem Eskalationsmechanismus gegenseitiger Vergeltung zu entgehen (Axelrod 1987:124). Axelrod (1987: 112ff.) hält noch einige weitere, sehr allgemeine Vorschläge zur Förderung kooperativen Verhaltens in sozialen Dilemmas bereit. Die Wahrscheinlichkeit zukünftiger Kooperationsgewinne sollte erhöht werden. Die Nutzenverhältnisse kooperativer und unkooperativer Handlungsalternativen gilt es zu verändern. Altruismus und gegenseitige Bindungen von Menschen sind zu stärken. Die Erinnerungsfähigkeit für vergangene Interaktionen sollte gesteigert werden. Die folgende Diskussion wird sich auf zwei unterschiedliche Wegen Axelrods Ergebnissen nähern. Zunächst wird auf die Adäquatheit der Modellierung des "Leben-und-leben-lassen"-Systems im ersten Weltkrieg eingegangen. Dann wird die Interpretation, die Axelrod seinen Resultaten gibt, kritisch überprüft. Das geschieht in Verbindung mit einer Rezeption von Rezensionen zu Axelrods Untersuchung. Daran schließt sich ein kurzes Resümee der Diskussion an.
1.1.1. Das "Leben-und-leben-lassen"-System im ersten Weltkrieg Eine umfassende Darstellung des "Leben-und-leben-lassen"-Systems an den britischen Frontabschnitten der Grabenstellungen des ersten Weltkrieges liefert Tony Ashworth (1980) in "Trench Warfare 1914-18: The Live and Let Live System". In seinen Ausführungen stützt sich Axelrod hauptsächlich auf dieses Buch, und es wird auch die Grundlage für die folgenden Erörterungen bilden. Dabei geht es hauptsächlich um die
1.1. Axelrods „Die Evolution der Kooperation"
27
Frage, wie gut die von Ashworth und Axelrod beschriebene Situation der Frontsoldaten dem strategischen Dilemma des Gefangenen entspricht. Liefert dieses Modell eine brauchbare, empirische Beschreibung der damals vorliegenden Interaktionsstrukturen? Der Hinweis auf die Bedeutung wechselseitiger Vergeltungsdrohungen und der relativen Dauerhaftigkeit von Interaktionen reicht noch nicht aus, damit die spieltheoretische Analyse von einem Gefangenendilemma ausgehen kann. Beide Merkmale treffen noch auf viele andere strategische Strukturen zu. Axelrod (1987: 68) behauptet: "Obwohl Ashworth es nicht so ausdrückt, läßt sich die historische Situation in den ruhigen Frontabschnitten als iteriertes Gefangenendilemma auffassen." Die beiden Handlungsalternativen sind "gezielt schießen, um zu töten" (DStrategie; Axelrod 1987: 68) und "vorsätzlich so schießen, daß Verletzungen vermieden werden" (C-Strategie; Axelrod 1987: 68), oder, das bleibt vor dem Hintergrund von Ashworth' Darstellungen anzumerken, überhaupt nicht zu schießen. Axelrod nimmt an, daß für beide Seiten eine Schwächung des Feindes bei einseitiger Aktion vorteilhaft ist, weil im Falle einer größeren Schlacht weniger Gegner vorhanden sind. Auf dieser Annahme begründet sich ein Anreiz zur Defektion. Zugleich erscheint jedoch bei symmetrischer Aktion ein heimlicher Waffenstillstand erstrebenswerter als ständige Abnutzungskämpfe. Die Situation entspricht einem iterierten Gefangenendilemma. Die handelnden Akteure sind jeweils größere Einheiten, wie Bataillone, die sich oft mehr als einen Monat lang in den Schützengräben gegenüberlagen, bevor sie von frischen Truppen abgelöst wurden. Es dürfte kaum problematisch sein, Bataillone als kollektive Akteure zu werten, denn die soziale Kontrolle und Gemeinschaft innerhalb eines Bataillons war groß. Ashworth (1980: 153ff.) weist ausdrücklich auf diesen Sachverhalt hin. Besonders kampflustige Soldaten wurden von ihren Kameraden gebremst. Das Battailon agierte meist einheitlich im Interesse seiner Mitglieder, sofern höhere Befehle dem nicht widersprachen. Die beschriebene strategische Situation kann natürlich nicht allgemein als typisch für den ersten Weltkrieg, oder auch nur für den Grabenkrieg, angesehen werden. Das bekanntere Bild vom menschenverschlingenden
28
1. Kooperation zwischen wenigen Partnern
Abnutzungskrieg, von den tödlichen Stahlgewittern bei Verdun oder Ypern, trifft sicherlich nicht minder zu. Ashworth (1980: 15ff.) unterscheidet deutlich zwischen ruhigen Frontabschnitten und solchen, an denen erbarmungslose Schlachten tobten. Die ruhigen Abschnitte waren faktisch von den Oberkommandos vergessen, die sich auf die großen Schlachten konzentrierten, oder sie wurden explizit als Ruhezonen für in der Schlacht aufgeriebene Einheiten aufgefaßt. Nur in diesen Ruhezonen konnte sich das "Leben-und-leben-lassen"-System etablieren. Dabei gab es erhebliche Unterschiede zwischen dem Verhalten von normalen Einheiten und Elitetruppen (vgl. Ashworth 1980: 21). Elitesoldaten betrachteten es als ihre Ehre, unablässig zu kämpfen und gegebenenfalls für das Vaterland zu fallen, während normale Soldaten oft genug nichts gegen ein möglichst sicheres Überleben einzuwenden hatten. Eine unterschiedliche Wahrnehmung der strategischen Abhängigkeiten und gemeinsamen Interessen der Soldaten besaßen auch die verschiedenen Waffengattungen, wobei die Differenzen zwischen Grabeninfanterie und der schweren Artillerie besonders hervortraten (vgl. Ashworth 1980: 160ff.). Die Infanterie versuchte nicht selten, die Artillerie durch Zureden oder Seitenzahlungen (z.B. mit Proviant) von aggressivem Vorgehen abzuhalten. Schließlich bemerkten die Oberkommandos im Laufe des Krieges die - aus ihrer Sicht bedauernswerte - Existenz von Systemen des Lebens und Leben lassens und bemühten sich, die heimlichen Waffenstillstände zu unterbrechen. Es wurden spezielle Scharfschützeneinheiten gebildet oder Kommandotrupps, die nur für einen einzigen, möglichst brutalen Angriff an einen Frontabschnitt geschickt wurden. Wie Ashworth (1980: 176ff.) berichtet, wurde das Leben und Leben lassen dadurch erheblich erschwert. Dennoch bleibt festzuhalten, daß das "Leben-und-leben-lassen"-System in den Gräben des ersten Weltkrieges über die gesamte Dauer der Kampfhandlungen immer wieder auftrat. Es ist die zentrale Schwierigkeit von Axelrods Analyse, daß neben dem Gefangenendilemma ebensogut andere Strukturen die strategischen Interdependenzen des "Leben-und-leben-lassen"-Systems repräsentieren können. Joanne Gowa (1986: 179ff.) weist in einem Rezensionsartikel zu Axelrod darauf hin, daß das Spiel, das in den Gräben gespielt wurde, einfach als Zusammenarbeitsproblem (collaboration game) verstanden werden könnte. Sie nimmt an, daß es im gemeinsamen Interesse der Frontsoldaten lag zu überleben, daß Aggressionen zu Vergeltungen führen mußten, und daß es daher für das Überleben jedes Einzelnen am be-
1.1. Axelrods „Die Evolution der Kooperation"
29
sten war, möglichst wenig oder möglichst ungenau zu schießen. Zugleich widerspricht sie Axelrods Rekonstruktion des strategischen Problems (Gowa 1986:180): "Der gegenwärtige Wert einer einseitigen Defektion war vernachlässigbar: jeder Anreiz zur Defektion mußte stark abdiskontiert werden, denn große Schlachten traten relativ selten in Abständen von mehreren Monaten auf." Gowas Einwand läßt sich noch durch weitere Argumente stützen. Zunächst scheint Axelrod zu übersehen, daß die Soldaten als direkte Folge einer aggressiven Aktion nur Nachteile erwarteten. In Ashworth' Darstellung sprechen die Soldaten nie davon, daß sie den kurzfristigen Nutzen eines Angriffs gegen die langfristigen Nachteile einer Unterbrechung des Waffenstillstandes abwägen. Aus Sicht der Frontsoldaten bringt die Defektion, d.h. ein Angriff, nur sofortige Nachteile in Form der gegnerischen Vergeltung (vgl. auch Gowa 1986:160). Anders als Axelrod erwarteten die Soldaten zunächst keinen Nutzen aus der Defektion. Ashworth (1980: 133ff) hebt hervor, daß oft kein antagonistisches Verhältnis zwischen gegnerischen Grabenkämpfern vorlag, oder daß ein anfänglicher Antagonismus im Laufe des Krieges zurückging. Die Soldaten lagen sich oft für längere Zeit auf eine Distanz von wenigen dutzend Metern gegenüber, konnten einander zurufen, miteinander singen, Witze machen, oder sich sogar heimlich im Niemandsland treffen. Sie aßen, badeten oder sonnten sich in der offenen Schußlinie des Gegners, im Vertrauen auf dessen mangelndes Interesse am Kampf. Dabei war dieses wechselseitige Stillhalten nicht immer nur instrumenten zu verstehen (Ashworth 1980:143): "Ein Waffenstillstand war nicht mehr nur ein instrumentelles Arrangement, denn die Kontrolle der Aggression war zugleich ein Akt der Klugheit und symbolisierte Gemeinschaftsgefühle." Es entstand eine Art Solidarität der Grabenkämpfer, ein Wir-Gefühl, das aus der Ähnlichkeit einer unersprießlichen Lage entsprang. Aus der Sicht des Soldaten hieß das (Ashworth 1980:142): "Jenseits des Niemandslandes gab es Männer, die unsere Schwierigkeiten
30
1. Kooperation zwischen wenigen Partnern
teilten, die die gleiche verlorene Schlacht gegen das Wasser kämpften, machtlos vor dem plötzlichen Sturm berstenden Metalls, und voll Sehnsucht, wieder zuhause bei ihren Kindern zu sein. Waren sie der Feind? Ein Fetzen eine Liedes drang durch die Dämmerung herüber.... sollten wir kalten Haß verspüren bei diesen Manifestationen eines Lebens, das unserem so sehr glich?" Im Verlaufe der Zeit bildete sich bei den einfachen Soldaten dagegen eine Antipathie gegenüber der eigenen Offizierskaste in der Etappe und dem Oberkommando, das sie millionenfach verheizte (vgl. Ashworth 1980: 141). Wie sehr das Fehlen psychologischer Feindschaftsgefühle als konstitutiv für das "Leben-und-leben-lassen"-System anzusehen ist, belegt ein Zusammenhang, der Axelrod und Ashworth anscheinend entging, weil sie die Verhältnisse auf deutscher Seite nicht hinreichend kannten. Ashworth (1980: 30, 34, 35, 146, 150, 163) bemerkt an einigen Stellen, daß besonders sächsische Truppenteile zum Leben und Leben lassen neigten. Er zitiert einen Soldaten, der Sachsen, Preußen und Bayern vergleicht (Ashworth 1980: 150): "Wo die zwei letztgenannten einen Sektor hielten, herrschte üblicherweise Taukenschlagkrieg', wogegen die Sachsen ein 'ruhiger Haufen' waren..." Dieser Soldat gibt an, daß die Sachsen die Engländer aufgefordert hätten, ihre Munition für die Preußen zu sparen. Offensichtlich zeigten die Sachsen in der Regel wenig Lust für die verhaßten Preußen bzw. das Deutsche Reich unter preußischer Führung zu kämpfen und zu sterben. Es verwundert etwas, daß dies bei den Bayern anders gewesen sein soll, doch ist das vielleicht nur die irrige Meinung des zitierten Beobachters. An anderer Stelle (Ashworth 1980: 163) werden Bayern und Sachsen zusammen als "friedlich" bezeichnet. Weder aus Eigeninteresse noch aus anderen psychologischen Gründen hatten diese Truppenteile offenbar einen Anreiz, auf Engländer zu schießen. Aufgrund des mangelnden Anreizes zum Kampf, läßt sich letztlich eine Gefangenendilemmasituation konstruieren, die umgekehrt zu der von Axelrod postulierten verläuft. Aus Sicht des Oberkommandos, aber auch
1.1. Axelrods „Die Evolution der Kooperation "
31
vieler Soldaten, war es kollektiv erstrebenswert, den Krieg zu gewinnen. Jede einzelne Einheit und jeder Soldat an einer ruhigen Front besaß jedoch ein individuelles Interesse, möglichst wenige Risiken einzugehen und nicht zu fallen, was durch Solidaritätsgefühle mit den gegnerischen Frontsoldaten noch verstärkt wurde. In dieser Fassung stellt das Dilemma des "Leben-und-leben-lassen"-Systems ein Problem der gemeinsamen Aktion im Sinne Olsons (1968) dar. Die von Ashworth (1980: z.B. 76ff.) behandelten Maßnahmen der Oberkommandos sollten dazu dienen, diese aus ihrer Sicht defektive Lösung zu unterbinden und die kollektiv optimale Lösung herbeizuführen. Das erwies sich in vielen Fällen als schwierig, denn die wechselseitige Nähe der feindlichen Gräben machte jede Vergeltungsdrohung äußerst effektiv und schuf vielfältige Möglichkeiten der Solidaritätsbildung. Zugleich wird ein grundlegendes Problem von Axelrods Empirie deutlich. Es gibt nicht nur verschiedene, alternative Modellierungsmöglichkeiten der Situation, sei es in Sachen Spielstruktur oder der Handlungstheorie, bei der sowohl egoistische, als auch normative Motive ausgemacht werden können, sondern das Modell des Gefangenendilemmas kann dazu verwendet werden, die Situation auf zwei genau entgegengesetzte Weisen zu rekonstruieren. Das ist kein normaler Fall der Konkurrenz von Ansätzen mehr, bei der dem PD beispielsweise ein "assurance game" (Sen), in dem bei ein- oder wechselseitiger Defektion unangenehme Ergebnisse drohen, während gar kein oder nur ein minimaler Anreiz zur Defektion existiert^, entgegengestellt werden könnte . Es gilt zu fragen, inwieweit eine Modellierung mit Hilfe des Gefangenendilemmas zu brauchbaren Erklärungen beitragen kann, wenn sich nach Belieben die Ansatzrichtung umkehren läßt. Hält man an Axelrods Interpretationsweise fest, ergeben sich noch andere, allgemeine Probleme einer spieltheoretischen Empirie. Wie so oft erscheint besonders die Unterstellung des reinen, rationalen Egoismus problematisch, wenn sie in empirisch beschreibender Absicht vorgenommen wird. Die Spieler können wahrscheinlich nicht als reine Egoisten angesehen werden, denn psychologische Motive des Wir-Gefühls zwischen feindlichen Grabenkämpfern, innernationale Spannungen zwischen Volksgruppen oder die Notwendigkeit der gelegentlichen Streßreduktion dürften eine große Rolle beim Entstehen des "Leben-und-leben-
32
1. Kooperation zwischen wenigen Partnern
lasseri'-Systems im ersten Weltkrieg gespielt haben. Andererseits trifft zu, daß Vergeltungsstrategien im Grabenkrieg wie in Axelrods Computerturnier entscheidend zur Stabilisierung kooperativen Verhaltens beigetragen haben. Nur: wie aussagekräftig ist die Lehre vom Erfolg der Reziprozität, die Axelrod aus seinen Wettkämpfen gewinnt? TIT FOR TAT vergilt immer Gleiches mit Gleichem. Ashworth' (von Axelrod zitierte) Belege sprechen aber meist von einer Art Vergeltung, bei der ein Schuß einer Seite durch mehrere der anderen beantwortet wurde. Dies sieht Axelrod nicht als Widerspruch zu seinen Resultaten, die offenkundig nicht beanspruchen, viel über das optimale Ausmaß einer Vergeltungsaktion auszusagen. Dann jedoch gerät die These, daß Vergeltungsdrohungen Kooperation fördern, in eine schwierige Lage. In voller Allgemeinheit wird diese Aussage zweifelhaft, denn überzogene Vergeltung dürfte ebensosehr Anlaß zu "unkooperativen" Racheakten geben, wie eine zu schwache Erwiderung keine Abschreckung gewährleistet. Genauere Angaben über den Bereich, in dem Vergeltungsdrohungen und Vergeltungsausübung die Stabilisierung oder die Rückkehr zur Kooperation induzieren, erscheinen höchst wünschenswert. Sie sind jedoch beim gegenwärtigen Stand der spieltheoretischen Erkenntnisse nicht verfügbar. Es sei jedem selbst überlassen, ob er die angesprochenen Probleme als nachrangige Detailfragen ansieht, oder als Anforderungen, die eine spieltheoretische Analyse erfüllen sollte. Bei gröberer Betrachtung jedenfalls lassen sich durchaus Übereinstimmungen zwischen Axelrods Turnierergebnissen und dem Verhalten der Frontsoldaten im "Leben-und-leben-lassen"-System feststellen. Die Struktur der strategischen Situation ähnelte einem Gefangenendilemma zumindest soweit, daß die aggressive Lösung aus der Sicht aller Spieler der kooperativen unterlegen ist, und daß eine einseitige Hinnahme der Aggression nicht akzeptabel erscheint. Außerdem wird die Dauerhaftigkeit der Interaktion einigen Einfluß auf die Stabilität heimlicher Waffenstillstände besitzen. Sie erlaubt es, daß ein Mechanismus der wechselseitigen Vergeltungsdrohung beide Seiten verläßlich vom Kampf abschreckt. Alle diese Aspekte untersucht Axelrod spieltheoretisch in seinem Buch. Es ist letzlich eine Frage des Anspruchs an die empirische Qualität und Wirklichkeitsgerechtigkeit spieltheoretischer Erklärungen, ob man die Übertragung der Gefangenendilemmaanalysen auf das historische "Leben-und-leben-lassen"System als befriedigend erachtet.
1.1. Axelrods „Die Evolution der Kooperation "
33
1.1.2. Diskussion von Axelrods Ergebnissen Die Diskussion von Axelrods Resultaten und seines Untersuchungsansatzes wird eigene Kommentare mit der Meinung von Rezensenten verbinden. Auf diese Weise soll ein Überblick über die wichtigsten Probleme von Axelrods Ansatz gegeben werden. Nach dem Tenor der Kommentatorenmeinung stellen seine Computerwettkämpfe einen entscheidenden Schritt nach vorn in der spieltheoretischen Modellierung von Kooperationsproblemen dar (als Gegenmeinung vgl. Rogowski 1985: 461). Differenzen bestehen jedoch darüber, wieviel durch Axelrod bereits erreicht ist, was fehlt, und über die nächstliegenden Weiterentwicklungen. Dabei ist zu berücksichtigen, daß Arbeiten, die eine neue Richtung in einer Disziplin etablieren, nie schon alle Fragen beantworten können, die diese Richtung aufwirft. Aufgezeigte Unvollständigkeiten in Axelrods Untersuchung sind daher mehr als Hinweise, denn als Vorwürfe zu verstehen. Auf Probleme des Untersuchungsdesigns wird ein erster Abschnitt eingehen. Ein zweiter bespricht die erzielten Ergebnisse und die Schlüsse für die soziale Realität, die Axelrod aus seinen Wettkämpfen zieht. Eine Gruppe von Kritiken an Axelrods Vorgehensweise bezieht sich auf seinen Verzicht, andere Spiele als das Zwei-Personen-PD mit binärer Wahl zwischen Kooperation oder Nicht-Kooperation zu analysieren. Einige Kommentatoren weisen darauf hin, daß auch andere Spiele für die Problematik des Entstehens von Kooperation unter rationalen Egoisten relevant sein dürften. Genannt werden z.B. das "Chicken game" (vgl. Beer 1986: 183), das zur Modellierung politischen Drohverhaltens (KubaKrise) verwendet worden ist, und Nullsummenspiele (vgl. Campbell 1986: 795)^. Doch a u c h der Hinweis auf die Bedeutung von n-Personen Varianten des Gefangenendilemmas bzw. allgemein von sozialen Dilemmas gehört hierher (vgl. Beer 1986: 182; Campbell 1986: 795). In der Tat versäumt es Axelrod, deutlich auf die gravierenden Unterschiede zwischen den Kooperationsproblemen im n- und im Zwei-Personen-PD hinzuweisen, und es ist nie ganz klar, ob er seine Ratschläge unzulässigerweise auf Bereiche ausdehnt, die eigentlich durch ein n-Personen-PD repräsentiert werden müßten. Eine direkte Übertragung von Axelrods Ergebnissen auf den n-Personen Kontext ist jedenfalls nicht möglich. Homans (1985: 894) gibt zu bedenken, daß die Resultate stark von der Wahl einer bestimmten Auszahlungsmatrix abhängen könnten, selbst wenn diese Wahl nur im Rahmen eines binären Zwei-Personen-PD er-
34
I. Kooperation zwischen wenigen Partnern
folgt. Manche Autoren verweisen darauf, daß man den Verhaltensmöglichkeiten in der Realität nur gerecht werden kann, wenn mehr als zwei Handlungsalternativen in das Entscheidungskalkül einbezogen werden (vgl. Beer 1986: 182; Shalom 1986: 235) und wenn die Annahme aufgegeben wird, daß sich die Auszahlungsmatrix mit der Zeit nicht ändert (vgl. Beer 1986: 181; May 1987: 16). Donninger (1986: 127ff.) zeigt anhand eines Computerwettkampfes, daß die Hinweise auf den Einfluß der Auszahlungsmatrix und dynamischer Veränderungen der Auszahlungen berechtigt sind. TIT FOR TAT konnte im Wettkampf bei Veränderung beider Randbedingungen nur den dreizehnten bzw. den elften Platz erreichen. Ein weiteres Problem in Axelrods Untersuchung ergibt sich, weil die Ergebnisse möglicherweise zu sehr von der Wahl der Strategienmenge abhängen (vgl. May 1987: 16; Rogowski 1985: 459; Shalom 1986: 235). Axelrod selbst weist in seiner Analyse der Wettkämpfe auf erhöhte Siegchancen für unterlegene Strategien hin, falls die Menge interagierender Konkurrententypen variiert würde (vgl. Axelrod 1987: 35). Auch Nachfolgewettkämpfe (vgl. besonders Donninger 1986) belegen, daß in verschiedenen Konkurrenzmilieus verschiedene Sieger zu erwarten sind. In Donningers Replikation von Axelrods erstem Wettkampf mit veränderter Strategienmenge, belegte TIT FOR TAT nur den achten Platz. Allerdings zeigte sich wieder eine Überlegenheit von freundlichen und nachsichtigen Strategien, die aber zurückschlagen, wenn sie provoziert werden (vgl. Donninger 1986:126ff). Perfektheitsannahmen hinsichtlich der Abwesenheit von Fehlleistungen und Zufällen etc. teilt Axelrods Untersuchung mit dem Gros spieltheoretischer und ökonomischer Analysen. Das entkräftet natürlich nicht die einschlägige Kritik. Ein Verzicht auf einige Perfektheitsannahmen in der weiteren Entwicklung von spieltheoretischen Wettkampfsimulationen wird von einigen Rezensenten angeraten (vgl. Beer 1986: 184; Campbell 1985: 795). Dabei wird besonders die Möglichkeit der Fehlinterpretation von Verhaltensweisen hervorgehoben (vgl. Homans 1985: 896; Milgrom 1984: 308). In realen Situationen ist es oft nicht klar, ob ein Akteur wirklich defektiert hat, oder wer mit der Defektion begann, wenn zwischenzeitlich eine längeren Sequenz von wechselseitigen Vergeltungsschlägen erfolgt ist. Für das Entstehen von Kooperation im iterierten Gefangenendilemma erweist sich dieses Wissen aber als wichtig, da Vergehen und Be-
1.1. Axelrods „Die Evolution der Kooperation"
35
strafung durch die gleiche Handlung erfolgen. Die Unfähigkeit, zwischen gerechtfertigter, vergeltender und ungerechtfertigter Defektion zu unterscheiden, kann die Chancen der Kooperationsentstehung im iterierten Gefangenendilemma entscheidend mindern. Axelrod weist auf nachteilige Echoeffekte sich wechselseitig bedingender Racheakte hin, für die TIT FOR TAT (d.h. die Regel "Auge um Auge") im Spiel gegen einen anderen Akteur des gleichen Typs besonders anfällig ist. Nach Donniriger (1986: 132) fällt TTT FOR TAT in einer Umwelt, in der eine Wahrscheinlichkeit von 10% pro Zug für eine Verhaltensfehlleistung besteht, bei sonst gleichen Bedingungen wie in Axelrods Computerwettkampf auf Platz 6 der Strategienrangliste zurück. Stattdessen nehmen in diesem Szenario sanftere Strategien, die nicht bis zum vollen Maß der Schuld vergelten, die Spitzenplätze ein. Allerdings demonstriert Molander (1985), daß TIT FOR TAT sich geeignet verändern läßt, um in einer nicht störungsfreien Umwelt erfolgreich gegen sich selbst spielen zu können. Anders als im nPersonen-Spiel ändern sich die Kooperationsbedingungen und effektiven Verhaltensweisen im Zwei-Personen-PD bei Einführung von Unsicherheit und der Möglichkeit von Fehlleistungen nicht grundlegend. Diese Robustheit ist ein positives Indiz für die Entwicklungsfähigkeit des betrachteten Ansatzes. Kritik an den Verhaltensannahmen von Axelrod und der Spieltheorie generell, wird hinsichtlich des Egoismus der Akteure geäußert (vgl. Gowa 1986: 167; Shalom 1986: 235). Schwerwiegender erscheint jedoch, daß die Spieler in Axelrods Modell ihre eigenen Auszahlungen nicht mit denen anderer Spieler vergleichen. Das Fehlen eines Neidmotivs führt zu mangelndem "Realismus" des Wettkampfes (vgl. Campbell 1986: 795; Gowa 1986: 176; Homans 1985: 896). Eine Sekundärauswertung von Axelrods erstem Wettkampf durch Behr (1981) zeigt, daß sich die Erfolgsbedingungen des Turniers tatsächlich stark verändern, wenn die Überlegenheit einer Strategie über eine andere anstelle der Auszahlungssumme als Erfolgskriterium herangezogen wird. TIT FOR TAT erreicht nur noch den zwölften Rang von fünfzehn Teilnehmern, und zwei ausbeuterische Strategien teilen sich den ersten Platz. Kritisiert wurde auch, daß Axelrods Regeln die zwangsweise, unfreiwillige Interaktion der Spieler in einem Superspiel vorsehen. Die in der Realität oft gegebene Möglichkeit, einen unkooperativen Partner zu verlassen (Exit-Option), fehlt in diesem Szenario. Mehr soll zu diesem Thema hier
36
1. Kooperation zwischen wenigen Partnern
jedoch nicht ausgeführt werden, da ihm Kapitel 3 der vorliegenden Arbeit gewidmet ist. Die meisten der bisher angeführten Einwände zu Axelrods Modell sind Desiderata der weiteren spieltheoretischen Forschung. Sie entwerten das Modell nicht, denn selbstverständlich kann kein Modell an Umfassendheit leisten, was sich die Summe der Kommentatoren wünschen würde. Dennoch begrenzen natürlich die Prämissen des Modells die Tragweite der Ergebnisse. Es gilt daher nicht eigentlich, die Unangemessenheit des Modells festzustellen, sondern nur, ob zu weitgehende Folgerungen aus ihm gezogen werden, die vielleicht erst durch die Akkumulation weiteren Wissens über die Kooperationsbedingungen in spieltheoretischen Strategiewettkämpfen legitimiert werden könnten. Nach der herrschenden Meinung in Rezensionen von Axelrods "Die Evolution von Kooperation" überinterpretiert er die Aussagekraft seiner Ergebnisse bei weitem (vgl. Beer 1986: 190; Milgrom 1984: 308). Das trifft jedoch nur zu, wenn man die Wettkampfergebnisse in einem engeren Sinne auffaßt. Axelrods Ratschläge sind dagegen so allgemein und vage (zur Kritik vgl. Beer 1986: 186f.; Rogowski 1985: 460), daß sie die Handlungsoptionen in konkreten Fällen nicht einschränken. Die Vorschläge "Unterweise die Menschen, sich umeinander zu kümmern" (Axelrod 1987: 120), "Unterweise in Sachen Reziprozität" (Axelrod 1987: 122), "Verbessere die Erinnerungsfähigkeit" (Axelrod 1987: 124) etc. sind Gemeinplätze, zu denen es keines Studiums der Spieltheorie bedarf. Gerade das Beispiel der Ratschläge zur Reziprozität belegt die Problematik von Axelrods populären Folgerungen. Im Computerwettkampf ist TIT FOR TAT eine präzise definierte Strategie, die eine Defektion mit genau einer Gegendefektion beantwortet. Im Abschnitt über Reziprozität spricht Axelrod von TIT FOR TAT oft als ob diese Strategie wesentlich mehr Formen der Reziprozität umfassen würde. Unkooperative Aktionen können mit weniger oder mit mehr als dem Gleichen vergolten werden. Es wäre herauszufinden, wo ein optimales Ausmaß der Vergeltung liegt. Die Instabilität des Erfolges von TIT FOR TAT und anderer Reziprozitätsstrategien bei Variation der Spielbedingungen zeigt, daß dieses Maß in voller Allgemeinheit schwer zu bestimmen sein dürfte. Ein Axelrodschüler als Premierminister von Großbritannien wüßte z.B. nicht, ob er Hitlers Überfall auf Polen nur mit einer Protestnote oder mit unerbittlichem
1.1. Axelrods „Die Evolution der Kooperation"
37
Kampf "bestrafen" sollte. Nicht das Faktum, sondern das angemessene Ausmaß von Vergeltung dürfte "Beteiligte und Reformer" wohl wirklich interessieren. Außer in ihrem Anwendungsbezug lassen sich Axelrods Wettkampfergebnissen auch immanent kritisieren. TIT FOR TAT, das Gleiches mit exakt Gleichem vergilt, ist zumindest Axelrods Wettkampfumwelt besonders gut angepaßt. Als Gründe von I I I FOR TATs Erfolg führt Axelrod an, daß sie freundlich, nachsichtig, sowie verständlich ist und bei Ausbeutungsversuchen zurückschlägt. Man kann die entscheidenden Eigenschaften von TIT FOR TAT jedoch auch anders interpretieren. Es läßt sich beispielsweise darüber streiten, ob TIT FOR TAT tatsächlich eine nachsichtige Strategie ist. Sie zeigt sich zwar bereit, die Kooperation mit einem reuigen Defekteur wieder aufzunehmen, fordert aber zuvor die volle "Rückzahlung" des Defektionsgewinnes durch den Abweichler. Hier darf der Begriff der Nachsicht nicht zu weit ausgelegt werden. Wichtiger erscheint jedoch, daß TIT FOR TAT kaum ausgebeutet werden kann. Diese Strategie ist die (mit) am wenigsten ausbeutbare, kooperative Strategie. Ein Opponent vermag höchstens einmal mehr als TIT FOR TAT zu defektieren. Nach jedem erfolgreichen Ausbeutungsversuch muß ein Defekteur erst wieder alle Defektionsgewinne aufgeben, bevor TIT FOR TAT erneut in die Kooperation einwilligt. Es gelingt ihm daher nicht, mehr als einen Schritt in der Defektion gegenüber TIT FOR TAT voranzukommen. Die minimale Ausbeutbarkeit dieser Strategie dürfte nicht weniger zu ihrem Erfolg beitragen als die anderen von Axelrod hervorgehobenen Eigenschaften. Diese Eigenschaft sollte daher an vorderer Stelle in den Erfolgsbericht von TIT FOR TAT aufgenommen werden. Last not least verläuft die evolutionäre Durchsetzung von TIT FOR TAT nicht so glatt wie Axelrod annimmt. Das Konzept der kollektiven Stabilität garantiert, entgegen der Intention mit der es eingeführt wurde, nicht die Fähigkeit, das Eindringen fremder Strategien in eine Strategienpopulation abwehren zu können (vgl. Beer 1986: 175). Diese Eigenschaft besitzt nur eine evolutionär stabile Strategie (ESS, vgl. Maynard Smith 1974). Im Unterschied zur kollektiven Stabilität muß eine ESS mit sich selbst eine höhere Auszahlung erreichen als mit der eindringenden
38
1. Kooperation zwischen wenigen Partnern
Strategie. Im Fall der kollektiven Stabilität reicht auch die Gleichheit der Auszahlungen aus. Dadurch können alle freundlichen Strategien, die mit TIT FOR TAT immer kooperativ spielen, über den Mechanismus der Zufallsdrift in eine reine TIT FOR TAT-Population eindringen. Selbst bei einem anfänglich minimalen Populationsanteil wird eine andere kooperative Strategie bei zufälliger Fortpflanzung oder Ausbreitung mit gleichen Chancen asymptotisch fünfzig Prozent der Population erreichen. Das beinhaltet die Gefahr, daß auch unkooperative Strategien wieder erstarken, weil sich ihnen in Gestalt von zu sanften Kooperateuren eine leichte Beute bietet. In einer zusammmenfassenden Wertung sollten die kritischen Bemerkungen und Einwände zu Axelrods Untersuchung nicht überinterpretiert werden. Jede Arbeit, die neue Wege weist, läßt zunächst viele Fragen offen. Die vielfältigen Einwände zeigen jedoch, daß noch kein verläßliches und hinreichend spezifisches Wissen über die Bedingungen egoistischer Kooperation vorhanden ist, und sei es nur für Computersimulationen. Axelrods Ergebnisse bilden eine Grundlage auf der mit weiteren Studien aufgebaut werden kann, aufgebaut werden sollte und von einer Vielzahl von Arbeiten bereits aufgebaut wird (vgl. Axelrod/Dion 1988).
12. Colemans offenes Modell Ein besonderes Defizit vieler Kooperationsanalyse für kleine Gemeinschaften tritt auch bei Axelrod auf, und wurde bisher noch nicht angesprochen. Selbst wenn sich die Akteure in einem strategischen Kontext häufiger wiedersehen, heißt das nicht, daß sie nur miteinander interagieren, und daß keine Durchmischung der Partner stattfindet. Genau das unterstellt jedoch das Modell eines Superspiels ohne Ausstiegsmöglichkeit. Jeder der Akteure befindet sich in einer unauflöslichen Bindung an seine Partner, sofern nicht exogene Faktoren wie die Abbruchwahrscheinlichkeit den Zwangsverband beenden. Die Spieler besitzen keinen Einfluß auf solche exogenen Spielabbrüche. Die Prämisse einer Zwangsgemeinschaft erscheint in besonderen Zusammenhängen wie dem strategischen Dilemma der Aussagen von Strafgefangenen, das dem Gefangenendilemma den Namen gab, nicht unplausibel Ein solches Beispiel darf jedoch nicht darüber hinwegtäuschen,
1.2. Colemans offenes Modell
39
daß dieses Dilemma allgemein den Widerspruch zwischen individueller und kollektiver Rationalität der Nutzenmaximierung verkörpert, und daß in den meisten Situationen, in denen dieser Widerspruch eine Rolle spielt, kein unverbrüchlicher Zwangsbund der Partner vorliegen dürfte. Einen Weg, die allzu strenge und beengende Superspielannahme durch realistischere Prämissen zu ersetzen, beschreibt Coleman (1986). Auch er untersucht das Entstehen von Normen, d.h. kooperativem Verhalten, im iterierten Gefangenendilemmaspiel. Wiederum besteht die einzige Möglichkeit der Sanktionierung in der reaktiven Wahl der defektiven Strategie. Die Glaubwürdigkeit der Sanktionsdrohungen wird jedoch nicht über ein Superspiel hergestellt. Colemans Suche nach einer alternativen Basis für Sanktionsdrohungen geht aus von einer Übereinstimmung mit Axelrod hinsichtlich gewisser minimaler Bedingungen der egoistischen Kooperation. Axelrod und Hamilton behaupten (Axelrod 1987: 90): "Die Grundidee ist, daß ein defektierendes Individuum nicht davonkommen darf, ohne daß die anderen Individuen zur Vergeltung fähig sind. Das erfordert, daß das defektierende Individuum nicht in einem Meer der Anonymität verschwindet." Damit wird die Bedeutung der Zurechenbarkeit von Aktionen, der Identifizierbarkeit von Akteuren und der Bestrafung von Defekteuren für die Stabilität der Kooperation im Zwei-Personen-Gefangenendilemma betont. Coleman (1986: 62) gewinnt aus Axelrods und Hamiltons Aussage zwei Bedingungen, die er als grundlegend für das Entstehen von Kooperation ansieht. Einmal müssen alle Akteure mit denselben anderen Individuen häufiger interagieren, zum anderen bedarf es eines Gedächtnisses für die Identität und das Verhalten von Akteuren, mit denen man Kontakt hatte. Beide Bedingungen können auch ohne die Annahme eines Superspieles erfüllt werden, durch das noch schärfere Restriktionen eingeführt würden 1 ^. Coleman konstruiert ein Modell, in dem die beiden genannten Bedingungen im Vordergrund stehen und das auf schärfere Annahmen verzichtet. In einem verschieden großen Pool von Akteuren wird wiederholt eine Gefangenendilemma gespielt, wobei die Partner nach jedem Spiel zufällig
40
1. Kooperation zwischen wenigen Partnern
wechseln (oder zufällig gleich bleiben). Alle Akteure benutzen im Prinzip nur eine einzige Strategie, die von TIT FOR TAT abgeleitet ist. Im Gegensatz zu TIT FOR TAT unterscheidet Colemans Strategie jedoch zwischen bekannten und unbekannten Partnern. Unbekannten begegnet diese Strategie mit einer grundsätzlich unkooperativen Haltung, weil sie ihnen nicht vertraut. Gegen Bekannte wählt sie eine vorsichtigere Taktik. Wie TIT FOR TAT stützt sie ihre Entscheidung nur auf die letzte gemeinsame Interaktion und beantwortet einen kooperativen Zug des Gegenübers in der letzten gemeinsamen Runde mit Kooperation und einen defektiven mit Defektion. Anders als bei TIT FOR TAT existiert zu dieser Regel aber eine Ausnahme. Sofern ein Akteur selbst im vorletzten gemeinsamen Spiel defektiert hat, interpretiert er einen unkooperativen Akt des Partners in der letzten Interaktion als Vergeltungsschlag und kooperiert daraufhin, um eine Eskalation von Vergeltungsakten zu vermeiden (vgl. Coleman 1986: 64). Da Coleman nur eine Strategie für alle Akteure in seinem Modell verwendet, kann er nicht wie Axelrod oder evolutionsbiologische Untersuchungen (vgl. Maynard Smith 1982) den Erfolg unterschiedlicher Strategien vergleichen. Coleman analysiert die Stabilität der Kooperation von Individuen mit einer Strategie bei Veränderung der Randbedingungen (vgl. Coleman 1986: 64). Die Variation erfolgt dabei in zwei Richtungen. Zum einen wird das Gefangenendilemma in Gruppen mit unterschiedlicher Geschlossenheit gespielt. Geschlossenheit steht bei Coleman einfach für die Größe einer Gruppe von Akteuren, mit denen die wiederholte Interaktion stattfindet (vgl. Coleman 1986: 63). Je kleiner diese Gruppe, desto größer die Geschlossenheit des Systems. Zum anderen wird die Länge des Gedächtnisses der Akteure variiert. Generell wird unterstellt, daß ein Akteur sich noch an die letzen m Interaktionen mit anderen Akteuren erinnert. Falls Akteur i mindestens eines der letzten m Spiele mit Akteur j absolviert hat, wird er von diesem als Bekannter behandelt (vgl. Coleman 1986: 63). Die Länge m des Gedächtnisses verändert Coleman in verschiedenen Computerläufen des Modells. Geschlossenheit und Gedächtnis repräsentieren die eingangs postulierten, minimalen Bedingungen für das Entstehen von Kooperation. In einer ersten Gruppe von Simulationsläufen wird das beschriebene Basismodell untersucht. Als Indikatorvariable für die Stabilität der Kooperation benutzt Coleman den Anteil von Defektionen an der Gesamtmenge
1.2. Colemans offenes Modell
41
von Spielzügen. Es zeigt sich, daß schon nach wenigen Iterationen ein gleichgewichtiger Anteil erreicht wird. Dabei nimmt der Gleichgewichtsanteil von Defektionen mit steigender Länge des Gedächtnisses ab und mit wachsender Gruppengröße zu (vgl. Coleman 1986: 68-72). Trägt man Gruppengröße auf einer Achse ab und Länge des Gedächtnisses auf der anderen, ergibt sich folgendes Bild von Isoklinen des Anteils von Defektionen
.
B I L D 1: Auswirkungen von Gruppengröße und Gedächtnis bei Coleman (1986) Anteil
3
4
uon
Defektionen
6
Q
18
Gruppengroesse In einer zweiten Gruppe von Simulationsläufen hat Coleman ein verändertes Verhalten gegenüber unbekannten Partnern zugrundegelegt. Während zuvor alle Akteure Neulingen mit extremer Vorsicht und konsequenter Defektion begegneten, sind sie nun mit einer gewissen Wahrscheinlichkeit bereit, mit ihnen zu kooperieren. Die Wahrscheinlichkeit der Kooperation mit Fremden variiert unter den Akteuren gemäß einer Rechtecksverteilung 1 ^ mit den Eckwerten 0 und 1. Deshalb wird es nun
42
1. Kooperation zwischen wenigen Partnern
möglich, durch einen evolutionären Prozeß zu analysieren, welches Ausmaß an Fremdenfreundlichkeit bzw. -feindlichkeit sich mit der Zeit durchsetzt (vgl. Coleman 1986: 75). Die Ergebnisse der zweiten Gruppe von Simulationen zeigen, daß der Anteil von Defektionen abnimmt, sobald keine völlige Fremdenfeindlichkeit mehr vorherrscht. Insgesamt lag der durchschnittliche Anteil der Defektionen bei xenophoben Strategien um 0.8, während er bei freundlicheren Strategien, die einem Prozeß evolutionärer Konkurrenz unterworfen waren, auf etwa 0.43 sank. Insgesamt dürften die von Colemans Modell aufgedeckten Zusammenhänge zwischen Gruppengröße, Länge des Gedächtnisses und Fremdenfreundlichkeit kaum überraschen. Andererseits sind spieltheoretische Simulationen relativ junge Analysetechniken, so daß es ausreichend erscheint, wenn Alltagserwartungen zunächst einmal unter kontrollierten Bedingungen erhärtet werden, bevor zu Ergebnissen vorgestoßen wird, die nicht schon dem common sense entspringen. Colemans Untersuchung zeigt zumindest, daß auf die Annahme von Superspielsituationen bei der Analyse endogener Kooperationsentstehung verzichtet werden kann. Im Falle der Reidentifizierbarkeit von Akteuren und einer hinreichend hohen Interaktionswahrscheinlichkeit von jedem Akteur mit jedem anderen, handelt ein stabiler Anteil von rationalen Akteuren kooperativ. Die Restriktionen von Colemans Modell beschränken auch seine Erklärungsleistung auf den Nachweis, daß rein egoistische Kooperation in kleinen Gruppen, primitiven Gesellschaften und zwischen Nachbarn entstehen kann. Auf die Frage, wie selbsterhaltende Normensysteme entstehen konnten, können Utilitaristen nun zuversichtlicher mit Axelrod und Coleman antworten: weil die gesellschaftliche Kooperation in frühen sozialen Gemeinschaften im Eigeninteresse der Individuen lag. Die Beschränkung der Ergebnisse von Axelrod und Coleman auf kleine Gruppen und primitive Gesellschaften offenbart jedoch ein fehlendes Glied in der spieltheoretischen Analyse. Die genannten Bedingungen für das endogene Entstehen von Kooperation sind um so weniger gegeben, je größer, mobiler und anonymer eine Gesellschaft wird. Genau diese Entwicklungsrichtung haben aber moderne Gesellschaften eingeschlagen. Bedeutet das, daß die soziale Kooperation immer fragiler wird? Wird nun,
1.2. Colemans offenes
Modell
43
um die Frage unter normativistischen Prämissen zu reformulieren, der individuelle Egoismus immer mehr die Kraft nomativer Bindungen aushöhlen, bis der Gesellschaft der Zusammenbruch droht? Merkwürdigerweise führen klassische, normativistische Warnungen vor dem Verfall der gemeinschaftlichen Werte, und Ergebnisse der spieltheoretischen Analyse zum selben Schluß. Große Gesellschaften drohen sich durch Auflösung der sozialen Vertrautheit der Individuen untereinander selbst zu zerstören. Normativistische und utilitaristische Ansätze erachten allerdings verschiedene Bindungen als wichtig. Während der Utilitarismus die situativen Randbedingungen und individuelle Entscheidungsparameter hervorhebt, betonen normativistische Schulen das Gewicht moralischer Autorität und normativer Integration. In Kapitel 2 wird diesen Fragen nun genauer nachgegangen.
KAPITEL 2: KOOPERATION IN GROSSEN GEMEINSCHAFTEN Die Rede vom Hobbesschen Ordnungsproblem übersieht leicht, daß nicht ein solches Problem, sondern ein Konglomerat verwandter Fragestellungen im Werk von Thomas Hobbes und der daran anschließenden Diskussion existiert
Bereits das letze Kapitel referierte Beiträge zum Teilpro-
blem des Entstehens sozialer Kooperation aus einem hypothetischen Urzustand des rationalen Egoismus heraus. Die Grenzen der Zwei-Personen-Analyse lassen es jedoch ratsam erscheinen, mindestens noch die Dilemmas der Gemeinschaftsproduktion öffentlicher Güter in die Modelle zur Ordnungsthematik einzubeziehen. Das öffentliche Gut, das bei Hobbes durch einen Gesellschaftsvertrag zu erzeugen wäre, ist der innere Friede in einer Gemeinschaft, oder die Sicherheit von Leben und Eigentum aus Sicht der Individuen. Spieltheoretisch impliziert dieser Schritt, daß von Zwei- zu n-Personen-Dilemmas als Grundlage der Kooperationsanalyse übergegangen wird (vgl. Taylor 1976,1987). Damit wird gleichzeitig auch der Weg zur Untersuchung des Ordnungsdilemmas in beliebig großen Gesellschaften bereitet, denn ab einem hinreichend großen "n" verändern sich die strategischen Eigenschaften des PD nicht mehr. Eine Betrachtung des einfachen iterierten n-Personen-PD, in dem nur jeweils die Individuen Maßnahmen zur Aufrechterhaltung der Kooperation treffen können, schränkt die Anwendbarkeit des Modells allerdings wesentlich ein. In Hobbesschen Termini beschreibt sie die gesellschaftliche Situation vor der Konstitution des "Leviathan", der absoluten, staatlichen Zentralmacht. Mit Hilfe des Grundmodells kann man bestenfalls der Frage nachgehen, ob rationale Egoisten ohne Zwang Ressourcen zur Einführung einer Zentralmacht bereitstellen würden. Ihre volle Kraft entfaltet die Untersuchung des einfachen n-Personen-PD erst, wenn Dilemmas der Nutzung und Produktion öffentlicher Güter im allgemeinen zur Sprache kommen (vgl. Olson 1968). Einen Paradefall für diese erweiterte Problematik stellt das Dilemma des Umweltschutzes in einer gleichberechtigten und oft nur allzu egoistischen Staatengemeinschaft dar. Sofern keine übergeordnete Weltzentralgewalt existiert, und einzelne, besonders mächtige Staaten nicht den globalen Polizisten spielen, befindet sich die Gemeinschaft von Staaten in einem n-Personen-PD. Taylors Untersuchung der Kooperationsprobleme in dieser Struktur betrifft demnach nicht nur das Hobbesproblem, sondern auch die neuesten Dilemmas des Umweltschutzes und gemeinsamen Ressourcenverbrauchs. Das sollte für die
2.1. Gefangenendilemma ohne Ausschlußoption
45
Schlußdiskussion in Erinnerung behalten werden. Die großen Schwierigkeiten, die der egoistischen Kooperation im n-Personen-PD begegnen sprechen dafür, einige Variationen zum Grundthema vorzunehmen. Einmal könnte man eine Zentralgewalt in das Spiel einsetzen, denn wie schwer auch immer zu erklären sein mag, wie diese Gewalt entstanden sein soll, ihre Existenz in der Realität läßt sich nicht bestreiten. Das würde zu der eingeschränkten Frage führen, ob diese Zentralgewalten eine Gemeinschaft rationaler Egoisten wenigstens soweit in Zaum halten können, daß sie nicht auseinanderbricht. Klassiker der Soziologie wie Dürkheim (1977) und Parsons (1949)^ hoben vor allem diesen Aspekt des Hobbesschen Problemkomplexes hervor und bestritten prinzipiell die Möglichkeit einer stabilen Gesellschaft auf der Basis des Zwanges und des rationalen Egoismus allein. Eine weitere Variation bestünde darin, den Auschluß von Individuen vom Konsum eines gemeinschaftlich genutzten Gutes zuzulassen, was im Grundmodell nicht möglich ist. Das Gut verliert dabei den Charakter eines öffentlichen Gutes im strengen Sinne, und sei im folgenden als kollektives Gut bezeichnet. Das für die Hobbessche Fragestellung entscheidende Gut "Sicherheit vor Übergriffen anderer" ist ein kollektives Gut entsprechend dieser Definition, denn vom Schutz durch den Staat oder durch freiwillige Schutzgemeinschaften als dessen mögliche sozioevolutionäre Vorläufer (vgl. Nozick 1976) können Akteure sehr wohl ausgenommen werden, wenn sie ihre "Mitgliedsbeiträge" nicht entrichten. Bendor und Mookherjee (1987), sowie Hirshleifer (1988) haben die Implikationen einer Ausschlußoption in Verbindung mit ihrer zentralen oder dezentralen Handhabung untersucht. Ihre Ergebnisse berühren die Frage der Stabilität eines Machtstaates, aber auch einer freiwilligen und gewaltfreien Schaffung sozialer Verbände^.
2.1. Kooperation in n-Personen-Gefangenendilemmas ohne Ausschlußoption Auf den ersten Blick ist ein n-Personen-Gefangenendilemma nur eine Ausweitung eines Zwei-Personen-PD um weitere Spieler. Es zeigt sich jedoch, daß eine solche Ausweitung zu einer unbestimmteren Auszahlungsmatrix führt. Dabei muß angegeben werden, welche Eigenschaften
46
2. Kooperation
in großen
Gemeinschaften
des kleineren Spiels in der Situation mit vielen Beteiligten erhalten bleiben sollen. Intuitiv scheint klar, daß ein Akteur von einer Defektion profitieren können muß, wenn ansonsten die Zahl der kooperierenden Spieler gleich bleibt. Außerdem sollte die Auszahlung im Falle der Kooperation aller Spieler für alle höher sein, als bei allseitiger Defektion. Auf diese Weise wird sichergestellt, daß ein Widerspruch zwischen der kollektiven und der individuellen Rationalität im Spiel vorliegt. Dieser Widerspruch existiert unabhängig von Problemen der Definition des Gemeinwohls^ nur dann, wenn im kollektiv rationalen Zustand niemand schlechter wegkommt und einige besser abschneiden, als bei allseitiger Wahl des scheinbaren, individuellen Vorteils. Schließlich sollte vorausgesetzt werden, daß ein defektierender Spieler vom kooperativen Verhalten anderer profitiert; die Defektionsauszahlungen bei teilweiser Kooperation müssen also höher sein als bei genereller Defektion. Taylor (1976: 43ff.) verwendet diese Überlegungen in seiner Definition des n-Personen-Gefangenendilemmas, auf die sich die weitere Analyse stützt^. Bei einer Zahl von n-1 übrigen Spielern, von denen v kooperieren, sei f(v) die Auszahlung eines Spielers der selbst kooperiert, und g(v) die eines Spielers, der selbst defektiert. Die Auszahlungsmatrix M2 dieses Gefangenendilemmas läßt sich nun auf einfache Weise wie folgt darstellen: v =
0
1
2
3
4
n-1
C
f(0)
f (n-1 )
D
g(0)
g(n-1)
Matrix M2 ist genau dann ein n-Personen-Gefangenendilemma, wenn gilt (Taylor 1976: 43-44): (1)
g(v) > f(v)
(2)
f(n-l) > g(0),
(3)
g(v) > g(0)
für alle v > 0,
für alle v > 0.
2.1. Gefangenendilemma ohne Ausschlußoption
47
Die Ungleichungen (l)-(3) geben die obigen, intuitiven Überlegungen wieder und sollen jetzt nochmals etwas genauer betrachtet werden. Nicht immer dürfen sie als unproblematisch gelten. Ungleichung (1) gibt an, daß Defektion unabhängig von der Handlungswahl der anderen Akteure für jeden Akteur eine höhere Auszahlung verspricht, als die zugehörige kooperative Option. D erweist sich damit auch im n-Personen-Kontext als dominante Strategie, und es dürften keine Probleme auftreten, dies als Grundkennzeichen eines Gefangenendilemmas zu akzeptieren. Bei Ungleichung (2) liegt der Fall komplizierter. In ihr wird nur angenommen, daß allseitige Kooperation besser ist als allseitige Defektion. Durch den Raum, den diese Definition für zusätzliche Auszahlungsrelationen läßt, können Unterklassen von verschiedenen Typen von n-Personen-PDs gebildet werden, die grundlegend unterschiedliche Kooperationsbedingungen aufweisen. So ist es zum Beispiel möglich, daß nicht die völlig kooperative Lösung das Optimum der gemeinsamen Wohlfahrt darstellt, sondern Lösungen in denen pro Spiel ein gewisser Prozentsatz von Spielern defektiert. Das entspricht Situationen des täglichen Lebens, in denen eine strikte Einhaltung sozialer Normen (z.B. Pünktlichkeit) gelegentlich durch äußere Umstände erschwert wird und mit hohen Kosten verbunden ist. In solchen Fällen erscheint es sinnvoll, mit Blick auf die allgemeine Wohlfahrt Ausnahmen zu dulden, sofern sie nicht überhand nehmend Allerdings gestaltet sich unter diesen Prämissen die Aufgabe der endogenen Entstehung und Stabilisierung von egoistischer Kooperation besonders schwierig, wie anhand der weiter unten durchgeführten strategischen Analysen erkennbar wird. Trotz dieser Problematik wird Ungleichung (2) zunächst als ausreichende Beschreibung des Widerspruches zwischen kollektiver und individueller Rationalität verwendet und nähere Bestimmungen nur bei Bedarf eingeführt. Das gleiche gilt für Ungleichung (3). Auch hier kann eine maximale, defektive Auszahlung g(v ) mit v < n-1 existieren. Taylor (1976: 44) weist in seiner Erläuterung der Definition des n-Personen-PD allerdings darauf hin, daß meist zusätzlich ein monotoner Anstieg (g(v^) > g ^ ) , wenn v j > V2) der Defektionsauszahlungen angenommen wird. Wie kann nun egoistische Kooperation im n-Personen-PD entstehen? Im
48
2. Kooperation
in großen
Gemeinschaften
einfachen Spiel bildet D die einzige dominante Strategie und die unkooperative Lösung stellt unter rationalen Egoisten daher das zu erwartende Ergebnis dar. Olsons (1968) Untersuchung des Dilemmas gemeinsamer Aktion in großen Gruppen basiert auf diesem Ergebnis und nährt eine pessimistische Einschätzung ihrer Aktionsfähigkeit. Diesem Vorbehalt gegen die Möglichkeit egoistischer Kooperation läßt sich begegnen, indem betont wird, daß soziale Dilemmasituationen oft mit einer wiederholten Interaktion der gleichen Akteure einhergehen (z.B. gemeinsame Aktion in Organisationen, Krieg, Politik). Die Iteration von Dilemmaspielen (vgl. Aumann 1981) eröffnet, wie bereits in Kapitel 1 gesehen, neue Chancen für die Kooperation und für vorausschauende Verhaltensstrategien^. Gleichzeitig verzichtet diese Annahme noch auf die Einführung von Erzwingungsstäben, exogenen Veränderungen der Spielsituation und anderer Maßnahmen, die bereits eine Aufgabe des Versuches darstellen, das Entstehen von Kooperation aus der Handlungslogik unabhängiger Akteure heraus endogen zu erklären. Iterative Spiele erlauben den Akteuren Gesamtstrategien zum Schutz vor Ausbeutung für die ganze, sich über mehrere Spiele erstreckende, strategische Situation. Zunächst erscheint klar, daß die beteiligten Akteure wie im Zwei-Personen-Fall reaktive Strategien spielen müssen, die defektives Verhalten mit vergeltender Unkooperativität beantworten, wenn kooperatives Verhalten überhaupt eine Chance erhalten soll. Ohne reaktive Drohungen entsteht ein Anreiz, kooperative Partner risikofrei auszubeuten. Andere Maßnahmen der reaktiven Bestrafung bzw. des Selbstschutzes vor Ausbeutung stehen im Rahmen des Gefangenendilemmas nicht zur Verfügung. Eine Ausnahme bildet die Exit-Option, ein unkooperatives, iteriertes n-Personen-PD zu verlassen. Diese strategische Option steht bei Problemen öffentlicher Güter im Widerspruch zur Annahme, daß sich Akteure Externalitäten nicht entziehen können. Dementsprechend ist bei öffentlichen Gütern auch ein Ausschluß unkooperativer Akteure aus einer kooperativen Gruppe nicht möglich. Taylor liefert eine eingehende Analyse der verbleibenden Strategien, wenn auf die Auschlußoption verzichtet werden muß. In großen Gruppen wird es kaum möglich sein, daß alle Akteure das Verhalten aller anderen Akteure verfolgen können. Die reaktive Handlungswahl wird sich daher auf eine Aggregatgröße beziehen müssen, wobei Taylor von der Gesamtzahl v von Spielern ausgeht, die außer dem jeweils
2.1. Gefangenendilemma ohne Ausschlußoption
49
in seiner Entscheidungsfindung betrachteten Akteur kooperieren. Für jeden Spieler i existiert ein minimales, erträgliches Kooperationsniveau v' = kj, wobei er reaktiv in allen folgenden Spielen D wählt, wenn sich mindestens einmal weniger als kj andere Akteure kooperativ verhalten haben. Vereinfachend wird bei Taylor angenommen, daß alle kj = k identisch sind. Aufgrund dieser Annahmen läßt sich nachweisen, daß sich nur dann eine gleichgewichtige Lösung des Spieles ergibt, wenn genau k Akteure unabhängig von jedem beliebigen Akteur kooperieren (Taylor 1976: 45ff.; Voss 1985: 223). In diesem Fall würde die Defektion jedes einzelnen Akteurs im nächsten Spiel zum völligen und endgültigen Zusammenbruch der Kooperation führen, was aus Eigeninteresse von keinem Defekteur gewollt werden kann. Jeder potentielle Defekteur wird folglich genau bei v = k von unkooperativem Verhalten abgeschreckt, sofern er den Verlust zukünftiger Auszahlungen hoch genug einschätzt. Bei v > k gilt dies nicht mehr, da jeder hoffen kann, daß v-1 immer noch größer oder gleich k bleibt, wenn nur er defektiert und andere nicht. Bei v < k bricht die Kooperation ohnehin zusammen und jeder sollte aus Selbstschutz D wählen. Damit ist bewiesen, daß Kooperation unter Egoisten prinzipiell entstehen o und stabil bleiben kann". Dennoch ist noch nicht viel erreicht; zuviele kritische Einwände lassen sich gegen die dargestellte "Lösung" eines n-Personen-PD vorbringen. Einmal bedarf es eines Koordinationsmechanismus, der dazu führt, daß alle individuellen Grenzen kj miteinander identisch werden. Unter der Annahme individuell verschiedener kj, entsteht kein Gleichgewicht mehr, und es kann erwartet werden, daß die Kooperation schnell zusammenbricht. Wie soll aber die Koordination in einer sehr großen Gruppe ohne Koordinationsstäbe erfolgen? Das Warten auf eine zufällige Identität der Grenzen, die sich als gleichgewichtig bewährt, scheitert an der Wahrscheinlichkeitstheorie, nach der dieses Ereignis extrem unwahrscheinlich ist. Doch selbst wenn sich ein einheitliches k ansetzen ließe, würde es für k < n-1 nur durch einen extremen Zufall erreicht. In dieser Situation dürfen immerhin einige Akteure defektieren, ohne daß die gesamte Kooperation zusammenbricht. Dadurch entsteht ein neues Dilemma der Strategiewahl im n-Personen-Gefangenendilemma. Sofern genügend andere Akteure sich kooperativ verhalten, verspricht die Defektion jedem einzelnen Vor-
50
2. Kooperation
in großen
Gemeinschaften
teile. Sofern aber alle dieser Logik folgen, wird eine kooperative Lösung unweigerlich verhindert. Eine universalisierbare und individuell rationale Regel für die Strategiewahl kann daher nicht existieren. Für jede beliebige Wahrscheinlichkeit mit der kooperiert wird, ist es bei vielen Spielern aufgrund der Gesetze der Binomialverteilung sehr unwahrscheinlich, daß eine Lösung mit genau k + 1 kooperierenden Akteuren entsteht^. Wenn mehr als k + 1 Kooperateure vorhanden sind, besitzen im nächsten Spiel alle den Anreiz, in der Hoffnung zu defektieren, daß andere Kooperateure das gerade nicht tun. Wiederum erscheint es unwahrscheinlich, daß de facto genau soviele defektieren, daß am Ende exakt k + 1 kooperative Spieler übrig bleiben. Die Logik des Beweises der prinzipiellen Möglichkeit egoistischer Kooperation im n-Personen-PD schließt also den Nachweis der extremen Unwahrscheinlichkeit dieser Lösung mit ein und kann daher kaum befriedigen^. Die Schwierigkeit, einen Gleichgewichtszustand mit hinreichend hoher Wahrscheinlichkeit zu erreichen, zeichnet allerdings auch genau eine Verhaltensregel als universalisierbar aus. Nur wenn k = n-1 gilt, d.h. die Schwelle zur reaktiven Defektion überschritten wird, sobald ein Akteur sich unkooperativ verhält, kann erwartet werden, daß eine stabile, kooperative Lösung entsteht (vgl. Bendor/Mookherjee 1987: 133). In diesem Fall weiß jeder Akteur, daß die Kooperation in der Gruppe für immer zusammenbricht, falls er nur einmal defektiert. Bei hinreichend hoher Wertschätzung zukünftiger Kooperationsgewinne wird jeder potentielle Defekteur wirkungsvoll abgeschreckt. Nur: welche Anreize besitzen rational egoistische Akteure, die Sanktionsregel S' mit k = n-1 zu wählen? Die Tatsache, daß ein Gleichgewicht entstehen würde, wenn alle Spieler kooperierten und diese Sanktionsregel einhielten, stellt noch keinen Nachweis der individuellen Rationalität dieses Verhaltens dar. Bei genauer Analyse entsteht das Problem, daß nicht alle Akteure S' verfolgen müssen, damit die Drohung mit dem Zusammenbruch der Kooperation Gewicht erhält. S' ist zwar universalisierbar, kann aber auch bei nur partieller Verbreitung einen verläßlichen Mechanismus darstellen, der nach einer einzigen Defektion die Kooperation im n-Personen-PD für immer zerstört. Man muß dazu nur ein Beispiel betrachten, in dem die Hälfte der Akteure S' spielt und die andere Hälfte kooperiert, wenn mehr als 70% aller Spieler kooperieren. Die erste Defektion löst in diesem Szenario unweigerlich den völligen Zusammenbruch der Kooperation in zwei Zügen
2.1. Gefangenendilemma ohne
Ausschlußoption
51
aus. Die Wahl einer Sanktionsregel ist folglich bestenfalls schwach determiniert^. Aus der Sicht des Handlungskalküls eines potentiellen Defekteurs werden die Probleme dadurch nicht geringer. Er muß bei einer Vielzahl von Kombinationen von Sanktionsregeln in der Spielermenge damit rechnen, daß seine Defektion den Zusammenbruch der Kooperation auslöst. Das ist ein starkes Argument von jedem Versuch abzusehen, Defektionsgewinne zu realisieren. Gerade die Fragilität der kooperativen Lösung im n-Personen-PD könnte somit zu starker Selbstdisziplin und zum Erhalt und Entstehung von Kooperation unter rationalen Egoisten beitragen. Dieses Ergebnis gilt allerdings nur unter sehr restriktiven Bedingungen. Ähnlich wie im oben diskutierten Fall einer unbestimmten Sanktionsregel mit k = v, bricht auch bei k = n-1 die Kooperation mit hoher Wahrscheinlichkeit zusammen. Es müssen nur einige Prämissen eingeführt werden, die in der Realität praktisch immer gegeben sind: ein gewisses Risiko einer Fehlentscheidung, der Fehlinterpretation des Verhaltens anderer, oder individuelle Sorglosigkeit. Im Gleichgewicht von S' würde die Kooperation zusammenbrechen, sobald bei beliebig vielen Spielern auch nur ein einziger die Aktion eines anderen fälschlich als D interpretiert. Das gleiche wäre der Fall, wenn auch nur ein Spieler irrtümlich defektiert. Trotz der formalen Stabilität des kooperativen Gleichgewichtes für S\ erscheint die kooperative Lösung im n-Personen-PD extrem brüchig. Insgesamt kommt die Analyse der Chancen der endogenen Kooperationsentstehung im iterierten n-Personen-PD ohne Ausschlußmöglichkeit zu einem negativen Ergebnis. Sofern dieses Spiel nicht ausschließlich als Modellkonstrukt verstanden wird, sondern die Struktur real existierender, sozialer Dilemmas abbilden soll, verweisen alle Ergebnisse darauf, daß das Entstehen von egoistischer Kooperation extrem unwahrscheinlich ist. Wenn überhaupt Kooperation in diesem Kontext entstehen kann, bedarf es zusätzlicher Sanktionsmechanismen. Einige Überlegungen zu Erweiterungen des Sanktionspotentials im n-Personen-PD sollen nun dargestellt werden, wobei die Auschlußdrohung gegen Mitglieder im Mittelpunkt steht.
52
2. Kooperation
in großen
Gemeinschaften
2.2. Kooperation im n-Personen-Gefangenendilemma mit Ausschlußoption Bendor und Mookheijee (1987) untersuchen, ob die egoistische Kooperation im n-Personen-Gefangenendilemma erleichtert wird, wenn die Möglichkeit besteht, unkooperative Mitglieder auszuschließen, oder wenn eine große Gruppe in vernetzte kleine untergliedert wird^. Nur die erste Zusatzannahme wird für die gegenwärtige Diskussion von Interesse sein, da eine Aufteilung eines großen sozialen Dilemmas in viele kleine das Problem der gemeinsamen Aktion einer großen Zahl von Akteuren eher umgeht als löst. Auch Bendor und Mookherjee gehen davon aus, daß ein kooperatives Gleichgewicht im n-Personen-PD existiert, wenn alle Spieler ihre Kooperation von der Kooperation aller anderen Spieler abhängig machen (Bendor/Mookherjee 1987: 133). An Sanktionen ist ihr Modell jedoch reicher als das gewöhnliche iterierte Gefangenendilemma. Es gibt eine Zentralinstanz (headquarters), die unkooperative Akteure aus der Menge der Spieler ausschließen kann. Der Ausschluß ist permanent und führt dazu, daß die ausgestoßenen Mitglieder nur noch die Auszahlung realisieren können, die sich ergäbe, wenn alle Akteure defektieren würden. Ausgeschlossene Mitglieder können ohne Schwierigkeiten durch neue ersetzt werden, die auf die Chance zur Teilnahme an dem gemeinsamen Projekt warten (vgl. Bendor/Mookherjee 1987:135). Ein entscheidender Parameter für die Beurteilung der Chancen einer andauernden Kooperation in diesem Spiel ist die Zuverlässigkeit q der Überwachung. Dieser Parameter gibt die Wahrscheinlichkeit an, mit der unkooperative Aktionen von einzelnen Spielern von der Zentralinstanz entdeckt und bestraft werden. Es folgt unmittelbar, daß bei sehr hoher Überwachungsqualität, also wenn q fast eins wird, jeder einen Anreiz besitzt, kooperativ zu handeln. Das gilt auch, wenn zwischen Spielern unterschieden wird, die ihre Kooperationsleistung mit mehr oder mit weniger eigenen Kosten erstellen können. Diese Unterteilung bei Bendor und Mookherjee entspricht einer getrennten Betrachtung von Mitgliedern mit hoher und niedriger aufgabenspezifischer Leistungsfähigkeit. Bendor und Mookherjee (1987: 135) resümieren: "Wenn die Überwachung sehr gut ist (q liegt genügend nahe bei 1), wird
2.2. Gefangenendilemma mit Ausschlußoption
53
jeder partizipieren, denn annahmegemäß ist es für Mitglieder mit geringen und größeren Fertigkeiten gleichermaßen besser, ihren Beitrag zu leisten als ausgestoßen zu werden. Wenn die Überwachung sehr schlecht ist, wird niemand partizipieren. Die eigentlich interessante Situation entsteht, wenn q mittlere Werte annimmt." Für mittlere Werte von q, hinreichende Wertschätzung zukünftiger Kooperationsgewinne, und genügend unterschiedliche Fertigkeiten der Mitglieder, steht zu erwarten, daß nur die leistungsfähigeren Akteure kooperieren, während sich Akteure mit geringerer Leistungsfähigkeit zum Trittbrettfahren entschließen. Diese Lösung tritt dann auf, wenn einigen Spielern ihr Beitrag sehr leicht fällt, und ein Zusammenbruch der Kooperation für sie unangenehmer wäre, als die Trittbrettfahrer mitzutragen. Die wenig leistungsfähigen Trittbrettfahrer dagegen müßten bei Kooperation relativ hohe Kosten auf sich nehmen und sehen in der Defektion kein allzu großes Risiko des Verlustes. Bendor und Mookherjee wird es möglich, durch die Hervorhebung gruppenspezifisch unterschiedlicher optimaler Strategien zu erklären, daß in Organisationen ein begrenzter Teil der Belegschaft die meiste Arbeit macht (vgl. Bendor/Mookherjee 1987: 136). Die Einführung einer überwachenden Zentralinstanz (die "Hobbes-Variante") löst das Problem der wirksamen Bestrafung unkooperativen Handelns. Das mag für einige Aspekte der Ordnungsproblematik ausreichend erscheinen, aber diese Lösung besitzt Nachteile. Sie impliziert Machtdifferenzen zwischen Akteuren, sie schafft eigene Probleme der Kontrolle der Zentralinstanz, und sie gibt den Versuch auf, Kooperation aus der freiwilligen Zusammenarbeit von egoistischen Akteuren zu verstehen. Die Ambitionen der meisten spieltheoretischen Untersuchungen erstrecken sich gerade auf diesen, letzten Punkt. Aufgrund der Nachteile der Hobbesschen Lösung und den individualistischen Ambitionen suchen Bendor und Mookherjee weiter nach Möglichkeiten, wie auch bei Fehlen einer Zentralinstanz ein kooperatives Gleichgewicht etabliert werden kann. Um die Schwierigkeiten dieser Aufgabe genauer zu erfassen, betrachten sie die Auswirkungen unvollständiger Information auf die oben beschriebene dezentrale Gleichgewichtsstrategie "Kooperiere nur, solange alle anderen kooperieren!". Die Stabilität freiwilliger Kooperation im n-Personen-PD wird negativ be-
54
2. Kooperation
in großen
Gemeinschaften
einflußt, wenn das Ergebnis der gemeinsamen Aktion nicht nur vom Einsatzwillen der beteiligten Akteure abhängt, sondern auch von äußeren Umständen oder Fehleinschätzungen. Sobald diese Annahme eingeführt wird, droht der Kooperation ein schneller Zusammenbruch (vgl. Bendor/Mookherjee 1987: 137). Zu untersuchen ist, ob eine Absenkung des zur Erhaltung der Kooperation nötigen Leistungsniveaus Abhilfe gegen diese Drohung schaffen kann. Bendor und Mookherjee stellen zu dieser Frage zwei Resultate vor. Einmal weisen sie nach, daß das Niveau, dessen Unterschreitung zur allgemeinen Wahl der D-Strategie führt, nicht viel höher liegen darf, als das bei Unsicherheit erwartete Outputniveau der Gruppe (vgl. Bendor/Mookherjee 1987: 138). Andernfalls wäre das Risiko eines unbeabsichtigten Zusammenbruchs der Kooperation zu hoch. Im übrigen existiert eine kritische Gruppengröße über die hinaus kein kooperatives Gleichgewicht mehr realisiert werden kann (vgl. Bendor/Mookherjee 1987: 140). Der Grund liegt darin, daß jeder Akteur glauben können muß, daß sein Beitrag entscheidend ist, damit die Gesamtleistung einer Gruppe über dem gerade kooperationserhaltenden Niveau bleibt. Nur in diesem Fall wird der Akteur zuverlässig von der Defektion abgeschreckt. Je größer aber die Gruppe wird, desto unwahrscheinlicher wird es für jeden Spieler, daß gerade er den entscheidenden Beitrag liefert. Bendor und Mookherjee (1987: 140) folgern: "Daher wird die Wahrscheinlichkeit, daß irgendein Individuum das Zünglein an der Waage darstellt in sehr großen Gruppen verschwindend klein, und das dezentralisierte Regime kann die Kooperation nicht länger aufrechterhalten." Die Chancen freiwilliger Kooperation in sozialen Dilemmas mit einer großen Zahl von Beteiligten sind folglich gering. Rettung verspricht der Rückzug auf eine zentralisierte Instanz mit Ausschlußrecht. Es läßt sich zeigen, daß auch bei Unsicherheit des Leistungsergebnisses eine stabile Mischung von leistungsstarken, kooperativen und leistungsschwachen, unkooperativen Akteuren hergestellt werden kann (vgl. Bendor/Mookherjee 1987: 138). Eine andere Möglichkeit der Stabilisierung von Kooperation besteht in der Aufteilung des großen n-Personen-Dilemmas in vernetzte Subgruppen von Dilemmas mit wenigen Spielern (Bendor/Mookherjee 1987: 140ff.).
2.2. Gefangenendilemma
mit Ausschlußoption
55
Es bleibt hervorzuheben, daß die Arbeit von Bendor und Mookherjee die bekannten Probleme der Kooperation im n-Personen-PD bestätigt. In ihrem Resümee betonen Bendor und Mookherjee die Bedeutung hierarchisierter Geflechte von Beziehungen in und zwischen kleineren Gruppen für die Stabilität von Organisationen und Gesellschaften (vgl. Bendor/Mookherjee 1987: 144ff.). Solche Geflechte erlauben eine "duale Kontrolle" von Individuen, d.h. die Kombination von bedingter Kooperation auf gleichberechtigter Gruppenebene, bei der sich Akteure weigern, ausbeuterische Partner zu unterstützen, und selektiven Anreizen "von oben". Daher behaupten Bendor und Mookherjee (1987: 145): "...die wirkliche Entscheidung ist nicht die zwischen Anarchie und Staat, sondern zwischen verschiedenen Formen der dualen Kontrolle." Die Chancen für das Entstehen endogener Kooperation unter rationalen Egoisten untersucht auch David Hirshleifer (1988). Wie Bendor und Mookherjee greift er auf den Ausschluß von Gruppenmitgliedern (ostracism) als Strafe für defektierende Akteure zurück (Hirshleifer 1988: 2). Ein Ausschluß erfolgt immer, wenn ein Akteur von mindestens einem anderen Akteur der Defektion bezichtigt wird (Hirshleifer führt das Verb "to blackball someone" für diesen Vorgang ein). Die Durchsetzung des Ausschlusses verursacht keine Kosten. Der Ausgeschlossene kann zu seinem Nachteil von den Ressourcen oder Leistungen der Gruppe abgeschnitten werden. Jedes Gruppenmitglied kann beliebig viele andere der Defektion bezichtigen. Der Ausschluß gilt nur für eine Runde; später kann der Bestrafte wieder in die Gruppe eintreten (vgl. Hirshleifer 1988: 5ff.). Die Wirksamkeit der Ausschlußdrohung wird durch eine einfache Annahme über die Auszahlungsverhältnisse sichergestellt (Hirshleifer 1988: 7): "...in jeder Runde ist für jede Gruppengröße der Verlust K durch den Ausschluß größer als die Gewinne aus der Ausbeutung von Kooperateuren..." Hirshleifer (1988: 8) zeigt, daß in diesem Modell eine Gleichgewichtsstrategie BANISHMENT existiert, mit den Eigenschaften:
56
2. Kooperation in großen Gemeinschaften
"Die Gleichgewichtsstrategie BANISHMENT, die wir im nächsten Abschnitt analysieren werden, lautet, immer entsprechend dem Gleichgewichtspfad zu kooperieren und jeden zu bezichtigen [blackball; mit den oben beschriebenen Folgen, R.S.], der von dieser Strategie abweicht, was Defekteure, Spieler, die andere unprovoziert bezichtigen, Spieler, die Defekteure nicht bezichtigen, Spieler, die solche nicht bezichtigen, die es verfehlen, Defekteure zu bezichtigen, etc. einschließt." Die BANISHMENT-Strategie stellt einen dezentralen Mechanismus der Sanktionierung dar, weil keine Zentralinstanz existiert, welche die Aktionen der Spieler koordiniert oder Sanktionsaufgaben übernimmt. Sie ist daher für die Analyse endogener Kooperationsprozesse von besonderem Interesse. Hirshleifer (1988: lOff.) widmet sich hauptsächlich dem Nachweis, daß BANISHMENT in iterierten n-Personen-Gefangenendilemmas mit unbestimmter oder im voraus bekannter Länge (zwischen beiden Arten der Iteration bestehen gravierende strategische Unterschiede; vgl. Luce/Raiffa 1957: 98) eine (Nash-) Gleichgewichtsstrategie bildet, d. h. daß kein Spieler einen Anreiz besitzt, von BANISHMENT abzuweichen, wenn alle anderen Akteure BANISHMENT spielen. Im unbestimmt oft iterierten Fall gibt es noch andere Gleichgewichte, aber sofern die Wertschätzung zukünftiger Kooperationsgewinne bei den Akteuren hinreichend hoch ist (niedriger Diskontfaktor) führt BANISHMENT auch hier ein allgemein kooperatives Gleichgewicht herbei (vgl. Hirshleifer 1988: 14). Nach Hirshleifer kann Kooperation unter rationalen Egoisten im n-Personen-PD mit Hilfe der Strategie BANISHMENT und des (temporären oder permanenten) Ausschlusses unkooperativer Akteure aus einer Gruppe erreicht werden. Im Gegensatz zu den Annahmen von Bendor und Mookherjee (1987) bedarf es keiner hierarchischen Gliederung der Gemeinschaft. Doch bevor man sich am Ziel einer endogenen Erklärung der Kooperationsentstehung wähnt, sollten die Defizienzen des Modells und von BANISHMENT beachtet werden. Sie zeigen, daß noch ein gutes Stück Weg bis zu einer einigermaßen befriedigenden Lösung der Probleme freiwilliger Kooperation im n-Personen-PD zurückzulegen ist. Zunächst verursacht der Ausschluß von Mitgliedern keine Kosten und birgt kein Risiko für denjenigen, der andere der Defektion bezichtigt.
2.2. Gefangenendilemma mit Ausschlußoption
57
Sowohl Auschlußkosten, als auch Risiken der Vergeltung, würden dazu führen, daß egoistische Spieler die Überwachung, die Anklage und den Ausschluß von Defekteuren anderen aufbürden. Sie selbst könnten dann als Trittbrettfahrer den Nutzen aus dieser Tätigkeit genießen. BANISHMENT schreibt zwar vor, daß auch Trittbrettfahrer ausgeschlossen werden sollten, aber zugleich besitzt BANISHMENT einen entscheidenden strategischen Nachteil. Es ist nur eine schwache Gleichgewichtsstrategie ( vgl. Hirshleifer 1988: 18), weil Akteure indifferent gegenüber einigen Forderungen von BANISHMENT sind. Das trifft besonders für die Forderung zu, jeden auszuschließen, der nicht BANISHMENT spielt. Im Gleichgewicht wird nur kooperiert, und es fällt daher nicht auf, wenn Akteure die indirekten Bestrafungsanforderungen (gegen die, die jene nicht bestrafen, die andere nicht bestrafen, die defektieren, etc. ad infinitum) verweigern. Hirshleifer (1988: 18) führt deshalb zur Stabilisierung des BANISHMENT-Gleichgewichts die Annahme ein, daß die Akteure schwach moralistisch sind und etwas Lust aus der - selbstverständlich moralisch gerechtfertigten - Bestrafung von Defekteuren ziehen. Damit wird der Weg zu einer Erklärung egoistischer Kooperation verlassen und Zuflucht bei den altbekannten Annahmen normativistischer Sozialtheorien gesucht. Andererseits wird deutlich, daß die Einführung von Kosten für den Ausschluß von Akteuren, die oft genug gegenüber schwachen moralischen Impulsen überwiegen werden, zu einer Destabilisierung des BANISHMENT-Gleichgewichts führt. Hirshleifers Lösung bezieht sich nur auf eine Idealwelt, in der die Bestrafung von Akteuren keine Kosten oder Risiken mit sich bringt. Eine ähnliche Problematik existiert für die Informationsannahmen des Modells. Hirshleifer unterstellt die vollständige und irrtumsfreie Informiertheit aller Akteure. Sobald aber eine verschwindende Wahrscheinlichkeit der Fehlwahrnehmung und des Irrtums eingeführt wird, zerfällt das Gleichgewicht, in dem alle BANISHMENT spielen. Dabei kommt es darauf an, wie Spieler behandelt werden, die Irrtümer begehen. Werden auch sie ausgeschlossen, so zieht der folgende Fall die Auflösung der Gruppe nach sich. Angenommen ein Spieler X irrt sich, indem er glaubt, daß ein Akteur Y, der tatsächlich defektiert hat, kooperativ gewesen ist. Die überwältigende Mehrheit aller Spieler wird Akteur Y ausschließen, aber Spieler X wird daraufhin alle ausschließen, die aus seiner Sicht ohne Rechtfertigung für den Ausschluß des Akteurs Y votiert haben. Das wird möglich, weil in Hirshleifers Modell jeder Akteur alle anderen des Ver-
58
2. Kooperation
in großen
Gemeinschaften
stoßes gegen BANISHMENT bezichtigen kann. Außerdem reicht eine einzige Bezichtigung für den Ausschluß aus, und BANISHMENT schreibt vor, daß jeder bezichtigt werden muß, der andere ohne Rechtfertigung bezichtigt. Werden dagegen Mitglieder, die Fehlleistungen begehen, nicht ausgeschlossen, krankt das System an der Schwierigkeit, nicht zwischen gewollter und ungewollter Aktion unterscheiden zu können. Es folgt, daß sich die Gleichgewichtsstrategie in Hirshleifers Modell nicht mit der Existenz von Fehlleistungen verträgt. Inwiefern sich diese Schwäche durch einen weniger einfachen Mechanismus des Ausschlusses und eine weniger strenge Strategie als BANISHMENT beheben läßt, bleibt offen, weil zugleich auch der Nachweis der Stabilität dieser Lösung gelingen m u ß ^ . In einer evolutionären Betrachtung von Hirshleifers Modell treten Schwierigkeiten nicht nur hinsichtlich der Stabilität etablierter Kooperation auf, sondern auch was das Entstehen eines kooperativen Gleichgewichtes betrifft. Der Weg zu einem Gleichgewicht, das ausschließlich aus BANISHMENT-Strategien besteht, führt in diesem Fall über die allmähliche Veränderung der relativen Häufigkeit, mit der einzelne Strategien in einer Population von Akteuren gespielt werden. Dabei ist in der Regel zu Anfang nicht nur eine Strategie in der Population vorhanden. Es könnte z.B. sein, daß in Hirshleifers Modell die Hälfte der Akteure BANISHMENT spielen und der Rest RUDIBAN eine rudimentäre Vorform dieser Strategie, die vorschreibt: "Bezichtige alle Defekteure und alle Akteure, die andere ohne Rechtfertigung bezichtigen!" Diese Verhaltensregel bestraft im Unterschied zu BANISHMENT Akteure nicht, die es versäumen, Defekteure zu bestrafen. Aus der Sicht von RUDIBAN würden Strafaktionen von BANISHMENT gegen eben solche Spieler ungerechtfertigt erscheinen. Als Folge würden die eigentlich wohlmeinenden RUDIBAN-Spieler alle BANISHMENT-Akteure aus der Gruppe verbannen und die Entwicklung zum Gleichgewicht verhindern. Diese Gefahr gewinnt um so mehr an Bedeutung, als entsprechend der Modellkonstruktion eine einzige Strategie des Typs RUDIBAN ausreicht, um alle Strategien des Typs BANISHMENT mit einem Schlag auszuschließen. Hirshleifers Konstruktion ist äußerst anfällig für eine Eskalation der Ausschlußakte bei ungünstiger Interaktion verschiedener Strategietypen. Die Wahrscheinlichkeit, daß es zu einer gelungenen Entwicklung zum Gleichgewicht kommt, ist daher sehr gering. Wiederum zeigt sich, daß das Entstehen und die Stabilität egoistischer Kooperation in großen n-PersonenGefangenendilemmas auf rein freiwilliger Basis kaum gelingen kann.
2.2. Gefangenendilemma
mit Ausschlußoption
59
Aufgrund der bisherigen Erörterungen läßt sich ein Resümee für die Chancen dauerhafter, egoistischer und freiwilliger Kooperation im Rahmen des n-Personen-PD ziehen. Dieses Resümee bezieht sich natürlich nicht auf einen umfassenden Überblick aller Ansätze zur Kooperation im n-Personen-PD, sondern auf die vorhergehende, selektive Diskussion grundlegender Problemstellungen und neuerer Lösungsvorschläge. Doch auch unter den hier nicht genannten Modellen befindet sich meines Wissens keines, das einen Nachweis der Stabilität egoistischer Kooperation erbracht hätte. Dabei zeichnet sich ein gegenläufiger Trend der spieltheoretischen Ergebnisse ab. Einmal weisen die Modelle nach, daß prinzipiell spieltheoretische Gleichgewichte der Kooperation unter reinen Egoisten existieren. Zum anderen sind diese Gleichgewichte aber bei Einführung selbst infinitesimaler externer Störungen und aus einer Reihe anderer, in der Realität anzunehmender Gründe, nicht mehr stabil. Für Untersuchungen, die auch nur den Status eines für die soziale Realität relevanten Denkmodelles beanspruchen, sollte zumindest eine gewisse Robustheit gleichgewichtiger Lösungen bei geringfügiger Störung gegeben sein. Außerhalb ökonomischer und spieltheoretischer Modellwelten ist stets mit dem Vorhandensein von Friktionen, Störungen und Irrtümern zu rechnen. Die Suche nach einem Mechanismus, der im n-Personen-PD das Entstehen von Kooperation endogen und ohne die Hobbessche Hilfslösung einer mächtigen Zentralinstanz erklärt, ist deshalb noch lange nicht am Ziel angekommen. Die Ergebnisse der vorgestellten spieltheoretischen Analysen stützen für diese Gruppe von Dilemmas die klassische soziologische Behauptung, daß stabile und freiwillige Kooperationsverhältnisse unter rationalen Egoisten praktisch unmöglich sind. Zur Zügelung des Egoismus bedarf es entweder der Moral oder der Macht. Damit tritt unter anderem die Hobbes-Lösung des Problems sozialer Kooperation wieder in den Vordergrund. Offen bleibt allerdings, wieviel Macht der Leviathan besitzen muß, damit Egoisten aus Furcht kooperieren. Bendor und Mookherjees Ergebnisse zeigen jedenfalls, daß eine Instanz, die den Frieden unter Egoisten sichert mit der Zustimung und der Legitimation durch die betroffenen Individuen rechnen kann. Nichts anderes besagt ja die Tatsache, daß rationale Akteure bei freier Austritts- oder Ausschlußoption in einer von einer zentralen Macht kontrollierten Gruppe verbleiben werden. Den Austritt aus
60
2. Kooperation
in großen
Gemeinschaften
der Gemeinschaft könnte ein Akteur dabei einfach durch einen bewußt herbeigeführten Ausschluß erklären. In diesem Modell impliziert die kooperative Lösung nicht nur ein kollektives, sondern auch ein individuelles Interesse am Zusammenschluß und der Einrichtung einer Zentralgewalt. Kapitel 4 der vorliegenden Arbeit greift diese Frage im Rahmen eines Modelles der Teamproduktion wieder auf und untersucht den Verlauf egoistischer Kooperation, wenn die Überwachungsmöglichkeiten der Zentralgewalt beschränkt bleiben. Nicht alle sozialen Dilemmas lassen sich auf die beschriebene Weise lösen. Probleme der Produktion öffentlicher Güter im engeren Sinne widersetzen sich per definitionem dem strategischen Einsatz von Ausschlußdrohungen. Das weltweite Dilemma des Umweltschutzes mag als bedeutsames Beispiel dienen. In diesem Fall könnten andere Arten der Strafandrohung die Kooperativität der Akteure garantieren, falls irgendwann einmal eine Zentralgewalt existiert. Aber das Fehlen der Ausschlußoption läßt erwarten, daß es nicht im Interesse rationaler Egoisten liegt, die Einrichtung einer solchen Zentralgewalt zu betreiben. In einem n-Personen-PD ohne Auschluß bleibt Defektion die einzig rationale, egoistische Entscheidung.
KAPITEL 3: KOOPERATION AUF ANONYMEN MÄRKTEN Nach dem Literaturreferat der vorangegangenen Kapitel wird nun ein eigenes Modell vorgestellt. Es baut auf Axelrod (1987) auf, indem es die Spielmatrix und die Methode des Computerwettkampfes übernimmt. Die Fragestellung und der Modellansatz beider Untersuchungen differiert jedoch erheblich. Das Zwei-Personen-PD wird in der Folge vornahmlich als Modell des Tausches interpretiert, eines sozialen Phänomens, das tatsächlich oft zwischen nur zwei Partnern auftritt. Das zentrale Merkmal des neuen Modells bildet die Möglichkeit, die Interaktion mit einem Partner freiwillig zu iterieren, sie aber auch nach Belieben abzubrechen. Schließlich spielt die Anonymität des Defekteurs, und das daraus resultierende Erfordernis eines neuen Sanktionsmechanismus, eine große Rolle. Mit all diesen Veränderungen eignet sich das Modell hauptsächlich zur Untersuchung der Frage, ob Betrug und Gewalt einen atomistischen, anonymen Kapitalismus notwendig zerfressen werden. Ein stark abstrahierter Computerwettkampf kann natürlich nur Indizien für eine Antwort liefern, doch die haben ihren besonderen Wert, wenn sie wie hier den üblichen soziologischen (Vor-)Urteilen widersprechen. Die Diskussion der Probleme atomistischen Tausches wird in zwei Etappen voranschreiten. Zuerst wird die Bedeutsamkeit der Modellierung freiwilliger Spieliteration gegenüber der Masse spieltheoretischer Analysen herausgestellt, die Superspiele verwenden, aus denen die Akteure nicht aussteigen können. Danach wird das eigentliche Modell mit seinen Ergebnissen vorgestellt.
3.1. Freiwillig iteriertes Spiel versus unfreiwilliges Superspiel Das Superspiel ohne Möglichkeit des Abbruchs durch die Spieler ist der am besten untersuchte Mechanismus zur Förderung der Kooperation im Gefangenendilemma. Es wird eine Reihe von Spielen mit der gleichen Auszahlungsmatrix zwischen den gleichen Partnern unterstellt. Das Spiel kann unbestimmt oft oder mit einer im voraus bekannten Zahl von Runden iteriert werden. Im Fall einer unbestimmt häufigen Iteration sind die Alternativen einer festgelegten, aber unbekannten Spiellänge, einer unendlichen Iteration und eines Superspielabbruchs mit einer kleinen Wahr-
62
3. Kooperation
auf anonymen
Märkten
scheinlichkeit nach jedem Spiel zu unterscheiden. Allen diesen Annahmen ist gemeinsam, daß keiner der beteiligten Spieler willentlich aus dem Superspiel ausscheiden kann. Aufgrund seiner Verbreitung sei nur dieser Typ des Superspiels hier verkürzend und vereinfachend als Superspiel bezeichnet. Bereits in Kapitel 1 wurde auf Schwächen der Superspielannahme hingewiesen, die nun eine vertiefte Betrachtung finden. Es ist wichtig, im Auge zu behalten, daß das Entstehen von Kooperation im (PD-) Superspiel nur im Zwei-Personen-Fall erwartet werden kann. In einem Gefangenendilemma-Superspiel mit einer großen Zahl von Spielern (n-Personen) kann sich prinzipiell ohne äußere Eingriffe kooperatives Verhalten unter rationalen Egoisten herausbilden, aber es ist nachweislich extrem unwahrscheinlich, daß diese Lösung erreicht wird (vgl. Kapitel 2). Für die Analyse des Stellenwertes der Superspielbedingung sind daher dyadische Bindungen von spezieller Bedeutung. Daran schließt sich die Frage an, für welche Art von sozialen Interaktionen eine ZweiPersonen-Modellierung eine besonders adäquate Repräsentation darstellt 1 . Eine herausragende Stellung als Klasse von Interaktionen zwischen zwei Partnern besitzt der soziale Austausch. Austauschverhältnisse sind grundlegend für das Wirtschaftsleben und werden von einer namhaften Schule der Soziologie, der "exchange theory" (Blau 1964; Ekeh 1974), als universale Charakteristika aller Sozialsysteme angesehen. Ausgetauscht werden können Güter, Geld, Wertschätzung, Information etc. Die Vielfalt der tauschbaren Entitäten hat den späten Talcott Parsons (1977) dazu bewegt, das Phänomen des Austausches mit seiner Theorie der sozialen Austauschmedien in den Mittelpunkt sozialer Interpenetrationsprozesse zu stellen''. Natürlich stellt die Dyade nicht die einzige Form von Austauschbeziehung dar. Austausch läßt sich indirekt und vermittelt durch ein ganzes Netzwerk von Akteuren denken. Mit Hilfe von Kontrakten kann die einfache Austauschrelation zu einer ganzen Sequenz aufeinander bezogener Austauschakte verkettet werden, die gegebenenfalls weit in die Zukunft reichen. Festzuhalten bleibt dennoch, daß die Zwei-Personen-Interaktion als Basisrelation des Austausches gelten kann. Aus diesem einfachsten Baustein lassen sich viele komplexere Formen von Austauschbeziehungen zusammensetzen, und deshalb gilt es zunächst, den bilateralen Austausch genauer zu analysieren.
3.1. Freiwillig iteriertes Spiel versus unfreiwilliges Superspiel
63
Spieltheoretische Ansätze lassen sich in diesem Kontext fruchtbringend anwenden, weil der soziale Austausch einem strategischen (Gefangenen-) Dilemma unterliegt (vgl. auch Landa/Grofman 1981). Meist besitzen die Inhaber auszutauschender Güter asymmetrische Informationsvorteile, was deren wirklichen Wert betrifft^. Selbst bei einer vorherigen Überprüfung durch den Partner, kann dieser in der Regel nicht alle dem Inhaber bekannten Merkmale des Gutes erkennen, besonders wenn dieser sein Gegenüber über Fehler zu täuschen beabsichtigt. Beim Tausch von Gütern gegen Geld befindet sich somit eine Seite in einem strategischen Informationsvorteil. Im Fall eines Tausches Leistung gegen Leistung oder - was in modernen Gesellschaften seltener vorkommt - Gut gegen Gut, besitzen beide Seiten die gleichen Handlungsoptionen. Die strategische Struktur der symmetrischen Situation kann durch ein Gefangenendilemma beschrieben werden. Wenn nur einer der Akteure die unvermeidliche Unschärfe von Verträgen ausnutzt, um weniger zu leisten, als dem Geist der Vereinbarung entspricht, kann er einen Vorteil auf Kosten des anderen realisieren*. Sofern jedoch beide Akteure so zu handeln versuchen, enden sie als betrogene Betrüger mit einem schlechteren Ergebnis als bei aufrichtiger Vertragserfüllung. Niemand erreicht in diesem Fall seine Ziele, und gleichzeitig entgeht beiden Akteuren der aus einem kooperativen Austausch entstehende Nutzenvorteil. Für die Untersuchung egoistischer Kooperation im Zwei-Personen-PD entstehen vor diesem Hintergrund Probleme. Die Annahme eines Superspieles ohne Austrittsmöglichkeit ist mit der zentralen Bedeutung des sozialen Austausches für den Zwei-Personen-Fall nicht kompatibel. Austauschbeziehungen zu bestimmten Partnern können in der Regel willentlich abgebrochen werden. Wenn A mit B einen Vertrag schließt, der beide zu bestimmten Leistungen verpflichtet, und dieser Vertrag nicht zufriedenstellend erfüllt worden ist, steht es beiden Partnern frei, beim nächsten Mal mit einem anderen Partner zu kontrahieren. Die Annahme der Zwangsgemeinschaft des Superspieles kann daher in vielen Situationen, die für die Untersuchung egoistischer Kooperation interessant wären, nicht angewendet werden. Diese Aussage läßt sich noch schärfer formulieren, wenn ein verbreitetes Verständnis der Ziele spieltheoretischer Kooperationsanalysen berück-
64
3. Kooperation
auf anonymen
Märkten
sichtigt wird. Utilitaristische Theoretiker, von denen der spieltheoretische Ansatz hauptsächlich genutzt wird, werfen ihren normativistischen Gegenspielern vor, daß sie die Existenz normativer Bindungen zur Lösung sozialer Dilemmas voraussetzen, aber das Entstehen dieser Bindungen nicht erklären können (vgl. Coleman 1964: 166; Voss 1985: 67). Anstelle dieser Methode, normatives Verhalten als deus ex machina auftreten zu lassen, schlagen die Utilitaristen vor, die Bildung von Normen und moralischer Autorität endogen als Ausdruck eigeninteressierten Handelns rationaler Akteure zu erklären. Das führt zu dem Problem, daß Moral zwar kollektiv sinnvoll sein mag, daß aber in Abwesenheit sanktionierender Instanzen und bei egoistischen Präferenzen ein individuelles Interesse besteht, von den Normen der Moral abzuweichen. Eine endogene Erklärung der Normentstehung setzt mit anderen Worten wiederum die Lösung eines Gefangenendilemmas voraus. Im Rahmen des Versuches, das Entstehen von Normen endogen zu erklären, unterliegt die Superspielbedingung starken Restriktionen. In vielen Arten iterierter Interaktion, die von den beteiligten Akteuren nicht auf einfache Weise beendet werden können, sorgen gesellschaftliche Normen, institutionelle Regelungen und damit verkoppelte Sanktionsdrohungen für die Stabilität der wechselseitigen Bindungen. Die Einhaltung von Verträgen, die Akteure für längere Zeit aneinander binden, wird z.B. durch Strafdrohungen garantiert. Die Institution der Ehe, um ein anderes Beispiel zu nennen, basiert weniger auf der Verläßlichkeit anhaltender sexueller und emotionaler Attraktivität als auf einer geregelten gesellschaftlichen Norm. In solchen Fällen ist der bindende Charakter, der eine Superspielsituation definiert, die Folge und nicht die Ursache von normativen Regelungen. Eine Theorie der endogenen Normentstehung darf nur solche Superspielsituationen für ihre explanative Aufgabe nutzen, die sich selbst nicht wieder auf normative Bindungen als notwendige Voraussetzung stützen. Der Bereich, in dem Superspielanalysen zur Problematik egoistischer Kooperation berechtigte Beachtung erwarten dürfen, schrumpft damit erheblich zusammen. Utilitaristische Theoretiker, die die Kostruktion einer allgemeinen Theorie endogener Normentstehung beabsichtigen, wären gut beraten, die herrschende Dominanz von Superspielanalysen zugunsten der Annahmen freiwilliger Interaktion abzubauen. Diese Folgerung wird auch nicht dadurch hinfällig, daß man jede festere soziale Bindung als approximativ realisiertes Superspiel auffaßt. Tatsäch-
S. 1. Freiwillig iteriertes
Spiel versus unfreiwilliges
Superspiel
65
lieh wird das Verlassen vieler iterierter Interaktionen mit Kosten für den Akteur verbunden sein, der die Interaktion aufheben will. In diesem Fall stellen die Kosten des Ausstiegs aber ein relevantes Element seines Handlungskalküls dar, und sollten explizit in das Modell eingebracht werden. Die Unterstellung einer unverbrüchlichen Superspielbindung führt dazu, daß die in der Realität bedeutungsvollen Parameter rationalen Handelns nicht hinreichend repräsentiert werden. Zugleich wird der Wert jeder modellbezogenen Erklärung egoistischer Kooperation gemindert. Ohne Superspiel und unter der Annahme nicht zu hoher Abbruchkosten für die Interaktion mit einem Partner würden sich rationale Egoisten vielleicht hemmungslos ausbeuten. Zu dieser Frage wird später mit einem eigenen Modell nochmals Stellung genommen. Eine Kritik der Superspielmodellierung des Problems egoistischer Kooperation muß nicht nur vom mangelnden Realismus dieser Annahme ausgehen. Axelrod (1987: 116) schlägt die Einrichtung einem Superspiel ähnlicher Interaktionsbindungen in der gesellschaftlichen Realität vor, um die Kooperationsanreize zwischen den Individuen zu stärken. Allein schon aufgrund des Zwangscharakters einer solchen Maßnahme sind Bedenken angebracht. In spieltheoretischen Analysen werden die kooperationsfördernen Aspekte eines Superspieles oft einseitig hervorgehoben, ohne daß berücksichtigt wird, daß dieser Mechanismus in die Freiheit eines Akteurs zur Wahl seiner Interaktionspartner eingreift. Wenn man diese Freiheit als wichtiges Gut betrachtet, liegt es nahe, vom Superspiel abzugehen und nach alternativen Lösungen des Problems der Kooperation rationaler Egoisten zu suchen. Im Kontext wirtschaftlichen Handelns wird dieser Einwand noch dadurch bestärkt, daß die Freiheit des Austausches und des Vertragsabschlusses mit wechselnden Partnern konstitutiv für ein Marktsystem ist. Die Einführung von Superspielsituationen in größerem Rahmen, wäre mit einer marktmäßigen Organisation einer Wirtschaft und einem freiheitlichen Gesellschaftssystem nicht zu vereinbaren. Schließlich erweist es sich als fraglich, ob ein Superspiel grundsätzlich immer kooperatives Verhalten fördert^. Sicherlich lassen sich Beispiele und experimentelle Resultate anführen, in denen dies der Fall ist. Andererseits erhielten Gegenbeispiele bislang wenig Publizität. Axelrod selbst zeigt, daß in der iterierten Interaktion bestimmter PD Superspielstrategien wie TIT FOR TAT (Axelrod 1987: 33) Echoeffekte entstehen können, bei denen ein erster aggressiver Akt zu einem ständigen Wechsel
66
3. Kooperation
auf anonymen
Märkten
von Vergeltungsschlägen führt, aus dem sich die Strategien aus eigener Kraft nicht befreien können. Solche unerwünschten Eskalationseffekte kleiner Aggressionen, die nur schwer wieder kontrolliert werden können, sind auch aus der sozialen Realität bekannt. Besonders gefährlich sind diese Konflikte, wenn Opponenten ihre Interaktion nicht zu beenden vermögen. Der einfache Ausweg, sich einen neuen Partner zu suchen oder den alten zu meiden, bleibt ihnen dann versperrt. Im Fall von Echoeffekten trägt eine Superspielsituation, weit davon entfernt, die Kooperation zu fördern, zur Verschärfung des Streites bei. Wenn keineswegs immer erwartet werden kann, daß ein Superspiel die Kooperativität von Akteuren steigert, sollte sein Wert vorsichtiger beurteilt werden. Es gilt herauszufinden, unter welchen Bedingungen die Tatsache, daß eine Interaktionsbindung nicht abgebrochen werden kann, die Neigung von Egoisten zur Kooperation steigert, und wann sie genau zum Gegenteil führt. Bisher existieren zu dieser Frage keine systematischen Ansätze in der spieltheoretischen Literatur. In diesem Kapitel wird ihr nicht weiter nachgegangen, sondern unter anderem eine Grundlage für ihre Beantwortung geschaffen: der Nachweis, daß die Freiwilligkeit des Kontaktes zwischen Akteuren den Untergang der sozialen Kooperation nicht besiegelt.
3.2. Ein Modell atomistischer Kooperation Im folgenden Modell werden die meisten Faktoren ausgeschaltet, die üblicherweise als grundlegend für das Entstehen von Kooperation im Gefangenendilemma angesehen werden. Es existieren keine Barrieren gegen das Verlassen eines Interaktionspartners und den Abbruch der Interaktion, dritte Spieler verfügen über keine Informationen über den Verlauf des Spieles zwischen zwei Partnern, Defekteure können nicht, wie es Axelrod und Coleman fordern, identifiziert und später sanktioniert werden. Ein solches Szenario, in dem die Akteure praktisch keinen sozialen Bindungen unterliegen und sehr wenig wechselseitige Information besitzen, wird hier als atomistische Interaktionsstruktur bezeichnet. Genau genommen wäre von einer atomistischen, großen, anonymen und sanktionsarmen^ Struktur zu sprechen, doch soll der Einfachheit wegen der Begriff des Atomismus im gegenwärtigen Kontext alle diese Merkmale umfassen.
3.2. Ein Modell atomistischer Kooperation
67
Sowohl normativistische Ansätze, als auch das Gros der spieltheoretischen Analysen gehen davon aus, daß in einer atomistischen Gesellschaft rationaler Egoisten keine stabilen Kooperationsverhältnisse entstehen können. Man könnte annehmen, daß sich bei soviel seltener Einigkeit der Sozialwissenschaftler auf eine modellhafte Überprüfung dieser Annahme verzichten ließe. Aber auch hoch plausible Thesen sind nicht immer richtig. Es lassen sich sogar Gründe für den Verdacht anführen, daß die Unmöglichkeit egoistischer Kooperation selbst in atomistischen Szenarien nicht einfach nachzuweisen ist. Dazu gilt es zu überlegen, ob eine weitere Abschwächung der bei Axelrod und Coleman genannten Bedingungen egoistischer Kooperation möglich erscheint. In der Tat sind die oben genannten Bedingungen noch zu qualifizieren. Das Erfordernis der Häufigkeit wechselseitiger Interaktionen, beispielsweise, bleibt für verschiedene Interpretationen offen. Einmal kann angenommen werden, daß die Akteure sich in einer Interaktionsstruktur befinden müssen, die sie zwangsläufig öfter zu gemeinsamen Spielen zusammenführt. Dieser Fall ist bei Superspielanalysen und bei Colemans Zufallswahl von Partnern in kleinen Gruppen gegeben. Er stellt die bislang vorherrschende Interpretation in der spieltheoretischen Literatur dar. Andererseits ließe sich unterstellen, daß die Akteure nur der Möglichkeit zur häufigen Interaktion bedürfen, damit stabile Kooperation zwischen ihnen entstehen kann. Dabei bliebe es den Akteuren überlassen, wie oft sie ein Spiel mit einem bestimmten Partner iterieren. Sie verfügen, im Gegensatz zum Superspiel, über eine "Exit"-Option in ihrem strategischen Verhalten^. Ein solches Szenario der zwangsfreien Iterationsmöglichkeit wird im folgenden als System der freien Kooperation bezeichnet. In einem Modell freier Kooperation besitzen ausgebeutete Partner durchaus Sanktionsmittel. Durch die Offenheit der Spielsituation besteht allerdings nicht mehr die Gewähr, daß die klassische Sanktion der reaktiven, vergeltenden Wahl der defektiven Strategie im Gefangenendilemma angewendet werden kann. Ein Defekteur vermag sich gegen diese Sanktion zu schützen, indem er sofort nach seinem Abweichen vom Pfad der Kooperativität die Interaktion mit dem ausgenutzten Partner abbricht und ein neues Opfer sucht. Sofern es sich bei dem untersuchten Modell um ein atomistisches Szenario handelt, wird die Anwendung solcher "hit and run"Taktiken weiter erleichtert. Die einzige Strafe, über die ein ausgebeuteter Partner unter diesen Bedingungen verfügt, besteht darin, daß er seiner-
68
3. Kooperation
auf anonymen
Märkten
seits die Interaktion mit einem Defekteur abbrechen kann. Ob diese scheinbar wenig abschreckende Drohung zur Genese von stabilen Kooperationsverhältnissen ausreicht, wird zu untersuchen sein. Zumindest belegt sie, daß die vergeltende Wahl der defektiven Strategie keineswegs die einzige denkbare Strafe im iterierten Gefangenendilemma darstellt.
3.2.1. Das Modell freier Kooperation 3.2.1.1. Die Spielstruktur Dem Modell wird das von Axelrod (1987: 8) gewählte Gefangenendilemma mit der Spielmatrix Ml zugrundegelegt: MATRIX M1
Spieler B C
D
C
3,3
0,5
D
5,0
1,1
Spieler A
Die Wahl bestimmter Auszahlungswerte erfolgt völlig willkürlich im Rahmen der Relationen, die ein Gefangenendilemma kennzeichnen. Das impliziert, daß es nur um eine prinzipielle Analyse des Widerspruches von gemeinsamem und individuellem Interesse gehen kann, der von allen PDStrukturen gleichermaßen repräsentiert wird. Ein direkter, empirischer Bezug der Argumentation würde die Wahl von Auszahlungen voraussetzen, die den Nutzenargumenten im Entscheidungskalkül realer Akteure entsprechen. Nachdem dies nicht der Fall ist, und nur auf prinzipieller Ebene argumentiert wird, konnte die Auszahlungsmatrix Axelrods so gut wie jede andere übernommen werden. Wiederholte Spiele mit Matrix Ml werden in einer festen Population von Spielern durchgeführt, wobei jeder Akteur in jeder Runde mit einem Partner interagiert. Es kommt nicht vor, daß ein Akteur eine oder mehrere Runden mit dem Spielen aussetzt. Das entspricht wiederum Axelrods Regelungen. Im Unterschied zu Axelrods Superspielanalysen wird jedoch angenommen, daß die Iteration von Interaktionen völlig freiwillig erfolgt. Ein Spieler kann, so beide wollen, mit seinem bisherigen Partner zusam-
3.2. Ein Modell atomistischer Kooperation
69
menbleiben, oder sich nach jedem Spiel einen neuen Partner suchen. Die o Partnerfindung erfolgt rein zufällig0. Aufgrund der in der Spielanlage verankerten freiwilligen Iteration können sich Akteure nach einem Spiel in zwei unterschiedlichen Interaktionszuständen befinden. Sie können in einer Partnerschaft verharren, oder unter anderen, ungebundenen Akteuren nach einem neuen Partner suchen. Daher zerfällt die Gesamtpopulation von Spielern zwischen den Runden in einen Teil, der in einer (Zweier-) Interaktion gebunden bleibt, und für Partnersuchende unzugänglich ist, und in einen Teil, der in einem Suchpool auf einen neuen Partner wartet. Nach jeder Zwischenrunde wird der Suchpool geleert, indem die Suchenden miteinander zu Paaren verbunden werden; und nach jeder Runde begeben sich die Akteure, die eine Interaktion abgebrochen haben, in den Suchpool. Unter diesen Bedingungen wäre es möglich, daß zwei "nette", kooperative Strategien auf ewig in einer Bindung verharren, weil für beide kein Anreiz besteht, diese zu verlassen. Obwohl in der Spieltheorie in anderen Zusammenhängen häufig Superspiele mit unendlicher Länge unterstellt werden^, erscheint diese Annahme unrealistisch. Für jede soziale Interaktion wird eine, wenn auch noch so kleine Wahrscheinlichkeit existieren, daß sie entgegen dem Willen der Beteiligten abbricht. Exogene Einflüsse, wie der Tod eines Partners, äußerer Zwang, oder auch Fehlinterpretationen des Verhaltens des anderen, können zum Ende einer Partnerschaft führen. Alle Effekte externer, kontingenter Ereignisse und irrtümlicher Aktionen der Spieler werden im Modell durch einen Parameter q repräsentiert. Weshalb hier Handlungsirrtümer mit externen Schocks gleichgesetzt werden können, wird aus den weiter unten erläuterten Eigenschaften der verwendeten Strategien verständlich. Der Parameter q steht für die Wahrscheinlichkeit, daß eine Interaktion, welche die Akteure gerne fortsetzen würden, dennoch abbricht. Dieses Risiko wirkt nach jedem Spiel neu auf die Partnerbindungen ein, und ist im Modell für alle Spieler gleich und über die Zeit konstant. Zufällig abgebrochene Interaktionen werden im übrigen wie absichtlich beendete behandelt: beide Akteure müssen sich im Suchpool nach neuen Partnern umschauen.
An dieser Stelle erscheint es sinnvoll, etwas näher auf die Art einzugehen, wie die Population von Spielern repräsentiert wird. Der Einfachheit und
70
3. Kooperation
auf anonymen
Märkten
Verständlichkeit wegen, wird durchgängig eine Sprache verwendet, die den Eindruck erweckt, daß es sich bei der Modellpopulation um eine Menge von Einzelakteuren handelt. Tatsächlich wird die Akteurspopulation jedoch anders modelliert. Wie bei Axelrod und in vielen Modellen der evolutionären Spieltheorie (vgl. Taylor/Jonker 1978; Zeeman 1980, 1981) wird ein individueller Akteur hauptsächlich als Träger einer bestimmten Strategie angesehen. Die vorliegende Untersuchung schließt sich dieser Richtung an und postuliert einen speziellen Evolutionsprozeß für Strategien, weshalb auf die Einführung einer Mikroebene, welche die Handlungswahl einzelner Akteure beschreibt, verzichtet wird*®. Diese Perspektive erlaubt es, daß Akteure nur über den Anteil repräsentiert werden, den eine bestimmte Strategie an der Gesamtpopulation von Strategien einnimmt. Die Interaktion zweier Strategien im Zwei-Personen-Spiel wird dann so verstanden, daß ein gewisser Teil einer Strategienpopulation mit einem Teil einer anderen spielt. Angenommen der Populationsanteil von TIT FOR TAT wäre beispielsweise 0.1, dann würde ein Prozent der Population aus TIT FOR TATs bestehen, die gegen andere TIT FOR TATs spielen. Nach jeder Runde wandert aufgrund der Abbruchwahrscheinlichkeit q ein gewisser Prozentsatz von Strategien in den Suchpool. Ein bestimmter Anteil aller Strategien befindet sich nach n Runden im Zustand einer n Runden andauernden Interaktion. Im genannten Beispiel wäre das der noch vorhandene Anteil an TIT FOR TATs, die sich bereits in der ersten Runde gefunden haben. Ein anderer Anteil wird nach n Runden, n-1, oder n-2, oder n-3 Runden interagiert haben etc. Dieses Verfahren der Modellierung besitzt den Nachteil einer geringeren, intuitiven Verständlichkeit, aber für die Analyse wird das durch den beträchtlichen Vorteil aufgewogen, daß die Größe der Gesamtpopulation nicht im Modell festgelegt werden muß. Dadurch wird verhindert, daß die Ergebnisse von der Gesamtzahl der Akteure abhängen, und selbst die Interaktionen in einer sehr großen, atomistischen Gesellschaft können auf dem Computer simuliert werden.
3.2. Ein Modell atomistischer
Kooperation
71
3.2.1.2. Der evolutionäre Prozeß Wie bereits angedeutet, wird im folgenden die evolutionäre Entwicklung von Strategienanteilen an einer Gesamtpopulation von Strategien untersucht. Das setzt voraus, daß die weiter unten behandelten Strategien miteinander konkurrieren. Die Modellierung der evolutionären Konkurrenz impliziert, daß Erfolg und Effektivität der Strategien sich in einem Mechanismus der Selektion und differentiellen Vermehrung niederschlagen. Der entscheidende Indikator für Erfolg ist dabei der Zugewinn oder der Verlust von Populationsanteilen. In einer einfacheren Betrachtungsweise würde es genügen, die Akkumulation von Auszahlungsgewinnen der Strategien zu verfolgen und eine Rangordnung zu bilden (vgl. Axelrod 1987: 173ff.). Dieses Verfahren berücksichtigt jedoch nicht, daß unter den selektiven Bedingungen der biologischen, wirtschaftlichen und sozialen Realität ineffektive Strategien wahrscheinlich früher oder später durch effektivere ersetzt werden. Zugleich erlaubt die dynamische Analyse, die Kernfrage des utilitaristischen Ansatzes nach der Möglichkeit egoistischer Kooperation direkt zu behandeln (vgl. Axelrod 1987: 43ff.). Erfolgreiche, egoisitische Kooperation läge vor, wenn kooperative Strategien auf Dauer einen angemessenen Anteil an der Population behaupten könnten^. Ein Problem entsteht allerdings bei der Wahl des Evolutionsmechanismus. Im Gegensatz zur Biologie sind die Basis und der Mechanismus sozialer Evolutionsprozesse nicht eindeutig bestimmt. Oft wird in den Sozialwissenschaften nur eine evolutionistische Metaphorik benutzt, ohne daß klar belegt wird, durch welche grundlegenden Gesetzmäßigkeiten dieser Prozeß vorangetrieben wird. Spieltheoretische Evolutionsanalysen benennen dagegen sowohl die Basis (Strategie), als auch den Mechanismus der unterstellten Prozesse mit mathematischer Präzision. Allerdings müssen diese Präzisierungen als willkürlich angesehen werden, denn bislang konnte das Vorliegen bestimmter, sozialer Evolutionsmechanismen nicht empirisch überprüft werden, und auch in absehbarer Zeit steht kaum zu erwarten, daß dieser Mangel behoben 1o werden kann . Die Annahme einer bestimmtem Evolutionsdynamik in spieltheoretischen Analysen egoistischer Kooperation stellt daher nur ein heuristisches
72
3. Kooperation
auf anonymen
Märkten
Hilfsmittel zur besseren Erfassung des Erfolges von Strategien dar. Wichtig erscheint, daß zumindest in erster Näherung eine Kopplung zwischen dem Erfolg und der Ausbreitung von Verhaltensroutinen vorgenommen wird. Sofern sich dann zeigt, daß das Entstehen von Kooperation möglich ist, hat der jeweilige Mechanismus auf der prinzipiellen Ebene, auf der die Diskussion geführt wird, schon seine Aufgabe erfüllt. Schließlich gilt es zuerst, diese Möglichkeit gegen den Einspruch der normativistischen Soziologie nachzuweisen, bevor der Einfluß verschiedener Evolutionsdynamiken auf die Kooperationsproblematik empirisch untersucht werden müßte. Der Gradmesser für den Erfolg einer Strategie ist zunächst die in einer Runde erreichte, durchschnittliche Auszahlung aus der Interaktion mit allen anderen Strategien. Dabei wird auf eine noch feinere Differenzierung der Analyse verzichtet. Die Unterschiede im Erfolg, die Teile einer Strategiepopulation mit jeweils anderen Partnern realisieren, werden nur in ihrer Wirkung für die Strategie insgesamt berücksichtigt und gemittelt. Die Einheit der Analyse sind tatsächlich bestimmte Strategien im Sinne von Verhaltensroutinen, und nicht einzelne Träger dieser Strategie. Auf diese Weise läßt sich die Rohauszahlung RAWj an eine Strategie i definieren. Die Rohauszahlung ist die Summe der mit der Größe der jeweiligen Teilpopulationen gewichteten Auszahlungen, die i im Spiel gegen die anderen Strategien erreicht. Die Auszahlungen hängen allerdings nicht nur vom Strategietyp, sondern auch vom Interaktionsstadium der Strategien ab. Zwei gleiche Paare von Strategien können sich entweder in einem Zustand befinden, in dem sie weiter interagieren, oder in einem Zustand, in dem eine oder beide Strategien die Kooperation abbrechen. In welchem Zustand sich ein Partnerpaar befindet, hängt aufgrund der weiter unten beschriebenen Eigenschaften der Strategien von der Zahl der Runden ab, die sie bereits miteinander gespielt haben. Der gesamte Anteil einer Strategie i an der Totalpopulation läßt sich demnach entsprechend den Auszahlungszellen des Gefangenendilemma in vier Teilgruppen zerlegen, die sich in unterschiedlichen Auszahlungszuständen befinden. Für Gruppe A kooperieren beide Partner, bei Gruppe B nur die Strategie selbst und der Partner nicht, bei Gruppe C die Strategie nicht, aber der Partner, und bei Gruppe D defektieren beide Partner. Diese Aufteilung führt zu Gleichung (4) für die Rohauszahlungen, wobei die pj^ mit x e (A,B,C,D) dem Anteil der Teilgruppen einer Strategie i an der Gesamtpopulation entsprechen:
3.2. Ein Modell atomistischer Kooperation
73
(4) RAWj = p i A ' 3 + p i ; B * 0 + P i ; C * 5 + p i D * 1, mitE
x P i , x = Pi
Die Rohauszahlungen erhielten ihren Namen, weil sie nur die Basis für die Berechnung der für den Evolutionsprozeß maßgeblichen Endauszahlungen bilden. Die Endauszahlung PAYj für i erhält man aus der Rohauszahlung für i, indem man diese ins Verhältnis zur Gesamtsumme der erreichten Rohauszahlungen für alle Strategien setzt, und zusätzlich alle Rohauszahlungen durch den inversen Populationsanteil der Strategien gewichtet: (5) PAY; = RAWj / ((£ RAW k /p k ) * P i )
Die Berechnung von Endauszahlungen wurde erforderlich, weil die Größe der Strategienpopulation in den Wert von (4) eingeht. Die Erfolgschancen einer Strategie dürfen aber nicht einfach schon deshalb schlechter werden, weil sie eine kleinere Population besitzt. Deshalb wird die Rohauszahlung ins Verhältnis zum Populationsanteil gesetzt, und so der Erfolg pro Einheit einer Verhaltensroutine als Erfolgsmaßstab herangezogen. Im übrigen wurde für die Berechnung der Endauszahlung normiert und der Anteil der gewichteten Rohauszahlung für i an der gewichteten Gesamtrohauszahlung benutzt. Die Endauszahlungen können als Basis für den Prozeß der Veränderung von Strategieanteilen dienen. In der evolutionären Spieltheorie (vgl. Zeeman 1980, 1981) hat sich ein System von nichtlinearen, "spieldynamischen" Differentialgleichungen als evolutionäre Dynamik eingebürgert (vgl. Seite 168).In diesen Gleichungen wird unterstellt, daß die Wachstumsrate des Populationsanteils einer Strategie proportional zur Differenz zwischen der durchschnittlichen Auszahlung an i und der Durchschnittsauszahlung aller Strategien variiert. Dieser Zusammenhang wurde mit Blick auf die Biologie konzipiert, wo er eine doppelte Begründung finden kann. Einmal lassen sich die spieldynamischen Gleichungen mathematisch in die schon früher in der Bioökologie analysierten Lotka-Volterra- oder Räuber-Beute-Gleichungen transformieren (vgl. Hofbauer/Sigmund
74
3. Kooperation auf anonymen Märkten
1984: 171). Zum anderen entspricht dem Begriff des Nutzens oder der Auszahlung in der Biologie der evolutionären Fitness, die anhand der Menge der produzierten, überlebensfähigen Nachkommenschaft gemessen wird. Damit ist schon definitorisch ein linearer Zusammenhang zwischen Fitness und Populationswachstum gegeben. Die Begründungen der spieldynamischen Differentialgleichungen sind jedoch nicht in die Sozialwissenschaften übertragbar. Eine Übernahme dieses Evolutionsmechanismus erscheint nur ratsam, weil er mathematisch gut durchanalysiert ist, und weil konkurrierende Mechanismen keine bessere empirische Fundierung besitzen. Dem steht entgegen, daß die spieldynamischen Gleichungen im vorliegenden Modell nicht direkt angewendet werden können. Die n*n-Auszahlungsmatrix, welche den Erfolg der Interaktionen aller n Strategien verzeichnet, ändert sich hier mit jeder Runde. Die üblichen analytischen Lösungsverfahren des spieltheoretischevolutionären Gleichungssystems setzen jedoch eine konstante Auszahlungsmatrix voraus. Ein weiterer Unterschied zur biologischen, evolutionären Spieltheorie besteht in der Existenz von zwei Pools für Strategien. Jede neu hinzukommende Einheit muß zunächst zur Partnersuche in den Suchpool. Dagegen erscheint es nicht sinnvoll, auch alle Schrumpfungsprozesse über den Suchpool zu modellieren. In diesem Fall nämlich wäre eine erfolglose, aber in festen Bindungen verharrende Strategie vor dem Aussterben geschützt, was nicht den Intentionen der Modellierung entspricht. Deshalb wurde die Konstruktion eines eigenen Evolutionsmechanismus bevorzugt, der die unterschiedlichen Ansätze für Wachstums- und Schrumpfungsprozesse widerspiegelt. In einem ersten Schritt wird nur das unterschiedlich starke Wachstum der Strategien betrachtet. Anschließend wird dieser Prozeß durch einen - je nach Interpretation - Schrumpfungs- oder Normierungsmechanismus vervollständigt. Für das vorliegende Modell wurden zwei Wachstumsmechanismen vergleichend untersucht, die sich stark voneinander unterscheiden. Auf diese Weise läßt sich beurteilen, ob die Ergebnisse von speziellen, willkürlich unterstellten evolutionären Dynamiken unabhängig sind. Den ersten Wachstumsprozeß liefert (6.1). Seine Ergebnisse seien zunächst diskutiert, während der zweite Prozeß (6.2) mit seinen Resultaten unter 3.2.3 besprochen wird. Gleichung (6.1) definiert zunächst das Rohpopulationswachstum RPGj
3.2. Ein Modell atomistischer
Kooperation
75
von Strategie i:
(6.1.) RPGj = (PAYj • p;)/ (maximale Auszahlung PAY für eine Strategie * Regulationsfaktor R)
Nach Gleichung (6.1) wächst die erfolgreichste Strategie im evolutionären Vergleich pro Runde um das 1/R-fache ihres Populationsanteiles pj. R ist ein Regulationsfaktor, der das Ausmaß bestimmt, in dem jede Runde direkt Veränderungen in den Strategiepopulationen bewirken kann. Dadurch werden die Verschiebungen pro Runde begrenzt, die durch den Wachstumsprozeß ins Modell eingebracht werden. In vielen evolutionären (bzw. nichtlinearen, bzw. komplexen) Systemen sind Art und Ausmaß von Veränderungen äußerst bedeutsam für die Dynamik des Systems (vgl. Haken 1977; Jantsch 1982; Prigogine 1979). R wird daher in einigen Simulationsläufen variiert, um den Einfluß der Zuwachsamplitude auf die Dynamik des Modells zu untersuchen. Durch den Vergleich der Endauszahlung für i mit der maximal erreichten Endauszahlung legt (6.1) für die unterlegenen Strategien fest, daß sie proportional zum Verhältnis ihrer Auszahlung zur besten Auszahlung weniger stark wachsen als die Siegerstrategie. Im Unterschied zur biologisch-evolutionären Spieltheorie geht hier neben dem relativen Auszahlungserfolg noch eine Begrenzung für das maximale Wachstum pro Runde ins Modell ein. Darin muß jedoch keine unzulässige Willkür liegen, zumal gut vorstellbar ist, daß technische und materielle Grenzen des Wachstums zu einer solchen Obergrenze führen können. Nachdem das Rohpopulationswachstum RPGj zum alten Populationsanteil pj addiert worden ist, summieren sich die Populationsanteile nicht mehr zu eins. Das beruht auf Gleichung (6.1), die ein mehr oder weniger starkes, aber immer positives Wachstum für alle Strategien vorschreibt. Ein Schrumpfungsprozeß, der wieder zu einer Gesamtpopulation mit Größe eins zurückführt, läßt sich nun auf zweifache Weise begründen. Zum einen kann ein echter, inhaltlich bedeutungsvoller Schrumpfungsprozeß vorliegen. Dazu wird vorausgesetzt, daß die Gesamtpopulation von Strategien um eine ökologische Nische konkurriert. Ökologische Nischen
76
3. Kooperation
auf anonymen
Märkten
besitzen eine bestimmte Menge von Ressourcen und damit eine begrenzte Tragfähigkeit, welche die Anwesenheit einer bestimmten Menge von Arten bzw. Nutzern der Nische erlaubt. Eine inhaltliche Interpretation des Schrumpfungsprozesses nimmt an, daß die Gesamtpopulation die Tragfähigkeit ihrer ökologischen Nische voll ausnutzt, und daß ein weiteres Wachstum der Gesamtpopulation nicht möglich ist. Zeitweilige Überschüsse, die auf überreichen "Geburten" durch den Wachstumsprozeß beruhen, führen zur Ressourcenverknappung, weshalb in der Folge ein Teil der Strategien wieder abstirbt. Für den Sterbeprozeß wird unterstellt, daß ein gleicher Prozentsatz von allen Strategien wieder verschwindet, bis sich die Gesamtpopulation erneut der Grenze der Tragfähigkeit angepaßt hat. Die Gleichheit der Absterbebedingungen legt nahe, daß man eher von einer Ressourcenkrise ausgehen sollte, die alle ähnlich trifft, als von einer relativen Ressourcenknappheit, bei der erfolgreichere Strategien bessere Überlebenschancen hätten. Unabhängig von dieser inhaltlichen Begründung des Schrumpfungsprozesses existiert noch eine andere, rein formale Interpretation. Danach befände sich die Gesamtpopulation in einem ständigen, durch Gleichung (6.1) beschriebenen Wachstumsprozeß. Deshalb wird es nötig, die Gesamtpopulation und die Anteile der einzelnen Strategien nach jeder Runde zu renormieren. Gleichung (7) erfüllt diese Aufgabe ebenso, wie die Repräsentation des inhaltlich interpretierten Sterbeprozesses: ( 7 ) Pi,t+1 =Pi,t
+ RPG
i,t/s(Pk,t +
RPG
k,t)
Gleichung (7) liefert zugleich den neuen Populationsanteil pj von i. Damit ist der endgültige, evolutionäre Vergleichsmaßstab für den Erfolg der Strategien gegeben. Nun kann zur Betrachtung der konkurrierenden Strategien und anschließend zu den Simulationsläufen des Modells übergegangen werden.
3.2.1.3. Die Strategien Die Wahl der Strategien im vorliegenden Modell wird von den Möglichkeiten der Sanktionierung in einem iterierten Gefangenendilemma mit Exit-Option bestimmt. Die verschiedenen Kalküle kooperativen, sanktio-
3.2. Ein Modell atomistischer Kooperation
77
nierenden oder ausbeuterischen Verhaltens, die in den Strategien implementiert sind, werden im folgenden als Taktiken bezeichnet. Vor allem zwei Typen unterschiedlicher Taktiken der Sanktionierung dürften in einem freiwillig iterierten Dilemmaspiel von Bedeutung sein. Eine ausgebeutete Strategie kann versuchen, in der Interaktion mit einem Defekteur zu verharren, und ihn durch eine defektive Reaktion zur Rückkehr zur Kooperation zu bewegen. Diese Taktik haben bedingte Kooperateure in Axelrods Superspielwettkämpfen eingesetzt. Allerdings lassen sich Axelrods Analysen bedingter Kooperativität im gegenwärtigen Kontext nicht übernehmen, denn im freiwillig iterierten Gefangenendilemma verfügen Defekteure über ein neue taktische Option. Sie müssen die Bestrafung durch ihre ausgenutzen Partner nicht abwarten, sondern können die Interaktion abbrechen, ihre Gewinne mitnehmen, in einem "Meer der Anonymität" (vgl. Axelrod 1987: 90) untertauchen und sich einen neuen Partner, bzw. ein neues Opfer, suchen. Eine solche "hit and run"-Taktik der Defekteure erscheint ex ante als starkes Argument gegen die Möglichkeit des Entstehens stabiler Kooperationsverhältnisse und gegen die Anwendung der beschriebenen Vergeltungstaktik kooperationswilliger Strategien. Letztere würde im Fall eines "hit and run"-Defekteurs einfach ins Leere laufen. Es liegt nahe, daß ausgebeutete Akteure die Flucht des Defekteurs nicht abwarten, sondern sich einer zweiten Taktik bedienen und sich ihrerseits sofort von defektiven Partnern trennen. Auf diese Weise gehen sie dem Risiko zukünftiger Konflikte mit einem Partner aus dem Weg, der sich bereits einmal als unzuverlässig oder böswillig erwiesen hat, und verlieren keine Zeit, nach einem kooperativen Partner zu suchen. Im täglichen Leben läßt sich diese Taktik häufig beobachten. Wer sich in wirtschaftlichen Interaktionen, sei es beim einfachen Kauf eines Gutes oder in der vertraglichen Kooperation, übervorteilt fühlt, wird es vorziehen, bei der nächsten Interaktion gleicher Art einen anderen Partner zu wählen. Natürlich kann auch die Vergeltungstaktik in der Realität beobachtet werden. Beide Taktiken sollten daher in einem Modell im Wettstreit ge-
78
3. Kooperation auf anonymen Märkten
geneinander getestet werden. Hier wird diese Aufgabe allerdings noch zurückgestellt und nur ein erster Schritt zur Analyse freiwillig iterierter Kooperation vollzogen. Dafür reicht es aus, vereinfachend anzunehmen, daß alle Strategien die zweite Taktik der sofortigen Trennung von Defekteuren bevorzugen. Ausgehend von den Simulationsresultaten für diese Taktik lassen sich dann allgemeinere Ergebnisse anstreben. Zur weiteren Vereinfachung wird die untersuchte Strategiemenge nochmals eingeschränkt. Axelrods Ergebnisse und die einfache Lebenserfahrung lehren, daß unbedingt kooperative Strategien, die nie Vergeltung üben, ohnehin aus der Menge durchsetzungsfähiger Verhaltensroutinen ausscheiden. Es reicht daher aus, nur bedingt kooperative Strategien zu untersuchen. Bedingte Kooperation heißt im vorliegenden Fall, daß eine gemeinsame Interaktion sofort beendet wird, sobald mindestens eine Seite defektiv spielt. Diese Regel wenden alle betrachteten Strategien an. Auch Strategien, die beabsichtigen, ihren Partner auszunutzen, verlassen diesen, wenn er die Gelegenheit zur Defektion vor ihnen wahrnimmt. Die eigene, böse Absicht ist hier kein Grund zur Duldsamkeit. Unter diesen Bedingungen bestehen die verbleibenden, taktischen Optionen einer Strategie in der Entscheidung, ob und wie lange sie kooperiert. Das führt zu einer linearen Ordnung der Strategiemenge. Die Strategien unterscheiden sich nur durch eine Zahl n, welche die Runde der gemeinsamen Interaktion bezeichnet, in der die Strategie defektieren will. Alle Strategien sind damit von einem Typ Dn, mit n als Parameter für die Runde der intendierten Defektion. Grenzfälle bilden Dl, die immer defektiert und folglich mit jedem anderen Akteur nur einmal interagiert, und D , die von sich aus nie die Kooperation abbricht und die einzige echt kooperative Strategie darstellt. Für diese besonderen Strategien werden in Abweichung von der linearen Klassifizierung die Namen ALL D ("Defektiere immer!" vgl. Axelrod 1987: 12) und CONCO (von conditional Cooperation) benutzt^. Die Strategiemenge der folgenden Simulationen ist immer eine Auswahl von m Exemplaren aus der Gesamtheit der Strategien Dn.
3.2.2. Simulationsergebnisse Verschiedene Simulationsläufe mit dem Modell des iterierten Gefange-
3.2. Ein Modell atomistischer Kooperation
79
nendilemma mit Exit-Option haben gezeigt, daß der Erfolg von Strategien stark von der Wahl der Parameter (Regulationsparameter R, Abbruchwahrscheinlichkeit q), der Strategiemenge, der Größe der Strategiepopulationen und der Struktur der Auszahlungsmatrix abhängt. Aus diesem Grund werden die Resultate einiger typischer Simulationen mit verschiedenen Parametern vorgestellt. Die gesamte Analyse wird für zwei Strategiemengen durchgeführt. Die erste Menge enthält die Strategien ALL D, D5, D10, D20, CONCO. Die Konkurrenten dieser Gruppe unterscheiden sich deutlich in der Dauer ihrer Kooperationsbereitschaft, wodurch Erfolgsdifferenzen klarer aufscheinen sollten. Eine zweite Strategiemenge besteht aus ALL D, D2, D3, D4, D5, D6, D7, D8, D9, CONCO. Hier wurden im Vergleich zur ersten Gruppe eng benachbarte Strategien gewählt, wobei der Konkurrenz minimal unterschiedlicher Strategien besonderes Interesse gilt. Zugleich ist die zweite Strategiemenge größer als die erste, umspannt aber eine geringere Variationsbreite an Kooperativität^. Aus der ersten Strategiemenge konnten nur ALL D, D5, und CONCO einen Simulationslauf des Modelles gewinnen. Die Darstellung konzentriert sich deshalb auf diese Strategien. CONCO, die einzige voll kooperative Strategie, konnte unter den scheinbar so ungünstigen Bedingungen freiwilliger Iteration in einer gänzlich anonymen Umwelt nicht nur überleben, sondern den Wettkampf der Strategien sogar gewinnen. Dies dürfte das zentrale und überraschendste Ergebnis der Simulationen sein. Die "hit and run"- Taktik von Defekteuren reicht nicht in allen Fällen aus, das Anwachsen von Kooperativität in der Population zu unterminieren. In einem Simulationslauf mit mittlerem Einfluß des Wachstums pro Runde (R = 10), mit unbegrenzter Interaktionserwartung für Kooperateure (q=0) und einer anfänglichen Gleichverteilung (p = 0.2) der Strategieanteile erreichte CONCO nach 3900 Runden einen Anteil von 99% der Gesamtpopulation. Danach verlief der Anstieg von CONCOs Anteil sehr langsam. Das letzte Prozent bis zur reinen CONCOPopulation bedurfte weiterer 5000 Runden, obwohl CONCO von Anfang an monoton wuchs. Mit ALL D und D5 starben dieschärfsten Rivalen von CONCO bereits nach 2460 Runden und 6900 Runden aus.
80
3. Kooperation auf anonymen Märkten
CONCOs Erfolg konnte in diesem Fall auf den Vorteil zurückgeführt werden, den sie aus der Möglichkeit zur unendlichen Iteration von Interaktionen mit dem gleichen Partner zog. Doch selbst, wenn die Wahrscheinlichkeit für einen Interaktionsabruch auf 0.02 erhöht wurde, gewann CONCO den oben beschriebenen Simulationslauf (jetzt: R = 10, q=0.02, p=0.2). Es kostete allerdings mehr Zeit bis ein voller Erfolg erzielt war. Nach Runde 5000, länger wurde diese Simulation nicht verfolgt, besaß CONCO einen Populationsanteil von p=0.82. Wieder wuchs der Anteil von CONCO von Anfang an monoton. Der zweitplazierte Konkurrent D20 okkupierte zu seinen besten Zeiten (Runde 1780) ungefähr 40% der Population. In beiden Läufen, wie auch in allen folgenden, verdrängte eine Strategie am Ende alle anderen aus der Population. Bild 2 zeigt die letztgenannte Simulation bis zu Runde 5000: BILD 2: Simulation freier Kooperation mit Strategiemenge I, R = 10, q=0.02, p = 0.2
p(i)
AU. D
Iterationen D5 gewann den Wettkampf der Strategien, wenn die Abbruchwahrscheinlichkeit ceteris paribus auf q = 0.035 erhöht wurde. In diesem
3.2. Ein Modell atomistischer
Kooperation
81
Szenario war D5 nach etwa 1400 Runden auf 99% der Gesamtpopulation angewachsen. Die besten Verlierer (D20 und CONCO) hatten jeweils maximal einen Anteil von 24% an der Population erreicht. Bild 3 dokumentiert diesen Lauf für 1500 Runden: BILD 3: Simulation freier Kooperation mit Strategiemenge I, R = 10, q=0.035, p=0.2
p(i)
ALLD
Iterationen Schließlich siegte ALL D erwartungsgemäß, wenn die Abbruchwahrscheinlichkeit über eine bestimmte Grenze gesteigert wurde. Wo diese Grenze liegt, ließ sich nicht genau bestimmen, da aufgrund der langen Laufzeit des Programmes der Einsatz eines iterativen Suchalgorithmus an technischen Beschränkungen scheiterte. Zumindest bestand in einem Lauf mit R = 10, q=0.1 und gleichverteilten Strategieanteilen die gesamte Population nach nur 340 Runden aus ALL D-Strategien. Wenn ALL D gewann, so gewann es sehr schnell. Überraschenderweise profitierte ALL D nicht nur von einer hohen Abbruchwahrscheinlichkeit q, sondern auch von einem kleinen R, d.h. von einem hohen Wachstumsparameter pro Runde. Selbst in einer Simulation mit unendlicher Interakti-
82
3. Kooperation auf anonymen Märkten
onschance für Kooperateure ( q = 0 ) hatte A L L D nach 300 Runden die gesamte Population okkupiert, wenn R = 5 angenommen wurde. Bild 4 zeigt das Ergebnis dieses Laufs bis Runde 300: B I L D 4: Simulation freier Kooperation mit Strategiemenge I, R = 5 , q=0, p = 0.2
P
ALL D
Wie läßt sich der Zusammenhang zwischen einen niedrigen R und einer hohen Erfolgschance für A L L D erklären? Es scheint sich um eine Art paradoxen Effekt der gewählten Evolutionsdynamik zu handeln. Würde man die Auszahlungsverhältnisse zwischen den Strategien über die Zeit konstant halten, wüchsen die Strategien mit Auszahlungsvorteilen bei einem niedrigeren R pro Runde um so schneller. Tatsächlich verschieben sich die Populationsanteile im Modell jedoch langsamer, wenn ein niedriges R angesetzt wird. In einem Simulationslauf mit R = 10 war beispielsweise A L L D nach 20 Runden auf einen Anteil von p=0.17 gesunken, während diese Strategie für R = 5 immerhin noch p = 0.20 erreichte, wenn die anderen Parameter konstant gehalten wurden. In einem anderen Beispiel mit R = 10, q = 0 und anfänglicher Gleichverteilung, wuchs C O N C O
3.2. Ein Modelt atomistischer Kooperation
83
bis zur Runde 500 auf 46% der Gesamtpopulation an, erzielte aber bei R=50 sogar ein Ergebnis von 73% in dieser Runde. Auf der Makroebene der beobachteten Populationsveränderung bewirkt die Variation von R immer genau das Gegenteil des Effektes, der auf der Mikroebene des Evolutionsmechanismus wirkt. Das scheint eine Folge des Umstandes zu sein, daß R neben der direkten, durch Gleichung (6.1) definierten Wachstumswirkung auch einen indirekten Einfluß auf die Dynamik des Modells ausübt. ALL D als radikal ausbeuterische Strategie lebt von anfänglich kooperativen Partnern. Das Modell entspricht in diesem Punkt einem RäuberBeute-System. Nach jeder Runde wandern alle Strategien des ALL DTyps in den Suchpool, um neue Opfer zu suchen; der gesamte Populationsanteil von ALL D ist also im Suchpool präsent. Alle durch den Wachstumsprozeß neu geschaffenen Strategieanteile müssen sich zunächst im Suchpool nach einem Partner umsehen und treffen mit einer gewissen Wahrscheinlichkeit auf ALL Ds. ALL D profitiert auf diese Weise von einem hohen Populationswachstum der kooperativen Beute-Strategien^. Je höher dieses Wachstum ausfällt, desto mehr Beute strömt ihr im Suchpool zu und fördert damit indirekt wieder das Populationswachstum dieser unkooperativen Strategie. Anscheinend überwiegen im gegenwärtigen Modell die negativen Effekte dieser Rückkopplung die Vorteile, die für kooperative Strategien durch eine Steigerung des unmittelbaren Wachstums pro Runde entstehen. Der Räuber-Beute-Mechanismus überkompensiert die Wirkung von R und kehrt die Wirkrichtung dieses Parameters um. Der Zusammenhang zwischen R, q und dem Sieg einer bestimmten Strategie in der ersten Strategiemenge läßt sich nun in einem Diagramm zusammenfassen. Wenn R groß genug wird und q klein genug bleibt, gewinnt CONCO den Wettkampf. Eine Steigerung von q führt, wiederum sofern R groß genug ist, zunächst zu einem Sieg von D5. Ein weiteres Anwachsen von q zieht schließlich den Erfolg von ALL D nach sich. Wählt man R klein genug, so kann D5 bei keiner Wahl von q mehr gewinnen und ein CONCO Regime springt bei Variation von q direkt zu einem ALL D Regime über. In verschiedenen Läufen mit R = 6 war dies der Fall. Für ein noch kleineres R, wie z.B. R=5, wird auch CONCO aus der Siegerliste verdrängt und ALL D gewinnt unabhängig von der Wahl von q
84
3. Kooperation auf anonymen Märkten
alle Simulationen. Bild 5 zeigt das Verhältnis von Sieg, Regulationsparameter R und Abbruchwahrscheinlichkeit q in einem Diagramm, das allerdings die tatsächlichen Parametergrenzen für Regimewechsel nur grob wiedergibt: BILD 5: Auswirkungen des Regulationsparameters R und der Abbruchwahrscheinlichkeit q auf den Erfolg von Strategien
ALL 0 D5
1-Abbruchwahrscheinlichkeit
CONCO
1.00 0.98 0.96 0.94 0.92 0.90 0.88 0.86 0.84 0.82 0.80
Regulationsparameter Weniger unerwartet als der Einfluß des Regulationsparameters R, verlief der von q. Eine hohe Abbruchwahrscheinlichkeit sollte kooperative Strategien benachteiligen, die ihren Erfolg im Modell ausschließlich aus der Chance ziehen, mit ihrerseits kooperativen Partnern möglichst lange iterativ zu interagieren. Tatsächlich führte ein hohes q zum Sieg mehr oder weniger unkooperativer Strategien wie D5 und ALL D. Doch warum erweist sich der Zusammenhang zwischen q und dem Mißerfolg der Kooperativität nicht als monoton? In allen Simulationen mit der ersten Strategiemenge sprang das Regime von CONCO gleich zu D5 oder ALL D über, während die dazwischen liegenden, kooperativeren Wettbewerber
3.2. Ein Modell atomistischer
Kooperation
85
D20 und D10 trotz zahlreicher Kontrolläufe mit veränderten Parametern nie einen Spitzenplatz erreichen konnten. Anscheinend zahlt es sich im gegenwärtigen Modell nicht aus, wenn eine Strategie relativ kooperativ ist, aber kein echter Kooperateur. Weshalb das Modell diese Eigenschaft besitzt, konnte nicht geklärt werden. Es zeigt sich, daß dynamische Systeme, die einer analytischen Lösung nicht zugänglich sind, oft eine Art simulativer Empirie erzeugen, die dem Modellkonstrukteur selbst nur Hypothesenbildung statt eines exakten Nachweises ermöglicht. Im Rahmen der zweiten Strategiemenge ALL D, D2, D3, D4, D5, D6, D7, D8, D9, CONCO gewannen nur ALL D und CONCO den evolutionären Wettkampf. Wiederum siegte ALL D, wenn das (in Gleichung (6.1) spezifizierte) Wachstum pro Runde über eine bestimmte Grenze stieg. In einer Simulation mit R = 10, q = 0 und Gleichverteilung bestand die Gesamtpopulation schon nach 340 Runden ausschließlich aus ALL D. Trotz der Vorteile infiniter Kooperation, war CONCO in diesem Lauf im Vergleich zu den Simulationen mit der ersten Strategiemenge benachteiligt, weil es gegen im Durchschnitt unkooperativere Konkurrenten antreten mußte, die zudem 90% der Gesamtpopulation okkupierten. Das wurde im folgenden Lauf geändert, der CONCO einen Anfangsanteil von 0.28 gegenüber 0.08 der restlichen Strategien einräumte. Zum Ausgleich wurde die Abbruchwahrscheinlichkeit auf q=0.01 (bei gleichbleibendem R=10) erhöht. Auch in diesem Fall verdrängte ALL D alle anderen Wettbewerber, wobei sich die vorteilhaftere Lage der Kooperateure in einer längeren Dauer (580 Runden) bis zu ALL Ds Sieg niederschlug. CONCO erreichte immerhin in beiden Simulationen den zweiten Platz der Erfolgsrangliste. Zu einem vollen Erfolg CONCOs kam es nur, wenn bei einer Ausgangsverteilung mit 0.28/0.08 der Regulationsparameter R erhöht wurde. Für R=50 und q = 0 bestand die ganze Population nach 2400 Runden aus CONCO Strategien. Doch selbst wenn q auf 0.01 gesteigert wurde, reichte R=50 für einen Sieg CONCOs nach 2400 Runden aus. Das Entstehen von Kooperation unter reinen Egoisten ist demnach auch bei einer Veränderung der Strategiemenge möglich. Zur besseren Darstellbarkeit dieses Ergebnisses wurde auf eine kleinere Menge (ALL D, D2, D3, D4, CONCO) einander ähnlicher Strategien zurückgegriffen. Hier siegte wieder CONCO in einer Simulation mit R=50, q = 0 (oder q=0.01) und Gleich-
86
3. Kooperation
auf anonymen
Märkten
Verteilung der Anfangsanteile. In diesem Lauf wechselte die Führung während des Evolutionsprozesses. Zunächst konnte ALL D den höchsten Populationsanteil für längere Zeit behaupten, bis CONCO gleichzog und ALL D schließlich überholte. In vielen anderen Simulationsläufen gelang es dagegen der Strategie, die am besten startete, auch am Ende, alle Rivalen aus der Population zu verdrängen. Bild 6 zeigt den Simulationslauf bis zu Runde 1000, in der CONCO einen Populationsanteil von p = 1 erreichte: BILD 6: Simulation freier Kooperation mit den Strategien CONCO, ALL D und D2-D4, R=50, q=0, p = 0.2 p ( i )
ALL D
Nach den bisherigen Simulationsläufen mit beiden (bzw. den drei) Strategiemengen erscheinen ALL D und CONCO als erfolgreichste Strategien. Beide konnten für einen weiten Bereich von Parameterkonstellationen den Wettkampf gewinnen. Der Erfolg egoistischer Kooperation läßt sich am besten anhand der Abbruchwahrscheinlichkeit q bewerten^. Demnach kann Kooperation in der atomistischen Modellwelt als egoistisch ra-
3.2. Ein Modell atomistischer Kooperation
87
tionales Verhalten angesehen werden, wenn die Gefahr hinreichend klein ist, daß die Interaktion auch gegen den Willen der Beteiligten abbricht. Andernfalls scheint die völlige Kooperationsverweigerung, einer vorsichtigen, graduellen Abschwächung der Kooperativität überlegen zu sein. Für CONCO spricht, daß sie bei Betrachtung der Gesamtrangliste oft den zweiten Platz erreichte, wenn ALL D gewann. Umgekehrt rutschte ALL D auf den letzten Platz ab, sobald sie die Führung an CONCO abgeben mußte. CONCOs Erfolg war eindeutig stabiler als der von ALL D. Es fragt sich jedoch, wieviel diese Stabilität wert ist, denn der Sieger beansprucht im vorliegenden Modell die Population für sich. Alle nachrangigen Strategien sterben mit der Zeit aus. In keiner Simulation entstand so etwas wie ein (polymorph oder echt stochastisch)^ gemischtes Gleichgewicht von Strategien, bei dem mehrere Konkurrenten in einem stabilen (oder auch nur stabil zyklisch variierenden) Verhältnis zu koexistieren vermochten. Die Rangordnung des Erfolges drückt unter diesen Bedingungen nur die Reihenfolge aus, in der die Verlierer ausstarben. Höher plazierte Bewerber überlebten einige Runden länger als andere. Es ist weitgehend eine Frage der subjektiven Perspektive, wie hoch man diese Art von Erfolg einschätzt. Vor dem Hintergrund der Keynesschen Maxime "in the long run we are all dead" kann ein temporärer Erfolg von kooperativem Verhalten durchaus als ausreichend angesehen werden. Aufgrund der subjektiven Momente in der Erfolgsbewertung macht es Sinn, näher auf die Rangliste des Erfolges in den Simulationsläufen einzugehen. Außerdem offenbart diese Liste einige auffällige Regelmäßigkeiten. Die folgende Tabelle gibt einen Überblick über die Strategiemenge, die Parameter bestimmter Simulationen (R, q, p zu Anfang), den Sieger und die Ordnung des Erfolges von allen Strategien:
88
3. Kooperation
auf anonymen
Märkten
TAFEL 1: Erfolgsrangliste der Strategien Strategienmenge
Parameter R q
Sieger
Re s trangordnung
P
10
0
0.2
CONCO
D20 > D10 > D5> A L L D
10
0.02
0.2
CONCO
D20 > D10 > D5 > A L L D
10
0.035
0.2
D5
C O N C O > D20 > D10 >ALL D
10
0.1
0.2
ALL D
D5 > C O N C O > D20 > D10
0
0.2
ALL D
C O N C O > D20 > D10 > D5
0.28/0.08
CONCO
D9 > D8 > D7 > D6 > D5 > D4 > D3 >D2 >ALL D
0.28/0.08
CONCO
D9 > D8 > D7 > D6 > D5 > D4 > D3 >D2 >ALL D
ALL D
C O N C O > D5 > D6 > D4 > D7 >D3 >D2 >D8 >D9
0.28/0.08 ALL D
C O N C O > D9 > ,D8 > D7 > D6 >D5>D4>D3>D2
II
50
II
50
II
10
II
10
0
0.01
0.1
0.01
Legende : S t r a t e g i e m e n g e I : A L L D, D5, D10, D20, C O N C O S t r a t e g i e m e n g e II: A L L D, D2, D3, D4, D5, D6, D7, D8, D9, C O N C O p = 0 . 2 bzw. p = 0 . 1 : A n f a n g s p o p u l a t i o n g l e i c h v e r t e i l t p=0.28/0.08: Anfangspopulation von CONCO/Anfang Rest
Die Tabelle zeigt, daß eine monotone Ordnung des Erfolges mit kooperativeren Strategien in den besseren Plazierungen existiert, wenn CONCO den Wettkampf gewinnt. Diese Rangordnung bleibt sowohl bei Variation der Modellparameter, als auch bei einer Veränderung der Strategiemenge erhalten. Im Falle eines Sieges von ALL D oder D5 hingegen entsteht eine nichtmonotone Rangliste. Besonders interessant erweist sich dabei die Rangordnung für den Computerlauf mit R = 10, q = 0, p=0.1. ALL D, CONCO und D5 nehmen die drei Spitzenplätze ein. Der Rest der Strategien schneidet um so besser ab, je mehr sie D5 benachbart sind. Bei der Teilfolge D6, D4, D7, D3 ist dieses Ordnungsprinzip noch ganz deutlich
3.2. Ein Modell atomistischer Kooperation
89
zu erkennen, dann löst es sich zum Ende der Rangordnung auf. Weshalb D5 hier den dritten Platz erreichen konnte und die Ordnung der schwächeren Konkurrenten bestimmt, bleibt unklar. In der zweiten Strategiemenge bestitzt D5 keinen ausgezeichneten Status mehr. Auch für den vorliegenden Lauf können die Gründe für bestimmte Ergebnisse der Simulationsempirie theoretisch nicht völlig durchdrungen werden. Die Rangordnungen der Strategien belegen die Robustheit des Erfolges von CONCO, sofern man temporäre Überlebensvorteile nicht zu gering schätzt. CONCO erreicht nie weniger als den dritten Platz unter fünf oder zehn Strategien. Darüberhinaus erweist sich ein erfolgreiches Abschneiden von CONCO auch möglich, wenn die Auszahlungsmatrix geändert wird. Ein symmetrisches 2x2-Spiel wird durch die Gültigkeit der Relationen y > x > w > z und 2x > y+z als Gefangenendilemma definiert (vgl. Rapoport/Chammah 1965: 35). Manchmal jedoch gilt allein schon die erste Relation als hinreichendes Merkmal für ein Gefangenendilemma (vgl. Harsanyi 1977: 280ff.). Spiele, die die Relation 2x < y+z aufweisen, begünstigen bei einem einfachen Spiel unkooperatives Verhalten aufgrund der hohen Differenz zwischen dem potentiellen Defektionsgewinn y und der kooperativen Auszahlung x. Im wiederholten Spiel ist die Kooperation durch alternierende Realisierung der Strategiekombinationen CD und DC (d.h. der Auszahlungen y,z und z,y) der iterierten, beiderseitigen Wahl von C überlegen. In den vorliegenden Modelläufen wurde von der Möglichkeit zu alternierender Kooperation abgesehen und untersucht, ob sich die höhere Versuchung zu unkooperativem Verhalten negativ auf CONCOs Erfolg auswirkt. Die Grundlage dieser Simulationen bildete eine Auszahlungsmatrix mit y=7, x=3, w = l , z=0. Überraschenderweise konnte CONCO bei hohem Regulationsparameter und niedriger Abbruchwahrscheinlichkeit auch in diesen Wettbewerben gewinnen (z. B. bei R=50 und q = 0 oder q=0.01). Generell im Vorteil war CONCO, wenn statt dem Gefangenendilemma ein ChickenSpiel (d.h. es gilt: y > x > z > w) untersucht wurde
3.2.3. Eine zweite Evolutionsdynamik Wie bereits angekündigt, wurden für das vorliegende Modell auch Rechnungen mit einem Evolutionsmechanismus durchgeführt, bei dem (6.1) verändert war. Diese Rechnungen sollen offenbaren, wie stark die
90
3. Kooperation
auf anonymen
Märkten
Simulationsergebnisse von der Wahl einer speziellen evolutionären Dynamik abhängen. Gleichung (6.2.) folgt daher einer anderen Logik als (6.1):
(6.2.) RPGj = (PAYj - E k PAY k *p k )'
Pi
Nach (6.2.) variiert die Rohwachstumsrate von Teilpopulation i, d.h. RPGj/pj (Hinweis: einfach pj nach links gebracht), proportional mit Faktor 1 zur Differenz zwischen der Endauszahlung für i und der durchschnittlichen Endauszahlung, die in der Gesamtpopulation vorliegt. Der Anteil an Strategien des Typs i wächst proportional zu ihrem Erfolg bzw. Mißerfolg relativ zu dem des Durchschnitts. Dieser Zusammenhang wird üblicherweise auch in der evolutionären Spieltheorie der Biologie unterstellt (vgl. Hofbauer/Sigmund 1984; Zeeman 1981), er bleibt jedoch im Kontext sozialer Kooperation unter Menschen ebenso willkürlich, wie andere Mechanismen auch. Seine Vorteile gegenüber (6.1) liegen in der größeren Einfachheit, die es unter anderem ermöglicht, auf den schwer zu interpretierenden Parameter R mit seinen ungewöhnlichen Wirkungsverflechtungen zu verzichten. Simulationen mit dem durch (6.2.) veränderten Modell erbrachten bis auf den Wegfall von R qualitativ unveränderte Ergebnisse. Der Wechsel des Evolutionsmechanismus erfordert wider erwarten keine neue Betrachtung der Möglichkeit egoistischer Kooperation bei freiwilliger Interaktion. Dementsprechend ist es nicht nötig, die Simulationsläufe en detail erneut zu kommentieren. Wie genau die beiden untersuchten Mechanismen in ihren Resultaten übereinstimmen, sei nur kurz anhand des Siegerwechsels in Strategiemenge I dargestellt. Im Modell mit (6.1) gewannen nur CONCO, D5 und ALL D abhängig von der Wahl der Abbruchwahrscheinlichkeit q und des Regulationsparameters R den Wettkampf. Mit (6.2.) und der übernommenen Bedingung anfänglich gleich großer Strategiepopulationen entfällt R, aber es treten weiterhin genau diese drei Sieger auf. Dabei bleibt bei Variation von q das Muster erhalten, mit dem sich die Sieger im Modell mit (6.1.) ablösen. Für eine hinreichend große Abbruchwahrscheinlichkeit siegt ALL D. Obwohl die Grenzen für den Siegerwechsel wiederum nicht exakt bestimmt werden konnten, trat dieser Fall für ungefähr q > 0.13 auf. Sofern 0.13 > q > 0.09 galt, gewann D5 den Wettkampf. Für ein noch kleineres q < 0.09
3.2. Ein Modell atomistischer Kooperation
91
setzte sich schließlich CONCO durch. Auch die zeitliche Entwicklung der Strategien entsprach den in den oben gezeigten Bildern vorkommenden Verlaufsmuster. Alle Folgerungen aus dem ersten Modell behalten daher für das zweite Gültigkeit und können nun nochmals vertiefend zusammengefaßt werden.
3.2.4. Diskussion der Ergebnisse Welche Aussagekraft besitzen die Ergebnisse von Simulationen mit dem iterierten Gefangenendilemma? Die Schwierigkeiten einer empirischen Validierung und Anwendung spieltheoretischer Befunde, sind bereits weiter oben angesprochen worden. Man darf bezüglich der spieltheoretischen Analyse ebensowenig zu hohe Leistungserwartungen hegen, wie gegenüber sozialwissenschaftlichen Theorien im allgemeinen. Spieltheoretische Argumente können in der Regel empirisch wenig erklären, aber sie können unbegründete Urteile korrigieren helfen, auf Möglichkeiten hinweisen, und Ängste vor dem ewig drohenden Verfall der Werte und der Stabilität moderner Gesellschaften abbauen. Wie viel oder wenig das ist, ist eine Frage der Perspektive und der Neigung, sich mit der Kunst des Möglichen zu begnügen. Unter diesen Gesichtspunkten sollte die folgende Diskussion der Simulationsergebnisse verstanden werden. Direkte Bezüge zur kooperativen Stabilität freier Märkte bleiben dem Schlußabschnitt vorbehalten. 3.2.4.1. Die Notwendigkeit von Normen Eine der zentralen, klassischen Annahmen der normativistischen Soziologie besagt, daß in einer Austauschgesellschaft rationaler Egoisten keine stabilen Kooperationsverhältnisse entstehen können (vgl. Dürkheim 1977, Parsons 1949). Angebliche Nachweise für diese These versuchen zu zeigen, daß bereits einfache, analytische Überlegungen zu diesem Schluß ausreichen. Die vorliegende Simulation sollte geeignet sein, diese Sicherheit zu erschüttern. Dabei muß eingeräumt werden, daß sich die Aussagen soziologischer Theoretiker über die Notwendigkeit der normativen Integration von Individuen nie allein auf den Fall egoistischer Austauschbeziehungen be-
92
3. Kooperation auf anonymen Märkten
schränken. Von ihren Intentionen her erstrecken sich einschlägige Thesen auch auf Probleme der Anomie, abweichenden Verhaltens, politischer Rebellion und auf Rechtsbrüche (vgl. Merton 1968: 194). Sie verweisen auf Dilemmas der gemeinsamen Aktion eigeninteressierter Individuen in großen Bürgerheeren, in Demokratien und in Nationen, die in imperialistischer Konkurrenz verstrickt sind. Die Thematik einer radikalisierten Austauschgesellschaft stellt nur eines von mehreren, kontrovers diskutierten Szenarien dar. Dennoch bildet sie eine wichtige Stütze der normativistischen Argumentation. Die Unterminierung dieser Stütze, deren Standhaftigkeit dem common sense so wenig bezweifelbar erscheint, zeigt zumindest, daß man gegenüber jedem apriorischen Beweis der sozialen Notwendigkeit normativer Bindungen vorsichtig sein muß. Nur die Empirie vermag hier einen verläßlichen Weg zu weisen. Die Analyse des spieltheoretischen Modells freier Kooperation belegt, daß zumindest prinzipiell stabile Kooperation unter rationalen Egoisten auch in großen, atomistischen und anonymen Austauschgesellschaften entstehen kann. Dabei wird nicht wie üblich vorausgesetzt, daß die Basis der gesellschaftlichen Kooperation Kleingruppen oder Familien sind, in denen die Bekanntheit aller Akteure miteinander unkooperatives Verhalten erschwert (vgl. Coleman 1986; Kliemt 1986b: 124). Egoistische Kooperation erweist sich robuster als der common sense und selbst die spieltheoretische Forschung annehmen. Skepsis ist vor allem gegenüber der These angebracht, daß wirtschaftliches Handeln eine Wirtschaftsethik unabdingbar voraussetzt. Im Sinne der vorliegenden Simulation kann auch eine völlig zwangsfreie Wirtschaft kooperatives Verhalten aus sich heraus generieren. Das heißt wohlgemerkt nicht, daß auf Eingriffe und den Schutz von Akteuren vor Kooperationsbrüchen verzichtet werden sollte. Die Ergebnisse der Simulation sprechen nur dafür, dies weniger als Frage der Funktionstüchtigkeit des Systems, denn als Problematik von Wertentscheidungen zu betrachten. Genaugenommen vermag das Modell, gestützt auf die Erfolge von ALL D, allerdings auch Ängste über die Funktionstüchtigkeit einer atomistischen, amoralischen Austauschgesellschaft zu nähren. Man muß diese Ängste nur nicht wie selbstverständlich teilen. Erwartungen hinsichtlich der Stabilität radikal egoistischer Kooperation müssen unter einem Schleier des Nichtwissens gebildet werden, den der sozialwissenschaftliche common sense nicht auflösen kann.
3.2. Ein Modell atomistischer Kooperation
93
3.2.4.2. Minimale Bedingungen egoistischer Kooperation Das Modell gibt einige bisher als wesentlich erachtete Bedingungen egoistischer Kooperation auf. Dadurch erfährt die Suche nach minimalen Voraussetzungen kooperativen Verhaltens eine Reorientierung. Bislang wurde in der Regel unterstellt, daß egoistische Kooperation zerfällt, wenn böswillige Akteure nicht verfolgt, identifiziert und zur Rechnung gezogen werden können. Es hat sich jedoch gezeigt, daß Kooperation unter Egoisten auf einer viel schmaleren Basis entstehen kann. Die im Modell verwendeten Strategien vom Typ Dn benötigen kein Gedächtnis für den Verlauf einer iterierten Kooperation. Sie folgen der einfachen Regel: "Kooperiere n-1 Runden und defektiere dann. Defektiert dein Partner, so trenne dich sofort von ihm." Zur Ausführung dieser Regel müssen sich die Strategien nur die Zahl der Runden mit einem Partner merken. CONCO, die einzige echte, kooperative Strategie, defektiert nie und kann deshalb sogar auf diese rudimentäre Form des Gedächtnisses verzichten. Defekteure und Kooperateure bleiben völlig anonym. Es existieren keine Effekte, die auf der Reputation bestimmter Strategien oder Akteure beruhen. Weder können bestimmte Defekteure in späteren Interaktionen wiedererkannt werden, noch kann der Typ ihrer Strategie identifiziert werden. Selbst eine Unterscheidung zwischen bereits bekannten und noch unbekannten Typen von Partnern ist nicht möglich. Diese Annahme geht noch über das hinaus, was in der Realität erwartet werden kann. Prozesse der Stigmatisierung und Reputationsbildung zeigen, daß Kooperationserwartungen oder Mißtrauen häufig an Gruppen- oder Typusmerkmale gebunden werden. Im gegenwärtigen Modell führt ein solcher Mechanismus, der die Kooperationsentstehung erleichtern würde, zu nichts, denn alle neuen Partner gleichen sich völlig. Fixierte Interaktionen (z.B. Superspiele) mit bestimmten Partnern entfallen. Der Schatten zukünftiger Sanktionsdrohungen trifft keinen potentiellen Defekteur. Dieser kann sicher sein, daß ausbeuterische "hit and run"-Aktionen zum Erfolg führen. Zugleich werden die Kosten der Beendigung einer Interaktion mit einem bestimmten Partner völlig vernachlässigt. In der Realität dürften solche Kosten in der Regel vorhanden sein
94
3. Kooperation
auf anonymen
Märkten
und eine gewichtige Rolle im Entscheidungskalkül von Akteuren spielen. Nach der herrschenden Meinung in spieltheoretischen Untersuchungen stärken hohe Trennungskosten die Kooperation. Das gegenwärtige Modell geht stattdessen von der pessimistischen Annahme einer kostenfreien Exit-Option aus. Die Interaktion bindungswilliger Akteure kann zudem durch äußere Umstände, Irrtümer und Fehlinterpretationen gestört werden. Zur Repräsentation dieser Annahme wurde eine Abbruchwahrscheinlichkeit eingeführt, mit der die iterierte Interaktionen nach jedem Spiel abbricht. Je höher die Abbruchwahrscheinlichkeit liegt, desto mehr wird die kooperative Lösung benachteiligt. Ein vergleichbarer Parameter beendet in Superspielen die fixierte Interaktion. In Axelrods zweitem Wettkampf betrug diese Abbruchwahrscheinlichkeit q=0.00346 für das Superspiel (vgl. Axelrod 1987: 38), hier wurde sie oft noch kooperationsfeindlicher mit q=0.02 oder q=0.01 angesetzt. Selbst für q=0.02 zeigte sich, daß kooperatives Verhalten erfolgreich sein kann. Weshalb konnte trotz dieser ungünstigen Annahmen egoistische Kooperation im Modell entstehen? Anscheinend ist die Kooperation rationaler Egoisten wesentlich robuster als üblicherweise angenommen. Die Strategien verfügten nur über einen einzigen Mechanismus der Sanktionierung: sie konnten unliebsame Partner ohne Umschweife verlassen. Kooperateure können nur einen einzigen Vorteil geltend machen: sie können mit anderen Kooperateuren in den durch die Abbruchwahrscheinlichkeit gezogenen Grenzen wiederholt zusammenarbeiten. Beides zusammen reicht aus, um in einigen Fällen stabile und erfolgreiche Kooperationsverhältnisse zu etablieren. Beide Bedingungen beschreiben ein Minimum an Voraussetzungen für das Entstehen freiwilliger Austauschkooperation. Allerdings müssen die üblichen Bedingungen egoistischer Kooperation vor dem Hintergrund dieses Ergebnisses nochmals kritisch betrachtet werden. In einigen Fällen können sie sich nämlich mehr als Hindernisse, denn als Stützen der Kooperation erweisen. Die Annahme, daß eine häufige, zwangsläufige Interaktion (Superspiel) zwischen Akteuren die Kooperation fördert, wird fragwürdig, wenn der sofortige Kooperationsabbruch sich als effizienter Sanktionsmechanismus empfiehlt. Ob ein System der freiwilligen oder der fixierten Interaktion letztlich mehr Anreize zu
3.2. Ein Modelt atomistischer Kooperation
95
kooperativem Verhalten bietet, können nur zukünftige, vergleichende Analysen zeigen. Zumindest muß die Möglichkeit der Überlegenheit eines Systems freier Kooperation in die spieltheoretischen Überlegungen einbezogen werden.
KAPITEL 4; DEGRADATIONSSPIELE UND EIN DILEMMA DER TEAMPRODUKTION In der Diskussion zum n-Personen-Gefangenendilemma hatte sich herausgestellt, daß eine Erklärung des Entstehens von Kooperation unter rationalen Egoisten weit schwerer fällt, als in einem Zwei-Personen Modell. Die Probleme der Kooperation einer großen Zahl von Akteuren werden nun im Mittelpunkt weiterer Überlegungen stehen. Die bislang negativ beantwortete Frage nach der Möglichkeit dezentraler und freiwilliger Kooperation wird allerdings nicht mehr aufgegriffen. Stattdessen wird versucht, ein einfacheres, aber spieltheoretisch noch nicht analysiertes Problem zu lösen. Die Arbeiten von Bendor und Mookherjee (1987), sowie Hirshleifer (1988) zeigen, daß egoistische Kooperation entstehen kann, wenn Akteure aus einer Gruppe ausgeschlossen werden können, und wenn eine Zentralinstanz die Ausschlußentscheidung handhabt. Damit findet die Hobbessche Lösung des Ordnungsproblems eine Bestätigung. Der Leviathan, ein mächtiger Schutzbund zur Sicherung des inneren Friedens, kann Egoisten dauerhaft zur Kooperation bewegen, indem er sie mit Ausschluß von der Schutzleistung bedroht. Auf diese Weise kann die Entwicklung politischer Zentralgewalten begonnen haben. Das Argument läßt sich jedoch auch auf verschiedene Arten von Teams, auf Versicherungen und viele freiwilligen Partnerschaften ausdehnen. Für die Modellierung von Teamdilemmas bei kollektiven (aber nicht öffentlichen) Gütern, soll nun noch ein anderer normativistischer Einwand berücksichtigt werden. Normativistische Ansätze bestreiten nicht, daß rationale Akteure kooperieren, wenn sie im Falle der Defektion erwarten, entdeckt und bestraft zu werden. Ein Problem egoistischer Kooperation entsteht nur deshalb, weil Egoisten im Verborgenen und ohne besondere Anreize immer unkooperativ handeln. Eine lückenlose Überwachung aller Akteure ist jedoch entweder nicht möglich, oder in einer freiheitlichen Gesellschaft moralisch nicht zu vertreten. Zumindest eine nicht-totalitäre Gesellschaft setzt deshalb aus normativistischer Sicht die moralische Einbindung der Individuen und ein gewisses Maß an Bürgertugend und Arbeitsethos voraus. Diesem Argument widersprechen Bendor und Mookherjee, wenn sie zeigen, daß auch bei hinreichend großer, aber nicht an Sicherheit grenzender Wahrscheinlichkeit der Entdeckung von Defekteu-
4. Degradationsspiele und ein Dilemma der Teamproduktion
97
ren ein amoralisches Auschlußsystem funktionstüchtig sein kann (vgl. Kapitel 2). Im Gegenzug könnten Normativisten fordern, daß diese Wahrscheinlichkeit mit dem Ausmaß der Defektion variiert, und daß das unkooperative Verhalten eines Akteurs von den Kontrollinstanzen nur wahrgenommen werden kann, wenn es bestimmte Schwellenwerte der Defektion überschreitet. Da jeder rationale Egoist seinen Leistungsbeitrag ungestraft maximal um diesen Schwellenwert absenken wird, verfällt dann langsam die soziale Kooperation. Ein solcher Einwand erinnert an Piatons (1958: 246ff.) Vorgehen im 8. Buch der "Politeia", wo er jeder Staatsform einen bestimmten Menschentypus zuordnet (vgl. auch Weber-Schäfer 1976, Bd. II: 18). Sobald die moralischen Bindungen im Individuum nachlassen, zerbricht allmählich die bürgerliche Ordnung, und der Staat endet schließlich in der Herrschaft der Tyrannis. Das letzte Modell der Arbeit untersucht diese normativistische Schwellenwertthese mit spieltheoretischen Mitteln. Es wird zunächst nach strategischen Strukturen gefragt, in denen ein allmählicher Verfall egoistischer Kooperation auftritt. Das normale n-Personen-Gefangenendilemma eignet sich nicht für diese Aufgabe. In einem endlich oft iterierten Gefangenendilemma mit bekannter Länge läßt sich dagegen bei evolutionärer Betrachtung ein schrittweiser Niedergang der Kooperation feststellen. Deshalb werden die strategischen Eigenschaften dieses Spieles zunächst genauer analysiert. Sie werden als Grundlage für die Konstruktion eines allgemeineren Spieltyps - des Degradationsspiels - genommen, in dem im evolutionären Modell die Kooperation egoistischer Akteure allmählich zerfällt oder zyklisch variiert. Im Unterschied zum endlich oft iterierten Gefangenendilemma können Degradationsspiele mit der Schwellenwertproblematik der Überwachung von Teamleistungen verbunden werden. Der zweite Abschnitt des vorliegenden Kapitels reformuliert das Problem des Leistungsbeitrages zur Produktion kollektiver Güter als Degradationsdilemma. In diesem Dilemma kann eine Zentralinstanz unkooperative Akteure vom Konsum eines kollektiven Gutes ausschließen. Die Zentralinstanz verfügt aber nur über unvollständige Überwachungsmöglichkeiten. Zum einen existiert ein Schwellenwert für die Überwachung von Defekteuren, wobei Akteure, die mit ihrer Defektion unter diesem Schwellenwert bleiben, nicht bestraft werden können. Zum anderen werden auch weitergehende Defektionen nur mit einer bestimmten Wahrscheinlichkeit entdeckt, die linear mit dem
98
4. Degradationsspiele und ein Dilemma der Teamproduktion
Ausmaß der Defektion ansteigt. Das Modell wird natürlich nicht alle Aspekte des normativistischen Argumentes erfassen. Es sollte aber zur Ergänzung und Erweiterung der existierenden, spieltheoretischen Erkenntnisse beitragen können. Zu diesem Zweck wurden einige Computersimulationen mit dem Degradationsdilemma durchgeführt.
4.1. Finîtes Gefangenendilemma und Degradationsspiel Schon früh in der Geschichte der Spieltheorie wurde erkannt, daß die rationale Strategiewahl in einem iterierten Gefangenendilemma, bei dem die genaue Zahl der zu spielenden Runden den Akteuren im voraus bekannt ist (= finîtes PD-Superspiel), Besonderheiten aufweist (vgl. Luce/Raiffa 1957: 98)^. Aus Gründen der Einfachheit wird sich die Darstellung dieser Rationalitätsprobleme auf den Zwei-Personen-Fall beschränken, obwohl sie sich direkt auf die Situation im n-Personen-Spiel übertragen läßt. Ein finîtes Superspiel des Gefangenendilemmas unterscheidet sich in strategischer Hinsicht grundlegend von einem nicht finiten, also unbestimmt oder unendlich oft iterierten Superspiel. Die Spieler wissen, daß ein bestimmtes Spiel mit Sicherheit die letzte Runde ihrer Interaktion darstellt, daß sie nicht wieder interagieren werden, und daß der Superspielpartner nach dieser Runde nicht mehr über die Möglichkeit verfügt, sie zu sanktionieren. Rationale Akteure verhalten sich in der letzten Runde deshalb wie im einfachen Spiel und wählen die dominante D-Strategie. Nun läßt sich dieses Argument jedoch in einer Art Dominoeffekt oder rückwärtslaufender Induktion fortsetzen. Sofern beide Akteure im letzten Spiel ohnehin D wählen, kann ein ausgebeuteter Kooperateur im vorletzten Spiel nicht mehr mit Vergeltung drohen. Unter rationalen Spielern sollte daher auch das vorletzte Spiel in beidseitiger Defektion enden. Dann existieren jedoch keine Sanktionsmöglichkeiten in der drittletzten Runde mehr, und auch in diesem Spiel erscheint einzig eine rein unkooperative Lösung rational. Luce und Raiffa (1957: 98) zeigen, daß sich dieses Kalkül bis zum ersten Spiel fortpflanzen läßt, und daß durchgängige Defektion die einzige (Nash-) Gleichgewichtsstrategie im finiten PDSuperspiel bildet. Einen formalen Beweis für die Gültigkeit dieser Aus-
4.1. Finîtes Gefangenendilemma
und
Degradationsspiel
99
sage liefert Friedman (1986: 95). Sie steht in deutlichem Gegensatz zur Tatsache, daß in einem nicht-finiten PD-Superspiel kooperative Gleichgewichte vorhanden sein können. Trotz des formalen Nachweises ihrer Gleichgewichtseigenschaften erscheint die Rationalität der beschriebenen Lösung bezweifelbar. Das Kalkül der rückwärtslaufenden Induktion ist nur dann über jede Problematisierung erhaben, wenn strategisches Denken mit einer eng verstandenen Gleichgewichtsrationaliät identifiziert wird. Diese These läßt sich am besten an einem extremen und sehr augenfälligen Beispiel erläutern. Angenommen zwei Akteure spielen ein finites Gefangenendilemma über 100 Runden mit der Matrix (Auszahlungen in DM): C
D
C
1.000.000,
1.000.000
0,
D
1.000.001,
0
1,1
1.000.001
Entsprechend der Logik von Luce und Raiffa wäre es einzig rational, die Interaktion mit der hundertfachen, rein defektiven Auszahlung, also mit 100 DM, zu beenden. Hätten die Spieler aber bis zum Ende spieltheoretisch "unvernünftig" gehandelt, hätten sie hundert Millionen DM erhalten. Insofern scheint die Situation einem einfachen Gefangenendilemma zu gleichen. Das ist jedoch nicht der Fall, denn die iterative Struktur der Interaktion bietet den Spielern Möglichkeiten für reaktives Verhalten. Jeder kann sich überlegen, ob er nicht längere Zeit kooperativ spielen will, um erst in den letzten Runden nach den unwesentlichen Defektionsgewinnen zu trachten. Das mit einem kooperativen Eröffnungszug verbundene Risiko bleibt überdies sehr klein. Wenn ein Partner von Beginn an defektiert, verliert der Geschädigte durch einen Kooperationsversuch nur eine Mark. Er gewinnt dagegen eine Million, falls der Partner auch nur im ersten Spiel kooperiert. Das extreme Beispiel eines finiten-PD-Superspieles offenbart die Schwächen der rückwärtslaufenden Induktion. Sie führt zwar zu einem eindeutigen Gleichgewicht, verliert aber dabei den Sinn des gesamten strategischen Kalküls aus den Augen, den Erfolg in Termini von Spielauszahlun-
100
4. Degradationsspiele und ein Dilemma der Teamproduktion
gen. Reinhard Selten (1978: 133), der sich intensiv mit der Problematik finiter PD-Superspiele befaßt hat, schreibt: "Meine Erfahrung legt nahe, daß mathematisch ausgebildete Personen die logische Gültigkeit des Induktionsargumentes erkennen, aber daß sie es als Maßstab für praktisches Verhalten nicht annehmen würden." Es ist genau dieser Widerspruch zwischen spieltheoretischer Rationalität und erfolgreichem Verhalten, der eine nähere Beschäftigung mit der Struktur des finiten Gefangenendilemmas rechtfertigt. Im folgenden wird jedoch die Suche nach erfolgreichen Verhaltensstrategien ein größere Rolle spielen, als eine geeignete Veränderung des Gleichgewichtsbegriffes (vgl. Kreps et al. 1982; Kreps/Wilson 1982a), die gegenwärtig im Mittelpunkt des spieltheoretischen Interesses steht. Die Problematik rationalen Verhaltens in einem finiten PD-Superspiel läßt sich auch mit Hilfe der Matrix der Superspielauszahlungen darstellen. Dabei gehen wesentliche Aspekte des (extensiven) Spieles verloren, die aus der Abfolge der Züge entstehen^. Aufgrund der evolutionären Ausrichtung der weiteren Untersuchungen, kann jedoch auf diese Information verzichtet werden. Ein Übergang zur evolutionären Betrachtung wird unter anderem sinnvoll, weil die Kooperation rationaler Akteure sprunghaft zusammenbrechen müßte. Jeder rationale Akteur würde versuchen, den anderen in Erwartung des Zusammenbruchs der Kooperation mit seiner Defektion zuvor zu kommen, um nicht zu den letzten, ausgebeuteten Kooperateuren zu gehören. Ein völlig spontaner Kooperationsverfall erscheint aber nicht realistisch. Zunächst wird ein Superspiel von 200 Runden Dauer, auf der Basis eines Gefangenendilemmas mit y = 5, x = 3, w = 1, z = 0 untersucht. Die Auszahlungssumme wird nicht abdiskontierp, und den Spielern steht nur ein besonderer Typ von Superstrategien zur Verfügung. Sie können durchgängig kooperieren, oder ab dem (200-n)-ten Spiel defektieren. Der Parameter n kann natürlich maximal den Wert 200 annehmen, was gleichbedeutend mit der Wahl der Strategie ALL D wäre, die immer defektiert. Alle anderen Strategien sind Varianten eines bedingt kooperativen Verhaltenstyps. Sie beantworten eine unprovozierte Defektion des Gegenübers mit vergeltenden Defektionen in allen folgenden, gemeinsamen Spielen. In Anlehnung an Axelrod (1987: 32) wird eine voll kooperative
4.1. Finites Gefangenendilemma und Degradationsspiel
101
Strategie mit dieser Eigenschaft FRIEDMAN bzw. F genannt^, während ihre Varianten En über die Zahl n der "Endspiele", in denen sie defektieren, charakterisiert werden. Dies führt schließlich zur Superspielmatrix M3 des finiten Gefangenendilemmas: F
E1
E2
E3
F
600
597
595
593
591
599-2n
199
E1
602
598
595
593
591
599-2n
199
E2
600
600
596
593
591
599-2n
199
E3
598
598
598
594
591
599-2n
199
E4
596
596
596
596
592
599-2n
199
En
600-2(n-2)
600-2n
199
ALL D
204
204
E4 . . . En . . .
204
ALL D
200
Aus Matrix M3 läßt sich direkt ersehen, weshalb die Wahl einer rationalen Strategie im finiten PD-Superspiel noch schwieriger ist, als im einfachen Gefangenendilemma. Reihe 1 von M3 (= F) wird von Reihe 2 (= E l ) dominiert (keine Auszahlung für E l ist kleiner, aber mindestens eine größer als für F; vgl. dazu Luce/Raiffa 1957: 77). F bzw. die erste Reihe und Spalte von M3 könnte nun ersatzlos aus dem Feld der Strategien gestrichen werden, da E l ohnehin immer gegenüber F vorzuziehen wäre. Nach dieser Streichung wird E l aber in der verkleinerten Matrix M3 wiederum von E2 dominiert. E l kann eliminiert werden, doch das führt nur dazu, daß E3 jetzt E2 dominiert. Analog zum Argument der rückwärtslaufenden Induktion kann der Prozeß der Elimination und Domination bis zu ALL D fortgesetzt werden. Nur diese Strategie wird von
102
4. Degradationsspiele
und ein Dilemma der
Teamproduktion
keiner anderen dominiert, und sie erscheint dem beschriebenen spieltheoretischen Kalkül daher als einzige rationale Wahl in Matrix M3. Im Unterschied zum einfachen Gefangenendilemma stellt ALL D jedoch keine dominante Strategie für die Gesamtmatrix des Spieles dar. Allein in der Interaktion mit sich selbst kann ALL D eine höhere Auszahlung erreichen als F, während sie im Vergleich mit allen anderen Strategien schlechter abschneidet. ALL D ist auch keine beste Antwort^ auf die Strategie F. Insofern existiert ein wesentlich stärkerer Grund, im Gefangenendilemma D zu spielen, als im finiten PD-Superspiel dem Argument der rückwärtslaufenden Induktion zu folgen. Letzlich gibt es keine vernünftige "rationale Verhaltensvorschrift" für ein Spiel mit Matrix M3. Es läßt sich nachweisen, daß für jede Wahl einer Strategie En, eine bessere Wahl E(n+1) existiert, wenn En nicht identisch mit ALL D ist. Andererseits erscheint ALL D als schlechte Antwort auf die überwiegende Zahl von Strategien. Welche Strategie ein kluger Akteur ohne spieltheoretische Scheuklappen wählen sollte, bleibt daher unbestimmt. Ausgehend von Matrix M3 kann die allgemeine Struktur eines Degradationsspieles definiert werden. Dabei liefern die soeben diskutierten strategischen Eigenschaften des finiten Gefangenendilemmas die Maßgabe für die Konstruktion von Degradationsmatrizen. In einem Degradationsspiel muß der beschriebene Prozeß der Elimination und Domination schrittweise alle Strategien bis auf eine aussondern. Ein Spiel in Normalform wird durch die Zahl der Spieler m, die Menge der reinen Strategien S = {S1
Sn} (hier für alle Spieler gleich) und die Auszahlungsfunktion A
definiert. Diese Funktion wird durch Aj(s) für jeden Spieler i in Situation s gegeben, wobei s eine realisierte Strategiekombination s E X m S, und X m S das m-fache cartesische Produkt von S ist. Nun sei zunächst die Dominanzrelation S x dorn Sy, Strategie S x dominiert Strategie Sy, definiert: S x dorn Sy gdw.: (8) Für alle s E X m S:
A;(S y s) < Aj(S x s), und
m
es gibt ein s e X S: Aj(S y s) < Aj(S x s ) . S
sei die Klasse aller Degradationsspiele. Weiterhin gilt durch n Konvention s=s( ) , mit n als der endlichen Zahl der reinen Strategien in S.
Allgemein
soll
S( k )
eine
bestimmte,
aus
S
hervorgehende
Strategienmenge mit k reinen Strategien sein. Ein Spiel ist ein (reines)
4.1. Finîtes Gefangenendilemma und Degradationsspiel
103
Degradationspiel genau dann, wenn für alle Strategien bzw. die Strategiemenge gilt: (9) S e S*, gdw. für alle k e {2,
n} gilt
S(k> e S*, wobei gilt: a) Für alle Sy, S^, e s( k ), es gibt S x , Sk> e s( k ): S x dorn S k >, und aus Sy dorn S w folgt Sy=S x und S w =S k >, und b) s( k " 1 ) = s ( k ) \ s k . , (mit als Mengensubtraktion). Die Definition eines reinen Degradationsspieles legt fest, daß in einer Degradationsmatrix immer nur eine einzige Strategie von einer einzigen anderen dominiert wird. Streicht man diese Strategie aus der Degradationsmatrix, so entsteht wieder eine Degradationsmatrix, sofern noch mehr als eine Strategie in der Strategiemenge übrig ist. Die Matrix M3 des finiten PD-Superspieles ist keine reine Degradationsmatrix, da in ihr F gleich von zwei Strategien - El und E2 - dominiert wird. Die Ähnlichkeiten zu einer Degradationsmatrix sind aber groß genug, daß das Muster der schrittweisen, rückwärtslaufenden Elimination von Strategien erhalten bleibt. Ein finîtes Gefangenendilemma stellt daher ein Degradationsspiel im weiteren Sinne bzw. ein "schwaches" Degradationsspiel dar. Trotzdem sind die strategischen Eigenschaften und die Probleme des Kalküls der Elimination und der Dominanzbetrachtung in einer reinen Degradationsmatrix am stärksten ausgeprägt. Ein anwendungsorientiertes Beispiel eines schwachen Degradationsspieles, das kein finîtes Gefangenendilemma ist, wird weiter unten diskutiert. Hier sollen zunächst kurz die strategischen Eigenschaften eines bestimmten Degradationsspiels, und einige seiner verallgemeinerbaren, evolutionären Merkmale untersucht werden. Hinzuweisen ist auf das Versagen der traditionellen, spieltheoretischen Rationalitätskonzepte in diesem Kontext. Es schafft besonders viel Raum für eine evolutionäre Betrachtung, die auf die Vorausbestimmung einer optimalen Verhaltensregel verzichtet, und darauf achtet, welche Strategien sich im Spielverlauf als erfolgreich erweisen. Dabei wird im allgemeinsten Fall nur unterstellt, daß die Verbreitung einer Strategie monoton mit ihrem relativen Auszahlungserfolg variiert.
104
4. Degradationsspiele
und ein Dilemma der
Teamproduktion
4.1.1. Die evolutionäre Stabilität von Degradationsspielen In der traditionellen spieltheoretischen Betrachtung des finiten Gefangenendilemmas existiert genau eine - maximal defektive - Strategie, die ein rationaler Akteur wählen würde. Diese Strategie führt, sofern sie von allen gespielt wird, zu einem (Nash-) Gleichgewicht, von dem abzuweichen sich nicht lohnt. Wechselt man den Blickwinkel und geht zu einer evolutionären Betrachtung über, so muß zunächst nach einem Konzept gesucht werden, das diese strategische Eigenschaft in einem evolutionären Rahmen repräsentiert. Geeignet erscheint vor allem eine Analyse der evolutionären Stabilität von Degradationsspielen, in Anlehnung an die zentrale Stellung dieses Konzeptes in der spieltheoretischen Biologie. Vereinfacht gesprochen, ist eine Population von Strategien dann evolutionär stabil, wenn einzelne andere Strategien, die in diese Population eingebracht werden, sich dort nicht vermehren können. Im übertragenen Sinne wird dadurch wieder die Idee des spieltheoretischen Gleichgewichtes eingeführt. Eine Abweichung von einer einmal etablierten Gleichgewichtsstrategie darf sich nicht auszahlen. Das Konzept der evolutionär stabilen Strategie (ESS) stammt von Maynard Smith (1974). Hier wird die Formulierung von Hofbauer und Sigmund zitiert, aus der der Zusammenhang von Gleichgewichtseigenschaft und evolutionärer Stabilität besonders klar hervorgeht^. A sei die Auszahlungsmatrix eines beliebigen Spieles und S n die Strategiemenge: " Man sagt nun, daß eine Bevölkerung p im Gleichgewicht ist, wenn keine andere Bevölkerung y besser gegen p abschneiden kann als p selbst, also wenn y.Ap i p.Ap
(23.2)
für alle y e S n gilt." (Hofbauer/Sigmund 1984: 162) "Die Strategie p t S n läßt sich als 'evolutionstabile Strategie' ansehen, wenn die beiden folgenden Bedingungen erfüllt sind: (a) (Gleichgewichtsbedingung) p ist beste Antwort auf sich selbst, d.h.
4.1. Finîtes Gefangenendilemma und Degradatiomspiel
y.Ap i p.Ap
105
für alle y e S n
(das entspricht gerade (23.2)), und (b) (Stabilitätsbedingung) Wenn y =j= p eine weitere beste Antwort auf y ist, also in (23.2) das Gleichheitszeichen gilt, dann ist p eine bessere Antwort auf y, als y selbst: p.Ay > y.Ay" (Hofbauer/Sigmund 1984: 164) Gegenüber dem üblichen Gleichgewichtsbegriff kommt in der ESS-Definition noch die Bedingung (b) hinzu (was Axelrod (1987) übersieht, und was bei ihm zu mindestens problematischen Stabilitätsbetrachtungen fuhrt), die sicherstellt, daß p dem Konkurrenten y nicht nur ebenbürtig, sondern überlegen ist. Wenn Bedingung (b) nicht gilt, dafür aber das Gleichheitszeichen in (a), ist eine Population von p aufgrund von Zufallsdrift instabil, und Konkurrenten des Typs y können vordringen. Im Falle eines finiten PD-Superspieles mit Matrix M3 erweist sich eine Population von ALL D-Strategien als evolutionär stabil. Für sie ist bereits Bedingung (a) im starken Sinne erfüllt, da ALL D im Spiel mit sich selbst immer eine höhere Auszahlung (Wert: 200) erhält, als jede andere Strategie, die mit ALL D interagiert (Wert: 199). Aus einer allgemeinen Analyse des 200-Runden-Superspieles für alle finiten Gefangenendilemmamatrizen (vgl. Schüßler 1989) wird ersichtlich, daß dieser Sachverhalt für jedes beliebige finite Gefangenendilemma gilt. Da sonst keine weiteren Gleichgewichte im gesamten Superspiel existieren, werden kooperative Strategien auch bei evolutionärer Betrachtung sukzessiv eliminiert. Die Evolution von Strategienpopulationen wird dazu führen, daß ALL D alle anderen Strategien aus der Gesamtpopulation verdrängt, wobei eine reine ALL D-Population gegen eine spätere Reinvasion durch die unterlegenen Konkurrenten gefeit ist. Es dürfte von Interesse sein, daß dieses Ergebnis für Degradationsspiele in voller Allgemeinheit nicht gilt. In Degradationsspielen muß die Strategie, die von keiner anderen dominiert wird, und die ALL D im finiten Gefangenendilemma entspricht, nicht evolutionär stabil sein. Das sei nun anhand eines Beispiels demonstriert. Entsprechend der oben eingeführten Definition, besitzt Matrix M4 die Struktur eines Degradationsspieles:
106
4. Degradationsspiele und ein Dilemma der Teamproduktion
S1
S2
S3
S4
S1 S2 S3
1
S4
Strategie S1 wird von S2 dominiert. Nach Elimination von S1 dominiert S3 die Strategie S2. S4 ist die einzige Strategie, die in diesem Prozeß undominiert bleibt; zugleich ist S4 ein (schwaches) Gleichgewicht. Insofern werden die strategischen Eigenschaften des finiten Gefangenendilemmas von Matrix M4 repliziert. Allerdings stellt S4 keine ESS dar, denn Bedingung (a) wird zwar erfüllt, aber nicht Bedingung (b). S4, in der Rolle von p, erzielt mit sich selbst die gleiche Auszahlung wie mit Sl, das die Rolle von y übernimmt, und deshalb müßte Bedingung (b) gelten. Im Gegensatz zu (b) gewinnt jedoch Sl gegen sich selbst weit mehr als S4 gegen Sl. Das heißt, daß in einer reinen S4-Population Invasoren des Typs Sl sich gut vermehren und S4 nach und nach verdrängen könnten. Ein allzu starkes Anwachsen von S l ist jedoch nicht zu erwarten, denn in diesem Fall würden sich auch ihre Konkurrenten S2 wieder vermehren und Sl dezimieren. Da Matrix M4 ein Spiel ohne starkes Gleichgewicht und (was direkt daraus folgt) ohne ESS definiert, ist mit zyklischen Veränderungen der einzelnen Strategienpopulationen zu rechnen. Die zyklische Dynamik dieses Degradationsspieles wird im nächsten Abschnitt genauer betrachtet. In Verbindung mit dieser Betrachtung erfolgt eine einfache Einführung in die dynamische Analyse, wie sie im Rahmen der evolutionären Spieltheorie in der Biologie entwickelt wurde. Bereits jetzt läßt sich festhalten, daß der Übergang vom finiten PD-Superspiel zu beliebigen Degradationsspielen in der evolutionären Perspektive das Kalkül der rückwärtslaufenden Induktion weiter schwächt. Das urprüngliche Argument von Luce und Raiffa bleibt hiervon unberührt, soweit es sich nur auf die Analyse von Zügen in einem Spiel in extensiver Form bezieht, weil dabei die Folge der Züge im Superspiel eine entschei-
4.1. Finîtes Gefangenendilemma und Degradationsspiel
107
dende Rolle spielt. Die extensive Betrachtung spielt aber in der evolutionären Modellierung keine Rolle, bei der die Strategien nicht rational vorausblicken. Angesichts der Problematik der spieltheoretischen Rationalität in Degradationsspielen erscheint ohnehin fraglich, ob die rationale Vorausschau die evolutionären Überlebenschancen der Strategien wesentlich erhöhen würde.
4.1.2. Eine dynamische Analyse eines Degradationsspieles Zur dynamischen Analyse der Evolution von Verhaltensstrategien hat sich in der theoretischen Biologie ein bestimmtes System von Differentialgleichungen durchgesetzt (vgl. Taylor/Jonker 1978). Diese "spieldynamischen Differentialgleichungen" sind nicht-linear (kubisch) n
und können zu sehr komplexen (z.B. chaotischen) Dynamiken führen'. Dennoch sind sie mathematisch gut analysiert, und es empfielt sich aus diesem Grund, auch in verschiedenen außerbiologischen Forschungsbereichen an sie anzuknüpfen. Dem Einwand, daß sich die Verhältnisse in der Biologie nicht auf die Sozialwissenschaften übertragen lassen, kann dabei ohne größere Schwierigkeiten Rechung getragen werden. Im Gegensatz zur Biologie sind die Gesetzmäßigkeiten sozialer Evolutionsprozesse weitgehend unbekannt. Der Begriff Evolution wird oft metaphorisch für unterschiedlichste Veränderungsprozesse in Gesellschaften gebraucht, und oft steht er für langfristige Entwicklungen sozialer Systeme, wie zunehmende Differenzierung und wachsende Komplexität^. Giesen und Lau (1981: 229) kritisieren die vorherrschenden, evolutionären Modelle, die soziale Entwicklungen nur generell beschreiben. Sie versuchen, die Grundlagen eines Evolutionsprozesses der Selektion und des Überlebens sozialer Institutionen zu skizzieren. Dabei bleiben Giesen und Lau jedoch noch weit von einem Entwurf einer Selektions- und Propagationsdynamik entfernt. Es bereitet wenig Schwierigkeiten, den Strategiebegriff der evolutionären Spieltheorie auch im Sinne institutionalisierter Handlungsnormen zu verstehen. Deshalb kann die evolutionäre Spieltheorie an die theoretischen Vorgaben einer darwinistischen, soziologischen Evolutionstheorie anknüpfen und die fehlende Evolutionsdynamik ergänzen. Es bietet sich an, in einem ersten Schritt eine einfache Dynamik anzuset-
108
4. Degradationsspiele
und ein Dilemma der
Teamproduktion
zen, zumal das mangelnde empirische Wissen über die Dynamik sozialer Evolutionsprozesse Modellüberlegungen keine Grenzen setzt. Auf diese Weise erhält man erste Erkenntnisse über die Evolution von Strategien, deren Robustheit später durch eine Variation der Evolutionsdynamiken noch weiter untersucht werden kann. Diese Überlegung spricht für eine Übernahme der spieldynamischen Evolutionsgleichungen aus der Biologie. Die Grundidee dieser Gleichungen ist einfach, und doch sind sie aufgrund ihrer Nichtlinearität flexibel genug, auch komplizierte Prozeßverläufe repräsentieren zu können. Ihre mathematische Struktur impliziert im übrigen keinen notwendigen Bezug zur Genetik. Eine genetische Verankerung und Vermehrung oder eine Ausbreitung von Strategien über Lern- und Diffusionsprozesse bilden alternative Interpretationen, die zumindest näherungsweise mit der unterstellten Spieldynamik verbunden werden können. Spieldynamische Differentialgleichungen stellen folgenden Zusammenhang her: Wachstumsrate von Strategie i in Runde x = Durchschnittsauszahlung von i beim Spiel gegen alle anderen Strategien in Runde x Durchschnittsauszahlung aller Strategien in Runde x. Es wird aus Gründen der Einfachheit angenommen, daß der Populationsanteil von Strategien proportional zu ihrem Erfolg wächst oder schrumpft. Dabei dient als Maßstab nicht ein absolutes Kriterium des Erfolges, sondern der Erfolg relativ zu den Konkurrenzstrategien. Im gleichen Maße, in dem eine Strategie besser abschneidet als der Durchschnitt der Konkurrenten, verbreitet sie sich, und je schlechter sie sich im Vergleich zum Durchschnitt erweist, desto schneller stirbt sie aus. Der Proportionalitätsfaktor für diesen Prozeß wird üblicherweise gleich eins gesetzt, wobei andere Faktoren den Ablauf des Evolutionsprozesses nur beschleunigen oder verlangsamen, aber nicht substantiell verändern würden. In der mathematischen Formulierung führt dieser proportional-lineare Ansatz zu einem System nicht-linearer Differentialgleichungen für die Strategien i e {1, n}: (10) dpj/dt = Pj((A p)j • p A p).
4.1. Finîtes Gefangenendilemma und Degradationsspiel
109
In Gleichung (10) wurde der Populationsanteil p; der Strategie i auf die rechte Seite gebracht. Damit wird von einer Betrachtung der Wachstumsrate zur Untersuchung der Populationsveränderung mit der Zeit übergegangen. Die Terme in der Klammer repräsentieren die Durchschnittspayoffs von i, gemittelt über alle Strategien bei einer gegebenen Auszahlungsmatrix A, und die allgemeine Durchschnittsauszahlung. Anstelle von A wird nun die Degradationsmatrix M4 eingeführt, um die Dynamik des zugehörigen Degradationsspiels mit Hilfe des Gleichungssystems (10) darzustellen. Das vierdimensionale Modell kann analytisch mit Techniken zur qualitativen Analyse von Differentialgleichungen untersucht werden (vgl. Arrowsmith/Place 1982). Es werden methodische Vereinfachungen benutzt, die Zeeman (1980, 1981) für spieldynamische Gleichungen dargestellt hat. Das mathematische Vorgehen wird für das finite PD-Superspiel hier nicht aufgezeigt, kann aber anhand von Schüßler (1989) nachvollzogen werden. Nur Angaben, die für das Verständnis der Ergebnisse von Bedeutung sind, seien hiervon ausgenommen. Die qualitative Dynamik von Gleichung (10) mit Matrix M4 wird durch Trajektorien in Strategiensimplices dargestellt. Ein Strategiensimplex für M4 repräsentiert den Möglichkeitsraum für Verteilungen von Populationsanteilen der vier Strategien und hat die Form eines Tetraeders. Die Ecken des Tetraeders stellen Zustände dar, in denen die gesamte Population nur aus einer einzigen Strategie besteht. Aus diesem Grund tragen die Ecken auch den Namen jeweils einer Strategie. Die Punkte auf den Kanten zwischen zwei Ecken stehen für Anteilsverteilungen, bei denen die zwei Strategien in der Population vorhanden sind, die den Ecken entsprechen, während die zwei anderen fehlen. Die Nähe zu einer Ecke zeigt immer ein Übergewicht der Strategie an, die der Ecke zugehörig ist. In gleicher Weise drücken Punkte auf den Seitenflächen des Tetraeders Anteilsverhältnisse zwischen drei Strategien in Abwesenheit der vierten aus, und Punkte im Inneren entsprechen Verteilungen, bei denen alle Strategien in der Population vorhanden sind.
110
4. Degradationsspiele und ein Dilemma der Teamproduktion
BILD 7: Simplex für vier Strategien
Ein Strategiensimplex liefert nur das Gerüst für die Trajektorien der Strategienentwicklung. Trajektorien, also Entwicklungsbahnen, ergeben sich, weil die meisten Verteilungen von Strategienanteilen an der Gesamtpopulation nicht stabil sind, sondern sich mit der Zeit entsprechend Gleichung (10) verändern. Die Entwicklungsrichtung der Trajektorien wird durch Pfeile dargestellt. Von besonderer Bedeutung für die qualitative Analyse von dynamischen Systemen ist ihre Fixpunktstruktur. Fixpunkte sind Orte im Simplex, an denen sich das System in (labiler oder stabiler) Ruhe befindet. Folgende Typen von Fixpunkten können in zwei Dimensionen auftreten (vgl. Arrowsmith/Place 1982: 58):
4.1. Finîtes Gefangenendilemma und Degradationsspiel
111
BILD 8 Attraktor
Sattel
Repellor
Zentrum
Im R a h m e n der qualitativen Analyse wird zunächst Existenz, Ort und Typ von Fixpunkten festgestellt und in den Strategiensimplex eingezeichnet. Danach lassen sich die Trajektorien auf den Kanten des Simplex leicht bestimmen. Schließlich werden die Trajektorien im Innern und auf den Seiten des Simplex auf geeignete Weise eingefügt, so daß sie mit den Kantentrajektorien und mit dem Typus der Fixpunkte kompatibel sind, auf die sie zu, oder von denen sie weg laufen^. Nachdem diese Analyseschritte vollzogen sind, ist die qualitative Dynamik eines Systems durch die Zahl und den Typus der Fixpunkte und die Richtung der Trajektorien eindeutig bestimmt. Über die Richtung hinaus, kann jedoch der genaue Verlauf der Trajektorien auf diese Weise (quantitativ) nicht errechnet werden. Quantitative Analysen sind in der Regel nur numerisch auf dem Computer durchführbar. Die visuelle Darstellung der Trajektorien muß schließlich auf eine dreidimensionale Tetraederrepräsentation verzichten, die zu unübersichtlich erscheint. Sofern im Innern des Strategiensimplex kein Fixpunkt existiert, reicht es für die Untersuchung der Trajektorien aus, nur die vier Seitenflächen zu b e t r a c h t e n ^ . Für Matrix M4 werden die Seitenflächen mit den Trajektorien nun in die Ebene aufgefaltet und abgebildet:
112
4. Degradationsspiele und ein Dilemma der Teamproduktion
BILD 9: Dynamik eines Degradationsspiels (M4)
Bild 9 zeigt, daß die vermutete, zyklische Dynamik des Systems von M4 tatsächlich eintritt. Da die Gesamtmatrix und alle 3x3- und 2x2-Submatrizen jeweils eine dominierte Strategie beinhalten, können im Innern, auf den Seiten und auf den Kanten des Simplex keine Fixpunkte existieren^. Das System erreicht nie einen Ruhezustand, und jede Strategie kann durch die geeignete Wahl von Konkurrenten geschlagen werden. Aus evolutionärer Sicht besitzt das Problem der strategischen Interaktion in einem Degradationsspiel mit Matrix M4 keine eindeutige, erfolgversprechende Lösung. Typischer für einen reinen Verfallsprozeß werden die Ergebnisse, wenn beispielsweise Matrix M5 der Analyse zugrundegelegt wird:
4.1. Finîtes Gefangenendilemma
SI S1
6
S2
8
S3
7
S4
6
S2
S3
und
Degradationsspiel
113
S4
Für dieses nicht reine Degradationsspiel ergibt sich die Dynamik von Bild 10:
BILD 10: Dynamik eines Degradationsspiels (M5) Si
S2.
SI
S3
S1
S2
Die Trajektorien der Strategiendynamik zeigen deutlich, daß in diesem Spiele ein irreversibler Kooperationsverfall eintritt. Alle Strategien werden durch Rivalen aus niedereren Reihen verdrängt, bis nur E3 übrig bleibt, das von niemandem mehr dezimiert werden kann. Der Pol E3 der
114
4. Degradationsspiele
und ein Dilemma der
Teamproduktion
Dynamik stellt einen Attraktor und eine ESS dar; von ihm führt kein durch Pfeile gekennzeichneter Fluß mehr weg. 4.2. Ein Dilemma der Gemeinschaftsproduktion eines kollektiven Gutes Für das finite PD-Superspiel wurde bislang nur ein begrenzter, ökonomischer Anwendungsbezug im Rahmen des Handelskettenparadoxes und des
"predatory
pricing"
gefunden
(vgl.
Kreps/Wilson
1982a,b;
Milgrom/Roberts 1982). Damit sind die Anwendungsoptionen von Degradationsspielen aber bei weitem noch nicht ausgeschöpft. Im folgenden wird ein Degradationsdilemma
der Gemeinschaftsproduktion
eines
kollektiven Gutes vorgestellt, das die allgemeine Bedeutung dieser Klasse strategischer Strukturen belegt. Das Degradationsdilemma setzt die Existenz einer Zentralgewalt voraus. Es ist so konzipiert, daß Defekteure nicht mit Sicherheit, sondern nur mit einer gewissen Wahrscheinlichkeit entdeckt und einer Bestrafung zugeführt werden können. Die Bestrafung besteht wie in den Modellen von Bendor und Mookherjee (1987) und Hirshleifer (1988) im Ausschluß aus der Gruppe, die das kollektive Gut erstellt und gemeinsam genießt. In den Untersuchungen zum Gefangenendilemma fehlen Analysen einer Schwellenwertproblematik der Entdeckung und Bestrafung von Defekteuren. Unter realistischen Prämissen wird nicht jede beliebig kleine Defektion von einer gemeinsamen Leistungsnorm Sanktionen hervorrufen, sondern nur eine hinreichend große Abweichung. Ein Individuum könnte sich daher straflos an der unteren Grenze einer Bandbreite von akzeptablen Leistungsbeiträgen orientieren. Sofern alle Individuen dieser Vorgabe folgen, sinkt das allgemeine Leistungsniveau aber kontinuierlich ab. Damit kehrt die Thematik des Verfalls der Kooperation auf einem zweiten, inhaltlichen Weg in die Modelldiskussion zurück. Die Einführung eines Schwellenwertes für die Reaktion auf Defektionen steht in direktem Bezug zum normativistischen Argument, daß normgerechtes Verhalten aufgrund der Furcht vor Sanktionen durch andere nicht ausreicht, um soziale Ordnung zu gewährleisten. Eine Gesellschaft bedarf demnach der Moralität der Individuen auch dort, wo diese nicht beobachtet werden kann, oder wo sie ohne Strafe unterlassen werden könnte. Sonst drohe der
4.2. Gemeinschaftsproduktion
eines kollektiven
Gutes
115
schleichende Niedergang der Kooperation. Das im folgenden untersuchte Modell egoistischer Kooperation eignet sich besser als das Gefangenendilemma, dieses Zusammenspiel von strategischen Problemen beobachtbarer und unbeobachtbarer Kooperationsverweigerung zu behandeln. Es zeigt sich, daß die Annahme eines Schwellenwertes für Sanktionsreaktionen und einer mit dem Ausmaß der Defektion wachsenden Ausschlußwahrscheinlichkeit auf einfache Weise zu einem Degradationsmodell führen.
4.2.1. Das Degradationsdilemma Im Degradationsdilemma wird von der gemeinsamen Produktion eines kollektiven Gutes durch eine größere Zahl von Akteuren ausgegangen. Bei diesem kollektiven Gut handelt es sich nicht um ein öffentliches Gut. Akteure, die einen zu geringen Beitrag leisten, können vom Konsum des Gutes ausgeschlossen werden. Das kollektiv erzeugte Gut wird zu gleichen Teilen auf die an der Erstellung beteiligten Individuen aufgeteilt oder gemeinsam konsumiert (insofern entsteht kein Allmendeproblem; vgl. dazu Hardin 1968). Man kann sich dieses Modell als Beschreibung der strategischen Interdependenz zwischen den Mitgliedern eines Teams oder zwischen Teilhabern an einem Unternehmen vergegenwärtigen. Eine Gruppe von Partnern erzielt zusammen einen Gewinn, der gleichmäßig unter ihnen verteilt wird. Dieser Gewinn kann auch als ideelles Gut, wie religiöse Gefühle in einer Sekte, verstanden werden. In diesem Fall würde das kollektive Gut nicht aufgeteilt, sondern gemeinsam konsumiert. Eine andere Interpretation könnte sich auf den Hobbesschen Leviathan als Schutzbund für den inneren Frieden beziehen. Im Modell existiert für jedes Individuum ein gleicher Sollbeitrag zur Gruppenleistung, der außerdem den maximalen Beitrag darstellt, den ein Akteur zu leisten bereit ist. Die Akteure verfügen über die Möglichkeit, in diskreten Schritten weniger als diesen Sollbeitrag einzubringen. Dabei laufen sie jedoch Gefahr, aus der Gruppe ausgeschlossen zu werden. Der Ausschluß erfolgt durch den Eingriff einer übergeordneten Kontrollinstanz. Die Kosten für die Ausübung der Kontrolle werden nicht explizit ins Modell eingeführt, sondern sind anteilig in den Kosten der Beitragsleistung enthalten. Das impliziert, daß auch Akteure ausgeschlossen werden,
116
4. Degradationsspiele
und ein Dilemma der
Teamproduktion
die einen angemessenen Beitrag zur Kontrolle der gemeinsamen Leistung verweigern. Für die Reaktion auf Minderbeiträge existiert ein Schwellenwert. Defektionen können nur entdeckt werden, wenn sie mehr als einen Schritt der Leistungsminderung unter einem Vergleichsbeitrag bleiben. Als Vergleichsbeiträge dienen alle in der Gruppe vorkommenden, höheren Beiträge, aber nur entsprechend der relativen Häufigkeit, mit der sie unter allen Beiträgen vorkommen. Ab dem zweiten Schritt der Minderung relativ zu einem Vergleichsbeitrag, wächst das Risiko, entdeckt zu werden linear. Eine Leistungsminderung um drei Schritte würde unter diesen Prämissen gegenüber dem Sollbeitrag deutlich auffallen, aber nur in dem Verhältnis, in dem dieser unter allen Beiträgen vertreten ist. Wenn niemand den vollen Sollbeitrag erbringt, verliert er seinen Kontrollwert. Wenn alle Akteure bis auf einen den Sollbeitrag leisten, wird der Abweichler leicht erkannt. Eine Minderung dritter Stufe wird dagegen um so unwahrscheinlicher entdeckt, je mehr Akteure um einen oder zwei Schritte geminderte Beiträge leisten. Wenn alle bis auf einen ihren Beitrag um zwei Stufen mindern, wird der Defekteur mit Sicherheit nicht entdeckt, da er den Reaktionsschwellenwert nicht überschreitet. Das beschriebene Verfahren entspricht der Annahme, daß eine Kontrollinstanz nicht den idealen Sollbeitrag, sondern die realisierten Beiträge entsprechend der Häufigkeit ihres Auftretens als Kriterien der Leistungsbeurteilung heranzieht. Die evolutionäre Betrachtung ermöglicht es, auf die Annahme einer bestimmten Zahl von Akteuren zu verzichten. Es wird eine auf 1 normierte Gesamtpopulation von Spielern unterstellt. Die Untersuchung konzentriert sich vor allem auf Veränderungen in den relativen Anteilen von Strategienpopulationen. Im vorliegenden Fall entsprechen diese Strategien Einsatzniveaus mit i E [0,....,n] Schritten Leistungsminderung gegenüber dem Sollbeitrag. Als evolutionärer Mechanismus der Veränderung von Populationsanteilen wird wieder ein System spieldynamischer Differentialgleichungen (vgl. Gleichung (10)) gewählt. Gestützt auf diese Grundannahmen kann nun das formale Modell eingeführt werden. Es enthält n Strategien SO bis Sn-1, die ihr Einsatzniveau jeweils um i e [0,...,n-l] Schritte absenken. Die Wahrscheinlichkeit qj, daß eine defektierende Strategie Si entdeckt wird, errechnet sich aus dem
4.2. Gemeinschaftsproduktion
eines kollektiven
Gutes
117
Entdeckungsparameter c. Der Parameter c ist eine Wahrscheinlichkeit, aus der man zunächst wjj erhält, die mit dem Populationsanteil pj gewichtete Entdeckungswahrscheinlichkeit für Si relativ zur Vergleichsstrategie Sj: (11)
Wjj =
pj * (i-j-1) * c , für j < i 0 , sonst.
Nach (11) steigt das Risiko w^ linear mit dem Ausmaß der Leistungsminderung gegenüber der Vergleichsstrategie an, wobei eine Abweichung um nur einen Schritt nicht erkannt werden kann. Die Entdeckungswahrscheinlichkeit qj relativ zu allen Vergleichsstrategien muß über die Gegenwahrscheinlichkeiten berechnet werden: (12)
qi
= l-Tij-a-wij)
Sie ist die Gegenwahrscheinlichkeit zum Risiko, daß ein Defekteur i übersehen wird. Die Gemeinschaftsproduktion P an Einheiten des kollektiven Gutes läßt sich als Summe der mit den Populationsanteilen gewichteten Produktionsbeiträge Pj der Strategien Si verstehen: (13)
P = EPi'Pi.
Der größte Produktionsbeitrag wird auf 1 normiert und pro Stufe des Mindereinsatzes erzeugt eine Strategie einen um einen Produktionsparameter k geringeren Beitrag: (14)
Pj = 1 - i*k
Der Nutzen Uj für Si aus der gemeinsamen Produktion ist die gewichtete Summe der Nutzen Ujj, die Si aus den Produktionsbeiträgen Pj zieht: (15)
Uj = Ej P j • ujj .
Dabei bezeichnet Ujj den Saldo aus dem Gewinn durch den Produktionsbeitrag von Sj minus dem eigenen (Kosten)Einsatz Ej, unter der Bedin-
118
4. Degradationsspiele und ein Dilemma der Teamproduktion
gung, daß Si nicht als Defekteur ausgestoßen wird: (16)
Uy = (1 "
io co
Milli | 1
ri II
ä
>
M B
3 a
O
" « 2 «JT ^ ® W o v> 1I1i u "O
.2 03
'S >
O
fiiß © vT fS o
es
©
vT O ©
CA w" o
sa C5
ii o
r t / / /
T«
CSI w
«
w
OT
i ii i
1 11 1
N N N S
4.2. Gemeinschaftsproduktion
o
i-
V)
U)
CM W
CO
U)
v V)
in CO
IO
eines kollektiven Gutes
133
134
4. Degradationsspiele
und ein Dilemma der
Teamproduktion
Die Ergebnisse der Parametervariationen im Degradationsdilemma lassen erkennen, daß in diesem Spiel ein gewisses Maß an egoistischer Kooperation entstehen kann. Von entscheidender Bedeutung ist dabei allerdings, daß geeignete Randbedingungen vorliegen, und daß nicht nur die Extremfälle völliger Kooperativität oder Kooperationsverweigerung betrachtet werden. Im Unterschied zum Modell in Kapitel 3 dieser Arbeit, verdrängt die erfolgreichste Strategie ihre Konkurrenten nicht ganz aus der Population. Als Resultat des simulierten Evolutionsprozesses entsteht eine stabile Mischpopulation, in der sowohl kooperative, als auch unkooperative Strategien Anteile wahren können. Das erschwert ein klares Urteil über die Richtigkeit der widerstreitenden, normativistischen und utilitaristischen Thesen. Einige besonders radikale, normativistische Behauptungen werden jedoch von den Simulationsergebnissen des Degradationsmodells in Frage gestellt. Die gemeinsame Produktion eines kollektiven Gutes durch eine Gruppe muß nicht unweigerlich zusammenbrechen, wenn die Individuen keine Neigung zu gemeinwohlorientiertem Verhalten besitzen. Durch eine Zentralinstanz ausgeübte Kontrollen und Straf- bzw. Auschlußandrohungen können bereits ausreichen, ein mittleres Niveau der Kooperativität in der Gruppe zu gewährleisten. Das gilt selbst dann, wenn die Zentralinstanz nicht aktiv werden kann, solange ein Schwellenwert der Minderleistung nicht überschritten wird.
SCHLUSS Die Untersuchung hat das Bild von vier strukturellen Dilemmas gezeichnet, die im Verlauf der sozialen Evolution aufgetreten sind. Dabei ergaben sich für die historische und spieltheoretische Betrachtung unterschiedliche Perspektiven. Die lineare Ordnung der geschichtlichen Interpretation erscheint wesentlich stärker vernetzt, wenn das Augenmerk auf die strategischen Merkmale der Dilemmasituationen wechselt. Die abschließende Bewertung der Ergebnisse versucht beiden Perspektiven gerecht zu werden. Sie behält die historische Gliederung bei, aber sie hebt auch die Interdependenzen der einzelnen Kapitel hervor. Die Modelle von Axelrod und Coleman im ersten Kapitel zeigen, daß sich egoistische Kooperation in kleinen Gruppen, in Familien und in stabilen, sozialen Nahbereichen von Akteuren ohne allzugroße Schwierigkeiten herausbilden kann. Für diese "Keimzellen" der Gesellschaft wird in der Regel ein erhöhtes Maß an zwischenmenschlicher Solidarität und opferbereiten Altruismus' angenommen. In diesem Kontext erweisen sich jedoch auch die antisozialen Wirkungen des Egoismus rationaler Akteure als gering, und altruistisches Verhalten kann, zumindest im Prinzip, oft aus egoistischen Motiven erklärt werden. Ähnliche Resultate vertreten biologisch-genetische Theorien der "inclusive fitness" mit Blick auf Verwandtschaftsbeziehungen (vgl. Dawkins 1978). Spieltheoretische Analysen lösen die egoistische Kooperation von ihrer Beschränkung auf eine genetische Basis, aber sie können die Anzahl der Individuen, auf die sich Kleingruppensolidarität bezieht, gegenüber biologischen Modellen kaum vergrößern. Verantwortlich für solche Größengrenzen ist vor allem der Mechanismus, der in Kleingruppen egoistische Kooperation generiert und das postulierte Fehlen jeder hierarchischen sozialen Struktur. Gemäß dem "Prinzip der späteren Vergeltung" wird unterstellt, daß unkooperative Akteure erkannt und bestraft werden müssen, damit die soziale Ordnung aufrechterhalten werden kann. Unter wenigen Akteuren läßt sich diese Aufgabe bereits dezentral bewältigen, indem jeder Akteur die Kooperation mit bekannterweise böswilligen Individuen vermeidet, um sich selbst vor Ausbeutung zu schützen. Das gelingt allerdings nur, wenn die Akteure nicht in der Anonymität verschwinden können, also bei einem begrenzten Gedächtnis und Überblick der Individuen nur in einer hinreichend
136
Schluß
kleinen und unveränderlichen Gemeinschaft. Die Einführung hierarchischer Machtstrukturen verändert die Situation grundlegend, aber die Betrachtung der gleichberechtigten Interaktion in Kleingruppen bleibt dennoch der notwendig erste Schritt einer befriedigenden Kooperationsanalyse. Zum einen können sich die Probleme freiwilliger, egoistischer Kooperation an der Spitze jeder Machthierarchie wiederholen. Es gilt dann herauszufinden, weshalb die Mitglieder einer Machtelite nicht notwendig wie Wölfe übereinander herfallen. Zum anderen erlaubt diese Ansatzweise, die Bösartigkeit sozialer Dilemmas zu stufen. Auf unterster Ebene stehen die Dilemmas, die bereits auf der Basis rein freiwilliger und dezentraler Aktion der Individuen lösbar sind; und gerade hier ist die Kooperation in Kleingruppen einzuordnen. Eine kurze Bemerkung verdient noch Axelrods Darstellung. Axelrod beschränkt die Interpretation seiner Ergebnisse nicht auf Situationen, in denen wenige interagierende Akteure vorhanden sind. Es ist natürlich immer eine Frage, wie weit man die Resultate einer abstrakten, formalen Untersuchung auslegen darf. Da aber die strategischen Bedingungen im Superspiel des Zwei- und n-Personen-PD (mit n > > 2) verschieden sind, sei an dieser Stelle erneut für eine im Vergleich zum Autor restriktive Auslegung der Ergebnisse plädiert. Dementsprechend wurden Axelrods Analysen auch eindeutig dem Kontext der Kooperation unter wenigen Partnern zugeordnet. Als nächster Punkt der historischen Betrachtung tritt uns die Problematik der Kooperation in großen Gruppen (n-Personen-PD, Kapitel 2) entgegen. Sie behält ihre Bedeutung auch beim Übergang zu neueren (Arbeitsethos) und neuesten (Umweltschutz) sozialen Dilemmasituationen bei. Zunächst wird sie jedoch auf das klassische Problem der Stabilität sozialer Ordnung in staatlich organisierten Gesellschaften bezogen. Die Diskussion kann sich dabei an Hobbes' Werk orientieren, der die Gefahr der Anarchie, der Atomisierung der Gemeinschaft, bis nur noch vereinzelte egoistische Individuen in einem Krieg aller gegen alle übrig bleiben, als Hauptgefahr für die Selbsterhaltung einer Gesellschaft ansieht. Nur "Leviathan", der allmächtige, mit einem Gewaltmonopol ausgerüstete Staat, kann nach Hobbes den inneren Frieden und somit Sicherheit für Leben und Eigentum der Bürger garantieren. Seit der frühen Neuzeit, die durch ein Nachlassen der Integrationskraft religiösen Glaubens und einen
Schluß
137
Anstieg der Bevölkerungszahlen gekennzeichnet ist, stellt diese Fragestellung ein zentrales Problem der Sozialtheorie dar. Nach wie vor bleibt umstritten, ob die Hobbessche Voraussetzung einer Lösung, die Etablierung eines absoluten Herrschaftssystems mit einem Monopol zur Ausübung von Gewalt, vermieden werden kann. Auch wenn der Absolutismus als Herrschaftsform durch den verwandten Totalitarismus diskreditiert ist, läßt sich über die Notwendigkeit eines staatlichen Gewaltmonopols debattieren. Außerdem erscheint unklar, ob eine Zentralisierung der Macht zur Stabilisierung der sozialen Ordnung allein schon ausreicht. Taylor (1976, 1987) beschäftigt sich ausschließlich mit der ersten Frage, und weist nach, daß egoistische Kooperation auf rein dezentraler Basis spieltheoretisch stabil sein kann. In einem wiederholten n-Personen-PD unter gleich mächtigen Akteuren können von den Individuen aus Eigeninteresse verfolgte Strategien bedingter Kooperation zu einem Gleichgewicht im gesamten Spiel führen. Das Ergebnis besitzt jedoch einen entscheidenden Haken. Unter halbwegs realistischen Bedingungen, bei denen Akteure fehlbar sind und nicht über absolut vollständige Information verfügen, verliert die kooperative Lösung ihre Gleichgewichtseigenschaften. Für die Praxis beweist die Spieltheorie deshalb gerade, daß in großen Gruppen hinsichtlich von Produktion und Konsum öffentlicher Güter keine Kooperation auf rein freiwilliger Basis entstehen kann. Die Individuen würden in Taylors Modell ihre Macht auch nicht freiwillig an einen "Leviathan" abtreten. Im Gegensatz dazu ist dezentrale, egoistische Kooperation in kleinen Gruppen relativ robust und liefert damit die Berechtigung, Dilemmas der großen Zahl auf einer erhöhten Stufe der Bösartigkeit anzusiedeln. Allerdings muß mit der pessimistischen Wendung von Taylors Analysen noch nicht das letzte Wort in Sachen Hobbesproblem gesprochen sein. Ein interpretatorischer Ausweg, der bei der Modellierung des Ordnungsdilemmas weniger radikal ansetzt, erscheint gangbar. Der Hobbessche Leviathan dient als Garant der inneren Sicherheit in einer Gesellschaft. Hobbes versteht den Leviathan als Schutzbündnis freier Individuen gegen die wechselseitige Anwendung von Betrug und Gewalt. Aus spieltheoretischer Sicht ist es entscheidend, daß ein Leviathan als Schutzbündnis (ebenso wie eine Versicherung) kein öffentliches, sondern nur ein kollektives Gut produziert. Bei einem kollektiven Gut sollen Akteure, nach dem hier eingeführten Sprachgebrauch, von der Konsumption ausgeschlossen
138
Schluß
werden können, bei einem öffentlichen nicht. Ein hypothetisches Schutzbündnis, das aus einem vorgesellschaftlichen Naturzustand heraus entsteht, besäße die Option, Beitragsverweigerer von der Schutzleistung auszunehmen. Hechter (1987: 106) weist darauf hin, daß neoutilitaristische Theoretiker zwar das Problem der Produktion öffentlicher Güter nicht lösen können, daß sie aber ohne weiteres erklären können, wie kollektive Güter unter rationalen Egoisten erstellt werden. Die in Kapitel 2 referierten Arbeiten helfen, diese Aussage zu präzisieren. Zunächst erscheint es wichtig, die Ausschlußoption unabhängig von anderen Arten der Bestrafung zu untersuchen. Sie erlaubt eine weitere Differenzierung der analytischen Beurteilung von Dilemmastrukturen. Der Auschluß von der Schutzleistung stellt noch keine direkte, gewaltsame Handlung gegen einen Akteur dar, sondern ein sanfteres Mittel der Sanktionierung. Dilemmas die durch gewaltfreien Ausschluß von Defekteuren gelöst werden können, sind deshalb weniger bösartig, als solche, die gewaltsame Eingriffe oder Drohungen mit Gewalt erfordern. Mit diesem Punkt verbunden und doch weiterführend ist die Frage, ob die Genese eines Staates oder einer Kontrollinstanz für die Produktion und den Konsum eines kollektiven Gutes auf der Basis der freiwilligen Übereinkunft der beteiligten Akteure möglich erscheint. Die Analysen von Bendor, Mookherjee und Hirshleifer stützen für den Bereich der dezentralen Unterstützung von Kooperation Taylors Ergebnisse. Auch wenn Akteure aus einer Gruppe ausgeschlossen werden können, besteht praktisch keine Chance zu einer kooperativen Lösung ohne zentralisierte Kontrolle. Es ergeben sich aus der spieltheoretischen Diskussion demnach bislang nur negative Indizien für die Möglichkeit einer radikal anarchischen Gesellschaftsorganisation. Sofern jedoch eine zentrale Kontrollinstanz eingerichtet ist, kann diese durch Ausschlußdrohung rationale Egoisten zur Kooperation bewegen. Es bedarf hierfür nicht notwendig einer intrinsischen Moralität und Solidarität der Individuen. Das System bleibt auch auf der Basis reinen, durch Sanktionsdrohungen in Zaum gehaltenen Eigeninteresses stabil. Mehr noch: rationale Egoisten würden freiwillig der Einrichtung von Schutzbünden für Leben und Eigentum zustimmen und ihnen beitreten. Die von Nozick (1976: 25ff.) postulierte Möglichkeit einer Staatsentste-
Schluß
139
hung über den Umweg freiwilliger Schutzbünde zeichnet sich ab. Zumindest über diese Zwischenstufe läßt sich Hobbes' Programm der freiwilligen Gesellschaftsbildung aus der Furcht heraus rational rekonstruieren. Historisch gesehen dürften diese philosophischen Spekulationen bedeutungslos sein, denn aller Wahrscheinlichkeit nach hat sich nie eine Gesellschaft freiwillig und ohne Gewalt formiert. Der ganze Gedankenaufwand lehrt aber wenigstens, daß auch das Problem sozialer Ordnung nicht den Gipfel struktureller Bösartigkeit eines strategischen Dilemmas erreicht. Selbst wenn die Welt voller rationaler Egoisten wäre, ließe sich das Ordnungsproblem noch mit vergleichbar milden Mitteln lösen. Ebenfalls beruhigend sind die Ergebnisse von Kapitel 3 für das erste wirklich moderne Problem - die Stabilität einer anonymen Marktwirtschaft. Theoriegeschichtlich gewann dieser Problemkomplex mit dem Erstarken des Kapitalismus und dem Entstehen moderner Gesellschaften an Gewicht. Das Verhalten des Menschen wurde zunehmend und bis tief in Bereiche der "Lebenswelt" hinein ökonomisiert. Soziologische Klassiker wie
Tönnies,
Spencer
und
Dürkheim
extrapolierten
die
Ent-
wicklungstendenzen der Moderne und sahen eine Gesellschaft voraus, in der freiwillige Kooperation und umfassender Austausch zur Basis der sozialen Beziehungen würden. Unabhängig von den erwarteten Risiken dieser Tendenz befürworteten einige Theoretiker ein gesellschaftspolitisches laissez-faire und andere den Einbau von "normativen Bremsen", um die ungehemmte Dynamik der Moderne zu zügeln. Bis heute haben Moderne und Kapitalismus alle Krisen überlebt. Der Prozeß der wachsenden Individualisierung und Anonymisierung der Gesellschaft konnte beiden nichts ernstliches anhaben. Auf einen möglichen Grund für diese erstaunliche Fähigkeit zur Selbststabilisierung geht Kapitel 3 der vorliegenden Arbeit ein. Ein Modell der freiwillig iterierten Kooperation im Zwei-Personen-Gefangenendilemma versucht, die Grundstrukturen einer mobilen und anonymen Tauschgesellschaft auf egoistischer Basis nachzuzeichnen. Dabei wird zugleich eine marktwirtschaftliche Anarchie unterstellt, in die der Staat oder Kontrollorgane nicht eingreifen. Unkooperative Akteure können ihre Tauschpartner straflos übervorteilen und sodann in der anonymen Masse untertauchen, um sich ein neues Opfer zu suchen. Sie werden nicht wiedererkannt und können nicht anhand bestimmter Merkmale identifiziert werden. Niemand kann sich im voraus gegen Defekteure
140
Schluß
schützen. Die einzige Waffe kooperativer Akteure besteht im Abbruch der Tauschbeziehungen zu jemanden, der sie bereits ausgenutzt hat. Der einzige Vorteil der Kooperativität liegt in der Möglichkeit, daß zwei kooperative Akteure zusammen bleiben und voneinander profitieren können, während Defekteure sich neue Partner suchen müssen, die vielleicht noch skrupelloser als sie selbst sind. Ein Computerwettkampf verschiedener Verhaltensstrategien zeigt, daß in diesem Modell noch unter scheinbar extrem ungünstigen Bedingungen Kooperation unter reinen Egoisten entstehen kann. Die Möglichkeit des Abbruches und der Anreiz der Fortsetzung der Interaktion erweisen sich in einem Tauschsystem als starke Waffen gegen ein übermäßiges Anwachsen unkooperativer Verhaltensweisen. Eine hypothetische Tauschgesellschaft rationaler Egoisten vermag sich daher möglicherweise endogen gegen den Verfall der Kooperation schützen. Es liegt nicht zu fern anzunehmen, daß der beschriebene Mechanismus der Selbststabilisierung auch im modernen Kapitalismus wirkt, obwohl nur seine potentielle und idealtypische Wirksamkeit von der spieltheoretischen Analyse nachgewiesen wird. In diesem Fall erscheint die These, daß die Geschäftsmoral in enger Verbindung zum Zustand der allgemeinen Moral in einer Gesellschaft steht (vgl. Dürkheim 1977: 42) nicht mehr so eingängig wie zuvor. Auch einige verbreitete Annahmen der soziologischen Theorie müssen überdacht werden. Es gehört fast zum common sense anzunehmen, daß ein nahes Zusammenleben von Individuen mit dauerhafter Interaktion die Kooperation zwischen diesen fördert. Gerade aus diesem Grund erschienen die Tendenzen zur Individualisierung, Mobilität und Anonymität als Existenzbedrohungen moderner Gesellschaften. Das spieltheoretische Modell zeigt, daß auch die entgegengesetzte Situation kooperationsfreundlich wirken kann. Wenn ein Akteur einen anderen jederzeit verlassen kann, muß dieser sich besonders um gute Beziehungen bemühen. Die Moderne zerstört offenbar die Grundlagen kooperativen bzw. normativen Verhaltens nicht, sondern sie wechselt - teilweise - zu anderen über. Eine normativistische Soziologie, die im Kontext der Austauschproblematik Unmöglichkeitsthesen zur Kooperation rationaler Egoisten aufstellt, überlastet deshalb schlicht die Tragfähigkeit ihrer Argumentation. Ein Modell der freiwillig iterierten Kooperation, wie es hier vorgestellt
Schluß
141
wurde, fordert letztlich auch eine Änderung in der Ausrichtung des spieltheoretischen Diskurses. Bisherige Studien unterstellen meist ein Superspiel ohne Möglichkeit des bewußten Abbruchs, wenn die iterierte Interaktion von rationalen Egoisten untersucht werden soll. Das beruht nicht zuletzt auf der These vom kooperationsfördernden Charakter dauerhafter Interaktion, die auch von der utilitaristischen Schule anerkannt wird. Ein Superspiel beschreibt einen Zustand, in dem die beteiligten Spieler aneinander gebunden sind, ob sie wollen oder nicht. Niemand kann in einem Superspiel seine(n) Partner verlassen, es sei denn, das Superspiel würde durch exogene, durch die Spieler nicht beeinflußbare Umstände abgebrochen. Derart enge, unvermeidliche Bindungen lassen sich nur für kleine oder für immobile große soziale Systeme postulieren. Sie sind z.B. in Planwirtschaften gegeben, was Freunde des Vorschlags, zur Förderung der Kooperation Superspielsituationen zu schaffen, zum Nachdenken bringen sollte. Auf jeden Fall wurden die Charakteristika von Marktwirtschaften zu sehr aus der spieltheoretischen Analyse ausgeklammert. Die Phänomene der freiwillig iterierten Kooperation bedürfen einer größeren Aufmerksamkeit, als ihnen bislang zu Teil geworden ist. Der Hinweis auf Planwirtschaften verdient vor dem Hintergrund der Ergebnisse aus Kapitel 3 einer Vertiefung. Trotz der Dauerhaftigkeit von Liefer- und Absatzbeziehungen scheint dieses System hinsichtlich der Qualität der erzeugten Produkte dem Markt weit unterlegen. Die Stärke des Marktes bei der Qualitätssicherung läßt sich gut mit Hilfe der Überlegungen zur freiwillig iterierten Kooperation bei schneller Abbruchmöglichkeit erklären. Die Schwäche der Planwirtschaft verweist dagegen auf die Zweischneidigkeit von Superspielmodellen ohne Abbruchoption. Falls nicht genügend äußere Anreize zur Qualitätsproduktion gegeben werden können, verstärkt das System den Qualitätsverfall noch, denn jede Seite wird schlechte, gelieferte Qualität mit schlechter, produzierter Qualität beantworten, sei es als Vergeltung im bilateralen Fall, oder um hinsichtlich der "Vorteile der Faulheit" anderen nicht nachzustehen. Die Produktion hochwertiger Güter aus minderwertigen Teilen würde schließlich unzumutbare Anstrengungen erfordern. Auch das letzte Modell dieser Arbeit beschäftigt sich mit den Problemen moderner Gesellschaften. Es untersucht die Frage, ob Individuen ohne intrinsisches Arbeitsethos allein aufgrund von Leistungskontrollen einen angemessenen Beitrag zu einer Teamproduktion erbringen werden. Dar-
142
Schluß
überhinaus steht das Modell aber noch in enger Verbindung zu der in Kapitel 2 diskutierten Ordnungsproblematik. In beiden Fällen handelt es sich um strategische Dilemmas der Produktion öffentlicher oder kollektiver Güter. Die historische Trennung der Probleme muß daher von der spieltheoretischen Seite nicht reflektiert werden, und das Modell von Kapitel 4 setzt die in Kapitel 2 abgebrochene Untersuchung fort. Dort war bereits herausgearbeitet worden, daß die Kooperation unter Egoisten in einem iterierten n-Personen-PD aufrechterhalten werden kann, wenn eine Zentralinstanz unkooperative Akteure mit hinreichend hoher Wahrscheinlichkeit zu erkennen und aus der Gruppe auszuschließen vermag. Nun wird auf alte, normativistische Argumente zurückgegriffen und zusätzlich ein Schwellenwert für die Wahrnehmung von Defektionen eingeführt. Außerdem variiert der Erfolg der Kontrollen im späteren Modell linear mit dem Ausmaß der Abweichung vom Produktionssoll. Unter der Annahme, daß reine Egoisten diese Chance zur unentdeckten Leistungsminderung ausnutzen werden, ließ sich ein allmählicher Zusammenbruch der Teamkooperation erwarten. Ein besonderer Reiz dieser Konstruktion besteht in ihrer Affinität zu klassischen, sozialphilosophischen Motiven des Zerfalls des guten Staates. Von Piaton bis Mancur Olson (1982) nehmen pessimistische Sozialphilosophen und -theoretiker an, daß Staaten, soziale Bewegungen und Organisationen mit der Zeit verkrusten und an "institutioneller Sklerose" zu leiden beginnen. Als Ursache dieses Prozesses tritt immer wieder der Egoismus der Akteure hervor, der sich mit zunehmendem Alter eines sozialen Systems besser und erfolgreicher etabliert. Im spieltheoretischen, evolutionären Modell eines Degradationsdilemmas, das diese präzisierte normativistische Fragestellung wiedergibt, tritt tatsächlich ein schleichender Verfall der Kooperation auf. Die Ausschlußoption der zentralen Kontrollinstanz genügt nicht, um eine kooperative Lösung auf lange Frist zu gewährleisten. Dieses Ergebnis gilt jedoch nur dann, wenn das Modell rein deterministisch abläuft. Sobald die Ausbreitung bzw. der Rückgang von Strategien in einer Population Zufallsschwankungen unterliegt, muß die Kooperation zwischen rationalen Akteuren nicht mehr zerfallen. Die Modellresultate nehmen diese unerwartete Wendung, weil die Zufallsschwankungen ein Informationsproblem der Kontrollinstanz lösen. Aufgrund der stochastischen Fluktuationen treten auch nachdem die Kooperation bereits weitgehend ver-
Schluß
143
fallen ist, immer wieder Individuen mit hoher Leistungsbereitschaft auf. Dadurch kann die Zentralinstanz das Ausmaß der Defektion unkooperativer Akteure erkennen und diese ausschließen. Die hoch kooperativen Akteure müssen ihren Leistungsbeitrag wohlgemerkt nicht, aufgrund eines intrinsischen Arbeitsethos oder bürgerlicher Tugend erbringen. Sie können auch als rationale Egoisten die (nicht in einem genetischen Sinn) evolutionären Vorteile ihres Verhaltens erkennen, und davon zu profitieren suchen. Die Gefahren eines nachlassenden Arbeitsethos erscheinen aufgrund der Ergebnisse in Kapitel 2 und 4 so schlimm nicht. Auch ohne Arbeitsethos konnte sich die Teamproduktion auf einem mittleren Niveau einpendeln. Ein totaler Pessimismus ist in diesem Punkt ebensowenig angebracht, wie hinsichtlich des Verfalls des guten Staates und der "institutionellen Sklerose". Die Tendenzen zum schleichenden Niedergang der Kooperation im Modell wurden bereits durch Zufallsschwankungen der Gruppenzusammensetzung, die in der Realität fast immer angenommen werden dürfen, in zyklische Bewegungen überführt. Es bedurfte nicht den Modelläquivalenten von Kriegen und Revolutionen, vor denen sich Olson als letzte Medizin gegen die "institutionelle Sklerose" fürchtet. Das Degradationsdilemma liefert die Grundlage für ein sanftes, sozialphilosophisches Modell gesellschaftlicher Zyklen mit relativ unspektakulären, von Zufallsprozessen auf der Mikroebene generierten Wendepunkten. Die spieltheoretische Diskussion von vier historischen Dilemmas menschlicher Gesellschaften gibt alles in allem zu Optimismus Anlaß. Selbst unter reinen Egoisten ließen sich diese Probleme mit wenig Gewalteinsatz lösen. Natürlich abstrahieren die behandelten Modelle stark von der sozialen Realität, doch das haben sie mit den Argumenten der normativistischen Gegenseite gemein. Die Ergebnisse der Untersuchung nähren auf jeden Fall die Skepsis gegenüber der behaupteten Notwendigkeit starker, gesellschaftlicher Normen- und Wertesysteme. Sie belegen, daß es keineswegs evident ist, daß eine "wertfreie" oder "wertschwache" Gesellschaft zwangsläufig zusammenbrechen müßte. Schließlich werfen die Resultate aus Kapitel 2 noch Licht auf ein fünftes Dilemma, das erst in neuester Zeit virulent geworden ist. Die Probleme des Umweltschutzes entsprechen einem iterierten n-Personen-PD ohne Ausschlußmöglichkeit. Akteure, die einen Beitrag zu einer saubereren
144
Schluß
Umwelt verweigern, können z.B. nicht von den Vorteilen einer reineren Luft ausgeschlossen werden. Spieltheoretische Analysen zum n-PersonenGefangenendilemma ohne Auschlußmöglichkeit (vgl. Raub/Voss 1986a, 1986b; Taylor 1976, 1987; Voss 1985) legen eine pessimistische Haltung gegenüber den Chancen der freiwilligen Kooperation rationaler Akteure in diesem Kontext nahe. Es gelingt zwar zu zeigen, daß ein spieltheoretisch stabiles, kooperatives Gleichgewicht im n-Personen Gefangenendilemma existieren kann, aber dieses Ergebnis taugt wenig als Indiz für mögliche, dezentrale Lösungen in sozialen Dilemmas. Wenn auch nur ein minimales Risiko eines Verhaltensirrtums oder von Informationsdefiziten in das Modell eingeführt wird, bricht das kooperative Gleichgewicht mit sehr großer Wahrscheinlichkeit zusammen. Die Akteure besitzen in diesem Dilemma auch keinen Anreiz auf freiwilliger Basis eine Kontrollinstanz zu schaffen, die über ihr Verhalten wacht. Jede Lösung des Problems dürfte somit ein gewisses Maß an Zwang beinhalten. Das fünfte Dilemma erweist sich als strukturell bösartiger als seine vier Vorläufer. Letztlich läßt sich für die hier diskutierten Probleme eine Stufenordnung der Lösbarkeit angeben, wobei höhere Stufen einer größeren Bösartigkeit entsprechen: Stufe 1: Dilemmas der Kooperation in kleinen Gruppen und auf freien Märkten. Eine dezentrale und robuste Lösung auf freiwilliger Basis ist möglich. Stufe 2: Dilemmas der gemeinschaftlichen Produktion von Gütern, von deren Konsum Akteure ausgeschlossen werden können. Diese Gruppe umfaßt das Problem sozialer Ordnung, sowie in der Regel der Teamproduktion. Eine dezentrale und freiwillige Lösung ist prinzipiell spieltheoretisch möglich, aber praktisch extrem unwahrscheinlich. Eine zentralistische Lösung kann auf der Basis der freiwilligen Schaffung einer Kontrollinstanz erzielt werden. Stufe 3: Dilemmas der Produktion und des Konsums echter öffentlicher Güter, von denen niemand ausgeschlossen werden kann (z.B. Umwelt). Eine dezentrale und freiwillige Lösung ist prinzipiell spieltheoretisch möglich, aber praktisch extrem unwahrscheinlich. Eine zentralistische Lösung kann nicht auf der Basis der freiwilligen Schaffung einer Kontrollinstanz erzielt werden. Nur der Einsatz von Macht, Gewalt oder
Schluß
145
Drohungen kann unter rationalen Egoisten eine Lösung herbeiführen. Vor dem Hintergrund der Diskussion um die gesellschaftliche Selbsterhaltung impliziert diese Stufenfolge, daß die Lösung der jeweils virulenten Dilemmas strukturell immer schwieriger wird, je höher entwickelt ein soziales System ist. Die spieltheoretische Klassifikation der fünf Dilemmas, besagt natürlich nicht, daß sich Umweltschutzprobleme überhaupt nicht beseitigen lassen, aber sie verweist deutlich auf die neue strukturelle Qualität dieser Bedrohung. Diese strukturelle Komponente kommt zu der ohnehin in der Öffentlichkeit breit diskutierten Steigerung der technischen Fähigkeiten hinzu, sich selbst und die irdischen Ökosysteme zu zerstören. Das heißt auch, daß aus der Problemlösungskapazität moderner Gesellschaften hinsichtlich der Dilemmas des Kapitalismus und der sozialen Ordnung nicht auf das Gelingen entsprechender Bemühungen beim Umweltschutz geschlossen werden kann. Vielleicht schlägt sich die höhere strukturelle Bösartigkeit der Problematik nicht in konkreten Schwierigkeiten der sozialen Organisation nieder. Vielleicht erfordert die verschärfte Dilemmastruktur aber auch Lösungen, die in direktem Bezug zu den definitorischen Merkmalen der Bösartigkeitsstufe stehen. Sobald Umweltprobleme unerträglich werden, sind dann Übergriffe mächtiger Staaten auf die Souveränität anderer, Versuche, sich umweltkonformes Verhalten bezahlen zu lassen, und harte staatliche Zwangsregelungen zu erwarten. Da rationale Egoisten einer zentralisierten Kontrolle in diesem Fall nicht freiwillig zustimmen werden, entstehen verstärkt Legitimationsprobleme für die Zentralinstanzen. Jeder mag seine Schlüsse aus den vorgestellten, spieltheoretischen Argumenten selbst ziehen und sich sein oder ihr passendes Szenario möglicher Lösungen der strukturellen Probleme ausmalen. Diese Arbeit möchte auf Prognosen und Prophezeiungen verzichten. Sie hofft lediglich, einen Beitrag zum Nachweis und zur Ausweitung der analytischen und diagnostischen Kapazität spieltheoretischer Modellierung geleistet zu haben.
146
Anmerkungen zur Einleitung
Anmerkungen zur Einleitung: 1) Auf eine Darstellung der Grundpositionen der utilitaristischen Schule in der Soziologie wird hier verzichtet. Zu diesem Zweck existiert, wie angegeben, bereits eine hinreichende Menge einführender Literatur. Zu spieltheoretischen Ansätzen zur Nonnentstehung (vgl. Axelrod 1987; Harsanyi 1977; Opp 1983; Schotter 1981; Taylor 1976, 1987; UllmannMargalit 1977) liefern Kliemt (1986b) und Voss (1985) eigene Beiträge und einen Überblick. 2) Für eine genauere Erörterung einer skeptischen Verwendung des homo oeconomicus vgl. Schüßler (1988). 3) Die hier charakterisierte Haltung ist typisch für eine klassisch normativistische Position, wie sich gut an Dürkheim belegen läßt. Vgl. z.B. Dürkheim (1961:40ff.;1983:449ff.,533ff.). 4) Der Begriff des sozialen Dilemmas wird in der Literatur auch für andere strategische Strukturen als das Gefangenendilemma verwendet. Einige weitere Strukturen werden z.B. bei Ullmann-Margalit (1977) diskutiert. Harsanyi (1977: 278-280) unternimmt den Versuch einer allgemeinen Klassifizierung von sozialen Dilemmas (vgl. auch Voss 1985: 124ff.). Besonders hervorzuheben sind dabei Probleme der Koordination von strategischen Entscheidungen. Unter allen Dilemmastrukturen besitzt jedoch das des Gefangenen am meisten Bedeutung, nicht zuletzt wegen seiner zentralen Stellung für die Public-Choice-Ökonomie. 5) Der Begriff des rationalen Egoisten alias rationalen Akteurs alias homo oeconomicus bezieht sich auf das ökonomische Verhaltensmodell rationalen Wahlhandelns. Das "behauptet kurz gesagt, daß Individuen ihren Nutzen unter Berücksichtigung der gegebenen Handlungsmöglichkeiten maximieren" (Opp 1984: 2). Der Terminus "Nutzen" in dieser Formulierung darf nicht im Sinne von Nützlichkeit oder eines utilitaristischen Hedonismus verstanden werden. Für die neoklassische Ökonomie besagt "Nutzen" nur, daß ein Objekt ein Argument in einer Präferenz- oder Zielfunktion eines Akteurs darstellt (vgl. Becker 1976: 5). Diese Argumente müssen nicht notwendig egoistischen Zwecken dienen (vgl. Margolis 1982). Im Hauptstrom der Anwendungen des Modells rationalen Wahlhandelns wird jedoch meist der Egoismus der individuellen Präferenzen unterstellt. Egoismus meint dabei, daß der Nutzen anderer Akteure kein Argument in der Nutzenfunktion eines Akteurs ist. Aus diesem Grund wird in der vorliegenden Arbeit "rationaler Akteur" gleichbedeutend mit "rationaler Egoist" verwendet. Die Rationalität dieser Akteure umfaßt natürlich nur die Fähigkeit ein Maximierungskalkül durchzuführen. Sofern dieser Punkt geklärt ist, wird es müßig zu streiten, ob damit der Begriff der Rationalität unterbelichtet bleibt. 6) Der Begriff des Hobbesschen Ordnungsproblems wird in ganz verschiedenen Bedeutungsvarianten gebraucht. Alle spieltheoretischen Formulierungen lösen sich stark von Hobbes' Text ab und sind keinesfalls als echte historische Rekonstruktionen anzusehen. Meine Entscheidung, nur Dilemmas größerer Gruppen (n-Personen-PDs) als Hobbesproblem im engeren Sinne zu betrachten deckt sich mit dem Vorgehen von Taylor (1976,1987). Dabei ist diese Benennung allein eine Frage einer inhaltlich nicht sehr erheblichen Konvention, nachdem es, wie gesagt, nicht um Philosophiegeschichte geht.
A nmerkungen zur Einleitung
147
7) Überblicke über einschlägige spieltheoretische Arbeiten geben z.B. Axelrod/Dion (1988); Shubik (1982). 8) Zur Frage, wie die soziologischen Klassiker die Moderne gesehen haben vgl. Eisenstadt (1973). Im gegenwärtigen Kontext hätten auch noch Theoretiker wie Simmel oder Sombart angeführt werden können, aber es soll kein theoriegeschichtlicher Überblick erarbeitet werden, sondern nur ein Hintergrund für die spieltheoretischen Analysen, der gerade die theoriegeschichtliche Dimension der behandelten Problemstellungen erkennen läßt. 9) Auf den ersten Blick legen die Phänomene der Attraktion und Repulsion eher einen Bezug zum Elektromagnetismus als zur Mechanik nahe. Die Analogie rührt jedoch von einem Planetenmodell mit seinen zentripetalen und zentrifugalen Kräften her. Die Analogie war von der Aufklärung z.B. bei Voltaire (vgl. Lovejoy 1961: 39) oder Berkeley (vgl. Sorokin 1928: 11) bis zu den Klassikern der Soziologie wie z.B. Spencer und Simmel (vgl. Spykman 1966: 23) weit verbreitet. 10) Für einen Überblick über Ansätze zur Entwicklung moderner Gesellschaften und damit verbundener Probleme vgl. Dreitzel (1967), Giesen (1980: 188ff.) oder Zapf (1969). Die Einschätzung von Giesen (1980: 215ff.) stützt die These, daß sich an den genannten Tendenzen nichts ändert, wenn man unterstellt, daß ein Übergang zu einer wie auch immer zu verstehenden Postmoderne zur Zeit stattfindet oder bereits stattgefunden hat. 11) Als Prinzip wurde diese Annahme nicht explizit formuliert. Sie liegt aber Thesen über die Gefahren der Anonymität und die Bedingungen egoistischer Kooperation von Piaton (1958) mit seinem Beispiel vom Ring des Gyges bis Axelrod (1987:90), Coleman (1986) oder Kliemt (1986b: 124) zugrunde.
148
Anmerkungen zu Kapitel 1
Anmerkungen zu Kapitel 1: 1) Ein umfangreicher Überblick über die spieltheoretische Literatur findet sich in Shubik (1982). 2) Besonders Ergebnisse der evolutionären Spieltheorie (vgl. Hofbauer/Sigmund 1984; Zeeman 1980, 1981) bleiben aus dem Überblick in den Kapiteln 1 und 2 ausgeklammert, obwohl diese Richtung in den letzten Jahren eine große Bedeutung in der theoretischen Biologie gewonnen hat. Der Grund für diese Entscheidung liegt zum einen darin, daß die meisten biologischen Modelle nicht in das hier vorgegebene, sozialwissenschaftliche Problemraster passen. Zum anderen werden die Techniken der spieltheoretischen, evolutionären Analyse in den Kapiteln 3 und 4 der Arbeit benutzt und in ihren elementarsten Zügen beschrieben. 3) Der hier postulierte Gegensatz zwischen rationalem Gleichgewichtskalkül und simulativen Strategiewettkämpfen stellt eine Vereinfachung der tatsächlichen Lage dar. Zunächst existiert nicht nur ein "rationales" Lösungsverfahren der Spieltheorie, sondern mehrere, die zu unterschiedlichen Ergebnissen kommen (vgl. van Damme 1987). Im übrigen setzt das analytische Gleichgewichtskalkül der evolutionären Spieltheorie die Rationalität der Akteure nicht mehr voraus. Der simultative Wettkampfansatz kann daher keine Einzigartigkeit beim Aufgeben traditioneller Annahmen beanspruchen. Dennoch trifft die vorgenommene Abgrenzung für den Hauptstrom der Spieltheorie zu. 4) Nullsummenspiele bzw. die in diese überführbaren Konstantsummenspiele für zwei Personen sind die einzigen Spiele, für die ein eindeutiges Gleichgewicht immer existiert (vgl. Vorob'ev 1977: 5 ff.). 5) Wie angemessen die Wettkampfmethode ist, läßt sich daran erkennen, daß viele Strategien, die elaborierte (z.B. Bayesianische) Lösungskonzepte der Spieltheorie verkörperten, von der primitiven T1T FOR TATRegel geschlagen wurden. 6) Hierzu vgl. erneut Raub und Voss (1986a, 1986b), sowie Schotter (1981). 7) Das Konzept der kollektiven Stabilität entspricht dem des NashGleichgewichtes. Es wurde bereits darauf hingewiesen, daß ein NashGleichgewicht die dynamische Stabilität eines Spieles nicht garantiert. Im Abschnitt, der Axelrods Arbeit kommentiert, wird hervorgehoben, daß dieser Mangel tatsächlich die Stabilität eines reinen TIT FOR TAT-Ergebnisses beeinträchtigt. 8) Das Phänomen der Reziprozität wird als soziologisches Universale angesehen, das in allen Gesellschaften auftritt (vgl. Gouldner 1984: 97). Eine spieltheoretische Analyse reziproker Kooperation bietet Schüßler (1986). 9) Das "assurance game" wurde von Sen (1975: 108 ff.) eingeführt (vgl. auch Voss 1985:160 ff.). Ein Beispiel für dieses Spiel ist:
Anmerkungen zu Kapitel 1
A1 A2 B2
3,3
2,-100
149
B1
-100,2 0,0
10) An dieser Stelle scheint eine kurze Rechtfertigung einer Konzentration auf das Gefangenendilemma angebracht, wie sie von Axelrod und auch mir bevorzugt wird. Unter dieser Bedingung kann die Vielfalt realer, strategischer Dilemmas sicher nicht abgedeckt werden. Das Gefangenendilemma stellt jedoch ein schärferes Problem als Spielmodelle wie Chicken, "Battie of Sexes" oder das Koordinationsdilemma dar. Letztere lassen sich zumindest formal ohne größere Schwierigkeiten unter Egoisten lösen. Zur prinzipiellen Erklärung egoistischer Kooperation fehlt hauptsächlich eine zufriedenstellende Lösung des Gefangenendilemmas, weshalb sich die Diskussion auf dieses Spiel konzentrieren kann. Axelrod nutzt seine Ergebnise allerdings darüberhinaus für Ratschläge an Beteiligte im politischen Prozeß. Für konkrete Anwendungen von Reziprozitätsstrategien ist es aber in der Tat bedeutsam, ihre Effektivität in verschiedenen strategischen Situationen zu kennen. Insofern machen die Kritiker Axelrods ihren Punkt. 11) Die Strafgefangenen werden unabhängig voneinander verhört und können einander veraten oder "dichthalten" Diese Situation kann als Basis sowohl eines einmaligen Spieles, als auch eines von der Polizei erzwungenen, iterierten Spieles aufgefaßt werden, wenn die Gefangenen mehrfach verhört werden (vgl. Rapoport/Chammah 1965). 12) Superspielanalysen wie die von Axelrod werden oft so verstanden, als ob sie approximativ und vereinfachend die Situation häufiger Interaktion beschreiben, die Coleman explizit modelliert (vgl. Raub/Voss 1986a, 1986b). Diese Annahme wirft jedoch Probleme auf. Eine Approximation ist nur dann sinnvoll, wenn minimale Veränderungen in den Randbedingungen nicht zu schwerwiegenden Veränderungen in den Resultaten führen können. Gerade das ist jedoch in der Spieltheorie häufig der Fall (z.B. bei der Einfuhrung einer minimalen Wahrscheinlichkeit eines Verhaltensirrtums). Es existiert in der Spieltheorie kein allgemeines Wissen darüber, wann die üblichen Vereinfachungen einen strategischen Kontext grundlegend ändern, und wann nicht. Colemans Ergebnisse sprechen allerdings für die These, daß ein Superspiel herangezogen werden kann, um häufige Interaktion zu repräsentieren. 13) Die Darstellung baut auf Colemans Ergebnissen auf. Coleman selbst hat seine Ergebnisse nicht auf diese Weise zusammengefaßt. 14) Die Rechteck- oder Gleichverteilung der Kooperationswahrscheinlichkeit unter den Akteuren besagt, daß alle Akteure mit der gleichen Wahrscheinlichkeit jeden Wert zwischen 0 und 1 für die Wahrscheinlichkeit der Kooperation mit einem Unbekannten wählen.
150
Anmerkungen zu Kapitel 2
Anmerkungen zu Kapitel 2: 1) Zu den bedeutsamsten Ansätzen zur Interpretation von Hobbes' Werk vgl. Macpherson (1973). Die Frage, inwieweit Hobbes nicht-egoistische Motive im Menschen zugelassen hat, berührt natürlich auch einschlägige Spielmodelle. 2) Parsons wird von individualistischer Seite deshalb vorgeworfen, daß er auf die Entstehungsbedingungen normativer und faktischer sozialer Ordnung nicht genügend eingegangen sei. 3) Man kann davon ausgehen, daß das stärkere Mittel der Bestrafung von unkooperativen Akteuren, die Chancen des Entstehens egoistischer Kooperation noch weiter verbessern würde. 4) In der Sprache der ökonomischen Wohlfahrtstheorie heißt das, daß die rationale Lösung eines Gefangenendilemas pareto-inferior zu einer anderen Strategiekombination ist. Harsanyi (1977) verwendet die Gefahr eines pareto-inferioren Ergebnisses zur Definition von strategischen Dilemmas. In der ökonomischen Literatur wird diskutiert, weshalb es schwierig ist, Wohlfahrtsverbesserungen oder -Verschlechterungen anhand anderer Maßstäbe als dem Pareto-Kriterium zu messen (vgl. Ng 1979). Das grundlegende Problem liegt dabei im interindividuellen Nutzenvergleich. 5) In der stark veränderten Neuauflage von "Anarchy and Cooperation" behält Taylor (1987: 83) die Definition des n-Personen-PD bei. Hamburger (1973) demonstriert die Vielfalt möglicher, definitorischer Merkmale eines n-Personen-PDs, die von Taylors Definition nicht eingefangen wird. 6) Schelling (1978: 220) und Hamburger (1973: 43) führen Beispiele für n-Personen-PDs an, in denen die Gesamtauszahlung maximal wird, wenn weniger als alle Spieler kooperieren. 7) Die strategische Bedeutung von Spieliterationen liegt darin, daß sie den "Schatten der Zukunft" herbeiführt. Der "Schatten der Zukunft" trifft Situationen, in denen zukünftige Nutzeneffekte gegenwärtiger Handlungen im Kalkül eines rationalen Akteurs bedacht werden müssen. In diesen Situationen entsteht oft ein Widerspruch zwischen kurzfristiger und langfristiger Nutzenmaximierung. 8) Eine Erweiterung der Stabilitätsbedingungen für n-Personen-PDs auf die allgemeine Klasse der Harsanyi-Dilemmas findet sich in Raub und Voss (1986a, 1986b). Die beiden Autoren lassen allerdings das Problem der Wahrscheinlichkeit einer kooperativen Lösung außer acht, das ihre Ausführungen in gleicher Weise betrifft wie das n-Personen-PD. 9) Der Versuch, die Wahrscheinlichkeit zu maximieren, daß genau x Akteure in einem n-Personen-Spiel kooperieren, bezeichnet Hofstadter (1983) als "superrationales" Verhalten. Die gegenwärtige Maximierungsaufgabe für die Wahrscheinlichkeit p der Kooperation bezieht sich auf das Auftreten von genau k+1 Kooperateuren in einer Binominalverteilung: dp(k) dp
_
( n \ k+1
p
k+1
n-k-1 (1-p)
Q
Anmerkungen zu Kapitel 2
151
Das Maximum liegt bei: (k+l)(l-p) - p(n-k-l) = 0; d.h. bei p = k+l/n. Die Wahrscheinlichkeit, daß der Wert k+1 erreicht wird, sinkt ceteris paribus mit Zunahme der Gruppengröße bereits beim einmaligen Versuch. Auch jede Iteration eines Spieles läßt diese Chance geringer werden. 10) Obwohl der Nachweis der prinzipiellen Möglichkeit der Kooperation mit dem ihrer Unwahrscheinlichkeit einhergeht, bildet er zumindest einen Ansatzpunkt, an den weitere Untersuchungen der neoutilitaristischen Schule anknüpfen können. Darin liegt auch seine eigentliche Bedeutung für dieses Forschungsprogramm. Er zeigt, daß der Utilitarismus entgegen Dürkheims und Parsons Verdikt nicht alle Hoffnung fahren lassen muß aber nicht mehr. Den Optimismus von Kliemt und Schauenberg (1982) oder Raub und Voss (1986a,1986b) teile ich nicht. 11) In einer anderen Formulierung heißt das, daß das S'-Gleichgewicht nur ein schwaches Nash-Gleichgewicht darstellt, bei dem einzelne Akteure zwar keine Vorteile, aber auch keine Nachteile erfahren, wenn sie von der Gleichgewichtsstrategie abweichen. In einer evolutionären oder dynamischen Betrachtung werden schwache Gleichgewichte durch Zufallseinflüsse instabil. Nur rationale Akteure werden in der Regel die Sicherheit des Gleichgewichts den Unsicherheiten der Indifferenz vorziehen, die resultieren können, wenn viele Spieler gleichzeitig vom Gleichgewicht abweichen. Die Stabilität eines schwachen Nash-Gleichgewichts ist deshalb weitgehend von der Annahme rationalen Wahlhandelns abhängig. 12) Die Thematik der Vernetzung von Akteuren in einem grossen, sozialen Dilemma wird hier nicht behandelt. Neuere Arbeiten zeigen, daß vernetzte, soziale Beziehungen in hohem Maße zur Stabilität egoistischer n-Personen-Kooperation beitragen können (vgl. Bendor/Mookherjee 1987; Raub/Weesie 1988). Bendor und Mookherjee (1987) unterstellen aber die zentrale Kontrolle von Akteursgruppen und somit ein hierarchisches Element in der Vernetzung. Da zentrale Kontrolle allein schon zur Generierung egoistischer Kooperation ausreichen kann, erweist sich die Vernetzung lediglich als Hilfe, und es erscheint nicht unbedingt notwendig, auf sie einzugehen. Bei Raub und Wessie (1988) wird ein Zwei-Personen-PD betrachtet, und das soziale Netzwerk dient in erster Linie der Verbreitung der Reputation von Akteuen. In Kapitel 3 der vorliegenden Arbeit wird gezeigt, daß dyadische, egoistische Kooperation auch bei voller Anonymität der Akteure entstehen kann. Reputationseffekte sind daher wiederum hilfreich, aber keine notwendigen Voraussetzungen der Kooperation. Dennoch wären die Ergebnisse von Netzwerkanalysen in jede Übersicht über den Stand der Forschung einzubringen, die weniger strikt als Hintergrund für die eigenen Analysen konzipiert ist, als im gegenwärtigen Fall. Sie stellen eine der interessantesten, neuen Entwicklungen auf dem Gebiet spieltheoretischer Kooperationsuntersuchungen dar. 13) In der Spieltheorie wird häufig ein Diskontfaktor benutzt, um den Gegenwartswert zukünftiger Auszahlungen zu bestimmen. Die zukünftigen Auszahlungen uj t an Spieler i zum Zeitpunkt t werden dabei mit einem Diskontfaktor CT < a < 1 gewichtet. Durch Summierung von 1 bis unendlich erhält man den zugehörigen Gegenwartswert Uj: Ui = = t a t " 1 , u i f
152
Anmerkungen zu Kapitel 2
Die Abdiskontierung zukünftiger Auszahlungen entspricht einer Gegenwartspräferenz im Nutzenkalkül der Akteure, oder sie kann die Risikoerwartung ausdrücken, daß zukünftige Auszahlungen nicht eintreten werden. Beide Interpretationen beziehen sich auf das Kalkül rationaler Akteure und entfallen in einer evolutionären Modellierung von Prozessen der Strategienkonkurrenz. Aus diesem Grund wird Effekten der Diskontierung in der vorliegenden Arbeit keine Aufmerksamkeit gewidmet. 14) Es scheint naheliegend, das Irrtumsproblem in Hirshleifers Modell durch das Erfordernis mehrerer Bannsprüche gegen das selbe Individuum zu beheben. Auf diese Weise nimmt die Wahrscheinlichkeit des Kooperationszusammenbruchs durch zufällige, individuelle Fehlleistungen schnell ab. Dennoch wären die verbesserten Gleichgewichtseigenschaften dieses veränderten Modells erst nachzuweisen. Reine Plausibilitätsbetrachtungen sollten dem nicht vorgreifen. 15) Die Strategie RUDIBAN wird hier eingeführt und kommt bei Hirshleifer nicht vor.
Anmerkungen zu Kapitel 3
153
Anmerkungen zu Kapitel 3: 1) Das widerspricht nicht der in Kapitel 1 übernommenen Auffassung, daß ein Zwei-Personen-PD als abstahiertes Modell zur Analyse von Kooperation in Kleingruppen verstanden werden kann. Es dürfte nur auf in idealtypischer Form ohnehin dyadische Tauschinteraktionen (noch) besser passen. 2) Bei Parsons steht jedoch nicht mehr der Austausch zwischen Individuen im Vordergrund, sondern die Verflechtungen eines sozialen Systems. Das Konzept der Interpénétration besitzt nach Münch (1979: 397) bereits Bedeutung für die "Structure of Social Action", besagt im gegenwärtigen Kontext aber nicht mehr als "Interdependenz". 3) Die Probleme asymmetrischer Information haben vor allem in der Ökonomie Beachtung gefunden. Dort existiert hierzu inzwischen ein eigener Forschungsbereich, die Informationsökonomie (vgl. Akerlof 1984; Stigler 1961). 4) Die Probleme der Austauschkooperation erstrecken sich nicht nur auf die Anwendung von Betrug und Gewalt. Es ist möglich, daß für die Funktion eines Austauschsystems auch die Einhaltung freiwilliger und oft impliziter Koordinationsvereinbarungen, wie z.B. Kulanzregelungen, von Bedeutung ist. In diesem Falle erweisen sich strategische Dilemmas als besonders scharf, weil die Kooperation der Akteure institutionell nicht abgesichert werden kann. 5) Hierzu vgl. van Damme (1987: 164). Van Damme weist darauf hin, daß lange kein systematisches Wissen über Probleme der strategischen Interdependenz in einem wiederholten Spiel existierte, und daß erst seit kurzem Anstrengungen unternommen werden, diese Lücke zu schließen. 6) Von einer sanktionsarmen Struktur wird hier gesprochen, weil sich die Möglichkeit vergeltender Bestrafung nicht mehr verläßlich einsetzen läßt, wie später erläutert wird. Die Struktur ist jedoch nicht völlig sanktionslos, da der Abbruch der Interaktion mit einem unkooperativen Partner als eine Art Bestrafung angesehen werden kann. 7) Mit dem Hinweis auf die Exit-Option im Unterschied zu weiterer Partizipation in einer Gruppe und dem Versuch der aktiven Einflußnahme hat Hirschman (1974) in den Sozialwissenschaften breites Interesse gefunden. Es verwundert etwas, daß diese Alternative in spieltheoretischen Untersuchungen bislang nicht stärker thematisiert worden ist. Außer den in Teil II dargestellten Arbeiten vgl. auch die empirische Untersuchung zum Exitverhalten im n-Personen-PD von Orbeil et al. (1984). 8) Im Modell wird die Kombination der Strategien nicht über einen Zufallsmechanismus vorgenommen, sondern durch eine Matrizenoperation. Zufall wird damit über die erwartete Kombinationshäufigkeit zweier Strategien in einer hinreichend großen Population repräsentiert. 9) Für einen Überblick über unendlich iterierte Spiele vgl. Aumann (1981) und van Damme (1987:171 ff.). 10) Das für die individualistische Soziologie zentrale Problem der Erklärung von sozialen Makrophänomenen durch Eigenschaften auf der Mi-
154
Anmerkungen zu Kapitel 3
kroebene des Individuums (vgl. Raub/Voss 1981: 88 ff.) verschiebt sich im gegenwärtigen Kontext. Makroveränderungen der Kooperativität in einer Akteurpopulation werden durch eine Mikroebene der evolutionären Konkurrenz von Strategietypen erklärt. Eine Erklärung bzw. Rekonstruktion auf der noch tiefer liegenden Mikroebene individuellen Verhaltens findet jedoch nicht statt. Diese Art des Ansatzes besitzt eine Parallele im Vorgenen der Ökonomie. Ökonomische Betrachtungen der Marktdynamik verzichten oft auf eine Ableitung aus dem individuellen Nutzenkalkül und unterstellen direkt bestimmte Differentialgleichungen für die Veränderung der Preise und der Angebots- und Nachfragemenge. 11) Die Möglichkeit eines gemischten Gleichgewichts, bei dem sich unterschiedlich kooperative Strategien in einer Population behaupten können, verweist auf die Notwendigkeit einer Präzisierung soziologischer Thesen zur egoistischen Kooperation. Implizieren normativistische Argumente, daß überhaupt keine dauerhafte Kooperation unter rationalen Egoisten entstehen kann, oder nur, daß keine völlig kooperative Ordnung unter ihnen möglich ist? Wie hoch darf der Prozentsatz unkooperativer Akteure in einer Population sein, damit noch vom Funktionieren der egoistischen Kooperation gesprochen werden darf? 12) Diese Art des Vorgehens läßt sich mit den Grundannahmen eines soziologischen und "darwinistischen" Paradigmas verbinden. Giesen und Lau (1981) kennzeichnen die Evolution und Selektion gesellschaftlicher Institutionen als Kern dieses Forschungsprogramms (vgl. auch Schmid 1987: 79 ff.). Der Strategienbegriff der vorliegenden Arbeit umfaßt durchaus institutionalisierte Verhaltensroutinen und ist damit für eine soziologische Evolutionstheorie einschlägig. Die Konstruktion des Modells zeigt auch, daß eine Analyse auf Individualebene in einem zweiten Schritt erfolgen könnte. Das entspricht der an sich plausiblen Forschungsstrategie, die Mikroerklärung eines komplexen Systems schrittweise durch das Einschieben verschieden tiefer Mikroebenen vorzunehmen. 13) Auf den ersten Blick ähnelt CONCO Axelrods FRIEDMAN-Strategie, die nach einer Defektion des Partners nie mehr mit ihm kooperiert. Dennoch sind die (hypothetischen) Verhaltenskalküle beider Strategien unterschiedlich plausibel. Es erscheint im Falle freiwilliger Iteration naheliegend, daß jemand die Kooperation mit einem Defekteur abbricht und seine Hoffnungen auf einen neuen Partner setzt. Im Falle der unvermeidlichen, längerfristigen Interaktion des Superspiels erscheint es jedoch unvernünftig, den Partner nicht zur Rückkehr zu kooperativem Verhalten bewegen zu wollen und selbst immer wieder die Nachteile der unkooperativen Lösung in Kauf zu nehmen. 14) Die Simulation erfolgte auf einem PC mit einem BASIC-Programm. Die Laufzeit für jeweils 1000 Runden betrug etwa 90 Minuten. Diese technische Zeitbeschränkung setzte auch dem Umfang der Modellanalysen Grenzen. 15) Im Suchpool befinden sich natürlich nicht nur ALL D-Strategien, und nicht nur diese finden durch den Zustrom kooperativer Strategien mehr Beute. ALL D profitiert von diesem Zustrom allerdings in besonderer Weise, da es nie Vorteil aus kooperativen Interaktionen zieht, und immer auf die anfängliche Gutwilligkeit seiner Partner angewiesen ist. 16) Auf eine Interpretation der Wirkungen des Regulationsfaktors R wird verzichtet, zum einen, weil er aufgrund der willkürlichen Annahme eines Evolutionsmechanismus kein eindeutig bestimmbares Äquivalent in der
Anmerkungen zu Kapitel3
155
Realität besitzt, und zum anderen, weil seine paradoxen Einflüße nur schwer interpretierbar sind. 17) Bei einem polymorphen Gleichgewicht besitzen verschiedene, reine Strategien stabile Anteile pj an einer Population, wobei 0 < pj < 1 gilt. Bei einem echten, gemischten Gleichgewicht können auch gemischte Strategien im Evolutionsprozeß und im Gleichgewichtszustand auftreten. 18) Ein Chicken (im Amerikanischen ein Slangwort für Feigling)-Spiel ist durch die Auszahlungsrelationen y > x > z > w definiert (vgl. Rapoport/Chammah 1969). Es soll Dilemmas der strategischen Konfrontation, wie z.B. die Kuba-Krise (vgl. Brams 1975: 39), repräsentieren. Die Untersuchung des Chicken-Spiels wurde von Rezensenten von Axelrod gefordert (1987). Ein Beispiel für eine Chicken-Matrix ist: AI
A2
B1
3,3
2,4
B2
4,2
1,1
156
Anmerkungen zu Kapitel 4
Anmerkungen zu Kapitel 4:
1) Friedman (1986: 94 ff.) und Trockel (1986) geben einen Überblick über Literatur und Dikussion zum finiten PD-Spiel. Eine empirische Untersuchung liefern Selten und Stoecker (1986). 2) In einem Spiel in extensiver Form ziehen die Spieler nacheinander und können in wechselndem Maße über die vorhergehenden Züge ihres Gegenübers informiert sein. In einem Spiel in Normalform, das die typische Matrixform aufweist, ziehen die Spieler simultan, ohne über die Strategiewahl des Gegenübers informiert zu sein. Das Argument der rückwärtslaufenden Induktion baut wesentlich auf einer extensiven Beschreibung des Spielablaufs auf, wenn unterstellt wird, daß die Akteure ökonomisch rational handeln. Im vorliegenden Kontext wird jedoch ein Übergang zur evolutionären Betrachtung vollzogen, bei der ein extensives Kalkül keine herausragende Rolle mehr spielt. 3) Eine Abdiskontierung wird wegen der evolutionären Modellierung und der begrenzten Länge des Superspiels unterlassen, wie es auch sonst in der Spieltheorie üblich ist (vgl. van Damme 1987:191 ff., 208 ff.). 4) Das Verhalten von TIT FOR TAT wäre im vorliegenden Kontext identisch mit dem von FRIEDMAN. FRIEDMAN wurde jedoch in der Formulierung des Modells vorgezogen, weil es strategisch bedeutsam ist, daß es nach der ersten Defektion zu keiner Kooperation zwischen zwei Partnern mehr kommt. TIT FOR TAT ist dagegen sehr schnell wieder bereit, zu kooperieren, wenn der Partner eine Wiedergutmachung leistet. Die selbst geäußerte Kritik an den Beschränkungen von FRIEDMAN trifft auch auf die eigene, evolutionäre Analyse des finiten PD-Superspiels zu. In späteren Untersuchungen sollte die Evolution von Kooperation im finiten PD-Superspiel ohne Beschränkung der Spieltaktiken behandelt werden. 5) Eine Strategie S aus der Strategiemenge £ = {Sj} ist genau dann eine Beste-Antwort-Strategie für Spieler j, wenn sie bei gegebener Strategiewahl S der anderen Spieler den Nutzen von j maximiert (vgl. Harsanyi 1977: 102): Uj(S*,S k ) = max Uj(S i( S k ), für alle Sj e £. 6) Für einen Überblick zu Theoremen über die Stabilität und die Querverbindungen zwischen evolutionär stabilen Strategien, Attraktoren und Gleichgewichten in der evolutionären Spieltheorie vgl. van Damme (1987: 208ff.). 7) Der Begriff des Chaos ist im Rahmen einer mathematischen ChaosTTieorie genau definiert (vgl. Deker 1983). Für den gegenwärtigen Kontext der Analyse eines deterministischen, dynamischen Systems ist wichtig, daß Chaos den grundlegend unterschiedlichen Verlauf von Trajektorien impliziert, die in einem Zustandsraum bei sehr ähnlichen Anfangswerten gestartet sind. 8) Zur Evolution moderner Gesellschaften enthält bereits Anm. 10 zur Einleitung einige Hinweise.
Anmerkungen zu Kapitel 4
157
9) Die Aufgabe der passenden Einfügung von Trajektorien ist nicht immer einfach zu bewältigen. Aber zumindest für zwei Dimensionen hat Zeeman (1980) eine vollständige Klassifikation aller stabilen Trajektorienkonfigurationen vorgelegt, an der man sich orientieren kann. Für höhere Dimensionen dürfte eine vergleichbare Klassifizierung aufgrund der kombinatorisch wachsenden Zahl von Fällen kaum möglich sein. 10) Wenn kein innerer Fixpunkt existiert, sind die Trajektorien im Inneren des vierdimensionalen Strategiensimplex durch die Trajektorien der Seitenflächen qualitativ eindeutig bestimmt (vgl. Zeeman 1981: 257). Deshalb erscheint die vereinfachte Darstelllung auch mathematisch legitim. 11) In einem Fixpunkt erreichen alle dort vorhandenen Strategien miteinander die gleiche Auszahlung. Wenn in jedem Unterraum des Strategiensimplex (mindestens) eine Strategie dominiert wird, kann keine allgemeine Identität der Auszahlungen und damit kein Fixpunkt existieren. Eine dominierte Strategie erhält für jede Kombination von Strategieanteilen weniger Auszahlung als die Strategie von der sie dominiert wird. 12) Die Normierung von Ej auf ein Minimum von Null ist aufgrund des linearen Zusammenhangs mit e technisch unproblematisch und kann durch Lineartransformation erfolgen. Inhaltlich kann die Transformation von E; ebensosehr etwas an der Dynamik des Modells ändern, wie die Auszahlungsmatrix in einem PD-Superspiel. Da die Modellparameter aber keine bestimmte, soziale Situation wiedergeben sollen, fällt dieser Punkt nicht ins Gewicht. 13) Das beschriebene Degradationsdilemma ist kein reines Degradationsspiel, weil, wie im finiten PD-Superspiel, eine Strategie von mehr als einer anderen dominiert wird. 14) Genau genommen wurden mehrere BASIC-Programme zur Evolution des Degradationsdilemmas benutzt. 15) Die große Differenz zwischen den Anteilen von S6 und S7 zeigt, daß die Geschwindigkeit evolutionärer Veränderungen während des Prozesses erheblich variiert. Der Prozeß wurde alle 25 Iterationen beobachtet. In Runde 2100 lag der Anteil von S7 noch deutlich niedriger als der von S6. 16) In diesem Kontext wird im folgenden nur mit Vorsicht von einem Gleichgewicht gesprochen werden. Die Stabilität eines Gleichgewichts wird üblicherweise auf analytischem Wege festgestellt. Hier werden nur die Ergebnisse einer Computersimulation interpretiert. Nach einer gewissen Laufzeit des Prozesses schwanken die Anteilswerte der Strategien allem Anschein nach nur noch zufällig um einen Mittelwert. Es wird angenommen, daß dieser Wert ein Gleichgewicht darstellt. Ohne analytische Fundierung, und aufgrund der begrenzten Laufzeit der Simulationen bleibt diese Annahme immer unsicher. 17) Die Konstruktion des Modells impliziert, daß keine Strategie dauerhaft aussterben kann. Die Zufallsschwankungen können auch ausgestorbene Strategien in jeder Runde mit einem gewissen Anteil ihrer Anfangspopulation ins Spiel zurückbringen. Dieser Anteil a beträgt aufgrund der Renormierung der Gesamtpopulation bei n Arten von Strategien, anfänglicher Gleichverteilung der Strategien und einem Fluktuationsparameter von f maximal:
158
Anmerkungen zu Kapitel 4
amax=l/f*n*(l+l/f*n) = l / ( f n + l ) . Für den vorliegenden Computerlauf mit n = 7 und f = 10 bedeutet das, daß a r n a x = 0,014 gilt. Eine Restpopulation von 1,4% kann daher für jede Strategie als artifizeller Effekt des verwendeten Zufallsmechanismus angesehen werden. Mit 7,8% ist SO von dieser maximalen Restgröße, und damit vom Aussterben unter Beachtung des Zufallsmechanismus, noch deutlich entfernt. Entsprechende Überlegungen sind auch bei allen weiteren Angaben von Populationsanteilen zu berücksichtigen. Aufgrund des unvermeidlichen Restanteils kann für f > 0 auch keine Strategie einen Anteil von eins erreichen. Meist bleiben die Strategien jedoch ohnehin unter ihrem maximal erreichbaren Populationsanteil.
Anhang
159
Anhang: Einige Grundbegriffe der Spieltheorie Spiel in Normalform Ein Spiel in Normalform ist definiert durch: a) Die Zahl n der Spieler b) n Mengen reiner Strategien, eine für jeden Spieler c) n Auszahlungsfunktionen, eine für jeden Spieler, wobei die Auszahlungen von der Strategiewahl aller Spieler abhängen (vgl. Luce/Raiffa 1957: 55). Reine Strategien werden dabei in der Spieltheorie die grundlegenden Handlungsalternativen der Spieler genannt. Die Auszahlungsfunktion U j gibt den Wert jeder möglichen Situation für Spieler i an, die durch verschiedene Handlungsentscheidungen aller Spieler entstehen kann. Die definitorischen Grundbegriffe des Spieles in Normalform gewinnen an Klarheit, wenn man sich die Spielmatrix betrachtet, durch die das Spiel repräsentiert wird. Ein Beispiel: Schere Schere Stein Papier
0,0 1,-1 -1,1
Stein
-1,1 0,0 1,-1
Papier
1,-1 -1,1 0,0
Diese Spielmatrix gibt die strategische Struktur des bekannten Spieles "Schere-Stein-Papier" wieder, das dadurch gekennzeichnet ist, daß zwei Spieler gleichzeitig eine Hand ausstrecken und Zeichen machen, die jeweils eine der drei Alternativen symbolisieren. Dabei gilt: Schere schlägt Papier, Papier schlägt Stein, Stein schlägt Schere. Es sei angenommen, daß die Verliererin in diesem Spiel eine Mark an die Gewinnerin zahlt. Zeigen beide Spieler das gleiche Symbol, erfolgt keine Zahlung. Unter diesen Bedingungen läßt sich die oben dargestellte Spielmatrix konstruieren. Die Menge der Spieler ist n=2, wobei jeder Spieler drei Handlungsalternativen bzw. reine Strategien besitzt. Dementsprechend kann die Spielstruktur auf einfache Weise durch eine Matrix repräsentiert werden, in der die Alternativen eines Spielers nach unten (Reihenspieler) und des
160
Anhang
anderen nach rechts (Spaltenspieler) aufgetragen werden. Für jede Kombination von Alternativen- oder Strategiewahlen (z.B. Reihenspieler wählt Schere, Spaltenspieler wählt Stein; realisiert wird das mittlere Ergebnis in der obersten Reihe der Matrix) ergibt sich eine Auszahlung (payoff) an die Spieler, die ihren Gewinn oder Verlust beschreibt. Die Zahl vor dem Komma gibt die Auszahlung an den Reihenspieler an, die nach dem Komma benennt den payoff des Spaltenspielers. Im allgemeinen Fall dürfte es schwieriger sein die Zahlenwerte in den Spielmatrizen zu interpretieren, da nicht generell um Geldbeträge gespielt wird. Allgemein drücken die Auszahlungen der Spieltheorie Nutzenwerte aus, die eine Situation für einen Spieler hat. Auf die Problematik von Nutzenmessungen sei hier nicht eingegangen. Für das Verständnis der spieltheoretischen Grundlagen der Arbeit reicht es aus, sich vorzustellen, daß die Spieler den Wert, den Ereignisse oder Situationen für sie haben in Geldbeträgen ausdrücken können, die dann in die Spielmatrix eingetragen werden. Wer es genauer wissen will, sollte die reiche Literatur zur Nutzentheorie konsultieren (z.B. Becker 1976; Fishburn 1970; Ng 1979). Die in der Spielmatrix vorfindlichen Strategien entsprechen auch oft nur einem Teil der den Handelnden offenen Alternativen, oder fassen diese in grobe Alternativenklassen (z.B. kooperieren versus nicht kooperieren) zusammen. Natürlich sind solche Vereinfachungen problematisch, aber sie sind unerläßlich, damit wenigstens Aspekte und bestenfalls die strategische Grobstruktur einer Interaktionssituation untersucht werden können.
Annahmen über die Spieler Ziel der Spieler ist es, ein Maximum an Auszahlungen für sich zu gewinnen. Der Gewinn oder der Verlust anderer Spieler interessiert sie nicht. Dabei wissen die Spieler nicht, wie die anderen Spieler wählen werden. Alle Spieler ziehen gleichzeitig ohne Kenntnis der Züge anderer. Es ist jedoch möglich, daß Spieler einander über ihre Absicht informieren, eine bestimmte Strategie zu wählen. Diese Information besitzt allerdings keinen verbindlichen Charakter, denn es gibt keine bindenden Vereinbarungen zwischen Spielern in den sogenannten nicht-kooperativen Spielen der
Anhang
161
Spieltheorie (vgl. Harsanyi 1977: 273). Hinweis: dieser Begriff der NichtKooperativität darf nicht mit der Kooperationsentscheidung in einem sozialen Dilemma verwechselt werden; beide sind voneinander völlig unabhängig. Weiterhin wird angenommen, daß alle Spieler die strategische Situation kennen, und also über die Handlungsalternativen und Situationsbewertungen (Auszahlungen) ihrer Mitspieler informiert sind. Änderungen an diesen Annahmen, die im Kontext einer evolutionären Spieltheorie vorgenommen werden, sind dem Text der Arbeit zu entnehmen.
Gemischte Strategien In der Spieltheorie wird üblicherweise angenommen, daß Spieler nicht nur ihre reinen Strategien wählen können, sondern auch einen Zufallsmechanismus, der jeder reinen Strategie eine Wahrscheinlichkeit zuordnet, mit der sie gespielt wird. Die Summe der zugeordneten Wahrscheinlichkeiten über der Menge der reinen Strategien muß für jeden Spieler eins ergeben. Im Schere-Stein-Papier Spiel könnte jeder Spieler dann z.B. jede Alternative mit Wahrscheinlichkeit ein Drittel spielen. Jede solche Wahrscheinlichkeitszuordnung
konstituiert eine bestimmte
gemischte
Strategie. Dominanz Als schwach dominant wird eine Strategie bezeichnet, wenn sie Spieler i unabhängig von der Strategiewahl der anderen Spieler eine immer wenigstens gleich hohe, aber mindestens einmal höhere Auszahlung einbringt, als jede andere ihm verfügbare Strategie. Sie ist stark dominant, wenn sie immer höhere Auszahlungen erzielt (vgl. Vorob'ev 1977: 38). Für den Reihenspieler und reine Strategien heißt das, daß die Auszahlungen in einer Reihe nie kleiner und manchmal größer sind als in anderen Reihen. Für den Spaltenspieler sind die Auszahlungen in einer Spalte größer oder gleich denen anderer Spalten.
162
Anhang
Falls eine solche Relation nicht für das gesamte Spiel gilt, sondern nur für jeweils einige Reihen oder Spalten, kann nicht mehr von genereller Dominanz gesprochen werden. In diesem Fall dominiert z.B. eine Reihe eine oder mehrere andere Reihen, ohne dominant im engeren Sinne zu sein.
Beste-Antwort-Strategie Eine Strategie heißt "beste Antwort" von i, wenn sie relativ zu einer festliegenden Strategiewahl der anderen Spieler die Auszahlung für Spieler i maximiert (vgl. Harsanyi 1977: 102).
(Nash-) Gleichgewicht In einem Spiel liegt ein Gleichgewicht vor, wenn bei gegebener Strategiewahl aller Spieler keiner der n Spieler einen Anreiz besitzt, eine andere als seine gewählte Strategie zu spielen (d.h. Gewinn machen kann), sofern alle anderen Spieler bei ihrer gewählten Strategie bleiben. In einem Gleichgewicht ist die Situation strategisch stabil, kein Einzelner hat Grund seine Strategiewahl zu ändern. Von der Existenz eines Gleichgewichtes wird auch gesprochen, wenn in einem Spiel eine Strategiekombination vorhanden ist, welche die Gleichgewichtseigenschaften besäße, sofern sie von den Spielern erzeugt würde. Es können mehrere oder auch keine Gleichgewichte in einem Spiel existieren. Die Strategien die bei Kombination zu einer solchen, gleichgewichtigen Situation führen werden Gleichgewichtsstrategien genannt.
Superspiel In einem Superspiel wird ein bestimmtes Spiel einfach mehrmals hintereinander (d.h. "iteriert") gespielt. Ziel der Spieler in einem Superspiel ist es, möglichst die Gesamtsumme ihrer Auszahlungen über die Reihe der Spiele zu maximieren. Dabei können zukünftige Auszahlungen bzw. die Erwartung zukünftiger Auszahlungen je nach Gegenwartspräferenz, also der Neigung, gegenwärtigen Nutzen zukünftigem vorzuziehen, geringer
Anhang
163
gewichtet werden. Sie werden dann im Maximierungskalkül bzw. der Summe der erwarteten Auszahlungen in den Einzelspielen mit einem sogenannten Diskontfaktor, der zwischen 0 und 1 liegt, multipliziert und dadurch "abdiskontiert". Im Superspiel weiß in der Regel jeder Spieler im i-ten Einzelspiel, wie seine Mitspieler in allen vorhergehenden Einzelspielen gezogen haben.
Gefangenendilemma (=Prisoner's Dilemma = PD) Der Name Gefangenendilemma rührt von der strategischen Situation zweier gefangener Verbrecherkomplizen beim getrennten Verhör her (vgl. Rapoport/Chammah 1965: 24ff.). Es wird angenommen, daß einer der Delinquenten eine erhebliche Straferleichterung als Kronzeuge erhält, wenn er "singt" und den genauen Ablauf des Verbrechens offenbart. Andererseits können die Komplizen nicht aller gemeinsam begangenen Verbrechen überführt werden, wenn sie beide dichthalten. Sie befinden sich nun in einer strategisch prekären Lage, in der vier entscheidungsrelevante Situationen entstehen können, die in der Folge zunehmender Vorteilhaftigkeit für die Spieler mit den Zahlen 1 bis 4 belegt werden. In zwei Situationen singt jeweils einer der beiden und wird Kronzeuge, was für ihn die beste Auszahlung 4 erbringt, während der andere alleine den Nachteil und die schlechteste Auszahlung 1 hat. Falls beide "singen" wird keiner Kronzeuge und beide müssen alle begangenen Verbrechen büßen, was zu der zweitschlechtesten Auszahlung 2 für beide führt. Halten dagegen beide dicht, werden sie nicht für alle Untaten verurteilt, was für sie das zweitbeste Ereignis, das mit 3 bewertet wurde, bedeutet: dichthalten dicht-
singen
3,3
1,4
4,1
2,2
halten singen
Aus individueller Sicht zeigt die Spielmatrix, daß es für jeden unabhängig von der Wahl des anderen eine höhere Auszahlung erbringt, wenn er singt. Singen ist eine dominante Strategie, aber als Folge erreichen beide ein Ergebnis das für jeden eine geringere Auszahlung (2,2) bringt, als das gemeinsame Dichthalten (3,3). Das macht den Widerspruch zwischen in-
164
Anhang
dividueller und kollektiver Rationalität deutlich, der im PD existiert. Dieser Widerspruch läßt sich im allgemeinen Handlungskalkül der Akteure so formulieren: "Wenn alle oder die meisten anderen sich solidarisch verhalten, kann ich ungestraft meinen egoistischen Vorteil suchen (ich richte bei sehr vielen Beteiligten damit nicht einmal großes Unheil an). Sofern jedoch alle so denken, fahren alle schlechter, als bei solidarischem Verhalten." In dieser Einkleidung wird sofort offenbar, daß das PD eine Problematik beschreibt, die für gesellschaftliche Dilemmas vom Umweltschutz bis zur Rüstung relevant ist. In der allgemeinen Form des PD wird die jeweils soldidarische Strategie mit C (= Cooperation, Kooperation) bezeichnet und die nicht solidarische mit D (= defection, Defektion). Bei zwei Personen repräsentieren die Variablen w, x, y, z die Auszahlungen: C
C x,x
D z, y
D
y, z
w,w
Dabei muß y > x > w > z und 2x > y+z gelten, damit ein Zwei-PersonenPD vorliegt (Rapoport/Chammah 1965: 35).
Literatur
165
Literatur: Akerlof, G. (1984): The Market for "Lemons", in: Akerlof, G.: An Economic Theorist's Book of Tales, Cambridge U.P., Cambridge Arrowsmith, D./Place, C. (1982): Ordinary Differential Equations, Chapman & Hall, London Aumann, R. (1981): Survey of Repeated Games, in: Aumann et al.: Essays in Game Theory and Mathematical Economics, Bibliographisches Institut, Mannheim Axelrod, R. (1987): Die Evolution der Kooperation, engl. 1984, Oldenbourg, München Axelrod, R./Dion, D. (1988): The Further Evolution of Cooperation, erscheint in: Science Becker, G. (1976): The Economic Approach to Human Behavior, University of Chicago Press, Chicago Beer, F. (1981): Games and Metaphors, Journal of Conflict Resolution, 30,171-191 Behr, R. (1981): Nice Guys Finish Last - Sometimes, Journal of Conflict Resolution, 25, 289-300 Bendor, J./Mookherjee, D. (1987): Institutional Structure and the Logic of Ongoing Collective Action, American Political Science Review, 81,129-154 Bernsdorf, W. (Hrsg.)(1969): Wörterbuch der Soziologie, Enke, Stuttgart Blau, P. (1964): Exchange and Power in Social Life, Wiley, New York Boudon, R. (1979): Die Widersprüche sozialen Handelns, Luchterhand, Darmstadt Brams, S./Schotter, A./Schwödiauer, G. (eds.) (1979): Applied Game Theory, Physica, Würzburg Buchler, I./Nutini, H. (eds.) (1969): Game Theory in the Behavioral Sciences, University of Pittsburgh Press, Pittsburgh Campbell, D. (1986): The Agenda Beyond Axelrod's "The Evolution of Cooperation", Political Psychology, 7,793-796
166
Literatur
Coleman, J. (1974): The Mathematics of Collective Action, Heineman, London Coleman, J. (1964): Collective Decisions, Sociological Inquiry, 34,166-181 Coleman, J. (1986): Social Structure and the Emergence of Norms among Rational Actors, in: Diekmann/Mitter (1986) Colman, A. (1982): Game Theory and Experimental Games, Pergamon Press, Oxford Damme, E. van (1987): Stability and Perfection of Nash Equilibria, Springer, Berlin Dawkins, R. (1978) Das egoistische Gen, Springer, Berlin Deker, U. (1983): Unberechenbares Spiel der Natur, Bild der Wissenschaft, 20, 62-75 Diekmann, A./Mitter, P. (eds.) (1986): Paradoxical Effects of Social Behavior, Physica, Heidelberg Donninger, C. (1986): Is it Always Efficient to be Nice? in: Diekmann/Mitter (1986) Dreitzel, H.P. (Hrsg.) (1967): Sozialer Wandel, Luchterhand, Darmstadt Dürkheim, E. (1961): Moral Education, 1. Ausgabe 1925, Free Press, Glencoe, 111. Dürkheim, E. (1977): Über die Teilung der sozialen Arbeit, 1. Ausgabe 1893, Suhrkamp, Frankfurt Dürkheim, E. (1983): Der Selbstmord, 1. Ausgabe 1897, Suhrkamp, Frankfurt Eisenstadt, S. (1973): Tradition, Change and Modernity, Wiley, New York Ekeh, P. (1974): Social Exchange Theory, Heineman, London Fishburn, P. (1970): Utility Theory for Decision Making, Wiley, New York Friedman, J. (1986): Game Theory with Applications to Economics, Oxford U.P., New York
Literatur
167
Giesen, B. (1980): Makrosoziologie, Hoffmann & Campe, Hamburg Giesen, B./Lau, C. (1981): Zur Anwendung darwinistischer Erklärungsstrategien in der Soziologie, Kölner Zeitschrift für Soziologie, 33,229-255 Gould, J./Kolb, W. (eds.) (1964): A Dictionary of the Social Sciences, Tavistock, London Gouldner, A. (1984): Reziprozität und Autonomie, Suhrkamp, Frankfurt Gowa, J. (1986): Anarchy, Egoism, and Third Images, International Organization, 40,167-186 Guerin, D. (1969): Anarchismus, Suhrkamp, Frankfurt Haken, H. (1977): Synergetics, Springer, Berlin Hamburger, H. (1973): N-Person Prisoner's Dilemma, Journal of Mathematical Sociology, 3,27-48 Hardin, R. (1968): The Tragedy of the Commons, Science, 162,1243-1248 Harsanyi, J. (1977): Rational Behavior and Bargaining Equilibrium in Games and Social Situations, Cambridge U.P., Cambridge Hechter, M. (1987): Principles of Group Solidarity, UCLA Press, Berkeley Hirschman, A. (1974): Abwanderung und Widerspruch, Mohr, Tübingen Hirschman, A. (1984): Leidenschaften und Interessen, Suhrkamp, Frankfurt Hirshleifer, D. (1988): Cooperation in a Finitely Repeated Prisoner's Dilemma Game With Ostracism, University of California, Los Angeles, mimeo Hobbes, T. (1959): Vom Bürger, 1. Ausgabe 1642, Meiner, Hamburg Hobbes, T. (1980): Leviathan, 1. Ausgabe 1651, Reclam, Stuttgart Hofbauer, J./Sigmund, K. (1984): Evolutionstheorie und dynamische Systeme, Parey, Berlin
168
Literatur
Hofstadter, D. (1983): Ist Kooperation ein Lotteriespiel? Spektrum der Wissenschaft, 9,8-14 Homans, C. (1974): Social Behavior - Its Elementary Forms, Harcourt Brace, New York Homans, C. (1984): "The Evolution of Cooperation" by Robert Axelrod, Theory and Society, 14, 893-897 Jantsch, E. (1982): Die Selbstorganisation des Universums, dtv, München Joll, J. (1964): Die Anarchisten, Propyläen, Berlin Jones, R. (1986): Emile Dürkheim, Sage, Beverly Hills Kahneman, D./Slovic, P./Tversky, A. (1982): Judgement under Uncertainty, Cambridge U.P., Cambridge Klages, H. (1975): Die unruhige Gesellschaft, Beck, München Kliemt, H. (1986a): The Veil of Insignificance, European Journal of Political Economy, 2/3, 333-344 Kliemt, H. (1986b): Antagonistische Kooperation, Alber, Freiburg Kliemt, H./Schauenberg, B. (1982): Zu M. Taylors Analyse des Gefangenendilemmas, Analyse und Kritik, 4, 71-96 König, R. (1969): Anomie, in: Bernsdorf (1969) Kreps, D./Milgrom, P./Roberts, J./Wilson, R. (1981): Rational Cooperation in the Finitely Repeated Prisoner's Dilemma, Journal of Economic Theory, 27, 245-252 Kreps, D./Wilson, R. (1982a): Sequential Eqilibrium, Econometrica, 50, 863-894 Kreps, D./Wilson, R. (1982b): Reputation and Imperfect Information, Journal of Economic Theory, 27, 253-279 Kropotkin. P. (1910): Gegenseitige Hilfe, Verlag Thomas, Leipzig Kuhn, T. (1979): Die Struktur wissenschaftlicher Revolutionen, Suhrkamp, Frankfurt
Literatur
Lakatos, I. (1978): Die Methodologie der wissenschaftlichen Forschungsprogramme, Vieweg, Braunschweig Landa, J./Grofman, B. (1981): Games of Breach and the Role of Contract Law in Protecting the Expectation Interest, Research in Law and Economics, 3, 67-90 Lindenberg, S. (1983): The New Political Economy, in: Sodeur (1983) Lovejoy, A. (1961). Reflections on Human Nature, Johns Hopkins Press, Baltimore Luce, R./Raiffa, H. (1957): Games and Decisions, Wiley, New York Lukes, S. (1973a): Emile Dürkheim, Penguin, Harmondsworth Lukes, S. (1973b): Individualism, Basil Blackwell, Oxford Macpherson, C. (1973): Die politische Theorie des Besitzindividualismus, Suhrkamp, Frankfurt/M. Mandeville, B. (1980): Die Bienenfabel, 1. Ausgabe 1714, Suhrkamp, Frankfurt Margolis, H. (1982): Selfishness, Altruism and Rationality, Cambridge U.P., Cambridge May, R. (1987): More Evolution of Cooperation, Nature, 327, 15-17 Maynard Smith, J. (1974): The Theory of Games and the Evolution of Animal Conflicts, Journal of Theoretical Biology, 47,209-221 Maynard Smith, J. (1982): Evolutionary Game Theory, Cambridge U.P., Cambridge Merton, R. (1968): Social Theory and Social Structure, Free Press, New York Milgrom, P. (1984): Axelrod's "The Evolution of Cooperation", Rand Journal of Economics, 15,305-309 Milgrom, P./Roberts, J. (1982): Predation, Reputation, and Entry Deterrence, Journal of Economic Theory, 27, 280-312
169
170
Literatur
Mueller, D. (1979): Public Choice, Cambridge U.P., Cambridge Münch, R. (1979a): Talcott Parsons und die Theorie des Handelns I, Soziale Welt, 30,385-409 Münch, R. (1979b): Talcott Parsons und die Theorie des Handelns II, Soziale Welt, 31,3-47 Münch, R. (1982): Theorie des Handelns, Suhrkamp, Frankfurt Neumann, J.v./Morgenstern, O. (1944): Spieltheorie und wirtschaftliches Verhalten, Physica, Würzburg Ng, Y. (1979): Welfare Economics, Macmillan, London Noelle-Neumann, E. (1978): Werden wir alle Proletarier?, Interfrom, Zürich Noelle-Neumann, E./Strümpel, B. (1984): Macht Arbeit krank? Macht Arbeit glücklich? Piper, München Nozick, R. (1976): Anarchie Staat Utopie, Moderne Verlags GmbH, München Olson, M. (1968): Die Logik des kollektiven Handelns, Mohr, Tübingen Olson, M. (1982): The Rise and Decline of Nations, Yale U.P., New York Opp, K.D. (1978): Das "ökonomische Programm" in der Soziologie, Soziale Welt, 29,129-154 Opp, K.D. (1982): The Rational Choice Model, paper presented at the 11th Conference of the Unity of Sciences, Philadelphia Opp, K.D. (1983): Die Entstehung sozialer Normen, Mohr, Tübingen Opp, K.D. (1984): Soziale Probleme und Protestverhalten, Westdeutscher Verlag, Opladen Orbell, J./Schwartz-Shea, P./Simons, R. (1984): Do Cooperators Exit More Readily than Defectors?, American Political Science Review, 78,147-162 Parsons, T. (1949): The Structure of Social Action, 1. Ausgabe 1937, Free Press, Glencoe, 111.
Literatur
Parsons, T. (1961): The Point of View of the Author, in: Black (1961) Parsons, T. (1977): Social Structure and the Symbolic Media of Interchange, in: Parsons, T.: Social Systems and the Evolution of Action Theory, Free Press, New York Platon (1958): Politeia, Werke Bd. II, Rowohlt, Hamburg Popper, K. (1984): Logik der Forschung, 1. Ausgabe 1935, Mohr, Tübingen Prigogine, I. (1979): Vom Sein zum Werden, Piper, München Rapoport, A. (1969): Games as Tools of Psychological Research, in: Buchler/Nutini (1969) Rapoport, A./Chammah, A. (1965): Prisoner's Dilemma, University of Michigan Press, Ann Arbor Rapoport, A./Chammah, A. (1969): The Game of Chicken, in: Buchler/Nutini (1969) Raub, W. (1986): Problematic Social Situations and the "Large-Number-Dilemma", New Dehli, mimeo Raub, W./Voss, T. (1981): Individuelles Handeln und gesellschaftliche Folgen, Luchterhand, Darmstadt Raub, W./Voss, T. (1986a): Conditions for Cooperation in Problematic Social Situations, in: Diekmann/Mitter (1986) Raub, W./Voss, T. (1986b): Die Sozialstruktur der Kooperation rationaler Egoisten, Zeitschrift für Soziologie, 15,309-323 Raub, W./Weesie, J. (1988): Reputation and Efficiency in Social Interactions, Utrecht, mimeo Riker, W./Ordeshook, P. (1973): Introduction to Positive Political Theory, Prentice-Hall, Englewood Cliffs Robbins, H. (1984): The Nature and Significance of Economic Science, New York U.P., New York
171
172
Literatur
Rogowski, R. (1985): The Evolution of Co-Operation, Review; of Axelrod, Political Theory, 13, 457-461 Schelling, T. (1978): Micromotives and Macrobehavior, Norton, New York Schlenker, B./Bonoma, T. (1978): Fun and Games, Journal of Conflict Resolution, 22,7-38 Schmid, M. (1987): Collective Action and the Selection of Rules, in: Schmid/Wuketits (1987) Schmid, M./Wuketits, F. (eds.) (1987): Evolutionary Theory in the Social Sciences, D. Reidel, Dordrecht Schotter, A. (1981): The Economic Theory of Social Institutions, Cambridge U.P., Cambridge Schüßler, R. (1986): The Evolution of Reciprocal Cooperation, in: Diekmann/Mitter (1986) Schüßler, R. (1988): Der Homo Oeconomicus als skeptische Fiktion, Kölner Zeitschrift für Soziologie, 3, 447-463 Schüßler, R. (1989): The Gradual Decline of Cooperation, Theory and Decision, 26, 133-155 Schüßler, R. (1989a): Exit Threats and Cooperation under Anonymity, Journal of Conflict Resolution, 33, 729-749 Selten, R. (1978): The Chain Store Paradox, Theory and Decision, 9, 127-159 Selten, R./Stoecker, R. (1986): End Behavior in Sequences of Finite Prisoner's Dilemma Supergames, Journal of Economic Behavior and Organization, 7,47-70 Shalom, S. (1986): "The Evolution of Cooperation". By Robert Axelrod, Journal of Politics, 48, 234-236 Shubik, M. (1970): Game Theory, Behavior, and the Paradox of the Prisoner's Dilemma, Journal of Conflict Resolution, 14, 181-193 Shubik, M. (1975): Games for Society, Business and War, Elsevier, New York
Literatur
173
Shubik, M. (1982): Game Theory in the Social Sciences, MIT Press, Cambridge,Mass. Simmel. G. (1908): Soziologie, Duncker & Humblot, Leipzig Sodeur, W. (Hrsg.) (1983): Ökonomische Erklärungen menschlichen Verhaltens, Verlag der sozialwissenschaftlichen Kooperative, Duisburg Sorokin, P. (1928): Contemporary Sociological Theories, Harper & Row, New York Spencer, H. (1872): Principles of Psychology, Vol II, 1. Ausgabe 1855, Williams & Norgate, London Spencer, H. (1888): Principles of Sociology, Vol. II, Appleton, New York Spencer, H. (1893): Social Statics, 1. Ausgabe 1851, Appleton, New York Spykman, N. (1966): The Social Theory of Georg Simmel, 1. Ausgabe 1925, Atherton Press, New York Stephen, L. (1949): History of English Thought in the 18th Century, 2 vols, 1. Ausgabe 1876, P. Smith, New York Stigler, G. (1961): The Economics of Information, Journal of Political Economy, 69,213-225 Taylor, M. (1976): Anarchy and Cooperation, Wiley, London Taylor, M. (1987): The Possibility of Cooperation, Cambridge U.P., Cambridge Taylor, P./Jonker, L. (1978): Evolutionary Stable Strategies and Game Dynamics, Mathematical Biosciences, 40, 145-156 Tönnies, F. (1935): Gemeinschaft und Gesellschaft, 1. Ausgabe 1887, Hans Buske, Leipzig Trockel, W. (1986): The Chain Store Paradox Revisited, Theory and Decision, 21,163-179 Tversky, A. (1975): A Critique of Expected Utility Theory, Erkenntnis, 9,163-173 Ullmann-Margalit, E. (1977): The Emergence of Norms, Clarendon Press, Oxford
174
Literatur
Vorob'ev, N. (1977): Game Theory, Springer, New York Voss, T. (1985): Rationale Akteure und soziale Institutionen, Oldenbourg, München Warrender, H. (1957): The Political Philosophy of Hobbes, Clarendon Press, Oxford Weber-Schäfer, P. (1976): Einführung in die antike politische Theorie, 2. Bde., Wissenschaftliche Buchgesellschaft, Darmstadt Williams, R. (1961): The Sociological Theory of Talcott Parsons in: Black (1961) Wippler, R. (1978): Nicht-intendierte soziale Folgen individueller Handlungen, Soziale Welt, 29,155-179 Woodcock, G. (1963): Anarchism, Penguin, Harmondsworth Zapf, W. (Hrsg.) (1969): Theorien des sozialen Wandels, Kiepenheuer & Witsch, Berlin Zeeman, E. (1980): Population Dynamics from Game Theory, in Nitecki, Z./Robinson, C. (eds.): Global Theory of Dynamical Systems, Springer, Berlin Zeeman, E. (1981): Dynamics of the Evolution of Animal Conflicts, Journal of Theoretical Biology, 89,249-270
Register
Register: (im Text ausführlich behandelte Autoren sind unterstrichen) Akerlof.,.155 Anarchismus...1, 55,138,140 Anomie...93 Anonymität...4, 7,16, 39,42,61 Arrowsmith...llO, 111 Assurance game...l50 atomistisch...l, 9, 61, 66,138 Attraktor.,.158 Aumann...48,155 Austauschmedien...62 Axelrod...22ff. BANISHMENT...56 Becker... 1,148, 162 Beer.,.33,34,36, 37 Behr...35 Bendor...52ff. Berkeley... 149 Binomialverteilung...50 Biologie...l9, 40, 71, 91,105,137,150 Blau...62 Boudon...l Bösartigkeit...l, 8,17,138,146 Brams...20,157 Campbell...33, 34, 35 Chammah...l9,23, 90,151,157, 165 Chaos... 108,158 Chicken-Spiel...33, 90,151 Coleman...38ff. Damme, van...20,150,155,158 Dawkins...l37 Degradationsdilemma... 116 Degradationsspiel...99 Deker.,.158 dezentral...45,53, 97, 137, 146 Differenzengleichungen... 120 Dion...38,149 Diskontierung...23, 29,56,101, 153 Dominoeffekt...99 Donninger.,.34, 35 Dreitzel...l49 Durkheim...l4ff. Echoeffekte...35, 66 Egoismus...148 Eisenstadt... 149 Ekeh...62 Evolutionäre Spieltheorie... 19, 108 Evolutionäre Stabilität...37,105,106,158 Exchange theory...62 Exit-Option...36, 48, 77, 95, 120,155 Finites Gefangenendilemma...99 Fishburn...l62 Fixpunkte...lll frei willig...1, 8, 12, 45,53, 77, 91,138,146
175
176
Register
Friedman...1,100,158 Gedächtnis...39,40,94,138 Gewaltmonopol...l38 Giesen...108,149,156 Gouldner.,.150 Gowa...28,29, 35 Grofman...63 Gut, kollektives...45, 97, 98,115,136,144 Gut, öffentliches...8, 44, 60,116,139,144 Haken...75 Hamburger...152 Handelskettenparadox. ..115 Hardin...ll6 Harsanyi...90,148, 152, 158,163,164 Harsanyi-Dilemmas...l52 Hechter...140 Hirschman...l55 Hirshleifer...55ff. Hobbes...7, 8, 9, 44,53, 59,116,138,148,152 Hobbesscher Urzustand...8,44,140 Hofbauer... 19,73,91,105,150 Hofstadter.,.152 Homans...33, 34, 35 Inclusive fitness...l37 Industriegesellschaft...7, 9,12 Irreguläres PD...90 Irrtum...51, 57, 69, 95,146,151,154 Jantsch...75 Jonker...70,108 Kahneman...20 Keynes...88 Klages...l6 Kliemt...93,148,149,153 Kollektive Stabilität...24 Kooperation...41 Koordinationsdilemma... 151 Kreps...l01,115 Kuba-Krise...157 Landa...63 Lau... 108,156 Leben-und-leben-Iassen-System...25, 26 Lindenberg... 1 Lovejoy...l49 Luce...l, 20,56,99,161 Machtelite...138 Macpherson...l52 Margolis...l48 May...34 Maynard Smith...24, 37,40,105 Merton...93 Mikro-Makro-Problem...l55,156 Milgrom.,.34, 36, 115 Mischpopulation...136 Moderne... 1,4, 9, 16, 42, 63, 92,141 Mookherjee...52ff. Moral...2, 7,12, 26, 43,57, 97,115, 140 Morgenstern...1,18,19 Mutationen... 121
Register
Münch... 155 Neoklassische Ökonomie...4,20,148 Neoutilitarismus...l, 140,153 Neumann, von... 1,18,19 Ng...l52,162 Noelle-Neumann...l6 Normativ-präskriptive Spieltheorie...20 Normentstehung...64,148 Normierung...73, 74,117,118, 124,159 Nozick...45,141 Nullsummenspiele...l50 Nutzen... 148 Olson.,.1,31,44, 48,144,145 Opp...l, 148 Orbell...l55 pareto-inferior... 152 Parsons...l, 45,62,92,152,153,155 Place... 110,111 Planwirtschaften...7, 143 Piaton...98,144, 149 Polymorphes Gleichgewicht...157 Prigogine...75 Prinzip der späteren Vergeltung...l6,137 Qualitätsproduktion... 143 Raiffa...l, 20,56,99,161 Rapoport...l9, 23, 90,151,157,165 Rationaler Egoist... 148 Raub...l, 146,150, 151,152,153,156 Räuber-Beute-System...73,84 Reputation...94, 153 Reziprozität...26,32, 150 Ring des Gyges...l49 Roberts... 115 Rogowski...33, 34, 36 RUDIBAN...58 Rückwärtslaufende Induktion...99 Sanktionsmittel...7, 77 Schatten der Zukunft... 152 Schauenberg.,.153 Schelling...l52 Schleichender Verfall... 116,124,144 Schleier des Nichtwissens...93 Schmid...l56 Schotter... 19,148,150 Schrumpfungsprozeß...75 Schutzbünde...45,97,116,140 Schüßler.,.106,110,121,148,150 Schwellenwert... 16, 98,115,136 Selten...20, 101,158 Shalom...34, 35 Shubik.,.149,150 Sigmund... 19, 73, 91, 105, 150 Simmel...l49 Sollbeitrag...ll6 Sombart...l49 Sorokin...l49 Soziale Evolutionsprozesse... 108 Soziologische Evolutionstheorie...156
177
178
Register
Spencer...l2ff. Spiel in extensiver Form... 158 Spieldynamische Differentialgleichungen..^, 73,108 Spykman.,.149 Stigler...l55 Stoecker.,.158 Strategiensimplex... 111 Strümpel...l6 Suchpool...69 Superrationalität... 152 Tavlor—46. 70.108ff. Totalitarismus...97,139 Tönnies.,.10ff. Trajektorien...llO Trockel...l58 Tversky...20 Ullmann-Margalit...l48 Umweltprobleme...!, 4, 7, 17, 44, 60,138, 145,166 Überwachung...52, 97 Vernetzung von Akteuren... 153 Voltaire... 149 Vorob'ev...l50,163 Voss...l, 49, 64,146,148,150, 151, 152, 153,156 Wachstumsprozeß...74 Was-wäre-wenn-Betrachtung...2, 4 Weber-Schäfer...98 Weesie...l53 Wilson... 101,115 Wippler... 1 Zapf... 149 Zeeman...l9, 70, 73,91,110,150,159 Zeitdiagnose... 17 Zentralgewalt...7, 9,44, 52, 97,115,126,136,144 Zufallsschwankungen... 124,159 Zyklizität... 17, 88, 98,107, 113,122,145