219 39 6MB
German Pages 221 [224] Year 1990
Evolution und Spieltheorie
Scientia Nova Herausgegeben von Rainer Hegselmann, Gebhard Kirchgässner, Hans Lenk, Siegwart Lindenberg, Werner Raub, Thomas Voss
Bisher erschienen u. a.: Robert Axelrod, Die Evolution der Kooperation Karl H. Borch, Wirtschaftliches Verhalten bei Unsicherheit Churchman/Ackoff/Arnoff, Operations Research Erklären und Verstehen in der Wissenschaft Bruno de Finetti, Wahrscheinlichkeitstheorie Richard C. Jeffrey, Logik der Entscheidungen Mathematische Methoden in der Politikwissenschaft Nagel/Newman, Der Gödelsche Beweis John von Neumann, Die Rechenmaschine und das Gehirn Erhard Oeser, Wissenschaft und Information Howard Raiffa, Einführung in die Entscheidungstheorie Erwin Schrödinger, Was ist ein Naturgesetz? Rudolf Schüßler, Kooperation unter Egoisten: vier Dilemmata Thomas Voss, Rationale Akteure und soziale Institutionen Hermann Wey!, Philosophie der Mathematik und Naturwissenschaft
Evolution und Spieltheorie Herausgegeben von Ulrich Mueller
R. Oldenbourg Verlag München 1990
Die englischsprachigen Beiträge wurden vom Herausgeber übersetzt.
CIP-Titelaufnahme der Deutschen Bibliothek Evolution und Spieltheorie / hisg. von Ulrich Mueller. München : Oldenbourg, 1990 (Scientia nova) ISBN 3-486-55839-0 NE: Mueller, Ulrich [Hrsg.]
© 1990 R. Oldenbourg Verlag GmbH, München Das Werk einschließlich aller Abbildungen ist urheberrechtlich geschützt. Jede Verwertung außerhalb der Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Bearbeitung in elektronischen Systemen. Umschlagentwurf: Dieter Vollendorf Gesamtherstellung: WB-Druck, Rieden
ISBN 3-486-55839-0
Inhalt Ulrich
Mueller
Einleitung John
Maynard
1 Smith und G.R.
Price
Die Logik des Konflikts John
Maynard
15
Smith
Spieltheorie und die Evolution von Konfliktstrategien John
Maynard
25
Smith
Kann eine gemischte Strategie in einer endlichen Population evolutionsstabil sein? Peter Schuster und Karl Sigmund Zu einer Dynamik des Sozial Verhaltens: Strategische und genetische Modelle von Konflikten zwischen Tieren Ulrich Mueller Optimale Vergeltung zwecks optimaler Kooperation
Joel S. Brown, Michael J. Sanderson und Richard E. Die Evolution sozialen Verhaltens durch Reziprozität Robert
29
37 61
Michod 83
Axelrod
Normen unter evolutionärer Perspektive
105
Sandra L. Vehrencamp Die Evolution von despotischen oder egalitären Gesellschaftsformen
129
D. Timothy Bishop, Chris Cannings und John Maynard Abnutzungskrieg mit zufallsverteilten Auszahlungen
I55
Smith
John Maynard Smith und Geoffrey Α. Parker Die Logik asymmetrischer Auseinandersetzungen
169
Literaturverzeichnis
199
Quellenverzeichnis
210
Sachregister
211
Autorenregister
213
Einleitung Die Spieltheorie wurde von ihren G r ü n d e r n , dem M a t h e m a t i k e r J o h n von N e u m a n n (1903-1957) u n d dem Ökonomen Oskar Morgenstern (1902-1977) entworfen als eine normative Theorie darüber, wie sich rationale, nutzenmaximierende Akteure optimal zu verhalten h ä t t e n in Situationen strategischer Interaktion, in denen es keine völlige Gleichsinnigkeit der Einzelinteressen gibt. Die elementaren Begriffe der Spieltheorie sind die Spieler, ihre Handlungsstrategien u n d ihre Nutzen- oder Auszahlungsfunktionen, die den Nutzen der jeweiligen Spielergebnisse f ü r den einzelnen Spieler ausdrücken. Wir können es zunächst bei einem intuitiven Verständnis dieser Begriffe bewenden lassen; wer mit der Spieltheorie gänzlich unvertraut ist, findet formale Definitionen dieser elementaren Begriffe a m Ende der Einleitung. Die wichtigste von diesen elementaren Begriffen abgeleitete Idee ist die des Gleichgewichts: ein Ergebnis, eine Konfiguration der Strategieentscheidungen der einzelnen Spieler, ist genau d a n n ein Gleichgewicht, wenn, grob gesprochen, jedes einseitige Abweichen von diesem Ergebnis den betreffenden Spieler nur schlechter oder höchstens gleich gut stellen kann. Folglich h a t keiner der Spieler ein Interesse, von einem Gleichgewicht, wenn es einmal erreicht ist, abzuweichen. Unterstellen wir überdies bei den Spielern eine Art von Verständnis des Spieles, so können wir die Frage, welche Wahl die einzelnen Spieler in ein e m Spiel treffen werden, so beantworten: sie werden sich - ob sogleich oder nach längerem Hin u n d Her - in einem Gleichgewicht wiederfinden, sofern ein solches existiert. Diese Antwort hilft uns nicht viel weiter bei mehreren Gleichgewichten, insbesondere nicht in dem Fall suboptimaler Gleichgewichte, in denen einige sich schlechter u n d keiner sich besser stellt als in anderen, ebenfalls möglichen Gleichgewichten: ist m a n erst einmal dort, so wird einen ein einseitiges Abweichen auch nur schlechter stellen, so sehr ein simultanes, koordiniertes Abweichen aller hin zu einem optimalen Gleichgewicht alle mindestens gleich gut stellen würde. Die Frage nach der Erreichbarkeit optimaler Gleichgewichte kann auf verschiedene Weise beantwortet werden. Entweder wir fragen, mit welchen Strategien in welchen Spielen rationale Egoisten einander dazu bringen können, gemeinsam zu einem optimalen Gleichgewicht zu kommen, ohne die in einer solchen Bewegung gegebenen Möglichkeiten gegenseitiger A u s b e u t u n g auszunutzen - diese Frage wird in diesem Band in den Aufsätzen von Brown et al., Mueller u n d Axelrod ausführlich diskutiert. Oder aber wir lassen einfach als Axiom bindende K o n t r a k t e zwischen den Spielern zu - damit gehen wir von der allgemeinen, nicht-kooperativen Spieltheorie zu einem Sonderzweig der Spieltheorie, der Theorie kooperativer Spiele über. Bindende Kontrakte, u n d damit die Theorie kooperativer Spiele ü b e r h a u p t werden allerdings in diesem Buch keine Rolle spielen.
2
Ulrich
Mueller
Zwei Beispiele zur Illustration der allgemeinen Definitionen: Das Spiel Knobeln besteht aus zwei Spielern, drei Strategien (Schere, Papier, Stein) und der Auszahlungsfunktion: Schere schneidet Papier, Papier wickelt Stein, Stein schleift Schere, wobei der Gewinner einen P u n k t erhält und der Verlierer einen abgezogen bekommt. Spielen beide Spieler dieselbe Strategie, so erhalten beide die Auszahlung e.
Spieler A
Stein Schere Papier
Stein e, e -1,1 1,-1
SpielerB Schere 1,-1 e, e -1,1
Papier -1,1 1,-1 e, e
(1)
wobei die Ziffern vor dem K o m m a die Auszahlungen an den Spieler A u n d die Ziffern nach dem K o m m a die Auszahlungen an den Spieler Β bezeichnen. Ein anderes Spiel ist das Vorfahrtsspiel: Zwei einander entgegenkommende Fahrer wollen an einer engen Kreuzung jeweils nach links abbiegen, was für beide nicht gleichzeitig möglich ist. Setzen wir willkürlich Auszahlungen fest (Blechschaden = —1000, langes Warten = —10, kurzes Warten = —1) so können wir dieses Spiel durch die folgende Auszahlungsmatrix beschreiben:
Fahren
FahrerB Fahren Warten -1000, -1000 0, -1
Warten
-i,o
(2)
Fahrer A -10, -10
Das Spiel Knobeln besitzt, falls e < 1, d a n n nur unter den gemischten Strategien ein Gleichgewicht (Spieler A: 1 / 3 Stein, 1 / 3 Schere, 1 / 3 Papier; Spieler B: 1 / 3 Stein, 1 / 3 Schere, 1 / 3 Papier). F ü r e > 1 besitzt Knobeln nur drei reine Gleichgewichte (Spieler A: Stein; Spieler B: Stein. Spieler A: Schere; Spieler B: Schere. Spieler A: Papier; Spieler B: Papier). Das Vorfahrtsspiel besitzt genau zwei reine Gleichgewichte: (Fahren; Warten) und (Warten; Fahren). Beim Knobeln ist überdies, falls e = 0, die Summe der Auszahlungen eines jeden der möglichen Ereignisse konstant, also die Summe der Nutzenveränderungen gleich Null; dies ist beim Vorfahrtsspiel nicht der Fall. Dieser Unterschied ist bedeutsam: nur wenn die Summe der jeweiligen Auszahlungen nicht von Ereignis zu Ereignis konstant bleibt, ist es sinnvoll, O p t i m a l i t ä t s - oder überhaupt Effizienzgesichtspunkte anzusprechen. Die Theorie der Konstantsummenspiele ist mathematisch einfacher, kompakter, aber die Theorie der Nicht-Konstantsummenspiele ist natürlich wichtiger für das Verständnis strategischer Interaktion in der realen Welt. Neben
Einleitung
3
anderem verklammert sie die allgemeine Spieltheorie mit der neoklassischen MikroÖkonomie. Die Spieltheorie durchlief von der Mitte der vierziger - von Neumann's und Morgenstern's „Theory of Games and Economic Behavior" erschien 1944 - bis zum Anfang der fünfziger J a h r e eine Phase rascher Entwicklung; es waren in den Verhaltenswissenschaften vor allem die Ökonomen, die sich neue Anstöße für ihre eigenen theoretischen Grundlagen erhofften, sei es für die Theorie von Oligopolen und Kartellen, sei es für Modelle von Tarifauseinandersetzungen und Arbeitskämpfen, sei es für die Theorie öffentlicher Güter. Blickt man auf diese erste Phase der Entwicklung der Spieltheorie und ihre Anwendungen in der MikroÖkonomie zurück, so muß das Urteil mehrdeutig ausfallen: trotz der unbestreitbaren Kraft der neuen Ideen sind die - vor allem ökonomischen - Anwendungen nicht wirklich überzeugend geworden. Die zunehmende mathematische Verfeinerung hat bei aller Brillanz die Theorie nicht kreativer, sondern eher steriler gemacht. In keinem Zweig der MikroÖkonomie - und der Verhaltenswissenschaften allgemein - konnte die Spieltheorie die vorgefundenen theoretischen Fundamente ersetzen. In den sich anschließenden 20 Jahren bis Anfang der siebziger J a h r e wurde die weitere Entwicklung der Spieltheorie durch Mathematiker geprägt, denen an der exakten Definition von Axiomen und der Strenge von Beweisen mehr gelegen war als an der Ausweitung und Anwendung der Theorie. Seit Beginn der siebziger Jahre hat die Spieltheorie in einer Reihe von Teilgebieten einen neuen Aufschwung genommen, der unvermindert bis heute anhält. Hier sind zu nennen: die Theorie von iterativen Spielen, die aus einer ganzen Serie von Spielrunden bestehen; die Theorie von dynamischen Spielen, in denen die Spieler ihre Entscheidungen nicht simultan, sondern sukzessive, jeweils in Kenntnis früherer Entscheidungen der anderen Spiele treffen können; und schließlich die Theorie von solchen Spielen, in denen die Spieler nur unvollständige und gegebenenfalls auch asymmetrische Information über die Struktur des Spiels oder den bisherigen Spielverlauf haben. Gemeinsam ist all diesen Entwicklungen, daß sie unverändert in der Tradition der klassischen Spieltheorie als einer Theorie rationaler Wahl stehen und damit unverändert nur eine normative, nicht aber eine deskriptive Theorie sozialen Handelns anzubieten haben. Sie bringen Aussagen hervor, wie Spieler sich in bestimmten Situationen verhalten sollten, wenn sie ihren Nutzen maximieren wollen, nicht aber Aussagen, wie sich reale Akteure in bestimmten Situationen im allgemeinen tatsächlich verhalten werden. Zwei Gründe lassen sich nennen, warum die klassische Spieltheorie - auch in den beschriebenen modernen Entwicklungen - nicht zu Aussagen des letzteren Typs kommt, u m die sich doch jede erklärende Theorie sozialer Realität bemühen muß. Der eine G r u n d ist die Beliebigkeit der Rationalitätskriterien, die durch die Anforderungen nach logischer Konsistenz der zugrundeliegenden subjektiven Präferenzordnungen allein nur unwesentlich eingeschränkt wird. Solange
4
Ulrich
Mueller
m a n Nutzen nicht mit einem objektiven Maßstab messen kann, oder anders ausgedrückt: solange man eine gegebene subjektive Präferenzordnung nicht auf objektive Richtigkeit überprüfen kann, kann m a n auch nicht über die Rationalität oder Effizienz von beobachteten Strategiewahlen urteilen; stets läßt sich in der sozialen Realität wie im Labor ad hoc irgendein nicht direkt beobachtbarer, psychischer Nutzen annehmen, mit dessen Hilfe auch das bizarrste beobachtete Verhalten noch als zweckmäßig gedeutet werden kann. Auch dort wo Nutzen direkt in Geldeinheiten gemessen werden kann, bieten zusätzliche Aspekte wie langfristige Stabilität, Erreichung von Zielschwellen statt perfekter Maximierung o.a. genügend R a u m für solche Interpretationen. Solange also die Spieltheorie mit einem letztlich subjektiven Nutzenbegriff arbeitet, ist sie als Grundlage von empirisch testbaren, d.h. deskriptiven u n d nicht bloß normativen Theorien sozialen Verhaltens untauglich. Der andere Grund ist die Abwesenheit jeder evolutionären Perspektive. Sowohl die Spieler wie die ihnen offenstehenden Handlungsoptionen sind in der Realität einer beständigen Dynamik unterworfen: die Ergebnisse eines Spiels oder gar einer Serie von Spielen verändern die Strategien,die Auszahlungsfunktionen und damit die Spieler selbst. Für diese Dynamik, insbesondere dort wo sie nicht stochastisch ist, sondern aus L e r n - u n d Anpassungsprozessen der Spieler hervorgeht, ist aber in der klassischen Spieltheorie kein Platz. Das Rationalhandlungsmodell der Spieltheorie hat natürlich implizit eine empirische Basis, mit der seine Relevanz für das Verständnis der sozialen Wirklichkeit begründet wurde. Dies ist die implizite Unterstellung, daß Akteure aus Erfahrung lernen können, insbesondere unter der Disziplin der Marktkonkurrenz, wenn sie sehen, wie andere mit anderen Entscheidungen Nutzen besser maximieren und sie selbst mit ihren Entscheidungen in Gefahr geraten, vom Markt gedrängt zu werden. Auf diese empirischen L e r n u n d Anpassungsprozesse wird aber nur vortheoretisch hingewiesen, sie sind nicht Bestandteil der Theorie selbst. Der Maßstab, mit dem Evolution letztlich gemessen wird, ist das Uberleben der Akteure u n d ihrer Nachkommen. Ohne die evolutionäre Perspektive aber kann m a n im unentwegten Fluß der Veränderung wichtiges nicht von unwichtigem unterscheiden: nämlich zu erkennen, was überlebensrelevant ist u n d wessen Veränderung letztlich darüber entscheidet, was zu späteren Zeitpunkten ü b e r h a u p t noch und was nicht mehr vorhanden ist. So gesehen ist es nicht überraschend, daß die Spieltheorie nicht in der Ökonomie und der Soziologie sondern in der Verhaltensbiologie durch die Integration der evolutionären Perspektive erstmals den Durchbruch zu einer deskriptiven, und damit empirisch prüfbaren Theorie sozialen Verhaltens schaffte. In der Verhaltensbiologie haben wir, was die Wissenschaften von menschlichem Sozialverhalten - trotz oder vielleicht auch wegen des soviel reicheren und komplexeren Gegenstandes - noch nicht haben: einen objektiven Nutzenmaßstab und damit einen objektiven Maßstab zum Messen von Evolution. Um diese Entwicklung in der Spieltheorie, welche ebenfalls mit
Einleitung
5
dem Beginn der 70er Jahre einsetzte, geht es in diesem Buch. Lehrreich ist zugleich nachzuvollziehen, warum sich dieser Durchbruch in der Biologie erst relativ spät - eine Generation nach von Neumann und Morgenstern - vollzog. Die Anwendung des spieltheoretischen Instrumentariums in der Biologie ließ deshalb solange auf sich warten, weil dort Evolution seit der Formalisierung des Darwin-Mendelschen Evolutionsmodells stets ids ein Optimierungsprozeß einer Population auf einer viel-dimensionalen Mannigfaltigkeit verstanden wurde, dessen Gradient, ausgedrückt in durchschnittlicher Fitness der Population, stets nicht-negativ sein soll. Dies ist der erste Teil des Fundamentalgesetzes der natürlichen Selektion und ein geeignetes Modell für die Evolution der meisten physiologischen Merkmale. Das Unterhautfettgewebe beispielsweise isoliert gegen Kälte, wird aber nicht so gut durchblutet und erhöht das Körpergewicht beträchtlich; Haare sind leichter und wärmen auch, sind aber anfällig gegen Parasiten, verhindern überdies die rasche Wärmeabgabe nach außen bei körperlicher Anstrengung. Dicke des Unterhautfettgewebes, Dichte des Haarkleides und Verteilung der Schweißdrüsen werden sich auf ein den jeweiligen Umweltbedingungen entsprechendes Optimum hin entwickeln. Der hier interessierende Punkt ist, daß dieser Evolutionsprozeß Ergebnis eines frequenz-unabhängigen Selektion ist: die Wohlangepaßtheit der angesprochenen Merkmalsausprägungen ist unabhängig von ihren jeweiligen Häufigkeiten in der Population, der die betreffenden Organismen angehören. Wohlgemerkt: die Fitness einer bestimmten Merkmalsausprägung ist natürlich nicht unabhängig von der Verteilung alternativer Merkmalsausprägungen in der Population: gibt es gut wärmeisolierte Mutanten in einer Population, die in einer kalten Zone lebt, so haben schlechter wärmeisolierte eine geringere relative Fitness als wenn die Mitglieder der Population alle gleich schlecht wärmeisoliert sind. Ob aber eine neue Merkmalsausprägung zu größerer oder geringerer Fitness führt, hängt nur von ihrer Angepaßtheit an die physische Umgebung ab, nicht aber von den Häufigkeiten alternativer Merkmalsausprägungen. Anders aber, wenn die Angepaßtheit gewisser Merkmale von der sozialen Umgebung des Organismus abhängt und dort von den Häufigkeiten alternativer Merkmalsausprägungen in der Population: dann haben wir eine frequenzabhängige Selektion der betreffenden Merkmale. Es ist charakteristisch für soziale Verhaltensweisen, also Strategien der Kommunikation, des Kämpfens, der Partnerwahl, der Kooperation usw., daß ihre Wohlangepaßtheit und damit ihre Selektion frequenzabhängig ist. Mit welcher Sprache man sich in einer gegebenen sozialen Umgebung gut verständigt, hängt davon ab, welche Sprache dort normalerweise gesprochen wird. Allgemein ausgedrückt: die Wohlangepaßtheit miteinander konkurrierender Merkmalsausprägungen ändert sich mit ihrer Häufigkeit in der Population. Der Evolutionsprozeß ändert sich dadurch tiefgreifend. Gleichgewichte bei frequenzabhängiger Selektion sind im allgemeinen nicht mehr Optima in dem Sinn, daß der Gradient der durchschnittlichen Fitness auf allen Bahnen hin zum Gleichgewicht stets
6
Ulrich Mueller
nicht-negativ ist; nun kann er sehr wohl auch negativ sein. Solange dieser Gradient nicht-negativ ist, geht jede Fitnesssteigerung einer neuen Mutante auch mit einer Steigerung der Durchschnittsfitness in der Population einher: das Wohl des Einzelnen und das Wohl der Art gehen parallel. Bei frequenzabhängiger Selektion können das Wohl der neuen Mutante und das Wohl der Art auseinander laufen: das Durchsetzen einer neuen Mutante kann die Durchschnittsfitness der Art senken. Das Ergebnis des Evolutionsprozesses ist hier Stabilität, nicht notwendig aber Optimalität. Die Übernahme des spieltheoretischen Instrumentariums hat die Theorie frequenzabhängiger Selektion, welche die Grundlage zum Verständnis der Evolution sozialer Verhaltensweisen ist, auf eine neue Grundlage gestellt. Bevor wir diese allgemein definieren, wollen wir uns die zentralen Ideen an einem Beispiel vergegenwärtigen. Das Beispiel stammt von Ronald Fisher, in seiner Lösung des Problems ist im Grunde genommen der entscheidende Gedankengang bereits enthalten, obwohl Fisher vom spieltheoretischen Instrumentarium, das in den dreißiger Jahren noch ganz unterentwickelt war, keinen Gebrauch machte. Ronald Fisher, den der sozialwissenschaftlich vorgebildete Leser vor allem aus der Statistik kennen dürfte, schuf gemeinsam mit J.B. Haidane und S. Wright in den zwanziger Jahren die klassische mathematische Populationsgenetik. Das hier angesprochene Problem ist die Sexualproportion, die, wenn nicht zusätzliche genetische Mechanismen im Spiel sind, bei den sich sexuell fortpflanzenden Arten in dem Lebensalter der maximalen Reproduktionschancen gerade 1 : 1 ist. Daß sich hinter dieser Gleichverteilung der Geschlechter ein Problem verbirgt - dies zeigt den genialen Blick des Forschers Fisher - ergibt sich aus einem Vergleich mit der jahrtausende alten Erfahrung des Menschen als Viehzüchter. Der limitierende Faktor bei der Fortpflanzung sind die weiblichen, nicht die männlichen Organismen. Ein Mann und zehn Frauen können in einem Jahr zehnmal so viele Kinder produzieren wie zehn Männer und eine Frau. Entsprechend hat der Mensch als Viehzüchter die Sexualproportion beim Vieh stets zugunsten der weiblichen Tiere verändert. Je mehr Frauen in einer Population (bis hin zu einem je nach Umständen festzulegenden Minimum von Männern), um so größer das Wachstums- und damit auch das Evolutionspotential einer Population. Warum hat die Evolution nicht eine solche schiefe Sexualproportion, sagen wir von 1 : 20, oder noch mehr hervorgebracht? Man könnte die Gleichverteilung als Ergebnis irgendeines allgemeinen Naturgesetzes ansehen, vergleichbar irgendwelchen Symmetrieeigenschaften der Materie im Bereich der Elementarteilchen. Gegen eine solche Annahme spricht, daß etwa beim Menschen die Sexualproportion bei der Einnistung des befruchteten Eis in der Gebärmutterschleimhaut auf 1.8 männlich gegen 1 weiblich geschätzt wird, dieses Verhältnis wegen der Ubersterblichkeit männlicher Foeten bei der Geburt auf 1.05 : 1 sinkt und eben erst zwischen 20 und 30, dem Alter maximaler Reproduktionschancen, das 1 : 1 Verhältnis
Einleitung
7
erreicht. Also könnte die Evolution durchaus auch im Erwachsenenalter eine von der Gleichverteilung abweichende Sexualproportion erreichen. Warum ist das nicht geschehen? Fisher gab auf diese Frage folgende Antwort: Eine Population habe etwa ein Verhältnis von 20 weibliche auf 1 männlichen Nachkommen genetisch fixiert. Da jeder Organismus aber genau eine Mutter und einen Vater hat, heißt dies, daß ein Mann durchschnittlich 20 mal soviele Nachkommen hat wie eine Frau. Lassen wir nun eine Mutante auftauchen, die Nachkommen im Verhältnis von, sagen wir, 20 Männer zu 1 Frau in die Welt setzt. Diese Mutante wird, wenn wir die Population als groß annehmen, anfangs 20.05 mal so viele Nachkommen haben wie der Durchschnitt und wird entsprechend rasant anwachsen. Allgemein ausgedrückt: bei jeder von der Gleichverteilung abweichenden Sexualproportion werden Mutanten, die mehr von dem seltenen Geschlecht produzieren als der Durchschnitt, einen Selektionsvorteil haben. In spieltheoretischer Terminologie können wir sagen, daß es auf jede von der Gleichverteilung abweichende Sexualproportion eine bessere Antwort gibt als sie selbst. Damit folgt auch, daß auf jede von der Gleichverteilung abweichende Sexualproportion die Gleichverteilung eine bessere Antwort ist. Betrachten wir als nächstes eine Population, in der Gleichverteilung herrscht. Nun wird jedes Geschlecht im Durchschnitt dieselbe Anzahl von Nachkommen haben, also hat keine Mutante mit einer von der Gleichverteilung abweichenden Sexualproportion der Nachkommenschaft einen Selektionsvorteil gegenüber der Gleich Verteilung selbst. Unsere Argumentation in umgekehrter Reihenfolge wiederholt lautet: die Gleichverteilung ist gegen sich selbst gespielt genau gleich gut wie alle Mutanten mit ungleichen Sexualproportionen, aber eine Mutante mit Gleichverteilung wird in allen Populationen mit einer ungleichen Sexualproportion einen Selektionsvorteil haben. Wir haben hier alle Ideen schon vor uns, die John Maynard Smith, der die Spieltheorie in die Theorie frequenzabhängiger Selektion einführte, zu dem zentralen Begriff einer evolutionsstabilen Strategie (evolutionarily stable strategy = ESS) verband: In einer großen Population gebe es verschiedene alternative Strategien aus einer Menge 5. Es gebe einen Maßstab U(sx,sy) für den evolutionären Wert einer Strategie sx, wenn sie gegen Strategie sy gespielt wird. Die Strategie szeS ist genau dann eine evolutionsstabile Strategie ESS, wenn gilt: U(sz,sz)
>
U(sx,sz)
(3.a)
oder U(sz,sz)
= U(sx,sz)
und U(sz,sx)
>
U(sx,sx)
(3.b)
für alle sxeS und sx φ sz. Eine ESS ist also eine Gleichgewichtsstrategie gegen sich selbst. Dies ist nur eine notwendige, nicht aber eine hinreichende
8
Ulrich Mueller
Bedingung, wie wir gleich sehen werden. Man beachte, daß (3.a) und (3.b) die Möglichkeit nicht ausschließen, daß U(sx,sx)
>
(4)
U(sz,3z)
Bedingung (3.a) wird als die Gleichgewichtsbedingung bezeichnet —sz ist eine Gleichgewichtsstrategie gegen sich selbst. Bedingung (3.b) ist die Stabilitätsbedingung — d e s t a b i l i s i e r t alle Konkurrenten und ist damit die einzige stabile Strategie. Betrachten wir zunächst die Definitionen anhand des erweiterten KnobelnSpieles, auf das wir weiter oben schon zu sprechen kamen, und nehmen wir uns wieder die gemischte Strategie (1/3 Stein, 1/3 Schere, 1/3 Papier) vor. Es gilt:
re y & gemischt*) U (¿gemischt, U(sSchere,
s
Schere)
¿Schere)
—
U ( 3 Stein , ¿gemischt)
=
U(s gemischt
=
U(spapier,spapier)
,¿ Papier)
—
^(¿Papier,
=
U ( i gemischt
'
U(sStein,
¿gemischt) ι ¿ Stein) ¿Stein)
=
e/3
—
β/3
= —
β/3 β.
Für e < 0 ist Bedingung (3.a) nicht erfüllt, aber Bedingung (3.b). Also ist dann die gemischte Strategie ESS. Für 0 > e > 1 gibt es überhaupt keine ESS, da die gemischte Strategie zwar im Gleichgewicht mit sich selbst ist, aber den zweiten Teil der Bedingung (3.b) nicht erfüllt. Für e > 1 ist jede der drei reinen Strategien eine ESS. Es ist leicht einsehbar, daß bei gemischten ESS nie Bedingung (3.a), sondern immer nur Bedingung (3.b) erfüllt sein kann. Da im Vorfahrtsspiel keine reine oder gemischte Strategie im Gleichgewicht gegen sich selbst ist, kann es in diesem Spiel auch keine ESS geben. Um zu sehen, was (4) konkret heißt, gehen wir wieder zu Fishers Problem zurück. Eine maximal zugunsten des Frauenanteils ungleiche Sexualproportion ergibt, gegen sich selbst gespielt, zweifellos eine höhere Durchschnittsfitness als die Gleichverteilung - die ESS in diesem Beispiel - gegen sich selbst gespielt. Dennoch wird die Mutante mit der ungleichen Sexualproportion der Mutante mit der Gleichverteilung erliegen. Auf dem zwangsläufigen Weg der Evolution von jener Ungleichverteilung hin zur ESS Gleichverteilung wird jedoch die durchschnittliche Fitness der Population abnehmen, was es bei frequenzunabhängiger Selektion nach dem Fundamentalgesetz der natürlichen Selektion gar nicht geben kann. Nehmen wir an, die Population von 1:20 war stationär, dann reichte für die Ersatzproduktion 1.05 Nachkommen pro Frau. Bleibt diese Nachkommenzahl pro Frau gleich auf dem evolutionären Weg hin zur Gleichverteilung, so sinkt dabei die Produktion von Nachkommen auf nur 52.5% der Ersatzproduktion und die Fitness von 1 auf .525. Drei weitere Anmerkungen sind zu dem zentralen Begriff einer evolutionsstabilen Strategie zu machen, der uns explizit oder implizit in allen Beiträgen dieses Sammelbandes begegnen wird.
Einleitung
9
1. Der Begriff ist im Kontext der theoretischen Populationsgenetik entstanden. Selektion - um die geht es hier — hat es aber mit Phänotypen, nicht mit Genotypen zu tun. Also kann die gesamte Theorie evolutionsstabiler Strategie unabhängig von irgendwelchen Annahmen über genetische Grundlagen beobachtbaren Verhaltens oder über genetische Mechanismen der Vererbung entwickelt werden. Der von Fisher beschriebene Mechanismus gilt unverändert auch für Gesellschaften, die etwa durch selektive Abtreibung weiblicher Foeten oder Tötung weiblicher Neugeborener die Sexualproportion zugunsten des männlichen Anteils verschieben: dort werden Brautpreise steigen und Mitgifte sinken und Eltern, die sich an der Verschiebung der Sexualproportion nicht beteiligen, werden ihren langfristigen Reproduktionserfolg über den Durchschnitt der Bevölkerung heben können. Die Theorie gilt für die Selektion individuell erlernter und kulturell weitergegebener Verhaltensweisen in gleicher Weise wie für die Selektion genetisch festgelegter und durch Fortpflanzung weitergegebener Verhaltensweise. Die beiden Typen von Selektion unterscheiden sich zweifellos in der Geschwindigkeit der durch sie vorangetriebenen Evolution, ihre Mechanismen sind aber dieselben. 2. Wir irren, wenn wir das Wohl der Art, oder, nüchterner ausgedrückt, das Wachstumspotential der Population als das für den Gang der Evolution entscheidende Kriterum ansehen. Dies ist vielmehr das Wachstumspotential einzelner, miteinander konkurrierender Alternativen auf der Ebene der individuellen Akteure. 3. Oft haben wir eine gemischte evolutionsstabile Strategie. Dies läßt sich in verschiedener Weise deuten: entweder wir nehmen an, daß Mitglieder der Population die entsprechenden reinen Strategien in der von dem gemischten Gleichgewicht vorgegebenen Häufigkeiten spielen. Oder wir nehmen an, daß die Mitglieder der Population selbst gemischte Strategien spielen (wobei keinesfalls alle Mitglieder exakt dieselbe Mischung zu spielen hätten wie die Gesamtpopulation; es reichte aus, daß sich die individuellen Häufigkeiten zu der geforderten Verteilung in der Gesamtpopulation aufsummierten). Diese doppelte Interpretation ist jedoch voller Fallgruben. In unserer Anwendung der ESS Definition (3.a) und (3.b) auf unser Knobeln-Beispiel (1) fanden wir, daß für e < 0 die gemischte Strategie (1/3 Stein, 1/3 Schere, 1/3 Papier) eine ESS ist. Das gilt natürlich nur, wenn diese gemischte Strategie auch auf der Individualebene gespielt werden kann. Können auf der Individualebene hingegen nur die reinen Strategien gespielt werden, so ist die entsprechende gleichverteilte Mischung auf Populationsebene keine ESS. Hier wird man eine instabile Drift der Populationsanteile der drei Strategien erhalten. Gemischte Strategien auf der Individualebene sind problematisch schon für die Theorie und überdies empirisch schwer nachzuweisen. John Maynard Smith äußert sich hierzu im dritten und vierten
Ulrich Mueller
10
Beitrag dieses Bandes. Aber auch gemischte Strategien nur auf Populationsebene eröffnen eine bedeutsame, für die Sozialwissenschaften neue Perspektive: die eines balancierten Polymorphismus, der zwar das evolutionäre Optimum verfehlt, dafür aber evolutionär stabil ist. Ein solcher ergibt sich, wenn für mehrere Strategien sx, sy ... gilt: U(sx,sy)
> U(sv,sy)
und
U(sy,sx)
> U(sx,sx)
(5)
Die eine Strategie kann also jeweils erfolgreich eine Population der anderen unterwandern, die andere Strategie jedoch nicht verdrängen. Die allgemeine Idee eines evolutionär stabil balancierten Polymorphismus für sich schon wirft ein neues und frisches Licht auf viele soziale Sachverhalte, die wir bislang in der funktionalistischen Tradition nur in Begriffen normgerechten und abweichenden Verhaltens zu sehen gelehrt wurden: lügen und die Wahrheit sagen, loyal sein und die Treue brechen, kämpfen und fliehen War die Idee evolutionsstabiler Strategien der erste Schritt zur Begründung der evolutionären Spieltheorie, so war der zweite die Idee, evolutionsstabile Strategien - die ja immer auf eine ganze Population bezogen sind - als asymptotisch stabile Gleichgewichtspunkte in dynamischen Systemen aufzufassen. Die ersten Überlegungen hierzu stammen von den englischen Mathematikern P. Taylor, L. Jonker und E.C. Zeeman und wurden von einer Wiener Arbeitsgruppe um J. Hofbauer, P. Schuster und K . Sigmund weiter ausgebaut. Durch die Verbindung mit dieser hochentwickelten mathematischen Theorie wurden wiederum weitere neue Perspektiven für die Spieltheorie eröffnet. Man kann nun beliebig viele Strategien simultan gegeneinander antreten lassen - in deterministischen wie in stochastischen Modellen. Man kann überdies die Dynamik in jedem Punkt des Zustandsraums des Populationssystems studieren, nicht nur in der Umgebung von Gleichgewichtspunkten. Das Ausschöpfen dieser neuen Perspektiven ist in vollem Gang; man hat eben erst begonnen, neueste Entwicklungen in der Theorie dynamischer Systeme, etwa aperiodische, nicht-punktförmige Attraktoren in den Modellen dynamischer Populationsspiele zu berücksichtigen. Wissenschaftsgeschichtlich interessant ist übrigens, daß bei der Entstehung der evolutionären Spieltheorie die grundlegenden neuen Ideen nicht von Mathematikern stammten, sondern von Substanzwissenschaftlern, die sich ihrerseits nur von den intuitiven Ideen der bis dahin existierenden Spieltheorie bei ihrer Suche nach geeigneten Modellen frequenzabhängiger Selektion anleiten ließen. Erst nachträglich kamen Mathematiker hinzu und verliehen dem neuen Instrumentarium die notwendige Tiefe und Strenge. Die evolutionäre Spieltheorie, so wie sie in der Evolutionsbiologie entstanden ist, stellt den ersten überzeugenden Versuch dar, die Spieltheorie von einer normativen zu einer deskriptiven, d.h. empirisch prüfbaren Theorie strategischer Interaktion weiterzuentwickeln. Möglich wurde dies durch die
Einleitung
11
Idee großer Populationen von Spielern und der Verbindung mit einem evolutionären Selektionsmechanismus. Entscheidend hierfür wiederum ist aber das Vorhandensein eines objektiven Nutzenmaßstabs in Gestalt biologischer Fitness. Nachdem diese neue evolutionäre Spieltheorie überwiegend im Kontext der Verhaltensbiologie und der Populationsgenetik entstanden ist, wird auch nicht überraschen, daß die meisten empirischen Anwendungen bisher auch in der Biologie versucht wurden. Die Anwendung des gesamten Instrumentariums der evolutionären Spieltheorie auf den Gegenstandsbereich der Sozialwissenschaften wird, so darf man vermuten, davon abhängen, ob es gelingt, in ihnen einen vergleichbar überzeugenden objektiven Nutzenmaßstab zu definieren. Man kann einen solchen einmal im Bereich der kulturellen Fitness bestimmter Verhaltensweisen suchen. So wendet sich Axelrod in seinem hier abgedruckten Aufsatz der Frage zu, wie lang - teilweise jahrtausende lang - gepflegte Verhaltensweisen wie etwa Kannibalismus, Sklaverei oder vergleichsweise harmlosere wie Rauchen in der Öffentlichkeit in relativ kurzer Zeit verschwinden können, während wiederum andere Verhaltensweisen in kurzer Zeit zu kulturell akzeptierten Normen werden können. Zum anderen ist zu fragen, ob nicht auch für so kulturbestimmte Organismen wie die Menschen das physische Überleben der Generationslinien nicht doch auch der entscheidende objektive Nutzenmaßstab ist, nach dem die Rationalität des Handelns in sozialen Interaktionen letztlich gemessen wird. In langsam oder gar nicht mehr wachsenden Populationen drückt sich biologische Fitness als zentraler Evolutionsparameter ja ohnehin nicht in einer möglichst großen Zahl unmittelbarer Nachkommen aus und muß möglicherweise überhaupt noch ganz anders definiert werden als wir das gegenwärtig tun. Man darf auch nicht in den Irrtum verfallen, etwa den biologischen Reproduktionserfolg eines deutschen Soziologen mit dem eines kenianischen Bauern zu vergleichen. Konkurrent um Selektionsvorteile ist immer zuerst der Nachbar: der Nachbar im Raum, im Berufsfeld, in der Geburtskohorte. In einer Zeit, in der die Erkenntnis Platz greift, daß die Ökologie, die natürliche Grundlage unserer biologischen Existenz, auch unser Schicksal als Kulturwesen bestimmen wird, dürfte der gewohnte weltanschauliche Widerstand in den Sozialwissenschaften gegen solche Überlegungen an Überzeugungskraft verlieren. Sicher ist freilich auch, daß in dieser zentralen Frage - eines objektiven Nutzenmaßstabs im Gegenstandsbereich der Sozialwissenschaften - bloße Analogien zur Biologie nicht weiterhelfen. Die drei ersten Aufsätze von J. Maynard Smith (zwei davon mit Koautoren) entwickeln die Theorie evolutionsstabiler Strategien. Der erste dieser Aufsätze (zusammen mit G. Price von 1973) ist gewissermaßen der Geburtsartikel der evolutionären Spieltheorie. Im Rückblick ist es beeindruckend, welch ein Scharfsinn und welch ein Gedankenreichtum sich in diesem auf formale Darstellung fast ganz verzichtenden Text verbirgt. Der Aufsatz von P. Schuster und K. Sigmund, der Ubersichtscharakter hat, entwickelt dann die Theorie
12
Ulrich
Mueller
dynamischer Populationsspiele. Diese ersten fünf Aufsätze zeigen die theoretischen Grundlagen der evolutionären Spieltheorie auf. Die folgenden fünf Aufsätze wenden sich mit diesem Instrumentarium dann verschiedenen zentralen Feldern sozialer Interaktion zu: T. Bishop und C. Cannings entwickeln eine allgemeine Theorie von Abnutzungskonflikten (das sind alle Konflikte, die durch langandauernden Ressourceneinsatz, nicht aber durch einen einzelnen Kampf entschieden werden). S. Vehrenkamp untersucht die Ursprünge sozialer Ungleichheit, J.S. Brown, M.J. Sanderson und R.E. Michod und U. Mueller die Bedingungen endogener Evolution von Kooperation zwischen Nicht-Verwandten und R. Axelrod schließlich die Bedingungen der endogenen Evolution von Normen. Ein Aufsatz von J. Maynard Smith und G. Parker behandelt asymmetrische Konflikte. Die meisten Aufsätze wurden etwas gekürzt. Entweder wurden dabei Abschnitte weggelassen, in denen elementare Definitionen gegeben wurden, die der Leser an dieser Stelle entweder schon kennt oder leicht weiter oben nachschlagen kann. Oder aber es wurden Abschnitte gestrichen, in denen die Autoren das Instrumentarium der evolutionären Spieltheorie auf populationsgenetische Fragestellungen im engeren Sinn anwenden. Diese liegen außerhalb des Rahmens dieses Sammelbandes. Der Leser sollte sich zunächst die drei ersten Beiträge vornehmen, danach ist die Reihenfolge beliebig. Axelrod ist Politikwissenschaftler, Schuster ist Chemiker, Mueller ist Soziologe. Alle anderen Autoren sind entweder Biologen oder Mathematiker. In dieser Verteilung der Disziplinen spiegelt sich die bisherige Entwicklung des neuen Arbeitsgebietes wider. Uber die Grundlagen der Spieltheorie kann man sich unterrichten etwa in Vorob'ev (1977), Rauhut et al. (1979), Ordeshook (1986) oder Rasmusen (1989). Die beiden ersteren sind in der mathematischen Darstellung strenger und ausführlicher. Ordeshook, sehr gut geschrieben, zeigt die Spieltheorie in Zusammenhang mit anderen formalisierten Entscheidungswissenschaften; Rasmusen stellt die neuen Gebiete von dynamischen Spielen und von Spielen mit asymmetrischer Information dax. In keinem dieser Bücher werden allerdings Fragestellungen der evolutionären Spieltheorie näher behandelt. Hier empfiehlt sich J. Maynard Smiths (1982) einführende Monographie, in der dann aber wieder die spieltheoretischen Grundlagen zu kurz kommen. Nützlich zur Einarbeitung in die weitverzweigte Literatur zum Begriff evolutionsstabiler Strategien ist Hines' (1987) umfangreicher Übersichtsartikel. Der sozialwissenschaftlich vorgebildete Leser könnte nach der Lektüre der biologischen Aufsätze sich über einige der elementaxen Begriffe der Populationsbiologie vergewissern wollen - wozu Wilson und Bossert (1973) gut geeignet ist. Biologen können sich in Axelrod (1987) - wie dieser Sammelband in der Reihe Scientia Nova in deutscher Ubersetzung erschienen - über Anwendungen der neuen Ideen in den Sozialwissenschaften belesen. Eine anspruchsvolle Darstellung dynamischer Populationsspiele im Kontext der theoretischen Populationsbiologie findet man bei Hofbauer und Sigmund (1984), eine an-
Einleitung
13
spruchsvolle Darstellung der evolutionären Spieltheorie aus der Perspektive der herkömmlichen Spieltheorie bei van D a m m e (1987, K a p . 9). Möge dieser Sammelband dazu beitragen, Sozialwissenschaftler ebenso wie Biologen u n d Mathematiker auf das enorme Potential hinzuweisen, das in jenen neuen Ideen steckt, die wir unter den Begriff der evolutionären Spieltheorie fassen. M a n könnte sich f ü r vieles gegenseitig die Augen öffnen. Ich bin zu Dank verpflichtet: Frau D a g m a r Haas f ü r das Schreiben des Textes, Frau Ute Berressem u n d Herrn Dr. Andreas Engel f ü r das Herstellen der Druckvorlage u n d Frau Gabriele W i t t f ü r redaktionelle Mitarbeit.
Formale
Definitionen
Ein Spiel bestehe aus Spielern, ihren Strategien u n d einer Auszahlungsf u n k t i o n . Es gebe eine Anzahl von Akteuren oder Spielern: 1 , 2 , . . . , i,... n. Jeder dieser Spieler i kann aus einer Menge von verschiedenen Handlungsweisen oder Strategien Si : s¿2> · · · > s>k eine Strategie auswählen, wobei die Menge S¡ von Spieler zu Spieler verschieden sein kann. Die Beschränkung auf endliche oder auch nur abzählbare Mengen von Spielern u n d Strategien ist nicht notwendig. In diesem Buch wird der Leser sowohl Kontinua von Spielern - etwa den relativen Anteil eines b e s t i m m t e n Spielertyps in einer großen Population - wie auch Kontinua von Strategien - etwa die Zeitspanne, die m a n auf irgendein Ereignis zu warten sich entscheidet - kennenlernen. Das Cartesische P r o d u k t der Strategien der Spieler S := Si x S2 x . . . x S„ soll der Ereignisraum des Spieles heißen. Jedes Element seS dieses Raumes, eines der möglichen Ereignisse des Spieles, ist ein n - T u p e l , eine der S verschiedenen möglichen Konfigurationen der jeweiligen Entscheidungen der η Spieler. Sodann gebe es eine Auszahlungsfunktion aus ]R n in E . " : jedes Ereignis s führe zu einer b e s t i m m t e n positiven oder negativen - Nutzenzuweisung f/,(s) an Spieler i, welche Auszahlung heißen soll. Nutzen wird rein operational definiert, in dem Sinn, daß Spieler i i m s t a n d e ist, alle Ereignisse u n d ihre Folgen f ü r sich selbst in eine Präferenzordnung zu bringen, die vollständig u n d transitiv ist. F ü r je zwei Ereignisse s' u n d s" gilt entweder Ui(s') > U,(s") oder U,(s') < Í7¿(s") oder Ui(s') ~ Ui(s"). Letzteres soll heißen: Spieler i ist zwischen s' u n d s" indifferent. Transitiv bedeutet, daß aus t/¿(s') < t/;(s") u n d 17,(s") < U{(s'") folgt: Ui(s') < Ui(s'"). Den Nutzen zukünftiger Ereignisse können wir mit der Wahrscheinlichkeit ihres Eintretens gewichten; diesen Erwartungsnutzen können wir quantitativ fassen, indem wir unterstellen, daß f ü r jeweils drei verschiedene Ereignisse s ' , s " , s'" mit Ui(s') > Ui(s") > U,(s"') gilt: es gibt genau eine Wahrscheinlichkeit ρ dergestalt, daß für Spieler i (6)
14
Ulrich Mutiler
Wenn wir als s' das von i an die erste Präferenzstelle und als s'" das an die letzte Präferenzstelle gesetzte Ereignis wählen, so können wir auf diese Weise den Nutzen eines jeden anderen Ereignisses s" bestimmen. Verstehen wir Nutzen in diesem Sinn als Netto-Erwaxtungsnutzen, so können wir das Indifferenzsymbol „ ~ " in (1) durch das Gleichheitszeichen „ = " ersetzen; damit unterstellen wir die Existenz einer kardinalen Nutzenfunktion in den Köpfen der Spieler. Zur Entscheidung der Spieler, eine Strategie aus der Menge der ihnen zur Verfügung stehenden zu wählen, ist zu sagen, daß ein Spieler i entweder _ eine reine Strategie wählen kann - etwa oder aber daß er eine stochastische Wahl treffen kann - er spiele etwa mit Wahrscheinlichkeit ρι, mit Wahrscheinlichkeit p2 usw., oder allgemein ausgedrückt: er spiele mehrere ihm mögliche Strategien entsprechend einer bestimmten Wahrscheinlichkeitsverteilung über Si. Diese Wahrscheinlichkeitsverteilung soll eine gemischte Strategie heißen. Welche Ereignisse werden sich durch die Entscheidungen der η rationalen Spieler realisieren? Zentral für die Beantwortung dieser Frage ist der Begriff des Gleichgewichts: ein Ereignis seS ist ein Gleichgewicht, wenn, grob gesprochen, jedes einseitige Abweichen von diesem Ereignis jeden der beteiligten Spieler nur gleich gut oder schlechter stellen kann. Formal: sei s* := j j , . . . , J ? , . . . ¿ή)· s * ist genau dann ein Gleichgewicht, wenn gilt: Ui(»ltsl
...,
Ej(J),
wobei Ei(j) den Erwartungswert der Strategie j gespielt gegen die Strategie i angibt. In einer Population, die gänzlich aus Individuen mit der Strategie I besteht, können damit in kleinen Zahlen auftretende Mutanten, die eine von I verschiedene Strategie J spielen, sich nicht durchsetzen, so daß diese Population unter den Bedingungen von Mutation und Selektion stabil ist. In der Definition haben wir verlangt, daß E¡(I) > Ej(J); es entstehen Schwierigkeiten, falls E¡(I) = Ej(J). Hier ist I zwar eine Gleichgewichtsstrategie, aber nicht notwendigerweise stabil. Um dies entscheiden zu können, müssen wir Ej(J) und Ej(I) kennen. In einer Population, in der ein Anteil ρ die Strategie I spielt und (1 — p) J spielt, sind die jeweiligen Erwartungswerte für Fitness: E(I)
=pEj(I)
+
(l-P)Ej(I),
E(J)
= pEj{J)
+ (1 -
p)Ej(J).
I wird dann evolutionsstabil sein, wenn Ej(I) > Ej(J). Wir können nun unsere Definition erweitern und festlegen, daß I eine ESS ist, wenn für alle alternative Strategien J entweder £,(/)
>
Er(J),
oder
(1) Etil)
= E¡(J)
und
Ej{I)
>
Ej(J).
'Hier wird nur der zentrale Abschnitt dieses Artikels abgedruckt. Herausgebers)
(Anmerkung dee
J . Maynard
26
Smith
Diese Stabilität ist nicht notwendigerweise global. Es kann mehr als eine ESS für ein gegebenes Spiel existieren. Ist das der Fall, so wird eine Population sich je nach ihrer initialen Zusammensetzung zur einen oder anderen ESS hin entwickeln. Eine ESS kann eine gemischte Strategie sein; d.h. diese ESS besteht dann aus einer Menge von reinen Strategien, die mit bestimmten Wahrscheinlichkeiten gespielt werden. Eine stabile Population in diesem Sinn könnte entweder genetisch polymorph sein, wobei entsprechende Proportionen von Individuen verschiedene reine Strategien spielen, oder sie könnte genetisch monomorph sein, wobei das Verhalten der Individuen in entsprechender Weise zufallsverteilt ist. Ein
einfache»
Modell
2
Wir betrachten einen Konflikt zwischen zwei Individuen, in denen der Sieg einfach an denjenigen der beiden Kombattanten geht, der bereit ist, länger auszuharren. Sei die Auszahlung an den Sieger v. Soll ein Kampf überhaupt einmal zu einem Ende kommen, so muß es irgendwelche Kosten für die Kämpfer in einer sehr langen Auseinandersetzung geben. Dann ist die einzige Wahl einer Strategie, welche ein Kombattant treffen kann, die maximale Zeit, die er bereit ist, auszuharren und entsprechend die Kosten, sagen wir —τη, die er bereit ist zu akzeptieren. Haben also zwei Kombattanten die Strategien τη ι und m¡, wobei τη χ > m j sei, so ist die Auszahlung an den ersten ν — τηÌ und die an den zweiten —m^· Unser Problem ist nun, welchen Wert von τη ein Kämpfer wählen sollte, oder genauer ausgedrückt, welches m eine ESS ist. Es läßt sich einfach zeigen, daß keine reine Strategie eine ESS sein kann. Nehmen wir an, Strategie I wähle mi + e, wobei e eine kleine symmetrisch verteilte Zufallsvariable mit Mittelwert 0 ist; damit ist sichergestellt, daß zwei Kombattanten mit Strategie I gleiche Gewinnchancen haben. Dann gilt E¡(I) = | ν — τηχ. Strategie J wähle m 2 . Falls m 2 > Toi, dann E i ( J ) = ν — m1. Folglich E j ( I ) > Ei(I) und I kann keine ESS sein. Diese Überlegung könnte nahelegen, daß ein Kombattant den höchstmöglichen Wert von m wählen sollte, um es seinem Gegner schwerer zu machen, einen noch höheren zu wählen. Dies löst das Problem jedoch auch nicht, denn wenn m j > dann E¡{I) < 0. Falls dann m.2 = 0, dann E ¡ { J ) = 0, und wiederum ist I unstabil. Es gibt jedoch eine gemischte Strategie, welche eine ESS ist, und die wie folgt gefunden werden kann: Strategie I sei gemischt und wähle einen Wert zwischen χ und χ + Sx mit Wahrscheinlichkeit p ( x ) 8 x . Dann ist der Erwartungswert einer Strategie mit einem festen Wert τη gegen I oo m 0
m
2 Hier wird die Lösung des Problems angegeben, das am Ende des vorhergehenden Artikels von Maynard Smith und Price gestellt wurde. (Anmerkung des Herausgebers)
Spieltheorie
und die Evolution
von
Konfliktstrategien
27
Wir wählen nun die Verteilung p(x) dergestalt, daß E(m) einen konstanten Wert C für alle Werte von m hat. C ist dann die erwartete Auszahlung einer jeden reinen Strategie gegen I . Da der Erwartungswert der Auszahlung einer jeden gemischten Strategie gegen I der gewichtete Mittelwert der Auszahlungen der reinen Strategien ist, aus denen die Mischung besteht, ist der Erwartungswert einer jeden gemischten Strategie gegen I gespielt ebenfalls C. Aus der gleichen Überlegung ergibt sich, daß C auch die erwartete Auszahlung von I gegen sich selbst ist. Wenn wir also nun eine Verteilung p(z) finden können dergestalt, daß Ε (τη) = C, werden wir die gesuchte Gleichgewichtsstrategie gefunden haben; wir werden dann zu zeigen haben, daß diese Gleichgewichtsstrategie auch stabil ist. U m p(x) zu finden, setzen wir E(m) m J(v 0
— x)p(x)dx
oo — J mp(x)dx m
=
= E(m + 8m) so, daß
m+Sm J (v — x)p(x)dx 0
oo Unter Berücksichtigung, daß / p(x)dx o ben:
oo — J (τη + ra+ím
6m)p(x)dx.
= 1, können wir dies anders schrei-
m νρ(τη) = 1 — J p(x)dx. o
(3)
Gleichung (3) wird nun erfüllt durch die Verteilung p(x) = -e-/· (4) ν welches die gesuchte Verteilung für die Gleichgewichtsstrategie ist. Nun ist zu zeigen, daß dieses Gleichgewicht stabil ist. D.h., wenn Strategie J einen festen Wert m spielt, so haben wir zu zeigen, daß E j ( I ) > E j ( J ) für alle Werte von τη. Es gilt: E
ÁJ) =
\v-m,
und
Ej(I) = =
(ν — τη) J p(x)dx m
—J 0
xp(x)dx
2 v e - m / " - v.
(5)
und folglich E j ( I ) - E j ( J ) = 2ve-m/v
- 3v/2 + m,
28
J. Maynard
Smith
welches positiv ist für alle positiven Werte von m. Damit haben wir bewiesen, daß die durch die Verteilung (4) definierte Strategie eine ESS ist. Wir schlußfolgern, daß eine evolutionsstabile Population entweder genetisch polymorph ist, wobei die von den einzelnen Individuen angewandten Strategien sich entsprechend (4) verteilen, oder daß sie aus gleichartigen Individuen besteht, deren Verhalten von Konflikt zu Konflikt entsprechend der Verteilung in (4) variiert. Da keine reine Strategie stabil ist, kann auch keine verhaltensmäßig uniforme Population stabil sein. Setzen wir p(x) — 1/v e~v!x in (2) ein, so finden wir, daß E(m) = 0. Dies mag auf den ersten Blick widersinnig erscheinen. Stellen wir uns vor, daß ν, die Belohnung für den Sieg, etwa eine bestimmte Futtermenge ist, und daß die Kosten des Konfliktes die dieser Futtermenge äquivalente Menge von Energie ist, welche im Konflikt aufgewandt wurde, so könnte es erscheinen, daß eine evolutionsstabile Population alle Energie, die sie aus ihrer Nahrung erhält, zum Ausfechten von Konflikten verwendet. Offensichtlich könnte keine solche Population überleben. Die Widersinnigkeit entsteht freilich aus einer Fehlinterpretation des Nutzens von v. Der relative Gewinn, den der Sieger in einem solchen Konflikt über den Verlierer hat, bemißt sich nicht nach der Energie etwa der durch den Sieg eroberten Futtermenge, sondern nach der Energie, die der Verlierer aufwenden muß, um eine vergleichbare Futterquantität anderswo zu finden. Betrachten wir hierzu zwei folgende Situationen: (1) Zwei Vögel versuchen, sich ein Territorium in einem Areal zu erkämpfen, welches zu klein ist, um beide zu unterhalten. Auf den Verlierer kommt also zu, sich ein Territorium in einem anderen, wahrscheinlich weniger günstigen Habitat zu erobern. Der Wert des Gewinnens ist folglich die Differenz zwischen dem erwarteten Reproduktionserfolg im umstrittenen Territorium und dem reproduktiven Erfolg im alternativen Habitat. Die Kosten der Fortführung des Kampfs für beide Kombattanten ist der Verlust an reproduktivem Erfolg, welcher sich aus der zeitlichen Verzögerung des Brutbeginns oder des Energieaufwandes im rituellen Kampf etc. ergibt. (2) Zwei Individuen rangeln miteinander um die relativen Positionen, die sie in einer sozialen Hierarchie oder in einer Hackordnung einnehmen möchten. Der Gewinn des Gewinnens bemißt sich durch den erhöhten reproduktiven Erfolg, welcher sich aus einem höheren Platz in der Hackordnung ergibt; die Kosten des Konflikts bemessen sich nach dem Energieaufwand und allen anderen Risiken, die aus einer sich lange hinziehenden Auseinandersetzung entspringen. Es ist folglich nichts Widersinniges in der Schlußfolgerung, daß Ε (τη) = 0. Man beachte, daß die oben beschriebene ESS nicht die ist, welche durch Gruppenselektion begünstigt werden würde: unter Bedingungen von Gruppenselektion wäre die optimale Strategie, die Auseinandersetzung jeweils nur für eine sehr kurze Zeitperiode zu führen.
John Maynard
Smith
Kann eine gemischte Strategie in einer endlichen Population evolutionsstabil sein? Im „Hawk-Dove-"(„Falke-Taube-") Spiel (Maynard Smith & Price, 1973) ist keine der beiden reinen Strategien, H oder D, für sich selbst stabil. Eine Η-Population kann durch eine D Mutante unterwandert werden, und ebenso eine D-Population durch eine H Mutante. Ein mögliches Ergebnis ist ein stabiler genetischer Polymorphismus, mit Proportionen pH : (1 — p)D. Ein alternatives Ergebnis ist, daß alle Mitglieder der Population genetisch identisch sind, und eine gemischte Strategie anwenden, in der H und D zufällig verteilt mit den Wahrscheinlichkeiten ρ und 1 — ρ auftreten. Maynard Smith und Price (1973) zeigten, wie ρ in einer unendlich großen Population berechnet werden kann. In einer solchen Population kann man sich nun eine unendliche Menge äquivalenter Gleichgewichte denken, in denen jeweils eine Teilmenge einer Population diese gemischte Strategie anwendet, und der Rest im Verhältnis ρ oder (1 — p) jeweils nur Η oder D spielt. In einem 1987 erschienenen Papier behauptet Vickery (1987), daß in einer endlichen Population „eine gemischte Strategie stets unterwandert werden kann", und daß in diesem Fall deshalb der einzig stabile Zustand ein genetischer Polymorphismus ist. Ich will hier darlegen, daß dieser Schluß falsch ist. Ich skizziere erst Vickerys Argumentation und erkläre dann, wo ich sie für fehlerhaft halte. Im Anschluß beschreibe ich das Ergebnis einer Simulationsstudie, begleitet von einem analytisch eher lockeren Argument, um zu zeigen, daß im Gegenteil in einer endlichen Population eine gemischte evolutionsstabile Strategie (ESS) das wahrscheinlichere Resultat ist. Ich möchte meine Argumentation anhand eines einfachen numerischen Beispiels darlegen (Tabelle la), bin aber überzeugt, daß die Argumentation auch auf den allgemeinen Fall zutrifft (Tabelle l b ) . Tabelle 1 Auszahlungsmatrizen für das Hawk-Dove Spiel (a) H H O D l
00 D 3 2
H H O D e
D b 1
Die Strategie „Spiele H mit Wahrscheinlichkeit p\ spiele D mit Wahrscheinlichkeit 1 — p" wird geschrieben werden als pH : (1 — p)D, und E(A,B) soll den Nutzen für Strategie A bedeuten, wenn sie gegen Strategie Β gespielt wird. In einer unendlichen Population gilt für die stabile Strategie, I, ρ = 0.5, mit:
30
John Maynard
Smith
Ε ( Η , Ι ) = 1.5; E ( D , I ) = 1.5;E(I,H) = 0.5;E(I,D) = 2.5. Im evolutionsstabilen Gleichgewicht fährt ein individueller Spieler also im Durchschnitt gleich gut, ob er nun Η oder D spielt; er fährt aber besser, wenn sein Gegenspieler D anwendet, und schlechter, wenn jener Η spielt. Nun betrachten wir eine endliche Population von Ν Individuen, welche die Strategie I anwenden, mit ρ = 0.5, deren Durchschnittsnutzen sich als 1.5 berechnet. Einer von ihnen möge sich nun durch Mutation in einen Η Spieler verwandeln (Vickery fügt ein zusätzliches Individuum zur Population hinzu. Mir erscheint die Annahme natürlicher, eines der bereits existierenden Individuen seine Strategie ändern zu lassen, aber diese unterschiedlichen Annahmen ändern nichts a m Gesamtergebnis). Die M u t a n t e begegnet nur I Spielern, folglich ist ihr Nutzen 1.5; der Rest der Population fährt jedoch schlechter: Ein durchschnittliches Individuum trifft auf die Η Strategie mit Wahrscheinlichkeit 1/(JV - 1), und auf I mit Wahrscheinlichkeit ( N - 2 ) / ( N - 1). Folglich hat die M u t a n t e eine größere Fitness als die Durchschnittsindividuen: die M u t a n t e wird sich ausbreiten. Im Gegensatz dazu ist eine einzelne D Mut a n t e weniger fit als der Rest der Population, und kann sich folglich nicht ausbreiten. Im dem Maß jedoch, wie Η sich weiter verbreitet, wird jedoch schließlich ein Zustand erreicht, in dem D-Mutanten sich ihrerseits ausbreiten können. Im Verlauf der Zeit wird sich die Population in eine genetisch polymorphe verwandeln. So weit Vickerys Argument, welches zeigt, daß ρ = 0.5 nicht die evolutionsstabile Strategie eines Spiels für eine endliche Population ist. Es zeigt darüber hinaus, daß die von Maynard Smith und Price (1973) aufgestellten Bedingungen strenggenommen nur auf unbegrenzte Populationen angewandt werden können, wie dies auch bereits von Riley (1979) gezeigt wurde. Wir wollen nun eine Strategie J = pH + (1 — p)D suchen, welche eine evolutionsstabile Strategie im endlichen Spiel ist. Ich gehe dabei in drei Schritten vor: 1. Ich gebe einen solchen Wert für ρ sui, daß eine einzelne D-Mutante dieselbe Fitness wie die restlichen ( Ν — 1)J Individuen hat. 2. D a n n zeige ich, daß exakt dieser Wert von ρ sicherstellt, daß eine einzelne Η M u t a n t e dieselbe Fitness wie die restlichen ( N — 1)J Individuen hat. 3. Schließlich zeige ich, daß, wann immer D- oder Η-Mutanten in der Population häufiger werden, ihre Fitness unter die von J Individuen fällt. Betrachten wir eine Population, welche aus einer D-Mutante, und ( Ν — 1)J Individuen besteht. Die Fitness eines Individuums sei gleich der einer Konstante K , plus der Auszahlung des Spiels. Folglich:
Kann
eine gemischte
W(D) W ( J )
=
Strategie
=
K + p + 2(l-p)
=
* + F h :
E ( J
31
= K + '
D )
+
^
2-p, E
(
J
'
J
)
Κ + ^ - { 3 ? + 2(1 - ρ ) } + ^ z f m i
- ρ) + (1 - p)[p + 2(1 - p)}}
Gleichsetzung von W ( D ) und W(H) und Auflösung nach ρ ergibt
Betrachten wir nun eine Population, welche aus einem H-Individuum und (N — 1)3 Individuen besteht: W ( H ) = tf + 3 ( l - p ) , und W
(J) =
K
+ ]73Te(j'h) +
^ZT
E ( J , J )
Gleichsetzung von W(H) = W ( J ) ergibt:
*
=
l o d e r
*
=
2 ( F h )
(2)
Folglich ist die gemischte Strategie J , mit ρ = N/2(N — 2), neutral stabil sowohl gegen eine einzelne D-Mutante wie gegen eine einzelne H-Mutante. Für das allgemeine Falke-Taube Spiel, (Tabelle l b ) ist der entsprechende Wert: (t-l)JV + P
(N-2)(b
2-fc-c + c-l)
{a)
Um die Stabilität von ρ zu zeigen, müssen wir die Fitness für die Mutante und die Population berechnen, wenn mehr als eine Mutante vorhanden ist. Es ergibt sich einfach, mit zwei Η Mutanten: W(J)-W(H) = ? £ f | *
(4)
und mit zwei D Mutanten W ( J ) - W ( D ) ^
2 ( j y
^ _
2 )
(5)
Aus (1) ergibt sich, daß eine gemischte E S S nur dann existiert, wenn iV > 4, folglich sind die Ausdrücke (4) und (5) notwendigerweise positiv.
32
John Maynard
Smith
Damit ist die Strategie J sowohl gegen eine Unterwanderung durch H oder durch D Mutanten stabil. Vickery will gezeigt haben (Vickery 1987,137), daß jede gemischte Strategie durch eine der beiden reinen Strategien unterwandert werden kann. Er berechnet die jeweilige Fitness, wenn es nur eine einzige M u t a n t e gibt, W(H) — W(S) _ W ( D ) - W(S)
1 — p, p.
wobei S eine beliebige gemischte Strategie mit ρ , H : (1—p,)D ist. Folglich h ä t t e n die Differenzen entgegengesetzte Vorzeichen, und eine von ihnen muß notwendigerweise positiv sein. I m Gleichgewicht ist jedoch, sehr zum Schaden seines Arguments, W(H) - W(S) = W ( D ) = W(S) = 0. Ich folgere, daß es eine Strategie J gibt, mit ρ wie bei (1), oder im allgemeinen wie bei Fall (3) angegeben, welche gegen eine Invasion sowohl durch Η wie durch D stabil ist. Damit ist aber die Frage noch nicht beantwortet, ob in einer begrenzten Population eine gemischte ESS oder aber ein Polymorphismus das wahrscheinlichere Ergebnis ist. Bis hierher vernachlässigen sowohl Vickery's wie auch meine eigene Analyse den Faktor, der das Ergebnis a m stärksten beeinflusst, nämlich daß in einer begrenzten Population die Zahl von H, D und I Individuen von Generation zu Generation fluktuiert. Zwei Quellen von Zufallsfluktuationen in Fitness haben wir hierbei zu betrachten: 1. Die relative Häufigkeit, mit der ein beliebiges Individuum auf Strategie Η u n d auf Strategie D stößt, wird fluktuieren, sowohl wegen der Zufallsn a t u r solcher Begegnungen, und dann wegen des zufälligen Auftretens der Η bzw. D Strategie in einer gemischten Strategie eines beliebigen Individuums. Beide Effekte werde ich hier nicht behandeln; ich unterstelle, daß jedes Individuum einer großen Zahl zufällig ausgewählter Partner begegnet, wobei sich die Auszahlungen dieser verschiedenen Treffen zur jeweiligen Fitness des Individuums zusammenaddieren: d a n n entsprechen die tatsächlichen Häufigkeiten von Η und D ihren jeweiligen Erwartungswerten. Anders ausgedrückt: ich unterstelle, daß wir es hier mit einem „Spiel gegen das Feld" (Maynard Smith, 1982) zu t u n haben. 2. Die absoluten Zahlen der verschiedenen Typen von Individuen fluktuieren von Generation zu Generation; mit diesem Effekt will ich mich hier befassen. Betrachten wir eine endliche Population mit H-, D- und I-Individuen (wobei I = 0.5H : 0.5D), welche das Spiel nach Tabelle l a spielt. In einer beliebigen Generation seien die Häufigkeiten, mit dem ein Individuum auf die Strategien Η und D trifft, (0.5 + 0. Es darf nicht unerwähnt bleiben, daß diese Definition abgewandelt werden muß, falls die Population selbst klein ist. In einem solchen Fall würde auch ein einziges mutantes Individuum die Zusammensetzung der Population in wahrnehmbarer Weise und nicht nur durch ein kleines ε ändern. Eine Analyse dieser Situation findet sich in Riley (1979). Im Verlauf unserer Überlegungen werden wir stets große Populationen annehmen, und damit nicht nur dieses Problem, sondern auch die Auswirkungen von Stichprobenfehlern vermeiden. Lassen wir e - + 0 streben, so ergibt sich aus Ungleichung (1), daß
Strategische
und genetische
Modelle
43
W(J,I) χ · Aq
für alle
χ e Sn,
χ φ ρ
(20)
q ·Bp > y ·Bp
für alle
y € Sm,
y φ q
(21)
und
Es läßt sich leicht zeigen, daß ein solches Paar (p, q ) aus reinen Strategien bestehen muß. Anders als im symmetrischen Fall kann also eine gemischte Strategie hier niemals evolutionsstabil sein. Dies wurde für eine noch beträchtlich größere Klasse asymmetrischer Spiele von Selten (1980) bewiesen. Hieraus ergeben sich unmittelbare Auswirkungen auch für symmetrische Konflikte, da es oft durchaus möglich ist, daß kleine, anscheinend irrelevante Unterschiede die Symmetrie zwischen den beiden Widersachern aufheben, und damit den ursprünglich symmetrischen Konflikt in einen asymmetrischen verwandeln (Maynard Smith, 1976; Hammerstein, 1979). Dies könnte erklären, warum gemischte Strategien in paarweisen Konflikten relativ selten zu sein scheinen. Andererseits gilt, daß dann gemischte E S S plötzlich wieder möglich werden, wenn die Population X nicht nur mit der Population Y, sondern auch mit sich selbst interagiert, (Taylor, 1979; Schuster et al., 1981a,b,c).
Strategische und genetische
Modelle
Nash-Gleichgewichte
49
und das ,ßpr δ digkeit-Untreue"
Spiel
Ein beliebiges Paar von Strategien (p, q) (mit ρ £ S n , q g S m ) heiße ein Nash-Gleichgewichtspaar, wenn
ρ · Aq
>
χ · Aq,
für îille
χ g Sn,
(22)
q · Bp
>
y · Bp,
für alie
y € Sm.
(23)
Nash-Gleichgewichte spielen eine wichtige Rolle in der klassischen Spieltheorie, da es für rationale Spieler keinen Grund gibt, einseitig von den Strategien ρ und q abzuweichen, solang ihr jeweiliger Widersacher nicht simultan auch davon abweicht. Wir werden jedoch sogleich sehen, daß in biologischen Spielen Nash-Gleichgewichte nicht sicher gegen Unterwanderung sind. Betrachten wir dazu ein anderes wohlbekanntes Beispiel, das „SprödigkeitUntreue" Spiel von Dawkins (1976). Die Geburt eines Nachkommens erhöhe die Fitness beider Eltern jeweils um den Betrag G. Die dazu erforderliche elterliche Investition \C\ wird gänzlich vom Weibchen getragen werden müssen, wenn das Männchen sie verläßt. Ansonsten soll sie in gleicher Weise von beiden Eltern getragen werden. Die weibliche Gegenstrategie zur Fahnenflucht des Männchens ist „Sprödigkeit", d.h. sie besteht auf einer langen Verlobungsperiode, welche beiden Partnern zusammen |Z?| kostet (und in die ein großer Teil der Investionen für die Nachkommenschaft vorverlagert wird. Anmerkung des Herausgebers). Wieder messen wir alle Parameter auf derselben Werteskale, und haben G > 0; C, E < 0. Es gebe zwei Phänotypen in der männlichen Population X, nämlich Ei (untreu) und E2 (treu), und zwei Phänotypen in der weiblichen Population Y, nämlich Fi (spröde) und F 2 (bereitwillig). Die Auszahlungsmatrizen sind: 0
0
G+J+E
,B =
A = G+^+E
G+j
(24) G+C
G+%
Kein Paar von Phänotypen ist evolutionsstabil und kein Populationszustand ist eine ESS (wir müssen nur reine Populationszustande prüfen). Es existiert ein und nur ein Paar gemischter Strategien ρ und q im NashGleichgewicht, nämlich: Pi =
E E + C + G'
9i =
2 (E + G)'
(25)
(mit ρ = (ί>ι)ί>2) 6 S 2 , q = (