Kollektives Verhalten von Automaten [Reprint 2021 ed.] 9783112483404, 9783112483398


189 38 79MB

German Pages 347 [309] Year 1979

Report DMCA / Copyright

DOWNLOAD PDF FILE

Recommend Papers

Kollektives Verhalten von Automaten [Reprint 2021 ed.]
 9783112483404, 9783112483398

  • 0 0 0
  • Like this paper and download? You can publish your own PDF file online for free in a few minutes! Sign Up
File loading please wait...
Citation preview

W. I. WARSOHAWSKI

K O L L E K T I V E S V E R H A L T E N VON AUTOMATEN

ELEKTRONISCHES RECHNEN UND REGELN

Herausgegeben

von

Prof. Dr. H A N S F R Ü H A U F • Prof. Dr. W I L H E L M K Ä M M E R E R Prof. Dr. K U R T S C H R Ö D E R • Prof. Dr. H E L M U T T H I E L E Prof. Dr. H O R S T VÖLZ

Sonderband

24

von

W. I. W A R S C H A W S K I

AKADEMIE-VERLAG • BERLIN 1978

W. I. W A R S C H A W S K I

KOLLEKTIVES VERHALTEN VON AUTOMATEN In deutscher Sprache herausgegeben von

Dipl.-Math. Gerhard Paulin, Berlin

Mit 87

Abbildungen

AKADEMIE-VERLAG • BERLIN 1978

B. M. BapiuaBCKHft KojiJieKTHBHoe noBeneHHe aBTOMaTOB, H3«aTejibCTB0 Hayna, MocKBa, 1973

Deutsche Übersetzung: Dipl.-Math. Hans Kühne, Berlin

Erschienen im Akademie-Verlag, 108 Berlin, Leipziger Str. 3—4 © Akademie-Verlag Berlin 1978 Lizenznummer: 202 • 100/539/78 Gesamtherstellung: V E B Druckhaus „Maxim Gorki", 74 Altenburg Bestellnummer: 762 111 1 (6256) • LSV 1075 Printed in GDR EVP 4 8 , -

VORWORT ZUR

ORIGINALAUSGABE

Im Jahre 1964 haben M. L. ZETLIN und ich zum erstenmal die Idee der Herausgabe dieses Buches beraten. Im Winter 1964/65 schrieben wir einen Übersichtsvortrag „Kollektive von Automaten und Verhaltensmodelle" für die III. Allunionskonferenz zu Fragen der automatischen Steuerung und im Winter 1965/66 den Vortrag „Automata and models of collective behaviour" für den III. IFAC-Kongreß in London. Beide Vorträge betrachteten wir als ersten Inhaltsentwurf des Buches. Auf der Grundlage der beiden Vorträge wurden zwei weitere Übersichtsvorträge gehalten, und zwar von M. L. ZETLIN in Prag und vom Autor dieses Buches in Edinburgh. Im Sommer 1966 wollten wir mit der Vorbereitungsarbeit für das Buch beginnen, jedoch machte der tragische Tod M. L. ZETLINS diese Pläne zunichte. Im Jahre 1969 wurde postum ein Sammelband von Arbeiten M. L. ZETLINS mit dem Titel „Untersuchungen zur Automatentheorie und der Modellierung biologischer Systeme" herausgegeben. Im Sammelband wurde unter die bis 1966 angeführten Arbeiten über das kollektive Verhalten von Automaten ein Schlußstrich gezogen, und im Anhang wurde ein kurzer Überblick über eine Reihe späterer Resultate gegeben. Der Sammelband umfaßte den ursprünglichen von uns 1964 beratenen Plan des Buches. Jedoch schon zum Erscheinungszeitpunkt des Buches von M. L. ZETLIN hatte man eine Reihe neuer Ergebnisse erhalten, die in einigen Fällen wesentliche Bedeutung für die Thematik hatten. Eine Vielzahl von Diskussionen überzeugte den Autor davon, daß die Idee der Herausgabe des Buches aktuell blieb. Um die Geschlossenheit der Darstellung zu bewahren, wurde im Buch die Darlegung einiger Fragen des Sammelbandes von M. L. ZETLIN wiederholt. Außerdem wurden Ergebnisse einer Reihe von Zeitschriftenartikeln verwendet, deren Autoren in der Regel Teilnehmer des jährlichen Seminars des Kybernetiklaboratoriums der Leningrader Abteilung des zentralen mathematisch-ökonomischen Instituts der AdW der UdSSR sind. In den Anmerkungen zum Buch sind die Autoren der dargelegten Ergebnisse angeführt, was natürlich nicht die Übertragung der Verantwortung für die Qualität des Buches auf die erwähnten Personen bedeutet. Die Auswahl des Materials für das Buch wurde durch folgende Überlegungen bestimmt : erstens durch das eigene wissenschaftliche Interesse des Autors und das wissenschaftliche Interesse derjenigen Personen, mit denen der Autor langjährige wissenschaftliche Kontakte unterhält; zweitens durch das Streben danach, ein häufig äußerst verschiedenartiges Material, das nur durch den einheitlichen methodologischen Zugang verknüpft war, einheitlich und zusammenhängend darzustellen; drittens durch den Wunsch, einen genügend großen Kreis inhaltsreicher Fragestellungen zu erfassen, um die Möglichkeit zu demonstrieren, in der Sprache des kollektiven Verhaltens von Automaten über komplizierte Objekte verschiedenartiger Natur zu sprechen. Ein Teil des Buchmaterials erscheint im Kleindruck. Ein Leser, der sich im wesent-

VI

Vorwort

liehen nur f ü r die inhaltliehe Seite einer Frage interessiert, k a n n diese Stellen ohne Schaden f ü r das Verständnis übergehen. Der Autor drückt seine aufrichtige Dankbarkeit all jenen aus, die ihm freundlicherweise die Verwendung ihrer Resultate in diesem Buch ermöglicht haben und bittet alle Personen, deren interessante Resultate auf dem Gebiet der Untersuchung von Modellen des Verhaltens von Automaten in zufälligen Medien u n d von Modellen des kollektiven Verhaltens in diesem Buche nicht erwähnt werden, um aufrichtige Entschuldigung. Aber leider k a n n m a n das nicht umfassen, was u n u m f a ß b a r ist. Die ständigen K o n t a k t e mit M. M. B O N G A R D , W. A. B O R O W I K O W , E. M. B R A W E R M A N , W . S. GURFINKEL, S. M . MEERKOW, L . I. ROSONOER, 1 . 1 . PJATEZKI-SCHAPIRO u n d

die

Diskussion sowohl eigener wissenschaftlicher Ergebnisse des Autors als auch dieses Buches brachten einen sehr großen Nutzen. Der Autor zweifelt daran, daß er die Arbeit ohne die ständige Hilfe von W . B. M A R A C H O W S K I , W. A. P E S T S C H A N S K I u n d L . J A . R O S E N B L J U M und deren unermüdlichem Bemühen, Fehler im Manuskript festzustellen, zu Ende geführt hätte. Der Autor bedauert es, wenn diese sich fast in ein sportliches Spiel verwandelte Beschäftigung der Fehlersuche nicht zu Ende geführt wurde. Seine besondere Dankbarkeit drückt der Autor dem Redakteur des Buches, D. A. PosP E L O W aus, der viel Arbeit aufgewendet hat, um das Buch gut lesbar zu machen. Leningrad, J a n u a r 1972

V O R W O R T

Autor

D E S

H E R A U S G E B E R S

Die reale Welt zu erkennen, erfolgt im allgemeinen auf dem Wege, abstrakte Modelle f ü r Objekte oder Erscheinungen zu schaffen, diese Modelle zu untersuchen und zu verbessern und aus der Erforschung der Modelle Schlüsse auf das modellierte Objekt zu ziehen. Die stürmische Entwicklung technischer Wissenschaften hat in den letzten J a h r z e h n t e n zu realen, großen Systemen geführt, deren Verhalten zu beschreiben zwar f ü r die Praxis ungemein wichtig ist, aber wegen der zufälligen Einflüsse und der zwischen den Systemteilen existierenden Wechselbeziehungen große Schwierigkeiten bereitet. E s gehört deshalb seit langem zu den reizvollen Arbeiten, mit den durch die Mathematik zur Verfügung gestellten Methoden und mit ihrem Formalismus Systeme oder Systemteile zu beschreiben. Entsprechende Arbeiten sind Teil mathematischer, praxisorientierter Forschung, wenn auch häufig die Restriktionen, die bei der Modellierung heute noch erforderlich sind, diese Praxisbezogenheit verschütten. Da dergleichen Forschungsarbeiten aber weltweit betrieben werden, ist es zu begrüßen, daß der Akademie-Verlag in sein Veröffentlichungsprogramm eine neuere, sowjetische Arbeit aufgenommen hat. Ich möchte f ü r das Lesen des deutschsprachigen Manuskriptes, f ü r zahlreiche Diskussionen, f ü r Hinweise und Vorschläge f ü r die Endfassung Herrn Prof. Dr. H E L M U T THIELE, Humboldt-Universität zu Berlin, herzlich danken. Ferner geht mein D a n k an den Autor f ü r den K o n t a k t während der Übersetzung u n d der Vorbereitung der Herausgabe. Berlin, Dezember 1977

GERHARD PAULIN

VI

Vorwort

liehen nur f ü r die inhaltliehe Seite einer Frage interessiert, k a n n diese Stellen ohne Schaden f ü r das Verständnis übergehen. Der Autor drückt seine aufrichtige Dankbarkeit all jenen aus, die ihm freundlicherweise die Verwendung ihrer Resultate in diesem Buch ermöglicht haben und bittet alle Personen, deren interessante Resultate auf dem Gebiet der Untersuchung von Modellen des Verhaltens von Automaten in zufälligen Medien u n d von Modellen des kollektiven Verhaltens in diesem Buche nicht erwähnt werden, um aufrichtige Entschuldigung. Aber leider k a n n m a n das nicht umfassen, was u n u m f a ß b a r ist. Die ständigen K o n t a k t e mit M. M. B O N G A R D , W. A. B O R O W I K O W , E. M. B R A W E R M A N , W . S. GURFINKEL, S. M . MEERKOW, L . I. ROSONOER, 1 . 1 . PJATEZKI-SCHAPIRO u n d

die

Diskussion sowohl eigener wissenschaftlicher Ergebnisse des Autors als auch dieses Buches brachten einen sehr großen Nutzen. Der Autor zweifelt daran, daß er die Arbeit ohne die ständige Hilfe von W . B. M A R A C H O W S K I , W. A. P E S T S C H A N S K I u n d L . J A . R O S E N B L J U M und deren unermüdlichem Bemühen, Fehler im Manuskript festzustellen, zu Ende geführt hätte. Der Autor bedauert es, wenn diese sich fast in ein sportliches Spiel verwandelte Beschäftigung der Fehlersuche nicht zu Ende geführt wurde. Seine besondere Dankbarkeit drückt der Autor dem Redakteur des Buches, D. A. PosP E L O W aus, der viel Arbeit aufgewendet hat, um das Buch gut lesbar zu machen. Leningrad, J a n u a r 1972

V O R W O R T

Autor

D E S

H E R A U S G E B E R S

Die reale Welt zu erkennen, erfolgt im allgemeinen auf dem Wege, abstrakte Modelle f ü r Objekte oder Erscheinungen zu schaffen, diese Modelle zu untersuchen und zu verbessern und aus der Erforschung der Modelle Schlüsse auf das modellierte Objekt zu ziehen. Die stürmische Entwicklung technischer Wissenschaften hat in den letzten J a h r z e h n t e n zu realen, großen Systemen geführt, deren Verhalten zu beschreiben zwar f ü r die Praxis ungemein wichtig ist, aber wegen der zufälligen Einflüsse und der zwischen den Systemteilen existierenden Wechselbeziehungen große Schwierigkeiten bereitet. E s gehört deshalb seit langem zu den reizvollen Arbeiten, mit den durch die Mathematik zur Verfügung gestellten Methoden und mit ihrem Formalismus Systeme oder Systemteile zu beschreiben. Entsprechende Arbeiten sind Teil mathematischer, praxisorientierter Forschung, wenn auch häufig die Restriktionen, die bei der Modellierung heute noch erforderlich sind, diese Praxisbezogenheit verschütten. Da dergleichen Forschungsarbeiten aber weltweit betrieben werden, ist es zu begrüßen, daß der Akademie-Verlag in sein Veröffentlichungsprogramm eine neuere, sowjetische Arbeit aufgenommen hat. Ich möchte f ü r das Lesen des deutschsprachigen Manuskriptes, f ü r zahlreiche Diskussionen, f ü r Hinweise und Vorschläge f ü r die Endfassung Herrn Prof. Dr. H E L M U T THIELE, Humboldt-Universität zu Berlin, herzlich danken. Ferner geht mein D a n k an den Autor f ü r den K o n t a k t während der Übersetzung u n d der Vorbereitung der Herausgabe. Berlin, Dezember 1977

GERHARD PAULIN

INHALTSVERZEICHNIS Einleitung Kapitel I. Verhalten von Automaten in zufälligen Medien § 1.1. Problemstellung § 1.2. Asymptotisch-optimale Polgen von symmetrischen Automaten . . . . § 1.3. Verhalten kontinuierlicher Automaten in stationären zufälligen Medien § 1.4. Stochastische Automaten mit veränderlicher Struktur § 1.5. Verhalten von Automaten in umschaltbaren zufälligen Medien . . . .

VIII 1 1 7 28 36 45

Kapitel I I . Automatenbeispiele §2.1. Spiele von N Automaten § 2.2. Nullsummenspiele zweier Automaten § 2.3. Homogene Automatenspiele § 2.4. Beispiele symmetrischer Automatenbeispiele § 2.5. Das Ö-Spiel § 2.6. Kreisspiele

67 67 71 88 97 109 129

Kapitel I I I . Zufällige paarweise Koalition in Kollektiven von Automaten . . § 3.1. Zufällige paarweise Koalition im O-Spiel § 3.2. Zufällige paarweise Koalition in symmetrischen Automatenspielen . . . § 3.3. Synchronisierung des Verhaltens der Automaten bei zufälliger paarweiser Koalition

137 137 154

Kapitel IV. Modelle des kollektiven Verhaltens § 4.1. Modelle mit Zweiebenenorganisation §4.2. Kollektives Verhalten in einem Bedienungssystem mit Warteschlange § 4.3. Kollektives Verhalten im Problem der Ressourcenzuteilung § 4.4. Kollektives Verhalten bei der Leistungsregulierung § 4.5. Ein dezentralisiertes Steuerungsverfahren zur Verbindungsherstellung in Fernmeldenetzen

160 175 175 186 201 216 232

Kapitel V. Verhalten von Systemen kooperierender Automaten 243 § 5.1. Synehronisierung in Automatenketten 243 § 5.2. Berechnung der Punktionswerte logischer Funktionen durch Ketten kooperierender Automaten 262 Anmerkungen

277

Literaturverzeichnis

281

Sachwortverzeichnis

287

EINLEITUNG Die Entwicklung der Technik und das Kompliziertwerden der organisatorischen und sozialen Struktur der Gesellschaft machen die Untersuchung komplizierter Systeme erforderlich. Solche Systeme werden häufig als „große Systeme" bezeichnet. Ohne terminologische Wortgefechte über die Definition eines „großen Systems" zu führen (solche Definitionen gibt es in der entsprechenden Literatur im Überfluß), ist es uns dennoch möglich, eine Reihe von Systemen anzugeben, von denen man allgemein überzeugt ist, daß sie „große" Systeme sind. Zweifellos findet m a n derartige Beispiele leicht in der Ökonomie — große Betriebe, Industriezweige, internationaler Handel u. ä. Diese Reihe von Beispielen k a n n auch auf dem Gebiet der Technik fortgeführt werden — Systeme der PWO, große Kommunikationsnetze usw. Dazu sei bemerkt, daß das gegenwärtige internationale Telefonnetz, das automatische Verbindungen zwischen beliebigen Teilnehmern aus verschiedenen Ländern ermöglicht u n d das den Teilnehmern eine beträchtliche Anzahl automatischer Dienstleistungen bietet, mindestens 10® —109 Schaltpunkte enthält. Das erwähnte System wurde niemals als einheitliches Ganzes projektiert, sondern entstand als Ergebnis der Evolution der Nachrichtentechnik. Darin liegen auch die Stärken und Schwächen eines solchen Systems. Schwächen deshalb, weil möglicherweise ein von einheitlichen Positionen aus projektiertes Nachrichtensystem effektiver arbeiten würde. Die Stärken bestehen darin, daß das System trotz der riesigen Anzahl von Elementen u n d der Kompliziertheit eine völlig ausreichende Nachrichtenverbindung gewährleistet. I n der T a t k a n n m a n annehmen, daß in einem solchen System stündlich 104 Elemente defekt werden. Das dies anscheinend so ist, vermutet jeder, der versucht, eine Störungsstelle anzurufen. Die Funktionsfähigkeit des Systems wird hier durch eine starke Dezentralisierung der Steuerung und eine hohe Autonomie der Bestandteile — Telefonzentralen, Ämter u. ä. — gewährleistet. Die ausgeprägtesten Beispiele von äußerst komplizierten Systemen finden wir in der Biologie. Ungeachtet der offenbaren Unterschiede hinsichtlich der zu lösenden Aufgaben, der zu verwendenden Komponenten usw. haben derartige Systeme bezüglich der Steuerung eine Reihe gemeinsamer Eigenschaften. Das Erkennen von allgemeinen Gesetzmäßigkeiten, die beim Funktionieren hochkomplizierter Systeme auftreten, ist eine der dringendsten Aufgaben der modernen Wissenschaft. Technik, Ökonomie, Biologie und Soziologie — das ist eine bei weitem nicht vollständige Aufzählung von Wissenschaften, f ü r deren Weiterentwicklung die Klärung der beim Funktionieren hochkomplizierter Systeme auftretenden Hauptgesetzmäßigkeiten unbedingt erforderlich ist. Worin bestehen nun die charakteristischen Merkmale der von uns zu beobachtenden hochkomplizierten Systeme? Uns scheint es, daß eines der wichtigsten Merkmale die große Yerhaltensautonomie der Systembestandteile, der Untersysteme, ist. Diese Tatsache wird sehr gut in den verschiedenen hierarchischen Ebenen einer biologischen

Einleitung

IX

Organisation deutlich. Die mehrzelligen Organismen bestehen aus einzelnen Zellen, die sich bei entsprechenden Bedingungen ernähren, fortbewegen und teilen können, d. h., sie können außerhalb des Organismus normal funktionieren. Diese Fähigkeit der Zellen kann man selbst bei hochorganisierten Tieren an den Gewebekulturen erkennen. Zu einem Ganzen, dem Organismus, vereint, besitzen sie insgesamt ein einheitliches zweckmäßiges Verhalten, das auf die Aufrechterhaltung der inneren Struktur nicht nur jeder einzelnen Zelle, sondern auch ihrer Gesamtheit als einheitliches Ganzes gerichtet ist. In solchen SuperOrganismen, wie z. B. einem Ameisenhaufen, die ein einheitliches Versorgungs- und Koordinationssystem besitzen, ist die Verhaltensautonomie der Komponenten — der einzelnen Insekten — noch höher. Trotzdem zeigt das System als Ganzes ein einheitliches zweckmäßiges Verhalten und ist so stabil, daß die Evolution die Ameisen im Verlaufe von Millionen Jahren praktisch kaum berührt hat. Die Reihe ähnlicher biologischer Beispiele kann man fortführen. Wir erwähnen, daß die Idee einer solchen Organisation eine glänzende Weiterentwicklung im Roman „Der Unbesiegbare" des polnischen Schriftstellers STANISLAW L E M erfahren hat. Wenn wir uns ökonomischen und Produktionssystemen zuwenden, so können wir auch hier leicht einen hohen Grad von Verhaltensautonomie der Untersysteme feststellen. In diesem Falle muß man berücksichtigen, daß bei der Leitung einer Gesamtheit von ökonomischen Systemen oder Produktionssystemen die höherstehende Leitungsebene faktisch nicht die Untersysteme selbst leitet, sondern die an der Spitze dieser Untersysteme stehenden Menschen, welche zweifellos ihre eigenen lokalen Interessen und Ziele haben. Die Identifizierung dieser Interessen und Ziele mit den Interessen und Zielen des Gesamtsystems hängt wesentlich von den Methoden der Leitungsorganisation im System ab. Die Fragen der Verhaltensautonomie sind eng verbunden mit einer weiteren Frage, nämlich der Dezentralisierung der Steuerung im System. Fragen der Dezentralisierung und Zentralisierung sind eine der tiefgehendsten und wichtigsten Fragen der Steuerungsorganisation in komplizierten Systemen. Allem Anschein nach ruft die Tatsache keinen Zweifel hervor, daß bei Vorhandensein von absolut zuverlässigen Steuerungs- und rechentechnischen Mitteln, von zuverlässigen Nachrichtenkanälen mit einer ausreichenden Durchlaßfähigkeit und einer ausreichenden Leistungsfähigkeit von Steuerungs- und rechentechnischen Mitteln eine äußerst zentralisierte Steuerung sicherlich jeder anderen vorzuziehen ist. Das folgt schon aus solchen Überlegungen, daß bei Erfülltsein der oben angeführten Bedingungen in der zentralen Rechen- oder Steuerungsvorrichtung Algorithmen des lokalen Verhaltens realisiert werden können, d. h., es können alle Aufgaben, die ein dezentralisiertes Verhalten sicherstellen, zentralisiert gelöst werden. Außerdem eröffnet die Zentralisierung eine Reihe zusätzlicher Möglichkeiten. Selbst für sich betrachtet ist eine zentralisierte Lösung lokaler Aufgaben vorteilhaft, weil beispielsweise die Ausführung einer arithmetischen Operation um so billiger wird, je größer die Rechenanlage oder das System ist. Allerdings zeichnen sich hierbei schon eine Reihe von unangenehmen Kleinigkeiten ab. In äußerst zentralisierten Systemen wächst der Umfang der Bedienungs- und Dispatchersysteme schneller als die Zahl der zu bedienenden Aufgabenquellen, und es ist zur Zeit nicht bekannt, wie groß diese Umfänge in äußerst komplizierten Systemen sind. Aber selbst wenn man bei der Einschätzung der Effektivität zentralisierter hochkomplizierter Systeme Optimist bleibt, so muß man sich doch von einem Teil dieses Optimismus bei der Betrachtung von Fragen der Zuverlässig-

X

Einleitung

keit von Steuerungs- und rechentechnischen Mitteln und auch bei Fragen der Zuverlässigkeit und Durchlaßfähigkeit von Nachrichtenkanälen trennen. Wir haben hier die Begriffe Zuverlässigkeit und Lebensfähigkeit zu unterscheiden. Die Konzeption der Zuverlässigkeit ist in ihrer klassischen Fragestellung offenbar nicht für hochkomplizierte Systeme anwendbar, weil alle bekannten Maßnahmen zur Erhöhung der Zuverlässigkeit nur die Ausfallwahrscheinlichkeit senken, wobei selbst eine Senkung der Ausfallwahrscheinlichkeit eines Elementes um zwei Ordnungen im Vergleich zum heute erreichten Stand nichts Prinzipielles für hochkomplizierte Systeme ändert. Für Systeme aber, die solchen extremen äußeren Einwirkungen, wie beispielsweise Explosionen und Stößen, ausgesetzt sind, ist die klassische Zuverlässigkeitskonzeption überhaupt nicht anwendbar. In den erwähnten Fällen ist es sinnvoll, über die Lebensfähigkeit des Systems zu sprechen, d. h. über die Fähigkeit des Systems, seine Funktionen oder einen Teil dieser Funktionen selbst bei ernsthaften Beschädigungen der Einzelteile auszuführen, wobei es möglich ist, daß dies auch langsamer oder weniger genau geschieht. Im Zusammenhang damit ist es interessant, Worte aus einem Vortrag zu zitieren, der am 25. Februar 1965 von M. L. Z E T L I N auf einer Sitzung einer Sektion der Moskauer physiologischen Gesellschaft gehalten wurde: ,,In der Technik und in der Physiologie kann man die Zuverlässigkeit verschieden auffassen. Genauer gesagt habe ich folgende unangenehme Eigenschaft aller unserer technischen Erzeugnisse im Sinn: ihre ungleichmäßige Zuverlässigkeit. Ich denke dabei an folgende paradoxe Sache: Ein Hemd wird weggeworfen, wenn der Kragen abgetragen ist, obwohl die restlichen Teile des Hemdes völlig unbeschädigt sind. Beliebige Maschinen, selbst große und schwere, werden ausrangiert, sobald sie sich geringfügig abnutzen. Dabei kann es sein, daß buchstäblich nur einige Gramm Metall fehlen. Wenn beispielsweise ein Maschinengestell wacklig wurde, dann ist dies durch nichts mehr zu ersetzen. Kluge Leute, die zur Zeit meiner Eltern Hemden herstellten, verkauften diese mit Ersatzkragen. Sie wurden mit Hilfe von Kragenknöpfen an den Hemden befestigt und waren austauschbar. Nebenbei bemerkt, auch bei allen technischen Erzeugnissen werden die Arbeitsteile, soweit dies möglich ist, so hergestellt, daß sie austauschbar sind. Es wäre natürlich viel angenehmer, wenn sich ein Hemd nicht so verhielte, sondern daß es einfach durch das Tragen und das Kragenwaschen kürzer würde. In der Regel ist das Hemd lang genug, und man könnte es sicherlich zehnmal so lange tragen wie dies heute der Fall ist. Das betrifft nebenbei bemerkt in gleichem Maße auch das Schuhwerk: Schuhe werden weggeworfen, wenn sie meist noch völlig neu sind. Es wäre weitaus angenehmer, wenn eine derartige Kompensation im Laufe der Zeit vor sich gehen würde." 1 ) Aus dem Gesagten muß klar geworden sein, was wir unter dem Begriff Lebensfähigkeit verstehen. Man erkennt leicht, wie gering die Lebensfähigkeit zentralisierter Systeme ist. Der Ausfall der Zentraleinheit beraubt das System vollständig seiner Steuerungsmittel und der Ausfall von Nachrichtenkanälen bringt ein Untersystem in eine katastrophale Lage. Ein natürlicher Weg im Kampf um die Lebensfähigkeit ist die Aufteilung der Steuerungsfunktionen innerhalb des Systems. Darüber sprach schon 1949 J . v. NEUMAUTST in seinen an der Illinois-Universität gehaltenen Vorlesungen „Theorie und Organisation komplizierter Automaten": M. L. ZETLIN, Untersuchungen zur Automatentheorie und der Modellierung biologischer Systeme, Verlag Nauka, Moskau 1969 (russ.).

Einleitung

XI

„Die Tatsache, daß sich die natürlichen Organismen sehr verschieden gegenüber Fehlern verhalten und sich völlig anders führen, wenn der Fehler auftritt, ist' wahrscheinlich mit anderen Eigenschaften der natürlichen Organismen verbunden, die unseren Automaten völlig fehlen. Die Fähigkeit der natürlichen Organismen, selbst bei einer großen Anzahl von Defekten zu überleben (wozu künstliche Automaten überhaupt nicht fähig sind), ist wahrscheinlich mit einer hohen Anpassungsfähigkeit, mit der Fähigkeit des Automaten, sich selbst zu beobachten und zu reorganisieren, verbunden. Das setzt aber allem Anschein nach eine bedeutende Autonomie seiner Teile voraus. Im Nervensystem des Menschen ist eine solche Autonomie stark ausgeprägt. Die Autonomie der Teile führt zu einem Effekt, den man im menschlichen Nervensystem beobachten kann und der in künstlichen Automaten fehlt. Wenn die Teile autonom und reorganisationsfähig sind, wenn es einige Organe gibt, von denen jedes Organ im Falle der Notwendigkeit in der Lage ist, die Steuerung auszuführen, dann können sich zwischen den Teilen antagonistische Wechselbeziehungen entwickeln, und die Teile werden im weiteren Verlaufe nicht mehr „freundschaftliche Beziehungen pflegen" und zusammenarbeiten. Es ist sehr wahrscheinlich, daß all diese Erscheinungen miteinander verbunden sind."1) Die Dezentralisierung eines Steuerungssystems erscheint also, wenigstens vom Standpunkt der Lebensfähigkeit des Systems aus, in einer Reihe von Fällen als zweckmäßig. Eine zweite Ursache, die eine Dezentralisierung nützlich und in einer Reihe von Fällen auch notwendig macht, ist mit den begrenzten Möglichkeiten der Nachrichtenkanäle verbunden. Man kann sich leicht eine Situation vorstellen, bei der Verzögerungen im Nachrichtenkanal eine wesentliche und nicht zu beseitigende Eigenschaft des Kanals sind. In einem solchen Falle kann sich die Steuerung durch eine Zentraleinheit überhaupt als unmöglich erweisen. So ist es offenbar unmöglich, von der Erde aus die weiche Landung einer kosmischen Apparatur auf dem Mars zu steuern. Andererseits ist die Dezentralisierung eine Sache, die im allgemeinen auch nicht ungefährlich ist. Eine völlige Dezentralisierung der Steuerung gestattet es nicht, operativ Informationen über Veränderungen in den Zielen des Gesamtsystems an die Untersysteme zu übermitteln. Und selbst die naive Meinung darüber, daß bei „gutem" Funktionieren aller Untersysteme auch das Gesamtsystem „gut" funktioniert, ist nur in dem Falle möglich, wenn die Untersysteme absolut unabhängig sind. Wir betrachten ein einfaches Beispiel.2) Es mögen 100 Arbeiter zur Verfügung stehen, die ihren Arbeitsplatz in einem der beiden Betriebe A oder B wählen können. Der Lohn eines jeden Arbeiters ist der Erzeugnismenge proportional, die in jedem Betrieb pro Arbeiter hergestellt wird. Dabei wächst in jedem Betrieb mit der Anzahl der im Betrieb tätigen Arbeiter auch der Produktionsausstoß. Allerdings wird der auf einen Arbeiter entfallende Teil des Produktionsausstoßes kleiner, d. h., der Lohn eines Arbeiters sinkt. Wir wollen voraussetzen, daß die Arbeiter ihren Arbeitsplatz frei wählen können und daß sie sich dabei nur von der Höhe des Lohnes leiten lassen. Bei den von uns gemachten Voraussetzungen ist das Bemühen eines Arbeiters um eine Erhöhung seines Lohnes dem Bemühen um eine Erhöhung der von ihm hergestellten Erzeugnisse, d. h. der Erhöhung der Arbeitsproduktivität, äquivalent. ) J . v. NEUMANN, Theorie sich selbst reproduzierender Automaten, Verlag Mir, Moskau 1971 (russ.). 2 ) Das mit diesem Beispiel verknüpfte Modell wird ausführlich im § 2.4 behandelt. J

XII

Einleitung

Zur Illustration setzen wir den Produktionsausstoß im Betrieb A gleich YÄ = 'JXA 0 . 0 5 X / und im Betrieb B gleich YB = iXB - 0,05X B 2 . XÄ u n d XB bezeichnen dabei die in den Betrieben A und B beschäftigten Arbeiter. Man erkennt leicht, daß der Lohn pro Arbeiter im Betrieb A immer größer ist als im Betrieb B, u n d bei einem dezentralisierten Verhalten der Arbeiter werden sich diese alle im Betrieb A konzentrieren. Dabei wird der Betrieb A YÄ = 400 Erzeugniseinheiten herstellen, und der Lohn eines Arbeiters wird gleich CA — 4 sein. Interessiert uns jedoch der Gesamtausstoß der B e t r i e b e t und B, so müssen die Arbeiter folgendermaßen auf die Betriebe aufgeteilt werden: XÄ = 75, XB = 25. Dabei werden insgesamt 462,5 Erzeugniseinheiten hergestellt (Y A = 393,75; YB = 68,75). Der Lohn im Betrieb A ist gleich CA = 5,25 und im Betrieb B gleich CB = 2,75. Die Anwendung einer unmittelbaren Steuerung, d. h. anzuweisen, daß 25 Arbeiter im Betrieb B arbeiten, r u f t deren verständlichen Widerstand hervor, weil in diesem Falle der Steuerungseinfluß den lokalen Interessen des Untersystems (in unserem Beispiel der Arbeiter) widerspricht. Einerseits f ü h r t also ein dezentralisiertes Verhalten einer Gruppe von nach maximaler Arbeitsproduktivität strebenden Arbeitern dazu, daß die mittlere Arbeitsproduktivität von 4 Einh./Arbeiter den Maximalwert von 4,625 Einh./Arb. nicht erreicht. Um diesen optimalen Wert zu erreichen, m u ß man 1/4 aller Arbeiter „zwingen", mit einer wesentlich geringeren Arbeitsproduktivität von 2,75 Einh./Arb. zu arbeiten. Andererseits folgt daraus, daß bei einer solchen Entlohnung die zentralisierte Steuerung auf den offenen Widerstand der Ausführenden trifft. Es ist leicht zu erkennen, daß die als Beispiel angeführte Situation sehr unnatürlich ist und daß es eine große Anzahl von Möglichkeiten gibt, den hier auftretenden Schwierigkeiten auszuweichen. Allerdings ist eine solche Situation charakteristisch f ü r Steuerungsaufgaben in großen Systemen, in denen jedes Untersystem auf Grund verschiedener Ursachen seine eigenen ausgeprägten lokalen Interessen hat, u n d jede zentralisierte Steuerung funktioniert vor dem Hintergrund eines gemeinsamen Verhaltens von Untersystemen, das in diesem oder jenem Maße offen auf die Erreichung seiner lokalen Ziele gerichtet ist. F a ß t m a n das Gesagte zusammen, so k a n n m a n folgern, daß es unmöglich ist, der rein zentralisierten oder der rein dezentralisierten Steuerung den Vorzug zu geben. Offenbar ist es notwendig, die Anwendungsgrenzen der dezentralisierten Steuerung zu finden, bei denen alle Vorzüge der dezentralisierten Steuerung voll genutzt werden können und danach nach Möglichkeiten zu suchen, eine zentrale Steuerung einzuführen, die die vor dem System stehenden globalen Ziele unter Berücksichtigung des gemeinsamen Verhaltens der Untersysteme verwirklicht. Zur Lösung der gestellten Aufgabe sind verschiedene Wege möglich. Einmal k a n n m a n real existierende komplizierte Systeme untersuchen und versuchen, die Prinzipien der Organisation der Steuerung in solchen Systemen zu klären. Die Biologie liefert uns eine Vielzahl von Beispielen für einen derartigen Zugang. Hier sind besonders die Arbeiten der Schule des korrespondierenden Mitglieds der A d W der UdSSR I. M. GELFAITD ZU erwähnen. 1 ) Arbeiten dieser Art finden wir auch in der Ökonomie und in der Soziologie. -

r ) Die Ergebnisse der Untersuchungen biologischer Systeme, die von diesem wissenschaftlichen Kollektiv durchgeführt wurden, bestimmten fast vollständig die Richtung der in diesem Buche betrachteten Modelluntersuchungen.

Einleitung

XIII

Bei der K o n s t r u k t i o n von komplizierten technischen Systemen regelt der Ausf ü h r e n d e die Gesamtsteuerung u n d die K o o p e r a t i o n der U n t e r s y s t e m e , wobei er sich in der Regel v o n heuristischen Überlegungen leiten l ä ß t . Versuche zur Verallgemeinerung der angesammelten reichen E r f a h r u n g e n f ü h r t e n zur H e r a u s b i l d u n g der m o d e r n e n Systemtechnik. Die Methoden der Operationsforschung ermöglichen es, wesentliche Gesetzmäßigkeiten der Steuerung in Organisationssystemen zu verstehen. Die a n g e f ü h r t e n Zugänge h a b e n es mit realen Systemen zu t u n u n d eröffnen zweifellos große Möglichkeiten zur F o r m i e r u n g einer Theorie der Steuerung in komplizierten Systemen. Andererseits erlauben es die realen S y s t e m e nicht, das A u f t r e t e n der H a u p t g e s e t z m ä ß i g k e i t e n in ihrer reinen Gestalt zu beobachten, d a diese ständig dem E i n f l u ß von vielfältigen F a k toren u n t e r w o r f e n sind, die m i t dem F u n k t i o n i e r e n des Systems selbst z u s a m m e n hängen. D a s B e m ü h e n zur S c h a f f u n g formaler Modelle, die eine B e t r a c h t u n g der Steuerprozesse in komplizierten Systemen erlauben, f ü h r t e zur H e r a u s b i l d u n g der m a t h e matischen (allgemeinen) Systeintheorie. I n ihrem heutigen Z u s t a n d w i d m e t die mathematische Systemtheorie ihr H a u p t a u g e n m e r k der Ausarbeitung eines f o r m a l e n A p p a r a tes, u n d zwar in der Regel im R a h m e n der Theorie dynamischer Systeme u n d der Ergodentheorie. Infolgedessen k o m m t die inhaltliche I n t e r p r e t a t i o n der zu u n t e r s u c h e n d e n O b j e k t e zu kurz. Gleichzeitig sind wir, wie sich ein Teilnehmer des internationalen Symposiums in Suchanowo (Moskauer Gebiet, 1969) b i l d h a f t a u s d r ü c k t e , auf d e m Gebiet des künstlichen Intellekts u n d der Theorie komplizierter Systeme „ n o c h n i c h t von den B ä u m e n g e k l e t t e r t " , u n d es ist gerade in der Periode der H e r a u s b i l d u n g einer Theorie sehr wichtig, eine deutliche inhaltliche I n t e r p r e t a t i o n der zu lösenden Aufgaben beizubehalten. D a b e i e n t s t e h t natürlich die reale Gefahr, d a ß wir anstelle einer vollwertigen Theorie eine Kollektion von m e h r oder weniger interessanten gelösten Aufgaben erhalten. D a v o r sollte m a n sich jedoch nicht f ü r c h t e n , weil dabei zwei sehr wichtige u n d d u r c h a u s nicht überflüssige N e b e n p r o d u k t e entstehen. E i n m a l die Erfahrung bei der Lösung von A u f g a b e n und zum anderen die Sprache, in der m a n b e q u e m über diese A u f g a b e n sprechen k a n n . Aber gerade E r f a h r u n g u n d Sprache bilden jenes F u n d a m e n t , auf dem m a n eine wirkliche Theorie a u f b a u e n k a n n . D a b e i k a n n es sich erweisen (muß aber nicht), d a ß die in der m a t h e m a t i s c h e n Systemtheorie v e r w e n d e t e Sprache der Differentialgleichungen nicht die Sprache ist, in der m a n über große Systeme sprechen m u ß . Z u r U n t e r s u c h u n g der H a u p t g e s e t z m ä ß i g k e i t e n der Organisation der Steuerung in komplizierten Systemen ist es natürlich, eine gewisse Folge von Modellen zu schaffen, a n denen m a n versucht, E r f a h r u n g e n zu sammeln u n d eine Sprache auszuarbeiten, die f ü r „Gespräche über komplizierte S y s t e m e " geeignet ist. Man k a n n hoffen, d a ß es d a m i t möglich wird, Voraussetzungen zur F o r m i e r u n g einer vollwertigen- Theorie zu schaffen. Dieser Zugang ist methodologisch nicht neu, u n d er wird in der Wissenschaft h ä u f i g angewandt. I m Z u s a m m e n h a n g d a m i t ist es angebracht, folgende W o r t e I. M. GELFATTDS a n z u f ü h r e n : „ B e t r a c h t e t m a n beispielsweise die Q u a n t e n m e c h a n i k , so k a n n m a n bei deren Herausbildung zwei E t a p p e n angeben. Die erste E t a p p e , als N I E L S B O H R die Philosophie der Q u a n t e n m e c h a n i k schuf. F o r m e l n gab es noch keine, u n d w e n n es sie gab, so waren sie nicht solche, die m a n benötigte. Die zweite E t a p p e , stürmisches Aufblühen, U m w a n d l u n g in ein e x a k t e s Gebiet der P h y s i k m i t einer großen Anzahl e x a k t e r Formeln. Aber diese E t a p p e ist dennoch die zweite u n d n u r n a c h der ersten E t a p p e

XIV

Einleitung

möglich". 1 ) Das im Text Zitierte endet mit den Worten: „In der Biologie aber ist noch nicht die erste Etappe eingetreten". Mit voller Berechtigung kann man das Wort Biologie auch durch die Wörter Theorie der komplizierten Systeme ersetzen. In dem der Aufmerksamkeit des Lesers empfohlenen Buch wird eine Anzahl von Verhaltensmodellen beschrieben, die es, wie uns scheint, einerseits gestatten, eine Reihe interessanter Charakteristiken des gemeinsamen Verhaltens von Systemen von Objekten mit echt ausgeprägten lokalen Interessen zu erhalten und andererseits es gestatten, ein System von Vorstellungen zu errichten und eine Sprache vorzuschlagen, in der man bequem über komplizierte Systeme sprechen kann. 2 ) Als elementare Objekte, deren gemeinsames (kollektives) Verhalten wir untersuchen werden, verwendet man endliche Automaten. Erstmalig wurde die Idee darüber, daß endliche Automaten äußerst geeignete Objekte zur Schaffung von Modellen komplizierter, unter anderem auch biologischer, Systeme sind, wahrscheinlich von J . VON 3 N E U M A N N ausgesprochen. ) Die Arbeitsrichtung jedoch, die mit der Schaffung von Modellen des kollektiven Verhaltens verbunden ist, wurde von M. L . Z E T L I N formuliert und entwickelt. Im Jahre 1960 begann M. L. Z E T L I N Fragen des Verhaltens von Automaten in zufälligen Medien zu studieren und schlug die Konstruktion eines Automaten mit linearer Taktik vor, der in diesen Medien eine asymptotisch optimale Folge bildet. Die Aufgabenstellung über das Verhalten von Automaten in zufälligen Medien war durch folgende Ursachen bedingt. M. L. Z E T L I N nahm an, daß man ein kompliziertes Verhalten „atomisieren" kann, d. h., man kann bei der Untersuchung des komplizierten Verhaltens einen elementaren Verhaltensakt herauskristallisieren und eine elementare Verhaltensaufgabe formulieren. Wenn man dann einen Mechanismus (endlichen Automaten) konstruiert, der eine Elementaraufgabe gut löst, d. h., der ein zweckmäßiges Verhalten in einer Elementarsituation zeigt, so kann man das komplizierte Verhalten eines komplizierten Objekts als Resultat des gemeinsamen Verhaltens einer großen Anzahl elementarer Objekte betrachten, von denen jedes eine Elementaraufgabe löst. Als elementare Verhaltensaufgabe stellte M. L. Z E T L I N die Frage nach dem Verhalten eines Automaten im zufälligen Medium. Die Auswahl einer solchen Aufgabe als Elementaraufgabe ist nicht zufällig. In der Tat, die oben angeführte Aufgabenstellung kann folgendermaßen ad absurdum geführt werden: ein beliebiges kompliziertes Verhalten, das auf einem endlichen Speichervolumen basiert, kann als ein durch die Realisierung eines Algorithmus mit endlichem Speicher, d. h. durch einen endlichen Automaten erzeugtes Verhalten dargestellt werden; die Aufgabe über die „Atomisierung" des Verhaltens wird dann automatisch auf die Aufgabe der Dekomposition des Ausgangsautomaten oder auf die Aufgabe der Konstruktion eines komplizierten Automaten aus elementaren (Basisautomaten), d. h. auf die klassische Syntheseaufgabe von endEinleitung zum zweiten Teil des Buches von M . L . ZETLIN „Untersuchungen zur Automatentheorie und Modellierung biologischer Systeme", Verlag Nauka, Moskau 1969 (russ.). 2 ) Wenn wir hier von Sprache sprechen, so verstehen wir darunter nicht ein gewisses formal logisches System. Es geht vielmehr um die Möglichkeit, über das Funktionieren komplizierter Systeme in Termini des kollektiven Verhaltens von Automaten zu sprechen. 3 ) Vergleiche dazu auch die Einleitung des Redakteurs (A. BURKS) im Buch J . v. NEUMANNS „Theorie sich selbst reproduzierender Automaten" (Verlag Mir, Moskau 1 9 7 1 (russ.)). Wie A. BURKS behauptet, interpretierte J . v. NEUMANN in seiner Konzeption, im Gegensatz zu N . W I E N E R , die Kybernetik überhaupt nur als Automatentheorie.

Einleitung

XV

liehen Automaten, zurückgeführt. 1 ) Um den inhaltsreichen Aspekt der Aufgabenstellung beizubehalten, wurde als Elementaraufgabe ein formales Analogon zur Aufgabe über ein T-förmiges Labyrinth gewählt, in dem unter der unermüdlichen Aufmerksamkeit von Zoologen, Physiologen und Psychiatern der ganzen Welt fast alle Lebewesen angefangen von Planarien bis zum Menschen gekrochen, gelaufen oder geschwommen sind.2) Die nächste und gleichzeitig grundlegende Frage, die dabei erwuchs, war folgende: Wie kompliziert dürfen die Verhaltensformen sein, damit sie durch eine Gesamtheit von Objekten realisiert werden können, die die elementare Verhaltensaufgabe lösen, und welcher Art sind die Hauptgesetzmäßigkeiten eines solchen gemeinsamen (kollektiven) Verhaltens. Gerade diese Frage war von Beginn an die Hauptfrage und sie bedingte die Aufgabenstellung über das Verhalten von Automaten in zufälligen Medien als eine auf die Bereitstellung von „Baumaterial" für Modelle gerichtete Zwischenetappe. 3 ) Im Jahre 1 9 6 1 erschienen die ersten Arbeiten M. L . ZBTLINS, die dem Verhalten von Automaten in zufälligen Medien gewidmet waren, und der Personenkreis, der sich mit derartigen Fragen beschäftigte und in dieser Thematik mit M. L . Z E T L I N zusammenarbeitete, begann sich zu vergrößern. In diesen Jahren begannen W . J . K B Y L O W , I . P . WOBOKZOWA,

W . A . BOBOWIKOW,

W . I . BRYSGALOW,

1 . 1 . PJATEZKI-SCHAPIBO,

W . I . K R I N S K I , W . A. PONOMARJOW und etwas später W . L . STEFAÜTJUK, A. W . B U T R I MENKO, S . L . GINSBUBG, M. W . M E L E S C H I N A und A. M. GERSCHT sich mit Automaten-

modellen zu beschäftigen. Von Beginn an zeigten für dieses Gebiet I. M. G E L F A N D , L . I . ROSONOER, M. M. B O N G A R D und E . M. B R A W E R M A N reges Interesse. Im Januar 1963 wurde in Komorowo bei Leningrad das erste erweiterte Seminar der Kybernetikgruppe des Rechenzentrums der Leningrader Abteilung des mathematischen Instituts der AdW der UdSSR 4 ) durchgeführt, an dem alle Personen teilnahmen, die gemeinsam mit M. L. Z E T L I N über Aütomatenmodellen des Verhaltens arbeiteten. Das gesamte schöpferische Leben M. L. Z E T L I N S war mit der Biologie verknüpft, und die Arbeit über Verhaltensmodelle wurde in vielem durch seine biologischen Interessen stimuliert, obwohl schon auf dem ersten Seminar mögliche technische, ökonomische und soziologische Analogien und Modelle beraten wurden. Die Thematik des Seminars *) Beispiele dafür, daß eine solche Problemstellung im Rahmen der zu untersuchenden Thematik von Interesse ist, sind in Kapitel 5 angeführt. 2 ) Der Richtigkeit halber muß man erwähnen, daß man einen Menschen nicht durch das Labyrinth kriechen oder laufen ließ. Für ihn wurde das Labyrinth durch eine Menge von Knöpfen ersetzt. Der Autor muß eingestehen, daß ihn im Jahre 1961 M. L. ZETLIN im Laboratorium M. A . A L E K S E J E W S im Institut für höhere Nerventätigkeit der AdW der UdSSR durch ein Labyrinth „gejagt" hat. Zu Resultaten ähnlicher Experimente und deren Zusammenhang mit Automatenmodellen siehe M. A . A L E X E J E W , M. S . SALKIND, W. M. KUSCHSTAEEW „Lösung der Auswahlaufgabe durch den Menschen bei zufälliger Unterstützung der Bewegungsreaktionen" im Sammelband „Biologische Aspekte der Kybernetik" (AdW der UdSSR, Moskau 1962 (russ.)). 3 ) Es ist erstaunlich, daß die als Hilfsmittel dienende Aufgabe über das Verhalten eines Automaten im stationären zufälligen Medium auch bis zum heutigen Tag bedeutende Anstrengungen auf sich lenkt. I m Verlaufe der letzten 10 Jahre erschienen in der UdSSR und besonders im Ausland immer wieder Arbeiten, in denen die Konstruktion von Automaten mit zweckmäßigem oder asymptotisch optimalem Verhalten verändert, modifiziert und ergänzt wurden. Dabei wurde von den Modellen des eigentlichen kollektiven Verhaltens nur drei bekannte Konstruktionen verwandt — der Automat M. L. Z E T L I N S (Automat mit linearer Taktik), der Automat W. I. KRTNSKIS (der „gutgläubige" Automat) und der Automat von R O B B I N S . 4 ) Seit 1965 Laboratorium für Kybernetik an der Leningrader Abteilung des Zentralen ökonomisch-mathematischen Instituts der AdW der UdSSR.

XVI

Einleitung

ging über die Grenzen von reinen Automatenmodellen des Verhaltens hinaus u n d schloß die Beratung eines breiten Kreises von Fragen ein, die mit der Organisation des komplizierten Verhaltens verknüpft waren, wie Zeichenerkennung, kontinuierliche Medien, physiologische Modelle usw. Durch die Teilnahme von Physiologen gelang es dem Seminar bei der Behandlung von biologischen Modellen, die häufig in ähnlichen Diskussionen auftretende Vulgarisierung der physiologischen D a t e n zu vermeiden. Bis zum J a n u a r 1963 wurde ein großer Schritt in der Entwicklung der Thematik gemacht, u n d zwar waren die grundlegenden Sätze über Automatenbeispiele formuliert und die einfachsten spieltheoretischen Modelle untersucht worden. Letzteres gestattete es, schon auf dem Seminar über Modelle des gemeinsamen Verhaltens von Automaten zu sprechen und die Hauptarbeitsrichtungen abzustecken. Zur gleichen Zeit schlug W . S. G U R F I N K E L ein Spiel vor, das später als Grundlage f ü r das Modell des Cr-Spiels diente. Selbiges hat in der Entwicklung von analytischen Methoden zur Untersuchung von Spielen eine wesentliche Rolle gespielt. Von J a n u a r 1963 an wird dieses erweiterte Seminar jährlich durchgeführt. Es f ü h r t Personen zusammen, die sich mit Problemen des kollektiven Verhaltens von Automaten befassen und formiert ein unsichtbares Kollektiv, das durch die Gemeinsamkeit der S t a n d p u n k t e und der Methodologie verbunden ist und das von J a h r zu J a h r größer wird. Im Sommer 1966 h a t t e sich die Untersuchung des kollektiven Verhaltens von Automaten zu einer selbständigen wissenschaftlichen Richtung herausgebildet, deren unumstrittener Führer u n d Inspirator M . L . ZETLIN war, der das mit ihm arbeitende Kollektiv mit Problemstellungen konfrontierte und die erhaltenen Ergebnisse einer kompromißlosen Kritik unterzog. Eine wesentliche E t a p p e in der Entwicklung der Thematik stellte die Verteidigung der Habilitationsschrift von M. L . ZETLIK „Endliche Automaten u n d Modellierung einfachster Verhaltensformen" im J a h r e 1964 dar. 1 ) I n dieser Arbeit wurde ein Schlußstrich unter die Arbeiten über die Konstruktion von Automaten, über Matrixspiele u n d homogene Spiele gezogen. Die weitere Entwicklung war erstens auf das Studium von Modellen gerichtet, die eine inhaltsreiche praktische Deutung erlaubten, wie Modelle zur Steuerung von N a c h r i c h t e n n e t z e n ( A . W . BUTRIMENKO, W . G . L A S A R E W ) , z u r S t e u e r u n g v o n

Kommu-

tationsvorrichtungen (W. M. TSCHENZOW), zur Steuerung eines Systems gemeinsam arbeitender Funkstationen (W. L. STEFANJUK) u . a . , u n d zweitens auf die Entwicklung eines mathematischen Apparates, der es erlaubt, analytische Abschätzungen des Verhaltens anzugeben ( W . A. WOLKONSKI, A. A. MILJUTIN, B . G. PITTEL, W . I . K R I N S K I , W. A. PONOMARJOW, W. A. BOROWIKOW U. a.). I m Ergebnis der durchgeführten Arbeiten wurde nicht n u r die Möglichkeit offensichtlich, das Verhalten von komplizierten Systemen in der Sprache des kollektiven Verhaltens zu beschreiben, sondern auch die Möglichkeit, die Ideen u n d Methoden des kollektiven Verhaltens f ü r die Organisation der Steuerung in realen Systemen zu verwenden. Die auf Grund des plötzlichen Todes von M. L . ZETLIN im Mai 1 9 6 6 entstandene Krise wurde auf dem f ü n f t e n alljährlichen Seminar 1967 überwunden. Auf dem sechsten Seminar wurden erstmals ökonomische Modelle und Fragen der Organisation des kollektiven Verhaltens in ökonomischen Systemen breit erörtert. V e r ö f f e n t l i c h t in „Erfolge der m a t h e m a t i s c h e n W i s s e n s c h a f t e n " B d . 18, Nr. 4 (112), 1963 (russ.).

Einleitung

XVII

In diesen Jahren wurde der Kreis der Personen, die sich mit Fragen des kollektiven Verhaltens beschäftigen, wesentlich größer, und es bildete sich eine Reihe von Gruppen heraus, wie zum Beispiel die Gruppen von L . I. ROSONOER (IPU), S. W . FOMIN und W . G . LASEREW ( I n s t i t u t f ü r P r o b l e m e d e r I n f o r m a t i o n s ü b e r t r a g u n g ) , W . G . SARGO-

WITSCH (Rechenzentrum der A d W der UdSSR), D. A. POSPELOW (Moskauer ökonomisches Institut, danach Rechenzentrum der A d W der UdSSR), G. N. ZERZWADSE (Staatliche Universität Tbilissi) und eine Reihe anderer. Zur selben Zeit begann man auch im Ausland, speziell in den USA, sich mit Modellen des Verhaltens von Automaten zu beschäftigen, jedoch gingen diese Arbeiten bis jetzt noch nicht über die einfachsten Verhaltensmodelle — Modelle des Verhaltens eines Automaten im zufälligen M e d i u m — hinaus (CHANDRASEKHAB, F U , SHEN u. a . ) .

Die Untersuchung von Modellen des kollektiven Verhaltens von Automaten hat sich gegenwärtig zu einer selbständigen wissenschaftlichen Richtung herausgebildet. Es werden regelmäßig Symposien und Schulen über diese Thematik durchgeführt, auf Allunionskonferenzen arbeiten Sektionen zu Fragen des kollektiven Verhaltens von Automaten. An der Sektion für technische Kybernetik des Wissenschaftlichen Rates zum Problem „Kybernetik" beim Präsidium der A d W der UdSSR wurde eine Unterkommission für die Theorie des kollektiven Verhaltens von Automaten und für spieltheoretische Methoden der Steuerung gebildet. Die betrachtete Richtung hat sich in der UdSSR herausgebildet und wurde von sojwetischen Gelehrten entwickelt. Erst in den letzten Jahren begannen Arbeiten über diese Thematik im Ausland zu erscheinen. Man muß erwähnen, daß es auch andere Richtungen gibt, die sich in diesem oder jenem Maße mit Fragen der Untersuchung von Modellen des kollektiven Verhaltens in komplizierten Systemen beschäftigen. Beispielsweise sind das vielfältige Modelle des Warenaustausches, Modelle der Gruppenauswahl usw. Allem Anschein nach ist eine Annäherung aller dieser Zugänge zu beobachten. Es kann sein, daß diese auf der Basis der existierenden Tendenz zur Schaffung „quasithermodynamischer" Modelle komplizierter Systeme beruht. Andererseits haben die Modelle des kollektiven Verhaltens von Automaten ihre eigene Spezifik, und gerade die Tendenz zur Annäherung der verschiedenen Zugänge bei der Untersuchung von Modellen des kollektiven Verhaltens macht es erforderlich, eine gewisse Bilanz in der Entwicklung von Modellen des kollektiven Verhaltens von Automaten zu ziehen.

2 Warschawski

KAPITEL I Verhalten von Automaten in zufälligen Medien § 1.1. Problemstellung Objekte unserer Untersuchung sind endliche Automaten, d. h. Objekte mit einer endlichen Anzahl von inneren Zuständen 0, f(t) =(= /(0)} — Zeitpunkt des ersten Aktionswechsels des Automaten; P co gegen Null konvergiert. Offenbar gilt Qn - » 0 (n oo). S a t z 1. Gehören die Automaten An im stationären Medium C zur Klasse K2(C) und ist xn ^ g B 1 _ s für ein gewisses 0, so gilt Pf{r > xnmf} ^ exp {-xn(l

+ «„)}.

(1.2.29)

Ist außerdem

xnm}} = exp {-xn(i l 0, so ist1)

P9{r < xnm}) ~xn

(n^

oo).

(1.2.31)

Der Grundgedanke des Beweises von Satz 1 besteht in Folgendem. Die Strecke [0, tn] wird in Ln gleiche Paare von Strecken zerlegt. Die erste Strecke des i-ten Paares (wir bezeichnen sie mit l

,

1 = 0,1,2,...

e

J

Wenn wir die Beziehung f . = Pf

l

=S *f ^n

2a„l = Z Pj(w)Pv ) VtEf

¡TS L

n

- 2a„\ )

einführen, dann erhalten wir zunächst V,

2J 3e„ F;-! + (1 -

v

n

)

F,_!

=

( l - v „

+

3e„)

F ; _,

und da V0 = 1 ist schließlich V, ^ (1 - vn + 3£„)',

I = 0,1, 2 , . . .

(1.2.32)

Analog kann man zeigen, daß für rp (.Ef

P"

{T >

1 1 } > (1

~

Vn)'

(1-2-33)

~

Unter Verwendung der Gleichheit M

v

( r )

=

E P

v

[ r > t \

1= 0

und der Monotonie von Pv{z > i} als Funktion von t erhalten wir M^r) S ^

Mr(r)

l i j U l M ,

Ln

1= 0

^n

1=1

^

[

£ P Ar

> /M (

(1.2.34)

L n \

^»J

.

(1.2.35)

1.2. Asymptotisch-optimale Folgen

17

Benutzen wir (1.2.33), so finden wir für z = 1, 2 , . . . m, ¿ min M,(r) ^ ¿ [(1 - v j ipíE, ÍJn j=l

3jej =

j i í - H - ^ [1 _ (1 l %

vn)*] -

¿

z(z + 1) e„\, )

oder x„

v„ S? (1 - VN) [1 - (1 - «,)«] -

2

z(z + 1) B„v„.

(1.2.36)

Im weiteren bezeichnen wir mit 6% beliebig klein gewählte positive Zahlen. Wir setzen max (Ve„, = p„ und betrachten zunächst den Fall n

x

6nlS-

=

Sei ) Ln = [(In e „) ] und z = [ ( - I n e»)K]- Aus (1.2.36) folgt dann 1

2

f2" (1 - ßn) n

wobei

ßn =

0(Qn^)

ist. Setzt man in (1.2.32) l = Ln, dann ist ln VZn 'S Ln ln (1 - vn + 3e„)

mit

L„(-vn

+ 3en) < - z „ ( l + £ + it} Sj max P9[z > t} max P9{r > u) xnmf} + 3L n e n ] ^ Ln ln ( l ä -

Setzt man L„ =

1

(*»„+3e„L„)

+

., so ist P9{ r > xnmj} ^ exp {-xn(l

woraus die Relation (1.2.30) folgt. *) Mit [ic] wird der ganze Teil der Zahl x bezeichnet.

3*

- 3e„ j

+ t,} [P^t > r,}]^ g Pv{r > tn],

P9{tl < *n > n) C1 - P9{* > *i>] Pv{r > T^i"1

>

^ 1 - P,{r > tn\

+ P9{rL > tn | r > rL),

1

P9{r > tn} ^ [P^r > t,}]*- - P„{r < r,} - P9{rk < tn|t > rk}

(1.2.39) (1.2.40)

angegeben werden. Wir betrachten zunächst Automaten mit linearer Taktik. Die Größe P 2 {t > Tj} kann mit Hilfe bekannter Formeln gefunden werden, die die Aufgabe, einen Spieler zu ruinieren, beschreiben (siehe [146], Kap. XIV, § 2, S. 289): Pl[r

rk} kann man als Komposition von k bedingten Verteilungen der Art P ^ T j < x \ t > r x } betrachten. Man prüft leicht nach, daß C„ = M1[t1 t > r3} [?/(? — p)] (n -> oo) ist. Wählt man deshalb k = k„ und L = Ln in der Form ( t J C n ) + (tJCn)", wobei 1/2 ist, und benutzt die Grenzwertsätze über große Abweichungen (siehe z. B. [147]), so kann man leicht verifizieren, daß die Ordnung der Wahrscheinlichkeiten P1{rk < tn | r > Tk] und !) Der Einfachheit halber betrachten wir den Fall k — 2.

19

1.2. Asymptotisch-optimale Folgen

PiirL > tn\~c > h) bei einem gewissen ß > 0 exp { — t j ) nicht übersteigt. Die Voraussetzungen der Grenzwertsätze sind leicht zu überprüfen, wenn m a n den exponentialen Verteilungscharakter der Größe rx (siehe [146], S. 299) verwendet. T ü r E — EX u E2 , Ex = {ip:q)> zn, f = f j ) , E2 = { € Ex PJr


rk} u n d Pr{Tl > tn | T > rL] f ü r alle Y> € Ex gültig. Die Ungleichungen (1.2.39) u n d (1.2.40) k a n n m a n also in der Form P9{r >

l

«»} = '

umschreiben. I s t

-

nTl < t.

"

-

(

Í

)

\J)

+ e"

+

]

/ q \r,n

N
ÍB} = exp | - í „

2 > m a x

1

1 \

( r ^ ' T ) '

( y ) " (1 + 0(1))} .

gleichmäßig bezüglich

tn}

exp J - i B y

KRINSKI

erhalten u n d

(1 + 0(1))}.

Ist außerdem tn < p™, wobei {r > m a x (1/(1 — ß), 1/z)) ist, d a n n gilt P„{r > tn] g exp | - t , j ( i + 0(1))} und M¿t)

~ -2-

(1.2.42)

(» -> co)

gleichmäßig bezüglich q>

CO,

l

£„ = 0

[

ere = Ofp« 1 - 2 »"]

(

f

p

(0 < z < 1)

f ü r A u t o m a t e n von K R I N S K I richtig ist. Wir betrachten einen Wahrscheinlichkeitsautomaten A , dessen Aktionen u n d Zustände Aktionen des A u t o m a t e n A sind, mit den Übergangswahrscheinlichkeiten p¡.^ (pj g ist die Wahrscheinlichkeit dafür, daß der A u t o m a t A aus den P u n k t e n des Wechsels der Aktion y>f in die tiefen Zustände der

20

I . Verhalten von A u t o m a t e n in zufälligen Medien

Aktion g übergeht) und ein stationäres Medium C mit der Verlustwahrscheinlichkeit 1 ¡mf für die Aktion /. Der Prozeß q>(t) der Zustandsänderung des Automaten A im Medium C ist eine MAEKOWsche Kette. Wir wollen sie als ergodisch voraussetzen. Dann kann man über Finalwahrscheinlichkeiten (stationäre Wahrscheinlichkeiten) von Zuständen sprechen. Wir bezeichnen mit a{f) die Summe der Finalwahrscheinlichkeiten der der Aktion / entsprechenden Zustände und mit 5(f) die Finalwahrscheinlichkeit der Aktion / für den Automaten A im Medium C. S a t z 2. Gehört der Automat im Medium C zur Klasse Ka(C) und ist f ü r alle / und g bei einem gewissen ö > 0

so gilt f ü r alle / o(j)~5(})

(n^co).

Man p r ü f t leicht nach, daß der Prozeß f (t) der Aktionsveränderung des Automaten A im Medium C eine MABKOWsche K e t t e mit den Übergangswahrscheinlichkeiten Pf g =

f + 9,

m

f

P„=

darstellt. Die Übergangswahrscheinlichkeiten Pjg f ü r die MABKOWsche K e t t e hängen sowohl von den Wahrscheinlichkeiten (P/g) des Übergangs des Automaten A zu einer anderen Aktion als auch von den Verlustwahrscheinlichkeiten 1\m,f im Medium Ö ab. Hieraus folgt, daß die Größen Xf = 5(f)/mf dem Gleichungssystem £ x f p / g = xg (1.2.43) / genügen. F ü r Automaten mit linearer Taktik und Automaten von K R I N S K I überprüft man leicht, daß f ü r n -> oo die Größen Pfg gegen gewisse von Null und Eins verschiedene Konstanten konvergieren (wenn die Verlustwahrscheinlichkeiten im Medium C von Null und Eins verschieden sind). Hieraus folgt, daß eine Lösung des Systems (1.2.43) existiert, die den Relationen Xf0

Xf

(n

oo)

0

genügt. Xf bedeuten dabei positive Konstanten. Deshalb gilt 5(f) TTr a(g)

xfm, hr^ xg"mg

und

o(f) ~ xf

£ 9

m, '

(n -> oo),

d. h., das Verhältnis der Finalwahrscheinlichkeiten ist dem Verhältnis der mittleren Zeiten bis zum Aktionswechsel proportional. Der Satz 2 f ü h r t die Analyse der Zweckmäßigkeit des Verhaltens des Automaten auf die relativ einfache Aufgabe der Berechnung der Größen mf zurück. Wir deuten den Beweisweg von Satz 2 an. Wir wählen eine Folge {tn}, die den Bedingungen tn > ™/en~l>

t„ = 0(mf)

(n -> oo)

f ü r alle / bei einem gewissen S > 0 genügt. Wir bezeichnen mit r 1 den ersten Zeitpunkt des Erreichens der Menge E nach t„, m i t r 2 den ersten Zeitpunkt des Erreichens der Menge E nach r1 + t„ usw.; r n ist der Zeitpunkt des erstmaligen Erreichens von E nach xn-1 + tn. Pi) gleichung \f(z)\ > \g(z)\. Nach dem Satz von R O U C H E haben die Funktionen f(z) und F(z) = f(z) + g(z) innerhalb des Kreises \z\ = 1 + y die gleiche Anzahl von Nullstellen. Die Anzahl der Nullstellen von f(z) innerhalb des Kreises \z\ = 1 + ö ist n + 1 (die (n — l)-fache Nullstelle Null und die Nullstellen z = i y 1 / 2 ) . Die Gleichung (1.2.61) hat also innerhalb des Kreises \z\ = 1 + X2 > 1, so konvergiert a2¡al schnell gegen Null, und zwar ungefähr wie l/A^. 6. «-Automaten. Die äußeren Medien, in denen ein e-Automat funktioniert, unterscheiden sich von den in § 1.1 definierten stationären zufälligen Medien C(alt a2, ..., ak). «-Automaten können als Eingabesignal eine beliebige Zahl am annehmen. Wir sagen, daß ein e-Automat in einem determinierten stationären Medium D(a¡, a2, ..., ak) funktioniert, wenn die vom Automaten zum Zeitpunkt t ausgeführte Aktion fm zum Zeitpunkt t + 1 einen Gewinn der Größe am nach sich zieht. 1 ) Ein e-Automat kann k Aktionen f1, f2, ..., fk ausführen und sich in zwei aufeinanderfolgenden Zeitpunkten die Aktionen f(t — 1) und /( a2 > ••• > ak voraus. Mit am bezeichnen wir die Finalwahrscheinlichkeit für die Wahl der m-ten Aktion (m = 1, 2, . . . , k) durch den Automaten im Medium D und mit

••• > ak 1-

k s-

1

0, q > 0 und — + — = 1 ist.

V

1

Wenn wir «j = 7ih ßi = 1, p = 1 + ß setzen, erhalten wir die Ungleichung /

= q'1^,

1 +

p =

(1.4.25)

V

i= 1 u n d f ü r » j = Q^n^-ßi

\i+i

i

ß ist

U-)

27 ;=i

¡=i

(1.4.26)

W

Mit Hilfe der Ungleichungen (1.4.25) und (1.4.26) schätzen wir den Ausdruck für Wj(ji) nach unten ab: /

i

\i+ß

l

k

\l+ß

U.j

{£">)

« ( J i t " ) ^ (1 -

¿ f \®i—— a)\] 1=1+1

=¡+1 \a« — «i/ m

1 m

JI«) 2>i + ¿>«) " i>)1+2'3 (7I(") \i=i+l / 2+2V=1 = ^ [ ( j i«C=) 1) ^ / (1 - \»=i+l / + (1 - 7t( ^]

/

= ^ ( j t O p 2 " (1 -

/ t

JI«")^.

Die erhaltenen Abschätzungen erlauben es uns, die Untersuchung des Prozesses 7iil}(t) durch die Untersuchung des Prozesses f(i) zu ersetzen, bei dem der Erwartungswert des Zuwachses zu einem beliebigen Zeitpunkt t nicht größer und der Erwartungswert des Quadrates des Zuwachses nicht kleiner als beim Prozeß n(,)(£) ist. Diese Erwartungswerte sind gleich m(£)

af^l -

k)1+ß

=

V

UP i=k+1



«h /

(1.4.27)

1.5. Automaten in umschaltbaren zufälligen Medien

45

Es ist klar, daß die Wahrscheinlichkeit der Absorption des Prozesses £(t) am Rand 1 = 1 nicht größer ist als die Wahrscheinlichkeit der Absorption des Prozesses n { l ) (t) am Rand n = 1, da diese Wahrscheinlichkeit [siehe (1.4.18)] sich mit der Vergrößerung von m ( f ) und der Verkleinerung von vergrößert. Analog dem Fall k = 2 kann man Bedingungen finden, bei denen die Wahrscheinlichkeit 01 (x) der Absorption des Prozesses £(t) am Rand $ = 1 unter der Bedingung £(0) = x gleich Eins ist. Unter Berücksichtigung von (1.4.27) erhalten wir 1) entweder ß > 1, 2) oder ß = 1 und «

^

(1.4.28)

1 iE ¡=¿+1 « i — « i

Da der Prozeß jr('>(i) am Rand JI{1) = 1 mit einer Wahrscheinlichkeit absorbiert wird, die nicht kleiner ist als die Wahrscheinlichkeit der Adsorption des Prozesses f ( i ) am Rand f = 1, so ist in dem Falle, daß die Parameter » und ß in (1.4.24) den Bedingungen (1.4.28) genügen, die Wahrscheinlichkeit der Absorption des Prozesses n{,](t) am Rand _-j(i) = i gleich Eins, d. h., die Gesamtwahrscheinlichkeit der Aktionen des Automaten, die dem maximalen Erwartungswert des Gewinns entsprechen, ist gleich Eins. Wenn also die Parameter » und ß den Forderungen (1.4.28) genügen, so ist der Erwartungswert des Gewinns für den Automaten Qk gleich dem maximal möglichen für das gegebene Medium. Man überprüft leicht, daß die Berücksichtigung der Bedingung (1.4.10) auf folgende Optimalitätsbedingungen des Automaten Qk im stationären zufälligen Medium G führen: 1) entweder ß > 1, oc i j

(2ß)2P (ß + i)i+l

(ß -

i y-1 (1.4.29)

2) oder ß = 1, « 5S min

l;

k

— «i

ii; ¿=¡+1

§ 1.5. Verhalten von Automaten in umschaltbaren zufälligen Medien In den oben betrachteten Beispielen des Verhaltens von Automaten blieben die Parameter a m im Verlauf beliebig langer Zeitintervalle unverändert. In diesem Sinne ist die Aufgabe über das Verhalten im stationären zufälligen Medium elementar. Von größerem Interesse ist der Fall, daß sich die Parameter des zufälligen Mediums zeitlich verändern, beispielsweise mit Hilfe eines Zufallsmechanismus. I m stationären zufälligen Medium hatte die Zeit des Übergangs in den stationären Zustand keine große Bedeutung. In dem Falle aber, daß sich die Parameter des Mediums zeitlich verändern, beginnt die „Anpassungsfähigkeit" des Automaten, seine Fähigkeit, schnell auf Veränderungen des äußeren Mediums zu reagieren, eine wesentliche Rolle zu spielen. In stationären zufälligen Medien führte eine Vergrößerung der Speicherkapazität zu einer Vergrößerung der Trägheit des Automaten — einer Verkleinerung der Wahrscheinlichkeit des Aktionswechsels — und der Erwartungswert des Gewinns des Automaten wuchs monoton mit dem Wachsen der Speicherkapazität. Es ist offensichtlich, daß im Falle nichtstationärer

46

I. Verhalten von Automaten in zufälligen Medien

zufälliger Medien die Abhängigkeit des Erwartungswertes des Gewinns von der Speicherkapazität ihren monotonen Charakter verlieren muß. In diesem Paragraphen werden wir zufällige Medien betrachten, deren Charakteristika zufällig von der Zeit abhängen. Wir setzen das Medium aus stationären zufälligen Medien bestehend voraus, deren Umschaltung durch eine MARKOWsche Kette verwirklicht wird. Wir betrachten eine MARKOWsche Kette K(Cl,Ci,...,Cr,A) mit r Zuständen Cu C2, ..., Cr und der Matrix der Übergangswahrscheinlichkeiten A = Jd^H, tx, ß = 1, 2 , . . . , r. Der Zustand Ca entspricht dem stationären zufälligen Medium Ca = C(a1", a2', ...,ak"). Wir sagen, daß sich der Automat im umschaltbaren zufälligen Medium K befindet, wenn er zu jedem Zeitpunkt in einem der stationären zufälligen Medien Ca, tx = 1 , 2 ,...,r arbeitet, d. h., wenn die zum Zeitpunkt t vom Automaten ausgeführte Aktion fm mit 1—a * der Wahrscheinlichkeit pma = — zum Zeitpunkt t + 1 das Eingabesignal 2 S(t + 1) = — 1 (Verlust) und mit der Wahrscheinlichkeit qm" = 1 — pm* das Eingabesignal / S ( f + 1 ) = + 1 (Belohnung) nach sich zieht; wenn sich dabei der Automat zum Zeitpunkt t im stationären zufälligen Medium Ca befand, so wird er sich zum Zeitpunkt t + 1 mit der Wahrscheinlichkeit daß im stationären zufälligen Medium Cß befinden. Wir bezeichnen mit xpf, tx = 1, 2 , . . . , r, i = 1, 2 , . . . , einen solchen Zustand des Systems „Automat — umschaltbares zufälliges Medium'", bei dem sich der Automat im Zustand q>{ und das umschaltbare Medium im Zustand C befindet1). Dann ist die Wahrscheinlichkeit des Übergangs des Systems vom Zustand tpf in den Zustand ipf gleich < = I » . ; (-1) + (+1)] (1.5.1) wobei || max (a, —a). Bei einer Vergrößerung von d tritt der umgekehrte Prozeß ein. So wird für — — < — das Maxio(l — ö) 1 — a2 ranm des Gewinnerwartungswertes bei n0 — 1 erreicht. Die Formel (1.5.13) gestattet es, die Werte n für einen in einem umschaltbaren Medium funktionierenden Automaten auszuwählen. Tabelle 1.5.1

a i 0,8 0,6 0,5 0,33 0,2 0,1

ó ->

0,010

0,001 3 5 6 8 11 15

0,792 0,588 0,488 0,306 0,178 0,072

2 3 4 5 6 7

0,744 0,532 0,424 0,250 0,112 0,034

0,032 2 2 3 3 4 4

0,672 0,466 0,344 0,182 0,074 0,020

0,100 1 2 2 2 2 2

0,512 0,314 0,232 0,110 0,040 0,010

0,320 1; 1; 1; 1; 1; 1;

0,230 0,130 0,090 0,040 0,014 0,004

0,450 1 1 1 1 1 1

0,064 0,036 0,024 0,012 0,004 0,002

Zur Auswahl der optimalen Speicherkapazität des Automaten LN 2 kann man Tabelle 1.5.1 benutzen. In ihr sind die Werte n0 und m für verschiedene Werte von a und d angegeben. In jedem Kästchen bedeutet die erste Zahl n0 und die zweite Zahl m.

1.5. Automaten in umschaltbaren zufälligen Medien

51

Wir betrachten nun das Verhalten eines e-Automaten in umschaltbaren Medien und zeigen, daß ein solches e0 existiert, bei dem die Finalwahrscheinlichkeiten der Zustände, in denen optimale Aktionen ausgewählt werden, maximal sind. Wir setzen voraus, daß das Medium K = K(Clt C 2 , A) aus den beiden stationären Medien C1 = C\(alt a2), C 2 = C2(a2, zusammengesetzt ist, deren Umschaltung durch eine MABKOWsche K e t t e mit den beiden Zuständen C\ und C2 und der Matrix der Übergangswahrscheinlichkeiten (1.5.3) realisiert wird. Sei at > a2 («i und a2 können beliebige positive oder negative Zahlen sein). Das System S (Automat — zusammengesetztes Medium) wird durch die Zustände Ef? ( (1 -

Mi)

(1 — Mi)

1.5. Automaten in umschaltbaren zufälligen Medien

(T i; =

«5(1 -

2] +

(1 -

= — 9?21 8 * )

r: = z p ( * , s ) 2 : < s }

t l

m

^

j = l \ f,

^

x «;. { i (s«) x ••• x