198 7 89MB
German Pages 372 [414] Year 1969
OSKAR LANGE Optimale Entscheidungen
OSKAR
LANGE
Optimale Entscheidungen Grundriß der Optimierungsrechnung
Vorbereitet auf der Grundlage von Vorlesungen an der Warschauer Universität unter der Mitarbeit von
ANTONI
BANASINSKI
In deutscher Sprache herausgegeben von
KLAUS
ZEITZ
AKADEMIE-VERLAG • BERLIN &
PWN — POLNISCHER VERLAG DER WISSENSCHAFTEN WARSZAWA 1968
Polnischer
Originaltitel'.
OPTYMALNE ZASADY
DECYZJE
PROGRAMOWANIA
Copyright by Panstwowe Wydawnictwo Naukowe Warszawa 1964
Ins Deutsche übersetzt von Martin Müller und wissenschaftlich bearbeitet von Klaus Zeitz unter Mitarbeit von Johannes Behr
Erschienen im Panstwowe Wydawnictwo Naukowe, Warszawa, Miodowa 10 und im Akademie-Verlag GmbH, 108 Berlin, Leipziger Straße 3-4 Alle Rechte für die deutsche Ausgabe vorbehalten Lizenznummer: 202-100/1/68 Gesamtherstellung: D R P — Drukarnia im. Rewolucji Pazdziernikowej Bestellnummer: 5589 ES 5 B 3/20 K3
Inhalt
Vorwort Einfuhrung - Praxeologie und Theorie der Optimierungsrechnung
IX 1
Kapitel I. Typische Modelle der Optimierungsrechnung § 1. Das Rundreiseproblem § 2. Das Transportproblem § 3. Koopmans' Transportproblem § 4. Zuteilungsprobleme § 5. Mischungsprobleme § 6. Das dynamische Problem — Produktionsablauf und Vorräte § 7. Ein anderes dynamisches Problem — Lagerung von Waren § 8. Optimierung der Investitionen — Investitionsvarianten § 9. Optimierung der Investitionen — Investitionsrichtungen § 10. Optimierung der Investitionen— Verteilung der Investitionen in der Zeit § 11. Klassifizierung der Modelle der Optimierungsrechnung
10 10 14 19 22 28 30 35 37 40
Kapitel II. Allgemeine Prinzipien der Theorie der Optimierungsrechnung § 1. Mathematische Formulierung des allgemeinen Problems der Optimierungsrechnung § 2. Geometrische Interpretation des Problems der Optimierungsrechnung § 3. Methode der unbestimmten Lagrangeschen Multiplikatoren § 4. Die Bilanzbedingungen sind Ungleichungen — Eine Verallgemeinerung
52
Kapitel III. Marginaloptimierung § 1. Methode und geometrische Interpretation der Lösung von Aufgaben der Marginaloptimierung § 2. Existenzbedingungen für die Lösung von Aufgaben der Marginaloptimierung § 3. Beispiele der Marginaloptimierung § 4. Optimierung der Produktion bei n Produktionsfaktoren
72
47 50
52 57 59 66
72 76 77 94
Inhalt Kapitel IV. Lineare Optimierung § 1. Mathematische Formulierung des Problems der linearen Optimierung § 2. Die geometrische Interpretation der linearen Optimierung — Der Begriff des Simplexes § 3. Grundlegende Sätze der Theorie der linearen Optimierung — Das Dualitätsprinzip der linearen Optimierung § 4. Die Simplex-Methode § 5. Anwendungsbeispiele für die Simplex-Methode § 6. Die Lösung der Dualaufgabe § 7. Das Optimalitätskriterium der Lösung
102 102 104 114 127 136 147 154
Kapitel V. Die Prozeßanalyse § 1. Das Wesen der Prozeßanalyse § 2. Produktionsmaximierung und Kostenminimierung § 3. Das Problem der Verbundproduktion § 4. Das verallgemeinerte Problem der Produktionsoptimierung § 5. Anwendungsbeispiele für die Prozeßanalyse
160 160 168 176 179 183
Kapitel VI. Optimierung bei einer Vielfalt von Zielen § 1. Wirksame Programme § 2. Lösung des Problems mit Hilfe der Margmalrechnung § 3. Vielfalt der Ziele und lineare Optimierung
188 188 190 199
Kapitel VII. Optimierung unter Ungewißheit § 1. Optimale Verteilung des Produktionsplanes auf einzelne Betriebe § 2. Der Fall einer beschränkten Kapazität der Produktionsbetriebe § 3. Die Bestimmung der optimalen Produktionskapazität in neu errichteten Betrieben § 4. Das Problem der Produktionsplanung unter Ungewißheit § 5. Produktionsplanung bei beschränkter Größe des zulässigen Risikos § 6. Die neoklassische Theorie des Risikos § 7. Produktionsplanung nach der neoklassischen Theorie des Risikos — Präferenzfunktion der Auswahl § 8. Kritik der neoklassischen Theorie — Die Methode der Grenzwahrscheinlichkeiten
203 203 206
Kapitel VIII. Dynamische Optimierung der Beschaffung und Bestände unter Gewißheit § 1. Die optimale Losgröße des Rohstoff bezugs § 2. Die erste verallgemeinerte Variante des Problems der Beschaffung und Bestände
208 213 221 225 232 237
244 244 251
Inhalt § 3. Die bezogenen Lose sind nicht unbedingt gleich groß § 4. Die Lagerkapazität ist begrenzt § 5. Der Verbrauch des Bestandes erfolgt nicht gleichmäßig in der Zeit Kapitel IX. Dynamische Optimierung der Beschaffung und Bestände unter Ungewißheit § l . D i e Wahrscheinlichkeit, daß die Bestandsreserve nicht ausreicht, ist eine vorgegebene Größe — Normalverteilung der Wahrscheinlichkeit des Bedarfs § 2. Die Wahrscheinlichkeitsverteilung des Bedarfs ist eine PoissonVerteilung § 3. Die Wahrscheinlichkeitsverteilung des Bedarfs ist „rechteckig" (gleichmäßig) § 4. Bestimmung der optimalen Größe des Risikokoeffizienten und der Rohstoffreserve in Abhängigkeit von den Kosten des Defizits und der Bestandshaltung
253 255 257 266
266 273 274
278
Kapitel X. Dynamische Optimierung der Produktion unter Gewißheit § 1. Bestimmung des optimalen Produktionsablaufs in der Zeit mit Hilfe der Variationsrechnung § 2. Beispiel der dynamischen Produktionsoptimierung
288
Kapitel XI. Dynamische Optimierung der Produktion unter Ungewißheit § 1. Der Gesamtbedarf ist eine Zufallsgröße mit bekannter Wahrscheinlichkeitsverteilung § 2. Die Bestimmung der Wahrscheinlichkeitsverteilung des Gesamtbedarfs § 3. Die Lösung des Problems der optimalen Ausnutzung von Elektroenergiequellen
304
288 299
304 308 311
Kapitel XII. Optimierung unter völliger Ungewißheit § 1. Allgemeine Bemerkungen zur Theorie der strategischen Spiele § 2. Optimierung unter Ungewißheit als Spiel des Menschen gegen die Natur § 3. Das Hurwicz-Prinzip und das Bayes-Laplacesche Prinzip § 4. Das Savage-Minimax-Prinzip der Folgen falscher Entscheidungen § 5. Die Bestimmung des optimalen Rohstoff bestandes nach der Theorie der strategischen Spiele § 6. Die Äquivalenz der linearen Optimierung mit einem ZweipersonenNullsummenspiel § 7. Das Minimax-Prinzip bei Kollektiventscheidungen
321 321
341 344
Literaturverzeichnis Namensverzeichnis Sachwortverzeichnis
347 353 355
329 331 335 339
Vorwort
In den Jahren 1960/61 und 1961/62 veranstaltete ich an der Fakultät für politische Ökonomie der Warschauer Universität einen zweijährigen Kursus über die Theorie der Optimierungsrechnung. Im ersten Jahr las ich über die allgemeinen Prinzipien der Optimierungsrechnung, im zweiten Jahr sprach ich über die Optimierung unter Ungewißheit.*) Wie üblich wurden meine Vorlesungen v o n Dr. A n t o n i Banasinski aufgezeichnet. Er half ferner bei der Ausarbeitung einer Reihe v o n Zahlenbeispielen und der stilistischen Überarbeitung. A u f *' Sind in den zu untersuchenden Problemen die Bedingungen streng determiniert, die Parameter also fest vorgegeben, so daß für jede ökonomische Wahlhandlung im voraus bekannt ist, daß sie unweigerlich zu einem bestimmten Ergebnis führt, so spricht man von Optimierung (Entscheidung) unter Gewißheit (aus dem Englischen: decision under certainty). Solche Probleme löst man u.a. mit den Methoden der Differentialrechnung, der linearen und nichtlinearen Optimierung. Andernfalls spricht man grob vereinfacht von Optimierung (Entscheidung) unter Ungewißheit (engl, under uncertainty). Dieser historisch entstandene, von der neoklassischen Theorie geprägte Begriff wird nach der modernen ökonomischen Entscheidungstheorie meist als Oberbegriff benutzt,während dieser Untersuchungsbereich im einzelnen unterteilt wird nach: Optimierung (Entscheidung) unter Risiko (engl, under risk), hier ist die Wahrscheinlichkeitstheorie und mathematische Statistik anwendbar (z.B. bei der stochastischen Optimierung); Optimierung (Entscheidung) unter völliger Ungewißheit, wo der Einsatz der Wahrscheinlichkeitstheorie und mathematischen Statistik versagt. Hier werden u.a. zur Bestimmung der strategischen Parameter andere Methoden, insbesondere die mathematische Theorie der Spiele angewandt. Der Autor folgt dieser üblichen Begriffsunterteilung. [Die Fußnoten der deutschen Redaktion werden mit Sternchen bezeichnet. Weitere Zusätze der deutschen Bearbeitung stehen in eckigen Klammern].
X
Vorwort
diese Weise wurde das Vorlesungsmaterial zu diesem Buch umgestaltet. Nach der „Einführung in die Ökonometrie" und der „Theorie der Reproduktion und Akkumulation" ist es somit das dritte Buch, das auf diese Weise unter der Mithilfe von Dr. Banasinski entsteht. Anläßlich dieses „Jubiläums" möchte ich besonders ihm Dank sagen. Die Beschreibung der Prinzipien der Theorie der Optimierungsrechnung hat ihre synthetische Darstellung zum Ziel. Ich war bestrebt, zunächst die Theorie der Optimierungsrechnung, gestützt auf die Anwendung der Lagrangeschen Multiplikatoren, allgemein zu fassen, um danach die Marginaloptimierung und die lineare Optimierung als Spezialfälle dieser allgemeinen Theorie darzulegen. In der Kurzfassung findet man das bereits im Anhang „Mathematische Grundlagen der Optimierungsrechnung" zu meinem Buch „Politische Ökonomie", Band 1. Im vorliegenden Buch wird diese Auffassung unter besonderer Berücksichtigung der praxeologischen Interpretation der Lagrangeschen Multiplikatoren wesentlich erschöpfender dargestellt. Das entspricht dem in diesem Buch eingeschlagenen Weg, die Theorie der Optimierungsrechnung als Teil der Praxeologie — der Wissenschaft vom rationellen Handeln — aufzufassen. Neben der Theorie erörtere ich auch die praktische Lösung von Aufgaben der Optimierungsrechnung. In diesem Zusammenhang werden sowohl die Grundlagen der Simplex-Methode als auch die Anwendung der Theorie der linearen Optimierung bei der sogenannten Prozeßanalyse dargestellt. Ein gesondertes Kapitel ist dem Problem der Optimierung bei einer Vielfalt von Zielen gewidmet. Es hat große Bedeutung für die politische Ökonomie des Sozialismus. Der Optimierung unter Ungewißheit ist fast die Hälfte des Buches gewidmet. Im Gegensatz zur allgemeinen Theorie der linearen Optimierung wurde dieses Problem in der Literatur bisher wesentlich weniger beachtet. Dabei besitzt es eine große praktische Bedeutung, insbesondere für die Planung im Sozialismus. Ich war bemüht, die wichtigsten auf diesem Gebiet angewendeten Methoden darzustellen und sie mit den Problemen der sozialistischen Wirtschaft zu verbinden. Es zeigte sich hierbei, daß die Theorie der Optimierung unter
Vorwort
XI
Ungewißheit auch die Methoden der mathematischen Statistik beeinflußt. Darüber hinaus führt sie zu interessanten Konsequenzen auf dem Gebiet der Vorratsplanung und des Produktionsablaufs in der Zeit. Die probabilistischen und statistischen Methoden der Optimierungsrechnung finden aber nur beschränkt praktische Anwendung. Sie erfordern nicht nur die Kenntnis oder Schätzung der Wahrscheinlichkeitsverteilungen der Parameter, sondern sind darüber hinaus nur bei solchen Entscheidungen praktisch anwendbar, die sich häufig wiederholen (z.B. bei der statistischen Qualitätskontrolle der Produktion). Viele Wahlhandlungen bei der Wirtschaftsplanung (z.B. Investitionsentscheidungen beim Aufbau großer Objekte) tragen den Charakter einmaliger Entschlüsse, bei denen das Gesetz der großen Zahlen nicht wirksam ist. Unter diesen Bedingungen kann man keine Optimierungsrechnung anwenden, die sich auf die Wahrscheinlichkeitsrechnung stützt. Die hier entstehende Lücke wird durch die Theorie der strategischen Spiele geschlossen. Sie entwickelte die Grundlagen für rationelle Entscheidungen unter völliger Ungewißheit, d. h. unter solchen Bedingungen, die die Anwendung der Wahrscheinlichkeitsrechnung ausschließen. Dem Einsatz der Spieltheorie in der Optimierung ist demzufolge der letzte Teil dieses Buches gewidmet. Das vorliegende Buch umfaßt somit die Gesamtheit der wichtigsten Probleme der Optimierungsrechnung. Ich hoffe, daß es von den Lesern günstig aufgenommen wird und die Planungs- und Leitungsmethoden in unserer Volkswirtschaft verbessern hilft. Oskar Lange Warszawa, im März 1964
Einführung
Praxeologie und Theorie der Optimierungsrechnung
In den letzten Jahren hat die Theorie der Optimierungsrechnung und ihre praktische Anwendung unter den Ökonomen großes Interesse ausgelöst. Die Theorie der Optimierungsrechnung bildet streng genommen keinen Bestandteil der politischen Ökonomie. Sie ist vielmehr eine Hilfswissenschaft, die sowohl in der politischen Ökonomie als auch in anderen Gebieten theoretischer und praktischer Untersuchungen angewandt wird. Man kann sie als einen Bestandteil der allgemeinen Wissenschaft vom rationellen Handeln auffassen. Das Problem rationellen Handelns trat in bewußter Form zu allererst im Bereich der politischen Ökonomie auf, aber seine Bedeutung geht weit über das Gebiet ökonomischer Untersuchungen hinaus. Das führte zur Verselbständigung der Wissenschaft vom rationellen Handeln, die als Praxeologie bezeichnet wird. Der Begriff Praxeologie wurde 1890 durch den französischen Soziologen Espinasa in einem Artikel über die „Anfänge der Technologie" geprägt.1) Seit dieser Zeit taucht dieser Begriff in der Literatur immer häufiger auf. Die systematischste Darstellung der Grundlagen dieser jungen Wissenschaft gab Tadeusz Kotarbiriski in seiner 1955 veröffentlichten Arbeit mit dem Titel „Traktat über die gute Arbeit".2) Die grundlegenden Gedanken der Wissenschaft vom rationellen Handeln entwikkelte Kotarbiriski jedoch schon wesentlich früher, nämlich in der '> Vgl. O. Lange, Ekonomia polityczna (Politische Ökonomie), Band I, 3. Ausgabe, S. 211, PWN, Warszawa 1964. 2> T. Kotarbiriski, Traktat o dobrej robocie (Traktat über die gute Arbeit), 2. Ausgabe, Zaklad Narodowy Imienia Ossolinskich, Wroclaw — Warszawa 1958.
2
Einführung
1913 veröffentlichten Artikelsammlung mit dem Titel „Praktische Skizzen".3> Unabhängig von Kotarbinski führte der sowjetische Mathematiker Jewgeni Slutski4' die Praxeologie in die ökonomischen Wissenschaften ein. Diesen Begriff benutzt ebenfalls der österreichische Ökonom Ludwig Mises. Er setzt die Praxeologie aber fälschlicherweise mit der politischen Ökonomie gleich und faßt die Grundlagen dieser Wissenschaft vollständig falsch auf. 5) Die Praxeologie befaßt sich mit dem rationellen Handeln. Sie kann auch als „Logik des rationellen Handelns" bezeichnet werden. Die Praxeologie bedient sich solcher spezieller Begriffe wie: Ziel, Mittel, Methode, Tätigkeit, Plan, Folgerichtigkeit, Wirksamkeit, Produktivität, Einsparung usw., die als praxeologische Kategorien bezeichnet werden. Das sind Begriffe, die nicht nur in der politischen Ökonomie, sondern auch in der Technik, in der militärischen Strategie und Taktik, in der Methodologie wissenschaftlicher Untersuchungen und in anderen Gebieten angewandt werden. Die Praxeologie begründet gewisse Relationen zwischen praxeologischen Kategorien, die als praxeologische Prinzipien des Verfahrens bezeichnet werden. Solche Prinzipien treten in allen Gebieten menschlichen Handelns auf. Eines davon ist besonders wichtig, weil es eine große Bedeutung in der politischen Ökonomie hat. Es ist das Wirtschaftlichkeitsprinzip, also das Prinzip des rationellen Wirtschaftens. Das Prinzip des rationellen Wirtschaftens kann angewendet werden, wenn Ziel und Mittel des Handelns quantifiziert sind, d.h. den 3
> Diese und andere Arbeiten sind in dem Sammelwerk Dziela wybrane (Ausgewählte Schriften), Band I, PWN, Warszawa 1958, enthalten. Zur „Vorgeschichte" der Praxeologie siehe T. Kotarbinski, Rozwôj prakseologii (Entwicklung der Praxeologie), Wiedza Praktyczna (Bulletin), Warszawa 1962. 4> J. Slutski, Ein Beitrag zur formal-praxeologischen Grundlegung der Ökonomik, Academie Ukrainienne des Sciences, Annales de la classe des sciences sociales-économiques, Band 4, Kiew 1926. 5) L. Mises, Nationalökonomie, Theorie des Handelns und Wirtschaftens, Genf 1940. Vgl. eine Kritik Mises' in der Arbeit von O. Lange, Ekonomia polityczna (Politische Ökonomie), a.a.O., S. 265—266.
Praxeologie und Theorie der Optimierungsrechnung
3
Charakter von Meßgrößen oder zumindest von Ordnungsgrößen6) haben. Dieses Prinzip besagt, daß man bei gegebenem Aufwand an Mitteln den maximalen Realisierungsgrad des Zieles zu erreichen sucht. Bei dieser Auffassung wird das Wirtschaftlichkeitsprinzip als Prinzip des größten Effektes oder als Prinzip der größten Produktivität bezeichnet. Es gibt noch eine zweite Variante des Wirtschaftlichkeitsprinzips, die als Prinzip des geringsten Aufwandes an Mitteln bezeichnet wird. Man bezeichnet sie auch als Prinzip der Einsparung von Mitteln. In diesem Fall erreicht man den maximalen Grad der Realisierung eines Zieles auf die Weise, daß man das vorgegebene Ziel mit minimalem Aufwand an Mitteln zu erreichen sucht. Man kann zeigen, daß beide Varianten des Prinzips des rationellen Wirtschaftens gleichwertig sind. Wendet man die zweite Variante an, so erreichen wir schließlich ebenfalls den maximalen Realisierungsgrad des Zieles. Verbrauchen wir nämlich zur Realisierung eines bestimmten Zieles weniger Mittel, so kann der Realisierungsgrad des Zieles entsprechend erhöht und dadurch bis zum Maximum geführt werden. Verschiedentlich wird das Prinzip des rationellen Wirtschaftens noch auf eine dritte Art formuliert, nämlich als Verfahrensweise, die mit geringstem Aufwand an Mitteln den höchsten Realisierungsgrad des Zieles erreicht. Eine derartige Formulierung des Wirtschaftlichkeitsprinzips ist falsch, da sie zum Widerspruch führt. Wir werden das näher begründen, wenn wir das Prinzip des rationellen Wirtschaftens in die mathematische Form kleiden. Es ist aber auch intuitiv einleuchtend, daß die dritte Formulierung des Wirtschaftlichkeitsprinzips falsch ist. Wir verwiesen ferner darauf, daß das Ziel, das wir nach dem Prinzip des rationellen Wirtschaftens zu erreichen suchen, eine Meßgröße oder Ordnungsgröße sein muß. Erläutern wir diese Begriffe näher. 6 > Der Unterschied zwischen den Begriffen Meßgröße (kardinale Größen) und Ordnungsgröße (ordinale Größen) wird im folgenden Text und im Kapitel II erläutert.
4
Einführung
Eine Erscheinung hat den Charakter einer Meßgröße, wenn man sie messen, also wenn man sie eindeutig durch eine Zahl ausdrücken kann. Es existieren aber auch solche Erscheinungen, die man zwar nicht messen, wohl aber ordnen kann, d.h., die man eindeutig in einer gewissen Rangfolge nach dem Grad ihrer Erscheinungsform gruppieren kann. In diesem Fall sprechen wir davon, daß die Erscheinungen den Charakter von Ordnungsgrößen haben. Beispiele einer solchen geordneten Klassifikation ist die Ordnung der Sterne nach ihrem Helligkeitsgrad oder die Einstufung der Minerale nach ihrem Härtegrad. Mit geordneten Klassifikationen haben wir es häufig bei der Untersuchung physiologischer Erscheinungen zu tun, beispielsweise bei der Ordnung gewisser Erscheinungen nach dem Ausmaß des Schmerzes, den sie hervorrufen usw. Hinreichende Bedingung für die Anwendung des Prinzips des rationellen Wirtschaftens ist, daß das angestrebte Ziel den Charakter einer Ordnungsgröße besitzt. Das Prinzip des rationellen Wirtschaftens erfordert, daß es möglich ist zu beurteilen, ob das Ziel ein gewisses Ausgangsniveau oder den vorherigen Zustand über- oder unterschreitet. Diese Bemerkung ist allgemeiner Natur; denn bei jeder Berechnung, die der Maximierung oder Minimierung einer Veränderlichen dient, reicht es aus, daß diese Veränderliche eine Ordnungsgröße ist, so daß man ihre einzelnen Werte in eindeutiger Weise ordnen kann. Aus den Erläuterungen folgt, daß jede Meßgröße natürlich eine Ordnungsgröße ist. Die Umkehrung gilt jedoch nicht. Wie bereits erwähnt, spielte das Prinzip des rationellen Wirtschaftens in der Entwicklung der politischen Ökonomie eine große Rolle und wurde zuerst von Ökonomen formuliert. Das war kein Werk des Zufalls, denn dieses Prinzip ist eng mit der Entwicklung der Wirtschaft verbunden. Mit der Herausbildung der Ware-GeldWirtschaft, insbesondere aber der kapitalistischen Produktionsweise, setzte die Quantifizierung der ökonomischen Kategorien ein. Das war eine Folge der Ablösung der Naturalwirtschaft durch die Geldwirtschaft. In der Naturalwirtschaft war die Befriedigung der vielschichtigen Bedürfnisse (Ernährung, Bekleidung, Vergnügen, Verteidigung usw.) mittels verschiedenartiger Gebrauchswerte (Brot, Ziegel,
Praxeologie und Theorie der Optimierungsrechnung
5
Holz, Metall usw.) Inhalt der wirtschaftlichen Tätigkeit. Dagegen besitzt in der kapitalistischen Produktionweise, in der eine vollständige „Monetarisierung" der gesamten Wirtschaftsrechnung erfolgte, das Ziel des Wirtschaftens durchweg Meßgrößencharakter. Es werden Geldeinkommen erstrebt. Da die in den kapitalistischen Unternehmen eingesetzten Mittel (Löhne, Amortisation der Maschinen, Einsparungen usw.) ebenfalls diesen Meßgrößencharakter in Geldform aufweisen, wird auch der Aufwand an diesen Mitteln auf einen Nenner gebracht. In der kapitalistischen Produktionsweise vollzog sich also die Quantifizierung von Ziel und Mitteln des Wirtschaftens über gleichförmige Geldeinheiten. Es bildete sich ein bestimmtes, einheitliches Handlungsziel heraus, nämlich der Geldgewinn. Das bewirkte eine Rationalisierung der Wirtschaftstätigkeit. Die alten Verfahrensweisen nach Gewohnheit und Tradition wurden durch präzise Methoden des rationellen Wirtschaftens auf der Grundlage von Berechnungen ersetzt, deren Hilfsmittel die Buchhaltung ist. Das Prinzip des rationellen Wirtschaftens, das mit der Entwicklung der kapitalistischen Wirtschaft entstand, beschränkt sich in dieser Gesellschaftsordnung im wesentlichen auf die einzelnen Unternehmen. Im Sozialismus erstreckt es sich dagegen auf die gesamte Volkswirtschaft. Das Prinzip des rationellen Wirtschaftens bezieht sich aber nicht ausschließlich auf die Wirtschaftstätigkeit. Es wird auch auf anderen Gebieten der menschlichen Tätigkeit angewandt. In der Technik entscheidet es beispielsweise, wie man mit gegebenen Mitteln die größte Geschwindigkeit eines Transportmittels erreichen kann, wie die größte Tragfähigkeit einer projektierten Brücke zu erreichen ist usw. Die nach dem Prinzip des rationellen Wirtschaftens zu lösenden technischen Probleme kann man natürlich auch anders formulieren: das Ziel der Tätigkeit, zum Beispiel eine bestimmte Zuverlässigkeit der Maschine, ist mit geringsten Mitteln zu erreichen. In der militärischen Strategie und Taktik kann es darum gehen, das vorgegebene Ziel mit geringstem Aufwand an materiellen Mitteln und minimalen Verlusten an Menschen zu erreichen oder umgekehrt mit begrenzten Mitteln und geringsten Ver2
Lange, Optimale Entscheidungen
6
Einführung
lusten den größten strategischen oder taktischen Effekt zu gewährleisten. Man kann noch sehr viele derartige Beispiele anführen. Es gibt aber Gebiete der menschlichen Tätigkeit, in denen man das Prinzip des rationellen Wirtschaftens nicht anwendet oder anwenden kann. Das sind vor allem jene Fälle, in denen Ziel und Mittel der Tätigkeit nicht den Charakter von Meßgrößen besitzen und nicht einmal Ordnungsgrößen sind. Das betrifft beispielsweise die Naturalwirtschaft, in der eine Vielzahl miteinander nicht vergleichbarer Ziele und Mittel vorhanden ist. Ähnliche Fälle, aber in bedeutend engeren Grenzen, können ebenfalls in der kapitalistischen und in der sozialistischen Wirtschaft auftreten. Einen dem Prinzip des rationellen Wirtschaftens gemäßen Einsatz der Mittel bezeichnen wir als optimale Art ihrer Ausnutzung. Die Optimierung der Ausnutzung der Mittel beruht also auf einer Maximierung des Zieles oder einer Minimierung der Mittel, also darauf, daß 1. bei gegebenem Aufwand an Mitteln der höchste Realisierungsgrad des Zieles erreicht wird oder 2. ein bestimmter Realisierungsgrad des Zieles mit geringstem Aufwand an Mitteln erreicht wird. Den nichtoptimalen Verbrauch von Mitteln bezeichnen wir als Vergeudung. Der Begriff der Vergeudung ist eine praxeologische Kategorie. Mit Vergeudung in der Wirtschaft oder bei anderen Tätigkeiten haben wir es also zu tun, wenn a) die Mittel so verbraucht werden, daß der maximale Realisierungsgrad des Zieles nicht erreicht wird oder b) der gegebene Effekt (der bestimmte Realisierungsgrad des Zieles) mit überhöhtem Aufwand an Mitteln erreicht wird. Das Prinzip des rationellen Wirtschaftens ist also ein allgemeines praxeologisches Prinzip des Vorgehens unter der Voraussetzung, daß Ziel und Mittel den Charakter von Ordnungsgrößen haben. Die Optimierungsrechnung, die das Thema unserer Ausführungen ist, beschäftigt sich mit einer besonderen Art rationeller Tätigkeit. Die Wissenschaft von der Optimierungsrechnung oder die Theorie der Optimierungsrechnung ist ein Teil der Praxeologie. Sie liefert
Praxeologie und Theorie der Optimierungsrechnung
7
die mathematische Theorie zur Anwendung des Prinzips des rationellen Wirtschaftens. Als Spezialdisziplin entstand die Theorie der Optimierungsrechnung im Verlaufe des II. Weltkrieges. Sie ist also ein noch sehr junger Zweig der Wissenschaft. Die Theorie der Optimierungsrechnung bildete sich fast gleichzeitig mit einer anderen Wissenschaft, der sogenannten Operationsanalyse (Englisch: Operations Research) heraus. Beide Wissenschaften entwickelten sich mit den Bedürfnissen militärischer Operationen und sind miteinander sehr eng verbunden. Die Operationsanalyse entstand zu Beginn des II. Weltkrieges in England. Damals rief man viele Gelehrte aus verschiedenen Wissenschaften zusammen, um geeignete Methoden zur Versorgung der Armee und zur Führung militärischer Handlungen zu erarbeiten. Dabei ging es beispielsweise um die Bestimmung der optimalen Anzahl von Schiffen in einem Konvoi. Aus der Praxis war nämlich bekannt, daß die Bildung großer Konvois die Organisation des Schutzes der Transportschiffe vor Flugzeugen und Unterseebooten erleichterte. Andererseits vermindert sich die Geschwindigkeit eines Konvois mit seiner Größe, da die Geschwindigkeit vom jeweils langsamsten Schiff bestimmt wird. Darüber hinaus treten bei einer größeren Gruppe von Schiffen häufiger Defekte auf, die ebenfalls die Schnelligkeit des Konvois herabsetzen. Die verminderte Geschwindigkeit des Konvois beeinträchtigt aber seine Sicherheit. In diesem Zusammenhang ist irgendeine „Kompromißlösung" des Problems notwendig. Das führte zur Bestimmung der optimalen Anzahl der Schiffe im Konvoi. Andere Probleme aus diesem Gebiet beruhen auf der Bestimmung der „optimalen Trasse" der Schiffe für Militärtransporte, um die Verluste an Schiffen und Ladung niedrig zu halten usw. All das sind Probleme, die auf die Maximierung des Realisierungsgrades des Zieles oder die Minimierung des Aufwandes an Mitteln zurückgehen. Es erwies sich, daß ein wesentlicher Teil der Methoden, die für die Lösung dieser militärischen Probleme entwickelt wurden, auch in Friedenszeiten angewendet werden kann, z.B. für die Bestimmung der Arten des rationellen Wirtschaftens einzelner Unternehmen. 2*
Einführung
8
Die Wissenschaft von der Optimierungsrechnung entwickelte sich in den Vereinigten Staaten von Nordamerika während des II. Weltkrieges, als Versorgungsprobleme der Armee mit Kriegsmaterial, Lebensmitteln usw. entstanden. Es ging unter anderem um die günstigste räumliche Verteilung der Vorratslager für Lebensmittel und Kriegsmaterial. Die Errichtung der Lager in Frontnähe sicherte zwar eine schnellere Bereitstellung der Lebensmittel und Materialien am Bestimmungsort, vergrößerte aber gleichzeitig das Risiko ihrer Vernichtung durch gegnerische Handlungen. Gleicherweise gestaltet sich das Problem, entweder kleine, aber dicht beieinander liegende Lager oder große, jedoch weit auseinander liegende Lager zu organisieren. All das waren Probleme aus dem Bereich der Optimierungsrechnung, und viele ihrer Lösungsmethoden fanden in der Friedenswirtschaft Anwendung. Noch vor dem Krieg, und zwar 1939, veröffentlichte der sowjetische Mathematiker L. W. Kantorowitsch eine Arbeit mit dem Titel „Mathematische Methoden bei der Organisation und Planung der Produktion",7) in der er die grundlegenden Ideen der Wissenschaft von der Optimierungsrechnung für Probleme der Produktionsorganisation und des Transportes entwickelte. Weitere Ergebnisse Kantorowitsch's auf diesem Gebiet wurden 1942 und 1949 veröffentlicht. Die ersten Arbeiten Kantorowitsch's weckten unter den Ökonomen nur geringe Aufmerksamkeit, sie waren eher für die Mathematiker von Interesse. Erst in den letzten Jahren begann man sich häufiger mit den von Kantorowitsch erzielten Ergebnissen zu beschäftigen und die Anwendungsmöglichkeiten in der Praxis zu untersuchen. 1959 erschien in Moskau das Buch von Kantorowitsch „Ökonomische Berechnung der optimalen Ausnutzung von Ressourcen".8) 7
> Der Artikel von Kantorowitsch ist in dem Sammelband: Anwendung mathematischer Methoden in der Ökonomie enthalten. Vgl. B. G. Teubner Verlagsgesellschaft, Leipzig 1963, S. 245 ff. 8) Polnische Übersetzung mit dem Titel „Rachunek ekonomiczny optymalnego wykorzystania zasoböw" (Ökonomische Berechnung der optimalen Ausnutzung
Praxeologie und Theorie der Optimierungsrechnung
9
Die Operationsanalyse und die Wissenschaft von der Optimierungsrechnung können zur Praxeologie gerechnet werden, da sich ihr Anwendungsbereich nicht auf die Ökonomie beschränkt. Gegenwärtig werden aber beide Wissensgebiete hauptsächlich in der Wirtschaft angewendet, sie besitzen also eine besondere Bedeutung für die politische Ökonomie und andere Wirtschaftswissenschaften.
von Ressourcen), PWN, Warschau 1959. Vgl. auch G. Sch. Rubinschtejn, O razwitii i primeneni lineinogo programirowanija w SSSR (Über die Entwicklung und Anwendung der linearen Programmierung in der UdSSR), Anhang zum Sammelband „Lineare Ungleichungen", (Ubersetzung aus dem Englischen), Moskwa 1959.
Kapitel I
Typische Modelle der Optimierangsrechnung
Die systematische Darlegung der Theorie der Optimierungsrechnung beginnen wir mit der Erörterung einiger typischer Schemata (Modelle), deren sich diese Theorie bei der Lösung ökonomischer Probleme bedient. Wir beschränken uns dabei vorläufig auf die Formulierung der Probleme, ohne die Methoden zu ihrer Lösung anzugeben. Es geht uns hier vornehmlich um die Darstellung des Anwendungsbereiches dieser Theorie, ohne schon in die Technik ihrer Handhabung einzudringen. § 1. Das Rundreiseproblem1 * Es seien auf der Landkarte vier Städte bestimmt, die wir mit A, B, C und D bezeichnen. In der Stadt A befinde sich der Sitz eines Handelsunternehmens, das Verkäufer mit der Weisung ausschickt, die Städte B, C und D zu besuchen und danach in die Stadt A zurückzukehren. Der Verkäufer kann verschiedene „Routen" wählen; bei 4 Städten sind (4—1)! = 3! = 6 Reihenfolgen der Rundreise, also 6 verschiedene Reiserouten möglich.2' Es läßt sich leicht zeigen, daß bei n Ortschaften die Anzahl der verschiedenen Routen (n— 1)! beträgt. Die Aufgabe besteht darin, unter allen möglichen Wegen jenen auszuwählen, für den die Reisekosten minimal sind. Dabei wird Das Problem wird in der amerikanischen Literatur als „the travelling-salesman Problem" bezeichnet. 2 > Im vorliegenden Fall kann die Besuchsfolge der einzelnen Städte sein: ABC DA, ABDCA, ACBDA, ACDBA, ADBCA, ADCBA.
§ 1. Das Rundreiseproblem
11
unterstellt, daß die Reisekosten ß y ( i , j = 1,2, ...,«) für die Fahrt zwischen zwei beliebigen Orten bekannt sind. Ohne Einschränkung der Allgemeinheit kann angenommen werden, daß die Fahrtkosten zwischen den Ortschaften proportional zu ihrer Entfernung wachsen. Dadurch wird das Problem auf die Bestimmung des kürzesten Weges zurückgeführt. Am einfachsten kann man das Problem durch die „Berechnung sämtlicher Varianten" lösen, indem man die Fahrtkosten für alle möglichen Wege errechnet. Versuchen wir das Problem für vier Städte zu lösen. Dabei sollen die Fahrtkosten (in MDN) zwischen zwei Städten •— proportional zur Entfernung — den in der Skizze und der Tabelle (Matrix) angegebenen Beträgen entsprechen. A 0 A B 12 C 14 D 23
B
C
D
12 0 17 25
14 17 0 30
23 25 30 0
Die Fahrtkosten für die einzelnen Wege berechnen sich wie folgt: Weg ABCDA, Kosten 12+17+30+23 = 82 Weg ABDCA, Kosten 12+254-30+14 = 81 Weg ADBCA, Kosten 2 3 + 2 5 + 1 7 + 1 4 = 79. Man erkennt ohne weiteres, daß die Fahrtkosten in umgekehrter Richtung, d.h. für die übrigen Wege: ADCBA, ACDBA, ACBDA entsprechend 82, 81 und 79 betragen. Daraus folgt, daß die vorliegende Kostentabelle bezüglich der Hauptdiagonalen der Tabelle symmetrisch ist. Dementsprechend sind die Fahrtkosten für den Weg AB gleich den Fahrtkosten in entgegengesetzter Richtung, d.h. für den Weg BA. Aus der Berechnung der Reisekosten geht hervor, daß die Wege ADBCA und ACBDA die optimalen Routen sind, da das gesetzte Ziel hierbei mit geringsten Kosten realisiert wird. Dieser Lösungsweg
12
Kapitel I. Typische Modelle der Optimierungsrechnung
für das Rundreiseproblem kann aber nur dann eingeschlagen werden, wenn die Anzahl der Städte, die der Verkäufer besuchen muß, nicht groß ist. Denn schon für 12 Städte beträgt die Anzahl der möglichen Reiserouten 111 = 39 916 800, also sogar bei einer symmetrischen Kostentabelle müßte man ll!/2 d.h. fast 20 Millionen Berechnungen durchführen. Die soeben beschriebene Methode, nämlich alle möglichen Varianten zu berechnen, ist natürlich in solchen Fällen nicht praktikabel. Man muß deshalb Methoden entwickeln, die eine Lösung dieses Problems auf vereinfachte Weise gestatten.3' Der Verkäufer habe n Städte zu besuchen und die Fahrtkosten von der Ortschaft i zur Ortschaft j (i,j = 1,2, ...,ri) seien in der folgenden Matrix S gegeben: s
12 J13 ••• J ln s 2l 0 S2 3 ... S2n 0
_snl sn2 sn3 ••• 0 ]• Das Problem besteht nun darin, den optimalen Weg des Verkäufers zu finden. Es ist also jene Route festzulegen, auf der die Fahrtkosten von der Stadt Nummer 1 über alle anderen Städte und zurück minimal sind. Wir bezeichnen die Folge der Fahrtkosten von einer Ortschaft zur anderen mit saß. Aus den Bedingungen der Aufgabe geht hervor, daß der Index a. der Reihe nach die Werte 1, i2, i3, ..., i„ und der Index ß die Werte i2, i3, U, ..., z„, 1 annehmen kann. Die Indizes i2, i3, ...,/„ können eine beliebige Permutation (Anordnung) der Zahlen 2, 3, ..., n angeben. Die Gesamtkosten z, die der Verkäufer bei der Fahrt auf einer bestimmten Route zu tragen hat, kann man in der Form a ß 3)
Das Rundreiseproblem wurde für den allgemeinen Fall bisher noch nicht gelöst. Es gibt Methoden zur Lösung dieses Problems, wenn die Kostenmatrix symmetrisch ist (ay = aji für i, j = 1, ...,«), und Näherungslösungen, wenn die Kostenmatrix unsymmetrisch ist. Einige Autoren nehmen sogar an, daß eine universelle Lösungsmethode für das Rundreiseproblem in seiner allgemeinsten Form nicht existiert.
13
§ 1. Das Rundreiseproblem
schreiben, wobei die Indizes a und ß der Glieder dieser Summe eine der möglichen unter den oben bezeichneten Zahlengruppierungen bilden: a = 1, i2,
h,
...,
i„
und
ß =
i2,
i3,
...,
i,„
1.
Wenn z.B. n = 5 ist und der Weg der Reihe nach durch die mit den Nummern 1, 3,2, 5,4,1 bezeichneten Städte verläuft, dann ergeben sich die Gesamtkosten wie folgt: Z = ZXA/i = i n + ^ + ^ s + ^ + ^ i a
ß
Das Problem besteht also darin, eine solche Permutation der Zahlen i2, (3, ...,/„ = 2, 3, ..., n zu finden, bei der z
=
X
X
s"ß
=
Min
-
Aus dieser mathematischen Formulierung erhellt, daß das Auffinden einer allgemeinen Methode zur Lösung des erörterten Problems nicht einfach ist. Schon bei diesem ersten Beispiel des Rundreiseproblems zeichnet sich ein gewisses Darstellungsschema für Probleme der Theorie der Optimierungsrechnung ab. Als erstes sehen wir, daß die Daten des Problems (im untersuchten Fall die Fahrtkosten von einer Ortschaft zur anderen) in Form einer Matrix gegeben sind. Des weiteren existiert eine gewisse Zielfunktion z, die durch geeignete Auswahl der im gegebenen Problem enthaltenen Veränderlichen zu minimieren oder zu maximieren ist. Beim Rundreiseproblem haben die Veränderlichen einen speziellen Charakter. Es sind verschiedene Anordnungen (Permutationen) der Zahlen, 1,2, 3, ...,«, die die Nummern der Städte darstellen, die der Verkäufer zu besuchen hat. Die Veränderlichen müssen darüber hinaus gewissen zusätzlichen Bedingungen genügen (sogenannten Randbedingungen). Im vorliegenden Fall beginnt die Folge des Indexes a der Glieder der Zielfunktion mit 1 und die Folge des Indexes ß endet mit 1. Schließlich ist noch zu bemerken, daß das Schema des Rundreiseproblems auch für andere Probleme der Optimierung angewendet
14
Kapitel I. Typische Modelle der Optimierungsrechnung
werden kann, die sachlich mit dem Rundreiseproblem nichts gemeinsam haben. § 2. Das Transportproblem Das Transportproblem wird in der Fachliteratur in verschiedenen Varianten wiedergegeben. Eine der einfachsten davon werden wir in diesem Paragraphen behandeln. Wir nehmen an, daß drei Produktionsbetriebe bestehen (beispielsweise Landmaschinenfabriken), die 5 Verkaufsstellen beliefern (zum Beispiel Genossenschaften). Jeder Betrieb hat eine bestimmte Produktionshöhe, die beispielsweise 200, 500 und 300 Einheiten beträgt, und es existiert ein gewisser Schlüssel für die Aufteilung der Gesamtproduktion von 1000 Einheiten auf die Verkaufsstellen (siehe Skizze). Gefragt ist, in welchen Mengen die Produkte von den einzelnen Betrieben an die Verkaufsstellen zu liefern sind, damit die Transportkosten so niedrig wie möglich bleiben. Unterstellen wiT dabei, daß die Transportkosten den Entfernungen der Betriebe zu den Verkaufsstellen proportional sind, dann reduziert sich das Problem auf die Minimierung der zu realisierenden Tonnenkilometer. 4 '
1
2
3
Produktionsbetriebe
Verkaufsstellen
Oftmals ist die Lösung der Aufgabe einfach und stützt sich auf die Durchrechnung aller möglichen Varianten, insbesondere dann, 4) Das Problem kann auch anders formuliert werden. Es muß nicht um die Bestimmung des Minimums der zu realisierenden Tonnenkilometer gehen, sondern zum Beispiel um die Minimierung der Anzahl der am Transport beteiligten Eisenbahnwaggons, Lastkraftwagen usw.
14
Kapitel I. Typische Modelle der Optimierungsrechnung
werden kann, die sachlich mit dem Rundreiseproblem nichts gemeinsam haben. § 2. Das Transportproblem Das Transportproblem wird in der Fachliteratur in verschiedenen Varianten wiedergegeben. Eine der einfachsten davon werden wir in diesem Paragraphen behandeln. Wir nehmen an, daß drei Produktionsbetriebe bestehen (beispielsweise Landmaschinenfabriken), die 5 Verkaufsstellen beliefern (zum Beispiel Genossenschaften). Jeder Betrieb hat eine bestimmte Produktionshöhe, die beispielsweise 200, 500 und 300 Einheiten beträgt, und es existiert ein gewisser Schlüssel für die Aufteilung der Gesamtproduktion von 1000 Einheiten auf die Verkaufsstellen (siehe Skizze). Gefragt ist, in welchen Mengen die Produkte von den einzelnen Betrieben an die Verkaufsstellen zu liefern sind, damit die Transportkosten so niedrig wie möglich bleiben. Unterstellen wiT dabei, daß die Transportkosten den Entfernungen der Betriebe zu den Verkaufsstellen proportional sind, dann reduziert sich das Problem auf die Minimierung der zu realisierenden Tonnenkilometer. 4 '
1
2
3
Produktionsbetriebe
Verkaufsstellen
Oftmals ist die Lösung der Aufgabe einfach und stützt sich auf die Durchrechnung aller möglichen Varianten, insbesondere dann, 4) Das Problem kann auch anders formuliert werden. Es muß nicht um die Bestimmung des Minimums der zu realisierenden Tonnenkilometer gehen, sondern zum Beispiel um die Minimierung der Anzahl der am Transport beteiligten Eisenbahnwaggons, Lastkraftwagen usw.
§ 2. Das Transportproblem
15
wenn es nur um eine geringe Anzahl von Betrieben und Verkaufsstellen geht. Die Aufgabe wird komplizierter, wenn deren Anzahl wächst. Wir betrachten den allgemeinen Fall des Problems und geben seine mathematische Formulierung an. Die Anzahl der das Produkt erzeugenden Betriebe sei m und die der Verkaufsstellen n. Mit xi}(i — 1,2, ..., m; j= 1,2, ...,«) bezeichnen wir die Menge des Produktes (ausgedrückt in Tonnen), die zum Beispiel während eines Jahres vom Betrieb mit der Nummer i an die Verkaufsstelle mit der Nummer j zu liefern ist. Die Größen bilden die Matrix der Produktaufteilung xn
xi2
...
X21 X22
xln
• • • x2„
Xm2 ...
Xm„\.
Zur Vereinfachung unterstellen wir, daß > 0 ist, der Transport also nur in einer Richtung verläuft (vom Betrieb zur Verkaufsstelle). Rückführungen von Teilen der Produktion von den Verkaufsstellen zu den Betrieben schließen wir somit aus. Wir stellen fest, daß die Zeilen der Matrix der Produktaufteilung die von einem bestimmten Betrieb an die einzelnen Verkaufsstellen abzugebenden Produkte bezeichnen und daß die Spalten der Matrix die Zuteilungen einer bestimmten Verkaufsstelle von den einzelnen Betrieben enthalten. Einige Elemente der Matrix der Produktaufteilung können natürlich gleich Null sein. Ist beispielsweise xtJ = 0, dann hat der i-te Betrieb von seiner Produktion nichts an die j-te Verkaufsstelle zu liefern. Wir setzen ferner voraus, daß die Transportkosten je Erzeugniseinheit von den Betrieben zu den Verkaufsstellen vorliegen und folgende Kostenmatrix bilden: C ii _
C
21
C12 ... c
22
c i„ c
••• 2n
Cm2 ••• CmnJ •
Die Größe ctJ bezeichnet die Transportkosten einer Tonne des Produktes vom Betrieb mit der Nummer i zur Verkaufsstelle mit der
16
Kapitel I. Typische Modelle der Optimierungsrechnung
Nummer j. Unterstellen wir, daß die Transportkosten proportional zur Länge der Transportwege sind, dann kann man — wie bereits oben erläutert — voraussetzen, daß die Elemente dieser Matrix die Entfernungen zwischen den entsprechenden Ortschaften ausdrücken. Aus den Bedingungen des Problems folgt natürlich, daß die Elemente der Kostenmatrix der Relation ctJ > 0 für alle Indizes i, j genügen. Wir nehmen weiterhin an, daß jeder Betrieb eine bestimmte und bekannte — beispielsweise jährliche — Produktionskapazität a^i = 1, 2, ...', m) hat und der jährliche Bedarf der einzelnen Verkaufsstellen b j ( j = 1 , 2 , . . . , « ) beträgt. Wie man leicht sieht, müssen demnach folgende Gleichungen erfüllt sein: Y,xiJ j
=
ai
Y,xH = bj i
1 , 2 , . . . , m)
( i =
(j = l , 2 , . . . , n ) 5 >
(1.1)
(1.2)
Wir stellen fest, daß die Gleichungen (1.1) und (1.2) insgesamt (m+w)-mal auftreten. Berücksichtigen wir aber, daß die Gesamtproduktion aller Betriebe gleich der Summe der Produkte ist, die die Verkaufsstellen erhalten, d.h. — dann gibt es unter i
j
den m+n Gleichungen (1.1) und (1.2) nur w+n—1 unabhängige Gleichungen. Sind aber w+n—1 Gleichungen des Systems (1.1) und (1.2) gegeben, dann kann man die (m+«)-te Gleichung dieses Systems als Linearkombination der vorliegenden m+n— 1 Gleichungen erhalten. Da die Transportkosten der Produkte vom Betrieb mit der Nummer i zur Verkaufsstelle mit der Nummer j ci}xj} betragen, sind die Gesamtkosten z des Transportes der Produkte von den Betrieben zu den Verkaufsstellen 1 s)
j
Das Symbol 2 besagt, daß über alle Indizes j zu summieren ist. Es ist die J
n
Kurzform des Symbols £ . j=l
§ 2. Das Transportproblem
17
Das Problem besteht in der Ermittlung der Unbekannten xu. Sie sind Elemente der gesuchten Aufteilungsmatrix und genügen der Bedingung * y > 0 ( i = 1 , 2 , ...,m; 7 = 1 , 2 , ...,«). (1.3) Die Unbekannten xtJ sind dann so zu bestimmen, daß bei Erfüllung der in den Gleichungen (1.1) und (1.2) ausgedrückten zusätzlichen Bedingungen die Gesamttransportkosten minimal sind, d.h. (1.4) * = EX;cy*V = Min. i J Analysieren wir das gewonnene mathematische Schema des Transportproblems näher. Zu allererst bemerken wir, daß das Problem der Optimierung auf die Minimierung oder Maximierung einer gewissen Funktion, der sogenannten Zielfunktion, zurückgeführt wird. Jedem Programm, das die Minimierung einer Zielfunktion beinhaltet, läßt sich aber ein sogenanntes duales Programm zuordnen, das eine andere Funktion maximiert. Und umgekehrt kann man einem Programm, das eine Zielfunktion maximiert, ein duales Programm zuordnen, das eine andere Funktion minimiert. Die Substitution des gegebenen Programms durch das hierzu duale Programm erfolgt bei Transportproblemen durch eine entsprechende Umformung der Zielfunktion. Ein Syndikat befasse sich beispielsweise mit der Produktion und Distribution eines bestimmten Erzeugnisses. Wir führen nun die Gewinnrechnung dieses Syndikats in das behandelte Problem ein. Dann würde der Gesamtgewinn des Syndikats bei Annahme konstanter Preise und konstanter Produktions- und Transportkosten je Erzeugniseinheit usw. von der Aufteilung der Produkte der einzelnen Betriebe auf die einzelnen Verkaufsstellen abhängen. Das Gewinnmaximum erreicht man unter diesen Bedingungen durch eine Minimierung der Transportkosten. Die Minimierung dieser Kosten ist der Maximierung des Gewinns gleichwertig. Die soeben beschriebene Eigenschaft der Optimierungsrechnung, die sogenannte Dualität, ist ein allgemeines Merkmal der Optimierungsschemata. Diese Eigenschaft resultiert aus der Existenz der beiden Varianten des Prinzips der Wirtschaftlichkeit, von denen in der Einführung gesprochen wurde.
18
Kapitel I. Typische Modelle der Optimierungsrechnung
Wenden wir uns den Bedingungen (1.1), (1.2) und (1.3) zu, die den Veränderlichen = 1,2, ..., m; j = 1, 2, ...,«) gewisse Beschränkungen auferlegen. Dazu bemerken wir, daß die als Gleichungen formulierten Bedingungen (1.1) und (1.2) durch Ungleichungen ersetzt werden können. Beispielsweise bedeutet die Bedingung < j daß nicht sämtliche Produkte a t des i-ten Betriebes im gegebenen Zeitraum an die Verkaufsstellen geliefert werden müssen. Es entstünde dann das „Vorratsproblem", das wir umgangen haben, um das behandelte Problem nicht zu komplizieren. Demgemäß bedeutet die Bedingung ^ daß in den Verkaufsstellen Vorräte entstehen i können. Die Bedingungen (1.1) und (1.2) — in der Form von Gleichungen oder Ungleichungen — bezeichnet man ihrem Charakter und Sinn gemäß als Bilanzbedingungen ;*> die Beschränkungen des Typs (1.3) nennt man dagegen Randbedingungen. Diese Begriffe hängen mit der graphischen Darstellung der Optimierungsschemata zusammen, über die noch gesprochen wird. Die Bilanzbedingungen spielen bei jedem Optimierungsproblem eine besondere Rolle; sie begrenzen nämlich die Anzahl der Unbekannten, die wir frei wählen können. Wollten wir beispielsweise das vorliegende Aufteilungsproblem der Produkte lösen, dann müssen wir m-n Unbekannte xi](i= 1, 2, ..., m; j = 1, 2, ..., n) bestimmen. Da aber diese Unbekannten m-\-n Bilanzbedingungen genügen müssen, können wir nur n • m— —(m+ri) Unbekannte frei wählen. Im vorliegenden Beispiel müssen wir noch die Anzahl der Freiheitsgrade berichtigen. Wie wir bereits zeigten, geht aus der Formulierung des Problems nämlich hervor, daß unter den (m+n) Bilanzbedingungen (den Gleichungen (1.1) und (1.2)) nur (m+n—1) unabhängig sind. Demzufolge können wir schließlich [n • m—(m+n—1)] Unbekannte frei wählen. Das bedeutet, daß wir [n • m—(m-\-n— 1)] Freiheitsgrade haben. Die Bilanzbedingungen (1.1) und (1.2) und die Randbedingungen (1.3) bestimmen, geometrisch ausgedrückt, den Bereich der zulässigen *> Die Bilanzbedingungen werden in der Literatur häufig auch als Nebenbedingungen bezeichnet.
§ 3. Koopmans' Transportproblem
19
Lösungen, der [n • m—(m+n— 1)] Freiheitsgrade hat. Unter diesen zulässigen Lösungen wählen wir jene aus, die die Zielfunktion minimiert (bzw. maximiert). Wir bemerken noch, daß im betrachteten Beispiel sowohl die Bilanzbedingungen (1.1) und (1.2) als auch die Zielfunktion (1.4) in den Unbekannten xi} linear sind. In diesen Fällen rechnen wir das untersuchte Problem zur linearen Optimierung. Sind die Zielfunktion oder die Bilanzbedingungen jedoch nicht linear, so sprechen wir von nichtlinearer Optimierung. Auf den ersten Blick erscheint es, als seien die Probleme der linearen Optimierung leichter zu lösen als die der nichtlinearen Optimierung. Das trifft jedoch nicht zu. Bei der linearen Optimierung ist zwar die mathematische Formulierung des Problems einfacher, aber seine rechnerische Lösung ist im Prinzip schwieriger als bei Problemen der nichtlinearen Optimierung. Das rührt hauptsächlich daher, daß es bei der linearen Optimierung nicht möglich ist, für die Bestimmung der Extremwerte der Zielfunktion (vgl. Kapitel IV) die Diiferentialrechnung anzuwenden. § 3. Koopmans' Transportproblem Wir erörtern jetzt eine andere, historisch frühere Version des Transportproblems, mit der sich erstmals der bekannte Ökonom T. C. Koopmans befaßte.6* Das von Koopmans untersuchte Problem betraf die Transporte von Kriegsmaterial, die in der Zeit des II. Weltkrieges von den USA nach England und umgekehrt erfolgten. Da sich die Transporte nach beiden Richtungen nicht ausglichen, fuhren die Schiffe häufig leer oder unausgelastet. Die Seetransporte der Alliierten waren überdies durch die faschistischen Unterseeboote und Flugzeuge gefährdet. Es ging deshalb um eine solche Zusammenstellung der Transporte, die die unausgenutzte Ladefähigkeit der 6)
T. C. Koopmans, Optimum Utilization of the Transportation System, veröffentlicht in „Econometrica" 1949 (Supplement). Vgl. auch T. C. Koopmans und S. Reiter, A Model of Transportation, in dem Buch Activity Analysis of Production and Allocation, ed. T. C. Koopmans, New York 1951. [Vgl. auch O. Lange, Einführung in die Ökonometrie, Akademie-Verlag, Berlin; PWN, Warszawa 1968, S. 237 ff.]
§ 3. Koopmans' Transportproblem
19
Lösungen, der [n • m—(m+n— 1)] Freiheitsgrade hat. Unter diesen zulässigen Lösungen wählen wir jene aus, die die Zielfunktion minimiert (bzw. maximiert). Wir bemerken noch, daß im betrachteten Beispiel sowohl die Bilanzbedingungen (1.1) und (1.2) als auch die Zielfunktion (1.4) in den Unbekannten xi} linear sind. In diesen Fällen rechnen wir das untersuchte Problem zur linearen Optimierung. Sind die Zielfunktion oder die Bilanzbedingungen jedoch nicht linear, so sprechen wir von nichtlinearer Optimierung. Auf den ersten Blick erscheint es, als seien die Probleme der linearen Optimierung leichter zu lösen als die der nichtlinearen Optimierung. Das trifft jedoch nicht zu. Bei der linearen Optimierung ist zwar die mathematische Formulierung des Problems einfacher, aber seine rechnerische Lösung ist im Prinzip schwieriger als bei Problemen der nichtlinearen Optimierung. Das rührt hauptsächlich daher, daß es bei der linearen Optimierung nicht möglich ist, für die Bestimmung der Extremwerte der Zielfunktion (vgl. Kapitel IV) die Diiferentialrechnung anzuwenden. § 3. Koopmans' Transportproblem Wir erörtern jetzt eine andere, historisch frühere Version des Transportproblems, mit der sich erstmals der bekannte Ökonom T. C. Koopmans befaßte.6* Das von Koopmans untersuchte Problem betraf die Transporte von Kriegsmaterial, die in der Zeit des II. Weltkrieges von den USA nach England und umgekehrt erfolgten. Da sich die Transporte nach beiden Richtungen nicht ausglichen, fuhren die Schiffe häufig leer oder unausgelastet. Die Seetransporte der Alliierten waren überdies durch die faschistischen Unterseeboote und Flugzeuge gefährdet. Es ging deshalb um eine solche Zusammenstellung der Transporte, die die unausgenutzte Ladefähigkeit der 6)
T. C. Koopmans, Optimum Utilization of the Transportation System, veröffentlicht in „Econometrica" 1949 (Supplement). Vgl. auch T. C. Koopmans und S. Reiter, A Model of Transportation, in dem Buch Activity Analysis of Production and Allocation, ed. T. C. Koopmans, New York 1951. [Vgl. auch O. Lange, Einführung in die Ökonometrie, Akademie-Verlag, Berlin; PWN, Warszawa 1968, S. 237 ff.]
20
Kapitel I. Typische Modelle der Optimierungsrechnung
Schiffe (gerechnet in Tonnenkilometern) auf ein Minimum einschränkt. Dadurch sollten zugleich die Verluste an Schiffen verringert werden. Obwohl Koopmans' Transportproblem historisch einen militärtaktischen Charakter hat, kann man es auch — wie das Koopmans übrigens später selbst getan hat — als ökonomisches Problem auffassen, denn die Verringerung der ungenutzten Ladefähigkeit erhöht die Rentabilität der Seetransporte. Eine optimale Lösung dieses Problems im Weltmaßstab wäre dann möglich, wenn eine geeignete Form der gemeinschaftlichen internationalen Bewirtschaftung der Schiffe und Seetransporte existierte. Man muß noch hinzufügen, daß Koopmans' Modell natürlich nicht nur bei Seetransporten angewendet werden kann, sondern ebenfalls bei Eisenbahnund Lastkraftwagentransporten sowie hiermit verwandten Problemen. Wir geben nun die mathematische Formulierung des behandelten Problems an. Es seien n Häfen vorhanden, von denen Ladungen abgesandt und zu denen Ladungen hintransportiert werden. Mit wf bezeichnen wir den Umfang des Abtransportes (beispielsweise in Tonnen) und mit Pi bezeichnen wir den Umfang des Antransportes während eines gewissen Zeitraums im Hafen i (i = 1,2, ..., n). Gegeben seien ferner (zum Beispiel in km) die beiderseitigen Entfernungen der Häfen. Diese Entfernungen kann man in einer Matrix anordnen: "0
i 1 2 ... sln~
s2i 0
••• s2n
_snl Sn2 ... 0 J . Mit X;j bezeichnen wir die vorhandene Gütermenge (wiederum in Tonnen), die vom Hafen i zum Hafen j transportiert werden soll, und mit x u bezeichnen wir die Ladefähigkeit der Schiffe, die vom Hafen izum Hafenjfahren. Die Größen x i ; und xu (i,j = 1, 2, ...,«) können wir in Matrizen darstellen.
21
§ 3. Koopmans' Transportproblem 0 x21
x,2
0 X„2
0
Xln x
2n
x12
X
21 0
0 J,
...
...
xin
•••
X
2n
Xn2
0 Die Unbekannten sind im vorliegenden Problem die Größen x t J (/,y'= 1,2, ...,«). Sie geben die Ladefähigkeit der Schiffe an, die vom Hafen i zum Hafen j zu leiten sind. Die Zielfunktion z drückt den Umfang der ungenutzten Transportkapazität aller Schiffe aus. Der Umfang der ungenutzten Transportkapazität zwischen Hafen i und Hafen j beträgt Folglich beträgt der Umfang an ungenutzter Kapazität auf sämtlichen Transportwegen (in Tonnenkilometern): z = ZX>;j(*i i j
j-Xij)
Das untersuchte Problem besteht also darin, daß z =
= i
Min
-
j
Die Nebenbedingungen, die die Unbekannten Xy erfüllen müssen, kann man als Bilanzbedingungen schreiben: ^xu=w, ( / = 1,2, ...,«) (1.5) sowie *L x u = PJ
0 ' = 1,2, . . . , « ) .
(1.6)
Die Gleichungen (1.5) besagen, daß der Gesamtumfang der Ladefähigkeit der Schiffe, die vom Hafen / zu allen anderen Häfen geleitet werden, gleich wt sein muß. Demgemäß bedeuten die Gleichungen (1.6), daß der Gesamtumfang der Ladefähigkeit der Schiffe, die in den Hafen j von allen übrigen Häfen einlaufen, gleich pj sein muß. Es ist zu beachten, daß — analog dem Transportproblem (Paragraph 2) — unter den n+n Bilanzbedingungen der Gleichungen (1.5) und (1.6) nur (2«—1) unabhängig sind. Das kommt daher, daß ^u'j = gilt. Das bedeutet, daß die Gesamtladefähigkeit der i j aus allen Häfen auslaufenden Schiffe gleich der Gesamtladefähigkeit 3
Lange, Optimale Entscheidungen
22
Kapitel I. Typische Modelle der Optimierungsrechnung
der in alle Häfen einlaufenden Schiffe ist. Da das Problem (n2—n) Unbekannte xu (i,j = 1, 2, ..., n) besitzt,7» und (2/j—1) unabhängige Bilanzbedingungen existieren, beträgt die Anzahl der Freiheitsgrade (n2—n)—(2n—l) = n2-3n+l. Neben den Bilanzbedingungen existieren noch Randbedingungen, die man so schreiben kann: 0.
(1.7)
Dabei besagt die Bedingung xu > xu> daß die Ladefähigkeit der von den Häfen i zu den Häfen j auslaufenden Schiffe größer oder gleich dem Umfang der Ladungen sein muß, die auf dieser Strecke transportiert werden sollen. Das ist die mathematische Darstellung des Koopmans'-Modells. Hieraus folgt, daß es sich um ein Problem der linearen Optimierung handelt, da sowohl die Zielfunktion z als auch die Bilanzbedingungen (1.5) und (1.6) in den Unbekannten xu linear sind. Das Problem läßt sich aber leicht in ein Schema der nichtlinearen Optimierung umformen. Man nehme nur an, daß die Transportkosten in Abhängigkeit von der Entfernung weniger als proportional ansteigen. Das untersuchte Programm kann man ebenfalls leicht durch das Dualprogramm ersetzen. Hierzu setzt man beispielsweise die Gesamtrentabilität aller Transporte im Weltmaßstab als Zielfunktion an. Das Problem der Minimierung ungenutzter Ladefähigkeit der Schiffe würde dann durch das Problem der Maximierung der Gesamtrentabilität der Transporte ersetzt. § 4. Zuteilungsprobleme Das Transportproblem erweist sich als Spezialfall einer allgemeineren Klasse von Problemen der Optimierung, die wir als Zuteilungsprobleme bezeichnen. Den allgemeinen Charakter dieser Probleme erläutern wir am Beispiel der Zuteilung von Maschinen für die 7 > Die Zahl der Unbekannten (;' = 1, 2 , . . . , n) ist im Prinzip n2, aber x¡j — 0, wenn i = j, d.h. wenn die Größe x¡¡ auf der Hauptdiagonalen der Matrix der Ladefähigkeiten der Schiffe liegt.
22
Kapitel I. Typische Modelle der Optimierungsrechnung
der in alle Häfen einlaufenden Schiffe ist. Da das Problem (n2—n) Unbekannte xu (i,j = 1, 2, ..., n) besitzt,7» und (2/j—1) unabhängige Bilanzbedingungen existieren, beträgt die Anzahl der Freiheitsgrade (n2—n)—(2n—l) = n2-3n+l. Neben den Bilanzbedingungen existieren noch Randbedingungen, die man so schreiben kann: 0.
(1.7)
Dabei besagt die Bedingung xu > xu> daß die Ladefähigkeit der von den Häfen i zu den Häfen j auslaufenden Schiffe größer oder gleich dem Umfang der Ladungen sein muß, die auf dieser Strecke transportiert werden sollen. Das ist die mathematische Darstellung des Koopmans'-Modells. Hieraus folgt, daß es sich um ein Problem der linearen Optimierung handelt, da sowohl die Zielfunktion z als auch die Bilanzbedingungen (1.5) und (1.6) in den Unbekannten xu linear sind. Das Problem läßt sich aber leicht in ein Schema der nichtlinearen Optimierung umformen. Man nehme nur an, daß die Transportkosten in Abhängigkeit von der Entfernung weniger als proportional ansteigen. Das untersuchte Programm kann man ebenfalls leicht durch das Dualprogramm ersetzen. Hierzu setzt man beispielsweise die Gesamtrentabilität aller Transporte im Weltmaßstab als Zielfunktion an. Das Problem der Minimierung ungenutzter Ladefähigkeit der Schiffe würde dann durch das Problem der Maximierung der Gesamtrentabilität der Transporte ersetzt. § 4. Zuteilungsprobleme Das Transportproblem erweist sich als Spezialfall einer allgemeineren Klasse von Problemen der Optimierung, die wir als Zuteilungsprobleme bezeichnen. Den allgemeinen Charakter dieser Probleme erläutern wir am Beispiel der Zuteilung von Maschinen für die 7 > Die Zahl der Unbekannten (;' = 1, 2 , . . . , n) ist im Prinzip n2, aber x¡j — 0, wenn i = j, d.h. wenn die Größe x¡¡ auf der Hauptdiagonalen der Matrix der Ladefähigkeiten der Schiffe liegt.
§ 4. Zuteilungsprobleme
23
Verrichtung gewisser elementarer Tätigkeiten bei der Maschinenteilebearbeitung Nehmen wir an, es stünden m Maschinen bereit, die n verschiedene Tätigkeiten (Drehen, Bohren, Schleifen usw.) verrichten können, und wir sollten mit Hilfe dieser Maschinen eine Reihe von Objekten bearbeiten (zum Beispiel irgendwelche Maschinenteile). Es geht nun darum, wie diese Objekte den einzelnen Maschinen zuzuteilen sind, damit der größte Gesamteffekt erzielt wird. Mit w y bezeichnen wir die Produktivität der Maschine / bei Verrichtung der Tätigkeit j. Diese Produktivität muß irgendwie gemessen werden, beispielsweise in Geldeinheiten. wtJ nennt dann den Geldwert des Effektes, den beispielsweise eine einstündige Arbeit der Maschine i bei Verrichtung der Tätigkeit j erzielt. Die Werte vvy (i = 1, 2, ..., ..., m; j = 1,2, ...,«) kann man in der Produktivitätsmatrix erfassen: " w
n
w,
2
W'21 vv22
...
w
...
w2„
l B
"
Lw.m wm2 ... ivm„J. Die Unbekannten sind in diesem Problem die Größen xtJ (i = 1,2, ...,m;j = 1,2, ..., n), die angeben, wie lange die Maschine i die Tätigkeit j ausführen soll. Diese Unbekannten, deren Anzahl m • n ist, kann man in der Zuteilungsmatrix der Tätigkeiten erfassen: Xu X\i ... X
2l
xln
X
22 ••• X2n
_xm 1 xm2 ••• xmn J* Der Wert des Arbeitseffektes der Maschine i bei Verrichtung der Tätigkeit j wird als Produkt der Produktivität der jeweiligen Maschine mit ihrer Arbeitszeit ausgedrückt: w^Xy. Der Gesamtwert des Arbeitseffektes aller Maschinen beträgt demzufolge z — X ^ f y ^ j - Das Problem besteht in der Maximierung der so bestimmten Zielfunktion: i j 3;
24
Kapitel I. Typische Modelle der Optimierungsrechnung
Bestimmen wir nun die Nebenbedingungen, die in diesem Problem auftreten. Wir bemerken zunächst, daß jede Maschine i (i = 1,2 ...,m) im Untersuchungszeitraum eine bestimmte maximale Laufzeit besitzt (z.B. während eines Tages, einer Woche usw.). Die Gesamtlaufzeit der j-ten Maschine, die zur Verrichtung von Tätigkeiten j = 1, 2, ..., n, d.h. Y^Xfj, aufgewendet wird, muß demzufolge j
di betragen. Daraus erhalten wir die erste Bilanzbedingung des Problems: 5 > y j
=
ai
(i
= 1, 2, ...,
m).
(1.8)
Diese Gleichungen (1.8) müssen durch Ungleichungen der Form ( i = 1,2, ...,m)
(1.8.1)
i
ersetzt werden, wenn wir die Möglichkeit einer unvollständigen Ausnutzung der maximalen Maschinenlaufzeit zulassen. Die zweite Gruppe der Bilanzbedingungen bilden die Gleichungen i
=
( y = 1,2,...,»).
(1.9)
Sie besagen, daß jede Tätigkeit j auf einer beliebigen Maschine i verrichtet werden kann, aber nur während einer im voraus begrenzten Zeit bj, d.h. in der Zeit bj muß die Tätigkeit j abgeschlossen werden. Demnach muß also die Zielfunktion z unter Einhaltung der Gleichungen (1.8) und (1.9), deren Anzahl (/n+n) beträgt, maximiert werden. Man kann leicht überprüfen, daß auch in diesem Fall die Anzahl der unabhängigen Gleichungen um 1 geringer ist und {m+n— 1) beträgt. Aus den Bedingungen des Problems geht tatsächlich hervor, daß die Laufzeit sämtlicher Maschinen bei Verrichtung jedweder Tätigkeit gleich sein muß: 1. der Summe der maximalen Maschinenlaufzeit sämtlicher Maschinen, d.h.
y = ! V J
i
J
Aus den letzten beiden Gleichungen folgt j i Es sind also nur m + « — 1 Gleichungen, die hier als Bilanzbedingungen fungieren, linear unabhängig; die n-te Bilanzbedingung kann aus ihnen bestimmt werden. Da m • n Unbekannte auftreten, besitzt das Problem demnach m - n — ( m + n — 1) Freiheitsgrade.
Die Randbedingungen des Problems legen fest, daß die Unbekannten, die die Verteilung der Tätigkeiten bestimmen, nicht negativ sein können: ( / = 1,2, 1,2, . . . , « ) . (1.10) 0 Das dargestellte Schema der Maschinenzuteilung kann sinngemäß auf viele andere Probleme der Theorie der Optimierungsrechnung übertragen werden, beispielsweise auf die Zuteilung von Ackerflächen mit unterschiedlicher Produktivität für den Anbau verschiedener Kulturen (Weizen, Rüben, Kartoffeln usw.) oder auf die Zuteilung von Arbeitern mit unterschiedlicher Qualifikation zur Verrichtung bestimmter Tätigkeiten. Bei der Zuteilung von Ackerflächen für verschiedene Anbaukulturen bedeuten die unbekannten Größen xu die Hektarzahl der Ackerfläche i (i = 1, 2, ..., m), die für den Anbau der Kultur j (j = 1,2, . . . , « ) vorgesehen ist. Die Gesamtgröße der Ackerfläche i wird mit at bezeichnet. Die bereitgestellte Fläche für den Anbau der Kultur j bezeichnen wir mit bj. Die Produktivität der Ackerfläche i für den Anbau der Kultur j , d.h. w i} , muß auch in diesem Fall in Geldeinheiten ausgewiesen werden, um die Produktivitäten miteinander vergleichen und eine geeignete Zielfunktion formulieren zu können. Als Zielfunktion kann beispielsweise das Gesamteinkommen aus der vorhandenen Ackerfläche dienen. Man kann auch hierfür das Dualprogramm aufstellen. Man nimmt dann an, daß das Einkommen aus der vorhandenen Ackerfläche von vornherein festliegt und konstant ist, und untersucht, wie die einzelnen Ackerflächen für die verschie-
26
Kapitel I. Typische Modelle der Optimierungsrechnung
denen Kulturen zu verwenden sind, damit die Anbaukosten so niedrig wie möglich bleiben. Bei der Zuteilung von m Beschäftigten eines Betriebes auf die Verrichtung von n Tätigkeiten besagen die unbekannten Größen Xfj, wieviel Zeiteinheiten (zum Beispiel Stunden) der Arbeiter i für die Tätigkeit j eingesetzt sein wird. Die Produktivität wu bezeichnet den Geldwert des Arbeitseffektes des Beschäftigten i, der in der jeweiligen Zeiteinheit die Tätigkeit j verrichtet. Das Problem besteht in einer solchen Bestimmung der Größen (i = 1,2, ..., m\ j — 1,2,...,«), d.h. in einer solchen Zuweisung der Arbeiter auf die einzelnen Tätigkeiten, daß der Wert der von ihnen ausgeführten Arbeiten maximal ist. Besonders interessant ist dabei der Fall, bei dem n = m ist, d.h. bei dem die Anzahl der verschiedenen Tätigkeiten gleich der Anzahl der Arbeiter ist. Das ist ein Problem, das man als Problem „der richtige Mann am richtigen Platz" bezeichnen kann. Das Zuteilungsproblem demonstrieren wir noch an einem Beispiel, das wir einer Arbeit Prof. W. Sadowskis entnommen haben.8) Wir nehmen an, daß einer mechanischen Werkstatt 3 Drehbänke MI, M2 und M3 zur Verfügung stehen, auf denen 4 verschiedenartige Einzelteile DU D2, D3, D 4 hergestellt werden können. Die technischen Bedingungen zur Herstellung dieser Einzelteile auf den verschiedenen Maschinen sind im mittleren Teil der folgenden Tabelle enthalten. Die Elemente ci} seien bekannt und bezeichnen die notwendige Zeit für die Fertigung des j-ten Einzelteiles auf der i-ten Maschine: iJ MI M2 M3
DI
D2
D3
D4
a-,
0,5 1.0 0,8
0,6 0,7 0,9
0,2 0,1 0,3
1,5 1,1 0,9
3000 2500 2800
bj
100
500
2000
1000
C
•I W. Sadowski, Krôtki rys rozwoju badan operacyjnych (Kurzer Abriß der Entwicklung der Unternehmensforschung), in dem Buch: Metody matematyczne w organizacji i ekonomice przedsiçbiorstwa (Mathematische Methoden in der Organisation und Ökonomik der Betriebe), PWE, Warszawa 1960, S. 16 ff.
27
§ 4. Zuteilungsprobleme
Die Tabelle enthält noch eine zusätzliche Spalte, in der die maximal möglichen Zeiten a ; (i = 1, 2, 3) für die Auslastung der einzelnen Maschinen während eines gewissen Zeitraums, z.B. eines Jahres, angegeben sind. In einer zusätzlichen Zeile sind die geforderten Mengen bj ( j = 1, 2, 3, 4) der Einzelteile Dl, D2, D3 and D4 angegeben. Die Größen ctJ und ai sind in Stunden und bj in Stück ausgedrückt. Das Problem besteht darin, die Produktion der Einzelteile optimal auf die einzelnen Maschinen zu verteilen. Die Größen x ( j , die die Menge des auf der i-ten Maschine hergestellten Einzelteiles j bezeichnen, sind dabei so zu ermitteln, daß die Veränderliche z — das ist die Gesamtlaufzeit aller Maschinen — so niedrig wie möglich wird, daß also z =
0,5x11+0,6xi2+0,2x13+1,5a-14+1,0x21+0,7x22+0,lx23+ +
1,1*24+0,8jc
3 1
+0,9*32+0,3*33+0,9*34
=
Min.
Unterstellen wir, daß die Maschinenkosten proportional zur Laufzeit anwachsen, so gibt z multipliziert mit einem konstanten Faktor — der keinen Einfluß auf die Lösung der Aufgabe hat — die Bearbeitungskosten aller Einzelteile an. Sind die Bearbeitungskosten (für eine Zeiteinheit, zum Beispiel für 1 Stunde) für die Maschinen verschieden und betragen s i e p \ , p 2 u n d p 3 , dann muß man die Glieder der Summe, die den Wert z bestimmen, m i t p i , p 2 u n d p } multiplizieren. Die Bilanzbedingungen des ersten Typs haben in diesem Beispiel folgende Form: *11 + *21+*31 *12+*22+*32 *13 + *23 + *33 *14 + *24+*34
= 100 = 500 = 2 000 = 1000,
die Bilanzbedingungen des zweiten Typs lauten: 0 , 5 * „ + 0 , 6 * u + 0 , 2 * J 3 + 1 , 5 * 1 4 < 3000 1 , 0 * 2 1 + 0 , 7 * 2 2 + 0 , 1 * 2 3 + 1 , 1 * 2 4 < 2500
0,8*3I+0,9*32+0,3*33+0,9*3 4 < 2800 und die Randbedingungen: xtJ>
0
( i = 1,2,3; j =
1,2,3,4).
28
Kapitel I. Typische Modelle der Optimierungsrechnung
Die in den Bilanzbedingungen des zweiten Typs enthaltenen Ungleichungen besagen, daß die Laufzeiten der einzelnen Maschinen nicht vollständig ausgenutzt werden müssen. § 5. Mischungsprobleme Es existiert noch eine große Klasse von Problemen der Optimierungsrechnung, die mit dem gemeinsamen Begriff Mischungsprobleme oder Substitutionsprobleme bezeichnet werden. Wir besprechen diese Modelle der Theorie der Optimierungsrechnung an einem einfachen Beispiel des sogenannten Diätproblems, das historisch zu den am frühesten mit Methoden der Optimierungsrechnung gelösten Problemen zählt. 9) Eine Gruppe von Personen (z.B. eine Abteilung Soldaten) sei zu ernähren. Hierfür werden m Lebensmittel (Brot, Fleisch, Gemüse usw.), die in verschiedenen Anteilen n unterschiedliche Nährstoffe (Protein, Kohlehydrate, Vitamine usw.) enthalten, bereitgestellt. Es sei üij (/' = 1, 2, ..., m; j = 1, 2, ...,«) die Menge des j'-ten Nährstoffs, die in der Gewichtseinheit des /-ten Lebensmittels enthalten ist (zum Beispiel 2 Milligramm Vitamine in 1 kg Tomaten). Wir nehmen weiter an, daß die Einheitspreise der Lebensmittel Pt (i — 1, 2, ..., m) betragen und jede Person im gegebenen Zeitraum (zum Beispiel je Tag) mindestens die Menge b} ( j = 1,2, ...,«) des Nährstoffes j erhalten muß. Das Problem besteht darin, die billigste Diät zu ermitteln, d.h. die Lebensmittelmengen X\y " ' ) -X/n SO Zll kombinieren, daß die Zielfunktion z — die Einkaufskosten — minimal wird, daß also 2 = YiPiXi = I
Min
"
Die Zielfunktion z ist unter Einhaltung der Bilanzbedingungen m
Y.ai]xJ>b] i
(j=
1,2,
...,n)
*' Das Diätproblem und seine Lösung an einem einfachen Beispiel, bei dem m = 2 und n = 2, ist dargestellt in dem Buch von O. Lange, Einführung in die Ökonometrie, a.a.O., S. 248 ff.
28
Kapitel I. Typische Modelle der Optimierungsrechnung
Die in den Bilanzbedingungen des zweiten Typs enthaltenen Ungleichungen besagen, daß die Laufzeiten der einzelnen Maschinen nicht vollständig ausgenutzt werden müssen. § 5. Mischungsprobleme Es existiert noch eine große Klasse von Problemen der Optimierungsrechnung, die mit dem gemeinsamen Begriff Mischungsprobleme oder Substitutionsprobleme bezeichnet werden. Wir besprechen diese Modelle der Theorie der Optimierungsrechnung an einem einfachen Beispiel des sogenannten Diätproblems, das historisch zu den am frühesten mit Methoden der Optimierungsrechnung gelösten Problemen zählt. 9) Eine Gruppe von Personen (z.B. eine Abteilung Soldaten) sei zu ernähren. Hierfür werden m Lebensmittel (Brot, Fleisch, Gemüse usw.), die in verschiedenen Anteilen n unterschiedliche Nährstoffe (Protein, Kohlehydrate, Vitamine usw.) enthalten, bereitgestellt. Es sei üij (/' = 1, 2, ..., m; j = 1, 2, ...,«) die Menge des j'-ten Nährstoffs, die in der Gewichtseinheit des /-ten Lebensmittels enthalten ist (zum Beispiel 2 Milligramm Vitamine in 1 kg Tomaten). Wir nehmen weiter an, daß die Einheitspreise der Lebensmittel Pt (i — 1, 2, ..., m) betragen und jede Person im gegebenen Zeitraum (zum Beispiel je Tag) mindestens die Menge b} ( j = 1,2, ...,«) des Nährstoffes j erhalten muß. Das Problem besteht darin, die billigste Diät zu ermitteln, d.h. die Lebensmittelmengen X\y " ' ) -X/n SO Zll kombinieren, daß die Zielfunktion z — die Einkaufskosten — minimal wird, daß also 2 = YiPiXi = I
Min
"
Die Zielfunktion z ist unter Einhaltung der Bilanzbedingungen m
Y.ai]xJ>b] i
(j=
1,2,
...,n)
*' Das Diätproblem und seine Lösung an einem einfachen Beispiel, bei dem m = 2 und n = 2, ist dargestellt in dem Buch von O. Lange, Einführung in die Ökonometrie, a.a.O., S. 248 ff.
§ 5. Mischungsprobleme
29
— diese Bedingungen entspringen den Diätansprüchen und besagen, daß die in den insgesamt bezogenen Lebensmitteln enthaltene Menge m
des Nährstoffes j, Y.aux., i
nicht geringer als bj 0 = 1 , 2 , . . . , « )
sein darf — sowie unter den Randbedingungen xt>0
(i = 1 , 2 ,
...,m)
zu minimieren. Man muß noch hinzufügen, daß das theoretisch schon während des II. Weltkrieges gelöste Diätproblem keine größere praktische Anwendung für die menschliche Ernährung fand. Vermutlich haben sich die auf diese Art ermittelten Diäten als zu wenig abwechslungsreich erwiesen. Die beschriebene Methode wird aber bei der Tierhaltung angewendet. Wir verwiesen darauf, daß die Ermittlung der billigsten Diät ein Spezialfall des allgemeinen Mischungsproblems ist. Er entsteht immer dann, wenn es möglich ist, verschiedene Gebrauchswerte mit ähnlichen Eigenschaften zu mischen und wechselseitig auszutauschen. Ein typisches Beispiel hierfür ist die Ermittlung des wirtschaftlichsten Benzingemischs für Kolben- und Düsenmotore. Bekanntlich gibt es verschiedene Benzinsorten. Sie unterscheiden sich durch die Menge der erzeugten Wärmeenergie und Temperatur, durch den Grad der Verunreinigung usw. Es gilt, die billigste Mischung dieser Benzinsorten unter der Bedingung zu finden, daß gewisse mengenmäßige Merkmale dieser Mischung größer (oder kleiner) als bestimmte vorgegebene Größen sind. Ähnlich gestaltet sich das Problem zur Herstellung der wirtschaftlichsten Mischung verschiedener Kohlesorten für die Beheizung von Dampfkesseln usw. Das Mischungsproblem ist gleichsam ein gewisser Typ des Substitutionsproblems, das den Ersatz des einen Produktionsmittels durch ein anderes bezweckt, um einen optimalen Produktionseffekt zu gewährleisten.
30
Kapitel I. Typische Modelle der Optimierungsrechnung
§ 6. Das dynamische Problem—Produktionsablauf und Vorräte Das Problem des Produktionsablaufs und der Vorratsbildung sowie einige im folgenden zu behandelnde Probleme gehören zu den Aufgaben, mit denen sich die sogenannte dynamische Optimierung befaßt. Es geht in diesem Paragraphen um folgendes Problem: wie können Produktion und Vorräte über die Zeit optimal so verteilt werden, daß der während eines bestimmten Zeitraums, 10) beispielsweise während eines Jahres, auftretende Bedarf befriedigt wird. Ein Betrieb erzeuge ein Produkt (Kunstdünger, Zement, Bier usw.), dessen Bedarf Saisonschwankungen unterliegt.11* Die Saisonverteilung des Bedarfs sei bekannt; er betrage für die einzelnen Monate des Jahres bu b2, b3, ..., bl2. Die Vorratshöhe zu Beginn des ersten Monats sei mit s 0 > 0 gegeben. Die Produktion des Betriebes in den einzelnen Monaten bezeichnen wir mit X
2, X3> •••> X12•
Wenn im Monat i über Bedarf produziert wird > ¿¡), dann wird der Vorrat um xt—bt erhöht. Wird dagegen in diesem Monat 10
> Im Gegensatz zu den dynamischen Problemen bezeichnet man die Probleme, die sich nicht auf die Verteilung der unbekannten Größen in der Zeit beziehen, als statische Probleme. Beispiele für statische Probleme sind die bereits erörterten Aufgaben. Die Erhöhung der Produktion und die daraus folgende Vorratsbildung muß nicht nur aus den Saisonschwankungen herrühren. Wir geben ein Beispiel: Im Fünfjahrplan sei der Gesamtbedarf an Zement vorgegeben. Danach ist die Produktion auf die einzelnen Jahre aufzuschlüsseln. Man kann dabei mechanisch vorgehen und annehmen, Produktionsumfang und Bedarf stimmten in den einzelnen Jahren völlig überein. Das wäre aber falsch, falls sich der Bedarf nicht gleichmäßig über die Zeit verteilt und beispielsweise im vierten Planjahr besonders hoch ist. Es kann sich unter diesen Umständen auszahlen, in den Berechnungen schon für die ersten Planjahre eine schrittweise Produktionserhöhung vorzusehen und für die Befriedigung des außerordentlichen Bedarfs im vierten Jahr Vorräte zu schaffen, statt gerade in diesem Planjahr die Produktion zu forcieren.
§ 6. Produktionsablauf und Vorräte
31
unter Bedarf produziert, (xt < ¿,), dann muß das Produktionsdefizit im Umfang £>f—xt aus den Vorräten abgedeckt werden. Ferner bezeichnen wir die Kosten für die Erhöhung der Produktion um eine Einheit während eines Monats mit ci,
c2,
c3,
...,
c
u
und die Lagerkosten für eine Erzeugniseinheit mit fl> r2> ri> •••» r12In die Lagerkosten kann auch die Verzinsung der in den Vorräten blockierten Finanzmittel des Betriebes eingehen. Die Kosten für die Produktionserhöhung um eine Einheit ct (i = 1,2, ..., 12) können für die einzelnen Monate verschieden sein und auch vom Grad der Produktionserhöhung abhängen. Der monatliche Zuwachs der Vorräte beträgt st = x{—b{ und der Zuwachs der Produktion beträgt z ; = X j — M a n muß noch hinzufügen, daß der Zuwachs st und z; (i = 1, 2, ..., 12) negativ oder gleich Null sein kann. Wenn s t < 0, so erfolgte im gegebenen Monat ein „negativer Zuwachs", also ein Rückgang der Bestände. Ist zf < 0, so lag die Produktion im Monat i unter der des Vormonats /—1. Wenn wir der Einfachheit halber annehmen, daß c, weder von z,- noch vom Produktionsniveau abhängt, betragen die (positiven oder negativen) Kosten für die Produktionsveränderung im Monat i c, zt und belaufen sich über sämtliche Monate auf ][]cjZj. Die Gesamti
kosten für die Produktionserhöhung und die Lagerung des Zuwachses der Produktionsvorräte betragen dann: z = XcfZf+ X/.J; = i
i
JVfOi-^)i
I
Das Problem besteht in der Aufstellung eines solchen Produktionsprogramms, bei dem die soeben bestimmten Gesamtkosten des Betriebes z minimal sind. Die Bilanz- und Randbedingungen bilden folgende Gleichungen und Ungleichungen: x,-bt = s,
( i = 1,2, ..., 12),
(1.11)
32
Kapitel I. Typische Modelle der Optimierungsrechnung
s0+isk>0 Xi
>0
( i = l , 2 , ...,12),
(1.12)
( / = 1,2, ...,12).
(1.13)
Der Sinn der Bedingung (1.11) wurde bereits erläutert. Aus dieser Bedingung folgt einfach, daß der Zuwachs an Vorräten s( dadurch bestimmt wird, daß man von der Produktion xt den im selben Zeitraum erfolgten Verbrauch bt abzieht. Die Bedingung (1.12) besagt, daß der Umfang der Vorräte in keinem Monat negativ sein darf, i
s0 ist der Anfangsbestand des Lagers und die Summe £ sk weist aus, k= 1
welcher Vorrat zusätzlich entstanden ist oder um wieviel sich der Vorrat vom Anfang des Jahres bis zum Ende des i-ten Monats verringert hat. Die Bedingung (1.13) ist natürlich, denn die Produktion kann in keinem Monat negativ sein. Die Lösung des in dieser Weise mathematisch formulierten dynamischen Problems der Produktion und der Vorräte führt auf die Bestimmung der Produktionshöhe in den einzelnen Monaten, x¡(i = 1,2,..., ..., 12), da die Höhe des monatlichen Bedarfs, ¿¡, die entsprechenden Kosten der Produktionserhöhung um eine Einheit, und die Kosten
Zeichnung 1.1
Analysieren wir die Lösung dieser Aufgabe näher, deren graphische Interpretation mit Hilfe eines entsprechenden Histogramms in der Zeichnung 1.1 dargestellt ist. Dieser Zeichnung ist zu entnehmen, daß ein Produktionsvorrat dann entsteht, wenn die „Säule der Produktion" höher ist als die
§ 6. Produktionsablauf und Vorräte
33
„Säule des Bedarfs" > ¿¡). In den Monaten, in denen die Situation umgekehrt ist, d.h. wenn die Größe bt die entsprechende Größe xt übersteigt, wird dieser Teil des Bedarfs aus dem Anfangsbestand oder aus den in den voraufgehenden Monaten entstandenen Überhängen gedeckt. Unterstellen wir einmal, es entstünden keine Lagerkosten, r t = 0, wohl aber Kosten der Produktionsveränderung, also c ; > 0. Dann wäre ein solches Programm optimal, bei dem die Produktionshöhe konstant bliebe. Natürlich müßte die Produktion auf einem solchen Niveau festgelegt werden, daß in keinem Monat ein Produktionsdefizit entstehen kann, also die laufende Produktion zusammen mit den früher erzeugten Vorräten den monatlichen Bedarf befriedigt. Nehmen wir nun umgekehrt an, es entstünden keine Kosten der Produktionsveränderung, c ; = 0, wohl aber Lagerkosten, also r, > 0. Dann wäre ein solches Programm optimal, bei dem in jedem Monat genau soviel produziert wird, wie man in diesem Zeitraum benötigt. In Wirklichkeit entstehen in der Regel sowohl Lagerkosten für die Vorräte als auch Kosten durch die Veränderung der Produktionshöhe. Es muß demnach einen Kompromiß zwischen den genannten extremen Situationen geben. Er besteht in einem optimalen Produktionsprogramm, das durch die Produktionshöhen x{{i — 1, 2,..., 12) bestimmt wird, die ein Minimum der Gesamtkosten für die Vorratslagerung und die Produktionsveränderung sichern. Die Produktion folgt irgendwie dem Bedarf und paßt sich (wenn auch nicht vollständig) dem erwarteten Bedarf an. Je geringer die Lagerkosten sind, desto ausgeglichener gestaltet sich die Produktion in den einzelnen Monaten (d.h. sie weist nur eine geringe Oszillation um ein gewisses Niveau auf). Sind umgekehrt die Kosten der Produktionsveränderung gegenüber den Lagerkosten gering, dann paßt sich die Produktionshöhe in den einzelnen Monaten sehr eng dem Bedarf an. Unter Hinweis auf die in den folgenden Kapiteln enthaltenen Untersuchungen zur dynamischen Optimierung lenken wir unser Augenmerk auf gewisse Erscheinungen, die mit dem in diesem Paragraphen dargestellten Problem des Produktionsablaufes und der Vorratsbildung zusammenhängen. Bislang haben wir unterstellt,
34
Kapitel I. Typische Modelle der Optimierungsrechnung
daß die Höhe des Bedarfs in den einzelnen Monaten, Z>( (/ = 1,2, ..., 12), bei Aufstellung des Produktionsprogramms bekannt ist. Ebenfalls bekannt sind die Lagerkosten je Einheit, rit und die Kosten der Veränderung der Produktionshöhe um eine Einheit, c ; . Wenn, wie in einer solchen Situation, die Parameter des Problems im voraus vorgegeben sind, sprechen wir von einem Programm, das unter Gewißheit aufgestellt wurde.*' Häufig jedoch, insbesondere bei Modellen der dynamischen Optimierung, die auf die künftige Verteilung von Vorräten und Bedarf abzielen, sind nicht alle die Zukunft betreffenden Parameter bekannt und bestimmbar. So können beispielsweise beim Problem der Produktion und Vorräte die Größen des künftigen Bedarfs für die einzelnen Monate aus Erfahrungswerten der vergangenen Jahre geschätzt werden, aber diese Vorhersagen müssen nicht immer eintreten.12) Das gleiche kann die Lagerkosten r{ und die Kosten der Veränderung der Produktionshöhe ct betreffen. Insbesondere unter den Bedingungen der kapitalistischen Wirtschaft können die Schwankungen dieser Parameter erheblich sein. Derartige Situationen treten in der Regel bei der dynamischen Optimierung auf, und es erhebt sich dann ein neues grundlegendes Problem, nämlich wie das optimale Programm unter Ungewißheit aufzustellen ist. Das Problem der Optimierung des Produktionsablaufes und der Vorratsbildung kann man—ähnlich wie andere Modelle der dynamischen Optimierung — auch als stetiges Modell formulieren, das die in der Zeit ablaufenden Prozesse vom Zeitpunkt / = 0 bis zum Zeitpunkt t = T widerspiegelt. Zu diesem Zweck unterstellt man, daß die Größen der Produktion und des Bedarfs, die Lagerkosten *' Es handelt sich also um ein deterministisches Modell. Vgl. Anmerkung zum Vorwort. 12 > Beispiel einer solchen Situation kann die Festlegung des Bedarfs für Bier an Hand von Daten vergangener Jahre sein. Es kann jedoch eintreten — z.B. infolge eines außergewöhnlich kühlen Sommers — , daß der tatsächliche Bedarf ausnahmsweise niedrig liegt und damit vom durchschnittlichen Bedarf der vergangenen Jahre bedeutend abweicht.
§ 7. Lagerung von Waren
35
und die Kosten der Veränderung der Produktionshöhe stetige Funktionen der Zeit sind. Bezeichnet man diese Funktionen entsprechend mit x(t), b(t), r(t) und c(f) und setzt s(t) = x(t)—b(t), dann kann man das stetige Modell der dynamischen Optimierung der Produktion und Vorräte folgendermaßen formulieren: Es ist die stetige Funktion der Produktionsverteilung in der Zeit, x(t), im Intervall (0,7") so zu bestimmen, daß die Gesamtkosten der Veränderung der Produktionshöhe und der Vorratslagerung im Zeitraum t = 0 bis t = T minimal sind, also daß13) T
z = $ c(t)dx(t)+
0
T
$ r(t)s(t)dt
0
= Min.
unter Einhaltung der Nebenbedingungen k
¿o+ 5 s(t)dt > 0 für alle k < T o und der Randbedingungen x ( / ) > 0 für
0 Die reine Zweigeffektivität der Investitionen bezeichnet den Zuwachs des Nettoproduktes im /-ten Zweig der Volkswirtschaft, der auf eine Einheit der
42
Kapitel I. Typische Modelle der Optimierungsrechnung AY-
ßi = —z-1 0 = 1, 2, ..., n). Dann können wir für den Zuwachs des H Nationaleinkommens schreiben: AY=
±AYt=
tßJi-
¡=1 i=i i< i=i Das zu lösende Problem besteht in der Maximierung des Zuwachses des Nationaleinkommens. Er entspricht der gewogenen Summe der Investitionen in den einzelnen Zweigen, wobei die reinen Zweigeffektivitäten der Investitionen die Gewichte sind. Überlegen wir uns jetzt, welche Beschränkungen bei dem gegebenen Problem auftreten. Wir bemerken zunächst, daß man für Investitionen nicht mehr als das Endprodukt eines jeden Zweiges einsetzen kann; würde man aber das gesamte Endprodukt verwenden, so verbliebe nichts für den Verbrauch und den Export. Deshalb unterstellen wir, daß in jedem Zweig eine gewisse maximale Menge Endprodukt festgelegt worden ist, die man für Investitionen verwenden kann. Diese maximale Menge bezeichnen wir mit q¡ ( j = 1, 2, ..., n). Bekanntlich existieren bestimmte Investitionskoeffizienten bj¡. Sie geben an, welche Menge des Produktes des j-ten Zweiges für die Erhöhung des Nettoproduktes des ¡'-ten Zweiges um eine Einheit notwendig ist.20) Die Koeffizienten bj¡ ordnet man gewöhnlich in Form einer Matrix an: 'bn bn
bn
.
•
b2z • •
blnb2n
A i bn 2 • Investitionen in diesem Zweig entfällt. Die Größen, von denen hier die Rede ist, werden in Geldeinheiten gemessen. Andernfalls wäre es unmöglich, sie zusammenzufassen und miteinander zu vergleichen. 20) Diese Koeffizienten unterscheiden sich von den Investitionskoeffizienten, von denen in dem Buch von O. Lange, Einführung in die Ökonometrie, a.a.O., S. 276 ff. die Rede ist. Dort bezeichnen sie den Investitionsaufwand, der notwendig ist, um das Bruttoprodukt des jeweiligen Zweiges um eine Einheit zu erhöhen. Die hier auftretenden Koeffizienten bezeichnen dagegen den Investitionsaufwand, der erforderlich ist, um das Nettoprodukt des Zweiges um eine Einheit zu erhöhen.
§ 9. Optimierung der Investitionen — Investitionsrichtungen
43
Unter Verwendung der Koeffizienten bß kann man die Produktionsmenge des y'-ten Zweiges, die f ü r die Erhöhung der Nettoproduktion des j-ten Zweiges u m AYt notwendig ist, als byi AYt ausdrücken. Daraus folgt, daß die Produktionsmenge des y'-ten Zweiges, die f ü r die Erhöhung des Nettoproduktes in allen Zweigen der Volkswirtschaft um AYly AY2> ..., AY„ notwendig ist, t V ^ /=1
beträgt. Die Bilanzbedingungen des betrachteten Problems kann man demnach als folgende Ungleichungen formulieren: £ bjiAYi < q j
/= i
0 =1,2,...,«)
(a)
oder wenn wir die Koeffizienten der reinen Zweigeffektivitäten der Investitionen verwenden: £ bjiß-Ji < qj i=i
( j = 1,2,...,«).
(a')
Wir stellen noch eine zusätzliche Bedingung. Die Gesamtsumme n
der Investitionen I = Y. h i=i
nämlich kleiner sein als der Gesamtn
wert der für Investitionen bestimmten Produkte £ q}. Das kann i man so schreiben: (b)
j-1
Diese Bedingung ist notwendig, damit das Problem der Auswahl der n
Investitionsrichtungen überhaupt existiert. Wäre nämlich I =
q}, j=i dann würden die Bedingungen (a') den Charakter von Gleichungen annehmen. In diesem Falle wäre die Höhe der Investitionen /; in den einzelnen Zweigen durch diese Gleichungen eindeutig bestimmt. N u r wenn die Gesamtsumme der Investitionen kleiner ist als die Gesamt-
44
Kapitel I. Typische Modelle der Optimierungsrechnung
menge der für Investitionszwecke bereitstehenden Endprodukte existiert ein echtes Problem der Optimierung. Wir bestimmen den Zuwachs des Nationaleinkommens mit Hilfe der Koeffizienten der Zweigstruktur der Investitionen in der Volkswirtschaft Aj, A2, ..., l n in folgender Weise n
A Y = Y ,
i=1
n
ßih
=
' S
n
/= 1
ßij-
=
1=1
ßih.
Nun können wir das Problem der Festlegung optimaler Investitionsrichtungen so formulieren: Ein Investitionsprogramm ist durch die Menge nichtnegativer Zahlen X lt A2, ..., A„ derart zu bestimmen, daß unter Einhaltung der Bedingungen (a') und (b) AY=
¡=1
ß,kt =
Max.
Darüber hinaus ist zu beachten, daß die Summe der Koeffizienten ¿i, die die Investitionsstruktur kennzeichnen, entsprechend der n
Definition dieser Koeffizienten gleich eins ist, also £ A; = 1. (=i Die Nebenbedingung (a') kann man noch anders formulieren. Dividiert man beide Seiten der Ungleichungen (a') durch I, so ergibt sich nämlich n
/=i
(7=
1,2,...,«).
Wir bemerken noch, daß das Maximum für den Zuwachs des Nationaleinkommens AY = /¿TM; mit denselben Werten Alf k2, ..., ..., X„ erreicht wird wie das Maximum des Ausdrucks 21 '
i=l
M .
21> Der konstante Faktor I spielt bei der Bestimmung der Extremwerte des vorliegenden Ausdrucks keine Rolle.
§ 9. Optimierung der Investitionen — Investitionsrichtungen
45
Dem Ausdruck —j- kann man eine gewisse ökonomische Deutung AY geben, - p - drückt die gesamte reine Effektivität der Investitionen in der Volkswirtschaft aus und entspricht der Summe der gewichteten reinen Zweigeffektivitäten der Investitionen. Das ist aber das gewogene Mittel der reinen Zweigeffektivitäten der Investitionen, wobei als Gewichte die Koeffizienten der Zweigstruktur der Investitionen n
¿2> •••> K dienen. Aus der Bedingung £
= 1 folgt tatsächlich,
daß ,v
»
E ßih
®r(xu
x2, ..., x„) = c r
(r = 1,2, ...,m)
(2.2)
(r = 1,2, ...,m)
(2.2a)
oder als Bilanzungleichungen &r(xux2,
...,xn)
0, ist eine vereinfachende Annahme. Ist z < 0, dann kann man durch eine geeignete Transformation des Koordinatensystems stets erreichen, daß z > 0 wird. Die Bedingung > 0 (/ = 1, 2 , . . . , « ) resultiert entweder aus dem Charakter dieser Größen oder aus einer entsprechenden Wahl des Koordinatensystems. Der Zielfunktion z unterstellen wir überdies, daß sie stetige partielle erste und zweite Ableitungen besitzt und eine steigende Funktion der Veränderlichen xx,x2, ...,*„ ist, also j— > 0 für i = 1, 2, ..., n gilt. Das ist ebenfalls eine vereinfachende Annahme. /\f Die Bedingung -x— > 0 (/' = 1,2, ...,«) besagt, daß wir bei unseren Untersuchungen schädliche Mittel ausschließen, deren Zunahme den Realisierungsgrad des Zieles vermindert
, und daß wir
überflüssige Mittel ausschalten, deren Zunahme den Realisierungsgrad des Zieles nicht beeinflußt ,5) Wir fordern des weiteren, daß die Funktionen 0r (x 1; x2, x„) (r = 1, 2, ..., m), die auf der linken Seite der Bilanzgleichungen (2.2) stehen, stetige partielle erste und zweite Ableitungen besitzen. Aus den Bilanzbedingungen geht hervor, daß man den Einsatz der Mittel JCJ, x2, •••, xn nicht beliebig erhöhen kann. Die Bilanzbedingungen (2.2) drücken die Beschränkungen für den Aufwand an Mitteln aus, deshalb bezeichnen wir sie auch als *> Vgl. O. Lange, Politische Ökonomie, a.a.O., S. 217—220 und 237—242. 3 > Ein Beispiel für Mittel, die unter Umständen schädlich sein können, ist ein zu hoher Einsatz von Kunstdünger in der landwirtschaftlichen Produktion, der eine Minderung der Erträge verursacht. Beispiel für überflüssige Mittel ist die Beschäftigung zusätzlicher Arbeitskräfte, wenn zur Produktionssteigerung die Rohstoffe fehlen.
§ 1. Mathematische Formulierung der Optimierungsrechnung
55
Bilanzbeschränkungen. Sie verhindern beliebige Kombinationen der Einsatzmengen und lassen nur solche Veränderungen zu, die die in den Bilanzbeschränkungen ausgedrückten Bedingungen erfüllen. Die Aufgabe der Optimierungsrechnung setzt sich aus zwei Teilen zusammen. Im ersten Teil geht es um die Bestimmung des sogenannten Bereichs zulässiger Lösungen, im zweiten Teil um die Ermittlung der optimalen Lösung (oder optimalen Lösungen, falls es mehrere gibt). Als Bereich zulässiger Lösungen bezeichnen wir die Lösungsmenge, also die Werte der Veränderlichen x2,..., x„, die den Bilanzbedingungen (2.2) und den Randbedingungen (2.3) genügen. Handelt es sich bei den Bilanzbedingungen um Gleichungen und ist die Anzahl der Bilanzgleichungen m kleiner als die Anzahl der Unbekannten n (also m < n), dann hat das Problem, wie bereits erläutert wurde, n—m Freiheitsgrade. Man kann dann m Unbekannte durch die übrigen n—m Unbekannten bestimmen. Also xi = y>i(xm+1, xm+2,...,
x„)6)
(i = 1, 2, ..., m)
(2.4)
Aus der Theorie der Funktionen mit mehreren Veränderlichen ist bekannt, daß das Gleichungssystem (2.2) eine eindeutige Lösung von der Art (2.4) hat, wenn seine Funktionaldeterminante in einem gewissen Bereich R (d.h. für jeden Punkt x= (x l t x 2 , ..., x„), der zu diesem Bereich gehört) verschieden von Null 7 ' ist, also wenn 801
D(xi,x2, •••,xm)
80t
80T
8X2
8xm
802 8x¡
802 8x2
80 2 8xm * 0.
80M
80m
80m 8xm
8x i
8xt
8X2
(2.5)
6
> Da die Numerierung der Veränderlichen gleichgültig ist, drücken wir die ersten m Veränderlichen x¡, xm als Funktionen der übrigen xm+1, xm+2, ...,
...,xn aus. 7
) Wenn die Funktionaldeterminante verschwindet, dann erhöht sich in Abhängigkeit vom Rang der Matrix die Anzahl der Freiheitsgrade des Problems. Ist der Rang der Matrix m—k, so existieren n—m+k Freiheitsgrade. 5:
56
Kapitel II. Prinzipien der Theorie der Optimierungsrechnung
Ein H-Tupel von Werten der Veränderlichen xu x2, ..., x„, z.B. xi0), ..., x*0), also eine Gruppe bestimmter Aufwendungen an einzelnen Mitteln, bezeichnen wir als Programm. Die Menge aller Programme, die die Bilanzbedingungen (2.2) und die Randbedingungen (2.3) erfüllen, bezeichnen wir als Menge aller verträglichen Programme. Verträgliche Programme bezeichnet man auch als zulässige Programme. Als optimales Programm bezeichnen wir dagegen ein solches zulässiges Programm, das der Zielfunktion, je nach dem Charakter der Aufgabe, einen maximalen oder minimalen Wert gibt. Unter Verwendung der obigen Begriffe sagen wir, daß die Aufgabe der Optimierungsrechnung darin besteht: 1. die Menge der zulässigen Programme zu bestimmen und 2. aus der Menge zulässiger Programme das optimale Programm auszuwählen (vgl. Zeichnung 2.1)
Bereich der Programme, 'die den Randbedingungen genügen Optimales Programm Bereich der zulässigen Programme
Zeichnung 2.1
Im Zusammenhang mit der Unterteilung der Aufgabe der Optimierungsrechnung in zwei Teile gliedert sich die entsprechende ökonomische Berechnung in: 1. die Koordinierungsrechnung*), die zur Bestimmung der Menge verträglicher (zulässiger) Programme führt, und 8 > Ein Beispiel für die Koordinierungsrechnung ist die Analyse von Aufwand und Ertrag der Produktion (sogenannte Input-Output-Analyse), bei der bekanntlich n Bruttoprodukte und n Endprodukte, die durch n Bilanzgleichungen verbunden sind, vorkommen. Das Problem besitzt im Prinzip 2n—n = n Freiheitsgrade. Die Hauptaufgabe der Input-Output-Analyse ist die Bestimmung der Menge der zulässigen Programme.
§ 2. Geometrische Interpretation
57
2. die Optimierungsrechnung, die sich mit der Auswahl des optimalen Programms aus der Menge der zulässigen Programme beschäftigt. § 2. Geometrische Interpretation des Problems der Optimierungsrechnung Die obigen Untersuchungen interpretieren wir geometrisch wie folgt. Jedes Programm, also jedes Wertetupel xu x2, •••, xn, kann man als einen Punkt im n-dimensionalen euklidischen Raum auffassen. Die Randbedingungen x¡ > 0 (i — 1 , 2 , . . . , « ) besagen, daß bei der Bestimmung der zulässigen Programme nur der Teil des Raumes einbezogen wird, dem nichtnegative Koordinaten entsprechen. Wie wir bereits wissen, geht aus den Bilanzbedingungen (hier in Form von Gleichungen) hervor, daß man n—m Werte beliebig wählen kann und die übrigen m Veränderlichen dann durch diese beliebig gewählten Veränderlichen bestimmt sind. Die zulässigen Programme sind im /i-dimensionalen Raum durch ein geometrisches Gebilde mit n—m Dimensionen bestimmt. Dieses Gebilde stellt den Bereich der zulässigen Lösungen dar. Wenn beispielsweise n — 2 (es gibt also zwei Veränderliche xt und x2) und m = 1, dann ist der Bereich der zulässigen Lösungen ein Gebilde mit der Dimension n—m = 2—1 = 1, also irgendeine Linie in dem Teil der Ebene (dem 2-dimensionalen Raum), dem — wegen der Randbedingungen — Punkte mit nichtnegativen Koordinaten entsprechen. Ist n = 3 und m = 2, existieren also drei Veränderliche Xj, x2, x$, die durch die beiden Bilanzgleichungen !(jc, , x2, x3) = cx und ^>2(*i> x2, x 3 ) = c2 verbunden sind, die im 3-dimensionalsn Raum gewisse Flächen darstellen, dann bilden die Punkte den Bereich der zulässigen Lösungen, die auf der Schnittlinie dieser Flächen liegen. Das ist eine Linie, also ein Gebilde mit der Dimension n—m = 3—2 = 1. Gäbe es im letzten Beispiel 3 unabhängige Bilanzgleichungen, dann hätte der Bereich der zulässigen Lösungen die Dimension
§ 2. Geometrische Interpretation
57
2. die Optimierungsrechnung, die sich mit der Auswahl des optimalen Programms aus der Menge der zulässigen Programme beschäftigt. § 2. Geometrische Interpretation des Problems der Optimierungsrechnung Die obigen Untersuchungen interpretieren wir geometrisch wie folgt. Jedes Programm, also jedes Wertetupel xu x2, •••, xn, kann man als einen Punkt im n-dimensionalen euklidischen Raum auffassen. Die Randbedingungen x¡ > 0 (i — 1 , 2 , . . . , « ) besagen, daß bei der Bestimmung der zulässigen Programme nur der Teil des Raumes einbezogen wird, dem nichtnegative Koordinaten entsprechen. Wie wir bereits wissen, geht aus den Bilanzbedingungen (hier in Form von Gleichungen) hervor, daß man n—m Werte beliebig wählen kann und die übrigen m Veränderlichen dann durch diese beliebig gewählten Veränderlichen bestimmt sind. Die zulässigen Programme sind im /i-dimensionalen Raum durch ein geometrisches Gebilde mit n—m Dimensionen bestimmt. Dieses Gebilde stellt den Bereich der zulässigen Lösungen dar. Wenn beispielsweise n — 2 (es gibt also zwei Veränderliche xt und x2) und m = 1, dann ist der Bereich der zulässigen Lösungen ein Gebilde mit der Dimension n—m = 2—1 = 1, also irgendeine Linie in dem Teil der Ebene (dem 2-dimensionalen Raum), dem — wegen der Randbedingungen — Punkte mit nichtnegativen Koordinaten entsprechen. Ist n = 3 und m = 2, existieren also drei Veränderliche Xj, x2, x$, die durch die beiden Bilanzgleichungen !(jc, , x2, x3) = cx und ^>2(*i> x2, x 3 ) = c2 verbunden sind, die im 3-dimensionalsn Raum gewisse Flächen darstellen, dann bilden die Punkte den Bereich der zulässigen Lösungen, die auf der Schnittlinie dieser Flächen liegen. Das ist eine Linie, also ein Gebilde mit der Dimension n—m = 3—2 = 1. Gäbe es im letzten Beispiel 3 unabhängige Bilanzgleichungen, dann hätte der Bereich der zulässigen Lösungen die Dimension
58
Kapitel II. Prinzipien der Theorie der Optimierungsrechnung
3—3 = 0. Er würde also aus einem Punkt bestehen. Im einem solchen Fall existiert das Problem der Auswahl eines optimalen Programmes nicht, weil die Bilanzbedingungen, die hier Gleichungen sind, ein eindeutiges Programm erzwingen (die Anzahl der Freiheitsgrade ist gleich Null). An Hand dieser Beispiele kann man schlußfolgern, daß jede Bilanzgleichung die Dimension des Bereiches der zulässigen Lösungen um eins verringert. Wir wollen jetzt die Auswahl des optimalen Programms aus der Menge der zulässigen Lösungen geometrisch interpretieren. Wir unterstellen, daß zwei Veränderliche xx und x2 existieren und es eine Bilanzgleichung 0 1 (x 1 , = ¿i gibt. Die Zielfunktion z —f{xu * 2 ) beschreibt für den festen Wertz = z0 auf der Zeichnung irgendeine Linie der Gleichung z0 = f(x1, x2), die im zweidimensionalen Raum liegt. Ordnet man der Veränderlichen z immer größere Werte zu, zx < z2 < z 3 ..., dann erhält man die Abbildung einer Schar von Linien, die immer weiter vom Ursprung des Koordinatensystems entfernt liegen (Zeichnung 2.2)
Dieser Schluß folgt aus der Annahme, daß die partiellen Ableitungen der Zielfunktion positiv sind. Wachsen also xx oder x2 an, dann erhöht sich ebenfalls der Wert der Funktion z = f(xx, x2). Diese Linien bezeichnet man als Isoziellinien.9) *> Für den Spezialfall, daß z die Produktionshöhe bedeutet, sind das die sogenannten Isoquanten.
§ 3. Methode der unbestimmten Lagrangeschen Multiplikatoren
59
Die Bilanzgleichung = wird ebenfalls durch eine Linie abgebildet. Sie entspricht zugleich dem Bereich der zulässigen Lösungen, da im Beispiel n—m = 1 ist. Der Punkt, der das optimale Programm anzeigt, liegt sowohl auf der Linie der zulässigen Lösungen als auch auf einer Isoziellinie, und zwar auf jener Linie aus der Schar z = f(pcj, x2), der der höchste Realisierungsgrad des Zieles z entspricht. Auf der Zeichnung 2.2 ist das der Punkt A. Die Situation ist analog, wenn die Zielfunktion z eine Funktion von n Veränderlichen xlt x2, ..., xn ist. Ordnet man z = f(xu x2, ..., xn) die Werte z0 < zx < z2 < z 3 ... zu, so erhält man eine Schar (n—l)-dimensionaler Isozielhyperflächen, die immer weiter vom Ursprung des Koordinatensystems entfernt liegen. Das optimale Programm wird dann durch den Punkt (oder die Punkte) bestimmt, der sowohl zum Bereich der zulässigen Lösungen gehört, d.h. zu dem geometrischen Gebilde, das durch die Bilanzbedingungen begrenzt wird, als auch auf der Isozielhyperfläche liegt, die dem höchsten Realisierungsgrad des Zieles entspricht. So stellt sich also die allgemeine Logik der Optimierungsrechnung dar, und gleichzeitig ist die Richtung bestimmt, in der man die Lösung von Optimierungsaufgaben suchen muß. Es geht dabei um das Auffinden möglichst einfacher Methoden, die die Bestimmung jenes Punktes (oder der Punkte) ermöglichen, der sowohl zum Bereich der zulässigen Lösungen gehört als auch auf der am weitesten vom Ursprung entfernten Isozielhyperfläche liegt. § 3. Methode der unbestimmten Lagrangeschen Multiplikatoren Wir beschäftigen uns jetzt näher mit einer Methode zur Bestimmung der optimalen Lösung einer Aufgabe der Optimierungsrechnung. Vom mathematischen Standpunkt betrachtet, geht es dabei um die Bestimmung des sogenannten Extrem ums (d.h. Maximums oder Minimums) einer Funktion mehrerer Veränderlicher unter Nebenbedingungen; es geht also darum, den Extremwert der Funktion (2.1) bei Vorliegen der Bilanz- bzw. Nebenbedingungen (2.2) und
§ 3. Methode der unbestimmten Lagrangeschen Multiplikatoren
59
Die Bilanzgleichung = wird ebenfalls durch eine Linie abgebildet. Sie entspricht zugleich dem Bereich der zulässigen Lösungen, da im Beispiel n—m = 1 ist. Der Punkt, der das optimale Programm anzeigt, liegt sowohl auf der Linie der zulässigen Lösungen als auch auf einer Isoziellinie, und zwar auf jener Linie aus der Schar z = f(pcj, x2), der der höchste Realisierungsgrad des Zieles z entspricht. Auf der Zeichnung 2.2 ist das der Punkt A. Die Situation ist analog, wenn die Zielfunktion z eine Funktion von n Veränderlichen xlt x2, ..., xn ist. Ordnet man z = f(xu x2, ..., xn) die Werte z0 < zx < z2 < z 3 ... zu, so erhält man eine Schar (n—l)-dimensionaler Isozielhyperflächen, die immer weiter vom Ursprung des Koordinatensystems entfernt liegen. Das optimale Programm wird dann durch den Punkt (oder die Punkte) bestimmt, der sowohl zum Bereich der zulässigen Lösungen gehört, d.h. zu dem geometrischen Gebilde, das durch die Bilanzbedingungen begrenzt wird, als auch auf der Isozielhyperfläche liegt, die dem höchsten Realisierungsgrad des Zieles entspricht. So stellt sich also die allgemeine Logik der Optimierungsrechnung dar, und gleichzeitig ist die Richtung bestimmt, in der man die Lösung von Optimierungsaufgaben suchen muß. Es geht dabei um das Auffinden möglichst einfacher Methoden, die die Bestimmung jenes Punktes (oder der Punkte) ermöglichen, der sowohl zum Bereich der zulässigen Lösungen gehört als auch auf der am weitesten vom Ursprung entfernten Isozielhyperfläche liegt. § 3. Methode der unbestimmten Lagrangeschen Multiplikatoren Wir beschäftigen uns jetzt näher mit einer Methode zur Bestimmung der optimalen Lösung einer Aufgabe der Optimierungsrechnung. Vom mathematischen Standpunkt betrachtet, geht es dabei um die Bestimmung des sogenannten Extrem ums (d.h. Maximums oder Minimums) einer Funktion mehrerer Veränderlicher unter Nebenbedingungen; es geht also darum, den Extremwert der Funktion (2.1) bei Vorliegen der Bilanz- bzw. Nebenbedingungen (2.2) und
60
Kapitel II. Prinzipien der Theorie der Optimierungsrechnung
der Randbedingungen (2.3) zu ermitteln. Wir unterstellen zunächst, daß die Nebenbedingungen die Form von Gleichungen haben. Aus der mathematischen Analysis ist bekannt, daß derartige Aufgaben mit der Methode der unbestimmten Lagrangeschen Multiplikatoren gelöst werden können. Zu diesem Zweck bildet man eine Hilfsfunktion, die sogenannte Lagrangesche Funktion: L(x
x2, ..., x„; Aj, A2, ..., Am) =/(x1)
x2,..., x„)—
m
-
X K[®r(xu x2, ..., .v„)-c r ],
r=1
(2.6)
Die Lagrangesche Funktion ist eine Funktion der Veränderlichen xux2,...,xn und der Multiplikatoren Ä2, ..., Der erste Bestandteil der Lagrangeschen Funktion ist die Funktion, deren Extremum wir zu bestimmen haben, ,und der zweite Bestandteil ist die gewogene Summe der Differenzen zwischen den linken und den rechten Seiten der Nebenbedingungen. Als Gewichte treten in dieser Summe die unbestimmten Multiplikatoren A2, ..., ?.m auf. Die Lagrangesche Funktion (2.6) besitzt nun eine gewisse Eigenschaft, die für uns praktische Bedeutung hat. Befindet sich der Punkt mit den Koordinaten (x,, x2, ...,xn) im Bereich der zulässigen Lösungen, dann verschwinden die in Formel (2.6) unter dem Summenzeichen auftretenden Ausdrücke; denn den Gleichungen, die die Nebenbedingungen ausdrücken, wird genügt. Demnach ist L = / ( x j , x2, ..., xn). Im Bereich der zulässigen Lösungen hat also die Lagrangesche Funktion dieselben Werte wie die Zielfunktion z. Dagegen ist außerhalb dieses Bereiches z. Deshalb kann die Aufgabe zur Bestimmung des Extremums der Funktion unter Nebenbedingungen (2.1) durch die Bestimmung des Extremums der gewöhnlichen Funktion (2.6) ersetzt werden, da man im Bereich der zulässigen Lösungen die Funktion f{xi,x2,...,xn) durch die Lagrangesche Funktion L ersetzen kann. Löst man diese Aufgabe, so erhält man Werte der Veränderlichen xS0), d p , . . . , x ermittelt, setzen wir sie in die Gleichungen (2.7) ein und erhalten die Werte der Veränderlichen x50), ..., x(n0), die die extremale Lösung (das optimale Programm) bestimmen. Wegen der Randbedingungen (2.3) kommen nur nichtnegative Werte xu x2, ..., xn in Betracht. Die beschriebene Methode hat viele Vorteile; denn sie ist nicht nur ein einfaches Instrument zur Lösung von Aufgaben der Optimierungsrechnung, sondern gewährt — wie wir uns überzeugen — zugleich einen tiefen Einblick in das Wesen der Optimierungsaufgaben. Betrachten wir jetzt gewisse Umformungen, die wir erhalten, wenn wir von der Lagrangeschen Funktion L die beliebig gewählte Konstante z0 subtrahieren und das Vorzeichen dieses Ausdrucks verändern. Wir erhalten: m
..., Am;
x2, ..., a,) = ^ Afl&^Xx, x2, ..., x„)—cP] r=l
-Uixu
x2, . . . , x n ) - z 0 ] .
(2.6.1)
Die Funktion Li hat ihr Minimum gerade in dem Punkt, bei dem die Lagrangesche Funktion L ihr Maximum besitzt. Die Bedingung L = Max. und die Bedingung Lx = Min. sind also einander äquivalent. Diese letzte Bedingung ist wiederum äquivalent der Bedingung: m
« = £ Ar[ö>r(*i, jc2, ..., *„)-c r ] = Min. r=l
(2.8)
unter Einhaltung der Nebenbedingung /(*,, x2, ..., x„) = z0
(2.9)
62
Kapitel II. Prinzipien der Theorie der Optimierungsrechnung
sowie der Randbedingungen xt > 0 (/ = 1,2,...,«). Das folgt daraus, daß die Funktion u in dem Bereich, in dem die Nebenbedingung (2.9) erfüllt wird, also bei einem gegebenen Realisierungsgrad der Zielfunktion, mit der Funktion Lx identisch ist. Das drängt uns eine gewisse praxeologische Deutung der Funktion u auf. Diese Funktion ordnet jedem Wertetupel der Mittel xu x2, ..., ...,x n bei gegebenen Multiplikatoren /2> ..., Xm eine bestimmte Zahl, nämlich den Wert der Funktion u, zu. Man kann sagen, daß die Funktion u „irgendwie" die Gesamtmenge des Aufwands an den Mitteln xu x2, ..., xn „erfaßt", indem sie eine gewisse Kommensurabilität10) (Meßbarkeit mit gemeinsamen Maß) dieser Mittel, die in verschiedenen Naturaleinheiten gemessen werden, beispielsweise in Arbeitsstunden, in Tonnen, in Litern, in Stück usw., festsetzt. Deshalb bezeichnet man die durch die Formel (2.8) bestimmte Funktion u als Funktion des Aufwands an Mitteln. Die Nebenbedingung (2.9) besagt, daß der Realisierungsgrad des Zieles z einen bestimmten Wert z„ oder, wie man ihn gewöhnlich nennt, ein bestimmtes Niveau z0 besitzt. Man kann also behaupten, daß das Maximum der Zielfunktion z = / ( x , , x2, ..., x„) bei vorgegebenem, durch die Bilanzbedingungen (2.2) ausgedrücktem Aufwand an Mitteln dem Minimum der Funktion des Aufwands an Mitteln bei vorgegebenem Realisierungsgrad des Zieles äquivalent ist. Das sind zwei gleichwertige Varianten desselben praxeologischen Prinzips. Die Aufgabe zur Bestimmung des Minimums der Funktion des Aufwands an Mitteln bei vorgegebenem Realisierungsgrad des Zieles bezeichnen wir als Dualaufgabe zur Aufgabe der Bestimmung des Maximums der Zielfunktion bei vorgegebenem Aufwand an Mitteln. Diese Dualität ist ein charakteristisches Merkmal der Optimierungsrechnung. Die Lösungsmethode für die Dualaufgabe ist der Primalaufgabe analog. Als Ausgangspunkt nehmen wir die durch die Formel (2.6.1) bestimmte Funktion Lly die man als Funktion der Veränderlichen 10 > Bei der Herbeiführung dieser Kommensurabilität der Mittel spielen die Multiplikatoren A,, A 2 ,..., Am eine spezielle Rolle. Darüber wird im folgenden noch gesprochen werden.
§ 3. Methode der unbestimmten Lagrangeschen Multiplikatoren
63
¿l9 ¿2> •••> ¿m und Xi, x2,..., x„_i betrachten kann. Die Veränderliche x„ läßt sich nämlich aus der zusätzlichen Bedingung (2.9) durch die übrigen Veränderlichen xlt x2, ..., x n _i herleiten. n) Die Funktion Li erreicht ihr Extremum für dieselben Werte der Veränderlichen wie die Funktion u. Diese Bedingungen ermöglichen es, die optimalen Werte der Unbekannten A und x Eine derartige Form der Bilanzungleichungen ( < ) ist besonders bequem. Sie besagt nämlich, daß in der „Bilanz" (z.B. für die Rohstoffzuteilung der Produktion) ein gewisses Limit cr nicht überschritten werden kann. Würde aus dem Charakter des Problems hervorgehen, daß die Bilanzungleichungen die Form cr haben, dann erhält man nach Multiplikation mit (—1) Ungleichungen vom Typ (2.10). 14 > Infolge der Bedingung &r(x¡,x2, ...,*„) < cr wird die in der Formel für die Funktion L stehende gewogene Summe im Bereich der zulässigen Lösungen im allgemeinen nicht gleich Null sein.
68
Kapitel II. Prinzipien der Theorie der Optimierungsrechnung
Es erweist sich jedoch, daß man die Lagrangesche Funktion auch auf dieses verallgemeinerte Problem anwenden kann, falls man folgendes verabredet: 1. wenn xz, x„) = cT, dann ist XT ^ 0, wobei die entsprechenden Werte Xr aus der Lösung der Aufgabe für das Extremum der Funktion z =f(xu x2, ..., x„) unter Nebenbedingungen ermittelt werden, 2. ist aber &r(x1, x2, ..., xn) < cr, dann setzen wir Ar = 0 an. Unter diesen Annahmen stimmt die Lagrangesche Funktion im Bereich der zulässigen Lösungen weiterhin mit der Zielfunktion überein. Wir bestimmen also anstelle des Extremwertes der Zielfunktion unter Nebenbedingungen den gewöhnlichen Extremwert der Lagrangeschen Funktion. Nun bedenken wir, wie diese Konvention praxeologisch zu deuten ist. Falls in der optimalen Situation das Limit für den Aufwand des jeweiligen Mittels nicht ausgeschöpft wird, also x2, ..., x„) < cr ist, verschwindet Ar. Dann haben die Glieder der gewogenen Summe m
r= 1
/lr[ 0, deren Bilanzlimite also ausgeschöpft sind. Die Bilanzungleichungen (2.10) lassen sich dadurch in Gleichungen umwandeln, daß man gewisse Hilfsveränderliche*> x„+r > 0 (r = 1, 2, ...,m) einführt: i, * a . ...,*«)+*,,+, = c r
(r = 1, 2, ..., m).
(2.10.2)
Ist eine der Bedingungen (2.10) eine Gleichung, dann verschwindet die entsprechende Hilfsveränderliche x„+r. Für die Bedingungen (2.10) dagegen, die echte Ungleichungen sind, ist xn+r > 0. Daraus folgt, daß die Hilfsveränderlichen xn+r den Umfang gewisser Reserven bestimmen. Wurde das Bilanzlimit ausgeschöpft, dann ver*) Diese Hilfsveränderlichen werden auch Schlupfvariable genannt.
69
§ 4. Die Bilanzbedingungen sind Ungleichungen
schwindet x„ + r . Andernfalls bezeichnet xn+r > 0 die Größe der „nichtausgeschöpften Reserve". Nach Umformung der Bilanzbedingungen in Gleichungen (2.10.2) bilden wir wiederum die Lagrangesche Funktion, die jetzt folgende Gestalt hat: m
L = f{pci, x2, ..., * „ ) - X Kl®r(xi, x2, ...,x„)-cr] = r=l m
=f(x\,x2, ...,*„)+ rX! K -^n+r* = l
Eine derartige Umformung der Lagrangeschen Funktion ermöglicht eine noch bessere Interpretation der Multiplikatoren Alt 1 2 , •••, Man kann sie nämlich als Gewichte auffassen, die den Reserven beigelegt werden. Diese Gewichte sind gleich Null, wenn die Reserven positiv sind (nicht ausgeschöpfte Limite), sie sind aber positiv, wenn die Reserven verschwinden oder negativ sind (Ausschöpfung oder Überschreitung der Limite). Nach Einführung der Hilfsveränderlichen x n + r in die Bilanzbedingungen muß man sie auch in die Zielfunktion einführen. Danach kann man das modifizierte Optimierungsproblem folgendermaßen formulieren: Es sind die Werte der Veränderlichen xu x2, ...,xn, xn+1, ..., xn+m so zu bestimmen, daß die Zielfunktion maximiert (oder minimiert) wird Z = / ( * i , X2, ...,x„, xn+1, ..., xn+m) = Max. (oder Min.) (2.11) unter der Voraussetzung, daß die Veränderlichen die Bilanzbedingungen ®r(xi, x2, ..., x„)+xB+r
= cr
[r= 1, 2, . . . , m)
(2.12)
und die Randbedingungen Xi>0
( / = 1,2, ...,fi+in)
(2.13)
erfüllen. Man muß aber noch eine zusätzliche Voraussetzung einführen. Wie zuvor muß nämlich 6 Lange, Optimale Entscheidungen
> 0 für i = 1, 2, ..., n sein, während
70
Kapitel II. Prinzipien der Theorie der Optimierungsrechnung
die partiellen Ableitungen der Zielfunktion nach den Hilfsveränderliehen
OXn+r
= 0 (r = 1, 2, ..., m) sind. Die letzte Bedingung besagt,
daß die Hilfsveränderlichen die Größe der Zielfunktion nicht beeinflussen. Vom formalen Gesichtspunkt unterscheidet sich das modifizierte Problem in nichts von dem eingangs untersuchten Problem.
Wir prüfen noch, welchen Einfluß die Einführung der Hilfsveränderlichen auf die Anzahl der Freiheitsgrade des Programms hat. Beim vorhergehenden Problem, bei dem die Bilanzbedingungen in Form von m Gleichungen gegeben waren, hatten wir n—m Freiheitsgrade. Jetzt liegen ebenfalls m Bilanzgleichungen (2.12) vor, jedoch n+m Veränderliche, dadurch gibt es n+m—m — n Freiheitsgrade. Dieses Ergebnis ist erklärlich, wenn wir berücksichtigen, daß die als Ungleichungen x2, ..., x„) < cr gegebenen Bilanzbedingungen die Anzahl der Freiheitsgrade des Problems nicht verringern. Diese Tatsache kann man geometrisch deuten. Wir unterstellen zwei Veränderliche xx und x2 sowie eine Bilanzgleichung. Die Bilanzbedingung bestimmt dann als zulässige Programme die Koordinaten aller jener Punkte, die auf der der gegebenen Bilanzgleichung entsprechenden Linie s liegen. Die Menge der auf dieser Linie liegenden Punkte hat einen Freiheitsgrad (Zeichnung 2.4). Ersetzen wir die Bilanzgleichung in diesem Beispiel durch eine Ungleichung, da nn gehören zum Bereich der zulässigen Lösungen alle Punkte des Bereiches, die auf oder unter der von der Bilanzbedingung
§ 4. Die Bilanzbedingungen sind Ungleichungen
71
bestimmten Linie s liegen. Zulässig ist also der schraffierte Bereich B einschließlich seiner Begrenzungen (Zeichnung 2.4). Es existieren demnach zwei Freiheitsgrade. Es sollen neben den beiden Veränderlichen xt und x2 nunmehr zwei Bilanzgleichungen vorliegen. Der Bereich der zulässigen Lösungen ist dann auf den Punkt A beschränkt, das Problem besitzt also Null Freiheitsgrade (Zeichnung 2.5). Ändern wir die Bilanzgleichungen in Ungleichungen ab, so erhalten wir als Bereich der zulässigen Lösungen die Fläche C unterhalb der beiden Linien einschließlich der Teile dieser Linien, die den Bilanzbedingungen entsprechen, sowie die Begrenzungen durch die Koordinatenachsen. Der Bereich der zulässigen Lösungen hat also zwei Freiheitsgrade (Zeichnung 2.5). Diese Beispiele zeigen, daß die in Form von Ungleichungen gegebenen Bilanzbedingungen die Anzahl der Freiheitsgrade des Problems tatsächlich nicht beeinflussen.
Kapitel
III
Marginaloptimierang § 1. Methode und geometrische Interpretation der Lösung von Aufgaben der Marginaloptimierung Im vorhergehenden Kapitel stellten wir die allgemeine Theorie der Optimierungsrechnung dar. Jetzt beschäftigen wir uns mit konkreten Lösungswegen für die Aufgaben der Optimierungsrechnung. Wir unterscheiden dabei zwei Fälle: als ersten, wenn die Lösung mit Hilfe der Differentialrechnung erzielt werden kann — wir sprechen dann von Marginalrechnung, da sie auf dem Vergleich des sogenannten Grenzzuwachses der Funktionen beruht — und als zweiten, wenn diese klassische Methode versagt. Vom theoretischen Standpunkt ist die Methode der Differentialrechnung die einfachste.^ Sie kann aber nicht angewendet werden, wenn den Ableitungen der Zielfunktion und der Bilanzbedingungen bestimmte Eigenschaften fehlen. Insbesondere versagt die Differentialrechnung bei der Lösung linearer Optimierungsprobleme, d. h. dann, wenn die Zielfunktion und die Bilanzbedingungen lineare Funktionen der Unbekannten des Problems sind. Zur Lösung von Aufgaben der linearen Optimierung wendet man spezielle Methoden an, die unter dem Einfluß der praktischen Bedürfnisse vor nicht allzulanger Zeit entstanden und weiterentwickelt wurden (während 'I Daraus erklärt sich, daß die Methode der Differentialrechnung von den Ökonomen schon sehr früh angewendet und als einzige Methode zur Optimierung ökonomischer Funktionen angesehen wurde. Diese Methode wurde unter der Bezeichnung Marginalrechnung am Ende des 19. und zu Beginn des 20. Jahrhunderts durch die neoklassische ökonomische Schule weit verbreitet und für die Lösung verschiedener ökonomischer Probleme, sowohl realer als auch häufig konstruierter, angewendet.
§ 1. Lösung von Aufgaben der Marginaloptimierung
73
des II. Weltkrieges und danach). Es zeigte sich bald, daß die zur Lösung solcher Aufgaben benötigten Rechenverfahren im allgemeinen weitaus komplizierter sind als die Methoden der Differentialrechnung, obwohl hierbei nur einfache lineare Funktionen zu behandeln sind. In diesem Kapitel beschäftigen wir uns zunächst mit dem Einsatz der Methoden der Differentialrechnung für die Optimierungsrechnung. Den Methoden zur Lösung von Aufgaben der linearen Optimierung ist dann das folgende Kapitel gewidmet. Soweit die Bilanzbeziehungen die Form von Gleichungen aufweisen, wurden die allgemeinen Prinzipien zur Lösung von Aufgaben der Optimierung mittels der Differentialrechnung bereits im vorigen Kapitel dargelegt. Ausgangspunkt bei der Anwendung dieser Methode ist bekanntlich die Bildung der Lagrangeschen Funktion, die im Bereich der zulässigen Lösungen ihr Maximum für dieselben Werte der Veränderlichen xltx2,...,x„ annimmt wie die Zielfunktion Z = f(X\, x2, ..., xn). Notwendige Bedingung für die Existenz von Extremwerten der Lagrangeschen Funktion ist, daß ihre partiellen Ableitungen verschwinden: ( / = 1,2,...,«).
(3.1)
Aus diesem System mit n Gleichungen und aus den m Bilanzgleichungen kann man die Werte der Veränderlichen x(°\ ..., , die das optimale Programm bestimmen, sowie die ihnen entsprechenden Werte der Lagrangeschen Multiplikatoren Ai9), ..., errechnen. Wir analysieren jetzt die Bedingung (3.1) zur Maximierung der Funktion L und der Zielfunktion. Wir berechnen hierzu die partiellen Ableitungen der Lagrangeschen Funktion. Die Bedingung (3.1) stellt sich danach folgendermaßen dar: m
ff-'.«
«>•
74
Kapitel III. Marginaloptimierung
Daraus resultiert: m
12 ir =r=S>Sf c' »>• L
r(Xu
X2, ...,
Xn)-Cr]
r = 1
an, die im Bereich der zulässigen Lösungen bekanntlich der Zielfunktion z = / ( x 1 ; x2, ..., xn) entspricht. Die Bestimmung der Existenzbedingung für das Maximum der Zielfunktion kann also durch die Bestimmung der Existenzbedingung für das Maximum der Lagrangeschen Funktion ersetzt werden. 3)
Die neoklassische ökonomische Schule nahm fälschlicherweise an, daß die Lösung der Gleichungen (3.4) immer existiert und ein System von Veränderlichen ist, bei denen die Zielfunktion ihr Maximum erreicht.
77
§ 3. Beispiele der Marginaloptimierung
Wir berechnen das Differential erster Ordnung der Lagrangeschen Funktion: n
m
¡=1
'
n
r= 1
1
' 1
1=1
1
r= 1 i=I
Auf der Grundlage dieses Differentials berechnen wir das Differential zweiter Ordnung der Lagrangeschen Funktion:
d L
n
n
m
* =2 £I i=l
n
2£Ü
'
j=
n
r=l (=1 j= 1
^1
7(
3
-
7
>
oder einfacher
« - S=iE j=
B2/ dxidxj
I>
820r dxidxj
dxidxj.
(3.8)
Hinreichende Bedingung für das Maximum der Zielfunktion unter Neben-(Bilanz-)Bedingungen ist, daß das Differential zweiter Ordnung der Lagrangeschen Funktion für die aus den Gleichungen (3.4) bestimmten Werte der Veränderlichen ..., xi0> und 2 für alle Werte dxt und dxj negativ ist (d L < 0). Es läßt sich leicht nachweisen, daß die Bedingung d2L < 0 und die Bedingung d2Lt > 0 einander äquivalent sind. Dabei ist Lt die Lagrangesche Funktion, die dem Dualproblem entspricht (vgl. Kapitel II). Es zeigt sich also, daß die hinreichende Bedingung für das Maximum der Zielfunktion der hinreichenden Bedingung für das Minimum der Funktion des Aufwands an Mitteln gleichwertig ist. Damit wird die Äquivalenz beider Varianten von Optimierungsaufgaben erneut bestätigt. § 3. Beispiele der Marginaloptimierung Wir untersuchen jetzt einige Beispiele, die die Methode der Marginaloptimierung verdeutlichen sollen
77
§ 3. Beispiele der Marginaloptimierung
Wir berechnen das Differential erster Ordnung der Lagrangeschen Funktion: n
m
¡=1
'
n
r= 1
1
' 1
1=1
1
r= 1 i=I
Auf der Grundlage dieses Differentials berechnen wir das Differential zweiter Ordnung der Lagrangeschen Funktion:
d L
n
n
m
* =2 £I i=l
n
2£Ü
'
j=
n
r=l (=1 j= 1
^1
7(
3
-
7
>
oder einfacher
« - S=iE j=
B2/ dxidxj
I>
820r dxidxj
dxidxj.
(3.8)
Hinreichende Bedingung für das Maximum der Zielfunktion unter Neben-(Bilanz-)Bedingungen ist, daß das Differential zweiter Ordnung der Lagrangeschen Funktion für die aus den Gleichungen (3.4) bestimmten Werte der Veränderlichen ..., xi0> und 2 für alle Werte dxt und dxj negativ ist (d L < 0). Es läßt sich leicht nachweisen, daß die Bedingung d2L < 0 und die Bedingung d2Lt > 0 einander äquivalent sind. Dabei ist Lt die Lagrangesche Funktion, die dem Dualproblem entspricht (vgl. Kapitel II). Es zeigt sich also, daß die hinreichende Bedingung für das Maximum der Zielfunktion der hinreichenden Bedingung für das Minimum der Funktion des Aufwands an Mitteln gleichwertig ist. Damit wird die Äquivalenz beider Varianten von Optimierungsaufgaben erneut bestätigt. § 3. Beispiele der Marginaloptimierung Wir untersuchen jetzt einige Beispiele, die die Methode der Marginaloptimierung verdeutlichen sollen
78
Kapitel III. Marginaloptimierung
Wir beginnen mit dem typischsten und einfachsten Beispiel, mit dem sich bereits die neoklassische ökonomische Schule bei der Bestimmung und Analyse von betrieblichen Produktionsprogrammen beschäftigt hat. Ein Betrieb verbrauche im Produktionsprozeß eines Erzeugnisses zwei Mittel in den Mengen x{ und x2; das sind die sogenannten Produktionsfaktoren, z.B. Arbeitskräfte und Maschinen, zwei verschiedene Rohstoffe usw. Die Mengen jc, und x2 bezeichnen wir als den Aufwand an Produktionsfaktoren. Die Produktionshöhe z (gemessen in Natural-, Geldeinheiten oder Werten) sei eine Funktion des Aufwands an Produktionsfaktoren, also z = f{xlt x2). Diese Abhängigkeit wird als Produktionsfunktion bezeichnet. Bei der Erzeugung des Produktes entstehen gewisse Kosten c. Sie hängen von den verbrauchten Mengen der beiden Produktionsfaktoren sowie deren Preisen px und p2 ab. Man unterstellt, daß der Betrieb die Preise der Produktionsfaktoren nicht beeinflussen kann (der Betrieb wirkt beispielsweise unter den Bedingungen der freien Konkurrenz). Die Gesamtkosten werden durch die Formel PlXi+p2X2
= c
ausgedrückt. Aus dem Ansatz der Produktionsfunktion geht hervor, daß zwischen den Produktionsfaktoren die Möglichkeit der Substitution besteht. Die Faktoren seien beispielsweise „Maschinen" und „Arbeitskräfte". Dann soll es möglich sein, zwischen Produktionsmethoden zu wählen, bei denen der Verbrauch an Maschinen im Verhältnis zum Arbeitsaufwand kleiner oder größer ist, man kann also mit mehr oder minder arbeitsintensiven Methoden produzieren. Ein reales Beispiel einer solchen Situation gibt die landwirtschaftliche Produktion; sie kann intensiver oder extensiver betrieben werden. Substitutionsfaktoren in der landwirtschaftlichen Produktion sind beispielsweise die „landwirtschaftliche Nutzfläche" und der „Kunstdünger". Das Problem der Optimierung der Produktion ist dem im Kapitel I behandelten Mischungsproblem analog. Es besteht darin, bei vor-
§ 3. Beispiele der Marginaloptimierung
79
gegebenen Gesamtkosten die Produktionsfaktoren so zu kombinieren, daß die Produktionshöhe maximal wird. Mathematisch kann das Problem wie folgt formuliert werden. Es sind die Mengen (Aufwände) der Produktionsfaktoren xi und x2 so zu bestimmen, daß die Produktionsfunktion z = /(*!, x2) = Max.
(3.9)
unter Einhaltung der Bilanzbedingung Pix1+p2x2 und der Randbedingungen
= c
(3.10)
x, > 0 und x2 > 0.
(3.11)
Das soeben formulierte Problem der Produktionsoptimierung kann man in sein duales Problem umformen. Als Zielfunktion gibt man nunmehr die Gesamtkosten c vor. Der Aufwand an den Produktionsfaktoren Xi und x2 ist dann so zu bestimmen, daß c = PiXi+p 2 x 2
- Min.
bei Erfüllung der Nebenbedingung fixI > x2) = z0
(vorgegebenes Produktionsniveau)
und der Randbedingungen Xi ^ 0 und x2 ^ 0. Aus der allgemeinen Theorie der Optimierungsrechnung folgt, daß das Dualproblem dem Primalproblem gleichwertig ist, d. h. zu derselben Lösung für x j und x2 führt. Im vorliegenden Fall gestaltet sich die Produktionsoptimierung mit Hilfe der Methode der Marginalrechnung sehr einfach. Aus der Differentialrechnung ist die notwendige Bedingung für die Existenz eines Extremwertes einer Funktion zweier Veränderlicher, z = fixi, x2), bekannt. Danach muß das Differential erster Ordnung der Funktion für alle Werte dx^ und dx2 verschwinden, also
gelten. Diese Bedingung ist erfüllt, wenn
— = 0 und
0.
80
Kapitel III. Marginaloptimierung
Im untersuchten Beispiel müssen die Veränderlichen xt und x2 aber der Bilanzgleichung pix1+p2x2 = c genügen, die man nach Differentation beider Seiten in folgender Form darstellen kann: pidxi+p2dx2
(3.13)
= 0.
Die Funktion z = f(xu x2) erreicht also ihren Extremwert, im gegebenen Fall ihr Maximum,4' wenn gleichzeitig die Bedingungen (3.12) und (3.13) eingehalten werden. Aus diesen geht hervor, daß5)
oder
8f 8x i
Sf 8x2
Pt
Pi
8f 8x, 8f 8x,
(3.14)
pt
(3.14.1)
pt
Die neoklassische ökonomische Schule hat den Bedingungen (3.14) oder (3.14.1) eine Deutung gegeben. Die partielle Ableitung der Produktionsfunktion z = f(xu x2, ..., x„) nach dem Produktionsfaktor Xi, d.h.
8f
wurde nämlich als
Grenzproduktivität
dieses
Faktors bezeichnet. Der Interpretation der partiellen Ableitung gemäß, entspricht die Grenzproduktivität des Produktionsfaktors Xi angenähert dem Zuwachs der Produktion z, der aus der Erhöhung 4
> Die neoklassische Schule unterstellte, daß die Existenz des Maximums der Produktionsfunktion aus dem Charakter des Problems resultiert und eine Untersuchung der hinreichenden Bedingungen für die Existenz eines Maximums einer Funktion zweier Veränderlicher z = f(x,, xz) im allgemeinen überflüssig ist. Es wurde unter anderem stillschweigend vorausgesetzt, daß die Produktionsfunktion z = f(x,, x2) mit dem Wachstum von x, und x2 immer langsamer ansteigt. Das bedeutet, daß die partiellen Ableitungen partiellen Ableitungen zweiter Ordnung 5
8f 82f 2 OXi
und und
8f
fallen, daß also die
82f , 2 negativ sind. OX 2
) Das homogene System linearer Gleichungen ist dann und nur dann erfüllt, wenn die Koeffizienten bei den Unbekannten proportional sind, oder, was gleichbedeutend ist, wenn die Koeffizientendeterminante des Gleichungssystems verschwindet.
§ 3. Beispiele der Marginaloptimierung
81
des Faktors Xj um eine Einheit resultiert. Hierbei wird unterstellt, daß der Aufwand aller übrigen Produktionsfaktoren konstant bleibt. Verwendet man den Begriff der Grenzproduktivität, so besagt die Bedingung (3.14.1), daß bei gegebenen Kosten c die Produktion z = /(X), x2) maximal ist, wenn die Grenzproduktivitäten der Produktionsfaktoren Xi und x2 ihren Preisen proportional sind. Wir führen einen zweiten Begriff ein, der als Grenzprodukt bezeich3f 1 net wird und gleich • — ist. Demnach entspricht das Grenzprodukt des Faktors xt annähernd dem Zuwachs der Produktionsfunktion z= f(xi,x2, ..., *,,), soweit er der Erhöhung dieses Produktionsfaktors um eine solche Menge entspringt, die man für eine Geldeinheit (z.B. für 1 Mark) erwerben kann. Dabei wird wiederum angenommen, daß der Aufwand an den übrigen Produktionsfaktoren konstant bleibt. Wenn beispielsweise 1 kg des betreffenden Produktionsfaktors pi Mark kostet, dann kann man tatsächlich für eine Mark kg dieses Faktors erwerben. Setzt man dxt mit - j - an, so beträgt der Produktionszuwachs angenähert JLdx 8xi '
=JL.±_ 3xi pi
Verwenden wir den Begriff des Grenzproduktes, dann kann man die Bedingung (3.14) so deuten, daß bei gegebenen Kosten die Produktion z = f(pci, x2) dann maximal ist, wenn die Grenzprodukte beider Produktionsfaktoren einander gleich sind. Diese Schlußfolgerung leuchtet ohne weiteres ein. Tatsächlich kann man jede disponible Mark für den Erwerb des ersten oder zweiten Produktionsfaktors verwenden. Vorteilhaft ist aber der Erwerb des Produktionsfaktors mit dem größeren Grenzprodukt, weil dann die Ausgabe einer Mark einen größeren Einfluß auf die Produktionssteigerung ausübt. Folglich erreicht die Produktionsfunktion ihr Maximum, wenn die Grenzprodukte beider Faktoren einander gleich sind. Andernfalls wäre es vorteilhafter, den zum Erwerb des Produktionsfaktors mit dem niedrigeren Grenzprodukt bestimmten Teil der Ausgaben zum
82
Kapitel III. Marginaloptimierung
Erwerb des Produktionsfaktors mit dem höheren Grenzprodukt zu verwenden. Die Lösung des dualen Produktionsprogramms verläuft analog. Aus der Bedingung für die Existenz des Minimums der Zielfunktion c = pixljrp2x2 und aus der zusätzlichen Bedingung f(x1, x2) = zQ (nach ihrer Differentation) folgt, daß de = pidxlJrp2dx2
— 0
sowie -8Xi P - d x1t + ^8x2 - d x 2 = 0. Beide Gleichungen müssen gleichzeitig erfüllt sein, wir erhalten deshalb als Lösung des Problems wiederum die Bedingung (3.14) oder (3.14.1). Wir sehen also, daß das Dualproblem dem Primalproblem gleichwertig ist, da es zu derselben Lösung führt. Zum besseren Verständnis lösen wir ein einfaches Zahlenbeispiel der Produktionsoptimierung. Die Produktionsfunktion habe folgende Form: z = f{x\, x2) = 60xj—1,5jc?+ 100x2— Die Preise der Produktionsfaktoren betragen pi = 3 und p2 = 2, und die Bilanzgleichung lautet 3x!+2x 2 = 110. Zur Lösung des Problems berechnen wir 8f
8x i
60—3xx und
8x:
100-2x 2 .
Aus der Bedingung (3.14) geht hervor, daß 60 — 3jct _ 100—2xa 3
~
2
und daraus folgt —xi+x 2
- 30.
An Hand der letzten Gleichung und der Bilanzbedingung 3x!+2x 2 — = 110 läßt sich errechnen, daß die Produktion ihren höchsten Wert erreicht, wenn wir aus der für die Produktionsmittel bestimmten
83
§ 3. Beispiele der Marginaloptimierung
Gesamtsumme in Höhe von 110 für den Ankauf des ersten Produktionsfaktors den Betrag x x p x = 10 • 3 = 30 und für den Ankauf des zweiten Produktionsfaktors den Betrag x2p2 = 40 • 2 = 80 aufwenden. Es ist leicht nachzuprüfen, daß dann die Grenzprodukte der beiden Faktoren xi und x2 tatsächlich einander gleich sind. Es ist nämlich 8f Sx,
J_ _ 60—3*1 _ 60-3-10 _ — Pi ~ Pi ~ 3
und 8f
1 _
dx2 ' p2 ~~
100-2;c2 _ 100-2-40 _ p2
~
2
—
1Q
Problem und Lösung der Produktionsoptimierung eines Betriebes kann man graphisch veranschaulichen. Die im folgenden gewählte Darstellungsweise wurde durch die neoklassische Schule sehr stark popularisiert. Danach wird die Produktionsfunktion z = f(xu x2) als Funktion zweier Veränderlicher, und x2, im Koordinatensystem als eine zweidimensionale Fläche im dreidimensionalen Raum (Zeichnung 3.1.1) eingetragen. Die räumliche Darstellung ist jedoch unbequem. Deshalb verwenden wir zur graphischen Veranschaulichung der Fläche das Bild der Funktion zweier Veränderlicher in der Ebene. Auf der Zeichnung (vgl. Zeichnung 3.1.2) stellen wir die sogenannten Isoquanten dar, d. h. eine Schar von Linien, die auf der Fläche z = f{xu x2) liegen und der geometrische Ort der Punkte sind, denen unabhängig von der Kombination der Werte xl und x2 dasselbe Produktionsniveau entspricht, z.B. z1 = 10, z2 — 15, z3 = 20 usw.6> Auf diese Weise entsteht eine „Höhenlinienkarte" der Produktionsfunktionen, die eine optische Vorstellung über Charakter und Verlauf dieser Funktion vermittelt. Die Werte z der Produktionsfunktion und die Veränderlichen und x2 sollen gewissen Bedingungen genügen, die dem empirischen 6 > Isoquanten sind senkrecht auf die Ebene x, 0x2 projizierte Linien, die durch die Schnittpunkte der Fläche z = f(xx, x,) mit der Ebene z = zlt z = z2, ... bestimmt sind. Isoquanten haben eine analoge Bedeutung wie Isothermen und Isobaren in meteorologischen Darstellungen und bei der Darstellung der Höhenlinien eines Gebietes mit unterschiedlichem Niveau auf der Landkarte.
84
Kapitel III. Marginaloptimierung
Charakter der Produktionsfunktion entspringen, vor allem also > 0, x2 > 0 und z > 0. Darüber hinaus nimmt man an, daß die partiellen Ableitungen der Produktionsfunktion z = f{xx, x2) nach den Produktionsfaktoren, also die Grenzproduktivitäten, P)f slf positiv sind: > 0 und > 0. Demnach steigt die Produktion z, wenn die Menge des einen Produktionsfaktors erhöht wird, während der Aufwand des anderen Faktors konstant bleibt. Die Fläche der Produktion erhöht sich also, wenn man sich auf ihr vom Ursprung des Koordinatensystems entfernt. Folglich steigt die Produktion z,
wenn wir einen oder sogar beide Faktoren xx und x2 erhöhen. Entfernt man sich auf der Zeichnung 3.1.2. vom Ursprung des Koordinatensystems, so geht man zu Isoquanten über, denen ein immer höheres Niveau der Produktion entspricht. Wir stellen überdies fest, daß sich zwei Isoquanten nicht schneiden können; denn das stünde im Widerspruch zur Eindeutigkeit der Produktionsfunktion und bedeute, daß dieselbe Kombination der Größen ^ und x2 unterschiedliche Produktionshöhen ergibt. Schließlich bemerken wir noch, daß die Isoquanten fallende Kurven sind. Bei konstanter Produktionshöhe muß also die Verringerung des Faktors xt durch die Erhöhung des Faktors x2 ausgeglichen werden und umgekehrt. Nun tragen wir die Bilanzgleichung pix1+p2x2 = c ab, die man auch in der Form
85
§ 3. Beispiele der Marginaloptimierung
schreiben kann. Wir sehen, daß die Darstellung der Bilanzgleichung im Koordinatensystem x1Ox2 eine gerade Linie ist. Wir bezeichnen sie als Linie der Kosten (bzw. Kostenlinie) (Zeichnung 3.2). Der Anstieg der
c Pi
Zeichnung 3.2
0
K
N
Zeichnung 3.3
Kostenlinie bildet mit der positiven Richtung der Oxj-Achse einen stumpfen Winkel. Er wird durch das Verhältnis der Preise der beiden Produktionsfaktoren (mit negativem Vorzeichen) bestimmt: — Die Ordinate des Schnittpunktes N der Kostenlinie mit der Ox2-Achse, d. h. der Abschnitt ON = — , bestimmt die Menge des Faktors x2, Pi die man für die insgesamt bereitstehende Kostensumme c erwerben £
kann; gleicherweise bezeichnet der Abschnitt OM = — die Menge pi des Faktors xt, die man für die geplante Kostensumme c kaufen kann. Vereinigen wir jetzt die Zeichnungen 3.1.2 und 3.2 in einer Zeichnung, so zeigt sich, daß wir bei gegebenem Kostenaufwand c die = OK und x2 = OL. maximale Produktion dann erreichen, wenn Dabei sind die Punkte K und L die Koordinaten des Berührungspunktes A der Kostengeraden mit einer der Isoquanten (Zeichnung 3.3). Wir wollen nun beweisen, daß die Koordinaten des Punktes A tatsächlich die optimale Lösung des untersuchten Problems anzei7
Lange, Optimale Entscheidungen
86
Kapitel m . Marginaloptimierung
gen. Hierbei beachten wir, daß zulässige Lösungen nur solche Kombinationen der Größen Xj und x2 sein können, die Koordinaten der auf der Kostenlinie liegenden Punkte sind. Andernfalls wäre die Bilanzgleichung pix1+p2x2 = c nicht erfüllt. Aber von allen auf der Kostenlinie liegenden Punkten stellen lediglich die Koordinaten des Punktes A die optimale Lösung dar. Die Annahme der Koorditen irgendeines anderen Punktes als optimale Lösung, z.B. des Punktes Alt führte sofort zum Widerspruch. Den Koordinaten aller Punkte, etwa des Punktes A2, die zwischen den Punkten Ax und A liegen, entspricht tatsächlich eine niedrigere Produktion als in A. Das folgt daraus, daß die Isoquante, auf der sich z.B. der Punkt A2 befindet, unterhalb der Isoquante liegt, auf der sich der Punkt A befindet (Zeichnung 3.3). Die Punkte dagegen, die auf höher gelegenen Isoquanten liegen als der Punkt A, befinden sich außerhalb des Bereichs der zulässigen Lösungen, da sie nicht auf der Kostenlinie liegen. Die auf diese Weise graphisch gefundene Lösung des Problems der Produktionsoptimierung entspricht der zuvor analytisch ermittelten Lösung. Nach der analytischen Lösung wird die maximale Produktionshöhe z — f(xj, x2) erreicht, wenn die Bedingung (3.14.1) erfüllt ist, d.h. wenn die Grenzproduktivitäten der Produktionsfaktoren Xj und x2 ihren Preisen proportional sind. Wie man leicht sieht, ist das Differential der Produktionsfunktion für die auf ein und derselben Isoquante liegenden Punkte gleich Null. Bei konstantem Produktionsniveau verschwindet folglich ihr Zuwachs dz, es gilt also
und daraus ergibt sich dx 2 dxx
8/ dxt 8f dxi
(3.16)
Wie aus der Zeichnung 3.4 ersichtlich ist, bezeichnet die linke Seite der Gleichung (3.16), d.h. das Verhältnis
den Anstieg der
§ 3. Beispiele der Margiiialoptimierung
87
betreffenden Isoquante. Das Verhältnis*) wird Grenzrate der Substitution genannt. Es charakterisiert die Bedingungen für die Substitution der Produktionsfaktoren im jeweiligen Punkt der Isoquante. Aus der Formel (3.15) erhellt eine weitere Eigenschaft des Verhältnisses Danach verbleibt nämlich der Punkt mit den Koordinaten dx i (*!+ Der absolute Betrag dieses Verhältnisses. 7»
88
Kapitel III. Margmaloptimierung
schar an, der verschiedene Produktionsniveaus entsprechen, und tragen die Kostengerade ein (Zeichnung 3.5). Wir wählen einen beliebigen Punkt K auf der Kostengeraden, dem ein bestimmtes Produktionsniveau entspricht, und fragen, ob die Produktion bei gleichen Kosten noch erhöht werden kann. Das ist offensichtlich möglich. Verschiebt man nämlich den Punkt K längs der Kostenlinie nach unten, dann steigt die Produktion, da der Punkt K nach einer Isoquante verschoben wird, die ein höheres Produktionsniveau repräsentiert. Dem entspricht jedoch eine veränderte Kombination der Produk-
Zeichnung 3.5
Zeichnung 3.6
tionsfaktoren Xi und x2. Bei gegebenen Kosten wird das Maximum der Produktion erreicht, wenn wir den Punkt K bis zum Punkt A verschieben, in dem die Kostengerade die entsprechende Isoquante tangiert. Eine weitere Verschiebung des Punktes K auf der Kostengeraden leitet zu keiner Isoquante mit höherem Produktionsniveau über, sondern führt auf Isoquanten, denen wieder ein niedrigeres Produktionsniveau entspricht. Auf diese Weise entnehmen wir unmittelbar der Zeichnung, daß man das Produktionsmaximum mit einer solchen technischen Variante erreicht, bei der die Größen der Produktionsfaktoren x1 und x2 den Koordinaten des Berührungspunktes der Kostengeraden mit der betreffenden Isoquante entsprechen. Analog kann man das duale Problem lösen und deuten, das in der Bestimmung des Kostenminimums bei vorgegebener Produktion
§ 3. Beispiele der Marginaloptimierung
89
besteht. In diesem Fall zeichnen wir die Isoquante, die dem gegebenen Produktionsniveau entspricht, und die Schar der Geraden, die die verschiedenen Kosten abbilden. Die Kostengeraden sind zueinander parallel, da ihr Anstieg stets — — beträgt. Je höher der Kostenaufwand P2
ist, desto höher liegt die jeweilige Gerade (Zeichnung 3.6). Wir wählen auf der Isoquante einen beweglichen Punkt K aus und lassen ihn auf der Isoquante nach unten wandern. Unter Beibehaltung des Produktionsniveaus (da sich der Punkt K ständig auf derselben Isoquante befindet) verringern wir den Kostenaufwand, da der Punkt auf niedriger gelegene Kostenlinien übergeht. Das Kostenminimum wird im Berührungspunkt der entsprechenden Kostenlinie mit der gegebenen Isoquante erreicht, also im Punkt A, in dem die Kostenlinie die Isoquante tangiert. Die Koordinaten des Punktes A geben demnach die optimale Kombination der Produktionsfaktoren an. Wir ersehen daraus erneut, daß das Dualproblem der Produktionsoptimierung dem ursprünglichen Problem gleichwertig ist, da es zu derselben Lösung führt. Mit Hilfe der graphischen Analyse wollen wir jetzt zu klären suchen, ob 1. stets eine Lösung des Problems der Produktionsoptimierung existiert und 2. falls die Lösung existiert, ob es nur eine oder mehrere Lösungen gibt. Den zuvor angefertigten Zeichnungen ist zu entnehmen, daß tatsächlich eine und nur eine Lösung existiert, wenn die Isoquanten die in den Zeichnungen 3.3, 3.5 und 3.6 enthaltene Form haben. Weisen die Isoquanten aber beispielsweise die in Zeichnung 3.7 gezeigte Gestalt auf, dann kann es zwei oder mehr Berührungspunkte der Kostenlinie mit der Isoquante geben. Das Problem kann demnach mehr als eine Lösung besitzen. Was bedeutet die für die Isoquanten als typisch erachtete Gestalt auf den Zeichnungen 3.3, 3.5 und 3.6? Beim Zeichnen der Isoquanten haben wir stillschweigend unterstellt, daß sie von oben (gesehen)
90
Kapitel III. Marginaloptimierung
konkav, 7) also konvex zum Ursprung des Koordinatensystems sind. Die Konkavität der Isoquanten ging aber nicht aus ihren Eigenschaften hervor, die wir am Beginn der Untersuchungen zur analytischen und graphischen Lösung des Problems der Produktionsoptimierung explizit erwähnten. Betrachten wir die Situation, wenn die Isoquanten von oben (gesehen) konvex, also zum Ursprung konkav sind (Zeichnung 3.8).
Dann ist im Punkt A, in dem die Kostenlinie die entsprechende Isoquante tangiert, nicht das Maximum der Produktionsfunktion bestimmt, sondern ihr Minimum. Man kann leicht nachprüfen, daß es beim Dualproblem analog ist. Wäre nämlich die Isoquante konvex, so würde der Berührungspunkt A der Kostenlinie mit der entsprechenden Isoquante das Kostenmaximum bei einem gegebenen Produktionsniveau bestimmen (Zeichnung 3.9). Aus diesen Untersuchungen folgt, daß das Problem der Produktionsoptimierung nur dann gelöst werden kann, wenn die Isoquanten zumindest in einem gewissen Bereich konkav sind. Die Lösung ist 7
> Gewöhnlich wird die Konkavität oder Konvexität einer Kurve bestimmt, indem man ihre Darstellung von oben betrachtet. Bei unseren Untersuchungen bedienen wir uns vorwiegend dieser Verabredung. [Dreht sich z.B. die Tangente der Kurve im entgegengesetzten Uhrzeigersinne, ist also / " ( * ) > 0 , — wie in den Zeichnungen 3.3, 3.5 und 3.6 —, dann nennt man die Kurve von oben (gesehen) konkav, also konvex zum Ursprung.]
§ 3. Beispiele der Marginaloptimierung
91
hierbei eindeutig, wenn die Isoquanten überall konkav sind. Die geometrische Bedingung der Konkavität der Isoquanten besagt, daß ihr Anstieg, also der absolute Wert des Verhältnisses Sf
dx2
dxl
"ST~~
dx2
ständig abnimmt, wenn x t ansteigt. Diese Bedingung kann man auch in der folgenden Form schreiben:8) Sr)
< 0
'
a l s o
Das ist das sogenannte „Gesetz" der zunehmenden Grenzrate der Substitution. Dieses „Gesetz" (genauer, die Annahme bezüglich der
Form der Isoquanten) besagt, daß sich die Substitutionsbedingungen mit der Steigerung von Xj verschlechtern. Man muß also für den Ersatz einer bestimmten Menge des Produktionsfaktors x2 eine immer größere Menge des Faktors Xi aufwenden. Die Bedingung für die Existenz einer Lösung des Problems der Produktionsoptimierung mit Hilfe der Marginalrechnung besteht
(3.17) ein Minuszeichen vorgesetzt, um einen positiven (absoluten) Wert zu erreichen.
92
Kapitel III. Marginaloptimierung
also darin, daß in einem gewissen Bereich*) das „Gesetz" der zunehmenden Grenzrate der Substitution erfüllt wird. Wird dieser Voraussetzung auf der gesamten Länge der entsprechenden Isoquante genügt, dann ist die Lösung eindeutig. Die auf der Grundlage geometrischer Untersuchungen hergeleitete Voraussetzung der zunehmenden Substitutionsrate kann man auch mit der analytischen Methode gewinnen. Den Beweis umgehen wir und beschränken uns lediglich auf die Darstellung der Bedingungen, die erfüllt sein müssen, damit die Funktion zweier Veränderlicher ein Maximum hat. Gegeben sei eine Funktion zweier Veränderlicher z — f(xi,x2). Es sei ferner die Bilanzgleichung pixi+p2x2 = c erfüllt. Dann folgt aus der Theorie der Marginaloptimierung, daß diese Funktion an jener Stelle (jci, x2) ein Maximum haben kann, für die gilt: 8f 8xx
. Bf ' 8x2
P, P2
und die zweite Ableitung der Funktion z = f(xu d2z
x2) negativ, d.h.
< 0
wird. Aus diesen Bedingungen kann man die Annahme über die zunehmende Substitutionsrate, d.h. die Annahme über die Konkavität der Isoquanten ableiten. 9 ' Im besonderen geht aus diesen Bedingungen hervor, daß die Isoquanten keine geraden Linien sein können. *) Es handelt sich hierbei um den sogenannten allgemeineren Normalfall der Produktion. Außerhalb dieses Bereiches liegt dann keine echte Substitution mehr vor. Vgl. R.G.D. Allen, Mathematik für Volks- und Betriebswirte, Duncker & Humblot, Berlin 1956, S. 297-98. »> Aus der Bilanzbedingung (3.10) bzw. (3.13) folgt dx1 = -—dx,. Pi
Damit
drücken wir das zweite Differential der Produktionsfunktion in der Form d2Z
=
r«:. ü/ L dx]
(il) 8x| \p2J
2
-
2
82f
8x13x2
•
dA p2 J
1
aus. Dieses Differential ist negativ, wenn der in der eckigen Klammer stehende Ausdruck negativ ist. Berücksichtigen wir die für das Maximum der Produktions-
§ 3. Beispiele der Marginaloptimierung
93
Wir untersuchen diesen letzten Fall näher und unterstellen, daß die Isoquanten gerade Linien sind. Man kann leicht feststellen (Zeichnung 3.10), daß die Lösung des Problems dann die Koordinaten des Punktes M sind, die auf der Abszissenachse liegen, oder die Koordinaten des Punktes N, die auf der Ordinatenachse liegen. Das hängt funktion notwendige Bedingung (3.14), dann können wir diesen Ausdruck in folgender Form
!?L 8x\
/Jf_y +
8x1 \ 8f_ I \ dx2 1
y/
8x,8x2
8f_ 8xi 8x2
und nach Umformung wie folgt schreiben:
1 I 82f 8f 82f 8f + , 8x\ 8x 8xi 8xzr)8x 8f 2 dx2 8f 8xl +-
82f 8f 81/ Bf \ 8x\ 8x, 8xidx2 8x2 )'
Die Ausdrücke vor den Klammern sind annahmegemäß positiv. Die Ausdrücke in den Klammern haben beide das gleiche Vorzeichen; denn aus der Formel (3.16) erhalten wir
(Px2 _ ^ '
"
und schließlich
d2xi
_
~~
82f 8f 82f 8f 8xf 8x2 8xi 8x2 8x, { & 82f 8f
8x\ 8xi
8*f 8f
8xi 8x2 8x2
( 8f \2
Das ist die Ableitung des Anstiegs der Isoquante
und ihre Umkehrung.
Beide Ableitungen haben das gleiche Vorzeichen. Da die Nenner positiv sind, haben die Zähler das gleiche Vorzeichen. Daraus folgt, daß d2z nur dann negativ ist, wenn beide genannten Ausdrücke in den Klammern negativ sind. Das bedeutet aber, daß die Bedingung (3.17> erfüllt sein muß.
94
Kapitel in. Marginaloptimierung
davon ab, ob der Anstieg der Kostengeraden kleiner oder größer als der Anstieg der geradlienigen Isoquanten ist. Diese Schlußfolgerung ist augenscheinlich und besagt, daß bei zwei substituierbaren Produktionsfaktoren zur Erreichung des Produktionsmaximums bei gegebenem Kostenaufwand ausschließlich der Produktionsfaktor anzuwenden ist, der relativ billiger ist. Die Bedingung, die derartige triviale Lösungen ausschließt, ist die zunehmende Substitutionsrate (die Konkavität der Isoquanten).
Der Genauigkeit wegen muß noch hinzugefügt werden, daß auch bei konkaven Isoquanten, d.h. wenn das „Gesetz" der zunehmenden Substitutionsrate erfüllt ist, eine Lösung vorhanden sein kann, in der einer der Produktionsfaktoren gleich Null ist. Ein solcher Spezialfall tritt dann ein, wenn die Isoquante eine Achse des Koordinatensystems berührt, beispielsweise die Abszissenachse (Zeichnung 3.11). Um diese Eventualität auszuschließen, muß man zusätzlich voraussetzen, daß die Isoquanten die Achsen des Koordinatensystems nicht berühren. § 4. Optimierung der Produktion bei n Produktionsfaktoren Wir verallgemeinern jetzt das Problem der Produktionsoptimierung für den Fall, daß n Produktionsfaktoren xj, x2, ..., x„ vorhanden sind, d.h., daß die Produktionsfunktion eine Funktion n Veränderli-
94
Kapitel in. Marginaloptimierung
davon ab, ob der Anstieg der Kostengeraden kleiner oder größer als der Anstieg der geradlienigen Isoquanten ist. Diese Schlußfolgerung ist augenscheinlich und besagt, daß bei zwei substituierbaren Produktionsfaktoren zur Erreichung des Produktionsmaximums bei gegebenem Kostenaufwand ausschließlich der Produktionsfaktor anzuwenden ist, der relativ billiger ist. Die Bedingung, die derartige triviale Lösungen ausschließt, ist die zunehmende Substitutionsrate (die Konkavität der Isoquanten).
Der Genauigkeit wegen muß noch hinzugefügt werden, daß auch bei konkaven Isoquanten, d.h. wenn das „Gesetz" der zunehmenden Substitutionsrate erfüllt ist, eine Lösung vorhanden sein kann, in der einer der Produktionsfaktoren gleich Null ist. Ein solcher Spezialfall tritt dann ein, wenn die Isoquante eine Achse des Koordinatensystems berührt, beispielsweise die Abszissenachse (Zeichnung 3.11). Um diese Eventualität auszuschließen, muß man zusätzlich voraussetzen, daß die Isoquanten die Achsen des Koordinatensystems nicht berühren. § 4. Optimierung der Produktion bei n Produktionsfaktoren Wir verallgemeinern jetzt das Problem der Produktionsoptimierung für den Fall, daß n Produktionsfaktoren xj, x2, ..., x„ vorhanden sind, d.h., daß die Produktionsfunktion eine Funktion n Veränderli-
§ 4. Optimierung der Produktion bei n Produktionsfaktoren
95
eher ist: z = f(xj, x2, ..., xn). Wir unterstellen des weiteren, daß nur eine Nebenbedingung in Form der Bilanzgleichung der Kosten p1x1+p2x2+
... +P„X„ = c
existiert. Die Randbedingungen sind Xx > 0, x2 ^ 0, ..., x„ > 0. Die notwendige Bedingung für die Existenz des Maximums der Produktionsfunktion bei einer Bilanzbedingung kann man in Form der folgenden beiden Gleichungen darstellen: d
z
=
•
•
•
+ i k
d x
«
und p1dxl+p2dx2+
... +P„dxn
=
=
0
(3.18)
0.
Diese beiden linearen Gleichungen sind gleichzeitig dann und nur dann erfüllt, wenn die Koeffizienten bei den Veränderlichen dxu dx2, ..., dxn proportional sind: ef dxi Pl
sf _
dx2 Pl
3f
_
__ "'
8x„ Pn '
Diese Bedingung besagt, daß bei gegebenen Kosten die Produktion z=f(xi,x2,...,x„) dann maximal ist, wenn die Grenzprodukte aller Produktionsfaktoren einander gleich sind. Die Bedingung (3.19) setzt sich aus (n— 1) Gleichungen zusammen. Mit der Bilanzgleichung der Kosten ermöglicht sie es, die Werte der Veränderlichen x1,x2,...,xn zu bestimmen, für die die Produktionsfunktion bei gegebenem Kostenaufwand das Maximum erreicht.10) Hat man diese Werte der Veränderlichen bestimmt — wir bezeichnen sie mit xf>, ..., x^ — dann kann man die optimale Produktionshöhe 0) ) Zo =/Ot, 4 V . . , 4 errechnen. 10
> Man kann zeigen, daß auch in diesem Fall die Lösung des Dualproblems (Minimum der Kosten bei gegebenem Produktionsniveau) dieselbe ist wie in dem ursprünglichen Problem, dem Primalproblem.
96
Kapitel III. Marginaloptimierung
Die Bedingung (3.19) erhält man auch, wenn zur Lösung der Aufgabe der Produktionsoptimierung die Methode der Lagrangeschen Multiplikatoren verwendet wird. Die Lagrangesche Funktion erhält in unserem Fall die Form L(xux2,
...,xn,
X) = f(xux2,
...,xa)—A(p1xi+p2x2+
...
+/VY„-c).
+
(3.20)
Die notwendige Bedingung für das Maximum dieser Funktion" ist ( / = 1,2,...,«).
(3.21)
Daraus erhalten wir Bf
A=
Pi
df
=
Pi
8f
=
Pn
(3.22)
Das ist gleichwertig mit der zuvor erhaltenen Bedingung (3.19). Wir erhalten dabei die ökonomische Interpretation des Lagrangeschen Multiplikators. Der Multiplikator X ist der gemeinsame Wert der Grenzprodukte der einzelnen Produktionsfaktoren unter den Bedingungen des optimalen Programms. Als Beispiel wenden wir die Methode der Lagrangeschen Multiplikatoren zur Lösung einer Optimierungsaufgabe an, bei der die Produktionsfunktion von drei Produktionsfaktoren abhängt, z = = f{xl,x2, und für die zwei Bilanzgleichungen existieren: pix1Jrp2x2+p3Xj,
= cj
n2x2-\-n3x3 = c2.
(3.23)
Die erste Gleichung bedeutet beispielsweise, daß die Gesamtkosten aller Produktionsfaktoren Mark betragen sollen, und die zweite, daß die Devisenausgaben (sagen wir in Rubel) für den Ankauf des zweiten und dritten Produktionsfaktors im Ausland c2 betragen sollen. Wir haben also zwei Bilanzlimite: das eine, ci, in Mark und das andere, c 2 , in Rubel. In der ersten Bilanzgleichung bedeuten pu p2 und p3 die Preise der Produktionsfaktoren in Mark und in der zweiten bezeichnen die Größen n 2 und n 2 den Preis des zweiten und dritten Produktionsfaktors in Rubel.
§ 4. Optimierung der Produktion bei n Produktionsfaktoren
97
Das Problem besteht in der Bestimmung einer solchen Kombination der Faktoren xit x2, x}, bei der die Produktion z = f(xu x2, x3) bei Erfüllung beider Bilanzgleichungen das Maximum erreicht. Die Lagrangesche Funktion hat in diesem Fall die Gestalt: L =/(*!,
x2,
xì)-Xl(plxl+p2x2+pìxì—ci)—
¿2(^2*2+^3*3—c2).
(3.24)
Die Funktion L (und die Produktionsfunktion z — f(xu x2, x3)) erreichen den Extremwert, wenn die partiellen Ableitungen von L nach xt, x2 und x3 verschwinden. Daraus folgt: ¿¡Pi',
-j^ =
= hPì+h^ì-
(3.25)
Aus dem System dieser drei Gleichungen kann man den Aufwand an den drei Produktionsfaktoren als Funktionen der Multiplikatoren Zt und errechnen: j c ^ j , A2), x2(lu X2) und x3(Alr A2). Setzt man diese Werte in die Bilanzgleichungen ein, so erhält man die beiden folgenden Gleichungen: Pl
+
(3.26)
aus denen wir die Werte Af' und ty0) bestimmen. Kennt man /{0) und A|0), so lassen sich die Werte x[0), x^0) und jc$0), die die Produktionsfunktion maximieren, sowie der maximale Wert dieser Funktion errechnen.11' interessant ist in diesem Beispiel die ökonomische Deutung der Multiplikatoren ^ und l 2 . Das Dualproblem besteht bei dieser Aufgabe im Auffinden des minimalen Wertes der „gewogenen Summe" der Bilanzgleichungen: h{PiXi-\-p2X2-\-p3X^+kz{n2x2+n3x^
=
l1c1+X2c2,
(3.27)
die man als verallgemeinerte Kostenfunktion bezeichnen kann. Daraus folgt, daß und X2 verschiedene Kostenbilanzen vergleichbar machen. Im gegebenen Beispiel gestatten die Multiplikatoren ^ und ?.2 den n
> Die Prüfung der hinreichenden Bedingungen für die Existenz des Maximums ist im vorliegenden Fall überflüssig, da aus dem Charakter des Problems hervorseht, daß die Produktionsfunktion ein Maximum hat.
98
Kapitel III. Marginaloptimierung
Vergleich der Bilanz der „Kosten in Mark" mit der Bilanz der „Kosten in Rubel". Sie sind gewissermaßen Umrechnungskoeffizienten, die die Kommensurabilität herstellen und die Berechnung der Summe beider Bilanzlimite ermöglichen. Auf diese Weise erhielten wir die eigentliche Formulierung des Dualproblems, bei dem es um die Minimierung des Kostenaufwandes sowohl in Mark als auch in Rubel geht, also um die Minimierung der verallgemeinerten Kostenfunktion, die die gewogene Summe der verschiedenen Bilanzgleichungen ist. Wir geben jetzt die geometrische Interpretation der Marginalmethode zur Lösung von Problemen der Produktionsoptimierung für den Fall, daß die Zielfunktion von mehr als zwei Produktionsfaktoren abhängt. Die von zwei Produktionsfaktoren abhängige Zielfunktion: z = x2) stellten wir graphisch mit Hilfe einer „Isoquantenkarte" in der Ebene Ox2 (Zeichnung 3.1.2) dar. Hängt die Zielfunktion von drei Produktionsfaktoren ab: z = f(x 1( x2, x3), so erhalten wir zweidimensionale Isoquantenflächen im dreidimensionalen Raum (Zeichnung 3.12), von denen jede einem gewissen
x.
Zeichnung 3.12
Produktionsniveau entspricht. Aus denselben Gründen, die wir bei der Analyse der von zwei Veränderlichen abhängigen Produktionsfunktion z = / ( * ! , x2) erörterten, müssen auch die Isoquantenflächen eine Reihe von Eigenschaften besitzen. Unter anderem müssen
99
§ 4. Optimierung der Produktion bei n Produktionsfaktoren
sie im Prinzip von oben konkav, d.h. konvex zum Ursprung des Koordinatensystems sein. Ferner hat die Bilanzgleichung der Kosten bei drei Produktionsfaktoren die Form p i x ^ p i x i + p ^ x i = c ihre geometrische Abbildung ist somit eine Fläche. Existiert also nur eine Bilanzgleichung, dann hat das Problem der Maximierung der Produktionsfunktion bei konstanten Kosten (wie auch das Dualproblem) als Lösung die Koordinaten des Punktes A ( x x , x3), in dem die Kostenfläche die betreifende Isoquantenfläche tangiert. Wie stellt sich aber die Situation dar, wenn die Produktionsfunktion von vier oder mehr Produktionsfaktoren abhängt? Wir gehen hierbei analog zum dreidimensionalen Fall vor. Im allgemeinen Fall, wenn n Produktionsfaktoren x x , • • • , x „ existieren und die Produktionsfunktion z = f ( x x , x2, • .., x„) eine Funktion n Veränderlicher ist, sind ihre Isoquanten («— l)-dimensionale Hyperflächen im n-dimensionalen euklidischen Raum. 12) Die Bilanzgleichung der Kosten p i x p x + p x t ... + p x „ = c entspricht dann einer (n—l)-dimensionalen H y p e r e b e n e in demselben n-dimensionalen Raum. Die Lösung des Problems stellen die Koordinaten des Punktes A ( x i , x , . . . , x„) dar, in dem die Hyperebene der Kosten die entsprechende Isoquanten-Hyperfläche der Produktion tangiert. u
l f
2
u
1
j
r
2
2
2
i
3
j
n
2
12> Die Produktionsfunktion selbst kann man als «-dimensionale Hyperfläche im (ft-H)-dimensionalen Raum deuten.
100
Kapitel III. Marginaloptimierung
Zum Schluß geben wir die geometrische Interpretation des Falles, in dem sowohl die Produktionsfunktion als auch die Bilanzgleichungen nichtlineare Funktionen zweier Veränderlicher sind, die in der Zeichnung also als beliebige Kurven dargestellt werden. Aus den Zeichnungen 3.13, 3.14 und 3.15 geht folgendes hervor: Sind die Isoquanten der Produktionsfunktion konkav, so besteht die Bedingung für die Existenz einer die Funktion maximierenden Lösung darin, daß die Kostenkurve konvex (Zeichnung 3.13) oder konkav ist, dann aber mit einer geringeren Konkavität als die der Isoquanten der Produktionsfunktion (Zeichnung 3.14). Die Kostenkurve darf keine größere Konkavität als die Isoquanten besitzen (Zeichnung 3.15), weil sonst die Koordinaten des Berührungspunktes A der Kostenkurve mit der entsprechenden Isoquante Aufwände der Produktionsfaktoren bestimmen würden, die die Produktionsfunktion bei gegebenen Kosten minimieren. Bei Einhaltung der erwähnten Bedingung entsprechen jedem anderen Punkt der Kostenkurve, z.B. dem Punkt B, dieselben Kosten, aber eine höhere Produktion.
Zeichnung 3.15
Zeichnung 3.16
Die der soeben formulierten geometrischen Bedingung entsprechende analytische Bedingung für die Existenz des Maximums der Produktionsfunktion lautet bekanntlich, daß die zweite Ableitung der Lagrangeschen Funktion negativ ist. Im allgemeinen Fall der von mehreren Veränderlichen abhängigen Produktionsfunktion muß also die Isoquanten-Hyperfläche konkaver („von oben gesehen") als
§ 4. Optimierung der Produktion bei n Produktionsfaktoren
101
die Hyperfläche sein, die die Bilanzgleichung der Kosten repräsentiert. Die Zeichnung 3.16 zeigt schließlich, daß die Methode zur Lösung von Aufgaben der Marginaloptimierung und ihre Ergebnisse keinen Veränderungen unterliegen, wenn die Bilanzbedingungen in Form von Ungleichungen gegeben sind, z.B. Pixljrp2x2 < c. Die Bilanzbedingung besagt dann, daß den Bereich der zulässigen Lösungen die Koordinaten aller Punkte bilden, die unterhalb der Kostengeraden liegen (schraffierter Bereich in der Zeichnung 3.16). Die maximale Produktionshöhe entspricht in diesem Fall natürlich ebenfalls dem Berührungspunkt A der Kostengeraden mit der betreffenden Isoquante, da dieser Punkt zum Bereich der zulässigen Lösungen gehört. Wir sehen also, daß die Veränderung der Bilanzgleichungen in Bilanzungleichungen im Prinzip keinen Einfluß auf die Lösung des Problems in den Fällen hat, in denen die Anwendung der Marginalrechnung möglich ist.
Kapitel IV
Lineare Optimierung § 1. Mathematische Formulierung des Problems der linearen Optimierung In diesem Kapitel beschäftigen wir uns mit einem Spezialfall der Theorie der Optimierung, der bei ökonomischen Berechnungen eine große praktische Bedeutung hat. Es handelt sich um die sogenannte lineare Optimierung. Sie ist dadurch charakterisiert, daß sowohl die Zielfunktion als auch die Bilanzbedingungen lineare Funktionen der Veränderlichen xlf x2, • ••, x„ sind. Die Aufgabe der linearen Optimierung kann man also auf folgende Weise formulieren: Die Veränderlichen x1,x2,...,xn sind so zu bestimmen, daß die Zielfunktion n z = X-Pi*; = Max. (4.1) unter Einhaltung der Bilanzbedingungen X briXi < cr (oder = cr) (r = 1, 2, ..., m) i=i und der Randbedingungen x^O (/=l,2,...,n).
(4.2) (4.3)
Im allgemeinen wird vorausgesetzt, daß alle Koeffizienten, die in der Zielfunktion vorkommen, positiv sind, also p t > 0 (i = 1, 2, ..., Wir prüfen als erstes, ob dieses besondere Problem der Optimierung mit der Methode der Marginalrechnung gelöst werden kann. Die notwendige Bedingung dafür, daß die Funktion (4.1) ein Maximum unter Nebenbedingungen besitzt, lautet (vgl. Formel (3.4)) 8f du ,. , „ x
§ 1. Mathematische Formulierung der linearen Optimierung
103
Hierbei ist u die Funktion des Aufwands an Mitteln, die durch die Formel m r= 1
bestimmt wird. Die Funktion u erhält infolge der Bilanzbedingungen (4.2) die Form: m n "1 u
=
Z
^r
b
£
nXi—cr
.
Die Bedingung (4.4) für das Maximum der Zielfunktion kann man so schreiben: m P i = YT =i W >« (i=l,2,...,n). (4.4.1) 1 Die hinreichende Bedingung dafür, daß die Funktion z = f(xl5 x2, ..., x„) für den allgemeinen Fall ein Maximum unter Nebenbedingungen hat, lautet, daß das Differential zweiter Ordnung der ihr entsprechenden Lagrangeschen Funktion negativ ist (Formel (3.8), Kapitel III), also daß 0,
d2L
n. Daraus folgt, daß man aus den Gleichungen (4.4.1) die Multiplikatoren Ar nicht ermitteln kann, da das System von n Gleichungen (4.4.1) mit m Unbekannten Xr im allgemeinen widersprüchlich, d. h. hier überbestimmt, ist (m < n). Es gibt hier also mehr Gleichungen als Unbekannte. Damit das System widerspruchsfrei ist, müssen die Koeffizienten p¡ und bri so ausgewählt sein, daß nur m dieser Gleichungen unabhängig sind § 2. Die geometrische Interpretation der linearen Optimierung — Der Begriff des Simplexes Da die Methode der Marginalrechnung für Aufgaben der linearen Optimierung nicht angewendet werden kann, wird es notwendig, nach anderen Lösungswegen für diese Probleme zu suchen. Solche Lösungswege vermittelt uns die Theorie der linearen Optimierung. Es gibt zwei prinzipielle Lösungsmethoden für Aufgaben der linearen Optimierung: erstens—die geometrische Lösung, zweitens—die algebraische Lösung. Die geometrische Lösung kann in der Praxis nur dann angewendet werden, wenn im Programm zwei oder höchstens drei Unbekannte auftreten. Im letzteren Fäll ist es erforderlich, ein räumliches Modell zu entwickeln. Trotzdem beginnen wir damit, die Theorie der linearen Optimierung an Hand der geometrischen Lösungsmethode darzustellen, da sie uns die Art und Weise der algebraischen Lösung des betrachteten Problems näherbringt. Wenn im linearen Programm nur zwei Veränderliche, x, und x2, auftreten, ist seine geometrische Interpretation und Lösung sehr einfach.
§ 2. Geometrische Interpretation der linearen Optimierung
105
Die Bilanzbedingungen, die dann die Form
}
021^1+022^2 < ^ 2 J
haben, kann man im rechtwinkligen Koordinatensystem der Ebene mit Hilfe der Geraden I und II (Zeichnung 4.1.1) darstellen. Haben
Zeichnung 4.1.1.
Zeichnung 4.1.2
die Bilanzbeschränkungen die Form von Gleichungen, so besteht der Bereich der zulässigen Lösungen aus dem einen Punkt A als Schnittpunkt der Geraden I und II. Sind aber die Bilanzbeschränkungen (4.2.1) in unscharfen** Ungleichungen formuliert, dann bilden den Bereich der zulässigen Lösungen die Punkte des ersten Quadranten des Koordinatensystems (jq > 0 und x2 > 0), die unterhalb der Geraden I und II liegen (auf der Zeichnung 4.1.1 die Punkte des schraffierten Vierecks OM2ANl) zusammen mit den Punkten der entsprechenden Abschnitte dieser Geraden (AN1 und AM2). Die Zielfunktion für den vorgegebenen Realisierungsgrad des Zieles z„ kann man in der Form z 0 = P1X1+P2X2
(4.1.1)
schreiben. Wird der Realisierungsgrad des Zieles z0 verändert, so erhält man *> Unscharfe Ungleichungen: < , > ; scharfe Ungleichungen: < , > .
106
Kapitel IV. Lineare Optimierung
auf der Abbildung eine Schar paralleler Isoziellinien*> mit der Gleichung _
Zo _
-*2 — Pl~
P, Pl
Aus dieser Gleichung resultiert, daß die betreffende Isozielgerade umso höher liegt, je größer der Realisierungsgrad des Zieles ist. Wie aus der Zeichnung 4.1.1 zu ersehen ist, sind die Koordinaten des Schnittpunktes A der Geraden I und II die optimale Lösung der Aufgabe; denn durch diesen Punkt führt die am höchsten gelegene Isozielgerade, die mindestens einen gemeinsamen Punkt mit dem Bereich der zulässigen Lösungen hat. Nun analysieren wir die erhaltene Lösung. Vor allem bemerken wir, daß das Programm nur dann eine maximale Lösung hat, wenn der Bereich der zulässigen Lösungen, im gegebenen Fall das Viereck OM2ÄN1, konvex ist, wie auf Zeichnung 4.1.1. Ist hingegen der Bereich der zulässigen Lösungen konkav, wie z. B. auf der Zeichnung 4.1.2, dann bestimmen die den Bilanzgleichungen entsprechenden Koordinaten des Schnittpunktes A der Geraden I und II das Minimum und nicht das Maximum der Funktion. Wir haben hier eine vollständige Analogie zu den Fällen, in denen wir eine mögliche Lösung nichtlinearer Programme analysierten (vgl. Paragraph 3, Kapitel III).1) Wir stellen weiter fest, daß der Bereich der zulässigen Lösungen auf der Zeichnung 4.1.1 drei Scheitelpunkte2) hat: A, M2 und Es kann eintreten, daß die der Zielfunktion entsprechende am höchsten *> Ist das Optimierungsproblem linear, d.h. sind Zielfunktion und Nebenbedingungen linear, so haben wir es mit Geraden bzw. Ebenen als Spezialfällen von Linien und Flächen zu tun. '' Der grundsätzliche Unterschied zwischen der geometrischen Interpretation der Marginaloptimierung und der Linearoptimierung besteht darin, daß das geometrische Bild des Bereichs der zulässigen Lösungen bei der Marginaloptimierung „glatt", bei der Linearoptimierung hingegen „kantig" bzw. „eckig" ist. Die „Kantigkeit" bzw. „Eckigkeit" ist die Ursache dafür, daß die Linearoptimierung nicht mit der Methode der Differential-(Marginal-)rechnung lösbar ist. 2> Den Scheitelpunkt im Ursprung des Koordinatensystems lassen wir unberücksichtigt, da er bei unseren Untersuchungen keine Rolle spielt.
§ 2. Geometrische Interpretation der linearen Optimierung
107
gelegene Gerade (die einen gemeinsamen Punkt mit dem Bereich der zulässigen Lösungen hat) anstatt durch den Punkt A durch den Punkt M z oder N t führt, wie das auf den Zeichungen 4.2.1 und 4.2.2
gezeigt wird. Wenn die Isozielgerade den Bereich der zulässigen Lösungen im Punkt M2 berührt, dann ist das Programm optimal für Xi = OM2 und x2 = 0. Berührt hingegen die am höchsten gelegene Isozielgerade den Bereich der zulässigen Lösungen im Punkt so ist das Programm optimal für x^ = 0 und x2 — ON\. Für den Spezialfall, daß der Anstieg der Isozielgeraden mit dem der Geraden I zusammenfällt, sind die Lösung des linearen Programms die Koordinaten aller Punkte des Abschnittes AN\. Und stimmt der Anstieg der Isozielgeraden mit dem der Geraden II überein, so sind analog die Lösung des linearen Programms die Koordinaten eines beliebigen Punktes des Abschnittes AM2. In beiden Fällen hat das lineare Programm keine eindeutige Lösung. Aus der geometrischen Analyse geht hervor, daß die Lösung des linearen Programms die Koordinaten des Scheitelpunktes des konvexen Bereichs der zulässigen Lösungen sind. Sind die Koordinaten zweier Scheitelpunkte die Lösung, dann sind es auch die Koordinaten aller Punkte des Abschnittes, der die Scheitelpunkte verbindet. Welcher Scheitelpunkt, bzw. welche Scheitelpunkte die Lösung der Aufgabe bestimmen, hängt vom Anstieg der Isozielgeraden ab. Charakteristisch für die lineare Optimierung ist auch die Tatsache, daß eine Veränderung des Anstiegs der Isozielgeraden in gewissen
108
Kapitel IV. Lineare Optimierung
Grenzen die Lösung nicht beeinflußt. Wir verändern den Anstieg der Isozielgeraden in der Zeichnung 4.1.1 so, daß die Gerade AC (die durch den Punkt A führende Isozielgerade) innerhalb des Winkels Mi AM2 liegt. Lösung des Programms sind dann tatsächlich weiterhin die Koordinaten des Punktes A. Eine derartige Erscheinung tritt bei der Marginaloptimierung nicht auf. Dort verursacht eine Veränderung des Anstiegs der Isoziellinie im Prinzip eine Veränderung der Lösung der Optimierungsaufgabe. Wir verallgemeinern jetzt die geometrische Interpretation der Lösungen der linearen Optimierung für den Fall, daß im Programm 3 Veränderliche und 3 Bilanzbedingungen enthalten sind. Die Aufgabe, die wir geometrisch deuten wollen, besteht in der Bestimmung solcher drei Veränderlichen (z.B. Aufwände an Produktionsfaktoren *i> x2,x3), die den Wert der Zielfunktion (beispielsweise die Produktionshöhe) z = />l*l+/>2*2+;>3*3
(4.1.2)
unter Einhaltung der Bilanzbedingungen «11*1 + 012*2+013*3 < Ci 021*1 + 022*2 + 023*3 < C2 «31*1 + 032*2+033*3 < Ci .
(4.2.2)
und der Randbedingungen *i>0,
x2>0,
x3>0
(4.3.2)
maximieren. Sind die Bilanzbedingungen Gleichungen, so kann man jede von ihnen als Gleichung einer Ebene im dreidimensionalen Raum auffassen, und der diesen drei Ebenen gemeinsame Punkt (der zufolge der Randbedingungen (4.3.2) im ersten Achtel des dreidimensionalen Koordinatensystems hegt) ist der einzige Punkt, der eine zulässige Lösung darstellt (Zeichnung 4.3.1). Sind die Bilanzbedingungen Ungleichungen, dann bilden den Bereich der zulässigen Lösungen die Punkte eines konvexen Polyeders, das im ersten Achtel des dreidimensionalen Koordinatensystems unterhalb aller den Bilanzbedingungen entsprechenden Ebenen liegt.
§ 2. Geometrische Interpretation der linearen Optimierung
109
Die Gleichung der Zielfunktion (4.1.2) begrenzt für den vorgegebenen Wert z im dreidimensionalen Falle ebenfalls eine gewisse Ebene. Ordnet man der Veränderlichen z verschiedene Werte zu, so erhält
man in der Darstellung eine Schar paralleler Isozielebenen. Dabei entspricht einem größeren Wert z eine höher gelegene, d.h. eine vom Ursprung des Koordinatensystems weiter entfernte Ebene. Es leuchtet ein, daß auch in diesem Fall die Koordinaten eines der Scheitelpunkte des konvexen Polyeders der zulässigen Lösungen die Lösung des Programms bezeichnen, und zwar sind das die Koordinaten jenes Scheitelpunktes, in dem die am höchsten gelegene Isozielebene das konvexe Polyeder berührt. Welcher der Scheitelpunkte das tatsächlich ist, hängt vom Anstieg der Isozielebenen und der Ebenen ab, die den Bilanzbedingungen entsprechen. Auch hier können mehrdeutige Lösungen entstehen. Das tritt ein, wenn die am höchsten gelegene Isozielebene (die gemeinsame Punkte mit dem Bereich der zulässigen Lösungen hat) ausnahmsweise das Polyeder der zulässigen Lösungen entweder längs einer Kante berührt, also durch zwei seiner Scheitelpunkte führt, z.B. A und B, oder längs einer Fläche, also durch drei Scheitelpunkte des Polyeders verläuft, beispielsweise A, B und D (Zeichnung 4.3.1). Wir bedenken noch den Fall, daß anstelle von drei nur zwei Bilanzgleichungen vorliegen. Bereich der zulässigen Lösungen ist dann die Schnittkante der durch die Bilanzgleichungen bestimmten Ebenen
110
Kapitel IV. Lineare Optimierung
oder genauer — der Abschnitt dieser Kante, der im ersten Achtel des Koordinatensystems, also im positiven Bereich, liegt (AD auf der Zeichnung 4.3.2). Wenn nur eine Bilanzgleichung existiert, dann
ist der Bereich der zulässigen Lösungen das Dreieck, dessen Seiten die Schnittgeraden der durch diese Gleichung bestimmten Ebene mit den Ebenen der Koordinatenachsen sind (Zeichnung 4.3.3). Auch in diesen Fällen sind die Lösungen des Programms die Koordinaten der Scheitelpunkte der entsprechenden Figuren (Abschnitt, Dreieck), jedoch mit der Einschränkung, daß—wie z u v o r — i n Sonderfällen auch Lösungen auftreten können, die nicht eindeutig sind. 3) Wir können jetzt die allgemeine geometrische Interpretation f ü r die Lösung der linearen Optimierung geben. Dazu bedienen wir uns der Begriffe und Sprache der mehrdimensionalen Geometrie (n > 3). Diese Interpretation dient uns, das algebraische Vorgehen bei der Lösung von Aufgaben der linearen Optimierung zu erläutern. Die als Gleichungen formulierten Bilanzbedingungen (4.2) bestimmen (n— l)-dimensionale Hyperebenen, die im «-dimensionalen 3
) Beispiele für die konkrete Lösung von Aufgaben der linearen Optimierung nach der graphischen Methode findet man in der einschlägigen Literatur sehr häufig. Vgl. O. Lange, Einführung in die Ökonometrie, a. a. O., S. 250 ff. u. 262 (Problem der optimalen Diät und Programm zur Entwicklung der Produktion von Elektroenergie); M. Lesz, Z praktyki programowania liniowego (Aus der Praxis der linearen Optimierung), PWE, Warschau 1962, S. 82 ff.
§ 2. Geometrische Interpretation der linearen Optimierung
111
Raum liegen. Es gibt ebensoviele Hyperebenen, z.B. m, wie Bilanzgleichungen. Die Hyperebenen schneiden sich und bestimmen in jenem Teil des «-dimensionalen Koordinatensystems, in dem die Koordinaten nicht negativ sind, ein gewisses konvexes geometrisches (Schnitt-)Gebilde. Wir bezeichnen es als Hyperpolyeder oder genauer als konvexes Polyeder. Dieses Polyeder hat die Dimension n—m. Das resultiert aus folgender Überlegung: Das Schnittgebilde zweier Geraden, also eindimensionaler Gebilde in der zweidimensionalen Ebene, ist ein O-dimensionaler Punkt. Das Schnittgebilde zweier zweidimensionaler Ebenen im dreidimensionalen Raum ist eine eindimensionale Gerade. Und das Schnittgebilde dreier zweidimensionaler Ebenen im dreidimensionalen Raum ist ein O-dimensionaler Punkt. Das Schnittgebilde zweier dreidimensionaler Hyperebenen, die im vierdimensionalen Raum liegen, ist eine zweidimensionale Ebene usw. Wenn also im n-dimensionalen Raum m Hyperebenen vorliegen, dann hat das Schnittgebilde dieser Hyperebenen die Dimension n—m. Zur selben Schlußfolgerung gelangen wir, wenn wir uns vergegenwärtigen, daß bei Vorliegen von m Bilanzbedingungen ein Programm mit n Veränderlichen n—m Freiheitsgrade besitzt. Das bedeutet, daß die Werte von m Unbekannten des Programms durch n—m beliebig gewählte Veränderliche bestimmt sind. Das kann man folgendermaßen schreiben:
X2 =
A2lXm+i-\-A22Xm+2-\-
...
-h^2,n-mX„
Jede zusätzliche Bilanzgleichung verringert die Anzahl der Freiheitsgrade um 1, und gleicherweise reduziert jede zusätzliche Hyperebene die Dimension des Schnittgebildes dieser Hyperebenen um 1. Sämtliche Punkte auf der Oberfläche des («—m)-dimensionalen konvexen Polyeders, das als Schnittgebilde der Bilanzhyperebenen entstanden ist, bilden den Bereich der zulässigen Lösungen. Liegen die Bilanzbedingungen (4.2) als unscharfe Ungleichungen vor,
112
Kapitel IV. Lineare Optimierung
dann werden in den Bereich der zulässigen Lösungen die innerhalb dieses Polyeders liegenden Punkte einbezogen. n Die Zielfunktion z = £ bestimmt eine n-dimensionale Hyper1=1 ebene im («+ l)-dimensionaIen Raum. Für einen vorgegebenen Realisierungsgrad des Zieles z = z0 reduziert sie sich auf eine (n— 1)dimensionale Hyperebene. Wird der Realisierungsgrad des Zieles verändert, dann erhält man eine Schar (n— l)-dimensionaler Isozielhyperebenen. Der Berührungspunkt (oder die -punkte) des den Bereich der zulässigen Lösungen bildenden Polyeders mit der am höchsten gelegenen (d.h. der vom Ursprung des Koordinatensystems entferntesten) Isozielhyperenebe bestimmt das Maximum dieser Funktion. Die Koordinaten dieses Punktes (oder dieser Punkte, falls es mehrere sind) ergeben die optimale Lösung der Optimierungsaufgabe. Im allgemeinen berührt das Polyeder die Isozielhyperebene an seinem am höchsten gelegenen Scheitelpunkt, und dann existiert eine eindeutige Lösung der Aufgabe. Erfolgt die Berührung mit der Isozielhyperebene aber an zwei Scheitelpunkten des Polyeders, dann liegt es mit einer ganzen Kante an der Isozielhyperebene an, also längs des Abschnittes, der beide Scheitelpunkte verbindet. Wenn die Berührung des Polyeders mit der Isozielhyperebene an drei Scheitelpunkten des Polyeders erfolgt, dann liegt es in der zweidimensionalen Ebene des durch die 3 Scheitelpunkte des Polyeders bestimmten Dreiecks, also mit diesem gesamten Dreieck, an der Isozielhyperebene an. Wird allgemein das Polyeder in k Scheitelpunkten von der Isozielhyperebene berührt, dann liegt das Polyeder mit einem (k— 1)dimensionalen geometrischen Gebilde (einer Fläche oder besser Hyperfläche des Polyeders), das durch diese Punkte bestimmt wird, an ihr an. Ein derartiges Gebilde bezeichnet man in der mehrdimensionalen Geometrie als Simplex. Daraus folgt, daß das Simplex eine um 1 geringere Dimension besitzt, als es gemeinsame Scheitelpunkte des Polyeders, das als Schnittgebilde der die Bilanzbedingungen darstellenden Hyper-
§ 2. Geometrische Interpretation der linearen Optimierung
113
ebenen entsteht, mit der am höchsten gelegenen Isozielhyperebene gibt. Oder anders ausgedrückt: k Scheitelpunkte des Polyeders bestimmen das (k— l)-dimensionale Simplex. In den einzelnen Fällen kann das Simplex ein Punkt (Dimension 0), ein Abschnitt (Dimension 1), ein Dreieck (Dimension 2), ein Tetraeder (Dimension 3) usw. sein. Fassen wir die erhaltenen Ergebnisse zusammen: 1. Die optimale Lösung in der linearen Optimierung wird durch einen oder mehrere Scheitelpunkte des Bereichs der zulässigen Lösungen bestimmt. Dieser Bereich ist ein («—/n)-dimensionales konvexes geometrisches Gebilde (Hyperpolyeder), wobei n die Anzahl der Unbekannten des Programms und m die Anzahl der unabhängigen Bilanzbedingungen angibt. 2. Die Lösung des Programms ist eindeutig, wenn das Polyeder in einem am höchsten gelegenen Scheitelpunkt von der Isozielhyperebene berührt wird. 3. Die Lösung ist nicht eindeutig, wenn das Polyeder von der Isozielhyperebene in k > 1 Scheitelpunkten berührt wird. Die Lösung wird dann durch ein (k— l)-dimensionales Simplex bestimmt, besitzt also k— 1 Freiheitsgrade. Deshalb können k— 1 Werte der Veränderlichen beliebig festgelegt werden, während die übrigen n—k+ + 1 Veränderlichen hiervon lineare Funktionen sind. Wir geben jetzt noch die geometrische Interpretation der Lösung einer konkreten Aufgabe der linearen Optimierung, die sich geometrisch einfach darstellen läßt. In der Aufgabe betrage die Anzahl der Unbekannten n = 8 und die Anzahl der Bilanzgleichungen m = 6. Der Bereich der zulässigen Lösungen hat demnach die Dimension n—m = 8—6 = 2, ist also ein gewöhnliches Vieleck beispielsweise auf der Ebene Xi Ox2 liegend, die im achtdimensionalen Raum liegt. Wegen der Randbedingungen xx > 0 und x2 > 0 interessiert uns lediglich der Teil des Vielecks, der den nichtnegativen Werten der Koordinaten entspricht (Zeichnungen 4.4.1 und 4.4.2). Die Projektionen der Isozielebenen auf die Ebene JC, OX2 bilden eine Schar paralleler Geraden. Das Maximum der Zielfunktion wird im Bereich der zulässigen Lösungen durch den am höchsten
114
Kapitel IV. Lineare Optimierung
gelegenen Scheitelpunkt des Vieleckes bestimmt, in dem es von einer dieser Geraden berührt wird. Auf der Zeichnung 4.4.1 existiert nur ein solcher Scheitelpunkt, die Lösung ist demnach durch die
Zeichnung 4.4.1
Zeichnung 4.4.2
Koordinaten dieses Scheitelpunktes eindeutig bestimmt. Auf der Zeichnung 4.4.2 existieren hingegen die beiden Scheitelpunkte A und B; in diesem Fall ist die Lösung vieldeutig, sie wird durch die Koordinaten sämtlicher Punkte des Abschnittes AB bestimmt und besitzt folglich den Freiheitsgrad 1. Die geometrische Interpretation einer Aufgabe der linearen Optimierung ist auch mit Hilfe eines räumlichen Modells möglich, wenn n—m = 3, z.B. wenn n = 8 und m = 5 ist. In diesem Fall ist der Bereich der zulässigen Lösungen ein dreidimensionales Polyeder. Seine Seiten sind Teile von Ebenen. Die Projektion der Isozielhyperebenen auf den dreidimensionalen Raum ergibt ebenfalls Ebenen. Das Polyeder kann von der am höchsten gelegenen Ebene in einem Scheitelpunkt berührt werden, es kann aber auch mit einer Kante oder einer ganzen Seite an dieser Ebene anliegen. Entsprechend diesen Möglichkeiten gibt es eine eindeutige Lösung, eine Lösung mit einem Freiheitsgrad und eine Lösung mit zwei Freiheitsgraden. § 3. Grundlegende Sätze der Theorie der linearen Optimierung — Das Dualitätsprinzip der linearen Optimierung Wie wir im vorigen Paragraphen erläuterten, kann man Aufgaben der linearen Optimierung mit der graphischen Methode nur für die
114
Kapitel IV. Lineare Optimierung
gelegenen Scheitelpunkt des Vieleckes bestimmt, in dem es von einer dieser Geraden berührt wird. Auf der Zeichnung 4.4.1 existiert nur ein solcher Scheitelpunkt, die Lösung ist demnach durch die
Zeichnung 4.4.1
Zeichnung 4.4.2
Koordinaten dieses Scheitelpunktes eindeutig bestimmt. Auf der Zeichnung 4.4.2 existieren hingegen die beiden Scheitelpunkte A und B; in diesem Fall ist die Lösung vieldeutig, sie wird durch die Koordinaten sämtlicher Punkte des Abschnittes AB bestimmt und besitzt folglich den Freiheitsgrad 1. Die geometrische Interpretation einer Aufgabe der linearen Optimierung ist auch mit Hilfe eines räumlichen Modells möglich, wenn n—m = 3, z.B. wenn n = 8 und m = 5 ist. In diesem Fall ist der Bereich der zulässigen Lösungen ein dreidimensionales Polyeder. Seine Seiten sind Teile von Ebenen. Die Projektion der Isozielhyperebenen auf den dreidimensionalen Raum ergibt ebenfalls Ebenen. Das Polyeder kann von der am höchsten gelegenen Ebene in einem Scheitelpunkt berührt werden, es kann aber auch mit einer Kante oder einer ganzen Seite an dieser Ebene anliegen. Entsprechend diesen Möglichkeiten gibt es eine eindeutige Lösung, eine Lösung mit einem Freiheitsgrad und eine Lösung mit zwei Freiheitsgraden. § 3. Grundlegende Sätze der Theorie der linearen Optimierung — Das Dualitätsprinzip der linearen Optimierung Wie wir im vorigen Paragraphen erläuterten, kann man Aufgaben der linearen Optimierung mit der graphischen Methode nur für die
§ 3. Grundlegende Sätze der Theorie der linearen Optimierung
115
Fälle lösen, in denen die Anzahl der Unbekannten 2 oder 3 beträgt. Im letzten Fall ist es notwendig, ein dreidimensionales Modell zu verwenden. Enthält die Aufgabe mehr als drei Unbekannte, so löst man sie mit Methoden der linearen Algebra. Es gibt mehrere Algorithmen, d.h. Rechenverfahren, zur Lösung von Aufgaben der linearen Optimierung.4) Bei einer größeren Anzahl von Veränderlichen und Bilanzbedingungen ist die praktische Ausführung dieser Berechnungen mit Hilfe gewöhnlicher Rechenmaschinen im allgemeinen sehr arbeitsaufwendig. Aus diesem Grund verwendet man immer häufiger elektronische Rechenanlagen zur Lösung von Aufgaben der linearen Optimierung.5) Die Algorithmen zur Lösung solcher Aufgaben sind unmittelbar oder mittelbar mit der im vorigen Paragraphen gegebenen geometrischen Interpretation verbunden. Sie beruhen darauf, den am höchsten gelegenen Scheitelpunkt des Bereichs (Polyeders) der zulässigen Lösungen mit Methoden der sogenannten Iteration aufzufinden. Hierbei geht man schrittweise von niederen zu höheren Scheitelpunkten dieses Bereichs über. 4 > Derartige Algorithmen haben ausgearbeitet: G.B. Dantzig, Maximization of a Linear Function of Variables Subject to Linear Inequalities, in: „Activity Analysis of Production and Allocation", New York 1951; R. Frisch, Principles of Linear Programming, Oslo 1954, sowie The Multiplex Method for Linear Programming, Oslo 1958; R. Dorfman, P.A. Samuelson und R.M. Solow, Linear Programming and Economic Analysis, McGraw-Hill, New York—Toronto—London 1958. Vgl. auch G.B. Dantzig, Linear Programming and Extentions, Princeton 1963, sowie D.B. Judin und E.G. Golstein, Zadatschi i metody lineinogo programirowanija (Aufgaben und Methoden der linearen Programmierung), Moskwa 1961; deutsch: Lineare Optimierung, Bd. I, Akademie-Verlag, Berlin 1968. 5 > Vgl. z.B. a) J. Leseault, Programme linéaire et calculateurs électroniques, in: „Revue de Recherche Operationelle", Bd. I, Nr. 4, Paris 1957; b) Primenenije tsifrowych wytschislitelnych maschin w ekonomike — Transportnaja zadatscha linejnogo programmirowanija, Akademija Nauk SSSR, Moskwa 1962; c) Primenenije matematiki i elektronnoj techniki w planirowani, Isdatelstwo Ekonomitscheskoj Literatury, Moskwa 1961. [Vgl. auch Mathematik und Rechentechnik bei der Planung, Verlag Die Wirtschaft, Berlin 1964.]
116
Kapitel IV. Lineare Optimierung
In unserer Darstellung bedienen wir uns der heute schon klassisch gewordenen Methode zur Lösung linearer Optimierungsaufgaben, der von G.B. Dantzig ausgearbeiteten Simplex-Methode. Die Simplex-Methode, wie auch die Mehrzahl analoger Algorithmen, stützt sich auf einen grundlegenden Satz der Theorie der linearen Optimierung, den man bezogen auf eindeutig lösbare, nicht degenerierte Probleme6) folgendermaßen formulieren kann: Das optimale Programm besitzt ebenso viele positive Veränderliche, wie Bilanzbedingungen in Form unabhängiger Gleichungen (Bilanzgleichungen) erfüllt sind. Die übrigen Veränderlichen haben den Wert Null.*) Um diesen Satz zu beweisen, befassen wir uns vor allem mit der Formulierung und Analyse des Dualproblems in der linearen Optimierung.**) Wir formulieren noch einmal die Aufgabe der linearen Optimierung. Die Zielfunktion ist die Linearform des Aufwands an n Mitteln x2, ..., x„. Die Größen c r (r = 1, 2, ..., m), die in den Bilanzbedingungen vorkommen, bezeichnen die Bilanzlimite für den Aufwand an Mitteln. Wir haben also den Aufwand an den Mitteln x 2 , ..., x„) so zu bestimmen, daß die Zielfunktion n z = X> Obiger Satz kann wie folgt allgemeiner formuliert werden: Besitzt das Problem eine optimale Lösung, dann existiert wenigstens eine Lösung, die soviele positive Werte der Veränderlichen enthält, wie Bilanzbedingungen in Form unabhängiger Bilanzgleichungen erfüllt sind. Die übrigen Veränderlichen haben den Wert Null. Die Lösung des Problems, die genau soviele positive Veränderliche enthält, wie unabhängige Bilanzgleichungen existieren, bezeichnet man als Basislösung [vgl. Definition der Basislösung und Fußnote dazu im § 4], Optimale Lösungen können auch mehr positive Veränderliche enthalten und lassen sich als gewogene Mittel optimaler Basislösungen ausdrücken (mehrdeutige optimale Lösung). Die optimale Lösung eines Problems kann aber auch weniger positive Veränderliche enthalten. Dann sprechen wir von Degeneration. Mit diesem Fall beschäftigen wir uns jedoch nicht. *i In der Literatur als Simplex-Theorem bekannt. **> In der Literatur als Dualitätstheorem bekannt.
§ 3. Grundlegende Sätze der Theorie der linearen Optimierung
117
unter Einhaltung der Bilanzbedingungen ( r = 1,2, . . . , m ; m < n)
¿Ari*, 0
(4.3)
Wir beweisen, daß die obige Aufgabe der folgenden dualen Aufgabe gleichwertig ist: Die Multiplikatoren ¿i, ...,A m sind so zu bestimmen, daß die Funktion 171 v = £ crXr = Min. (4.6) r= 1 unter Einhaltung der Bilanzbedingungen tb K>Pi r=I r i und der Randbedingungen Ar>0
(i = l, 2, ...,«)
(r = 1, 2, ..., m).
(4.7)
(4.8)
In beiden Aufgaben sind die gleichen Konstanten pit bri, c, (i — 1, 2, ..., «; r = 1, 2 m) enthalten, es ändert sich aber die Anzahl der Veränderlichen von n auf m und die Anzahl der Nebenbedingungen von m auf n. Die Koeffizienten der Zielfunktion in der ersten Aufgabe werden in den Nebenbedingungen der Dualaufgabe zu Bilanzlimiten, und die in den Nebenbedingungen enthaltenen Ungleichungen haben entgegengesetzten Charakter. Den Beweis der Äquivalenz beider Varianten der Aufgabe der linearen Optimierung erbringt man auf folgende Weise. Setzt man in die Formel (4.6) anstelle von c r die linke Seite der Ungleichungen (4.2) ein, so erhält man m v
>
n k
E
n briXi
E
=
m
X > i
1 (=1 Unter Berücksichtigung von (4.7) folgt >
n E
X
i
1=1
y Lange, Optimale Entscheidungen
m E
r=l
M
r
^
E
n
briXr.
r= l
r = 1
V
£
Pi*i =
i=l
Z.
118
Kapitel IV. Lineare Optimierung
Wir haben demnach v > z. Die Bedingung v > z gilt für alle Werte x¡, die die Bedingungen (4.2) erfüllen, und für alle Werte Xr, die den Bedingungen (4.7) genügen. Deshalb gilt auch die Bedingung ®MIn. > z Max .. Es ist leicht nachzuweisen, daß ein solcher Wert v = v0 der Funktion v und ein solcher Wert z = z0 der Funktion z existiert, so daß v0 — z0 gilt. Solche Werte v0 und z0 existieren tatsächlich, wenn n =
S
i= 1
m S
n
r=1
KiK
=
£
1=1
Pi*i
=
z
o
erfüllt ist. Das tritt dann ein, wenn a) ebensoviele der Bilanzbedingungen (4.7) zu Gleichungen werden, wie es von Null verschiedene Werte l r gibt, und ebensoviele der Bilanzbedingungen (4.2) zu Gleichungen werden. Ihre Anzahl mag k sein, wobei k < / n ist; b) n—k Veränderliche x¡ gleich Null sind. Da die Numerierung der Veränderlichen gleichgültig ist, können wir unterstellen, daß Xu A2, ..., Ák von Null verschieden sind und daß xk+2, . . . , x„ = 0. Wir erhalten dann: ®o =
k
k
H
x¡ X!
1=1
r-1
k KiK
=
X
PiXi
/-I
=
Z0
(k
zMax. ist das aber nur möglich, wenn v0 = vmn. und z0 = z M «,. Andernfalls (d.h. wenn v0 > vwlB. und z0 < zMM.) würden wir feststellen, daß mit Verringerung von v und Erhöhung von z die Ungleichung u Min . zMax. nicht erfüllt ist. Das ist aber nicht möglich, wie aus den Zeichnungen 4.5.1 und 4.5.2 hervorgeht. Das Ergebnis wMln. > zMax. kann man noch auf eine andere Art gewinnen. Dazu setzt man die linke Seite der Bedingungen (4.7) anstelle der p¡ in den Ausdruck (4.1) ein und berücksichtigt die Bedingungen (4.2). Wir haben gezeigt, daß beide Varianten der Aufgabe der linearen Optimierung einander äquivalent sind.
§ 3. Grundlegende Sätze der Theorie der linearen Optimierung
119
Aus dieser Beweisführung resultiert zugleich der grundlegende Satz der Theorie der Optimierung.*0 Wir zeigten, daß die Bedingung ©Mln. = zMax. erfüllt ist, wenn mindestens n—k der Werte von x 1 , x 2 , . . . , x „ gleich Null sind, wobei k die Anzahl der von
Zeichnung 4.5.1
Zeichnung 4.5.2
Null verschiedenen Werte l r ist. Dasselbe gilt umgekehrt: nicht mehr als k der Werte von x u x 2 , •••,xn können von Null verschieden sein, wenn die Bedingung wMin. = zMnx. erfüllt sein soll. Das ist der obigen Ungleichung zu entnehmen. Demnach sind in der optimalen Situation, d.h., wenn die Zielfunktion das Maximum erreicht, höchstens k Veränderliche xt von Null verschieden. Wegen der Randbedingungen sind diese xt dann positiv. In der Regel darf aber die Anzahl der von Null verschiedenen Veränderlichen nicht kleiner als k sein. Das folgt aus den Bedingungen (4.2). Wären weniger als k Veränderliche von Null verschieden, so würden einige Werte der Veränderlichen, die den Gleichungen k Y\briXi = c r
(r — 1, 2 , . . . ,
k)
genügen, verschwinden. Das ist nur dann möglich, wenn die Konstanten cr von den Koeffizienten bri linear abhängen, wenn also die Bilanzlimite von den in den Bilanzgleichungen enthaltenen Koeffizienten abhängig sind. Das ist jedoch eine Situation, die mit der *) Das sog. Simplex-Theorem, auch Hauptsatz genannt. 9*
120
Kapitel IV. Lineare Optimierung
Existenz unabhängiger Bilanzlimite unverträglich ist, und deshalb übergehen wir sie. 7) Daraus ergibt sich die endgültige Schlußfolgerung, daß das optimale Programm der linearen Optimierung für genau k Mittel positive Werte enthält. Im optimalen Programm der linearen Optimierung ist also die Anzahl der mit positiven Werten vertretenen Faktorenaufwände gleich der Anzahl der Bilanzbedingungen in der Primalaufgabe, die die F o r m v o n Gleichungen annehmen. Oder anders ausgedrückt: die Anzahl der tatsächlich eingesetzten Mittel ist gleich der Anzahl der Bilanzlimite, die im optimalen Programm ausgeschöpft werden.8) Dieses Ergebnis gewinnt man auch durch eine Untersuchung der Lagrangeschen Funktion. D i e Lagrangesche Funktion der Primalauf') Das resultiert aus der Cramerschen Regel bn ... c, ... ¿>!fc • • c2 ... b2ic bki ••• Ck ••• btk bi, ... bii ... öifc bz, ... b2i ... b2k
( / = 1,2, ...,*).
bk\ ••• bki ••• bk * Die Veränderliche xi hat den Wert Null, wenn die im Zähler stehende Determinante verschwindet. Das tritt ein, wenn die die Bilanzlimite c,,c2 ...,ck enthaltende Spalte von den übrigen Spalten der Determinante linear abhängt. In diesem Fall sprechen wir davon, daß die Aufgabe entartet (degeneriert) ist. In den entarteten Aufgaben sind die Bilanzlimite Linearkombinationen der in den Bilanzbedingungen enthaltenen (k — 1) Koeffizienten. Es handelt sich um „uneigentliche" Limite, die wir als „untypischen" Fall aus unseren Betrachtungen ausschließen. 8) Dieser Satz entspricht der im Paragraphen 2 gegebenen geometrischen Interpretation der linearen Optimierung. Wenn wir unterstellen, daß beispielsweise die ersten k Unbekannten von xltx2,..., x„ positiv und die übrigen gleich Null sind, und wenn wir diese Werte in die Bilanzgleichungen (4.2) einsetzen, erhalten wir k Gleichungen mit k Unbekannten, die — wenn sie unabhängig s ind — eine eindeutige Lösung haben: (xi0), ...,xjt 0) , 0, 0,....0). Geometrisch erhält man diese Lösung durch das Schnittgebilde von k Hyperflächen mit der Dimension k—1. Das die Lösung darstellende Gebilde hat also die Dimension k—k — 0, es ist also einer der Scheitelpunkte des Bereichs der zulässigen Lösungen.
§ 3. Grundlegende Sätze der Theorie der linearen Optimierung
gäbe, d.h. der Maximierung der Zielfunktion
z
n
= ^T ptXi /=i
121
unter
den Nebenbedingungen ^ briXi < c r ) kann man in folgender Form /= i darstellen: x2,
...,
x„\ Aj, X2, ...,
Am) =
n ^
PiXi^r
+ tK\Cr-tbrlx\, r= 1
\
i=l
/
(4.9.1)
wobei A2, ..., Am die Lagrangeschen Multiplikatoren sind. Nach Umordnung der Summanden läßt sich die Funktion folgendermaßen ausdrücken: m
x2,
x„", ki,
A 2 s ...,
Am) =
r=1
+
crK~\~ "
I
i=l
\
m
\
r=l
I
(4.9.2)
Diesen Ausdruck kann man als Lagrangesche Funktion zur Bestimm
mung des Extremwertes der Funktion v = £ c,K unter den NebenT=
m
bedingungen £
r =» 1
1
> pL interpretieren, wobei jetzt die Größen
die Rolle der Lagrangeschen Multiplikatoren spielen. Wir zeigen, daß der auf diese Weise bestimmte Extremwert ein Minimalwert ist und daß Ar ^ 0 (r = 1, 2, ..., m) ist, wenn xf > 0 (i = 1,2, ...,«), also die Dualaufgabe gelöst ist. Sowohl die Primal- als auch die Dualaufgabe zielen darauf ab, für ein und dieselbe Lagrangesche Funktion das Extremum zu bestimmen, nur wird das Extremum einmal nach den Veränderlichen xu x2, ..., xn und zum anderen nach den Veränderlichen ^ , l2, ..., lm abgeleitet. Beide Aufgaben sind also einander äquivalent. Aus den Ausdrücken (4.9.1) und (4.9.2) bestimmen wir die partiellen Ableitungen der Lagrangeschen Funktion. Wir erhalten x
u
x 2 , . . . , xn
8L OJt
'
m
= Pi—
n
r= 1
M r
(' = 1, 2, . . . , « ) ,
122
Kapitel IV. Lineare Optimierung
SL " -ÖTOA = Cr— £ briXi r
(= 1
(r = 1,2, . . . , m ) .
Im Bereich der zulässigen Lösungen der Primalaufgabe ist dL -gj- > 0 (nach (4.2)), im Bereich der Dualaufgabe ist dagegen -fa - < 0 (nach (4.7)). Außerhalb jedes dieser Bereiche ist ^oA< 0 und öXi -f^>0. r In dem Punkt (oder den Punkten), in dem die Lagrangesche Funktion ihren Extremwert erreicht, ist dL = 0. Beim Lösen der Primalaufgabe wird das dadurch erreicht, daß = 0 (/ = 1 , 2 , . . . , « ) und die zweite Summe auf der rechten Seite des Ausdrucks (4.9.1) verschwindet. Beim Lösen der Dualaufgabe wird das dadurch erreicht, BJL daß = 0 (r = 1, 2, ..., m) und die zweite Summe auf der rechten Seite des Ausdrucks (4.9.2) verschwindet. Der Extremwert der Primalaufgabe liegt bekanntlich am Rande des Bereichs der zulässigen Lösungen der Dualaufgabe | Y, ^nK = Pij > während der Extremwert der Dualaufgabe am Rande des Bereichs der zulässigen Lösungen der Primalaufgäbe | £ 6 r i x f = c r j liegt. Innerhalb der genannten Bereiche der zulässigen Lösungen haben BL SL wir — < 0 und > 0. Entfernt man sich vom Punkt des ExtremSxi 8Ar wertes in Richtung ansteigender Werte so verringert sich der Wert der Lagrangeschen Funktion; entfernt man sich dagegen in Richtung zunehmender Werte Ar, so vergrößert sich ihr Wert. Das gleiche tritt ein, wenn man sich in Richtung fallender Werte x f und l r entfernt, da wir dann nämlich über den Rand des Bereichs der zulässigen Lösungen hinausgehen. Die partiellen Ableitungen verändern dann ihr Vorzeichen, und der Zuwachs dxt sowie dlr verändern gleichfalls ihre Vorzeichen. Es zeigt sich also, daß die Lagrangesche Funktion L im Extremalpunkt (oder in den Extremalpunkten) ein Maximum bezüglich der Veränderlichen x i , x 2 , . . . , x „ und ein
§ 3. Grundlegende Sätze der Theorie der linearen Optimierung
123
Minimum bezüglich der Veränderlichen X2, ..., Xm besitzt (das ist der sogenannte Sattelpunkt). Auf diese Art erweist sich die Dualaufgabe der Primalaufgabe äquivalent (siehe Zeichnung 4.6), da
es hier um den Extremwert ein und derselben Lagrangeschen Funktion geht, also zMax. = wMiD.. Die Randbedingungen sind bei der Primalaufgabe, der Voraussetzung xf > 0 (i = 1, 2, ..., n) gemäß, erfüllt; bei der Dualaufgabe haben wir Xr > 0. Im Ausdruck (4.9.2) spielen die Veränderlichen x, ...,x„ die Rolle der Lagrangeschen Multiplikatoren. Ihre Werte sind von Null verschieden, wenn die entsprechende Nebenbedingung 2
m Z
r=1
b
r i
K > P i
zur Gleichung wird, ihre Werte werden Null, wenn die Nebenbedingung eine scharfe Ungleichung ist. Unter den Nebenbedingungen kann es aber höchstens so viele Gleichungen geben, wie es unter den X (r = 1,2, . . . , m ) von Null verschiedene Werte gibt. Andernfalls gäbe es mehr Gleichungen als Unbekannte und die Gleichungen könnten nicht unabhängig sein. Im Ausdruck (4.9.1) sind dagegen so viele von Null verschiedene Werte Xr vorhanden, wie von den r
n
Bilanzbedingungen ^
briXi
In der Literatur als Dualitätsprinzip bekannt.
126
Kapitel IV. Lineare Optimierung
für die Realisierung des optimalen Programms auffassen kann.9) Bedient man sich dieser Bezeichnung, so kann man die beiden Varianten der Aufgabe der linearen Optimierung folgendermaßen formulieren: Die erste besteht in der unmittelbaren Bestimmung des optimalen Aufwands an den einzelnen Mitteln (xlf x2,..., x„), die die Zielfunktion unter Einhaltung der m Bilanzbedingungen maximieren; die zweite besteht in der Angabe solcher Bewertungen Ai, l z , ..., l m der einzelnen Mittel, bei denen die „Sensitivität" der Bilanzbeschränkungen minimal ist. Die Form dieser Aufgaben ist symmetrisch. Die Koeffizienten Pt(i = 1 , 2 , . . . , «), die in der Funktion enthalten sind, mit der wir die erste Aufgabe optimieren, sind die Bilanzlimite in der zweiten Aufgabe (und umgekehrt). Die Veränderlichen Xi (i = 1, 2, ..., n) und Ar(r = 1, 2, ..., m) treten also abwechselnd in beiden Varianten auf. In der ersten Variante sind die Veränderlichen xt die Unbekannten und die K die Lagrangeschen Multiplikatoren. In der zweiten Aufgabe sind umgekehrt die Xr die Unbekannten und die Veränderlichen xt sind die Lagrangeschen Multiplikatoren. Zum Schluß verweisen wir noch darauf, daß der Realisierungsgrad des Zieles bei der linearen Optimierung stets meßbar sein muß. ®) Diese Bezeichnung stimmt mit der von Kantorowitsch verwendeten Terminologie überein: objektiv begründete Bewertungen, d.h. Bewertungen, die mit logischer Konsequenz aus der Aufgabe der Optimierung unter den gegebenen Bilanzbedingungen entspringen. Vgl. L.W. Kantorowitsch, Rachunek ekonomiczny optymalnego wykorzystania zasoböw (Ökonomische Berechnung der optimalen Ausnutzung von Ressourcen), PWN, Warszawa 1961, S. 37 ff. und S. 406ff. [Vgl. ferner W. S. Nemtschinow, Anwendung mathematischer Methoden in der Ökonomie, B. G. Teubner Verlagsgesellschaft, Leipzig 1963, S. 306 ff., sowie vom selben Verfasser: ökonomisch-mathematische Methoden und Modelle, Verlag Die Wirtschaft, Berlin 1965, S. 245 ff.] In der westlichen Literatur spricht man in diesen Fällen von quasi-Preisen (shadow prices). Die Methode der „Auflösungsmultiplikatoren", die von Kantorowitsch zur Lösung von Aufgaben der linearen Optimierung entwickelt wurde, besteht eben in der Formulierung des Dualproblems zu jedem Problem der linearen Optimierung und in der Bestimmung „objektiv begründeter Bewertungen", also Multiplikatoren, die den Gesamtbetrag der „Sensitivität" der Bilanzlimite minimieren.
§ 4. Die Simplex-Methode
127
Diese Tatsache resultiert aus der Linearität der Zielfunktion, denn nur lineare Umformungen der Zielfunktion erhalten deren Linearität. Die einzig zulässige Transformation der Zielfunktion besteht in einer Veränderung der Maßeinheit und in einer Verschiebung des Nullpunktes.10) Die Wahl beliebiger anderer monotoner Transformationen bewirkt, daß die gegebene Aufgabe aus dem Bereich der linearen Optimierung ausscheidet, selbst wenn die Extremalpunkte erhalten bleiben. Auf diese Weise wird die Anwendung der linearen Optimierung auf Situationen beschränkt, in denen der Realisierungsgrad des Zieles meßbar ist. Im Gegensatz hierzu reicht es bei der Marginaloptimierung aus, daß die verschiedenen Stufen der Realisierung des Zieles geordnet werden können. Man kann das noch anders ausdrücken. Bei den Aufgaben der linearen Optimierung ist es notwendig, daß der Realisierungsgrad des Zieles eine Meßgröße ist, während es bei der Marginaloptimierung hinreicht, daß der Realisierungsgrad des Zieles eine Ordnungsgröße ist. n ) § 4. Die Simplex-Methode Aus dem grundlegenden Satz der Theorie der linearen Optimierung, den wir im vorhergehenden Paragraphen bewiesen haben, geht hervor, daß die optimale Lösung der Aufgabe der linearen Optimie,0 > Es geht hier also um die Transformation der Funktion f(xt, x2,. .., x„) in die Funktion g = F[f(xlt x2,..., x„)] nach der Formel g(x¡,xz, ...,x„) = = A+B/(x,, x2, ...,x„). Multipliziert man die Funktion / mit B, so verändert man die „Skala", also die Maßeinheit, in der die Werte der Funktion/ausgedrückt sind. Addiert man die Konstante A, so verändert man den „Bezugspunkt", man verschiebt also den Nullpunkt, von dem aus die Größen der Funktion /gemessen werden. Auf diese Weise erfolgt beispielsweise die Transformation der nach Celsius gemessenen Temperatur in die Skala von Fahrenheit. Bezeichnet man nämlich die erste mit x und die zweite mit y, dann erhalten wir y = 32+1,8*. u) Von einer Erscheinung sagen wir, sie sei eine Ordnungsgröße (ordinale Größe), wenn die verschiedenen Stufen ihrer Realisierung eine geordnete Menge darstellen. Wir sagen, eine Erscheinung sei eine Meßgröße (kardinale Größe), wenn die verschiedenen Stufen ihrer Realisierung eine Menge bilden, der man eindeutig die Menge der reellen Zahlen oder eine Untermenge der Menge der reellen Zahlen zuordnen kann (vgl. § 3, Kapitel II).
§ 4. Die Simplex-Methode
127
Diese Tatsache resultiert aus der Linearität der Zielfunktion, denn nur lineare Umformungen der Zielfunktion erhalten deren Linearität. Die einzig zulässige Transformation der Zielfunktion besteht in einer Veränderung der Maßeinheit und in einer Verschiebung des Nullpunktes.10) Die Wahl beliebiger anderer monotoner Transformationen bewirkt, daß die gegebene Aufgabe aus dem Bereich der linearen Optimierung ausscheidet, selbst wenn die Extremalpunkte erhalten bleiben. Auf diese Weise wird die Anwendung der linearen Optimierung auf Situationen beschränkt, in denen der Realisierungsgrad des Zieles meßbar ist. Im Gegensatz hierzu reicht es bei der Marginaloptimierung aus, daß die verschiedenen Stufen der Realisierung des Zieles geordnet werden können. Man kann das noch anders ausdrücken. Bei den Aufgaben der linearen Optimierung ist es notwendig, daß der Realisierungsgrad des Zieles eine Meßgröße ist, während es bei der Marginaloptimierung hinreicht, daß der Realisierungsgrad des Zieles eine Ordnungsgröße ist. n ) § 4. Die Simplex-Methode Aus dem grundlegenden Satz der Theorie der linearen Optimierung, den wir im vorhergehenden Paragraphen bewiesen haben, geht hervor, daß die optimale Lösung der Aufgabe der linearen Optimie,0 > Es geht hier also um die Transformation der Funktion f(xt, x2,. .., x„) in die Funktion g = F[f(xlt x2,..., x„)] nach der Formel g(x¡,xz, ...,x„) = = A+B/(x,, x2, ...,x„). Multipliziert man die Funktion / mit B, so verändert man die „Skala", also die Maßeinheit, in der die Werte der Funktion/ausgedrückt sind. Addiert man die Konstante A, so verändert man den „Bezugspunkt", man verschiebt also den Nullpunkt, von dem aus die Größen der Funktion /gemessen werden. Auf diese Weise erfolgt beispielsweise die Transformation der nach Celsius gemessenen Temperatur in die Skala von Fahrenheit. Bezeichnet man nämlich die erste mit x und die zweite mit y, dann erhalten wir y = 32+1,8*. u) Von einer Erscheinung sagen wir, sie sei eine Ordnungsgröße (ordinale Größe), wenn die verschiedenen Stufen ihrer Realisierung eine geordnete Menge darstellen. Wir sagen, eine Erscheinung sei eine Meßgröße (kardinale Größe), wenn die verschiedenen Stufen ihrer Realisierung eine Menge bilden, der man eindeutig die Menge der reellen Zahlen oder eine Untermenge der Menge der reellen Zahlen zuordnen kann (vgl. § 3, Kapitel II).
128
Kapitel IV. Lineare Optimierung
rung, die durch die Bedingungen (4.1), (4.2) und (4.3) bestimmt ist, wie folgt geschrieben werden kann: (*}«, ...,*«>, 0 , 0 , . . . , 0), (4.10) wobei.xf 0 , xi0>, positiv sind. Geometrisch betrachtet, besteht die optimale Lösung aus den Koordinaten eines der Scheitelpunkte des Polyeders der zulässigen Lösungen. Wenn wir zur Lösung einer konkreten Aufgabe übergehen, wissen wir natürlich nicht von vornherein, welche Veränderlichen im optimalen Programm positiv sind und welche verschwinden. Da aber die Numerierung der Veränderlichen gleichgültig ist, kann man immer unterstellen, daß die ersten m Veränderlichen positiv sind, während die übrigen (n—m) verschwinden. Das weitere Vorgehen zur Bestimmung der optimalen Lösung würde dann in der Ermittlung aller möglichen Systeme von Lösungen des Typs (4.10) bestehen und in der Überprüfung, welches von ihnen dem maximalen Wert der Zielfunktion (4.1) entspricht. Ein derartiges Verfahren zur „unmittelbaren Berechnung" (der Berechnung aller möglichen Varianten) ist im Prinzip möglich, aber praktisch ist es nur dann durchführbar, wenn die Anzahl der Veränderlichen in der Aufgabe nicht groß ist. Man kann leicht überprüfen, daß die Anzahl aller Lösungssysteme vom Typ (4.10) sehr groß wird, sobald die Anzahl der Veränderlichen zunimmt. Sie beträgt nämlich C™ = (¡J,), d.h. soviel, wie es Kombinationen von n Elementen nach m gibt. 12) Der typische Algorithmus, der zur Lösung von Aufgaben der linearen Optimierung am häufigsten angewendet wird, die SimplexMethode, beruht im Grunde auf einer ähnlichen Verfahrensweise nur mit dem Unterschied, daß man zur Auswahl der möglichen Lösungen eine gewisse Ordnung einführt. Dieser Algorithmus liefert Kriterien, die eine einfache Bewertung zulassen, ob die gegebene Lösung I2)
Falls die Anzahl der Unbekannten n = 10 und die Anzahl der Bilanzbedingungen m = 5 ist, müßte man den Wert der Zielfunktion (4.1) für C'0 = (50) = 10! = "5i"5T = 252 Systeme von Lösungen des Typs (4.10) berechnen.
§ 4. Die Simplex-Methode
129
optimal ist, und die es ermöglichen, nicht blindlings, sondern schrittweise immer in Richtung von einer schlechteren zu einer besseren Lösung, d.h. näher zum Optimum, vorzugehen. Auf diese Weise wird die Anzahl der Varianten beträchtlich verringert, und man erreicht einen schnellen Übergang zur optimalen Lösung. Wir beschäftigen uns zuerst mit der allgemeinen Beschreibung der Prinzipien, auf denen die Simplex-Methode beruht, und im nächsten Paragraphen lösen wir mit dieser Methode einige einfache Zahlenbeispiele. Wir unterstellen, daß die Bilanzbedingungen der linearen Aufgabe in Form von m unabhängigen Gleichungen (4.2) vorliegen.13) Zum Ausgangspunkt für die weiteren Berechnungen wählen wir Veränderliche, die den Koordinaten irgendeines der Scheitelpunkte des Polyeders der zulässigen Lösungen entsprechen. Das ist ein n-Tupel von Zahlen, von denen m positiv und die übrigen Null sind: x2, ..., x,„, 0,0, ...,0). Die Gesamtheit der positiven Veränderlichen in dieser Lösung bezeichnen wir als Basis, die Lösung als Basislösung.*) Setzt man die Basisveränderlichen in die Bilanzgleichungen (4.2) ein, so erhält man m unabhängige Gleichungen mit m Unbekannten. 14 ' ¿>n*i+6r2*2+ ••• +brmxm
= cr
(r = 1, 2, ..., m).
(4.11)
0)
Sie besitzen die Lösung JC{ , ..., die den Aufwänden der als positiv vorausgesetzten m Mittel entspricht. "> Wenn die Bilanzbedingungen als Ungleichungen gegeben sind, dann formt man sie durch die Einführung von Hilfsveränderlichen in Gleichungen um (vgl. § 4, Kapitel II). Ein derartiges Beispiel wird im folgenden Paragraphen gegeben. *) Die hier gewählte Definition für Basislösung schließt auf Grund der Annahme, daß von einem Scheitelpunkt des PolyederJ der zulässigen Lösungen ausgegangen wird, die Zulässigkeit ein. Allgemein nennen wir eine Lösung, die den Bilanz- (4.2) und Randbedingungen (4.3) genügt, zulässige Lösung. Eine Lösung m linear unabhängiger Bilanzbedingungen (4.2) heißt Basislösung, wenn in ihr genau m der Veränderlichen xi ungleich Null sind. Danach heißt eine Basislösung von (4. 2), in der die m Veränderlichen positiv sind (die Randbedingungen (4.3) sind also auch erfüllt), zulässige Basislösung. Nach Voraussetzung ist die hier definierte Basislösung also zulässige Basislösung. 14)
Wären die Bilanzgleichungen abhängig, würde bei der Lösung der Optimierungsaufgabe eine gewisse Komplikation, die sogenannte Degeneration, auftreten. Wir beschäftigen uns hier nicht näher damit. Vgl. Fußnote 6.
130
Kapitel IV. Lineare Optimierung
Das ist die erste vorläufige Lösung, die wir als Ausgangslösung15( bezeichnen und die wir durch Einführung eines anderen Mittels in die Lösung, z.B. des Mittels mit der Nummer m + 1 , verbessern wollen. Wir setzen also x m + 1 ^ 0 an. Dabei haben wir zu beachten, daß dann — gemäß dem grundlegenden Satz der linearen Optimierung — eine der Veränderlichen aus der Ausgangslösung ausscheiden muß (d.h. es wird ein xt — 0). Vorläufig ist noch unbekannt, welche Veränderliche das sein muß. Die Bilanzgleichungen haben jetzt die Form: brlx1+br2x2+
... +brmxm+br
.m+l^m+l — Cr ( r = l,2,...,m),
(4.12)
wobei eine der Veränderlichen xlt x2, xm zu Null werden muß. Das Gleichungssystem (4.12) mit m + 1 Unbekannten besteht aus m Gleichungen. Es hat nur dann eine eindeutige Lösung, wenn diese Gleichungen ein abhängiges System bilden. (Siehe Behauptung über die maximale Anzahl linear unabhängiger Vektoren im m-dimensionalen Raum). Eine Spalte (ein senkrechter Vektor) der Koeffizientenmatrix dieses Systems, z.B. die letzte Spalte, muß deshalb von den übrigen Spalten der Koeffizientenmatrix linear abhängen. Daß heißt, es muß briyi+br2y2+ ... +brmym = ¿ r , m + 1 (r = 1, 2, ..., m) (4.13) gelten, wobei die Größen ylt y2, ...,ym nicht sämtlich verschwinden. Das Gleichungssystem (4.13) ermöglicht die eindeutige Bestimmung der Größen Wir subtrahieren jetzt von dem Gleichungssystem (4.11) das i-fache (t > 0) der entsprechenden Gleichungen des Systems (4.13) und erhalten folgendes Gleichungssystem brl(x1—ty1)+br2(x2~ty2)+
... +brm(xm—tym)
=
cr-tbr,m+l
(/•= 1,2, ...,m) oder brl(x1-ty1)+br2(x2-ty2)+
... +brm(xm—tym)+brim+1t
= cr
( r = l , 2 ,...,m).
(4.14)
"> In der Praxis setzt man als Ausgangslösung meistens solche Werte an, die irgendeiner tatsächlichen Situation entsprechen.
131
§ 4. Die Simplex-Methode
Wir bemerken, daß das Gleichungssystem (4.14) ein neues System von Bilanzgleichungen (4.12) ist. Verschieden sind in den Systemen nur die Unbekannten. Die im Gleichungssystem (4.14) enthaltenen Unbekannten lassen sich mit Hilfe der Ausgangslösung, d.h. der Lösung des Gleichungssystems (4.11) und der Lösung des Gleichungssystems (4.13), also durch die Veränderlichen (xf'-ty^),
( 4 0 ) - O 4 0 ) ) , ( x ^ - t y W ) , t,
(4.15)
ausdrücken. Wir verwenden diese Veränderlichen als zweite vorläufige Lösung der Aufgabe unter der Bedingung, daß eine von ihnen (es sind m+\ Veränderliche, also eine zu viel) den Wert 0 annimmt. Darüber hinaus sind auch die übrigen im Gleichungsystem nicht enthaltenen Veränderlichen, d.h. xm+2, xm+3) ..., x„ gleich Null. Um zu bestimmen, welche der Veränderlichen in (4.15) Null gesetzt werden muß, berechnen wir den Wert der Zielfunktion z — PyXy+ +P2X2+ ••• +Pnx„ für die Ausgangslösung und die zweite vorläufige Lösung. Bezeichnet man die Werte der Zielfunktion entsprechend mit z 0 und Z\, so erhält man ...
+PmX^
sowie = pM0)-ty{0))+P2(x^-ty^)+
...
+pm(xW-t/»)+pm+1t.
Subtrahieren wir den ersten Ausdruck vom zweiten, so erhalten wir den Zuwachs Az der Zielfunktion, der aus der Programmänderung, nämlich infolge des Ersatzes der ersten vorläufigen Lösung durch die zweite, entsteht: Az = z r t = -tp1y?)-tp2yi0)-
... - f / r f + z W
oder ^ = t[pm+,-{piyf^p2y^+
... +Pmy£>)].
(4.16)
Infolge des Ersatzes der Ausgangslösung durch die zweite vorläufige Lösung wird die Zielfunktion a) erhöht, wenn Az > 0, b) verringert, wenn Az < 0, und c) bleibt unverändert, wenn beide Lösungen übereinstimmen, wenn also Az — 0.
132
Kapitel IV. Lineare Optimierung
Wegen t >0 hängt das Vorzeichen des Zuwachses der Zielfunktion Az von dem des Klammerausdruckes auf der rechten Seite der Gleichung (4.16) ab. Wir können das so schreiben: signziz =
s i g n [ ;
W
l
- 0 >
l
>
f
)
+
J
p
2
> f
)
+
...
+/w£>)].
( 4 .17)
Die neue Lösung ist folglich besser als die Ausgangslösung, wenn p m+ i > P i y ? ) + P i y f ) + ... +p m y£>.
(4.18)
Für den Koeffizienten pm+1 kann man hieraus eine gewisse praxeologische Deutung herleiten. Die in der Zielfunktion z = piXx+ -\-P2Xi-\- ••• +/>n*n enthaltenen Koeffizienten pt (i = 1, 2, ..., n) kann man als die Produktivitäten der einzelnen Mittel betrachten. Es gilt nämlich pt —
. Da wir vereinbarungsgemäß schädliche
und überflüssige Mittel ausschließen,*) folgt pt > 0 (i = 1, 2,...,«). Die Koeffizienten pi bezeichnen also den Grenzzuwachs des Realisierungsgrades des Zieles, der sich aus dem erhöhten Aufwand des jeweiligen Mittels ergibt. Wenn wir diesen Grenzzuwachs als Produktivität des Mittels bezeichnen, ist pm+i die Produktivität des neu eingeführten Mittels. Führt man ein neues Mittel, d.h. eine neue Veränderliche, in das Programm ein, dann verringert sich der Aufwand für die anderen Mittel, und wir verwenden sie statt im Umfang x[0) nunmehr im Umfang (x{0)—0>i0)). Gleichzeitig vermindern wir den Nutzeffekt dieser Mittel um t{PiyT+P2yr+
...
Den Klammerausdruck bezeichnen wir mit ym+1. Wie aus der Ungleichung (4.18) hervorgeht, steigt der Realisierungsgrad des Zieles, wenn die Produktivität pm+1 des neu eingeführten Mittels größer als ym+1, also größer als jener Betrag ist, den wir je Einheit des neu eingeführten Mittels durch den verringerten Einsatz der anderen Mittel verlieren. Die Differenz beider Größen, also pm+1—ym+1, bezeichnen wir als *> Vgl. § 1, Kapitel II.
§ 4. Die Simplex-Methode Nettoproduktivität
des neu eingeführten Mittels m+1.
133 Im Endergebnis
erhalten wir ¿z = t(pm+l-yn+l)
(4.19)
und wegen t > 0 folgt signzlz = sign(/>m+i—y„+1).
(4.19.1)
Der Zuwachs der Zielfunktion hat das gleiche Vorzeichen wie die Nettoproduktivität des neu eingeführten Mittels und ist ihr proportional. In Abhängigkeit von der Nettoproduktivität des Mittels m + 1 unterscheiden wir die folgenden drei Fälle: 1. Die Nettoproduktivität des neu eingeführten Mittels (und demnach auch Az) ist gleich Null. In diesem Fall sind beide vorläufigen Lösungen der Optimierungsaufgabe, die Ausgangs- und die neue Lösung, gleich gut. Wie aus der geometrischen Interpretation der linearen Optimierung hervorgeht, gibt es in einem solchen Fall unendlich viele Lösungen, die gleich gut sind. Sie sind durch die Punkte des Abschnittes bestimmt, der die beiden Scheitelpunkte des Polyeders der zulässigen Lösungen verbindet. 2. Die Nettoproduktivität des neu eingeführten Mittels ist negativ. In diesem Fall ist Az 0, die neue Lösung ist demnach besser als die Ausgangslösung. Die Ausgangslösung ist also sicher nicht optimal. Die endgültige Entscheidung darüber, welche Lösung optimal ist, erfordert die Fortsetzung der oben beschriebenen Verfahrensweise. Es sind weitere, bisher noch nicht genutzte Mittel mit den Nummern wj+2, m+3, ... in das Programm einzuführen, bis schließlich alle möglichen, in der Basis nicht berücksichtigten Mittel geprüft worden sind. Bei jedem dieser Schritte berechnen wir die Nettoproduktivität 10 Lange, Optimale Entscheidungen
134
Kapitel IV. Lineare Optimierung
des neu eingeführten Mittels und überprüfen, welcher der drei Fälle vorliegt. Daraus ziehen wir die entsprechenden Schlußfolgerungen. Auf diese Weise wird die Aufgabe nach (n—m) „Schritten" (Iterationen), d.h. nach der (n—m)-maligen Wiederholung des beschriebenen Verfahrens, entschieden. Es verbleibt noch, die Rolle des Koeffizienten t > 0 zu erläutern und anzugeben, welches der bisher im Programm verwendeten Mittel nach Einführung eines neuen Mittels aus dem Programm zu entfernen ist. Bekanntlich sind im optimalen Programm nur m positive Mittel vorhanden. Die übrigen Mittel werden im optimalen Programm nicht verwendet, die ihnen entsprechenden Werte verschwinden. Wir unterstellen jetzt, daß wir in die Basis (xj°>, ..., x£\0,0, ..., ...,0) das neue Mittel mit der Nummer m + 1 eingeführt haben. Die neuen Veränderlichen des Programms haben danach die Form (4.15). Da eine dieser Veränderlichen verschwinden muß, ist für ein gewisses i (das wir noch immer nicht kennen) die Gleichung v(«)
= 0, also t
=
(
4
.
2
0
)
erfüllt, und für die übrigen i gilt > 0. (4.21) Aus den Bedingungen (4.20) und (4.21) folgt unmittelbar, daß aus dem Programm das Mittel zu entfernen ist, dem t = Min.^- > 0
(4.22)
entspricht. Würden wir ein anderes Mittel eliminieren, dann erhielten wir nämlich für die Mittel, für die
< t ist, jcJ0)—/)>i0) < 0. Das
ist aber unmöglich, da wir keine negativen Mengen der Mittel (infolge der Randbedingungen dürfen die Veränderlichen des Programms nicht negativ sein) zulassen können. Wir besitzen also ein Kriterium, das uns die Aussonderung des richtigen Mittels ermöglicht, wenn in das Programm ein neues, noch nicht verwendetes Mittel eingeführt wird. Ist das Verhältnis — ^ für
§ 4. Die Simplex-Methode
135
mehrere Mittel minimal, dann eliminieren wir ein beliebiges von ihnen aus dem Programm. Zum Abschluß fassen wir die Simplex-Methode kurz zusammen. Sie beruht auf der vorläufigen Auswahl einer Basis und der ihr entsprechenden Ausgangslösung des Programms. Die Ausgangslösung enthält m positive Veränderliche (d.h. soviel, wie es unabhängige Bilanzgleichungen gibt) und n—m Veränderliche mit dem Wert Null. Die Werte der positiven Veränderlichen gewinnen wir durch die Lösung der Bilanzgleichungen. Danach führen wir das Mittel m + 1 ein und prüfen, ob die Nettoproduktivität dieses Mittels gleich Null, negativ oder positiv ist. Im ersten Fall ist das neue Programm genausogut, im zweiten Fall ist das neue Programm schlechter und im dritten Fall ist das neue Programm besser als das vorherige. Tritt der dritte Fall ein, dann verbessern wir das Programm durch Einführung dieses neuen Mittels und entfernen gleichzeitig das Mittel aus dem Programm, für das der Ausdruck
den kleinsten positiven
Wert annimmt. Die neue, bessere Lösung suchen wir erneut zu verbessern, indem wir in das Programm schrittweise weitere Mittel m+2, m+3 usw. einführen und das oben beschriebene Verfahren wiederholen. Nach («—m)-maliger Wiederholung dieses Verfahrens ist die optimale Lösung des Programms ermittelt. Die Simplex-Methode ist also sozusagen die mathematische Verallgemeinerung der empirischen Methode zur Berechnung aller Varianten. Sie besteht darin, daß der Reihe nach die Substitution eines Mittels durch ein anderes probiert wird und daß in das Programm die Mittel eingeführt werden, bei denen die Probe positiv ausfällt, d.h. eine Erhöhung des Wertes der Zielfunktion erfolgt. Die Simplex-Methode zeichnet sich durch die Einfachheit der logischen Struktur aus, erfordert aber bei einer größeren Anzahl Unbekannter und Bilanzgleichungen aufwendige Berechnungen. Aus diesem Grund ist die Geschichte der linearen Optimierung in der Praxis mit dem Einsatz elektronischer Rechenanlagen verbunden. 10«
136
Kapitel IV. Lineare Optimierung
§ 5. Anwendungsbeispiele für die Simplex-Methode Wir bringen jetzt einige einfache Zahlenbeispiele für die Anwendung des Simplex-Algorithmus zur Lösung von Optimierungsaufgaben.16) Beispiel 1. Es sind die Werte x,, x2, * 3 und x4 zu bestimmen. Die Zielfunktion lautet z = xi+2x2—3*3+4*4 = Max. unter Einhaltung der Bilanzbedingungen * 2 + 7 * 3 + * 4 = 100 2*,+3* 2 —* 3 +10*4 = 800 und der Randbedingungen *,->0 (1=1,2,3,4). Die Basislösung enthält hier definitionsgemäß zwei positive Veränderliche. Als Ausgangslösung nehmen wir das Tupel (*i, x2, 0, 0). Wir unterstellen also, daß die ersten beiden Veränderlichen x t und x2 positiv (die Anzahl der Bilanzgleichungen ist m = 2) und daß die Werte der übrigen Veränderlichen gleich Null sind. Die Werte der positiven Veränderlichen *i und x2, die die Ausgangslösung bilden, berechnen wir aus den Bilanzgleichungen, in denen wir * 3 = 0 und x4 = 0 setzen. Aus den Gleichungen ermitteln wir also: *,-*
2
=
100
2*!+3* 2 = 800 und erhalten als Lösung *,(0) = 220 und
= 120.
") Die ersten drei Beispiele sind dem Artikel von Pietro Pagani, Programmazione lineare, entnommen. Vgl. hierzu: Dizionario di Economia Politica, unter der Redaktion von Claudio Napoleoni, Milano 1956, S. 1253—1256. Die Zielfunktion im ersten und dritten Beispiel weicht von der von uns im Text postulierten Eigenschaft ab; denn sie berücksichtigt die Existenz eines „schädlichen Mittels", also einen Koeffizienten Pi < 0. Das hat keinen Einfluß auf den Lösungsweg, ist aber lehrreich. Wie das Beispiel 4 zeigt, entspricht das gewissen interessanten Situationen in der Praxis.
§ 5. Anwendungsbeispiele für die Simplex-Methode
137
Die Ausgangslösung hat also folgende Gestalt: (220, 120, 0, 0). Wir versuchen jetzt, das dritte Mittel in die Lösung einzuführen. Danach haben die Bilanzgleichungen folgende Gestalt (vgl. Formel 4.12): *2+7X3 = 100 2x 1 +3x 2 — x3 = 800. Hieraus folgt, daß die Koeffizienten der dritten Spalte eine Linearform der Koeffizienten der ersten und zweiten Spalte sind (vgl. Formel 4.13): yi-y2 = 7 2yi+3j 2 = — l . Löst man diese Gleichungen, so erhalten wir j( 0 ) = 4 und y(20> = — 3. Die Produktivität des neu eingeführten Mittels beträgt im gegebenen Beispiel p3 = —3, und der Verlust, der infolge des verringerten Aufwands an den ersten beiden Mitteln (als Konsequenz der Einführung des dritten Mittels) entsteht, beträgt 73 = P ^ + P i y ^ = y\ 0) +2yW = - 2 . Die Nettoproduktivität />3—y3 des neu eingeführten Mittels ist demzufolge negativ, und der Zuwachs der Zielfunktion ist deshalb auch negativ (vgl. Formel 4.19): signzlz = sign(p3—y3) = sign[—3—(—2)] = s i g n ( - l ) . Daraus folgt, daß die neue Lösung, die durch Einführung des dritten Mittels entsteht, schlechter ist als die Ausgangslösung. Gleicherweise kann man leicht nachweisen, daß auch die Einführung des vierten Mittels die Ausgangslösung verschlechtert. Danach nehmen die Bilanzgleichungen unseres Beispiels nämlich folgende Form an: xl~x2+x4
=
100
2^+3x2+10*4 = 800, woraus hervorgeht, daß y1-y2
= 1
2j, + 3J2 = 10
138
Kapitel IV. Lineare Optimierung
und demnach j4°> = 2,6 und
=
1,6
ist. Da p4 = 1 und 74 = P i y ^ + P i y ^ = 2,6+2 • 1,6 = 5,8, ergibt sich für sign^lz = sign(/>4—y4) = sign(l—5,8) = sign(—4,8). Sowohl die Einführung des dritten als auch des vierten Mittels verschlechtert also die Ausgangslösung. Die optimale Lösung ist somit durch die Ausgangslösung (220, 120, 0, 0) gegeben. Für diese Werte des Aufwands an Mitteln nimmt die Zielfunktion den maximalen Wert Zq = 220+2 • 120 = 460 an. Interessant ist, daß das im vorliegenden Beispiel produktivste Mittel Nummer 4 (p 4 = 4) nicht in die Lösung eingegangen ist. Das erklärt sich aus dem Aufbau der Bilanzbedingungen, die den Einsatz des vierten Mittels in großen Mengen nicht zulassen. Das vierte Mittel schöpft das durch die zweite Bilanzgleichung bezeichnete Limit sehr schnell aus. Beispiel 2. Zu lösen ist die Aufgabe der linearen Optimierung, bei der die Zielfunktion z = X!+x2+x3+x4 = Max. unter Einhaltung der Bilanzbedingungen 2x l +x 2 +2x 3 -{-X4 = 60 x 1 + 2 x i + 3 x 3 + 2 x t = 90 und der Randbedingungen xt>0
(1=1,2,3,4)
vorliegt. Als Basis setzen wir das Tupel (x 1( x2, 0, 0) an. Die dieser Basis entsprechenden Bilanzgleichungen sind 2 x \ + x 2 — 60 Xy+lx2
= 90,
§ 5. Anwendungsbeispiele für die Simplex-Methode
139
daraus resultiert: =
10
j4°> = 40. Die Ausgangslösung ist also (10, 40, 0, 0), und für diese Aufwände beträgt die Lösung Zo
= 10+40 = 50.
Nach Einführung des dritten Mittels erhalten wir folgende Bilanzgleichungen 2XI+X2+2X3
= 60
^+2X2+3X3 = 90, aus denen hervorgeht, daß 2^1+^2 = 2 yl+2y2 = 3. Daraus ergibt sich:
Wir berechnen die Nettoproduktivität des dritten Mittels:
Demnach istzlz < 0. Die Einführung des dritten Mittels verschlechtert also die Lösung. Wir versuchen, das vierte Mittel einzuführen. Wir erhalten neue Bilanzgleichungen 2XI+X2+X4
= 60
x i + 2 x 2 + 2 x 4 = 90, aus denen hervorgeht, daß 2^1+^2 = 1 yi+2y2
= 2,
und daraus folgt = 0; > f > = l .
140
Kapitel IV. Lineare Optimierung
Die Nettoproduktivität des vierten Mittels ist P4~Y4= 1 - 1 = 0. Also ist Az = 0. Demnach ist die Lösung, die wir durch Einführung des vierten Mittels erhalten, genausogut wie die Ausgangslösung. Es gilt jetzt zu entscheiden, welches Mittel — das erste oder zweite — aus der Lösung zu entfernen ist, wenn man sich für die Annahme dieser letzten Lösung entscheidet. Zu diesem Zweck berechnen wir oo, wenn j}0) -• 0.17) Daraus
-^j- = — = 40, dagegen strebt
folgt, daß man das zweite Mittel aus der Lösung entfernen und das erste und vierte Mittel verwenden muß. Setzt man in den Bilanzgleichungen x2 = 0 und x3 = 0, so erhält man 2X!+X4 = 60 xi+2x 4 = 90 und daraus x™ = 10 und x f = 40. Der Lösung (10, 0, 0, 40) entspricht ein Realisierungsgrad des Zieles von zt = 10+40 = 50. Wir erkennen, daß tatsächlich beide Lösungen — die Ausgangslösung (10,40, 0, 0) und die Lösung (10, 0, 0, 40) — gleich gut sind. Beispiel
3.
Wir lösen jetzt die Aufgabe, bei der die Zielfunktion
die Gestalt z = Xi~ 3x2+9*3 = Max. hat und für die die Bilanzgleichungen 10 *1—x2+2X3 "> Da
i
= 2
= 0 ist, kann man das Verhältnis
x(»> r- nicht unmittelbar betrachten.
Aus diesem Grund untersuchen wir den Grenzwert, zu dem dieses Verhältnis strebt, wenn 0.
§ 5. Anwendungsbeispiele für die Simplex-Methode
141
und die Randbedingungen x, > 0
(i = 1, 2, 3)
vorgegeben sind. Als Basis setzen wir die beiden ersten Mittel an. Mit x3 = 0 erhalten wir die Bilanzgleichungen x i + x 2 = 10 xi—x2 = 2 und daraus x = 6 und 4°> = 4. Die Ausgangslösung hat die Form (6,4,0) und die ihr entsprechende Zielfunktion besitzt den Wert z0 = —6. Wenn man das dritte Mittel einführt, erhält man folgende Gleichungen yi+yi = 1 yi—yz = 2 und daraus v 0.
Die Einführung des dritten Mittels in die Lösung ist vorteilhaft. Wir ermitteln weiter >>(0) Demnach ist t = Min.
4 und J>(0) =
= 4, da
< 0 nicht in Frage
kommt. Deshalb ist in der neuen verbesserten Lösung Az = t(p3-y3)
= 4 • 6 = 24.
= 0 und
142
Kapitel IV. Lineare Optimierung
Die der neuen Lösung (0, x2, x3) entsprechenden Bilanzgleichungen sind x 2 +x 3 = 10 —x2+2X3
=
2
und daraus folgt x = 6 und
= 4.
Als optimale Lösung erhalten wir (0, 6, 4), und der ihr entsprechende Realisierungsgrad des Zieles beträgt z = —3 • 6 + 9 - 4 = 1 8 . Wir sehen, daß sich der Realisierungsgrad des Zieles tatsächlich um 24 erhöht hat. Beispiel 4. Dieses Beispiel ergibt durch Einführung einer vierten Veränderlichen eine gewisse Modifikation und Erweiterung des vorherigen Beispiels. Die Aufgabe besteht in der Maximierung der Zielfunktion Z=
— 3X2+9*3+15*4
unter Einhaltung der Bilanzgleichungen * l + * 2 + * 3 + *4 =
10
und der Randbedingungen Xi
>0
(1=1,2,3,4).
Wir unterstellen, daß x3 = 0 und x4 = 0. Die Bilanzgleichungen sind dann Xi+x 2 = 10 —x2 ~ ~ ~ 2 und daraus folgt xi0> = 6 und
= 4.
Als Ausgangslösung erhalten wir (6, 4, 0, 0). Ihr entspricht der Wert der Zielfunktion z0 = 6—12 = - 6 .
§ 5. Anwendungsbeispiele für die Simplex-Methode
143
Bei der Lösung des Beispiels 3 zeigten wir, daß die Einführung des dritten Mittels vorteilhaft und die Lösung (0, 6, 4) besser ist als die Ausgangslösung. Die Zielfunktion für diese neue Lösung hat den Wert z, = 18. Wir versuchen jetzt, das vierte Mittel einzuführen. Die Koeffizientenspalte, die diesem Mittel entspricht, ist dann eine lineare Funktion der Koeffizienten der zweiten und dritten Spalte. Erfüllt sind demnach die Gleichungen des Typs (4.12): b,iyi+br2yi+
... +brmym
= ¿r>m+1
(r = 1, 2, ..., m),
die hier die Form yz+y 3 = i -y2+2y3
= 1
annehmen. Daraus ergibt sich = !
und
=
Die Nettoproduktivität des vierten Mittels beträgt p4-y4=
1 5 - [ ( - 3 ) - y + 9 - | ] = 10.
Die Einführung des vierten Mittels ist somit vorteilhaft, und der Zuwachs der Zielfunktion beträgt Az =
10i.
Weiter berechnen wir *(»)
6
yl» -
-
,„
xW
4
18;
yi0) -
2
6
-
3
Daraus folgt t = Min. - ^ y =
— 6. Demnach ist das dritte
Mittel aus der Lösung zu eliminieren. Und durch Einführung des vierten Mittels erreichen wir einen Wertzuwachs der Zielfunktion von Az — 10 • 6 = 60.
144
Kapitel IV. Lineare Optimierung
Die neue Lösung ist (0, x2, 0, x4). Wenn wir diese Werte in die Bilanzgleichungen einsetzen, erhalten wir das Gleichungssystem x2+x4 —x2+x4
— 10 = 2
und daraus 4°> = 4 und 4 0 ) = 6. Die endgültige optimale Lösung ist die Lösung (0, 4, 0, 6), der der Wert der Zielfunktion Zi = —12+90 = 78 entspricht. Wir sehen also, daß die Einführung des vierten Mittels in die Lösung einen Wertzuwachs der Zielfunktion von 60 bewirkt. Analysieren wir die Lösung des letzten Beispiels. Nach der Logik der Simplex-Methode war schon auf den ersten Blick zu erwarten, daß das vierte Mittel in die optimale Lösung eingeht, da es die größte Produktivität (p4 = 1 5 ) besitzt. Überraschend ist dagegen die Tatsache, daß das zweite Mittel ebenfalls in die optimale Lösung eingeht, denn es besitzt die niedrigste Produktivität und ist sogar ein schädliches Mittel (p2 = —2). Diese Tatsache wird durch die Bilanzbedingungen erklärt. Aus der zweiten Bilanzbedingung folgt, daß das Bilanzlimit für die anderen Mittel umso größer wird, je mehr man vom zweiten Mittel einsetzt. Verwendet man nämlich das Mittel x2, so vermindern wir zwar den Realisierungsgrad des Zieles, erhöhen aber zugleich das Limit für das produktivste Mittel x4. Das führt schließlich zu einem Anstieg des Nettowertes der Zielfunktion. Darin besteht das „Geheimnis", daß die optimale Lösung neben dem produktivsten Mittel x4 auch das schädliche Mittel x2 enthält. Es drängt sich hier eine Analogie zu gewissen Situationen im Außenhandel auf, in denen man „unrentable Importe" in Kauf nimmt, um vorteilhafte Exporte zu realisieren. Beispiel 5. Hier sind die Bilanzbedingungen als Ungleichungen gegeben.18) Für beliebige Werte jcj und x2 ist die Funktion z =
2*1+5*2
"> Dieses Beispiel ist dem Buch von K.E. Boulding und W.A. Spivey, Linear Programming and the Theory of the Firm, The Macmillan Comp., New York i960, S. 73, entnommen.
§ 5. Anwendungsbeispiele für die Simplex-Methode
145
zu maximieren, wobei die Veränderlichen folgende Bilanzbedingungen erfüllen müssen: X1+4X2 < 24
>4 = 1 aus denen resultiert, daß
§ 6. Die Lösung der Dualaufgabe
147
Demnach ist Ps-Ys = 0 - ^2 • y —5 • y ^ = —1 < 0 . Die Einführung des Mittels xs verbessert das Ergebnis nicht, die optimale Lösung ist demnach ( 4 , 5 , 0 , 4 , 0 ) . Diese Lösung besagt, daß das erste Mittel mit der Menge 4 und das zweite Mittel mit der Menge 5 angewendet werden soll. Der Wert der Hilfsveränderlichen x 4 — 4 verweist darauf, daß das Bilanzlimit, welches durch die zweite Bilanzbedingung mit 21 bestimmt worden ist, nicht vollständig ausgenutzt wird. Tatsächlich ist 3 x i + x 2 = 1 2 + 5 = 17.
x1*x2=9 Zeichnung 4.7
Da im gegebenen Beispiel nur zwei Veränderliche, xl und x2, vorkommen, wird es möglich, die Aufgabe graphisch zu lösen. Das zeigt Zeichnung 4.7. § 6. Die Lösung der Dualaufgabe Wir geben jetzt eine andere Lösungsmöglichkeit für das Beispiel 4 aus dem vorigen Paragraphen an. Sie beruht auf der Umformung der gegebenen Aufgabe in die Dualaufgabe.
§ 6. Die Lösung der Dualaufgabe
147
Demnach ist Ps-Ys = 0 - ^2 • y —5 • y ^ = —1 < 0 . Die Einführung des Mittels xs verbessert das Ergebnis nicht, die optimale Lösung ist demnach ( 4 , 5 , 0 , 4 , 0 ) . Diese Lösung besagt, daß das erste Mittel mit der Menge 4 und das zweite Mittel mit der Menge 5 angewendet werden soll. Der Wert der Hilfsveränderlichen x 4 — 4 verweist darauf, daß das Bilanzlimit, welches durch die zweite Bilanzbedingung mit 21 bestimmt worden ist, nicht vollständig ausgenutzt wird. Tatsächlich ist 3 x i + x 2 = 1 2 + 5 = 17.
x1*x2=9 Zeichnung 4.7
Da im gegebenen Beispiel nur zwei Veränderliche, xl und x2, vorkommen, wird es möglich, die Aufgabe graphisch zu lösen. Das zeigt Zeichnung 4.7. § 6. Die Lösung der Dualaufgabe Wir geben jetzt eine andere Lösungsmöglichkeit für das Beispiel 4 aus dem vorigen Paragraphen an. Sie beruht auf der Umformung der gegebenen Aufgabe in die Dualaufgabe.
148
Kapitel IV. Lineare Optimierung
Es zeigt sich nämlich, daß die Dualaufgabe — die zu derselben Lösung führt wie die Primalaufgabe — in gewissen Fällen einfacher zu lösen ist. Das Beispiel 4 bestand in der Maximierung der Zielfunktion Z =
—3X2+9*3+15*4
unter Einhaltung der Bilanzgleichungen * l + * 2 + * 3 + *4 = 10
*2+2*3+*4 = 2 und der Randbedingungen x,>0
( / = 1,2,3,4).
Die Dualaufgabe, die dieser Aufgabe entspricht, besteht in der Minimierung der Funktion v =
10^+2^
mit den Nebenbedingungen ¿1 + ^2 > 1 -3 Ai+
h >
15
und den Randbedingungen h>0
und A 2 > 0 .
Die oben aufgeführten vier Bilanzungleichungen des Dualproblems entsprechen den vier Mitteln xt, x2, x3, x».19) Aus der allgemeinen Theorie der linearen Optimierung folgt: ist das betreffende Mittel Xi = 0, so ist die entsprechende Bilanzbeschränkung des DualproWir bemerken noch, daß die Koeffizienten bei den Unbekannten A in den einzelnen Bilanzbedingungen der Dualaufgabe den Koeffizienten in den Spalten der Bilanzgleichungen der Primalaufgabe entsprechen.
§ 6. Die Lösung der Dualaufgabe
149
blems eine Ungleichung, und wenn das gegebene Mittel Jtj ^ 0, so ist die entsprechende Bilanzbeschränkung eine Gleichung.20) Um die vorliegende Aufgabe lösen zu können, müssen wir untersuchen, wieviele der vier Nebenbedingungen des Dualproblems die Form von Gleichungen annehmen können. Im gegebenen Fall kann es höchstens zwei solcher Gleichungen geben, da nur die beiden Unbekannten und /l2 auftreten. Die Gleichungen seien die beiden ersten Nebenbedingungen: AJ+A2 = 1 X
1
- X
= - 3 .
2
Aus diesen folgt, daß = — 1 ist. Das ist aber unmöglich, da die Multiplikatoren X wegen der Randbedingungen nicht negativ sein dürfen. Man kann aber auch nicht die erste und dritte Nebenbedingung als Gleichungen formulieren: AI+A2 = 1 Xl+2X
2
= 9.
Geht man von der ersten und vierten Bedingung aus, so widersprechen sich Aj+^2 = 15 und = 1. Ebenfalls unmöglich ist die Annahme, daß die dritte und vierte Nebenbedingung Gleichungen sein können: Xt+2Ä
2
= 9
Xt+X
2
= 15.
Wäre nämlich At+A2 = 15, dann folgte AI+2A2 > 9 (At und X2 sind positiv). 2
°) Die der Dualaufgabe entsprechende Form der Lagrangeschen Funktion ist
m n / m \ £•1 = S c r X r + £ X i l p i - s X r b r i \ , r —l ;=1 \ r= l / m wobei sie im Bereich der zulässigen Lösungen gleich £ c r l r ist. Daraus resultiert: r-1 m m ist xi # 0, so folgt daraus, daß pi— £ Kbri = 0, also £ K K i = Pi ist, d.h., r-1 r-1 die entsprechende Bilanzbeschränkung ist eine Gleichung. 11 Lange, Optimale Entscheidungen
150
Kapitel IV. Lineare Optimierung
Weitere Untersuchungen zeigen, daß nur die Annahme - -
- 3
= 15
zulässig ist. Diese Gleichungen sind für = 6 und 4 0 ) = 9 erfüllt. Da lediglich die zweite und vierte Nebenbedingung des Dualproblems Gleichungen sein können, darf man deshalb in der optimalen Lösung des Primalproblems nur das zweite und vierte Mittel anwenden. Wir haben also x2 > 0 und x4 > 0, dagegen sind die übrigen Mittel Xi = 0 und x3 — 0. Dieses Ergebnis stimmt mit dem überein, das wir bei der Lösung des vierten Beispiels im vorigen Paragraphen mit Hilfe der Simplex-Methode erhielten. Der Minimalwert der Funktion der Gesamtsensitivität der Bilanzlimite beträgt: v = 10A1+2A2 = 10 • 6 + 2 • 9 = 78, und das entspricht dem optimalen Wert der Zielfunktion z(z = 78) des Primalproblems. Das Resultat bestätigt die allgemeine Theorie der linearen Optimierung, wonach Max. z = Min. v gilt. Es zeigt sich, daß in diesem Fall die Lösung der Aufgabe der linearen Optimierung durch ihre Umformung in die Dualaufgabe sehr vereinfacht wurde. Mit der Methode des Probierens eliminierten wir die unrentablen Mittel, nämlich das erste und dritte Mittel, und ermittelten, daß die optimale Lösung das zweite und vierte Mittel enthalten muß. Unter komplizierteren Bedingungen ist die Lösung der Dualaufgabe nicht so einfach. Wir verwenden dann die Simplex-Methode, die in diesem Fall auf der Verminderung der Gesamtsensitivität der Bilanzlimite, d.h. der Funktion v, durch Ersetzen der „teuren" durch „billigere" Mittel beruht. Intuitiv vermutet man, daß dieses Vorgehen irgendwie die Umkehrung des Verfahrens zur Maximierung der Zielfunktion z ist. In Wirklichkeit handelt es sich um die zweite Variante desselben Verfahrens.
151
§ 6. Die Lösung der Dualaufgabe
Wir wenden die Simplex-Methode zur Lösung der oben gegebenen Dualaufgabe an. Zu diesem Zweck formen wir die vier Bilanzungleichungen durch Einführung negativer Hilfsveränderlicher /i u fi 2 , H3 und Ha in Gleichungen um. Wir erhalten dann folgende Bilanzgleichungen der Dualaufgabe V
M
¿1—^2
2
=
1 = —3
+P2
A,+2A2
+ ^ 3 = 9
¿L+H
+H 4 =
15.
Wir wollen feststellen, welche Hilfsveränderlichen verschwinden können.21* Nach Einführung der Hilfsveränderlichen kann man die Funktion v folgendermaßen schreiben: v = 10A,+2^+0^+0^2+0^3+0^4. Wir haben vier Bilanzgleichungen, die aber sechs Unbekannte ¿1, ¿2, HI, H2, HZ, HA enthalten. Also müssen zwei dieser Unbekannten HI > H2, H3, HA verschwinden. Es seien z.B. fi3 = 0 und ha — 0. Dann hat die vorläufige Lösung die Form (Als A2, HU HI-, 0, 0) und die Bilanzgleichungen sind =
1
H—H+HI
=
—3
^+2^2
=
9
Ax+A2
=
15.
Löst man diese Gleichungen, so erhält man: A = 21; 4°) = - 6 ; M0) = - 1 4 ; /4°> = - 3 0 . Die erste vorläufige „Lösung" (in dieser Lösung ist A^0) < 0, das entspricht nicht den Randbedingungen; die Lösung ist nicht zulässig, kann also auch nicht die optimale Lösung sein) kann man folglich JI) Verschwindet die Hilfsveränderliche Mi, dann wird die ihr entsprechende Bilanzbedingung zur Gleichung und die entsprechende Veränderliche x; ^ 0. Ist dagegen m ^ 0, so ist x, = 0.
Ii'
152
Kapitel IV. Lineare Optimierung
so angeben: (21, —6, —14, —30, 0, 0). Dieser Lösung entspricht der Wert der Zielfunktion v0 = 10 • 2 1 - 6 • 2 = 198. Wir führen nun die Veränderliche p 3 in die Lösung ein. Die Koeffizienten der 5. Spalte des Bilanzgleichungssystems sind die Linearform der Koeffizienten der ersten vier Spalten. Wir erhalten die Gleichungen: yi+yi+yt
=
o
yi—jz+^4 = o yi+2y2
= 1
yi+y2
= 0,
aus denen wir > = — 1; yi0) = 1; >40) = 0 und yi0) = 2 ermitteln. Demnach ist Pi~7i
= 0—[10(—1)+2(1)] = 8
sowie Av = t(p3-y3)
Nimmt man 22 ' t = — =
=
—ty3.
—^— = — 1 5 an, dann erhalten wir
Av = —15-8 = —120, also beträgt der neue Wert der Funktion v demnach ©j = 198—120 = 78. In der neuen Lösung ist fi2 = 0; sie hat also die Form (Aj, ?.2, jLilt 0,fi 3 ,0). In die Bilanzgleichungen eingesetzt, erhält man: ¿i+^+^I = 1 ll-X2 = -3 = 9 = 15. Daraus resultiert A = 6, 4°> = 9, M0) = - 1 4 , /4°> = 0, M0) = = —15, = 0. Die neue Lösung der Dualaufgabe ist also (6, "> Wir bemerken noch, daß der Koeffizient t in der Dualaufgabe nicht positiv sein muß.
153
§ 6. Die Lösung der Dualaufgabe
9, —14,0,-15,0). Man kann leicht nachrechnen, daß für diese Lösung der Wert der Zielfunktion tatsächlich vx = 1 0 - 6 + 2 - 9 = 78 ist. Wir prüfen noch, ob die Einführung der Veränderlichen /40) = y >
yi 0) = — 1,
Demnach ist Av = /(/> 4 - 7 4 ) = f [ 0 - (lO - 1 + 2 - 1 ) ] =
-6t.
Im vorliegenden Fall haben wir * x(°> 12;' -J/W L - = 1 8 ; -y(^0)- =—1 "4 sowie -j,(0) ^ = 0,
also t = 0 und Av = 0. Folglich verringert die Einführung der Veränderlichen ¡xx den Wert der Funktion v schon nicht mehr, das Ergebnis wird also nicht mehr verbessert. Demnach ist die vorherige Lösung optimal: (6, 9, —14, 0, —15, 0). Wir entnehmen dieser Lösung, daß der Wert der Funktion v minimal ist, falls nur das zweite und vierte Mittel verwendet werden (/¿2 = 0 und /¿4 = 0). Das sind die „vorteilhaften" Mittel. Die unvorteilhaften Mittel (das erste und dritte) wurden dagegen aus der Lösung eliminiert. Damit gelangen wir zu denselben Ergebnissen wie bei der Lösung des Beispiels 4 mit der SimplexMethode. Wir verweisen darauf, daß die Methode KantorowitscKs zur Lösung von Aufgaben der linearen Optimierung, die früher als
154
Kapitel IV. Lineare Optimierung
die Simplex-Methode von Dantzig ausgearbeitet wurde, auf der Lösung von Dualaufgaben aufgebaut ist. Sie ist also auf die Elimination der unrentablen Mittel und die Bestimmung solcher nichtnegativer Multiplikatoren (der sogenannten Auflösungsmultiplikatoren**) gerichtet, für die der Wert der Gesamtsensitivität der Bilanzlimite minimal ist. § 7. Das Optimalitätskriterium der Lösung Wir führen jetzt ein einfaches Kriterium ein, das uns ermöglicht festzustellen, ob die gefundene Lösung der linearen Optimierungsaufgabe optimal ist. Das Wesen dieses Kriteriums erläutern wir zuerst an einem konkreten Beispiel. Wir wissen, daß man m Unbekannte durch die übrigen n—m Unbekannten ausdrücken kann, wenn bei der gegebenen Aufgabe der linearen Optimierung n Unbekannte und m Bilanzgleichungen existieren, wobei n > m. Die Zielfunktion kann man dann als Funktion der n—m Veränderlichen ausdrücken. Betrachten wir noch einmal das Beispiel 1 aus Paragraph 5. Dort war die Funktion z—
xí+2x2—3x3+4x4
unter Einhaltung der Bilanzbedingungen *2+7*3+X 4 = 100 I x x + ^ — X i + l O x t = 800 und der Randbedingungen Xi
>0
(i = 1, 2, 3, 4)
zu maximieren. Die optimale Lösung dieser Aufgabe war (220, 120, 0, 0), wobei zMax. = 460. An Hand der Bilanzgleichungen drücken wir jetzt die Veränderlichen Xi und x2 als Funktionen der übrigen Veränderlichen x3 und x4 aus. Auch Auflösungskoeffizienten genannt.
154
Kapitel IV. Lineare Optimierung
die Simplex-Methode von Dantzig ausgearbeitet wurde, auf der Lösung von Dualaufgaben aufgebaut ist. Sie ist also auf die Elimination der unrentablen Mittel und die Bestimmung solcher nichtnegativer Multiplikatoren (der sogenannten Auflösungsmultiplikatoren**) gerichtet, für die der Wert der Gesamtsensitivität der Bilanzlimite minimal ist. § 7. Das Optimalitätskriterium der Lösung Wir führen jetzt ein einfaches Kriterium ein, das uns ermöglicht festzustellen, ob die gefundene Lösung der linearen Optimierungsaufgabe optimal ist. Das Wesen dieses Kriteriums erläutern wir zuerst an einem konkreten Beispiel. Wir wissen, daß man m Unbekannte durch die übrigen n—m Unbekannten ausdrücken kann, wenn bei der gegebenen Aufgabe der linearen Optimierung n Unbekannte und m Bilanzgleichungen existieren, wobei n > m. Die Zielfunktion kann man dann als Funktion der n—m Veränderlichen ausdrücken. Betrachten wir noch einmal das Beispiel 1 aus Paragraph 5. Dort war die Funktion z—
xí+2x2—3x3+4x4
unter Einhaltung der Bilanzbedingungen *2+7*3+X 4 = 100 I x x + ^ — X i + l O x t = 800 und der Randbedingungen Xi
>0
(i = 1, 2, 3, 4)
zu maximieren. Die optimale Lösung dieser Aufgabe war (220, 120, 0, 0), wobei zMax. = 460. An Hand der Bilanzgleichungen drücken wir jetzt die Veränderlichen Xi und x2 als Funktionen der übrigen Veränderlichen x3 und x4 aus. Auch Auflösungskoeffizienten genannt.
§ 7. Das Optimalitätskriterium der Lösung
155
Wenn wir x 2 aus den Bilanzgleichungen23) eliminieren, erhalten wir
5x1+20x3+13*4 = noo, also x x = 220—4x 3 —2,6X 4 . Auf ähnliche Weise erhalten wir x 2 = 120+3x 3 —l,6x 4 . Setzt man die so ermittelten x t und x 2 in die Zielfunktion ein, wird der Wert z als Funktion der beiden Veränderlichen x 3 und x 4 ausgedrückt: z = 460-x3-1,8x4. Das Ergebnis ist interessant. Es zeigt nämlich, daß dann, wenn die positiven Veränderlichen xl und x 2 — sie bilden eine Basis und wir bezeichnen sie deshalb als Basisvariable — richtig gewählt wurden, die Zielfunktion z ihr Maximum erreicht, falls x 3 = 0 und x 4 = 0. Das resultiert unmittelbar aus der Form der Zielfunktion z = = 460—x3—1,8x4, in der die Koeffizienten von x 3 und x 4 negativ sind. Auf der Grundlage dieses Beispiels ist es einfach zu erläutern, wie man zu dem eingangs erwähnten Optimalitätskriterium für die Zielfunktion gelangt. Zunächst muß man aus den Bilanzgleichungen die m Unbekannten x l 5 x 2 , ..., x m , die eine Basis bilden, eliminieren, d.h. sie sind durch die n—m übrigen Variablen x m + 1 , xm+2, xn auszudrücken. Die auf diese Weise gewonnenen Ausdrücke werden in die Zielfunktion eingesetzt. Die Zielfunktion wird somit zu einer Funktion der verbleibenden n—m Variablen, der sog. Nicht-Basisvariablen. Sind die Koeffizienten bei diesen Veränderlichen negativ, dann existiert eine optimale Lösung, die die Basisvariablen enthält (x 1 ; x 2 , ...,x m ); die übrigen Veränderlichen nehmen den Wert Null an. 2J> Die erste Gleichung multiplizieren wir mit 3 und addieren sie seitenweise zur zweiten Bilanzgleichung.
156
Kapitel IV. Lineare Optimierung
Sind in der Zielfunktion gewisse Koeffizienten bei den Unbekannten x m + i, x +i, ..., x gleich Null, dann ist die Basislösung zwar optimal (xj, x , ...,x ), sie ist aber nicht die einzige optimale Lösung, da einige der übrigen Veränderlichen beliebige Werte annehmen können. Sind schließlich einige Koeffizienten bei den Unbekannten x , *m+2> •••» positiv, dann ist die Basislösung x2, ..., xm) nicht optimal. Es wird dann nämlich möglich, durch Aussonderung einer Basisvariablen und ihren Ersatz durch eine andere Veränderliche den Wert der Zielfunktion zu erhöhen. Hat man eine Aufgabe der linearen Optimierung zu lösen, dann lohnt es sich im allgemeinen, zuerst das hier erörterte vereinfachte Kriterium anzuwenden. Und erst wenn der dritte der hier beschriebenen Fälle eintritt, sollte man das Simplex-Verfahren anwenden, um eine bessere Lösung als die Ausgangslösung zu finden. Wir zeigen nun noch, daß das in diesem Paragraphen eingeführte Kriterium im Grunde identisch ist mit dem Kriterium sign Az = = sign (Pm+i—Ym+i}> das uns bei der Simplex-Methode die Feststellung erlaubte, ob die Einführung des neuen Mittels die Lösung verbessert, d.h. den Wert der Zielfunktion erhöht. Als erstes formen wir die ursprüngliche Bilanzgleichung m
n
2
m
m+l
n (r =
=
1,2,
...,m)
in die folgende Form um: m
n
Y b
1
r i X i
=
c
r
-
2
i=m + l
( r = 1,2,
bHxt
(4.23)
...,m).
In diesen Gleichungen behandeln wir die Veränderlichen x x ,..., • ••,x m als unbekannte und die übrigen als bekannte Größen. Wir erhalten folgende Lösung des Gleichungssystems (4.23): u
X l
=
k -
t Bir r=I \
t j=m+1
b
r
j ( i /
= 1. 2, ..•,
m).
2
(4.24)
§ 7. Das Optimalitätskriterium der Lösung
157
Hierbei sind die Bir Elemente der zur Koeffizientenmatrix des Gleichungssystems (4.23) inversen Matrix (Kehrmatrix).24) Die Lösung (4.24) setzen wir in die wie folgt zerlegte Zielfunktion n m n Z = Y,Pixi= lLPixi+ ü Pjxj t-l (=1 j-m +1 ein. Wir erhalten dann m m / rt \ n H brjXj]+ S PjXj. i=1 r = 1 \ 7=m + l / y=m + l Diesen Ausdruck können wir ordnen, indem wir alle Bestandteile, die konstante Größen enthalten (cr und Bir), in einem Glied zusammenfassen, das wir mit C bezeichnen. Wir erhalten: n mm n z — C + x PjXj- YiPi ü Bir ü brjXj j=m+l ¡=1 r-1 j=m +1 oder z=C+
£ [pj-ipt£Birbr]Xj. (4.25) j=m +1 \ r=l / Aus dieser Formel geht hervor: Wenn die Basislösung (xlt x2, ..., ..., xm) optimal und einzig ist, müssen die Koeffizienten bei den Unbekannten xm+1, xm+2, ...,x„ negativ sein, also m m Pj- 'ZPiH Birbrj < 0 0' = m+l, m+2, ...,«). (4.26) i-1 r=l Wir zeigen, daß der Ausdruck (4.26) identisch ist mit dem Ausdruck Pm+\ Ym+\ = Pm+1-Piy[0)-P2yi0)— ^Pmy(m\ wobei jj 0 ) , J40), ..., yW bekannthch die Lösung des Gleichungssystems briyi+br2y2+
••• +brmym = br,m+1
ist.
(r = 1, 2, ..., m) m b,ixi = ar(r = /=l
> Die Lösung eines Systems m linearer Gleichungen des Typs 2
2
ist also identisch mit dem Kriterium, das Vorzeichen des entsprechenden Koeffizienten in der umgeformten Zielfunktion (4.25) zu prüfen, die wir erhalten, wenn m Veränderliche der Aufgabe durch die übrigen n—m Veränderlichen ausgedrückt werden. Auf diese Weise gelangten wir zu einer neuen Interpretation des Kriteriums, das bei der Simplex-Methode angewendet wird, um zu prüfen, ob die Einführung einer neuen Veränderlichen in die Lösung vorteilhaft ist. Es zeigt sich, daß die Ausdrücke p{—yt als Koeffizienten bei den Unbekannten xt in der umgeformten Zielfunktion auftreten. Man kann sie in diesem Zusammenhang in folgender Form schreiben: * = C+
t (Pj~yj)xj(4-28) y=m+1 Ist ein Koeffizient in der umgeformten Zielfunktion negativ, dann handelte man richtig, das entsprechende Mittel aus der Lösung zu eliminieren. Ist der betreffende Koeffizient dagegen positiv, dann ist es richtig, irgendein Mittel aus der Basislösung durch das betreffende Mittel außerhalb der Basislösung zu ersetzen.
§ 7. Das Optimalitätskriterium der Lösung
159
Diese Interpretation gibt somit eine zusätzliche Erläuterung des Grundgedankens der Simplex-Methode und der Bedeutung der Nettoproduktivität der einzelnen Mittel in der Lösung. Zum Abschluß dieses Kapitels über die lineare Optimierung möchten wir noch einige Bemerkungen zur weiteren Entwicklung dieser Optimierungsmethode anfügen. Die Methode der linearen Optimierung findet eine wichtige Anwendung in der modernen Produktionstheorie und entwickelt wesentlich wirklichkeitsnahere Auffassungen als die neoklassische Produktionstheorie. Die weitere Verallgemeinerung und der Ausbau der Theorie der linearen Optimierung führt zur Lösung von Aufgaben, in denen nicht ein einziges Ziel der Tätigkeit vorgegeben ist, sondern mehrere Ziele, die kein gemeinsames Maß haben. Es geht kurz gesagt um die Ermittlung einer optimalen Lösung bei einer Vielfalt von Zielen. Mit diesen Problemen beschäftigen wir uns in den folgenden Kapiteln.
Kapitel V
Die Prozeßanalyse § 1. Das Wesen der Prozeßanalyse Die auf der Marginalrechnung begründete Optimierungstheorie (Kapitel III) bedient sich der Produktionsfunktion z = f{xi, x2, ...,x„), wobei dieser Produktionsfunktion gewisse Eigenschaften unterstellt werden. Unter anderem ist diese Funktion stetig und difFerenzierbar, und ihre partiellen Ableitungen (die als Grenzproduktivitäten gedeutet werden) sind nicht negativ: > 0 (i = = 1, 2, ...,ri). Infolge dieser und weiterer Annahmen sind die Isoquanten der Produktionsfunktion, die je nach der Anzahl der Produktionsfaktoren Linien, Flächen oder Hyperflächen darstellen, zum Ursprung des Koordinatensystems konvex (also von oben konkav). Das ist eine notwendige Bedingung dafür, daß die Lösung des Optimierungsproblems auf ein Maximum der Produktion bei gegebenen Kosten (und nicht auf ein Minimum der Produktion bei gegebenen Kosten) führt. Die Existenz einer Produktionsfunktion z = f(xl3 x2, xn) mit den obengenannten Eigenschaften stieß jedoch auf Kritik, als man die Marginalrechnung praktisch anwenden wollte. Es wurde vor allem darauf verwiesen, daß ein Messen der Grenzproduktivitäten unbestimmt und unreal sei, da es die unbegrenzte Substitution beliebig kleiner Mengen von Produktionsfaktoren voraussetzt. Die Produktionsfaktoren sind aber in der Praxis in wesentlich geringerem Maß teilbar. Eine Maschine besitze beispielsweise eine Leistung von 100 kW. Dann kann man sie durch 10 Maschinen mit einer Leistung von je 10 kW ersetzen. Und in diesem Zusammenhang kann man von der Notwendigkeit sprechen, die Arbeitskräftezahl zu erhöhen, wenn eine Maschine mit der Leistung von 10 kW ausscheidet.
§ 1. Das Wesen der Prozeßanalyse
161
Geringere Veränderungen und Substitutionen der beiden Produktionsfaktoren in Mengen unterhalb eines gewissen Niveaus (Quantums) sind aber praktisch unmöglich. Mit der Notwendigkeit, den Einfluß des technischen Fortschritts in der Produktionsfunktion zu berücksichtigen, ergibt sich eine weitere Schwierigkeit, die ebenfalls zu veränderten Einsatzverhältnissen der Produktionsfaktoren führt. Es erweist sich nämlich als notwendig, in die Produktionsfunktion einen geeigneten Parameter r einzuführen, der den Einfluß des technischen Fortschritts auf die Mengenrelationen der Produktionsfaktoren berücksichtigt. Die Produktionsfunktion hätte dann also die Form z — f(xx, x2, ..., x„, r). Theoretisch kann man dieses Problem also irgendwie klären. Wesentlich schwieriger ist es aber, das Problem praktisch zu lösen, da es fast unmöglich ist, Veränderungen durch Faktorsubstitution von denen des technischen Fortschritts zu trennen.1* Eine solche Produktionsfunktion erweist sich deshalb als eine künstliche Gedankenkonstruktion, sobald man von der Theorie zur Praxis schreitet, weil die auf dieser bequemen mathematischen Konzeption aufbauende Marginalrechnung den wirklichen Produktionsprozessen nicht entspricht. Diese Tatsache bewirkte die Entwicklung einer neuen Methode zur Bestimmung des optimalen Produktionsprogramms. Sie wird Prozeßanalyse (englisch: activity analysis) genannt. Als Schöpfer dieser neuen Methode betrachtet man T. C. Koopmans, der sie 1951 in der Arbeit „Analysis of Production as an Efficient Combination of Activities" erstmals veröffentlichte.2) Das Problem, mit dem sich die Prozeßanalyse beschäftigt, ist im Grunde dem Problem analog, das wir als Mischungsproblem be'> Ein Beispiel dafür, in welchem Grad sich der Einfluß dieser beiden Faktoren miteinander verbindet, ist die Tatsache, daß unter kapitalistischen Verhältnissen die Verteuerung der Arbeitskraft zum Hebel für den technischen Fortschritt wird. 2) Diese Arbeit ist in dem von Koopmans redigierten Sammelband „Activity Analysis of Production and Allocation", John Wiley & Sons, Inc., New York 1951, enthalten. Vgl. auch: T. C. Koopmans, „Three Essays on the State of Economic Science", New York 1957, S. 66-104.
162
Kapitel V. Die Prozeßanalyse
zeichneten (Kapitel I). Ein Betrieb fertige z.B. ein Produkt im Umfang z. Hierfür setzt er n Produktionsfaktoren ein. Dabei stehen ihm m technologische Prozesse zur Verfügung. Jeder Produktionsprozeß wird durch die ihm eigenen technischen Koeffizienten charakterisiert. Sie bestimmen den Aufwand jedes einzelnen Produktionsfaktors, der für die Erzeugniseinheit bei Nutzung des betreffenden technologischen Prozesses benötigt wird. alr > 0 bezeichnet die Menge des i-ten Produktionsfaktors, die zur Herstellung einer Erzeugniseinheit bei Nutzung des r-ten Prozesses verbraucht wird. Dem ersten Produktionsprozeß entsprechen demnach folgende technischen Koeffizienten: O21, ..., an 1, dem zweiten Prozeß die Koeffizienten dem m-ten Prozeß die Koeffizienten Alle diese Koeffizienten kann man in der sogenannten technologischen Matrix erfassen: ~an al2 ... alm~ a 2l a22 ••• a2m _anl an2 ••• anmJHierbei unterstellt man, daß diese Matrix für den betreffenden Betrieb festliegt. Die technologische Matrix hat m Spalten und n Zeilen. Jede der Spalten charakterisiert einen bestimmten Prozeß, und die Zeilen enthalten die Einsatzmengen der Produktionsfaktoren, die in den verschiedenen Prozessen für eine Erzeugniseinheit benötigt werden. Die r-te Spalte enthält z.B. alle technischen Koeffizienten, die im r-ten Produktionsprozeß gelten. In der i-ten Zeile sind dagegen die unterschiedlichen Einsatzmengen des i-ten Produktionsfaktors verzeichnet, die in den einzelnen Prozessen zur Fertigung einer Erzeugniseinheit aufzuwenden sind.
§ 1. Das Wesen der Prozeßanalyse
163
An Hand dieser Matrix kann man leicht errechnen, welche Mengen der einzelnen Produktionsfaktoren aufzuwenden sind, um die vorgegebene Erzeugnismenge z mit dem r-ten Prozeß zu fertigen. Diese Mengen betragen nämlich: alrz, a2rz,..., anrz. Schon aus dieser Darstellung des Problems wird ersichtlich, worin der prinzipielle Unterschied zwischen der Prozeßanalyse und der marginalistischen Auffassung der Produktionsoptimierung besteht. Nach der Marginalmethode existierten unendlich viele Varianten technologischer Prozesse, wobei der eine in den anderen stetig übergehen konnte. Nach der Prozeßanalyse verfügen wir dagegen nur über eine begrenzte (endliche) Anzahl von Prozessen. Unter diesen ist ein — optimaler — Prozeß oder eine — optimale — Kombination von Prozessen so auszuwählen, daß der Produktionsertrag maximal wird. Bei der Prozeßanalyse kann man die Produktionsfunktion durch das folgende Gleichungssystem beschreiben: X\ — o n z ; Xj — a 12 z; ...; Xi — a\ m z x2 — O21Z', x2 = a22z; ...; X2 = a2mz
(5.1)
Xn — Ctn\Z, Xn — üZ y • • • > Xn — &nm Z * Die r-te Spalte enthält hier die benötigten Mengen an einzelnen Produktionsfaktoren, um bei Nutzung des r-ten Prozesses das Produkt in der Menge z zu erzeugen. Die Zeilen des Systems (5.1) bezeichnen dagegen die Mengen ein und desselben Produktionsfaktors, die notwendig sind, um das Produkt z bei Nutzung verschiedener Prozesse herzustellen. Sind die Produktionskoeffizienten air konstant, so ist die Produktionshöhe z den Einsatzmengen der Produktionsfaktoren proportional
-, z = — usw.). Diese An 0, x2 > 0), die vom Ursprung des Koordinatensystems ausgehen, dargestellt. Die Prozeßanalyse beruht nun nicht auf der Auswahl eines Prozesses, sondern auf der Auswahl einer optimalen Prozeßkombination. Auf diese Weise wird das Problem der Faktorsubstitution gelöst. Während das vorliegende Verfahren Faktorsubstitutionen ausschließt, ermöglicht es den Austausch der Prozesse untereinander sowie den kombinierten Einsatz mehrerer Prozesse. Einer der Produktionsfaktoren verteuere sich beispielsweise. Dann besteht die Möglichkeit, eine solche Prozeßkombination zu wählen, bei der Prozesse bevorzugt werden, die einen geringeren Verbrauch dieses verteuerten Faktors aufweisen. 12 Lange, Optimale Entscheidungen
166
Kapitel V. Die Prozeßanalyse
Nach der marginalistischen Auffassung von der Produktionsoptimierung erfolgte die Substitution der Produktionsfaktoren durch eine sehr abstrakt bestimmte Produktionsfunktion. Bei der Prozeßanalyse vollzieht sich dagegen die Substitution konkret durch den Austausch der Prozesse. Zweifellos entspricht eine solche Auffassung vom Substitutionsproblem der Wirklichkeit weit mehr. Auf welche Weise kann man Prozeßkombinationen graphisch darstellen? In der Zeichnung 5.2, die den vorherigen Abbildungen ähnelt, sind die Punkte Au A2, A3, A4, ... festgelegt worden. Sie liegen auf den Geraden 1,2, 3, 4, ..., durch die die verschiedenen Prozesse charakterisiert werden. Ihnen entspricht das Produktionsniveau z = 1. Demgemäß entspricht den Punkten Blt B2, B3, B4, ...
Zeichnung 5.2
die Produktionshöhe z = 2, den Punkten Clt C2, C3, C 4 , ... die Produktionshöhe z = 3 usw. Die Abschnitte der gebrochenen Linien Au A2, A3, A4, ..., Bu B2, B3, B4, ..., Ci, C2, C 3 , C 4 , ... usw. sind einander parallel, aber ihre Abstände vom Ursprung des Koordinatensystems wachsen proportional zu den natürlichen Zahlen 1,2, 3, 4 Das Netz dieser gebrochenen parallelen Linien läßt sich beliebig verdichten. Man hat nur weitere gebrochene Linien einzuzeichnen, denen z.B. z = y , z = l y usw. entsprechen. Es ist noch folgendes hinzuzufügen: Weil mit wachsender Anzahl der Prozesse (im oo) die Zahl der sie darstellenden Geraden immer größer
§ 1. Das Wesen der Prozeßanalyse
167
wird, nähern sich die gebrochenen Linien „glatten" Kurven an. Das Netz der gebrochenen Linien erinnert dann an das Netz der Isoquanten als „Karte" der stetigen Produktionsfunktion (Kapitel III). Die gebrochenen Linien auf der Zeichnung 5.2 sind in diesem Sinne Isoquanten, da die Koordinaten ihrer Eckpunkte die zulässigen Mengenverhältnisse der Produktionsfaktoren bestimmen, die man im jeweiligen Prozeß zur Erzeugung einer bestimmten Produktionsmenge verwenden muß. Die übrigen Punkte auf den gebrochenen Linien bleiben außer Betracht. Aus diesen Bemerkungen folgt, daß man die marginalistische Produktionstheorie als den Grenzfall der Prozeßanalyse betrachten kann, in dem die Anzahl der Prozesse unbegrenzt wächst, also m-too. Bleibt die Anzahl der Prozesse jedoch verhältnismäßig gering, läßt sich die Prozeßanalyse nicht durch die marginalistische Produktionstheorie ersetzen; nur die der Prozeßanalyse zugrunde gelegten Annahmen spiegeln dann die Wirklichkeit adäquat wider. 4) Es ist kennzeichnend, daß die Prozeßanalyse durch Ingenieure entwickelt wurde, die sich mit Problemen der Betriebswirtschaft beschäftigten. Allein diese Tatsache verweist schon auf die praktische Bedeutung dieser Untersuchungsmethoden. Die Entwicklung der Prozeßanalyse fällt in die Periode des II. Weltkrieges und in die Nachkriegsjahre. Ihre theoretischen Grundlagen erarbeitete T.C. Koopmans im Jahre 1951, und einige Jahre später verwiesen P.A. Samuelson und R . G . D . Allen darauf, daß sich die marginalistische Theorie und die Prozeßanalyse nicht widersprechen.^ Tatsächlich kann man die erste als Grenzfall der Prozeßanalyse auffassen, wenn die Anzahl der möglichen Produktionsprozesse unendlich groß ist. 4 ) Versuche zur Realisierung der Marginaltheorie wurden unter anderem von dem norwegischen Ökonomen Ivar Jantzen unternommen. I. Jantzen erlegte zu diesem Zwecke der Produktionsfunktion gewisse Beschränkungen bezüglich der Teilbarkeit der Faktoren auf. Vgl. zu diesem Problem auch Erich Schneider, Theorie der Produktion, Wien 1954, S. 5 1 - 5 7 und 8 3 - 8 6 . 5 ) Vgl. R.A. Dorfman, P.A. Samuelson, R . M . Solow, Linear Programming and Economic Analysis, McGraw-Hill, New York—Toronto—Lodon 1958, S. 375-381 und R. G. D. Allen, Mathematical Economics, Macmillan & Co. Ltd, London 1957, S. 565fl'., insb. S. 635, sowieEkonomia matematyczna,PWN,Warszawa 1961, S. 661 ff.
12«
168
Kapitel V. Die Prozeßanalyse
Den bisherigen Betrachtungen zur Prozeßanalyse unterstellten wir die Existenz der beiden Produktionsfaktoren xt und x2. Das ermöglichte die einfache geometrische Interpretation des Problems. Es ist aber nicht schwer, die geometrische Deutung des Problems auf Prozesse mit drei und mehr Faktoren auszudehnen. Diese Verallgemeinerung ähnelt jener, bei der die Produktion z eine Funktion von drei oder mehr Produktionsfaktoren ist (Kapitel III). So kann man beispielsweise für drei Produktionsfaktoren (n = 3) die bei der Prozeßanalyse auftretenden Isoquanten graphisch als „gebrochene Flächen" (d.h. Flächen, die aus Teilen von Flächen zusammengesetzt sind) darstellen, wobei diese Flächen konvex zum Ursprung des Koordinatensystems sind. § 2. Produktionsmaximierung und Kostenminimierung Wir erörterten soeben die Eigenschaften der Isoquanten bei der Prozeßanalyse. Hierbei verwiesen wir darauf, daß nur die Koordinaten der Eckpunkte der gebrochenen Linien bedeutsam sind; sie bestimmen nämlich die zulässigen Faktorkombinationen, die im erwählten Prozeß verwendet werden können. Das trifft aber nur dann zu, wenn man praktisch nur einen unter mehreren möglichen Prozessen anwendet. Hingegen repräsentieren die Koordinaten der zwischen den Ecken liegenden Punkte auf den Isoquanten „Mischungen" verschiedener Prozesse. Das Produktionsniveau z betrage 1, und es seien u{ und u2 die Mengen des in den Prozessen 1 und 2 erzeugten Produktes, also "i+«2 = 1- Wie man leicht sieht, beträgt dann der Aufwand des ersten Produktionsfaktors = «n «1+^12 "2 = an «1+012(1— "l) und der Aufwand des zweiten Faktors x2 = Ö21W1+Ö22W2 =
a2iui+a22(l—"i).
Benutzen wir nur den ersten Prozeß (d.h. ut — 1 und u2 = 0), dann werden die Aufwände x! und x2 durch die Koordinaten des Punktes Ai bestimmt. Dieser liegt auf der den Prozeß 1 abbildenden
168
Kapitel V. Die Prozeßanalyse
Den bisherigen Betrachtungen zur Prozeßanalyse unterstellten wir die Existenz der beiden Produktionsfaktoren xt und x2. Das ermöglichte die einfache geometrische Interpretation des Problems. Es ist aber nicht schwer, die geometrische Deutung des Problems auf Prozesse mit drei und mehr Faktoren auszudehnen. Diese Verallgemeinerung ähnelt jener, bei der die Produktion z eine Funktion von drei oder mehr Produktionsfaktoren ist (Kapitel III). So kann man beispielsweise für drei Produktionsfaktoren (n = 3) die bei der Prozeßanalyse auftretenden Isoquanten graphisch als „gebrochene Flächen" (d.h. Flächen, die aus Teilen von Flächen zusammengesetzt sind) darstellen, wobei diese Flächen konvex zum Ursprung des Koordinatensystems sind. § 2. Produktionsmaximierung und Kostenminimierung Wir erörterten soeben die Eigenschaften der Isoquanten bei der Prozeßanalyse. Hierbei verwiesen wir darauf, daß nur die Koordinaten der Eckpunkte der gebrochenen Linien bedeutsam sind; sie bestimmen nämlich die zulässigen Faktorkombinationen, die im erwählten Prozeß verwendet werden können. Das trifft aber nur dann zu, wenn man praktisch nur einen unter mehreren möglichen Prozessen anwendet. Hingegen repräsentieren die Koordinaten der zwischen den Ecken liegenden Punkte auf den Isoquanten „Mischungen" verschiedener Prozesse. Das Produktionsniveau z betrage 1, und es seien u{ und u2 die Mengen des in den Prozessen 1 und 2 erzeugten Produktes, also "i+«2 = 1- Wie man leicht sieht, beträgt dann der Aufwand des ersten Produktionsfaktors = «n «1+^12 "2 = an «1+012(1— "l) und der Aufwand des zweiten Faktors x2 = Ö21W1+Ö22W2 =
a2iui+a22(l—"i).
Benutzen wir nur den ersten Prozeß (d.h. ut — 1 und u2 = 0), dann werden die Aufwände x! und x2 durch die Koordinaten des Punktes Ai bestimmt. Dieser liegt auf der den Prozeß 1 abbildenden
§ 2. Produktionsmaximierung und Kostenminimierung
169
Geraden 1 (Zeichnung 5.3). Bedienen wir uns hingegen nur des zweiten Prozesses (d.h. u2 = 1 und «j = 0), dann werden die Aufwände und x2 durch die Koordinaten des Punktes A2 angezeigt. Dieser Punkt liegt auf der dem Prozeß 2 entsprechenden Geraden 2. Folglich werden die Faktormengen und x2, die bei Kombinationen der Prozesse 1 und 2 zur Erzeugung der Produktion z = « i + « 2 = 1 eingesetzt werden, durch die Koordinaten der auf dem Abschnitt AXA2 liegenden Punkte bestimmt.
Zeichnung 5.3
Um das zu zeigen, berücksichtigen wir, daß das obige Gleichungssystem : = öiiWi+aiz(l—"i) 1 (5.3) x 2 = a 2 i"i+fl22(l—"l) J eine Parameterdarstellung der beiden Geraden ist. Wir eliminieren aus diesen Gleichungen zunächst den Parameter Mi. Hierzu benutzen wir beispielsweise die erste Gleichung: *1— «12 «i = — — — . «11-012 Sodann setzen wir ux in die umgeformte zweite Gleichung des Systems *2 = fei" Ö22)"l + fl22 ein. Wir erhalten dann folgende Geradengleichung "21—Oll Oll—«22 (5.3.1) Xi a +a . «11 — 012 «11—«12 12 22 Auf der durch Gleichung (5.3.1) beschriebenen Geraden liegt sowohl der Punkt At als auch der Punkt A2, da die Parameterwerte X2 :
170
Kapitel V. Die Prozeßanalyse
die diesen Punkten entsprechen: = 1 und u2 = 0, die Gleichungen (5.3) erfüllen. Aus diesen Gleichungen wurde aber die Gleichung (5.3.1) hergeleitet. Auf diese Weise haben wir gezeigt, daß bei einer Produktionshöhe von z = 1 die Koordinaten der Punkte auf dem Abschnitt AIA2 die Einsatzmengen der Produktionsfaktoren und x2 angeben. Diese entsprechen den verschiedenen Werten für ux und u2, die die Anteile der Prozesse 1 und 2 an der Gesamtproduktion ausdrücken. Analog kann man die Punkte auf den Abschnitten solcher Isoquanten deuten, die anderen Produktionshöhen z entsprechen. Die Gleichungen (5.3) haben dann die Form: xi = anuiz+ai2(l-u1)z 1 x2 = a2luiz+a22(l—ui)z. )
Aus der Zeichnung 5.4 wird ersichtlich, daß bei derselben Produktionshöhe z durch Kombination der Prozesse 1 und 3 von beiden Produktionsfaktoren mehr verbraucht wird als durch Kombinationen der Prozesse 1 und 2 oder 2 und 3. Wie in Zeichnung 5.4 graphisch veranschaulicht wird, ist es nämlich in solchen Fällen vorteilhafter, die „benachbarten Prozesse" miteinander zu kombinieren. Dagegen sind die Kombinationen „weiter voneinander entfernter" Prozesse ungünstiger. Um dasselbe Produktionsergebnis zu erzielen, erfordern solche Kombinationen von jedem, zumindest aber von einem Produktionsfaktor größere Aufwände. Das hat eine rein technische Ursache, die mit den Preisrelationen zwischen den einzelnen Produktionsfaktoren nicht zusammenhängt. Aus diesem Grund werden wir in solchen
§ 2. Produktionsmaximierung und Kostenminimierung
171
Fällen von einer größeren oder geringeren technischen Wirksamkeit*0 sprechen, von einer besseren oder schlechteren ingenieur-technischen Kombination der Prozesse. Diese Schlußfolgerung über den Grad der technischen Wirksamkeit von Kombinationen benachbarter Prozesse resultiert daraus, daß die den technologischen Prozessen entsprechenden Isoquanten annahmegemäß gebrochene Linien darstellen, die zum Ursprung des Koordinatensystems konvex sind. Das ist der Zeichnung 5.4 leicht zu entnehmen. Ist die Isoquante hingegen in einem gewissen Abschnitt konkav zum Ursprung des Koordinatensystems, so wie das auf der Zeichnung 5.5 dargestellt ist, dann kann man den Prozeß, dem die
Gerade 2 entspricht, außer acht lassen; denn er ist weniger wirksam als die anderen benachbarten Prozesse. In diesem Fall ist nämlich die Kombination der Prozesse 1 und 3 wesentlich vorteilhafter, wirksamer als die Kombinationen der Prozesse 1 und 2 oder 2 und 3; denn für die Realisierung der Kombination 1 und 3 wird von beiden Produktionsfaktoren Xi und x2 weniger benötigt als bei der Realisierung der Kombinationen 1 und 2 oder 2 und 3. Im Spezialfall kann die Isoquante ein Abschnitt der Geraden sein, aber dann ist es (wie aus der Zeichnung 5.6 hervorgeht) vom Standpunkt der technischen Wirksamkeit der Prozesse gleichgültig, ob wir den Prozeß 2 oder eine Kombination der Prozesse 1 und 3 anwenden. *> Auch als Effizienz bekannt.
172
Kapitel V. Die Prozeßanalyse
In solchen Spezialfällen werden die der benachbarten Kombination gleichwirksamen Prozesse ebenfalls außer acht gelassen.
Nach Vernachlässigung der „weniger wirksamen" und der „gleichermaßen wirksamen" Technologien bei Kombinationen benachbarter Prozesse sind die in der Prozeßanalyse enthaltenen Isoquanten zum Ursprung des Koordinatensystems konvex. Unterstellen wir darüber hinaus, daß die Anzahl der elementaren wirksamen Prozesse (d.h. solcher, die nach Veranchlässigung der „weniger wirksamen" und der Kombination „gleichermaßen wirksamer" benachbarter Prozesse verbleiben) unbegrenzt wächst, dann nähern sich die gebrochenen Linien der Isoquanten den glatten, zum Ursprung des Koordinatensystems konvexen Linien an; sie werden also den in der neoklassischen Produktionstheorie gebräuchlichen Isoquanten ähnlich (Kapitel III). Auf diese Weise erhält die Konzeption der marginalistischen Theorie im Lichte der Prozeßanalyse eine konkrete Bedeutung. Damit einher geht eine tiefere Einsicht in die Genesis der marginalistischen Theorie und das „Gesetz der zunehmenden Substitutionsrate", das die Konvexität der Isoquanten zum Ursprung des Koordinatensystems unterstellt. Wie oben gezeigt wurde, ist die Annahme zunehmender Substitutionsraten nämlich eine Konsequenz der Auswahl technologisch wirksamer und der Vernachlässigung technologisch weniger wirksamer Prozesse. Das entspringt aber dem praxeologischen Verfahrensprinzip und nicht einer vermeintlichen Eigenschaft der Produktionstechnik, wie das die neoklassische Ökonomie annahm.
§ 2. Produktionsmaximierung und Kostenminimierung
173
Die bisherigen Untersuchungen bezogen sich auf solche Prozeßanalysen, in denen — wie bereits erwähnt — die Anzahl der Produktionsfaktoren leicht von n = 2 auf beliebig viele Faktoren erweitert werden kann. Bei drei Faktoren (n = 3) wären die dem jeweiligen Produktionsniveau entsprechenden Isoquanten gebrochene Flächen, die aus Teilen von Flächen zusammengesetzt sind. Eine analoge graphische Darstellung von Problemen der Prozeßanalyse für n > 3 ist schon nicht mehr möglich. Die beschreibende und analytische Formulierung dieser Probleme wären dagegen einander analog. Wir wollen jetzt das Problem lösen, ein optimales System von Produktionsfaktoren zu finden. Es ist also eine solche Prozeßkombination anzugeben, in der bei gegebenem Kostenaufwand das Produkt maximal ist. Für die graphische Interpretation des Problems unterstellen wir, daß nur zwei Produktionsfaktoren Xx und x2 vorhanden sind. In diesem Fall kann man die Bilanzgleichung der Kosten wie folgt schreiben: PiXi+p2x2
= c.
Hierbei sind px und p2 die Faktorpreise und c ein konstanter Betrag, nämlich die zulässigen Kosten. Formuliert man die Kostengleichung wie folgt
so wird ersichtlich, daß sie eine Gerade mit negativem Anstieg zur positiven Richtung der Abszissenachse beschreibt. Der Richtungskoeffizient dieser Geraden ist der absolute Wert des Preisverhältnisses der Produktionsfaktoren — . Pi
In der Zeichung 5.7 wurden die den elementaren wirksamen Prozessen entsprechenden Geraden und die dazugehörigen Isoquanten aufgetragen. Man erkennt unmittelbar, daß die optimale Lösung des Problems die Koordinaten des Punktes sind, in dem die Kostengerade eine der Isoquanten berührt. Auf analoge Weise löst man das Dualproblem. Dort geht es um die Festlegung einer solchen Faktorkombination, bei der die Herstellungskosten für eine bestimmte Produktionsmenge minimal sind.
174
Kapitel V. Die Prozeßanalyse
In diesem Fall muß man die Schar der Kostengeraden entsprechend
wobei der Parameter c verschiedene Werte annimmt. Die Lösung des dualen Problems ist wiederum durch die Koordinaten des Punktes gegeben, in dem eine dieser Kostenlinien die dem vorgegebenen Produktionsniveau entsprechende Isoquante berührt. Wir schlußfolgern, daß Probleme der Produktionsmaximierung oder Kostenminimierung bei der Prozeßanalyse im wesentlichen analog zur Marginalrechnung gelöst werden. Es existieren jedoch gewisse Unterschiede. Vor allem gibt es bei der Marginalrechnung, bei der die Isoquanten glatte und stetige Linien sind, einen Berührungspunkt der Kostenlinie und der Isoquante, also eine Lösung des Problems. Bei der Prozeßanalyse kann die Isoquante dagegen in gewissen Fällen über einen ganzen Abschnitt an der Kostenlinie anliegen (Zeichnung 5.9). Das bedeutet, daß verschiedene Faktorkombinationen gleich gut sind. Die Existenz vieldeutiger Lösungen, denen die Koordinaten der Punkte eines gewissen Abschnitts entsprechen, neben der Existenz eindeutiger Lösungen, denen die Koordinaten eines bestimmten Punktes entsprechen, ist bekanntlich (vgl. Kapitel IV) ein Charakteristikum der Probleme der linearen Optimierung. Existieren drei Produktionsfaktoren, dann setzt sich die Isoquante aus einer gebrochenen Fläche zusammen, die aus Teilen von Flächen
§ 2. Produktionsmaximierung und Kostenminimierung
175
gebildet wird, und die Bilanzgleichung der Kosten wird als Fläche dargestellt. Es können dann die folgenden drei Fälle eintreten: 1. die Kostenfläche liegt am Gipfelpunkt der Isoquante an und hat mit ihr einen gemeinsamen Punkt, 2. die Kostenfläche liegt an einer Kante der Isoquante an, 3. die Kostenfläche liegt an einer Seite der Isoquante an.6)
Im ersten Fall existiert nur eine Lösung des Problems. Im zweiten und dritten Fall gibt es hingegen unendlich viele Lösungen. Sie sind entweder durch die Koordinaten der Punkte eines Abschnitts oder durch die Koordinaten eines Teiles einer dreieckigen Fläche bestimmt. Wir erkennen daran, daß sich mit zunehmender Anzahl der Produktionsfaktoren der „Freiheitsbereich" immer mehr erweitert, der die Punkte enthält, die den Lösungen des Problems entsprechen. Im allgemeinen Fall mit n Produktionsfaktoren ist die Isoquante ein (n— l)-dimensionales Hyperpolyeder. Die Lösungen des Problems der optimalen Produktion mit n Faktoren sind durch die Koordinaten einer Punktmenge des (n— l)-dimensionalen Hyperpolyeders bestimmt. Die marginalistische Theorie führt dagegen stets zu einer (eindeutigen) Lösung,*) aber zu Lasten einer richtigen Abbildung der konkreten Wirklichkeit. Trotzdem kann man das in der marginalistischen Theorie benutzte Modell als Grenzfall des Modells der Prozeßanalyse auffassen, wenn die Anzahl der Prozesse unbegrenzt wächst. 6)
Man kann beweisen, daß die Seiten der Isoquante Dreiecke sind. *> Vgl. § 3, Kapitel III.
176
Kapitel V. Die Prozeßanalyse
§ 3. Das Problem der Verbundproduktion Wir untersuchen jetzt einen weiteren Anwendungsbereich der Prozeßanalyse. Bisher haben wir unterstellt, daß ein Produkt mit Hilfe mehrerer Produktionsfaktoren hergestellt wird. Wir beschäftigen uns jetzt mit dem in gewissem Sinne entgegengesetzten Fall, sofern wir annehmen, daß mit einem Produktionsfaktor gleichzeitig verschiedene Erzeugnisarten hergestellt werden können. Das ist der Fall der sogenannten Verbundproduktion. Beispiel für eine solche Situation kann der Anbau verschiedener landwirtschaftlicher Kulturen (Weizen, Rüben, Kartoffeln usw.) unter Einsatz eines Produktionsfaktors sein. Hierbei mag es sich um eine für den Anbau der Kulturen geeignete Bodenfläche handeln. Ein derartiges Problem kann in zwei Versionen formuliert werden. Erstens kann es darum gehen, bei fest vorgegebener Faktormenge eine Produktkombination zu erreichen, deren Produktionswert maximal ist. Zweitens kann das Ziel der Analyse in der Auswahl einer solchen Produktkombination bestehen, deren vorgegebener Produktionswert mit minimalem Faktoraufwand erreicht wird. Das sind zwei zueinander duale Probleme, deren Lösungen ihrem Wesen nach gleich sind, während ihre Interpretationen voneinander abweichen. Die technologische Matrix sei gegeben: Oll #12 ••• Q\m Ü21 Cl22 • •• Ö2m ,anl
a
nZ
•••
OnmJ-
In ihr bezeichnen die Elemente der r-ten Spalte die Aufwände des gegebenen Produktionsfaktors, die zur Herstellung einer Erzeugniseinheit der verschiedenen Produkte bei Nutzung des r-ten Prozesses notwendig sind. Allgemein bedeutet aJr die Faktorenmenge (z.B. die landwirtschaftliche Nutzfläche), die beim r-ten Prozeß einzusetzen ist, um eine Einheit des 7-ten Produktes (beispielsweise 1 dt Weizen) zu erzeugen.
§ 3. Das Problem der Verbundproduktion
177
Auf diese Weise wird mit Hilfe der Gleichungen vom Typ x = ajrzj ( j = 1,2 n) eine gewisse Produktionsfunktion bestimmt. Diese Gleichungen bestimmen also, welche Menge des einzigen Produktionsfaktors x zur Erzeugung des 7-ten Produktes in der Menge zj bei Nutzung des r-ten Prozesses notwendig ist. Für zwei Produkte, die in den Mengen zx und z2 zu erzeugen sind, erhalten wir eine einfache graphische Interpretation und Lösung. Auf der Zeichnung (5.10) stellen die Geraden 1, 2, 3, 4, ... die ver-
0 Zeichnung 5.10
schiedenen Prozesse dar. Die Koordinaten der Punkte A\,A2, A3, A4, ... kennzeichnen die Mengen der Produkte zx und z 2 , die bei Nutzung der Prozesse 1,2, 3, 4, ... unter Einsatz einer Einheit des gegebenen Produktionsfaktors erzeugt werden können. Verbindet man diese Punkte, so erhält man die Isoquante A1A2A3Ai. Die Koordinaten der Punkte dieser Isoquante geben die Produktkombination an, die man bei Einsatz einer Einheit des Produktionsfaktors erhält, wenn eine bestimmte Prozeßkombination gewählt wird. Auf analoge Weise erhalten wir weitere Isoquanten, die anderen Aufwandsmengen des Produktionsfaktors entsprechen. Dabei kann man das Netz der Isoquanten beliebig verdichten. Die Lösung des Problems ist den zuvor untersuchten Fällen analog, bei denen mehrere Produktionsfaktoren, jedoch nur ein Produkt existierten. Man kann aber zeigen, daß hier nach Ausschaltung der „weniger wirksamen" Prozesse die Isoquanten zum Ursprung des
178
Kapitel V. Die Prozeßanalyse
Koordinatensystems konkav sind. Des weiteren wird der Gesamtwert der Verbundproduktion durch die Gleichung zlpl+z2p2 = c bestimmt, wenn die Preise der Produkte pi und p2 betragen. Die Darstellung dieser Gleichung ergibt für verschiedene Werte von c eine Schar paralleler Geraden mit dem Anstieg — — zur positiven Pi Richtung der Abszissenachse. Die Lösung des Problems beruht also darin, den Gesamtwert der Verbundproduktion bei vorgegebenem Faktoraufwand zu maximieren. Die Lösung wird durch die Koordinaten der Berührungspunkte der Isoquante mit der entsprechenden Linie des Gesamtwertes der Verbundproduktion bestimmt. (Analog ist es im Dualproblem.) Das Problem der Maximierung des Gesamtwertes einer Produktkombination, zu deren Erzeugung nur ein Produktionsfaktor eingesetzt wird, wurde ebenfalls in der marginalistischen Theorie untersucht,75 und zwar in folgender, hier gedrängt dargestellten Art und Weise. Nimmt man an, daß zwei Produkte Zi und z2 mit Hilfe eines Faktors x erzeugt werden, dann kann man die entsprechende Produktionsfunktion als f(zu z 2 , x) = 0 darstellen. Eine solche Produktionsfunktion bezeichnet man als Transformationsfunktion, da man auf ihrer Grundlage „ein Produkt durch das andere ausdrücken, ersetzen" kann, indem man z.B. zx = (zi, x) bestimmt.*.) Diese Funktion wird für verschiedene 7 > Das Problem der Verbundproduktion wurde schon von Marshall untersucht. Vgl. A. Marshall, Principles of Economics, 8. Aufl., London 1936, S. 388-390 sowie 854. [Vgl. ferner 8. Aufl. von 1962, Macmillan & Co., Ltd., London, S. 323 ff. und S. 702, Anmerk. XVÜI.] *' Bei der Transformationsfunktion handelt es sich wie bei der Substitutionsfunktion formal um sogenannte Indifferenzkurven. Inhaltlich liegen bei der Transformationskurve Isoquanten substituierbarer Produktmengen bei gleichen Faktormengen vor, während es sich umgekehrt bei den Substitutionsfunktionen um Isoquanten substituierbarer Produktionsfaktoren bei gleicher Produktmenge handelt. Die Transformationskurven sind also Isofaktorkurven, die Substitutionskurven sind hingegen Isoproduktkurven.—Vgl. R.G.D. Allen, Mathematik für Volks- und Betriebswirte, a.a.O., S. 129.
§ 4. Das verallgemeinerte Problem der Produktionsoptimierung
179
Faktormengen x als eine Schar gewisser, zum Ursprung des Koordinatensystems konkaver Linien dargestellt (Zeichnung 5.11). Diese letzte Eigenschaft stützt sich in der marginalistischen Theorie auf gewisse Vgl. J.R. Hicks, Value and Capital, 2. Ausgabe, Oxford 1946, S. 319 sowie R. G. D. Allen, Ekonomia matematyczna, PWN, Warszawa 1961, S. 666 ff. sowie Mathematical Economics, Macmillan & Co. Ltd., London 1957, S. 613. S) Vgl. T. C. Koopmans, Analysis of Production as an Efficient Combination of Activities, a.a.O., S. 35 ff.
§ 4. Das verallgemeinerte Problem der Produktionsoptimierung
181
Wir führen jetzt den Ausdruck k V
=
E PJZJ+
y=l
n
Ü P&I
i-1
ein, in dem die erste Summe den erzielten Produktionswert aus k Erzeugnisarten und die zweite Summe die Gesamtkosten der n in der Produktion verbrauchten Faktoren bezeichnen. Setzt man beispielsweise Zj > 0 und Xi < 0, dann weist der Betrag v den in der Produktion erzielten Erfolg (Gewinn oder Verlust) aus. Dieser Ausdruck wird vereinfacht, wenn wir sowohl die Menge der Produkte als auch die Aufwände an Produktionsfaktoren mit demselben Symbol x bezeichnen, wobei den Produkten x > 0 und den Aufwänden x < 0 (oder umgekehrt) entspricht. Analog stellt sich das Problem bei der Produktionsfunktion dar. Die Kennzeichnung der Produktund Faktormengen mit demselben Symbol x, aber mit entgegengesetzten Vorzeichen ist hier noch treffender, da im Produktionsprozeß häufig ein und derselbe Gebrauchswert sowohl Produkt als auch Produktionsfaktor sein kann (zum Beispiel Getreide für die Konsumtion, als Saatgut oder als Futtermittel). Man kann sich leicht vorstellen, zu welchen Vereinfachungen eine solche Betrachtungsweise führt. Die Produkte seien z.B. durch positive und die eingesetzten Faktoren durch negative Zahlen bezeichnet. Sodann wählt man für alle Prozesse ein Erzeugnis aus, auf das der Einsatz sämtlicher Faktoren sowie der Ausstoß aller anderen Produkte bezogen werden. Dieses Erzeugnis nennen wir Bezugsprodukt. Dann bezeichnet man mit air < 0 den Aufwand des z'-ten Faktors je Einheit des Bezugsproduktes und mit aJr > 0 die Menge des j-ten (Verbund-)Produktes, das man zusammen mit einer Einheit des Bezugsproduktes im r-ten Prozeß erhält. Es ist klar, daß für das Bezugsprodukt aJr — 1 gilt. Darüber hinaus bedeutet air — 0, daß im r-ten Prozeß der i'-te Produktionsfaktor nicht verwendet wird; dagegen bedeutet a]r = 0, daß man im Prozeß r das j-te Produkt nicht erzeugt. Man benutzt also zwei Arten technischer Koeffizienten: Aufwandskoeffizienten, die negativ, und Produktionskoeffizienten, die positiv sind. 13
Lange, Optimale Entscheidungen
182
Kapitel V. Die Prozeßanalyse
Folglich kann man mit Hilfe einer erweiterten technologischen Matrix an al2 ... alm a 2l aZ2 ••• a2m ßnl an2 ••• anm. sowohl die technischen Bedingungen für den Faktoraufwand als auch die technologischen Bedingungen für die Herstellung unterschiedlicher Erzeugnisse im Gesamtprozeß der Produktion darstellen. In dieser Matrix bezeichnen die negativen Elemente die Aufwandskoeffizienten und die positiven Elemente die Produktionskoeffizienten. Alle diese Koeffizienten werden auf die Einheit des Bezugsproduktes berechnet.10' Die Aufgabe besteht jetzt in der Auswahl einer solchen Mengenkombination der Produktionsfaktoren und Produkte, daß der Ausn druck Pixi maximal wird. Hierin repräsentieren die xi je nach ¡=1
dem Vorzeichen Produkt- oder Faktormengen. Setzt man, wie üblich, die Produkte mit positivem und die Produktionsfaktoren mit negan tivem Vorzeichen an, dann drückt die Summe £ ptXi den in der Die Auswahl des Bezugsprodukts ist beliebig. Eine Veränderung des Bezugsproduktes zieht die Multiplikation sämtlicher Elemente der Matrix mit einer Konstanten nach sich. Ist beispielsweise das Produkt 1 Bezugsprodukt, dann beträgt der Koeffizient alr = 1. Wenn man danach als Bezugsprodukt das mit der Zahl 2 bezeichnete Produkt wählt, dann beträgt der ihm entsprechende Koeffizient, der zuvor a 2r war, jetzt d l r = 1; dagegen wird der Produktions. Alle übrigen Elemente der koeffizient des ersten Produktes jetzt zu a[r — a2r Matrix werden ebenfalls mit
multipliziert. Die Multiplikation mit einer Kon-
Beide Beispiele sind entnommen dem Buch von R . G . D . Allen, Mathematical Economics, a.a.O., S. 629 sowie Ekonomia matematyczna, PWN, Warszawa 1961, S. 680 ff. 13«
184
Kapitel V. Die Prozeßanalyse
(z.B. 100 Tonnen) im r-ten Prozeß benötigt werden. Sie sind in der folgenden technologischen Matrix enthalten (der Faktoraufwand wird positiv ausgewiesen):
1. Arbeitskraft 2. Boden 3. Traktoren
1
2
3
25 50 20
5 100 3,5
4 125 0
Ci 10 110 10
Aus der technologischen Matrix geht hervor, daß der erste Prozeß hochmechanisiert ist. Die übrigen Prozesse verbrauchen weniger Arbeitskraft und Maschinen, die Produktion vollzieht sich aber auf bedeutend größeren Flächen. In der letzten Spalte der Tabelle sind die Mengen der einzelnen Faktoren angegeben, die insgesamt bei der Getreideproduktion verwendet werden können; der „Arbeitskräfteeinsatz" darf nämlich 10, der „Boden" 110 und die „Traktoren" 10 der entsprechenden Einheiten nicht überschreiten. Wenn man m i t d i e jeweiligen „Prozeßgrade"*) der Getreideproduktion bezeichnet, dann kann man das Problem folgendermaßen formulieren: Die Prozeßgrade fo sind so zu bestimmen, daß z — ^1+^2+^3 = Max. wird unter Einhaltung der Nebenbedingungen 25iMi+5/a2+4//3
< 10
50^+100^+125^3 < 110 20^+3,5^
< 10
und der Randbedingungen fi2>0,
/i3>0.
Das ist eine einfache Aufgabe der linearen Optimierung, die nach *J Ausmaß der Prozesse.
§ 5. Anwendungsbeispiele für die Prozeßanalyse
185
Lösung mit der Simplex-Methode folgende optimalen Werte für die Prozeßgrade hat: ft - 0,2; (i2 = 1,0; fi3 = 0. Um die höchstmögliche Getreideproduktion zu gewährleisten, muß man den Anbau auf die einzelnen Prozesse wie folgt aufteilen: Eine Einheit, d.h. in unserem Beispiel 100 Tonnen Getreide, ist mit Hilfe des zweiten Prozesses und 0,2 • 100 = 20 Tonnen Getreide sind mit Hilfe des ersten Prozesses zu produzieren. Der dritte Prozeß ist dagegen nicht anzuwenden. Die maximale Produktion beträgt in diesem Fall 100+20 = 120 Tonnen. Jede andere „Mischung" der Prozesse ergibt eine geringere Produktion als 120 Tonnen. Nutzt man den ersten Prozeß im Ausmaß 0,2 und den zweiten Prozeß im Ausmaß 1,0, so werden die beiden ersten Produktionsfaktoren vollständig ausgeschöpft: die Arbeitskraft in den Mengen 25 • 0,2+ + 5 - 1 , 0 = 10 (Arbeiter-Monate) und der Boden in den Mengen 50 - 0 , 2 + 1 0 0 - 1 , 0 = 110 (Hektar). Der dritte Faktor wird in den Mengen 20-0,2+3,5-1,0 = 7,5 angewendet. Es wird also nicht der gesamte Vorrat dieses Mittels, der 10 (Traktoren-Monate) beträgt, eingesetzt. Das duale Programm kann man für das vorliegende Beispiel wie folgt formulieren: Die X2 und A3 sind so zu bestimmen, daß c = 10^!+110A2+10A3 = Min. unter Einhaltung der Nebenbedingungen 25^+50A 2 + 20A3 > 100 5 ^ + 1 0 0 ^ + 3 , 5 ^ > 100 4A!+125A2 > 100 und der Randbedingungen
h>0,
¿2P0,
Die Anwendung der Simplex-Methode führt zu folgender Lösung: 20
8
K = - 9-» h = -9 > h = 0 sowie » Mla . = 120 = z Max .. Wir bemerken noch, daß die „Bewertung" der Traktoren A3 = 0 ist, da der Vorrat dieses Faktors nicht vollständig ausgeschöpft wird.
186
Kapitel V. Die Prozeßanalyse
Beispiel 2.*> Zwei Produkte (Mais und Schweine) werden mit Hilfe zweier Faktoren (Arbeitskraft und Boden) erzeugt. Hierbei können drei Prozesse genutzt werden. Im ersten Prozeß sind die Schweine das Endprodukt. Der Mais dient hier nur als Zwischenprodukt zur Fütterung der Schweine. Der zweite Prozeß besteht nur im Anbau von Mais. Und der dritte Prozeß liefert als Verbundproduktion Mais und Schweine. Die technologische Matrix stellt sich wie folgt dar: r
1
2
3
Ci
1. Arbeitskraft 2. Boden
50 5
25 50
75 60
50 52,5
Mais Schweine
1/2 -1
-1 0
-1 -1/2
i
Maßeinheit Arbeiter-Monate Hektar 100 Tonnen 100 Stück
In dieser Tabelle wurden die Produktionsfaktoren (wie im vorigen Beispiel) mit positiven, die Endprodukte mit negativen Zahlen bezeichnet. An primären Produktionsfaktoren stehen bereit: 50 ArbeiterMonate Arbeitskraft und 52,5 Hektar Boden. Betragen die Preise für eine Tonne Mais sowie für ein Schwein je 20 Geldeinheiten, dann erzielt man aus den drei Prozessen Nettoerlöse von jeweils 1000, 2000, 3000 Einheiten. Zur Vereinfachung der weiteren Berechnungen verändern wir in der technologischen Matrix die Maßstäbe so, daß der Nettoerlös in jedem Prozeß 2000 Geldeinheiten beträgt. Die Matrix läßt sich dann wie folgt darstellen: r 1 2
1
2
3
Ci
100 10
25 50
50 40
50 52,5
*> Vgl. R. G. D. Allen, engl. Ausgabe, a.a.O., S. 626.
§ 5. Anwendungsbeispiele für die Prozeßanalyse
187
Die Aufgabe reduziert sich auf eine solche Bestimmung der nichtnegativen Prozeßgrade daß z = 2000(/i 1 +^2+^3) = Max. wird unter Einhaltung der Nebenbedingungen 100^ 1 +25 i a 2 +50/ij < 50 10//i + 5 0 ^ + 4 0 ^ 3 < 52,5. Mais und Schweine sind Produkte und unterliegen also keinen Beschränkungen. Mit der Simplex-Methode erhalten wir folgendes optimale Ergebnis: fr = 0,25; fi2 = 1,0; /¿3 = 0
sowie
z M «. = 2000(0,25 + 1,0) = 2500. Die Dualaufgabe lautet wie folgt: Es sind die nichtnegativen ^ und A2 so zu bestimmen, daß v = 50^+52,5^2 = Min., wobei 100A!+10A 2 >2000 25A1+50A2 > 2000 50/^+40^2 > 2000. Als Lösung der Dualaufgabe erhalten wir .
_
320 ~19~'
. /2
_ 600 -"19-'
®M.n. = 50 • ^ - + 52,5 • ^
= 2500.
Wir bemerken noch, daß man die letzte Aufgabe mit der graphischen Methode lösen kann, da im dualen Problem nur zwei Unbekannte und ?.2 vorkommen. Bei diesem Beispiel könnte man aber auch die Primalaufgabe mit der graphischen Methode lösen^da die Analyse der Kurven für die technologischen Prozesse sofort zeigen würde, daß der dritte Prozeß weniger wirksam ist und demnach nicht angewendet werden sollte.
Kapitel VI
Optimierung bei einer Vielfalt von Zielen § 1. Wirksame Programme*) Wir beschäftigen uns jetzt näher mit einem für die Praxis wichtigen Fall, der sowohl bei der Prozeßanalyse als auch in der allgemeinen Theorie der Optimierung eintreten kann. Bisweilen läßt sich nämlich der Realisierungsgrad eines Zieles (Produktionshöhe, Faktoraufwand usw.) nicht mit Hilfe einer einzigen Zahl angeben. Stattdessen existiert eine Vielfalt von Zielen, deren Realisierungsgrad nicht mehr durch einen Wert, sondern durch eine geordnete Zahlenfolge, also einen Vektor, ausgedrückt werden kann. Auf dieses Problem stößt man häufig, wenn beispielsweise mit einem Produktionsprozeß verschiedenartige Erzeugnisse gefertigt werden, deren Mengen(-einheiten) nicht summiert werden können, oder wenn wir zur Produktion viele Produktionsmittel anwenden, deren Werte sich nicht auf ein gemeinsames Maß, z.B. auf dieselben Währungseinheiten, zurückführen lassen. Im einfachsten Fall kann man den einzelnen Zielen geeignete Gewichte zuordnen und sie dann zu einem Gesamtziel vereinigen. Dadurch entsteht eine Zielfunktion, die die gewogene Summe der Realisierungsgrade der einzelnen Ziele ist. Derartige Probleme lassen sich sodann mit den oben beschriebenen Methoden der Optimierungstheorie oder der Prozeßanalyse lösen. Man kann aber leicht Beispiele angeben, insbesondere unter den Bedingungen der sozialistischen Volkswirtschaft, bei denen man den einzelnen Zielen nicht ohne weiteres Gewichte zuordnen kann.1) Unmöglich ist dann auch Auch als effiziente Programme bekannt. '' Unter den Bedingungen der Naturalwirtschaft wäre es gleichfalls schwierig, die Gewichte beispielsweise für Äpfel und Fahrräder, Schulen und Krankenhäuser usw. festzulegen und die Mengen dieser Produkte zu summieren.
189
§ 1. Wirksame Programme
die Formulierung einer Zielfunktion und die Anwendung der gewöhnlichen Modelle der Optimierungstheorie zur Lösung dieser Aufgaben. Wie gezeigt werden kann, ist es aber auch in solchen Fällen möglich, die Optimierungstheorie anzuwenden, falls das Problem passend formuliert wird. Wir unterstellen jetzt, daß ein bestimmter Produktionsprozeß ausgewählt wurde, in dem k verschiedene Erzeugnisse zt , z2 , ..., zk mit n Produktionsmitteln xu x2 , ..., xn gefertigt werden. Wir haben also nicht eine, sondern k Zielfunktionen z = f ( x , x , ..., x ) ermittelt, wobei s = 1, 2, ..., k. Diese Zielfunktionen bestimmen die jeweiligen Produktionshöhen der einzelnen Erzeugnisse in Abhängigkeit von den in ihrer Fertigung verbrauchten Faktormengen. Ist die Bestimmung der optimalen Lösung auch in einem solchen Fall möglich? Multiplizieren wir die einzelnen Produkte mit den zugehörigen Preisen P u P i , dann kann man natürlich den Gesamtwert s
k
der Produktion als Produktsumme ^
z
s
p
s
l s
2 s
n s
errechnen. Die Lösung,
J=I
der der maximale Wert dieser Summe entspricht, betrachten wir als optimal. Untersuchen wir jedoch einmal das Problem der optimalen Produktion unter den Bedingungen der Naturalwirtschaft. Dort ist es unmöglich, den Gesamtwert der Produktion zu bestimmen. In diesem Fall dürften folgende Annahmen gerechtfertigt sein: 1. der Realisierungsgrad des allgemeinen Zieles wächst, wenn der Realisierungsgrad aller einzelnen Ziele wächst, und 2. der Realisierungsgrad des allgemeinen Zieles wächst, wenn der Realisierungsgrad (mindestens) eines der Ziele wächst und der Realisierungsgrad aller übrigen Ziele sich nicht verringert. Setzt man das Ausgangsniveau zur Erreichung der Ziele mit Null an, kann man den zweiten Fall wie folgt darstellen: Es ist zs > 0 (J = 1 , 2 , . . . , k ) und wenigstens für eines der Produkte erreichen wir z > 0. Die Lösung für Situationen, in denen die Erhöhung eines Produktes ohne die Verringerung wenigstens eines der übrigen Produkte s
190
Kapitel VI. Optimierung bei einer Vielfalt von Zielen
nicht mehr möglich ist, bezeichnen wir als wirksames Programm. Dieser Begriff wurde schon von Pareto eingeführt, und man bezeichnet ihn auch als Pareto-Optimum (oder -Maximum).2) Pareto benutzte diesen Begriff in seinen Untersuchungen zum Wohlstand und Einkommen der Bevölkerung. Sein Gedankengang war folgender. Wenn sich die Einkommen einer Bevölkerungsgruppe erhöhen, dann verringern sich die Einkommen anderer Gruppen, und der Vergleich des allgemeinen „Wohlstandes" ist in diesem Fall unmöglich. Man kann aber annehmen, daß eine Steigerung des allgemeinen Wohlstands erfolgt, wenn sich die Einkommen mindestens einer Gruppe erhöhen, ohne daß sich die Einkommen anderer Bevölkerungsgruppen verringern. Wir stellen fest, daß das vom mathematischen Standpunkt von uns gesetzte Optimalitätskriterium für eine Vielfalt von Zielen den Pareto-Gesetzen*) analog ist. § 2. Lösung des Problems mit Hilfe der Marginalrechnung Wenn man sich auf die im vorigen Paragraphen enthaltenen Betrachtungen stützt, dann kann man das erweiterte Problem der Produktionsoptimierung folgendermaßen formulieren : Es sind die Bedingungen zu bestimmen, unter denen die Produktion eines der Erzeugnisse das Maximum erreicht, ohne daß die Produktion anderer Erzeugnisse verringert wird. Wir sind dabei bestrebt, die Aufgabe für jedes Erzeugnis getrennt zu lösen. Mit xis bezeichnen wir den Aufwand des Faktors i, der für die Herstellung einer Einheit des Erzeugnisses s notwendig ist. Das Problem besteht in einer solchen Bestimmung der Veränderlichen XiS(i = 1, 2, ..., n; s = 1, 2, ..., k), daß beispielsweise das Produkt Nummer 1 (s = 1) den maximalen Wert erreicht. Wir schreiben das so: 2
> V. Pareto, Cours d'économie politique, Paris 1896—1897, sowie Manuel d'économie politique, Paris 1909, sowie 1927. [Eine Güterkombination ist maximal im Sinne von Pareto (Pareto-Maximal), wenn es nicht möglich ist, die Menge irgendeines Gutes zu vergrößern, ohne die Menge von wenigstens einem anderen Gut vermindern zu müssen.] *> Das heißt der Einkommensverteilung.
190
Kapitel VI. Optimierung bei einer Vielfalt von Zielen
nicht mehr möglich ist, bezeichnen wir als wirksames Programm. Dieser Begriff wurde schon von Pareto eingeführt, und man bezeichnet ihn auch als Pareto-Optimum (oder -Maximum).2) Pareto benutzte diesen Begriff in seinen Untersuchungen zum Wohlstand und Einkommen der Bevölkerung. Sein Gedankengang war folgender. Wenn sich die Einkommen einer Bevölkerungsgruppe erhöhen, dann verringern sich die Einkommen anderer Gruppen, und der Vergleich des allgemeinen „Wohlstandes" ist in diesem Fall unmöglich. Man kann aber annehmen, daß eine Steigerung des allgemeinen Wohlstands erfolgt, wenn sich die Einkommen mindestens einer Gruppe erhöhen, ohne daß sich die Einkommen anderer Bevölkerungsgruppen verringern. Wir stellen fest, daß das vom mathematischen Standpunkt von uns gesetzte Optimalitätskriterium für eine Vielfalt von Zielen den Pareto-Gesetzen*) analog ist. § 2. Lösung des Problems mit Hilfe der Marginalrechnung Wenn man sich auf die im vorigen Paragraphen enthaltenen Betrachtungen stützt, dann kann man das erweiterte Problem der Produktionsoptimierung folgendermaßen formulieren : Es sind die Bedingungen zu bestimmen, unter denen die Produktion eines der Erzeugnisse das Maximum erreicht, ohne daß die Produktion anderer Erzeugnisse verringert wird. Wir sind dabei bestrebt, die Aufgabe für jedes Erzeugnis getrennt zu lösen. Mit xis bezeichnen wir den Aufwand des Faktors i, der für die Herstellung einer Einheit des Erzeugnisses s notwendig ist. Das Problem besteht in einer solchen Bestimmung der Veränderlichen XiS(i = 1, 2, ..., n; s = 1, 2, ..., k), daß beispielsweise das Produkt Nummer 1 (s = 1) den maximalen Wert erreicht. Wir schreiben das so: 2
> V. Pareto, Cours d'économie politique, Paris 1896—1897, sowie Manuel d'économie politique, Paris 1909, sowie 1927. [Eine Güterkombination ist maximal im Sinne von Pareto (Pareto-Maximal), wenn es nicht möglich ist, die Menge irgendeines Gutes zu vergrößern, ohne die Menge von wenigstens einem anderen Gut vermindern zu müssen.] *> Das heißt der Einkommensverteilung.
§ 2. Lösung des Problems mit Hilfe der Marginalrechnung
191
zi = / i ( * n , x2i, ..., xnl) = Max.
(6.1)
unter Einhaltung folgender Nebenbedingungen Zs =fs(xu, X2s, ...,xns) > z{0> für jedes s = 2, 3, ..., k. (6.2) Diese Bedingungen besagen, daß man bei der Maximierung der Produktion von zx das vorgegebene Niveau der übrigen Produkte, 4 C ) ( S = 2, 3, ..., k), nicht verringern darf, daß also ein gewisses minimales Produktionsniveau dieser Erzeugnisse gesichert sein muß. Auf diese Weise übertragen wir die „anderen Ziele" (in diesem Fall außer dem ersten, z t ) gewissermaßen in die Nebenbedingungen. Das Ziel (6.1) und die Nebenbedingungen (6.2) kann man analog für jedes Produkt zs(s = 1, 2, ..., k) formulieren. Daraus folgt, daß auch der Lösungsweg des Problems für jedes s = 1,2, . . . , k derselbe ist. Wir können uns also auf die Darstellung der Lösung dieser Aufgabe für s = 1 beschränken. Wir bezeichnen mitX; (z = 1,2, ...,«) die Ressourcen der einzelnen Produktionsfaktoren, insbesordere der Produktionsmittel. Es muß dann gelten: j : x i s = Xt 5=1
(i=l,2,...,/i).
(6.3)
Darüber hinaus lassen wir die Möglichkeit von Faktorsubstitutionen zu. Das kann man als folgende Bedingung schreiben: F(XuX2,...,Xn)
= 0.
(6.4)
Ferner seien die Randbedingungen xis> 0
(i = 1, 2, ..., n\ s = 1, 2, ..., k)
(6.5)
erfüllt. Nach (6.3) folgt daraus, daß X^O
(i=l,2,...,«).
Das ist die Darstellung des Problems für ein wirksames Programm bei einer Vielfalt von Zielen.3) Wir lösen diese Aufgabe für s = 1 mit der bekannten Methode der Lagrangeschen Multiplikatoren. 3 > Vgl. O. Lange, The Foundation of Weifare Economics, in „Econometrica", insbesondere Nr. 11, 1942.
192
Kapitel VI. Optimierung bei einer Vielfalt von Zielen
Wir bilden die dieser Aufgabe entsprechende Lagrangesche Funktion und geben ihr das Symbol Lx, um zu unterstreichen, daß das Problem die Maximierung der Produktionshöhe des ersten Erzeugnisses betrifft. Die Lagrangeschen Funktionen L , L , . . . , L für die übrigen Erzeugnisse haben eine analoge Form. Wir erhalten: 2
3
k
k Li
= M x
u
,
X2U
•••,
*„l)+
X
X2s,
j= 2
...,
x „
s
) - 4
0 )
] -
- ¡=1 S 4 LJ=I I xis-x] J -XF{Xu X2, ...,Xn).
(6.6)
Nun berechnen wir die partiellen Ableitungen dieser Funktion nach den Unbekannten x , x ..., x und setzen diese gleich Null. Wir erzielen folgende notwendige Bedingung dafür, daß die Lagrangesche Funktion Lj und die Produktionsfunktion n
z
ein Maximum haben :
i
=
2 U
ni
fi(.Xn>
x2i, ...,
x„i)
4)
BX'
Da -g-i- = 1 ist, was aus der Nebenbedingung (6.3) hervorgeht, OXi 1
kann man die Bedingung (6.7) folgendermaßen darstellen: 8 Xu
dXi
( / = 1,2, ...,«).
(6.8)
Aus den Gleichungen (6.8) folgt, daß 3/i
SA
8F
8F
.
1
.
,
(
r
0x
Diese Bedingung besagt, daß das „Pareto-Optimum" erreicht wird, wenn die Grenzrate der Substitution,*) sofern sie aus den Ablei4) Wir stellen fest, daß der zweite Bestandteil der Lagrangeschen Funktion die Veränderlichen Xu nicht enthält, also seine partiellen Ableitungen nach xu verschwinden. Die partiellen Ableitungen des dritten Bestandteiles in (6.6.)
sind ebenfalls gleich Null, da
8xu
== 1 und nach (6.3) auch
*> Also das Verhältnis der Grenzproduktivitäten (vgl. (3.16)).
8xu
= 1.
193
§ 2. Lösung des Problems mit Hilfe der Marginalrechnung
tungen der Zielfunktion Zi = f i ( x , x2i,..., x nl ) nach den Faktoren i und j hervorgeht, mit dem Substitutionsverhältnis dieser Faktoren in der Substitutionsfunktion für die gesamte Volkswirtschaft, F(XUX2, ...,XN) — 0, übereinstimmt. Analoge Ergebnisse erzielen wir, wenn wir die Bedingungen festlegen, unter denen die Funktionen z 2 , z 3 , ... usw. das Maximum erreichen. Maximiert man beispielsweise z2 = / 2 (x I 2 , x , • ••,x„ ), dann erhalten wir anstelle der Bedingung (6.9) die Bedingung n
22
8/2
8f2
=
8F
8F
,.
.
,
-
2
,
">•
tu
( 6 ni U
i\
>
Allgemein müssen also für jedes s = 1, 2, ..., k die Bedingungen 8/s
.
8f
s
=
8F
.
8F
0 . 7 = 1. . 2. , - . « ).
/ (6.10) Ä
i
m
erfüllt sein. Das Produktionsprogramm ist also wirksam, wenn die Produktionsmittel so verteilt worden sind, daß in jedem Produktionsprozeß das Verhältnis der Grenzproduktivitäten zweier beliebiger Produktionsfaktoren dasselbe ist und mit dem Substitutionsverhältnis dieser Faktoren in der Substitutionsfunktion für die gesamte Volkswirtschaft übereinstimmt. Wir erläutern das gewonnene Resultat an einem einfachen Zahlenbeispiel, in dem zwei Produktionsfaktoren a und b und zwei Erzeugnisarten I und II vorkommen. Die Grenzproduktivitäten der Produktionsfaktoren a und b in beiden Produktionsprozessen sind in der folgenden Aufstellung angegeben:
a b
I
II
3 4
5 10
Aus dieser Tabelle ist zu ersehen, daß die Verhältnisse der Grenzproduktivitäten beider Faktoren ungleich sind (3:4 > 5 : 1 0 ) . Das Programm ist also nicht wirksam, und es ist vorteilhaft, gewisse Mengen der Produktionsfaktoren von II auf I zu verlagern. Übertragen wir nämlich eine Einheit des Faktors a von der Produktion II
194
Kapitel VI. Optimierung bei einer Vielfalt von Zielen
auf die Produktion I, so erzielen wir tatsächlich eine Erhöhung des Produktes I um 3 Einheiten und gleichzeitig verringern wir das Produkt II um 5 Einheiten. Um diese Verringerung zu kompensieren, übertragen wir zusätzlich 1/2 Einheit des Faktors b von der Produktion I auf die Produktion II. Infolge dieser zweiten Verlagerung verringert sich das Produkt I um 2 Einheiten und das Produkt II erhöht sich um 5 Einheiten. Das Gesamtergebnis dieser beiden Verlagerungen zeigt die zweite Übersicht:
a b
I
II
+3 -2
-5 +5
+ 1
0
Wir erreichten somit, daß die Produktion des Erzeugnisses II unverändert bleibt, während die Produktion des Erzeugnisses I um eine Einheit erhöht werden konnte. Dank dieser Umverteilungen der Produktionsmittel gewährleisteten wir eine Produktionserhöhung des einen Erzeugnisses, ohne die Produktion des anderen Erzeugnisses zu verringern. Die in der ersten Tabelle dargestellte Ausgangslösung war demnach nicht wirksam. Stimmen jedoch die Verhältnisse der Grenzproduktivitäten der Produktionsfaktoren in den einzelnen Prozessen — wie im folgenden Beispiel — überein I II a b
3 6
5 10
dann ist das Programm wirksam. Wir haben damit gezeigt, daß sich das Problem der Optimierung bei einer Vielfalt von Zielen auf die Aufstellung wirksamer Programme zurückführen läßt. Dieses Problem muß man als ein typisches Problem der sozialistischen Wirtschaft ansehen, falls man der Auf-
§ 2. Lösung des Problems mit Hilfe der Marginalrechnung
195
fassung beipflichtet, nach der die sozialistische Wirtschaft durch eine Vielfalt von Zielen charakterisiert wird. Es zeigt sich, daß es in einer solchen Situation auch möglich ist, Optimierungsmethoden anzuwenden, die auf die Eliminierung unwirksamer Prozesse abzielen. Wir analysieren nun die Formulierung und Lösung des Optimierungsproblems bei einer Vielfalt von Zielen genauer. Ein charakteristisches Merkmal der Problemformulierung ist es, daß sich die Optimierungsbedingung (6.1) auf ein Ziel bezieht, während die Bedingungen für die „übrigen Ziele" in die Nebenbedingungen verwiesen wurden. Die Technik zur Lösung der Aufgaben ist die gleiche wie bei den typischen Optimierungsproblemen. Als Lösung dieser Aufgabe erhalten wir das System folgender Funktionen:
Zunächst bemerken wir, daß die Lösungen von der Substitutionsfunktion zwischen den Produktionsfaktoren in der gesamten Volkswirtschaft, F(XlfX2, • ••, X„) = 0, abhängen, und daß man die Werte z{0), z(20), ... durch die zuvor errechneten zIMaJE., z2Max., ... usw. ersetzen kann. Das z^0) in der zweiten Funktioh kann man durch Max. ersetzen, das z| 0) in der dritten Funktion durch das in der zweiten Funktion errechnete z2Max. usw. Auf diese Weise erhalten wir eine Abhängigkeit zwischen den z maximalen Werten k> die man durch folgende implizite Funktion ausdrücken kann: ^[zlMax.>
Max
z
F(X1,X2,...,X„)] = 0. (6.11) Das ist die sogenannte allgemeine Transformationsfunktion, die es ermöglicht, Transformationen zwischen den einzelnen Zielen zu vollziehen. Mit Hilfe der allgemeinen Transformationsfunktion kann man die kMax.
>
196
Kapitel VI. Optimierung bei einer Vielfalt von Zielen
sogenannte
Grenzrate
der
Transformation
der
Ziele*)
errechnen,
die durch ÖZjMix.
0 ' J = 1,2, ...,k)
ausgedrückt wird. Sie bestimmt, um wieviel sich der Realisierungsgrad des Zieles Zi verringern muß, um im wirksamen Programm eine Zunahme des Realisierungsgrades des Zieles z} um eine Einheit zu erreichen. Die Bestimmung der Bedingungen, die die Pareto-optimale Lösung erfüllen muß, führt auf die Maximierung der Lagrangeschen Funktion (6.6), die man auch in einer einfacheren Form schreiben kann, nämlich: Li — f(x 11, X2i, ..., *„i)+
k J] ^sfsixlst s=2
x
2\> •••» xns)
-AF(XUX2,...,X„).
(6.12)
0)
In der Formel (6.12) ließen wir die Ausdrücke z{ außer acht, da sie als Konstante keinen Einfluß auf die Bestimmung der Bedingungen für das Optimum der Funktion Lv haben. Der dritte Ausdruck auf der rechten Seite von (6.6) bleibt unberücksichtigt, da er ohne Einfluß auf die Untersuchung von Li bleibt (part. Ableitungen sind gleich Null). Man kann die Lagrangesche Funktion noch weiter vereinfachen, wenn man ihren ersten Bestandteil f(xn, x21 x nl ) mit der nachfolgenden Summe vereinigt. Wir erhalten: L =
k s= 1
Kf(xij,
x2s, ..., xns)—AF(Xi,
X2, ...,
Xn)
*> Werden z.B. zwei Güter mit gegebenen Produktionsmitteln erzeugt, so daß F{x,y) = 0 die Beziehung zwischen der Ausbringung x und y darstellt, dann gibt der Ausdruck Fx Fy die Grenzrate der Transformation (Substitution) der Produktion von Y für die Produktion von X wieder. Vgl. R. G. D. Allen, Mathematik für Volks- und Betriebswirte, Duncker & Humblot, Berlin 1956, S. 295 und 358. Vgl. auch die Anmerkung auf S. 92 dieser Arbeit.
§ 2. Lösung des Problems mit Hilfe der Marginalrechnung
197
oder einfacher L=
I itzMs= 1
X2,....Xn).
(6.13)
Diese Umformung ist deshalb möglich, weil die Lagrangesche Funktion (6.12) für beliebige Veränderliche z t , z 2 , ..., zk dazu dienen kann, die Bedingungen für das Erreichen des Maximums zu bestimmen. Dabei nimmt man an, daß im Maximum eines beliebigen Zi das entsprechende = 1 ist. Aus der Formel (6.13) resultiert, daß die Lagrangeschen Multiplikatoren ¿ j , X 2 , . . . , X k gewissermaßen die Gewichte der einzelnen Ziele darstellen, und daß die Maximierung der Lagrangeschen Funktion die Maximierung einer gewogenen Summe der Ziele herbeiführt, die um eine Substitutionsfunktion der Mittel, ebenfalls multipliziert mit einem Gewicht X, vermindert ist. Wir bedenken nun, was die Gewichte 1 2 , ..., Xk der einzelnen Ziele bedeuten können. Es zeigt sich, daß die Relationen zwischen den einzelnen Multiplikatoren A mit den entsprechenden Transformationsverhältnissen der Ziele in den wirksamen Programmen übereinstimmen. Die Multiplikatoren X, von denen einer gleich 1 ist, bestimmen also, auf welchen Wert eines Zieles man verzichten muß, um eine Werteinheit eines anderen Zieles zu erhalten. k Die Summe £ kann man als Bruttowert des Gesamtzieles f= I k bezeichnen, und die Differenz Xszs— XF{Xy, X2, X„) ist der J=I
Nettowert des Gesamtzieles.
k Interpretiert man die Summe ^
a s
'
Bruttogesamtwert der
J=I
Produkte und den Ausdruck: — AF(X1,X2, ...,Xn) als Wert der k Aufwände, dann ist die Differenz L — ^ Xszs—XF{XU X2, ...,X„) J=I
der Nettogesamtwert der Produkte. Wenn die obigen Betrachtungen die Gesamtheit der Volkswirtschaft betreffen und die Erzeugnispreise den Multiplikatoren As 14
Lange, Optimale Entscheidungen
198
Kapitel VI. Optimierung bei einer Vielfalt von Zielen
( j = 1, 2, ..., k) gleichgesetzt werden, dann bestimmt die Funktion L die Höhe des Nationaleinkommens. Das Problem, mit dem wir uns beschäftigen, führt demnach auf die Maximierung des Nationaleinkommens. Wie bereits erwähnt, verwies auf diese Tatsache schon Pareto in seinen Untersuchungen zum Problem des allgemeinen Wohlstandes. Die Überlegungen Paretos stützten sich eben auf die Annahme, daß es bei einer Steigerung des Nationaleinkommens stets möglich ist, den Zuwachs so aufzuteilen, daß Verluste, die einige Einheiten erleiden, kompensiert werden können und doch noch irgendein Überschuß verbleibt. Daraus folgt, daß die Zunahme des Nationaleinkommens zur Erhöhung des allgemeinen Wohlstandes führt. Die Überlegungen Paretos werden durch die von uns angestellten mathematischen Betrachtungen bestätigt.5* Das Pareto-Optimum läßt sich somit als Maximum der Lagrangeschen Funktion (6.13) ausdrükken. Deren Wert kann man aber als Nationaleinkommen deuten, falls als Erzeugnispreise die nach der Marginalrechnung bestimmten Multiplikatoren X benutzt werden. Gleichzeitig haben wir nachgewiesen, daß das Optimierungsproblem bei einer Vielfalt von Zielen so gelöst werden kann, als ob die einzelnen Ziele kommensurabel wären. Wir fügen hinzu, daß das untersuchte Problem auch in der dualen Form dargestellt werden kann. Man kann anstelle der Maximierung der durch die Formel (6.13) bestimmten Produktionsfunktion die Gesamtaufwände der Produktionsfaktoren bei gegebenem Realisierungsgrad der Ziele: z [ ° \ . . . , 4 0 ) , also die Funktion — L — =
A [ F ( X U X 2 , ...,XN)-C}~
5
£ W S (*1>*2, . . . , * „ ) - 4 0 ) ] minimieren.
> Man muß auch darauf verweisen, daß dieses Problem präziser als von Pareto 1908 von Enrico Barone formuliert wurde, der sich als erster mit Problemen ökonomischer Berechnungen in der sozialistischen Wirtschaft beschäftigte. Vgl. E. Barone, II ministero della produzione nello stato collectivista, in: Giornale degli Economisti, 1908; (engl. Ubersetzung in Collectivist Economic Planning, Hrsg. F. A. V. Hayek, London 1935).
§ 3. Vielfalt der Ziele und lineare Optimierung
199
§ 3. Vielfalt der Ziele und lineare Optimierung Das Optimierungsproblem bei einer Vielfalt von Zielen kann auch mit den Methoden der linearen Optimierung gelöst werden. Die entsprechenden Zielfunktionen sind dann lineare Funktionen der Unbekannten des Problems. Es seien n Erzeugnisse zu untersuchen und für jedes Erzeugnis gelte folgende Bilanzgleichung :6) X, = £ aiJXj+yi i
(i = 1, 2, ...,»).
(6.14)
Hierin kennzeichnet Xt den Wert des Bruttoproduktes und j f den Wert des Endproduktes vom i-ten Erzeugnis, während die au die technischen Koeffizienten der Produktion sind. Neben den Bilanzgleichungen der Produktion (6.14) existiert noch eine analoge Bilanzgleichung für die Arbeitskräfte: X0=
tojXj+yo, i= i
(6.15)
in der a0J die zur Fertigung einer Bruttoprodukteinheit des Ern Zeugnisses j notwendige Menge Arbeit angibt. aojXj bestimmt 7=1 demnach den Gesamtaufwand an gesellschaftlicher Arbeit, der zur Realisierung des Produktionsprogramms in der Volkswirtschaft erforderlich ist. X0 bezeichnet den Vorrat an gesellschaftlicher Arbeit, den man insgesamt einsetzen kann, und y0 ist die Menge gesellschaftlicher Arbeit, die nicht in der Produktion verrichtet wird. Das Optimierungsproblem für dieses Produktionsprogramm kann man folgendermaßen formulieren. Der Aufwand an gesellschaftlicher Arbeit in der gesamten Volkswirtschaft ist zu minimieren, d.h., es ist zu bestimmen: z
= £ a 0 J Xj = Min. 7=1
(6.16)
"> Das sind die aus der „Analyse des Aufkommens und der Verteilung" bekannten Bilanzgleichungen für die Produktion der einzelnen Erzeugnisse. 14*
200
Kapitel VI. Optimierung bei einer Vielfalt von Zielen
bei Erfüllung des vorgeschriebenen Programms für die Endproduktion: j4 0) , j40)> • • •, y(n0), also unter Einhaltung der Nebenbedingungen > yp 0' = 1.2> 1 und der Randbedingungen Xj > 0; yW > 0 ( i j = 1, 2 Xi-
t
«)
(6-17)
»).
(6.18)
Wir formen dieses Problem in die Dualaufgabe um, die im vorliegenden Fall wie folgt dargestellt werden kann: Die Multiplikatoren A2, ..., A„ sind so zu bestimmen, daß der Wert der Funktion des „Gesamtgewichtes der Bilanzlimite" maximal wird, also daß ® = £ ¿¡yf' = Max. ¡=1 unter Einhaltung der Nebenbedingungen h - S auh < öoj i= i
( j = 1 , 2 , . . . , n)
und der Randbedingungen 0 0=1,2,...,«).
(6.19)
(6.20) (6.21)
Wir überlegen uns, was die so formulierte Dualaufgabe aussagt. Es geht hier um die Maximierung der gewogenen Summe der Endprodukte der Volkswirtschaft. Als Gewichte dienen in dieser Summe die Multiplikatoren ..., die gewissermaßen die einzelnen Endprodukte bewerten. Faßt man die Multiplikatoren A2, ..., A„ als Preise der jeweiligen Endprodukte auf, dann bestimmt die Summe v=±hy?) i= l die Höhe des Nationaleinkommens. Die Nebenbedingungen (6.20) besagen, daß der Überschuß des Preises über den Gesamtwert des Aufwandes an stofflichen Mitteln je Erzeugniseinheit in keinem Produktionszweig die Größe a0j, d.h. die Menge der zu ihrer Herstellung notwendigen Arbeit, überschreiten darf. Schreibt man diese Bedingung in der Form n h i=i
§ 3. Vielfalt der Ziele und lineare Optimierung
201
dann erkennen wir, daß sie der Voraussetzung entspricht, wonach der Preis den Gesamtarbeitsaufwand und den Wert der stofflichen Mittel, also die Produktionskosten für das jeweilige Erzeugnis, nicht überschreiten darf. Dadurch wird nachgewiesen, daß die Aufgabe, die auf die Minimierung des gesellschaftlichen Arbeitsaufwandes bei Erfüllung der geforderten Endproduktion in der gesamten Volkswirtschaft abzielt, der dualen Aufgabe gleichwertig ist, die auf der Maximierung des Nationaleinkommens bei Anwendung von Preisen beruht, die die Produktionskosten nicht überschreiten. Aus der Theorie der linearen Optimierung ist bekannt, daß die optimale Lösung der dualen Aufgabe der optimalen Lösung der Primalaufgabe gleich ist, also = z Mln .. Daraus ergibt sich unter der Bedingung eines optimalen Programms die interessante Beziehung
t
i=\
Dieser Gedanke wurde das erste Mal erwähnt in dem von R. Dorfman, P. A. Samuelson und R. M. Solow verfaßten Buch, Linear Programming and Economic Analysis, Kapitel 14, McGraw-Hill, New York—Toronto—London 1958. Mit-diesem Problem beschäftigte sich ebenfalls Prof. Drewnowski in dem Artikel Prawo wartoici w socjalizmie. Ui?cie matematyczne (Das Wertgesetz im Sozialismus. Mathematische Auffassung), in: „Ekonomista", Nr. 6, Warszawa 1960. Dieses Thema wurde von T. Kasprzak weiterentwickelt. Kasprzak erbrachte einen einfachen Beweis für die beiden oben besprochenen Varianten der Optimierung und ihre ökonomische Interpretation. Vgl. T. Kasprzak, Rachunek ekonomiczny w liniowych modelach makroekonomicznych (Ökonomische Berechnung in makroökonomischen linearen Modellen), in: Bulletin der Fakultät für politische Ökonomie der Warschauer Universität, Warszawa 1961, S. 648—651.
202
Kapitel VI. Optimierung bei einer Vielfalt von Zielen
schaft, wobei die Produktionsumfänge aller anderen Zweige beibehalten werden müssen und das vorgegebene Limit an gesellschaftlichem Arbeitsaufwand nicht überschritten werden darf. Dieses Problem kann man folgendermaßen formulieren: Es ist das Endprodukt des Zweiges 1 zu maximieren, d.h., es ist jj =
X auXj = Max. i
(6.23)
zu erreichen, bei Erfüllung der Nebenbedingungen Xt-
t djXj > yi0)
7=1
(i= 1.2, ...,«),
£a0jXj 0
0 = 1 , 2 , ...,n).
(6.26)
Die Bedingung (6.25) fordert, daß die insgesamt aufgewandte gesellschaftliche Arbeit eine vorgegebene Menge disponibler gesellschaftlicher Arbeit X0 nicht überschreitet. Aus den obigen Betrachtungen folgt schließlich, daß das Problem des „Pareto-Maximums" für den Fall, daß die entsprechende Zielfunktion und die Nebenbedingungen linear, die Methoden der Marginalrechnung also nicht brauchbar sind, auf die Lösung einer bestimmten Aufgabe der linearen Optimierung führt.
K a p i t e l VII
Optimierung unter Ungewißheit § 1. Optimale Verteilung des Produktionsplanes auf einzelne Betriebe Wir untersuchen jetzt einige Probleme, die zwar noch keine klassischen Probleme der dynamischen Optimierung sind, aber mit derartigen Problemen zusammenhängen, da sie ein Element der Ungewißheit enthalten. Das erste Beispiel betrifft die optimale Aufteilung des Produktionsplanes auf eine Reihe von Betrieben, so daß die Gesamtproduktionskosten minimal werden. Wir unterstellen, daß unter der Leitung einer Wirtschaftsorganisation (z.B. eines Kombinats, einer Vereinigung usw.) n Kraftwerke Elektroenergie in den Mengen q u q z , •••,q n ^ 0, i = 1, 2 , . . . , « ) 1} erzeugen. Die variablen Produktionskosten für Elektroenergie in den einzelnen Betrieben sind Funktionen der Produktionshöhe und betragen -©2(92), •••, Dn(q„). Wir unterstellen, daß die variablen Produktionskosten nicht negativ sind und mit der Produktionssteigerung anwachsen; die Grenzkosten der Produktion sind also A ' t e ) > 0 für i= 1,2, ...,«. Im Verlaufe der Untersuchung werden wir uns davon überzeugen, daß eine weitere Annahme gelten muß, wonach die Grenzkosten mit der Produktionssteigerung anwachsen, d.h. DWq-,) > 0 für j = 1, 2, ...,n notwendig ist. Wir berücksichtigen nur die variablen Kosten, da die konstanten Kosten auf das Ergebnis der weiteren Untersuchungen keinen Einfluß haben. Die Ableitungen der konstanten Kosten nach qi verschwinden. Die konstanten Kosten beeinflussen somit nicht die zur Minimierung der Gesamtproduktionskosten führenden Entscheidungen.
204
Kapitel VII. Optimierung unter Ungewißheit
Es sei ferner ein bestimmter Gesamtbedarf an Elektroenergie vorhanden, der für den gegebenen Zeitraum Q > 0 beträgt. Es geht darum, die Produktion so auf die einzelnen Betriebe aufzuteilen, daß die Gesamtproduktionskosten D minimal werden. Dabei reicht es aus, die variablen Gesamtkosten zu analysieren. In der mathematischen Formulierung kann man das Problem wie folgt darstellen. Die Veränderlichen qu q2, ..., q„ sind so zu bestimmen, daß D = t A f e ) = Min. i=i unter Einhaltung der Bedingung, daß t
* = Q,
(7.1)
(7-2)
und der Voraussetzung, daß q^O
( / = 1,2, ...,«).
(7.3)
Nach Bilanzbedingung (7.2) muß die Gesamtproduktion mit dem Bedarf übereinstimmen. An sich könnte man diese Bedingung durch tQ i= 1 ersetzen. Aber es wird sofort ersichtlich, daß wegen (7.1) diese Forderung durch die Bedingung (7.2) ersetzt werden müßte, da die Produktionskosten bei tQ (=i unnötig ansteigen. Die Kostenfunktionen sind im allgemeinen nichtlinear, deshalb lösen wir das Problem mit der Methode der Marginalrechnung. Die Lagrangesche Funktion hat hier die Form
§ 1. Optimale Verteilung des Produktionsplanes auf einzelne Betriebe
205
Daraus folgt, daß L = Min., wenn A ; (?;) = A (i = 1, 2, ..., n ) . Die Verteilung der Produktion ist also optimal, wenn die Grenzkosten der Produktion in allen Kraftwerken gleich sind: A ' ( ? i ) = D'2(q2) = ... = D'n{qn). (7.4) Insgesamt gibt es n— 1 Gleichungen (7.4). Aus ihnen kann man n— 1 Unbekannte q{ bestimmen. Die letzte, «-te Unbekannte können wir aus der Bilanzbedingung (7.2) herleiten. Die Bedingung (7.4) leuchtet intuitiv ein. Stimmten nämlich die Grenzkosten in den einzelnen Kraftwerken nicht überein, dann lohnte es sich, einen Teil der Produktion aus Kraftwerken mit höheren Grenzkosten auf Kraftwerke mit niedrigeren Grenzkosten zu verlagern; denn dadurch ließe sich eine Senkung der Gesamtproduktionskosten erreichen. Wenn alle Kraftwerke gleiche Grenzkosten der Produktion aufweisen, dann kann man von den allgemeinen Grenzkosten der Elektroenergieproduktion, z.B. in der gesamten Volkswirtschaft, sprechen. Diese Kosten sind gleich X, und das ist in diesem Fall der ökonomische Inhalt der Lagrangeschen Multiplikatoren. Ist die Verteilung* der Produktion auf die einzelnen Kraftwerke jedoch nicht optimal, d.h. wird der Bedingung (7.4) nicht genügt, dann kann man nicht von allgemeinen Grenzkosten der Elektroenergieproduktion in der gesamten Volkswirtschaft sprechen. In jedem Kraftwerk sind diese Kosten dann unterschiedlich hoch. Wir geben eine graphische Interpretation dieses Problems für den Fall, daß nur zwei Kraftwerke vorhanden sind. Den Abschnitt Ox 0 2 auf der Zeichnung 7.1 setzen wir gleich Q , wobei Q = q \ - \ - q 2 ist. Danach stellen wir die Funktionen der Grenzkosten D [ ( q { ) und D ' 2 ( q 2 ) dar, indem wir die Produktionen der einzelnen Kraftwerke qx und q2 von den Punkten Ox und 0 2 in entgegengesetzter Richtung abtragen. Wenn die Grenzkostenkurven beider Kraftwerke ansteigen, also •ßi'Cii) > 0 und D'2'(q2) > 0 ist, dann bestimmt die Senkrechte durch den Schnittpunkt der Grenzkostenkurven D [ { q x ) und D ' 2 ( q 2 ) auf die Achse 0 X 0 2 , also der Punkt A u die optimale Verteilung der Produktion auf die beiden Kraftwerke: qx = O l A l und q2 — 0 2 Ä 1 . Jede andere Verteilung der Bruttoproduktion Q = Ox 0 2 führte zu höheren
206
Kapitel VII. Optimierung unter Ungewißheit
Gesamtproduktionskosten. Der Abschnitt AiA = k repräsentiert die allgemeinen Grenzkosten der Produktion beider Kraftwerke.
Zeichnung 7.1
Zeichnung 7.1.1
Es ist nicht schwer zu zeigen, daß bei fallenden Grenzkosten D'^q^ und D'2(q2) (Zeichnung 7.1.1) der Punkt Ax nicht den minimalen, sondern den maximalen Wert D bestimmte. In einem solchen Fall wäre es richtig, die gesamte Produktion einem Kraftwerk zu übertragen, und zwar dem, dessen Gesamtkosten Q niedriger sind. Die Existenz des Minimums von D in dem Punkt, in dem die Grenzkosten beider Betriebe gleich sind, resultiert daraus, daß die Grenzkosten der Kraftwerke mit steigender Produktion annahmegemäß wachsen, also D['(qj) > 0 und D'2'(q2) > 0 ist. Wird die Bilanzbedingung (7.2) erfüllt, dann ist die zweite Ableitung der Lagrangeschen Funktion d2L > 0. Das ist bekanntlich eine Bedingung dafür, daß der Extremwert einer Funktion ein Minimum ist. § 2. Der Fall einer beschränkten Kapazität der Produktionsbetriebe Wir beschäftigen uns jetzt mit einer komplizierteren Variante des untersuchten Problems. Wir unterstellen insbesondere, daß die Kraftwerke eine bestimmte untere und obere Kapazitätsschranke at und bt (¿f > a t > 0) haben. Die Randbedingungen (7.3) nehmen dann die Form
206
Kapitel VII. Optimierung unter Ungewißheit
Gesamtproduktionskosten. Der Abschnitt AiA = k repräsentiert die allgemeinen Grenzkosten der Produktion beider Kraftwerke.
Zeichnung 7.1
Zeichnung 7.1.1
Es ist nicht schwer zu zeigen, daß bei fallenden Grenzkosten D'^q^ und D'2(q2) (Zeichnung 7.1.1) der Punkt Ax nicht den minimalen, sondern den maximalen Wert D bestimmte. In einem solchen Fall wäre es richtig, die gesamte Produktion einem Kraftwerk zu übertragen, und zwar dem, dessen Gesamtkosten Q niedriger sind. Die Existenz des Minimums von D in dem Punkt, in dem die Grenzkosten beider Betriebe gleich sind, resultiert daraus, daß die Grenzkosten der Kraftwerke mit steigender Produktion annahmegemäß wachsen, also D['(qj) > 0 und D'2'(q2) > 0 ist. Wird die Bilanzbedingung (7.2) erfüllt, dann ist die zweite Ableitung der Lagrangeschen Funktion d2L > 0. Das ist bekanntlich eine Bedingung dafür, daß der Extremwert einer Funktion ein Minimum ist. § 2. Der Fall einer beschränkten Kapazität der Produktionsbetriebe Wir beschäftigen uns jetzt mit einer komplizierteren Variante des untersuchten Problems. Wir unterstellen insbesondere, daß die Kraftwerke eine bestimmte untere und obere Kapazitätsschranke at und bt (¿f > a t > 0) haben. Die Randbedingungen (7.3) nehmen dann die Form
§ 2. Der Fall einer beschränkten Kapazität der Produktionsbetriebe
ai In der Formel (7.5.1) bedeutet der Buchstabe / den Zinsfuß, also i =
1UU
wobei p der Prozentsatz ist. Der Diskontfaktor, d.h. der Barwert der in einem Jahr zu zahlenden Geldeinheit beträgt v = zu zahlenden Geldeinheit beträgt 5
^ ^ _, und der Barwert der in t Jahren
*
(1+0' '
> Tatsächlich ist 1 —v = iv, da t>(l+/') = 1.
§ 4. Das Problem der Produktionsplanung unter Ungewißheit
213
Die graphische Interpretation der Lösung des vervollständigten Problems bleibt dieselbe, nur daß die Gerade mit dem Anstieg— T 1 —
(Zeichnung 7.3) durch die Gerade mit dem Anstieg
V
T
—— zu erset-
zen ist. Es gibt natürlich noch wesentlich kompliziertere Fälle des in diesem Paragraphen dargestellten Problems. So mag sich beispielsweise die Bauzeit über mehrere Jahre erstrecken. Dann wird es vorteilhaft, nicht nur die Betriebskosten zu diskontieren, sondern auch die einzelnen Investitionsaufwände. Manchmal können Komplikationen durch die Existenz technisch bedingter Kapazitätsgrenzen (also auch der Investitions- und Betriebskosten) des Kraftwerkes entstehen. Im letzten Fall wird es vorteilhaft sein, eine Variante auszuwählen, deren Investitions- und Betriebskosten den technischen Grenzen am nächsten liegen. Die Bedingungen der Aufgabe verweisen darauf, ob man zur linken oder zur rechten Grenze gehen muß. Es können auch Spezialfälle auftreten, bei denen die Marginalrechnung versagt. Aber auch dann treten keine wesentlichen Komplikationen auf, es sind lediglich zusätzliche Untersuchungen und die Bestimmung individueller Lösungsmethoden erforderlich. § 4. Das Problem der Produktionsplanung unter Ungewißheit Wir analysieren jetzt ein Problem, bei dem ein Element der Ungewißheit auftritt. Wir wollen uns mit der Produktionsplanung für eine bestimmte Getreideart (z.B. Weizen) beschäftigen. Dabei unterstellen wir, daß die gesamte für den Weizenanbau bestimmte Fläche in n Gebiete, etwa nach Bodenarten, unterteilt wurde. Die Produktionskosten im z'-ten Gebiet betragen für qt Tonnen Weizen A ( < 7 i ) > die Produktionsn
kosten6) für Weizen betragen also im ganzen Land D = Jj A(tfi)i=i 6
> Wir untersuchen hier nur die variablen Produktionskosten. Die konstanten Produktionskosten können wir unberücksichtigt lassen, da sie — genau wie bei den vorhergehenden Problemen — die Ergebnisse der Berechnung nicht beeinflussen. 15
Lange, Optimale Entscheidungen
§ 4. Das Problem der Produktionsplanung unter Ungewißheit
213
Die graphische Interpretation der Lösung des vervollständigten Problems bleibt dieselbe, nur daß die Gerade mit dem Anstieg— T 1 —
(Zeichnung 7.3) durch die Gerade mit dem Anstieg
V
T
—— zu erset-
zen ist. Es gibt natürlich noch wesentlich kompliziertere Fälle des in diesem Paragraphen dargestellten Problems. So mag sich beispielsweise die Bauzeit über mehrere Jahre erstrecken. Dann wird es vorteilhaft, nicht nur die Betriebskosten zu diskontieren, sondern auch die einzelnen Investitionsaufwände. Manchmal können Komplikationen durch die Existenz technisch bedingter Kapazitätsgrenzen (also auch der Investitions- und Betriebskosten) des Kraftwerkes entstehen. Im letzten Fall wird es vorteilhaft sein, eine Variante auszuwählen, deren Investitions- und Betriebskosten den technischen Grenzen am nächsten liegen. Die Bedingungen der Aufgabe verweisen darauf, ob man zur linken oder zur rechten Grenze gehen muß. Es können auch Spezialfälle auftreten, bei denen die Marginalrechnung versagt. Aber auch dann treten keine wesentlichen Komplikationen auf, es sind lediglich zusätzliche Untersuchungen und die Bestimmung individueller Lösungsmethoden erforderlich. § 4. Das Problem der Produktionsplanung unter Ungewißheit Wir analysieren jetzt ein Problem, bei dem ein Element der Ungewißheit auftritt. Wir wollen uns mit der Produktionsplanung für eine bestimmte Getreideart (z.B. Weizen) beschäftigen. Dabei unterstellen wir, daß die gesamte für den Weizenanbau bestimmte Fläche in n Gebiete, etwa nach Bodenarten, unterteilt wurde. Die Produktionskosten im z'-ten Gebiet betragen für qt Tonnen Weizen A ( < 7 i ) > die Produktionsn
kosten6) für Weizen betragen also im ganzen Land D = Jj A(tfi)i=i 6
> Wir untersuchen hier nur die variablen Produktionskosten. Die konstanten Produktionskosten können wir unberücksichtigt lassen, da sie — genau wie bei den vorhergehenden Problemen — die Ergebnisse der Berechnung nicht beeinflussen. 15
Lange, Optimale Entscheidungen
214
Kapitel VII. Optimierung unter Ungewißheit
Die Funktionen A() betrachten wir als gegeben und setzen voraus,7) daß Dl(qi) > 0 und > 0 für i = 1, 2, ...,«. Das Problem besteht darin, einen vorgegebenen Bedarf an Weizen in Höhe von Q Tonnen zu befriedigen, wobei die Produktion so auf die Gebiete aufzuteilen ist, daß die Gesamtproduktionskosten D minimal werden. Die mathematische Formulierung dieses Problems ist mit der des oben erörterten Problems der Kraftwerke identisch. Es geht darum, solche nichtnegativen Veränderlichen qu q2, ..., q„ zu bestimmen, für die D = t A( Das Symbol „Var" wird als Abkürzung für das Wort Varianz (Streuung) verwendet. ,4 > Die Voraussetzung der Unabhängigkeit der Unsicherheitsfaktoren xi (i = 1,2 n) wurde zur Vereinfachung der Berechnungen eingeführt. In Wirklichkeit sind die Unsicherheitsfaktoren der Weizenproduktion zweifellos voneinander abhängig, da auf die Erträge in den einzelnen Gebieten die klimatischen Bedingungen, die häufig für das ganze Land gelten, einen Einfluß haben. Gibt man aber diese Voraussetzung auf, dann muß man bei den Berechnungen die Koeffizienten der zwischen ihnen bestehenden Korrelation berücksichtigen.
§ 5. Produktionsplanung bei beschränkter Größe des Risikos
221
des optimalen Aussaatplanes für Weizen (und bei ähnlichen Situationen) nicht nur die Mittelwerte (mathematischen Erwartungen) der in dem Problem enthaltenen Zufallsgrößen interessieren, sondern auch das Ausmaß ihrer Varianz Das Symbol „Var" wird als Abkürzung für das Wort Varianz (Streuung) verwendet. ,4 > Die Voraussetzung der Unabhängigkeit der Unsicherheitsfaktoren xi (i = 1,2 n) wurde zur Vereinfachung der Berechnungen eingeführt. In Wirklichkeit sind die Unsicherheitsfaktoren der Weizenproduktion zweifellos voneinander abhängig, da auf die Erträge in den einzelnen Gebieten die klimatischen Bedingungen, die häufig für das ganze Land gelten, einen Einfluß haben. Gibt man aber diese Voraussetzung auf, dann muß man bei den Berechnungen die Koeffizienten der zwischen ihnen bestehenden Korrelation berücksichtigen.
222
Kapitel VII. Optimierung unter Ungewißheit
V a r ( ß - t *«?i) =
Y a T
( t *(?«) = t Var(* (9l ) = £
q]o\,
wobei a\ die Varianz der Zufallsgröße ist. Das modifizierte Problem der optimalen Verteilung der Weizenproduktion auf n Anbaugebiete kann man jetzt folgendermaßen formulieren. Die nichtnegativen Veränderlichen q\,q2,...,q n sind so zu bestimmen, daß die Gesamtkosten (Produktionskosten des Weizens und eventuelle Kosten des Defizits) minimal sind: D = t DtWd+c^Q-
t
= Min.
(7.15)
bei Erfüllung der Nebenbedingungen t Ii* = ß> i= 1
(7-16)
V a r ( ß - J j * i ? i ) = ± q\a) < k.
(7.17)
Die Bedingung (7.17) besagt, daß die Varianz des Defizits (Überschusses) der Weizenproduktion eine gewisse zuvor festgelegte Größe k nicht überschreiten darf. Diese Größe gibt die Grenze des Risikos an, das wir bereit sind, bei der Planung der Produktion in Kauf zu nehmen. Die als Ungleichung geschriebene Bedingung (7.17) kann man — wie aus der allgemeinen Theorie der Optimierung folgt — durch eine Gleichung ersetzen:15' /= i
=
(7.17.1)
Die rechnerischen Umformungen beruhen auf den aus der Wahrscheinlichkeitstheorie bekannten Sätzen über die Varianz: 1. die Varianz einer Konstanten ist gleich Null, 2. die Varianz der Summe oder der Differenz unabhängiger Zufallsgrößen ist gleich der Summe der Varianzen der einzelnen Summanden,
3. Var {qiXi) = q\ Var (*;).
15) Das Ersetzen der Ungleichung (7.17) durch die Gleichung (7.17.1) hat keinen Einfluß auf das endgültige Ergebnis, da der Punkt, der der optimalen Lösung entspricht, immer am Rande des Bereichs der zulässigen Lösungen liegt.
§ 5. Produktionsplanung bei beschränkter Größe des Risikos
223
Das ermöglicht die Anwendung der Methode der Lagrangeschen Multiplikatoren zur Lösung des Problems. Die Lagrangesche Funktion hat für den vorliegenden Fall die Form: L =
Differenziert man diese Funktion nach qt (i — 1,2, ...,«) und unterstellt wie zuvor, daß x t = is(xi) = 1 ist, dann erhält man die notwendigen Bedingungen, damit D — Min., nämlich: also
D',(qi)-c-h+2^qi = 0 Dl(qd-c
= A,-2A 2 a? ?i
(i = 1, 2 , . . . , n), (/ = 1, 2, ...,«).
(7.18)
Die n Gleichungen (7.18) und die zusätzlichen Bedingungen (7.16) und (7.17.1) ermöglichen die Bestimmung der n + 2 Veränderlichen Es entsteht die Frage, wie sich B entscheidet: fordert er die Rückgabe der 100 Mark oder stimmt er dem vorgeschlagenen Spiel zu. Legte B seiner Entscheidung die mathematische Gewinnerwartung zugrunde, dann wäre es für ihn gleichgültig, welche Variante er wählt. Marshall und Pigou, die mit der Grenznutzentheorie operierten, waren der Meinung, daß ein ökonomisch denkender Mensch den Vorschlag zum Spiel ablehnen muß, da der Nutzen, der aus dem Erhalt zusätzlicher 50 Mark resultiert, geringer ist als der Verlust an Nutzen, der aus dem gegenüber der Schuldsumme um 50 Mark verminderten Betrag entsteht. 17
> Einen ähnlichen Vorschlag propagiert unter sozialistischen Bedingungen die polnische Sparkasse. Sie schlägt ihren Kunden vor, auf die Verzinsung der Spareinlagen zu verzichten. Stattdessen kann sich der Sparer an der Auslosung einer hochwertigen Prämie (z.B. Auto) beteiligen. [Sogenanntes Prämiensparen.]
§ 6. Die neoklassische Theorie des Risikos
227
Diese Erfahrungstatsache ist nach ihrer Meinung die Quelle der Erscheinung, die wir als Abneigung gegen Risiko bezeichneten. Zwar ist in beiden Fällen die mathematische Erwartung für den Betrag, den B zurückerhält, die gleiche, aber die Varianz ist unterschiedlich. Im ersten Fall, d.h., wenn B von A 100 Mark erhält, beträgt die Varianz Null, im zweiten Fall, d.h., wenn B sein Einverständnis zu dem Spiel gibt, beträgt die Varianz a 2 — ( y • 502j + + ( y • 50 2 ) = 2500.
Nach der neoklassischen Theorie handelt der
Leiter eines Betriebes ähnlich. Für ihn hat der sichere Gewinn einen größeren Nutzen als jener, der zwar eine gleich hohe Erwartung aufweist, aber durch Gewinnschwankungen charakterisiert ist. Aus diesen Betrachtungen zog Marshall unter anderem den Schluß, daß es sich nicht lohnt, Wetten abzuschließen, in der Lotterie zu spielen oder an anderen Glücksspielen teilzunehmen.*) Es fanden sich aber Gegner einer derartigen Ansicht. Sie verwiesen darauf, daß Marshall in seinen Überlegungen den Reiz unberücksichtigt ließ, den Personen empfinden, die Wetten abschließen oder in der Lotterie spielen. Ähnlich gibt es in der kapitalistischen Wirtschaft Untennehmer, die es lieben, ein Risiko zu tragen. Als Folge ihrer riskanten Tätigkeit können sie Bankrott machen; es kommt aber auch vor, daß sie schnell ein Vermögen erwerben.18' Wesentlich ist aber für die Auffassungen der neoklassischen Risikotheorie, daß man einen Betrieb oder eine Person zur Übernahme eines gewissen Risikos bewegen kann, wenn die mathemati*> „Eine Eisenbahnaktie, die mit Sicherheit 4 Prozent Ertrag ergibt, wird mit einem höheren Preis verkauft als jene, die mit gleicher Wahrscheinlichkeit 1 oder 7 Prozent — oder einen Betrag dazwischen — erbringt." Vgl. A. Marshall, Principles of Economics, 8. Aufl., London 1962, S. 332. Vgl. auch R. Hilferding, Das Finanzkapital, Dietz Verlag, Berlin 1955, S. 201. 18) Auf die positive Bedeutung der „Unternehmungslust" [oft auch mit Risikofreudigkeit bezeichnet] der kapitalistischen Betriebe verwies J. M. Keynes, Ogölna teoria zatrudnienia, procentu i pieniqdza, (Allgemeine Theorie der Beschäftigung, des Zinses und des Geldes), Warszawa 1956, S. 191—194 und 206— 208. [Vgl. auch die deutsche Ausgabe, Duncker & Hamblot, Berlin 1955, u.a. S. 127 bis 138.]
228
Kapitel VII. Optimierung unter Ungewißheit
sehe Gewinnerwartung entsprechend erhöht wird. Bei höherer Gewinnerwartung ist der Unternehmer bereit, ein größeres Risiko zu tragen. 19) Das ist die grundlegende These der neoklassischen Risikotheorie. Wir erläutern das an einem Beispiel näher. Es sei möglich, die folgenden vier Varianten zu realisieren: I. Variante: der Gewinn beträgt 100 Mark mit der Wahrscheinlichkeit 120> II. Variante: der Gewinn beträgt 80 Mark mit der Wahrscheinlichkeit ~ oder 130 Mark mit der Wahrscheinlichkeit
.
III. Variante: der Gewinn beträgt 60 Mark mit der Wahrscheinlichkeit oder 160 Mark mit der Wahrscheinlichkeit y . IV. Variante: der Gewinn beträgt 50 Mark mit der Wahrscheinlichkeit -i oder 180 Mark mit der Wahrscheinlichkeit -i. Die mathematische Erwartung des Gewinns beträgt für die einzelnen Varianten entsprechend: 100, 105, 110 und 115. M a n erkennt leicht, daß die Varianz des Gewinns für die Variante I am niedrigsten ist (gleich 0); die Variante II hat eine größere Varianz als die Variante I, III eine größere als II und die Varianz der Variante IV ist am größten. In einer gewissen Situation können sich die vier Varianten als gleichwertig erweisen: die höhere Varianz wird genau durch die größere mathematische Erwartung kompensiert. Wir erläutern das an Hand der Zeichnung, die die sogenannte Indifferenzkurve darstellt. Sie ist der geometrische Ort aller Punkte, die den gleichwertigen Varianten des Problems entsprechen. Auf der Abszissenachse (Zeichnung 7.7) tragen wir die Größe der Varianz a 2 auf. Sie zeigt 19) Die Ökonomen der neoklassischen Schule gebrauchten anstelle des Begriffes „Risiko" den Begriff „Ungewißheit". Gegenwärtig wird der Begriff „Ungewißheit" benutzt, wenn bei der Untersuchung bestimmter Erscheinungen die Wahrscheinlichkeitsrechnung nicht angewandt werden kann. [Zur besseren Unterscheidung vom Risiko verwendet der Autor — wie allgemein üblich — hier auch den Terminus „völlige Ungewißheit", vgl. Kapitel XII sowie Anmerkung zum Vorwort.] Ist diese Möglichkeit aber gegeben, so verwenden wir hierfür den Begriff „Risiko". 20) Ist die Wahrscheinlichkeit gleich eins, so wird der Gewinn in der bestimmten Höhe mit Sicherheit (Gewißheit) erreicht.
§ 6. Die neoklassische Theorie des Risikos
229
das Maß des Risikos an, das mit der Realisierung der jeweiligen Variante des Problems verbunden ist. Auf der Ordinatenachse tragen wir den Erwartungswert (die mathematische Erwartung) des Gewinns E(x) ab. Wir betrachten die Variante, bei der das Risiko OA und
der erwartete Gewinn OB beträgt. Dieser Variante entspricht der Punkt M. Wir ändern nun diese Variante dahin ab, daß wir das Risiko beispielsweise um AA} erhöhen. Dann müssen wir den erwarteten Gewinn beispielsweise um BBX erhöhen, um eine zur ersten Variante gleichwertige Variante zu erhalten. Der Punkt N entspricht dieser neuen Variante. Wenn man weiterhin so vorgeht und schrittweise das Risiko in kleinen Quanten erhöht, erhalten wir die Indifferenzkurve PMN, auf der die Punkte liegen, die den gleichwertigen Varianten des Problems entsprechen. Wir bemerken, daß der Punkt P auf der Zeichnung 7.7 der Variante entspricht, bei der der Gewinn sicher, d. h. gewiß ist (Gewinn = OP\ a2 = 0). Aus der Zeichnung 7.7 geht hervor, daß der zusätzlich erwartete Gewinn BBX gewissermaßen der „Preis", also die Risikoprämie, für die Übernahme des zusätzlichen Risikos AAl ist. Dieses zusätzliche Risiko wird an der Größe der Varianz gemessen. In Analogie hierzu repräsentiert beispielsweise der Abschnitt OBx die Prämie für die Übernahme des Risikos, das durch den Abschnitt OA x bestimmt ist 16
Lange, Optimale Entscheidungen
230
Kapitel VII. Optimierung unter Ungewißheit
usw. Es besteht also die Möglichkeit, das Risiko durch die entsprechende Erhöhung der Gewinnerwartung zu kompensieren, oder anders ausgedrückt, es gibt eine Prämie, die einer bestimmten Abneigung gegen Risiko entspricht. Für gewöhnlich setzt man voraus, daß die Indifferenzkurve eine Funktion darstellt, die progressiv wächst, die also „konkav von oben" verläuft, wobei sie eine senkrechte Asymptote besitzt. Dann wird aber die Kompensation eines hinreichend großen Risikos schon unmöglich, weil der erwartete Gewinn unendlich groß sein müßte. Die Erfahrungstatsache, daß die Indifferenzkurve immer steiler ansteigt (was bedeutet, daß bei steigendem Risiko die Prämie für die Risikoübernahme noch schneller anwächst) wurde als Gesetz der zunehmenden Risikoprämie bezeichnet.21) Die Schar der Indifferenzkurven repräsentiert eine Präferenzfunktion zur Auswahl des Programms. Die Indifferenzkurven sind die Projektionen der Höhenlinien der Fläche der Präferenzfunktion, die in der dreidimensionalen Darstellung diese Präferenzen repräsentiert. Wir führen noch den Begriff „Prämienrate q (Bonifikation) für Risiko" ein, den wir als Verhältnis der Risikoprämie zur Höhe des sicheren Gewinns definieren. Auf der Zeichnung 7.7 wird die Prämienrate für Risiko, also die Größe q, durch die Länge des Abschnittes PB — OB— OP (zusätzliche Risikoprämie) zur Länge des Abschnittes OP (sicherer Gewinn) ausgedrückt: 8 = OP Qp Aus der Formel 7.19 folgt, daß q = — ^ p — =
(7-19) un(
* daraus (7.20)
Den sicheren Gewinn OP können wir als Diskontwert des erwarte21
> Dieses Gesetz nutzte Kalecki zur Bestimmung der Betriebsgröße kapitalistischer Unternehmen aus. Vgl. M. Kalecki, Teoria dynamiki gospodarczej (Theorie der wirtschaftlichen Dynamik), PWN, Warszawa 1958, S. 116—122. [Vgl. auch seine Theory of Economic Dynamics, London 1954, S. 91—95.]
§ 6. Die neoklassische Theorie des Risikos
231
ten Gewinns ausdrücken. Hierbei dient als Diskontrate die Prämienrate für Risiko, die von der Indifferenzkurve abhängt. In der modernen kapitalistischen Wirtschaft werden zweifellos auf die obigen Prämissen gestützte Transaktionen durchgeführt. Sie resultieren aus dem Bestreben, sich gegen Risiken abzusichern. So verkauft der Bauer z.B. das Getreide auf dem Halm im allgemeinen für einen niedrigeren Betrag als das erwartete Einkommen. Er tut das, um sich des Risikos einer eventuellen späteren Senkung der Getreidepreise zu entledigen. Dieses Risiko überträgt er auf den Käufer des Getreides. Die Termintransaktionen der Börse haben einen ähnlichen Charakter.*) Der Industrielle ersteht beispielsweise Kupfer zum „Kassa"-Preis, obgleich es erst in einem halben Jahr geliefert werden soll. Der tatsächliche („Termin"-) Preis des Kupfers nach Ablauf dieses Zeitraumes kann niedriger oder höher sein als der „Kassa"-Preis. Der Industrielle will jedoch nichts riskieren, er möchte von vornherein eine genaue Kalkulationsbasis der Produktionskosten haben und bezahlt für das Kupfer, was zum „Kassa"-Preis notiert ist. Auf diese Weise verwandelt er eine unsichere Ausgabe in eine sichere. Man kann auch eine Indifferenzkurve entwickeln (analog der in der Zeichnung 7.7 dargestellten Kurve), die nicht die Analyse der erwarteten Gewinne, sondern der erwarteten Kosten betrifft. Die
*' „Der Terminhandel ist so das Mittel für die Industriellen und Kommerziellen, sich auf ihre eigene Funktion zu beschränken." Vgl. R. Hilferding, Das Finanzkapital, Dietz Verlag, Berlin 1955, S. 221 ff. 16*
232
Kapitel VII. Optimierung unter Ungewißheit
Indifferenzkurve ist dann eine degressiv fallende Kurve, sie ist also konkav von oben (Zeichnung 7.8). Das rührt daher, daß beispielsweise der Käufer von Rohstoffen immer mehr bezahlen muß, wenn er kein Risiko tragen will. Und umgekehrt verringern sich die Kosten für den Rohstoff, wenn das Käuferrisiko zunimmt. Dabei unterstellt man, daß die Bezugspreise mit wachsendem Risiko immer langsamer sinken. Auf der Zeichnung 7.8 repräsentiert der Abschnitt OP die Höhe der sicheren Kosten und der Abschnitt BP die Risikoprämie. Auch in diesem Fall läßt sich die Prämienrate (Bonifikation) für Risiko bestimmen. § 7. Produktionsplanung nach der neoklassischen Theorie des Risikos—Präferenzfunktion der Auswahl Wir kommen noch einmal auf das Problem der Optimierung der Weizenproduktion unter Ungewißheit und der Bestimmung der optimalen Produktionsverteilung auf n Gebiete des Landes zurück. Wir versuchen, das Problem nach der neoklassischen Theorie des Risikos zu lösen. Wir führen die Präferenzfunktion der Auswahl F(D, ff2) ein. Diese Funktion macht die Auswahl des Programms von den Produktionskosten für Weizen und vom Risiko eines Defizits abhängig, das an der Varianz gemessen wird. Als Funktion zweier Veränderlicher ist ihre graphische Darstellung eine gewisse Fläche. Ordnet man der Funktion F{D, a2) verschiedene konstante Werte zu, so erhält man auf der Ebene ( Man kann das folgendermaßen beweisen. Der mittlere Bestand ist Z = = y S Q(.t)dt. Da der Verbrauch gleichmäßig erfolgt, ist demnach Q(t) = Q - rt, wobei r den Verbrauch während einer Zeiteinheit, beispielsweise eines Tages 1 T
bedeutet. Wir haben also Z = — J (Q-rt)dt 1 0 1 T1 rT
i T
i T
i
= — J Qdt—- 5 rtdt = ~QTT 0 T 0 T
~fr~2~
=
ß — j - , und wenn man beachtet, daß r r = ö ( d a f ü r t = TQ(T) =
= Q-rT
= 0 ist), erhalten wir endgültig Z = ß - ~
— -y-. Man kann das ebenT
falls an Hand der Zeichnung 8.1.1 nachweisen. Das Integral S Q{t)dt ist gleich der 0 Fläche des Dreiecks OQT, das ist TO der mittlere Bestand beträgt also Z = =
IT
=
0 erhält, was beweist, daß für x — y = ^k die Summe z = x+y ihr Minimum erreicht. 4
> Daraus folgt, daß sich die Lagerkosten je Einheit,
D
=
c
+c, mit der Er-
höhung der Bestände Z verringern. Das ist eine Annahme, die in der Praxis gewöhnlich erfüllt ist.
252
Kapitel V m . Optimierung der Beschaffung unter Gewißheit
2. sich die Bezugskosten eines Loses aus den konstanten Kosten K, die unabhängig von der Größe des jeweiligen Loses entstehen, und den zusätzlichen Kosten, die man mit der Formel (a Das ist ebenfalls eine realistische Annahme, da beim Bezug großer Lose der Käufer tatsächlich einen gewissen Rabatt erzielt. Außerdem verringern sich im allgemeinen die Transportkosten je Einheit sowie die anderen mit dem Bezug verbundenen Kosten.
§ 3. Die bezogenen Lose sind nicht unbedingt gleich groß
253
Dieses Ergebnis ist dem der ersten Variante des Problems der Beschaffung und Bestände analog. Die Formel (8.6) unterscheidet sich von der Formel (8.3) dadurch, daß im Nenner der Formel (8.6) der zusätzliche Bestandteil —2aQ auftritt. Er kennzeichnet den Einfluß, den die Verbilligung des Bezugs als Folge einer Vergrößerung des Loses auf den Umfang des optimalen Loses ausübt. Dieser Einfluß ist der Verringerung von c, den Lagerkosten je Einheit, um die Größe 2aQ gleichwertig. Die geometrische Interpretation der zweiten Variante des Problems der Beschaffung und Bestände ist der im Paragraphen 1 gegebenen analog. § 3. Die bezogenen Lose sind nicht anbedingt gleich groß Wir untersuchen jetzt die zweite Modifikation des Problems der Beschaffung und Bestände, das im Paragraphen 1 dargestellt wurde. Wir berücksichtigen nämlich, daß die einzelnen Rohstofflose nicht unbedingt gleich groß sein müssen und folglich auch nicht unbedingt in gleichen Zeitabständen bezogen werden. Im Untersuchungszeitraum T, beispielsweise im Verlaufe eines Jahres, mögen n Lose des Rohstoffes in der Höhe St (i = 1 , 2 , . . . , « ) bezogen werden. Die Gesamtmenge des während des Jahres bezogenen Rohstoffes beträgt dann Q = t s , .
i-1
Der mittlere Rohstoffbestand in dem Zeitraum zwischen zwei aufeinanderfolgenden Bezügen beträgt Z ; =
S1; (i = 1, 2, ...,«) und
die Zeit ihrer Lagerung beträgt Sj rp Q
1
'
wobei T = 1 (Jahr) ist. Wenn wir wie im Paragraphen 1 die Lagerkosten je Bestandseinheit mit c und die Bezugskosten eines Loses mit K bezeichnen
§ 3. Die bezogenen Lose sind nicht unbedingt gleich groß
253
Dieses Ergebnis ist dem der ersten Variante des Problems der Beschaffung und Bestände analog. Die Formel (8.6) unterscheidet sich von der Formel (8.3) dadurch, daß im Nenner der Formel (8.6) der zusätzliche Bestandteil —2aQ auftritt. Er kennzeichnet den Einfluß, den die Verbilligung des Bezugs als Folge einer Vergrößerung des Loses auf den Umfang des optimalen Loses ausübt. Dieser Einfluß ist der Verringerung von c, den Lagerkosten je Einheit, um die Größe 2aQ gleichwertig. Die geometrische Interpretation der zweiten Variante des Problems der Beschaffung und Bestände ist der im Paragraphen 1 gegebenen analog. § 3. Die bezogenen Lose sind nicht anbedingt gleich groß Wir untersuchen jetzt die zweite Modifikation des Problems der Beschaffung und Bestände, das im Paragraphen 1 dargestellt wurde. Wir berücksichtigen nämlich, daß die einzelnen Rohstofflose nicht unbedingt gleich groß sein müssen und folglich auch nicht unbedingt in gleichen Zeitabständen bezogen werden. Im Untersuchungszeitraum T, beispielsweise im Verlaufe eines Jahres, mögen n Lose des Rohstoffes in der Höhe St (i = 1 , 2 , . . . , « ) bezogen werden. Die Gesamtmenge des während des Jahres bezogenen Rohstoffes beträgt dann Q = t s , .
i-1
Der mittlere Rohstoffbestand in dem Zeitraum zwischen zwei aufeinanderfolgenden Bezügen beträgt Z ; =
S1; (i = 1, 2, ...,«) und
die Zeit ihrer Lagerung beträgt Sj rp Q
1
'
wobei T = 1 (Jahr) ist. Wenn wir wie im Paragraphen 1 die Lagerkosten je Bestandseinheit mit c und die Bezugskosten eines Loses mit K bezeichnen
254
Kapitel VIII. Optimierung der Beschaffung unter Gewißheit
sowie T— 1 setzen, dann erhalten wir folgende Formel, die die Gesamtkosten des Rohstoffbezugs und der Lagerung ausdrückt: D = c ± ± . j L
+ K n
also D
=
^
t
s
!
+
K
n
.
Das Minimum dieses Ausdruckes berechnen wir unter Berücksichtigung der Bedingung t S i i= 1
=
Q .
Wendet man die Methode der Lagrangeschen Multiplikatoren an, so reduziert sich die Aufgabe darauf, das Minimum für den Ausdruck (die Lagrangesche Funktion)
aufzufinden, wobei l der Lagrangesche Multiplikator ist. Notwendige Bedingung für das Minimum dieses Ausdruckes ist, daß die partiellen Ableitungen nach sämtlichen St gleich Null sind. Demnach muß dT
=
r
= V
0=1,2
n)
sein. Daraus resultiert 0 ' = 1,2,...,«). Sämtliche Werte St sind der auf der rechten Seite der obigen Gleichung stehenden konstanten Größe gleich. Als Ergebnis erhalten wir somit S1 = S2=... = S„ = S, (8.7) wobei S den gemeinsamen Wert der Größen Slt S2, ..., Sn bezeichnet. Auf diese Weise zeigt sich, daß die im Paragraphen 1 getroffene Annahme, die Lose wären alle gleich groß, nicht willkürlich ist,
§ 4. Die Lagerkapazität ist begrenzt
255
sondern aus der Minimierungsbedingung der Gesamtkosten für den Rohstoffbezug und die Lagerung abgeleitet werden kann, falls der Rohstoff in der Zeit gleichmäßig verbraucht wird. § 4. Die Lagerkapazität ist begrenzt Eine weitere Modifikation des Problems der Beschaffung und Bestände resultiert aus der Einführung einer Nebenbedingung. Sie enthält die Annahme, daß die Lagerkapazität begrenzt ist und die Größe P nicht überschreiten darf. Das Problem kann man dann folgendermaßen formulieren: Die Größe des Loses S ist so zu bestimmen, daß die Gesamtkosten für den Rohstoffbezug und die Lagerung minimiert werden: D = \ c S + ^ - = Min.*)
(8.8)
unter Einhaltung der Bedingung 5.
(8.9)
Dieses Problem lösen wir wiederum mit der Methode der unbestimmten Lagrangeschen Multiplikatoren. Die Lagrangesche Funktion hat im vorliegenden Fall folgende Form:
oder L = ^cS+^-X(P-S),
(8.10)
wobei P—S die nichtausgenützte Lagerkapazität ausdrückt. Bei voller Auslastung des Lagers, d.h. S = P, ist die Lagrangesche Funktion (8.10) der Kostenfunktion (8.8) gleich. Wenn also die Funktion (8.10) das Minimum erreicht, dann erreicht auch die Funktion (8.8) das Minimum. Für P—S > 0 unterstellen wir, daß X = 0 ist; auf diese Weise gleichen wir die Lagrangesche Funktion der Kostenfunktion (8.8) an. *> Vgl. (8.1) im § 1.
§ 4. Die Lagerkapazität ist begrenzt
255
sondern aus der Minimierungsbedingung der Gesamtkosten für den Rohstoffbezug und die Lagerung abgeleitet werden kann, falls der Rohstoff in der Zeit gleichmäßig verbraucht wird. § 4. Die Lagerkapazität ist begrenzt Eine weitere Modifikation des Problems der Beschaffung und Bestände resultiert aus der Einführung einer Nebenbedingung. Sie enthält die Annahme, daß die Lagerkapazität begrenzt ist und die Größe P nicht überschreiten darf. Das Problem kann man dann folgendermaßen formulieren: Die Größe des Loses S ist so zu bestimmen, daß die Gesamtkosten für den Rohstoffbezug und die Lagerung minimiert werden: D = \ c S + ^ - = Min.*)
(8.8)
unter Einhaltung der Bedingung 5.
(8.9)
Dieses Problem lösen wir wiederum mit der Methode der unbestimmten Lagrangeschen Multiplikatoren. Die Lagrangesche Funktion hat im vorliegenden Fall folgende Form:
oder L = ^cS+^-X(P-S),
(8.10)
wobei P—S die nichtausgenützte Lagerkapazität ausdrückt. Bei voller Auslastung des Lagers, d.h. S = P, ist die Lagrangesche Funktion (8.10) der Kostenfunktion (8.8) gleich. Wenn also die Funktion (8.10) das Minimum erreicht, dann erreicht auch die Funktion (8.8) das Minimum. Für P—S > 0 unterstellen wir, daß X = 0 ist; auf diese Weise gleichen wir die Lagrangesche Funktion der Kostenfunktion (8.8) an. *> Vgl. (8.1) im § 1.
256
Kapitel VIII. Optimierung der Beschaffung unter Gewißheit
Wir setzen also X = 0, wenn S < P, und A # 0, wenn S = P, wobei wir im zweiten Fall annehmen, daß dann X > 0 ist. Wir formen des weiteren die Lagrangesche Funktion folgendermaßen um: L=(±c+x)s+^--XP.
(8.11)
Wie man leicht sieht, erreicht sie ihren Minimalwert (ihre Ableitung nach S ist gleich Null), wenn
Versuchen wir, das gewonnene Ergebnis zu interpretieren: Wird das Lager nicht vollständig ausgenutzt (S < P), dann ist X = 0 und die Formel (8.12) für die optimale Losgröße läßt sich auf die Formel (8.3) zurückführen, die wir bereits im Paragraphen 1 erhielten. Wird dagegen die Lagerkapazität voll genutzt (S — P), dann ist X > 0. Diese Tatsache beeinflußt die Höhe des optimalen Loses für den Rohstoff genauso, als ob die Lagerkosten je Bestandseinheit um 21 erhöht würden. Die Größe 2X stellt gewissermaßen eine Bewertung dar, die mit der Bilanzbeschränkung (8.9) verbunden ist, also mit der beschränkten Lagerkapazität zusammenhängt. Die Größe 2X kann man vom ökonomischen Standpunkt als zusätzliche Ausgabe (je Bestandseinheit) für Lagermiete auffassen. Wenn wir nämlich in der Formel (8.12) den Ausdruck c+2X mit c, bezeichnen und ihn als neue Lagerkosten (je Bestandseinheit) betrachten, dann wird die Formel (8.12) in eine der Formel (8.3) analoge Gestalt umgeformt. Man kann das auch noch anders erläutern: Gilt die Bedingung (8.9), d.h., ist die Lagerkapazität beschränkt, dann darf die optimale Losgröße S die Größe P nicht überschreiten. Erhöhen sich andererseits die Lagerkosten je Bestandseinheit um 2X, dann beeinflußt dieser Umstand die Größe S in der gleichen Weise wie die einschränkende Bedingung (8.9). Wenn die optimale Losgröße für den Rohstoff S < P ist, dann ist natürlich X — 0 und die Formel (8.12) ist mit der Formel (8.3) identisch. Die Beschränkung der Lagerkapazität erlangt dann keine praktische Bedeutung.
257
§ 5. Der Verbrauch des Bestandes erfolgt nicht gleichmäßig
Die vorliegende Variante des Problems der Beschaffung und Bestände lösen wir so, daß wir die Beschränkung (8.9) vorerst außer /2KQ
acht lassen und die optimale Losgröße nach der Formel So = 1 /
bestimmen. Zeigt es sich, daß S 0 < P, dann gibt es keine Komplikationen, da die Bedingung (8.9) erfüllt ist. Ist aber S 0 > P, dann muß die Beschränkung (8.9) berücksichtigt werden und als optimale Losgröße muß man S = P setzen. Man kann sich vorstellen, daß das Unternehmen zu irgendeiner Vereinigung gehört, die Lager zur Nutzung durch ihre Unternehmen besitzt. In einem solchen Fall könnte man die Größe 2k als Abgabe für eine Bestandseinheit auffassen, die von dem Unternehmen im Lager der Vereinigung untergebracht wird. Die Größe 2X kann man aus der Formel 2KQ c+2A
herleiten. Wir haben dann P2 =
2X0
^
2 A = 2 * 2ß P
und daraus folgt -
Es läßt sich auch einfach erklären, weshalb in der Formel (8.12) 2A auftritt und nicht L Bekanntlich lagert das Unternehmen den Durchschnittsbestand Z = ^-S ein. Es gilt aber die Beschränkung S < P. Sie besagt, daß das gesamte Los im Lager untergebracht werden muß. Die Bedingung S < P bedeutet also, daß der „zweifache mittlere Bestand" geringer sein muß als P. Ersetzte man die Bedingung S < P durch die Bedingung Z == y S < P, dann hätte man in der Formel (8.12) anstelle von 2A nur A, wovon man sich leicht überzeugen kann. \
§ 5. Der Verbranch des Bestandes erfolgt nicht gleichmäßig in der Zeit Zur weiteren Entwicklung des Problems der Beschaffung und Bestände geben wir jetzt die Voraussetzung auf, daß von dem Unter-
257
§ 5. Der Verbrauch des Bestandes erfolgt nicht gleichmäßig
Die vorliegende Variante des Problems der Beschaffung und Bestände lösen wir so, daß wir die Beschränkung (8.9) vorerst außer /2KQ
acht lassen und die optimale Losgröße nach der Formel So = 1 /
bestimmen. Zeigt es sich, daß S 0 < P, dann gibt es keine Komplikationen, da die Bedingung (8.9) erfüllt ist. Ist aber S 0 > P, dann muß die Beschränkung (8.9) berücksichtigt werden und als optimale Losgröße muß man S = P setzen. Man kann sich vorstellen, daß das Unternehmen zu irgendeiner Vereinigung gehört, die Lager zur Nutzung durch ihre Unternehmen besitzt. In einem solchen Fall könnte man die Größe 2k als Abgabe für eine Bestandseinheit auffassen, die von dem Unternehmen im Lager der Vereinigung untergebracht wird. Die Größe 2X kann man aus der Formel 2KQ c+2A
herleiten. Wir haben dann P2 =
2X0
^
2 A = 2 * 2ß P
und daraus folgt -
Es läßt sich auch einfach erklären, weshalb in der Formel (8.12) 2A auftritt und nicht L Bekanntlich lagert das Unternehmen den Durchschnittsbestand Z = ^-S ein. Es gilt aber die Beschränkung S < P. Sie besagt, daß das gesamte Los im Lager untergebracht werden muß. Die Bedingung S < P bedeutet also, daß der „zweifache mittlere Bestand" geringer sein muß als P. Ersetzte man die Bedingung S < P durch die Bedingung Z == y S < P, dann hätte man in der Formel (8.12) anstelle von 2A nur A, wovon man sich leicht überzeugen kann. \
§ 5. Der Verbranch des Bestandes erfolgt nicht gleichmäßig in der Zeit Zur weiteren Entwicklung des Problems der Beschaffung und Bestände geben wir jetzt die Voraussetzung auf, daß von dem Unter-
258
Kapitel VIII. Optimierung der Beschaffung unter Gewißheit
nehmen der Rohstoff gleichmäßig in der Zeit verbraucht wird. Wir unterstellen statt dessen, daß der Verbrauch des Rohstoffes zum gegebenen Zeitpunkt t durch eine bekannte, ständig positive Funktion q(t) bestimmt wird. Die Funktion q(t) ermöglicht es, den Rohstoffverbrauch für den Zeitraum von irgendeinem Zeitpunkt t0 bis zum Zeitpunkt 11 zu bestimmen. Diese Größe des Verbrauchs ist gleich dem bestimmten Integral \q{t)dt*> 10 Die Höhe des Rohstoffverbrauchs in dem Zeitraum vom Anfang des Jahres (i0 = 0) bis zu irgendeinem Zeitpunkt t bestimmt das Integral 2 ( 0 = J qif)dt. o Das Problem der Beschaffung und Bestände können wir jetzt folgendermaßen formulieren: Zu welchen Zeitpunkten des gegebenen Zeitraumes T = 1 (Jahr) sind die Lose zu beziehen (und welche Größe müssen diese Lose haben), damit die Gesamtkosten der Rohstoffbezüge und Lagerung minimal werden? Wie zuvor unterstellen wir ferner, daß die Lagerkosten je Bestandseinheit während des Jahres, c, und die Kosten für den einmaligen Bezug eines Loses, K, bekannt sind. 6
> Die Funktion q(t) kann man als „Dichtefunktion" des Rohstoffverbrauchs bezeichnen. Sie gibt angenähert den Rohstoffverbrauch je Zeiteinheit in einem beliebig kleinen Zeitraum At an. Zerlegt man das Intervall [/ 0 , M in n Teilintervalle Ati, so ist der Rohstoffverbrauch im Zeitraum [/ 0 , /,] angenähert der Summe
n
2
qi(ti)Ati gleich. Wenn n -* oo und Max. Ati
Grenze, die das bestimmte Integral j
'o
0. dann strebt die Summe zur
q{t)dt ist. Demnach kann das bestimmte
Integral der „Dichtefunktion" des Rohstoffverbrauchs(-bedarfs) als Größe des Rohstoffverbrauchs in dem gegebenen Zeitintervall [/ 0 , /,] interpretiert werden.
§ 5. Der Verbrauch des Bestandes erfolgt nicht gleichmäßig
259
Für die Analyse des Problems stellen wir die Funktion Q(t)=\q(t)dt, o
die den Rohstoffverbrauch in dem Zeitraum vom Zeitpunkt 0 (Anfang des Jahres) bis zum Zeitpunkt t bestimmt, graphisch dar (Zeichnung 8.3). Ihre Abbildung ist eine ansteigende Kurve, da die Funktion Q(t) eine stetig wachsende Funktion ist (q(t) > 0).
Es seien im Verlaufe des Zeitraumes T zu den Zeitpunkten f 0 = 0, tu t2,..., t„_i n Lose bezogen worden. Unbekannte Zeitpunkte tt (i = 1,2, ...,n— 1) gibt es hier nur n— 1, da das erste Los am Anfang des Zeitraumes (t0 = 0) bezogen werden muß. Die Menge des am Anfang des Zeitraumes, d.h. zum Zeitpunkt t0 = 0, bezogenen Rohstoffes muß bis zum Zeitpunkt i, ausreichen, zu dem das zweite Los erworben wird, das bis zum Zeitpunkt t2 ausreichen muß usw. Das zum Zeitpunkt tn_ i bezogene Los muß schließlich bis zum Ende des gegebenen Zeitraumes, d.h. bis zum Zeitpunkt tn= T (1 Jahr), ausreichen. Der zum Zeitpunkt t0 in der Menge ö('i) bezogene Rohstoff wird sukzessive verbraucht und im Zusammenhang damit existiert in dem Zeitraum [i0, i j ein Rohstoff bestand, der der schraffierten Fläche des „Dreiecks" entspricht, das über der Abbildung der Funktion Q(t) im Intervall [i0, liegt (Zeichnung 8.3). Die Größe der Fläche
260
Kapitel VIII. Optimierung der Beschaffung unter Gewißheit
dieses „Dreiecks" und damit die Größe des Bestandes im Zeitraum [t0, f,] beträgt:7> ? [Q{h)-Q{t)]dt. »0 Die Rohstoffbestände in den folgenden Zeiträumen entstehen in gleicher Weise. Allgemein entsprechen also den Beständen die schraffierten Flächen der „Dreiecke", die gleich dem Integral l' m>)-Q(t)]dt
( ¿ = 1 , 2 , ..., « ) ü
sind. Der Gesamtbestand im Zeitraum [i0, i„], also im Zeitraum [0, T], ist gleich der Summe der Flächen aller dieser „Dreiecke". Da in dem Zeitraum 0 bis T n Lose bezogen wurden, deren Gesamtbezugskosten nK und Lagerkosten je Einheit c betragen, werden die Gesamtkosten der Rohstoffbezüge und der Lagerung durch die Formel D = nK+c\\[Q{t1)-Q(t)]dt+ L'o
+
j" [Q(tn)-Q{t)]dt\ +
tn-i ('o = 0, t„=T sind gegeben), bei denen die Gesamt'n
kosten D = Min. Wir stellen fest, daß das Integral j Q(t)dt
(die
lo
'»Das
h
Integral S
'o
h
[ß(i,)-ß(i)]A = C M C i - f o ) - S
Q(ß)dt
drückt folgende
'o
Differenz aus: Fläche unter der horizontalen Linie mit der Ordinate ß('i) minus Fläche unter der die Funktion Q(t) repräsentierenden Kurve, jeweils im Intervall
§ 5. Der Verbrauch des Bestandes erfolgt nicht gleichmäßig
261
Größe der Fläche unter der Kurve ß ( 0 ) eine konstante und gegebene Größe ist. Demnach ist D = Min., wenn der Ausdruck in der eckigen Klammer in der Formel (8.13) den Minimalwert erreicht, also wenn ß('i) O i - f o H ö f o ) fe-'iH ... + ß ( ' „ ) ( W » - i ) = Min. (8.14) Der Ausdruck (8.14) erreicht den Extremwert — im vorliegenden Fall, wie aus dem Problem selbst hervorgeht, das Minimum — , wenn die partiellen Ableitungen dieses Ausdruckes nach t l , t2 , ..., f„_i gleich Null sind. Auf diese Weise erhält man folgendes System von n—1 Gleichungen mit n—l Unbekannten: ö'('i)('i-'o)+ö('i)-ß('2) = 0
Q\h)
{t2 -h)+Q{t2 )-Q{h)
= 0
(8.15.1)
ß U - O (f B -l-*„-2) + e ( ' n - l ) - ö ( ' n ) = 0. Dieses System kann man auch wie folgt schreiben: ö('2)-Ö('i) = ß ' ( ' i ) ( ' i - ' o ) ß f e ) - ß ( < 2 ) = Q'(t2 ) ß('n)-ß(i„-l)
(t2 -h)
(8.15.2)
= ß ' C n - l ) (/„-l-in-2)
oder in vereinfachter Form ß('i+i)-ß(',) =
ß'Ci) ( t i - t i - i )
(i
= 1, 2, . . . , « - 1 ) .
(8.15)
Durch die Lösung des Gleichungssystems (8.15) bestimmt man die Unbekannten tl,t2,...,tn_1, d.h. die Zeitpunkte, zu denen man die Lose des Rohstoffes beziehen muß, damit die Gesamtkosten minimal werden. Wenn man diese Unbekannten kennt, ist es einfach, die Größe der Lose zu bestimmen. Wie aus der Zeichnung 8.3 tatsächlich hervorgeht, muß die Größe des zum Zeitpunkt t = 0 bezogenen t\
Loses ß(ij) = J q(t)dt betragen. Das zum Zeitpunkt i t bezogene o Los muß die Größe Q(t2 )—ß(ii) haben, zum Zeitpunkt t2 \ ß ( ' 3 ) - ß ( ' 2 ) usw. Wir erkennen, daß sich die Bestimmung des optimalen Programms der Rohstoffbezüge auf die Festlegung der Zeitpunkte reduziert, zu 18 Lange, Optimale Entscheidungen
262
Kapitel VIII. Optimierung der Beschaffung unter Gewißheit
denen die einzelnen Lose zu beziehen sind, denn schon dadurch wird die Größe der einzelnen Lose bestimmt. Das Problem lösten wir unter der Voraussetzung, daß 1. die Anzahl der während des Jahres erworbenen Lose n von vornherein festgelegt ist und 2. die Dichtefunktion der Verteilung des Rohstoffverbrauchs (-bedarfs) in der Zeit, q(t), bekannt ist. Was die erste Voraussetzung betrifft, so wird die Anzahl n durch die technischen Bedingungen des Rohstoffbezugs festgelegt. So mag man beispielsweise Bestellungen nicht häufiger als einmal im Monat aufgeben können, also zwölfmal im Verlaufe des Jahres. Eine gewisse Orientierung für die optimale Anzahl von Rohstoffbezügen kann Kn+cF(n), folgende Überlegung geben. Die Gesamtkosten sind D = wobei Kn die Bezugskosten der Lose und cF(n) die Lagerkosten darstellen. Die Funktion F(n) bedeutet hier die durchschnittliche Bestandshöhe, die von der Anzahl der getätigten Bestellungen n abhängt. Die Gesamtkosten D erreichen ihr Minimum, wenn D' = K+cF'(n)
= 0, alsQ wenn
F'(n)
=
Hieraus ist zu ersehen, daß die Ableitung der Funktion F{n) negativ ist. Je häufiger folglich Lose bezogen werden, desto geringer sind die Durchschnittsbestände und damit auch die Lagerkosten.8) Aus dieser Bemerkung und aus der Formel D = Kn+cF(n) folgt: Sind die Bezugskosten eines Loses, K, relativ hoch, dann sind in großen Abständen größere Lose des Rohstoffes zu beziehen. Sind hingegen die Lagerkosten relativ hoch, so hat man in geringen Abständen kleinere Lose des Rohstoffes zu erwerben. In der Praxis kann die Lösung der Gleichungen (8.15) Schwierigkeiten bereiten. Man kann dann eine angenäherte Lösung auf graphischem Wege erreichen.9* 8) Das resultiert ebenfalls aus der Zeichnung 8.3, auf der sich die Summe der schraffierten Flächen der „Dreiecke" (also die Höhe des Gesamtbestandes) verringert, wenn n anwächst. 9) Siehe J. Lesourne, Technique économique et gestion industrielle, a.a.O., S. 356.
§ 5. Der Verbrauch des Bestandes erfolgt nicht gleichmäßig
263
Zu diesem Zweck fertigen wir eine Abbildung der Funktion Q(t) an (Zeichnung 8.4). Als Ausgangspunkt wählen wir auf der Abszissenachse einen beliebigen Zeitpunkt des zweiten Bezugs, d.h. einen beliebigen Punkt Der nächste Rohstoffbezug erfolgt zum Zeitpunkt t2, der bereits durch die Bedingungen der Aufgabe bestimmt ist. tut)
/
B Q(t2J-Qlt7J •
0
/
j
ti
fr
,L —aiti
j Qtt2)
t2
Zeichnung 8.4
Um den Zeitpunkt t2 zu bestimmen, zeichnen wir vom Punkt A, der auf der Ordinatenachse in der Höhe ö('i) liegt, die Gerade AL mit dem Anstieg ö ' ( ' i ) ein. Der Zeitpunkt t2 wird dann durch die Abszisse des Punktes der Kurve Q(t) bestimmt, dessen Ordinate gleich der Ordinate des Punktes auf der Geraden AL ist, der die Abszisse t1 hat. Wie aus der Zeichnung 8.4 ersichtlich, ist dann die erste Gleichung des Gleichungssystems (8.15.2), d.h. Q(t2)—Q(ti) = = Q'UiK'i-'o), tatsächlich erfüllt. Gleicherweise verfahren wir bei der graphischen Bestimmung der Zeitpunkte t3, t4 usw. Es kann natürlich vorkommen, daß sich der letzte Punkt t„ nicht mit dem Endpunkt des gegebenen Zeitraumes deckt, also t„ # T. Ist die Differenz bedeutend, dann muß man das beschriebene Verfahren wiederholen und den beliebig gewählten Punkt tl entweder nach links oder nach rechts verschieben. Auf diese Weise gelangen wir zu einer genaueren Lösung der Aufgabe. Die soeben beschriebene graphische Lösungsmethode kann in der Praxis angewendet werden, wenn die Anzahl der bezogenen Lose nicht groß ist und beispielsweise 5 bis 6 beträgt. Interessant ist, daß die graphische Lösung auch dann möglich bleibt, wenn die analy18'
264
Kapitel VIII. Optimierung der Beschaffung unter Gewißheit
tische Form der Funktion q(t) oder Q(t) unbekannt ist. Es reicht aus, den Verlauf der Funktion Q{t) zu kennen, soweit man diesen beispielsweise aus den statistischen Daten des vergangenen Zeitraumes herleiten kann. Abschließend stellen wir die Behauptung auf, daß sich für q(t) = = konst., d.h. bei einem gleichmäßigen Rohstoffverbrauch in der Zeit, die in diesem Paragraphen ermittelte Lösung des allgemeinen Problems der Beschaffung und Bestände auf die im Paragraphen 3 erhaltenen Ergebnisse reduziert; es stimmen nämlich sowohl die Losgrößen als auch die Zeitabstände zwischen den einzelnen Bezügen der Lose überein. Für q{t) = k = konst. haben wir Q(t) = J q(t)dt = j kdt = kt. o o Die Abbildung der Funktion Q(t) ist also eine gerade Linie, die durch den Ursprung des Koordinatensystems führt (Zeichnung 8.5) und einen Anstieg gleich k hat. In diesem Fall ist Q'(t) = k. Gill*
Zeichnung 8.5
Das Gleichungssystem (8.15.2) hat dann folgende Form: ktz—ktx =
10)
kt3—kt2 =
k(t2—ti)
Daraus resultiert, daß t i ~ t i — t! tQ t3—12 = t1—ti
§ 5. Der Verbrauch des Bestandes erfolgt nicht gleichmäßig
265
also sind die Abstände zwischen den Zeitpunkten für den Bezug der einzelnen Lose gleich. Folglich stimmen auch die Größen der erworbenen Lose überein. Bei einem gleichmäßigen Rohstoffverbrauch müssen also die Bezüge in gleichen Zeitabständen geplant werden. Wir erhielten auf diese Weise das oben ermittelte spezielle Ergebnis auf der Grundlage wesentlich allgemeinerer Betrachtungen.
K a p i t e l IX
Dynamische Optimierung der Beschaffung und Bestände unter Ungewißheit § 1. Die Wahrscheinlichkeit, daß die Bestandsreserve nicht ausreicht, ist eine vorgegebene Größe — Normalverteilung der Wahrscheinlichkeit des Bedarfs Im vorhergehenden Kapitel unterstellten wir, daß die Größe ß , d.h. der Rohstoffverbrauch im Zeitraum T (beispielsweise in einem Jahr), bekannt und bestimmt ist. Wir nehmen jetzt an, daß die Größe des Rohstoffbedarfs für den gesamten Planungszeitraum und zu jedem Zeitpunkt dieser Periode eine Zufallsgröße mit bekannter Wahrscheinlichkeitsverteilung ist.1) Ließe das Unternehmen diesen Umstand außer acht und würde es in der Praxis die im vorhergehenden Kapitel dargelegte Theorie der Beschaffung und Bestände anwenden, dann könnte der Rohstoffbedarf zu bestimmten Zeitpunkten größer sein als der Bestand. Wir unterstellen, daß der erwartete Rohstoffverbrauch im gegebenen Jahr Q beträgt. Wenn der Rohstoff im Verlaufe des Jahres n-mal in gleichen Mengen bezogen wird, dann beträgt die Größe der einzelnen Lose S = —. n
Da aber der Rohstoffverbrauch eine Zufallsgröße ist, gebietet der gesunde Menschenverstand, zur Deckung eines eventuellen Roh11
Wir nennen eine Veränderliche (im vorliegenden Fall den Rohstoffbedarf) eine Zufallsgröße, wenn ihr Wert durch zufällige Ereignisse bestimmt wird. Jedem Wert der Zufallsgröße ist eine bestimmte Wahrscheinlichkeit zugeordnet (oder eine Wahrscheinlichkeitsdichte, wenn die Zufallsgröße stetig ist). Diese Zuordnung bezeichnen wir als Wahrscheinlichkeitsverteilung der gegebenen Zufallsgröße. Die Funktion, die diese Zuordnung ausdrückt, bezeichnen wir als Wahrscheinlichkeitsfunktion (oder Wahrscheinlichkeitsdichte).
§ 1. Normalverteilung der Wahrscheinlichkeit des Bedarfs
267
stoffverbrauchs, der den erwarteten Bedarf überschreitet, einen zusätzlichen Bestand zu halten. Einen solchen zusätzlichen Bestand bezeichnen wir als Reserve. Das Unternehmen geht dann auf folgende Art und V/eise vor. Vor allem schafft es die Reserve R in der im voraus festgelegten Höhe, und danach tätigt es die aufeinanderfolgenden Rohstoffbestellungen. Wenn zu einem gewissen Zeitpunkt der gesamte Rohstoffbestand bis auf die Höhe der Reserve absinkt, dann bezieht es sofort ein neues Los. Soll bei dieser Berechnung die notwendige Bezugszeit berücksichtigt werden, dann m u ß die Bestellung etwas früher aufgegeben werden, nämlich dann, wenn der Gesamtbestand auf das Niveau R+s gefallen ist. 21 Ein unvorhergesehener Rohstoffbedarf wird aus der Reserve abgedeckt. Die beschriebene Verfahrensweise des Unternehmens illustriert die Zeichnung 9.1. Der mittlere Rohstoffbestand beträgt in diesem Fall Z = ^ - S + R . Aus den Darlegungen folgt, daß das Problem der Beschaffung und Bestände bei ungewissem Rohstoffbedarf auf die Bestimmung einer optimalen Reserve R führt. Wenn das Unternehmen eine sehr hohe Reserve festlegt, dann deckt es natürlich alle zufälligen Überschreia(t)
o\
t,
t2
t3
t4
t
Zeichnung 9.1 2
> Bei derartigen Fällen wird in der Praxis oftmals das Drei-Lager-System angewendet: das große Lager S—s sowie die kleinen Lager s und R. Im ersten, dem Hauptlager, wird S—s untergebracht, im zweiten s und im dritten R. Den Rohstoff entnimmt man zunächst dem ersten Lager. Und wenn dort alles aufgebraucht ist, bestellt man eine neue Rohstoffsendung und entnimmt mittlerweile dem Lager s. Dem Lager R entnimmt man Rohstoff nur, falls der Rohstoffverbrauch den erwarteten Bedarf übersteigt.
268
Kapitel IX. Optimierung der Beschaffung unter Ungewißheit
tungen des erwarteten Rohstoffverbrauchs ab. Die Haltung einer hohen Reserve ist aber mit hohen Lagerkosten verbunden. Aus diesen Gründen stützt sich die Kalkulation in der Praxis auf eine im voraus festgelegte Wahrscheinlichkeit, mit der der tatsächliche Rohstoffbedarf die vorhandene Reserve nicht überschreiten soll. Diese Wahrscheinlichkeit entspricht dem Konfidenzkoeffizienten. Seine Höhe beträgt beispielsweise 95 Prozent oder 99 Prozent. Anstelle des Konfidenzkoeffizienten kann man auch von der Wahrscheinlichkeit des entgegengesetzten Ereignisses ausgehen. Man benutzt dann den sogenannten Risikokoeffizienten, der entsprechend 5 Prozent oder 1 Prozent beträgt. Der Risikokoeffizient drückt die Wahrscheinlichkeit aus, daß die Reserve zur Deckung eines erhöhten Rohstoffbedarfs nicht ausreicht.3) Nach dieser Einführung kann man das Problem folgendermaßen formulieren: Mit V bezeichnet man die Höhe des tatsächlichen Rohstoffbedarfs im Zeitraum zwischen zwei aufeinanderfolgenden Rohstoffbezügen. S bedeutet wie zuvor die Größe des bezogenen Loses. Es ist nun die Größe der Reserve R zu bestimmen. Dabei soll die Wahrscheinlichkeit P (das Risiko), daß sich die Reserve als unzureichend erweist, gleich einer vorgegebenen Größe p (z.B. p = 0,01) sein. Die Reserve muß also so hoch sein, daß der Wert der Zufallsgröße V (also der tatsächliche Rohstoffverbrauch) die Summe S+R (bezogene Rohstoffmenge und Reserve) nur mit der Wahrscheinlichkeit p überschreitet.4) 3 > Diese Verfahrensweise ist der statistischen Prüfung von Hypothesen analog. Ein Konfidenzkoeffizient beispielsweise von 99 Prozent besagt dann, daß die Wahrscheinlichkeit für die Richtigkeit der geprüften Hypothese 0,99 beträgt und die Wahrscheinlichkeit, daß sich die Hypothese als falsch erweist, gleich 0,01 ist. [Die letztere Wahrscheinlichkeit bezeichnet man oft als Signifikanzniveau.] 4 > Wir unterstellen, daß die Wahrscheinlichkeitsverteilung der Zufallsgröße V in allen Zeiträumen zwischen den Bezügen gleich ist. Das Problem würde komplizierter werden, wenn die Verteilung in den verschiedenen Zeiträumen unterschiedlich wäre und beispielsweise im Zeitraum einer Produktionssteigerung größere Abweichungen aufwiese, [p ist also jene Wahrscheinlichkeit des Risikos einer Bestandsüberschreitung durch zu hohen Verbrauch, die das Unternehmen bereit ist, in Kauf zu nehmen.]
§ 1. Normal Verteilung der Wahrscheinlichkeit des Bedarfs
269
In der mathematischen Ausdrucksweise kann man diese Bedingung wie folgt schreiben: P{V > S+R} = p oder P{V-S
>R}
= p.
(9.1)
Um aus der Bedingung (9.1) R bestimmen zu können, muß man die Verteilung der Zufallsgröße V kennen. Am einfachsten ist es, zu unterstellen, daß die Zufallsgröße V normalverteilt ist. Bei dieser Verteilung ist der Erwartungswert (die mathematische Erwartung) der Zufallsgröße V gleich S, da (wie bekannt) S =
und Q der
erwartete Gesamtrohstoffverbrauch ist. Die Varianz der Zufallsgröße bezeichnen wir mit a 2 . Die genannten Voraussetzungen beziehen wir in die Charakterisierung der Dichtefunktion ein, indem wir P(V) = N(S, a2) schreiben. Dabei ist P(V) die Dichtefunktion für die Wahrscheinlichkeit der Zufallsgröße V und N(S, a2) ist das Symbol der Normalverteilung mit dem Erwartungswert S und der Varianz er2. Aus der Wahrscheinlichkeitsrechnung wissen wir, daß die Normalverteilung einer Zufallsgröße bestimmt ist, wenn ihr Erwartungswert, der im gegebenen Beispiel S beträgt, und ihre Varianz ff2 gegeben sind. Die Dichtefunktion der Wahrscheinlichkeit wird dann durch die Formel P{V) = -^—e R (d.h. dem Ereignis, daß die Reserve nicht ausreicht) die Wahrscheinlichkeit p entspricht.
270
Kapitel IX. Optimierung der Beschaffung unter Ungewißheit
W e n n wir anstelle der ursprünglichen Zufallsgröße V die normierte Zufallsgröße 5 > u -•-
V-S CT
einführen, dann nimmt die Formel (9.2) die vereinfachte F o r m (9.3)
y 2n
an. Es geht darum, einen solchen Wert der normierten Zufallsgröße V—S up = — - — zu bestimmen, der von der Wahrscheinlichkeit p abhängt und für den folgende Gleichung gilt: 11
~f "p
- 2-
2 d u
=
p
-
(9
-4)
D i e graphische Lösung der Gleichung (9.4) besteht in der Bestimm u n g eines solchen Wertes der normierten Zufallsgröße up, für den
5
> Die Normierung einer Verteilung besteht allgemein in einer linearen Transfor-
mation der Zufallsgröße X, indem Z = ^
^ gesetzt wird. Die normierte Zuo fallsgröße Z gewinnt man also aus der ursprünglichen Zufallsgröße X, indem von dieser der Erwartungswert fi abgezogen wird und die Differenz in Einheiten der Standardabweichung (mittleren quadratischen Abweichung) ausgedrückt wird. [Dabei wird der Erwartungswert der normierten Zufallsgröße zu Null und ihre Streuung gleich eins. Die normierte Normalverteilung wird auch als standardisierte Normalverteilung bezeichnet.]
271
§ 1. Normalverteilung der Wahrscheinlichkeit des Bedarfs
die schraffierte „Fläche unter der Kurve der Normalverteilung" im Intervall von up bis oo gleich p ist (Zeichnung 9.2). In der Praxis entnehmen wir die Werte up aus Tabellen der Normalverteilung. So erhalten wir beispielsweise für p — 0,05 ein V—S
up = 1,64 und für p = 0,01 ein up = 2,33. Kennt man u„ = —-—, so kann man die Reserve R sofort bestimmen. Annahmegemäß muß die Reserve R nämlich so hoch sein, daß ein Rohstoffdefizit, d.h. V—S>R, V—S
nur mit der Wahrscheinlichkeit p eintritt. Es ist d a n n — - — > up. Daraus resultiert, daß die Reserve, die dem Risikokoeffizienten p entspricht, mindestens R = V—S — upa betragen muß. Wir erhalten also R = upa. (9.5) Setzen wir beispielsweise p — 0,05, dann ist R = l,64). Darüber hinaus ist die Höhe der Reserve proportional zur Standardabweichung a, also zur Schwankung des Rohstoffbedarfs. Die Größe a ist aus der Erfahrung bekannt. Sie kann auf der Grundlage der Bedarfsschwankungen in den voraufgegangenen Zeiträumen unter Berücksichtigung von Veränderungen, die im gegenwärtigen Zeitraum eintreten können, abgeschätzt werden.6) *' Vgl. Fußnote 4 dieses Paragraphen. Diese Art der Reservebestimmung wird seit langem im Versicherungswesen angewendet, insbesondere bei Sachversicherungen. Im Versicherungswesen unterscheidet man die Entschädigungsreserve, die gleich dem Erwartungswert (der mathematischen Erwartung) des Totalschadens ist und die Schwankungsreserve. Die letzte dient bei ungünstigem Schadensverlauf zur Abdeckung einer möglichen Auszahlung über ihren Erwartungswert. Vgl. W. Saxer, Versicherungsmathematik, Bd. II, Springer Verlag, Berlin 1958, S. 98—100; H. Galbrun, Théorie mathématique des assurances, Paris 1947, S. 143—148; A. Banasinski, Matematyka ubezpieczeniowa (Versicherungsmathematik), 2. Ausgabe, PWE, Warszawa 1955, S. 89—97. 6)
272
Kapitel IX. Optimierung der Beschaffung unter Ungewißheit
Wir gehen jetzt zur Bestimmung der optimalen Losgröße des Rohstoffbezugs über. Dabei verwenden wir dieselben Bezeichnungen wie im vorhergehenden Kapitel mit dem Unterschied, daß Q jetzt den erwarteten Rohstoffverbrauch im Verlaufe des Zeitraumes T (1 Jahr) bedeutet. Die Gesamtkosten des Bezugs von n Losen (n = - y j und der Lagerung betragen
Diese Kosten erreichen das Minimum, wenn dS
S2
+
2
•
Wir erhalten daher das gleiche Ergebnis wie im vorigen Kapitel, nämlich
-V
2QK
c
Folglich hat die Höhe der Reserve keinen Einfluß auf die Losgröße S. Die Reserve ist im Verhältnis zur Losgröße konstant und hängt lediglich von dem der Kalkulation zugrunde gelegten Risikokoeffizienten und von der Schwankung des Rohstoffbedarfs, also von a, ab. Der mittlere Bestand, der aus dem Bezug optimaler Lose resultiert, ist -2 = Vl /2c^ Der optimale Bestand einschließlich der Reserve beträgt also
Aus diesen Betrachtungen geht hervor, daß unter den eingangs genannten Voraussetzungen (die Zufallsgröße V ist in sämtlichen Zeiträumen zwischen aufeinanderfolgenden Bezügen stets normalverteilt) sowohl die Größe der optimalen Lose als auch die Zeitabstände der Rohstoffbezüge gleich sind. Das Ergebnis ist also
§ 2. Poisson-Verteilung
273
identisch mit dem der Optimierung der Beschaffung und Bestände unter Gewißheit. Die Situation gestaltete sich anders, wenn die Wahrscheinlichkeitsverteilungen der Zufallsgröße V in den verschiedenen Zeiträumen voneinander abwichen, wenn also beispielsweise saisonale Bedarfsschwankungen vorhanden wären. § 2. Die Wahrscheinlichkeitsverteilung des Bedarfs ist eine Poisson-Verteilung Das von uns untersuchte Problem kann weiterentwickelt werden. So kann man beispielsweise planen, daß der Grad des Risikos, auf dem die Kalkulation der Reserve aufbaut, in den einzelnen Quartalen eines Jahres verschieden ist. Des weiteren kann man annehmen, daß die Wahrscheinlichkeitsverteilung des Rohstoffbedarfs keine Normalverteilung ist usw. Besonders interessant ist der Fall, bei dem die Wahrscheinlichkeitsverteilung des Rohstoffbedarfs eine Poisson-Verteilung ist.7) Es zeigt sich, daß die Höhe der Reserve dann nicht mehr unabhängig von der Losgröße des bezogenen Rohstoffes ist, so wie das bei der Normalverteilung der Fall war. Wenn die Zufallsgröße V eine Poisson-Verteilung hat, dann wird die Wahrscheinlichkeit des tatsächlichen Bedarfs durch die Formel W
e-s.sv = -LTi—
(9.7)
7 > Eine Poisson-Verteilung liegt vor, wenn die Proben (Ereignisse) unabhängig sind und die Wahrscheinlichkeit für den Eiutritt des untersuchten Ereignisses sehr klein ist. Im vorliegenden Fall müssen also die Faktoren, die eine Abweichung der Bedarfshöhe vom erwarteten Wert bewirken, sehr selten auftreten, aber die Anzahl dieser Faktoren groß sein, so daß der Erwartungswert der Anzahl der untersuchten Ereignisse einen endlichen konstanten Wert (im Beispiel S = Losgröße) besitzt. Die Poisson-Verteilung wendete für praktische Zwecke als erster der bekannte Statistiker Wladyslaw Bortkiewicz an (Vgl. Bortkiewicz, Das Gesetz der kleinen Zahlen, Leipzig 1898). Die Poisson-Verteilung findet eine breite Anwendung in der Kernphysik, in der Technik und in anderen Wissenschaften.
§ 2. Poisson-Verteilung
273
identisch mit dem der Optimierung der Beschaffung und Bestände unter Gewißheit. Die Situation gestaltete sich anders, wenn die Wahrscheinlichkeitsverteilungen der Zufallsgröße V in den verschiedenen Zeiträumen voneinander abwichen, wenn also beispielsweise saisonale Bedarfsschwankungen vorhanden wären. § 2. Die Wahrscheinlichkeitsverteilung des Bedarfs ist eine Poisson-Verteilung Das von uns untersuchte Problem kann weiterentwickelt werden. So kann man beispielsweise planen, daß der Grad des Risikos, auf dem die Kalkulation der Reserve aufbaut, in den einzelnen Quartalen eines Jahres verschieden ist. Des weiteren kann man annehmen, daß die Wahrscheinlichkeitsverteilung des Rohstoffbedarfs keine Normalverteilung ist usw. Besonders interessant ist der Fall, bei dem die Wahrscheinlichkeitsverteilung des Rohstoffbedarfs eine Poisson-Verteilung ist.7) Es zeigt sich, daß die Höhe der Reserve dann nicht mehr unabhängig von der Losgröße des bezogenen Rohstoffes ist, so wie das bei der Normalverteilung der Fall war. Wenn die Zufallsgröße V eine Poisson-Verteilung hat, dann wird die Wahrscheinlichkeit des tatsächlichen Bedarfs durch die Formel W
e-s.sv = -LTi—
(9.7)
7 > Eine Poisson-Verteilung liegt vor, wenn die Proben (Ereignisse) unabhängig sind und die Wahrscheinlichkeit für den Eiutritt des untersuchten Ereignisses sehr klein ist. Im vorliegenden Fall müssen also die Faktoren, die eine Abweichung der Bedarfshöhe vom erwarteten Wert bewirken, sehr selten auftreten, aber die Anzahl dieser Faktoren groß sein, so daß der Erwartungswert der Anzahl der untersuchten Ereignisse einen endlichen konstanten Wert (im Beispiel S = Losgröße) besitzt. Die Poisson-Verteilung wendete für praktische Zwecke als erster der bekannte Statistiker Wladyslaw Bortkiewicz an (Vgl. Bortkiewicz, Das Gesetz der kleinen Zahlen, Leipzig 1898). Die Poisson-Verteilung findet eine breite Anwendung in der Kernphysik, in der Technik und in anderen Wissenschaften.
274
Kapitel IX. Optimierung der Beschaffung unter Ungewißheit
ausgedrückt, wobei weiterhin der Erwartungswert der Zufallsgröße V gleich S ist. Es ist bekannt,*' daß dann, wenn S oo, die Poisson-Verteilung zur speziellen Normalverteilung strebt, deren Erwartungswert S und deren a = j/^Sist. Demnach gilt, wenn S -y oo, (V-Sp y
g
und die normierte Zufallsgröße hat die Form u = ———. Die Reserve ist also R = upa = up ]/S. Die Gesamtkosten des Rohstoffbezugs und der Lagerung kann man durch die Formel
ausdrücken. Wir sehen also, daß in diesem Fall die Höhe der Reserve, R, und die Losgröße des Rohstoffbezugs, S, miteinander verbunden sind; denn a und damit auch die Reserve hängen von der optimalen Losgröße ab. Um die optimale Losgröße zu bestimmen, muß man die Ableitung berechnen und gleich Null setzen: dD dS
=
KQ
c_
cup
_
n
Durch die Lösung dieser Gleichung (die nicht einfach ist, da sie eine Gleichung 4. Grades in S ist) bestimmen wir die optimale Losgröße der Rohstoffbezüge. § 3. Die Wahrscheinlichkeitsverteilung des Bedarfs ist „rechteckig" (gleichmäßig) Wir fassen die bisher erhaltenen Ergebnisse zusammen. Falls die Wahrscheinlichkeitsverteilung des möglichen Rohstoffbedarfs normal Vgl. u.a.L. Schmetterer, Einführung in die mathematische Statistik, Wien 1956, S. 102.
274
Kapitel IX. Optimierung der Beschaffung unter Ungewißheit
ausgedrückt, wobei weiterhin der Erwartungswert der Zufallsgröße V gleich S ist. Es ist bekannt,*' daß dann, wenn S oo, die Poisson-Verteilung zur speziellen Normalverteilung strebt, deren Erwartungswert S und deren a = j/^Sist. Demnach gilt, wenn S -y oo, (V-Sp y
g
und die normierte Zufallsgröße hat die Form u = ———. Die Reserve ist also R = upa = up ]/S. Die Gesamtkosten des Rohstoffbezugs und der Lagerung kann man durch die Formel
ausdrücken. Wir sehen also, daß in diesem Fall die Höhe der Reserve, R, und die Losgröße des Rohstoffbezugs, S, miteinander verbunden sind; denn a und damit auch die Reserve hängen von der optimalen Losgröße ab. Um die optimale Losgröße zu bestimmen, muß man die Ableitung berechnen und gleich Null setzen: dD dS
=
KQ
c_
cup
_
n
Durch die Lösung dieser Gleichung (die nicht einfach ist, da sie eine Gleichung 4. Grades in S ist) bestimmen wir die optimale Losgröße der Rohstoffbezüge. § 3. Die Wahrscheinlichkeitsverteilung des Bedarfs ist „rechteckig" (gleichmäßig) Wir fassen die bisher erhaltenen Ergebnisse zusammen. Falls die Wahrscheinlichkeitsverteilung des möglichen Rohstoffbedarfs normal Vgl. u.a.L. Schmetterer, Einführung in die mathematische Statistik, Wien 1956, S. 102.
§ 3. „Rechteckige" (gleichmäßige) Verteilung
275
ist, sind die optimale Losgröße für den Rohstoffbezug S und die Reserve R voneinander unabhängig. Die Höhe der Rohstoffreserve wird auf der Grundlage der obigen Betrachtungen bei gegebenem Risikokoeffizienten p in Naturaleinheiten bestimmt. Sie hängt weder von den Bezugskosten eines Loses noch von den Lagerkosten je Einheit ab — im Gegensatz zur optimalen Losgröße für den Rohstoffbezug, die von diesen Parametern abhängig ist. Anders stellt sich die Situation dar, wenn die Wahrscheinlichkeitsverteilung des Bedarfs eine Poisson-Verteilung ist. In diesem Fall sind die Höhe der Reserve und die optimale Losgröße voneinander abhängig. Wir untersuchen noch ein anderes Beispiel von großer praktischer Bedeutung. In diesem Fall weist der Bedarf eine sogenannte „rechteckige", also „gleichmäßige" Verteilung auf. Die rechteckige Wahrscheinlichkeitsverteilung der Zufallsgröße V wird dadurch charakterisiert, daß ein niedrigster und ein höchster Wert der Zufallsgröße V existieren. Diese Grenzen, die wir entsprechend mit F Mln . und FMax. bezeichnen, überschreitet die Zufallsgröße nicht, und innerhalb dieser Grenzen ist die Wahrscheinlichkeitsdichte konstant, also P{V) = konst. (Zeichnung 9.3). Die Dichte dieser Wahrscheinlichkeit kann man leicht bestimmen, wenn wir berücksichtigen, daß die „Fläche unter der Kurve" der Wahrscheinlichkeitsdichte (also die Fläche des ganzen Rechtecks auf der Zeichnung 9.3) gleich eins ist. Wir haben demnach P(V) (FMax.—FMin.) = 1 und daraus folgt 1 (9.8) P(V) ist also gleich dem Kehrwert der „Spannweite" der Veränderlichen V. Aus der Zeichnung 9.3 ist ersichtlich, daß R= ist. Daraus erhalten wir:
Vp-S
(9.9)
276
Kapitel IX. Optimierung der Beschaffung unter Ungewißheit
Wenn beispielsweise p = 0,01, dann ist R = 0,49(F M a x - —V^), Aus der Formel (9.9) resultiert, daß bei gleichmäßiger Wahrscheinlichkeitsverteilung des Bedarfs die Höhe der Reserve proportional zur Spannweite zwischen dem höchsten und dem niedrigsten möglichen Bedarf ist.
R
%VmaxV
Zeichnung 9.3
Die Formel (9.9), die die Höhe der Reserve bei einer gleichmäßigen Wahrscheinlichkeitsverteilung des Bedarfs bestimmt, ist dem Ergebnis, das wir bei Normalverteilung erhielten, in der Hinsicht analog, daß hier wie dort die Höhe der Reserve von der optimalen Losgröße für den Rohstoffbezug unabhängig ist. Bei gleichmäßiger Verteilung betragen die Gesamtkosten für den Rohstoffbezug und die Lagerung
Diese Kosten erreichen ihr Minimum, wenn dD _ dS
KQ
, c _
S2 ^ 2
n
'
und demnach ist die optimale Losgröße für den Rohstoffbezug wie im Falle der Normalverteilung gleich /2KQ
=v-
Die Größe der Reserve R ist ebenfalls von der Höhe der Lager-
§ 3. „Rechteckige" (gleichmäßige) Verteilung
277
kosten je Einheit unabhängig. Zweifellos müssen aber die Lagerkosten einen gewissen Einflüß auf die Handlungsweise des Unternehmens bei der Reservebildung ausüben. Sind die Lagerkosten hoch, dann müßte man erwarten, daß das Unternehmen den Konfidenzbereich verringert und damit den vertretbaren Risikokoeffizienten vergrößert, auf den sich die Kalkulation der Reserve stützt, und das hat natürlich einen Einfluß auf den Umfang der Reserve. Deshalb ist es unrealistisch, konstante Risikokoeffizienten zu unterstellen. Es ist folglich notwendig, ökonomische Überlegungen anzustellen, die eine Veränderung des vertretbaren Risikokoeffizienten nach oben oder nach unten begründen. Das ist möglich, wenn es gelingt, die zusätzlichen Kosten zu bestimmen, die aus einer unzureichenden Rohstoffreserve resultieren. Derartige Kosten können durch den Verlust von Kunden und durch Vertragsstrafen entstehen, die das Unternehmen wegen der Nichterfüllung eingegangener Lieferverpflichtungen zahlen muß. Aus unzureichenden Reserven können aber auch gesamtvolkswirtschaftliche Schäden entstehen. So können Verluste beispielsweise dadurch eintreten, daß die Elektroenergieproduktion eines gewissen Zeitraumes für die Planerfüllung nicht ausreicht oder infolge Kohlenmangels die Eisenbahntransporte eingeschränkt werden müssen. Wenn es möglich ist, die Kosten zu bestimmen, die durch eine unzureichende Rohstoffreserve entstehen, dann existiert eine Grundlage für solche ökonomischen Überlegungen und zur Bestimmung der optimalen Höhe des Risikokoeffizienten. Das ist jedoch nicht immer möglich. Würden beispielsweise infolge einer Einschränkung der Arzneimittelproduktion Menschenleben gefährdet, so kann man wohl kaum über die Höhe der mit einer solchen Situation verbundenen Kosten und über die ökonomische Grundlage zur Bestimmung des Risikokoeffizienten sprechen. In solchen Fällen verbleibt nichts anderes, als einen gewissen, möglichst niedrigen Risikokoeffizienten zu vereinbaren. Mit der Bestimmung der Höhe des Risikokoeffizienten in Abhängigkeit von gewissen ökonomischen Prämissen beschäftigen wir uns im folgenden Paragraphen. 19 Lange, Optimale Entscheidungen
278
Kapitel IX. Optimierung der Beschaffung unter Ungewißheit
§ 4. Bestimmung der optimalen Größe des Risikokoeffizienten und der Rohstoffreserve in Abhängigkeit von den Kosten des Defizits und der Bestandshaltung Es mögen nun aus unzureichenden Bestandsreserven gewisse Kosten entstehen, die sich im voraus bestimmen lassen. Diese Kosten bezeichnen wir als Defizitkosten. Die mit dem Rohstoffbezug und der Bestandslagerung (mit der Reserve und ihrem möglichen Defizit) verbundenen Gesamtkosten D betragen dann D=
•-f-+Ci[J?-(F'-5)] > wenn R > V-S
(9.10.1)
• - | + c 2 [ ( F - 5 ) - j q , wenn R < V-S.
(9.10.2)
oder D=
In dieser Formel bedeutet V wie zuvor den tatsächlichen Rohstoffverbrauch im Zeitraum zwischen den aufeinanderfolgenden Bezugsterminen; K ist eine Zufallsgröße, deren Wahrscheinlichkeitsverteilung f(V) bekannt ist. Die ersten beiden Bestandteile auf den rechten Seiten der Formeln (9.10) sind die normalen Kosten für den Bezug und die Lagerung des in Losen bestimmter Größe beschafften Rohstoffes. Mit diesen Kosten haben wir uns in den voraufgehenden Betrachtungen beschäftigt. Die Symbole haben die gleiche Bedeutung wie zuvor mit dem Unterschied, daß Q der Erwartungswert des Rohstoffverbrauchs im Verlaufe des Zeitraumes T = 1 (Jahr) ist. Das Symbol Ci bezeichnet die Lagerkosten je Einheit im Verlaufe des gewählten Zeitraumes (1 Jahr). Der letzte Bestandteil der Formel (9.10.1) oder (9.10.2) gibt die zusätzlichen Kosten an, die aus dem Überschuß oder dem Defizit der Reserve resultieren. Es können zwei Fälle auftreten: 1. Die Reserve ist zu groß (R > V— S), und es entstehen Kosten für die Lagerung des nicht benötigten zusätzlichen Bestandes; diese Kosten betragen cJJ?—(V— S)]; 2. die Reserve ist zu klein (V—S > R), und im Zusammenhang damit entstehen Kosten des Defizits, die gleich c2[(V— S)—Ä] sind, wobei c2 die Kosten je Einheit des Defizits im Verlaufe des ge-
§ 4. Optimale Größe des Risikokoeffizienten
279
wählten Zeitraumes (1 Jahr) sind, die — wie wir unterstellen — im voraus bestimmt werden können. Im ersten Fall werden die Gesamtkosten D durch die Formel (9.10.1) und im zweiten Fall durch die Formel (9.10.2) ausgedrückt. Zur Vereinfachung der weiteren Berechnungen führen wir die neue Zufallsgröße U = V—S ein (sie bestimmt die Größe des Rohstoffdefizits oder -Überschusses). Diese Veränderliche besitzt natürlich die gleiche Wahrscheinlichkeitsverteilung wie die Zufallsgröße V. Wir werden jetzt versuchen, den Erwartungswert (die mathematische Erwartung) der Gesamtkosten zu minimieren. Wir müssen deshalb die Höhe der Reserve und den Wert des Risikokoeffizienten p so bestimmen, daß der Erwartungswert der Gesamtkosten D — wir bezeichnen ihn mit E(D) — minimal wird. Folglich ergibt sich der genannte Erwartungswert mit E{D) =
°
L
f -CO
(R-U)f(U)dU+
+00 $ (U-R)f(U)dU. (9.11) R Die ersten beiden Bestandteile sind von R und p unabhängig, deshalb reicht es aus, die Summe der letzten beiden Bestandteile dieses Ausdrucks zu untersuchen. Diese Summe, wir bezeichnen sie mit E(D{), ist der Erwartungswert der Lagerkosten für den Überschuß der Reserve und der eventuellen Defizitkosten. Wir haben also 8) R +oo +c2
—oo R Der Erwartungswert E(DX) enthält zwei Bestandteile: der erste entspricht dem Fall U < R und der zweite dem Fall U > R. Die Aufgabe, die Größe der Reserve R zu finden, bei der E(Di) das •> Aus der Wahrscheinlichkeitsrechnung ist bekannt, daß dann, wenn die stetige Zufallsgröße * die Wahrscheinlichkeitsverteilung f(x) hat, der Erwartungswert dieser Veränderlichen E(x) =
+00
5 xf(x)dx ist. Die unendlichen Integrations—oo grenzen kann man durch endliche Grenzen ersetzen, die dem niedrigsten und dem höchsten Wert entsprechen, den die Zufallsgröße erreicht. 19*
280
Kapitel IX. Optimierung der Beschaffung unter Ungewißheit
Minimum erreicht, ist eine gewöhnliche Aufgabe der Differentialrechnung; es ist nämlich £(X>i) = Min., wenn Wir haben 8R
1 •=Ci-4 8R
R
JS
ÖR
— 0 ist.
+00 v{R-U)f{U)dU+c^
i
qr
—oo
J (U—R)f(U)dU
= 0.
R
Daraus folgt, daß E(D{) = Min., wenn R
JL
5 +0
R
°
{R-u)mdu
Cl Cl
(9.13)
Es zeigt sich, daß die Bedingung (9.13), sogar ohne Berechnung der auftretenden Integrale, einen bestimmten ökonomischen Inhalt besitzt. Das auf der linken Seite der Gleichung (9.13) im Zähler stehende Integral ist die mathematische Erwartung für einen Rohstoffüberschuß, d.h., es entspricht dem Ereignis, daß die Rohstoffreserve zu groß ist. Die Ableitung dieser Größe kann man als den erwarteten Grenzüberschuß bezeichnen. Das im Nenner stehende Integral ist dagegen die mathematische Erwartung des Rohstoffdefizits; es entspricht dem Ereignis, daß die Reserve unzureichend ist. Die Ableitung dieses Integrals bezeichnen wir als erwartetes Grenzdefizit. Die Bedingung (9.13) können wir also wie folgt interpretieren: Optimal ist die Reserve, bei der das Verhältnis des erwarteten Grenzüberschusses zum erwarteten Grenzdefizit gleich dem Verhältnis — ~ ist, wobei Cj die Lagerkosten je Einheit des Bestandes und c2 die Kosten je Einheit des Rohstoffdefizits sind. Es erhebt sich die Frage, woher in der Formel (9.13) das Minuszeichen kommt, wenn sowohl cx > 0 als auch c2 > 0 ist. Das resultiert daraus, daß die Ableitung des im Zähler auf der linken Seite der Formel (9.13) stehenden Integrals positiv ist.Je größer die Reserve R ist, desto größer ist natürlich auch der erwartete Wert des Überschusses. Die Ableitung des Integrals im Nenner dieses
281
§ 4. Optimale Größe des Risikokoeffizienten
Ausdrucks ist dagegen negativ; denn je größer die Reserve R ist, desto geringer ist der erwartete Wert des Defizits. Den hier auftretenden Begriff der erwarteten Grenzgröße (auch als mathematische Grenzerwartung bezeichnet) führte Pierre Massé in seiner Arbeit über Optimierung unter Ungewißheit ein.9) Er beschäftigte sich mit einem speziellen Problem, nämlich mit der Optimierung der Wassernutzung durch Wasserkraftwerke, da die angesammelte Wassermenge für den Antrieb der Turbinen eine Zufallsgröße ist. Massé gelangte zu dem Schluß, daß das Programm optimal ist, wenn die erwarteten Grenzwerte proportional zu den entsprechenden Kosten oder Erträgen sind, je nachdem, wie das Problem formuliert wird. Die Formel (9.13) gibt uns die erste ökonomische Erklärung der Bedingung, die die optimale Bestandsreserve erfüllen muß. Um eine weitere Interpretation dieser Bedingung zu erhalten, formen wir die Formel (9.13) um, indem wir die in ihr auftretenden Integrale berechnen. Zur Berechnung dieser Integrale verwenden wir einen bekannten Satz aus der Analysis, der als Differentiation unter dem Integralzeichen bezeichnet wird. Man kann diesen Satz folgendermaßen formulieren : b
Ist die Funktion 10 ' g(x) = J f(x, y)dy gegeben, wobei a und b a
konstante Größen sind, dann ist die Ableitung dieser Funktion dg(x)
dx
_
f 8f(x,y\dy)
J
a
8x
(9
14)
*' Pierre Massé, Les réserves et la régulation de l'avenir dans la vie économique, Bd. II, Paris 1946, S. 33 ff.; vgl. auch Pierre Massé, Le choix des investissements, Paris 1959, S. 319-327. [Vgl. vom selben Verfasser Risk and the Rate of Interest, in: International Economic Papers, Bd. 2, London 1952, S. 136: „Wir behaupten, daß selbst in dieser ungewissen Welt das menschliche Verhalten noch immer durch ein Maximumprinzip geregelt wird, und wir werden die zu maximierende Funktion ökonomische Erwartung nennen."] 10) Wir bemerken hierzu, daß g(x) die Funktion einer Veränderlichen x ist, die unter dem Integral die Rolle des Parameters erfüllt. Die Veränderliche y verschwindet nach der Berechnung des bestimmten Integrals.
282
Kapitel IX. Optimierung der Beschaffung unter Ungewißheit
d.h., die Ableitung des Integrals erhält man durch Differentiation der Funktion unter dem Integral. Wenn die Integrationsgrenzen a und b von der Veränderlichen x abhängen, also wenn die Funktion die Form g(x)
b(x) 5 f(x, a(x)
=
y)dy
hat, dann hat die Ableitung der Funktion g(x) die Form: b(x) 4M
=
j ^ o(*)
- d y + f [ x , b ( x ) ] ^ - f [ x , a { x ) ] ^ L .
(9.15)
Der angeführte Satz wird im Prinzip für den Fall angewendet, daß a und b endlich sind. Beim „Grenzübergang" muß man nachweisen, daß der Satz auch für unendliche Integrationsgrenzen gilt. Wendet man die Formel (9.15) zur Berechnung der in der Formel (9.13) auftretenden Integrale an, dann erhalten wir n ) R ~
R
R
S {R—U)f{U)dU a
=
] f { U ) d U + { R - R ) = a a
\f(U)dU.
Und da die Formel (9.15) ebenfalls für unendliche Integrationsgrenzen angewendet wird, haben wir demnach R S
R (R—U)f{U)dU
— OO
=
S
—00
f(U)dU.
Die Ableitung des im Nenner der Formel (9.13) auftretenden Integrals errechnen wir analog und erhalten: +oo +00 S R
(U-R)f{U)dU=
11
-
S R
AU)dU.
) Wir stellen fest, daß der dritte Bestandteil auf der rechten Seite der Formel (9.15) im gegebenen Fall gleich Null ist, da die untere Integrationsgrenze nicht von R abhängt; demnach i s t =
0.
§ 4. Optimale Größe des Risikokoeffizienten
283
Dadurch kann man die Bedingung (9.13) in der Form f f(U)dU —
CO
+oo
s
R
f(u)du
iL
(9.16)
Cl
schreiben. 12) Wir stellen fest, daß das im Zähler auf der linken Seite der Formel (9.16) auftretende Integral die Wahrscheinlichkeit ist, daß U < R; es handelt sich also um die Wahrscheinlichkeit für den Bestandsüberschuß. Das Integral im Nenner dieses Ausdrucks ist dagegen die Wahrscheinlichkeit, daß U > R ist, d.h., daß sich die Reserve als unzureichend erweist — das ist der Risikokoeffizient, den wir mit dem Buchstaben p bezeichneten. Demzufolge ist das Integral R
5 f{U)dU gleich 1 - p (Zeichnung 9.4). P(u),
P{U>R}=p
/
/
/ o P{U Unter Ausnutzung der Formel (9.16) kann man die Ableitung von E(D,) folgendermaßen darstellen: 0K
=
5 f(U)dU—c2 J f(U)dU.
-oo
R
Daher haben wir für R = i?optimum
und dieser Ausdruck ist größer als Null; demnach ist tatsächlich E(Dt) = Min
284
Kapitel IX. Optimierung der Beschaffung unter Ungewißheit
So werden die Formeln (9.13) und (9.16) in die Bedingung Cl
"
1 —p
(9.17)
c2
umgeformt. Aus der Formel (9.17) kann man den optimalen Risikokoeffizienten 1 —p berechnen. Aus (9.17) resultiert nämlich, daß c}p-\-c2p = ist und daraus (9.17.1)
Ci+C2
sowie \-p=\
Ci+Cj
= —t— -
(9.17.2)
v
c¡+c2
Auf diese Weise gelangen wir zu folgendem interessanten Schluß: Existieren bei dem Problem der Beschaffung und Bestände bestimmte Lagerkosten cl für den Reserveüberschuß und bestimmte Kosten c2 für das Reservedefizit, dann muß die optimale Reserve so hoch sein, daß die Wahrscheinlichkeit des Defizits, also der Risikokoefiizient, C1+C2
und der Konfidenzkoefñzient 1 —p = —^— ist. Cl+Cj
Interessant ist der Vergleich der Größe dieser Risikokoeffizienten mit den in der mathematischen Statistik traditionell üblichen von 0,01 oder 0,05. In der früheren statistischen Literatur, vor R. A. Fisher, hat man noch kleinere Risikokoelfizienten benutzt. Damals verwendete man nämlich am häufigsten die sog. „3) • (rM«.-rMiD.) bestimmt. Setzen wir beispielsweise den RisikokoeflBzienten mit P = \
an, dann ist R = -i- (F M „.—F MJn .). Die optimale Reserve
beträgt also ~ der Spannweite zwischen dem höchsten und dem niedrigsten erwarteten Rohstoffverbrauch. Damit schließen wir die Darlegung der Theorie der Beschaffung und Bestände unter Ungewißheit ab. Man kann sie noch weiterentwickeln und bereichern, indem man die bisherigen Annahmen abwandelt. So kann man beispielsweise die in diesem Kapitel erörterte Methode auf den Fall anwenden, bei dem die Funktion der Bezüge eine bestimmte Funktion der Zeit ist, so daß wir die Höhe der Reserve auch für jeden Zeitpunkt bestimmt erhalten. Es zeigt sich aber — und das kann man sich auch intuitiv klarmachen — , daß dann, wenn die Wahrscheinlichkeitsverteilung immer die gleiche ist, auch die Reserve immer gleich sein wird. Die Größe der Reserve
§ 4. Optimale Größe des Risikokoeffizienten
287
unterliegt nur dann einer Veränderung, wenn sich die Wahrscheinlichkeitsverteilung in der Zeit verändert. Die grundlegenden Begriffe und Methoden, die in der Theorie der Beschaffung und Bestände unter Ungewißheit angewendet werden, wurden in diesem Kapitel dargestellt —• die weitere Entwicklung dieser Theorie würde hauptsächlich in ihrer Anwendung auf konkrete Fälle bestehen.
Kapitel X
Dynamische Optimierung der Produktion unter Gewißheit § 1. Bestimmung des optimalen Produktionsablaufs in der Zeit mit Hilfe der Variationsrechnung Wir beschäftigen uns jetzt mit dem Problem der dynamischen Optimierung der Produktionshöhe, die zur Deckung des sich in der Zeit verändernden Bedarfs dient. Wir unterstellen vorerst, daß der Bedarf mit Sicherheit bekannt ist, und danach, daß nur die Wahrscheinlichkeitsverteilung des Bedarfs gegeben ist. Das Problem der Bestände tritt hier ebenfalls auf, aber als abgeleitetes Problem. Der Bestand vergrößert oder verringert sich nämlich in Abhängigkeit davon, wie Produktion und Bedarf verlaufen. Der Optimierungszeitraum — wir bezeichnen ihn als Planungszeitraum — möge gleich T (beispielsweise 1 Jahr, 5 Jahre usw.) sein. Ferner sei der Bedarf zu jedem Zeitpunkt t dieses Optimierungszeitraumes bekannt und gleich v(t) ^ 0. Die Produktionshöhe sei zu jedem Zeitpunkt der Periode T durch eine nichtnegative Funktion x(t) bestimmt, die wir als Funktion des Produktionsablaufes in der Zeit oder einfach als Produktionsplan bezeichnen. Im Zeitraum T vergrößert oder verringert sich der zuvor gebildete Bestand. Ist x(t) > v(t), dann existiert zum Zeitpunkt t ein Überschuß der Produktion über den Bedarf, der zum vorhandenen Bestand hinzutritt. Ist hingegen x(t) < v(t), dann verringert sich der Bestand zum Zeitpunkt t um die Differenz v(t)—x(t). Wir unterstellen, daß der Bestand zu keinem Zeitpunkt kleiner als Null sein darf.
§ 1. Optimaler Produktionsablauf in der Zeit—Variationsrechnung
289
Mit V(t) bezeichnen wir weiterhin den Gesamtbedarf für das Erzeugnis vom Anfangszeitpunkt 0 bis zum Zeitpunkt (; wir haben dann V(t) =
o
\v(t)dt.
Gleicherweise bezeichnet X{t) =
o
\x{t)dt
die Gesamtproduktion vom Anfangszeitpunkt 0 bis zum Zeitpunkt t, und Z(0) bezeichnet den Anfangsbestand zum Zeitpunkt t = 0. An Hand dieser Daten kann man die Bestandshöhe für einen beliebigen Zeitpunkt t bestimmen, nämlich Z(i) = X(t)-V(t)+Z(0)
> 0.
Die Zeichnung 10.1.1 stellt den Zuwachs oder die Abnahme des Bestandes im Zeitraum T dar. In dem Zeitintervall, in dem die
Kurve der Funktion x(t) über der Kurve der Funktion v(t) liegt, wird der Bestand erhöht. Liegt umgekehrt die Kurve x(t) unter der Kurve v(t), so wird der zuvor gebildete Bestand verringert. Die Bestandsveränderungen werden durch die schraffierten Flächen auf der Zeichnung 10.1.1 dargestellt. Die Zeichnung 10.1.2 stellt die Bestandshöhe zu einem beliebigen Zeitpunkt t dar. Der Bestand zum Zeitpunkt t ist gleich der Differenz zwischen der Ordinate der Funktion X(t) und der Ordinate der
290
Kapitel X. Optimierung der Produktion unter Gewißheit
Funktion V(t) zuzüglich dem Anfangsbestand Z(O). Zu dem Zeitpunkt, der beispielsweise dem Abszissenwert OA entspricht, ist der Bestand gleich CD zuzüglich dem Anfangsbestand AB. Zu dem Zeitpunkt, der dem Abszissenwert OA' entspricht, beträgt der Bestand -C'D'+A'B' (wobei A'B' = AB). V(t) -X(t)
Ö\
A
A'
t
Zeichnung 10.1.2
Wir unterstellen weiterhin, daß die Lagerkosten je Bestandseinheit (in der Zeiteinheit) c betragen, und daß zu jedem Zeitpunkt t eine bekannte Funktion der Produktionskosten k(t) existiert, die eine Funktion der Produktionshöhe x ist. Es ist demnach k(t) — /[*(/)]; dabei seien / ' ( x ) > 0 und /"(jc) > 0. Diese Bedingungen besagen, daß die Grenzkosten der Produktion positiv sind und ansteigen. Die Bedingung /"(JC) > 0 ist — wie wir uns überzeugen werden — für unsere weiteren Betrachtungen wesentlich. Die Aufgabe der dynamischen Produktionsoptimierung kann man nun wie folgt formulieren: Es ist der Produktionsplan, 15 d.h. die Funktion des Produktionsablaufs in der Zeit x(t), so zu bestimmen, daß die Gesamtkosten der Produktion und Lagerung im Zeitraum T minimal werden. Wir schreiben das folgendermaßen: J > Wir unterstellen hier, daß sich der Grundmittelbestand der Produktion im Planungszeitraum T nicht verändert. Diese Annahme könnte man fallen lassen, wenn in die Produktionskosten der Investitionsaufwand einbezogen würde, der den Grundmittelbestand der Produktion entsprechend den im Programm getroffenen Festlegungen verändert.
§ 1. Optimaler Produktionsablauf in der Zeit—Variationsrechnung
D = \f[x(t)]dt+c o
f [X(t)-V(t)+Z(G)]dt o
= Min.
291
(10.1)
Das erste Integral auf der rechten Seite der Formel (10.1) bezeichnet die Gesamtproduktionskosten im Zeitraum von 0 bis T. Der Ausdruck unter dem zweiten Integral, X(t)—V(t)+Z(0), gibt, wie wir wissen, den Gesamtbestand zum Zeitpunkt t an. Demnach weist das zweite Integral den Gesamtbestand im Zeitraum von 0 bis T aus. Das mit c multiplizierte Integral ergibt die Lagerkosten für den Bestand im Zeitraum T. Das Minimum D bestimmen wir unter der Voraussetzung, daß die folgenden Zusatzbedingungen erfüllt sind: Z(0)>0,
(10.2)
X(t)-V(t)+Z(0)>0,
(10.3)
X(T)-V(T)=
(10.4)
Z(T).
Die Bedingung (10.2) legt fest, daß die Höhe des Anfangsbestandes zum Zeitpunkt t = 0 nicht negativ sein darf. Des weiteren besagt die Bedingung (10.3), daß auch der Bestand zu keinem Zeitpunkt der Periode 0 < t < T negativ sein darf. Damit wird z.B. das Ausborgen oder Kaufen von Fremdprodukt durch das Unternehmen ausgeschlossen. Die Bedingung (10.4) bestimmt schließlich, daß am Ende des Planungszeitraumes, d.h. zum Zeitpunkt T, der Bestand Z(T) betragen soll. Es ist also die Höhe des Endbestandes vorgegeben. Dabei kann der Endbestand Z(T) in beliebiger Höhe vorgegeben sein, er mag beispielsweise 0 oder Z(0) betragen, d.h. soviel wie am Anfang des Planungszeitraumes. Ohne die Bedingungen (10.3) und (10.4), die den Anfangs- und Endbestand festlegen, bliebe das Programm unbestimmt.2) 2) Es läßt sich in unsere Untersuchungen noch ein anderer Faktor einbeziehen. Man kann nämlich die laufenden Produktionskosten auf ihren Anfangswert des Planungszeitraumes diskontieren. Das veränderte aber die gewonnenen Ergebnisse nur unwesentlich. Die Einführung des Diskontfaktors würde die hergeleiteten Formeln nur komplizieren, ohne die grundlegenden Überlegungen und die Schlußfolgerungen zu beeinflussen.
292
Kapitel X. Optimierung der Produktion unter Gewißheit
Die so präzisierte Aufgabe der dynamischen Produktionsoptimierung weicht von den bisher untersuchten Optimierungsproblemen ab. Bei den bisherigen Untersuchungen war nämlich die Zielfunktion, deren Extremwert wir suchten, von gewissen Veränderlichen abhängig, die konkrete Werte annahmen. Jetzt ist die Größe der Zielfunktion, die die Gesamtkosten der Produktion und Lagerung umfaßt, jedoch nicht von den Werten gewisser Veränderlicher (also Zahlen), sondern von einer Funktion x(t) abhängig. Das Problem besteht also in der Bestimmung der optimalen Funktion des Produktionsablaufes in der Zeit. Diese Funktion kann beispielsweise progressiv, degressiv, oszillierend o.ä. sein. Aus der unendlichen Mannigfaltigkeit derartiger Funktionen müssen wir die optimale auswählen, d.h. die, welche die Gesamtkosten D minimiert und darüber hinaus die Zusatzbedingungen (10.2, 3, 4) erfüllt. Es gibt für diese Aufgabe zwei Lösungsmöglichkeiten. Die erste Lösungsmöglichkeit besteht darin, das Problem auf die klassische Aufgabe der Auffindung des Minimums einer Funktion zurückzuführen — sie wird mit Hilfe der Differentialrechnung gelöst. Hierzu ist es notwendig, den stetigen Prozeß der Produktion, des Absatzes und der Bestandsveränderung durch einen stufenförmigen Prozeß zu ersetzen. Man muß den Planungszeitraum T, der beispielsweise 1 Jahr beträgt, in n Perioden unterteilen (beispielsweise in n = 12 Monate oder n = 365 Tage) und folgende Funktion der Gesamtkosten aufstellen: D = "s/WOl+c
V
[X(f)-V(t)+Z(ß)]-
Das Problem reduziert sich dann auf eine gewöhnliche Aufgabe zur Bestimmung des Minimums einer Funktion n Veränderlicher. Es gibt aber auch eine unmittelbare Lösungsmöglichkeit für die Aufgabe der dynamischen Produktionsoptimierung in der Form, wie sie oben formuliert wurde. Dafür benötigen wir die Methoden der Variationsrechnung, die eine gewisse Verallgemeinerung der Differentialrechnung darstellen. Die Variationsrechnung entstand im 18. Jahrhundert, und hatte es sich zur Aufgabe gestellt, Funktionen zu
§ 1. Optimaler Produktionsablauf in der Zeit—Variationsrechnung
293
bestimmen, die bestimmte extremale Bedingungen erfüllen. Die einfachste Aufgabe der Variationsrechnung ist die Bestimmung der kürzesten Linie, die zwei auf der Ebene liegende Punkte miteinander verbindet (in diesem Fall ist das natürlich der Abschnitt der geraden Linie, die durch die beiden Punkte führt) oder die auf irgendeiner anderen Fläche liegen, z.B. auf der Oberfläche einer Kugel; die kürzeste Linie ist dann bekanntlich der diese beiden Punkte verbindende Kreisbogen. Zu den klassischen Aufgaben der Variationsrechnung auf dem Gebiet der Physik gehört die Bestimmung der Kurven des schnellsten Falls, der sogenannten Brachistochronen. Danach ist jene Kurve zu bestimmen, auf der sich ein Massenpunkt unter dem Einfluß der Schwerkraft in der kürzesten Zeit vom Punkt A zum Punkt B bewegt, der niedriger liegt als der Punkt A. Eine der grundlegenden und zugleich einfachsten Aufgaben der Variationsrechnung besteht in der Bestimmung der Funktion X(t), für die das Integral I = J F[X(t), X'(t), t]dt = Min. a
(10.5)
Zu beachten ist, daß die Funktion unter dem Integral F[X{t),X'{t),t] eine Funktion speziellen Typs ist. Sie hängt nämlich unmittelbar von der unabhängigen Veränderlichen t (die beispielsweise die Zeit bezeichnet) und von einer Funktion dieser Veränderlichen, X(t), sowie von deren Ableitung, X'(t), ab. Das bestimmte Integral I hat bekanntlich einen Zahlenwert, der vom Wert der Funktion unter dem Integral und im gegebenen Fall mittelbar von der Funktion X(t) abhängt. Die Veränderliche, deren Zahlenwert nicht vom Wert irgendeiner anderen Veränderlichen (also von einer anderen Zahl) oder anderer Veränderlicher, wenn es mehrere sind, sondern von einer Funktion abhängt, wird als Funktional3) bezeichnet. Die Formel (10.5) bezeich3)
Das Funktional ist eine gewisse Verallgemeinerung des Funktionsbegriffes. Die Funktion kann man folgendermaßen definieren: Gegeben seien zwei Zahlenmengen A und B. Die Funktion ist die Vorschrift (Regel), durch die jeder Zahl 20 Lange, Optimale Entscheidungen
294
Kapitel X. Optimierung der Produktion unter Gewißheit
net demnach ein Funktional speziellen Typs. Die Minimierung eines solchen Funktionais erreicht man analog zur Minimierung der Funktion y = f{x) in der Differentialrechnung. Das Extremum, d.h. Minimum oder Maximum, der Funktion y — f{x) wird folgendermaßen bestimmt: Anstelle des gegebenen Wertes der unabhängigen Veränderlichen x setzen wir den Wert x+dx ein; den neuen Wert der Funktion können wir dann in der Form f{x)+df(x) schreiben. Ist das Differential der Funktion df{x) > 0 oder df{x) < 0, dann hat die Funktion y — f{x) an dieser Stelle kein Extremum. Das Extremum der Funktion existiert im Punkt x nur dann, wenn an dieser Stelle das Differential der Funktion df(x) = 0 ist. Analog verfährt man bei der Extremwertbestimmung (Maximum oder Minimum) für das Funktional. Jedoch ersetzen wir jetzt nicht die unabhängige Veränderliche durch den um einen gewissen Zuwachs erhöhten Wert, sondern die Funktion X(t) durch die veränderte Funktion X(t)+dX(t). Der Ausdruck dX(t) wird als Variation der Funktion X{t) bezeichnet. Vergrößert man die Funktion X(t) um ihre Variation 0 oder dl < 0, dann hat das Integral I kein Extremum. Das Integral / hat hingegen ein Extremum, wenn dl = 0, also wenn die „geringe Veränderung" der Funktion um die Variation 6X(t) keine Veränderung des Wertes des Integrals hervorruft. Zu beachten ist, daß wir bei der Festlegung der Bedingung für die Existenz eines Extremums der Funktion y = f(x) den Wert des Argumentes der Funktion verändert haben. Bei der Untersuchung aus der Menge A eine bestimmte Zahl aus der Menge B zugeordnet wird. Mit einem Funktional haben wir es zu tun, wenn die erste Menge eine Menge Funktionen und die zweite eine Menge Zahlen ist. Das Funktional können wir also als die Regel bezeichnen, nach der jeder Funktion der ersten Menge eine bestimmte
b
Zahl der zweiten Menge zugeordnet wird. Jedes bestimmte Integral / = J f(x)dx a ist ein Funktional, da sein Wert von der Funktion f(x) unter dem Integral abhängt.
§ 1. Optimaler Produktionsablauf in der Zeit-—Variationsrechnung
295
des Extremums eines Funktionais (Integrals) wird der Wert des Arguments der Funktion t nicht verändert, es verändert sich lediglich „unbedeutend" die Funktion X(t) in den Grenzen von a bis b. Das wird in der Zeichnung 10.2 verdeutlicht. XH)
a
M Zeichnung 10.2
Unterstellen wir, daß die Funktion X(t) und ihre Variation öX{t) stetige erste und zweite Ableitungen nach t haben, dann können wir den neuen Wert des Integrals folgendermaßen darstellen: I+8I
= J F[X{t)+8X(t)-,
X'(t)+dX'(t)\
t]dt
(10.6)
und danach errechnen wir den Wert dl für den Fall, daß die Variation dX(t) -* 0 (bei gegebenem /). Die Veränderung der Funktion F unter dem Integral ist das Ergebnis der Veränderung der Funktion X(t) und mittelbar auch der Veränderung der Funktion X'(t). Die Variation des Integrals beträgt demnach : 4) 4)
Der Zuwachs der Funktion F(x, y), der durch den Zuwachs der Veränderlichen x und y hervorgerufen wird, ist gleich dem vollständigen Differential dieser Funktion: 8F BF, Im vorliegenden Fall sind aber x und y Funktionen, z.B. x(t) und y{t). Die Werte x und y verändern sich, da sich die Funktionen x(t) und y(t) um die Variationen 0, dann hat das Funktional ein Minimum, wenn aber 5 2 I < 0, dann hat das Funktional ein Maximum. Die Berechnung der zweiten Variation ist im allgemeinen kompliziert. In dem von uns untersuchten Fall ist sie jedoch ausnahmsweise einfach. Aus den Formeln (10.9) und (10.11) folgt, daß T
ö2D=\
o
—ö^dt,
r> Wo es bei den Symbolen der Funktionen X, X' usw. nicht zu Mißverständnissen führt, umgehen wir das Symbol des Arguments t.
§ 2. Beispiel der dynamischen Produktionsoptimierung
299
weil ö2F 8X2
0, '
S1F „ „ , = 0 und X' = x.
Wir haben demnach Ö2D =
= [/"(x)^/. o
o
Da wir unterstellten, daß die Grenzkosten der Produktion / ' ( * ) progressiv sind, also daß f"(x) > 0, ist ö2D = \f"{x)öx1dt o
> 0.
Wenn also die Bedingung (10.10) erfüllt ist, erreichen die Gesamtkosten der Produktion und Lagerung D das Minimum. § 2. Beispiel der dynamischen Produktionsoptimierung Wir untersuchen jetzt einen konkreten Fall der dynamischen Produktionsoptimierung. Es sei eine bestimmte Funktion der Produktionskosten als Polynom zweiten Grades f(x) =
cc+ßx+yx2
gegeben, wobei a > 0, ß ^ 0 und y^0 sind. Die Darstellung dieser Funktion ist eine Parabel, wobei für die Produktion x = 0 die Produktionskosten /(0) = x betragen. Die Eulersche Differentialgleichung (10.10.1) hat hierfür die ungewöhnlich einfache Gestalt c = 2yx'(t). Daraus erhalten wir x'(t) =
(10.12)
und x(t) = ~ t+k, wobei k = konst.
von den Anfangs- und Endbedingungen der Aufgabe, (10.2) und (10.4), abhängt. Die Funktion des Produktionsplanes ist also linear. Wir berechnen ferner X(t), d.h. die Produktionshöhe in dem Zeitraum (0, t). Wir haben m
= i(-^t+k)dt
= JLt2+kt+m
(m = konst.).
§ 2. Beispiel der dynamischen Produktionsoptimierung
299
weil ö2F 8X2
0, '
S1F „ „ , = 0 und X' = x.
Wir haben demnach Ö2D =
= [/"(x)^/. o
o
Da wir unterstellten, daß die Grenzkosten der Produktion / ' ( * ) progressiv sind, also daß f"(x) > 0, ist ö2D = \f"{x)öx1dt o
> 0.
Wenn also die Bedingung (10.10) erfüllt ist, erreichen die Gesamtkosten der Produktion und Lagerung D das Minimum. § 2. Beispiel der dynamischen Produktionsoptimierung Wir untersuchen jetzt einen konkreten Fall der dynamischen Produktionsoptimierung. Es sei eine bestimmte Funktion der Produktionskosten als Polynom zweiten Grades f(x) =
cc+ßx+yx2
gegeben, wobei a > 0, ß ^ 0 und y^0 sind. Die Darstellung dieser Funktion ist eine Parabel, wobei für die Produktion x = 0 die Produktionskosten /(0) = x betragen. Die Eulersche Differentialgleichung (10.10.1) hat hierfür die ungewöhnlich einfache Gestalt c = 2yx'(t). Daraus erhalten wir x'(t) =
(10.12)
und x(t) = ~ t+k, wobei k = konst.
von den Anfangs- und Endbedingungen der Aufgabe, (10.2) und (10.4), abhängt. Die Funktion des Produktionsplanes ist also linear. Wir berechnen ferner X(t), d.h. die Produktionshöhe in dem Zeitraum (0, t). Wir haben m
= i(-^t+k)dt
= JLt2+kt+m
(m = konst.).
300
Kapitel X. Optimierung der Produktion unter Gewißheit
Wir werden die Lösung nun geometrisch veranschaulichen. Die Darstellung der Funktion x(t) ist eine gerade Linie mit dem Anstieg 2y
> 0, die die Ordinatenachse beim Wert k schneidet. Wir unter-
stellen, daß zum Zeitpunkt t = 0 der Bestand Z(0) = 0 ist. Daher muß während eines gewissen Anfangszeitraumes (0, t t ) die Produktion größer sein als der Bedarf, also x(t) > v(t) (Zeichnung 10.3).8) In diesem Zeitraum wird ein Bestand geschaffen, dem die schraffierte Fläche zwischen der Geraden x(t) und der Kurve v(t) im Intervall (0, ?i) entspricht. Im folgenden Zeitraum (2) wird der angehäufte Bestand aufgebraucht, da x(t) < v{t) ist. Es kann jedoch nicht mehr Bestand aufgebraucht werden, als im vorhergehenden Zeitraum angesammelt wurde. Die Fläche zwischen der Kurve v(t) und der Geraden x(f) im Intervall ((¡, t2) darf also nicht größer sein als die Fläche zwischen der Geraden x(t) und der Kurve v(t) im Intervall (0, tj. Diese Bedingung bestimmt die Höhe von k, bei der die Gerade x(t) die Ordinatenachse schneidet. x(t) v(t)
^x(t)
T*v(t>
Zeichnung 10.3
Interessant ist, daß wir eine „abschnittweise" Lösung des Problems erhalten; denn die Kurve, die den Produktionsplan darstellt, setzt sich aus einer Reihe gerader Abschnitte zusammen. Zu dem *> Existierte im Anfangszeitraum / = 0 ein Bestand Z(0) > 0, dann könnte die anfängliche Produktion entsprechend geringer sein, die Abbildung der Produktionsfunktion würde also niedriger liegen als auf der Zeichnung 10.3.
§ 2. Beispiel der dynamischen Produktionsoptimierung
301
Zeitpunkt nämlich, an dem der im Zeitraum (0, fj) angesammelte Bestand im Zeitraum (tu t2) aufgebraucht ist, erfolgt eine Korrektur des Produktionsprogramms. Die Gerade x(t) — die vom Verlauf der Funktion v(t) abhängt — senkt oder erhöht sich, damit im Zeitraum (t3, t4) erneut ein Bestand angesammelt werden kann, der im Zeitraum (t4, t5) aufgebraucht wird. Eine gewisse Zeit lang, auf der Zeichnung 10.3 in dem Zeitraum (t 2 , t3), deckt sich die Produktionshöhe ¿c(/) mit dem Bedarf v(t). Demzufolge ist die den Produktionsverlauf darstellende Kurve glatter als die Kurve des Bedarfs, da sie sich nämlich aus einer Reihe von geraden Abschnitten sowie eventuell aus gewissen Teilen zusammensetzt, in denen x(t) = v(t) ist.9) Zu ähnlichen Ergebnissen gelangen wir, wenn die Funktion der Produktionskosten ein Polynom dritten Grades ist: f{x) = Wir haben dann/"(x) =
a+ßx+yx*+öx3.
2y+6dx.
Die Eulersche Differentialgleichung (10.10) hat dann die Gestalt c = (2y+66x)x'(t) und daraus folgt
Wird die letzte Gleichung integriert, dann erhält man keine Gerade mehr, sondern eine logarithmische Kurve. Die Situation ist analog der des vorhergehenden Beispiels; denn wir erhalten eine „abschnittsweise" Lösung, die darauf beruht, daß sich die Funktionskurve des Produktionsplanes nach gewissen Abschnitten nach oben oder nach unten verschiebt. Wir bemerken noch, daß dann, wenn die Lagerkosten je Einheit c gleich Null sind, nach der Formel (10.10.1) x'(t) = 0 und demnach x(t) = konst. ist, also die Produktionskurve eine horizontale Gerade ist. In diesem Fall verändern wir das Produktionsniveau also nicht, '> Auf diese Art der Lösung von Differentialgleichungen treffen wir auch in anderen Wissensgebieten, z.B. in der Physik. Charakteristisches Merkmal dieser Lösungen ist die Erfüllung der Randbedingung, die postuliert, daß der Verbrauch den Gesamtumfang von Produktion und zuvor angesammeltem Bestand nicht überschreiten darf, da kein negativer Bestand zugelassen ist.
302
Kapitel X. Optimierung der Produktion unter Gewißheit
da das Kosten verursachte. Sobald aber der Bestand aufgebraucht ist, unterliegt das Produktionsniveau einer Verschiebung nach oben oder nach unten in Abhängigkeit vom Verlauf der Bedarfsfunktion v(t). Die Lösung setzt sich also aus einer Reihe horizontaler gerader Abschnitte zusammen. Vernachlässigen wir schließlich die Voraussetzung, daß der Bestand nicht negativ sein darf, d.h., lassen wir den Bezug von Produkten aus dem Inland oder über den Import zu, dann wäre die Lösung des Problems eine stetige Kurve (in unserem ersten Beispiel ein gerade Linie), deren Lage von der Anfangsbedingung (10.2) und der Endbedingung (10.4) des Programms abhängt. Wir veranschaulichen die Obige Lösung nochmals graphisch, aber mit Hilfe von X(t) und V(t) und nicht x(t) und v(t). t
Ist die Funktion x(t) linear, dann ist die Funktion X(t) = J x(t)dt o ein Polynom zweiten Grades, seine Abbildung ist also eine Parabel. Oben X(t)
untersuchten 2
= -!Lt +kt+m
wir
den
Fall, daß
x(t) = 2y
also
ist.
Wir unterstellen Z(0) = 0. Die Differenzen zwischen den Ordinaten der Abbildungen der Funktion X(t) und der Funktion V{t) stellen dann die Bestandshöhe des Produktes zum Zeitpunkt t dar. 10)
Zeichnung 10.4 10
> Die Differenzen zwischen den Ordinaten der Funktionen X(t) und V(t) entsprechen den Größen der schraffierten Flächen auf der Zeichnung 10.3.
§ 2. Der Fall einer beschränkten Kapazität der Produktionsbetriebe
303
Da der Bestand nicht negativ sein darf, kann demnach die Kurve V(t) nirgendwo oberhalb der Kurve X(t) liegen. Die Kurve X(t) kann aber die Kurve Vit) berühren oder ein gewisser Abschnitt von X(t) kann sich mit dem entsprechenden Abschnitt von V(t) überdecken. In diesem Zeitraum ist der Bestand des Produktes gleich Null. Auf der Zeichnung 10.4 wird das dargestellt. Die Kurve, die die Funktion X(t) repräsentiert, setzt sich aus einer Reihe parabolischer Abschnitte zusammen, die über der Abbildung der Funktion V(t) liegen und die diese Abbildung an den Endpunkten oder eventuell in gewissen Teilen berühren, bei denen X(t) = V(t) ist. Das letzte tritt in den Intervallen der Veränderlichen t ein, in denen die Krümmung der Parabel größer ist als die Krümmung der Darstellung der Funktion V(t). Falls c = 0 ist, haben wir x(t) = konst., und die Darstellung der Funktion X(t) ist eine gerade Linie, die ebenfalls immer oberhalb der Kurve V(t) verlaufen muß oder diese Kurve berührt.
Kapitel XI
Dynamische Optimierung der Produktion unter Ungewißheit § 1. Der Gesamtbedarf ist eine Zufallsgröße mit bekannter Wahrscheinlichkeitsverteilung Im vorigen Kapitel haben wir in einem allgemeinen Überblick das Problem der dynamischen Produktionsoptimierung unter Gewißheit behandelt. Jetzt erweitern wir dieses Problem, indem wir den Einfluß der Ungewißheit berücksichtigen. Wir unterstellen, daß der Gesamtbedarf im Zeitraum (0, t), d.h. V(t)=\v(t)dt, o eine Zufallsgröße mit bekannter Wahrscheinlichkeitsverteilung $[F(f)] ist. Das ist die Dichtefunktion der Wahrscheinlichkeit für den Gesamtbedarf im Zeitraum von 0 bis /; sie bestimmt die Dichte der Wahrscheinlichkeit (oder die Wahrscheinlichkeit, wenn die Funktion nicht stetig ist), daß der Gesamtbedarf in diesem Zeitraum V(t) beträgt. Die übrigen Elemente des Problems sind die gleichen wie im vorigen Kapitel. Die Produktionshöhe zum Zeitpunkt t ist x(t), und die Gesamtproduktion im Zeitraum (0, t) beträgt X(t) = J x(t)dt. o Es existiert eine bestimmte Funktion der Produktionskosten f[x(t)], die Lagerkosten je Einheit (in der Zeiteinheit) sind c t > 0 und die Kosten je Einheit des Defizits betragen c2 > 0. Unter diesen Umständen setzen sich die Gesamtproduktionskosten zum Zeitpunkt t, D(t), zusammen aus:
§ 1. Der Gesamtbedarf
305
1. den Produktionskosten, die durch die Funktion /[*(*)] bestimmt werden; 2. den Lagerkosten für den Bestand, die Ci[X(f)—V(t)+Z(0)] betragen (wobei Z(0) den Bestand zum Anfangszeitpunkt / = 0 bezeichnet), oder den Kosten, die entstehen, falls der Bedarf größer ist als der Gesamtumfang von Produktion und Anfangsbestand, also c2[V(t)-X(t)-Z(0)]. Die Gesamtkosten betragen zum Zeitpunkt t also m
=f[x(t)]+cl[x{t)~v{t)+zm,
(li.i.i)
wenn X(t)+Z(0)
> V(t),
oder D(t) =f[x{t)\+cAV(t)-X{t)-Z(0)],
(11.1.2
wenn X(i)+Z(0)
[F(0] dv(t)+ — 00
+oo
+ c 2 - X(t)+Z(0) s wit)-x{t)-zmnv(t)w{t). (n.2) Dabei bedeutet die obere Integrationsgrenze des ersten Integrals in der Formel (11.2), daß V(t) < A"(f)+Z(0) ist, also der Bedarf den Gesamtumfang von Produktion und Anfangsbestand nicht übersteigt. Analog bedeutet die untere Integrationsgrenze des zweiten Integrals in der Formel (11.2), daß V{t) > X{t)+Z(0) ist, daß also der Gesamtumfang von Produktion und Anfangsbestand zur Bedarfsdeckung nicht ausreicht. Die in der Formel (11.2) auftretenden unendlichen Integrationsgrenzen können durch endliche ersetzt werden, wenn für die Zufallsgrö3e V(t) ein endlicher unterer und ein endlicher oberer Wert existieren. Unter Ausnutzung der Formel (11.2) kann man die erwarteten Gesamtkosten für den Zeitraum (0, T) errechnen. Wir erhalten
306
Kapitel XI. Optimierung der Produktion unter Ungewißheit
IT \ D = E\\ D(t)dt =
\0
T( $ /WOl+Cj
X(t)+Z(0) • J -oo
/ O l
+zm®[v{t)w(t)+c2-
[*(o-no+
7 [v(o-x(t)-zmX(»+Z(0)
• 4>{V(t)]dV{t^dt.
(11.3)
Die Aufgabe besteht in der Angabe einer solchen Funktion der Gesamtproduktion X(t), bei der die durch die Formel (11.3) bestimmten erwarteten Gesamtkosten das Minimum erreichen. Kennt man X(t), dann kann man die optimale Funktion des Produktionsplanes bestimmen, da x(/) = X'(t) ist. Die Aufgabe lösen wir mit der Variationsrechnung, da — wie man leicht nachprüfen kann — das Integral auf der rechten Seite der Formel (11.3) ein Integral des Typs / =
a
\F[X(t),X\t),t]dt
ist, und dieses Funktional erreicht sein Minimum, wenn die Eulersche Gleichung 3F _ d SF ex ~~ dt 8X'
erfüllt ist. dF Die linke Seite der Eulerschen Gleichung, also (wobei F der Ausdruck unter dem in Formel (11.3) auftretenden Integral ist) berechnen wir unter Beachtung der Regeln über die „Differentiation unter dem Integralzeichen".^ ') Wir erinnern an die Formel (9.15) aus dem Kapitel IX. Wenn Hx) g{x) = S Kx,y)dy, a(X) dann ist b(x)
*'(*)= J -"¿dy+Ax, m\
a(Jt)
^
Wir stellen fest, daß bei der Differentiation der in der Formel (11.3) auftretenden Integrale im gegebenen Beispiel die beiden letzten Bestandteile der Formel für g'(x) verschwinden.
307
§ 1. Der Gesamtbedarf
Wir erhalten X(0+Z(0) +00 Ein Problem dieser Art war in gewissem Grad die Grundlage für die Entwicklung der modernen Theorie der stochastischen Optimierung. Als einer der ersten beschäftigte sich mit diesem Problem Pierre Massé in dem bereits erwähnten Buch und später F. Modigliani und F. E. Hohn in der Arbeit Production Planning over Time and the Nature of the Expectation and Planning Horizon, in: „Econometrica" 1933. Vgl. auch K. J. Arrow, S. Karlin und H. Scarf, Studies in the Mathematical Theory of Inventory and Production, Pälo Alto 1958, und P. A. P. Moran, The Theory of Storage, London 1961, und die dort angegebene Literatur. 21*
312
Kapitel XI. Optimierung der Produktion unter Ungewißheit
Bezeichnen wir den Bedarf an Elektroenergie zum Zeitpunkt t mit v{t) (er ist eine Zufallsgröße), dann wird ein Teil dieses Bedarfs n
in Höhe von £ *»(0 durch die Wasserkraftwerke gedeckt und der i-1 n restliche Bedarf, d.h. u(i)— X *;(0> muß durch die Wärmekraftwerke i=l befriedigt werden. Ferner seien die Grenzkosten für den Betrieb der Wasserkraftwerke gleich Null,7> so daß der veränderliche Teil der Produktionskosten für Elektroenergie ausschließlich von der Höhe der in den Wärmekraftwerken erzeugten Elektroenergie abhängt. Folglich ist der veränderliche Teil der Produktionskosten für Elektroenergie eine Funktion der Gestalt
Die Produktionshöhe eines gegebenen Wasserkraftwerkes ist eine Funktion zweier Parameter: 1-
t), das ist die Höhe der nutzbaren Wassersäule im Staubecken und ' 2. q M , das ist die Wassermenge, die aus dem Staubecken in die Turbinen fließt. Wir haben demnach *i(0 = / i [ W i ( 0 , 9.(01
0" =
2, . . . , « ) .
(11.12)
Die Kenntnis der technischen Betriebsbedingungen der Wasserkraftwerke ermöglicht es, die Funktion (11.12) zu bestimmen. Wenn man die Funktion (11.12) entsprechend verändert, dann kann man den Parameter Wt(t) im weiteren nicht als Wasserhöhe, sondern als Wassermenge im Staubecken des gegebenen Kraftwerkes auffassen. 7 ) Diese Annahme ist realistisch, da die Betriebskosten der Wasserkraftwerke im allgemeinen tatsächlich nicht von der Produktionshöhe an Elektroenergie abhängen. Die Produktionsveränderung hat keinen Einfluß auf die Produktionskosten, man kann also unterstellen, daß diese Kosten konstant sind. Man kann diese Annahme übrigens modifizieren. Das kompliziert zwar die weiteren Betrachtungen, hat aber keinen Einfluß auf die endgültigen Schlußfolgerungen.
§ 3. Problem der optimalen Ausnutzung von Elektroenergiequellen
313
Wir gehen in dieser Weise vor, um die folgenden Betrachtungen zu vereinfachen. Wir bemerken noch, daß der Parameter W^t) eine Zufallsgröße ist, während der Parameter q^t) eine „Entscheidungsveränderliche" ist, deren Wert davon abhängt, welche Wassermenge den Turbinen zugeleitet wird. Mit r ; (i) und qt(t) bezeichnen wir die Wassermenge, die zum gegebenen Zeitpunkt in das bzw. aus dem Staubecken des z'-ten Kraftwerkes fließt. Die im Zeitraum (0, t) in das Staubecken dieses Kraftwerkes eingeflossene Wassermenge beträgt dann *i(0 = \ri{t)dt, o während die im selben Zeitraum ausgeflossene Wassermenge ßi(0 = \qiiß)dt o beträgt. Im Staubecken des i'-ten Kraftwerkes ist demnach zum Zeitpunkt t die Wassermenge W M = Ä t (0—ßi(0+Wi(0) (11.13) enthalten, wobei W|(0) den Anfangsbestand im Staubecken angibt. Ohne die Allgemeingültigkeit der weiteren Betrachtungen zu schmälern, kann man annehmen, daß der Anfangswasserbestand in den Staubecken aller Kraftwerke gleich Null ist, d.h. Wt(0) = 0 (i = 1 , 2 n). Wi(0) hat als konstanter Bestandteil in der Formel (11.13) tatsächlich keinen Einfluß auf die Ergebnisse der weiteren Untersuchungen. Wir haben also Wt(t) = Ri(t)—Qi(t)
( / = 1,2,...,«).
(11.13.1)
Qi(t) ist keine Zufallsgröße, folglich wird der Zufallscharakter der Veränderlichen Wi(t) durch die Zufälligkeit der Veränderlichen Ri(t) verursacht, die wiederum das Ergebnis der Zufälligkeit der Veränderlichen rt(t) ist, d.h. des Wasserzuflusses in das Staubecken zum gegebenen Zeitpunkt.
314
Kapitel XI. Optimierung der Produktion unter Ungewißheit
Nach diesen Bemerkungen kann man die Produktionsfunktion der Wasserkraftwerke (11.12) in der Form *i(0 =fi\Wt{ty, i«(01 =fi[Ri(t)-Qi(ty,
q,(0] 0=1,2,...,«)
(11.14) schreiben. Danach berechnen wir die variablen Betriebskosten D(t) für die Elektroenergiequellen zum gegebenen Zeitpunkt t, die — wie aus den obigen Angaben hervorgeht — eine Funktion der Höhe der in den Wärmekraftwerken erzeugten Elektroenergie sind. Sie betragen D(t) = f { © ( 0 - tfiWity,
*,(*)]}.
(11.15)
Die gesamten variablen Betriebskosten betragen im Planungszeitraum T D = Jf{o(0-
¿MW«)-,?,(/)]}[f(i)] beträgt; das ist die Wahrscheinlichkeitsdichte, daß der Bedarf an Elektroenergie zum Zeitpunkt t v(t) beträgt. Den Wahrscheinlichkeitsverteilungen könnte man zugrunde legen, daß die Zufallsgrößen W^t) (i = 1, 2, ...,«) unabhängig sind. Eine solche Annahme wäre aber unrealistisch, da die Wassermengen in den Staubecken der einzelnen Wasserkraftwerke im allgemeinen voneinander abhängen. So füllen sich beispielsweise in Regenzeiten 8)
Man kann dieses Problem dadurch verallgemeinern, indem man annimmt, daß sich die Wahrscheinlichkeitsverteilung der Zufallsgröße i>(0 im Zeitverlauf verändert. Eine solche Annahme würde aber nichts wesentlich Neues zu dem untersuchten Problem beitragen.
§ 3. Problem der optimalen Ausnutzung von Elektroenergiequellen
315
alle im betreffenden Landesteil liegenden Staubecken. Aus diesem Grund können wir nicht voraussetzen, daß die Zufallsgrößen Wt (i = 1, 2 , . . . , n) unabhängig sind. Da der Zufallscharakter der Veränderlichen Wt das Ergebnis der Zufälligkeit des Wasserzuflusses r ; (i) in die Staubecken ist, kann man die Wahrscheinlichkeitsverteilung der Zufallsgröße Wt als Funktion der Veränderlichen r^i),
r2(t),...,
rn(t), also in Form der
Funktion ^[r^t), r 2 (i),..., r„(0] darstellend Wir bestimmen jetzt den Erwartungswert (die mathematische Erwartung) der Gesamtkosten für die Nutzung der Kraftwerke zum Zeitpunkt i. 10) Es können drei Fälle eintreten, die wir bei der Kalkulation der Gesamtnutzungskosten der Kraftwerke als gesonderte Bestandteile berücksichtigen: 1. Die Produktion der Wasserkraftwerke übersteigt den Bedarf an Elektroenergie, d.h. es ist: > v(t). In diesem Fall können Kosten für die Speicherung des Überschusses an Elektroenergie1 ^ in Höhe von ciil/iTO),?.«]-^')}
entstehen, wobei cl die Kosten für die Speicherung einer Einheit Elektroenergie sind. ®> Man kann noch weiter gehen und unterstellen, daß die Wahrscheinlichkeitsverteilung Wt nicht nur von den Wassermengen abhängt, die zum gegebenen Zeitpunkt in die einzelnen Staubecken fließen, d.h. von r,(f), r 2 (/),..., rn(t), sondern auch von den Wassermengen, die zu früheren Zeitpunkten in die Staubecken flössen; es existiert nämlich eine Korrelation zwischen dem Wasserzufluß in die Staubecken zu verschiedenen Zeitpunkten der gegebenen Periode. Unter einer solchen Voraussetzung hätte die Funktion der Wahrscheinlichkeitsverteilung 0i die Form r2(0,.... f„(t); *,(/), MO *„(/)]. Wir hätten es dann mit einem stochastischen Prozeß zu tun. 10 > Wir erinnern daran, daß die Betriebskosten der Wasserkraftwerke konstant (unabhängig von der Produktionshöhe) und die Grenzkosten demzufolge gleich Null sind. u > Der Überschuß an Elektroenergie kann z.B. in Akkumulatoren gespeichert werden oder mittelbar durch Hochpumpen von Wasser in Reservebecken, die oberhalb der Hauptbecken liegen.
316
Kapitel XI. Optimierung der Produktion unter Ungewißheit
2. Der Bedarf an Elektroenergie v(t) übersteigt zwar die Produktion der Wasserkraftwerke i s t a ^ e r g e r i n g e r als der Umfang an Elektroenergie, der aus der Produktion der Wasserkraftwerke £ / < und durch Auslastung der Produktionskapazität der Reservewärmekraftwerke M angeboten werden kann. Das kann man als folgende Ungleichung schreiben: In diesem Fall betragen die gesamten variablen Produktionskosten wobei die Funktion F die variablen Produktions-(Betriebs-)Kosten für Elektroenergie in den Wärmekraftwerken bezeichnet. 3. Der Bedarf v(t) übersteigt die Gesamtproduktionskapazität der Wasser- und Wärmekraftwerke, d. h. v(t) > / ¡ + M . Es entsteht dann ein Defizit an Elektroenergie. Die Kosten dieses Defizits betragen c2{v{t)-
^MW^t),
qm-M),
wobei c2 die Kosten je Einheit des Defizits an Elektroenergie bezeichnet. Auf der Grundlage dieser Bemerkungen kann man den Erwartungswert (die mathematische Erwartung) der Gesamtkosten für die Nutzung, d.h. den Betrieb der Kraftwerke zum Zeitpunkt t bestimmen. Diese Nutzungskosten D{t) sind eine Zufallsgröße. Sie ergibt sich als Summe der Zufallsgrößen, die den oben beschriebenen drei Fällen entsprechen. Der Erwartungswert der Kosten D{t), d.h. E[D(t)], ist die Summe der mathematischen Erwartungen dieser drei Zufallsgrößen. Wir erhalten demnach: £ [ £ « ] = c, J - . J
{Y,MWi{t), q i {t)]-
-v{t))w[v{t)] Die Umgebung von Gebirgspässen hat eine der Sattelfläche ähnliche Gestalt. Der Sattelpunkt liegt im höchsten Punkt des Passes, der zugleich der niedrigste Punkt der Linie ist, die längs des Gebirgszuges (längs des Grates) verläuft. 7
§ 1. Bemerkungen zur Theorie der strategischen Spiele
327
erhalten, die Zeilen und Spalten der einen Sattelpunkt besitzenden Matrix entsprechen.
Es gibt aber Matrizen von Zweipersonen-Nullsummenspielen, die keinen Sattelpunkt haben. Ein einfaches Beispiel ist die in der folgenden Tabelle enthaltene Matrix. B
A
A, Ai
B,
B2
80 40
20 100
In diesem Spiel wählt der Spieler A — wobei er genauso verfährt wie zuvor — die Strategie A2, da a = Max. Min. au = 40. Der i J Spieler B wählt dagegen die Strategie Bu da b = Min. Max. au = 80. J
i
Da a # £ ist, existiert kein Sattelpunkt. Wird das Spiel nach anfänglicher Wahl der genannten Strategien mehrfach wiederholt, so ist es für den Spieler A vorteilhaft, die Strategie A2 mit der Strategie Ax auszutauschen, da dann sein Gewinn von 40 auf 80 steigt. Als Antwort auf die Veränderung der Strategie des Spielers A kann natürlich der Spieler B die Strategie B2 anwenden, und der Gewinn des Spielers A sinkt dann auf 20 ab usw. Aus diesem einfachen Beispiel geht hervor, daß dann, wenn die Matrix keinen Sattelpunkt hat, die Lösung des Spiels sehr kom22
Lange, Optimale Entscheidungen
328
Kapitel XII. Optimierung unter völliger Ungewißheit
pliziert ist. Anstatt wie im ersten Beispiel ständig die gleiche Strategie anzuwenden, also sich der sogenannten reinen Strategie zu bedienen, muß man bei oftmaliger Wiederholung des Spiels die sogenannte gemischte Strategie anwenden. Diese Strategie beruht darauf, im Verlaufe des Spiels die verschiedenen Strategien zu „vermischen" (zu kombinieren), wobei diese Vermischung in einem bestimmten Verhältnis erfolgt. Die gemischte Strategie, die beispielsweise durch den Spieler A angewendet wird (der 3 reine Strategien zur Auswahl hat), kann man symbolisch folgendermaßen beschreiben: 'Al A2 A3 ,/>i Pi Pi, Der Spieler A wendet demnach die Strategien Ai, A2, A3 mit den relativen Häufigkeiten pu p2, p3 an, wobei natürlich pi+p2+p3 = 1 ist. Wendet der Spieler B die gemischte Strategie B1 und B2 mit den relativen Häufigkeiten qx und q2 an, wobei q^+q2 = 1 ist, dann kann man diesen Tatbestand demgemäß so kennzeichnen:
Die gemischte Strategie, die einem Spieler den höchsten möglichen Gewinn (oder niedrigsten Verlust) sichert, unabhängig davon, was der zweite Spieler unternimmt, bezeichnet man als optimale Strategie, und die Strategien, die Bestandteile der optimalen gemischten Strategie sind, werden als vorteilhafte, auch als effiziente, Strategien bezeichnet. Der Hauptsatz der Spieltheorie, der 1928 durch J. von Neumann bewiesen wurde, sagt aus, daß jedes endliche Spiel, d.h. ein solches, bei dem die Anzahl der möglichen Strategien der beiden Spieler endlich ist, mindestens eine optimale Lösung hat. Es kann sich hierbei auch um eine gemischte Strategie handeln. Den auf der Grundlage dieser Lösung erhaltenen Gewinn v bezeichnet man ebenfalls als Wert des Spiels, wobei dieser Wert v dann zwischen dem unteren und oberen Spielwert liegt: a Vi (i = 1, 2, ...,ri) sein, dann existiert ein zu großer, unnötiger Rohstoffbestand, der Lagerkosten für den Bestand in Höhe von c^Ri—V¡) nach sich zieht. Ist andernfalls F; > Rh so entsteht ein Rohstoffdefizit, das mit zusätzlichen Kosten c2{Vi—R,) verbunden ist. Wenn Vt — Rif dann sind die zusätzlichen Kosten natürlich gleich Null. Folglich hängt das entsprechende Element der Gewinnmatrix ausschließlich davon ab, ob Rt > Vt, Rt < Vt oder R{ = Vt ist. Schematisch können wir die Gewinnmatrix folgendermaßen darstellen:
V\ v2 ...v„
c^Ri-Vi), wenn R t > Ft c2(Vi-Ri), wenn Vt > Rt 0 , wenn Rt = V{ Die Elemente der Spjelmatrix weisen in diesem Beispiel die Höhe der Kosten aus, die wir in Abhängigkeit von der unbekannten Bedarfshöhe und des angenommenen Standes der Reserve tragen müssen; wir wenden deshalb das Minimax-Prinzip an. Wir setzen nämlich die Reserve so hoch fest, daß die Lagerkosten c^Ri—Vi) oder die Kosten des Rohstoffdefizits c2(Vi—Ri) minimal sind. Das ist ein praktisches Beispiel für die Anwendung des SavagePrinzips unter der Voraussetzung, daß die aus einer falschen Ent-
340
Kapitel XII. Optimierung unter völliger Ungewißheit
Scheidung resultierenden Verluste diskret sind, d.h. eine endliche Anzahl von Werten annehmen können. Dieses Beispiel läßt sich aber verallgemeinern. Hierzu ersetzt man die Matrix der Folgen einer falschen Entscheidung durch eine stetige Kostenfunktion (Verluste) F(R, V), die von der ebenfalls stetig variierenden Höhe der Reserve R und dem Bedarf V abhängt. Also: c^R-V), wenn R > V F(R, V) = c2(V—R), wenn V > R 0 , wenn V = R. Die Lösung des Problems reduziert sich dann auf die Bestimmung des Minimaxes dieser Funktion, also auf den Wert: Min. Max. F(R, V). R
V
Wie aus den vorherigen Erörterungen folgt (Paragraph 1), existiert eine Entscheidung des Problems, wenn die Kostenfunktion F(R, V) einen Sattelpunkt hat. Es muß also einen Punkt P geben, der sowohl der höchste Punkt eines Schnittes der durch die Gleichung Z = F(R, V) bestimmten Fläche mit der zur Ebene der Koordinaten VOZ parallelen Ebene, als auch der niedrigste Punkt eines Schnittes der durch die Gleichung Z = F(R, V) bestimmten Fläche mit der zur Ebene der Koordinaten ROZ parallelen Ebene ist. Die Lösung des Problems ist dann der Wert der Funktion F(R, V), der dem Sattelpunkt entspricht. Besitzt die Kostenfunktion F(R, V) keinen Sattelpunkt, dann muß man für den Fall, daß R und V eine endliche Anzahl von Werten annehmen können, die entsprechende gemischte Strategie anwenden. Es zeigt sich nämlich, daß auch bei den strategischen Spielen gegen die Natur eine Mischung der Entscheidungen möglich ist. Beabsichtigen wir beispielsweise, nicht ein, sondern viele Kraftwerke, z.B. 100, zu bauen, dann können wir verschiedene Typen von Kraftwerken: Wärmekraftwerke, Speicherkraftwerke, Flußkraftwerke ohne Schleusenanlagen und Flußkraftwerke mit Schleusenanlagen in einem entsprechenden Verhältnis, z.B. 1:2:3:4, errichten. Die einen dieser Kraftwerke sind hinsichtlich des einen Naturzustandes besser (ökonomischer), andere hinsichtlich eines anderen Naturzustandes. Das Problem reduziert sich demnach auf die Bestimmung eines opti-
341
§ 6. Zweipersonen-Nullsummenspiel
malen Verhältnisses der Anzahl der einzelnen Kraftwerkstypen, also einer optimalen gemischten Strategie. Mit diesem Problem beschäftigen wir uns im folgenden Paragraphen. § 6. Die Äquivalenz der linearen Optimierung mit einem Zweipersonen-Nullsummenspiel Aus dem Hauptsatz der Theorie der strategischen Spiele folgt, daß bei Anwendung gemischter Strategien mit dem Wert des Spiels v mindestens eine optimale Lösung existiert, wobei a < v < b gilt, d.h., der Wert des Spiels liegt zwischen dem unteren und oberen Spielwert (vgl. Paragraph 1).13) Die optimale gemischte Strategie des Spielers A setze sich aus den Strategien Ax, Ä2, •••, Am zusamm e n , die m i t d e n H ä u f i g k e i t e n p i , p 2 , ...,pmU)
(P1+P2+
••• +Pm = 1)
angewendet werden. Und die optimale Strategie des Spielers B setze sich aus den Strategien l5) B1,B2,...,B„ zusammen, die mit den Häufigkeiten q^,q2, ...,q„ (