226 94 4MB
German Pages 486 [487] Year 2013
Regelungstechnik 2 Mehrgrößenregelung, Digitale Regelungstechnik, Fuzzy-Regelung Prof. Dr. Gerd Schulz Prof. Dr. Clemens Graf
3., überarbeitete und erweiterte Auflage
Oldenbourg Verlag München
Prof. Dr. Gerd Schulz studierte Regelungstechnik an der TH Darmstadt und an der Stanford University. Mit einem Thema zur Parameteridentifizierung promovierte er an der TH Darmstadt. Prof. Schulz arbeitete viele Jahre in der Luft- und Raumfahrtforschung und Luftfahrtindustrie. Er lehrte zunächst an der FH Landshut und hielt von 1989 bis 2009 Vorlesungen auf dem Gebiet der Regelungstechnik an der Hochschule München. Prof. Dr. Klemens Graf studierte Elektrotechnik an der Universität Erlangen-Nürnberg. Nach einer Promotion auf dem Gebiet hydraulisch angetriebener Handhabungsgeräte arbeitete er in der Antriebsentwicklung für den Magnetschwebezug Transrapid bei der Siemens AG. Seit 2005 lehrt er Regelungstechnik an der Hochschule München.
Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. © 2013 Oldenbourg Wissenschaftsverlag GmbH Rosenheimer Straße 143, D-81671 München Telefon: (089) 45051-0 www.oldenbourg-verlag.de Das Werk einschließlich aller Abbildungen ist urheberrechtlich geschützt. Jede Verwertung außerhalb der Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Bearbeitung in elektronischen Systemen. Lektorat: Dr. Gerhard Pappert Herstellung: Tina Bonertz Titelbild: Raumstation ISS mit dem Endeaver Raumtransporter und einem ATV Modul ESA/ NASA Einbandgestaltung: hauser lacour Gesamtherstellung: Grafik + Druck GmbH, München Dieses Papier ist alterungsbeständig nach DIN/ISO 9706. ISBN 978-3-486-71281-0 eISBN 978-3-486-73615-1
Vorwort zur 3. Auflage In der vorliegenden dritten Auflage wurden die bekannt gewordenen Unstimmigkeiten korrigiert und beseitigt. In Teil I über Mehrgrößenregelung wurde ein neues Kapitel über den Entwurf von Zustandsreglern im Frequenzbereich eingefügt. Die Strukturierung des Buches in drei Teile wird beibehalten und nachfolgend im Einzelnen beschrieben: Teil I: Mehrgrößen-Regelsysteme Zur Einführung wird in Kapitel 1 die Drehzahlregelung eines Gleichstrommotors als typisches Eingrößensystem vorgestellt, und die Entwurfsanforderungen an einen Regelkreis werden erläutert. Ausgehend von der Darstellung eines Eingrößensystems durch eine lineare Differentialgleichung n-ter Ordnung wird der Übergang zu einer Beschreibung durch n Differentialgleichungen 1. Ordnung, der so genannten Zustandsdarstellung, entwickelt. Die Variablen dieser n Differentialgleichungen 1. Ordnung sind die Zustände des Systems. Diese Darstellungsart ermöglicht Regelkonzepte, die auf der Basis von Übertragungsfunktionen nicht realisierbar sind. Verschiedene Normalformen der Zustandsdarstellung werden erstmals aufgezeigt, und es wird die Berechnung der Übertragungsfunktion aus der Zustandsdarstellung erläutert. In Kapitel 2 werden vier verschiedene Beispiele von technischen Mehrgrößensystemen vorgestellt. Dies sind eine Hydraulik-Kaskade, der Schwebeflug eines Hubschraubers, eine Destillationskolonne und ein Dampferzeuger. Durch eine vektorielle Erweiterung der Eingrößensystem-Zustandsdarstellung können diese Mehrgrößensysteme ebenso durch eine Zustandsdarstellung beschrieben werden. Die nummerischen Zahlenwerte der Beispiele werden angegeben. Daran schließt sich die nummerische Lösung der Vektordifferentialgleichung, die Ermittlung der Übertragungsmatrix von Mehrgrößensystemen, die Stabilität und die Verknüpfung von Mehrgrößensystemen durch Reihen-, Parallel- und Kreisschaltung an. Die Fragen der Steuer- und Beobachtbarkeit und die Normalformen von Mehrgrößensystemen sind Thema des Kapitels 3. Ausgehend von den Definitionen der Steuerund Beobachtbarkeit werden deren Kriterien plausibel gemacht. Dieses Konzept der Steuer- und Beobachtbarkeit ist bei der Regelung von Eingrößensystemen auf der Basis von Übertragungsfunktionen irrelevant, da die Übertragungsfunktion ohnehin nur den steuer- und beobachtbaren Systemteil erfasst. Anschließend werden die von den Eingrößensystemen bekannten Normalformen der Zustandsdarstellung auch für die Mehrgrößensysteme vorgestellt und ihre Berechnung demonstriert. Die Regelung von Eingrößensystemen durch den klassischen PID-Regler gestattet nur eine Einstellung der Pole des geschlossenen Regelkreises auf bestimmte, durch die Äste
VI
Vorwort
einer Wurzelortskurve vorgegebene Positionen in der s-Ebene. Dagegen können mit den Mitteln der in Kapitel 4 vorgestellten Polfestlegung die Pole des geschlossenen Regelkreises beliebig festgelegt werden, falls die Steuerbarkeit des Mehrgrößensystems gegeben ist. Bei den Eingrößensystemen erfolgt diese Polfestlegung mittels Zustandsvektorrückführung vorteilhaft unter Verwendung der Regelungsnormalform. Auch bei den Mehrgrößensystemen ermöglicht die Verwendung der Brunovsky-Form eine analytische Polfestlegung. Nummerische Methoden erlauben die Berücksichtigung von Empfindlichkeitsmaßen, welche die Lage der Pole unempfindlich gegen Parametervariationen der Mehrgrößen-Regelstrecke macht. Man spricht von einer robusten Polfestlegung. In einem gesonderten Abschnitt werden verschiedene Methoden zur Auswahl der gewünschten Pollagen untersucht Als alternative Methode zur Polfestlegung für die Auslegung von Reglern mittels Zustandsvektorrückführung wird in Kapitel 5 die optimale Zustandsregelung betrachtet. Wie bei den Eingrößensystemen kann man eine konstante Rückführmatrix K der Zustandsvektorrückführung so bestimmen, dass bestimmte quadratische Gütekriterien erfüllt sind. Diese integralen Kriterien bewerten die Abweichung des Zustands- und Stellvektors von der Ruhelage. Das Minimum des Integralkriteriums liefert die Lösung P einer Matrix-Riccati-Gleichung, die dann die Berechnung der Rückführmatrix K ermöglicht. Ansatz und Lösung dieses quadratischen Reglerproblems werden plausibel gemacht und an Beispielen demonstriert. Auch die Verschiebung der Pole des geschlossenen Mehrgrößen-Regelkreises auf Werte kleiner −α in der s-Ebene mithilfe der optimalen Regelung wird demonstriert. Die Zustandsvektorrückführung über eine Rückführmatrix K, die mit den Methoden der Polfestlegung oder der optimalen Regelung berechnet wird, setzt die Kenntnis des Zustandsvektors x(t) voraus. In Kapitel 6 wird gezeigt, wie man diesen Zustandsvektor aus den gemessenen Ein- und Ausgangsgrößen eines Mehrgrößensystems mit einem Zustandsbeobachter ermitteln kann. Ein derartiger Zustandsbeobachter bildet die Struktur des untersuchten Mehrgrößensystems nach. Die Berechnung der hierbei erforderlichen Rückführmatrix L des Ausgangsfehlers kann sowohl mit den Methoden der Polfestlegung als auch mittels der quadratischen Regelung erfolgen. Damit ist man in der Lage, ein Mehrgrößensystem mittels Zustandsvektorrückführung zu stabilisieren, ohne den Zustandsvektor direkt zu messen, da der Zustandsbeobachter die Schätzung des Zustandsvektors ermöglicht. In einem gesonderten Unterkapitel wird gezeigt, wie man durch intelligente Verwendung der Messgrößen die Ordnung des Beobachters reduzieren kann und zu einem Beobachter reduzierter Ordnung gelangt. Die Auslegung des Zustandsbeobachters und die Auslegung der Rückführmatrix für die Zustandsvektorrückführung des Mehrgrößensystems sind unabhängig voneinander, wie das Separationstheorem zeigt. Die in den Kapiteln 2 bis 6 behandelte Theorie der Mehrgrößensysteme ist erforderlich, um das in Kapitel 7 untersuchte zentrale Problem der Regelungstechnik, das Führungsund Störverhalten von (in diesem Fall) Mehrgrößensystemen zu verstehen. Zunächst wird die Führungsgrößenaufschaltung behandelt, mittels der im Rahmen einer Steuerung die Regelgrößen auf den Sollwert geführt werden. Die dann untersuchte integrale Ausgangsvektorrückführung mit einem PI-Mehrgrößenregler demonstriert, wie durch diese Struktur alle s Regelgrößen auf ihre Sollwerte geregelt werden. Dies gilt auch beim
Vorwort
VII
Auftreten von Parameteränderungen der Mehrgrößen-Regelstrecke. Sollen die Regelgrößen mit vorgeschriebenem Zeitverhalten auf die Sollwerte einschwingen, so kann man dies mit einem Modellfolgeregler erreichen, dessen Auslegung sich anschließt. Die Unterdrückung von Störgrößen durch Schätzung und Aufschaltung ist Thema des letzten Abschnitts Störgrößenaufschaltung. Durch Einsatz eines kombinierten Zustands- und Störbeobachters zusammen mit einem dynamischen Kompensator wird dieses Problem gelöst. Das neu eingefügte Kapitel 8 über den Entwurf von Zustandsreglern im Frequenzbereich ermöglicht besonders im Eingrößenfall einen einfachen direkten Entwurf der Reglerübertragungsfunktionen. In einem Entwurfsschritt werden auf der Grundlage des Separationstheorems ohne explizite Auslegung eines ordnungsreduzierten Beobachters die Pole der Strecke mit Zustandsrückführung und des Beobachters festgelegt. Die Unterdrückung von konstanten und sinusförmigen Störsignalen kann in besonders einfacher Weise erfolgen. Das Ziel von Teil I des Buchs ist, dem Leser mit möglichst wenig Mathematik eine grundlegende Einführung in die Regelung von Mehrgrößensystemen zu ermöglichen. Es werden wesentliche Grundlagen der Zustandsdarstellung und -regelung von Mehrgrößensystemen behandelt. Für Vertiefungen und weiterführende Untersuchungen wird auf die umfangreiche Literatur zu dieser Thematik verwiesen. Alle vorgestellten Methoden werden am Beispiel der Hydraulik-Kaskade demonstriert. Zum Selbststudium sind die Daten weiterer Beispiele aufgeführt. Teil II: Digitale Regelung Die Kapitel 9 bis 16 führen auf die Regelung von Eingrößensystemen zurück. Die Entwurfsanforderungen von Kapitel 1 bezüglich Führungs- und Störverhalten bleiben erhalten, erreicht werden sollen die Entwurfsziele mittels Verwendung digitaler Regler. Dazu werden in Kapitel 9 zunächst die Komponenten eines digitalen Regelkreises vorgestellt. Die Wirkung von Abtaster und Halteglied, die A/D- bzw. D/A-Wandlung1 und die Verwendung eines Mikrocontrollers zur Regelung werden erläutert. Abschließend wird der Abtastvorgang mathematisch beschrieben. Die mathematische Behandlung von Zahlenfolgen zu den Abtastzeitpunkten kT ermöglicht die in Kapitel 10 vorgestellte Theorie der z-Transformation. Ihre Rechen- und Transformationsregeln werden erläutert und mit vielen Beispielen demonstriert. Diese z-Transformation ermöglicht in Kapitel 11 die Einführung der z-Übertragungsfunktion. Die Berechnung der z-Übertragungsfunktion für die Regelstrecke mit vorgeschaltetem Halteglied und nachgeschaltetem Abtaster ist dabei das zentrale Thema. Abschließend werden Rechenregeln für das Rechnen mit z-Übertragungsfunktionen für die Reihen-, Parallel- und Kreisschaltung von digitalen Systemen aufgeführt. In Kapitel 12 werden Stabilität und Zeitverhalten diskreter Systeme untersucht. Zunächst werden Stabilitätskriterien von z-Übertragungsfunktionen erläutert und Bedin1
A/D- und D/A-Wandlung bezeichnet die Analog/Digital- bzw. die Digital/AnalogWandlung von Signalen.
VIII
Vorwort
gungen für die Lage der Pole in der z-Ebene genannt. Ein Vergleich zwischen der Lage der Pole in der s-Ebene und der z-Ebene schließt sich an. Die zentrale Aufgabe der digitalen Regelung, die Ermittlung der in einem Mikrocontroller zu implementierenden Reglergleichung, ist Thema von Kapitel 13. Erst werden verschiedene Methoden der digitalen Realisierung analoger Regler vorgestellt und miteinander verglichen. Dabei erweist sich die Diskretisierung mit der Methode der bilinearen Transformation als besonders vorteilhaft. Dann folgt der Entwurf von digitalen Kompensationsreglern mit den Methoden von Ragazzini und der Reglerentwurf auf endliche Einstellzeit. Infolge von Stellgliedbegrenzungen kann es bei integrierenden Reglern zu einem Reglerüberlauf (Wind-Up) kommen. Maßnahmen gegen diesen Reglerüberlauf schließen das Kapitel ab. In Kapitel 14 werden die von der klassischen Regelungstechnik bekannten Ortskurvenverfahren des Reglerentwurfs mithilfe des Bode-Diagramms und der Wurzelortskurve auf digitale Regelsysteme übertragen. Im folgenden Kapitel 15 über den Entwurf digitaler Kompensationsregler werden ohne vorherigen Entwurf analoger Regler und anschließende Diskretisierung direkt digitale Kompensationsregler nach verschiedenen Methoden entworfen. Ein Entwurf mittels Polvorgabe wird dabei ebenfalls vorgestellt. Das Kapitel 16 über adaptive und selbsteinstellende Regler behandelt das Autotuning von Reglern, Gain-Scheduling, selbsteinstellende Regler sowie Modell-ReferenzAdaptive Systeme. Diese komplexen Entwurfsverfahren ermöglichen eine Regleranpassung an sich verändernde Parameter der Regelstrecke. Das Ziel von Teil II des Buchs ist, den Leser mit einfachen Mitteln mit den Methoden der digitalen Regelung vertraut zu machen. Anhand vieler Beispiele erfolgt eine Einführung in die Thematik, und die zahlreichen Aufgaben ermöglichen die selbständige Erarbeitung des Stoffes. Dabei wird das Ziel des Entwurfs digitaler Regler, die Ermittlung der im Mikrocontroller zu programmierenden Reglergleichung, nicht aus den Augen verloren. Teil III: Fuzzy-Regelung Die Ermittlung und Anwendung der Methoden der Fuzzy-Logik auf die Auslegung von Reglern für Eingrößensysteme bilden den Inhalt der Kapitel 17 bis 20 des Buches. Begonnen wird in Kapitel 17 mit der Definition unscharfer Mengen, den Fuzzy-Mengen, deren Zugehörigkeitsfunktion, anders als bei den klassischen Mengen, die Elemente der Grundmenge auch auf Werte zwischen Null und Eins abbildet. Nach der Vorstellung typischer Fuzzy-Mengen werden UND-, ODER- und NICHT-Operator für Fuzzy-Mengen erläutert. Die Einführung von linguistischen Variablen und Termen schließt sich an. Mit der Abbildung „scharfer“ Messwerte auf ihren Zugehörigkeitsgrad (die Fuzzifizierung) endet das Kapitel. Kapitel 18 beginnt mit den Regeln für Fuzzy-logisches Schließen, den Fuzzy-Relationen und leitet über zur Fuzzy-Inferenz. Hierunter versteht man die Erarbeitung einer Schlussfolgerung auf der Basis des Wahrheitsgehaltes von Prämissen. WENN-DANN-Regeln
Vorwort
IX
beschreiben formal die Verknüpfung von Prämisse und Konklusion (Schlussfolgerung). Die Erläuterung dieser Fuzzy-Inferenz erfolgt am Beispiel einer Füllstandsregelung eines Behälters. Verwendet wird hierbei die MAX-MIN-Inferenz, jedoch weitere Inferenzmethoden werden ebenso erläutert. Die Defuzzifizierung, d. h. die Gewinnung eines „scharfen“ Ausgangswertes aus der Ergebnis-Fuzzy-Menge der Fuzzy-Inferenz schließt sich an. In Kapitel 19 wird die Anwendung der beiden vorangehenden Kapitel auf den Reglerentwurf vorbereitet. Die Konstruktion statischer und dynamischer Fuzzy-Regler wird ebenso erläutert wie die Konstruktion von Zwei- und Dreipunktreglern auf der Basis der Fuzzy-Inferenz. Die Beschreibung des Ein-/Ausgangsverhaltens von Fuzzy-Reglern durch Kennlinien und Kennflächen verdeutlicht die Wirkungsweise. Der Einfluss unterschiedlicher Fuzzy-Mengen und unterschiedlicher Inferenzmethoden wird für einen Fuzzy-PD-Regler anhand seiner Kennflächen demonstriert, bevor sich die Generierung von Fuzzy-PI- und -PID-Reglern anschließt. Die beispielhafte Anwendung von Fuzzy-Reglern im Regelkreis im Vergleich zu einem konventionellen Regler wird in Kapitel 20 für eine Verzögerungsstrecke untersucht. Dies beinhaltet auch die Untersuchung des Einflusses verschiedener Inferenzmethoden. Es schließt sich die Untersuchung einer Störgrößenaufschaltung über einen Fuzzy-Regler für die Regelung einer integrierenden Regelstrecke an. Den Abschluss dieses Kapitels bildet ein Blick in die Problematik der Stabilität von Fuzzy-Regelungssystemen. Das Ziel von Teil III des Buches ist, dem Leser ein Verständnis für den Einsatz der Fuzzy-Logik in der Regelungstechnik zu vermitteln. Daher wird der Vergleich zur konventionellen Regelung häufig betont. Beispiele und Aufgaben sollen die Einarbeitung erleichtern. Anhang Der Anhang bietet mit seinen Formeln zur Matrizenrechnung die Möglichkeit fehlendes Formelwissen nachzuschlagen. Dies kann nicht die intensive Beschäftigung mit der Matrizenrechnung, die in Teil I des Buches erforderlich ist, ersetzen. Jedoch sind hier einige, speziell in der Regelungstechnik hilfreiche Zusammenhänge leicht zu finden. Allgemeine Bemerkungen Voraussetzung für den Leser dieses Buches ist eine Grundvorlesung in Regelungstechnik. Die normalerweise in einer derartigen Vorlesung vermittelten Kenntnisse von PIDRegelungen sind nach wie vor die Basis und die erste Wahl zur Lösung von regelungstechnischen Aufgaben. Die Ziele der Autoren sind es, die über eine derartige Grundvorlesung hinausgehenden Theorien der Regelungstechnik in den drei Bereichen Mehrgrößenregelung, digitale Regelung und Fuzzy-Regelung zusammenfassend in einem Buch darzustellen. Dabei wird der mathematische Aufwand so gering wie möglich gehalten. Das Buch eignet sich sowohl für den in der Praxis tätigen Ingenieur zur schnellen Einarbeitung in die Problematik als auch für Studenten als Textbuch für weiterführende Vorlesungen zur Regelungstechnik. So sind z. B. die behandelten Themengebiete Inhalt von Vorlesungen an der Hochschule München in der Fakultät für Elektrotechnik und Informationstechnik.
X
Vorwort
Auf den Internetseiten des Oldenbourg Wissenschaftsverlages http:\\www.oldenbourg-wissenschaftsverlag.de sind unter dem Buchtitel die MATLAB-Programme einiger gerechneter Beispiele sowie weitere Informationen zum Buch zu finden. Dies soll insbesondere das Selbststudium und die ersten Schritte der Anwendung der Verfahren erleichtern. Dabei ist allerdings vorausgesetzt, dass der Leser leistungsfähige Programmsysteme wie z. B. MATLAB, DORA, MATRIXX ... zur Verfügung hat. Zur Unterscheidung vom normalen Text werden Beispiele und Aufgaben mit dem Zeichen abgeschlossen. Dank Die Autoren möchte sich bei den Herren Prof. Dr. Wolfgang Höger und Prof. Dr. Dr. h.c. Hans-Joachim Kroll für wertvolle Anregungen bedanken. Der Dank geht außerdem an den Oldenbourg Verlag, bei dem wir jederzeit ein offenes Ohr für Probleme und Wünsche fanden.
München
Gerd Schulz und Klemens Graf
Inhaltsverzeichnis I
Mehrgrößen-Regelsysteme
1
1
Zustandsdarstellung von Eingrößensystemen
3
1.1
Klassische Eingrößenregelung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
1.2 1.2.1 1.2.2
Zustandsgleichungen von Eingrößensystemen . . . . . . . . . . . . . . . . . . . . . 7 Ermittlung aus der Differentialgleichung, Normalformen . . . . . . . . . 7 Ermittlung aus den Systemgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.3
Ermittlung der Übertragungsfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2
3
Zustandsdarstellung von Mehrgrößensystemen
23
2.1 2.1.1 2.1.2
Mehrgrößensysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 Einführung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 Beispiele von Mehrgrößensystemen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.2 2.2.1
Zustandsgleichungen von Mehrgrößensystemen . . . . . . . . . . . . . . . . . . . 28 Herleitung aus den Systemgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.3
Lösung der Zustandsvektor-Differentialgleichung . . . . . . . . . . . . . . . . . . 35
2.4
Ermittlung der Übertragungsmatrix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
2.5
Stabilität von Mehrgrößensystemen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
2.6
Verknüpfung von Mehrgrößensystemen . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
Steuerbarkeit und Beobachtbarkeit, Normalformen
51
3.1
Steuerbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.2
Beobachtbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.3 3.3.1 3.3.2 3.3.3 3.3.4
Transformation auf Normalform . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Normalformen von Eingrößensystemen . . . . . . . . . . . . . . . . . . . . . . . . . . . Steuerbarkeitsnormalformen für Mehrgrößensysteme . . . . . . . . . . . . . . Regelungsnormalformen für Mehrgrößensysteme . . . . . . . . . . . . . . . . . Weitere Normalformen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
63 64 67 72 79
XII 4
5
6
7
8
Inhaltsverzeichnis Reglerentwurf zur Polfestlegung
81
4.1
Polfestlegung für Eingrößensysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
4.2 4.2.1 4.2.2
Polfestlegung für Mehrgrößensysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 Systeme in Brunovsky-Form . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 Robuste Polfestlegung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
4.3 4.3.1 4.3.2 4.3.3 4.3.4 4.3.5
Auswahl der gewünschten Pollagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Dominierendes Polpaar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Prototypen-Entwurf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Symmetrischer Wurzelort . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Pol-/Nullstellenkompensation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Resümee . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Optimale Zustandsregelung
94 94 96 100 105 106 107
5.1
Lineare quadratische optimale Regelung . . . . . . . . . . . . . . . . . . . . . . . . . . 107
5.2
Erzeugung eines vorgeschriebenen Stabilitätsgrades . . . . . . . . . . . . . . . 120
Zustandsbeobachter/-schätzer
125
6.1 6.1.1 6.1.2
Entwurf des Einheitsbeobachters mittels Polfestlegung . . . . . . . . . . . . 126 Eingrößensysteme. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126 Mehrgrößensysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
6.2
Entwurf des Einheitsbeobachters unter Verwendung quadratischer Güteindizes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
6.3 6.3.1 6.3.2
Entwurf eines Beobachters reduzierter Ordnung . . . . . . . . . . . . . . . . . . 137 Messung von s Zuständen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137 Allgemeiner Fall des reduzierten Beobachters . . . . . . . . . . . . . . . . . . . . . 142
6.4
Das Separationstheorem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
Führungs- und Störverhalten von Mehrgrößensystemen
147
7.1
Führungsgrößenaufschaltung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
7.2
Integrale Ausgangsvektorrückführung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
7.3
Modellfolgeregler – Servo-Kompensator . . . . . . . . . . . . . . . . . . . . . . . . . . 159
7.4
Störgrößenaufschaltung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
7.5
Abschließendes Eingrößenbeispiel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
Zustandsreglerentwurf im Frequenzbereich
183
8.1
Aufstellen der Entwurfsgleichung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183
8.2
Zustandsregler mit Störmodell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188
8.3
Grenzen der erreichbaren Regelgüte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194
8.4
Bewertung des Frequenzbereichsentwurfs . . . . . . . . . . . . . . . . . . . . . . . . . 195
Inhaltsverzeichnis
II
Digitale Regelung
9
Grundlagen digitaler Regelsysteme
10
11
XIII
197 199
9.1
Aufbau digitaler Regelkreise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200
9.2
Mathematische Beschreibung des Abtastvorgangs . . . . . . . . . . . . . . . . 205
9.3
Standardform digitaler Regelkreise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210
Die z-Transformation
213
10.1
Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213
10.2 10.2.1 10.2.2 10.2.3 10.2.4 10.2.5
Rechenregeln der z-Transformation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Überlagerungssätze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ähnlichkeitssatz (Dämpfungssatz) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Verschiebungssätze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Faltungssatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Grenzwertsätze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
219 219 220 221 223 224
10.3 10.3.1 10.3.2 10.3.3
Die inverse z-Transformation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Rücktransformation durch Polynomdivision . . . . . . . . . . . . . . . . . . . . . . Partialbruchzerlegung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Auswertung des Umkehrintegrals (Residuensatz) . . . . . . . . . . . . . . . . .
225 226 227 228
10.4
Anwendung der z-Transformation bei der Lösung von Differenzengleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231
Diskrete Übertragungsfunktionen
235
11.1 11.1.1 11.1.2 11.1.3
Die z-Übertragungsfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Gewichtsfolge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Anwendung des Faltungssatzes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
235 235 238 239
11.2 11.2.1 11.2.2 11.2.3
Z-Übertragungsfunktion der Regelstrecke . . . . . . . . . . . . . . . . . . . . . . . . . Grundlegende Berechnungsmethode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Berechnung mittels Partialbruchzerlegung . . . . . . . . . . . . . . . . . . . . . . . . Berechnung mittels der Residuenmethode . . . . . . . . . . . . . . . . . . . . . . . .
239 240 244 246
11.3 Z-Übertragungsfunktion des Reglers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247 11.3.1 Das Halteglied-Äquivalent . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247
12
11.4
Rechenregeln für diskrete Übertragungsfunktionen . . . . . . . . . . . . . . . 249
11.5
Kanonische Realisierungen von z-Übertragungsfunktionen . . . . . . . . 253
Stabilität und Zeitverhalten diskreter Systeme
259
12.1
Stabilitätsbedingungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 259
12.2
Das Jury-Stabilitätskriterium . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263
12.3
Vergleich der Lage der Pole in der s-Ebene und der z-Ebene . . . . . . 265
XIV 13
14
15
16
Inhaltsverzeichnis Quasikontinuierlicher Entwurf digitaler Regler
273
13.1 13.1.1 13.1.2 13.1.3 13.1.4 13.1.5 13.1.6 13.1.7
Digitale Realisierung analoger Regler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Das Euler-Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die bilineare Transformation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Der PID-Regelalgorithmus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Das diskrete Äquivalent . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Das Halteglied-Äquivalent . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . „Direkte z-Transformation“ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Vergleich der entworfenen Regler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
273 273 276 278 280 284 285 287
13.2
Der digitale Regler nach Takahashi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292
13.3
„Reglerüberlauf“ (Controller Wind-Up). . . . . . . . . . . . . . . . . . . . . . . . . . . 295
Ortskurvenverfahren
303
14.1 14.1.1 14.1.2 14.1.3
Das Wurzelortskurvenverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Grundlagen des Entwurfsverfahrens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Stabilitätsgebiete in der z-Ebene . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Entwurf eines Reglers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
303 303 304 306
14.2 14.2.1 14.2.2 14.2.3
Der Entwurf mithilfe des Bode-Diagramms . . . . . . . . . . . . . . . . . . . . . . . Das „diskrete“ Bode-Diagramm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die w-Transformation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Entwurf eines Reglers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
309 309 311 314
Entwurf digitaler Kompensationsregler
319
15.1
Der direkte Entwurf nach Ragazzini . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 319
15.2
Der Entwurf auf endliche Einstellzeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . 329
15.3
Reglerentwurf mittels Polvorgabe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 335
15.4
Entwurf von Kompensationsreglern für das Störverhalten . . . . . . . . . 339
Adaptive und selbsteinstellende Regler
341
16.1
Autotuning von Reglern . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 342
16.2
Gain-Scheduling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345
16.3 Selbsteinstellende Regler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 346 16.3.1 Parameterschätzung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 347 16.3.2 Reglerentwurf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 353 16.4 Modell-Referenz-Adaptive Systeme (MRAS) . . . . . . . . . . . . . . . . . . . . . . 355 16.4.1 Die MIT-Regel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 355 16.4.2 Anwendung der MIT-Regel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 356
Inhaltsverzeichnis
III
Fuzzy-Regelung
17
Grundlagen „unscharfer“ Mengen (Fuzzy-Mengen)
18
XV
361 363
17.1
Unscharfe Informationen und Fuzzy-Mengen . . . . . . . . . . . . . . . . . . . . . 363
17.2
Operatoren für Fuzzy-Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 367
17.3
Linguistische Variablen und Terme — Fuzzifizierung . . . . . . . . . . . . . . 371
Fuzzy-logisches Schließen (Fuzzy-Inferenz)
375
18.1
Regeln für Fuzzy-logisches Schließen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 375
18.2
Fuzzy-Relationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 376
18.3 18.3.1 18.3.2 18.3.3 18.3.4 18.3.5
Fuzzy-Inferenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . WENN-DANN-Regeln mit einer Prämisse . . . . . . . . . . . . . . . . . . . . . . . . WENN-DANN-Regel mit mehreren Teilprämissen . . . . . . . . . . . . . . . . Mehrere WENN-DANN-Regeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Zusammenfassung des MAX-MIN-Inferenzschemas . . . . . . . . . . . . . . . Andere Inferenzschemata . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
380 380 383 384 388 391
18.4 Defuzzifizierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 392 18.4.1 Schwerpunktmethode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 393 18.4.2 Singletons als Ausgangs-Fuzzy-Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . 394 19
20
Grundlagen der Fuzzy-Regelung (Fuzzy-Control)
399
19.1
Struktur eines Fuzzy-Reglers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 399
19.2 19.2.1 19.2.2 19.2.3 19.2.4 19.2.5
Entwurf eines Fuzzy-Reglers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Festlegung der Ein- und Ausgangsgrößen . . . . . . . . . . . . . . . . . . . . . . . . . Wertebereich der Ein- und Ausgangssignale . . . . . . . . . . . . . . . . . . . . . . Definition der linguistischen Terme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Aufstellen der WENN-DANN-Regeln. . . . . . . . . . . . . . . . . . . . . . . . . . . . . Fuzzy-Mengen der Ausgangsgröße . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
19.3
Kennlinien von Fuzzy-Reglern . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 405
19.4
Fuzzy-PD-Regler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 410
19.5
Fuzzy-PI-Regler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 416
19.6
Fuzzy-PID-Regler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 417
Fuzzy-Regler im Regelkreis 20.1
402 402 402 403 404 405
419
Einsatz von Fuzzy-Reglern . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 419
20.2 Regelung einer Verzögerungsstrecke mit einem Fuzzy-Regler . . . . . . 420 20.2.1 Fuzzy-PI-Regler mit MAX-PROD-Inferenz und Singletons als Ausgangs-Fuzzy-Mengen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 420
XVI
Inhaltsverzeichnis 20.2.2 Fuzzy-PI-Regler mit MAX-MIN-Inferenz und Defuzzifizierung mittels der Schwerpunkt-Methode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 422 20.2.3 Eingangs-Fuzzy-Mengen nur teilweise überlappend, MAX-PRODInferenzmethode und Singletons als Ausgangs-Fuzzy-Mengen . . . . . 423
A
20.3
Regelung einer integrierenden Regelstrecke mit einem Fuzzy-Regler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 425
20.4
Stabilität von Fuzzy-Regelungssystemen. . . . . . . . . . . . . . . . . . . . . . . . . . 431
Formeln zur Matrizenrechnung
433
A.1
Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433
A.2
Determinanten, Minoren und Kofaktoren . . . . . . . . . . . . . . . . . . . . . . . . . 439
A.3
Adjungierte und inverse Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 442
A.4
Lineare Unabhängigkeit, Rang einer Matrix . . . . . . . . . . . . . . . . . . . . . . 445
A.5
Eigenwerte und Eigenvektoren. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 447
A.6
Das Caley-Hamilton-Theorem. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 450
A.7
Definite und semidefinite Matrizen, Normen von Vektoren und Matrizen, Orthogonalität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 450
Literaturverzeichnis
453
Glossar deutsch – englisch
459
Namens- und Sachverzeichnis
467
Teil I
Mehrgrößen-Regelsysteme
1
Zustandsdarstellung von Eingrößensystemen
Eine Einführung in die Regelung von technischen Systemen wird im Allgemeinen anhand von Eingrößensystemen durchgeführt. Diese Systeme oder Anlagen besitzen eine Stellgröße für ihre Beeinflussung und eine dominierende Ausgangs- oder Regelgröße. Beispiele hierfür sind ein Gleichstrommotor (Stellgröße: Steuerspannung und Regelgröße: Drehzahl oder Drehwinkel), ein Flüssigkeitsbehälter (Stellgröße: Zufluss pro Zeiteinheit und Regelgröße: Füllstand) oder eine Raumheizung (Stellgröße: Heizleistung und Regelgröße: Temperatur). In diesem Kapitel soll zunächst eine Einführung in die Beschreibung von Eingrößensystemen durch Differentialgleichung und Übertragungsfunktion gegeben werden. Sowohl der Regler als auch die Regelstrecke werden derart beschrieben. Durch Messung und Rückführung der Regelgröße, Soll-/Istwertvergleich und Verwendung eines Reglers entsteht dann der klassische einschleifige Regelkreis. Die Betrachtung der Eingrößensysteme wird einführend am Beispiel des dynamischen Verhaltens und der Regelung eines permanenterregten Gleichstrommotors durchgeführt. An diesem Beispiel lässt sich die typische Untersuchung von Regelsystemen gut erläutern, da ein derartiger Motor die hinreichende Komplexität für die Analyse aufweist. Dabei werden auch die Anforderungen an die Auslegung von Regelkreisen kurz aufgeführt. Ausgehend von dieser Einführung wird dann zur Beschreibung von dynamischen Systemen durch die Zustandsgleichungen übergegangen. Die Zustandsdarstellung wird zunächst allgemein an einem Beispiel zweiter Ordnung erläutert. Die Lösung wird dann auf Systeme n-ter Ordnung verallgemeinert. Da die Form der Zustandsdarstellung nicht eindeutig ist, werden einige unterschiedliche kanonische Formen der Zustandsdarstellung betrachtet.
1.1
Klassische Eingrößenregelung
Beschreibung. Bei der Regelung von Eingrößensystemen werden Regelstrecken mit einer Ein- und einer Ausgangsgröße, dargestellt als Block wie in Abb. 1.1, geregelt. Die Regelgröße bezeichnet man üblicherweise mit x(t), das Stellsignal mit y(t) und die Störgröße(n) mit z(t).
4
1 Zustandsdarstellung von Eingrößensystemen Störgröße z(t)
? Stellgröße y(t)
-
Regelstrecke
Regelgröße x(t)
-
Abbildung 1.1: Blockdarstellung einer Regelstrecke
Die gleichungsmäßige Beschreibung des Übertragungsverhaltens einer derartigen Regelstrecke geht im Allgemeinen von den zugrunde liegenden Differentialgleichungen aus. Dies soll am Beispiel eines Gleichstrommotors erläutert werden, dessen technologische Ersatzdarstellung Abb. 1.2 zeigt:
d
uA
iA -
RA
LA
N ? d
ma , n mw e# A S J "! ?
Abbildung 1.2: Technologische Ersatzdarstellung eines Gleichstrommotors Die Grundgleichungen für die Beschreibung des Gleichstrommotors lauten1 : RA iA + LA diA + eA Maschengleichung dt 2πn · cΨf Induktionsgesetz iA · cΨf Momentengleichung Impulssatz (Bewegungsgl.). 2 πJ · dn dt Durch Einsetzen und Umformen ermittelt man dann die resultierende Differentialgleichung des Gleichstrommotors zu: uA eA ma ma − mw
= = = =
2πJLA 2πJRA RA LA ·n ¨+ · n˙ + 2πcΨf · n = uA − · mw − ·m ˙ w . (1.1) cΨf cΨf cΨf cΨf Eingangsgröße des Motors ist die Ankerspannung ua (t) und die Ausgangsgröße ist die Drehzahl n(t) (oder gegebenenfalls auch der Drehwinkel ϕ(t)). Das Lastmoment mw (t) ist die auf den Motor wirkende Störgröße. 1 Hierin bedeuten: J - Trägheitsmoment, RA - Ankerkreiswiderstand, LA - Ankerkreisinduktivität, Ψf - verketteter Fluss, c - Maschinenkonstante, ma (t) - Antriebsmoment, mw (t) Lastmoment.
1.1 Klassische Eingrößenregelung
5
Diese Beschreibung des dynamischen Verhaltens des Gleichstrommotors durch eine Differentialgleichung wird in der Regelungstechnik im Allgemeinen überführt in die Beschreibung durch eine oder mehrere Übertragungsfunktionen: N (s) = FSy (s) · UA (s) + FSz (s) · MW (s),
(1.2)
mit2 N (s) = L{n(t)}, UA (s) = L{uA (t)}, MW (s) = L{mW (t)} und den Übertragungsfunktionen 1
FSy (s) =
N (s) = UA (s)
FSz (s) =
N (s) = MW (s)
2πJLA cΨf
·
s2
+
2πJRA cΨf
und
· s + 2πcΨf
RA − cΨ − f 2πJLA cΨf
· s2 +
LA cΨf s 2πJRA cΨf · s +
2πcΨf
.
(1.3)
(1.4)
Die Blockdarstellung von Abb. 1.1 wird dann ersetzt durch die Blockdarstellung nach Abb. 1.3 mit den Übertragungsfunktionen als Blöcken in der Darstellung: Regelstrecke
UA (s)
- FSy (s)
MW (s) ? FSz (s) + + ? i -
N (s) -
Abbildung 1.3: Blockdarstellung mit Übertragungsfunktionen Nach Rückführung der Regelgröße und Entwurf eines Reglers mit der Übertragungsfunktion FR (s) entsteht dann der in Abb. 1.4 dargestellte einschleifige Regelkreis mit MW (s) ? FSz (s)
Regelstrecke USt¨or (s) – ? UA (s) NW (s) - h - FR (s) UR- h - FSy (s) – 6
+ + ? h -
N (s) Abbildung 1.4: Einschleifiger Regelkreis
der Führungsgröße NW (s) und einer zusätzlich hinzugefügten Versorgungsstörgröße USt¨or (s), wie z. B. Schwankungen der Ankerspannung. 2
Mit L{x(t)} = X(s) wird die Laplace-Transformierte der Größe x(t) bezeichnet.
6
1 Zustandsdarstellung von Eingrößensystemen
Für die Regelung eines derartigen Systems hat sich der (reale) PID-Regler mit der Übertragungsfunktion FR (s) =
Xa (s) 1 + T N s + T N T V s2 = KP · Xe (s) TN s · (1 + TD s)
(1.5)
mit Xa (s) = UR (s), Xe (s) = NW (s) − N (s) und TN , TV und TD als Zeitkonstanten, als der geeignete Regler erwiesen3 . Tritt keine Laststörung (mW (t)) auf, so geht der obige Regelkreis nach Abb. 1.4 über in die Standarddarstellung eines einschleifigen Regelkreises nach Abb. 1.5. Der Entwurf der
Sollwert W (s)
- i– 6
FR (s)
Stellgröße Y (s)
Störgröße Z(s)
– ? - i -
FS (s)
Regelgröße X(s)
-
Abbildung 1.5: Einschleifiger Regelkreis
Übertragungsfunktion FR (s) ist die zentrale Aufgabe der klassischen Regelungstechnik. Ein dominierendes Entwurfsverfahren ist dabei das Verfahren der dynamischen Kompensation, bei dem Pole und Nullstellen der Übertragungsfunktion der Regelstrecke durch geeignete Nullstellen und Pole des Reglers kompensiert werden. Andere Entwurfsverfahren gehen auf grafische Darstellungen wie z. B. das Bode-Diagramm oder die Wurzelortskurve über und leiten unter Zuhilfenahme dieser Ortskurven die Übertragungsfunktion des Reglers ab. Entwurfsanforderungen. Die zentralen Anforderungen an den Regelkreis beim Entwurf dieser Regler-Übertragungsfunktion FR (s) lauten dabei: 1. Der Regelkreis muss stabil sein. Ohne diese Hauptforderung ist die Erfüllung weiterer Anforderungen nicht möglich, bzw. hinfällig. 2. Der Regelkreis soll ein „gutes“ Führungsverhalten aufweisen. D. h., nach Vorgabe einer Führungsgröße w(t) soll die Regelgröße x(t) auf die Führungsgröße einschwingen. Dieser Einschwingvorgang ist näher zu spezifizieren. Falls die Führungsgröße zeitveränderlich ist, soll die Regelgröße der Führungsgröße folgen. 3. Der Regelkreis soll ein „gutes“ Störverhalten aufweisen. D. h., der Einfluss einer Störung z(t) auf die Regelgröße x(t) soll gering sein. Dieser Einfluss wird beschrieben durch Größen eines Einschwingvorgangs. 3
Dabei soll außer Acht gelassen werden, dass die Verwendung zweier einschleifiger Regelkreise in Form einer Kaskadenregelung bei einem Gleichstrommotor bessere Ergebnisse liefert.
1.2 Zustandsgleichungen von Eingrößensystemen
7
4. Der Einfluss von Parameteränderungen auf das dynamische Verhalten des Regelkreises soll gering sein. D. h., der Regelkreis soll möglichst unempfindlich (robust) gegenüber Schwankungen von Parametern (z. B. der Regelstrecke) sein. Einen guten Überblick über die Methoden und Verfahren zum Entwurf geeigneter Regler findet man in der Literatur wie z. B. [19], [22], [43], [45], [53], [57], [62], [64], [65].
1.2
Zustandsgleichungen von Eingrößensystemen
1.2.1
Ermittlung aus der Differentialgleichung, Normalformen
Einführung. Die Beschreibung von dynamischen Systemen durch Zustandsgleichungen lässt sich anschaulich an einem System 2. Ordnung erklären. Dies könnte z. B. der Gleichstrommotor von Abschnitt 1.1 sein, bei dem zunächst das Störmoment mw (t) zu Null angenommen wird. Die Differentialgleichung eines derartigen Systems lautet dann in allgemeiner Form: ¨a + a1 x˙ a + a0 xa = b0 xe . a2 x
(1.6)
Hierin entspricht xe (t) der Eingangsgröße und xa (t) der Ausgangsgröße des Systems. Mit den Substitutionen x1 = xa x˙ 1 = x˙ a = x2
und
(1.7) (1.8)
kann Gleichung 1.6 umgeformt werden zu
x¨a = x˙ 2 = =
1 · [−a1 x˙ a − a0 xa + b0 xe ] a2
1 · [−a1 x2 − a0 x1 + b0 xe ] . a2
(1.9)
Aus der Differentialgleichung 2. Ordnung werden zwei Differentialgleichungen 1. Ordnung, dies sind die Gleichungen 1.8 und 1.9. Aus diesen zwei Differentialgleichungen 1. Ordnung bildet man dann eine Vektordifferentialgleichung 1. Ordnung wie folgt:
x1 x2
• =
0 1 a0 − a1 −a a2 2
0 x1 · + b0 · xe . x2 a2
8
1 Zustandsdarstellung von Eingrößensystemen
Die Ausgangsgröße xa (t) folgt dann aus Gleichung 1.7 zu x1 . xa = 1 0 · x2 Nun werden die folgenden Abkürzungen4 0 0 1 A= b = b0 a1 0 −a a2 − a2 a2
cT = 1 0
(1.10)
mit A als Dynamikmatrix, b als Eingangsvektor und cT als Ausgangsvektor eingeführt. Darin ist cT der transponierte Vektor von c. Die Größen x1 und x2 heißen die Zustandsvariablen des Systems, sie bilden den Zustandsvektor x(t) x1 (t) xa (t) x(t) = = . x2 (t) x˙ a (t) Mit diesen Abkürzungen kann dann die Differentialgleichung 2. Ordnung als Vektordifferentialgleichung 1. Ordnung in der allgemeinen Form x˙ = A · x + b · xe xa = cT · x geschrieben werden. Diese Darstellung einer Differentialgleichung durch eine Vektordifferentialgleichung mit den Matrizen A, b, c und dem Zustandsvektor x nennt man die Zustandsdarstellung der Differentialgleichung. Aufgabe 1.1: Berechnen Sie die Matrizen A, b, cT und den Zustandsvektor x für die folgende Differentialgleichung: x¨a (t) + 4x˙ a (t) + 3xa (t) = 2xe (t). Lösung: A =
0 1 0 xa T ,b= , c = 1 0 und x = . −3 −4 2 x˙ a
Aufgabe 1.2: Berechnen Sie die Matrizen A, b, cT und den Zustandsvektor x für die Differentialgleichung des Gleichstrommotors nach Gleichung 1.1 mit uA (t) als Eingangsgröße: 2πJLA 2πJRA ·n ¨+ · n˙ + 2πcΨf · n = uA cΨf cΨf 4 Fettgedruckte Großbuchstaben bezeichnen Matrizen und fettgedruckte Kleinbuchstaben bezeichnen Vektoren. Skalare Größen werden durch nicht fettgedruckte Kleinbuchstaben bezeichnet.
1.2 Zustandsgleichungen von Eingrößensystemen Lösung: A = n x= . n˙
0 (cΨ ) − JLfA
1 2
A −R LA
,
b =
9 0 cΨf 2πJLA
,
cT
=
1 0
und
Sprungfähige Systeme, Regelungsnormalform der Zustandsdarstellung. Die zwei Differentialgleichungen 1.8 und 1.9 können in einem Simulationsdiagramm (siehe Abb. 1.6) dargestellt werden. Darin entspricht der Block mit dem Integralzeichen einer Integration, und die anderen Blöcke stellen die Multiplikation mit einem konstanten Faktor dar. xe
- b0 a2
¨a x˙ a = x2 + i x − 6 K A − A a1 A a2
x1 = xa -
a0 a2
Abbildung 1.6: Simulationsdiagramm der Vektordifferentialgleichung
Mit diesem Simulationsdiagramm kann man sich auf einfache Art und Weise auch die Herleitung der Zustandsgleichungen für Differentialgleichungen mit Ableitungen der Eingangsgröße xe (t) klarmachen. Das Vorgehen soll wieder für eine Differentialgleichung 2. Ordnung erläutert werden. Die Differentialgleichung laute a2 x ¨a + a1 x˙ a + a0 xa = b0 xe + b1 x˙ e + b2 x ¨e ,
(1.11)
die Eingangsgröße xe (t) ist also bis zu zweimal abgeleitet. Systeme, bei denen die höchste Ableitung der Größen xa (t) und xe (t) in der Differentialgleichung identisch ist, bezeichnet man als sprungfähige Systeme. Bei einem Sprung der Eingangsgröße xe (t) ändert sich auch die Ausgangsgröße sprungförmig. Anstelle der Differentialgleichung 1.11 wird zunächst die reduzierte Differentialgleichung ¨1 + a1 x˙ 1 + a0 x1 = xe a2 x
(1.12)
analysiert. Für diese reduzierte Differentialgleichung gilt analog zu Abb. 1.6 das Simulationsdiagramm von Abb. 1.7. Das reduzierte System hat als alleinige Eingangsgröße nur xe , und die zugehörige Ausgangsgröße resultiert dann als x1 (t). Die rechte Seite der Differentialgleichung 1.11, d. h. die Anregung der Differentialgleichung, lautet jedoch vollständig b0 xe + b1 x˙ e + b2 x ¨e . Da Eingang xe den Ausgang x1 ergibt (siehe Abb. 1.7) bzw. Eingang b0 xe den Ausgang b0 x1 , muss Eingang b1 x˙ e den Ausgang b1 x˙ 1 ergeben (da die Differentiation eine lineare
10
1 Zustandsdarstellung von Eingrößensystemen xe
x˙ 1 + i x¨1 - K− A −6 A a1 A a2
- 1 a2
x1
Abbildung 1.7: Simulationsdiagramm der reduzierten Differentialgleichung
a0 a2
¨1 erzeugen. Somit resultiert Operation darstellt) und ebenso muss b2 x¨e den Ausgang b2 x die Ausgangsgröße xa dieser Differentialgleichung dann als lineare Überlagerung von ¨1 ⇒ xa . b0 x1 + b1 x˙ 1 + b2 x Dieser Aufbau des Ausgangssignals xa ergibt dann eine Erweiterung des Simulationsdiagramms 1.7 und ist in Abb. 1.8 dargestellt [36]. - b2 - b1 xe
- 1 a2
¨1 = x˙ 2 x˙ 1 = x2 + hx tt− K A 6 − A a1 A a2
x1 t
- b0
B
B+ x +-BN h a+
a0 a2 Abbildung 1.8: Simulationsdiagramm der vollständigen Differentialgleichung 2. Ordnung Aus diesem Simulationsdiagramm 1.8 leitet man dann die Zustandsdarstellung der Differentialgleichung 2. Ordnung wie folgt ab. Es gilt:
x˙ 1 = x2 xe a1 a0 − x2 − x1 x ¨1 = x˙ 2 = a2 a2 a2 xa = b0 x1 + b1 x2 + b2 x˙ 2 .
(1.13) (1.14) (1.15)
1.2 Zustandsgleichungen von Eingrößensystemen
11
Diese Gleichungen 1.13 und 1.14 ergeben die Vektordifferentialgleichung • 0 0 1 x1 x1 = a0 − a1 · x + 1 · xe −a x2 2 a2 a 2 2
mit der Dynamikmatrix A und dem Eingangsvektor b wie folgt: 0 0 1 A= . b= 1 a1 0 −a a2 − a2 a2
(1.16)
Das Einsetzen von Gleichung 1.14 in 1.15 ergibt dann xa = b0 x1 + b1 x2 + b2 x˙ 2
xe a1 a0 = b0 x1 + b1 x2 + b2 · − x2 − x1 a2 a2 a2 b2 a0 a1 · x1 + b1 − b2 · x2 + xe = b0 − b2 a2 a2 a2 x1 b2 = b0 − b2 aa02 b1 − b2 aa12 · + · xe . x2 a2
(1.17)
Dann lauten die mit Ausgangsvektor cT und Durchgangsfaktor d bezeichneten Größen b2 a0 a1 T c = b 0 − b 2 a2 b 1 − b 2 a2 d= . (1.18) a2 Dieser Durchgangsfaktor d ist nur bei einem sprungfähigen System, d. h. bei einer Differentialgleichung mit gleicher Ordnung der höchsten Ableitung von xa und xe von Null verschieden. Die Extrapolation der Ergebnisse von Gleichung 1.16 und 1.18 führt von der Differentialgleichung n-ter Ordnung in der Form n
n−1 a
an xa +an−1 x
n
+ . . . + a1 x˙ a + a0 xa = b0 xe + b1 x˙ e + . . . + bn xe
zu den dazugehörigen Zustandsgleichungen: x˙ = A · x + b · xe xa = cT · x + d · xe , mit den Matrizen und Vektoren ⎡ ⎤ ⎤ ⎡ 0 0 1 0 ··· 0 ⎢ 0 ⎥ ⎢ 0 ⎥ 0 1 ··· 0 ⎢ ⎥ ⎢ . ⎥ .. .. .. ⎢ .. ⎥ ⎥ ⎢ A = ⎢ . b = ⎢ .. ⎥ ⎥ . . . ⎢ ⎥ ⎥ ⎢ ⎣ 0 ⎦ ⎣ 0 ⎦ 0 0 ··· 1 an−1 1 − aan0 − aan1 − aan2 · · · − a an n a cT = b0 − bn aan0 b1 − bn aan1 b2 − bn aan2 · · · bn−1 − bn n−1 an bn d = , an
(1.19) (1.20)
(1.21)
(1.22) (1.23)
12
1 Zustandsdarstellung von Eingrößensystemen
und dem Zustandsvektor x zu ⎤ ⎡ x1 ⎢ x2 ⎥ ⎥ ⎢ x(t) = ⎢ . ⎥ . ⎣ .. ⎦ xn Diese Form der Zustandsdarstellung bezeichnet man als Regelungsnormalform und die Form der A-Matrix bezeichnet man als Frobenius-Form. Man kann die Zustandsbeschreibung dieses Systems mit den Matrizen A, b, c und d und dem Zustandsvektor x (Anfangszustand x(0)) in einem Blockschaltbild, wie in Abb. 1.9 gezeigt, darstellen5 . Dabei repräsentiert der Block mit dem Integralzeichen die Integration des Zustandsvektors x. Die anderen Blöcke enthalten die jeweiligen Systemmatrizen. -
d x(0)
xe (t)
-
x(t) ˙ i
b
. . . dt
x(t)
cT
?xa (t) - i -
+ A Abbildung 1.9: Allgemeines Blockschaltbild der Zustandsbeschreibung
Nicht sprungfähige Systeme. Bei einem nicht sprungfähigen System (d. h. bn = 0) vereinfachen sich bei unveränderter Dynamikmatrix A und unverändertem Eingangsvektor b der Ausgangsvektor cT und der Durchgangsfaktor d zu: und d=0. (1.24) cT = b0 b1 b2 · · · bn−1 Besonders einfach wird die Zustandsdarstellung für eine normierte Differentialgleichung mit an = 1 und bn = 0 n
n−1 e
n−1
xa + an−1 xa + . . . + a1 x˙ a + a0 xa = b0 xe + b1 x˙ e + . . . + bn−1 x
.
Dann besitzt für diese Differentialgleichung die Regelungsnormalform die Matrizen ⎡
0 0 .. .
1 0 .. .
0 1 .. .
··· ···
0 0 .. .
⎤
⎢ ⎥ ⎢ ⎥ ⎢ ⎥ A = ⎢ ⎥ ⎣ 0 0 0 ··· 1 ⎦ −a0 −a1 −a2 · · · −an−1 T b0 b1 b2 · · · bn−1 c = 5
⎡ ⎤ 0 ⎢0⎥ ⎢.⎥ ⎥ b=⎢ ⎢ .. ⎥ ⎣0⎦
(1.25)
1 d=0.
Es werden vektorielle Größen im Blockschaltbild durch breite Pfeile dargestellt.
(1.26)
1.2 Zustandsgleichungen von Eingrößensystemen
13
In der letzten Zeile der Matrix A stehen die Koeffizienten ai mit negativem Vorzeichen. Oberhalb der Hauptdiagonalen von A steht eine Eins, alle weiteren Elemente von A sind Null. Der Vektor cT enthält die Koeffizienten bi . Vektor b ist bis auf das letzte Element gleich Null. Die normierte Blockdarstellung dieser Form mit an = 1, bn = 0 und einzelnen Integratoren zeigt Abb. 1.10. Die mit einem Faktor multiplizierte Aufsummierung der xi und ihrer Ableitungen ergibt die Ausgangsgröße xa . -f 6 bn−1
bn xe (t)- f − 6
n
6 i r x-
r6 ?
(t) - fxa6
-f 6 b1
n−1 -xi
-
r6 x˙ i ? a1
an−1 ? f
b0
xi r6 ? a0
? f
Abbildung 1.10: Normierte Blockdarstellung der Regelungsnormalform
Aufgabe 1.3: Berechnen Sie die Matrizen A, b, cT in Regelungsnormalform und den Zustandsvektor x für die folgende Differentialgleichung: ...
x a (t) + 6¨ xa (t) + 11x˙ a (t) + 6xa (t) = 3xe (t) . ⎡
⎤ 0 1 0 Lösung: A = ⎣ 0 0 1 ⎦, −6 −11 −6
⎡ ⎤ 0 b = ⎣ 0 ⎦, 1
cT = 3 0 0 ,
⎤ x1 x = ⎣ x2 ⎦. x3 ⎡
Aufgabe 1.4: Berechnen Sie die Matrizen A, b, cT in Regelungsnormalform und den Zustandsvektor x für die folgende Differentialgleichung: ...
x a (t) + 2¨ xa (t) + 4x˙ a (t) + 3xa (t) = xe (t) + 3x˙ e (t) + 2¨ xe (t) . ⎡
⎤ 0 1 0 Lösung: A = ⎣ 0 0 1 ⎦, −3 −4 −2
⎡ ⎤ 0 b = ⎣ 0 ⎦, 1
cT = 1 3 2 ,
⎤ x1 x = ⎣ x2 ⎦ . x3 ⎡
14
1 Zustandsdarstellung von Eingrößensystemen
Aufgabe 1.5: Berechnen Sie die Matrizen A, b, cT und d in Regelungsnormalform sowie den Zustandsvektor x für die folgende Differentialgleichung: ...
...
xa (t) + 5x˙ a (t) + 3xa (t) = xe (t) + 3x˙ e (t) + 4¨ xe (t) + 2 x e (t) . 2 x a (t) + 4¨ ⎡
⎤ 0 1 0 0 1 ⎦, Lösung: A = ⎣ 0 −1,5 −2,5 −2 ⎡ ⎤ x1 d = 1 und x = ⎣ x2 ⎦. x3
⎡
⎤ 0 b = ⎣ 0 ⎦, 0,5
cT = −2 −2 0 sowie
Beobachtungsnormalform. Die als Beobachtungsnormalform bezeichnete Darstellung soll anhand einer Differentialgleichung dritter Ordnung entwickelt werden. Es gelte die Differentialgleichung ... xa
+ a2 x¨a + a1 x˙ a + a0 xa = b0 xe + b1 x˙ e + b2 x ¨e .
Es wird als erstes der Term a0 xa auf die rechte Seite gebracht und die Zustandsvariable x˙ 1 definiert: ... xa
= x˙ 1 + a2 x¨a + a1 x˙ a = b0 xe − a0 xa + b1 x˙ e + b2 x ¨e = b1 x˙ e + x˙ 1 + b2 x ¨e .
Danach bringt man den Term a1 x˙ a auf die rechte Seite und definiert die Zustandsvariable x¨2 : ... xa
= x¨2 + a2 x¨a = b1 x˙ e + x˙ 1 − a1 x˙ a + b2 x¨e = b2 x ¨e + x ¨2 .
Zuletzt bringt man den Term a2 x¨a auf die rechte Seite und definiert die Zustandsvariable ... x 3 = x a , d. h. x3 = xa :
...
...
= x3 ... ... x a = b2 x ¨e + x ¨ 2 − a2 x ¨a = x 3 . Die Zusammenfassung der eingeführten Definitionen der Zustandsvariablen ergibt: x˙ 1 x˙ 2 x˙ 3 xa
= = = =
b0 xe − a0 xa b1 xe + x1 − a1 xa b2 xe + x2 − a2 xa x3
1.2 Zustandsgleichungen von Eingrößensystemen
15
Daraus resultiert die Zustandsdarstellung ⎡
⎤• ⎤ ⎡ ⎤ ⎡ ⎤ ⎡ x1 x1 b0 0 0 −a0 ⎣ x2 ⎦ = ⎣ 1 0 −a1 ⎦ · ⎣ x2 ⎦ + ⎣ b1 ⎦ · xe x3 0 1 −a2 x3 b2 ⎡ ⎤ x1 xa = 0 0 1 · ⎣ x2 ⎦ . x3
und
Abb. 1.11 zeigt eine Blockdarstellung dieses Systems in Beobachtungsnormalform. ? b0
xe
? b1
? f x˙ 1− 6 a0 6
x1 - f ? x˙ 2 − 6 a1 6
? b2
x2 - f ? x˙ 3 − 6 a2
xa = -x3
6
Abbildung 1.11: Blockdarstellung der Beobachtungsnormalform Die Erweiterung dieser Darstellung für eine normierte Differentialgleichung n-ter Ordnung n
n−1
x a + . . . + a2 x ¨a + a1 x˙ a + a0 xa = b0 xe + b1 x˙ e + . . . + bn−1 xe ergibt die Zustandsdarstellung in Beobachtungsnormalform als ⎡
⎤ ⎡ ⎤ ⎡ ⎤ x1 b0 0 0 0 . . . −a0 ⎢ 1 0 0 . . . −a1 ⎥ ⎢ x2 ⎥ ⎢ b1 ⎥ ⎥ ⎢ ⎥ ⎥ ⎢ ⎥ ⎢ ⎥ ⎥ = ⎢ 0 1 0 . . . −a2 ⎥ · ⎢ x3 ⎥ + ⎢ b2 ⎥ · xe ⎢ ⎢ ⎢. ⎥ ⎥ ⎥ ⎥ .. ⎣ .. ⎦ ⎦ ⎣ ... ⎦ ⎣ ... ⎦ . xn 0 0 1 −an−1 xn bn−1 ⎤ ⎡ x1 ⎢ x2 ⎥ ⎢x ⎥ 3 ⎥ xa = 0 0 . . . 0 1 · ⎢ ⎢ . ⎥ . ⎣ .. ⎦ xn
x1 ⎢ x2 ⎢x ⎢ 3 ⎢ . ⎣ ..
⎤•
⎡
und
(1.27)
(1.28)
In dieser Beobachtungsnormalform lassen sich besonders einfach mehrere Eingangsgrößen, wie z. B. Stell- und Störsignal bei der Differentialgleichung des Gleichstrommotors,
16
1 Zustandsdarstellung von Eingrößensystemen
berücksichtigen. Die Zustandsdarstellung des Gleichstrommotors nach Gleichung 1.1 lautet dann • (cΨ )2 cΨf RA − 2πJL x1 x1 0 − JLfA 2πJL A A = · · uA + + · mw 1 A x2 x2 − 2πJ 0 1 −R LA x1 n = 0 1 · , x2 bzw. in Kurzform
x˙ = A · x + b · ua + b · mw n = cT · x . Das Blockschaltbild dieser Zustandsdarstellung zeigt Abb. 1.12. mw (t) ? b
x(0) uA (t)
-
b
x(t) ˙ i . . . dt +
x(t)
cT
n(t) -
A Abbildung 1.12: Blockschaltbild des Gleichstrommotors mit zwei Eingangsgrößen
Diagonalform der Zustandsdarstellung. Die Repräsentation einer Differentialgleichung durch ihre Zustandsdarstellung ist, wie die beiden obigen Normalformen zeigen, nicht eindeutig. Der nachfolgenden Differentialgleichung mit m ≤ n n
m
an x a + . . . + a2 x ¨a + a1 x˙ a + a0 xa = b0 xe + b1 x˙ e + . . . + bm x e entspricht die Übertragungsfunktion F (s) =
Xa (s) b 0 + b 1 s + b 2 s2 + . . . + b m sm = . Xe (s) a0 + a1 s + a2 s2 + . . . + an sn
Die Residuendarstellung dieser Übertragungsfunktion lautet für einfache Pole spi von F (s) F (s) =
Xa (s) α1 α2 αn = α0 + + + ···+ . Xe (s) s − sp1 s − sp2 s − spn
1.2 Zustandsgleichungen von Eingrößensystemen
17
Die Terme αi sind die Residuen. Der Term α0 ist nur für m = n von Null verschieden. αi Jeder Einzelterm Xi (s)/Xe (s) = s − spi entspricht hierbei einer Differentialgleichung 1. Ordnung x˙ i = spi · xi + αi · xe . Der Ausgang xa (t) ist dann die Summe der n einzelnen Terme xi (t). Hieraus kann man direkt eine einfache Zustandsdarstellung ableiten zu ⎡
⎤ ⎡ ⎤ ⎡ ⎤ x1 α1 sp1 0 · · · 0 ⎥ ⎢ 0 sp2 · · · 0 ⎥ ⎢ x2 ⎥ ⎢ α2 ⎥ ⎥ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ = ⎢ .. .. .. ⎥ · ⎢ .. ⎥ + ⎢ .. ⎥ · xe ⎦ ⎣ . . . ⎦ ⎣ . ⎦ ⎣ . ⎦ xn xn αn 0 0 · · · spn
x1 ⎢ x2 ⎢ ⎢ .. ⎣ .
⎤•
⎡
⎡
xa =
1
1 ···
x1 x ⎢ ⎢ 2 1 ·⎢ . ⎣ ..
⎤ ⎥ ⎥ ⎥ + α0 · xe ⎦
xn mit den Systemmatrizen und Vektoren ⎤ sp1 0 · · · 0 ⎢ 0 sp2 · · · 0 ⎥ ⎥ ⎢ A = ⎢ . . .. ⎥ ⎣ .. .. . ⎦ 0 0 · · · spn T c = 1 1 ··· 1 ⎡
⎡
α1 ⎢ α2 ⎢ b=⎢ . ⎣ ..
⎤ ⎥ ⎥ ⎥ ⎦
(1.29)
αn d = [α0 ] .
(1.30)
Diese Darstellungsform bezeichnet man als Diagonalform der Zustandsdarstellung, oder auch als Jordan’sche Normalform. Außer der bisher genannten Regelungs- und Beobachtungsnormalform sowie der Diagonalform existieren weitere Normalformen der Zustandsdarstellung von Systemen. Mit geeigneten Transformationen [36] (siehe auch Kapitel 3.3) können die Darstellungen von einer in die andere Normalform umgerechnet werden.
1.2.2
Ermittlung aus den Systemgleichungen
Eine weitere Methode zur Aufstellung der Zustandsgleichungen, die sich insbesondere bei den Mehrgrößensystemen als sehr vorteilhaft erweist, geht von den zugrunde liegenden Systemgleichungen aus. Dies soll am Beispiel des Gleichstrommotors erläutert werden.
18
1 Zustandsdarstellung von Eingrößensystemen
Die vier Grundgleichungen für die Beschreibung des Gleichstrommotors lauten gemäß Seite 4 = RA iA + LA diA + eA Maschengleichung uA dt eA = 2πn · cΨf Induktionsgesetz = iA · cΨf Momentengleichung ma Impulssatz (Bewegungsgl.). ma − mw = 2 πJ · dn dt Herleitung ohne Lastmoment. Es sei für die folgenden Betrachtungen zunächst das Lastmoment mw (t) ≡ 0. Nach Ersetzen von eA (t) in der Maschengleichung und ma (t) im Impulssatz resultieren die zwei Gleichungen: uA = RA iA + LA iA · cΨf = 2πJ ·
diA + 2πn · cΨf dt
dn . dt
(1.31)
Nun bringt man die Terme mit der Ableitung auf die linke Seite und erhält: diA 1 = · {−RA iA − 2πn · cΨf + uA } dt LA 1 dn = · {iA · cΨf } . dt 2πJ Wählt man nun als Zustandsvariablen die Größen iA (t) und n(t), so lauten die Zustandsgleichungen • RA 2πcΨf 1 − LA − LA iA (t) iA (t) = cΨf · + LA · uA (t) . n(t) n(t) 0 0 2πJ Die Ausgangsgröße n(t) resultiert zu iA (t) n(t) = 0 1 · . n(t) Es resultiert eine andere Zustandsdarstellung als in Aufgabe 1.2. Während dort die Zustandsvariablen die Größen n(t) und n(t) ˙ waren, sind es bei der obigen Vorgehensweise die Größen n(t) und iA (t). Die Zustandsvariablen sind im Allgemeinen physikalisch messbare Größen, bzw. man wählt sie als solche. Dies ist bei den Verfahren, die zu den speziellen Normalformen führen, nicht immer der Fall. Das Ein-/Ausgangsverhalten von uA (t) nach n(t) ist dasselbe obwohl andere Zustandsvariablen vorliegen. Dies liegt daran, dass die Zustandsdarstellung bezüglich der Zustandsvariablen und der Matrizen A, b ... nicht eindeutig ist, obwohl das Ein-/Ausgangsverhalten unverändert erhalten bleibt.
1.3 Ermittlung der Übertragungsfunktion
19
Herleitung mit Lastmoment. Ist das Lastmoment mw (t) nicht gleich Null, so lautet Gleichung 1.31 iA · cΨf = 2πJ ·
dn + mw . dt
Aufgelöst nach n˙ folgt daraus: dn cΨf 1 = · iA − · mw . dt 2πJ 2πJ Damit resultiert die Zustandsdarstellung für den Gleichstrommotor mit Stell- und Störgröße zu: • RA 2πcΨ 1 − LA − LA f 0 i ia · A + LA · uA + = cΨf · mw . 1 n n − 2πJ 0 0 2πJ
Die Dynamikmatrix A entspricht bei dieser Vorgehensweise keiner der zuvor behandelten Normalformen für Eingrößensysteme. Die Ausgangsgleichung für n(t) bleibt unverändert iA (t) n(t) = 0 1 · . n(t) Auch in dieser Form kann man die Regelstrecke Gleichstrommotor als Block mit zwei Eingängen und einem Ausgang in einem Blockschaltbild darstellen. Diese Blockdarstellung ist dann äquivalent zu der Darstellung nach Abb. 1.9, die Systemmatrizen sind nun jedoch andere. Die in diesem Abschnitt behandelte Ermittlung der Zustandsgleichungen aus der Systemdarstellung stellt die Grundlage der Zustandsdarstellung von Mehrgrößensystemen dar.
1.3
Ermittlung der Übertragungsfunktion
Herleitung. Die Beschreibung eines Eingrößensystems durch die Zustandsdarstellung wurde in den Gleichungen 1.19 und 1.20 angegeben zu x˙ = A · x + b · xe xa = cT · x + d · xe .
(1.32) (1.33)
Diese Zustandsdarstellung kann mithilfe der Laplace-Transformation in eine Übertragungsfunktion überführt werden. Die Laplace-Transformation von Gleichung 1.32 ergibt s · X(s) = A · X(s) + b · Xe (s) ,
20
1 Zustandsdarstellung von Eingrößensystemen
mit s als Laplace-Variable und X(s) = L{x(t)} bzw. Xe (s) = L{xe (t)} als Laplacetransformierte Größen x(t) bzw. xe (t). Fasst man die Größen mit X(s) auf der linken Seite zusammen, so erhält man {sI − A} · X(s) = b · Xe (s) , mit I als Einheitsmatrix. Die Linksmultiplikation dieser Gleichung mit {sI − A}−1 führt dann zu X(s) = {sI − A}−1 · b · Xe (s) . Setzt man diese Lösung für X(s) ein in die Laplace-transformierte Gleichung 1.33 Xa (s) = cT · X(s) + d · Xe (s) , (mit Xa (s) = L{xa (t)}) so resultiert für Xa (s) die folgende Gleichung: Xa (s) = cT · {sI − A}−1 · b · Xe (s) + d · Xe (s) . Abschließend fasst man noch die Terme mit Xe (s) zusammen und erhält als Ergebnis die Gleichung Xa (s) = cT · {sI − A}−1 · b + d · Xe (s) .
(1.34)
Die zu Gleichung 1.34 gehörende Übertragungsfunktion lautet dann F (s) =
Xa (s) = cT · {sI − A}−1 · b + d . Xe (s)
(1.35)
Die Anwendung dieser Gleichung soll an dem einfachen Beispiel von Aufgabe 1.1 erläutert werden. Beispiel 1.1: Es seien die Zustandsmatrizen eines Systems gegeben zu 0 1 0 A= , b= , cT = 1 0 und d = 0. −3 −4 2 Man beginnt mit der Berechnung der Matrix {sI − A} welche man auch als charakteristische Matrix6 bezeichnet. Sie lautet hier s −1 {sI − A} = . 3 s+4 6
Näheres hierzu siehe Abschnitt 2.4.
1.3 Ermittlung der Übertragungsfunktion Die Inverse dieser Matrix resultiert zu: s −1 s+4 1 Adj 3 s+4 −3 s = {sI − A}−1 = . s · (s + 4) + 3 s −1 Det 3 s+4
21
(1.36)
Die Determinante der charakteristischen Matrix Det(sI − A) also s −1 Det = s · (s + 4) + 3 = s2 + 4s + 3 = (s + 3) · (s + 1) , 3 s+4 ist das charakteristische Polynom. Es gilt also allgemein die folgende Beziehung: Det(sI − A) = sn + an−1 sn−1 + . . . + a1 s + a0 = (s − λ1 )(s − λ2 ) · · · (s − λn )
(1.37)
mit λi als Wurzeln7 der charakteristischen Gleichung (Det(sI − A) = 0 ) und ai als Koeffizienten der charakteristischen Gleichung. Die Wurzeln der charakterischen Gleichung sind gleichzeitig die charakteristischen Werte oder Eigenwerte der Matrix A (siehe Anhang A.5). Diese Zusammenhänge werden in Kapitel 2 noch ausführlicher betrachtet. Die Linksmultiplikation von Gleichung 1.36 mit cT = 1 0 ergibt dann
cT · {sI − A}−1
s+4 1 −3 s s+4 1 = . = 1 0 · s · (s + 4) + 3 s · (s + 4) + 3
0 Die abschließende Rechtsmultiplikation mit b = führt dann zu: 2 0 s+4 1 2 s+4 1 2 0 · = = 2 . cT {sI − A}−1 b = 2 s · (s + 4) + 3 s · (s + 4) + 3 s + 4s + 3 Damit lautet die Übertragungsfunktion F (s) der gegebenen Zustandsdarstellung unter Beachtung von d = 0 dann F (s) =
2 Xa (s) = 2 . Xe (s) s + 4s + 3
7
Man bezeichnet die Wurzeln einer Gleichung mathematisch auch als Nullstellen der Gleichung.
22
1 Zustandsdarstellung von Eingrößensystemen
Aufgabe 1.6: Die Zustandsmatrizen eines Systems sind gegeben zu: A = 1 b= , cT = 2 0 und d = 0. 2
0 1 , −2 −5
Berechnen Sie die Übertragungsfunktion dieser Zustandsdarstellung. Lösung: F (s) =
2s + 14 s2 + 5s + 2
⎡
⎤ 0 1 0 Aufgabe 1.7: Die Zustandsmatrizen eines Systems sind gegeben zu: A = ⎣ 0 0 1 ⎦, −3 −4 −2 ⎡ ⎤ 0 b = ⎣ 0 ⎦, cT = 1 3 2 und d = 0. 1 Berechnen Sie die Übertragungsfunktion dieser Zustandsdarstellung. Lösung: F (s) =
2s2 + 3s + 1 s3 + 2s2 + 4s + 3
Aufgabe 1.8: Die Zustandsmatrizen eines Systems sind gegeben zu: A = 1 b= , cT = 2 1 und d = 1. 2
1 3 , −2 −4
Berechnen Sie die Übertragungsfunktion dieser Zustandsdarstellung. Lösung: F (s) =
s2 + 7s + 18 s2 + 3s + 2
2
Zustandsdarstellung von Mehrgrößensystemen
Allgemeines. Im Unterschied zu den Eingrößensystemen weisen die Mehrgrößensysteme mehrere Eingangsgrößen und mehrere Ausgangsgrößen auf. Beispiele hierfür sind ein Hydrauliksystem bestehend aus mehreren Behältern mit Zu- und Abflüssen (Stellgrößen: Zufluss 1, 2 . . . und Regelgrößen: Füllstand 1, 2 . . . ), die Längsbewegung eines Flugzeugs (Stellgrößen: Höhenruder und Schub, Regelgrößen: Flughöhe und Geschwindigkeit), ein Dampferzeuger (Stellgrößen: Frischwassereinspeisung und Brennstoffzufuhr, Regelgrößen: Dampfdruck und Dampftemperatur). Auch hier werden die interessierenden Regelgrößen (Istwerte) mit den entsprechenden Sollwerten verglichen und als Eingangsgrößen in einen Mehrgrößenregler geführt. Dieser liefert dann die Stellsignale, die dafür sorgen, dass die Regelgrößen zu den Sollwerten geführt werden. Mehrgrößen-Regelsysteme können wie Eingrößensysteme sowohl im Zeitbereich durch Differentialgleichungen als auch im Frequenzbereich durch Übertragungsfunktionen beschrieben werden. Beide Darstellungen können ineinander überführt werden. Das Schwergewicht bei den Untersuchungen soll hier auf die Darstellung im Zeitbereich gelegt werden. Auf die Analogie zu Eingrößensystemen wird an den Stellen wo es möglich ist hingewiesen.
2.1
Mehrgrößensysteme
2.1.1
Einführung
Definitionen. Systeme mit mehreren Eingangs- und Ausgangsgrößen bezeichnet man in der Regelungstechnik als Mehrgrößensysteme oder als Mehrgrößen-Regelsysteme. Es wirken gleichzeitig mehrere Eingangsgrößen auf das System ein und beeinflussen wechselseitig die vorhandenen Ausgangsgrößen. Die Ein- und Ausgangsgrößen werden zu Vektoren wie folgt zusammengefasst1 : ⎡ ⎤ ⎤ ⎤ ⎡ ⎡ u1 (t) y1 (t) z1 (t) ⎢ u2 (t) ⎥ ⎢ y2 (t) ⎥ ⎢ z2 (t) ⎥ ⎢ ⎥ ⎥ ⎥ ⎢ ⎢ u(t) = ⎢ . ⎥ y(t) = ⎢ . ⎥ z(t) = ⎢ . ⎥ , (2.1) ⎣ .. ⎦ ⎣ .. ⎦ ⎣ .. ⎦ ur (t) 1
ys (t)
zq (t)
Es wird ab hier die für die Zustandsdarstellung von Systemen übliche Schreibweise mit u = xe als Eingangsvektor und y = xa als Ausgangsvektor verwendet.
24
2 Zustandsdarstellung von Mehrgrößensystemen
mit u(t) als Vektor der r Stellgrößen, y(t) als Vektor der s Ausgangsgrößen und z(t) als Vektor der q Störgrößen. Der Übergang zu diesen im Vergleich zum Eingrößensystem geänderten Bezeichnungen ist durch die in Kapitel 1 eingeführte Zustandsdarstellung bedingt. Die Blockdarstellung2 einer Mehrgrößen-Regelstrecke zeigt Abb. 2.1.
Störgrößen z(t) Stellgrößen u(t)
Ausgangsgrößen y(t)
Regelstrecke
Abbildung 2.1: Mehrgrößen-Regelstrecke
Jede der Stell- bzw. Störgrößen uα , α ∈ {1 . . . r}, bzw. zβ , β ∈ {1 . . . q}, beeinflusst eine oder mehrere der Ausgangsgrößen yγ , γ ∈ {1 . . . s}. Ein- und Ausgangsgrößen sind also Regelstrecke mit internen Kopplungen -
u1 u2
z :
.. . ur
* 1
-
q j
- y1 - y2 .. . - ys
Abbildung 2.2: Mehrgrößen-Regelstrecke mit internen Kopplungen
miteinander verkoppelt. Dies deutet die Abb. 2.2 (für z(t) ≡ 0) an. Diese Regelstrecken mit mehreren Eingangs- und Ausgangsgrößen werden mit Reglern geregelt, die ebenfalls mehrere Ein- und Ausgangsgrößen enthalten. Es liegen mehrere Regelgrößen und somit auch mehrere Sollwerte vor. Somit entsteht ein mehrschleifiger Regelkreis, wie ihn Abb. 2.3 darstellt. Bevor auf die mathematische Beschreibung derartiger Mehrgrößen-Regelstrecken sowie auf die Beschreibung und den Entwurf der Mehrgrößenregler eingegangen wird, sollen zunächst einige Beispiele für diese Mehrgrößen-Regelsysteme vorgestellt werden. 2
Es werden vektorielle Größen in der Blockdarstellung als breite Pfeile hervorgehoben.
2.1 Mehrgrößensysteme
25
Störgrößen z(t) Sollwerte w(t)
Stellgrößen u(t)
e(t)
i
Regler
Ausgangsgrößen y(t)
Regelstrecke
–
Abbildung 2.3: Mehrschleifiger Regelkreis – Mehrgrößen-Regelsystem
2.1.2
Beispiele von Mehrgrößensystemen
Beispiel 2.1 Hydraulik-Kaskade: Ein Hydrauliksystem, bestehend aus drei verbundenen Flüssigkeitsbehältern, enthalte die Stellgrößen3 QZu1 und QZu3 und die zwei Störgrößen QAb2 und QAb3 . Der Füllstand h1 und h3 in den Behältern 1 und 3 soll geregelt werden. Abb. 2.4 zeigt die technologische Ersatzdarstellung dieser Regelstrecke. QZu1
QZu3
? 6 h1 ?
?
6
6 h3
h2 V1
V2
?
?
V4 QAb2 ?
V3 QAb3 ?
Abbildung 2.4: Regelstrecke Hydraulik-Kaskade
Die Bauteile V1 bis V4 sollen Ventile darstellen. Aus technischen Gründen kann z. B. die Regelgröße h2 nicht gemessen werden, sondern nur die Größen h1 und h3 sind messtechnisch erfassbar. Aufgrund der Verkopplung der drei Behälter ist die Stellgröße QZu1 nicht nur für Behälter 1 zuständig, sondern sie wirkt ebenso auf Behälter 2 und 3. Entsprechendes gilt für die Stellgröße QZu3 und die Störgrößen QAb2 und QAb3 .
3
Mit der Größe Q als Menge pro Zeiteinheit.
26
2 Zustandsdarstellung von Mehrgrößensystemen
Die klassische Eingrößenregelung kann diese Regelaufgabe nicht bewältigen, da die Systemgrößen Druck, Füllstand, Zufluss und Abfluss sich gegenseitig beeinflussen. Dies ist eine typische Aufgabe für eine Mehrgrößenregelung. Beispiel 2.2 Hubschrauber-Schwebeflug: Die Bewegung eines Hubschraubers im Schwebeflug stellt ebenfalls ein Mehrgrößen-Regelsystem dar. Abb. 2.5 zeigt die Aufsicht und Seitenansichten eines Hubschraubers.
Abbildung 2.5: Aufsicht und Seitenansichten eines Hubschraubers [54]
Stellgrößen für die Bewegung des Hubschraubers sind z. B. der Anstellwinkel des Hauptrotors αM und des Heckrotors αT . Ausgangsgrößen sind z. B. die Höhe z(t) und der Gierwinkel4 Ψ(t). Auch bei diesem Beispiel sind die Systemgrößen, wie z. B. Höhe z, ˙ sowie RotordrehVertikalgeschwindigkeit z, ˙ Gierwinkel Ψ, Gierwinkelgeschwindigkeit Ψ zahl Ω miteinander verkoppelt. Eine oder mehrere Eingrößenregelungen sind nicht in der Lage, das System zufriedenstellend zu regeln. Beispiel 2.3 Destillationskolonne: In einer Destillationskolonne soll die aus zwei Bestandteilen bestehende Flüssigkeit mittels Destillation in ihre beiden Bestandteile zerlegt werden. In Abb. 2.6 ist die technologische Ersatzdarstellung gezeigt. Das Flüssigkeitsgemisch wird bei a in die Anlage eingefüllt. Der schwerer siedende Bestandteil sinkt in der mit Füllkörpern und Zwischenböden gefüllten Kolonne hinab und sammelt sich im unteren Teil, dem „Sumpf“. Die mit Dampf beheizte Heizschlange im Sumpf trennt die leichter siedenden Bestandteile, die sich als Dampf im „Kopf“ der Kolonne sammeln und im Kühler d kondensieren. Das leichter siedende Produkt wird bei 4
Der Gierwinkel ist der Winkel zwischen dem Geschwindigkeitsvektor des Hubschraubers und seiner Längsachse.
2.1 Mehrgrößensysteme
27 d '$ x1 y ?1 b
a-
x3 & % y2 ' $ x2 ? &% y3 c ? Abbildung 2.6: Aufbau einer Destillationskolonne
b abgezogen und das schwerer siedende bei c. Mehrere Regler regeln die Temperatur im Kolonnenkopf bzw. Temperatur und Füllstand im Sumpf. Ist der Reinheitsgrad der Produkte b und c nicht ausreichend, so können diese Produkte bei a wieder dem Prozess zugeführt werden. Regelgrößen dieser Kolonne sind die Temperatur x1 im Kopf, Temperatur x2 und Füllstand x3 im Sumpf und die betreffenden Stellgrößen sind die Ventilstellungen y1 , y2 und y3 . Aufgrund der Verkopplung der Systemgrößen können auch hier die Größen unabhängig voneinander nicht zufriedenstellend geregelt werden, sodass eine Mehrgrößenregelung vorzunehmen ist. Es ist ein Mehrgrößenregler so zu entwerfen, dass durch geeignete Rückführung der Mess-(Regel-)größen x1 bis x3 die Stellgrößen y1 bis y3 so angesteuert werden, dass die Regelgrößen die gewünschten Werte annehmen. Beispiel 2.4 Dampferzeuger: In einem Dampferzeuger (Abb. 2.7) wird das zugeführte Speisewasser in einem Kessel erhitzt, um den Dampf zu erzeugen. Die Aufheizung des Speisewassers geschieht im Feuerraum des Kessels. Regelgrößen sind der Füllstand x1 des Speisewasserbehälters, die entnommene Dampfmenge x2 , die zugeführte Luftmenge x3 sowie der Feuerraumdruck x4 . Als Stellgrößen stehen zur Verfügung die Einstellung der zugeführten Speisewassermenge über ein Stellventil y1 , die zugeführte Brennstoffmenge y2 (hier z. B. Gas), die Stellklappe für die Regelung der zugeführten Luftmenge y3 sowie die Stellklappe y4 für die Regelung des Feuerraumdrucks. Als Störgrößen treten beispielsweise auf: der Heizwert des Brennstoffs, die Menge des entnommenen Dampfes, Speisewasserdruck und Speisewassertemperatur, die Verschmutzung der Feuerung . . . .
28
2 Zustandsdarstellung von Mehrgrößensystemen v x4
y4
6
x2-
' $ x1
y ?1
& % y ?2 6 v
x3 y3
Abbildung 2.7: Aufbau eines Dampferzeugers
Auch hier ist das System so verkoppelt, dass ein getrennter Reglerentwurf für die Regelung der Größen x1 bis x4 nicht zu einem befriedigenden Ergebnis führt.
2.2
Zustandsgleichungen von Mehrgrößensystemen
2.2.1
Herleitung aus den Systemgleichungen
Grundlagen. Der Übergang von den Zustandsgleichungen für Eingrößensysteme zu den Zustandsgleichungen für Mehrgrößensysteme lässt sich formal sehr einfach an den Zustandsgleichungen 1.19 und 1.20 (mit u = xe und y = xa ) zeigen: x˙ = A · x + b · u y = cT · x + d · u . In diesen Gleichungen sind die Ein- und Ausgangsgröße u und y skalare Größen. In einem Mehrgrößensystem sind die Ein- und Ausgangsgrößen u und y jedoch Vektoren.
2.2 Zustandsgleichungen von Mehrgrößensystemen
29
Dann werden die zugehörigen Vektoren b und c und der Skalar d ebenfalls zu Matrizen und es resultiert die folgende Zustandsdarstellung: x˙ = A · x + B · u y = C ·x+D·u .
(2.2) (2.3)
Auch hier ist die Matrix D nur für sprungfähige Systeme von Null verschieden. Für ein System mit r Eingangsgrößen, s Ausgangsgrößen und einem Zustandsvektor der Dimension n ist A eine n × n Matrix, B eine n × r Matrix, C eine s × n Matrix und D eine s × r Matrix. Die nachfolgende Umformung eines Systems vierter Ordnung in die Zustandsdarstellung zeigt die Ermittlung der Systemmatrizen und -vektoren. Das Gleichungssystem für ein System mit zwei Eingängen u1 (t), u2 (t) und zwei Ausgängen y1 (t), y2 (t) sei beispielsweise gegeben zu: x˙ 1 x˙ 2 x˙ 3 x˙ 4 y1 y2
= = = = = =
−2x1 − 3x2 + u1 x1 − 2x2 + x4 −x2 − x3 + 2u2 x1 − 3x3 − 4x4 + u1 x2 + 2x3 x2 + x3 − x4 + u1 .
und
Schreibt man diese Gleichungen in Matrizenform so resultiert: ⎡
⎤• ⎡ x1 −2 ⎢ x2 ⎥ ⎢ 1 ⎣x ⎦ =⎣ 0 3 x4 1
y1 y2
=
−3 −2 −1 0
0 0 −1 −3
⎤ ⎡ ⎤ ⎡ 0 1 x1 1 ⎥ ⎢ x2 ⎥ ⎢ 0 + · 0 ⎦ ⎣ x3 ⎦ ⎣ 0 x4 −4 1
⎤ 0 0 ⎥ u1 · 2 ⎦ u2 0
⎤ x1 0 1 2 0 0 0 u1 ⎢ x2 ⎥ . + · · u2 0 1 1 −1 ⎣ x3 ⎦ 1 0 x4
⎡
Die Matrizen des Systems in Zustandsdarstellung sind damit ⎡
−2 ⎢ 1 A=⎣ 0 1 0 1 C= 0 1
−3 −2 −1 0
0 0 −1 −3 2 0 1 −1
⎤ 0 1 ⎥ 0 ⎦ −4
⎡
⎤ 1 0 ⎢0 0⎥ B=⎣ 0 2⎦ 1 0 0 0 und D= 1 0
30
2 Zustandsdarstellung von Mehrgrößensystemen
und Zustands-, Ein- und Ausgangsvektor des Systems lauten: ⎤ x1 ⎢x ⎥ x=⎣ 2⎦ , x3 x4 ⎡
u=
u1 u2
und
y=
y1 y2
.
In allgemeiner Form kann diese Zustandsdarstellung durch das Blockschaltbild nach Abb. 2.8 repräsentiert werden (Anfangszustand x(0) = x0 ). D u(t) B
x(t) ˙ i
x(0)
. . . dt
x(t) C
i
y(t)
+ A Abbildung 2.8: Blockschaltbild der Zustandsbeschreibung eines Mehrgrößensystems
Falls zusätzlich zum Eingangsvektor u ein weiterer Eingangsvektor z (z. B. ein Störeingang) vorhanden ist, dann wird dieser Eingang über eine zusätzliche Eingangs- und Durchgangsmatrix B z bzw. D z wie folgt erfasst: x˙ = A · x + B · u + B z · z y = C · x + D · u + Dz · z .
(2.4) (2.5)
Aufgabe 2.1: Ermitteln Sie die Systemmatrizen A, B, C und gegebenenfalls D des folgenden Differentialgleichungssystems: x˙ 1 x˙ 2 x˙ 3 x˙ 4 y1 y2
= = = = = =
−2x1 − x2 + 3x4 + 2u1 + u2 x1 − 4x2 + x4 − u2 2x1 − x2 − x3 + 3u1 x1 − 3x3 − 2x4 + u1 und x1 − x2 + 2x3 − 3u2 2x2 + x3 − x4 + u1 .
2.2 Zustandsgleichungen von Mehrgrößensystemen
31
Lösung: ⎡
−2 ⎢ 1 A=⎣ 2 1 C=
−1 −4 −1 0
0 0 −1 −3
1 −1 2 0 0 2 1 −1
⎤ 3 1 ⎥ 0 ⎦ −2
⎡
2 ⎢0 B=⎣ 3 1
⎤ 1 −1 ⎥ 0 ⎦ 0
und
D=
0 −3 1 0
.
Nachfolgend sollen einige Beispiele für die Zustandsdarstellung der technischen Mehrgrößensysteme gegeben werden, die zuvor vorgestellt wurden. Beispiel 2.5 Hydraulik-Kaskade: Die technologische Ersatzdarstellung der untersuchten Hydraulik-Kaskade zeigt Abb. 2.4. Für eine derartige Kaskade gelten die folgenden Grundgleichungen: pi
=
QEin − QAus
=
Qab
=
ρ · g · hi dhi Ai · dt Kj · (pa − pb )
Druck im Behälter i Füllstandsgleichung Behälter i Ventilgleichung für Ventil j
mit pi als Druck in kPascal am Boden des jeweiligen Behälters, ρ in kg/dm3 als spezifische Dichte der Flüssigkeit, g als Gravitationkonstante in m/s2 , Ai als Grundfläche des i-ten Behälters in m2 , Kj als Ventilkonstante des Ventils j in m4 s/(103 kg), und dem Zu- und Abfluss pro Zeiteinheit Q in m3 /s sowie dem Ventildurchfluss pro Zeiteinheit Qab von Behälter a in Behälter b in m3 /s. Stellt man für die drei Behälter mit ihren Zu- und Abflüssen und die Ventile nach obiger Vorgabe die Grundgleichungen auf, so lauten diese: h1 = h2 = h3 = Q12 Q23 QAb2 QAb3 p1 p2 p3
= = = = = = =
1 · (QZu1 − Q12 )dt A1 1 · (Q12 − Q23 − QAb2 )dt A2 1 · (QZu3 + Q23 − QAb3 )dt A3 K1 · (p1 − p2 ) K2 · (p2 − p3 ) K 4 · p2 K 3 · p3 ρ · g · h1 ρ · g · h2 ρ · g · h3 .
32
2 Zustandsdarstellung von Mehrgrößensystemen
Die Ableitungen der Gleichungen für den Füllstand hi und das Einsetzen der Gleichungen für den Druck in die jeweiligen Durchflüsse ergibt 1 h˙ 1 = · (QZu1 − Q12 ) A1 1 · (Q12 − Q23 − QAb2 ) h˙ 2 = A2 1 h˙ 3 = · (QZu3 + Q23 − QAb3 ) A3 Q12 = K1 ρg · h1 − K1 ρg · h2 Q23 = K2 ρg · h2 − K2 ρg · h3 .
und
Das Einsetzen der Gleichungen für die Durchflüsse in die Ableitungen der Füllhöhen hi ergibt die resultierenden Gleichungen 1 · (QZu1 − K1 ρg · h1 + K1 ρg · h2 ) h˙ 1 = A1 1 · (K1 ρg · h1 − K1 ρg · h2 − K2 ρg · h2 + K2 ρg · h3 − QAb2 ) h˙ 2 = A2 1 · (QZu3 + K2 ρg · h2 − K2 ρg · h3 − QAb3 ) , h˙ 3 = A3
die nur noch in Matrixform zu schreiben sind. Damit lauten dann die Zustandsgleichungen der Hydraulik-Kaskade: ⎤ ⎡ ⎤ ⎡ ⎤ ⎡ K1 ρg + KA1 1ρg 0 − A1 h˙ 1 h1 K ρg K ρg K ρg K ρg ⎥ ⎣ h˙ 2 ⎦ = ⎢ ⎣ + A1 2 − A1 2 − A2 2 + A2 2 ⎦ · ⎣ h2 ⎦ h3 h˙ 3 0 + KA2 3ρg − KA2 3ρg ⎡
⎤ ⎤ ⎡ 0 0 0 Q QAb2 1 Zu1 ⎣ ⎦ ⎦ ⎣ 0 − + 0 0 · + . · A2 QZu3 QAb3 0 − A13 0 A13 1 A1
(2.6)
Die Hydraulikkaskade ist ein verkoppeltes System, wie man an der Dynamikmatrix A erkennt. Die Füllstände hi beeinflussen sich gegenseitig, da sonst A eine Diagonalmatrix wäre. Da nur h1 und h3 als Ausgangsgrößen gemessen werden, lautet die Ausgangsgleichung (mit [hi ] in m):
y1 y2
=
h1 h3
=
⎡ ⎤ h 1 0 0 ⎣ 1⎦ · h2 . 0 0 1 h3
(2.7)
2.2 Zustandsgleichungen von Mehrgrößensystemen
33
Mit den Zahlenwerten A1 = 8 m2 , A2 = 10 m2 , A3 = 12 m2 , ρ = 1kg/dm3 , g = 10 m/s2 , K1 = K2 = 0,1 m4 s/(103 kg) lauten die Zustandsgleichungen dann: ⎤ ⎡ ⎤ ⎡ ⎤ h˙ 1 −0,125 0,125 0 h1 ⎣ h˙ 2 ⎦ = ⎣ 0,1 −0,2 0,1 ⎦ · ⎣ h2 ⎦ + 0 0,0833 −0,0833 h3 h˙ 3 ⎡
⎡
⎤ ⎡ ⎤ 0,1250 0 0 0 Q QAb2 Zu1 ⎣ ⎦ ⎣ ⎦ 0 0 0 + · + −0,1 · . QZu3 QAb3 0 0,0833 0 −0,0833
(2.8)
⎤ h1 QZu1 QAb2 der Stellvektor, z = Hierin sind x = ⎣ h2 ⎦ der Zustandsvektor, u = QZu3 QAb3 h3 h1 der Störvektor und y = der Ausgangsvektor. h3 ⎡
Beispiel 2.6 Hubschrauber im Schwebeflug: Das nachfolgende Zustandsmodell beschreibt die Bewegung eines Helikopters im Schwebeflug (siehe Seite 26) in der Vertikalen und um die Hochachse [75]. ⎡
⎤• ⎡ ⎤ ⎡ ⎤ z z 0 0,4989 0 0 0 0 0 ⎢ z˙ ⎥ ⎢ 0 −0,4022 0 ⎥ ⎢ z˙ ⎥ ⎢Ψ⎥ ⎢ ⎥ ⎢Ψ⎥ 0 0 4,008 0 ⎢ ⎥ = ⎢0 ⎥·⎢ ⎥ ⎣Ψ ⎣ ⎦ ˙ ˙ ⎦ 0 −0,009793 0 −0,7637 −0,9658 ⎦ ⎣ Ψ 0 0,03684 0 −1,498 −3,000 Ω Ω ⎡
⎤ 0 0 0 ⎥ ⎢ 12,04 ⎢ ⎥ αM 0 ⎥· +⎢ 0 αT ⎣ −1,728 −6,541 ⎦ 6,680 −6,984
z Ψ
=
⎡ ⎤ z ⎢ z˙ ⎥ 1 0 0 0 0 ⎢ ⎥ ·⎢Ψ⎥ 0 0 1 0 0 ⎣ ˙ ⎦ Ψ Ω
(2.9)
(2.10)
In diesen Zustandsgleichungen sind die skalierten Zustandsvariablen die Höhe z (bezogen auf 1 m), die Vertikalgeschwindigkeit z˙ (bezogen auf 0,5 m/s), der Gierwinkel Ψ
34
2 Zustandsdarstellung von Mehrgrößensystemen
˙ (bezogen auf 4 rad/s) und die Rotordreh(bezogen auf 1 rad), die Giergeschwindigkeit Ψ zahl Ω (bezogen auf 5 rad/s). Die Stellgrößen sind der Anstellwinkel des Hauptrotors αM (bezogen auf 0,09 rad) und der Anstellwinkel des Heckrotors αT (bezogen auf 0,3 rad). Ausgangs- bzw. Messgrößen sind die Höhe z und der Gierwinkel Ψ. Die Verkopplung der einzelnen Systemzustände erkennt man z. B. an der Eingangsma˙ und trix B. Der Anstellwinkel αM wirkt sich auf die Höhe z, Giergeschwindigkeit Ψ die Rotordrehzahl Ω aus. Dagegen wirkt sich der Anstellwinkel αT nur auf die Gierge˙ und die Rotordrehzahl Ω aus. schwindigkeit Ψ Beispiel 2.7 Destillationskolonne: Das Schaubild einer Destillationskolonne ist in Abb. 2.6 gezeigt. Für ein vereinfachtes Zustandsmodell werden nach [10] nur die Verkopplungen der Temperaturen von Boden 2 und Boden 9 betrachtet. Die Zustandsgleichungen für dieses Modell lauten dann: ⎡ ⎤• ⎡ ⎤ ⎡ ⎤ x1 x1 0 0 0 −2,6853 · 10−3 −3 0 −2,9446 · 10 0 0 ⎢ x2 ⎥ ⎥ ⎢ x2 ⎥ ⎢ ⎣x ⎦ =⎣ ⎦·⎣x ⎦ 0 0 −4,6147 · 10−4 0 3 3 x4 x4 0 0 0 −1,3441 · 10−3 ⎡
⎤ 0 2,8491 · 10−4 −3 0 −3,6926 · 10 ⎥ QH ⎢ +⎣ · ⎦ κ 7,5035 · 10−5 0 0 −5,1156 · 10−3
ϑ2 ϑ9
=
⎤ x1 1 1 0 0 ⎢ x2 ⎥ . · 0 0 1 1 ⎣ x3 ⎦ x4
(2.11)
⎡
(2.12)
In diesem Zustandsmodell bedeuten x1 bis x4 die Zustandsvariablen, QH die Heizdampfmenge/Zeiteinheit als Stellsignal 1 und κ das Rücklaufverhältnis der Destillate als Stellsignal 2. Die Ausgangs- bzw. Messgrößen sind die Temperatur ϑ2 von Boden 2 und die Temperatur ϑ9 von Boden 9. In diesem Beispiel erfolgt die Verkopplung über die Messmatrix C.
Beispiel 2.8 Dampferzeuger: Für einen Dampferzeuger nach Abb. 2.7 gelten nach [50] die folgenden Zustandsgleichungen: ⎡ ⎤• ⎡ ⎤ ⎡ ⎤ x1 −0,1 0 0 0 0 0 x1 ⎢ x2 ⎥ ⎢ 1 −0,037 0 0 0 0 ⎥ ⎢ x2 ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ 0 −0,0385 0 0 0 ⎥ ⎢ x3 ⎥ ⎢ x3 ⎥ ⎢ 1 ⎢ ⎥ =⎢ ⎥ · ⎢ ⎥+ 0 0 −0,05 0 0 ⎥ ⎢ x4 ⎥ ⎢ x4 ⎥ ⎢ 0 ⎣x ⎦ ⎣ 0 0 0 1 −0,0385 0 ⎦ ⎣ x5 ⎦ 5 x6 x6 0 0 0 1 0 −0,025
2.3 Lösung der Zustandsvektor-Differentialgleichung
35
⎤ 0 0⎥ ⎥ QW 0⎥ ⎥· 1 ⎥ QBr 0⎦ 0
(2.13)
0 0 6,353 · 10−5 0 8,1 · 10−3 0 0 −0,001 0 0
⎤ x1 x ⎥ ⎢ ⎢ 2⎥ 0 ⎢ x3 ⎥ ·⎢ ⎥ . 1,125 · 10−4 ⎢ x4 ⎥ ⎣x ⎦ 5 x6 (2.14)
⎡
1 ⎢0 ⎢ ⎢0 +⎢ ⎢0 ⎣0 0
⎡
pD ϑD
=
In diesem Dampferzeugermodell bedeuten die Eingangsgrößen QW die Frischwassereinspeisung und QBr die Brennstoffmenge pro Zeiteinheit. Die Ausgangsgrößen sind der Dampfdruck pD und die Dampftemperatur ϑD . In diesem Modell geschieht die Verkopplung sowohl über die Dynamikmatrix A als auch über die Messmatrix C. Ebenso wie bei den Eingrößensystemen gibt es bei den Mehrgrößensystemen verschiedene Normalformen. Die Herleitung dieser Normalformen baut jedoch auf die in Kapitel 3 entwickelte Theorie der Steuer- und Beobachtbarkeit auf. Daher werden diese Normalformen erst in Kapitel 3 in Abschnitt 3.3 behandelt.
2.3
Lösung der Zustandsvektor-Differentialgleichung
Herleitung. Die Lösung der Zustandsvektor-Differentialgleichung x˙ = A · x + B · u y = C ·x+D·u
(2.15) (2.16)
kann man in Analogie zur Lösung der skalaren Differentialgleichung erster Ordnung x˙ = a · x + b · u herleiten. Hierzu wird Gleichung 2.17 zunächst mit e−at multipliziert e−at x˙ = ae−at x(t) + e−at b · u(t) und umgeordnet zu: e−at x˙ − ae−at x(t) = e−at b · u(t) . d −at x(t)) dt (e
(2.17)
36
2 Zustandsdarstellung von Mehrgrößensystemen
Die Integration dieser Differentialgleichung und Verwendung der Integrationsvariablen τ ergibt dann e
−aτ
t t · x(τ ) = e−aτ b · u(τ )dτ . t0
t0
Einsetzen der Integrationsgrenzen, erneutes Multiplizieren mit eat und Umordnen führt dann zur Lösung dieser skalaren Differentialgleichung wie folgt: t x(t) = ea(t−t0 ) · x(t0 ) +
ea(t−τ ) · b u(τ )dτ .
(2.18)
t0
Es wird nun die Matrixexponentialfunktion eAt in Analogie zur Potenzreihenentwicklung der normalen Exponentialfunktion ea(t−t0 ) = 1 +
{a(t − t0 )}3 a(t − t0 ) {a(t − t0 )}2 + + + ··· 1! 2! 3!
(2.19)
wie folgt mit I als Einheitsmatrix definiert: eA(t − t0 ) =
∞ [A(t − t0 )]k k=0
k!
=I+
A(t − t0 ) {A(t − t0 )}2 {A(t − t0 )}3 + + ... 1! 2! 3! (2.20)
Diese Reihenbildung konvergiert nach einer endlichen Anzahl von Schritten [55], [56]. Die Lösung von Gleichung 2.15 lässt sich dann in Analogie zu Gleichung 2.18 formulieren als x(t) = eA(t − t0 ) · x(t0 ) +
t
eA(t − τ ) · B · u(τ )dτ .
t0
Der erste Term gibt die Abhängigkeit von den Anfangsbedingungen von x(t0 ) an und der zweite Term repräsentiert die Abhängigkeit der Lösung von der Eingangsfunktion u(t). Man führt nun die sogenannte Transitionsmatrix Φ(t − t0 ) wie folgt ein: Φ(t − t0 ) = eA(t − t0 ) .
(2.21)
Damit lautet dann die Lösung der Vektordifferentialgleichung t x(t) = Φ(t − t0 ) · x(t0 ) +
Φ(t − τ ) · B · u(τ )dτ , t0
(2.22)
2.3 Lösung der Zustandsvektor-Differentialgleichung
37
und es gilt somit für die Lösung von y(t) von Gleichung 2.16: ⎡ y(t) = C · ⎣Φ(t − t0 ) · x(t0 ) +
t
⎤ Φ(t − τ ) · B · u(τ )dτ ⎦ + D · u(t) .
(2.23)
t0
Mit den Gleichungen 2.22 und 2.23 liegt nun eine geschlossene Lösung der Zustandsgleichungen 2.15 und 2.16 vor. Diese geschlossene Lösung ist jedoch so allgemein formuliert, dass man zunächst wenig damit anfangen kann. Der große Nutzen dieser Lösung zeigt sich jedoch bei der nummerischen Berechnung der Lösung von Vektordifferentialgleichungen. Nummerische Lösung der Vektordifferentialgleichung. Für die Ermittlung der nummerischen Lösung der Vektordifferentialgleichung wird zunächst die Zeitachse in äquidistante Abschnitte Δt = tk+1 − tk für k = 0, 1, 2, 3, . . . zerlegt. Die r Komponenten ui (t) des Eingangsvektors u(t) seien innerhalb des betrachteten Zeitabschnitts Δt konstant, d. h. es gilt: ui (t) = ui (tk )
für
tk ≤ t < tk+1 , i = 1, . . . , r .
Entsprechend gilt dann für den Eingangsvektor u(t) = u(tk )
für
tk ≤ t < tk+1 .
Die Eingangsgröße ist somit stückweise konstant. Für ein derartiges stückweise konstantes Eingangssignal kann man eine geschlossene Lösung des Integrals von Gleichung 2.22 ermitteln. Hierbei macht man Gebrauch von den folgenden Eigenschaften der Matrixexponentialfunktion
1.) 2.)
d At e = A · eAt = eAt · A dt eAt dt = A−1 · eAt = eAt · A−1
(2.24)
Zunächst ersetzt man in Gleichung 2.22 die Zeit t durch tk+1 und t0 durch tk und erhält: tk+1
x(tk+1 ) = Φ(tk+1 − tk ) · x(tk ) +
Φ(tk+1 − τ ) · B · u(τ )dτ . tk
38
2 Zustandsdarstellung von Mehrgrößensystemen
Da u(τ ) = u(tk ) für tk ≤ τ < tk+1 kann man die mit Γ(Δt) bezeichnete Lösung des Integrals ohne den konstanten Vektor u bestimmen zu: tk+1
Γ(Δt) =
tk+1
eA(tk+1 − τ ) · B dτ
Φ(tk+1 − τ ) · B dτ = tk
= eAtk+1
tk tk+1
tk+1 e−Aτ B dτ = eAtk+1 · (−A−1 ) · e−Aτ ·B tk
tk
= eAtk+1 · (−A−1 ) · (e−Atk+1 − e−Atk ) · B = (−A−1 ) · (I − eA(tk+1 − tk ) ) · B = −A−1 · (I − Φ(Δt)) · B =
∞ Ak (Δt)k k=0
(k + 1)!
(Δt)B .
In dieser Herleitung bezeichnet Φ(Δt) = Φ(tk+1 − tk ) = eAΔt =
∞
(2.25)
(AΔt)k /(k!). Da-
k=0
mit lautet die rekursive Lösung der Vektordifferentialgleichung für stückweise konstante Eingangssignale u(τ ) = u(tk ) für tk ≤ τ < tk+1 : x(tk+1 ) = Φ(Δt) · x(tk ) + Γ(Δt) · u(tk ) .
(2.26)
Die Ausgangsgleichung 2.16 geht dann für das jeweilige Zeitinterval über in y(tk ) = C · x(tk ) + D · u(tk ) .
(2.27)
Mit den Gleichungen 2.26 und 2.27 kann man in rekursiver Form die Lösung des Ausgangsvektors y(tk ) für einen gegebenen stückweise konstanten Eingangsvektor u(tk ) ermitteln5 . Beispiel 2.9 System zweiter Ordnung: Die Anwendung dieser Lösungsgleichungen soll an einem einfachen Beispiel zweiter Ordnung gezeigt werden. Es gelten die Zustandsgleichungen:
0 1 0 1 ·x+ ·u −2 −0,5 1 0 1 1 y = ·x . 0 1
x˙ =
5
Die Gleichungen 2.26 und 2.27 stellen gleichzeitig die Zustandsgleichungen in diskreter Zeit dar, wobei man dann normalerweise Δt durch die Abtastzeit T ersetzt.
2.3 Lösung der Zustandsvektor-Differentialgleichung
39
Für ein Zeitintervall von Δt = 0,1 s lauten die Einzelterme der Reihenentwicklung für ∞ (A Δt)k /(k!) dann: Φ(Δt) = k=0
AΔt (AΔt)0 1 0 0 0,1 =I = = 0 1 −0,2 −0,05 0! 1! (AΔt)3 (AΔt)2 −0,010 −0,0025 0,1667 −0,2917 = = · 10−3 0,005 0,0088 0,5833 0,3125 2! 3! (AΔt)4 0,1458 0,0781 = · 10−4 −0,1563 0,1068 4! (AΔt)5 −0,3125 0,2135 = · 10−6 −0,4271 −0,4193 5! Bereits nach fünf Iterationen ändern sich die Zahlenwerte der Transitionsmatrix nur noch in der siebten Stelle nach dem Komma. Die Reihenentwicklung konvergiert also sehr schnell. Somit resultiert für die diskrete Transitionsmatrix Φ(Δt): 0,9902 0,0972 Φ(Δt) = . −0,1944 0,9416 ∞ Ak (Δt)k (Δt)B gemäß Gleichung 2.25 lauten: k=0 (k + 1)! Δt (AΔt)1 · Δt 0 0,1 0,005 0 ·B = ·B = 0,1 0 −0,0025 −0,01 1! 2! (AΔt)2 · Δt −0,0833 −0,3333 ·B = · 10−3 −0,2917 0,1667 3! (AΔt)3 · Δt −0,0729 0,0417 ·B = · 10−4 0,0781 0,1458 4! (AΔt)4 · Δt 0,1563 0,2917 ·B = · 10−6 . 0,2135 −0,3125 5!
Die Einzelterme für Γ(Δt) =
Auch hier ändern sich bereits nach fünf Iterationen die Zahlenwerte der Matrix Γ(Δt) nur noch in der siebten Stelle nach dem Komma. Somit resultiert für die Matrix Γ(Δt): 0,0049 0,0997 Γ(Δt) = . 0,0972 −0,0098 Damit lautet die Rekursionsgleichung für ein Zeitinterval von Δt = 0,1 s: 0,9902 0,0972 0,0049 0,0997 x(tk+1 ) = · x(tk ) + · u(tk ) . (2.28) −0,1944 0,9416 0,0972 −0,0098
40
2 Zustandsdarstellung von Mehrgrößensystemen
Für y(tk ) gilt die Rekursionsgleichung: 1 1 · x(tk ) . y(tk ) = 0 1
(2.29)
Für ein sinusförmiges Eingangssignal der Form u1 (t) = sin t mit t = 0, 0,1, 0,2, . . . 20, und u2 (t) ≡ 0 ergibt die Verwendung der Rekursionsgleichungen 2.28 und 2.29 für y1 (t), y2 (t) den in Abb. 2.9 dargestellten Zeitverlauf. Bei der Berechnung des Signalverlaufs von y1 (t) und y2 (t) ist das Eingangssignal u1 (t) als stückweise konstant für jeweils Δt = 0,1 s angenommen worden. 1.5 1 y1 ,y2 (t) 0.5
y1 (t)
6
0 −0.5
y2 (t)
−1 −1.5
0
2
4
6
8
10
-
12
14
16
18
20
t/s
Abbildung 2.9: Verlauf von y1 (t), y2 (t) für u1 (t) = sin t
Aufgabe 2.2: Berechnen Sie für Δt = 0,05 s die Matrizen Φ(Δt) und Γ(Δt) für die folgende Zustandsdarstellung eines Systems. Wie lautet die Rekursionsgleichung in vollständiger Form? 0 1 1 1 A= B= −2 −4 0 3 1 1 0 0 C= D= 0 1 0 1 Lösung:
0,9977 0,0453 0,0500 0,0535 Γ(Δt) = −0,0906 0,8165 −0,0023 0,1335 0,9977 0,0453 0,0500 0,0535 · x(tk ) + · u(tk ) . x(tk+1 ) = −0,0906 0,8165 −0,0023 0,1335 1 1 0 0 y(tk ) = ·x(tk )+ ·u(tk ) . 0 1 0 1 Φ(Δt) =
2.4 Ermittlung der Übertragungsmatrix
41
Aufgabe 2.3: Berechnen Sie für Δt = 0,1 s die Matrizen Φ(Δt) und Γ(Δt) für die folgende Zustandsdarstellung eines Systems. ⎡ ⎤ ⎡ ⎤ 1 −2 0 1 3 A = ⎣ 2 −3 5 ⎦ B = ⎣ 4 −1 ⎦ 3 1 −9 2 8 Lösung:
⎡
⎤ 1,0818 −0,1820 −0,0354 Φ(Δt) = ⎣ 0,2350 0,7356 0,2781 ⎦ 0,2164 0,0344 0,4160
⎡
⎤ 0,0643 0,3142 Γ(Δt) = ⎣ 0,3905 0,0840 ⎦ 0,1553 0,5642
2.4
Ermittlung der Übertragungsmatrix
Berechnung. Die Übertragungsmatrix eines Mehrgrößensystems enthält die in Matrizenform zusammengestellten Übertragungsfunktionen des Systems vom jeweiligen Eingang i zum jeweiligen Ausgang j. Für ein System mit zwei Eingängen und drei Ausgängen ist die Übertragungsmatrix somit eine Matrix, bestehend aus sechs einzelnen Übertragungsfunktionen. Berechnet wird die Übertragungsmatrix aus der Zustandsdarstellung in der gleichen Art und Weise wie beim Eingrößensystem (siehe Kapitel 1.3), mit dem Unterschied, dass die Vektoren b, cT und d in die Matrizen B, C und D übergehen. Die Übertragungsmatrix G(s) des Mehrgrößensystems x˙ = A · x + B · u y = C ·x+D·u lautet somit in Analogie zu Gleichung 1.35 G(s) =
Y (s) = C · {sI − A}−1 · B + D . U (s)
(2.30)
Die Berechnung der Übertragungsmatrix geschieht elementweise und soll an einem Beispiel verdeutlicht werden. Beispiel 2.10 Ermittlung der Übertragungsmatrix: Es werde ein System mit zwei Eingängen und zwei Ausgängen betrachtet, welches durch die folgende Zustandsraumdarstellung beschrieben wird: 0 1 2 1 x˙ = ·x+ ·u −2 −5 0 1 0 −1 0 0 y = ·x+ ·u . 1 0 1 0
42
2 Zustandsdarstellung von Mehrgrößensystemen
Die Übertragungsfunktion von Eingang 1 nach Ausgang 1 wird unter Verwendung von 2 Gleichung 1.35 mit cT = [0 − 1], b = und d = 0 berechnet. Diese Werte für c, 0 b und d sind die entsprechenden Zeilen und Spalten aus den Matrizen C, B und D. Dann resultiert als G11 (s) die folgende Übertragungsfunktion G11 (s) =
4 Y1 (s) = 2 . U1 (s) s + 5s + 2
Für die anderen Übertragungsfunktionen gilt nach entsprechender Vorgehensweise: s2 + 7s + 12 Y2 (s) = 2 U1 (s) s + 5s + 2 −s + 2 Y1 (s) G12 (s) = = 2 U2 (s) s + 5s + 2 s+6 Y2 (s) G22 (s) = = 2 . U2 (s) s + 5s + 2 G21 (s) =
Damit resultiert die Übertragungsmatrix G(s) zu: ⎡
−s + 2 4 ⎢ s2 + 5s + 2 s2 + 5s + 2 G11 (s) G12 (s) ⎢ G(s) = =⎢ G21 (s) G22 (s) ⎣ s2 + 7s + 12 s+6 s2 + 5s + 2 s2 + 5s + 2
⎤ ⎥ ⎥ ⎥ . ⎦
Abb. 2.10 zeigt das Blockdiagramm für das betrachtete Mehrgrößensystem. U1 (s) s
-
4 s2 + 5s + 2
-
s2 + 7s + 12 s2 + 5s + 2
U2 (s) s
-
s2
(s) + g Y1+ 6
−s + 2 + 5s + 2
s+6 s2 + 5s + 2
Abbildung 2.10: Blockdiagramm des Mehrgrößensystems
+ + g-Y2 (s) -?
2.5 Stabilität von Mehrgrößensystemen
43
Die Matrix {sI − A}−1 ist die Inverse der in Kapitel 1 als charakteristische Matrix bezeichneten Matrix {sI − A}. Diese Inverse wird auch als Resolvente bezeichnet und mit Φ(s) abgekürzt: Φ(s) = {sI − A}−1 .
(2.31)
Damit kann die Übertragungsmatrix G(s) dann auch in der folgenden Form geschrieben werden: G(s) = C · {sI − A}−1 · B + D = C · Φ(s) · B + D ,
(2.32)
und es gilt für das Ein-/Ausgangsverhalten die Beziehung Y (s) = G(s) · U (s) . Eigenschaften der charakteristischen Matrix {sI −A}. Bereits in Gleichung 1.37 wurde für die charakteristische Matrix der folgende Zusammenhang dargestellt: Det(sI − A) = sn + an−1 sn−1 + . . . + a1 s + a0 = (s − λ1 )(s − λ2 ) · · · (s − λn ). (2.33) Darin sind mit λi die Wurzeln der charakteristischen Gleichung und mit ai die Koeffizienten der charakteristischen Gleichung bezeichnet. Die Wurzeln der charakterischen Gleichung sind gleich den charakteristischen Werten oder Eigenwerten der Matrix A. Zwischen der Transitionsmatrix Φ(t − t0 ) nach Gleichung 2.21 und der Resolventen Φ(s) = {sI − A}−1 besteht für t0 = 0 folgender Zusammenhang: Φ(s) = {sI − A}−1 = L{Φ(t)} = L{eAt } .
(2.34)
Die Resolvente Φ(s) ist also die Laplace-Transformierte der Transitionsmatrix Φ(t).
2.5
Stabilität von Mehrgrößensystemen
Bei der Stabilität von Mehrgrößensystemen unterscheidet man wie bei den Eingrößensystemen zwischen der internen und der externen Stabilität. Ein Eingrößensystem ist intern stabil, wenn alle Wurzeln der homogenen Differentialgleichung negativen Realteil aufweisen. Es ist extern stabil, wenn ein beschränktes Eingangssignal ein beschränktes Ausgangssignal zur Folge hat. Die externe Stabilität wird auch als BIBO-Stabilität bezeichnet. Dabei steht der Begriff BIBO für Bounded-Input Bounded-Output. Interne Stabilität. Es wird die interne Stabilität eines Mehrgrößensystems der Ordnung n in der Form x˙ = A · x + B · u y = C ·x+D·u wie folgt definiert:
44
2 Zustandsdarstellung von Mehrgrößensystemen Das obige System ist intern stabil, wenn die Lösung von x(t) ˙ = A · x(t)
mit
x(0) = x0
für ein beliebiges x0 für t → ∞ gegen Null geht. Betrachtet man die Lösung x(t) für die obige Definition im Laplace-Bereich, also X(s) = (sI − A)−1 · x0 =
Adj(sI − A) · x0 Det(sI − A)
und berücksichtigt, dass gilt Det(sI − A) = sn + an−1 sn−1 + . . . + a1 s + a0 = (s − λ1 )(s − λ2 ) · · · (s − λn ), (2.35) so gelangt man zur folgenden Stabilitätsaussage: Das Mehrgrößensystem ist intern stabil, wenn alle Wurzeln der charakteristischen Gleichung 2.35 negativen Realteil aufweisen. Da diese Wurzeln jedoch gleichzeitig die Eigenwerte der Matrix A sind, gilt die folgende hinreichende und notwendige Bedingung für die interne Stabilität eines Mehrgrößensystems: Ein Mehrgrößensystem ist intern stabil, wenn alle Eigenwerte der Matrix A negativen Realteil aufweisen, also Re{λi (A)} < 0
für
i = 1, . . . , n .
Beispiel 2.11 System dritter Ordnung: Gegeben sei ein Mehrgrößensystem dritter Ordnung in Zustandsdarstellung zu ⎡ ⎤ ⎡ ⎤ 0 1 2 2 1 1 2 −1 x˙ = ⎣ −2 −3 0 ⎦ · x + ⎣ 0 2 ⎦ · u , y = ·x . 2 −1 3 −2 0 −1 1 3 Die drei Eigenwerte der Matrix A ergeben sich zu λ1,2 = −0,6962 ± j2,2101 und λ3 = −2,6075. Die Realteile aller Eigenwerte sind negativ, folglich ist das Mehrgrößensystem intern stabil. Beispiel 2.12 Hubschrauber im Schwebeflug: Die in Beispiel 2.6 betrachtete Dynamikmatrix des Hubschraubers im Schwebeflug lautet ⎡
⎤ 0 0,4989 0 0 0 0 0 ⎢ 0 −0,4022 0 ⎥ ⎢ ⎥ 0 0 4,008 0 A=⎢0 ⎥ . ⎣ 0 −0,009793 0 −0,7637 −0,9658 ⎦ 0 0,03684 0 −1,498 −3,000
2.5 Stabilität von Mehrgrößensystemen
45
Die Eigenwerte der Matrix A lauten λ1,2 = 0 λ4 = −0,2396
λ3 = −3,5241 λ5 = −0,4022 ,
sie besitzen nicht alle einen negativen Realteil. Folglich ist der Hubschrauber im Schwebeflug nicht intern stabil. Da zwei Eigenwerte auf der Stabilitätsgrenze liegen, bezeichnet man ein derartiges System auch als grenzstabil. Externe Stabilität. Die externe Stabilität beschreibt bei einem Mehrgrößensystem die Stabilität des Ein-/Ausgangsverhaltens. Es gilt die Definition: Ein Mehrgrößensystem ist extern stabil, wenn für x0 = 0 ein beschränktes Eingangssignal6 ||u(t)|| < uMax immer ein beschränktes Ausgangssignal ||y(t)|| < yMax zur Folge hat. In [36] wird gezeigt, dass ein intern stabiles System ebenso die Bedingungen der externen Stabilität erfüllt. Die Umkehrung gilt jedoch nicht immer. Sind z. B. die instabilen Eigenwerte eines Systems nicht steuerbar7 (oder beobachtbar), so ist das System zwar extern aber nicht intern stabil. Ist ein System vollständig steuer- und beobachtbar, dann folgt aus der externen auch die interne Stabilität. Beispiel 2.13 System 3. Ordnung: Gegeben sei ein Mehrgrößensystem dritter Ordnung in Zustandsdarstellung zu ⎡ ⎤ ⎡ ⎤ −1 0 0 1 1 3 2 −1 x˙ = ⎣ 0 0 1 ⎦ · x + ⎣ 3 2 ⎦ · u , y = ·x . 2 −1 3 0 −4 0 1 3 Berechnet man die Eigenwerte der Dynamikmatrix A, so resultiert λ1 = −1 λ2,3 = ±j2 . Das System ist vollständig steuer- und beobachtbar. Somit ist das System intern und extern nicht stabil. Regt man es am Eingang mit einem sinusförmigen Signal mit der Frequenz ω0 = 2 s−1 (der Resonanzfrequenz) an, so wächst das Ausgangssignal über alle Grenzen! 6 7
Als Norm || . . . || wird die übliche Vektornorm verwendet. Zur Definition der Steuer- und Beobachtbarkeit siehe Kapitel 3.
46
2.6
2 Zustandsdarstellung von Mehrgrößensystemen
Verknüpfung von Mehrgrößensystemen
Mehrgrößensysteme können ähnlich wie Eingrößensysteme in Form von Reihen-, Parallelund Kreisschaltungen miteinander verknüpft werden. Eine derartige Verknüpfung kann in systematischer Form durch eine Zustandsvektorerweiterung dargestellt werden. Nachfolgend werden die klassischen Verknüpfungen der Reihen-, Parallel- und Kreisschaltung behandelt. Diese Betrachtungen werden für nicht sprungfähige Systeme durchgeführt. Die Erweiterung auf sprungfähige Systeme ist problemlos möglich. Reihenschaltung. Unter einer Reihenschaltung (oder auch Serienschaltung) von Mehrgrößensystemen wird die in Abb. 2.11 dargestellte Systemstruktur verstanden. Dabei wird der Ausgangsvektor y 1 von System 1 gleich dem Eingangsvektor u2 von System 2. Die Ordnungen beider Vektoren sind gleich. Die Ordnungen der Zustandsvektoren x1 und x2 können jedoch unterschiedlich sein. System 1 u1
x˙ 1 =A1 x1 +B 1 u1 y 1 =C 1 x 1
System 2 y 1 = u2
x˙ 2 =A2 x2 +B 2 u2 y 2 =C 2 x 2
y2
Abbildung 2.11: Reihenschaltung von zwei Mehrgrößensystemen Ausgehend von den Zustandsgleichungen beider Systeme x˙ 1 y1 x˙ 2 y2
= = = =
A1 · x1 + B 1 · u1 C 1 · x1 A2 · x2 + B 2 · u2 C 2 · x2
(2.36) (2.37) (2.38) (2.39)
wird durch Ersetzen von u2 durch y 1 Gleichung 2.38 geändert in: x˙ 2 = A2 · x2 + B 2 · y 1 = A2 · x2 + B 2 C 1 · x1 .
(2.40)
Damit kann dann die Zustandsdarstellung der Reihenschaltung des resultierenden Systems mit u1 = u als Eingangsvektor und y 2 = y als Ausgangsvektor auf der Basis der Gleichungen 2.36, 2.40 und 2.39 wie folgt angegeben werden:
x˙ 1 x˙ 2
0 A1 x1 B1 ·u · + B 2 C 1 A2 x2 0 x1 y = y2 = 0 C 2 · . x2
=
2.6 Verknüpfung von Mehrgrößensystemen
47
Der neue Zustandsvektor ist nun der erweiterte Vektor x1 x= , x2 man spricht bei dieser Vorgehensweise auch von einer Zustandsvektorerweiterung. Die neuen Zustandsmatrizen sind nun die erweiterten Matrizen A∗ , B ∗ und C ∗ als 0 A1 B1 ∗ ∗ A = , C∗ = 0 C2 . , B = B 2 C 1 A2 0 Parallelschaltung. Bei einer Parallelschaltung nach Abb. 2.12 sind die Eingangsvektoren der Systeme 1 und 2 gleich, die Ausgänge der Systeme werden nun jedoch entweder addiert oder subtrahiert. Es gilt also u1 = u2 = u
sowie
y = y1 ± y2 . System 1
x˙ 1 =A1 x1 +B 1 u y 1 =C 1 x 1
y1
u ±
System 2 x˙ 2 =A2 x2 +B 2 u y 2 =C 2 x 2
g
y
y2
Abbildung 2.12: Parallelschaltung von zwei Mehrgrößensystemen Wiederum können die Dimensionen der Zustandsvektoren x1 und x2 unterschiedlich sein. Ausgehend von den Gleichungen 2.36 bis 2.39 wird mit u1 = u2 = u und y = y 1 ± y 2 die Zustandsdarstellung dieser Parallelschaltung dann
x˙ 1 x˙ 2
x1 B1 · + ·u x2 B2 x1 y = C 1 ±C 2 · . x2 =
A1 0 0 A2
Die neuen Zustandsmatrizen sind nun die erweiterten Matrizen A∗ , B ∗ und C ∗ als A1 0 B1 ∗ ∗ A = , B = , C ∗ = C 1 ±C 2 . B2 0 A2
48
2 Zustandsdarstellung von Mehrgrößensystemen
Kreisschaltungen. a) Dynamische Rückführung: Zunächst wird der allgemeine Fall einer dynamischen Rückführung betrachtet. Bei einer Kreisschaltung von zwei Mehrgrößensystemen wird der Ausgang des Systems im Vorwärtszweig einem Mehrgrößensystem im Rückwärtszweig zugeführt. Der Ausgang dieses Mehrgrößensystems im Rückwärtszweig wird dann einem neuen Eingang u überlagert. Diese Überlagerung geschieht mit positivem oder negativem Vorzeichen, man spricht dann von einer Mitkopplung bzw. Gegenkopplung. Abb. 2.13 zeigt die Struktur der Kreisschaltung. System 1 u
g
u1
±
y1 = y
x˙ 1 =A1 x1 +B 1 u1 y 1 =C 1 x 1 System 2
y2
x˙ 2 =A2 x2 +B 2 u2 y 2 =C 2 x 2
u2 = y
Abbildung 2.13: Kreisschaltung mit dynamischer Rückführung Ausgehend von den Gleichungen 2.36 bis 2.39 wird mit u1 = u ± y 2 und y = y 1 = u2 die Zustandsdarstellung des rückgeführten Systems dann: x˙ 1 A1 ±B 1 C 2 x1 B1 = · + ·u x˙ 2 B2C 1 A2 x2 0 x1 y = y1 = C 1 0 · . x2 Die neuen Zustandsmatrizen sind nun die erweiterten Matrizen A∗ , B ∗ und C ∗ als A1 ±B 1 C 2 B1 ∗ ∗ A = , B = , C∗ = C1 0 . B2C 1 A2 0 b) Statische Rückführung: Anstelle einer Rückführung des Ausgangs y 1 über ein dynamisches Mehrgrößensystem kann diese Rückführung auch rein statisch sein. Dann gilt z. B. für die statische Rückführung des Ausgangs y2 = K · y1 = K · y . Eine derartige statische Rückkopplung zeigt Abb. 2.14 . In diesem Fall vereinfacht sich die Zustandsdarstellung des rückgeführten Systems mit konstanter Rückführung zu x˙ 1 = [A1 ± B 1 KC 1 ] · x1 + B 1 · u y = C 1 · x1 .
(2.41)
2.6 Verknüpfung von Mehrgrößensystemen
49
System 1 u
g
u1
±
y1 = y
x˙ 1 =A1 x1 +B 1 u1 y 1 =C 1 x 1 System 2
y2
y 2 =Ky
y
Abbildung 2.14: Kreisschaltung mit statischer Rückführung c) Einheitsrückführung: Liegt als Spezialfall eine Einheitsrückführung des Ausgangs y 1 von System 1 auf den Eingang vor, d. h. es gilt die konstante Rückführung y2 = y1 = y , dann ist die Rückführmatrix in Abb. 2.14 die Einheitsmatrix, K = I . Hierbei muss die Ordnung des Vektors u gleich der Ordnung des Vektors y sein. Dann lauten die Zustandsgleichungen des Systems mit Einheitsrückführung mit K = I in Gleichung 2.41 somit x˙ 1 = [A1 ± B 1 C 1 ] · x1 + B 1 · u y = C 1 · x1 . d) Zustandsvektorrückführung: Steht der komplette Zustandsvektor am Ausgang des Mehrgrößensystems 1 zur Verfügung, ist also die Messmatrix C 1 = I gleich der Einheitsmatrix, dann vereinfacht sich diese Zustandsdarstellung des rückgeführten Systems nach Gleichung 2.41 zu x˙ 1 = [A1 ± B 1 K] · x1 + B 1 · u y = x1 . Dieser Spezialfall der sogenannten Zustandsvektorrückführung wird in den nachfolgenden Kapiteln ausführlich behandelt.
3
Steuerbarkeit und Beobachtbarkeit, Normalformen
Betrachtet man die Zustandsgleichungen der Beispiele von Kapitel 2.2, so stellt man fest, dass der Zustandsvektor x(t) wohldefinierte physikalische Größen enthält. Beim Hydrauliksystem sind dies die Füllstände h1 (t) bis h3 (t) der einzelnen Behälter, beim Hubschrauber die Höhe und Steiggeschwindigkeit z(t) bzw. z(t), ˙ Gierwinkel und Gier˙ winkelgeschwindigkeit Ψ(t) und Ψ(t) sowie die Rotordrehzahl Ω(t). In den Beispielen des Dampferzeugers und der Destillationskolonne sind die Zustandsvariablen die nicht näher spezifizierten Variablen xi (t). Zur Regelung der jeweiligen Systeme werden Steuereingänge ui (t) verwendet, die als Messgrößen nur die Systemausgänge yi (t) zur Verfügung haben. Es stellt sich nun zum einen die Frage, inwieweit es möglich ist, über die jeweiligen Steuereingänge ui (t) bzw. den Steuervektor u(t) alle Zustandsvariablen xi (t) gezielt zu beeinflussen. Dieses Problem bezeichnet man als Steuerbarkeit eines Systems. Und zum anderen interessiert die Frage, inwieweit man aus der Messung der Ausgangsgrößen yi (t) Information über alle Zustandsvariablen xi (t) erhält. Dieses Problem bezeichnet man als Beobachtbarkeit eines Systems. Beide Problemkreise sind Thema dieses Kapitels.
3.1
Steuerbarkeit
Definition. Die Untersuchung der Steuerbarkeit von Systemen in der Zustandsdarstellung soll ausgehen von der Definition der Steuerbarkeit nach [7]: Ein System heißt vollständig zustandssteuerbar, wenn für jede Anfangszeit t0 jeder Anfangszustand x(t0 ) in endlicher Zeit tf > t0 durch einen unbeschränkten Steuervektor u(t) in jeden beliebigen Endzustand x(tf ) überführt werden kann. Ein unbeschränkter Steuervektor u(t) ist in der Amplitude nicht beschränkt. Diese Definition bedeutet, dass u(t) jede Zustandsvariable in der nachfolgenden Gleichung beeinflussen kann t x(t) = Φ(t − t0 ) · x(t0 ) +
Φ(t − τ ) · B · u(τ )dτ .
(3.1)
t0
Bedingung. Die Ableitung der Bedingung für die Steuerbarkeit eines Systems geht von der obigen Definition aus. Fordert man z. B. als Endzustand x(tf ) = 0 dann geht
52
3 Steuerbarkeit und Beobachtbarkeit, Normalformen
Gleichung 3.1 über in: tf 0 = Φ(tf − t0 ) · x(t0 ) +
Φ(tf − τ ) · B · u(τ )dτ
oder
t0
tf x(t0 ) = −
Φ(t0 − τ ) · B · u(τ )dτ .
(3.2)
t0
Steuerbarkeit verlangt, dass der Steuervektor u(t) jedes beliebige x(t0 ) generieren kann, damit x(tf ) zu Null wird. Dies erfordert die Erfüllung bestimmter Bedingungen für die Matrizen B und Φ(t0 − τ ). Unter Verwendung der Gleichungen 2.20 und 2.21 kann man Φ(t0 − τ ) wie folgt darstellen: A(t0 − τ ) {A(t0 − τ )}2 Φ(t0 − τ ) = eA(t0 − τ ) = I + + + ... 1! 2! ∞ [A(t0 − τ )]k = . k!
(3.3)
k=0
Φ(t0 − τ ) wird durch eine unendliche Reihe beschrieben die, wie in Beispiel 2.9 gezeigt, nach einer endlichen Anzahl von Schritten konvergiert [55], [56]. Diese unendliche Summe für die Ermittlung von Φ(t0 − τ ) kann unter Verwendung des Caley-HamiltonTheorems (siehe Anhang A.6) in eine endliche Summe umgeformt werden. Das Theorem lautet: Jede quadratische Matrix A erfüllt ihre eigene charakteristische Gleichung. Dies besagt, dass man in der charakteristischen Gleichung Det(sI − A) = sn + an−1 sn−1 + . . . + a1 s + a0 = 0
(3.4)
die Laplace-Variable s durch die Matrix A ersetzen kann, und die Gleichung bleibt trotzdem gültig. Es gilt also An + an−1 An−1 + . . . + a1 A + a0 I = 0 , bzw. nach einer Umformung: An = −(an−1 An−1 + . . . + a1 A + a0 I) .
(3.5)
3.1 Steuerbarkeit
53
Unter Verwendung von Gleichung 3.5 kann die unendliche Summe von Gleichung 3.3 durch Ersetzen der höheren Potenzen von A in eine endliche Summe mit der höchsten Potenz n − 1 umgeformt werden: Φ(t0 − τ ) = α0 (τ )I + α1 (τ )A + α2 (τ )A2 + . . . + αn−1 (τ )An−1 =
n−1
(3.6)
αk (τ )Ak .
k=0
Die Koeffizienten αk (t) ergeben sich beim Ersetzen der höheren Potenzen der Matrix A. Damit kann Gleichung 3.2 umgeformt werden zu: x(t0 ) = −
n−1 k=0
tf Ak B
(3.7)
αk (τ )u(τ )dτ . t0
Mit tf βk =
αk (τ )u(τ )dτ t0
kann Gleichung 3.7 dann geschrieben werden als ⎡ x(t0 ) = −
⎢ ⎢ Ak Bβ k = − B | AB | A2 B | · · · | An−1 B ·⎢ ⎢ ⎣ k=0
n−1
β0 β1 β2 .. .
⎤ ⎥ ⎥ ⎥ . (3.8) ⎥ ⎦
β n−1 Der Wert x(tf ) = 0 kann genau dann eindeutig von jedem beliebigen x(t0 ) durch einen Steuervektor u(t) erreicht werden, wenn die folgende Bedingung für die Zustandssteuerbarkeit eines Systems erfüllt ist: Das System n-ter Ordnung x˙ = A · x + B · u ist genau dann vollständig zustandssteuerbar, wenn die Matrix QS den Rang n hat: QS = B | AB | A2 B | · · · | An−1 B .
(3.9)
Man bezeichnet die Matrix QS als Steuerbarkeitsmatrix. In Kurzform wird die Bedingung für die Zustandssteuerbarkeit auch gern so formuliert, dass man sagt: „Das Paar (A, B) ist vollständig steuerbar“.
54
3 Steuerbarkeit und Beobachtbarkeit, Normalformen
Für ein System mit nur einer Steuergröße u(t) wird aus der Matrix B ein Spaltenvektor b und die Steuerbarkeitsmatrix lautet dann: QS = b | Ab | A2 b | · · · | An−1 b . (3.10) Die Steuerbarkeitsmatrix ist dann eine n × n Matrix. Die Steuerbarkeit von Systemen soll an drei Beispielen verdeutlicht werden. Beispiel 3.1 Nicht steuerbares System: Gegeben sei die Zustandsdarstellung eines Systems der Ordnung n = 2 zu:
−1 0 1 x˙ = ·x+ ·u 0 −2 0 1 ·x . y = 1 Dann lautet die Steuerbarkeitsmatrix QS 1 −1 QS = b | Ab = . 0 0 Die zweite Zeile der Matrix ist Null. Somit ist der Rang der Matrix QS gleich 1 und nicht, wie für die Steuerbarkeit erforderlich n = 2. Das System ist nicht vollständig steuerbar. Abb. 3.1 verdeutlicht den Zusammenhang. u
-f + 6
f + 6
x1 + f y+
-1 -2
x2 Abbildung 3.1: Nicht vollständig steuerbares System
Der Zustand x2 kann vom Steuersignal u nicht beeinflusst werden, das System ist nicht vollständig steuerbar. Beispiel 3.2 Steuerbares System: Ändert man den Eingangsvektor von Beispiel 3.1 wie folgt um: −1 0 1 x˙ = ·x+ ·u 0 −2 1
3.1 Steuerbarkeit
55
dann wird der Rang der Steuerbarkeitsmatrix QS gleich n.
1 −1 Rang (QS ) = Rang b | Ab = Rang 1 −2
=2
Das System ist nun vollständig steuerbar wie auch Abb. 3.2 zeigt. u r- f - + 6
-1
f + 6
x1 + f y+ 6 x2
-2
Abbildung 3.2: Vollständig steuerbares System
Beispiel 3.3 Steuerbares Mehrgrößensystem: Gegeben sei die Zustandsdarstellung eines Mehrgrößensystems der Ordnung n = 2 zu:
−1 0 1 x˙ = ·x+ 0 −2 3 2 3 y = ·x 4 5
2 ·u 4
Dann lautet die Steuerbarkeitsmatrix QS QS = B | AB =
1 2 −1 −2 3 4 −6 −8
Der Rang der Steuerbarkeitsmatrix QS ist zwei, das System ist vollständig steuerbar.
56
3.2
3 Steuerbarkeit und Beobachtbarkeit, Normalformen
Beobachtbarkeit
Definition. Die Untersuchung der Beobachtbarkeit von Systemen in der Zustandsdarstellung soll ebenfalls ausgehen von der Definition der Beobachtbarkeit nach [7]: Ein System heißt vollständig beobachtbar, wenn jeder Anfangszustand x(t0 ) aus den Messungen des Ausgangssignals y(t) im Zeitintervall t0 ≤ t ≤ tf exakt bestimmt werden kann. Dies heißt mit anderen Worten, dass jeder Zustand x(t) den Ausgang y(t) beeinflusst, t CΦ(t − τ )Bu(τ )dτ + Du(t) (3.11)
y(t) = CΦ(t − t0 )x(t0 ) + t0
wobei der Anfangszustand x(t0 ) von Eingangssignalen vor t0 abhängt. Bedingung. Die Ableitung der Bedingung für die Beobachtbarkeit eines Systems geht von der obigen Definition aus, wobei der Eingangsvektor u(t) hierbei keine Rolle spielt. D. h. man untersucht nur den ersten Teil der Gleichung: y(t) = C · Φ(t − t0 ) · x(t0 ) .
(3.12)
Die Beobachtbarkeit fordert, dass x(t0 ) aus y(t) rekonstruierbar sein soll. Auch dies erfordert die Erfüllung bestimmter Bedingungen für die Matrizen C und Φ(t − t0 ). Wie bei der Untersuchung der Steuerbarkeit wird unter Verwendung des Caley-HamiltonTheorems Φ(t − t0 ) durch eine endliche Summe wie folgt dargestellt: Φ(t − t0 ) = α0 (t)I + α1 (t)A + α2 (t)A2 + . . . + αn−1 (t)An−1 =
n−1
(3.13)
αk (t)Ak .
k=0
Damit kann Gleichung 3.12 dann umgeformt werden zu: y(t) = C · Φ(t − t0 ) · x(t0 ) =
n−1
αk (t)CAk x(t0 )
(3.14)
k=0
Dies führt zu Bedingungen für die Matrizen CAk damit man aus dem gemessenen y(t) den Anfangszustand x(t0 ) ermitteln kann. In [50] werden ausgehend vom Eingrößensystem und dann übergehend zum Mehrgrößensystem diese Bedingungen ausführlich erläutert. Es wirkt sich in Gleichung 3.14 jeder Zustand xi (t0 ) auf den Ausgangsvektor y(t) aus, d. h. das System ist vollständig beobachtbar, wenn die folgende Bedingung für die vollständige Beobachtbarkeit eines Systems erfüllt ist:
3.2 Beobachtbarkeit
57
Das System n-ter Ordnung x˙ = A · x + B · u, y = C · x ist genau dann vollständig beobachtbar, wenn die Matrix QB den Rang n hat: ⎡
C CA CA2 CA3 .. .
⎢ ⎢ ⎢ ⎢ QB = ⎢ ⎢ ⎢ ⎣
⎤ ⎥ ⎥ ⎥ ⎥ ⎥ . ⎥ ⎥ ⎦
(3.15)
CAn−1 Man bezeichnet die Matrix QB als Beobachtbarkeitsmatrix. In Kurzform wird die Bedingung für die Beobachtbarkeit auch gern so formuliert, dass man sagt: „Das Paar (A, C) ist vollständig beobachtbar“. Für ein System mit nur einer Ausgangsgröße y(t) wird aus der Matrix C ein Zeilenvektor cT und die Beobachtbarkeitsmatrix lautet dann: ⎡ ⎢ ⎢ ⎢ ⎢ QB = ⎢ ⎢ ⎢ ⎣
cT cT A cT A2 cT A3 .. .
⎤ ⎥ ⎥ ⎥ ⎥ ⎥ . ⎥ ⎥ ⎦
(3.16)
cT An−1 Die Beobachtbarkeitsmatrix ist dann eine n × n Matrix.
Exkurs: Eine einfache Herleitung der Bedingung für die vollständige Beobachtbarkeit des Systems findet sich bei Kailath [36]. Wenn der Ausgangsvektor y(t) gemessen wird, dann stehen im Prinzip n−1
auch die Ableitungen des Ausgangsvektors, d. h. y(t), ˙ y ¨(t) . . . y (t) zur Verfügung. Damit resultiert der folgende Vektor der Beobachtungen ⎡
⎤
⎡
⎤
⎤ ⎡ ⎤ C · x(t) C ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎢ ⎥ ⎢ CA · x(t) ⎥ ⎥ ⎢ ⎥ ⎢ CA ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎢ ⎥ ⎢ CA2 · x(t) ⎥ ⎢ CA2 ⎥ ⎥ ⎢ ⎥ · x(t) . ⎢ ⎥=⎢ ⎥=⎢ ⎥=⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ .. .. ⎥ ⎢ ⎥ ⎢ ⎥ ⎣ ⎥ ⎢ ⎦ ⎦ ⎣ . . ⎣ ⎦ ⎦ ⎣ n−1 n−1 n−1 n−1 CA CA · x(t) y (t) C · x (t) y(t) y(t) ˙ y ¨(t) .. .
C · x(t) C · x(t) ˙ C ·x ¨(t) .. .
⎡
58
3 Steuerbarkeit und Beobachtbarkeit, Normalformen Damit kann aus den Messungen von y(t) und seinen Ableitungen der Zustand x(t) rekonstruiert werden, wenn die Beobachtbarkeitsmatrix ⎡
⎤ C ⎢ CA ⎥ ⎢ ⎥ ⎢ 2 ⎥ ⎢ CA ⎥ ⎥ QB = ⎢ ⎢ CA3 ⎥ ⎢ ⎥ ⎢ ⎥ .. ⎣ ⎦ . n−1 CA vollen Rang hat. Die Beobachtbarkeit von Systemen soll an drei Beispielen verdeutlicht werden. Beispiel 3.4 Nicht beobachtbares System: Gegeben sei die Zustandsdarstellung eines Systems der Ordnung n = 2 zu:
−1 0 1 ·x+ ·u 0 −2 1 y = 1 0 ·x .
x˙ =
Dann lautet die Beobachtbarkeitsmatrix QB T c 1 0 QB = = . −1 0 cT A Die zweite Spalte der Matrix ist Null. Somit ist der Rang der Matrix gleich 1 und nicht, wie für die Beobachtbarkeit erforderlich n = 2. Das System ist nicht vollständig beobachtbar. Abb. 3.3 verdeutlicht den Zusammenhang. u r- f - + 6
x1
x2
y-
-1
-f + 6
-2
Abbildung 3.3: Nicht vollständig beobachtbares System
Der Zustand x2 wirkt sich nicht auf den Ausgang y aus, das System ist nicht vollständig beobachtbar.
3.2 Beobachtbarkeit
59
Beispiel 3.5 Beobachtbares System: Ändert man die Messgleichung von Beispiel 3.4 um in y= 1
1 ·x ,
dann wird der Rang der Beobachtbarkeitsmatrix QB gleich n.
cT Rang (QB ) = Rang T c A
1 1 = Rang −1 −2
=2
Das System ist nun vollständig beobachtbar wie auch Abb. 3.4 zeigt. u r- f - + 6
x1
x2
-1
-f + 6
-2
- f y6
Abbildung 3.4: Vollständig beobachtbares System
Beispiel 3.6 Beobachtbares Mehrgrößensystem: Gegeben sei die Zustandsdarstellung eines Mehrgrößensystems der Ordnung n = 2 zu:
−1 0 1 2 x˙ = ·x+ ·u 0 −2 3 4 2 3 y = ·x . 4 5
Dann lautet die Beobachtbarkeitsmatrix QB QB =
C CA
⎡
⎤ 2 3 ⎢ 4 5 ⎥ =⎣ . −2 −6 ⎦ −4 −10
Der Rang der Beobachtbarkeitsmatrix QB ist zwei, das System ist vollständig beobachtbar.
60
3 Steuerbarkeit und Beobachtbarkeit, Normalformen
Aufteilung eines Systems. Man kann mit diesen Definitionen ein Mehrgrößensystem S in seine vier Bestandteile aufspalten: SSB SB SS Sn
= = = =
vollständig steuerbares und vollständig beobachtbares Teilsystem vollständig beobachtbares aber nicht steuerbares Teilsystem vollständig steuerbares aber nicht beobachtbares Teilsystem nicht steuerbares und nicht beobachtbares Teilsystem.
Abb. 3.5 verdeutlicht diese Systemaufspaltung. Allein der vollständig steuerbare und
SS u
y SSB
SB
Sn
Abbildung 3.5: Aufspaltung eines Systems in seine steuerund beobachtbaren Anteile
beobachtbare Systemteil SSB wird durch die Übertragungsmatrix G(s) = C · Φ(s) · B + D beschrieben. Die Übertragungsmatrix G(s) ist eine Ein-/Ausgangsbeschreibung und daher per Definition auf den steuer- und beobachtbaren Systemteil beschränkt. Im Unterschied dazu beinhaltet die Zustandsdarstellung ebenfalls eine Beschreibung des internen Systemverhaltens durch die Zustandsvariablen. Aufgabe 3.1: Überprüfen Sie die Steuerbarkeit und Beobachtbarkeit eines Systems beschrieben durch die folgenden Systemmatrizen (siehe Aufgabe 2.1): ⎡ ⎤ ⎡ ⎤ −2 −1 0 3 2 1 ⎢ 1 −4 0 1 ⎥ ⎢ 0 −1 ⎥ A=⎣ B=⎣ 2 −1 −1 0 ⎦ 3 0 ⎦ 1 0 −3 −2 1 0 1 −1 2 0 0 −3 C= und D= . 0 2 1 −1 1 0 Lösung: Der Rang der Steuerbarkeitsmatrix QS ist ebenso wie der Rang der Beobachtbarkeitsmatrix QB gleich vier. Das System ist vollständig steuer- und beobachtbar. .
3.2 Beobachtbarkeit
61
Aufgabe 3.2: Überprüfen Sie die Steuerbarkeit und Beobachtbarkeit der Hydraulikkaskade von Beispiel 2.5. Lösung: Der Rang der Steuerbarkeitsmatrix QS ist ebenso wie der Rang der Beobachtbarkeitsmatrix QB gleich drei. Das System ist vollständig steuer- und beobachtbar. Aufgabe 3.3: Überprüfen Sie die Steuerbarkeit und Beobachtbarkeit des Hubschraubers im Schwebeflug von Beispiel 2.6. Lösung: Der Rang der Steuerbarkeitsmatrix QS ist ebenso wie der Rang der Beobachtbarkeitsmatrix QB gleich fünf. Das System ist vollständig steuer- und beobachtbar. Aufgabe 3.4: Überprüfen Sie die Steuerbarkeit und Beobachtbarkeit eines Systems beschrieben durch die folgenden Systemmatrizen: ⎡
⎤ 0 1 0 A = ⎣ −2 −3 0 ⎦ 0 0 −4 cT = 0 0 1
⎡ ⎤ 1 b =⎣0⎦ 0
und
d=0.
1. Wie groß ist der Rang der Steuerbarkeitsmatrix? 2. Geben Sie die Matrizen des steuerbaren Teilsystems an. 3. Wie groß ist der Rang der Beobachtbarkeitsmatrix? 4. Geben Sie die Matrizen des beobachtbaren Teilsystems an. Lösung: 1.) Rang(QS ) = 2;
3.) Rang(QB ) = 1;
AS =
0 1 −2 −3
cTS = 0 0
und
2.)
1 bS = 0 dS = 0
Das Teilsystem ist zwar steuerbar aber nicht beobachtbar, cTS = [ 0 0 ]. 4.)
AB = [ −4 ]
bB = [ 0 ]
cTB = [ 1 ]
und
Das Teilsystem ist zwar beobachtbar aber nicht steuerbar, bB = 0.
dB = 0
62
3 Steuerbarkeit und Beobachtbarkeit, Normalformen
Aufgabe 3.5: In Aufgabe 3.4 wird die Dynamikmatrix A wie folgt geändert: ⎡ ⎤ 0 1 0 A = ⎣ −2 −3 0 ⎦ 1 0 −4 Überprüfen Sie nun die Steuerbarkeit und Beobachtbarkeit. Lösung: Der Rang der Steuerbarkeitsmatrix QS ist ebenso wie der Rang der Beobachtbarkeitsmatrix QB gleich drei. Das System ist nun vollständig steuer- und beobachtbar. Aufgabe 3.6: Gegeben ist die Übertragungsfunktion des Eingrößensystems F (s) =
s3
s+2 . + 6s2 + 11s + 6
Die Zustandsdarstellung dieses System lautet in Regelungsnormalform ⎡ ⎡ ⎤ ⎤ 0 1 0 0 AR = ⎣ 0 0 1 ⎦ bR = ⎣ 0 ⎦ cTR = [2 1 0] −6 −11 −6 1 und in Beobachtungsnormalform ⎡ ⎤ 0 0 −6 AB = ⎣ 1 0 −11 ⎦ 0 1 −6
⎡ ⎤ 2 bB = ⎣ 1 ⎦ 0
cTB = [0 0 1] .
1. Ist das System in Regelungsnormalform vollständig steuer- und beobachtbar? 2. Ist das System in Beobachtungsnormalform vollständig steuer- und beobachtbar? 3. Begründen Sie das Ergebnis. Lösung: 1. Das System in Regelungsnormalform ist vollständig steuerbar aber nicht vollständig beobachtbar. 2. Das System in Beobachtungsnormalform ist vollständig beobachtbar aber nicht vollständig steuerbar. 3. Die Übertragungsfunktion des Systems kann wie folgt vereinfacht werden: F (s) =
s3
s+2 1 s+2 = = . 2 + 6s + 11s + 6 (s + 1)(s + 2)(s + 3) (s + 1)(s + 3)
Infolge der Pol-/Nullstellenkompensation ist der Pol bei s = −2 bei der Regelungsnormalform nicht beobachtbar und bei der Beobachtungsnormalform nicht steuerbar.
3.3 Transformation auf Normalform
3.3
63
Transformation auf Normalform
Grundlagen. Die in den vorangehenden Abschnitten abgeleiteten Steuerbarkeitsund Beobachtbarkeitsmatrizen werden auch benutzt, um unterschiedliche Normalformen (oder auch kanonische Formen) von Ein- und Mehrgrößensystemen zu entwickeln. Zur Berechnung dieser Normalformen wird eine nichtsinguläre Transformationsmatrix T konstruiert, mit der mittels einer Ähnlichkeitstransformation die neuen Matrizen in Normalform, wie nachfolgend gezeigt, berechnet werden. Das zu transformierende System sei gegeben zu: x˙ = A · x + B · u y = C·x . Mit einer geeigneten Transformationsmatrix T wird der Zustandsvektor einer Zustandstransformation x = T · xT unterworfen und man erhält das transformierte System zu x˙ T = T −1 AT · xT + T −1 B · u = AT · xT + B T · u y = CT · xT = C T · xT . Die Ein-/Ausgangsbeschreibung des Systems ist erhalten geblieben, d. h. die Übertragungsmatrix G(s) bleibt unverändert wie die nachfolgende Umformung zeigt1 G(s) = C T (sI − AT )−1 B T = CT (sI − T −1 AT )−1 T −1 B = C(sI − A)−1 B. Es liegen nur ein anderer Zustandsvektor und andere Systemmatrizen vor, für die folgende Beziehungen gültig sind: x = T xT ,
AT = T −1 AT ,
B T = T −1 B,
C T = CT .
Die Eigenwerte der transformierten Dynamikmatrix werden durch die Ähnlichkeitstransformation aufgrund der Beziehung Det (sI − AT ) = Det sI − T −1 AT = T −1 Det (sI − A) T = Det (sI − A) ebenfalls nicht verändert. Zur Ermittlung der Transformationsmatrix kann man, wie oben erwähnt, vorteilhaft die Steuerbarkeits- und Beobachtbarkeitsmatrizen QS und QB heranziehen. Für die Mehrgrößensysteme existieren ebenso wie für Eingrößensysteme mehrere Normalformen. Die Strukturen dieser Normalformen bei den Mehrgrößensystemen lehnen sich an die Formen bei den Eingrößensystemen an. Eine gute Übersicht über die Methoden zur Ermittlung der unterschiedlichen Normalformen findet man z. B. in [1] und [48]. 1
−1 Hierbei wird aus der Matrizenrechnung die Beziehung (A1 A2 )−1 = A−1 verwendet. 2 A1
64
3.3.1
3 Steuerbarkeit und Beobachtbarkeit, Normalformen
Normalformen von Eingrößensystemen
In Abschnitt 1.2.1 sind unter Verwendung spezieller Substitutionen und Umrechnungen aus der zugrunde liegenden Differentialgleichung eines Systems die Regelungs- und Beobachtungsnormalform sowie die Diagonalform der Systeme in Zustandsdarstellung hergeleitet worden. Liegt jedoch schon eine Zustandsdarstellung des Eingrößensystems vor, so kann unter Verwendung der Steuer- und Beobachtbarkeitsmatrizen aus der zugrunde liegenden, nicht normierten Zustandsdarstellung die gewünschte Normalform hergeleitet werden. Es sei ein Eingrößensystem der Ordnung n in Zustandsform gegeben zu: x˙ = A · x + b · u y = cT · x .
(3.17) (3.18)
Regelungsnormalform. Für das Eingrößensystem der Ordnung n von Gleichung 3.17 und 3.18 lautet die Steuerbarkeitsmatrix QS QS = b | Ab | A2 b | · · · | An−1 b .
Die Inverse dieser Steuerbarkeitsmatrix sei ⎡
Q−1 S
eT1 ⎢ eT2 ⎢ =⎢ . ⎣ ..
⎤ ⎥ ⎥ ⎥ ⎦
eTn mit eTi als Zeilenvektor. Konstruiert man nun unter Verwendung der letzten Zeile der inversen Steuerbarkeitsmatrix, also unter Verwendung von eTn die folgende Transformationsmatrix T ⎡ ⎢ ⎢ T =⎢ ⎣
⎤−1
eTn eTn A .. .
⎥ ⎥ ⎥ ⎦
(3.19)
,
eTn An−1 so transformiert diese Transformationsmatrix T das Ausgangssystem von Gleichung 3.17 und 3.18 mittels der Transformation x = T xT ,
AT = T −1 AT ,
bT = T −1 b,
cTT = cT T
3.3 Transformation auf Normalform
65
auf die Regelungsnormalform. Bei der Regelungsnormalform weist die Matrix AT Frobenius-Form auf, Vektor bT ist gleich Null und nur Element n ist gleich eins, Vektor cTT ist voll besetzt. Beispiel 3.7 System 3. Ordnung: Gegeben sei ein Eingrößensystem in Zustandsdarstellung zu ⎡
0 x˙ = ⎣ −2 −6 y = 3
⎤ ⎡ ⎤ 0 0,5 0 −2 −1,5 ⎦ + ⎣ 1 ⎦ · u −4 −3 2 2 −0,5 · x .
Die Steuerbarkeitsmatrix QS lautet hierfür ⎡ ⎤ 0 1 −5 QS = b | Ab | A2 b = ⎣ 1 −5 23 ⎦ , 2 −10 44
und ihre Inverse resultiert zu: ⎡ T⎤ ⎡ ⎤ e1 5 3 −1 ⎣ eT2 ⎦ = ⎣ 1 5 −2,5 ⎦ . Q−1 S = 0 1 −0,5 eT3 Damit lautet die letzte Zeile der inversen Steuerbarkeitsmatrix eT3 = [ 0 1 − 0,5 ]. Unter Verwendung von eT3 wird dann die Transformationsmatrix T aufgebaut zu: ⎡
⎤−1 ⎡ ⎤−1 ⎡ ⎤ eT3 0 1 −0,5 0 1 0 T = ⎣ eT3 A ⎦ = ⎣ 1 0 0 ⎦ = ⎣ 1 0 1 ⎦ . 0 0 0,5 0 0 2 eT3 A2
(3.20)
Dann resultiert die Regelungsnormalform des Eingrößensystems zu ⎡
⎤ ⎡ ⎤ 0 1 0 0 x˙ T = T −1 AT · xT + T −1 B · u = ⎣ 0 0 1 ⎦ · xT + ⎣ 0 ⎦ · u −2 −3 −5 1 y = CT · xT = 2 3 1 · x .
66
3 Steuerbarkeit und Beobachtbarkeit, Normalformen
Aufgabe 3.7: Gegeben ist ein Eingrößensystem in Zustandsdarstellung mit den Matrizen ⎡ ⎤ ⎡ ⎤ 1 −1 1 0 A = ⎣ −4 2 −4,5 ⎦ b =⎣1⎦ cT = 3 −1 1 . −10 6 −10 2 Berechnen Sie die Matrizen der Regelungsnormalform. Lösung: ⎡
⎤ 0 1 0 AT = ⎣ 0 0 1 ⎦ −2 −5 −7
⎡ ⎤ 0 bT = ⎣ 0 ⎦ 1
cTT = 2 3 1 .
Beobachtungsnormalform. Die Transformation eines Eingrößensystems in Zustandsdarstellung auf die Beobachtungsnormalform geschieht äquivalent zur Transformation auf Regelungsnormalform, nun aber unter Verwendung der Beobachtbarkeitsmatrix QB ⎡ ⎢ ⎢ ⎢ ⎢ QB = ⎢ ⎢ ⎢ ⎣
cT cT A cT A2 cT A3 .. .
⎤ ⎥ ⎥ ⎥ ⎥ ⎥ . ⎥ ⎥ ⎦
(3.21)
cT An−1 Die Inverse dieser Beobachtbarkeitsmatrix sei Q−1 B = e1 e2 · · · en mit ei für i = 1, . . . , n als Spaltenvektor. Konstruiert man nun unter Verwendung der letzten Spalte der inversen Beobachtbarkeitsmatrix, also unter Verwendung von en die folgende Transformationsmatrix T (3.22) T = en Aen · · · An−1 en , so transformiert diese Transformationsmatrix T das Ausgangssystem von Gleichung 3.17 und 3.18 mittels der Transformation x = T xT ,
AT = T −1 AT ,
bT = T −1 b,
cTT = cT T
auf die Beobachtungsnormalform. Bei der Beobachtungsnormalform ist die Matrix AT die Transponierte einer Matrix in Frobenius-Form, Vektor cT ist gleich Null und nur Element n ist gleich eins, Vektor bT ist voll besetzt.
3.3 Transformation auf Normalform
67
Aufgabe 3.8: Gegeben sei ein Eingrößensystem in Zustandsdarstellung mit den Matrizen ⎡ ⎤ ⎡ ⎤ 1 −1 1 0 A = ⎣ −4 2 −4,5 ⎦ b= ⎣1⎦ cT = 3 −1 1 . −10 6 −10 2 Berechnen Sie die Matrizen der Beobachtungsnormalform. Lösung: ⎡
⎤ 0 0 −2 AT = ⎣ 1 0 −5 ⎦ 0 1 −7
3.3.2
⎡ ⎤ 2 bT = ⎣ 3 ⎦ 1
cTT = 0 0 1 .
Steuerbarkeitsnormalformen für Mehrgrößensysteme
Am einfachsten lassen sich bei Mehrgrößensystemen die Steuerbarkeitsnormalformen ermitteln, deren Herleitungen wie bei den Eingrößensystemen direkt von der Steuerbarkeitsmatrix ausgehen [36]. Die in Abschnitt 3.1 hergeleitete Steuerbarkeitsmatrix lautet: QS = B | AB | A2 B | · · · | An−1 B . Diese Matrix QS ist für ein System der Ordnung n mit r Eingängen eine n × nr Matrix. Um aus dieser n × nr Matrix eine quadratische (n × n) Transformationsmatrix T zu gewinnen, bieten sich verschiedene Vorgehensweisen an. Schema I. Man spaltet z. B. für ein System mit n = 7 und r = 4 die n × r Matrix B wie folgt in ihre Spaltenvektoren auf: B = [b1 b2 b3 b4 ] .
(3.23)
Dann erstellt man ein so genanntes Young-Diagramm (siehe Tabelle 3.1) [37]. Dieses Young-Diagramm besitzt r Spalten, welche die Spalten der Matrix B repräsentieren, sowie n Zeilen, welche Potenzen der A-Matrix repräsentieren. Die Vorgehensweise zum Ausfüllen des Young-Diagramms ist die folgende: Man beginnt mit dem Vektor b1 in Spalte 1 und setzt ein Kreuz in das obere linke Feld. Dann prüft man, ob Ab1 von b1 linear unabhängig ist. Ist dies der Fall, dann setzt man das nächste Kreuz in Zeile 2 und Spalte 1. Anschließend wird geprüft, ob A2 b1 linear unabhängig von b1 und Ab1 ist. Ist dies erfüllt, setzt man ein weiteres Kreuz in Zeile 3 Spalte 1. Dies geht so lange, bis ein Vektor von den vorherigen Vektoren linear abhängig ist. Dann wird eine Null in das Feld gesetzt, in diesem Fall in Zeile 5 Spalte 1.
68
3 Steuerbarkeit und Beobachtbarkeit, Normalformen b1
b2
b3
b4
A =I
×
×
×
0
A1
×
×
0
2
×
0
3
×
4
0
0
A A A
5
A
A6 Tabelle 3.1: Young-Diagramm für die Spaltensuche Nun beginnt man mit Spalte 2, also mit dem Element b2 . Ist b2 unabhängig von allen Vektoren der Spalte 1, so setzt man ein Kreuz in Zeile 1 Spalte 2. Als nächstes wird geprüft, ob A · b2 von allen bisherigen Vektoren linear unabhängig ist. Dieses Vorgehen setzt man so lange fort, bis man n linear unabhängige Spaltenvektoren gefunden hat. Auf diese Weise ermittelt man n (hier n = 7) unabhängige Spaltenvektoren der Steuerbarkeitsmatrix, die Stellen mit den Kreuzen im Young-Diagramm, und kann für den dargestellten Fall die Transformationsmatrix T wie folgt ansetzen: T = b1 Ab1 A2 b1 A3 b1 b2 Ab2 b3 . (3.24) Für diese in Tabelle 3.1 angenommene Struktur und die Transformationsmatrix nach Gleichung 3.24 resultiert dann die folgende Steuerbarkeitsnormalform der Dynamik- und Eingangsmatrix: ⎡
0 ⎢1 ⎢ ⎢0 ⎢ AT = ⎢ 0 ⎢0 ⎢ ⎣0 0
0 0 1 0 0 0 0
0 0 0 1 0 0 0
x x x x 0 0 0
0 0 0 0 0 1 0
x x x x x x 0
⎤ x x⎥ ⎥ x⎥ x⎥ ⎥ x⎥ ⎥ x⎦ x
⎡
und
1 ⎢0 ⎢ ⎢0 ⎢ BT = ⎢ 0 ⎢0 ⎢ ⎣0 0
0 0 0 0 1 0 0
0 0 0 0 0 0 1
⎤ x x⎥ ⎥ x⎥ x⎥ ⎥ . x⎥ ⎥ x⎦ x
An den mit „x“ bezeichneten Stellen stehen Werte ungleich Null, die anderen Werte sind wie angegeben Null oder Eins. Die Matrix C T ist im Allgemeinen voll besetzt. Die AT -Matrix hat eine spezielle Struktur bestehend aus Teilsystemen der Ordnung vier, zwei und eins, jeweils hervorgehoben durch die senkrechten und waagerechten
3.3 Transformation auf Normalform
69
Linien. Die Teilmatrizen auf der Hauptdiagonalen weisen eine transponierte FrobeniusForm auf. Das Teilsystem der Ordnung eins koppelt ein in die Teilsysteme der Ordnung zwei und vier, und das Teilsystem der Ordnung zwei koppelt ein in das System der Ordnung vier, aber nicht umgekehrt. Diese Struktur bezeichnet man auch als einseitige oder dreiecksförmige Kopplung. Eine derartige Struktur zeichnet sich dadurch aus, dass die charakteristische Gleichung des Gesamtsystems gleich dem Produkt der charakteristischen Gleichungen der Teilsysteme auf der Hauptdiagonalen von AT ist. Es gilt also: Det (sI − AT ) = Det (sI − AT,4×4 ) · Det (sI − AT,2×2 ) · Det (sI − AT,1×1 ) mit AT,i×i als Teilsysteme der Ordnung i. Die B T -Matrix zeigt, dass Eingang eins nur das Teilsystem der Ordnung vier steuert, Eingang zwei nur das Teilsystem der Ordnung zwei, und Eingang drei nur das Teilsystem der Ordnung eins. Eingang vier wirkt auf alle Teilsysteme. Die so ermittelte Struktur ist nicht eindeutig. Sie hängt von der willkürlichen Ordnung der Eingänge eins bis vier ab. Beispiel 3.8 System der Ordnung fünf: Gegeben sei die Zustandsdarstellung eines Mehrgrößensystems der Ordnung n = 5 zu: ⎡ ⎤ 2 −9 8 1 −28 8 ⎢5 ⎢ −5 −4 22 −58 0 ⎥ ⎢ ⎢ ⎥ x˙ = ⎢ −4 10 −25 58 0 ⎥ · x + ⎢ 4 ⎣1 ⎣ −1 4 −11 26 0 ⎦ 2 −2 14 −41 99 0 −1 4 −11 26 0 y = ·x . 0 0 −2 8 0 ⎡
−5 −4 −1 0 1
⎤ −8 −2 ⎥ ⎥ 0 ⎥·u 0 ⎦ 2
Für dieses System resultiert das folgende Young-Diagramm:
0
A =I A1 A2 A3 A4
b1
b2
b3
× × × 0
× × 0
0
Tabelle 3.2: Young-Diagramm für die Spaltensuche
70
3 Steuerbarkeit und Beobachtbarkeit, Normalformen
Dann lautet die Transformationsmatrix T ⎡
T = b1 Ab1 A2 b1 b2
2 5 ⎢ ⎢ Ab2 = ⎢ 4 ⎣1 2
14 0 0 0 1
−118 −70 −56 −14 −28
−5 −4 −1 0 1
⎤ 20 19 ⎥ ⎥ 5 ⎥ , 0 ⎦ −5
und es resultieren die folgenden Matrizen ⎡
AT
CT
0 ⎢1 ⎢ ⎢ = ⎢0 ⎢ ⎣0 0 0 = 0
⎤ 0 −8 0 0,2222 ⎥ 0 −14 0 0 ⎥ ⎥ 1 −7 0 −0,0556 ⎥ , ⎥ 0 0 0 −6 ⎦ 0 0 1 −5 −14 90 0 1 . 0 0 2 −10
⎡
1 ⎢0 ⎢ ⎢ BT = ⎢ 0 ⎢ ⎣0 0
⎤ 0 4,0444 0 2 ⎥ ⎥ ⎥ 0 0,2889 ⎥ , ⎥ 1 10 ⎦ 0 2
Die Teilsysteme sind nun von der Ordnung drei und zwei und dreiecksförmig gekoppelt. Die charakteristische Gleichung lautet ⎛
⎡
⎤⎞ 0 0 −8 0 −6 ⎝ ⎣ ⎦ ⎠ · Det sI − Det (sI − AT ) = Det sI − 1 0 −14 1 −5 0 1 −7 = (s + 1)(s + 2)2 (s + 3)(s + 4) . Schema II. Während bei Schema I die Suche der linear unabhängigen Vektoren der Steuerbarkeitsmatrix laut Young-Diagramm spaltenweise erfolgt, wird in Schema II die Suche zeilenweise durchgeführt. Für den in Schema I untersuchten Fall mit n = 7 und r = 4 geht man dann wie folgt vor: Die Suche beginnt wieder bei Spalte eins der B-Matrix, also bei Vektor b1 . Dann prüft man, ob Vektor b2 unabhängig von b1 ist und setzt gegebenenfalls ein Kreuz. Anschließend wird geprüft ob b3 von b1 und b2 unabhängig ist, usw. Nach Prüfung aller Vektoren bi beginnt man in Zeile 2 von links mit der Prüfung der Unabhängigkeit des Vektors Ab1 von allen vorherigen Vektoren, bis man n unabhängige Spaltenvektoren gefunden hat. Es möge für den betrachteten Fall das folgende Young-Diagramm resultieren:
3.3 Transformation auf Normalform
71 b1
b2
b3
b4
A =I
×
×
×
0
A1
×
0
×
2
×
0
×
3
0
0
A A
0
4
A
A5 A6 Tabelle 3.3: Young-Diagramm für die Zeilensuche Zu diesem Young-Diagramm gehört dann die folgende, spaltenweise aufgebaute Transformationsmatrix T : T = b1 Ab1 A2 b1 b2 b3 Ab3 A2 b3 . (3.25) Für diese in Tabelle 3.3 angenommene Struktur und die Transformationsmatrix nach Gleichung 3.25 resultiert dann die folgende andere Steuerbarkeitsnormalform der Dynamik- und Eingangsmatrix: ⎡
0 ⎢1 ⎢ ⎢0 ⎢ AT = ⎢ 0 ⎢ ⎢0 ⎣0 0
0 0 1 0 0 0 0
x x x x x x x
x x 0 x x 0 0
0 0 0 0 0 1 0
0 0 0 0 0 0 1
⎤ x x⎥ ⎥ x⎥ ⎥ x⎥ ⎥ x⎥ x⎦ x
⎡
und
1 ⎢0 ⎢ ⎢0 ⎢ BT = ⎢ 0 ⎢ ⎢0 ⎣0 0
0 0 0 1 0 0 0
0 0 0 0 1 0 0
⎤ x 0⎥ ⎥ 0⎥ ⎥ x⎥ . ⎥ x⎥ 0⎦ 0
An den mit „x“ bezeichneten Stellen stehen Werte ungleich Null, die anderen Werte sind wie angegeben Null oder Eins. Die Matrix C T ist im Allgemeinen voll besetzt. Die AT -Matrix hat eine Struktur bestehend aus Teilsystemen der Ordnung drei, eins und drei, jeweils hervorgehoben durch die senkrechten und waagerechten Linien. Die A-Matrizen der Teilsysteme haben transponierte Frobenius-Form. Die Teilsysteme sind nun jedoch alle miteinander verkoppelt. Es liegt keine einseitige oder dreiecksförmige Kopplung vor. Jeder Eingang u1 bis u3 der B T -Matrix steuert ein Teilsystem. Nur Eingang u4 wirkt auf alle drei Teilsysteme. Beispiel 3.9 System der Ordnung fünf: Für das Beispiel 3.8 resultiert nach Schema II das folgende Young-Diagramm:
72
3 Steuerbarkeit und Beobachtbarkeit, Normalformen b1
b2
b3
A =I
×
×
×
A1
×
×
0
2
0
0
0
A
3
A
A4
Tabelle 3.4: Young-Diagramm für die Zeilensuche Dann lautet die Transformationsmatrix T ⎡
T = [b1 Ab1 b2 Ab2
2 ⎢5 ⎢ b3 ] = ⎢ 4 ⎣1 2
14 0 0 0 1
−5 −4 −1 0 1
20 19 5 0 −5
⎤ −8 −2 ⎥ ⎥ 0 ⎥ , 0 ⎦ 2
und es resultieren die folgenden Matrizen ⎡
AT
CT
0 ⎢1 ⎢ = ⎢0 ⎣0 0 0 = 0
−14 −6,9231 −34,6154 −6,9231 3,4615
0 0 0 1 0
0 0,3846 −4,0769 −4,6154 −0,1923 −14 0 1 0 . 0 2 −10 0
⎤ 10 0,9231 ⎥ ⎥ −7,3846 ⎥ , 0,9231 ⎦ −0,4615
⎡
1 ⎢0 ⎢ BT = ⎢ 0 ⎣0 0
0 0 1 0 0
⎤ 0 0⎥ ⎥ 0 ⎥, 0⎦ 1
Die Teilsysteme sind hier von der Ordnung zwei, zwei und eins. Jeder Eingang wirkt auf ein Teilsystem, allerdings sind alle drei Teilsysteme über die AT -Matrix miteinander verkoppelt.
3.3.3
Regelungsnormalformen für Mehrgrößensysteme
Regelungsnormalform nach Luenberger. Für die nachfolgend vorgestellte Regelungsnormalform nach Luenberger [48] werden die linear unabhängigen Spalten der Steuerbarkeitsmatrix QS nach Schema II von Abschnitt 3.3.2 ermittelt. D. h. man prüft zunächst die lineare Unabhängigkeit der Vektoren bi , für i = 1, . . . , r der B-Matrix. Danach folgt die Prüfung der linearen Unabhängigkeit der Produkte Abi mit wachsendem i von allen vorherigen Vektoren, usw. bis man eine n × n Matrix mit n linear unabhängigen Spalten gefunden hat. Diese n linear unabhängigen Spalten ordnet man dann,
3.3 Transformation auf Normalform
73
wieder am selben fiktiven Fall wie bei Schema II für n = 7 und r = 4 gezeigt, zu einer Matrix S (siehe Gleichung 3.25) wie folgt: S = b1 Ab1 A2 b1 b2 b3 Ab3 A2 b3 .
(3.26)
Diese Matrix S wird nun invertiert und ergibt: ⎤ eT11 ⎢ eT ⎥ ⎢ 12 ⎥ ⎢ eT ⎥ ⎥ ⎢ 13 T ⎥ =⎢ ⎥ . ⎢ e21 ⎢ eT31 ⎥ ⎢ T ⎥ ⎣ e32 ⎦ eT33 ⎡
S −1
(3.27)
Die Indizierung der Vektoren eTij geschieht nach folgendem Schema: Der Index i gehört zum Vektor bi . Kann man aus den Vektoren bi , Abi . . . Api −1 bi nun pi unabhängige Vektoren bilden, dann läuft der Index j von j = 1 bis j = pi . Die pi heißen Steuerbarkeitsindizes oder auch Control Invarianten und es gilt p1 + p2 + . . . + pr = n. Im obigen Fall ist für i = 1 die Größe p1 − 1 = 2, also p1 = 3, und somit läuft j von j = 1 bis j = p1 = 3 und es resultieren die Vektoren eT11 . . . eT13 . Für i = 2 ist p2 − 1 = 0, d. h. p2 = 1, also läuft j nur bis 1 und es ergibt sich nur der Vektor eT21 . Für i = 3 gilt wieder p3 − 1 = 2, also p3 = 3 und es ergeben sich die Vektoren eT31 . . . eT33 . Die Vektoren eTipi werden wie folgt umbenannt: eTipi = eTi . für
i = 1, . . . , r .
Aus diesen Vektoren eTi wird dann die Transformationsmatrix T wie folgt gebildet: ⎡
eT1 eT1 A .. .
⎤−1
⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎢ T p −1 ⎥ ⎢e A 1 ⎥ 1 ⎥ T =⎢ ⎥ ⎢ eT2 ⎥ ⎢ ⎢ eT2 A ⎥ ⎥ ⎢ ⎥ ⎢ .. ⎦ ⎣ . T pr −1 er A
.
(3.28)
74
3 Steuerbarkeit und Beobachtbarkeit, Normalformen
Für den obigen Fall ist dann die Matrix T : ⎤−1 eT1 ⎢ eT1 A ⎥ ⎥ ⎢ ⎢ eT A2 ⎥ ⎢ 1T ⎥ ⎥ T =⎢ . ⎢ e2T ⎥ ⎢ e3 ⎥ ⎢ T ⎥ ⎣ e3 A ⎦ eT3 A2 ⎡
(3.29)
Bei Verwendung einer derartig aufgebauten Transformationsmatrix T nehmen die Matrizen AT und B T für den betrachteten Fall die folgende Struktur an: ⎡
0 ⎢0 ⎢ ⎢x ⎢ AT = ⎢ x ⎢ ⎢0 ⎣0 x
1 0 x x 0 0 x
0 1 x x 0 0 x
0 0 x x 0 0 x
0 0 x x 0 0 x
0 0 x x 1 0 x
⎤ 0 0⎥ ⎥ x⎥ ⎥ x⎥ ⎥ 0⎥ 1⎦ x
⎡
und
0 ⎢0 ⎢ ⎢1 ⎢ BT = ⎢ 0 ⎢ ⎢0 ⎣0 0
0 0 x 1 0 0 0
0 0 x x 0 0 1
⎤ 0 0⎥ ⎥ x⎥ ⎥ x⎥ . ⎥ 0⎥ 0⎦ x
Die Matrix AT besteht aus Teilsystemen der Ordnung drei, eins und drei, die alle miteinander verkoppelt sind. Dabei weist jedes Teilsystem auf der Hauptdiagonalen Frobenius-Form auf. Die Struktur der Matrix B T ist dergestalt, dass Eingang 1 Teilsystem 1 beeinflusst, Eingang 2 dann die Teilsysteme 1 und 2 . . . bis zum letzten Eingang 4 der alle Teilsysteme beeinflusst. Derartige Normalformen von Mehrgrößensystemen können vorteilhaft verwendet werden, um die Stabilisierung von Mehrgrößensystemen zu untersuchen. Eine effiziente Berechnungsmethode zur Ermittlung der Regelungsnormalform nach Luenberger wird von Daly in [15] vorgeschlagen.
Beispiel 3.10 System der Ordnung fünf: Für das Beispiel 3.8 ⎡
−9 ⎢ −5 ⎢ x˙ = ⎢ −4 ⎣ −1 −2
8 −4 10 4 14
1 22 −25 −11 −41
−28 −58 58 26 99
⎤ ⎡ 8 2 0⎥ ⎢5 ⎥ ⎢ 0⎥·x+⎢4 ⎦ ⎣1 0 0 2
−5 −4 −1 0 1
⎤ −8 −2 ⎥ ⎥ 0 ⎥·u 0 ⎦ 2
resultiert nach Schema II das Young-Diagramm von Tabelle 3.5.
3.3 Transformation auf Normalform
75 b1
b2
b3
A =I
×
×
×
A1
×
×
0
2
0
0
0
A
3
A
A4
Tabelle 3.5: Young-Diagramm für die Zeilensuche Dann lautet die Matrix S ⎡
S = [b1 Ab1 b2 Ab2
2 ⎢5 ⎢ b3 ] = ⎢ 4 ⎣1 2
14 0 0 0 1
−5 −4 −1 0 1
20 19 5 0 −5
⎤ −8 −2 ⎥ ⎥ 0 ⎥ , 0 ⎦ 2
und es resultiert S −1 zu ⎡
S −1
0 ⎢ 0,0769 ⎢ = ⎢ 0,3846 ⎣ 0,0769 −0,0385
0 −0,3846 −6,9231 −1,3846 0,1923
0 1,0769 19,3846 4,0769 −0,0385
1 −2,3846 −32,9231 −7,3846 −1,8077
⎤ 0 −0,0769 ⎥ ⎥ −5,3846 ⎥ . −1,0769 ⎦ 0,5385
Die Vektoren eT1 bis eT3 liest man ab als eT1 = [ 0,0769 −0,3846 1,0769 −2,3846 −0,0769 ] eT2 = [ 0,0769 −1,3846 4,0769 −7,3846 −1,0769 ] eT3 = [ −0,0385 0,1923 −0,0385 −1,8077 0,5385 ] und es ergibt sich die Transformationsmatrix T zu ⎡
0,0769 ⎢ −0,5385 ⎢ T = ⎢ 0,0769 ⎣ −0,5385 −0,0385
−0,3846 2,3077 −1,3846 2,3077 0,1923
⎤−1 1,0769 −2,3846 −0,0769 −5,9231 13,0 0,6154 ⎥ ⎥ 4,0769 −7,3846 −1,0769 ⎥ . −6,9231 16,0 0,6154 ⎦ −0,0385 −1,8077 0,5385
76
3 Steuerbarkeit und Beobachtbarkeit, Normalformen
Die resultierenden Matrizen AT , B T und C T lauten dann ⎡
AT
BT
CT
0 1 ⎢ −10,8047 −6,9231 ⎢ 0 0 = ⎢ ⎣ −31,4201 −6,9231 3,4615 0 ⎤ ⎡ 0 0 0 ⎢ 1 0 0,9231 ⎥ ⎥ ⎢ 0 ⎥ , = ⎢0 0 ⎣ 0 1 0,9231 ⎦ 0 0 1 −14 0 1 = 13,8462 0 −0,7692
⎤ 0 0 0 0,8225 0,3846 −0,4260 ⎥ ⎥ 0 1 0 ⎥ , −4,2544 −4,6154 −7,8107 ⎦ −0,1923 0 −0,4615
0 0 2 −1,8462
.
Die Teilsysteme sind hier von der Ordnung zwei, zwei und eins und über die AT -Matrix miteinander verkoppelt. Brunovsky-Form (Verallgemeinerte regelungskanonische Form). Bei der Brunovsky-Form oder verallgemeinerten regelungskanonischen Form weisen die Dynamikmatrix AB und die Eingangsmatrix B B Blockdiagonalgestalt auf, wobei gilt: ⎡ ⎡ ⎤ ⎤ Ap1 0 0 · · · 0 bp1 0 · · · 0 ⎢ 0 Ap2 0 · · · 0 ⎥ ⎢ 0 bp2 · · · 0 ⎥ ⎢ . ⎢ . ⎥ . . .. .. ⎥ ⎢ ⎥ ⎥ .. .. ⎥ und B B = ⎢ (3.30) AB = ⎢ .. . . ⎥ ⎢ .. ⎣ 0 ⎣ ⎦ ⎦ 0 ··· 0 0 0 ··· 0 0 0 ··· Apr 0 0 · · · bpr mit ⎡
Api
0 ⎢0 ⎢. ⎢. . =⎢ ⎢ ⎢0 ⎣0
⎤ 1 0 ··· 0 0 0 1 ··· 0 0⎥ .. ⎥ ⎥ .⎥ ⎥ 0 0 ··· 1 0⎥ 0 0 ··· 0 1⎦
0 0 0 ··· 0 0
und bpi
⎡ ⎤ 0 ⎢0⎥ ⎢.⎥ ⎢.⎥ .⎥ =⎢ ⎢ ⎥ ⎢0⎥ ⎣0⎦
(3.31)
1
mit pi als die zuvor definierten Steuerbarkeitsindizes. Die Matrizen AB und B B enthalten auf der Hauptdiagonalen die Matrizen Api bzw. bpi und sind sonst Null2 . Die Matrizen Api weisen einen pi -fachen Pol im Ursprung auf. Die Berechnung dieser Matrizen AB und B B geht von der oben entwickelten Regelungsnormalform nach Luenberger aus und soll anhand der Daten des Beispiels 3.10 auf Seite 74 gezeigt werden. 2
Api ist eine pi × pi Matrix und bpi ist ein pi × 1 Vektor.
3.3 Transformation auf Normalform
77
Für die dort berechneten Matrizen AT und B T gelten die Zahlenwerte ⎤ 0 0 0 0 1 ⎢ −10,8047 −6,9231 0,8225 0,3846 −0,4260 ⎥ ⎥ ⎢ 0 0 0 1 0 = T −1 AT = ⎢ ⎥ ⎣ −31,4201 −6,9231 −4,2544 −4,6154 −7,8107 ⎦ 3,4615 0 −0,1923 0 −0,4615 ⎡ ⎤ 0 0 0 ⎢ 1 0 0,9231 ⎥ ⎢ ⎥ 0 ⎥. = T −1 B = ⎢ 0 0 ⎣ 0 1 0,9231 ⎦ 0 0 1 ⎡
AT
BT
Die Steuerbarkeitsindizes sind in diesem Fall p1 = 2, p2 = 2 und p3 = 1. Die Berechnung der Brunovsky-Form erfolgt in zwei Schritten. Schritt 1: Es wird die Matrix B T mittels der Eingangstransformation u = F · w mit zunächst unbekanntem F auf die gewünschte Form transformiert x˙ T = AT · xT + B T · u = AT · xT + B T F ·w . BB
(3.32)
Es gilt also B B = B T · F . Mit den Beispieldaten errechnet man somit ⎡
BB
0 ⎢1 ⎢ =⎢0 ⎣0 0
0 0 0 1 0
⎤ ⎡ 0 0 0⎥ ⎢1 ⎥ ⎢ 0⎥= ⎢0 0⎦ ⎣0 0 1
⎤ 0 0 ⎤ ⎡ 0 0,9231 ⎥ f f f ⎥ ⎣ 11 12 13 ⎦ 0 0 ⎥ · f21 f22 f23 . f31 f32 f33 1 0,9231 ⎦ 0 1
(3.33)
Die Auflösung dieser Gleichung nach den gesuchten Zahlenwerten für die Matrix F mit den Elementen fij liefert ⎡
⎤ 1 0 −0,9231 F = ⎣ 0 1 −0,9231 ⎦ . 0 0 1
(3.34)
Schritt 2: Dann wird mit einer Zustandsrückführung der Form w = v − H · xT mit zunächst unbekannten H die gewünschte Form von AB ermittelt aus: x˙ T = AT · xT + B B · w = AT · xT + B B · (v − HxT ) = (AT − B B H)xT + B B v = AB · xT + B B · v .
78
3 Steuerbarkeit und Beobachtbarkeit, Normalformen
Die Auflösung der Bestimmungsgleichung ⎡
0 ⎢0 ⎢ AB = ⎢ 0 ⎣0 0
1 0 0 0 0
0 0 0 0 0
0 0 1 0 0
⎤ 0 0⎥ ⎥ 0 ⎥ = AT − B B · H = 0⎦ 0 ⎤
⎡
⎡
0 1 0 0 0 0 ⎢ −10,8047 −6,9231 0,8225 0,3846 −0,4260 ⎥ ⎢ 1 ⎥−⎢0 ⎢ 0 0 0 1 0 ⎦ ⎣ ⎣ −31,4201 −6,9231 −4,2544 −4,6154 −7,8107 0 3,4615 0 −0,1923 0 −0,4615 0
(3.35)
0 0 0 1 0
⎤
0 0⎥ h11 h12 h13 h14 h15 ⎥ 0 · h21 h22 h23 h24 h25 ⎦ 0 h31 h32 h33 h34 h35 1
nach den gesuchten Elementen hij der Matrix H zeigt, dass die Zeilen eins, zwei und drei der Matrix H identisch sind mit den Zeilen zwei, vier und fünf der Matrix AT . Somit lauten die Zahlenwerte von H ⎡
⎤ −10,8047 −6,9231 0,8225 0,3846 −0,4260 H = ⎣ −31,4201 −6,9231 −4,2544 −4,6154 −7,8107 ⎦ . 3,4615 0 −0,1923 0 −0,4615
Das gesuchte Ergebnis dieser zwei Transformationen lautet dann x˙ T = AB · xT + B B · v = (T −1 AT − T −1 BF H) · xT + (T −1 BF ) · v mit ⎡
0 ⎢0 ⎢ AB = ⎢ 0 ⎣0 0
1 0 0 0 0
0 0 0 0 0
0 0 1 0 0
⎤ 0 0⎥ ⎥ 0⎥ 0⎦ 0
⎡
und B B
0 ⎢1 ⎢ =⎢0 ⎣0 0
0 0 0 1 0
⎤ 0 0⎥ ⎥ 0⎥ . 0⎦ 1
(3.36)
In dieser Brunovsky-Form steuert jeder Eingang i nur ein Teilsystem der Ordnung pi und die einzelnen Teilsysteme sind voneinander entkoppelt. Mit einem System in Brunovsky-Form kann man z. B. analytisch das in Kapitel 4 vorgestellte Verfahren der Polfestlegung anwenden, ohne auf spezielle nummerische Entwurfsverfahren rückgreifen zu müssen. Den Aufbau dieser Brunovsky-Form mit den angewendeten Transformationen verdeutlicht Abb. 3.6.
3.3 Transformation auf Normalform v
w g
F
u
79
BT
x˙ gT
xT
– AT
H
Abbildung 3.6: Aufbau der Brunovsky-Form Mithilfe dieser Eingangstransformation und der Zustandsvektorrückführung resultiert das derart modifizierte System in der entkoppelten Form, beschrieben durch die Gleichung: x˙ T = AB · xT + B B · v . Diese Brunosvky-Form ermöglicht die Anwendung der im nächsten Kapitel untersuchten Methode der Polfestlegung auf besonders einfache Art und Weise.
3.3.4
Weitere Normalformen
Außer den in den beiden vorangehenden Abschnitten vorgestellten Normalformen existieren weitere Normalformen mit anderen Eigenschaften wie z. B. die Hessenberg- und die Nour-Eldin-Normalform [1]. Die bisher untersuchten Strukturen wandelten die Matrizen A und B so um, dass eine spezielle Struktur der umgeformten Matrizen AT und B T resultiert, wenn man die Brunovsky-Form mal außer Acht lässt. Die Matrix C T ist im Allgemeinen voll besetzt. Die Vorgehensweise von Abschnitt 3.3.2 und 3.3.3 kann auch auf die Messgleichung übertragen werden, sodass die Matrizen AT und C T eine spezielle Struktur aufweisen und die Matrix B T dann im Allgemeinen voll besetzt wird. Ersetzt man bei der Berechnung A := AT , B := C T und C := B T , so kommt man zu den dualen Normalformen. Die Beobachternormalform ist dual zur Regelungsnormalform und die Beobachtbarkeitsnormalform ist dual zur Steuerbarkeitsnormalform. Die Berechnungen sind mit den angegebenen Substitutionen entsprechend anzupassen.
4
Reglerentwurf zur Polfestlegung
In den vorangehenden Kapiteln wurde die Analyse von Mehrgrößensystemen auf der Basis der Zustandsraumdarstellung untersucht. Dabei wurden Fragen der Steuer- und Beobachtbarkeit sowie einige Normalformen von Mehrgrößensystemen behandelt. In den folgenden Kapiteln werden nun die Fragen der gezielten Beeinflussung der Dynamik von Mehrgrößensystemen durch regelungstechnische Maßnahmen, also der Komplex der Synthese von Mehrgrößensystemen im Zustandsraum betrachtet.
Zustandsvektorrückführung. Als Erstes wird in diesem Kapitel die gezielte Veränderung der Pole des Systems durch eine Zustandsvektorrückführung behandelt. Der gemessene Zustandsvektor x(t) wird über eine Matrix K auf den Eingang u zurückgeführt. Der neue Eingang des rückgeführten Systems wird u (t). Die Pole des rückgeführten Systems sollen auf vorgeschriebene Positionen verschoben werden. Man nennt diese Problemstellung Polfestlegung oder Polverschiebung. Die Struktur der Zustandsvektorrückführung zur Polverschiebung zeigt Abb. 4.1. Ist der Zustandsvektor nicht direkt messbar, dann kann man durch die Verwendung von Zustandsbeobachtern und Zustandsschätzern, die in Kapitel 5 untersucht werden, diese Voraussetzung umgehen. u (t)
i
u(t)
–
B
x(t) ˙ i
. . . dt
y(t)
x(t) C
+ A
K Abbildung 4.1: System mit Zustandsvektorrückführung bei Messung des Zustandsvektors
In den folgenden Abschnitten wird zunächst die Polfestlegung für Eingrößensysteme und dann für Mehrgrößensysteme untersucht.
82
4 Reglerentwurf zur Polfestlegung
4.1
Polfestlegung für Eingrößensysteme
Herleitung. Ausgangspunkt für die Untersuchung der Zustandsvektorrückführung ist das Eingrößensystem der Ordnung n beschrieben durch die Zustandsgleichungen x˙ = A · x + b · u .
(4.1)
Mittels der Ähnlichkeitstransformation1 x = T xT mit T nach Gleichung 3.19 wird das System nach Gleichung 4.1 auf die Regelungsnormalform transformiert: x˙ T = T −1 AT · xT + T −1 b · u = AT · xT + bT · u ⎡
0 0 .. .
1 0 .. .
0 1 .. .
··· ···
0 0 .. .
⎢ ⎢ = ⎢ ⎢ ⎣ 0 0 0 ··· 1 −a0 −a1 −a2 · · · −an−1
⎡ ⎤ 0 ⎥ ⎢0⎥ ⎥ ⎢ ⎥ ⎥ xT + ⎢ .. ⎥ · u . ⎥ ⎢.⎥ ⎦ ⎣0⎦ ⎤
1
Bei der Zustandsdarstellung in Regelungsnormalform hat die Dynamikmatrix AT Frobenius-Form und der Eingangsvektor bT ist gleich Null bis auf das Element in der letzten Zeile. Die Pole des Systems werden durch diese Ähnlichkeitstransformation nicht verändert. Die Pole des Systems sind die Nullstellen der charakteristischen Gleichung mit den Koeffizienten der letzten Zeile der Dynamikmatrix AT Det(sI − AT ) = sn + an−1 sn−1 + . . . + a1 s + a0 = (s − λ1 )(s − λ2 ) · · · (s − λn ). (4.2) ˜ Die Rückführung des Zustandsvektors xT über die 1 × n Matrix k ˜T · xT = −[k˜0 k˜1 . . . k˜n−1 ] · xT u = −k
(4.3)
führt zu der Zustandsdarstellung des rückgeführten Systems ˜T ) · xT + bT · u x˙ T = (AT − bT · k ⎡
=
0 1 0 0 0 1 ⎢ ⎢ ⎢ . . . .. .. .. ⎢ ⎢ ⎣ 0 0 0 ˜0 ) −(a1 + k ˜1 ) −(a2 + k ˜2 ) −(a0 + k
⎡ ⎤ ⎤ 0 0 0 ⎢0⎥ ⎥ ⎢ ⎥ ⎥ . ⎢.⎥ ⎥ .. ⎥ xT + ⎢ .. ⎥ u ⎢ ⎥ ⎥ ⎣0⎦ ⎦ ··· 1 ˜n−1 ) 1 · · · −(an−1 + k
(4.4)
··· ···
(4.5)
Die letzte Zeile der Dynamikmatrix enthält wieder die Koeffizienten der charakteristischen Gleichung des rückgeführten Systems. Sollen die Pole des rückgeführten Systems 1
Es existieren in der Literatur auch Ähnlichkeitstransformationen der umgekehrten Form xT = T x mit entsprechend anderer Tranformationsmatrix T .
4.1 Polfestlegung für Eingrößensysteme
83
an den Positionen λR,1 . . . λR,n liegen, dann lautet die charakteristische Gleichung des rückgeführten Systems ˜T ) = (s − λR,1 )(s − λR,2 ) · · · (s − λR,n ) = αR (s) Det(sI − AT + bT k = sn + αR,n−1 sn−1 + . . . + αR,1 s + αR,0 = 0.
(4.6)
Der Koeffizientenvergleich von Gleichung 4.6 mit der letzten Zeile der Dynamikmatrix ˜T zu von Gleichung 4.5 ergibt die gesuchten Parameter des Rückführvektors k k˜i = αR,i − ai
für
i = 0, . . . n − 1 .
(4.7)
Da aber nicht der Zustandsvektor xT gemessen wird, sondern der Zustandsvektor x, lautet wegen x = T xT der endgültige Rückführvektor zur Polfestlegung: ˜ T · xT = − k ˜T T −1 · x = −kT · x u = −k
(4.8)
kT = αR,0 − a0
(4.9)
mit αR,1 − a1
...
αR,n−1 − an−1 · T −1 .
Die αR,i sind die Koeffizienten des charakteristischen Polynoms des rückgeführten und die ai die des nicht rückgeführten Systems. Beispiel 4.1 System 3. Ordnung: Gegeben sei ein Eingrößensystem in Zustandsdarstellung (siehe Beispiel 3.7) zu ⎡ ⎤ ⎡ ⎤ 0 0 0,5 0 x˙ = ⎣ −2 −2 −1,5 ⎦ · x + ⎣ 1 ⎦ · u . −6 −4 −3 2 Die Ermittlung der Transformationsmatrix T auf Regelungsnormalform lautet nach Gleichung 3.19 ⎡ ⎤ 0 1 0 T =⎣1 0 1⎦ . 0 0 2 Damit berechnet man die Regelungsnormalform zu ⎡ ⎤ ⎡ ⎤ 0 1 0 0 x˙ T = T −1 AT · xT + T −1 b · u = ⎣ 0 0 1 ⎦ · xT + ⎣ 0 ⎦ · u . −2 −3 −5 1
84
4 Reglerentwurf zur Polfestlegung
Die charakteristische Gleichung des Systems lautet dann Det(sI − A) = s3 + a2 s2 + a1 s + a0 = s3 + 5s2 + 3s + 2 = 0 und sie besitzt die Nullstellen (Pole des Systems) bei λ1 = −4,4241 λ2,3 = −0,2880 ± j0,6076 . Die Pole des Systems sollen durch eine Zustandsvektorrückführung auf die Positionen λR,1 = −5
λR,2 = −2
λR,3 = −1
verschoben werden. Das neue charakteristische Polynom lautet dann (s − λR,1 )(s − λR,2 )(s − λR,3 ) = s3 + 8s2 + 17s + 10 = s3 + αR,2 s2 + αR,1 s + αR,0 .
Nach Gleichung 4.9 lautet dann die gesuchte Rückführmatrix αR,0 − a0 αR,1 − a1 . . . αR,n−1 − an−1 · T −1 ⎡ ⎤−1 0 1 0 = 8 14 3 · ⎣ 1 0 1 ⎦ 0 0 2 = 14 8 −2,5 .
kT =
Aufgabe 4.1: Die Pole des Systems mit den Matrizen 0 1 0 A= und b = , −3 −4 2 sollen durch eine Zustandsvektorrückführung auf die Positionen λ1 = −2 und λ2 = −4 verschoben werden. Berechnen Sie den Rückführvektor kT . Lösung: kT = [2,5 1] Aufgabe 4.2: Die Pole des Systems mit den Matrizen ⎡ ⎤ ⎡ ⎤ 0 1 0 0 A = ⎣ 0 0 1 ⎦ und b = ⎣ 0 ⎦ , −6 −11 −6 3
4.1 Polfestlegung für Eingrößensysteme
85
sollen durch eine Zustandsvektorrückführung auf die Positionen λ1 = −1,5, λ2 = −2,5 und λ3 = −3,5 verschoben werden. Berechnen Sie den Rückführvektor kT . Lösung: kT = [2,375 2,25 0,5]
Aufgabe 4.3 Instabiles System: Gegeben sei ein steuerbares aber instabiles System in Zustandsdarstellung zu: ⎡ ⎤ ⎡ ⎤ −1 −1 0 1 x˙ = ⎣ 1 −1 1 ⎦ · x + ⎣ 1 ⎦ · u 0 0 2 2 Berechnen Sie die Rückführmatrix kT so, dass der instabile Pol nach λ = −1 verschoben wird. Lösung: kT = 0
0
1,5
.
Ackermann’s Formel. Neben der obigen Vorgehensweise zur Berechnung des Rückführvektors k existieren weitere Methoden, von denen hier ohne Herleitung Ackermann’s Formel angegeben werden soll [2]. Danach berechnet man den Rückführvektor k gemäß der Gleichung kT = q T · αR (A) .
(4.10)
Hierin ist αR (A) nach dem Caley-Hamilton-Theorem das charakteristische Polynom des rückgeführten Systems mit der Variablen s ersetzt durch die Matrix A. Wenn also das charakteristische Polynom lautet αR (s) = sn + αR,n−1 sn−1 + . . . + αR,1 s + αR,0 , dann versteht man unter αR (A) das Polynom αR (A) = An + αR,n−1 An−1 + . . . + αR,1 A + αR,0 I . Weiterhin gilt für den Vektor q T der Zusammenhang q T = [0 0 . . . 0 1] · Q−1 S . Der Vektor q T ist somit die letzte Zeile der inversen Steuerbarkeitsmatrix QS . Die Anwendung von Gleichung 4.10 soll in Beispiel 4.2 demonstriert werden.
86
4 Reglerentwurf zur Polfestlegung
Beispiel 4.2 System 2. Ordnung: Gegeben sei das steuerbare System von Beispiel 3.2 in Zustandsdarstellung zu: −1 0 1 x˙ = ·x+ ·u 0 −2 1 Durch eine Zustandsvektorrückführung sollen die Pole des rückgeführten Systems nach λR,1 = −3 und λR,2 = −4 verschoben werden. Dann lautet das Polynom αR (s) des rückgeführten Systems: αR (s) = (s − λR,1 ) · (s − λR,2 ) = (s + 3) · (s + 4) = s2 + 7s + 12 , und das Polynom αR (A) resultiert zu: 2
αR (A) = A + 7A + 12I =
6 0 0 2
.
Die Steuerbarkeitsmatrix QS lautet 1 −1 QS = b | Ab = 1 −2 und ihre Inverse ist Q−1 S =
2 −1 1 −1
.
Dann lautet die letzte Zeile der inversen Steuerbarkeitsmatrix q T = [1
− 1] .
Damit ergibt sich der gesuchte Rückführvektor zu 6 0 kT = q T · αR (A) = [1 − 1] · = [6 0 2
− 2] .
Die Probe bestätigt das Ergebnis.
4.2
Polfestlegung für Mehrgrößensysteme
Die Berechnungen des Rückführvektors k für Eingrößensysteme führen zu eindeutigen Lösungen. Für Mehrgrößensysteme ist dies jedoch nicht der Fall, man hat nun r × n Parameter der Rückführmatrix K zur Verfügung, um n Koeffizienten des charakteristischen Polynoms festzulegen. Nachfolgend werden zwei Verfahren der Polfestlegung für Mehrgrößensysteme behandelt.
4.2 Polfestlegung für Mehrgrößensysteme
4.2.1
87
Systeme in Brunovsky-Form
Bei der Darstellung eines Mehrgrößensystems in Brunovsky-Form nach Abschnitt 3.3.3 weisen die A- und B-Matrix Blockdiagonalgestalt auf ⎡
Ap1 0 ⎢ 0 Ap2 ⎢ . .. AB = ⎢ . ⎢ .. ⎣ 0 0 0 0
0 ··· 0 ··· ··· ···
0 0 .. .
⎡
⎤
⎥ ⎥ ⎥ ⎥ 0 ⎦ Apr
und B B
bp1 0 · · · ⎢ 0 bp2 · · · ⎢ . .. =⎢ . ⎢ .. ⎣ 0 0 ··· 0 0 ···
0 0 .. .
⎤
⎥ ⎥ ⎥ ⎥ 0 ⎦ bpr
mit den Hauptdiagonalmatrizen wie folgt: ⎡
Api
0 ⎢0 ⎢. ⎢. . =⎢ ⎢ ⎢0 ⎣0
⎤ 1 0 ··· 0 0 0 1 ··· 0 0⎥ .. ⎥ ⎥ .⎥ ⎥ 0 0 ··· 1 0⎥ 0 0 ··· 0 1⎦
und bpi
0 0 0 ··· 0 0
⎡ ⎤ 0 ⎢0⎥ ⎢.⎥ ⎢.⎥ .⎥ =⎢ ⎢ ⎥ . ⎢0⎥ ⎣0⎦ 1
Bei r Eingängen liegen r Teilsysteme der Ordnung pi für i = 1, . . . , r vor. Die pi sind die auf Seite 73 definierten Steuerbarkeitsindizes. Jeder Eingang ui steuert ein Teilsystem. Diese Normalform wird wie folgt ermittelt [7] (siehe Kapitel 3.3.3): Mittels der Ähnlichkeitstransformation x = T ·xT wird zunächst die Dynamikgleichung x˙ = A · x + B · u auf die Regelungsnormalform nach Luenberger (Seite 72) transformiert x˙ T = T −1 AT · xT + T −1 B · u = AT · xT + B T · u . Mit einer Eingangstransformation u = F · w und einer weiteren Zustandsrückführung w = v − H · xT wird das System dann auf Brunovsky-Form transformiert x˙ T = AB · xT + B B · v . Aufgrund der besonderen Form der Matrizen AB und B B kann man jedes Teilsystem der Brunovsky-Form als Eingrößensystem ansehen. Mittels der Rückführung v = −Γ · xT soll die Dynamikmatrix AB auf die neue Matrix AR , ebenfalls in Blockdiagonalform, mit den gewünschten Pollagen transformiert werden AR = Diag( AR1 AR2 . . . ARr ) .
88
4 Reglerentwurf zur Polfestlegung
Dabei weist ARi Frobenius-Form auf. Somit gilt x˙ T = (AB − B B Γ) · xT = AR · xT .
(4.11)
Aufgrund der besonderen Form der Matrix B B gilt B TB · B B = I m mit I m als m×m-Einheitsmatrix. Somit kann man die Gleichung für die Dynamikmatrix nach Gleichung 4.11 AR = AB − B B Γ von links mit B TB multiplizieren und nach Γ auflösen zu Γ = B TB [AB − AR ] .
(4.12)
Setzt man diese Beziehung ein in u = F · w = F · [v − HxT ] = F · [−ΓxT − HxT ] = −F · [Γ + H] xT = −F · [Γ + H] T −1 · x , so resultiert für die Rückführung zur Polfestlegung u = −K · x die Rückführmatrix zu: K = F · [Γ + H] T −1 .
(4.13)
Diese Methode soll an einem Beispiel in Brunovsky-Form demonstriert werden. Beispiel 4.3 System 3. Ordnung: Gegeben sei ein Mehrgrößensystem in Brunovsky-Form zu ⎡ ⎡ ⎤ ⎤ 0 1 0 0 0 x˙ T = AB · xT + B B v = ⎣ 0 0 0 ⎦ · xT + ⎣ 1 0 ⎦ · v . 0 0 0 0 1 Es seien für Teilsystem eins die Pollagen λ11 = −1 und λ12 = −2 und für Teilsystem zwei die Pollage λ21 = −3 gefordert. Dann lautet die charakteristische Gleichung des rückgeführten ersten Teilsystems (s − λ11 ) · (s − λ12 ) = (s + 1) · (s + 2) = s2 + 3s + 2 = 0 ,
4.2 Polfestlegung für Mehrgrößensysteme
89
und die des zweiten Teilsystems (s − λ21 ) = (s + 3) = 0 . Die Koeffizienten der charakteristischen Gleichungen bilden dann die letzte Zeile der Dynamikmatrix des rückgeführten Systems: ⎤ ⎡ 0 1 0 AR = ⎣ −2 −3 0 ⎦ . 0 0 −3 Dann folgt für die Matrix Γ nach Gleichung 4.12
0 1 0 0 0 1 ⎤ ⎡ 0 0 0 0 1 0 ⎣ 2 = · 2 3 0⎦= 0 0 1 0 0 0 3
Γ = B TB [AB − AR ] =
⎤ ⎡ ⎤⎞ 0 1 0 0 1 0 · ⎝⎣ 0 0 0 ⎦ − ⎣ −2 −3 0 ⎦⎠ 0 0 0 0 0 −3 3 0 . 0 3
⎛⎡
Die weitere Umformung auf die Matrix K erfolgt unter Anwendung der Matrizen T , F und H, die zur Umformung auf die Brunovsky-Form verwendet wurden. Aufgabe 4.4: Gegeben sei ein Mehrgrößensystem der Ordnung vier in Brunovsky-Form mit zwei Eingängen. Jeder Eingang steuert ein Teilsystem der Ordnung zwei, d. h. die Steuerbarkeitsindizes sind p1 = p2 = 2. Berechnen Sie eine Rückführmatrix Γ so, dass die Pole der rückgeführten Teilsysteme für Teilsystem eins bei λ11 = −1 und λ12 = −2 und für Teilsystem zwei bei λ21 = −3 und λ22 = −4 liegen. Lösung: Γ=
2 3 0 0 0 0 12 7
.
90
4 Reglerentwurf zur Polfestlegung
4.2.2
Robuste Polfestlegung
Verfahren. Ein Nachteil der Methoden zur Polfestlegung für Systeme in kanonischer Form liegt in ihrer Empfindlichkeit bezüglich Schwankungen der Systemparameter. Aus diesem Grund werden in Rechenprogrammmen zur Polfestlegung, wie z. B. in MATLAB, im Allgemeinen Verfahren eingesetzt, die gewisse Empfindlichkeitsforderungen erfüllen. Nachfolgend soll die Methode von Kautsky [38] (Subroutine place in MATLAB) vorgestellt werden, die gut konditionierte und robuste Lösungen der Polfestlegung liefert. Die Systemmatrizen müssen keine besondere Normalform aufweisen. Gegeben ist die Dynamikgleichung eines Systems n-ter Ordnung in Zustandsdarstellung x˙ = A · x + B · u . Für das Rückführgesetz u = −K · x + v soll eine Rückführmatrix K derart gefunden werden, dass für das rückgeführte System x˙ = [A − B · K] · x + B · v
(4.14)
die Pole an den Positionen λ1 , λ2 , . . . , λn liegen. In [38] wird gezeigt, dass diese Aufgabenstellung in das Problem der folgenden robusten Polfestlegung überführt werden kann. Für gegebene Matrizen A und B sollen eine reelle Matrix K und eine nichtsinguläre Matrix T derart gefunden werden, dass die folgende Gleichung [A − BK] · T = T Λ mit Λ = Diag {λ1 , λ2 , . . . , λn } erfüllt wird und gleichzeitig ein Robustheitsmaß ν optimiert wird. Bei optimaler Lösung dieses Problems werden vier verschiedene Empfindlichkeitsmaße gleichzeitig minimiert und die Pole sind so unempfindlich wie möglich. Z. B. sollen die Pollagen sich möglichst wenig ändern, wenn Parameteränderungen Δ das rückgeführte System A − BK + Δ stören. Nach [38] existiert für gegebenes Λ und ein nichtsinguläres T eine Lösung dann und nur dann, wenn die Bedingung U T1 · [AT − T Λ] = 0 erfüllt ist, wobei gilt B = [U 0 , U 1 ] ·
Z 0
4.2 Polfestlegung für Mehrgrößensysteme
91
mit U = [U 0 , U 1 ] orthogonal und Z nicht-singulär. Die Lösung für K ergibt sich dann zu K = −Z −1 U T0 · T ΛT −1 − A . Die nummerische Ermittlung der Lösung für T und damit auch für die Matrix K geschieht iterativ. Ein Beispiel soll die Robustheit des obigen Entwurfs verdeutlichen. Beispiel 4.4 System 3. Ordnung: Gegeben sei ein Mehrgrößensystem in Zustandsdarstellung ⎡ ⎤ ⎡ ⎤ −0,75 0,75 0,125 1 2 x˙ = ⎣ −0,75 −0,25 0,125 ⎦ · x + ⎣ 2 3 ⎦ · u . 4 2 −2 2 2 Die Pole des Systems liegen bei λ1,2 = −0,3376 ± j0,5623 und λ3 = −2,3247. Die Pole des rückgeführten Systems sollen bei λR,1 = −1, λR,2 = −2 und λR,3 = −3 liegen. Mit der Transformationsmatrix ⎡ ⎤ 2 1 0 T = ⎣ −1 1 1 ⎦ 2 0 2 resultiert die Regelungsnormalform nach Luenberger zu ⎡ ⎤ ⎡ ⎤ 0 1 0 0 0 und BT = ⎣ 1 2 ⎦ . AT = ⎣ −2 −2 1 ⎦ 1 2 −1 1 1 Mit den Matrizen H=
−2 −2 1 1 2 −1
und
F =
−1 2 1 −1
liefert die Transformation dieses System auf Brunovsky-Form ⎡ ⎤ ⎡ ⎤ 0 1 0 0 0 x˙ T = ⎣ 0 0 0 ⎦ · xT + ⎣ 1 0 ⎦ · v 0 0 0 0 1 Dann ergibt die Berechnung der Rückführmatrix K nach Kapitel 4.2.1 1,25 1,75 0,625 K= . −0,5 −0,5 −0,25
92
4 Reglerentwurf zur Polfestlegung
Dagegen ergibt die Berechnung nach Kautsky [38] die Rückführmatrix K K=
1,4090 0,9036 0,0673 −0,2045 0,0453 −0,0389
.
Die Pole des rückgeführten Systems liegen für beide Rückführmatrizen K bei λR,1 = −1, λR,2 = −2 und λR,3 = −3. Ergibt sich nun jedoch eine Störung der Systemparameter, z. B. aufgrund ungenauer Kenntnis der Systemmatrizen A und B so, dass A − BK + Δ um den willkürlichen Fehler ⎡ ⎤ 0,02 −0,04 0,02 Δ = ⎣ −0,08 0,02 0,06 ⎦ 0,01 −0,04 −0,02 gestört wird, so liegen beim Entwurf mittels der Brunovsky-Form die Pole auf den Positionen λR,1 = −0,8712, λR,2 = −2,1140 und λR,3 = −2,9948. Dies ergibt einen mittleren Fehler von ! Δλ = (ΔλR,1 )2 + (ΔλR,2 )2 + (ΔλR,3 )2 = 0,1721 . Bei der robusten Polverschiebung liegen die Pole des gestörten Systems jedoch bei λR,1 = −0,8977, λR,2 = −2,0023 und λR,3 = −3,0799. Dies ergibt einen mittleren Fehler von ! Δλ = (ΔλR,1 )2 + (ΔλR,2 )2 + (ΔλR,3 )2 = 0,1298 . Der mittlere Fehler ist ca. 30% kleiner als vorher.
Beispiel 4.5 Hydraulik-Kaskade: Abschließend soll die Methode der Polfestlegung auf das Beispiel 2.1 der Hydraulik-Kaskade angewendet werden. Die Dynamik- und Messgleichung der Hydraulik-Kaskade lauten gemäß Beispiel 2.5 ⎡
⎤ ⎡ ⎤ ⎡ ⎤ h˙ 1 −0,125 0,125 0 h1 ⎣ h˙ 2 ⎦ = ⎣ 0,1 −0,2 0,1 ⎦ · ⎣ h2 ⎦ + 0 0,0833 −0,0833 h3 h˙ 3 ⎡
⎤ 0,1250 0 QZu1 ⎣ ⎦ 0 0 + · QZu3 0 0,0833
4.2 Polfestlegung für Mehrgrößensysteme und
y1 y2
=
h1 h3
=
93
⎡ ⎤ h 1 0 0 ⎣ 1⎦ · h2 . 0 0 1 h3
⎤ h1 QZu1 ⎦ ⎣ mit x = h2 als Zustandsvektor, u = als Stellvektor und dem Vektor QZu3 h3 h1 y= als Ausgangsvektor. h3 ⎡
Die Eigenwerte der Dynamikmatrix A lauten λ1 = −0,3063
λ2 = −0,1020
und
λ3 = 0 .
Die Sprungantwort des Hydraulik-Kaskade für eine sprungförmige Stellgröße QZu1 = 1 hl/s zeigt Abb. 4.2 2.5
h(t)
2
h1 (t)
61.5
h2 (t)
1 0.5 0
h3 (t) 0
5
10
15
20
25
-
30
35
40
45
50
t/s
Abbildung 4.2: Sprungantwort der Hydraulik-Kaskade für einen Sprungeingang QZu1 = 1 hl/s Mit einem integrierenden Verhalten steigt der Füllstand der drei Behälter. Der Füllstand von Behälter eins steigt am schnellsten, dann folgen die Behälter zwei und drei. Mittels Polfestlegung sollen nun die Pole des Kreises mit Zustandsvektorrückführung auf die Positionen λ1 = −0,30
λ2 = −0,25
und
λ3 = −0,20
verschoben werden. Die mit der Methode der robusten Polfestlegung berechnete Rückführmatrix lautet dann: 1,1449 0,9873 0,1565 K= . 0,3609 1,0203 2,3826
94
4 Reglerentwurf zur Polfestlegung
Die Pole des rückgeführten Sytems Ac = A − B · K liegen, wie man leicht feststellen kann, auf den gewünschten Positionen. Die Sprungantwort der Hydraulik-Kaskade für dieselbe sprungförmige Stellgröße QZu1 = 1 hl/s zeigt Abb. 4.3. Hierbei ist allerdings 0.5
h1 (t)
0.4
h(t)
60.3
h2 (t)
0.2
h3 (t)
0.1 0
0
10
20
30
40
50
-
60
70
80
90
100
t/s
Abbildung 4.3: Sprungantwort der Hydraulik-Kaskade für einen Sprungeingang QZu1 = 1 hl/s mit Zustandsvektorrückführung und Rückführmatrix mittels Polfestlegung zu beachten, dass die Stellgröße nur positive Werte annehmen kann, ansonsten ergibt sich ein anderer Signalverlauf der Füllstände. Die Füllstände h1 bis h3 enden alle bei demselben Endwert von ca. 0,43 m, da infolge der Rückführung die Eingangssignale in das System nach Null geführt werden. Anschließend gleichen sich über die Ventile die Füllstände der Behälter aus. Auch hier steigt der Füllstand von Behälter eins am schnellsten, dann folgen die Behälter zwei und drei.
4.3
Auswahl der gewünschten Pollagen
Problematik. Bei der Anwendung der Verfahren zur Polverschiebung stellt sich schnell die Frage nach der gewünschten Position, auf welche die Pole des geschlossenen Regelkreises verschoben werden sollen. Hierzu werden in diesem Abschnitt einige Vorschläge gemacht. Bei manchen Anwendungen, wie z. B. in der Flugregelung, sind die Pollagen für die Erfüllung bestimmter Qualifikationen schon vorgegeben, sodass man sich hierüber weniger Gedanken machen muss. Bei anderen Anwendungen versucht man die für die Polverschiebung aufgewendete Stellenergie möglichst gering zu halten. Es werden vier verschiedene Möglichkeiten zur Auswahl der gewünschten Pollagen vorgestellt.
4.3.1
Dominierendes Polpaar
Methode. Dies ist die einfachste Methode um mögliche Pollagen vorzugeben. Man spezifiziert die Lage eines dominierenden Polpaares, und legt damit im Wesentlichen
4.3 Auswahl der gewünschten Pollagen
95
die Anregelzeit, Ausregelzeit sowie das Überschwingen fest (siehe [65]). Die weiteren Pole des Systems werden auf der reellen Achse sehr weit links positioniert. Damit wird das Einschwingverhalten im Wesentlichen durch das dominierende Polpaar bestimmt, auf die erforderliche Stellenergie und die Stellamplituden wird weniger Rücksicht genommen. Es ist hierbei auch notwendig, dass mögliche Nullstellen weit genug links in der s-Halbebene liegen, sodass ihr Einfluss gering ist. Diese Philosophie rührt von der Regelung eines Systems mit mehreren schwach gedämpften hochfrequenten Vibrationen plus zusätzlicher niederfrequenter Bewegungen zweier starrer Körper her. Die niederfrequenten Bewegungen werden bezüglich Kreisfrequenz ω und Dämpfung D geeignet geregelt, und bei den hochfrequenten Modi wird nur die Dämpfung erhöht um die Stellenergie klein zu halten. Das Verfahren soll an dem Eingrößensystem 3. Ordnung von Beispiel 3.7 auf Seite 65 erprobt werden. Beispiel 4.6 Eingrößensystem 3. Ordnung: Gegeben sei das Eingrößensystem in Zustandsdarstellung zu ⎡
0 x˙ = ⎣ −2 −6 y = 3 2
⎤ ⎡ ⎤ 0 0,5 0 −2 −1,5 ⎦ · x + ⎣ 1 ⎦ · u −4 −3 2 −0,5 · x .
Die Pole des Systems liegen bei s1,2 = −0,2880 ± 0,6076j
und
s3 = −4,4241 .
Dämpfung und Kreisfrequenz des konjugiert komplexen Polpaares lauten: D = 0,4283
und
ω0 = 0,6724 .
Die Dämpfung des Systems soll bei unverändertem ω0 durch eine Zustandsvektorrückführung auf D = 0,7 erhöht werden, und der reele Pol nach −6 verschoben werden. Die neuen gewünschten Pollagen lauten dann s1,2 = −0,4707 ± 0,4802j
und
s3 = −6 .
Unter Verwendung der MATLAB-Subroutine place wird dann die Zustandsvektorrückführung berechnet zu K = [ 3,1003 0,7127 0,6143 ] . Es wird nun die Systemkonfiguration nach Abb. 4.4 untersucht. Für dieses System werden für das Eingangssignal u (t) = σ(t) die Sprungantworten y(t) „mit“ und „ohne“ Rückführung von u1 (t) sowie das Signal −u1 (t) für die Polverschiebung in Abb. 4.5 dargestellt.
96
4 Reglerentwurf zur Polfestlegung u (t) - h 6–
-
x(t) ˙ h
B
. . . dt
x(t)
C
y(t) -
+
u1 (t)
A K
Abbildung 4.4: System mit Zustandsvektorrückführung
1.5
y(t)
yohne (t)
1
6
ymit (t)
0.5
0
−0.5
−u1 (t) 0
2
4
6
8
10
-
12
14
16
18
20
t/s
Abbildung 4.5: Zeitverläufe „ohne“ und „mit“ Zustandsvektorrückführung Die Dämpfung des rückgeführten Systems ist wie gefordert deutlich erhöht, und das dafür erforderlich Rückführsignal −u1 (t) wird maximal ca. −0,45.
4.3.2
Prototypen-Entwurf
Methode. Bei den nächsten vorgeschlagenen Pollagen wird ein bestimmter Einschwingverlauf gemäß einem berechneten Beispielverlauf erzwungen. Als Beispielverläufe werden zwei Sprungantworten gewählt:
(1.) Als erster Beispielverlauf wird die Sprungantwort y(t) gewählt, die sich ∞ bei Minimierung des ITAE-Kriteriums J = 0 t|xd (t)|dt ergibt. Die sich dann ergebenden Pollagen werden in Tabelle 4.1 aufgeführt. (2.) Der zweite Beispielverlauf resultiert bei Realisierung der Sprungantwort für eine Bessel-Übertragungsfunktion.
4.3 Auswahl der gewünschten Pollagen
97
Die Tabellen2 4.1 und 4.2 listen die notwendigen Pollagen für diese Entwürfe für die Kreisfrequenz ω0 = 1 rad/s auf3 :
(1) ITAE-ÜF
Pollagen für ω0 = 1 rad/s s+1 s + 0,7071 ± j0,7071 (s + 0,7081)(s + 0,5210 ± j1,068) (s + 0,4240 ± 1,2630j)(s + 0,6260 ± j0,4141) (s + 0,8955)(s + 0,3764 ± j1,2920) ·(s + 0,5758 ± j0,5339) (s + 0,3099 ± j1,2634)(s + 0,5805 ± j0,7828) ·(s + 0,7346 ± j0,2873)
k 1 2 3 4 5 6
Tabelle 4.1: Tabelle mit den Pollagen der ITAE-Übertragungsfunktion
Zu den Pollagen der Tabellen gehören die in den Abbildungen 4.6 und 4.7 gezeigten Sprungantworten. Die Übertragungsfunktionen aus den Tabellen 4.1 und 4.2 werden derart normiert, dass für die Nennerpolynome N (s) das Zählerpolynom Z(s) = 1 gesetzt wird. Es resultiert so im eingeschwungenen Zustand der Endwert Eins.
1.2 1
y(t)
0.8
6
k=
1
2
3
4
5 6
0.6 0.4 0.2 0
0
2
4
6
-
8
10
t/s
Abbildung 4.6: Sprungantworten für ITAE-Prototypen
2 3
Aus Platzgründen wird (s + a + jb)(s + a − jb) geschrieben als (s + a ± jb). Für ω0 -Werte ungleich 1 ist s durch s/ω0 zu ersetzen.
12
98
4 Reglerentwurf zur Polfestlegung
(2) Bessel-ÜF
k 1 2 3 4 5
Pollagen für ω0 = 1 rad/s s+1 s + 0,8660 ± j0,5000 (s + 0,9420)(s + 0,7455 ± j0,7112) (s + 0,6573 ± j)0,8302(s + 0,9047 ± j0,2711) (s + 0,9264)(s + 0,5906 ± j0,9072) ·(s + 0,8516 ± j0,4427) (s + 0,5385 ± j0,9617)(s + 0,7998 ± j0,5622) ·(s + 0,9093 ± j0,1856)
6
Tabelle 4.2: Tabelle mit den Pollagen der Bessel-Übertragungsfunktion 1.2 1
y(t)
0.8
6
k=
1
2
3
4
5
6
0.6 0.4 0.2 0
0
2
4
6
-
8
10
12
t/s
Abbildung 4.7: Sprungantworten für Bessel-Prototypen Auch dieser Entwurf soll wieder an dem zuvor untersuchten Beispiel 3. Ordnung untersucht werden. Beispiel 4.7 Eingrößensystem 3. Ordnung: Gegeben sei das Eingrößensystem in Zustandsdarstellung zu ⎡
0 x˙ = ⎣ −2 −6 y = 3 2
⎤ ⎡ ⎤ 0 0,5 0 −2 −1,5 ⎦ · x + ⎣ 1 ⎦ · u −4 −3 2 −0,5 · x .
Die Pole des Systems liegen bei s1,2 = −0,2880 ± 0,6076j
und
s3 = −4,4241 .
Dämpfung und Kreisfrequenz des konjugiert komplexen Polpaares lauten: D = 0,4283
und
ω0 = 0,6724 .
4.3 Auswahl der gewünschten Pollagen
99
(1): Für den ITAE-Prototypenentwurf müssen die Pole auf die Positionen s1 = −0,4761
s2,3 = −0,3503 ± 0,7181j
und
verschoben werden. Unter Verwendung von place wird dann die Zustandsvektorrückführung berechnet zu K = [ −2,0280
− 1,6960
− 1,0636 ] .
Dämpfung und Kreisfrequenz des konjugiert komplexen Polpaares lauten nun: D = 0,4384
und
ω0 = 0,7990 .
Der reelle Pol rückt deutlich nach rechts. Für dieses System werden für das Eingangssignal u (t) = σ(t) die Sprungantworten y(t) „mit“ und „ohne“ Rückführung von u1 (t) sowie das Signal −u1 (t) für die Polverschiebung in Abb. 4.8 dargestellt. 8
ymit (t) 6
y(t)
−u1 (t)
6 4
2
0
yohne (t) 0
2
4
6
8
10
-
12
14
16
18
20
t/s
Abbildung 4.8: ITAE-Zeitverläufe „ohne“ und „mit“ Zustandsvektorrückführung Wie man aus Abb. 4.8 erkennt, wird durch die Zustandsvektorrückführung die Streckenverstärkung deutlich erhöht. Dies erfolgt unter Verwendung eines kräftigen Rückführsignals. Das prozentuale Überschwingen wird reduziert. (2): Für den Bessel-Prototypenentwurf müssen die Pole auf die Positionen s1 = −0,6334
und
s2,3 = −0,5013 ± 0,4782j
verschoben werden. Unter Verwendung von place wird dann die Zustandsvektorrückführung berechnet zu K = [ −1,8850
− 1,6960
− 0,8340 ] .
Dämpfung und Kreisfrequenz des konjugiert komplexen Polpaares lauten nun: D = 0,7236
und
ω0 = 0,6928 .
100
4 Reglerentwurf zur Polfestlegung
7 6
ymit (t)
y(t)5
−u1 (t)
64 3 2
yohne (t)
1 0
0
2
4
6
8
10
-
12
14
16
18
20
t/s
Abbildung 4.9: Bessel-Zeitverläufe „ohne“ und „mit“ Zustandsvektorrückführung Der reelle Pol rückt auch hier deutlich nach rechts. Für dieses System werden für das Eingangssignal u (t) = σ(t) die Sprungantworten y(t) „mit“ und „ohne“ Rückführung von u1 (t) sowie das Signal −u1 (t) für die Polverschiebung in Abb. 4.9 dargestellt. Wie man aus Abb. 4.9 erkennt, wird auch hier durch die Zustandsvektorrückführung die Streckenverstärkung deutlich erhöht. Dies erfolgt auch hier unter Verwendung eines kräftigen Rückführsignals. Der Zeitverlauf ist jedoch insgesamt wesentlich ruhiger geworden.
4.3.3
Symmetrischer Wurzelort
Methode. In Kapitel 5 wird das Verfahren der linearen optimalen Regelung zur Bestimmung einer optimalen Rückführung u = −K · x vorgestellt. Dabei wird im Zuge einer Minimierung der Gütefunktion ∞ J = [xT Qx + uT Ru] dt
und
min J(u) ⇒ u∗ u
0
gezeigt, dass dieses Optimum mittels einer linearen Zustandsvektorrückführung erzielt wird. Somit läuft diese Optimierung auf die Ermittlung der Rückführmatrix K hinaus. Dieses Verfahren wird nun auf die Polfestlegung bei Eingrößensystemen der Form x˙ = A · x + b · u y = cT1 · x angewendet. Der Index bei der Messmatrix c soll andeuten, dass man bei der Polfestlegung nicht die Originalmatrix c sondern auch eine modifizierte Matrix c1 verwenden
4.3 Auswahl der gewünschten Pollagen
101
kann. Im Eingrößenfall lautet das Gütekriterium ∞ J = [ρy 2 (t) + u2 (t)]dt . 0
Kailath [36] hat nun gezeigt, dass die optimalen Pole des geschlossenen Regelkreises durch die „stabilen“ Pole (jene in der linken s-Halbebene) der Gleichung 1 + ρ(−1)n−m G1 (−s)G1 (s) = 0 bestimmt sind. Die Übertragungsfunktion G1 (s) ist dabei bestimmt zu G1 (s) =
y(s) Z(s) = cT1 · {sI − A}−1 · b = , u(s) N (s)
und n bzw. m sind der Grad von Nenner bzw. Zählerpolynom der Übertragungsfunktion G1 (s). Die bei dem Verfahren der Wurzelortskurve gesuchte skalare Reglerverstärkung K wird hier ersetzt durch den Gewichtsparameter ρ, der die Gewichtung der Nullablage des Ausgangssignals y(t) im Vergleich zur aufgewendeten Stellamplitude u(t) bewerkstelligt. Bei einem großen ρ wird die Nullablage von y(t) bestraft und klein gehalten zulasten eines großen Stellsignals u(t). Umgekehrt lässt ein kleines ρ eine größere Nullablage von y(t) zu, hält dafür aber die Stellamplitude u(t) klein. Die für die Polfestlegung gesuchten optimalen Pollagen sind dann die auf der Wurzelortskurve für das jeweilige ρ bestimmten Pole in der linken s-Halbebene. Die Wurzelortskurve ist dabei die Wurzelortskurve des Systems (−1)n−m G1 (−s)G1 (s) = (−1)n−m
Z(−s)Z(s) . N (−s)N (s)
(4.15)
Diese Wurzelortskurve weist eine doppelte Symmetrie sowohl zur reellen Achse als auch zur imaginären Achse auf. Dieses Verfahren soll zunächst an einem einfachen Beispiel demonstriert werden. Beispiel 4.8 Instabiles System: Gegeben sei folgendes instabile System eines invertierten Pendels: 0 1 0 x˙ = ·x+ ·u −0,25 0 −1 Zur gleichen Gewichtung der Ausgänge x1 (t) und x2 (t), die dem Winkel und der Winkelgeschwindigkeit entsprechen, wird die Messgleichung gewählt zu y=[1
1 ]·x .
102
4 Reglerentwurf zur Polfestlegung
Die zugehörige Übertragungsfunktion dieses Systems lautet nun: G1 (s) =
s+1 . − 0,25
s2
Die Differenz der Ordnung von Nenner- und Zählergrad beträgt hier n − m = 1. Somit ist die Wurzelortskurve von (−1)n−m G1 (−s)G1 (s) = (−1) ·
(−s + 1)(s + 1) (s2 − 0,25)2
zu ermitteln. Abb. 4.10 zeigt die resultierende Wurzelortskurve mit jeweils einem Doppelpol bei ±0,5 sowie je einer Nullstelle bei −1 und bei +1. Die Äste der Wurzelortskurve beginnen jeweils in den Doppelpolen auf der reellen Achse, verlaufen dann entlang der Halbkreise in der positiven und negativen s-Halbebene, treffen dann bei ca. ±1,3 wieder zusammen und laufen dann in die Nullstellen bei ±1 bzw. ins Unendliche. Für die Wahl der Pole für die Polfestlegung sind nur die beiden linken Äste der Wurzelortskurve von Bedeutung. Für ein kleines ρ, d. h. eine kleine Gewichtung von y 2 (t), sind die gesuchten Pollagen nahe bei dem Doppelpol bei −0,5 auf den beiden Halbkreisen zu wählen. Für ein großes ρ, d. h. eine große Gewichtung von y 2 (t), sind die gesuchten Pollagen auf der negativen reellen Achse zu wählen. Dazwischen lägen dann die Pollagen für einen Kompromisswert von ρ.
Im(s)
6
Abbildung 4.10: Symmetrische Wurzelortskurve des instabilen Pendels -
Re(s)
Beispiel 4.9 Eingrößensystem 3. Ordnung: Gegeben sei das Eingrößensystem in Zustandsdarstellung zu ⎡ ⎤ ⎡ ⎤ 0 0 0,5 0 x˙ = ⎣ −2 −2 −1,5 ⎦ · x + ⎣ 1 ⎦ · u −6 −4 −3 2 y = 3 2 −0,5 · x .
4.3 Auswahl der gewünschten Pollagen
103
Die Übertragungsfunktion für dieses System lautet: G1 (s) =
2 + 3s + s2 . 2 + 3s + 5s2 + s3
Nun wird die Wurzelortskurve für den symmetrischen Wurzelort gemäß Gleichung 4.15 ermittelt und in Abb. 4.11 dargestellt.
Im(s)
6
-
Re(s)
Abbildung 4.11: Symmetrische Wurzelortskurve des Systems 3. Ordnung
Je zwei Äste der symmetrischen Wurzelortskurve beginnen in den konjugiert komplexen Polen (gekennzeichnet mit einem „x“) verlaufen dann zur reellen Achse und von dort in die Nullstellen (gekennzeichnet mit „o“) auf der reellen Achse. Ast fünf und sechs beginnen in den Polen auf der reellen Achse und verlaufen von dort ins Unendliche. Zusätzlich markiert mit einem „+“ sind die Pollagen für ein ρ = 2 (nahe den Polen) sowie mit einem „+“ für ein ρ = 60 (nahe den Nullstellen) auf der reellen Achse. Die Pollagen in der linken s-Halbebene für ρ = 2 lauten: s1,2 = −0,5989 ± 0,6292j und s3 = −4,5907 , und für ρ = 60 lauten sie: s1 = −1,1383; s2 = −1,5825 und s3 = −8,6718 . Zu diesen Pollagen gehören dann die mit dem Programm place ermittelten Rückführmatrizen: (1.) für ρ = 2 : K ρ=2 = [ 3,2533
1,4640
(2.) für ρ = 60 : K ρ=60 = [ 22,3956
− 0,3378 ] ,
13,6210
− 3,6142 ] .
Die resultierenden Zeitverläufe der mit diesen Verstärkungen rückgeführten Systeme werden nun analysiert. In Abb. 4.12 wird die Sprungantwort für die Rückführung K ρ=2 simuliert.
104
4 Reglerentwurf zur Polfestlegung
1.5
yohne (t) y(t)
1
ymit (t)
60.5 0
−u1 (t) −0.5 −1
0
2
4
6
8
10
-
12
14
16
18
20
t/s
Abbildung 4.12: Sprungantwort für das System 3. Ordnung mit der Rückführung K ρ=2
Aufgrund der geringen Verstärkung, wegen des kleinen ρ ist die Stellamplitude ebenfalls gering. Die Gesamtverstärkung des rückgeführten Systems wird abgesenkt. Insgesamt ist jedoch der Eingriff der Rückführung in die Systemdynamik relativ gering. Der Verlauf ähnelt dem in Abb. 4.5 analysierten Verlauf bei Polauswahl für das dominierende Polpaar (Abschnitt 4.4.3.1). Abb. 4.13 zeigt die Sprungantwort für die Rückführung K ρ=60 .
1.5
y(t)
yohne (t)
1
60.5
ymit (t)
0 −0.5 −1
−u1 (t) 0
2
4
6
8
10
-
12
14
16
18
20
t/s
Abbildung 4.13: Sprungantwort für das System 3. Ordnung mit der Rückführung K ρ=60 Nun ist aufgrund der großen Verstärkung der Eingriff in die Systemdynamik sehr groß. Der Verlauf der Sprungantwort zeigt eine schnelle Reaktion, jedoch mit deutlich verringerter Gesamtverstärkung.
4.3 Auswahl der gewünschten Pollagen
4.3.4
105
Pol-/Nullstellenkompensation
Methode. Die Methode des symmetrischen Wurzelorts führt bei Auswahl eines großen ρ schnell zu der Frage, ob es nicht möglich ist, mittels der Polfestlegung eine Pol/Nullstellenkompensation durchzuführen. Bisher ging die Messmatrix C wenig bzw. überhaupt nicht in die Berechnung der Rückführung ein. Da das zu untersuchende System, speziell im Eingrößenfall, jedoch wohlbekannte Pole und Nullstellen aufweist, soll nun eine direkte Pol-/Nullstellenkompensation betrachtet werden. Dies soll wieder am Beispiel des Systems 3. Ordnung dargestellt werden. Beispiel 4.10 Eingrößensystem 3. Ordnung: Gegeben sei das Eingrößensystem in Zustandsdarstellung zu ⎡
0 x˙ = ⎣ −2 −6 y = 3
⎤ ⎡ ⎤ 0 0,5 0 −2 −1,5 ⎦ · x + ⎣ 1 ⎦ · u −4 −3 2 2 −0,5 · x .
Die Übertragungsfunktion des Systems lautet F (s) =
2 + 3s + s2 . 2 + 3s + 5s2 + s3
Pole und Nullstellen des Systems liegen bei: s02 = −2 s01 = −1; s1,2 = −0,2880 ± 0,6076;
und s3 = −4,4241 .
Legt man nun die gewünschte Pollage des rückgeführten Systems fest zu s1 = −1;
s2 = −2
und
s3 = −1,1 ,
so resultiert als Rückführmatrix K = [ 2,3
0,2
− 0,55 ] .
Zu dieser Rückführung gehört die in Abb. 4.14 gezeigte Sprungantwort des rückgeführten Systems: Die benötigte Stellenergie ist relativ gering, und das rückgeführte System zeigt eine Sprungantwort, die sich in der Amplitude nicht wesentlich von der ursprünglichen unterscheidet. Der Verlauf ist jedoch deutlich ruhiger geworden, da das Überschwingen infolge der Nullstellen wegkompensiert wird.
106
4 Reglerentwurf zur Polfestlegung 1.5
yohne (t)
y(t)
1
ymit (t)
6 0.5
0
−u1 (t) −0.5
0
2
4
6
8
10
-
12
14
16
18
20
t/s
Abbildung 4.14: Sprungantwort für das System 3. Ordnung mit der Rückführung zur Pol-/Nullstellenkompensation
4.3.5
Resümee
Ergebnisvergleich für das Beispiel des Eingrößensystems. Der Vergleich der für das Eingrößensystem erzielten Ergebnisse zeigt deutlich die Vorteile der Methoden dominantes Polpaar, symmetrischer Wurzelort und Pol-/Nullstellenkompensation. Die benötigte Stellenergie ist relativ gering, außer beim symmetrischen Wurzelort für ρ = 60. Der Prototypenentwurf ist deutlich schlechter, da dem System eine Dynamik aufgezwungen wird, ohne Rücksicht auf die vorhandene Eigendynamik. Außer bei der Pol-/Nullstellenkompensation wird auf die vorhandenen Nullstellen des Systems keine Rücksicht genommen, sodass der Verlauf der Sprungantwort bei starkem Einfluss der Nullstellen deutlich vom gewünschten Verlauf abweicht. Erstaunlich ist das Ergebnis der Pol-/Nullstellenkompensation, da aufgrund der Ergebnisse des symmetrischen Wurzelorts für ein großes ρ eigentlich mit großen Stellamplituden zu rechnen gewesen wäre. Dies ist jedoch überraschenderweise nicht der Fall, vermutlich weil der dritte Pol nach rechts verschoben wurde. Die Analogie zur Kompensation mit dem klassischen PID-Regler bleibt erhalten. Es bleiben die Nullstellen von Regler und Strecke im geregelten System in der Führungsübertragungsfunktion erhalten, eine Kompensation durch Pole ist jedoch möglich. Anwendung bei Mehrgrößensystemen. Die erläuterten Methoden der Polfestlegung werden demonstriert für den Fall des Eingrößensystems. Die Methoden sind im Wesentlichen jedoch ebenso auf Mehrgrößensysteme anwendbar. Speziell das Verfahren des dominanten Polpaares und der Prototypenentwurf sind ohne Einschränkungen auf Mehrgrößensysteme anwendbar. Auch hier gilt allerdings wie bei den Eingrößensystemen, dass aufgrund der nicht berücksichtigten Nullstellen die Sprungantworten nicht unbedingt vorhersagbar sind. Die Pol-/Nullstellenkompensation legt die Pole speziell auf die Nullstellen des Zählerpolynoms. Daher kann diese Methode bei Mehrgrößensystemen nur beschränkt eingesetzt werden, da mehrere Zählerpolynome mit jeweils unterschiedlichen Nullstellen auftreten können. Treten dominante Nullstellen auf, so ist die Pol-/Nullstellenkompensation jedoch näherungsweise einsetzbar.
5
Optimale Zustandsregelung
Gütekriterien zur Optimierung. Zur Bestimmung der Reglerparameter von Eingrößensystemen kann man Gütekriterien wie z. B. das IAE-Kriterium (Integral of Absolute Error) Ja verwenden: ∞
∞ |w " − x(τ )|dτ =
Ja = τ =0
|xd (τ )|dτ
wobei
min
KP ,TN ,...
Ja ⇒ KP∗ , TN∗ , . . .
τ =0
Das Minimum dieses Gütekriteriums über die Reglerparameter wie z. B. KP , TN . . . liefert die gesuchten „optimalen“ Werte von KP∗ , TN∗ . . .. Weitere Kriterien sind die quadratische Regelfläche Jq (ISE-Kriterium — Integral of Squared Error) ∞
∞ [w " − x(τ )] dτ = 2
Jq = τ =0
xd (τ )2 dτ
und
min
KP ,TN ,...
Jq ⇒ KP∗ , TN∗ , . . .
τ =0
und zeitgewichtete Kriterien wie z.B. das ITAE-Kriterium (Integral of Time multiplied by Absolute Error) Ji , mit ∞
∞ τ |w−x(τ " )| dτ =
Ji = τ =0
τ |xd (τ )| dτ
und
min
KP ,TN ,...
Ji ⇒ KP∗ , TN∗ , . . .
τ =0
Ein derartiges Kriterium kann man auch zur Bestimmung des Rückführvektors K bei Mehrgrößensystemen einsetzen. Damit ist es dann zwar nicht möglich, die Pole des rückgeführten Systems auf eine gegebene Position zu verschieben, dennoch ist eine gezielte Beeinflussung des Regelverhaltens gewährleistet. Somit ist die Struktur der Rückführung identisch zur Struktur von Abb. 4.1, wie Abb. 5.1 zeigt.
5.1
Lineare quadratische optimale Regelung
Quadratische Gütekriterien. Das obige ISE-Kriterium wird auch bei Mehrgrößensystemen angewendet, um den Regelfehler bzw. die Abweichungen des Zustandsvektors
108
5 Optimale Zustandsregelung u (t)
h
x(t) ˙ h
u(t) B
–
. . . dt
x(t)
C
y(t)
+ A K
Abbildung 5.1: System mit Zustandsvektorrückführung bei Messung des Zustandsvektors
x von Null zu minimieren. Dabei wird meist eine Wichtungsmatrix Q eingeführt. Das Kriterium lautet dann: tf xT Qx dt
J1 =
wobei
min J1 (u) ⇒ u∗ . u
(5.1)
t0
Die Matrix Q wird als reelle, symmetrische, positiv definite oder positiv semidefinite Matrix gewählt. Aufgrund dieser Wahl wird die Gütefunktion J1 größer Null, J1 > 0. Die Minimierung der Funktion J1 über u liefert einen Stellvektor u∗ (x, t) derart, dass die Regelgröße x(t0 ) mittels der Zustandsvektorrückführung nach Abb. 5.1 in den Zustand x(tf ) überführt wird und gleichzeitig das Kriterium J1 minimal wird. Da das Kriterium nach Gleichung 5.1 zu nicht eindeutigen Lösungen für u führen kann (wegen u∗ (t) → ∞), wird dem Kriterium ein Maß für die Stellenergie hinzugefügt. Das Kriterium J2 lautet dann tf (xT Qx + uT Ru) dt .
J2 =
(5.2)
t0
Das Kriterium J2 nach Gleichung 5.2 wird als quadratisches Gütekriterium bezeichnet. Seine Anwendung min J2 (u) ⇒ u∗ u
(5.3)
führt zu einem optimierten Regelsystem, das einen Kompromiss zwischen einem System mit minimalem quadratischen Zustandsfehler und mit minimaler Stellenergie darstellt. Ändert man die Integrationsgrenzen auf Null und Unendlich, so gelangt man für das lineare System in Zustandsdarstellung x˙ = A · x + B · u
und
x(0) = x0
(5.4)
5.1 Lineare quadratische optimale Regelung
109
zur Formulierung des linearen quadratischen Reglerproblems: ∞ J = [xT Qx + uT Ru] dt
und
min J(u) ⇒ u∗ . u
(5.5)
0
Mit diesen Integrationsgrenzen wird das optimale Regelgesetz u∗ (x) eine explizite Funktion vom Zustandsvektor x(t). Dies ermöglicht die Realisierung der optimalen Regelung mittels einer Zustandsvektorrückführung in der Form u∗ = −K · x .
(5.6)
Ljapunov-Funktion. Ausgehend vom ungeregelten System mit u(t) = 0 lautet das Gütefunktional nach Gleichung 5.5 ∞
∞ xT0 ΦT (t) Q Φ(t) x0 dt = xT0 P x0
T
J=
x (t)Qx(t) dt = 0
0
mit x(t) = Φ(t)x0 = eA t x0 und ∞ ΦT (t)QΦ(t) dt .
P =
(5.7)
0
Die Anwendung der Regeln der partiellen Integration auf Gleichung 5.7 ergibt −1
P = Φ (t)QA T
∞ ∞ Φ(t) − AT ΦT (t)QA−1 Φ(t) dt .
(5.8)
0
0
Wegen Gleichung 2.20 kann man die Multiplikation von A und Φ(t) vertauschen. Außerdem resultiert für eine stabile Matrix A nun Φ(∞) = 0 und somit kann man dann Gleichung 5.8 überführen in ⎡ P = −QA−1 − AT ⎣
∞
⎤ ΦT (t)QΦ(t) dt⎦ A−1 .
(5.9)
0
Das Integral auf der rechten Seite stellt wiederum die Matrix P dar. Somit lautet Gleichung 5.9 dann P = −QA−1 − AT P A−1 ,
110
5 Optimale Zustandsregelung
bzw. nach Rechtsmultiplikation mit A resultiert: AT P + P A = −Q .
(5.10)
Diese Gleichung spielt in der Stabilitätstheorie eine bedeutende Rolle und sie wird als Ljapunov-Gleichung bezeichnet. Nach [12] existiert eine eindeutige Lösung dieser Gleichung für P , sofern die Matrix A nur Eigenwerte mit negativem Realteil aufweist. Weiterhin wird diese Lösung P durch das folgende konvergierende Integral spezifiziert: ∞ P =
T eA t QeA t dt .
(5.11)
0
Die nummerische Lösung der Ljapunov-Gleichung erfolgt in MATLAB mittels Aufruf der Subroutine lyap. Ljapunov-Funktion für das rückgeführte System. Dieselbe Vorgehensweise wird nun auf die Regelstrecke mit Zustandsvektorrückführung u = −K ·x angewendet. Dann gilt x˙ = [A − BK] x
und
x(0) = x0 .
Nun führt man die Systemmatrix Ac = A − BK ein und erhält als Gütefunktional nach Einsetzen von u = −K · x in Gleichung 5.5 dann ∞
∞ T
J=
T
xT QS x dt
x (Q + K RK)x dt = 0
(5.12)
0
mit QS = Q + K T RK. Damit resultiert für das System mit Zustandsvektorrückführung die Ljapunov-Gleichung ATc P + P Ac = −QS .
(5.13)
Für das Gütefunktional gilt J = xT0 P x0
(5.14)
mit ∞ P = 0
T eAc t QS eAc t dt .
(5.15)
5.1 Lineare quadratische optimale Regelung
111
Ermittlung der optimalen Rückführmatrix K ∗ . Es ist die optimale Rückführmatrix K ∗ derart zu bestimmen, dass der Güteindex nach Gleichung 5.14 minimal wird. Eine einfache Herleitung der notwendigen Optimalitätsbedingungen hierfür wird in [50] angegeben. Eine notwendige Bedingung für das Minimum min J(K) ⇒ K ∗ ist, dass die erste K Ableitung von J nach K von Gleichung 5.14 verschwindet: dJ ! = 0 dki,j
für
i = 1, . . . , r
j = 1, . . . , n .
(5.16)
Wegen Gleichung 5.14 entspricht dieser Forderung dP dJ = xT0 x0 = 0 . dki,j dki,j
(5.17)
Da diese Bedingung unabhängig von x0 sein soll, folgt hieraus die gleichwertige Bedingung: dP =0 dki,j
für
i = 1, . . . , r
j = 1, . . . , n .
(5.18)
Die Matrix P ist die Lösung der Ljapunov-Gleichung ATc P + P Ac = −QS .
(5.19)
Leitet man nun diese Ljapunov-Gleichung 5.19, die Bestimmungsgleichung für P , nach ki,j ab und berücksichtigt, dass Ac und QS von K abhängen, so resultiert: $ dQS d # T Ac P + P Ac = − dki,j dki,j dAc dQS dATc P +P = − dki,j dki,j dki,j −
dK T T dK dK T dK B P − PB = − RK − K T R . dki,j dki,j dki,j dki,j
Geeignet zusammengefasst resultiert daraus $ # $T dK dK T # RK − B T P + RK − B T P · =0. dki,j dki,j
(5.20)
112
5 Optimale Zustandsregelung
Die Ableitung der Matrix K nach dki,j ergibt eine Matrix, die eine Eins an Position (i,j) und sonst lauter Nullen enthält. Führt man die Differentiation nach Gleichung 5.20 aus, so resultiert z. B. für ein System mit r = n = 5 sowie i = 2 und j = 3 ⎡
⎤ 0 ⎢ 0 ⎥ # $ # $T ⎢ ⎥ ⎢ 0 1 0 0 0 ⎥ · RK − B T P + RK − B T P ⎣ 0 ⎦ 0 ⎡ 0 0
.. . .. .
⎤ 0 ⎢0 0 1 0 0⎥ ⎢ ⎥ 0 ·⎢ ⎥= ⎣ ⎦ 0 0
⎤ ⎢ 0 0 0 0 0 ⎢ 0 0 0 $ ⎥ ⎢ ⎢ 0 0# 0 0 # $T ⎥ ⎢ ⎢ T ⎢ . . . RK − B T P . . . ⎥ + ⎢ ⎢ 0 0 RK − B P ⎥ ⎢ ⎢ i i ⎦ ⎢ ⎣0 0 0 0 0 .. ⎢0 0 . ⎣ 0 0 0 0 0 .. 0 0 . ⎡
⎡
⎤ 0 0
⎥ ⎥ 0 0⎥ ⎥ ⎥ 0 0⎥ =0 ⎥ ⎥ 0 0⎥ ⎦ 0 0
# $ Diese Gleichung wird nur erfüllt, wenn die i-te Zeile von RK−B T P , also RK − B T P i gleich dem Nullvektor ist. Die identische Bedingung resultiert für die anderen Werte von j. Die Anwendung dieser Ableitung für die anderen Werte von i = 1, . . . , r führt jedoch zu den weiteren äquivalenten Bedingungen, dass auch die anderen i Zeilen von RK − B T P gleich dem Nullvektor sein müssen. Somit ist die Erfüllung von Gleichung 5.20 äquivalent zu der Forderung RK − B T P = 0 .
Die Optimalitätsbedingung für P nach Gleichung 5.18 wird somit erfüllt, wenn für die Rückführmatrix K gilt K = K ∗ = R−1 B T P ,
(5.21)
vorausgesetzt, dass die Inverse von R existiert. Das Einsetzen von Gleichung 5.21 in die Ljapunov-Gleichung 5.19 des rückgekoppelten Systems führt zur Bestimmungsgleichung für P , der so genannten algebraischen Matrix-Riccati-Gleichung AT P + P A − P BR−1 B T P + Q = 0 .
(5.22)
Nachfolgend wird die Formulierung und Lösung des quadratischen Reglerproblems zusammengefasst.
5.1 Lineare quadratische optimale Regelung
113
Formulierung und Lösung des quadratischen Reglerproblems. Man bezeichnet die Berechnung des Steuervektors u(t), der das Gütefunktional ∞ J = [xT Qx + uT Ru] dt
(5.23)
0
für das vollständig steuerbare System x˙ = A · x + B · u
mit
x(0) = x0
minimiert, als quadratisches Reglerproblem. Dabei sind die Wichtungsmatrizen Q und R vorzugeben, wobei die Matrix Q positiv semidefinit und R positiv definit zu wählen ist. Ist für die Matrix Q in der Form Q = QT1 Q1 das Paar (A, Q1 ) vollständig beobachtbar1, dann ist der optimale Rückführvektor u∗ bestimmt zu u∗ = −K · x = −R−1 B T P x , wobei P die symmetrische, positiv definite Lösung der algebraischen Matrix-RiccatiGleichung (subroutine lqr in MATLAB) AT P + P A − P BR−1 B T P + QT1 Q1 = 0 darstellt. Beispiel 5.1 System 1. Ordnung: Gegeben sei ein System 1. Ordnung in allgemeiner Form zu x˙ = a · x + b · u
mit
x(0) = x0 ,
und das Gütefunktional lautet ∞ J = [x(t)qx(t) + u(t)ru(t)]dt . 0
Für die Rückführung u(t) = −k · x(t) ergibt sich für x(t) dann x(t) = x0 · e(a−bk)t . Die Ermittlung der optimalen Rückführung k soll auf zwei verschiedenen Wegen gezeigt werden. 1
Das Paar (A, Q1 ) ist vollständig beobachtbar, wenn die Beobachtbarkeitsmatrix QB des Systems mit der Dynamikmatrix A und der Messmatrix Q1 vollen Rang hat.
114
5 Optimale Zustandsregelung
Weg 1 Minimierung des Gütefunktionals: Das Gütefunktional lautet ∞ ∞ 2 2 J = [qx (t) + ru (t)]dt = (q + rk 2 )x2 (t)dt 0
0
∞ ∞ 2 q + rk e2(a−bk)t . = x20 (q + rk 2 ) · e2(a−bk)t dt = x20 2(a − bk) 0
0
Abhängig vom Vorzeichen von a − bk existieren zwei Lösungen für J: ⎧ ∞ für a − bk > 0 ⎨ q + rk 2 2 J= x für a − bk < 0 . ⎩− 2(a − bk) 0 Die Bildung der ersten Ableitung dJ/dk unter Verwendung der Quotientenregel ergibt nach dem Nullsetzen die folgende quadratische Gleichung für k k2 −
q 2a k− =0 , b r
mit den Lösungen k1,2
a = ± b
( a q ( )2 + . b r
Von diesen Lösungen führt nur die mit dem positiven Vorzeichen zu einem stabilen System. Folglich resultiert für die optimale Rückführung ( a a q k ∗ = + ( )2 + . b b r Weg 2 Lösung der Riccati-Gleichung: Für das gegebene System lautet die algebraische Riccati-Gleichung 2pa − p2
b2 +q =0 , r
mit den Lösungen für p p1,2 =
ra ± b2
( ra qr ( 2 )2 + 2 . b b
5.1 Lineare quadratische optimale Regelung
115
Von diesen Lösungen ist nur die positive (definite) Lösung gültig und es gilt somit ra p= 2 + b
( ra qr ( 2 )2 + 2 . b b
Daraus folgt nach Multiplikation mit b/r (wegen k = p · b/r) dann a k = + b ∗
( a q ( )2 + . b r
Beide Lösungen für die optimale Rückführung sind identisch. Ergebnisinterpretation: Für )kleine Gewichtung der Stellamplitude (r → 0) geht die Rückführverstärkung k → q/r, also gegen beliebig große Verstärkungen. Das Gütekriterium J kann damit beliebig klein gemacht werden. Der Pol des rückgeführten Systems wird beliebig weit nach links in die negative s-Halbebene geschoben (s1 = a − bk). Für große Gewichtung der Stellamplitude (r → ∞) geht die Rückführverstärkung k → 0 bzw. 2a/b. Dabei gilt k = 0 für negative Werte von a, das System ist bereits stabil q 2 x0 . Der und eine Rückführung überflüssig. Das Gütefunktional lautet dann J = − 2a Wert k = 2a/b gilt für positives a, also für ein instabiles System. Die Gütefunktion geht dann jedoch gegen Unendlich. Der Pol des rückgeführten Systems wird von +a nach −a verschoben. Anwendung des quadratischen Reglerproblems. In der Anwendung des quadratischen Reglerproblems sind zunächst für das gegebene System mit den Systemmatrizen A und B die Gewichtsmatrizen Q und R auszuwählen. Ein „großes“ 2 Q bestraft große Ablagen der Regelgröße x(t). Im Ergebnis wird dann die Regelgröße x(t) schnell abklingen, aber zu Lasten großer Stellamplituden. Umgekehrt bestraft ein „großes“ R große Stellamplituden und führt damit zu einem langsamen Abklingen der Regelgröße x(t) bei kleinen Stellamplituden. Diese Interpretation gilt auch für die einzelnen Elemente der jeweiligen Matrizen Q und R. Ist z. B. Element (1,1) von Q größer als Element (2,2), also q1,1 > q2,2 , so wird eine große Amplitude von x1 (t) stärker bestraft als eine große Amplitude von x2 (t). In der Folge wird die Rückführmatrix K so beschaffen sein, dass in der Tendenz x1 (t) kleiner als x2 (t) sein wird. In der Regel wird man nur die Hauptdiagonalen der jeweiligen Matrizen Q und R mit positiven Werten belegen. Damit werden automatisch die Bedingungen der positiven Definitheit, bzw. Semidefinitheit erfüllt. Wichtig ist jedoch, dass alle Elemente der Hauptdiagonalen positiv sind. Auch die Aufspaltung von Q in das Produkt QT1 Q ist damit problemlos möglich. Die Belegung von Elementen der Nebendiagonalen von Q und R beeinflusst die Kopplung zwischen den einzelnen Zustands- bzw. Regelgrößen. 2
„Groß“ bedeutet hierbei einen großen Wert einer Matrixnorm.
116
5 Optimale Zustandsregelung
Die Lösung der algebraischen Riccati-Gleichung kann im Allgemeinen nicht mehr auf analytischem Weg erfolgen. Daher ist man hierfür auf die Verwendung von Rechenprogrammen wie z. B. MATLAB, DORA, MATRIXX, . . . angewiesen. Man erhält damit eine nummerische Lösung für die Matrix P . Dies wird am folgenden Beispiel gezeigt. Beispiel 5.2 System 2. Ordnung: Gegeben sei folgendes System zweiter Ordnung: 0 1 1 1 A= , b= , mit x(0) = . −2 −5 2 0 Gesucht ist der Rückführvektor k, der das quadratische Gütekriterium J nach Gleichung 5.23 ∞ J = [xT Qx + ru2 ] dt 0
für Q =
1 0 0 2
und r = 1 minimiert.
Lösung: Einsetzen der Zahlenwerte von A, b, Q und r in die Matrix-Riccati-Gleichung führt zu drei nichtlinearen Gleichungen für die Elemente p1,1 , p2,2 und p1,2 = p2,1 der Matrix P , deren Lösung nicht trivial ist. Schneller liefert ein Rechnerprogramm die nummerische Lösung P der Matrix-Riccati-Gleichung zu 0,8926 0,0265 P = . 0,0265 0,1889 Dann resultiert die Rückführmatrix K ∗ = R−1 B T P zu: K ∗ = [0,9456 0,4044] und der Wert des Gütefunktionals wird damit ∞ J = [xT Qx + ru2 ] dt = xT0 P x0 = 0,8926 . 0
Die Pole des Systems werden durch die Rückführung von s1 = −0,4384
und
s2 = −4,5616
auf die folgenden Positionen verschoben: s1 = −1,4811
und
s2 = −5,2732 .
Die Struktur des rückgeführten Systems zeigt Abb. 5.2. Darin ist u (t) der neue „freie“ Eingang des Systems.
5.1 Lineare quadratische optimale Regelung
117 x0
u (t) u(t) - i 6–
x(t) ˙ i
b
. . . dt
x(t)
+ A K∗
Abbildung 5.2: Regelkreis mit Zustandsvektorrückführung
Den Verlauf der Zustandsgrößen ohne und mit Rückführung zeigt Abb. 5.3. Die Zustandsgrößen gehen von ihren Anfangswerten auf den Endwert x(∞) = 0 über. Ohne Zustandsvektorrückführung klingen die Zustandsgrößen nach ca. 10 s auf Null ab. Mit Zustandsvektorrückführung dagegen sind sie schon nach ca. 4 s praktisch auf Null abgeklungen. Das System ist schneller geworden. Dies zeigt auch schon die Lage der Pole des offenen und rückgeführten Systems. Infolge der Rückführung werden die Pole in der s-Ebene nach links verschoben. 1 x1o
x1 ,x2 ,u(t) 0.5
6
x1r
ur
0 x2r
−0.5
0
1
x2o
2
3
4
5
-
6
7
8
9
10
t/s
Abbildung 5.3: Zeitverlauf der Zustands- und Stellgrößen des offenen (Index „o“) und des rückgeführten (Index „r“) Systems Vergrößert man jetzt den Wichtungsfaktor r der Stellgröße von r = 1 auf r = 10, so geht das Stellsignal stärker gewichtet in die Gütefunktion ein. Die Folge ist eine Reduzierung der Stellamplitude, aber auch ein deutlich langsameres Einschwingen der Zustandsgrößen auf Null, wie Abb. 5.4 zeigt. Die zugehörigen Werte der Rückführmatrix und der Pollagen sind: K ∗ = [0,1773 0,0632]
und
s1 = −0,6725 s2 = −4,6312 .
118
5 Optimale Zustandsregelung
1 0.8 x1o
x1 ,x2 ,u(t) 0.6
6
0.4 0.2
x1r
ur
0 x2r
−0.2 −0.4
0
x2o
1
2
3
4
5
-
6
7
8
9
10
t/s
Abbildung 5.4: Zeitverlauf der Zustands- und Stellgrößen des offenen (Index „o“) und des rückgeführten (Index „r“) Systems Durch Wahl der Wichtungsmatrizen Q und R hat man somit ein einfaches Mittel zur Verfügung, um den Verlauf der Zustandsgrößen und Stellgrößen gezielt zu beeinflussen. Die Berechnung der optimalen Rückführmatrix K führt zu einem Systemverhalten derart, dass die Zustandsvariablen von einem Anfangszustand x0 durch die Zustandsvektorrückführung unter Minimierung des Gütefunktionals in die Ruhelage überführt werden. Dies sagt zunächst noch nichts über das Führungs- und/oder Störverhalten des geregelten Systems aus. Diese Fragestellung der Optimierung des Führungs- und/oder Störverhaltens ist Thema von Kapitel 7. Aufgabe 5.1: Berechnen Sie für das folgende System in Zustandsdarstellung A=
0 1 −3 −4
und B =
1 2 1 0
für die Wichtungsmatrizen Q=
2 0 0 1
und R =
1 0 0 1
die Lösung P der algebraischen Riccati-Gleichung und die resultierende Rückführmatrix K. Lösung: P =
0,6083 0,0207 0,0207 0,1272
und
K=
0,6290 0,1480 1,2165 0,0415
5.1 Lineare quadratische optimale Regelung
119
Beispiel 5.3 Hydraulik-Kaskade: Die Methode des quadratischen Reglerproblems soll ebenfalls auf das Beispiel 2.1 der Hydraulik-Kaskade angewendet werden. Die Dynamikund Messgleichung der Hydraulik-Kaskade lauten entsprechend denen von Beispiel 2.5. Wählt man als Gewichtsmatrizen für die Bestimmung der Rückführmatrix K die Matrizen Q als Einheitsmatrix und R als Diagonalmatrix mit den Elementen 0, 2, dann resultiert die folgende Rückführmatrix: 1,6924 0,8100 0,3250 K= . 0,2166 0,6847 1,7455 Mit dieser Rückführmatrix K ergibt sich dann das in Abb. 5.5 dargestellte Einschwingverhalten für den bei der Füllstandsregelung zu beachtenden Spezialfall positiver Stellsignale (ein negativer Zufluss existiert nicht!). 0.4
h(t)
6
h1 (t)
0.3
h2 (t)
0.2
h3 (t)
0.1
0
0
10
20
30
40
50
-
60
70
80
90
100
t/s
Abbildung 5.5: Sprungantwort der Hydraulik-Kaskade für einen Sprungeingang QZu1 = 1 hl/s mit Zustandsvektorrückführung und Rückführmatrix mittels quadratischer Regelung. Die Füllstände h1 bis h3 enden (wie schon auf Seite 94 erläutert) alle bei demselben Endwert von ca. 0,35 m. Auch hier steigt der Füllstand von Behälter eins am schnellsten, dann folgen die Behälter zwei und drei. Aufgabe 5.2: Berechnen Sie für die Zahlenwerte des Beispiels 2.6 (Hubschrauber im Schwebeflug) die Lösung P der algebraischen Riccati-Gleichung und die resultierende Rückführmatrix K für die Wichtungsmatrizen: ⎡
2 ⎢0 ⎢ Q=⎢0 ⎣0 0
0 2 0 0 0
0 0 1 0 0
0 0 0 1 0
⎤ 0 0 ⎥ ⎥ 0 ⎥ 0 ⎦ 0,1
und
R=
1 0 0 1
.
120
5 Optimale Zustandsregelung
Wo liegen die Pole des rückgeführten Systems? Lösung: ⎡
4,1440 ⎢ 0,1360 ⎢ P = ⎢ 0,0195 ⎣ 0,0538 −0,0217
K=
0,1360 0,1369 0,0194 0,0543 −0,0220
0,0195 0,0194 0,3847 0,1655 −0,0133
0,0538 0,0543 0,1655 0,2723 −0,0505
⎤ −0,0271 −0,0220 ⎥ ⎥ −0,0133 ⎥ −0,0505 ⎦ 0,0305
1,4000 1,4080 −0,1416 −0,1546 0,0262 −0,2003 −0,2013 −0,9899 −1,4278 0,1174
λ1 = −17,2360 λ2 = −6,3937 λ3 = −3,9134 λ4 = −2,0372 λ5 = −0,4990.
5.2
Erzeugung eines vorgeschriebenen Stabilitätsgrades
Problemstellung. Es existieren Fragestellungen, bei denen die Pole des mittels Zustandsvektorrückführung geregelten Systems alle einen Realteil kleiner −α aufweisen sollen. Dieses Problem kann durch Modifikation des Problems der linearen quadratischen Regelung behandelt werden [3]. Es wird das vollständig steuerbare System in Zustandsdarstellung x˙ = A · x + B · u
mit
x(0) = x0
betrachtet. Weiterhin wird das modifizierte Gütekriterium herangezogen ∞ e2αt [xT Qx + uT Ru] dt
J=
(5.24)
0
mit einer positiven Konstante α. Die Wichtungsmatrizen Q und R sind gegeben, die Matrix Q ist positiv semidefinit und R ist positiv definit. Ferner habe die Matrix Q die Form Q = QT1 Q1 und das Paar (A, Q1 ) ist vollständig beobachtbar. Die Aufgabe dieses modifizierten Reglerproblems besteht in der Ermittlung des Minimums des gegebenen Güteindexes und der zugehörigen Rückführmatrix K.
5.2 Erzeugung eines vorgeschriebenen Stabilitätsgrades
121
Vorgehensweise. Spaltet man den Term e2αt im Integralkriterium auf, so kann man Gleichung 5.24 umschreiben zu ∞ J = [xT eαt Qxeαt + uT eαt Rueαt ] dt . 0
Nun substituiert man wie folgt x ˜(t) = eαt x(t) u ˜(t) = eαt u(t)
und
und somit gilt: d αt x ˜˙ (t) = e x(t) = αeαt x(t) + eαt x(t) ˙ dt = α˜ x + eαt Ax + eαt Bu = (A + αI)˜ x + Bu ˜ = Aα x ˜ + Bu ˜. Mit dieser Substitution lauten die modifizierten Systemgleichungen dann x ˜˙ (t) = (A + αI) · x ˜ + Bu ˜ = Aα · x ˜ + Bu ˜ mit dem modifizierten Gütekriterium ∞ J = [˜ xT Q˜ x+u ˜T R˜ u] dt . 0
Nach [3] folgt aus den Bedingungen der vollständigen Steuerbarkeit von (A, B) und der vollständigen Beobachtbarkeit von (A, Q1 ) die vollständige Steuerbarkeit von (Aα , B) und die vollständige Beobachtbarkeit von (Aα , Q1 ). Damit liefert die Lösung P α der algebraischen Riccati-Gleichung (A + αI)T P α + P α (A + αI) − P α BR−1 B T P α + Q = 0
(5.25)
das Minimum des modifizierten Gütefunktionals und die optimale Zustandsvektorrückführung lautet u∗ = −K ∗ · x mit K ∗ = R−1 B T P α . Mit dieser Zustandsvektorrückführung liegen die Pole des rückgeführten Systems wie gefordert alle links von −α.
122
5 Optimale Zustandsregelung
Beispiel 5.4 System 1. Ordnung: Gegeben sei ein System 1. Ordnung in allgemeiner Form zu x˙ = a · x + b · u
mit
x(0) = x0 ,
und das Gütefunktional laute: ∞ J=
* + e2αt · x(t)qx(t) + u(t)ru(t) dt .
0
Es soll die Rückführung k derart ermittelt werden, dass der Pol des geschlossenen Kreises links von −α liegt. Die Rückführung u(t) = −k · x(t) wird über die Lösung der modifizierten Riccati-Gleichung ermittelt welche lautet: (a + α)pα + pα (a + α) − p2α b2 /r + q = 0 . Die Lösungen der quadratischen Gleichung p2α − 2(a + α)pα r/b2 − qr/b2 = 0 berechnet man dann zu pα,1,2
( 2 r qb , = 2 · (a + α) ± (a + α)2 + b r
von denen die positive (positiv definite) Lösung verwendet wird. Die Rückführung k wird damit ( 1 qb2 2 k = pα b/r = · (a + α) + (a + α) + . b r Die Gleichung des rückgeführten Systems ergibt sich dann zu ( x˙ = a · x − bk · x = (a − bk)x = −α −
qb2 (a + α)2 + r
·x
und der Pol des geschlossenen Kreises liegt bei ( qb2 s1 = −α − (a + α)2 + , r also, wie gefordert, in der linken s-Halbebene links von −α.
5.2 Erzeugung eines vorgeschriebenen Stabilitätsgrades
123
Beispiel 5.5 System 2. Ordnung: Gegeben sei folgendes System zweiter Ordnung 0 1 1 1 A= , b= , mit x(0) = . −2 −5 2 0 Gesucht ist der Rückführvektor k derart, dass die Pole des geschlossenen Kreises in der s-Ebene für α = 2 links von −2 liegen und das quadratische Gütekriterium J nach Gleichung ∞ e2αt · [xT Qx + ru2 ] dt
J= 0
für Q =
1 0 0 2
und r = 1 minimal wird.
Lösung: Zunächst stellt man die modifizierte Riccati-Gleichung auf zu (A + αI)T P α + P α (A + αI) − P α BR−1 B T P α + Q =
2 1 −2 −3
T Pα + Pα
T 1 0 2 1 1 1 Pα + =0. + Pα 0 2 −2 −3 2 2
Die Lösung der modifizierten Riccati-Gleichung lautet 3,5122 0,1456 . Pα = 0,1456 0,2928 Damit resultiert die Rückführmatrix K ∗ zu K ∗ = 3,8034 0,7312 , und die Pole des geschlossenen Kreises liegen bei s1,2 = −5,1329 ± j0,9028 , also links von −α = −2. Aufgabe 5.3: Berechnen Sie für das folgende System in Zustandsdarstellung 0 1 1 2 A= und B = −3 −4 1 0 und die Wichtungsmatrizen 2 0 1 0 Q= und R = 0 1 0 1
124
5 Optimale Zustandsregelung
die Rückführmatrix K ∗ derart, dass die Pole des geschlossenen Kreises einen Realteil kleiner −3 aufweisen. Lösung: Die Lösung der modifizierten Riccati-Gleichung lautet: 1,5152 −0,0432 Pα = . −0,0432 0,3922 Damit resultiert die Rückführmatrix K ∗ zu 1,4720 0,3490 K∗ = , 3,0304 −0,0863 und die Pole des geschlossenen Kreises liegen bei s1,2 = −5,9409 ± j1,0719 , also links von −α = −3.
6
Zustandsbeobachter/-schätzer
Grundlagen. Die in Kapitel 4 und 5 entwickelte Theorie der Polfestlegung und der optimalen Regelung mittels der linearen Zustandsvektorrückführung setzt zunächst voraus, dass der Zustandsvektor x(t) direkt gemessen werden kann. Dies ist im Allgemeinen nicht der Fall, da nur der Ausgangsvektor y(t) als Messgröße zur Verfügung steht. Der Ausgangsvektor y(t) ist eine Linearkombination der Elemente des Zustandsvektors und berechnet sich für ein lineares Mehrgrößensystem x˙ = A · x + B · u zu y =C·x . Außer für den Fall, dass C eine Diagonalmatrix ist, steht der Zustandsvektor im Allgemeinen nicht zur Verfügung. Mithilfe eines Zustandsbeobachters kann man aus den Ein- und Ausgangsgrößen eines Mehrgrößensystems den Zustandsvektor x(t) rekonstruieren. Die prinzipielle Struktur eines Mehrgrößensystems mit Zustandsbeobachter zeigt Abb. 6.1. u(t) u(t)
Mehrgrößensystem
y(t)
Zustandsbeobachter
x ˆ(t)
Abbildung 6.1: Prinzip eines Zustandsbeobachters
Eingangsgrößen in den Zustandsbeobachter sind der Eingangsvektor u(t) und der gemessene Ausgangsvektor y(t) des Mehrgrößensystems. Der Zustandsbeobachter liefert für diese Eingangsgrößen als Ausgangsgröße einen Schätzwert x ˆ(t) des Zustandsvektors x(t). Die Berechnung derartiger Zustandsbeobachter wird in den folgenden Abschnitten behandelt. Bei der Struktur der Zustandsbeobachter unterscheidet man zwischen dem Einheitsbeobachter und dem Beobachter reduzierter Ordnung. Unabhängig von dieser Unterscheidung kann man die Zustandsbeobachter sowohl mit den Methoden der Polfestlegung als auch mit den Methoden der optimalen Regelung auslegen. Eine ausführliche Zusammenstellung der Methoden der Zustandsbeobachtung und der Zustandsrückführung findet man bei Hippe, Wurmthaler [29].
126
6 Zustandsbeobachter/-schätzer
6.1
Entwurf des Einheitsbeobachters mittels Polfestlegung
6.1.1
Eingrößensysteme
Methodik. Die Struktur eines Zustandsbeobachters gleicht der Struktur eines Systems in Zustandsdarstellung (siehe Abb. 6.2). Im Beobachter wird die Dynamik des Ursprungssystems nachgebildet. Damit liegt im Beobachter ein nun zugänglicher (geschätzter) Zustandsvektor x ˆ(t) vor. Das Ziel ist die Minimierung des Fehlers zwischen dem wahren und dem geschätzten Zustandsvektor x(t) − x ˆ(t). Da aber der wahre Zustandsvektor der Messung nicht zugänglich ist, wird versucht, ersatzweise den Fehler zwischen dem wahren und dem geschätzten Ausgangssignal (bei Eingrößensystemen) bzw. dem Ausgangsvektor y(t) − yˆ(t) = y ˜(t) (bei Mehrgrößensystemen) zu minimieren. Dieser so genannte Ausgangsfehler y ˜(t) steuert über eine Matrix L (bzw. bei Eingrößensystemen Spaltenvektor l) den Zustandsbeobachter so, dass der geschätzte Zustandsvektor x ˆ(t) sich asymptotisch dem wahren Zustandsvektor x(t) annähert. Die Berechnung dieser Rückführmatrix L erfolgt in diesem Abschnitt mit den Methoden der Polfestlegung. Originalsystem u(t)
-
x(0) x(t) ˙ x(t) i . . . dt +
b
y(t) cT
A
Zustandsbeobachter
u(t)
-
b
x ˆ˙ (t) i
" (0) x
+ ? i – 6
l
. . . dt
x ˆ(t)
yˆ(t) cT
+ x ˆ(t) A
Abbildung 6.2: System- und Beobachterstruktur
Die Dynamik- und Messgleichung des Beobachters lauten damit x ˆ˙ = A · x ˆ + b · u + l · (y − yˆ) yˆ = cT · x ˆ mit
x ˆ(0) = x ˆ0 (i. A. = x(0)) .
(6.1) (6.2)
6.1 Entwurf des Einheitsbeobachters mittels Polfestlegung
127
Das Einsetzen der Messgleichung 6.2 in die Dynamikgleichung 6.1 ergibt x ˆ˙ = A · x ˆ + b · u + l cT · (x − x ˆ) .
(6.3)
Damit resultiert die Dynamikgleichung des Schätzfehlers x − x ˆ des Zustandsvektors zu x˙ − x ˆ˙ = (A · x + b · u) − A · x ˆ + b · u + l cT · [x − x ˆ] = A − l cT · (x − x ˆ) . Die Dynamikgleichung des Zustandsschätzfehlers x ˜ =x−x ˆ ˜ x ˜˙ = A − l cT · x
(6.4) (6.5)
(6.6)
weist diesselbe Struktur auf, wie die Dynamikgleichung 4.4 des Systems für eine Polfestlegung in Kapitel 4.1, welche ohne die dort verwendeten Indizes lautet: * + x˙ = A − bkT · x + b · u . (6.7) Während bei der Polfestlegung (Gleichung 6.7) der Vektor k berechnet wird, ist bei der Auslegung des Beobachters der Vektor l zu ermitteln. Transponiert man die Dynamikmatrix von Gleichung 6.7, so erhält man +T * + * A − bkT = AT − kbT . Somit kann man die Berechnung des Vektors kT für die Polfestlegung übernehmen, wenn man die folgenden Substitutionen durchführt: A → AT ,
b → c,
k→l.
Die Berechnung des Rückführvektors kT für die Polfestlegung lautet nach Gleichung 4.9 für das System (A, b) kT = αR,0 − α0 αR,1 − α1 . . . αR,n−1 − αn−1 · T −1 . (6.8) Die αR,i sind darin die Koeffizienten des charakteristischen Polynoms des rückgeführten und die αi die des nicht rückgeführten Systems, und die Matrix T ist die Transformationsmatrix des Systems (A, b) auf Regelungsnormalform. Die Anwendung von Gleichung 6.8 auf das Beobachterproblem führt bei der Ermittlung des Rückführvektors l zu1 ⎤ ⎡ αB,0 − α0 ⎢ αB,1 − α1 ⎥ ⎥ ⎢ l = T −T · ⎢ (6.9) ⎥ = T −T · αB − α . .. ⎦ ⎣ . αB,n−1 − αn−1 1
Es gilt: T −T = (T −1 )T = (T T )−1
128
6 Zustandsbeobachter/-schätzer
Für die Elemente dieser Gleichung gilt: (i) Der Vektor α = [α0 α1 . . . αn−1 ]T enthält die Koeffizienten der charakteristischen Gleichung des Originalsystems Det(sI − AT ) = sn + αn−1 sn−1 + . . . + α1 s + α0 = 0 . (6.10) (ii) Der Vektor αB = [αB,0 αB,1 . . . αB,n−1 ]T enthält die Koeffizienten der charakteristischen Gleichung der Dynamikmatrix des Beobachters Det(sI −AT +clT ) = sn +αB,n−1 sn−1 +. . .+αB,1 s+αB,0 = 0 . (iii) Die Matrix T ist die Transformationsmatrix des Systems (AT , c) auf Regelungsnormalform ⎡ ⎢ ⎢ T =⎢ ⎣
eTn T T en A .. .
⎤−1 ⎥ ⎥ ⎥ ⎦
⎡
mit eTn
aus
Q−1 S
eTn (AT )n−1
eT1 ⎢ eT2 ⎢ =⎢ . ⎣ ..
⎤ ⎥ ⎥ ⎥ ⎦
eTn (6.11)
und QS als „angepasste Steuerbarkeitsmatrix“ QS = c | AT c | (AT )2 c | · · · | (AT )n−1 c . Somit ergibt Gleichung 6.9 die Lösung für die Rückführmatrix l des Zustandsbeobachters, vorausgesetzt das System (AT , c) ist vollständig „steuerbar“. Diese Steuerbarkeitsbedingung ist jedoch identisch mit der Bedingung, dass das System (A, cT ) vollständig beobachtbar ist. Beispiel 6.1 System 2. Ordnung: Gegeben sei ein steuerbares und beobachtbares System zweiter Ordnung in Zustandsdarstellung zu: x˙ =
0 1 1 ·x+ ·u , −2 −5 2
y = [ 2 1 ]·x
1 und x(0) = . 0
Die Pole des Systems liegen bei λ1 = −0,4384 und λ2 = −4,5616. Es soll ein Zustandsbeobachter für die Zustandsvariablen x1 (t) und x2 (t) unter Verwendung von Gleichung 6.9 l = T −T · αB − α
(6.12)
6.1 Entwurf des Einheitsbeobachters mittels Polfestlegung
129
entworfen werden. Zunächst wird der Vektor α unter Verwendung von Det(sI − AT ) = sn + αn−1 sn−1 + . . . + α1 s + α0 = s2 + 5s + 2 2 ermittelt zu α = . 5 Die Pole des Beobachters sollen liegen bei λB,1,2 = −2. Dann resultiert der Vektor αB unter Verwendung von Det(sI − AT + clT ) = (s − λB,1 ) · (s − λB,2 ) = 4 zu αB = . 4
= sn + αB,n−1 sn−1 + . . . + αB,1 s + αB0 = s2 + 4s + 4
Die Transformationsmatrix T des Systems (AT , c) auf Regelungsnormalform wird wie folgt ermittelt: Die „Steuerbarkeitsmatrix“ QS lautet 2 −2 T QS = c | A c = , 1 −3 ihre Inverse ist Q−1 S
=
eT1 eT2
=
0,75 −0,5 0,25 −0,5
.
T Die letzte Zeile von Q−1 S ergibt e2 = [ 0,25 − 0,5 ] und damit resultiert die Transformationsmatrix T zu −1 −1 eT2 0,25 −0,5 8 2 = = . (6.13) T = −0,5 2 2 1 eT2 AT
Damit wird dann der Vektor l des Beobachters berechnet zu −T 4 8 2 2 l = T −T · αB − α = · − 4 2 1 5
=
1 −3
.
(6.14)
Die Pole des Beobachters, d. h. die Pole von A − lcT , liegen wie für den Entwurf gefordert bei λB,1,2 = −2. Damit ist die Konvergenz des Beobachters gewährleistet. Die Konvergenz des Beobachter-Zustandsvektors x ˆ(t) auf den System-Zustandsvektor x(t) soll auch anhand einer Simulation demonstriert werden. Hierbei wird angenom1 men, dass der Anfangszustand des Systems, d. h. x(0) = nicht bekannt ist. Der 0
130
6 Zustandsbeobachter/-schätzer
2
ˆ(t)1.5 x(t),x 6 1
x ˆ1 x1
0.5 x ˆ2
0 −0.5
x2
0
1
2
3
-
4
5
6
7
8
t/s
Abbildung 6.3: Zeitverlauf der Zustandsgrößen des Beobachters („ xˆi “) und des Originalsystems
Anfangszustand des Beobachters wird willkürlich auf den Wert x ˆ(0) =
2 gesetzt. 2
Falls die berechnete Rückführmatrix l korrekt ist, muss x ˆ(t) nach x(t) konvergieren. Abb. 6.3 zeigt, dass der Zustandsvektor x ˆ(t) nach ca. 2 bis 3 Sekunden den Zustandsvektor x(t) erreicht hat. Falls das Originalsystem einen von Null verschiedenen Steuereingang u(t) aufweist, so ändert das nichts an der Konvergenz des Beobachters, wie Abb. 6.4 zeigt. Hierbei wird u(t) = sin t als willkürlicher verwendet und der Anfangswert des Zu Steuereingang 2 standsvektors bei x ˆ(0) = belassen. Auch hier konvergiert der Beobachter nach 2 ca. 2 bis 3 Sekunden auf den Zustandsvektor des Originalsystems. Somit kann unter Einsatz eines Beobachters nun die in Kapitel 4 berechnete Zustandsvektorrückführung (zumindest für Eingrößensysteme) verwendet werden, da der Beobachter nach ein paar Sekunden auf den Zustandsvektor des Originalsystems konvergiert ist. Ab diesem Zeitpunkt kann der Zustandsvektor als bekannt vorausgesetzt werden. Der Zustandsbeobachter sollte schneller konvergieren als das Originalsystem reagiert, d. h. die Pole des Beobachters sollten im Allgemeinen in der s-Ebene links von den Polen des Systems liegen. Als Empfehlung gilt, dass der Beobachter ca. zwei bis sechsmal schneller als das System reagieren soll. Aufgabe 6.1: Für ein System in Zustandsdarstellung mit den Matrizen A=
0 1 −3 −4
,
3 b= , 2
cT = [2 1]
soll ein Beobachter entworfen werden, dessen Pole bei λB,1,2 = −3 liegen. Berechnen Sie den Rückführvektor l.
6.1 Entwurf des Einheitsbeobachters mittels Polfestlegung
131
3 2
ˆ(t) x(t),x 6 1 0
−1 −2
0
1
2
3
4
-
5
6
7
8
t/s
Abbildung 6.4: Zeitverlauf der Zustandsgrößen des Beobachters (Anfangswert x ˆT (0) = [2 2]) und des Originalsystems Lösung: l =
2 −2
.
Aufgabe 6.2: Für ein System in Zustandsdarstellung mit den Matrizen 1 2 2 A= , b= , cT = [1 3] −3 −2 2 soll ein Beobachter entworfen werden, dessen Pole bei λB,1,2 = −1 liegen. Berechnen Sie den Rückführvektor l. 0,4 Lösung: l = . 0,2
6.1.2
Mehrgrößensysteme
Methode. Der Zustandsbeobachter für Mehrgrößensysteme weist dieselbe Struktur wie der Zustandsbeobachter für Eingrößensysteme auf. Der Ausgangsvektor y des Systems wird mit dem Ausgangsvektor y ˆ des Zustandsbeobachters verglichen und über eine Rückführmatrix L zurückgeführt. Abb. 6.5 zeigt den Aufbau von Originalsystem und Beobachter in Zustandsdarstellung. Für das Originalsystem x˙ = A · x + B · u y = C·x .
(6.15) (6.16)
mit x(0) = x0 lautet die Gleichung des Beobachters x ˆ˙ = A · x ˆ + B · u + L · (y − yˆ) yˆ = C · x ˆ.
(6.17) (6.18)
132
6 Zustandsbeobachter/-schätzer Originalsystem x(0) x(t) ˙ i . . . dt +
u(t) B
x(t)
y(t) C
A + i –
Zustandsbeobachter L u(t) B
x ˆ˙ (t) i
" (0) x
. . . dt
x ˆ(t)
y ˆ(t) C
+ A
x ˆ(t)
Abbildung 6.5: System- und Beobachterstruktur für ein Mehrgrößensystem
mit x ˆ(0) = x ˆ0 . Damit lautet wie beim Eingrößensystem die Dynamikgleichung des Schätzfehlers x ˜= x−x ˆ dann: x ˜˙ = (A − LC) · x ˜.
(6.19)
Für beliebige Anfangszustände des Beobachters geht der Schätzfehler des Beobachters gegen Null, wenn die Dynamikmatrix des Beobachters AB = (A − LC) nur Eigenwerte mit negativem Realteil aufweist. Die Dynamikgleichung des Beobachters hat eine ähnliche Struktur wie die Dynamikgleichung 4.14 der Polfestlegung von Kapitel 4.2: AR = (A − BK) mit K als Rückführmatrix für die Polfestlegung. Während bei der Polfestlegung die Matrix K zu berechnen war, ist beim Beobachterentwurf die Rückführmatrix L zu ermitteln. Transponieren der Matrix AB liefert * + ATB = AT − C T LT . Somit kann man, wie beim Eingrößensystem, die Matrix LT des Beobachters mit den gleichen Methoden wie die Matrix K bei der Polfestlegung ermitteln, wenn man die
6.2 Entwurf des Einheitsbeobachters unter Verwendung quadr. Güteindizes
133
folgenden Substitutionen durchführt: A → AT ,
B → CT ,
K → LT .
Voraussetzung für die Konvergenz des Beobachters ist, dass das Paar (A, C) vollständig beobachtbar ist. Welche Methode der Polfestlegung für Mehrgrößensysteme man schließlich einsetzt, bleibt dem Anwender überlassen. Man kann die Brunovsky-Form für die Polfestlegung oder die Methode der robusten Polfestlegung nach [38] oder jede andere Methode verwenden. Entscheidend ist, dass die Pole des Beobachters in der sEbene links von den Polen des Systems liegen. Denn nur dann ist die Reaktionszeit des Beobachters kleiner als die des Systems und der Einsatz eines Beobachters macht Sinn. Wenn der Beobachter „langsamer“ ist als das System, dann können die Zustände des Systems schon längst unzulässig große Werte angenommen haben, bevor die Rückführung der geschätzten Zustände das System zum Abklingen bringt.
6.2
Entwurf des Einheitsbeobachters unter Verwendung quadratischer Güteindizes
Methode. Man kann das Verfahren der linearen quadratischen Regelung ebenso wie die Methoden der Polfestlegung für die Ermittlung der Rückführmatrix L des Zustandsbeobachters verwenden. Da hierbei keine prinzipiellen Unterschiede der Berechnung von L für Eingrößensysteme oder Mehrgrößensysteme vorliegen, wird nur der Mehrgrößenfall betrachtet. Die Dynamikgleichung des Beobachters ist wie in Kapitel 6.1.2 AR = (A − BK) mit K als Rückführmatrix der Zustandsvektorrückführung. Auch hier erhält man durch Transponieren der Dynamikmatrix des rückgeführten Beobachters AB die Form + * ATB = AT − C T LT . Somit kann man die Matrix LT mit den gleichen Methoden wie die Matrix K bei der linearen quadratischen Regelung ermitteln, wenn man die folgenden Substitutionen durchführt: A → AT ,
B → CT ,
K → LT .
Über die noch vorzugebenden Wichtungsmatrizen Q und R für das quadratische Gütekriterium wird die Konvergenzgeschwindigkeit des Beobachters beeinflusst. Ein „großes2“ R im Vergleich zur Matrix Q führt zu einer langsamen Konvergenz, da große Stellamplituden stärker „bestraft“ werden. Umgekehrt führt ein „kleines“ R (im Vergleich zu Q) zu 2
Hier kann eine beliebige Norm einer Matrix als Maß verwendet werden.
134
6 Zustandsbeobachter/-schätzer
einer schnellen Konvergenz, da nun große Schätzfehler stärker bestraft werden. Bei der Polfestlegung gelangt man im Prinzip zu ähnlichen Aussagen. Verschiebt man die Pole „weit“ in die linke s-Halbebene, dann konvergiert der Zustandsbeobachter zwar schnell, aber zulasten großer Signalamplituden L · y(t). Dagegen ergeben sich nur kleine Signalamplituden, wenn man die Beobachterpole nur wenig nach links in die s-Halbebene verschiebt. Die Vorgehensweise soll am Beispiel eines einfachen Mehrgrößensystems demonstriert werden. Beispiel 6.2 System 3. Ordnung: Gegeben sei ein steuer- und beobachtbares System dritter Ordnung in Zustandsdarstellung zu: ⎡
⎤ ⎡ ⎤ 0 1 2 2 1 x˙ = ⎣ −2 −3 0 ⎦ · x + ⎣ 0 2 ⎦ · u , −2 0 −1 1 3
y=
1 2 −1 ·x 2 −1 3
⎡
⎤ 0 mit x(0) = ⎣ 1 ⎦ . −1 Die Pole des Systems liegen bei λ1 = −2,6075 und λ2,3 = −0,6962 ± j2,2101 Es soll ein Zustandsbeobachter derart entworfen werden, dass nach ca. 1 bis 2 Sekunden der Beobachter den Zuständen ⎡ des ⎤ Originalsystems folgt. Der Anfangszustand des Be0,5 obachters wird auf x ˆ(0) = ⎣ 0,5 ⎦ gesetzt, da der Anfangszustand des Originalsystems 0,5 nicht bekannt ist. Unter Beachtung der Substitutionen A → AT und B → C T wird die folgende algebraische Matrix-Riccati-Gleichung aufgestellt: AP + P AT − P C T R−1 CP + Q = 0 .
(6.20)
Nach einigen Probeberechnungen werden die Gewichtsmatrizen auf die folgenden Werte gesetzt: ⎡
⎤ 2 0 0 Q = ⎣0 2 0⎦ 0 0 1
und
R=
0,1 0 0 0,1
.
Die Lösung der Matrix-Riccati-Gleichung P und die Rückführmatrix K lauten dann ⎡
⎤ 0,3316 −0,1647 −0,2134 2,1559 2,6266 −0,8874 ⎣ ⎦ P = −0,1647 0,3372 0,2270 , K = . 1,8769 0,2436 3,3410 −0,2134 0,2270 0,3293
6.2 Entwurf des Einheitsbeobachters unter Verwendung quadr. Güteindizes
135
Wegen der Substitution K → LT ergibt sich dann die Rückführmatrix L des Zustandsbeobachters zu ⎡ ⎤ 2,1559 1,8769 L = ⎣ 2,6266 0,2436 ⎦ . −0,8874 3,3410 Vom Anfangszustand des Beobachters (siehe Abb. 6.6) konvergiert der Zustandsvektor des Beobachters wie gefordert in 1 bis 2 Sekunden auf die Zustände des Originalsystems. Die Pole des Zustandsbeobachters liegen bei λ1 = −14,0322, λ2 = −9,8678 und bei λ3 = −1,9297. 1
0.5
ˆ(t) x(t),x 6
0
−0.5
−1
0
0.5
1
1.5
-
2
2.5
3
t/s
Abbildung 6.6: Zeitverlauf der Zustandsgrößen des Beobachters (Anfangswerte x ˆT (0) = [0,5 0,5 0,5]) und des Originalsystems (Anfangswerte xT (0) = [0 1 −1]) 2 1.5 1
ˆ(t) x(t),x 0.5 6 0 −0.5 −1 −1.5
0
0.5
1
1.5
-
2
2.5
3
t/s
Abbildung 6.7: Zeitverlauf der Zustandsgrößen des Beobachters (Anfangswerte x ˆT (0) = [0,5 0,5 0,5]) und des Originalsystems (Anfangswerte xT (0) = [0 1 −1]) für einen Eingangsvektor uT (t) = [sin t 0,5 cos t]
136
6 Zustandsbeobachter/-schätzer
sin t folgt nach 0,5 cos t ca. 2 Sekunden der Zustandsvektor x ˆ des Zustandsbeobachters dem Zustandsvektor x des Originalsystems, wie Abb. 6.7 zeigt. Auch für einen willkürlich gewählten Eingangsvektor u(t) =
Aufgabe 6.3: Gegeben sei ein instabiles, steuer- und beobachtbares System dritter Ordnung in Zustandsdarstellung zu: ⎡
⎤ ⎡ ⎤ 3 1 2 1 2 x˙ = ⎣ 2 −3 0 ⎦ · x + ⎣ 0 2 ⎦ · u , −2 0 −1 3 1
y=
⎡
1 1 −2 ·x 2 −1 3
mit
⎤ 0 x(0) = ⎣ 1 ⎦ . −1
1. Berechnen Sie die Pole des Originalsystems. 2. Ermitteln Sie die Lösung der Riccati-Gleichung P und die Rückführmatrix L des Zustandsbeobachters für die Gewichtsmatrizen ⎡ ⎤ 2 0 0 0,1 0 Q=⎣0 2 0⎦ . und R= 0 0,1 0 0 1 3. Ermitteln Sie den Zeitverlauf der Zustandsvektoren des Originalsystems und des Zustandsbeobachters für den Anfangszustand x ˆT (0) = [0,5 0,5 0,5] . Lösung: 1.) λ1 = 2,1028, λ2 = 0,1464 und λ3 = −3,2491 ⎡ ⎤ ⎡ ⎤ 0,3045 0,0514 −0,0583 4,7257 3,8251 2.) P = ⎣ 0,0514 0,2938 0,0676 ⎦ , L = ⎣ 2,1009 0,1180 ⎦ . −0,0583 0,0676 0,1267 −2,4417 1,9589 3.)
2 1 0
ˆ(t) x(t),x −1 6 −2 −3 −4 −5
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
- t/s Abbildung 6.8: Zeitverlauf der Zustandsgrößen des Beobachters (Anfangswerte x ˆT (0) = [0,5 0,5 0,5]) und des Originalsystems (Anfangswerte xT (0) = [0 1 −1])
6.3 Entwurf eines Beobachters reduzierter Ordnung
6.3
Entwurf eines Beobachters reduzierter Ordnung
6.3.1
Messung von s Zuständen
137
Erläuterung. Der Beobachter vollständiger Ordnung führt eine Schätzung des Zustandsvektors x(t) durch und weist dabei dieselbe Ordnung n wie der Zustandsvektor auf. Werden nun z. B. n − 1 Zustandsgrößen gemessen, so erhält der Zustandsbeobachter dennoch wieder die Ordnung n, obwohl nur noch die Messung einer Zustandsgröße fehlt. Diesen Nachteil beseitigt der reduzierte Beobachter, der bei der Messung von s Ausgangsgrößen nur einen Beobachter der Ordnung n − s erfordert. Die Struktur eines derartigen reduzierten Beobachters wird nachfolgend in Anlehnung an die Arbeiten von Gopinath [26] hergeleitet. Bei stark verrauschten Messsignalen des Ausgangs wird jedoch nach wie vor die Verwendung eines Beobachters voller Ordnung empfohlen, da der Beobachter zusätzlich zur Schätzung der Zustände auch eine Filterung/Glättung der Messungen durchführt. Herleitung des reduzierten Beobachters. Zunächst wird vorausgesetzt, dass von den n Komponenten des Zustandsvektors, durch die Messung y(t) nun s Elemente des Zustandsvektors gemessen werden. Die Messgleichung für y hat also die folgende Struktur: x1 (6.21) = x1 . y = [I 0] · x2 Die s Zustände x1 werden also direkt gemessen, die restlichen Zustände x2 sollen durch den reduzierten Beobachter geschätzt werden. Partitioniert man entsprechend zu Gleichung 6.21 die Dynamikgleichung des Systems so gilt hierfür: x˙ 1 A11 A12 x1 B1 = · + ·u . (6.22) x˙ 2 A21 A22 x2 B2 Die Dynamikgleichung der nicht gemessenen Zustände x2 lautet: x˙ 2 = A22 · x2 + (A21 · x1 + B 2 · u) . bekannte Eing¨ ange
Aufgrund der Messung von y = x1 sind die in der runden Klammer stehenden Variablen nun bekannte Signale und es gilt: ˜·u x˙ 2 = A22 · x2 + (A21 · y + B 2 · u) = A22 · x2 + B ˜,
(6.23)
138
6 Zustandsbeobachter/-schätzer
T ˜ = [A21 B 2 ] und u mit den entsprechenden Größen B ˜ = [y u] .
Ersetzt man nun in Gleichung 6.22 ebenfalls x1 durch y, so resultiert: x˙ 1 = y˙ = A11 · y + A12 · x2 + B 1 · u . Sammelt man die messbaren Größen auf der linken Seite so folgt: ˜ = A12 · x2 . (y˙ − A11 · y − B 1 · u) = y
(6.24)
bekannte Messungen
Die Gleichungen 6.23 und 6.24 bilden nun ein eigenes dynamisches System mit bekanntem Eingang u ˜ und bekannter Messung y˜, für welches man einen eigenen Beobachter (nun aber reduzierter Ordnung n − s) für die Zustände x2 entwerfen kann. ˜·u x˙ 2 = A22 · x2 + B ˜ y˜ = A12 · x2 .
(6.25) (6.26)
˜ und der MessmaFür dieses System mit der Dynamikmatrix A22 , der Eingangsmatrix B trix A12 wird nach der Methode der Polfestlegung bzw. der linearen quadratischen Regelung die Rückführmatrix L des Beobachters entworfen. Die Beobachtergleichungen des reduzierten Beobachters lauten dann: # $ " ˜ ·u "˙ 2 = A22 · x "2 + B x ˜ + L · y˜ − y ˜ ˜ ·u B ˜
y ˜
y ˜
"2 + [A21 · y + B 2 · u] +L · [y˙ − A11 · y − B 1 · u − A12 · x "2 ] = A22 · x "2 + [A21 − LA11 ] · y + [B 2 − LB 1 ] · u + L · y˙ = [A22 − LA12 ] · x
Die Darstellung dieser Beobachtergleichung im Blockschaltbild zeigt Abb. 6.9. Voraussetzung für die Existenz des reduzierten Beobachters ist wie beim Beobachter vollständiger Ordnung, dass das System (A, C) vollständig beobachtbar ist. "2 (t) erfolgt, Da die Ableitung des Systemausgangs y direkt vor der Integration von x kann man den Eingang von y˙ über die Integration hinweg nach rechts verschieben, und dadurch auf die ungünstige Ableitung der Messung y verzichten. Abb. 6.10 zeigt die modifizierte Struktur des reduzierten Beobachters ohne Ableitung der Messgröße y.
6.3 Entwurf eines Beobachters reduzierter Ordnung
139
y d dt
y˙ A21 − LA11 u
B 2 − LB 1
L "˙ (t) x h 2 . . . dt
h
"2 (t) x
+ A22 − LA12
Abbildung 6.9: Blockschaltbild des reduzierten Beobachters mit Ableitung y˙ "˙ 2 (t) sondern nun x "˙ 2 −Ly. Die Variable vor dem Integrator ist nun allerdings nicht mehr x ˙ Das Ly wird jedoch nach der Integration wieder hinzuaddiert, sodass am Ausgang des "2 auftritt. reduzierten Beobachters wieder der geschätzte Zustand x y A21 − LA11 u
B 2 − LB 1
L
˙ 2 − Ly˙ x
h
2 − Ly x
. . . dt
h
"2 (t) x
+ A22 − LA12
Abbildung 6.10: Blockschaltbild des reduzierten Beobachters ohne Ableitung y˙
Beispiel 6.3 Hubschrauber: Als Beispiel wird die Schätzung der nicht gemessenen Zustände des Hubschraubers im Schwebeflug von Beispiel 2.6 untersucht. Die Zustandsgleichungen des Systems lauten:
140
6 Zustandsbeobachter/-schätzer ⎤• ⎡ ⎤ ⎡ ⎤ z z 0 0,4989 0 0 0 0 0 ⎢ z˙ ⎥ ⎢ 0 −0,4022 0 ⎥ ⎢ z˙ ⎥ ⎢Ψ⎥ ⎢ ⎥ ⎢Ψ⎥ 0 0 4,008 0 ⎢ ⎥ = ⎢0 ⎥·⎢ ⎥ ⎦ ⎣Ψ ⎣ ˙ ˙ ⎦ 0 −0,009793 0 −0,7637 −0,9658 ⎦ ⎣ Ψ 0 0,03684 0 −1,498 −3,000 Ω Ω ⎡
⎡
⎤ 0 0 0 ⎥ ⎢ 12,04 ⎢ ⎥ αM 0 ⎥· +⎢ 0 αT ⎣ −1,728 −6,541 ⎦ 6,680 −6,984 ⎡
⎤ z ⎢ z˙ ⎥ z 1 0 0 0 0 ⎢ ⎥ = ·⎢Ψ⎥ . Ψ 0 0 1 0 0 ⎣ ˙ ⎦ Ψ Ω Es werden bei diesem Beispiel die Höhe z und der Gierwinkel Ψ gemessen. Die Prüfung der Steuerbarkeit und Beobachtbarkeit (siehe Aufgabe 3.3) zeigt, dass das System vollständig steuerbar und beobachtbar ist. Für den Entwurf des reduzierten Beobachters müssen die Zustände zunächst so umgeordnet werden, dass die beiden gemessenen Zustände die Zustände eins und zwei bilden. Damit resultiert die neue Zustandsdarstellung: ⎡ ⎤• ⎡ ⎤ ⎡ ⎤ z z 0 0 0 0 0,4989 ⎢Ψ⎥ ⎢Ψ⎥ 0 0 0 4,008 0 ⎢ ⎥ ⎥ ⎢ ⎥ ⎥ ⎢ ⎢ z˙ ⎥ = ⎢ z˙ ⎥ 0 0 ⎢ 0 0 −0,4022 ⎥·⎢ ⎢ ⎢ ⎥ ⎣ 0 0 −0,009793 −0,7637 −0,9658 ⎦ ⎣ ˙ ⎥ ˙ ⎦ ⎣Ψ Ψ⎦ 0 0 0,03684 −1,498 −3,000 Ω Ω ⎡
⎤ 0 0 0 ⎥ ⎢ 0 ⎢ ⎥ αM + ⎢ 12,04 0 ⎥· αT ⎣ −1,728 −6,541 ⎦ 6,680 −6,984 ⎤ z ⎢Ψ⎥ ⎥ z 1 0 0 0 0 ⎢ z˙ ⎥ ·⎢ . = ⎢ 0 1 0 0 0 ⎣ ˙ ⎥ Ψ Ψ⎦ Ω
(6.27)
⎡
(6.28)
Die Partitionierung der Matrizen und Vektoren ist durch die horizontalen und vertikalen Striche in Gleichung 6.27 und 6.28 angedeutet.
6.3 Entwurf eines Beobachters reduzierter Ordnung
141
Die Pole der Regelstrecke liegen bei λ1,2 = 0, λ3 = −0,2396, λ4 = −0,4022 und λ5 = −3,5241. Da die Pole des Beobachters links von den Polen der Strecke liegen sollen werden sie bei λ3B = −0,4, λ4B = −0,8 und λ5B = −6 platziert. Die Anwendung des Verfahrens der Polfestlegung für die obigen Pole λ3B bis λ5B und die Systemmatrizen ⎡ ⎤ −0,4022 0 0 A =A " 22 = ⎣ −0,009793 −0,7637 −0,9658 ⎦ 0,03684 −1,498 −3,000 ⎡
⎤ 12,04 0 B =B " 2 = ⎣ −1,728 −6,541 ⎦ 6,680 −6,984
C =A " 12 =
und
0,4989 0 0 0 4,008 0
liefert dann die Rückführmatrix L des reduzierten Beobachters zu: ⎡ ⎤ 0,043597 −0,04866 L = ⎣ −0,227933 0,75158 ⎦ . 0,005499 1,3465
(6.29)
Mit der Struktur von Abb. 6.10 ergibt sich dann die Zustandsschätzung für die nicht ˙ und Ω bei einem Sprungeingang von αM = 0,03 Rad = " 2◦ gemessenen Zustände z, ˙ Ψ für den Anstellwinkel des Hauptrotors wie in Abb. 6.11 gezeigt. Die Zustände des re1 0.8
z˙
0.6
x3 , x4 , x5
6
0.4
˙ Ψ
0.2 0
Ω
−0.2 −0.4
0
0.5
1
1.5
2
2.5
-
3
3.5
4
4.5
5
t/s
Abbildung 6.11: Zeitverläufe der Zustände und der geschätzten Zustände; Anfangszustände x "i (0) = 0 und xi (0) = 0 duzierten Beobachters konvergieren nach wenigen Sekunden auf die wahren Zustände. Eine Ableitung ist nicht erforderlich.
142
6 Zustandsbeobachter/-schätzer
6.3.2
Allgemeiner Fall des reduzierten Beobachters
Struktur des allgemeinen Beobachters reduzierter Ordnung. Beim allgemeinen Fall des Beobachter reduzierter Ordnung werden nicht wie zuvor s Zustände direkt gemessen, sondern die s Ausgangsgrößen y sind eine Linearkombination der Zustände. Es kann also in der C-Matrix keine Teilmatrix als Einheitsmatrix realisiert werden. Die Struktur des dann aufzubauenden Beobachters zeigt Abb. 6.12. Eine ausführliche Herleitung hierzu findet man bei Hippe, Wurmthaler [29]. Originalsystem x(0) x(t) ˙ i . . . dt +
u(t) B
x(t)
y(t) C
A
Zustandsbeobachter H u(t) TB
zˆ˙ (t) i
"(0) z
. . . dt
zˆ(t)
y(t)
+ F
"(t) z
C T
−1
" (t) x
Abbildung 6.12: Struktur des Beobachters reduzierter Ordnung Die Dynamikgleichungen des Beobachters lauten: "˙ = F · z " + TB · u + H · y z −1 C y " = x · " T z Die Dynamikmatrix F muss so vorgegeben werden, dass die Eigenwerte von F von denen der Matrix A verschieden sind. Außerdem ist die Matrix H so vorzugeben, dass das Paar (F , H) vollständig steuerbar ist. Die Berechnung der Matrix3 T erfolgt dann unter Verwendung der Gleichung T A − F T = HC .
(6.30)
Näheres zu den Voraussetzungen und der Lösbarkeit dieser Gleichung siehe bei Hippe, Wurmthaler [29]. 3
Nicht zu verwechseln mit der Transformationsmatrix T von Kap. 3.3.
6.4 Das Separationstheorem
6.4
143
Das Separationstheorem
Zustandsrückführung mit Beobachter. Die in Kapitel 4 entwickelte lineare Zustandsvektorrückführung setzt voraus, dass der rückzuführende Zustandsvektor gemessen werden kann. Wenn dies nicht der Fall ist, dann ist diese Methode zunächst nicht anwendbar. Nachdem es mithilfe eines Zustandsbeobachters jedoch möglich ist, diesen Zustandsvektor zu schätzen, kann man nun bei Nichtmessbarkeit des Zustandsvektors einen Zustandsbeobachter einsetzen. Ein derartiges System mit Zustandsvektorrückführung und Einheitsbeobachter wird durch den folgenden Satz von Gleichungen beschrieben: Systemgleichungen (mit u als neuem Eingang): x˙ = A · x + B · u + B · u y = C·x und x(0) = x0 , Zustandsbeobachter: x ˆ˙ = A · x ˆ + B · u + B · u + L · (y − yˆ) yˆ = C · x ˆ und x ˆ(0) = x ˆ0 , Zustandsvektorrückführung: u = −K · x ˆ. Die Struktur eines derart geregelten Mehrgrößensystems mit Zustandsvektorrückführung und Zustandsbeobachter zeigt Abb. 6.13. Es ist bekannt, Steuer- und Beobachtbarkeit vorausgesetzt, dass bei Rückführung des Originalzustandsvektors die Regelstrecke stabilisiert wird. Außerdem konvergiert der Zustandsbeobachter auf den richtigen Zustandsvektor mit Schätzfehler Null. Offen ist jedoch die Stabilität des Gesamtsystems bei Rückführung des geschätzten Zustandsvektors. Das Separationstheorem. Zur Ermittlung der Stabilität des Systems nach Abb. 6.13 wird das Übertragungsverhalten vom Eingang u zum Ausgang y berechnet. Mittels Zustandsvektorerweiterung erhält man die Zustandsdarstellung des Gesamtsystems zu
x x ˆ
A −BK x B · + ·u LC A − LC − BK x ˆ B A∗ B∗ x y = C 0 · . ˆ x C∗
•
=
144
6 Zustandsbeobachter/-schätzer
u (t)
Mehrgrößen-Regelstrecke x(0) x(t) ˙ x(t) g . . . dt B +
+g + u(t)
y(t) C
A
−K B x ˆ(t) x ˆ(t)
C
" (0) x . . . dt
g
+ g –
L
A
Zustandsbeobachter Abbildung 6.13: System mit Zustandsvektorrückführung und Zustandsbeobachter Die Übertragungsmatrix dieses rückgeführten Systems lautet dann unter Verwendung von Gleichung 2.32 G(s) =
Y (s) −1 = C ∗ · (sI − A∗ ) · B ∗ U (s)
Die Stabilität dieses Systems wird bestimmt durch die Eigenwerte der Matrix A∗ . Diese Eigenwerte sind wiederum identisch mit den Wurzeln der charakteristischen Gleichung, die berechnet wird zu Det(sI − A∗ ) = (s − λ1 )(s − λ2 ) · · · (s − λ2n ) = 0 mit n als Systemordnung. Für diese Determinante gilt: Det(sI − A∗ ) = Det
sI − A BK −LC sI − A + LC + BK
.
Da Zeilen- und Spaltenoperationen den Wert einer Determinanten nicht ändern, werden zunächst die Zeilen 1 bis n von den Zeilen n + 1 bis 2n subtrahiert. Man erhält: sI − A BK Det(sI − A∗ ) = Det . −sI + A − LC sI − A + LC
6.4 Das Separationstheorem
145
Dann werden die Spalten n+1 bis 2n zu den Spalten 1 bis n addiert und man erhält:
sI − A + BK BK Det(sI − A ) = Det 0 sI − A + LC ∗
.
Die Determinante dieser Matrix in Dreiecksform aber resultiert zu: Det(sI − A∗ ) = Det [sI − (A − BK)] · Det [sI − (A − LC)] .
(6.31)
Die Matrizen A − BK und A − LC sind aber gerade die Dynamikmatrix des Systems mit Rückführung des wahren Zustandsvektors und die Dynamikmatrix des Beobachters. Damit ist das charakteristische Polynom des Gesamtsystems gerade das Produkt vom charakteristischen Polynom des rückgeführten Systems bei Kenntnis des wahren Zustandsvektors und dem charakteristischen Polynom des Beobachters. Die Stabilität beider Systemteile kann unabhängig voneinander entworfen werden. Diese Eigenschaft ist nicht selbstverständlich wenn man daran denkt, dass eine stabile Eingrößenregelstrecke und ein stabiler Eingrößenregler noch längst kein stabiles Gesamtsystem garantieren. Somit ist die Berechnung der Rückführmatrix K unabhängig davon, ob die wahren oder die geschätzten Zustandsvektoren zurückgeführt werden. Ebenso kann man die Rückführmatrix L des Beobachters unabhängig davon berechnen, ob der Beobachter mit einer Zustandsvektorrückführung kombiniert wird oder nicht. Diese Eigenschaft wird als Separationsprinzip des Regler/Beobachter-Entwurfs bezeichnet. Der getrennte Entwurf von Zustandsbeobachter und Zustandsvektorrückführung, z. B. zur Polfestlegung eines Mehrgrößensystems, kann mit dem Entwurf eines dynamischen Kompensators in einem Entwurfsschritt erledigt werden. In [11] wird gezeigt, dass die Ordnung dieses dynamischen Kompensators für ein steuer- und beobachtbares System gleich Min {Rang(QS ) − 1, Rang(QB ) − 1} ist, mit QS und QB als Steuer- und Beobachtbarkeitsmatrizen. Beispiel 6.4 Hydraulik-Kaskade: Die Auswirkung des Separationstheorems soll ebenfalls auf das Beispiel 2.1 der Hydraulik-Kaskade angewendet werden. Die Dynamik- und Messgleichung der Hydraulik-Kaskade lauten entsprechend denen von Beispiel 2.5. Mittels Polfestlegung sollen nun die Pole des Kreises mit Zustandsvektorrückführung auf die Positionen λ1 = −0,30
λ2 = −0,25
und
λ3 = −0,20
verschoben werden. Die mit der Methode der robusten Polfestlegung berechnete Rückführmatrix K der quadratischen Regelung lautet dann: K=
1,1449 0,9873 0,1565 0,3609 1,0203 2,3826
.
146
6 Zustandsbeobachter/-schätzer
Die ebenfalls mittels Polfestlegung vorgegebenen Pole des Beobachters sollen auf die Positionen λ1 = −0,40
λ2 = −0,35
und
λ3 = −0,30
verschoben werden. Der Beobachter soll also schneller einschwingen als die Regelung mittels Zustandsvektorrückführung. Die mit der Methode der robusten Polfestlegung berechnete Rückführmatrix L des Beobachters lautet dann: ⎡ ⎤ 0,3218 0,0787 L = ⎣ 0,2043 0,1834 ⎦ . 0,0653 0,3199 Die Sprungantwort der rückgeführten Hydraulik-Kaskade für eine sprungförmige Stellgröße QZu1 = 1 hl/s zeigt Abb. 6.14 für den bei der Füllstandsregelung zu beachtenden Spezialfall positiver Stellsignale. 0.5
h1 (t)
0.4
h(t)
60.3
h2 (t)
0.2
h3 (t)
0.1 0
0
5
10
15
20
25
-
30
35
40
45
50
t/s Abbildung 6.14: Sprungantwort der Hydraulik-Kaskade für einen Sprungeingang QZu1 = 1 hl/s mit Zustandsvektorrückführung und Beobachter. Zustände hi (t) fett gezeichnet, und geschätzte Zustände " hi (t) nicht fett gezeichnet Die geschätzten Zustände sind nach ca. 10 s auf die wahren Zustände eingeschwungen. Dabei ist zu berücksichtigen, dass der unbekannte Zustand der Füllstand h2 (t) ist, der nicht gemessen wird. Die Zustände h1 (t) und h3 (t) sind gemessene Ausgangsgrößen des Systems. Der unbekannte Zustand " h2 (0) ist zu 0,1 angenommen.
7
Führungs- und Störverhalten von Mehrgrößensystemen
Problemstellung. Mit den zuvor behandelten Verfahren der Polfestlegung und der linearen quadratischen Regelung wird durch Zustandsvektorrückführung das Stabilitätsverhalten eines Mehrgrößensystems verbessert. Falls dabei der Zustandsvektor nicht direkt messbar ist, muss er unter Verwendung eines Zustandsbeobachters geschätzt werden. Die Pole des rückgeführten Mehrgrößensystems werden entweder auf vorgegebene Positionen verschoben oder sie werden in der linken s-Halbebene so verändert, dass ein quadratisches Gütefunktional minimal wird. In beiden Fällen dieser Zustandsvektorrückführung wird der Zustandsvektor in geeigneter Weise in den Nullpunkt überführt. Damit ist auch der Ausgangsvektor y(t) für t → ∞ gleich Null. Diese Fragestellung ist jedoch häufig von untergeordneter Bedeutung. Von größerer Bedeutung ist vielmehr die Frage, ob die Ausgangsgrößen des Mehrgrößensystems vorgegebene Sollwerte erreichen und wie das geregelte Mehrgrößensystem auf Störgrößen reagiert. Die Untersuchung des Führungs- und Störverhaltens des geregelten Mehrgrößensystems ist Gegenstand der Untersuchung dieses Kapitels. Die zu untersuchende Problematik verdeutlicht das nachstehende Blockdiagramm der Regelung eines Mehrgrößensystems1.
z(t) w(t)
j
e(t)
Mehrgrößenregler
u(t)
Mehrgrößenregelstrecke
y(t)
–
Abbildung 7.1: Struktur eines Mehrgrößenregelsystems
1
Um mögliche Missverständnisse im Zusammenhang mit dem Zustandsvektor x(t) zu vermeiden, wird die Regeldifferenz als e(t) und nicht als xd (t) definiert.
148
7 Führungs- und Störverhalten von Mehrgrößensystemen
Die folgenden Fragestellungen werden anschließend untersucht: • Wie wird der Ausgang y(t) durch Verwendung eines Vorfilters auf den gewünschten stationären Sollwert w ˆ gesteuert? (Steuerung) • Welcher Regler ist erforderlich, damit der Ausgang y(t) den stationären Sollwert w ˆ erreicht? (Führungsverhalten) • Welcher Regler ist erforderlich, damit der Ausgang y(t) einem veränderlichen Sollwert w(t) folgt? (Servokompensator, Modellfolgeregler) • Wie ist der Einfluss der Störungen z(t) auf den Ausgang y(t) zu reduzieren? (Störverhalten)
7.1
Führungsgrößenaufschaltung
Methode. Bei der Führungsgrößenaufschaltung soll durch Aufschaltung eines Steuersignals u(t) das Mehrgrößensystem so gesteuert werden, dass im eingeschwungenen Zustand der Systemausgang y(∞) den geforderten konstanten Sollwert w ˆ erreicht. Dies löst man durch Erzeugung des Steuersignals u (t) mittels einer konstanten Vorfiltermatrix V , deren Eingangssignal gemäß Abb. 7.2 lautet w(t) = w ˆ ·σ(t). Dabei ist angenommen, dass das Mehrgrößensystem zusätzlich durch eine Zustandsvektorrückführung mit der Rückführmatrix K stabilisiert werden kann. Liegt keine Zustandsvektorrückführung vor, dann ist in der folgenden Herleitung K = 0 zu setzen. Mehrgrößensystem
w(t)
u (t) V
u h
B
–
x0
x(t) ˙ h
. . . dt
x(t)
C
y(t)
+ A K
Abbildung 7.2: Mehrgrößensystem mit Führungsgrößenaufschaltung
Für das stabilisierte System mit Zustandsvektorrückführung gelten die Zustandsgleichungen x˙ = (A − BK) · x + B · u y = C ·x .
mit x(0) = x0
7.1 Führungsgrößenaufschaltung
149
Im eingeschwungenen Zustand des Systems (x˙ = 0) gilt 0 = (A − BK) · x(∞) + B · u (∞) y(∞) = C · x(∞) .
(7.1)
Sofern [A − BK] invertierbar ist, kann man Gleichung 7.1 nach x(∞) auflösen zu x(∞) = − (A − BK)−1 B · u (∞) . Damit wird das Ausgangssignal y(∞) im eingeschwungenen Zustand * + y(∞) = − C · [A − BK]−1 B · u (∞) = −V˜ · u (∞) . −1
˜ ·w ˆ werden. Damit Um zu erreichen, dass y(∞) = w ˆ wird, muss somit u (∞) = −V kann man dann das Vorfilter V nach der folgenden Beziehung berechnen: +−1 * −1 . V = − C [A − BK] B
(7.2)
Die Voraussetzungen für die Berechenbarkeit der Vorfiltermatrix V nach Gleichung 7.2 sind: 1. Die Matrix (A − BK) muss invertierbar sein. Diese Bedingung ist erfüllt, sofern alle Pole dieser Matrix negativen Realteil aufweisen. * + −1 2. Die Berechnungsmatrix C [A − BK] B muss ebenfalls invertierbar sein. Dazu muss die Zahl der Steuereingänge r gleich der Zahl der Ausgangsgrößen s sein, also r = s. Die Invertierbarkeit der Systemmatrix (A − BK) wird zwar auch für Pole mit positivem Realteil erfüllt, jedoch macht die Ermittlung eines Vorfilters dann keinen Sinn, da kein stabiler Endwert existiert. Die Matrix ist nicht invertierbar, sofern ein Pol im Ursprung liegt. Letzteres entspricht wie im Eingrößenfall einem System mit integrierendem Verhalten. Ein Sprungeingang führt nicht zu einem stationären Endwert. Für die Berechnung des Vorfilters ist die genaue Kenntnis der Systemmatrizen A, B und C erforderlich. Sind diese Matrizen nicht genau bekannt, führt dies, wie bei einer Steuerung zu erwarten ist, zu einer Abweichung des Endwertes y(∞) von w. ˆ Dann ist die Verwendung einer I- oder PI-Reglerstruktur vorzuziehen.
150
7 Führungs- und Störverhalten von Mehrgrößensystemen
Falls der Zustandsvektor einer direkten Messung nicht zugänglich ist, geschieht die Rückführung des Zustandsvektors x(t) durch Verwendung eines Zustandsbeobachters. Es wird dann der geschätzte Zustandsvektor x ˆ zurückgeführt. Die Voraussetzungen für die Existenz der Vorfiltermatrix V bleiben unverändert. Beispiel 7.1 System 3. Ordnung: Gegeben sei das System 3. Ordnung von Beispiel 6.2 in Zustandsdarstellung zu ⎡
⎤ ⎡ ⎤ 0 1 2 2 1 x˙ = ⎣ −2 −3 0 ⎦ · x + ⎣ 0 2 ⎦ · u , −2 0 −1 1 3
y=
1 2 −1 ·x 2 −1 3
⎡ ⎤ 0 mit x(0) = ⎣ 0 ⎦ . 0
Die Minimierung eines quadratischen Integralkriteriums mit den Wichtungsmatrizen ⎡
⎤ 1 0 0 Q = ⎣0 1 0⎦ 0 0 1
und
R=
1 0 0 1
ergibt die Rückführmatrix K=
0,8738 0,0090 0,2176 0,4485 0,2483 0,6476
.
Die Berechnung der Vorfiltermatrix V nach Gleichung 7.2 liefert folgendes Ergebnis: V =
4,0531 −1,0406 −0,7796 0,7982
.
Die Berechnung der des Systems mit Vorfilter für den Eingangssprung Sprungantwort 1 w(t) = w ˆ · σ(t) = · σ(t) ergibt für die Ausgangsgrößen y1 (t) und y2 (t) den in Abbil2 dung 7.3 gezeigten Verlauf. Die Ausgangsgrößen erreichen wie gewünscht die Endwerte y1 (∞) = 1 und y2 (∞) = 2. Beispiel 7.2 Hydraulik-Kaskade: Will man die Führungsgrößenaufschaltung auf das Beispiel 2.1 der Hydraulik-Kaskade anwenden, dann führt der bei dieser Anwendung auftretende Spezialfall beschränkter (positiver) Stellsignale zu Problemen. Es ist dann nicht möglich, die Ausgangsgrößen mittels Vorfilter auf die gewünschten Sollwerte zu führen, da hierfür negative Stellsignale erforderlich sind. Könnte man negative Stellsignale mittels einer Ansteuerung der Abflüsse erzeugen, dann würde die Anwendung der Vorfiltermatrix V zum gewünschten Ergebnis führen.
7.1 Führungsgrößenaufschaltung
151
3.5 3 y1 ,y2 (t) 2.5
6
y2 (t)
2
1.5 1 y1 (t)
0.5 0
0
0.5
1
1.5
2
2.5
-
3
3.5
4
4.5
5
t/s
Abbildung 7.3: Verlauf der Ausgangsgrößen y1 (t) und y2 (t) nach einem Sprungeingang
Parameterempfindlichkeit. Abschließend soll noch die Parameterempfindlichkeit der Führungsgrößenaufschaltung von Beispiel 7.1 untersucht werden. Es wird angenommen, dass z. B. der wahre Wert des Elements A(2,2) = −3,1 und nicht wie bei der Ermittlung von K und V angenommen gleich −3 ist. Die Sprungantwort des Systems mit Führungsgrößenaufschaltung liefert, wie bei einer Steuerung zu erwarten ist, nun eine Abweichung von y(∞) von gewünschten Sollwert w, ˆ wie Abbildung 7.4 zeigt. 3.5 3 y1 ,y2 (t) 2.5
6
y2 (t)
2
1.5 1 y1 (t)
0.5 0
0
0.5
1
1.5
2
2.5
-
3
3.5
4
4.5
5
t/s
Abbildung 7.4: Verlauf der Ausgangsgrößen y1 (t) und y2 (t) nach einem Sprungeingang für eine geänderte A-Matrix
Aufgabe 7.1 System 4. Ordnung: Gegeben ist das System von Aufgabe 3.1 mit den Systemmatrizen ⎡
−2 ⎢ 1 A=⎣ 2 1
−1 −4 −1 0
0 0 −1 −3
⎤ 3 1 ⎥ 0 ⎦ −2
⎡
2 ⎢0 B=⎣ 3 1
⎤ 1 −1 ⎥ 0 ⎦ 0
152
7 Führungs- und Störverhalten von Mehrgrößensystemen C=
1 −1 2 0 0 2 1 −1
.
1. Ermitteln Sie die Rückführmatrix K für das quadratische Integralkriterium mit Wichtungsmatrizen Q und R als Einheitsmatrizen. 2. Ermitteln Sie für das rückgeführte System die Vorfiltermatrix V . Lösung: 0,3949 1.) K = 0,2147 0,6440 2.) V = 1,1078
7.2
−0,2077 1,3781 −0,3598 −0,1426 0,0295 0,0847 1,2983 −1,5849
Integrale Ausgangsvektorrückführung
Grundlagen. Beim Entwurf eines dynamischen Mehrgrößenreglers wird, wie in Abbildung 7.1 gezeigt, aus der Differenz zwischen Sollwert w und Istwert y die Regeldifferenz e(t) gebildet, e(t) = w(t) − y(t). Diese Regeldifferenz wird wie im Eingrößenfall über den dynamischen Mehrgrößenregler weiter verarbeitet. Bei der Ermittlung der Reglermatrizen der integralen Ausgangsvektorrückführung kann das Verfahren der linearen quadratischen Regelung verwendet werden. Bei dieser Methode wird ein quadratisches Integralkriterium von t = 0 bis t → ∞ minimiert (siehe Gleichung 5.5). Für t → ∞ streben dabei der Zustandsvektor x und der Steuervektor u gegen Null. Damit bleibt der Wert des Gütefunktionals J dann endlich. Soll nun jedoch zur Erzielung eines gewünschten Führungsverhaltens der Ausgangsvektor y gegen den von Null verschiedenen Sollwert w ˆ gehen, dann werden für t → ∞ der Zustandsund Steuervektor im Allgemeinen endliche Werte annehmen, und somit wird der Wert des Gütefunktionals J gegen Unendlich gehen. Der Ansatz der linearen quadratischen Regelung ist nun so umzuformulieren, dass der Wert des Gütefunktionals endlich bleibt. Herleitung. Wenn für einen konstanten Sollwert w ˆ der Ausgangsvektor y(∞) und damit auch x(∞) und u(∞) endliche, konstante Werte annehmen, dann heißt das aber auch, dass deren Ableitungen x(∞) ˙ und u(∞) ˙ Null sind. Somit sind die System- und Reglergleichungen so umzuformen, dass als Zustands- bzw. Stellgrößen die Vektoren x(t) ˙ und u(t) ˙ auftreten [70]. Dann bleibt der Wert des Gütefunktionals J nach Gleichung 5.5 endlich. Ausgehend von den Systemgleichungen des Mehrgrößensystems x˙ = A · x + B · u y = C ·x
(7.3) (7.4)
7.2 Integrale Ausgangsvektorrückführung
153
gilt für den Regelfehler e=w−y . Für die Ableitung der Zustands- und der Fehlergleichung gelten dann x ¨ = A · x˙ + B · u˙ e˙ = w˙ − y˙ ,
(7.5) (7.6)
bzw. für w = w ˆ = const wird w˙ = 0 und Gleichung 7.6 geht über in e˙ = −y˙ = −C · x˙ .
(7.7)
Die Zusammenfassung der Gleichungen 7.5 und 7.7 zu einer erweiterten Zustandsdarstellung ergibt ¨ x A 0 x˙ B = · + · u˙ . (7.8) e˙ −C 0 e 0 Nach Einführung des neuen Zustandsvektors x ˜=
x˙ e
und Steuervektors u ˜ = u˙ lauten
dann die modifizierten Zustandsgleichungen A 0 B ˜·x ˜·u ˙x ˜ = ·x ˜+ ·u ˜=A ˜+B ˜. −C 0 0
(7.9)
Die Minimierung des Gütefunktionals ∞ xT Q˜ x+u ˜T R˜ u] dt J = [˜ 0
über u ˜ für die Systemgleichung 7.9, also min J(˜ u) ⇒ u ˜∗ u ˜ liefert die optimale Zustandsvektorrückführung in der Form x˙ . ˜ = − [K x | K e ] · u ˜∗ = u˙ ∗ = −K ∗ · x e
(7.10)
Voraussetzung für die Existenz dieser Lösung ist die Erfüllung der Bedingungen des quadratischen Reglerproblems, also die vollständige Steuerbarkeit des Systems von Gleichung 7.9, die Semidefinitheit bzw. Definitheit der Matrizen Q und R und die vollstän˜ Q1 ) mit Q1 gemäß der Beziehung Q = QT1 Q1 und dige Beobachtbarkeit des Paares (A,
154
7 Führungs- und Störverhalten von Mehrgrößensystemen
˜ als Dynamikmatrix nach Gleichung 7.9. Nach Weglassen des „*“ (für Optimalität) A beim Vektor u˙ ∗ lautet Gleichung 7.10 u˙ = −K x · x˙ − K e · e .
(7.11)
Die Integration von Gleichung 7.11 liefert dann die endgültige Rückführung zu u = −K x · x − K e ·
e(τ )dτ
mit
(7.12)
e(0) = e0 .
Über die Matrix K x wird der Zustandsvektor x bzw. bei Nichtmessbarkeit der über einen Zustandsbeobachter geschätzte Zustandsvektor x ˆ zurückgeführt und über die Matrix K e wird das Integral des Regelfehlers e = w − y zurückgeführt. Es findet also eine proportionale Rückführung des Zustandsvektors und eine integrale Rückführung des Regelfehlers statt. Daher bezeichnet man diese Reglerstruktur auch als PI-Mehrgrößenregler oder auch als integrale Ausgangsvektorrückführung. In Abb. 7.5 wird die Struktur dieser Regelung gezeigt.
w ˆ
e g –
e0 ...dt
Ke
Mehrgrößen-Regelstrecke x0 u x(t) ˙ x(t) g g ...dt B − – +
C
y(t)
A Kx
Abbildung 7.5: Mehrgrößensystem mit integraler Ausgangsvektorrückführung Die Methode soll an einem Beispiel demonstriert werden.
Beispiel 7.3 System 3. Ordnung: Gegeben sei wieder das System 3. Ordnung von Beispiel 6.1 in Zustandsdarstellung zu ⎡
⎤ ⎡ ⎤ 0 1 2 2 1 x˙ = ⎣ −2 −3 0 ⎦ · x + ⎣ 0 2 ⎦ · u , −2 0 −1 1 3 ⎡ ⎤ 0 mit x(0) = ⎣ 0 ⎦ . 0
y=
1 2 −1 ·x 2 −1 3
7.2 Integrale Ausgangsvektorrückführung
155
Für dieses Mehrgrößensystem sollen eine integrale Ausgangsvektorrückführung gemäß Abb. 7.5 entworfen und die Rückführmatrizen K x und K e berechnet werden. Für die Berechnung dieser Rückführmatrizen sind zunächst die modifizierten Matrizen ˜ und B ˜ gemäß Gleichung 7.9 aufzustellen: A ⎡
˜= A
A 0 −C 0
und
0 ⎢ −2 ⎢ = ⎢ −2 ⎣ 1 2
⎡
2 ⎢0 ˜ = B =⎢ B ⎢1 0 ⎣0 0
1 −3 0 2 −1
2 0 −1 −1 3
0 0 0 0 0
⎤ 0 0⎥ ⎥ 0⎥ 0⎦ 0
⎤ 1 2⎥ ⎥ 3⎥ . 0⎦ 0
Für den nächsten Entwurfsschritt sind die geeigneten Gewichtsmatrizen Q und R zu ermitteln. Hierzu sind im allgemeinen mehrere Entwurfsschritte mit unterschiedlichen Werten für Q und R erforderlich. Nach mehreren Versuchen erwiesen sich die folgenden Gewichtsmatrizen ⎡
1 ⎢0 ⎢ Q=⎢0 ⎣0 0 und
R=
0 1 0 0 0
1 0 0 1
0 0 1 0 0
0 0 0 20 0
⎤ 0 0⎥ ⎥ 0⎥ 0⎦ 5
als geeignet. Dabei werden Quadrate der Zustände x1 (t) bis x3 (t) mit den Gewichtswerten 1 und Quadrate der Fehler e1 (t) = w ˆ1 − y1 (t) bzw. e2 (t) = w ˆ2 − y2 (t) mit den die Gewichtswerten 20 und 5 gewichtet. Die Gewichtungswerte für die Quadrate der Stellsignale u ˜1 (t) und u ˜2 (t) sind 1. Damit sind die Vorarbeiten für die Anwendung des Algorithmus der linearen quadratischen Regelung nach Kapitel 5 erledigt und die Anwendung des Optimierungsalgorithmus’ liefert die folgenden Rückführmatrizen: 2,9546 3,4547 −2,3128 −4,4720 −0,0171 und K e = . Kx = 0,1628 −0,9351 2,6000 0,0343 −2,2360
156
7 Führungs- und Störverhalten von Mehrgrößensystemen
Das Einschwingverhalten für den Eingangssprung w(t) = w ˆ · σ(t) =
1 · σ(t) zeigt die 2
nachfolgende Abb. 7.6. 2.5 y2 (t)
2 y1 ,y2 (t)
61.5 1 y1 (t)
0.5 0
1.5
1
0.5
0
2
2.5
-
3
3.5
4
4.5
5
t/s
Abbildung 7.6: Verlauf der Ausgangsgrößen y1 (t) und y2 (t) nach einem Sprungeingang
Wie gefordert erreichen die Ausgangsgrößen y1 (t) und y2 (t) nach ca. 3,5 s die gewünschten Endwerte 1 und 2. Das Überschwingen der Regelgröße y2 (t) beträgt ca. 20%. Durch Modifizierung der Gewichtsmatrizen Q und R können die Ausgangsverläufe beeinflußt werden. Dies geschieht jedoch nicht unbedingt systematisch, es ist mehr ein Probierverfahren. Beispiel 7.4 Hydraulik-Kaskade: Als weiteres Beispiel wird wieder die Hydraulik-Kaskade von Beispiel 2.1 untersucht. Die Dynamik- und Messgleichung der Hydraulik-Kaskade lauten entsprechend Beispiel 2.5 ⎡
⎤ ⎡ ⎤ ⎡ ⎤ h˙ 1 −0,125 0,125 0 h1 ⎣ h˙ 2 ⎦ = ⎣ 0,1 −0,2 0,1 ⎦ · ⎣ h2 ⎦ + 0 0,0833 −0,0833 h3 h˙ 3 ⎡
⎤ ⎡ ⎤ 0,1250 0 0 0 QZu1 ⎦ · QAb2 0 ⎦· 0 +⎣ 0 + ⎣ −0,1 QZu3 QAb3 0 0,0833 0 −0,0833 und
y1 y2
=
h1 h3
=
⎡ ⎤ h 1 0 0 ⎣ 1⎦ · h2 . 0 0 1 h3
7.2 Integrale Ausgangsvektorrückführung
157
⎤ h1 QAb2 QZu1 ⎦ ⎣ Hierin sind x = h2 der Zustandsvektor, u = der Stellvektor, z = QZu3 QAb3 h3 h1 der Störvektor und y = der Ausgangsvektor. h3 ⎡
Die Methode der integralen Ausgangsvektorrückführung führt für die Gewichtsmatrizen 20 0 Q = I 5 und R = zu den Rückführmatrizen 0 1 Kx =
1,3275 0,5271 0,0603 0,8042 1,0316 4,3161
und K e =
−0,2223 0,0243 −0,1088 −0,9941
.
Der mit diesen Rückführmatrizen generierte Einschwingverlauf für die Systemstruktur nach Abb. 7.5 führt die Ausgangsgrößen h1 (t) und h3 (t) zu den gewünschten Sollwerten h1w = 3 m und h2w = 2 m. Die auftretenden Störgrößen sind die Abflüsse Q2ab = 3 hl/s und Q3ab = 2 hl/s. Die Abflüsse sorgen in diesem Fall indirekt für die notwendigen “negativen“ Stellsignale. Den Zeitverlauf des Einschwingvorgangs zeigt Abb. 7.7.
3.5
h(t)
h1 (t)
3
2.5
h3 (t)
62 1.5 1 0.5 0
0
10
20
30
-
40
50
60
t/s
Abbildung 7.7: Sprungantwort der Hydraulik-Kaskade für die Methode der integralen Ausgangsvektorrückführung
Die Füllstände erreichen nach ca. 30 bis 50 s die gewünschten Endwerte von 2 bzw. 3 m. Die Stellsignale nehmen für diesen Verlauf nur positive Werte an.
158
7 Führungs- und Störverhalten von Mehrgrößensystemen
Parameterempfindlichkeit. Die Untersuchung der Parameterempfindlichkeit dieser Regelung soll wie in Beispiel 7.1 in gleicher Weise auch an Beispiel 7.3 untersucht werden. Es wird angenommen, dass der wahre Wert des Elements A(2,2) = −3,1 und nicht wie bei der Ermittlung von K x und K e angenommen gleich −3 ist. Die Sprungantwort des Systems mit integraler Ausgangsvektorrückführung zeigt in Abb. 7.8, dass nun keine Abweichung von y(∞) vom gewünschten Sollwert w ˆ auftritt. Die Zeitverläufe von y1 (t) und y2 (t) weichen auch während des Einschwingvorgangs nur geringfügig vom „ungestörten“ Verlauf ab. 2.5 y2 (t)
2 y1 ,y2 (t)
61.5 1 y1 (t)
0.5 0
0
0.5
1
1.5
2
2.5
-
3
3.5
4
4.5
5
t/s
Abbildung 7.8: Verlauf der Ausgangsgrößen y1 (t) und y2 (t) im gestörten und ungestörten Fall nach einem Sprungeingang Ausgangsvektorrückführung und Zustandsschätzung. Falls der Zustandsvektor nicht messbar ist, muss er unter Verwendung eines Zustandsbeobachters geschätzt werden. Dies führt dann zu der in Abb. 7.9 gezeigten Struktur des Systems mit Zustandsbeobachter und integraler Ausgangsvektorrückführung. Aufgabe 7.2 System 4. Ordnung: Gegeben ist das System von Aufgabe 7.1 mit den Systemmatrizen ⎡
−2 ⎢ 1 A=⎣ 2 1 C=
−1 −4 −1 0
0 0 −1 −3
1 −1 2 0 0 2 1 −1
⎤ 3 1 ⎥ 0 ⎦ −2
⎡
2 ⎢0 B=⎣ 3 1
⎤ 1 −1 ⎥ 0 ⎦ 0
.
Ermitteln Sie die Rückführmatrizen K x und K e für das quadratische Integralkriterium mit den Wichtungsmatrizen Q und R als Einheitsmatrizen mit Ausnahme der Werte von J(5,5) = 20 und J(6,6) = 5.
7.3 Modellfolgeregler – Servo-Kompensator
159
PI-Mehrgrößenregler w ˆ
e(t) g ...dt –
u(t) MehrgrößenRegelstrecke
– g –
Ke
y(t)
Kx x ˆ Zustandsbeobachter
Abbildung 7.9: Systemstruktur mit Beobachter und PI-Mehrgrößenregler Lösung:
1,1330 −0,3812 2,2533 −0,1074 0,4278 −1,3784 0,0416 0,5337 −3,8338 −1,1513 2.) K e = −2,3026 1,9169
1.) K x =
7.3
Modellfolgeregler – Servo-Kompensator
Modellgleichungen. Ein Modellfolgeregler hat die Aufgabe, ein Mehrgrößensystem in der Weise zu beeinflussen, dass das geregelte Mehrgrößensystem in der Lage ist, den vorgegebenen Referenzsignalen zu folgen. Diese Referenzsignale sind die Ausgangssignale eines ungesteuerten Modells, dessen Ausgangssignale allein vom Anfangszustand des Modells abhängen. Das Mehrgrößensystem soll praktisch so beeinflusst werden, dass es weitgehend das dynamische Verhalten des Modells annimmt [3]. Betrachtet man z. B. die folgenden Zustandsgleichungen eines Modells x˙ M = AM · xM w M = C M · xM
mit
(7.13) (7.14)
xM (0) = xM,0
für die folgenden Zahlenwerte der Matrizen: ⎡ ⎤ 0 1 0 −1 0 1 ⎣ ⎦ AM = −1 −2 0 , C M = −2 0 2 0 0 0
und
xM,0
⎡ ⎤ 1 = ⎣0⎦ , 1
(7.15)
so hat der Ausgang wM (t) dieses Modells den in Abb. 7.10 gezeigten Signalverlauf. Das Paar (AM , C M ) des Modells sei vollständig beobachtbar.
160
7 Führungs- und Störverhalten von Mehrgrößensystemen
2 wM,i (t)
6
wM,2 (t)
1.5
1 wM,1 (t)
0.5
0
0
1
2
3
4
5
-
6
7
8
9
10
t/s
Abbildung 7.10: Verlauf der Ausgangsgrößen wM,1 (t) und wM,2 (t) des Modells Weiterhin sei das Mehrgrößensystem gegeben zu x˙ = A · x + B · u y = C ·x und für den Regelfehler gilt e = wM − y . Regler/Servo-Kompensator. Für die Lösung dieses Modellfolgeproblems wird in [16], [17], [74] die in Abb. 7.11 gezeigte Reglerstruktur vorgeschlagen. Diese Struktur ist sehr ähnlich der Reglerstruktur bei integraler Ausgangsvektorrückführung. Der Integrator wird jedoch durch eine Dynamikgleichung ersetzt, deren Matrizen N und M zunächst unbekannt sind. Führungsmodell x˙ M = AM xM wM ge w M = C M xM –
Regelstrecke
Kompensator ζ˙ =N ζ +M e
Kζ
–g u –
x˙ = Ax + Bu y = Cx
Kx
Abbildung 7.11: Struktur der Modellfolgeregelung
x
y(t)
7.3 Modellfolgeregler – Servo-Kompensator
161
Für die in Abb. 7.11 dargestellte Systemstruktur (Dimensionen: x [n × 1]; y, u, w M und e [s × 1], Dim ζ abhängig von der gewünschten Signalform von wM ) gelten die folgenden Zustandsgleichungen: x˙ = A · x + B · u ζ˙ = N · ζ + M · e y = C ·x e = wM − y = wM − C · x u = −K x · x − K ζ · ζ
(7.16) (7.17) (7.18) (7.19) (7.20)
Nach dem Einsetzen von Gleichung 7.19 in Gleichung 7.17 erhält man dann das erweiterte Zustandsmodell
x˙ ζ˙
=
A 0 −M C N
x B 0 · + ·u+ · wM ζ 0 M
(7.21)
Davison und Goldenberg [16] schlagen für die Wahl von N und M vor N = Diag (N 1 . . . N s ) M = Diag (m1 . . . ms ) . mit Det (sI − N i ) = Det (sI − AM )
(i = 1, . . . , s) .
Die Matrizen N und M sind also Diagonalmatrizen in der folgenden Form: ⎡
⎤ N1 0 · · · 0 ⎢ 0 N2 · · · 0 ⎥ ⎢ ⎥ N =⎢ . .. .. ⎥ ⎣ .. . . ⎦ 0 0 · · · Ns
⎤ m1 0 · · · 0 ⎢ 0 m2 · · · 0 ⎥ ⎥ ⎢ M =⎢ . .. .. ⎥ . ⎣ .. . . ⎦ 0 0 · · · ms ⎡
und
Durch diese Wahl enthält der Kompensator für s zu regelnde Ausgangsgrößen yi (t) dann s-mal die Dynamikmatrix AM des Modells. Wählt man die N i und mi in Regelungsnormalform, dann ist zugleich die erforderliche vollständige Steuerbarkeit des Paares (N ,M ) gewährleistet.
162
7 Führungs- und Störverhalten von Mehrgrößensystemen
Für das in den Gleichungen 7.13 bis 7.15 vorgestellte Führungsgrößenmodell mit s = 2 lauten dann z. B. die Matrizen N und M wie folgt: ⎡
0 1 ⎢ −1 −2 ⎢ AM 0 ⎢ 0 0 N = =⎢ 0 AM ⎢ 0 0 ⎣ 0 0 0 0 ⎤ ⎡ 0 0 1 0⎥ ⎢ ⎥ ⎢ m1 0 ⎢1 0⎥ M = =⎢ ⎥ . 0 m1 ⎢0 0⎥ ⎣0 1⎦ 0 1
0 0 0 0 0 0
0 0 0 0 −1 0
0 0 0 1 −2 0
⎤ 0 0⎥ ⎥ 0⎥ ⎥ 0⎥ 0⎦ 0
(7.22)
(7.23)
Offen ist noch die Bestimmung der Rückführmatrizen K x und K ζ . Diese Matrizen werden nach den Standardverfahren des quadratischen Reglerproblems bzw. der Polfestlegung für Mehrgrößensysteme, angewendet auf Gleichung 7.21, bestimmt. Die Berechnung der Rückführmatrizen und die Simulation des Modellfolgeverhaltens soll wieder an dem Beispiel 7.1 behandelt werden.
Beispiel 7.5 System 3. Ordnung: Gegeben sei das System 3. Ordnung von Beispiel 7.1 in Zustandsdarstellung
x˙ = A · x + B · u y = C ·x
mit den Zahlenwerten ⎡
⎤ ⎡ ⎤ 0 1 2 2 1 x˙ = ⎣ −2 −3 0 ⎦ · x + ⎣ 0 2 ⎦ · u , −2 0 −1 1 3 ⎡ ⎤ 0 und x(0) = ⎣ 0 ⎦ . 0
y=
1 2 −1 ·x 2 −1 3
(7.24)
7.3 Modellfolgeregler – Servo-Kompensator
163
˜ Mit den Zahlenwerten der Gleichungen 7.22 bis 7.24 werden zunächst die Matrizen A ˜ aufgebaut: und B A 0 ˜= ˜= B A und B (7.25) −M C N 0 Damit können nun die Rückführmatrizen K x und K ζ ermittelt werden. Nach einigen Versuchen ergibt die Minimierung eines quadratischen Integralkriteriums mit den Wichtungsmatrizen2 Q(4,4) bis Q(6,6) = 10 Q = 09 außer Q(7,7) bis Q(9,9) = 1 und3 R = I2 =
1 0 0 1
˜ und B ˜ die folgenden Werte der Rückführmatrizen für die obigen Systemmatrizen A K x und K ζ : Kx =
1,8907 2,7147 −1,7908 0,4019 0,0986 1,1440
und Kζ =
−0,3976 −0,3976 −3,0424 −0,0672 −0,0672 0,2727 −0,4147 −0,4147 −0,8624 −0,2335 −0,2335 −0,9621
.
Mit N und M nach Gleichung 7.22 und 7.23 und das Führungsmodell nach den Gleichungen 7.13 bis 7.15 ergibt sich das in Abb. 7.12 gezeigte Modellfolgeverhalten des nach Abb. 7.11 aufgebauten Gesamtsystems. Die Ausgangsgrößen y(t) des Mehrgrößensystems folgen näherungsweise dem vorgeschriebenen Verlauf der Modellgrößen w(t). Die Abweichungen sind durch den Einschwingvorgang bedingt. Für einen anderen Verlauf der Modellgrößen zeigt Abb. 7.13, dass nach ca. 6 bis 8 s die Ausgangsgrößen auf die Modellgrößen eingeschwungen sind. Der Modellfehler e(t) geht für die obige Vorgehensweise somit für t gegen Unendlich gegen Null. Beispiel 7.6 Hydraulik-Kaskade: Als weiteres Beispiel wird wieder die Hydraulik-Kaskade von Beispiel 2.1 untersucht. Die Dynamik- und Messgleichung der Hydraulik-Kaskade lauten entsprechend Beispiel 2.5. 2 3
Mit 09 wird eine 9x9 Nullmatrix bezeichnet. Mit I 2 wird eine 2x2 Einheitsmatrix bezeichnet.
164
7 Führungs- und Störverhalten von Mehrgrößensystemen 2
y2 (t) wM,2 (t)
wM ,y (t) 6
1.5
1 wM,1 (t) y1 (t)
0.5
0
0
1
2
3
4
5
-
6
7
8
9
10
t/s
Abbildung 7.12: Verlauf der Modellgrößen wM,i und der Ausgangsgrößen yi des Systems für stark gedämpften Sollwertverlauf
4 y2 (t)
wM ,y (t) 6
3 wM,2 (t)
2
wM,1 (t)
1
0
y1 (t)
0
2
4
6
8
10
-
12
14
16
18
20
t/s
Abbildung 7.13: Verlauf der Modellgrößen wM,i (fett) und der Ausgangsgrößen yi des Systems für schwach gedämpften Sollwertverlauf
Die Regelgrößen h1 (t) und h3 (t) sollen in ca. 100 s monoton gegen die Endwerte 3 bzw. 2 gehen. Dies wird erreicht durch Vorgabe folgender Modellmatrizen AM , C M und xM,0 : ⎡
AM
⎤ 0 1 0 −3 0 3 = ⎣ −0,01 −0,2 0 ⎦ , C M = −2 0 2 0 0 0
und
xM,0
⎡ ⎤ 1 = ⎣0 ⎦. 1
Die Störgrößen sind wie in Beispiel 7.4 die Abflüsse Q2ab = 3 hl/s und Q3ab = 2 hl/s. Die Matrix N wird nach Gleichung 7.22 mit der obigen Matrix AM aufgebaut und die ˜ und Matrix M wird von Gleichung 7.23 übernommen. Mit den weiteren Matrizen A ˜ aufgebaut wie in Gleichung 7.25, und den Gewichtsmatrizen Q = 10 · I 9×9 und B,
7.3 Modellfolgeregler – Servo-Kompensator
165
R = I 2×2 resultieren die folgenden Rückführmatrizen: Kx = Kζ =
10,8301 1,0059 0,0995 0,0663 0,9945 13,7072
und
−2,5446 −4,7969 −3,1623 −0,0037 −0,0198 −0,0053 0,0048 −0,0014 0,0053 −2,5265 −5,2929 −3,1623
.
Mit diesen Rückführmatrizen und der Systemstruktur gemäß Abb. 7.11 resultiert das in Abb. 7.14 gezeigte Modellfolgeverhalten der Regelgrößen. 3
h1 (t)
2.5
w M ,h(t) 6
2
h3 (t)
1.5 1 0.5 0
10
0
20
30
40
50
-
60
70
80
90
100
t/s
Abbildung 7.14: Modellfolgeverhalten der Regelgrößen h1 (t) und h3 (t) (nicht fett gezeichnet) und dem Sollwertverlauf (fett gezeichnet) Die Regelgrößen weichen nur geringfügig vom Sollwertverlauf ab. Die nicht gezeigten Stellgrößen sind aufgrund der Beschränkung wie gefordert positiv. Servo-Kompensator bei sprungförmigen Sollwerten. Die Modellfolgeregelung nach Davison kann auch auf sprungförmige Führungsgrößen, wie in Abschnitt 7.2 untersucht, angewendet werden. Das Führungsgrößenmodell 1. Ordnung lautet dann x˙ M = AM · xM = [ 0 ] · xM 1 w M = C M · xM = · xM . 2
mit
xM (0) = xM,0 = 1
(7.26) (7.27)
Die konstanten Sollwerte sind also wM,1 = 1 und wM,2 = 2. Die Matrizen N und M haben die Form
AM 0 0 0 = 0 AM 0 0 m1 0 1 0 M = = . 0 1 0 m1 N =
166
7 Führungs- und Störverhalten von Mehrgrößensystemen
Die Berechnung der Rückführmatrizen K x und K ζ mittels Minimierung eines quadratischen Integralkriteriums ergibt mit den Wichtungsmatrizen Q(4,4) = 10 Q = 05 außer Q(5,5) = 1 und
R = I2 =
1 0 0 1
die folgenden Werte der Rückführmatrizen K x und K ζ : 1,6391 2,4092 −1,6203 Kx = 0,2969 0,0752 1,0029 und
Kζ =
−3,0153 0,3013 −0,9527 −0,9535
.
Damit resultiert dann das in Abb. 7.15 gezeigte Einschwingverhalten des Systems auf die Sollwerte 1 und 2. Der Vergleich dieses Einschwingverlaufs mit Abb. 7.6 zeigt ein ähnliches Einschwingen der Ausgangsgrößen. 3.5 y2 (t)
3
y (t) 6
2.5 2 1.5 y1 (t)
1 0.5 0
0
0.5
1
1.5
2
2.5
-
3
3.5
4
4.5
5
t/s
Abbildung 7.15: Verlauf der Sprungantwort der Ausgangsgrößen yi des Systems Modellfolgeregelung und Zustandsschätzung. Im Fall der Nichtmessbarkeit der Zustandsgrößen muss für die Ermittlung des Zustandsvektors ein Zustandsbeobachter eingesetzt werden. Dann resultiert als Struktur des Modellfolgereglers mit Beobachter die in Abb. 7.16 gezeigte Struktur. Aufgabe 7.3 System 4. Ordnung: Gegeben sind die Systemmatrizen von Aufgabe 7.2 für ein System 4. Ordnung.
7.3 Modellfolgeregler – Servo-Kompensator
Modellfolgeregler Führungsmodell x˙ M = AM xM wM ge wM = C M xM –
167
Regelstrecke
Kompensator ζ˙ =N ζ +M e
Kζ
–g u –
x˙ = Ax + Bu y(t) y = Cx
Kx x ˆ x ˆ˙ = Aˆ x + Bu + L(y − yˆ) y ˆ = Cx ˆ Beobachter
Abbildung 7.16: Struktur des Modellfolgereglers mit Kompensator und Beobachter 1. Berechnen Sie die Rückführmatrizen K x und K ζ für die konstanten Sollwerte wm (1) = 1 und wm (2) = 2 und die Wichtungsmatrizen Q = I 6 außer Q(5,5) = 8 und Q(6,6) = 40 sowie R = I 2 . 2. Berechnen Sie die Eigenwerte des geschlossenen Regelkreises. 3. Erstellen Sie ein Simulationsprogramm in MATLAB zur Ermittlung des Einschwingverhaltens der Regelgrößen y1 (t) und y2 (t). 4. Stellen Sie das Einschwingverhalten von y(t) grafisch dar. Lösung:
1,0311 0,9157 2,5760 −0,6595 1. K x = 0,2978 −2,0262 −0,4316 0,8146 −1,8733 −4,7386 Kζ = −2,1192 4,1888
2. λ = [−3,9459 ± 4,3484j; −0,7271; −4,6887; −4,9197; −2,2273] 3.
t=0:0.05:5; a=[-2 -1 0 3;1 -4 0 1;2 -1 -1 0;1 0 -3 -2]; b=[2 1;0 -1;3 0;1 0]; c=[1 -1 2 0;0 2 1 -1]; am=0; n=[am 0;0 am]; cm=[1;2]; m=eye(2); a0=[a zeros(4,2);-m*c n]; b0=[b;zeros(2)]; q=eye(6); r=eye(2); q(5,5)=8; q(6,6)=40; [k,s,e]=lqr(a0,b0,q,r);
168
7 Führungs- und Störverhalten von Mehrgrößensystemen sys1=ss(am,0,cm,[0;0]); [wm,t,xm]=initial(sys1,1,t) asim=a0-b0*k; bsim=[zeros(4,2);m]; lsim(asim,bsim,[c zeros(2)],zeros(2),wm,t); return;
4. 2
y (t) 6
y2 (t)
1.5
y1 (t)
1
0.5
0
0
0.5
1
1.5
2
2.5
-
3
3.5
4
4.5
5
t/s
Abbildung 7.17: Einschwingverlauf von y(t)
7.4
Störgrößenaufschaltung
Modellierung konstanter Störgrößen. Bei den bisher in diesem Kapitel untersuchten Reglerstrukturen wurde das Auftreten von Störgrößen im Regelkreis nicht explizit berücksichtigt. Dies soll nun in diesem Abschnitt nachgeholt werden. Man beschreibt die Störgrößen z(t) üblicherweise durch ein dynamisches Störgrößenmodell in Form der Zustandsdarstellung wie folgt v˙ = V · v z = Z ·v .
mit
v(0) = v 0
gegeben,
(7.28) (7.29)
Mit dieser Beschreibung kann man sowohl konstante als auch zeitveränderliche Störungen modellieren. Diese Störgrößen wirken über die Matrix E auf das Mehrgrößensystem ein x˙ = A · x + B · u + E · z y = C ·x .
(7.30) (7.31)
7.4 Störgrößenaufschaltung
169
Störgrößenbeobachter. Da die Störgrößen im Allgemeinen nicht messbar sind, werden sie über einen Störgrößenbeobachter geschätzt. Ein derartiger Störgrößenbeobachter ist wie ein normaler Zustandsbeobachter aufgebaut. Da meist auch der Zustandsvektor nicht direkt gemessen werden kann, konstruiert man einen kombinierten Zustandsund Störgrößenbeobachter. Bei dieser Konstruktion des Beobachters werden die Matrizen der Störgrößen V , Z und die Matrix E als bekannt angenommen. Allein der Anfangszustand des Zustandsvektors v 0 ist unbekannt. Die Zustandsgleichungen des Systems (Gleichungen 7.30 und 7.31) und die Zustandsgleichungen der Störgrößen (Gleichungen 7.28 und 7.29) werden mittels Zustandsvektorerweiterung zusammengefasst x˙ A EZ x B = · + ·u . (7.32) v˙ 0 V v 0 Danach wird dann für diese Darstellung der kombinierte Beobachter nach der Methode von Kapitel 6 konstruiert. Dies soll wieder an einem Beispiel demonstriert werden. Beispiel 7.7 System 3. Ordnung: Gegeben sei das System 3. Ordnung von Beispiel 7.1 in Zustandsdarstellung zu ⎡
⎤ ⎡ ⎤ ⎡ ⎤ 0 1 2 2 1 1 0 x˙ = ⎣ −2 −3 0 ⎦ · x + ⎣ 0 2 ⎦ · u + ⎣ 2 3 ⎦ · z −2 0 −1 1 3 0 2 ⎡ ⎤ 0 1 2 −1 y = ·x und x(0) = ⎣ 0 ⎦ . 2 −1 3 0
Das Störgrößenmodell lautet 0 0 v˙ = ·v 0 0 mit v(0) =
1 1,5
und
z=
0,2 0 ·v 0 0,3
(7.33)
.
Es wirkt somit eine konstante Störung z1 = 0,2 · v1 (0) = 0,2 und z2 = 0,3 · v2 (0) = 0,45 auf das System. Die Aufgabe des kombinierten Zustands- und Störgrößenbeobachters besteht in der Ermittlung der Zustände x ˆ und v ˆ. Infolge der konstanten Störgrößen schwingt das System auf den konstanten Endwert x(∞) = −A−1 · E · Z · v(0) = [0,5536 0,2143 − 0,2071]
T
ein.
170
7 Führungs- und Störverhalten von Mehrgrößensystemen
Mit den obigen Systemparametern kann man mit den Methoden von Kapitel 5 für die Gewichtsmatrizen Q = I 5 und R = 0,1 ∗ I 2 die folgende Rückführmatrix L des Beobachters ermitteln: ⎡
1,5466 ⎢ 1,9474 ⎢ L = ⎢ −0,7279 ⎣ 2,7855 1,4970
⎤ 1,1393 0,6764 ⎥ ⎥ 3,5300 ⎥ . −1,4970 ⎦ 2,7855
Die Simulation der Zeitverläufe des Systems zeigt, dass nach ca. 6 bis 8 s die Schätzwerte des Beobachters auf die Werte der Zustandsgrößen x(t) und die Zustände der konstanten Störung v(t) = v(0) eingeschwungen sind (Abb. 7.18).
2 v1 (t) v1 ,ˆ
1.5 x,v (t)
6
v2 (t) v2 ,ˆ
1 x1 ,ˆ x1 (t)
0.5 x2 ,ˆ x2 (t)
0 −0.5
x3 ,ˆ x3 (t)
0
1
2
3
-
4
5
6
t/s
Abbildung 7.18: Verlauf der wahren (fette Linien) und geschätzten Zustandsgrößen des Systems und der Störung; Anfangszustände: x "i (0) = v"i (0) = 0,5
Schätzung zeitveränderlicher Störgrößen. Auch für zeitveränderliche Störgrößen kann der Störgrößenbeobachter eingesetzt werden. Es sollen beispielhaft für dasselbe Mehrgrößensystem wie in Beispiel 7.7 die Zustände von sinusförmig auf ein Mehrgrößensystem einwirkenden Störgrößen geschätzt werden. Hierzu ist zunächst das Modell sinusförmiger Störgrößen zu entwickeln. Das folgende Störgrößenmodell erzeugt zwei √ sinusförmige Störgrößen mit den unterschiedlichen Frequenzen ω1 = 1 s−1 und ω2 = 2 s−1 . ⎡
0 ⎢ −1 v˙ = ⎣ 0 0
1 0 0 0
0 0 0 −2
⎤ 0 0⎥ ·v 1⎦ 0
und
z=
0 1 0 0 ·v 0 0 0 1
(7.34)
7.4 Störgrößenaufschaltung
171
⎡
⎤ −1 ⎢ 0 ⎥ mit v(0) = ⎣ . Für die Gewichtsmatrizen Q = I 7 und R = 0,1 · I 2 resultiert die −1 ⎦ 0 folgende Rückführmatrix des Beobachters: ⎤ ⎡ 2,0519 0,5214 ⎢ 3,0605 2,1142 ⎥ ⎥ ⎢ ⎢ −0,4318 5,0019 ⎥ ⎥ ⎢ L = ⎢ −1,0926 0,0920 ⎥ . ⎢ 3,7946 −2,0973 ⎥ ⎥ ⎢ ⎣ −1,3114 −0,7478 ⎦ 2,1952 4,5413 Die anschließende Simulation zeigt, dass nach ca. 2 bis 3 s die Zustände des Beobachters auf die wahren Werte der Systemzustände x1 (t) bis x3 (t) und die Störzustände v1 (t) und v2 (t) eingeschwungen sind (Abb. 7.19). 3 2
x,v (t) 1 6
v1 (t) v1 ,ˆ v2 ,ˆ v2 (t)
0 x2 (t) x2 ,ˆ
−1 −2 −3
x3 ,ˆ x3 (t)
0
1
2
x1 ,ˆ x1 (t)
3
-
4
5
6
t/s
Abbildung 7.19: Verlauf der wahren (fette Linien) und geschätzten Zustandsgrößen des Systems und der Störung (Anfangszustände x "i (0) = v"i (0) = 0,5) Zustandsschätzung ohne Störgrößenmodellierung und -schätzung. Wenn man keine Modellierung der auf das System einwirkenden Störgrößen vornimmt, so konvergiert die Schätzung der Zustandsvariablen nicht. Der Schätzfehler geht nicht gegen Null. Dies wird wieder an dem Beipiel 3. Ordnung gezeigt. Es wird nur ein Beobachter für das System 3. Ordnung entworfen, die einwirkenden Störgrößen werden nicht modelliert. Für die Systemdaten von Beispiel 7.7 und die Gewichtsmatrizen Q = I 3 und R = 0,1 · I 2 resultiert die Beobachtermatrix L zu: ⎡ ⎤ 1,4851 1,3314 L = ⎣ 1,5794 0,1805 ⎦ . −0,9166 3,0514 Das Zeitverhalten der wahren und der geschätzten Zustandsgrößen zeigt Abb. 7.20.
172
7 Führungs- und Störverhalten von Mehrgrößensystemen
3 2 x,x 1 6
0 −1 −2 −3
0
1
2
3
4
5
-
6
7
8
9
10
t/s
Abbildung 7.20: Verlauf der wahren (fette Linien) und geschätzten Zustandsgrößen des Systems (Anfangszustände x "i (0) = 0,5); Keine Konvergenz! Störgrößenkompensation und Zustandsrückführung. Wirkt eine (konstante oder dynamische) Störgröße auf das zu regelnde System, so kann man einen Kompensator so auslegen, dass er zugleich für die Sollwertfolge und den Störungsausgleich sorgt. Dies soll zunächst für den Fall der direkten Messbarkeit der Zustandsgrößen gezeigt werden. Die Struktur der Mehrgrößenregelung mit Störmodell, Führungsmodell und Kompensator zeigt Abb. 7.21. Das Problem beim Entwurf einer derartigen Störgrößenkompensation liegt in der Ermittlung der Parameter des Kompensators. Nach Davison und Goldenberg [16] muss die Dynamikmatrix N des Kompensators wenigstens s-mal die gemeinsamen und s-mal die unterschiedlichen Eigenwerte der Matrizen V und Am enthalten mit s als Zahl der Ausgangsgrößen. Außerdem muss das Paar (N , M ) vollständig steuerbar sein. Störmodell Führungsmodell x˙ M =AM xM w M =C M x M
wM
v˙ =V v z =Zv z
Kompensator e g –
ζ˙ =N ζ +M e
Kζ
– gu –
Regelstrecke x˙ =Ax+Bu+Ez y =Cx
y(t)
x Kx
Abbildung 7.21: Systemstruktur mit Störmodell und Zustandsvektorrückführung Der Entwurf dieser Mehrgrößenregelung soll an einem Beispiel demonstriert werden.
7.4 Störgrößenaufschaltung
173
Beispiel 7.8 System 3. Ordnung: Gegeben sei das System 3. Ordnung von Beispiel 6.2 in Zustandsdarstellung zu ⎤ ⎤ ⎡ ⎤ ⎡ 1 0 2 1 0 1 2 x˙ = ⎣ −2 −3 0 ⎦ · x + ⎣ 0 2 ⎦ · u + ⎣ 2 3 ⎦ · z 0 2 1 3 −2 0 −1 ⎡ ⎤ 0 1 2 −1 y = ·x und x(0) = ⎣ 0 ⎦ . 2 −1 3 0 ⎡
Die Gleichungen des Störmodells lauten für zwei √ sinusförmige Störgrößen mit den unterschiedlichen Frequenzen ω1 = 1 s−1 und ω2 = 2 s−1 . ⎡
0 ⎢ −1 v˙ = ⎣ 0 0
1 0 0 0
0 0 0 −2
⎤ 0 0⎥ ·v =V ·v 1⎦ 0
und z =
0 0
0,1 0
0 0 ·v = Z ·v 0 0,1
mit v(0) = [−1 0 − 1 0]T . Die Ausgangsgrößen y sollen im eingeschwungenen Zustand die konstanten Sollwerte wM,1 = 1 und wM,2 = 2 erreichen. Damit lautet das Führungsgrößenmodell dann x˙ M = AM · xM = [ 0 ] · xM 1 w M = C M · xM = · xM . 2
mit
xM (0) = xM,0 = 1
(7.35) (7.36)
Mit diesen Führungs- und Störmodellen kann man die Dynamikmatrix des Kompensators wie folgt ansetzen4 : N = Diag(AM , AM , V , V ) . Die Eingangsmatrix M muss zum einen die Steuerbarkeit des Kompensators gewährleisten und zum anderen über eine geeignete Gewichtung des Regelfehlers e(t) = wm (t) − y(t) die Stör- und Führungsmodelle im Kompensator hinreichend anregen. Im betrachteten Beispiel erfüllt nach einigen Versuchen die Matrix M mit folgenden Zahlenwerten M = 1000 · 4
1 0 1 −2 2 6 −3 −4 4 9 0 2 0 −3 0 −5 0 3 0 −9
T
Unter der Bezeichung Diag(A1 , A2 , . . . , An ) wird eine Diagonalmatrix verstanden, die auf der Hauptdiagonalen die Matrizen A1 bis An und sonst nur Nullen enthält.
174
7 Führungs- und Störverhalten von Mehrgrößensystemen
die geforderten Bedingungen. Zur Ermittlung der Rückführmatrizen K x und K ζ nach dem Verfahren des quadratischen Reglerproblems wählt man die Gewichtsmatrizen ⎧ ⎨ Q(4,4) = 200 Q(5,5) = 1000 Q = I 13 außer ⎩ Q(7,7) = 400 und R = I 2 sowie die Dynamik- und Eingangsmatrizen A 0 ˜= ˜= B . A und B −M C N 0 Damit erhält man dann die Rückführmatrizen K x und K ζ zu
1,0638 2,5942 −2,0635 K x = 1000 · −0,9083 −2,3142 1,8785
und Kζ = #
−14,1024 −2,3702 1,7145 16,0342 −1,3779 −0,7315 0,2106 0,8116 0,0609 −0,1171 1,0600 −31,5338 11,0984 4,2179 −0,0492 0,1198 −1,1124 −0,2439 1,7230 −0,0106
$ .
Mit den so berechneten Zahlenwerten resultiert der in Abb. 7.22 gezeigte Einschwingverlauf der Ausgangsgrößen auf die geforderten konstanten Sollwerte. Nach ca. 7 s sind die Ausgangsgrößen auf die Sollwerte eingeschwungen. Die nach 10 s einsetzenden sinusförmigen Störungen werden durch den Kompensator nahezu vollkommen unterdrückt. 2.5 y2 (t)
2
y ,z (t) 1.5 6
y1 (t)
1 0.5
z1 ,z2 (t)
0 −0.5
0
5
10
15
-
20
25
30
t/s
Abbildung 7.22: Einschwingvorgang der Ausgangsgrößen auf die Sollwerte und Verlauf der sinusförmigen Störgrößen mit Störgrößenschätzung und -kompensation Ohne diese Störgrößenschätzung und -kompensation würden sich die sinusförmigen Störungen, wie Abb. 7.23 zeigt, speziell auf den Ausgang y1 (t) stark auswirken. Die Aus-
7.4 Störgrößenaufschaltung
175
wirkung auf den Ausgang y2 (t) ist deutlich geringer. Der Einschwingvorgang auf die Sollwerte ist nach ca. 4 Sekunden abgeschlossen. 2.5 y2 (t)
2
y ,z (t) 1.5 6
y1 (t)
1 0.5
z1 ,z2 (t)
0 −0.5
0
5
10
15
-
20
25
30
t/s
Abbildung 7.23: Einschwingvorgang der Ausgangsgrößen auf die Sollwerte und Verlauf der sinusförmigen Störgrößen ohne Störgrößenschätzung und -kompensation Bei dieser Auslegung wurden die folgenden Matrizen gewählt: 1 0 N = Diag(AM , AM ) und M= 0 2 sowie Q = I5
außer
Q(4,4) = 200 Q(5,5) = 1000
und R = I 2 . Es resultierten dann die folgenden Rückführmatrizen: 9,1716 8,1682 −2,8966 Kx = 1,1094 −9,5156 14,5995 und Kζ =
−11,7510 −17,5947 7,8686 −26,2759
.
Störgrößenkompensation und Zustandsbeobachter. Im Fall der Nichtmessbarkeit der Zustandsgrößen müssen Zustandsbeobachter zur Schätzung des Zustandsvektors eingesetzt werden. Diese Zustandsbeobachter müssen sowohl die Schätzung der Zustände der Regelstrecke als auch des Störmodells durchführen. Der geschätze Zustand des
176
7 Führungs- und Störverhalten von Mehrgrößensystemen Störmodell
Modellfolgeregler Führungsmodell wM x˙ =A x M
M
M
w M =C M x M
z
v˙ =V v z =Zv
Regelstrecke
Kompensator e g –
ζ˙ =N ζ +M e
Zustandsbeobachter
–g u
Kζ
x˙ =Ax+Bu+Ez y =Cx
y(t)
– Kx
x ˆ
x ˆ˙ =Aˆ x+Bu+E zˆ+Lx (y −y ˆ) yˆ=C x ˆ zˆ v ˆ˙ =V v ˆ+Lz (y −y ˆ) zˆ=Z v ˆ
yˆ y
Störgrößenbeobachter
Abbildung 7.24: Modellfolgeregler mit Zustands- und Störgrößenbeobachter und dynamischem Kompensator
Störmodells ist dann Eingangsgröße in den Beobachter für die Zustandsschätzung der Regelstrecke. Abb. 7.24 zeigt die Struktur eines derartigen Mehrgrößenreglers. Damit die Konvergenz der Beobachter hinreichend schnell ist, empfiehlt sich die Vorgabe eines Stabilitätsgrades (siehe Abschnitt 5.2) wie beim quadratischen Reglerproblem. Zur Verdeutlichung der Vorgehensweise wird das Beispiel 7.8 nun mit Zustands- und Störgrößenbeobachter untersucht.
Beispiel 7.9 System 3. Ordnung: Gegeben seien die Daten des Systems von Beispiel 7.8. Die dort berechneten Rückführmatrizen K x und K ζ bleiben unverändert erhalten. Neu zu berechnen sind die Rückführmatrizen Lz und Lx der beiden Beobachter. Wählt man die jeweiligen Gewichtsmatrizen Q und R als Einheitsmatrizen, dann resultieren die nachfolgenden Rückführmatrizen bei einem vorgeschriebenen Stabilitätsgrad des Beobachters von „−1“. Dieser Stabilitätsgrad gewährleistet, dass die Pole der Beobachter
7.4 Störgrößenaufschaltung
177
einen Realteil kleiner −1 aufweisen. Es lauten ⎡ ⎤ 3,2348 −1,1000 Lx = ⎣ 2,8724 3,7894 ⎦ −1,6088 7,7078 und ⎡
−49,0058 ⎢ 87,5307 Lz = ⎣ −14,0580 −4,7056
⎤ 70,2481 −91,0649 ⎥ . −18,5074 ⎦ 97,8465
Für diese Zahlenwerte resultiert dann das in Abb. 7.25 gezeigte Einschwingverhalten der Ausgangsgrößen. 2.5 y2 (t)
2
y ,z (t) 1.5 6
y1 (t)
1 0.5
z1 ,z2 (t)
0 −0.5
0
5
10
15
-
20
25
30
t/s
Abbildung 7.25: Einschwingvorgang der Ausgangsgrößen auf die Sollwerte und Verlauf der sinusförmigen Störgrößen Nur bei genauem Hinschauen sind geringe Unterschiede zwischen den Verläufen von Abb. 7.22 und 7.25 festzustellen. Dieser Nachweis einer Mehrgrößenregelung mit Zustands- und Störgrößenbeobachter und dynamischem Kompensator zur Sollwertfolge und Störungskompensation wird erreicht mit einem Mehrgrößenregler von relativ hoher Ordnung. Für die Systemordnung n = 3 und ein Störmodell von der Ordnung vier ist bei zwei Ausgangsgrößen yi der gesamte Mehrgrößenregler von der Ordnung 17. Die Beobachter haben die Ordnung drei bzw. vier, und der dynamische Kompensator hat die Ordnung 10. Beispiel 7.10 Hydraulik-Kaskade: Als weiteres Beispiel wird wieder die HydraulikKaskade von Beispiel 2.1 untersucht. Die Dynamik- und Messgleichung der Hydraulik-Kaskade lauten entsprechend Beispiel 2.5. Die Regelgrößen h1 (t) und h3 (t) sollen in ca. 100 s monoton gegen die Endwerte 3 bzw. 2 gehen. Dies wird erreicht durch Vorgabe der Modellmatrizen AM , C M und xM,0 wie
178
7 Führungs- und Störverhalten von Mehrgrößensystemen
in Beispiel 7.6 auf Seite 164. Daher ergeben sich dann auch die Rückführmatrizen K x und K ζ wie in Beispiel 7.6. Für den Zustands- und Störgrößenbeobachter lauten die Modellgleichungen
x˙ v˙
=
A EZ 0 V
x x B · + · u und y = C 0 · . v 0 v
Die Matrizen A, B, C sind die bekannten Systemmatrizen der Hydraulik-Kaskade. Die Matrix des Störeingangs lautet: ⎡
⎤ 0 0 ⎦ 0 E = ⎣ −0,1 0 −0,0833 und die Matrizen des Störmodells für die konstanten (unbekannten) Störgrößen (Abflüsse) Q2ab = 3 hl/s und Q3ab = 2 hl/s sind V = 02
und
Z = I2
mit dem willkürlichen Anfangswert v1,0 = v2,0 = 0,5. Mit den Verfahren der Polfestlegung von Kapitel 4 und 6 werden dann die Rückführmatrizen Lx und Lz der Beobachter entworfen. Um ein schnelles Einschwingen der Beobachter auf die Zustände zu gewährleisten, werden die Pole auf die Positionen λ = [−1 − 1,1 − 1,2 − 1,3 − 1,4 ] verschoben. Dann resultieren die Zahlenwerte der Rückführmatrizen zu ⎡
⎤ 2,9846 0,4368 Lx = ⎣ 23,8564 7,6782 ⎦ 0,4717 2,6070
und Lz =
−101,9799 −48,6567 11,4596 −17,1477
.
Für die Systemstruktur nach Abb. 7.24 resultiert dann ein Einschwingverlauf der Regelgrößen h1 (t) und h3 (t) wie in Abb. 7.26 gezeigt. Dabei ist eingearbeitet, dass die Zustands- und Störgrößenbeobachter nur positive Zuflüsse und Abflüsse schätzen können. Die Abweichungen zwischen den Regelgrößen der Beispiele 7.6 und 7.10 sind sehr gering. Dies ist darauf zurückzuführen, dass Zustands- und Störgrößenbeobachter aufgrund der gewählten Pollagen schnell einschwingen. Damit ist dann kaum ein Unterschied zwischen der Rückführung des geschätzen und des (nicht verfügbaren) wahren Zustands festzustellen.
7.5 Abschließendes Eingrößenbeispiel
4
179
u1 (t)
3.5
h(t), u(t) 3
6
u2 (t)
2.5
h1 , ˆ h1
2
h3 , ˆ h3
1.5 1
h2 (t)
0.5 0
0
10
20
30
40
50
-
60
70
80
90
100
t/s
Abbildung 7.26: Modellfolgeverlauf der Regelgrößen (h1 , h3 ) sowie der Verlauf der Stellsignale (u1 , u2 ) und des nicht messbaren Zustands (h2 ); Modellverläufe nicht fett gezeichnet
7.5
Abschließendes Eingrößenbeispiel
Zur Vorbereitung für den in Kapitel 8 untersuchten Entwurf von Zustandsreglern im Frequenzbereich soll nun eine Gesamtstruktur, bestehend aus Vorfilter (siehe Kap. 7.1), reduziertem Beobachter (Kap. 6.3) und Zustandsrückführung (Kap. 4) berechnet werden. Strecke. Als Regelstrecke dient ein ungedämpfter Schwinger mit der Zustandsdarstellung A =
0 1 −4 0
0 b= 4
cT = 1 0 .
Für die Streckenübertragungsfunktion gilt
T
−1
FS (s) = c (sI − A)
s −1 −1 0 4 . b= 1 0 = 2 4 s 4 s +4
Reglerentwurf. Für den reduzierten Beobachter nach Kapitel 6.3 wird die Ordnung n − s = 1 benötigt (siehe Seite 137 und [26]). Der Beobachterpol soll bei −2 liegen. Dann lautet das charakteristische Polynom Δ(s) des Beobachters Δ(s) = Det(sI − F ) = s + 2
(7.37)
180
7 Führungs- und Störverhalten von Mehrgrößensystemen
und für seine Dynamikmatrix gilt F = −2. Die Matrix T = tT = t1 t2 ergibt sich für ein willkürlich gewähltes H = h = 1 gemäß der Gleichung (siehe auch 6.30) T A − F T = H cT 0 1 t1 t 2 − (−2) t1 t2 = 1 0 −4 0 −4t2 t1 + 2t1 2t2 = 1 0
zu
(7.38)
und daraus folgt 2t1 − 4t2 = 1 t1 + 2t2 = 0. Die Lösung dieses linearen Gleichungssystems ergibt t1 = resultiert T = tT = t1 t2 = 14 − 81 .
1 4
und t2 = − 18 und somit
Unter Verwendung einer allgemeinen Zustandsrückführung kT = k1 k2 errechnet ˜ (s) der geregelten Strecke (d.h. der Strecke mit sich das charakteristische Polynom N Zustandsrückführung) zu T ˜ N (s) = Det(sI − A + bk ) =
s −1 = s2 + 4k2 s + 4k1 + 4. 4k1 + 4 s + 4k2
In diesem Beispiel sollen die beiden Eigenwerte der geregelten Strecke bei −2 liegen, so dass als charakteristisches Polynom ˜ (s) = (s + 2)2 = s2 + 4s + 4 N
(7.39)
vorgegeben wird. Durch einen Koeffizientenvergleich der beiden Gleichungen folgt daraus für die Zustandsrückführung kT = 0 1 . Für ein stationär genaues Führungsverhalten wird ein skalares Vorfilter V benötigt, das sich gemäß Gleichung (7.2) berechnen läßt. * −1 +−1 b V = − cT A − b k T , −1 -−1 0 1 0 1 0 = − =1 −4 −4 4
7.5 Abschließendes Eingrößenbeispiel
w(t) -
V
Regelstrecke u(t) - g - b 6
181
x(t) ˙ g . . . dt +
x(t)
y(t) -
cT
A
u˜(t) Zustandsbeobachter
- tT · b
h
˙ zˆ(t) gzˆ(t) . . . dt + F
Zustandsrückführung
kT
y(t)
-
"(t) z
cT tT
−1 x ˆ(t)
Zustandsregler
Abbildung 7.27: Struktur des Gesamtsystems mit Beobachter reduzierter Ordnung, Zustandsrückführung und Vorfilter Abbildung 7.27 zeigt die Struktur des Gesamtsystems. Umformung. Der ordnungsreduzierte Beobachter und die Zustandsrückführung zusammen bilden den Zustandsregler. Im betrachteten Fall der Eingrößenregelstrecke kann der Zustandsregler nach Laplace-Transformation im Frequenzbereich durch die zwei Übertragungsfunktionen FU (s) =
˜1 (s) U U (s)
und FY (s) =
˜2 (s) U Y (s)
˜ (s) = U ˜1 (s) + U ˜2 (s) sowie U
beschrieben werden (Abbildung 7.28). ˜ (s) ergibt sich folgendermaßen aus den Matrizen des GeDie rückgeführte Stellgröße U samtsystems ˜ (s) = U
kT
cT tT
−1 Y (s) · ˆ Z(s)
(7.40)
wobei gilt U (s) ˆ Z(s) = (sI − F )−1 tT · b h . Y (s)
(7.41)
182
7 Führungs- und Störverhalten von Mehrgrößensystemen W (s) -
- j 6 ˜ (s) U ˜ (s) U j 1
V
U (s)
- FS (s)
Y (s)
-
FU (s)
6 ˜2 (s) U
FY (s) Zustandsregler
Abbildung 7.28: Zweischleifige Struktur der Zustandsregelung Gleichung (7.41) in (7.40) eingesetzt resultiert dann zu −1 0 1 1 0 U (s) · · Y (s) 0 (sI − F )−1 tT · b h 1 0 1 0 0 1 U (s) · = 0 1 · 1 0 s+2 Y (s) 2 −8 − 21 1 2s − 4 4 U (s) + Y (s) = s+2 s+2 = FU (s) U (s) + FY (s) Y (s).
˜ (s) = U
kT
cT tT
Die beiden Übertragungsfunktionen FU (s) und FY (s) beschreiben in der zweischleifigen Struktur in Abbildung 7.28 den Zustandsregler. Beiden gemeinsam ist der durch das charakteristische Polynom Δ(s) des Beobachters vorgegebene Nenner. Ihre Zähler ZU (s) bzw. ZR (s) werden gemäß FU (s) =
4 ZU (s) = Δ(s) s+2
FY (s) =
2s − 4 ZR (s) = Δ(s) s+2
abgelesen zu 4 bzw. 2s − 4. Im nächsten Kapitel wird gezeigt, wie die beiden Übertragungsfunktionen FU (s) und FY (s) des Zustandsreglers auf einfache Weise direkt aus der Streckenübertragungsfunktion und den Polvorgaben für den Beobachter und die zustandsgeregelte Strecke berechnet werden können. Dieses Verfahren wird Frequenzbereichsentwurf von Zustandsreglern genannt.
8
Zustandsreglerentwurf im Frequenzbereich
Für den Fall der Eingrößen-Regelstrecke können der Beobachter und die Zustandsrückführung gemeinsam im Frequenzbereich durch zwei Übertragungsfunktionen FU (s) und FY (s) ausgedrückt werden, wie im Kapitel 7.5 gezeigt. Diese beiden Übertragungsfunktionen des Zustandsreglers lassen sich auf einfache Weise auch direkt aus der Streckenübertragungsfunktion und den Polvorgaben berechnen. Der sogenannte Frequenzbereichsentwurf von Zustandsreglern ist zwar ebenso langjährig bekannt wie der zuvor behandelte Zeitbereichsentwurf, jedoch trotz seiner Vorteile nahezu in Vergessenheit geraten. In der neueren Literatur findet sich der Frequenzbereichsentwurf bei Hippe und Wurmthaler [28], [29]. Da diese Entwurfsmethode keine explizite Zustandsdarstellung erfordert, kann der Frequenzbereichsentwurf weitestgehend basierend auf Kenntnissen der klassischen Regelungstechnik vermittelt werden. Hier wird lediglich der Eingrößenfall betrachtet. Eine Erweiterung auf den Fall von Mehrgrößenstrecken ist aber unter Verwendung von Polynommatrizen möglich [29].
8.1
Aufstellen der Entwurfsgleichung
Problemstellung. Ausgangspunkt für die Herleitung der Entwurfsgleichung ist die charakteristische Gleichung des Zustandsregelkreises. Abbildung 8.1 zeigt oben die in Abschnitt 7.5 eingeführte zweischleifige Struktur (siehe Abb. 7.28) und unten eine durch Blockschaltbildumformung gefundene äquivalente einschleifige Struktur. Mit Z(s) wird hier eine am Streckeneingang wirkende Störung bezeichnet. Offenbar kann der Zustandsregelkreis hier als klassischer Regelkreis mit zusätzlichem Vorfilter aufgefasst werden. Die charakteristische Gleichung des Regelkreises lautet 1 + FR (s) · FS (s) = 1 +
ZR (s) ZS (s) · = 0, NR (s) NS (s)
wobei ZR (s) bzw. ZS (s) das Zählerpolynom des Reglers bzw. der Strecke bezeichnen und NR (s) bzw. NS (s) das jeweilige Nennerpolynom. Nach Multiplikation mit NR (s)·NS (s) erhält man das charakteristische Polynom C(s) = ZR (s)ZS (s) + NR (s)NS (s) des Regelkreises. Kennzeichnend für die Zustandsregelung ist, dass dieses charakteristische Polynom frei vorgegeben werden kann. Es setzt sich gemäß dem Separationsprinzip
184
8 Zustandsreglerentwurf im Frequenzbereich Z(s) W (s) -
V
- j 6
U (s)
? - j- FS =
j FU = 6
ZU Δ
FY =
ZR Δ
ZS NS
Y (s) -
Z(s) W (s) - V
Δ ZR
- j - FR = 6
ZR NR
U (s) ? - j- FS =
ZS NS
Y (s) -
mit NR = ZU + Δ
Abbildung 8.1: Zweischleifige Struktur der Zustandsregelung (oben) und einschleifige Struktur (unten) nach Gleichung (6.31) auf Seite 145 in der Form ˜ (s) · Δ(s) C(s) = N aus den charakteristischen Polynomen ˜ (s) der Strecke mit Zustandsrückführung und • N • Δ(s) des ordnungsreduzierten Beobachters zusammen. Aus beiden Gleichungen ergibt sich ˜ (s) · Δ(s) ZR (s)ZS (s) + NR (s)NS (s) = N
(8.1)
als Entwurfsgleichung für den Zustandsregler im Frequenzbereich. Letztlich liefert also das Separationstheorem von Kap. 6.4 die Grundlage für den Zustandsreglerentwurf im Frequenzbereich.
8.1 Aufstellen der Entwurfsgleichung
185
Lösung der Entwurfsgleichung. Für die Lösung der Entwurfsgleichung werden das Zähler- und Nennerpolynom der Strecke als gegeben angenommen. Weiterhin muss mit ˜ (s) · Δ(s) ein stabiles charakteristisches Polynom für die geregelte Strecke und C(s) = N den Beobachter vorgegeben werden. Die unbekannten Zähler- und Nennerkoeffizienten des Reglers in den Polynomen ZR (s) und NR (s) können dann durch einen Koeffizientenvergleich zwischen der linken und rechten Seite der Gleichung (8.1) bestimmt werden. Voraussetzungen für die eindeutige Lösbarkeit der Entwurfsgleichung. Da der Zustandsregler sowohl eine Zustandsrückführung wie auch einen Beobachter enthält, muss erstens die Strecke sowohl vollständig steuerbar als auch vollständig beobachtbar sein. An der Übertragungsfunktion der Strecke äußert sich das dadurch, dass keine Pol-/Nullstellen-Kürzungen auftreten. Eine zweite Voraussetzung für die Lösbarkeit betrifft die Ordnung der beiden Vorgabe˜ (s) und Δ(s). Nur bei Wahl einer ausreichenden Ordnung der Vorgabepopolynome N lynome bzw. ausreichender Reglerordnung ist eine freie Polvorgabe möglich. Geht man von einer Strecke der Ordnung n mit der Übertragungsfunktion FS (s) =
bm sm + bm−1 sm−1 + ... + b1 s + b0 ZS (s) = NS (s) sn + an−1 sn−1 + ... + a1 s + a0
und einem Regler mit FR (s) =
dn snR + dnR −1 snR −1 + ... + d1 s + d0 ZR (s) = RnR NR (s) s + cnR −1 snR −1 + ... + c1 s + c0
(8.2)
mit der Reglerordnung nR aus, so ergeben sich in der Entwurfsgleichung folgende Polynomordnungen: ˜ (s) Δ(s) ZR (s) ZS (s) + NR (s) NS (s) = N m nR n n nR (Polynomordnung) nR
(8.3)
˜ (s) der Strecke mit Zustandsrückführung muß die Ordnung n Das Vorgabepolynom N der Strecke besitzen und das charakteristische Polynom Δ(s) des Beobachters die zu bestimmende Reglerordnung nR . Der Koeffizientenvergleich zwischen linker und rechter Seite der Entwurfsgleichung liefert für den hier betrachteten Fall m < n dann n + nR Gleichungen zur Bestimmung der unbekannten Reglerkoeffizienten, da der Vorfaktor bei der höchsten s-Potenz auf der linken und rechten Seite von Gleichung 8.3 jeweils gleich Eins ist. Da der Regler nach Gleichung 8.2 nun 2nR + 1 Koeffizienten besitzt, ist die Entwurfsgleichung eindeutig lösbar, wenn die Anzahl der Unbekannten (also 2nR + 1) mit der Anzahl der Gleichungen (also n + nR ) übereinstimmt, wenn also gilt 2nR + 1 = n + nR oder aufgelöst nR = n − 1.
(8.4)
186
8 Zustandsreglerentwurf im Frequenzbereich
Für eine freie Polvorgabe im Regelkreis ist also mindestens die Reglerordnung nR = n−1 anzusetzen. Diese entspricht der Ordnung n − s des reduzierten Beobachters in Kapitel 6.3, wegen s = 1 bei der hier vorliegenden Eingrößen-Regelstrecke. Bei Wahl einer größeren Reglerordnung nR > n−1 können außer der freien Vorgabe aller Regelkreispole weitere Forderungen an den Regler gestellt werden. So kann beispielsweise ein I-Anteil zur Unterdrückung konstanter Störungen in den Regler eingebaut werden, wie im nächsten Kapitel erläutert wird. Führungs- und Störübertragungsfunktion der Zustandsregelung. Aus der Abbildung 8.1 unten erhält man für die Führungsübertragungsfunktion die Beziehung
FW (s) =
Δ(s) ZR (s)ZS (s) Y (s) =V . W (s) ZR (s) ZR (s)ZS (s) + NR (s)NS (s)
Ersetzt man das charakteristische Polynom im Nenner durch die rechte Seite der Entwurfsgleichung (8.1), so vereinfacht sich die Führungsübertragungsfunktion zu
FW (s) = V
ZS (s) . ˜ (s) N
(8.5)
Das Führungsverhalten ist also unabhängig von der Wahl der Beobachterdynamik in Δ(s). Durch die Dimensionierung des skalaren Vorfilters entsprechend ˜ (s) N s→0 ZS (s)
V = lim
erhält man stationär genaues Führungsverhalten. Die Störübertragungsfunktion
FZ (s) =
ZS (s)NR (s) Y (s) =− ˜ (s)Δ(s) Z(s) N
(8.6)
˜ (s) wie auch die des Beobenthält sowohl die Vorgabepole der geregelten Strecke in N achters in Δ(s). Beispiel 8.1 Zustandsreglerentwurf im Frequenzbereich: Im Kapitel 7.5 wurde für eine Eingrößen-Regelstrecke mit der Übertragungsfunktion FS (s) =
4 s2 + 4
8.1 Aufstellen der Entwurfsgleichung
187
im Zeitbereich eine Zustandsrückführung mit Beobachter reduzierter Ordnung entworfen. Dieser Reglerentwurf wird nun mit identischen Polvorgaben (siehe Gln 7.37 und 7.39) ˜ (s) = (s + 2)2 N
und Δ(s) = s + 2
im Frequenzbereich wiederholt. Nach Gleichung (8.4) ist ein Regler der Ordnung nR = n − 1 = 2 − 1 = 1 anzusetzen mit der Übertragungsfunktion FR (s) =
d1 s + d0 ZR (s) = . NR (s) s + c0
Die Entwurfsgleichung (8.1) lautet dann ˜ (s) · Δ(s) ZR (s) · ZS (s) + NR (s) · NS (s) = N 2 (d1 s + d0 ) · 4 + (s + c0 ) · (s + 4) = (s + 2)2 · (s + 2). Nach Ausmultiplizieren der linken und rechten Gleichungsseite kann der Koeffizientenvergleich durchgeführt werden. s3 + c0 s2 + (4 + 4d1 ) s + 4c0 + 4d0 = s3 + 6 s2 + 12 s + 8 Für die Reglerkoeffizienten erhält man c0 = 6, d1 = 2 und d0 = −4 und damit FR (s) =
2s − 4 s+6
als Reglerübertragungsfunktion. Die Übertragungsfunktionen der zweischleifigen Struktur lauten dann NR (s) − Δ(s) 4 ZU (s) = = Δ(s) Δ(s) s+2 2s − 4 ZR (s) FY (s) = = mit Δ(s) s+2 ˜ (0) N = 1 als Vorfilter. V = ZS (0) FU (s) =
(8.7) (8.8)
Damit erhält man das gleiche Ergebnis wie beim Zeitbereichsentwurf von Kapitel 7.5 durch Lösen einer einzigen Entwurfsgleichung. Der Koeffizientenvergleich führt auf ein eindeutig lösbares lineares Gleichungssystem, welches auch rechnergestützt gelöst werden kann. Aufgabe 8.1 Zustandsregler im Frequenzbereich: Gegeben ist eine Strecke mit der Übertragungsfunktion FS (s) =
3 . s(s + 2)
188
8 Zustandsreglerentwurf im Frequenzbereich
Berechnen Sie für eine Vorgabe aller Regelkreispole bei −3 die Übertragungsfunktionen FR (s), FU (s) und FY (s) der zweischleifigen Regelkreisstruktur. Wie muss das Vorfilter V für stationär genaues Führungsverhalten gewählt werden? Lösung: FR (s) =
1 13s + 27 3 s+7
FU (s) =
4 s+3
FY (s) =
1 13s + 27 3 s+3
V =3
8.2
Zustandsregler mit Störmodell
Bei Wahl einer Reglerordnung nR > n − 1 ergeben sich in der Entwurfsgleichung über die freie Polvorgabe hinaus zusätzliche Freiheitsgrade. Diese erlauben die Formulierung von Zusatzbedingungen an den Regler nach Gleichung (8.2). Beispielsweise kann die Durchgriffsfreiheit des Reglers gefordert werden (Koeffizient dnR = 0). Dies ist bei der zeitdiskreten Realisierung von Reglern (siehe Teil II) wegen der vorhandenen Wandlungszeiten des Analog-Digital-Wandlers eventuell notwendig. Eine alternative Zusatzbedingung ist die Vorgabe bestimmter Pole des Reglernenners. So kann durch das Erzwingen eines Poles in s = 0 ein Zustandsregler mit I-Anteil entworfen werden. Dieser ist in der Lage, konstante Störungen vollständig auszuregeln. Eine Verallgemeinerung des I-Anteils erlaubt es, auch Störungen mit anderer Signalform durch die Vorgabe entsprechender Reglerpole vollständig zu unterdrücken. Zustandsregler mit I-Anteil. Damit der Regler in seinem Nenner einen integrierenden Pol aufweist, muss der Koeffizient c0 in Gleichung (8.2) verschwinden. Die Anzahl der Unbekannten in der Reglerübertragungsfunktion verringert sich in der Folge auf 2 · nR und führt auf folgende Bilanzierung: Anzahl der Unbekannten = Anzahl der Gleichungen 2 · nR = nR + n Für einen Zustandsregler mit I-Anteil ist daher die Reglerordnung nR = n mit dnR snR + dnR −1 snR −1 + ... + d1 s + d0 FR (s) = s(snR −1 + cnR −1 snR −2 + ... + c2 s + c1 )
(8.9) (8.10)
als Reglerübertragungsfunktion anzusetzen. Der Reglerentwurf mit I-Anteil erfordert also eine um Eins erhöhte Reglerordnung, wie der Vergleich der Gleichungen (8.4) und (8.9) zeigt. Beispiel 8.2 Zustandsregler mit I-Anteil: Für die Strecke mit der Übertragungsfunktion FS (s) =
3 s(1 + 0,5s)
8.2 Zustandsregler mit Störmodell
189
wird ein Zustandsregler mit I-Anteil berechnet. Die Pole der geregelten Strecke sollen bei s1,2 = −1 ± i und die des Beobachters bei sB1 = −1 und sB2 = −2 vorgegeben werden. Damit lauten die Vorgabepolynome ˜ (s) = (s − s1 ) · (s − s2 ) = s2 + 2s + 2 und N Δ(s) = (s − sB1 ) · (s − sB2 ) = s2 + 3s + 2. Nach Gleichung (8.9) wird ein Regler der Ordnung nR = n = 2 benötigt mit dem Ansatz FR (s) =
d2 s2 + d1 s + d0 . s(s + c1 )
Vor dem Einsetzen in die Entwurfsgleichung dividiert man Zähler und Nenner der Strecke durch 0,5, so dass sich mit FS (s) =
6 ZS (s) = NS (s) s(s + 2)
der Nennerkoeffizient bei der höchsten s-Potenz zu Eins ergibt. Nun lautet die Entwurfsgleichung ˜ (s) ZR (s) · ZS (s) + NR (s) · NS (s) = N · Δ(s) (d2 s2 + d1 s + d0 ) · 6 + s(s + c1 ) · s(s + 2) = (s2 + 2s + 2) · (s2 + 3s + 2). Der Koeffizientenvergleich führt auf FR (s) =
1 2s2 + 5s + 2 ZR (s) = · NR (s) 3 s(s + 3)
als Reglerübertragungsfunktion. Die Übertragungsfunktionen der zweischleifigen Struktur gemäß den Gleichungen (8.7) und (8.8) lauten dann NR (s) − Δ(s) −2 ZU (s) = = Δ(s) Δ(s) (s + 1)(s + 2) 1 2s2 + 5s + 2 ZR (s) = mit FY (s) = Δ(s) 3 (s + 1)(s + 2) ˜ (0) N 1 V = = als Vorfilter. ZS (0) 3 FU (s) =
Wieder erfolgt der Reglerentwurf (ordnungsreduzierter Beobachter und Zustandsrückführung mit I-Anteil) durch Lösen eines einzigen Gleichungssystems. Im Vergleich zum
190
8 Zustandsreglerentwurf im Frequenzbereich
1.2
w,y,u(t) 6
w(t)
1
0.8 y(t)
0.6 0.4 0.2
u(t)
0 −0.2
0
5
-
t/s
10
15
Abbildung 8.2: Zeitverläufe der Zustandsregelung mit I-Anteil Regler ohne I-Anteil hat sich die Ordnung der Entwurfsgleichung lediglich um Eins erhöht. Abbildung 8.2 zeigt die Zeitverläufe bei Anregung des Regelkreises mit einem Führungssprung w(t) = σ(t−1) und einem Störsprung z(t) = 0,5 σ(t−7). Entsprechend ˜ (s) tritt in der Führungssprungden konjugiert komplexen Polen im Vorgabepolynom N antwort y(t) in der linken Bildhälfte ein Überschwingen auf. Die zum Zeitpunkt sieben Sekunden auftretende Störung wird durch den I-Anteil des Reglers erwartungsgemäß vollständig ausgeregelt. Aufgabe 8.2 Zustandsregler mit I-Anteil: Gegeben ist eine Strecke mit der Übertragungsfunktion FS (s) =
4 . 1 + 2s
Berechnen Sie einen Zustandsregler mit I-Anteil, der alle Pole des geschlossenen Regelkreises nach −1 legt. Wie lauten die Übertragungsfunktionen FU (s) und FY (s) der zweischleifigen Regelkreisstruktur? Für welches Vorfilter V ist das Führungsverhalten stationär genau? Lösung: FR (s) =
1 3s + 2 4 s
FU (s) = −
1 s+1
FY (s) =
1 3s + 2 4 s+1
V =
1 2
Vermeidung des Reglerüberlaufs (Controller Windup). Bei allen realen Strecken ist das Stellsignal in seiner Größe begrenzt. Als Reglerüberlauf bezeichnet man das Weiterintegrieren des Regler-I-Anteils im Falle der Stellbegrenzung. Dieses kann ein ungünstiges Einschwingverhalten des Regelkreises nach sich ziehen (siehe Kap. 13.3).
8.2 Zustandsregler mit Störmodell
191
In vielen Fällen läßt sich das Problem dadurch vermeiden, dass man dem Beobachter das begrenzte Stellsignal zuführt, so dass er in gleicher Weise wie die reale Strecke angeregt wird. Dazu baut man, wie aus Abbildung 8.3 ersichtlich, ein Modell des Begrenzers in die innere Schleife der zweischleifigen Reglerstruktur ein. Zur Realisierung ist diese zweischleifige Struktur mit eingebautem Begrenzer generell der einschleifigen Struktur von Abbildung 8.1 vorzuziehen.
W (s) -
V
- j6
Z(s) reale Strecke mit Begrenzer U (s) ? Y (s) - FS = ZS - j NS
j FU = 6
ZU Δ
FY =
ZR Δ
Abbildung 8.3: Zweischleifige Struktur der Zustandsregelung mit Begrenzer
Zustandsregler mit allgemeinem Störmodell. Die Unterdrückung konstanter Störungen durch einen I-Anteil im Regler wird im folgenden auf beliebige Führungs- und Störsignale erweitert. Dazu ist es notwendig, das charakteristische Polynom des betrachteten Signals zu kennen. Die folgende Tabelle zeigt die charakteristischen Polynome typischer Signalformen [29]. Störsignal Sprung Rampe Sinus Sinus mit Mittelwert
char. Polynom NRZ (s) s s2 s2 + ω02 s(s2 + ω02 )
Ordnung nZ 1 2 2 3
Das jeweilige Signal entsteht dabei als Impulsantwort der Übertragungsfunktion 1/NRZ (s). Kennzeichnend für die für t → ∞ nicht verschwindenden Signale der Tabelle ist der verschwindende Realteil der Nullstellen ihrer charakteristischen Polynome. Um ein Signal nach einem Einschwingvorgang vollständig auszuregeln, muss das zugehörige charakteristische Polynom NRZ (s) im Zähler der Störübertragungsfunktion (8.6)
FZ (s) =
ZS (s)NR (s) Y (s) =− ˜ (s)Δ(s) Z(s) N
192
8 Zustandsreglerentwurf im Frequenzbereich
enthalten sein. Das ist dann der Fall, wenn es im Nenner des Reglers enthalten ist. Der gesamte Reglernenner muss sich folglich gemäß ¯R (s) NR (s) = NRZ (s) · N aus dem charakteristischen Polynom NRZ (s) des Störsignals und dem sich erst durch ¯R (s) zusammensetzen. Die Reglerdie Lösung der Entwurfsgleichung ergebenden Teil N ordnung muss entsprechend der Ordnung nZ des Störmodells zu nR = n − 1 + nZ gewählt werden. Dann lautet die Entwurfsgleichung ˜ · Δ. ZR · ZS + (NRZ · N¯R ) · NS = N (8.11) nZ nR − nZ n n nR (Polynomordnung) nR m Aus ihr lassen sich alle unbekannten Koeffizienten des Reglers FR (s) =
ZR (s) ¯R (s) NRZ (s)N
¯R (s) bestimmen. in den Polynomen ZR (s) und N Für den Fall einer Strecke erster Ordnung (n = 1) entspricht die Reglerordnung der des ¯R (s) = 1 und der Reglernenner besteht nur noch Störmodells (nR = nZ ). Dann gilt N aus dem charakteristischen Polynom des Störmodells. Beispiel 8.3 Zustandsregler mit Sinus-Störmodell: Für die I2 -Strecke FS (s) =
1 s2
wird ein Zustandsregler entworfen, der die beim Zeitpunkt 10 Sekunden einsetzende sinusförmige Störung z(t) = 0,5 · sin(3 t) · σ(t − 10) stationär ausregeln soll. Das charakteristische Polynom des Störsignales z(t) mit der Kreisfrequenz ω0 = 3 lautet NRZ (s) = s2 + ω02 = s2 + 9 und besitzt die Ordnung nZ = 2. Dann ist der Regler mit der Ordnung nR = n − 1 + nZ = 2 − 1 + 2 = 3
8.2 Zustandsregler mit Störmodell
193
und der Übertragungsfunktion d3 s3 + d2 s2 + d1 s + d0 ZR (s) = ¯ (s2 + 9)(s + c0 ) NRZ (s)NR (s)
FR (s) =
¯R (s) mit nR − nZ = 3 − 2 = 1 ist. Als anzusetzen, wobei nach (8.11) die Ordnung von N Polvorgaben werden ˜ (s) = (s + 1)2 N
Δ(s) = (s + 1)(s2 + 2s + 2)
und
gewählt. Nach Einsetzen in die Entwurfsgleichung und Ausführen des Koeffizientenvergleichs ergibt sich der Regler FR (s) =
2s3 − 32s2 + 8s + 2 (s2 + 9)(s + 5)
mit dem Vorfilter V = 1. 1.5
w,y,u(t) 6
w(t)
1 y(t)
0.5 u(t)
0 −0.5 −1
0
2
4
6
8
10
-
t/s
12
14
16
18
20
Abbildung 8.4: Zeitverläufe der Zustandsregelung mit Sinus-Störmodell Abbildung 8.4 zeigt die simulierten Zeitverläufe bei Anregung des Regelkreises mit einem Führungssprung w(t) = σ(t − 1) und dem Störsignal z(t) = 0,5 · sin(3 t) · σ(t − 10). Die Regelgröße y(t) reagiert in der linken Bildhälfte entsprechend der Vorgabe eines ˜ (s) ohne Überschwingen. Die bei 10sec einsetzende sinusförreellen Doppelpoles in N mige Störung wird nach einem Einschwingvorgang in der Regelgröße y(t) vollständig ausgeregelt. Dazu bildet sich in der Stellgröße u(t) eine Sinusschwingung aus, die die Störgröße gerade auslöscht. Die Dynamik des Einschwingvorgangs wird durch die Po˜ (s) und Δ(s) bestimmt. In den Regler wurde mit NRZ (s) = s2 + 9 lediglich le in N die Kenntnis der Kreisfrequenz der Störung eingebaut. Die Ausregelung der Störung erfolgt unabhängig von ihrer Amplitude, Phasenlage oder ihrem Angriffspunkt. In der Simulation wurde eine Störung am Streckeneingang wie in Abbildung 8.3 angenommen. Sogar sinusförmigen Führungsgrößen der Frequenz ω0 = 3 folgt die Regelung nach dem Einschwingvorgang unverzögert.
194
8 Zustandsreglerentwurf im Frequenzbereich
8.3
Grenzen der erreichbaren Regelgüte
Diskussion. Im vorangegangenen Kapitel konnten durch das gezielte Einbringen von Polen in den Reglernenner bestimmte Störsignale im Regelkreis vollständig ausgeregelt werden. Leider ziehen diese im offenen Regelkreis auf der imaginären Achse liegenden Pole auch immer eine Verschlechterung des Regelkreisverhaltens an anderer Stelle nach sich. Für das Beispiel 8.3 des Zustandsreglers mit Sinus-Störmodell ergibt sich FZ (s) = −
(s + 5)(s2 + 9) (s + 1)3 (s2 + 2s + 2)
als Störübertragungsfunktion für Störungen am Streckeneingang. Abbildung 8.5 zeigt den zugehörigen Störamplitudengang |FZ (jω)|. Er besitzt bei der Frequenz ω0 = 3 des Störmodells eine Nullstelle und damit ein ausgeprägtes Minimum. Zum Vergleich zeigt Abbildung 8.5 auch den Störamplitudengang des Regelkreises ohne Störmodell ˜ (s) = (s + 1)2 und Δ(s) = s + 1. Besonders im Bereich niedriger für die Vorgaben N Frequenzen liegt der Amplitudengang des Regelkreises ohne Störmodell unterhalb des Amplitudenganges mit Störmodell. Durch den Einbau des Störmodells wurde also das Regelverhalten für Frequenzen mit ω < 3 verschlechtert. 2
10
mit Störmodell
|FZ (jω)| 0
6
10
ohne Störmodell
−2
10
−4
10
−1
0
10
1
10
-
ω/s
−1
10
Abbildung 8.5: Störamplitudengänge der Zustandsregelung mit und ohne SinusStörmodell Dieser Effekt wird durch das 1952 von Westcott bewiesene Gleichgewichtstheorem beschrieben [49]. Es bezieht sich allerdings auf den Amplitudengang der Störübertragungsfunktion für ausgangsseitige Störungen. Für einen stabilen offenen Regelkreis mit einem Differenzgrad von mindestens zwei gilt demnach für das Integral über den Störamplitudengang: lg
+j∞
−j∞
1 djω = 0 . 1 + FR (jω) · FS (jω)
Ein Absenken des Störamplitudengangs in einem Frequenzbereich führt demnach immer auch zu einer Erhöhung in einem anderen Frequenzbereich. Diese Tatsache bezeichnet
8.4 Bewertung des Frequenzbereichsentwurfs
195
man auch sehr treffend als „Wasserbett-Effekt“. Für den Einsatz von Störmodellen im Regler bedeutet dies, dass auch die unvermeidliche Verschlechterung des Regelverhaltens in den anderen Frequenzbereichen mit betrachtet werden muss.
8.4
Bewertung des Frequenzbereichsentwurfs
Entwurfsempfehlungen. Insbesondere bei Eingrößen-Regelstrecken stellt der Frequenzbereichsentwurf eine kompakte Möglichkeit dar, um den reduzierten Beobachter und die Zustandsrückführung gemeinsam zu berechnen. Der Entwurf setzt im Wesentlichen nur die Kenntnis der von der klassischen Regelungstechnik her vertrauten Übertragungsfunktionen voraus. Eine Zustandsdarstellung der Strecke wird nicht benötigt. Wie aus den Beispielen ersichtlich, ergeben sich teilweise Reglertypen, die von der klassischen Regelungstechnik her bekannt sind, wie zum Beispiel PI-Regler oder PID-Regler. Neu ist in diesen Fällen also nicht der Reglertyp, sondern der mit der Polvorgabe für den geschlossenen Regelkreis beginnende Entwurfsweg, der zu ihm führt. Polvorgaben. Unabhängig vom Entwurf im Zeit- oder Frequenzbereich ist für die praktische Realisierung von Zustandsreglern die Wahl der Polvorgabe entscheidend. Reale Randbedingungen wie Stellsignalbegrenzung, Modellfehler oder Messrauschen setzen hier den sinnvollen Dynamikvorgaben Grenzen. In Ergänzung zum Kapitel 4.3 sollen hier noch einige einfache Tipps gegeben werden: 1. Orientierung an der Dynamik der Strecke ˜ (s) und Δ(s) in der GrößenEs ist grundsätzlich sinnvoll, die Vorgabepole in N ordnung der Pole der ungeregelten Strecke zu wählen. Die Vorgabepole müssen jedoch stabil sein, so dass keine integrierenden, schwach gedämpften oder instabilen Streckenpole in sie aufgenommen werden dürfen. Nach einer erfolgreichen Inbetriebnahme mit dieser vorsichtigen Polvorgabe wird man versuchen, durch schrittweises Vergrößern des Abstands der Vorgabepole vom Ursprung, die Regelkreisdynamik zu erhöhen. 2. Untersuchung des Stellsignals Bei der Inbetriebnahme der Regelung sollte auf jeden Fall auch das Stellsignal aufgezeichnet und in zweierlei Hinsicht untersucht werden. Tritt in der Reaktion auf einen Führungssprung bereits eine Stellbegrenzung auf, so ist die erreichbare Führungsdynamik bereits ausgeschöpft. Andernfalls kann ˜ (s) die Führungsdynamik noch erhöht durch die Vorgabe schnellerer Pole in N werden. Eine schnelle Regelung verstärkt immer auch das in der Regelgröße enthaltene Sensorrauschen, was zu einem unruhigen Stellsignalverlauf führt. Durch ein derart verrauschtes Stellsignal aber droht ein erhöhter Verschleiß oder gar die Zerstörung ˜ (s) und Δ(s) dürfen nur so schnell gewählt des Stellgliedes. Die Vorgabepole in N werden, dass das Stellsignalrauschen auf ein akzeptables Maß beschränkt bleibt.
196
8 Zustandsreglerentwurf im Frequenzbereich
3. Untersuchung der berechneten Reglerübertragungsfunktion Es ist zweckmäßig, auch die Lage der Pole und Nullstellen der durch die Lösung der Entwurfsgleichung gewonnenen Reglerübertragungsfunktion zu berechnen. Eine Pollage bzw. Nullstellenlage in der rechten s-Halbebene (instabiler bzw. nicht-minimalphasiger Regler) kann auf eine ungünstige Polvorgabe hindeuten. Allerdings können solche „Regler-Anomalien“ auch in einer schwierig zu stabilisierenden Strecke begründet sein.
Teil II
Digitale Regelung
9
Grundlagen digitaler Regelsysteme
Kontinuierliche Systeme. Bei der Untersuchung kontinuierlicher Regelsysteme wird davon ausgegangen, dass alle Signale im Regelkreis kontinuierliche Signale sind. Diese kontinuierlichen Signale können mit Mitteln der analogen Signalverarbeitung im Regelkreis verarbeitet werden. x(t) 6
t -
Abbildung 9.1: Kontinuierliches Signal
Die typischen Komponenten eines analogen Regelkreises zeigt die nachfolgende Abb. 9.2: Störgröße z(t) w(t) - d - Regler – 6 xMess (t)
u(t) -Verstärker
- Stellglied
? - Strecke
x(t) -
Messgeber
Abbildung 9.2: Analoger Regelkreis mit analogen Baugruppen
Der Regler in einem derartigen Regelkreis ist aus Operationsverstärkerschaltungen aufgebaut, die eine analoge Signalverarbeitung ermöglichen. Die Signale w(t), u(t) und xMess (t) sind meist Normsignale 0 . . . 10 V, 0 . . . 20 mA oder 4 . . . 20 mA. Die anderen Signale weisen prozessabhängige Dimensionen wie z. B. Druck in bar, Höhe in m, usw. auf. In einem digitalen Regelkreis treten nun jedoch zusätzliche Baugruppen auf, die erforderlich sind, damit die Regelsignale als Zahlenwerte von einem Digitalrechner verarbeitet werden können.
200
9 Grundlagen digitaler Regelsysteme
9.1
Aufbau digitaler Regelkreise
Digitale Systeme. Ein Digitalrechner ist in der Lage, in einer endlichen Rechengeschwindigkeit in binärer Form vorliegende Zahlenwerte (Daten) zu verarbeiten. Damit er diese Art der Datenverarbeitung auch in einem Regelkreis durchführen kann, müssen 1. die analogen Messwerte der Regelstrecke zu bestimmten Zeitpunkten (den Abtastzeitpunkten) ausgelesen, und in digitale Zahlenwerte gewandelt werden (Analog/Digital-Wandlung, A/D-Wandlung) und 2. nach Berechnung des Stellsignals zur Regelung der Regelstrecke wieder in analoge Stellsignale rückgewandelt werden (Digital/Analog-Wandlung, D/A-Wandlung). Zur Durchführung dieser Operationen sind die zusätzlichen Baugruppen Abtaster, Halteglied, A/D- und D/A-Wandler erforderlich. Die Grundstruktur eines derartigen Regelkreises zeigt die folgende Abbildung: Sollwert
- Digitalrechner
-D/A-
Wandler
Verstärker,
- Stellglied und
6
- Sensor
Regelgröße
-
Regelstrecke Abtaster
A/D Wandler
Halte- glied
t
t
Abbildung 9.3: Grundstruktur eines digitalen Regelkreises Die Funktionsweise von Abtaster, Halteglied und Wandler mit ihren Auswirkungen wird nachfolgend beschrieben. Abtaster. Der Abtaster funktioniert wie ein schneller elektronischer Schalter, der aus einem analogen Signal x(t) zum Zeitpunkt des Abtastens (Abtastzeitpunkt kT ) den Signalwert x(kT ) ausliest. Der Wert k ist eine Laufvariable, k = 0, 1, 2, . . . Wird dieser Abtastvorgang in gleichen Zeitintervallen T wiederholt, so spricht man von synchroner Abtastung mit der Abtastzeit T . Die daraus abgeleitete Frequenz ωT bezeichnet man als Abtastfrequenz ωT = 2π · fT = 2π/T . Diese Abtastzeit T liegt je nach zu regelndem Prozess im Bereich von ca. 100 μs bis hin zu 100 und mehr Millisekunden. Während des Abtastvorgangs ist der Schalter für die Dauer eines kleinen Zeitintervalls, das mit h bezeichnet werden soll, geschlossen, wobei gilt h T . Abb. 9.4 verdeutlicht den Vorgang des Abtastens. Der Abtaster ist quasi ein Puls-Amplituden-Modulator mit dem Trägersignal p(t). Dieses Trägersignal ist eine Impulskette der Höhe Eins und der Frequenz ωT (siehe Abb. 9.10). Das Ausgangssignal x∗p (t) kann man sich dann vorstellen, als ein PulsAmplituden-moduliertes Signal, welches mit dem Trägersignal p(t) moduliert ist x∗p (t) = p(t) · x(t).
(9.1)
Bei idealer Abtastung geht die Impulsbreite h gegen Null und die Impulskette geht über in eine Kette von Deltaimpulsen (Abb. 9.4d).
9.1 Aufbau digitaler Regelkreise
201
b)
a)
x(t)
- t
x(t) 6 x(t)
x∗p (t) -
t
t c)
x∗p (t) 6
d)
x∗p (t) 6 6 6 6
x(t)
6
6 h - T
6
t -
T
t -
Abbildung 9.4: Abtastung eines kontinuierlichen Signals; a) Symbol des Abtasters; b) kontinuierliches Signal x(t); c) Ausgangssignal des Abtasters bestehend aus einer Folge von Pulsen der Breite h; d) Ausgangssignal des Abtasters bei idealer Abtastung (h → 0)
Halteglied. In der Regel wird das abgetastete Signal in einem nachfolgend angeordneten Halteglied gespeichert. Die Speicherfunktion übernimmt in einer elektronischen Schaltung meist ein Kondensator. Damit ergibt sich dann stark vergrößert der in Abb. 9.5 gezeigte Signalverlauf. x(t) 6
T
LL B B 2T
3T
4T
t -
Abbildung 9.5: Einschwingvorgang beim Abtasten und Halten Die Zeitdauer vom Beginn des Abtastens bis zum Ende des Einschwingvorgangs liegt im Bereich von ca. 400 bis 500 ns (Nanosekunden), sie entspricht der Impulsbreite h des Abtastvorgangs. Danach beginnt der eigentliche Haltevorgang. Das Prinzipbild einer Operationsverstärkerschaltung für Abtasten und Halten zeigt Abb. 9.6. Nach Beendigung des Aufladevorgangs des Kondensators beginnt eine langsame Entladung. Die Zeitkonstante dieses Entladevorgangs ist jedoch groß im Vergleich zur Abtastzeit T , sodass sie vernachlässigt werden kann.
202
9 Grundlagen digitaler Regelsysteme
c
ωT ?
b bb
xe (t)
b bb
c xa (t)
? c
? c
Abbildung 9.6: Schaltung eines Abtasters mit Halteglied auf der Basis von Operationsverstärkern
Infolge des Abtast- und Haltevorgangs ergibt sich zwischen dem Eingangssignal x(t) in Abtaster und Halteglied und der Grundwelle x (t) der resultierenden Treppenfunktion, dem Ausgangssignal, eine Phasenverschiebung von einer halben Abtastzeit. Dies verdeutlicht Abb. 9.7.
x(t) 6
x
-
x
T /2
T-
t -
Abbildung 9.7: Phasenverschiebung zwischen dem Eingangssignal x und der Grundwelle x des abgetasteten und gehaltenen Signals
A/D- und D/A-Wandlung. Damit diese abgetasteten und gehaltenen Messwerte nun in einem nachfolgenden Mikroprozessor, Prozessrechner oder Digitalrechner digital weiterverarbeitet werden können, müssen sie in einem Analog/Digital-Wandler (A/DWandler) in eine Zahl mit einer endlichen Anzahl von Stellen (endliche Wortlänge) gewandelt werden. Bei dieser Wandlung tritt ein Quantisierungsfehler Δq/2 auf, hervorgerufen durch die endliche Wortlänge des Wandlers. Dies verdeutlicht Abb. 9.8. Der Wandlungsprozess erfolgt je nach Verfahren und Auflösung in Zeiten bis herab zu ca. 10 μs. Dieses quantisierte Signal wird nachfolgend im Prozessor verarbeitet. Die Rückwandlung des vom Digitalrechner ausgegebenen Stellsignals (D/A-Wandlung) in eine analoge Spannung erfolgt in der Regel schneller. Zeiten bis in den Nanosekunden-Bereich sind erreichbar.
9.1 Aufbau digitaler Regelkreise xa digitales Signal
203 6 3 2 1
-
-1 -2 -3
Δq/2
xe
analoges Signal
Abbildung 9.8: Quantisierungskennlinie
Digitalrechner. Die in digitaler Form vorliegenden Daten des Regelsystems werden in einem Digitalrechner zur Berechnung des Stellsignals verarbeitet. Diese Verarbeitung erfolgt in der Regel durch die Auswertung einer Rekursionsgleichung, die in der allgemeinen Form lautet: xa (kT ) = a1 xa ([k − 1]T ) + a2 xa ([k − 2]T ) + . . . + b0 xe (kT ) + b1 xe ([k − 1]T ) + . . . Die Daten werden innerhalb des Abtastintervalls multipliziert, addiert usw. um das auszugebende Stellsignal zu berechnen. Die Ermittlung dieser Rekursionsgleichung, der Reglergleichung, stellt die Hauptaufgabe der digitalen Regelung dar. Die Berechnung der Stellsignale mittels dieser Rekursionsgleichung ist das digitale Pendant zur Operationsverstärkerschaltung zur Ermittlung des Stellsignals auf analogem Wege. Nachfolgend ein Beispiel zur Berechnung des Stellsignals.
Beispiel 9.1: Es soll für die Zahlenfolge
w(kT ) = {1; 1; 1; . . . } und ein willkürlich angenommenes Signal der Regelgröße x(kT ) = {1; 0,8; 0,64; 0,512; . . . }
die Zahlenfolge des Stellsignals u(kT ) mittels der Rekursionsgleichung u(kT ) = 0,5 u([k − 1]T ) − 0,3 xd ([k − 1]T ) für k = 0; 1; 2; . . . mit xd (kT ) = w(kT ) − x(kT ). berechnet werden.
204
9 Grundlagen digitaler Regelsysteme
Die Lösung dieses Problems wird durch die Berechnung der Rekursionsgleichung zu jedem Abtastzeitpunkt kT ermittelt: u(0) u(T ) u(2T ) u(3T ) u(4T )
= = = = =
0 0,5 · u(0) − 0,3 · xd (0) = 0 0,5 · u(T ) − 0,3 · xd (T ) = 0,5 · 0 − 0,3 · 0,2 = −0,06 0,5 · u(2T ) − 0,3 · xd (2T ) = 0,5 · (−0,06) − 0,3 · 0,36 = −0,138 0,5 · u(3T ) − 0,3 · xd (3T ) = 0,5 · (−0,138) − 0,3 · 0,488 = −0,215
Ein Programm zur Berechnung der Rekursionsgleichung könnte in einer fiktiven Makrosprache folgende Form zeigen: INITIAL: START:
END:
u(k-1) = 0 IN w(k-1); x(k-1) xd(k-1) = w(k-1) - x(k-1) u(k) = 0,5 * u(k-1) - 0,3 * xd(k-1) OUT u(k) u(k-1) = u(k) RETURN
Der Ansprung der Startadresse START erfolgt durch den Interrupt-Controller jeweils nach Ablauf der Abtastzeit T . Fasst man die Komponenten des gesamten digitalen Regelkreises in einem Blockschaltbild zusammen, so hat die Struktur den in Abb. 9.9 gezeigten Aufbau. Durch diese Abbildung wird deutlich, dass die in einem digitalen Regelkreis zusätzlich erforderlichen Funktionsbausteine wie Abtaster, Halteglied und Wandler schon im Mikrocontroller integriert sind. Dieser Mikrocontroller enthält natürlich auch den für die eigentlichen Rechenoperationen erforderlichen Mikroprozessor. Bevor auf die regelungstechnische Behandlung der unterschiedlichen Signalformen dieses digitalen Regelkreises — kontinuierliche Signale, impulsförmige Signale und treppenförmige Signale — eingegangen wird, sollen zunächst die mathematische Beschreibung des Abtastvorgangs und seine Auswirkungen näher untersucht werden. Zur sprachlichen Unterscheidung von Systemen mit unterschiedlichen Signalformen werden häufig die folgenden Bezeichungen verwendet: Ein kontinuierliches System enthält nur kontinuierliche Signale (z. B. analoger Regelkreis). Ein (zeit)diskretes System enthält nur zeitdiskrete Signale (z. B. Modell einer Volkswirtschaft). Ein Abtastsystem enthält kontinuierliche und zeitdiskrete Signale (z. B. Sehvorgang des Auges). Ein digitales System enthält zeitdiskrete, amplitudenquantisierte Signale (z. B. digitaler Regelkreis).
9.2 Mathematische Beschreibung des Abtastvorgangs w(kT )
u(kT )
6 6 6 6 6 6 6 -kT -
Regelalgorithmus:
w(kT )
-
205
xd (kT )=w(kT )−x(kT )
6 6 6 6 6 6 6kT 6 - Speicher - D/A- - HalteWandler
u(kT )=a0 ·u(kT −T )+...
u ¯(t)
y(t)
6
glied
6 -t
-t
? - Signal-
verstärker
?
+b0 ·xd (kT )+...
Stellglied
9 ?
Analoge Regelstrecke
Mikrocontroller
?
x(kT )
A/DWandler
x(kT ) 6 6 kT 6 6 6 6 6 6 -
x(kT )
Messwertgeber
ωT ? s s
6 6 kT 6 6 6 6 6 6 -
-
x(t)
KA 6 A
-t
Abbildung 9.9: Digitaler Regelkreis mit Mikrocontroller
9.2
Mathematische Beschreibung des Abtastvorgangs
Beschreibung der Pulsfolge p(t) durch eine Fourier-Reihe und die Berechnung seines Frequenzspektrums. In Gleichung 9.1 wurde das Ausgangssignal des Abtasters als ein Puls-Amplituden-moduliertes Signal x∗p (t) berechnet, welches mit dem Trägersignal p(t) moduliert ist x∗p (t) = p(t) · x(t). Dieses Trägersignal p(t) ist eine Impulsfolge mit der Höhe Eins und der Frequenz ωT . Jeder Impuls weist die Breite h auf, so wie es bei der realen Abtastung der Fall ist. Die Pulsfolge p(t) wird beschrieben durch die Gleichung p(t) =
+∞
[σ(t − nT ) − σ(t − nT − h)]
n=−∞
mit σ(τ ) als Einheitssprungfunktion zum Zeitpunkt τ = 0 und h T .
(9.2)
206
9 Grundlagen digitaler Regelsysteme 1
- h −2T
−T
0
T
-t
2T
3T
Abbildung 9.10: Pulsfolge des Trägersignals p(t) Da p(t) eine periodische Funktion mit der Periode T darstellt, kann sie durch eine Fourier-Reihe mit den Fourier-Koeffizienten cn beschrieben werden. +∞
p(t) =
cn · ejnωT t .
(9.3)
n=−∞
Die Ermittlung der Fourier-Koeffizienten cn geschieht nach [13] durch die folgende Gleichung: 1 cn = T
∞
p(t)e−jnωT t dt .
(9.4)
0
Die Auswertung dieses Integrals liefert cn =
h sin(nωT h/2) −jnωT h/2 1 − e−jnωT h = · ·e . jnωT T T nωT h/2
(9.5)
Das Frequenzspektrum von p(t) ist gemäß Gleichung 9.3 dann die grafische Darstellung des Betrags der Fourier-Koeffizienten cn als Funktion von ω. Abb. 9.11 zeigt das Amplitudenspektrum von p(t).
h/T
6
6
6
−4ωT
−3ωT
6
−2π/h
6
−2ωT
|cn | 6 6
−ωT
0
6 ωT
2π/h
6
2ωT
6 3ωT
6 4ωT
6 ω
Abbildung 9.11: Amplitudenspektrum der Pulskette p(t) Das Frequenzspektrum der Pulskette ist somit ein Linienspektrum mit diskreten Frequenzen ω = n · ωT (dargestellt durch die Pfeile). Berechnung des Frequenzspektrums von x∗p (t) bei realer Abtastung. Mit der Berechnung von p(t) kann das abgetastete Signal x∗p (t) wie folgt dargestellt werden: x∗p (t) =
+∞ n=−∞
cn · x(t) · ejnωT t .
(9.6)
9.2 Mathematische Beschreibung des Abtastvorgangs
207
Um das Frequenzspektrum des abgetasteten Signals zu berechnen, wird vom Frequenzspektrum des Ausgangssignals x(t) ausgegangen. Das Frequenzspektrum von x(t) ist gegeben durch die Spektralfunktion Fx (jω) ∞ Fx (jω) =
x(t)e−jωt dt = F {x(t)} .
(9.7)
−∞
Fx (jω) ist die Fourier-Transformierte von x(t) und F ist der so genannte FourierOperator. Damit wird dann die Fourier-Transformierte des abgetasteten Signals unter Verwendung von Gleichung 9.6 und 9.7
F {x∗p (t)}
= Fx∗p (jω) =
+∞ +∞
cn · x(t) · ejnωT t · e−jωt dt
−∞ n=−∞
=
+∞ n=−∞
+∞ x(t) · ejnωT t · e−jωt dt.
cn ·
(9.8)
−∞
Mit dem Verschiebungssatz der Fourier-Transformation F {x(t) · ejnωT t } = Fx (jω − jnωT ) resultiert dann eingesetzt in Gleichung 9.8 F {x∗p (t)} = Fx∗p (jω) =
+∞
cn · Fx (jω − jnωT )
n=−∞
=
+∞
cn · Fx (jω + jnωT ).
(9.9)
n=−∞
Somit ist das Frequenzspektrum des abgetasteten Signals gleich dem Frequenzspektrum des Ursprungssignals x(t) multipliziert mit dem korrespondierenden Fourier-Koeffizienten |cn |. Abb. 9.12 zeigt nun das Spektrum des Ausgangssignals und darunter das resultierende Spektrum des abgetasteten Signals. Das Spektrum des Ausgangssignals x(t) ist bandbegrenzt auf den Frequenzbereich −ωm < ω < +ωm . Das resultierende Spektrum des abgetasteten Signals enthält ebenso das Spektrum des Ausgangssignals und zusätzlich als Seitenspektren dieses Ausgangsspektrum bei den Mittenfrequenzen ω = n · ωT (mit n = ±1, ±2 . . .) jeweils multipliziert mit dem jeweiligen Fourier-Koeffizienten |cn | der Impulskette p(t). Das abgetastete Signal weist somit eine unendliche Anzahl von Seitenbändern auf. Da die Bandbreite
208
9 Grundlagen digitaler Regelsysteme
1
|Fx (jω)| 6
−ωT /2
ωT /2 −ωm
h/T
0
- ω ωm
|Fx∗p (jω)| 6
−2π/h −4ωT
−3ωT
−2ωT
2π/h −ωT
0
ωT
2ωT
3ωT
4ωT
ω
Abbildung 9.12: Frequenzspektrum des Ausgangssignals x(t) (oben) und des abgetasteten Signals x∗p (t) (unten)
des Ausgangssignals x(t) auf ±ωm begrenzt ist, können die Seitenbänder nicht in das Basisfrequenzband ±ωT /2 hineinspiegeln. Eine eindeutige Rückgewinnung des Originalsignals x(t) aus dem abgetasteten Signal wäre sonst nicht mehr möglich. Auf diesen Punkt wird auf der nächsten Seite noch näher eingegangen. Das Spektrum des abgetasteten Signals wird für den Fall ωT > 2 · ωm nicht durch die Seitenbänder gestört und bleibt unverfälscht. Man bezeichnet diese Forderung auch als Shannon’sches Abtasttheorem:
Die Abtastfrequenz ωT eines Systems muss mindestens doppelt so groß wie die höchste im System vorkommende Frequenz ωm sein.
Das Frequenzspektrum von x∗p (t) bei idealer Abtastung. Bei idealer Abtastung (Impulsbreite h → 0) geht die Pulsfolge h(t) über in eine Kette von Deltaimpulsen. Man kann nun zeigen [42], dass das Frequenzspektrum des abgetasteten Signals dann wiederum das Ausgangsspektrum und die Seitenbänder, nun aber in nicht abgeschwächter Form, enthält, wie in Abb. 9.13 dargestellt. Das Amplitudenmaximum der Seitenbänder ist so groß wie das Maximum des Grundspektrums. Die Problematik der Verfälschung des Spektrums des Nutzsignals bei zu kleiner Abtastfrequenz ωT ist jedoch unverändert vorhanden. Auf die Erfüllung des Shannon’schen Abtasttheorems muss nach wie vor geachtet werden, wenn das Originalsignal durch die Abtastung nicht verfälscht werden soll.
9.2 Mathematische Beschreibung des Abtastvorgangs
209
|Fx (jω)| 6
1
a) −ωT /2
ωT /2 −ωm 1/T
b)
−2ωT
−ωT
0
- ω ωm
|Fx∗p (jω)| 6
0
ωT
2ωT
-
ω
Abbildung 9.13: Frequenzspektren vom Ausgangssignal x(t) (Abb. a) und dem Signal x∗p (t) nach dem idealen Abtaster (Abb. b). Rückgewinnung des analogen Signals x(t) aus dem abgetasteten Signal x∗p (t). Betrachtet man das Frequenzspektrum des abgetasteten Signals, so erkennt man, dass die Rückgewinnung des Originalsignals dadurch erreicht werden kann, dass man das abgetastete Signal durch ein Bandpassfilter1 mit der Bandbreite ±ωF schickt (wobei ωm < ωF < ωT /2). |Fx∗p (jω)| 6
a)
−2ωT
−ωT
0 ωm ωF ωT 1
b)
2ωT
-
ω
|F (jω)| 6 F ilt ωF
- ω
Abbildung 9.14: Rückgewinnung des kontinuierlichen Signals aus dem abgetasteten Signal durch einen idealen Bandpass; Spektrum des abgetasteten Signals (Abb. a) und Spektrum des Bandpasses (Abb. b) 1
Betrachtet man nur positive Frequenzen, so liegt ein Tiefpassfilter mit der Grenzfrequenz ωF vor.
210
9 Grundlagen digitaler Regelsysteme
Aus dem Frequenzspektrum des abgetasteten Signals wird durch den idealen Bandpass dann genau der Frequenzbereich des Nutzsignals ausgeblendet, die Seitenbänder werden weggedämpft. Voraussetzung für eine derartige Betrachtung ist jedoch, dass das Nutzsignal auf den Frequenzbereich ωm < ωT /2 begrenzt ist. Anderfalls spiegeln das erste und gegebenenfalls auch höhere Seitenbänder in den Nutzfrequenzbereich ein und verfälschen das Nutzsignal („Aliasing Effekt“). Dies zeigt Abb. 9.15 mit einem Nutzsignal der Bandbreite ωm > ωT /2.
b
−2ωT
−ωT
a
|Fx∗p (jω)| 6
0 ωm ωT
2ωT
-
ω
Abbildung 9.15: Darstellung des „Aliasing-Effekts“ bei einem Nutzsignal mit einer Bandbreite ωm > ωT /2 und einem idealen Bandpass, Filter a Bandbreite ωF < ωT /2 und Filter b Bandbreite ωF > ωT /2 Auch eine Vergrößerung der Bandbreite des Bandpasses — Filter a mit der Bandbreite ωF < ωT /2 und Filter b mit der Bandbreite ωF > ωT /2 — ermöglicht keine fehlerfreie Rückgewinnung des analogen Signals aus dem abgetasteten Signal. Das abgetastete Signal wird aufgrund der Einspiegelung der Seitenbänder verfälscht.
9.3
Standardform digitaler Regelkreise
Grundstruktur. Nach der Einführung des Aufbaus digitaler Regelkreise und einem Einblick in die mathematische Beschreibung des Abtastvorgangs soll nun die Standardform eines digitalen Regelkreises für die weitere Untersuchung entwickelt werden. Der Regelkreis nach Abb. 9.9 zeigt detailliert die einzelnen Baugruppen und die unterschiedliche Natur der im Kreis auftretenden Signalformen. Entscheidend für alle weiterführenden Untersuchungen sind jedoch nur die Signale zu den Abtastzeitpunkten. Einschwingverhalten, Stabilitätsbetrachtungen, Reglerentwurf . . . werden auf die Signale zu den Abtastzeitpunkten abgestellt. Daher ist es ausreichend, die Abb. 9.9 dahingehend zu vereinfachen, dass nur noch die Baugruppen in der Beschreibung auftauchen, welche die Signale zu den Abtastzeitpunkten bestimmen. Randeffekte, wie z. B. die Fehlereinflüsse bei der A/D-, D/A-Wandlung, sollen dabei außer Acht gelassen werden. Diese Überlegungen führen dann zu der folgenden Standardform eines digitalen Regelkreises (Abb. 9.16). Der physikalische Ausgang des Regelkreises ist nach wie vor die kontinuierliche Regelgröße x(t). Für die Auslegung spielen jedoch nur noch die Signale x(kT ), w(kT ) und u(kT ) eine Rolle. Die Beschreibung des Zusammenhangs zwischen den (zeit)diskreten
9.3 Standardform digitaler Regelkreise
211 x(t)
-
Strecke mit Halteglied und Abtaster w(kT )
u(kT )
Abtaster
- t
pt - i- Regler − 6
Abtaster
- Halteglied
Regelstrecke mit -Verstärker und Stellglied
- t
pt
x(kT )
-
Abbildung 9.16: Standardform eines digitalen Regelkreises Eingangsgrößen xe (kT ) und den (zeit)diskreten Ausgangsgrößen xa (kT ) eines Übertragungsblocks geschieht durch Differenzengleichungen. Für den Übertragungsblock Regler mit der Eingangsgröße xd (kT ) = w(kT ) − x(kT ) und der Ausgangsgröße u(kT ) wurde eine derartige Differenzengleichung schon in Abschnitt 9.1 angegeben. Auch für die Beschreibung des Zusammenhangs zwischen dem Eingang in den Block Strecke mit Halteglied und Abtaster, d. h. u(kT ), und dem Ausgang x(kT ) kann eine derartige Differenzengleichung entwickelt werden (siehe Kapitel 11.2). Diese Differenzengleichungen beschreiben so wie im kontinuierlichen Fall die Differentialgleichungen vollständig das dynamische Verhalten zwischen der Eingangsgröße und der Ausgangsgröße eines Systems. Allerdings gilt die Beschreibung durch die Differenzengleichungen nur zu den Abtastzeitpunkten. So wie sich für das Rechnen mit Differentialgleichungen und Zeitfunktionen das Arbeiten mit der Laplace-Transformation als vorteilhaft erwiesen hat, so erleichtert die z-Transformation das Arbeiten mit Differenzengleichungen und Zahlenfolgen. Eine Einführung in die z-Transformation bringt das nachfolgende Kapitel.
10
Die z-Transformation
Beginnend mit der Definition der z-Transformation werden zunächst ihre Rechenregeln erarbeitet. Dann wird die inverse z-Transformation eingeführt und es werden Anwendungen aufgezeigt.
10.1
Definition
z-Transformation. Für die gegebene Zahlenfolge f (kT ) = {f (0); f (T ); f (2T ) . . . . . .}
(10.1)
wird die z-Transformierte von f (kT ) wie folgt definiert:
F (z) = Z {f (kT )} =
∞
f (kT ) · z −k .
(10.2)
k=0
Das Symbol Z ist der Operator dieser Transformation. Für einen genügend großen Wert von z |z| > r0
(10.3)
konvergiert die Transformation F (z), falls die Folge f (kT ) die folgende Ungleichung erfüllt: |f (kT )| < K · r0k .
(10.4)
Dabei sind r0 und K positive Konstanten. Die in der Regelungstechnik vorkommenden Folgen wachsen nicht schneller als eine e-Funktion mit positivem Koeffizienten. Daher lassen sich immer Konstanten K und r0 finden, sodass die Transformation konvergiert. Es soll in mehreren Beispielen für einige Zahlenfolgen f (kT ) die z-Transformierte F (z) berechnet werden. Als Beipiele werden gewählt die Sprungfunktion, die Rampenfunktion und die Exponentialfunktion.
214
10 Die z-Transformation
Beispiel 10.1: f (kT ) 6 1
6 6 6 6 6 6
Gesucht ist die z-Transformierte der Sprungfunktion f (kT ) = {1; 1; 1; . . . . . .}. t -
T 2T 3T 4T Lösung: F (z) = Z{f (kT )} =
∞
1 · z −k = 1 + z −1 + z −2 + z −3 + z −4 + . . .
k=0
Dies ist eine geometrische Reihe, die in ihrer allgemeinen Form lautet: ∞
q i−1 = 1 + q 1 + q 2 + q 3 + . . . =
i=1
q∞ − 1 . q−1
Mit q = z −1 lautet dann die Lösung: F (z) =
1 z z −∞ − 1 = . = z −1 − 1 1 − z −1 z−1
Die Reihe konvergiert für |z| > 1.
Beispiel 10.2: f (kT ) 6 1
Gesucht ist die z-Transformierte der abklingenden e-Funktion für k = 0, 1, 2, . . . f (kT ) = e−akT
6 6
6 6 6 T 2T 3T 4T
t -
Lösung: F (z) =
∞ k=0
e−akT ·z −k =
∞ −aT −1 k e ·z = 1+e−aT z −1 +e−2aT ·z −2 +. . . k=0
10.1 Definition
215
Substituiert man q = e−aT · z −1 , so erkennt man wieder die geometrische Reihe. Das Ergebnis lautet: F (z) =
1 z −1 = = e−aT · z −1 − 1 1 − e−aT · z −1 z − e−aT
mit dem Konvergenzbereich |z| > e−aT .
Beispiel 10.3: f (kT ) 6
6
6
6 6 T 2T 3T 4T
Gesucht ist die z-Transformierte der Rampenfunktion f (kT ) = k· T für k = 0, 1, 2, . . .
6 t -
Lösung: F (z) =
∞
kT · z −k = T · {z −1 + 2 · z −2 + 3 · z −3 + 4 · z −4 + . . .} .
k=0
Dann gilt für z −1 · F (z) = T · {z −2 + 2 · z −3 + 3 · z −4 + . . .} und für F (z) − F (z) · z −1 = T · {z −1 + z −2 + z −3 + . . .} = T · z −1 · {1 + z −1 + z −2 + z −3 + . . .} . Der Term in der geschweiften Klammer ist wieder die geometrische Reihe. Somit wird F (z) − F (z) · z −1 = T · z −1 ·
T z = . z−1 z−1
Aufgelöst nach F (z) resultiert F (z) =
T ·z T 1 = · . −1 1−z z−1 (z − 1)2
Die Reihe konvergiert für |z| > 1.
216
10 Die z-Transformation
Beispiel 10.4: f (kT ) 6 1
Gesucht ist die z-Transformierte der Folge t k 1 T 1 f (kT ) = = = a−k a a für k = 0, 1, . . .
6 6 6 T
2T
6
6
3T
t 6 -
4T
Lösung: F (z) =
∞ 1 k=0
a
k
·z
−k
∞ 1 = a·z k=0
k
=1+
1 −1 1 · z + 2 · z −2 + . . . a a
Mit q = 1/(a · z) erkennt man wieder die geometrische Reihe, sodass die Lösung folgt zu z −1 = . F (z) = 1/(a · z) − 1 z − 1/a Konvergenz ist gegeben für |z| > 1/a.
In der Korrespondenztabelle auf der folgenden Seite sind die wichtigsten Korrespondenzen der Zeitfunktionen und zugehörigen Laplace-Transformierten sowie der z-Transformierten zusammengestellt. Aufgabe 10.1: Berechnen Sie die z-Transformierten der folgenden Zahlenfolgen: 1. f (kT ) = (kT )2 2. f (kT ) = kT · e−akT 3. f (kT ) = (kT )2 · e−akT Lösung: 1. F (z) =
T 2 z · (z + 1) (z − 1)3
2. F (z) =
T z · e−aT (z − e−aT )2
3. F (z) =
T 2 z · e−aT (z + e−aT ) (z − e−aT )3
10.1 Definition
217
f (t) ≡ f (kT )
L-Transformierte
z-Transformierte F (z)
1
δ-Impuls δ(t)
1
1
2
Sprungfunktion σ(t)
3
t
4
t2
5
t3
6
tn
1 s 1 s2 2 s3 6 s4 n!
7
e−at
8
t · e−at
9
t2 · e−at
10
tn · e+at
11
1 − e−at
12
e−at − e−bt
z z−1 Tz (z − 1)2 T 2 z · (z + 1) (z − 1)3 3 T z · (z 2 + 4 z + 1) 4 (z − 1)
n z ∂ lim a→0 ∂an z − eaT z z − e−aT T · z · e−aT (z − e−aT )2 T 2 · z · e−aT · (z + e−aT ) (z − e−aT )3
z ∂n n ∂a z − eaT (1 − e−aT ) · z (z − 1) · (z − e−aT ) z · (e−aT − e−bT ) (z − e−aT ) · (z − e−bT )
13
1 − (1 + at)e−at
14
at − 1 + e−at
15
1+
be−at − ae−bt a−b
16
sin ω0 t
17
cos ω0 t
18
e−δt · sin ωe t
19
e−δt · cos ωe t
20
at/T = ak
sn+1 1 s+a 1 (s + a)2 2 (s + a)3 n! (s − a)n+1 a s · (s + a) b−a (s + a)(s + b) a2 s(s + a)2 a2 2 s (s + a) a·b s(s + a)(s + b) ω0 s2 + ω02 s 2 s + ω02 ωe (s + δ)2 + ωe2 s+δ (s + δ)2 + ωe2 1 s − (1/T ) ln a
z z−1
−
z z−e−aT
−
aT z·e−aT (z−e−aT )2
(aT −1+e−aT )z 2 +{1−e−aT (1+aT )}z (z−1)2 ·(z−e−aT ) z z−1
+
z a−b
.
b z−e−aT
−
a z−e−bT
/
z · sin ω0 T z 2 − 2z · cos ω0 T + 1 z · (z − cos ω0 T ) 2 z − 2z · cos ω0 T + 1 e−δT · z · sin ωe T 2 z − 2z · e−δT · cos ωe T + e−2δT z 2 − e−δT · z · cos ωe T 2 z − 2z · e−δT · cos ωe T + e−2δT z z−a
Tabelle 10.1: Korrespondenztabelle der Laplace- und der z-Transformation
218
10 Die z-Transformation
Aufgabe 10.2: Berechnen Sie einen geschlossenen Ausdruck für die z-Transformierte des folgenden Signalverlaufs f (kT ): f (t) 16
×
×
×
2T
3T
4T
× ×
T
- t
Lösung: F (z) =
z+1 . 2z · (z − 1)
Aufgabe 10.3: Berechnen Sie einen geschlossenen Ausdruck für die z-Transformierte der folgenden Dreiecksschwingung. 6 1×
× T
−1
2T
×
× 3T
×
t -
4T
×
Lösung: F (z) =
z . z+1
Aufgabe 10.4: Berechnen Sie einen geschlossenen Ausdruck für die z-Transformierte der folgenden Dreiecksfunktion. f (t) 6 1
""bb " b " bb " T
2T
t -
3T
Lösung: F (z) =
(z + 1)2 . 2z 3
10.2 Rechenregeln der z-Transformation
219
10.2
Rechenregeln der z-Transformation
10.2.1
Überlagerungssätze
Definition. Für die z-Transformation gelten die beiden folgenden Überlagerungssätze. Folglich ist die z-Transformation eine lineare Transformation. Satz 10.1 Für eine beliebige Konstante a gilt: Z {a · f (kT )} = aZ {f (kT )} = a · F (z) .
(10.5)
Satz 10.2 Für eine Linearkombination von Zahlenfolgen gilt: Z {f1 (kT ) + f2 (kT )} = Z {f1 (kT )} + Z {f2 (kT )} = F1 (z) + F2 (z) . (10.6)
Beispiel 10.5: Gegeben sei die Zahlenfolge f (kT ) = c · e−akT . Dann lautet die z-Transformierte dieser Zahlenfolge 0 1 0 1 Z c · e−akT = c · Z e−akT = c ·
z . z − e−aT
Beispiel 10.6: f (kT ) 6
6 6 6 1 6 6
Gegeben sei die Zahlenfolge f (kT ) = f1 (kT ) + f2 (kT ) mit für k = 0, 1, 2, . . . (Sprungfunktion) f1 (kT ) = 1 f2 (kT ) = kT für k = 0, 1, 2, . . . (Rampenfunktion). -t
T 2T 3T 4T Dann lautet die z-Transformierte Z {f (kT )} = Z {f1 (kT ) + f2 (kT )} = Z {f1 (kT )} + Z {f2 (kT )} = =
z z · (z − 1) + T · z z · (z + [T − 1]) T ·z = = . + z − 1 (z − 1)2 (z − 1)2 (z − 1)2
220
10 Die z-Transformation
10.2.2
Ähnlichkeitssatz (Dämpfungssatz)
Definition. Der Ähnlichkeits- bzw. Dämpfungssatz beinhalten die gleiche Aussage, jedoch in unterschiedlicher Darstellung. Satz 10.3: Ähnlichkeitssatz Ist a eine beliebige Konstante, so gilt: 0 1 Z a−k · f (kT ) = F (a · z) .
(10.7)
Satz 10.4: Dämpfungssatz Ist α eine beliebige Konstante, so gilt: 0 1 Z e−αkT · f (kT ) = F (eαT · z) .
(10.8)
Beispiel 10.7: Gegeben seien die Sprungfunktion f1 (kT ) = 1 für k = 0, 1, . . . und der t Term a− T = a−k für k = 0, 1, . . .. Dann lautet die z-Transformierte 1 0 Z a−k · f1 (kT ) = F1 (a · z) =
z (az) = . (az) − 1 z − (1/a)
Beispiel 10.8: Gegeben seien die Sprungfunktion f1 (kT ) = 1 für k = 0, 1, 2, . . . und der Term e−αkT für k = 0, 1, 2, . . .. Dann lautet die z-Transformierte: 0 1 Z e−αkT · f1 (kT ) = F1 (eαT · z) =
z (eαT z) = . −1 z − e−αT
(eαT z)
Beispiel 10.9: Gesucht ist die z-Transformierte einer phasenverschobenen Sinusfunktion.
f (kT ) 6 - ϕ 6
66
66
6
6
6 ?
?
? ? ??
?
kT
Es sei f (t) = sin(ω0 t + ϕ) mit ϕ < 0.
10.2 Rechenregeln der z-Transformation
Mit sin(ω0 t + ϕ) =
221
/ 1 . j(ω0 t+ϕ) e − e−j(ω0 t+ϕ) folgt 2j 1 2j 1 = 2j 1 = 2j
Z {sin(ω0 t + ϕ)} =
=
0 1 0 1 · Z ejω0 t · ejϕ − Z e−jω0 t · e−jϕ 1 1 0 0 · ejϕ · Z 1 · ejω0 t − e−jϕ · Z 1 · e−jω0 t −jω0 T jω0 T jϕ ze −jϕ ze · e −e ze−jω0 T − 1 zejω0 T − 1
z z · ejϕ − e−j(ω0 T −ϕ) + ej(ω0 T −ϕ) − z · e−jϕ · , 2j z 2 − z · (ejω0 T + e−jω0 T ) + 1
und es resultiert: Z {sin(ω0 t + ϕ)} =
z 2 · sin ϕ + z · sin(ω0 T − ϕ) . z 2 − 2z cos ω0 T + 1
10.2.3
Verschiebungssätze
Definition. Die Verschiebungssätze spezifizieren die z-Transformierten von zeitverschobenen Zahlenfolgen. Satz 10.5: Rechtsverschiebung Ist f1 (kT ) eine Zahlenfolge, dann lautet die z-Transformierte der um n Abtastschritte nach rechts verschobenen Zahlenfolge f2 (kT ) = " f1 (kT − nT )
f1 (kT ) 6
f2 (kT ) 6
hier n = 2
6
6
6 6 6
6 6 6 6
T 2T 3T 4T 5T
t -
6
6 6
t -
T 2T 3T 4T 5T
Z {f2 (kT )} = Z {f1 (kT − nT )} = z −n · Z {f1 (kT )} = z −n · F1 (z) . (10.9) Auch diese Rechenregel soll an einem Beispiel veranschaulicht werden.
222
10 Die z-Transformation
Beispiel 10.10: f2 (kT ) 6 Rechtsverschiebung der Sprungfunktion f2 (kT ) = 1 für k = 2, 3, . . .
6 6 6 6 t T 2T 3T 4T 5T
Z {f2 (kT )} = z −2 · Z {f1 (kT )} = z −2 · F1 (z) = z −2 ·
1 z = . z−1 z · (z − 1)
Beispiel 10.11: f (kT ) 6
Rechtsverschiebung der Sinusfunktion Z {sin ω(kT − nT )} = z · sin ωT z −n · 2 z − 2z cos ωT + 1
66 66 6 6 6 6 ? kT ? - nT ???
Entsprechend zur Rechtsverschiebung ist die Linksverschiebung von Zahlenfolgen wie folgt definiert: Satz 10.6: Linksverschiebung Ist f1 (kT ) eine Zahlenfolge, dann lautet die z-Transformierte der um n Abtastschritte nach links verschobenen Zahlenfolge f1 (kT ) 6
6
6
6
6
6 6 6 6
hier n = 3
f2 (kT ) 6
6 6
-
6
6 6
6 6
t
T 2T 3T 4T 5T 6T
-
t
T 2T 3T 4T 5T 6T
wie folgt: 2 Z {f2 (kT )} = Z {f1 (kT + nT )} = z · n
F1 (z) −
n−1 ν=0
3 f1 (νT ) · z
−ν
. (10.10)
10.2 Rechenregeln der z-Transformation
223
Beispiel 10.12: f2 (kT ) 6
6 6 6 6 6 t 6 T 2T 3T 4T 5T
Linksverschiebung der Rampenfunktion f1 (kT ) = kT für k = 0, 1, . . . um einen Abtastschritt (n = 1)
Z {f2 (kT )} = Z {f1 (kT − T )} = z · {F1 (z) − f1 (0)} =z·
T ·z (z − 1)2
F2 (z) =
=
T · z2 . (z − 1)2
T · z2 . (z − 1)2
10.2.4
Faltungssatz
Definition. Der Faltungssatz wird bei der Bestimmung der Faltungssumme von zwei Zahlenfolgen benötigt. Seine Hauptanwendung findet er im Zusammenhang mit z-Übertragungsfunktionen.
Satz 10.7: Faltungssatz Sind f1 (kT ) und f2 (kT ) zwei Zahlenfolgen, so bezeichnet man die folgende Summe k
f1 (νT ) · f2 (kT − νT ) = f1 (kT ) ∗ f2 (kT )
(10.11)
ν=0
als Faltungssumme (f1 gefaltet mit f2 ) mit „ ∗ “ als Faltungsoperator. Die zTransformierte der Faltungssumme ist gleich dem Produkt ihrer z-Transformierten: 2 Z
k
3 f1 (νT ) · f2 (kT − νT )
= F1 (z) · F2 (z) .
(10.12)
ν=0
Anwendungen werden in Abschnitt 11.1.3 über Übertragungsfunktionen gezeigt.
224
10 Die z-Transformation
10.2.5
Grenzwertsätze
Definition. Sofern Anfangswert f (0) und Endwert f (∞) einer Zahlenfolge existieren, gelten die folgenden Sätze: Satz 10.8: Anfangswertsatz Es gilt (10.13)
f (0) = lim f (kT ) = lim F (z), z→∞
k=0
sofern der Anfangswert existiert.
Satz 10.9: Endwertsatz Es gilt f (∞) = lim f (kT ) = lim (z − 1) · F (z), k→∞
z→1
(10.14)
sofern der Endwert existiert.
Beispiel 10.13: f (kT ) 6 1
Betrachtet werde die Zahlenfolge für k = 0, 1, 2, . . . f (kT ) = e−akT z mit F (z) = z − e−aT
6 6
T
6
6
6
t -
2T 3T 4T
Anfangswert: f (0) = lim F (z) = lim z→∞
z→∞
z =1. z − e−aT
Endwert: z · (z − 1) =0. z→1 z − e−aT
f (∞) = lim (z − 1) · F (z) = lim z→1
Die berechneten und aus der Zeichnung ersichtlichen Grenzwerte stimmen, wie man leicht sieht, überein.
10.3 Die inverse z-Transformation
225
Beispiel 10.14: f (kT ) 6 - ϕ 66 6 6
66
6 6 ? ? ???
? ?
kT
Gegeben sei die phasenverschobene Sinusfunktion f (t) = sin(ω0 t + ϕ) mit ϕ < 0 .
Anfangswert: z 2 · sin ϕ + z · sin(ω0 T + ϕ) = sin ϕ. z→∞ z 2 − 2z · cos ω0 T + 1
f (0) = lim F (z) = lim z→∞
Endwert: (z − 1) · z 2 · sin ϕ + z · sin(ω0 T + ϕ) f (∞) = lim (z − 1) · F (z) = lim = 0. z→1 z→1 z 2 − 2z · cos ω0 T + 1
Der Endwert existiert jedoch nicht!
10.3
Die inverse z-Transformation
Definition. Der Zeitfunktion f (t) ist im Bildbereich eindeutig eine Laplace-Transformierte F (s) zugeordnet und entsprechend gilt für ihre Rücktransformation, dass der Laplace-Transformierten F (s) im Zeitbereich eine Zeitfunktion f (t) eindeutig zugeordnet ist. Für die z-Transformation gilt eine entsprechende Rücktransformation vom Bildbereich in den diskreten Zeitbereich (inverse z-Transformation): Z −1 {F (z)} = f (kT ).
(Operatorschreibweise)
(10.15)
Die inverse z-Transformation liefert für F (z) wieder die Werte der Zahlenfolge f (kT ) für k = 0, 1, . . .. Wie bei der Laplace-Transformation ist die inverse z-Transformation über ein komplexes Umlaufintegral definiert: f (kT ) =
1 2πj
4 F (z) · z k−1 dz.
(10.16)
Der Weg des Umlaufintegrals ist ein Kreis im Konvergenzgebiet von F (z). Für die Auswertung dieser inversen Transformation gibt es neben anderen die folgenden drei Möglichkeiten.
226
10.3.1
10 Die z-Transformation
Rücktransformation durch Polynomdivision
Methode. Hier wird die z-Transformierte F (z) durch Polynomdivision in eine konvergierende Potenzreihe nach z −i entwickelt. Unter Verwendung von Gleichung 10.2 wird: b0 + b1 z + b2 z 2 + . . . a0 + a1 z + a2 z 2 + . . . = (b0 + b1 z + b2 z 2 + . . .) ÷ (a0 + a1 z + a2 z 2 + . . .) ∞ = f (0) + f (T )z −1 + f (2T )z −2 + . . . = f (kT ) · z −k
F (z) =
(10.17)
k=0
Dividiert man das Zählerpolynom von F (z) durch das Nennerpolynom nach den Regeln der Polynomdivision, so liefert diese Division die gewünschte Potenzreihe. Die Vorfaktoren der Potenzen von z sind die gesuchten Werte der Zahlenfolge f (kT ). Beispiel 10.15: Gegeben sei die z-Transformierte F (z) =
z2
8z . − 4z + 3
Dann liefert die Polynomdivision: 8 z : (z 2 − 4 z + 3) = 8z −1 + 32z −2 + 104z −3 + 320z −4 + . . . −8 z ∓ 32 ± 24 z −1 32 − 24 z −1 −32 ∓ 128 z −1 ± 96 z −2 104 z −1 − 96 z −2 −104 z −1 ∓ 416 z −2 ± 312 z −3 320 z −2 − 312 z −3 .. . Der Vergleich mit Gleichung 10.17 ergibt dann: f (0) = 0;
f (T ) = 8;
f (2T ) = 32; f (3T ) = 104;
f (4T ) = 320;
Beispiel 10.16: Es sei F (z) =
z . z − e−aT
Dann liefert die Polynomdivision:
10.3 Die inverse z-Transformation
227
z : (z − e−aT ) = 1 + e−aT · z −1 + e−2aT z −2 + . . . − z ∓ e−a T e−aT −e−aT ∓ e−2aT z −1 e−2aT z −1 .. . Somit ist f (0) = 1 = e0·aT ; f (T ) = e−aT ; oder allgemein gilt f (kT ) = e−akT .
f (2T ) = e−2aT ; . . .
Aufgabe 10.5: Gegeben ist die folgende z-Transformierte F (z) =
z 2 − 14 z . z 2 − 12 z + 14
Berechnen Sie mittels Polynomdivision die ersten 7 Funktionswerte f (0) . . . f (6T ). Lösung: f (0) = 1; f (T ) = 1/4; f (2T ) = −1/8; f (5T ) = 1/64; f (6T ) = 1/64;
10.3.2
f (3T ) = −1/8;
f (4T ) = −1/32;
Partialbruchzerlegung
Methode. Die zu transformierende z-Transformierte wird in Partialbrüche zerlegt, und dann wird mittels der Korrespondenztabelle 10.1 die Rücktransformation in den Zeitbereich durchgeführt. Wichtig ist es hierbei darauf zu achten, dass die Partialbrüche z die Form aufweisen. Die inverse z-Transformation von F (z), also f (kT ), erhält z − zi man dann als Summe der rücktransformierten Partialbrüche. Beispiel 10.17: Wie in Beispiel 10.15 sei gegeben: F (z) =
8z 8z = . z 2 − 4z + 3 (z − 3) · (z − 1)
Die Partialbruchzerlegung liefert: F (z) =
b·z z 2 · (a + b) + z · (−a − 3b) a·z + = . z−3 z−1 (z − 3) · (z − 1)
228
10 Die z-Transformation
Durch Koeffizientenvergleich erhält man die Werte für a und b zu: 3 a + b = 0 ⇒ b = −a ⇒ 2a = 8 ⇒ a = 4 b = −4 . −a − 3b = 8 Damit gilt für F (z) die Partialbruchzerlegung z z −4· . F (z) = 4 · z−3 z−1 Aus der Tabelle 10.1 folgt dann die Rücktransformation zu: f (kT ) = 4 · 3k − 4 · 1k = 4 · (3k − 1), " 3t/T und t = k · T für ganzzahlige k. mit 3k = Damit resultiert wiederum f (0) = 0; f (T ) = 8; f (2T ) = 32; f (3T ) = 104; f (4T ) = 320; . . . Aufgabe 10.6: Gegeben ist die folgende z-Transformierte F (z) =
3z 2 − 1,6z . z 2 − z + 0,24
1. Berechnen Sie eine geschlossene Lösung für die Zahlenfolge f (kT ). 2. Wie lauten Anfangs- und Endwert der Zahlenfolge? Lösung: 1. f (kT ) = 0,6k + 2 · 0,4k . 2. f (0) = 3
f (∞) = 0
10.3.3
Auswertung des Umkehrintegrals (Residuensatz)
Methode. Die inverse z-Transformation ist über das komplexe Umlaufintegral 4 1 F (z) · z k−1 dz f (kT ) = (10.18) 2πj bestimmt, wobei der Integrationsweg im Konvergenzgebiet von F (z) verläuft. Mithilfe der Funktionentheorie kann man die Lösung dieses Integrals auf die Bestimmung der Residuen Res {zi } zurückführen: 1 0 f (kT ) = Res F (z) · z k−1 z=zi (10.19) i
10.3 Die inverse z-Transformation
229
Die Residuen werden an den Polstellen der Funktion F (z) wie folgt berechnet: (i) F (z) besitzt nur eine einfache Polstelle bei z = zi . Dann berechnet man das Residuum und somit f (kT ) wie folgt: 0 1 f (kT ) = Res F (z) · z k−1 z=zi = lim (z − zi ) · F (z) · z k−1 . (10.20) z→zi
Beispiel 10.18: Gegeben sei die z-Transformierte F (z) =
z . z−3
Es liegt ein einfacher Pol von F (z) bei z = z1 = 3 vor. Berechnung des Residuums: 1 0 Res F (z) · z k−1 z=3 = lim (z − 3) · z→3
z · z k−1 = 3k . z−3
⇒ f (kT ) = 3k .
(ii) F (z) ist eine gebrochene rationale Funktion mit mehreren einfachen B(z) , mit B(z) und A(z) als Polynome in Polstellen bei z = zi . Ist F (z) · z k−1 = A(z) z, so berechnet man die Residuen an den Stellen z = zi und somit f (kT ) wie folgt: B(z) 1 0 Res F (z) · z k−1 z=zi = . (10.21) f (kT ) = dA(z)/dz z=zi i i Beispiel 10.19: Gegeben ist F (z) =
z wie in Beispiel 10.18. Dann gilt z−3
B(z) zk = , z−3 A(z) dA(z) und es wird für z = z1 = 3 dann = 1 sowie B(z)|z=3 = 3k und somit wird dz z=3 B(z) 3k = 3k . = dA(z)/dz z=z1 1 F (z) · z k−1 =
Damit wird 0 1 f (kT ) = Res F (z) · z k−1 z=3 = 3k .
230
10 Die z-Transformation
Beispiel 10.20: Gegeben ist F (z) =
8z 8z = 2 . (z − 3) · (z − 1) z − 4z + 3
Dann gilt F (z) · z k−1 =
B(z) 8z · z k−1 = . − 4z + 3 A(z)
z2
und es wird
A (z) =
dA(z) = 2z − 4. dz
Somit wird für die Polstellen z1 = 3 und z2 = 1 dann
f (kT ) =
0
Res F (z) · z
i
8z k = 2z − 4
z=3
k−1
1
8z k + 2z − 4
z=zi
2 B(z) = A (z) z=zi i=1
= 4 · 3k − 4 · 1k z=1
= 4 · (3k − 1)
(iii) F (z) besitzt einen q-fachen Pol bei z = zi . Das Residuum an der q-fachen Polstelle lautet in diesem Fall: 0 1 f (kT ) = Res F (z)z k−1 z=zi =
dq−1 1 lim (z − zi )q F (z) · z k−1 . q−1 (q − 1)! z→zi dz (10.22)
Beispiel 10.21: Es ist F (z) =
z T ·z z 2 + z · (T − 1) + = 2 z − 1 (z − 1) (z − 1)2
die Überlagerung einer Sprungfunktion und einer Rampenfunktion.
10.4 z-Transformation bei der Lösung von Differenzengleichungen
231
Dann wird für den doppelten Pol bei z = 1: 0 1 d z 2 + z(T − 1) k−1 f (kT ) = Res F (z)z k−1 z=1 = lim z (z − 1)2 z→1 dz (z − 1)2 d k+1 = lim z + z k (T − 1) z→1 dz 1 0 = lim (k + 1)z k + kz k−1 (T − 1) z→1
= (k + 1) + k(T − 1) = 1 + k · T.
Aufgabe 10.7: Gegeben ist die z-Transformierte F (z) =
z . (z − 0,5)2
Berechnen Sie die Zahlenfolge f (kT ). Lösung:
f (kT ) = k/2k−1 .
10.4
Anwendung der z-Transformation bei der Lösung von Differenzengleichungen
Methode. Analog zur Vorgehensweise bei den Differentialgleichungen lässt sich in gleicher Weise die Transformation in den Bildbereich (z-Bereich) zur Lösung von Differenzengleichungen verwenden. Dies verdeutlicht Abb. 10.1. Zeitbereich:
Differenzengleichung ? z-Transformation
Bildbereich:
? Algebraische Gleichung
Lösung 6 Rücktransformation 6 -
Lösung
Abbildung 10.1: Schema zur Lösung von Differenzengleichungen Die Differenzengleichung wird in den z-Bereich transformiert, aufgelöst und die Lösung in den Zeitbereich rücktransformiert.
232
10 Die z-Transformation
Beispiel 10.22 Homogene Differenzengleichung: Gegeben sei die homogene Differenzengleichung x(kT ) − 4x([k − 1]T ) + 3x([k − 2]T ) = 0 x([k + 2]T ) − 4x([k + 1]T ) + 3x(kT ) = 0.
bzw.
Die z-Transformation nach der Linksverschiebungsregel liefert: 1 0 z 2 · X(z) − x(0) − x(T ) · z −1 − 4z · {X(z) − x(0)} + 3X(z) = 0. Aufgelöst nach X(z) = Z{x(kT )} erhält man: X(z) =
z 2 · x(0) + z · [x(T ) − 4x(0)] . z 2 − 4z + 3
Für z. B. x(0) = 1 und x(T ) = 2 resultiert dann: X(z) =
z 2 − 2z 1 z 1 z = · + · . − 4z + 3 2 z−3 2 z−1
z2
Rücktransformiert in den Zeitbereich lautet das Ergebnis: x(kT ) =
1 k 1 k 1 · 3 + · 1 = · (1 + 3k ). 2 2 2
Dies ist eine Zahlenfolge, die bei den angegebenen Anfangswerten beginnt und dann dem berechneten Bildungsgesetz gehorcht. Beispiel 10.23 Inhomogene Differenzengleichung: Gegeben sei die inhomogene Differenzengleichung x([k + 2]T ) − 4x([k + 1]T ) + 3x(kT ) = 2k . Die Transformation in den z-Bereich mit den Anfangswerten x(0) = x(T ) = 0 liefert: z 2 · X(z) − 4z · X(z) + 3X(z) =
z . z−2
Aufgelöst nach X(z) = Z{x(kT )} erhält man: z − 4z + 3) · (z − 2) z = (z − 3) · (z − 1) · (z − 2) z 1 z z 1 + · − . = · 2 z−3 2 z−1 z−2
X(z) =
(z 2
10.4 z-Transformation bei der Lösung von Differenzengleichungen
233
Die Rücktransformation in den Zeitbereich ergibt dann das Ergebnis: 1 2 1 = 2 1 x(kT ) = 2
x(kT ) =
· 3k +
1 k · 1 − 2k 2
· (1 + 3k − 2 · 2k ) · 1 + 3k − 2k+1 .
11
Diskrete Übertragungsfunktionen
In den vorangehenden Kapiteln wurden die wesentlichen Bestandteile eines digitalen Regelkreises vorgestellt und die z-Transformation für das Rechnen mit Zahlenfolgen eingeführt. Hierbei wurde die Analogie zur Laplace-Transformation an verschiedenen Stellen hervorgehoben. Für die weitere einfache Behandlung von digitalen Regelkreisen wird nun wie bei den kontinuierlichen Systemen der Begriff der Übertragungsfunktion eingeführt und die Rechenregeln für Übertragungsfunktionen werden erläutert.
11.1
Die z-Übertragungsfunktion
11.1.1
Definition
Grundlagen. Im vorangehenden Abschnitt 10.4 wurde die Lösung einer inhomogenen Differenzengleichung mit einer definierten Anregung auf der rechten Seite untersucht. Treten auf der rechten Seite der Differenzengleichung die Werte einer Eingangsgröße xe (kT ) zu verschiedenen Abtastzeitpunkten auf, so liegt die allgemeine Form einer inhomogenen Differenzengleichung eines Systems vor: an xa (kT − nT ) + . . . + a2 xa (kT − 2T ) + a1 xa (kT − T ) + a0 xa (kT ) = = b0 xe (kT ) + b1 xe (kT − T ) + . . . + bm xe (kT − mT ).
(11.1)
Diese Differenzengleichung ist nach [31] nur dann realisierbar, wenn die folgenden Bedingungen erfüllt sind: • Falls b0 = 0 muss auch a0 = 0 sein. • Falls b0 = 0, a0 = 0 und b1 = 0, muss a1 = 0 sein, usw. Damit ist gewährleistet, dass der Ausgangswert zum Zeitpunkt kT , also xa (kT ), nicht von zukünftigen Eingangswerten xe (kT + iT ) mit i > 0 abhängt. Ferner1 gilt m ≥ < n. Diese Bedingungen gelten auch für die nachfolgend definierte z-Übertragungsfunktion G(z). Die Transformation der Differenzengleichung 11.1 in den z-Bereich (mithilfe von Satz 10.5 „Rechtsverschiebung“) ergibt mit Xi (z) = Z {xi (kT )} und i = a, e: 1
Das Zeichen
≥
n) bzw. z n (für n > m) ergibt sich die Darstellung der z-Übertragungsfunktion mit positiven Exponenten von z wie folgt: G(z) =
β0 + β1 z + . . . + βm z m Xa (z) = . Xe (z) α0 + α1 z + . . . + αn z n
(11.4)
Bei positiven Exponenten von z in der Übertragungsfunktion muss jedoch gelten m ≤ n, damit das System realisierbar ist. Mithilfe dieser z-Übertragungsfunktion G(z) kann bei gegebener z-transformierter Eingangsgröße Xe (z) die z-transformierte Ausgangsgröße Xa (z) eines Übertragungssystems berechnet werden zu Xa (z) = G(z) · Xe (z).
(11.5)
Diese Gleichung kann wie bei der Übertragungsfunktion Laplace-transformierter Größen in die nachfolgende Blockdarstellung in einem Blockschaltbild übertragen werden.
Xe (z)
-
G(z)
Xa (z) -
Abbildung 11.1: Übertragungsverhalten in Blockdarstellung
11.1 Die z-Übertragungsfunktion
237
Systeme mit und ohne Totzeit. Für die in der Regelungstechnik vorkommenden Systeme ohne Totzeit ist der Zählergrad der z-Übertragungsfunktion gleich dem Nennergrad, d. h. es gilt in Gleichung 11.3 also m = n und somit wird G(z) =
b0 + b1 z −1 + . . . + bn z −n Xa (z) = . Xe (z) a0 + a1 z −1 + . . . + an z −n
(11.6)
Eine Totzeit von d Abtastschritten wird durch die Hinzufügung eines Terms z −d erfasst. G(z) =
b0 + b1 z −1 + . . . + bn z −n Xa (z) = · z −d . Xe (z) a0 + a1 z −1 + . . . + an z −n
(11.7)
Falls der Koeffizient b0 = 0 (für a0 = 0 und d = 0), so ist das System sprungfähig, für ein xe (kT ) = 0 wird auch das xa (kT ) = 0. Falls der Koeffizient b0 = 0 (für a0 = 0) ist, so kann man in diesem Fall den Term z −1 aus dem Zählerpolynom herausziehen und der Totzeit hinzufügen. Dann wird der Zählergrad kleiner als der Nennergrad, an der Totzeit von d Abtastschritten ändert sich jedoch nichts: G(z) =
b1 + b2 z −1 + . . . + bn−1 z −(n−1) −(d+1) Xa (z) = ·z . Xe (z) a0 + a1 z −1 + . . . + an z −n
Ist auch der Koeffizient b1 = 0, so kann man entsprechend verfahren. In den nachfolgenden Abschnitten wird die je nach Bedarf erforderliche Form der z-Übertragungsfunktion verwendet. Anwendung. Die Ermittlung der Übertragungsfunktionen von Regler und Regelstrecke mit Abtaster und Halteglied ist eine der Hauptaufgaben der digitalen Regelung. Mit der Berechnung dieser diskreten Übertragungsfunktionen beschäftigen sich die nachfolgenden Abschnitte dieses Kapitels. Als Vorbereitung für das Rechnen mit diesen Übertragungsfunktionen dient das anschließend gerechnete Beispiel. Beispiel 11.1: Gegeben sei die z-Übertragungsfunktion G(z) =
z 1 = . z−2 1 − 2z −1
Gesucht ist der Systemausgang xa (kT ) für einen Sprungeingang xe (kT ) = 1 für alle Werte von k. Lösung: 1. z-Transformation des Eingangssignals: Z {xe (kT )} = Xe (z) =
z . z−1
238
11 Diskrete Übertragungsfunktionen
2. Berechnung des z-transformierten Ausgangssignals: Xa (z) = G(z) · Xe (z) = = 2·
z z2 z · = z−2 z−1 (z − 2) · (z − 1)
z z − z−2 z−1
3. Rücktransformation von Xa (z) in den Zeitbereich: xa (kT ) = 2 · 2k − 1k = 2k+1 − 1
11.1.2
Die Gewichtsfolge
Definition. Wählt man als Eingangssignal xe (kT ) die Impulsfunktion δ(kT ), wobei δ(kT ) definiert ist zu 1 für k = 0 δ(kT ) = (11.8) 0 für k = 0, dann resultiert die z-Transformierte der Impulsfunktion zu Z {δ(kT )} =
∞
δ(kT ) · z −k = 1 · z 0 + 0 · z −1 + . . . = 1.
(11.9)
k=0
Die Reaktion xa (kT ) eines Regelkreisgliedes auf eine Impulsfunktion am Eingang nennt man die Impulsantwort. Die Anwendung von Gleichung 11.5 liefert für die Impulsantwort Xa (z) = G(z) · Xe (z) = G(z) · Z {δ(kT )} = G(z) · 1 = G(z).
(11.10)
Hieraus folgt, dass die z-transformierte Impulsantwort eines diskreten Systems gleich der z-Übertragungsfunktion ist. Die Rücktransformation der Impulsantwort Xa (z) des Systems G(z) in den Zeitbereich nennt man die Gewichtsfolge g(kT ): g(kT ) = Z −1 {Xa (z)} = Z −1 {G(z)} G(z) = Z {g(kT )}
bzw.
(11.11)
Beispiel 11.2: Die z-Übertragungsfunktion eines Systems laute G(z) = Dann ergibt sich die Gewichtsfolge g(kT ) zu: −1 −1 g(kT ) = Z {G(z)} = Z 2·
z z−3
2z . z−3
= 2 · 3k .
11.2 Z-Übertragungsfunktion der Regelstrecke
11.1.3
239
Anwendung des Faltungssatzes
Vorgehensweise. Für ein gegebenes Eingangssignal xe (kT ) in ein System, beschrieben durch die Gewichtsfolge g(kT ), kann man das diskrete Ausgangssignal xa (kT ) durch die Anwendung der Faltungssumme nach Gleichung 10.11 berechnen. Es gilt xa (kT ) =
k
xe (νT ) · g(kT − νT ) = " xe (kT ) ∗ g(kT )
(11.12)
ν=0
mit dem Zeichen „ ∗ “ für die Faltungsoperation. Diese Gleichung wird plausibel, wenn man sich die Eingangsfolge xe (νT ) in die folgende Summe zerlegt denkt: xe (νT ) = " xe (0) · δ(0) + xe (T ) · δ(T ) + xe (2T ) · δ(2T ) + . . .
(11.13)
Das Ausgangssignal xa (kT ) ergibt sich dann aus der Summe der Impulsantworten und führt zur Erklärung von Gleichung 11.12. Die z-Transformation von Gleichung 11.12 ergibt dann mit Anwendung des Faltungssatzes (von Abschnitt 10.2.4) Z {xa (kT )} = Z
k
xe (νT ) · g(kT − νT )
(11.14)
ν=0
Xa (z) = G(z) · Xe (z) . Gleichung 11.14 stellt die eigentliche Definition der z-Übertragungsfunktion dar.
11.2
Z-Übertragungsfunktion der Regelstrecke
Methode der Berechnung. Nach der Definition der diskreten Übertragungsfunktion sollen nun die Übertragungsfunktionen von Regelstrecke und Regler entwickelt werden. Die zugrunde gelegte Standardform eines digitalen Regelkreises nach Abb. 11.2 zeigt, dass im Regelkreis die Regelstrecke einschließlich Verstärker und Stellglied zusammen mit dem vorgeschalteten Halteglied und dem nachgeschalteten Abtaster analysiert werden muss. x(t) w(kT )
Strecke mit Halteglied und Abtaster u(kT )
Abtaster
- t
pt - i- Regler − 6
u ¯ (t)
-Halteglied
Regelstrecke, - Verstärker und Stellglied
Abbildung 11.2: Standardform eines digitalen Regelkreises
Abtaster
- t
pt
x(kT )
-
240
11 Diskrete Übertragungsfunktionen
Das Eingangssignal in die „Strecke mit Halteglied und Abtaster“ ist die Impulsfolge u(kT ). Das wahre Eingangssignal in die physikalische Strecke ist jedoch das treppenförmige Signal u ¯(t) nach dem Halteglied (siehe Abb. 11.3). u(kT ) 6
u¯(t) 6 6
6
6
6
6
6 -t
-t
T 2T 3T 4T 5T
T 2T 3T 4T 5T
Abbildung 11.3: Streckeneingangssignale Man benötigt für die Berechnungen im Regelkreis nun die z-Übertragungsfunktion der Regelstrecke (Übertragungsfunktion G(s)) mit vorgeschaltetem Halteglied (Übertragungsfunktion H0 (s)) und nachgeschaltetem Abtaster (siehe Abb. 11.4). u(kT )
- H0 (s)
u ¯(t)
-
G(s)
x(t)
- t
t
x(kT ) -
Abbildung 11.4: Strecke mit Abtaster und Halteglied
11.2.1
Grundlegende Berechnungsmethode
Berechnung der Übertragungsfunktion H0 (s) des Haltegliedes. Zur Berechnung der Übertragungsfunktion der Strecke mit vorgeschaltetem Halteglied und nachgeschaltetem Abtaster ist also zunächst die (Laplace-)Übertragungsfunktion H0 (s) des Haltegliedes zu berechnen, da die Übertragungsfunktion der Strecke G(s) als bekannt vorausgesetzt ist. Die Eingangssignale in das Halteglied sind Deltaimpulse zu den Abtastzeitpunkten. Für einen Eingangsimpuls δ(t) liefert das Halteglied 0-ter Ordnung einen Puls von der Breite der Abtastzeit T und der Höhe des Deltaimpulses. u¯(t) 6
u(kT ) 6 6 0 T 2T
t -
u(kT )
- H0 (s)
Abbildung 11.5: Signalfolge am Halteglied
u ¯(t) -
0 T
2T
t -
11.2 Z-Übertragungsfunktion der Regelstrecke
241
Aus dieser Signalfolge am Halteglied kann man die Beschreibung des Haltegliedes ableiten. Aus dem Deltaimpuls zum Zeitpunkt T am Eingang wird am Ausgang ein Sprung mit positiver Sprunghöhe zum Zeitpunkt T und mit negativer Sprunghöhe zum Zeitpunkt 2T . Da die Sprungfunktion das Integral eines Deltaimpulses darstellt, entspricht die Übertragungsfunktion des Haltegliedes einer positiven Integration, gefolgt von einer zeitverzögerten negativen Integration: H0 (s) =
1 1 Xa (s) 1 − e−sT = − · e−sT = . Xe (s) s s s
(11.15)
Die Zeitverzögerung um einen Abtastschritt T entspricht einem Totzeitglied mit der (Laplace-)Übertragungsfunktion e−sT . Diese Zeitverschiebung von einer Abtastzeit entspricht aber bei der z-Transformation nach Satz 10.5 (Rechtsverschiebung) der Multiplikation mit z −1 ; d. h. es gilt also die folgende Beziehung zwischen der Laplace-Variablen s und der Variablen z der z-Transformation: e−sT = " z −1 z = " esT .
bzw. (11.16)
Berechnung der Übertragungsfunktion H0 G(z). Aus den Überlegungen zur Gewichtsfolge ergibt sich nach Gleichung 11.11, dass die z-Übertragungsfunktion eines linearen Regelkreisgliedes die z-Transformierte der Gewichtsfolge ist. Die Reihenschaltung von Halteglied H0 (s) und Strecke G(s) stellt ein lineares Regelkreisglied dar. Folglich ergibt sich zunächst die Gewichtsfunktion dieser Reihenschaltung nach den Rechenregeln der Laplace-Transformation zu gH0 G (t) = L−1 {H0 (s) · G(s)} .
(11.17)
Die Gewichtsfolge dieser Reihenschaltung entspricht dann der Gewichtsfunktion zu den Abtastzeitpunkten und sie lautet: gH0 G (kT ) = gH0 G (t)t=kT = L−1 {H0 (s) · G(s)}|t=kT .
(11.18)
Die z-Transformierte dieser Gewichtsfolge ergibt schließlich die gesuchte z-Übertragungsfunktion der Strecke mit vorgeschaltetem Halteglied und nachgeschaltetem Abtaster unter Verwendung der Gleichung: H0 G(z) = Z {gH0 G (kT )} .
(11.19)
Setzt man nun Gleichung 11.15 in Gleichung 11.18 ein, so resultiert für die Gewichtsfolge: gH0 G (kT ) = L−1 {H0 (s)G(s)}|t=kT = L−1
G(s) G(s) −sT − e . (11.20) s s t=kT
242
11 Diskrete Übertragungsfunktionen
Da auch die inverse Laplace-Transformation eine lineare Operation darstellt, kann man Gleichung 11.20 in zwei getrennte Terme aufspalten
G(s) G(s) −sT −1 −1 gH0 G (kT ) = L e −L . (11.21) s s t=kT t=kT 1 ist der erste Term von Gleichung 11.21 die Eins heitssprungantwort h(t) der Strecke G(s) zu den Abtastzeitpunkten t = k·T , d. h. h(kT ):
G(s) −1 L = h(kT ). (11.22) s t=kT Aufgrund der Beziehung H(s) = G(s)·
Der zweite Term von Gleichung 11.21 stellt die gleiche, aber um einen Abtastschritt verschobene Sprungantwort dar
G(s) −sT e L−1 = h(kT − T ). (11.23) s t=kT Beide Gleichungen 11.22 und 11.23 in Gleichung 11.21 eingesetzt liefern gH0 G (kT ) = h(kT ) − h(kT − T ). Wendet man hierauf den Z-Operator an und berücksichtigt Gleichung 11.19 sowie die Rechtsverschiebung von h(kT − T ), so resultiert: Z {gH0 G (kT )} = H0 G(z) = (1 − z −1 )Z {h(kT )} . Setzt man für h(kT ) wieder den Ausdruck aus Gleichung 11.22 ein, so erhält man
z−1 G(s) −1 −1 H0 G(z) = (1 − z ) · Z {h(kT )} = Z L . z s t=kT 3 2
−1 führt man den Operator Z ein und er... Für die Operation Z L t=kT
hält somit die gesuchte z-Übertragungsfunktion der Regelstrecke mit vorgeschaltetem Halteglied und nachgeschaltetem Abtaster zu z−1 ·Z H0 G(z) = z
G(s) s
.
(11.24)
Damit kann man unter Benutzung von Tabelle 10.1 ausgehend von der Laplace-Transformierten von G(s)/s zunächst in der linken Spalte die zugehörige Gewichtsfolge2 2
g (kT ) soll zu den Abtastzeitpunkten die Gewichtsfolge von G(s)/s kennzeichnen im Unterschied zu g(kT ) als Gewichtsfolge von G(s).
11.2 Z-Übertragungsfunktion der Regelstrecke
243
/ berechnen und dann in der rechten Spalte die z-Transfor t=kT mierte ablesen. Da die Gewichtsfolge jedoch für die weitere Berechnung nicht erforderlich ist (sie dient nur zum Verständnis der Transformation), kann man auch direkt für z−1 liefert G(s)/s die z-Transformierte ablesen. Die abschließende Multiplikation mit z dann letztlich die gesuchte z-Übertragungsfunktion H0 G(z) der Regelstrecke mit vorgeschaltetem Halteglied und nachgeschaltetem Abtaster. Die Anwendung soll an einem Beispiel gezeigt werden.
g (kT ) = L−1
.
G(s) s
Beispiel 11.3: Gegeben sei die Übertragungsfunktion der P T1 -Strecke G(s) = u(kT )
u ¯(t)
- H0 (s)
x(t)
a s+a
-
- t
a . s+a t
x(kT ) -
Abbildung 11.6: P T1 -Strecke mit Abtaster und Halteglied G(s) a = und die zugehörige (aber nicht expliziert erforders s · (s + a) liche) Gewichtsfolge lautet
G(s) −1 g (t)|t=kT = g (kT ) = L = 1 − e−akT . s Damit wird dann
t=kT
Die z-Transformierte von g (kT ) = 1 − e−akT ist laut Tabelle 0 1 Z 1 − e−akT =
(1 − e−aT ) · z . (z − 1) · (z − e−aT )
Dann resultiert die z-Übertragungsfunktion z−1 Z H0 G(z) = z
2 −1
L
G(s) s
t=kT
3 =
0 1 z−1 Z 1 − e−akT z
(1 − e−aT ) · z z−1 · = z (z − 1) · (z − e−aT ) 1 − e−aT = . z − e−aT
244
11 Diskrete Übertragungsfunktionen
Beispiel 11.4:
a·b ist die Übertragungsfunktion einer P T2 -Strecke gegeben. (s + a) · (s + b) Gesucht ist die z-Übertragungsfunktion der Strecke mit vorgeschaltetem Halteglied und nachgeschaltetem Abtaster. Diesmal soll ohne Zwischenschritte direkt mit der Korrespondenz in Tabelle 10.1 gearbeitet werden. Aus der Tabelle 10.1 (Korrespondenz 15) liest man die z-Transformierte von G(s)/s ab zu:
Mit G(s) =
Z
G(s) s
=
b·z a·z z + − . z − 1 (a − b)(z − e−aT ) (a − b)(z − e−bT )
Damit resultiert dann:
G(s) z−1 H0 G(z) = ·Z z s
z b·z a·z z−1 · + − = z z − 1 (a − b)(z − e−aT ) (a − b)(z − e−bT ) a · (z − 1) b · (z − 1) − = 1+ (a − b)(z − e−aT ) (a − b)(z − e−bT ) (a − b)(z − e−aT )(z − e−bT ) + (z − 1)[b(z − e−bT ) − a(z − e−aT )] = (a − b) · (z − e−aT ) · (z − e−bT ) .. . a · (z − e−aT ) · (1 − e−bT ) − b · (z − e−bT ) · (1 − e−aT ) (11.25) = (a − b) · (z − e−aT ) · (z − e−bT )
11.2.2
Berechnung mittels Partialbruchzerlegung
Vorgehensweise. Eine einfache Methode der Berechnung der z-Übertragungsfunktion der Strecke geht über die Anwendung der Partialbruchzerlegung. Für einfache Pole der Regelstrecke soll nachfolgend eine geschlossene Lösung gezeigt werden. Es sei die Übertragungsfunktion der Regelstrecke gegeben zu:
G(s) =
n i=1
ci . s − si
(11.26)
11.2 Z-Übertragungsfunktion der Regelstrecke
245
Dann ergibt sich die z-Übertragungsfunktion der Strecke mit Halteglied und Abtaster zu 2 n 3 ci z−1 1 H0 G(z) = Z · z s − si s i=1 2 n 3 z − 1 ci (1 − esi T ) · z H0 G(z) = · z −si (z − 1) · (z − esi T ) i=1 =
n i=1
−
ci (1 − esi T ) . · si (z − esi T )
(11.27)
Bei mehrfachen Polen ist die Partialbruchzerlegung entsprechend vorzunehmen. Beispiel 11.5: Die Partialbruchzerlegung von G(s) aus Beispiel 11.4 ergibt G(s) =
a·b a·b a·b =− + (s + a) · (s + b) (a − b) · (s + a) (a − b) · (s + b)
Mithilfe von Gleichung 11.27 wird dann H0 G(z) = +
(1 − e−aT ) a·b (1 − e−bT ) a·b · − · (a − b) · (−a) (z − e−aT ) (a − b) · (−b) (z − e−bT )
.. . =
a · (z − e−aT ) · (1 − e−bT ) − b · (z − e−bT ) · (1 − e−aT ) . (a − b) · (z − e−aT ) · (z − e−bT )
Aufgabe 11.1: Gegeben ist die Übertragungsfunktion einer Regelstrecke zu F (s) =
5 + 13s . 6s2 + 5s + 1
Berechnen Sie die z-Übertragungsfunktion H0 G(z) der Regelstrecke mit vorgeschaltetem Halteglied und nachgeschaltetem Abtaster für eine Abtastzeit von T = 0,1 s. Lösung: H0 G(z) =
0,2119z − 0,2039 . z 2 − 1,9184z + 0,92
246
11.2.3
11 Diskrete Übertragungsfunktionen
Berechnung mittels der Residuenmethode
Vorgehensweise. Unter Zuhilfenahme von Sätzen der Funktionentheorie und des Faltungssatzes im Frequenzbereich kann man die z-Übertragungsfunktion der Strecke herleiten zu 2 G(s) 3 n z−1 s ·z · Res , (11.28) H0 G(z) = z z − esT i=0 s=si
mit si als Pole von G(s)/s. Somit ist der Pol s0 = 0 ebenfalls enthalten. Die Auswertung der Residuen geschieht mithilfe der Funktionentheorie. Sind die Pole von G(s)/s einfache Pole, so vereinfacht sich die Berechnung von H0 G(z) mithilfe von Gleichung 10.21 zu n z z−1 Z(s) · · H0 G(z) = , (11.29) sT z (dN (s)/ds) z − e 0 s=si i=0 dabei gilt G(s) Z(s) Z(s) = = . s s · N (s) N0 (s)
Beispiel 11.6: Gegeben ist die Übertragungsfunktion der P T2 -Strecke zu G(s) =
(11.30)
a·b . (s + a) · (s + b)
Dann sind Z(s) = a · b sowie N0 (s) = s · (s + a) · (s + b) und dN0 (s) = N0 (s) = (s + a) · (s + b) + s · (2s + a + b). ds Weiterhin lauten die Pole s0 = 0; s1 = −a und s2 = −b.
Eingesetzt in Gleichung 11.29 resultiert: ab z a·b·z z−1 · · − + H0 G(z) = z ab z − 1 (−a)(a − b)(z − e−aT )
a·b·z + (−b)(a − b)(z − e−bT ) .. . a · (z − e−aT ) · (1 − e−bT ) − b · (z − e−bT ) · (1 − e−aT ) = (a − b) · (z − e−aT ) · (z − e−bT )
11.3 Z-Übertragungsfunktion des Reglers
247
Aufgabe 11.2: Gegeben ist die Übertragungsfunktion einer IT1 -Regelstrecke F (s) =
1 . s · (1 + 0,5s)
Berechnen Sie die z-Übertragungsfunktion H0 G(z) der Regelstrecke mit vorgeschaltetem Halteglied und nachgeschaltetem Abtaster für eine Abtastzeit T = 50 ms. Lösung: H0 G(z) =
0,2419z −1 + 0,2339z −2 . 100 · (1 − 1,9048z −1 + 0,9048z −2)
11.3
Z-Übertragungsfunktion des Reglers
Die Ermittlung der z-Übertragungsfunktion des Reglers bzw. der zugehörigen im Rechner zu programmierenden Rekursionsgleichung stellt die eigentliche Hauptaufgabe der digitalen Regelung dar. Diese Aufgabenstellung wird in den Kapiteln 13 bis 15 ausführlich behandelt. Um das Verständnis für das Rechnen mit Übertragungsfunktionen im geschlossenen Regelkreis (Abschnitt 11.4) und die Untersuchungen zu Stabilität und Zeitverhalten (Kapitel 12) zu erhöhen, soll an dieser Stelle jedoch schon eine Möglichkeit der Ermittlung der z-Übertragungsfunktion des Reglers aufgezeigt werden.
11.3.1
Das Halteglied-Äquivalent
Berechnung. Für eine gegebene (Laplace-)Übertragungsfunktion FR (s) des Reglers, die z. B. mit den Verfahren der klassischen Regelungstechnik entwickelt wird, werden in Kapitel 13.1 verschiedene Methoden zur Berechnung der z-Übertragungsfunktion des Reglers D(z) vorgeschlagen. Eine der Methoden ist das Halteglied-Äquivalent, bei dem das bei der Strecke in Abschnitt 11.2 angewendete Verfahren übernommen wird. Gedanklich wird dabei angenommen, dass der digitale Regler, beschrieben durch D(z), durch eine Reihenschaltung von Halteglied, analogem Regler FR (s) und Abtaster approximiert werden kann. Analog zu Gleichung 11.24 lautet dann die Transformationsbeziehung:
z−1 FR (s) Xa (z) = ·Z . D(z) = Xe (z) z s
(11.31)
Die Anwendung dieser Umformung soll am Beispiel eines PI-Reglers gezeigt werden. Beispiel 11.7: Die Übertragungsfunktion eines PI-Reglers lautet: FR (s) =
KP · (1 + TN s) Xa (s) KP = = KP + . Xe (s) TN s TN s
248
11 Diskrete Übertragungsfunktionen
Gesucht ist D(z) = Xa (z)/Xe (z). Die Anwendung von Gleichung 11.31 ergibt dann
KP KP z−1 1 KP 1 z−1 ·Z + · Z KP · + D(z) = · = z s T N s2 z s T N s2
KP z−1 z Tz · KP · + = · z z−1 TN (z − 1)2 KP · TN · (z − 1) + KP · T KP · T = = KP + TN · (z − 1) TN · (z − 1) KP · TN · z + KP · (T − TN ) = TN · z − TN KP · TN + KP · (T − TN ) · z −1 D(z) = . TN − TN · z −1
Für die Reglerparameter KP = 2, TN = 1,5 s und die Abtastzeit T = 0,1 s lautet dann die z-Übertragungsfunktion des Reglers: D(z) =
3 − 2,8z −1 2 − 1,8667z −1 Xa (z) = = . Xe (z) 1,5 − 1,5z −1 1 − z −1
(11.32)
Diese z-Übertragungsfunktion wird im Rechner als Differenzengleichung einprogrammiert. Zur Ermittlung dieser Differenzengleichung wird zunächst Gleichung 11.32 umgeformt auf die Gleichung Xa (z) · {1 − z −1 } = Xe (z) · {2 − 1,8667z −1} bzw. −1 −1 Xa (z) − z Xa (z) = 2Xe (z) − 1,8667z Xe (z).
Die Anwendung von Satz 10.5 über die Rechtsverschiebung (um einen Abtastschritt „ − 1“) ergibt dann für die Rücktransformation dieser Gleichung in den Zeitbereich: xa (kT ) − xa (kT −1T ) = 2xe (kT ) − 1,8667xe (kT −1T ). Damit lautet dann die endgültige Rekursionsgleichung des PI-Reglers, die als Reglerprogramm zu erstellen ist: xa (kT ) = xa (kT − T ) + 2xe (kT ) − 1,8667xe(kT − T ).
(11.33)
11.4 Rechenregeln für diskrete Übertragungsfunktionen
11.4
249
Rechenregeln für diskrete Übertragungsfunktionen
Für die Verschaltung von z-Übertragungsfunktionen gelten dieselben Rechenregeln wie für die (Laplace-)Übertragungsfunktion. Dabei muss beim Rechnen mit z-Übertragungsfunktionen jedoch beachtet werden, an welcher Stelle ein Abtaster vorhanden ist. Die Übertragungsfunktionen der nächsten Blockschaltbilder sollen entweder Übertragungsfunktionen von Regelkreisgliedern mit und ohne Halteglied, beschrieben z. B. durch H0 (s) · Gi (s), sein, oder digital arbeitende Regler, beschrieben durch D(z), darstellen. Eingangsgrößen sind die Signale Xe (s) bzw. die Signale Xe (z). (i) Reihenschaltung 1: Xe (s)- t t Xe (z) - H0 (s)G1 (s)
- t t
- H0 (s)G2 (s)
(z) - t t X a-
Abbildung 11.7: Reihenschaltung 1
G(z) =
Xa (z) = H0 G1 (z) · H0 G2 (z) Xe (z)
(11.34)
(ii) Reihenschaltung 2: Xe (s) - t
t
Xe (z) - H0 (s)G1 (s)
-
G2 (s)
- t
t
Xa (z) -
Abbildung 11.8: Reihenschaltung 2 Liegt nun jedoch zwischen den beiden Teilsystemen 1 und 2 der Reihenschaltung 1 kein Abtaster mit Halteglied, so ergibt sich eine andere z-Übertragungsfunktion dieser Reihenschaltung 2:
G(z) =
Xa (z) = H0 G1 G2 (z) Xe (z)
(11.35)
Der Einfluss des zusätzlichen Abtasters und Halteglieds zwischen den beiden Regelkreisgliedern soll am Beispiel zweier PT1 -Strecken verdeutlicht werden.
250
11 Diskrete Übertragungsfunktionen
Beispiel 11.8: Die Übertragungsfunktionen zweier PT1 -Glieder lauten: G1 (s) =
2 s+2
und
G2 (s) =
3 . s+3
Für die Reihenschaltung 1 resultiert dann H0 G1 (z) =
1 − e−2T z − e−2T
und
H0 G2 (z) =
1 − e−3T , z − e−3T
und somit berechnet man Ga (z) = H0 G1 (z) · H0 G2 (z) =
(1 − e−2T ) · (1 − e−3T ) . (z − e−2T ) · (z − e−3T )
Aber es wird im Unterschied dazu für die Reihenschaltung 2 G1 (s) · G2 (s) =
6 . (s + 2) · (s + 3)
Daraus folgt dann unter Verwendung von Gleichung 11.25 Gb (z) = H0 G1 G2 (z) =
3 · (z − e−3T ) · (1 − e−2T ) − 2 · (z − e−2T ) · (1 − e−3T ) (z − e−2T ) · (z − e−3T )
Die resultierenden z-Übertragungsfunktionen der beiden Reihenschaltungen sind unterschiedlich, d. h. es gilt: Ga (z) = Gb (z) .
(iii) Parallelschaltung: Xe (s) - t
t
Xe (z)
- H0 (s)G1 (s)
- t
t
- H0 (s)G2 (s)
- t
t
+ Xa (z) ? i 6 ±
Abbildung 11.9: Parallelschaltung Es werden nun zwei Regelkreisglieder parallel geschaltet. Für diese Parallelschaltung resultiert die Übertragungsfunktion G(z) =
Xa (z) = H0 G1 (z) ± H0 G2 (z) . Xe (z)
(11.36)
11.4 Rechenregeln für diskrete Übertragungsfunktionen
251
(iv) Standardregelkreis (Kreisschaltung 1): Für diesen Regelkreis in der Standardform nach Abb. 11.10 erhält man mit denselben Rechenregeln, wie sie für analoge Regelkreise gelten, die Führungsübertragungsfunktion des geschlossenen Regelkreises zu: GW (z) =
D(z) · H0 GS (z) Xa (z) = . Xe (z) 1 + D(z) · H0 GS (z) H0 GS (z)
Regler Xe (s) - t
t
Xe (z) - i − 6
(11.37)
- H0 (s)
D(z)
- GS (s)
- t
t
Xa (z) -
Abbildung 11.10: Standardregelkreis (v) Kreisschaltung 2: Die nachfolgende Kreisschaltung repräsentiert eine Schaltung, die im Wesentlichen aus analogen Übertragungsgliedern und zusätzlichen Abtastern mit Halteglied besteht. Xe (s) - i - t − 6
t
- H0 (s)G1 (s)
t
t
Xa (z) -
G2 (s)
Abbildung 11.11: Kreisschaltung 2 Die Übertragungsfunktion H0 (s)G1 (s) entspricht der Reihenschaltung von Halteglied, analogem Regler und analoger Strecke, d. h. H0 (s)G1 (s) = " H0 (s) · FR (s) · FS (s), und G2 (s) entspricht der Übertragungsfunktion FM (s) eines analogen Sensors. Für diese Struktur eines Regelkreises resultiert als diskrete Übertragungsfunktion
G(z) =
H0 G1 (z) H0 FR FS (z) Xa (z) = = . Xe (z) 1 + H0 G1 G2 (z) 1 + H0 FR FS FM (z)
(11.38)
252
11 Diskrete Übertragungsfunktionen
(vi) Regelkreis mit Störgröße (Kreisschaltung 3): Für diesen Regelkreis mit einer Störgröße nach Abb. 11.12 existiert keine Störübertragungsfunktion, da die Störgröße nicht über einen Abtaster und Halteglied auf den Regelkreis einwirkt. Sie wirkt direkt als „analoge“ Störgröße auf den Streckenteil GS2 (s). H0 GS1 GS2 (z)
Regler Xe (z) i D(z) 6-
- H0 (s)
Vz (s)
− ? - GS1 (s) - i - GS2 (s)
- t t
Xa (z) -
Abbildung 11.12: Regelkreis mit Störgröße Vz (s) Die diskrete Ausgangsgröße Xa (z) für einen Störeingang kann allerdings berechnet werden zu: Xa (z) =
Vz GS2 (z) . 1 + D(z) · H0 GS1 GS2 (z)
(11.39)
Häufig wird jedoch so getan, als ob die Störgröße Vz (s) über einen Abtaster und Halteglied auf den Streckenteil einwirkt, und die nachfolgende z-Übertragungsfunktion angenommen: GV (z) =
Xa (z) −H0 GS2 (z) = . Vz (z) 1 + D(z) · H0 GS1 GS2 (z)
(11.40)
Aufgabe 11.3: Gegeben ist ein Standardregelkreis mit den Übertragungsfunktionen von Regler und Strecke zu: D(z) = 0,2 ·
1 − 0,5z −1 1 − 0,9z −1
und
H0 G(z) =
z + 0,6 . (z − 0,6) · (z − 0,8)
Berechnen Sie für einen Einheitssprung der Führungsgröße w(t) 1. die Regelgröße x(kT ) für k → ∞, 2. die Stellgröße y(kT ) für k = 0 und für k → ∞. Lösung: 1. x(∞) = 0,9524, 2. y(0) = 0,2 und y(∞) = 0,0476 .
11.5 Kanonische Realisierungen von z-Übertragungsfunktionen
253
Aufgabe 11.4: Gegeben ist ein Standardregelkreis mit den Übertragungsfunktionen von Regler und Strecke zu: D(z) =
1 − 0,95z −1 100 − 100z −1
und
H0 G(z) =
z + 0,6 . (z − 0,6)(z − 0,8)(z − 0,9)
Berechnen Sie für einen Einheitssprung der Führungsgröße w(t) 1. die Regelgröße x(kT ) für k → ∞, 2. die Stellgröße y(kT ) für k = 0 und für k → ∞. Lösung: 1. x(∞) = 1 und
2. y(0) = 0,01 und y(∞) = 0,0050
Aufgabe 11.5: Für einen Standardregelkreis sind Regler- und Streckenübertragungsfunktion wie folgt gegeben: D(z) =
0,3(z − 0,4) z−1
und
H0 G(z) =
z + 0,2 . (z − 0,7) · (z − 0,6)
Wie groß ist die bleibende Regeldifferenz e(kT ) = w(kT ) − x(kT ) für k → ∞, wenn der Sollwert w(kT ) eine Rampe mit der Steigung 1 darstellt? Die Abtastzeit betrage T = 1 s. Lösung:
e(∞) = 10/18
11.5
Kanonische Realisierungen von z-Übertragungsfunktionen
Einführung. Bei manchen technischen Anwendungen, z. B. in der Kfz-Technik, Audiotechnik, Videotechnik, werden z-Übertragungsfunktionen in der Form G(z) =
Xa (z) b0 + b1 z −1 + . . . + bn z −n = Xe (z) a0 + a1 z −1 + . . . + an z −n
(11.41)
hardwaremäßig mit Hilfe von Einheitsverzögerungen, realisiert als Schieberegister, in verschiedenen Strukturen aufgebaut. Diese Einheitsverzögerung, dargestellt als Block
254
11 Diskrete Übertragungsfunktionen
mit der z-Übertragungsfunktion z −1 gibt das Eingangssignal xe (kT ) um ein Abtastintervall T verzögert wieder aus. Es existieren verschiedene kanonische Realisierungen (Normalformen der Realisierung), deren Namen auf die Ermittlung dieser Strukturen mit Hilfe der Zustandsdarstellung zurückgehen (siehe Teil I: Mehrgrößenregelung). Es sind dies unter anderen die Regelungsnormalform, die Beobachtungsnormalform und die Diagonalform, die nachfolgend vorgestellt werden sollen. Regelungsnormalform. Die Abbildung 11.13 zeigt die Realisierung der z-Übertragungsfunktion mittels der Regelungsnormalform. Die Realisierung besteht aus einer Serienschaltung von Einheitsverzögerungen, vor bzw. nach denen jeweils die Signale ausgekoppelt und entweder über die Verstärkungen bi zum Ausgang geführt bzw. über die Verstärkungen zum Eingang zurückgeführt werden. Man erkennt hierbei sofort, dass der Parameter a0 immer ungleich Null sein muss, sonst ist die z-Übertragungsfunktion nicht realisierbar. In vielen Darstellungen wird aus Gründen der Vereinfachung der Parameter a0 = 1 gewählt. - h 6 b0 Xe (z) - h - 1/a0 − 6
6 t - z −1
b1
b2
6 - −1 t z ? a1
6 t ? a2
? h
- h 6 Xa (z)
- h 6
? h
bn - z −1
6 t ? an
Abbildung 11.13: Blockschaltbild der Regelungsnormalform Die Gültigkeit dieser Realisierung soll an einer z-Übertragungsfunktion der Ordnung zwei überprüft werden. Diese z-Übertragungsfunktion wird in Abb. 11.14 dargestellt. In dieser Darstellung sind die Hilfsvariablen X1 (z), X2 (z) und X3 (z) zwischen den Einheitsverzögerungen eingeführt. Die Aufstellung der Gleichungen für dieses System 2. Ordnung ergibt:
Xa (z) = b0 X3 (z) + b1 X2 (z) + b2 X1 (z) X2 (z) = z −1 X3 (z) X1 (z) = z −1 X2 (z) = z −2 X3 (z) und 1 · [Xe (z) − a1 X2 (z) − a2 X1 (z)] . X3 (z) = a0
(11.42) (11.43) (11.44) (11.45)
11.5 Kanonische Realisierungen von z-Übertragungsfunktionen - i 6 b0 Xe (z)
- i - 1/a0 6−
6 t - z −1
X3 (z)
255
- i (z) X a 6
b1 X2 6
t - z −1 ? a1
b2 6 t X1 (z) ? a2
? i Abbildung 11.14: Blockschaltbild der Regelungsnormalform für ein System 2. Ordnung
Das Einsetzen der Gleichungen 11.43 und 11.44 in Gleichung 11.42 führt dann zu Xa (z) = b0 X3 (z) + b1 z −1 X3 (z) + b2 z −2 X3 (z) = b0 + b1 z −1 + b2 z −2 X3 (z)
(11.46)
und das Einsetzen in Gleichung 11.45 ergibt: X3 (z) =
1 · [Xe (z) − a1 z −1 X3 (z) − a2 z −2 X3 (z)] . a0
(11.47)
Die Auflösung von Gleichung 11.47 nach X3 (z) lautet dann: a0 X3 (z) + a1 z −1 X3 (z) + a2 z −2 X3 (z) = Xe (z) a0 + a1 z −1 + a2 z −2 · X3 (z) = Xe (z)
bzw.
Damit wird X3 (z) =
Xe (z) . a0 + a1 z −1 + a2 z −2
(11.48)
Das Einsetzen von Gleichung 11.48 in Gleichung 11.46 führt dann zu dem gesuchten Ergebnis: G(z) =
b0 + b1 z −1 + b2 z −2 Xa (z) = Xe (z) a0 + a1 z −1 + a2 z −2
(11.49)
Ist b0 = 0 so ist das diskrete System sprungfähig. In vielen Darstellungen wird eine Beschränkung der Regelungsnormalform auf nicht sprungfähige Systeme mit der Normierung a0 = 1 gewählt G(z) =
b1 z −1 + . . . + bn z −n Xa (z) = . Xe (z) 1 + a1 z −1 + . . . + an z −n
(11.50)
256
11 Diskrete Übertragungsfunktionen - i 6Xa (z)
- i 6
Xe (z)
- i - z −1 6−
b1
b2
6 t - z −1 ? a1
t6 ? a2
? i
bn
? i
- z −1
t6 ? an
Abbildung 11.15: Blockschaltbild für ein normiertes System mit b0 = 0 und a0 = 1 Dies führt dann zu der Blockschaltbilddarstellung nach Abb. 11.15. Die Erzeugung von Systemen mit einer Totzeit ist durch Nullsetzen der entsprechenden Koeffizienten ebenfalls leicht möglich. Setzt man in Gleichung 11.41 z. B. die Koeffizienten b0 und an gleich Null, so liegt damit ein System mit einer Totzeit von einem Abtastintervall T vor. Diese kanonischen Formen der Realisierung erlauben einen effizienten Aufbau derartiger digitaler Systeme mit Schieberegistern. Beobachtungsnormalform (Beobachternormalform). Die Beobachtungsnormalform für die z-Übertragungsfunktion G(z) =
Xa (z) b0 + b1 z −1 + . . . + bn z −n = Xe (z) a0 + a1 z −1 + . . . + an z −n
(11.51)
weist eine Struktur ähnlich zur Regelungsnormalform auf, und ist in Abb. 11.16 dargestellt. Xe (z) ? bn ? i - z −1 − 6 an 6
? bn−1
-
i - z −1 - ? − 6 an−1 6
? b1 i - z −1 - ? − 6 a1
? b0 i - 1/a0 - ?
X -a (z)
6
Abbildung 11.16: Blockschaltbild eines Systems in Beobachtungsnormalform
11.5 Kanonische Realisierungen von z-Übertragungsfunktionen
257
Auch hier ist wieder leicht erkennbar, dass ein System mit dem Koeffizienten a0 = 0 nicht realisierbar ist. Die gleichungsmäßige Überprüfung dieser Beobachtungsnormalform verläuft analog zur Vorgehensweise bei der Regelungsnormalform. Sie wird daher an dieser Stelle nicht wiederholt. Sonderformen dieser Beobachtungsnormalform liegen z. B. vor mit den Parameterkonfigurationen a0 = 1 und b0 = 0, also die z-Übertragungsfunktion G(z) =
Xa (z) b1 z −1 + . . . + bn z −n = Xe (z) 1 + a1 z −1 + . . . + an z −n
(11.52)
die in Abb. 11.17 als Blockschaltbild dargestellt ist. Xe (z)
? bn ? i - z −1 − 6 an 6
? bn−1 - ? i - z −1 − 6 an−1 6
? b1 - ? i - z −1 − 6 a1
Xa (z) -
6
Abbildung 11.17: Blockschaltbild der Beobachtungsnormalform mit den Parameterwerten a0 = 1 und b0 = 0 Diagonalform. Bei der dritten vorgestellten kanonischen Form ist zunächst eine Partialbruchzerlegung der z-Übertragungsfunktion erforderlich. Für diese Partialbruchzerlegung der z-Übertragungsfunktion G(z) =
Xa (z) b0 + b1 z −1 + . . . + bn z −n = Xe (z) a0 + a1 z −1 + . . . + an z −n
(11.53)
müssen Zähler und Nenner der z-Übertragungsfunktion mit z n multipliziert werden. Dies führt dann zu der Form Xa (z) b0 z n + b1 z n−1 + . . . + bn G(z) = = , (11.54) Xe (z) a0 z n + a1 z n−1 + . . . + an und die Partialbruchzerlegung der z-Übertragungsfunktion 11.54 ergibt: G(z) =
Xa (z) α1 α2 αn = α0 + + + ... + . Xe (z) z − z1 z − z2 z − zn
(11.55)
Darin sind die zi die Pole der z-Übertragungsfunktion nach Gleichung 11.54 und die αi sind die zugehörigen Residuen. Für ein nicht sprungfähiges System ist der Koeffizient α0 = 0. Die Blockschaltbilddarstellung dieser Diagonalform zeigt die Abb. 11.18. Für eine ausführliche Darstellung dieser und weiterer kanonischer Formen wird auf die Bücher von Ackermann [1] und Isermann [31] verwiesen.
258
11 Diskrete Übertragungsfunktionen
Xe (z) ? α0
-
? α2
? α1
? i - z −1 6
? i - z −1 6 z1 t - ? i
? αn ? i - z −1 6
z2 t - ? i-
Abbildung 11.18: Blockschaltbild der Diagonalform des Systems
zn t Xa (z) - ? i -
12
Stabilität und Zeitverhalten diskreter Systeme
Wie bei den analogen Regelsystemen hat auch bei den digitalen Regelsystemen die Stabilität von Regelkreisgliedern und Regelkreisen eine entscheidende Bedeutung. Die dabei anzuwendenden Stabilitätsbedingungen gelten sowohl für ein einzelnes Regelkreisglied als auch für den gesamten Regelkreis. Daher wird nachfolgend allgemein die Stabilität von z-Übertragungsfunktionen G(z) betrachtet. Diese Übertragungsfunktion kann also sowohl ein einzelnes Regelkreisglied als auch einen geschlossenen Regelkreis repräsentieren.
12.1
Stabilitätsbedingungen
Definitionen. Für die nachfolgend aufgestellten und untersuchten Stabilitätsbedingungen wird von der folgenden z-Übertragungsfunktion ausgegangen: G(z) =
b0 + b1 z −1 + . . . + bm z −m Xa (z) = , Xe (z) a0 + a1 z −1 + . . . + an z −n
(12.1)
wobei gilt m ≥ < n. Das z-transformierte Ausgangssignal Xa (z) dieser Übertragungsfunktion bei Anregung mit dem Eingangssignal Xe (z) berechnet man zu Xa (z) = G(z) · Xe (z).
(12.2)
Unter Verwendung von Gleichung 11.12 gilt für das diskrete Ausgangssignal xa (kT ) bei Anregung mit xe (kT ) xa (kT ) =
k
xe (νT ) · g(kT − νT ),
(12.3)
ν=0
mit g(kT ) als Gewichtsfolge. Die Definition der externen Stabilität1 eines digitalen Systems und nur diese soll hier betrachtet werden, basiert auf der Beschreibung des Übertragungsverhaltens durch die Faltungssumme nach Gleichung 12.3: 1
Die sogenannte interne Stabilität bezieht sich auf die Stabilität der homogenen Differenzengleichung eines Systems.
260
12 Stabilität und Zeitverhalten diskreter Systeme Ist für eine beschränkte Eingangsfolge xe (kT ) die Ausgangsfolge xa (kT ) ebenfalls beschränkt, dann heißt das System extern stabil.
Für ein beschränktes Eingangssignal (mit Me als beliebiger Konstante) |xe (kT )| ≤ Me < ∞ ist das Ausgangssignal ebenfalls beschränkt, wenn die folgende Bedingung
|xa (kT )| ≤ |
k
xe (νT ) · g(kT − νT )| ≤
ν=0
≤
k
k
|xe (νT )| · |g(kT − νT )|
ν=0
Me · |g(kT − νT )|
≤ Me ·
ν=0
k
|g(kT − νT )|
ν=0
erfüllt ist. Die Ausgangsgröße xa (kT ) eines digitalen Systems ist beschränkt, d. h. es gilt (mit Ma als beliebiger Konstante) |xa (kT )| ≤ Ma < ∞ , sofern die folgende Stabilitätsbedingung erfüllt ist: Ist g(νT ) die Gewichtsfolge eines digitalen Systems, dann ist das System genau dann extern stabil, wenn die Beziehung ∞
|g(νT )| < ∞
und damit erst recht
ν=0
k
|g(νT )| < ∞
(12.4)
ν=0
erfüllt ist. Unter Verwendung der Funktionentheorie wird in [23] gezeigt, dass diese im Zeitbereich umständlich zu handhabende Stabilitätsbedingung nach Gleichung 12.4 bei Übergang in die z-Ebene zu der nachfolgenden wesentlich einfacheren Stabilitätsbedingung führt: Die z-Übertragungsfunktion
G(z) =
b0 z n + b1 z n−1 + . . . + bm z n−m b0 + b1 z −1 + . . . + bm z −m = −1 −n a0 + a1 z + . . . + an z a0 z n + a1 z n−1 + . . . + an (12.5)
12.1 Stabilitätsbedingungen
261
ist genau dann (intern und extern) stabil, wenn alle Pole von G(z) in der z-Ebene innerhalb des Einheitskreises liegen. Die Pole von G(z), d. h. die Wurzeln zi der charakteristischen Gleichung a0 z n + a1 z n−1 + . . . + an = 0
(12.6)
müssen somit dem Betrag nach alle kleiner Eins sein |zi | < 1
für i = 1, 2, . . . , n.
(12.7)
Am einfachsten kann man sich diese Betragsbedingung plausibel machen, wenn man den in Gleichung 11.16 aufgestellten Zusammenhang zwischen der Laplace-Variablen s und der Variablen z der z-Transformation heranzieht: z= " esT .
(12.8)
Ein kontinuierliches System ist stabil, wenn die Pole si,j der charakteristischen Gleichung negativen Realteil haben si,j = σi ± jωi Re {si,j } = σi < 0
bzw.
si = σi (Bedingung für Stabilität).
Unter Verwendung der Gleichung 12.8 resultiert dann: =1
|zi,j | = |e
si,j T
| = |e
(σi ±jωi )T
| = |e
σi T
| · |e±jωi T | = |eσi T |.
(12.9)
Hieraus folgt dann für ein diskretes System die Bedingung, dass für ein stabiles diskretes System die Pole dem Betrag nach kleiner Eins sein müssen ⇒
σi < 0
|zi,j | < 1.
Beispiel 12.1: Gegeben sei die z-Übertragungsfunktion G(z) =
1z −2 − 1,2z −3 . 1 + 0,2z −1 − 0,3z −2 − 0,4z −3
Die Wurzeln der Gleichung z 3 + 0,2z 2 − 0,3z − 0,4 = 0 lauten: z1 = +0,8
und
z2,3 = −0,5 ± j0,5,
262
12 Stabilität und Zeitverhalten diskreter Systeme Im (z) 6 j
0,5j
× −1
z-Ebene
7 1
-0,5
0,5
×
stabiler -0,5j Bereich
×
(z) 1 ◦Re Abbildung 12.1: Pole (×) und Nullstellen (◦) von G(z) in der zEbene
instabiler Bereich
-j
und somit ist |z1 | = +0,8
und
|z2,3 | = 0,7071.
Alle Wurzeln der Gleichung sind dem Betrag nach kleiner Eins, die Pole der Übertragungsfunktion liegen innerhalb des Einheitskreises (siehe Abb. 12.1). Die Nullstelle z01 liegt außerhalb des Einheitskreises bei +1,2. Das durch die Übertragungsfunktion G(z) beschriebene System ist stabil. Beispiel 12.2: Es wird eine PT1 -Regelstrecke mit vorgeschaltetem Halteglied und nachgeschaltetem Abtaster (siehe Beispiel 11.3) untersucht. Das Blockschaltbild der Anordnung zeigt die nachfolgende Abbildung.
xe (kT )
- H0 (s)
x ¯e (t) -
a s+a
xa (t) - t
t
xa (kT ) -
Abbildung 12.2: PT1 -Strecke mit Abtaster und Halteglied Gesucht ist die Zahlenfolge des Ausgangssignals xa (kT ), wenn das System mit einem Sprungeingang xe (kT ) = σ(kT ) angeregt wird. Die z-Übertragungsfunktion des Systems lautet: H0 G(z) =
1 − e−aT Xa (z) = . Xe (z) z − e−aT
Mit der z-Transformierten des Sprungeingangs z Xe (z) = z−1
12.2 Das Jury-Stabilitätskriterium
263
resultiert dann für den z-transformierten Ausgang Xa (z) = H0 G(z) · Xe (z) =
z z 1 − e−aT z = − · . (12.10) z − e−aT z − 1 z − 1 z − e−aT
Die Rücktransformation in den Zeitbereich liefert dann die Zahlenfolge xa (kT ) = 1 − e−akT . Für a > 0 d. h. s1 = −a < 0 liegt der Pol |z1 | = |e−aT | < 1 von H0 G(z) innerhalb des Einheitskreises und das System ist stabil. Mit den Zahlenwerten von z. B. a = 1 und der Abtastzeit von T = 100 ms ist dann |zi | = |e−0,1 | = 0,9048 < 1. Dann konvergiert die Folge xa (kT ) gegen Eins. Für ein beschränktes Eingangssignal xe (kT ) = 1 für alle k bleibt das Ausgangssignal ebenfalls beschränkt xa (kT ) ≤ 1. Die Berechnung der Stabilität eines diskreten Systems erfordert somit wie beim kontinuierlichen System die Berechnung der Pole des Systems, d. h. der Wurzeln eines Polynoms der Ordnung n. Hierzu ist in der Regel die Verwendung eines Rechners erforderlich. Bei kontinuierlichen Systemen kann man mithilfe der Hurwitz-Bedingungen die Stabilität überprüfen, ohne die Wurzeln zu berechnen. Eine ähnliche Stabilitätsüberprüfung ohne Berechnung der Wurzeln erlaubt bei diskreten Systemen das nachfolgende JuryStabilitätskriterium.
12.2
Das Jury-Stabilitätskriterium
Methode. Die Überprüfung der Stabilität eines diskreten Systems ohne die Berechnung der Wurzeln der charakteristischen Gleichung ermöglicht das Stabilitätskriterium nach Jury [33]. Hierbei wird wie beim Hurwitz-Kriterium eine Überprüfung von Bedingungen für die Koeffizienten der charakteristischen Gleichung ohne eine explizite Wurzelberechnung durchgeführt. Die zu untersuchende z-Übertragungsfunktion des diskreten Systems sei G(z) =
b0 + b1 z −1 + . . . + bm z −m . a0 + a1 z −1 + . . . + an z −n
Dann lautet die charakteristische Gleichung ausgehend von a0 + a1 z −1 + . . . + an z −n = 0 nach Multiplikation mit z n dann a0 z n + a1 z n−1 + . . . + an = 0.
(12.11)
Gleichung 12.11 wird umbenannt in f (z) = αn z n + αn−1 z n−1 + . . . + α0 = 0.
(12.12)
264
12 Stabilität und Zeitverhalten diskreter Systeme
Vorgehensweise:
1. Es wird das Vorzeichen von f (z) so gewählt, dass gilt αn > 0. 2. Dann wird die Stabilitätstabelle (Tabelle 12.1) aufgestellt. Reihe
z0
z1
z2
...
z n−2
z n−1
zn
1
α0
α1
α2
...
αn−2
αn−1
αn
2
αn
αn−1
αn−2
...
α2
α1
α0
3
β0
β1
β2
...
βn−2
βn−1
4
βn−1
βn−2
βn−3
...
β1
β0
5
c0
c1
c2
...
cn−2
6 .. .
cn−2
cn−3
cn−4
... .. .
c0
2n - 5
r0
r1
r2
r3
2n - 4
r3
r2
r1
r0
2n - 3
s0
s1
s2
Tabelle 12.1: Stabilitätstabelle nach Jury
Hierbei werden in der Tabelle die Elemente der Reihen 3, α0 αn−j β0 βn−1−j c = βj = j βn−1 βj αn αj c0 cn−2−j ... dj = cn−2 cj r0 r3 r0 r2 s s2 = s0 = = 1 r3 r0 r3 r1
4, . . . wie folgt berechnet:
r0 r1 r3 r2 .
Die Berechnung der Reihen wird abgebrochen, wenn die Reihe nur noch 3 Elemente enthält. Das System ist stabil, d. h. die Pole der z-Übertragungsfunktion liegen im Einheitskreis, wenn die folgenden Bedingungen, die so genannten Jury-Stabilitätsbedingungen, erfüllt sind:
12.3 Vergleich der Lage der Pole in der s-Ebene und der z-Ebene
265
Jury-Stabilitätsbedingungen: 1.) 2.) 3.) 4.)
f (z)|z=1 = f (1) α0 β0 c0
5.)
s0
0 sowie (−1)n · f (z)|z=−1 = (−1)n · f (−1) > 0 . αn > 0 . βn−1 . cn−2 .
> < > > .. .
s2 .
>
Die Anwendung der Stabilitätsbedingungen wird an einem Beispiel überprüft. Beispiel 12.3: Gegeben sei die charakteristische Gleichung eines Systems zu: f (z) = 1 − z + 3z 2 − 4z 3 + 3z 4 = 0. Die Stabilität dieser charakteristischen Gleichung ist mithilfe der Jury-Stabilitätsbedingungen zu überprüfen. Die dafür erforderliche Stabilitätstabelle ist zu erstellen. (i) Erstellung der Tabelle:
1 2 3 4 5
Reihe (α) (α)−1 (β) (β)−1 (c)
z0 1 3 −8 −1 63
z1 −1 −4 11 −6 −94
z2 3 3 −6 11 59
z3 −4 −1 −1 −8
z4 3 1
(ii) Prüfung der Stabilitätsbedingungen: 1.) 2.) 3.) 4.)
f (1) = 1 − 1 + 3 − 4 + 3 = 2 > 0 ok. 4 · f (−1) = 1 + 1 + 3 + 4 + 3 = 12 >0 (−1) α0 < αn > 0 : 1 < 3 > 0 ok. β0 > βn−1 : 8 > 1 ok. c0 > cn−2 : 63 > 59 ok.
ok.
Alle Bedingungen sind erfüllt, folglich ist das System stabil.
12.3
Vergleich der Lage der Pole in der s-Ebene und der z-Ebene
Vorgehensweise. Der Zusammenhang zwischen den Polen in der s-Ebene und der z-Ebene wird durch die Abbildung z = esT
mit
s = σ ± jω
(12.13)
266
12 Stabilität und Zeitverhalten diskreter Systeme
und T als Abtastzeit bestimmt. Diese Abbildung ist jedoch nur bis zur halben Abtastfrequenz ωMax =
π ωT = 2 T
eindeutig. Frequenzbereiche größer als die halbe Abtastfrequenz werden in den Grundfrequenzbereich bis ωT /2 in der z-Ebene hineingespiegelt. Dieser Tatbestand wurde zuvor schon durch das Shannon’sche Abtasttheorem in Abschnitt 9.2 beschrieben und wird durch die nachfolgende Abb. 12.3 verdeutlicht. Im(s) = jω 6 jωT /2 s-Ebene
jωT /4
0
Re(s)-= σ
Im z 6
z-Ebene
ωT /4 3ωT /8
ωT /8
ωT /2
0
−ωT /2
Re -z
−jωT /4 −ωT /8
−3ωT /8 −jωT /2
−ωT /4
Abbildung 12.3: Abbildung der imaginären Achse s = jω der s-Ebene auf den Einheitskreis in der z-Ebene Die imaginäre Achse s = jω der s-Ebene (d. h. σ = 0) wird gemäß der Gleichung z = esT = ejωT in der z-Ebene auf den Einheitskreis abgebildet. Setzt man ein für ωT = ±
π ωT · T = ± · T = ±π = " ± 180◦ , 2 T
so erkennt man, dass die halbe Abtastfrequenz genau in den Punkt z = e±jπ = −1 abgebildet wird. Frequenzen auf der imaginären Achse, die größer als die halbe Abtastfrequenz sind, werden zwar auch auf den Einheitskreis abgebildet, die Abbildung ist nun jedoch nicht mehr eindeutig, wie die nachfolgende Rechnung zeigt.
12.3 Vergleich der Lage der Pole in der s-Ebene und der z-Ebene
267
Für die Abbildung einer beliebigen Frequenz ω1 < ωT /2 wird z = ejω1 T . Der gleiche Punkt in der z-Ebene ergibt sich jedoch auch für die Abbildung der Frequenz ω2 = ω1 + N · ωT (N ganzzahlig) wie die nachfolgende Rechnung zeigt: z = ejω2 T = ej(ω1 +N ωT )·T = ej(ω1 +N ·2π/T )·T = ej(ω1 T +N ·2π) = ejω1 T . Die Abbildung von Polen aus der s-Ebene in die z-Ebene ist aufgrund des Shannon’schen Abtasttheorems somit auf den durch die Schraffur in Abb. 12.3 begrenzten Bereich beschränkt. Die Abbildung von Polen links der imaginären Achse (also mit σ < 0) erfolgt in den Einheitskreis in der z-Ebene. Die Abbildung von Polen rechts der imaginären Achse (also mit σ > 0) erfolgt auf den Bereich außerhalb des Einheitskreises in der z-Ebene. Ausgewählte Bereiche. Die weiteren Darstellungen für ein PT2 -System zeigen die Abbildung von Bereichen gleicher Dämpfung D, gleicher Abklingkonstante δ, gleicher Eigenfrequenz ωe und gleicher Kreisfrequenz ω0 von der s-Ebene in die z-Ebene. Im (z) 6
Im (s) 6
a
a
Re (z) -
Re(s)
Abbildung 12.4: Abbildung der Linien konstanter Dämpfung D von der s-Ebene in die z-Ebene Im (z) 6 Im (s) 6
−δ
Re(s)
y
e−δT
Re (z) -
Abbildung 12.5: Abbildung der Linien konstanter Abklingkonstante δ von der s-Ebene in die z-Ebene
268
12 Stabilität und Zeitverhalten diskreter Systeme Im (s) 6 ω1
Re(s)
Im (z) 6
ω1 T
Re (z) -
Abbildung 12.6: Abbildung der Linien konstanter Kreisfrequenz ωe von der s-Ebene in die z-Ebene
Im (s) 6
a
Re(s)
Im (z) 6
a
Re (z) -
Abbildung 12.7: Abbildung der Linien konstanter Kreisfrequenz ω0 von der s-Ebene in die z-Ebene Der Ursprung der s-Ebene wird in den Punkt z = +1 der z-Ebene abgebildet. Obere Grenze der abzubildenden Frequenz der Pole ist jeweils die als gestrichelte Linie gezeichnet Frequenz ωT /2, d. h. die halbe Abtastfrequenz. Diese Darstellungen sind besonders hilfreich bei der Reglerauslegung mithilfe der Wurzelortskurve. Bei diesem Verfahren ist die Lage der Pole des geschlossenen Kreises in der z-Ebene zu beurteilen, um daraus die Reglerparameter zu bestimmen. Mithilfe der obigen Abbildungen, die dann natürlich zu parametrieren sind, ist man damit in der Lage, die Reglerparameter so auszuwählen, dass der geschlossene Kreis Anforderungen z. B. bezüglich Dämpfung, An- oder Ausregelzeit erfüllt. Beispiel 12.4: Für eine PT2 -Strecke soll nun beispielhaft der Zusammenhang zwischen dem Zeitverhalten und der Lage der Pole in der s-Ebene und der z-Ebene demonstriert werden. Die
12.3 Vergleich der Lage der Pole in der s-Ebene und der z-Ebene
269
z-Übertragungsfunktion des PT2 -Systems lautet F (s) =
1 1 + (2D/ω0 ) · s + (s/ω0 )2
mit D = 0,5 und ω0 = 0,2 bzw. 1 s−1 . Dann liegen die Pole des kontinuierlichen Systems bei s1,2 = −0,1 ± j0,1732
ω0 = 0,2 s−1
für
s1,2 = −0,5 ± j0,8660
für
ω0 = 1 s
−1
und bei
.
Die Pole liegen folglich auf dem Schnittpunkt der geraden Linie konstanter Dämpfung D = 0,5 mit den Halbkreisbögen für ω0 = 0,2 bzw. 1 s−1 wie Abb. 12.8 zeigt. 1 0.5
0.4 0.3 0.2 0.1
0.6
0.8 0.7 0.8
0.6 0.9 0.4
Im (s) 0.2
6
0
1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1
−0.2
−0.4
Abbildung 12.8: Lage der Pole des PT2 -Systems in der s-Ebene
0.9 −0.6
0.8 0.7
−0.8
0.6 0.5
−1 −1.5
−1
0.4 0.3 0.2 0.1
−0.5
-
0
0.5
Re (s)
Die z-Übertragungsfunktion H0 G(z) für eine Abtastzeit von T = 1 s lautet für dieses System 0,0187z −1 + 0,0175z −2 1 − 1,7826z −1 + 0,8187z −2 0,3403z −1 + 0,2417z −2 H0 G(z) = 1 − 0,7859z −1 + 0,3679z −2
H0 G(z) =
für für
ω0 = 0,2 s−1
und
ω0 = 1 s−1 .
Die Pole von H0 G(z) liegen dann bei z1,2 = 0,8913 ± j0,1559
für
ω0 = 0,2 s−1
z1,2 = 0,3929 ± j0,4620
für
ω0 = 1 s−1 .
und bei
Die Pole liegen auf der herzförmigen Linie konstanter Dämpfung D = 0,5, wie Abb. 12.9 zeigt, sowie den (nicht gezeichneten) Linien mit der Kreisfrequenz ω0 = 0,2 s−1 und
270
12 Stabilität und Zeitverhalten diskreter Systeme 1 0.6π/T 0.8
0.5π/T
0.4π/T 0.10.3π/T
0.7π/T
0.6
0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
0.8π/T
0.4 0.9π/T
Im (z)
0.2
0
6
0.2π/T
0.1π/T
π/T π/T
−0.2 0.9π/T
0.1π/T
−0.4
−0.6
0.8π/T
0.7π/T
−0.8
0.3π/T 0.6π/T
−1 −1
−0.8
Abbildung 12.9: Lage der Pole des PT2 -Systems in der z-Ebene
0.2π/T
−0.6
−0.4
−0.2
-
0.5π/T 0
0.4π/T 0.2
0.4
0.6
0.8
1
Re (z)
ω0 = 1 s−1 . Gezeichnet sind jeweils die Linien mit den Kreisfrequenzen ω0 = n·π/(10T ) für n = 1 . . . 10. Die Sprungantworten des kontinuierlichen (durchgezogene Linie) und diskreten Systems (“ * “) zeigt Abb. 12.10. Der schnelle Einschwingverlauf gilt für ω0 = 1s−1 und der langsame Einschwingverlauf für ω0 = 0,2 s−1 . Zur Verdeutlichung, dass es sich um ein diskretes System handelt, ist der treppenförmige Verlauf des diskreten Ausgangssignals nach einem fiktiven Halteglied ebenfalls eingezeichnet. 1.2
x(t)
1
0.8
6
0.6 0.4 0.2 0
0
5
10
15
- t/s
20
25
30
Abbildung 12.10: Sprungantwort des analogen und diskreten PT2 -Systems Aufgabe 12.1: Gegeben ist die folgende z-Übertragungsfunktion H0 G(z) =
0,2387 + 0,2417z −1 − 0,2328z −2 − 0,2358z −3 . 100 · (1 − 2,8905z −1 + 2,7960z −2 − 0,9050z −3)
12.3 Vergleich der Lage der Pole in der s-Ebene und der z-Ebene
271
1. Berechnen Sie die Pole der Übertragungsfunktion. 2. Ist die Übertragungsfunktion stabil? Lösung: 1. z1,2 = 0,9647 ± j0,1047,
z3 = 0,9611
2. Ja. Aufgabe 12.2: Gegeben sei die charakteristische Gleichung f (z) = 1 − z + 3z 2 − 4z 3 + 3z 4 = 0. Bestimmen Sie mit dem Jury-Stabilitätstest die Stabilität des diskreten Systems. Ist das System stabil? Lösung: Das System ist stabil.
13
Quasikontinuierlicher Entwurf digitaler Regler
Die Hauptaufgabe der digitalen Regelung ist der Entwurf eines digitalen Reglers, der dann als Rekursionsgleichung im Prozessrechner oder Mikrocontroller realisiert wird. Für diesen Entwurf steht eine große Anzahl von Entwurfsverfahren zur Verfügung. In diesem Kapitel werden die Verfahren untersucht, die keine Ortskurven für den Entwurfsprozess verwenden. In Kapitel 14 werden dann die Ortskurvenverfahren betrachtet.
13.1
Digitale Realisierung analoger Regler
Grundlagen. Bei dieser Klasse von Entwurfsverfahren geht man von einem bekannten analogen Regler für eine analoge Strecke aus. Wie man diesen analogen Regler ermittelt hat, ist dabei unerheblich. Ebenso spielt es keine Rolle, ob die Parameter der Regelstrecke bekannt sind. Zu diesem analogen Regler, spezifiziert als (Laplace-) Übertragungsfunktion, wird nun der äquivalente digitale Regler entworfen. Man spricht hierbei auch von einem digitalen Filter. Dieser letzte Begriff stammt aus der Nachrichtentechnik und meint im Grunde dasselbe wie in der Regelungstechnik: Entwurf eines digitalen Übertragungsgliedes, das einem analogen Butterworth-, Chebyschev-, . . . Übertragungsglied mit bekannter Charakteristik entspricht. Es werden in diesem Kapitel sechs Verfahren zum Entwurf digitaler Filter vorgestellt und miteinander verglichen.
13.1.1
Das Euler-Verfahren
Beim Euler-Verfahren wird die Differentiation eines Signals durch seinen Differenzenquotienten ersetzt. Da man sowohl den linksseitigen als auch den rechtsseitigen Grenzwert einer Ableitung bilden kann, spricht man dann auch von dem Rückwärtsdifferenzenquotienten und dem Vorwärtsdifferenzenquotienten. Als Erstes wird die Anwendung des Rückwärtsdifferenzenquotienten bei der Berechnung des digitalen Reglers betrachtet. Rückwärtsdifferenzenquotient. Hierbei wird also die Differentiation eines Signals durch seinen linksseitigen Grenzwert, den Rückwärtsdifferenzenquotienten, ersetzt, wobei die Größe T die Abtastzeit und k den Laufparameter darstellen: x(kT ) − x([k − 1] · T ) x(t) − x(t − Δt) dx = lim ≈ . Δt→0 dt Δt T
(13.1)
274
13 Quasikontinuierlicher Entwurf digitaler Regler
Bei der Laplace-Transformation entspricht die Ableitung einer Größe nach der Zeit der Multiplikation dieser Größe mit der Laplace-Variablen s. Bei der z-Transformation wird die Rechtsverschiebung einer Variablen um ein Abtastintervall durch Multiplikation dieser Variablen mit z −1 erfasst. Wendet man diese beiden Regeln auf Gleichung 13.1 an, so erhält man: s · X(s) = "
1 − z −1 · X(z). T
Somit besteht dann zwischen beiden Transformationen die Äquivalenzbeziehung: s= "
1 − z −1 z−1 = . T T ·z
(13.2)
Man substituiert somit in der (Laplace-)Übertragungsfunktion FR (s) des Reglers die Laplace-Variable s durch (z − 1)/(T · z) und ermittelt die z-Übertragungsfunktion D(z) des Reglers, d. h. das äquivalente digitale Filter. Es gilt somit: D(z) = FR (s)
s=
z−1 T ·z
(13.3)
Aus dieser z-Übertragungsfunktion wird dann, wie in den Gleichungen 11.32 und 11.33 gezeigt, die im Rechner zu programmierende Rekursionsgleichung ermittelt. Beispiel 13.1: Gegeben sei die Übertragungsfunktion eines PI-Reglers FR (s) = KP ·
1 + TN s KP = KP + . TN s TN · s
Gesucht ist die z-Übertragungsfunktion des Reglers sowie die zugehörige Rekursionsgleichung. Unter Verwendung der obigen Herleitung wird
KP KP D(z) = KP + = KP + z−1 z−1 TN · s TN · s= T ·z T ·z KP · TN · (z − 1) + KP · T · z KP T · z = · = KP + TN z − 1 TN · (z − 1) KP · (1 + T /TN ) · z − KP KP · (T + TN ) · z − KP · TN = = TN · (z − 1) z−1 KP · (1 + T /TN ) − KP · z −1 D(z) = 1 − z −1
13.1 Digitale Realisierung analoger Regler
275
Mit den Zahlenwerten KP = 3; TN = 2 s und T = 1 s lautet dann die z-Übertragungsfunktion des Reglers D(z) =
4,5 − 3z −1 . 1 − z −1
Damit resultiert die im Rechner zu programmierende Rekursionsgleichung (siehe Gleichungen 11.32 und 11.33) zu xa (kT ) = xa (kT − T ) + 4,5xe (kT ) − 3xe (kT − T ).
(13.4)
Reduziert man die Abtastzeit von T = 1 s auf T = 0,01 s, dann resultiert die Rekursionsgleichung: xa (kT ) = xa (kT − T ) + 3,015xe (kT ) − 3xe (kT − T ).
(13.5)
Vorwärtsdifferenzenquotient. Anstelle des Rückwärtsdifferenzenquotienten kann man die Ableitung dx/dt auch durch den Vorwärtsdifferenzenquotienten approximieren. Dann erhält man dx x(kT + T ) − x(kT ) x(t + Δt) − x(t) = lim ≈ . (13.6) Δt→0 dt Δt T Die gesuchte Äquivalenz für die Berechnung des digitalen Reglers lautet dann: s= "
z−1 . T
Das digitale Filter berechnet man somit zu: D(z) = FR (s) z−1 s= T
(13.7)
(13.8)
Nach [24] garantiert die Methode des Vorwärtsdifferenzenquotienten jedoch keine stabile Lösung. Beispiel 13.2: Wendet man diesen Algorithmus auf einen PI-Regler an, so ergibt sich:
KP KP D(z) = KP + = KP + z−1 z−1 TN · s TN · s= T T KP · TN · (z − 1) + KP · T KP · T = = KP + TN · (z − 1) TN · (z − 1) KP · TN · z + KP · (T − TN ) KP · z + KP · (T /TN − 1) = = TN · (z − 1) z−1 −1 KP + KP · (T /TN − 1) · z = 1 − z −1
276
13 Quasikontinuierlicher Entwurf digitaler Regler
Mit den Zahlenwerten von Beispiel 13.1 (KP = 3; TN = 2 s und T = 1 bzw. 0,01 s) lauten dann die z-Übertragungsfunktionen des Reglers: (T = 1 s :) (T = 0,01 s :)
3 − 1,5z −1 , 1 − z −1 3 − 2,9850z −1 D(z) = . 1 − z −1 D(z) =
Damit resultieren die im Rechner zu programmierenden Rekursionsgleichungen (siehe Gleichungen 11.32 und 11.33) zu (T = 1 s :) (T = 0,01 s :)
xa (kT ) = xa (kT − T ) + 3xe (kT ) − 1,5xe (kT − T ) , xa (kT ) = xa (kT − T ) + 3xe (kT ) − 2,9850xe (kT − T ) .
Beide Ansätze führen zu unterschiedlichen Ergebnissen. Je kleiner die Abtastzeit, umso weniger unterscheiden sich jedoch die Koeffizienten der Rekursionsgleichung. Ein Ergebnisvergleich erfolgt in Abschnitt 13.1.7.
13.1.2
Die bilineare Transformation
Methode. In Abschnitt 11.2 wurde die Äquivalenz zwischen der s-Ebene und der z-Ebene durch die Gleichung 11.16 ausgedrückt. Es galt: z= " esT ,
(13.9)
bzw. es gilt die Umkehrung s= "
1 · ln z. T
Die Entwicklung des natürlichen Logarithmus ln z in eine Potenzreihe liefert 2 3 3 5 z−1 z−1 1 z−1 1 1 s= " ·2· + · + · + ... . T z+1 3 z+1 5 z+1
(13.10)
(13.11)
Durch Abbruch dieser Reihenentwicklung nach dem ersten Glied erhält man die Tustin’sche Formel nach dem Engländer Tustin für die Äquivalenzbeziehung zwischen der Variablen s und z zu: s= "
2 z−1 · . T z+1
(13.12)
Diese Transformation heißt auch bilineare Transformation. Sie wird bei der Ermittlung digitaler Filter in der Regelungstechnik am häufigsten angewendet.
13.1 Digitale Realisierung analoger Regler
277
Der zu ermittelnde digitale Regler wird somit nach der folgenden Transformationsbeziehung bestimmt: D(z) = FR (s)
s=
2 z−1 · T z+1
(13.13)
Beispiel 13.3: Für den PI-Regler von Beispiel 13.1 FR (s) = KP +
KP TN · s
wird
KP D(z) = KP + TN · s
KP = KP + 2 z−1 2 z−1 TN · · s= · T z+1 T z+1 2 · KP · TN · (z − 1) + KP · T · (z + 1) KP · T · (z + 1) = = KP + 2 · TN · (z − 1) 2 · TN · (z − 1) KP · [1 + T /(2TN )] · z + KP · [T /(2TN ) − 1] = z−1 KP · [1 + T /(2TN )] + KP [T /(2TN ) − 1] · z −1 D(z) = 1 − z −1 Mit den Zahlenwerten von Beispiel 13.1 (KP = 3; TN = 2 s und T = 1 bzw. 0,01 s) lauten dann die z-Übertragungsfunktionen des Reglers: (T = 1 s :) (T = 0,01 s :)
3,75 − 2,25z −1 , 1 − z −1 3,0075 − 2,9925z −1 D(z) = 1 − z −1
D(z) =
Damit resultieren die im Rechner zu programmierenden Rekursionsgleichungen zu: (T = 1 s :) xa (kT ) = xa (kT − T ) + 3,75xe (kT ) − 2,25xe (kT − T ) , (T = 0,01 s :) xa (kT ) = xa (kT − T ) + 3,0075xe (kT ) − 2,9925xe(kT − T ) . Auch hier gilt: Je kleiner die Abtastzeit, umso kleiner werden die Unterschiede der Koeffizienten der Rekursionsgleichungen der verschiedenen Berechnungsmethoden.
278
13 Quasikontinuierlicher Entwurf digitaler Regler
Aufgabe 13.1: Gegeben ist der folgende PDTD -Regler: FR (s) = 2 ·
1+s . 1 + 0,1s
Berechnen Sie die z-Übertragungsfunktion für eine Abtastzeit von 10 ms nach der Methode von Tustin. Lösung: D(z) =
19,1429 − 18,9524z −1 . 1 − 0,9048z −1
Aufgabe 13.2: Für einen PI-Regler der Form FR (s) = KP +
KP TN s
wird mit der Methode nach Tustin die Rekursionsgleichung ermittelt zu xa (kT ) = xa ([k − 1]T ) + 1,25xe (kT ) − 0,75xe ([k − 1]T ). Wie groß sind KP und TN wenn die Abtastzeit T = 1 s beträgt? Lösung:
KP = 1 und TN = 2 s.
13.1.3
Der PID-Regelalgorithmus
Herleitung. Beide zuvor entwickelten Abbildungsregeln werden oft zur Berechnung des diskreten PID-Regelalgorithmus verwendet. Der I-Anteil wird nach der Tustin-Regel (Gleichung 13.12) und der D-Anteil nach dem Rückwärtsdifferenzenquotienten (Gleichung 13.2) berechnet. Für den analogen PID-Regler FR (s) = KP · 1 +
1 TN · s
+
TV · s 1 + TD · s
(13.14)
wird dann D(z) = KP · 1 +
z−1 T z + 1 TV + · · 2 · TN z − 1 T z · (1 + TD /T ) − TD /T
. (13.15)
13.1 Digitale Realisierung analoger Regler
279
Gleichnamig machen führt zur allgemeinen z-Übertragungsfunktion des digitalen PIDReglers D(z) =
d0 + d1 · z −1 + d2 · z −2 1 − (1 − c1 ) · z −1 − c1 · z −2
(13.16)
mit d0 = d1 = d2 = c1 =
KP 1 + TD /T KP 1 + TD /T KP 1 + TD /T −TD . T + TD
T + TD · 1+ 2 · TN T · −1 + 2 · TN TD + TV · − T
TD + TV + T
2 · (TD + TV ) − T
TD 2 · TN
(13.17) (13.18) (13.19) (13.20)
Die zugehörige Differenzengleichung lautet dann: xa (kT ) = d0 · xe (kT ) + d1 · xe (kT − T ) + d2 · xe (kT − 2T ) +(1 − c1 ) · xa (kT − T ) + c1 · xa (kT − 2T ).
(13.21)
Diesen Algorithmus bezeichnet man auch als Stellungs- oder Positionsalgorithmus, da hiermit die Stellgröße xa (kT ) direkt berechnet wird. Will man nur die Änderung der Stellgröße Δxa (kT ) berechnen, so folgt aus der Differenzenbildung Δxa (kT ) = xa (kT ) − xa (kT − T ) = d0 · xe (kT ) + d1 · xe (kT − T ) + d2 · xe (kT − 2T ) +(1 − c1 ) · xa (kT − T ) + c1 · xa (kT − 2T ) − xa (kT − T ) = d0 · xe (kT ) + d1 · xe (kT − T ) + d2 · xe (kT − 2T ) −c1 · xa (kT − T ) + c1 · xa (kT − 2T ). Damit gilt: Δxa (kT ) = d0 xe (kT )+d1 xe (kT −T )+d2xe (kT −2T )−c1Δxa (kT −T ). (13.22) Dieser Algorithmus wird auch als Geschwindigkeitsalgorithmus bezeichnet und vorwiegend bei Stellgliedern mit integralem Verhalten, wie z. B. Schrittmotoren eingesetzt. Es soll hier nochmals daran erinnert werden, dass die Reglerparameter KP , TN , TV und TD von der Auslegung eines analogen Reglers als bekannt vorausgesetzt sind.
280
13 Quasikontinuierlicher Entwurf digitaler Regler
Praktische Realisierung in einer SPS. SPS ist die Abkürzung für Speicherprogrammierbare Steuerung. Diese Art von Steuerungen wird in weiten Bereichen der digitalen Regelung eingesetzt. Bei der praktischen Realisierung des Rekursionsalgorithmus in einer SPS werden die Datenglättung (erforderlich für das Differenzieren) sowie die Positions- und Geschwindigkeitssignale in getrennte Gleichungen aufgespalten. Schritt 1: Zunächst werden die Messwerte gefiltert mittels der Gleichung xf (kT ) = xe (kT ) + α (xf (kT − T ) − xe (kT )) .
(13.23)
Die zugehörige z-Übertragungsfunktion Ff (z) =
(1 − α)z Xf (z) = Xe (z) z−α
ist die Übertragungsfunktion eines einfachen PT1 -Gliedes (Tiefpasses) mit der Zeitkonstanten T1 = −α/ ln T bzw. der Eckfrequenz ωE = 1/T1. Schritt 2: Nun wird die Regeldifferenz als Differenz des Sollwertes und des gefilterten Messwertes ermittelt aus xd (kT ) = w(kT ) − xf (kT ) .
(13.24)
Schritt 3: Dann wird die Geschwindigkeitsausgabe Δxa (kT ) mit der Rekursionsgleichung T xd (kT ) Δxa (kT ) = KP [xd (kT ) − xd (kT − T )] + TN −
TV [2xf (kT − T ) − xf (kT ) − xf (kT − 2T )] T
(13.25)
berechnet. Der erste Term enthält den proportionalen Anteil, dann folgt der integrierende Anteil. Die Differentiation als dritter Anteil wird ebenso nur auf die gefilterten Messwerte angewendet. Schritt 4: Im letzten Schritt werden dann die Geschwindigkeitsanteile aufaddiert und ergeben das Positions- oder Stellungssignal xa (kT ) = xa (kT − T ) + Δxa (kT ) .
13.1.4
(13.26)
Das diskrete Äquivalent
Methode. Bei der Ermittlung des Reglers nach dem diskreten Äquivalent werden die Pole und Nullstellen der Reglerübertragungsfunktion von der s-Ebene in die z-Ebene abgebildet. Dabei wird von der Pol-/Nullstellendarstellung der Übertragungsfunktion des Reglers ausgegangen: FR (s) =
b 0 + b 1 s + . . . + b m sm (s − s01 )(s − s02 ) · · · (s − s0m ) , = Qa · a0 + a1 s + . . . + an sn (s − s1 )(s − s2 ) · · · (s − sn )
(13.27)
13.1 Digitale Realisierung analoger Regler
281
mit dem Faktor Qa = bm /an . Die Pole und Nullstellen werden mit der Transformation z = esT von der s-Ebene in die z-Ebene abgebildet. Die z-Übertragungsfunktion des Reglers wird somit ebenfalls zunächst in der Pol-/Nullstellendarstellung bestimmt: D(z) = Qd ·
c0 + c1 z + . . . + cm z m (z − z01 )(z − z02 ) · · · (z − z0m ) = , (z − z1 )(z − z2 ) · · · (z − zn ) d0 + d1 z + . . . + dn z n
(13.28)
mit dem Faktor Qd = cm /dn . Die Abbildungsregeln lauten im Einzelnen: 1. Besitzt FR (s) eine Polstelle bei si = −α, dann erhält D(z) eine Polstelle bei zi = esi T = e−αT . 2. Besitzt FR (s) eine endliche Nullstelle bei s0i = −β, dann erhält D(z) eine Nullstelle bei z0i = es0i T = e−βT . 3.1 Alle Nullstellen von FR (s) im Unendlichen werden bei D(z) auf eine Nullstelle bei z0i = −1 abgebildet. 3.2 Wenn für das digitale Filter z. B. aus Rechenzeitgründen eine Einheitsverzögerung erforderlich ist, dann wird die Nullstelle bei s0i = ∞ abgebildet auf eine Nullstelle bei z0i = ∞. Die Zahl der Nullstellen von D(z) ist um eins kleiner als die Zahl der Polstellen. Dadurch entfällt in der Rekursionsgleichung der Term d0 · xe (kT ). 4. Der Faktor Qd von D(z) wird so angepasst, dass die Beträge von D(z) und FR (s) • im Zentrum des Frequenzbandes, oder • bei der Durchtrittsfrequenz ωD , oder • z. B. bei der Frequenz ω = 0 übereinstimmen. D. h. es wird Qd berechnet aus der Beziehung D(z)
z=ejωx T
= FR (s)
.
(13.29)
s=jωx
mit ωx als entsprechende Frequenz. Diese Methode soll ebenfalls an einem Beispiel demonstriert werden. Beispiel 13.4: Es wird wieder der PI-Regler von Beispiel 13.1 untersucht. Hierzu ist zunächst eine Umformung auf die Pol-Nullstellendarstellung erforderlich. FR (s) = KP ·
1 + TN s 1/TN + s = KP · . TN s s
Die Pole und Nullstellen von FR (s) liegen somit bei: s1 = 0
s01 = −1/TN .
und
Die Abbildung dieser Pole und Nullstellen erfolgt (für T =1 s) zu: z1 = es1 T = e0 = 1
und
z01 = es01 T = e−T /TN = 0,6065.
282
13 Quasikontinuierlicher Entwurf digitaler Regler
Damit lautet die Pol-Nullstellendarstellung des digitalen Reglers D(z) = Qd ·
z − z01 z − e−T /TN . = Qd · z − z1 z−1
(13.30)
Das Prinzip der Berechnung von Qd lässt sich mit Zahlenwerten leichter demonstrieren. Daher werden die Zahlenwerte des analogen PI-Reglers von Beispiel 13.1 herangezogen. Diese Zahlenwerte des analogen Reglers sind KP = 3, TN = 2 s und T = 1 bzw. 0,01 s. Die Verstärkungsanpassung von analogem und digitalem Regler bei ωx = 0 macht keinen Sinn, da der analoge Regler dann eine unendliche Verstärkung aufweist. Günstiger ist eine Anpassung für die maximale Frequenz s = jωx = jωT /2 = j(2π/T )/2 = jπ/T . Der entsprechende Punkt in der z-Ebene ist dann z = ejωx T = ej(π/T )T = ejπ = −1. Dann wird (zunächst für T = 1 s): FR (s)
s=jπ/T
s + 1/T N = KP · s s=jπ/T j(π/1)s−1 + (1/2)s−1 = 3· = 3,0378 j(π/1)s−1
mit s als Einheit Sekunde, und für den digitalen Regler wird: D(z)
z=−1
z − e−T /TN = Qd · z−1 z=−1 −1 − e−1/2 = Qd · = 0,8033 · Qd . −1 − 1
Aus dem Gleichsetzen dieser beiden Beträge gemäß Gleichung 13.29 resultiert dann der Faktor Qd des digitalen Reglers zu: Qd = 3,7818. Die z-Übertragungsfunktion des digitalen Reglers lautet somit D(z) = 3,7818 ·
z − 0,6065 3,7818 − 2,2938z −1 = z−1 1 − z −1
und die entsprechende Rekursionsgleichung resultiert dann zu: (T = 1 s :) xa (kT ) = xa (kT − T ) + 3,7818xe (kT ) − 2,2938xe(kT − T ) (T = 0,01 s :) xa (kT ) = xa (kT − T ) + 3,0075xe (kT ) − 2,9925xe(kT − T ) .
13.1 Digitale Realisierung analoger Regler
283
Sie sind (bei diesem Beispiel) praktisch identisch mit den Rekursionsgleichungen nach der bilinearen Transformation. Aufgabe 13.3: Gegeben sei ein analoger PDTD -Regler mit der Übertragungsfunktion FR (s) = 3 ·
1 + 2s . 1 + 0,2s
1. Bestimmen Sie die z-Übertragungsfunktion des digitalen Reglers nach der Methode des diskreten Äquivalent für eine Abtastzeit von 10 ms. 2. Wie lautet die im Mikrocontroller zu programmierende Rekursionsgleichung des Reglers? Lösung: 1. D(z) =
29,3356 − 29,1893z −1 . 1 − 0,9512z −1
2. xa (kT ) = 0,9512xa(kT − T ) + 29,3356xe (kT ) − 29,1893xe (kT − T ).
Die Untersuchung der Spezialregeln 3.1 und 3.2. Die Regeln 3.1 und 3.2 sollen ebenfalls an einem Beispiel demonstriert werden. Beispiel 13.5: Betrachtet werde die fiktive Reglerübertragungsfunktion FR (s) =
2 . s+2
Dann wird der Pol bei s1 = −2 für eine Abtastzeit T = 0,1 s abgebildet auf z1 = e−2T = e−0,2 = 0,8187. Abbildungsregel 3.1 bildet die Nullstelle bei s01 = ∞ ab auf z01 = −1. Dann lautet die z-Übertragungsfunktion D1 (z) = Qd1 ·
z+1 1 + z −1 . = Qd1 · , z − 0,8187 1 − 0,8187z −1
und die Rekursionsgleichung resultiert zu: xa (kT ) = 0,8187xa(kT − T ) + Qd1 [xe (kT ) + xe (kT − T )] .
284
13 Quasikontinuierlicher Entwurf digitaler Regler
Abbildungsregel 3.2 dagegen bildet die Nullstelle bei s01 = ∞ ab auf z01 = ∞. Dann lautet die z-Übertragungsfunktion D2 (z) = Qd2 ·
1 z −1 . = Qd2 · , z − 0,8187 1 − 0,8187z −1
und die Rekursionsgleichung resultiert zu: xa (kT ) = 0,8187xa(kT − T ) + Qd2 xe (kT − T ) . Unabhängig von den Zahlenwerten von Qd1 und Qd2 entfällt bei der Anwendung von Regel 3.2 der Term xe (kT ) in der Rekursionsgleichung. Dies ist im folgenden Fall von Bedeutung: Wenn für die Gesamtzeit TGes für A/D-Wandlung, Berechnung des Stellwertes xa (kT ) und D/A-Wandlung nicht gilt TGes T , dann erfolgen die Messung des Regelsignals xe (kT ) und die Ausgabe des Stellsignals xa (kT ) nicht mehr fast synchron. Für z. B. T = 0,1 s und TGes = 0,04 s lägen 40ms zwischen Messung von xe (kT ) und der Ausgabe von xa (kT ). Ein- und Ausgabe verlaufen asynchron und somit kann Regel 3.1 nicht angewendet werden. Es ist eine Reglergleichung erforderlich, in der xe (kT ) nicht auftaucht. Diese Reglergleichung liefert die Anwendung von Regel 3.2 . Wäre dagegen TGes = 0,004 s = 4 ms, dann würden Messung und Ausgabe des Stellsignals praktisch synchron erfolgen und das Regelgesetz nach Regel 3.1 kann verwendet werden.
13.1.5
Das Halteglied-Äquivalent
Methode. Die Berechnung der diskreten Übertragungsfunktion des digitalen Reglers nach dem Verfahren des Halteglied-Äquivalents wurde in Kapitel 11.3.1 schon ausführlich behandelt. Die Vorgehensweise ist dieselbe wie bei der Ermittlung der Übertragungsfunktion der Regelstrecke mit vorgeschaltetem Halteglied und nachgeschaltetem Abtaster. Es wird daher an dieser Stelle nur das Ergebnis wiederholt. Die Berechnung der z-Übertragungsfunktion D(z) des digitalen Reglers aus der Übertragungsfunktion FR (s) des analogen Reglers erfolgt nach dem Schema: z−1 ·Z D(z) = z
FR (s) s
.
(13.31)
Für einen analogen PI-Regler wurde in Beispiel 11.7 die diskrete Übertragungsfunktion ermittelt zu: D(z) =
KP + KP · (T /TN − 1) · z −1 . 1 − z −1
13.1 Digitale Realisierung analoger Regler
285
Das Ergebnis für den digitalen Regler stimmt in diesem Fall überein mit dem Regler, entwickelt nach dem Verfahren des Vorwärtsdifferenzenquotienten. Mit den Reglerparametern KP = 3, TN = 2 s und der Abtastzeit T = 1 bzw. 0,01 s lauten dann die z-Übertragungsfunktionen des Reglers (T = 1 s :) (T = 0,01 s :)
Xa (z) 3 − 1,5z −1 = Xe (z) 1 − z −1 3 − 2,9850z −1 Xa (z) = D(z) = Xe (z) 1 − z −1
D(z) =
und die entsprechenden Rekursionsgleichungen haben die Form (T = 1 s :) xa (kT ) = xa (kT − T ) + 3xe (kT ) − 1,5xe (kT − T ) (T = 0,01 s :) xa (kT ) = xa (kT − T ) + 3xe (kT ) − 2,9850xe(kT − T ) . Die Ergebnisse sind identisch mit denen des Vorwärtsdifferenzenquotienten.
13.1.6
„Direkte z-Transformation“
Methode. Abschließend soll die als direkte z-Transformation bezeichnete Methode für die Berechnung des digitalen Reglers betrachtet werden. Bei dieser Transformation wird mithilfe der Tabelle 10.1 „direkt“ die Übertragungsfunktion FR (s) in den z-Bereich transformiert. Als Transformationsregel wird verwendet: D(z) = Z {FR (s)} .
(13.32)
Diese Art der Transformation erweist sich jedoch als ungeeignet. Denn theoretisch geht für T → 0 ein Abtastsystem in das korrespondierende zeitkontinuierliche System über, d. h. es ist die folgende Gleichung erfüllt: lim G(z) = G(s).
T →0
(13.33)
Die Anwendung der Regel nach Gleichung 13.32 soll wieder am Beispiel des PI-Reglers demonstriert werden. Beispiel 13.6: Die Übertragungsfunktion des PI-Reglers lautet: FR (s) = KP ·
1 + TN s KP = KP + . TN s TN s
Die Anwendung der Transformationsregel nach Gleichung 13.32 liefert
286
13 Quasikontinuierlicher Entwurf digitaler Regler s-Bereich KP KP 1 · TN s
⇒ ⇒
z-Bereich KP KP z · TN z − 1
Dann resultiert als diskrete Übertragungsfunktion des PI-Reglers D(z) =
KP · (1/TN + 1) − KP · z −1 KP z Xa (z) = KP + = · . Xe (z) TN z − 1 1 − z −1
Da die z-Übertragungsfunktion unabhängig von der Abtastzeit T ist, sind für den PIRegler mit den Reglerparametern KP = 3, TN = 2 s die z-Übertragungsfunktionen für die Abtastzeiten T = 1 bzw. 0,01 s identisch: D(z) =
4,5 − 3z −1 Xa (z) = Xe (z) 1 − z −1
und die entsprechende Rekursionsgleichung hat die Form xa (kT ) = xa (kT − T ) + 4,5xe (kT ) − 3xe (kT − T ). Für T = 1 s ist das Ergebnis korrekt, aber für T = 0,01 s liegen die Zahlenwerte weit von den bei Anwendung der anderen Verfahren ermittelten Werte entfernt. Überprüft man die Bedingung nach Gleichung 13.33 für den digitalen Regler, entworfen nach der „direkten z-Transformation“, dann ist Gleichung 13.33 nicht erfüllt. Das Einsetzen der Näherung von z = esT ≈ 1 + sT ergibt KP · (1/TN + 1)z − KP z−1 KP · (1/TN + 1) · (1 + sT ) − KP und somit wird = (1 + sT ) − 1 KP · [1/TN + (1/TN + 1)sT ] lim D(z) = lim KP · ⇒ ∞. T →0 T →0 Ts D(z) =
Die Überprüfung von Gleichung 13.33 für einen anderen digitalen Regler, z. B. den Regler entworfen nach der Methode von Tustin, zeigt die Erfüllung von Gleichung 13.33. Es lautet die z-Übertragungsfunktion des Reglers nach Tustin D(z) = KP ·
(2TN + T ) + (T − 2TN )z −1 (2TN + T )z + (T − 2TN ) = KP · . (13.34) −1 2TN − 2TN z 2TN z − 2TN
Einsetzen der Näherung von z = esT ≈ 1 + sT ergibt KP · (2TN + T ) · (1 + sT ) + KP · (T − 2TN ) 2TN · (1 + sT ) − 2TN 2T · (1 + TN s) + sT 2 und somit wird = KP · 2T TN s 1 + TN s = FR (s). lim D(z) = KP · T →0 TN s D(z) =
13.1 Digitale Realisierung analoger Regler
287
Die Methode der „direkten z-Transformation“ liefert also keine verwendbare z-Übertragungsfunktion eines digitalen Reglers.
13.1.7
Vergleich der entworfenen Regler
Nachdem in den vorangehenden Abschnitten verschiedene Methoden zur Entwicklung digitaler Regler aus einem gegebenen analogen Regler dargestellt wurden, sollen nun die entworfenen Regler verglichen werden. Dieser Vergleich soll erstens mittels des Amplitudengangs |D(z)| der Regler und zweitens mittels der Analyse der Regler im geschlossenen Regelkreis durchgeführt werden. Vergleich der Amplitudengänge der Regler. Hierbei stellt sich als erstes die Frage, was unter dem Amplitudengang eines digitalen Reglers (Filters) zu verstehen ist. Der Amplitudengang einer diskreten Übertragungsfunktion D(z) ist in Kapitel 14.2.1 definiert zu: |D(z)|z=ejωT
für 0 ≤ ω ≤ ωT /2.
(13.35)
Abb. 13.1 zeigt die Amplitudengänge des analogen Reglers FR (s) =
KP · (1 + TN · s) TN · s
mit KP = 3 und TN = 2 s
(13.36)
und zusätzlich die Amplitudengänge aller digitalen Regler mit den z-Übertragungsfunktionen D(z) =
b0 + b1 z −1 a0 + a1 z −1
(13.37)
2
10
|D(z)| dB
6101
0
10 −2 10
−1
10
0
10
1
-
10
ω/s
−1
2
10
3
10
Abbildung 13.1: Amplitudengänge der entworfenen PI-Regler für eine Abtastfrequenz von 100 Hz: analoger Regler (—); digitale Regler: Vorwärtsdiff./Haltegliedäquiv. (o), bilinearer Entwurf/diskr. Äquiv. (*), Rückwärtsdiff. (x), Direkter Entwurf (.-)
288
13 Quasikontinuierlicher Entwurf digitaler Regler
und den entsprechenden Werten für a0 , a1 , . . . für die Abtastzeit T = 0,01 s, d. h. die Abtastfrequenz ωT = (2π)/T = 628,3 s−1 bzw. fT = 1/T = 100 Hz. Der für den digitalen Regler gültige Frequenzbereich liegt dann nach dem Shannon’schen Abtasttheorem bei ωT 0≤ω≤ = 314,2 s−1 . 2 Die Amplitudengänge der analogen und digitalen Regler unterscheiden sich nur unwesentlich. Allein der gestrichelt gezeichnete Amplitudenverlauf des Reglers nach dem „direkten Entwurf“ weicht von den anderen Amplitudenverläufen deutlich ab. Diese Entwurfsmethode scheidet somit für die weitere Betrachtung aus. Der Unterschied der anderen Amplitudengänge im gültigen Frequenzbereich bis ω = 314,2 s−1 ist so gering, dass eine Wertung bezüglich der Güte der einzelnen Entwurfsverfahren nur schlecht vorgenommen werden kann. Die Amplitudengänge der diskreten Regler werden nun erneut berechnet, nun aber für die größere Abtastzeit T = 1 s, d.h. ωT = (2π)/T = 6,28 s−1 bzw. fT = 1 Hz und in Abb. 13.2 dargestellt. 2
10
|D(z)| dB
6101
0
10 −2 10
−1
10
0
10
1
-
10
ω/s−1
2
10
3
10
Abbildung 13.2: Amplitudengänge der entworfenen PI-Regler für eine Abtastfrequenz von 1 Hz: analoger Regler (—); digitale Regler: Vorwärtsdiff./Haltegliedäquiv. (o), bilinearer Entwurf/diskr. Äquiv. (*), Rückwärtsdiff. (x) Nun zeigen sich im Verlauf der diskreten Amplitudengänge deutliche Abweichungen vom Verlauf des Amplitudengangs des analogen Reglers im gültigen Frequenzbereich " 0,5 Hz. Auffällig sind die „großen Zacken“ bei den Amplibis ωT /2 = 3,14 s−1 = tudenverläufen im Frequenzbereich oberhalb der halben Abtastfrequenz von 3,14 s−1. Die Amplitudenverläufe sind hier nicht mehr gültig. Die beste Übereinstimmung mit dem „analogen“ Amplitudengang zeigt der Amplitudengang des Reglers, der mit der bilinearen Transformation (nach Tustin) berechnet wurde (dargestellt durch „ * “). Daraus lässt sich folgern, dass für genügend große Abtastfrequenzen die Auswahl der Entwurfsmethode des digitalen Reglers unkritisch ist. Erst für niedrige Abtastfrequenzen erweist sich die Diskretisierungsmethode nach Tustin als überlegen.
13.1 Digitale Realisierung analoger Regler
289
Aufgabe 13.4: Bestimmen Sie für einen PI-Regler mit den Zahlenwerten KP = 1 und TN = 1 s die z-Übertragungsfunktionen der digitalen Regler für die Entwurfsverfahren nach Abschnitt 13.1.1 bis 13.1.5 für die Abtastzeit T = 0,5 s. Lösung: Rückwärtsdifferenzenverfahren: Vorwärtsdifferenzenverfahren: Bilinearer Entwurf: Diskretes Äquivalent: Halteglied-Äquivalent =
1,5 − z −1 1 − z −1 1 − 0,5z −1 D(z) = 1 − z −1 1,25 − 0,75z −1 D(z) = 1 − z −1 1,2606 − 0,7646z −1 D(z) = 1 − z −1 Vorwärtsdifferenzenverfahren D(z) =
Vergleich der Regler im geschlossenen Regelkreis. Dieser Vergleich soll anhand der Regelung einer Verzögerungsstrecke 2. Ordnung beschrieben durch die Übertragungsfunktion FS (s) =
2/3 KS = (1 + T1 s) · (1 + T2 s) (1 + 0,5s) · (1 + 2s)
(13.38)
durchgeführt werden. Es gilt also KS = 2/3, T1 = 0,5 s und T2 = 2 s. Ein PI-Regler, bestimmt nach dem Verfahren der dynamischen Kompensation, mit den Parametern KP = 3 und TN = 2 s führt zu einem guten Regelverhalten mit ca. 5 % Überschwingen (siehe Abb. 13.3). Die Sprungantworten des Systems bei Einsatz der verschiedenen digitalen Regler (gezeichnet wie in Abb. 13.2 als Kreuze („x“), Kreise („o“) und Sterne („*“) ) bei einer Abtastzeit von T = 0,01 s, d. h. ωT = 628,3 s−1 , ist ebenfalls in Abb. 13.3 eingezeichnet. Die Sprungantworten des mit dem analogen 1.2
x(t)
1
0.8
6
0.6 0.4 0.2 0
0
1
2
3
-
4
5
6
t/s
Abbildung 13.3: Sprungantworten des Systems bei Verwendung der verschiedenen analogen und digitalen PI-Regler für eine Abtastfrequenz von 100 Hz (gezeichnet als „–“) bzw. den „schnellen“ digitalen Reglern geregelten Systems sind bei
290
13 Quasikontinuierlicher Entwurf digitaler Regler
der Abtastzeit von T = 0,01 s nicht zu unterscheiden. Somit erscheint eine Wertung der Verfahren bei dieser kleinen Abtastzeit nicht sinnvoll. Es sollen daher wie beim Methodenvergleich auf der Basis des Amplitudengangs ebenfalls die Sprungantworten bei der kleineren Abtastfrequenz ωT = 6,28 s−1 = " fT = 1 Hz untersucht werden. Die Abtastzeit der in Abb. 13.4 dargestellten Sprungantworten beträgt somit 1 s. 1.4 1.2
x(t) 1 60.8 0.6 0.4 0.2 0
0
1
2
3
-
4
5
6
t/s
Abbildung 13.4: Sprungantworten des Systems bei Verwendung der verschiedenen PIRegler für eine Abtastfrequenz von 1 Hz: analoger Regler (—); digitale Regler: Vorwärtsdiff./Haltegliedäquiv. (o), bilinearer Entwurf ≈ diskr. Äquiv. (*), Rückwärtsdiff. (x) Nun ist ein deutlicher Unterschied beim Einschwingverhalten bei Verwendung des analogen und der verschiedenen digitalen Regler festzustellen. Das größte Überschwingen tritt bei Einsatz des Reglers auf, der nach der Methode des Vorwärtsdifferenzenquotienten entworfen ist (Kurve „ o “). Dieser Regler ist identisch mit dem Regler nach dem Halteglied-Äquivalent. Die kürzeste Anregelzeit weist der Regler nach dem Rückwärtsdifferenzenverfahren (Kurve „ x “) auf. Der Regler nach dem bilinearen Entwurf, der nahezu identisch mit dem Regler nach dem diskreten Äquivalent ist (Kurve „ * “), liegt im Zeitverhalten zwischen den beiden anderen Entwürfen. Hervorgerufen wird dieses unterschiedliche Zeitverhalten durch die aufgrund der Reglergleichungen unterschiedlichen Stellamplituden, die in Abb. 13.5 dargestellt sind. Die schnellere Reaktion des Reglers nach dem Rückwärtsdifferenzenverfahren wird, wie Abb. 13.5 zeigt (Treppenkurve mit einem „ x “ zu Beginn des Abtastschritts), durch die größere Stellamplitude zu Beginn des Einschwingvorgangs hervorgerufen. Die Stellamplitude für den Regler nach dem Vorwärtsdifferenzenverfahren (Treppenkurve mit einem „ o “ zu Beginn des Abtastschritts) ist zunächst praktisch gleich dem analogen Stellsignal, wird dann jedoch für mehrere Abtastschritte größer als das analoge Signal. Dies führt dann zu dem höheren Überschwingen bei Verwendung dieses Reglers. Im Zeitverlauf zwischen beiden treppenförmigen Stellsignalen liegt das Stellsignal des Reglers auf der Basis des bilinearen Entwurfs (Treppenkurve mit einem „ * “ zu Beginn des Abtastschritts).
13.1 Digitale Realisierung analoger Regler
291
5 4
y(t) 63 2 1 0
0
1
2
3
-
4
5
6
t/s
Abbildung 13.5: Stellamplituden bei Verwendung der verschiedenen PI-Regler für eine Abtastfrequenz von 1 Hz: analoger Regler (—); digitale Regler: Vorwärtsdiff./Haltegliedäquiv. (o), bilinearer Entwurf ≈ diskr. Äquiv. (*), Rückwärtsdiff. (x)
Eine Verbesserung des Einschwingverhaltens nach Abb. 13.4 lässt sich durch eine Reduzierung der Reglerverstärkung erzielen. Multipliziert man die in Aufgabe 13.4 berechneten Reglerübertragungsfunktionen mit dem Faktor 0,8, dies entspricht einer Reduzierung der Verstärkung um 20 %, so resultieren die in Abb. 13.6 gezeigten Verläufe. Die Einschwingverläufe für die Regler, entworfen nach dem bilinearen Entwurf (Kurve „ * “) und dem Rückwärtsdifferenzenverfahren (Kurve „ x “), liegen nun wesentlich näher beim Zeitverlauf für den analogen Regler (siehe Abb. 13.6). Nur der Entwurf des Reglers nach dem Vorwärtsdifferenzenverfahren (Kurve „ o “) weist nach wie vor noch ein deutlich überhöhtes Überschwingen auf.
1.5
x(t) 1 6 0.5
0
0
1
2
3
-
4
5
6
t/s
Abbildung 13.6: Sprungantworten des Systems bei Verwendung verschiedener PIRegler (Abtastfrequenz 1 Hz) und eine um 20 % reduzierte Verstärkung: analoger Regler (—); digitale Regler: Vorwärtsdiff./Haltegliedäquiv. (o), bilinearer Entwurf ≈ diskr. Äquiv. (*), Rückwärtsdiff. (x)
292
13 Quasikontinuierlicher Entwurf digitaler Regler
Die Amplituden der Stellsignale sind nun merklich kleiner als vor der Reduzierung der Reglerverstärkung, wie Abb. 13.7 zeigt. 4
x(t)3 6 2
1
0
0
1
2
3
4
-
5
6
t/s
Abbildung 13.7: Stellamplituden bei Verwendung der verschiedenen PI-Regler für eine Abtastfrequenz von 1 Hz: analoger Regler (—); digitale Regler: Vorwärtsdiff./Haltegliedäquiv. (o), bilinearer Entwurf ≈ diskr. Äquiv. (*), Rückwärtsdiff. (x) Resümee. Bei hinreichend kleinen Abtastzeiten spielt der verwendete Algorithmus zur Berechnung der Reglergleichung praktisch keine Rolle. Erst bei größer werdenden Abtastzeiten sind Auswirkungen des Verfahrens erkennbar. Die Verwendung eines diskreten Reglers, ermittelt nach der Methode der bilinearen Transformation (Tustin’sche Formel) zeigt die geringsten Abweichungen vom kontinuierlichen Regler und wird daher am häufigsten eingesetzt.
13.2
Der digitale Regler nach Takahashi
Grundlagen. Ähnlich zu den Einstellregeln von Ziegler-Nichols bzw. Chien-HronesReswick hat Takahashi Einstellregeln für die Reglerparameter eines digitalen Reglers entwickelt [68], [69]. Ausgangspunkt für die Entwicklung der Regler nach Takahashi ist nach [69] die z-Übertragungsfunktion des digitalen PID-Reglers nach Gleichung 13.15 wie folgt: 2
z−1 T z + 1 TV D(z) = KP · 1 + + · · T z · (1 + TD /T ) − TD /T 2 · TN z − 1
3 . (13.39)
Die Zeitkonstante TD des Differenzieranteils muss dabei so groß gewählt werden, dass der Einfluss des Signalrauschens reduziert wird. Dann werden die Koeffizienten KP , TN und TV des digitalen Reglers nach einer der beiden nachfolgenden Methoden auf der Basis der Kenngrößen des analogen Systems berechnet.
13.2 Der digitale Regler nach Takahashi
293
Methode I. Hierbei sind zunächst die kritische Verstärkung KP,Krit und die zugehörige Periodendauer TKrit des Regelkreises bei Verwendung eines P-Reglers zu ermitteln. Die Parameter des digitalen Reglers werden dann nach der folgenden Tabelle (nach Ziegler und Nichols) berechnet. Reglerparameter
Reglertypen
KP
TN
TV
P
0,5 KP,Krit
-
-
PI
0,45 KP,Krit
0,83 TKrit
-
PID
0,6 KP,Krit
0,5 TKrit
0,125 TKrit
Tabelle 13.1: Reglereinstellwerte nach Takahashi, Methode I Damit resultiert dann die z-Übertragungsfunktion 13.39 mit den neuen Koeffizienten zu D(z) =
d0 + d1 · z −1 + d2 · z −2 1 − (1 − c1 ) · z −1 − c1 · z −2
mit
2
2
KP · d0 = 1 + TD /T
T + TD TD + TV 1+ + T 2 · TN
3
T 2 · (TD + TV ) −1 + − T 2 · TN 2 3 TD + TV TD KP d2 = · − 1 + TD /T T 2 · TN KP d1 = · 1 + TD /T
c1 =
3
−TD . T + TD
Methode II. Hier sind mit der Wendetangentenmethode zunächst die Ersatzzeitkonstanten Tu und Tg sowie die Streckenverstärkung KS zu ermitteln. Weiterhin muss die Abtastzeit T bekannt sein. Die Parameter KP , TN und TV des digitalen Reglers werden dann anhand von Tabelle 13.2 berechnet und wie bei Methode I weiterverarbeitet. Da für die in Abschnitt 13.1 verwendete Strecke 2. Ordnung keine endliche kritische Verstärkung KP,Krit existiert, soll nur Methode II nach Takahashi an dieser Strecke getestet werden.
294
13 Quasikontinuierlicher Entwurf digitaler Regler Reglerparameter
Reglertypen
KP
P
1 KS 0,9 KS 1,2 KS
PI PID
TN
TV -
·
Tg Tu
-
·
Tg Tu +T /2 Tg Tu +T
3,33 ·(Tu + T /2)
·
2·
(Tu +T /2)2 Tu +T
Tu +T 2
Tabelle 13.2: Reglereinstellwerte nach Takahashi, Methode II Beispiel 13.7: Gegeben sei die Übertragungsfunktion der analogen Strecke FS (s) =
2/3 KS = . (1 + T1 s) · (1 + T2 s) (1 + 0,5s) · (1 + 2s)
Die Ersatzzeitkonstanten Tu und Tg werden grafisch bzw. rechnerisch ermittelt zu: Tu = 0,215 s und Tg = 3,333 s. Die Parameter eines PI-Reglers resultieren für die Abtastzeit T = 0,1 s nach Tabelle 13.2 zu:
KP = 16,9811
und
TN = 0,8832 s .
Dann lautet die Rekursionsgleichung des digitalen Reglers: xa (kT ) = xa (kT − T ) + 17,9424xe(kT ) − 16,0198xe(kT − T ). Abb. 13.8 zeigt ein wenig befriedigendes Führungsverhalten aber ein relativ gutes Stör1.8 1.6 1.4
x(t) 1.2 61 0.8 0.6 0.4 0.2 0
0
5
10
15
20
-
25
30
35
40
t/s
Abbildung 13.8: Führungs- und Störverhalten bei Verwendung eines PI-Reglers nach Takahashi (Methode II) bei einer Abtastfrequenz von 10 Hz verhalten (ab t ≥ 20 s) der Regelgröße x(t). Dies ist im Wesentlichen auf die große Reglerverstärkung KP zurückzuführen.
13.3 „Reglerüberlauf“ (Controller Wind-Up)
13.3
295
„Reglerüberlauf“ (Controller Wind-Up)
Beschreibung. Bei der praktischen Anwendung entworfener analoger und/oder digitaler Regler mit Integralanteil kann es bei Vorhandensein von Stellgliedbeschränkungen Stellglied
Regler W (z)- iXd (z)D(z) − 6
U (z) -
Regelstrecke Y (z) -
H0 G(z)
X(z) -
Abbildung 13.9: Digitaler Regelkreis mit Stellgliedbegrenzung zu einem so genannten „Reglerüberlauf“ kommen. Dieser unerwünschte Effekt kommt wie folgt zustande: Sobald das Stellsignal u(kT ) die Beschränkung des Stellglieds erreicht, wird das Eingangssignal y(kT ) in die Regelstrecke auf den Maximalwert des Stellsignals begrenzt. Dadurch wächst die Regelabweichung weiter an, da nicht genügend Stellenergie zur Verfügung gestellt wird. Diese Regelabweichung wird aber vom Regler immer weiter aufintegriert, ohne dass das Stellsignal wegen der Begrenzung steigt. Wird nun nach einiger Zeit die Regelabweichung negativ, so dauert es sehr lange, bis der Integrator von seinem hohen Signalwert herunter integriert. Die Folge dieses Effekts sind länger andauernde und größere Regeldifferenzen. Algorithmus 1. Eine wirkungsvolle Reduzierung dieses Phänomens besteht nach [24] darin, die Begrenzung des Stellsignals in der Reglergleichung in geeigneter Weise mitzurechnen und ein begrenztes Stellsignal aus dem Regler auszugeben. Die diskrete Übertragungsfunktion D(z) des Reglers D(z) =
C(z) N (z)
wird in das Zähler- und Nennerpolynom (C(z) und N (z)) aufgespalten und in der in Abb. 13.10 gezeigten Weise verarbeitet. Xd (z) - C(z)
E1 (z) + E(z) - i + 6 E2 (z)
U (z) -
1 − N (z) Abbildung 13.10: Schema der Signalverarbeitung im Regler bei Stellsignalbegrenzung
296
13 Quasikontinuierlicher Entwurf digitaler Regler
Es werden im Regler die beiden folgenden Gleichungen realisiert: E(z) = C(z) · Xd (z) + [1 − N (z)] · U (z) U (z) = SAT {E(z)}
und
(13.40) (13.41)
mit SAT als Operator für die Begrenzung. Liegt das Signal E(z) innerhalb der Begrenzung, dann ist U (z) = E(z) und Gleichung 13.40 lautet: U (z) = C(z) · Xd (z) + [1 − N (z)] · U (z). Aufgelöst nach D(z) =
D(z) =
U (z) resultiert Xd (z)
U (z) C(z) = . Xd (z) N (z)
Wird die Begrenzung nicht erreicht, dann ist die z-Übertragungsfunktion des Reglers identisch zur Originalübertragungsfunktion. Bei Überschreiten der Grenze wird jedoch die Begrenzung im Regler berücksichtigt und die Wirkung des Reglerüberlaufs reduziert. Abb. 13.11 verdeutlicht die Gesamtstruktur des Systems. Regler mit Anti-Wind-Up Stellglied Xd (z)
W (z) + hE(z) - h - C(z) − + 6 6
U(z)-
Regelstrecke Y (z) -
H0 G(z)
X(z) -
1 − N (z)
Abbildung 13.11: Regelkreis mit Anti-Wind-Up-Regler Das Verfahren des Anti-Wind-Up soll an einem Beispiel demonstriert werden.
Beispiel 13.8: Für die Verzögerungsstrecke 3. Ordnung beschrieben durch die Übertragungsfunktion FS (s) =
0,5 (1 + s) · (1 + 2s) · (1 + 5s)
13.3 „Reglerüberlauf“ (Controller Wind-Up)
297
wird nach dem Verfahren der dynamischen Kompensation der folgende analoge Regler ausgelegt: FR (s) =
2,67 · (1 + 5s) . 5s
Der entsprechende digitale Regler nach Tustin für eine Abtastzeit von T = 0,5 s lautet: D(z) =
2,8035 − 2,5365z −1 . 1 − z −1
Der Regler ist so ausgelegt, dass bei einem Sprung der Führungsgröße maximal 20 % Überschwingen auftritt bei einer Ausregelzeit von 17 s für ein 5 % Fehlerband. Das Stellglied weist eine Begrenzung bei ±2,5 auf. Es werden nun drei verschiedene Regelkreise miteinander verglichen: Kreis 1 ist der normale digitale Regelkreis ohne jegliche Stellsignalbegrenzung. Dann lautet die Rekursionsgleichung für den digitalen Regler nach Tustin für eine Abtastzeit von T = 0,5 s : y(kT ) = y([k − 1]T ) + 2,8035xd(kT ) − 2,5365xd([k − 1]T ). Hierbei gilt u(kT ) = y(kT ). Die Signalverläufe für diesen Kreis sind in den Abbildungen 13.12 und 13.13 fett hervorgehoben (Kurve —). Kreis 2 ist der digitale Regelkreis mit Stellsignalbegrenzung. Die Reglergleichung ist unverändert: u(kT ) = u([k − 1]T ) + 2,8035xd(kT ) − 2,5365xd([k − 1]T ). Die Signalverläufe für den Kreis mit diesem Regler sind in den Abbildungen 13.12 und 13.13 bezeichnet mit Kurve „ a “. Kreis 3 ist der digitale Regelkreis mit Anti-Wind-Up-Korrektur. Die Reglergleichungen werden mittels Gleichung 13.40 und 13.41 ermittelt: ergibt E(z) = C(z) · Xd (z) + [1 − N (z)] · U (z) E(z) = (2,8035 − 2,5365z −1) · Xd (z) + [1 − (1 − z −1 )] · U (z) = (2,8035 − 2,5365z −1) · Xd (z) + z −1 · U (z) und damit wird e(kT ) = 2,8035xd(kT ) − 2,5365xd([k − 1]T ) + u(kT − T ) u(kT ) = SAT {e(kT )} .
298
13 Quasikontinuierlicher Entwurf digitaler Regler Die Signalverläufe für den Kreis mit diesem Regler sind in den Abbildungen 13.12 und 13.13 bezeichnet mit Kurve „ b “. 1.4 1.2
a
x(t) 1 60.8
b
0.6 0.4 0.2 0
0
5
10
15
20
-
25
30
35
40
t/s
Abbildung 13.12: Sprungantwort des geschlossenen Regelkreises (T = 0,5 s) für die Führungsgröße mit w " = 1 für die Systeme: Kreis 1 ohne Stellsignalbegrenzung (Kurve —); Kreis 2 mit Stellsignalbegrenzung (Kurve „ a “); Kreis 3 mit Anti-Wind-UpKorrektur (Kurve „ b “) Die Regelgröße von Kreis 1 schwingt 20 % über und die Ausregelzeit beträgt 17 s (siehe Abb. 13.12). Die Stellgröße erreicht einen Maximalwert von ca. 3,7 Einheiten (siehe Abb. 13.13). Ohne Anti-Wind-Up-Korrektur (Kreis 2) bleibt das Überschwingen zufällig bei ca. 20 %, aber die Ausregelzeit steigt auf 28 s an. Die Stellamplitude ist auf 4 3.5
x(t) 3 62.5
a
b
2 1.5 1 0.5 0
0
5
10
15
20
-
25
30
35
40
t/s
Abbildung 13.13: Stellgrößenverläufe für die Systeme: Kreis 1 ohne Stellsignalbegrenzung (Kurve —); Kreis 2 mit Stellsignalbegrenzung (Kurve „ a “); Kreis 3 mit AntiWind-Up-Korrektur (Kurve „ b “) 2,5 Einheiten begrenzt. Mit Anti-Wind-Up-Korrektur (Kreis 3) geht das Überschwingen deutlich zurück und die Ausregelzeit sinkt auf 12 s. Die Stellamplitude ist wieder auf 2,5 Einheiten begrenzt. Die Kurvenverläufe bestätigen die Verbesserung des dynamischen Verhaltens bei Einsatz der Anti-Wind-Up-Korrektur. Mit Verwendung dieser Korrekturmaßnahme wird das Entwurfsziel (maximal 20 % Überschwingen und Ausregelzeit
13.3 „Reglerüberlauf“ (Controller Wind-Up)
299
kleiner 17 s) auch mit Stellgliedbeschränkung erreicht. Die Wirksamkeit der Korrekturmaßnahme ist umso größer, je mehr das maximale Stellsignal (im unbegrenzten Fall) über dem Begrenzungswert (hier |yMax | = 2,5) liegt. Das in den Gleichungen 13.40 beschriebene Verfahren kann auch bei instabilen Reglern angewendet werden. Algorithmus 2. Bei diesem Verfahren wird die Wind-Up-Korrektur direkt auf den integrierenden Anteil des Reglers abgestimmt. Die Methode wird erläutert für einen realen PID-Regler, sie kann jedoch leicht auf einen allgemeinen Regler mit I-Anteil übertragen werden. Ausgehend von einem analogen realen PID-Regler in Standarddarstellung
FR (s) =
KD · s KP TV · s Xa (s) KI KP = KP + + = KP + + . Xe (s) s 1 + TD s TN · s 1 + TD s
ergeben sich die diskretisierten Anteile für eine Abtastzeit T zu: P-Anteil: DP (z) = KP ⇒ xa,P (kT ) = KP · xe (kT ) .
I-Anteil ohne Wind-Up-Korrektur: KP DI (z) = (z. B. nach Tustin) 2 z−1 TN s s= · T z+1 Kp T 1 + z −1 · = 2TN 1 − z −1 KP T ⇒ xa,I (kT ) = xa,I (kT − T ) + · xe (kT ) + xe (kT − T ) . 2TN
DTD -Anteil:
KP TV s DD (z) = (z. B. nach Rückwärtsdiff.quot.) z−1 1 + TD s s= Tz 1 − z −1 Kp TV · = TD (1 + TTD ) − z −1
1 KP TV ⇒ xa,D (kT ) = · xa,D (kT − T ) + · [xe (kT ) − xe (kT − T )] . TD 1 + TT D
300
13 Quasikontinuierlicher Entwurf digitaler Regler - DP (z) Xe (z)
? Xa (z) - j -
u - DD (z)
6 - DI (z)
Abbildung 13.14: PID-Regler ohne Wind-Up-Korrektur Abb. 13.14 zeigt die Struktur des digitalen PID-Reglers. Bei der Wind-Up-Korrektur wird nun nur beim I-Anteil die Differenz zwischen dem unbegrenzten x˜a (kT ) und begrenzten Ausgang xa (kT ) subtrahiert (siehe Abb. 13.15). - DP (z) Xe (z)
t - DD (z)
- DI (z)
˜ a (z) X
? - i 6 – - i
T Tw
·
z −1 1−z −1
SAT -
Xa (z) -
? – i
Abbildung 13.15: PID-Regler mit Wind-Up-Korrektur I-Anteil mit Wind-Up-Korrektur:. KP T · xe (kT ) + xe (kT − T ) 2TN T − x ˜a (kT − T ) − xa (kT − T ) . Tw
xa,I (kT ) = xa,I (kT − T ) +
Für xa (kT − T ) = x˜a (kT − T ) ist die Korrektur unwirksam. Wird jedoch xa (kT − T ) < x˜a (kT − T ), dann wird ein negativer Korrekturterm von xa,I (kT ) subtrahiert und reduziert die Wirkung des Wind-Up. Die Zeitkonstante Tw kann verändert werden, um die Korrektur auf den Anwendungsfall abzustimmen. Der I-Anteil wird dann beschrieben durch: Xa,I (z) =
Kp T 1 + z −1 T z −1 ˜ a (z) − Xa (z)] . · · Xe (z) − · · [X −1 2TN 1 − z Tw 1 − z −1
13.3 „Reglerüberlauf“ (Controller Wind-Up)
301
In der Wirkung unterschieden sich die beiden Methoden nur wenig. Der Vorteil bei Methode 2 liegt darin, dass man über die Zeitkonstante Tw die Korrektur auf den Anwendungsfall abstimmen kann und damit flexibler ist. Dies soll wieder an der Verzögerungsstrecke 3. Ordnung von Beispiel 13.8 demonstriert werden.
Beispiel 13.9: Für die Verzögerungsstrecke 3. Ordnung beschrieben durch die Übertragungsfunktion 0,5 (1 + s) · (1 + 2s) · (1 + 5s)
FS (s) =
wird nach dem Verfahren der dynamischen Kompensation der folgende analoge Regler ausgelegt:
FR (s) =
2,67 · (1 + 5s) . 5s
Der entsprechende digitale Regler nach Tustin für eine Abtastzeit von T = 0,5 s lautet:
D(z) =
2,8035 − 2,5365z −1 . 1 − z −1
Der Regler ist so ausgelegt, dass bei einem Sprung der Führungsgröße maximal 20 % Überschwingen auftritt bei einer Ausregelzeit von 17 s für ein 5 % Fehlerband. Das Stellglied weist eine Begrenzung bei ±2,5 auf. Es wird nun die Reglerstruktur nach Abb. 13.15 (ohne den nicht vorhandenen DAnteil) aufgebaut. Die Anwendung der Wind-Up-Korrektur nach Algorithmus 2 hat als zusätzlichen Freiheitsgrad bei der Auslegung die „Wind-Up-Zeitkonstante“ TW . Die nachfolgende Abbildung zeigt den Verlauf der Sprungantwort des Regelkreises für den Fall ohne Wind-Up-Korrektur (Fettgezeichneter Verlauf) und für die zwei Wind-UpZeitkonstanten TW = 1 s und 5 s. Der Verlauf der Regelgröße für TW = 1 s entspricht praktisch dem mit dem Algorithmus 1 erzielten Ergebnis. Im Vergleich dazu ist der Signalverlauf TW = 5 s etwas langsamer und das Überschwingen wird größer. Dieses Ergebnis ist nicht allgemeingültig. Generell hat man mit dieser Wind-Up-Zeitkonstanten jedoch einen zusätzlichen Entwurfsparameter (Korrekturfaktor) den man geeignet einstellen kann.
302
13 Quasikontinuierlicher Entwurf digitaler Regler
1.4 1.2
b
x(t) 1 60.8
a
0.6 0.4 0.2 0
0
5
10
15
20
-
25
30
35
40
t/s
Abbildung 13.16: Sprungantwort für die Systeme: Kreis 1 ohne Wind-Up-Korrektur (Kurve —); Kreis 2 mit Wind-Up-Korrektur für TW = 1 s (Kurve „ a “); Kreis 3 mit Wind-Up-Korrektur für TW = 5 s (Kurve „ b “)
14
Ortskurvenverfahren
14.1
Das Wurzelortskurvenverfahren
14.1.1
Grundlagen des Entwurfsverfahrens
Grundlagen. Das Wurzelortskurvenverfahren in der digitalen Regelung wird äquivalent angewendet zum Verfahren in der analogen Regelung. Für den digitalen Standardregelkreis V (z) W (z) -e − 6
D(z)
− e - H0 G(z) -?
X(z) -
Abbildung 14.1: Digitaler Regelkreis mit D(z) und H0 G(z) als Regler- bzw. Streckenübertragungsfunktion lautet die charakteristische Gleichung 1 + K · D(z) · H0 G(z) = 0.
(14.1)
Hierbei ist angenommen, dass die Reglerverstärkung KP = K aus der Übertragungsfunktion D(z) des Reglers herausgezogen ist. Eine andere Schreibweise der charakteristischen Gleichung ist N {D(z)} · N {H0 G(z)} + K · Z{D(z)} · Z{H0 G(z)} = 0.
(14.2)
mit Z{ . } und N { . } als Zähler- bzw. Nennerpolynom. Die Wurzelortskurve ist der geometrische Ort für alle Wurzeln der charakteristischen Gleichung in Abhängigkeit von der Reglerverstärkung K. Es ist K somit der Laufparameter der Ortskurve. Die Bedeutung der Wurzelortskurve als Entwurfswerkzeug liegt nun darin, dass man durch die Wahl der Reglerverstärkung K die Lage der Nullstellen (Wurzeln) der charakteristischen Gleichung, d. h. der Pole des geschlossenen Kreises, festlegt. Die Nullstellen der Zählerpolynome der jeweiligen Führungs- und Störübertragungsfunktion bleiben unbeeinflusst von der Wahl von K. Die Wurzelortskurve verläuft von den Nullstellen der Nennerpolynome N {D(z)} bzw. N {H0 G(z)}, beginnend mit K = 0, in die Nullstellen der Zählerpolynome Z{D(z)} bzw. Z{H0 G(z)} für K ⇒ ∞.
304
14 Ortskurvenverfahren
Die Aufgabe des Reglerentwurfs mithilfe der Wurzelortskurve ist die Auswahl des Reglers und die Festlegung der Reglerverstärkung K derart, dass die Pole des geschlossenen Kreises in dem gewünschten Stabilitätsgebiet in der z-Ebene liegen (siehe Abb. 12.9).
14.1.2
Stabilitätsgebiete in der z-Ebene
Erläuterung. Nach Abschnitt 12.1 müssen für einen stabilen digitalen Regelkreis die Wurzeln der charakteristischen Gleichung innerhalb des Einheitskreises liegen. Sofern die Führungsübertragungsfunktion FW (z) des Kreises näherungsweise durch ein PT2 -Verhalten beschrieben werden kann, d. h. sofern der Kreis ein dominantes Polpaar aufweist, erweist sich die Hinzuziehung von Hilfslinien in der z-Ebene als hilfreich für die Festlegung der Reglerverstärkung K. Vorwiegend verwendet werden dann die Hilfslinien konstanter Dämpfung D und konstanter Kreisfrequenz ω0 , wie in Abb. 14.2 eingezeichnet. 1 0.6π/T 0.8
0.5π/T
0.4π/T 0.10.3π/T
0.7π/T
0.6
0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
0.8π/T
0.4 0.9π/T 0.2
Im(z)
6
0
a b
0.2π/T
0.1π/T
d c
π/T π/T
−0.2 0.9π/T
0.1π/T
e
−0.4
−0.6
0.8π/T
0.2π/T
0.7π/T
−0.8
0.3π/T 0.6π/T
−1 −1
−0.8
−0.6
−0.4
−0.2
0.5π/T 0
-
0.4π/T 0.2
0.4
0.6
0.8
1
Re(z)
Abbildung 14.2: Linien konstanter Dämpfung D [beginnend im Punkt (+1,0)] und konstanter Kreisfrequenz ω0 (beginnend auf dem Einheitskreis) mit den Hervorhebungen: Linie mit Dämpfung D = 0,1 (Kurve a), 0,2 (Kurve b), Linie mit Kreisfrequenz ω0 = π/10T (Kurve c), Linie mit Kreisfrequenz ω0 = 2π/10T (Kurve d) sowie Punkt „e“ mit den Koordinaten 0,4 − j0,6 in der z-Ebene Diese Hilfslinien sollen nun näher betrachtet werden. 1. Die Linien konstanter Dämpfung D in Abb. 14.2 gelten von außen nach innen für die Dämpfungen D = 0,1 (Kurve a), 0,2 (Kurve b), 0,3 . . . 0,9. Für ein PT2 -Verhalten von FW (z) gilt zwischen der Dämpfung D und dem prozentualen
14.1 Das Wurzelortskurvenverfahren
305
maximalen Überschwingen u¨ der Regelgröße der Zusammenhang | ln u¨| D=) π 2 + (ln u ¨)2
bzw.
u ¨ = exp
−π · D √ 1 − D2
.
(14.3)
2. Die Linien konstanter Kreisfrequenz ω0 sind in Abb. 14.2 von rechts nach links gezeichnet für die Werte von ω0 = n · π/(10T ) für n = 1, 2 . . . 10 mit T als Abtastzeit. Zwischen der Kreisfrequenz ω0 und der Anregelzeit TAn der Regelgröße besteht im Bereich der Dämpfung D ≈ 0,7 die Beziehung TAn ≈
π . ω0
(14.4)
Die äußerste rechte halbkreisförmige Linie konstanter Kreisfrequenz in Abb. 14.2 — also für n = 1 und mit Kurve c bezeichnet — entspräche für ein System mit der Abtastzeit T = 0,2 s somit einer Anregelzeit von TAn =
π π = 2 s. = ω0 1 · π/(10 · 0,2 s)
Die zweite Linie von rechts — also für n = 2 und mit Kurve d bezeichnet — entspräche einer Anregelzeit von TAn = 1 s, usw. 3. Der Abstand eines dominanten Polpaares vom Ursprung lässt auf die Ausregelzeit TAus der Regelgröße x(t) schließen. In der s-Ebene stellen die Linien konstanter Ausregelzeit vertikale Geraden mit den Achsenabschnitten Re{s} = −δ mit δ als Abklingkonstante dar. Die Abbildung dieser vertikalen Linien in die z-Ebene führt gemäß Abb. 12.5 zu konzentrischen Kreisen um den Ursprung mit dem Radius r = exp
T TAus
· ln ,
(14.5)
mit T als Abtastzeit und als Größe des Fehlerbandes mit den Werten 1 %, 2 %, 5 % oder 10 %. Der in Abb. 14.2 mit „e “ hervorgehobene Punkt an der Position ) 0,4 − j0,6 weist einen Abstand von r = 0,42 + 0,62 = 0,7211 vom Ursprung auf. Bei einer Abtastzeit T = 0,2 s und einem 2 % Fehlerband entspräche dieser Punkt somit einer Ausregelzeit von TAus = T ·
ln = 2,39 s. ln r
Diese Hilfslinien erleichtern die Auswahl der Reglerverstärkung K, da man nun einen Anhaltspunkt für die An-, Ausregelzeit oder Dämpfung hat, sofern der geschlossene Kreis näherungsweise durch ein dominantes Polpaar beschrieben werden kann.
306
14.1.3
14 Ortskurvenverfahren
Entwurf eines Reglers
Anwendung. Der Entwurf eines Reglers mithilfe der Wurzelortskurve soll anhand einer Verzögerungsstrecke dargestellt werden. Gegeben ist die PT2 -Regelstrecke mit der Übertragungsfunktion FS (s) =
1 1 = . (1 + T1 s) · (1 + T2 s) (1 + s) · (1 + 0,5s)
(14.6)
Es gilt also KS = 1, T1 = 1 s und T2 = 0,5 s. Die zugehörige z-Übertragungsfunktion der Strecke mit vorgeschaltetem Halteglied und nachgeschaltetem Abtaster lautet für eine Abtastzeit von T = 0,5 s: H0 G(z) =
0,1548z −1 + 0,0939z −2 . 1 − 0,9744z −1 + 0,2231z −2
(14.7)
Der gewählte PI-Regler, ausgelegt nach dem Verfahren der dynamischen Kompensation, besitzt die Übertragungsfunktion FR (s) = K ·
1+s . s
(14.8)
Die zugehörige z-Übertragungsfunktion, diskretisiert nach der bilinearen Transformation, resultiert für eine Abtastzeit von T = 0,5 s zu: D(z) = K ·
1,25 − 0,75z −1 . 1 − z −1
(14.9)
Die charakteristische Gleichung lautet in Abhängigkeit von K z 3 + (0,1935K − 1,9744)z 2 + (0,0013K + 1,1975)z − (0,0704K + 0,2231) = 0. (14.10)
Die Ordnung dieser Gleichung beträgt n = 3. Folglich besitzt die Wurzelortskurve 3 Äste (siehe Abb. 14.3). Sie beginnen in den Polen von Strecke und Regler (bei z1 = +0,6065, z2 = +0,3679 und z3 = +1 hervorgehoben durch ein „ x “ und enden in den Nullstellen bei z01 = –0,6065 und z02 = +0,6 sowie im Unendlichen, jeweils hervorgehoben durch ein „o“. Vergleicht man die Pole der Strecke (z1 = +0,6065 und z2 = +0,3679) mit der Reglernullstelle bei z01 = +0,6, so stellt man fest, dass keine exakte Kompensation des Streckenpols bei +0,6065 durch die Reglernullstelle bei +0,6 stattfindet. Für K > 5,4 verlässt die Wurzelortskurve den Einheitskreis, der Regelkreis wird instabil. Die nachfolgende Abb. 14.4 zeigt einen Ausschnitt aus der Wurzelortskurve. Hervorgehoben ist durch ein „∗“ der Punkt auf der Wurzelortskurve mit der Verstärkung K = 0,69.
14.1 Das Wurzelortskurvenverfahren
307
K
Im(z)
6
K
K
-
Re(z)
Abbildung 14.3: Wurzelortskurve des Regelkreises für T = 0,5 s
Im(z)
6
-
Re(z)
Abbildung 14.4: Ausschnitt aus der Wurzelortskurve des Regelkreises für T = 0,5 s Dieser Punkt („ ∗ “) liegt genau auf der Hilfslinie mit der Dämpfung D = 0,7 und ungefähr auf der Linie mit der Kreisfrequenz 1,75 · π = 1,10s−1 . ω0 = 10 · 0,5s
308
14 Ortskurvenverfahren
Dies entspricht dann nach Gleichung 14.4 einer Anregelzeit TAn ≈ 2,86 s. Der Abstand des Punktes vom Nullpunkt beträgt r ≈ 0,68. Nach Gleichung 14.5 entspricht dies dann für ein 2%-Fehlerband einer Ausregelzeit von TAus = 5,07 s. Die Aussagen hinsichtlich Dämpfung, An- und Ausregelzeit gelten für die Regelgröße x(t) jedoch nur dann, wenn ein dominantes Polpaar die Dynamik des geschlossenen Regelkreises bestimmt. Da die Wurzelortskurve jedoch 3 Äste aufweist, muss ein dritter Pol für K = 0,69 existieren. Bei genauerer Analyse von Abb. 14.4 ist dieser dritte Pol links der Nullstelle z01 = 0,6 zu finden. Er befindet sich jedoch so nahe bei der Nullstelle, dass seine Wirkung durch die Nullstelle kompensiert wird (Pol-/Nullstellenkompensation). Somit ist für den Einschwingvorgang des geschlossenen Kreises für einen Sollwertsprung zu erwarten, dass die Regelgröße eine Dämpfung von D = 0,7 (entsprechend u¨ ≈ 4,3 %) aufweist, sowie eine An- und Ausregelzeit von 2,75 s bzw. 5,07 s. Die in Abb. 14.5 gezeigte Sprungantwort bestätigt weitgehend die oben ermittelten Zeiten für An-, Ausregelzeit und Dämpfung. Der geschlossene Regelkreis kann durch ein dominierendes Polpaar beschrieben werden, daher ist die erwartete gute Übereinstimmung der in der z-Ebene abgeschätzten und im Zeitverhalten nachgewiesenen Kenngrößen festzustellen. 1.4 1.2
x(t)
1
60.8 0.6 0.4 0.2 0
0
1
2
3
4
5
-
6
7
8
9
10
t/s
Abbildung 14.5: Sprungantwort des Regelkreises für die Abtastzeit T = 0,5 s und die Reglerverstärkung K = 0,69 mit eingezeichnetem 2 %-Fehlerband Wenn die Führungsübertragungsfunktion nicht durch ein dominierendes Polpaar beschrieben werden kann, dann sind die Hilfslinien nur als grober Anhaltspunkt zu werten. Aufgabe 14.1: Gegeben ist die folgende Übertragungsfunktion einer analogen PT2 Regelstrecke FS (s) =
2 . (1 + s) · (1 + 4s)
Verwenden Sie für die Auslegung eines PI-Reglers die Methode der dynamischen Kompensation. Die Abtastzeit betrage T = 1 s. Zeichnen Sie die Wurzelortskurve des diskreten Systems und beantworten Sie anhand der Wurzelortskurve die Fragen 2 und 3.
14.2 Der Entwurf mithilfe des Bode-Diagramms
309
1. Wie lautet die z-Übertragungsfunktion des digitalen PI-Reglers? 2. Bestimmen Sie anhand der Wurzelortskurve für das diskrete System die Reglerverstärkung KP so, dass der geschlossene Kreis eine Dämpfung von D = 0,6 aufweist. Wie groß ist KP ? 3. Wie groß sind die An- und Ausregelzeit der Regelgröße für ein sprungförmiges Führungssignal für ein 5 %-Fehlerband? Lösung: 1. D(z) = KP ·
1,125 − 0,875z −1 . 1 − z −1
2. KP = 0,84 3. TAn ≈ 5 s und TAus = 7,77 s.
14.2
Der Entwurf mithilfe des Bode-Diagramms
14.2.1
Das „diskrete“ Bode-Diagramm
Grundlagen. Die Vorteile des Entwurfs mithilfe des Bode-Diagramms für kontinuierliche Systeme sind wie folgt zu sehen: 1. Amplituden- und Phasengänge können relativ leicht von Hand konstruiert werden. 2. Bei „einfachen“ Systemen (Phasenminimumsystem) kann aus dem Amplitudenund Phasenrand die Stabilität des Regelkreises bestimmt werden. 3. Die Bestimmung der Regler (Festlegung der Reglerverstärkung, Auslegung von Korrekturnetzwerken) kann mithilfe des Bode-Diagramms durchgeführt werden. 4. Aus dem Frequenzverhalten kann auf das Verhalten der Regelgröße im Zeitbereich geschlossen werden (z.B. Bandbreite ↔ Anregelzeit). Diese Vorteile möchte man beim Entwurf diskreter Regler erhalten. Für die Darstellung des „diskreten“ Bode-Diagramms wird von der folgenden z-Übertragungsfunktion eines Regelkreisgliedes ausgegangen: G(z) =
b0 + b1 z −1 + . . . + bm z −m . a0 + a1 z −1 + . . . + an z −n
(14.11)
310
14 Ortskurvenverfahren
Amplituden- und Phasengang (also das „diskrete“ Bode-Diagramm) dieser z-Übertragungsfunktion sind nach [24] definiert zu |G(z)| = |G(z)|z=ejωT ∠{G(z)} = ∠{G(z)}z=ejωT
für für
0 ≤ ω ≤ ωT /2 0 ≤ ω ≤ ωT /2.
(14.12) (14.13)
Die Größe z läuft somit entlang dem Einheitskreis von z = 0 bis z = −1 gemäß der Beziehung z = ejωT mit T als Abtastzeit und ωT = (2π)/T als Abtastfrequenz. Die Darstellung dieses Bode-Diagramms erfolgt wieder in der Frequenzebene ω. Damit bleiben die Vorteile des Reglerentwurfs mithilfe des Bode-Diagramms zu einem gewissen Grad erhalten. Die einfache Konstruktion „von Hand“ ist jedoch nicht mehr möglich. Außerdem ist die Gültigkeit des Bode-Diagramms wegen des Shannon’schen Abtasttheorems auf den Frequenzbereich bis zur halben Abtastfrequenz begrenzt. Beispiel. In Abb. 14.7 sind Amplituden- und Phasendiagramme der folgenden schwingungsfähigen Regelstrecke 3. Ordnung (siehe auch Beispiel 15.3) dargestellt: FS (s) = " G(s) =
1 0,5 . = 3 2 3 2 1 + s + 5s + 2s s + 2,5s + 0,5s + 0,5
(14.14)
Die z-Übertragungsfunktion der Regelstrecke mit vorgeschaltetem Halteglied und nachgeschaltetem Abtaster lautet für eine Abtastzeit von T = 0,5 s: H0 G(z) =
0,0078z −1 + 0,0233z −2 + 0,0042z −3 . 1 − 2,1946z −1 + 1,5164z −2 − 0,2865z −3
(14.15)
Während FS (s) keine endlichen Nullstellen besitzt, weist H0 G(z) aufgrund des Abtastund Haltevorgangs zwei endliche Nullstellen bei z01 = −2,8075 und z02 = −0,1914 auf. Zunächst wird die obere Kurve des Amplitudengangs betrachtet. Kurve a in Abb. 14.7 zeigt den Amplitudengang der analogen Regelstrecke und Kurve b zeigt den Amplitudengang der Strecke mit Abtaster und Halteglied. Die Amplitudengänge sind bis zur halben Abtastfrequenz (ω ≈ 6 s−1 ) weitgehend identisch. Ab der Frequenz ωT /2 ist der Amplitudengang von H0 G(z) irrelevant. Für die Phasengänge (untere Abbildung 14.7) gilt eine ähnliche Aussage. Kurve a zeigt den Phasengang der analogen Regelstrecke, und Kurve b zeigt den Phasengang der Strecke mit Abtaster und Halteglied. Die Phasengänge sind nun jedoch nur bis ca. zu 1/10 der Shannon’schen Grenzfrequenz von 6,28 s−1 , d. h. bis 0,628 s−1 deckungsgleich. Der Abtast- und Haltevorgang wirkt sich nur wenig auf den Amplitudenverlauf aus, die Phasennacheilung jedoch nimmt deutlich zu. Es wird hierdurch ersichtlich, dass der Entwurf des digitalen Reglers auf der Basis des „analogen“ Bode-Diagramms nur mit Einschränkungen möglich ist. Denn Abtaster und Halteglied und seine destabilisierende Wirkung sind darin nicht berücksichtigt. Mit der
14.2 Der Entwurf mithilfe des Bode-Diagramms
311
Erstellung des „diskreten“ Bode-Diagramms unter Benutzung eines Digitalrechners kann aber der Reglerentwurf ähnlich wie beim Entwurf analoger Regler erfolgen. Bevor auf diesen Reglerentwurf näher eingegangen wird, soll eine weitere Methode der Erstellung eines diskreten Bode-Diagramms auf der Basis einer bilinearen Transformation erläutert werden.
14.2.2
Die w-Transformation
Erläuterung. Bei der Erstellung des Bode-Diagramms einer diskreten Übertragungsfunktion G(z) nach den Gleichungen 14.12 und 14.13 verläuft die Frequenz ω in der s-Ebene entlang der imaginären Achse von ω = 0 bis ωT /2, bzw. in der z-Ebene von z = +1 entlang des Einheitskreises bis z = −1. Die Beschreibung der z-Übertragungsfunktion G(z) wird beibehalten, nur für die Frequenz wird ein geeigneter Pfad in der z-Ebene verwendet. Bei der Methode der Ermittlung des Bode-Diagramms auf der Basis der w-Transformation wird zunächst die z-Übertragungsfunktion G(z) mittels einer bilinearen Transformation in die s-Ebene rücktransformiert und dann das Bode-Diagramm für den Frequenzbereich 0 ≤ ω ≤ ωT /2 berechnet. Zur Unterscheidung von der ursprünglichen s-Ebene wird die Ebene, in die rücktransformiert wird, als w-Ebene bezeichnet. Die w-Transformation ist quasi die Umkehrung der bilinearen Transformation nach Tustin (siehe Abschnitt 13.1.2) gemäß der Beziehung s=
2 z−1 · . T z+1
(14.16)
Frequenzabhängigkeit der bilinearen Transformation. Vor der Durchführung dieser Umkehrung (siehe Gleichung 14.21) soll der Zusammenhang zwischen den Frequenzen in der s-Ebene und der w-Ebene infolge der bilinearen Transformation näher betrachtet werden. Dazu führt man in Gleichung 14.16 die Substitutionen s = " w = jν z = " esT
und
(14.17) (14.18)
durch. Es resultiert dann für w w=
2 esT − 1 2 sT · sT = · tanh . T e +1 T 2
(14.19)
Für ein rein imaginäres s = jω verläuft z = ejωT auf dem Einheitskreis und es resultiert dann für w w= " jν = j ·
ωT 2 · tan . T 2
(14.20)
312
14 Ortskurvenverfahren
3
10
2
10
ν/s−1 6
1
10
0
10
−1
10
−2
10
−3
10
−3
−2
10
10
−1
10
-
0
10
ω/s−1
1
10
Abbildung 14.6: Darstellung der Frequenz ν der w-Transformation abhängig von der Frequenz ω Für Frequenzen bis ω ≈ 3 s−1 sind die Frequenzen ω und ν praktisch identisch, wie Abb. 14.6 für die Abtastzeit T = 0,5 s zeigt. Ab der Frequenz ω ≈ 3 s−1 , also ab ωT /4, wächst ν jedoch gegen Unendlich. Somit kann man erwarten, dass die Bode-Diagramme der analogen Strecke und der mit der w-Transformation rücktransformierten Strecke ca. bis ωT /4 weitgehend übereinstimmen. Berechnung der bilinearen Transformation. Die Formel für die Rücktransformation der z-Übertragungsfunktion G(z) mithilfe der w-Transformation in die w-Ebene gewinnt man, indem man in Gleichung 14.16 die Größe s durch w ersetzt und nach z auflöst. Dann erhält man die Gleichung z=
1+w· 1−w·
T 2 T 2
.
(14.21)
Die w-Übertragungsfunktion G(w) berechnet man dann unter Verwendung von (14.22) G(w) = G(z) 1 + w · T2 . z= 1 − w · T2 Die Anwendung von Gleichung 14.22 auf die Übertragungsfunktion des Beispiels von Abschnitt 14.2.1 H0 G(z) =
0,0078z −1 + 0,0233z −2 + 0,0042z −3 1 − 2,1946z −1 + 1,5164z −2 − 0,2865z −3
(14.23)
14.2 Der Entwurf mithilfe des Bode-Diagramms
313
ergibt dann die w-Übertragungsfunktion G(w) = H0 G(z)
=
1+w· T 2 z= 1−w· T 2
0,0023w3 − 0,0149w2 − 0,0900w + 0,4522 . w3 + 2,2560w2 + 0,4752w + 0,4522
(14.24)
Der Vergleich von Gleichung 14.14 mit 14.24 zeigt eine gewisse Übereinstimmung im Nennerpolynom. Das Zählerpolynom weist nun jedoch die durch Abtaster und Halteglied hinzugekommenen zusätzlichen Nullstellen bei w01 = +8,4260, w02 = +4 und bei w03 = −5,8934 auf. Für diese w-Übertragungsfunktion G(w) werden nun Amplituden- und Phasengang 20
10
0
|G(..)| dB
6
−10
−20
b
−30
−40
c −50
−60
a −70 −3 10
−2
10
10 −1
ω/s−1
0
10
1
10
0
−50
−100
∠|G(..)| ◦
6
−150
−200
−250
a
−300
c
−350
−400
b
−450
−500 −3 10
−2
10 -
−1
0
1
ω/s−1 Abbildung 14.7: Amplitudenverlauf (obere Abb.) und Phasenverlauf (untere Abb.) der " G(s), Kurve b: H0 G(z) und Kurve c: G(w); ωT /2 = Regelstrecke: Kurve a: FS (s) = 6,16 s−1 10
10
10
314
14 Ortskurvenverfahren
berechnet und ebenfalls in Abbildung 14.7 als Kurve c eingetragen. Der Amplitudengang von G(w) weicht ab der Frequenz ω ≈ 2 s−1 merklich vom Amplitudengang der kontinuierlichen Strecke (Kurve a) ab. Generell ist jedoch festzustellen, dass die Amplitudengänge mit Berücksichtigung von Abtaster und Halteglied (Kurve b und c) erst im höheren Frequenzbereich sich von Kurve a unterscheiden. Bei den in Abb. 14.7 dargestellten Phasengängen sind die Unterschiede der Phasenverläufe deutlich größer. Während der Phasenverlauf von G(s) (Kurve a) von 0◦ bis −270◦ verläuft, sind die Phasenverzögerungen von H0 G(z) und G(w) (Kurve b und c) infolge des Abtast- und Haltevorgangs deutlich größer. Bis zur Hälfte der Shannon’schen Grenzfrequenz ωT /2 = 6,16 s−1 , d. h. bis ca. ω ≈ 2 . . . 3 s−1 , stimmen die Verläufe der Phasengänge von H0 G(z) und G(w) noch überein, danach weist der Phasengang von H0 G(z) jedoch eine deutlich größere Phasenverzögerung auf. Abtast- und Haltevorgang wirken sich deutlich mehr auf den Phasenverlauf aus als auf den Amplitudenverlauf. Dies konnte schon in Abb. 9.7 beobachtet werden. Schon ab ca. 1/10 der Shannon’schen Grenzfrequenz von 6,28 s−1 , d. h. ab 0,628 s−1 , nimmt die Phasennacheilung infolge des Abtast- und Haltevorgangs deutlich zu. Zusammenfassend ist festzustellen, dass für den Entwurf des digitalen Reglers der analog entworfene Regler übernommen werden kann, sofern die Abtastfrequenz deutlich über den höchsten im System vorkommenden Frequenzen liegt. Im anderen Fall sind die Amplitudenänderungen und Phasenverzögerungen durch Abtast- und Haltevorgang zu berücksichtigen. Es sollte dann das Bode-Diagramm des diskreten Systems verwendet werden. Der Rechenaufwand für die Berechnung des Bode-Diagramms von H0 G(z) ist geringer, da die Rücktransformation in die w-Ebene entfällt. Daher wird im nächsten Abschnitt diese Methode verwendet. In [19] wird auf den Reglerentwurf mithilfe der w-Transformation ausführlich eingegangen. Aufgabe 14.2: Berechnen Sie die w-Übertragungsfunktion von Regler (KP = 1) und Strecke von Aufgabe 14.1 für die Abtastzeit von T = 1 s. Lösung: FR (w) =
14.2.3
w + 0,25 w
und
FS (w) =
−0,0235w2 − 0,1828w + 0,4597 . w2 + 1,1729w + 0,2299
Entwurf eines Reglers
Reglerauslegung. Der Entwurf eines Reglers mithilfe des diskreten Bode-Diagramms soll am Beispiel der im vorangehenden Abschnitt 14.2.1 analysierten schwingungsfähigen PT3 -Regelstrecke untersucht werden: FS (s) = " G(s) =
1 0,5 . = 3 1 + s + 5s2 + 2s3 s + 2,5s2 + 0,5s + 0,5
(14.25)
14.2 Der Entwurf mithilfe des Bode-Diagramms
315
Die Pole der Regelstrecke liegen bei s1 = −2,3782 und s2,3 = −0,0609 ± j0,4545 . Eigenfrequenz und Dämpfung des konjugiert komplexen Polpaares betragen für dieses Polpaar ω0 = 0,4585 s−1 bzw. D = 0,134. Der digitale Regler soll in erster Linie die schwachgedämpfte Schwingung der Strecke kompensieren. Außerdem soll für den Einschwingverlauf der Regelgröße x(t) die Stellenergie kleine Werte annehmen. Die Abtastzeit beträgt T = 0,5 s. Damit scheidet der Dead-Beat Reglerentwurf, der in Abschnitt 15.2 für diese Strecke verwendet wird, aus, denn es resultiert in Beispiel 15.3 für diese Abtastzeit eine maximale Stellamplitude von ca. 30. Die gewünschte Reglerstruktur erfordert somit eine komplexe Zählernullstelle beim schwingungsfähigen Pol der Regelstrecke, eine Integration zur Beseitigung der bleibenden Regeldifferenz, sowie eine kleine Zeitkonstante TR , damit der Regler realisierbar bleibt und der Zählergrad nicht größer als der Nennergrad wird. Der analoge Regler besitzt damit folgende Struktur: FR (s) =
2 KI s2 + 2DR ω0R s + ω0R · . s 1 + TR s
(14.26)
Es werden die Reglerparameter wie folgt gewählt: 1. Da die Eigenfrequenz der Strecke genauer messbar ist als die Dämpfung der Strecke, werden als Reglerwerte gewählt ω0R = 0,46 s−1 und DR = 0,1407. Die Dämpfung ist dabei ca. 10 % größer als die wahre Dämpfung der Strecke, die Eigenfrequenz weicht jedoch nur geringfügig vom wahren Wert ab. 2. Der Integrierbeiwert wird zunächst gewählt zu KI = 1 s−1 . 3. Die Zeitkonstante des Reglers wird auf TR = 0,3 s gesetzt, um zu große Stellamplituden zu vermeiden. Mit den Zahlenwerten für diskreten Regler und Strecke mit Abtaster und Halteglied resultiert dann die Übertragungsfunktion des aufgeschnittenen Regelkreises zu F0 (z) = D(z) · H0 G(z).
(14.27)
Die Abbildung 14.8 zeigt Amplituden- und Phasengang des aufgeschnittenen diskreten Regelkreises. Infolge der komplexen Zählernullstelle des Reglers wird die Wirkung der komplexen Polstelle der Strecke fast vollständig kompensiert. Die Überhöhung im Amplitudengang ist beseitigt. Aus dem Bode-Diagramm werden Amplituden- und Phasenrand abgelesen zu
316
14 Ortskurvenverfahren 30
20
10
|F0 (z)| dB
6
0
−10
−20
−30
−40
−50 −2 10
−1
10
-
0
10
ω/s−1
1
10
−50
−100
−150
−200
∠|F0 (z)| ◦
−250
6
−300
−350
−400
−450
−500
−550 −2 10
−1
10
0
10
1
10
- ω/s−1 Abbildung 14.8: Amplituden- und Phasengang von F0 (z) = D(z) · H0 G(z) ARand ϕRand
= =
21dB 79◦
bei bei
ω = 1,73 s−1 ω = 0,2 s−1 .
Ein Phasenrand von 60◦ tritt bei der Frequenz ω ≈ 0,555 s−1 auf. Der Amplitudenrand beträgt bei dieser Frequenz ca. 8,17 dB. Folglich kann man die Verstärkung KI noch um 8,17 dB, dies entspricht dem Faktor 2,56 vergrößern. Mit diesem Integrierbeiwert KI = 2,56 resultiert als Übertragungsfunktion des Reglers FR (s) =
0,5288 + 0,3274s + 2,56s2 . s2 + 0,3s
(14.28)
Die Diskretisierung dieser Reglergleichung mittels der bilinearen Transformation nach Tustin für die Abtastzeit T = 0,5 s ergibt die diskrete Übertragungsfunktion D(z) =
4,8635 − 9,1889z −1 + 4,5658z −2 . 1 − 1,0909z −1 + 0,09091z −2
(14.29)
14.2 Der Entwurf mithilfe des Bode-Diagramms
317
Zu dieser z-Übertragungsfunktion gehört die Rekursionsgleichung y(kT ) = 1,0909y([k − 1]T ) − 0,09091y([k − 2]T ) + 4,8635xd(kT ) −9,1889xd([k − 1]T ) + 4,5658xd([k − 2]T ).
(14.30)
Zu einem Phasenrand von 60◦ gehört eine Dämpfung von D ≈ 0,61 und ein prozentuales Überschwingen von ca. 9 %. Die Bandbreite von |F0 (z)| beträgt ca. ωB = 0,555 s−1 . Dies würde einer Anregelzeit von ca. TAn = π/ωB ≈ 5,71 s entsprechen. Diese Werte werden von der in Abb. 14.9 dargestellten Sprungantwort von x(kT ) für eine sprungförmige Eingangsgröße w(t) = w " · σ(t) bestätigt bzw. sogar übertroffen. 1.2 1
x(kT ) 0.8
6
0.6 0.4 0.2 0
0
1
2
3
4
5
6
7
-
8
9
10
11
12
13
14
15
t/s
Abbildung 14.9: Sprungantwort des Regelkreises für die Abtastzeit T = 0,5 s (eingezeichnetes Fehlerband 10 %) In Abb. 14.10 wird die zugehörige Stellgröße y(kT ) aufgetragen. Die maximale Stellamplitude beträgt knapp 5 Einheiten. 5 4
y(kT ) 6
3 2 1 0
−1
0
1
2
3
4
5
6
7
-
8
9
10
11
12
13
14
15
t/s
Abbildung 14.10: Stellgrößenverlauf des Regelkreises für die Abtastzeit T = 0,5 s Vergleicht man die Stellamplitude von Abb. 14.10 mit der Stellamplitude des Dead-BeatReglers für dieselbe Abtastzeit von T = 0,5 s (siehe Abb. 15.11), dann liegt die maximale
318
14 Ortskurvenverfahren
Stellamplitude des Dead-Beat-Reglers bei ca. 30 Einheiten. Sie ist also ca. sechsmal größer. Dafür liegt die Ausregelzeit des Dead-Beat-Reglers bei ca. 1,3 s im Vergleich zu den hier erzielten ca. 6 s. Es besteht der auch bei der analogen Regelung festgestellte Zusammenhang zwischen großer Stellamplitude und kleiner An- bzw. Ausregelzeit, bzw. vice versa. Aufgabe 14.3: Es soll das System von Aufgabe 14.1 weiter untersucht werden. 1. Ermitteln Sie mithilfe des Bode-Diagramms für diskrete Systeme den Amplituden- und Phasenrand und die zugehörigen Frequenzen für die Reglerverstärkung KP = 0,84. 2. Berechnen Sie die w-Übertragungsfunktion des aufgeschnittenen Kreises für die Verstärkung KP = 0,84. 3. Wie groß sind Amplituden- und Phasenrand und die zugehörigen Frequenzen bei Verwendung der w-Transformation? Lösung: 1. ARand = 15,58 dB bei der Frequenz ω1 = 1,363 s−1 und ϕRand = 58,03◦ bei der Frequenz ω2 = 0,3878 s−1 .
2. F0 (w) =
−0,0198w3 − 0,1585w2 + 0,3478w + 0,0965 . w3 + 1,1729w2 + 0,2299w
3. ARand = 15,58 dB bei der Frequenz ω1 = 1,624 s−1 und ϕRand = 57,82◦ bei der Frequenz ω2 = 0,392 s−1 .
15
Entwurf digitaler Kompensationsregler
Grundlagen. Bei den bisherigen Reglerentwürfen wird von einem berechneten analogen Regler ausgegangen. Dieser analoge Regler wird dann diskretisiert. Dies ist insbesondere dann problemlos, wenn die Abtastfrequenz groß im Verhältnis zu den sonstigen im Regelkreis vorkommenden Signalfrequenzen ist. Ist dieser Frequenzabstand nicht gewährleistet, dann empfiehlt sich der direkte digitale Reglerentwurf. Hierbei wird, ohne vorher einen analogen Regler zu entwerfen, direkt der digitale Regler für die diskrete Strecke mit Abtaster und Halteglied berechnet. Im englischen Sprachraum wird diese Vorgehensweise als „Direct Digital Control“ (DDC) bezeichnet. Bei dieser Entwurfsmethode wird vom Regelkreis in der Standardform nach Abb. 15.1 ausgegangen. Regler W (z) - i - D(z) 6 −
V (z) Strecke − i - H0 G(z) - ?
X(z) -
Abbildung 15.1: Digitaler Standardregelkreis Die Vorgehensweise für den Entwurf eines Kompensationsreglers wird entwickelt anhand der Methode nach Ragazzini [60], [24].
15.1
Der direkte Entwurf nach Ragazzini
Methode. Bei diesem Verfahren wird wie beim Entwurf von analogen Kompensationsreglern nach Weber [72], [73] eine z-Übertragungsfunktion für das Führungsverhalten vorgegeben und der Regler wird dann so berechnet, dass der geschlossene Kreis das gewünschte Führungsverhalten annimmt [69]. Es wird ausgegangen von der z-Übertragungsfunktion der Regelstrecke mit vorgeschaltetem Halteglied und nachgeschaltetem Abtaster
H0 G(z) =
b0 + b1 z −1 + . . . + bn z −n B(z) · z −d · z −d = −1 −n a0 + a1 z + . . . + an z A(z)
(15.1)
320
15 Entwurf digitaler Kompensationsregler
mit a0 = 0 sowie d ≥ 0. Die Strecke darf bei dieser Schreibweise eine Totzeit von d Abtastschritten aufweisen. Eine Totzeit von d Abtastschritten liegt vor, wenn im Zählerpolynom bei ansonsten gleicher Ordnung von Zähler- und Nennerpolynom, der Term z −d abgespalten werden kann. Mit B(z) und A(z) werden die Zähler- und Nennerpolynome der Strecke abgekürzt. Dann wird der Regler D(z) so bestimmt, dass die Führungsübertragungsfunktion FW (z) des geschlossenen Kreises eine vorgeschriebene (gewünschte) Form annimmt. Es gilt allgemein FW (z) =
D(z) · H0 G(z) . 1 + D(z) · H0 G(z)
(15.2)
Aufgelöst nach D(z) folgt hieraus die Entwurfsgleichung des Reglers D(z) =
FW (z) 1 · . H0 G(z) 1 − FW (z)
(15.3)
Anforderungen für eine Strecke mit Polen und Nullstellen innerhalb des Einheitskreises. Damit der nach dieser Gleichung berechnete digitale Regler realisierbar bleibt, müssen die folgenden Zusatzbedingungen erfüllt sein: 1. Stabilität: Die Regelstrecke muss stabil sein und sie darf keine Nullstellen außerhalb des Einheitskreises aufweisen. Pole und Nullstellen der z-Übertragungsfunktion H0 G(z) müssen also innerhalb des Einheitskreises liegen. Es reicht hierbei also nicht, nur die Stabilität der analogen Strecke heranzuziehen. 2. Kausalität: Kausalität einer z-Übertragungsfunktion bedeutet, dass das Ausgangssignal xa (kT ) nicht von in der Zukunft liegenden Werten des Eingangssignals xe (kT + iT ) mit i > 0 abhängen darf, denn dann ist sie nicht realisierbar. Diese Forderung wird erfüllt, wenn die Reglerübertragungsfunktion keine Polstelle im Unendlichen aufweist. Dies ist gleichbedeutend mit der Forderung, dass der Koeffizient a0R des Reglers (Gleichung 15.4) nicht verschwinden darf falls b0R = 0. Es muss für D(z) =
b0R + b1R z −1 + . . . a0R + a1R z −1 + . . .
(15.4)
also gelten a0R = 0 sofern b0R = 0. Einsetzen von Gleichung 15.1 in Gleichung 15.3 ergibt: D(z) =
A(z) FW (z) . · B(z) · z −d 1 − FW (z)
(15.5)
Damit resultiert als Entwurfsanforderung für die Kausalität des Reglers, dass die geforderte Führungsübertragungsfunktion FW (z) die Form FW (z) =
p0 + p1 · z −1 + . . . + pr · z −r P (z) · z −d = · z −d N (z) n0 + n1 · z −1 + . . . + nr · z −s
(15.6)
annehmen muss. Mit anderen Worten: Die Totzeit des geschlossenen Kreises, d. h. von FW (z), muss mindestens so groß sein wie die Totzeit der Regelstrecke.
15.1 Der direkte Entwurf nach Ragazzini
321
3. Stationäre Genauigkeit: Die Forderung nach stationärer Genauigkeit eines Regelkreises bedeutet, dass die Regelgröße keine bleibende Regelabweichung aufweisen darf. Sofern die Führungsgröße W (z) ein Sprungsignal darstellt, resultiert für den Regelfehler E(z) E(z) = W (z) − X(z) = [1 − FW (z)] · W (z) = z . = [1 − FW (z)] · z−1
(15.7)
Der Endwertsatz der z-Transformation liefert dann e(∞) = lim e(t) = lim (z − 1) · E(z) t→∞
z=1
= lim (z − 1) · z=1
z · [1 − FW (z)] = 0. z−1
(15.8)
Für die Vermeidung einer bleibenden Regeldifferenz muss der Term 1 − FW (z) eine Nullstelle bei z = 1 aufweisen. Es muss für FW (z) folglich gelten: FW (z)
z=1
= FW (1) = 1.
(15.9)
Für eine stabile Regelstrecke H0 G(z) ohne Nullstellen außerhalb des Einheitskreises reicht die Erfüllung der Bedingungen 15.6 und 15.9 aus. Die Polynome P (z) und N (z) von FW (z) können beliebig vorgegeben werden. Das Entwurfsverfahren soll an einem Beispiel demonstriert werden. Beispiel 15.1: Gegeben sei die analoge Regelstrecke FS (s) =
2/3 . (1 + 0,5s) · (1 + 2s)
Die z-Übertragungsfunktion der Regelstrecke mit Abtaster und Halteglied lautet dann für eine Abtastzeit T = 0,1 s (= " fT = 10 Hz) H0 G(z) =
0,0031z −1 + 0,0028z −2 . 1 − 1,7700z −1 + 0,7788z −2
Die Regelgröße soll mit der e-Funktion x(t) = 1 − e−t/T1
mit T1 = 1 s
322
15 Entwurf digitaler Kompensationsregler
bei einem sprungförmigen Eingang w(t) auf den Sollwert einschwingen. Die Vorgabe eines derartigen Einschwingverhaltens wird auch als Dahlin’s Regelalgorithmus bezeichnet. Dann gilt für den z-transformierten Verlauf der Regelgröße x(t) X(z) =
z (1 − e−T /T1 ) · z = FW (z) · . −T /T 1 z−1 (z − e ) · (z − 1)
Daraus folgt dann FW (z) =
1 − e−T /T1 (1 − e−T /T1 )z −1 = z − e−T /T1 1 − e−T /T1 z −1
Es sollen nun als erstes die Bedingungen für die Realisierbarkeit des Reglers untersucht werden: 1. Stabilität: Die Pole und Nullstellen der Regelstrecke liegen bei z1 = 0,8187, z2 = 0,9512 und z01 = –0,9201. Sie liegen alle innerhalb des Einheitskreises. 2. Kausalität: Die Totzeit von FW (z) ist gleich d = 0 ebenso wie die Totzeit der Strecke. 1 − e−T /T1 = 1. 3. Stationarität: Es gilt für FW (z)|z=1 = z − e−T /T1 z=1 Da alle Randbedingungen erfüllt sind, ist der nach Gleichung 15.5 bzw. 15.3 zu berechnende Regler realisierbar. Er wird berechnet zu: 1 FW (z) 1 1 − e−T /T1 · = · H0 G(z) 1 − FW (z) H0 G(z) z−1 −1 −2 0,0952 − 0,1684z + 0,0741z . D(z) = 0,0031 − 0,0002z −1 − 0,0028z −2 D(z) =
(15.10)
Die zugehörige Rekursionsgleichung des Reglers lautet: xa (kT ) = 1/0,0031 · {0,0002xa (kT − T ) + 0,0028xa(kT − 2T ) +0,0952xe(kT ) − 0,1684xe (kT − T ) + 0,0741xe(kT − 2T )} . Die berechnete Sprungantwort weist das gewünschte Zeitverhalten mit der Zeitkonstanten T1 = 1 s auf (siehe eingezeichnete Gerade in Abb. 15.2). Der in Abb. 15.3 dargestellte Verlauf der Stellamplitude zeigt, dass die Stellgröße dem Kreis das gewünschte Einschwingverhalten aufzwingen muss. Dies führt zu einem sehr unruhigen (oszillierenden) Stellgrößenverlauf.
15.1 Der direkte Entwurf nach Ragazzini
323
1 0.8
x(t) 60.6 0.4 0.2 0
0
0.5
1
1.5
2
2.5
-
3
3.5
4
4.5
5
t/s
Abbildung 15.2: Sprungantwort des geschlossenen Regelkreises für den Regler nach Ragazzini (Abtastfrequenz von 10 Hz)
40 30
y(t) 20 610 0 −10 −20 −30
0
0.5
1
1.5
2
2.5
-
3
3.5
4
4.5
5
t/s
Abbildung 15.3: Stellgrößenverlauf für den Regler nach Ragazzini
Dieser oszillierende Stellgrößenverlauf ist auf die Nullstelle der Strecke (z01 = −0,9201) zurückzuführen, die nun im Regler als Pol bei zR1 = −0,9201, also auf der negativ reellen Achse auftritt. Man spricht bei dieser Konstellation von einem Klirrpol (ringing pole) des Systems. Der zweite integrierende Pol des Reglers liegt bei zR2 = −1. Der Pol bei zR1 wird begleitet von einer Nullstelle des Reglers bei z0R1 = +0,9512. Zur Abhilfe dieser Oszillation wird in [20] vorgeschlagen, den oszillierenden Pol des Reglers durch eine statische Verstärkung bei (z = 1) zu ersetzen. Der Pol bei −0,9201 wird dadurch in den Ursprung geschoben. In der Pol-/Nullstellendarstellung lautet die zuvor berechnete Gleichung 15.10 des Reglers
D(z) = 31,0019 ·
(z − 0,9512) · (z − 0,8187) . (z − 1) · (z + 0,9201)
(15.11)
324
15 Entwurf digitaler Kompensationsregler
Mit der vorgeschlagenen Modifikation wird der Regler D(z) nach Gleichung 15.11 über führt in den Regler D (z) wie folgt:
(z − 0,9512) · (z − 0,8187) (z − 1) · (1 + 0,9201) 16,1460 − 28,5778z −1 + 12,5745z −2 = . 1 − z −1
D (z) = 31,0019 ·
Diese Korrekturmaßnahme beeinflusst das Einschwingverhalten der Regelgröße (bei diesem Beispiel) nicht entscheidend, wie Abb. 15.4 zeigt. Der oszillierende Verlauf der Stellgröße ist jedoch nicht mehr vorhanden (siehe Abb. 15.5). 1 0.8
x(t) 60.6 0.4 0.2 0
0
0.5
1
1.5
2
2.5
-
3
3.5
4
4.5
5
t/s
Abbildung 15.4: Sprungantwort des geschlossenen Regelkreises für den urprünglichen Regler (,,o“) und den modifizierten Regler (,,+“) (Abtastfrequenz von 10 Hz) 18 16 14
y(t) 12 610 8 6 4 2 0
0
0.5
1
1.5
2
2.5
-
3
3.5
4
4.5
5
t/s
Abbildung 15.5: Stellgrößenverlauf für den modifizierten Regler Enthält die Regelstrecke Pole oder Nullstellen außerhalb des Einheitskreises, so werden in [69] weitere Anforderungen aufgeführt, die nachfolgend näher betrachtet werden. Eine direkte Kompensation der „instabilen“ Pole ist wegen der Streckenungenauigkeit wie bei der analogen Regelung nicht möglich.
15.1 Der direkte Entwurf nach Ragazzini
325
Anforderungen für eine Regelstrecke mit Polen oder Nullstellen auf bzw. außerhalb des Einheitskreises. Zunächst wird die Übertragungsfunktion der Regelstrecke von Gleichung 15.1 in Polynome mit Wurzeln innerhalb und auf bzw. außerhalb des Einheitskreises wie folgt aufgespalten: B + (z)B − (z)z −d . A+ (z)A− (z)
H0 G(z) =
(15.12)
Darin sind B + (z) und A+ (z) die Polynome mit Wurzeln innerhalb des Einheitskreises und B − (z) und A− (z) die Polynome mit den Wurzeln auf bzw. außerhalb des Einheitskreises. Damit wird die Reglerbestimmungsgleichung für D(z) gemäß Gleichung 15.5 dann
D(z) =
A+ (z)A− (z) FW (z) . · + − −d B (z)B (z)z 1 − FW (z)
(15.13)
Wählt man nun FW (z) = B − (z)K1 (z)z −d 1 − FW (z) = A− (z)K2 (z)
und
mit zunächst noch frei wählbaren rationalen Übertragungsfunktionen K1 (z) und K2 (z), so eliminiert man mit diesem Ansatz die unerwünschten Anteile aus der Reglerübertragungsfunktion. Die zusätzliche Beachtung der Stationaritätsforderung FW (1) = 1 führt für K1 (z) und K2 (z) zu den Ansätzen BK (z)P (z) und N (z) (1 − z −1 )Q(z) K2 (z) = N (z) K1 (z) =
(15.14) (15.15)
mit den frei wählbaren Polynomen BK (z) und N (z). Die unbekannten Polynome P (z) und Q(z) werden mit minimaler Ordnung so bestimmt, dass die frei wählbaren Parameter in BK (z) und N (z) enthalten sind. Diese Vorgehensweise führt für D(z) und FW (z) zu folgenden Übertragungsfunktionen D(z) = FW (z) =
A+ (z)BK (z)P (z) B + (z)Q(z)(1 − z −1 )
(15.16)
B − (z)BK (z)P (z)z −d N (z)
(15.17)
326
15 Entwurf digitaler Kompensationsregler
mit N (z) = (1 − z −1 )Q(z)A− (z) + B − (z)BK (z)P (z)z −d .
(15.18)
Unbehauen [69] schlägt vor, über einen Koeffizientenvergleich die noch freien Polynome P (z) und Q(z) zu bestimmen, die dann zu einer exakten Realisierung der geforderten Übertragungsfunktion FW (z) führen. Dieses Vorgehen soll an einem Beispiel untersucht werden. Beispiel 15.2 Integrierende Regelstrecke: Das obige Entwurfsverfahren wird an der folgenden integrierenden Regelstrecke untersucht: FS (s) =
0,7672s + 5,1293 . s · (s + 0,5129)
Abb. 15.6 zeigt die Sprungantwort der Regelstrecke. 80
x(t) 60
6 40
20
0
0
1
2
3
4
-
5
6
7
8
t/s
Abbildung 15.6: Sprungantwort der Regelstrecke Die Diskretisierung dieser Regelstrecke mit der Abtastzeit T = 0,1 s ergibt die folgende z-Übertragungsfunktion: H0 G(z) =
0,1 · (z − 0,5) 0,1 · (z −1 − 0,5z −2) 0,1 · (z − 0,5) = = . − 1,95z + 0,95 (z − 1)(z − 0,95) 1 − 1,95z −1 + 0,95z −2
z2
Die Pole der diskretisierten Strecke liegen bei z1 = 1 und z2 = 0,95 und die Nullstelle liegt bei z01 = 0,5. Der Pol z1 liegt auf dem Einheitskreis, der andere Pol und die Nullstelle liegen im Einheitskreis. Es wird nun die folgende Faktorisierung der Polynome der Strecke vorgenommen (wobei d = 0): H0 G(z) =
B + (z)B − (z)z −d , A+ (z)A− (z)
mit
(15.19)
15.1 Der direkte Entwurf nach Ragazzini B + = 0,1z −1 · (1 − 0,5z −1 ) A+ = (1 − 0,95z −1)
327 und B − = 1 und A− = (1 − z −1 ) .
Die frei wählbaren Polynome BK (z) und N (z) werden gewählt zu: und BK (z) = 1 N (z) = 1 − 1,85z −1 + 0,855z −2 = (z − 0,95)(z − 0,9) · z −2 . Die Berechnung der Polynome P (z) und Q(z) mittels Gleichung 15.18 (die nachfolgend wiederholt wird) führt nur dann zu einer eindeutigen Lösung, wenn die linke und rechte Seite der Gleichung dieselbe Ordnung aufweisen, N (z) = (1 − z −1 )Q(z)A− (z) + B − (z)BK (z)P (z)z −d . Da N (z) die Ordnung 2 und A− (z) sowie der Term (1 − z −1 ) die Ordnung 1 aufweisen, setzt man das Polynom Q(z) = 1 auf die Ordnung 0. Da weiterhin B − (z) = BK (z) = 1 und d = 0, kann man Gleichung 15.18 leicht nach dem gesuchten Polynom P (z) auflösen zu: P (z) = N (z) − (1 − z −1 ) · A− (z) = 0,1500z −1 − 0,1450z −2 .
(15.20)
Nachdem alle Polynome berechnet sind, kann man nach den Formeln 15.16 und 15.17 D(z) und FW (z) berechnen zu: 1,5 − 2,8750z −1 + 1,3775z −2 A+ (z)BK (z)P (z) = B + (z)Q(z)(1 − z −1 ) 1 − 1,5z −1 + 0,5z −2 0,1500z −1 − 0,1450z −2 B − (z)BK (z)P (z)z −d = FW (z) = N (z) 1 − 1,8500z −1 + 0,8550z −2 D(z) =
(15.21) (15.22)
Die Pole des Reglers liegen bei z1 = 1 und z2 = 0,5, er enthält also einen I-Anteil. Die Überprüfung von FW (z)|z=1 = FW (1) = 1 ergibt das gewünschte Ergebnis, damit keine bleibende Regeldifferenz auftritt. Der geforderte Verlauf von FW (z) ist also nicht völlig frei vorgebbar. Man muss das Entwurfsverfahren mehrere Male durchführen, indem man unterschiedliche Polynome BK (z), N (z) und auch Q(z) wählt, bis die geforderte Sprungantwort zufriedenstellend ist. Die Berechnung der Polynome P (z) und Q(z) ist nicht immer so einfach wie bei Gleichung 15.20. Meist ist mithilfe eines Koeffizientenvergleichs zunächst ein lineares Gleichungssystem mit den gesuchte Koeffizienten pi und qi aufzustellen, das dann zu lösen ist. Die Überprüfung der Sprungantwort von FW (z) und des Regelkreises mit dem Regler D(z) und der Strecke H0 G(z) zeigt Abb. 15.7. Die Zeitverläufe liegen exakt übereinander. Zum Zeitpunkt t = 0 ist die Zeitverzögerung von einem Abtastschritt gut erkennbar.
328
15 Entwurf digitaler Kompensationsregler 1.4
x(t)1.2 6
1
0.8 0.6 0.4 0.2 0
0
1
2
3
4
-
5
6
7
8
t/s
Abbildung 15.7: Sprungantworten des Regelkreises: Gefordertes Zeitverhalten aus FW (z) („∗“) und erzieltes Zeitverhalten D(z)H0 G(z)/(1 + D(z)H0 G(z)) („–“)
Der Regelkreis schwingt ca. 15 % über und geht dann gegen den gewünschten Sollwert w " = 1. Die Überprüfung des Stellsignalverlaufs für das erzielte Regelverhalten zeigt Abb. 15.8. Der erste Stellwert ist um einen Abtastschritt verzögert, bevor er auf den Wert 1,5 springt und danach für t → ∞ gegen Null geht. Da eine integrierende Regelstrecke vorliegt, muss im eingeschwungenen Fall der Stellwert Null sein. 1.6
x(t) 6
1.4 1.2 1 0.8 0.6 0.4 0.2 0
−0.2
0
1
2
3
4
-
5
6
7
8
t/s
Abbildung 15.8: Stellsignal für das Regelverhalten von Abb. 15.7 Der Entwurf nach Ragazzini ist im Allgemeinen sehr parameterempfindlich, da die Streckenparameter in den Reglerentwurf direkt eingehen. Daher können bei der Realisierung sehr leicht Probleme auftreten und er führt nur bei sorgfältiger Anwendung zum Erfolg. Die Entwurfsmethodik kann jedoch bei dem im nachfolgenden Abschnitt beschriebenen Verfahren direkt übernommen werden und ist hier deutlich unkritischer.
15.2 Der Entwurf auf endliche Einstellzeit
329
Aufgabe 15.1: Gegeben ist die z-Übertragungsfunktion der Regelstrecke mit vorgeschaltetem Halteglied und nachgeschaltetem Abtaster H0 G(z) =
(z − 0,6) · (z + 0,6) (z − 0,5) · (z − 0,4)
Abtastzeit T = 0,6931 s .
Bestimmen Sie nach der Methode von Ragazzini die Übertragungsfunktion D(z) des Reglers so, dass die Regelgröße mit der Funktion x(t) = 1 − e−t/T1 mit T1 = 1 s gegen den Sollwert w(t) = 1 geht. Lösung: D(z) =
0,5 · (z − 0,5) · (z − 0,4) . (z − 1) · (z − 0,6) · (z + 0,6)
15.2
Der Entwurf auf endliche Einstellzeit
Erläuterung. Während bei einem analogen Regelkreis die Regelgröße x(t) erst für t → ∞ exakt auf ihren Endwert einschwingt, also nach einer unendlichen Einstellzeit, kann bei der digitalen Regelung eine endliche Einstellzeit von z. B. wenigen Abtastschritten erreicht werden. Die Regelgröße verharrt nach wenigen Abtastschritten zu den Abtastzeitpunkten auf dem gewünschten Sollwert. Zwischen den Abtastzeitpunkten sind jedoch eventuell noch Restschwingungen vorhanden. Der Entwurf auf endliche Einstellzeit (im Englischen „dead beat“, manchmal auch als Kalman-Regelalgorithmus bezeichnet) beruht auf dem Reglerentwurf nach Ragazzini. Man schreibt nun jedoch nicht den Einschwingverlauf der Regelgröße x(t) vor, sondern man fordert, dass die Pole der Führungsübertragungsfunktion alle im Ursprung der zEbene liegen. Es gilt also für FW (z) mit einer eventuellen zu beachtenden Totzeit der Strecke von d Abtastschritten: k0 z q + k1 z q−1 + . . . + kq−1 z + kq zq 1 0 −d −1 = z · k0 + k1 z + . . . + kq z −q .
FW (z) = z −d ·
(15.23)
FW (z) weist also einen q-fachen Pol im Ursprung auf. Außerdem ist durch die Berücksichtigung einer eventuellen Totzeit der Strecke durch den Term z −d automatisch die Kausalitätsbedingung erfüllt. Weiterhin ist in dieser Form der Ansatz beschränkt auf stabile Regelstrecken. Die Sprungantwort des Regelkreises (für w " = 1) lautet beispiels-
330
15 Entwurf digitaler Kompensationsregler
weise für d = 0 und q = 3 X(z) =
0
1 k0 + k1 z −1 + k2 z −2 + k3 z −3 ·
z z−1
k0 z + k1 + k2 z −1 + k3 z −2 = (k0 z + k1 + k2 z −1 + k3 z −2 )/(z − 1) z−1 = k0 + (k0 + k1 )z −1 + (k0 + k1 + k2 )z −2 + (k0 + k1 + k2 + k3 )z −3 +(k0 + k1 + k2 + k3 )z −4 + . . . =
Unter Verwendung der Definition der z-Transformation lauten dann die Werte der Regelgröße x(kT ) im Zeitbereich: x(0) x(T ) x(2T ) x(3T ) x(4T ) .. .
= = = = =
k0 k0 + k1 k0 + k1 + k2 k0 + k1 + k2 + k3 k0 + k1 + k2 + k3
= k0 + k1 + k2 + k3 .
Die Regelgröße verharrt nach q = 3 Abtastschritten, d. h. nach einer endlichen Einstellzeit, auf dem Endwert x(∞) = k0 + k1 + k2 + k3 . Hieraus folgt ohne weitere Rechnung die Bedingung dafür, dass keine stationäre Regeldifferenz auftritt. Es muss die Summe der ki des noch zu bestimmenden Zählerpolynoms von FW (z) genau Eins ergeben: q
ki = 1
(Stationaritätsbedingung).
(15.24)
i=0
Berechnung. Für die folgende Regelstrecke mit a0 = 0 H0 G(z) =
b0 + b1 z −1 + . . . + bn z −n B(z) · z −d −d · z = a0 + a1 z −1 + . . . + an z −n A(z)
(15.25)
wird FW (z) nach Gleichung 15.23 in die Bestimmungsgleichung 15.5 eingesetzt und ergibt: D(z) = =
A(z) FW (z) · −d 1 − FW (z) B(z) · z
(15.26)
a0 + a1 z −1 + . . . + an z −n z −d (k0 + k1 z −1 + . . . + kq z −q ) . · (b0 + b1 z −1 + . . . + bn z −n )z −d 1 − z −d (k0 + k1 z −1 + . . . + kq z −q )
15.2 Der Entwurf auf endliche Einstellzeit
331
Eine einfache Lösung für das noch zu bestimmende Zählerpolynom von FW (z) erhält man durch die Wahl von K(z) = k0 + k1 z −1 + . . . + kq z −q =
b0 + b1 z −1 + . . . + bn z −n B(z) . (15.27) = b0 + b1 + . . . + bn B(1)
Man setzt also das gesuchte Polynom K(z) gleich dem Zählerpolynom der Strecke und q=n dividiert durch B(z)|z=1 = B(1) = bi . Aufgrund dieser Division wird dann die i=0
Stationaritätsbedingung x(∞) = 1 erfüllt. Einsetzen von Gleichung 15.27 in die Reglerbestimmungsgleichung ergibt dann die gesuchte z-Übertragungsfunktion des Reglers zu D(z) =
a0 + a1 z −1 + . . . + an z −n A(z) = . −d −1 −n B(1) − z · (b0 + b1 z + . . . + bn z ) B(1) − z −d · B(z)
(15.28)
Mit diesem Regler wird der Endwert x(∞) = w " nach n + d Abtastschritten erreicht. Die Regelgröße für die Regelung einer Strecke mit n = 3 und mit einer zusätzlichen Totzeit von d = 2 Abtastschritten erreicht also nach 5 Abtastschritten den Endwert und verbleibt dort.
Beispiel 15.3: Gegeben sei eine Verzögerungsstrecke 3. Ordnung zu FS (s) =
1 . 1 + s + 5s2 + 2s3
Die Sprungantwort (" xe = 1) dieses schwingungsfähigen Systems zeigt Abb. 15.9. 1.8 1.6 1.4
x(t) 1.2 6 1 0.8 0.6 0.4 0.2 0
0
5
10
15
20
25
-
30
35
40
45
50
t/s
Abbildung 15.9: Sprungantwort (" xe = 1) des schwingungsfähigen analogen Systems 3. Ordnung
332
15 Entwurf digitaler Kompensationsregler
Für die Abtastzeit T = 0,5 s soll ein Regler auf endliche Einstellzeit entworfen werden. Daher ist zunächst die z-Übertragungsfunktion der Strecke mit Halteglied und nachgeschaltetem Abtaster zu berechnen. Sie ergibt sich zu: H0 G(z) =
0,0078z −1 + 0,0233z −2 + 0,0042z −3 . 1 − 2,1946z −1 + 1,5164z −2 − 0,2865z −3
Dann resultiert der Regler auf endliche Einstellzeit nach Gleichung 15.28 zu D(z) =
1 − 2,1946z −1 + 1,5164z −2 − 0,2865z −3 . 0,01 · (3,5310 − 0,7784z −1 − 2,3344z −2 − 0,4182z −3)
Zähler- und Nennerpolynom der diskreten Regelstrecke besitzen die Ordnung n = 3 und es ist d = 0. Damit wird n + d = 3 und es ist zu erwarten, dass die Regelgröße mit dem Dead-Beat-Regler nach 3 Abtastschritten den Endwert erreicht. In Abb. 15.10 wird dies für die Sprungantwort des entworfenen Reglers bestätigt. Obwohl 1.2 1
x(t) 0.8 6 0.6 0.4 0.2 0
0
0.5
1
1.5
2
2.5
-
3
3.5
4
4.5
5
t/s
Abbildung 15.10: Sprungantwort (w " = 1) des geschlossenen Regelkreises (T = 0,5 s) für das System „analoge Strecke mit Dead-Beat-Regler“: Zeitverlauf zu den Abtastzeitpunkten („ • “) und zwischen den Abtastzeitpunkten („ — “) die (analoge) Sprungantwort x(t) sofort reagiert und keine Totzeit aufweist, hat die (diskrete) Sprungantwort x(kT ) erst nach einer Verzögerung von einem Abtastschritt (wegen b0 = 0 in H0 G(z)) einen Wert ungleich Null. Auch zwischen den Abtastzeitpunkten ist ein glatter Kurvenverlauf der Regelgröße zu erkennen. Es ist also keineswegs so, dass zwischen den Abtastzeitpunkten die Regelgröße einen stark schwingenden Verlauf aufweist. Aufgrund der relativ trägen Regelstrecke (siehe Abb. 15.9) muss sehr viel Stellenergie aufgewendet werden, damit die Regelgröße nach 1,5 s den Endwert erreicht (siehe Abb. 15.11).
15.2 Der Entwurf auf endliche Einstellzeit
333
30 20
y(t) 10 6 0 −10 −20 −30 −40
0
0.5
1
1.5
2
3
2.5
-
3.5
4
4.5
5
t/s
Abbildung 15.11: Stellgrößenverlauf für den Dead-Beat-Regler (T = 0,5 s) Um die Stellenergie zu reduzieren, kann versucht werden, die Abtastzeit zu vergrößern. Dann ist zu erwarten, dass das System länger Zeit hat, auf den Endwert einzuschwingen und dazu weniger Stellenergie benötigt. Dies bestätigen die folgenden Abbildungen für eine Abtastzeit des Reglers von T = 1 s. Die Verdopplung der Abtastzeit bringt eine Reduzierung der maximalen Stellamplitude von ca. 34 auf 6 Einheiten (Abb. 15.12). 6 4
y(t) 6
2 0
−2 −4 −6
0
0.5
1
1.5
2
2.5
-
3
3.5
4
4.5
5
t/s
Abbildung 15.12: Stellgrößenverlauf für den Dead-Beat-Regler (T = 1 s) Die Regelgröße schwingt wieder nach 3 Abtastschritten, d. h. in diesem Fall nach 3 s, auf den Endwert ein. Zwischen den Abtastzeitpunkten treten keine Oszillationen auf (siehe Abb. 15.13). Der Entwurf auf endliche Einstellzeit ist nicht beschränkt auf das oben beschriebene Verfahren für stabile Regelstrecken. Der Entwurf kann, wie in [69] angegeben, in modifizierter Form durchgeführt werden und zwar: • für instabile Regelstrecken, oder • mit einer Vorgabe des Anfangswertes y(0) der Stellgröße, oder • für die Auslegung des Störverhaltens.
334
15 Entwurf digitaler Kompensationsregler
1.2 1
x(t) 0.8 6 0.6 0.4 0.2 0
0.5
0
1
1.5
2
3
2.5
-
3.5
4
4.5
5
t/s
Abbildung 15.13: Sprungantwort (w " = 1) des geschlossenen Regelkreises (T = 1 s) für das System „analoge Strecke mit Dead-Beat-Regler“: Zeitverlauf zu den Abtastzeitpunkten („•“) und zwischen den Abtastzeitpunkten („ − “) Aufgabe 15.2: Gegeben ist die folgende z-Übertragungsfunktion der Regelstrecke mit vorgeschaltetem Halteglied und nachgeschaltetem Abtaster H0 G(z) = 0,05 ·
z −1 + z −2 . z 2 − 1,95z + 0,95
1. Berechnen Sie die Reglerübertragungsfunktion D(z) nach der Methode der endlichen Einstellzeit. 2. Wie lautet die Führungsübertragungsfunktion FW (z) des geschlossenen Regelkreises? 3. Berechnen Sie für einen Einheitssprung w(t) = σ(t) der Führungsgröße die ztransformierte Regelgröße X(z). 4. Wie lauten die Zahlenwerte von x(kT )? Lösung: 1. D(z) =
1 − 1,95z −1 + 0,95z −2 0,1 − 0,05(z −3 + z −4 )
2. FW (z) = 0,5 · (z −3 + z −4 ) 3. X(z) =
0,5 · (z −2 + z −3 ) z−1
4. x(0) = x(T ) = x(2T ) = 0; x(3T ) = 0,5; x(4T ) = x(5T ) = . . . = 1.
15.3 Reglerentwurf mittels Polvorgabe
15.3
335
Reglerentwurf mittels Polvorgabe
Reglerstruktur. Von Åstrøm, Wittenmark [5] und Rasmussen [61] wird der Entwurf eines Reglers vorgeschlagen, bei dem die Pollagen der Übertragungsfunktion des geschlossenen Regelkreises vorgegeben werden. Spezifiziert man die Übertragungsfunktion des kontinuierlichen Systems zu FW,Soll (s) =
1 1+
2D ω0 s
+
,
s2 ω02
dann führt die Diskretisierung dieser Übertragungsfunktion zu der z-Übertragungsfunktion FW,Soll (z) =
bm1 z −1 + bm2 z −2 Bm (z = . Am (z) 1 + am1 z −1 + am2 z −2
(15.29)
Liegen die Pole des geschlossenen Regelkreises bei ) s1,2 = −δ ± j ωe = −Dω0 ± j ω0 1 − D2 , dann ergeben sich mit T als Abtastzeit die Parameter am1 und am2 zu: am1 = −2e−Dω0 T cos(ω0 T am2 = e−2Dω0 T .
) 1 − D2 )
und
Åstrøm und Wittenmark schlagen die folgende Struktur des Kompensationsreglers zur Erzielung des gewünschten Führungsverhaltens vor: W (z) -
T (z)
-g 6 −
-
1 R(z)
S(z)
Y (z) -
B(z) A(z)
X(z) -
Abbildung 15.14: Struktur des Regelkreises nach Åstrøm und Wittenmark Die Rekursionsgleichung des digitalen Reglers folgt damit aus der Gleichung: R(z) · Y (z) = T (z) · W (z) − S(z) · X(z) zu y(kT ) = −r1 y((k − 1)T ) − . . . rn y((k − n)T ) + +[t0 w(kT ) + . . . + tn w((k − n)T )] − −[s0 x(kT ) + . . . + sn x((k − n)T )] .
336
15 Entwurf digitaler Kompensationsregler
Reglerberechnung mittels Polvorgabe. Die z-Übertragungsfunktion der Struktur nach Abb. 15.14 lautet FW (z) =
B(z)T (z) A(z)R(z) + B(z)S(z)
(15.30)
und die z-Übertragungsfunktion des (modifizierten) geforderten Führungsverhaltens formuliert man zu: FW,Soll (z) = t0
B(z) Am (z)
mit
t0 = T (z)|z=1 =
n
ti .
(15.31)
i=1
Weisen Regler und Strecke die Ordnung n auf, dann besitzt das Polynom P (z) = A(z)R(z) + B(z)S(z) die Ordnung 2n. Wenn man die 2n Pole des Polynoms P (z) spezifiziert, dann liegt das Problem der Reglerauslegung in der Ermittlung der Koeffizienten ri und si der Polynome R(z) und S(z) derart, dass die Polynomgleichung P (z) = A(z)R(z) + B(z)S(z) erfüllt ist. Es wird von Rasmussen [61] vorgeschlagen das Polynom P (z) wie folgt zu spezifizieren (Polvorgabe) P (z) = Am (z) · A0 (z) , wobei Am (z) das Nennerpolynom von Gleichung 15.29 ist und A0 (z) ein BeobachterPolynom (Tiefpassverhalten) um eventuelles Rauschen zu unterdrücken. Die Forderung P (z) = A(z)R(z) + B(z)S(z) ergibt 2n Gleichungen mit 2n + 1 unbekannten Koeffizienten ri und si der Polynome R(z) und S(z). Dies bedeutet, dass man eine zusätzliche Forderung z. B. R(z)|z=1 = R(1) = 0 (integrierendes Verhalten des Reglers) erfüllen kann. Wenn Zähler- und Nennerpolynome A(z) und B(z) der Strecke keine gemeinsamen Pole aufweisen, dann gibt es eine und nur eine Lösung für die Gleichungen: A(z)R(z) + B(z)S(z) = P (z) R(z)|z=1 = R(1) = 0
und
(15.32) (15.33)
Gleichung 15.32 wird als Diophantine-Gleichung oder Bezout-Identität bezeichnet. Wählt man nun T (z) = t0 A0 (z) dann wird die z-Übertragungsfunktion des geschlossenen Regelkreises wie folgt gefordert: FW (z) =
B(z)T (z) B(z)t0 A0 (z) B(z) = = t0 = FW,Soll (z) . A(z)R(z) + B(z)S(z) Am (z)A0 (z) Am (z)
Die Führungsübertragungsfunktion weist die stationäre Verstärkung 1 auf FW (z)
z=1
= t0
B(z) =1 Am (z) z=1
(15.34)
15.3 Reglerentwurf mittels Polvorgabe
337
wenn für t0 gilt: t0 =
Am (z) . B(z) z=1
(15.35)
Das Verfahren soll auf die Strecke von Beispiel 15.1 angewendet werden. Beispiel 15.4: Gegeben sei die analoge Regelstrecke FS (s) =
2/3 . (1 + 0,5s) · (1 + 2s)
Die z-Übertragungsfunktion der Regelstrecke mit Abtaster und Halteglied lautet für eine Abtastzeit T = 0,1 s H0 G(z) =
0,0031z −1 + 0,0028z −2 B(z) b1 z −1 + b2 z −2 = = . A(z) 1 − 1,7700z −1 + 0,7788z −2 1 + a1 z −1 + a2 z −2
Als Entwurfsgrößen für die Modellübertragungsfunktion werden gewählt √ D = 1/ 2 und a0 = −0,5 . ω0 = 1rad/s Damit gilt dann für das Polynom P (z): P (z) = A0 (z) · Am (z) A0 (z) = (z + a0 )2 = (z − 0,5)2 Am (z) = z 2 + am1 z + am2
mit und
sowie am1 = −2e−Dω0 T cos(ω0 T am2 = e−2Dω0 T .
) 1 − D2 )
und
Zur Ermittlung der Reglerkoeffizienten R(z) = z 2 + r1 z + r2 S(z) = s0 z 2 + s1 z + s2 s0 + s1 + s2 T (z) = t0 A0 (z) = · A0 (z) 1 + 2a0 + a20 für den Regler nach Abb. 15.15 Y (z) =
S(z) T (z) · W (z) − · X(z) R(z) R(z)
(15.36)
338
15 Entwurf digitaler Kompensationsregler
werden die Gleichungen A(z)R(z) + B(z)S(z) = A0 (z)Am (z) = z 4 + p1 z 3 + p2 z 2 + p3 z + p4 R(z)|z=1 = R(1) = 0
und
ausmultipliziert und ein Koeffizientenvergleich durchgeführt. Dies ergibt das lineare Gleichungssystem: ⎡
b1 ⎢ b2 ⎢ ⎢ 0 ⎣ 0 0
0 b1 b2 0 0
0 0 b1 b2 0
1 a1 a2 0 1
⎤ ⎡ ⎤ ⎡ ⎤ p 1 − a1 0 s0 1 ⎥ ⎢ s1 ⎥ ⎢ p 2 − a2 ⎥ ⎥ ⎢ ⎥ ⎢ ⎥ a1 ⎥ · ⎢ s2 ⎥ = ⎢ p 3 ⎥ . ⎦ ⎣ ⎦ ⎣ a2 r1 p4 ⎦ 1 r2 −1
Regler w(z)
-
T (z) R(z)
? f − 6
S(z) R(z)
y(z) -
B(z) A(z)
x(z) -
Abbildung 15.15: Reglerstruktur Die Lösung dieses linearen Gleichungssystems lautet: ⎡
⎤ ⎡ ⎤ s0 31,5240 ⎢ s1 ⎥ ⎢ −56,8853 ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ s2 ⎥ = ⎢ 25,7564 ⎥ ⎣ r ⎦ ⎣ −1,1851 ⎦ 1 r2 0,1851 Für die so ermittelten Reglerkoeffizienten zeigt Abb. 15.16 Stell- und Regelgröße für die Sprungantwort des Regelkreises. Die Regelgröße verläuft nach ca. 3 s (= ˆ 12 · 2π ω0 ) im 5 %-Fehlerband und das prozentuale Überschwingen beträgt ca. 5 %. Sie folgt genau dem geforderten Modellverlauf der Übertragungsfunktion FW,Soll (s) =
1 1+
2D ω0 s
+
s2 ω02
.
15.4 Entwurf von Kompensationsreglern für das Störverhalten
339
2.5 2
x(t), y(t) 6 1.5
y(t)
1
x(t)
0.5 0
0
1
2
3
4
-
5
6
7
8
9
10
t/s
Abbildung 15.16: Sprungantwort des geschlossenen Regelkreises für den Regler nach Åstrøm und Wittenmark, Rasmussen
15.4
Entwurf von Kompensationsreglern für das Störverhalten
Methode. Der Entwurf von Kompensationsreglern ist nicht auf vorgegebenes Führungsverhalten beschränkt. Man kann ebenso Kompensationsregler für vorgegebenes Störverhalten entwerfen. Ist das Störverhalten vorgeschrieben zu FV (z) =
X(z) V (z)
(15.37)
mit V (z) als Störgröße, so wird der zugehörige Kompensationsregler unter Verwendung der Beziehung D(z) =
1 − FV (z) 1 H0 G(z) FV (z)
(15.38)
ermittelt. Verfahren zu Berechnung derartiger Regler findet man bei Ragazzini [60], Lindorff [47] oder Dahlin [14].
16
Adaptive und selbsteinstellende Regler
Motivation. Die in den vorangehenden Kapiteln 13 bis 15 behandelten Verfahren der Auslegung digitaler Regler erfordern für die Berechnung der Reglerparameter Informationen über die Regelstrecke. Entweder müssen z. B. die Streckenparameter bekannt sein um die dynamische Kompensation oder den Entwurf von Kompensationsreglern anwenden zu können. Oder es müssen zumindest Kenngrößen der Regelstrecke wie z. B. die kritische Verstärkung und kritische Periodendauer (KP,Krit , TKrit ) oder Streckenverstärkung und Ersatzzeitkonstanten (KS , Tu , Tg ) bekannt sein, um Auslegungen nach Ziegler/Nichols, Chien/Hrones/Reswick oder Takahashi vornehmen zu können. Die so entworfenen Regler führen im Allgemeinen zu einem zufriedenstellenden Regelverhalten, sofern sich die Streckenparameter nicht ändern. Sobald sich jedoch im Betrieb die Streckenparameter ändern, verschlechtert sich das Regelverhalten des Systems, in manchen Fällen sogar bis hin zur Instabilität des Regelkreises. Als Beipiele für Systeme mit sich ändernden Streckenparametern seien genannt: • Spurhalteregelung von Lastkraftwagen: Die Spurhalteregelung von Lastwagen muss im zulässigen Geschwindigkeitsbereich (vMin ≤ v(t) ≤ vMax ) und für unterschiedliche Beladungen (Masse Mi ) des Lastkraftwagens sicher arbeiten. • Lageregelung eines Flugzeugs: Die Streckenparameter der Flugzeuglängs- und Seitenbewegung hängen von der Flughöhe h(t) und der Geschwindigkeit v(t) ab. Für einen Flug mit Autopilot sind die Regler an den jeweiligen Arbeitspunkt (h(t) und v(t)) anzupassen. • Container-Verladebrücke: Bei der Verladung von Containern (z. B. vom Schiff auf die Bahn) muss der Positions- und Geschwindigkeitsregler des Verladekrans auch bei unterschiedlich schweren Containern (Masse Mi ) zufriedenstellend arbeiten. Während man bei der Spurhalteregelung von Lastkraftwägen versucht mit einem Satz von Reglerparametern auszukommen, so ist man jedoch bei den anderen Anwendungen bestrebt die Reglerparameter im jeweiligen Betriebszustand (Arbeitspunkt) an die sich verändernden Streckenparameter anzupassen. In einer Vielzahl von Artikeln und Büchern werden adaptive und selbsteinstellende Regler behandelt, wie z. B. bei Åstrøm und Wittenmark [5], Rasmussen [61], Isermann [32], Dutton [20] und Yu [71]. Die Bezeichnungsweise der Methoden ist dabei nicht immer einheitlich.
342
16 Adaptive und selbsteinstellende Regler
16.1
Autotuning von Reglern
Vorgehensweise. Zur Ermittlung der Reglerparameter eines Systems müssen im Allgemeinen zunächst die Parameter der Regelstrecke bekannt sein. Diese Streckenparameter werden daher im Zuge einer Parameteridentifizierung oder aus der Analyse der Systemantwort von Testsignalen ermittelt. In vielen Anwendungen liefern diese Testsignale aber nicht den kompletten Parametersatz der Regelstrecke, sondern Ersatzgrößen wie z. B. Streckenverstärkung und Ersatzzeitkonstanten (KS , Tu , Tg ) oder die kritische Verstärkung und kritische Periodendauer (KP,Krit , TKrit ). Auf der Basis dieser Ersatzgrößen kann dann mithilfe der Methoden von Ziegler/Nichols oder Chien/Hrones/Reswick die Auslegung der Reglerparameter vorgenommen werden. Automatisiert man diesen Vorgang der Anregung eines Systems mit Testsignalen, Ermittlung der Ersatzgrößen und Einstellung der Reglerparameter dann bezeichnet man das als Autotuning von Reglern. Der Übergang von der “normalen“ Reglerauslegung zur “adaptiven“ Reglerauslegung ist quasi fließend. Ausführlich behandelt wird dieses Autotuning von PID-Reglern von Yu [71]. Die prinzipielle Vorgehensweise der adaptiven Regelung und auch des Autotuning veranschaulicht Abb. 16.1. Parameter- anpassung
Sollwert
-
Reglerparameter ? Regler
s Stellsignal
- Regelstrecke
s Regelgröße
Abbildung 16.1: Prinzip der adaptiven Regelung / Autotuning von Reglern Das System enthält also eine Rückführschleife der Regelgröße und eine weitere Schleife zur Einstellung der Reglerparameter. In Phase 1 wird der Regelkreis mit dem Testsignal beaufschlagt, dann werden in Phase 2 die Regelparameter berechnet und eingestellt und in Phase 3 wird z. B. der geforderte Sollwert auf den Kreis geschaltet. Für die Phase 1 des Systemtests wird bei Åstrøm und Hägglund [6], und Yu [71] vorgeschlagen, einen Zweipunktregler zu verwenden (Autotuning based on Relay Feedback). Diese Rückführung führt dann bei den in der Verfahrenstechnik üblichen Verzögerungsstrecken zu Dauerschwingungen im Regelkreis (Abb. 16.2). Yu schlägt hierzu die folgende Vorgehensweise vor: 1. Zunächst wird das System in einen stationären Zustand gefahren. 2. Dann wird der Streckeneingang (y) z.B. um 5 % angehoben. Dieser Wert ist prozessabhängig. Typische Änderungen liegen bei 3 bis 10 %.
16.1 Autotuning von Reglern
343
3. Sobald der Ausgang (x) den Sollwert (w) erreicht wird u in die andere Richtung um (z. B. −5 %) verändert. 4. Nun wird Schritt 2 solange wiederholt, bis eine stabile Dauerschwingung auftritt. 5. Abschließend wird die Periodendauer Tu abgelesen. Tu !! a
d w -e − 6
y(t)
- Regelstrecke
u x(t)
Abbildung 16.2: Strecke mit Zweipunktregler Aus der Periodendauer Tu , die näherungsweise gleich der kritischen Periodendauer TKrit ist, folgt die kritische Frequenz zu ωKrit =
2π TKrit
.
Für eine Strecke mit Tiefpasscharakter, bei der die erste Harmonische das Ausgangsverhalten dominiert, kann man dann aus der Amplitude a der Dauerschwingung und der Schaltamplitude des Zweipunktreglers d näherungsweise die kritische Verstärkung berechnen zu KP,Krit =
4d . πa
Mit diesen Werten für KP,Krit und TKrit werden dann nach Tabelle 13.1 auf Seite 293 die Parameter eines P-, PI- oder PID-Reglers eingestellt. Ein Beispiel soll die Vorgehensweise veranschaulichen. Beispiel 16.1 Autotuning einer PT2 Tt -Strecke: Es soll das Autotuning der folgenden PT2 Tt -Verzögerungsstrecke untersucht werden: FS (s) =
20 · e−0,1s . 10 + 8s + s2
Dazu wird der Regelkreis nach Abb. 16.2 mit einem Zweipunktschalter (Schaltlevel ±0,2) aufgebaut. Dieser Regelkreis wird 2 s mit einem Sprungsignal w(t) = 0,2 · σ(t) angeregt. Nach 2 s wird der Sprung auf Null zurückgeschaltet und die sich einstellende Dauerschwingung wird analysiert.
344
16 Adaptive und selbsteinstellende Regler
Aus den sich ergebenden Werten der Dauerschwingung (TKrit = 0,768 s) und der Amplitude der Dauerschwingung von a = 0,06 kann man dann gemäß Tabelle 13.1 die Reglerparameter berechnen zu KP = 0,45 · KP,Krit = 0,45 · TN = 0,83 · TKrit = 0,64 s .
4 · 0,2 = 1,901 π · 0,06
Nach Berechnung der Reglerparameter wird nach ca. 10 s der Sollwert w(t) = 1 aufgeschaltet und die Regelgröße schwingt dann auf den Sollwert ein. Die Abb. 16.3 und 16.4 zeigen den Verlauf der Regel- und Stellgröße für diesen Relay-Autotuning-Prozess. 1.2 1
x(t)
0.8
6 0.6 0.4 0.2 0 −0.2
0
2
4
6
8
10
-
12
14
16
18
20
18
20
t/s
Abbildung 16.3: Verlauf der Regelgröße x(t) beim Relay-Autotuning
2 1.5
y(t) 6
1 0.5 0
−0.5
0
2
4
6
8
10
-
12
14
16
t/s
Abbildung 16.4: Verlauf der Stellgröße y(t) beim Relay-Autotuning Für weitere Methoden des Autotuning wird auf die Literaturstellen [6] und [71] verwiesen.
16.2 Gain-Scheduling
16.2
345
Gain-Scheduling
Methode. Es ist nun jedoch nicht möglich jede Regelstrecke, wenn auch nur kurzzeitig, mit einem Zweipunktregler zu betreiben. In der Luftfahrt wird bei der Regelung der Längs- und Seitenbewegung von Flugzeugen das Verfahren des “Gain-Scheduling“ angewendet. Die Parameter der Bewegungsgleichungen eines Flugzeugs hängen von der Flughöhe und der Fluggeschwindigkeit ab. Diese Messwerte (Höhe h(t) und Geschwindigkeit v(t)) werden benutzt um die Reglerverstärkung (Gain) an den jeweiligen Arbeitspunkt (h(t), v(t)) anzupassen. Beim Verfahren einer Last an einem Containerkran tritt eine ähnliche Problematik auf, abhängig von der zu transportierenden Last (Masse Mi ) ist der Regler bzw. die Reglerverstärkung an die Last anzupassen. Die in Abb. 16.1 gezeigte Struktur der Anpassung gilt auch hier. Dieses Verfahren des Gain-Scheduling soll am Beispiel der Positionsregelung eines Motors, an den elastisch Massen mit unterschiedlichen Trägheitsmomenten Ji angekoppelt sind, betrachtet werden. Beispiel 16.2 Positionsregelung einer Last: Die Übertragungsfunktion der untersuchten Positionsregelung eines Motors, an den elastisch Massen mit unterschiedlichen Trägheitsmomenten angekoppelt werden, lautet: FS (s) =
40 Φ(s) = . M (s) 20 + 5s + Ji · s2
(16.1)
Eingangsgröße der Regelstrecke ist das normierte Stellmoment des Motors, Ausgangsgröße und Regelgröße ist der Drehwinkel ϕ(t) der Last in Grad. Das Trägheitsmoment der Last soll die Werte J1 = 0,5 kg m2
J2 = 2 kg m2
J3 = 5 kg m2
annehmen. Der Nominalwert der Last sei J = J2 . Legt man nun für J = J2 nach dem Verfahren der dynamischen Kompensation einen PID-Regler aus, so resultiert als Reglerübertragungsfunktion mit einer aus Gründen der Realisierbarkeit hinzugefügten Zeitkonstanten von TR = 0,5 s dann FR (s) = KP ·
20 + 5s + 2s2 . s · (0,5s + 1)
Eine Reglerverstärkung von KP 2 = 0,02 führt für diese Konfiguration zu einer minimalen Ausregelzeit für ein 2 %-Fehlerband von ca. 3 s. Wendet man diesen Regler mit KP 2 = 0,02 auf die Regelstrecken mit den Trägheitsmomenten J1 und J3 an, so verschlechtert sich das Regelverhalten (Sollwertsprung 10◦ ) insbesondere für das Trägheitsmoment J = J3 , wie Abb. 16.5 zeigt. Während für J = J1 das Regelverhalten infolge des geänderten Trägheitsmoments nur wenig beeinflusst wird, fängt für J = J3 die Regelgröße nun an zu schwingen. Die Ausregelzeit für das 2 %Fehlerband steigt auf ca. 10 s an, während sie in den anderen beiden Fällen bei ca. 3 s liegt.
346
16 Adaptive und selbsteinstellende Regler
12 10
ϕ(t)/◦
J3
8
6
J1 6 4 2 0
0
2
4
6
8
-
10
12
14
16
t/s
Abbildung 16.5: Verlauf der Regelgröße für die verschiedenen Lastträgheitsmomente (J = J2 gestrichelt) ohne Gain-Scheduling; ϕSoll = 10◦ Nimmt man nun eine Anpassung der Reglerverstärkung (Gain-Scheduling) vor und wählt KP 1 = 0,185 und KP 3 = 0,0145 so verbessert sich das Regelverhalten deutlich (siehe Abb. 16.6). Die Ausregelzeit für den Fall J = J3 kann nun auf ca. 5 s verringert werden. 12 10
ϕ(t)/◦
J3
8
6
6
J1
4 2 0
0
2
4
6
8
-
10
12
14
16
t/s
Abbildung 16.6: Verlauf der Regelgröße für die verschiedenen Lastträgheitsmomente (J = J2 gestrichelt) mit Gain-Scheduling; ϕSoll = 10◦
16.3
Selbsteinstellende Regler
Prinzip. Eine weitere Verbesserung des Regelverhaltens kann erzielt werden, wenn man eine komplette Identifizierung der Streckenparameter durchführt und dann den Regler direkt an die jeweils vorliegende Regelstrecke anpasst. Somit enthält der selbsteinstellende Regler zunächst einen Programmteil, in dem die Identifzierung der Regelstrecke
16.3 Selbsteinstellende Regler
347
erfolgt, im zweiten Programmteil wird dann der Reglerentwurf für die identifizierte Regelstrecke durchgeführt. Abb. 16.7 zeigt die Struktur des selbsteinstellenden Reglers: Streckenparameter Spezifikationen -
Sollwert
-
? Reglerentwurf
- Parameter- schätzung
Reglerparameter ? Regler
s - Regelstrecke Stellsignal
sRegelgröße
Abbildung 16.7: Struktur des selbsteinstellenden Reglers Die einzelnen Schritte des Entwurfsprozesses werden nachfolgend untersucht.
16.3.1
Parameterschätzung
Streckengleichung und Streckenmodell. Für diesen Entwurfsprozess muss zunächst ein Modell der Regelstrecke vorliegen. Die Parameter dieses Modells werden mit einem Verfahren der Parameterschätzung (Parameteridentifizierung) ermittelt. Hierzu wird die Regelstrecke mit einem Eingangssignal xe (kT ) angeregt und das sich ergebende Ausgangssignal xa (kT ) wird aufgezeichnet. Aus diesen gespeicherten Messwerten ermittelt der Schätzalgorithmus dann die Parameter des Streckenmodells. Die zu identifizierende echte Strecke werde beschrieben durch die folgende Übertragungsfunktion: G(z) = H0 G(z) =
b0 + b1 z −1 + . . . + bn z −n Xa (z) = . Xe (z) a0 + a1 z −1 + . . . + an z −n
(16.2)
Die Normierung dieser Übertragungsfunktion mit a0 = 1 führt zu der Differenzengleichung1 xa (kT ) = −a1 xa ((k − 1)T ) − a2 xa ((k − 2)T ) − . . . − an xa ((k − n)T ) + +b1 xe ((k − 1)T ) + b2 xe ((k − 2)T ) + . . . + bn xe ((k − n)T ) n n xa (kT ) = − ai xa ((k − i)T ) + bi xe ((k − i)T ) . (16.3) i=1
i=1
Ein System in der Form von Gleichung 16.3 bezeichnet man auch als ARMA-Modell (arithmetic moving average model). 1
Hierbei gilt streng genommen: ai =a ˆ i /a0 und bi =b ˆ i /a0 .
348
16 Adaptive und selbsteinstellende Regler
Als Modell der Strecke (Prädiktionsmodell, prediction model) für die Parameterschätzung verwendet man die Gleichung xˆa (kT ) = −
n
θˆi xa ((k − i)T ) +
i=1
n
θˆi+n xe ((k − i)T ) .
(16.4)
i=1
mit bzw. θ = [a1 a2 . . . an b1 b2 . . . bn ]T T ˆ = [θˆ1 . . . θˆ2n ] = [ˆ a1 a ˆ2 . . . a ˆn ˆb1 ˆb2 . . . ˆbn ]T θ Die Parameter θˆi des Modells stellen die Schätzwerte a ˆi bzw. ˆbi der Streckenparameter dar. Diese sind mittels der Parameteridentifizierung so zu berechnen, dass der Modellausgang x ˆa (kT ) zum Zeitpunkt kT möglichst gut mit dem Ausgang xa (kT ) der echten Regelstrecke übereinstimmt. “Kleinste Fehlerquadrate“ Schätzalgorithmus. Ordnet man nun die Messwerte xa ((k − i)T ), xe ((k − i)T ) für i = 1, . . . , n wie folgt in vektorieller Form an hTk = [−xa ((k − 1)T ) − xa ((k − 2)T ) . . . − xa ((k − n)T ) .. .. xe ((k − 1)T ) xe ((k − 2)T ) . . . xe ((k − n)T )] , so lautet das Prädiktionsmodell nach Gleichung 16.4 zum Zeitpunkt kT für den Modellausgang x ˆa (kT ) (siehe Gleichungen 16.3 und 16.4) dann ˆ xˆa (kT ) = hTk · θ
wegen xa (kT ) = hTk · θ .
(16.5)
ˆ so berechnen, dass auf der Das Parameterschätzverfahren soll die Modellparameter θ Basis von N Messungen der mittlere quadratische Fehler ˆ = J(θ)
N N 1 2 1 e (k) = [xa (kT ) − x ˆa (kT )]2 N N k=1
(16.6)
k=1
minimal wird. Führt man die folgenden Matrizen und Vektoren ein2 ⎡
HN
hT1 ⎢ hT ⎢ 2 =⎢ . ⎣ .. hTN
2
⎤ ⎥ ⎥ ⎥ , ⎦
⎡ ⎢ ⎢ xa,N = ⎢ ⎣
xa (T ) xa (2T ) .. . xa (N T )
⎤ ⎥ ⎥ ⎥ , ⎦
⎡ ⎢ ⎢ ˆ a,N = ⎢ x ⎣
x ˆa (T ) x ˆa (2T ) .. . x ˆa (N T )
Werte von xa ((j − i)T ), xe ((j − i)T ) in hj für i > j sind dabei gleich Null.
⎤ ⎥ ⎥ ⎥ ⎦
16.3 Selbsteinstellende Regler
349
so geht der mittlere quadratische Fehler über in ˆ = J(θ)
N 1 2 1 ˆ a,N ]T · [xa,N − x ˆ a,N ] . e (k) = [xa,N − x N N
(16.7)
k=1
ˆ ergibt unter Die Minimierung des quadratischen Fehlers nach Gleichung 16.7 über θ ˆ ∂J(θ) Verwendung von = 0 als Lösung ˆ ˆ ˆ ∂θ θ =θN,LS ˆ N,LS = [H T H N ]−1 H T xa,N . θ N N
(16.8)
Diese Lösung3 wird als Schätzwert nach der Methode der kleinsten Fehlerquadrate (Least Squares Estimate) bezeichnet [63]. Die Größe ˆ − θ] ˆ T} P N = [H TN H N ]−1 = E{[θ − θ][θ ist die Kovarianzmatrix des Schätzfehlers. Der zu invertierende Term ist nur dann nichtsingulär, wenn die Eingangssignale xe (kT ) das System geeignet anregen (persistently exciting). “Rekursive Kleinste Fehlerquadrate“ Schätzalgorithmus. Das Verfahren der rekursiven kleinsten Fehlerquadrate vermeidet, dass man die komplette Berechnung des Schätzwertes der Streckenparameter nach Gleichung 16.8 bei Hinzunahme eines(!) neuen Messwertes xa ((N + 1)T ) = hTN +1 · θ ˆ N und die Kovarianzmaerneut durchführen muss. Stattdessen werden der Schätzwert θ trix des Schätzfehlers P N verwendet, und rekursiv werden auf der Basis dieser Größen ˆ N +1 und die neue Kovarianzmatrix des Schätzfehlers P N +1 wie der neue Schätzwert θ folgt ermittelt: T ˆ ˆ N +1 = θ ˆ N − P N hN +1 (hN +1 θN − xa ((N + 1)T )) θ T 1 + hN +1 P N hN +1
P N +1 = P N −
P N hN +1 hTN +1 P TN 1 + hTN +1 P N hN +1
.
(16.9) (16.10)
ˆ 0 und P 0 werden z. B. mit 0 und I vorgegeben. Damit beDie Anfangswerte von θ steht nun die Möglichkeit während des Regelprozesses, also on-line, die Parameter der Regelstrecke zu jedem Abtastschritt neu zu berechnen. Dies soll am Beispiel 16.2 der Positionsregelung einer Last demonstriert werden. 3
Nachfolgend wird der Index LS beim Schätzwert weggelassen.
350
16 Adaptive und selbsteinstellende Regler
Beispiel 16.3 Parameterschätzung der Positionsregelstrecke: Es wird die Regelstrecke nach Gleichung 16.1 mit verschiedenen Eingangssignalen angeregt und mit dem rekursiven Kleinste-Quadrate-Schätzverfahren identifiziert. Als Abtastzeit wird T = 0,1 s verwendet. FS (s) =
40 Φ(s) = . M (s) 20 + 5s + Ji · s2
Diskretisiert lautet die Rekursionsgleichung der Regelstrecke: y(kT ) = a1 y((k − 1)T ) + a2 y((k − 2)T ) + b1 xe ((k − 1)T ) + b2 ((k − 2)T ) . Die wahren Parameter a1 , a2 , b1 , b2 für die drei Trägheitsmomente Ji = 0,5; 2 und 5 kg m2 werden bei Diskretisierung nach der Methode von Kapitel 11.2.1 berechnet zu: a1 −1,1232 −1,6911 −1,8669
J = 0,5 kg m2 J = 2 kg m2 J = 5 kg m2
a2 0,3679 0,7788 0,9048
b1 0,2853 0,0914 0,0386
b2 0,2040 0,0841 0,0373
Tabelle 16.1: Tabelle der wahren Streckenkoeffizienten für T = 0,1 s Diese Streckenparameter sollen nun von dem Algorithmus geschätzt werden. Zunächst wird die Regelstrecke mit einem Sprungsignal angeregt, und die Trägheitsmomente werden nach 20 bzw. 40 s von 0,5 auf 2 und dann auf 5 kg m2 umgeschaltet. Die Schätzung der Streckenkoeffizienten zeigt Abb. 16.8. 1
ˆ2 0.5 a ˆ1 , a ˆb1 , ˆb2 6
ˆb1 , ˆb2 a ˆ2
0
−0.5
a ˆ1 −1
0
10
20
-
30
40
50
60
t/s
Abbildung 16.8: Schätzwerte der Streckenparameter a ˆ1 , a ˆ2 , ˆb1 , ˆb2 für J = 0,5 kg m2 (0 ≤ t ≤ 20 s); J = 2 kg m2 (20 < t ≤ 40 s); J = 5 kg m2 (40 < t ≤ 60 s) [20] Der Schätzalgorithmus berechnet zu keinem Zeitpunkt auch nur näherungsweise die korrekten Streckenparameter. Das liegt daran, dass der Sprungeingang die Regelstrecke nicht genügend anregt, er ist nicht “persistently exciting“. Regt man nun jedoch die Regelstrecke mit einer Rechteckschwingung (mit der Periodendauer TP = 5 s; Amplitude ±1) an, so werden die Schätzungen der Streckenparameter
16.3 Selbsteinstellende Regler
351
deutlich verbessert, wie Abb. 16.9 zeigt. Nun reagiert der Schätzalgorithmus auf die immer wieder erneute Anregung mit der Rechteckschwingung und die zweimalige Änderung des Trägheitsmoments.
1
ˆ2 a ˆ1 , a ˆb1 , ˆb2 6
a ˆ2
0.5
ˆb1
0
ˆb2
−0.5 −1 −1.5
a ˆ1 −2
0
10
20
-
30
40
50
60
t/s
Abbildung 16.9: Schätzwerte der Streckenparameter a ˆ1 , a ˆ2 , ˆb1 , ˆb2 für J = 0,5 kg m2 2 2 (0 ≤ t ≤ 20 s); J = 2 kg m (20 < t ≤ 40 s); J = 5 kg m (40 < t ≤ 60 s) Die Koeffizienten der Regelstrecke werden nun relativ gut berechnet, wie die Tabelle 16.2 zeigt, wenn man die Zahlenwerte mit denen von Tabelle 16.1 vergleicht.
2
J = 0,5 kg m J = 2 kg m2 J = 5 kg m2
a ˆ1 −1,1115 −1,6119 −1,8095
a ˆ2 0,3594 0,7158 0,8581
ˆb1 0,2867 0,1628 0,1111
ˆb2 0,2095 0,0422 −0,0189
Tabelle 16.2: Tabelle der geschätzen Streckenkoeffizienten für T = 0,1 s
Gewichtete Rekursive Kleinste Fehlerquadrate-Schätzverfahren. Bei der Schätzung der Streckenparameter θi gehen trotz des rekursiven Updates alle Messwerte des Ein- und Ausgangssignals von k = 1 bis k = N in die Schätzung mit ein. Obwohl also in dem betrachteten Beispiel nach 20 bzw. 40 s ein anderes Trägheitsmoment der Last vorliegt, gehen die vorherigen Messungen für die anderen Trägheitsmomente mit gleichem Gewicht in die aktuelle Schätzung ein. Dadurch werden die Schätzungen der Streckenparameter verschlechtert. Zur Verbesserung der Schätzung der Streckenparameter wird vor der Berechnung der ˆ N +1 nach Gleichung 16.9 nun der alte Wert von P N durch Parameterschätzwertes θ den Gewichtsfaktor α (forgetting factor) dividiert, wobei dieser Faktor im Wertebereich
352
16 Adaptive und selbsteinstellende Regler
0,9 ≤ α ≤ 1,0 vorzugeben ist. Die Rekursionsgleichungen ändern sich damit wie folgt: P N := P N /α T ˆ ˆ N − P N hN +1 (hN +1 θN − xa ((N + 1)T )) ˆ N +1 = θ θ T 1 + hN +1 P N hN +1
P N +1 = P N −
P N hN +1 hTN +1 P TN 1 + hTN +1 P N hN +1
Durch diese sich immer wiederholende Vergrößerung der aktuellen Schätzfehlervarianz (wegen α < 1) verlieren die alten Messwerte von xe (kT ) und xa (kT ) an Gewicht, und die aktuellen Messungen werden stärker gewichtet. Dies hat eine enorme Verbesserung der Genauigkeit der Schätzung der Streckenparameter zur Folge. Setzt man in dem vorangehenden Beispiel 16.3 den Wert α = 0,95 so werden die Parameter ai und bi bis auf vier Stellen nach dem Komma exakt ermittelt wie Tabelle 16.3 zeigt.
J = 0,5 kg m2 J = 2 kg m2 J = 5 kg m2
a1 −1,1232 −1,6911 −1,8669
a2 0,3679 0,7788 0,9048
b1 0,2853 0,0914 0,0386
b2 0,2040 0,0841 0,0373
Tabelle 16.3: Tabelle der geschätzten Streckenkoeffizienten für T = 0,1 s Der zeitliche Schätzverlauf der Streckenparameter ist nach jeweils ca. 5 s praktisch abgeschlossen, wie die Abb. 16.10 zeigt. Danach hat der Algorithmus den Endwert des geschätzten Parameters erreicht und bleibt ab da konstant. 1
ˆ2 0.5 a ˆ1 , a ˆb1 , ˆb2 0 6
ˆb1
a ˆ2
ˆb2
−0.5 −1
a ˆ1
−1.5 −2
0
10
20
-
30
40
50
60
t/s
Abbildung 16.10: Schätzwerte der Streckenparameter a ˆ1 , a ˆ2 , ˆb1 , ˆb2 für J = 0,5 kg m2 2 2 (0 ≤ t ≤ 20 s); J = 2 kg m (20 < t ≤ 40 s); J = 5 kg m (40 < t ≤ 60 s) Alternativ zu diesem Gewichtsfaktor könnte man auch z. B. nur die jeweils letzten 20 oder 30 Messwerte für die Schätzung verwenden. Dadurch würde man praktisch ein Zeitfenster für die zu verwendenden Messwerte vorgeben. Beide Verfahren werden angewendet.
16.3 Selbsteinstellende Regler
16.3.2
353
Reglerentwurf
Methoden. Nachdem infolge der Parameterschätzung die Streckenkoeffizienten mehr oder weniger exakt vorliegen, kann man auf der Basis dieser Kenntnis die Reglerkoeffizienten berechnen. Hierzu bietet sich letztlich der Einsatz aller automatisierbaren Entwurfsverfahren an. Man kann z. B. einen der in Kapitel 15 behandelten, oder andere Entwurfsverfahren einsetzen. Hier soll der Entwurf mittels Polvorgabe (siehe Kapitel 15.3, Seite 335) angewendet werden. Reglerentwurf mittels Polvorgabe. Die Vorgehensweise soll beispielhaft an der identifizierten Regelstrecke von Beispiel 16.3 demonstriert werden. Aus den geschätzten Zahlenwerten der Regelstrecke werden zunächst die Kreisfrequenzen ω0 und die Dämpfungsbeiwerte D der drei identifizierten Strecken berechnet zu: J1 = 0,5 kg m2 6,32 0,79
ω0,Ji /(Rad/s) DS
J2 = 2 kg m2 3,16 0,395
J3 = 5 kg m2 2,0 0,25
Tabelle 16.4: Kreisfrequenz und Dämpfung der geschätzten Streckenkoeffizienten Um die Stellsignale nicht unnötig groß werden zu lassen, soll die Kreisfrequenz des Modellverhaltens des geregelten Systems für die verschiedenen Trägheitsmomente möglichst genau den in Tabelle 16.4 ermittelten Kreisfrequenzen entsprechen. Der geforderte Dämpfungsbeiwert wird auf D = 0,71 gesetzt. Somit lauten die jeweiligen gewünschten Modellübertragungsfunktionen: FW (s) =
1+
2D ω0,Ji
1 . s · s + ( ω0,J )2 i
Mit dem in Kapitel 15.3 entwickelten Entwurfsverfahren werden dann die jeweiligen Polynome R(z), S(z) und T (z) berechnet. Tabelle 16.5 zeigt die ermittelten Zahlenwerte der Polynome:
J1 :
J2 :
J3 :
R(z) S(z) T (z) R(z) S(z) T (z) R(z) S(z) T (z)
1,0000 − 0,6862z −1 − 0,3138z −2 1,6016 − 1,7651z −1 + 0,5857z −2 0,5213 − 0,1043z −1 + 0,0052z −2 1,0000 − 0,5773z −1 − 0,4227z −2 5,5756 − 9,1988z −1 + 3,9916z −2 0,4547 − 0,0909z −1 + 0,0045z −2 1,0000 − 0,5648z −1 − 0,4352z −2 13,3153 − 23,7035z −1 + 10,7587z −2 0,4574 − 0,0915z −1 + 0,0046z −2
Tabelle 16.5: Tabelle der verschiedenen Polynome R(z), S(z) und T (z)
354
16 Adaptive und selbsteinstellende Regler
Mit diesen Polynomen wird das Regelverhalten simuliert und in den Abbildungen 16.11 und 16.12 werden drei Verläufe von Regel- und Stellgröße dargestellt. Die Regelgröße folgt dem gewünschten Verlauf für die verschiedenen identifzierten Trägheitsmomente. Die Stellsignale zeigen die erwünschten kleinen Signalamplituden.
1.2 1
x(t) 6
J1
0.8
J2
J3
0.6 0.4 0.2 0
0
1
2
-
3
4
5
6
t/s
Abbildung 16.11: Verläufe der Regelgrößen für die verschiedenen Trägheitsmomente
0.6
J1
0.55
y(t)
0.5
6
0.45
J2
0.4
J3
0.35 0.3 0.25
0
1
2
-
3
4
5
6
t/s
Abbildung 16.12: Verläufe der Stellgrößen für die verschiedenen Trägheitsmomente Lässt man größere Stellsignale zu, dann ist speziell bei den Verläufen für die Trägheitsmomente J2 und J3 ein schnelleres Einschwingverhalten erzielbar. Man muss in der praktischen Anwendung den Ablauf des gesamten Vorgangs sich wie folgt vorstellen: Während der Identifizierungsphase (Anregung z. B. mit einer Rechteckschwingung) werden aus den Ein-/Ausgangssignalen die Streckenparameter und die verschiedenen Kreisfrequenzen ω0,Ji berechnet. Daran schließt sich die Berechnung der Reglerpolynome R(z), S(z) und T (z) an, die dann an die beiden Anteile des Reglers gemäß Abb. 15.15 übergeben werden. Mit diesen Reglern erfolgt dann die Regelung des Prozesses.
16.4 Modell-Referenz-Adaptive Systeme (MRAS)
355
16.4
Modell-Referenz-Adaptive Systeme (MRAS)
16.4.1
Die MIT-Regel
MRAS-Struktur. Modell-Referenz-Adaptive Systeme sind eine wichtige adaptive Reglerstruktur. Bei der MRAS-Struktur wird das gewünschte Systemverhalten des geschlossenen Kreises durch ein Modell spezifiziert. Die Reglerparameter werden abhängig vom Fehler zwischen Modell und geschlossenem Regelkreis angepasst. Abb. 16.13 zeigt das Blockdiagramm der MRAS-Struktur. -
xm (t)
Modell
Reglerparameter Sollwert w(t) s -
? Adaptions- schema
? Regler
s - Regelstrecke Stellsignal y(t)
x(t) s Regelgröße -
Abbildung 16.13: Blockdiagramm des Modell-Referenz-Adaptiven Systems (MRAS) Herleitung der MIT-Regel. Der Name der MIT-Regel ist abgeleitet vom Draper Laboratorium am Massachusetts Institute of Technology, in dem die Regel entwickelt wurde. Nachfolgend soll eine kurze Ableitung der Regel erfolgen. Es wird ein Regelkreis betrachtet, in dem der Regler einen anzupassenden Parameter θ enthält. Das gewünschte Verhalten des geschlossenen Regelkreises wird beschrieben durch den Modellverlauf der Regelgröße xm (t). Man führt nun als Fehler e(t) die Abweichung zwischen der Regelgröße x(t) und der Modellgröße xm (t) wie folgt ein: e(t) = x(t) − xm (t) . Die Anpassung des Parameters θ kann man dergestalt realisieren, dass man das Gütekriterium des Fehlers 1 J(θ) = e(t)2 (16.11) 2 minimiert. Man erzielt eine Verringerung des Gütekritierums, wenn man den Parameter θ in Richtung des negativen Gradienten von J verändert, d. h. es wird gewählt: dθ ∂J ∂e = −γ = −γe . (16.12) dt ∂θ ∂θ Liegen mehrere Parameter θi des Reglers vor, so ist in den obigen Ableitungen die Größe θ als Vektor anzusehen. In der Literatur [5], [61] werden andere Gütekriterien und Anpassungsstrategien behandelt.
356
16.4.2
16 Adaptive und selbsteinstellende Regler
Anwendung der MIT-Regel
Systemgleichungen. Die Anwendung des adaptiven Reglers soll wieder am Beispiel der Positionsregelung einer Last (siehe Beispiel 16.2) erfolgen. Die Übertragungsfunktion der Regelstrecke ist FS (s) =
X(s) 40 Φ(s) b = = = . 2 M (s) Y (s) 20 + 5s + Ji · s a0 + a1 s + a2 s2
(16.13)
Das veränderliche Trägheitsmoment der Last soll die Werte J1 = 0,5 kg m2
J2 = 2 kg m2
J3 = 5 kg m2
annehmen. Der geschlossene Regelkreis soll die folgende Modellübertragungsfunktion aufweisen: FM (s) =
1 bm = , am0 + am1 s + am2 s2 + ( ωs0 )2
Xm (s) = W (s) 1+
2D ω0 s
(16.14)
mit D = 0,71 und ω0 = 0,5 · 3,12s−1. Die Reglergleichung mit den anzupassenden Parametern θi lautet: y(t) = θ1 · w(t) − θ2 · x(t) − θ3 · x(t) ˙ .
(16.15)
Entwicklung des adaptiven Reglers. Ausgehend von den Differentialgleichungen der Strecke und des Modells a2 x¨ = −a0 x − a1 x˙ + by a2m x¨m = −a0m xm − a1m x˙ m + bm w ,
(16.16) (16.17)
wird die Reglergleichung 16.15 in die Streckengleichung 16.16 wie folgt eingearbeitet: ˙ a2 x¨ = −a0 x − a1 x˙ + b · (θ1 · w(t) − θ2 · x(t) − θ3 · x(t)) = −(a0 + bθ2 )x − (a1 + bθ3 )x˙ + bθ1 w .
(16.18) (16.19)
Die Ausgänge von Gleichung 16.17 und 16.19 stimmen dann überein, wenn gilt: bm bθ1 = , a2 a2m
a0 + bθ2 a0m = , a2 a2m
a1 + bθ3 a1m = . a2 a2m
(16.20)
Daraus folgt dann für den Vektor θ: b m a2 θ1 = , θ2 = b a2m
a0m a2 − a0 /b , θ3 = a2m
a1m a2 − a1 /b . a2m (16.21)
16.4 Modell-Referenz-Adaptive Systeme (MRAS)
357
Aus Gleichung 16.19 folgt nach der Laplace-Transformation X(s) =
bθ1 · W (s) . (a0 + bθ2 ) + (a1 + bθ3 )s + a2 s2
(16.22)
Der Fehler E(s) = L{e(t)} resultiert dann zu: E(s) =
bm bθ1 ·W (s)− ·W (s) . (16.23) (a0 + bθ2 ) + (a1 + bθ3 )s + a2 s2 a0m + a1m s + a2m s2
Anhand der Fehlergleichung 16.23 werden die partiellen Ableitungen der Parameter θi entwickelt zu: b ∂E(s) = · W (s) ∂θ1 (a0 + bθ2 ) + (a1 + bθ3 )s + a2 s2 −b2 θ1 ∂E(s) = 2 · W (s) ∂θ2 [(a0 + bθ2 ) + (a1 + bθ3 )s + a2 s2 ] −b = · X(s) (a0 + bθ2 ) + (a1 + bθ3 )s + a2 s2 ∂E(s) −b2 θ1 s = 2 · W (s) ∂θ3 [(a0 + bθ2 ) + (a1 + bθ3 )s + a2 s2 ] =
−bs · X(s) . (a0 + bθ2 ) + (a1 + bθ3 )s + a2 s2
(16.24)
(16.25)
(16.26)
Da die Streckenparameter a0 , a1 , . . . unbekannt sind, müssen Approximationen in den Gleichungen 16.24 bis 16.26 gemacht werden. Das Einsetzen von Termen der Gleichung 16.20 führt zu den approximierten und auf die Verstärkung Eins normierten Ableitungen der Fehler wie folgt: a0m ∂E(s) ≈ · W (s) = FM (s) · W (s) ∂θ1 a0m + a1m s + a2m s2 ∂E(s) −a0m ≈ · X(s) = −FM (s) · X(s) ∂θ2 a0m + a1m s + a2m s2 ∂E(s) −a0m s ≈ · X(s) = −FM (s) · sX(s) ∂θ3 a0m + a1m s + a2m s2
(16.27) (16.28) (16.29)
Mit diesen Approximationen lautet die MIT-Regel für die einzelnen zeitlichen Ableitungen der Werte θi : dθ1 = −γ · e(t) · dt dθ2 = −γ · e(t) · dt dθ3 = −γ · e(t) · dt
∂e ∂θ1 ∂e ∂θ2 ∂e . ∂θ3
(16.30) (16.31) (16.32)
358
16 Adaptive und selbsteinstellende Regler
Die Laplace-Transformierten dieser Gleichungen lauten dann: ∂E(s) = −γ · E(s) · FM (s) · W (s) ∂θ1 ∂E(s) sΘ2 (s) = −γ · E(s) · = γ · E(s) · FM (s) · X(s) ∂θ2 ∂E(s) sΘ3 (s) = −γ · E(s) · = γ · E(s) · FM (s) · sX(s) bzw. ∂θ3 Θ3 (s) = γ · E(s) · FM (s) · X(s) . sΘ1 (s) = −γ · E(s) ·
(16.33) (16.34)
(16.35)
Die Gleichungen 16.33 bis 16.35 stellen die zu realisierenden Adaptionsgleichungen des Reglers der MRAC-Struktur dar. MRAC-Struktur. Abb. 16.14 zeigt das Blockdiagramm der MRAC-Struktur der Gleichungen 16.33 bis 16.35. Im oberen Teil der Abbildung liegt die Modellübertragungsfunktion, und im unteren Teil ist die MRAC-Struktur aufgebaut. -
w
-X
r
6 −θ1 γ s
6 -
FM (s)
-X
xm
FM (s)
− g − 6 X θ3 6 γ
- g y− s 6 X r θ2 6
6
6
− ? g e 6 xr
FS (s)
r x
γ s
r6 X 6
FM (s)
Abbildung 16.14: MRAC-Struktur der Anwendung Mit dieser MRAC-Struktur wird die Positionsregelung der Last mit den unterschiedlichen Trägheitsmomenten Ji durchgeführt. Für alle Adaptionen wird der Wert γ = 0,05 und ω0 = 0,5 · 3,12 s−1 gewählt. Simulationen. Abb. 16.15 zeigt die Simulation der Regelung für J = J1 = 0,5 kg m2 bei Anregung des Systems mit einer Rechteckfunktion. Im Verlauf der Adaption des Reglers nähert sich die Regelgröße x(t) wie gewünscht immer mehr dem Modellverlauf xm (t) an.
16.4 Modell-Referenz-Adaptive Systeme (MRAS)
359
1.5
x(t), xm (t) 6
1
0.5 0 −0.5 −1 −1.5
0
50
100
150
-
200
250
300
t/s
Abbildung 16.15: Verlauf des Modellausgangs xm (t) (fett gezeichnet) und der Regelgröße x(t) für das Trägheitsmoment J = J1 = 0,5 kg m2
Abb. 16.16 zeigt die Simulation der Regelung für J = J2 = 2 kg m2 bei Anregung des Systems mit einer Rechteckfunktion. Der Verlauf der Adaption des Reglers erfolgt hier noch deutlicher als in Abb. 16.15.
2 1.5
x(t), xm (t) 1 6
0.5 0 −0.5 −1 −1.5 −2
0
50
100
150
-
200
250
300
t/s
Abbildung 16.16: Verlauf des Modellausgangs xm (t) (fett gezeichnet) und der Regelgröße x(t) für das Trägheitsmoment J = J2 = 2 kg m2
Setzt man nun jedoch das große Trägheitsmoment J = J3 = 5 kg m2 ein, so konvergiert der Regelvorgang nicht so gut, wie bei den anderen Trägheitsmomenten. Dies zeigt Abb. 16.17. Die Regelgröße schwingt relativ lange um den gewünschten Endwert. Das geforderte Einschwingverhalten ist für das große Trägheitsmoment zu schnell. Hier ist eine weitere Parameteroptimierung mit anderen Werten für γ und ω0 vorzunehmen.
360
16 Adaptive und selbsteinstellende Regler
2 1.5
x(t), xm (t) 1 6
0.5 0 −0.5 −1 −1.5 −2
0
50
100
150
-
200
250
300
t/s
Abbildung 16.17: Verlauf des Modellausgangs xm (t) (fett gezeichnet) und der Regelgröße x(t) für das Trägheitsmoment J = J3 = 5 kg m2
Teil III
Fuzzy-Regelung
17
Grundlagen „unscharfer“ Mengen (Fuzzy-Mengen)
17.1
Unscharfe Informationen und Fuzzy-Mengen
Einführung. In der klassischen Mengenlehre gehört ein Element zu einer Menge oder es gehört nicht zu einer Menge. Die Zahl 2 gehört z. B. zur Menge der geraden Zahlen, die Zahl 2,0001 dagegen nicht mehr. Es findet eine scharfe Trennung der Zugehörigkeit zu einer Menge statt. Diese Zugehörigkeit drückt man durch eine klassische Zweiwertigkeit der Information aus Nein ↔ Ja Falsch ↔ Wahr 0 ↔ 1. Die Zugehörigkeit zu einer Menge kann jedoch ebenso durch eine Zugehörigkeitsfunktion μ ausgedrückt werden, die in der klassischen Mengenlehre nur die Werte 0 und 1 annimmt. Gehört ein Element x zur Menge, so ist μ(x) = 1, gehört es nicht zur Menge, so ist μ(x) = 0. Als Beispiel werde die Menge A der reellen Zahlen zwischen 2 und 3 betrachtet, A := {x|x ∈ R, 2 ≤ x ≤ 3}
(17.1)
mit R als Menge der reellen Zahlen (Grundmenge) und in Abb. 17.1 grafisch dargestellt. μ(x) 6 1
1
2
3
4
x
Abbildung 17.1: Grafische Darstellung der Menge der reellen Zahlen von 2 bis 3 durch ihre Zugehörigkeitsfunktion μ(x)
364
17 Grundlagen „unscharfer“ Mengen (Fuzzy-Mengen)
Diese scharfe Trennung wird in der Theorie der unscharfen Mengen aufgehoben [76], [77], [78]. In Anlehnung an die aus dem Englischen kommende Bezeichnung fuzzy = unscharf, fusselig sollen diese Mengen im Folgenden mit Fuzzy-Mengen (Fuzzy-Sets) bezeichnet werden. Diese sogenannte Unschärfe wird im alltäglichen Sprachgebrauch wie selbstverständlich akzeptiert. Man unterscheidet z. B. 1. Stochastische Unschärfe: Hiermit wird die Wahrscheinlichkeit des Eintretens eines Ereignisses gemeint, wie z. B. das Auftreten der Zahl 17 beim Roulettespiel, oder das Ziehen des Herz-Ass beim Pokern. 2. Lexikalische oder sprachliche Unschärfe: Hiermit bescheibt man Sachverhalte, die sich an einer gewissen Norm orientieren, wie z. B. die Begriffe ein reiches Land, ein hübsches Mädchen oder ein guter Vertrag. 3. Informale Unschärfe: Hiermit bezeichnet man Tatbestände, zu deren genauer Beschreibung oft weitere Informationen fehlen. Beispiele hierfür sind Glaubwürdigkeit, Vertrauenswürdigkeit. In der Theorie der Fuzzy-Mengen wird diese Unschärfe rechenbar gemacht durch eine Aufweichung der Zugehörigkeitsfunktion μ. Dies soll an der Menge der Zahlen die „viel größer als 10“ sind erläutert werden. In der Mathematik verbindet man mit dem Ausdruck „viel größer“ in der Regel die Tatsache, dass eine derartige Zahl mindestens um eine Zehnerpotenz größer als die betrachtete Zahl sein muss. Damit kann man diesen Sachverhalt durch die Zugehörigkeitsfunktion nach Abb. 17.2 darstellen. Die Akzeptanz μ(x) 6 1
50
100
150
200
x
Abbildung 17.2: Modellierung der Menge der Zahlen „viel größer als 10“ einer derartigen Modellierung ist jedoch fragwürdig. Sie entspricht im Allgemeinen nicht dem gesunden Menschenverstand. So gehört nach dieser Definition z. B. die Zahl 99,9 nicht zu der Menge der Zahlen, die viel größer als 10 sind. Durch die oben angesprochene Aufweichung der Zugehörigkeitsfunktion kann man diesen Sachverhalt viel besser ausdrücken. Lässt man z. B. Werte der Zugehörigkeitsfunktion zwischen 0 und 1 zu, so entspricht die nachfolgende Modellierung der Menge der Zahlen viel größer als 10 wesentlich mehr unserem Empfinden.
17.1 Unscharfe Informationen und Fuzzy-Mengen μ(x) 6 1 0,86
0,18
6
6
6 50 100
365
150
200
x
Abbildung 17.3: Modellierung der Menge der Zahlen viel größer als 10 durch eine unscharfe Menge (Fuzzy-Menge) Aufgrund dieser Modellierung gemäß Abb. 17.3 gilt z. B.: Der Zugehörigkeitsgrad der Zahl x = 50 zur Menge ist 0,18 Der Zugehörigkeitsgrad der Zahl x = 100 zur Menge ist 0,86 Der Zugehörigkeitsgrad der Zahl x = 200 zur Menge ist 1,0 Definitionen von Fuzzy-Mengen. Diese Art der Modellierung durch unscharfe Mengen wurde von Zadeh im Jahre 1965 [76] eingeführt. Die formale Definition einer FuzzyMenge lautet: Es sei G eine Grundmenge mit den Elementen x. Die Fuzzy-Menge (unscharfe Menge) A in G ist dann definiert als die Menge geordneter Paare A = {x, μA (x)|x ∈ G}.
(17.2)
μA (x) heißt Zugehörigkeitsfunktion von x in G. Die Zugehörigkeitsfunktion bildet jedes Element der Grundmenge G auf Werte zwischen 0 und 1 ab: μA (x) : G → [0, 1].
(17.3)
Eine Fuzzy-Menge wird vollständig durch ihre Zugehörigkeitsfunktion beschrieben. Bei den klassischen Mengen ergab eine Darstellung als Kennlinie aufgrund der Zweiwertigkeit keinen besonderen Vorteil. Bei den Fuzzy-Mengen veranschaulicht eine Darstellung als Kennlinie jedoch den beschriebenen Sachverhalt, wie das nachfolgende Beispiel der Fuzzy-Menge „Junger Mann“ (Abb. 17.4) zeigt. Hierbei ist zu beachten, dass der Zugehörigkeitsgrad nichts mit dem Begriff der Wahrscheinlichkeit aus der Statistik zu tun hat. Da die Form der Zugehörigkeitsfunktion nicht beschränkt ist, sind die klassischen Mengen als Spezialfälle in den Fuzzy-Mengen enthalten. Eine alternative Beschreibung der Fuzzy-Mengen in Form analytischer Funktionen ist ebenso möglich. Aufgrund der Anschaulichkeit grafischer Darstellungen werden sie hier vorwiegend verwendet.
366
17 Grundlagen „unscharfer“ Mengen (Fuzzy-Mengen)
1
μ 6
5
10
15
20
25
30 Alter
Abbildung 17.4: Darstellung des Begriffs „Junger Mann“ als Zugehörigkeitsfunktion einer Fuzzy-Menge Die in Theorie und Anwendung am häufigsten verwendeten Fuzzy-Mengen zeigen die Abbildungen 17.5 bis 17.7. μ 1 6
μ 1 6
x
x
Abbildung 17.5: Trapezförmige Fuzzy-Menge (links) und dreiecksförmige Fuzzy-Menge (rechts)
μ 1 6
μ 1 6
x
x
Abbildung 17.6: Kosinusförmige Fuzzy-Menge (links) und Gauß-förmige Fuzzy-Menge (rechts)
17.2 Operatoren für Fuzzy-Mengen μ 1 6
367 μ 1 6
x
t
x0
x
Abbildung 17.7: LR-Fuzzy-Menge (Links-Rechts) (links) und Singleton (rechts)
Meistens werden bei der Fuzzy-Regelung die dreiecks- und trapezförmigen Fuzzy-Mengen eingesetzt. Die Fuzzy-Mengen mit krummlinigen Flankenverläufen sind dagegen seltener anzutreffen. Die mit Singleton bezeichnete Fuzzy-Menge stellt eine Sonderform dar, die jedoch in der Fuzzy-Regelung sehr häufig zu finden ist. Das in Abb. 17.7 eingeführte Singleton stellt eine diskrete Fuzzy-Menge dar, die nur an der Stelle x = x0 von Null verschieden ist. Eine häufig hierfür verwendete Schreibweise derartiger endlicher Mengen ist: A := {μA (x)/x|x ∈ G}
(17.4)
mit μA (x)/x als Singleton. Daher kann das Singleton von Abb. 17.7 geschrieben werden als A = {1/x0 }
oder auch als
A = {(x0 ,1)} .
Es fällt auf, dass der Zugehörigkeitsgrad μ(x) der dargestellten Fuzzy-Mengen immer den maximalen Wert 1 aufweist. Derartige Fuzzy-Mengen heißen normale Fuzzy-Mengen im Unterschied zu den subnormalen Fuzzy-Mengen. In der Fuzzy-Regelung wird meistens mit normalen Fuzzy-Mengen gearbeitet.
17.2
Operatoren für Fuzzy-Mengen
Operatoren der klassischen Mengenlehre. In der klassischen Mengenlehre werden Operationen auf Teilmengen derselben Grundmenge durch Operatoren wie z. B. den UND-, ODER- oder NICHT-Operator beschrieben. Dabei bezeichnet man z. B. die Menge der Elemente, die zu den Teilmengen 1 UND 2 gehört, als Schnittmenge, die Menge der Elemente, die zu den Teilmengen 1 ODER 2 gehört, als Vereinigungsmenge, und die Menge der Elemente, die NICHT zu einer Menge gehört, als Komplementärmenge. Es sei die Teilmenge A1 die Menge der reellen Zahlen zwischen 5 und 20 und die Teilmenge A2 die Menge der Zahlen zwischen 15 und 30. Als Schnittmenge A1∩2 = A1 ∩ A2
368
17 Grundlagen „unscharfer“ Mengen (Fuzzy-Mengen)
resultiert dann die Menge der Zahlen zwischen 15 und 20
A1∩2
A1 = {x|x ∈ R, 5 ≤ x ≤ 20} A2 = {x|x ∈ R, 15 ≤ x ≤ 30} = A1 ∩ A2 = {x|x ∈ R, 15 ≤ x ≤ 20}.
(17.5)
Stellt man diesen Sachverhalt grafisch dar, so ergeben sich die in Abb. 17.8 gezeigten Zugehörigkeitsfunktionen. Die Menge A1∩2 ist die Schnittmenge der beiden Teilmengen μ 1 6
μ 1 6
Menge A1
10
20
30
x
Menge A2
10
μ 1 6
20
30
x
Menge A1 ∩ A2
10
20
30
x
Abbildung 17.8: Darstellung der Mengen A1 und A2 und ihrer Schnittmenge A1 ∩ A2 A1 und A2 , sie resultiert als Ergebnis einer UND-Verknüpfung. Mathematisch entspricht diese UND-Verknüpfung dem Minimum-Operator, auch als MIN-Operator bezeichnet. UND-Operator. Diese Bildung der Schnittmenge zweier Mengen in der klassischen Mengenlehre, also die MIN-Operation, kann in dieser Form auf Fuzzy-Mengen übertragen werden. Dies soll zunächst an einem Beispiel mit den Fuzzy-Mengen kleiner und mittlerer Abstand zweier Fahrzeuge gezeigt werden, wobei die Grundmenge G in m G = {x|x ∈ R, 0 ≤ x ≤ 500} betragen soll. Als Fuzzy-Menge 1 (kleiner Abstand) sei der Abstand zweier Fahrzeuge im Bereich von 0 bis 40 m bezeichnet. Der Abstand von 20 bis 60 m werde durch die Fuzzy-Menge mittlerer Abstand beschrieben. Dann resultiert mittels einer analogen Anwendung der MIN-Operation (UND-Verknüpfung) auf diese Fuzzy-Mengen der Bereich von 20 bis 40 m als Schnittmenge kleiner UND mittlerer Abstand. Diese neue Fuzzy-Menge ist in der linken Abb. 17.9 schraffiert hervorgehoben und rechts noch einmal gesondert
17.2 Operatoren für Fuzzy-Mengen μ 1 6
klein
20
40
369 μ 1 6
mittel
-
60 Abstand/m
klein UND mittel
20
40
-
60 Abstand/m
Abbildung 17.9: Verknüpfung der Fuzzy-Mengen kleiner und mittlerer Abstand durch eine UND-Verknüpfung dargestellt. Die Zugehörigkeitsfunktion der Schnittmenge beider Fuzzy-Mengen ergibt sich als MINIMUM der Zugehörigkeitsfunktionen der Einzelmengen. Dies führt zu der folgenden Definition der Schnittmenge: Es seien A und B zwei Fuzzy-Mengen auf der Grundmenge G beschrieben durch ihre Zugehörigkeitsfunktionen μA und μB . Dann nennt man A ∩ B = {x, μA∩B (x)|x ∈ G}
(17.6)
die Schnittmenge der Fuzzy-Mengen A und B. Die Zugehörigkeitsfunktion μA∩B (x) ist dabei über den sogenannten MIN-Operator definiert zu μA∩B (x) = μA ∩ μB (x) := MIN(μA (x), μB (x)).
(17.7)
Diese Schnittmenge A∩B wird nachfolgend zur Modellierung der Verknüpfung A UND B
(17.8)
herangezogen. ODER-Operator. Die so erarbeitete Methodik der Verknüpfung kann in gleicher Weise zur Modellierung der ODER-Verknüpfung verwendet werden. Ausgehend von den zuvor in Abb. 17.9 untersuchten Mengen kleiner und mittlerer Abstand resultiert dann die ODER-Verknüpfung der Mengen als Vereinigungsmenge. Die Zugehörigkeitsfunktion der Vereinigungsmenge beider Fuzzy-Mengen ergibt sich als MAXIMUM der Zugehörigkeitsfunktionen der Einzelmengen. Dies führt zu folgender Definition der Vereinigungsmenge: Es seien A und B zwei Fuzzy-Mengen beschrieben durch ihre Zugehörigkeitsfunktionen μA und μB . Dann nennt man A ∪ B = {x, μA∪B (x)|x ∈ G}
(17.9)
370
17 Grundlagen „unscharfer“ Mengen (Fuzzy-Mengen) μ 1 6
klein
20
40
μ 1 6
mittel
-
60 Abstand/m
klein ODER mittel
20
40
-
60 Abstand/m
Abbildung 17.10: Verknüpfung der Fuzzy-Mengen kleiner und mittlerer Abstand durch eine ODER-Verknüpfung die Vereinigungsmenge der Fuzzy-Mengen A und B. Die Zugehörigkeitsfunktion μA∪B (x) ist dabei definiert zu μA∪B (x) = μA ∪ μB (x) := MAX(μA (x), μB (x)).
(17.10)
Diese Vereinigungsmenge A ∪ B wird zur Modellierung der Verknüpfung (17.11)
A ODER B verwendet.
NICHT-Operator. Abschließend wird jetzt die Bildung der Komplementärmenge von Fuzzy-Mengen definiert. Für die Untersuchung wird dabei die Fuzzy-Menge mittlerer Abstand herangezogen (siehe Abb. 17.11). μ 1 6
mittel
20
40
NICHT mittel
-
60 Abstand/m
Abbildung 17.11: Bildung des Komplements NICHT mittlerer Abstand durch den NICHT-Operator Es gilt folgende Definition für die komplementäre Menge: Es sei A eine Fuzzy-Menge beschrieben durch ihre Zugehörigkeitsfunktion μA . Dann nennt man Ac = {x, μAc (x)|x ∈ G}
(17.12)
17.3 Linguistische Variablen und Terme — Fuzzifizierung
371
die komplementäre Menge der Fuzzy-Menge A. Die Zugehörigkeitsfunktion μAc (x) ist dabei definiert zu μAc (x) = 1 − μA (x) .
(17.13)
Diese komplementäre Menge Ac wird zur Modellierung der Negation NICHT A
(17.14)
verwendet.
17.3
Linguistische Variablen und Terme — Fuzzifizierung
Ohne die Vorgehensweise näher zu diskutieren ist in Abschnitt 17.2 eine Methodik eingeführt worden, die in der Fuzzy-Logik üblich ist und nachfolgend näher erläutert werden soll. In der klassischen Mengenlehre geht man häufig von Mengen aus, die man mathematisch exakt beschreiben kann. Dies sind z. B. die Menge der reellen Zahlen R, die Menge der komplexen Zahlen C, die Menge der Zahlen größer 5 A = {x|x ∈ R, x > 5} und ähnliche Spezifizierungen. In gleicher Weise können technische Sachverhalte wie z. B. der in Abschnitt 17.2 betrachtete Abstand zweier Fahrzeuge beschrieben werden. D. h. man kann diesen Abstand in scharf getrennte Mengen unterteilen: minimaler Abstand kleiner Abstand mittlerer Abstand größerer Abstand
A1 A2 A3 A4
= {x|x ∈ R, x ≤ 10} = {x|x ∈ R, 10 < x ≤ 30} = {x|x ∈ R, 30 < x ≤ 50} = {x|x ∈ R, 50 < x ≤ 100} .
Abhängig vom jeweiligen Abstand können dann unter Verwendung von Methoden der Steuerungstechnik Aktionen wie z. B. die Einleitung gestufter Bremsvorgänge aktiviert werden. Linguistische Variable und Terme. Eine ähnliche Vorgehensweise ist auch in der Fuzzy-Logik üblich. Der untersuchte Sachverhalt wird in sprachlicher Form beschrieben und dann in algorithmische Berechnungsverfahren überführt, die zur Steuerung und Regelung eingesetzt werden. Die Grundelemente der linguistischen Beschreibung in der Fuzzy-Logik sind • linguistische Variable wie z. B. Fahrzeugabstand, Temperatur, Regeldifferenz, . . . und • linguistische Terme wie z. B. klein, mittel, groß, riesig . . . .
372
17 Grundlagen „unscharfer“ Mengen (Fuzzy-Mengen)
Die linguistische Variable (z. B. Abstand) stellt den Signalkanal dar, und der linguistische Term (z. B. klein) den Fuzzy-Signalwert [78]. Kleiner Abstand ist somit eine Fuzzy-Menge mit einer zu spezifizierenden Zugehörigkeitsfunktion. Aus später noch näher erläuterten Gründen werden die linguistischen Terme meist überlappend gewählt. In Abb. 17.12 werden zwei Beispiele für derart spezifizierte Fuzzy-Mengen gezeigt. μ 1 6
μ 1 6
klein
20
40
60
80
-
100 Abstand/m
mittel
20
40
60
80
-
100 Abstand/m
Abbildung 17.12: Fuzzy-Mengen kleiner Abstand (linke Abb.) und mittlerer Abstand (rechte Abb.) mit der linguistischen Variablen Abstand und den linguistischen Termen klein bzw. mittel Für eine komplette Abdeckung des Wertebereichs des zu untersuchenden Signalkanals sind mehrere Fuzzy-Mengen zu spezifizieren. Dabei legt man im Allgemeinen trapezförmige Fuzzy-Mengen an die Ränder des Wertebereichs und dreiecksförmige Fuzzy-Mengen ins Innere des Wertebereichs. Dies zeigt Abb. 17.13 für die linguistische Variable Temperatur im Bereich von 0◦ C bis 100◦C mit den fünf linguistischen Termen sehr niedrig, niedrig, mittel, hoch, sehr hoch. μ 1 6
sehr niedrig niedrig
20
40
mittel
60
hoch
80
sehr hoch
100
-
Temperatur/◦ C
Abbildung 17.13: Linguistische Variable Temperatur in ◦ C mit den linguistischen Termen sehr niedrig, niedrig, mittel, hoch, sehr hoch Fuzzifizierung. In der Praxis liegt die Anzahl der linguistischen Terme je Variabler im Bereich von 2 . . . 7. Für jede gemessene Temperatur kann man nun den Zugehörigkeitsgrad zur jeweiligen Fuzzy-Menge genau angeben. In der Fuzzy-Logik nennt man dies einen Übergang von einem scharfen Signalwert auf den Fuzzy-Signalwert. Dies wird in Abb. 17.14 gezeigt. Der scharfe (hochgestelltes s) Temperaturwert T s = 24◦ C weist die folgenden Zugehörigkeitsgrade zu den einzelnen Fuzzy-Mengen auf: μsehr niedrig (24◦ C) = 0,17 μniedrig (24◦ C) = 0,47
17.3 Linguistische Variablen und Terme — Fuzzifizierung μ 1 6
sehr niedrig niedrig
0,70 0,47 0,17
mittel
373
hoch
sehr hoch
6 6 6
206 24◦ C
40
6
60
80
100
-
Temperatur/◦ C
46◦ C
Abbildung 17.14: Übergang vom scharfen Signalwert zum Fuzzy-Signalwert für die Temperaturen T s = 24 und 46◦ C μmittel (24◦ C) = 0 μhoch (24◦ C) = 0 μsehr hoch (24◦ C) = 0 . Der Temperaturwert T s = 24◦ C wird also wie folgt auf die Fuzzy-Mengen abgebildet: T s = 24◦ C → T ∗24◦ C = [μsehr niedrig (24◦ C), μniedrig (24◦ C), . . . . . . μmittel (24◦ C), μhoch (24◦ C), μsehr hoch (24◦ C)] ∗ → T 24◦ C = [0,17 0,47 0 0 0] . Dabei ist T ∗ der Vektor der Zugehörigkeitsfunktionen. Diesen Vorgang der Abbildung eines scharfen Messwertes auf einen Vektor von Zugehörigkeitsgraden zu den einzelnen Fuzzy-Mengen bezeichnet man auch als Fuzzifizierung. Nach diesem Schema führt die Fuzzifizierung der Temperatur T s = 46◦ C, wie in Abb. 17.14 gezeigt, zu dem Ergebnis: T s = 46◦ C → T ∗46◦ C = [0
0
0,70
0
0] .
Sofern der scharfe Signalwert im Überlappungsbereich benachbarter Fuzzy-Mengen liegt, besitzt der Vektor der Zugehörigkeitsfunktionen zwei Elemente ungleich Null. Sonst ist nur ein Element von Null verschieden.
18
Fuzzy-logisches Schließen (Fuzzy-Inferenz)
18.1
Regeln für Fuzzy-logisches Schließen
Fuzzy-Implikation. Eine der Anwendungen der Theorie der Fuzzy-Mengen besteht darin, bei Erfüllung einer bestimmten Bedingung eine Schlussfolgerung zu ziehen. Sowohl die Bedingung als auch die Schlussfolgerung sind dabei über Fuzzy-Mengen definiert. Diese Art des Schließens wurde von Zadeh [77] als Fuzzy-logisches Schließen bzw. als unscharfes Schließen bezeichnet. Die zugrunde liegende Regel R für dieses unscharfe Schließen R: WENN x = A DANN y = B wird als WENN-DANN-Regel bezeichnet. Der WENN-Teil der Regel, also x = A, stellt die Bedingung oder Prämisse dar, und der DANN-Teil, also y = B, die Schlussfolgerung oder Konklusion. Da Bedingung und Schlussfolgerung auf unscharfen Aussagen basieren, bezeichnet man derartige Regeln in Anlehnung an die klassische Implikation als FuzzyImplikation und kürzt sie ab mit A⇒B . Die Verarbeitung einer derartigen Regel muss man sich wie folgt vorstellen: Regel R: Faktum: Schlussfolgerung:
WENN x = A DANN y = B x besitzt mehr oder weniger die Eigenschaft A y besitzt mehr oder weniger die Eigenschaft B
Das Beispiel des Kuchenbackens in einem Backofen, soll dieses Fuzzy-logische Schließen verdeutlichen: • Die Prämisse sei hierbei die Bräunung des Kuchens im Backofen, und • die Konklusion sei die Aussage, ob der Kuchen gar ist oder nicht.
376
18 Fuzzy-logisches Schließen (Fuzzy-Inferenz)
Dann erfolgt die Verarbeitung der Regel nach dem folgenden Schema: Regel R: Faktum: Schlussfolgerung:
WENN Bräunung = Goldbraun DANN Kuchen = Gar Bräunung des Kuchens weniger Goldbraun Kuchen weniger Gar
Goldbraun und Gar stellen also Fuzzy-Mengen A und B dar, die über die Regel (FuzzyImplikation) verknüpft werden. Es stellt sich nun die Frage, welcher Operator zur Verarbeitung einer derartigen WENNDANN-Regel verwendet werden kann. Durchgesetzt hat sich hierbei der Grundgedanke von Mamdani [51], der besagt, dass der Wahrheitsgehalt der Schlussfolgerung nicht größer sein kann als der Wahrheitsgehalt der Prämisse. Ersetzt man Wahrheitsgehalt durch Zugehörigkeitsgrad zu einer Fuzzy-Menge, dann besagt dies beim Kuchenbeispiel: Wenn die Bräunung des Kuchens den Zugehörigkeitsgrad 0,75 zur Fuzzy-Menge Goldbraun (A) aufweist, dann kann der Zugehörigkeitsgrad der Schlussfolgerung zur Fuzzy-Menge Kuchen ist Gar (B) maximal auch nur 0,75 betragen. Die Mengen A und B basieren auf unterschiedlichen Grundmengen. Die Operationalisierung der Regeln, die unterschiedliche Grundmengen verknüpfen, wird durch die sogenannten Relationen bzw. Fuzzy-Relationen ermöglicht, die im nachfolgenden Abschnitt eingeführt werden.
18.2
Fuzzy-Relationen
Relationen. Während die bisher untersuchten Mengen auf einer Grundmenge definiert waren, soll nun die Verknüpfung von Elementen aus verschiedenen Grundmengen betrachtet werden. Hierzu eignen sich die sogenannten Relationen. Zunächst einige Definitionen: 1. Es seien die Variablen x die Elemente der Grundmenge M1 , und y die Elemente der Grundmenge M2 . 2. Zwischen den Grundmengen M1 und M2 lässt sich durch eine Aussageform „x verknüpft mit y“ eine Beziehung herstellen. 3. Die Grundmenge der Aussageform mit zwei Variablen ist die Kreuzproduktmenge M1 × M2 . Die Aussageform nennt man Relationsvorschrift. 4. Die Lösungsmenge einer Aussageform mit zwei Variablen bezeichnet man als Relation R. 5. Die Relation R ist auch eine Menge, und zwar eine Teilmenge der Grundmenge R ⊆ M1 × M2 .
18.2 Fuzzy-Relationen
377
Diese Definitonen sollen nun am Beispiel der diskreten Mengen A und B mit A = {1 3 5 7 8} und B = {4 6 8 10} veranschaulicht werden. Für die Relationsvorschrift x > y kann man nun die Relation R der Wertepaare (x, y) ∈ A × B aus den unterschiedlichen Mengen bilden. Diese Relation lautet: R = {(5, 4), (7, 4), (7, 6), (8, 4), (8, 6)}.
(18.1)
Die Relation ist definiert auf der Kreuzproduktmenge A × B und kann in Form einer Tabelle dargestellt werden: y
R: x > y
x
1 3 5 7 8
4 0 0 1 1 1
6 0 0 0 1 1
8 0 0 0 0 0
10 0 0 0 0 0
⎡
0 ⎢0 ⎢ R = ⎢1 ⎣1 1
⇒
0 0 0 1 1
0 0 0 0 0
⎤ 0 0⎥ ⎥ 0⎥ 0⎦ 0
Die Matrix R wird als Relationsmatrix bezeichnet. Sie enthält nur die Elemente 0 und 1, da in der klassischen Mengenlehre die Zugehörigkeitsfunktion μ nur diese beiden Werte annehmen kann. Fuzzy-Relationen. Im Unterschied zu den einfachen Mengen sind bei den Fuzzy-Mengen auch Zugehörigkeitsgrade zwischen 0 und 1 zugelassen. Die weiteren Spezifikationen bleiben erhalten. Die Definition einer Fuzzy-Relation lautet somit: Es seien A = {x, μA (x)|x ∈ G1 }
und
B = {y, μB (y)|y ∈ G2 }
zwei Fuzzy-Mengen auf den zwei Grundmengen G1 und G2 . Dann heißt die geordnete Menge von Tupeln R = {((x, y), μR (x, y)) |(x, y) ∈ G1 × G2 } eine 2-stellige Fuzzy-Relation in G1 × G2 . Dabei stellt die Abbildung μR (x,y) : G1 × G2 → [0, 1] die Zugehörigkeitsfunktion von R dar. Für n Grundmengen gilt die entsprechende Erweiterung auf n-stellige Fuzzy-Relationen. Eine Relationsvorschrift verknüpft (Operator ≈) die beiden Variablen x und y, geschrieben als R:x≈y .
378
18 Fuzzy-logisches Schließen (Fuzzy-Inferenz)
Als Relationsvorschrift R kann auch eine WENN-DANN-Regel dienen, oder wie nachfolgend gezeigt die UND-Verknüpfung (oder ODER-Verknüpfung) von Teilprämissen einer WENN-DANN-Regel. Die Fuzzy-Relation soll an dem technischen Beispiel der Füllstandsregelung eines Behälters (siehe Abb. 18.7) veranschaulicht werden. Es seien die zwei Fuzzy-Mengen mittel (Füllstand) und hoch (Abfluss)1 durch die nachfolgend abgebildeten Zugehörigkeitsfunktionen gekennzeichnet: μ 6 1
μ 1 6
mittel
hoch
-
1,83
2,5
3,16Füllstand/m
-
2,83
3,5
3 4,16 Abfluss/(m /h)
Abbildung 18.1: Fuzzy-Mengen mittel (Füllstand) (linke Abb.) und hoch (Abfluss) (rechte Abb.) Auf der Basis der Fuzzy-Mengen mittel (Füllstand) und hoch (Abfluss) soll eine Schlussfolgerung „“ gezogen werden. Dies kann auf der Basis einer WENN-DANNRegel erfolgen. Beispielhaft möge eine derartige WENN-DANN-Regel lauten:
R:
WENN Füllstand = mittel UND Abfluss = hoch DANN
Dieses , die Konklusion, wird in den folgenden Abschnitten näher betrachtet werden. An dieser Stelle soll zunächst nur die UND-Verknüpfung der Teilprämissen untersucht werden, die auch eine Relationsvorschrift RP darstellt, und zwar: Füllstand = mittel UND Abfluss = hoch . Diese UND-Verknüpfung der Teilprämissen basiert auf unterschiedlichen Grundmengen, die man in Fuzzy-Relationen auf der gleichen Kreuzproduktmenge überführen muss. Da die Fuzzy-Mengen mittel (Füllstand) und hoch (Abfluss) – ohne Verknüpfung durch eine Regelung – voneinander unabhängige Größen sind, kann man die jeweilige Grundmenge über der anderen Grundmenge erweitern, und erhält die Gesamtrelation RP der Prämisse. Diese Prämissen-Relation RP kann man als „Relationsgebirge“, wie in Abb. 18.2 gezeigt, grafisch darstellen. 1
Die jeweiligen Fuzzy-Mengen sind Füllstand mittel und Abfluss hoch. Füllstand und Abfluss sind die linguistischen Variablen, und mittel und hoch die linguistischen Terme.
18.2 Fuzzy-Relationen
379
Abfluss/(m3 /h)
μRP 6
4,16
1 3,5
2,83
1,83
2,5
3,16
-
Füllstand/m
Abbildung 18.2: Darstellung des Relationsgebirges der Prämissen-Relation RP als MIN-Verknüpfung der erweiterten Fuzzy-Mengen mittel (Füllstand) UND hoch (Abfluss) Diese Zugehörigkeitsfunktion μRP der Prämissen-Relation basiert auf der nachfolgenden Tabelle und der daraus sich ergebenden Relationsmatrix RP :
RP : A UND B
mittel (Füllstand in m)
1,50 1,83 2,16 2,50 2,83 3,16 3,50
2,5 0 0 0 0 0 0 0
⎡
RP
⎢ ⎢ ⎢ ⎢ =⎢ ⎢ ⎢ ⎣
0 0 0 0 0 0 0
hoch (Abfluss/(m3 /h)) 2,83 3,16 3,5 3,83 4,16 0 0 0 0 0 0 0 0 0 0 0 0,5 0,5 0,5 0 0 0,5 1 0,5 0 0 0,5 0,5 0,5 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0
0 0 0 0 0 0 0,5 0,5 0,5 0,5 1 0,5 0,5 0,5 0,5 0 0 0 0 0 0
0 0 0 0 0 0 0
0 0 0 0 0 0 0
4,5 0 0 0 0 0 0 0
⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦
380
18 Fuzzy-logisches Schließen (Fuzzy-Inferenz)
18.3
Fuzzy-Inferenz
18.3.1
WENN-DANN-Regeln mit einer Prämisse
WENN-DANN-Regel. Nach der Einführung des Fuzzy-logischen Schließens in Abschnitt 18.1 und der Fuzzy-Relation in 18.2 kann nun die Auswertung der WENNDANN-Regeln, die Konklusion, betrachtet werden. Das Schema der Auswertung der WENN-DANN-Regel wird am Beispiel der Füllstandsregelung eines Behälters erläutert. Hierzu wird wieder die zuvor betrachtete Fuzzy-Menge mittel (Füllstand) mittels einer WENN-DANN-Regel mit der Fuzzy-Menge dreiviertel (Ventilstellung) für die Steuerung des Zuflusses verknüpft. Regel R: WENN Füllstand = mittel DANN Ventilstellung = dreiviertel bzw. in Kurzform Regel R: WENN x = A DANN y = B Zur Veranschaulichung werden zunächst die Fuzzy-Mengen mittel (Füllstand) und dreiviertel (Ventilstellung) dargestellt. μ 1 6
μ 1 6
mittel
dreiviertel
-
-
1,83
2,5
3,16Füllstand/m
56,7
70
83,3 Ventilst./%
Abbildung 18.3: Fuzzy-Mengen mittel (linke Abb.) und dreiviertel (rechte Abb.) Die Verarbeitung der obigen Regel muss man sich gemäß Abschnitt 18.1 wie folgt vorstellen: Regel R: Faktum: Schlussfolgerung:
WENN x = A DANN y = B x besitzt mehr oder weniger die Eigenschaft A y besitzt mehr oder weniger die Eigenschaft B
Es werden in dieser Regel die zwei Größen x und y, und zwar Füllstand und Ventilstellung, zueinander in Beziehung gesetzt. Folglich lässt sich die Regel ebenfalls als zweistellige Fuzzy-Relation beschreiben, deren Zugehörigkeitsfunktion μR (x, y) sich aus der Zugehörigkeitsfunktion μA (x) der Prämisse und der Zugehörigkeitsfunktion μB (y) der Konklusion ergibt. Offen jedoch ist zunächst der zu verwendende Operator zur Verknüpfung der Zugehörigkeitsfunktionen. Fuzzy-Inferenz. Nach der Grundidee von Mamdani kann der Wahrheitsgehalt der Schlussfolgerung jedoch nicht größer sein als der Wahrheitsgehalt der Prämisse. Ist die Prämisse z. B. mit dem Zugehörigkeitsgrad von 0,5 erfüllt, dann soll auch die Konklusion
18.3 Fuzzy-Inferenz
381
maximal den Zugehörigkeitsgrad von 0,5 aufweisen. Die Zugehörigkeitsfunktion μR der Regel A ⇒ B wird dann einfach dadurch gebildet, dass wie bei der logischen UNDVerknüpfung das Minimum beider Zugehörigkeitsfunktionen genommen wird. (18.2)
μR:A⇒B (x, y) := MIN(μA (x), μB (y)) .
Die Anwendung der Mamdani-Implikation wird leichter verständlich, wenn man die Fuzzy-Mengen mittel und dreiviertel diskretisiert, d. h. nur einige wenige Werte der Fuzzy-Mengen betrachtet. Abb. 18.4 verdeutlicht diesen Diskretisierungsprozess. μ μ t t 1 6 1 6 mittel
t
t
t 1,83
dreiviertel
t t
2,5
-
t
t
3,16Füllstand/m
56,7
t
70
-
83,3 Ventilst./%
Abbildung 18.4: Fuzzy-Mengen mittel (linke Abb.) und dreiviertel (rechte Abb.) Beschränkt man sich zunächst auf die diskreten Grundmengen G1 = " F u¨llstand in m = {1,83 2,16 2,5 2,83 3,16} und G2 = " V entilstellung in % = {56,7 63,3 70 76,7 83,3}, dann erhält man z. B. für die Wertepaare (xs , y) mit xs als scharfem Eingangswert (2,16 m Füllstand) = " (xs = 2,16) ⇒ μmittel = 0,5 und (70 % Ventilstellung) = " (y = 70) ⇒ μdreiviertel = 1,0 gemäß der Mamdani-Implikation μR:A⇒B (xs = 2,16, y = 70) = MIN(μmittel (2,16), μdreiviertel (70)) = MIN(0,5; 1,0) = 0,5. Für die Wertepaare xs = 2,5 und y = 70 resultiert dann μR:A⇒B (xs = 2,5, y = 70) = MIN(μmittel (2,5), μdreiviertel (70)) = MIN(1,0; 1,0) = 1,0. Führt man diese MIN-Operation für alle möglichen Wertepaare von (xs , y) durch, so erhält man die Relationsmatrix der Regel, die man in Form der nachfolgenden Tabelle darstellen kann: R: A ⇒ B
Füllstand in m
1,83 2,16 2,50 2,83 3,16
56,7 0 0 0 0 0
Ventilstell. 63,3 70 0 0 0,5 0,5 0,5 1 0,5 0,5 0 0
in % 76,7 0 0,5 0,5 0,5 0
83,3 0 0 0 0 0
382
18 Fuzzy-logisches Schließen (Fuzzy-Inferenz)
Zur Ergebnisinterpretation soll die Zeile der Relationsmatrix mit xs = 2,16 für alle Werte von y herausgegriffen werden. Es gilt hier: µR:A⇒B (xs µR:A⇒B (xs µR:A⇒B (xs µR:A⇒B (xs µR:A⇒B (xs
= = = = =
2,16, y 2,16, y 2,16, y 2,16, y 2,16, y
= = = = =
56,7) = 63,3) = 70,0) = 76,7) = 83,3) =
MIN(µmittel (2,16), µdreiviertel (56,7)) MIN(µmittel (2,16), µdreiviertel (63,3)) MIN(µmittel (2,16), µdreiviertel (70,0)) MIN(µmittel (2,16), µdreiviertel (76,7)) MIN(µmittel (2,16), µdreiviertel (83,3))
= = = = =
MIN(0,5; 0) = 0 MIN(0,5; 0,5) = 0,5 MIN(0,5; 1,0) = 0,5 MIN(0,5; 0,5) = 0,5 MIN(0,5; 0) = 0.
Man erkennt, dass infolge der MIN-Operation für die Prämisse xs = 2,16 die Konklusion auf den Minimalwert von Prämisse und Konklusion beschränkt wird. Die ErgebnisFuzzy-Menge für die Konklusion blendet aus der Relationsmatrix praktisch die Zeile der jeweiligen Prämisse aus. Dies soll die eingerahmte Zeile in Tab. 18.1 verdeutlichen. R: A ⇒ B Füllstand in m
1,83 2,16 2,50 2,83 3,16
56,7 0 0 0 0 0
Ventilst. in % 63,3 70 76,7 0 0 0 0,5 0,5 0,5 0,5 1 0,5 0,5 0,5 0,5 0 0 0
83,3 0 0 0 0 0
Tabelle 18.1: Darstellung des Inferenzvorgangs der WENN-DANN-Regel für xs = 2,16
Das Ergebnis des Inferenzvorgangs der WENN-DANN-Regel ist die in der Höhe der Zugehörigkeitsfunktion der Prämisse (hier μA (xs = 2,16)) abgeschnittene Ergebnis-FuzzyMenge, die in Abb. 18.5 schraffiert hervorgehoben ist. Die Höhe der Zugehörigkeitsfunktion der Prämisse (hier H = 0,5) wird auch als Erfüllungsgrad der Prämisse bzw. Regel bezeichnet. Man bezeichnet eine Regel als aktiv, wenn ihr Erfüllungsgrad H > 0 ist. Die Ergebnis-Fuzzy-Menge ist nicht normal, ihr maximaler Zugehörigkeitsgrad ist i. A. kleiner als Eins. μ 1 6
t t 6 t 1,83
mittel
t
-
t t
2,5
μ 1 6
-
3,16Füllstand/m
xs =2,16
t
t
t 56,7
dreiviertel
t
70
-
83,3 Ventilst./%
Abbildung 18.5: Grafische Darstellung des Inferenzvorgangs der WENN-DANN-Regel für xs = 2,16
18.3 Fuzzy-Inferenz
18.3.2
383
WENN-DANN-Regel mit mehreren Teilprämissen
Methode. Nach der Erläuterung der grundsätzlichen Vorgehensweise bei der schematischen Verarbeitung von WENN-DANN-Regeln soll nun die Verarbeitung von mehreren Teilprämissen betrachtet werden. Die Teilprämissen sollen dabei UND-verknüpft sein. Wiederum wird am Beispiel der Füllstandsregelung eines Behälters die Vorgehensweise erläutert. Die zugrunde gelegte Regel laute nun: R:
WENN Füllstand = mittel UND Abfluss = hoch DANN Ventilst. = dreiviertel bzw. in Kurzform
R:
WENN x1 = A1 UND x2 = A2 DANN y = B
Es müssen nun zwei Fakten, zwei Eingangsgrößen, verarbeitet werden, um zur Konklusion zu kommen. Man benötigt eine Information über den Füllstand UND den Abfluss. Die Beibehaltung der Grundidee von Mamdani, dass der Wahrheitsgehalt der Konklusion nicht größer sein kann als der der Prämisse bzw. Prämissen, erfordert nur eine kleine Modifikation der oben eingeführten Verarbeitungsregel. Die Ergebnis-FuzzyMenge ist wiederum die abgeschnittene Fuzzy-Menge dreiviertel. Sie wird nun jedoch abgeschnitten in der Höhe des minimalen Erfüllungsgrades der UND-verknüpften Prämissen (MIN-Operation). Die grafische Darstellung dieser Auswertung zeigt Abb. 18.6 für die beiden Fakten (scharfen Eingangsgrößen): " Füllstand = 2,16 m xs1 = " Abfluss = 3,5 m3 /h. xs2 = μ 16
μ 16
mittel
hoch
-
μ 16
dreiviertel
1,83
2,5 3,16 6 Füllstand/m xs1 =2,16
2,83
4,16 6 Abfluss/(m3 /h)
-
56,7 70 83,3 Ventilst./%
xs2 =3,5
Abbildung 18.6: Grafische Darstellung des Inferenzvorgangs der WENN-DANN-Regel für zwei Teilprämissen Ergebnis-Fuzzy-Menge dieser Regel mit den zwei Prämissen für die beiden oben aufgeführten scharfen Eingangswerte ist die schraffiert dargestellte Fuzzy-Menge. Sie ist abgeschnitten in der Höhe des minimalen Erfüllungsgrades beider Prämissen. Der Erfüllungsgrad der Eingangs-Fuzzy-Menge mittel (Füllstand in m) für den scharfen Eingangswert xs1 = 2,16 beträgt H1 = 0,5 und der Erfüllungsgrad der Eingangs-FuzzyMenge hoch (Abfluss in m3 /h) für den scharfen Eingangswert xs2 = 3,5 beträgt H2 = 1.
384
18 Fuzzy-logisches Schließen (Fuzzy-Inferenz)
Der minimale Erfüllungsgrad beider Teilprämissen ist H = 0,5. Also wird die Fuzzy-Menge dreiviertel (Ventilstellung in %) in der Höhe des Erfüllungsgrades H = 0,5 abgeschnitten und liefert die Ausgangs-Fuzzy-Menge. Formelmäßig wird dieses Vorgehen beschrieben durch μB (y) = μR (xs , y) = MIN (H, μB (y)) H = MIN (μA1 (xs1 ), μA2 (xs2 )) .
(18.3) (18.4)
Darin sind μB (y) die Zugehörigkeitsfunktion der „abgeschnittenen“ Ergebnis-FuzzyMenge und xs der Vektor der scharfen Eingangsgrößen xs1 und xs2 . Die Erweiterung dieser Vorgehensweise von zwei auf n UND-verknüpfte Teilprämissen erfolgt nach dem gleichen Schema. Sind die beiden Teilprämissen jedoch ODER-verknüpft, lautet also die Regel WENN x1 = A1 ODER x2 = A2 DANN y = B ,
R:
dann kann man diese Regel auf die folgenden zwei Regeln aufspalten R1 :
WENN x1 = A1 DANN y = B
R2 :
WENN x2 = A2 DANN y = B.
und
Dieser Fall ist ein Sonderfall der Verarbeitung mehrerer WENN-DANN-Regeln, der im anschließenden Abschnitt behandelt wird.
18.3.3
Mehrere WENN-DANN-Regeln
Anwendungsbeispiel. Für die Anwendung der Fuzzy-Logik in der Regelungstechnik kommt man im Allgemeinen nicht mit einer Regel aus. Daher soll für die Darstellung der Verarbeitungsvorschrift bei Vorhandensein mehrerer WENN-DANN-Regeln nun das Beispiel der Füllstandsregelung eines Behälters erweitert werden. In Abb. 18.7 ist der
?QZu Abbildung 18.7: Flüssigkeitsbehälter mit Zu- und Abfluss
6
Füllstandshöhe in m
?
Q - Ab Grundfläche A
18.3 Fuzzy-Inferenz
385
Behälter mit den interessierenden Größen skizziert. Die Grundmengen der Eingangsvariablen (in einen Regler) bei diesem Prozess sind G1 = Füllstandshöhe h in m nachfolgend mit Füllstand h abgekürzt und G2 = Abflussmenge pro Zeiteinheit in m3 /h nachfolgend mit Abfluss QAb abgekürzt. Der interessierende Bereich der Eingangsvariablen (linguistische Variablen) Füllstand und Abfluss werde durch die in Abb. 18.8 dargestellten Fuzzy-Mengen abgedeckt. μ 1 6
leer
halbleer
1
μ 1 6
2
sehr gering gering
1
2
mittel
halbvoll
3
4
normal
hoch
3
4
voll
-
Füllstand/m
5
sehr hoch
-
Abfluss/(m3 /h)
5
Abbildung 18.8: Darstellung der Fuzzy-Mengen der Eingangsvariablen Füllstand h und Abfluss QAb
Die Grundmenge der Ausgangsvariablen (eines Reglers) für den Füllprozess ist die Menge G3 „Ventilstellung“ in % zur Steuerung der Zuflussmenge pro Zeiteinheit QZu . Die auf diesen Grundmengen definierten Fuzzy-Mengen sind in Abb. 18.9 dargestellt. μ 16
zu
einviertel halb
20
40
60
auf
dreiviertel
80
100
-
Ventil%
Abbildung 18.9: Darstellung der Fuzzy-Mengen der Ausgangsvariablen Ventilstellung
386
18 Fuzzy-logisches Schließen (Fuzzy-Inferenz)
Fuzzy-Inferenz. Es seien unter anderen die folgenden zwei Regeln definiert, die durch die Eingangsvariablen angesprochen werden: R1 : WENN Füllstand = halbleer UND Abfluss = normal DANN Ventilst. = dreiviertel R2 : WENN Füllstand = mittel UND Abfluss = normal DANN Ventilst. = halb Die betrachteten scharfen Eingangswerte der Eingangsvariablen seien Füllstand xs1 = 2,18 m sowie Abfluss xs2 = 2,4 m3 /h . Die Verarbeitung von Regel 1 unter Verwendung der MIN-Operation zeigt Abb. 18.10. WENN Füllstand = halbleer UND Abfluss = normal DANN Ventilst. = dreiviertel μ halbleer 16 0,86 0,58 0,11 1
μ 16
mittel
-
-
2 6s 3 4 5 x1 = 2,18 Füllstand/m
μ 16
normal
-
1 2 3 xs2 = 2,4 6
4
-
5 20 Abfluss/(m3 /h)
dreiviertel
40
60
-
80 100 Ventilst./%
Abbildung 18.10: Grafische Darstellung des Inferenzvorgangs für Regel 1 Der Erfüllungsgrad der Fuzzy-Menge Füllstand = halbleer beträgt H11 = 0,11 und der Erfüllungsgrad der Fuzzy-Menge Abfluss = normal beträgt H12 = 0,86. Der minimale Erfüllungsgrad beider Fuzzy-Mengen ist somit H1 = 0,11. Die MIN-Operation, die zur Verarbeitung der UND-Verknüpfung zugrunde gelegt ist, hat als Ergebnis, dass die Prämisse mit dem Erfüllungsgrad H1 = 0,11 erfüllt ist. Als Konklusion der WENN-DANNRegel 1 steht dann die Ergebnis-Fuzzy-Menge Ventilst. = dreiviertel zur Verfügung, die in der Höhe des minimalen Erfüllungsgrades abgeschnitten ist. Diese abgeschnittene Ergebnis-Fuzzy-Menge der 1. WENN-DANN-Regel ist in Abb. 18.10 schraffiert hervorgehoben. In gleicher Weise wird die Ergebnis-Fuzzy-Menge der 2. WENN-DANN-Regel ermittelt. UND Abfluss = normal
WENN Füllstand = mittel μ halbleer 16
0,86 0,58 0,11
-
1
μ 16
mittel
-
2 6s 3 4 5 x1 = 2,18 Füllstand/m
normal
1 2 3 xs2 = 2,4 6
μ 16
-
4
DANN Ventilst. = halb
-
5 20 Abfluss/m3 /h
halb
40
60
Abbildung 18.11: Grafische Darstellung des Inferenzvorgangs für Regel 2
-
80 100 Ventilst./%
18.3 Fuzzy-Inferenz
387
Der Erfüllungsgrad der Fuzzy-Menge Füllstand = mittel beträgt H21 = 0,58 und der Erfüllungsgrad der Fuzzy-Menge Abfluss = normal beträgt H22 = 0,86. Der minimale Erfüllungsgrad beider Fuzzy-Mengen ist somit H2 = 0,58. Die MIN-Operation, die zur Verarbeitung der UND-Verknüpfung zugrunde gelegt ist, hat als Ergebnis, dass die Prämisse mit dem Erfüllungsgrad H2 = 0,58 erfüllt ist. Als Konklusion der WENNDANN-Regel 2 steht dann die Ergebnis-Fuzzy-Menge Ventilst. = halb zur Verfügung, die in der Höhe des minimalen Erfüllungsgrades abgeschnitten ist. Diese abgeschnittene Ergebnis-Fuzzy-Menge der 2. WENN-DANN-Regel ist in Abb. 18.11 schraffiert hervorgehoben. Aggregation. Die abgeschnittenen Ergebnis-Fuzzy-Mengen der zwei Regeln werden nun über den MAX-Operator zur Ergebnis-Fuzzy-Menge zusammengefügt μres = MAXj=1,2 MIN(Hj , μBj (y)) Hj = MINi=1,2 (μj,i (xsi )) .
mit
(18.5) (18.6)
Unter Verwendung der beim Füllprozess auftretenden Fuzzy-Mengen lautet die Anwendung dieser Regel H1 = MIN μh=halbleer (2,18 m), μQAb =normal (2,4 m3 /h) = MIN(0,11; 0,86) = 0,11 H2 = MIN μh=mittel (2,18 m), μQAb =normal (2,4 m3 /h) = MIN(0,58; 0,86) = 0,58 μres (y) = MAX (MIN(H1 ,μV entilst.=dreiviertel (y)),MIN(H2 ,μV entilst.=halb (y))) = MAX (μV entilst.=dreiviertel (y), μV entilst.=halb (y)) . Das hochgestellte “ ’ “ soll in der obigen Gleichung die abgeschnittenen Mengen kennzeichnen. Die grafische Darstellung dieses Inferenzvorgangs zeigt Abb. 18.12. Zusammenfassung. Der gesamte Inferenzvorgang des Fuzzy-logischen Schließens unter Verwendung dieser beiden Regeln erfolgt somit in drei Schritten: Im 1. Schritt wird die UND-Verknüpfung der Teilprämissen unter Verwendung des MIN-Operators durchgeführt. Im 2. Schritt wird dann wieder unter Verwendung des MIN-Operators die Ergebnis-Fuzzy-Menge jeder WENN-DANN-Regel ermittelt (Fuzzy-Inferenz). Beide Schritte sind grafisch dargestellt in den Abbildungen 18.10 und 18.11. Im 3. Schritt werden dann die Ergebnis-Fuzzy-Mengen beider Regeln unter Verwendung des MAX-Operators akkumuliert (Aggregation). Diesen dritten Schritt zeigt Abb. 18.12.
388
18 Fuzzy-logisches Schließen (Fuzzy-Inferenz) μ 16
dreiviertel
20
40
μ 16
60
80
-
100 Ventilst./%
40
60
halb
20
60
dreiviertel
Menge
MAX ⇒
halb
20
μ Ergebnis1 6 Fuzzy-
80
40
80
-
100 Ventilst./%
-
100 Ventilst./%
Abbildung 18.12: MAX-Operation des Inferenzvorgangs zur Bildung der schraffiert dargestellten Fuzzy-Ergebnismenge Man bezeichnet die Vorgehensweise des Fuzzy-logischen Schließens in der obigen Form mit mehreren Regeln auch als MAX-MIN-Inferenzschema (bzw. korrekt als MAX-MINMIN-Inferenzschema).
18.3.4
Zusammenfassung des MAX-MIN-Inferenzschemas
Gesamtdarstellung. Die einzelnen Schritte der Fuzzy-Inferenz sollen nachfolgend zusammengefasst werden. Dabei wird ausgegangen von einem Satz von m Regeln, die jeweils n UND-verknüpfte Teilprämissen enthalten: R1 : .. .
WENN x1 = A11
UND . . .
UND xn = A1n
DANN y = B1
Rj : .. .
WENN x1 = Aj1
UND . . .
UND xn = Ajn
DANN y = Bj
Rm :
WENN x1 = Am1
UND . . .
UND xn = Amn
DANN y = Bm .
Hierin sind x1 , x2 , . . . , xn A11 , . . . , Aji , . . . , Amn y B1 , B2 , . . . , Bm
die die die die
Eingangsgrößen der Regeln, linguistischen Terme der Eingangsgrößen xi , Ausgangsgröße der Regel, und linguistischen Terme der Ausgangsgröße y.
Für einen Vektor xs von scharfen Eingangswerten xs = {xs1 , xs2 , . . . , xsn } erfolgt das Fuzzy-logische Schließen in drei Schritten:
18.3 Fuzzy-Inferenz
389
In Schritt 1 wird der Erfüllungsgrad Hj einer jeden Regel unter Verwendung des MIN-Operators für die Auswertung der UND-Verknüpfung der Teilprämissen ermittelt: H1 = MIN (μA11 (xs1 ), μA12 (xs2 ), . . . , μA1n (xsn )) .. . Hj = MIN μAj1 (xs1 ), μAj2 (xs2 ), . . . , μAjn (xsn ) .. . Hm = MIN (μAm1 (xs1 ), μAm2 (xs2 ), . . . , μAmn (xsn )) .
In Schritt 2 wird die Ergebnis-Fuzzy-Menge Bj einer jeden aktiven Regel ermittelt, indem die Fuzzy-Menge Bj der Konklusion in der Höhe des minimalen Erfüllungsgrades der Teilprämisse abgeschnitten wird (Inferenz). μB = MIN (H1 , μB1 (y)) 1
μB
j
μBm
.. . = MIN Hj , μBj (y) .. . = MIN (Hm , μBm (y)) .
In Schritt 3 werden dann die Ergebnis-Fuzzy-Mengen aller Regeln im Sinne einer ODER-Verknüpfung unter Verwendung des MAX-Operators zur resultierenden Ergebnis-Fuzzy-Menge für den scharfen Eingangsvektor xs überlagert (Aggregation). 2 3 $ # s (18.7) μres (y) = MAXj=1,...,m MIN MINi=1,...,n μAji (xi ) , μBj (y)
Hj
μ
(y) B j
Eine grafische Darstellung dieser MAX-MIN-Inferenz einschließlich der in Abschnitt 18.4 behandelten Defuzzifizierung ist auf Seite 390 zu finden.
0
1
μ
0
1
μ
-
Füllstand/m 5
0,11 0
1
μ
0
Abfluss/(m3 /h) 5
-
normal
0,11
0,86
MIN
0
1
μ
0
0
6 xs1 =2,18m
Füllstand/m
-
mittel
5
0,58 0
1
μ
0
0,86 0,58
xs2 =2,4m3 /h
Abfluss/(m3 /h) 5
-
normal
MIN
0
1
μ
0
Ventilstellung /%
halb
5
MAX
5
dreiviertel
Ventilstellung /%
R2 : WENN Füllstand = mittel UND Abfluss = normal DANN Ventilst. = halb
0
halbleer
R1 : WENN Füllstand = halbleer UND Abfluss = normal DANN Ventilst. = dreiviertel
0
1
μ
0
?
y s =53,67%
Ventilstellung /%
Defuzzifizierung
5
390 18 Fuzzy-logisches Schließen (Fuzzy-Inferenz)
Abbildung 18.13: Grafische Darstellung des MAX-MIN-Inferenz-Schemas
18.3 Fuzzy-Inferenz
18.3.5
391
Andere Inferenzschemata
Neben der MAX-MIN-Inferenz sind auch andere Inferenzschemata gebräuchlich, die an dieser Stelle kurz angesprochen werden sollen. SUM-Operator. Die Akkumulation mehrerer Regeln (Aggregation) kann anstelle des MAX-Operators auch mit dem SUM-Operator erfolgen. Dabei werden die abgeschnittenen Ergebnis-Fuzzy-Mengen geometrisch addiert. Das Inferenzschema heißt dann SUMMIN-Inferenzschema und ist in Abb. 18.14 dargestellt. R1 : WENN x = halbvoll DANN y = halb µ
16
mittel
halbvoll
µ
16
MAX-MIN
µ
16
halb dreiviertel
halb dreiviertel
MAX x
0 0
y
0 0
0
R2 : WENN x = mittel DANN y = dreiviertel µ
16
mittel
halbvoll
µ
16
y
0
SUM-MIN
µ
16
halb dreiviertel
halb dreiviertel
SUM 0
- 0 x 0 xs R1 : WENN x = halbvoll DANN y = halb
0 µ
16
mittel
halbvoll
µ
16
y
y
0 0
MAX-PROD
µ
16
halb dreiviertel
halb dreiviertel
MAX x
0 0
0 0
y
0
R2 : WENN x = mittel DANN y = dreiviertel µ
16
mittel
halbvoll
µ
16
y
0
SUM-PROD
µ
16
halb dreiviertel
halb dreiviertel
SUM 0 0
s
x
0 0
y
0 0
y
x
Abbildung 18.14: Vergleich verschiedener gebräuchlicher Fuzzy-Inferenzmechanismen mit x als Füllstand und y als Ventilstellung PROD-Operator. Bei der Ermittlung der Ergebnis-Fuzzy-Menge einer Regel (Inferenz) kann der MIN-Operator durch eine Verwendung des algebraischen Produkts
392
18 Fuzzy-logisches Schließen (Fuzzy-Inferenz)
(PROD) ersetzt werden. Die Zugehörigkeitsfunktion der Ergebnis-Fuzzy-Menge einer Regel ist dann das Produkt aus dem Erfüllungsgrad Hj dieser Regel und der AusgangsFuzzy-Menge: μB = H1 · μB1 (y) 1
μBm
.. . = Hm · μBm (y).
Mittels der nachfolgenden MAX-Operation resultiert dann die Ergebnis-Fuzzy-Menge der MAX-PROD-Inferenz zu: 2 3 s μres (y) = MAXj=1,...,m MINi=1,...,n μAji (xi ) · μBj (y) (18.8)
Hj
μB (y) j
Ersetzt man bei der MAX-PROD- bzw. MAX-MIN-Inferenz den MAX-Operator durch den SUM-Operator, bei dem die Ergebnis-Fuzzy-Mengen aufsummiert werden, so resultiert das SUM-PROD- bzw. SUM-MIN-Inferenzschema. Auch diese beiden Inferenzschemata sind in Abb. 18.14 gezeigt. Bezeichnungen. Bei der Auswahl der Bezeichnungsweise dieser Regeln wird in allen Fällen die Verwendung der MIN-Operation bei der UND-Verknüpfung der Teilprämissen nicht ausdrücklich hervorgehoben. Die folgende Tabelle verdeutlicht die Zusammenhänge. Aggregation
Inferenz
MAX SUM MAX SUM
MIN MIN PROD PROD
UND-Verknüpfung der Teilprämissen MIN MIN MIN MIN
Schema ⇒ ⇒ ⇒ ⇒
MAX-MIN SUM-MIN MAX-PROD SUM-PROD
Tabelle 18.2: Ausführliche Darstellung der Inferenzschemata
18.4
Defuzzifizierung
Nachdem für einen Satz von scharfen Eingangsgrößen mithilfe der obigen Inferenzschemata eine Ergebnis-Fuzzy-Menge ermittelt wurde, fehlt noch der Schritt von dieser Ergebnis-Fuzzy-Menge zu einem scharfen Ausgangswert. Nach Vollziehen dieses Schritts s kann dann für jeden Satz von scharfen Eingangsgrößen eine scharfe Ausgangsgröße yres ermittelt werden. Diesen Schritt von der Ergebnis-Fuzzy-Menge zum scharfen Ausgangswert bezeichnet man als Defuzzifizierung.
18.4 Defuzzifizierung
18.4.1
393
Schwerpunktmethode
Schwerpunktmethode. Die im Rahmen der Defuzzifizierung am häufigsten eingesetzte Methode ist die Schwerpunkt-Methode. Hierbei wird zur Ermittlung der scharfen Ausgangsgröße der Flächenschwerpunkt der Ergebnis-Fuzzy-Menge nach der folgenden Formel gebildet: ∞ s yres =
0
y · μres (y) dy
∞
(Schwerpunktmethode).
(18.9)
μres (y) dy
0
Abb. 18.15 zeigt die Vorgehensweise der Ermittlung der Ausgangsgröße nach der Schwerpunktmethode am Beispiel des zuvor untersuchten Füllprozesses in Abschnitt 18.3.3. Die Ergebnis-Fuzzy-Menge ist hierbei die aus zwei trapezförmigen Teil-Fuzzy-Mengen zusammengesetzte Menge. Der Flächenschwerpunkt bei diesem Beispiel liegt bei s y = 53,67. Somit lautet die scharfe Ausgangsgröße yres = " V entilst.s/% = 53,67. μ Ergebnis1 6 Fuzzy-
halb
dreiviertel
Menge 0,58
u
0,11 20
40
60
s yres
?
-
80
100
Ventilst./%
Abbildung 18.15: Ermittlung der scharfen Ausgangsgröße am Beispiel der FuzzyMenge des Füllprozesses Arithmetisches Mittel. Die Ermittlung des exakten Flächenschwerpunktes erfordert die Bestimmung zweier Integrale. Dies kann je nach Form der Ergebnis-Fuzzy-Menge rechenintensiv sein. Eine meist ausreichende Näherung besteht in der Approximation der Integrale durch zwei gewichtete Summen. Jeder Summenanteil setzt sich aus dem Abszissenwert yi des Schwerpunkts der Einzelfläche multipliziert mit dem Erfüllungsgrad Hi der Regel zusammen. Der dabei gemachte Fehler besteht darin, dass die überlappenden Flächenanteile nicht herausgerechnet werden. Die Näherungsformel, auch als arithmetisches Mittel bezeichnet, lautet m s yres =
y i · Hi
i=1 m i=1
(arithmetisches Mittel). Hi
(18.10)
394
18 Fuzzy-logisches Schließen (Fuzzy-Inferenz)
Abb. 18.16 verdeutlicht die Vorgehensweise. Für das oben behandelte Beispiel der zwei s Ergebnismengen halb und dreiviertel lautet dann der scharfe Ergebniswert yres s yres =
y 1 H1 + y 2 H2 = " V entilst.s /% = 53,19. H1 + H 2
μ Ergebnis1 6 Fuzzy-
halb
Menge
H1
H1
6 u ?
H2
dreiviertel
H2
?
6 40 y1 60 y2 80
20
s yres
?
-
100
Ventilst./%
Abbildung 18.16: Schwerpunktberechnung mit der Näherungsformel Weitere aber seltener eingesetzte Verfahren zur Defuzzifizierung bei der Inferenz vom Mamdani-Typ sind • das Bisector-Verfahren, • der Mittelwert der Maxima, • der kleinste Wert der Maxima, und • der größte Wert der Maxima.
18.4.2
Singletons als Ausgangs-Fuzzy-Mengen
Singletons. Besonders einfach wird die Berechnung des scharfen Ausgangswerts, wenn anstelle der dreiecks- oder trapezförmigen Fuzzy-Mengen der Ausgangsgröße Singletons verwendet werden. Abb. 18.17 stellt die linguistische Variable Ventilst. mit ihren 5 linguistischen Termen dar. Um auch die Extremwerte (0 und 100%) der Ausgangsgröße zu erfassen, werden die Fuzzy-Mengen zu und auf auf 0 bzw. 100% gesetzt. μ einviertel r rhalb rdreiviertel rauf 1 r6zu
20
40
60
80
100
-
Ventilst.%
Abbildung 18.17: Ausgangsvariable Ventilst. mit linguistischen Termen als Singletons
18.4 Defuzzifizierung
395
Defuzzifizierung. Als Ergebnis-Fuzzy-Menge für den Füllprozess ergeben sich dann die in den jeweiligen Höhen H1 und H2 abgeschnittenen Singletons der linguistischen Terme halb und dreiviertel (fettgedruckt hervorgehoben in Abb. 18.18).
μ 16
halb
c ErgebnisFuzzyMenge
H1
dreiviertel
c
s H1 s H2
H2
20
40 y1 60 y2 80 s ? yres
-
100 Ventilst./%
Abbildung 18.18: Ergebnis-Fuzzy-Menge für den Füllprozess s Die scharfe Ausgangsgröße yres berechnet sich wieder nach Gleichung 18.10 m s yres =
y i · Hi
i=1 m
. Hi
i=1
Damit ist die scharfe Ausgangsgröße bei Verwendung von Singletons als Fuzzy-Mengen der Ausgangsgröße identisch zu der Ausgangsgröße bei dreiecks- bzw. trapezförmigen Fuzzy-Mengen bei gleichzeitiger Verwendung der Näherungsgleichung zur Schwerpunktberechnung. Aus diesem Grund werden bei vielen industriellen Fuzzy-Reglern Singletons als Fuzzy-Mengen der Ausgangsgröße verwendet. Weitere Verfahren. Neben der obigen Methode der Defuzzifizierung, die auch als gewichteter Durchschnitt, Schwerpunkt- oder Höhenmethode bezeichnet wird, ist bei Singletons als Ausgangs-Fuzzy-Menge auch die Methode der gewichteten Summe gebräuchlich. Dabei entfällt die Normierung über der Summe der Erfüllungsgrade. Die Inferenzmethoden bei Verwendung von Singletons werden allgemein auch als Inferenz vom Sugeno-Typ [67] bezeichnet, im Unterschied zur Inferenz vom Mamdani-Typ [51], [52], die das Thema des Abschnitts 18.3 bildet. Die allgemeine Form einer Regel bei der Inferenz vom Sugeno-Typ lautet R : WENN x1 = A1 UND x2 = A2 DANN y = a · x1 + b · x2 + c
(18.11)
mit a, b, c als vorgebbare Konstanten. Die zu Beginn dieses Abschnitts betrachtete Darstellung mit einem Singleton (an einer festen Position) als Ausgangs-Fuzzy-Menge ist in dieser allgemeinen Regel enthalten. In der allgemeinen Form der Regel nach Gleichung 18.11 wird quasi die Position eines Singletons abhängig von den Erfüllungsgraden der Teilprämissen der Regel festgelegt (moving singleton).
396
18 Fuzzy-logisches Schließen (Fuzzy-Inferenz)
Aufgabe 18.1: Gegeben seien die folgenden Fuzzy-Mengen: μx 6
klein
mittel
μy
groß
1
0
1
50
100
x 200
150
6
0
klein
mittel
groß
20
40
60
y 80
Abbildung 18.19: Fuzzy-Mengen von Eingang x und Ausgang y
Ferner gelten die folgenden Regeln: WENN x = klein DANN y = klein WENN x = mittel DANN y = mittel WENN x = groß DANN y = groß 1. Gegeben seien die fünf scharfen Eingangswerte xs = {50; 60; 75; 90; 100} (a) Ermitteln Sie mittels der MAX-MIN-Inferenz und der Schwerpunktmethode die Werte der scharfen Ausgangsvariable y s . (b) Ermitteln Sie mittels der SUM-MIN-Inferenz und der Schwerpunktmethode die Werte der scharfen Ausgangsvariable y s . (c) Ermitteln Sie mittels der MAX-PROD-Inferenz und der Schwerpunktmethode die Werte der scharfen Ausgangsvariable y s . (d) Ermitteln Sie mittels der SUM-PROD-Inferenz und der Schwerpunktmethode die Werte der scharfen Ausgangsvariable y s . 2. Die Ausgangs-Fuzzy-Mengen werden nun durch Singletons an den Positionen 20, 40 und 60 ersetzt. Ermitteln Sie wiederum die Werte der scharfen Ausgangsvariablen y s für die angegebenen scharfen Eingangswerte und Defuzzifizierung nach der gewichteten Summe. Lösung:
1.
(a) (b) (c) (d)
MAX-MIN: MAX-PROD: SUM-MIN: SUM-PROD:
ys ys ys ys
= {20; = {20; = {20; = {20;
24,8; 30; 35,2; 40} 23,2; 30; 36,7; 40} 25,5; 30; 34,5; 40} 24; 30; 36; 40}
2. Gew. Summe y s = {20; 24; 30; 36; 40}
18.4 Defuzzifizierung
397
Aufgabe 18.2: Gegeben seien die folgenden Fuzzy-Mengen: μx 1 6
klein
μx 2 6
groß
mittel
1
klein
mittel
groß
20
40
60
1
0
50
100
x1 200
150
0
x2 80
Abbildung 18.20: Fuzzy-Mengen der Eingänge x1 und x2
µy
6 1 sehr klein klein
10
20
mittel
groß
sehr groß
30
40
50
-
60 y
Abbildung 18.21: Ausgangs-Fuzzy-Mengen y Es gelte die folgende Relationsmatrix Eingang x2
Eingang x1
klein
mittel
groß
klein
mittel
groß
sehr groß
mittel
klein
mittel
groß
groß
sehr klein
klein
mittel
1. Ermitteln Sie für die folgenden scharfen Eingangswerte xs1 = 60 und xs2 = {25, 30; 35} die scharfen Ausgangswerte y s für die nachfolgenden Inferenzmethoden bei Defuzzifizierung nach der Schwerpunktmethode: (a) MAX-MIN-Methode, (b) MAX-PROD-Methode,
398
18 Fuzzy-logisches Schließen (Fuzzy-Inferenz) (c) SUM-MIN-Methode, (d) SUM-PROD-Methode.
2. Es werden als Ausgangs-Fuzzy-Mengen nun Singletons an den Positionen 10; 20; 30; 40; und 50 verwendet und bei der Defuzzifizierung wird die gewichtete Summe eingesetzt. Wie lauten nun die scharfen Ausgangswerte für die obigen Eingangswerte? Lösung:
1.
(a) (b) (c) (d)
MAX-MIN: MAX-PROD: SUM-MIN: SUM-PROD:
ys ys ys ys
= {30,5; = {30,4; = {30,4; = {30,4;
32,4; 32,8; 31,8; 32,1;
2. Gew.- Summe : y s = {30,5; 33; 35,5}
34,1} 35,1} 32,8} 33,9}
19
Grundlagen der FuzzyRegelung (Fuzzy-Control)
19.1
Struktur eines Fuzzy-Reglers
Statischer Fuzzy-Regler. Das in Abschnitt 18 entwickelte Schema der Fuzzy-Inferenz stellt den Kern eines Fuzzy-Reglers dar. Die wesentlichen Elemente dieses Kerns sind nachfolgend zusammengestellt.
1. Zugehörigkeitsfunktionen der Eingangsgrößen: Es mögen n Eingangsgrößen x1 . . . xn vorliegen. Diese n Eingangsgrößen stellen n linguistische Variable (Signalkanäle) dar, für die linguistische Terme festzulegen sind. Die einzelnen linguistischen Terme werden als Fuzzy-Mengen mit einer im Allgemeinen dreiecks- oder trapezförmigen Zugehörigkeitsfunktion definiert. Die Anzahl der linguistischen Terme pro Signalkanal liegt häufig zwischen 2 und 7.
2. Fuzzifizierung: Für n scharfe Eingangsgrößen xs1 . . . xsn werden im Rahmen der Fuzzifizierung die Zugehörigkeitsgrade zu den einzelnen Fuzzy-Mengen ermittelt. Für jeden einzelnen Signalkanal wird dabei ein Vektor von Zugehörigkeitsgraden zu den Fuzzy-Mengen der jeweiligen linguistischen Terme festgelegt. Dieser Schritt wird als Fuzzifizierung der Eingangsgrößen bezeichnet.
3. Satz von WENN-DANN-Regeln (Regelbasis): Für die Weiterverarbeitung der „fuzzifizierten“ Eingangsgrößen ist ein Satz von m WENN-DANN-Regeln (Regelbasis) aufzustellen: R1 : .. .
WENN x1 = A11
UND . . .
UND xn = A1n
DANN y = B1
Rj : .. .
WENN x1 = Aj1
UND . . .
UND xn = Ajn
DANN y = Bj
Rm :
WENN x1 = Am1
UND . . .
UND xn = Amn
DANN y = Bm .
400
19 Grundlagen der Fuzzy-Regelung (Fuzzy-Control) Hierin sind x1 , x2 , . . . , xn A11 , . . . , Aji , . . . , Amn y B1 , B2 , . . . , Bm
die die die die
Eingangsgrößen der Regeln, linguistischen Terme der Eingangsgrößen xi , Ausgangsgröße der Regelbasis, und linguistischen Terme der Ausgangsgröße.
4. Fuzzy-logisches Schließen (MAX-MIN-Inferenz): Die Ermittlung der Fuzzy-Mengen der Ausgangsgröße y erfolgt nach einem Inferenzschema, wobei hier meist die MAX-MIN-Inferenz zugrunde gelegt wird (siehe Abschnitt 18.3.4). In Schritt 1 wird der Erfüllungsgrad Hi einer jeden aktiven Regel (Hi > 0) unter Verwendung des MIN-Operators für die Auswertung der UND-Verknüpfung der Teil- prämissen jeder Regel ermittelt. In Schritt 2 wird die Ergebnis-Fuzzy-Menge Bj jeder aktiven Regel ermittelt, indem die Fuzzy-Menge Bj der Konklusion in der Höhe des minimalen Erfüllungsgrades der Teilprämisse abgeschnitten wird. In Schritt 3 werden dann die Ergebnis-Fuzzy-Mengen aller Regeln im Sinne einer ODER-Verknüpfung unter Verwendung des MAX-Operators zur resultierenden Ergebnis-Fuzzy-Menge für den scharfen Eingangsvektor xs überlagert. 5. Defuzzifizierung: Den Vorgang der Berechnung einer scharfen Ausgangsgröße y s aus der Ergebnis-Fuzzy-Menge bezeichnet man als Defuzzifizierung. Üblich ist hierbei häufig die Bestimmung von y s als Flächenschwerpunkt der ErgebnisFuzzy-Menge. Die anschließende grafische Darstellung veranschaulicht die obige Aufstellung. Fuzzifizierung
xs1
- 6 -
.. . xsn
.. .
Regelbasis
- WENN .. UND .. DANN .. .. .
- 6 -
Defuzzifizierung
-
6 -
ys -
- WENN .. UND .. DANN ..
Abbildung 19.1: Schematische Darstellung des Kerns eines Fuzzy-Reglers Die Eingangsgrößen in den Kern des Fuzzy-Reglers sind xs1 . . . xsn . Es wird angenommen, dass n Messgrößen im Regelkreis vorliegen, die vom Fuzzy-Regler verarbeitet werden1 . In der klassischen Regelungstechnik wird im Allgemeinen nur von einer Eingangsgröße in den Regler ausgegangen. Abb. 19.2 zeigt den Standardregelkreis mit FR (s) und FS (s) 1
Nachfolgend wird der hochgestellte Index “ s “ für scharfe Ein- und Ausgangsgrößen nur dann verwendet, wenn diese Eigenschaft besonders hervorgehoben werden soll.
19.1 Struktur eines Fuzzy-Reglers
401 z
w x - i d- FR (s) − 6
− y ? - i - FS (s)
x -
Abbildung 19.2: Standardregelkreis als Übertragungsfunktionen von Regler und Strecke. Weiterhin sind x, y, w und z die Regel-, Stell-, Führungs- und Störgröße, und xd wird als Regeldifferenz bezeichnet. Die nähere Betrachtung des Kerns des Fuzzy-Reglers zeigt, dass eine statische Signalverarbeitung vorliegt. Geht man z. B. von nur einer Eingangsgröße x1 aus, so wird für den scharfen Messwert xs1 dieser Eingangsgröße nach dem vorgestellten Schema der scharfe Wert y s der Ausgangsgröße ermittelt. Man kann somit eine Tabelle aufstellen, in der für alle scharfen Werte der Eingangsgröße xs1 die zugehörigen scharfen Werte y s der Ausgangsgröße gegenübergestellt werden. Ist der Zusammenhang zwischen xs1 und y s linear, dann liegt ein klassischer P-Regler vor. Andernfalls liegt ein nichtlinearer Zusammenhang vor, der durch eine Kennlinie beschrieben werden kann. Hierauf wird im Abschnitt 19.3 noch ausführlich eingegangen. Weder beim linearen noch beim nichtlinearen Zusammenhang von x1 und y weist der Regler ein dynamisches Verhalten auf. Die Eingangsgröße wird weder integriert noch differenziert. Es liegt ein rein statisches Übertragungsverhalten vor. Diese fehlende Dynamik muss dem Fuzzy-Regler durch eine Integration oder Differentiation der Eingangsgröße aufgeprägt werden. Dynamischer Fuzzy-Regler. Es sei nun e = " xd die Eingangsgröße in den FuzzyRegler. Diese Eingangsgröße wird über drei Kanäle dem Kern des Fuzzy-Reglers zugeführt und hierbei in Kanal 2 und 3 jeweils integriert bzw. differenziert. Die sich ergebende Gesamtstruktur des Fuzzy-Reglers mit Dynamik zeigt Abb. 19.3. Fuzzy-Regler mit Dynamik Dynamik
e
KP
- KI dt
d - KD · dt
Fuzzifizierung
x1- 6 x2- 6
x3- 6
-
-
-
Regelbasis
- WENN .. UND .. DANN .. -
.. .
Defuzzifizierung
- 6
-
y -
WENN .. UND .. - DANN ..
Abbildung 19.3: Fuzzy-Regler mit zusätzlicher Dynamisierung des Eingangssignals e
402
19 Grundlagen der Fuzzy-Regelung (Fuzzy-Control)
Der Fuzzy-Regler von Abb. 19.3 mit beliebigem statischen oder dynamischen Verhalten wird in Regelkreisen symbolisch durch einen Block mit drei Fuzzy-Mengen dargestellt. Abb. 19.4 zeigt einen Standardregelkreis mit Fuzzy-Regler. Fuzzy-Regler
w x - i d− 6
19.2
z − y ? - i - FS (s)
x -
Abbildung 19.4: Standardregelkreis mit Fuzzy-Regler
Entwurf eines Fuzzy-Reglers
Beim Entwurf und der Analyse des Übertragungsverhaltens von Fuzzy-Reglern sind im Allgemeinen die in den nachfolgenden Abschnitten behandelten Aufgaben zu bearbeiten.
19.2.1
Festlegung der Ein- und Ausgangsgrößen
Methodik. Die Auswahl der Ein- und Ausgangsgrößen wird wesentlich durch das zu regelnde System vorbestimmt. Bei einer Eingrößenregelung ist wie in der klassischen Regelung die Regelgröße zu messen, mit dem Sollwert zu vergleichen und als Eingangsgröße in den Regler zu führen. Wird ein Übertragungsverhalten ähnlich wie beim klassischen PID-Regler angestrebt, dann muss in einem Dynamikteil des Fuzzy-Reglers eine Integration und/oder Differentiation des Eingangssignals ergänzt werden. Bei Vorhandensein weiterer gemessener Hilfsgrößen können diese als zusätzliche Eingangssignale mit verarbeitet werden. Bei einer Mehrgrößenregelung werden in gleicher Art und Weise die Signale wie bei der Eingrößenregelung, aber nun mehrkanalig, verarbeitet. Die Ausgangsgröße des Fuzzy-Reglers wirkt, gegebenenfalls über einen Wandler, auf das Stellglied zur Beeinflussung der Regelstrecke. Diese Baugruppen sind im Allgemeinen durch die Physik der Regelstrecke festgelegt.
19.2.2
Wertebereich der Ein- und Ausgangssignale
Methodik. Der Wertebereich der Eingangssignale in den Fuzzy-Regler wird durch den Messbereich der Messgeräte der Regelgröße(n) bestimmt. Der Wertebereich der linguistischen Variablen Eingangssignal muss den gesamten Messbereich überdecken. Es besteht in der Praxis kein Unterschied zur klassischen Regelungstechnik. Hier hat man allenfalls beim Entwurf diesen Aspekt weniger stark beachtet. Der Wertebereich des Ausgangssignals des Fuzzy-Reglers wird durch den Arbeitsbereich des Stellgliedes bestimmt. Das Ausgangssignal vom Fuzzy-Regler muss den Signalbereich vom Eingang des Stellgliedes überdecken. Begrenzungen des Stellgliedes sind zu
19.2 Entwurf eines Fuzzy-Reglers
403
beachten. Zusätzliche Begrenzungen können, wie später gezeigt wird, einfach realisiert werden.
19.2.3
Definition der linguistischen Terme
Definitionen. In der Fuzzy-Regelung wird weitgehend mit dreiecks- und trapezförmigen Fuzzy-Mengen gearbeitet. Dabei legt man meist an die Ränder des Wertebereichs trapezförmige Fuzzy-Mengen und in das Innere dreiecksförmige Fuzzy-Mengen. Um die Zahl der aufzustellenden Regeln überschaubar zu halten, beschränkt man sich in der Praxis je Eingangskanal auf 2 bis maximal 7 linguistische Terme. Zur Vereinfachung werden die Fuzzy-Mengen (linguistischen Terme) häufig mit den englischen Bezeichnungen NB (negativ big), NS (negativ small), Z (zero), PS (positiv small) und PB (positiv big) versehen, sodass im Fall von fünf Termen jede Eingangsgröße xi durch die folgenden Fuzzy-Mengen spezifiziert ist: μ 1 6
-100
NB
NS
-50
Z
0
PS
50
PB
100
-
Eingang/%
Abbildung 19.5: Standardisierte linguistische Terme eines Eingangssignals Erstreckt sich der Signalbereich des betreffenden Signals einseitig von 0 bis 100 % so werden die Bezeichnungen Z (zero), S (small), M (medium), B (big) und H (huge) für die linguistischen Terme häufig verwendet. Die linguistischen Terme der Ein- und Ausgangsgrößen werden in der oben dargestellten Normierung gewählt. Bei der Wahl gemäß Abb. 19.5 tritt bei der Fuzzifizierung das Problem auf, dass der Eingangssignalbereich nicht komplett überdeckt wird. Für scharfe Eingangswerte |xsi | > 80 % bleibt der Zugehörigkeitsgrad konstant bei 1. Wenn dieses Verhalten nicht erwünscht ist, muss der Bereich des Signalkanals rechts und links entsprechend erweitert werden (siehe Abb. 19.6). Auch bei der Defuzzifizierung tritt ein nichtideales Verhalten auf, wenn Fuzzy-Mengen gemäß Abb. 19.5 vorliegen. Bei Verwendung der Schwerpunktmethode zur Defuzzifizierung kann der scharfe Ausgangswert y s nie ±100 % erreichen. Abhilfe bietet auch hier die Ausdehnung der Rand-Fuzzy-Mengen über die ±100 %-Grenze hinaus an, wie in Abb. 19.7 gezeigt. Um eine gleiche Empfindlichkeit für alle Eingangssignale zu erreichen, sind die Bereichsgrenzen sorgfältig zu wählen und an die Messbereiche geeignet anzupassen.
404
19 Grundlagen der Fuzzy-Regelung (Fuzzy-Control) μ
μ
16
16
-100
-
-80 6 xsi
Eingang/%
6
-120 -100
xsi
Eingang/%
Abbildung 19.6: Fuzzy-Mengen des Eingangssignals ohne (linke Abb.) und mit (rechte Abb.) Bereichserweiterung μ
μ
16
16
t -100
t Ausgang/%
y ?
s
-100
y ?
s
Ausgang/%
Abbildung 19.7: Fuzzy-Mengen des Ausgangssignals ohne (linke Abb.) und mit (rechte Abb.) Bereichsanpassung
19.2.4
Aufstellen der WENN-DANN-Regeln
Vorgehensweise. Die Anzahl der WENN-DANN-Regeln ist durch die Anzahl der Terme der linguistischen Variablen vorbestimmt. Für p linguistische Terme und m Eingangsgrößen existieren maximal r = pm mögliche Regeln. Die Erstellung der Regeln für einen Fuzzy-Regler erfolgt meist auf der Basis einer ingenieurmäßigen Analyse des zu regelnden Prozesses. Sehr bewährt hat sich die Darstellung der Regeln in einer Relationsmatrix. Dies soll nachfolgend am Beispiel der Füllstandsregelung, die in Abschnitt 18 untersucht wurde, gezeigt werden. Bei der Anwendung Füllstandsregelung liegen die Eingangsgrößen Füllstand und Abfluss und die Ausgangsgröße Ventilstellung vor. Die Grenzen der Ein-/Ausgangsgrößen liegen alle zwischen Null und einem Maximalwert. Daher bietet sich die Normierung mit den Bezeichnungen Z (zero), S (small), M (medium), B (big) und H (huge) für die linguistischen Terme an. Ziel der Regelung möge es sein, für jede mögliche Abflussmenge einen mittleren Füllstand des Behälters zu gewährleisten. Die Regelbasis für den Füllprozess kann besonders übersichtlich z. B. in Form der in Tab. 19.1 gezeigten Relationsmatrix dargestellt werden. Zu Element (1, 1) der Relationsmatrix gehört die Regel: WENN
x1 = Z
UND
x2 = Z
DANN
y = M.
19.3 Kennlinien von Fuzzy-Reglern
405
x2 = " Abfluss Z
S
M
B
H
Z
M
B
H
H
H
x1 = "
S
S
M
B
H
H
Füll-
M
Z
S
M
B
H
stand
B
Z
Z
S
M
B
H
Z
Z
Z
S
M
Tabelle 19.1: Regelbasis in Form einer Relationsmatrix Entsprechend lauten beispielsweise die Regeln zu Element (2, 3) oder (3, 5): WENN WENN
x1 = S x1 = M
UND UND
x2 = M x2 = H
DANN DANN
y=B y = H.
Die Eingabe der Regeln in die Fuzzy-Software lässt häufig die Eingabeformen Relationsmatrix und WENN-DANN-Regeln zu. Die interne Verarbeitung der Regeln lehnt sich jedoch an die tabellarische Datenverarbeitung, wie in der Relationsmatrix realisiert, an. Form und Bereiche der Fuzzy-Mengen der linguistischen Terme der Ein- und Ausgangsgrößen sind in Anlehnung an die Empfehlungen der vorangehenden Abschnitte zu wählen.
19.2.5
Fuzzy-Mengen der Ausgangsgröße
Als Fuzzy-Mengen der Ausgangsgröße können wie bei den Eingangsgrößen dreiecks- und/oder trapezförmige Fuzzy-Mengen gewählt werden. Bei der Analyse des Übertragungsverhaltens des Fuzzy-Reglers hat sich jedoch gezeigt, dass die Form der FuzzyMenge nur einen geringen Einfluss auf das Übertragungsverhalten hat. Aus Rechenzeitgründen werden daher bei vielen industriellen Fuzzy-Reglern bei der Ausgangsgröße Singletons verwendet. Dabei entfällt die relativ aufwändige „exakte“ Schwerpunktberechnung. Die Berechnung der scharfen Ausgangsgröße erfordert nur die einfache Auswertung einer gewichteten Summe.
19.3
Kennlinien von Fuzzy-Reglern
Grundlagen. Nach den Ausführungen zur allgemeinen Struktur eines Fuzzy-Reglers in Abschnitt 19.1 und den Empfehlungen für die Festlegung der Fuzzy-Mengen und
406
19 Grundlagen der Fuzzy-Regelung (Fuzzy-Control)
der WENN-DANN-Regeln soll nun das Übertragungsverhalten von Fuzzy-Reglern näher untersucht werden. Zu diesem Zweck wird ein einfacher Fuzzy-Regler mit einer Eingangsgröße e = " x1 und einer Ausgangsgröße y betrachtet. Abb. 19.8 zeigt die FuzzyMengen der Ein- und Ausgangsgröße. Die bei diesem Fuzzy-Regler zugrunde gelegten WENN-DANN-Regeln lauten
WENN WENN WENN
1 N
DANN DANN DANN
e=N e=Z e=P
y=N y=Z y = P.
μ
6
1 P
N
Z
-1
μ
6
P
Z
1
-
-1
Eingang
1
-
Ausgang
Abbildung 19.8: Fuzzy-Mengen der Ein- (linke Abb.) und Ausgangsgröße (rechte Abb.)
Als Relationsmatrix (mit nur einer Zeile) resultiert für die obigen WENN-DANN-Regeln die Relationsmatrix von Tabelle 19.2. e= " Eingang
y= " Ausgang
N
Z
P
N
Z
P
Tabelle 19.2: Relationsmatrix des einfachen Fuzzy-Reglers Die Verarbeitung der Regeln im Rahmen des Inferenzschemas soll nach der MAX-MINInferenz erfolgen. Zur Ermittlung der scharfen Ausgangsgröße soll die Schwerpunktmethode verwendet werden. Da in dem betrachteten Fuzzy-Regler kein Integrator oder ein Differenzierglied eingebaut ist, kann sein Übertragungsverhalten durch eine statische Kennlinie (Abb. 19.9) beschrieben werden.
19.3 Kennlinien von Fuzzy-Reglern
407 y
1
-2
6
relevanter Bereich
-1
1
-
2 e
-1
Abbildung 19.9: Kennlinie des einfachen Fuzzy-Reglers mit hervorgehobenem Übertragungsbereich von ±1 An dieser Kennlinie sind drei Punkte hervorzuheben: 1. In den drei Bereichen −0,2 ≤ e ≤ +0,2 sowie −1 ≤ e ≤ −0,8 und 0,8 ≤ e ≤ 1 bleibt die Ausgangsgröße y konstant auf ihrem jeweiligen Wert Null bzw. ±1. Die Ursache hierfür liegt darin, dass die linguistischen Terme der Eingangsgröße e in diesen Bereich sich nicht überlappen. Folglich ist nur eine WENN-DANN-Regel aktiv, und die Schwerpunktmethode bei der Defuzzifizierung liefert als scharfen Ausgangswert den Mittelwert der jeweiligen Fuzzy-Menge. 2. In den Bereichen, in denen sich die linguistischen Terme der Eingangsgröße überlappen, sind immer zwei Regeln aktiv. Folglich verändert sich bei Variation der scharfen Eingangsgröße es der Erfüllungsgrad der aktiven Regeln und die scharfe Ausgangsgröße y s folgt dieser Veränderung der Eingangsgröße monoton. Allerdings ist bei genauerer Analyse des Kurvenverlaufs zu erkennen, dass zwischen y s und es kein linearer Verlauf auftritt. Die Kurve verläuft in Form einer schwach gekrümmten S-Kurve. 3. Die Kennlinie hat starke Ähnlichkeit mit der Kennlinie eines „Dreipunktreglers mit stetigen Übergängen“. Zwei- und Dreipunktregler. Verändert man die Fuzzy-Mengen der Eingangsgröße so, dass sie sich nicht überlappen, so resultiert als Kennlinie des Fuzzy-Reglers die eines Dreipunktreglers (siehe Abb. 19.10). Lässt man die Fuzzy-Menge Zero im Eingangskanal weg bei unveränderter Beibehaltung der Ausgangs-Fuzzy-Mengen, so resultiert die Kennlinie eines Zweipunktreglers mit Hysterese. Allerdings muss hierbei zusätzlich vereinbart werden, dass das Inferenz-Schema im Fall eines nicht durch eine Fuzzy-Menge abgedeckten Bereichs der Eingangsgröße (hier für −0,5 ≤ e ≤ +0,5) den alten Wert der Ausgangsgröße y beibehält. Abb. 19.11 zeigt die Eingangs-Fuzzy-Mengen und die Kennlinie des Zweipunktreglers mit Hysterese. Lässt man die Fuzzy-Mengen P oder N der Ein- und Ausgangsgröße von Abb. 19.10 weg, so resultiert die Kennlinie des Zweipunktreglers ohne Hysterese.
408
19 Grundlagen der Fuzzy-Regelung (Fuzzy-Control) 1
a)
N
μ
6
P
Z y
-1
-
1
6
c)
1
Eingang e
e
1 b)
N
μ
6
-
-1
1
P
Z -1 -1
-
1
Ausgang y
Abbildung 19.10: Fuzzy-Mengen der Eingangsgröße (Abb. a), Ausgangsgröße (b) und Kennlinie des Fuzzy-Reglers mit Dreipunktregler-Kennlinie (c)
y
a)
1 N
b)
μ
6
6 1
P
?
-e
-1 -1
1
-
Eingang e
6
1
-1
Abbildung 19.11: Eingangsgröße (Abb. a) und Kennlinie (Abb. b) des Fuzzy-Reglers “Zweipunktregler mit Hysterese“
P-Regler mit Begrenzung. Bei vollständiger Überlappung der Fuzzy-Mengen der Eingangsgröße resultiert dagegen näherungsweise die Kennlinie eines P-Reglers mit Begrenzung (Abb. 19.12). Die Steigung der Kennlinie ist jedoch nicht konstant, sie schwankt geringfügig um den Wert +45◦. Ändert man die Ausgangs-Fuzzy-Mengen in Singletons an den Positionen −1, 0 und +1, so geht die Kennlinie des Fuzzy-P-Reglers in eine Gerade mit konstanter Steigung +45◦ über (siehe Abb. 19.13).
19.3 Kennlinien von Fuzzy-Reglern a)
1 N
409
μ
6
P
Z y
-1
1
1 b)
N
-
1
Eingang e
μ
6
6
c)
-e
-1
1
P
Z -1 -1
1
-
Ausgang y
Abbildung 19.12: Eingangsgröße (Abb. a), Ausgangsgröße (b) und Kennlinie des Fuzzy-Reglers mit P-Regler-Kennlinie (c) a)
1 N
μ
6
P
Z y
-1
b)
N
1
t
1
μ
t6
-
6
c)
1
Eingang e
-e
-1
tP
1
Z -1 -1
1
-
Ausgang y
Abbildung 19.13: Fuzzy-Mengen der Eingangsgröße (Abb. a), Ausgangsgröße (b) und Kennlinie (c) des Fuzzy-Reglers mit P-Regler-Kennlinie (mit konstanter Steigung) Kennlinien unterschiedlicher Steigung lassen sich erreichen durch eine Verbreiterung der Überlappungszonen, wie Abb. 19.14 zeigt. Die vier WENN-DANN-Regeln für diesen Fuzzy-Regler lauten:
WENN WENN WENN WENN
e e e e
= = = =
NB NS Z P
DANN DANN DANN DANN
y y y y
= = = =
NB NS Z P
410
19 Grundlagen der Fuzzy-Regelung (Fuzzy-Control) 1 a)
NB
NS
μ
6
P
Z y
-2
-1
1
-
2
c)
6 2
Eingang e 1 e
t
b) NB
NS
t
1
μ
t6
t
-
-2
2
P
Z -2 -2
-1
1
-
Ausgang y
Abbildung 19.14: Fuzzy-Regler mit einer Kennlinie mit zwei unterschiedlichen Steigungen Die unterschiedliche Steigung der Kennlinie bedeutet, dass dieser Fuzzy-Regler unterschiedliche Verstärkungen des Eingangssignals bewirkt. Für negative Eingangssignale e beträgt der Verstärkungsfaktor Kn = 1 und für positive Eingangssignale Kp = 0,5.
19.4
Fuzzy-PD-Regler
Herleitung. Der klassische PD-Regler verstärkt und differenziert das ihm zugeführte Eingangssignal. Die ihn beschreibende Differentialgleichung lautet de(t) de(t) y(t) = KP · e(t) + KD · = KP · e(t) + TV · , (19.1) dt dt mit KP , KD als Verstärkungsfaktoren und TV als Vorhaltzeit. Die Struktur des FuzzyPD-Reglers wird in Anlehnung an Abb. 19.3 aufgebaut. Zur Implementierung von Verstärkungsfaktoren werden in die Blöcke vor dem Kern des Fuzzy-Reglers die betreffenden Verstärkungsfaktoren KP und KD eingefügt. Damit resultiert die in Abb. 19.15 dargestellte Struktur des PD-Reglers. Eine Skalierung des Eingangssignals (z. B. ×0,1) auf den Bereich der Eingangs-Fuzzy-Mengen und anschließende Rückskalierung (×10) am Ausgang kann ebenso durchgeführt werden. Für die Analyse des Übertragungsverhaltens dieses PD-Reglers wird zur Vereinfachung von den in Abb. 19.16 dargestellten Termen der Eingangsgrößen x1 = KP · e und x2 = KD · de(t)/dt ausgegangen. Der Signalbereich von x1 und x2 sei begrenzt auf den Wertebereich −1 ≤ x1 , x2 ≤ +1. Es bedeuten wie zuvor P (positiv), Z (zero) und N (negativ) als Bezeichnungen der Fuzzy-Mengen. Die Fuzzy-Mengen des Ausgangssignals y sind ebenfalls dreiecksförmige Fuzzy-Mengen, die sich von −3 bis +3 erstrecken. Dadurch ist gewährleistet, dass im Signalbereich von
19.4 Fuzzy-PD-Regler
411 Fuzzy-PD-Regler
x1- 6
- KP
Regelbasis
Fuzzifizierung
Dynamik
-
e
- WENN .. UND .. DANN ..
Defuzzifizierung
- 6
.. . -
x2- 6
d KD dt
-
-
y -
- WENN .. UND .. DANN ..
Abbildung 19.15: Struktur des Fuzzy-PD-Reglers μ
N
1
μ
6
P
N
Z
-1
1
6
P
Z
0
1
x1
-1
0
1
x2
Abbildung 19.16: Eingangs-Fuzzy-Mengen des Fuzzy-PD-Reglers
−2 bis +2 annähernd lineare Übertragungseigenschaften vorliegen. Abb. 19.17 zeigt die zugehörigen Fuzzy-Mengen. μ
-3
NB
NS
-2
-1
1 Z
0
6 PS
PB
1
2
3
y
Abbildung 19.17: Ausgangs-Fuzzy-Mengen des Fuzzy-PD-Reglers Die Verknüpfung der Eingangs- und Ausgangs-Fuzzy-Mengen geschieht über die in Tab. 19.3 angegebene Relationsmatrix. Zur Erläuterung dieser Relationsmatrix sollen einige der implementierten WENN-DANNRegeln näher betrachtet werden. So gehören z. B. zu Elementen von Zeile 1 die Regeln:
412
19 Grundlagen der Fuzzy-Regelung (Fuzzy-Control)
KD · de/dt = " x2
KP · e = " x1
N
Z
P
N
NB
NS
Z
Z
NS
Z
PS
P
Z
PS
PB
Tabelle 19.3: Relationsmatrix des Fuzzy-PD-Reglers
R 1.1: R 1.2: R 1.3:
WENN KP · e = N UND KD · de/dt = N DANN y = N B WENN KP · e = N UND KD · de/dt = Z DANN y = N S WENN KP · e = N UND KD · de/dt = P DANN y = Z .
Wenn die Fuzzy-Mengen der Regeldifferenz e und deren Ableitung e˙ beide negativ sind, dann soll die Fuzzy-Menge der Stellgröße y NB (negativ-big) sein. Ist nur e negativ und e˙ dagegen Z (zero), dann soll die Fuzzy-Menge der Stellgröße NS (negativ-small) sein. Besitzen die Fuzzy-Mengen von e und e˙ dagegen unterschiedliche Vorzeichen, dann soll die Fuzzy-Menge der Stellgröße Z (zero) sein. Entsprechend sind die Regeln der anderen Zeilen zu interpretieren. Während man das Übertragungsverhalten der Fuzzy-Regler mit je einer Ein- und einer Ausgangsgröße durch eine Kennlinie darstellen kann, so lässt sich das Übertragungsverhalten eines Fuzzy-Reglers mit zwei Eingangsgrößen und einer Ausgangsgröße entsprechend dann durch eine Kennfläche darstellen. Die Kennflächen derartiger FuzzyRegler sollen nachfolgend näher betrachtet werden. Hierbei sind auch das verwendete Inferenzschema und die angewendete Defuzzifizierungsmethode zu beachten. MAX-MIN-Inferenzmethode und Defuzzifizierung mittels der Schwerpunktmethode. Als Ergebnis dieser Kombination resultiert für die Ein- und AusgangsFuzzy-Mengen nach Abb. 19.16, 19.17 und der Relationsmatrix nach Tab. 19.3 die in Abb. 19.18 dargestellte Kennfläche. Die dreiachsige Darstellung der Kennfläche zeigt in der Horizontalen die Eingangssignale x1 = KP · e und x2 = KD · de/dt, und in der Vertikalen das Ausgangssignal y. Wie beim klassischen PD-Regler resultieren, wenn sowohl e und e˙ positiv sind, dann auch positive Stellsignale. Entsprechendes gilt umgekehrt für negative Signale von e und e. ˙ Die Kennfläche in Abb. 19.18 ist leicht gewellt. Dies ist wie im Eingrößenfall (ein Eingang, ein Ausgang) auf die MIN-Operation für die Implementierung der UNDVerknüpfung der Teilprämissen der Eingangssignale zurückzuführen. Die Überlappung der Fuzzy-Mengen des Ausgangssignals ist hierbei von untergeordneter Bedeutung.
19.4 Fuzzy-PD-Regler
413
2 1.5 1 0.5
y
0 −0.5 −1 −1.5 −2 1 1
0.5 0.5
0 0
x2
−0.5
−0.5 −1
x1
−1
Abbildung 19.18: Kennfläche des Fuzzy-PD-Reglers — MAX-MIN-Inferenz und Defuzzifizierung nach der Schwerpunktmethode
MAX-MIN-Inferenzmethode und Singletons als Ausgangs-Fuzzy-Mengen. Anstelle der dreiecksförmigen Ausgangs-Fuzzy-Mengen werden nun Singletons gewählt. Die verwendeten Singletons zeigt Abb. 19.19.
NB
-3
-2
t NS t
-1
μ
1 Z
0
t PS t PB t 6
1
2
3
y
Abbildung 19.19: Ausgangs-Fuzzy-Mengen des PD-Reglers
Als Inferenzmethode wird wie zuvor die MAX-MIN-Inferenz verwendet. Die Defuzzifizierung für diese Ausgangs-Fuzzy-Mengen geschieht mittels des gewichteten Durchschnitts, der nach Gleichung 18.10 berechnet wird. Als Ergebnis dieser Kombination resultiert die in Abb. 19.20 dargestellte Kennfläche. Der Einfluss des Singletons als Ausgangs-Fuzzy-Mengen ist relativ gering. Dies bestätigt die schon in Kapitel 18 gemachte Aussage, dass die Überlappung der Ausgangs-FuzzyMengen praktisch keinen Einfluss auf die Übertragungskennlinie aufweist. Die Ränder der Kennfläche und die Mittenlinien für x1 bzw x2 sind nun exakte Geraden. Dazwischen bleibt die Kennfläche leicht gewellt, wie im zuvor betrachteten Fall.
414
19 Grundlagen der Fuzzy-Regelung (Fuzzy-Control)
2 1.5 1 0.5
y
0 −0.5 −1 −1.5 −2 1 1
0.5 0.5
0 0 −0.5
x2
−0.5 −1
x1
−1
Abbildung 19.20: Kennfläche des Fuzzy-PD-Reglers — MAX-MIN-Inferenz, Singletons als Ausgangsgrößen und Defuzzifizierung nach dem gewichteten Durchschnitt MAX-PROD-Inferenzmethode und Singletons als Ausgangs-Fuzzy-Mengen. Bei unveränderten Ein- und Ausgangs-Fuzzy-Mengen wie oben, sowie der Beibehaltung des gewichteten Durchschnitts bei der Defuzzifizierung wird nun anstelle der MAX-MINInferenz die MAX-PROD-Inferenzmethode von Abschnitt 18 verwendet. Abb. 19.21 zeigt die infolge dieser Veränderung resultierende, nun vollständig plane und geneigte Kennfläche. Dies ist die Kennfläche eines aus der linearen Regelungstechnik bekannten PD-Reglers. Somit ist es auch bei zwei Eingangsgrößen in den Kern des Fuzzy-Reglers möglich, eine exakte Nachbildung eines linearen Reglers durchzuführen.
2 1.5 1 0.5
y
0 −0.5 −1 −1.5 −2 1 1
0.5 0.5
0 0
x2
−0.5
−0.5 −1
−1
x1
Abbildung 19.21: Kennfläche des Fuzzy-PD-Reglers — MAX-PROD-Inferenz, Singletons als Ausgangsgrößen und Defuzzifizierung nach dem gewichteten Durchschnitt
19.4 Fuzzy-PD-Regler
415
Eingangs-Fuzzy-Mengen nur teilweise überlappend, MAX-PROD-Inferenzmethode und Singletons als Ausgangs-Fuzzy-Mengen. Die fehlende teilweise Überlappung der Fuzzy-Mengen führte im Eingrößenfall zu abschnittsweise konstanten Kennlinien (siehe Abb. 19.10). Der Einfluss der fehlenden Überlappung soll nun im Fall von zwei Eingangsgrößen überprüft werden. Es seien die Fuzzy-Mengen der Eingangssignale x1 und x2 durch Abb. 19.22 beschrieben. Als Fuzzy-Mengen des Ausgangssignals werden wie zuvor die Singletons von Abb. 19.19 verwendet. μ
1
N
μ
6
P
Z
-1 -0.8
-0.2 0 0.2
0.8
N
x1
1
-1-0.8
1
6
Z
-0.2
0 0.2
P
0.8
1
x2
Abbildung 19.22: Eingangs-Fuzzy-Mengen des Fuzzy-PD-Reglers mit nur teilweiser Überlappung Für diese Ein-/Ausgangs-Fuzzy-Mengen resultiert dann bei Verwendung der MAXPROD-Inferenzmethode und des gewichteten Durchschnitts bei der Defuzzifizierung die in Abb. 19.23 dargestellte Kennfläche.
2 1.5 1 0.5
y
0 −0.5 −1 −1.5 −2 1 1
0.5 0.5
0 0
x2
−0.5
−0.5 −1
−1
x1
Abbildung 19.23: Kennfläche des Fuzzy-PD-Reglers — Eingangs-Fuzzy-Mengen nur teilweise überlappend, MAX-PROD-Inferenz, Singletons als Ausgangsgrößen und Defuzzifizierung nach dem gewichteten Durchschnitt Die fehlende Überlappung spiegelt sich in der Kennfläche in Form von Plateaus wider, auf denen das Ausgangssignal y unabhängig von den Eingangssignalen x1 , x2 ist. Das größte Plateau tritt in diesem Beispiel für die Eingangssignale x1 , x2 gerade im
416
19 Grundlagen der Fuzzy-Regelung (Fuzzy-Control)
Bereich des Ursprungs auf. Somit ist evtl. also gerade im Bereich der Ruhelage mit Signalabweichungen zu rechnen. Durch Änderungen der Überlappungszonen können die Plateaus in Bereiche geschoben werden, die zu einem gewünschten Systemverhalten führen. Derartige Kennlinien sind mit Methoden der Fuzzy-Regelung recht einfach zu erzielen. Mit Methoden der klassischen Regelung lassen sich diese Kennflächen nur schwer einstellen, wenn man einmal von der Verwendung des Mikrocontrollers als Regler absieht. Denn mit einem Mikrocontroller kann man auch ohne die Methoden der Fuzzy-Regelung jede Art von Kennflächen programmieren und realisieren.
19.5
Fuzzy-PI-Regler
Methode. Die beim Fuzzy-PD-Regler angewendete Methodik kann direkt auf die Realisierung von Fuzzy-PI-Reglern übertragen werden. Der klassische PI-Regler verstärkt und integriert das ihm zugeführte Eingangssignal. Die ihn beschreibende Differentialgleichung lautet t y(t) = KP · e(t) + KI ·
⎛ 1 e(τ )dτ = KP · ⎝e(t) + · TN
0
t
⎞ e(τ )dτ ⎠
(19.2)
0
mit KP , KI als Verstärkungsfaktoren und TN als Nachstellzeit. Die Struktur des FuzzyPI-Reglers entspricht der in Abb. 19.15 gezeigten Struktur des Fuzzy-PD-Reglers und ist in Abb. 19.24 dargestellt. Zur Implementierung von Verstärkungsfaktoren werden in die Blöcke vor dem Kern des Fuzzy-Reglers die betreffenden Verstärkungsfaktoren KP und KI eingefügt. Eine Skalierung des Eingangssignals (z. B. ×0,1) auf den Bereich der Eingangs-Fuzzy-Mengen und anschließende Rückskalierung (×10) am Ausgang kann ebenso durchgeführt werden. Fuzzy-PI-Regler Dynamik
- KP
Fuzzifizierung
x1- 6
e
-
Regelbasis
- WENN .. UND .. DANN .. .. .
-KI
t 0
x2 6 e(τ )dτ -
-
- WENN .. UND .. DANN ..
Abbildung 19.24: Struktur des Fuzzy-PI-Reglers
Defuzzifizierung
- 6
-
y -
19.6 Fuzzy-PID-Regler
417
Die Wahl der Eingangs- und Ausgangs-Fuzzy-Mengen kann in gleicher Art und Weise wie beim Fuzzy-PD-Regler vorgenommen werden. Ebenso kann die Regelbasis in Form der Relationsmatrix von Tabelle 19.3 übernommen werden. Es resultieren dann je nach angewendeter Inferenzmethode und Defuzzifizierungsschema die entsprechenden Kennflächen zur Beschreibung des Übertragungsverhaltens wie beim Fuzzy-PD-Regler. Stellungs- und Geschwindigkeitsalgorithmus. Den nach Gleichung 19.2 realisierten Regler bezeichnet man auch als Stellungsalgorithmus des PI-Reglers. Das Ausgangssignal des PI-Reglers ist der absolute Stellwert für das Stellglied. Manche Stellglieder, wie z. B. ein Stellmotor (Schrittmotor), besitzen selbst ein integrierendes Übertragungsverhalten. Die Integration muss dann nicht im Regler durchgeführt werden. Somit kann der Regler als Ausgangssignal die Ableitung des Stellsignals y˙ (Änderung des Stellsignals) liefern. Das Stellglied integriert das Eingangssignal und Regler und Stellglied gemeinsam zeigen das gewünschte PI-Verhalten. Das Ausgangssignal des PI-Reglers wird bei dieser Realisierung durch die Gleichung 19.3 beschrieben 1 y(t) ˙ = KP · e(t) ˙ + KI · e(t) = KP · e(t) ˙ + · e(t) . TN
(19.3)
Diese Gleichung ähnelt der eines PD-Reglers bei dem die Konstanten wie folgt ersetzt werden: PD-Regler KP KD
←→ ←→
PI-Regler KI KP
Einen derartig realisierten Algorithmus des PI-Reglers bezeichnet man als Geschwindigkeitsalgorithmus. Das Stellglied, z. B. ein Schrittmotor, erhält also vom Regler nur die Winkeländerung, um die seine Achse pro Zeiteinheit verdreht werden soll. Der absolute Stellwinkel ergibt sich dann durch Aufsummation (= " Integration) der einzelnen Winkeländerungen. Der Vorteil liegt in der einfacheren Ansteuerung des Stellgliedes.
19.6
Fuzzy-PID-Regler
Aufbau. Die grundsätzliche Struktur eines Fuzzy-PID-Reglers wurde bereits in Abb. 19.3 vorgestellt. Das Problem der Implementierung eines PID-Reglers liegt in der großen Anzahl der WENN-DANN-Regeln, die zu spezifizieren sind. Für eine Eingangsgröße e(t), die integriert und differenziert wird, d. h. also insgesamt drei Variablen x1 , x2 und x3 als Eingänge in den Kern des Fuzzy-Reglers, sind im Fall von jeweils drei Fuzzy-Mengen pro Signalkanal insgesamt 33 = 27 WENN-DANN-Regeln zu spezifizieren. Wählt man 5 Fuzzy-Mengen je Signalkanal xi , so steigt die Anzahl der aufzustellenden Regeln sogar auf 53 = 125. Damit geht die Übersicht jedoch sehr schnell verloren.
418
19 Grundlagen der Fuzzy-Regelung (Fuzzy-Control)
In [46] wird ein Verfahren angegeben, bei dem ein konventioneller PID-Regler in einen kennliniengleichen Fuzzy-PID-Regler überführt werden kann. Hierbei werden als Eingangs-Fuzzy-Mengen dreiecks- bzw. trapezförmige Fuzzy-Mengen und als AusgangsFuzzy-Mengen Singletons verwendet. Als Inferenzmethode wird die MAX-MIN-Inferenz eingesetzt und defuzzifiziert wird mittels der Schwerpunktmethode (d. h. bei Singletons mittels des gewichteten Durchschnitts). Eine einfache Alternative zur Realisierung eines Fuzzy-PID-Reglers besteht in der Parallelschaltung eines Fuzzy-PI- und Fuzzy-PD-Reglers, wie es in Abb. 19.25 gezeigt wird. Dabei ist allerdings darauf zu achten, dass das Eingangssignal in den Proportionalkanälen nur jeweils mit dem halben Verstärkungsfaktor KP /2 verstärkt wird, da ja zwei Proportionalkanäle vorliegen. Fuzzy-PD-Regler
e Fuzzy-PI-Regler
-
+ ? l + 6
y -
Abbildung 19.25: FuzzyPID-Regler als Addition eines Fuzzy-PI- und FuzzyPD-Reglers
20
Fuzzy-Regler im Regelkreis
20.1
Einsatz von Fuzzy-Reglern
Anwendung. Fuzzy-Regler eignen sich für die Regelung der unterschiedlichsten Prozesse. Die Anwendungen reichen von der Steuerung von Drehrohröfen bei der Zementherstellung über Containerkransteuerungen, autonome Transportsysteme, Müllverbrennungsanlagen, Robotersysteme, Steinkohleverkokung, Kläranlagen, Automatikgetriebe, Anti-Blockiersysteme bis hin zu Motor- und U-Bahnsteuerungen [4], [25], [27], [30], [40], [44], [58]. Der Grundtenor bei diesen Anwendungen liegt darin, dass die zu automatisierenden Prozesse sehr komplex sind und mit den herkömmlichen mathematischen Mitteln nur schlecht bzw. überhaupt nicht beschreibbar sind. Daher eignen sich die Methoden der klassischen Regelungstechnik bzw. der modernen Regelungstechnik (Zustandsvektorrückführung) nur schlecht bzw. überhaupt nicht für den Einsatz. Denn diese Methoden des Reglerentwurfs erfordern ein mehr oder weniger genaues Modell der Regelstrecke. Doch gerade dieses genaue Modell fehlt. Als Lösung aus diesem Dilemma bietet Zadeh [76], [77], [78] das Werkzeug der FuzzyLogik an, bei dem vage Information, empirisch gewonnenes Wissen und z. B. Erfahrung beim manuellen Betreiben einer Anlage in die Automatisierung eines Prozesses mittels der Fuzzy-Regelung einfließen. Die so realisierten Regelungen sind relativ aufwandsarm und robust. Ihre Funktion wird, wie zuvor gezeigt, durch allgemeinverständliche WENNDANN-Regeln festgelegt. Die Realisierung der Fuzzy-Regler geschieht in einem Mikrocontroller. Somit ist im Prinzip ein Fuzzy-Regler immer ein digitaler Regler, dessen Abtastzeit mittels der Überlegungen aus der digitalen Regelung festzulegen ist. Die Implementierung der Regelalgorithmen der Fuzzy-Regler kann erfolgen durch 1.) spezielle Fuzzy-Regler-Software oder 2.) spezielle Fuzzy-Mikrocontroller. Die Software-Realisierung hat den Nachteil der langen Bearbeitungsdauer bei der Abfrage der WENN-DANN-Regeln und z. B. der Schwerpunktberechnung bei der Defuzzifizierung. Dafür ist sie kostengünstig, da sie auf einer Vielzahl von Mikrocontrollern implementiert werden kann. Dagegen bietet der Einsatz spezieller Fuzzy-Mikrocontroller den Vorteil der speziell auf die Fuzzy-Logik abgestimmten und daher schnellen Hardware zu allerdings höheren Kosten. Aber auch hier ist der Anzahl der WENN-DANN-Regeln eine obere Grenze gesetzt.
420
20 Fuzzy-Regler im Regelkreis
Um ein gewisses Verständnis für die Wirkungsweise der Fuzzy-Regler im Regelkreis zu gewinnen, sollen in den nachfolgenden Abschnitten unterschiedliche Fuzzy-Regler an bekannten, einfachen Regelstrecken erprobt werden. Für die Anwendung der FuzzyRegelung an komplexen Regelstrecken und Anlagen wird auf die umfangreiche Literatur verwiesen [34], [35].
20.2
Regelung einer Verzögerungsstrecke mit einem Fuzzy-Regler
Beispielstrecke. Die Wirkungsweise der Fuzzy-Regelung soll an einer Verzögerungsstrecke 3. Ordnung (PT3 -Strecke) bestehend aus einer Reihenschaltung von drei PT1 Teilstrecken untersucht werden. Dabei werden zum einen verschiedene Fuzzy-Regler verwendet und zum anderen wird das Führungs- und Störverhalten verglichen mit dem Führungs- und Störverhalten bei Einsatz eines klassischen PI-Reglers. Der untersuchte Regelkreis ist in Abb. 20.1 dargestellt. Der Fuzzy-Regler sei jeweils ein Fuzzy-PI-Regler, ausgelegt nach verschiedenen Methoden. Die Zeitkonstanten der Regelstrecke seien T1 = 1,2 s, T2 = 3 s und T3 = 5 s und die Streckenverstärkung betrage Ks = K1 · K2 · K3 = 1,8. Fuzzy-PI-Regler w - hxd− 6
z
K1 − ? y- h -
T1
K2 -
T2
K3
T3
-
x-
Abbildung 20.1: Regelkreis bestehend aus einem Fuzzy-PI-Regler und einer PT3 Strecke Die Ergebnisse der verschiedenen Fuzzy-Regler werden verglichen mit einem klassischen PI-Regler ausgelegt nach der Methode der dynamischen Kompensation. Die Nachstellzeit TN des PI-Reglers wird gleich der größten Zeitkonstanten der Regelstrecke gesetzt, also TN = T3 = 5 s. Die Reglerverstärkung KP wird so gewählt, dass bei einem Sprung der Führungsgröße von w(t) = 1 · σ(t) und bei einem Sprung der Störgröße von z(t) = 0,2 ·σ(50 s) die maximale prozentuale Überschwingweite in etwa gleich groß (hier u¨ ≈ 15 %) ist. Dies wird erreicht für KP = 0,55.
20.2.1
Fuzzy-PI-Regler mit MAX-PROD-Inferenz und Singletons als Ausgangs-Fuzzy-Mengen
Basisauslegung. Die Struktur dieses Fuzzy-Reglers entspricht der in Abb. 19.24 dargestellten Struktur eines Fuzzy-PI-Reglers. Die Eingangs- und Ausgangs-Fuzzy-Mengen
20.2 Regelung einer Verzögerungsstrecke mit einem Fuzzy-Regler
421
zeigt Abb. 20.2. Die Eingangs-Fuzzy-Mengen sind dreiecksförmige Fuzzy-Mengen und die Ausgangs-Fuzzy-Mengen sind Singletons. Defuzzifiziert wird nach dem gewichteten Durchschnitt. μ
N Z
a)-1
μ
6
1
P
N Z
0
1
x1
NB t NS t
c)
1
-2
-1
b) -1
6
0
P
1
x2
μ
1 t 6PS t PB t Z
0
1
2
y
Abbildung 20.2: Eingangs-Fuzzy-Mengen (Abb. a und b) und Ausgangs-Singletons (Abb. c) Die Relationsmatrix für diesen Fuzzy-PI-Regler zeigt Tab. 20.1. Sie entspricht unverändert der Relationsmatrix von Tab. 19.3. Sind e und e˙ positiv, so wird auch die Stellgröße y positiv. Umgekehrt gilt die Aussage entsprechend. KI ·
KP · e = " x1
e(τ )dτ = " x2
N
Z
P
N
NB
NS
Z
Z
NS
Z
PS
P
Z
PS
PB
Tabelle 20.1: Relationsmatrix des Fuzzy-PI-Reglers Aufgrund der wesentlichen Übereinstimmung der Fuzzy-Mengen und der Relationsmatrix mit der des entsprechenden Fuzzy-PD-Reglers ist die Kennfläche dieses Fuzzy-PIReglers identisch mit der Kennfläche von Abb. 19.21. Die Kennfläche stellt eine plane, geneigte Ebene dar. Die Kennfläche ist nicht gewellt, somit liegt ein lineares Übertragungsverhalten zwischen Ein- und Ausgangsgröße vor. Wie in Abschnitt 19.4 betont, stimmt die so entwickelte Kennfläche des Fuzzy-PI-Reglers mit der Kennfläche eines klassischen analogen PI-Reglers überein. Somit ist ein identisches dynamisches Verhalten dieses Fuzzy-Reglers und des klassischen PI-Reglers bei Einwirkung einer Führungs-
422
20 Fuzzy-Regler im Regelkreis
und Störgröße zu erwarten. Dies wird durch die in Abb. 20.3 dargestellte Simulation des Führungs- und Störverhaltens beider Regler bestätigt. Die Zeitverläufe der Regelgrößen x(t) und Stellgrößen y(t) verlaufen deckungsgleich und sind nicht voneinander zu unterscheiden. 1.2
x, y
x
1
0.8
6
0.6
y 0.4 0.2 0
0
10
20
30
40
50
60
-
70
80
90
100
Zeit t/s
Abbildung 20.3: Identisches Führungs- und Störverhalten des klassischen und FuzzyPI-Reglers (mit w(t) = 1 · σ(t), z(t) = 0,2 · σ(t − 50)) Dieses Ergebnis bestätigt die auf der Basis der Analyse des Fuzzy-PI-Reglers zu erwartenden Ergebnisse. Bei identischem Übertragungsverhalten von klassischem und FuzzyPI-Regler ist auch ein identisches Regelverhalten des gesamten Regelkreises zu erwarten.
20.2.2
Fuzzy-PI-Regler mit MAX-MIN-Inferenz und Defuzzifizierung mittels der Schwerpunkt-Methode
Anwendung. Im Vergleich zu den in Abschnitt 20.2.1 verwendeten Singletons als Ausgangs-Fuzzy-Mengen werden nun die Fuzzy-Mengen von Abb. 19.17 verwendet, die in Abb. 20.4 nochmals dargestellt sind. μ
-3
NB
NS
-2
-1
1 Z
0
6 PS
PB
1
2
3
y
Abbildung 20.4: Ausgangs-Fuzzy-Mengen des Fuzzy-PI-Reglers Da wie in Abb. 20.2 nun 5 Ausgangs-Fuzzy-Mengen vorliegen, kann die Relationsmatrix von Tab. 20.1 beibehalten werden. Somit entspricht die zu diesem Fuzzy-PI-Regler gehörende Kennfläche der in Abb. 19.18 dargestellten Kennfläche. Dieser Fuzzy-PIRegler hat somit eine leicht gewellte Kennfläche. Es ist nicht mehr die Kennfläche, die
20.2 Regelung einer Verzögerungsstrecke mit einem Fuzzy-Regler
423
zu einem klassischen PI-Regler gehört. Da aber dennoch sich beide Kennflächen nur unwesentlich unterscheiden, ist im Signalverlauf des Führungs- und Störverhaltens der Regelkreise mit klassischem und mit Fuzzy-PI-Regler auch kein wesentlicher Unterschied zu erwarten. Es wird in Abb. 20.5 das Führungs- und Störverhalten bei der schon zuvor
1.2
x, y
x, xF uz
1
0.8
6
0.6
y, yF uz 0.4 0.2 0
0
10
20
30
40
50
-
60
70
80
90
100
Zeit t/s
Abbildung 20.5: Führungs- und Störverhalten bei der Regelung einer PT3 -Strecke mit einem Fuzzy-PI-Regler („gestrichelt“) und einem klassischen PI-Regler betrachteten Regelung einer PT3 -Strecke mit einem PI-Regler untersucht. Die mit xF uz und yF uz bezeichneten Größen sind Regel- und Stellgröße bei Einsatz des Fuzzy-PIReglers. Die nicht indizierten Größen sind Regel- und Stellgröße des zum Vergleich betrachteten klassischen PI-Reglers. Da die Kennflächen der Regler sich nur wenig unterscheiden, verlaufen auch die Signalverläufe des Führungs- und Störverhaltens sehr ähnlich. Die Stellamplitude des FuzzyReglers ist zu Beginn etwas steiler, und infolgedessen reagiert die Regelgröße auch schneller und die Regeldifferenz beim Führungsverhalten wird etwas schneller ausgeregelt. Die Signalverläufe beim Störverhalten zeigen noch geringere Unterschiede zum klassischen PI-Regler.
20.2.3
Eingangs-Fuzzy-Mengen nur teilweise überlappend, MAX-PROD-Inferenzmethode und Singletons als Ausgangs-Fuzzy-Mengen
Anwendung. Abschließend soll wie in Abschnitt 19.4 das Regelverhalten des zuvor betrachteten Regelkreises mit Fuzzy-PI-Regler bei nur teilweise überlappenden EingangsFuzzy-Mengen und Singletons als Ausgangsgröße mit dem des klassischen PI-Reglers verglichen werden. Um den erwarteten negativen Einfluss der Plateaus in den Kennflächen eines derartigen Reglers zu reduzieren (siehe Abb. 19.23), wird von den in Abb. 20.6 dargestellten Fuzzy-Ein- und Ausgangsmengen ausgegangen.
424
20 Fuzzy-Regler im Regelkreis μ
N
-1
Z
-0.9
μ
16
P
N
-
-0.1 0 0.1
0.9 1 x1
-1
-0.9
-0.1 0 0.1
P
-
0.9 1 x2
μ
NB t NS t
-2
Z
16
1 t 6PS t PB t Z
0
-1
1
2
y
Abbildung 20.6: Ein- und Ausgangs-Fuzzy-Mengen des untersuchten Fuzzy-Reglers bei nur teilweiser Überlappung der Eingangsmengen Für diese Konstellation der Ein- und Ausgangs-Fuzzy-Mengen resultiert dann die in Abb. 20.7 dargestellte Kennfläche des Fuzzy-PI-Reglers. Die Verkleinerung der Zonen fehlender Überlappung führt zu einer Verkleinerung der Plateaus der Kennfläche.
2 1.5 1 0.5
y
0 −0.5 −1 −1.5 −2 1 1
0.5 0.5
0 0
x2
−0.5
−0.5 −1
−1
x1
Abbildung 20.7: Kennfläche des Fuzzy-PI-Reglers mit nur teilweiser Überlappung der Eingangs-Fuzzy-Mengen; (MAX-PROD-Inferenz und gewichteter Durchschnitt) Auch für diesen Fuzzy-Regler wird die Relationsmatrix von Tab. 20.1 angewendet. Die Struktur des Fuzzy-Reglers entspricht der in Abb. 19.24 gezeigten Reglerstruktur. Um zu vermeiden, dass die Eingangsgrößen x1 und x2 den zulässigen Wertebereich von ±1 überschreiten, wird das Eingangssignal e halbiert und das Stellsignal y verdoppelt. Da mit diesem Fuzzy-PI-Regler das Regelverhalten deutlich langsamer wird, erfolgt nur eine Untersuchung des Führungsverhaltens. Aufgrund der Plateaus in der Reglerkennfläche
20.3 Regelung einer integrierenden Regelstrecke mit einem Fuzzy-Regler
425
tritt nun eine länger anhaltende Schwingung der Regelgröße x(t) auf. Die Ausregelzeit der Regelung mit Fuzzy-Regler erhöht sich um ein Mehrfaches gegenüber der klassischen PI-Regelung. Dies ist allein auf die nicht überlappenden Kennflächen der EingangsFuzzy-Mengen zurückzuführen. 1.4
xF uz
1.2
x, y
x
1
60.8
yF uz
0.6
y
0.4 0.2 0
0
50
-
100
150
Zeit t/s
Abbildung 20.8: Führungsverhalten bei der Regelung einer PT3 -Strecke mit einem Fuzzy-PI-Regler („gestrichelt“) und einem klassischen PI-Regler Dies Regelverhalten verdeutlicht die Notwendigkeit der Überlappung der Fuzzy-Menge der Eingangsgrößen.
20.3
Regelung einer integrierenden Regelstrecke mit einem Fuzzy-Regler
Anwendung. Die Regelung einer integrierenden Regelstrecke soll beispielhaft an einer Füllstandsregelung demonstriert werden. Ein Flüssigkeitsbehälter mit Zu- und Abfluss soll auf einen konstanten Füllstand geregelt werden. Bei Veränderung der Abflussmenge (Störgröße z) soll der Fuzzy-Regler den Zufluss so steuern, dass die Füllstandshöhe unverändert auf dem Sollwert bleibt. Die technische Anordnung zeigt Abb. 20.9. y 6 h ?
Flüssigkeitsbehälter
Abbildung 20.9: Anordnung der Flüssigkeitsstandsregelung z -
426
20 Fuzzy-Regler im Regelkreis
Die Regelstrecke weist ein integrierendes Verhalten auf, der Integrationsfaktor sei KI = 2/min. Aufgrund der Messung der Abflussmenge z pro Minute kann eine Störgrößenaufschaltung vorgenommen werden. Der verwendete Fuzzy-Regler weist als Eingänge die Signale xd = " Δh = hSoll −hIst und die Störgröße z auf. Die Eingangssignale können mit einer Konstanten Kh bzw Kz multipliziert werden. Fuzzy-Regler sind von ihrer Struktur her Kennflächenregler mit in erster Annäherung P-Verhalten. Es ist daher zu vermuten, dass auf einen zusätzlichen Dynamikteil des Fuzzy-Reglers verzichtet werden kann, da die Strecke ein integrierendes Verhalten aufweist und dann ein P-Regler ausreichen sollte, eine bleibende Regeldifferenz zu vermeiden. Für diese Anordnung resultiert dann das in Abb. 20.10 dargestellte Blockschaltbild. z w = hSoll- hxd− 6
Kz
Kh
Fuzzy-Regler -
KI − y- ? h -
x = hIst -
Abbildung 20.10: Blockschaltbild der Füllstandsregelung Die Bereiche der Ein- und Ausgangsgrößen sind wie folgt vorgegeben: Füllstandshöhe h 0≤h≤6 Abflussmenge z 0≤z≤6 Stellgröße y 0≤y≤8 dann resultiert für die Regeldifferenz −6 ≤ y ≤ +6 Regeldifferenz xd
Einheiten Einheiten/min Einheiten/min Einheiten.
Es werden für die Ein- und Ausgangs-Fuzzy-Mengen, d. h. x1 = Kh · xd , x2 = Kz · z und y die in Abb. 20.11 dargestellten Fuzzy-Mengen mit Randerweiterung angenommen. Die linguistischen Terme dieser Fuzzy-Mengen sind mit P B = " Positiv Big, P S = " Positiv Small, Z = " Zero, M = " Medium usw. abgekürzt. μ
NB
-9
NS
-6
16 Z PS
0
μ
16 PB
Z
6
9
-
x1
-1,5
S
M
B
3
H
6
7,5
-
x2
μ
16 Z
-2
S
M
B
4
H
8
10
y
Abbildung 20.11: Fuzzy-Mengen mit „Randerweiterung“ für die Einund Ausgangsgrößen der Füllstandsregelung
20.3 Regelung einer integrierenden Regelstrecke mit einem Fuzzy-Regler
427
Aufgrund der zweimal fünf Eingangs-Fuzzy-Mengen ist die Aufstellung einer Relationsmatrix mit 25 Elementen erforderlich. Diese Relationsmatrix zeigt Tab. 20.2.
Kz · z = " x2
Kh · xd = " x1
Z
S
M
B
H
PB
M
B
H
H
H
PS
S
M
B
H
H
Z
Z
S
M
B
H
NS
Z
Z
S
M
B
NB
Z
Z
Z
S
M
Tabelle 20.2: Relationsmatrix des Fuzzy-Reglers Bei Verwendung der MAX-MIN-Inferenz und der Schwerpunktmethode zur Defuzzifizierung ergibt sich die in Abb. 20.12 gezeigte Kennfläche. Aufgrund der Randerweiterung der Fuzzy-Mengen hat die Kennfläche das Aussehen eines Troges. Ohne Berücksichtigung der Randerweiterung ist die Kennfläche weitgehend plan und geneigt, aber leicht gewellt, wie die Kennfläche des Fuzzy-PD-Reglers von Abb. 19.18.
8 7 6 5
y
4 3 2 1 0 8 6
10 4
5 2
x2
0 0
−5 −2
−10
x1
Abbildung 20.12: Kennfläche des Fuzzy-Reglers mit Berücksichtigung der Randerweiterung; (MAX-MIN-Inferenz und Schwerpunktmethode)
428
20 Fuzzy-Regler im Regelkreis
Die Untersuchung des Regelverhaltens des oben entwickelten Fuzzy-Reglers bei Wahl der Verstärkung Kh und Kz = 1 erweist sich als unbefriedigend. Betrachtet man den Signalbereich für die Störgröße z (von 0 bis 6 Einheiten) und für die Stellgröße y (von 0 bis 8 Einheiten), so entspricht bei der weitgehend linearen Regelfläche dies einer Störgrößenaufschaltung mit der Reglerverstärkung KP ≈ 8/6 = 1,33. Die korrekte Störgrößenaufschaltung erfordert jedoch eine Verstärkung K von Eins. Wählt man Kz = 0,75, so resultiert für die Störgrößenaufschaltung K = KP · Kz = 1 die gewünschte exakte Kompensation. Abb. 20.13 zeigt für das Zeitintervall 0 ≤ 5 min das exakte Einregeln der Füllstandshöhe auf den Sollwert von 3 Einheiten (Störgröße z = 0). Zum Zeitpunkt t = 5 min wird der Abfluss geöffnet, und eine Störgröße z = 2 Einheiten eingestellt. Aufgrund der Störgrößenaufschaltung regelt der Fuzzy-Regler diese Störung problemlos aus. Zu den Zeitpunkten t = 10 min und t = 15 min werden dann neue Sollwerte w = 5 bzw. 4 Einheiten eingestellt, die ebenfalls fehlerfrei eingestellt werden. Zusätzlich zu diesen Signalverläufen ist in Abb. 20.13 ebenfalls das vom Fuzzy-Regler berechnete Stellsignal y aufgetragen. 5 4
x, y 63
x
2
y, z
1 0
y 0
2
4
6
8
10
-
12
14
16
18
20
Zeit t/s
Abbildung 20.13: Führungs- und Störverhalten des Füllstandsregelkreises mit einem Fuzzy-Regler (Regelgröße x, Stellgröße y und Störgröße z (gestrichelt), Sollwert w wechselnd von 3 auf 5 auf 4) Verzichtet man auf die Störgrößenaufschaltung, so regelt der Fuzzy-Regler zwar auf die gewünschten Sollwerte ein, bei permantem Einwirken einer Störung kann die Füllstandshöhe jedoch nicht auf dem Sollwert gehalten werden. Aufgrund des I-Verhaltens der Strecke reicht ein einfacher Fuzzy-P-Regler für ein zufriedenstellendes Führungsverhalten aus. Die zusätzliche Einführung einer Störgrößenaufschaltung erlaubt jedoch eine zufriedenstellende Zweigrößenregelung, denn man kann nun Füllstandshöhe h und Abflussmenge z gleichzeitig auf den jeweils gewünschten Wert regeln.
Aufgabe 20.1: Es soll die Abstandsregelung von zwei Fahrzeugen auf der Autobahn mithilfe der Fuzzy-Regelung untersucht werden. Eingangskanäle der Fuzzy-Regelung in Fahrzeug 2 sind die Signalkanäle Abstand in m (zu Fahrzeug 1) und die Geschwindigkeit in m/s (von Fahrzeug 2). Ausgangskanal der Fuzzy-Regelung ist die Brems- oder
20.3 Regelung einer integrierenden Regelstrecke mit einem Fuzzy-Regler
429
Beschleunigungskraft in N (von Fahrzeug 2). Fahrzeug 2 habe eine Masse von m2 = 1000 kg. Es werden die Eingangs-Signalkanäle mit folgenden Fuzzy-Mengen belegt: μx d 1
6klein mittel
0
100
μv2
groß
1
-
xd /m
200
6klein
0
groß
mittel
50
100
-
v2 /(km/h)
Abbildung 20.14: Fuzzy-Mengen der Eingangskanäle Abstand und Geschwindigkeit
Der Ausgangskanal (die Brems- oder Beschleunigungskraft) sei spezifiziert durch folgende Fuzzy-Mengen: μF
Vollbremsung Bremsen
-500
-250
Null 16
0
Gas
250
Vollgas
-
500 F /N
Abbildung 20.15: Fuzzy-Mengen des Ausgangskanals „Brems- oder Beschleunigungskraft“
1. Geben Sie eine sinnvolle Relationsmatrix für die Verknüpfung der Ein- und AusgangsFuzzy-Mengen des Abstandsreglers von Fahrzeug 2 an. 2. Stellen Sie die Kennfläche grafisch dar. 3. Entwickeln Sie ein Simulationsdiagramm für das Testen der Abstandsregelung. Es gibt keine Sollwerte für den Abstand und die Geschwindigkeit vom zweiten Fahrzeug! 4. Testen Sie nun die Abstandsregelung für verschiedene Anfangszustände. Bei allen Tests wird angenommen, dass das vorausfahrende Fahrzeug 1 eine konstante Geschwindigkeit von v1 (t) = 100 km/h fahre. Fahrzeug 2 fahre mit ausgeschalteter Abstandsregelung hinter Fahrzeug 1 her. Bei t = 0 s und Position x2 (0) = 0 m wird die Abstandsregelung in Fahrzeug 2 eingeschaltet. Ermitteln Sie per Simulation jeweils den Abstand xd (∞) und v2 (∞) für die folgenden Anfangszustände:
430
20 Fuzzy-Regler im Regelkreis (a) (b) (c) (d) (e) (f)
x1 (0) x1 (0) x1 (0) x1 (0) x1 (0) x1 (0)
= = = = = =
120 m 80 m 120 m 80 m 120 m 80 m
und und und und und und
v2 (0) = 100 km/h. v2 (0) = 100 km/h. v2 (0) = 120 km/h. v2 (0) = 120 km/h. v2 (0) = 80 km/h. v2 (0) = 80 km/h.
5. Stellen Sie einen typischen Regelverlauf grafisch dar. 6. Wie groß darf für den Fall x1 (0) = 100 m die Anfangsgeschwindigkeit v2 (0) von Fahrzeug 2 höchstens sein, damit es nicht zu einem Auffahrunfall kommt? 7. Wie groß muss für den Fall v2 (0) = 120 km/h der Abstand xd (0) von Fahrzeug 2 mindestens sein, damit es nicht zu einem Auffahrunfall kommt? Lösung: 1.
xd (t) = Abstand zu Fahrzeug 1 klein mittel groß
Geschw. v2 (t)
2.
klein
Null
Gas
Vollgas
mittel
Bremsen
Null
Gas
groß
Vollbremsung
Bremsen
Null
500
F2 (t)/N
0
−500 60 50
1000
40
800
30
600 20
v2 (t)/(m/s)
400 10
200 0
0
xd (t)/m
Abbildung 20.16: Kennfläche mit Stellkraft F2 (t)/N; Fahrzeugabstand xd (t)/m und Geschwindigkeit v2 (t)/(m/s)
20.4 Stabilität von Fuzzy-Regelungssystemen
431
3. -
-
-
xd (t)
v2 (0)
Fuzzy-Regler 1 m2
-
1 s
v2 (t) - ? i -
v1 (t)
1 s
-
1 s
– i – x2 (0) + 6 - i 6 x (0) 1
Abbildung 20.17: Simulationsdiagramm
4.
xd (∞) 311 m 375 m 410 m 457 m 448 m 487 m
a. b. c. d. e. f.
5.
v2 (∞) 100 km/h 100 km/h 100 km/h 100 km/h 100 km/h 100 km/h
500 400
v2 , xd , F
6
xd (t)/m
300 200
v2 (t)/(km/h)
100 0
F (t)/N
−100 −200 −300 −400
0
50
100
-
150
200
250
300
Zeit t/s
Abbildung 20.18: Zeitverlauf für v2 (0) = 120 km/h und x1 (0) = 80 m 6. Die Geschwindigkeit v2 (0) muss kleiner 128 km/h sein. 7. Der Abstand x2 (0) muss mindestens 46 m betragen.
20.4
Stabilität von Fuzzy-Regelungssystemen
Zusammenfassung. Für die Untersuchung der Stabilität von Regelkreisen mit FuzzyReglern gibt es noch keine abgeschlossene Theorie. Es existieren Ansätze, die Stabili-
432
20 Fuzzy-Regler im Regelkreis
tätsaussagen erlauben. Diese Ansätze hängen vom jeweiligen Typ des Fuzzy-Reglers und der untersuchten Regelstrecke ab. Falls keine mathematische Beschreibung der Regelstrecke in Form von Differential- oder Differenzengleichungen, Übertragungsfunktionen, Zustandsgleichungen oder dergleichen vorliegt, bzw. falls eine derartige Beschreibung auch nicht möglich ist, kann man davon ausgehen, dass es eine Stabilitätsaussage für ein Regelsystem mit einer derartigen Strecke und einem Fuzzy-Regler auch kaum geben wird. Denn ohne Streckenbeschreibung kann man zwar empirisch Fuzzy-Regler an der Strecke erproben und feststellen, ob sie für die betrachteten Fälle Stabilität gewährleisten. Doch allgemeine Aussagen kann man daraus kaum erwarten. Liegt eine Streckenbeschreibung in Form von linguistischen WENN-DANN-Regeln, basierend auf mehr oder weniger aussagekräftigen Fuzzy-Mengen vor, so gibt es auch hier noch keine praktikablen Stabilitätsansätze. Ein Bedarf hierfür ist jedenfalls gegeben, da bei derartigen Prozessen durchaus die Anwendung eines Fuzzy-Reglers sinnvoll ist. Ist eine mathematische Beschreibung der Regelstrecke gegeben und der Fuzzy-Regler ist so ausgelegt, dass sein dynamisches Verhalten exakt dem dynamischen Verhalten eines klassischen Reglers, z. B. PID-Reglers, entspricht, dann kann entsprechend die Stabilitätstheorie der klassischen Regelungstechnik angewendet werden. Dieser Anwendungsfall ist in den untersuchten Beispielen in Abschnitt 20.2.1 gegeben, wenn die MAXPROD-Inferenzmethode und Singletons als Ausgangs-Fuzzy-Mengen verwendet werden. Die Kennfläche des Fuzzy-Reglers ist dann eine lineare Kennfläche und der Regelverlauf des klassischen und des Fuzzy-PI-Reglers stimmen exakt überein. Sind die Eingangs-Fuzzy-Mengen nicht überlappend, dann resultiert im Fall einer Eingangsgröße für den Fuzzy-Regler die Übertragungskennlinie eines klassischen schaltenden Reglers wie z. B. Zwei- oder Dreipunktregler (siehe Abb. 19.10). Die Stabilitätsuntersuchung von Regelkreisen mit derartigen schaltenden Fuzzy-Reglern kann z. B. mithilfe des Zweiortskurvenverfahrens unter Benutzung der Beschreibungsfunktion erfolgen. Bei Fuzzy-Reglern mit beliebiger nichtlinearer Übertragungskennlinie kann eine Stabilitätsuntersuchung mit der Methode von Popov [59] bzw. mit dem Kreiskriterium erfolgen. Beide Methoden arbeiten im Frequenzbereich. Dabei wird ein Sektor für die nichtlineare Kennlinie festgelegt, für den das Regelsystem stabil ist. Verlässt die Übertragungskennlinie des Fuzzy-Reglers den berechneten Sektor, kann Stabilität nicht garantiert werden. Sowohl die Methode von Popov als auch das Kreiskriterium können bei Fuzzy-Reglern, beschrieben durch nichtlineare Kennflächen, angewendet werden, doch die Stabilitätsaussagen sind sehr konservativ, d. h. die Bedingungen sind sehr einschränkend und von geringer praktischer Bedeutung. Bei Fuzzy-Reglern mit derartigen nichtlinearen Kennflächen liegt aber der eigentliche Bedarf an Stabilitätsaussagen, da die eingesetzten Fuzzy-Regler häufig durch derartige Kennflächen beschrieben werden.
A
Formeln zur Matrizenrechnung
Die hier im Anhang zusammengestellten Formeln zur Matrizenrechnung ersetzen nicht die Beschäftigung mit der Theorie der Matrizenrechnung. Hierzu gibt es eine genügend große Anzahl von Lehrbüchern, von denen hier nur die Bücher von DeRusso [18] und Stewart [66] stellvertretend genannt seien. Manche speziell in der Regelungstechnik benötigte Formeln sind jedoch auch in Lehrbüchern zur Matrizenrechnung schwer zu finden. Daher soll dieser Anhang neben ein paar Grundlagen der Matrizenrechnung einen schnellen Zugang zu einigen wichtigen, in der Regelungstechnik benötigten Zusammenhängen liefern.
A.1
Grundlagen
Lineare Gleichungen und Matrizen. Der folgende Satz linearer Gleichungen erstellt eine Verknüpfung zwischen den Variablen x1 , x2 , . . . , xn und den Variablen y1 , y2 , . . . , ym a11 x1 + a12 x2 + . . . + a1n xn a21 x1 + a22 x2 + . . . + a2n xn ............................................ am1 x1 + am2 x2 + . . . + amn xn
= = = =
y1 y2 ... ym .
Diese Verknüpfung zwischen den Variablen x1 , x2 , . . . , xn und y1 , y2 , . . . , ym kann wesentlich einfacher beschrieben werden, wenn man das geordnete Feld ⎡
⎤ a11 a12 . . . a1n ⎢ a21 a22 . . . a2n ⎥ ⎢ ⎥ A=⎢ . .. .. ⎥ ⎣ .. . . ⎦ am1 am2 . . . amn
(A.1)
einführt. Dieses geordnete Feld bezeichnet man als Matrix A. Eine Matrix ist eine rechteckige Anordnung von Elementen a11 , a12 , . . . , amn . Bei den doppelt indizierten Elementen aij bezeichnet der erste Index i die jeweilige Zeile, und der zweite Index j die Spalte der Matrix. Element a12 ist also das Element in Zeile 1 und Spalte 2. Eine Matrix mit m Zeilen und n Spalten wird (m × n)-Matrix oder Matrix der Ordnung m mal n genannt. Matrizen werden i. A. mit fett gedruckten Großbuchstaben A, B, . . . bezeichnet.
434
A Formeln zur Matrizenrechnung
Formen von Matrizen. (a) Spaltenmatrix, Spaltenvektor, Vektor. Eine Matrix mit m Zeilen und nur einer Spalte (n = 1) heißt Spaltenmatrix oder Spaltenvektor, bzw. kurz Vektor ⎡
a1 a2 .. .
⎢ ⎢ a=⎢ ⎣
⎤ ⎥ ⎥ ⎥ . ⎦
(A.2)
am Vektoren werden mit fett gedruckten Kleinbuchstaben a, b, . . . , x, y, . . . bezeichnet. (b) Zeilenmatrix, Zeilenvektor. Eine Matrix, bestehend aus nur einer Zeile und n Spalten, heißt Zeilenmatrix oder Zeilenvektor b T = b1 b2 . . . bn .
(A.3)
Zur Unterscheidung von Spalten- und Zeilenvektoren wird ein Zeilenvektor meist bezeichnet als transponierter Spaltenvektor (Vektor) und durch ein hochgestelltes T gekennzeichnet (siehe Gleichung A.7). (c) Diagonalmatrix. Eine Diagonalmatrix ist eine quadratische n mal n Matrix, die nur auf der Hauptdiagonalen von Null verschiedene Elemente aii enthält. ⎡
⎤ a11 0 . . . 0 ⎢ 0 a22 . . . 0 ⎥ ⎢ ⎥ A=⎢ . .. .. ⎥ . ⎣ .. . . ⎦ 0 0 . . . ann
(A.4)
(d) Einheitsmatrix. Eine Einheitsmatrix ist eine quadratische n mal n Matrix, die nur auf der Hauptdiagonalen eine Eins enthält und sonst Null ist. Einheitsmatrizen werden i. A. mit dem Symbol I (oder auch E) bezeichnet. ⎡
⎤ 0 ... 0 1 ... 0⎥ ⎥ .. .. ⎥ . . .⎦ 0 0 ... 1
1 ⎢0 ⎢ I=⎢. ⎣ ..
(A.5)
Will man die Ordnung n betonen, so bezeichnet man diese Einheitsmatrix auch mit I n×n oder I n .
A.1 Grundlagen
435
(e) Nullmatrix. Eine Nullmatrix ist eine m mal n oder n mal n Matrix, die nur Nullen enthält.
⎡
⎤ 0 ... 0 0 ... 0⎥ ⎥ .. .. ⎥ . . .⎦ 0 0 ... 0
0 ⎢0 ⎢ 0=⎢. ⎣ ..
(A.6)
(f ) Transponierte Matrix. Vertauscht man die Zeilen und Spalten einer Matrix A, so nennt man die entstehende Matrix die transponierte Matrix AT oder auch kurz die Transponierte, und kennzeichnet sie durch ein hochgestelltes T . Die Transponierte der Matrix A von Gleichung A.1 lautet ⎤ a11 a21 . . . am1 ⎢ a12 a22 . . . am2 ⎥ ⎥ ⎢ AT = ⎢ . .. .. ⎥ . ⎣ .. . . ⎦ a1n a2n . . . amn ⎡
(A.7)
Ist A eine m mal n Matrix, so ist AT eine n mal m Matrix. Manchmal wird die transponierte Matrix auch nur mit einem hochgestellten Strich bezeichnet AT ≡ A . Spezielle Matrizen. (a) Symmetrische Matrix. Eine quadratische n mal n Matrix heißt symmetrisch, wenn sie gleich ihrer transponierten Matrix ist, d. h. wenn gilt
A = AT
oder
aij = aji
für
(i,j = 1 . . . n) .
(b) Schiefsymmetrische Matrix. Eine reelle quadratische n mal n Matrix heißt schiefsymmetrisch, wenn sie gleich ihrer negativen transponierten Matrix ist, d. h. wenn gilt
A = −AT
oder
aij = −aji
für
(i,j = 1 . . . n) .
Dies impliziert, dass die Elemente auf der Hauptdiagonalen gleich Null sind.
436
A Formeln zur Matrizenrechnung
Elementaroperationen. (a) Addition von Matrizen. Zwei rechteckige m mal n Matrizen werden addiert, indem man die jeweiligen Elemente i, j addiert: C = A+B
wobei gilt
cij = aij + bij
für alle i, j.
Beispiel A.1 Addition von Matrizen. ⎡ ⎤ ⎡ ⎤ ⎡ ⎤ 2 −3 1 2 3 −1 ⎣ 4 8 ⎦ + ⎣ −5 2 ⎦ = ⎣ −1 10 ⎦ . 2 −3 −1 2 1 −1
(A.8)
Für die Addition von Matrizen gelten das Kommutativ- und das Assoziativgesetz, i. e. Kommutativgesetz Assoziativgesetz.
A+B = B+A A + (B + C) = (A + B) + C
(b) Subtraktion von Matrizen. Zwei rechteckige m mal n Matrizen werden subtrahiert, indem man die jeweiligen Elemente i, j subtrahiert: C = A−B
wobei gilt
cij = aij − bij
für alle i, j.
(c) Multiplikation von Matrizen. Das Produkt einer m mal n Matrix A mit einer n mal m Matrix B ergibt die m mal m Matrix C
C = A·B
wobei gilt
cik =
n
aij · bjk
für alle i, k = 1 . . . m.
j=1
Man spricht auch von einer Links- bzw. Rechtsmultiplikation, wenn man betonen will, dass B von links mit A multipliziert wird, bzw. dass A von rechts mit B multipliziert wird. Beispiel A.2 Produkt der Matrizen A · B. ⎡ ⎤ ⎡ ⎤ 2 −3 −4 7 −16 ⎣ 4 8 ⎦ · 1 2 −5 = ⎣ 20 0 −4 ⎦ . 2 −1 2 2 3 8 1 −4
(A.9)
Mit diesen Definitionen kann man die Gleichung A.1 in Kurzform schreiben als A·x = y.
A.1 Grundlagen
437
Das Matrizenprodukt A · B ist i. A. ungleich dem Produkt B · A. Somit ist das Kommutativgesetz für das Produkt zweier Matrizen i. A. nicht erfüllt A · B = B · A .
Beispiel A.3 Produkt der Matrizen B · A. ⎡ ⎤ 2 −3 1 2 −5 ⎣ 0 −2 · 4 8 ⎦= . 2 −1 2 4 −8 2 3
(A.10)
Die Produkte der Matrizen von Beispiel A.2 und A.3 sind verschieden.
Für das Produkt zweier Matrizen gelten das nachfolgende Assoziativ- und das Distributivgesetz A · (B · C) = (A · B) · C A · (B + C) = A · B + A · C (A + B) · C = A · C + B · C
Assoziativgesetz Distributivgesetz Distributivgesetz.
(d) Produkt transponierter Matrizen. Für das Produkt transponierter Matrizen gilt die Beziehung (A · B)T = B T · AT . (e) Multiplikation einer Matrix mit einer Einheitsmatrix. Die Rechts- oder Linksmultiplikation einer Matrix A mit einer Einheitsmatrix I lässt die Matrix A unverändert I ·A= A·I = A . (f ) Partitionierung von Matrizen (Blockmatrizen). Eine Matrix A kann man in geeignete Untermatrizen Ai aufteilen. So gilt z. B. für eine 3 mal 3 Matrix als eine mögliche Aufteilung ⎤ ⎡ a11 a12 a13 A1 A2 ⎦ ⎣ A = a21 a22 a23 = . (A.11) A3 A4 a31 a32 a33 mit A1 =
a11 a12 a21 a22
,
A2 =
a13 a23
,
A3 = a31 a32 ,
A4 = a33 .
438
A Formeln zur Matrizenrechnung
(g) Addition und Subtraktion partitionierter Matrizen. Mit Matrix A nach Gleichung A.11 und B wie folgt ⎡ ⎤ b11 b12 b13 B1 B2 B = ⎣ b21 b22 b23 ⎦ = (A.12) B3 B4 b31 b32 b33 mit
B1 =
b11 b12 b21 b22
,
B2 =
b13 b23
,
B 3 = b31 b32 ,
B 4 = b33 ,
liefert die Addition und Subtraktion dieser partitionierten Matrizen C = A ± B das Ergebnis A1 A2 B1 B2 A1 ± B 1 A2 ± B 2 C = A±B = ± = . A3 A4 B3 B4 A3 ± B 3 A4 ± B 4 (h) Produkt partitionierter Matrizen. Mit den Matrizen A und B nach Gleichung A.11 und A.12 ist das Produkt der partitionierten Matrizen definiert zu A1 A2 B1 B2 A1 B 1 + A2 B 3 A1 B 2 + A2 B 4 C = A·B = · = . A3 A4 B3 B4 A3 B 1 + A4 B 3 A3 B 2 + A4 B 4 (i) Ableitung einer Matrix. Bei der Ableitung einer Matrix nach der Zeit wird jedes einzelne Element nach der Zeit abgeleitet. Es sei ⎤ ⎡ a11 (t) a12 (t) . . . a1n (t) ⎢ a21 (t) a22 (t) . . . a2n (t) ⎥ ⎥ ⎢ A(t) = ⎢ . (A.13) ⎥ . .. .. ⎦ ⎣ .. . . am1 (t) am2 (t) . . . amn (t) Dann gilt für die Ableitung ⎡
⎤• a11 (t) a12 (t) . . . a1n (t) ⎢ a21 (t) a22 (t) . . . a2n (t) ⎥ dA(t) ⎢ ⎥ ˙ = A(t) =⎢ . ⎥ = .. .. dt ⎣ .. ⎦ . . am1 (t) am2 (t) . . . amn (t) ⎡ ⎢ ⎢ ⎢ ⎢ =⎢ ⎢ ⎢ ⎣
da1n (t) da11 (t) da12 (t) ... dt dt dt da21 (t) da22 (t) da2n (t) ... dt dt dt .. .. .. . . . dam1 (t) dam2 (t) damn (t) ... dt dt dt
⎤ ⎥ ⎥ ⎥ ⎥ ⎥ . ⎥ ⎥ ⎦
A.2 Determinanten, Minoren und Kofaktoren
439
(j) Integration einer Matrix. Bei der Integration einer Matrix über die Zeit wird jedes einzelne Element integriert. Somit gilt für A nach Gleichung A.13 ⎡ ⎤ t t t a12 (τ )dτ . . . a1n (τ )dτ ⎥ ⎢ a11 (τ )dτ ⎢ 0 ⎥ 0 0 ⎢ ⎥ t t ⎢ t ⎥ t a22 (τ )dτ . . . a2n (τ )dτ ⎥ ⎢ a21 (τ )dτ ⎥ . A(τ )dτ = ⎢ 0 0 0 ⎢ ⎥ .. .. .. ⎢ ⎥ 0 ⎢ ⎥ . . . ⎢ t ⎥ t t ⎣ ⎦ am1 (τ )dτ am2 (τ )dτ . . . amn (τ )dτ 0
A.2
0
0
Determinanten, Minoren und Kofaktoren
Determinanten. Die Determinante einer quadratischen Matrix A, bezeichnet mit „Det“ oder mit zwei senkrechten Strichen | . . . |, ist wie folgt definiert: a11 a12 . . . a1n n a21 a22 . . . a2n Det(A) = |A| = . aij · γij mit i = ∈ (1, . . . , n) = . . .. .. .. j=1 an1 an2 . . . ann mit γij als die nachfolgend definierten Kofaktoren. Für i kann ein beliebiger Wert von 1 bis n genommen werden! Die Determinante einer quadratischen 2 mal 2 Matrix A ist wie folgt definiert: a a Det(A) = |A| = 11 12 = a11 a22 − a12 a21 . a21 a22 Minoren. Der Minor |M ij | einer Matrix ist die Determinante der Matrix A wenn man Zeile i und Spalte j streicht. Beispiel A.4 Minor einer Matrix. Der Minor |M 12 | der 3 mal 3 Matrix ⎡ ⎤ a11 a12 a13 A = ⎣ a21 a22 a23 ⎦ a31 a32 a33 lautet
(A.14)
a21 a23 = a21 a33 − a23 a31 . |M 12 | = a31 a33
440
A Formeln zur Matrizenrechnung
Kofaktoren. Der Kofaktor γij einer Matrix ist gleich dem Minor |M ij | der Matrix multipliziert mit (−1)i+j , also γij = (−1)i+j · |M ij | .
Beispiel A.5 Kofaktor einer Matrix. Der Kofaktor γ12 der 3 mal 3 Matrix nach Gleichung A.14 lautet a a γ12 = (−1)1+2 · |M 12 | = (−1) · 21 23 a31 a33 = (−1) · (a21 a33 − a23 a31 ) = a23 a31 − a21 a33 Beispiel A.6 Determinante einer 2 × 2 Matrix. Die Determinante der nachfolgenden Matrix A a11 a12 A= a21 a22 lautet Det(A) =
2
aij · γij
für z. B. i = 1
j=1
= a11 · γ11 + a12 · γ12 = a11 · a22 + a12 · (−1) · a21 = a11 a22 − a12 a21
Beispiel A.7 Determinante einer 3 × 3 Matrix. Die Determinante der nachfolgenden Matrix A ⎡ ⎤ a11 a12 a13 A = ⎣ a21 a22 a23 ⎦ a31 a32 a33 lautet Det(A) =
3
aij · γij
für z. B. i = 2
j=1
= a21 · γ21 + a22 · γ22 + a23 · γ23 = a21 · (−1) · |M 21 | + a22 · (+1) · |M 22 | + a23 · (−1) · |M 23 | = a21 · (−1) · (a12 a33 − a13 a32 ) + a22 · (+1) · (a11 a33 − a13 a31 ) + a23 · (−1) · (a11 a32 − a12 a31 ) = a11 a22 a33 + a12 a23 a31 + a13 a21 a32 − a13 a22 a31 − a12 a21 a33 − a11 a23 a32 .
A.2 Determinanten, Minoren und Kofaktoren
441
Regeln zur Berechnung von Determinanten. (a) Multiplikation mit einer Konstanten c. Die Multiplikation einer Zeile (oder Spalte) einer Matrix mit einer Konstanten c ändert den Wert der Determinanten nicht. (b) Vertauschen von Zeilen und Spalten. Das Vertauschen zweier beliebiger Zeilen (oder Spalten) einer Matrix ändert den Wert der Determinanten nicht. (c) Addieren des Vielfachen einer Zeile oder Spalte. Addiert man zu einer Zeile (oder Spalte) das Vielfache einer anderen Zeile (bzw. Spalte), so ändert das den Wert der Determinanten nicht. (d) Determinante der transponierten Matrix. Transponieren einer Matrix ändert den Wert der Determinanten nicht, |A| = |AT | . (d) Determinante eines Produkts. Sind A und B zwei beliebige quadratische Matrizen, dann gilt für die Determinante des Produkts |A · B| = |A| · |B| = |B · A| . Singuläre Matrizen. Eine quadratische Matrix, deren Determinante den Wert Null aufweist, heißt singuläre Matrix. Ist der Wert der Determinanten ungleich Null, so heißt die Matrix nichtsingulär. Cramer’sche Regel. Die Auflösung des linearen Gleichungssystems A·x = y (Matrix A nichtsingulär) nach dem Vektor x = [ x1 x2 . . . xn ]T ist gegeben zu xi =
DetAi , DetA
mit Ai als die Matrix, bei der Spalte i durch den Vektor y ersetzt ist. Beispiel A.8 Cramer’sche Regel. Gegeben sei ein lineares Gleichungssystem zweiter Ordnung A · x = y mit nichtsingulärer Matrix A zu a11 a12 x1 y1 · = . a21 a22 x2 y2 Dann ist y1 a12 5 a11 DetA1 = x1 = y2 a22 a21 DetA a11 y1 5 a11 DetA2 = x2 = a21 y2 a21 DetA
a12 = a22 a12 = a22
y1 a22 − y2 a12 a11 a22 − a12 a21 a11 y2 − a21 y1 a11 a22 − a12 a21
442
A Formeln zur Matrizenrechnung
Determinanten von Blockmatrizen. (a) Beziehung 1. Für quadratische Blockmatrizen A und B gilt A 0 Det = Det(A) · Det(B) C B (b) Beziehung 2. Falls die Matrix A nichtsingulär ist, gilt A D Det = Det(A) · Det(B − CA−1 D) . C B (c) Beziehung 3. Für rechteckige Matrizen A (n mal m) und B (m mal n) gilt die Beziehung |I n − AB| = |I m − BA| mit I j als Einheitsmatrizen der Ordnung j.
A.3
Adjungierte und inverse Matrizen
Adjungierte Matrix. Bildet man für eine quadratische Matrix A mit den Kofaktoren γi,j eine neue Matrix aus den Kofaktoren γj,i , so bezeichnet man diese neue Matrix als adjungierte Matrix von A Adj A = [γj,i ] . Die adjungierte Matrix ist die Transponierte der Matrix die entsteht, wenn man die Elemente ai,j durch ihre Kofaktoren ersetzt. Beispiel A.9 Transponierte Matrix. Gesucht ist die Adjungierte der folgenden Matrix ⎡ ⎤ 2 3 −1 A=⎣ 1 4 2 ⎦ . −2 −1 1 Es lauten die Kofaktoren γ11 = 6 γ12 = −5 γ13 = 7 γ21 = −2 γ22 = 0 γ23 = −4 γ31 = 10 γ32 = −5 γ33 = 5 und somit ergibt sich die Adjungierte zu ⎡ ⎤ 6 −2 10 AdjA = [γj,i ] = ⎣ −5 0 −5 ⎦ . 7 −4 5
A.3 Adjungierte und inverse Matrizen
443
Inverse Matrix. Ergibt das Produkt zweier quadratischer Matrizen A und B die Einheitsmatrix A·B =I , so nennt man die Matrix B die inverse oder reziproke Matrix von A und1 kennzeichnet sie durch ein hochgesetztes “−1“ B = A−1 . Es gilt also A · A−1 = I , bzw. ebenso A−1 ·A = I . Man berechnet die Inverse einer Matrix mittels der Beziehung A−1 =
Adj A |A|
vorausgesetzt
|A| = 0 .
Beispiel A.10 Inverse Matrix. Gesucht ist die Inverse der folgenden 2 mal 2 Matrix: a11 a12 A= . a21 a22 Es lauten die Adjungierte a22 −a12 AdjA = −a21 a11 und die Determinante |A| = a11 a22 − a12 a21 . Damit lautet die Inverse der Matrix A dann a22 −a12 −a21 a11 A−1 = . a11 a22 − a12 a21 Beispiel A.11 Inverse Matrix. Gesucht ist die Inverse der folgenden Matrix ⎡ ⎤ 2 3 −1 A=⎣ 1 4 2 ⎦ . −2 −1 1 1
Es gilt entsprechend ebenso A = B −1 .
444
A Formeln zur Matrizenrechnung
Mit Adj A nach Beispiel A.9 zu ⎡
⎤ 6 −2 10 AdjA = [γj,i ] = ⎣ −5 0 −5 ⎦ , 7 −4 5 und |A| = −10 resultiert ⎡
A−1
⎤ 6 −2 10 ⎣ −5 0 −5 ⎦ ⎡ ⎤ −0,6 0,2 −1 7 −4 5 Adj A = = ⎣ 0,5 0 0,5 ⎦ . = |A| −10 −0,7 0,4 −0,5
Probe: ⎡
A · A−1
⎤ ⎡ ⎤ ⎡ ⎤ 2 3 −1 −0,6 0,2 −1 1 0 0 = ⎣ 1 4 2 ⎦ · ⎣ 0,5 0 0,5 ⎦ = ⎣ 0 1 0 ⎦ = I . −2 −1 1 −0,7 0,4 −0,5 0 0 1
Inverse des Produkts zweier Matrizen. Für die Inverse des Produkts zweier quadratischer Matrizen gilt −1
(A · B)
= B −1 · A−1 .
Ableitung der Inversen einer Matrix. Für die Ableitung der Inversen einer quadratischen Matrix gilt d −1 ˙ · A−1 (t) . A (t) = −A−1 (t) · A(t) dt Diese Beziehung kann man herleiten aus dem Zusammenhang dI d −1 =0, A (t)A = dt dt wobei die Anwendung der Produktregel der Differentiation liefert: A−1 A˙ +
d −1 A (t) A(t) = 0 . dt
A.4 Lineare Unabhängigkeit, Rang einer Matrix
A.4
445
Lineare Unabhängigkeit, Rang einer Matrix
Lineare Unabhängigkeit. Ein Satz von m Vektoren xi mit jeweils n Komponenten x1i , x2i . . . xni , also ⎡
x1i ⎢ x2i ⎢ xi = ⎢ . ⎣ ..
⎤ ⎥ ⎥ ⎥ ⎦
für
i = 1, 2 . . . m
xni heißt linear unabhängig, wenn keine Konstanten k1 , k2 . . . km (mit mindestens einem ki ungleich Null) derart existieren, dass die folgende Gleichung erfüllt wird k1 x1 + k2 x2 + . . . + km xm = 0 .
(A.15)
Findet man Konstanten ki , sodass Gleichung A.15 erfüllt wird, dann nennt man die Vektoren xi linear abhängig. Beispiel A.12 Linear abhängige Vektoren. Die zwei Vektoren ⎡ ⎤ 1 x1 = ⎣ 2 ⎦ 3
und
⎡ ⎤ 2 x2 = ⎣ 4 ⎦ 6
sind linear abhängig, da für k1 = −2 und k2 = 1 gilt ⎡ ⎤ ⎡ ⎤ ⎡ ⎤ 1 2 0 −2x1 + x2 = −2 ⎣ 2 ⎦ + ⎣ 4 ⎦ = ⎣ 0 ⎦ 3 6 0 Beispiel A.13 Linear unabhängige Vektoren. Die zwei Vektoren x1 =
1 3
und
x2 =
2 4
sind linear unabhängig, da nur für k1 = k2 = 0 gilt k1 x1 + k2 x2 = 0 .
446
A Formeln zur Matrizenrechnung
Rang einer Matrix. Der Rang r einer nicht notwendigerweise quadratischen Matrix A ist die Ordnung r des größten quadratischen Feldes in A, dessen Determinante ungleich Null ist. Beispiel A.14 Rang einer Matrix. Gegeben sei die Matrix 2 3 A= . 1 4 Die Determinante von A ist gleich 5, d. h. die Matrix ist nichtsingulär. Somit gilt Rang(A) = r = 2. Beispiel A.15 Rang einer Matrix. Gegeben sei die Matrix ⎡ ⎤ 2 3 1 A =⎣1 4 3⎦ . 1 3 2 Da die Determinante von A gleich Null wird, d. h. die Matrix singulär ist, kann der Rang r nicht gleich r1 = 3 sein. Die Überprüfung eines beliebigen quadratischen Feldes in A wie z. B. das Feld bestehend aus den Elementen a11 , a12 , a21 und a22 , ergibt 2 3 = 5 = 0 . |A1 | = 1 4 Somit ist der Rang r der Matrix A gleich zwei.
Spaltenrang, Zeilenrang einer Matrix. (a) Spaltenrang einer Matrix. Eine Matrix vom Rang r besitzt höchstens r linear unabhängige Spalten. Man sagt auch, die Matrix hat den Spaltenrang r. Beispiel A.16 Spaltenrang. Gegeben sei die Matrix ⎡ ⎤ 2 3 1 A =⎣1 4 3⎦ , 1 3 2 die nach Beispiel A.15 den Rang zwei hat. Somit hat die Matrix höchstens zwei linear unabhängige Spalten. Man kann zeigen, dass Spalte drei gleich der Differenz der Spalten zwei und eins ist: ⎡ ⎤ ⎡ ⎤ ⎡ ⎤ 1 3 2 ⎣3⎦ =⎣4⎦−⎣1⎦ . 2 3 1
A.5 Eigenwerte und Eigenvektoren. Die drei Spalten sind linear voneinander abhängig.
447
(b) Zeilenrang einer Matrix. Eine Matrix vom Rang r besitzt höchstens r linear unabhängige Zeilen. Man sagt auch, die Matrix hat den Zeilenrang r.
Beispiel A.17 Zeilenrang. Gegeben sei die Matrix ⎡
⎤ 2 3 1 A=⎣1 4 3⎦ , 1 3 2 die nach Beispiel A.15 den Rang zwei hat. Somit hat die Matrix höchstens zwei linear unabhängige Zeilen. Man kann zeigen, dass z. B. gilt “Zeile eins ist gleich fünfmal Zeile drei minus dreimal Zeile zwei“:
2 3 1 =5 1 3 2 −3 1 4 3 .
Die drei Zeilen sind linear voneinander abhängig.
(c) Zeilen- und Spaltenrang einer Matrix. Der Zeilenrang einer Matrix ist gleich dem Spaltenrang der Matrix. (d) Rang, Zeilen- und Spaltenrang einer Matrix. Der Zeilen-/Spaltenrang und der über die Determinantenbedingung definierte Rang einer Matrix sind identisch. Daher spricht man generell nur vom Rang einer Matrix, den man als Rang(A) schreibt.
A.5
Eigenwerte und Eigenvektoren.
Eigenwerte, Eigenvektoren. Es wird das nachfolgend gegebene lineare Gleichungssystem y = Ax = λx mit A als quadratische n × n Matrix betrachtet. Der Vektor x = 0, der die Gleichung Ax = λx
(A.16)
erfüllt, heißt Eigenvektor der Matrix A und der zugehörige Skalar λ heißt Eigenwert. Die Umformung von Gleichung A.16 führt zu der Gleichung [λI − A] x = 0 .
(A.17)
Gleichung A.17 hat nur dann eine nichttriviale Lösung für x ungleich Null, wenn die folgende Determinante verschwindet Det(λI − A) = 0 .
(A.18)
448
A Formeln zur Matrizenrechnung
Charakteristische Gleichung. Die Ermittlung der Determinanten der Gleichung A.18 führt zu einem Polynomgleichung n-ter Ordnung in λ P (λ) = λn + an−1 λn−1 + . . . + a1 λ + a0 = 0 .
(A.19)
Diese Gleichung nennt man charakteristische Gleichung der Matrix A und das Polynom das charakteristische Polynom. Die n Nullstellen (Wurzeln) λi der charakteristischen Gleichung heißen charakteristische Werte oder Eigenwerte von A. Die Eigenwerte können einfach oder mehrfach, reell oder konjugiert komplex sein. Nach dem Satz von Vieta kann man das charakteristische Polynom faktorisieren zu P (λ) = (λ − λ1 )(λ − λ2 ) · · · (λ − λn ) . Das Produkt der Eigenwerte einer quadratischen Matrix ist gleich der Determinanten der Matrix λ1 λ2 · · · λn = |A| . Die Summe der Eigenwerte einer Matrix ist gleich der Spur der Matrix. Dabei versteht man unter der Spur einer Matrix die Summe der Hauptdiagonalelemente λ1 + λ2 + · · · + λn = SpurA =
n
aii .
i=1
Lineare Unabhängigkeit der Eigenvektoren. Wenn die n Eigenwerte λi der Matrix A verschieden sind, dann gehört zu jedem Eigenwert λi ein Eigenvektor xi . Diese Eigenwerte xi sind die Lösung der Gleichung [λi I − A] xi = 0
(i = 1, 2, . . . , n) .
Wenn A unterschiedliche Eigenwerte besitzt, dann sind die zugehörigen Eigenvektoren linear unabhängig. Beispiel A.18 Eigenwerte, Eigenvektoren. Gegeben sei die Matrix 1 4 A= . 3 2 Die charakteristische Gleichung der Matrix lautet λ − 1 −4 |λI − A| = = P (λ) = λ2 − 3λ − 10 . −3 λ − 2
A.5 Eigenwerte und Eigenvektoren.
449
Die Nullstellen der charakteristischen Gleichung bzw. die Eigenwerte der Matrix A sind λ1 = +5 und λ2 = −2 . Dann gilt nach dem Satz von Vieta P (λ) = (λ − λ1 )(λ − λ2 ) = (λ − 5)(λ + 2) = λ2 − 3λ − 10 . Den zu λ1 = +5 gehörenden Eigenvektor berechnet man aus [λ1 I − A] x1 =
4 −4 x1 = 0 −3 3
zu 1 x1 = 1
bzw. auf die Länge Eins normiert zu x1 =
√ 1/√2 . 1/ 2
Den zu λ2 = −2 gehörenden Eigenvektor berechnet man aus [λ2 I − A] x2 =
−3 −4 x2 = 0 −3 −4
zu x2 =
−4 3
bzw. auf die Länge Eins normiert zu x2 =
−0,8 0,6
.
Das Produkt der Eigenwerte von A, d. h. λ1 · λ2 = −10 ist gleich der Determinanten von A, d. h. 1 4 = 2 − 12 = −10 . 3 2
Die Summe der Eigenwerte λ1 + λ2 = +3 ist gleich der Spur der Matrix SpurA =
n
aii = 1 + 2 = 3 .
i=1
Die Eigenvektoren x1 und x2 sind linear unabhängig.
450
A.6
A Formeln zur Matrizenrechnung
Das Caley-Hamilton-Theorem.
Das Caley-Hamilton-Theorem. Es sei A eine quadratische n × n Matrix mit dem charakteristischen Polynom P (λ) = λn +an−1 λn−1 +. . .+a1 λ+a0 . Das Caley-HamiltonTheorem besagt, dass jede quadratische Matrix ihre eigene charakteristische Gleichung erfüllt, d. h. es gilt dann P (A) = An + an−1 An−1 + . . . + a1 A + a0 I = 0 .
Beispiel A.19 Caley-Hamilton-Theorem. Gegeben sei die Matrix 1 2 A= . 4 3 Die charakteristische Gleichung lautet λ − 1 −2 |λI − A| = = P (λ) = λ2 − 4λ − 5 = 0 . −4 λ − 3 Die Nullstellen der charakteristischen Gleichung, d. h. die Eigenwerte von A sind dann und
λ1 = 5
λ2 = −1 .
Nach dem Caley-Hamilton-Theorem gilt P (A) = A2 − 4A − 5I = 0 . Es gilt mit
2
A = dann
9 8 16 17
9 8 1 2 1 0 0 0 −4 −5 = 16 17 4 3 0 1 0 0
q.e.d.
A.7
Definite und semidefinite Matrizen, Normen von Vektoren und Matrizen, Orthogonalität
Positiv semidefinite Matrix. Die Matrix A ist positiv semidefinit, wenn die folgende quadratische Form xT Ax ≥ 0 für alle Vektoren x erfüllt ist.
A.7 Definite und semidefinite Matrizen, Normen, Orthogonalität
451
Positiv definite Matrix. Die Matrix A ist positiv definit, wenn die folgende quadratische Form xT Ax ≥ 0 nur für x ≡ 0 mit dem Gleichheitszeichen erfüllt wird. Test der Definitheit mittels Eigenwertberechnung. Eine Matrix A ist positiv definit (bzw. semidefinit), wenn alle Eigenwerte der Matrix positiv (bzw. nichtnegativ) sind. Beispiel A.20 Test auf Definitheit. Gegeben sei die Matrix 1 2 A= . 4 3 Die Eigenwerte der Matrix sind λ1 = 5 und λ2 = −1. Die Eigenwerte sind weder alle positiv oder nichtnegativ. Die Matrix ist weder positiv definit noch positiv semidefinit. Beispiel A.21 Test auf Definitheit. Gegeben sei die Matrix 1 2 A= . 0 3 Die Eigenwerte der Matrix sind λ1 = 1 und λ2 = 3. Die Matrix ist positiv definit. Beispiel A.22 Test auf Definitheit. Gegeben sei die Matrix 1 2 A= . 2 4 Die Eigenwerte der Matrix sind λ1 = 0 und λ2 = 5. Die Matrix ist positiv semidefinit. Norm eines Vektors. Man definiert die Länge oder Norm eines Vektors ||x|| als die Wurzel aus der Summe der quadrierten Elemente des Vektors 6 7 n 7 x2i . ||x|| = 8 i=1
452
A Formeln zur Matrizenrechnung
Normen einer Matrix. In Anlehnung an die Norm eines Vektors werden verschiedene Normen einer Matrix, geschrieben als ||A||i , definiert. Für eine n × n Matrix gibt es z. B. folgende Definitionen von Normen: (a) Frobenius-Norm. 6 7 n 7 n ||A||1 = 8 a2ij . i=1 j=1
(b) Spur der Matrix. ||A||2 = SpurA . (c) Maximaler Eigenwert der Matrix. ||A||3 = max λi i
Orthogonalität. Zwei n-Vektoren x und y sind orthogonal, wenn gilt xT · y = 0. Beispiel A.23 Orthogonalität. Gegeben seien die Vektoren 1 −3 x= und y = . 3 1 Wegen −3 = 1 · (−3) + 3 · 1 = 0 . xT · y = 1 3 · 1 sind die beiden Vektoren orthogonal.
Beispiel A.24 Orthogonales Koordinatensystem. Die Achsen eines orthogonalen Koordinatensystems stehen senkrecht aufeinander. Es seien die Einheitsvektoren in x-, y- und z-Richtung ⎡ ⎤ ⎡ ⎤ ⎡ ⎤ 1 0 0 ey = ⎣ 1 ⎦ ez = ⎣ 0 ⎦ . ex = ⎣ 0 ⎦ 0 0 1 Wegen eTx · ey = eTx · ez = eTy · ez = 0 sind die drei Vektoren orthogonal zueinander, sie stehen senkrecht aufeinander.
Literaturverzeichnis [1] J. Ackermann: Abtastregelung, Springer Verlag, Berlin Heidelberg, (1988) [2] J. Ackermann: Der Entwurf linearer Regelungssysteme im Zustandsraum, Regelungstechnik und Prozessdatenverarbeitung 7, S. 297 - 300, (1972) [3] Brian D. O. Anderson, John B. Moore, Linear Optimal Control, Prentice Hall, Inc., Englewood Cliffs, New Jersey, (1971) [4] S. Aoki et al: Application of Fuzzy Control Logic for Dead-Time Processes in a Glass Melting Furnace, Fuzzy Sets and Systems 38, 1990, S. 252 - 265 [5] K. J. Åstrøm, B. Wittenmark, Adaptive Control, 2. Auflage, Addison-Wesley Publishing Company, Reading Mass., 1995 [6] K. J. Åstrøm, T. Hägglung, Automatic Tuning of PID-Controllers, Instr. Society of America, (ISBN 1-55617-081-5), 1988 [7] J. D’Azzo, C. H. Houpis: Linear Control System - Analysis and Design, McGrawHill Book Company, New York, 1981 [8] Cs. Bányasz, L. Keviczky: Direct methods for self-tuning PID-regulators, Proc. 6th IFAC-Symp. on Identification, Washington 1982, Oxford: Pergamon Press [9] R. W. Bass, I. Gura: High Order Design via State-Space Considerations, Proceedings of the 1965 Joint Automatic Control Conference, Troy, N.Y., 1965, S. 311 318 [10] Stefan Bergold, et al.: Entwurf und Erprobung eines Entkopplungsreglers am Beispiel einer Rektifikationskolonne, Automatisierungstechnische Praxis 41, (1999), Heft 3, S. 25 - 34 [11] F. M. Brasch, J. B. Pearson: Pole placement using dynamic compensators, IEEE Trans. AC (1970), Nr. 15, S. 34 – 43
454
Literaturverzeichnis
[12] R. W. Brockett: Finite Dimensional Linear Systems, John Wiley and Sons Inc., New York, 1970 [13] I. N. Bronstein, K.A. Semendjajew: Taschenbuch der Mathematik, Verlag Harri Deutsch, Thun und Frankfurt/Main, 1981 [14] E. B. Dahlin: Designing and tuning digital controllers, Instr. Control Sys. 41, 1968, 77 - 83 und 87 - 92 [15] K. C. Daly: The computation of Luenberger canonical forms using elementary similarity transformations, Int. Journal of Systems Sci., 1976, Vol. 7, No. 1, S. 1 15 [16] E. J. Davison, A. Goldenberg: Robust Control of a General Servomechanism Problem: The Servo Compensator, Automatica, Vol. 11, (1975), No. 5, S. 461 - 471 [17] E. J. Davison: The Output Control of Linear Time-Invariant Multivariable Systems with Unmeasurable Arbitrary Disturbances, IEEE Trans. on Aut. Control 17, (1972), No. 5, S. 209 - 231 [18] P. M. DeRusso, R. J. Roy, C. M. Close: State Variables for Engineers, John Wiley & Sons, Inc., New York, 1967 [19] F. Dörrscheidt, W. Latzel: Grundlagen der Regelungstechnik, Teubner Verlag, Stuttgart, 1989 [20] K. Dutton, S. Thompson, B. Barraclough: The Art of Control Engineering, Pearson Education Limited, Essex, 1997 [21] E. G. Feindt: Regeln mit dem Rechner, Oldenbourg-Verlag, München 1990 [22] O. Föllinger: Regelungstechnik, 5. Auflage, Hüthig Verlag, Heidelberg, 1985 [23] O. Föllinger: Lineare Abtastsysteme, R. Oldenbourg Verlag, München, 1990 [24] G. F. Franklin, J. D. Powell, M. L. Workman: Digital Control of Dynamic Systems, Addison-Wesley Publishing Company, Reading Mass., 1990 [25] D. Gariglio: Fuzzy in der Praxis, Elektronik 20, 1991
Literaturverzeichnis
455
[26] B. Gopinath: On the Control of Linear Multiple Input-Output Systems, Bell Sys. Techn. Journal, 50 , March 1971 [27] B. P. Graham, P. B. Newell: Fuzzy Identification and Control of a Liquid Level Rig, Fuzzy Sets and Systems 26, 1988 [28] P. Hippe: Windup in Control - Its Effects and Their Prevention, Springer Verlag, Berlin/Heidelberg, 2006 [29] P. Hippe, Ch. Wurmthaler: Zustandsregelung, Springer Verlag, Berlin/Heidelberg, 1985 [30] L. P. Holmblad, J. J. Østergaard: Control of a cement kiln by fuzzy logic, in M. M. Gupta, E. Sanches (eds): Fuzzy Information and Decision Processes, North-Holland 1982, S. 389 - 399 [31] R. Isermann: Digitale Regelsysteme I, (Bd. 1: Grundlagen, Deterministische Regelungen), Springer Verlag, Berlin 1988 [32] R. Isermann: Digitale Regelsysteme II, (Bd. 2: Stochastische Regelungen, Mehrgrößenregelungen, Adaptive Regelungen, ..), Springer Verlag, Berlin 1987 [33] E. I. Jury: Theory and Application of the z-transform Method, J. Wiley and Sons, New York, 1964 [34] J. Kahlert: Fuzzy-Control für Ingenieure, Vieweg-Verlag, Braunschweig/Wiesbaden, 1995 [35] J. Kahlert, H. Frank : Fuzzy-Logik und Control, Vieweg-Verlag, Braunschweig /Wiesbaden, 1993 [36] T. Kailath: Linear Systems, Prentice-Hall, Inc., Englewood Cliffs, N. J., 1980 [37] R. E. Kalman: Kronecker Invariants and Feedback. in Ordinary Differential Equations, (L. Weiss, ed.), Academic Press, New York, 1972, S. 459 –471. [38] J. Kautsky, N. K. Nichols, P. van Dooren: Robust pole assignment in linear state feedback, Int. J. Control, 1985, Vol. 41, No. 5, S. 1129 – 1155 [39] W. J. M. Kickert, E. H. Mamdani: Analysis of a Fuzzy Logic Controller, Fuzzy Sets and Systems 1, 1978, S. 29 - 44
456
Literaturverzeichnis
[40] P. J. King, E. H. Mamdani: The application of fuzzy control to industrial processes, Automatica 13, 1977 [41] R. Kofahl, R. Isermann: A simple method for automatic tuning of PID-controllers based on process parameter estimation, American Control Conference Boston, 1985 [42] B. C. Kuo: Digital Control Systems, Verlag Holt, Rinehard and Winston Inc., New York, 1980 [43] Chr. Landgraf, G. Schneider: Elemente der Regelungstechnik, Springer Verlag, Berlin/Heidelberg, 1970 [44] L. I. Larkin: A fuzzy logic controller for aircraft flight control, in M. Sugeno (ed): Industrial Applications of Fuzzy-Control, North-Holland 1985, S. 87 - 98 [45] W. Leonhard: Einführung in die Regelungstechnik, Vieweg Verlag, Braunschweig/München, 1985 [46] M. Lichtenberg: Generierung kennliniengleicher Fuzzy-Regler aus den Parametern konventioneller (PID-)Regler, Automatisierungstechnik 12, 1994, S. 540 - 546 [47] D. P. Lindorff: Theory of sampled-data control systems, McGraw Hill, New York, 1965 [48] D. G. Luenberger: Canonical forms for multivariable systems, IEEE Trans. AC, 1967, Nr. 12, S. 290 – 293. [49] J. Lunze: Regelungstechnik 1, Springer Verlag. Berlin Heidelberg, 6. Auflage, 2007 [50] J. Lunze: Regelungstechnik 2, Springer Verlag. Berlin Heidelberg, 4. Auflage, 2006 [51] E. H. Mamdani: Advances in the linguistic synthesis of fuzzy controllers, Int. Journal Man-Machine-Studies, 8, 1976, S. 669 - 678 [52] E. H. Mamdani, N. Baaklini: Prescriptive Methodes for deriving control policy in fuzzy logic controller, Electronic Letters 11, 1975, S. 625 - 626 [53] H. Mann, H. Schiffelgen, R. Froriep: Einführung in die Regelungstechnik, Carl Hanser Verlag, München Wien, 2005
Literaturverzeichnis
457
[54] D. McRuer, I. Ashkenas, D. Graham: Aircraft Dynamics and Automatic Control, Princeton University Press, Princeton, New Jersey, 1973 [55] C. Moler, C. van Loan: Nineteen Dubious Ways to Compute the Exponential of a Matrix, SIAM Review Vol. 20, 1978 , p. 801 - 836 [56] C. Moler, C. van Loan: Nineteen Dubious Ways to Compute the Exponential of a Matrix, Twenty-Five Years Later, SIAM Review Vol. 45, No. 1, 2003 , p. 1 - 46 [57] W. Oppelt: Kleines Handbuch technischer Regelvorgänge, 5. Auflage, Verlag Chemie, 1972 [58] R. Palm: Steuerung eines sensorgeführten Roboters unter Berücksichtigung eines unscharfen Regelkonzepts, msr 32, 1989, S. 210 - 213 [59] V. M. Popov: Hyperstability of Control Systems, Springer Verlag, Berlin-Heidelberg, 1973 [60] J. R. Ragazzini, G. F. Franklin: Sampled Data Control Systems, McGraw-Hill, New York, 1958 [61] H. Rasmussen: Automatic Tuning of PID-Regulators, Aalborg University, (ISBN 0908-1208), 1993 [62] M. Reuter: Regelungstechnik für Ingenieure, Vieweg Verlag, Braunschweig/Wiesbaden, 1986 [63] A. P. Sage, J. L:. Melsa Estimation Theory with Applications to Communications and Control, McGraw Hill Book Comp., New York, 1971 [64] G. Schmidt: Grundlagen der Regelungstechnik, Springer Verlag, Berlin/Heidelberg, 1987 [65] G. Schulz: Regelungstechnik 1, Oldenbourg Verlag, München, 4. Auflage, 2010 [66] G. W. Stewart: Introduction into Matrix Computations, Academic Press, New York, 1973 [67] M. Sugeno: An Introductory Survey of Fuzzy Control, Information Sciences 36, 1985, S. 59 - 83
458
Literaturverzeichnis
[68] Y. Takahashi, C. Chan, D. Auslander: Parametereinstellung bei linearen DDCAlgorithmen, Regelungstechnik, Bd. 19, 1971, S. 237 - 244 [69] H. Unbehauen: Regelungstechnik II (Zustandsregelungen, digitale und nichtlineare Regelsysteme), Verlag Vieweg und Sohn, Braunschweig/Wiesbaden, 1989 [70] H. Unbehauen: Regelungstechnik III, Vieweg Verlag, Braunschweig, 1985 [71] Cheng-Ching Yu: Autotuning of PID-Controllers, Springer-Verlag, London, 1999 [72] W. Weber: Ein systematisches Verfahren zum Entwurf linearer und adaptiver Regelungssysteme, ETZ-A 88, (1967), S. 138 - 144 [73] W. Weber: Ein leicht zu berechnender Regler für vorgeschriebenes Zeitverhalten des Regelkreises, Zeitschrift Regelungstechnik, (1968), Heft 6, S. 260 - 262 [74] G. Weihrich: Mehrgrößen-Zustandsregelung unter Einwirkung von Stör- und Führungssignalen, Regelungstechnik, 1977, Heft 6, S. 166 - 172 und Heft 7, S. 204 - 208
[75] M. F. Weilenmann: Robuste Mehrgrößen-Regelung eines Helikopters, Diss. ETH Nr. 10890, Eidgenössische Technische Hochschule, Zürich, 1994 [76] L. A. Zadeh: Fuzzy Sets, Information and Control, 1965, S. 338 - 353 [77] L. A. Zadeh: Fuzzy Logic and Approximate Reasoning, Synthese 30, 1975, S. 407 - 428 [78] L. A. Zadeh: The Concept of a Linguistic Variable and its Application to Approximate Reasoning, Information Science, 8, 1975, S. 199 - 249 und S. 310 - 357
Glossar deutsch – englisch A/D-Wandlung Abklingkonstante Ableitung Abstandsregelung Abtasttheorem Aggregation Ähnlichkeitstransformation algebraische Riccati-Gleichung Aliasing-Effekt Amplitudengang Amplitudenspektrum Anfangswertsatz Anregelzeit Anti-Wind-Up aperiodisch aperiodischer Grenzfall Assoziativgesetz Ausgangsvektorrückführung Ausregelzeit
A/D-conversion damping coefficient derivation distance control sampling theorem aggregation similarity transformation algebraic Riccati equation aliasing effect magnitude diagram magnitude spectrum initial value theorem rise time anti wind-up overdamped critically damped associative law output vector feedback settling time
Bandbreite beobachtbar Beobachtbarkeit Beobachtbarkeitsmatrix Beobachternormalform Beobachtungsnormalform BIBO-Stabilität bilineare Transformation Blockschaltbild Bode-Diagramm Brunovsky-Form
bandwidth observable observability observability matrix observer canonical form observability canonical form BIBO-stability bilinear transformation block diagram Bode diagram, Bode plot Brunovsky form
Caley-Hamilton-Theorem charakteristische Gleichung charakteristische Matrix charakteristisches Polymom Control-Invarianten Cramer’sche Regel
Caley-Hamilton theorem characteristic equation characteristic matrix characteristic polynomial control invariants Cramer’s rule
460
Glossar deutsch – englisch
Dämpfungsgrad D/A-Wandler D/A-Wandlung Dampferzeuger Dead-Beat Dead-Beat-Regler Definitheit Defuzzifizierung Destillationskolonne Diagonalform Diagonalmatrix Differentialgleichung Digitalrechner Distributivgesetz dominantes Polpaar dreiecksförmige Kopplung Dreipunktregler dynamische Kompensation
damping ratio D/A converter D/A conversion steam generator Dead-Beat Dead-Beat controller definiteness defuzzyfication distillation column diagonal form diagonal matrix differential equation digital computer distributive law dominant pair of poles triangular coupling three point controller dynamic compensation
Eigenwert Eingangstransformation Eingangsvektor eingeschwungener Zustand Einheitsmatrix Einheitsrückführung Empfindlichkeit Endwertsatz Exponentialfunktion extern stabil externe Stabilität
eigenvalue input transformation input vector steady state unity matrix unity feedback sensitivity final value theorem exponential function externally stable external stability
Faltungsintegral Faltungsoperator Flugzeug Fourier-Koeffizient Fourier-Reihe Fourier-Transformierte Frequenzbereich Frequenzspektrum Frobenius-Form Führungsverhalten Füllstandsregelung Fuzzifizierung Fuzzy-Implikation Fuzzy-PI-Regler Fuzzy-Regelung
convolution integral convolution operator airplane Fourier coefficient Fourier series Fourier transform frequency domain frequency spectrum Frobenius form command response level control fuzzyfication Fuzzy implication Fuzzy PI controller Fuzzy control
Glossar deutsch – englisch
461
Gegenkopplung geometrische Reihe Geschwindigkeitsalgorithmus Gewichtsfolge Gewichtsfunktion Gleichstrommotor Grenzfrequenz Grundmenge Gütefunktion Gütekriterium
negative feedback geometric series velocity algorithm discrete impulse response impulse response direct current motor, DC motor corner frequency, cut off frequency basic set performance index performance criterion
Halteglied-Äquivalent Hessenberg-Normalform Hubschrauber Hydraulik-Kaskade Hydrauliksystem
hold equivalent Hessenberg canonical form helicopter hydraulic cascade hydraulic system
IAE-Kriterium Imaginärteil Impulsantwort Instabiles System intern stabil interne Stabilität Interrupt-Controller ISE-Kriterium IT2 -Regelstrecke ITAE-Kriterium
IAE criterion imaginary part impulse response unstable system internally stable internal stability interrupt controller ISE criterion IT2 plant ITAE criterion
kanonische From Kaskade Kausalität Kennfläche Kofaktor Kommutativgesetz Kompensator Komplementärmenge Kopplung Kreiskriterium Kreisschaltung
canonical form cascade causality characteristic surface cofactor commutative law compensator complementary set coupling circle criterion feedback loop
linear unabhängig lineare Gleichungen lineare quadratische Regelung Linksmultiplikation Ljapunov-Funktion Ljapunov-Gleichung
linear independent linear equations linear quadratic control left multiplication Ljapunov function, Liapunov function Ljapunov equation, Liapunov equation
462
Glossar deutsch – englisch
Matrix-Riccati-Gleichung Matrixexponentialfunktion MAX-MIN-Inferenz MAX-PROD-Inferenz Mehrgrößensystem Mehrgrößenregler Mikrocontroller MIN-Operator Mitkopplung Modellfolgeregelung modifizierte Riccati-Gleichung
matrix Riccati equation matrix exponential function MAX-MIN inference MAX-PROD inference multivariable system multivariable controller microcontroller MIN operator positive feedback model following control modified Riccati equation
Nennergrad Nennerpolynom NICHT-Operator nichtsinguläre Matrix Normalform Nour-Eldin-Normalform Nullmatrix Nullstelle nummerische Lösung
denominator degree, order of denominator denominator polynomial NOT operator nonsingular matrix canonical form Nour-Eldin canonical form zero matrix zero numerical solution
ODER-Operator orthogonal Ortskurve
OR operator orthogonal locus plot
P-Regler Parallelschaltung Parameterempfindlichkeit PD-Regler PDTD -Regler periodisch Phasengang Phasenrand PI-Mehrgrößenregler PI-Regler PID-Regler Pol Pol-/Nullstellendarstellung Pol-/Nullstellenkompensation Polfestlegung Positionsalgorithmus positiv definit positiv definite Matrix positiv semidefinit positiv semidefinite Matrix Potenzreihenentwicklung
proportional controller parallel connection parameter sensitivity PD controller PDTD controller underdamped, periodic phase plot phase margin PI multivariable controller PI controller PID controller pole pole-zero representation pole-zero compensation pole placement position algorithm positive definite positive definite matrix positive semidefinite positive semidefinite matrix power series expansion
Glossar deutsch – englisch
463
Prämissenrelation PT1 -Regelstrecke PT2 -Regelstrecke PT3 -Regelstrecke Puls-Amplituden-Modulator Pulsfolge
premise relation PT1 plant PT2 plant PT3 plant pulse amplitude modulator pulse series
quadratisches Reglerproblem
quadratic controller problem
Randerweiterung Realteil Rechtsmultiplikation Rechtsverschiebung Regeldifferenz Regelgröße Regelkreis Regelungsnormalform Regler Reglerentwurf Reglerverstärkung Reihenentwicklung Reihenschaltung Rekursionsgleichung rekursive Lösung Relationsmatrix Relationsvorschrift Residuen Residuensatz Resolvente robust Rückwärtsdifferenzenquotient
boundary expansion real part right multiplication right shift control difference controlled variable, control variable control loop control canonical form controller controller design feedback gain series expansion series connection recurrence equation recurrence solution relation matrix relation rule residues residue theorem resolvent robust backward rectangular rule
s-Ebene schiefsymmetrische Matrix Schnittmenge Schwerpunktmethode Semidefinitheit Servo-Kompensator Simulationsdiagramm Singleton singuläre Matrix Sollwert Spaltenmatrix Spaltenrang Spaltenvektor Sprung Sprungfunktion
s plane skew symmetric matrix intersection set center of gravity method semi definiteness servo compensator simulation diagram singleton singular matrix reference input, command column matrix column rank column vector step step function
464
Glossar deutsch – englisch
SPS Spur einer Matrix stabil Stabilität Stationarität statische Rückführung Stellglied Stellgröße Stellungsalgorithmus steuerbar Steuerbarkeit Steuerbarkeitsindex Steuerbarkeitsmatrix Steuerbarkeitsnormalform Störgröße Störgrößenaufschaltung Störgrößenbeobachter Störgrößenkompensation Störverhalten SUM-MIN-Inferenz SUM-PROD-Inferenz symmetrische Matrix
programmable logic controller trace of a matrix stable stability stationarity static feedback actuator manipulated variable, actuating signal position algorithm controllable controllability controllability index controllability matrix controllability canonical form disturbance disturbance rejection disturbance observer disturbance compensator disturbance response SUM-MIN inference SUM-PROD inference symmetrical matrix
Totzeit Trägersignal Transformationsmatrix Transitionsmatrix Transponierte Matrix
dead time, transport lag carrier signal transformation matrix transition matrix transpose matrix
Übertragungsfunktion Übertragungsmatrix UND-Operator UND-Verknüpfung
transfer function transfer matrix AND operator AND connection
verallgemeinerte regelungskanonische Form Vereinigungsmenge Verkopplung Verschiebungssatz Vieta’scher Satz Vorfilter Vorfiltermatrix Vorwärtsdifferenzenquotient
generalized control canonical form union set coupling shift theorem Vieta’s rule prefilter prefilter matrix forward rectangular rule
Glossar deutsch – englisch
465
w-Ebene Wind-Up Wurzelortskurve
w plane wind-up root locus plot
Young-Diagramm
Young diagram
Zählergrad Zählerpolynom Zeilenmatrix Zeilenrang Zeilenvektor Zeitbereich Zustandsbeobachter Zustandsraum Zustandsvariable Zustandsvektorerweiterung Zweipunktregler
numerator degree, order of numerator numerator polynomial row matrix row rank row vector time domain state observer state space state variable state vector expansion two point controller
Namens- und Sachverzeichnis A/D-Wandlung, 284 Abklingkonstante, 267, 305 Ableitung, 438, 444 Abstandsregelung, 428, 429 Abtasttheorem, 208, 266, 267, 288, 310 Ackermann, 85, 257 Ähnlichkeitstransformation, 63, 82, 87 Aggregation, 387, 389, 391, 392 algebraische Riccati-Gleichung, 114, 118, 121 Aliasing Effekt, 210 Amplitudengang, 287, 288, 290, 309, 310, 313, 315 Amplitudenrand, 309, 315, 318 Amplitudenspektrum, 206 Anfangswertsatz, 224 Anregelzeit, 305, 308, 309, 317 Anti-Wind-Up, 296–298 ARMA-Modell, 347 Assoziativgesetz, 436, 437 Åstrøm, 341, 342 Ausgangsvektorrückführung, 152, 154, 157, 158, 160 Ausregelzeit, 268, 305, 308, 309, 318 Autotuning, 342 Bandbreite, 207, 209, 210, 309, 317 beobachtbar, 45 Beobachtbarkeit, 35, 45, 81, 113, 121, 140, 143, 153 Beobachtbarkeitsmatrix, 57–63, 66 Beobachtbarkeitsnormalform, 79 Beobachternormalform, 79 Beobachtungsnormalform, 17, 62, 64, 66, 67, 256, 257 Bessel-Prototypenentwurf, 99 Bessel-Übertragungsfunktion, 96 Bezout-Identität, 336 BIBO-Stabilität, 43
bilineare Transformation, 276, 306, 311, 312 Brunovsky-Form, 76–79, 87–89, 91, 92, 133 Caley-Hamilton-Theorem, 52, 56 charakteristische Gleichung, 43, 44, 69, 70, 82, 128, 144, 263, 265, 271, 303, 306, 448 charakteristische Matrix, 20, 43 charakteristisches Polynom, 83, 86, 145, 448 Chien, 341 Control Invarianten, 73 Cramer’sche Regel, 441 D/A-Wandler, 200 D/A-Wandlung, 284 Dahlin, 322, 339 Daly, 74 Dampferzeuger, 23, 27, 28, 34, 35, 51 Davison, 161, 165, 172 Dead-Beat, 315, 317, 318 Dead-Beat-Regler, 329 Definitheit, 153 Defuzzifizierung, 400, 401, 403, 407, 411–417 DeRusso, 433 Destillationskolonne, 26, 27, 34, 51 Diagonalform, 16, 17, 257, 258 Diagonalmatrix, 434 Digitalrechner, 199, 200, 202, 203 Diophantine-Gleichung, 336 Distributivgesetz, 437 dominantes Polpaar, 106, 304, 305, 308 dominierendes Polpaar, 94 Doppelpol, 102 DORA, 116 dreiecksförmige Kopplung, 69, 71 Dreipunktregler, 407, 408, 432
468
Namens- und Sachverzeichnis
Dutton, 341 dynamische Kompensation, 6, 341, 345
Gütekriterium, 101, 107, 108, 115, 116, 120, 121, 123, 133
Eigenwert, 21, 43–45, 63, 132, 144 Eingangstransformation, 77 Einheitsmatrix, 434, 437, 443 Einheitsrückführung, 49 Einheitsverzögerung, 253, 254 Endwertsatz, 224 Exponentialfunktion, 36 extern stabil, 45 externe Stabilität, 45, 259
Hagglund, 342 Halteglied-Äquivalent, 247, 284, 289, 290 Hessenberg-Normalform, 79 Hippe, 125, 142, 183 Hrones, 341 Hubschrauber, 26, 33, 44, 45, 51, 61, 119, 139 Hydraulik-Kaskade, 25, 31, 32, 92–94, 119, 145, 146, 150, 156, 157, 163, 177, 178 Hydrauliksystem, 23, 25, 51
Faltungsoperator, 223 Faltungssatz, 223 Flugzeug, 23 Fourier-Koeffizient, 206, 207 Fourier-Reihe, 205, 206 Fourier-Transformierte, 207 Frequenzbereichsentwurf, 183 Frequenzspektrum, 205–210 Frobenius-Form, 12, 65, 66, 71, 74, 82 Führungsverhalten, 6, 118 Füllstandsregelung, 378, 380, 383, 384, 404, 425, 426 Fuzzifizierung, 371–373, 399–401, 403, 411, 416 Fuzzy-Implikation, 375, 376 Fuzzy-PI-Regler, 420–422, 424 Gegenkopplung, 48 geometrische Reihe, 214–216 Geschwindigkeitsalgorithmus, 279, 417 Gewichtete Rekursive Kleinste Fehlerquadrate, 351 Gewichtsfolge, 238, 239, 241–243, 259, 260 Gleichgewichtstheorem, 194 Gleichstrommotor, 3–8, 15–19 Goldenberg, 161, 172 Gopinath, 137 Gradient, 355 Grenzfrequenz, 310, 314 Grundmenge, 363, 365, 367–369, 376–378, 381, 385 Gütefunktion, 100, 108–110, 113–118, 121, 122
IAE-Kriterium, 107 Identifizierung, 346 Impulsantwort, 238, 239 Instabiles System, 85 intern stabil, 43–45 interne Stabilität, 43 Interrupt-Controller, 204 ISE-Kriterium, 107 Isermann, 257, 341 ITAE-Kriterium, 96, 107 ITAE-Prototypenentwurf, 99 Jury, 263–265, 271 Kalman, 329 kanonische Form, 90 Kausalität, 320, 322, 329 Kautsky, 90 Kennfläche, 421–424, 426, 427, 429, 430, 432 Kleinste Fehlerquadrate, 348 Klirrpol, 323 Kofaktor, 439, 440, 442 Kommutativgesetz, 436, 437 Kompensationsregler, 353 Kompensator, 160, 161, 167, 172–174, 176, 177 Komplementärmenge, 367, 370 Kopplung, 24 Kreiskriterium, 432 Kreisschaltung, 46, 48, 49, 251, 252
Namens- und Sachverzeichnis Least Squares Estimate, 349 Lindorff, 339 linear unabhängig, 67, 68, 70, 72 Lineare Gleichungen, 433 lineare quadratische Regelung, 120, 138, 152 Linksmultiplikation, 436 Linksverschiebung, 222, 223, 232 Ljapunov-Funktion, 109, 110 Ljapunov-Gleichung, 110–112 Luenberger, 72, 74, 76, 91 Mamdani, 376, 380, 381, 383, 394, 395 MATLAB, 90, 113, 116, 167 Matrix-Riccati-Gleichung, 112, 113, 116, 134 Matrixexponentialfunktion, 36 MATRIXX, 116 MAX-MIN-Inferenz, 388–392, 396, 400, 406, 412–414, 418, 422, 427 MAX-PROD-Inferenz, 392, 396, 414, 415, 420, 432 Mikrocontroller, 204, 205, 273, 283, 419 Mikroprozessor, 202, 204 MIN-Operator, 368 MIT-Regel, 355 Mitkopplung, 48 Modellfolgeregelung, 160, 165, 166 modifizierte Riccati-Gleichung, 123 MRAC-Struktur, 358 Nennergrad, 237 Nennerpolynom, 303, 313 Nichols, 341 NICHT-Operator, 367, 370 nichtsinguläre Matrix, 90 Normalform, 7, 16–19, 35, 81, 87, 90 Nour-Eldin-Normalform, 79 Nullmatrix, 435 Nummerische Lösung, 37 ODER-Operator, 369 Optimierung, 100 orthogonal, 91 Ortskurve, 6 P-Regler, 401, 408, 409, 426, 428
469 Parallelschaltung, 47, 250 Parameterempfindlichkeit, 151, 158 Partialbruchzerlegung, 257 PD-Regler, 410, 412 PDTD -Regler, 278, 283 Phasengang, 310, 313–316 Phasenrand, 309, 315–318 PI-Regler, 149, 247, 248, 274, 275, 277, 278, 281, 282, 284–292, 294 PID-Regler, 6, 106, 278, 279, 292, 299, 300, 402, 417, 418, 432 PI-Mehrgrößenregler, 159 Pol-/Nullstellendarstellung, 280, 281 Pol-/Nullstellenkompensation, 62, 105, 106, 308 Polfestlegung, 125–127, 132, 133, 138, 141, 145–147, 162, 178 Polvorgabe, 353 Popov, 432 Positionsalgorithmus, 279 positiv definit, 108, 113, 120, 122 positiv definite Matrix, 451 positiv semidefinit, 108 positiv semidefinite Matrix, 450 Potenzreihenentwicklung, 36 Prädiktionsmodell, 348 Prämissen-Relation, 378, 379 Prototypenentwurf, 106 PT1 -Regelstrecke, 262 PT2 -Regelstrecke, 268, 306, 308 PT3 -Strecke, 420, 423, 425 Puls-Amplituden-Modulator, 200 Pulsfolge, 205, 206, 208 quadratisches Reglerproblem, 113 Ragazzini, 319, 323, 328, 329, 339 Randerweiterung, 426, 427 Rasmussen, 336, 341 Realteil, 43–45, 110, 120, 124 Rechteckschwingung, 350 Rechtsmultiplikation, 436 Rechtsverschiebung, 221, 222, 235, 241, 242, 248 reduzierter Beobachter, 137, 179
470 Regelungsnormalform, 9, 12–14, 17, 62, 64–66, 72, 74, 76, 79, 82, 83, 87, 91, 127–129, 161, 254–257 Reglerüberlauf, 190 Reihenentwicklung, 39 Reihenschaltung, 46, 241, 247, 249–251 Rekursionsgleichung, 39, 40 Rekursive Kleinste Fehlerquadrate, 349 rekursive Lösung, 38 Relationsmatrix, 377, 379, 381, 382, 397, 404–406, 411, 412, 417, 421, 422, 424, 427, 429 Relationsvorschrift, 376–378 Relay-Autotuning, 344 Residuen, 16, 17, 257 Residuensatz, 228 Resolvente, 43 Reswick, 341 robust, 7 Rückwärtsdifferenzenquotient, 273, 275, 278 s-Ebene, 305, 311 Schieberegister, 253, 256 schiefsymmetrische Matrix, 435 Schnittmenge, 367–369 Schwerpunktmethode, 403, 406, 407, 412, 413, 418, 427 Semidefinitheit, 153 Servo-Kompensator, 159, 160, 165 Shannon, 266, 267, 288, 310, 314 Simulationsdiagramm, 9, 10 Singleton, 367, 405, 408, 413–415, 418, 420–423, 432 Singuläre Matrix, 441 Spaltenmatrix, 434 Spaltenrang, 446, 447 Spaltenvektor, 434 sprungfähig, 9, 11, 12 SPS, 280 Spur einer Matrix, 448, 449, 452 stabil, 6, 43 Stabilität, 320, 322 Stationarität, 322, 325, 330, 331 statische Rückführung, 48 Stellenergie, 94 Stellsignalrauschen, 195
Namens- und Sachverzeichnis Stellungsalgorithmus, 417 steuerbar, 45, 85, 86 Steuerbarkeit, 35, 45, 121, 140, 143, 153, 161, 173 Steuerbarkeitsindex, 73, 76, 77, 87, 89 Steuerbarkeitsmatrix, 53–55, 60–65, 67, 68, 70, 72, 85, 86, 128, 129 Steuerbarkeitsnormalform, 67, 68, 71, 79 Stewart, 433 Störgrößenaufschaltung, 426, 428 Störgrößenbeobachter, 169, 170, 176–178 Störgrößenkompensation, 172, 175 Störmodell, 192, 194 Störverhalten, 6, 118 Sugeno, 395 SUM-MIN-Inferenz, 392, 396 SUM-PROD-Inferenz, 392, 396 Symmetrische Matrix, 435 Takahashi, 292–294 Totzeit, 237, 241, 256, 320, 322, 329, 331, 332 Trägersignal, 200, 205, 206 Transformationsmatrix, 63–68, 70–75, 83, 127–129 Transitionsmatrix, 36, 39, 43 Transponierte Matrix, 435, 442 Tustin, 276, 278, 286, 288, 297, 299, 301 Übertragungsmatrix, 41, 60 Unbehauen, 326 UND-Operator, 368 UND-Verknüpfung, 368, 369 Verallgemeinerte regelungskanonische Form, 76 Vereinigungsmenge, 367, 369, 370 Verkopplung, 25, 27, 34, 35 Verschiebungssatz, 207 Vieta’scher Satz, 448, 449 vollständig beobachtbar, 138 Vorfilter, 148–150, 152 Vorfiltermatrix, 148–150, 152 Vorwärtsdifferenzenquotient, 273, 275, 285, 290
Namens- und Sachverzeichnis w-Ebene, 311, 312, 314 Weber, 319 Wescott, 194 Wind-Up, 295, 299, 300 Wittenmark, 341 Wurmthaler, 125, 142, 183 Wurzelortskurve, 6, 101–103, 268 Young-Diagramm, 67–72, 74, 75 Yu, 341, 342 Zadeh, 365, 375, 419 Zählergrad, 237 Zählerpolynom, 303 Zeilenmatrix, 434 Zeilenrang, 446, 447 Zeilenvektor, 434 Ziegler, 341 Ziegler und Nichols, 293 Zustandsbeobachter, 81, 147, 150, 154, 158, 159, 166, 169, 175 Zustandsdarstellung, 254 Zustandsvektorerweiterung, 47, 143 Zweipunktregler, 343, 407, 408, 432
471