254 115 44MB
German Pages 208 Year 1979
F. H. LANGE Methoden der Meßstochastik
Methoden der Meßstochastik Prof. (em.) Dr.-Ing. hábil. F. H. LANGE Rostock
Mit 58 Abbildungen
und 8 Tafeln
AKADEMIE-VERLAG • BERLIN 1978
Erschienen im A k a d e m i e - V e r l a g , 108 Berlin, Leipziger S t r a ß e 3—4 © A k a d e m i e - V e r l a g Berlin 1978 L i z e n z n u m m e r : 202 • 100/413/78 B r o s c h u r u m s c h l a g : Rolf K u n z e G e s a m t h e r s t e l l u n g : V E B D r u c k h a u s „ M a x i m Gorki", 74 A l t e n b u r g B e s t e l l n u m m e r : 762 249 9 (6451) • LSV 1084 P r i n t e d in G D R DDR 2 6 , - M
Vorwort Bücher über die Meßtechnik behandeln meist die Meßgeräte und ihre technischen Anwendungen. Sie gehen von der physikalischen Betrachtungsweise aus, vom „physikalischen Aspekt" der Meßtechnik. Inzwischen hat sich unter dem Einfluß der Nachrichten- und der Regelungstechnik als zweite Betrachtungsweise der „informatorische Aspekt" als nützlich erwiesen. Er betrifft die Meßtheorie und hat die Zielsetzung, die gemeinsamen Gesichtspunkte der Meßwert-Gewinnung, -Übertragung und -Verarbeitung in multivalenter Form zusammenzufassen. Hierdurch kann man Methoden und Erfahrungen eines Arbeitsgebietes leichter auf ein anderes übertragen. Den Grundstein jeder Meß-Theorie bildet die klassische Meßfehler-Theorie statischer Messungen. Daneben hat sich infolge der zunehmenden Automatisierungstechnik die Meßdynamik (WOSCHNI [20]) entwickelt, die zeitvariable Meßgrößen betrachtet. Eine Weiterentwicklung ergab sich bei der Untersuchung der Einflüsse von Störungen, ebenfalls unter Ausnutzung der Erfahrungen der Nachrichtentechnik. Dazu gehört die Korrelations-Analyse ([10]). So wurde allmählich ein Arbeitsgebiet der Meßtheorie ausgebaut, das am besten mit dem Begriff „Meß-Informations-Theorie" bezeichnet werden kann. Es bedient sich der Meßinformationssysteme ( K B A U S , WOSCHNT [ 9 ] ) . Es ist das Anliegen des vorliegenden Buches, unter dem Begriff der Meßstochastik die methodischen Grundgedanken der Meßtheorie zusammenzufassen, die nicht determinierte Meßgrößen als Nutz- und als Störsignale betreffen, sogenannte stochastische Prozesse. Sie sind so mannigfaltig, daß eine systematische Zusammenfassung lohnend erschien. Die Meß-Informationstheorie geht weit über die SHANNONsche Informationstheorie hinaus, die sich speziell mit der Optimierung der Informationsübertragung und der Informations-Speicherung beschäftigt. Die Meß-Informationstheorie berücksichtigt vollständig die Amplituden-Information der Meßereignisse, während die SHANNONsche Theorie vorzugsweise die Wahrscheinlichkeits-Information zur Bildung von Kenngrößen ausnutzt. Die Grundlagen bieten die mathematische Statistik und Stochastik einschließlich der Wahrscheinlichkeitstheorie. Übereinstimmung herrscht in der bevorzugten Betrachtung des Empfanges von
VI
Vorwort
endlich vielen, diskreten Meßinformationen. Es wird auf die Fragen der Meßstochastik für die optimale Informationsgewinnung durch Meßgeber und auf die Folgerungen aus der SHANNONschen Theorie für die Meßtechnik aus Gründen des Buchumfanges in diesem Buch nicht eingegangen, zumal diese ausführlich im Buch von KEAUS/WOSCHNI ([9]) behandelt worden sind. Auch wird auf innermathematische Probleme, z . B . der Maß-Theorie, und auf den semantischen Aspekt nicht eingegangen. Vielmehr stehen neben einigen klassischen Methoden der Meßwertübertragung die Probleme der Informations-Reduktion und der Störfestigkeit bei der MeßwertVerarbeitung und Kenngrößen-Bildung im Vordergrund. Es handelt sich mehr um den pragmatischen Aspekt, d. h. nach K L A U S ([34]) um Relationen, die die Beziehungen zwischen den Meßwerten und den Menschen betreffen, die diese Meßwerte oder Zeichen erzeugen und verwenden. Es steht der Gesichtspunkt der praktischen Anwendungsmöglichkeit der Meß-Informationstheorie im Vordergrund. Danach richtet sich der Einsatz der Meßtheorie. Die nachfolgenden Betrachtungen beschränken sich vorwiegend auf die Meßstochastik, speziell auf die Prozeß-Meßtechnik. Die Meßstochastik ist ein Teilgebiet der Meßtheorie und dient zur Klärung von Fragen der Prozeßanalyse. Es klafft immer noch eine Lücke zwischen der mathematisch gut ausgebauten Theorie der stochastischen Prozesse und der Meßtechnik, die diese Theorie in der Praxis ausnutzt. Das vorliegende Buch soll einen Uberblick über die methodischen Grundgedanken der Informationsverarbeitung geben. Überall in der Technik müssen Meßwerte übertragen werden und aus ihnen Kenngrößen zur Beobachtung und zur Steuerung von laufenden Prozessen gewonnen werden. Ähnliche Fragen treten z. B. auch in der medizinischen Diagnostik auf. Hierbei wird aus der Fülle der anfallenden Informationen nur ein Teil ausgenutzt, d. h., es wird stets eine Informationsreduktion durchgeführt. Dabei gilt es, anfallende Störungen zu unterdrücken, um eine hohe Störfestigkeit der Meßwertübertragung und der Meßwertverarbeitung zu erreichen. Diese Aufgabenstellung läßt sich nur unter weitgehender Anwendung mathematischer Modellvorstellungen erreichen. Die Auswahl der mathematischen Hilfsmittel richtet sich hierbei nach den praktischen Bedürfnissen der Anwendungen. Sie wird durch die technische Aufgabenstellung und deren Randbedingungen stark beeinflußt (Analysis, Algebra, Wahrscheinlichkeitstheorie). Daher ergeben sich die axiomatischen Grundlagen der Lösung von Meßaufgaben erst am Ende, nicht aber wie in der reinen Mathematik am Anfang der Untersuchungen. Die mathematischen Anforderungen überschreiten hier nicht den Rahmen der mathematischen Grundausbildung an den Hochschulen. Erfahrungsgemäß sind sie dem Studenten wesentlich besser bekannt als die zugehörigen Anwendungsmöglichkeiten. Daher verzichtet die Darstellung auf eine nochmalige Ableitung und betont statt dessen die Einsatzmöglichkeit und
Vorwort
VII
die Aussagekraft der m a t h e m a t i s c h e n Hilfsmittel. Sie gibt f e r n e r Hinweise f ü r ihre Auswahl. Die M a t h e m a t i k liefert Modelle f ü r die sich abspielenden Prozesse als „Signaltheorie" u n d f ü r die a n g e w a n d t e n Mittel zur I n f o r m a t i o n s v e r a r b e i t u n g als „Systemtheorie" ([36]). Der 1. H a u p t a b s c h n i t t beschäftigt sich mit d e m I n f o r m a t i o n s - A s p e k t der Meßtechnik u n d m i t d e m P r o b l e m der I n f o r m a t i o n s b e w e r t u n g auf der Basis der I n formationstheorie u n d der Stochastik. Als G r u n d s t r u k t u r der informationsverarbeitenden Systeme dient das Modell des zweifach ausgesteuerten Systems, hier als V e r b u n d s y s t e m bezeichnet. Dies ergibt eine E r w e i t e r u n g der linearen Systemtheorie, die f ü r die Meßtechnik in keiner Weise ausreicht. Der 2. H a u p t a b s c h n i t t b e h a n d e l t die wichtigsten Methoden der Prozeßanalyse vom S t a n d p u n k t der Meßtheorie. Es werden F r a g e n der Klassifizierung u n d Darstellung v o n Informationsprozessen behandelt sowie die Methoden zu ihrer Umw a n d l u n g f ü r die Zwecke der Meßwertübertragung u n d Meßwertverarbeitung. Hier werden viele Verfahren der klassischen Nachrichtentechnik v o n der Meßtechnik b e n u t z t . Die klassischen V e r b u n d s y s t e m e der N a c h r i c h t e n t e c h n i k zur Modulation, A b t a s t u n g u n d Kodierung dienen der M e ß w e r t ü b e r t r a g u n g u n d arbeiten möglichst ohne I n f o r m a t i o n s r e d u k t i o n . Die V e r b u n d s y s t e m e der Meßtechnik n e h m e n dagegen zur K e n n g r ö ß e n b i l d u n g eine gewisse I n f o r m a t i o n s r e d u k t i o n vor. Energetische K e n n g r ö ß e n werden d u r c h die einfache Analyse gewonnen, die eigentlichen informationshaltigen K e n n g r ö ß e n aber vor allem durch eine V e r b u n d a n a l y s e ohne oder m i t vorangegangener Prozeßwandlung ( z . B . Begrenzung). E s zeigt sich, d a ß die Korrelationsanalyse eng m i t anderen Methoden der V e r b u n d a n a l y s e verw a n d t ist, so d a ß die V e r b u n d a n a l y s e die universelle Methode zur Kenngrößenbildung ist. F ü r die Kenngrößenbildung ergeben sich vielfache Möglichkeiten durch die Darstellung im Zeit- oder im Spektral- oder im statistischen Bereich, d u r c h eine vorangehende Prozeßwandlung, z. B. Begrenzung der A m p l i t u d e n u n d d u r c h eine Zeit- u n d Amplitudendiskretisierung des p r i m ä r e n Prozesses, speziell u n t e r U m w a n d l u n g der A m p l i t u d e n w e r t e in Binärsignale, d. h. durch Binärkodierung. I n allen Fällen ist die vorgenommene I n f o r m a t i o n s r e d u k t i o n ein K r i t e r i u m f ü r die Optimierung der Prozeßanalyse, wobei aus den M o m e n t a n w e r t e n Mittelwerte gebildet werden. Der 3. H a u p t a b s c h n i t t b e h a n d e l t ein anderes Optimierungskriterium, die Störfestigkeit der M e ß w e r t - Ü b e r t r a g u n g u n d -Auswertung, zunächst aus allgemeiner Sicht b e t r a c h t e t , d a n n an j e zwei Beispielen f ü r analoge u n d f ü r digitale Verf a h r e n erläutert. Z u s a m m e n f a s s e n d h a n d e l t es sich u m folgende F r a g e n : II 1. Welche Prozeß-Kenngrößen lassen sich in der Meßtechnik v o n stocha11 stischen Prozessen bilden?
VIII
Vorwort
2. Welche Systeme stehen als Grundstrukturen zur optimalen InformationsVerarbeitung zur Verfügung? 3. Welche Optimierungs-Kriterien treten dabei auf? Dieser Band behandelt als Übersicht das methodische Konzept der Meßstochastik und setzt zum Verständnis bereits einige Vorkenntnisse voraus mit dem Ziel, die derzeitigen Entwicklungstendenzen der Meßstochastik darzulegen. Als roten Faden der Darstellung soll der Leser den „algebraischen" und den „statistischen" Aspekt der Meßwert-Verarbeitung betrachten. Fragen der Meßwert-Gewinnung durch Meßfühler werden nur gestreift. Die digitale MeßwertVerarbeitung wird vorrangig behandelt. An Hand ausgewählter methodischer Beispiele — ohne Anspruch auf Vollständigkeit — sollen dem Leser die Grundgedanken der Meßstochastik und ihrer systemtheoretischen Hilfsmittel so dargeboten werden, daß er beim Entwurf von Meßverfahren einen nützlichen Gebrauch machen kann. Dies gilt u. a. auch für den Einsatz von Mikroprozessoren (Minicomputern) mit ihrem minimalen Raum- und Gewichtsbedarf. Es wird gezeigt, welche Aufgaben sie in der Meßtechnik zu erfüllen haben. Die hierfür definierten „Verbund-Systeme" treten als kleinste System-Strukturen zur Kenngrößen-Verarbeitung auf. Anregungen zu diesem Buche verdanke ich den IMEKO-Kongressen und den Symposien der technischen Kommittees der IMEKO, ferner dem Gedankenaustausch mit den Kollegen Prof. FRITZSCHE (Dresden), Prof. HOFMANN (Jena) und Prof. W O S C H N I (Karl-Marx-Stadt). Dem Akademie-Verlag danke ich für die Unterstützung bei der Drucklegung, vor allem der Lektorin Frau GISELA LAGOWITZ. Rostock, im Sommer 1976
F . H . LANGE
Inhalt 1.
Informationsbewertung durch Meßsysteme
1
1.1. 1.1.1. 1.1.2.
Der Informations- Aspekt der Meßtechnik A u f g a b e n der Meßtheorie u n d der Meßstochastik M e ß b e w e r t u n g zur I n f o r m a t i o n s ü b e r t r a g u n g u n d zur Informationsspeicherung 1.1.2.1. Zufallsgrößen u n d Zufallsprozesse als Gegenstand der Meßstochastik, der statistische A s p e k t der Meßtechnik 1.1.2.2. M e ß b e w e r t u n g bei n u r q u a l i t a t i v u n t e r s c h e i d b a r e n Meßereignissen, der algebraische A s p e k t der Meßtechnik 1.1.3. Empirische M e ß b e w e r t u n g zur I n f o r m a t i o n s - V e r a r b e i t u n g
13 18
1.2. 1.2.1. 1.2.2. 1.2.3.
Der System-Aspekt der Meßtechnik Die black-box-Darstellung u n d die Theorie der linearen S y s t e m e Die Frequenzgang-Beschreibung linearer S y s t e m e Z u m E i n s a t z der O p e r a t o r e n r e c h n u n g e n in der Systemtheorie
20 22 26 31
1.3. 1.3.1. 1.3.2. 1.3.3. 1.3.3.1. 1.3.3.2.
Das Verbundsystem als Grundstruktur der Meßtechnik Analoge V e r b u n d s y s t e m e Digitale V e r b u n d s y s t e m e f ü r einstellige Binärsignale Digitale V e r b u n d s y s t e m e f ü r mehrstellige Binärsigrjale A n w e n d u n g e n der Matrizen-Multiplikation A n w e n d u n g e n der Polynom-Multiplikation
34 36 39 43 45 48
2.
Methoden der Informationsverarbeitung stochastischer Prozesse
54
2.1. 2.1.1. 2.1.2.
Zielstellung und Randbedingungen der Informations-Verarbeitung in der Meßtechnik Prozeß-Identifizierung u n d Prozeß-Kontrolle Signalerkennung u n d P a r a m e t e r - A b s c h ä t z u n g bei Störeinflüssen
54 54 59
2.2. 2.2.1. 2.2.1.1. 2.2.1.2. 2.2.1.3.
Übertragung von Informationsprozessen F r e q u e n z u m s e t z u n g v o n stochastischen Prozessen durch Modulation Amplitudenmodulation Frequenzmodulation Zeitdauer- u n d P u l s m o d u l a t i o n
61 62 62 66 70
. . .
1 1 8 8
X
Inhalt
2.2.2. Diskretisierung durch Kodierung 2.2.2.1. Zeitdiskretisierung und Abtastung 2.2.2.2. Amplitudendiskretisierung und Binärkodierung 2.3.
Informations-Reduktion durch Kenngrößenbildung
2.3.1. Kenngrößen der einfachen Analyse 2.3.1.1. Amplituden-Verteilungen und Mittelwerte stationärer Prozesse 2 . 3 . 1 . 2 . Komponenten-Zerlegung in Standardsignale ( F O U R I E R - und Analyse) 2.3.1.3. Kenngrößen instationärer Prozesse, Kurzzeitmittelwerte 2.3.2. Kenngrößen der Verbund-Analyse 2.3.2.1. Korrelations-Analyse, Verbundwahrscheinlichkeit 2.3.2.2. Korrelations-Meßtechnik 2.3.2.3. Cepstrum-Analyse 2.3.2.4. Mehrfach-Verbund-Analyse 2.3.3. Kenngrößenbildung nach einer Prozeßwandlung 2.3.3.1. Amplitudenbegrenzung ohne Informationsreduktion 2.3.3.2. Amplitudenbegrenzung mit Informationsreduktion 2.3.3.3. Klassifizierung der Methoden zur Prozeßwandlung 3.
73 73 80
Methoden zur Erhöhung der Störfestigkeit
82
83 83 WALSH-
90 108 112 113 122 134 138 140 140 144 145 147
3.1.
Das Entstörproblem aus allgemeiner Sicht
147
3.1.1. 3.1.2. 3.1.3.
Störeinflüsse auf eine Meßkette Mittel zur Störbefreiung bei Meßprozessen Störpegel und Störabstand
147 149 152
3.2.
Erhöhung der Störfestigkeit bei analogen Verfahren
156
3.2.1. 3.2.2.
Methode der Frequenzmodulation Störfestigkeit der Korrelationsverfahren
157 160
3.3.
Erhöhung der Störfestigkeit bei digitalen Verfahren
165
3.3.1. 3.3.2. 3.3.2.1. 3.3.2.2.
Methode des angepaßten Filters Methoden der Kodierungsredundanz Anwendung der Matrizen-Multiplikation Anwendung der Polynom-Multiplikation
166 174 176 181
Literaturverzeichnis
189
Symbolverzeichnis
194
Sachwortverzeichnis
197
1. Informationsbewertung durch Meßsysteme 1.1. Der Informations-Aspekt 1.1.1. Aufgaben
der
Meßtechnik
der Meßtheorie und der
Meßstochastik
Prozeßanalyse: Bei der P r o z e ß m e ß t e c h n i k h a n d e l t es sich u m folgenden, allgemein gültigen F a l l : es l ä u f t irgend ein physikalischer oder technischer oder biologischer Vorgang ab, den wir als Prozeß bezeichnen. E r h a t einen regellosen Verlauf, bewegt sich aber m i t einer gewissen Wahrscheinlichkeit auf ein b e s t i m m t e s Ziel zu (griech. „stochos" = Ziel). D a h e r wird er als stochastischer Prozeß bezeichnet. E r wird m i t Meßeinrichtungen b e o b a c h t e t u n d aufgezeichnet. Das Ergebnis n e n n t m a n die Realisierung des stochastischen Prozesses, z. B. in F o r m eines eindimensionalen Zeitvorganges als Meßspannungs-Verlauf, auch „ M u s t e r f u n k t i o n " g e n a n n t . Meßinformationen werden m i t Signalen ü b e r t r a g e n . Man definiert ein Signal als den Träger einer I n f o r m a t i o n . E i n Signal ü b e r m i t t e l t eine I n f o r m a t i o n ü b e r einen Z u s t a n d oder einen Vorgang in einem physikalischen System, u n d zwar als Ergebnis einer Messung an einem beobachteten physikalischen System. Die d u r c h Signale ü b e r t r a g e n e n Meßinformationen werden zur Prozeß-Identifizierung oder zur Prozeß-Kontrolle b e n u t z t . E s b e s t e h t die Aufgabe, Gütekriterien zur Prozeßidentifizierung oder zur Prozeßkontrolle in F o r m v o n Kenngrößen zu erhalten. Diese K e n n g r ö ß e n k ö n n e n K e n n w e r t e oder K e n n f u n k t i o n e n sein, je n a c h d e m sie K o n s t a n t e sind oder v o n einem P a r a m e t e r , der Zeit oder der Frequenz, a b h ä n g e n . Die Gütekriterien müssen m a t h e m a t i s c h definiert werden. D a d u r c h wird die Meßtechnik zu einer Meßtheorie u n d auf eine theoretisch zuverlässige Grundlage gestellt. D e r a r t i g e m a t h e matisch definierte Gütekriterien eines stochastischen Prozesses sind m u l t i v a l e n t f ü r verschiedenartige technische, physikalische, chemische, biologische u n d physiologische Vorgänge einheitlich n u t z b a r . Dieses G r u n d k o n z e p t der Meßtheorie wurde in den letzten J a h r z e h n t e n zur Meßstochastik entwickelt u n d h a t eine stürmische Weiterentwicklung erfahren, vor allem durch die z u n e h m e n d e Automatisierung der Meßtechnik als „ A u t o metrie". Die Weiterentwicklung betraf sowohl die Meßmittel als auch die M e ß m e t h o d e n f ü r die Meßwertgewinnung, - Ü b e r t r a g u n g u n d -Verarbeitung.
2
1. I n f o r m a t i o n s b e w e r t u n g durch M e ß s y s t e m e
Die physikalische Grundlagenforschung ergab neue Meßmethoden, z. B. die Isotopen-Strahlungsmeßtechnik oder die Holographie mittels Laserstrahlung. Dies b e t r i f f t den physikalischen Aspekt der Meßtechnik, von dem hier jedoch nicht die R e d e sein soll. Es ergaben sich nicht zuletzt d a n k der Rechnerentwicklung neue Methoden der Meßwertverarbeitung
unter
Ausnutzung
der
mathematischen
Grundlagen-
forschung, z. B. die Korrelationsanalyse, die I n f o r m a t i o n s a n a l y s e u n d die AutoTafel 1: Aufgaben der Prozeßanalyse a) Optimale Informations-Gewinnung durch d e n Meßgeber: Reaktionszeit verbessern! b) Optimale Informations-Übertragung durch die Meßstrecke: K e i n Informationsverlust, verzerrungsfrei u n d störfest übertragen! c) Optimale Informations-Verarbeitung: durch elektronische Rechner: Optimale Informations-Reduktion, Bildung v o n prozeßrelevanten K e n n g r ö ß e n
matentheorie. Die Nachrichten-, Meß- u n d Regelungstechnik entwickelte als gemeinsames F u n d a m e n t die Signal- u n d die Systemtheorie. Diese b e t r i f f t den informatorischen Aspekt der Meßtechnik, der hier näher b e t r a c h t e t werden soll. Das K e r n p r o b l e m besteht dabei in der K e n n g r ö ß e n a u s w a h l u n d Kenngrößengewinnung d u r c h informationsverarbeitende Systeme. Wir beschränken uns hierbei auf die elementaren G r u n d s y s t e m e u n d G r u n d s t r u k t u r e n , die bei j e d e m noch so komplizierten R e c h e n p r o g r a m m von Meßwertverarbeitungsanlagen b e n u t z t werden. Der informatorische
Aspekt der Meßtechnik:
Meß-Informationstheorie
Der informatorische A s p e k t ist der Gegenstand u n d die A r b e i t s m e t h o d e der Meßtheorie. Sie beschäftigt sich m i t der sogenannten Meßkette, die aus den Meßgebern zur Meßwertgewinnung, aus den Übertragungs- u n d Verstärkungseinricht u n g e n der Meßwerte u n d aus den Auswertgeräten zur Bildung v o n Kenngrößen — als K e n n w e r t e oder K e n n f u n k t i o n e n — b e s t e h t . Natürlich spielt a u c h der stoffliche u n d energetische A s p e k t f ü r die Meßtheorie eine Rolle, gehört aber vorwiegend z u m laufenden P r o d u k t i o n s p r o z e ß oder z u m u n t e r s u c h t e n Vorgang u n d wird bei den nachfolgenden B e t r a c h t u n g e n zeitweise ausgeklammert. D i e I n f o r m a t i o n s t h e o r i e v o n SHANNON u n d K O T E L N I K O W , a u f d i e w i r n a c h f o l -
gend noch eingehen werden, bildet — im Gegensatz zur N a c h r i c h t e n t e c h n i k — keine ausreichende Grundlage f ü r die Meßtechnik, besonders was F r a g e n der I n f o r m a t i o n s a u s w e r t u n g a n b e t r i f f t . Die Meßtheorie h a t ihre eigenen A u f g a b e n , die mit den Methoden u n d Begriffen der m a t h e m a t i s c h e n Statistik u n d Stochastik gelöst werden u n d die die A m p l i t u d e n i n f o r m a t i o n der Messung voll ausschöpfen.
1.1. Der Informations-Aspekt der Meßtechnik
3
Die Meßtheorie gliedert sich in drei Teilgebiete auf, in die Meßstatik, die Meßd y n a m i k u n d die Meßstochastik. Die Meßstatik entspricht der klassischen Meßtheorie. Sie ist d a d u r c h gekennzeichnet, d a ß der Meßgegenstand eindeutig u n d z e i t k o n s t a n t vorhegt u n d d a ß vor allem der Z e i t a u f w a n d f ü r die Messung keine Rolle spielt. Sie b e t r i f f t die Laborm e ß t e c h n i k , die Eichmeßtechnik u n d viele Teilgebiete der industriellen u n d der naturwissenschaftlichen Meßtechnik.
Physikalischer
Meßinfarmation
Vorgang
Meßwertausgabe als
Henngröße
Abb. 1.1. Schema einer Meßstrecke zur Prozeßanalyse (Typ 1)
Die Meßdynamik behandelt die Messung zeitlich veränderlicher Größen. Hierbei soll die Zeitabhängigkeit möglichst nicht v e r ä n d e r t werden. D a h e r r ü c k t die Meßzeit in den Vordergrund der Genauigkeitsbetrachtungen. B e a c h t e t m a n sie nicht, so k a n n m a n trotz großer Meßgenauigkeit etwas vollkommen Falsches messen, z. B. w e n n der Einschwingvorgang des Meßobjektes noch nicht abgeklungen ist. Bei der Meßstochastik entfällt auch die andere Voraussetzung, d a ß die Meßgröße des Meßobjektes determiniert ist. Sie stellt vielmehr selbst einen Schwankungsvorgang dar. Dieser Fall t r i t t vor allem bei der Messung an l a u f e n d e n Produktionsprozessen u n d an Vorgängen im lebenden Organismus (Medizintechnik!) ein. Tafel 2: Teilgebiete der
Meß-Informations-Theorie
Meß-Statik : Meß-Dynamik : Meß-Stochastik:
Meß-Objekt
Meß-Parameter
zeitkonstant, determiniert zeitvariabel, determiniert zeitkonstant oder zeitvariabel, nicht determiniert
meßbar meßbar schätzbar
4 Zielstellungen
1. Informationsbewertung durch Meßsysteme
der Meß-Informations-Theorie
und der
Prozeß-Meßtechnik:
In der Meßstochastik kommt die Forderung hinzu, daß der Meßprozeß automatisch vorgenommen werden soll, um den Informationsfluß in kürzester Zeit zu verarbeiten. Der Mensch wird in der modernen Meßtechnik weitgehend als Beobachter und als Auswerter ausgeschaltet, wenn es sich um Betriebsmessungen handelt, die im Programmablauf völlig festgelegt sind. Diese Betriebsmeßtechnik stellt aber im automatisierten Produktionsprozeß keine geringeren Anforderungen als die Labormeßtechnik; denn die Meßwerte dienen zur Regelung des Prozesses. Man muß stets genauer messen als geregelt werden soll. Die automatische Meßwertverarbeitung wird meist in peripheren Rechensystemen, nicht in einer zentralen E D V vorgenommen, um den Datenfluß zu reduzieren und die zentralen Informationsspeicher zu entlasten. So ergibt sich für die Meßtechnik noch als weitere Forderung, eine Informationsreduktion vorzunehmen. Es kommt darauf an, nur den Anteil auszuwerten, der für den Prozeß charakteristisch ist — den prozeßrelevanten Anteil — und den anderen zu unterdrücken. Dieser letzere, der irrelevante Anteil, kann ein Teil des Nutzsignals sein, oft aber rührt er von Störungen her. So spielen in der Meßstochastik die Methoden zur Erhöhung der Störfestigkeit eine große Rolle. Nachfolgend sollen die Probleme der Kenngrößenbildung und Kenngrößenverarbeitung im Rahmen der Meßstochastik näher betrachtet werden! Hierbei sind zwei Teilaufgaben zu unterscheiden, die Meßwertübertragung und die Meßwertauswertung. Sie sind Bestandteile der technischen Kybernetik. NORBERT WIENER, der Schöpfer des Begriffes der Kypernetik, hat frühzeitig erkannt, daß die Nachrichtenübertragung und die Informationsverarbeitung in lebenden Organismen, speziell zur Regelung, ähnlichen Gesetzmäßigkeiten folgt wie in technischen Anlagen ( = Maschinen). Dies gilt auch für die Meßstochastik und führt zu neuen Anwendungen in nichttechnischen Bereichen! Modellbilduhg
in der
Prozeßmeßtechnik:
Die Aufgabe der Meßtheorie besteht in einer mathematischen Modellbildung zwecks Analyse oder Synthese von Meßvorgängen. Hierbei ergibt sich der Vorteil, daß physikalisch und technisch unterschiedliche Prozesse durch einen gemeinsamen Modellvorgang beschrieben werden können. Der physikalische Aspekt entfällt. Dies hat den Vorteil, daß Erfahrungen und Methoden eines Spezialgebietes leichter in ein anderes Spezialgebiet übertragen werden können. Dieser Standpunkt erscheint gerechtfertigt, da hinter dem Meßwertgeber die nichtelektrische Zustandsinformation des Meßobjektes in eine rein elektrische Information in Gestalt des elektrischen Meßsignals umgewandelt wird. Von welchem Prozeß es stammt, ist hier nicht mehr feststellbar und darum für die Informationsverarbeitung uninteressant. Die Meßstochastik betrachtet den untersuchten Vor-
5
1.1. Der Informations-Aspekt der Meßtechnik
gang lediglich als eine zeitabhängige Größe. Sie wird vom Meßfühler als el. Einheitssignal über Verstärkereinrichtungen abgegeben und soll nun zu Meßgrößen (Meßwerten oder Meßfunktionen) verarbeitet werden. Durch Abstraktion wird dem Prozeß ein Modellvorgang zugeordnet, der gewisse mathematische Gesetzmäßigkeiten besitzt. Diese werden zur Bildung von Kenngrößen ausgenutzt. Man darf allerdings nicht übersehen, daß stets zwischen dem Prozeß und dem Modellvorgang keine volle Übereinstimmung herrscht. An Hand des Modells wird entweder eine Analyse vorgenommen, d. h., es werden die Eigenschaften des Objektes bei vorgegebener Struktur bestimmt. Objekt, System, Prozeß••
Analyse
Eigenschaften
gesucht
Struktur
vorgegeben
Synthese. .
vorgegeben gesucht
Abb. 1.2. Analyse und Synthese als Hauptaufgaben der technischen Kybernetik
Oder es wird eine Synthese vorgenommen, d. h., es wird die Struktur des Objektes — speziell einer Meßanlage — an Hand vorgegebener Eigenschaften bestimmt. Diese Umkehraufgabe zur Analyse tritt bei jeder technischen Konstruktion auf. Die Analyse dient bei der Synthese zum Variantenvergleich als wichtigstes Hilfsmittel. Optimierung
als Kernproblem
der
Ingenieursarbeit:
Bei technischen Aufgaben spielt die Optimierung eines Gütekriteriums eine dominierende Rolle. Bei der mathematischen Modellbildung muß daher gefragt werden, welche Eigenschaften optimal sein sollen und welche Wertigkeit sie gegeneinander haben. So kann bei der Meßwertübertragung entweder der Übertragungsaufwand minimalisiert werden, oder es kann die Übertragungsgüte optimiert werden. Meist ist beides gefordert, und der technische Entwurf ist ein Kompromiß zwischen widersprechenden Anforderungen. Bei der Meßwertverarbeitung kann die Forderung bestehen, das Maximum an Information aus einer Messung herauszuholen oder umgekehrt eine möglichst starke Informationsreduktion vorzunehmen. Jeder Standpunkt hat seine Berechtigung, führt aber zu einer anderen Theorie
1. Informationsbewertung durch Meßsysteme
6
und zu einer anderen Methode. Die hierzu b e n ö t i g t e m a t h e m a t i s c h e Grundlage m u ß so gewählt werden, d a ß sie M a ß g r ö ß e n für die Optimierung und für die S y s t e m s y n t h e s e liefert. Hierbei b e s t e h e n erhebliche Unterschiede in der Arbeitsrichtung des M a t h e m a tikers und des Ingenieurwissenschaftlers. D e r M a t h e m a t i k e r wird seine Theorie auf A x i o m e n und Definitionen a u f b a u e n ( S t u f e 1), daraus eine m a t h e m a t i s c h e Arbeitsrichtung Theoretische Grundlagen^ Axiome, Definitionen
(D Arbeitsrichtung
der mathematischen
Analyse ••
Systeme, Strukturen
Eigen schatten
(2)
P)
der technischen
Synthese:
-
Praktische Anwendungen und gesellsch. Bedürfnisse
M
Abb. 1.3. Arbeitsrichtungen bei der Modellierung von arbeitenden Systemen
informationsver-
S t r u k t u r ableiten ( S t u f e 2) und deren E i g e n s c h a f t e n durch eine Analyse untersuchen ( S t u f e 3). Die p r a k t i s c h e Anwendung ( S t u f e 4) wird der Z u s a m m e n a r b e i t m i t der I n genieurwissenschaft bedürfen, die dem m a t h e m a t i s c h e n K a l k ü l n i c h t eindeutig zugeordnet ist. D e r M a t h e m a t i k e r b i e t e t dem Ingenieur ein b e s t i m m t e s , v o n ihm entwickeltes H i l f s m i t t e l an, ein anderer M a t h e m a t i k e r ein a n d e r e s ! Die A r b e i t s r i c h t u n g des Ingenieurwissenschaftlers v e r l ä u f t u m g e k e h r t . Sie beginnt bei den gesellschaftlichen Bedürfnissen, der Anwendung ( S t u f e 4 ) . D a r a u s ergeben sich die E i g e n s c h a f t e n des O b j e k t e s oder S y s t e m s (Stufe 3). D i e H a u p t arbeit b e s t e h t in der S y n t h e s e des S y s t e m s , indem die S t r u k t u r aus den geforderten E i g e n s c h a f t e n erarbeitet wird (Stufe 2). B e i der Modellbildung wird ein geeignetes m a t h e m a t i s c h e s W e r k z e u g herangezogen, d a ß sich aus den Eigenschaften des geforderten S y s t e m s ergibt, also keineswegs schon a m A n f a n g festliegt, oft gar n i c h t b e k a n n t ist und auf halb heuristischem W e g e v o n Ingenieuren erfunden wird (z. B . Operatorenrechnung v o n HEAVISIDE). Die A x i o m a t i s i e r u n g und die F e s t l e g u n g der Definition ( S t u f e 1) ist erst der Schlußstein einer t e c h nischen T h e o r i e und bedarf nun der engen Z u s a m m e n a r b e i t m i t einem M a t h e m a t i k e r , u m die notwendige S t r e n g e zu erreichen. E s ist also die erste Aufgabe des Ingenieurs, sich ü b e r die zur Verfügung stehenden m a t h e m a t i s c h e n Hilfsmittel zu informieren und ihre E i n s a t z m ö g l i c h k e i t zu prüfen, ehe er sich dem tieferen S t u d i u m des K a l k ü l s zuwendet. D a s H a u p t problem j e d e r Theorie liegt i m Auffinden des geeigneten m a t h e m a t i s c h e n Hilfs-
J.l. Der Informations-Aspekt der Meßtechnik
7
mittels zur Problemlösung! Die dabei notwendige Kooperation mit der Mathematik bedarf einer gründlichen gegenseitigen Kenntnis der Fachbegriffe und der Fachsprache beider Partner, die ganz unterschiedlichen Bedürfnissen genügen müssen. Es gilt hier nach A L B E R T EINSTEIN : „Soweit die Mathematik exakt ist, beschreibt sie nicht die Wirklichkeit und soweit sie die Wirklichkeit beschreibt, ist sie nicht exakt". Dies charakterisiert die Grenzen der mathematischen Modellbildung, und dies gilt auch für die Meßstochastik. Die tatsächlich sich abspielenden physikalischen oder technischen Prozesse weichen mehr oder weniger stark von den ausgewählten mathematischen Modellen ab. Daher muß man erst durch ein Experiment prüfen, ob die Modellkenngrößen den Prozeßkenngrößen auch entsprechen und für den Prozeß wirklich charakteristisch sind. Daher werden wir nachfolgend die Frage in den Vordergrund stellen: 11 „Welche mathematischen Modelle werden von der Meßtheorie angeboten und II inwieweit sind sie für die gestellte Aufgabe überhaupt brauchbar?". Bei den Anwendungen der Modelltheorie kommen folgende Gebiete der Meßtechnik in Frage: 1. Meßtechnik im Produktionsbereich: 1.1. Fertigungsmeßtechnik in diskontinuierlichen Prozessen 1.2. Verfahrensmeßtechnik in kontinuierlichen Prozessen 2. Meßtechnik außerhalb des Produktionsbereiches: 2.1. Verbrauchskontrolle der Konsumtion 2.2. Umweltkontrolle 2.3. Gesundheitskontrolle (Medizintechnik, Sportmedizin) Hierbei treten Prozesse als Zeitvorgänge auf, die man verschieden einteilen kann, so z. B. in folgender Weise: a) Determinierte und nicht determinierte Prozesse b) Stationäre und nicht stationäre Prozesse c) Analoge und diskrete Prozesse (bzw. kontinuierliche und diskontinuierliche Prozesse) d) Periodische und aperiodische Prozesse e) Amplituden-, zeit- oder frequenzbegrenzte Prozesse f) Ein- oder mehrstellige Binärprozesse g) Ein- oder mehrdimensionale Prozesse Jeder Prozeßtyp hat seine eigene, ihm angepaßte mathematische Modelltheorie und Methodik. 2
Lange
1. Informationsbewertung durch Meßsysteme
8 1.1.2. Meßbewertung tionsspeicherung
zur Informationsübertragung
und zur
1.1.2.1. Zufallsgrößen und Zufallsprozesse als Gegenstand stochastik, der statistische Aspekt der Meßtechnik
Informader
Meß-
Es ist nicht die Aufgabe des vorliegenden Buches, die Grundlagen der mathematischen Statistik und der Wahrscheinlichkeitslehre zu erläutern (vgl. FlSZ [54] und KEMPE [59]), sondern sie auf die Meßtechnik anzuwenden. Doch soll eingangs kurz auf einige wichtige Begriffe hingewiesen werden sowie auf einige hier geltende Einschränkungen. Der Gegenstand aller nachfolgenden Betrachtungen ist ein phys. technischer Prozeß, dem kontinuierlich oder diskontinuierlich mit der Zeit Meßwerte entnommen werden. Die Meßwerte selbst können entweder diskrete Werte annehmen oder einen kontinuierlichen Bereich überstreichen. Wir sprechen in diesem Falle von einem zufälligen Prozeß oder Zufallsprozeß. E r besteht aus einer Menge von Zufallsgrößen, die durch den reellen Zeitparameter t geordnet sind. Die einzelne Zufallsgröße hat noch keine statistischen Eigenschaften, sondern erst die Zusammenfassung aller Zufallsgrößen ac(ij) unseres Experimentes ergibt den Zufallsprozeß x(t) als Gegenstand unserer Beobachtungen. Die zeitlich geordnete Folge der aufgenommenen Meßwerte des Zufallsprozesses wird als Musterfunktion oder auch als Realisierung des Prozesses bezeichnet. Man kann nun den Apparat der klass. mathematischen Statistik anwenden, wenn man die Besonderheiten der Zeitabhängigkeit zunächst nicht in den Vordergrund stellt, sondern anstelle des einen Prozesses ein Ensemble von derartigen Versuchsanlagen zu einem festen Zeitpunkt betrachtet und annimmt, daß das Meßergebnis hieraus gewonnen wurde. Die Zusammenfassung der Zufallsgrößen ergibt eine statistische Beschreibung des Versuches. Nehmen wir nun an, daß es nur eine endliche Menge unterscheidbarer Meßergebnisse gibt (wie es bei der Amplitudenquantisierung s. u. der Fall ist), so kann man durch eine fortgesetzte Wiederholung des Versuches eine Häufigkeitsverteilung für die diskreten Meßwerte ermitteln. Nähert diese sich mit großer Wahrscheinlichkeit einem Grenzwert, so nimmt man an, daß eine Wahrscheinlichkeitsverteilung für ein mathematisches Modell existiert, das mehr oder weniger weitgehend unserem Versuch entspricht. Damit wird dem Versuchsausgang x¡ eine Wahrscheinliche^ P(x¡) zugeordnet, und es ergibt sich ein Wahrscheinlichkeitsfeld: X2
P(xj) P(x2) ausgänge.
x3
...
P(x3)
...
XN
P{xit) für N mögliche Versuchs-
1.1. Der Informations-Aspekt der Meßtechnik
9
Damit wird die Axiomatik von K o l m o g o r o w in die Meßtheorie eingeführt. Hiernach ist die Wahrscheinlichkeit P ; eine dem i-ten Typ des Versuchsausganges zugeordnete Maßzahl. E s gilt: N
0 ^ P(Xi)
^ 1
und
2J P(xi)
=
!= 1
Pi — 0 gilt für ein unmögliches Ergebnis, P ; = 1 für ein sicheres Ergebnis als Grenzfälle. Die Summe von Wahrscheinlichkeiten von Beobachtungen oder Messungen, die sich gegenseitig ausschließen, ist gleich der Summe der Wahrscheinlichkeiten dieser Ereignisse: P(Xl,
x2) = P(Xj) + P ( x 2 ) .
Es handelt sich um das exklusive Oder von „disjunkten" Meßwerten, die also nicht gleichzeitig auftreten können. E s gilt außerdem die entscheidende Voraussetzung, daß die Menge der unterscheidbaren Versuchsergebnisse abgeschlossen ist. Nimmt man ein weiteres Versuchsergebnis hinzu, so ändert sich auch die Wahrscheinlichkeitsverteilung, es sei denn, es handelt sich um ein unmögliches Ereignis, mit P j = 0. Qualitativ
und quantitativ
unterscheidbare
Ereignisse:
F ü r das Verständnis der Meßtheorie erscheint folgender Hinweis für wichtig. Man hat zu unterscheiden, ob der Beobachtung des Auftretens eines Versuchsergebnisses ( = Elementarereignis) nur eine Maßzahl P s — die Wahrscheinlichkeit — zugeschrieben werden kann oder noch eine zweite Maßzahl, die Amplitude des Meßwertes. I m ersten Fall liefert eine „Ereignisquelle" Farben oder Buchstaben oder Symbole (als allgemeine Bezeichnung, wozu auch Situationen oder Strukturen gehören). E s muß sich nur um eine klar unterscheidbare und um eine abgeschlossene Menge von „Ereignissen" handeln, die mit unterschiedlicher Häufigkeit auftreten. Beträgt ihre Anzahl N und sind sie gleichwahrscheinlich, so gilt P f = konst = 1 ¡ N . Diese Wahrscheinlichkeitsverteilung des Modells wird z. B . angenommen, wenn keine A-priori-Information über den Vorgang weiter vorliegt. Der erste Fall wird nachfolgend als Inhalt der klass. Informationstheorie weiter verfolgt werden. Der zweite Fall liegt vor, wenn das Beobachtungsergebnis durch eine Amplitude (oder im mehrdimensionalen Fall durch mehrere Amplitudenwerte) beschrieben werden kann. Dann geht der „Ereignisraum" in einen linearen Raum 2*
10
1. Informationsbewertung durch Meßsysteme
über, im einfachsten Falle in eine Zahlengerade mit diskontinuierlicher oder kontinuierlicher Werteverteilung. I n diesem Falle t r i t t ein skalarer F a k t o r des Ereignisses auf; man kann von einem Vielfachen des Ereignisses ( = Meßwert) sprechen, was im ersten Falle nicht möglich ist. Diese Erweiterung auf ein oder mehrere Amplitudenmaßzahlen braucht man, wie noch näher erläutert werden wird, unbedingt zum Aufbau einer Meßtheorie der Informationsverarbeitung! Wenn im zweiten F a l l die Meßgröße einen kontinuierlichen Wertebereich überstreicht, dann t r i t t an die Stelle der Wahrscheinlichkeit die Wahrscheinlichkeitsdichte p(x) m i t : P(x)
=
x-{-Ax J p(x)
dx.
X
Sie stellt die Wahrscheinlichkeit pro Amplitudenintervall in einem hinreichend kleinen Wertebereich von x bis x + Ax dar, und P(x) ist der Mittelwert im Bereich von x bis x + Ax. E s wird unten gezeigt werden, daß bei vielen Meßprozessen infolge der Meßunsicherheit nur diskrete Amplituden unterschieden zu werden brauchen, aber für theoretische Betrachtungen, z. B . des Stör-Rauschens, ist es zweckmäßiger, mit kontinuierlicher Amplitudenverteilung zu rechnen. Dies hängt von den anliegenden Meßproblemen ab, ob man den Ubergang zu diskreten Meßwerten vor oder am Schluß der Analyse durchführt, und er ist nicht von grundsätzlicher Bedeutung! Die Mittelwertbildung kann auch an Meß Wertfunktionen f(x) durchgeführt werden. Dies ergibt die Bildung von Momenten nach der statistischen Grundformel. £{/(*)}
= //(*)/>(*)
dx
=f(x).
— OO
Diese statistischen Mittelwerte werden Erwartungswerte genannt und mit E bezeichnet, zum Unterschied von den zeitlichen Mittelwerten, von denen später die Rede ist. Sie dienen zur Bildung von Momenten. Das Moment 1. Ordnung ist definiert als: oo
M1 = E{x\ = J x p(x) dx = x — 00
- bezeichnet den statist. Erwartungswert!
Das Moment 2. Ordnung ist definiert als: oo
M 2 = E[x2}
= J x2p(x) — OO
dz =
Ä
1.1. Der Informations-Aspekt der Meßtechnik
11
Schließlich ist noch das Zentralmoment zu erwähnen: M2Z = E[(x-
xf\ =o2
oo = f ( x - x)2p(x) — oo
dx =
( T ^ f .
a ist die „Streuung" und er2 wird als „Varianz" bezeichnet. Es gilt die Beziehung: M 2 = M j 2 + ff2 bzw.
o-2 = M 2 -
Mj2,
sie ist der Mechanik bekannt als der STEINERsche Satz für das Zentralmoment. Weitere Kenngrößen zufälliger Prozesse werden in 1.1.2. und 2.3. besprochen. Zum Begriff
der
Verbundwahrscheinlichkeit:
Die Wahrscheinlichkeitsverteilung P(X) oder p(x) wird als Wahrscheinlichkeitsverteilung 1. Ordnung bezeichnet. Sie liefert energetische Aussagen in Form der Momente, wenn x eine Amplitude bedeutet. Ihr informationstechnischer Aussagewert ist gering. Für die Informationstechnik bedeutungsvoller hat sich der Begriff der Wahrscheinlichkeitsverteilung verknüpfter Ereignisse als Wahrscheinlichkeitsverteilung 2. Ordnung erwiesen. Sie wird auch als Verbundwahrscheinlichkeit bezeichnet. Betrachten wir eine Folge von diskreten Ereignissen von zwei Prozessen. Man versteht unter der Verbundwahrscheinlichkeit P(X,Y) die Wahrscheinlichkeit, daß die Meßereignisse X und Y gleichzeitig auftreten. Ferner versteht man unter der bedingten Wahrscheinlichkeit P(X/Y) die Wahrscheinlichkeit, daß beim Auftreten des Ereignisses Y auch das Ereignis X auftritt. Für das Auftreten eines derartigen verknüpften Ereignisses (X, Y) gilt: P(X,Y)
= P ( X / Y ) • P ( Y ) und ebenso:
P(X, Y) = P ( Y/X) • P(X). Für alle voneinander unabhängig auftretenden Ereignisse gilt: P ( X , Y) = P(X) • P(Y). Zwei Ereignisse sind voneinander unabhängig, wenn die Wahrscheinlichkeit des verknüpften Ereignisses (X, Y) gleich dem Produkt der Einzelwahrscheinlichkeiten ist (Satz von der statistischen Unabhängigkeit).
12
1. Informationsbewertung durch Meßsysteme
Begriff
der totalen
Wahrscheinlichkeit:
Bei statistisch abhängigen Ereignissen gilt für ein bestimmtes Ereignis Y ; : P(Y f /X) =
PIX Y)
als
bedingte Wahrscheinlichkeit.
Daraus erhält man die totale Wahrscheinlichkeit P(X), wenn man über alle möglichen Ereignisse Y; summiert: N P(X) = £ P(Yi) • P{XjYi) als Mittelwert aller bedingten Wahrscheinlichkeiten. i=i Die gesuchte bedingte Wahrscheinlichkeit P(Y;/X) ergibt sich somit zu: P(YilX)
= P ( X / Y , ) • P(Y{) P(X)
P(XjYj) • P(Yä) j r P(Y.) P(X/Yj)
Diese Beziehung wird als die Formel von BAYES bezeichnet. Sie hat folgende Bedeutung: Angenommen, es wird ein Meßereignis X beobachtet, daß von verschiedenen Ursachen Y; hervorgerufen sein kann. Dies wird durch die bedingte Wahrscheinlichkeit P(X/Yj) beschrieben. Durch Mittelwertbildung (Nenner der Formel von BAYES) erhalten wir die Wahrscheinlichkeit für das Auftreten des Ereignisses X, des Meßergebnisses (Ausgangs-Seite). Dann liefert die Formel die bedingten Wahrscheinlichkeiten für die N möglichen Ursachen Y; des Meßereignisses. Man berechnet mittels der Formel von BAYES die Wahrscheinlichkeit der Ursache Y; aus der Wahrscheinlichkeit der Wirkung, d. h. des beobachteten Meßereignisses. Anstelle von Ursache kann man Y; auch als Bedingung interpretieren. P(X/ Y;) ist die A-priori-Information, mit welcher Wahrscheinlichkeit ein Meßereignis unter der Bedingung Yj eintritt. P(YJX) ist die A-posteriori-Wahrscheinlichkeit, mit der die Bedingung Y; für das Meßereignis X vorgelegen haben kann. Aus dem Yersuchsausgang wird die Versuchsbedingung ermittelt. Die Formel von BAYES findet in der Meßtechnik vielfache Anwendung, vorzugsweise in der Entscheidungstheorie. In den nachfolgenden Abschnitten wird gezeigt werden, welche grundlegende Rolle der Begriff der verknüpften Ereignisse in der Meßtechnik spielt. Ergänzungs-Literatur zur Wahrscheinlichkeitstheorie und Stochastik: [51, 52, 54, 55, 56, 57, 58, 59, 62, 65, 69, 70, 71, 76, 77, 79].
1.1. Der Informations-Aspekt der Meßtechnik
1.1.2.2. Meßbewertung bei nur qualitativ durch die Informationstheorie, Meßstochastik
13
unterscheidbaren der algebraische
Ereignissen Aspekt der
Neben der in 1.1.2.1. kurz skizzierten statistischen Betrachtungsweise der Meßstochastik spielen auch algebraische Betrachtungen eine Rolle, die wir hier als den algebraischen Aspekt bezeichnen wollen. Wir begegnen ihm nachfolgend an verschiedenen Stellen. In Zusammenhang mit der statistischen Betrachtungsweise tritt er in Form der Booleschen Algebra auf (mathematisch als Wahrscheinlichkeits-Algebra). S H A N N O N hat 1948 ([74]) hierzu die Begriffe auf die Bedürfnisse der Informationstechnik ausgerichtet. Es handelt sich um folgende Problemstellung : Wie betrachten die gewonnenen Meßinformationen des Meßgebers nur als „Meßereignisse" oder als Symbole ohne eine Amplitudeninformation. Entweder ist diese nicht vorhanden, z. B. bei der Beobachtung von verschiedenen optischen Signalen, oder sie wird nicht ausgenutzt. Die Meßereignisse sollen eine endliche und abgeschlossene Ereignismenge bilden, und sie sollen durch keine andere Maßzahl gekennzeichnet sein als durch die jedem Ereignis zugeordnete Wahrscheinlichkeit. Das generelle Problem besteht darin, geeignete Kenngrößen aufzufinden, die den Prozeß diskreter Ereignisse charakterisieren. Diese Aufgabe hat sich die Informationstheorie von S H A N N O N gestellt und gelöst. Eine weitere Aufgabe besteht darin, die Meßereignisse in geeigneter Weise umzuformen und umzurechnen. Die Aufgabe läßt sich mit Hilfe der Gruppentheorie oder mit Hilfe von anderen algebraischen Strukturen mittels meßinformationsverarbeitender Systeme lösen, wie im Abschnitt 1.3. gezeigt werden wird. Die Einheit der Meßinformation,
das
Bit:
Wenn man in der Meßtechnik eine Meßinformation, die ein Meßgeber zu einem bestimmten Zeitpunkt liefert, quantitativ auswerten will, ergibt sich die Frage nach einer begrifflichen Definition der Meßinformation. Diese kann aus einer Maßzahl bestehen, aber auch aus einer bestimmten Meßbeobachtung in Form einer Farbe, eines Zeichens u. a., kurz Symbol genannt. Die Frage wird von der Informationstheorie folgendermaßen beantwortet: Man stellt sich vor, die Meßinformation sei aus einer endlichen Menge von N möglichen Meßwerten entnommen. Dann kann diese Auswahl eines „Symbols" der Menge in q = ld N = log 2 N Auswahlschritten erfolgen. Hierbei nehmen wir zunächst an, daß N eine Potenz von 2 ist (andernfalls muß man die nächst höhere Potenz von 2 als Wert für N wählen!). Bei jedem Auswahlschritt denkt man sich die Restmenge in
14
1. Informationsbewertung durch Meßsysteme
2 Hälften geteilt, die mit 0 oder 1 bezeichnet werden. Die Angabe der Binärziffer gibt die Teilmenge an, die den Meßwert — das Symbol — enthält. So kann man jeden Amplitudenwert oder jedes Symbol durch eine bestimmte Binärzahl kennzeichnen. Eine 7stellige Binärzahl reicht zur Bezeichnung von einem aus 2 7 = 128 Meßwerten aus. Man kann durch Übertragung dieser Binärzahl den Meßwert als Meßinformation in kodierter Form einer Auswertstelle mitteilen. Die Einheit des Kodierungsaufwandes ist das „bit". Es kennzeichnet einen Auswahlschritt „0 oder 1". Die Stellenzahl q der Binärzahl ist gleich der bit-Zahl des Kode-Wortes. Es gilt: q = [Id N] = 3,32 log 10 N für verschiedene Amplitudenwerte. Für 1000 Amplitudenwerte benötigt man q = 9,96 RS 10 bit = 10 Stellen zur Kennzeichnung eines der 1000 Amplitudenwerte durch eine Binärzahl. Die eckige Klammer gibt die nächst höhere ganze Zahl an, da die Stellenzahl nur ganzzahlig sein kann. Für 106 Symbole benötigt man eine 20stellige Binärzahl. Der Vorteil einer Übertragung von Binärsignalen wurde zuerst in der Nachrichtentechnik erkannt und für die Pulskodemodulation benutzt. Die hier noch offene Frage, ob eine Diskretisierung von Meßamplituden sinnvoll und möglich ist, kann bejaht werden und wird in Abschn. 2.2. nochmals näher untersucht. Von der Informationstheorie werden nur Fragen der Iniormalionsübertragung beantwortet, wobei die weiteren Untersuchungen sich dem Problem der Optimierung des Kodierungsaufwandes zuwenden. Die Umrechnung eines Meßamplitudenwertes in eine entsprechende Binärzahl und die Übertragung der Binärzahl bedeutet keinen Informationsverlust, wenn auf der Empfangsseite eine Kodeliste vorliegt und ein Dekodiergerät den Meßamplitudenwert zurückgibt. Meßgröße
des
Informationsflusses:
Die Informationstheorie ergibt die Möglichkeit, eine Information quantitativ zu bewerten, wobei das logarithmische Maß für die Mannigfaltigkeit der Information einen sinnvollen Nullwert definiert: für N = 1 ergibt sich q = Id 1 = 0 . Wenn nur eine einzige Möglichkeit (1 Zeichen, 1 Symbol) vorliegt, braucht man keine Auswahl zu treffen. Der „Informationsgehalt" ist Null. Sie bietet die Möglichkeit, den laufenden Informationsfluß quantitativ zu erfassen. Die Einheit des bit läßt sich zur Einheit des Informationsflusses in bit/s erweitern. Dies bedeutet die Anzahl der Binärzeichen, die je s durch die kodierten Signale übertragen werden. Dieser Begriff läßt sich auf viele Bereiche anwenden, um eine Informationsübertragung quantitativ zu erfassen. Der Informationsfluß oder Binärzeichenfluß muß unterschieden werden vom Symbolfluß, von der Anzahl der je s übertragenen oder entnommenen Symbole. Der Begriff Symbol ist hier eine Verallgemeinerung. In der Meßtechnik kann man
1.1. Der Informations-Aspekt der Meßtechnik
Informationsgehalt Nachrichtanmenge
, An. A
J m - A - f l T L
Informationsfluss
15
^
bit Is
Abb. 1.4. Informationsgehalt und Informationsfluß
Meßwert dazu sagen, aber ein Symbol braucht keine quantitative „Amplitudeninformation" enthalten! Es gilt die wichtige Beziehung für die Kodierung von Meßereignissen, allgem. von Symbolen: Informationsfluß = Symbolfluß mal Kodierungsaufwand F
= V - I
d. h.: Mit F — Informationsfluß in bit/s V — Symbolfluß in Symbolen/s I — Entscheidungsgehalt oder Kodierungsaufwand in bit/ Symbol Wenn alle Symbole mit gleicher Stellenzahl q kodiert werden, beträgt I = ld JV, wenn N die Anzahl der Symbole sind und es gilt: F = F - l d i V i n bit/s. Zur Übertragung von Informationen über Meßereignisse benötigt man in der Zeit T die Informationsmenge: QinS
=
T-
F - l d i V i n bit.
Bei Kodierung von Symbolen mit unterschiedlicher Stellenzahl q — entsprechend der Häufigkeit wie beim Morse-Alphabet — benötigt man einen mittleren Informationsfluß von: Fmitta
=
V • Hin
bit/s.
Hierbei bedeutet H den mittleren Kodierungsaufwand je Symbol, der als Informationsentropie bezeichnet wird (s. u.). Für die voll automatisierte Meßwertübertragung hat eine ungleiche Symbolkodierung einen großen Nachteil:
16
1. Informationsbewertung durch Meßsysterne
Ein konstanter Symbolfluß V hat nur dann einen konstanten Informationsfluß zur Folge, wenn der Kodierungsaufwand je Symbol für alle Symbole gleich groß ist. Wenn man Meßwerte mit ungleicher Stellenzahl q kodiert, muß man bei einer automatischen Kodierungseinrichtung eine Pufferstufe (Informationsspeicher) einfügen, um bei konstantem Symbolfluß auch einen konstanten Zeichenfluß zu erreichen. Daher verwendet man bei automatischem Betrieb (Telex-Fernschreiber) nur eine gleiche Stellenzahl für alle Symbole. E s bleibt zunächst die Frage offen, ob man bei einem kontinuierlichen Informationsfluß diese Begriffe gebrauchen kann. Es wird später (in Abschnitt 2.2.2.) gezeigt werden, daß dies unter bestimmten Bedingungen möglich ist, indem eine Zeitdiskretisierung durch Abtastung des Meßvorganges vorgenommen werden kann, allerdings nur bei frequenzbegrenzten Prozessen! Zuordnung von binären Informationsentropie:
Kodeworten
zu quantisierten
Meßwerten
und Begriff
der
Die Formel für den Kodierungsaufwand q = ld N läßt sich noch anders deuten. Wenn N Amplitudenwerte in einem stochastischen Prozeß mit gleicher Wahrscheinlichkeit auftreten, dann gilt: P = P ; = 1/iV für die Wahrscheinlichkeit des Auftretens eines Amplitudenwertes. Es ist q = ld 1/P = — ld P m i t P = 1/N. Hier ist q zugleich der mittlere Kodierungsaufwand q = E{q) für ein Symbol der Symbolmenge, bzw. für eine Amplitudenstufe der Meßwertmenge. Treten die Symbole mit verschiedener Wahrscheinlichkeit auf, die wir mit P ; für das Symbol mit dem Index i bezeichnen, so ergibt sich für jedes Symbol ein eigener Kodierungsaufwand, eine unterschiedliche Stellenzahl q = —ld P ; (wobei nur ganzzahlige q realisierbar sind). Der mittlere Kodierungsaufwand für das ,Alphabet' beträgt dann nach der Formel für einen statistischen Mittelwert ( = Erwartungswert) m
= ? =zp&i i=1
= - ¿ P i W Pi = ¡=1
H.
H wird als „Informations-Entropie" bezeichnet. Die Informationsentropie H hat also für die Meßtechnik zwei verschiedene Bedeutungen: erstens kennzeichnet sie den mittleren Kodierungsaufwand je Symbol in bit/Symbol, und zweitens kennzeichnet sie den mittleren Informationswert eines Symbols, ebenfalls in der gleichen Maßeinheit bit/Symbol. Der Zusammenhang mit der thermodynamischen Entropie ist für die makroskopische Meßtechnik ohne Bedeutung und soll daher hier nicht erläutert werden (vgl. PETEBS [67]). Für Gleichverteilung P ; = P ergibt sich H = —ld P = ld N für N Symbole. Dies ist der Maximalwert von H. Bei ungleicher Wahrscheinlichkeit der Symbole
17
1.1. D e r I n f o r m a t i o n s - A s p e k t der Meßtechnik
ist H < Hmax. Dies bedeutet, daß bei ungleicher Kodierung der mittlere Kodierungsaufwand für ein Symbol verringert werden kann. Aber dies hat mehr theoretische als praktische Bedeutung, da dazu der Aufwand der Kodierungseinrichtung vergrößert werden muß, außerdem die Störfestigkeit verringert wird. Beispiel:
Wird alle 20 m s j e eine aus 64 unterschiedenen Meßamplituden ü b e r t r a g e n ,
so b e t r ä g t der
I n f o r m a t i o n s f l u ß bei gleicher Wahrscheinlichkeit:
1000 ^ ld64 =
50-6
= 300 b i t / s u n d zur K o d i e r u n g werden Binärworte v o n q = ld 64 = 6 Stellen benötigt. Alle S y m b o l e (Meßwerte) werden m i t gleicher Stellenzahl kodiert. B e s i t z e n aber nur 2 5 % der Meßwerte die mittlere H ä u f i g k e i t P ; = 1/64 der Gleichverteilung, sind d a g e g e n 2 5 % doppelt so häufig mit Pi = 1/32 u n d 5 0 % halb so h ä u f i g m i t N
Pi = 1/128 (wobei £
¡=1
P j = 1 erfüllt ist), ergibt f ü r die drei G r u p p e n j e w e ü s eine K o d i e r u n g
mit (fo — —ld P j von 6 oder 5 oder 7 Binärzeichen und die mittlere Stellenzahl ( = Informationsentropie) ergibt sich z u :
H = -
1
v
27 P; ld P : = 16 ¿x
32
5 + 16
1
64
6 + 32
1 128
7
= 2,5 + 1,5 + 1,75 = 5,75 bit < i f m a x = 6 bit. I m Mittel wird also 0,25 b i t / S y m b o l an K o d i e r u n g s a u f w a n d eingespart. D o c h b e d e u t e t eine ungleichmäßige K o d i e r u n g v o n S y m b o l e n (Amplitudenwerten) entweder einen Mehraufw a n d f ü r ein Pausenzeichen a m E n d e j e d e s binären K o d e w o r t e s oder eine e x t r e m e Störanfälligkeit, d a bei einem einzigen Fehler die f o r t l a u f e n d e R e i h e v o n B i n ä r s i g n a l e n (0,1) nicht mehr dekodiert werden k a n n .
Man benutzt die Informationsentropie einer Meßwertmenge, um den Informationswert eines Symbols dieser Menge im Mittel zu kennzeichnen. Dies ist u. a. für den Vergleich von Kommunikationsmitteln (Sprachen) von Interesse, setzt aber die Kenntnis der Wahrscheinlichkeitsverteilung der Symbole voraus. Dies geschieht durch die Analyse der Häufigkeit von Buchstaben in sehr langen Texten. So ergeben 26 Symbole gleicher Wahrscheinlichkeit H = Hmix = ld 26 = 4,70 bit/ Symbol. KÜPFMÜLLES ermittelte aus der Häufigkeitsverteilung der 26 deutschen Buchstaben eine Informationsentropie von 4,097 bit/Buchstabe als „Entropie der deutschen Sprache". In der Wirklichkeit ist aber die Wahrscheinlichkeit für das Auftreten eines Buchstabens von den bereits durchgegebenen oder noch folgenden Buchstaben abhängig (vom „Kontext"). Bei modernen Sprachen liegt der Informationswert in der Größe von 1,5 bit/Symbol. Für die Meßauswertung hat diese Kennzahl aber keine Aussagekraft, da nur die Häufigkeit eines Meßwertes, aber nicht seine absolute oder relative Größe erfaßt wird. Dies ist aber in sehr vielen Fällen der Meßtechnik unbedingt erforderlich. Damit sind die Grenzen der Informationstheorie erreicht, eine Theorie, die ja auch nur für die Optimierung
18
1. Informationsbewertung durch Meßsysteme
der Informationsübertragung geschaffen wurde und nicht für die Informationsauswertung. Man hat für spezielle Anwendungsfälle versucht, diesem Mangel durch Bewertungskoeffizienten der Symbole abzuhelfen, aber damit nur einen begrenzten Erfolg erreicht. Ergänzungs-Literatur zur Informationstheorie: [22, 53, 58, 62, 66, 67, 68, 75].
1.1.3. Empirische
Meßbewertung zur Informations-
Verarbeitung
Es sollen hier zwei Versuche erwähnt werden, die Kenngrößen der Informationstheorie auch für eine Meßbewertung, d. h. für eine Erfassung des quantitativen Inhaltes eines Meßwertes, allgemeiner gesagt eines Meßgegenstandes, heranzuziehen. Hierbei war die Nebenbedingung gewählt worden, daß man bei Gleichbewertung die SHANNONsche Informationsentropie erhält! So schlug z. B . G. LONGO vor, folgendermaßen die SHANNONsche Informationstheorie durch Hinzunahme von „qualitativen" Parametern zu erweitern. E r will damit die Nützlichkeit einer Information erfassen, während die SHANNONsche Definition nur die Wahrscheinlichkeit (die Häufigkeit) eines Symbols einer Inf.Quelle ohne jede Semantik verwendet. LONGO ordnet einem Symbol oder einem Ereignis jeweils einen Nützlichkeitskoeffizienten zu: U i
> 0 [64],
Die Nützlichkeitsverteilung ist unabhängig von der Wahrscheinlichkeitsverteilung. LONGO definiert die „Selbstinformation" zu: I(u,p)
= —ku log p,
wobei k eine Konstante und p = Pi die Wahrscheinlichkeit des iten Ereignisses ist. Der statistische Mittelwert, d. h. die „Nützlichkeitsentropie" lautet dann : H(P, U) =
i
logj»,.
Für Uj = konst. geht die Nützlichkeitsentropie in die gewöhnliche Informationsentropie über. Für nutzlose Ereignisse mit p i > 0 setzt man u; = 0. Wenn aus Uj > 0 folgt : Pi = 0, so bedeutet dies, daß nützliche Ereignisse unmöglich sind, z. B . beim Rauschen. Mit diesem Ansatz H(U, P) wird das Konzept der Informationstheorie durch ein subjektives Element ergänzt.
1.1. Der Informations-Aspekt der Meßtechnik
19
Ein zweiter Versuch, die SHAiTNONsche Informationsentropie zu verallgemeinern und dabei den Begriff einer bewerteten Informationsentropie zu entwickeln, stammt von G. SCHULZ ( [ 7 4 ] ) . Auch er versuchte, die Inf. Entropie als statistischen Mittelwert des Informationsgehaltes ld l/p{ der Einzelereignisse: H = — E Pi^ pt
i
abzuändern, um sie nicht nur für die Informationsübertragung, sondern auch für die Informationsauswertung geeignet zu machen. Er betrachtet dabei als Anwendungsbeispiel die Bewertung der Wirksamkeit eines Medikamentes. Er führt hierfür eine Bewertungsskala ein, wobei für den ungünstigsten Fall die niedrigste Punktzahl und für den günstigsten Fall die höchste Punktzahl (in geometrischer Progression) festgesetzt wird, z. B. bei 6 Versuchsergebnissen:
V0
= 1,
Vx
= 2,
V2
= 4,
V3 =
8,
VT =
16, F 5 = 3 2 .
Daraus bildet er die relaltiven Bewertungskoeffizienten:
V0 27 V/i
bis
Vm E ^
Sie stehen gleichberechtigt neben der Folge der relativen Häufigkeiten p^. Der naheliegende Ansatz H(p, v) = —Ppvp log p^v^ ist nicht brauchbar, weil die Zusatzforderung gestellt wird, daß bei gleicher Bewertung aller Versuchsausgänge sich die SHANNONsche Informationsentropie ergeben soll. Der Ansatz ist daher so umzuformen, daß bei gleichen Bewertungskoeffizienten die Größen vm aus der Funktion und insbesondere aus dem Logarithmus herausfallen. m p v •p v H(p,v) =H(p1, p2,...pm-, vi,v2,...vm) = — JT J- " log m " " . " =1 E Py vy E Py vy y=l y=1
Die Funktion H(p, v) ist in bezug auf p und v symmetrisch. Für pt = konst.
m ergibt sich: H(v) = — JJ v^ log v^ und für px = p2 = •••pn = v1 = v2 = •••vm fx = 1 m
folgt der Grenzfall H(m) = —m 2J log 1/m = log m mit m als Anzahl der Versuchsausgänge. Man kann auch mit den absoluten Bewertungskoeffizienten V/x und den absoluten Häufigkeiten P^ rechnen.
m p y f=l y p v y-1 ± y r y Es sind nur positive V^ zugelassen!
p y y p Mv y=1^ y ' y
20
1. InformationsbeWertung durch Meßsysteme
Meist rechnet man mit dem dualen Logarithmus und der Maßeinheit 1 bit. Als Maßeinheit für die Bewertung schlägt SCHULZ 1 val vor. Der Grundgedanke dieses Vorschlages besteht darin, daß die Wahrscheinlichkeit eines Ereignisses bewertet wird. Es gilt dabei: H(p, v) = H(P, V) = H(w) = - £ w^ ld w„ (.=l in formaler Übereinstimmung mit der unbewerteten SHANNONschen Entropie: H
(p)= — m e=i
H(w) ist im Definitionsbereich 0 < w < 1 nur positiv und nimmt für w^ = 1 jm das einzige Maximum an, wie die SHANNON-Entropie H(jp). SCHULZ hat mit dieser Kenngröße versucht, die Verbesserung der Wirkung eines verabreichten Medikaments durch die Maßzahl der bewerteten Informationsentropie auszudrücken. Eine gewisse Willkür liegt in der Wahl der Bewertungskoeffizienten ! Zusammenfassend ist festzustellen, daß die klassische Informationstheorie von SHANNON als Theorie der optimalen Informations-Übertragung und Informations-Speicherung Fragen der optimalen Informations-Auswertung nicht ausreichend beantworten kann. Diese Erweiterung führt in der Meßtechnik zur Meß-Informationstheorie, speziell zur Meßstochastik.
1.2. Der System-Aspekt
der
Meßtechnik
Die Meßtechnik verlangt von der Theorie mathematische Modelle, mit deren Hilfe die Meß-Systeme optimal dimensioniert werden können. Dazu werden Kenngrößen eingeführt. In Abschn. 1.1. wurde der Begriff der Informations-Entropie als Mittelwert des Kodierungsaufwandes für ein Meßereignis zur Optimierung der Informationsübertragung und Informationsspeicherung vorgestellt. Dazu benötigt man die Wahrscheinlichkeitsverteilung der Meßereignisse, die eine abgeschlossene Menge bilden müssen. Man kann diese Verteilung nur durch umfangreiche Versuche ermitteln und benötigt dazu ein Meßsystem (vgl. Abschn. 2.3.1.1.). Um derartige Meßsysteme zur Bewertung von Informationsflüssen handelt es sich bei den folgenden Betrachtungen. Die SHANNONsche Informationstheorie berücksichtigt meist nur die Wahrscheinlichkeitsverteilung der Meßereignisse und benutzt bemerkenswerterweise nicht die Amplitudeninformation des Meßereignisses, d. h. den eigentlichen Meßwert selbst.
1.2. Der System-Aspekt dei Meßtechnik
21
Wie in Abschn. 2.2.2.2. später gezeigt wird, wird nur noch die mittlere Signalleistung zur Amplituden-Diskretisierung, d. h. zur Festlegung der Anzahl der unterscheidbaren Amplituden benötigt. Mit anderen Worten: die klass. Informationstheorie von Shannon arbeitet nur mit A-priori-Informationen über den empfangenen Informationsfluß (lat. a priori: ,vorher'). Im Gegensatz dazu benutzt die Meß-Informations-Theorie, speziell die Meßstochastik, zur Informations-Verarbeitung die Amplitudeninformationen der Meßereignisse, d. h. die A-posteriori-Informationen (lat. a posteriori: ,nachher'), die sich erst nach dem Eintreffen des Meßwertes ergeben. Kenngrößen-Bildung
durch informationsverarbeitende
Systeme:
Wir treffen hier auf den System-Aspekt der Meßtechnik, die Betrachtung der Meß-Informations-Systeme. Abb. 1.5 stellt die Situation dar, das Schema der Informations-Verarbeitung stochastischer Prozesse, auf das sich die nachfolgenden Ausführungen beziehen. An einem Meßort gibt der laufende Prozeß über eine physikalische Größe (Lautstärke, Abstand, Geschwindigkeit, Temperatur, Druck ü. a.) eine Meßinformation an einen Meßfühler ab. Dieser setzt sie in ein elektrisches Meßsignal um, das in Meßanlagen entweder kontinuierlich übertragen oder zu diskreten Zeitpunkten kontinuierlich abgetastet wird. Die diskreten Amplitudenwerte stellen den Symbolfluß — in der Ausdrucksweise der Informationstheorie — dar. Bei diesen diskreten Meßsystemen, die uns vorrangig interessieren, werden die diskreten Amplitudenwerte über einen A/D-Wandler in binäre Kodeworte umgewandelt. Diese ergeben den Signalfluß (oder Informationsfluß) in bit/s. Die nachfolgend betrachtete Aufgabe ist die Umwandlung des primären Meßinformations-Flusses in einen sekundären Informationsfluß oder in eine ProzeßKenngröße in Form eines Kennwertes oder einer Kennfunktion. Hierzu benötigt man ein informationsverarbeitendes System. Den hiermit zusammenhängenden Fragenkomplex nennen wir den Systemaspekt der Meßtechnik. Ferner unterscheiden wir zwei Hauptaufgaben, die Informationsübertragung, die meist ohne Informationsreduktion (Informationsverlust) vor sich gehen soll, und die Informationsauswertung, die meist mit einer Informationsreduktion verbunden wird. In beiden Fällen treten folgende Fragen auf: 1. Welche Systemstrukturen stehen zur Informationsverarbeitung prinzipiell zur Verfügung? 2. Welche Kenngrößen oder welche Sekundärprozesse lassen sich mit Hilfe der Systeme herstellen?
22
1. Informationsbewertung durch Meßsysteme
Meßtechnik (Kenngrößennahl)
Abb. 1.5. Schema der Informationsverarbeitung stochastischer Prozesse Der nachfolgende Abschn. 1.2. soll einen kurzen Überblick über die Systemdarstellung der Nachrichten- und Regelungstechnik geben, und anschließend wird eine für die Meßtechnik optimale Systemstruktur vorgeschlagen, die sowohl die Analog- als auch die Digitaltechnik berücksichtigt. 1.2.1. Die black-box-Darstellung
und die Theorie der linearen
Systeme
Systeme werden in der Kybernetik wie folgt definiert: „Ein System ist eine Menge von Elementen und eine Menge von Relationen, die zwischen den Elementen bestehen. Alle isomorphen Gesamtheiten dieser Art werden als ein und
1.2. Der System-Aspekt der Meßtechnik
23
dasselbe System betrachtet. Die Menge der Relationen zwischen den Elementen macht die Struktur a u s " ([34]). Zur Ausnutzung der mathematischen Grundlagen ist es notwendig, eine gemeinsame Basis für die Kooperation von Mathematik und Meßtechnik zu finden. Diese ergibt sich aus der obenstehenden Definition eines Systems. Ein „ S y s t e m " wirkt mathematisch betrachtet als Operator auf den Eingangsinformationsfluß bzw. auf das Eingangs-Signal, j e nachdem welcher Ausdrucksweise wir uns anschließen. Zur anschaulichen Darstellung des Sachverhaltes hat man in der Kybernetik den Begriff des „Schwarzen K a s t e n s " eingeführt (engl, black-box). Dies ergibt folgendes Schema: II Eingangs-Information II (Eingangs-Signal)
g
^
Ausgangs-Information (Ausgangs-Signal)
Man betrachtet hierbei nur einen Eingang und einen Ausgang. Mehrdimensionale Größen lassen sich durch Eingangs- und Ausgangs-Vektoren darstellen. Bleiben wir zunächst beim eindimensionalen Fall! In der Informationstechnik unterscheidet man analoge und digitale Systeme, je nachdem dem Eingang eine kontinuierliche oder eine diskrete Folge von Eingangs-Signalwerten entnommen wird. Die analogen Systeme werden durch eine elektronische Schaltung realisiert, die digitalen gleichfalls, aber auch durch einen Computer ersetzt, der allerdings letzten Endes auch wieder aus einer elektronischen Schaltung besteht. Die analogen Operationen lassen sich auf der Basis des Abtast-Theorems nach Abschn. 2.2.2. durch digitale Operationen ersetzen. E s werden dann nur die Abtastwerte des Eingangs verarbeitet. Eine wichtige Einteilung ist die in lineare und in nichtlineare Systeme, d. h. in Systeme zur linearen und zur nichtlinearen Signalwandlung. Lineare Systeme sind Systeme, für die das Superpositionsgesetz gilt: wenn ein Eingangssignal x 6i ein Ausgangs-Signal x a i hervorruft und ein Eingangssignal xe^ ein Ausgangs-Signal xadann ruft bei einem linearen System die Summe der Eingänge x g i + xe> die Summe der Einzelreaktionen des Systems hervor: d. h. x0i + Daraus folgt, daß eine n-fache Eingangsamplitude n • xe die ra-fache Ausgangsamplitude n • xa hervorruft. Das System ist amplitudenunabhängig. Bei Erregung mit harmonischen Schwingungen entstehen keine neuen Frequenzen in linearen Systemen. Bei realen Systemen gilt dies nur für hinreichend kleine Amplituden! Lineare Systeme werden vorzugsweise zur Informationsübertragung und zur spektralen Signalselektion benötigt, die nichtlinearen Systeme zur Informationsumsetzung (auf Trägersignale), zur Signalwandlung (z. B . als Begrenzer) und zur Informationsverarbeitung. Letztere sind für die Meßtechnik besonders wichtig 3
Lange
24
1. Informationsbewertung durch Meßsysteme
und werden uns nachfolgend noch beschäftigen. Hier spielen die Verbundsysteme (Abschn. 3.2.) eine große Rolle. Bleiben wir zunächst bei der black-box-Vorstellung mit einem einzigen Signaleingang, dem einfach ausgesteuerten System. Nach dem obigen Schema lassen sich drei Fälle unterscheiden: entweder ist das Eingangssignal oder das System oder das Ausgangssignal unbekannt und zu bestimmen, während die anderen beiden Größen vorgegeben sind. Fall der
Eingang
System
Ausgang
Meßtechnik, Signalanalyse Systemtechnik, Systemsynthese Nachrichtentechnik, Systemanalyse
unbekannt
gegeben
gegeben
gegeben
unbekannt
gegeben
gegeben
gegeben
unbekannt
Die Systemtheorie steht vor der Aufgabe, eine Beziehung der Form Ausgangssignal
= Systemfunktion
mal
Eingangssignal
herzustellen, „mal" bedeutet hier eine verallgemeinerte, multiplikative Verknüpfungsoperation. Bemerkung: Die nachfolgenden Ausführungen setzen bereits die Kenntnis der Funktionstransformationen nach FOURIER und LAPLACE voraus, die Gegenstand der Grundlagenausbildung an allen techn. Hochschulen für Elektrotechnik sind (vgl. FRITZSCHE [7], LANGE [ 3 7 ] u n d W U N S C H [ 4 7 — 4 9 ] ) .
Hier sollen nur einige Eigenschaften und Aussagen in Erinnerung gebracht werden, um den Einsatzbereich in der Meßtechnik zu klären.
Dieses Konzept läßt sich am einfachsten bei linearen Systemen verwirklichen, bei denen man eine Systemfunktion unabhängig von der Art und Form des Eingangssignals definieren kann. Die lineare Systemtheorie unterscheidet eine Darstellung im Zeitbereich und eine Darstellung im Spektralbereich ( = Bildbereich) genau wie die Signaltheorie. Im Zeitbereich wird die Ausgangszeitfunktion eines linearen Systems dargestellt als Faltungsintegral: t xa(t) = J xe(r) g(t — r) dr mit g(r) als Gewichtsfunktion des Systems 0 (in [37] mit h(r) bezeichnet).
25
1.2. Der System-Aspekt der Meßtechnik
Man schreibt diese Verknüpfungsoperation auch abgekürzt: xa(t) = xe(t) * g(t) mit * als Faltungsprodukt. Das Faltungsprodukt ist kommutativ: *e{t)*g(t)
=g(t)*xe(t).
Im Spektral- oder Bildbereich wird das Ausgangsspektrum eines linearen Systems dargestellt als algebraisches Produkt des Eingangs-Amplitudenspektrums mit dem Frequenzgang G(joo) des Systems (in [37] mit H(joj) bezeichnet): Xa(jco)
— Xe(ja>) • G(ja>)
oder auch a b g e k ü r z t :
Xa(a>) = Xe(a>) • G(w). Die S p e k t r e n Xe(co),
Xa(a>) u n d G(a>) sind die jeweiligen FouBiEB-Transfor-
mierten der Zeitfunktionen xe(t), xa(t) und g(t). Man rechnet vorwiegend mit der FoTJRlER-Transformation, wenn die Zeitvorgänge zweiseitig zeitbegrenzt sind. Dies ist in vielen technischen Anwendungsfällen der Fall. Für eine tiefere Einsicht in die Systemeigenschaften, speziell für die Lösung von Umkehraufgaben (Systemsynthese) empfiehlt sich die LAPLACE-Transformation. Mit der komplexen Frequenz p = o + jco als Bildvariable lautet die Verknüpfungsoperation im Bildbereich: Xa(p)
= Xe(p)
• G(p) = G(P) •
Xe(p).
Sie stellt wie bei der FOTJBIEE-Transformation ein einfaches, speziell kommutatives, algebraisches Produkt dar. Sie gilt nur für Einschaltvorgänge ab t = 0 mit der Nebenbedingung x(t) = 0 für t < 0. Die hierbei benutzte mathematische Struktur der p-Funktionen ist ein Körper, d. h., es sind die vier Verknüpfungsoperationen Addition, Subtraktion, Multiplikation und Division von zugelassenen ^-Funktionen möglich. Daher sind im Bildbereich die Umkehraufgaben der oben als Systemanalyse bezeichneten Operation möglich. Es gilt für die Signalanalyse: Xe(p) = Xa(p)/G(p) | als Umkehraufgaben der und für die Systemsynthese: G(p) = Xa(p)/Xe(p) f Systemtechnik. Bei den linearen Systemen, die aus diskreten Bauelementen bestehen, ist die gesuchte Funktion schon durch die Angabe der Pole und der Nullstellen — bis auf eine Konstante — völlig bestimmt. Da der Vorgang im Zeitbereich interessiert, muß nach der Lösung der Gleichung des Bildbereiches die Lösung im Zeitbereich durch eine LAPLACE-Rücktransformation aufgefunden werden. Hierbei ist das Hauptproblem die Frage, ob solch ein Zeitvorgang überhaupt physikalisch realisierbar ist. 3*
1. Informationsbewertung durch Meßsysteme
26
Man erkennt hieraus, daß viele Fragen der Signaltheorie in der Theorie der signalverarbeitenden Systeme in ähnlicher Form wieder auftauchen. J a , man kann diesen Teil der Systemtheorie direkt als Signaltheorie auffassen. Alle Eigenschaften der linearen Systeme lassen sich als Systemreaktionen auf bestimmte Testsignale auffassen. So erkennt man, daß für Xe(p) = 1 die formale Beziehung gilt: Q(p)=Xa(p). Die LAPLACE-transformierte Gewichtsfunktion oo G(p) = *{*(!)} = / g(t) er-* dt 0 ist die Systemreaktion auf die Stoßfunktion X(p) = 1, die im Zeitpunkt t = 0 einen DiRAC-Stoß darstellt: ^-.{Xö»)}
=^{1)
=ö(t).
Daher wird die Gewichtfunktion auch als Stoßreaktion des linearen Systems bezeichnet. Die dazugehörige LAPLACE-Transformierte G(p) wird als Übertragungsfunktion des Systems bezeichnet. Die eigentliche Systemtheorie beginnt bei der Berechnung der Übertragungsfunktion G(p) eines vorgegebenen Netzwerkes von linearen Bauelementen. Dies ist die Systemanalyse. Dazu gehört die ingenieurtechnische Umkehraufgabe, zu einer vorgegebenen Übertragungsfunktion G(p) das zugehörige Netzwerk aufzufinden. In beiden Fällen ist man bestrebt, nur Widerstände und Kondensatoren als passive Bauelemente, also keine Induktivitäten zu verwenden. Dies gelingt in einer begrenzten Anzahl von Fällen bei zusätzlicher Verwendung von aktiven Bauelementen (Operationsverstärkern, Mikroelektronik!). Zusammenfassend ist festzustellen, daß die LAPLACE-Transformation für die Analyse und die Synthese von linearen Netzwerken geeignet ist. Sie liefert zusammen mit dem Sonderfall der FoURIER-Transformation ( p ->ja>) die Grundlagen für die spektrale Betrachtungsweise der Informationstechnik. Hierzu gehört vor allem der Begriff des Frequenzganges von linearen Systemen! Zur Lösung in diskreter Darstellung bildet das Abtast-Theorem die Grundlagen (vgl. Abschn. 2.2.2. und [35 a]). 1.2.2. Frequenzgang'Beschreibung
von linearen
Systemen
Unter den Systemreaktionen, die für die Beschreibung des System-Verhaltens am häufigsten herangezogen werden, gehört der Frequenzgang. Man versteht darunter die Antwort eines linearen Systems auf eine harmonische Schwingung
1.2. Der System-Aspekt der Meßtechnik als
Eingangs-Erregung.
27
Hierbei ändern sich die Amplitude und die P h a s e der har-
monischen Schwingung, ohne d a ß neue Frequenzen e n t s t e h e n . E s sei f ü r xe(t) = e?) sa 1. Das Verhalten im Übergangsbereich wird am klarsten durch die Ortskurve (vgl. Abb. 1.6) beschrieben. Dieses einfache Beispiel zeigt grundsätzlich, wie man das spektrale Verhalten eines linearen Systems analysiert. Dies führt zur Filtertheorie elektrischer Netzwerke zum Zweck der spektralen Signaltrennung. Der Entwurf derartiger Systeme mit vorgegebenen spektralen Eigenschaften ist als Systemsynthese die Umkehrung der Aufgabe der Systemanalyse und erfordert erhebliche mathematische und technische Überlegungen (vgl. [7] und [36]). Hierbei ist zu beachten, daß stets ein Informationsverlust eintritt. Dieser ist meist erwünscht, um unerwünschte spektrale Anteile eines Informationsflusses auszusondern. Aber eine Frequenzbegrenzung tritt auch bei der Meßwertübertragung auf, z. B. über Telefonleitungen im Gebiet über 4 kHz. Dann ist sie durch Netzwerke mit inversem Frequenzgang nicht kompensierbar, da derartige Kompensationsnetzwerke nur annähernd physikalisch realisierbar sind. Außerdem werden bei der Kompensation Rauschanteile hervorgehoben, d. h., der Störabstand wird verschlechtert (vgl. 3.1.3.). Ein Kompensationsnetzwerk muß stabil sein (d. h. stets schwingungsdämpfend, nicht schwingungsanfachend). Ein lineares Netzwerk ist stabil, wenn die Pole der Übertragungsfunktion auf der linken p-Halbebene liegen, ein umkehrbares lineares Netzwerk darf auch keine Nullstellen auf der rechten />-Halbebene besitzen, da diese bei der Inversion zu Polen werden und die Stabilitätsbedingung verletzen (die Folge wäre eine Selbsterregung). Bei realisierbaren linearen Netzwerken besteht die Nebenbedingung, daß das Zählerpolynom der Übertragungsfunktion G(p) im Bildbereich gleichen oder kleineren Grades sein muß als das Nennerpolynom (vgl. [37] und (49]). Diese Forderung widerspricht grundsätzlich der Umkehrbarkeit, da dabei Zähler
1. Informationsbewertung durch Meßsysteme
30
und Nenner die Rollen vertauschen. Daher sind Umkehrnetzwerke nie exakt realisierbar! Diese methodischen Grundlagen der Theorie der linearen Systeme reichen aber für die Informations-Meßtechnik nicht aus. Die Systeme, die zur Informationsverarbeitung herangezogen werden, sind nicht immer linear, sondern oft nichtlinear. Außerdem sind sie nicht nur Analognetzwerke (Netzwerke für kontinuierliche Signale), sondern oft auch Digital-Systeme (Netzwerke für diskontinuierliche Signale, für diskrete Meßwertfolgen). Daher muß die Anzahl der betrachteten Systeme zur Informationsübertragung und zur Informationsverarbeitung über die linearen und analogen Systeme hinaus erheblich erweitert werden und auch die einfache Darstellung als black-boxSysteme mit einer einfachen Eingangs-Ausgangssignal-Relation reicht nicht aus. Dies gilt auch für folgende Erweiterung der linearen Systemtheorie: Zustandsbeschreibung
von linearen
Systemen:
Die einfache Vorstellung des linearen Systems als black-box führt, wie gezeigt, zur Beschreibung des Systemverhaltens durch eine Ausgangs-Eingangs-Relation. Bei mehreren Ein- und Ausgangs-Signalen, die zu je einem Eingangs- und Ausgangsvektor zusammengefaßt werden können, empfiehlt sich die Einführung einer Zustandsgröße oder eines Zustandsvektors Z. Dann erhält man zwei Gleichungen: z' = Az + Bx
mit X als Eingangsvektor und
;y = Cz + Dx
y als Ausgangsvektor, Z als Zustandsvektor.
Hingangs -
Vektor
ZustanüsVektor des Systeme z
x
Abb. 1.7. Black-box-Darstellung Beschreibung
Hierbei bedeutet A die Systemmatrix B die Steuermatrix C die Beobachtungsmatrix D die Durchgangsmatrix.
Ausgangs -
Vektor
1
eines linearen Systems mit Zustands-
1.2. Der System-Aspekt der Meßtechnik
31
I m wesentlichen h a n d e l t es sich also hier u m eine R e l a t i o n zwischen d e m E i n g a n g u n d d e m S y s t e m z u s t a n d u n d u m eine R e l a t i o n zwischen d e m S y s t e m z u s t a n d u n d d e m A u s g a n g . Die K o m p o n e n t e Dx t r i t t n u r a u f , w e n n der E i n g a n g z u m Teil unmittelbar den Ausgang beeinflußt. Diesen W e g b e s c h r e i t e t h e u t z u t a g e vorzugsweise die R e g e l u n g s - T h e o r i e ([42]). M a n k a n n a n H a n d dieses A n s a t z e s u. a. b e u r t e i l e n , o b d a s S y s t e m s t e u e r b a r o d e r b e o b a c h t b a r ist oder n i c h t . Diese B e s c h r e i b u n g s m e t h o d i k ist n o c h wenig in die M e ß p r a x i s e i n g e d r u n g e n u n d w i r d i m n a c h f o l g e n d e n T e x t n i c h t b e n ö t i g t . D i e m o d e r n e M e ß t h e o r i e b e n u t z t die Z u s t a n d s g i e i c h u n g e n bei d e m verallgemein e r t e n F i l t e r v e r f a h r e n v o n K A I M A N u n d v o n STRATONOWITSCH ( [ 9 a , 1 4 a , 1 5 a
u n d 22 a]). W i c h t i g e r sind f ü r die M e ß t e c h n i k S y s t e m e , d e r e n Z u s t a n d t a k t w e i s e m i t j e d e m E i n g a n g s - S i g n a l v e r ä n d e r t w i r d . Diese F u n k t i o n s w e i s e w i r d d u r c h eine U b e r f ü h r u n g s f u n k t i o n x(t) = t d a r , m i t x(t) = 0 f ü r alle t < 0 . E r g ä n z u n g s - L i t e r a t u r zur S y s t e m - T h e o r i e : [7, 20, 22, 23, 24, 27, 29, 30, 32, 35, 36, 37, 38, 39, 42, 43, 47, 48, 49, 50],
1.3. Das Verbundsystem Vorbemerkung
zur
als Grundstruktur
der
Meßtechnik
Systemklassifizierung:
I n d e r M e ß t e c h n i k v e r w e n d e t m a n S y s t e m e sowohl z u r S i g n a l ü b e r t r a g u n g als a u c h z u r S i g n a l v e r a r b e i t u n g , im ersten Falle möglichst o h n e I n f o r m a t i o n s r e d u k t i o n , im zweiten Falle m i t einer o p t i m a l e n I n f o r m a t i o n s r e d u k t i o n . Die Theorie der linearen S y s t e m e b i l d e t eine n o t w e n d i g e G r u n d l a g e ; sie liefert die s p e k t r a l e
1.3. D a s V e r b u n d s y s t e m als Grundstruktur der Meßtechnik
Betrachtungsweise auf der Basis der Funktionstransformationen
35 nach FOURIER
u n d LAPLACE.
Wenn ein System kontinuierliche Prozesse verarbeitet, bezeichnet man es in der Fachliteratur als analoges System, obwohl diese Bezeichnungsweise sprachlich unbefriedigend ist und nicht den Kern der Sache trifft. Wenn ein System diskontinuierliche Prozesse verarbeitet, wird es als ein digitales System bezeichnet. Dies ist, wie noch gezeigt wird, häufig in der Meßtechnik der Fall. In beiden Fällen kann es sich um ein lineares System handeln, für das das Superpositionsgesetz gelten muß. Den Gegensatz zu den linearen Systemen bilden die nichtlinearen Systeme. Aus dieser sehr großen Klasse wählen wir nachfolgend eine für die Meßwertverarbeitung sehr wichtige Klasse heraus. Es sollen alle diejenigen Systeme zusammengefaßt werden, die zur elektronischen Verarbeitung von Meßprozessen zu Meßprozessen mit neuen Eigenschaften (z. B . zur optimalen Übertragung) oder zu prozeßrelevanten Kenngrößen benutzt werden. Dabei steht die Frage des Rechnens mit Meßwert-Ereignissen und Meßwertamplituden im Vordergrund ( = „algebraischer Aspekt"). Dies dient zugleich zum Verständnis der digitalen Meßwertverarbeitung als Entwicklungstendenz der modernen Meßtechnik. Es handelt sich nachfolgend stets um doppelt ausgesteuerte Systeme. Diese lassen sich in verschiedenartige Teilklassen von meßwertverarbeitenden Systemen einteilen, j e nach ihrem Aufbau und ihrer Wirkungsweise, doch nach einem einheitlichen Grundprinzip arbeitend, nach dem Prinzip der Informationsverknüpfung. Zur Definition
der
Verbundsysteme:
Für die Zwecke der Meßtechnik genügt es, wie noch ausführlich gezeigt werden soll, die Wirkungsweise eines doppelt ausgesteuerten Systems auf eine algebraische Verknüpfungs-Operation zu beschränken. Diese Systemklassen sollen nachfolgend als Verbundsysteme bezeichnet werden, in Anlehnung an die Verbundwahrscheinlichkeit, einem in der Statistik üblichen Begriff (joint probability). Das Schema eines Verbundsystems zeigt Abb. 1.9. Es stellt in black-box-Darstellung ein doppelt ausgesteuertes System dar. Es sind zwei Eingänge zu unterscheiden, im allgemeinen zwei verschiedene Informationsflüsse, die durch das System mittels einer definierten mathematischen Operation zu einem resultierenden Informationsfluß verbunden werden. Es sind zwei Eingangssignale und ein Ausgangs-Signal vorhanden. Für die beiden Eingangssignale gilt nicht unbedingt das Superpositionsgesetz (nur bei additiver Verknüpfung!). W ichtig ist für diese Auffassung, daß das zweite Eingangssignal auch ein detei-
36
1. Informationsbewertung durch Meßsysteme
miniertes Kontrollsignal oder eine Vergleichs-System-Funktion sein kann. Der Vorteil dieser Begriffsbildung ist eine Möglichkeit, die verschiedenen Typen meßwertverarbeitenden Systeme zu klassifizieren und in ihrer Wirkungsweise vergleichend zu beschreiben. Hierbei kann eine Einteilung a) nach der verwendeten Verknüpfungs-Operation oder b) nach dem Vergleichssignal erfolgen. Die Verknüpfungsoperation kann additiv oder multiplikativ sein oder aus einer logischen Verknüpfung bestehen, wobei es jeweils verschiedenartige Möglichkeiten gibt. Primärer
Eingangs
Informations
-
_
" Verbundsystem" als mathemat. VerhnüpfungsOperation
fLuß
Sekundärer Eingangs in formations fluß oder KontroLlinformation
-
Abb. 1.9. Schema eines verarbeitender Systeme
Ausgangs Flui)
Verbundsystems
als
- Informations
Grundstruktui
-
meßwert-
Im allgemeinen Falle wird die Verknüpfung der Eingangs-Signale durch eine algebraische Struktur festgelegt. Informationstheoretisch betrachtet erfolgt in einem Verbundsystem eine Signalwandlung, die meist mit einer Informationsreduktion verbunden ist. Wir betrachten zunächst die analogen und dann die digitalen Verbundsysteme! 1.3.1. Analoge
Verbundsysteme
Man kann das einfach ausgesteuerte lineare System bereits als ein Verbundsystem darstellen, wie es Abb. 1.10 zeigt. Die Verknüpfungs-Operation ist hier die Faltungs-Multiplikation im Zeitbereich und die algebraische Multiplikation im Spektralbereich, j e nach der gewählten Darstellungsform. Das zweite Eingangssignal ist determiniert und stellt im Zeitbereich die Gewichtsfunktion, im Spektralbereich den Frequenzgang des Systems dar.
^eft)
P
System
als Fattungsoperator
*
—
xa
ft) =
=/n£Sir)xeft-T)dr
g fr)
g(i)
: Speicher
öewichtfunktion
für die
=g(t)xxe
(t)
des lin.
Systems
Abb. 1.10. Darstellung eines linearen Systems als Verbundsystem
37
1 . 3 . D a s V e r b u n d s y s t e m als G r u n d s t r u k t u r d e r M e ß t e c h n i k
Eine derartige Aufteilung nimmt man in der Tat vor, wenn man ein lineares Netzwerk durch ein Rechner-Programm realisiert. Es werden dann im Zeitbereich die Faltungs-Operation und die Gewichtsfunktion des Systems eingespeichert. Zugleich dient diese Aufteilung dazu, den Zusammenhang mit anderen Formen von Analogsystemen aufzuzeigen. So zeigt Abb. 1.11 die Erweiterung zu einem adaptiven System, wenn eine Störgröße gemessen und aufgeschaltet wird, um die Systemfunktion in geeigneter Weise den Umweltbedingungen (Luftdruck, Lufttemperatur u. a.) anzupassen. Wenn man eine Rückführung des Ausgangs zur Systemfunktion vornimmt, er*ef) SystemFunktion
[
Ög=
I Mathem. VerknüpfungsOperation
4 -{ z , r i .
Speicher für die Systemfunktion
Störgrößen Aufschaltung tAdaptive Systeme)
*a i f ) * Op (xe ft)} Rückführung zur SeLbstoptimierung (— Extremwert Systeme)
Steuerung der Systemfunktion
A b b . 1 . 1 1 . D a r s t e l l u n g eines a d a p t i v e n u n d eines s e l b s t o p t i m i e r e n d e n S y stems als V e r b u n d s y s t e m
geben sich Formen von selbsteinstellenden Extremwert-Systemen, wie sie in der Kybernetik und Regelungstechnik in verschiedener Weise benutzt werden. Die Systemfunktion ist dann entsprechend komplizierter. Zum B e g r i f f des
Verbundsystems:
1. Ein Verbundsystem ist der elementare Bauteil meßwertverarbeitender Systeme. 2. Ein Verbundsystem ist ein doppelt oder mehrfach ausgesteuertes System mit analogen oder mit digitalen Eingangs-Signalen. 3. Ein Verbundsystem führt im Rahmen einer algebraischen Struktur eine mathematische Operation durch, die die beiden Eingangs-Signale zu einem AusgangsSignal verknüpft. 4. Da ein Verbundsystem auf der Wechselwirkung der Eingangs-Signale beruht, gilt das Superpositions-Gesetz im allgemeinen nicht: die Systemreaktion ist von beiden Signalen abhängig. Auch gilt das Superpositionsgesetz im allgemeinen Falle nicht für mehrfache Einwirkung auf einen der beiden Eingänge, in einzelnen Fällen gilt es.
1. Informationsbewertung durch Meßsysteme
38
5. Es erfolgt durch ein Verbundsystem eine notwendige und erwünschte Informations-Reduktion des Eingangs-Informationsflusses. 6. Die Klassifizierung der Verbundsysteme kann erfolgen nach dem Typ der mathematischen Verknüpfungs-Operation oder nach dem Typ des zweiten Eingangs-Signals, mit dem die Verknüpfung erfolgt. Letzteres kann sowohl determiniert sein (Kontroll- oder Vergleichs-Signal, Systemfunktion), oder es kann nicht determiniert sein (als 2. Informationsfluß). 7. Verbundsysteme können analog oder digital realisiert werden, im letzteren Falle z. B. durch Mikroprozessoren. Zeitfunktions-Multiplikatoren: Die beim linearen System benutzte mathematische Verknüpfungsoperation ist die Faltungsintegration im Zeitbereich. Zu ihr äquivalent ist die algebraische Multiplikation im Bildbereich unter Benutzung der FoUEIBR-Transformierten bzw. verallgemeinert der LAPLACE-Transformierten. Eine Erweiterung der Klasse der linearen Systeme ergibt sich, wenn man andere mathematische Verknüpfungsoperationen dem Verbundsystem zuordnet, so z. B. die Bildung eines algebraischen Produktes im Zeitbereich. Dies ergibt den Multiplikator von Zeitfunktionen. Die äquivalente Verknüpfungsoperation im Bildbereich ist dann die Faltungsoperation der Spektralfunktionen. Es gilt also für den Multiplikator: *aW = XeSf) ' xe2(t) oder O) 0 Der Multiplikator ist also das zum linearen System inverse Netzwerk, wobei der Zeitbereich und der Bildbereich ihre Rollen vertauschen. Eine Operatorenrechnung wird hierfür nicht benötigt, um die Wirkungsweise einfacher analysieren zu können wie bei den linearen Systemen. In der Informationstechnik werden seit Jahrzehnten die Multiplikatoren als Modulatoren und als Demodulatoren benutzt, um Informationen über Trägersignale ( = Hochfrequenzschwingungen) zu übertragen. Hierbei wird eine nichtlineare Kennlinie gleichzeitig mit dem niederfrequenten Modulationsfluß und dem hochfrequenten Trägersignal ausgesteuert. Nach Aussiebung unerwünschter Spektralbereiche durch Filter (z. B. Schwingkreise) bleibt die modulierte Trägerschwingung übrig. Der Unterschied gegenüber einer einfachen Multiplikation zweier Zeitfunktionen wird im 2. Abschnitt besprochen.
39
1.3. Das Verbundsystem als Grundstruktur der Meßtechnik
Weitere, seit langem bekannte analoge Multiplikatoren (vgl. Abb. 1.12) sind die Austaststufen (gates), die Amplitudenbegrenzer u. a. Diese von der Nachrichtentechnik entwickelten Signal-Wandler sind nichtlineare Systeme, für die das Superpositionsgesetz nicht gilt. Sie lassen sich alle zu einer Klasse von Zeitfunktionsmultiplikatoren zusammenfassen und bilden auch wichtige Formen der Signalverarbeitung in der Meßtechnik. Zur analogen Signalverarbeitung ist in den letzten beiden Jahrzehnten die digitale Signalverarbeitung hinzugekommen. Nachfolgend sollen die hier beSystem
Einfach
-
Charakteristik
ausgesteuerte
Systeme
Zwei - oder mehrfach ausgesteuerte Systeme (= Verbund-Systeme)
Systeme der tionsübertragung mit Linearem
InformaVerhalten
Systeme der Informationsverarbeitung! mit nichtLine -
•rem Verhalten
Verstärker
Begrenzer
Frequenzfilter
Frequen
Leitungen
vielfacher
Pseudo (ohne
-
Verbundsysteme nechselwirHung)
Summierstufen
iver-
Verbundsysteme: Multiplihatoren (Mischstufen, Modulatoren, Frequenzumsetzer, Horre Latoren, Systeme mit Wechselwirkung,
Abb. 1.12. System-Klassifizierung der Analog-Systeme
stehenden Möglichkeiten besprochen werden und gezeigt werden, daß der Begriff des Multiplikators viel allgemeiner gefaßt werden muß, da es eine Vielzahl von multiplikativen Verknüpfungsmöglichkeiten zwecks Informationsverarbeitung gibt. Dies gibt die Begründung, den neuen Begriff des „Verbundsystems" einzuführen und damit eine große Anzahl von nichtlinearen Systemen zu einer gemeinsamen Klasse zusammenzufassen, die in ihrer technischen Bedeutung in der Meßtechnik die der linearen Netzwerke weit übertrifft. Auch hier werden wir uns auf die methodischen Grundgedanken beschränken! 1.3.2. Digitale Verbundsysteme
für einstellige
Binärsignale
Der Begriff des Verbundsystems mit einer multiplikativen Verknüpfung ergibt die Möglichkeit, die lineare Systemtheorie auf eine große Klasse von nichtlinearen Systemen zu erweitern, die ihrerseits mathematisch übersichtlich untergliedert werden können. Es soll nachfolgend gezeigt werden, daß die Digitaltechnik zu einer erheblichen Erweiterung der Klasse der Verbundsysteme ge4
Lange
1. Informationsbewertung durch Meßsysteme
40
f ü h r t h a t . D e r A n s a t z p u n k t zur E r w e i t e r u n g liegt in d e r E r k e n n t n i s , d a ß es v e r s c h i e d e n a r t i g e Möglichkeiten g i b t , m u l t i p l i k a t i v e V e r k n ü p f u n g e n z u definieren. Die G r u n d l a g e b i e t e t die h ö h e r e A l g e b r a einschließlich der Y e r b a n d s t h e o r i e . Hierbei w i r d ein i n f o r m a t i o n s v e r a r b e i t e n d e s S y s t e m d u r c h eine algebraische S t r u k t u r gekennzeichnet. W i r k e h r e n n u n zu d e n A u s f ü h r u n g e n v o n A b s c h n . 1.1.3. z u r ü c k , in d e m d a s B i n ä r s i g n a l als T r ä g e r einer I n f o r m a t i o n e i n g e f ü h r t w u r d e . W i r b e t r a c h t e n n u n eine Folge v o n Meßereignissen, die d u r c h B i n ä r s i g n a l e b e s c h r i e b e n w e r d e n . D i e Z u o r d n u n g soll e i n e i n d e u t i g sein, d. h., j e d e s B i n ä r s i g n a l k e n n z e i c h n e t ein Meßereignis u n d u m g e k e h r t . Die Z u o r d n u n g ist d u r c h eine K o d e l i s t e festgelegt, so Primärer binärer
Eingangs -
SignaLfLuß
Logisches
Binärer
BaueLement
SignaLfLuß
für
Sekundärer binärer Eingangs SignaLfLuß
Ausgangs -
Lag. Ker-
knüpfung
Abb. 1.13. Logisches Bauelement als Verbundsystem d a ß eine R ü c k u m w a n d l u n g s t e t s w i e d e r möglich ist. D i e b i n ä r e n K o d e w o r t e können einstellige o d e r mehrstellige B i n ä r z a h l e n sein. Also h a t m a n digitale V e r b u n d s y s t e m e f ü r einstellige u n d f ü r mehrstellige b i n ä r e E i n g a n g s s i g n a l e zu u n t e r scheiden. D a s b i n ä r e K o d e w o r t k a n n einen A m p l i t u d e n w e r t b e d e u t e n oder a u c h n u r einen I n d e x , i n d e m wir die E r e i g n i s m e n g e in eine „wohl g e o r d n e t e M e n g e " e i n t e i l e n : J e d e m Meßereignis ist eine B i n ä r z a h l z u g e o r d n e t . D a s e r g i b t die Möglichk e i t , m i t d e n Meßereignissen f o r m a l i m R a h m e n einer a l g e b r a i s c h e n S t r u k t u r rechnen zu k ö n n e n . H i e r b e i b r a u c h e n wir eine S t r u k t u r m i t einer abgeschlossenen (endlichen) Menge v o n Meßereignissen. Verbundsysteme
für einstellige
Binärworte:
Diese liegen in F o r m v o n „logischen B a u e l e m e n t e n " in der I n f o r m a t i o n s t e c h n i k b e r e i t s v o r ( A b b . 1.13). M a n b e t r a c h t e t zwei B i n ä r s i g n a l f o l g e n , die zu d i s k r e t e n Z e i t p u n k t e n d a s W e r t e p a a r (o, b) b i l d e n m i t a £ {0, 1} u n d b £ {0, 1}. E s sind also eingangsseitig n u r 22 „ E r e i g n i s s e " m ö g l i c h : o = 0
0
1
1
6 = 0
1
0
1
J e d e m dieser Ereignisse ist ein A u s g a n g s - B i n ä r s i g n a l 0 oder 1 z u g e o r d n e t .
1.3. Das Verbundsystem als Grundstruktur der Meßtechnik
41
Die m a t h e m a t i s c h e A u f f a s s u n g des S a c h v e r h a l t e s ist f o l g e n d e : A u s d e r Menge d e r E l e m e n t e des E i n g a n g s - S i g n a l r a u m s , die hier n u r a u s zwei E l e m e n t e n bes t e h t (0, 1), w e r d e n d u r c h zwei Signalquellen A u n d B j e ein E l e m e n t a u n d b ausg e w ä h l t u n d z u e i n a n d e r in R e l a t i o n gesetzt. M a n s c h r e i b t h i e r : a Rb. E i n e R e l a t i o n ist eine logische Beziehung zwischen zwei oder m e h r e r e n Elementen. I n der hier b e n u t z t e n B o o L E s c h e n Algebra wird d e m E l e m e n t e p a a r (o, b) m i t a u n d b £ {0, 1} ein neues E l e m e n t z u g e o r d n e t : c = / ( o , b),
c e {0,1}.
f k e n n z e i c h n e t die Y e r k n ü p f u n g s o p e r a t i o n f ü r die E l e m e n t e o u n d b. a u n d b sind die b i n ä r e n , einstelligen M e ß w e r t e , f k e n n z e i c h n e t d a s i n f o r m a t i o n s v e r a r b e i t e n d e S y s t e m , hier in F o r m eines logischen B a u e l e m e n t s . E s stellt d a s „ V e r b u n d s y s t e m " d a r . I n d e r D i g i t a l t e c h n i k interessieren u n s i n f o r m a t i o n s v e r a r b e i t e n d e S y s t e m e , f ü r die zwei v e r s c h i e d e n e V e r k n ü p f u n g s o p e r a t i o n e n / j u n d / 2 d e f i n i e r t sind. Sie e r g e b e n eine algebraische S t r u k t u r . So a r b e i t e t die BoOLEsche A l g e b r a m i t f o l g e n d e n V e r k n ü p f u n g e n : / j = log. inklus. Oder in d e r F o r m : 0
1—1
0 1
1 1
\
c
0 1
b e z e i c h n e t als D i s j u n k t i o n v ; u n d / 2 = log. U n d in der F o r m : c
\ 0
0 1
0 0
1 0 1
u n d b e z e i c h n e t als K o n j u n k t i o n A. D a g e g e n b a u t m a n d e n K ö r p e r d e r B i n ä r z a h l e n m i t f o l g e n d e n log. V e r k n ü p f u n g e n auf: f-i = A n t i v a l e n z oder exklus. O d e r in der F o r m :
0 1
0
1
0 1
1 0
b e z e i c h n e t als A d d i t i o n m o d u l o 2 m i t © 4*
42
1. Informationsbewertung durch Meßsysteme
und f 2 = log. U n d oder algebr. P r o d u k t , bezeichnet mit
0 1
0
1
0 0
0 1
Die Verknüpfungen sind in diesen Fällen k o m m u t a t i v :
a v b = b v a,
a
o 0 6 = 60o,
o-6=6-a.
A 6 =
6 A O
sowie
A b e r es bestehen Unterschiede f ü r die distributiven Gesetze beider Verknüpf u n g e n : es gilt in der BoOLEschen A l g e b r a : (a x
A
o 2 ) v 6 = (a1
A
6) v (o 2
A
6)
und auch gleichzeitig (fl! A a 2 ) V 6 = (a1 V 6) A («2 V 6). E s gilt f ü r den K ö r p e r der Binärzahlen nur d a s distributive G e s e t z : (a10«2).6 =
(o1.6)0(o2-6),
aber es gilt nicht: (oj • a 2 ) 0
6 = (cti 0
b) • (a 2 0
b).
Die BoOLEsche Algebra ergibt eine höhere algebraische S t r u k t u r , die als Verb a n d bezeichnet wird. D i e meßtechnischen Anwendungen werden als Schaltalgebra bezeichnet u n d vor allem in der binären Steuerungstechnik zur B e o b a c h t u n g v o n zwei gleichzeitig eintreffenden binären Informationsflüssen benutzt. Die algebraischen S t r u k t u r e n f ü r einstellige binäre K o d e w o r t e ( = binäre Ereignisse) dienen als Hilfsmittel beim Entwurf v o n S c h a l t s y s t e m e n mit folgenden Zielstellungen: a) die in der Aufgabenstellung gegebenen Schaltbedingungen eindeutig durch logische Funktionen darzustellen, b) f ü r diese Funktionen solche A u s d r ü c k e zu finden, die eine weitgehende eindeutige Abbildung der Schaltungen g e s t a t t e n , c) diese A u f g a b e so u m z u f o r m e n u n d dabei zu vereinfachen, daß wiederum möglichst eindeutige A n g a b e n über die technische Realisierung mit einem minimalen A u f w a n d oder m i t m a x i m a l e r Störfestigkeit gewonnen werden.
43
1.3. D a s Verbundsystem als Grundstruktur der Meßtechnik
1.3.3.
Verbundsysteme
für mehrstellige
binäre
Kodeworte
W i r b e n ö t i g e n die einstelligen Binärsignale u n d i h r e V e r k n ü p f u n g e n n a c h f o l g e n d f ü r die M e ß w e r t v e r a r b e i t u n g mehrstelliger B i n ä r s i g n a l e . Als a d d i t i v e Verk n ü p f u n g w i r d die logische V e r k n ü p f u n g „ A d d i t i o n m o d u l o 2 " bei d e n m e h r w e r t i g e n M e ß w e r t e n , in F o r m v o n mehrstelligen b i n ä r e n K o d e w o r t e n , a u s folgenden Gründen benutzt: 1. Die Stellenzahl der mehrstelligen K o d e w o r t e b l e i b t bei d e r A d d i t i o n erhalten. 2. E s ist ein N u l l w o r t (0, 0 , . . . 0) v o r h a n d e n , f ü r d a s g i l t : a © 0 =
a.
3. Z u j e d e m K o d e w o r t existiert ein inverses K o d e w o r t a', d a s zugleich m i t dem Kodewort identisch ist: a + o' = 2a = 0
z. B . : 1 0 1 1 0
1011 0000'
D a a u c h d a s k o m m u t a t i v e Gesetz gilt sowie d a s assoziative Gesetz ( « 1 © « 2 ) © «3 = « 1 © ( ° 2 © «3) = « 1 © « 2 © b i l d e n die mehrstelligen b i n ä r e n K o d e w o r t e als algebraische S t r u k t u r eine Gruppe! D i e E i g e n s c h a f t e n v o n V e r b u n d s y s t e m e n f ü r mehrstellige b i n ä r e K o d e w ö r t e r h ä n g e n w e i t g e h e n d d a v o n a b , welche algebraischen S t r u k t u r e n m a n zur Meßw e r t v e r a r b e i t u n g b e n u t z t . Die algebraischen S t r u k t u r e n w i e d e r u m sind b e s t i m m t d u r c h die V e r k n ü p f u n g s o p e r a t i o n e n f ü r die K o d e w ö r t e r . A d d i t i v e V e r k n ü p f u n g e n 1) algebraische A d d i t i o n 2) A d d i t i o n m o d u l o 2. B e i d e r algebraischen A d d i t i o n w e r d e n die 1-Signale f o r t l a u f e n d zu n a t ü r l i c h e n Z a h l e n a d d i e r t . Die S u m m e ist d a n n keine B i n ä r z a h l m e h r , s o n d e r n eine g e w ö h n liche Zahl. A n g e w e n d e t w i r d dies z. B . b e i m P o l a r i t ä t s k o r r e l a t o r , vgl. A b s c h n . 2.3. E n t s c h e i d e n d ist f ü r die W i r k u n g s w e i s e d e r a r t i g e r b i n ä r e r V e r b u n d s y s t e m e die W a h l d e r zweiten V e r k n ü p f u n g s o p e r a t i o n , die w i r e t w a s v e r a l l g e m e i n e r t als die m u l t i p l i k a t i v e V e r k n ü p f u n g bezeichnen wollen. I d e n t i s c h m i t d e n m u l t i p l i k a t i v e n V e r k n ü p f u n g e n v o n ra-Tupeln k a n n m a n n- stellige b i n ä r e K o d e w ö r t e r v e r s c h i e d e n a r t i g m u l t i p l i k a t i v v e r k n ü p f e n .
1. Informationsbewertung durch Meßsysteme
44
Vom meßtechnischen Standpunkt aus betrachtet, ist der Zweck der algebraischen Umwandlung für die Auswahl der 2. Verknüpfungsoperation entscheidend. Sie ergibt diejenige mathematische Struktur, die benutzt werden muß! Entweder muß das Ausgangskodewort die gleiche Stellenzahl haben oder eine veränderte Stellenzahl.
Eingangswort (binär, mehrstelüg)
Matrizen Polynom
-oder Mutti-
Ausgangswort (binär, mehrstellig]
plihator
Speicher für Hodierungs Matrix oder Hod. - Polynom
Abb. 1.14. Digitales Verbund-System zur Matrix- oder zur Polynom-Multiplikation
Digitale
Verbundsysteme
mit Beibehaltung
der Stellenzahl der
Kodewörter:
Für diese Verbundsysteme wird eine algebraische Multiplikation der Werte gleicher Stellenzahl benutzt. Man spricht hier vom Werteprodukt (nach BERG [24]). Beim Werteprodukt bleibt die Stellenzahl erhalten: C = a • b = (a0b0, flji»!, . . . ) t • + cos {Q + a>) t •].
Die Trägerleistung beträgt zusammen:
* 2 ' 4
lo2
, die Seitenbandleistungen bei m — 1 betragen
^
4
Damit ergibt sich der Wirkungsgrad als Verhältnis der Nutzleistung zur Gesamt1/4 leistung xu: r] =
= 1/3. Der Effektivwert der amplitudenmodu-
lierten Schwingung beträgt: *effm =
*effm=„ - 1
-
=
*effm„„ • ! >
2
25
bei m
=
1 0 0 % .
Der Bandbreitebedarf der modulierten Schwingung beträgt also das doppelte der höchsten Modulationsfrequenz: 2wg bzw. 2fg in Hz. Die obere und die untere m
Seitenfrequenz hat die Amplitude —^—. Beim Modulationsprozeß wird die Trägerschwingung nicht verändert, während die Seitenfrequenzen neu hinzutreten. Der Träger enthält keine Information und kann bei der Übertragung fortgelassen werden. Ebenfalls genügt eine Seitenfrequenz (bzw. ein Seitenband) für die Informationsübertragung. Dies ergibt die Einseitenbandmodulation. Hier kommt es darauf an, daß bei der Demodulation der Träger mit genügender Fre-
64
2. Methoden der Informationsverarbeitung stochastischer Prozesse
quenzkonstanz hinzugesetzt wird. In manchen Fällen überträgt man deswegen noch einen Trägerrest. Der Vorteil besteht in der Reduzierung des Bandbreitebedarfs auf die Hälfte und in einem erheblich größeren Wirkungsgrad, da praktisch nur die Nutzleistung übertragen wird. Ein genereller Nachteil der Amplitudenmodulation ist die mangelhafte Störfestigkeit, da jede der Trägerschwingung überlagerte Störschwingung bei synchroner Phasenlage eine Störmodulation hervorruft, die der Störamplitude proportional ist. Einen Ausweg dazu bietet die Frequenzmodulation an (3.2.1). In der Meßtechnik tritt eine Sonderform der Amplitudenmodulation auf: wenn man einen Meßgeber, z. B. einen Dehnungsmeßstreifen, in eine wechselstromgespeiste Brücke einschaltet (z. B. mit einem Träger von 5 kHz), dann ergibt sich beim Durchgang durch den Brückenabgleichpunkt (d. h. bei Brückengleichgewicht) ein Vorzeichenwechsel der Brückenabgleichspannung. Dieser Vorzeichenwechsel bedeutet beim Wechselstrom ein Phasensprung von 180°. Da beim Abgleich der Träger unterdrückt wird, entspricht dies einer AM mit unterdrücktem Träger! Der Amplituden-Modulator wird technisch realisiert durch die Aussteuerung einer nichtlinearen Kennlinie. Hierbei werden neben der erwünschten multiplikativen Verknüpfungskomponente auch unerwünschte Signalkomponenten erzeugt, die nachträglich durch Resonanzkreise unterdrückt werden müssen. Angenommen, es liegt eine nichtlineare Kennlinie der Form vor: x j f ) = o0 + a\Xe(t) + a2xe 2(t)
mit xe(t) als Eingangssignal und xa(t) als Ausgangssignal! Dies ist eine parabolische Kennlinie mit linearem und konstantem Anteil. Das Eingangssignal bestehe aus der additiven Mischung der Trägerschwingung der Frequenz Q und dem Repräsentant der Information, der Modulationsschwingung der Frequenz co: xe(x.) —
cos Qt + X2 cos cot.
Dann beträgt das Ausgangssignal des nichtlinearen Signalwandlers: *(t) = o0 + a ^ ^ j cos Qt + 3t2 cos cot) + a2(£x2 cos2 Qt -f- 2 l i l 2 cos Qt • cos cot +
cos2 cot)
Nur in der Komponente (a 2 • cos Qt cos cot) ist die gewünschte Verknüpfungskomponente des idealen Verbundsystems enthalten. Sie ergibt die beiden Modulationsseitenbänder unter Berücksichtigung der Umrechnung: 2 cos Qt • cos cot = cos (Q + co) t + cos (Q — co) t.
65
2.2. Übertragung von Informationsprozessen
zu: a23t1&2 cos (Q ^ w) t = —
®i
cos
(ö i
oj) t.
cos Qt = Xq COS Qt. Die Trägeramplitude lautet: Der Modulationsgrad m ergibt sich aus der Beziehung: — 2
= Seitenfrequenzamplitude == — o,
zu m =
2a2
«l
ÄA 2 .
Man erkennt, daß der Modulationsgrad, wie gefordert, der Modulationsamplitude X 2 proportional ist. Alle übrigen Komponenten sind Störkomponenten. Es erscheint auf der Ausgangsseite noch der Gleichanteil a0, die Modulationsschwingung der Frequenz a> und die doppelten Frequenzen 2Q und 2w. Letzteres folgt aus der Beziehung: cos2 Qt = — (1 + cos 2Qt) und 2
mit den Amplituden
•
cos 2wt = — (1 + cos 2cot) 2
und — • Jt 2 2 .
Daneben treten noch die gleichgerichteten Anteile — (3tj 2 +
2 ),
um die
2
sich der Gleichanteil a 0 bei der Aussteuerung ändert. Sofern die Nebenbedingung erfüllt ist: 2a> 2Q, lassen sich die Störkomponenten leicht von der Modulationsnutzkomponente trennen. Das Beispiel soll zugleich zeigen, daß bei der technischen Realisierung stets Probleme auftreten, die in der theoretischen Aufgabenstellung zunächst nicht erkennbar sind. Man kann auch mit erheblich größerem technischen Aufwand einen idealen Multiplikator realisieren, muß aber entscheiden, ob dies ökonomisch sinnvoll ist. Der Amplitudenmodulator ist wohl der älteste Vertreter eines Verbundsystems, indem nach Abb. 2.4 der niederfrequente Informationsfluß mit der determinierten Trägerschwingung multiplikativ verknüpft werden. In anderer Auffassung repräsentiert der Modulator ein rheolineares System mit gesteuertem Parameter. Zum Unterschied zu einem reinen Multiplikator, der nur die beiden Seitenfrequenzen liefern würde, enthält das Ausgangssignal noch die Trägerschwingung selbst als wesentliche Komponente. Die Parametersteuerung wird durch die Aussteuerung einer nichtlinearen Kennlinie (s. o.) vorgenommen, d. h. durch ein nichtlineares Bauelement.
66
2. Methoden der Informationsverarbeitung stochastischer Prozesse
Zusammenfassend ist festzustellen, daß der Amplitudenmodulator dazu dient, die Meßwertfolge eines stochastischen Prozesses in Scheitelwertschwankungen einer Trägerschwingung umzuformen. Die modulierte Trägerschwingung dient zur Übertragung und Weiterverarbeitung des aufgenommenen Meßprozesses. Wird dabei eine Frequenzverschiebung in störfreie Frequenzbereiche vorgenommen, so wirkt dies als „induzierte Störfestigkeit". Dies gilt für jede Modulationsart ! 2.2.1.2.
Frequenzmodulation
Die Amplitudenmodulation hat den Nachteil, daß sie störanfällig ist: entweder gegenüber additiv überlagerten Störsignalen oder gegenüber multiplikativen Störfaktoren; im ersten Falle können es Rauschstörungen oder induzierte Störspannungen sein, die sich dem Informationsfluß überlagern, im anderen Falle sind es Schwankungen der Verstärkung oder der Übertragungsdämpfung. In beiden Fällen wird die Meßgenauigkeit erheblich beeinträchtigt, wenn die Signalamplitude ein Maß der übertragenen Meßinformation ist. Daher benutzt man in zunehmendem Maße in der Meßtechnik die Frequenzoder die Phasenmodulation nach dem Vorbild der UKW-Rundfunktechnik. Sie wurde 1936 von ARMSTRONG, dem Erfinder des Überlagerungsempfängers, vorgeschlagen und in die Funktechnik eingeführt. Bei der Frequenzmodulation wird die Frequenz des Trägersignals als Modula" tionsparameter im Takte der Nachricht um den Mittelwert — die Trägerfrequenz Q — verändert, wie bei der Amplitudenmodulation synchron, d. h. nach dem gleichen Zeitverlauf. Bei der FM wird der Scheitelwert der Trägerschwingung mit der Frequenz Q konstant gehalten, und bei einwirkenden Störungen auf die Trägersignalamplitude wird auf der Empfangsseite durch Amplitudenbegrenzung jede parasitäre Amplitudenmodulation unterdrückt. Es bleibt als Störeffekt nur die parasitäre Phasenmodulation übrig. In Abschn. 3.2.1 wird gezeigt, in welchem Maße sich hierbei die Stöj-festigkeit erhöht, und welche Voraussetzungen dafür bestehen (zusätzlicher Bandbreitebedarf). Die Meßtechnik hat an der FM besonderes Interesse, weil sich Meßgeber mit FM leicht realisieren lassen, z. B . durch gesteuerte Kapazitäten von Resonanzkreisen, und weil die Verwendung der Frequenz als Meßgröße eine hohe Auswertgenauigkeit und Empfindlichkeit verspricht, beides Eigenschaften der elektr. Meßtechnik von Frequenzen. Doch hier zunächst zur mathematischen Modellierung der Phasen- und Frequenzmodulation: Das Grundprinzip ist folgendes: Während bei einer unmodulierten harmonischen Schwingung der Phasenwinkel sich linear mit der Zeit
2.2. Übertragung von Informationsprozessen
67
ändert, daher die Phasengeschwindigkeit - ^ 1 1 = Q konstant ist, wird hier die dt
Phase nichtlinear mit der Zeit geändert, dis Phasengeschwindigkeit oder Kreisfrequenz ist eine Funktion der Zeit: —
=
Q(t). Dem konstanten Anteil Q0
dt
ist ein periodischer Anteil überlagert. Q(t) = i i 0 ( l + m sin cot) = Qü -j~ AQsincot mit AQ = mQ0 als Frequenzhub (eigentlich „Frequenzwechselamplitude"). Der Ansatz entspricht formal dem der Amplitudenmodulation, doch ist hier m 1 bzw. AQ Q0, sofern die relative Bandbreite klein gehalten werden soll. Dies ist aber meist notwendig. Stellt man nach dem Vorbild der Wechselstromtechnik den Träger Q0 als stillstehende Zeigergröße dar, so pendelt der modulierte Träger als Zeiger mit einem Phasenhub A
'Jlt
—» =
£ * „ /
doj
— oo
e>w,t~nAt>
df
=
2
x.2\f„
1
si (2nfg{t -
nAt)).
At ist der zeitliche Abstand der Abtastwerte von x(t). So wie man im Spektralbereich die spektralen Amplituden von den spektralen Amplitudendichten unterscheiden muß, so muß man nun hier im Zeitbereich die diskreten Amplitudenwerte (als DlBAO-Impulse!) von den kontinuierlichen Amplitudenwerten unterscheiden. Zwischen den Impulsflächen (Bewertungskoeffizienten der Diracstöße im Zeitbereich) xn der diskreten Abtastung und den Zeitfunktionsamplituden x(nAt) besteht die Beziehung: x(nAt)
=
xn
• 2f
2fg
g
ist die Breite des Frequenzbandes v o n / =
—f
g
bis/ =
Hiermit ergibt sich für den kontinuierlichen, frequenzbegrenzten Zeitvorgang: *(t)
=
X
x(nAt)
• si
'JI Il * \At
n
V J
79
2.2. Übertragung von Informationsprozessen
Dies ist die Reihenentwicklung des abgetasteten Zeitvorganges nach Spaltfunktionen. Zu den Zeitpunkten t = nAt stimmten x(t) und x(nAt) überein, da hier stets si (nAt) — 0 und si (0) = 1 ist. E s treten auch keine Widersprüche auf, da alle übrigen Spaltfunktionen gerade an diesen diskreten Punkten ihre Nulldurchgänge besitzen. x{t) ist also trotz der Summendarstellung in den diskreten Punkten t = nAt jeweils nur durch einen einzigen Summanden eindeutig bestimmt! Das frequenzbegrenzte kontinuierliche Spektrum besteht aus unendlich vielen linear unabhängigen (d. h. hier orthogonalen) Spektraltermen. Daher werden unendlich viele linear unabhängige Abtastwerte im Zeitabstand 1/2 fg zur Rekonstruktion des Spektrums mittels der FOURIER-Transformation benötigt. Liegen nur N Abtastwerte des Zeitvorganges vor, so reichen diese zur vollständigen spektralen Darstellung im Bereich —f g < f < f g nicht aus. Der iV-dimensionale Zeitraum läßt sich auch nur in einen iV-dimensionalen Spektralraum abbilden. Mehr spektrale Information enthalten die N Abtastwerte nicht. Dies führt zur diskreten FoURlER-Transformation, die die quadratische FotTRIER-Matrix N-ter Ordnung benutzt! F ü r 4 Abtastwerte lautet diese: (vgl. S. 95ff.)
~*(0)~1 p 1 1 1 "1 r*(0) *(1) x(2)
=
*(3)J
Die Realisierung Zeitvorgang:
1
F1 F2
F3
1
F2
F2
LI
F°
F3 F2 F1
der Rückumwandlung
«(1)
J
'
x(2)
L*(3)
mit F = e~' 2 "l N und Fk =
der Abtastfolge
e-J
in einen
2"fr'(mod
N)IN
kontinuierlichen
Die Wiedergewinnung des frequenzbegrenzten stochastischen Prozesses nach der Übertragung der Abtastfolge geschieht durch einen Tiefpaß als Glättungsfilter. Die einzelnen Impulse ergeben als Stoßreaktion des Filters zeitverzögerte Spaltfunktionen (der Form sin xjx), die sich zu dem kontinuierlichen Prozeß vor der Abtastung (d. h. hinter dem Meßwertgeber) aufsummieren. Die Grenzfrequenz des Tiefpaßfilters muß gleich der Abtastfrequenz, d. h. gleich der doppelten Grenzfrequenz sein. Man verzichtet auf eine Rekonstruktion des ursprünglichen kontinuierlichen Meßprozesses, wenn die nachfolgende weitere Meßwert-Verarbeitung digital durchgeführt wird, z. B . durch eine A/D-Umwandlung der Abtastimpulse in binäre Kodewörter (Binärsignalgruppen). Die mathematische Grundlage der finiten Systemtheorie ist die Matrizenrechnung, allgemeiner betrachtet die „diskrete" Mathematik. Sie findet ihre Anwendung in der Analyse linearer Netzwerke, hauptsächlich für Filteraufgaben der Informationsübertragungs-Technik.
80
2. Methoden der Informationsverarbeitung stochastischer Prozesse
2.2.2.2. Amplitudendiskretisierung
und
Binärkodierung
Bei der Digitalisierung von kontinuierlichen Meßvorgängen erfolgt nach der Abtastung als Zeitdiskretisierung die Umsetzung in Binärsignalgruppen als Kodewörter als Amplitudendiskretisierung. Hierbei muß die Anzahl der unterscheidbaren Amplitudenstufen festgelegt werden. Sie ergibt sich aus dem zu erwartenden Meßfehler Ax und beträgt:
Kodeliste Abb. 2.9. Übermittlung der Amplituden-Information durch Kodierung
N = —j-^ als Anzahl der unterscheidbaren Amplitudenstufen. Der Kehrwert ist der zu erwartende mittlere Meßfehler: F = AX[Xmäx. Für stochastische Prozesse mit überlagertem Störrauschen liefert die Informationstheorie von SHANNON die Formel: N2 =
Gesamtleistung ^ ^ Störleistung
=
J/ Pst
lA |/
^
+
P s t ör
Für die Wiedergabe durch binäre Kodeworte benötigt man eine Stellenzahl q von: g = {Ioga iV} = {ld JV}. Die geschweifte Klammer bedeutet die Valenzzahl, d. h. die nächste ganze Zahl von q, wenn N keine Potenz von 2 ist. Für N = 128 unterscheidbare Amplitudenwerte benötigt man also z. B. eine siebenstellige Binärzahl zur Kodierung. Bei der Übertragung und Rückumwandlung von Sprachsignalen äußert sich der regelmäßig auftretende Kodierungsfehler als Quantisierungsgeräusch. J e
2.2. Übertragung von Informationsprozessen
81
mehr unterscheidbare Stufen verwendet werden, um so geringer ist auch, das auftretende Quantisierungsgeräusch. International wird ein Störband von 62 dB verlangt. Dies bedeutet bei gleichmäßiger Amplitudenabstufung eine elfstellige Binärstellenzahl (q = 11). Für die Meßwertübertragung ist dies ein Anhaltswert zur Abschätzung. Bandbreitebedarffür
Binärsignalübertragung:
Bandbreitebedarf für eine Einkanalübertragung: Ein Binärzeichen der Dauer r benötigt eine obere Grenzfrequenz von/gj. l/2r. Dies ist zugleich die Basisbandbreite BNF. Bei Modulation eines HF-Trägers ist für das obere und untere Seitenband zusammen die doppelte Bandbreite J5HP = 2 B n p = 1/t erforderlich. Die Anzahl der Binärzeichen je s beträgt: I = 1/rbit/s als Informationsfluß. Da das bit dimensionslos ist, hat bit/s die Maßeinheit des Hz. Es gilt also: || HF-Bandbreite in Hz = Informationsfluß in bit/s. Andererseits ist der Informationsfluß gleich dem Produkt aus dem Symbolfluß und dem Kodierungsaufwand je Symbol. Daher gilt auch : HF-Bandbreite in Hz =Symbolfluß in Symbolen/s mal Kodierungsaufwand in bit/Symbol. Zahlenbeispiel: Ein Meßsystem hat eine Grenzfrequenz von 100 Hz. Dies ergibt eine Abtastfrequenz von 200 Hz. Indem 200 Meßwerte je s abgenommen werden, beträgt der Symbolfluß 200 Symbole je s. bit Symbole Der Informationsfluß ergibt sich demnach zu: 5 • 200 Symb. s = 1000 Hz. Man benötigt zur Übertragung mindestens 1000 Hz = B H f HFBandbreite bei einer Basisbandbreite von ß N F = 500 Hz. Bandbreitebedarf
bei
Mehrkanalübertragung:
In der Nachrichten- und auch in der Meßwert-Übertragung verbindet man die Binärkodierung mit einer Zeitstaffelung verschiedener Kanäle. Dies wird auch als Multiplex-Betrieb bezeichnet. Je mehr der Kanal zeitlich in ein Abtastintervall eingeschaltet wird, um so größer wird der Bandbreitebedarf und zwar proportional mit der Anzahl der gleichzeitig in Zeitstaffelung übertragenen Kanäle. So wird zur Sprachübertragung mit fgr = 4 kHz eine Abtastfrequenz von 2fgr
2. Methoden der Informationsverarbeitung stochastiascher Prozesse
82
= 8 kHz benötigt, und das Abtastintervall beträgt: T = 125 ms. Staffelt man zeitlich 10 Kanäle, so steht für einen Kanal nur eine Zeitdauer von 12,5 ms zur Übertragung des Kodewortes zur Verfügung. Beträgt die Binärstellenzahl q = 7 (wie beim Telexbetrieb), so ergibt sich eine Länge der Elementarimpulse von r < 1,5 ms und eine HF-Bandbreite von über 600 kHz. Die Übertragung läßt sich nur mit den Mitteln der Hochfrequenztechnik realisieren.
2.3. Informations-Reduktion Vorbemerkung
durch
Kenngrößenbildung
zu 2.3.
Zwei Grundgedanken beherrschen die Prozeßanalyse: 1. Es wird kein wesentlicher Unterschied zwischen den kontinuierlichen und den diskreten Meßprozessen gemacht, da jeder Prozeß frequenzbegrenzt ist und sich nach dem Abtastsystem durch eine Folge von diskreten Meßwerten übertragen und verarbeiten läßt. Der Unterschied tritt nur in der Wahl der mathematischen Begriffe und in der Wahl der technischen Mittel auf. Die heutige Prozeßmeßtechnik strebt dabei an, möglichst weitgehend digital zu arbeiten. Daher rechnet man stets mit endlichen Mengen bei den Meßwertkollektiven, da j a auch die Dauer des Meßprozesses (bzw. des Segments) begrenzt ist. 2. Die Meßwertfolge eines stochastischen Prozesses kann auf zwei verschiedene Weisen übertragen und verarbeitet werden: entweder betrachtet man die einzelnen Meßwerte als selbständige Ereignisse, die nur nach der Quantität (Amplitudenwert) und nach der Zeitfolge geordnet werden können und im Rahmen einer algebraischen Struktur rechnerisch ausgewertet werden können (algebraischer Aspekt) oder man betrachtet den inneren Zusammenhang der Ereignisse und sieht sie als Informationsträger des Prozesses an, wobei statistische Gesetze die Ereignisse verknüpfen (statistischer Aspekt). Es stehen also zwei grundsätzlich verschiedene Wege zur Informationsverarbeitung zur Verfügung. Wir wollen uns nun dem statistischen Aspekt zuwenden, d. h. uns mit der Frage beschäftigen, wie man aus der Beobachtung und Messung der einzelnen Meßwerte auf Grund der statistischen Gesetzmäßigkeiten Rückschlüsse auf den Prozeß selbst (auf das Meßwertkollektiv als Ganzes) machen kann. Hierbei spielt der Begriff der Informationsreduktion eine wichtige Rolle! Dagegen sind die Informationen über die Einzelereignisse — die einzelnen Meßwerte — nur von untergeordneter Bedeutung. Diese werden benutzt, um eine Information über den Charakter der Ereignismenge — des Meßprozesses — zu
2.3. Informations-Reduktion durch Kenngrößenbildung
83
gewinnen, während im erst genannten Fall das Einzelereignis schon die gewünschte Teilinformation darstellt und zwar in Form eines kodierten Signals. Dort kann nur die überlagerte Störinformation reduziert werden (Abschn. 3.), nicht die Nutzinformation! Der Unterschied der Anwendung algebraischer und statistischer Methoden der Informationsverarbeitung liegt also weitgehend in der vorgegebenen Informationsaufgabe, der Zielstellung begründet! Man beachte auch, daß die Meßtheorie keine speziellen Prozesse, sondern ganz allgemein in Physik oder Technik sich abspielende Vorgänge vom methodischen Standpunkt betrachtet. Daher kann die Meßstochastik nur allgemein gültige Hinweise geben, welche Kenngrößen sich aus einem Prozeß mit den Methoden der Signaltheorie ableiten lassen und in welcher Form dies geschehen muß. Sie kann dagegen keine Angaben liefern, welche Kenngrößen mehr oder weniger geeignet sind, eine Prozeßkontrolle oder eine Prozeßidentifikation vorzunehmen. Es ist daher in der Praxis eine enge Zusammenarbeit mit der Verfahrenstechnik und der Technologie des Prozesses erforderlich. Die Verfahrenstechnik hat hier das letzte Wort zu sprechen. Oft können nur langwierige Versuche eine Entscheidung liefern, ob eine Kenngröße optimal geeignet ist.
2.3.1. Kenngrößen
der einfachen
2.3.1.1. Amplituden-Verteilungen
Analyse und Mittelwerte
stationärer
Prozesse
Wenden wir uns nun dem statistischen Aspekt zu, um durch Kenngrößenbildung unter Informationsreduktion aus den einzelnen Meßwerten eine Information über den Meßprozeß selbst zu erhalten! Am Meßort liefert die Meßanlage über einen angeschlossenen Analysator Kenngrößen ( = Kennwerte oder Kennfunktionen) zur Prozeßidentifikation oder zur Prozeßkontrolle (zur Regelung des Prozesses). Dabei tritt die Frage auf, welche prinzipiellen Möglichkeiten es für eine Kenngrößenbildung überhaupt gibt. Es gilt, die Kenngrößen zu klassifizieren. Dies soll nachfolgend geschehen. Zunächst haben wir zu unterscheiden, ob die Kenngrößen nur von einem einzigen Meßpunkt abgeleitet werden ( = Fall der einfachen Analyse) oder von zwei oder mehr Meßpunkten ( = Fall der Verbundanalyse). Abb. 2.10 zeigt sche'matisch den Unterschied! In den beiden Fällen, d. h. bei der einfachen und bei der Verbundanalyse von Prozessen, kann man die Kenngrößen einteilen in solche, die momentane Prozeßkenngrößen darstellen, und in Kenngrößen, die Mittelwerte des Prozeßverlaufes ergeben. Im ersten Falle erfolgt also eine Momentanauswertung, im anderen Falle eine Mittelung.
84
2. Methoden der Informationsverarbeitung stochastischer Prozesse
Das ergibt ein Klassifizierungs-Schema nach Tafel 4 mit der Untergliederung in Methoden mit Momentanwert-Bildung und mit Mittelwert-Bildung für die einfache Analyse und die Verbundanalyse. Ein weiterer Einteilungsgesichtspunkt ist das Fehlen oder das Vorhandensein von Störungen. Wenn keine Störungen sich dem Meßprozeß überlagern, gibt es die Frage nach dem Vertrauensintervall (Schätzproblem der Kennwerte), bea) EinzeLanalyse
: laufender
Prozeß
\ Meßort
Analysator
I Prozeßkenngräße
b)
Verbundanolyse: Laufender
Prozeß
\
x
Verbund
Meßort -
1 ,
Verbund -
Analysator
Kenngröße Meßort
2
/ VergLeichsprozeS
Abb. 2.10. Einzelanalyse udn Verbundanalyse zur Kenngrößen-Bildung
sonders bei einer geringen Anzahl von Meßwerten. Wenn Störungen vorliegen, treten ganz erhebliche zusätzliche Schwierigkeiten auf, die zu einer stürmischen Weiterentwicklung der Theorie und der Meßmethode in den letzten Jahrzehnten führten. Hieran hatte vor allem die Verbundanalyse ihren Anteil. Für alle genannten Fälle ist eine Darstellung der Kenngrößen auf die verschiedensten Arten möglich: 1. Kenngrößen im Ensemble als statistische Erwartungswerte 2. Kenngrößen im Zeitbereich als Zeitmittelwerte 3. Kenngrößen im Spektralbereich als spektrale Werte. Welcher Darstellung man den Vorzug gibt, hängt vor allem von der praktischen Meßmöglichkeit ab. Vgl. Tafel 4.
2.3. Informations-Reduktion durch Kenngrößenbildung
85
Tafel 4 Darstellung
von
Prozeß-Kenngrößen
Beispiele
Kontinuierliche Wertefolgen („analog")
Diskontinuierliche Wertefolgen („digital")
im Zeitbereich:
Zeitfunktionen
im Spektralbereich :
FOUBIEB-IntegralFrequenzspektren AmplitudendichteVerteilungen
Amplituden-Abtastwerte, binäre Kodeworte Frequenzharmonische von FOTJRIBB-Reihen Amplituden-Verteilungen
im Ensemble:
Klassifizierung
von Prozeß-Kenngrößen
Beispiele
Einfache Analyse
Verbund-Analyse
MomentanwertBildung
z. B. Grenzwerte, Amplitudenwerte
logische Verknüpfungen
MittelwertBildung
Momente (Gleichanteil, Korrelationsfunktionen Varianz u. a.)
jeweils für a) ungestörte Prozesse b) gestörte Prozesse
Nun einige typische Beispiele für die Einzelanalyse: Grenzwert-A
nalyse:
In vielen Fällen genügt es, zu überwachen, ob der Prozeß gewisse Grenzwerte überschreitet oder nicht. Dies geschieht durch sogenannte Grenzwertwächter. Dies ergibt ein binäres Entscheidungsproblem: Grenzwert über- oder unterschritten bzw. Toleranz- oder Arbeitsbereich eingehalten oder nicht. Zusätzliche Informationen ergibt ein Grenzwertwächter, wenn er auf einem Amplitudenpegel im Arbeitsbereich eingestellt ist und die Häufigkeit der Durchgänge der Meßgröße durch einen noch zulässigen Amplitudenpegel registriert und ausgewertet wird. Dies ergibt die Durchgangsrate. Auch kann man den Zeitabstand der Durchgänge als Meßgröße analysieren und daraus Meßgrößen ableiten. Für die Analyse der inneren Prozeßdynamik ergeben sich dabei interessante Anwendungsmöglichkeiten, die bisher von der Meßpraxis noch wenig ausgenutzt wurden.
86
2. Methoden der Informationsverarbeitung stochastischer Prozesse
Mittelwert-Bildung: In der Meßtechnik sind zwei Typen von Meßparametern zu unterscheiden: a) direkte Prozeßparameter, z. B . Amplituden einer Spannung und ihre Frequenz (bei FM!) oder Phase, die zu jedem Zeitpunkt ein Abbild der Meßinformation zu demselben Zeitpunkt sind oder b) zeitgemittelte Parameter, z. B . bei Pulshäufigkeit- und Pulsbreiten-Modulation (vgl. 2.3.3.). Bei diesen wird die Meßinformation zu einem gegebenen Zeitpunkt in einen Signalparameter abgebildet, welcher sich erst durch Mittelung über eine gewisse Zeitspanne bestimmen läßt. In diesem Falle handelt es sich um Zeitmittelwerte. Hier entsteht die Frage, inwieweit derartige zeitgemittelte Parameter den statistischen Charakter des Meßprozesses, d. h. den Prozeßtyp, charakterisieren. Welcher Zusammenhang besteht zwischen den statistischen Mittelwerten und den Zeitmittelwerten eines Prozesses. Es muß folgendes festgestelt werden: Statistische
Mittelwerte und
Prozeß-Klassifizierung:
Mit der Klassifizierung der Kenngrößen ist die Klassifizierung der stochastischen Prozesse eng verbunden; meistens lassen sich bestimmte Kenngrößen nur bestimmten Prozeßklassen zuordnen! Die Zuordnung eines sich in der Praxis abspielenden Prozesses zu einer bestimmten Prozeßklasse ist stets eine Hypothese, deren Gültigkeit noch geprüft werden muß. Die Wahl eines mathematischen Modells hat meist heuristischen Charakter. Daher darf man die Schlußfolgerungen aus einer Modellanalyse nur mit Vorsicht auf den tatsächlich ablaufenden Prozeß übertragen. Die statistischen Prozesse werden durch die Wahrscheinlichkeiten der auftretenden Meßereignisse, z. B . Amplituden, beschrieben. Vgl. Abschn. 1.1.2.1. Wir unterschieden die Prozesse, die nur aus qualitativ unterscheidbaren Meßereignissen (Symbole, Farben, Zeichen) bestehen, wobeiletztere eine geschlossene Ereignismenge bilden müssen, und wir unterschieden die Prozesse, bei denen jedes Meßereignis mit einer Amplituden-Information verknüpft ist. Nach Abb. 2.11 kann man aus der beobachteten Folge von Amplituden durch eine Amplituden-Selektions-Stufe (Amplituden-Diskretisierung) die Häufigkeit der einzelnen Amplituden ermitteln. Konvergiert sie zu einem Grenzwert, wählt man diesen Wert einer Amplitudenstufe als ihre Wahrscheinlichkeit. Aus den Wahrscheinlichkeiten aller Amplituden-Stufen kann man dann z. B . die Kenngröße der Informationsentropie H(x) errechnen oder andere statistische Kenngrößen bilden, z. B . die Varianz ff2. Hierbei verfährt man bei einem zufälligen Prozeß genau wie bei einer Zufalls-
2.3. Informations-Reduktion durch Kenngrößenbildung
87
große, bei der man den Zufallsvorgang zur Ermittelung der Häufigkeitsverteilung immer wieder unter gleichen Bedingungen wiederholen und beobachten muß. Bei einem zufälligen Prozeß ist ein derartiges Verfahren nur unter zwei wichtigen Voraussetzungen möglich: der Prozeß muß die Eigenschaften der Stationarität und der Ergodizität besitzen. Dies wird meist stillschweigend angenommen, ist aber durchaus nicht immer voraussetzbar! Hier besteht die Gefahr eines klaffenden Widerspruchs zwischen der Modellbildung und dem realen Vorgang. Was beinhalten diese Voraussetzungen? PIA,)
Abb. 2.11. Amplituden-Verteilungs-Analysator zur Entropie-Bestimmung Messungen mittels der Zeitmittelung an stationären und ergodischen Prozessen: Stationarität bedeutet, daß die statistische Gesetzmäßigkeit des Ensembles als zeitkonstant angenommen wird. J e größer die Anzahl der am Vorgang beteiligten Elementarvorgänge ist, desto geringer ist der Einfluß der Natur des Elementarprozesses und desto besser gilt die statistische Gesetzmäßigkeit. Ein Beispiel dafür ist das elektronische Rauschen, das in der Meßstochastik als hauptsächlicher Störprozeß in Erscheinung tritt. Das elektronische Störrauschen selbst enthält keine determinierten Komponenten und läßt sich nur durch eine Wahrscheinlichkeitsanalyse der auftretenden Amplituden beschreiben. Als Modell wird meist der sogenannte GATJSSProzeß mit einer Normalverteilung angenommen. Die Amplituden-Wahrscheinlichkeitsdichte lautet hier: 1
l x - x f \
00
mit x = E[x]
als Gleichmittelwert: x = J xp(x) dx und er2 = E[(x — x)2} als oo
—oo
Varianz: a2 = f ( x - xf p(x) dx. Abb. 2.12 zeigt das Schema der Varianzanalyse — oo
eines stationären und ergodischen Prozesses. 7
Lange
88
2. Methoden der Informationsverarbeitung stochastischer Prozesse
Bei der Normalverteilung und x = 0 treten Amplitudenwerte, die groß gegen a sind, nur selten auf, so treten Werte von > 3er nur zu 0,3% auf. Dieses Prozeßmodell ist nur gültig, wenn sich der Prozeß aus einer sehr großen Anzahl von Elementarprozessen durch Amplitudenüberlagerung zusammensetzt, wobei die Wahrscheinlichkeitsverteilung der Amplituden der Elementarprozesse kaum eine Rolle spielt. Die Gauss-Verteilung erfreut sich in theoretischen Arbeiten großer Beliebtheit, auch wenn die Hypothese ihrer Gültigkeit durchaus nicht gesichert ist. Das „GATJSSsche Rauschen", beschrieben durch die GAUSSsche Normalverteilung, ist aber dann und nur dann ein stationärer Prozeß, wenn die der Varianz primärer oder sekundärer
Abb. 2.12. Schema zur Varianz-Analyse
entsprechende Wechselleistung und der Gleichanteil zeitlich konstant sind. Andernfalls verfährt man nach den in Abschn. 2.3.1.2. nachfolgend gemachten Ausführungen! Die GAUSS-Verteilung ist der Grenzfall der B e r n o u l l i - V e r teilung, die die Wahrscheinlichkeit von k günstigen (diskreten) Ereignissen A aus m möglichen angibt: P(k)
=
j
P(A)k
(1 -
P(A))
m
-".
Eine weitere wichtige meßtechnische Voraussetzung ist die Ergodizität des untersuchten Ensembles. Dies bedeutet, daß man die statistischen Eigenschaften des Ensembles auch durch die Analyse einer einzigen Prozeßrealisierung ( = Musterfunktion) feststellen kann. Man nimmt dabei — meist stillschweigend — an, daß im Laufe der Zeit die Prozeßrealisierung alle Amplitudenwerte des Ensembles mit der gleichen Wahrscheinlichkeitsdichte durchläuft. In vielen Anwendungsfällen liegt nur eine Realisierung eines Schwankungsprozesses vor, und es ist nicht möglich, den Vorgang an einem Ensemble zu einem festen Zeitpunkt zu messen. Da der Beweis der Ergodizität oft nicht exakt möglich ist, erklärt man einfach die Statistik des Prozesses an Hand der zeitlich fortlaufenden Analyse. Dies bedingt, daß der Prozeß hinreichend lange stationär verläuft, eine Voraussetzung, die erst durch einen Vorversuch geprüft werden muß.
2.3. Informations-Reduktion durch Kenngrößenbildung
89
Bei den ergodischen Prozessen setzt man die zeitlichen Mittelwerte gleich den statistischen Erwartungswerten: /(')
=
/
— : zeitlicher Mittelwert statistischer Erwartungswert
oo
T
d. h. j f(x) p(x) dx = lim y J f(t)dt. — oo
0
In der Meßtechnik spielen — bei der Einzelanalyse —• die Momente 1. und 2. Ordnung eine wichtige Rolle: So gilt für die Gleichkomponente eines Prozesses: oo
T
.x p(x) dx = lim — I x(t) dt r-*oo To J
/
und für den quadratischen Mittelwert (proport. der Gesamtleistung):
p(x) dx =
1
i
lim — T-+ oo 0
— oo
TJ
f x (t) dt 2
bzw. ohne Gleichkomponente (proport. der Wechselleistung): oo
0
( (x — xf p(x) dx = lim — f (x(t) —xfdt J TJ0 — oo
a2=
a 2 = Varianz oder Streuungsquadrat. Momente höherer Ordnung werden in der Meßtechnik kaum benötigt und ergeben sich bei der häufig verwendeten Normalverteilung aus den Momenten 1. und 2. Ordnung. So lautet bei der Normalverteilung:
M3 = 0
und
M 4 = 3a 4 .
Die bisher genannten Mittelwerte der Amplitudenanalyse haben nur energetischen Aussagewert und spiegeln den informatorischen Aspekt des Prozesses nur unzureichend wider. Für eine Informationsverarbeitung benötigt man weitere Aussagen. Diese liefert die Yerbundanalyse (Abschn. 2.3.2.). 7*
90
2. Methoden der Informationsverarbeitung stochastischer Prozesse
Die einfache Analyse k a n n aber auch an anderen Meßgrößen als an Amplituden vorgenommen werden, z. B. gibt es Momente 1. und 2. Ordnung von Frequenzabweichungen, Zeitabständen usw., womit sich die Anzahl von möglichen Kenngrößen erheblich erhöht.
2.3.1.2. Komponenten-Zerlegung in Standard-Signale (Fourier- und Walsh-Analyse) Spektrale Darstellung von Muster-Funktionen
stochastischer Prozesse
Als weitere Möglichkeit der Kenngrößen-Bildung steht die spektrale Darstellung offen. Sie benutzt die FoTTKIEK-Integral-Darstellung und ergänzt die Bildung von Ensemble- und Zeit-Mittelwerten. Wir gehen von der Tatsache aus, daß sich ein aperiodischer Zeitvorgang aus dem komplexen Amplituden-Spektrum X(a>) mittels der Beziehung berechnen läßt: 00
x(t) = J X(OJ) e? w
da
(X(w)-komplex)
— 00
Es gilt umgekehrt: 00
X(a>) = j x{t) e-i«' dt — CO
Dies ist die Verallgemeinerung der FouBiER-Reihen-Entwicklung periodischer Vorgänge. Wir haben hierbei Standardsignale der Form eiwt = cos cot + j sin cot vorgegeben und können den Zeitvorgang im Frequenzbereich von co = —oo bis oj = + o o darstellen. In der Meßtechnik kann man dabei meist eine Frequenzbegrenzung als Modellfall annehmen, womit sich der Frequenzbereich von a> — — W g bis = -\-C0g reduziert. X(a>) ist die spektrale Amplitudendichte, die bei den zu t = 0 symmetrisch verlaufenden, d. h. geraden Zeitfunktionen x(t), reell sind. Dies kann man aber bei stochastischen Prozessen niemals annehmen. X(a>) ist im allgemeinen eine komplexe Größe. So ergibt sich durch die F o u r i e r Integraldarstellung einer Prozeßrealisierung ein Amplitudenspektrum X(co) und ein Phasenspektrum arg X(co). Dieses gilt nur f ü r die bestimmte Realisierung ( = Musterfunktion). Wenn man aber zahlreiche gleichartige Prozesse als Ensemble untersucht, so kann man einen statistischen Mittelwert ( = Erwartungswert) f ü r die Amplitudenverteilungskurve
2.3. Informations-Reduktion durch Kenngrößenbildung
91
bilden, vorausgesetzt, daß man das Ensemble als „erwartungstreu" ansehen kann. Erst diese charakterisiert den Prozeß selbst. Meßtechnisch betrachtet wird ein bestimmter Wert des Amplitudenspektrums X(a>) für ein vorgegebenes co durch eine multiplikative Verknüpfung des Zeitvorganges mit dem Standard-Signal und durch eine nachfolgende Auf summierung (Integration) über die Zeit t gewonnen, also durch ein Verbund
Abb. 2.13. FOURIER- oder WALSH-Analysator als Verbundsystem
system, bestehend aus einem Multiplikator und einer Summierstufe (Integrator). Mittels des Multiplikators wird die Verbundgröße gebildet und durch die Summierstufe der zugehörige Mittelwert im Zeitbereich. Einer derartigen Meßanordnung werden wir noch häufig begegnen (vgl. Abschn. 2.3.). Das Schema zeigt Abb. 2.13! Das Amplitudenspektrum enthält eine Amplitudeninformation und eine Phaseninformation. Geht man von der Analyse der Musterfunktion ( = ProzeßRealisierung) zur eigentlichen Prozeßanalyse über, indem man den statistischen Mittelwert über alle Musterfunktionen bildet, wird man in den meisten Fällen beobachten, daß die Phase gleichmäßig zwischen 0 und 2n verteilt schwankt und für den Prozeß uninteressant ist. Man untersucht daher bei Zufallsprozessen anstelle des Amplituden-Spektrums nur das sogenannte Leistungs-Spektrum. Die Phaseninformation eines einzelnen Vorganges wird bei der akustischen Wahrnehmung durch das menschliche Hörorgan nach H E L M H O L T Z nicht ausgenutzt. Für die visuelle Wahrnehmung und für die Bildwiedergabe (Fernsehen!) ist die Phaseninformation jedoch unentbehrlich. Das Leistungsspektrum ist definiert durch die spektrale Leistungsdichte: S(f) = lim - L |X(/)|*. T~>oo ¿i
Diese Definition ist so gewählt, daß die Integration über den mathematischen
2. Methoden der Informationsverarbeitung stochastischer Prozesse
92
Frequenzbereich —oo < / < + oo den quadratischen Mittelwert von x(t) ergibt: + 00
/ S(f) df =• x(t)2 = — 00
x2eU,
die normierte Leistung des Prozesses. E s ist auch die Definition S(a>) üblich, die den quadratischen Mittelwert über — oo < w < + oo ergibt: oo J S(m) dCO = i(f)2 — 00
mit
2jrS(w) = S ( / ) .
Während die Momente 1. und 2. Ordnung des Prozesses nur energetische Aussagen liefern und für die Informationsanalyse von geringerem Interesse sind, enthält das Leistungsspektrum tiefer gehende Aussagen, da die Leistung des Prozesses durch die spektrale Leistungsdichte S(f) in bestimmter Weise auf den Frequenzbereich aufgeteilt wird. Dies ist der spektrale Aspekt der Informationstheorie und für zahllose Anwendungen von großer praktischer Bedeutung. Das Leistungsspektrum ist eine altbekannte Größe der Physik. Sie wird z. B . bei den Strahlungsgesetzen der Optik (Plancksches Strahlungsgesetz) benutzt und durch seine Frequenzabhängigkeit dargestellt. Ein wichtiges Ersatzmodell ist das „Breitbandspektrum" mit konstanter Leistungsdichte S 0 im Bereich — f g < f < fg, das außerhalb dieses Bereiches verschwindet. Realisiert wird dieses Modell durch ein elektronisches Rauschsignal, das durch ein Tiefpaßfilter bei^j, scharf abgeschnitten wird. Es gilt hier: x\lt = a2 = S0 • 2/1/. Die Bedeutung des Leistungsspektrums für die Charakterisierung der Eigenschaften eines stochastischen Prozesses geht aus dem nachfolgenden Abschn. 2.3.2. hervor! Signal-Analyse
mittels orthogonaler
Funktionen-Systeme:
E i n wichtiges Hilfsmittel der Prozeßanalyse sind die orthogonalen Funktionensysteme, in der Meßtechnik auch als Standard-Signale bezeichnet. Die harmonischen Schwingungen, benutzt als Entwicklungsfunktionen bei der F o t j b i e r Analyse, bilden ein wichtiges Anwendungsbeispiel. Es gibt jedoch noch andere Möglichkeiten, einen Vorgang in Komponenten zu zerlegen, d. h. in eine Summe von gewichteten Standardsignalen. Dann wird der Vorgang vollständig — oder auch annähernd — durch die Angabe der Standard-Signal-Komponenten beschrieben. Hierbei wird eine Meßanordnung nach Abb. 2.13 benutzt.
93
2.3. Informations-Reduktion durch Kenngrößenbildung A n g e n o m m e n , es sei eine Folge v o n Standardsignalen 0n(t)
vorgegeben, die
wir durch den I n d e x n m i t n = 0, 1, 2, . . . oo kennzeichnen. D a n n l a u t e t die Summendarstellung des V o r g a n g s : oo m
=£cn®n(t)
n=0
m i t cK als Gewichts-Koeffizient, auch E n t w i c k l u n g s - K o e f f i z i e n t g e n a n n t . F ü r ein orthogonales und normiertes F u n k t i o n e n s y s t e m 0„(t) gilt d a n n : f. J 0m(t) N(n). Eine Abbildung, die dies leistet, lautet: »-1
a = 2J ai ' 2' mit ¡=o
a 6 N(n)
und
at € (Z 2 ).
Man kann also Indizes durch natürliche Zahlen oder durch Binärzahlen ausdrücken. Es sei noch darauf hingewiesen, daß die Elemente einer Gruppe allgemein keine bestimmte Ordnungsrelation besitzen und nach praktischen Gesichtspunkten in der Reihenfolge geordnet werden können, wovon unten Gebrauch gemacht werden wird.
100
2. Methoden der Informationsverarbeitung stoehastischer Prozesse
Zum B e g r i f f der
Charaktere:
Definitionsgemäß versteht man unter einem Charakter einer Gruppe G eine homomorphe Abbildung von G in die multiplikative Gruppe des Körpers K der komplexen Zahlen. Unter einer homomorphen Abbildung versteht man eine relationstreue eindeutige Abbildung der Originalgruppe in die Bildgruppe. Relationstreu heißt, daß die Summe der hier additiven Gruppe (o@ b) in das Produkt der Abbildungen a von a und b abgebildet wird: n
mit
r/ = e'2"/n dar.
2.3. Informations-Reduktion durch Kenngrößenbildung
101
Die Elemente der multiplikativen zyklischen Gruppe unserer Abbildung sind Potenzen der Abbildung des erzeugenden Elenents, also sind sie Potenzen der gewählten und durch den Index k gekennzeichneten Einheitswurzel: a(za) = a(a)z = (rjk)z = rjkz, auch mit /¡¡(z) bezeichnet. Die n Punkte des Einheitskreises r/k, die re-ten Einheitswurzeln, lassen sich anschaulich als Elemente einer Drehgruppe auffassen, ein Zusammenhang, der hier nicht näher untersucht werden soll. Betrachten wir nun zunächst die Charaktere % der dyadischen Gruppe Z2! Hier ist n = 2 und d a m i t : rj = ei* = ( — 1 ) als ein Abbild des erzeugenden Elements a = 1 von Z 2 . Es gibt aber hier zwei Einheitswurzeln cr(o) = zt]/l = ¿ 1 . Wir haben für die Wahl von k zwei Möglichkeiten: k = 0 und k — 1 und wir haben zwei Gruppenelemente 2 = 0 und z = 1 abzubilden. Jedem Gruppenelement werden zwei Bilder zugeordnet, gekennzeichnet durch den Index k. Dies ergibt folgendes Schema für die Charaktere: kz:
k =0 k= 1
2= 0 0 2= 1 0
0 1
Xk(z)
= (-1)*:
2= 0 2= 1
k =0 k = + 1 + 1
+1 —1
So wird durch die beschriebene Abbildung dem Element 0 von Z 2 das Tupel ( + 1, + 1 ) und dem Element 1 von das Tupel ( + 1, —1) zugeordnet. Diese beiden Werte bilden die Werte der WALSH-Funktion, die einem Element zugeordnet i s t : walo(fc)s + 1 , + 1 wal^fc): + 1 , - 1 . Man erkennt aus der Definitionsgleichung: Xk(z) — V1"* daß die Koeffizienten vertauschbar sind. wal t (z) = wal z (fc).
" c: ü)is
Die „Walshmatrix" / + !
-¡-1 \ ist symmetrisch!
Sie stimmt mit der sogenannten HADAMAED-Matrix H2 überein.
102
2. Methoden der Informationsverarbeitung stochastischer Prozesse
V o m S t a n d p u n k t der I n f o r m a t i o n s t e c h n i k ist zu b e m e r k e n , d a ß die Abbildung eine Kodierungsredundanz h i n e i n b r i n g t : die einstelligen Binärziffern werden durch zweistellige B i n ä r z a h l e n abgebildet. M i t ( + 1 ) .A. 0 und ( — 1) . A L ergeben sich: ff(0) =
(0 0)
und
a(L)
=
(0
L).
M a n b e m e r k t ferner, d a ß die C h a r a k t e r e Xk(z) = Xz(k) nicht die WALSH-Funktionen selbst darstellen, sondern die K o e f f i z i e n t e n der WALSH-Funktionen. Übergang
zu den Charakteren
mehrstelliger
Binärzahlen:
D e r Übergang zu zwei- und zu mehrstelligen Binärziffern und zu ihren Char a k t e r e n ergibt sich aus der Auffassung, d a ß die B i n ä r z a h l e n direkte S u m m e n v o n zyklischen Gruppen des T y p s Z 2 sind. B e i der Abbildung geht die direkte S u m m e in ein direktes P r o d u k t über. D e r F a l l n = 2: F ü r eine zweistellige B i n ä r z a h l (z 1 ; z 2 ) erhalten wir für die A b bildung einer Ziffer: a(zi) = % k (zj) =
(—iyoo 2 T J
x ( t ) y ( t ) dt
y*eff • Jeff
*(«) • y ( t ) ' y*ff
115
2.3. Informations-Reduktion durch Kenngrößenbildung
f
+ T
mit *«,„ = lim - L x{tf dt = r->oo J -T
.
T ist hierbei das Beobachtungsintervall. Der Grundgedanke der Korrelationsanalyse war der Vergleich zweier Prozesse, die eine Zeitverschiebung aufweisen. Sie wird mit r bezeichnet. Hierbei ist eine Normierung des Korrelationsfaktors, wie sich zeigt, nicht einmal notwendig. Wir erhalten im Zeitbereich kontinuierlicher Vorgänge folgende Definition der von r abhängigen Korrelationsfunktion f ( r ) :
=
l i m
+T
1
w
T-* oo ¿1
*W y(l -T
- r ) d t = x(t) y(t
-
t) .
J
Auf eine Normierung kann man hierbei meist verzichten! Zur Messung der Korrelationsfunktion (KF) benötigt man ein Verbundsystem, das die beiden Informationsflüsse x(t) und y(t — r ) durch eine algebraische Multiplikation verknüpft und das Werteprodukt aufsummiert. Die K F W(r) — in der Literatur auch mit R(T) oder mit K(r) bezeichnet — ist eine Funktion der Verzögerungszeit, bei harmonischen Schwingungen gilt T =
. Eine Veränderung der Zeitverschieft» bung bedeutet eine zu ihr proportionale Phasenverschiebung A