138 39 15MB
German Pages 231 [232] Year 1973
Lutz, Informationssystem (CIS)
Das computerorientierte Informationssystem (CIS) Eine methodische Einführung
von Theo Lutz
Mit 47 Abbildungen
w DE
G Walter de Gruyter • Berlin • N e w York • 1 9 7 3
© Copyright 1973 by Walter de Gruyter & Co., vormals G. J. Göschen'sche Verlagshandlung - J. Guttentag, Verlagsbuchhandlung - Georg Reimer Karl J. Trübner - Veit & Comp., Berlin 30. - Alle Rechte, insbesondere das Recht der Vervielfältigung und Verbreitung sowie der Übersetzung, vorbehalten. Kein Teil des Werkes darf in irgendeiner Form (durch Photokopie, Mikrofilm oder ein anderes Verfahren) ohne schriftliche Genehmigung des Verlages reproduziert oder unter Verwendung elektronischer Systeme verarbeitet, vervielfältigt oder verbreitet werden. Printed in Germany. Satz und Druck: Mercedes-Druck, Berlin 61 ISBN 3 1 1 0 0 3 8 0 8 0
Vorwort In der heutigen Terminologie der Datenverarbeitung klafft eine breite Lücke zwischen Begriffen, wie sie in der praktischen Dimension der Erstellung von Softwaresystemen gebraucht werden, gegenüber Sprachräumen, die vornehmlich methodisch und wissenschaftlich orientiert sind. Betroffen sind Begriffe wie Informationssystem, Datenbank, Datenfernverarbeitung, time-sharing, Teilnehmersysteme, Teilhabersysteme, um nur die wichtigsten zu nennen. So gehört etwa das Wort „Informationssystem" von seiner Herkunft her eindeutig in den Bereich der Kybernetik, oder genauer gesagt der Informationstheorie. Man bezeichnet damit aber in der Datenverarbeitung eine Vielzahl von Systemen, ohne daß jedesmal ersichtlich wäre, wo jeweils ein Zusammenhang zu sehen ist. Diese Divergenz in der Benutzung von Worten hat sicherlich einen Grund darin, daß methodische und erst recht theoretische Dimensionen fehlen, die hier eine Verbindung liefern könnten. Die Kunst der Wissenschaft Informatik ist wohl noch nicht so weit gediehen, daß hier in absehbarer Zeit tiefgreifend Änderndes zu erwarten wäre. Andererseits und umgekehrt arbeitet der wissenschaftliche Raum, als die primäre Kompetenz für Theorie und Methode sehr oft ohne die gerade bei dieser Problematik relevante enge Bindung an die Praxis der Problemstellung. Dieses Phänomen ist erstaunlich, denn die Erstellung von Softwarepaketen, wie sie im Zusammenhang mit unserer Problematik anstehen, läßt sich ohne wissenschaftliche Vorgehensweise und ohne Wissenschaftler nicht mehr erreichen, auch wenn diese nicht im universitären Raum tätig sind. Da Wissenschaftlichkeit bekanntlich weder aus der Diktion noch aus einem Zitatenschatz kommt, haben wir mit diesem Buch versucht, eine Verständnisbrücke zu schlagen, zwischen der schwierigen und komplizierten Diktion der Informationstheorie, die im übrigen den Begriff der Datenbank noch nicht zur Kenntnis genommen hat, und den schwierigen und komplizierten SoftwarePaketen, mit denen man es im Tagesgeschehen zu tun hat und die wir wo immer erforderlich und manchmal auch öfter zitiert haben. Auch auf das Risiko hin, in manchen Augen eine wissenschaftliche Sünde zu begehen! Aus der Zitation realer Software-Systeme, die heute vielfältig auf dem Markt zu finden sind, ergab sich ein besonderes Problem. Als Mitarbeiter des Hauses IBM ist uns die IBM-Software am besten bekannt und zugänglich, ebenso wie Informationen über den praktischen Einsatz solcher Systeme. Andererseits sind uns Systeme anderer Hersteller nur über Handbücher und sehr oft nur über unzureichende Prospekte zugänglich. Wir haben uns daher ausschließlich auf IBM-Systeme beschränkt, weil wir nur so einigermaßen sicherstellen konnten, daß wir mit korrekten Informationen arbeiten. Der Leser sollte allerdings daraus nicht den Schluß ziehen, daß nur IBM-Software zu diesem Problemkreis
VI
Vorwort
existiert. Dem ist nicht so, und wir gehen eigentlich davon aus, daß wir den ernsthaften Leser mit diesem Buch sehr wohl in die Lage versetzen andere, nicht erwähnte Systeme selbst zu analysieren und in den Rahmen dieser Darstellung einzuordnen. Das Thema hat Anlehnungen an frühere Veröffentlichungen sowie Bezugnahmen auf Arbeiten anderer Autoren erforderlich gemacht. Das Literaturverzeichnis und die Zitationen im laufenden Text sollen dies dokumentieren. Ebenso sind diesem Buch viele Diskussionen mit Fachkollegen vielfältig zugutegekommen, nicht zuletzt deshalb, weil sie einen intensiven Kontakt zu praktischen Problemstellungen sichergestellt haben. Dorthin geht unser ganz besonderer Dank, ebenso wie an die Adresse derjenigen, die durch Toleranz, Verständnis und praktische Arbeit zum Zustandekommen dieses Buches beigetragen haben. Aber auch ein Lehrauftrag der Universität zu Köln ist nicht ohne Auswirkung auf die Durchdringung des Stoffes geblieben und muß hier genannt werden, weil er nicht von selbst zustande gekommen ist. So hoffen wir, daß mit dieser Analyse, von der wir meinen, daß sie in den Bereich der angewandten Informatik gehört, ein Lesestoff entstanden ist, der Interesse findet, der zum Mitdenken reizt und der schließlich zu Diskussionen fuhrt, denen wir gerne entgegensehen und an denen wir uns auch weiterhin gerne beteiligen wollen. Theo Lutz
Rodenkirchen bei Köln Im Herbst 1972
Inhaltsverzeichnis
Vorwort
V
1. Die Grundlagen des computerorientierten Informationssystems (CIS) - Definitorische Dimension des Problems -
1.1 Grundbegriffe der Kommunikation 1.1.1 1.1.2 1.1.3 1.1.4
Das allgemeine Kommunikationsschema Zeichen und Nachrichten Formatierte und formatfreie Nachrichten Imperative und deskriptive Nachrichten
1.2 Das Informationssystem 1.2.1 Vom Kommunikationssystem (KS) zum Informationssystem (IS) . . . 1.2.2 Vom Informationssystem (IS) zum computerorientierten Informationssystem (CIS)
1.3 Betriebssystem und Time-Sharing
1
1 1 4 6 6
7 7 9
11
1.3.1 Die historische Situation
11
1.3.2 Schubverarbeitung, Teilnehmer und Teilhaber
13
1.4 Aspekte des computerorientierten Informationssystems (CIS)
14
1.5 Konversation im computerorientierten Informationssystem (CIS) 1.5.1 Interaktive Informationssysteme 1.5.2 Anfrage und Dialog
17 17 18
2. Elemente und Transaktionen im computerorientierten Informationssystem (CIS) - Theoretische Dimension des Problems -
2.1 Die Elemente des CIS
20
20
Inhaltsverzeichnis
VIII 2.1.1 2.1.2 2.1.3 2.1.4 2.1.5 2.1.6 2.1.7 2.1.8
Eine Vorbemerkung Die Nachrichten im CIS Die Teilnehmer im computerorientierten Informationssystem Die Eingabe im CIS (Sender) Die Ausgabe im CIS (Empfänger) Die Bestände des Informationssystems Die Datenbank im computerorientierten Informationssystem (CIS) . . Transformierende Elemente im computerorientierten Informationssystem 2.1.9 Prozeduren und Methoden im System 2.1.10 Offene Prozeduren
2.2 Transaktionen und Transaktionstypen im CIS 2.2.1 2.2.2 2.2.3 2.2.4 2.2.5
Transaktionen im CIS Eine abstrakte Transaktion Typische Transaktionen im CIS Transaktionstypen Der Transaktionscode
2.3 Das theoretische computerorientierte Informationssystem 2.3.1 2.3.2 2.3.3 2.3.4
Das theoretische Gesamtsystem Die graphische Darstellung des theoretischen CIS Informationstheorie, Informationssystem und Automat Die Systemsteuerung - eine Anmerkung
3. Die Datenbank im computerorientierten Informationssystem (CIS) - Eine methodische Dimension des Problems -
3.1 Imperative Definition der Datenbank 3.1.1 3.1.2 3.1.3 3.1.4 3.1.5 3.1.6 3.1.7 3.1.8
Syntaktische oder semantische Datenbank Redundanzfreiheit in der Datenbank Vielfachverwendbarkeit der Datenbank Die Unabhängigkeit der Datenbank Die Integriertheit der Datenbank Die Benutzerorientiertheit der Datenbank Die Strukturflexibilität der Datenbank Zusammenfassende Bemerkungen
3.2 Datenelemente und informationelle Grundstruktur 3.2.1 Das formatierte Datenelement 3.2.2 Die Menge der Ordnungskriterien
20 21 27 28 29 29 33 35 36 35
37 37 39 41 49 50
50 50 52 54 56
59
59 59 59 60 60 61 61 61 62
63 63 64
Inhaltsverzeichnis 3.2.3 Spezifizierende Bedingungen und sensitive Datenelemente 3.2.4 Ein erklärendes Beispiel 3.2.5 Die informationelle Grundstruktur einer Datenbank
3.3 Datenbankstrukturen 3.3.1 3.3.2 3.3.3 3.3.4
Datenelementeinsätzen Der logische Satz Nichtlineare Struktur der Datenbank Das Datenbankdiagramm
3.4 Makrobeschreibung einer Datenbank 3.4.1 3.4.2 3.4.3 3.4.4 3.4.5 3.4.6 3.4.7
Problemstellung Indizes, Adressen und Indizierungsmethoden Grundbegriffe des Datenbankprozessors Die Makros des Datenbankprozessors Dateiauswertende Operationen Anwendungsbeispiel für eine Datenbank Abschließende Bemerkung
3.5 Typen von Datenbanken 3.5.1 3.5.2 3.5.3 3.5.4 3.5.5 3.5.6
Das Problem Dynamische und stationäre Datenbanken Virtuell und physisch strukturierte Datenbanken Segment-und Baumdateien in der Datenbank Typen von Datenbanken Der Bestand als triviale Datenbank
4. Die Moduln eines computerorientierten Informationssystems (CIS) - Technische Dimension des Problems -
4.1 Typen von Informationssystemen 4.1.1 4.1.2 4.1.3 4.1.4 4.1.5 4.1.6
Das Grundproblem Teilhabersysteme Teilnehmersysteme Moduln eines computerorientierten Informationssystems Ein Stammbaum für Informationssysteme Die ideale Software
4.2 Systemsteuerung (DC)
IX 67 69 70
72 72 75 76 77
78 78 80 82 85 94 100 108 113 113 114 117 118 120 121
123
123 123 125 127 130 132 132 134
X
Inhaltsverzeichnis 4.3 Die Kommandosprache ( T C L )
136
4.3.1
Eine Vorbemerkung
136
4.3.2
Struktur einer Kommandosprache
137
4.3.3
Die Kommandosprache in C A L L
139
4.4 Remote Job Entry ( R J E )
142
4.5 Sicherheit und Logging ( R A S P )
143
4.5.1
Das Problem der Sicherheit
143
4.5.2
Logging im CIS
145
4.6 Bestände und Datenbanken ( D B )
146
4.6.1
Eine Vorbemerkung
146
4.6.2
Dateiorganisation
146
4.6.3
Arbeitsbereiche und Matrizen
4.6.4 Schnelle Bestände im Time-Sharing 4.6.5 File scanning - Dateiabsuche 4.6.6 File processing - Datenbankdateiverwaltung 4.6.7 Eine Zwischenbemerkung
148 149 150 151 153
4.6.8
Sub-Datei und dedizierter Bestand
153
4.6.9
Bridging
155
4.6.10 Eine abschließende Bemerkung
4.7 Bibliotheken und Prozedurbank
155
156
4.7.1
Eine Unterscheidung
156
4.7.2
Bibliotheken im CIS
157
4.7.3
Ein Beispiel: Die CALL-Bibliotheken
158
4.7.4
Prozedurbanken
159
4.7.5
Systemübergänge
160
4.8 Sprachen und Umwandlet im CIS
161
4.8.1
Sprachen im CIS
4.8.2
Utilities für Dateiabfragen . . . .
161 162
4.8.3
Ein methodischer Zwischenschritt
163
4.8.4
Anfragesprachen (QL-Problem)
164
4.8.5
Eine komplexe Anfrage
165
4.8.6
Der systemgeführte Dialog (Stationsprogrammierung)
169
4.8.7
Der benutzergeführte Dialog
170
4.8.8 Ein knappes APL-Beispiel
171
4.8.9 Compiler, Interpreten und Umwandler
173
Inhaltsverzeichnis 4.9 Time-Sharing (TS) - Ein Systemmodul TSD 4.9.1 Die TS-Situation 4.9.2 Der TDS-Modul in TSO
5. Softwareprofile - Praktische Dimension des CIS -
5.1 Versuch einer Softwareanalyse 5.1.1 5.1.2 5.1.3 5.1.4 5.1.5
Die Vorgehensweise Zusätzliche Bemerkungen Was ist ein Systemprofil Ein spezielles Systemprofil Eine Anmerkung
5.2 Teilnehmersysteme 5.2.1 5.2.2 5.2.3 5.2.4
Ein System von Teilnehmern Time Sharing Option - TSO Das Teilnehmersystem CALL A Programming Language - APL
5.3 Teilhabersystem 5.3.1 5.3.2 5.3.3 5.3.4 5.3.5
Ein System von Teilhabern Information Management System - IMS Customer Information and Control System - CICS Generalized Information System - GIS Datenbankprozessoren
XI 176 176 177
179
179 179 180 182 183 185
185 185 186 189 192
195 195 196 200 202 205
6. Nachwort
208
Wichtige Akronyme
211
Literaturiibersicht
216
Sachverzeichnis
218
1.
Die Grundlagen des computerorientierten Informationssystems (CIS) — Definitorische Dimension des Problems —
1.1 G r u n d b e g r i f f e d e r K o m m u n i k a t i o n
1.1.1 Das allgemeine Kommunikationsschema Der Begriff „Informationssystem" ist in eine Terminologie eingebettet, die zum Gegenstandsbereich der Informationstheorie gehört und die man im weitesten Sinne zur Kybernetik rechnet. Recherchiert man in der aktuellen Literatur zu dieser Thematik, so macht man zuerst einmal die sehr erstaunliche Feststellung, daß über sehr grundlegende und viel benutzte Begriffe weder einheitliche Meinungen noch anerkannte Definitionen bestehen. Lediglich der Begriff „Information" macht hier eine gewisse Ausnahme, wenn man ihn im Sinne der Shannonschen Maßtheorie [41] benutzt. Aber auch diese Strenge im Begriff Information verschwindet bereits dann, wenn man den Sprachgebrauch öffnet und etwa von einem „Informationssystem" spricht. Versucht man schließlich noch Gesichtspunkte zu beachten, die aus der Datenverarbeitung und den von ihr berührten Disziplinen, wie etwa der Organisationslehre rühren, so landet man bei jener Sprachverwirrung, die es möglich macht, daß man im Jargon der Datenverarbeitung oft schon dann von einem Informationssystem spricht, wenn vielleicht nur ein Datenfernverarbeitungssystem gemeint ist. Man muß wohl nicht darauf hinweisen, daß dabei völlig übersehen wird, daß ein solches System sua generis sinnlos ist und erst durch auftretende MenschMaschinen-Beziehungen zu jener Spontaneität gelangt, die man unterstellt, wenn man etwa im organischen Bereich unter Bezugnahme auf kybernetische Überlegungen von einem „Informationssystem" spricht. In dem hier aufgezeigten terminologischen Bereich muß man beispielsweise ein „Informationssystem" auch in einem Ameisenstaat vermuten, wenn man zugesteht, daß ein solcher Staat nur dann denkbar ist und Bestand haben kann, wenn er sich zielgerichtet verhält und wenn sich die Elemente dieses Systems wenigstens in der statistischen Summe über ein solches Ziel einig sind und entsprechend abgestimmt handeln. Die Divergenz in den Begriffen rund um das Wort Informationssystem macht es erforderlich, den Begriff „Informationssystem" auf die Gegebenheiten des Computers und seiner Software abzustimmen und den benutzten Begriffen eine feste und möglichst eindeutige Bedeutung zu geben. Dieser Aufgabe wollen wir uns im ersten Abschnitt dieser Abhandlung unterziehen.
2
1. Die Grundlagen des computerorientierten Informationssystems (CIS)
Nach Flechtner [10] liegt eine Kommunikation oder ein Kommunikationsprozeß dann vor, wenn bei einer Beziehung zwischen zwei Elementen, die man dann auch die Teilnehmer eines Systems nennt, etwas vom einen auf den anderen übergeht. Das ist etwa der Fall, wenn ein Brief geschrieben wird oder wenn eine Ameise in einem Ameisenstaat eine zweite als zu ihrem Staat gehörig akzeptiert und nicht bekämpft. Was dabei übergeht, nennen wir mit Flechtner eine „Mitteilung". Ein System von Elementen oder Teilnehmern, die so aufeinander Bezug nehmen, heißt „Kommunikationssystem". Es dient der Übermittlung und dem Austausch von Mitteilungen. Ein solches System heißt „formalisiert", wenn die Struktur und der Aufbau all seiner Mitteilungen bekannt ist und wenn klar angebbare Regeln bestehen, nach denen diese Mitteilungen aufgebaut, übermittelt und ausgetauscht werden. In diesem Falle hat man es mit speziellen Mitteilungen zu tun, die wir der Informationstheorie folgend „Nachrichten" nennen wollen. Ohne allzusehr in die Informationstheorie eindringen zu wollen [dazu 41; 10 und 1], sei hier kurz dargestellt, wie man sich in der Kommunikationstheorie den Aufbau, die Übermittlung und den Austausch solcher Nachrichten vorstellt. Man geht dabei davon aus, daß die Teilnehmer im System genau bekannt sind und eine wohl definierte, endliche Menge T = (Ti, i = 1 . . . I) bilden. Jeder Teilnehmer Tj hat die Eigenschaft, Nachrichten aufbauen und abgeben zu können. Diese Eigenschaft macht ihn zum Sender. Er hat weiterhin die Eigenschaft, Nachrichten empfangen und abbauen (verstehen) zu können. In dieser Eigenschaft ist der Teilnehmer ein Empfänger. Es ist dabei nicht zwingend, daß ein Teilnehmer über beide Eigenschaften verfügt oder daß er beide Eigenschaften gleichzeitig besitzt und/oder wahrnimmt. Für viele Betrachtungen ist es nachgerade zweckmäßig, während eines bestimmten Kommunikationsprozesses einem Teilnehmer die Eigenschaft „Sender" und dem weiterbeteiligten Teilnehmer die Eigenschaft „Empfänger" zu geben. Hat ein Teilnehmer T^ zu einem bestimmten Zeitpunkt die Eigenschaft „Sender", so bezeichnen wir dies mit T k (S). Entsprechend hat der Teilnehmer Ti(E) im jetzigen Moment die Eigenschaft „Empfänger", und er kann Nachrichten entgegennehmen. Die Nachrichten in einem Kommunikationsprozeß, der formalisiert ist, sind nach bestimmten Regeln, die wir die syntaktischen Regeln der Kommunikation nennen, aus einzelnen Zeichen zusammengesetzt, die einem Zeichenvorrat oder auch einem Alphabet entnommen worden sind. Auch der Zeichenvorrat des Prozesses ist eine wohl definierte endliche Menge A = (z i ; i = 1 . . . K) und eine Nachricht ist eine Folge von Zeichen aus der Menge A. Ob eine bloße Anordnung solcher Zeichen im Sinne des Kommunikationsprozesses als Nach-
3
1.1 Grundbegriffe der Kommunikation
rieht zulässig ist, entscheidet sich an den syntaktischen Regeln des Kommunikationsprozesses. Weiterführende Definitionen und Schlußfolgerungen finden sich in der Literatur (etwa in [1; 35], Interessant für unsere Überlegungen ist dabei, daß vor allem die Theorie der Programmiersprachen sehr zur Aufhellung dieser Sachverhalte beigetragen hat, was nicht verwundert, da Programmiersprachen dazu dienen, spezielle Kommunikationsprozesse zu beschreiben [35], Formal können wir eine solche Nachricht, von der wir voraussetzen, daß sie sinnvoll ist und den syntaktischen Regeln genügt, darstellen als N
=
( z i> z2> z 3 • • • z n) >
z
iGA
oder einfacher als N(z1; z 2 , z 3 . . . zn) . Es ist dabei für unsere Zwecke nicht erforderlich, daß wir die Menge aller Nachrichten in einem Kommunikationsprozeß definieren. Eine von einem Sender erzeugte Nachricht wird von einem Kanal übernommen, dessen Spezifikation unsere Probleme ebenfalls nur sehr peripherer berührt, so daß wir ihn nicht weiter formalisieren: Der Kanal überträgt die Nachricht an einen Empfänger. Die Nachricht ändert in Kanälen im allgemeinen ihre Gestalt und wird auf eine andere Zeichenfolge gelegt, die auch aus anderen Zeichen eines anderen Alphabetes stammen kann. Dieser Fall soll uns jedoch nicht interessieren. Wir gehen davon aus, daß für alle unsere Kommunikationsprozesse, die wir hier untersuchen wollen, stets genau ein Alphabet gilt. Dort, wo ein Kanal eine Nachricht in der äußeren Form verändert, sagt man auch, die NachSender
Bild 1.1.1 Schematische Darstellung eines Kommunikationsprozesses
Empfänger
4
1. Die Grundlagen des computerorientierten Informationssystems (CIS)
rieht werde umcodiert. Dies kann eine Eigenschaft des Kanales sein. Sofern für die Übertragung der Nachricht eine Umcodierung erforderlich ist, unterstellen wir, daß am Ende des Kanals erneut so umcodiert wird, daß die Nachricht ihre ursprüngliche Gestalt mit den Zeichen des Ausgangsalphabets wieder erhält und damit empfängergerecht ist. In diesem Zusammenhang treten Begriffe wie Decodieren und Recodieren auf. Den Vorgang der Codierung kann man als eine eindeutige Abbildung verstehen. Der Kommunikationsprozeß, wie er hier beschrieben ist, ist in Bild 1.1.1 dargestellt.
1.1.2 Zeichen und Nachrichten Unsere Beschränkung auf nur ein Alphabet erweist sich keinesfalls als einengend, da auch im Bereich menschlicher Kommunikation eine unübersehbare Fülle von Kommunikationsprozessen mit ein und demselben „Alphabet" formal dargestellt wird. Wesentlich ist, daß der Empfänger eine Nachricht von einem Sender über einen Kanal nur dann als sinnvoll anerkennt, wenn er mit demselben Alphabet und mit denselben syntaktischen Regeln ausgestattet ist. Man drückt dies gelegentlich auch so aus, daß man sagt, die Menge der Zeichen und syntaktischen Regeln seitens des Senders und des Empfängers müssen über eine nichtleere Durchschnittsmenge verfügen. Diese Voraussetzung ist hinfällig, wenn mit einem einheitlichen Alphabet gearbeitet wird. Formal zeigen wir einen solchen Kommunikationsprozeß folgendermaßen an: Tk(S)=>N(z1,z2lz3 . . .z,)=>Tm(E) . Über die in Kommunikationsprozessen auftretenden Zeichen existiert eine breite Palette von Literatur, die sich auch ausführlich mit den Problemen der Codierbarkeit überhaupt, also der Darstellbarkeit von Sachverhalten durch Zeichen schlechthin befaßt. Hier soll uns ein anderer Sachverhalt beschäftigen, der darauf hinausläuft, daß der Unterschied zwischen Zeichen und Nachrichten keineswegs grundsätzlich ist. Zeichen und Nachrichten rangieren in derselben Betrachtungsdimension. Da wir ausschließlich mit endlichen Mengen umgehen, ist die Menge der Zeichen über eine Syntax und einem Alphabet ebenfalls wiederum endlich, wenn man nur endlich lange Nachrichten zuläßt, wie dies sinnvoll ist. Dann kann man aber wiederum jeder Nachricht selbst eine feste Zahl zuordnen, etwa eine Dezimalzahl oder auch ein ikonisches Zeichen und man kann sich bei der Kommunikation der Nachricht auf die Übermittlung des ikonischen Zeichens oder der Dezimalzahl selbst beschränken. Man spricht dann auch von einem Superzeichen. Diese Vorgehensweise wählt man, wenn man etwa über eine Codezahl (später sprechen wir von einem Transaktionscode) ein Programm aufruft, das etwa eine Computerliste erstellt, und man damit darauf verzichtet, das Programm selbst zu übermitteln.
5
1.1 Grundbegriffe der Kommunikation
Zeichen und Nachrichten, die in formalisierten Kommunikationsprozessen auftreten, sind vor allem in Hinblick auf drei Aspekte bekannt, die man auch die semiotischen Funktionen der Zeichen nennt. Sie sind in Bild 1.1.2 dargestellt. Die erste dieser drei Funktionen ist die syntaktische Funktion oder die syntaktische Dimension, die uns bereits begegnet ist. Sie gibt, wie sich Anschütz [1] ausdrückt, Aufschluß über den Zusammenhang zwischen den inneren Gesetzmäßigkeiten von Nachrichten und Zeichen, insbesondere über das gemeinsame Auftreten von Zeichen und Nachrichtenpaaren oder der Abfolge von Zeichen innerhalb von Nachrichten. Die semantische Funktion bezieht sich auf die Bedeutung, die einem Zeichen oder einer Nachricht zukommt. Sofern es möglich wäre, in Regeln auszudrücken, wie die Abbildung einer Bedeutung oder eines Sachverhaltes auf ein Wort der Umgangssprache zustandekommt, so würden solche Regeln die Semantik der Kommunikation sein und die entsprechende Syntax ergänzen. Als drittes ist die pragmatische Funktion zu nennen, die die Beziehung der Zeichen und Nachrichten zum Bezeichner beschreibt. Die Semiotik als die Lehre von den Zeichen und Nachrichten besteht demnach aus den Disziplinen der Syntax, der Semantik und der Pragmatik. Unsere Betrachtungsweise ist vorwiegend syntaktisch. Die ganzheitliche Betrachtung von Kommunikationsprozessen erfordert jedoch eine Ausleuchtung aller drei Dimensionen. Eine sehr eingehende Diskussion des Zeichens im Rahmen der Semiotik findet der Leser in [4], Im Zusammenhang mit dem Begriff des Kanals ergab sich bereits der Begriff der Decodierung und der Recodierung. Dabei entsteht ein interessantes Phänomen. Man verlangt von Geräten, die eine Umcodierung vornehmen (man nennt sie im Bereich der Technik auch Wandler), daß sie etwas ganz Bestimmtes an einer Nachricht oder an einem Zeichen invariant belassen. Dieses Etwas könnte
Syntaktische Funktion
Semantische Funktion
Pragmatische Funktion
Bild 1.1.2 Die semiotischen Funktionen
6
1. Die Grundlagen des computerorientierten Informationssystems (CIS)
man auch den Inhalt einer Nachricht nennen. Ein besserer und gebräuchlicher Ausdruck für den Inhalt einer Nachricht ist das Wort Information, und wir wollen es im folgenden auch in diesem Sinne benutzen. Wie schwierig es ist, die semiotischen Funktionen der Zeichen zu trennen, zeigen im übrigen die Arbeiten von Shannon [etwa 41], die das Problem der Information sehr klar und wohl definiert, aber ausschließlich syntaktisch betrachten. Die Bedeutung der shannonschen Arbeit liegt vorwiegend dort, wo es ihm gelungen ist, den Gehalt einer Nachricht rein syntaktisch aus dem Auftreten der Nachrichten und Zeichen zu fassen und in der nach ihm benannten Formel auszuweisen. Hier liegen aber auch die Grenzen einer solchen Betrachtung und der allgemeine, bedauerlicherweise sehr oft auch der wissenschaftliche Sprachgebrauch außerhalb der Informationstheorie, vermischt den Begriff Information allzu häufig noch mit semantischen und pragmatischen Betrachtungen. Daß das Wort „Information" überdies gelegentlich als Synonym für das Wort Nachricht dient, rührt daher, daß in vielen Betrachtungen mehr auf den Inhalt einer Nachricht als auf ihre äußere Gestalt Wert gelegt wird. Wir wollen uns jedoch im Verlauf dieser Darstellung voll an die hier gegebenen Definitionen halten. 1.1.3 Formatierte und formatfreie Nachrichten Wir werden später eine kurze Typologie der Nachrichten darstellen, die in einem computerorientierten Informationssystem auftreten können. Hier sei jedoch noch einmal auf eine Unterscheidung von Nachrichten hingewiesen, die für das Folgende sehr wesentlich ist. Es gibt zuerst einmal Nachrichten, deren Zeichen Worte der Umgangssprache sind. Nachrichten, die so beschaffen sind, heißen heute üblicherweise formatfrei oder unformatiert. Dem stehen sehr spezielle Nachrichten gegenüber, die vorwiegend aus dem Bereich der kommerziellen Datenverarbeitung stammen. Dies sind Nachrichten, bei denen als Zeichen nur spezielle Begriffe, zumeist normierter Länge dienen, die man in der Technik der Datenverarbeitung auch Felder nennt und die mit speziellen Attributen versehen sind. Sie werden nicht nach freien, verbal vorliegenden Regeln zu Nachrichten zusammengesetzt, sondern in vordefinierte Schemata eingesetzt, die man dann auch ihr „Format" nennt. Aus diesem Grunde heißen diese Nachrichten auch formatierte Nachrichten. Die Trennung zwischen formatierten und formatfreien Nachrichten in computerorientierten Informationssystemen ist so grundsätzlich, daß eine formale Kennzeichnung nicht erforderlich ist. Mißverständnisse sind hierbei kaum möglich. 1.1.4 Imperative und deskriptive Nachrichten Eine weitere Unterscheidung von Nachrichten bezieht sich auf die semantische Funktion der Nachrichten, wobei auch diese Differenzierung vorwiegend auf das computerorientierte Informationssystem abhebt. Es gibt einerseits Nach-
7
1.2 Das Informationssystem
richten, die innerhalb des Systems eine Wirkung zeitigen, die etwa eine Anweisung an eine Komponente des Systems enthalten und die im System verarbeitet werden. Dies sind die imperativen Nachrichten. Andere Nachrichten liefern eine Aussage über das System, oder sie sind gar nur eine Kopie oder Auswertung der im System enthaltenen und gespeicherten Nachrichten, oder es sind Nachrichten, die in das System eingehen, um dort verarbeitet oder verwahrt zu werden. Solche Nachrichten nennen wir im folgenden deskriptiv. Im Fluß der Nachrichten in einem Informationssystem ist diese Unterscheidung sehr relevant, denn die imperativen Nachrichten werden vom System verarbeitet wie etwa eine Telefonnummer, die deskriptiven Nachrichten aber werden vorwiegend erzeugt oder im System gespeichert oder durch das System hindurch übertragen. Formal unterscheiden wir beide Nachrichtentypen durch die Bezeichnungen NI für imperative und ND für deskriptive Nachrichten. Eine imperative Nachricht hat also in der allgemeinen Form die Gestalt N I ( Z l , z 2 , z 3 . . . zn) , und sofern sie von einem Sender an einen Empfänger geht, kann man folgendes Kommunikationsschema angeben: Tk (S) => NI (zj, z 2 , z 3 . . . ^n/
im ( E ) .
Eine weitere Differenzierung der Nachrichten, die in einem computerorientierten Informationssystem auftreten können, wird in einem späteren Kapitel gegeben.
1.2 Das Informationssystem 1.2.1 Vom Kommunikationssystem (KS) zum Informationssystem (IS) Man versteht unter einem System eine „organisierte Gesamtheit" [10], die dadurch zustande kommt, daß zwischen den Teilen des Systems gewisse Beziehungen bestehen. Insbesondere spricht man von einem formalisierten System, wenn die Teile eines Systems als wohl definierte Elemente einer Menge faßbar und angebbar sind und wenn eine Sammlung von Regeln, die Syntax des Systems, besteht, die genau festlegt, wie die einzelnen Elemente im System aufeinander bezogen sind. Es sei angemerkt, daß hier ein deutlicher Zusammenhang zur formalen Definition für den Begriff Struktur besteht, wie sie Rüssel und später Wiener ausgesprochen haben [s. dazu 31; 24], Gelegentlich wird auch gesagt, daß sich das System zu einer Struktur verhalte, wie eine Wirklichkeit zu einem Abbild. Unter einem Kommunikationssystem hat man demnach ein zuerst einmal nicht formalisiertes System zu verstehen, das sich aus Kom-
8
1. Die Grundlagen des computerorientierten Informationssystems (CIS)
munikationsprozessen aufbaut. Es besteht aus Elementen (Teilnehmern), die gegenseitig Mitteilungen (im Sinne Flechtners, s. S. 2) austauschen, übermitteln und auch verarbeiten. Wendet man den Begriff der Formalisierung auf das System und auf die darin auftretenden Kommunikationsprozesse an, so kommt man nach [10] zum „Informationssystem". Das Informationssystem ist diesem Sprachgebrauch folgend also ein formalisiertes Kommunikationssystem: Die Elemente des Systems sind genau angebbar und definierbar, man kann sie in geordneten, endlichen Mengen zusammenfassen; die auftretenden Kommunikationsprozesse sind bekannt; an die Stelle der allgemeineren Mitteilungen treten Nachrichten, die mit Informationen angefüllt sind. Das Informationssystem setzt sich also aus formalisierten Kommunikationsprozessen (Bild 1.1.1) zusammen, wie in Bild 1.2.2 gezeigt wird. Die Formalisierung besteht darin, daß zuerst einmal ein verbindliches Alphabet definiert ist, wobei wir auch hier voraussetzen, daß für das gesamte System nur genau ein Alphabet existiert. Sie erfaßt weiterhin den Aufbau und die Struktur der im System auftretenden Nachrichten sowie die Art und Weise ihres Austausches. Es existieren also syntaktische Regeln, nach denen sich die Kommunikationsprozesse formalisiert abwickeln. Während sie sich im Bereich der formalisierten Kommunikationsprozesse ausschließlich auf den Aufbau und die Übermittlung der Nachrichten beziehen, kommen im Informationssystem weitere Regeln dazu, die die Beziehungen zwischen den Teilnehmern und den Elementen des Systems festlegen. In diesen Regeln kommt zum Ausdruck, daß wir es nunmehr mit einer Summe von Kommunikationsprozessen zu tun haben und von einem System reden. Dies wird vor allem dann deutlich, wenn wir zur Abwicklung eines Informationssystems noch Einrichtungen benötigen, die
Bild 1.2.2 Das Informationssystem als Summe formalisierter Kommunikationsprozesse
1.2 Das Informationssystem
9
den Systemcharakter betonen. Besonders deutlich wird dies am Phänomen der Datenbank, die sinnvoll erst dann definiert und gefordert werden kann, wenn mehrere Teilnehmer zur gemeinsamen Kommunikation einen Systemverband eingehen. Der Schritt vom Kommunikationssystem zum Informationssystem bedeutet faktisch eine Einengung. In der überwiegenden Mehrzahl der praktischen Fälle, etwa innerhalb eines Unternehmens, wird es wohl kaum möglich oder sinnvoll sein, alle auftretenden Kommunikationsprozesse zu formalisieren. Man muß sich vorstellen, daß ein (formalisiertes) Informationssystem in ein Kommunikationssystem eingebettet ist.
1.2.2 Vom Informationssystem (IS) zum computerorientierten Informationssystem (CIS) Die Formalisierung von Kommunikationsprozessen kann von unterschiedlichem Umfang sein. Einerseits wird man nicht in allen Fällen darauf abheben, ein Kommunikationssystem bis in alle Feinheiten formal zu erhellen und durchaus einen wohl definierten oder auch zwangsläufig vorhandenen Spielraum zu belassen. In vielen Fällen aber wird man die Formalisierung so weit durchfuhren, daß es möglich ist, die Regeln und die „Formeln", die das Profil eines Informationssystems bestimmen, so präzise festzulegen, daß man für den zeitdynamischen Ablauf der Kommunikationsprozesse Computerprogramme schreiben kann. Dann wird aus dem Informationssystem das „computerorientierte Informationssystem (CIS)". Wenn wir im Verhältnis zwischen einem Kommunikationssystem und einem Informationssystem davon gesprochen haben, daß das eine in das andere eingebettet ist, so gilt es weit mehr noch für das computerorientierte Informationssystem im allgemeinen Informationssystem. Bei der Betrachtung der Grenzen stoßen wir auf einen interessanten Sachverhalt. Der Weg von einem System in ein anderes führt über Nachrichten oder Mitteilungen, über spezielle Kommunikationsprozesse. Der Träger solcher Prozesse wird beim Übergang vom KS zum IS im allgemeinen ein Mensch sein können oder ein auf den Menschen ausgerichteter Mitteilungsträger. Dort aber, wo dieser Übergang von einem IS in ein CIS führt, steht auf der einen Seite ohne Zweifel ein Mensch, den wir auch weiterhin als Teilnehmer bezeichnen wollen. Auf der anderen Seite aber findet sich eine instrumenten ausgebildete Einrichtung, die vom Teilnehmer eine Nachricht entgegennimmt oder eine Nachricht an einen Teilnehmer abgibt. Die Brücke ist in jedem Falle eine Nachricht, die sowohl deskriptiv als auch imperativ sein kann, wenn man im CIS etwa Vorgänge abwickeln oder wenn das CIS den Teilnehmer zu irgendwelchen Handlungen veranlassen will. Man spricht dabei von Mensch-Maschinen-Beziehungen und man meint damit die Summe der Einrichtungen, die es dem Teilnehmer
10
1. Die Grundlagen des computerorientierten Informationssystems (CIS)
ermöglicht, mit dem System zu kommunizieren, die es andererseits aber auch dem System ermöglicht, mit dem Teilnehmer zu kommunizieren. Zwar kommen in der Praxis der Informationssysteme und der computerorientierten Informationssysteme solche Mensch-Maschinen-Beziehungen eine eminent wichtige Bedeutung zu, aber sie besteht vorwiegend in der fachgerechten Programmierung von Computern zum Betrieb von Datenendstationen oder sonst irgendwie ein- und ausgebenden Geräten. Vom Standpunkt einer formalsyntaktischen Analyse wird diesen Mensch-Maschinen-Beziehungen kaum eine wesentlichere Bedeutung zukommen, als den Nachrichten im CIS überhaupt. Wir nennen im folgenden alle Einrichtungen, die außerhalb des CIS Nachrichten liefern oder entgegennehmen, die Teilnehmer des Systems mit den im letzten Abschnitt
Mensch-SystemBeziehungen Mensch-MaschinenBeziehungen Bild 1.2.1 Die Einbettung des CIS
1.3 Betriebssystem und Time-Sharing
11
getroffenen formalen Festlegungen. Alle im CIS liegenden Einrichtungen aber nennen wir seine Elemente. Diese Elemente lassen sich klassifizieren. Auch sie nehmen deskriptive und/oder imperative Nachrichten entgegen und/oder erzeugen oder verarbeiten solche. Sie bilden insgesamt eine geordnete, endliche Menge, die aus Teilmengen besteht. Bezeichnen wir das j-te Element im CIS mit dem Symbol Ej, so können wir die Mensch-Maschinen-Beziehungen folgendermaßen formal beschreiben: NI T fSI =>
=> E-
NI E- =» => T fE^ J ND ' Mit diesen informationellen Beziehungen, mit diesen formalisierten Kommunikationsprozessen, ist das CIS mit dem IS verzahnt, in das es eingebettet ist. In Bild 1.2.1 ist symbolhaft dargestellt, wie sich das KS, das IS und ein CIS gegenseitig enthalten. Die Brücken zwischen den Systemen sind dabei Nachrichten oder allgemeiner ausgedrückt, Mensch-Maschinen-Beziehungen, wenn es sich um die Grenzen zwischen IS und dem CIS handelt.
1.3 Betriebssystem und time-sharing 1.3.1 Die historische Situation Der Computer ist unter Einschluß der Datenfernverarbeitung ein Gerät, das Informationen sowohl verarbeiten als auch vermitteln und verwalten kann. Das computerorientierte Informationssystem ist nachgerade eine Systemausprägung, bei dem alle diese Fähigkeiten des Computers in wohlausgewogenem Umfang Verwendung finden sollen. Betrachtet man jedoch die historische Entwicklung in der Anwendung der Datenverarbeitung, so stellt man fest, daß der Schwerpunkt im Einsatz des Computers heute vorzugsweise immer noch in der Verarbeitung von Informationen (Daten) und nur zu einem geringen Anteil in der Vermittlung von Informationen und Nachrichten zu sehen ist. Am deutlichsten wird dies im kommerziellen Bereich sichtbar, wo man auch heute noch weitgehend Schubverarbeitung betreibt. Man geht nur sehr zögernd auf komplexere Anwendungen über, in die Arbeitsvorgänge aufgelöst sind und bei denen die Potenz des Computers dem Benutzer nicht über die EDV-Abteilung, sondern über Datenendstationen zur Verfügung steht. So ist es nicht verwunderlich, daß die heutigen Betriebssysteme als Mittler zwischen Benutzer (EDV-Abteilung) und Computer, vorzugsweise auf Schubverarbeitung ausgerichtet sind.
12
1. Die Grundlagen des computerorientierten Informationssystems (CIS)
Man kommt bei Betriebssystemen dieser Art sehr wohl mit einer Betriebsweise aus, bei der sich mehrere Programme in das System teilen (Multiprogramming) und die Zuteilung der Rechnerkapazität zu den einzelnen Programmen erfolgt nicht zeitbezogen, sondern nach festgelegten Prioritäten und einem Austausch aktueller Programme, der jeweils erzeugt wird, wenn ein Programm, das gerade den Rechner beansprucht, zur Peripherie Kontakt aufnimmt und etwa einen langsameren Geräteteil beansprucht, der unabhängig vom Gerätezentrum gesteuert werden kann (Kanalprinzip). Versuche, sich von dieser Art der prioritätengesteuerten Computerbenutzung freizumachen, sind früh bekannt geworden, und zwar unter dem Terminus „time-sharing". Am bekanntesten ist dabei das System MAC (Multiple Access Computer) des Massachusetts Institute of Technology (MIT) geworden, das über 300 Teilnehmern aus 15 Laboratorien mit einem sehr potenten Computer verbindet. Es soll hier nicht die Geschichte des „time-sharing" nachgezeichnet werden [dazu 36; 8; 14], bemerkenswert erscheint nur, daß der Schwerpunkt der Anwendungen von „time-sharing" im Bereich technischer und wissenschaftlicher Datenverarbeitung lag. Der Anwendungsbereich kommerzieller und kaufmännischer Datenverarbeitung berichtet bis heute nur zögernd über komplexe „time-sharing"-Systeme, bei der sich die Aufteilung der Computerkapazität nicht in der Weise ergibt, wie wir dies oben geschildeter haben, sondern vielmehr dadurch, daß jedem Benutzer ein Anteil an der Rechenzeit des Systemes umschichtig zugeteilt wird. Dabei werden gegebenenfalls sehr komplizierte Algorithmen herangezogen, um jedem Benutzer einen gerechten Zeitanteil zuordnen zu können. Der Benutzer erhält im „time-sharing"-Betrieb eine „Zeitscheibe" (time slice), die ihm individuell zugeordnet wird, während der er jeweils über das Zentrum des Systems verfugt. Dieses Verfahren ist im technischen und im wissenschaftlichen Anwendungsbereich konsequent, weil dort vorwiegend Probleme auftreten, die das Zentrum des Rechners stark in Anspruch nehmen und wenig intensiv in der Benutzung der Peripherie sind. In dem Software-Angebot, das zum Arbeitsbereich „time-sharing" heute verfügbar ist, scheinen schlechte Erfahrungen verarbeitet zu sein, die offensichtlich auftraten, als man den Versuch unternahm, mit „time-sharing" in den Bereich der kaufmännischen Datenverarbeitung einzudringen. Hier hat man eine Situation, die dadurch gekennzeichnet ist, daß einer geringeren Beanspruchung des Computerzentrums eine relativ starke Auslastung der Peripherie oder Teilen der Peripherie gegenübersteht. Dabei kann in der Zuweisung des Computerzentrums und in der Übergabe des Systemzentrums von einem Benutzer zum nächsten in der umschichtigen Weise des „time-sharing" soviel Administration auftreten, daß ein effizienter Betrieb des Systems nicht mehr stattfindet. Jedenfalls sind nichtpublizierte Erfahrungen bekanntgeworden, bei denen der Verwaltungsaufwand (systems overhead) solcher Systeme unerträglich groß wurde und zur Preisgabe von Systemprojekten geführt haben soll. Aus dieser
1.3 Betriebssystem und Time-Sharing
13
Zeit stammt die Vermutung, daß man es bei der Anwendung von „timesharing" im kommerziellen Bereich mit einem Saurierproblem zu tun habe, mit einem Problem also, das an seiner eigenen Größe stirbt. Neuere Erfahrungen, etwa mit dem System CALL von IBM, das sich einer zunehmenden Beliebtheit auch im kommerziellen Bereich erfreut, weisen jedoch darauf hin, daß diese These in bezug auf die gesamte Problematik zu einseitig ist. Andererseits steckt hinter der Suche nach einer anderen Strukturierung der Anwendung der Datenverarbeitung im kaufmännischen und administrativen Bereich mehr, als nur das Bedürfnis, neue Arbeitsgebiete zu erschließen. Die Handhabung der Computer in einem auf Schubverarbeitung ausgerichteten Rechenzentrum, das eine gewisse Größenordnung überschreitet, ist so komplex und kompliziert geworden, daß man bereits von hier aus gezwungen ist, neue Wege zu suchen. Auch ist der Zugang zu Computerkapazität und zu den eigenen Daten über eine Fachabteilung, deren Führung im Unternehmen mit sehr ernsten Problemen verbunden ist, für den Benutzer oft unzumutbar geworden. Die Problematik, die sich mit der Fachabteilung EDV in vielen Unternehmen auftut, ist heute so schwierig, daß oft neue Anwendungen blockiert und bereits vorhandene Anwendungen unbefriedigend geworden sind. Auch an dieser Stelle entsteht das Bedürfnis nach neuen Wegen in der Nutzung des Computers, die man in der Fachwelt noch relativ unreflektiert mit dem Terminus Informationssystem belegt.
1.3.2 Schubverarbeitung, Teilnehmer und Teilhaber Systeme wie etwa das „Information Management System (IMS)" von IBM oder das „Integrated Data Store (IDS)" von Bull-General Electric versuchen, über komplexe Steuerungs- und Verwaltungssysteme Teilhabersysteme aufzubauen, die mit einer sehr zentralen Datenverwaltung versehen sind. Solche Systeme lassen sich zwischen Schubverarbeitung und „time-sharing" einordnen. Wir werden in Abschn. 4.1, wo wir uns mit der Typisierung von Informationssystemen befassen, feststellen, daß hier vorwiegend Anwendungsgesichtspunkte sprechen. Es sei noch einmal darauf hingewiesen, daß sich alle diese Informationssysteme jeweils aus Moduln oder Komponenten aufbauen, die in einen gemeinsamen Betrachtungsbereich gehören. Sie definieren sich als individuelle Systeme jeweils aus spezifischen Forderungen. Unverkennbar ist die Tendenz der heutigen Datenverarbeitung, die dahingeht, daß die Computer in einem wohlausgewogenen Verhältnis Informationen und Nachrichten nicht nur verarbeiten, sondern auch vermitteln und verwalten (Datenbank). Erst dann entsteht das, was man sinnvollerweise mit „Informationssystem" meinen kann, wobei wir nicht ohne Bedacht eine Einschränkung angebracht haben und vom „computerorientierten
14
1. Die Grundlagen des computeroiientierten Informationssystems (CIS)
Informationssystem (CIS)" sprechen. Diesen Systemen sind vorwiegend zwei Eigenschaften eigen. Einmal ist die Peripherie des Computers über Datenfernverarbeitung um Stationen erweitert, denen ein hohes Maß an Selbstständigkeit zukommt. Man spricht dabei auch von Teilnehmersystemen (remote Computing). Zum anderen handelt es sich um einen echten Systemverbund, der etwa dadurch zum Ausdruck kommen kann, daß eine gemeinsame Datenbank vorhanden ist. In diesem Zusammenhang spricht man gerne von Teilhabersystemen. Auch sind die Systeme so konfiguriert und implementiert, daß eine Konversation zwischen dem Systemzentrum und den Stationen und vor allem den Stationen untereinander zustande kommen kann. In diesem Sinne spricht man heute übergeordnet von interaktiven Systemen. Wir werden später sehen, und dies ist eine wesentliche Zielsetzung des Buches, daß sich auf der Basis einer hinreichend klaren Terminologie sowohl Datenbanken als auch Informationssysteme klassifizieren und typisieren lassen. Die in diesem Kapitel geschilderten Probleme ordnen sich dann zu einer sinnvollen Betrachtungsweise, von der wir jetzt schon sagen können, daß sie noch nicht vollständig sein kann.
1.4 Aspekte des computerorientierten Informationssystems (CIS) Für eine weitere formale Vertiefung des CIS ist es erforderlich, eine Reihe von Aspekten zu erörtern und zu definieren, die teilweise bereits in [21] und auch sonst in der Literatur auftreten. Unter den vielfältigen Aspekten, die im Zusammenhang mit dem CIS zur Diskussion stehen, sollen uns nur solche interessieren, die eine Auswirkung auf die Gestaltung von Software-Systemen haben oder die vom formal-syntaktischen Standpunkt aus, wesentlich sind. Insbesondere soll es sich dabei um die Aspekte handeln, die mit folgenden Stichworten skizziert sind: - Initiative - Orientierung - Spezialisierung - Nachrichtenart - Nachrichtenverwaltung - Datenverwaltung und zwar jeweils im CIS. Die Initiative eines Informationssystems ist gekennzeichnet durch das Begriffspaar aktiv und passiv. Ein Informationssystem ist aktiv in bezug auf einen Teilnehmer, wenn es ihn aus eigener Initiative mit Nachrichten versorgt, die im allgemeinen deskriptiver Natur sind. Das System ist passiv, wenn es Nachrichten, die auch wieder vorwiegend deskriptiv sein werden, nur auf Anfrage
1.4 Aspekte des computerorientierten Informationssystems (CIS)
15
zur Verfügung stellt. Gelegentlich findet man für das aktive Informationssystem auch die Bezeichnung Bringsystem, für das passive Holsystem. Beide Aspekte verbinden sich im Begriff konversationeil, der so grundsätzlich geworden ist, daß wir ihn im nächsten Kapitel noch ausführlicher diskutieren werden. Ein Synonym für konversationeil ist das Wort interaktiv in diesem Sinne. Systeme, die ausschließlich aktiv oder passiv sind, sind selten und verweisen auf einen mehr konventionellen Standpunkt. Die Orientierung eines Systems nimmt daruf Bezug, ob der Teilnehmer durch eine Aktion, später werden wir von Transaktionen sprechen, am System erreichen kann, daß sich die Daten des Systems, vorzugsweise etwa die Daten der Datenbank, verändern oder nicht. Ein System, dessen Teilnehmer aus dem System nur deskriptive Nachrichten entnehmen können, heißt informationell. Ein System dessen Teilnehmer die Daten im System durch Nachrichten verändert, in dem sie etwa erreichen, daß eine deskriptive Nachricht in die Datenbank übernommen wird, oder daß die Datenbank über eine imperative Nachricht verändert wird, heißt operationelles System. Zwar gibt es in der Praxis rein informationelle Systeme, wie etwa das Auskunftssystem der Deutschen Bundespost, das über Telefonnetz zu erreichen ist, aber im allgemeinen wird man wohl mit einem Verbund beider Aspekte rechnen müssen. Der Aspekt der Spezialisierung eines Informationssystems bezeichnet einen für die praktische Dimension sehr bedeutsamen Sachverhalt. Ein Informationssystem heißt spezialisiert oder gerichtet, wenn es mit einem eingeschränkten und vordefinierten Repertoire an deskriptiven und imperativen Nachrichten arbeitet und wenn es dem Teilnehmer nicht möglich ist, Nachrichten zu erhalten, die über dieses Repertoire hinaus möglich wären. Wir werden im Zusammenhang mit der Datenbank auch eine spezialisierte Datenbank kennenlernen, und vor allem den Begriff der absoluten Datenbank und dem sie umgebenden absoluten Informationssystem eine klare Deutung geben können (s. Kap. 3). Das absolute Informationssystem jedenfalls kennt keine Einschränkungen im Hinblick auf seine Nachrichten, es erlaubt die Gewinnung aller Nachrichten, die nach den syntaktischen Regeln des Systems gewonnen werden können. Beispielsweise kann man in einem absoluten System etwa die Datenelemente der Datenbank unbeschränkt zu deskriptiven Nachrichten zusammenfugen, was in einem spezialisierten System nicht möglich ist. Während ein Informationssystem aktiv, passiv oder konversationeil, informationell oder operationeil sein kann, ist die Spezialisierung eines Systems keine feste Eigenschaft. Vielmehr kann es sich bei der Spezialisierung sehr wohl um einen fortschreitenden Prozeß handeln, bei dem man mehr und mehr Formalisierungen von Kommunikationsprozesses vornimmt und diese spezialisiert in das System übernimmt. Insbesondere kann der permanente Ausbau eines CIS in einem umfassenden Informationssystem so beschaffen sein, daß man abso-
16
1. Die Grundlagen des computerorientierten Informationssystems (CIS)
lute Komponenten durch gerichtete, spezialisierte und formalisierte Kommunikationsprozesse ersetzt, weil im Verlauf des Ausbaus eines solchen Systems sichtbar wird, welche informationellen Zusammenhänge im Informationssystem (IS) oder gar im Kommunikationssystem (KS) bestehen. Dem Prozeß der Spezialisierung kommen also beim Aufbau von Informationssystemen eine grundsätzliche Bedeutung zu. Andererseits darf man nicht annehmen, daß das CIS nicht absolut sein könnte. Es ist sehr wohl möglich, auch im CIS absolut zu informieren. Ein besseres Verständnis wird für diesen Aspekt der Leser erhalten, wenn wir dem Begriff der Datenbank eine feste Bedeutung gegeben haben. Wir hatten bereits festgelegt, daß wir mit wenigstens zwei Typen von Nachrichten im Informationssystem zu rechnen haben, und zwar sind dies die formatfreien Nachrichten einerseits und die formatierten Nachrichten andererseits (s. 1.1.3). Die Unterscheidung zwischen diesen Nachrichtenarten scheint so grundsätzlich zu sein, daß formatfreie Nachrichten in formatierten Systemen eine ausgesprochen untergeordnete Rolle spielen und umgekehrt. Auch diese Unterscheidung überträgt sich auf die Datenbank, denn Datenbanken, die formatierte und unformatierte Datenelemente gleichberechtigt behandeln, sind bis heute nicht bekannt geworden. Jedenfalls haben wir mit der Nachrichtenart einen weiteren Aspekt für Informationssysteme. Vor allem für Nachrichten, die in das System eingehen und die das System verlassen, die also auf Verhältnisse stoßen, die vom CIS nicht direkt gesteuert werden, ist der Aspekt der Nachrichtenverwaltung von wesentlicher Bedeutung. Ist eine Nachrichtenverwaltung nicht vorhanden, so treffen eingehende oder abgehende Nachrichten direkt auf das System bzw. den Teilnehmer. Dies ist der Aspekt der direkten Nachrichtenverwaltung. Die Alternative dazu ist die gepufferte Verwaltung von Nachrichten in Warteschlangen. Sie ist bei komplexen Systemen unumgänglich und heute im allgemeinen auch anzutreffen. Manche Systeme treffen einen erheblichen Aufwand für diesen Aspekt, vor allem dort, wo vermieden werden muß, daß eine Kommunikation deshalb nicht stattfindet, weil ein Systemteilnehmer, der im Moment angesprochen werden soll, belegt ist. Sowohl den deskriptiven als auch den imperativen Nachrichten ist es eigen, daß sie im System nur eine relativ kurze Verweildauer haben. Wir haben den Nachrichten von ihrer Definition her mehr den Charakter des Durchgehens, als den des Verweilens zugeordnet. Wenn wir nun von Datenverwaltung sprechen, so meinen wir die Administration derjenigen Informationen, die im System verfügbar, auffindbar und gegebenenfalls verwertbar sind. Sie sind in diesem Sinne zu trennen von durchgehenden Nachrichten oder von solchen Nachrichten, die im System verbraucht werden. Ihre Charakterisierung erfolgt präziser im Zusammenhang mit der Datenbank, die vornehmlich der Ort ihrer Verwahrung ist. Sofern wir von einer Datenbank sprechen, meinen wir eine
1.5 Konversation im computerorientierten Informationssystem (CIS)
17
zentrale Verwaltung solcher Daten, im Gegensatz zur dezentralen Verwaltung in Beständen, die jeweils auf einen Benutzer oder eine Benutzergruppe ausgerichtet sind. Die getroffenen Festlegungen für besondere Aspekte in einem Informationssystem sind vorwiegend software-relevant. Dies wird sich im weiteren Verlauf unserer Betrachtung erweisen. Sie sind darüberhinaus von erheblich praktischer Auswirkung. In [21] ist eingehend dargestellt, inwiefern praktische Probleme angesprochen sind, wenn es darum geht, unterschiedlichen Aspekten auf dem Arbeitsgebiet „Informationssystem" zur Realisierung zu verhelfen. Daß sich dabei unterschiedliche Eigenschaften aus unterschiedlichen Aspekten zu unterschiedlichen Informationssystemen formen, ist naheliegend. Wir haben also bereits hier einen Punkt erreicht, wo wir die Aussage machen können, daß eine Differenzierung und vielleicht auch eine Typisierung von Informationssystemen möglich ist, und wir haben damit eine gewisse Allgemeinheit des Begriffes Informationssystem gebrochen.
1.5 Konversation im computerorientierten Informationssystem (CIS) 1.5.1 Interaktive Informationssysteme Wir wollen den Aspekt der Initiative vor allem im Hinblick auf „Konversation" noch weiter vertiefen. Die Begriffe aktiv und passiv, in die wir die Initiative eines Informationssystems zerlegt hatten, nehmen Bezug auf das Verhältnis eines Teilnehmers zum Informationssystem. Sie beziehen sich also vorzugsweise auf die Mensch-Maschinen-Beziehungen eines solchen Systems. So steht der in 1.3 festgelegte Nachrichtenfluß
-
z
^
für eine momentane, passive Initiative und die Beziehung
steht für eine momentane aktive Initiative des Systems, wobei wir, was die Richtungen der Beziehungen betrifft, uns auf den Standpunkt gestellt haben, als wären wir innerhalb des CIS, das wir schließlich analysieren. Zwar findet man heute noch häufig Informationssysteme, in denen aktive und passive Beziehungen getrennt sind, aber die Tendenz zu kombinierten aktiv/
18
1. Die Grundlagen des computerorientierten Informationssystems (CIS)
passiven, also zu konversationeilen Nachrichtenflüssen in einem Kommunikationsprozeß ist kaum zu übersehen. Die verschiedenen Arten der Konversation ergeben sich einmal daraus, wie die aktiv/passiven Komponenten einer Konversation aufgebaut sind, welche Nachrichten also beteiligt sind, und zum anderen, wie und in welcher Aufeinanderfolge die aktiv/passiven Komponenten der Konversation aufeinanderfolgend kombiniert sind. Beispiele für spezielle Konversationen werden sich im nächsten Kapitel ergeben, wenn wir die Elemente des Systems durch entsprechende Nachrichten formal verbinden können. Zu dieser Auffassung einer Mensch-Maschinen-Konversation kommt noch die spezielle Version der Vermittlung von Nachrichten, evtl. unter Einschluß von Verarbeitung, was formal bedeutet, daß die vom System abgehenden Beziehungen einen anderen Teilnehmer betreffen, als die in das System eingehenden Nachrichten. T n ( S ) bezeichnet dann einen anderen Teilnehmer als T n ( E ) , n im obigen Schema wird also variieren können und ebenso j. Für diesen umfassenderen Konversationsbegriff im Bereich der Mensch-Maschinen-Beziehung verwendet man heute auch das Wort „interaktiv", und es steht nicht entgegen, wenn man die computerorientierten Informationssysteme mit dem Begriff „Interaktive Informationssysteme" bezeichnet. Mehr als durch das Wort Konversation wird durch den Begriff interaktiv deutlich, daß die Absicht, computerorientierte Informationssysteme aufzubauen, mehr darin besteht, zu einem wohl ausgewogenen Verbund von Nachrichten und Geräten zu kommen, wobei der Schwerpunkt nicht nur auf der Verarbeitung von Daten, sondern vor allem einer benutzergerechten Aufbereitung von Nachrichten liegt.
1.5.2 Anfrage und Dialog In diesem Zusammenhang ist es sinnvoll, den Begriff der Anfrage oder der Direktanfrage gegenüber dem des Dialoges abzugrenzen. In Anlehnung an verfugbare Software-Systeme (wie etwa das „Generalized Information System" (GIS)) versteht man unter einer Direktanfrage oder Anfrage (Query) eine imperative Nachricht an das System, die eine deskriptive Nachricht anfordert, zu deren Ermittlung und Aufstellung Datenelemente in Beständen oder gar in einer Datenbank aufgesucht werden müssen. Eine zeitliche Dimension kann bei einer Anfrage nur mittelbar angesprochen sein, insofern man die Antwort so rasch als möglich wünscht. Andererseits muß man aber konzedieren, daß das Aufsuchen von Datenelementen gegebenenfalls Zeiten beansprucht, die zum Beispiel datenbankabhängig und oft nicht unerheblich klein sind [s. dazu 27], Demgegenüber steht der Dialog als eine Konversation mit dem System, wobei Bestände oder eine Datenbank nicht (etwa bei dem System „A Programming Language" (APL)) oder nur sehr gelegentlich angesprochen werden.
1.5 Konversation im computerorientierten Informationssystem (CIS)
19
Was in jedem Falle zur Verfügung steht, ist ein Arbeitsbereich im Arbeitsspeicher, der über imperative Nachrichten auch bibliothekarisiert werden kann, und der Programme oder Matrizen und ähnliche Datengebilde aufnehmen kann. Der Dialog besteht in einem unter Umständen sehr hochfrequenten Hin und Her zwischen den Elementen des Systems und dem Teilnehmer. Der Teilnehmer übermittelt vor allem im benutzergefiihrten Dialog die Informationen, die er benötigt. Gegebenenfalls modifiziert er auch seinen Arbeitsbereich. Der Teilnehmer gibt imperative und teilweise deskriptive Nachrichten an das System und erhält selbst vorwiegend deskriptive Nachrichten als Ergebnisse. Die formale Beschreibung von Anfragen und Dialog werden wir im nächsten Kapitel vornehmen, wenn wir die formale Struktur der Nachrichten und Elemente des CIS festgelegt haben [s. auch 22, 27].
2.
Elemente und Transaktionen im computerorientierten Informationssystem (CIS) — Theoretische Dimension des Problems —
2.1 Die Elemente des CIS 2.1.1 Eine Vorbemerkung Wenn wir im folgenden von den Elementen des CIS reden, so meinen wir auf der Ebene der jetzt anstehenden theoretischen Dimension des Problems logische und in sich selbständige, abgrenzbare Funktionsteile im System, die Nachrichten aufnehmen, weitergeben oder aufarbeiten. Im Sinne des hier unterstellten Systembegriffes handelt es sich dabei zuerst einmal um die Menge der Elemente, die die Systembasis darstellen. In ihr lassen sich endliche Untermengen angeben, die sich dadurch auszeichnen, daß ihren Elementen spezielle Funktionen, also spezielle Eigenschaften zukommen. Wir sind davon ausgegangen, daß ein System immer dann zustandekommt, wenn solche Elemente durch irgendwelche Beziehungen miteinander verbunden sind. In einem Informationssystem kommt die Verbindung dadurch zustande, daß zwischen den Elementen Nachrichten ausgetauscht werden, die sowohl deskriptiv (ND) als auch imperativ (NI) sein können. Für eine formale Beschreibung des Systems in seinem zeitbezogenen Ablauf ist es dabei wichtig, daß, wenn wir von einem Kommunikationsprozeß reden, wir dabei jeweils einen aktuellen Kommunikationsprozeß meinen. Daß das Gesamtsystem als Zusammenfassung aller potentiellen Kommunikationsprozesse angesehen werden muß, berührt einen anderen Horizont, auf den wir in einem späteren Kapitel zurückkommen. Wenn wir einmal von den Nachrichten im System absehen, so kann man noch zu einer weiteren Klassifizierung der übrigen Elemente des Systems kommen, indem man auf eine bestimmte Verbindungseigenschaft abhebt. Wie nennen ein Element monadisch, wenn es zu einem aktuellen Zeitpunkt t n oder im Sinne der Automatentheorie in einer endlichen, aber fortlaufenden Folge aktueller Zeitpunkte t n bis t n + k eine Nachricht annimmt oder abgibt, aber nicht beides gleichzeitig. Monadische Elemente im System sind vorwiegend Sender und Empfänger, also die Geräte der Ein- und Ausgabe. Dyadische Elemente des Systems nehmen zu einem Zeitpunkt oder wiederum zu einer definierten Folge von Zeitpunkten Nachrichten entgegen und geben gleichzeitig Nachrichten ab. Technisch gesehen handelt es sich dabei um Wandler. Logisch gesehen sind es vorwiegend transformierende Einrichtungen, wie etwa Compiler und Interpreten, aber auch Sammlungen aktivierbarer Prozeduren und Methoden.
2.1 Die Elemente des CIS
21
Es treten im System auch triadische Elemente auf, die entweder einen einfachen Eingang und einen zweifachen Ausgang, oder einen zweifachen Eingang und eine einfachen Ausgang haben. Dies sind zum einen die Bestände des Systems, zum anderen ist es die Datenbank. Wie wir bei der genaueren Betrachtung und Definition der Nachrichten im CIS sehen werden, erfolgt im Falle des CIS die Ablaufsteuerung in der Zeitbezogenheit des Systems nicht ausschließlich determiniert von einem Taktgenerator, der die im Sinne der Automatentheorie erforderlichen Zeitreihe liefert und der Taktgenerator des zentralen Computers wäre. Vielmehr kommen auch steuernde und zeitrelevante Einflüsse von außen. Dieser Aspekt wurde zum ersten Mal im Zusammenhang mit Betriebssystemen bekannt, als Steuerkarten auf das System zukamen, die im Ablauf des Systems das strenge und herkömmliche Automatenschema durchbrachen. Wir werden später sehen, daß es dem Teilnehmer möglich ist, über eine Kommandosprache auf das System Einfluß zu nehmen, der weit über das hinausgeht, was man im Zusammenspiel zwischen Programm und Taktgenerator gewohnt ist. Bei einem einigermaßen umfassenden CIS hat jeder Benutzer über die Kommandosprache, in der man eine Verallgemeinerung des Steuerkartenprinzips sehen kann, die Möglichkeit, den zeitbezogenen Ablauf in einer gewissen Weise zu takten. Dies ist vor allem bei konversationeilen Systemen ein wesentlicher Gesichtspunkt. Vom Standpunkt des Systems aus gesehen ist dies unter Umständen ein Übergang vom streng determinierten zum stochasitischen System. Wir wollen nun die einzelnen Elemente des CIS formal beschreiben. Es ist dabei unterstellt, daß sich die Elemente für eine spätere methodische und auch technische Betrachtungsweise und Dimensionierung des Problemes zusammenfassen und unterschiedlich realisieren lassen. Gerätetechnisch wird etwa eine Datenendstation sowohl senden als auch empfangen und zu einem gewissen Ausmaß, je nach „Intelligenz" der Station, auch einen Bestand führen können. Eine andere Zusammenfassung von Funktionen der einzelnen Elemente werden wir finden, wenn man software-relevante Zusammenfassungen vornimmt und durch entsprechende Programme zu den Moduln des Systems kommt. 2.1.2 Die Nachrichten im CIS Wir haben unterstellt, daß in unserem System ein und nur ein Alphabet von Zeichen definiert ist, aus dem sich die Nachrichten aufbauen lassen. Dieses Alphabet ist allen Teilnehmern bekannt und kann von allen Elementen des Systems übertragen und — soweit erforderlich — auch verarbeitet werden. Die bereits getroffene Unterscheidung nach deskriptiven und nach imperativen Nachrichten bedarf einer weiteren Vertiefung. Wie wollen jedoch zuerst noch einmal das allgemeine Nachrichtenschema in unserem Informationssystem formal betrachten.
22
2. Elemente und Transaktionen im computerorientierten Informationssystem (CIS)
Es seien Zj . . . z k die einzelnen voneinander verschiedenen Zeichen unseres Alphabetes A, die in praktischen Fällen mit den Zeichen des allgemeinen Alphabetes übereinstimmen und etwa aus den 26 Buchstaben, den 10 Ziffern und einer Reihe von Sonderzeichen bestehen. Sofern es bedeutsam ist, vor allem bei fließenden Nachrichten, führen wir in der Nachricht einen Zeitpunkt t k mit, zu dem die Nachricht besteht, oder einen Zeitzähler, der von einem Anfangsstand ausgehend auf den Zeitpunkt zählen kann, zu dem die zeitbezogene Nachricht aus dem System verschwindet oder in eine zeitlose Dimension rückt, wenn sie etwa in einem Bestand verwahrt wird. Eine Nachricht Nj hat also die allgemeine Gestalt Ni = N i ( z 1 . . . zj . . . z n , t k ) ;
zjGA
als einer Nachricht Nj, die sich aus den Zeichen zl . . . zn entnommen dem Alphabet A, aufbaut und die die Länge n hat und zum Zeitpunkt t k besteht. Im allgemeinen wird uns t k nicht interessieren. Fast immer wird es so sein, daß aus den Grundzeichen des Alphabets bereits Superzeichen gebildet sind, etwa in Form von Feldern, Feldinhalten, Schlüsselwörtern oder Konstanten, wie sie etwa im Zusammenhang mit höheren Programmiersprachen auftreten, die auch in Informationssystemen ihre wohldefinierte Stellung einnehmen. Wir bezeichnen solche Superzeichen mit Z t . . . Z m und wir weisen mit der Wahl dieser Bezeichnung darauf hin, daß ein relevanter Unterschied zwischen Zeichen und Superzeichen (beides sind letztlich Zeichen) eigentlich nicht besteht, wie dies auch innerhalb der Informationstheorie ausgesprochen wird [1], Superzeichen kommen im CIS auf verschiedene Weise zustande und bilden wieder ein Alphabet SA. Es kann eine feste Definition vorliegen, wie im Falle der bereits zitierten Felder, die mit datentechnischen Attributen versehen sind, oder auch im Falle fest vorgegebener Schlüsselwörter einer Programmiersprache. Superzeichen kommen aber auch dadurch zustande, daß syntaktische Regeln bestehen, die angeben, etwa im Falle der Konstanten in höheren Programmiersprachen, wie diese angeschrieben werden müssen. Eine Nachricht aus Superzeichen hat damit die Form Nj = N; (Zj . . . Zj . . . Z k ) ;
ZjSSA ,
wobei wir hier auf die Zeitbezogenheit verzichtet haben und die auftretenden Zj irgendeine Auswahl aus dem Alphabet der Superzeichen darstellen, wobei die Reihenfolge im allgemeinen wesentlich ist, und ein und dasselbe Z auch mehrfach auftreten darf. Der bis jetzt diskutierte Aspekt ist syntaktisch. Aus semantischen und pragmatischen Gesichtspunkten haben wir unterschieden zwischen deskriptiven Nachrichten von mitteilendem Charakter und imperativen Nachrichten, die dem Informationssystem Anweisungen übermitteln und die innerhalb des Systems verbraucht werden. Innerhalb der deskriptiven Nachrichten unterscheiden wir
2.1 Die Elemente des CIS
23
zwischen Listen und Datenelementen. Beide Typen von Nachrichten werden in unserem Zusammenhang im Sinne der in 1.4 festgelegten Unterscheidung als formatiert angesehen. Sie bestehen also aus einzelnen Feldern, die fest mit datentechnischen Attributen versehen sind und deren Anordnung in einem wohldefinierten Schema festliegt. Die Superzeichen einer solchen Nachricht sind also ausschließlich Felder, wie sie in Form von Kontenständen, Bezeichnungen, Abmessungen, Kennzeichen usw. in jedem Informationssystem auftreten. Der Aufbau der Nachrichten wird also nicht durch eine Syntax in Form einer Sammlung von Regeln erreicht, sondern er wird als Schema festgelegt. Damit ergibt sich als formale Darstellung zuerst einmal eine Form, die sich wie folgt beschreiben läßt: ND = N D ( F 1 . . . F m ) . Darin treten m Felder als Superzeichen auf, die eine deskriptive Nachricht bilden. Vornehmlich versteht man dabei etwa unter Fj nicht irgendein individuelles Feld, sondern einen Feld typ, und man geht davon aus, daß eine entsprechende Anzahl von Feldern vom Feldtyp Fj vorhanden ist, der durch entsprechende Attribute festgelegt, und der vor allem mit einem Namen versehen ist. Zu jedem Feldtyp gehört ein gewisser, dem Feld eigener Wertevorrat. Nimmt ein Feldtyp einen bestimmten Wert aus seinem Wertevorrat an, so nennt man diesen auch den Feldinhalt. Sind die Felder einer deskriptiven Nachricht alle vom selben Rang und rein aussagend, so spricht man auch von einer Liste oder einer Auswertung. Gibt es in einer Nachricht Felder, die einen zuweisenden Charakter haben, so nennt man diese Felder, wie wir noch sehen werden, Ordnungskriterien und die deskriptive Nachricht selbst, die wenigstens ein solches Ordnungskriterium enthält, ein Datenelement. Ist Wj k der k-te Wert aus dem Wertevorrat des Feldes Fj, der in allen CIS wegen der Digitalität des Systems eine endliche Menge ist, so kann man mit Fj (W j > k )
beschreiben, daß Fj den Wert Wj k angenommen hat. Schreibt man insbesondere L = L(ND, (F, (W1)(, . . . F m (W lfI )) ; (1 = 1 . . . n) , so hat man eine Liste im herkömmlichen Sinne in der mehrere Feldtypen vielfach auftreten, jedoch in gleichbleibender Anordnung für alle 1. Für jedes 1 erhält man eine Zeile der Liste, die selbst aus n Zeilen besteht. Die einzelnen Felder Fj bis F m werden im sogenannten Listenbild, sofern sie zusammengehören, horizontal und — sofern sie vom selben Typ sind — vertikal angeordnet. Es kann auch auftreten, daß ein Fj in einer Zeile fehlt und dann das Attribut „absent" oder den Inhalt „blank" hat. Ebenso kann es vorkommen, daß in einer Liste Zwischenzeilen erscheinen, etwa mit summierten Feldern,
24
2. Elemente und Transaktionen im computerorientierten Informationssystem (CIS)
deren formale Darstellung wir hier außer Acht gelassen haben. Listen und Auswertungen sind fast immer ausgabeorientiert. Anders liegen die Verhältnisse bei den Datenelementen. Sie sollen funktionell eine andere Rolle spielen als die Listen, die wir eben gezeigt haben. Sehr oft gibt es nämlich unter den in einer Nachricht auftretenden Feldern solche, die bevorzugt und die weniger informativ als klassifizierend oder zuweisend sind. Diese Felder dienen dazu, eine deskriptive Nachricht oder eine Klasse deskriptiver Nachrichten zu spezifizieren. Solche Felder heißen Ordnungskriterien, wir bezeichnen sie mit
OK n ist ein Ordnungskriterium vom Typ n. Sofern wir einem solchen Ordnungskriterium einen festen individuellen Wert M aus seinem Wertevorrat zuweisen, schreiben wir dafür auch OK n (M) . Im Hinblick auf das Aufsuchen von Nachrichten ist es sehr oft wichtig, einem solchen Ordnungskriterium nicht nur einen festen Wert, sondern einen Teilbereich seines Wertevorrates zuzuweisen. Diese Zuweisung geschieht über Bedingungen, denen ein Wertevorrat für M genügen muß. Diese Bedingungen ergeben sich, wie noch dargestellt wird, als komplexe Bedingungen, die aus Simplexbedingungen aufgebaut sind. Simplexbedingungen sind im Hinblick auf eine Nachricht und unter Bezugnahme auf ein oder mehrere Ordnungskriterien entweder wahr oder falsch. Durch Verwendung boolescher Verknüpfungssymbole entstehen daraus komplexe Bedingungen. Formal wollen wir eine solche komplexe Bedingung kennzeichnen mit K(OK n ) . Eine Erweiterung auf mehrere Ordnungskriterien wird sich später als notwendig erweisen. Ein Beispiel für K könnte etwa sein (OK n < M AND OK n > N) bzw. mit der Notation von Programmiersprachen: WHEN OK n LT M AND OK n GT N. Wir nennen eine deskriptive Nachricht ein einfaches Datenelement, wenn in ihm ein bevorzugtes Ordnungskriterium OK n enthalten ist. Bevorzugt bedeutet, daß dieses Ordnungskriterium unmittelbar verfügbar ist, wogegen weitere Ordnungskriterien nur mittelbar zur Spezifikation einer solchen Nachricht herangezogen werden können. In diesem Sinne nennt man dieses sogenannte Hauptordnungskriterium auch aktiv und alle anderen, die nicht zu einer Spezifikation herangezogen werden können, passiv. Dies bedeutet etwa, daß man eine Sammlung von einfachen Datenelementen zum Zwecke der Auswertung nach einem anderen als dem Hauptordnungskriterium umsortieren muß. Ein-
2.1 Die Elemente des CIS
25
fache Datenelemente sind immer nur im Hinblick auf ein und nur ein Ordnungskriterium spezifizierbar. Es soll DEj (OK n ) ein Datenelement vom Typ j sein, das einfach ist und dessen Ordnungskriterium vom Typ OK n ist. Mit der Angabe DEj ist festgelegt, welches sein Ordnungskriterium ist, und welches die Feldtypen (Superzeichen) sind, aus denen diese spezielle Nachricht aufgebaut ist. Man nennt j auch den Namen des Datenelementes, der zugleich für seinen Typ steht. Insbesondere bedeutet DEj(K(OK n )) die Spezifikation einer Menge (Untermenge) von Datenelementen des Types j gemäß einer komplexen Bedingung K für das Ordnungskriterium OK n . Ist ein Datenelement nicht nur über ein, sonder über mehrere Ordnungskriterien von unterschiedlichem Typ charakterisiert, sind diese also aktiv, so sprechen wir von einem komplexen Datenelement und wir bezeichnen es mit DEj (OK n . . . OK m ) als Datenelement vom Typ j, versehen mit den aktiven Ordnungskriterien OK n bis O K m , die im allgemeinen alle innerhalb einer komplexen Bedingung K(OK n . . . OK m ) auftreten können. Das in diesem Sinne spezifizierte Datenelement hat dann die allgemeine Gestalt DEj(K(OKn...OKm)). Wir bezeichnen damit wiederum eine Menge (Untermenge) spezifizierter Datenelemente vom Typ j, spezifiziert gemäß einer komplexen Bedingung, die sich auf die Ordnungskriterien OK n bis OK m bezieht. Der Sonderfall eines absoluten Datenelementes ist dann gegeben, wenn jedes Feld, das in einem Datenelement enthalten ist, zum Gegenstand einer Spezifikation, .wenn also jedes Feld im Datenelement potentiell zum aktiven Ordnungskriterium werden kann. Im absoluten Informationssystem treten, unter Bezugnahme auf 1.4, stets auch nur absolute Datenelemente auf. Die gegenüber den Ordnungskriterien nicht bevorzugten Felder der Datenelemente nennen wir ihre Werte Wj, wobei man sich unter Wj einen Feldtyp vorzustellen hat, der als Superzeichen „Feld" über einen entsprechenden Wertevorrat verfügt, wie jedes Feld (Variable). Ein Datenelement DEj läßt sich demnach darstellen als DE j = D E j ( O K n . . . O K m , W 1 . . . W k ) , prinzipiell also wiederum als Liste, jedoch mit einem differenzierten Aufbau. Wir werden später sehen, daß die Ordnungskriterien OK n in einem CIS eine feste Menge bilden, und daß jedes Ordnungskriterium selbst wieder einen eige-
26
2. Elemente und Transaktionen im computeiorientierten Informationssystem (CIS)
nen Wertevorrat hat, wie es seiner Eigenschaft, Feldtyp zu sein, entspricht. In jedem Typ Datenelement kommt eine gewisse Auswahl aus den Typen von Ordnungskriterien vor, aber so, daß nicht jeder Typ von Ordnungskriterium in jedem Typ von Datenelement auftritt. Auch die imperativen Nachrichten lassen eine weitere Differenzierung zu, die für das folgende von Bedeutung ist. Imperative Nachrichten sind im allgemeinen nicht formatiert, wie wir das bei den deskriptiven Nachrichten vorwiegend finden. Fast immer ist eine Menge von Superzeichen verfügbar (Schlüsselwörter und Konstanten), die sich nach vorgegebenen Syntaxregeln zu Nachrichten anordnen lassen. Für unsere Zwecke interessieren uns dabei vor allem zwei Typen von imperativen Nachrichten, die wir auch formal unterscheiden wollen. Im ersten Falle haben wir es mit Nachrichten zu tun, die in bezug auf das System anweisenden Charakter haben. Dies sind etwa die Programme, die von außen eingebracht werden, oder die auch im System residieren. Sie erzeugen letztlich bestimmte Auswertungen, oder genauer gesagt, deskriptive Nachrichten, entweder in Form von Listen oder Datenelementen. Wir nennen solche imperativen Nachrichten auch anweisend und bezeichnen sie mit dem Symbol NIA im Sinne der bereits getroffenen Festlegung für imperative Nachrichten. Ihnen stehen steuernde Nachrichten gegenüber, die einen Einfluß auf den Ablauf der Vorgänge im Informationssystem haben. Während die anweisenden imperativen Nachrichten vorzugsweise im Hinblick auf deskriptive Nachrichten verarbeiten, nehmen die steuernden imperativen Nachrichten auf den Systemablauf und auf die einzelnen Elemente des Systems Einfluß. Wir bezeichnen
imperative NI Nachrichten
Kommando
NIS
Transaktionscode
TC
Programm Programmteil
NIA
anweisend
Nachrichten im CIS
einfach Spezifizierbar - Datenelement - komplex absolut
deskriptive ND Nachrichten informativ - Liste Auswertung Text Bild 2.1.1 Nachrichten im CIS
DE: (OKn) DE; (OKn...OKm)
2.1 Die Elemente des CIS
27
solche steuernden imperativen Nachrichten mit dem Symbol NIS. Beide Typen von imperativen Nachrichten kommen im allgemeinen dadurch zustande, daß entsprechende Zeichen (Superzeichen) unter Beachtung entsprechender Regeln verwendet werden. Im Falle der Nachrichten vom Typ NIA spricht man unter Bezugnahme auf die Syntax von Programmier-, Anfrage- oder Dialogsprachen, beim Typ NIS hat man es entsprechend mit Kommandosprachen zu tun. Beide Nachrichtentypen treffen sich gelegentlich. Führt man nämlich fertige Programme innerhalb des Systems, so werden diese Programme durch irgendeinen Code gekennzeichnet, den man auch den Transaktionscode nennt. Das zu einem Transaktionscode gehörende Programm ist in der Lage, eine entsprechende Transaktion abzuwickeln. Will man ein solches Programm aktivieren, so gibt man eine geeignete Steueranweisung an das System, die in einfachen Fällen lediglich aus dem Transaktionscode selbst besteht. Er steht dann für eine steuernde und für eine anweisende imperative Nachricht. Ein Codezeichen aus einem solchen Transaktionscode werden wir später mit TC bezeichnen. Man wird sich im allgemeinen eine Nachricht, die von einem Systemelement zu einem anderen fließt, so vorstellen müssen, daß sie eine Kombination von steuernden, anweisenden und deskriptiven Nachrichten ist. Die hier aufgezeigten Nachrichten in einem CIS sind in Bild 2.1.1 zusammengefaßt.
2.1.3 Die Teilnehmer im computerorientierten Informationssystem Wir haben bereits deutlich gemacht, daß es innerhalb des CIS (menschliche) Teilnehmer nicht gibt. Sie gehören vielmehr in den Bereich des umgebenden Informationssystemes IS. Wir wollen noch einmal festhalten, wie der formale Anschluß dieser Teilnehmer stattfindet. Die Teilnehmer sind in bezug auf das System aktiv, insofern sie einen Vorgang im Informationssystem, etwa einen Transfer von Nachrichten auslösen können; sie sind passiv, wenn ein solcher Vorgang in ihnen endet. Diese Begriffe schließen an die in 1.4 dargestellten Aspekte von Informationssystemen an, wo wir von der Initiative des Systems gesprochen haben. Jedenfalls ist der Teilnehmer im Sinne der im letzten Paragraphen gegebenen Definition monadisch. Allerdings kann er jeweils von Senden auf Empfangen und von Empfangen auf Senden umschalten. Dieses Umschalten kann hochfrequent erfolgen, wenn es sich etwa um Dialoge handelt. Für den Empfangszeitpunkt ist er jedoch stets Empfänger, ebenso wie er für den Sendezeitpunkt Sender ist. Das in 1.2 festgelegte Grundschema für die Mensch-Maschinen-Beziehung, die wir jetzt besser Teilnehmer-Maschinen-Beziehung nennen, ist für unsere weitere Betrachtung also gültig. Von den Nachrichten her gesehen kann ein Teilnehmer an einen Sender des CIS sowohl imperative als auch deskriptive Nachrichten sowie Kombinationen geben. Von den Empfängern des Systems wird er vorzugsweise deskriptive Nachrichten ent-
28
2. Elemente und Transaktionen im computerorientierten Informationssystem (CIS)
gegennehmen. Gelegentlich wird ihn das System jedoch auffordern, eine bestimmte Aktion vorzunehmen oder es wird ihn im Falle eines eingegebenen Fehlers auffordern, diesen zu beseitigen. Dies wäre dann eine für den Teilnehmer bestimmte imperative Nachricht. Wir bezeichnen die Teilnehmer des Systems entsprechend unserer Festlegung in 1.2 im Falle des Abgebens einer Nachricht an das System mit T, (S) und im Falle der Entgegennahme von Nachrichten aus dem System mit Tj (E). Die Funktion T; (S) nennt man auch „Eingeben in das System". Die Funktion Tj (E) ist vom System aus gesehen eine Ausgabefunktion. Wir möchten noch einmal darauf hinweisen, daß die Begriffe Senden und Empfangen klar darauf hinweisen, daß wir für die Analyse des Systems einen Standpunkt einnehmen, als wären wir innerhalb des CIS. 2.1.4 Die Eingabe im CIS (Sender) »»
Die Sender im CIS sind Elemente, die wir zur Peripherie des Systemes rechnen und die Nachrichten vom Teilnehmer übernehmen und in einer technisch geeigneten Form in das System senden (eingeben). Senden ist also eine auf das System ausgerichtete Funktion. In diesem Sinne ist der Sender ein monadisches Element im System und wir bezeichnen den i-ten Sender mit Sj. Alle Sender fassen wir zur Menge der Sender als einer speziellen Untermenge der Systemelemente selbst zusammen: S = (Sj, i = 1 . . . I) . Mit der Definition des Senders als einem monadischen Element werden wir dem Umstand gerecht, daß die Grenze des CIS vor dem Teilnehmer und hinter dem Sender liegt. Der Sender gehört also mit zu den Elementen des Systems, die die Peripherie bilden. Die Nachrichten, die ein Sender sendet, können sowohl imperativ als auch deskriptiv sein. Beide Nachrichten können gemischt auftreten, wegen der monadischen Eigenschaft des Senders jedoch stets nur aufeinanderfolgend. Ist Ej das j-te Element im System und ist Ej kein weiterer Sender, so bezeichnen wir den Transfer vom Sender zum System mit der Notation: Ej O.
O Z