Datenverarbeitung im Dienste juristischer Dokumentation: Ein Arbeits- und Funktionsvergleich zweier Systeme [Reprint 2020 ed.] 9783112316771, 9783112305645


179 117 4MB

German Pages 65 [68] Year 1971

Report DMCA / Copyright

DOWNLOAD PDF FILE

Table of contents :
INHALTSVERZEICHNIS
Literaturverzeichnis
1. Die juristische Informationslawine
2. Elektronische Datenverarbeitung — ein neues Hilfsmittel für den Juristen
3. Grundtypen automatisierter juristischer Dokumentation
4. Vergleich der System-Grundtypen in der Praxis
5. Systembeschreibung CREDOC
6. Systembeschreibung UNIDATA
7. Praktischer Versuch: Speicherung und Aufbereitung des Materials
8. Praktischer Versuch: Formulierung der Fragen
9. Praktischer Versuch: Informationswiedergewinnung
10. Versuchsauswertung
Recommend Papers

Datenverarbeitung im Dienste juristischer Dokumentation: Ein Arbeits- und Funktionsvergleich zweier Systeme [Reprint 2020 ed.]
 9783112316771, 9783112305645

  • 0 0 0
  • Like this paper and download? You can publish your own PDF file online for free in a few minutes! Sign Up
File loading please wait...
Citation preview

Bernhard M. Prestel Datenverarbeitung im Dienste juristischer Dokumentation

EDV und Recht Band 3

1971

J. Schweitzer Verlag Berlin

Datenverarbeitung im Dienste juristischer Dokumentation Ein Arbeits-und Funktionsvergleich zweier Systeme von

Dr. jur. Bernhard M. Prestel Freiburg i. Br.

1971

v J. Schweitzer Verlag Berlin

ISBN 3 8059 0245 X

© Copyright 1971 by J. Schweitzer Verlag Alle Rechte, einschließlich des Rechtes der Herstellung von Photokopien und Mikrofilmen, vorbehalten Satz: Studio Feldafing - Druck: W. Hildebrand, Berlin

INHALTSVERZEICHNIS Literaturverzeichnis 1. Die juristische Informationslawine 2. Elektronische Datenverarbeitung - ein neues Hilfsmittel für den Juristen 3. Grundtypen automatisierter juristischer Dokumentation 4. Vergleich der System-Grundtypen in der Praxis 4.1 Versuchsmotivation 4.2 Versuchsanordnung 4.3 Versuchsmaterial 4.4 Versuchssysteme 4.5 Geplanter Versuchsablauf 5. Systembeschreibung CREDOC 5.1 Vorgeschichte 5.2 Dokumentationstechnik 5.3 Informationstechnik 6. Systembeschreibung UNIDATA 6.1 Vorgeschichte 6.2 Dokumentationstechnik 6.3 Informationstechnik 7. Praktischer Versuch: Speicherung und Aufbereitung des Materials 7.1 CREDOC 7.2 UNIDATA 7.3 Vergleich 8. Praktischer Versuch: Formulierung der Fragen 9. Praktischer Versuch: Informationswiedergewinnung 10. Versuchsauswertung

VII 1 . . 2 3 5 5 5 5 8 8 10 10 10 11 12 12 12 13 14 14 16 17 23 25 54

Literaturverzeichnis Breton, Jean-Maiie, Dennis, Sally F., Fraenkel, Aviezri S., Furth, Stephen E„ Haft, Fritjof, Hoffman, Paul S., Houtart, Edouard, Schreiber, Aaron,

Simitis, Spiros

„Indexation par motclés ou texte intégral" in: Law & Computer Technology, Juni 69, S. 24 ff. „The design and testing of a fully automatic indexing-searching system for documents consisting of expository text" in: Proceeding-Third annual colloquium, Phil. 1966, S. 67 ff. „Legal information retrieval" in: Advances in Computer 9, 1968, S. 123 ff. „Computers" in: Computers & the Law, second edition 1969, S. 26 ff. Elektronische Datenverarbeitung im Recht (EDV und Recht, Band 1), Berlin 1970 „Evaluating legal research services" in: Computers & the Law, second edition 1969, S. 51 ff. „Le droit et l'électronique" in: Law & Computer Technology, Juni 1969, S. 15 ff. „Computerized storage and retrieval of case law without indexing: The hebrew responsa project" in: Law & Computer Technology, Nov. 1969, S. 14 ff. „Informationskrise des Rechts und Datenverarbeitung", Karlsruhe 1970

Sammelveröffentlichungen und Verhandlungen ohne Verfasserangabe: „Die schweizerische juristische Datenbank", eine Veröffentlichung der Unidata AG, Zürich 1970 „Juristisches Informationssystem mit Hilfe der elektronischen Datenverarbeitung", Bericht der Arbeitsgruppe für Datenverarbeitung im Bundesministerium der Justiz vom 1. Februar 1970. Beilage zum Bundesanzeiger Nr. 41 vom 28. Februar 1970. „Le Credoc - déscription du système et réalisations actuelles", Bruxelles, Mai 1969 „Pour une organisation nationale de l'informatique juridique", Rapport du groupe de travail pour l'informatique juridique, Paris 1970 Verhandlungen des 48. Deutschen Juristentages. Mainz 1970 Band II (Sitzungsberichte) Teil T „Datenverarbeitung im Recht", München 1970

1.

Die juristische Informationslawine

Die Flut der für den Juristen bestimmten Fachinformationen nimmt von Jahr zu Jahr zu. Die Anzahl der Gesetze, veröffentlichten Entscheidungen, Kommentare und Lehrbücher wächst so schnell an, daß selbst der auf einen Rechtsbereich spezialisierte Richter oder Anwalt kaum alles ihn interessierende Material lesen und verarbeiten kann. Diese Situation, treffend als „Informationskrise des Rechts" 1 bezeichnet, wurde in letzter Zeit wiederholt mit alarmierendem Zahlenmaterial verdeutlicht 2 . Dem betroffenen Juristen mögen die genauen Ausmaße dieser Informationsfülle bis dahin unbekannt gewesen sein; mit dem Problem seiner eigenen „Nichtinformiertheit" hat er sich dagegen schon seit langem tagtäglich auseinanderzusetzen. Dies bestätigt eine vom Verfasser bei zwanzig Richtern, Staats- und Rechtsanwälten durchgeführten Umfrage. Bei 80 von hundert der von ihnen bearbeiteten Fälle sind die Befragten nicht sicher, alles zur Lösung des jeweiligen Problems wichtige Hilfsmaterial zusammengetragen zu haben. Darüber hinaus nimmt die Mehrzahl der Befragten in 50—60% aller Fälle bewußt eine Informationslücke in Kauf. Aus Zeitmangel ist ein Sammeln und Durcharbeiten der möglicherweise interessanten, aber in zahlreichen Zeitschriften und Büchern verstreuten Entscheidungen oder Lehrmeinungen unmöglich. Oft ist bereits der Zugang zu den Informationsquellen erschwert, da die Hausbibliothek nicht sämtliche Zeitschriften und Bücher führen kann. Es wird offen zugestanden, daß dieses Fehlen von Hilfsinformationen sich in nicht optimal fundierten Schriftsätzen und Urteilen niederschlagen kann. Eine umfassende Kenntnis der Auslegung des geltenden Rechts in Rechtsprechung und Literatur kann mit den gegenwärtigen Möglichkeiten nicht erlangt werden. Dies führt zu einer Häufung voneinander abweichender Entscheidungen und damit zu einer gewissen Unsicherheit für Rechtspraxis und Rechtsgefühl.

1 2

Spiros Simitis: Informationskrise des Rechts und Datenverarbeitung So z.B. im Bericht der Arbeitsgruppe für Datenverarbeitung im Bundesministerium der Justiz vom 1.2.1970; sielie dazu auch Simitis, S. 12 ff., Zahlenmaterial auf internationaler Ebene findet sich bei Haft, S. 102 ff. Da das Problem durch diese Veröffentlichungen umfassend dargestellt ist, erübrigt sich eine weitere Erörterung an dieser Stelle.

2

Elektronische Datenverarbeitung

Der Instanzenzug wird mit vermeidbarer Mehrarbeit beschwert. Die Überbelastung führt zu einer rechtspolitisch bedenklichen Schwerfälligkeit des Rechtsprechungsapparates3.

2.

Elektronische Datenverarbeitung — ein neues Hilfsmittel für den Juristen

Zur Bewältigung der ständig wachsenden Informationslawine konnte sich der Jurist auf bewährte Hilfen wie Fundhefte, Stichwort- und Leitsatzkarteien stützen. Bereits heute jedoch läßt sich das Überangebot an Informationen auch mit diesen Mitteln nicht mehr vollständig erfassen. Da die Informationsmasse immer weiter zunehmen wird, muß sich der Jurist rechtzeitig nach anderen, neuen Hilfsmitteln umsehen. Als zeitgemäßes Werkzeug bietet sich die elektronische Datenverarbeitung (EDV) an. Der Zugang zur Rechtswissenschaft wurde ihr zwar lange Zeit durch die auf den ersten Blick unüberbrückbar scheinende Kluft zwischen Jurisprudenz und Mathematik verwehrt. Inzwischen hat sich die Datenverarbeitung aber auch in anderen nichtmathematischen Disziplinen als Hilfsmittel bewährt, so daß auch der Jurist sich heute bereit findet, die psychologische Barriere abzubauen, hinter die er sich, von Ausdrücken wie Speicherkapazität, Zugriffsgeschwindigkeit und Rechenzeit geschreckt, zurückgezogen hat. Die Begegnung mit der neuen Hilfswissenschaft wird allerdings noch von zahlreichen Vorurteilen belastet. So besteht vielfach die Vision vom Computer als vollautomatischer, alles nach gleichem Schema behandelnder Richtermaschine, bei welcher oben die Tatbestandsdaten eingegeben und unten die Urteile entnommen werden können. Diese Vorstellung ist falsch. Der Jurist muß sein Verhältnis zur Datenverarbeitung auf reale Grundlagen stellen, indem er sich ein klares Bild über Fähigkeiten und Grenzen des Computers verschafft. Der Computer ist eine Weiterentwicklung herkömmlicher Rechenmaschinen.

3

So nennt die Statistik eines süddeutschen LG für die Anhängigkeit der in einem Quartal des Jahres 1970 erledigten Zivilsachen 1. Instanz folgende Zeiträume: bis einschließlich 3 Monate 38% über 3 Monate bis einschließlich 6 Monate 25% über 6 Monate bis einschließlich 12 Monate 22% über 12 Monate bis einschließlich 24 Monate 11% über 24 Monate bis einschließlich 36 Monate 3% über 36 Monate 1%

Grundtypen automatisierter juristischer Dokumentation

3

Mit Hilfe elektronischer Schaltungen kann er sehr schnell logische Operationen durchführen. Sein Einsatz bei der Dokumentation stellt sich stark vereinfacht folgendermaßen dar: Der Speicher des Computers wird mit Dokumentmaterial aufgefüllt. Buchstaben werden hierbei durch Zeichen, Worte durch Zeichenkombinationen ausgedrückt. Das Fassungsvermögen des Speichers, die Speicherkapazität, ist bereits heute außerordentlich groß und wird noch weiter entwickelt. Bei der Suche nach bestimmten Dokumenten, der Informationswiedergewinnung, werden dem Computer Suchbegriffe vorgegeben. Diese setzt er ebenfalls in Zeichen um und vergleicht sie mit dem gespeicherten Material. Bei Übereinstimmung gibt er die gefundenen Dokumente, die den Suchbegriff enthalten, aus. Der ganze Suchvorgang läuft mit hoher Geschwindigkeit ab und erfordert nur wenige Sekunden. Mit seinen Fähigkeiten kann der Computer dem Juristen die zeitraubende mechanische Suche nach Vorschriften Urteilen, Aufsätzen und Kommentaren abnehmen, nicht aber Denkentscheidungen. Die Güte und Brauchbarkeit dieser Hilfeleistung hängt entscheidend von der Qualität und Vollständigkeit des gespeicherten Materials ab. Der Computer kann nur solche Informationen liefern, die zuvor von ihm aufgenommen wurden. „If the Little Giant Pocket Encyclopedia is stored in a Computer, it cannot be transformed into the Encyclopedia Britannica on Output" 1 .

3.

Grundtypen automatisierter juristischer Dokumentation

Erste Versuche, die Datenverarbeitung im Gebiet juristischer Dokumentation einzusetzen, wurden vor etwa 20 Jahren in den Vereinigten Staaten angestellt. In der weiteren Entwicklung bildeten sich zwei Grundtypen automatisierter juristischer Dokumentation heran: — Systeme mit manueller Indexierung, die als Index-Systeme bezeichnet werden — Systeme mit maschineller Indexierung oder Volltext-Systeme. Systeme mit manueller Indexierung erfordern eine manuelle Analyse der zu speichernden Texte durch einen juristischen Textbearbeiter. Ergebnis der Analyse ist ein „Abstract", eine Stichwortliste, die den nach Meinung des Bearbeiters wesentlichen Gehalt der Textstelle wiedergibt. 1

Hoffmann, S. 52

4

Grundtypen automatisierter juristischer Dokumentation

Dieser Abstract wird zusammen mit der Fundstelle des ursprünglichen Textes im Computer gespeichert. Volltext-Systeme dagegen verzichten auf eine manuelle Bearbeitung. Die Textstellen werden in vollem Wortlaut in den Computer eingegeben. Nach einem vorherbestimmten Programm sondert die Maschine die sogenannten Füllwörter aus. Dies sind Wörter ohne signifikante Bedeutung wie z.B. Artikel, Präpositionen, Konjunktionen usw. Die vom Text verbleibenden Worte, etwa 60—70% des Gesamtwortlauts, bilden den Abstract der Textstelle. Dieser ist damit wesentlich umfangreicher als ein manuell erarbeiteter Abstract. Bei der Informationswiedergewinnung durch Abfrage der beiden Systemtypen ergeben sich ähnliche Unterschiede. Eine Frage an das Index-System muß vom Textbearbeiter auf wesentliche Stichworte konzentriert werden. Hierbei ist er an die bei der Eingabe verwendeten Begriffe gebunden, da nur diese im Computer gespeichert sind. Die Maschine vergleicht dann die Frage-Stichworte mit den Speicher-Stichworten und gibt bei Übereinstimmung die Fundstellen der einschlägigen Texte an. Beim Volltext-System richtet der Benutzer seine Frage direkt an den Computer. Er muß sich dabei nicht an ein Stichwortverzeichnis halten, da die ursprünglichen Texte im Speicher vorhanden sind. Die Maschine vergleicht die Frage mit dem gespeicherten Material und kann bei Übereinstimmung nicht nur die Fundstelle, sondern den gesamten Wortlaut der einschlägigen Textstelle ausgeben. Weitere Unterschiede zwischen den beiden Systemtypen hegen auf der technischen Seite. Index-Systeme benötigen eine wesentlich geringere Speicherkapazität als Volltext-Systeme. Ferner erlauben sie das kostensparende batch processing, bei dem mehrere Anfragen gesammelt und vom Computer in einem Durchlauf bearbeitet werden. Volltext-Systeme dagegen sind meist auf den Dialog Benutzer—Maschine hin ausgerichtet. Dabei wird on line, in direkter, unmittelbarer Verbindung mit dem Computer gearbeitet. Beide System-Grundtypen kommen in der Praxis in verschiedenen Abwandlungen vor. Die spezifischen Vor- und Nachteile des jeweiligen Grundtyps finden sich jedoch in allen Spielarten wieder.

Vergleich der System-Grundtypen in der Praxis

4.

Vergleich der System-Grundtypen in der Praxis

4.1

Versuchsmotivation

5

Angesichts der Notwendigkeit, die Datenverarbeitung zur Bewältigung juristischer Informationsfülle heranzuziehen, stellt sich die Frage nach dem geeigneten System. Ihre Beantwortung erfordert einen sorgfältigen Auswahlprozeß, bei dem zahlreiche Faktoren praktischer und theoretischer Natur verglichen und gegeneinander abgewogen werden müssen. Der Entscheidung für den einen oder anderen System-Grundtyp kommt hierbei wesentliche Bedeutung zu. Entscheidungselemente ergeben sich aus denktheoretischen Erwägungen sowie Angaben und Erfahrungen, die von bereits angelaufenen Projekten erhältlich sind. Manche dieser Aspekte können aber fundierter beurteilt werden, wenn man sie vor dem Hintergrund eines praktischen Funktions- und Arbeitsvergleichs der beiden Grundtypen sieht. Einen solchen Vergleich zwischen einem Indexund einem Volltext-System durchzuführen, ist Aufgabe des vorliegenden Versuchs. Aus Kostengründen mußte der Umfang des Versuchs bescheiden bleiben. Beobachtungen und Ergebnisse sind deshalb nicht als absolute Werte, sondern als richtungweisende Indizien zu sehen und zu beurteilen. 4.2

Versuchsanordnung

Ein in sich geschlossenes und überblickbares juristisches Textmaterial soll von einem Index-System und von einem Volltext-System gespeichert werden. Beiden Systemen werden dann Fragen vorgelegt die in Beziehung zum gespeicherten Material stehen. Die ausgegebenen Ergebnisse sind zu vergleichen. Effektivität, Kosten, offengelegte Systemphilosophie und Erfordernisse an den Benutzer sollen Faktoren einer vergleichenden Bewertung der beiden System-Grundtypen sein. 4.3

Versuchsmaterial

Das Versuchsmaterial muß zwei Anforderungen genügen: Es soll aus juristischen Texten bestehen, die möglichst umfassende Aussagen zu einem abgrenzbaren Rechtsgebiet enthalten. Andererseits darf es wegen der mit der

6

Veigleich der System-Grundtypen in der Praxis

doppelten Speicherung und Abfragung verbundenen Kosten nicht zu umfangreich sein. Nach Überprüfung verschiedenen Textmaterials erweist sich der Komplex der zum § 1747 BGB veröffentlichten Rechtsprechung als beiden Anforderungen entsprechend. § 1747 BGB behandelt die elterliche Einwilligung in die Adoption sowie die gerichtliche Ersetzung dieser Einwilligung. Für die Auswahl der zu diesem Paragraphen veröffentlichten Rechtsprechung spricht auch dessen Vorgeschichte. Nachdem die Auslegung der alten Fassung des § 1747 BGB lange umstritten war, wurde er durch das Familienrechtsänderungsgesetz vom 11.8.1961 in die jetzige Form gebracht. Die Verfassungsmäßigkeit der neuen Vorschrift wurde in der Rechtsprechung bezweifelt, bis das Bundesverfassungsgericht 1968 die Vereinbarkeit des § 1747 BGB mit dem Grundgesetz bestätigt 1 . Die zum § 1747 BGB veröffentlichten Entscheidungen sind damit nicht nur für aktuelle Fragen, sondern auch für Studien über Rechtsentwicklung und -änderung von Interesse 2 . Das Versuchsmaterial umfaßt 59 aus Kommentaren und Lehrbüchern zusammengetragene Entscheidungen mit folgenden Fundstellen: -

1 2

LG LG OLG KG, LG OLG AG BGH, KG, OLG OLG OLG OLG KG, OLG AG

Koblenz, Darmstadt, Karlsruhe, Hamburg, Hamburg, Achern Karlsruhe, Stuttgart, Stuttgart, Braunschweig, Karlsruhe, Hamburg

FamRZ FamRZ FamRZ FamRZ FamRZ FamRZ FamRZ FamRZ FamRZ FamRZ FamRZ FamRZ FamRZ FamRZ FamRZ FamRZ

1956, 59 1956,60 1957, 183 1957,184 1957,328 1957,379 1959,378 1960,229 1960,244 1961,490 1963,303 1964,51 1964,323 1966,266 1966,268 1966, 576

BVerfGE 24,120 ff. Die Problematik des Urheberrechts bei der Speicherung von Texten in Datenbanken soll an dieser Stelle nicht behandelt werden.

Vergleich der System-Grundtypen in der Praxis

-

OLG LG LG OLG OLG OLG AG OLG AG OLG LG LG LG AG LG AG LG

Hamm, Detmold, Lüneburg Hamm, Hamm, Celle, Hamburg, Celle, Hamburg, Celle, Tübingen, Mannheim, Lübeck, Heidelberg, Berlin, Hamburg, Hof,

DAVorm XXIV, 90 DAVorm XXIX, 162 DAVorm XXVII, 11 DAVorm XXVII, 41 DAVorm XXVIII, 66 DAVorm XXXIII, 17 DAVorm XXXIII, 59 DAVorm XXXIII, 94 DAVorm XXXVI, 329 DAVorm XXXVI, 330 DAVorm XXXVI, 332 DAVorm XXXVI, 129 DAVorm XXXVII, 121 DAVorm XXXVII, 215 DAVorm XXXIX, 98 DAVorm XXXIX, 335 DAVorm XXXIX, 350

BVerfGE 24,120 BGHZ 2,287 BGHZ 24,345 BGHZ 27,127 RGZ 119,44 RGZ 121, 30 -

BGH, Duisburg, LG BayObLG, Aurich, LG LG Mannheim,

-

OLG OLG KG, RG, KG, KG, LG AG KG, KG, OLG

Celle, Celle,

Nürnberg-Fürth Glückstadt Celle,

NJW1951,309 NJW 1959,820 NJW1962,301 NJW 1962,1967 NJW 1966, 357 StAZ 1958,290 StAZ 1966, 146 DRW 1939,2079 Warn.R. 1933, Nr. 182 JW1926,834 DFG 1941, 121 DNotZ 1962,654 SchlHAnz 1959, 196 DJ 1935,379 JFG22,332 JR 1948, 342

7

Vergleich der System-Grundtypen in der Praxis

8

-KG, -OLG Kiel, - BayObLGZ 21, 197 - KGJ XXVII, 183

EJF 1953,53 OLG 46,187

Das Testmaterial enthält damit Dokumente vom Jahre 1904 bis 1968, die sich wie folgt auf die Instanzen verteilen: - 1 Entscheidung des BVerfG - 3 RG- und 5 BGH-Entscheidungen - 29 Entscheide von Oberlandesgerichten - 14 LG-Entscheidungen - 7 Entscheidungen von Amtsgerichten Um die Objektivität der Datenbanksysteme zu prüfen wird eine Entscheidung doppelt, aber unter verschiedener Fundstellenbezeichnung in das Material aufgenommen. Das Dokument KG, DFG 1941, 121 entspricht im Wortlaut genau dem Dokument KG, JFG 22, 332. Der Versuch soll zeigen, ob die Systeme Texte, welche wörtlich übereinstimmen, aber von verschiedenen Fundstellen stammen, unterschiedlich oder gleich behandeln. 4.4

Versuchssysteme

Als Index-System dient das Verfahren des Centre de documentation juridique, CREDOC in Brüssel. CREDOC arbeitet bisher als erstes und einziges juristisches Informationszentrum in Europa. Die Volltext-Versuche werden mit dem System der UNIDATA AG in Zürich durchgeführt. Dort ist man gegenwärtig mit dem Aufbau einer „Schweizerischen Juristischen Datenbank" beschäftigt.

4.5

Geplanter Versuchsablauf

Um den geplanten Versuchsablauf klar zu umreißen, sind die wichtigsten Tätigkeiten und Stationen im folgenden Netzplan (Abbildung 1) festgehalten.

10

Systembeschreibung CREDOC

5.

Systembeschreibung CREDOC1

5.1

Vorgeschichte

CREDOC wurde 1967 von belgischen Anwälten in Brüssel gegründet. Nachdem die Anwalts- und Notarvereine Belgiens die Trägerschaft für das Projekt übernommen hatten, begann man mit der Speicherung von Gesetzen, Rechtsprechung und juristischer Literatur. Es folgten intensive Vorbereitungsund Testarbeiten. Im September 1969 konnte CREDOC seine Tätigkeit als erste juristische Datenbank in Europa aufnehmen und beliefert seither die belgischen Juristen mit Informationen. 5.2

Dokumentationstechnik

Die in die Datenbank aufzunehmenden Textstellen werden bei CREDOC manuell analysiert und indexiert. Ein juristisch ausgebildeter Textanalytiker sieht jedes Dokument durch und verarbeitet es nach einem bestimmten Schema zu einer Kurzfassung. Diese besteht aus signifikanten Stichworten, den Deskriptoren. Ebenso werden von außen an die Datenbank gerichtete Anfragen behandelt. Der Textbearbeiter kann die Deskriptoren nicht frei wählen. Er muß sich vielmehr an eine Wortliste der wichtigsten juristischen Termini halten, den Thesaurus. In den Thesaurus eingearbeitet sind implizite Wortbeziehungen wie Synonyme und verwandte Begriffe. Damit kann der Textbearbeiter feststellen, welche Wortformen und -abwandlungen einem Deskriptor zugeordnet sind. Explizite Wortbeziehungen werden vom Analytiker bei der Fragenformulierung hergestellt. Mit Hilfe logischer Operatoren kann er Fragedeskriptoren miteinander verknüpfen. Sind die Deskriptoren durch den Operator „und" verbunden, so bedeutet dies, daß Dokumente gesucht werden, die sämtliche Fragedeskriptoren enthalten. Der logische Operator „oder" fordert das Vorhandensein nur eines der zueinander in Beziehung gesetzten Begriffe. Soll von einer angesprochenen Dokumentgruppe eine nicht interessierende Untergruppe von der Suche ausgeschlossen werden, so sind die Deskriptoren mit dem Operator „ausgenommen" zu verbinden. 1

Die folgende Beschreibung beschränkt sich auf wesentliche Systemmerkmale. Detailangaben finden sich in: Le Credoc und bei Houtart S. 15 ff.

Systembeschreibung CREDOC

11

Weitere Hilfsmittel bei Text- und Fragenanalyse sind die Spezifikatoren, die einen Deskriptor spezifizieren. Spezifikatoren sind z.B. Ausdrücke wie „Ursache", „Zweck", „Folge", „Fehlen", „Bedingung" usw. Ihre Einführung ermöglicht es, die Deskriptoren in verschiedene Aspekte zu zerlegen und somit bei der Analyse genauer und gezielter vorzugehen. Die CREDOC-Technik erlaubt schließlich eine Gewichtung der Fragedeskriptoren. Mit ihr kann der Textanalytiker die Deskriptoren einer Anfrage ihrer Bedeutung entsprechend verschieden stark betonen. Wird beim ersten Suchdurchlauf kein Dokument gefunden, das alle Deskriptoren enthält, so scheidet der Computer den am schwächsten gewichteten Deskriptor aus und sucht noch einmal. Dies wiederholt er so oft, bis entweder ein einschlägiges Dokument gefunden ist oder alle Deskriptoren ausgeschieden sind. 5.3

Informationstechnik

Maschinelle Ausstattung CREDOC arbeitet mit einem Computer außer Haus im batch processing. Die Anfragen einer Woche werden gesammelt und in einem Computerdurchlauf pro Woche bearbeitet. Die hierbei benutzte Maschinenkonfiguration besteht aus folgenden Hauptelementen: Eine Zentraleinheit Bull/General Electric GE 115 mit einer Speicherkapazität von 16 K = 32.768 alphanumerischen Zeichen, ein Schnelldrucker mit einer Ausgabegeschwindigkeit von 600 Zeilen pro Minute. Programme Die von CREDOC benutzten Programme teilen sich in drei Hauptgruppen auf: Eingabe- und Speicherprogramme, welche Eingabe und Speicherung des analysierten Materials steuern, Such- und Ausgabeprogramme, die den Suchvorgang lenken, Überprüfungs- und Erneuerungsprogramme, welche überholtes Material ausscheiden.

12

Systembeschreibung UNIDATA

6.

Systembeschreibung UNIDATA1

6.1

Vorgeschichte

Die UNIDATA AG wurde 1968 von schweizerischen Juristen in Zürich gegründet. Sie beschäftigt sich mit Problemen der nichtnumerischen Datenverarbeitung und speziell mit der Entwicklung eines Systems für eine juristische Datenbank. Im Jahre 1970 war dieses Projekt so weit gediehen, daß beim 48. Deutschen Juristentag in Mainz 2 und bei ähnlichen Veranstaltungen in der Schweiz Probevorführungen gezeigt werden konnten. Zur Zeit wird daran gearbeitet, mit Hilfe des UNIDATA-Systems eine Schweizerische Juristische Datenbank aufzubauen. Die folgende Erklärung des Systems gibt den zum Versuchszeitpunkt erreichten Entwicklungsstand wieder. Inzwischen verwirklichte und geplante Änderungen können den detaillierten ßystembeschreibungen entnommen werden.

6.2

Dokumentationstechnik

UNIDATA arbeitet nach dem Volltext-Verfahren. Die in die Datenbank aufzunehmenden Dokumente werden nicht manuell analysiert und nur als Kurzfassung gespeichert, sondern in vollem Wortlaut dem Computer eingegeben. Dieser speichert den vollen Text in einer Archiv-Datei ab. Dann erstellt er zusätzlich eine komprimierte Fassung des Dokuments. Diesen maschinell gewonnenen Abstract erarbeitet der Computer,indem er sämtliche Füllwörter wie Artikel Präpositionen, Konjunktionen und ähnliches eliminiert und die verbleibenden Worte alphabetisch ordnet. Mehrmals erscheinende Worte werden nur einmal aber mit ihrer Vorkommenshäufigkeit genannt. Im nächsten Schritt bildet der Computer ein Gesamtregister, welches alle vorkommenden Begriffe erfaßt. In dieser Datei werden die Begriffe zunächst statistisch registriert; bei jedem Begriff ist festgehalten, wie oft und in wievielen Dokumenten er auftaucht. Weiter ist verzeichnet, in welchen Dokumenten der Begriff zu finden ist.

1 2

Detailbeschreibung in: „Die schweizerische juristische Datenbank" Berichte darüber in der FAZ vom 28.9.1970 S. 7, NJW 1970, 2012, DJT-Sitzungsberichte

Systembeschieibung UNIDATA

13

Die Befragung des Systems erfolgt ebenfalls nicht über einen Textbearbeiter sondern direkt. Der Benutzer stellt sein Problem in natürlicher Sprache, wie es ihm gerade einfällt. Die einmal formulierte Frage kann er um Synonyme und verwandte Begriffe erweitern 3 . Der Computer sondert aus dem ihm vorgelegten Wortlaut die Füllwörter aus und vergleicht die verbleibenden Begriffe mit dem Gesamtregister. Als erstes Ergebnis nennt er die Anzahl der Dokumente, die einen oder mehrere der Suchbegriffe enthalten. An diesem Punkt beginnt der Dialog zwischen Benutzer und Maschine, in dessen Verlauf sich der Fragende mit Hilfe der vom Computer gelieferten Zwischeninformationen an die ihn interessierenden Dokumente heranarbeitet. Solche Zwischeninformationen bestehen aus Angaben über Fundstellen, Autoren, Leitsätze, Kontexte und Anmerkungen. Von den beim Dialog herausgearbeiteten Zieldokumenten läßt sich der Benutzer in einem letzten Schritt den vollen Text ausdrucken. 6.3

Informationstechnik

Maschinelle Ausstattung Die Eingabe der Dokumente erfolgt über einen Klarschriftleser vom Typ Scan-Data 300. Dieses optisch elektronische Gerät überträgt stündlich 500 DIN A 4 Schreibmaschinenblätter in den Computer. Die Verarbeitung und Speicherung der Dokumente wird auf einer Großrechenanlage Control Data CD 6500 durchgeführt. Die Anlage verarbeitet 1500 DIN A 4 Blätter pro Stunde. Die Verbindung Benutzer—Maschine wird über Terminals hergestellt. Dies sind fernschreiberähnliche Geräte, in die der Benutzer seine Frage eintippt und über die die Antwort des Computers ausgegeben wird. Programme Die Programme steuern Aufbau und Auswertung von drei Dateien. Die Archiv-Datei speichert die Dokumente in unverändertem Wortlaut, jedoch gegliedert in Abschnitte und Zeilen. Die Index-Datei, ein „inverted file", verzeichnet die Dokumente ebenfalls in ihrem Wortlaut, diesmal aber in Ausdrücke zerlegt. Jedem Ausdruck — ausgenommen Füllwörter — werden Notizen beige fügt wie Fundstelle, Position im Dokument usw.

3

Ein Programm, welches diesen Schritt automatisiert, wird zur Zeit ausgearbeitet.

14

Praktischer Versuch

Die X-Datei schließlich nimmt ebenfalls die Dokumente im vollen, aber verdichteten Wortlaut auf. Mehrmals auftretende Ausdrücke werden hier nur einmal verzeichnet, unter Angabe ihrer Vorkommenshäufigkeit. Anhand dieser Datei sucht der Computer einschlägige Dokumente, indem er die X-Datei daraufhin überprüft, welche Dokumente Ausdrücke des Problems des Anfragers enthalten und in welcher Zahl.

7.

Praktischer Versuch: Speicherung und Aufbereitung des Materials

7.1

CREDOC

Der Versuch beginnt mit der manuellen Analyse der ausgewählten 59 Entscheidungen. Ein deutschsprechender CREDOC-Textanalytiker führt diese Arbeit mit Unterstützung des Verfassers durch. Jedes Textdokument wird, zunächst unter Nichtbeachtung des Leitsatzes, gelesen. Bei einem zweiten Durchlesen unterstreicht der Bearbeiter die ihm signifikant scheinenden Worte. Mit ihrer Hilfe versucht er, den Gehalt der Textstelle in wenigen Stichworten zusammenzufassen, die er als Deskriptoren in ein Dokumentformular überträgt (siehe Abbildung 2). Hier wird von der üblichen CREDOC-Arbeitsweise abgewichen. Normalerweise muß sich der Textbearbeiter am vorgegebenen Thesaurus orientieren und kann die Deskriptoren nicht frei wählen. Beim Versuch kann wegen der Überschaubarkeit des Materials umgekehrt vorgegangen werden. Der Thesaurus wird erst nach Beendigung der Analyse aus den verwendeten Deskriptoren zusammengestellt. Der vorhandene Thesaurus von CREDOC kann für den Versuch nicht benutzt werden, da er nur in den belgischen Landessprachen Französisch und Flämisch existiert. Durch die Verschiedenheit des belgischen Rechtssystems vom deutschen ist auch nicht gewährleistet, daß formell gleiche Begriffe sachlich übereinstimmen. Nachdem im Versuch für das Dokument eine Deskriptorliste erstellt ist, wird geprüft, ob sie Aussage und Gehalt der Entscheidung wiedergibt. Ist dies nicht der Fall, fügt der Analytiker weitere Deskriptoren hinzu. Jetzt erst studiert er den Leitsatz der Entscheidung, als Kontrolle, ob die in ihm ausgedrückten Gedanken von den Deskriptoren erfaßt sind. Diese Kontrolle ist allerdings nicht immer wirksam, da manchmal der Leitsatz nichts oder nur wenig über die in der Entscheidung behandelten Probleme aussagt.

Abbildung 2

t o

-

-

ON ?S

l/l -H CT\

M U Z M D a w

«

>

Z O

X X

3 z

H

& u ai

X a z D

es

O en s 1 H u

N M a.

Ñ W 0.

O