198 36 37MB
German Pages 530 [532] Year 2000
Managementwissen für Studium und Praxis Herausgegeben von
Professor Dr. Dietmar Dorn und Professor Dr. Rainer Fischbach Bisher erschienene Werke: Behrens • Kirspel, Grundlagen der Volkswirtschaftslehre Bichler • Dörr, Personalwirtschaft Einführung mit Beispielen aus SAP® R/3® HR® Blum, Grundzüge anwendungsorientierter Organisationslehre Bontrup, Volkswirtschaftslehre Bontrup, Lohn und Gewinn Bradtke, Mathematische Grundlagen für Ökonomen Bradtke, Statistische Grundlagen für Ökonomen Busse, Betriebliche Finanzwirtschaft, 4. Auflage Clausius, Betriebswirtschaftslehre I Dorn • Fischbach, Volkswirtschaftslehre II, 3. Auflage Ellinghaus, Werbewirkung und Markterfolg Fank, Informationsmanagement Fank • Schildhauer • Klotz, Informationsmanagement: Umfeld - Fallbeispiele Fiedler, Einfuhrung in das Controlling Fischbach, Volkswirtschaftslehre I, 10. Auflage Frodl, Dienstleistungslogistik Haas, Marketing mit EXCEL, 2. Auflage Hardt, Kostenmanagement Heine • Herr, Volkswirtschaftslehre Hofmann, Globale Informationswirtschaft Hoppen, Vertriebsmanagement Koch, Marketing Koch, Marktforschung, 2. Auflage Koch, Gesundheitsökonomie: Kosten- und Leistungsrechnung Krech, Grundriß der strategischen Unternehmensplanung Kreis, Betriebswirtschaftslehre, Band I, 5. Auflage Kreis, Betriebswirtschaftslehre, Band II, 5. Auflage Kreis, Betriebswirtschaftslehre, Band III, 5. Auflage
Lebefromm, Controlling - Einführung mit Beispielen aus SAP® R/3®, 2. Auflage Lebefromm, Produktionsmanagement Einführung mit Beispielen aus SAP® R/3®, 4. Auflage Martens, Statistische Datenanalyse mit SPSS für Windows Mensch, Kosten-Controlling Olivier, Windows-C - Betriebswirtschaftliche Programmierung für Windows Peto, Einführung in das volkswirtschaftliche Rechnungswesen, 5. Auflage Piontek, Controlling Piontek, Beschaftüngscontrolling, 2. Auflage Piontek, Global Sourcing Posluschny, Kostenrechnung für die Gastronomie Posluschny • von Schorlemer, Erfolgreiche Existenzgründungen in der Praxis Reiter • Matthäus, Marketing-Management mit EXCEL Rudolph, Tourismus-Betriebswirtschaftslehre Rüth, Kostenrechnung, Band I Sauerbier, Statistik für Wirtschaftswissenschaftler Schaal, Geldtheorie und Geldpolitik, 4. Auflage Scharnbacher • Kiefer, Kundenzufriedenheit, 2. Auflage Schuchmann • Sanns, Datenmanagement mit MS ACCESS Schuster, Kommunale Kosten- und Leistungsrechnung Stahl, Internationaler Einsatz von Führungskräften Steger, Kosten- und Leistungsrechnung, 2. Auflage Stock, Informationswirtschaft Weindl • Wöyke, Europäische Union, 4. Auflage Zwerenz, Statistik
Informationswirtschaft Management externen Wissens
Von Professor
Dr. Wolfgang G. Stock
R.Oldenbourg Verlag München Wien
Die Deutsche Bibliothek - CIP-Einheitsaufnahme Stock, Wolfgang G.: Informationswirtschaft : Management externen Wissens / Wolfgang G. Stock. - München ; Wien : Oldenbourg, 2000 (Managementwissen für Studium und Praxis) ISBN 3-486-24897-9
© 2000 Oldenbourg Wissenschaftsverlag GmbH Rosenheimer Straße 145, D-81671 München Telefon: (089) 45051-0, Internet: http://www.oldenbourg.de Das Werk einschließlich aller Abbildungen ist urheberrechtlich geschützt. Jede Verwertung außerhalb der Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Bearbeitung in elektronischen Systemen. Gedruckt auf säure- und chlorfreiem Papier Gesamtherstellung: Druckhaus „Thomas Müntzer" GmbH, Bad Langensalza ISBN 3-486-24897-9
Inhalt Vorwort 1. Informationswirtschaft in der Informationsgesellschaft 1.1 Was heißt „Informationsgesellschaft"? Versuch einer Präzisierung
XV 1 1
Informationsgesellschaft als (fünfte) Kondratieff-Welle (1) - Informationsgesellschaft als Wissensgesellschaft (4) - Informationsgesellschaft und Telematik (5) 1.2 Unternehmensorganisation in der Informationsgesellschaft
7
Globalisierung (7) - Neues ökonomisches Paradigma:,, Toyotismus " statt „Fordismus" (8) - Telearbeit in „virtuellen Unternehmen" (9) Die Einheit der informationstechnischen und organisatorischen Dimension (II) - Die Bedeutung der Informationsinhalte (13) 1.3 Das Spektrum der Informationswirtschaft im Expertenurteil
13
Ist „ Informationswirtschaft " ein klarer und deutlicher Begriff? (14) Unterschiedliche Auffassungen von „Informationswirtschaft" (16) 1.4 Informationswirtschaft als Wirtschaftsbranche
20
Informationsproduzenten (21) - Informationsanbieter (22) Informationsvermittler (23) 1.5 Informationswirtschaft als betriebliche Funktion
25
Das betriebliche Informationssystem (28) - Informationsmanagement (29) - Externe Kommunikation (30) - Informationsressourcenmanagement (31) 2. Informationen und Informationskanäle 2.1 Information als Wirtschaftsgut
36 36
Information als Ware (36) - Das Wirtschaftsgut Information als „ Vertrauensgut" (38) 2.2 Information als Gesamt von Signal und Nachricht
39
Information (39) - Daten - Information - Wissen - handlungsrelevantes Wissen (40) Informationsübermittlungen (41) 2.3 Informationskanäle
Nicht-formale Kanäle der Individualkommunikation (43) - Formale Informationskanäle der Printmedien (45) - Formale elektronische Informationskanäle (46) - Kommerzielle Online-Archive (47) - CD-ROM (48) Real-time Informationen (49) - Internet (50)
43
Inhalt
VI 2.4 Informationslogistik im Data Warehouse
50
Data Warehouse (51) - Data Mining (52) - Aktive und passive Informationsübermittlung (53) - Informationsbedarf (54) - Just-in-time Information (56) 3. Hilfsmittel der Wirtschaftsdokumentation: Klassifikation und Thesaurus 3.1 Begriffssysteme
59 59
Relationen (60) - Hierarchierelation (60) - Assoziationsrelation (61) 3.2 Klassifikation
62
DIN-Norm zu Klassifikationssystemen (62) - Dewey Decimal Classification (DDC) (64) - NACE (70) - SIC und Predicasts Product Code (72) - Internationale Patentklassifikation (IPK) (73) 3.3 Thesaurus
76
DIN-Norm zur Thesauruserstellung (76) - Indexierung (81) - Der Standard-Thesaurus Wirtschaft (84) 4. Retrieval von elektronischen Informationen: Techniken und Strategien 4.1 Suchen und Finden von Datenbanken
90 90
Datenbankführer (91) - Hostspezifische Datenbankindices (93) „Bluesheets" (96) - Preise (97) 4.2 Suchtechniken in Datenbanken
97
Datenbankaufruf (98) - Feldspezifische Suche - Suche im Basic Index (98) Blättern im Wörterbuch (101) - Fragmentierung (103) - Mengentheoretische Operatoren (104) - Abstandsoperatoren (107) - Häufigkeitsoperatoren (109) Hierarchische Suche (110)- Datenbankübergreifende Suche (111)- Umformulierung von Suchergebnissen zu Suchargumenten (112) - Ökonometrische Befehle (113) - Anzeigen von Suchergebnissen (114) - Bestellen von Volltexten (116) - Verwalten von Suchprofilen, SDI (117) 4.3 Relevanz
119
Frage- und Antworttypen (119) - Recall und Precision (121) 4.4 Information Indexing und Information Retrieval
Dokumentarische Bezugseinheit - Dokumentationseinheit (123) - Dokumentationsmethoden (124) - ,,Berrypicking" (127)
123
Inhalt 5. Data Mining bei externen Informationen 5.1 Informetrie
VII 130 130
Ein informetrisches Gesetz (130) - Ausprägungen des informetrischen Gesetzes (132) - Zipfsches Gesetz (132) - Bradfordsches Gesetz (133) Lotkasches Gesetz (135) - Garfieldsches Gesetz (136) - 80/20-Regel (137) 5.2 Rangordnungen
137
Rangordnungen im Dienste des Data Mining (137) - Rangordnungen zur Verfeinerung einer Retrievalstrategie (139) 5.3 Informetrische Zeitreihen
139
5.4 Semantische Netze
141
Clusteranalyse beim Data Mining (141) - Semantische Netze als Einengung von Suchfragen (142) 5.5 Informationsflußgraphen
143
Unternehmen und ihre Informationsflüsse (143) - Retrieval bei Zitationsdatenbanken (145) 6. Automatische Indexierung
147
6.1 Informationslinguistik
149
Elimination von Stoppwörtern (151) - Wortstammanalysen (151) Phrasenerkennung (153) - Synonyme (156) - Pronomina-Analysen (157) Fehlertolerante Behandlung von Suchfragen (157) 6.2 Informationsstatistik
159
Einfache Zählungen von Worthäufigkeiten (160) - Dokumentspezifische Wortgewichtung (161) - Gewichtung nach Position im Text (162) Inverse Dokumenthäufigkeit (162) - Wortabstand (163) - Ranking nach Relevanz (163) 6.3 Ordnungstheorie
164
Automatische Deskriptor- oder Notationsvergabe beim Einsatz einer Dokumentationssprache (164) - Automatische Schlagwortvergabe (165) 6.4 Assoziative Suche
166
Natürlichsprachiges Verfahren (167) - Zitationsanalytisches Verfahren (167) Text Retrieval Conferences (168) 6.5 Automatische Indexierung deutschsprachiger Texte
Lemmatisierung (169) - Derivation (170) - Bindestrichergänzung (170) Kompositazerlegung (171)
168
Inhalt 7. Suchen und Browsen im World Wide Web 7.1 Retrievalsysteme im World Wide Web
174 175
HTML-Dokumente (175) - Retrievalsysteme für das gesamte World Wide Web (176) - Suchmaschinen mit automatischer Indexierung (177) Klassifikatorische Retrievalsysteme (178) - Meta-Suchmaschinen (180) 7.2 Virtuelle Bibliotheken
181
Linksammlungen realer Bibliotheken (182) - Thematische Linksammlungen (183) 7.3 Wissenschaftliche Zeitschriften, Bücher und Working Papers
184
8. Wirtschaftswissenschaftliche Informationen: Literaturnachweise und Volltexte
187
8.1 Bibliographische wirtschaftswissenschaftliche Datenbanken
188
Volkswirtschaftliche Informationen I: ECON1S (188) - Volkswirtschaftliche Informationen II: EconLit (191) - Betriebswirtschaftliche Informationen I: BLISS (193) - Betriebswirtschaftliche Informationen II: ABI/INFORM (197) 8.2 Wirtschaftswissenschaftliche Volltextdatenbanken
199
8.3 Wirtschaftswissenschaftliche Linksammlungen
203
NetEc - Gruppe (203) - Ressourcen von NetEc (204) 9. Ergebnisse
der Marktforschung
9.1 Fakteninformationen
207
zur Marktforschung
208
Marktforschungergebnisse für Deutschland: FAKT (208) - Kaufkraftkennziffern: Informationen der GfK- Marktforschung (212) 9.2 Bibliographische Marktforschungsdatenbanken
214
9.3 Marktanalysen von Marktforschungsinstituten, Banken und Brokern im Volltext
216
Investext (216) - Aktuelle exklusive Reports: Frost & Sullivan Electronic Distribution (222) 10.
Wirtschaftsnachrichten:
Agenturmeldungen
- Zeitungen
-Newsletter
- Pressearchive
10.1 Presseagenturen
Dow Jones Reuters Business Interactive (224) - Wirtschaftsnachrichtenagenturen (226)
224 224
Inhalt
IX
10.2 Tageszeitungen und Wirtschaftspresse Tages- und Wochenzeitungen
227
(227) - F.A.Z. (228) - Handelsblatt
(232)
10.3 Quellenübergreifende Informationen zu Branchen, Märkten, Unternehmen und Produkten
233
Die Datenbanken der Information Access Company (233) 10.4 Wirtschaftsarchive Pressedokumentation
237 nach dem Dossierprinzip
(237) - HWWA-
Archiv (238) 10.5 Medienpräsenzanalysen Marketingmaßnahmen
240
und Presseresonanz
Messung der Medienpräsenz Medienresonanz
(240) - Argus Media (240) -
(241) - Indikatoren der Medienpräsenz
und
(243)
11. Betriebswirtschaftliche Unternehmensinformationen Fakteninformationen
über betriebswirtschaftliche
246
Aspekte (246)
11.1 Grunddaten eines Unternehmens Unternehmensgrunddaten Database-Marketing
247
von Hoppenstedt und Creditreform (248) -
mit externen Informationen
Unternehmensaktivitäten
(251) - Abstracts der
(252) - Publizitätspflicht
von Unternehmen
(253)
11.2 Handelsregistereintragungen Bundesanzeiger
254
(Zentralhandelsregister
/ Bekanntmachungen)
(254)
11.3 Bilanzen
257
11.4 Bonität
261
Zahlungsgewohnheiten
von Unternehmen (261) - Dun & Bradstreet
(263)
11.5 Produkte
268
11.6 Unternehmensverflechtungen
269
Konzernverflechtungen 12. Ausschreibungen
(270) - Mergers & Acquisitions
(272)
und Geschäftsanbahnungen
276
12.1 Ausschreibungen
276
Öffentliche Ausschreibungen: Ausschreibungen
Tenders Electronic Daily (276) -
in Deutschland: Subreport
(280)
12.2 Geschäftsanbahnungen Kooperationsbörsen 12.3 Förderprogramme
(283) - Unternehmensnachfolgebörsen
282 (285) 286
Inhalt
X 13. „Selbstdarstellungen" von Unternehmen: Geschäftsberichte und Homepages 13.1 Geschäftsberichte
290 290
Die Sammlungen von Disclosure (290) 13.2 Homepages im World Wide Web
291
RealNames (292) - Homepage - Information und Kontaktanbahnung (292) 14. Gesetze und Urteile
294
14.1 Deutsches Recht
294
Bundesrecht auf CD-ROM (294) - Juris (295) 14.2 Europäisches Recht
297
Celex (297) 14.3 Rechtsinformationen bei Lexis-Nexis
299
Inhalte von Nexis (300) - Zitationssuche mit Shepard's (303) 15. Gewerbliche Schutzrechte als Wirtschaftsinformationen: Patente, Gebrauchsmuster, Marken, Geschmacksmuster 15.1 Gewerbliche Schutzrechte
307 307
Nichttechnische Schutzrechte: Warenzeichen und Geschmacksmuster (307) - Technische Schutzrechte: Patente und Gebrauchsmuster (308) Technische Informationen außerhalb der Patente und Gebrauchsmuster (309) 15.2 Patentrecherchen
310
Struktur von Patentdokumenten (311) - Rechercheziele (312) Typen von Patentdatenbanken (314) - Recherchen nach dem Rechtsstand (316) 15.3 Patentdatenbanken
317
Derwent 's „ World Patents Index " (317) - lnpadoc (318) - Patente des Europäischen Patentamtes (322) - Deutsche Patente: PATDPA PATOSDE - DEPAROM (327) - Beschaffung von Patentschriften (328) 15.4 Markenrecherche Nizza-Klassifikation (329) - Wiener Klassifikation (330) - Informationsressourcen mit Markeninformationen (333)
329
XI
Inhalt 16. Forschungs- und Entwicklungsaktivitäten von Unternehmen
335
16.1 Wissenschaftlich-technische Informationen als „Rohstoff' für unternehmerische Forschung und Entwicklung
335
Informationsflüsse zwischen Grundlagenforschung, Technik, Design und Innovationen (335) - Informationsressourcen für Forschung und Entwicklung (336) - Patentinformationen (337) - Wissenschaftlich-technische Literaturinformationen (339) - Zitationsindices des Institute for Scientific Information (339) - Dissertationen I: Dissertation Abstracts (343) - Dissertationen II: Deutsche Hochschulschriften (345) - Fachspezifische Datenbanken (347) 16.2 Beobachtung der Forschung und Entwicklung von Wettbewerbern und in Technikgebieten
349
Frühindikatoren auf Produkt- und Prozeßinnovationen (349) - Weltstandsvergleich (350) - Analyse und Prognose von FuE-Aktivitäten (352) Markierung der technologischen Entwicklung von Unternehmen (353) Markierung von Technologietrends in einer Branche (354) 17. Personenbezogene Informationen in Datenbanken 17.1 Biographische Datenbanken
358 358
Munzinger Archiv (359) - Who's Who In European Business and Industry (360) 17.2 Suche nach personenbezogenen Informationen
361
Hilfsmittel im Internet: Switchboard (361) - Hilfsmittel bei einem Online-Archiv: Dialindex (362) 17.3 Informetrische Rangordnungen von Personennamen
363
Wissenschaftlich-technische Leistung und Wirkung (363) - Head Hunting mittels Informetrie (364) 18. Wirtschaftsstatistische Zeitreihen 18.1 Definition, Datenerhebung und Berechnung einer Zeitreihe
366 367
Der Geschäftsklimaindex des ifo Instituts (368) - Darstellung der Zeitreihe - Salden- und Indexwerte (371) 18.2 Informationsressourcen mit wirtschaftsstatistischen Zeitreihen
DSI Data Service & Information (373) - Zeitreihenanalysen mit DRI (377)
373
XII
Inhalt
19. Integration externer Informationen in das betriebliche Informationssystem
379
19.1 Das „gläserne" Unternehmen?
379
19.2 Befriedigung des Ad-hoc-Informationsbedarfs durch retrospektive Recherchen
3 81
Wissenslücken und Entscheidungsvorbereitungen
(381) - Retro-
spektive Recherche (382) - Externe Lösung: Informationsbroker, Bibliotheken und Unternehmensberater (383) - Interne Lösung I: Informationsvermittlung (384) - Interne Lösung II: Endnutzerkonzept und Informationsvermittlung (385) 19.3 Befriedigung eines andauernden Informationsbedarfs durch Profildienste und SDI
386
Standardprofil: News-Bre@k (386) - Persönliche Profile in externen Systemen (388) - Persönliche Profile in internen Systemen (388) 19.4 Frühwarnsysteme
391
Feldspezifische Frühwarninformationen Frühwarninformationen
(392) - Data Mining nach
(392)
20. Fallstudien 20.1 Online-Archiv mit Orientierung auf den Endnutzer: Profound
395
The Dialog Corporation (395) - Profounds Produktpalette (396) Die Datenbestände im Überblick (397) - InfoSort: Ein Thesaurus für alle Literaturinformationen
(399) - WorldSearch (401) - WorldSearch
Alert Manager (402) - Quotes (403) - Portfolio (403) - Profounds Intranet-Lösung (404) - Lifewire: Der individuelle Tickerdienst (405) Preise (405) - Profound: Zusammenfassende Bewertung (406) 20.2 Ein System automatischer Indexierung: Freestyle von Lexis-Nexis
407
Freestyle in der Recherchepraxis (408) - Boole und Freestyle in Kombination (410) - Automatische Indexierung bei Lexis-Nexis (411) .where und .why: Dem System über die Schulter schauen (412) Assoziatives Retrieval: More (414) - Verwandte Begriffe:
Anwendung
des statistischen Thesaurus (415) - Bewertung von Freestyle (417) 20.3 Anatomie einer Online- und CD-ROM-Datenbank: Die ifo Literaturdatenbank Zugänge zur ifo Literaturdatenbank (418) - Dokumentationswürdigkeit (419) - Inhaltserschließung (420) - Sachgebietsklassifikation (423) -
417
XIII
Inhalt Ländercode (425) - Abstracts (427) - Tabellenwerke (427) - Formale Erfassung (427) - Bibliographische Angaben (428) - Namensansetzungen (429) - Qualitätssicherung (429) - Suchhilfen (431) 20.4 Intranet-Lösung einer wissenschaftlichen Datenbank: „Web of Science"
432
Suchzugänge (432) - Easy Search: Zugang zu Sachthemen,
Personen
und Orten (434) - Füll Search: „Allgemeine" Suche und Suche nach zitierter Literatur (435) - Results Summary und Füll Record (436) Abspeichern von Suchanfragen (436) - Zitationssuchen: nach hinten, nach vorne und zur „ Verwandtschaft" (436) - Ausgabeformate (437) Informetrische undszientometrische
Untersuchungen (439) - Abonne-
ment des „ Web of Science " (439) 20.5 Suchmaschine und Portal zum World Wide Web: AltaVista
440
AltaVista im historischen und systematischen Überblick (440) Die Quellen von AltaVista und ihr ,, Einsammeln": Scooter (440) Automatische Indexierung der Quellen (442) - Einfache Suche (444) Fortgeschrittene Suche (445) - Der RealNames-Link (446) - Suche nach Personen: Switchboard (447) - Systran: Automatische Übersetzung - mit Problemen (448) Anschriften
450
Literatur
453
Zeitschriften und Newsletter der Informationswirtschaft
483
Messen der Informationswirtschaft
484
Register
485
INFORMATIONSWIRTSCHAFT
Management externen Wissens
Vorwort Integration externen Wissens in betriebliche Informationssysteme Die betriebliche Informationswirtschaft durchzieht nahezu alle Organisationseinheiten eines Unternehmens. Sie ist überall dort anzutreffen, wo Informationen fließen - oder fließen sollten. Informationswirtschaft hat unterschiedliche Aspekte: •
Empirie und Theorie bedeutungstragender Informationen sowie deren Verarbeitung und Übermittlung (Informationswissenschaft)
•
Technik der Informationsverarbeitung und -Übermittlung (Wirtschaftsinformatik)
•
Organisation der Informationsverarbeitung und -Übermittlung (Informationsmanagement)
•
Inhalte der Informationen (Informationsressourcenmanagement) •
(unternehmens-)interne Informationen
•
externe Informationen.
Dieses Lehrbuch konzentriert sich auf den letztgenannten Aspekt. Es geht vorwiegend um die Beschaffung externer Informationen und deren Aufarbeitung sowie Bereitstellung in betrieblichen
Informationssystemen.
Wenn man
das
Schlagwort vom „Knowledge Management" aufnehmen möchte, handelt dieses Buch vom Nutzbarmachen
externen Wissens in Unternehmen
und
anderen
Organisationen. Warum ist eine Befassung mit den externen Informationen für Unternehmen oder Einrichtungen der öffentlichen Verwaltung überhaupt notwendig? Ganz allgemein
XVI
Vorwort
gilt für nahezu alle Institutionen: „Wissenspotentiale werden nur ungenügend genutzt" (Probst 1999, 25). Externe Informationen •
schließen Wissenslücken (z.B. bei Forschungs- und Entwicklungsarbeiten, bei der Einführung neuer Unternehmensführungsmethoden, bei der Beurteilung eines Unternehmens)
•
fundieren Entscheidungen (Unsicherheiten werden zwar nicht aufgehoben, aber doch auf ein Minimum reduziert)
•
bilden - richtig zusammengefaßt - Frühwarnsysteme (z.B. über unerwartete Bewegungen auf Märkten, über Aktionen von Wettbewerbern)
•
zusammengefaßt: erschließen bei richtigem Einsatz Wettbewerbsvorteile.
Beispielhaft seien einige Fragestellungen aufgeführt, die durch externe Informationsressourcen beantwortet werden: •
Welche
aktuellen
wirtschaftswissenschaftlichen Forschungsergebnisse
zur
Einführung eines neuen Managementinstruments (sagen wir: zum Qualitätsmanagement nach ISO 9000) liegen vor? •
Wir wollen einen neuen Auslandsmarkt erschließen. Welche Absatzchancen sind dort vorhanden? Gibt es einheimische Konkurrenz? Liegen hierzu Studien von Wirtschaftsforschungsinstituten vor?
•
Im Bereich der Marktforschung: Welches sind die Top 10 Unternehmen in einem Marktsegment?
•
Welches Image hat mein Unternehmen (oder haben die Wettbewerber) in den Wirtschafts- und Tageszeitungen in irgendeinem Land (etwa: in Japan)?
•
Heute ist Bilanzpressekonferenz des Unternehmens X. Ich möchte direkt nach Abschluß der Veranstaltung erfahren, was Presseagenturen dazu melden.
•
Eine Mailingaktion ist geplant. Woher bekomme ich Namen und Anschriften der Forschungsleiter aller Großunternehmen einer Region?
•
Wie erhalte ich über einen neuen Geschäftspartner (einigermaßen) zuverlässige Informationen über dessen Bonität?
•
Gibt es Übernahmepläne oder Beteiligungswünsche von X an Y?
Vorwort •
XVII
Unser Unternehmen hat in einem Bereich freie Kapazitäten. Gibt es Ausschreibungen, an denen man sich beteiligen sollte?
•
Wie stellt sich Unternehmen X im Internet dar? Wie findet man zielgenau dessen Homepage?
•
Unser Unternehmen hat ein juristisches Problem. Wie ist die Rechtslage? Gibt es bereits Grundsatzurteile?
•
Bevor wir eine neue Forschungsaktivität beginnen: Gibt es bereits Patente auf dem Gebiet?
•
Ein Unternehmen hält einige Patente. Wie überwachen wir, daß andere Firmen den Patentschutz nicht verletzen? Wie werden unsere Patente in anderen Patenten zitiert? Sind dabei Lizenzen fallig?
•
Wie aktiv ist ein Wettbewerber in der Patentanmeldung? Welche Forschungsund Entwicklungsgebiete werden derzeit abgedeckt? Lassen sich Schlüsse auf Planungen neuer Produkte oder Prozesse ziehen?
• •
Wir wollen eine neue Marke schützen lassen. Gibt es bereits ähnliche Marken? Wir suchen Personal, sagen wir: einen Mitarbeiter der Forschungs- und Entwicklungsabteilung mit dem ausgewiesenen Schwerpunkt beim Thema X. Gibt es jemanden, der viel über X publiziert hat? Hat dieser Autor durch seine Schriften auch eine wissenschaftliche Wirkung erzielt?
Externe Informationen, dies zeigen bereits unsere Beispiele, decken
diverse
Bereiche betrieblicher Informations- und Entscheidungsaufgaben ab. Zu den extern gewonnenen Informationen gesellen sich die internen Informationen aus Controlling, persönlichen
Forschungs- und Entwicklungsberichten, Informationen der
Mitarbeiter
Memos,
Briefwechseln,
usw. Aufgearbeitet werden
alle
Informationen in einem unternehmensweiten Informationssystem. Verschiedene Systemoberflächen - etwa in einem Data Warehouse - sprechen die verschiedenen Mitarbeiter an: Der Vorstand benötigt hochverdichtete strategische Informationen, der Controller Kennzahlen über betriebliche Funktionen, die Forscher und Entwickler wissenschaftliche Artikel und Patente, die Marketingabteilung Daten über gewisse Absatzmärkte. Im Unterschied zur Wirtschaftsinformatik und zum
Informationsmanagement
betont das Informationsressourcenmanagement die Informationsinhalte. Hier geht
XVIII
Vorwort
es nicht um Informationstechnik und Informationsorganisation, hier geht es um die Informationen selber. Im betriebswirtschaftlichen Bereich ist das Informationsressourcenmanagement eine noch junge Disziplin. Erst durch das Aufkommen der
Online-Datenbanken,
der CD-ROM, des World Wide Web (WWW) sowie des Knowledge Management wird die Relevanz der externen Informationsressourcen
gebührend
wahrge-
nommen.
Inhaltsübersicht Die folgenden Kapitel lassen sich zwanglos in drei Teile gruppieren: •
theoretische und methodische Grundlagen der Beschaffung externer Informationen und ihrer Integration in betriebliche Informationssysteme
•
Typen externer Informationsressourcen
•
Fallstudien.
Theoretische
und
methodische Grundlagen
des
Informationsressourcen-
management Der erste Teil umfaßt die Kapitel 1 bis 7 sowie Kapitel 19 und thematisiert vorwiegend theoretische und methodische Grundlagen. Zunächst muß überhaupt geklärt werden, was „Informationswirtschaft" bedeutet. Läßt sich der durchaus schillernde Begriff „Informationsgesellschaft" genauer fassen? Ändern
sich durch
die Informationsgesellschaft bestimmte
Voraus-
setzungen für Unternehmen? Was bedeutet „Informationswirtschaft"? Der Term „Informationswirtschaft"
bezeichnet
sowohl
eine
Wirtschaftsbranche,
deren
Wertschöpfungskette Informationsproduzenten, -anbieter und -vermittler umfaßt, als auch eine betriebliche Funktion, die (nahezu) jedes Unternehmen betrifft. Wie grenzen
sich
management
Informationswirtschaft, und
Wirtschaftsinformatik,
Informationsressourcenmanagement
in einem
InformationsUnternehmen
voneinander ab (Kapitel 1)? Kapitel 2 geht auf den Begriff „Information", vor allem in betriebswirtschaftlicher Perspektive ein und zeigt die Unterschiede zwischen „Daten", „Information", „Wissen" und „handlungsrelevantem Wissen" auf. Wie ist handlungsrelevantes
Vorwort
XIX
Wissen in einem betrieblichen Informationssystem, beispielsweise einem Data Warehouse,
zu
organisieren?
Welche
Informationskanäle
sind
für
das
Informationsressourcenmanagement relevant? Gibt es neben dem Internet weitere nützliche Quellen? Welche Vorteile haben Online-Datenbanken gegenüber CDROM-Lösungen? Wie ist Just-in-time Information für jeden Informationsbedarf in einem Unternehmen organisierbar? Lassen sich externe Informationen in ein Intranet integrieren? Daten, Informationen oder Wissen, egal, ob in einem Data Warehouse oder einer kommerziellen Online-Datenbanken, bedürfen der Ordnung. Vorherrschende Ordnungssysteme
im Bereich der Wirtschaftsinformationen sind
Klassifikations-
systeme und Thesauri. Was ist überhaupt ein Begriffssystem oder warum brauchen wir so etwas in der Informationswirtschaft? Wie sind konkrete Klassifikationssysteme aufgebaut? Wir werden dies an den Beispielen der Dewey Decimal Classification, der NACE, des Predicasts Product Code sowie der Internationalen Patentklassifikation darstellen. Die Dewey Decimal Classification wird am Einsatz in zwei großen Bibliotheken, der Library of Congress und der British Library, vorgeführt. (Am Rande: In der Informationsgesellschaft erhalten Bibliotheken - als Verwalter des Wissens - eine große Bedeutung, die in der Betriebswirtschaftslehre bislang noch nicht gebührend wahrgenommen worden ist.) Was ist ein Thesaurus? Wie können wir durch terminologische Kontrolle und Relationen
zwischen
Begriffen die Sprache der Wirtschaft in den Griff bekommen? Wie wird nach einem Thesaurus indexiert, d.h. wie werden die relevanten Inhalte einer Vorlage in einer Datenbank abgebildet? Auch beim Thesaurus arbeiten wir mit einem konkreten Beispiel, dem Standard-Thesaurus Wirtschaft (Kapitel 3). Ein Informationswirt muß Suchmethoden und -Strategien in Datenbanken wie im Internet beherrschen. Kapitel 4 konzentriert sich auf Suchtechniken. Wie finde ich die „richtigen" Datenbanken? Und wie finde ich in diesen Datenbanken die „richtigen" Informationen? Wir werden mit dem „Nadel-im-Heuhaufen"-Syndrom konfrontiert. Aufgabe ist, aus Milliarden potentiell zutreffender Datensätze die wenigen
Informationseinheiten
zu
finden,
die
einen
Informationsbedarf
befriedigen. Wir beschreiben Datenbankführer, hostspezifische Indices
sowie
„Bluesheets" und gehen auch kurz auf die Preise der Informationen ein. Großen Raum müssen wir den einzelnen Suchtechniken widmen.
Mengentheoretische
(„Boolesche") Operatoren werden genauso besprochen wie Abstandsoperatoren, hierarchische Suchen, Häufigkeitsoperatoren, Fragmentierungen (Truncation) oder ökonometrische Befehle. Leitidee bei der Bestimmung der Qualität von Such-
XX
Vorwort
ergebnissen ist die Relevanz. Diese ist abhängig vom entsprechenden Frage- bzw. Antworttyp und wird in einem theoretischen Modell durch die Aspekte Recall und Precision erfaßt. Ein Informationsbedarf läßt sich in der Regel nicht durch die Abfrage einer Datenbank befriedigen, sondern erfordert ein Durchstöbern diverser Informationsbestände. Welche Strategien sind dabei zu befolgen? Externe Informationssammlungen sind Experimentierfeld für Methoden des Data Mining. Durch sogenannte „informetrische" Verfahren lassen sich gewisse Informationsmengen quantitativ erfassen. Solche Mengen können etwa die Patente oder die wissenschaftlich-technischen Artikel eines Unternehmens oder eines Wissenschaftlers sein. Kapitel 5 zeigt eine allgemeine informetrische Gesetzmäßigkeit sowie spezielle Varianten dieses Verteilungsgesetzes (Gesetze von Zipf, Bradford, Lotka und Garfield) auf. Die einzelnen Methoden der Informetrie (Rangordnungen, Zeitreihen, semantische Netze auf der Basis von Clusteranalysen, Informationsflußgraphen) können sowohl für Zwecke des Data Mining als auch zur Verfeinerung von Retrievalstrategien eingesetzt werden. In der kommerziellen Informationswirtschaft sowie bei den Suchmaschinen im World Wide Web werden Verfahren automatischer Indexierung
zunehmend
wichtig. Die enormen Informationsmengen lassen eine intellektuelle Indexierung jedes einzelnen Dokuments zum Teil nicht mehr zu. Die Retrievalmöglichkeiten dieser Systeme ergänzen die Suchbefehle, die wir im Kapitel 4 kennengelernt haben. Suchen werden hier durch natürlichsprachige Sätze oder sogar durch ganze Dokumente eingeleitet. Um konkrete Retrievalsysteme bzw. Suchmaschinen und ihre Stärken und Schwächen einschätzen zu können, ist es hilfreich, die Grundlagen der automatischen Indexierung zu beherrschen. In diesem Sinne vermittelt Kapitel 6 einen Einblick in die informationslinguistischen, statistischen und ordnungstheoretischen Aspekte der automatischen Indexierung. Kapitel 7 geht auf solche Informationsinhalte ein, die - in der Regel kostenlos - im World Wide Web angeboten werden. Am Anfang steht eine Warnung: Obgleich die Inhalte in der Tat umsonst sind, sind Internetrecherchen für ein Unternehmen nicht billig, sondern kosten - im Vergleich zur Nutzung kommerzieller OnlineArchive - sehr viel Zeit. Notwendig für die betriebliche InformationsWirtschaft ist das W W W bei Informationen, die entweder ausschließlich als HTML-Dokumente im Netz liegen oder die über das Web bequem zu erreichen sind. Die systematische Suche (im Gegensatz zum „Browsen", „Stöbern", wo ausschließlich den Links gefolgt wird) geschieht mithilfe von Retrievalsystemen (Suchmaschinen mit automatischer Indexierung, klassifikatorische Systeme, Meta-Suchmaschinen), von
Vorwort virtuellen
XXI Bibliotheken
oder
von
Systemen,
die
die
Daten
genau
eines
Informationsanbieters (etwa eines Verlages) erschließen. Die Suche nach externen Informationen findet in der Informationswirtschaft niemals isoliert statt; externe Informationen müssen stets in das betriebliche Informationssystem
im
Sinne
einer
ganzheitlichen
Informationswirtschaft
eingebettet werden. Kapitel 19 greift die theoretischen und methodischen Überlegungen aus den Kapiteln 1 bis 7 vor dem Hintergrund der Typen der externen Informationsressourcen noch einmal auf und zeigt, wie unterschiedliche Arten von Informationsbedarfen im Unternehmen befriedigt werden. Diskutiert wird zudem die Frage nach dem „gläsernen Unternehmen": Wie gut sind Firmeninformationen in öffentlich zugänglichen Ressourcen abgebildet?
Typen externer Informationsressourcen Der zweite Teil besteht aus den Kapiteln 8 bis 18 und beschreibt die einzelnen Typen externer Informationsressourcen. Es geht in diesem Teil nicht darum, einen Überblick über alle jeweils wichtigen Datenbanken zu schaffen. Dies ist allein aus quantitativen Gründen nicht machbar, gibt es doch derzeit allein mehrere tausend Online-Quellen der kommerziellen Informationswirtschaft mit schätzungsweise 10 Milliarden Datensätzen. Unser Anspruch ist viel bescheidener und bringt einen Überblick der Typen der Ressourcen. Verdeutlicht werden die einzelnen Typen an paradigmatisch ausgewählten „Muster"datenbanken. Drei Trends charakterisieren eine derzeit zu beobachtende Phase der internationalen kommerziellen Informationswirtschaft: •
Informationsanbieter im Online-Bereich arbeiteten bis vor wenigen Jahren in der Regel mit ausgewiesenen Datennetzen (in Deutschland etwa Datex-P) und mit einer elaborierten Suchsoftware, die nahezu ausschließlich von Fachleuten zu beherrschen war. Derzeit befinden sich die Online-Archive in einer Umbruchphase hin sowohl zu benutzerfreundlicher Client-Software als auch zu Oberflächen im World Wide Web. Damit werden die Online-Archive auch für gelegentliche Nutzer zugänglich (vgl. Stock 1999a).
•
Informationsproduzenten, insbesondere die großen, stehen angesichts der Möglichkeiten des Internet vor der Wahl, ihre Datenbestände - wie bisher über Online-Archive zu vertreiben oder aber auf diese Absatzmittler zu
XXII
Vorwort
verzichten und die Informationen direkt im W W W anzubieten (vgl. Benscheck 1999). Auch eine Parallelvermarktung ist durchaus denkbar. •
Die Zukunft der C D - R O M ist unsicher. Von vielen wird dieser Kanal nur als „ Ü b e r g a n g s m e d i u m " eingeschätzt, das zugunsten des aktuelleren Online künftig an B e d e u t u n g verlieren kann. Völlig unklar ist ferner, o b das Medium D V D (mit ungleich größerem Speichervolumen als bei der C D - R O M ) in der Informationswirtschaft Einsatz finden wird.
Diese drei T r e n d s führen dazu, daß in der Branche der Informationswirtschaft derzeit viele Veränderungen vorliegen. Insofern sind unsere Beispiele nicht davor gefeit, daß sie in den kommenden Jahren an einer ganz anderen Stelle innerhalb der Informationswirtschaft zu finden sind. W a s dagegen stabil bleiben wird, ist die Typologie
der Informationsressourcen. Lernziel dieses Teiles können also vor-
wiegend die Informationstypen, nicht aber die einzelnen Musterdatenbanken sein.
Kapitel 8 wendet sich den wirtschaftswissenschaftlichen Informationen zu. Beschrieben werden zwei volkswirtschaftliche Datenbanken ( E C O N I S und EconLit) sowie zwei betriebswirtschaftliche Informationssammlungen (BLISS und A B I / I N F O R M ) . Datenbanken, die nur bibliographische Nachweise anbieten, bedingen als zweiten Arbeitsschritt die Beschaffung der Volltexte. Wir skizzieren entsprechende Lieferwege. Mehrere wirtschaftswissenschaftliche Zeitschriften sind bereits abfragbar mit d e m gesamten Fließtext in Online-Datenbanken enthalten. Sind solche Datenbanken zusätzlich dokumentarisch ausgewertet, so bereitet eine thematische Suche in der Regel wenig Probleme. Reine Volltextdatenbanken sind dagegen nur mit elaborierten Retrievalstrategien
nutzbringend abfragbar. Ein
idealer Einstieg in die wirtschaftswissenschaftlichen Informationen des World W i d e W e b bieten die Dienste der NetEc-Gruppe. Wie kommt ein Unternehmen zu den relevanten und aktuellen Informationen der Marktforschung?
Kapitel
Informationswirtschaft. tionsressourcen
der
9 skizziert
Die
die
Möglichkeiten
Sekundärmarktforschung
kommerziellen
Online-Archive
ist
der
kommerziellen
auf
die
angewiesen,
Informaist
doch
sicherzustellen, daß vor der Durchführung eigener Primärforschung die entsprechende Sekundärforschung komplett vorliegt. Fakteninformationen zur Marktforschung wie eine spezifische Tabelle, eine Rangordnung (etwa eine „Top-10-Liste") oder eine Zahlenangabe liegen in der Datenbank F A K T oder in den Informationsquellen der GfK-Marktforschung vor. Bei den bibliographischen Datenbanken zur Marktfor-
Vorwort
XXIII
schung stellen wir die „International Market Research Information" (IMRI) vor; bei den Volltextquellen gehen wir besonders auf Investext ein. Kapitel 10 widmet sich einem Informationsbereich, wo die „Informationsflut" sehr groß ist: den Wirtschaftsnachrichten in Agenturmeldungen, Tageszeitungen, Wirtschaftszeitungen, Branchennewslettern. Schätzungen ergeben ein Wachstum der Nachrichten von rund 20.000 pro Tag. Ohne die Hilfsmittel der Wirtschaftsdokumentation (eingesetzt werden hier in der Regel Klassifikationssysteme) und ohne ausgefeilte Retrievalsysteme stünde man dieser Informationsmenge chancenlos gegenüber. Bei den - stets aktuellen - Datenbanken der Presseagenturen widmen wir Reuters den meisten Platz; als Beispiel für eine Tageszeitung stellen wir ausführlich die Archiv-Datenbank der F.A.Z. vor; im Bereich der Newsletter thematisieren wir die Datenbanken der Information Access Company. Zentral wird jeweils die inhaltliche Erschließung der Meldungen behandelt, ist diese doch der Schlüssel für den effizienten Zugriff auf die Datenbanken. Wir werden in diesem Kapitel darüberhinaus ein Wirtschaftsarchiv (HWWA-Hamburgisches Welt-Wirtschafts-Archiv) und die Methoden der Medienpräsenzanalyse (am Beispiel von Argus Media) kennenlernen. Unter den betriebswirtschaftlichen Unternehmensinformationen (Kapitel 11) fassen wir Fakteninformationen zusammen, die die betriebswirtschaftliche Lage eines Unternehmens beschreiben. Ein Unternehmen steht häufig vor der Situation, über andere Unternehmen Informationen einholen zu müssen, u.a. über (uns bereits bekannte oder über neue) Zulieferer und Abnehmer sowie über Wettbewerber. Grunddaten über Firmen bieten Datenbanken mit Unternehmenskurzdossiers. Für deutsche Unternehmen relevant sind Hoppenstedt (mit einer interessanten Schnittstelle zum Database-Marketing) und Creditreform. Die Eintragungen im deutschen Handelsregister sind im Wortlaut recherchierbar, Bilanzen (zumindest der Veröffentlichungspflichtigen Unternehmen) einschließlich der betrieblichen Kennzahlen liegen online vor. Bonitätsdatenbanken (für Deutschland etwa Creditreform und weltweit Dun & Bradstreet) versuchen eine Risikobewertung von Firmen anhand von Zahlungsverhalten und anderen Kriterien. Produktdatenbanken bieten nicht nur einen Überblick über lieferbare Produkte und ihrer Anbieter, sondern auch eine Schnittstelle zum elektronischen Handel (E-Commerce). Datenbanken zu Konzernverflechtungen und zu Mergers & Acquisitions berichten über Beteiligungen und Käufe. Kapitel 12 befaßt sich mit Ausschreibungen, Geschäftsanbahnungen und Förderprogrammen und gibt damit Informationen zu neuen Geschäftsbeziehungen. Aus-
XXIV
Vorwort
Schreibungen sind in den Datenbanken Tenders Electronic Daily (öffentliche Ausschreibungen aus den EU-Ländern) sowie Subreport (deutsche Ausschreibungen) tagesaktuell gesammelt. Unsere Beispiele für Geschäftsanbahnungen sind die nach dem Prinzip „Angebot - Gesuch" arbeitenden Kooperationsbörsen der Online G m b H . Über alle deutschen Förderprogramme (Bund wie Länder) und über Programme der Europäischen Union berichtet die vom Bundesministerium ftir Wirtschaft und Technologie hergestellte „Förderdatenbank". Man kann die in diesem Kapitel beschriebenen Informationsquellen für eigene Aktionen heranziehen, man kann sich aber auch Informationen über andere Unternehmen besorgen, insofern diese in den Datenbanken aufscheinen (z.B. mit einem Angebot in einer Kooperationsbörse oder als Projektpartner in einem öffentlich geförderten Projekt). In der Zusammenstellung eines umfassenden Dossiers über eine Firma können deren „Selbstdarstellung" in Form von Homepages und Geschäftsberichten nicht übergangen werden (Kapitel 13). Geschäftsberichte börsennotierter Unternehmen sind entweder bei Wirtschaftsarchiven oder bei speziellen Anbietern von Unternehmensinformationen (wie Disclosure) erhältlich. Homepages haben nicht nur eine Informationsfunktion, sondern dienen darüberhinaus zum Kontaktaufbau. Gesucht und gefunden werden Homepages mittels der Retrievalsysteme im World Wide Web. Jedes Unternehmen braucht zur Absicherung seiner Aktivitäten Rechtsinformationen, und zwar sowohl Normen (Gesetze usw.) als auch Entscheidungen und Kommentare bzw. Fachliteratur. Kapitel 14 bespricht deutsche juristische Informationsquellen (u.a. Juris) und solche der Europäischen Union (Celex). Besonderes Augenmerk wird auf das Online-Archiv Lexis-Nexis gelegt, ist dies doch der Weltmarktfuhrer im Bereich der juristischen Informationen. Kapitel 15 betrachtet gewerbliche Schutzrechte (vor allem: Patente und Marken) aus der Perspektive von Wirtschaftsinformationen. Patente sind dynamische Dokumente, sie ändern im Laufe der Zeit ihren Rechtsstand (von der Offenlegungsschrift zum erteilten Patent; Wechsel von Eigentümern; Anmeldung der gleichen Erfindung bei weiteren Patentämtern; Erlöschen des Patents). Patentrecherchen dienen unterschiedlichen Informationsbedarfen und erstrecken sich von der Beobachtung eines technischen Gebiets oder eines Wettbewerbers über die Suche nach erloschenen Patenten oder nach Lizenzen bis zu Verletzungs- und Abwehrrecherchen, wenn fremde Patentanmeldungen mit eigenen Ansprüchen in Konflikt geraten. Alle Patente sind durch das gleiche Hilfsmittel (die Internationale Patentklassifikation) erschlossen. Analoges gilt für die Abbildung von Markeninformationen;
Vorwort
XXV
hier liegen mit der „Nizza-Klassifikation" (für Waren und Dienstleistungen) und der „Wiener Klassifikation" (für figürliche Darstellungen) international akzeptierte Dokumentationssprachen vor. Forschungs- und Entwicklungsaktivitäten von Unternehmen (Kapitel 16) haben in unserem Kontext zwei Aspekte. Zum einen geht es darum, den Rohstoff Information im eigenen Unternehmen optimal in die FuE- und Innovationsaktivitäten einzubauen. Wir betrachten im Überblick die Informationsflüsse zwischen Grundlagenforschung, Technik, Design und Innovationen und stellen eine Auswahl wissenschaftlich-technischer Informationsressourcen (darunter Datenbanken des Institute for Scientific Information sowie Datenbanken mit Hochschulschriften) vor. Zum andern nutzen wir die Informationen in den wissenschaftlich-technischen Datenbanken zur Konkurrenzbeobachtung. Es wird hier möglich, Frühindikatoren auf mögliche neue Produkte oder Produktionsprozesse abzuleiten. Personenbezogene Informationen werden in der Untemehmenspraxis vor allem bei der Suche nach neuen Mitarbeitern sowie bei Einschätzungen von neuen Geschäftspartnern benötigt. Kapitel 17 demonstriert biographische Datenbanken und Suchwerkzeuge beim Aufstöbern verstreuter personenbezogener Informationen im Internet und in den kommerziellen Online-Archiven bis hin zu Strategien des HeadHunting mittels informetrischer Methoden. Kapitel
18 geht
auf wirtschaftsstatistische
Zeitreihen
ein.
Zeitreihen
sind
Sammlungen numerischer Werte, die nach der Zeit geordnet sind. In der innerbetrieblichen
Informationswirtschaft reicht in der Regel die „reine" Präsentation
einer Zeitreihe nicht aus. Gefordert ist vielmehr eine Zeitreihenanalyse zur Erklärung und Prognose eines ökonomischen Sachverhalts. Jede Zeitreihe erfordert ein spezifisches Hintergrundwissen, das wir an der Konstruktion eines Beispiels (Geschäftsklima-Indikator des ifo Instituts für Wirtschaftsforschung) detailliert darlegen. Beispiele für Anbieter elektronischer Zeitreiheninformationen sind DSI Data Service & Information und Standard & Poor's DRI. DRI bietet neben den Zahlen auch ökonometrische bzw. statistische Software zur Weiterverarbeitung an.
Fallstudien Der (kurze) dritte Teil besteht nur aus einem Kapitel (20) und bringt Fallstudien. Gezeigt wird an konkreten paradigmatischen Fällen das Zusammenspiel
von
Vorwort
XXVI
speziellen Informationsinhalten (aus den Kapiteln 8 bis 18) mit den theoretischen sowie methodischen Aspekten (aus den Kapiteln 1 bis 7 sowie 19). Als Musterbeispiel für einen Host mit Endnutzerorientierung präsentieren wir Profound (Kapitel 20.1), ein Produkt der Dialog Corp. Schwerpunkt
von
Profound sind Informationen über Märkte und Unternehmen. Profound ist so ausgelegt, daß Mitarbeiter in Unternehmen ohne Schwierigkeiten mit dem System umgehen können. Ein System mit automatischer Indexierung ist Freestyle von Lexis-Nexis (Kapitel 20.2). Hier sind natürlichsprachige Nutzereingaben möglich. Im Zusammenspiel von „klassischem" mengentheoretischen
Retrieval und den Algorithmen
der
automatischen Inhaltserschließung lassen sich auch sehr große Datenbanken (mit mehreren zehn Millionen Datensätzen) zielführend durchsuchen. Eine Online- bzw. CD-ROM-Datenbank werden wir genau analysieren.
Die
„Anatomie" gilt der ifo Literaturdatenbank des ifo Instituts für Wirtschaftsforschung in München (Kapitel 20.3), einer bibliographischen Datenbank mit Informationen zu Volkwirtschaft und Konjunkturforschung. Einige
Datenbankproduzenten
bieten
ihre
Informationen
nicht
nur
über
Absatzmittler wie Online-Archive an, sondern vermarkten sie selber. Die Variante einer Intranet-Lösung betrachten wir in Kapitel 20.4 am Beispiel des Web of Science, einer der größten wissenschaftlich-technischen Datenbanken, die derzeit angeboten werden. Das World Wide Web ist im Kapitel 20.5 durch eine Suchmaschine (AltaVista) vertreten. Wir skizzieren sowohl die Arbeitsweise von AltaVista als auch die Retrievalmöglichkeiten für Nutzer.
Im Zentrum der Betrachtung: Wirtschaftsinformationen Bei der Auswahl der Informationsressourcen orientieren wir uns daran, was ein Unternehmen (oder auch eine öffentliche Verwaltung) an Informationen benötigen könnte. Dieses Schwergewicht auf den Wirtschaftsinformationen bedeutet jedoch nicht, daß wir nur Informationen über die Wirtschaft besprächen, infrage kommen vielmehr alle Informationen für die Wirtschaft, und dies sind u.a. auch wissenschaftlich-technische sowie juristische Informationen. Soweit möglich, werden die einzelnen Informationsressourcen durch Beispiele verdeutlicht. (Eine Anmerkung am Rande: Das Buch und auch einzelne Kapitel erscheinen recht „dick" und
XXVII
Vorwort
könnten Leser abschrecken. Durch die vielen Beispiele, die j a nur der vertiefenden Illustration dienen, reduziert sich der Umfang an Text enorm, und das Buch dürfte bequem durchzuarbeiten sein.) Jedes Kapitel endet mit einem „Fazit", in dem wir knapp auf die wichtigsten Inhalte des Kapitels hinweisen. Innerhalb der Kapitel wird auf einschlägige Literatur verwiesen. Einen Überblick über die verwendeten und einige weiterfuhrende Schriften bringt das Literaturverzeichnis. Eine Auswahlliste von Zeitschriften und Newsletter nennt relevante Periodika der Informationswirtschaft.
Zielgruppe Das Buch versteht sich als Grundlagenmaterial
für Lehrveranstaltungen
wie
„Informationsressourcenmanagement", „Knowledge Management", „Retrieval externer Informationen", „Informationsbeschaffung" o.ä. innerhalb folgender Studiengänge: •
Betriebswirtschaftslehre
•
Informationswirtschaft
•
Wirtschaftsinformatik
•
Informationsmanagement
•
Informationswissenschaft.
Unterstützend ist es bei der Vorstellung der einzelnen Ressourcentypen sowie der Fälle (Kapitel 8 bis 18, 20) sinnvoll, an konkreten Systemen zu üben. Neben dem Vorhalten der technischen Ausstattung ist dabei zu bedenken, daß - außer bei den freien Informationen im Internet - stets Verträge mit den Informationsanbietern geschlossen sein müssen. (Dies ist in der Regel kein Preisproblem: Hosts schließen großzügig rabattierte Verträge mit Hochschulen ab. Wird nur stundenweiser Zugang gewünscht, so besteht bei einigen Hosts auch die Möglichkeit, mit kostenlosen Passwörtern zu arbeiten.) Die Anschriften wichtiger Online-Archive werden im Anhang genannt.
Für Unternehmen in deutschsprachigen Ländern sind u.a. die folgenden OnlineArchive mit Wirtschaftsinformationen relevant:
XXVIII
Vorwort
•
GBl (Gesellschaft für betriebswirtschaftliche Information), München
•
GENIOS (Düsseldorf; Frankfurt)
•
Dialog Corp. (Frankfurt) mit den Hosts DataStar, Dialog und Profound
•
FIZ Technik (Frankfurt)
•
Juris (Saarbrücken)
•
Lexis-Nexis (Frankfurt)
•
Reuters (Frankfurt)
•
ggf. STN-International
(deutscher Partner: FIZ Karlsruhe),
Schwerpunkt:
Wissenschaftsinformationen. Die Inhalte und die Retrievalsoftware dieser Online-Archive sind - für den OnlineBereich der kommerziellen Informationswirtschaft - nicht umgehbares Basiswissen für Informationswirte beim Management externen Wissens. Neben Studierenden wendet sich das Buch an Praktiker, die mit Problemen der Beschaffung und Verbreitung externer Informationen in Unternehmen
oder
anderen Organisationen kämpfen, also an Informationsvermittler, „Onliner", Informationsmanager oder Knowledge Manager.
Ausblick Dieses Buch thematisiert vorwiegend die externen Informationsressourcen. Und hierbei legen wir das Schwergewicht auf Wirtschaftsinformationen. Nur am Rande gehen wir auf Wissenschaftsinformationen ein. Die wichtige Wertkette Wissenschaft - Information - Innovation wird hier nur angedeutet. Die Betrachtung der unternehmensexternen Informationen muß durch eine Analyse der internen Informationsressourcen ergänzt werden. Ebenso erfahrt der Leser nichts über Planung, Organisation und Betrieb eines Unternehmens der Informationswirtschaft und auch nichts über diese Komponenten der innerbetrieblichen Informationswirtschaft. Das Lehrbuch „Informationswirtschaft" konzentriert sich auf die Beschreibung und Analyse der Informationsinhalte
und wird deshalb nicht auf Wirtschaftsinformatik
und auch nicht auf Informationsmanagement eingehen. Für diese Disziplinen
XXIX
Vorwort
liegen bereits einschlägige Lehrbücher vor. Zu erinnern ist beispielsweise bei der Wirtschaftsinformatik an Ferstl/Sinz 1998 oder Janko 1993, beim Informationsmanagement an Heinrich 1999 oder Fank 1996.
Ich verdanke den Kollegen und Studierenden im Studiengang schaft an der Fachhochschule
Köln sowie beim Institut für
schaft der Karl-Franzens-Universität
InformationswirtInformationswissen-
Graz wertvolle Hinweise. In dieses Buch
konnten auch Erfahrungen einfließen, die ich in der Praxis des Management externen Wissens am ifo Institut für Wirtschaftsforschung München sammeln konnte.
Wolfgang G. Stock Köln, Oktober 1999
1 Informationswirtschaft in der Informationsgesellschaft
1.1 Was heißt „Informationsgesellschaft"? Versuch einer Präzisierung Informationswirtschaft kann als eine spezielle Betriebswirtschaftslehre verstanden werden. Normalerweise wird man bei Lehrbüchern zu speziellen Betriebswirtschaftslehren „direkt loslegen", die Bedeutung des Spezialgebietes fiir Unternehmen ist jedem einsichtig. Bei der Informationswirtschaft ist dies (noch) anders. Unternehmen kennen Managementinformationen, Marketinginformationen, Personalinformationen usw., alle kennen die Informationswirtschaft jedoch wahrscheinlich noch nicht. Die besondere Bedeutung der betrieblichen Informationswirtschaft ergibt
sich
nämlich
erst
mit
dem
Aufkommen
der
sogenannten
„Informationsgesellschaft". In dieser Gesellschaftsform spielen Informationen eine zentrale Rolle. Für Unternehmen oder Behörden in der Informationsgesellschaft wird sich einiges ändern. Die Informationen, die vormals im Unternehmen mehr oder minder bezugslos voneinander zirkulierten, müssen innerhalb eines lichen Systems
ganzheit-
verarbeitet und verteilt werden, externe Informationen müssen
systematisch erhoben und in das betriebliche Informationssystem eingebettet werden, die Kommunikation des Unternehmens, intern (u.a. auch im Rahmen von Telearbeit) wie extern, wird in elektronischer Form vonstatten gehen. Was heißt überhaupt „Informationsgesellschaft"? Eine grundlegende Aufgabe ist für uns zunächst, eine plausible Arbeitsdefinition zu schaffen, denn die wissenschaftliche wie politische Terminologie ist bei diesem Begriff ausgesprochen schillernd.
Informationsgesellschaft als (fünfte) Kondratieff-Welle Wir wollen zur Klärung des Begriffs auf die Theorie des „fünften Kondratieff' zurückgreifen. Zugrundegelegt wird die Theorie der langen Wellen, die auf Nikolai D. Kondratieff
zurückgeht. Kondratieff
zeigt anhand empirischen Materials
Evidenzen für das Vorliegen langer Zyklen der kapitalistischen Wirtschaft von etwa 48 bis 60 Jahren. Ursache dieser langer Wellen sind Gesetzmäßigkeiten des Kapitalismus, nicht etwa äußere Einflüsse. Als mögliche externe Ursachen diskutiert und verwirft Kondratieff Kriege, Revolutionen, soziale Spannungen, die Ein-
2
1 Informationswirtschaft
beziehung neuer Länder in die Weltwirtschaft, Goldgewinnung und -Vermehrung sowie den technischen Fortschritt. Zentral ist der letztgenannte Aspekt. „Während des Absinkens der langen Wellen werden besonders viele wichtige Entdeckungen und Erfindungen in der Produktions- und Verkehrstechnik gemacht, die jedoch gewöhnlich erst beim Beginn des neuen langen Anstiegs im großen auf die wirtschaftliche Praxis angewandt zu werden pflegen" (Kondratieff 1926, 591). Änderungen in der Technik „üben auf den Gang der kapitalistischen Dynamik unstreitig einen mächtigen Einfluß aus" (ebd., 593), sie sind aber mitnichten Ursache für die Wirtschaftsentwicklung. „Vom wissenschaftlichen Gesichtspunkt aus wäre es aber ein ... Irrtum zu meinen, daß Richtung und Intensität dieser Entdeckungen und Erfindungen ganz zufallig wären; weit wahrscheinlicher ist es, daß diese Richtung und Intensität eine Funktion der Anforderungen der praktischen Wirklichkeit und der vorausgegangenen Entwicklung von Wissenschaft und Technik sind" (ebd., 593). Fazit der Überlegungen KondratiefJs
ist: Es genügt „zu einer wirklichen
Änderung der Produktionstechnik nicht, daß wissenschaftlich-technische Erfindungen vorliegen; diese können unwirksam bleiben, solange die ökonomischen Vorbedingungen zu ihrer Anwendung fehlen" (ebd., 594). Joseph A. Schumpeter
modifiziert Kondratieffi,
Ansatz. Hier werden die techni-
schen Innovationen zu Antriebskräften der wirtschaftlichen Entwicklung. „Alle zyklischen Bewegungen lassen sich mit den Begriffen des Prozesses der wirtschaftlichen Entwicklung ... erklären. Innovationen, ihre unmittelbaren und ferneren Auswirkungen und die Reaktion des Systems sind die gemeinsame 'Ursache' für alle ..." (Schumpeter 1961, 181) und: „... Innovationen (sind) die eigentliche Quelle zyklischer Schwankungen ..."(ebd., 176). Leo A. Nefiodow folgt Schumpeter
und interpretiert Innovationen als Ursache für
die langen Wellen der kapitalistischen Wirtschaft. „Innovationen, die umfassendes wirtschaftliches
Neuland
erschließen
und
einen
Schwärm
von
Nachfolge-
innovationen auslösen ('bandwagon-effect'), werden Basisinnovationen genannt. Sie waren und sind die tragenden Neuerungen für lange Phasen der Konjunktur. Die Dampfmaschine, die Eisenbahn, die Elektrifizierung, das Automobil sind Beispiele für Basisinnovationen. Jede dieser Erfindungen hat eine lange Periode der Prosperität ausgelöst und zu einer weitreichenden Umorganisation der Gesellschaft gefuhrt" (Nefiodow 1991, 47). Seit Beginn des Kapitalismus sind vier lange Wellen zu beobachten: ein erster Zyklus mit der Dampfmaschine als Basisinnovation, der zweite Zyklus basiert auf der Eisenbahn, der dritte auf Chemie und Elektrizität und schließlich der vierte Zyklus auf der Petrochemie und der Automatisie-
1 Informationswirtschaft
3
rung. Die fünfte Kondratieff-Welle ist bereits im Entstehen begriffen. „Sie wird vom Innovationspotential der Ressource Information getragen, und sie wird die endgültige Etablierung der Informationsgesellschaft mit sich bringen" (ebd., 39). Jeder Kondratieff-Zyklus bringt typische Netze hervor, der zweite Zyklus etwa die Schienennetze, der dritte die Gas- und Elektrizitätsnetze und der vierte die Straßennetze bzw. Autobahnen. Netze der fünften Kondratieff-Welle sind die Telekommunikationsnetze.
Abb. 1.1: Die langen Wellen der Konjunktur gemäß Neflodow
Wenn wir die Positionen Kondratieffs behauptet Kondratiejf
und Nefiodows
stark überzeichnen wollen,
als Ursache für Wandel die Wirtschaft, Wirkung ist u.a. die
jeweilige Basisinnovation. Nefiodow
sieht als Ursache die Basisinnovation, als
deren Wirkung eine typische lange wirtschaftliche Welle. Einmal wäre die Wirtschaft der Informationsgesellschaft der Auslöser fiir Innovationen im Bereich Information, Kommunikation und Telematik, zum andern wären die genannten Innovationen Auslöser für die Informationsgesellschaft. Wenn es politisch er-
4
1 Informationswirtschaft
wünscht erscheint, die Informationsgesellschaft aufzubauen, so müßte man nach Kondratieff
bevorzugt
Wirtschaftspolitik, nach Nefiodow
bevorzugt
Wissen-
schafts- und Technikpolitik betreiben.
Eine vermittelnde Position zwischen den beiden anscheinend gegensätzlichen Ursache-Wirkungs-Ketten nimmt das „Metamorphose-Modell" von Mensch
ein.
„Schumpeters Einsicht: 'Die Innovationen tragen die Konjunkturen' und bewirken den wirtschaftlichen Aufschwung, fuhren wir hier fort. Wir fragen, woher denn die Innovationen kommen, denn sie fallen j a nicht vom Himmel ('exogene Variable'). Vielmehr entstehen sie im evolutorischen Wechselspiel von Stagnation und Innovation ...", schreibt Gerhard Mensch (Mensch 1975, 15). Demnach ist die Basisinnovation Ursache für die Aufschwungphase eines Kondratieff-Zyklus', für die Abschwungphase des vorangehenden Zyklus' ist jedoch das ökonomische System ausschlaggebend. „Das gesamte evolutorische Geschehen im sozial wirtschaftlichen Ganzen wird in einen Regelkreis gebunden: Stagnation in Systemteilen und im ganzen System fördert Einzelinnovationen an strukturell geeigneten Stellen, und die Innovation läßt manch altbewährtes Teil als altes Eisen erscheinen. Innovation und Stagnation induzieren einander" (ebd., 85). Da sehr viel dafür spricht, daß das Regelkreis-Modell von Mensch zutrifft, daß also wechselseitige Abhängigkeiten zwischen Wirtschaftssystem und den jeweils tragenden Basisinnovationen bestehen, sollten Wirtschafts- und Wissenschaftspolitik koordiniert vorgehen, um die Entwicklungsstufe der Informationsgesellschaft zu erreichen - dies gilt sowohl für eine nationale Informationspolitik als auch für die Politik eines konkreten Unternehmens.
Informationsgesellschaft als Wissensgesellschaft Welche Regelmäßigkeiten sind der Ressource Information zu eigen? Die „Bewegung" von Informationen beruht nach Manfred Bonitz auf der Basis zweier einfacher grundlegender Prinzipien: auf dem Holographie- und dem Tempo-Prinzip. (Bonitz betrachtet ausschließlich wissenschaftliche Informationen. Unseres Erachtens sind seine Prinzipien jedoch auf alle Arten von Informationen anzuwenden.) Das Holographie-Prinzip beschreibt den Raum der Information. „Die Gesamtheit menschlichen Wissens ist ein riesiges Hologramm, das aus allen Speichern, Datenbasen usw. besteht, über die der Mensch verfügt" (Bonitz 1986b, 192). Die
1 Informationswirtschaft
5
Gesamtheit aller Informationen ist überall virtuell vorhanden. „Jede beliebige ... Information ist von jedem beliebigen Ort aus abrufbar" (Bonitz 1986a, 7). Die Informationsgesellschaft - und in deren Folge die Informationswirtschaft - ist demnach prinzipiell global definiert. Das Tempo-Prinzip beinhaltet die Bewegung der Information in der Zeit. „Danach hat jede Information die Tendenz, sich so zu bewegen, daß sie ihren Adressaten in der kürzestmöglichen Zeit erreicht" (Bonitz 1986b, 192). Das Tempo-Prinzip gilt zwar in der gesamten Geschichte der menschlichen Kommunikation, doch ist das Tempo von Etappe zu Etappe schneller geworden. Mit , j e d e r Einfuhrung eines neuen Kommunikationskanals (ist) ein Zeitgewinn für die ... Gemeinschaft einhergegangen" (Bonitz 1986a, 8). Mit der elektronischen Informationsübertragung in internationalen Netzwerken wie u.a. dem Internet wurde die Tempo-Grenze erreicht. Informationen werden zur Zeit ihres Entstehens gesendet und - zumindest potentiell - auch real-time empfangen. Die Informationsgesellschaft ist stets auch eine Wissensgesellschaft. Betrachtet werden m u ß zwar Wissen jeglicher Herkunft, zentral dürfte aber - wie dies auch Bonitz sieht - das wissenschaftliche Wissen und seine Umsetzung in Innovationen sowie als Basis für unternehmerische Entscheidungen sein. Es geht also um die Abfolge Grundlagenforschung, angewandte Forschung und Technik, konstruktive Entwicklung bis hin zu Produkt- und Prozeßinnovationen bei allen Sektoren einer Volkswirtschaft, also bei Landwirtschaft, Industrie und Dienstleistung. Diese Innovationen sind ein Kern künftigen Wirtschaftens. Am Rande: Wir widersprechen hier durchaus der These, daß die Information einen vierten Sektor eröffnet. Vielmehr wirken Informationen auf alle Wirtschaftssektoren, sind aber selbst neutral. Es kann also eine informatisierte Industriegesellschaft genauso geben wie eine informatisierte Agrargese 11 schaft oder eine informatisierte Dienstleistungsgesellschaft. In den drei genannten Wirtschaftssektoren geschieht jeweils die wirtschaftliche Wertschöpfung. Eine andere Frage ist, ob in einer Informationsgesellschaft in den drei klassischen Sektoren Arbeitsplätze benötigt oder ob diese durch Rationalisierung überflüssig werden.
Informationsgesellschaft und Telematik Die die Informationsgesellschaft tragende Ressource Information bedarf entsprechender informations- und kommunikationstechnischer,
d.h. telematischer
6
1 Informationswirtschaft
Geräte und Verfahren: Computer, Netzwerke, Software usw., um das Holographieund das Tempo-Prinzip überhaupt flächendeckend verwirklichen zu können. Ebenso müssen die Unternehmen, Behörden und die Bürger willens und in der Lage sein, diese Geräte auch adäquat anzuwenden. Hieraus folgt ein massiver Einsatz von Telematik-Geräten, von Informations- und Kommunikationstechnik, im Berufs- wie im Privatleben, was man durchaus als „telematische Revolution" umschreiben kann. Die Informationsgesellschaft kommt nur dann zustande, wenn diese telematische Revolution - zumindest bei einer kritischen Masse, d.h. bei einer genügend großen Anzahl der Gesellschaftsmitglieder - stattfindet.
Es wäre allerdings völlig verfehlt, diese Komponente der Informationsgesellschaft überzubewerten oder gar als einzig entscheidende anzusehen. Manche Konzeptionen einer Informationsgesellschaft stellen - die Telematik verabsolutierend - die Informations- und Kommunikationstechnik ungerechtfertigt in den Vordergrund und vergessen die anderen Elemente, vor allem die Wissenskomponente. Hier sei ein bildlicher Vergleich gestattet. Wichtige Hardware-Bauteile der Informationsgesellschaft sind Glasfaserkabel und Silizium-Chips, mithin Material, das aus Sand ( S i 0 2 ) gewonnen wird. Konzentriert man sich beim Ausbau der Informationsgesellschaft ausschließlich auf die Technik, so ist die gesamte Informationsgesellschaft „auf Sand" gebaut. Stellt man jedoch die Informationsinhalte und sozial wie psychisch richtig indizierte Anwendungen in den Vordergrund, so werden wir über das durch die Information übertragene Wissen in Industrie und Dienstleistung Innovationsvorteile erlangen sowie in privaten Anwendungen neue Wege der Wissens- und Unterhaltungsangebote gehen, Aspekte, die letztlich zu einem Gewinn für jedes Mitglied der Informationsgesellschaft werden können.
Wir können nun eine Arbeitsdefinition für „Informationsgesellschaft" zusammensetzen. „Informationsgesellschaft" bezieht sich auf eine Gesellschaft, •
deren Basisinnovationen von der Ressource Information getragen werden (Theorie des fünften Kondratieff),
•
in der Informationsinhalte aller Arten überall und jederzeit zur Gänze zur Verfugung stehen (Holographie- und Tempo-Prinzip) und auch intensiv genutzt werden (Theorie der Wissensgesellschaft),
1 Informationswirtschaft •
7
deren Mitglieder bevorzugt Telematikgeräte zur Information und Kommunikation benutzen (Theorie der telematischen Revolution).
1.2 Unternehmensorganisatiôn in der Informationsgesellschaft Im betriebswirtschaftlichen Bereich wird sich die Basisinnovation Information massiv auswirken. Wir werden bereits bestehende Trends der Änderungen der Unternehmensorganisation aufnehmen und in Richtung Informationsgesellschaft weiterdenken.
Globalisierung Unter „Globalisierung" fassen wir alle Aktivitäten des Auslandsengagements der Unternehmen zusammen, sofern sie über den traditionellen Außenhandel hinausgehen. Herbert Hofmann und Christoph Saul nennen wichtige Dimensionen der Globalisierung: „einen wachsenden unternehmensinternen Handel bei den multinationalen Unternehmen, ein starkes Ansteigen der Direktinvestitionen im Ausland, ein verstärktes 'Global Sourcing' von Vorprodukten, eine internationale Ausrichtung der Unternehmensfunktionen, eine wachsende Abhängigkeit von Unternehmen durch internationale strategische Allianzen, einen verstärkten Technologiefluß sowohl innerhalb als auch zwischen den Unternehmen, eine breitere geographische Streuung der international fuhrenden Unternehmen über die wirtschaftlich wichtigsten Weltregionen" (Hofmann/Saul 1996b, 17).
Globalisierung verstärkt im Rahmen der internationalen Arbeitsteilung den Wettbewerb zwischen den Industrieländern, aber auch zwischen diesen und den Entwicklungsländern. Eine besondere Rolle können die dynamischen Schwellenländer spielen, die ihre internationale Wettbewerbsfähigkeit durchaus kräftig steigern dürften.
Die Globalisierung hängt u.a. von der Liberalisierung und Öffnung der Märkte ab, von steigendem Druck durch neue Wettbewerber in der Weltwirtschaft, von politischen Entscheidungen. Ausschlaggebend für die Globalisierung sind jedoch die neuen Möglichkeiten der Telekommunikation, der Informationstechnik und der
8
1 Informationswirtschaft
damit einher gehenden Software (z.B. Groupware). Die Netzwerke und die darin übertragenen Informationen versetzen Unternehmen in die Lage, „weltumspannend die Produktion, Forschung, Verwaltung, Marketing und Management zu koordinieren. Strategische Allianzen mit anderen Unternehmen, schnelle und flexible Kunden- und Lieferantenkontakte werden auf der Grundlage der globalen Unternehmensvernetzung zunehmen oder eine neue Qualität erhalten" (ebd., 18). Der Fortschritt im Informationsbereich begünstigt die Globalisierung „in hohem Maße", stellt Jürgen Friedrichs fest. „Mit den modernen Informationssystemen - angefangen bei der Satellitenübertragung von Nachrichten bis hin zum Internet und Intranet - können heute Informationen an jedem Ort übertragen werden. Zwischen Unternehmen und innerhalb von Unternehmen ist eine Kommunikation möglich geworden, die unter anderem Kontrollen gestattet, physischen Transport - etwa von Papier - überflüssig macht, rasche Reaktionen auf Börsenkurse erlaubt, es vereinfacht, Dienstleistungen zu verlagern und zudem Zeitunterschiede überwindet" (Friedrichs 1997, 5). Informatisierung ist eine wesentliche Bedingung für Globalisierung, ein global agierendes Unternehmen kann auf Informationstechnik, Software, Informationsinhalte usw. überhaupt nicht verzichten.
Neues ökonomisches Paradigma: „Toyotismus" statt „Fordismus" Das „auslaufende" Modell der industriellen Arbeitsteilung steht für Rationalisierung der Arbeit durch Mechanisierung, für Massenproduktion zur Befriedigung einer stabilen bzw. steigenden Nachfrage und für hierarchische Kontrolle von Arbeitnehmern an ihren eher eintönigen Arbeitsplätzen: Paradigma ist die Fließbandproduktion bei Ford. Der Fordismus ist in der heutigen Wirtschaft nicht mehr gefragt. „Zunehmende Globalisierung auf Beschaffungs- und Absatzmärkten, die Entwicklung zu Käufermärkten und ein beschleunigter technischer Fortschritt haben den Wettbewerbsdruck weltweit erhöht. Kürzere Produkt- und Modellzyklen bei größerer Produktund Modellvielfalt, die Reduzierung von Entwicklungs-, Durchlauf- und Lieferzeiten, gesteigerte Produktqualität sowie erhöhte Innovationsfahigkeit und kundenmaßgeschneiderte Systemlösungen werden heute als Anforderungen im Wettbewerb betont" (Hofmann/Saul 1996a, 38). Diese veränderten Rahmenbedingungen zwingen die Unternehmen, alte Organisations- und Produktionsstrukturen zu überdenken und neu zu gestalten.
1 Informationswirtschaft
9
Das neue Modell erfordert eine globale Optimierung des gesamten Produktionsflusses, wobei die Forschung und Entwicklung, die Konstruktion und die Produktion integrativ vorgehen. Die Massenproduktion wird durch weitere Produkte ergänzt, die nur spezielle Kunden ansprechen. Hieraus folgt eine enge Orientierung an den Wünschen der potentiellen und tatsächlichen Kunden. Über Qualitätsmanagement wird versucht, eine Null-Fehler-Quote im gesamten Produktionsprozeß zu erreichen. Die (wenigen verbliebenen) Arbeitskräfte brauchen eine gesteigerte Kompetenz am Arbeitsplatz. Das Personalmanagement setzt auf Vertrauen und steigert damit das Engagement der Arbeitnehmer: Paradigma kann die Unternehmenskultur bei Toyota sein, wo das neue Modell bereits seit längerem eingesetzt wird.
Der W e g vom Fordismus zum Toyotismus (vgl. Dohse/Jürgens/Malsch
1985)
bedeutet nicht nur neue Managementformen wie zum Beispiel das Qualitätsmanagement, sondern vor allem die konsequente Beachtung der Informationswege und der darauf übertragenen Informationsinhalte. Herbert Hofmann und Christoph Saul betonen, „das 'neue Modell industrieller Arbeitsteilung' impliziert auf allen Betrachtungsebenen eine ansteigende Bedeutung von 'Information' als Produktionsfaktor und folglich ansteigende Informations- und Kommunikationsbedürfnisse der Unternehmen. Vorteile der Netzbildung, von joint ventures und strategischen Allianzen können nur ausgeschöpft werden, wenn eine enge Koordination der Aktivitäten erfolgt. Globale Beschaffungs- und Absatzstrategien setzen aktuelle Informationen über Marktentwicklungen, technische und rechtliche Rahmenbedingungen voraus. Die Ausrichtung der Unternehmensaktivitäten an Kundenbedürfnissen impliziert Kommunikation mit den Kunden. Die Schaffung globaler Informationsnetzwerke verspricht den Zugang zu Informationen, zu weltweit vorhandenem Know-how und Expertenwissen" (Hofmann/Saul 1996a, 40).
Telearbeit in „virtuellen Unternehmen" Global agierende Unternehmen brauchen Mitarbeiter an unterschiedlichen Stellen auf der Welt, die jedoch optimal miteinander kommunizieren können müssen. Insbesondere kleine Unternehmen werden gewisse Tätigkeiten, etwa alle verwaltenden Arbeiten, auslagern und sich ausschließlich auf ihr Kerngeschäft konzentrieren. Die ausgelagerten Funktionen werden dann via Telekommunikation in die betrieblichen Abläufe einbezogen. Außendienstmitarbeiter müssen jederzeit mit
10
1 Informationswirtschaft
der Unternehmenszentrale Kontakt halten. Diese und weitere Entwicklungen fuhren dazu, daß viele (tendenziell alle) informationsbezogenen Arbeiten eines Unternehmens dezentral abgewickelt werden. Unternehmen verlieren damit eine bislang notwendige Standortbindung, so daß es gerechtfertigt erscheint, sie als „virtuell" zu bezeichnen (vgl. Dostal 1995, 533 f.). In virtuellen Unternehmen werden die informationsbezogenen Arbeiten in der Form von Telearbeit stattfinden. Das Forum Informationsgesellschaft
stellt fest,
„Telearbeit wird die Beschäftigungsform der Zukunft für Millionen von Menschen sein" (Forum Informationsgesellschaft 1996, 23). Hier kommt - bildhaft ausgedrückt - die Arbeit zum Menschen und nicht wie bisher der Mensch zur Arbeit.
Zwei grundlegende Änderungen gehen mit der Telearbeit einher. Erstens verfügen wir nicht mehr über genau einen Arbeitsplatz, sondern über mehrere: Zuhause, in Nachbarschaftsbüros, am (nunmehr mit mehreren Kollegen geteilten) Arbeitsplatz im Unternehmen usw. Zweitens ist nicht unbedingt ein Geschäftsverhältnis zu genau einem Arbeitgeber gegeben. Ein Telearbeiter kann durchaus, entweder gleichzeitig oder knapp hintereinander, für unterschiedliche Arbeitgeber arbeiten.
Die Rahmenstrukturen der Erwerbsarbeit, die sich in den letzten 150 Jahren aufgebaut haben, berücksichtigen die Möglichkeiten moderner Telekommunikation und damit auch die Telearbeit nicht. Hier ist ein radikaler Wandel in Sicht. „Abhängige Erwerbsarbeit ist traditionell räumlich und zeitlich festgelegt. Die Arbeitsbewertung erfolgt auch heute noch weitgehend durch unmittelbare Überwachung von Anwesenheitszeit. Die Erfahrungen der Telearbeitsdiskussion zeigen deutlich, daß Telearbeit als abhängige Arbeit nicht organisiert werden kann. Aus Betrieben werden Netzwerke, aus Kollegen Partner. Die Kontinuität von Arbeit wird sich kaum noch sichern lassen" (Dostal 1995, 540).
Wie hoch sind die Potentiale der Telearbeit? Werner Dostal faßt seine Betrachtungen so zusammen. „Telearbeit ist nur dort relevant, wo überwiegend Informationen verarbeitet werden. Wie bereits erwähnt, sind heute in Deutschland etwa die Hälfte der Erwerbstätigen in 'Informationsberufen' tätig. Durch weitere Arbeitsteiligkeit können die informationsbezogenen von den übrigen Arbeitsaufgaben getrennt werden, so daß noch mehr reine Informationsberufe entstehen. Prinzipiell lassen
11
1 Informationswirtschaft
sich alle Informationsaufgaben räumlich und zeitlich entkoppeln, doch zeigen sich in der Praxis manche Einschränkungen, insbesondere wenn es sich um sensible Daten handelt. In der Literatur wird angegeben, daß sofort etwa 10% der heutigen Arbeitsplätze in Telearbeitsplätze umgewandelt werden könnten, weitere 50%, wenn Arbeitsteilung und Aufgabenstrukturen modifiziert w e r d e n " (Dostal 1995, 538). Zukunftsszenarien für Deutschland schätzen ein Potential von 2,5 Millionen bis 4 Millionen Telearbeitsplätzen im Jahr 2 0 0 0 (vgl. ebd.).
Die Einheit der informationstechnischen und organisatorischen Dimension Sowohl Globalisierung, das neue ökonomische Paradigma als auch virtuelle Unternehmensstrukturen bedingen ansteigende und von der Unternehmensleitung sowie den (Tele-)Mitarbeitern zu bewältigende Informationsmengen. Es steigen
die
Quantität und Komplexität der informationstechnischen Dimension und der organisatorischen Dimension. Beide Dimensionen müssen als Einheit verstanden werden. Setzt man etwa einseitig ausschließlich auf Informationstechnik, vernachlässigt man also die Umgestaltung der Organisation, so sind unerwünschte Fehlentwicklungen
durchaus
nicht
auszuschließen.
„Im
informationstechnologischen
Sektor hat die Wissenschaft in der Vergangenheit eine Vielzahl leistungsfähiger Basistechnologien entwickelt, z.B. Nonstandard-Datenbanken, Optimierung, Simulation,
Multimedia,
Führungs-lnformations-Systeme,
elektronischer
Datenaus-
tausch und jüngst die ' D a t e n a u t o b a h n A l l z u o f t wurden und werden sie j e d o c h nur isoliert in ' E n d p r o d u k t e ' umgesetzt oder gar als 'Allheilmittel' propagiert. Ihr Scheitern in der Praxis mußte zwangsläufig vorprogrammiert sein: Als Beispiel sei nur an die Expertensystem-Euphorie A n f a n g der 80er Jahre erinnert" (IMU 1995). Dieses mögliche Scheitern der Informationstechnik liegt nun aber nicht in der Technik selbst begründet, sondern im falschen Einsatz. Das Institut für Informationsmanagement und Unternehmensführung der Universität Osnabrück stellt fest, „gleichwohl tragen diese Technologien mehr denn j e als zuvor erhebliche Produktivitätspotentiale in sich, die im Unternehmensalltag allerdings erst dann vollständig entfaltet werden können, wenn sie gewissermaßen als 'Roh-, Hilfs- oder Betriebsstoffe' verstanden werden, die es zu 'Halbfertigprodukten' zu komprimieren gilt, aus denen konkrete Anwender dann effizient ihre individuellen ' E n d p r o d u k t e ' konfigurieren und kontinuierlich sich ändernden Anforderungen anpassen k ö n n e n " (ebd.).
12
1 Informationswirtschaft
Tab. 1.1: Wettbewerbsvorteile für Unternehmen durch Nutzung von elektronischen Informationen W e t t b e w e r b s v o r t e i l e ( Beispiele)
Zugang zu weltweit vorhandenem wissenschaftlichem und technologischem Knowhow und Expertenwissen Verbesserte Koordination zwischen den Bereichen Forschung und Entwicklung, Produktion sowie Marketing Erhöhung der Geschwindigkeit der Informationsübertragung sowie von Informationsumfang und -qualität Bessere Ausrichtung der Produktion und der Innovationskapazitäten an Kundenbedürfiiissen durch verbesserte Unternehmens-Kunden-Beziehungen Verringerung der Vorleistungskosten durch Multisourcing und Global Sourcing Optimierung der Allokation von Neukunden sowie des Haltens der Kunden durch elektronische Kommunikation Verringerung des Umlaufvermögens und damit sinkende Lagerhaltungskosten in Folge von Just-in-Time-Konzepten Reduzierung der Time-to-Market Bessere Kontrolle von Qualitätsstandards Verringerung von Verwaltungs-, Koordinations- und Kontrollkosten Verringerung von Informations-, Verhandlungs- und Vertragskosten Senkung der minimalen effizienten Losgrößen in der Serienfertigung Verbesserte Möglichkeiten zur kostengünstigen Produktdifferenzierung Erhöhte räumliche Ungebundenheit bei der Wahl von Produktionsstätten, die eine stärkere Ausnutzung regionaler Kostenvorteile ermöglicht Verbesserung des Unternehmensimages
Quelle: verändert nach: Hofmann/Saul 1996a, 41
1 Informationswirtschaft
13
Die konkreten Konfigurationen der Informationstechnik und deren Änderungen haben ihren Fixpunkt in der organisatorischen Dimension. „Die maßgeschneiderte Konfiguration dieser 'Informationssysteme' muß sich ausrichten an bzw. einhergehen
mit
einer
geplanten,
sozialverträglichen
Umgestaltung
der
Unter-
nehmensorganisation sowie der Führungs- und Entscheidungsprozesse bzw. Verantwortlichkeiten" (ebd.). Es gilt etwas zu verhindern, was als „Produktivitätsparadoxon der Informationstechnik" Eingang in die Literatur gefunden hat (vgl. Brynjolfsson 1993): das Ansteigen der Investitionsmittel in EDV verbunden mit einem Gleichbleiben oder gar Abfallen der Produktivität.
Die Bedeutung der Informationsinhalte Neben dem maßgeschneiderten Einsatz von Informationstechnik und der entsprechenden organisatorischen Maßnahmen ist es notwendig, die Informationsinhalte zu beachten, die innerhalb des Unternehmens bzw. zwischen dem Unternehmen und seiner Umwelt übertragen werden. Die Informationstechnik ist ausschließlich eine notwendige Bedingung für die Nutzung der Ressource Information, hinreichend wird die Bedingung erst, wenn auch die Informationsinhalte sowohl in Systeme abgelegt und gespeichert als auch abgefragt und verteilt werden können. Jeder Mitarbeiter muß zu jeder Zeit - just in time - seinen Informationsbedarf optimal befriedigen können.
Einen Oberblick über die Wettbewerbsvorteile eines Unternehmens bei der optimalen Nutzung der Informations- und Kommunikationstechnik und der damit verarbeiteten bzw. übermittelten Informationsinhalte gibt Tabelle 1.1.
1.3 Das Spektrum der Informationswirtschaft im Expertenurteil Da die Informationswirtschaft noch keine etablierte Disziplin ist, lohnt eine Bestandsaufnahme, wie die Bezeichnung „Informationswirtschaft" derzeit in Expertenkreisen verwendet wird. Hierbei greifen wir auf eine Untersuchung zurück, die 1997 an der Fachhochschule Kleibrink/Stock 1997).
Köln durchgeführt worden
ist (vgl.
Dehnert-
1 Informationswirtschaft
14
Ist „Informationswirtschaft" ein klarer und deutlicher Begriff? Vor allen in Zeiten ideologischen Wandels haben bestimmte Worte Hochkonjunktur. Beispiele sind „Informationsgesellschaft" mit der darin wohl
vorherrschenden
„Informationswirtschaft". Schaut man sich die Worte genauer an und versucht man gar, sie (möglichst) allgemeingültig zu definieren, so stößt man auf größte Probleme. Immerhin kann man Informationswirtschaft bereits studieren: u.a. an der Fachhochschule Darmstadt, der Wirtschaftsuniversität Wien, der Universität Karlsruhe oder der Fachhochschule Köln. Die deutsche Bundesregierung hat in ihrem Bericht „Info 2000" in der Informationswirtschaft einen der weltweit größten Wirtschaftszweige ausgemacht. Zudem gab es (bis Ende 1998) einen deutschen „Verband der Informationswirtschaft" in Eschborn, der inzwischen Teil des „Deutschen Multimedia-Verbandes" geworden
ist. Das
Wort, der
Begriff und der Gegenstand
„Infor-
mationswirtschaft" sollten eigentlich hinreichend klar sein. Sind sie aber nicht. Wir wollen - rein beispielhaft - vier der angesprochenen Varianten des Wortes „Informationswirtschaft" näher anschauen, und zwar die Darmstädter, die Karlsruher, die Bonner und die Eschborner Version. Die Fachhochschule
Darmstadt bietet
seit einigen Jahren
einen
Studiengang
„Information und Dokumentation" an, der zum Abschluß „Diplom-Informationswirt" führt. Nach dem ursprünglichen Studienplan geht es hier um dasjenige Praxisfeld, das sich beschäftigt „mit der Sammlung, Sichtung, Erschließung, Verarbeitung und Verftigbarmachung von Information aus allen Bereichen des menschlichen Wissens in die gesellschaftlichen Bereiche hinein, die diese Informationen benötigen" (FH Darmstadt
1992,
2).
Gemäß
Informationswirtschaft Informationstechnik
drei
der
Darmstädter
Bereiche
(Anwendung
der
der
Konzeption
fließen
Informationsarbeit
Technik
zum
Zwecke
in
der
zusammen: der
Informa-
tionsvermittlung), Informationsmethodik (Methoden und Verfahren der Erfassung, Erschließung
und
Vermittlung von
Informationen),
Fachanteil
(in
Darmstadt
entweder Chemie oder Medien und Wirtschaft). „Informationswirtschaft" in Darmstädter Sicht ist demnach eine zeitgemäße Spielart von Dokumentation
bzw.
Spezialbibliothek. In Kooperation der Fakultäten für Informatik und Wirtschaftswissenschaften bietet die
Universität
Karlsruhe
„Informationswirtschaft"
mit
seit
Wintersemester
dem
Ziel
an,
1997/98 Personen
einen
Studiengang
auszubilden,
„die
Informationsflüsse und -produkte erkennen, gestalten, bewerten und wirtschaftlich nutzen
können"
(Univ.
Karlsruhe
1997a).
Die
Lehrinhalte
der
Karlsruher
1 Informationswirtschaft
15
Informationswirtschaft entstammen zu 40% der Informatik, zu weiteren 4 0 % den Wirtschaftswissenschaften und zu 20% den Rechtswissenschaften (vgl. Univ. Karlsruhe 1997b). Fixpunkt ist die Gestaltung von Informationsprodukten bzw. -dienstleistungen entweder in der Informationswirtschaft (als Branche) oder in Unternehmen bzw. Verwaltungen. Informationswirtschaft in der Sicht der deutschen Bundesregierung ist ein Bündel von Branchen, die sich - in irgendeiner Weise - mit Informationen befassen. „Die Informationswirtschaft ist in dieser Abgrenzung neben der Tourismusbranche derzeit bereits der weltweit größte Wirtschaftszweig. Auch zukünftig werden in den einzelnen Marktsegmenten zum Teil jährliche Wachstumsraten von 7 - 15 % erwartet. ... (Zudem wird erwartet), daß die durch Fortschritte bei der Informationstechnik möglichen Innovationen einen lang andauernden Wachstumsschub auslösen" (Bundesregierung
1996, 18). Die Bonner Diktion der Informations-
wirtschaft folgt der Konvergenzthese und sieht die zusammenwachsenden Branchen der
Informationsinhalte (u.a.
Informationsdienstleitungen
mittels
Datenbanken,
Druckerzeugnisse, Film, Video, Audio, TV), der Telekommunikation (u.a. Telefonund Datennetze, Kommunikationsdienstleistungen) und der Informationsverarbeitung (Mikroelektronik,
Informationsverarbeitungssysteme,
Unterhaltungselektronik,
Kommunikationssysteme,
Software, entsprechende Dienstleistungen) als
Einheit.
„Informationswirtschaft" in Bonner Sicht ist der weite Bereich der sog. „4CBranchen" (Communications, Computers, Contents, Consumer Electronics). Auch der Verband der Informationswirtschaft (viw) definiert branchenbezogen allerdings weitaus enger als die Bundesregierung. Der viw vertritt Unternehmen, die als
Produzenten
oder
Händler
von
Informationsinhalten
auftreten, also
Datenbankproduzenten, kommerzielle Online-Hosts, CD-ROM-Verlage,
u.a.
Internet-
Provider oder Informationsvermittler. „Damit deckt der VIW die gesamte Kette vom Informationserzeuger bis zum Informationsnutzer ab" (VIW o.J.), heißt es in der Selbstdarstellung des Verbandes. In der Eschbomer Lesart ist „Informationswirtschaft" der recht kleine Bereich der kommerziellen elektronischen Informationen. Keine der Sichten von „Informationswirtschaft" ist für sich gesehen abwegig. Alle zusammen geben jedoch keinen Sinn. In Darmstadt wird nahezu völlig dasjenige ausgeschlossen, was in Karlsruhe im Zentrum steht (Wirtschaft und Informatik); in Karlsruhe wird dasjenige übergangen, was Darmstadt auszeichnet (Dokumentation). Bei der Branchenabgrenzung liegen mit der Bonner und der Eschborner Version extreme Unterschiede vor. Die viw-Informationswirtschaft ist nur ein sehr kleiner Teil der riesigen Info-2000-Informationswirtschaft.
1 Informationswirtschaft
16
Unsere vier Beispiele sind willkürlich gewählt und verbieten Verallgemeinerungen. Sie dienten
hier nur zum
Beleg, daß es eine
umfassende Definition von
„Informationswirtschaft" derzeit offenbar nicht gibt.
Unterschiedliche Auffassungen von „Informationswirtschaft" Welche unterschiedlichen Lesarten lassen sich heute belegen? Relevant erscheinen uns Aussagen von Experten im Informationsbereich. Wir operationalisieren unsere Fragestellung durch eine Umfrage bei einschlägig ausgewiesenen Fachleuten. Es gilt zu erfahren, wie diese Experten die Relevanz einer vorgegebenen Menge von Disziplinen für die Informationswirtschaft einschätzen. Die entscheidende Frage ist: Gibt es eine „Durchschnittssicht" der Informationswirtschaft bei den Informationsspezialisten, oder liegen diverse, sich ggf. einander ausschließende Einschätzungen vor? Die Umfrage gibt bei der inhaltlichen Einschätzung der „Informationswirtschaft" zwölf Fächer vor, deren Relevanz für unseren Gegenstand bestimmt werden soll: •
Betriebswirtschaftslehre
•
Bibliothekswesen
•
Design
•
Dokumentationswesen
•
Fremdsprachen
•
Informatik
•
Informationswissenschaft
•
Nachrichtentechnik
•
Recht
•
Sprachwissenschaft
•
Statistik Wissenschaftstheorie.
1 Informationswirtschaft
17
Tab. 1.2: Einschätzungen zum fachlichen Spektrum der Informationswirtschaft
Relevanzeinschätzu||»en der Fächer für fünf Cluster (Mittelwerte der Relevanzurteile) Cl
C2
C3
C4
C5
Betriebswirtschaftslehre (1,56 ; 1,72)
1,4
1,7
1,8
1,5
1,8
Bibliothekswesen (2,35 ; 2,56)
3,2
2,9
2,9
2,1
1,6
Design (2,63 ; 2,83)
2,4
3,4
2,3
2,4
3,1
Dokumentationswesen (1,57; 1,72)
2,1
1,9
1,7
1,5
1,3
Fremdsprachen (1,57 ; 1,73)
1,6
1,5
1,7
1,5
1,9
Informatik (1,74 ; 1,94)
2,2
2,1
1,7
1,3
2,1
Informationswissenschaft (1,51 ; 1,67)
2,0
2,0
1,3
1,3
1,5
Nachrichtentechnik (2,60; 2,80)
2,7
3,5
2,6
2,1
2,8
Recht (2,55 ; 2,72)
2,1
3,1
3,1
2,3
2,6
Sprachwissenschaft (3,05 ; 3,22)
2,9
3,8
3,0
2,8
3,1
Statistik (2,50; 2,69)
2,1
3,2
3,0
1,9
2,7
Wissenschaftstheorie (3,13 ; 3,31)
3,1
3,9
3,4
2,8
3,0
Fächer (Durchschnittswerte / 95%Konfidenzintervaile)
Quelle: Stock 1998a N (Cluster C l ) = 43; N (Cluster C2) = 49; N (Cluster C3) = 52; N (Cluster C4) = 65; N (Cluster C5) = 59
18
1 Informationswirtschaft
Bei der Frage nach dem Fächerspektrum der Informationswirtschaft sind vier Werte vorgegeben, die ähnlich wie Schulnoten von 1 (sehr wichtig) bis 4 (nicht wichtig) skaliert sind. Man könnte nun eine „Durchschnittsmeinung" kreieren, die aus dem arithmetischen Mittel der Werte der einzelnen Fächer berechnet wird. Aber eine solche „durchschnittliche" Meinung setzt voraus, daß sich die Gesamtgruppe der Befragten mehr oder minder kohärent verhält. Es kann aber auch sein, daß sich innerhalb aller Befragten Gruppen herauskristallisieren, die untereinander jeweils kohärent votieren, sich aber von den anderen Gruppen eindeutig abheben. Genau dies wollen wir ja eruieren. Zur Klärung des Problems haben wir das Werkzeug der Clusteranalyse eingesetzt. In der Tat ergeben sich unterscheidbare Cluster (siehe Tabelle 1.2). Unsere Clusteranalyse stellt fünf solcher Gruppen vor. Zum Vergleich sind die 95%Konfidenzintervalle der „Durchschnittseinschätzung"
angegeben. Die beiden
Werte im Konfidenzintervall, z.B. Design (2,63 ; 2,83), geben an, daß zwischen den Werten der „wahre" Wert, auf den wir mittels unserer Stichprobe schließen wollen, mit einer Irrtumswahrscheinlichkeit von 5% liegt. Die Durchschnittseinschätzung der Relevanz von Design darf demnach mit einer Wahrscheinlichkeit von 95% zwischen 2,63 und 2,83 vermutet werden. Interessant sind in den Clustern C1 bis C5 vor allem diejenigen Werte, die vom Durchschnittswert signifikant abweichen, d.h. außerhalb des Konfidenzintervalls liegen. Cluster 1 votiert im Vergleich zur Durchschnittseinschätzung besonders positiv beim Fach Betriebswirtschaftslehre (arithmetisches Mittel: 1,4), beim Fach Statistik (2,1) sowie beim Fach Recht (2,1). Ausgesprochen negativ schneidet für die Experten dieser Gruppe das Bibliothekswesen (3,2) ab, leicht negativ die Dokumentation. Für dieses Cluster der „Betriebswirte" ist die Informationswirtschaft vor allem eine wirtschaftliche und juristische Angelegenheit, wo bibliothekarische und auch dokumentarische Fähigkeiten wenig gefragt sind. Dieses Votum ähnelt dem Karlsruher Ansatz der Informationswirtschaft. Cluster 2 hat 49 „Mitglieder", die sich vor allem in durchgehend negativen Urteilen einig sind. Besonders schlecht werden Wissenschaftstheorie (3,9), Sprachwissenschaft (3,8), Nachrichtentechnik (3,5) und Design (3,4) bewertet. Es gibt nur ein Fach, das positiver als der Durchschnitt aller Fragebögen angesehen wird, das ausgesprochen unspezifische Fach Fremdsprachen (1,5). Wir erfahren von dieser Gruppe eigentlich nur, was sie als nicht relevant für die Informationswirtschaft betrachtet. Diese Gruppe der „Pessimisten" kann mit der Informationswirtschaft offensichtlich wenig anfangen.
1 Informationswirtschaft
19
Cluster 3 hat eine eindeutige Leitdisziplin, nämlich die Informationswissenschaft (1,3); recht hoch werden zudem Informatik und Design eingestuft. Ansonsten verteilen sich die Urteile ähnlich wie beim Durchschnitt aller Experten. Cluster 4, mit 65 „Mitgliedern" größtes Cluster, wertet besonders hoch bei Informatik und Informationswissenschaft (jeweils 1,3), Betriebswirtschaftslehre, Dokumentation und Fremdsprachen (Jeweils 1,5). Aber auch Statistik (1,9) und Nachrichtentechnik (2,1) bekommen gute Noten. Hier wird Informationswirtschaft als multidisziplinäre Angelegenheit verstanden. Diese Gruppe der „Optimisten" wertet in jedem Fach positiver als der Durchschnitt. Cluster 5 votiert eher traditionell inhaltsorientiert. Fächer wie Dokumentation (1,3), Informationswissenschaft (1,5) und Bibliothekswesen (1,6) erhalten die besten Noten. Wenn Cluster 1 in der Tendenz dem Karlsruher Ansatz entsprach, so repräsentiert Cluster 5 in etwa die Darmstädter Sicht in der Zeit, wo der Studiengang entwickelt wurde.
Es gibt - so können wir die empirische Untersuchung zusammenfassen - mehrere Strömungen von Meinungen, welche Fächer das neue Gebiet der Informationswirtschaft
aufspannen.
Wenn
„Pessimisten" außer acht
wir
einmal
lassen, haben
die
wir
(recht
Indizien
aussageschwachen)
für vier
voneinander
abweichende Sichtweisen: •
Informationswirtschaft Betriebswirtschaftlehre,
als
spezielle
Fremdsprachen,
Betriebswirtschaft
(Leitdisziplinen:
Informationswissenschaft,
Recht,
Statistik), entspricht Cluster 1, •
Informationswirtschaft als spezielle Informationswissenschaft bzw. Informatik (Leitdisziplinen:
Informationswissenschaft,
Informatik,
Dokumentation,
Fremdsprachen, Betriebswirtschaftslehre, Design), entspricht Cluster 3, •
Informationswirtschaft
als
multidisziplinäre
wirtschaft eher als eigenständige
Angelegenheit
(Informations-
Disziplin verstanden, die Anleihen
bei
diversen Fächern macht), entspricht Cluster 4, •
Informationswirtschaft als zeitgemäße Version von Bibliotheks- und Dokumentationswesen (Leitdisziplinen: Dokumentation, Informationswissenschaft, Bibliothek,), entspricht Cluster 5.
20
1 Informationswirtschaft
Welche Sichtweise sich letztlich durchsetzen wird, dürfte offen sein. Im Sinne einer Konvergenz der unterschiedlichen Strömungen ist nicht ausgeschlossen, daß sich im Laufe der Zeit eine Auffassung der Informationswirtschaft durchsetzen wird, die dann am ehesten Cluster 4 entspricht. Aus dieser Warte ist auch das vorliegende Lehrbuch geschrieben.
1.4 Informationswirtschaft als Wirtschaftsbranche Informationswirtschaft tritt sowohl als Branche als auch als betriebliche Funktion auf. Diese Wirtschaftsbranche produziert, speichert und verteilt Informationen. Player dieser Branche sind sowohl Wirtschaftsunternehmen als auch öffentliche Einrichtungen, z.B. Bibliotheken. Für die Beschaffung externer Informationen in Unternehmen im Rahmen des Informationsressourcenmanagement sind diese Player von eminenter Wichtigkeit, erstellen sie doch große Teile der unternehmensexternen Informationsressourcen. An dieser Stelle wollen wir nur kurz auf die Branche der Informationswirtschaft zu sprechen kommen, um uns einen knappen Überblick zu verschaffen, detailliert gehen wir in den folgenden Kapiteln auf die kommerziell vorgehaltenen Informationsressourcen ein. (Einen guten Überblick über die Branche der Informationswirtschaft, insbesondere aus deutscher und europäischer Sicht, findet man in Bredemeier/Schwuchow 1997.)
Eines sollten wir schon hier erwähnen: Eine feste Wirtschaftsstruktur gibt es in dieser noch recht jungen Branche nicht. Unternehmen mit interessanten Produkten kommen andauernd neu in den Markt (und verschwinden auch zum Teil bald wieder). Die eingesetzte Technik ist starken Wandlungen unterworfen. Zur Zeit beobachten wir zum Beispiel einen Übergang von „klassischen" Datenübertragungsmethoden wie Datex-P oder Telefon (Technik der 70er und 80er Jahre) über lokale Windows-Clients (Technik der frühen 90er Jahre) hin zu HTML- oder JavaAnwendungen im World Wide Web. Von einem festen Wissensstand über unsere Branche kann demnach keine Rede sein. Flexibilität und stetes Dazulernen gehört bei der Informationswirtschaft zu den Kernfahigkeiten.
Die Wertschöpfungskette der Informationswirtschaft enthält im Wesentlichen drei Glieder:
1 Informationswirtschaft •
die Produktion von Informationen
•
die Speicherung und Distribution von Informationen
•
die Vermittlung von Informationen.
21
Informationsproduzenten Im Rahmen der Informationswirtschaft unterscheiden wir zwei Arten von Informationsproduzenten, solche, die Informationen neu kreieren, und solche, die vorhandene Informationen aufarbeiten und geordnet zugänglich machen. Zur ersten Art gehören beispielsweise Ersteller von Unternehmensdossiers, die auf der Basis öffentlicher Angaben oder eigener Erhebungen Daten zu einer Firma zusammenstellen, Zeitungsverlage, die ihre Artikel - ggf. angereichert durch inhaltserschließende Informationen - in elektronischer Form zusammenstellen, oder Produzenten von (irgendwelchen) Faktensammlungen (etwa auf der Basis der Informationen der statistischen Ämter oder von Börsen). Zur zweiten Gruppe zählen wir Produzenten von Nachweisinformationen über Literatur, die (mehr oder minder) komplett Literaturhinweise über ein Fachgebiet erstellen, denen allerdings die „volle" Information abgeht. Eine Informationssuche ist hier stets zweistufig. Zunächst wird anhand vielfaltiger dokumentarischer Methoden der Nachweis der gewünschten Literatur recherchiert, und im zweiten Schritt ist der Volltext aus einer Bibliothek, konventionell oder elektronisch, zu beschaffen. Gemeinsames Merkmal der Informationsproduzenten innerhalb der Wirtschaftsbranche der Informationswirtschaft ist ihre Gewinnorientierung. Dies unterscheidet sie von vielen Produzenten von Informationen im Internet, die natürlich auch Informationen produzieren, aber diese kostenlos streuen. Hierunter fallen etwa Schriftenreihen wissenschaftlicher Einrichtungen oder Geschäftsberichte von Unternehmen. Eine Grobstrukturierung der kommerziell agierenden
Informationsproduzenten
ergibt folgende Einteilung: •
Produzenten eigener Inhalte •
Unternehmensinformationen (Dossiers, Bilanzen, Produkte, Bonität, Analysen usw.)
1 Informationswirtschaft
22 •
Textinformationen (Artikel von Zeitungen oder Zeitschriften, Texte von Patentschriften, Gesetze und Grundsatzurteile usw.)
•
(nicht-textuelle) Fakteninformationen (wirtschaftsstatistische Zeitreihen, Börsenkurse, aber auch wissenschaftliche oder technische Fakten)
•
Produzenten von Nachweisinformationen (Hinweise auf die Inhalte von Literatur; bibliographische Datenbanken u.a. zu wissenschaftlich-technisch-medizinischen Gebieten).
In der Wertschöpfungskette vor den Informationsproduzenten liegen die Tätigkeiten von Wissenschaftlern, Analysten, Redakteuren usw., die die Informationsinhalte erstellen. Das heißt, diese Tätigkeiten zählen wir nicht zur Informationswirtschaft, sondern rechnen sie ihren „Ursprungsgebieten" zu. Das Erstellen eines Forschungsberichtes beispielsweise ist demnach zum Wissenschaftssektor gehörig, die Publikation des Reports in elektronischer Form oder der Existenznachweis des Reports in einer bibliographischen Datenbank markiert den Übergang zur Branche der Informationswirtschaft.
Informationsanbieter Den
Informationsproduzenten nachgelagert agieren
die
Informationsanbieter.
Hierunter fallen alle Unternehmen, die Informationssammlungen (in der Regel) unterschiedlicher Produzenten gebündelt in elektronischer Form anbieten. Nach dem Distributionsmedium kann man nach Offline- und Online-Anbietern differenzieren. Offline-Anbieter konzentrieren sich auf CD-ROM, früher auch auf Informationsträger wie Magnetbänder oder Disketten. Online-Anbieter (oder auch „Hosts" genannt) halten ihre Datensammlungen für den Fernzugriff bereit, das heißt, sie sind jederzeit und von jedem Ort aus abfragbar. Angesichts dieses Aspektes ist klar, daß Informationswirtschaft prinzipiell als global agierende Branche einzuschätzen ist. Für den Nutzer eines Hosts ist es irrelevant, ob der Host im Nachbarort oder auf einem anderen Kontinent steht, Hauptsache ist der Anschluß an ein Telekommunikationsnetz. Im Hinblick auf die Zielgruppe arbeiten Hosts entweder innerhalb des Geschäftsbereiches (business to business) oder vorwiegend für Endnutzer (Consumer Services). Zu letzteren zählen zum Beispiel T-Online oder AOL.
23
1 Informationswirtschaft
Nach der Zeitperspektive müssen wir die Online-Hosts in zwei Gruppen einteilen. Erstere verteilen Informationen in Echtzeit, das heißt im Zeitpunkt ihres Entstehens (oder knapp danach). Hierunter fallen die beiden großen Gruppen der Realtime-Finanzinformationen (Börsenkurse usw.) und der Realtime-Nachrichten, also die Berichte der Presseagenturen. Die zweite Gruppe konzentriert sich auf retrospektive Informationen. Vereinfacht kann man diese dadurch charakterisieren, daß sie keine Realtime-Informationen anbieten. Wir treffen in diesem Segment der „Online-Archive" u.a. Anbieter mit Unternehmensinformationen, mit wissenschaftlich-technisch-medizinischen Informationen oder mit Zeitreihen (wirtschafts-)statistischer Daten. Wie bei den Informationsproduzenten finden wir auch bei den Informationsanbietern Einrichtungen außerhalb der kommerziellen Informationswirtschaft, die kostenlos Informationen verteilen. Hervorzuheben sind insbesondere die Bibliotheken mit ihren „Online Public Access Catalogues" (OPAC) im Internet sowie die sogenannten
„Suchmaschinen",
die
mit
(mehr
oder
weniger)
guten
Such-
algorithmen im W W W eine grobe Orientierung schaffen. Fassen wir kurz die Marktsegmente der kommerziellen Informationsanbieter zusammen! •
•
Online-Hosts •
Realtime Informationen
•
Online-Archive
Offline-Informationsanbieter (CD-ROM-Verlage).
Eine für die Online-Hosts wichtige „Zulieferbranche" sind die Betreiber von Telekommunikationsnetzen. Erst diese ermöglichen j a Online-Verbindungen. Ebenso wichtig sind lokale Einwählpunkte in Netzwerke, wie sie etwa Internet-Provider anbieten.
Informationsvermittler Am Ende der Wertschöpfungskette der Informationswirtschaft stehen die Informationsvermittler. Sie recherchieren im Kundenauftrag bei Datenbankanbietern und anderen Quellen nach benötigten Informationen und arbeiten diese (mehr oder
24
1 Informationswirtschaft
minder komfortabel) auf. Informationsvermittlung als einziges Geschäft ist recht selten zu finden und betrifft nahezu ausschließlich Nischenmärkte, zum Beispiel chemische Fachinformationen. Selbständige Informationsvermittler koppeln ihre Tätigkeit häufig mit verwandten Aktivitäten wie Consulting oder Weiterbildung im Informationsbereich. Informationsvermittlungsstellen in Unternehmen bilden die „Schnittstelle" zwischen der internen Unternehmenskommunikation und der Welt der externen Informationen. Hier ist das Management externer Informationsressourcen angesiedelt. Dies heißt nun keineswegs, daß j e d e Beschaffung externer Informationen in einem Unternehmen oder einer Behörde über eine Informationsvermittlungsstelle laufen müßte. Dies wird zwar bei komplexen wie komplizierten Aufgaben, etwa einer Recherche zum Stand der Technik bei der Vorbereitung eines Forschungsprojektes der Fall sein, in der Regel wird jedoch der Endnutzer seine Suche selber durchführen. Es ist allerdings Aufgabe des betrieblichen
Informationsmanage-
ments, diese Endnutzerrecherche zu ermöglichen. Das Spektrum der Möglichkeiten ist breit und reicht von Intranet-Lösungen über elektronische Pressedossiers, FuE-News bis hin zu Managementinformationssystemen, um nur einige Aspekte zu nennen. Im Bereich der Informationsvermittlung gibt es auch nicht-kommerzielle Alternativen. Viele Wissenschaftliche Bibliotheken und hierunter nahezu alle Universitätsbibliotheken und zunehmend auch einige Öffentliche Bibliotheken bieten jedoch zum Teil nicht kostenlos - entsprechende Dienstleistungen an (vgl. Bieletzki/Roth 1998). Für kleine und mittlere Unternehmen, für die ggf. die Einführung einer eigenen informationswirtschaftlichen Abteilung nicht lohnt, besteht in den Bibliotheken neben den privaten Informationsvermittlern eine durchaus attraktive Möglichkeit des Outsourcing von Informationswirtschaft. Von dieser Denkmöglichkeit sollte jedoch nur vorsichtig Gebrauch gemacht werden, da die optimale Nutzung der Ressource Information einen Wettbewerbs vorteil verspricht. Entsprechend wäre es geraten, mit „seinen" Informationen durchaus vertraulich umzugehen. Die Zusammenfassung zeigt uns die Möglichkeiten der Informationsvermittlung: •
Informationsvermittlung als Teil der betrieblichen Informationswirtschaft •
Informationsvermittlung durch Informationsvermittlungsstelle
•
Endnutzer recherchiert selber
1 Informationswirtschaft •
25
Outsourcing der Informationsvermittlung •
private Informationsvermittler
•
Bibliotheken.
1.5 Informationswirtschaft als betriebliche Funktion Die Produkte der Wirtschaftsbranche der Informationswirtschaft sowie die weiteren, zum Teil kostenlosen Angebote in den Informationsnetzen bilden die Grundlage für die Gewinnung und Aufarbeitung der weltweiten Informationsressourcen. Dieses Einbeziehen unternehmensexterner Informationen in die betriebliche Informationswirtschaft ist dabei jedoch nur ein - allerdings wichtiger - Teil eines Gesamtkonzepts. Wir wollen hier einen knappen Blick auf die Gesamtheit der betrieblichen Informationswirtschaft werfen.
Abb. 1.2: Organigramm einer Unternehmung ohne betriebliche Informationswirtschaft
26
1 Informationswirtschaft
Zunächts müssen wir den Unterschied zwischen Unternehmen, die die Informationswirtschaft in ihre Organisation einbinden, und den anderen, die auf Informationswirtschaft verzichten, herausarbeiten. Eine „klassische" Unternehmung ohne Informationswirtschaft zerfällt in die üblichen Einheiten wie Geschäftsführung an der Spitze, mit Abteilungen für Forschung und Entwicklung, den Produktionsabteilungen, Absatz, Finanzen usw. Natürlich wird auch Datenverarbeitung eingesetzt, organisiert als eigene Abteilung mit allenfalls losen direkten Beziehungen zu den anderen Unternehmensteilen. Abbildung 1.2 zeigt ein solches aus der Sicht der Informationswirtschaft suboptimales Organigramm.
Abb. 1.3: Organigramm einer Unternehmung mit betrieblicher Informationswirtschaft
Organigramm einer Unternehmung Modell mit Informationswirtschaft
externe
Kommunikation
Informationswirtschaft ersetzt die bisherige Datenverarbeitung und erweitert dabei deren Umfang, und dies sowohl informations- und
kommunikationstechnisch,
organisatorisch und inhaltlich. Organisatorisch (siehe Abbildung 1.3) ist die Informationswirtschaft dergestalt in eine Unternehmung eingebunden, daß sie - quasi das Rückgrat des Unternehmens bildend - an alle Arbeitseinheiten direkt angebunden ist. Zusätzlich fungiert die Informationswirtschaft als Schnittstelle nach außen,
1 Informationswirtschaft
27
versorgt alle Mitarbeiter mit externen Informationen und fungiert als Ansprechpartner bei der (elektronischen) Kommunikation mit der Umwelt. Die Informationswirtschaft umfaßt alle Informationsaspekte (Technik, Organisation, Inhalte) und berührt daher unterschiedliche Gebiete (siehe Tabelle 1.3). Die Problematik der betrieblichen Informationssysteme wird vorwiegend von der Wirtschaftsinformatik bearbeitet, die Organisation unternehmensweiter Information und Kommunikation obliegt dem Informationsmanagement, den Informationsinhalten letztendlich widmet sich das Informationsressourcenmanagement. Diese Einteilung ist durchaus analytisch, in der Praxis hängen alle Aspekte stets zusammen.
Diese weite Definition der Informationswirtschaft, die durchaus Gebiete anderer Disziplinen mit umfaßt, deckt sich in der Tendenz mit der Auffassung von Wolfgang H. Janko. „Informationswirtschaft befaßt sich mit der Frage der wirtschaftlichen Beschaffung bzw. Produktion, Verwaltung, Organisation und dem Management sowie der zielgerechten Verwertung von Informationen in Organisationen" (Janko 1993,2).
Tab. 1.3: Aspekte der Informationswirtschaft und deren Wissenschaftsdisziplinen Informationsaspekt
Wissenschaftsdisziplin
Informationssysteme
Wirtschaftsinformatik
Informationsorganisation
Informationsmanagement
Informationsinhalte
Informationsressourcenmanagement
In der Abbildung 1.4 betrachten wir die Informationsflüsse im Unternehmen sowie zwischen dem Unternehmen und seiner Umgebung. In der Abbildung erkennen wir unschwer drei Bereiche der betrieblichen Funktion der Informationswirtschaft: •
der Fluß externer Informationen in das betriebliche Informationssystem hinein
28 •
1 Informationswirtschaft der Fluß (externer wie interner) Informationen innerhalb des betrieblichen Informationssystems mit Schnittstellen bei (soweit sinnvoll) jedem Arbeitsplatz
•
der Fluß ausgewählter interner Informationen nach außen sowie dessen Rückkopplungen (externe Kommunikation).
Abb. 1.4: Informationsflüsse in der betrieblichen Informationswirtschaft
Betriebliche Informations Wirtschaft externe Informationen
Unternehmen Behörde
1 '
Arbeitsplätze
f
«
» „
« _ j ,
O ^.
(pfcsysteral
i
Í|
fr
Arbeitsplätze externe Kommunikation
Das betriebliche Informationssystem Im Zentrum steht das betriebliche Informationssystem, das sich - soweit irgendwie sinnvoll - über alle Arbeitsplätze in einem Unternehmen bzw. in einer Behörde erstreckt. Das betriebliche Informationssystem verbindet interne Informationen mit im Informationsressourcenmanagement gewonnenen externen Informationen. Der Gegenstand der Informationswirtschaft ist demnach durchaus dem Gegenstand der Wirtschaftsinformatik ähnlich. Vergegenwärtigen wir uns eine Definition der „Wirtschaftsinformatik"! „Gegenstand der Wirtschaftsinformatik", schreiben Otto
1 Informationswirtschaft
29
K. Ferstl und Elmar J. Sinz, „sind Informationssysteme in Wirtschaft und Verwaltung. In einer ersten Begriffsbestimmung wird unter einem Informationssystem ein System verstanden, das Informationen verarbeitet, d.h. erfaßt, überträgt, transformiert, speichert und bereitstellt" (Ferstl/Sinz 1998, 1). Unterscheidbar vom Informationssystem ist das „Basissystem", in dem Produkte bzw. Dienstleistungen erbracht werden. Das Basissystem stellt demnach die „eigentliche" Unternehmensoder Verwaltungsleistung dar. Das Informationssystem steht in unmittelbarer Beziehung zum Basissystem. „Aufgabe des Informationssystems
ist die Planung,
Steuerung und Kontrolle des Basissystems" (ebd., 29). Wenn wir den Begriff „Information" in die zwei Komponenten der Objektart Information (im Sinne der Informationsverarbeitung) und der Tätigkeit des Informierens unterscheiden, so konzentriert sich die Wirtschaftsinformatik auf die Objektart Information (vgl. ebd., 8 f.), in der Informationswirtschaft geht es umfassend um beide Komponenten. Der Aspekt des Informierens aller Mitarbeiter ist also bei der Informationswirtschaft zwingend mit eingeschlossen.
Informationswirtschaft ist in dieser Sichtweise eine der Wirtschaftsinformatik übergeordnete Disziplin. „Das Fachgebiet Informationswirtschaft umfaßt daher das Gebiet Wirtschaftsinformatik, wenn man unter der Wirtschaftsinformatik die Wissenschaft von den Informationssystemen der Unternehmen versteht" (Janko 1993, 2).
Informationsmanagement Lassen wir weiter Wolfgang H. Janko zu Wort kommen! „In Ergänzung zu den heute üblichen Inhalten der Wirtschaftsinformatik sieht jedoch die Informationswirtschaft auch Themenbereiche, die nicht unmittelbar auf Informatik basieren und dennoch in der Bewertung und Beurteilung bzw. in der Organisation und im Management von Informationssystemen berücksichtigt werden müssen, als ihren Forschungsgegenstand an" (ebd.). Informationsobjekte und Informationsflüsse in Unternehmen und Behörden sind in einen planenden und organisierenden Rahmen zu stellen. Zerlegt man das Wort „Informationsmanagement" in seine zwei Bestandteile, so geht es um das Management von Informationen. In diesem Sinne definiert Matthias Fank die Thematik. „Behandelt werden [im Informationsmanagement] eine Reihe von Methoden der
1 Informationswirtschaft
30
Managementlehre, mit dem Versuch, sie auf den Faktor Information zu übertragen" (Fank 1996, 3). Der Gegenstand des Informationsmanagement „ist die Information, welche geplant, organisiert, koordiniert und kontrolliert wird, d.h. eines Managements bedarf. Information als Gegenstand bedeutet, daß Information eine Ressource (...) bw. einen Produktionsfaktor darstellen. Zur Erfüllung der Aufgaben kommen Methoden, Werkzeuge und Informations- und Kommunikationstechnik zum Einsatz" (ebd., 19).
Die Produktionsfaktoren werden in der aktuellen Diskussion in vier Aspekte zerlegt: •
Kapital
•
Rohstoffe, Boden
•
Arbeit
•
Information.
Neben den drei „alten" Faktoren beeinflußt „heutzutage die Information den Leistungserstellungsprozeß" (Fank 1996, 25). Der „vierte Faktor" (vgl. Best, Hg., 1995) bedarf dabei genauso einer wirtschaftswissenschaftlichen wie -praktischen Behandlung wie die drei anderen Faktoren.
Externe Kommunikation Jedes Unternehmen, jede Behörde kommuniziert mit der betreffenden Umwelt. Insofern diese externe Kommunikation über elektronische Netzwerke verläuft, wird sie Teil der betrieblichen Informationswirtschaft. Nach heutiger Technik dürfte der Ausgangspunkt der externen Kommunikation eine Homepage im W W W sein. Über Möglichkeiten der Rückkopplung (etwa via E-Mail) werden neue Formen der Kommunikation sowohl mit Lieferanten als auch mit Kunden gefunden. Teile der betrieblichen Kommunikationspolitik, zum Beispiel Werbung oder Öffentlichkeitsarbeit, werden so zu Bestandteilen der Informationswirtschaft.
1 Informationswirtschaft
31
Informationsressourcenmanagement Im Informationsressourcenmanagement geht es um die Informationsinhalte, um diejenigen Rohstoffe, die Entscheidungsprozesse unterstützen sowie innovativen Produkt- oder Prozeßentwicklungen die informationelle Basis verschaffen. Die Beschaffung und Aufarbeitung (interner wie externer) Informationen, mithin die „Informationslogistik", umfaßt idealtypisch folgende Prinzipien: •
die „richtige" Information
•
zum „richtigen" Zeitpunkt
•
am „richtigen" Ort
•
im „richtigen" Umfang
•
in der „richtigen" Form
•
mit der „richtigen" Qualität.
Siegfried Augustin betont: „Im Rahmen eines zielgerichteten Systems ... können als 'richtig' nur jene Informationen angesehen werden, die der Empfanger bzw. Verantwortungsträger benötigt, versteht und bearbeitet, also beispielsweise in Entscheidungen umsetzt. Der 'richtige' Zeitpunkt bezieht sich auf die rechtzeitige Verfügbarkeit für das Fällen von Entscheidungen jeglicher Art und Detaillierungsstufe, der 'richtige' Ort betrifft den Ort, an dem die Informationen verarbeitet werden, und die 'richtige' Qualität erstreckt sich auf die vier Komponenten Aktualität, inhaltliche Wahrheit, formale Relevanz und verwendungsgerechte Form" (Augustin 1993,28). Aber auch ideal „richtige" Informationen sind in aller Regel nicht ausreichend für den Abbau jeglicher Unsicherheit bei Entscheidungen. Die Informationsbasis der Entscheidungen kann nur kleiner oder größer sein. Die Vergrößerung der Informationsbasis birgt jedoch - im Vergleich zur Konkurrenz - enorme Wettbewerbsvorteile. Gerade die nicht perfekte Information und die jeweils relative Unsicherheit sind Schlüsselaspekte der Informationswirtschaft (vgl. Hughes/ Moore 1992): In einer Umgebung, die prinzipiell nicht vollständig zu erfassen ist und sich zudem ständig ändert, ist es für Unternehmen wichtig, die hieraus resultierenden Unsicherheiten möglichst zu reduzieren. Erreicht wird eine komplette Information und damit der Abbau der Unsicherheit jedoch nie. Durch Information wird vielmehr ein Zustand kreativer
Unsicherheit
erzeugt. Die Existenz der Unsicherheit fuhrt
Unternehmen dazu, Informationen als strategische Waffe einzusetzen, um durch
32
1 Informationswirtschaft
den Abbau und die Veredelung von Informationen Vorteile gegenüber Wettbewerbern zu erreichen. Der Konkurrenzvorteil ist solange gegeben, wie ein Unternehmen gewisse Informationen monopolisiert oder die Informationen doch zumindest asymmetrisch zugunsten unseres Unternehmens verteilt sind. Die anderen Wettbewerber müssen notwendig nachziehen, bis wieder ein Informationsgleichgewicht auf einem bestimmten Gebiet herrscht. Durch Informationen auf anderen Gebieten oder durch neue Informationen auf dem Ausgangsgebiet wird ein neuer Informationsvorsprung erarbeitet usw. usf. Die Information rückt so ins Zentrum innovativen Wettbewerbs.
Das Informationsressourcenmanagement zerfallt in eine unternehmensinterne und eine -externe Aufgabenstellung, wie dies Rainer Kuhlen betont. „Zum einen die Informationsressourcen und Kommunikationsströme innerhalb von Organisationen vernünftig, d.h. auf Organisationsziele ausgerichtet zu koordinieren, zum andern und dies wird wichtiger - mit den extern vorhandenen Informations- und Kommunikationsressourcen bekannt zu werden und sie vernünftig, d.h. wieder entsprechend den Organisationszielen, nutzen zu können" (Kuhlen 1996, 128). Letztlich ist es egal, ob Informationen intern oder extern besorgt werden, Hauptsache ist, daß sie in kritischen Situationen vorhanden sind. Solche „kritischen Situationen" können sein: •
Entscheidungsvorbereitungen
•
Wissenslücken
•
Frühwarninformationen.
In den ersten zwei Situationen ist der Informationsmangel bekannt, Entscheidungen wollen durch Informationen vorbereitet oder (zum Beispiel bei Forschungsund Entwicklungsprojekten) Wissenslücken gestopft werden. Bei der dritten kritischen Situation weisen erst die Informationen darauf hin, daß überhaupt eine solche Situation eintreten könnte. Hier fungieren die Informationen als Frühwarnsystem. Zu denken ist hier beispielsweise an die Kräfte des Wettbewerbs innerhalb von Branchen im Sinne von Michael E. Porter. •
Gefahr des Markteintritts neuer Wettbewerber
•
Gefahr vor Ersatzprodukten oder -diensten
1 Informationswirtschaft •
Situation der Lieferanten
•
Situation der Abnehmer
•
Rivalität unter den bestehenden Wettbewerbern (vgl. Porter 1992, 23).
33
Hinzu treten weitere Frühwarninformationen: •
konjunkturelle Schwankungen innerhalb der Branche
•
konjunkturelle Schwankungen der Branchen der Zulieferer und der Abnehmer
•
(regionale, soziale o.ä.) Krisen auf Märkten (Rohstoffmärkte, Absatzmärkte, aber auch Personal markte)
•
Krisensituationen außerhalb des ökonomischen Systems
•
gesamtwirtschaftliche Probleme in einem Land.
Allgemein gilt nach Kuhlen, „Informations-Ressourcen-Management hat ... zum Ziel, Informationen über Veränderungen in den für das Unternehmen relevanten Umweltsegmenten erkennen und aufnehmen zu können, die Leistungsfähigkeit
von
innerorganisatorischer Verwaltung und Produktion durch effiziente Informationsverarbeitung und Kommunikation zu steigern und die Austauschbeziehungen zu relevanten externen Partnern zu intensivieren" (Kuhlen 1996, 130). Alle diese Informationen intern vorzuhalten, ist kaum möglich. Allein in den Datenbanken der kommerziellen Informationswirtschaft, also ohne die kostenlosen InternetRessourcen, schlummern mehrere Milliarden Datensätze. Der Wettbewerbsvorteil „Information" liegt demnach nicht - oder nicht nur - in den internen Informationssammlungen, sondern im geschickten Aufspüren der „richtigen" externen Informationen. „Informationelle Autonomie in professionellen Umgebungen ... kann nicht länger bedeuten, daß man selber alles weiß, sondern daß man die Ressourcen zu nutzen versteht, die den Zugang zum benötigten Wissen ermöglichen" (ebd., 134).
In diesem Sinne zeigen die weiteren Kapitel, wie man innerhalb der Informationswirtschaft externe Informationen aufspürt und in betriebliche Informationssysteme einfließen läßt. Wir teilen hierbei den Optimismus von Gerhard J.
Mantwili.
„Die Informationswirtschaft leistet einen wichtigen Beitrag zur Sicherung der
1 Informationswirtschaft
34
Wettbewerbsfähigkeit der Unternehmen und zur Stärkung des Wirtschaftsstandortes Deutschland. Sie stellt einen Teil des Wissens zur Verfügung, das für Forschung und Lehre, für Entwickeln und Produzieren, für Marketing und Vertrieb, für rationales Handeln und Entscheiden benötigt wird" (Mantwill 1997, 7).
Fazit •
„Informationsgesellschaft" bezieht sich auf eine Gesellschaft, deren Basisinnovationen von der Ressource Information getragen werden (Theorie des fünften Kondratieff), in der Informationsinhalte aller Arten überall und jederzeit zur Gänze zur Verfügung stehen (Holographie- und Tempo-Prinzip) und auch intensiv genutzt werden (Theorie der Wissensgesellschaft), deren Mitglieder bevorzugt
Telematikgeräte
zur Information
und
Kommunikation
benutzen
(Theorie der telematischen Revolution). •
Die Informationsgesellschaft wird sich auf Unternehmen und auf die öffentliche Verwaltung massiv auswirken. Hauptursachen für Änderungen sind die Globalisierung, das neue ökonomische Paradigma des „Toyotismus", die „Virtualisierung" von Unternehmen, die notwendige Einheit von Informationstechnik und entsprechender Organisation sowie - zentral - die wachsende Bedeutung der Informationsinhalte.
•
Lösungsansätze für die Herausforderungen der Informationsgesellschaft liegen in der Informationswirtschaft - diese verstanden sowohl als Wirtschaftsbranche als auch als betriebliche Funktion.
•
Es gibt derzeit noch kein einheitliches Bild von der Informationswirtschaft. Vier Sichtweisen sind auszumachen: (1) Informationswirtschaft als spezielle Betriebswirtschaftslehre, (2) als spezielle Informationswissenschaft bzw. Informatik, (3) als zeitgemäße Version von Bibliotheks- und Dokumentationswesen und (4) als eigenständige Disziplin.
•
In unserer Sicht ist die Informationswirtschaft eine Disziplin, die sich den Informationssystemen
(federführende
Wissenschaftsdisziplin:
Wirtschafts-
informatik), der Informationsorganisation (Informationsmanagement) und den Informationsinhalten (Informationsressourcenmanagement) widmet.
1 Informationswirtschaft •
35
Die Wertschöpfungskette der Wirtschaftsbranche Informationswirtschaft umfaßt die drei Glieder Informationsproduktion, -speicherung und -distribution sowie -Vermittlung.
•
Die Informationswirtschaft als betriebliche Funktion durchdringt alle betrieblichen Bereiche und ist gleichzeitig die Schnittstelle zur Umwelt des Unternehmens sowie der Inputbereich für externe Informationen.
2 Informationen und Informationskanäle 2.1 Information als Wirtschaftsgut Verkaufe ich jemanden ein materielles Gut, sagen wir ein Auto, so hat nach dem Geschäft der Käufer das Auto, ich habe es nicht mehr. Verkaufe ich jedoch jemanden eine Information, so hat nach dem Geschäft natürlich der Käufer die Information, ich habe sie aber auch noch. Information ist demnach ein Wirtschaftsgut besonderer Art.
Information als Ware Ein
Wirtschaftsgut entsteht
dann,
wenn
sich
Arbeit
in
einem
niederschlägt. Die Wertgröße eines Gutes errechnet sich aus den
Gegenstand geleisteten
Arbeitsquanta, den verbrauchten Ressourcen und weiteren Kostenquellen. Wenn das produzierte Gut für jemanden nützlich geworden ist, hat es einen Gebrauchswert. Die Wertgröße des Wirtschaftsgutes Information läßt sich für das erste Erstellen der Information berechnen. Hiernach fallen mehr oder weniger nur noch Speicherkosten an, die Information hat nun eine Wertgröße nahe Null. In der Zeit nach dem ersten Erstellen einer Information hat sie demnach eine vernachlässigbare Wertgröße. In diesem Sinne ist das Bild des „Rohstoffes" Information vertretbar. Information hat ähnlich wie Erdöl oder wildwachsendes
Holz - nahezu ausschließlich
einen
Gebrauchswert. Der Gebrauchswert von Information schwankt je nach Nachfrager beträchtlich. Ein Schüler, der für einen kurzen Vortrag einen Forschungsartikel benötigt, geht von völlig anderen Wertvorstellungen aus als ein Unternehmen, das den Artikel für die Fundierung der Entwicklung eines neuen Produktes benötigt. Der Preis von Informationen kann sich demnach weder an der Wertgröße noch am Gebrauchswert orientieren. Der Preis für ein und diesselbe Information schwankt beträchtlich, j e nachdem, welchen Übertragungsweg oder welche Institution ein Kunde anspricht. Besorgt sich unser Schüler den Artikel aus einer Öffentlichen Bibliothek, so fallen (außer für das Fotokopieren) keinerlei Kosten an. Hat das Unternehmen die Zeitschrift abonniert, in der der Aufsatz steht, so ist der Preis mit den Abonnementgebühren abgedeckt. Besorgt sich eine firmeninterne Informationsstelle den Artikel aus einer elektronischen Volltextdatenbank, so entstehen bereits Kosten von mehreren zehn Mark. Schaltet man letztendlich einen kommerziellen Informationsvermittler ein, der in Online-Datenbanken erst nach dem Artikel sucht und diesen dann elektronisch besorgt, so liegen die Kosten möglicherweise bei mehreren hundert Mark. Der Preis der InformationsbeschafFung - so können wir diesen Abschnitt zusammenfassen -
37
2 Informationen und Informationskanäle
liegt nicht in der Information selber begründet, sondern in der Art und Weise der Informationsübermittlung. Es sei gestattet, den Fall weiter zu verkomplizieren. Es gibt Informationen, die frei zugänglich sind, also durchaus abbaubare Rohstoffe versprechen, deren Nutzung aber eingeschränkt ist. Zu denken ist beispielsweise an Patentinformationen. Hieraus entsteht ein Handel mit den Informationen selber, der sich in Lizenzen niederschlägt. Noch weniger Rohstoffcharakter haben Informationen, die vom Produzenten in nur geringer Auflage gestreut werden. Derart Informationen werden nicht in Zeitschriften publiziert, sondern an ausgewählte Empfanger (teuer) verkauft. Denken können wir in
diesem
Fall
etwa
an
Unternehmensanalysen
oder
Marktberichte
von
Consultantunternehmen. Hier werden die Kosten der Ersterstellung einer Information an die Kunden weitergegeben. Bislang haben wir vorausgesetzt, daß eine gesuchte Information bereits vorhanden ist. Im Zeitpunkt des Starts unserer Informationssuche wissen wir dies jedoch nicht. Läßt sich die Information in Datenspeichern aller Art nicht auftreiben, so ist die Initiierung der Ersterstellung dieser Information geboten. Dieser Weg führt in Richtung Auftragsforschung bzw. Consulting. Hier sind wir bei der sicherlich teuersten Art der Informationsgewinnung angelangt. (Und - so müssen wir ergänzen hier haben wir das Gebiet der Informationswirtschaft bereits verlassen:
Die
Ersterstellung von Informationen liegt ausserhalb der informationswirtschaftlichen Wertschöpfungskette.) Aspekte des Preises des Wirtschaftsgutes Information sind also: •
für den Verkauf bestimmte Information (Beispiel: Marktbericht - hoher Preis) versus für die freie Nutzung bestimmte Information (Beispiel: wissenschaftlicher Artikel - niedriger Preis bis kostenlos)
•
als Schutzrecht offengelegte Information (Beispiel: Patent - niedriger Preis bis kostenlos) versus Nutzung der im Schutzrecht enthaltenen Information (entweder kostenpflichtige Lizenz oder überhaupt keine Freigabe)
•
Information
wird
in
Öffentlicher Bibliothek
öffentlicher -
Einrichtung
kostenlos)
versus
nachgefragt Information
(Beispiel: wird
in
woanders
nachgefragt (kostenpflichtig) •
Information wird auf kostengünstigem Medium angeboten (Beispiel: Printversion eines Artikels - niedriger Preis) versus Information wird auf kostspieligem
38
2 Informationen und Informationskanäle Medium angeboten (Beispiel: der gleiche Artikel in elektronischer Form in einer Volltextdatenbank - hoher Preis).
Arnold Picot und Sven Scheuble sehen im Wirtschaftsgut Information verschiedene Eigenschaften, die dieses Wirtschaftsgut von anderen abgrenzt und deren Kenntnis für den Umgang mit unserem besonderen Wirtschaftsgut unerläßlich ist (vgl. Picot/ Scheuble 1997, 16): •
Informationen sind immaterielle Güter, die (auch bei mehrfacher Nutzung) nicht verbraucht werden
•
die Käufer der Informationen bekommen „Kopien" der Information
•
fur die Informationsanbieter lassen sich économies of scale realisieren, sind doch nach dem Ersterstellen die Produktionskosten nahe Null.
Zu beachten ist zudem das sogenannte „Informationsparadoxon": „Eine Bewertung von Information setzt ... voraus, daß die zu beschaffende bzw. zu erwerbende Information bereits bekannt sein muß. Wenn jedoch die Information einer Bewertung zugänglich ist, hat der Informationsbeschaffer die Information bereits aufgenommen und muß sie nicht mehr erwerben" (ebd., 16 f.). Bevor ich eine Information kaufe, kann ich demnach nicht bewerten, ob ich diese überhaupt benötige. Sollte ein Verkäufer mir eine Information zur Bewertung vorlegen, so werde ich diese - auch bei positivem Ausgang - nicht mehr beschaffen müssen, schließlich habe ich mit der Bewertung auch den Inhalt der Information aufgenommen.
Das Wirtschaftsgut Information als „Vertrauensgut" Infolge des Informationsparadoxons läßt sich der Wert einer Information stets erst nach dem Erwerb feststellen. Es ist also durchaus möglich, daß man Informationen beschafft, von denen man zwar meint, daß man sie brauchen könnte, faktisch jedoch nicht benötigt. Ebenso wie die Einschätzung des Wertes einer Information ist auch die Beurteilung der Qualität dieses Wirtschaftsgutes problematisch. Hierzu sei ein kurzer Ausflug in die Informationsökonomie gestattet (vgl. Stock 1995, 150 ff.)! In der Literatur zur Informationsökonomie finden sich zunächst Unterscheidungen von „Suchgütern" und „Erfahrungsgütern" (vgl. Nelson 1970). Bei Suchgütern kann die Qualität eines Gutes vor dem Kauf durch Betrachtung beurteilt werden; Erfahrungsgüter erweisen ihre Qualität erst durch den Gebrauch. Als dritte
2 Informationen und Informationskanäle
39
Kategorie werden darüberhinaus „Vertrauensgüter" genannt (vgl. Darby/Karni 1973). Die Qualität eines Vertrauensgutes kann auch im Gebrauch nur unvollkommen beurteilt werden. Um welche Art von Wirtschaftsgut es sich im konkreten Fall handelt, hängt außer von der Beschaffenheit des Produktes auch und entscheidend von den (potentiellen) Käufern ab, von deren Fachwissen, ihren Interessen und Motiven. Ein Kunde ohne ausreichendes Fachwissen auf dem Gebiet des Wirtschaftsgutes macht das Gut - für sich - stets zum Vertrauensgut. Informationen in elektronischen Diensten sind nie Suchgüter; man sieht das Produkt vor der Recherche prinzipiell nicht. Ob sie Erfahrungs- oder Vertrauensgüter sind, hängt vom kaufenden Subjekt ab. Ein Fachmann, etwa ein Informationswirt, ein „Onliner" oder ein erfahrener Nutzer, wird das Resultat einer Online-Recherche als Erfahrungsgut einstufen, dessen Qualität er einschätzen kann. Für einen Laien der Informationswirtschaft sind Informationsprodukte stets Vertrauensguter. Die Beziehungen Datenbankproduzent - Host sowie Host - Informationsvermittler beinhalten demnach Erfahrungsgüter,
denn hier sind ausschließlich Fachleute ange-
sprochen. Der „typische" Endbenutzer ist sicherlich kein professioneller Informationswirt; demnach hat für die Mehrzahl der Wirtschaftssubjekte das Wirtschaftsgut Information den Charakter eines
Vertrauensgutes.
2.2 Information als Gesamt von Signal und Nachricht Information Information ist ein Gegenstand mit zwei Gesichtern. Eine Seite, das „Signal", zeigt den materiellen Aspekt, die andere Seite, die „Nachricht" den Aspekt des Gemeinten bzw. Verstandenen, des Informationsinhalts. Signale sind also stets materielle Phänomene, wie Schallwellen, elektromagnetische Wellen, Druckerschwärze usw. Dieser Bereich ist wahrnehmbar und auf unterschiedlichen Medien speicherbar. Einem gewissen Ausschnitt der Realität ist also das Prädikat „ist ein Signal" zuzuordnen. Als Signal können wir uns die Darstellung eines Buchstabens denken; nehmen wir z.B. „E". Es ergibt sich als Darstellung von „E" eine Reihe von Möglichkeiten, es kann mit großer oder kleiner Type gedruckt sein, es kann als Schallwelle unsere akustischen Rezeptoren affizieren, es kann als entsprechend magnetisierte Stelle auf einem besprochenen Tonband vorkommen usw.: Es gibt einen Ausschnitt aus der Menge der Signale, dem das Prädikat „ist ein ' E ' " zukommt. Generalisieren wir dies, so können wir feststellen, eine gewisse Menge bestimmter Signale hat (mit
40
2 Informationen und Informationskanäle
Randunschärfen) die Eigenschaft, Träger einer bestimmten Nachricht (in unserem Beispiel die Nachricht „E") zu sein. Der Term „Information" wird fur die Einheit von materiellem Träger (Signal) und Nachricht verstanden.
Daten - Information - Wissen - handlungsrelevantes Wissen Jede Nachricht ist hierbei zwingend an einen Träger, an ein Signal, gebunden. Umgekehrt muß dies nicht sein. Es gibt sicherlich Signale, die keine Nachrichten beinhalten. Betrachten wir ausschließlich Signale, so reden wir von „Daten". Datenverarbeitung bezieht sich demnach auf einen Bereich, in dem von der Bedeutung der Information prinzipiell abstrahiert wird. Hier geht es um bits und bytes, um die Informationstheorie im Sinne von Shannon und Weaver.
Abb. 2.1: Daten - Information - Wissen
Die Nachrichten sind in fachliche Systeme einzuordnen. Diese Systeme können der Alltagswelt entstammen, einen betrieblichen Kontext repräsentieren oder auch
41
2 Informationen und Informationskanäle
wissenschaftliche Lehrgebäude sein. Nachricht in diesem systematischen Kontext definieren wir als „Wissen". Wissen ist so verstanden eine statische Entität, während Information stets Übertragung, also ein dynamisches Moment, beinhaltet.
Nicht alles, was einen Rezipienten an Informationen umspült, ist auch für ihn relevant. Nur ein Teil, wahrscheinlich sogar ein sehr kleiner Teil der Informationen, die einen Empfänger erreichen, werden von ihm auch in Handlungen berücksichtigt. Hier geht es um das „handlungsrelevante Wissen". Dieses handlungsrelevante Wissen ist ein Ausschnitt aus der Gesamtmenge unternehmensintemen und -externen Wissens, der - als Information - „in Bewegung gesetzt wurde" und nun in menschliche Handlungen bzw. Praxis einfließt. Hier liegt der Kern der Bemühungen um „Knowledge Management": Wissen über Information in Handlungen umsetzen. Abbildung 2.1 zeigt die Begriffe, die sich um „Information" bündeln, im Überblick.
Informationsübermittlungen Zentral für die Informationswirtschaft sind die Informationsübermittlungen, wollen wir doch handlungsrelevante (externe und interne) Informationen dorthin vermitteln, wo sie nutzbringend gebraucht werden. Die Aspekte der Informationsübermittlung zeigt als Modell Abbildung 2.2. Bei Informationsübermittlungsprozessen zwischen einem Sender und einem Empfanger werden grundsätzlich nur Signale übertragen, keine Nachrichten bzw. kein Wissen. „Sender" und „Empfanger" werden sehr allgemein verstanden, es kann sich sowohl um Menschen als auch um informationsverarbeitende Maschinen handeln. Beim Senden eines Signals unterstellt der Sender eine Nachricht. Ebenso wird der Empfanger dem Signal - soweit möglich - eine Nachricht unterstellen. Daß die „gemeinte" Nachricht und die „verstandene" Nachricht identisch oder zumindest ähnlich sind, kann man hoffen, eine Garantie dafür gibt es nicht. Wir befinden uns hier auf einem Gebiet, das eher Geisteswissenschaftlern als Betriebswirten vertraut ist: der Hermeneutik, der Lehre vom (richtigen) Verstehen.
Im Bereich
der
Informationswirtschaft reden wir von der „Informationshermeneutik", die alle Verstehensprozesse
thematisiert,
die
innerhalb
Informationswirtschaft auftreten (vgl. Capurro 1986).
der
Wertschöpfungskette
der
42
2 Informationen und Informationskanäle
Abb. 2.2: Aspekte der Informationsübermittlung
Modell der
Mgnal
(Output)
SignalÜbertragung
signal (Input)
Signale sollen nicht nur zu (richtig verstandenen) Nachrichten zusammengefaßt werden, sondern auch in bezug zu Wissenssystemen. Ein Informationswirt, der fachliche Informationen abfragt, muß demnach auch Fachkenntnisse in demjenigen Wissensbereich haben, in dem die Information zu verorten ist. Nehmen wir ein Beispiel! Jemand, der in Strukturdatenbanken
der Chemie nach
bestimmten
organischen Stoffen sucht, dürfte ohne einschlägiges Fachwissen der Organischen Chemie dort verloren sein. Nun stellt sich das Problem des Fachwissens im Unternehmensalltag möglicherweise nicht so krass wie in unserem Extrembeispiel, ein Informationswirt ist trotzdem gut beraten, sich einschlägiges
Fachwissen
anzueignen. Das Wissen ist in elektronischen Datenbanken anders strukturiert als etwa in Lehrbüchern. Ordnungsprobleme tauchen auf. An welchen Stellen oder unter welchen Schlagwörtern muß ich dies oder jenes suchen? Welche Datenbank ist überhaupt
2 Informationen und Informationskanäle
43
zutreffend? Hier wird vom Informationswirt dokumentarisches Know how verlangt. (Diesem Gebiet werden wir uns in den Kapiteln 3 bis 7 widmen.) Letztlich benötigt man bei Informationsübermittlungen entsprechende Kanäle, die die Signale transportieren. Wir reduzieren hier die Sichtweise auf die Daten und vernachlässigen zwangsläufig den Aspekt der Nachricht. Der Informationswirt muß - als Anwender - die betreffenden (elektronischen wie herkömmlichen) Informations- und Kommunikationstechniken beherrschen. Bei der Informationsübermittlung im Rahmen der Informationswirtschaft spielen also hermeneutische, fachliche, dokumentarische und technische Faktoren zusammen: •
Verstehensaspekte (Nachricht der Information relativ zu Sender und Empfänger)
•
fachliche Aspekte (Nachricht der Information relativ zu einem Wissensgebiet)
•
dokumentarische Aspekte (Bearbeitung der Information in Informationsmitteln)
•
technische Aspekte (Informationskanal, Datenverarbeitung).
2.3 Informationskanäle Welcher Art sind die Kanäle, die Signale vom Sender zum Empfänger übermitteln? Abbildung 2.3 zeigt einige Kanäle, geordnet nach ihrem Auftreten in der menschlichen Geschichte. Wir unterscheiden drei Kanalformen: nicht-formale Kanäle, formale Print-Kanäle und formale elektronische Kanäle. Alle Formen haben für die Informationswirtschaft Relevanz.
Nicht-formale Kanäle der Individualkommunikation Die nicht-formalen Kanäle sind die Informationsübermittlungswege der Individualkommunikation. Die nicht hintergehbare elementare Kommunikationsform ist das persönliche Gespräch. Diesen Dialog zwischen zwei Partnern gibt es, seitdem sich Menschen überhaupt ausdrücken können. Nicht-formale Informationskanäle werden auch
in der
Informationswirtschaft genutzt.
Unabhängig
von
elektronischen
Informations- und Kommunikationsmöglichkeiten erfreuen sich diese Kanäle einer nicht zu unterschätzenden Beliebtheit, wie dies beispielsweise Silke Schütte betont. „Neben elektronisch verfügbaren Informationen genießen auch Printmedien und die
44
2 Informationen und Informationskanäle
informelle Face-to-face-Kommunikation einen nicht unerheblichen Stellenwert. Darüber hinaus stellt das Wissen von Mitarbeitern im Außendienst oder von kooperierenden Unternehmen eine wertvolle Quelle für externe Informationen dar" (Schütte 1995, 335).
Abb. 2.3: Entwicklung der Informationskanäle
Gespräch S
M
Buch
E
P Zeitschrift
D E
E
kommerzielle Datennetze
D
CD-ROM
Internet Zeit
p
A N G
E R
gestrichelte Linie: nicht-formale Informationskanäle durchgezogene dünne Linie: formale Informationskanäle / Druckerzeugnisse durchgezogene dicke Linie: formale elektronische Informationskanäle
Je nach Gesprächspartner und Situation ergeben sich diverse Informationsmöglichkeiten: •
Gespräche mit Geschäftspartnern
2 Informationen und Informationskanäle •
Gespräche mit Kunden
•
Gespräche
mit
„Peers"
(„Bekannten",
45
zwischen
denen
soziale
und
informationelle Beziehungen gepflegt werden) •
Gespräche auf Messen
•
Gespräche auf Tagungen
•
Gespräche mit Experten.
Informelle Informationsnetze wollen gepflegt werden. Vertrauliche Informationen oder allgemeiner „Insider"-Informationen werden nur dann weitergegeben, wenn zwischen den Gesprächspartnern soziale Kontakte bestehen und wenn das Geben und Nehmen von Informationen einigermaßen ausgeglichen ist.
In Abbildung 2.3 tauchen die nicht-formalen Kanäle zweimal auf. Einmal als Grundform der Kommunikation (am Anfang der Geschichte) und ein anderes Mal beim Kanal Internet (am bisherigen Ende der Geschichte). Der Technikeinsatz bei der Grundform ist entweder überhaupt nicht gegeben oder benötigt gerademal ein Telefon. Im Internet ergeben sich weitere Möglichkeiten. Über E-Mail oder auch News-Groups lassen sich gewisse (Experten-)Gruppen gezielt ansprechen. Man kann hier gleichzeitig eine große Menge von Menschen kontaktieren, die möglicherweise bereit sind, bei einem Informationsproblem weiterzuhelfen. Das Internet ist ein recht offenes Netz, das wohl nur bei peripheren Informationen genutzt werden kann. Informationen, die Aufschluß über mögliche Unternehmensstrategien geben (und auch eine Frage an eine Newsgroup kann dies bereits erfüllen), sollten nicht über diesen Kanal fließen.
Formale Informationskanäle der Printmedien Über Jahrhunderte dominierten bei den formalen Informationskanälen die Printmedien. Mit der Erfindung des Buchdrucks (ca. 1440) wurde es möglich, Texte in großer Auflage herzustellen. Die Anzahl der Bücher wurde in der Folge immer größer, so daß drohte, daß die einzelnen Gelehrten den Überblick über das Gesamtwissen verlieren. Um dem abzuhelfen, kam es schon im Jahr 1665 zur ersten Zeitschriftengründung. Die in den ersten Zeitschriften enthaltenen Artikel waren keine Forschungsberichte, sondern Überblicksarbeiten, die Wissen aus den Büchern
46
2 Informationen und Informationskanäle
extrahierten oder über das wissenschaftliche Leben berichteten. Im Laufe der Jahrhunderte erschienen in den Zeitschriften auch Forschungsbeiträge, die die reinen Überblicksartikel mehr und mehr verdrängten. Die Anzahl der Zeitschriften stieg stark an, so daß die Zeitschrift zu einem gleichberechtigten (oder gar überlegenen) formalen Kommunikationskanal gegenüber dem Buch wurde. Ende des letzten Jahrhunderts bis ca. Anfang des 20. Jahrhunderts gesellten sich weitere Publikationsformen innerhalb der Printmedien dazu. Durch die Arbeiten der Patentämter werden alle Patentschriften veröffentlicht. Tages- und Wochenzeitungen erscheinen nunmehr regelmäßig. Unternehmen nutzen Printkanäle für eigene Texte (von Unternehmenszeitungen über Geschäftsberichte und technische Dokumentationen bis hin zu Werbetexten). Folgende
Zahlen
sollen
einen
groben
Überblick
über
die
Masse
an
Printpublikationen geben, die im ausgehenden 20. Jahrhundert jährlich weltweit (mit steigender Tendenz) produziert werden: •
wissenschaftliche Bücher: gut 200.000 allein in deutsch, englisch und französisch (vgl. vom Kolke 1994, 1)
•
Verlage: über 330.000 (vgl. ISBN 1995)
•
wissenschaftliche Zeitschriften: gut 100.000, darin: wissenschaftliche Artikel: rund 3 Mio.
•
Tageszeitungen: rund 7.000 (ohne Anzeigenblätter)
•
Patentschriften: knapp 1 Mio.
•
hinzu kommen: Unternehmensschriften und weitere „graue" Literatur, etwa Dissertationen.
Da in jedem Printwerk potentiell brauchbare Informationen liegen, ist für die Informationswirtschaft die Gesamtheit aller aufgeführten Literaturgattungen relevant. Bei den doch sehr hohen Zahlen bekommen wir hier einen ersten Eindruck eines Grundproblems des Informationsressourcenmanagements: dem „Nadel-im-Heuhaufen-Suchen"-Syndrom.
Formale elektronische Informationskanäle Formale Informationskanäle der elektronischen Medien kann man zunächst grob nach Online- und Offline-Kanälen differenzieren. Im Online-Bereich liegen sowohl
2 Informationen und Informationskanäle
47
die kommerziellen Archive, früher über X.25-Datennetze, heute über das Internet erreichbar, die Real-time Informationen als auch die Informationsangebote im Internet selber. Bei den Offline-Kanälen dominiert eine Produktart: die CD-ROM.
Kommerzielle Online-Archive Allein bei den wissenschaftlich-technischen Publikationen drohte bereits am Anfang des 19. Jahrhunderts, daß angesichts der hohen Artikel- und Buchproduktion für die Fachwissenschaftler der Überblick verloren geht. Als Lösung wurden Referateblätter kreiert, in denen in Kurzform, thematisch geordnet, besprechungswürdige Arbeiten zusammengefaßt wurden. Zusätzlich verfaßte man Bibliographien, Sammlungen von Literaturhinweisen, nach formalen Kriterien (etwa: Bibliographie von Hochschulschriften)
oder
zu
Referateblätter und
(mehr
oder
minder
bibliographischen
weiten)
Werke
Themengebieten.
erfreuten
sich
Solche
insbesondere
in
Bibliotheken und Dokumentationseinrichtungen großer Beliebtheit, außerhalb dieser Welt, insbesondere im Unternehmensalltag, wurden sie kaum wahrgenommen. Der Kanal eines Druckwerkes ist für solche Art von Informationsmitteln denkbar ungeeignet. Zentral wäre der uneingeschränkte gezielte Zugriff auf
konkrete
Informationen und nicht das Blättern in regalmeterlangen Referenzbeständen einer Bibliothek. So verwundert es nicht, daß bereits in den 1960er Jahren, also durchaus noch in der „Frühzeit" elektronischer Datenverarbeitung die ersten Referateblätter als elektronische Datenbank angeboten wurden. Zunächst waren diese Datenbanken ausschließlich vor Ort nutzbar, aber Anfang der 70er Jahre konnte man „Online-Datenbanken" auch im Femzugriff erreichen. Zugangsmöglichkeiten ergaben sich über Telefonleitungen und spezielle Datennetze, die der internationalen Norm X.25 (in Deutschland: Datex-P) entsprachen. Zudem wurde mit dem Medium Videotex (in Deutschland Bildschirmtext) gearbeitet. Seit dem Ende der 90er Jahre setzen sich das World Wide Web sowie das Telnet als Zugangsnetze zu den Online-Archiven mehr und mehr durch. Obgleich die Online-Datenbanken ihren Ausgang in elektronischen Formen von Referateblättern haben, hat sich das Spektrum inzwischen massiv erweitert. Volltexte wissenschaftlicher Zeitschriften, Gerichtsurteile im Wortlaut, Sammlungen naturwissenschaftlicher und technischer
Angaben,
Unternehmensdossiers,
Bilanzen,
Marktforschungsberichte im Volltext, Patentschriften einschließlich der darin enthaltenen Graphiken usw. sind derzeit in diesen elektronischen Informationsmitteln
48
2 Informationen und Informationskanäle
abfragbar. Die Online-Datenbanken werden - von einigen Ausnahmen öffentlicher Anbieter abgesehen - im Rahmen der Informationswirtschaft kommerziell vermarktet. Sie bilden den Kern des Informationsressourcenmanagements.
Die Quantität der kommerziellen Online-Angebote ist durchaus mit der Menge an Printressourcen
vergleichbar,
wobei
Schnittbereiche
aufweisen,
insofern
beide
Mengen
inzwischen
Druckerzeugnisse
parallel
recht
große
elektronisch
vertrieben werden. Als vage Schätzwerte können gelten: •
Anzahl der Online-Datenbanken: 6000 (hinzu kommen weitere rund 2500 Datenbanken mit fachlichem Inhalt auf CD-ROM)
•
Anzahl der Datensätze in Online-Datenbanken: circa 10 Milliarden (vgl. Gale/1; Gale/2).
CD-ROM Viele
Online-Datenbanken
erscheinen
parallel
in CD-ROM-Ausgaben,
einige
(wenige) Produkte auch exklusiv unter CD-ROM. Die Datenmenge ist, bedingt durch die Begrenztheit des Speichermediums, geringer als bei den Online-Datenbanken. Bei großen Datenmengen auf CD-ROMs, z.B. bei Patenten im faksimilierten Volltext,
ist
stetes
CD-Wechseln
angesagt
(,,Diskjockey"-Syndrom),
selbst
Jukeboxen bekommen Platzprobleme. Die Mächtigkeit der Suchmöglichkeiten hängt von der CD-ROM-Retrievalsoftware ab und ist in der Regel zwar komfortabler, aber weniger umfänglich als im Online-Bereich. Datenbankübergreifende Suchen, bei Online-Archiven selbstverständlich, sind bei CD-ROM nahezu ausgeschlossen. (Dies geht nur, wenn mehrere Datenbanken auf einer CD-ROM vereinigt sind.) Vorteil einer CD-ROM kann der Preis sein. Im Gegensatz zur Online-Nutzung, wo „pay as You go" dominiert, liegt hier eine feste Abonnementgebühr vor. Für Vielnutzer genau einer Datenbank ist möglicherweise die CD-ROM attraktiver. Hauptargument für Online-Archive ist die Aktualität der Informationen. Je nach Datenbankproduzent werden die Informationen mehrmals täglich fortgeschrieben. Beim Bedarf nach aktuellen Informationen fällt die CD-ROM als Informationskanal prinzipiell weg. Einen Vergleich zwischen der CD-ROM- und der Online-Nutzung von Datenbanken bietet Tabelle 2.1.
2 Informationen und Informationskanäle Entsprechend ausgerüstete Unternehmen
49 legen ihre CD-ROM-Bestände
in ein
internes Netzwerk, etwa in ein Intranet. Für solche CD-ROM-Kunden, die ohnehin höhere Nutzungslizenzen zahlen müssen, bietet sich als Alternative das Abonnement einer Online-Datenbank zur Nutzung im Intranet an. Hier verbinden sich die Vorteile des Mediums Online-Datenbank mit Kostenvorteilen. Sollte sich solch ein Vorgehen durchsetzen, so sind die Einsatzmöglichkeiten der C D - R O M in der betrieblichen Informationswirtschaft nur noch sehr gering.
Tab. 2.1: Eigenschaften von Online- und C D - R O M - D a t e n b a n k e n Online-Archiv
CD-ROM
hoch
niedrig
Mächtigkeit der Retrieval- groß
niedrig
Aktualität
sprache datenbankübergreifende
möglich
nicht möglich
Datenmenge
groß
begrenzt
Preis
variabel
konstant
Suchen
Real-time Informationen Im Finanzsektor haben sich in den letzten Jahren Informationssysteme etabliert, die ihren Kunden in Echtzeit wichtige Informationen, z.B. Börsenkurse, auf deren Rechner senden. Verbunden sind die Informationssysteme mit Transaktionssystemen, mit denen Börsengeschäfte abgeschlossen werden können. Als „Hintergrundinformationen"
wird
auch
in
diesem
Bereich
auf
die
Inhalte
der
Online-Archive
zurückgegriffen, etwa auf Berichte von Analysten. „Newswire-Services" sind Weiterentwicklung der „Tickerdienste" der Presseagenturen. Berichte der Korrespondenten werden direkt nach dem
Erstellen
in die
Datenbank aufgenommen. Aus Nutzersicht der Informationswirtschaft unterscheiden sich die Real-time Informationen nicht von den „historischen" Informationen (sie sind halt aktueller).
50
2 Informationen und Informationskanäle
Internet Der letzte hier zu besprechende formale Kommunikationskanal der elektronischen Medien ist das Internet. Dieses fährt uns - als Netzwerk - zu den Anbietern der kommerziellen Online-Informationen, aber auch zu den kostenlosen breitgestreuten Informationen
aller
Arten
von
Anbietern.
Im
Internet
bzw.
seinem
wohl
interessantesten Teil, dem World Wide Web, sind wir derzeit mit zweierlei Aspekten von Chaos konfrontiert: •
dem Chaos der WWW-Seiten selber
•
dem Chaos, im W W W zielgenau etwas zu finden.
Der erste Aspekt betrifft den Sachverhalt, daß jedermann, der meint, etwas im Internet veröffentlichen zu müssen, dies auch ungehindert tun kann. Es gibt demnach seriöse Angebote neben nutzlosen und falschen Informationen. Der zweite Aspekt zielt auf die sogenannten „Suchmaschinen", die mittels Methoden der automatischen Indexierung
zu
einzelnen
WWW-Seiten
leiten.
Im
Vergleich
zu
den
Retrievalmöglichkeiten der Online-Archive arbeiten die Suchmaschinen suboptimal. Wir müssen streng unterscheiden zwischen dem WWW als Netzwerk und den (z.T. chaotischen) Inhalten des WWW. Für die Informationswirtschaft hat nur ein geringer Teil der Inhalte Relevanz. Als globales Netzwerk ist es jedoch für die Informationswirtschaft zentral. Hier bahnt sich ein Weltstandard - ähnlich dem Telefon - an. Alle Rechner der Welt sind, sofern erwünscht, in das Netz integrierbar. Die Grenzen zwischen dem globalen Internet und den unternehmensinternen Intranets (die ja nichts anderes als nur intern zugängliche Internets sind) sind offen. Bei der Beschaffung externer Informationen und der Integration dieser in das firmeneigene Intranet ist dies ein wichtiger Aspekt.
2.4 Informationslogistik im Data Warehouse Interne und externe Informationen bilden im Sinne der Vorgaben der Informationswirtschaft einen ganzheitlichen Bereich. Dabei sind die einzelnen Informationen natürlich nicht gleichartig. Daten aus den operativen Systemen fallen genauso an wie Textinformationen aus internen Berichten oder Informationen aus den externen Informationsressourcen. Diese Informationsvielfalt will gebändigt werden.
2 Informationen und Informationskanäle
51
Data Warehouse Ein interessanter Aspekt der Bündelung von Daten und Informationen ist das „Data Warehouse" (vgl. Inmon 1996). Grob gesagt, geht es darum, den Anwendern in einem
Unternehmen
oder
einer
Behörde
alle
die
(internen
wie
externen)
Informationen anzubieten, die sie zur Unterstützung ihrer Aufgabenstellungen benötigen.
Wenn
Primärdatenbanken
wir
die
bezeichnen,
ursprünglichen so
liegt
Informationsressourcen
beim
Data
Warehouse
als eine
Sekundärdatenbank vor, „die mit Hilfe geeigneter Extraktionsmechanismen aus einer oder
mehreren
operativen
Datenbanken
erzeugt
wird.
Die
Daten
der
Sekundärdatenbank sind dabei so aufzubereiten und zu aggregieren, daß sie hinsichtlich
zu
erwartender
Auswertungen
in
möglichst
geeigneter
Weise
zusammengestellt werden" (Inan/Rautenstrauch 1997, 156). Abbildung 2.4 zeigt wesentliche Bestandteile eines Data Warehouse.
Abb. 2.4: Data Warehouse
Data Warehouse
Ressourcen
Integration
Verwaltung
Zugriff
52
2 Informationen und Informationskanäle
Interne wie externe Informationsressourcen, f ü r die ein Bedarf besteht, werden nach relevanten Informationen durchsucht, diese werden in ein einheitliches
Format
transformiert. Diese integrierten Daten gehen als Datenbasis in das Data Warehouse ein. Zusätzlich enthält das Data Warehouse Metadaten, das sind Daten über Daten. Metadaten werden etwa eine thematische Ordnung der Datenbasis erbringen und bereiten
demnach
den
optimalen
Zugriff
auf
das
Data
Warehouse
vor.
Zugriffsformen können sein: •
thematische Abfragen von Informationen
•
Informationsanalysen
•
Informationsverdichtungen
für Managementinformationssysteme
(MIS)
bzw.
Executives Information Systems (EIS). Bei den Abfragen werden Daten bzw. Datensätze als solche selektiert. Informationsanalysen
setzen
Daten
aus
verschiedenen
Perspektiven
in
Zusammenhänge.
Informationsverdichtungen für MIS bzw. EIS arbeiten hochaggregiert und geben den oberen Managementebenen Orientierungsinformationen. Wir wollten an dieser Stelle ausschließlich zeigen, daß - am Beispiel des Data Warehouse - eine ganzheitliche Informationswirtschaft überhaupt möglich ist. A m Ende des Buches (im Kapitel 19) werden wir das Thema noch einmal aufgreifen.
Data Mining In betrieblichen Informationssystemen können alle Informationen abgefragt werden, die
so auch
explizit
ins
System
eingegeben
werden.
Durch
die
geschickte
Aggregierung von Daten, durch Berechnen von Korrelationen, durch Clusteranalyse usw. ist es jedoch möglich, auf der Basis der vorhandenen Informationen
zu gewinnen.
Ein solches
Vorgehen
wird
Daten
als „Data
neuartige Mining"
besprochen. „Der Kernaspekt von Data Mining liegt in der Gewinnung neuer Erkenntnisse. Es werden also Informationen geschaffen, die vorher explizit nicht vorhanden waren" (Krahl/ Windheuser/Zick 1998, 39). Data Mining kann (aber muß nicht) Teil eines Data Warehouse sein. Data Mining ist dann eine spezielle Form der Analysetools. Daniela Krahl, Ulrich Windheuser
und
Friedrich-Karl Zick sehen Vorteile der Integration von Data Warehouse und Data Mining. „1. Data Mining-Werkzeuge können auf Daten, die erst im Data Warehouse bereinigt und konsolidiert werden, zugreifen, wie z.B. aggegrierte oder historische
2 Informationen und Informationskanäle
53
Daten. 2. Die operativen Datenbanken werden durch den Data Mining-Prozeß nicht belastet. 3. Das bereinigte Datenmodell und die bereinigten Daten des Data Warehouse können zu verbesserten Ergebnissen fuhren. 4. Data Mining-Ergebnisse, wie z.B. eine Segmentierung, können direkt zurück auf das Data
Warehouse
übertragen werden" (ebd., 53 f.). Methoden des Data Mining bedienen sich u.a. der Statistik, der Technik neuronaler Netze (vgl. ebd., 59 ff.) oder auch informetrischer Methoden (vgl. Stock 1992a). Wir werden hierauf später zurückkommen.
Aktive und passive Informationsübermittlung Wie kommen die jeweils relevanten Informationen zu ihren Empfangern? Hier gibt es zwei Wege: Entweder der Nutzer holt sich die Informationen aktiv aus dem betrieblichen Informationssystem oder er wartet, bis das Informationssystem ihn mit den Informationen versorgt (siehe Abbildung 2.5). Silke Schütte spricht in diesem Zusammenhang von einem Pull- und Push-Ansatz. „Während der Informationssuchende beim Pull-Ansatz aktiv die Information ... sucht und abfragt, empfängt der Anwender beim Push-Ansatz passiv die gesuchten Informationen" (Schütte 1997, 104). Im Pull-Ansatz werden die Informationsarten im betrieblichen Informationssystem (oder im Data Warehouse) je nach Nutzerkategorie unterschieden. Nur die Klasse der „allgemeinen
Informationen"
ist
für
alle
Nutzer
zugänglich.
Alle
anderen
Informationen sind durch Passwörter geschützt. „Sensible Informationen" können sowohl interne Informationsbestände sein (z.B. Forschungs- und Entwicklungsberichte) als auch externe Informationsressourcen (etwa weil ein Informationsanbieter im Hochpreissegment agiert und nur geschulte Rechercheure kostengünstig suchen können). Analog sieht es bei den „exklusiven Informationen" aus. Solche Informationsbestände werden als Geschäftsgeheimnis betrachtet und stehen nur einem kleinen Kreis zur Verfugung. Hierunter fallen etwa alle Personalinformationen eines Unternehmens oder die Daten der Executives Information Systems (EIS). „Zielgruppenspezifische Informationen" beziehen sich auf den Informationsbedarf von Personengruppen oder betrieblichen Einheiten. Dieser Bedarf ist sowohl von der Informationsart (etwa wissenschaftliche Literatur für Forscher oder eine Liste mit betriebswirtschaftlichen
Kennzahlen
für das
Controlling)
als
auch
von
der
Informationsaufbereitung (auch lange Texte fiir den Forscher; am liebsten eine aussagekräftige Graphik für den Controller) abhängig. Beim Pull-Ansatz muß der
54
2 Informationen und Informationskanäle
Informationssuchende seinen Informationsbedarf erkennen und daraufhin selber suchen. Über das Passwort wird sichergestellt, daß er im betrieblichen Informationssystem die für ihn passenden Informationen - und (möglichst) nur diese - findet. Der Push-Ansatz eignet sich besonders für die Verteilung zielgruppenspezifischer Informationen. Dies können allgemein „Neuigkeiten" sein, die eine bestimmte Nutzergruppe interessieren könnten. Dies sind aber auch alle Arten von Frühwarninformationen, die schnellstmöglich zum Entscheidungsträger gelangen müssen. „Push-Technologien erlauben es, daß Anwender passiv Nachrichten als E-Mails erhalten, statt diese im Web oder Intranet aktiv zu suchen" (ebd., 111). Damit ein Mitarbeiter „passiv" relevante Informationen erhält, muß natürlich ein Informationswirt „aktiv" werden.
Abb. 2.5: Pull- und Push-Ansatz der Informationsbereitstellung
Informationsbereitstellung: Pull and Push
PullAnsatz
freier Zugang allgemein e Informationen
PassWörter sensible Informationen
PassWörter
Benutzersichten
exklusive Informationen
zielgruppenspezifische Informationen .
PushAnsatz
E-MailVerteiler
Quelle: verändert nach: Schütte 1997, 104
Informationsbedarf Welche Informationen werden im Data Warehouse zur aktiven Suche oder Analyse angeboten, welche werden zielgruppenspezifisch verteilt? Zur Beantwortung fuhrt
2 Informationen und Informationskanäle
55
eine Analyse des Informationsbedarfs eines Unternehmens bzw. seiner Mitarbeiter. Bei der Untersuchung dieses Problems müssen wir zwei Gesichtspunkte berücksichtigen: •
den objektiven Informationsbedarf
•
den subjektiven Informationsbedarf (oder das „lnformationsbedürfhis")-
Die Ermittlung und Prognose von Informationsbedarf heißt nicht nur, die faktisch bei den Nutzern vorhandenen Informationswünsche, den subjektiven Informationsbedarf zu eruieren, sondern auch, den objektiv gegebenen Mitarbeiters unabhängig von Informationsbedarf
können
ihm zu bestimmen. weit
Informationsbedarf
Subjektiver und
auseinanderklaffen
(vgl.
eines
objektiver
Strohmeier
1994).
Mitarbeiter sind zum Teil gar nicht in der Lage einzuschätzen, was sie alles nicht wissen, aber in bestimmten Situationen wissen sollten. Unterscheidet sich der objektive
Informationsbedarf
Informationsbedürfhissen
oder
von ist
den
(empirisch
beim
Mitarbeiter
erhobenen) keinerlei
subjektiven Bedarf
an
Informationen vorhanden, so gilt es, beim Mitarbeiter ein Informationsbewußtsein zu wecken oder zu verfeinern. Die Anwender des betrieblichen Informationssystems sollten bei der Festlegung des objektiven Informationsbedarfs, bei der Definition der zielgruppenspezifischen
Informationen
sowie
bei
der
Größe
ihrer
Zugriffsberechtigungen stets beteiligt werden. Das schönste Informationssystem wird nichts bringen, wenn es nicht optimal genutzt wird. Informationsbedarf in Unternehmen oder Behörden entsteht auf unterschiedlichen Dimensionen: •
aktuelle betriebsinterne Informationen (Auftragsbestand, Produktionsvolumen usw.) - Ist- und Sollwerte
• •
Historie der betriebswirtschaftlichen Kennzahlen des eigenen Unternehmens betriebswirtschaftliche Kennzahlen anderer Unternehmen (Wettbewerber, Zulieferer, Abnehmer, Unternehmen, an denen man sich beteiligen möchte)
•
Informationen über Produkte und Märkte (oder auch größere Aggregate, etwa gesamtwirtschaftliche Situationen)
•
Informationen über das Image eines Unternehmens (insbesondere des eigenen) auf Märkten und in Regionen
•
wirtschaftswissenschaftliche Informationen
2 Informationen und Informationskanäle
56 •
wissenschaftlich-technische Informationen
•
Informationen über gewerbliche Schutzrechte
•
juristische Informationen
•
Informationen über Ausschreibungen
•
Informationen über Personalressourcen.
Für jede dieser Dimensionen ist zu bestimmen, in welcher Richtung ein Informationsbedarf im Hause vorhanden ist. In das betriebliche Informationssystem gehen alle entsprechenden internen Informationen ein. Der Rest muß extern besorgt werden.
Abb. 2.6: Deckung des Informationsbedarfs
Informationsbedarf iL
bekannte Informationen gedeckter Informationsbedarf
ungedeckter Informationsbedarf t
Zeit
Just-in-time Information Im Sinne einer Just-in-time Information ist es wenig sinnvoll, eigene Informationsbestände anzuhäufen, die „gegebenenfalls irgendwann" gebraucht werden könnten. In
2 Informationen und Informationskanäle
57
Anlehnung an ein Prinzip der Logistik der Just-in-time Produktion fordert Siegfried August in „kein 'Auf-Vorrat-Produzieren' von Informationen" (Augustin 1990, 112). Wohl muß im Unternehmen organisiert sein, daß jederzeit auf benötigte externe Informationen uneingeschränkt zugegriffen werden kann. Just-in-time Information bedeutet, daß eine singulare Information im Moment des Bedarfs im Informationssystem zu finden ist. Es kommt aber auch vor, daß Informationen nicht punktuell nachgefragt werden, sondern daß eine gewisse Informationsmenge über eine Zeitspanne benötigt wird. Als Beispiel kann man sich ein Forschungs- oder Entwicklungsprojekt vorstellen, bei dem zum Forschungsthema alle relevanten Literatur-, Patent- und Projektinformationen in die Arbeit einfließen. Dieser Informationsfluß dauert so lange, wie das Projekt läuft. In jeder Projektphase werden - just in time - die jeweils relevanten Informationen erhoben. Abbildung 2.6 zeigt einen solchen zeitgebundenen Informationsfluß. Am Anfang der Themenstellung (bei ti) wird die Menge der bekannten Informationen, also der gedeckte Informationsbedarf, normalerweise kleiner sein als die Menge der unbekannten Informationen, als der ungedeckte Informationsbedarf. An einem späteren Bearbeitungszeitpunkt (t 2 ) liegt der ungedeckte Informaionsbedarf bei einem Minimum. Im Laufe der Themenbearbeitungszeit steigt der Informationsbedarf infolge neuer, akueller Informationen an. Auch und gerade diese Informationen müssen bekannt werden.
Fazit •
Information ist eine Ware, deren Preis in Abhängigkeit von Übermittlungsform und -instanz stark schwankt.
•
Information ist ein Vertrauensgut im Sinne des Qualitätsmanagements.
•
Information ist das Gesamt von einem materiellen Träger (Signal) und einem Inhalt (Nachricht). Der Begriff „Daten" sieht von jeglichem Inhalt ab. „Wissen" sind Informationsinhalte, die in einem System (z.B. einer Wissenschaftsdisziplin) verortet werden. Entscheidend fiir die Informationswirtschaft, ist das „handlungsrelevante Wissen", derjenige Teil der Informationen, für den ein
Bedarf
vorhanden ist. •
Bei Informationsübermittlungen spielen hermeneutische, fachliche, dokumentarische und technische Faktoren zusammen.
58 •
2 Informationen und Informationskanäle Als Übermittlungskanäle kommen alle formalen wie informellen Formen infrage. Besonders ausgeprägt ist die Relevanz gewisser Printmedien, der CD-ROM, der Online-Archive sowie des Internet.
•
Für die Beschaffung externer Informationen wird Informationslogistik im Sinne von Just-in-time eingesetzt.
•
Externe wie interne Informationen fließen im Data Warehouse zusammen und werden den Nutzern unter einheitlicher Oberfläche angeboten.
•
Die Informationsversorgung in einem Unternehmen erfolgt (aus der Sicht der Nutzer) sowohl aktiv als auch passiv (Pull- und Push-Ansatz).
•
Die Auswahl der Informationen, die im betrieblichen Informationssystem vorhanden sein sollen, orientiert sich am objektiven Informationsbedarf der Mitarbeiter und der Geschäftsführung.
3 Hilfsmittel der Wirtschaftsdokumentation: Klassifikation und Thesaurus Daten, Information und Wissen bedürfen der Ordnung. Der Zugriff auf Informationen im Data Warehouse braucht genauso eine systematische Ordnung wie eine kommerzielle Online-Datenbank oder auch ein elektronischer Bibliothekskatalog. Beim Aufbau von Datenbanken oder Katalogen machen die „Indexer" von gewissen Ordnungssystemen Gebrauch, wenn sie die Informationsinhalte suchbar abbilden. Eine inhaltliche Abfrage an diesen Datenbanken ist dementsprechend fast ausschließlich nur dann möglich, wenn der Suchende die Methoden und Hilfsmittel kennt, die bei der Datenbankproduktion eingesetzt worden sind. Auch ist die Kenntnis solcher Ordnungssysteme bei der Gestaltung eines thematischen Abfrage- oder Analysetools eines Data Warehouse nützlich. Die Methoden der ordnenden Inhaltsabbildung sind vor allem im bibliothekarischen und dokumentarischen Kontext entstanden (vgl. z.B. Cleveland/Cleveland
1990;
Fugmann 1999; Ladewig 1997; Lancaster 1998; O'Connor 1996). Wir wollen uns in diesem Kapitel mit solchen Methoden und konkreten Hilfsmitteln befassen, die in der Dokumentation
wirtschaftlicher Sachverhalte
Relevanz haben. Das heißt,
wir
befassen uns nur mit denjenigen Dokumentationsmethoden, die beim Aufspüren externer
Wirtschaftsinformationen
dringend
benötigt
werden
oder
die
in
betrieblichen Informationssystemen Anwendung finden können. In der Wirtschaftsdokumentation dominieren zwei Methoden der Inhaltsabbildung: Klassifikation und Thesaurus. Eine Klassifikation ist eine strukturierte Darstellung von Klassen und der zwischen den Klassen bestehenden Begriffsbeziehungen, wobei die Klassen durch (von natürlichen Sprachen unabhängigen) Notationen repräsentiert werden (vgl. DIN 32705, 2). Ein Thesaurus ist ebenso eine geordnete Zusammenstellung von Begriffen, hier jedoch unter Nutzung ihrer natürlichsprachigen Bezeichnungen (vgl. DIN 1463/1,2).
3.1 Begriffssysteme Die Ordnung, die in der Wirtschaftsdokumentation geschaffen wird, arbeitet mit Begriffen und Relationen zwischen Begriffen. Wenn man so will, wird hierbei die Sprache der Wirtschaft und der Wirtschaftswissenschaften in eine begriffliche Ordnung gebracht.
60
3 Hilfsmittel der Wirtschaftsdokumentation
Relationen Begriffssysteme unterscheiden folgende Relationsarten (vgl. DIN 2331): •
•
Hierarchierelation •
Abstraktionsrelation (generische Relation)
•
Bestandsrelation (partitive Relation)
Assoziationsrelation.
Abb. 3.1: Relationen in Begriffssystemen
Relationen in Begriffssystemen
relation
Bottomterms
In Abbildung 3.1 haben wir ein kleines Begriffssystem vor uns, das die neun Begriffe A bis I enthält.
Hierarchierelation Der Begriff A ist der oberste Begriff in der Hierarchie, ein „Topterm", also ein Begriff von hoher Allgemeinheit. Im Bild von oben nach unten stehen auf den jeweils benachbarten Ebenen „Unterbegriffe". B und C sind Unterbegriffe von A; D, E und F
61
3 Hilfsmittel der Wirtschaftsdokumentation
sind Unterbegriffe von B usw. In umgekehrter Reihenfolgen spricht man von „Oberbegriffen".
Ober-
und
Unterbegriffe
bilden
die
„Hierarchierelation".
„Hierarchische Beziehungen stellen ein Über- und Unterordnungsverhältnis und damit auch Nebenordnungsverhältnisse zwischen Begriffen her. Hinsichtlich des Begriffsumfanges bedeutet dies, daß alle Gegenstände, die unter einen engeren Begriff
(untergeordneten
Begriff) fallen,
auch
unter
den
weiteren
Begriff
(übergeordneten Begriff) fallen, dieser aber noch zusätzliche Gegenstände umfaßt" (DIN 2331, 2). Die Hierarchierelation hat zwei Ausprägungen, die jedoch in den meisten Dokumentationssprachen zusammenfallen. Einmal geht es um eine logische Sichtweise: Der Unterbegriff der Abstraktionsrelation schließt alle Merkmale des Oberbegriffs ein, hat aber mindestens ein weiteres Merkmal, das ihn von den nebengeordneten Begriffen,
die
auch
Unterbegriffe
desselben
Oberbegriffs
sind,
eindeutig
unterscheidet (Beispiel: Pkw und Lkw als Unterbegriffe von Kraftwagen). Zum anderen geht es um Ganzheiten und dessen Teile. Der Unterbegriff der Bestandsrelation repräsentiert jeweils einen Teil des übergeordneten Gegenstandes (Beispiel: Fahrgestell und Motor als Teilbegriffe von Kraftwagen). Alle Paare, die in Hierarchierelation zueinander stehen, bilden in ihrer Gesamtheit vom Topterm bis zu den Bottomterms eine „Begriffsleiter". In der Abbildung sind mehrere Begriffsleitern vorhanden, u.a. A - B - D oder A - B - F - G. Eine „Begriffsreihe" setzt sich aus allen Begriffen zusammen, die denselben OberbegrifThaben, also z.B. D - E - F oder B - C. Ein Begriffssystem, in dem alle Begriffe entweder keinen oder genau einen Oberbegriff haben, nennt man „monohierarchisch". Begriffssysteme, bei denen ein Begriff mehrere Oberbegriffe haben kann, sind „polyhierarchisch". Unser Beispiel in Abbildung 3.1 ist demnach ein polyhierarchisches System (H hat die zwei Oberbegriffe C und F). Ein Beispiel möge die Nützlichkeit von Polyhierarchien verdeutlichen! Der Begriff „Holzmöbelindustrie" hat als Oberbegriff sowohl „Holzindustrie" als auch „Möbelindustrie".
Assoziationsrelation Neben der Hierarchierelation kennt man in der Dokumentation weiterhin die „Assoziationsrelation". Hier gehen alle Beziehungen zwischen zwei Begriffen ein,
62
3 Hilfsmittel der Wirtschaftsdokumentation
die unabhängig von Hierarchierelationen bestehen. Folgende Relationsarten fallen u.a. unter die assoziativen Begriffsbeziehungen: •
Nachfolgerelation (Vorgänger - Nachfolger)
•
Kausalrelation (Ursache - Wirkung)
•
genetische Relation (Produzent - Produkt)
•
Herstellungsrelation (Material - Produkt)
•
Transmissionsrelation (Sender - Empfänger)
•
instrumentelle Relation (Werkzeug - Anwendung des Werkzeugs)
•
funktionelle Relation (Argument - Funktion)
•
Ähnlichkeitsrelation
•
Antonymie-Relation (Gegensätze) (vgl. DIN 2331, 3).
In einem Begriffssystem steht die assoziative Relation ergänzend zur Hierarchierelation zur Verfugung. In unserem Beispiel ist eine Assoziationsrelation zwischen den Begriffen D und G gegeben.
3.2 Klassifikation DIN-Norm zu Klassifikationssystemen Die deutsche Norm DIN 32705 definiert „Klassifikationssysteme" als „Hilfsmittel zur Ordnung von Gegenständen oder Wissen über Gegenstände. Ordnung wird hierbei verstanden als •
technisch-praktische Aufgabe: Anordnen, Bei-, Neben- und Einordnen, Einteilen, Gruppieren, Unterordnen, Zusammenordnen, Zuordnen;
•
wissenschaftliche Aufgabe: Verwendung logischer Hilfsmittel, zur angemessenen Darstellung von Wissenseinheiten (Aussagen über Gegenstände);
•
erkenntnisvermittelnde
Aufgabe: Aufhellung von Zusammenhängen
geordneten Wissens" (DIN 32705,2).
anhand
63
3 Hilfsmittel der Wirtschaftsdokumentation
Ein Klassifikationssystem ist ein Begriffssystem, in dem die Begriffe als Klassen angesehen werden. Die Bezeichnungen der Klassen geschieht durch Notationen. Hierbei unterscheidet man drei Arten: •
hierarchische Notation: die Notation bildet die Struktur des Systems ab; im Beispiel von Abbildung 3.1 etwa:
•
•
Klasse A
Notation
1
•
Klasse B
Notation
11
•
Klasse D
Notation
111
•
Klasse C
Notation
15 usw.
sequentielle Notation: durch Notation wird durchnumeriert, sie ist nicht strukturabbildend, z.B.:
•
•
Klasse A
Notation
1
•
Klasse B
Notation
3
•
Klasse D
Notation
8
•
Klasse C
Notation
5
hierarchisch-sequentielle Notation: Mischform (vgl. ebd., 6).
Viele Klassifikationssysteme bilden auch komplexe Begriffe bzw. Begriffskombinationen möglichst in genau einer Klasse mit einer Notation ab. Solche Systeme bezeichnet man als „präkombiniert". „Ein präkombiniertes Klassifikationssystem ist ein Klassifikationssystem, das Komplexbegriffe enthält, denn in ihm sind aus zweckdienlichen Gründen komplexe Verknüpfungen von vornherein festgelegt worden" (ebd., 5). So kann es für ein System möglicherweise nützlich sein, den aus mehreren Begriffen bestehenden Komplex „Witterungsabläufe in Mittelgebirgslagen subtropischer Zonen" als eine Klasse anzusehen und mit einer Bezeichnung zu notieren. Klassifikationssysteme sind in der Regel monohierarchisch geordnet. Außer der Hierarchierelation kommt normalerweise keine weitere Relationsart vor. Im Folgenden werden wir eine Universalklassifikation
(die Dewey
Decimal
Classification),
zwei Spezialklassifikationen der Wirtschaftsdokumentation ( N A C E
und Predicasts
Product Code) sowie eine Spezialklassifikation der Technik (die
Internationale Patentklassifikation)
als Beispiele für konkrete Systeme vorstellen.
64
3 Hilfsmittel der Wirtschaftsdokumentation
Dewey Decimal Classification (DDC) Eine der großen Universalklassifikationen ist die Dewey
Decimal
Classification
(DDC). Sie wurde erstmals 1876 in den Vereinigten Staaten veröffentlicht. Melvil Dewey betrachtete seine auf dem Dezimalprinzip beruhende Klassifikation als Hilfsmittel für Kataloge sowie als Systematik für Aufstellordnungen in Bibliotheken. Eingesetzt wird die DDC in tausenden von Bibliotheken, vor allem im angloamerikanischen Bereich. In Europa wird eher mit einer Variante der DDC, der Universellen
Dezimalklassifikation
(UDK
oder
DK)
gearbeitet.
Mit
dem
Aufkommen von elektronischen Bibliothekskatalogen, die zudem über Internet zugänglich
sind,
gewinnt
Informationsressourcenmanagement
die an
DDC Bedeutung,
als ermöglicht
Instrument sie doch
des einen
einheitlichen inhaltlichen Zugriff auf die Bibliotheksbestände.
Die DDC umfaßt derzeit etwa 22.000 Klassen in den Haupttafeln (schedules) sowie rund 8.000 Klassen in den Hilfstafeln (tables). Erschlossen wird die systematische Ordnung durch ein alphabetisches Register mit über 80.000 Einträgen, das nicht nur die Klassenbezeichnungen, sondern auch deren Synonyme enthält. Die zehn Klassen der obersten Hierarchieebene sind: 000
Generalities
100
Philosophy, psychology
200
Religion
300
Social sciences
400
Language
500
Natural sciences and mathematics
600
Technology (applied sciences)
700
The arts
800
Literature
900
Geography, history.
Die Hierarchie wird in der DDC durch die Notation angezeigt. Unterbegriffe einer Klasse haben eine Dezimalstelle mehr als der betreffende Oberbegriff. (Bis zu den
65
3 Hilfsmittel der Wirtschaftsdokumentation
ersten drei Stellen wird in der DDC mit Nullen „aufgefüllt".) Betrachten wir dazu beispielhaft eine Begriffsleiter und ihre Darstellung in der DDC: 600
Technology (applied sciences)
630
Agriculture and related technologies
636
Animal husbandry
636.7
Dogs
636.8
Cats.
Es gibt Begriffe, die (mehr oder minder sinnvoll) mit allen Klassen verknüpft werden können. Hierzu gehören u.a. geographische Benennungen. Wir können über die Landwirtschaft Deutschlands genauso Aussagen treffen wie über die in Italien. Um nicht eigens Klassen für die unterschiedlichen nationalen Landwirtschaften einführen zu müssen, werden „Schlüssel" verwendet, die an DDC-Notationen angeschlossen werden können. Diese „Hilfstafeln" finden wir in den „Tables". Die DDC verwendet sieben Hilfstafeln: T1
Standard subdivisions
T2
Geographic areas, historical periods, persons
T3
Individual literatures
T4
Individual languages
T5
Racial, ethnic, national groups
T6
Languages
T7
Groups of persons.
Unser Ausschnitt in Abbildung 3.2 zeigt einen Teil der schedules im thematischen Umfeld der Datenverarbeitung. Beim Retrieval nach der DDC ist die Kenntnis der Notation
notwendig,
da
diese
(und
nicht
etwa
die
umgangssprachlichen
Benennungen) bei der DDC-Suche benutzt werden müssen. Mit der Dewey Decimal Classification werden die Bestände einiger der weltgrößten Bibliotheken thematisch erschlossen (vgl. Crossley 1984). Die DDC wird u.a. bei der „Library of Congress" und der „British Library" eingesetzt.
66
3 Hilfsmittel der Wirtschaftsdokumentation
Abb. 3.2: Ausschnitt aus der Dewey Decimal Classification (DDC) 004
Data processing - Computer science
004.015 1
Mathematical principles
004.019
Human-computer interactions
004.028
Auxiliary techniques and procedures; apparatus, equipment, materials
004.1
General works on specific types of computers
004.11
Digital supercomputers
004.12
Digital mainframe computers
004.125 004.14 004.145 004.16 004.165 004.19 004.2
Specific digital mainframe computers Digital minicomputers Specific digital minicomputers Digital microcomputers Specific digital microcomputers Hybrid and analog computers Systems analysis and design, computer architectures, performance evaluation
004.21
Systems analysis and design
004.22
Computer architecture
004.24
Performance evaluation
Quelle: DDC 1989, Bd. 2, 9 ff. (stark gekürzt)
Wir wollen die thematische Suche in Bibliothekskatalogen an zwei Beispielen vorführen. Im ersten Beispiel recherchieren wir via Internet bei der Library of Congress, im zweiten Beispiel mittels einer CD-ROM bei der British Libraiy. Abbildung 3.3 zeigt (stark gekürzt) eine Suche nach einer Monographie über Systemanalyse und Systemdesign im elektronischen Katalog der Library of Congress. Wir beginnen als Einstieg mit der DDC-Notation 004.2. Das Recherchesystem zeigt
3 Hilfsmittel der Wirtschaftsdokumentation
67
die thematische Umgebung der Einstiegsnotation unter Angabe der Trefferzahl an. Wir entscheiden uns zunächst für die Klasse 004.21 (174 Treffer). Die Klassen unterhalb der 004.21 geben Kombinationen aus unserer Notation und Notationen aus den Hilfstafeln an. Die Zahl „01" steht für „Philosophy and theory", „011" - als Unterbegriff zu 01 - für „Systems". Schlägt man an dieser Stelle in den tables nach, so erfährt man, daß die nächsten Dezialmalstellen die Art der Systeme (erstellt aus dem Bereich 003 der schedules) darlegt; „76" steht dabei fur „Stochastic systems". Die Notation 004.2101176 bedeutet demnach: Systemanalyse / Systemdesign in bezug auf stochastische Systeme. Das Ankreuzen der gewünschten Notation führt im letzten Schritt zur Anzeige der Katalogkarte(n).
Abb 3.3: DDC-Recherche bei der Library of Congress (1) Aufruf des „Browse"-Einstiegs in den Katalog der Library of Congress (URL: http://lcweb.loc.gov/catalog/browse/bks3.html) (2) Anklicken von „Dewey Number" (3) Eingabe einer DDC-Notation (Beispiel: 004.2); Ergebnis: • 004.169029(1 item) • 004.19(5 items) • 004.2 (41 items) • 004.2014(1 item) • 004.20151 (1 item) • 004.20684 (1 item) • 004.21 (174 items) • 004.2101 (1 item) • 004.21011 (2 items) • 004.2101176(1 item) • 004.210151 (1 item) • 004.21015113(1 item)
68 (4)
3 Hilfsmittel der Wirtschaftsdokumentation Ankreuzen
einer
oder
mehrerer
DDC-Notationen
(Beispiel:
Notation
004.2101176); Ergebnis: AUTHOR: Pukite, Paul TITLE: Modeling for reliability analysis : Markov modeling for reliability, maintainability, safety, and supportability analysis of complex systems / Paul Pukite, Jan Pukite PUBLISHED: New York : IEEE Press, 1998 SUBJECT: Computer engineering SUBJECT: Reliability (Engineering)--Mathematical models OTHER NAME: Pukite, Jan, 1928SERIES: IEEE Press series on engineering of complex computer systems ISBN NUMBER: 0780334825 Quelle: Rechercheprotokoll vom 2.7.1998 (URL: http://lcweb.loc.gov/catalog/browse; stark gekürzt)
Unser zweites Beispiel fuhrt uns zur britischen Nationalbibliographie. Da hier ein fragmentiertes
Suchen möglich ist, wollen wir die Truncierung einer Notation
vorfuhren. Die Hierarchierelation bringt im Information Retrieval einen großen Vorteil. Wenn man Literatur zu einem gewissen Begriff sucht und dabei auch alle Literaturstellen sehen möchte, die zu Unterbegriffen verfaßt worden sind, langt es bei Klassifikationssystemen mit hierarchischer Notation aus, nach der Notation unserer Klasse ein Truncierungszeichen zu setzen. Unsere Beispielsuche (Abbildung 3.4) bewegt sich im Bereich 382 (Foreign trade). Wünschen wir Literatur zum Außenhandel und nicht gleichzeitig zu Unterbegriffen (wie etwa Zölle) bzw. Kombinationen mit Hilfstafeln (wie z.B. Länder), so lautet die Eingabe 382; sie führt zu 160 Treffern. Möchte man die Suche ausweiten auf alle Aspekte des Außenhandels, also nun einschließlich aller Unterbegriffe und Kombinationen, so wird mit einem einzigen Zeichen, dem Fragmentierungszeichen (hier: „$" für „rechts offen") die Anfrage drastisch erweitert. Die Eingabe wird jetzt mit 382$ notiert und ergibt 1806 Katalogisate.
69
3 Hilfsmittel der Wirtschaftsdokumentation
Natürlich kann man seine Suche auch verfeinern. Gesucht sei spezielle Literatur zum Außenhandel Österreichs. An die DDC-Notation 382 wird die Standard subdivision 09 aus Table 1 (09 leitet ein Geographicum ein) sowie 436 aus Table 2 (fur Austria and Liechtenstein) angehängt. Die Recherche nach 382.09436 bringt genau einen Treffer.
Abb. 3.4: DDC-Recherche bei der British National Bibliography Anzahl der Treffer
Suche nach: 382
160
382$
1806 1
382.09436
Suche nach 382.09436; Ergebnis: PUBLICATION YEAR:
1993-
PUBLICATION TYPE:
annual, periodical, text
LANGUAGE:
eng
NAT. BIB. NO.:
b9417086
ISSN:
1352-9943
DEWEY CLASS NO.:
382.09436
TITLE:
Investing, licensing & trading conditions abroad. Austria
PUBL, DISTR, MANUF: London : Economist Intelligence Unit [1993?] Quelle: BNB on CD-ROM (1986-current); gekürzt
70
3 Hilfsmittel der Wirtschaftsdokumentation
NACE Bei der Aufbereitung statistischen Materials der statistischen Ämter der Mitgliedsstaaten machen die Einrichtungen der Europäischen Union von einer „Systematik der Wirtschaftszweige" Gebrauch. Diese „NACE" (Nomenclature général des activités économiques dans les Communautés Européens) liegt derzeit in der Fassung der 1. Revision
von
1990
vor
(vgl.
NACE
1990).
Bei
der
Nutzung
der
Wirtschaftsstatistiken der Europäischen Union ist demnach die Kenntnis der NACE unumgänglich. Da die NACE bei den statistischen Ämtern der Mitgliedsstaaten der EU zunehmend eingesetzt wird, erhält man auch einen thematischen Zugang zu den einzelnen nationalen Wirtschaftsstatistiken. Ziel der Einführung der NACE ist es, „eine gemeinsame statistische Systematik der Wirtschaftszweige in der Europäischen Gemeinschaft aufzustellen, um die Vergleichbarkeit zwischen den nationalen und den gemeinschaftlichen Systematiken und damit zwischen den nationalen und den gemeinschaftlichen Statistiken zu gewährleisten" (NACE 1990, 1).
Die NACE ist eine Grobsystematik von Wirtschaftsbranchen. Sie wird sowohl nach „Abschnitten" (mit einem Buchstabencode) als auch nach „Abteilungen", „Gruppen" und „Klassen" (mit einem numerischen Code) eingeteilt. Unser Beispiel
in
Abbildung 3.5 zeigt einen Ausschnitt aus Abschnitt K. Komplett aufgeführt sind die Abteilungen 72 und 73, 74 ist gekürzt. Der Code 74.14 beispielsweise bezeichnet die Klasse der Unternehmensberatung. Diese ist Teil der Gruppe 74.1 (Rechts-, Steuerund Unternehmensberatung; Markt- und Meinungsforschung, Beteiligungsgesellschaften) und diese ist wiederum Teil der Abteilung 14 (Erbringung von Dienstleistungen für Unternehmen).
Abb. 3.5: Ausschnitt aus der NACE Rev. 1 Abschnitt K. Grundstücks- und Wohnungswesen, Vermietung beweglicher Sachen, Erbringung von Dienstleistungen für Unternehmen
72
Datenverarbeitung und Datenbanken 72.1
Hardwareberatung
72.2
Softwarehäuser
3 Hilfsmittel der Wirtschaftsdokumentation 72.3
Datenverarbeitungsdienste
72.4
Datenbanken
72.5
Instandhaltung und Reparatur von Büromaschinen,
71
Datenverarbeitungsgeräten und -einrichtungen 72.6
Sonstige mit der Datenverarbeitung verbundene Tätigkeiten
73
Forschung und Entwicklung Forschung und Entwicklung im Bereich der Natur-,
73.1
Ingenieur- und Agrarwissenschaften sowie der Medizin 73.2
Forschung und Entwicklung im Bereich der Rechts-, Wirtschafts- und Sozialwissenschaften sowie der Sprach-, Kultur- und Kunstwissenschaften
74
Erbringung von Dienstleistungen fiir Unternehmen 74.1
Rechts-, Steuer- und Unternehmensberatung; Markt- und Meinungsforschung, Beteiligungsgesellschaften 74.11
Rechtsberatung
74.12
Wirtschaftsprüfung und Steuerberatung
74.13
Markt- und Meinungsforschung
74.14
Unternehmensberatung
74.15
Beteiligungsgesellschaften (ohne Kapitalanlagegesellschaften)
74.2 Quelle: NACE 1990, 22 f.
Architektur- und Ingenieurbüros
72
3 Hilfsmittel der Wirtschaftsdokumentation
SIC und Predicasts Product Code Ähnlich wie die NACE ist die (us-amerikanische) Standard Industrial
Classification
(SIC)
vierstelligen
ein
Klassifikationssystem
von
Wirtschaftsbranchen.
Notationen der SIC werden in den Predicasts
Die
Product Codes um maximal drei
weitere Stellen erweitert und bilden damit einen kombinierten Branchen- und Produkt-Code. Diese Wirtschaftsklassifikation findet bei allen Datenbanken eines großen Anbieters für Wirtschaftsinformationen, der Information
Access
Company,
sowie bei diversen weiteren Online-Archiven Anwendung. Unser Beispiel (Abbildung 3.6) zeigt einen thematisch vewandten Ausschnitt wie bei der NACE. Wir betrachten einige Produkte aus der SIC-KIasse 7372 (Computerdienste, Software). Literatur zu Produkten im Bereich Graphik-Software ist unter der Notation 7372205 zu finden. Durch die Rechtsfragmentierung ist es hier möglich, ganze Produktgruppen mit einer Notation zu suchen. Die Mächtigkeit des Predicasts Product Codes ist weitaus größer als bei der NACE; entsprechend sind detailliertere Suchen gestaltbar.
Abb. 3.6: Ausschnitt aus dem Predicasts Product Code 70
DIENSTLEISTUNGSGEWERBE
73
DIENSTLEISTUNGEN, GEWERBLICH
737
COMPUTERDIENSTE & DATENVERARBEITUNGSDIENSTE
7371
Computerdienste, Personal
7372
Computerdienste, Software 7372001
Softwaredienste
7372002
Anwendersoftware
7372003
Software für militärische Zwecke
7372005
Künstliche Intelligenz
3 Hilfsmittel der Wirtschaftsdokumentation 73722
73
Softwarepakete
7372201
Softwarepakete, Finanzen & Buchhaltung
7372202
Softwarepakete, Büro, sonstige Softwarepakete Softwarepakete, Datenbankver-
7372203
waltung 7372204
Softwarepakete, Technik
7372205
Softwarepakete, Graphik
Quelle: Predicasts 1993, PTS Product Codes, 64
Internationale Patentklassifikation (IPK) Patentliteratur erschließt Unternehmen das technische Wissen der Welt. Die Abbildung der Patente in elektronischen Datenbanken dürfte (nahezu) vollständig sein. Ein besonderer Glücksfall dabei ist, daß die gesamte - weltweite - Patentliteratur nach ein und demselbem Hilfsmittel inhaltlich erschlossen ist, nach der Patentklassifikation
Internationalen
(IPK). Der weltweite Einsatz dieses Klassifikationssystems ist
durch das Straßburger Abkommen über die Internationale Patentklassifikation (1971, in Kraft getreten 1975) geregelt. Hieran halten sich sowohl die Patentämter als auch die anderen Informationsproduzenten im Patentbereich. Viele Länder (darunter Deutschland) haben
zugunsten
der Internationalen
Patentklassifikation
eigene
Klassifikationssysteme außer Kraft gesetzt, andere (u.a. die USA) werten zweifach aus, nach eigenen, nationalen Systemen und zusätzlich, allerdings z.T. nicht besonders tief, nach der Internationalen
Patentklassifikation.
Aktualisiert wird die
IPK im Rhythmus von fünf Jahren.
Gegenstandsbereich der Internationalen
Patentklassifikation
ist - grob gesprochen -
alles das, was patentiert werden kann, d.h. die Gesamtheit technischer Sachverhalte. Die IPK wird in acht Sektionen eingeteilt: •
Täglicher Lebensbedarf (Sektion A)
•
Arbeitsverfahren, Transportieren (Sektion B)
74
3 Hilfsmittel der Wirtschaftsdokumentation
•
Chemie, Hüttenwesen (Sektion C)
•
Textilien, Papier (Sektion D)
•
Bauwesen, Erdbohren, Bergbau (Sektion E)
•
Maschinenbau, Beleuchtung, Heizung, Waffen, Sprengen (Sektion F)
•
Physik (Sektion G)
•
Elektrotechnik (Sektion H).
In den acht Sektionen werden über 65.000 technische Begriffe verwaltet, darunter alleine in Sektion B (Arbeitsverfahren, Transportieren) über 16.000 und in Sektion C (Chemie, Hüttenwesen) über 13.000.
Jede Sektion zerfällt in „Klassen" und diese in „Unterklassen". Die Unterklassen enthalten „Hauptgruppen" und diese wiederum „Nebengruppen". Illustrieren wir dies an einem Beispiel! Sektion (Beispiel: H / Elektrotechnik) Klasse (H05 / Elektrotechnik, soweit nicht anderweitig vorgesehen) Unterklasse (H05B / Elektrische Heizung, elektrische Beleuchtung) Hauptgruppe (H05B-3/00 / Widerstandsheizung) Untergruppe (H05B-3/62 / Heizelemente, die in besonderer Weise für Öfen ausgebildet sind). In Abbildung 3.7 zeigen wir die thematische Umgebung unseres Beispiels.
Die IPK verfugt über hierarchisch-sequentielle Notationen. Bis zur Hauptgruppe sind die Notationen strukturabbildend hierarchisch bezeichnet. Bis hierhin sind Fragmentierungen möglich. In jeder Hauptgruppe sind die Symbole „00" für allgemeine Themen der Gruppe reserviert. Die Notationen der Untergruppen sind ungeachtet ihrer hierarchischen Stellung sequentiell verzeichnet. So ist z.B. die Untergruppe H05B-3/66 ein Unterbegriff zu H05B-3/62, was sich jedoch nicht in der Notation niederschlägt. In der Druckversion der IPK sind die Hierarchieebenen innerhalb der
75
3 Hilfsmittel der Wirtschaftsdokumentation
Untergruppen durch Punkte angedeutet. Eine fragmentierte Suche ist nicht möglich, da auch Literatur zu Klassen gefunden würde, die nicht gewünscht ist. Nehmen
wir an, wir suchen
Patente zu Heizelementen
(3/62)
sowie
allen
Unterbegriflfen (also 3/64 und 3/66). Suchen wir fragmentiert nach H05B-3/6..., so erhalten wir neben den gewünschten Treffern zusätzlich Ballast, da auch alles zu 3/60 und 3/68 mit ausgegeben würde. Im Online-Retrieval kann demnach die Suche mittels IPK-Notationen ggf. etwas aufwendig werden, muß man doch (bei den Untergruppen) jede Notation einzeln suchen. Hilfreich sind in ZweifelsfMllen die Verweise bzw. Vorrangregeln, z.B. in der Untergruppe
H05B-3/62
(Heizelemente,
die
in besonderer
Weise
fiir
Öfen
ausgebildet sind) der Verweis auf F27 (Industrieöfen, Schachtöfen, Brennöfen, Retorten).
Abb. 3.7: Ausschnitt aus der Internationalen Patentklassifikation Heizung 1/00
Einzelheiten von elektrischen Heizvorrichtungen
1/02
• Selbstätige Schaltanordnungen, die besonders für elektrische Heizgeräte ausgebildet sind (Temperaturregelung allgemein G05D 23/00; thermisch betätigte Schalter HO 1H 37/00)
3/00
Widerstandsheizung
3/02
• Einzelheiten
3/03
• • Elektroden (elektrothermische Behandlung von Erzen C22b 4/00)
3/04
• • Wasserdichte oder luftdichte Verschlüsse für Heizkörper
3/06
• • Heizelemente, die baulich mit Kupplungselementen oder Halterungen vereinigt sind
3/08
• • • mit elektrischem Anschluß, insbesondere für hohe Temperaturen
... [gekürzt] 3/60
• Heizanordnungen, bei denen der Heizstrom durch körnigen, pulverförmigen oder fluiden Werkstoff fließt, z.B. für Salzbadofen, elektrolytisches Heizen (3/38 hat Vorrang)
76
3 Hilfsmittel der Wirtschaftsdokumentation
3/62
• Heizelemente, die in besonderer Weise für Öfen ausgebildet sind (3/60 hat Vorrang; Anordnungen solcher Elemente in Öfen F27, z.B. F27D 11/00)
3/64
• • unter Verwendung von Heizbändern, Heizstäben oder Heizdrähten
3/66
• • Träger oder Halterungen an oder in der Wand oder Decke für Heizelemente
3/68
• Heizanordnungen, die in besonderer Weise für Kochplatten oder ähnliche Wärmeplatten ausgebildet sind
Quelle: IPK 1994, Sektion H; gekürzt
3.3 Thesaurus DIN-Norm zur Thesauruserstellung Die Dokumentationsmethode des Thesaurus ist das derzeit vorherrschende Verfahren bei der Produktion und der Abfrage von Literaturnachweisdatenbanken (vgl. Wersig 1985). Thesauri sind überall dort einsetzbar, wo fachliches Wissen eines bestimmten, fest abgegrenzten Gebietes durch ein Begriffssystem repräsentiert werden soll. Einsatzgebiet
ist
neben
der
Inhaltserschließung
von
Fachliteratur
auch
die
thematische Strukturierung eines Data Warehouse. Weltweit existieren weit über 1.000 Thesauri.
Die Norm DIN 1463/1 definiert „Thesaurus" als „eine geordnete Zusammenstellung von Begriffen und ihren (vorwiegend natürlichsprachigen) Bezeichnungen, die in einem Dokumentationsgebiet zum Indexieren, Speichern und Wiederauffinden dient" (DIN 1463/1, 2). Hier ist bereits der große Unterschied zu Klassifikationssystemen angesprochen.
Statt der (schwer merkbaren) Notationen verwenden
Thesauri
Bezeichnungen, die einer natürlichen Sprache oder einer Fachsprache entnommen sind. Im Gegensatz zu den Kunstsprachen der Klassifikationen wird hier mit nationalen Sprachen gearbeitet. Ein Thesaurus (abgeleitet von griechisch „Schatz") ist ein Wortschatz, der durch zwei Merkmale gekennzeichnet ist: •
terminologische Kontrolle und
•
Relationen zwischen den Begriffen.
77
3 Hilfsmittel der Wirtschaftsdokumentation
„Terminologische Kontrolle" bedeutet, daß Begriffe und deren Bezeichnungen eindeutig aufeinander bezogen werden. Synonyme (und Quasi-Synonyme) werden zu einer Klasse zusammengefaßt. Eines der Synonyme, das gebräuchlichste, wird als sogenannter „Deskriptor" ausgezeichnet, alle anderen werden als „Nicht-Deskriptoren" auf den
Deskriptor bezogen. Die beiden
„Eheschließung"
sind
synonym.
Wenn
wir
Bezeichnungen annehmen,
daß
„Heirat" und „Heirat"
die
gebräuchlichere Benennung ist, so wird diese der Deskriptor, „Eheschließung" wird Nichtdeskriptor. Die Äquivalenzrelation wird in Thesauri durch die Abkürzungen „BS" (benutze synonym; Richtung: Nicht-Deskriptor - Deskriptor) und „ B F ' (benutzt für; Richtung: Deskriptor - Nicht-Deskriptor) ausgedrückt. Unser Beispiel führt demnach zu den beiden Einträgen:
Eheschließung BS Heirat
und
Heirat BF Eheschließung.
Informationssysteme, die unseren Beispielthesaurus einsetzen, arbeiten ausschließlich mit
dem
Deskriptor
„Heirat".
Obwohl
im
Thesaurus
als
Nicht-Deskriptor
verzeichnet, darf „Eheschließung" nicht zur Inhaltsabbildung herangezogen werden. Je nach eingesetzter Software muß die Äquivalenzrelation entweder vom Benutzer intellektuell berücksichtigt werden oder das System verwaltet die Relationen. Im ersten Fall fuhrt eine Suche, die - ggf. in Unkenntnis eines Thesaurus formuliert - mit einem Nicht-Deskriptor arbeitet, zwangsläufig zu einer Null-Treffer-Recherche, obwohl zum entsprechenden Deskriptor diverse Datensätze vorhanden wären.
Terminologische Kontrolle bedeutet weiterhin, daß Homonyme besonders gekennzeichnet werden. Nehmen wir an, daß in unserem Thesaurus die Bezeichnung
78
3 Hilfsmittel der Wirtschaftsdokumentation
„Kiefer" vorkommt, und zwar sowohl als Baum als auch als Teil des Kopfes. Thesauri arbeiten hier mit Homonymzusätzen, die so aussehen können:
Kiefer (Knochen) Kiefer (Nadelbaum).
Deskriptor ist die gesamte Bezeichnung, also mit dem Homonymzusatz, und muß auch so gesucht werden. Thesaurusrelationen aufgegliedert
umfassen
nach
die
Hierarchierelation
Abstraktions-
und
(je
nach
Bestandsrelation)
Thesaurus sowie
die
Assoziationsrelation. Normgemäße Abkürzungen für Relationen sind •
O B (übergeordneter Begriff)
•
UB (untergeordneter Begriff)
•
OA (Oberbegriff Abstraktionsrelation)
•
UA (Unterbegriff Abstraktionsrelation)
•
SP (Verbandsbegriff Bestandsrelation)
•
T P (Teilbegriff Bestandsrelation)
•
V B (verwandter Begriff Assoziationsrelation).
In Thesauri sind Fragmentierungen wie bei den Notationen der Klassifikationssysteme nicht möglich. Sind die Relationen nicht datentechnisch einsetzbar, so müssen bei einer Suche nach einem Begriff samt seiner Unterbegriffe alle Unterbegriffe nachgeschlagen und ins System eingegeben werden. Diese „Lösung" ist
ausgesprochen
unbefriedigend.
Datenbankproduzenten Relationen
lassen
(Es
gibt
jedoch
durchaus
und -anbieter, die dermaßen suboptimal arbeiten.)
sich
erst
durch
geeignete
hierarchische
und
noch Die
assoziative
Retrievalbefehle gut ausnutzen. Voraussetzung sind Abfragebefehle der Art •
„Suche nach einem Deskriptor samt der Unterbegriffe der nächsten Ebene"
•
„Suche nach einem Deskriptor samt der Unterbegriffe der nächsten zwei Ebenen"
•
„Suche nach einem Deskriptor samt aller Unterbegriffe"
79
3 Hilfsmittel der Wirtschaftsdokumentation •
„Suche nach einem Deskriptor samt der Oberbegriffe der nächsten Ebene"
•
„Suche nach einem Deskriptor samt aller verwandter Begriffe".
Verdeutlichen wir dies an einem Beispiel! Wir suchen Literatur zum Thema „Marketing bei Dienstleistern". Uns interessiert nicht nur die allgemeine Literatur, sondern auch Schriften zu Spezialaspekten, also zu Unterbegriffen zum Marketing sowie zu Unterbegriffen von Dienstleistern. Treffer sollte also auch z.B. eine Literaturstelle
zur
Kommunikationspolitik
(Unterbegriff zu
„Marketing")
bei
Untemehmensberatern (Unterbegriff zu „Dienstleister") sein. Bildlich können wir das geforderte Retrieval in Anlehnung an Winfried Gödert
und Klaus Lepsky
so
skizzieren:
(vgl. Gödert/Lepsky 1997, 16). Bei einer intellektuellen Recherche müßte man alle Unterbegriflfe mühsam aufsuchen und eintippen. Ein automatisches hierarchisches Retrieval erfordert demgegenüber nur das Angeben des entsprechenden Suchbefehls. Eine Besonderheit mancher Thesauri sind Verweisungen im Bereich von Begriffskombinationen.
Wenn zwei Begriffe bereits als Deskriptoren
im
Thesaurus
vorhanden sind, etwa „Schiffahrtsstatistik" und „Binnenschiffahrt", und der Begriff „Binnenschiffahrtsstatistik"
ebenso
nötig
erscheint,
so
kann
anstelle
des
zusammengesetzten Begriffs eine Kombinationsverweisung angelegt werden. Die Abkürzungen lauten BK (benutze Kombination) und KB (benutzt in Kombination). Wie bei der Synonymie gibt es auch hier sowohl eine intellektuelle und eine elektronische Variante, wobei letztere vorzuziehen ist. Die Bezeichnungen im Thesaurus haben folgendes Aussehen:
Binnenschiffahrtsstatistik BK Schiffahrtsstatistik + Binnenschiffahrt
80
3 Hilfsmittel der Wirtschaftsdokumentation Binnenschiffahrt KB Binnenschififahrtsstatistik Schiffahrtsstatistik KB Binnenschiffahrtsstatistik.
Wie wird ein Thesaurus aufgebaut? Vorangestellt sei ein warnender Hinweis: Eine solche Arbeit erfordert in der Regel enormen Aufwand, der kaum überschätzt werden kann. Wenn irgend möglich, sollte ein vorhandener Thesaurus (oder eine andere Dokumentationssprache) adaptiert werden. Muß man jedoch bei Null anfangen, so liegt der erste Schritt in der Sammlung der Fachbegriffe. Quellen können sein: •
Terminologie der Fachliteratur
•
Fachleute
•
potentielle Benutzer.
Hierzu sind umfangreiche (sprach-)empirische Erhebungen nötig. Die Menge der infragekommenden Bezeichnungen kann je nach Fachgebiet durchaus mehrere tausend bis mehrere zehntausend Terme umfassen. Der zweite Schritt ist das Zusammenfassen synonymer Bezeichnungen mit der Auszeichnung vorläufiger Vorzugsbenennungen, also der Deskriptoren.
Im dritten Schritt wird jeder der
Deskriptor-Kandidaten einzeln überprüft und bewertet, ob er für den Thesaurus notwenig ist. Auswahlkriterien sind: •
die relative Häufigkeit in der Literatur
•
das erwartete Vorkommen in Abfragen, Analysen, Management Information Systemen oder Data Mining-Aspekten
•
Art der Verwandtschaft zu bereits akzeptierten Deskriptoren
•
Eignung und Authentizität gemäß der neuesten Terminologie des Fachgebiets
•
Zweckmäßigkeit für die Erfassung von Sinn und Bedeutung des Begriffs (vgl. DIN 1463/1, 10).
Für jeden Deskriptor ist ein Datensatz anzulegen, der folgende Angaben enthält: •
Deskriptor
81
3 Hilfsmittel der Wirtschaftsdokumentation •
alle Nicht-Deskriptoren
•
Oberbegriffe der nächsten Hierarchieebene
•
Unterbegriffe der nächsten Hierarchieebene
•
alle verwandten Begriffen
•
ggf. kurze Erläuterung, Definition oder Übersetzungen.
Natürlich muß ein Thesaurus in sich stimmig sein. Ist ein Deskriptor X Unterbegriff zu Y, so muß Y Oberbegriff zu X sein. Sind zwei Deskriptoren als verwandt ausgezeichnet, so ist dies bei beiden Datensätzen zu vermerken. Beispiele für Datensätze werden im Abschnitt über den Standard-Thesaurus
Wirtschaft nachgeliefert.
Ein Thesaurus „lebt" gemeinsam mit den Systemen, für die er eingesetzt wird. Eine kontinuierliche Thesaurusweiterentwicklung ist demnach unumgänglich. Drei Aspekte sind zu berücksichtigen: •
Eliminierung von Deskriptoren
•
Differenzierung von Deskriptoren
•
Aufnahme neuer Deskriptoren (vgl. DIN 1463/1, 10).
Deskriptoren, die nicht oder kaum benutzt werden, blähen den Thesaurus nur unnötig auf und sollten gelöscht werden. Alle ihre Relationen sind mit zu eliminieren. Wird ein Deskriptor einer sehr großen Zahl von Datensätzen zugeordnet, so muß analysiert werden, ob dies am Umfang der Datensätze liegt oder ob der Deskriptor zu allgemein gehalten war. Im letzteren Fall sollten spezifischere Unterbegriffe dem Thesaurus zugefügt werden. Werden neue Sachverhalte, die im Thesaurus bisher noch gar nicht berücksichtigt waren, in das Informationssystem aufgenommen, so sind entsprechend neue Deskriptoren nebst aller zugehörigen Relationen zu kreieren. Änderungen im Detail sind dabei recht unproblematisch, große Änderungen, insbesondere solche, die in Hierarchien eingreifen und diese neu formulieren, sind aufwendig und werden in der Regel nur selten durchgeführt.
Indexierung Indexierung meint die Abbildung relevanter Informationsinhalte eines Datensatzes (z.B. einer wissenschaftlichen Publikation, einer statistischen Zeitreihe, einer Menge betriebswirtschaftlicher Kennzahlen oder der Daten eines Data Warehouse) auf
82
3 Hilfsmittel der Wirtschaftsdokumentation
Deskriptoren (wenn ein Thesaurus eingesetzt wird), Notationen (falls mit einem Klassifikationssystem gearbeitet wird) oder andere Terme mit dem Zweck, den Datensatz thematisch suchbar zu machen. Die „Kunst" des Indexierens besteht darin, die relevanten Informationsinhalte herauszufiltern sowie durch die bestpassenden Deskriptoren, Notationen o.ä. auszudrücken. Die Indexierung geschieht entweder intellektuell durch den Einsatz von „Indexern" oder im Rahmen einer automatischen Indexierung. Aspekte der Indexierung sind •
Indexierungsbreite
•
Indexierungsspezifität
•
Indexierungstiefe
•
Indexierungskonsistenz.
Die
„Indexierungsbreite"
gibt
bezogen
auf
den
Informationsinhalt
der
auszuwertenden Vorlage den Grad der Erschließung an. Kriterium ist die Anzahl der vergebenen Deskriptoren bzw. Notationen. Die „Spezifität" der Indexierung zielt auf die Trennschärfe der vergebenen Indexterme ab. Hier gilt es, zwei Aspekte zu unterscheiden. Einmal geht es um das hierarchische Niveau der Deskriptoren und Notationen. Je höher ein Term in einer Begriffsleiter steht, desto niedriger ist seine Spezifität. Zum andern geht es um die Anzahl der Datensätze, denen der betreffende Term zugeordnet ist. Je häufiger ein Term bereits vergeben worden ist, umso weniger trennscharf ist er. „Indexierungstiefe" ist die Kombination von Indexierungsbreite und -Spezifität und gibt die Genauigkeit der Abbildung des Informationsinhalts der Vorlage durch das Indexierungsergebnis an. „Dies bedeutet, daß im konkreten Fall von zwei Indexierungsergebnissen des gleichen Dokuments mit gleicher Anzahl von Deskriptoren
oder
Notationen
dasjenige
tiefer ist, das
die
spezifischeren
Bezeichnungen enthält" (DIN 31623/1, 4). Die Indexierungstiefe erreicht bei einem gewissen Schwellenwert ihr Optimum. Zu wenige oder zu unspezifische Indexterme sind
genauso
suboptimal
wie
zu
viele
Terme.
Einmal
sind
wir
mit
Informationsverlust konfrontiert, das andere Mal mit Informationsballast. Als Qualitätskriterium für „gute" Inhaltserschließung" gilt es, die Indexierungstiefe einer Datenbank in der Nähe des Optimums zu plazieren. Die „Indexierungskonsistenz" ist der Grad der Übereinstimmung verschiedener Indexierungsergebnisse für ein und dieselbe Vorlage. Meßbar ist die Indexierungskonsistenz durch den Anteil gemeinsam vergebener Deskriptoren oder Notationen an der
3 Hilfsmittel der Wirtschaftsdokumentation Gesamtzahl
aller
vergebener
Indexterme.
83 Man
unterscheidet
Inter-lndexer-
Konsistenz (Vergleich der Ergebnisse unterschiedlicher Indexer) und Intra-IndexerKonsistenz (Vergleich der Ergebnisse desselben Indexers zu selber Vorlage zu unterschiedlichen Zeiten). Es ist ein Qualitätskriterium der Indexierung, möglichst hohe Konsistenzraten zu garantieren. Nur wenn beide Qualitätskriterien der Indexierung, also Indexierungstiefe und Indexierungskonsistenz, erfüllt sind, ist ein sicheres Wiederfinden von Informationen in Informationssystemen möglich. Dies gilt sowohl für die betrieblichen Informationssysteme der Unternehmen und Verwaltungen als auch für die Anbieter externer Informationen innerhalb der Wertschöpfungskette der Informationswirtschaft.
Wir unterscheiden zwei Ansätze der Indexierung: gleichordnende und syntaktische Indexierung. Bei der gleichordnenden Indexierung haben alle Deskriptoren bzw. Notationen die gleiche Stellung im Datensatz. Suche ich nach zwei Termen im Rahmen einer Und-Verknüpfung (Schnittmenge) und sind die beiden Terme in einem Datensatz vorhanden, so wird dieser als Treffer ausgegeben. Die gleichordnende Indexierung ist nicht immer sinnvoll. Stellen wir uns im Bereich der Literaturinformation folgende Situation vor: Ein Artikel handelt am Anfang über Thema A, bespricht dann A im Blickwinkel zu B und kommt in einem Exkurs am Ende auf C zu sprechen, wobei wir unterstellen, daß A und C in überhaupt keinem Zusammenhang stehen. Die gleichordnende Indexierung würde unserem Text jedoch
A;B;C
zuordnen. Eine Suche nach A und C gibt den Text als Treffer aus, und dies wäre nach unseren Voraussetzungen ein Fehler. Lösbar ist das Problem durch syntaktische Indexierung. „Syntaktisches Indexieren soll das Rechercheergebnis stärker als das gleichordnende Indexieren einengen (Präzisieren, Vermindern von Ballast)" (DIN 31623/3, 1). Hierbei wird die Stellung der einzelnen Deskriptoren im Datensatz mit Mitteln der Syntax kenntlich gemacht. Insbesondere bei sehr großen Informationsmengen muß syntaktisches Indexieren eingesetzt werden. Es gibt mehrere Methoden des syntaktischen Indexierens (vgl. DIN 31623/3), von denen hier die Bildung von Teilmengen beschrieben werden soll. Enger zusammenhängende Deskriptoren bilden
84
3 Hilfsmittel der Wirtschaftsdokumentation
dabei die Teilmengen. In unserem obigen Beispiel stehen A und B zusammen, C alleine. Die syntaktische Indexierung dieses Beispiels bringt zwei Teilmengen:
Teilmenge 1: A ; B Teilmenge 2: C.
Mit einem modifizierten Und-Operator, der die Teilmengen berücksichtigt (in einigen Systemen erfüllt der Abstandsoperator „und.p" diese Funktion), wird eine Suche nach A und.p B zu einem Treffer fuhren, eine Suche nach A und.p C jedoch nicht.
Der Standard-Thesaurus
Wirtschaft
Der Standard-Thesaurus
Wirtschaft (STW 1998) ist das Indexierungshilfsmittel
deutschsprachiger wirtschaftswissenschaftlicher Datenbanken (vgl. Stock,M. 1999). Hervorgegangen u.a. aus dem Thesaurus Wirtschaft des HWWA-Hamburgisches Welt-Wirtschafts-Archiv (vgl. Gastmeyer
1994), ist der
Standard-Thesaurus
Wirtschaft ein Ergebnis der Kooperation der drei großen deutschen Wirtschaftsforschungsinstitute bzw. -informationszentren in Hamburg (HWWA), Kiel (Institut für Weltwirtschaft mit der Deutschen Zentralbibliothek für Wirtschaftswissenschaften) sowie
München
(ifo Institut
für Wirtschaftsforschung) und
dem
Informationsanbieter GBl (Gesellschaft fiir Betriebswirtschaftliche Information). Er findet Einsatz bei allen Datenbanken, die von den Projektpartnern erstellt werden. Wir wollen am Beispiel des Standard-Thesaurus Wirtschaft die Ausfuhrungen zum Thesaurus erläutern. In Abbildung 3.8 sind zwei Beispiele für Deskriptorsätze verzeichnet. Eine uns noch unbekannte Abkürzung liegt bei „F" vor. Der STW ordnet in seinem systematischen Teil die Deskriptoren in Feldern an, wobei die Felder klassifikatorisch eingerichtet sind. „F" steht für die Notation des Feldes. Unser Deskriptor „Marketinginformationssystem" ist in den Feldern B.07 (B: Betriebswirtschaft; B.07: Marketing) und B.09.03 (B.09: Wirtschaftsinformatik; B.09.03: Betriebliche Anwendungssysteme) eingeordnet. „Marketinginformationssystem" hat als Unterbegriff „CAS"; entsprechend finden wir im Deskriptorsatz für „CAS" den Term „Marketinginformationssystem" als Oberbegriff. Nicht-Deskriptorsätze sind kurz, sie verweisen auf die entsprechende Vorzugsbenennung (siehe Abbildung 3.9).
85
3 Hilfsmittel der Wirtschaftsdokumentation Abb. 3.8: Beispiele fur Deskriptorsätze des Standard-Thesaurus
Wirtschaft
Marketinginformationssystem BF
Absatz-Informationssystem; Database-Marketing; Kundendatenbank; Kundeninformationssystem; MIAS (Marketing-Informations- und Analysesystem); Vertriebs-Informationssystem; VIS (Vertriebs-Informationssystem)
F
B.07; B.09.03
OB
Betriebliches Informationssystem; Marketing
UB
CAS; Elektronisches Buchungssystem
CAS E
Computergestützte Akquisitions- und Verkaufsmethoden; auch für Computereinsatz im Außendienst
BF
AUDIUS; Außendienstunterstützungssystem; Computer-Aided-Selling
F
B.06.03; B.09.03
OB
Marketinginformationssystem
VB
Außendienst
Quelle: STW 1998, Bd. 2, Teil 2, 112 u. 113
86 Abb.
3 Hilfsmittel der Wirtschaftsdokumentation 3.9:
Beispiele
für
Nicht-Deskriptorsätze
des
Standard-Thesaurus
Wirtschaft A ußendienstunterstützungssystem BS
CAS
Vertriebs-Informationssystem BS
Marketinginformationssystem
Quelle: STW 1998, Bd. 1, 36 u. 517
Ein besonderer Verdienst des STW sind seine Konkordanzen. Neben einer Konkordanz im geographischen Bereich (Länderdeskriptoren und Notationen der sog. Predicasts Country Codes) liegt eine Konkordanz der Deskriptoren für Wirtschaftszweige mit den Notationen der NACE vor. Abbildung 3.10 zeigt Beispiele für die STW-NACE-Konkordanz und fuhrt dabei unser Beispiel aus Abbildung 3.5 weiter.
Abb. 3.10: Beispiele für die NACE-Konkordanz des Standard-Thesaurus Wirtschaft 72
Datenverarbeitung und Datenbanken
Datenverarbeitung Datenverarbeitungswirtschaft EDV-Dienstleistung Softwareindustrie
72.1
Hardwareberatung
EDV-Dienstleistung
72.2
Softwarehäuser
Programmierung Softwareindustrie
3 Hilfsmittel der Wirtschaftsdokumentation
87
EDV-Dienstleistung H
Dienstleistungen, die vor allem im Zusammenhang mit dem Betreiben von EDV-Anlagen, dem Erfassen von Daten und der Beratung im EDV-Bereich erbracht werden
BF
COM-Dienst... [gekürzt]
NAC
72; 72.1
F
W.19
OB
Datenverarbeitungswirtschaft; Dienstleistung
UB
Rechenzentrum
VB
I nformationsmanagement
Quelle: STW 1998, Bd. 1, 112; Bd. 2, Teil 5, 77
Die gegenseitigen Abbildungen verlaufen nicht eindeutig. Der NACE-Notation 72 (Datenverarbeitung und Datenbanken) werden beispielsweise die vier STW-Deskriptoren „Datenverarbeitung", „Datenverarbeitungswirtschaft", „EDV-Dienstleistung" und „Sofhvareindustrie" zugeordnet. Der NACE-Klasse 72.1 (Hardwareberatung), Unterbegrifif zu 72, wird der Deskriptor „EDV-Dienstleistung" zugeteilt, der aber auch schon mit dem Oberbegriff 72 korrespondierte. Im STW-Deskriptorsatz „EDVDienstleistung" sind beide NACE-Notationen angegeben, einer der Oberbegriffe ist „Datenverarbeitungswirtschaft", der wiederum zu 72 zugeordnet ist. Die Nicht-Eindeutigkeit betrifft demnach auch die Hierarchien. Dies ist nun nicht etwa ein Fehler des STW oder der NACE, sondern zeigt ausschließlich unterschiedliche Sichten auf ähnliche Sachverhalte, einmal aus der Warte der Wirtschaftsstatistik (NACE), zum andern aus der Warte der wirtschaftswissenschaftlichen Literaturdokumentation (STW). Vorteil einer Konkordanz ist es, Zahlen, etwa aus Zeitreihen, und Literatur zum gleichen Sachverhalt bequem gemeinsam abzufragen.
88
3 Hilfsmittel der Wirtschaftsdokumentation
Die Datenbanken, die mittels des Standard-Thesaurus Wirtschaft inhaltlich erschlossen werden, sind z.T. recht groß. Allein die auf der CD-ROM WISO II (vgl. Stock/ Striefler/Thomsen 1994) zusammengefaßten Literaturhinweise umfassen derzeit rund eine Million Publikationen. So ist es nur folgerichtig, daß - soweit nötig - vom Instrument der syntaktischen Indexierung Gebrauch gemacht wird. Es ist wahrscheinlich müßig, daraufhinzuweisen, daß Literaturdatenbanken, die mit dem Standard-Thesaurus
Wirtschaft arbeiten, nur unter der Voraussetzung optimal
abgefragt werden können, daß dem Fragesteller dieser Thesaurus auch bekannt ist. Weiterhin ist der STW für betriebliche Anwendungen nützlich, läßt sich doch die dort
aufbereitete Terminologie ftir eigene Zwecke, etwa der
thematischen
Strukturierung eines Data Warehouse, adaptieren.
Fazit •
Informationssysteme bedürfen der Ordnung. Dies gilt für betriebliche Anwendungen genauso wie für kommerzielle Aktivitäten der Informationswirtschaft. Werkzeuge der inhaltlichen Ordnung wirtschaftlicher Aspekte sind Klassifikationssysteme und Thesauri.
•
Grundlage für Ordnungen sind Begriffssysteme. Begriffe und deren Benennungen werden durch hierarchische und assoziative Relationen in ein System gebracht.
•
Klassifikationen sind Begriffssysteme, die - monohierarchisch geordnet - durch ihre Notationen einen Zugang schaffen, der von natürlichen Sprachen unabhängig ist und demnach einer internationalen Kommunikation dienen. Ein wichtiges bibliothekarisches Klassifikationssystem ist die Dewey Decimal
Classification,
nach der Teile der Bestände der weltgrößten Bibliotheken (darunter die Library of Congress und die British Library) inhaltlich erschlossen sind. •
Ausgesprochene Wirtschaftsklassifikation sind die NACE (zur Strukturierung von Wirtschaftsstatistiken) sowie die Predicasts Product Codes (zur inhaltlichen Abfrage von Informationen zu Produkten und Branchen.
•
Im Wirtschaftsbereich Relevanz hat zudem die Internationale
Patentklassifika-
tion, nach der - weltweit - alle Patentschriften inhaltlich erschlossen sind.
3 Hilfsmittel der Wirtschaftsdokumentation •
89
Ein Thesaurus ist ein Begriffssystem, das - in der Regel polyhierarchisch ausgelegt - für ein abgegrenztes fachliches Begriffssystem einen natürlichsprachigen Zugang bietet. Der Einsatz von Thesauri erfordert für bestimmte Suchfunktionen (etwa das hierarchische und das assoziative Retrieval) den Einsatz spezieller Software.
•
Der Neuaufbau eines Thesaurus ist ein aufwendiges sprachempirisches und systematisches
Projekt, das eine Terminologie
für vorgegebene
Zwecke
aufbereitet. •
Die Inhaltsabbildung einer Vorlage auf einen Datensatz (Indexierung) erfordert die Einhaltung zweier Qualitätskriterien, Indexierungstiefe und Indexierungskonsistenz.
•
Für die deutschsprachige Terminologie der Wirtschaftswissenschaft und -praxis liegt im Standard-Thesaurus Wirtschaft eine gut ausgebaute Begriffsordnung vor.
4 Retrieval von elektronischen Informationen: Techniken und Strategien
In diesem und den beiden nächsten Kapiteln geht es in mehrfacher Hinsicht um das „Nadel-im-Heuhaufen"-Syndrom. Wie finde ich zielgenau aus mehreren tausend kommerziellen Datenbanken mit ihren rund zehn Millarden Datensätzen sowie den in ebenfalls nach Millionen zählenden Internetquellen diejenige Information, die fiir mich handlungsrelevantes Wissen darstellt? Viele Informationsanbieter verfolgen parallel zwei Zugangswege zu ihren meist riesigen Wissensbeständen. Ein einfacher Weg spricht die „Endnutzer" direkt an. „Anklickbare" Buttoms, leichte Navigation und nachvollziehbare Antworten zeichnen diese Zugangsart aus. Es bleibt aber durchaus offen, ob auch alles gefunden wird, was im Sinne der Suchfrage Relevanz hat. Der zweite Weg läuft über den Information Professional. Erst dieser Weg erschließt (derzeit) die Vielfalt der Suchtechniken und -Strategien. Er ist jedoch ausgesprochen
voraussetzungsvoll.
Es
müssen
nicht
nur
die
Arten
Retrievalbefehle bekannt sein, sondern auch die konkreten Ausprägungen
der
bei den
Datenbankanbietern, die zu allem Überfluß sehr erfindungsreich jeweils anders benannt sind. Im Folgenden beschreiben wir die theoretischen Voraussetzungen und Arten der Retrievalbefehle für beide Wege, denn ein Informationswirt - davon sind wir überzeugt - muß den Überblick über alle Techniken und Strategien haben.
4.1 Suchen und Finden von Datenbanken Wir beginnen mit dem „Nadel-im-Heuhaufen"-Syndrom, Phase 1, dem Finden der relevanten kommerziellen Online- und CD-ROM-Datenbanken. Auf die Internetquellen kommen wir weiter unten zu sprechen. Nach der Art der abrufbaren Informationen können wir unterschiedliche Typen von Datenbanken ausmachen: •
bibliographische Datenbanken
•
Volltextdatenbanken
•
Faktendatenbanken
•
statistische Datenbanken.
4 Retrieval von elektronischen Informationen
91
Bibliographische Datenbanken weisen ausschließlich das Vorhandensein von Literaturstellen nach. Wenn wir das Ausgangsmaterial dieser Datenbanken, also den wissenschaftlichen Artikel, das Buch usw. als „dokumentarische Bezugseinheit" bezeichnen und das, was letztlich in der Datenbank steht, als „Dokumentationseinheit", dann werden in der Dokumentationseinheit die formalen bibliographischen Aspekte dergestalt beschrieben, daß die dokumentarische Bezugseinheit aufgefunden werden kann. Hinzu kommen inhaltsabbildende Momente, etwa Deskriptoren eines Thesaurus, Notationen eines Klassifikationssystems sowie in den meisten Fällen ein Abstract. Insbesondere die professionelle inhaltliche Beschreibung der wesentlichen Informationsinhalte der dokumentarischen Bezugseinheiten läßt eine zielgenaue thematische Suche zu. Nachteil dieser Datenbanken ist der Medienbruch im Anschluß an die Recherche, insofern der Volltext in einem zweiten Arbeitsschritt besorgt werden muß. Volltextdatenbanken bringen in der Dokumentationseinheit den gesamten Text der dokumentarischen Bezugseinheit. Tageszeitungen, Gesetzestexte, Grundsatzurteile, Patente, Artikel wissenschaftlicher Zeitschriften usw. sind so Wort für Wort abfragbar und als Ganzes abrufbereit. Volltexte können indexiert, d.h. wie die bibliographischen Auffinden
enorm.
Nachweise In
inhaltlich
vielen
Fällen
erschlossen findet
sein.
jedoch
Dies erleichert keine
ihr
intellektuelle
Inhaltserschließung statt, so daß wir hier entweder auf besondere, am Volltext orientierte
Retrievalbefehle
oder
auf
die
Möglichkeiten
der
automatischen
Indexierung angewiesen sind. Faktendatenbanken lassen sich am besten mit Nachschlagewerken bzw. Handbüchern vergleichen. Hier wird nicht die Literatur zu einem Sachverhalt nachgewiesen, sondern das Faktum selbst. Die Bandbreite der Faktendatenbanken ist sehr groß und reicht von Unternehmensbeschreibungen über Bilanzen, biographische Informationen, Daten über Werkstoffe bis hin zu den Strukturformeln der organischen Chemie. Statistische Datenbanken sind Faktendatenbanken, die - in der Regel - Zeitreihen enthalten. Hauptunterschied zu den anderen Faktendatenbanken ist die Möglichkeit zu ökonometrischen Berechnungen.
Datenbankführer Einen guten Überblick über (nahezu) alle elektronischen Datenbanken verschaffen die Führer von Gale. In kurzen Abständen aktualisiert, beschreiben sie Online-
92
4 Retrieval von elektronischen Informationen
Datenbanken sowie elektronische Offline-Datenbanken, u.a. CD-ROM (vgl. Gale/1 u. 2).
Abb. 4.1: Ausschnitt aus dem Gale Directory of Databases • 2707 • ifo Osteuropadokumentation ifo Institut fiier Wirtschaftsforschung Informationszentrum Poschingerstr. 5 D-81679 Munich, Germany Alternative Database Name: Economy and Business in Eastern Europe. Type: Bibliographic. Content: Contains more than 6500 citations to newspaper and journal articles, books, and book chapters dealing with the national economy of Eastern European countries and states. Subject Coverage: National economy of Eastern European countries and states. Language: German. Geographic Coverage: Commonwealth of Independent States (CIS) (with emphasis on Russia and Kazachstan), Baltic States, Poland, Czech Republic, Slovak Republic, Hungary, former Yugoslavia and Albania. Year First Available: 1993. Time Span: 1990 to date. Updating: Weekly. Online Availability: GEN/OS
Wirtschaftsdatenbanken
(IFOL: DM 4.50 / connect
minute, DM 3.50 / full record online). Gesellschaft für Betriebswirtschaftliche
Information mbH (GBl) (IFOOST: DM 2.50
/ connect minute; DM 3 / full record online). Alternative Electronic Formats: CD-ROM. Quelle: Gale/1 (Stand: 1996; gekürzt)
4 Retrieval von elektronischen Informationen
93
Der Ga/e-Datenbankfiihrer, der natürlich auch in elektronischen Versionen vorliegt, sammelt einige formale Angaben zu den Datenbanken, u.a. Sprache und Preis, sowie knappe Inhaltsangaben (siehe Abbildung 4.1). Man erhält - als ersten Einstieg folgende Informationen: •
Datenbanken
•
Datenbankproduzenten
•
Datenbankanbieter
•
Länderindex der Datenbankproduzenten und -anbieter
•
Themen der Datenbanken (in sehr grober Gliederung)
•
Produktnamen der Datenbanken.
In fachlicher Hinsicht in Wirtschafts- und Technikdatenbanken zweigeteilt ist der deutsche Datenbankführer „Welt der Online-Datenbanken" von Scientific Consulting (vgl. W.O.D. 1998a /b).
Hostspezifische Datenbankindices Eine notwendige Ergänzung zu den eher grob strukturierten allgemeinen Datenbankführern sind die elektronischen
Indices der Online-Datenbankanbieter.
Diese
beziehen sich natürlich nur auf die Datenbankangebote eines Hosts, dafür sind alle Terme jeweils aller Datenbanken abfragbar, die ein Datenbankanbieter in seinem Informationssystem vereinigt. Und dies können durchaus mehrere hundert Datenbanken sein. Neben der Option, alle Datenbankindices zu durchforschen, ist es auch möglich, nur definierte Datenbankgruppen, etwa Wirtschaftsdatenbanken, zu konsultieren. Wenn man sich über seine Suchargumente zumindest grob im Klaren ist, läßt man im Gesamtindex des Datenbankanbieters oder in der gewählten Datenbankgruppe alle Datensätze durchsuchen. Resultat ist eine Liste der Datenbanken, die man nach der Auftretenshäufigkeit unseres Sucharguments sortieren lassen kann. Anhand der so entstehenden „Hitparade" entscheidet man, mit welchen konkreten Datenbanken weitergearbeitet werden soll. Bei der Formulierung der Suchargumente ist Vorsicht geboten. Wir können hier nicht von genau einem Vokabular ausgehen, z.B. einem Thesaurus, und auch nicht von genau einer natürlichen Sprache, insofern Hosts Datenbanken mit unterschiedlichen
94
4 Retrieval von elektronischen Informationen
Dokumentationsmethoden und in unterschiedlichen Sprachen nebeneinander aufliegen haben. Abbildung 4.2 zeigt beispielhaft eine Suche nach Datenbanken, die über Mulitmediaunternehmen in Berlin und Potsdam Datensätze angelegt haben. Der Befehl, der die Indexsuche hier einleitet, lautet „cros". Die ergiebigsten Datenbanken sind demnach EcoRegister
(mit
95
Datensätzen
aus einer
Gesamtmenge
von
Creditreform und Hoppenstedt.
Abb. 4.2: Suche nach Datenbanken in einem hostspezifischen Index (1) Eingabe: cros (2) Ergebnis: 1
Ali
2
Business & Market Research
3
Companies
4
News
(3) Eingabe: 3 (4) Ergebnis: 30
All Companies
31
Company Directories
32
Company Financial Data
33
Mergers & Acquisitions
34
Company/Market/Industry News
(5) Eingabe: 31 (6) Ergebnis: 3100
Company Directories
3101
All Europe
3102
Austria
3,3
Mio.),
4 Retrieval von elektronischen Informationen
3106
95
Germany
(7) Eingabe: 3106 (8) Ergebnis: Enter search terms (9) Eingabe: Multimedia? and (Potsdam or Berlin) (10) Ergebnis: ... (alphabetische Liste der Datenbanken) 1
for new search on same cross set
2
for cross menu
3
to rank results
4
to request a database
(11) Eingabe: 3 (12) Ergebnis: ECCO
EcoRegister: German Co Reg. '85-
95
of
3386066
DVVC
Creditreform: German Companies
52
of
757691
HOPE
Hoppenstedt: Germay
19
of
73164
TNSW
Technimetrics Shareworld Current
16
of
34525
13
of
502595
6
of
208697
DBWG D&B Germany WLWE Who Supplies What?
Beispielhost: DataStar; Quelle: Poetzsch 1998, 74 ff. (stark gekürzt)
4 Retrieval von elektronischen Informationen
96 „Bluesheets"
Jede elektronische Datenbank hat ihre Eigenheiten, ihr spezielles Feldschema, eigene Thesauri, verwendete Klassifikationssysteme usw. Alle diese Spezifika jeder Datenbank sind in den Datenbankbeschreibungen, den sog. „Bluesheets" aufgelistet. (Der Name kommt daher, daß der erste Online-Host, Dialog,
seine Datenbank-
beschreibungen auf blaues Papier druckte.) Bluesheets enthalten ausführliche Angaben über das in der Datenbank verwendete Feldschema nebst den einzugebenden Feldkürzeln. Eine bibliographische Datenbank kann z.B. folgendes Feldschema haben: •
AU
Autor(en)
•
TI
Titel
•
SO
Quelle
•
YR
Erscheinungsjahr
•
CN
Erscheinungsland
•
CI
Erscheinungsort
•
CO
Verlag
•
IB
ISBN
•
IS
ISSN
•
LA
Sprache
•
PU
Publikationsform
•
KL
Notation(en) des verwendeten Klassifikationssystems
•
DE
Deskriptor(en) des verwendeten Thesaurus
•
AB
Abstract.
Die Feldkürzel haben sowohl bei der Suche als auch bei der Ausgabe Relevanz. Für feldspezifische Suchen ist die Kenntnis der Abkürzungen notwendig. Suchen nach Autorennamen müssen etwa so formuliert werden:
AlMMarx, Karl.
4 Retrieval von elektronischen Informationen
97
Bei der Ausgabe kann man entweder auf vorformulierte Formate zurückgreifen oder sich aus den Feldern selbst ein Format zusammenstellen, z.B.
Ausgabeformat=AU, TI, SO.
Preise In der Regel ist es (derzeit) notwendig, mit Datenbankanbietern Verträge abzuschließen. Der Nutzer bekommt ein Passwort, das Zugang zu allen jeweils angebotenen Datenbanken verschafft. Kostenquellen für die Kunden sind - bei vielen, aber nicht allen Hosts - fixe jährliche Abonnementgebühren, hinzu kommen Kosten nach „Pay as You go". Diese variablen Kosten entstammen den Gebühren für die Anschaltzeit, den Gebühren für einzelne Datensätze sowie für besondere Befehle. Zum Teil werden die jährlichen Gebühren auf die variablen Kosten angerechnet. Hinzugerechnet werden die Kosten für die Telekommunikation; zusammengefaßt: •
jährliche Fixkosten
•
Anschaltzeit
•
Datensätze
•
Spezialbefehle
•
zusätzlich: Telekommunikationskosten.
Viele elektronische Datenbanken liegen bei mehreren Datenbankanbietern auf. Da die Preise für die Datenbanken von Host zu Host variieren, ist - neben der Retrievalsoftware und der Datenbankumgebung der jeweiligen Hosts - der Preis ein wichtiges Aus wahlelement.
4.2 Suchtechniken in Datenbanken Wir kommen bei unserem „Nadel-im-Heuhaufen"-Syndrom zu Phase 2, zum Finden der relevanten Datensätze. Die Suchtechniken in Datenbanken hängen entscheidend von der Mächtigkeit der angebotenen Retrievalsysteme ab. Wir wollen hier kein einzelnes Retrievalsystem beschreiben, sondern in systematischer Hinsicht die Möglichkeiten skizzieren, die optimale Suchen benötigen. Zur konkreten Anwendung ist die Kenntnis der jeweils korrekten Retrievalbefehle natürlich notwendig (vgl.
98
4 Retrieval von elektronischen Informationen
hierzu z.B. vom Kolke 1994 oder Viesels 1997 sowie die einschlägigen Handbücher der Informationsanbieter).
Datenbankaufruf Hat sich der Rechercheur für eine oder mehrere verwandte Datenbanken eines Hosts entschieden, so sind diese - in der Regel über ihre Nummer oder ihr Kürzel - aufzurufen. Nehmen wir an, wir wollen die Datenbank 3 anwählen, so ist ein Befehl der Art
begin 3
auszufuhren. Wünscht man, in gewissen Teilmengen einer Datenbank zu arbeiten, so kann man dies in einigen Systemen bereits beim Aufruf markieren. Jetzt kommen für uns nur die letzten zwei Jahrgänge der Datenbank 3 infrage:
begin 3 current 2.
Datenbanken mit gleicher oder doch zumindest ähnlicher Feldstruktur bzw. Inhaltserschließung lassen sich gleichzeitig aufrufen und abarbeiten. Hierzu werden beim Aufruf alle gewünschten Datenbanken angegeben, etwa:
begin 3, 12, 134,445.
Feldspezifische Suche - Suche im Basic Index Eine gezielte Suche läuft normalerweise über Felder. Unterschieden werden bei den Hosts durchwegs zwei Feldtypen. Alphanumerische Felder erlauben die Suche mit Buchstaben, Zahlen und einigen Sonderzeichen, numerische Felder gestatten sowohl algebraische Operationen als auch (manchmal) Berechnungen. Bei alphanumerischen Feldern sucht man entweder nach einzelnen Wörtern, z.B.
4 Retrieval von elektronischen Informationen
99
A I N M a r x und AU=Karl
oder nach kompletten Phrasen wie
AU=Marx, Karl.
Numerische Felder lassen neben der Gleichheit weitere algebraische Suchen zu, also nach „größer als", „kleiner als" bzw. nach Intervallen. Suchen nach dem Jahrgangsintervall 1998-2000 bzw. nach Umsatzgrößen mit mehr als einer Million DM werden beispielsweise so formuliert:
YR=1998:2000 UM> 1000000.
Gibt man bei der Suche kein Feldkürzel an, so verläuft die Suche automatisch im sog. „Basic Index". Was jeweils hierunter fallt, variiert von Host zu Host und auch von Datenbank zu Datenbank. Bei einigen Datenbankanbietem fallen alle Feldeinträge im Basic Index zusammen. Hier ist eine Suche im Basic Index ausgesprochen riskant, weiß man doch nicht, in welchem Feld unser Suchargument überhaupt vorkommt. Wollen wir z.B. Literatur zum Wirtschaftsstandort München recherchieren und geben
München
ein, so werden auch alle Datensätze gefunden, die als Verlagsort München nennen. Das Suchergebnis wäre eine riesige Menge an Ballast. Andere Datenbankanbieter fassen - abhängig vom jeweiligen Datenbanktyp - nur (mehr oder minder sinnvoll) die relevanten Felder im Basic Index zusammen. Bei bibliographischen Datenbanken wären dies Autor, Titel, Abstract u.ä. Auch hier muß mit Ballast gerechnet werden. Nehmen wir an, in einem Abstract steht der Satz: „Der Text handelt über Oberbayem, aber nicht über München". Unsere München-Suche
100
4 Retrieval von elektronischen Informationen
über den Basic Index findet diesen Datensatz, kommt doch die Zeichenfolge „München" vor. Korrekt wäre eine Suche nach Deskriptoren, und dort findet man den Datensatz nicht. Einen Sonderfall stellt die Groß- und Kleinschreibung dar. Normalerweise wird nicht zwischen Klein- und Großbuchstaben unterschieden. Für bestimmte Suchen kann es aber sinnvoll sein, Großbuchstaben gezielt anzugeben. Der Datenbankanbieter LexisNexis bietet drei Varianten an:
allcaps (findet z.B. AIDS) nocaps (findet aid) caps (findet Aid).
Sucht man in Volltextdatenbanken, so muß die Suche nach einem Wort sowohl dessen Plural- als auch Singularformen umfassen. Für die englische Sprache bieten einige Hosts eine automatische Pluralbildung für den regelmäßigen Plural an. Möchte man seine Suche auf genau eine Form beschränken, so ist dies explizit anzugeben.
plural (Job) findet jobs singular (job) findet job, ansonsten: job findet jobs sowie job.
Diese Methode kann bei Eigennamen, die auf ,,-s" enden, nützlich sein. Das Retrievalsystem erkennt solche Eigennamen nicht und wendet seine Regeln auch fälschlicherweise - darauf an. Eine Suche nach dem Namen des Gründers von Apple Computer, Steven Jobs, ist ein passendes Beispiel. Um nicht Ballast (über das Wort ,job") zu bekommen, muß die Suche über die Pluralform gebildet werden:
Steven w/3 plural (job) (w/3 ist ein Abstandsoperator; s.u.!).
4 Retrieval von elektronischen Informationen
101
Je nach Software muß außer dem Suchargument zusätzlich ein Befehl eingegeben werden, der eine Suche einleitet, z.B. „find" oder „select". (Im Folgenden lassen wir zur Vereinfachung diesen Befehl stets weg.)
Blättern im Wörterbuch
Über den Basic Index und auch über die Indices der Felder werden Wörterbücher geführt und dem Benutzer angeboten. Die Wörterbücher sind sowohl wortinvertiert (Mehrwortausdrücke sind zerlegt: „Marx" unter „M", „Karl" unter „K") als auch phraseninvertiert („Marx, Karl" nur unter „M") angelegt. Zum Blättern gibt man den entsprechenden Wörterbuchbefehl, sagen wir „list", und die Anfangsbuchstaben des gesuchten Terms an. Normalerweise wird die alphabetische Umgebung des Wörterbucheintrags angezeigt. Da die Einträge durchnumeriert sind, kann man - auch bei langen Wörtern - bequem mit der Nummer weiterarbeiten, wie das Beispiel zeigt:
Eingabe: list de=Geschichte der Wirtschaftswissenschaften
Ergebnisausschnitt: T1
Geschichte
T2
Geschichte der Wirtschaft
T3
Geschichte der Wirtschaftswissenschaften
T4
Geschichte der wirtschaftswissenschaftlichen Theorien
T5
Geschichtswissenschaft
T6
usw.
Eingabe: suche T3.
102
4 Retrieval von elektronischen Informationen
Gewisse Online-Archive bieten zur Umschreibung von Suchargumenten sogenannte „Thesauri" an. Hier ist zu beachten, daß der Begriff „Thesaurus" zwei Bedeutungen hat. Einmal ist die Dokumentationssprache gemeint, die wir im letzten Kapitel kennengelernt haben (und auf die wir unten bei der hierarchischen Suche wieder zu sprechen kommen), zum andern geht es um Synonymwörterbücher. Dieser zweite Aspekt ist hier gemeint. Aus bestehenden Wörterbüchern oder aus automatisierten Verfahren
kreiert,
werden
einem
Suchterm
gewisse
(mehr
oder
minder
entsprechende) verwandte Wörter zugeordnet. Das folgende Beispiel stammt vom Online-Archiv Lexis-Nexis.
Eingabe: thes contract
Ergebnis: Term Variations: contracted 2
contracter
3
contracting
4
contractor
5
accord
6
accordance
7
agreement
8
bargain
9
binding agreement usw.
4 Retrieval von elektronischen Informationen
103
Fragmentierung Suchargumente können entweder „komplett" oder auch fragmentiert angegeben werden. Bei kontrolliertem Vokabular, etwa eines Thesaurus (im Sinne einer Dokumentationsmethode) empfiehlt sich die komplette Bezeichnung, ansonsten kann es in gewissen Fällen sinnvoll sein, mit sog. „Jokerzeichen" zu arbeiten, die die Fragmentierung (Truncation) herstellen. Auf die große Bedeutung der Fragmentierung bei der hierarchischen Suche mithilfe eines Klassifikationssystems haben wir bereits hingewiesen (s.o. S. 68 f.). Bei Suchen nach Wörtern in frei formulierten Texten (Titel, Abstract, Volltext) sind wir stets mit den Varianten der grammatischen Flexionsformen konfrontiert, die mit geschickten Fragmentierungen zusammengefaßt werden können. Ebenso sind unterschiedliche Schreibweisen (Meier oder Meyer) gemeinsam suchbar. Aber auch bei numerischen Feldern kann Truncation hilfreich sein. Denken wir z.B. an eine Suche nach
Unternehmen
im
Bereich
Berlin,
die
wir
anhand
der
Postleitzahlen
identifizieren wollen. Hier müssen wir nach der „1" fragmentieren. Es gibt Fragmentierungszeichen für eine unbegrenzte Anzahl von Zeichen, d.h. hinter dem Suchargument können null oder beliebig viele Zeichen vorkommen. So findet
UnternehmS
die Terme Unternehmen, Unternehmung, Unternehmer, Unternehmensphilosophie usw. Das Analogon zur gerade gezeigten Rechtsfragmentierung ist die Linksfragmentierung, eingesetzt etwa zur Suche nach Unternehmensformen
Sunternehmen,
und findet Bauunternehmen, Chemieunternehmen, Stahlunternehmen usw. Darüberhinaus sind Fragmentierungen mit einer bestimmten Anzahl von Zeichen nutzbringend einsetzbar, diesmal zur Rechts- und Links- sowie zusätzlich zur Binnenfragmentierung. Nehmen wir an, der Joker * steht für ein beliebiges Zeichen. Dann findet
104
4 Retrieval von elektronischen Informationen Me*er
die Worte Meier, Meyer, Mejer usw. Die begrenzte Rechtsfragmentierung sei an einem weiteren Beispiel verdeutlicht.
bank***
findet (im Englischen) u.a. bank, banker und banking, aber nicht bankruptcy.
Um nicht unliebsamen Ballast als Suchergebnis zu erhalten, ist bei allzu großzügigen Fragmentierungen Vorsicht geboten. Nehmen wir an, jemand möchte einen kompletten Überblick zu Affen haben und formuliert sein Suchargument durch
$affe$.
Natürlich findet unser Biologe alles über Affen, zusätzlich aber auch alles über Giraffen, Affenbrotbäume, Kaffee und Zulukaffer.
Mengentheoretische Operatoren Bei der Verwendung mehrerer Suchargumente müssen diese durch Operatoren miteinander verbunden werden. Im einfachsten Fall geschieht dies durch die mengentheoretischen Operatoren •
und (Schnittmenge)
•
oder (Vereinigungsmenge)
•
nicht (Exklusionsmenge).
In Erinnerung an den Mathematiker und Logiker George Boole (1815 - 1864) werden die Operatoren auch „Boolesche Operatoren" genannt.
4 Retrieval von elektronischen Informationen
105
Das mengentheoretische „und" findet diejenigen Datensätze, die alle die durch „und" verknüpften Suchargumente enthalten. Im Falle von zwei Argumenten gilt folgendes Schaubild:
A UND B
Nehmen wir an, wir suchten Literatur, in der über Äpfel und Birnen (gemeinsam) gesprochen wird. Suchergebnis ist die Schnittmenge der Menge der Dokumente, die über Äpfel spricht, und der Texte, die über Birnen handeln, also der Dokumente, die sowohl über Äpfel als auch über Birnen handeln. Das mengentheoretische „oder" findet diejenigen Datensätze, die mindestens eines der durch „oder" verknüpften Suchargumente enthalten; graphisch:
A ODER B
Nehmen wir nun an, daß wir alles über Äpfel und Birnen erfahren wollen. Wir möchten also die Menge der Literatur über Äpfel sowie die Menge der Literatur über Birnen erhalten. Entgegen der Umgangssprache wird bei der Bildung der Vereinigungsmenge der Operator „oder" verwendet. „Alles über Äpfel und Birnen" muß durch „Äpfel oder Birnen" formuliert werden. Das mengentheoretische „nicht" findet diejenigen Datensätze, die das erste Suchargument enthalten, aber nicht das zweite. Im Gegensatz zum „und" und zum „oder"
106
4 Retrieval von elektronischen Informationen
ist hier die Reihenfolge der Argumente zu beachten. Die Darstellung mittels der Booleschen Mengenkreise sieht so aus:
A NICHT B
Nun möchten wir alles über Äpfel erfahren, aber auf keinem Fall einen Text finden, der auch Birnen bespricht. Die mengentheoretische Formulierung lautet „Äpfel nicht Birnen". Bei der Exklusionsmenge wird die Schnittmenge (A und B) ausgeschlossen. Die drei mengentheoretischen Operatoren können beliebig kombiniert werden. Hierbei ist die Bindungsstärke der Operatoren zu beachten •
NICHT bindet stärker als UND
•
UND bindet stärker als ODER.
(Z.T. ist die Bindungsstärke zwischen Nicht, Und und Oder auch umgekehrt.) Mit Klammersetzung kann man die gewünschten Bindungen herstellen. Möchte man etwa die Vereinigungsmenge zweier Argumente A und B mit der Menge C schneiden, so ist mit Klammern wie folgt zu formulieren:
(A oder B) und C.
Mengentheoretische Operatoren lassen sich sowohl auf Terme des Basic Index' als auch auf feldspezifische Bezeichnungen anwenden. So können wir beispielsweise bei der Suche nach Zeitschriftenartikeln von Ernst Meier (Feldkürzel für „Autor" sei AU) aus den Jahren 1998 und 1999 (JG) zu den Themen Mineralwasser bzw. Soft drinks (Kurzform für das Deskriptorenfeld ist DE) diese Anfrage stellen:
AU=Meier, Ernst und (JG=1998 oder JG=1999) und (DE=Mineralwasser oder DE=Soft drinks).
4 Retrieval von elektronischen Informationen
107
In einem zweiten Beispiel suchen wir nach Unternehmen im Postleitzahlbereich Köln (die Postleitzahl, PL, sollte mit 5 beginnen), die Anwendersoftware (PTS Product Code 7372002; Feldkürzel PC) anbieten und entweder mehr als 30 Mitarbeiter (MI) oder mehr als 20 Mio. DM Jahresumsatz (UM) haben. Gleichzeitig wollen wir sichergehen, daß unser Unternehmen keine Software für militärische Zwecke erstellt (PTS 7372003):
(PL=5$ und PC=7372002 und (MI>30 oder UM>20000000)) nicht PC=7372003.
Abstandsoperatoren Insbesondere bei langen Texten oder Datensätzen ist die Verwendung des mengentheoretischen Und-Operators kritisch, können doch Datensätze gefunden werden, wo die durch Und verknüpften Argumente in völlig unterschiedlichen
Kontexten
vorkommen. Lösungsmöglichkeiten erschließen sich durch Abstandsoperatoren, die alle das Boolesche Und verschärfen. Das Angebot von Abstandsoperatoren schwankt bei den unterschiedlichen Informationsanbietern, so daß wir hier nur auf einige Operatoren hinweisen wollen. Der engste Abstand zwischen zwei Suchargumenten liegt vor, wenn die Bezeichnungen im selben Feld direkt nebeneinander stehen. Der hierzu passende Abstandsoperator hat zwei Ausprägungen, insofern er einmal die Reihenfolge beachtet, das andere Mal nicht. Unter Berücksichtigung der Reihenfolge langt es bei einigen Systemen, die Suchphrase (ggf. durch Anführungszeichen „..." gekennzeichnet) hinzuschreiben, also etwa
„Julia Roberts",
oder durch einen eigenen Operator, z.B. „adj" (adjacency), zu verknüpfen:
Julia adj Roberts.
108
4 Retrieval von elektronischen Informationen
Eine Phrase der Art „Roberts, Julia", z.B. ein Wörterbucheintrag, wird so nicht gefunden. Hier muß man mit einem Operator arbeiten, der von der Reihenfolge der Suchargumente absieht, etwa der Operator (n):
Julia (n) Roberts.
Bietet ein Host letzteren Befehl nicht an, so müssen zwei mit adj gebildete Argumente mit dem Booleschen Oder verknüpft werden:
Julia adj Roberts oder Roberts adj Julia.
Nicht nur Abstände von genau einem Wort sind nützlich, sondern auch größere Intervalle. Angeboten wird bei einigen Online-Archiven ein allgemeiner Abstandsoperator W/n, wobei n eine ganze Zahl zwischen 1 und - je nach Software - einigen Hundert ist. Der Abstand wird ausschließlich innerhalb eines Feldes ausgezählt. Das Suchargument
„Julia Roberts" w/5 „Lyle Lovett"
findet demnach alle Datensätze, in denen die beiden Namen, egal in welcher Reihenfolge, im gleichen Feld im Abstand von höchstens fünf Wörtern stehen. Stoppwörter, d.h. nicht sinntragende Terme wie „der", „die", „das" o.ä., zählen hierbei nicht mit. Der allgemeine Abstandsoperator ist ein reiner Zählalgorithmus. Es gibt auch grammatische Varianten von Abstandsoperatoren. Bezugspunkte sind der gleiche Satz, der gleiche Absatz, das gleiche Feld, eine besondere Stellung im Satz (etwa am Satzanfang), und dies unterteilt in positive wie negative Fälle, tabellarisch:
a und.s b (a und b im gleichen Satz) a nicht.s b (a und b nicht im gleichen Satz)
4 Retrieval von elektronischen Informationen
109
a und.p b (a und b im gleichen Absatz) a nicht.p b (a und b nicht im gleichen Absatz) a und.f b (a und b im gleichen Feld) a nicht.f b (a und b nicht im gleichen Feld) 0 a (a steht am Satzanfang). Bei der Anwendung syntaktischen Indexierens zur Inhaltsabbildung (s.o. S. 83 f.) werden die Deskriptoren in mehreren Teilmengen abgelegt. Das Retrieval erfordert in diesem Fall die Eingabe eines Abstandsoperators und nicht des Booleschen Und. Je nach verwendeter Software kommt einer der oben genannten Operatoren infrage. Wenn wir die thematischen Teilmengen als Analogon zu einem Absatz sehen, müßte entsprechend mit dem Operator Und.p gearbeitet werden. In Fortführung des Beispiels auf Seite 84 (Teilmenge 1: A, B; Teilmenge 2: C) ergibt sich beim Suchargument
A und.p B
ein Treffer, beim Suchargument
A und.p C
jedoch nicht. Erst durch Abstandsoperatoren wird ein Retrieval im Rahmen der syntaktischen Indexierung praktikabel.
Häufigkeitsperatoren In Volltextdatenbanken kann es sinnvoll sein, gewisse Terme nach ihrer Auftretenshäufigkeit zu suchen. Eine solche Suche wird von der - nicht immer zutreffenden Voraussetzung begründet, daß ein Term umso wichtiger ist je öfter er in einem Text vorkommt. Anwendbar sind Häufigkeitsoperatoren vor allem dann, wenn jede Indexierung fehlt und wenn sehr viele Datensätze zum Suchargument vorliegen. Nehmen wir an, wir suchen nach Siemens. Da in unserer durchsuchten Datenbank diverse
4 Retrieval von elektronischen Informationen
110
Datensätze hierzu vorliegen, wollen wir uns auf diejenigen Texte einschränken, in denen das Wort „Siemens" mindestens 20mal vorkommt. Beim Host
Lexis-Nexis,
einem der wenigen Informationsanbieter, die überhaupt mit Häufigkeitsoperatoren arbeiten, heißt der Befehl „atleast n (Suchargument)", wobei n eine Zahl zwischen 1 und 255 ist. Unsere Suchfrage müßte demnach lauten:
atleast20(Siemens).
Hierarchische Suche Bei Klassifikationssystemen erhalten wir durch geschickte Rechtsfragmentierung eine
einfache
Form
hierarchischen
Retrievals.
Eine
unbegrenzte
Rechts-
fragmentierung findet die Datensätze zu einem Begriff sowie zu allen Unterbegriffen. Eine begrenzte Fragmentierung findet soviele Ebenen wie Fragmentierungszeichen verwendet werden. Folgende Beispiele mögen dies verdeutlichen:
DDC=382$ (findet alles zu 382 nebst allen Unterbegriffen) . DDC=382* (findet alles zu 382 und zu den Unterbegriffen der nächsten Ebene) DDC=382** (findet alles zu 382 und zu den Unterbegriffen der nächsten zwei Ebenen).
Im Abschnitt über Thesauri (s.o. S. 78 f.) haben wir bereits gesehen, daß die Thesaurusrelationen nicht wie bei den Klassifikationen über Fragmentierungen abfragbar sind. Vielmehr benötigen wir hier eigene Operatoren. Leider gibt es (derzeit) nur wenige
Datenbankanbieter,
die
eine
größere
Menge
an
hierarchischen
Suchmöglichkeiten anböten. Bei der Software GRIPS/DIRS, eingesetzt beim Online-Archiv DIMDl, gibt es den hierarchischen Operator „Down", der einen Deskriptor und alle seine Unterbegriffe gemeinsam sucht, z.B.
de down Hepatitis (findet alles zu Hepatitis und allen Unterbegriffen im hinterlegten Thesaurus).
III
4 Retrieval von elektronischen Informationen
Die Qualität und Nützlichkeit einer hierarchischen Suche steht und fallt natürlich mit der Qualität des eingesetzten Dokumentationswerkzeugs.
Datenbankübergreifende Suche Technisch völlig unproblematisch können mehrere Datenbanken gleichzeitig aufgerufen und abgefragt werden. Trotz dieser Einfachheit ist eine datenbankübergreifende Suche an diverse Voraussetzungen geknüpft. Grundvoraussetzung ist, daß alle Datenbanken zum gleichen Typ gehören. Eine Faktendatenbank, eine bibliographische Datenbank und eine Volltextdatenbank gemeinsam abzuarbeiten, ist wegen der völlig unterschiedlichen Feldstruktur kaum möglich. Bei Datenbanken des gleichen Typs sind formale Suchargumente, etwa zu Unternehmen oder zu Autorennamen, jederzeit drin. Vorsicht ist demgegenüber bei inhaltlichen Suchargumenten wie Deskriptoren oder Notationen geboten. Eine inhaltliche datenbankübergreifende Suche mit kontrolliertem Vokabular geht nur dann, wenn das gleiche Dokumentationswerkzeug bei allen Datenbanken Verwendung findet. Sucht man in mehreren Datenbanken gleichzeitig, so ist immer damit zu rechnen, daß man Dubletten erhält. Das Umgehen mit den Dubletten erfordert einige Retrievalbefehle. Zunächst sind die Dubletten zu identifizieren; beim Host Dialog geschieht dies mittels
identify duplicates.
Die entsprechenden
Identifikationsprogramme
vergleichen ausgewählte
Inhalte
gewisser Felder. Insbesondere Schreibvarianten in den unterschiedlichen Datenbanken machen das Verfahren nicht völlig zuverlässig. Wenn beispielsweise eine Datenbank einen Autorennamen mit „Marx, Karl" ansetzt und eine andere mit „Marx, K." und das Identifikationsprogramm beim Autorenfeld zehn Stellen vergleicht, so kann eine entsprechende Dublette nicht erkannt werden. Der zweite Schritt ist das Löschen der Dubletten durch
remove duplicates.
4 Retrieval von elektronischen Informationen
112
In der Regel werden die Datenbanken in der Reihenfolge ihres Aufrufs abgearbeitet. Haben wir beispielsweise die Datenbanken 15,16 und 17 (in dieser Reihenfolge) aufgerufen, so bleiben alle Datensätze aus 15 erhalten. In 16 werden die Datensätze entfernt, die als Dublette zu einem Datensatz aus 15 erkannt worden sind, usw. Gibt es Qualitätsunterschiede zwischen den Datenbanken, so muß man dies durch die daran orientierte Reihenfolge beim Aufruf berücksichtigen, also zuerst die „beste" Datenbank nennen, dann die zweitbeste usw.
Umformulierung von Suchergebnissen zu Suchargumenten Manchmal werden Suchfragen nur durchgeführt, um zu einer aussagekräftigen Menge von Suchargumenten zu kommen. Dies kann u.a. dann der Fall sein, wenn wir in einer Synonymdatenbank (etwa zu chemischen Bezeichnungen) alle Varianten zu einem Suchterm eruieren wollen. Nehmen wir an, wir suchten nach „Aspirin". Die Suche in der Datenbank der chemischen Bezeichnungen fuhrt zu mehreren Dutzend Synonymen. Diese interessieren uns jedoch im Einzelnen nicht; wir benötigen sie vielmehr als Suchargumente in einer anderen Datenbank. Der entsprechende Befehl bei Dialog lautet „Map". Hierbei werden die Suchergebnisse eines Feldes auf Suchargumente desselben Feldes abgebildet, z.B.
map rn (rn sei das Feld der Registry Number chemischer Verbindungen).
Das „Mapping" ist auch über Feldgrenzen hinaus sinnvoll. Nehmen wir nun an, wir suchten alle die Patente, die Patente eines bestimmten Unternehmens zitieren. Zunächst müssen wir alle Patente finden, die unser Unternehmen als Patentanmelder nennen. An den gefundenen Datensätzen sind im Sinne unserer weiteren Recherche nur die Patentnummern (Feldkürzel pn) interessant. Über einen Ausgabebefehl erhalten wir eine Liste der Form pn=xxx pn=yyy usw.
4 Retrieval von elektronischen Informationen
113
Im nächsten Schritt müssen die Feldkürzel pn durch die Kürzel et (für cited patents) umbenannt und alle mit dem logischen Oder verbunden werden. Der Datenbankanbieter Questel-Orbit bietet hierzu den Befehl „requal" an:
requal ct.
Über die anschließende Suche nach den zitierten Patenten löst sich unser Informationsproblem (vgl. Stock 1992a, 312).
Ökonometrische Befehle Wirtschaftsstatistische Datenbanken berichten in numerischer Form über Objekte und zugehörige Merkmale. Werden Daten auch nach dem Merkmal „Zeit" erhoben, so haben wir Zeitreihen vor uns. Bei Datenbanken mit statistischen Informationen sind zwei Arten von Befehlen zu unterscheiden, erstens die Suchbefehle, die Zeitreihen auffinden, und zweitens Befehle, die bei den gefundenen Zeitreihen ansetzen. Die Suchbefehle unterscheiden sich nicht prinzipiell von den „normalen" Booleschen Operatoren. Wohl gibt es aber noch Datenbankanbieter, die die Suche nicht elektronisch anbieten, d.h. der Nutzer muß anhand gedruckter Unterlagen die Verknüpfungen manuell herstellen. Nehmen wir an, wir suchten in der Außenhandelsdatenbank der Europäischen Union nach dem deutschen Export nach Frankreich über alle Warengruppen (vgl. Staud 1997, 336). Die Codes für die vier Bestandteile der Suche sind in der entsprechenden
Klassifikation bzw. Codetabelle
nachzuschlagen.
Untercode I betrifft die Meldeländer (also hier: Deutschland, Code: 12), Untercode II Handelsströme, Einheit und Periodizität (wir wählen: Ausfuhren, Werte, monatlich; Code: 7), Untercode III die Warenklassen (da wir keine Einschränkung wünschen, ist Code
169 für „insgesamt" korrekt) sowie
Untercode
IV die
Partnerländer
(Frankreich, Code: 001). Wir setzen die Codes in der vorgegebenen Reihenfolge zusammen und suchen demnach folgende Zeitreihe:
127169001.
114
4 Retrieval von elektronischen Informationen
Der große Unterschied zu nicht-statistischen Datenbanken liegt in den Befehlen für die Weiterverarbeitung von Zeitreihen. Angeboten werden einfache Berechnungen, etwa Summenbildungen über verschiedene Zeitreihen hinweg (z.B. die deutsche Ausfuhr nach Frankreich und Italien, dargestellt als eine Zeitreihe) oder die Änderung der Währungsbasis (z.B. statt DM in US-$). Ökonometrische Befehle reichen von Glättungen, Saisonbereinigungen, Abweichungen von der Vorperiode, Korrelationen zwischen Zeitreihen, Regressionsrechnungen bis hin zum Durchspielen makroökonomischer Modelle.
Anzeigen von Suchergebnissen Nehmen wir an, wir haben nach einigen Suchschritten ein Ergebnis gefunden, von dem wir meinen, daß es „passen" könnte. Es gilt demnach, die Datensätze ganz oder teilweise am Bildschirm anzuzeigen. Der Anzeigebefehl verlangt in der Regel nach drei Argumenten, dem Suchschritt, den gewünschten Datensätzen im Suchschritt und dem Ausgabeformat. Wenn „type" der Anzeigebefehl ist und wir vom vierten Suchschritt in die ersten fünf Datensätze im kostenfreien Format (Format 3) ansehen möchten, lautet die Eingabe
type s4/3/l-5.
Weiß der Recherchierende nicht mehr - nach langem Suchen -, welche Nummer der letzte Suchschritt hat oder wünscht er einen Überblick über seine bisherige Strategie, so gibt es hierfür einen eigenen Anzeigebefehl, etwa
display set.
Bei der Ergebnisanzeige werden entweder vorformulierte oder selbstdefinierte Formate benutzt. Vorformuliert sind beispielsweise ein Freiformat (zum ersten Sichten eines Ergebnisses) oder ein Vollformat (mit Informationen aus allen Feldern). Man definiert eigene Formate, indem man diejenigen Felder angibt, deren Informationen man bei der Ausgabe sehen möchte.
4 Retrieval von elektronischen Informationen
115
Nur selten realisiert, aber wichtig scheint ein Befehl zum „Ankreuzen" eines Datensatzes. Bei einer ersten Durchsicht (etwa nur der Titel) entscheidet der Nutzer, ob er den Datensatz ausgegeben haben möchte oder nicht. Unter gewissen Umständen kann es sinnvoll sein, nur wenige Informationen auszugeben, diese aber sortiert und in einem Tabellenformat aufbereitet. Wenn wir etwa nach Unternehmen gesucht haben, können wir Firmen nach Umsatzzahlen sortieren
sort s4/all/um (alle Datensätze aus Suchschritt 4 werden nach den Inhalten des um-Feldes sortiert)
und in einem Reportformat unter Angabe von Namen, Umsatz, Stadt o.ä. als Tabelle ausgeben.
Die Ergebnisanzeige ist sowohl zum Anschauen auf dem Bildschirm als auch zur Vorbereitung einer Druckausgabe geeignet. Zum Zwecke der Bildschirmausgabe ist es möglich, ein an der Größe des Bildschirms orientiertes Blättern einzustellen. Bei der Druckausgabe wäre dies demgegenüber störend. Hier ist eine durchgängige Ausgabe gewünscht. Selbstverständlich für die Ausgabe ist, daß die Daten, wenn gewünscht, auf dem lokalen Rechner gespeichert werden. Viele Datenbankanbieter liefern ihre Daten ausschließlich im ASCII-Format. Das hat den Vorteil, daß man sie - etwa in Textverarbeitungs- oder Tabellenkalkulationsprogrammen - weiterverarbeiten kann. Es hat den Nachteil, daß „gewohnte" Formate, z.B. der Satzspiegel einer Zeitung, verloren gehen. Entsprechend bieten einige Online-Archive alternativ zur ASCII-Ausgabe ein Quasi-Faksimile an, das den Satzspiegel simuliert. Ein großes Problem für ausschließlich am ASCII orientierte Online-Archive ist, daß sie mit dem Angebot von Tabellen und besonders von Graphiken größte Schwierigkeiten haben. So ist es durchaus in einigen Volltextdatenbanken üblich, daß zwar der volle Fließtext, aber keine einzige Abbildung vorhanden ist. Inzwischen gehen die Anbieter dazu über, andere Zeichensätze bzw. Datenformate zu benutzen, die ein Faksimile des gesamten Textes ermöglichen. Bevorzugt wird hierbei das PDFFormat.
116
4 Retrieval von elektronischen Informationen
Bestellen von Volltexten Suchergebnisse aus bibliographischen Datenbanken sind Hinweise auf Literaturstellen, Suchergebnisse der ASCII-Volltextdatenbanken sind Texte ohne Graphiken. In allen Fällen, wo die volle Information gebraucht wird, entsteht an dieser Stelle ein Medienbruch. Der gewünschte Volltext, etwa ein wissenschaftlicher Artikel, muß in Bibliotheken bestellt werden. Es gibt mehrere (elektronische) Wege, die Texte zu ordern. Viele Hosts bieten einen entsprechenden Bestellbefehl, etwa
order
an. Die Bestellung wird an die gewünschte Bibliothek weitergeleitet und dort bearbeitet. Zudem kann man kommerzielle „Document Delivery Services" konsultieren. Solche Dienstleister, wie z.B. UnCover, arbeiten mit Bibliotheken und Verlagen zusammen und halten große Mengen wissenschaftlicher Zeitschriften zur jederzeitigen Benutzung bereit. Da hier keinerlei Copyright-Probleme auftauchen, werden die einzelnen Artikel zur Auslieferung in ein EDV-System eingescannt und stehen ab dem zweiten Nutzungsfall elektronisch (und das heißt hier: sofort) zur Verfügung. Bevorzugte Lieferformen sind E-Mail und Fax, möglich ist aber auch ein Kopienversand per Post. Der letzte hier zu besprechende Weg fährt direkt zu großen Bibliotheken. In Deutschland gibt es die Dienstleistung Subito, an der bereits einige der wichtigsten deutschen Universitäts- und Zentralen Fachbibliotheken teilnehmen. Über eine gemeinsame Datenbank, die „Zeitschriftendatenbank", wird diejenige Zeitschrift ausgewählt, in der der gesuchte Artikel steht. Der Nutzer bekommt die Namen der Bibliotheken genannt, die die Zeitschrift abonnieren. Über eine der Bibliotheken wird die Bestellung durchgeführt. Da bei Subito, bedingt durch Probleme mit dem Copyright, nicht auf eingescannte Bestände zurückgegriffen werden darf, ergeben sich durch das Handling mit dem Original gegenüber
UnCover
ggf. Zeit-
verzögerungen. (Dafür ist Subito kostengünstiger.) Die Lieferung erfolgt - wie vom Kunden präferiert - auf allen derzeit möglichen Kanälen (E-Mail, Kopie usw.).
4 Retrieval von elektronischen Informationen
117
Besteht die gewünschte Information nicht aus einem wissenschaftlichen Artikel, sondern einem Buch, einer Dissertation, einer Unternehmensschrift o.a., so muß direkt bei der bestpassenden Bibliothek bestellt werden. In Deutschland wäre dies die Zentralbibliothek der Wirtschaftswissenschaften
in Kiel. Hier kann via Fax geordert
werden, geliefert wird - als Ausleihe - umgehend auf dem Postweg.
Verwalten von Suchprofilen, SDI Arbeitet man ein Suchargument genau einmal ab, so spricht man von einer „retrospektiven Recherche". Wenn man sein Suchargument als „Suchprofil" abspeichert, kann man zu unterschiedlichen Zeitpunkten dasselbe Suchargument benutzen. Hier redet man von „Selective Dissemination of Information", abgekürzt „SDI". Eine solche selektive Informationsvermittlung ist immer dann sinnvoll, wenn der Informationsbedarf eines Nutzers oder einer Nutzergruppe über eine längere Zeit stabil bleibt. Denken wir z.B. an ein Forscherteam, das an einem Thema arbeitet. Nach der ersten Recherche ist das Team daran interessiert, stets die neuesten Informationen zu seinem Thema zu erhalten. Gelöst wird dies, indem das Suchprofil immer dann abgefragt wird, wenn die entsprechende Datenbank aktualisiert worden ist. Das Suchargument läuft dann freilich nicht über den Gesamtbestand der Datenbank, sondern nur über den jeweiligen Zuwachs. Nach dem gleichen Verfahren ist ein Pressespiegel (mehr oder minder automatisch) herstellbar. Als zweites Beispiel betrachten wir eine Wettbewerberbeobachtung. In dem Moment, wenn ein Dossier, eine Bilanz o.ä. in einer Datenbank aktualisiert wird, muß die neue Information ins betriebliche Informationssystem eingespeist werden. Hier benutzen wir unser Suchprofil und wenden es auf aktualisierte Datensätze an. Der erstgenannte Fall, die Suche mittels identischer Suchargumente über Datenbankzuwächse, wird von einigen Online-Archiven automatisiert angeboten. Der SD1Befehl beinhaltet folgende Angaben:
Angabe des Sucharguments Name dieses Sucharguments (frei wählbar) Ausgabeformat
4 Retrieval von elektronischen Informationen
118
Intervall (etwa: täglich, wöchentlich, monatlich) Lieferform (in der Regel: elektronisch).
Auf SDI-Ergebnisse wird in der Regel aktiv vom System hingewiesen; nach Aufrufen des Online-Archivs wird eine Nachricht eingeblendet. Grenzform eines SDI ist ein individueller Tickerdienst. Hier wird ein Suchargument auf Datenbanken angewandt, die realtime Agenturmeldungen verwalten. Der Nutzer bekommt einen Datensatz, der seinem Suchargument entspricht, im Moment des Einspeisens in die Datenbank zugespielt. Der zweite Fall, in dem bereits vorhandene Datensätze mehrmals, nämlich nach ihren Aktualisierungen, gesucht werden, wird nicht zur Gänze durch Hostsoftware unterstützt. Hier speichern wir das Suchargument, rufen es in periodischen Abständen auf und ergänzen es durch zusätzliche Argumente, etwa über Einträge des Feldes „letzte Aktualisierung". Vorausgesetzt, unser letzter SDI-Lauf fand am 1.5.1998 statt, so lautet der SDI-Befehl zum nächstspäteren Zeitpunkt:
[Suchargument] und da> 1998-05-01 („da" sei das Feldkürzel für „Aktualisierungsdatum").
SDI-Läufe über Daten, die ständig in Bewegung sind (etwa Börsenkurse), werden verwaltet, indem die entsprechenden Angaben realtime aus den operativen Systemen abgezogen werden. In seinem „Portfolio" kann der Nutzer jederzeit die jeweils aktuellen Angaben (sowie einen gewissen historischen Hintergrund) abrufen. Einige Datenbankanbieter, darunter Profound, numerischen
Informationen
bieten Portfolios in Kombination
(Aktienkurse)
und
Literaturinformationen
von
(Broker-
Reports zu den überwachten Unternehmen, Pressemeldungen usw.) an.
Da der Informationsbedarf eines Unternehmens bzw. seiner Mitarbeiter erfahrungsgemäß über längere Zeiträume stabil bleibt, kommt dem Verwalten der SDIs in der betrieblichen Informationswirtschaft eine sehr große Bedeutung zu.
4 Retrieval von elektronischen Informationen
119
4.3 Relevanz Unser „Nadel-im-Heuhaufen"-Syndrom beginnt, durchschaubarer zu werden. Wir haben Techniken vorgestellt, die gewünschten „Nadeln", also die Datensätze, im Heuhaufen der elektronischen Datenbanken zu suchen und zu finden. Abschließend wollen wir über Kriterien berichten, die über die Qualität von Suchergebnissen Auskunft geben sollen. Es geht vor allem um zwei Fragen: •
Haben wir alle Datensätze gefunden, die handlungsrelevantes Wissen beinhalten?
•
Haben wir nur solche Datensätze gefunden?
Der zentrale Begriff ist der der „Relevanz". Relevant ist eine Information dann, wenn sie Basis für Handlungen darstellt, d.h. wenn sie •
eine Wissenslücke gefüllt oder
•
eine Entscheidung fundiert oder
•
eine Frühwamfunktion erfüllt hat.
Der Begriff der „Handlung" umfaßt hier auch (bewußte) Unterlassungen. Wenn ein Unternehmer auf der Basis der vorgelegten Informationen keine Handlungsnotwendigkeit sieht, also nichts tut, so war die Information trotzdem für sein Handeln die Basis, und das heißt: Sie war relevant.
Frage- und Antworttypen Die Bestimmung der Relevanz von Informationen ist bei den verschiedenen Informationstypen unterschiedlich. Betrachten wir zum Beispiel einige Informationsbedarfe, die sich in folgenden Fragen wiederfinden: •
Fragetyp A •
Welchen Umsatz hatte Unternehmen X im Monat Januar 1999 in der Region Y?
•
Wo liegt der Schmelzpunkt von Kupfer?
•
Wie schloß der Dollarkurs gestern an der Frankfurter Börse?
•
Wann hat mein Geschäftspartner X.Y. Geburtstag?
120 •
4 Retrieval von elektronischen Informationen Fragetyp B •
Welche Methoden der fiizzy logie lassen sich beim Data Mining einsetzen?
•
Wie hängen - nach Meinung moderner Marketingwissenschaftler Dienstleistungsmarketing und Qualitätsmanagement zusammen?
•
Wie bewerten Analysten das Unternehmen Z AG?
•
Wie beschreiben Marktforscher das Konsumklima für ausländischen Wein in Ungarn?
Fragetyp A zielt auf die Übermittlung einer Fakteninformation ab. Der zugrunde liegende Informationsbedarf ist konkret. Valéry Frants, Jacob Shapiro und Vladimir G. Voiskunskii benennen in ihrer Analyse des Informationsbedarfs diesen Typ als „Concrete Information Need" (CIN). Fragetyp B läßt sich nicht durch die Angabe eines
Faktums
befriedigen. Das
Informationsproblem
wird
hier durch
die
Übermittlung einer mehr oder minder großen Sammlung von Texten befriedigt. Frants et al. sprechen beim Typ B vom „Problem Oriented Information Need" (POIN). CIN und POIN lassen sich mittels einiger Charakteristika anschaulich vergleichen (vgl. Frants/Shapiro/Voiskunskii 1997, 38): CIN
POIN
1. Thematische Grenzen
1. Thematische Grenzen sind nicht
sind klar abgesteckt.
exakt bestimmbar.
2. Die Suchfrageformulierung
2. Die Suchfrageformulierung
ist durch exakte Terme
läßt mehrere terminologische
ausdrückbar.
Varianten zu.
3. Eine Fakteninformation reicht
3. In der Regel müssen diverse
aus, um den Bedarf zu decken.
Dokumente beschafft werden. Ob der Informationsbedarf damit abschließend gedeckt ist, bleibt offen.
4. Mit der Übermittlung der
4. Mit der Übermittlung der
Fakteninformation ist das
Literaturinformationen wird ggf. das
Informationsproblem erledigt.
Informationsproblem modifiziert oder ein neuer Bedarf entdeckt.
4 Retrieval von elektronischen Informationen
121
Die Relevanz einer Information zur Befriedigung eines CIN bzw. zur Beantwortung einer Frage vom Typ A ist exakt zu bestimmen. Entweder beantwortet der gefundene Datensatz unsere Frage oder nicht. Etwas anderes liegt beim POIN bzw. bei der Anwort auf eine Typ-B-Frage vor. Die Antwortmenge sammelt in der Regel Dokumente (oder Hinweise darauf) aus literaturbezogenen
Datenbanken,
also
bibliographischen
Datenbanken
und
Volltextdatenbanken. Hier haben wir mehrere „Treffer", die - mehr oder weniger Aspekte dessen beantworten, was gefragt wurde. Bei problemorientiertem Informationsbedarf (POIN) und den Literaturinformationen als Antwort wird die Beurteilung der Relevanz also durchaus vage ausfallen.
Recall und Precision Ein Klassiker der Informationswissenschaft, Gerald Salton, hat zur Bestimmung der Qualität von Antwortmengen bei Literaturinformation die beiden Aspekte „Recall" und „Precision" besprochen (vgl. Salton/McGill 1987, 174 ff.). Wir gehen von drei Mengen aus, wobei •
a =: gefundene relevante Treffer
•
b =: nichtrelevante Datensätze, die in der Trefifermenge enthalten sind (Ballast)
•
c =: relevante Datensätze in der Datenbank, die nicht gefunden wurden (Verlust).
Recall (Vollständigkeit) errechnet sich als Quotient aus der Anzahl der gefundenen relevanten Datensätze und der Gesamtzahl der relevanten Datensätze in der Datenbank:
Recall = a / a+c.
Precision (Genauigkeit) ergibt sich als Quotient aus der Anzahl der gefundenen relevanten Datensätze und der Gesamtzahl der gefundenen Datensätze:
Precision = a / a+b.
122
4 Retrieval von elektronischen Informationen
Die Precision ist - sehen wir von Randunschärfen bei der Bestimmung der Relevanz ab - genau meßbar. Recall ist demgegenüber ein reines Konstrukt, da der Wert c nicht meßbar ist. Woher weiß ich, was ich nicht gefunden habe? Gäbe es Algorithmen, den Verlust zu benennen, würde ich als Rechercheur diese auch einsetzen und keinen Verlust erleiden. Leider gibt es solche Algorithmen außerhalb von experimentellen (überschaubaren) Datenbanken nicht, der Rechercheur wird immer mit Verlust zu kämpfen haben, und es wird der Qualitätsmessende nie wissen, wie groß c tatsächlich ist. Das Konstrukt „Recall" ist in Verbindung mit der „Precision" in einem Denkmodell nützlich. Versuchen wir, die Recallquote zu erhöhen, sinkt gleichzeitig die Quote der Precision, d.h. wir erkaufen uns einen besseren Grad an Vollständigkeit mit einem schlechteren Grad an Genauigkeit, sprich mit Ballast. Weisen wir alle Datensätze einer Datenbank nach, so erwischen wir neben den relevanten auch alle nichtrelevanten Datensätze. Der Recall-Wert liegt bei idealen „1". Der Ballast ist riesig; das Rechercheergebnis unbrauchbar. Versuchen wir umgekehrt, die Genauigkeit zu erhöhen, also Ballast möglichst völlig zu vermeiden, verringern wir die Vollständigkeit. Ein völlig ballastfreies Retrievalergebnis könnte ebenso unbrauchbar sein, da vielzuviele Informationen gar nicht aufscheinen. In diesem Wechselspiel von Vollständigkeit und Ballast muß der Recherchierende ein optimales Ergebnis herstellen - ein Verfahren, das sich algorithmischen Verfahren entzieht und dessen Güte entscheidend von den Erfahrungen und der „Kunst" des Rechercheurs abhängt. Um es zu wiederholen: Dies gilt ausschließlich für bibliographische Datenbanken und
Volltextdatenbanken
unter der Voraussetzung
eines
problemorientierten
Informationsbedarfs (POIN). In Faktendatenbanken und in statistischen Datenbanken unter der Bedingung einer konkreten Faktenfrage (CIN) gilt der umgekehrt proportionale Zusammenhang zwischen Recall und Precision nicht. Hier sind - bei methodisch sauberer Recherche - sowohl Recall gleich 1 als auch Precision gleich 1. Ein Spezialproblem sind Null-Treffer-Recherchen. Der Recall hat den Wert „0", wenn c > 0 und a = 0; der Recallwert ist nicht definiert, wenn c = 0 und a = 0. Die erstgenannte Möglichkeit signalisiert eine schlechte Recherchequalität, der zweite Fall durchaus nicht, denken wir nur an Neuigkeitsrecherchen im Patentbereich. Null Treffer bei der Frage nach einem technischen Sachverhalt bedeutet, daß - auch im patentrechtlichen Sinne - nichts Vergleichbares vorliegt und wir demnach
4 Retrieval von elektronischen Informationen
123
technisches Neuland betreten und in der Folge auch mit einer Patenterteilung rechnen können. Eine entsprechende Recherche wäre demnach sehr erfolgreich. Eine solche (korrekte) Null-Treffer-Recherche im Patentbereich stellt ein hochrelevantes und präzises Ergebnis dar, das die Ausrichtung der Forschung und Entwicklung eines Unternehmens nachhaltig beeinflussen wird. Null Treffer kann aber auch bedeuten, daß falsch gesucht wurde. Fehler sind zwar immer peinlich; in diesem Fall können sie verheerende Folgen haben.
Hier
signalisiert die Null in der Tat die schlechteste Qualitätsstufe.
4.4 Information Indexing und Information Retrieval Ein optimales Ergebnis beim Information Retrieval kann ausschließlich
dann
erbracht werden, wenn die Informationssuche den Bedingungen der entsprechenden Datenbank voll entspricht. Das heißt, beim Prozeß des Information Retrieval muß bekannt sein, wie die Datenbank aufgebaut wird, sprich wie das Information Indexing vonstatten geht.
Dokumentarische Bezugseinheit - Dokumentationseinheit Information Indexing meint die Abbildung formaler und inhaltlicher Kriterien einer Vorlage, der sog. „dokumentarischen Bezugseinheit" (DBE), auf einen Datensatz innerhalb der Datenbank, der sog. „Dokumentationseinheit" (DE). Die Dokumentationseinheit tritt damit an die Stelle der dokumentarischen Bezugseinheit. Die Einheitenbildung bezieht sich auf den Umfang eines Datensatzes. So kann man beispielsweise einen Sammelband artikelweise bzw. als Ganzes auswerten oder einen Film sequenzweise bzw. als Ganzheit. Ja nach Datenbank wären dann die einzelnen Artikel, Filmsequenzen, Bücher bzw. Filme die Dokumentationseinheiten. Die Auswahl, welche konkreten dokumentarischen Bezugseinheiten in eine Datenbank aufgenommen werden und welche nicht, wird durch die „Dokumentationswürdigkeit" bestimmt. Diese Dokumentationswürdigkeit wird durch einen Kriterienkatalog fundiert, der mindestens folgende Angaben enthält: •
formale Kriterien
•
inhaltliche Kriterien
124 •
4 Retrieval von elektronischen Informationen Anzahl der zu bearbeitenden dokumentarischen
Bezugseinheiten
in einer
Zeiteinheit (Kriterien: Finanzrahmen, Personalressourcen) •
Nutzerbedarf
•
ggf. Neuigkeit der Informationen in der dokumentarischen Bezugseinheit.
Die formalen Kriterien bestimmen etwa die Dokumenttypen (z.B. nur wissenschaftliche Artikel), die Sprache (Beispiel: nur englisch) oder die Zeit. Bei den inhaltlichen Kriterien geht es um das Abstecken des thematischen Rahmens der Datenbank. Die Anzahl der bearbeitbaren dokumentarischen
Bezugseinheiten
richtet sich nach den vorhandenen Ressourcen. Ist der Bedarf der Nutzer dem Datenbankproduzenten hinreichend bekannt, so kann dieser in den Kriterienkatalog aufgenommen werden. Zudem ist es möglich, bei den einzelnen dokumentarischen Bezugseinheiten den Neuigkeitsaspekt zu eruieren und nur solche aufzunehmen, in denen - relativ zur bereits vorhandenen Datenbasis - etwa Neues hinzukommt. Alle diese Kriterien müssen - es sei wiederholt - bei der Informationssuche bekannt sein. So kann man in einer Datenbank, die ausschließlich schaftliche
Literatur
auswertet
(formales
Kriterium),
keine
wissen-
Zeitungsartikel
erwarten. Eine Datenbank, die volkswirtschaftliche Informationen zu Osteuropa speichert
(inhaltliches
Kriterium),
wird
kaum
Datensätze
über
Österreich
vorhalten. Ein „kleiner" Datenbankproduzent mit geringen Personalressourcen wird möglicherweise keine Vollständigkeit in seinen Datenbanken garantieren können. Ein Informationsanbieter, der als Nutzer Akademiker vor Augen hat und deren Informationsbedarf bedienen möchte, könnte einen Wirtschaftspraktiker in einem Unternehmen völlig enttäuschen.
Dokumentationsmethoden Beim Abbildungsprozeß der dokumentarischen Bezugseinheiten auf die Dokumentationseinheiten sind drei Aspekte zu unterscheiden: •
Abbildung formaler Informationsinhalte
•
Abbildung der behandelten Gegenstände
•
dokumentarische Bezugseinheit in Vollform.
4 Retrieval von elektronischen Informationen
125
Bei den formalen Informationsinhalten geht es um die Beschreibung derjenigen Elemente, die eine dokumentarische Bezugseinheit (möglichst) eindeutig identifizieren. Informationsproduzenten machen hierbei von Regelwerken Gebrauch und regeln darin z.B., wie Autorennamen angesetzt werden (etwa: Marx, Karl oder Marx K) oder welche Namen überhaupt vorkommen (es gibt in deutschen Bibliotheken z.B. ein Regelwerk, das bei Büchern von mehr als drei Autoren das Werk als „Titelwerk" betrachtet und alle Autorennamen ignoriert). Letztlich kann man bei jedem Feld einer Datenbank unterstellen, daß die Feldinhalte nach bestimmten Regeln ausgewertet wurden. Von zentraler Bedeutung für die Recherche ist die Abbildung der thematisierten Gegenstände, suchen wir doch meistens inhaltlich und nicht nach formalen Kriterien. In den inhaltsabbildenden Feldern gehen Bezeichnungen ein, die den Hilfsmitteln der Wirtschaftsdokumentation entnommen werden. Einige dieser Hilfsmittel haben wir im Kapitel 3 bereits kennengelernt. Abb. 4.3: Das Zusammenspiel von Information Indexing und Information Retrieval
Treffer
DBE Frage
Information Retrieval
Information Indexing
DBE: dokumentarische Bezugseinheit, DE: Dokumentationseinheit
4 Retrieval von elektronischen Informationen
126
In Abbildung 4.3 wird dies verdeutlicht. Beim Information Indexing werden die Gegenstände, um die es in der dokumentarischen Bezugseinheit geht, durch Begriffe repräsentiert. Die Begriffe werden - als Deskriptoren - einem Thesaurus oder - als Notationen - einem Klassifikationssystem entnommen. Zusätzlich oder auch anstelle der
Deskriptoren
und Notationen bieten
einige Informationssammlungen
die
Vollformen (bei Texten: Volltexte) der dokumentarischen Bezugseinheiten an, so daß nunmehr jedes Wort suchbar wird. Beim Information Retrieval wird der Nutzer seinen Informationsbedarf durch eine Suchfrage ausdrücken, das heißt er formuliert Deskriptoren, Notationen oder andere Bezeichnungen. Der Suchprozeß ist ein Vergleich der Suchbegriffe mit den in der Datenbank vorliegenden Begriffen. Der Vergleich wird entweder exakt vorgommen (hier muß jedes Zeichen übereinstimmen; jeder Tippfehler hat negative Folgen) oder - bei einigen Systemen - nach Ähnlichkeitsgesichtspunkten (hieraufkommen wir unten im Kapitel
6
zu
sprechen).
Je
nach
Vergleichsalgorithmus
Dokumentationseinheiten als Treffer ausgegeben.
Abb. 4.4: „Berrypicking" von Informationen
Quelle: Bates 1989
werden
bestimmte
4 Retrieval von elektronischen Informationen
127
„Berrypicking" Angesichts der Vielzahl und Vielfalt elektronischer Informationsressourcen wäre es verfehlt anzunehmen, in nur einer Datenbank alles zu finden, was den Informationsbedarfbefriedigte. Es ist vielmehr so, daß diverse Datenbanken mit unterschiedlichen Suchformulierungen angesprochen werden müssen, wie dies Abbildung 4.4 schematisch zeigt. Im Modell von Marcia J. Bates durchsucht man die Welt der elektronischen Informationsdienste wie einen großen Hypertext. Man beginnt mit derjenigen Datenbank, die einschlägig erscheint. Eine erste Treffermenge kann dazu fuhren, daß der Suchende Anregungen zu modifizierten Suchen in derselben Datenbank bekommt, etwa „passende" Deskriptoren oder Notationen. Es wird sich zusätzlich zeigen, daß die Datenbank alleine den Bedarf nicht stillen kann. Weitere Datenbanken werden angewählt. Nach der Suche in einer Datenbank mit wissenschaftlichen Artikeln bekommt man z.B. den Hinweis, daß auch Patente zum Thema vorliegen. Folglich wechselt man in eine Patentdatenbank. Oder wir erfahren in einem Artikel einer Nachrichtendatenbank, daß Zeitreihen zum Suchgegenstand gefuhrt werden. Nun müssen wir eine ökonometrische Recherche anschließen. Bates vergleicht das Durchsuchen und Durchstöbern des Hypertextes der elektronischen Informationsdienste mit einem Beerenpflücken im Wald: Der Wald wird erst verlassen, wenn der Korb voll ist, egal, ob die Beeren von einigen wenigen Stellen stammen oder mühselig im gesamten Wald zusammengeklaubt werden müssen.
Fazit •
Information Retrieval in elektronischen Informationssammlungen ist stets mit dem „Nadel-im-Heuhaufen"-Syndrom konfrontiert. Inhaltliche, technische und methodische Expertise der Informationswirte läßt sie die „Nadeln" zielgenau suchen und finden.
•
Nach der Art der in den Datenbanken enthaltenen Informationstypen unterscheiden wir bibliographische Datenbanken, Volltextdatenbanken, Faktendatenbanken und statistische Datenbanken. Die Methode des Information Retrieval ist vom Informationstyp abhängig.
128 •
4 Retrieval von elektronischen Informationen Datenbankfiihrer (wie Gale) geben einen Überblick über Online- und CD-ROM-
Datenbanken. Zusätzlich geben hostspezifische Indices einen Einblick in die suchbaren Aspekte des Informationsangebots des betreffenden Online-Dienstes. •
Die Mächtigkeit eines Retrievalsystems ist von der jeweils eingesetzten Software abhängig. Insofern unterscheiden
sich die Möglichkeiten des Information
Retrieval zwischen den einzelnen Online- oder Offline-Diensten zum Teil beträchtlich. •
Das Gesamtspektrum an Retrievalmöglichkeiten bei der zielgenauen Suche nach Datensätzen umfaßt folgende Befehle: Datenbankaufruf, feldspezifische Suche, Suche im Basic Index, Berücksichtigung von Groß- und Kleinschreibung, automatische Berücksichtigung von Plural- und Possessivformen, Blättern im Wörterbuch, Synonymwörterbuch, Suchtermfragmentierung, mengentheoretische Operatoren (und, oder, nicht), Abstandsoperatoren, Häufigkeitsoperator, hierarchische Suche, datenbankübergreifende Suche, Dubiettenidentifikation und -élimination, Umformulierung von Suchergebnissen zu Suchargumenten,
ökonometrische
Befehle (bei statistischen Datenbanken), Anzeige, Sortierung, Ausgabe, Verwalten von Suchprofilen (SDI). •
Nur solche gefundenen Informationen gelten als relevant, die Basis für Handlungen darstellen, also entweder eine Wissenslücke gefüllt, eine Entscheidung fundiert oder eine Frühwarnfunktion ausgeführt haben. Alle anderen Informationen sind irrelevant und im betrieblichen Informationssystem störend.
•
Die Kriterien für die Qualität eines Retrievalergebnisses sind Recall (Anteil der gefundenen relevanten
Datensätze
relativ zur Gesamtheit
der
relevanten
Datensätze in einer Datenbank) und Précision (Anteil der relevanten Datensätze relativ zur Gesamtheit der Datensätze in einer Treffermenge). Ihre Bestimmung hängt vom Fragetyp ab. Der konkrete Informationsbedarf (Concrete Information Need; CIN) wird durch eine Fakteninformation beantwortet. Relevanz und Précision dürften jeweils 100% erreichen. Der problemorientierte Informationsbedarf (Problem Oriented Information Need; POIN) fuhrt zu einem Zusammenspiel von Recall und Précision, insofern ein Anstieg des Recall zu einem Absinken der Précision und umgekehrt führt.
4 Retrieval von elektronischen Informationen •
129
Optimales Information Retrieval setzt optimale Kenntnis des Information Indexing der durchsuchten Datenbank voraus. Zentral sind die Aspekte der Einheitenbildung (dokumentarische Bezugseinheit), der Dokumentationswürdigkeit sowie der eingesetzten Dokumentationsmethoden.
•
Ein Informationsbedarf dürfte in der Regel nicht innerhalb genau einer Datenbank befriedigt werden können. Nötig ist vielmehr ein Stöbern und Suchen in diversen Datenbanken, wobei auch die Suchfrage - in Rückkopplung mit bereits erzielten Teilergebnissen - ggf. zu modifizieren ist (Modell des „Berrypicking").
5 Data Mining bei externen Informationen 5.1 Informetrie Wir verlassen nunmehr die Suche nach den „Nadeln" im Heuhaufen und wenden uns größeren Einheiten zu. Bislang haben wir Techniken besprochen, die möglichst zielgenau Datensätze finden. Nunmehr wenden wir uns gewissen Mengen von Nachweisen zu, die als Ganzes qualifiziert werden sollen. Hierbei kann es sich beispielsweise um alle Patente eines Unternehmens handeln oder um alle bisherigen Schriften eines Wissenschaftlers. Bei der Suche nach Datensätzen erhalten wir als Suchergebnis einen Eintrag, der - als Dokumentationseinheit - so in das System eingegeben wurde wie wir ihn nun herausbekommen. Bei der informetrischen Suche kreieren wir neue Informationen, also solche, die nie explizit in die Datenbank eingegeben wurden und die sich erst durch den informetrischen Suchvorgang selbst zeigen. Wir haben hier eine Form von Data Mining vor uns, die auf externe Informationen in Online-Archiven angewandt wird. Informetrische Recherchen (vgl. Stock 1991b, 1992a) setzen Methoden ein, die experimentell Inhalte elektronischer Datenbanken analysieren. Folgende Ansätze sind zu berücksichtigen: •
Rangordnungen
•
Zeitreihen
•
semantische Netze
•
Informationsflußgraphen.
Ein informetrisches Gesetz Informetrische Retrievalverfahren können bei der Bildung von Rangordnungen von einer informetrischen Gesetzmäßigkeit Gebrauch machen. Typisch für informetrische Verteilungen ist die linksschiefe Form, die der Formel
f (x) = C / xa
5 Data Mining bei externen Informationen
131
folgt. C und a sind Konstanten; a ist näherungsweise (aber nicht notwendig) 2 (vgl. Egghe/Rousseau 1990, 293). x ist eine Variable für gewisse Informationen, f(x) ist eine Funktion von x. Beispielsweise kann x ein Rangplatz von Autoren nach der Anzahl der Einträge einer Bibliographie und f(x) die Anzahl der Bibliographieeinträge sein. Zur Vereinfachung nehmen wir an, daß a = 2 ist. Der Autor mit den meisten Einträgen möge 1.000 Werke auf sich vereinigen (also C = 1000). Der zweithäufigste Autor muß entsprechend der Formel 250 Einträge haben, der dritte 111, der vierte 63, der fünfte 40 usw. Der Autor auf Rangplatz 31 kommt auf gerade einen Eintrag. Ähnlich wie Autoren verteilen sich Patentanmelder zu einem Thema, Zitationen auf Wissenschaftler usw. Wichtig für uns ist die Tatsache, daß wir mit recht wenigen Items x, die in der Rangordnung oben liegen, die - im quantitativen Sinne - zentralen Figuren einer gesamten Verteilung orten können.
Abb. 5.1: Informetrische Verteilungen
Das informetrische Verteilungsgesetz f(x)
Quelle: Stock 1995, 70
132
5 Data Mining bei externen Informationen
Ausprägungen des informetrischen Gesetzes Die informetrische Gesetzmäßigkeit ist bereits seit Jahrzehnten bekannt. Sie wurde für unterschiedliche Verteilungen bestätigt. Kurz betrachten wollen wir folgende Ausprägungen unseres Gesetzes (vgl. Diodato 1994; Egghe/Rousseau 1990): •
Zipfsches Gesetz (Verteilung von Wörtern in Texten)
•
Bradfordsches Gesetz (Verteilung von Zeitschriften eines Fachgebiets)
•
Lotkasches Gesetz (Verteilung der Produktivität von Wissenschaftlern eines Fachgebiets)
•
Garfieldsches Gesetz (Verteilung von Zitationen wissenschaftlicher Zeitschriften).
Zipfsches Gesetz George Kingsley Zipf (1902 - 1950) findet beim Auszählen der Häufigkeit von Wörtern in Texten einen Zusammenhang zwischen dem Rangplatz der Frequenz und der absoluten Häufigkeit des betreffenden Wortes (vgl. Zipf 1949). Wir benötigen zur Darstellung dieser Gesetzmäßigkeit eine Liste aller Wörter eines Textes, absteigend nach Häufigkeit sortiert. Wenn r der Rangplatz eines Wortes und f seine Häufigkeit ist, so ist das Produkt aus r und f eine textspezifische Konstante C, also
r *f = C (Zipfsches Gesetz).
Zipf exemplifiziert sein Gesetz anhand von „Ulysses" von James Joyce. Das Wort auf Rang 10 kommt in „Ulysses" 2.653mal vor (C = 26.530), das Wort auf Rang 20 1.311 mal (C= 26.220), das Wort auf Rang 1.000 26mal (C = 26.000). Die Konstante C für „Ulysses" ist demnach etwa 26.000. Das Gesetz gilt für alle Hochfrequenzwörter eines Textes, zum Teil auch - je nach Text - für alle Wörter. Für Niedrigfrequenzwörter hat Zipfem modifiziertes weiteres Gesetz („Zweites Zipfsches Gesetz") entwickelt.
5 Data Mining bei externen Informationen
133
Bradfordsches Gesetz Im Bradfordschen Gesetz finden wir einen quantitativen Ausdruck des Zusammenhangs zwischen einer Wissenschaftsdisziplin und den zugehörigen wissenschaftlichen Zeitschriften bzw. deren Ergiebigkeit für diese Disziplin (vgl. Bradford 1934). Samuel Clement Bradford geht von der Gesamtmenge der Artikel eines Fachgebiets aus. Er zählt die Anzahl der Artikel pro Zeitschrift und sortiert die Zeitschriften absteigend nach der Anzahl der Artikel. In der Ursprungsvariante des Bradfordschen Gesetzes werden drei Mengen von Zeitschriften gebildet, die jeweils die gleiche Anzahl von Artikeln enthalte. Die Anzahl der Zeitschriften unterscheidet sich voneinander: im „Kern" sind die ergiebigsten Zeitschriften, in der „Mitte" sind Zeitschriften, die schon jeweils viel weniger Artikel enthalten, am „Rand" befinden sich Zeitschriften, in denen nur noch vereinzelt Artikel unserer Disziplin auftauchen. Die Anzahl der Zeitschriften in den drei Zonen folgt der Formel
1 : n : n2 (Bradfordsches Gesetz).
n ist eine Konstante, der sog. „Bradford-Multiplikator". Eines von Bradfords „klassischen" Beispielen (von 1934) sind die wissenschaftlichen Aufsätze zu den „Schmiermitteln". 395 Artikel verteilen sich auf 164 Zeitschriften. Die acht Zeitschriften im Kern produzieren 110 Artikel, die nächsten 29 Zeitschriften der Mitte 133 Artikel und die nächsten 127 Zeitschriften des Randes enthalten 152 Artikel. Setzen wir in die Formel ein, so erhalten wir
8 : 29 : 127 bei Division durch acht: 1 : 3,625 : 15,875 in etwa also: 1 : 4 : 16.
In der aktuellen informetrischen Literatur wird die Bradfordsche Dreiteilung der Zonen wenig weiterverfolgt, sondern der Gesamtzusammenhang zwischen der kumulierten Anzahl der Artikel und der kumulierten Anzahl der Zeitschriften betrachtet und als sog. „Bradford-Zipf-Bibliograph", in der Regel in halblogarithmischer Dar-
134
5 Data Mining bei externen Informationen
Stellung graphisch veranschaulicht. Die Achse der Anzahl der Artikel wird dabei in absoluten Zahlen, die Achse der Anzahl der Zeitschriften im logarithmischen Maßstab abgetragen. Wir wollen den Bradford-Zipf-Bibliograph an einem Beispiel erläutern! Die Zahlen entnehmen wir dem zweiten „Klassiker" von Bradford, der Verteilung der Artikel der Jahre 1928 bis 1931 der angewandten Geophysik. Wir betrachten folgende Meßwerte:
Kumulierte Anzahl
Logarithmus der Anzahl
Kumulierte Anzahl
der Zeitschriften
der Zeitschriften
der Artikel
1
0,000
93
2
0,301
179
3
0,477
235
4
0,602
283
5
0,699
329
6
0,778
364
9
0,954
429
13
1,114
493
20
1,301
590
30
1,477
689
45
1,653
802
85
1,929
996
108
2,033
1065
157
2,196
1163
326
2,513
1332
Die angewandte Geophysik produziert im Untersuchungszeitraum 1.332 Artikel, die sich auf 326 unterschiedliche Periodika verteilen. (Der Logarithmus zur Basis zehn
5 Data Mining bei externen Informationen
135
von 326 ist 2,513.) Die ergiebigste Zeitschrift druckt 93 Artikel, die zweite 86 usw. In den ersten 20 Zeitschriften sind bereits 590 Artikel erfaßt. Die Darstellung als „Bibliograph" verdichtet die Einzelinformationen zu einer Graphik (siehe Abbildung 5.2).
Abb. 5.2: Bradford-Zipf-Bibliograph der angewandten Geophysik Angewandte Geophysik
Kumulierte Anzahl der Zeitschriften (log.)
Quelle: Bradford 1934; eigene Berechnung
Je nach der Form der Kurve (Gerade, S-Form, J-Form) lassen sich die Spezifika der Wissenschaftsdisziplin und ihrer Zeitschriften auf einem sehr hohen Allgemeinheitsniveau angeben.
Lotkasches Gesetz Das Gesetz von Alfred J. Lotka (1880 - 1949) bespricht die Konzentration von fachlich einschlägigen Autoren in einem Fachgebiet (vgl. Lotka 1926). Gegeben sei eine umfassende Liste der Publikationen zu einer Disziplin, etwa eine Bibliographie oder eine Spezialdatenbank. Ausgezählt werden die Publikationsraten für alle vorkommenden Verfasser. Die Sortierung erfolgt nach Autoren, und zwar absteigend nach der Anzahl ihrer Veröffentlichungen. Zentral ist dabei die jeweilige Anzahl der Autoren, die gleich viele Publikationen vorweisen können, x sei die Anzahl der
136
5 Data Mining bei externen Informationen
Publikationen und y die relative Häufigkeit der Autoren mit x Publikationen. Dann gilt nach Lotka
xn * y = c (Lotkasches Gesetz).
n und c sind Konstanten, die je nach Fachgebiet unterschiedlich ausfallen, in der Regel ist n jedoch ungefähr gleich zwei. In einer neueren Untersuchung (vgl. Keenan 1988) zeigen sich für die Jahrgänge 1946 bis 1980 des „Journal of Finance" folgende Autorenzahlen: •
je 1 Artikel schreiben 1.237 Autoren (das sind 67,1% aller „Journal of Finance"Autoren)
•
je 2 Artikel verfassen 295 Autoren (16,0%)
•
je 3 Artikel stammen von 140 Autoren (7,6%)
•
je 4 Artikel produzieren 63 Wissenschaftler (3,4%)
•
je 5 Artikel entstammen der Feder von nur 41 Autoren (2,2%).
Wir nehmen der Einfachheit halber an, daß n = 2 gilt. Durch Einsetzen in die Formel von Lotka erhalten wir: •
l 2 * 0,671
=0,671
•
2 2 * 0,160
= 0,640
•
3 2 * 0,076
= 0,684
•
42 * 0,034
= 0,544
•
5 2 * 0,022
= 0,550.
Die Konstante c für das „Journal of Finance" ist demnach etwa 0,6.
Garfieldsches Gesetz Eugene Garfield ist der Entwickler der wissenschaftlichen Zitationsindices („Science Citation Index"). Ausgangsmaterial für Garfield sind die Zitationen aus den Quellen-
137
5 Data Mining bei externen Informationen
Zeitschriften der Reihen des Science Citation Index'. Jeder zitierten Zeitschrift wird die betreffende Zitationsrate zugeordnet, und die Zeitschriften werden absteigend nach ihren Zitationsraten sortiert. Wir erhalten im Garfieldschen Gesetz eine analoge Konzentration wie beim Bradford-Zipf-Bibliographen. 75% aller wissenschaftlichen Zitationen entfallen auf knapp 1.000 Zeitschriften, 84% auf ca. 2.000 Periodika (vgl. Garfield 1977; Garfield 1979,23). Als praktische Konsequenz aus diesem Gesetz gilt der Ausbau der Zitationsdatenbanken. Da es völlig ausgeschlossen ist, die gesamte Wissenschaftsliteratur mit ihren über 100.000 laufend erscheinenden Zeitschriften auszuwerten, konzentriert sich Garfield auf die wenigen Tausend Periodika, die - je Disziplin - am meisten zitiert werden. Die Reihen der Zitationsindices können so ökonomisch arbeiten und ergeben doch ein einigermaßen repräsentatives Abbild der Wissenschaft.
80/20-Regel Eine
für Praxiszwecke
durchaus geeignete
Faustregel, die die
Formel
des
allgemeinen Verteilungsgesetzes erheblich vereinfacht, ist die 80/20-Regel. 80% der Funktion einer Variablen werden von ca. 20% dieser Variablen erreicht. Dieses Fünftel der Variablen beinhaltet die wichtigen Elemente der zu untersuchenden Gesamtmenge. Im Rahmen deskriptiver Informetrie erstellt man ein Ranking, etwa aller Autoren
zu einem
Thema
Patentaktivität
in einem
Technikgebiet.
oder allen In
Unternehmen Ausnutzung
hinsichtlich
der
ihrer
informetrischen
Verteilungsgesetzmäßigkeit kann man sich auf die wenigen (etwa 20%) der Autoren bzw. Unternehmen konzentrieren, die die „Hitparade" anführen. Im Sinne des Data Mining dürften hier die wichtigsten Informationen liegen.
5.2 Rangordnungen Rangordnungen im Dienste des Data Mining Die Suche nach Rangordnungen nutzt das informetrische Gesetz aus. Diese Suche verläuft stets in zwei Schritten. Im ersten Schritt ist diejenige Menge an Datensätzen zu bestimmen, die auszuwerten ist. Suchen wir die patentaktivsten Unternehmen in einem bestimmten Technikfeld, so müssen wir - anhand der Internationalen klassifikation
Patent-
- alle Patente zum Technikfeld suchen. Brauchen wir einen neuen
wissenschaftlichen Mitarbeiter in einem Spezialgebiet, sagen wir: Maschinenbau von
138
5 Data Mining bei externen Informationen
Etikettiermaschinen, so öffnen wir eine einschlägige Maschinenbau-Datenbank und suchen alle Artikel, die Etikettiermaschinen thematisieren. Wollen wir wissen, in welchen Technikfeldern ein Unternehmen überhaupt forschend aktiv ist, so durchsuchen wir eine Patentdatenbank nach dem Unternehmensnamen als Patentanmelder. Die Datensätze werden nun aber nicht ausgegeben, sondern im zweiten Schritt in die gewünschte Rangordnung gebracht. Nehmen wir an, der Rankingbefehl lautet „rank", so sind diesem Befehl lediglich das Feldkürzel anzuhängen, das das Ranking steuert, die Sortierreihenfolge (etwa: absteigend) sowie eine Begrenzung der Anzahl der Angaben (z.B. top 10). In unserem ersten Beispiel (Suche nach patentaktiven Unternehmen; Feldkürzel für Patentanmelder sei PA) lautet demnach die Eingabe
rank pa (absteigend; top 25).
In unserem letzten Beispiel (Suche nach den Technikfeldern eines Unternehmens) wollen wir die IPK.-Notationen sortiert ausgegeben bekommen. Uns interessiert hierbei nicht die Feingliederung bis auf die letzte IPK-Hierarchieebene, sondern nur - als umfassender Überblick - die Darstellung von IPK-Vierstellern. Dies erhalten wir mit einem solchen Befehl (IC ist das Kürzel für das Feld der IPK-Notationen):
rank ic ( 1 -4; absteigend; top 10).
Als Ausgabe erhält man eine Liste, die so aussehen kann: 120
B65C
31
B67C
11
B65G
5
B65B
usw.
Die wichtigsten Technikfelder unseres Unternehmens werden durch die
IPK-
Notationen B65C, B67C und B65G beschrieben, also durch Etikettiermaschinen, Abziehen von Flüssigkeiten sowie Transport- und Lagervorrichtungen.
5 Data Mining bei externen Informationen
139
Je nachdem, wie geschickt man im ersten Schritt vorgegangen ist, erhält man neuartige Informationen, die erst durch unsere Suche entstanden sind, obgleich sie freilich in der Datenbank „schlummerten".
Rangordnungen zur Verfeinerung einer Retrievalstrategie Rangordnungen können - außer zum Data Mining - auch zur Abstimmung einer Retrievalstrategie dienen. Nehmen wir an, wir seien mit einem unbekannten Sachverhalt konfrontiert und finden keinen passenden Deskriptor. Wir geben ohne Feldkürzel, also im Basic Index, Terme ein, die unseren Sachverhalt mehr oder minder gut beschreiben. Die Treflfermenge wird nun nach Deskriptoren geordnet, also
rank de (absteigend; top 5).
An der Spitze dieser Rangordnung stehen diejenigen Deskriptoren, die die Indexer zu den (mehr oder minder gut passenden) Texten vergeben haben. Mit den häufigsten zwei bis drei Deskriptoren müßten wir gut weiterarbeiten können. Die Datenbankanbieter stellen hierbei Nummern zur Verfugung, so daß direkt mit den Nummern der Deskriptoren weitergesucht werden kann.
5.3 Informetrische Zeitreihen Die Fragestellung bei informetrischen Zeitreihen ist: Wie entwickelt sich ein Thema im Laufe der Zeit? Im Gegensatz zu Zeitreihendatenbanken, in denen die Zeitreihen abrufbar gespeichert vorliegen, erstellen wir im Rahmen des Data Mining die gewünschte Zeitreihe aktiv durch das informetrische Retrieval. Zunächst werden alle Datensätze zum Thema selektiert. Ausgegeben wird ausschließlich der Inhalt des Feldes „Jahrgang" mit der zugehörigen Anzahl der Dokumentationseinheiten. Eine sinnvolle Aufbereitung wäre die Darstellung der zeitlichen Entwicklung als Graphik. Konstruieren wir ein Beispiel! Wieviele Patente hat ein Unternehmen in einem gegebenen Technikbereich im Laufe der letzten Jahre angemeldet? Nehmen wir an, durch das Data Mining bei der Methode der Rangordnung sei herausgekommen, daß unser Beispielunternehmen die meisten Patente im Bereich B25C hält. Nun wollen
140
5 Data Mining bei externen Informationen
wir wissen, wann die Forschung und Entwicklung des Unternehmens durch B25C dominiert worden ist. Wir recherchieren in einer umfassenden Patentdatenbank nach der IPK-Stelle B25C (einschließlich aller untergeordneter Klassen) sowie nach dem Namen des Unternehmens als Patentanmelder:
IC=B25C$ UND PA=Untemehmensname.
Das Jahrgangsfeld sei JG. Der Anzeigebefehl bei Questel-Orbit ist GET SHOW. Bei diesem Online-Archiv würden wir demnach
get show JG
als Befehl notieren. Ergebnis ist eine Liste der Jahrgänge unter Zuordnung der Häufigkeit. Durch Einspielen dieser Liste in ein Tabellenkalkulationsprogramm ergibt sich eine Graphik, die wie in Abbildung 5.3 aussehen kann.
Abb. 5.3: Informetrische Zeitreihe Patentanmeldungen
1980
1982
1984
1986
1988
Jahrgang
1990
1992
1994
5 Data Mining bei externen Informationen
141
5.4 Semantische Netze Clusteranalyse beim Data Mining Suchbare Aspekte wie u.a. Autoren, Deskriptoren, Notationen, Zitationen, Wörter in Abstracts oder im Volltext kommen in den Dokumentationseinheiten nicht isoliert voneinander vor, sondern stehen in irgendeiner Beziehung zueinander. Die Methode, solche Beziehungen aufzuspüren, ist die Clusteranalyse, eine sinnvolle Darstellung der Cluster ist die Form der semantischen Netze. Eine (von mehreren möglichen) Berechnungsformeln für Ähnlichkeit zwischen gewissen Items ist der Jaccard-Sneath-Koeffizient. Gezählt wird die Häufigkeit (a) des Auftretens von Item A (etwa einem Deskriptor in einem Datensatz) in einer Datenmenge, die Häufigkeit (b) eines Items B (etwa einem zweiten Deskriptor) in der selben Menge sowie die Häufigkeit (g) des gemeinsamen Auftretens von A und B im selben Datensatz. Der Jaccard-Sneath-Koeffizient von A und B ist:
Ähnlichkeit (A; B) = g / a + b - g.
Abb. 5.4: Semantisches Netz
Optoelektronik
Getränk
Reinigung Abfüllen
LiiKemeren
Verpackung
142
5 Data Mining bei externen Informationen
Die Ähnlichkeit von A und B ist Null, wenn g gleich Null ist; die Ähnlichkeit von A und B ist 1, wenn a gleich b gleich g (wobei g ungleich Null) ist, d.h. wenn A und B stets gemeinsam auftreten. Der Ähnlichkeitkoeffizient wird für alle infragekommenden Paare einer Menge berechnet. Semantische Netze, wie wir sie beim informetrischen Data Mining benutzen wollen, sind ungerichtete Graphen, an deren Knoten Elemente von Datensätzen (Autorennamen, Deskriptoren, Textwörter usw.) und an deren Pfaden Bindungsstärken zwischen den Elementen (wie der Ähnlichkeitskoeffizient von Jaccard und Sneath) abgetragen werden. Bei beiden Aspekten wird mit Schwellenwerten gearbeitet. Es kommen erstens nur solche Datensatzelemente in ein semantisches Netz, die bei der Rangordnung einen zu definierenden Wert überschreiten. Und zweitens werden nur solche Bindungsstärken eingezeichnet, die einen Schwellenwert bei der Ähnlichkeit erreichen. In Abbildung 5.4 haben wir ein semantisches Netz von Forschungsthemen eines (fiktiven) Unternehmens vor uns. Eingezeichnet sind die Top acht der Deskriptoren, die in einer einschlägigen Datenbank zu den dokumentarischen Bezugseinheiten der Literatur dieses Unternehmens vergeben worden sind. Die Wichtigkeit der Deskriptoren ist durch die Schriftstärke ausgedrückt. Die acht Deskriptoren bilden drei thematische Cluster: •
Bier - Getränk - Abfüllen
•
Flasche - Optoelektronik - Reinigung - Verpackung
•
Flasche - Etikettieren.
Die Größe des Jaccard-Sneath-Koeffizienten ist durch die Strichstärke angedeutet. Beim Data Mining zeigt uns die Clusteranalyse - insbesondere bei großen und deshalb ggf. unübersichtlichen Mengen - eine Strukturierung von Informationen. Hat ein Unternehmen beispielsweise mehrere Forschungsschwerpunkte, so dürften diese im semantischen Netz deutlich aufscheinen.
Semantische Netze als Einengung von Suchfragen Clusteranalyse bzw. semantische Netze haben eine nicht zu unterschätzende Bedeutung beim Information Retrieval. Gesetzt den Fall, wir erhalten bei einer Recherche eine viel zu große Treffermenge, die als Ganzes nicht auswertbar ist. Über das semantische Netz erfahrt die Rechercheur, daß unterschiedliche Teilmengen existie-
5 Data Mining bei externen Informationen
143
ren (unter der Voraussetzung, daß es sie tatsächlich gibt, was nicht immer der Fall ist), so kann er seine Suche darauf abstimmen.
Es sind zwei Strategien möglich. Zum einen kann man positiv zu einem bestimmten Cluster weitersuchen. In unserem Beispiel aus Abbildung 5.5 möge man etwa nur am Aspekt Bier - Getränk - Abfüllen interessiert sein. Man engt seine Suche - unter Vernachlässigung aller anderen Themen - auf dieses eine Thema ein. Die zweite Strategie arbeitet negativ, indem gewisse Cluster ausgeschlossen werden. Gesucht wird nunmehr gezielt unter Ausschluß dieser Cluster. Beide Strategien garantieren, daß die Treffermenge reduziert wird. Die Retrievalsoftware zur Clusteranalyse bzw. zu semantischen Netzen ist sowohl bei den kommerziellen Online-Archiven als auch bei den freien Suchmaschinen im World Wide Web nur wenig verbreitet.
5.5 Informationsflußgraphen Unternehmen und ihre Informationsflüsse Analysen von Informationsflüssen beantworten Fragen der Art: Fließen Informationen von A nach B? Informationsflüsse können dann nachgezeichnet werden, wenn über sie berichtet wird. In systematischer Form haben sich drei Arten solcher Berichtssysteme etabliert: •
in der wissenschaftlich-technischen Literatur
•
in der Patentliteratur
•
bei Urteilen.
In der Regel berichten Zitationen (Fußnoten, Literaturverzeichnisse o.ä.) über Informationsflüsse. Ein wissenschaftlicher Artikel, ein Patent oder ein Gerichtsurteil deutet in einer Zitation an, woher gewisse Informationen stammen. Insofern Datenbanken Zitationen nachweisen, können Informationsflüsse im Retrieval rekonstruiert werden. Für alle drei Berichtssysteme existieren (mehr oder minder ausfuhrliche) Datensammlungen über Zitationen. Im Wissenschaftsbereich sind die Reihen des „Science Citation Index" zu nennen, im Technikbereich diverse Patentdatenbanken sowie im juristischen Bereich Datenbanken mit (Grundsatz-)Urteilen.
144
5 Data Mining bei externen Informationen
Im Gegensatz zu den oben beschriebenen semantischen Netzen sind Informationsflußdarstellungen gerichtete Graphen, wobei der Pfad die Richtung der Informationsübermittlung von Sender zum Empfänger anzeigt. Die Tatsache der Informationsübermittlung wird am Vorkommen der entsprechenden Zitation festgemacht. Dies bedeutet, daß der Empfänger über die erfolgreiche Informationsübermittlung an ihn selbst innerhalb einer Fußnote berichtet. In der Patentliteratur kann zusätzlich der Prüfer beim Patentamt eine entsprechende Zitation initiieren. Alle anderen Fälle von Informationsübermittlungen sind informetrisch nicht zu erfassen.
Abb. 5.5: Informationsinput und -Output eines Unternehmens
Input an Informationen
°utPut
an
Informationen
In Abbildung 5.5 betrachten wir die Stellung eines Unternehmens im Informationsfluß. Den Input an Informationen erhalten wir, wenn wir die wissenschaftlich-technische Literatur sowie die Patente des Unternehmens nach Zitationen durchsehen. Hiemach fließen Informationen aus Patenten oder anderer Literatur aus den Unternehmen A bis E an unser Unternehmen. Im Gegenzug bedienen sich auch andere Firmen der Forschungs- und Entwicklungsergebnisse des Unternehmens. Der Output fließt nach A (hier gibt es also ein Geben und Nehmen) sowie nach F bis I.
5 Data Mining bei externen Informationen
145
Informationsflußgraphen zeigen deutlich die Stellung eines Unternehmens (oder auch eines einzelnen Forschers) im wissenschaftlich-technischen Informationsfluß. Wenig Informationsinput, aber viel Output deuten auf die Rolle eines Technologiefiihrers hin; umgekehrt wenig Output bei viel Input auf einen Nachahmer.
Retrieval bei Zitationsdatenbanken Neben der Bedeutung der Informationsflußanalysen für das Data Mining gibt es auch hier eine Funktion für das „normale" Information Retrieval, gibt es doch spezielle Retrievalstrategien, die an Zitationsdatenbanken durchfuhrbar sind: •
Informationsflüsse „nach hinten"
•
Informationsflüsse „nach vorne"
•
Vergleich von Zitationsapparaten.
Voraussetzung fiir das erfolgreiche Retrieval bei Zitationsdatenbanken ist ein Ausgangsdokument, das für ein Informationsproblem einschlägig ist. Die Informationsflüsse „nach hinten" zu verfolgen, heißt, alle zitierte Literatur zu suchen. Dies ist kein großes Problem, das auch ohne elektronisches Retrieval möglich wäre. Ganz anders ist dies bei Suchen „nach vorne". Hier recherchieren wir alle die Artikel, Patente usw., die unser Ausgangsdokument zitieren. Solch ein Retrieval ist ausschließlich bei Zitationsdatenbanken durchfuhrbar. Auch die nächste Form ist exklusiv bei Zitationsdatensammlungen möglich. Hier geht es um den Vergleich von Zitationen in unterschiedlichen Datensätzen. Wir suchen nach Dokumentationseinheiten, die möglichst viele Zitationen mit dem Ausgangsdokument gemeinsam haben. Alle Retrievalstrategien der Zitationsdatenbanken ergänzen andere Retrievalformen und finden Datensätze, die ansonsten mit keiner anderen Strategie gefunden werden können.
Fazit •
Data Mining bei externen Informationen verwendet Ergebnisse und Methoden der Informetrie. Informetrie kennzeichnet gewisse Datenmengen als Ganzes und verläßt damit die Ebene der Einzelinformationen. Kreiert werden die informetrischen Daten im Retrievalprozeß selber, d.h. die gefundenen Daten „schlummern" zwar in den Datenbanken, sind aber nie explizit in sie eingegeben worden.
146 •
5 Data Mining bei externen Informationen Informetrische Verteilungen folgen einem Konzentrationsgesetz mit einer typi-
schen linksschiefen Verteilung. Das informetrische Gesetz liegt neben einer allgemeinen Form in mehreren spezifischen Varianten vor (Gesetze von Zipf, Bradford, Lotka und Garfield). •
Informetrische Rangordnungen wenden die Kenntnisse des Verteilungsgesetzes an. Nur wenige zentrale Items einer Verteilung charakterisieren die gesamte Verteilung, so daß man sich bei entsprechenden Analysen auf diese beschränken kann.
•
Informetrische Zeitreihen sortieren gewisse Aspekte (etwa Patente) nach der Zeit und zeigen die Ausprägung des Aspektes im Zeitverlauf.
•
Semantische Netze zeigen Zusammenhänge zwischen Items auf. Ausgenutzt werden hierbei Methoden der Clusteranalyse.
•
Informationsflüsse (zwischen Unternehmen, Wissenschaftlern usw.) werden anhand von Zitationsanalysen in Informationsflußgraphen ausgewertet. Sie zeigen bei Unternehmen deren Stellung in der Technologiefiihrerschaft.
•
Die meisten informetrischen Methoden können neben ihrem Einsatz beim Data Mining auch beim „normalen" Information Retrieval als spezielle informetrische Strategien eingesetzt werden.
6 Automatische Indexierung
Ein optimales Retrievalergebnis läge sowohl im Recall und in der Précision bei jeweils 100%. Bei Fakteninformationen ist dies „drin", bei Literaturinformationen liegt der Wert darunter. Schätzwert ist, daß die Summe von Recall und Précision 100 kaum Ubersteigt. Angesichts dieses Zusammenhangs zwischen Recall und Précision beim problemorientierten Informationsbedarf (POIN) wird das Optimalergebnis in der Abbildung 6.1 als der kaum erreichbare „heilige Gral" der Rechercheure eingezeichnet.
Abb. 6.1: Recall und Précision im Booleschen Retrieval und bei der natürlichsprachigen Suche nach Literaturinformationen
100
Der "heilige
R e c
a
100 P
r
ä
z
i
s
i
o
n
Quelle: Evans 1994, 124
Die beiden Booleschen Operatoren UND und ODER werden zwecks Orientierung am „heiligen Gral" verfeinert. Der erste Weg geht vom UND aus und verstärkt es
148
6 Automatische Indexierung
zu Abstandsoperatoren. Der zweite Weg fuhrt uns zu den natürlichsprachigen Suchen, die zu großen Teilen eine Variation des Booleschen ODER darstellen. Vertreter natürlichsprachiger Suchen wie Ross Evans behaupten nun, daß - zusätzlich zu im Booleschen Retrieval entdeckten Literaturstellen - weitere relevante Treffer gefunden werden, daß wir uns also mit natürlichsprachigem Retrieval dem „heiligen Gral" in der Tat ein Stück nähern. Wir wollen uns einen Überblick darüber verschaffen, mit welchen Mitteln natürlichsprachige Systeme arbeiten. Allen Systemen gemein ist die Annahme, daß das System zur automatischen Erschließung elektronisch vorliegender Informationsinhalte und zur Erschließung der Suchanfragen mindestens so gut geeignet ist wie intellektuelle Indexierung. Ziel ist es, solche Informationsinhalte zu finden, die der Suchanfrage möglichst ähnlich sind. Angesichts der Tatsache, daß diverse Datenbanken so schnell wachsen, daß eine intellektuelle Auswertung allein aus Massengründen kaum noch möglich ist (Presseagenturdatenbanken wachsen beispielsweise um viele tausend Volltexte täglich), wird die automatische Indexierung in der Informationswirtschaft zunehmend wichtig. Die meisten Systeme automatischer Indexierung arbeiten mit der englischen Sprache. Wir werden zunächst diese Systeme besprechen, um anschließend auf Besonderheiten einzugehen, die die - weitaus kompliziertere - deutsche Sprache kennzeichnen.
Die theoretischen Grundlagen automatischer Inhaltserschließung lassen sich in drei Aspekte einteilen, die allein oder in Kombinationen in konkreten Systemen eingesetzt werden: •
linguistische Aspekte (Stoppwörter, Wortstammanalysen, Phrasenerkennung, Synonyme, Pronomina-Analysen, fehlertolerante Suchfragebearbeitung)
•
statistische Aspekte (Worthäufigkeiten, Rangordnungsalgorithmen)
•
ordnungstheoretische Aspekte (Deskriptor-, Notations- bzw. Schlagwortvergabe).
6 Automatische Indexierung
149
6.1 Informationslinguistik Informationslinguistische Methoden, die derzeit in Retrievalsystemen Einsatz finden, haben vorwiegend die Aufgabe, die Bildung von Sucheinstiegen in einen Text vorzubereiten. Es geht darum, nicht sinntragende Wörter zu eliminieren, grammatische Flexionsformen auf eine Grundform zu bringen, aus mehreren Termen bestehende Phrasen zu erkennen sowie Pronomina den jeweiligen Nomen zuzuordnen.
Abb. 6.2: Stoppwortliste (Ausschnitt) a
amongst
becomes
about
an
becoming
across
and
been
after
another
before
afterwards
any
beforehand
again
anyhow
behind
against
anyone
being
all
anything
below
almost
anywhere
beside
alone
are
besides
along
around
between
already
as
beyond
also
at
both
althought
be
but
always
became
by
among
because
can
become Quelle: Salton/McGill 1987, 77
6 Automatische Indexierung
150
Triviale Voraussetzung aller weiterer Schritte ist die Isolation einzelner Wörter bzw. von Zeichenfolgen mit n Elementen. Die erste Variante arbeitet mit Wörtern, d.h. Zeichenfolgen, die zwischen zwei Leerzeichen, Satzzeichen o.ä. stehen. Die zweite Variante zerlegt Zeichenfolgen in sog. „N-Gramme", etwa Tupel zu jeweils fünf Zeichen. Am Beispiel von „Widerspruchsfreiheitsbeweis" soll eine solche Zerlegung in Pentagramme verdeutlicht werden (vgl. Henrichs 1975, 229): Wider iders dersp erspr rspru spruc pruch ruchs uchsf chsfr hsfre sfrei freih reihe eihei iheit heits eitsb itsbe tsbew sbewe bewei eweis
6 Automatische Indexierung
151
Viele Tupel sind für das Retrieval irrelevant. So wird etwa niemand nach „tsbew..." fragen, so daß die irrelevanten Zeichenfolgen auch nicht störend sind. Zum Großteil sind die Pentagramme nützlich. Eine Suche nach „Freiheit" findet durch das Pentagramm „freih" unseren „Widerspruchsfreiheitsbeweis" ebenso wie eine Suche nach „Beweis" fundig würde. Allerdings ist dieses Verfahren auch fehleranfallig, wird doch auch „Widerspruchsfreiheitsbeweis" bei der Eingabe von „Reihe" gefunden, eine eindeutige semantische Falle.
Elimination von Stoppwörtern Während mengentheoretisch vorgehende Retrievalsysteme mit rund zehn Stoppwörtern auskommen („the", „a", „an", „but" usw.), erhöhen natürlichsprachige Systeme deren Anzahl auf bis zu 500 (für einen Ausschnitt siehe Abbildung 6.2). Eingeschlossen sind Wörter, von denen erwartet wird, daß sie normalerweise keine eigenständigen thematischen Passagen ausdrücken. Beispiele sind „meanwhile", „nevertheless" oder „myself'. Problematisch ist die oftmals durchgeführte Elimination von Pronomina, kommt es doch so zu Verzerrungen bei informationsstatistischen Auszählungen. Pronomina sollten zunächst markiert und für informationsstatistische Zählungen verwendet werden, erst danach sind sie für die Suche zu eliminieren. (Wir werden bei den Pronomina-Analysen hierauf zurückkommen.) Stoppwortkombinationen sind nicht zu eliminieren, sondern müssen als Phrase suchbar bleiben. Die Terme „be", „not", or" und „to" sind jeweils Stoppwörter und damit einzeln nicht suchbar. Die Phrase „to be or not to be" dagegen ist - wenn sie als Phrase (in der Regel durch Anführungszeichen) gekennzeichnet ist - durchaus abfragbar.
Wortstammanalysen Grammatikalische Flexionsformen werden auf deren Wortstamm reduziert. In der englischen Sprache reicht es in der Regel aus, bei Beachtung einiger Regeln die Endungen (über eine vorgegebene Suffixliste) zu tilgen. Einen Ausschnitt aus einer Suffixliste zeigt am Beipiel des Anfangsbuchstabens E die Abbildung 6.3. Die Imperfekt-Endung ,,-ed" wird beispielsweise getilgt. Wenn im Text
152
6 Automatische Indexierung ... listened ...
vorkommt, wird als abfragbare Stammform
... listen...
notiert. Zu den Suffixlisten treten gewisse Regeln. Ist z.B. ,,-ing" in der Liste enthalten, wird das Wort „ringing" auf den Stamm „ring" reduziert, aber durch eine an der Länge orientierten Regel nicht auf „r". Alle Varianten eines Wortstammes gelten dabei als dasselbe Wort.
Abb. 6.3: Suffixliste (Ausschnitt: Anfangsbuchstabe E) e
em
ently
est
eable
ence
entum
et
eal
ency
eous
eta
ectual
eness
er
etion
ed
ening
ered
etic
edly
ent
erer
etic
edness
entia
eress
etum
ee
entiae
erial
ety
eer
ential
ery
eur
el
entialness
es
euse
ely
entiate
escent
ement
entiation
ess
Quelle: Frants/Shapiro/Voiskunskii 1997, 145
153
6 Automatische Indexierung Phrasenerkennung
Eine Phrase ist ein Ausdruck, der aus mehreren einzelnen Wörtern besteht. Hier gilt nicht das einzelne Wort (oder dessen Wortstamm) als Schlagwort, sondern die Phrase als Ganzes. Das System muß beispielsweise in der Lage sein, „Information Retrieval", den Körperschaftsnamen „Fachhochschule Köln" oder den Eigennamen „Wolfgang Clement" als eine Einheit zu erkennen. Dies geschieht durch zwei Methoden: •
durch den Abgleich mit Listen
•
durch eine Analyse gemeinsamen Auftretens in den Dokumenten.
Die Listen können die Phrasen bereits enthalten (der Eintrag „Wolfgang Clement" liegt also vor), oder die Listen enthalten sogenannte „Indikatorbegriffe", die auf Phrasen hinweisen. Mit solchen Indikatorbegriffen lassen sich neue Phrasen aufspüren. Abb. 6.4: Indikatorbegriffe (Beispiele) Indikatorbegriffe für Unternehmensnamen Bros
Co
Inc
Bros.
Co.
Inc.
Brothers
Company
Incorp
Chartered
Corp
Incorp.
Chtd
Corp.
Incorporated
Chtd.
Corporation
Ltd.
Indikatorbegriffe fur Namen von Organisationen Agency
Bureau
College
Army
Center
Commission
Assembly
Church
Committee
Association
Clinic
Community
Board
Club
Congress
Quelle: Lu/Miller/Wassum 1998
154
6 Automatische Indexierung
Abbildung 6.4 zeigt einige Indikatorbegriffe für Körperschaftsnamen. Indikatorbegriffe für Personennamen sind Vornamen. So hat sich z.B. Lexis-Nexis
eine
mehrere hundert Vornamen umfassende Liste im Rahmen eines Patentes für Phrasenerkennung (vgl. Lu/Miller/Wassum 1998) schützen lassen. Der Umgang mit den Indikatorlisten wird durch Regeln gewährleistet. Grundregel für den Eintrag einer Phrase in ein Wörterbuch ist ein mehrmaliges Vorkommen von Wortkombinationen in Texten. Hierzu ist ein Schwellenwert zu definieren, ab dem eine identifizierte Kombination als Phrase geführt wird. Für die Identifikation der Phrasen gelten - j e nach Indikatorliste - unterschiedliche Regeln. Phrasen von Personennamen werden erkannt, indem ein Eintrag aus der Indikatorliste (also ein Vorname) mit dem nächsten Wort bzw., falls dieses Buchstabe und Punkt ist, mit dem nächsten und übernächsten Wort zusammengefaßt wird.
Die zweite Methode der Phrasenerkennung - neben den Listen - zerlegt den Text in „Textklumpen". Dies ist der hauptsächliche Anspruch des bereits zitierten Patentes von Lexis-Nexis.
Lu, Miller und Wassum nehmen diverse weitere Stoppwörter in
die Stoppwortliste auf, darunter alle Adverbien, alle Hilfsverben sowie weitere Verben. Betrachtet werden die Wörter, die nach Abzug aller Stoppwörter übrigbleiben. Stehen zwischen den zu tilgenden Stoppwörtern Einwortbegriffe, so werden diese außer acht gelassen. Bleiben jedoch mehrere nebeneinanderstehende Wörter übrig, so sind dies Kandidaten für Phrasen. Kommen solche Wortkombinationen häufig vor - auch hier muß ein Schwellenwert festgelegt werden -, so ist eine abfragbare Phrase gefunden worden. Im Text in Abbildung 6.5 sind die zwischen den Stoppwörtern stehenden Terme durch Dickdruck markiert. Die angereicherte Stopp wort liste umfaßt demnach die Terme „what, „is", „newly", „by" usw.
Abb. 6.5: Identifikation von Textklumpen (Beispieltext) Citing what is called newly conciliatory comments by the leader of the Irish Republican Army's political wing, the Clinton Administration announced today that it would issue him a visa to attend a conference on Northern Ireland in Manhattan on Tuesday. Quelle: Lu/Miller/Wassum 1998
155
6 Automatische Indexierung
Einwort-Textklumpen wie „citing", „called", leader" usw. sind für die Zwecke der Phrasenbildung irrelevant und werden übergangen. Die gesuchten MehrwortTextklumpen sind:
conciliatory comments Irish Republican Army political wing Clinton Administration Northern Ireland.
Bestätigt sich die Existenz dieser Phrasen durch mehrfaches Auftreten in diesem oder in einem anderen Text, so werden sie in das Phrasenwörterbuch aufgenommen. Identifiziert werden durch das Verfahren der Textklumpen Phrasen folgender Typen: •
Substantiv-Phrasen (beispielsweise „ice cream")
•
Adjektiv-Substantiv-Phrasen („high school")
•
Partizip-Substantiv-Phrasen („operating system")
•
Eigennamen („White House").
Neben den beiden besprochenen Verfahren der Indikatorbegriffe und der Textklumpen gibt es weitere Ansätze, Phrasen zu identifizieren. Betrachten wir den Satz:
Der Kaffee wurde soeben frisch in der Maschine geröstet.
In diesem Satz „versteckt" sich die Phrase „frischer Röstkaffee". Um Phrasen dieser Art zu erkennen, reicht es nicht hin, mit den skizzierten Methoden zu arbeiten. Hier ist es nötig, die grammatische Struktur des Satzes zu analysieren. In der Informationswirtschaft derzeit eingesetzte Systeme sind allerdings nicht in der Lage, dermaßen aufwendig zu arbeiten.
156
6 Automatische Indexierung
Synonyme Wörter sind synonym, wenn ihre unterschiedlichen Bezeichnungen jeweils denselben Begriff bedeuten. So sind beispielsweise die Wörter „Samstag" und „Sonnabend" synonym. Ein Nutzer einer Volltextdatenbank, der mit dem Term „Samstag" sucht, sollte auch diejenigen Textstellen finden, in denen von „Sonnabend" die Rede ist. Synonyme kommen in mehreren Formen vor: •
Flexionsformen (alle grammatischen Flexionen eines Wortstammes sind synonym)
•
Schreibvarianten eines Wortes (zum Beispiel britisches und amerikanisches Englisch; „aluminium" und „aluminum" sind synonym)
•
Varianten in unterschiedlichen Zeichensystemen (etwa bei Zahlwörtern und Ziffern; „ten" und „10" sind synonym)
•
Abkürzungen und ihre Vollformen sind synonym (beispielsweise „N.J.", „NJ" und „New Jersey")
•
„echte" Synonyme (wie „Samstag" - „Sonnabend").
Zentral ist die letztgenannte Form. Systeme automatischer Indexierung greifen hierbei auf Thesauri (in beiden Wortbedeutungen) zurück: •
Thesaurus im Sinne der Sprachwissenschaft (als Synonymwörterbuch)
•
Thesaurus im Sinne der Dokumentation (als Dokumentationssprache).
Beim Thesaurus im Sinne der Sprachwissenschaft benutzt man entweder allgemeine oder fachspezifische Synonymwörterbücher. Einsatz bei Lexis-Nexis finden z.B. „The Legal Thesaurus" von William C. Burton
sowie Merriam
Webster's
„Collegiate Thesaurus". Ein Thesaurus im Sinne der Dokumentation enthält die Synonymie in der NichtDeskriptor-Deskriptor-Relation. Für den Einsatz im Rahmen der automatischen Indexierung muß diese Relation besonders gut ausgebaut worden sein. Auch diese Art Thesaurus wird eingesetzt; das Online-Archiv Profound arbeitet mit seinem „Infosort"-Thesaurus bei der automatischen Indexierung.
6 Automatische Indexierung
157
Pronomina-Analysen Die sinntragenden Wortstämme sowie die Phrasen werden, wie wir gleich sehen werden, als Zählbasis für statistische Berechnungen verwendet. Es ist demnach die Markierung jedes Vorkommens in einem Text nötig. Pronomina, die an die Stelle ihrer Nomen rücken, müssen dabei entsprechend beachtet werden. Betrachten wir den Satz:
„The president has a girl friend, but he doesn't love her",
so muß das „he" dem Wort „president" und „her" der Phrase „girl friend" zugeordnet werden. Die Auftretenshäufigkeit von „president" und von „girl friend" im Beispielsatz ist demnach jeweils gleich zwei. So wichtig Pronomina-Analysen für die Informationslinguistik und -statistik auch sein mögen, sie werden derzeit nur in experimentellen Systemen behandelt. Kommerzielle Software setzt sie zur Zeit nicht ein.
Fehlertolerante Behandlung von Suchfragen Suchfragen können Schreibfehler beinhalten. Beobachtungen bei einem elektronischen Katalog ergaben, daß 8 bis 12% sachlicher Suchen Tippfehler oder orthographische Fehler enthalten (vgl. Walker/Jones 1987, 15). Retrievalsysteme müssen deshalb in der Lage sein, mit Fehlern seitens der Benutzer fertig zu werden. Wir wollen einen Algorithmus beschreiben, der seine Basis in der Phonetik hat (vgl. Jacobs 1982) und der bei einem Projekt („Okapi") ausgearbeitet wurde sowie im Rahmen dieses Projektes bei einem Online-Katalog erfolgreich eingesetzt werden konnte (vgl. Walker/Jones 1987). Es handelt sich hierbei um das sogenannte „Soundex"-Verfahren. Alle in der Datenbank enthaltenen Worte werden auf ihren Soundex-Code reduziert. Der Algorithmus ist in Abbildung 6.6 angegeben. Gibt ein Nutzer ein Wort ein, daß nicht in der Datenbank vorhanden ist, so könnte dies ein Eingabefehler sein. In diesem Fällen geschieht ein Abgleich der Soundex-Form unseres unbekannten Eingabewortes mit der Liste der Soundex-Codes. In der Datenbank sei z.B. das Wort „economics" enthalten; ein Nutzer gibt jedoch „ecomonic" ein.
158
6 Automatische Indexierung economics - Soundex-Code: ECMMS ecomonic - Soundex-Code: ECMMS.
Abb. 6.6: Soundex-Algorithmus Beispielwort: economics (1)
der erste Buchstabe des Wortes bleibt erhalten economics
E
(2)
falls der zweite Buchstabe identisch mit dem ersten ist, Ubergehe ihn
(3)
falls zwei aufeinanderfolgende Buchstaben im Ausgangswort identisch sind, übergehe den jeweils zweiten
(4)
falls zwei aufeinanderfolgende Buchstaben im entstehenden Codewort identisch sind, notiere beide
(5)
Ubergehe die Buchstaben AEIOUYWH economics
(6)
Ecnmcs
falls ein Buchstabe CGJKQSXZ ist, notiere C economics
(7)
falls ein Buchstabe BFPV ist, notiere B
(8)
falls ein Buchstabe DT ist, notiere D
(9)
falls ein Buchstabe MN ist, notiere M economics
(10)
die Buchstaben L und R bleiben erhalten
(11)
falls der letzte Buchstabe AIOUY, notiere Y
ECnmC
ECMMC
Quelle: Walker/Jones 1987, 151
Da die Soundex-Codes übereinstimmen, ist die Fehleridentifikation abgeschlossen. Nun muß ein Code einen anderen Code jedoch nicht zeichengenau treffen, sondern nur mehr oder minder mit diesem übereinstimmen. Nehmen wir hierzu an, unser Nutzer gibt
6 Automatische Indexierung
159
econmic - Soundex-Code: ECMS
ein. Das Soundex-System sucht in diesem Fall nach dem nächstpassenden Eintrag und findet auch hier ECMMS. Es ist durchaus möglich, daß eine Suche kein eindeutiges Ergebnis hat, sondern mehrere Kandidaten ausgibt. Die Fehlerkorrektur geschieht demnach nicht automatisch, sondern in Rückkopplung mit dem Nutzer. Das Projekt Okapi verwendet folgenden Korrekturdialog:
Can't find ECONMIC - closest match found is ECONOMICS [GREEN KEY] to use ECONOMICS instead [BLUE KEY] to type a different word.
Leider werden fehlertolerante Systeme sowohl in der Welt der kommerziellen Informationswirtschaft als auch im Raum des freien World Wide Web noch viel zu selten eingesetzt.
6.2 Informationsstatistik Informationsstatistik zählt Wörter sowie Datensätze und setzt die ausgezählten Werte in bestimmte Relationen. Was jeweils als ein Wort gilt, hängt vom Umfang der eingesetzten informationslinguistischen Methoden ab. Ein Wort kann deshalb durchaus völlig Unterschiedliches bedeuten: •
(1) jedes vorkommende Wort
•
(2) Wortstamm einzelner Wörter
•
(3) wie (2), zusätzlich Phrasen (in Stammform)
•
(4) wie (3), zusätzlich Zählung der zugehörigen Pronomina.
So gibt es zum Teil riesige Unterschiede, ob alle Flexionsformen einzeln gezählt werden, ob nur die Wortstämme oder ob Wortstämme und zugehörige Pronomina gezählt werden. Je elaborierter die informationslinguistischen Verfahren arbeiten, desto bessere Resultate wird auch die Informationsstatistik erbringen. Hauptziel
160
6 Automatische Indexierung
der Informationsstatistik sind Algorithmen der Rangordnung von Datensätzen nach Relevanz („relevance ranking"). W e n n wir im Folgenden von „Wort" sprechen, so meinen wir eine der Varianten (1) bis (4) aus obiger Aufzählung. Die Primitivvariante (1) k o m m t nur selten in bestehenden Systemen vor; es dominieren derzeit die Varianten (2) und (3); Variante (4) gibt es nur in experimentellen U m g e b u n g e n .
E i n f a c h e Z ä h l u n g e n von Worthäufigkeiten Alle Wörter in einem Text und - als S u m m e über die Texte - alle Wörter in einer Datenbasis werden gezählt. Hierbei wird j e d e m Wort eines Textes dessen Häufigkeit im Text zugeordnet. Z u d e m wird ausgezählt, in wievielen Texten das entsprechende Wort überhaupt vorkommt. Die so ermittelten Summen sind die Rohwerte f ü r alle weiteren Berechnungen.
W i r wollen als Bezeichnungen für die Grundwerte folgende Verabredungen treffen: •
die Anzahl der Wörter eines Datensatzes sei L
•
die Anzahl der Datensätze, in denen ein bestimmtes Wort (mindestens einmal) vorkommt, sei n
•
die Gesamtanzahl der Datensätze in einer Datenbank sei N.
Einige Systeme arbeiten auf der Basis der Anzahl n der Dokumente, in denen ein W o r t vorkommt, mit einem Schwellenwert. Ab einem gewissen Wert werden die H o c h f r e q u e n z b e g r i f f e für Retrievalzwecke eliminiert, da sie fiir die Suche nicht genügend trennscharf sind. Hochfrequenzwörter verhalten sich dann analog zu S t o p p Wörtern. Eine solche Elimination von häufig v o r k o m m e n d e n Termen ist bedenklich. N e h men wir an, wir hätten eine Rechtsdatenbank vor uns. Das Wort „Recht" ist hier sicherlich ein Hochfrequenzbegriff. Behandeln wir „Recht" wie ein Stoppwort, so werden eigentlich sinnvolle Suchen, etwa nach
6 Automatische Indexierung
161
Recht und Internet,
nicht mehr durchführbar.
Dokumentspezifische Wortgewichtung Eine einfache Zählung der Worthäufigkeit in einem Dokument eignet sich nicht für informationsstatistische Zwecke, da längere Texte methodisch bevorzugt würden. Vielmehr arbeitet man mit der relativen Häufigkeit von Textwörtem, d.h. mit dem Quotienten aus der Häufigkeit des Wortes und der Gesamtmenge der Wörter im Text. In der Berechnungsformel von Donna Harman wird mit Logarithmen zur Basis zwei (logarithmus dualis; ld) gearbeitet (vgl. Harman 1986). i sei ein Wort im Text j. Freq(i,j) gibt die Häufigkeit von i in j an. Das dokumentspezifische Wortgewicht (within-document frequency weight) WDF errechnet sich nach der Formel
WDF (i) = (ld [Freq(ij) + 1] / ld L.
WDF wird umso größer, je häufiger ein Wort i in einem Datensatz vorkommt. Verdeutlichen wir die Formel durch ein Beispiel! Ein Text J habe 1.024 Wörter, das Wort A kommt darin 7mal vor. L ist also 1.024, Freq(A,J) ist 7. Die dokumentspezifische Wortgewichtung von A in J ist
WDF (A) = (ld [7+1])/ld 1024 = 3/10 = 0,3.
Ein anderes Wort B kommt im selben Text J 31 mal vor. WDF von B ist
WDF (B) = (ld [31 + 1]) / ld 1024
162
6 Automatische Indexierung = 5/10 = 0,5.
Durch die logarithmische Berechnungsbasis werden die WDF-Werte nicht so weit auseinandergezogen wie etwa bei der Berechnung der relativen Häufigkeit der absoluten Zahlenwerte.
Gewichtung nach Position im Text Die dokumentspezifische Wortgewichtung wird verfeinert, indem die Stellung in Textteilen Berücksichtigung findet. So kann ein Text in mehrere Teile zerlegt werden. Wenn man annimmt, daß Terme am Textanfang wichtiger sind als solche in der Mitte, so wird dies durch geeignete Gewichtungsfaktoren berücksichtigt. Ein Vorkommen im ersten Teil kann etwa mit 1,5 bewertet werden, ein Vorkommen in einem mittleren Abschnitt mit 0,8 usw. Eine Variante dieses Verfahrens arbeitet mit den dokumentarischen Beschreibungen der Texte. Die Termgewichtung orientiert sich hier am Auftreten in bestimmten Feldern. Ein Vorkommen im Sachtitel wird z.B. höher gewichtet als ein Vorkommen im Abstract. Kommt ein Wort mehr als einmal in einem Texte vor, so kann man die durchschnittliche Positionierung durch das arithmetische Mittel der einzelnen Gewichtungswerte bestimmen.
Inverse Dokumenthäufigkeit Während ein Textwort im Kontext eines Textes um so wichtiger ist, je häufiger es vorkommt, gilt in Beziehung zur Gesamtdatenbank die umgekehrte Proportion. Ein Wort ist demnach um so wichtiger, je weniger Dokumente dazu in der Datenbank vorhanden sind. Um die Spannweite der Gewichtungswerte nicht allzu groß werden zu lassen, arbeitet man auch bei der Berechnung der inversen Dokumenthäufigkeit mit logarithmischen Werten. Die klassische Berechnungsformel lautet (vgl. Sparck Jones 1972): IDF(i) = (log 2 N / n) + 1, wobei IDF(i) die inverse Dokumenthäufigkeit des Wortes i, N die Gesamtanzahl der Datensätze in der Datenbank und n die Anzahl der Datensätze, in denen i vorkommt, ist. Der Wert des IDF ist - für jedes Wort - in ständiger Bewegung, insofern die Datenbank wächst und so auf jedem Fall N ändert. - Auch hier sei ein Beispiel gestattet! Eine Datenbank habe 3.584 Datensätze; das Wort A kommt in
6 Automatische Indexierung
163
sieben Datensätze mindestens einmal vor. Die inverse Dokumenthäufigkeit von A ist:
IDFA
=
(log 2
3.584/7) + 1 =
(log 2
512) + 1 = 9 + 1
=
10.
Wortabstand Wird nach mehr als einem Wort gesucht, ist als Relevanzkriterium für das gesamte Suchargument der Abstand zwischen den einzelnen Suchargumenten interessant. Stehen die einzelnen Wörter enger zusammen (im Idealfall innerhalb eines Satzes), so ist der entsprechende Text wahrscheinlich wichtiger für einen Nutzer als wenn die Suchwörter zwar alle vorkommen, doch bezugsios an unterschiedlichen Textstellen aufscheinen. Der Gewichtungswert für einen Text errechnet sich beispielsweise (andere Varianten sind möglich) aus der Summe der Wörter, die zwischen den einzelnen Suchargumenten stehen. Kommen die Wortpaare mehrfach vor, wird der Durchschnittswert berechnet. Sind mehr als zwei Wortpaare vorhanden, wird das Verfahren für jedes Wortpaar wiederholt und ebenfalls ein arithmetisches Mittel bestimmt. Der Gewichtungswert für den durchschnittlichen Wortabstand gegebener Suchwörter in einem Text ist umso größer, j e kleiner das arithmetische Mittel der Wortabstände ist. Ranking nach Relevanz Für jedes Wort eines Textes ergibt sich durch Multiplikation der dokumentspezifischen Wortgewichtung (mit oder ohne Berücksichtigung der Positionen im Text) mit seiner inversen Dokumenthäufigkeit ein Gewichtungswert. Vernachlässigen wir die Gewichtung der Wortposition, so hat das Wort i in einem Datensatz j folgenden Gewichtungswert: Gewicht (i,j) = WDF (i) * IDF(i). Berücksichtigen wir die Position unseres Wortes im Dokument, so wird der entsprechende (durchschnittliche) Gewichtungswert als weiterer Faktor in der Formel verwendet. Dieser Faktor heiße P. Gewicht' ( i j ) = WDF (i) * IDF(i) * P. Betrachtet man mehrere Wörter, so addieren sich die einzelnen Gewichtungswerte pro Dokument. Diese Summe bildet die Basis für Sortierungen nach Relevanz.
164
6 Automatische Indexierung
Aus der informationslinguistischen Analyse der Suchfrage ergibt sich eine Liste von Suchargumenten. Sie beinhaltet nicht nur die vom Benutzer explizit eingegebenen Terme, sondern - j e nach Software - auch Synonyme. Zum Teil werden auch Wörter, etwa Hochfrequenzbegriffe sowie alle Stoppwörter, weggefallen sein. Eine „rohe" Ergebnismenge sind solche Datensätze, die mit mindestens einem Suchargument übereinstimmen. Für alle Dokumente der „Rohmenge" werden die Gewichtungen der gesuchten Textwörter nach einer der Gewichtungsformeln berechnet. Kommen meherere Suchargumente in einem Text vor, werden die Gewichtungswerte addiert. Hinzu kommt - j e nach eingesetztem System - der Gewichtungsfaktor für den Wortabstand. Im letzten Schritt geschieht eine Sortierung der Datensätze nach der Summe der Gewichtungswerte. Ergänzend anzumerken gilt es informationsstatistische Verfahren, die ausschließlich im World Wide Web anwendbar sind und die auch bei Suchmaschinen bereits Eingang finden. Ein Gewichtungsfaktor ist die „Popularität" eines Links, d.h. ein HTML-Dokument ist umso wichtiger, je häufiger darauf verwiesen wird. Experimentiert wird mit dem Gewichtungsfaktor „Zugriff auf Sites". Hier wird eine WWW-Site umso wichtiger, j e öfter bereits auf sie zugegriffen wurde. - Nach dem Relevance Ranking dürften die der Suchfrage ähnlichsten Texte oben in der Trefferliste stehen.
6.3 Ordnungstheorie Im Rahmen der Anwendung der Ordnungstheorie bei der automatischen Indexierung geht es um die Zuordnung von kontrolliertem Vokabular (Deskriptoren, Notationen) bzw. von Schlagwörtern zu einem Datensatz. Deskriptoren kann man nur dann verwenden, wenn ein Thesaurus vorliegt, Notationen nur im Rahmen eines Klassifikationssystems. Die Schlagwortvergabe arbeitet ausschließlich mit dem in den Texten vorhandenen Termmaterial. Die verschiedenen ordnungstheoretischen Methoden schließen einander nicht aus, können also ggf. gemeinsam eingesetzt werden.
Automatische Deskriptor- oder Notationsvergabe beim Einsatz einer Dokumentationssprache Eine Dokumentationssprache (Thesaurus oder Klassifikationssystem), die zur automatischen Indexierung herangezogen wird, muß über besonders ausgefeilte
6 Automatische Indexierung
165
Synonymie-Relationen verfügen. Nur so kann das textspezifische Vokabular in das Vokabular der hinterlegten Dokumentationssprache übertragen werden. Über eine große Menge an Nicht-Deskriptoren soll erreicht werden, daß möglichst wenig Termmaterial „übersehen" wird. Wie wird methodisch vorgegangen? Vorauszusetzen sind die beiden Stufen der Informationslinguistik und Informationsstatistik, d.h. wir verfugen für jeden Text über eine nach Relevanz geordnete Liste der Textwörter bzw. Phrasen. Die Gewichtungswerte aller dem Text zugeordneten Wörter werden mit einem Schwellenwert verglichen. Für die verbleibenden wichtigsten Terme geschieht ein Abgleich mit der Liste der Deskriptoren und ihrer Synonyme. Ein Deskriptor des verwendeten Thesaurus wird dann zugeteilt, wenn er (bzw. sein Wortstamm) selber oder wenn einer seiner Synonyme vorkommt. Analog kann bei Klassifikationen vorgegangen werden. Hierbei werden Notationen dann vergeben, wenn die entsprechenden natürlichsprachigen Bezeichnungen der Notationen im Text vorkommen. Wörter, die in einem Text wichtig vorkommen, die aber nicht einem Deskriptor oder Nicht-Deskriptor (oder der Bezeichnung einer Notation) entsprechen, fallen mitnichten weg, sondern führen zur Fortschreibung des kontrollierten Vokabulars. Für einen neuen Term ist - intellektuell - zu entscheiden, ob dieser als Deskriptor auszuzeichnen und damit in die Relationen der Dokmentationssprache zu verorten ist oder ob er einen zusätzlichen Nicht-Deskriptor für einen bereits etablierten Deskriptor abgibt. Dieses Verfahren garantiert, daß die Dokumentationssprache stets aktuell bleibt und sich dynamisch dem Vokabular seiner Texte anpaßt. Diese Variante der automatischen Indexierung fundiert ein „normales" Boolesches Retrieval mit kontrolliertem Vokabular. Letztlich kann der Nutzer bei dieser Variante der automatischen Indexierung gar nicht merken, daß nicht intellektuell gearbeitet worden ist, sieht doch das Ergebnis aus wie ein vom menschlichen Indexer erstelltes Produkt.
Automatische Schlagwortvergabe Wir nehmen nun an, daß das System automatischer Indexierung über keine Dokumentationssprache verfügt, trotzdem aber einzelne Terme als Sucheinstiege in einen Text auszeichnen möchte. Solche „auszuzeichnenden" Terme bezeichnen wir als „Schlagwörter".
166
6 Automatische Indexierung
Alle nach den informationslinguistischen und -statistischen Methoden markierten Textwörter sind Kandidaten für Schlagwörter. Gemäß Gerald Salton kann man jedes Schlagwort als Dimension verstehen. Eine Datenbank mit n verschiedenen Schlagwörtern spannt demnach einen n-dimensionalen Raum auf. Die Repräsentation eines Dokuments ist nach Salton derjenige Vektor, der durch alle jeweils vergebenen Schlagworte verläuft. (Nach diesem Grundgedanken wurde
Saltons
berühmtes System SMART, Salton's Magical Automated Retrieval Technique, kreiert; vgl. Salton, Hg., 1971.) Da die Terme durch die statistischen Verfahren mit einem dokumentspezifischen numerischen Wert versehen sind, bekommt unser Vektor auf jeder Dimension einen konkreten Wert zugeordnet. Es ist hierbei möglich, mit einem Schwellenwert zu arbeiten. Ein Vektor läuft nur dann durch eine Dimension, wenn der Schwellenwert überschritten wird. Durch die Analyse der Vektoren läßt sich ein „statistischer Thesaurus" aufbauen. Dimensionen, die von mehreren Vektoren gemeinsam berührt werden, gelten dabei als „verwandt" oder „ähnlich". Hierbei wird in der Regel mit mehreren Schwellenwerten gearbeitet. Gefordert ist ein hoher Gewichtungswert der einzelnen Textwörter sowie eine möglichst große Zahl gemeinsamen Auftretens unterschiedlicher Schlagworte innerhalb der Vektoren. Begriffe, zwischen den solch eine „statistische Ähnlichkeit" festgestellt wurde, können in der Recherche wie Synonyme behandelt werden. Wenn also der Nutzer einen dieser Terme eingibt, wird automatisch oder nach Systemrückfrage auch nach den anderen „statistisch ähnlichen" Termen gesucht. Nach dem Gesagten ist die Bestimmung der automatischen Indexierung bei der Variante Uber Schlagworte recht einfach. Sowohl die Texte in der Datenbank als auch die Suchanfragen werden durch das geschilderte Extraktionsverfahren indexiert. Die Suche ist ein Abgleich des Vektors, der die Suchanfrage repräsentiert, mit den Vektoren der Dokumente der gesamten Datenbank. Ausgegeben werden die Dokumente derjenigen Vektoren, die dem Suchvektor am ähnlichsten sind.
6.4 Assoziative Suche Im Booleschen Retrieval arbeiten wir mit exakten Suchbegriffen, bei der bisher geschilderten automatischen Indexierung mit natürlichsprachigen Sätzen. Die „assoziative Suche" arbeitet mit ganzen Dokumenten als Suchargumenten. Der Nutzer
6 Automatische Indexierung
167
benötigt hierzu ein „Musterdokument" als Ausgangspunkt für den Recherchevorgang, das er aus zwei Quellen erhalten kann. Zum einen kennt er den betreffenden Text bereits, sucht ihn im Retrievalsystem und startet die assoziative Suche. Zum andern hat er den Text in einem laufenden Suchvorgang gefunden, und nutzt nun dieses Dokument zur weiteren Recherche. Im zweiten Fall redet man von „Relevance feedback". Heutige Retrievalsysteme arbeiten mit zwei Varianten der assoziativen Suche: •
Suche über Schlagwörter
•
Suche über Zitationen.
Natürlichsprachiges Verfahren Die Suche über Schlagwörter arbeitet mit den oben bereits geschilderten natürlichsprachigen Verfahren der automatischen Indexierung. Das Musterdokument wird automatisch indexiert, d.h. aus dem Text werden die relevanten Schlagwörter extrahiert. J e nach systemintern eingestelltem Schwellenwert handelt es sich hierbei um einige wenige bis ca. ein Dutzend Schlagwörter. Die gefundenen Suchargumente werden in der Regel dem Nutzer angezeigt, so daß dieser seine Suchfrage bearbeiten kann, indem er unerwünschte Terme löscht oder weitere Wörter hinzufugt. Es schließt sich eine normale Suche im Rahmen der automatischen Indexierung an. Rechercheergebnis ist eine Menge von Dokumenten, die - nach Relevanz sortiert dem Musterdokument jeweils mehr oder weniger entsprechen.
Zitationsanalytisches Verfahren Eine zweite Variante assoziativen Retrievals ignoriert den gesamten Fließtext eines Dokuments und arbeitet ausschließlich mit den Zitationen. Natürlich ist dieses Verfahren nur dort einsetzbar, wo zitiert wird, also in der wissenschaftlich-technischen Fachliteratur, bei Patenten und bei Gerichtsurteilen (siehe auch oben S. 143). Das Verfahren geht von der Idee aus, daß zwei Texte, die viele andere Texte gemeinsam zitieren, miteinander verwandt sind. Operationalisiert wird die Idee durch das Auszählen des Vorkommens gemeinsamer Zitationen. Dem Musterdokument wird die Liste der Zitationen entnommen. Im assoziativen Retrieval werden alle anderen Dokumente mit dieser Liste verglichen. Rohmenge für die Ausgabe sind Texte, die mindestens eine Fußnote mit dem Musterdokument
168
6 Automatische Indexierung
gemeinsam haben. Die Sortierung nach Relevanz wird über die Menge gemeinsamer Zitationen bestimmt, d.h. oben stehen solche Texte, die viele gemeinsame Zitationen mit dem Musterdokument vorweisen. Problematisch ist teilweise die Erkennung gleicher Zitationen, zitieren doch Autoren nicht unbedingt nach jeweils dem gleichen Schema. Im Vorteil sind solche Datenbanken, die die Zitationen überarbeiten und in eine Normform bringen. Hierunter fallen alle Datenbanken der Reihen des „Science Citation Index". Die assoziative Suche in diesem System wird als „Co-Citation-Analysis" beschrieben.
Text Retrieval Conferences Seit 1992 finden jährlich die „Text Retrieval Conferences" (TREC) statt, die Systeme automatischer Indexierung evaluieren (vgl. Harman 1998). Nahmen bei der ersten TREC im Jahr 1992 25 Systeme teil, die ihre Verfahren an einer fiinf Megabyte großen Textmenge testete, so stieg die Zahl der Teilnehmer bei TREC-6 (1997) auf 51 Systeme und die Größe der Textmenge auf 2 Gigabyte (vgl. Sachse/Liebig/Gödert 1998, 10 ff.). TREC wird damit ein wichtiges Instrument zur Evaluation von Systemen natürlichsprachigen Retrievals. Die Text Retrieval Conferences zeigen: State of the art bei „Suchmaschinen" ist das natürlichsprachige Retrieval; nur noch ältere Systeme bieten ausschließlich Boolesche Recherchen an.
6.5 Automatische Indexierung deutschsprachiger Texte Für die deutsche Sprache gibt es eine Reihe von Besonderheiten, die die im Abschnitt 6.1 beschriebenen informationslinguistischen Verfahren, die ja am Englischen orientiert sind, fiir die automatische Indexierung deutschsprachiger Texte zum Teil erheblich modifzieren. Zu beachten sind Aspekte, die für die englische Sprache entweder überhaupt keine oder doch nur wenig Bedeutung haben: •
Lemmatisierung
•
Kompositazerlegung
•
Derivation
•
Bindestrichergänzung.
169
6 Automatische Indexierung
Stemming ist im Deutschen nicht durchzufuhren, an dessen Stelle tritt die Lemmatisierung. Andere Algorithmen, darunter z.B. die Erkennung von Phrasen, haben auch für das Deutsche Relevanz. Systeme automatischer Indexierung deutschsprachiger Texte sind in der kommerziellen Informationswirtschaft noch rar. Wir greifen auf Erfahrungen eines bibliothekarischen Projektes zurück, das für Online-Kataloge („OPAC", Online Public Access Catalogue) konstruiert worden ist. Es handelt sich um MILOS („Maschinelles Indexierungsverfahren auf linguistischer Grundlage für OPAC-Systeme", vgl. Lepsky 1994), das von der Universitäts- und Landesbibliothek Düsseldorf gemeinsam mit Harald H. Zimmermann entwickelt wurde.
Lemmatisierung Die Ermittlung der grammatischen Grundform für deutsche Wörter geschieht durch Lemmatisierung, d.h. durch eine Rückführung der konkreten Wortform auf ein „Lemma", einen Wörterbucheintrag. Einfluß auf die jeweilige Wortform haben •
die Wortklasse (Substantiv, Verb usw.)
•
die Flexionsendung (z.B. ,,-en" bei einigen Bildungen des Akkusativ Plural)
•
die Fugenbindungen (bei Verknüpfungen mehrerer Lemmata, z.B. durch ,,-s-").
Verwendet man bei der automatischen Indexierung deutscher Texte (wie MILOS; vgl. Lepsky 1994, 36) Wörterbücher, so gehen dort die jeweiligen Grundformen nebst den Regeln der Ermittlung der möglichen Wortformen (anhand der Wortklasse, den Flexionsendungen und der Fugenbindungen) ein. Die einzelnen Wortformen werden im Indexierungsprozeß auf die Grundform reduziert. Einige Beispiele mögen dies zeigen:
deutschen —> deutsch Mittelsalters —> Mittelalter Kühen —> Kuh.
170
6 Automatische Indexierung
Das letzte Beispiel zeigt anschaulich, warum der Weg über das Stemming im Deutschen nicht gangbar ist. Das Verfahren der automatischen Lemmatisierung über Wörterbücher ist fehleranfällig: Das Beispiel
Weinen - Wein
ist - wenn man den Kontext nicht beachtet - mehrdeutig. „Weinen" ist sowohl eine Flexionsform des Substantivs „Wein" (Dativ Plural) als auch des substantivierten Verbs „Weinen".
Derivation Für das Retrieval kann es durchaus wichtig sein, verschiedene Wortklassen ein und desselben Lemmas zusammenzufassen. Mittels der Derivation werden solche wortklassenübergreifenden Lemmatisierungen durchgeführt, z.B. von einem Adjektiv zu einem Substantiv:
mikroskopischen —> mikroskopisch (Schritt 1: Lemmatisierung innerhalb der Wortklasse) mikroskopisch —> Mikroskop (Schritt 2: Lemmatisierung durch Derivation).
Im Retrieval werden alle Flexionsformen und alle Derivate eines Lemmas synonym behandelt. Wenn eine Nutzeranfrage „mikroskopischen" enthält, werden alle Texte berücksichtigt, in denen Flexionsformen von „mikroskopisch" oder von „Mikroskop" vorkommen. Enthält ein Text „mikroskopischen", so wird er auch bei der Suchfrage nach „Mikroskop" erfaßt.
Bindestrichergänzung Eine Eigenheit der deutschen Sprache ist das Weglassen gleicher Wortteile bei dicht nebeneinanderstehenden Wörtern. Das System automatischer Indexierung steht hier
6 Automatische Indexierung
171
vor der Aufgabe, den Bindestrich als Auslassungszeichen zu interpretieren und den „abgekürzten" Teil des ersten Wortes durch das Fehlende zu ergänzen, etwa:
Film- und Fernsehwirtschaft —> Filmwirtschaft | Fernsehwirtschaft.
Kompositazerlegung In der englischen Sprache stehen wir häufig vor dem Problem, Mehrwortbegriffe automatisch zu erkennen. In der deutschen Sprache haben wir eher das umgekehrte Problem, nämlich aus Mehrwortbegriffen suchbare einzelne Lemmata auszulösen. Auch hier helfen Wörterbücher partiell weiter, insofern Einträge auch innerhalb von Wörtern als Teilmengen identifizierbar sind. Wenn unser Wörterbuch über die Grundformen „Unternehmen" und „Fusion" verfugt, sollte die Zerlegung
Unternehmensfusion —> Unternehmen | Fusion
keine Probleme bereiten. Probleme treten bei „Überzerlegung" auf. Es ist beispielsweise sinnvoll, „Wellensittichfutter" in die Lemmata „Sittich" und „Futter" sowie in die Komposita „Wellensittich" und „Sittichfutter" zu zerlegen, nicht aber in alle Bestandteile:
Wellensittichfutter —> Wellensittich | Welle | Sittich | Sittichfutter | Futter
Die „Welle" ist eine Überzerlegung. Analoges kann bei der Zerlegung von Eigennamen passieren. Eine Kompositazerlegung wie
Wolfgang —> Wolf| Gang
dürfte wenig sinnvoll sein. Alle nicht gewünschten Ausnahmen müssen einzeln im Wörterbuch verzeichnet sein. Nur dann können fehlerhafte Indexierungen vermieden werden. Leider ist das Deutsche besonders reich an solchen Ausnahmen.
172
6 Automatische Indexierung
Fazit •
Intellektuelle
Indexierung durch menschliche Arbeitskraft und
maschinelle
automatische Indexierung ergänzen einander. Ist die Informationswirtschaft mit großen Informationsmengen in kurzen Zeiten konfrontiert, kommt wohl ausschließlich automatische Indexierung infrage. •
Auch auf der Retrievalseite ergänzen sich „herkömmliches" Boolesches Retrieval und die auf der automatischen Indexierung beruhenden Möglichkeiten natürlichsprachiger Suche. Der Nutzer kommt dem Idealsuchergebnis - 100% Recall bei 100% Precision - ein Stück näher.
•
Die theoretischen Grundlagen der automatischen Indexierung berücksichtigen drei Aspekte: Informationslinguistik, Statistik und Ordnungstheorie.
•
Informationslinguistische Verfahren, die derzeit bereits im Einsatz sind, arbeiten vorwiegend mit der englischen Sprache. Die einzelnen sprachlichen Einheiten werden entweder durch Wörter oder durch N-Gramme gebildet. Nicht sinntragende Wörter sind durch Stoppwortlisten für das Retrieval gesperrt. Wortstammanalysen geschehen im Englischen durch das Abschneiden von Flexionsformen. Zur Anwendung gelangen dabei Suffixlisten und Regeln. Eine wichtige Aufgabe der Informationslinguistik ist die Markierung von Phrasen, d.h. Wortfolgen, die zusammengehören. Synonyme werden aus (sprachwissenschaftlichen) Synonymwörterbüchern und (dokumentarischen) Thesauri entnommen. Sinnvoll (wegen der Zählbasis der Informationsstatistik) wären Zuordnungen von Pronomina zu den jeweiligen Nomen. Eine fehlertolerante Behandlung von Nutzeranfragen verhindert Informationsverlust, der nur durch Tippfehler oder orthographische Fehler zustandekommt.
•
Für die automatische Indexierung deutschsprachiger Texte sind weitere Aspekte zu beachten. Wortstammanalysen durch Weglassen von Suffixen sind nicht möglich, an ihre Stelle tritt die Lemmatisierung. Lemmatisierung und zusätzlich Bindestrichergänzung und Kompositazerlegung verlangen nach umfangreichen Wörterbüchern. Leider ist die deutsche Sprache reich an Ausnahmen, so daß allgemeine Regeln meist nicht ausreichen, um das jeweils passende Lemma zu identifizieren.
6 Automatische Indexierung •
173
Bei der Informationsstatistik geht es darum, Wörter (Lemmata, Phrasen) in Texten zu gewichten. Ziel ist eine sortierte Ausgabe der Dokumente, wobei dasjenige Dokument, das der Suchfrage am Ähnlichsten ist, oben steht. Gewichtungsfaktoren sind die dokumentspezifische Wortgewichtung (ein Wort ist umso wichtiger, je häufiger es in einem Text vorkommt), die Gewichtung nach den Positionen im Text sowie die inverse Dokumenthäufigkeit (ein Wort ist umso wichtiger, je seltener es in einer Datenbank vorkommt). Besteht die Suchanfrage aus mehreren Wörtern, kommt als weiterer Gewichtungsfaktor der Abstand zwischen den Wörtern hinzu.
•
Im Rahmen der Anwendung von Begriffsordnungen bei der automatischen Indexierung werden Deskriptoren (wenn wir mit einem Thesaurus arbeiten) oder Notationen (bei Klassifikationssystemen) automatisch vom System vergeben.
•
Die assoziative Suche geht nicht mehr von Suchwörtern oder Suchsätzen aus, sondern von ganzen Musterdokumenten. Gesucht werden möglichst ähnliche andere Texte. Zum Einsatz kommen sowohl natürlichsprachige als auch zitatenanalytische Verfahren.
7 Suchen und Browsen im World Wide Web
In diesem Kapitel geht es nicht um das World Wide Web als Netzwerk, auf dem wir die Online-Archive der kommerziellen Informationswirtschaft erreichen, sondern es geht darum, die - meist kostenlosen - Angebote des Web zu suchen und zu finden. Wir können bei der Betrachtung externer Informationsressourcen nicht auf die Inhalte des Web verzichten, da sie teilweise ausschließlich auf diesem Kanal verteilt werden (Beispiel: elektronische Zeitschriften oder Schriftenreihen) oder da sie recht bequem via Internet beschaffbar sind (Beispiel: Geschäftsberichte). Eine Tatsache darf nicht übersehen werden. Web-Angebote sind in der Regel ohne Kosten recherchierbar. Hiermit werden aber ausschließlich die Kosten für die Beschaffung der konkreten Informationen erfaßt und nicht die Kosten für die Telekommunikation und nicht die Kosten für die Arbeitszeit beim Recherchieren. Gerade die letzte Kostenquelle kann sehr groß werden, denn Internet-Recherchen brauchen Zeit - weitaus mehr Zeit als Recherchen in Systemen der kommerziellen Online-Archive. (Für einen Studierenden, der im Internet stöbert, mögen solche Opportunitätskosten zu vernachlässigen sein, nicht aber für einen Mitarbeiter in einem
Wirtschaftsunternehmen.) Zudem
können
Web-Recherchen
in
freien
Datenbanken sogar teurer kommen als vergleichbare Online-Recherchen, ganz abgesehen von der Zeit. Durch die Möglichkeit, in kommerziellen Systemen datenbankübergreifend zu suchen, werden Datenbanken, die frei im Web verfügbar sind, gemeinsam mit anderen innerhalb einer Recherche abgearbeitet. Durch die Funktion der Dublettenelimination werden unliebsame Doppelnachweise ein und desselben Artikels vermieden. Recherchiert man erst - kostenlos - in der freien Internetquelle und sodann in den restlichen Quellen in kommerziellen Systemen, so liegen die Recherchekosten wegen nicht möglicher Ausnutzung der genannten Funktionen möglicherweise über den Kosten, die man bei ausschließlicher Nutzung der kommerziellen Systeme hat. Ulrich Kämper
und Christiane Wolff haben
entsprechende vergleichende Untersuchungen durchgeführt. Sie kommen zu dem Schluß: Zahlreiche freie Angebote haben sich „als Bumerang erwiesen, weil sie nicht nur
enorme
Zeitfresser sind,
sondern
auch
in
barer
Münze
selbst
ohne
Berücksichtigung des Zeitfaktors effektiv Mehrkosten verursachen, wenn man nicht gravierende Informationsverluste akzeptieren will" (Kämper/Wolff 1999, 17). Das World Wide Web ist als Hypertext organisiert. Der Nutzer navigiert durch den Raum der Dokumente, indem er sich via Links von Dokument zu Dokument „klickt". Unterscheidbar sind zwei Arten, im Netz etwas zu finden:
175
7 Suchen und Browsen im World Wide Web •
Browsen und
•
Suchen.
Wir wollen von „Browsen" („Stöbern") sprechen, wenn ein Nutzer, ausgehend von einem Startdokument, ausschließlich Links bei seiner Informationssuche benutzt. „Suchen" gebrauchen wir so, wie wir dies in den letzten Kapiteln eingeführt haben, also als systematische Aktion unter Ausnutzung von Retrievalsystemen.
7.1 Retrievalsysteme im World Wide Web HTML-Dokumente Die Retrievalsysteme im W W W haben ihre Besonderheit in den einzelnen dokumentarischen Bezugseinheiten, die sie nachweisen: Es handelt sich um Dokumente im HTML-Format. Hypertext Markup Language (HTML) ist eine formale Sprache, die mithilfe von Markierungen (tags) die logische Struktur sowie das Layout von Dokumenten notiert (vgl. Bonin 1996). „Dokumente" können Texte und Graphiken, aber auch Videosequenzen oder Klangelemente sein. Jedes Dokument wird durch eine Adresse (URL; Uniform Resource Locator) eindeutig bestimmt. Grundlage der Zusammenarbeit der Rechner im W W W
ist das
Hypertext Transfer Protokoll (HTTP). Die Einheit eines Dokuments wird durch zwei -Tags hergestellt, d.h. es wird alles als ein Dokument angesehen, das zwischen den beiden Tags
steht. Innerhalb eines Dokuments unterscheidet man Kopf und Dokumentenkörper . Im Dokumentenkopf können - sichtbar - u.a. die Titelinformationen sowie - unsichtbar - weitere Informationen über das Dokument angegeben werden. Im Rahmen der Meta-Tags lassen sich z.B. inhaltsbeschreibende Schlagwörter auflisten. Links zu anderen HTML-Dokumenten werden durch den „Anchor"-Tag angelegt. Dies mag als Kurzeinführung in HTML reichen. Für unsere Zwecke ist die Struktur der Tags wichtig, da die Retrievalsysteme sowohl (bei der automatischen Indexierung) auf gewisse
176
7 Suchen und Browsen im World Wide Web
Markierungen zugreifen (etwa auf die Titel oder die Meta-Tags) als auch bei der Suche einige Tags als Suchfelder vorsehen.
Retrievalsysteme für das gesamte World Wide Web Retrievalsysteme im W W W stehen vor vier Problemen (vgl. Potempa u.a. 1998, 14): •
Auffinden der HTML-Dokumente
•
Indexieren der gefundenen Dokumente
•
Verifikation gefundener Dokumente; Aktualisierung der Datenbasis
•
Angebot eines Suchsystems.
Im World Wide Web gibt es keine zentrale Instanz. Jeder kann Dokumente ins Netz stellen. Es gibt damit auch keinen zentral geführten „Katalog" aller Dokumente. Entsprechend ist die erste Aufgabe der Systeme, die Dokumente überhaupt zu suchen. Der zweite Schritt, die Indexierung, verläuft ähnlich den bereits in den vorigen Kapiteln beschriebenen Methoden. Dokumente im W W W verfügen z.T. über eine begrenzte Lebensdauer. Wenn der Autor so will, können sie jederzeit gelöscht werden. Entsprechend müssen die Retrievalsysteme „ihre" Dokumente periodisch überprüfen, ob sie überhaupt noch existieren. Letztlich bieten die Systeme eine Oberfläche zum Suchen an. Es gibt mehrere Alternativen, die Probleme anzugehen. Wir unterscheiden im Folgenden grob nach drei Typen von Retrievalsystemen: •
Suchmaschinen mit automatischer Indexierung (Beispiel: AltaVista)
•
klassifikatorische Retrievalsysteme (Beispiel: Yahoo!)
•
Meta-Suchmaschinen (Beispiel:
MetaCrawler).
Die Suchmaschinen erarbeiten automatisch eine indexierte Menge an Dokumentationseinheiten; klassifikatorische Systeme werden intellektuell gepflegt und bieten innerhalb eines Klassifikationssystems Wege vom Allgemeinen zum Besonderen an; Meta-Suchmaschinen letztlich greifen auf andere Retrievalsysteme zurück und fassen deren Leistungen im gewissen Rahmen zusammen.
177
7 Suchen und Browsen im World Wide Web Suchmaschinen mit automatischer Indexierung
Das „Einsammeln" von Dokumenten geschieht bei den Suchmaschinen über das Verfolgen von Links. Programme, die derart die Netz-Dokumente durchsuchen, werden „Web-Crawlers", „Spiders" oder „Robots" genannt. Ausgang ist eine gewisse Menge von URL, die entweder bereits im System gespeichert sind oder die von anderen
Systemen übernommen werden. Alle mit den
Ausgangs-
dokumenten verbundenen noch nicht bekannten Dokumente werden notiert, von diesen ausgehend werden wiederum die Links verfolgt usw. Grundsätzlich nicht gefunden werden Dokumente, auf die kein Verweis besteht, und geschützte WebSites. Da niemand weiß, wieviele HTML-Dokumente im Web vorhanden sind, sind Schätzungen über den Abdeckungsgrad der einzelnen
Retrievalsysteme
überaus heikel. Man kann aber davon ausgehen, daß kein einziges Retrievalsystem das WWW auch nur annähernd komplett abbildet, so daß Recherchen in mehreren Systemen in aller Regel notwendig sind. Alle von den Spiders oder Robots gefundenen Dokumente werden indexiert. Je nach System werden jedoch unterschiedliche Elemente zur Auswertung herangezogen. Aus der folgenden Liste werden mehrere Aspekte übernommen und bei der automatischen Indexierung berücksichtigt: •
URL (immer)
•
Titel (immer)
•
Datum (immer)
•
Schlagwörter (aus den Meta-Tags)
•
Anchors / Links
•
Text aus dem Body
Unter
•
gesamter Text
•
Textteil (meist der Textanfang).
Zuhilfenahme
informationslinguistischer
und
-statistischer
Methoden
werden die Wörter des Textes gewichtet und lassen ein - von Suchmaschine zu Suchmaschine unterschiedlich ausgeprägtes - Relevance Ranking der Dokumente zu (vgl. Courtois/Berry 1999). Alle Suchmaschinen errechnen Gewichtungswerte für Dokumente, „nur nimmt jede eine andere Gewichtung vor", stellen Thomas Potempa,
Peter Franke,
Wilfried Osowski
und Maria-Elisabeth Schmidt
fest
178
7 Suchen und Browsen im World Wide Web
(Potempa u.a. 1998, 125). „So kommt es in der Regel dazu, daß das gleiche Dokument im Ergebnisdatenbestand der Suchmaschinen eine unterschiedliche Position einnimmt". Die Suchmaschinen greifen periodisch auf die erfaßten URL zu und bekommen so Informationen über Aktualisierungen oder Löschungen der Dokumente. Sind die Zeiträume zwischen zwei Überprüfungsläufen groß, so kann es vorkommen, daß eine Suchmaschine ein Dokument auswirft, das schon nicht mehr existiert; der Link geht demnach ins Leere. Die Oberflächen mit den Suchoptionen für die Nutzer unterscheiden sich in ihrem Funktionsumfang. Es gibt Systeme, wie z.B. AltaVista,
deren
brauchen
den
Befehlsumfang beeindruckend Vergleich
mit
den
ist.
Deren
Retrievalsystemen
der
Suchmaschinen kommerziellen
Informationswirtschaft nicht zu scheuen. Es gibt allerdings auch Systeme, die nur über rudimentäre Suchmöglichkeiten verfügen.
Klassifikatorische Retrievalsysteme Im Gegensatz zu den Suchmaschinen, die ausschließlich automatisch arbeiten, werden die klassifikatorischen Retrievalsysteme intellektuell auf- und ausgebaut, d.h. hier sind (menschliche) Indexer am Werke. Basis der Systeme ist eine Klassifikation, in deren Klassen die HTML-Dokumente eingeordnet werden. Michael Otto betont, „der Aufbau dieser Verzeichnisse ist stets hierarchisch, was bedeutet, daß jeweils eine kleine Anzahl von übergeordneten Hauptthemen oder -katagorien definiert ist, unter denen wiederum weitere, speziellere Themen folgen" (Otto 1997, 21). Die Anzahl der Hierarchieebene ist von System zu System unterschiedlich. Wir wollen klassifikatorische Retrievalsysteme am Beispiel von Yahoo! verdeutlichen. Abbildung 7.1 zeigt die Unterteilung von „Handel und Wirtschaft", die sich auf der zweiten Hierarchieebene (von oben) bei Yahoo! Deutschland befindet. Bei jeder Klasse ist angegeben, wieviele Links sich in der betreffenden Rubrik (nebst aller Unterklassen) befinden. Bei einigen Klassen (etwa Nachrichten) variiert die Linkanzahl; dies wird durch „ @ " markiert. Auf unteren Hierarchieebenen sind - auf demselben Bildschirm - sowohl Klassenbezeichnungen eingetragen, die zu weiteren Unterklassen fuhren, als auch Links zu Dokumenten, die der Klasse entsprechen. Einen Ausschnitt aus solch einem „gemischten" Angebot zeigt Abbildung 7.2. Die oberen sechs Punkte sind Namen von
179
7 Suchen und Browsen im World Wide Web
Klassen, die unteren zwei sind „Endpunkte" im Klassifikationssystem, d.h. Links zu WWW-Dokumenten.
Abb. 7.1: Klassifikationssystem von Yahoo! Deutschland - Rubrik Handel und Wirtschaft • •
Yahoo! Finanzen Yahoo! Schlagzeilen - Wirtschaft
• • • • • • • • • • • •
Arbeit Archive Beschäftigung Bildung und Ausbildung Bücher E-Commerce Finanzen und Investitionen Firmen Handel Immobilien Kleinanzeigen Konferenzen und Messen
• • • • • • • • • • • •
Kostenlos Marketing Nachrichten Organisationen Transport Verbraucherinformationen Verzeichnisse Weltwirtschaft Wirtschaft- und Sozialgeschichte Wirtschaftsförderung Wirtschaftswissenschaften Zeitschriften
Gleiche Kategorie im internationalen Verzeichnis Quelle: URL:http://www.yahoo.de/Handel_und_Wirtschaft/ (25.2.1999)
Fortgeschrieben werden die Linksammlungen durch (intellektuelle) Recherchen der Mitarbeiter der Retrievalsysteme. Der Großteil der Web-Sites, auf die verwiesen wird, resultiert aus Vorschlägen der Nutzer, die jedoch geprüft und bewertet werden. Die Retrievalstrategie bei klassifikatorischen Systemen besteht darin, sich durch das Klassifikationssystem hindurch so zu bewegen, daß am Ende der gewünschte Link steht. Da eine eindeutige Klassierung von Dokumenten z.T. schwerfallt, stehen die Links ggf. an mehreren Stellen im System. Es kann vorkommen, daß der eine oder andere Link aus Nutzersicht „an der falschen Stelle" steht. Hier ist also durchaus Browsen angesagt, Stöbern in den Hierarchien der Klassifikationssysteme.
180
7 Suchen und Browsen im World Wide Web
Abb. 7.2: Klassifikationssystem von Yahoo! Deutschland - Rubrik E-Commerce (Ausschnitt) •
Yahoo! Shopping
•
Digitales Geld
•
Einkaufszentren
•
Firmenverzeichnisse
•
Internet Handel und Wirtschaft
•
Software
•
CommerceNet Deutschland e.V. - ein Verein, der sich für die Förderung des Elektronischen Handels einsetzt.
•
Electronic Commerce Info NRW - ECIN bietet Informationen und Kontakte rund um Electronic Commerce, Experten und Unternehmen sind hier Partner für das elektronische Geschäft
Quelle: URL:http://www.yahoo.de/Handel_und_Wirtschaft/E_Commerce/ (25.2.1999)
Klassifikatorische Retrievalsysteme gibt es mehrere, jedes mit eigenem Klassifikationsschema. Eigentlich läge nahe, vorhandene (und weit verbreitete) Klassifikationssysteme einzusetzen. Ingo Steinhaus schlägt vor, die Dezimalklassifikation zu verwenden (vgl. Steinhaus 1997, 152 f f ) . Es wäre in der Tat prüfenswert, ob nicht die Dewey Decimal Classification, die wir bereits kennengelernt haben (s.o. S. 64 ff.), oder irgend eine Variante davon für den Einsatz zur inhaltlichen Strukturierung des World Wide Web infragekäme.
Meta-Suchmaschinen Unter „Meta-Suchmaschinen" verstehen wir Retrievalsysteme, die selbst keine Datenbank aufbauen, sondern eine Suchfrage an andere Retrievalsysteme weitergeben
(vgl. Garman
1999).
Da kein
Suchsystem
im
Word
Wide
Web
Vollständigkeit garantieren kann, ist der Grundgedanke der Meta-Suchmaschinen zunächst plausibel. Eine Suche wird umso vollständiger, je mehr Systeme
7 Suchen und Browsen im World Wide Web
181
angesprochen werden. „Meta-Suchmaschinen versuchen, diesen Arbeitsaufwand dadurch zu reduzieren, daß sie Ihre Suchanfrage entgegennehmen und dann parallel an mehrere Suchdienste weiterschicken. Diese senden ihr Ergebnis zurück zur Meta-Suchmaschine, die alle Treffer sortiert und meist die doppelten Verweise zusammenfaßt" (Otto 1997, 26). Das Verfahren hat einen entscheidenden Nachteil. An alle Retrievalsysteme wird dieselbe Anfrage geschickt, d.h. die Funktionalität der Meta-Suchmaschine besteht im „kleinsten gemeinsamen Nenner" aller angesprochenen Systeme. Damit kann der Befehlsumfang jedes einzelnen Systems nicht ausgenutzt werden; das Ergebnis wird suboptimal.
7.2 Virtuelle Bibliotheken Da der Begriff der „virtuellen Bibliothek" noch nicht allseits gebräuchlich ist, sei eine definitorische Vorbemerkung gestattet. Eine (reale) Bibliothek hat gemäß Rupert Hacker folgende Aufgaben (vgl. Hacker 1992, 11 ff.): •
(1)
Sammeln,
Erschließen
und
Vermitteln
von
Büchern
(Monographien,
Zeitschriften usw.) •
(2) Sammeln, Erschließen und Vermitteln von Informationen über Bücher (z.B. bibliographische Informationen)
•
(3)
Sammeln,
Erschließen
und
Vermitteln
anderer
Medien
als
Bücher
(audiovisuelle Medien, elektronische Medien). Eine „digitale Bibliothek" ist ein Aspekt der dritten Aufgabe und meint eine Sammlung elektronischer Medien (etwa CD-ROM), die sich im Besitz der (realen) Bibliothek befinden. Die betreffenden elektronischen Medien können dabei sowohl der ersten Aufgabe (Bereitstellung von Volltexten) als auch der zweiten Aufgabe (Bereitstellung von bibliographischen Datenbanken) dienen.
Eine „virtuelle Bibliothek" verwaltet weder Bücher noch in ihrem Besitz befindliche elektronische Medien. Die „virtuelle Bibliothek" ist eine geordnete Sammlung von Verweisen auf elektronische Dokumente, die nicht zum Besitz der betreffenden Bibliothek gehören (vgl. Hilberer 1998). Wie die digitale geht auch die virtuelle Bibliothek von der dritten Aufgabe aus, umfaßt allerdings - für elektronische Doku-
182
7 Suchen und Browsen im World Wide Web
mente - stets die beiden ersten Aufgaben und „dreht" in ihrer dritten Aufgabe die Medienformen quasi „um": •
(1*) Sammeln, Erschließen und Vermitteln von elektronischen Dokumenten (vor allem: HTML-Dokumenten)
•
(2*) Sammeln, Erschließen und Vermitteln von Informationen über elektronische Dokumente (Angebot von Links zu Suchmaschinen, klassifikatorischen Retrievalsystemen und zu anderen virtuellen Bibliotheken)
•
(3*) Sammeln, Erschließen und Vermitteln anderer Medien als elektronische Dokumente (etwa Links zu bibliographischen Datenbanken über Buchliteratur).
Zwei große Unterschiede bestehen zur realen Bibliothek. Erstens ist eine virtuelle Bibliothek niemals geschlossen, und zweitens sind die (elektronischen) Dokumente immer vorhanden (und nicht etwa ausgeliehen, vermißt oder im bibliothekarischen Geschäftsgang). Die Linksammlungen der virtuellen Bibliotheken ergänzen damit das Angebot der Retrievalsysteme im World Wide Web.
Linksammlungen realer Bibliotheken Virtuelle Bibliotheken werden sowohl von (realen) Bibliotheken als auch von Fachwissenschaftlern (in der Regel aus Hochschulinstituten) aufgebaut und gepflegt. Das fachliche Spektrum der Linksammlungen der Bibliotheken ist breit angelegt und umfaßt eine große Palette von Disziplinen. Dafiir wird die Spezialisierung innerhalb der Disziplinen nicht in alle Tiefe verfolgt. Die Düsseldorfer
Virtuelle Bibliothek verfugt beispielsweise über Linksammlungen
zu nahezu allen Fächern, die an der Universität Düsseldorf gelehrt werden. Abbildung 7.3 zeigt einen Ausschnitt aus dem Fach Wirtschaftswissenschaft. Zur Illustration ist jeweils ein Link angegeben (natürlich umfaßt die virtuelle Bibliothek weitaus mehr Verweise). Die Mehrzahl der Links entspricht der Aufgabe (1*) und fuhrt zu HTML-Dokumenten. Einige Links leiten den Nutzer zu Retrievalsystemen (z.B. zu Yahoo!) oder zu anderen virtuellen Bibliotheken (etwa zu WebEc) und erfüllen damit Aufgabe (2*). Durch den Verweis auf kommerzielle Online-Archive (in unserer Abbildung: zu GENIOS) wird auch der Aufgabe (3*) genüge getan.
7 Suchen und Browsen im World Wide Web
183
Abb. 7.3: Düsseldorfer Virtuelle Bibliothek: Wirtschaftswissenschaft (Ausschnitt) Aktuelles Wirtschaftswissenschaftliche Fakultät der Heinrich-Heine-Universität Düsseldorf Sammlung wirtschaftswissenschaftlicher Internetquellen —> WebEc - World Wide Web Resources in Economics (Helsinki School of Economics) Datenbanken und Nachschlagewerke —> GENIOS Wirtschaftsdatenbanken Institutionen, Verbände und Bibliotheken Industrie- und Handelskammer Düsseldorf Aktien- und Währungskurse Banken und Versicherungen Wirtschaftliche Aspekte des Internet —> Economics and the Internet Stellenmarkt Zeitschriften und Nachrichtendienste —> Yahoo! - Deutschland - Wirtschaft Quelle: http://www.uni-duesseldorf.de/WWW/ulb/wir.html (24.8.1998)
Thematische Linksammlungen Die „virtuellen Fachbibliotheken" bieten themenspezifische Linksammlungen. Je nach Engagement der Ersteller und Mitarbeiter sind diese Bibliotheken zum Teil sehr ergiebig. Als Beispiel dient uns „ W W W Virtual Library Economic: WebEc" von Lauri Saarinen (siehe Abbildung 7.4). Auch hier begnügen wir uns mit einem kleinen Ausschnitt, der allerdings zeigt, wie detailliert diese thematische Linksammlung vorgeht.
184
7 Suchen und Browsen im World Wide Web
Abb. 7.4: WebEc - World Wide Web Resources in Economics (Ausschnitt) Economics and teaching —> Universities Methodology and history of economic thought Mathematical and quantitative methods —> Statistics Economics and computing —> Software Economics data —> Statistical Offices Microeconomics Macroeconomics International economics —> International trade —> International organizations —> International treaties Financial economics —> Insurance Public economics —> Collections by country Health, education and welfare Labor and demographics Law and economics Industrial organization Business economics Economic history Economic development, technological change and growth Economic systems Agriculture and natural resources —> Energy Regional economics Economics of networks —> Electronic commerce Publishing —> List of economics journals —> Working paper archives and collections —> Books Quelle: http://www.helsinki.fi/WebEc/WebEc.html (24.8.1998)
7.3 Wissenschaftliche Zeitschriften, Bücher und Working Papers Zunehmend gehen Verlage dazu über, ihre periodischen Veröffentlichungen sowie einige
Buchpublikationen
parallel
anzubieten,
einmal
- wie gewohnt
-
als
7 Suchen und Browsen im World Wide Web
185
Druckausgabe, zum andern zusätzlich in elektronischer Form in der Regel unter Beibehaltung des Original-Layouts. Der Zugriff geschieht passwortgeschützt via WWW, d.h. nur registrierte Abonnenten können solche Dienste nutzen. So ist es etwa möglich, über die „Economics Online Library" des Produktes „Link" vom Springer-Verlag
die Artikel der „Annais of Regional Science" einzusehen, auszu-
drucken oder zur Weiterbearbeitung zwischenzuspeichem. Zudem wird ein Service angeboten, der dem Nutzer via E-Mail die Inhaltsverzeichnisse der aktuellen Hefte von ihm bevorzugter Zeitschriften übermittelt. Mittels eines Retrievalsystems kann nach Informationen über die Verlagsprodukte, z.B. nach Inhaltsverzeichnissen der Zeitschriften gesucht werden. Außerhalb des Buchhandels vertriebene Schriften von Körperschaften wie z.B. die in vielen Wissenschaftsdisziplinen wichtigen „Working Papers" erhalten wie die Verlagsprodukte elektronische „Ableger"; hier ist der Zugang jedoch meist kostenlos. Manche Sammlungen der Arbeitspapiere sind nicht nur eine schlichte Reproduktion der Printexemplare, sondern gestatten zudem einen thematischen Sucheinstieg in die Veröffentlichungen. Durch das Angebot einer Datenbanksoftware mit Retrievalfünktionalität wird es dann beispielsweise möglich, nach jedem Wort jedes Heftes der entsprechenden „Working Paper"-Reihe zu suchen. Analoge Suchfunktionen offerieren z.T. auch klassifikatorische Retrievalsysteme und virtuelle Bibliotheken. Auch weitere Informationsproduzenten erschließen so ihr Angebot. Z.B. bietet der Buchhändler Schweitzer Sortiment an, unter Nutzung einer mächtigen Retrievalsoftware (Verity) Hinweise auf Bücher, z.T. mit Inhaltsverzeichnissen, zu recherchieren und direkt nach der Suche zu bestellen. Man kann demnach sehr viel und dies mit durchaus ansprechenden Techniken suchen - aber jede Informationsressource für sich. Was im Einzelfall zufriedenstellend ist, wird für den Fall, das viele solcher Systeme angesprochen werden müssen, ausgesprochen problematisch. Hier kommt die Komponente der teuren Suchzeit besonders deutlich zum Vorschein.
Fazit •
Die Informationsressourcen im World Wide Web selbst sind zwar meist kostenfrei; bedingt durch lange Suchzeiten, z.T. suboptimale Retrievalsysteme und - vor allem - durch einzeln abzuarbeitende isolierte Systeme entstehen im Unternehmen jedoch z.T. erhebliche Kosten.
186 •
7 Suchen und Browsen im World Wide Web Eine WWW-Recherche wird dann notwendig, wenn die gesuchte Information
ausschließlich als HTML-Dokument vorliegt oder wenn es sich als bequemer erweist, das Internet als Kanal zu benutzen. Letzteres kann z.B. bei Geschäftsberichten von Unternehmen der Fall sein. •
Alle Dokumente im WWW folgen der HTML-Sprache. HTML erlaubt Verweise (Links) innerhalb der Dokumente, so daß man von Dokument zu Dokument browsen kann. Über Markierungen (tags) wird ein Dokument strukturiert; (unsichtbare) Meta-Tags können inhaltserschließende Informationen enthalten.
•
Es gibt eine Reihe von Retrievalsystemen im World Wide Web (Suchmaschinen mit automatischer Indexierung, klassifikatorische Systeme, Meta-Suchmaschinen); hinzu kommen Linksammlungen universeller virtueller Bibliotheken oder thematische Linksammlungen virtueller Fachbibliotheken. Verlage, Herausgeber von Schriftenreihen und weitere Informationsproduzenten bieten retrievalfähige Datenbanken an, die jeweils den Bestand des Anbieters erschließen.
8 Wirtschaftswissenschaftliche Informationen: Literaturnachweise und Volltexte In den nächsten Kapiteln widmen wir uns den verschiedenen Typen der externen Informationsressourcen. Wo liegt dasjenige Wissen, das im Unternehmen benötigt wird, abrufbar gespeichert? „Wissen" kann hierbei aus sehr vielen Bereichen stammen, angefangen von wirtschaftswissenschaftlichem Wissen über technisches Wissen, Wissen über Unternehmen, Märkte und Branchen, Wissen über Ausschreibungen, Wissen aus Nachrichtenagenturen oder Zeitungen bis hin zu vagem und vorläufigem Wissen, etwa Gerüchten. Die folgenden Kapitel verdeutlichen den jeweiligen Ressourcentyp durch Beispiele. Es ist nicht beabsichtigt, einen Überblick über alle Quellen zu verschaffen. Bei der riesigen Anzahl der Informationsmittel und - gerade im World Wide Web - dem Kommen und Gehen von Informationsressourcen ist ein solcher Überblick gar nicht möglich. Unsere Beispiele sind allerdings so gewählt, daß Unternehmen (vorzugsweise in deutschsprachigen Ländern) ihren Informationsbedarf an Wirtschaftsinformationen mit den jeweiligen „Musterdatenbanken" durchaus decken könnten oder doch zumindest einen ersten Einstieg in die Lösung ihrer Informationsprobleme finden.
Im Bereich der Wirtschaftswissenschaften können wir nach der Art der elektronischen Informationsmittel folgendermaßen unterscheiden: •
bibliographische Datenbank ohne jedes Abstract,
•
bibliographische Datenbank mit Abstracts,
•
Datenbanken mit dokumentarisch ausgewerteten Volltexten,
•
Datenbanken mit (kaum oder gar nicht erschlossenen) Volltexten,
•
Linksammlung im World Wide Web.
Bibliographische Datenbanken - wir wissen es schon (s.o. S. 91) - bringen nur die Nachweise der gefundenen Literaturstellen, nicht die Texte selber. Wir zeigen Kanäle auf, wie der Nutzer trotz des umständlichen Medienbruches einigermaßen günstig an die Volltexte gelangt.
188
8 Wirtschaftswissenschaftliche Informationen
Die Grenze zwischen rein bibliographischen Datenbanken und Volltextdatenbanken ist fließend. Es gibt einige Informationsproduzenten (unser Beispiel ist ABIINFORM), die die elektronischen Volltexte an die Dokumentationseinheiten „anhängen" und damit natürlich den Medienbruch - für einen Teil ihrer Datensätze - optimal vermeiden.
8.1 Bibliographische wirtschaftswissenschaftliche Datenbanken Volkswirtschaftliche Informationen I: ECONIS Bei den wirtschaftswissenschaftlichen Informationen mit den Hauptausrichtungen Volkswirtschaft sowie Weltwirtschaft ist im deutschsprachigen Bereich die Datenbank ECONIS (Economics Information System) führend. Sie wird von der „Deutschen Zentralbibliothek für Wirtschaftswissenschaften" (ZBW), gleichzeitig Bibliothek des Instituts für Weltwirtschaft in Kiel produziert. Das Kieler Wirtschaftsforschungsinstitut wird 1914 als „Königliches Institut für Seeverkehr und Weltwirtschaft" an der Christian-Albrechts-Universität zu Kiel gegründet, die Institutsbibliothek erhält bereits 1919 den Status einer selbständigen Abteilung. Nahezu von Anfang an wird in Kiel Wert gelegt auf die „organisatorische Einheit von Bibliotheksarbeit, Dokumentation und Informationsdiensten" (ZBW 1998, 1). Seit 1966 ist die Institutsbibliothek zugleich die „Deutsche Zentralbibliothek für Wirtschaftswissenschaften". „Ihre Aufgabe ist es, wirtschaftswissenschaftliche Spezialliteratur aus allen Ländern der Welt und in allen Sprachen zu ermitteln, zu sammeln, zu erschließen und für die örtliche, nationale sowie internationale Benutzung allen Interessierten zur Verfügung zu stellen" (ebd., 1 f.). Für Bibliotheken ist es teilweise üblich, nur Bücher als Ganzes zu katalogisieren. Die ZBW verfährt anders: Neben Monographien und Periodika „werden ausgewählte Aufsätze aus Zeitschriften sowie Sammelwerken indexiert" (ebd., 2). Zudem beschafft die ZBW (sonst nur schwer erreichbare) „graue" Literatur, d.h. Schriften, die außerhalb des Buchhandels vertrieben werden. Der Gesamtbestand der ZBW umfaßt rund 2,5 Millionen Bände (Stand: Anfang 1999) bei einem jährlichen Zuwachs von etwa 40.000 Einheiten. Bis 1985 erfolgt die Inhaltserschließung durch ein System von Kartenkatalogen mit über 8 Millionen Katalogkarten. Ab 1986 wird elektronisch katalogisiert. Seitdem sind in ECONIS über 850.000 Datensätze angelegt. Der durchschnittliche Zuwachs beträgt rund 65.000 bibliographische Einheiten pro Jahr. Die über 20.000 Neuzugänge an Büchern pro Jahr entstammen nur zu gut einem Drittel Verlagen, ein weiteres Drittel
8 Wirtschaftswissenschaftliche Informationen
189
wird von wissenschaftlichen Institutionen herausgegeben, der Rest ist Literatur von Behörden,
internationalen
Organisationen,
Unternehmen
und
Verbänden.
Die
Indexer sehen etwa 1.400 wirtschaftswissenschaftliche Zeitschriften laufend durch, 144 davon werden cover-to-cover ausgewertet. Zur Inhaltserschließung wird der „Standard-Thesaurus Wirtschaft" herangezogen. Ein Abstracting findet nicht statt. Der Arbeitseinsatz der Indexer geschieht nach dem Regionalprinzip, d.h. jedem im Team ist eine gewisse Weltregion zugeordnet. Somit fließen regionale Kompetenz (vor allem Sprachkompetenz) und wirtschaftswissenschaftliche Expertise zusammen.
Zugänge zu ECONIS bestehen über mehrere Kanäle: •
online bei GBl
•
online bei GENIOS
•
CD-ROM (als Teil der WISO II)
•
World Wide Web.
In Abbildung 8.1 sind drei Beispiele aus ECONIS angeführt, die einen (kleinen) Teil einer Treffermenge zum Thema „Braunkohlenbergbau" ausmachen.
Abb. 8.1: ECONIS - Beispielnachweise Datenbank ECONIS Dokumentnr. Autor Titel Quelle Signatur Schlagworte Publikation Sprache Jahr Erfassungsnr. (c) IfW
471295 Boecker, Dietrich Der Tagebau Garzweiler II: Genehmigung sichert Energieversorgung und Wirtschaftskraft In: Energiewirtschaftliche Tagesfragen. - 45 (1995),6, S. 342 - 349 : Graph. Darst., Kt.; 5 YY 4498(45.1995) Braunkohle ; Braunkohlenbergbau ; Energiepolitik; Nordrhein-Westfalen Zeitschriftenaufsatz Deutsch 1995 00622003
190 Dokumentnr. Autor Titel Quelle Signatur Schlagworte Publikation Sprache Jahr Erfassungsnr. (c)IfW Dokumentnr. Autor Titel Quelle Signatur Fußnoten Schlagworte Publikation Sprache Jahr Erfassungsnr. (c)IfW
8 Wirtschaftswissenschaftliche Informationen 451781 Heck, Birgit Landwirtschaft und Braunkohlentagebau : das Beispiel Westrevier In: Raumforschung und Raumordnung. - 52 (1994),6, S. 406 411; 4 YY 721 (52.1994) Braunkohlenbergbau ; Landwirtschaft ; Deutschland
Zeitschriftenaufsatz Deutsch 1994 00591737
413252 Kasztelewicz, Zbigniew Wegiel brunatny - oferta energetyczna dla Polski Brown coal - energy offer to Poland In: Gospodarka surowcami mineralnymi. - 9 (1993),2, S. 249 265; 3 XX 5405 (9.1993) Zsfassung in engl. Sprache Braunkohlenbergbau; Polen Zeitschriftenaufsatz Polnisch 1993 00539357
Quelle: ECONIS; WISO II Version September 1998 Die inhaltliche Suche geschieht über die Deskriptoren des Standard-Thesaurus Wirtschaft, hier mit dem Term „Braunkohlenbergbau". Wie das dritte Beispiel zeigt, kann unabhängig von der Sprache der Quelle stets in deutsch gesucht werden. Die Nachweisinformationen in ECONIS enthalten neben den Deskriptoren die bibliographischen Angaben, so daß das Buch oder der Artikel eindeutig identifiziert werden.
Die Beschaffung der Volltexte geschieht auf zwei Wegen: •
Bücher als Ausleihe
•
Artikel als Kopie.
191
8 Wirtschaftswissenschaftliche Informationen
Unter Angabe der Signatur kann jeder Volltext, der in ECONIS beschrieben ist, bei der Deutschen Zentralbibliothek für Wirtschaftswissenschaften beschafft werden. Buchliteratur wird ausgeliehen, d.h. per Post übersandt, und muß nach Ablauf der Leihfrist zurückgeschickt werden. Artikel werden grundsätzlich fotokopiert und dem Nutzer zum Verbleib überlassen (vgl. ZBW 1998, 14-18).
Volkswirtschaftliche Informationen II: EconLit Das englischsprachige Gegenstück zum deutschen
ECONIS
ist EconLit,
„Economic Literature Index", produziert von der American Economic
der
Association.
EconLit ist die elektronische Version der bibliographischen Sektion dreier Zeitschriften: •
Journal of Economic Literature
•
Index of Economic Articles
•
Abstracts of Working Papers in Economics.
Die indexierte Literatur reicht bis ins Jahr 1969 zurück. Inzwischen (Anfang 1999) sind über 400.000 Datensätze gesammelt. Das Wachstum der Datenbank liegt in den letzten Jahren zwischen ca. 25.000 und 30.000 Nachweisen pro Jahr. Ausgewertet werden rund 450 (meist englischsprachige) wirtschaftswissenschaftliche Periodika. Zusätzlich bearbeiten die Indexer ca. 600 Sammelbände (z.B. Kongreßakten), 2.000 Monographien, 900 Dissertationen, 2.000 Working Papers sowie diverse Buchbesprechungen pro Jahr. Die meisten Datensätze enthalten ein (in der Regel ausführliches) Abstract. Inhaltserschließende Informationen sind in unterschiedlichen Feldern enthalten: •
Abstract
•
Klassenbezeichnung (im Feld DE)
•
Notation (im Feld DC)
•
geographischer Deskriptor (im Feld DC)
•
Namen thematisierter Personen (im Feld NM).
Die Notationen (und deren Bezeichnungen) entstammen der Klassifikation des Journal of Economic Literature.
192
8 Wirtschaftswissenschaftliche Informationen
Abb. 8.2: EconLit - Beispielnachweise Title: The German tradition of organized capitalism: Self-government in the coal industry Author: Parnell, Martin F. Publication Information: Government-Industry Relations series. Oxford and New York: Oxford University Press, Clarendon Press, Pages: xiii, 259 Publication Date: 1994 ISBN: 0-19-827761-X Document Type: Book Abstract Indicator: Abstract Abstract: Portrays the politics of the German coal industry in its historical context, highlighting the concept and institution of self-government. Describes how, by the outbreak of the First World War, the German hard coal industry had established organizational precedents of centralization and coordination, in the form of prestigious employers' associations and mighty coal syndicates, and had become a fulcrum of a highly developed system of organized capitalism. Describes the relations between the coal industry, the state, and labor through the 1920s and 1930s, and traces a fluctuating line of development that resulted in an apparent amalgamation of state and industry. Describes how, in the post-Second World War world, patterns of cooperation and concertation between state, industry, and labor reasserted themselves in the West German coal industry, displaying a continuity with prewar values and institutions outweighing the influence of Allied occupiers and neoliberal ideologists of the so-called social market economy. Examines in more detail the institution of industrial self-government in Germany , considering both employer and labor approaches. Contends that organized labor in postwar West Germany both embraced and was embraced by a corporatist system, whose growth, stability, and very survival had become dependent on labor's support. Discusses coal and contemporary organized capitalism in Germany . Parnell is Senior Lecturer in International Business Studies, at Liverpool John Moores University. Bibliography; index. Descriptors: Economic History: Labor, Demography, Education, Income and Wealth: Europe: 1913-71 (N340); Mining , Extraction, and Refining: Hydrocarbon Fuels (L7I0); Political Economy of Capitalism (PI 60); Trade Unions: Objectives, Structure, and Effects (J510); Capitalist Enterprises (P120 Descriptors: Economic History—Europe—History of Factor Prices and Markets (0442); Industry Studies-Extractive Industries-Oil, Gas, and Other Fuels (6323); Collective Bargaining in the Private Sector (8321); Capitalist Economic Systems: Market Economies (0510) Company Names (DIALOG Generated): Liverpool John Moores University Title: The German Coal Market after 1992 Author: Heilemann, Ullrich; Hillebrand, Bernhard Author Affiliation: Rheinisch-Westfälisches Institute fur Wirtschaftsforschung; Rheinisch-Westfälisches Institute fur Wirtschaftsforschung Journal Name: Energy Journal, Journal Volume & Issue: 13 3 , Pages: 141-56
193
8 Wirtschaftswissenschaftliche Informationen Publication Date: 1992 ISSN: 0195-6574 Document Type: Journal Article Geographic Location Descriptors: Germany Descriptors: Mining , Extraction, and Refining: Hydrocarbon Fuels (L710); Electric Utilities (power plants) (L940) Descriptors: Industry Studies—Extractive Industries—Oil, Gas, and Other Fuels (6323); Industry Studies-Electrical, Gas, Communication, and Information Services (6352); Regulation of Public Utilities (6130) Quelle: EconLit; DIALOG, File 139
Unsere Beispiele fur Datensätze der EconLit wurden (neben anderen) bei einer Recherche nach „coal and Germany" gefunden. Auffallig sind im unteren Nachweis das Fehlen des Abstracts sowie die orthographischen Fehler bei der (deutschen) Arbeitsstätte der Autoren, im oberen Nachweis das Fehlen des geographischen Feldes. Abfragbar ist EconLit online über den Host DIALOG sowie via der CD-ROMVersion. Einen Bestellservice für die Volltexte bietet EconLit nicht an. Ist die betreffende Literatur nicht bei der Deutschen Zentralbibliothek für Wirtschaftswissenschaften vorhanden, so dürfte eine Bestellung über das Document Supply Centre der British Library am Erfolgversprechensten sein.
Betriebswirtschaftliche Informationen I: BLISS Auch im Bereich der Betriebswirtschaft wollen wir zwei Datenbanken vorstellen, die in Deutschland führende BLISS sowie die international ausgerichtete ABI-INFORM. Das „Betriebswirtschaftliche Ljteratursuchsystem" (BLISS) ist das „Flaggschiff' des Informationsproduzenten und -anbieters Gesellschaft
für
Betriebswirtschaftliche
Information (GBl). Thematisch umfaßt die BLISS den Gesamtbereich der Betriebswirtschaftslehre, sprachlich liegt der Schwerpunkt mit rund drei Viertel aller Nachweise auf deutscher Literatur. Rund 85% der Datensätze bilden Artikel ab, der Rest Bücher und Dissertationen. Graue Literatur wird nicht aktiv gesammelt. Die Datenbank
ist
Anfang
1999
auf
ca.
200.000
bibliographische
Nachweise
angewachsen. „Ein Angebotsmonopol entzieht sich der Kritik, liegt doch die Alternative für den Konsumenten und Nachfrager nur im Verzicht. Wer deutschsprachige betriebswirt-
194
8 Wirtschaftswissenschaftliche Informationen
schaftliche Literaturhinweise in elektronischer Form erhalten will, muß auf die von der Gesellschaft für betriebswirtschaftliche Information mbH (GBl) in München produzierte Datenbank BLISS zugreifen", stellt Manfred Boni fest (Boni 1994, 50) und spielt damit auf die einzigartige Stellung der BLISS in Deutschland an, die nicht unbedingt zu größter Qualität inspirierte. Ein möglicher Wettbewerber, nämlich das Sondersammelgebiet
Betriebswirtschaft, Versicherungswesen
und
Sozialwissen-
schaften, angesiedelt bei der Universitäts- und Stadtbibliothek Köln, mit analogem Auftrag versehen wie die Kieler Wirtschaftsbibliothek, hat sich in der Tat auf das „Sammeln" beschränkt und unterlassen, die betriebswirtschaftliche Literatur analytisch auszuwerten. Die Qualitätsdefizite der BLISS beziehen sich vor allem auf Probleme des korrekten Abstracting. „Trotz aller 'Positiva' (Benutzungsfrequenz, Bekanntheitsgrad) ist die inhaltliche Erschließung ... an einigen Stellen nicht gerade ein Ideal", stellt Thomas Sänger fest (Sänger 1993, 33). Abstracts sind zum Teil gar nicht vorhanden, und einige Abstracts verdienen diesen Namen nicht (Leseprobe: „Ein Beitrag zu einem Thema, das vielen einheimischen Unternehmen auf den Naegeln brennt"; Sänger 1993, 27). Gemäß der umfangreichen Analysen von Sänger
verhärtet sich die
Vermutung, daß bei der BLISS „keine 'Regeln' oder Anleitungen zum Abstracting vorhanden sind. Eine Endkontrolle geschieht nur grob, eine Rechtschreibprüfung im Abstract-Feld findet nicht statt" (ebd., 27). Die Indexierung außerhalb der Kurzreferate ist dagegen brauchbar, wenngleich etwas grob. Eingesetzt werden parallel mehrere Werkzeuge: •
Standard-Thesaurus Wirtschaft
•
NACE
•
SIC
•
Ländercodes.
Bei den klassifikatorischen Elementen sind sowohl die Notationen als auch die umgangssprachlichen Benennungen (in deutsch) suchbar. Branchenbezeichnungen werden ausschließlich durch NACE- und SIC-Codes dargestellt. Der Nutzer des Standard-Thesaurus Wirtschaft ist hier auf die NACE-STW-Konkordanz angewiesen. Die Beispiele in Abbildungen 8.3 entnehmen wir der Antwortmenge unserer Suchfrage „Braunkohle und Deutschland". Es ist hierbei sicher kein Zufall, daß wir auf
8 Wirtschaftswissenschaftliche Informationen
195
einen Nachweis ohne Abstract gestoßen sind. Die inhaltserschließenden Informationen sind in der CD-ROM-Version der WISO / im Feld „Schlagworte" zusammengefaßt. Brancheninformationen entstammen der NACE (angedeutet durch das „N" vor der Notation) oder der SIC („S"), regionale Informationen dem Ländercode („C"), alle weiteren Deskriptoren (ohne einleitendes Zeichen) dem Standard-Thesaurus Wirtschaft. Es gibt Fälle, in denen die Klassifikationssysteme nicht genügend spezifizieren. So läßt z.B. S1220 (Steinkohle, Braunkohle) in der BLISS-Version keine feinere Gliederung zu. Eine Suche nach „Braunkohle" findet demnach immer auch alles über Steinkohle. Der Nutzer muß sich hier helfen, indem er im Titel oder im Abstract zusätzlich nach „Braunkohle" recherchiert.
Abb. 8.3: BLISS - Beispielnachweise BLISS - Betriebswirtschaftliche Literatur Dokumentnr. Autor Titel Quelle Schlagworte
Publikation Sprache Datum Jahr (c) GBl Dokumentnr. Autor Titel Quelle Abstract
158942 Giesel, Klaus Kohle: Die Vorraete reichen fuer eine unbegrenzte Zeit WERTPAPIER, Heft: 2, 1993, S. 30-32 Fuehrungskraefte / Zukunftsforschung / Umwelt / Produktinnovation N10 Kohlenbergbau, Torfgewinnung S1220 Steinkohle, Braunkohle N40.1 Elektrizitaetsversorgung S4910 Stromversorgung Deutschland C4EUGE 3 Aufsatz in Zeitschriften L0 Deutsch 19930000 1993
147245 Bilkenroth, K.-D. Ausgewaehlte betriebswirtschaftliche Aspekte des Umweltschutzes in der mitteldeutschen Braunkohlenwirtschaft B E T R I E B S W I R T S C H A F T L I C H E FORSCHUNG UND PRAXIS, Heft: 6, 1991, S. 535-549 Die Braunkohlenindustrie Mitteldeutschlands befindet sich in einem Umstellungsprozess, der das Unternehmen MIBRAG in einen konsolidierten Bereich der Foerderung und Verarbeitung fiiehren
196
Schlagworte
Publikation Sprache Datum Jahr (c) GBl Dokumentnr. Autor Titel Quelle Abstract
Schlagworte
Publikation Sprache Datum Jahr (c) GBl
8 Wirtschaftswissenschaftliche Informationen wird. Der Beitrag beschaeftigt sich mit den betriebswirtschaftlichen Auswirkungen veraenderter Umweltanforderungen auf den Tagebaubetrieb. Umwelt / Umweltschutz N10 Kohlenbergbau, Torfgewinnung S1220 Steinkohle, Braunkohle N40 Energieversorgung N13 Erzbergbau / N27 Metallerzeugung und -bearbeitung S1220 Steinkohle, Braunkohle / S3300 Metalle (Eisen, Stahl, Nichteisen) Deutschland C4EUGE 3 Aufsatz in Zeitschriften LO Deutsch 19910000 1991
147243 Thole, Bernhard Braunkohle in Deutschland - Fakten und Perspektiven fuer eine effiziente Energieversorgung BETRIEBSWIRTSCHAFTLICHE FORSCHUNG UND PRAXIS, Heft: 6, 1991, S. 495-512 Die ausreichende Versorgung mit Energie sowie eine intakte Umwelt stellen wichtige und unverzichtbare Lebensgrundlagen dar. Bei der Braunkohlengewinnung und -Verwendung in Westdeutschland erfaehrt der Produktionsfaktor „Umwelt" im einzelwirtschaftlichen Kalkuel seit langem Beruecksichtigung. Eine Unternehmens- und Betriebskonzentration sowie konsequente Rationalisierungsmassnahmen fuehrten zu einer massgeblichen Reduzierung des Einsatzes der Produktionsfaktoren. Umwelt / Anforderungsprofi 1 / Umweltschutz / Wettbewerb N40 Energieversorgung N10 Kohlenbergbau, Torfgewinnung SI220 Steinkohle, Braunkohle N13 Erzbergbau / N27 Metallerzeugung und -bearbeitung S1220 Steinkohle, Braunkohle / S3300 Metalle (Eisen, Stahl, Nichteisen) Deutschland C4EUGE 3 Aufsatz in Zeitschriften LO Deutsch 19910000 1991
Quelle: BLISS; WISO 1 Version September 1998
8 Wirtschaftswissenschaftliche Informationen
197
GBl bietet keinen Dokumentlieferservice an. Der Nutzer muß notwendigerweise auf andere Lieferanten der Volltexte ausweichen. „Erste Adresse" dürfte das genannte Sondersammelgebiet der Kölner Universitätsbibliothek sein.
Betriebswirtschaftliche Informationen II: ABI/INFORM ABI/INFORM ist mit rund 1,7 Millionen Datensätzen (Anfang 1999) die größte der wirtschaftswissenschaftlichen Datenbanken. Ihre Ausrichtung ist schwerpunktmäßig „Business Administration", es finden sich aber auch Informationen zu „Economics". Informationsproduzent ist Bell & Howell Information and Learning (früher: UMI University Microfilms International) in Ann Arbor (Michigan). Seit 1971 wird die betriebswirtschaftliche Literatur in ABI/INFORM nachgewiesen, seit 1991 sind mehr als 50% der ausgewerteten Zeitschriften mit den Volltexten ihrer Artikel in der Datenbank vertreten. Ist der Volltext nicht vorhanden, gibt ein Abstract zusammenfassende Informationen. Zur Auswertung gelangen mehr als 800 Zeitschriften, davon rund die Hälfte cover-to-cover. Drei Viertel der Periodika erscheinen in den Vereinigten Staaten. Bücher werden nicht bearbeitet. Fortgeschrieben wird die Datenbank täglich, ein Update enthält ca. 1.200 Datensätze. Sucheinstiege in ABI/INFORM sind alle Wörter in den Abstracts und - soweit vorhanden - in den Volltexten. Die Indexierung mit kontrolliertem Vokabular findet in mehreren Feldern statt: •
Unternehmensname (im Feld CO beim Online-Archiv Dialog)
•
Unternehmenskennziffer (D-U-N-S Number; Feld DN)
•
Tickersymbol des Unternehmens (Feld TS)
•
Ländername (Feld GN)
•
Deskriptoren (nach eigenem Thesaurus; Feld DE)
•
Notationen (des eigenen Klassifikationssystems; Feld CC)
•
umgangssprachliche Benennungen der Notationen (Feld CN).
Eine Beschränkung auf Datensätze mit Volltexten ist bereits bei der Recherche (bei Dialog mittels ,/FULLTEXT") möglich. ABI/INFORM liegt bei diversen Online-Archiven (u.a. Dialog, Lexis-Nexis, 577V) auf; zusätzlich existieren CD-ROM-Versionen.
198
8 Wirtschaftswissenschaftliche Informationen
Abb. 8.4: ABI/INFORM - Beispielnachweis The German Coal Market After 1992 Heilemann, Ullrich; Hillebrand, Bernhard Energy Journal vl3n3 pp: 141-156 1992 CODEN: ENJODN ISSN: 0195-6574 Journal Code: ENJ Document Type: Journal article Language: English Length: 16 Pages Special Feature: Charts Graphs References Abstract: Hard coal mining in the countries of the European Community and in Germany in particular has undergone a 30 year decline. This decline is bound to continue, and will probably accelerate when the Single European Internal Market comes into force on January 1, 1993. Because of ist continuing lack of competitiveness, German coal only stands a chance on the open market if the price difference with 3rd-country coal is reduced by subsidies. Given Germany's tight fiscal position and the dynamics of these subsidies, a cutback in the production of hard coal seems inevitable. Recent policies have taken this into account. The agreements made by the 1991 Coal Round foresee a reduction in coal production by the turn of the century to 50 million tons. It remains doubtful, however, whether this really represents a long-term solution. Geographic Names: Germany Descriptors: EC single market; Coal industry; Industrywide conditions; Electric utilities; Subsidies; Prices; Statistical data Classification Codes: 8500 (CN=Extractive industries); 9175 (CN=Western Europe); 8340 (CN=Electric, water & gas utilities); 1120 (CN=Economic policy & planning); 9140 (CN=Statistical data) Quelle: ABI/INFORM; DIALOG, File 15 Es ist sicherlich Manfred Boni zuzustimmen, wenn er behauptet, daß ABI/INFORM „sich zu einer der führenden Informationsquellen für Wirtschaftsinformationen herausgebildet hat" (Boni 1994, 64). Mit ABI/INFORM haben wir bereits die rein bibliographischen Datenbanken verlassen, sind doch teilweise die Volltexte angehängt. Wir wenden uns nunmehr Datenbanken zu, die ausschließlich Volltexte speichern.
199
8 Wirtschaftswissenschaftliche Informationen
8.2 Wirtschaftswissenschaftliche Volltextdatenbanken Datenbanken,
die den
vollständigen
Text wissenschaftlicher Artikel
suchbar
speichern, haben den großen Vorteil, ohne Medienbruch direkt an die gewünschte Information zu fuhren, sie haben jedoch dann einen Nachteil, wenn keinerlei dokumentarische Inhaltserschließung vorhanden ist, muß man doch mit dem Termmaterial auch großer Texte beim Retrieval auskommen. Optimal sind demnach diejenigen Volltextdatenbanken, die eine inhaltliche Beschreibung (mittels Klassifikationsnotationen, Deskriptoren eines Thesaurus oder anderer Dokumentationsmethoden) der Texte vornehmen. Als „Musterbeispiel" in den Wirtschaftswissenschaften kann durchaus die gerade vorgestellte Volltextsektion bei ABI/INFORM angesehen werden. (Hier fehlte eigentlich nur noch die Option, den Text der Zeitschriftenartikel nicht nur im ASCII-Format, sondern im Originallayout mit allen Graphiken und Bildern vorzuhalten.) In unerschlossenen Volltextdatenbanken verfugen wir nicht nur nicht über kontrolliertes Vokabular, sondern auch nicht über Terme in gewissen Ansetzungsformen. Wir sind dem Material des jeweiligen Autors ausgeliefert. Verwendet dieser Wortspiele oder setzt in rhetorischer Absicht Doppeldeutigkeiten ein, so sind die dahinter verborgenen Informationen kaum recherchierbar. Problematisch ist zudem, daß das reine Vorkommen eines Wortes nichts darüber aussagt, ob das Wort auch Thema ist; die Mehrzahl der Terme sind „erläuterndes Beiwerk" der Themen, suchen (und finden) wollen wir aber nur solche Texte, die unser Suchargument auch thematisieren. Große Probleme bereitet der Einsatz des mengentheoretischen Und-Operators. Es ist durchaus nicht unwahrscheinlich, daß zwar beide Suchargumente irgendwo in einem Text vorkommen, aber in semantischer Hinsicht völlig getrennt voneinander. Die Verwendung des Booleschen Und gilt für Reva Bäsch als eine der „Todsünden" der Volltextrecherche (vgl. Bäsch 1990). Es gibt zwei Lösungsalternativen: •
im intellektuellen Retrieval: Abstandsoperatoren und Häufigkeitsoperatoren
•
Verwendung von Systemen mit automatischer Indexierung.
Die erste Lösung verzichtet auf den Und-Operator und verwendet stattdessen Abstandsoperatoren (s.o. S. 107 ff.) oder Häufigkeitsoperatoren (s.o. S. 109 f.). Die zweite Lösung lehnt Boolesches Retrieval für Volltexte ganz ab und verweist auf Verfahren der automatischen Indexierung (s.o. S. 147 ff.).
200
8 Wirtschaftswissenschaftliche Informationen
Wichtig für den Nutzer ist das Angebot einer schnellen „Sicht" auf die der Suchfrage entsprechenden Stellen im Volltext. Retrievalsysteme bieten hierzu z.T. die Option KWIC (Keyword in Context) an und zeigen den Textabschnitt, der die Suchargumente am besten trifft. Eine brauchbare Information ist bei Volltexten die Angabe der Textlänge (zumeist benutzt wird die Anzahl der Wörter).
Als Beispiel stellen wir die Volltextversion des „Journal of Marketing" bei LexisNexis vor. Der (stark gekürzte) Beispieldatensatz in Abbildung 8.5 bringt den Quellennachweis, den gesamten Text, die Fußnoten sowie „Subjects". Diese Subjects sind kein normiertes Vokabular, sondern werden von Lexis-Nexis im Rahmen einer automatischen Schlagwortvergabe kreiert. Bei der Quellenangabe fällt auf, daß die Paginierung nicht vollständig angegeben wird (Endseite fehlt), und im Text gibt es auch keinen Hinweis auf die ursprüngliche Seitenzählung. Übernimmt man ein Zitat wörtlich in seine wissenschaftliche Arbeit, so ist keine seitengenaue Zitierung möglich. (Dies wird sich erst dann ändern, wenn das Originallayout
mit
abgespeichert wird.)
Abb. 8.5: Journal of Marketing - Beispieldatensatz Copyright 1999 American Marketing Association Journal Of Marketing 1999, Winter SECTION: BOOKS REVIEWS; Vol. 63, No. 1; Pg. 121 LENGTH: 2007 words HEADLINE: Breaking Up America: Advertisers and the New Media World; by Joseph Turow (Chicago: University of Chicago Press, 1997, 242 pp., $ 22.50) BYLINE: TERRY CLARK, Editor, Emory University, HERBERT J. ROTFELD, Auburn University BODY: Fear of Audience Segmentation In a style that is reminiscent of, but more negative than, Alvin Toffler's now-classic Future Shock, Turow decries the changing media system, viewing audience segmentation and media demassification as potentially destructive forces in modern society. Unlike some of business' critics, he does not blame
8 Wirtschaftswissenschaftliche Informationen
201
some amorphous business conspiracy for the increasing fragmentation of media audiences. But his seemingly intuitive cultural analysis of media audiences and mostly anecdotal review of changes in how the trade press discusses those audiences presents a paranoid view of the U.S. cultural future. As the most visible of business practices, marketing is criticized by almost everyone, from social critics to public policymakers to political pundits. Even people meeting at social gatherings will j u m p on marketing practitioners they have just met with all sorts of complaints. Deceptive advertising, audience manipulation, market abuse of children, and cultural destruction are among the social ills often laid at the feet of the marketing business. And as a core area of that business, market segmentation itself increasingly has been criticized for all sorts of reasons. Although these criticisms often are voiced by people with limited knowledge or understanding of marketing theory and practice, the mere existence of the critics has influenced marketing theory and research. With even articles in Marketing News calling segmentation potential "exploitation of vulnerable populations" (e.g., Sims 1997), the research question becomes "when," not "if," segmentation might be unethical (Smith and Cooper Martin 1997). As firms of questionable products, such as cigarette companies, try to make optimal use of marketing tools, people who dislike the product itself attack those tools for all sorts of perceived ills (e.g., Rotfeld 1996, 1997a). Although the ethics and exploitation discussions themselves might sound racist and sexist, referring to "vulnerable populations" of women and black people as if these thinking adults possessed the cognitive control of children, the sellers of guns, alcoholic beverages, cigarettes, and legal gambling all are criticized for their market segmentation strategies in product design and advertising (Davidson 1996). ... ... Turow expects marketing as an institutional force to give a nation a single, shared culture, and to a point, it does that. But for the most part, it is incapable of doing so and never could. As my former officemate in graduate school seemed to say at least once a week, that is why there are so many flavors of Jell-O. BIBLIOGRAPHY: REFERENCES Baker, C. Edwin (1994), Advertising and a Democratic Press. Princeton, NJ: Princeton University Press. Barash, Robert (1997), "The Dumbing Down of America," Marketing News, 31 (October 27), 4. Davidson, D. Kirk (1996), Selling Sin: The Marketing of Socially Unacceptable Products. Westport, CT: Quorum Books. Gossage, Howard Luck (1986), Is There Any Hope for Advertising? K. Rotzoll, J. Graham, and B. Mussey, eds. Urbana, IL: University of Illinois Press.
202
8 Wirtschaftswissenschaftliche Informationen
Hentoff, Nat (1975), "A Survey of Publishers: Would You Run This Ad?" Business and Society Review, 14 (Summer), 8-13. Rotfeld, Herbert J. (1992), "Power and Limitations of Media Clearance Practices and Advertising Self-Regulation," Journal of Public Policy & Marketing, 11 (Spring), 87-95. — (1996), "Tobacco Firms Are Efficient Marketers. Should They Be?" Marketing News, 30 (September 9), 4, 11. -- (1997a), "'Ban' on Liquor Ads Not What It Seems," Marketing News, 31 (May 26), 12. -- (1997b), "The FTC and Marketing Abuse," Marketing News, 31 (March 17), 4. Sims, Rodman (1997), "When Does Target Marketing Become Exploitation?" Marketing News, 31 (November 24), 10. Smith, N. Craig and Elizabeth Cooper-Martin (1997), "Ethics and Target Marketing: The Role of Product Harm and Consumer Vulnerability," Journal of Marketing, 61 (July), 1-20. Zanot, Eric J. (1985), "Unseen but Effective Advertising Regulation: The Clearance Process," Journal of Advertising, 14(4), 44-51, 59, 68. L A N G U A G E : ENGLISH LOAD-DATE: February 5, 1999 SUBJECT: MARKETING (92%); MEDIA (89%); ADVERTISING (74%); T O B A C C O (64%); TELEVISION INDUSTRY (60%); CITY: CHICAGO, IL, USA (76%); £>we//e:Lexis-Nexis, File J M K T (stark gekürzt)
Ein mögliches Selektionskriterium bei der intellektuellen Recherche kann der Ort der Suchargumente im Text sein. Im „Journal of Marketing" sind einzeln ansprechbar: •
Bibliographie / Fußnoten (Bibliography / References)
•
Artikeltext (Body)
•
Sachtitel des Artikels (Headline)
•
Highlight (Abstract, falls im Text vorhanden)
•
Lead (Wortlaut des ersten Abschnittes des Artikeltextes)
•
HLEAD (Zusammenfassung der Suchfelder Headline, Highlight und Lead).
8 Wirtschaftswissenschaftliche Informationen
203
Die Länge der Artikel kann als Suchargument gebraucht werden. Möchte man z.B. Kurzartikel ausschließen, so ist bei Lexis-Nexis folgender Befehl ausfuhrbar:
length > 1.000,
wobei „Length" die Anzahl der Wörter im Body zählt. Der numerische Wert kann frei gewählt werden. Außer dem „Journal of Marketing" gibt es diverse weitere wirtschaftswissenschaftliche Zeitschriften in Volltextdatenbanken (recherchierbar in Gale/1 oder W.O.D. 1998a). An deutschsprachigen Zeitschriften liegen z.B. beim Online-Archiv GEN/OS u.a. vor: •
Absatzwirtschaft
•
Personal
•
Der Betrieb
•
DIW Wochenberichte / Deutsches Institut für Wirtschaftsforschung, Berlin
•
Konjunkturberichte / Institut für Wirtschaftsforschung, Halle
•
Marketing Journal
•
RWI Mitteilungen zur Wirtschaftsforschung / Rheinisch-Westfälisches Institut für Wirtschaftsforschung
•
Personalwirtschaft
•
Zeitschrift für das gesamte Kreditwesen.
Die Tendenz, retrievalfahige Parallelausgaben wissenschaftlicher Zeitschriften zu produzieren und auf dem Markt der Informationswirtschaft anzubieten, hält an.
8.3 Wirtschaftswissenschaftliche Linksammlungen NetEc - Gruppe Ein zentraler Einstieg in die Welt wirtschaftswissenschaftlicher WWW-Ressourcen ist die von Thomas Krichel betreute NetEc-Gruppe. „NetEc ist ein akademisches
204
8 Wirtschaftswissenschaftliche Informationen
Produkt, das von der internationalen Kooperation und von den Beiträgen und Kritiken der Benutzer lebt", stellt Sabine Schäfer in ihrem Übersichtsartikel zu wirtschaftswissenschaftlichen virtuellen Bibliotheken fest (Schäfer 1998, 24). Das „Portal" in NetEc zeigt Abbildung 8.6.
Abb. 8.6: NetEc - Eingangsbildschirm (Ausschnitt) NetEc is an international academic effort to improve the communication of Economics via electronic media. It consists of: •
Information on printed working papers on BibEc.
•
Data about electronic working papers on WoPEc,
•
Code for Economics and Econometrics on CodEc,
•
World Wide Web resources in Economics on WebEc,
•
Home Page Papers in Economics on HoPEc,
•
Jokes about economists and economics on JokEc
All datasets can be queried in a common search system. Consult the NetEc documentation for further Information. Comprehensive usage statistics are available. In anything is not working properly, please notify ,[email protected]" at once. Projects that are sponsored by NetEc are •
RePEc, a large distributed catalogue of economics papers
•
NEP, a series of reports on new additions to RePEc
Other projects that are associated with NetEc are • •
"Resources for Economists on the Internet" by William L. Goffe (searchable) EDIRC ("Economics Departments, Institutes and Research Centres in the World") by Christian Zimmermann, (searchable).
Quelle: http://netec.mcc.ac.uk/NetEc.html (24.8.1998)
Ressourcen von NetEc Von der NetEc-Site verzweigt die Suche zu den einzelnen Ressourcen der NetEcGruppe. BibEc ist ein bibliographischer Dienst (mit Abstracts), der (gedruckte)
8 Wirtschaftswissenschaftliche Informationen
205
Working Papers auswertet. Ende 1998 sind etwa 45.000 Titel aus rund 500 Working Paper-Reihen enthalten. WoPEc ist das Gegenstück zu BibEc, es weist den Weg zu den (derzeit gut 4.000) elektronischen Arbeitspapieren. CodEc verzeichnet Software für den Gebrauch in den Wirtschaftswissenschaften bzw. in der Ökonometrie. WebEc thematisiert den Gesamtbereich der Wirtschaftswissenschaften. (Wir haben WebEc bereits einmal gestreift; s.o. S. 183 f.). Sabine Schäfer urteilt sehr positiv über WebEc: „WebEc ist von einer großen Themenvielfalt, zeichnet sich durch Quellen aus der ganzen Welt aus und das alles kostenlos und leicht zu bedienen. ... Man kann kaum Fehler machen, und das Reinschauen dürfte sich in jedem Fall lohnen" (Schäfer 1998,28). Der Service HoPEc führt zu (privaten) Homepages, die graue Literatur zu den Wirtschaftswissenschaften speichern. JokEc letztlich ist eine Sammlung von Witzen. Die - auf Aktivitäten außerhalb der NetEc-Gruppe verweisenden - Links zu RePEc, einem Katalog wirtschaftswissenschaftlicher Reports, zu Goffes „Resources for Economists on the Internet" und zu Christian Zimmermanns
Sammlung wirt-
schaftswissenschaftlicher Forschungsstätten komplettieren die NetEc-Homepage.
Gemäß Thorsten Wichmann
ist NetEc die Internetquelle fiir wirtschaftswissen-
schaftliche Informationen schlechthin (vgl. Wichmann 1997). Nachdem die vormals fiir Wirtschaftswissenschaftler zentrale Netsite von William L. Goffe (vgl. Goffe 1994) auf dem Stand von 1996 verblieben ist, dürfte diese Einschätzung durchaus zutreffend sein. Goflfes Linksammlung hat jedoch auch heute noch Relevanz. Insofern kann man auch Manfred Boni zustimmen, insbesondere, wenn man die Pionierleistung
Goffes auf diesem Gebiet berücksichtigt.
„Die
längsten
und
hervorragenden Bemühungen um eine Katalogisierung aller für wirtschaftliche und wirtschaftswissenschaftliche Fragen relevanten Informationsquellen im Internet sind mit dem Namen und der Person Bill Goffe verbunden" (Boni 1996,41).
Fazit •
Die vielfaltigen Informationsressourcen sowohl in den Diensten der kommerziellen Informationswirtschaft als auch in den virtuellen Fachbibliotheken im World Wide Web dürften den Zugang zu (nahezu) aller publizierter Literatur gestatten.
206 •
8 Wirtschaftswissenschaftliche Informationen Im Umfeld der Volkswirtschaftslehre dominieren die beiden
Datenbanken
ECONIS und EconLit. ECONIS ist die Katalogdatenbank der Deutschen Zentralbibliothek für Wirtschaftswissenschaften; die einzelnen Datensätze sind durch den Standard-Thesaurus
Wirtschaft inhaltlich erschlossen. EconLit ist das
englischsprachige Gegenstück zu ECONIS. EconLit hat zwar nur etwa halb so viele Nachweise wie ECONIS, diese sind aber meistens mit Abstracts versehen. •
Betriebswirtschaftliche Informationen finden sich auf der deutschen Datenbank BLISS sowie - in quantitativer und qualitativer Hinsicht weitaus besser - auf dem us-amerikanischen Produkt ABI/INFORM.
•
Datenbanken mit ausschließlich bibliographischen Informationen bedingen als zweiten Arbeitsschritt die Beschaffung der für relevant eingeschätzten Volltexte. Hierfür kommen besonders infrage: die Deutsche Zentralbibliothek für Wirtschaftswissenschaften, das Sondersammelgebiet Betriebswirtschaft an der Universitätsbibliothek Köln sowie das British Library Document Supply Center oder jeder elektronische Dokumentlieferdienst (wie z.B. Subito).
•
ABI/INFORM bietet für einen Teil seiner tief erschlossenen bibliographischen Datensätze in derselben Datenbank die Volltexte an. Das Information Retrieval kann bei solch einer Datenbank auf die kontrollierten Terme zurückgreifen, die bei der Indexierung erstellt worden sind, und vereinfacht so die Suche. Der ansonsten nötige Medienbruch bei der Volltextbeschaffung entfällt.
•
Datenbanken, die ausschließlich die Volltexte ohne jede dokumentarische Auswertung anbieten (unser Beispiel ist das „Journal of Marketing") verlangen elaborierte Suchstrategien, etwa den Einsatz von Abstandsoperatoren oder die Anwendung automatischer Verfahren. Vorteil ist, daß man nach jedem Wort eines Artikels gezielt suchen kann. Nachteil ist, daß man von der Masse der Wörter nahezu „erschlagen" wird.
•
Informationsressourcen im World Wide Web (aber auch Hinweise zu gedruckter Literatur) finden sich in der virtuellen Bibliothek NetEc. Ein wichtiger Teil von NetEc ist WebEc mit Links, die den Gesamtbereich der elektronischen Publikationen der Wirtschaftswissenschaften abdecken.
9 Ergebnisse der Marktforschung
Die Marktforschung als Teil des Marketing beschäftigt sich mit der systematischen Informationsgewinnung über konkrete Teilmärkte (Angebot wie Nachfrage). Ihr kommt gemäß Heribert Meffert und Manfred Bruhn die Aufgabe zu, „Käufer- und Marktpotentiale zu identifizieren und Anhaltspunkte für die Formulierung von Zielen und Strategien sowie für die Ausgestaltung der Marketinginstrumente zu liefern" (Meffert/Bruhn 1997, 69). Die Informationsgewinnung geschieht entweder durch Primärforschung oder durch Sekundärforschung. Bei der Primärforschung werden konkret für ein bestimmtes Problem - empirische Erhebungen (etwa Befragungen) durchgeführt. Im Rahmen der Sekundärforschung „ist das Informationsmaterial gegeben und dem Untersuchungszweck entsprechend auszuwerten" (ebd., 95) und zentral für die Informationswirtschaft - „hierbei können sowohl externe als auch interne Informationsquellen herangezogen werden" (ebd.). Wir skizzieren im Folgenden die Typen der externen Informationsressourcen. Sekundärforschung ist in der Regel der erste Schritt bei einem Marktforschungsprojekt, ist es doch sinnvoll, zuerst alle Informationen aufzuarbeiten, die bereits vorliegen, und auf dieser Basis die Primärforschung - soweit noch nötig - zu planen. Sabine Graumann
betont die Bedeutung der CW/«e-Sekundärmarktforschung.
„Während Sekundärforschung früher teuer, umständlich und zeitaufwendig war, ist sie heutzutage umfassend, schnell, aktuell, präzise und im allgemeinen billiger als Primärforschung. Der Hauptgrund für diesen Wandel liegt darin, daß der Marktforscher von seinem Schreibtisch aus einen direkten Online-Zugriff zu einen Vielzahl von elektronischen Quellen hat" (Graumann 1998, 115). Marktforschungsinformationen sind nicht nur in „ausgewiesenen" Marktforschungsdatenbanken enthalten, sondern in einer Reihe weiterer Informationstypen, etwa in den wirtschaftswissenschaftlichen Datenbanken (Literatur zu Ländern, Branchen, Märkten, Produkten und Unternehmen), Unternehmensdatenbanken oder Zeitreihendatenbanken. Diese Quellen werden in den entsprechenden Kapiteln besprochen. Spezielle Marktforschungsinformationen werden über die Kanäle der kommerziellen Informationswirtschaft (und dies im Hochpreissegment) verteilt. Das World Wide Web mit seinen kostenlosen Quellen ist hier nahezu gänzlich zu vernachlässigen. Graumann stellt im Anschluß an entsprechende Versuche fest, „Marktforschungsstudien im Volltext werden in der Regel nur über kommerziellen Datenbankanbieter bzw. über die Institute selber vermarktet und nicht kostenfrei angeboten" (ebd., 122).
208
9 Ergebnisse der Marktforschung
Wir wollen bei den „ausgewiesenen" Marktforschungsinformationen drei Typen unterscheiden: •
Datenbanken mit Detailinformationen (einzelne Tabellen, Zahlenangaben oder Ranglisten)
•
bibliographische Datenbanken zur Marktforschung
•
Volltexte der Marktforschungsinstitute oder von Brokern.
9.1 Fakteninformationen zur Marktforschung Bibliographische Datenbanken, wie wir sie im vorangegangenen Kapitel kennengelernt haben, haben eine dokumentarische Bezugseinheit, etwa einen Zeitschriftenartikel, zur Basis. Diese Bezugseinheit wird als Ganzes durch den Datensatz abgebildet. Nun ist es aber auch möglich, aus den dokumentarischen Bezugseinheiten die jeweils interessanten Informationen zu selektieren und unabhängig von ihrer Herkunft als eigenen Datensatz abzuspeichern. Wenn in einem Artikel nur genau eine Tabelle für dokumentationswürdig erachtet wird, so wird eben auch nur diese ausgewertet und der Rest übergangen. Es existieren Informationen auch außerhalb von Publikationen. Marktforschungsinstitute erheben diverse Daten, die sinnvoll zu Tabellen oder Graphiken zusammengefaßt werden können. Auch hier wird die einzelne Tabelle, die einzelne Abbildung zur Dokumentationseinheit. Ein erster Vorteil solchen Vorgehens ist es, direkt die gewünschte Fakteninformation zu bekommen; ein Medienbruch wie bei bibliographischen Datenbanken ist nicht möglich. Der zweite Vorteil ist, nur die gewünschte Information zu erhalten. Information „Overload" wird dadurch verhindert. Es ist ja durchaus vorstellbar, daß ein umfangreicher Artikel, der sonst als Einheit behandelt wird, außer unserer gesuchten Information noch diverse weitere Aspekte berührt, die mit unserem Informationsproblem nichts zu tun haben.
Marktforschungergebnisse für Deutschland: FAKT Unser Beispiel für Informationsressourcen mit Tabellen und - als Teil davon Ranglisten ist die Datenbank „FAKT", hergestellt von Infratest Burke in München. Erschlossen werden seit 1989 rund 170 Quellen (Tageszeitungen, Wirtschafts-
9 Ergebnisse der Marktforschung
209
magazine, Nachrichtenmagazine, Fachzeitschriften, Informationsdienste von Bundesministerien und Forschungsinstituten sowie Ergebnisse der publizierten Studien von Infratest Burke und anderen Marktforschunginstituten; vgl.. Klassen-Meurer 1994, 507). Inhaltliches Schwergewicht ist in regionaler Hinsicht Deutschland (ca. 70% der Informationen); der Rest verteilt sich auf das Ausland mit Schwerpunkt Europa. Thematische Schwergewichte innerhalb der Marktforschung sind Ranglisten führender Unternehmen, Markt- und Brancheninformationen, Umfrageergebnisse, Verbraucherverhalten sowie Prognosen. 95% der Datensätze sind in Form von einfachen und übersichtlichen
Tabellen aufbereitet. Enthielt die Informationsquelle eine
Graphik, so werden die Werte für FAKT in eine Tabelle übertragen. Zusätzlich sind z.T. Abstracts enthalten, die die Interpretation der Tabelle unterstützen. FAKT ist ausschließlich online zu recherchieren. Die Zuwachsrate beträgt ca. 2.600 Datensätze pro Jahr. Inhaltserschließende Sucheinstiege in FAKT sind: •
Thesaurus (zweisprachig deutsch-englisch)
•
Sachgebietsklassifikation
•
Ländernamen
•
Eigennamen
•
Abstracts (soweit vorhanden)
•
Dokument- und Tabellentitel.
Die Titel der Datensätze und der darin enthaltenen Tabellen werden „nach dokumentarischen und rechercherelevanten Gesichtspunkten" vergeben (Norpoth/Nüßlein 1995, 210), so daß auch die Titelinformationen sinnvolle Sucheinstiege darstellen. Bei der Suche nach Ranglisten von Unternehmen, Produkten usw. muß mit dem Term „top" im Titel gesucht werden. Wie vertrauenswürdig sind die Tabellen? FAKT garantiert die Qualität der eigenen (dokumentarischen) Arbeit. „Korrektheit der Daten kann im Falle von FAKT nur korrekte Wiedergabe der Daten aus dem Quelldokument bedeuten", betonen Susanne Norpoth und Desiree Nüßlein (Norpoth/Nüßlein 1995, 210). Die Angaben in den Quellen werden nicht hinterfragt oder gar nachrecherchiert. Als Beispiel haben wir nach Tabellen mit Ranglisten derjenigen Unternehmen gesucht, die am häufigsten im deutschen Fernsehen werben. Als Titelterm muß mit
210
9 Ergebnisse der Marktforschung
,top" gesucht werden. Ländername ist „Deutschland", als Deskriptoren bieten sich ,Fernsehspot" und „Unternehmen" an. Die Suchanfrage bei DataStar
lautet:
Femsehspot.de. and Unternehmen.de. and Deutschland.cn. and top.ti.
Das Suchergebnis ist als Abbildung 9.1 angegeben. Wir erhalten in dem Datensatz insgesamt drei aussagekräftige Tabellen zu unserem Informationsproblem.
Abb. 9.1: FAKT - Beispiel für eine Tabelle mit Rangordnung 1 FAKT AN N96-000562 960429. TI D: Top 20 Werbespots im Fernsehen 1995. G: Top 2 0 Television Advertising Spots 1995. SO Media-Facts, 03/1996, S. 9. DT 960000. IN Media Control. TB Tabelle 1: Top 20 Werbespots im Fernsehen nach Branchen 1995 Spots Dauer gesamt Rang Anzahl in Stunden Branche 1 2 3 4 5 6 7 8 9 10
Spielzeug Post PKW (inklusive Kredit) Zeitschriften Waschmittel Riegel Versand Filme Tontraeger Spuelmittel Kaffee
44 .335 . 42..571 31..782 23..439 21..277 19..200 18.. 655 18..477 16.. 930 14.. 964
240:: 18::08 156:: 50: : 35 227 : 55::30 130:: 50::2 6 176:: 55::34 135:: 56: : 43 : 03 265:: 00: 104 : 45: : 09 127 : 25::54 103:: 11: : 31
11 12 13 14 15 16 17 18 19 20
Getreideerzeugnisse Bier (alkoholisch) Zahncreme Kaese Joghurt Pralinen Banken TV Sender Versand Tontraeger Herrenparfuem
14 .597 . 14 .549 . 12..4 62 11..795 11.,787 11.,415 11.,020 10..819 9.,735 9.,584
82:: 16: : 04 104 : 03::23 67:: 40::4 5 58:: 27::4 6 74 : 27::59 77 : 54::20 77 : 27::00 90:: 56::01 169:: 24::4 0 50:: 51::16
Quelle: Media Control
211
9 Ergebnisse der Marktforschung
Tabelle 2: Top 20 Werbespots im Fernsehen nach Firmen 1995 Spots Dauer gesamt Rang Anzahl in Stunden Firma 1 2 3 4 5 6 7 8 9 10
Procter & Gamble Henkel Kraft Jacobs Suchard Ferrero Beiersdorf Union Mattel Effem Vital-Versand Langnese-Iglo
11 12 13 14 15 16 17 18 19 20
Nestle Lever Benckiser Blendax Lingener + Fischer Wiek Pharma H. Bahlsen Dr. Oetker Kellogg's Mars
30 088 25 932 18 180 16 121 13. 603 12. 350 10. 627 10. 458 10. 074 9. 504
258 : 47 :21 168 : 26: 01 115 : 45: 58 115 : 32 : 2 9 81 : 54:51 73 : 17 : 09 67 : 27 : 34 57 : 47 : 49 130 : 08:18 60 : 20: 08
9. 102 9. 025 9. 025 8. 873 8. 142 7 904 7 824 7. 398 7 361 7 321
57 :24 : 18 57 : 12: 56 56 : 06:45 59 : 21: 45 51 : 03: 05 59 : 4 8 : 0 4 45 : 28: 39 43 : 58: 50 43 : 59: 04 43 : 22: 05
Quelle: Media Control Tabelle 3: Top 20 Werbespots im Fernsehen nach Marken 1995 Dauer gesamt Spots Rang Anzahl in Stunden Marke 1 2 3 4 5 6 7 8 9 10
Nivea Bahlsen Kellogg's Nestle Premiere Jacobs McDonald's Wrigley's Dr. Oetker Kinder
8. 030 7 .824 7 .361 7 .202 6. 642 6. 593 6. 487 5. 962 5. 809 5. 778
48 : 14 : 30 45 : 28: 39 43 : 59: 04 43 •16:59 62 .55:20 44 : 18 : 58 43 •08:29 39 .46:32 34 •44:20 44 : 4 9 : 30
11 12 13 14 15 16 17 18 19 20
Persil Classic-Video Fairy Barbie Calgonit Odol Mueller Sueddeutsche Lotterie Ariel Milka
5. 588 5. 533 5. 386 5. 344 5. 228 5. 222 4 .992 4 .700 4. 573 4. 4 62
44 •44:53 73 : 45:14 53 21:05 40 : 28 : 34 30 : 57 : 4 0 33 •21:50 25 : 15: 40 27 .21:40 51 07:15 32 16:45
Quelle: Media Control.
9 Ergebnisse der Marktforschung
212
PT Tabelle. DE Fernsehen; Werbetraeger; Spot; Fernsehspot; Werbung; Fernsehwerbung; Spielwaren; Post; Pkw; Zeitschrift; Waschmittel; Suesswaren; Versandhandel; Film; Spuelmittel; Kaffee; Getreide; Bier; Zahnpasta; Kaese; Joghurt; Bank; Fernsehsender; Parfüm; Unternehmen; Hersteller; Marke; Unternehmen; television; advertising-medium; commercial; television-commercial; advertising; television-advertising; toys; postal-service; passengervehicle; magazine; detergent; sweets; mail-order-trade; film; washingup-liquid; coffee; grain; beer; toothpaste; cheese; yogurt; bank; television-station; perfume; enterprise; manufacturer; brand; enterprise. KW Tontraeger. CC Branche (Umsatz, Marktentwicklung) (BR); Medien (Werbung, Medienforschung, Nutzung, Verhalten) (ME); Branch of Industry (turnover, market development); Media (advertising, media research, use, behaviour). CN Deutschland; Germany. Quelle: DataStar, File FAKT
Kaufkraftkennziffern: Informationen der GfK-Marktforschung Die Gesellschaft für Konsumforschung
(GfK) in Nürnberg ist eines der großen
deutschen Marktforschungsunternehmen. Vorgestellt werden soll in dieser Stelle eine der Aktivitäten der GfK, ihre Erhebungen zu den Bevölkerungsstrukturdaten und den Kaufkraftkennziffern, sind diese doch online (beim Host GENIOS) abfragbar. Alle Angaben werden von der Abteilung Regionalforschung
der GfK
Marktforschung
GmbH erstellt. Bevölkerungsstrukturdaten sind eine zentrale Basis für Maßnahmen der Marktbearbeitung, sie dienen zur Identifikation , Quantifizierung und Lokation von Zielgruppen. Die GfK-Daten sind sowohl nach statistischen Regionen (Bundesländer, Regierungsbezirke, Stadt- und Landkreise, Gemeinden) als auch nach Postleitzahlen (1-stellige, 2-stellige und 5-stellige Postleitgebiete) sortiert. Jeder Datensatz enthält folgende Angaben: •
Region
•
Bevölkerung (Anzahl der Einwohner) Anzahl der Haushalte; durchschnittliche Haushaltsgröße
9 Ergebnisse der Marktforschung
213
•
Anzahl der Wohngebäude (Anteil der 1-2-, 3-6- und 7-und-mehr-Familienhäuser)
•
Umzugshäufigkeit
•
Alter des Haushaltsvorstandes (bis 29 Jahre, 30-39,40-59, über 60)
•
Status (Beruf, Einkommen): niedrig, mittel, hoch
•
Anzahl Personen im Haushalt (Single-Haushalte, Mehrpersonen-Haushalte ohne Kinder, Mehrpersonen-Haushalte mit Kind/ern).
Informationen zur Kaufkraft der Regionen bzw. Gemeinden sind ein Hilfsmittel für Unternehmen bei deren Standortplanung sowie bei der Leistungsbewertung des Außendienstes. Die Datenbanken zu den Kaufkraftkennziffern sind ebenfalls nach den deutschen Regionen und den Postleitgebieten sortiert. Die einzelnen Datenbanken erfassen jeweils unterschiedliche Aspekte der Kaufkraft: •
Kaufkraftkennziffern allgemein (Summe der Nettoeinkünfte und weiterer Erlöse der Bürger)
•
einzelhandelsrelevante Kaufkraft (nachfrageorientierter Teil der Kaufkraft)
•
sortimentsbezogene Kaufkraft (für zwölf Sortimente des Einzelhandels: Lebensmittel, Nahrungs- und Genußmittel; Gesundheits- und Körperpflege; Einrichtungsbedarf, Möbel; Elektrogeräte, Leuchten; Baumarkt-Sortimente; Bekleidung, Textil; Uhren, Schmuck, Lederartikel; Schuhe; Bücher, Schreibwaren, Zeitschriften, Neue Medien; Hausrat, Glas, Porzellan; Unterhaltungselektronik, Rundfunkgeräte, Fernsehgeräte; Sport, Spiel, Hobby.
Die Datenbanken zu den Kaufkraftkennziffern lassen Suchen nach diesen Angaben zu: •
Region
•
Anzahl der Einwohner (Promille der Einwohner bzl. Deutschland)
•
Kaufkraft (allgemein - einzelhandelsrelevant - sortimentsbezogen, je nach Datenbank) in Mio. DM, pro Kopf in DM, in Promille (bzl. Deutschland).
Unser Beispiel in Abbildung 9.2 ist Resultat einer Suche nach den KaufkraftkennzifTem des Lebensmitteleinzelhandels in Bayern.
214
9 Ergebnisse der Marktforschung
Abb. 9.2: Sortimentsbezogene Kaufkraftkennziffern. Beispieldatensatz Stand: 1997-12-01 Sortiment: Lebensmittel, Nahrungs- und Genußmittel Gebietsschlüssel: 9 Gebiet: Bayern Bereich: 1 Bundesländer Bevölkerung: 11993484 Bevölkerung, Promille: 146.588 Haushalte: 5339300 Sortimentsbezogene KK in Mio DM: 39647.112 Sortimentsbezogene KK p.c.: 3305.721 Sortimentsbezogene KK, Prom.: 149,47 Sortimentsbezogene Kaufkraftkennziffer: 101,966 Quelle: GENIOS; File GFKSR
9.2 Bibliographische Marktforschungsdatenbanken Nicht immer sind die - im nächsten Abschnitt zu besprechenden - Volltextdatenbanken aktuell; einigen Marktforschungsinstituten ist die Verteilung ihrer Berichte in gedruckter Form wichtiger als in der elektronischen Form (vgl. Norpoth/Nüßlein 1995, 204 f.). Hier kommen die bibliographischen Datenbanken zum Zuge. Klar ist, daß infolge des Medienbruches nach der Recherche die Treffer in Druckform bei den Instituten zu ordern sind. Als Beispiel für eine bibliographische Datenbank in der Marktforschung stellen wir kurz „International Market Research Information" (IMRI) vor. IMRI dokumentiert nicht nur Marktforschungsberichte, sondern auch Literatur über Theorien und Techniken der Marktforschung. Zusätzlich werden Kurzangaben zu Marktforschungsinstituten angeboten. Die Datenbank reicht bis zum Jahre 1964 zurück. Sie wird von Norton Sterling Associates in Coalville (Leicester) produziert.
9 Ergebnisse der Marktforschung Die
Inhaltserschließung
geschieht
215 durch
Deskriptoren
sowie
Abstracts.
Die
„Abstracts" bei den Finneninformationen (über die Marktforschungsinstitute) enthalten eine Beschreibung der hauptsächlichen Forschungsfelder des betreffenden Unternehmens. Die Volltextbeschaffung verläuft zweigleisig. Die Literatur zur Theorie und Methode der
Marktforschung erscheint
in Zeitschriften, Kongreßbänden
und
weiteren
Büchern. Sie ist beschaffbar wie andere Literatur auch - über Buchhandel, Bibliotheken oder Dokumentlieferdienste. Die Reports der Marktforschungsinstitute sind bei den betreffenden Herausgebern zu beschaffen. Die Datenbank gibt im Quellenfeld die Telefonnummer der Einrichtung an. Einige Volltextdatenbanken überschreiben ihre Berichte durch die jeweils aktuelle Version, so daß u.U. alte - aber durchaus (etwa für Zeitreihen) brauchbare - Informationen nicht mehr elektronisch vorhanden sind. Vorteil von bibliographischen Datenbanken ist es, eine solche „Geschichte" von Reports lückenlos abzubilden. Unser Nachweisbeispiel aus Abbildung 9.3 wurde bei einer Recherche nach dem Marktpotential von Vitaminen zum Einsatz in Kosmetika gefunden. Am Rande: Beachtenswert ist der Berichtsverzug bei dieser Dokumentationseinheit. Obgleich der Marktforschungsbericht bereits im Mai 1996 erschien, wurde der Nachweis erst Anfang 1998 in die Datenbank eingegeben.
Abb. 9.3: International Market Research Information - Nachweisbeispiel International Market Research Information - 1964 to date (IMRI) Accession number & update: 9701992 19981201 Agency name/title: Global Market for Vitamins in Food, Feed, Pharma, and Cosmetics. Source:
Business
Communications
Co
Inc
Tel.+ l
203
AN.Number:9500123, Price $2950.,, PG: 149 pg., DATE: 31/05/1996. Publication date: 31 May 1996 (19960531) Publication type: S. Language: EN. Country of publication: USA, World, Europe.
853
4266
216
9 Ergebnisse der Marktforschung
Descriptors:
Vitamins;
Food;
Food-Additives;
Cosmetics;
Pharmaceutical-
Companies; Food-Additives-Supplements; Report-No-096 Abstract:
Report
characteristics
providing
of vitamins
an
overview
on
the
technical
in relation to their applications
and
economic
in food, feed,
pharmaceuticals, and cosmetics. Analyzes the production processes, especially when biotechnological steps are involved. Covers formulations for vitamins. Forecasts applications rates of different usages, along with market share estimates for each vitamin. Analyzes price and historic developments of market sizes for each vitamin. Profiles major players. Entry date: 10 January 1999 (19990110). COPYRIGHT BY NSA Ltd, Coalville, UK Quelle: DataStar; File IMRI
9.3 Marktanalysen von Marktforschungsinstituten, Banken und Brokern im Volltext „Wenn Marktforscher ein möglichst vollständiges Bild einer Branche, ihrer Stärken und Schwächen, ihrer Marktfiihrer und Prognosen benötigen, so stellen die Volltextdatenbanken der Marktforschungsinstitute die beste weil umfangreichste und vollständigstes Quelle dar, diese Art der Information zu finden" (Graumann 1998, 121). Aus dem großen Angebot an Volltextdatenbanken wählen wir paradigmatisch zwei Produkte aus, „Investext" und „Frost & Sullivan Electronic Distribution", ein Gemeinschaftsprodukt von Frost & Sullivan
und der Dialog
Corp. für deren
Online-Archiv Profound.
Investext Investext ist die größte Datenbank weltweit mit Volltextquellen von Broker-Berichten. Investext greift auf Informationsproduzenten wie Investmentbanken, Brokerhäuser oder Unternehmensberatungsfirmen zurück. Z.T. vertreibt Investext die Berichte im Online-Bereich exklusiv, z.B. die Reports von ING Barings oder die europäischen Berichte der Deutschen Morgan Grenfell. Die Datenbank wird von The Investext Group in London produziert. Investext Group ist eine Geschäftseinheit von Thomson Financial Securities Data (TFSD; London).
9 Ergebnisse der Marktforschung
217
Muttergesellschaft von TFSD ist Thomson Financial Services (ebenfalls in London), die wiederum Teil von The Thomson Corporation
(Toronto) ist. Außer Investext
stellt dieser Datenbankproduzent weitere Datenbanken zur Marktforschung her, darunter
Markintel
Communications, Baskerville
mit
Marktforschungsberichten
Cowles/Simba
Information,
aus
Quellen
wie
Jupiter
Faulkner Information Services
oder
Communications.
Investext, das „Flaggschiff' der Investext Group, bietet zu derzeit (Anfang 1999) weit über einer Million Berichten über 55.000 Unternehmen und mehr als 50 Branchen Zugang. Fortgeschrieben wird die Volltextdatenbank um rund 600 neue Reports arbeitstäglich. Alte Berichte werden nicht überschrieben; sind also zusätzlich zum jeweils aktuellen Report als historische Ergänzung abfragbar. Die rund 450 Zulieferer sind schwerpunktmäßig
in Nordamerika
(rund
200
Partnerunternehmen), Europa (ca. 175) und im asiatisch-pazifischen Raum (gut 60) beheimatet. Abbildung 9.4 listet zur Verdeutlichung der Quellenlage bei Investext deren deutsche Quellen auf.
Abb. 9.4: Deutsche Quellen von Investext B. Metzler seel. Sohn & Co. Barclays de Zoete Wedd Deutschland GmbH Bayerische Landesbank Bayerische Vereinsbank BHF Bank Commerzbank Deutsche Bank Research Deutsche Bundesbank Deutsche Morgan Grenfell Dresdner Bank FT Analysis Kleinwort Benson Research GmbH Lehman Brothers Inc. LGT Bank in Liechtenstein Deutschland GmbH Oppenheim Finanzanalyse GmbH Salomon Brothers AG SBC Deutschland AG Schröder Münchmeyer Hengst Research Trinkaus Capital Management UBS Deutschland AG
218
9 Ergebnisse der Marktforschung
Vereins- und Westbank AG Verlag Hoppenstedt & Co. WestLB Research GmbH Quelle: Investext Group
Distributionskanäle von Investext sind Print, online über diverse kommerzielle Hosts, Internet (über das Investext-System „Research Bank Web" mit Dokumentenausgabe im Originallayout mittels PDF-Format; vgl. Kassel 1998) sowie CD-ROM. Einen Ausschnitt aus einer Investext-Recherche in der World Wide Web-Version von DataStar bringen Abbildungen 9.5 bis 9.6.
Abb. 9.5: Recherche bei Investext. Ergebnisanzeige 1: Struktur des Dokuments INVESTEXT Broker Reports - 1993 to date (INVE) Select sections of the report. Sections where one or more of your search terms occur are preselected. •
TI Coal: Australia.
•
SO WARBURG DILLON READ (ASIA). Analyst: Giubin, M. Report Type: INDUSTRY REPORT. Published: February 03 1999. Location: HONG-KONG, SOUTHEAST- ASIA, ASIAN-CONTINENT. Total Pages of Report: 002.
•
DT 990203 ... Section/Table Headings
•
Steaming Coal Demand Holding Up Relatively Well
TX (1)
•
Coking Coal - Demand Dries Up But Market Share Ris
TX (1)
•
Coking Coal - Demand Dries Up But Market Share Ris
TX (2)
•
Steaming Coal
TX (2)
Quelle: DataStar, File INVE
9 Ergebnisse der Marktforschung
219
Unsere Recherche suchte nach einem aktuellen Marktbericht zu Kohle in Australien. Gesucht wurde Anfang März 1999 beim Investext-Datenbanksegment 1993 bis heute beim Online-Archiv DataStar mit folgender Frage:
coal.ti. and australia.ti. and rt=l.
Die Terme „coal" und „australia" sollen demnach im Titel vorkommen. Mit der Berichtsform (report type rt) „Industry Report" (I) legen wir uns auf Branchenberichte fest, verzichten also z.B. auf alle Unternehmensberichte. Die Recherche führt zunächst zu einer Titelliste, aus der wir einen der aktuellen Reports auswählen. Die erste Anzeige fuhrt uns zur Struktur des Dokuments (siehe Abbildung 9.5). Die einzelnen Textteile (TX) können einzeln abgerufen werden. Wären Tabellen im Text enthalten, so würden auch diese einzeln aufgelistet. Wir haben den Gesamttext angekreuzt und den Volltext des Dokuments erhalten (siehe Abbildung 9.6). Die inhaltserschließenden Informationen •
Deskriptoren und
•
SIC-Codes
beziehen sich auf die einzelnen Textabschnitte. Der „Volltext" ist insofern vollständig, da der komplette Fließtext des Dokuments vorhanden ist. Da der Host mit dem ASCII-Format arbeitet, sind graphische Textelemente nicht abgespeichert. (In unserem Beispieltext - am Anfang von Abschnitt 2 - sind ein entsprechender Hinweis sowie Telefonnummern zum Nachrecherchieren angegeben.) Bei Online-Archiven, die mit dem PDF-Format arbeiten, sind natürlich die Graphiken vorhanden.
Abb. 9.6: Recherche bei Investext. Ergebnisanzeige 2: Volltext des Dokuments 1 IN VE TI Coal: Australia. SO WARBURG DILLON READ (ASIA). Analyst: Giubin, M. Report Type: INDUSTRY REPORT. Published: February 03 1999. Location: HONG-KONG, SOUTHEAST-ASIA, ASIAN-CONTINENT. Total Pages of Report: 002. DT 990203. TX 1 O F 2 In this Section:
220
9 Ergebnisse der Marktforschung
Subjects: IMPORTS-EXPORTS, MARKET-SHARE-COMPANY-BRAND, FINANCIAL-INFORMATION, COMPANY-ANALYSES, INDUSTRYOVERVIEW-OUTLOOK, SUPPLY-DEMAND, COAL, ENERGY, LEISURERECREATION. US SIC Code : 1200. COAL January in Review - Steaming Coal Demand Holding Up Relatively Well. 3 February 1999 Negotiations on steaming and semi-soft coking coal are yet to be concluded. MIM and Shell had been negotiating with Chubu Electric Power this week. According to TEX, Chubu is asking for a US$5.50/t (16%) cut in contract price, while MIM are asking for less than a US$4.50/t cut. The latest data continues to support the established trends. Demand for coking coal has dried up but Australian producers continue to gain market share into Japan and Europe at the expense of the Canadians and North Americans. The outlook for steaming coal demand is much better in comparison. Tough times in Asia should divert energy raw material demand to the cheapest form of fossil fuel energy - coal. The offsetting risk is the threat to market share from Indonesian producers. WDR price assumptions allow for a US$5.50/t cut in thermal coal and a US$6/t (16%) cut in semi-soft coking coal. COKING C O A L - D E M A N D DRIES UP BUT M A R K E T SHARE RISES * The outcome for semi-soft coking coal has not yet come. Expect an outcome similar to that of hard coking coal, although there is a chance of a slightly better result as Japanese steel mills continue to ramp up PCI injection rates. We anticipate that the PCI injection rate will rise from around 130kg/t of pig iron in JFY98 to 145kg/t in JFY99. * Coking coal from South Blackwater and Collinsville have been re-classified from hard coking coal to semi-soft coking coal by the JSM, so the price drop for this brand of coal should be greater than the publicised 18% drop in hard coking coal price. * Rio Tinto's Hail Creek was postponed due to the state of the coking coal market. * South Korean imports of hard coking coal fell 23% (3.2Mt) during Jan-Nov 98 despite pig iron production holding up as the country had entered into a period of de-stocking. * According to ABS, Australian hard coking coal exports rose by 2.4Mt (4.5%) to 56Mt in 1998 compared to 53.6Mt in 1997. Exports to Japan rose by 0.85Mt (6%) to 15.1 Mt while exports into Europe rose by 4.7Mt (43%) to 15.5Mt. The chart below illustrates this. The average realised price is represented in US dollars. The deterioration reflects the fall in US dollar contract price and a larger spot component sold into Europe because of the favourable movement in the Australian dollar during the period. Freight rates into Europe have also fallen and have also significantly contributed to the strength in market share.
9 Ergebnisse der Marktforschung
221
2 OF 2 In this Section: Subjects: ORDERS-AND-CONTRACTS, MARKET-SHARE-COMPANYBRAND, IMPORTS-EXPORTS, COMPANY-ANALYSES, INDUSTRYOVERVIEW-OUTLOOK, SUPPLY-DEMAND, COAL, ENERGY, LEISURERECREATION. US SIC Code: 1200. Coking Coal - Demand Dries Up But Market Share Rises Graphical Material Omitted - Call Boston (617) 856-2704, U.S./Canada (800) 662-7878, U.K./Europe (+44) (0) 171 369 7860 for Price and Availability: Australian Hard Coking Coal Exports To Europe And Average Price Of Total Hard Coking Exports 1997-98 * The CQCA/Gregory mines shipped 6.3Mt in the December quarter compared with 7Mt the previous quarter, reflecting poor market conditions and washery shutdowns at Peak Downs and Goonyelia as well as other operational setbacks. * Canadian coking coal exports fell 5.7% (1.3Mt) for Jan-Sep 98. Canadian market share is expected to fall next year as subsidies granted by Japanese Steel Mills are phased out and as price reduction coerce high cost producers to cut production. We expect Canadian market share into Japan to drop from 25% in JFY98e to 20% in JFY99e. This should see 3.7Mt less Canadian coking coal entering this market. * By contrast, we anticipate that Australian market share will increase from around 30% in JFY98e to 34% in JFY99e or an extra 3.5Mt. STEAMING COAL * Thermal coal spot prices were steady during the month at around US$23,25/t FOB (BJ spot 6,700kcal). * MIM and Shell had been negotiating with Chubu on Feb 2 and Oakbridge on Feb 3. According to TEX, the outcome is said to range between a cut of US$4.50-5.50/t (13-16%). * Japanese Electric Power Utilities consumed 3.96Mt of thermal coal in December, up 6.8% from November and up 2% on last year. * South Korean thermal coal imports have risen 10% (2.8Mt) for the Jan-Nov 98 period despite the economic crisis because a number of coal-fired power stations came on stream from KEPCO. * Australian thermal coal exports for the period Jan-Oct 98 were up 7.3Mt (12%) to 68.4Mt. Exports to South Korea increased by 3.4Mt (34%) to 13.5Mt while exports to Europe rose by I.8Mt (41%) to 6.1Mt. * Rio Tinto produced 34.5 Mt of coal (mostly thermal) in the December quarter, up 53% or 11.9Mt from last year. This largely reflected an 11 Mt (YoY) rise from the US coal operations which accounts for the acquisition of new PRB assets and a strong operational performance from the existing North American mines. Quelle: DataStar, File INVE
222
9 Ergebnisse der Marktforschung
Angesichts der riesigen Quellenlage von Investext ist klar, daß diese Informationsressource nicht ausschließlich der Marktforschung zugerechnet werden kann, sondern auch dem Bereich der Unternehmensinformationen.
Aktuelle exklusive Reports: Frost & Sullivan Electronic Distribution Das Online-Archiv Profound (als Teil der Dialog Corp.) hat mit Frost & Sullivan einen Exklusivvertrag fiir die elektronische Verbreitung gewisser Reportreihen abgeschlossen. Hiermit ist die aktuelle elektronische Distribution dieser Marktforschungsberichte gesichert; der Nutzer braucht jedoch einen (teuren) Zugang zu Profound. U.a. werden fünf Berichtsreihen von Frost & Sullivan im Volltext und Originallayout angeboten: •
„Competitor Engineering Proflies" (Analyse der Spitzenunternehmen in einem Markt, Bericht über deren Marktanteile, über vermutete Erfolgsfaktoren, Marktstrategien und Produkte)
•
„Technology Impact"
•
„Strategies and Issues"
•
„Industry Business Development"
•
„Market Engineering Newsletter"
Das System von Profound gestattet, nicht nur auf die Berichte als Ganzes zuzugreifen, sondern auch auf ausgewählte Kapitel oder auf einzelne Abbildungen oder Tabellen. Wir werden bei unseren Fallbeispielen auf Profound zurückkommen (in Kapitel 20.1).
Fazit •
Die Sekundärmarktforschung ist auf die Informationsressourcen der kommerziellen Online-Archive angewiesen. Informationen zur Marktforschung sind auch in anderen als den „ausgewiesenen" Marktforschungsdatenbanken (etwa in der wirtschaftswissenschaftlichen Literatur oder in statistischen Zeitreihen) enthalten.
9 Ergebnisse der Marktforschung •
Vor
der
betriebliche
Durchfiihrung
eigener
Informationswirtschaft
223 (kostspieliger) sicherzustellen,
Primärforschung daß
die
hat
die
entsprechende
Sekundärforschung komplett vorliegt. •
Die Marktforschung benötigt u.U. exakte Detailinformationen, ggf. eine einzige Zahl. Datenbanken wie FAKT oder die Informationsquellen der GfK-Marktforschung kommen diesem Informationsbedarf nach und speichern einzelne Tabellen, Rangordnungen (z.B. Top-10-Listen) und Zahlenangaben.
•
Auch für die Marktforschung existieren bibliographische Datenbanken. Vorteil solcher Informationsressourcen ist der komplette Nachweis von periodisch erscheinender Literatur, während einige Volltextdatenbanken nur die jeweils aktuelle Version vorhalten und ältere Texte löschen.
•
Eine zentrale Quelle für Marktinformationen sind die Volltextdatenbanken mit Reports von Brokern bzw. Analysten. Flaggschiff der Branche ist bei den OnlineDatenbanken die Quelle Investext; bei den Hosts ist der Datenbankanbieter Profound auf Marktforschung spezialisiert.
10 Wirtschaftsnachrichten: Agenturmeldungen - Zeitungen - Newsletter - Pressearchive Wenn die „Informationsflut" irgendwo mit voller Wucht zuschlägt, dann im Bereich der Nachrichten, egal, ob über die Ticker der Presseagenturen oder die Artikel der Tages- und Wochenzeitungen sowie der diversen Branchen-Newsletter. Schätzungen ergeben einen Zuwachs an (unterschiedlichen) Meldungen von rund 20.000 pro Tag. Ein Großteil dieser Meldungen betrifft auch das Wirtschaftsleben oder doch zumindest dessen Umfeld.
10.1 Presseagenturen Aktuelle Informationen bieten die Informationsdienste der Presseagenturen. Die Nachrichten werden annähernd real-time verteilt. Nehmen wir an, gegen 11:00 h endet die Bilanzpressekonferenz der Firma X. Geben wir dem Korrespondenten unserer Agentur ein wenig Zeit, die Informationen zu verarbeiten. Spätestens jedoch gegen 12:00 dürfte der Bericht in der Datenbank der Presseagentur abrufbar sein. Recherchen, die auf Vollständigkeit angelegt sind, sind zwangsläufig auf Agenturdatenbanken angewiesen, wird doch bei weitem nicht jede Agenturmeldung auch in einer Zeitung oder Zeitschrift gedruckt. Insbesondere Pressemitteilungen der Unternehmen werden nur zu kleinen Teilen in Zeitungen abgedruckt; sie werden bei den Agenturen weitaus stärker berücksichtigt.
Dow Jones Reuters Business Interactive Reuters ist eine der weltgrößten Nachrichtenagenturen mit über 2.000 Journalisten, Fotografen bzw. Kameraleuten, die in gut 160 Ländern der Erde ihre Büros haben. Für internationale Wirtschaftsinformationen fuhrt an Reuters kein Weg vorbei. In Verbindung mit weiteren Informationen liegen die Meldungen der
Reuters-
Presseagentur bei Dow Jones Reuters Business Interactive auf, einem Unternehmen, das aus einem Zusammenschluß von Geschäftsaktivitäten von Dow Jones (DJ Interactive) und Reuters (Reuters Business Briefing; vgl. Rahlenbeck 1996) hervorgegangen ist. Die Nachrichten der eigenen Agentur erscheinen bei Reuters stets im Volltext; bei den (rund 4.000) weiteren Quellen liegen z.T. ebenso Volltexte, z.T. aber auch nur
225
10 Wirtschaftsnachrichten
informative Abstracts vor, die aber in der Regel den Volltext ersetzen. So ist z.B. das deutsche „Handelsblatt" durch englischsprachige Zusammenfassungen wichtiger Artikel vertreten. Kern der Datenbank sind die Meldungen der ca. 1.500 Korrespondenten der Nachrichtenagentur Reuters, die pro Tag ungefähr 3.500 Artikel verfassen. Nach Angaben des Datenbankproduzenten braucht dieser durchschnittlich drei bis fünf Minuten, die Meldungen online zur Verfügung zu stellen (und weitere drei bis vier Stunden, bis sie im „Archiv" - dann aber inhaltlich erschlossen - suchbar sind). Die Datenbank wächst - alle Quellenartikel mitgerechnet - um rund 28.000 Meldungen pro Tag. Die Gesamtdatenbank enthält derzeit über 33 Millionen Texte. Mittels eigener Klassifikationssysteme werden die Texte inhaltlich erschlossen. Codesysteme gibt es für Unternehmensnamen, Länder, Branchen und Themen. Jede Meldung wird dabei intellektuell von einem weltweit verteilten Team indexiert und danach mittels automatischer Verarbeitung um zusätzliche Notationen erweitert.
Abb. 10.1: Agenturmeldung von Reuters als indexierter Datensatz Reuter News Service - Western Europe July 4, 1995 GERMANY: RWE TO SUSPEND GARZWEILER PLANNING BONN, July 4 (Reuter) - German utilities group RWE AG said it would suspend plans to invest 20 billion marks in connection wirg a controversial new brown-coal mine until it is clear the project will actually go ahead. ... [gekürzt; hier folgt der Volltext der Meldung] The mine was approved by the previous SPD state government, but the SPD lost ist majority in elections in May. — J. Terence Gallagher, Bonn newsroom, 49 228 2609750 COMPANY: R W E AG (Essen) (GFR); RWE ; RWE AG INDUSTRY: 161 - Prod. & distrib. electricity; 16 - Prod. & distrib. Energy inc. gas & elec.; 11 - coal extraction & manuf. of solid fuels GEOGRAPHIC: G E R M A N Y ; GFR GFRZ WEURZ EURZ EECZ EUREAZ NATOZ OECDZ UNZ GFIVEZ SUBJECT:
Government/Social;
Environment;
Corporate;
Capacity/Facilities;
Strategy/Plans; Country Reports General; Country Reports Economic Quelle: Reuters Ltd.
226
10 Wirtschaftsnachrichten
In unserem Beispiel (Abbildung 10.1) wird etwa die Länderklasse „Germany" intellektuell vergeben, die weiteren regionalen Zuordnungen (zur EU, OECD, UNO usw.) jedoch maschinell. Die durch die automatische Nachbearbeitung entstehende breite Indexierung ist ausgesprochen nützlich bei unspezifischen thematischen Fragen. Nehmen wir an, jemand hat Interesse an Literatur zu Umweltproblemen im Kohlenbergbau in den OECD-Ländern. Mittels des Sucharguments
INDUSTRY = 11 AND GEOGRAPHIC = OECD$ AND SUBJECT = Environment
wird unsere - ja durchaus einschlägige - Meldung gefunden. Hinzuweisen ist auf das Company-Feld, werden hier doch mehrere Varianten des Unternehmensnamens angeboten, die eine sichere Suche gewährleisten, auch wenn der Korrespondent (in seiner Meldung) und der Nutzer (in seiner Suchanfrage) nicht die korrekte Namensansetzung benutzen. Neben den Texten sind Bilder recherchierbar. Hier ist der Umfang jedoch weitaus geringer. Insgesamt liegen 250.000 Bilder bei einem täglichen Wachstum von 300 neuen Bildern pro Tag vor (vgl. zur /tewferi-Datenbank Klems 1994, 158-176).
Wirtschaftsnachrichtenagenturen Nicht nur „allgemeine" Nachrichtenagenturen wie Reuters, ebenfalls spezielle Agenturen für Wirtschaftsnachrichten bieten ihre Informationen online an. Vorteil ist auch hier, daß man nicht nur die aktuellen Informationen erfahrt, sondern darüber hinaus in den umfangreichen Archivmaterialien suchen kann. Volltextspeicherung ist bei allen Agenturen selbstverständlich, die inhaltliche Erschließung, die wir gerade bei Reuters kennengelernt haben, leider nicht immer. Wir wollen hier nur kurz an zwei Wirtschaftsnachrichtenagenturen erinnern. Für Informationen über die deutsche Wirtschaft sind die „Vereinigten Wirtschaftsdienste" vwd einschlägig, vwd erarbeitet mit 200 eigenen Mitarbeitern (und zusätzlich Partneragenturen) täglich über 700 (deutschsprachige) Meldungen. Schwerpunkte sind Untemehmensnachrichten, Markt- und Branchenberichte, die Zentralbank-Berichterstattung und EU-Nachrichten. Für Unternehmensmeldungen der Vereinigten Staaten bietet sich Business Wire an. Beobachtet werden von rund 150 Mitarbeitern 12.000 us-amerikanische Unterneh-
10 Wirtschaftsnachrichten
227
men, vorzugsweise solche aus High-tech-Branchen, aus der Fortune 1000-Liste sowie (bei Nasdaq) börsennotierte Firmen.
10.2 Tageszeitungen und Wirtschaftspresse Tages- und Wochenzeitungen Diverse Zeitungen sind in Online-Archiven oder auch auf CD-ROM Wort für Wort recherchierbar. In Tages- oder Wochenzeitungen sind natürlich nicht nur Wirtschaftsnachrichten enthalten, sondern die Informationen aller Ressorts bis hin zu den Leserbriefen. Positiv aus der Sicht der untemehmensintemen Informationswirtschaft ist dabei, daß auch das (kulturelle, politische usw.) Umfeld von wirtschaftlichen Ereignissen aufscheint, negativ kann ggf. die - manchmal nicht gewünschte - Informationsfülle auf eben diesem Umfeld werden. Nehmen wir an, wir suchten nach VW in den Vereinigten Staaten. Eine Recherche nach
VW ODER Volkswagen ODER „Volkswagen AG"
in us-amerikanischen Tageszeitungen (die nahezu alle online abfragbar sind) bringt wahrscheinlich eine lückenlose Liste von Artikeln über die unternehmerischen Aktivitäten von VW in den USA, aber auch eine ebenso lückenlose Liste aller Unfälle, an denen ein VW beteiligt war, oder aller Diebstähle von VWs, also Informationen, die nicht unbedingt weiterhelfen. Die großen Wirtschaftszeitungen wie das Handelsblatt (siehe hierzu den nächsten Abschnitt) oder Financial Times bringen Wirtschaftsinformationen von überregionaler Bedeutung; lokale oder regionale Wirtschaft ist dabei zwangsläufig unterrepräsentiert. Aus diesem Grunde ist eine Recherche nach eher regionalen Wirtschaftsinformationen auf Tageszeitungen angewiesen. Informationen über die Struktur des Weinbaus in - sagen wir: Klüsserath - findet man kaum im Handelsblatt, wohl aber im „Trierischen Volksfreund" (online bei GENIOS). Einige Zeitungen erscheinen parallel im World Wide Web und in Online-Archiven. In der Regel ist der kostenlose Web-Zugriff auf ausgewählte aktuelle Artikel beschränkt, während in den Online-Archiven die Artikel z.T. über viele Jahrgänge gespeichert vorliegen. Zudem bieten die Online-Archive die Möglichkeit, datenbankübergreifend zu suchen, so daß Recherchezeit gespart werden kann.
228
10 Wirtschaftsnachrichten
F.A.Z. Als Beispiel für eine Tageszeitung soll die „Frankfurter Allgemeine" dienen. Im Gegensatz zu vielen anderen, vor allem den kleineren Zeitungen (wie den soeben bemühten „Trierer Volksfreund") ist die Archiv-Datenbank der F.A.Z. inhaltlich erschlossen. Die F.A.Z.-Online-Datenbank enthält alle Artikel (einschließlich der Tabellen) aus der überregionalen Ausgabe der „Frankfurter Allgemeinen Zeitung" lückenlos ab Anfang 1993 (vgl. Ganzmann 1998). Angeboten wird die OnlineVersion der Datenbank bei den Hosts GBl, Data-Star und Lexis-Nexis. In der CDROM-Version gibt es jahrgangsweise j e eine CD, ebenfalls beginnend mit 1993. Der Datensatz der F.A.Z.-Datenbank entspricht einem Artikel. „Eigenständige Artikel (Dokumente) sind alle redaktionell verantworteten Texte der Zeitung, die eine eigene Überschrift (und häufig Datums- und Verfasserangaben haben) oder ohne eigene Überschrift mit anderen Artikeln unter festen Zwischenüberschriften (sog. Rubriktiteln, wie z.B. „Kurze Meldungen", „Personalien" usw.) zusammengefaßt sind. Gefettete Wörter am Anfang weisen sie als eigene Artikel aus" (Ganzmann 1998, 8). Kastentexte oder Bildtitel gelten als Teil eines Artikels. Grundsätzlich nicht aufgenommen werden Anzeigen. Die Datenstrukturierung eines Zeitungsartikels erbingt die folgende Feldstruktur: •
Name der Quelle (hier stets: Frankfurter Allgemeine Zeitung)
•
Datum
•
Seite
•
Ressort
•
Kolumnentitel (Überschrift einer Seite der Zeitung)
•
Titel; eingeschlossen: Haupttitel (zentrale Überschrift eines Artikels), Untertitel (ergänzender Titelteil, steht unter dem Haupttitel), Dachtitel (ergänzender Titelteil, steht unterstrichen über dem Haupttitel), Gesamttitel (Titel, der mehrere eigenständige Artikel inhaltlich zusammenfaßt), Serientitel (a] Rubriktitel; b] Titel einer Artikelserie oder c] Bezeichnung von Artikeltypen mit fester Position, z.B. Leitartikel)
•
Text; eingeschlossen: Artikeltext, Bildtext, Kastentext, Tabellen.
229
10 Wirtschaftsnachrichten
Suchbar sind in der F.A.Z.-Datenbank alle Wörter aller Felder. Eine solche Suche findet zwar jedes Vorkommen eines Terms, garantiert aber nicht, daß über das Suchwort auch Informationen im gewünschten Umfang vorhanden sind. Eine Volltextsuche kann demnach sehr viel Ballast enthalten. Aus dem Grunde, beim Retrieval Recall und Precision zu erhöhen, wird jeder Artikel der F. A.Z. intellektuell inhaltlich erschlossen. In die Felder, die die Erschließungsinformationen aufnehmen, gehen ausschließlich solche Begriffe ein, Uber die im Text etwas ausgesagt wird. Die inhaltliche Erschließung der F.A.Z. geschieht mittels folgender Felder und Hilfsmittel: •
Firma / Hilfsmittel: Ansetzungsform des Unternehmensnamens
•
Person / Hilfsmittel: Ansetzungsform des Personennamens
•
Branche / Hilfsmittel: SIC-Code
•
Land / Hilfsmittel: Ländercode der Information Access Company
•
Sachgebiet / Hilfsmittel: Sachcodes
•
Artikeltyp / Hilfsmittel: normierte Wortliste.
Unternehmens- und Personennamen werden in einer einheitlichen Ansetzungsform für alle Artikel verwendet. Das Hilfsmittel SIC kennen wir bereits (s.o. Kapitel 3.2), auf die Ländercodes der Information Access Company kommen wir im nächsten Abschnitt (Kapitel 10.3) zu sprechen. Die Notierung von Sachgebieten dient der groben Verortung eines Artikels in einen thematischen Schwerpunkt. Als Beispiele betrachten wir folgende Rubriken:
AGRA (Landwirtschaft) A R B T (Arbeit) AUWI (Außenwirtschaft) BAUW (Bau- und Wohnungswirtschaft) BETR (Betriebswirtschaft) GESU (Medizin) WISS (Wissenschaft).
230
10 Wirtschaftsnachrichten
Die Suche geschieht mittels der Vier-Buchstaben-Kürzel oder der Sachgebietsbezeichnungen. Für Recherchezwecke hilfreich sind solche Codes zur Einschränkung recht breiter Suchen. Nehmen wir beispielsweise an, nach „Krebs" im Artikeltext gesucht zu haben. Mittels des Sucharguments
Krebs UND Sachcode=GESU
wird die Treffermenge auf diejenigen Artikel eingeengt, die medizinische Aspekte in den Vordergrund stellt (vgl. Ganzmann 1998, 156). Für Personen, Unternehmen, Branchen und Länder sind weitere Eingrenzungen möglich. Hierzu existieren Listen mit Standardvorgaben, beispielsweise etwa „Anschuldigungen",
„Privates" oder „Status" fiir Personen,
„Beteiligungen",
„Ergebnisse", „Struktur" für Firmen und Branchen sowie „Geschichte", „Kultur" oder „Wirtschaft" fiir Länder. Der Artikeltyp informiert über besondere Formen der Vorlage, so z.B. über „Dokument" (wenn die Vorlage im Wortlaut abgedruckt wurde), „Leserbrief, „Produktbericht" oder „Rezension - Fernsehen" (Fernsehkritik). Eine Suche mit dem kontrollierten Vokabular der inhaltlichen Erschließung ist einer Freitextsuche
prinzipiell
vorzuziehen.
Jochen
Ganzmann
faßt die
Vorteile
zusammen. „Während bei der Suche über Titel- oder Textwörter häufig Artikel gefunden werden, in denen ein Suchbegriff (z.B. ein Firmenname) nur eine marginale Rolle spielt, werden mit Hilfe der inhaltlichen Erschließung ausschließlich Artikel gefunden, in denen dieser Suchbegriff von zentraler Bedeutung ist. ... Bei der inhaltlichen Erschließung wird kontrolliertes Vokabular verwendet, so daß der Nutzer Informationen zu einer Firma oder einem Land immer unter denselben Suchbegriffen findet" (Ganzmann 1998, 12). Abbildung 10.2 zeigt einen F.A.Z.-Artikel in seiner Online-Version. Gesucht wurde im Bereich Firma nach der Eingrenzung „Marketing" in Verbindung mit dem Sachgebiet „Kommunikation und Medien".
231
10 Wirtschaftsnachrichten Abb. 10.2: F.A.Z. - Beispieldatensatz F.A.Z.
Wirtschaft
Montag / 23.03.1998 / Nr. 69 / Seite 30
EDV-Unternehmen schlecht im Internet Nur die Großen der Branche überzeugen / Interaktivität kaum ausgenutzt ht. HANNOVER, 22. März. Beim Internet-Auftritt der EDV-Unternehmen zeichnet sich nach Ansicht von Uwe Kamenz, Marketing-Professor an der Fachhochschule Dortmund, eine Zweiklassengesellschaft ab: Während die Großen der Branche wie IBM oder Hewlett-Packard die Möglichkeiten des neuen Mediums zumindest zum Teil ausnutzen, befinden sich die meisten Intemet-Seiten des EDV-Handels und der Systemhäuser auf Amateumiveau. "Die meisten Unternehmen haben eher ihre Computer im Kopf als ihre Kunden", beurteilt Kamenz die zentrale Schwierigkeit der EDV-Unternehmen. Kamenz hat rund 1500 Internet-Auftritte der etwa 23000 deutschen Software- und Hardwareunternehmen sowie System- und Handelshäuser der EDV-Branche untersucht und anhand der Kriterien Interaktivität, Handhabung, Layout und Inhalt beurteilt. Nach seiner Rangliste wird die Branche bei den Hardwareunternehmen von IBM angeführt. Bei den Softwareschmieden liegt Lotus vorne, während bei den Handelshäusern/Dienstleistern Neckermann den höchsten Wert erzielte. Aber auch bei diesen Unternehmen gebe es noch erheblichen Nachholbedarf, zum Beispiel beim interaktiven Kontakt mit dem Kunden, urteilt Kamenz. Im Durchschnitt haben die EDV-Unternehmen in dieser Kategorie nur 3 von 20 möglichen Punkten erzielt. Zum Beispiel richteten die Unternehmen nur in wenigen Fällen die Möglichkeit ein, Produkte über das Internet direkt zu bestellen. In mehr als der Hälfte der Fälle werde dem Internet-Nutzer noch nicht einmal der Weg zu einem Händler gezeigt. Nach Ansicht von Kamenz haben die meisten Unternehmen somit gar kein Interesse daran, Produkte über das Netz zu verkaufen. Deutlich besser zeigen sich die meisten Unternehmen bei den Kriterien Layout und Handhabung. Dort erzielten die untersuchten Unternehmen im Durchschnitt zumindest die Hälfte der erreichbaren Punktzahl. Deutliche Abstriche sind nach Ansicht von Kamenz jedoch beim Inhalt der Internet-Seiten zu machen. Im Vorfeld der Cebit erwarte jeder Nutzer Informationen über dort ausgestellte Produkte oder Neuheiten. Doch weniger als die Hälfte der Unternehmen wiesen auf ihren Internet-Seiten auf die weltgrößte Computermesse hin. Für Kamenz, der zuvor bereits die Internet-Auftritte der Buchverlage und Autohersteller untersucht hatte, sind diese Ergebnisse überraschend. "Die Unternehmen präsentieren sich so, als ob sie nicht wüßten, welche Möglichkeiten das Internet bereithält." Tabelle Die erfolgreichsten Internet-Auftritte Rang Unternehmen Punkte 1 IBM 73 2 Hewlett-Packard 70 3 Lotus 68 4 TransTec 67 5 64 mb-Software
232
10 Wirtschaftsnachrichten
6 7 8
Dell 63 Neckermann 62 Microsoft 61 Logitech 61 Horschar 61 HE&HG 61 Elsa 61 Quelle: Professorennetzwerk Profnet Firma:
International Business Machines Corp., Armonk, NY; Marketing Hewlett-Packard Co. (HP), Palo Alto, CA; Marketing Lotus Development Corp., Cambridge, MA; Marketing Branche: (7370) Computerdienste, Datenbearbeitung; Firma, Markt Land: ( 1 USA) Vereinigte Staaten (OOWOR) Internationales Sachgebiet: (INDU) Industrie; (KOMM) Kommunikation und Medien Quelle: F.A.Z.-CD-ROM 1998
Handelsblatt Das „Handelsblatt", Deutschlands größte Wirtschaftszeitung, erscheint seit 1986 parallel in Print und in einer elektronischen Version. Da das Online-Archiv GENIOS eine Abteilung des Handelsblatt-Verlages ist, liegt Handelsblatt Online - exklusiv bei diesem Host auf. (Mit einem solchem Exklusivangebot wird GENIOS - zumindest in Deutschland - zu einem nicht zu umgehenden Online-Archiv für Wirtschaftsinformationen.) Hauptbereiche des Handelsblatts sind: •
Wirtschaft und Politik
•
Unternehmen und Märkte
•
Finanzen
•
„Themen und Trends" (Sonderseiten an festen Wochentagen).
Seit dem Jahrgang 1996 wird die Handelsblatt-Datenbank artikelweise inhaltlich erschlossen. Dokumentationssprachen
finden bei Personen, Unternehmen
bzw.
Organisationen, Ländern und Regionen, Themen sowie Branchen (hier die SIC) Einsatz. Im Prinzip ähnelt dieses Vorgehen dem bei der F. A.Z., so daß hier auf eine nähere Beschreibung verzichtet werden kann.
10 Wirtschaftsnachrichten
233
Im Gegensatz zur F.A.Z. werden bei GENIOS die Abbildungen und Graphiken nicht übergangen, sondern können in einem eigenen Bereich - der Chart-Library - recherchiert werden. Die Datenbank wächst börsentäglich um ca. 150 bis 250 Artikel des Vortages. In einer eigenen Datenbank erscheint täglich die aktuelle Ausgabe des jeweiligen Tages.
10.3 Quellenübergreifende Informationen zu Branchen, Märkten, Unternehmen und Produkten Presseagenturen und Zeitungsverlage bieten jeweils ihre Artikel in einer Datenbank an. Um ein einigermaßen vollständiges Bild über ein Ereignis, eine Firma usw. zu erhalten, müßte man diverse solcher Quellen abfragen. Nicht vergessen dürfen wir, daß neben den Tages- und Wochenzeitungen auch branchenspezifische Zeitungen bzw. Newsletter existieren, die - für die betreffende Branche - zentrale Informationen enthalten. Ideal wäre demnach ein quellenübergreifender Zugang zu allen (oder doch zumindest zu den wichtigsten) Quellen für Wirtschaftsinformationen. Einen solchen Service bieten die Datenbanken der Information Access
Die Datenbanken der Information Access
Company.
Company
Die Information Access Company mit Sitz in Foster City (Kalifornien) ist neben Gale Research und Primary Source Media Teil der Gale Group in Farmington Hills, Michigan. Gale Group ist neben anderen Unternehmen (etwa Thomson Science and Technology mit den Finnen Derwent und Institute for Scientific Information) ein Teil der Geschäftseinheit Thomson Business Information der Thomson Corp. (Toronto). (Im letzten Kapitel haben wir mit der Investext Group bereits eines der diversen 77?0/n50rt-Unternehmen kennengelernt.) Im Bereich der Brancheninformationen (aus Newslettern und weiteren Quellen) sind die Informationssammlungen der Information
Access
Adresse. Durch die Übernahme von Predicasts
Inc. durch die Information
Company
Company
die wichtigste Access
(1991) wurden auch deren Klassifikationssysteme übernommen. Die
Predicasts-Codes
sind so etwas wie ein Industrie-Standard fiir die Inhaltserschlie-
ßung von Wirtschaftsinformationen geworden. Die Klassifikation ist ein facettiertes System mit drei Facetten: •
Branchen und Produkte
234
10 Wirtschaftsnachrichten
•
Länder
•
Aspekte - Ereignisse (Events).
Die erste Facette ist der Produktcode, der auf der amerikanischen SIC beruht. Wir haben das System bereits in Kapitel 3.1 kennengelernt (S. 72 f.). Die zweite Facette beinhaltet den Ländercode, der die Welt in zehn Regionen (mit den Ziffern 0 bis 9) zerlegt und danach einen vierstelligen Buchstabencode für ein Land oder für eine Staatengemeinschaft anhängt. Japan gehört in den asiatisch-pazifischen
Raum
(Kennziffer 9) und erhält die Notation
9JAPA.
Deutschland liegt in Europa (Kennziffer 4), ist Teil der Europäischen Union (4EU) und hat die Notation
4EUGE.
„Event-Codes" benennen Aspekte und Ereignisse. Mit dieser Klassifikation „wird auf eine bestimmte Aktivität eingeschränkt, unter der die Branche, das Produkt, die Firma oder das Land ... in dem Artikel behandelt wird, zum Beispiel Aufkäufe, Produkteinfiihrungen, Marktanteile oder Produktabsätze. Die Event-Codes werden normalerweise mit einem Product-Code oder Firmennamen verknüpft, obwohl sie auch einzeln suchbar sind" (Predicasts 1993, PTS Event-Codes, VI). Die erste Hierarchieebene der Klassifikation kennt neun Hauptgruppen: 1
Firmen und Institutionen
2
Unternehmensführungsverfahren
3
Technologie
4
Ressourcen und Ressourcennutzung
5
Personen
6
Marktinformationen
7
Kosten und Preise
235
10 Wirtschaftsnachrichten 8
Finanzinformationen
9
Sozialwesen und Politik.
Die Hauptgruppen werden jeweils in zehn Gruppen zerlegt. Hier möge ein kurzer Ausschnitt zur Illustration genügen: 6
Marktinformationen 60
Allgemeine Marktinformationen
61
Erhaltene Aufträge und Verträge
62
Produktionsinformationen
69
Materialien- und Warenvertrieb.
Jede Notation wird in der Dokumentationseinheit sowohl mit der Notation als auch mit der natürlichsprachigen Benennung (in englisch) geführt. So fuhren etwa die Suchen
PC=2800000 and CC=1 USA and EC=15 (PC: Product Code; CC: Country Code; EC: Event Code)
und
PN=Chemicals & Allied Products and CN=United States and EN=Acquisitions & Mergers (PN: Product Name; CN: Country Name; EN: Event Name)
zum identischen Ergebnis. Zusätzlich zu den Klassifikationen werden Unternehmensnamen auf eine Ansetzungform normiert. Drei wichtige Datenbanken der Information Access Company soeben geschilderten Klassifikationssystem: •
P R O M T (Predicasts Overview of Markets and Technology)
arbeiten mit dem
236
10 Wirtschaftsnachrichten
•
Trade & Industry Database
•
Globalbase.
Alle drei Datenbanken wurden ursprünglich bei unterschiedlichen Informationsproduzenten hergestellt. Inzwischen konnte zwar die Indexierung angeglichen werden, nicht jedoch eine klare Abgrenzung der Quellen. So wird der Nutzer oftmals bei der Abfrage aller drei Datenbanken mit Dubletten konfrontiert. PROMT ist das „Flaggschiff' der Information Access Company. Seit 1972 sind hier Uber 7 Millionen Datensätze zu allen Wirtschaftsbranchen (weltweit) gespeichert. Die Datenbank enthält sowohl bibliographische Nachweise mit Abstracts als auch (zu rund 60%) die Volltexte. Ausgewertet werden weit über 1.000 Quellen, u.a. Newsletter, Zeitschriftenartikel, Zeitungsartikel und Pressemitteilungen der Unternehmen. Abbildung 10.3 bringt ein Beispiel für einen Volltext bei PROMT (dies ist ein Treffer zur oben formulierten Suchfrage nach Mergers and Acquisitions in der chemischen Industrie der Vereinigten Staaten).
Abb. 10.3: IAC's PROMT. Beispieldatensatz 05769202 Food Additives: Eastman Sells Emulsifiers To Quest. Signs letter of intent to sell food-grade distilled monoglycerides business to Quest Intnl Chemical Week Oct 11, 1995 p. 10 ISSN: 0009-272X Eastman Chemical has signed a letter of intent to sell its food-grade distilled monoglycerides business to the North American food division of Quest International (Hoffman Estates, IL), a unit of Unilever. ... [gekiirzt; es folgt der Volltext] COMPANY:
*Eastman Chemical Quest
PRODUCT:
»Chemicals & Allied Products (2800000); Packaging Machinery ex Food (3569100)
EVENT:
* Asset Sales & Divestitures (16); Acquisitions & Mergers (15)
COUNTRY:
"United States (1 USA)
Quelle: DIALOG; File 16
10 Wirtschaftsnachrichten
237
Die thematische Abdeckung der „Trade & Industry Database" ist ähnlich der von PROMT. Seit 1981 sind hier rund 8 Millionen Dokumentationseinheiten vorhanden, davon ca. drei Viertel im Volltext. „Globalbase" ist - ganz entgegen des Namens eine Wirtschaftsdatenbank mit Schwergewichten auf Europa und dem ostasiatischen Raum (vor allem Hongkong und Singapur). Ab Jahrgang 1986 liegen rund 1,5 Millionen bibliographische Nachweise mit informativen Abstracts vor. Ergänzt werden die gut indexierten Datenbanken PROMT, Trade & Industry Index und Globalbase durch die „Newsletter Database", die ausschließlich im Volltext ca. 600
Branchennewsletter
in
elektronischer
Form
anbietet. Ab
1988
werden
inzwischen über 3.2 Millionen Datensätze vorgehalten. Die Inhaltserschließung beschränkt sich hier auf einen knappen Branchencode und eine -automatisch erstellte - Vorzugsform von Unternehmensnamen.
10.4 Wirtschaftsarchive Pressedokumentation nach dem Dossierprinzip Pressearchive sammeln artikelweise Literatur zu Sachthemen oder Unternehmen nach dem sog. „Dossierprinzip". Die „Dossiers" sind (elektronische oder konventionelle) „Mappen", in denen Literatur hinterlegt ist. Die einzelne Mappe sortiert die Presseausschnitte dergestalt nach der Zeit, daß Aktuelles oben liegt. Die Gesamtheit der Mappen ist nach Dokumentationsmethoden geordnet, vorherrschendes Werkzeug bei Pressearchiven sind Klassifikationssysteme. Pressearchive versorgen ihre Nutzer zum einen mit diversen Fakten aus den einzelnen Artikeln und liefern zum andern das thematische Umfeld der Fakten durch das Angebot diverser Artikel zum gleichen Thema in der Mappe. Marianne Englert beschreibt die Ziele der Pressedokumentation. „Auf der einen Seite benötigt der Redakteur (oder der Infonnationswirt, Anm. St.) präzise Fakten und harte Daten. Aber er braucht das Archivmaterial auch dazu, sich einzulesen und sich bereits Bekanntes zu vergegenwärtigen" (Englert 1990, 496). Der Nutzer wird beim Blättern in den Dossiers „Assoziationen beleben und Denkanstöße erhalten" (ebd.).
Diverse Unternehmen insbesondere der Medienbranche führen solche Pressearchive. Große Archive wie bei Gruner & Jahr, beim SPIEGEL
oder beim
Axel-Springer-
Verlag enthalten mehrere zehn Millionen Presseausschnitte (vgl. FH Köln 1997, 16 ff.). Die genannten Archive arbeiten ausschließlich für das eigene Unternehmen; an
10 Wirtschaftsnachrichten
238
eine Kommerzialisierung durch Öffnung nach außen wird derzeit kaum gedacht (vgl. z.B. Gessner 1994). Will man in seinem Unternehmen nicht selbst ein Wirtschaftsarchiv aufbauen, ist man auf öffentliche zugängliche Archive angewiesen.
HWWA-Archiv Die Abteilung „Pressedokumentation" des HWWA-Hamburgisches
Welt-Wirtschafts-
Archiv ist ein Wirtschaftsarchiv, das der Öffentlichkeit zur Verfugung steht. Seit der Gründung der Abteilung 1908 sind bis heute über 18 Mio. Presseausschnitte gesammelt und nach dem Dossierprinzip geordnet worden. Etwa zehn bis 15 Jahre bleiben
die
Artikel
in
Papierform
erhalten,
danach
werden
die
Mappen
mikroverfilmt. Die HWWA-Pressedokumentation besteht aus vier Bereichen (vgl. HWWA 1998). Das Sacharchiv ist nach Ländern und - unterhalb der Länderebene - nach einem Klassifikationssystem geordnet. Dieses größte Teilarchiv wächst jährlich um rund 120.000 Presseausschnitte zu Aspekten der Wirtschaft und verwandter Bereiche. Das Warenarchiv sammelt Informationen über Rohstoffe, Halb-, Vor- und Fertigerzeugnisse, geordnet nach Warengruppen und Ländern. Es nimmt jährlich um 20.000 Zeitungsartikel
zu.
Im
Personenarchiv
liegen
Pressemeldungen
Uber
Persönlichkeiten der Wirtschaft sowie aus Politik, Kultur und Wissenschaft vor. Derzeit sind Dossiers zu mehr als 50.000 Personen vorhanden; die Anzahl der Artikel steigt um 10.000 pro Jahr. Das Firmenarchiv sammelt Pressemeldungen zu rund 70.000 Unternehmen, Organisationen, Instituten und Körperschaften bei einer Wachstumszahl von über 80.000 Artikeln jährlich. Zusätzlich werden Geschäftsberichte von über 3.000 Unternehmen gesammelt. Die Kartei, über welche Unternehmen überhaupt im HWWA-Archiv Dossiers angelegt sind, befindet sich als Datenbank im World Wide Web. Einen Beispieldatensatz zeigt Abbildung 10.4. Hierbei kommt es nicht auf die (wenigen) Angaben zum Unternehmen an, die in der WWW-Firmendatenbank aufscheinen, sondern nur (1.) auf die korrekte Bestimmung des Namens des gesuchten Unternehmens und (2.) auf die Art und Menge der Informationen
(Geschäftsberichte,
Zeitungsausschnitte,
HWWA vorliegen und bestellt werden können.
Festschriften),
die
im
10 Wirtschaftsnachrichten
239
Abb. 10.4: HWWA-Firmendatenbank. Beispieldatensatz Unternehmen
Verweisformen
Siemens AG
Protos Engineering (Pty) Ltd s Elektriska AB Siemens s Elektrizitäts-AG vorm. Schlickert & Co (Fusion) f Siemens & Halske AG f
Bestellmöglichkeit für Benutzer außerhalb des HWWA: Bestellformular Anschrift
Verschiedenes
Straße: Wittelsbacherplatz 2
Recherche: !
PLZ:
D-80333
Signatur: 2DE S 143
Ort:
München
Rechtsform: Aktiengesellschaft
Land:
DE
Produktionsprogramm: Elektronik
Bemerkungen:
Forts. Festschrift 1988 B 1446, 1993 A 236 ... [gekürzt]
Geschäftsberichte
Zeitungsausschnitte
Festschriften
von:
1898
von:
1971
von:
bis:
1997/98
bis:
1999
bis:
Eingangsmonat: 08
Stempel: j
Anzahl: 7
vollständig: j
FS-Ort: b
anfordern: j
FS-Signatur: 1972 A 2015 ... [gekürzt]
Quelle: HWWA. URL:http://www.hwwa.uni-hamburg.de/scripts/firmen-vers3-form. asp
240
10 Wirtschaftsnachrichten
So erfahren wir aus unserem Beispiel, daß die Geschäftsberichte der Siemens AG seit 1898 komplett im HWWA vorhanden sind, daß Zeitungsausschnitte im Dossier seit 1971 vorliegen und daß insgesamt sieben Festschriften zu Siemens abrufbar sind. Quellenbasis des Wirtschaftsarchivs sind rund 120 deutsche und internationale Zeitungen. Der Zugriff auf die Informationen geschieht nicht direkt auf die Artikel, sondern auf die Dossiers als Ganzes. Diese werden auch als Ganzheit entweder für die Präsenznutzung ausgeliehen oder im Kundenauftrag fotokopiert.
10.5 Medienpräsenzanalysen Marketingmaßnahmen und Presseresonanz Formen der Kommunikationspolitik im Marketing eines Unternehmens sind u.a. Öffentlichkeitsarbeit (Public Relations), Eventmarketing und auch Sponsoring, die neben die klassische Mediawerbung treten. Eine entscheidende Frage hierbei ist: Wo und wie „wirkte" die kommunikationspolitische Maßnahme? In bezug auf die Medien liefern quantitative und qualitative Medienpräsenzanalysen eine Antwort und bilden so die Informationsgrundlage für eine Resonanzkontrolle der Marketingaktivitäten eines Unternehmens. Medienpräsenzanalysen bieten ein Bild, wie sich Pressemeldungen einer Firma, Veranstaltungen oder gesponserte Ereignisse in der Presse auswirken. Zusätzlich gewinnt man einen Eindruck über das „Image" eines Unternehmens in der Presse (über das ja auch unabhängig von der betrieblichen Pressearbeit berichtet wird). Basis der Medienpräsenzanalysen sind - wie bei den Wirtschaftsarchiven - die einzelnen Artikel über ein Unternehmen. Ziel der Analysen ist eine Informationsverdichtung der einzelnen „Clippings" zu einem Gesamtbild. Es liegt hier eine Spielart informetrischer Methoden vor, die - vor allem im Dienste des Marketing - unternehmensbezogene Presseinformationen analysiert.
Argus Media Unser Beispiel für Medienpräsenzanalysen betrifft die Firma „Argus Media" in Fellbach (vgl. Argus 1996a; 1996b). Auf der Basis der einzelnen Presseclippings verdichtet Argus Media über sog. „Analyse-Profile" die Einzelinformationen zu den gewünschten konzentrierten Informationen. Zur Abarbeitung der Analyse-Profile
10 Wirtschaftsnachrichten
241
dienen gewisse Kennziffern, d.h. Indikatoren auf Medienpräsenz und Medienresonanz. Die Suchfragen sind frei wählbar, in der Regel handelt es sich jedoch um den Namen eines Unternehmens (des eigenen und - ggf. zusätzlich - den der Wettbewerber). Alle Artikel, die den Firmennamen nennen, werden durch das Faksimile des Textes sowie durch folgende Daten ausgewertet: •
Publikations-Codenummer
•
Erscheinungsnummer
•
Erscheinungsdatum
•
Titel
•
Verlagsort
•
Redaktionstelefon
•
Redaktionsfax
•
Art der Publikation
•
Publication Monitor - Selektionsprogramm
•
Bundesland
•
Nielsengebiet
•
Auflagenzahl (verbreitete Auflage, verkaufte Auflage, Auflagensumme der publizistischen Einheit)
•
Seite
•
Position auf Seite
•
Ressort
•
Anzahl der in der publizistischen Einheit tatsächlich erschienenen inhaltsgleichen Artikel je Erscheinungstag.
Messung der Medienpräsenz Die Pressepräsenz wird in „Präsenzreports" dokumentiert. Errechnet werden die Präsenzanteile des Themas in einem gegebenen Zeitraum relativ zu allen Publikatio-
242
10 Wirtschaftsnachrichten
nen sowie die Verteilung der Artikel u.a. nach der Position auf der Seite (entsprechend der Blickorientierung), nach Rubriken, der Region, der journalistischen Darstellungsform, der Bewertung (positiv, neutral, negativ). Der Nutzer erhält zusätzlich Informationen über die Höhe der Auflage der Zeitungen, die sein Thema besprechen, und kann damit die Reichweite der Information abschätzen. Einen Ausschnitt aus einem Präsenzreport bringt Abbildung 10.5.
Abb. 10.5: Medienpräsenz. „Präsenzreport" von Argus Media 1. Präsenz: In den ausgewerteten Publikationen waren insgesamt 196 Artikel relevant. 1.1 27% der Tageszeitungstitel (150 von 554) berichteten über das Thema in 173 Artikeln. 15% dieser Tageszeitungen berichteten mehrfach über dieses Thema. 1.2 2 % der Periodika (21 von 800 Zeitschriftentitel) berichteten zum Thema in 23 Artikeln, [gekürzt] 2. Artikelposition 1
2 Position 1:45 (22,95%) Position 2: 83 (42,34%) Position 3: 48 (24,48%) Position 4: 20 (10,20%) 3. Rubriken Politik 18(9,18%) Wirtschaft 17 (8,67%) Allgemeines: 0 Lokales: 19 (9,69%) usw. [gekürzt] 4. Regionale Verteilung nach Bundesländern
243
10 Wirtschaftsnachrichten Baden-Württemberg: 68 (39,3%) Bayern: 22 (12,7%) Berlin: 3 (1,73%) usw. [gekürzt] 5. Journalistische Darstellungsform Nachrichtenagenturmeldungen: 75 (38,26%) mehrere Agenturmeldungen zusammengefaßt: 12 (6,12%) bearbeitete Agenturmeldungen: 15 (7,65%) Kommentare: 13 (6,63%) Berichte; Reportagen: 30 (15,30%) usw. [gekürzt] Quelle: Argus 1996b (stark gekürzt)
Indikatoren der IMedienpräsenz und Medienresonanz Zum Teil bereits in den Präsenzreports enthalten, zum Teil zusätzlich berechnet werden die Kennziffern der Analyseprofile. Die Profile zum „Issue" bestehen aus dem Issue-Quotienten (Anteil der Publikationen mit Artikel zum Thema an allen Publikationen), der Akzeptanz (Saldo aus positiven und negativen Artikeln zum Thema), dem Neutralitätsquotienten
(Verhältnis von neutraler und
wertender
Berichterstattung) sowie Informationen zum Autor bzw. zur Presseagentur. Ein Werkzeug zur Analyse des Erfolgs von Maßnahmen des Event-Marketing liefert das Event-Profil. Der Durchdringungsindex arbeitet wie der Issue-Quotient, er liefert einen Wert der relativen Häufigkeit der Erwähnung des Events in Zeitungen innerhalb eines gegebenen Zeitraums. Verteilungswerte zeigen desweiteren die regionale Medienresonanz nach Bundesländern. Das Verhältnis der selbstinitiierten und der fremdinitiierten Berichterstattung errechnet der Initiierungs-Index und gibt so dem Erfolg der Öffentlichkeitsarbeit eines Unternehmens einen quantitativen Ausdruck. Insbesonders in Verbindung mit dem Neutralitätsquotienten und der Akzeptanz kann der Initiierungs-Index ein Indikator
244
10 Wirtschaftsnachrichten
auf angemessene (bei überwiegend positiven bzw. neutralen Artikeln) oder verfehlte Pressearbeit (bei überwiegend fremdinitiierter negativer Berichterstattung) sein. Beim Sponsoring erwartet der Sponsor u.a., daß sein Name im Kontext des gesponserten Ereignisses marketingwirksam genannt wird. Das Sponsoring-Profil gibt zu solchen Fragen gewisse Antworten. Der Plazierungsindex zeigt an, wo der Sponsor genannt wird; eine Plazierung in der Schlagzeile, in einem Bild oder in der Bildlegende wird dabei höher bewertet als eine Plazierung irgendwo im Text. Die Transferquote ist analog zum Issue-Quotienten angelegt und gibt das Verhältnis der Nennung eines Sponsors in einer Zeitung relativ zu allen Zeitungen an. Zusätzlich wird mit der „Transferdichte" die Anzahl der Nennungen eines Sponsors in einem Artikel gezählt. Der Text-Bild-Quotient letztlich gibt die Relation von Artikeln mit Bildem zu solchen ohne Bildern an. Vergleiche zwischen den Kosten klassischer Mediawerbung und anderen Formen der Kommunikationspolitik wie Öffentlichkeitsarbeit, Event-Marketing oder Sponsoring gibt das Profil „Äquivalenzwertberechnung". Dieses Profil weist die Kosten auf, die für eine vergleichbare Anzeige in Qualität und Quantität der erschienenen Artikel entstanden wären. Grundvoraussetzungen dieses Vergleichs ist, daß Zeitungsartikel über ein Unternehmen, ein Event oder ein gesponsertes Ereignis einen ähnlichen kommunikationspolitischen Charakter wie Anzeigen haben. Durch die Präsenzreports und die Analyseprofile mittels Kennzahlen wird - gemäß Argus Media - „der Output der eigenen PR-Arbeit (oder der PR-Arbeit der Wettbewerber) dokumentiert und analysiert. Der Nutzer dieser Daten kann sich auf die nächsten Stufen der Evaluation konzentrieren. Es wird Zeit und Geld gewonnen. Erstens für die Analyse des Outgrowths, d.h. der erreichten Aufmerksamkeit und Erinnerungsleistung bei der angestrebten Zielgruppe. Zweitens für die Messung des Outcomes, d.h. der Wirkung auf Meinungen, Einstellungen und Verhalten der Zielgruppe" (Argus
1996b). Informationswirtschaftliche Methoden und
Hilfsmittel
werden so ein Controlling-Instrument zur Evaluation gewisser Marketingaktivitäten.
Fazit •
Im Bereich der (Wirtschafts-)Nachrichten sind wir mit einer Fülle von Informationen konfrontiert. Viele tausend potentiell relevante Wirtschaftsinformationen werden von Presseagenturen, Zeitungen und Branchennewsletter täglich produziert. Informationsfilter und inhaltliche Erschließung sind unabdingbar.
10 Wirtschaftsnachrichten •
245
Nahezu alle Presseagenturen weltweit vertreiben ihre Informationen elektronisch. Große Agenturen, unser Beispiel ist Reuters, versehen alle ihre Meldungen in den Archiv-Datenbanken mit einer Inhaltserschließung.
•
Tages- und Wochenzeitungen erscheinen zunehmend in einer elektronischen Ausgabe. Nicht alle versehen ihre Artikel mit dem informationellen Mehrwert einer Inhaltserschließung. Wir betrachten zwei Ausnahmen und stellen die indexierten Versionen von F.A.Z. und Handelsblatt vor.
•
Bei den Datenbanken zu Branchennewslettern setzen die Produkte der Information Access Company mit ihrem System der Inhaltserschließung Maßstäbe. In der Recherchepraxis nicht zu umgehende Informationssammlungen zu allen Wirtschaftsbranchen, ihren Unternehmen und Technologien sind PROMT, Trade & Industry Database und Globalbase.
•
Nicht zu vergessen sind im Bereich der Wirtschaftsnachrichten die nach dem Dossierprinzip geordneten Stücke großer Wirtschaftsarchive wie z.B. das Archiv des HWWA.
•
Medienpräsenzanalysen verdichten die Clippings der einzelnen Presseartikel im informetrischen Sinne zu aussagefahigen Kenngrößen. Anwendungsfälle sind u.a. die Beschreibung der Resonanz auf Marketingaktivitäten eines Unternehmens oder die Beobachtung des Images eines Wettbewerbers in der Öffentlichkeit.
11 Betriebswirtschaftliche Unternehmensinformationen
Fakteninformationen über betriebswirtschaftliche Aspekte Unternehmensinformationen sind in zweierlei Hinsicht relevant. Zum einen wird eine möglichst vollständige Liste mit Angaben zu einem bestimmten Unternehmen gesucht, dessen Namen wir bereits kennen (zu dem wir etwa erstmals eine geschäftliche Beziehung aufbauen oder das wir übernehmen wollen), zum andern geht es darum, ein Unternehmen oder eine Menge von Unternehmen zu finden, die bestimmte Merkmale erfüllen (z.B. suchen wir eine Firma, die ein bestimmtes Produkt anbietet, oder wir wünschen eine Liste von Unternehmen - samt Ansprechpartnern und Adressen für eine Mailingaktion - mit einem bestimmten Umsatz in einer definierten Branche und Region). Nach der Art der Stellung des Unternehmens, über das informiert wird, können wir folgende Fälle unterscheiden: • •
Wettbewerber bislang marktfremde Unternehmen, die auf einen Markt eindringen, auf dem unser Unternehmen agiert
•
in der Wertkette vorgelagerte Unternehmen (uns bereits bekannte Zulieferer)
•
potentielle Zulieferer, die uns nicht bekannt sind
•
in der Wertkette nachgelagerte Unternehmen (uns bereits bekannte Abnehmer)
•
potentielle Abnehmer, die uns nicht bekannt sind
•
Unternehmen, an denen wir interessiert sind (Anteile kaufen oder übernehmen?).
Bei den einem Unternehmen bereits bekannten Finnen (jetzige Wettbewerber, Zulieferer, Abnehmer; nicht zu vergessen Unternehmen, an deren Beteiligung und Übernahme Interesse besteht) gilt es, die Informationen jeweils aktuell zu halten, um mögliche Änderungen oder gar Probleme bereits früh zu erkennen. Hier sollte eine firmeninterne Datenbank gefuhrt werden, die durch die externen Informationen „gefuttert" wird. Recherchen nach potentiellen neuen Geschäftspartnern erfordern eine thematische Suche in externen Unternehmensdatenbanken. Ein großes Problem ist das Erkennen von Aktivitäten von Unternehmen, die bislang nicht auf „unserem" Markt agierten und nun neu hinzustoßen.
11 Betriebswirtschaftliche Unternehmensinformationen
247
Zusätzlich müssen wir bei den Unternehmensinformationen auch an die Eigentümer von Aktienbesitz denken, die im Rahmen ihres Portfolios über die betreffenden Unternehmen unterrichtet sein möchten. Die Informationspraxis unterscheidet - wir wissen es bereits aus dem 4. Kapitel nach einem problemorientierten und einem konkreten Informationsbedarf (s.o. S. 119 ff.). Ersterer wird durch eine mehr oder minder relevante Liste von Literaturstellen befriedigt, letzterer durch den exakten Nachweis des gesuchten Faktums. In den letzten drei Kapiteln hatten wir mit den wissenschaftlichen Werken, den Berichten der Marktforschung und den Pressetexten stets Literaturinformationen kennengelernt, die vor allem dem problemorientierten Informationsbedarf entsprechen. (Natürlich „stecken" in den Texten auch die Fakten „drinnen", etwa in einer Tabelle; doch diese muß erst einmal problemorientiert gesucht und erfolgreich gefunden werden.) In diesem Kapitel wenden wir uns dem konkreten Informationsbedarf zu. Hier geht es nahezu ausschließlich um Fakten, um quantitative wie qualitative Angaben zu einem Unternehmen. Wir schränken demnach die Gesamtmenge an Unternehmensinformationen in diesem Kapitel auf Fakteninformationen im betriebswirtschaftlichen Sinne ein - letztlich grob vereinfacht - auf das, was im Handelsregister, in Produktkatalogen oder in der Bilanz steht (vgl. Rahlenbeck 1995/96). Ein komplettes Untemehmensbild erhalten wir erst, indem wir die unternehmensspezifischen Angaben aller Informationstypen zusammenspielen. Wie „komplett" sich solche Informationen erweisen, wird kurz im Abschnitt 19.1 diskutiert.
11.1 Grunddaten eines Unternehmens Zu den „Grunddaten" eines Unternehmens zählen wir Angaben, die in der Form eines Kurzdossiers ein Unternehmens identifizieren (Anschrift, Produkte, Management) und zusätzlich mindestens auf Umsatz und Zahl der Mitarbeiter hinweisen. Die folgende Feldliste wird von den meisten Datenbanken mit Unternehmensgrunddaten erfüllt: •
Name
•
Anschrift (einschließlich Telefon und Fax)
•
Unternehmensnummer (datenbankspezifisch); international bedeutsam sind die Codes der Firma Dun & Bradstreet (D-U-N-S Number)
248
11 Betriebswirtschaftliche Unternehmensinformationen
•
Rechtsform
•
Kurzbeschreibung des Unternehmens
•
Branche (in der Regel durch eine Branchenklassifikation, häufig SIC)
•
Geschäftsjahr
•
Griindungsjahr
•
Anzahl der Mitarbeiter (ggf. als Zeitreihe über drei Jahre)
•
Umsatz (ggf. als Zeitreihe über drei Jahre)
•
Grundkapital
•
Bankverbindungen
•
Mitgliedschaften
•
Produkte
•
Produktionsstätten
•
Personen (Management, ggf. Aufsichtsrat)
•
ggf. Hinweise auf Eigentümer und Tochterunternehmen.
Unternehmensgrunddaten von Hoppenstedt und Creditreform Elektronische Datenbanken mit Grunddaten von Unternehmen gibt es reichlich. Zu denken ist für deutsche Firmen u.a. an: •
Creditreform (online bei mehreren Online-Archiven oder unter dem Namen „Markus" als CD-ROM von Bureau van Dijk)
•
Hoppenstedt (via CD-ROM oder WWW direkt bei Hoppenstedt).
Für den internationalen Bereich sind folgende Informationsproduzenten von Interesse: •
Dun & Bradstreet
•
Kompass.
Wir stellen diesen Datenbanktyp an Beispielen von Hoppenstedt (Abbildung 11.1) und Creditreform (Abbildung 11.2) vor.
11 Betriebswirtschaftliche Unternehmensinformationen
249
Abb. 11.1: Unternehmenskurzdossier. Beispieldatensatz aus der HoppenstedtDatenbank Rheinbraun Aktiengesellschaft Stuettgenweg 2 50935 Koeln TELEPHONE: (0221) 4 80-0 TELEFAX: (0221) 4 80-1351 TYPE: Public limited company (PLC) GERMAN INDUSTRIAL CODE: 1110 Lignite and bituminous coal mining, lowtemperature; lignite carbonisation SUBSIDIARY SECTOR(S): 1010 Electricity generation 1110 Lignite and bituminous coal mining, low-temperature lignite carbonisation US-SIC-CODE: 1221 Bituminous coal and lignite surface mining 2999 Mineraloel- u. Kohleprodukte etc. / Products of petroleum and coal, n.e.c. 4911 Elektrizitaetsgesellschaften u. -Systeme / Electric companies and systems FOUNDED: 1908 EMPLOYEES: Besch. 1997: 12031 (Stand 30. Juni) FISCAL YEAR: 1.7.-30.6. SALES/TURNOVER: Urns: DM 3309 Mio (1996/97); DM 3222 Mio (1995/96); DM 3212 Mio (1994/95) EQUITY: Grundkap: DM 1100 Mio BANK: LZB Koeln Postgiro: Koeln 14 06 - 506 REAL ESTATE: Produktionsanlagen: 4 Tagebaue; 3 Kohlenveredlungsbetriebe; 4 Grubenkraftwerke; 2 Wasserkraftwerke (verpachtet an RWE Energie AG, Essen) MANAGEMENT: Member Brd. Directors/Vorstand: Dr. Dietrich Boecker (Dr.-Ing.) (m), Bruehl Technician Member Brd. Directors/Vorstand: Bernd J. Breioer (m), Koeln Member Brd. Directors/Vorstand: Jan Zilius (m), Koeln Mem Supervis. Brd/Aufsichtsrat: Dr. Dietmar Kuhnt (Dr.jur.) (m), Essen (Vors.) Lawyer Mem Supervis. Brd/Aufsichtsrat: Klaus-Dieter Suedhofer (m), Recklinghausen (stellv. Vors.) Mem Supervis. Brd/Aufsichtsrat: Professor Clemens Boersig (Prof. Dr.rer.pol.) (m), Essen Economist Mem Supervis. Brd/Aufsichtsrat: Professor Ulrich Buedenbender (Prof. Dr. jur.) (m), Essen Lawyer Mem Supervis. Brd/Aufsichtsrat: Norbert Burger (m), Koeln ... [gekürzt; es folgen die Namen aller Mitglieder des Aufsichtsrats] Director / Direktor: Direktor Paul Albers (m), Personnel Manager / Personalleitung (Personal- und Bildungswesen Tarifmitarbeiter) Director / Direktor: Dr. Juergen Engelhard (Dr.-Ing.) (m),
250
11 Betriebswirtschaftliche Unternehmensinformationen
Management of Research and Development / Forschung/Entwicklung (Ltg.) (Forschung u. Entwicklung) Technician ... [gekürzt; es folgen die Namen der Direktoren] Exec. Stat.Authority/Prokurist: Hans-Dieter Bertram (m), (Steuern und Abgaben) ... [gekürzt; es folgen die Namen der Prokuristen] Exec. Stat.Authority/Prokurist: Heinz Joseph Welter (m), Commercial Management / Kaufmaennische Unternehmensfuehrung, Personnel Manager / Personalleitung (Sozialwesen) OWNERSHIP: Shareholder / Aktionaer: RWE Aktiengesellschaft (organisations/ companies), Essen 100 % SUBSIDIARIES: Braunkohlenbergbau: Lausitzer Braunkohle AG, Senftenberg 39,5 %; Steinkohlenbergbau und Mineralische Rohstoffe: Consol Energy Inc., USA - 50 % (davon 10 % indirekt); Uranerzbergbau-GmbH, Wesseling - 50 %; Rheinbraun Australia Pty. Ltd., Australien - 100 %; Huertherberg Steine und Erden GmbH, Koeln - 100 % Handel und Dienstleistungen: RV Rheinbraun Handel und Dienstleistungen GmbH, Koeln - 100 %; Rheinbraun Brennstoff GmbH, Koeln - 100 %; RSB LOGISTIC GMBH, Wesseling - 100 %; Breuer GmbH, Huerth - 100 % Sonstige Bereiche: Rheinbraun Engineering und Wasser GmbH, Koeln 100 %; KAZ Bildmess GmbH, Leipzig - 100 %; RHEINBRAUN HAUSTECHNIK GMBH, Koeln - 100 %; Rheinbraun Immobilien GmbH, Koeln - 100 %; Wohnungsbaugesellschaft fuer das Rheinische Braunkohlenrevier GmbH, Koeln 50 %; GSG Wohnungsbau Braunkohle GmbH, Koeln - 15 % (70 % ueber Wohnungsbaugesellschaft fuer das Rheinische Braunkohlenrevier) MEMBERSHIP: Verb: Deutscher Braunkohlen-Industrie-Verein e.V., Koeln; Verein Rheinischer Braunkohlenbergwerke e.V., Koeln; Vereinigung Deutscher Elektrizitaetswerke, Frankfurt; Vereinigung Industrielle Kraftwirtschaft, Essen COUNTRY: GERMANY HOPPENSTEDT NUMBER: 315000422 SOURCE: Major Companies Directory / Handbuch der Grossunternehmen - 1997 Edition; Region: Nordrhein-Westfalen LANGUAGE: ENGLISH; GERMAN; DEUTSCH LOAD-DATE: January 19, 1998 Quelle: Lexis-Nexis / Hoppenstedt
Diesmal betrachten wir zwei Beispiele zu einem Datenbanktyp. Der Grund liegt darin, daß hier Unterschiede bestehen, die sich gegenseitig ergänzen. Grob gesagt, hat Hoppenstedt Stärken bei personenbezogenen Informationen, die Marketingaktivitäten im Rahmen von Database-Marketing ermöglichen; während Creditreform in der
11 Betriebswirtschaftliche Unternehmensinformationen
251
Anzahl der betrachteten Unternehmen sowie in deren Kurzbeschreibung überlegen ist.
Database-Marketing mit externen Informationen Das Dossier von Hoppenstedt
bringt detaillierte Personeninformationen, zum
Vorstand,
Angestellten,
zu
den
leitenden
zum
Aufsichtsrat.
Sucht
man
personenbezogen („Wo sitzt Herr X überall im Aufsichtsrat?"), so wird man hier fündig. Jede Funktion einer Person ist markiert, so daß man gezielt z.B. nach den Personalleitern oder Direktoren der Forschung und Entwicklung recherchieren kann. Unterstützt die Software im Rahmen der Ausgabeformate ein Labelformat (bei Hoppenstedt
vorhanden), so können Namen und Adresse direkt in eine Datei
übertragen werden. Hier befinden wir uns an der Schnittstelle zwischen Datenbankrecherche und Database-Marketing, wobei sich die „Database" in dieser Variante auf die externen Informationen einschränkt. Sogar die Anredeform ist Uber die Geschlechtsangabe sowie - wenn vorhanden - die akademischen Grade der Personen notiert. Einer Übernahme einer solchen Namensdatei in die Mailingaktion der Marketingabteilung steht nichts im Wege. Die Datensätze der Hoppemtedt-¥\rmtnáaiznbmY.
enthalten Informationen zu rund
360.000 Führungskräften des Top- und Middle-Management. Betrachten wir folgendes Detail aus Abbildung 11.1:
Dr. Juergen Engelhard (Dr.-Ing.) (m), Management of Research and Development / Forschung/Entwicklung (Ltg.) (Forschung u. Entwicklung) Technician
Wir finden den Namen bei einer Recherche nach Leitern von FuE-Abteilungen (mittels des Sucharguments „Forschung/Entwicklung (Ltg.)"). Das Anschriftenfeld füllen wir mit „Herrn" (auf der Basis des „m") und „Dr.-Ing. Juergen Engelhardt"; analog geht man mit der Anrede um.
252
11 Betriebswirtschaftliche Unternehmensinformationen
Abstracts der Unternehmensaktivitäten Der Beispieldatensatz von Creditreform zeigt die Vorzüge dieser Datenbank in der inhaltlichen (verbalen) Beschreibung des Unternehmens, die Hoppenstedt
kaum
bietet. Zudem enthält die Datenbank weitaus mehr Datensätze.
Abb. 11.2: Unternehmenskurzdossier. Beispieldatensatz aus der CreditreformDatenbank Rheinbraun Aktiengesellschaft Stuettgenweg 2, 50935 Koeln Germany / Deutschland Tel: (0221)4800 CREFO-NR: 519001337 LEGAL-STATUS: AG HISTORY: Eintragsdatum: AG, 1902, 50939 Koeln, Nummer (Register B): 117, letzte HR-Aenderung: August 20, 1997 FOUNDED: November 22, 1902, Vorgruendung: May 23, 1898 CAPITAL: Grundkapital: 1100000000 DM LEGAL-RESERVES: 842353713 DM MANAGEMENT: Vorstands-Vorsitzender: Henning, Dieter, Dr., Dueren, Stresemannstr. 31, 52349 Vorstandsmitglied: Zilius, Jan, 5000 Koeln Vorstandsmitglied: Boecker, Dietrich, Dr. Ing., 5040 Bruehl, Auguste-ViktoriaStr. 26,50321 Vorstandsmitglied: Breioer, Bernd Jobst, Koeln, Hans-Driesch-Str. 3, 50935 OWNERSHIP: Aktionaer: RWE Aktiengesellschaft Essen 100,00%, 45128 SECTOR: 10200 Braunkohlenbergbau und -brikettherstellung BUSINESS: Aufsuchung, Gewinnung, Verarbeitung und Veredelung von Rohstoffen, besonders von Braunkohle im In- und Ausland, Absatz von und Handel mit Waren und Erzeugnissen vornehmlich der genannten Art incl. Baustoffe und -geraete, Erbringung von Dienstleistungen, insbesondere auf den Geschaeftsfeldern Transport, Logistik und Sicherheit sowie Taetigung von Grundstuecksgeschaeften. Die Gesellschaft ist auch berechtigt, alle Geschaefte und Taetigkeiten vorzunehmen, die diesem Gegenstand unmittelbar oder mittelbar zu dienen geeignet erscheinen, Forschung und Entwicklung zu betreiben sowie im In- und Ausland Unternehmen gleicher oder verwandter Art in jeder zulaessigen Form zu gruenden, zu erwerben, sich an derartigen Unternehmen zu beteiligen, sie zu leiten oder sich auf deren Verwaltung zu beschraenken. gefoerderte Braunkohle (Mio.Tonnen): 1995 - 100,7 1996- 100,8 1997- 102,2 . EMPLOYEES: Beschaeftigte 12401 SALES:
11 Betriebswirtschaftliche Unternehmens informationell
253
1997 3300000000 DM 1996 3220000000 DM 1995 3210000000 DM PUB-TYPE: Company Profile LANGUAGE: German; Deutsch COUNTRY: Germany; Deutschland LOAD-DATE: January 14, 1998 Quelle: Lexis-Nexis / Creditreform
Da die Angaben in den Dossiers (egal, welcher Datenbank) nicht immer korrekt sind (z.T. schlichte Tippfehler, aber auch veraltete Informationen), empfiehlt sich grundsätzlich eine Parallelrecherche in mehreren Datenbanken und ein (intellektueller) Vergleich der Daten. Es ist bei der Nutzung der Kurzdossiers stets zu beachten, daß sie nur Basisinformationen liefern, aber keine ausfuhrliche Firmenanalyse. Hier helfen die in diesem Kapitel beschriebenen anderen betriebswirtschaftlichen Datenbanken und die Files mit Berichten von Brokern bzw. Analysten (z.B. Investext oder die Brokerline von Profound; s.o. Kap. 9.3, s.u. Kap. 20.1) weiter. Unternehmenskurzdossiers bieten demnach bei der Sammlung von Informationen zu einer Firma nur einen ersten Einstieg.
Publizitätspflicht von Unternehmen Wie vollständig und wie verläßlich sind die Angaben in den Unternehmenskurzdossiers? Hoppenstedt beschreibt ausschließlich große und mittlere Firmen, während Creditreform auch kleinere Unternehmen zusätzlich berücksichtigt. Die Hoppenstedt Firmen-Datenbank auf CD-ROM umfaßt rund 135.000 deutsche Unternehmen, Creditreform enthält 700.000 Dossiers. Zum Vergleich: Der Weltmarktfuhrer für Unternehmensdossiers, Dun & Bradstreet, kommt auf mehr als 51 Millionen Datensätze - allerdings weltweit. Die Vollständigkeit der Information hängt entscheidend von der Rechtsform des Unternehmens ab. Veröffentlichungspflichtige Unternehmen sind in der Regel besser abgebildet als die anderen. Zu den Veröffentlichungspflichtigen Firmen gehören in Deutschland •
Aktiengesellschaften
•
Kommanditgesellschaften auf Aktien
254 •
11 Betriebswirtschaftliche Unternehmensinformationen Gesellschaften mit beschränkter Haftung.
Veröffentlicht werden Jahresabschluß und Lagebericht. Der Umfang der Veröffentlichung sowie der Abgabetermin variieren mit der Größe des Unternehmens. Kleine Unternehmen dürfen weniger publizieren und dies auch später (zwölf Monate nach Bilanzstichtag gegenüber neun Monaten bei mittleren und großen Firmen). Grundsätzlich für alle Unternehmen besteht die Pflicht, die gesetzlich vorgeschriebenen Angaben in das Handels- bzw. Genossenschaftsregister eintragen zu lassen. Auch fiir ausländische Unternehmen gilt, daß für börsennotierte Firmen eine bessere Informationsbasis vorhanden ist als für die Privatunternehmen. Dies ist aber nur ein kleiner Teil der Unternehmen. In den USA gibt es z.B. mehr als elf Millionen Firmen, aber nur 11.000 müssen ihre Zahlen gemäß SEC (Securities and Exchange Commission) offenlegen (vgl. IMO 1994b, 15). Die Datenbankproduzenten bemühen sich, über Befragungen die Daten auch der anderen Unternehmen zu erhalten, hier durchaus mit dem Risiko behaftet, daß die Selbstauskünfte der Unternehmen subjektiv gefärbt sein können.
11.2 Handelsregistereintragungen Durch Gesetz müssen alle Angaben zum Status eines Unternehmens veröffentlicht werden. Diese Angaben umfassen •
Sitz des Unternehmens
•
Anschrift
•
Stammkapital
•
Geschäftsführer
•
Zweck des Unternehmens.
Bundesanzeiger (Zentralhandelsregister / Bekanntmachungen) Im „Bundesanzeiger" werden in der Zentralhandelsregister-Beilage sowie in den ergänzenden Bekanntmachungen alle deutschen Pflichtpublikationen zum Firmenstatus publiziert. Von der Firmengründung über jede relevante Änderung (etwa: neue Prokura) bis zum Erlöschen des Unternehmens wird jede Meldung notiert. Es ist
11 Betriebswirtschaftliche Unternehmensinformationen
255
verständlich, daß sich hier eine Menge Detailinformationen sammelt, rund 400.000 Dokumente pro Jahr.
Abb. 11.3: Handelsregister. Beispiel für eine Änderungsmeldung ZENTRALHANDELSREGISTER-BEILAGE HANDELSREGISTER
Ausgabedatum: 21.05.97 Doknr.: 21059749211005
VERÄNDERUNG Boll & Kirch Filterbau Gesellschaft mit beschränkter Haftung 50171 Kerpen Boll & Kirch Filterbau Gesellschaft mit beschränkter Haftung, Kerpen-Sindorf HRB 1 2 9 4 - 1 1 . 0 4 . 1997 11. 04. 1997 HRB 1294 - 1 1 . 04. 1997: Boll & Kirch Filterbau Gesellschaft mit beschränkter Haftung, Kerpen-Sindorf. Die Prokura Wilfried Klein ist erloschen. Diplom-Ingenieur Wilfried Klein, Maschinenbau-Ingenieur, Nettesheim, ist zum weiteren Geschäftsführer bestellt. Er ist befugt, mit sich im eigenen Namen oder als Vertreter eines Dritten Rechtsgeschäfte mit der Gesellschaft abzuschließen (Befreiung von § 181 BGB). Er ist berechtigt, die Gesellschaft allein zu vertreten. Amtsgericht Kerpen Quelle: Bundesanzeiger-CD-ROM
In der elektronischen Version des Handelsregisters sind folgende Daten vorhanden: •
Zentralhandelsregister-Beilage •
Handelsregister •
Neueintragungen
•
Veränderungen
•
Löschungen
•
Partnerschaftsregister
•
Genossenschaftsregister
11 Betriebswirtschaftliche Unternehmensinformationen
256
•
•
Konkurse, Gesamtvollstreckungs- und Vergleichsverfahren
•
Verschiedenes
gerichtliche und sonstige Bekanntmachungen •
Aktiengesellschaften
•
Kommanditgesellschaften auf Aktien
•
Gesellschaften mit beschränkter Haftung
•
Europäische wirtschaftliche Interessenvereinigungen.
Mittels der elektronischen Recherche finden wir, den korrekten Unternehmensnamen als Suchargument vorausgesetzt, eine lückenlose Liste aller Handelsregistereintragungen. Es ist sinnvoll, außer mit dem Unternehmensnamen mit weiteren Suchargumenten zu arbeiten. Sucht man nur Neueintragungen, so kann dies in einem Feld „Art der Veröffentlichung" angegeben werden. Abbildung 11.3 ist Ergebnis einer Suche nach einer Änderungsmeldung der Firma Boll & Kirch. Natürlich kann auch im gesamten Text der Einträge gesucht werden, u.a. nach dem Amtsgericht oder dem Aktenzeichen oder nach Aspekten der Firmenanschrift. (Das Ausweisen gewisser Informationen in mehreren Feldern erklärt die Dopplungen einiger Angaben.) Suchen müssen nicht auf konkrete Unternehmen beschränkt werden, sondern können auch anderen Interessen dienen. So haben wir nach allen Liquidationen einer GmbH in Kerpen-Sindorf gesucht (Abbildung 11.4). Solcherart gefundenes Material läßt sich weiter statistisch verdichten. Als Beispiel könnte dienen: In welcher Stadt gab es in den letzten Jahren mehr Konkurse, in Köln oder in Düsseldorf?
Abb. 11.4: GmbH-Bekanntmachung. Beispiel einer Liquidation GERICHTLICHE UND SONSTIGE BEKANNTMACHUNGEN Ausgabedatum: 22.02.97 GESELLSCHAFTEN MIT BESCHRÄNKTER HAFTUNG Doknr.: 22029717013001 LIQUIDATION TELEIT Temex-Leitstellen GmbH TELEIT Temex-Leitstellen GmbH, 50170 Kerpen-Sindorf [17 013/39] TELEIT Temex-Leitstellen GmbH, Kerpen-Sindorf
11 Betriebswirtschaftliche Unternehmensinformationen
257
Die Gesellschaft ist aufgelöst. Die Gläubiger der Gesellschaft werden aufgefordert, sich bei dem Liquidator, Herrn Heinz Klein, Daimlerstr. 36, 50170 KerpenSindorf, zu melden. Der Liquidator
Quelle: Bundesanzeiger-CD-ROM
11.3 B i l a n z e n Alle Jahresabschlußbilanzen der publizitätspflichtigen Unternehmen in Deutschland (vgl. Küting/Mohrens 1992) sowie vieler weiterer Länder sind komplett elektronisch recherchierbar. Abfrage wie Interpretation der Zahlenwerke erfordern einschlägiges betriebswirtschaftliches Wissen (vgl. z.B. Küting/Weber 1999 oder Küting/Weber/ Hayn 1999). Die Aufgabe des Informationswirtes ist die Beschaffung der Bilanz eines Unternehmens oder die Selektion gewisser Mengen von Unternehmen nach Zahlenwerten der Bilanz. Der nächste Schritt, die Bilanzanalyse, wird vom Informationswirt vorbereitet, gehört aber in den Hände von Finanzspezialisten. Unser Beispiel in Abbildung 11.5 bringt die (stark gekürzte) Bilanz der Rheinbraun AG, recherchiert in der //oppmsfctA-Bilanzdatenbank beim Online-Archiv LexisNexis.
Abb. 11.5 : Bilanz. Beispieldatensatz aus der Hoppenstedt-Datenbank RHEINBRAUN AKTIENGESELLSCHAFT Postfach 41 08 40 Stuettgenweg 2 50935 Koeln Deutschland / Germany H-NUMBER: 315000422 TYPE: Aktiengesellschaft / Public limited company (PLC) SECTOR: Industrie / Industiy COMP-GROUP: Muttergesellschaft / Mother Company BRANCHEN: 1110 Braun- und Pechkohlenbergbau (einschl. -brikettherstellung) Braunkohlenschwelerei / 1110 Lignite and bituminous coalmining, lowtemperature lignite carbonisation SIC: 1200 Flammkohlen- u. Lignitbergbau / 1 2 0 0 Coal mining P&L-TYPE: Gesamtkostenverfahren / Total Costs Method CURRENCY: DM Deutsche Mark / DM Deutschmark FYE: June 30, 1997 / 30. Juni 1997
258
11 Betriebswirtschaftliche Unternehmensinformationen
TOTAL-ASSETS: 8739372000 TOTAL-LIAB: 8739372000 NET-INCOME: 0 EMPLOYEES: 12401 (1997) NORMBILANZ / STANDARDIZED BALANCE SHEET: AKTIVA / ASSETS: ******************
1995 1996 Anlagevermoegen 7060746000 6864845000 Anfangsbestand 16647588000 17248255000 Zugaenge 941823000 593861000 Abgaenge 341156000 670583000 Kumul. Abschreibungen 10187509000 10306688000 (davon Geschaeftsjahresabschreibungen) 574948000 584255000 (dav. Zuschr. b. Abschr.) 190000 49000 Immaterielle Vermoegensgegenstaende 3898000 4941000 Anfangsbestand 84483000 86932000 Zugaenge 2274000 4330000 Abgaenge 6000 15000 Sonstige Veraenderungen 181000 209000 Kumul. Abschreibungen 83034000 86515000 (dav. Geschaeftsjahresabschreib.) 4042000 3496000
1997 6477538000 17171533000 416103000 482375000 10627723000 511932000 58000 4935000 91456000 3134000 172000 105000 89588000 3266000
. [gekürzt] 8850566000
8787466000
8739372000
1995 E igenkapi tal 2213745000 1100000000 Kapital Eingefordertes Kapital 1100000000 Gezeichnetes Kapital 1100000000 Offene Ruecklagen 1113745000 Kapitalruecklagen 842032000 Gewinnruecklagen 271713000 Freie Ruecklagen 271713000 And. Gewinnruecklagen 271713000
1996 2263745000 1100000000 1100000000 1100000000 1163745000 842032000 321713000 321713000 321713000
1997 2263745000 1100000000 1100000000 1100000000 1163745000 842032000 321713000 321713000 321713000
Bilanzsumme (Passiva) 8850566000 8787466000 Eventualverbindlichk. 727498000 811757000 Haftungsverhaeltnisse 698018000 585792000 (davon Verblk. aus Buergschaften) 695583000 583355000 (dav. Sich. -Best. f. fremde Vblk. )
8739372000 998674000 867922000
Bilanzsumme (Aktiva) PASSIVA / LIABILITIES: ***********************
. [gekürzt]
865494000
11 Betriebswirtschaftliche Unternehmensinformationen 2435000 2437000 Sonstige finanzielle Verpflichtungen 141706000 113739000 (dav. ggue. verbundenen Unternehmen) 8000000 3000000 (dav. Bestellobligo fuer Sachanl.) 102000000 60000000
259 2428000 130752000 1000000 122000000
GEWINN- UND VERLUSTRECHNUNG / PROFIT & LOSS: ****************************************************
Gesamtkostenverfahren / Total Costs Method 1995 1996 Umsatz / Aussenumsatz / Erloese (netto) 3212079000 3222250000 Bestandsveraenderungen 25787000 -23142000 Aktiv. Eigenleistungen 112042000 66834000 Sonst, betriebl. Erträge 300302000 330274000 Ertraege aus Rueckstellungsaufloesungen Ertr. aus der Sopo-Aufloesung 92493000 92056000 Sonstige Ertraege 207809000 238218000 Materialaufwand 538155000 608789000 Roh-/Hilfs-/Betriebsstoffe/bez. Waren 533434000 600213000 Bezogene Leistungen 4721000 8576000 Rohergebnis (Gesamtkostenverfahren) 3112055000 2987427000 Personalaufwand 1512362000 1494494000 Loehne und Gehaeiter 1148316000 1130493000 Soz.Abgaben/Altersvers./Unterstuetzung 364046000 364001000 (davon gesetzlicher Sozialaufwand) 280419000 279378000 (dav. Altersversorgung) 75526000 81724000 (davon Unterstuetzung) 8101000 2899000
1997 3308917000 15421000 30724000 416003000 106048000 78311000 231644000 567015000 557354000 9661000 3204050000 1517125000 1123402000 393723000 284581000 66280000 42862000
... [gekürzt] .. Finanzergebnis d. gewoehnlichen Geschae. 123990000 123139000 Ergebnis der gewoehnl. Geschaeftstaetig. 340190000 377495000 EE - Steuern / Steuererstattungen 133360000 147655000 Sonstige Steuern / Steuererstattungen 3580000 -1660000 Ausgewies. Steuern / Steuererstattungen 136940000 145995000 Gewinnabfuehrung aufgrund von Vertraegen 173250000 181500000 Ergebnisverrechnungen vor Jahresergebnis -173250000 -181500000 Jahresueberschuss / -fehlbetrag 30000000 50000000 Ruecklagenveraenderung -30000000
164143000 202159000 33231000 3928000 37159000 165000000 -165000000 0 -50000000
260
11 Betriebswirtschaftliche Unternehmensinformationen
Veraenderung der Gewinnruecklagen -30000000 Einstellung in Gewinnruecklagen 30000000 Veraenderungen vor Bilanzgewinnausweis -30000000 Bilanzgewinn / -verlust
0
LANGUAGE: German; Deutsch
0
-50000000 50000000 -50000000 0
LOAD-DATE: October 20, 1997
Quelle: Lexis-Nexis / Hoppenstedt (stark gekürzt) Neben den Angaben zu den Aktiva und Passiva sowie zur Gewinn- und Verlustrechnung gestatten Online-Archive den genauen Zugriff auf Werte der betrieblichen Kennzahlen. Die Creditreform-Datenbank felder u.a. folgende Kennzahlen an: •
Cash-Flow
•
Verschuldungsgrad
•
Selbstfinanzierungsquote
•
Return on Investment
•
Eigenkapitalrentabilität
•
Gesamtkapitalrentabilität
•
Umsatzrentabilität
•
Eigenkapitalquote
•
Bilanzkurs (in %)
•
Anlagendeckung
•
Kapitalintensität
•
Arbeitsintensität
•
Materialaufwandsquote
•
Personalaufwandsquote Rationalisierungsgrad Umsatz pro Mitarbeiter.
FINN beim Host GBl bietet z.B. als Such-
11 Betriebswirtschaftliche Unternehmensinformationen
261
Mittels solcher Felder lassen sich Unternehmen (deren Bilanz in der Datenbank vorliegt) finden, die gewisse Eigenschaften erfüllen. Man denke etwa an Informationsprobleme der Art: Gesucht sind alle Unternehmen einer Branche (nach SIC), deren Umsatz pro Mitarbeiter über 250.000 DM liegt. Oder: Wir suchen alle deutschen Unternehmen mit einer Personalaufwandsquote unter 30.
11.4 Bonität Einem Unternehmen können wirtschaftliche Probleme von Geschäftspartnern bis hin zu deren Insolvenz beträchtliche Sorgen bereiten, wenn man die durch Insolvenzen bedingten Forderungsausfälle bedenkt. Diese Bedrohung macht es gemäß Hans P. Schuhböck „zur grundsätzlichen Aufgabe jedes ... Unternehmens, durch umfassendes Risk Management die wesentlichen Insolvenzrisiken und -Ursachen genau zu kennen und in die Kunden- bzw. Partnerbewertung und Kreditentscheidung einzubeziehen" (Schuhböck 1997, 68). Bei der umfassenden Bewertung eines Unternehmens fließen natürlich alle Informationen aller Datenbanktypen zusammen, es gibt aber auch spezialisierte Datenbanken, die sich mit der Bonität von Firmen befassen. Diesem Datenbanktyp wenden wir uns hier zu.
Zahlungsgewohnheiten von Unternehmen Im Vergleich zu den anderen betriebswirtschaftlichen Unternehmensdatenbanken steht hier die Kreditwürdigkeit eines Unternehmens im Zentrum. Erhoben werden Daten, die Schlüsse auf die Bonität gestatten, vor allem Werte zu den Zahlungserfahrungen mit der Firma und damit zur (jetzigen und - wahrscheinlich - künftigen) Zahlungsfähigkeit. Je nach Datenbankanbieter werden die uns hier interessierenden Bonitätsinformationen mit weiteren Unternehmensinformationen gekoppelt (etwa mit gewissen Grunddaten des Unternehmens). Die Bonitätsinformation besteht entweder aus der Angabe eines Wertes, der als Obergrenze für Vereinbarungen gilt (Kreditempfehlung), oder durch Kennziffern zur Risikobewertung, die die Bonität quantitativ ausdrücken. Creditreform, ein wichtiger Anbieter von Bonitätsdaten über deutsche Unternehmen, benutzt zur Quantifizierung des Risikos eine Kombination von mehreren bonitätsrelevanten Merkmalen, „aus denen mit Hilfe von normierten Schlüsseln für jedes
262
11 Betriebswirtschaftliche Unternehmensinformationen
Merkmal und eines Gewichtungsfaktors der Bonitätsindex errechnet wird" (Schuhböck 1997, 73). Die einzelnen Merkmale sind in Abbildung 11.6 aufgelistet.
Abb. 11.6: Risikobewertung von Unternehmen bei Creditreform Zahlungsweise Krediturteil Auftragslage Unternehmensentwicklung Mitarbeiterstruktur Umsatz / Gesamtleistung Produktivität (Umsatz pro Mitarbeiter) Eigenkapitalstruktur Zahlungsverhalten der Kunden Zahlungsverhalten des Unternehmens Kapitalumschlag Rechtsform Altersstruktur Gesellschafterstruktur Branchensituation Quelle: Creditreform. URL:http://www.creditreform.de
Bonitätsinformationen sind nicht risikofrei, denn ihre Erhebung ist stark von Zufällen abhängig. Aussagen zum Zahlungsverhalten beruhen z.B. stets auf bekanntgewordenen negativen Erfahrungen. „Aus dieser Aussage ergibt sich allerdings keine verläßliche Schlußfolgerung bezüglich des augenblicklichen Zahlungsverhaltens. Die Tatsache, daß ein Unternehmen noch nicht aufgefallen ist, läßt darüber hinaus keine verbindliche Prognose für die Zukunft zu" (Schuhböck 1997, 70). Schuhböck
11 Betriebswirtschaftliche Unternehmensinformationen
263
empfiehlt zusätzlich zu den Informationen aus Bonitätsdatenbanken stets die eigene Durchführung von Bilanzanalysen (vgl. ebd., 71 f.).
Dun & Bradstreet Weltmarktfiihrer bei Bonitätsauskünften dürfte mit Datensätzen zu rund 46 Millionen Unternehmen aus 200 Ländern Dun & Bradstreet (in Deutschland D&B Schimmelp/eng) sein. Ein Bonitätsdossier von D&B enthält folgende Angaben, wobei die jeweils angeführten Informationen von Unternehmen zu Unternehmen - j e nach Informationsstand bei D&B - variieren: •
Firmeninformationen •
Analysen zur Bewertung von Geschäftsvorgängen
•
wirtschaftliche Entwicklung der Firma
•
Profitabilität und Rentabilität
•
registrierte
Firmennamen,
Eigentumsverhältnisse,
Finanzlagen,
schäftsbeziehungen • •
•
•
•
Firmenhierarchie, Managementebenen
Zahlungsanalysen •
historische Analyse der Zahlungsweise
•
Zahlungsgewohnheiten, Konkurse, Insolvenzen, Liquidität
Lieferantenanalysen •
Risikoanalysen für Geschäftsbeziehungen zu Lieferanten
•
alternative Produkte und Dienstleistungen
•
regionale und überregionale Benchmarks
Finanzanalysen •
Zahlungsgewohnheiten, Bewertungsziffern für Insolvenzrisiken
•
Handelsregistereinträge, Bankverbindungen, Experten
Finanzvergleich Unternehmen - Branche
Ge-
264
11 Betriebswirtschaftliche Unternehmensinformationen •
Branchenvergleiche
•
Vergleich des Unternehmenserfolgs mit dem der Branche, Ermittlung von Zahlungsfähigkeit
•
Funktionsbereiche des Management.
Abb. 11.7: Bonitätsinformation. Beispieldatensatz von Dun & Bradstreet D&B EUROPEAN REPORT DATE PRINTED 16 AUG 1999 IDENTIFICATION Frankfurter Maschinenbau Aktiengesellschaft ADDRESS: Sachsenhausen Darmstaedter Landstr. 802 60598 Frankfurt DE TEL: 069/123456 FAX: 069/2631587 TELEX: 456789 TELETEX NO: 1238899002 BTX NO: 123456789 TRADING STYLE(S): FMA Frankfurter Maschinenbau PO BOX/ 328234 POSTAL ADDRESS DUNS: 31-727-3787 CURRENCY: Shown in Deutschmarks, unless otherwise stated. LANGUAGE: In certain circumstances information in this report may be quoted in the local language. In case of difficulty, please contact your D&Blocal Customer Service Department . EVALUATION D&B RATING: MAXIMUM CREDIT: AVERAGE DAY(S) IN ANTICIPATION: D&B PAYMENT SCORE: ACCOUNTS INCORPORATED IN REPORT:
2A1 3,000,000 9 84 30-11-1998
The D&B Rating of 2A1 indicates: A Financial Strength of 4.5 - 20 Million (based on Net Worth) and an overall condition which is Strong (minimal risk). The D&B 'maximum credit recommendation' for this business is 3,000,000. The D&B Payment Score of 84 corresponds to an average of 9 day(s) in anticipation of terms.
265
11 Betriebswirtschaftliche Unternehmensinformationen SUMMARY STARTED: 1931 SALES : DATE INC: 1952 LEGAL FORM: AG FRANKFURT CITY OF PROFIT/(LOSS): NET WORTH: REG NO: HRB 90002 EMPLOYS: NOMINAL CAPITAL: LINE OF BUSINESS: METAL FORMING METAL CUTTING 3542 SIC CODE(S): SBA No(s) : 2421 SPECIAL EVENTS Critical legal notice information D&B Analysts, and where relevant, this section.
75,333,248 30-11-1998 (277,866) 8,729,484 30-11-1998 330 5,000,000 MACHINE TOOL MANUFACTURERS MACHINE TOOL MANUFACTURERS 3541 2427 filed is investigated by comment is presented in
BANKERS Deutsche Konsumbank eG, Frankfurt/Main, BLZ (50066789) Bayrische Hypothekenbank AG, Frankfurt/Main, BLZ (50077898) Hessische Landesbank, Frankfurt/Main, BLZ (50050033) Volksbank eG, Dresden, BLZ (85095154) PRINCIPALS Name: Born: Address: Marital status : Marr. Contract : Qualifications : Work History: Aachen;
Dr. rer. nat. Hermann Schulz Chief Executive 24-04-1949 Dresden Balkenhaeuser Tal 31, Frankfurt married Property-separation marriage contract Dipl.-Ingenieur 1967-1973 Studium an der TU Berlin und TH
... [gekürzt] ... PAYMENT HABITS D&B has collected 21 trade references amounting to 1,329,000 which show that, on average, this business pays its bills 9 DAY(S) IN ANTICIPATION OF TERMS (Payment Score = 84), which is BETTER THAN THE INDUSTRY AVERAGE. In some instances, payment beyond terms can be the result of overlooked or disputed invoices. INDUSTRY COMPARISON - THIS QUARTER ONLY Based on the 2348 firms in SIC code 3542 ment experiences. UPPER SEGMENT (Top 25%) SCORE = MEDIAN SEGMENT (Middle 50%) SCORE = LOWER SEGMENT (Bottom 25%) SCORE = Beyond Terms
where D&B has pay81 Pays Within Terms 80 Pays Within Terms 75 Pays 8 day(s)
266
11 Betriebswirtschaftliche Unternehmensinformationen
BREAKDOWN OF PAYMENT EXPERIENCES FOR THE 12 MONTHS ENDING APRIL 99 CREDIT AMOUNT BANDS: NUMBER OF TOTAL PAYMENT EXPERIENCES AMOUNT Greater than 300,000 1 500,000 100% of amount stated as Within Terms Between 150,000 & 299,999 2 400,000 100% of amount stated as Within Terms Between 45,000 & 149,999 3 250,000 100% of amount stated as Within Terms 145,000 Between 15,000 & 44,999 6 84% of amount stated as Within Terms 16% of amount stated as 1-30 Days Beyond Terms Between 3,000 & 14,999 4 30,000 83% of amount stated as Within Terms 17% of amount stated as 1-30 Days Beyond Terms 4, 000 Below 3,000 5 63% of amount stated as Within Terms 31% of amount stated as 1-30 Days Beyond Terms 6% of amount stated as 31-60 Days Beyond Terms Total Payment Experiences in file 21 1, 329,000 FINANCIAL COMPARISONS
Fiscal 30-11-1996 Sales 72,387,152 Fixtures & Equipment 7,243,937 Fixed Assets 11,476,500 Inventory 13,475,177 Accounts Receiv. 13,690,358 Current Assets 30,737,728 Net worth 7,481,590 Current Liabil. 21,024,107 Total Assets 44,267,236 Pre-Tax Profit (Loss) 918,760 Employees 375 KEY PERFORMANCE RATIOS 30-11-1996 FINANCIAL STATUS Acid Test (X) 0.7 Current Ratio (X) 1.5 Solvency Ratio (%) 406.9 ASSET UTILITY Collection Period (Days) 69.0
Fiscal 30-11-1997 78,965,152
Fiscal 30- 11-1998 75, 333,248
7,443,937 11,676,500 13,675,177 12,890,358 30,137,728 9,007,350 21,024,107 45,792,996
7, 472,937 11, 618,624 12, 700,476 14, 112,898 30, 506,086 8, 729,484 21, 429,785 45,710,294
2,760,760 355
(277,866) 330
30-11-1997
30--11-1998
0.7 1. 4 338 . 0
0.7 1. 4 352 . 3
59.6
68.4
FINANCIAL STATEMENT ... [gekürzt; es folgen Aktiva/Passiva und Gewinn - und Verlustrechnung] ... CORPORATE STRUCTURE CAPITAL
11 Betriebswirtschaftliche Unternehmensinformationen
267
Date of latest capitalisation 1-3-1993 The capital was increased by 3,500,000. Nominal capital 5,000,000 SHAREHOLDERS: Voting Capital 90% 10%
Shareholder Unterhauser Beteiligungs GmbH, Frankfurt Streubesitz
PARENT COMPANY ...[gekürzt] ... SUBSIDIARIES [gekürzt] ... OPERATIONS ... [gekürzt] ... Umsatzgliederung nach Produktgruppen: 1997 in % 1998 CNC-Drehautomaten 43 42 CNC-Fraesautomaten 25 22 Industrieroboter 32 36 Sells to: Investitionsgueterindustrie (80%), Konsumgueterindustrie (20%) Terms are: 1/3 bei Auftragsbestaetigung, 1/3 bei Produktionsbeginn, 1/3 bei Inbetriebnahme Zahlungsbedingungen(Einkauf): 30 Tage netto Kasse, Wechsel 90 Tage Number of accounts: 1500. Territory: 69% national Exports: 31% of sales to USA,, Kanada, EG-Laender, Osteuropa Imports Italien und Frankreich Product names: FM Industrieroboter, FM CNC-Dreh- und Fraesmaschinen EMPLOYEES: 330 including, labourers: 300, clerks: 45. Die Angabe zu Mitarbeitern bezieht sich auf den Jahresdurchschnittswert. Fuer 1998 betraegt die Mitarbeiterzahl 350. Premises: Subject owns factory, at the heading address covering 9.000 sq. metres of which 12,500 square metres are built on Location: Central business area. Anschluss an das Verkehrsnetz der Deutschen Bundesbahn. MANAGEMENT COMMENT ... [gekürzt] ... Geschaeftsjähr 1998: Die Unternehmensleitung submitted the following interim figures Inventory 10,000,000 Loss 2,300,000 Projected sales turnover for : 85,000,000 Quelle Dun & Bradstreet Musterunternehmens)
via Lexis-Nexis (stark gekürztes Beispiel eines fiktiven
268
11 Betriebswirtschaftliche Unternehmensinformationen
Abbildung 11.7 bringt ein Bonitätsdossier von Dun & Bradstreet. Da Bonitätsinformationen durchaus heikle Details von Unternehmen freilegen können, wird an dieser Stelle nicht - wie sonst durchgehend in diesem Buch - ein Originalbeispiel vorgestellt, sondern ein (allerdings von Dun & Bradstreet selbst erstelltes) rein fiktives Musterunternehmen. Gesucht werden die Dossiers entweder durch Angabe von (korrektem) Unternehmensnamen und Land oder von der Unternehmensnummer (D-U-N-S Number) und Land. Im Datensatz wiederholt werden uns schon bekannte Informationsarten wie Aktiva/Passiva, Gewinn- und Verlustrechnung sowie einige Grunddaten des Unternehmens. Wichtig am Bonitätsdossier sind die Angaben zu den Zahlungsaktivitäten. Unser Beispielunternehmen ist durchaus kreditwürdig (Maximalkredit: 3 Mio. DM), seine Zahlungsgeschwindigkeit liegt (bei einem Wert von 84) über dem Branchenmittelwert (die Top 25 der Branche haben einen Wert von nur 81). Die Branchenzugehörigkeit
wird nach SIC bestimmt.
Die
Zahlungsgewohnheiten
variieren mit der Höhe der Verbindlichkeit, wobei große Rechnungen zu 100% innerhalb der Frist gezahlt werden, kleinere z.T. später. Empirische Basis dieser Werte sind 21 Auskünfte über die Zahlungsgewohnheiten unseres Unternehmens - ob dies genügend fundiert ist, sei dahingestellt.
11.5 Produkte Datenbanken mit Produktinformationen erfüllen zwei Zwecke •
sie informieren über Produkte und ihre Anbieter
•
sie bilden eine Schnittstelle für Ein- und Verkauf mittels elektronischer Kanäle („E-Commerce").
In Deutschland ist die Informationsquelle „Wer liefert was?" einschlägig. Die Wer liefert was? GmbH in Hamburg gehört zur Ameritech Corporation in Chicago. Die Datenbank wird online bei Hosts angeboten, über CD-ROM vertrieben und ist im World Wide Web (als „WLW-Online") abrufbar. Die Datenbank enthält Produktinformationen von über 290.000 Unternehmen, vor allem aus Deutschland, aber auch aus weiteren europäischen Ländern. Die Produkte werden unter ca. 35.000 Rubriken eingeordnet. Als Suchergebnis erhält der Nutzer Namen derjenigen Unternehmen, die das gewünschte Produkt im Sortiment haben. Für einige Firmen, die über eine eigene
11 Betriebswirtschaftliche Unternehmensinformationen
269
Homepage verfugen, ist - bei der Nutzung von WLW-Online - ein Link zur betreffenden Homepage vorhanden. Für Unternehmen, die keine eigene Homepage haben, bietet Wer liefert was? den Aufbau einer Produktpräsentation oder eines elektronischen Katalogs im Rahmen der WLW-Homepage an. Die Kontaktaufhahme zum Unternehmen geschieht demnach entweder direkt - via Homepage bzw. E-Mail - oder konventionell via Fax oder Telefon. Produktinformationen in umfassenden Produktdatenbanken sind bei „allgemeinen" Produktinformationen durchaus brauchbar. Positiv ist sicherlich die Schnittstelle dieser Datenbanken hin zum Electronic Commerce. Problematisch wird es beim Retrieval nach exakt beschriebenen speziellen Produkten. Ursula Georgy berichtet von Rechercheerfahrungen: „Von einer qualifizierten Antwort ... ist man noch weit entfernt. Dies trifft vor allem dann zu, wenn es um etwas detailliertere Produktbeschreibungen geht: z.B. Stahlhallen ab einer Größe von 2000 m2. Es macht schließlich einen Unterschied, ob es sich um ein Gewächshäuschen von 100m2 handelt oder um einen Hangar, in den ein Flugzeug von 9 m Höhe hineinpassen muß. Doch leider ist für derartige Produktspezifizierungen in den Datenbanken kein Platz" (Georgy 1995, 22). Die fehlende Indexierungstiefe bei den Produktbeschreibungen führt ggf. auch zu Interpretationsproblemen. Georgy versorgt uns mit einem weiteren Beispiel. „Gesucht werden Firmen, die Altreifenrecycling übernehmen. Es finden sich in den verschiedensten Datenbanken auch einige Dokumente ... Die meisten Firmen übernehmen gar keine Altreifenentsorgung, sondern stellen Maschinen her, die z.B. jedem Reifenhändler zum Selbstschreddern auf den Hof gestellt werden" (Georgy 1995, 23). Letztlich wird es häufig im Anschluß an eine Produktrecherche nötig sein, anhand einer recht groben Liste mit Unternehmensnamen, die ein bestimmtes Produkt herstellen könnten, weiterzuarbeiten: entweder die Firmen anrufen oder deren Websites besuchen.
11.6 Unternehmensverflechtungen Unternehmensverflechtungen, d.h. Angaben zu Tochter- und Mutteruntemehmen, sind in den Datenbanken zu den Unternehmensgrunddaten meist nur äußerst rudimentär. Hier helfen Spezialdatenbanken zu Konzernverflechtungen weiter. Weiterhin gibt es Informationsmittel, die - angefangen beim „ersten Gerücht" - den Verlauf einer Beteiligung oder einer Akquisition mehr oder minder lückenlos verfolgen. Auch solche Mergers & Acquisitions-Datenbanken werden wir vorstellen.
270
11 Betriebswirtschaftliche Unternehmensinformationen
Konzernverflechtungen Eine auf Vollständigkeit der Angaben ausgerichtete Datenbank ist die
Hoppenstedt
Konzernstrukturdatenbank mit Informationen zu rund 700 deutschen Konzernen und deren ca. 80.000 Beteiligungen. Abbildung 11.8 führt unser Beispiel der Rheinbraun AG weiter. Die Unternehmensgrunddaten sind hier knapp gehalten, zentral sind die Informationen zu den Eigentümern sowie zu den Tochterunternehmen. Angegeben ist jeweils die Art der Verflechtung (etwa: konsolidiert, verbunden, assoziiert, mit Ergebnisabfiihrungsvertrag), das Datum der letzten Änderung im Handelsregister sowie die Quote der Beteiligung. Für das Retrieval wird die Unternehmensnummer wichtig. Wenn man weitere Informationen zu einem gefundenen Unternehmen aus einer anderen
Hoppenstedt-Daten-
bank suchen möchte, etwa das Kurzdossier oder die Bilanz, so ist diese „H-Nummer" der einfachste Weg der Identifikation der Firma. In der Online-Version der Datenbank liegen stets die Informationen zur jeweils nächsten Hierarchieebene vor. Suchen über mehrere Hierarchieebenen sind - über die Unternehmensnummer - zwar möglich, aber zumindest bei Großkonzernen recht mühselig. Die //o#pens/e£#-Konzernstrukturdatenbank
auf CD-ROM bringt die
Konzerninformationen dagegen im grafischen Überblick und erleichtert damit das Retrieval erheblich.
Abb. 11.8: Konzernverflechtung. Beispieldatensatz aus der Hoppenstedt-Datenbank Rheinbraun Aktiengesellschaft Stuettgenweg 2 50935
Koeln
Deutschland / Germany Tel: (0221) 4800 Fax: (0221)4801351 COMPANY-NUMBER: 012396000 H-NUMBER: 315000422 TYPE: Aktiengesellschaft / Limited liable Company FOUNDED: 1908 INDUSTRY: 1110 Braun- und Pechkohlenbergbau (einschl. -brikettherstellung) Braunkohlenschwelerei / Lignite and bituminous coalmining, low-temperature
11 Betriebswirtschaftliche Unternehmensinformationen
271
lignite carbonisation EMPLOYEES: 12989 CAPITAL: 1100000000 CURRENCY: Deutsche Mark OWNERSHIP: COMPANY NO: % OWNED: COMPANY DETAILS: 012392500
100.000% RWE Aktiengesellschaft
SUBSIDIARIES: COMPANY NO: % OWNED: COMPANY DETAILS: 013161200
100.000% Carl Scholl Kommanditgesellschaft, Koeln,
Deutschland / Germany. Accounting: verbünd. Unternehmen / Allied comp. Last change: November 15, 1996 06265400
100.000% Rheinbraun Immobilien GmbH, Koeln,
Deutschland / Germany. Contract: Organschaftsvertr. + Ergebnisabf. / Integr. Contr. + P+L transf. Accounting: konsol. / Consol. Last change: July 2, 1997 007355400
100.000% Huertherberg Steine und Erden GmbH, Koeln,
Deutschland / Germany. Accounting: konsol. / Consol. ... [gekürzt]... 006110900
15.000% GSG Wohnungsbau Braunkohle GmbH, Koeln,
Deutschland / Germany Last change: July 2, 1997 TOTAL-PARENTS: 1 TOTAL-SUBSIDS: 17 LANGUAGE: German; Deutsch; English LOAD-DATE: November 5, 1997 Quelle: Lexis-Nexis / Hoppenstedt
Mittels solcher Strukturen können z.B. im Einkauf Potentiale erkannt werden. Wenn einige der Lieferanten eines Unternehmens zu einer großen Firma gehören, fuhren Rahmenverträge u.U. zu günstigeren Konditionen. Auch Kundenkredite sind besser abschätzbar. Kreditgeschäfte geraten manchmal nicht wegen des direktes Gläubigers in Gefahr, sondern durch Schwierigkeiten des Mutterkonzerns oder der Beteiligungsgesellschaft.
272
11 Betriebswirtschaftliche Unternehmensinformationen
Mergers & Acquisitions Aktuelle Informationen über Unternehmensbeteiligungen und -käufe bieten spezialisierte Datenbanken zu Mergers and Acquistions. Der Rechercheur erhält hier Informationen zum Zielunternehmen, zum Käufer, zum Verkäufer und eine Beschreibung der Aktion. Auch bei diesem Datenbanktyp kann man gezielt nach einem Datensatz, und das heißt hier nach einem Unternehmen bzw. einer Übernahme suchen (wie wir in Abbildung 11.9 zum Kauf von One 2 One durch die Deutsche Telekom), oder man recherchiert informetrisch und versucht, aggregierte Daten zu erlangen. Beispiele könnten sein: Wieviele M&A gab es in der Branche der Telekommunikation im Jahre 1999 und welches Volumen wurde erreicht? Oder: Wieviele deutsche Firmen haben in einem gegebenen Zeitraum britische Unternehmen übernommen, und wieviele britische deutsche? Unser Beispieldatensatz entstammt der Datenbank Mergerstat M&A des Informationsproduzenten Houlihan, Lokey Howard & Zukin, Inc.
Abb. 11.9: Mergerstat M&A Database. Beispieldatensatz Target: One 2 One Ltd Acquiror: Deutsche Telekom AG Announce-Date: August 6, 1999 Last-Update: August 6, 1999 TARGET: T-COMPANY: One 2 One Ltd T-COUNTRY: ENGLAND S-INDUSTRY: Communications ACQUIROR: A-COMPANY: Deutsche Telekom AG A-COUNTRY: GERMANY A-INDUSTRY: Communications PURPOSE: Horizontal SYNOPSIS: Deutsche Telekom agreed to acquire One 2 One, a 50/50 joint venture between MediaOne Group and Cable & Wireless, for $11.1 billion in cash plus $2.4 billion in assumed debt. The acquisition is part of Deutsche's strategy to reduce its reliance on a crowded domestic market. * * * * * * * * *
* * * * * * TRANSACTION DETAILS * * * * * * * * * * * * * * CANCEL-DATE: N/A CLOSE-DATE: N/A PRICE-UPD-DATE: N/A DEAL-TYPE: Divestiture TRANS-TYPE: Divestiture PURPOSE: Horizontal
11 Betriebswirtschaftliche Unternehmensinformationen BANKRUPTCY: LEVERAGE-BUY: CONSIDER-EQUITY: STOCK-EXCH-RATIO: EXCH-DATE: PERCENT-SOUGHT: COMM-SHAR-SOUGHT: PCT-SHARES-OWNED: COMM-SHARES-ACQ: CONT-PAYOUT-AMT: CONT-PAYOUT-DATE: FUT-PAYOUT-AMT: FUT-PAYOUT-DATE: SHARE-PRICE: OPEN-OFFR-PRICE: CLOSE-OFFR-PRICE: PREMIUM-OFFERED: PRICE/EARNINGS: MKT/BOOK-VALUE: NO-TERMS: CASH: STOCK: DEAL-NOTES: CONVERTIBLE-DEBT: PREFERRED-STOCK: CONVERTIBLE-PREF: WARRANTS: LIABILITY-ASSUME: OTHER-PAYMENTS: TOTAL-PAYMENTS: EQUITY-PRICE: OFFER-TYPE: TENDER-DATE: EXPIRY-DATE: MIN-SHARE-REQRD: COMPETING-BIDS: FUND-DESCRIPTION:
No No N/A N/A N/A 100.00% N/A N/A N/A N/A N/A N/A N/A N/A 11128.32 N/A N/A N/A N/A No 11,128,320,000.00 N/A N/A N/A N/A N/A N/A 2419.20 N/A 13547.52 11128.32 Friendly N/A N/A N/A N/A N/A
...[gekürzt; es folgen Angaben zu den Grunddaten beider Unternehmen]... SELLER INFORMATION : S-COMPANY: MediaOne Group Inc / Cable & Wireless PLC S-ADDRESS: 188 Inverness Drive West Englewood, CO 80112 UNITED STATES S-TELEPHONE: 303-858-3000 S-CONTACTS: N/A S-PRODUCTS: Provides mobile telecommunications services
273
274
11 Betriebswirtschaftliche Unternehmensinformationen
Specialization: T : Description not found[T] S-INDUSTRY: Communications S-PRI-SIC: 4812 : Radiotelephone communications S-2ND-SIC: N/A Division S-ORGANIZATION: S-EXCHANGE: N/A S-TICKER: N/A ... [gekürzt; es folgen weitere Angaben zum Verkäufer]... LOAD-DATE: August 10, 1999 Quelle: Lexis-Nexis; File Mergerstat M&A Database
Als Faktendatenbanken für den betriebswirtschaftlichen Informationsbereich haben wir in diesem Kapitel Kurzdossiers mit Grunddaten, Handelsregistereintragungen, Bilanzen,
Zahlungsgewohnheiten
(Indikatoren
auf
Bonität),
Produkte
(mit
Schnittstelle zum E-Commerce) sowie Unternehmensverflechtungen und Mergers & Acquisitions kennengelernt. Mit diesen Datenbanktypen haben wir die wichtigsten Informationsmittel markiert, die eine betriebswirtschaftliche Analyse benötigt. Es gibt jedoch noch weitere, ggf. relevante Informationstypen. Hier sollen nur drei Beispiele genannt werden. (1.) Beim Online-Archiv GENIOS
liegt eine Datenbank („GO") auf, die Kurz-
beschreibungen von Anzeigen aus der überregionalen deutschen Printwerbung anbietet. Man erhält so Informationen über kommunikationspolitische Maßnahmen im Rahmen der klassischen Media-Werbung von Firmen. (2.) Das „Journal of Commerce" hält (u.a. beim Host DIALOG) eine komplette elektronische Liste aller Importe und Exporte vor, die an einem Hafen der USA oder Mexikos abgefertigt worden sind. Mittels PIERS (Port Import Export Reporting Service) können demnach Frachtstücke detailliert gesucht werden. (3.) Bei börsennotierten Unternehmen sind Informationen über die Aktienkurse wesentlich. Börseninformationen liegen - in der Regel leicht zeitversetzt - im kostenlosen Bereich des World Wide Web vor (vgl. Rahlenbeck 1998). Daneben gibt es kommerzielle Systeme zur Überwachung eines Portfolios wie etwa von Profound (s.u. Kap. 20.1) und natürlich die Transaktionsdienste, beispielsweise von Reuters.
11 Betriebswirtschaftliche Unternehmensinformationen
275
Fazit •
Unter „betriebswirtschaftlichen
Informationen"
fassen wir
faktographische
Angaben zusammen, die ein Unternehmen im betriebswirtschaftlichen Sinn beschreiben, also Informationen aus Handelsregister, Bilanzen, Produktkatalogen oder auch solche von Auskunfteien. •
Datenbanken mit Unternehmensgrunddaten geben einen ersten Einblick in eine Firma, indem sie Informationen zu Adressen, Management, Produkte, Umsatz, Personal in gedrängter Form anbieten. Für deutsche Unternehmen sind die Informationssammlungen von Hoppenstedt
und Creditreform,
für in- und aus-
ländische Unternehmen die von Dun & Bradstreet einschlägig. •
Die Datenbank von Hoppenstedt
eignet sich - über ihre Informationsfünktion
hinaus - als Quelle für Database-Marketing, da sie detailliert über Ansprechpartner in Firmen berichtet. •
Über publizitätspflichtige Unternehmen liegen in der Regel mehr Informationen vor als über die restlichen. Informationsproduzenten bemühen sich jedoch, über Befragungen die Angaben zu möglichst vielen Unternehmen zu sammeln.
•
Das deutsche Handelsregister liegt komplett in elektronischer Form vor. Basisdaten sind demnach für jedes deutsche Unternehmen lückenlos vorhanden.
•
Bilanzen sind (für alle Veröffentlichungspflichtigen, aber auch für weitere Unternehmen) in Datenbanken abrufbar. Besonders interessant sind Recherchen mittels der Kennzahlen.
•
Bonitätsinformationen geben eine Einschätzung von Zahlungsgewohnheiten von Unternehmen nebst deren Kreditwürdigkeit wieder. Da die Beobachtungsbasis manchmal recht schmal ist, sind solche Angaben durchaus skeptisch zu hinterfragen. Bonitätsinformationen ersetzen auf keinem Fall die selbst durchgeführte Bilanzanalyse. Marktführer von Bonitätsinformationen ist Dun & Bradstreet.
•
Produktdatenbanken wie Wer liefert was? bieten nicht nur (z.T. allerdings etwas grobe) Suchen zu Produkten und deren Anbietern, sondern liefern auch in ihrem WWW-Varianten Schnittstellen zum elektronischen Handel.
•
Konzemstruktur- und M&A-Datenbanken berichten über Besitzverhältnisse und aktuelle Beteiligungs- bzw. Übernahmeaktivitäten.
12 Ausschreibungen und Geschäftsanbahnungen 12.1 Ausschreibungen Aufträge öffentlicher Einrichtungen werden ab einer gewissen Größenordnung stets ausgeschrieben (vgl. Rahlenbeck 1995b). Zunehmend nutzen auch private Unternehmen diesen Weg, Aufträge zu erteilen. Da viele Ausschreibungen ausschließlich in elektronischer Form verbreitet werden, ist die Recherche in Online-Ausschreibungsdatenbanken der geeignete Weg, sich umfassend über Ausschreibungen zu informieren. Spätestens hier wird klar, daß das Management externer Informationen für jedes
Unternehmen relevant ist. Selbst ein kleiner Handwerksbetrieb im
Baugewerbe muß zwangsläufig zumindest die Ausschreibungsdatenbanken nutzen, will er vorteilhafte Angebote unterbreiten. Wir betrachten zwei Online-Datenbanken mit Ausschreibungen, zum einen die (kostenlos) im World Wide Web angebotene Sammlung „Tenders Electronic Daily", die ausschließlich öffentliche Ausschreibungen enthält, zum andern die beim kommerziellen Online-Archiv Genios aufliegende Datenbank von Subreport, die sowohl öffentliche als auch privatwirtschaftliche Ausschreibungen umfaßt. Beide Datenbanken werden täglich aktualisiert.
Öffentliche Ausschreibungen: Tenders Electronic Daily Alle Ausschreibungen von Einrichtungen der Europäischen Union erscheinen im Supplement zum „Amtsblatt der Europäischen Gemeinschaften" (Reihe S). Seit Mitte 1998 wird die Reihe S ausschließlich in elektronischer Form (CD-ROM oder World Wide Web) vertrieben (vgl. EUR-OP 1999). Die Datenbank „Tenders Electronic Daily" (TED) enthält außer den EU-Ausschreibungen weitere Bau-, Dienstleistungsund Lieferaufträge nationaler und internationaler Organisationen. Täglich werden in TED rund 650 öffentliche Ausschreibungen publiziert. Produzent der Datenbank ist EUR-OP, das offizielle Verlagshaus der Organe und Institutionen der Europäischen Gemeinschaften mit Sitz in Luxemburg. EUR-OP veröffentlicht in der Regel mehrsprachig, im Idealfall - was bei TED der Fall ist - in den elf Sprachen der EU-Länder. Suchbar sind Informationen mittels folgender Felder: •
Amtsblatt S Nr.
12 Ausschreibungen •
Land
•
Vertrag
•
Dokument
•
CPV-Code
•
Veröffentlichungsdatum
•
Datum des Dokuments
•
Typ des Auftraggebers
•
Heading
•
Ort
•
Verfahren
•
Verordnung
•
NUTS-Code
•
Dokument-Nummer
•
Termin
•
Name des Auftraggebers
•
Volltext.
277
Wichtig für die thematische wie regionale Suche ist die Kenntnis der verwendeten Dokumentationsmethoden. Sowohl NUTS als auch CPV sind monohierarchische Klassifikationssysteme. CPV (Common Procurement Vocabulary) ist das Codesystem fiir die inhaltliche Aufgliederung der Ausschreibungen. Es handelt sich um einen achtstelligen Zifferncode. Ein Ausschnitt (Abbildung 12.1) verdeutlicht die Gliederungstiefe. Die regionalen Aspekte werden durch die Nomenclature des unités territoriales statistiques (NUTS) ausgedrückt. Das Land wird durch einen zweistelligen Buchstabencode abgebildet, darunterliegende Einheiten durch Zifferncodes. Die Begriffsleiter von „Österreich" bis „Graz" zeigt Abbildung 12.2. Sowohl der Code des Vokabulars fiir die öffentlichen Ausschreibungen (CPV) als auch der Code der Nomenklatur der statistischen Territorialeinheiten liegen in der
12 Ausschreibungen
278
Online-Version von TED vor. Navigieren durch die jeweiligen Hierarchien ist möglich, ebenso das Anklicken von Notationen, die als Suchargumente ausgewählt worden sind.
Abb. 12.1: CPV - Beispielnotationen 850 000 00 853 000 00
Dienstleistungen des Gesundheits- und Sozialwesens Dienstleistungen des Sozialwesens und zugehörige Dienstleistungen Dienstleistungen des Sozialwesens
853 100 00 853 110 00
Dienstleistungen des Sozialwesens in Verbindung mit Heimen Altenfursorgeheime
853 111 00 Quelle: EUR-OP
Je nach Branche und nach Region (oder weiterer Kriterien) müssen im Unternehmen so viele Suchprofile angelegt werden, wie dieses unterschiedliche unternehmerische Aktivitäten unterhält. Nehmen wir an, eine Firma ist spezialisiert auf Dienstleistungen für Altenheime; die angepeilte Zielregion sei die Steiermark. Das Suchprofil lautet:
CPV=85311100 UND NUTS-AT22.
Abb. 12.2: NUTS - Beispielnotationen AT AT2 AT22 AT221 Quelle: EUR-OP
Österreich Südösterreich Steiermark Graz
279
12 Ausschreibungen
Werden die Suchprofile täglich abgerufen, hat unser Unternehmen stets den Überblick über alle öffentlichen Aufträge seiner Branche in der Zielregion. Abbildung 12.3 zeigt einen stark gekürzten Datensatz aus TED. Der Volltext der Ausschreibung ist hier fortgelassen; in der Datenbank ist er natürlich komplett enthalten. Ist ein Auftrag bereits vergeben worden, ist der Datensatz um ein Feld größer. Unter CO wird dann der Auftragnehmer notiert.
Abb. 12.3: Tenders Electronic Daily - Datensatzbeispiel Katalogdaten für Dokument 59971-1999 TI
Titel
D-Friedberg: Stromversorgungsanlagen (99/S 87-59971/DE)
ND
Dok.Nr.
59971-1999
PD
Veröf. Datum
19990505
OJ
Abi. S Nr.
87/1999
PG
Seitenzahl
121
RN
Refiir Dokum
48124-1998
CY
Land
DE
TW
Ort
Friedberg
AU
Name Aufgeber Staatsbauamt Friedberg/Hessen
AA
Typ Aufgeber
DS
Dok abgeschickt 19990426
DR
Dok empfangen
19990426
DT
Termin
19990608
OL
Originalsprache
DE
HD
Heading
1110
NC
Vertrag
1 - Bauauftrag
PR
Verfahren
1 - Offenes Verfahren
TD
Dokument
3 - Ausschreibung
3 - Körperschaften
280
12 Ausschreibungen
RP
Verordnung
4 - Europäische Gemeinschaften
TY
Ausschreibart
1 - Gesamtangebot
AC
Vergabekriterien 2 - Wirtschaftlichstes Angebot 31682510 - Notstromsysteme 45214400 - Bauarbeiten fiir Universitätsgebäude
PC
CPV-Code
45315300-Stromversorgungsanlagen 45512100 - Sanierungsarbeiten 45530000 - Umbau von Gebäuden
RC
NUTS-Code
DE712 Frankfurt am Main, KRFR ST
D-Friedberg: Stromversorgungsanlagen (99/S 87-59971/DE) 1. Auftraggeber: Staatsbauamt Friedberg/Hessen, Schützenrain 5-7, D-61160 Friedberg. Tel. (06031)167-0. Telefax (06031)167-26. [usw. es folgt der gesamte Text der Ausschreibung] Quelle: Recherche in TED am 5.5.1999. URL:http://ted.eur-op.eu.int/
Ausschreibungen in Deutschland: Subreport Das Kölner Unternehmen Verlag Schawe unterhält mit seinem Produkt „subreport" die größte deutsche Datenbank mit Ausschreibungstexten (vgl. Lipka 1999). Die Datenbank weist arbeitstäglich ca. 500 Ausschreibungen nach; pro Jahr kommen so rund 120.000 Ausschreibungen zusammen. Die Ausschreibungen stammen von potentiellen
Auftraggebern
der
öffentlichen
Hand
(die
zur
öffentlichen
Ausschreibung verpflichtet sind), von Architekten, Ingenieuren und Unternehmen. In Deutschland werden pro Jahr Aufträge im Volumen von über 50 Milliarden DM über solche Ausschreibungen vergeben. Quelle der Datenbank sind die Meldungen der ausschreibenden Einrichtungen selber, hinzu kommen Informationen aus Zeitungen oder Amtsblättern (wie z.B. dem „Bundesanzeiger").
12 Ausschreibungen
281
Klassifiziert werden die Ausschreibungen nach einer groben Systematik, die z.B. folgende Einträge hat:
Brückenbau Deutsche Bahn AG Kultureller Bau Schule Universität Telekom Wohnungsbau.
Der Online-Zugang geschieht über den Host GENIOS. Die Datensätze sind sehr detailliert und umfassen diverse Informationen: •
Auftraggeber
•
Planer
•
Leitung
•
Vergabeverfahren
•
Art des Auftrags
•
Ausfiihrungsort
•
Umfang
•
Art der Vergabe
•
Planungsleistung
•
Ausführungsfrist
•
Anforderungsdatum
•
Anforderung
•
Bewerbung Gebühr
282
12 Ausschreibungen
•
Angebotsabgabe
•
Angebotssprache
•
Bieter
•
Eröffnungsdatum
•
Eröffnung
•
Sicherheit
•
Zahlungsbedingungen
•
Rechtsform
•
Nachweise
•
Zuschlags- und Bindefrist
•
Kriterien fiir die Auftragserteilung
•
Nebenangebote.
Alois Lipka stellt fest, „für Lieferanten des Bauhaupt- und -nebengewerbes, die Erfahrungen mit Ausschreibungen haben, ist das Internet ein neuer und rationellerer Weg zu interessanten Aufträgen. Für Firmen ohne Erfahrung erschließt sich hier ein völlig neues Marktsegment mit ganz konkreten regionalen oder überregionalen Absatzpotentialen" (Lipka 1999, 198).
12.2 Geschäftsanbahnungen Wichtig für neue geschäftliche Partnerschaften ist das Wissen darüber, wer als Partner überhaupt infragekommt. Wenn ein Unternehmen X beispielsweise ein Patent hält, dessen Ergebnisse aber selbst nicht anwenden will (oder kann), ist es sinnvoll, es über eine Lizenz weiterzugeben. Vielleicht arbeitet ein Unternehmen Y konzeptionell an einem Produkt, das die Kenntnisse unserer Firma X voraussetzt. Y wäre wohl durchaus daran interessiert, die entsprechende Lizenz von X zu erwerben. Ebenso ist es denkbar, daß ein Unternehmen in einem Geschäftsbereich freie Kapazitäten hat. Für potentielle Auftraggeber ist dies eine wichtige Information. Solche nach dem Prinzip „Angebot - Gesuch" arbeitende Informationsressourcen sind die sog. „Kooperationsbörsen".
12 Ausschreibungen
283
Unternehmen, insbesondere kleine, ggf. auch mittlere, stehen irgendwann vor dem Problem, daß der Inhaber aus dem Geschäft ausscheidet und ein Nachfolger nicht in Sicht ist. Auch hier gibt es mit den Unternehmensnachfolgebörsen ein elektronisches Hilfsmittel.
Kooperationsbörsen Die Heidelberger Online GmbH bzw. deren Tochterfirma Business Datenbanken GmbH fuhrt mit dem „International Business Opportunities Service" seit 1983 eine Datenbank für Geschäftsanbahnungen und Partnersuche. Die Inserate sind entweder über kommerzielle Online-Archive (derzeit ca. 40.000 Datensätze) oder - kostenlos über das World Wide Web (ca. 5.000 aktuelle Anfragen) recherchierbar. In der hier beschriebenen WWW-Version gilt es, sich durch (einfache) Klassifikationssysteme durchzuarbeiten, um eine optimale Recherche zu formulieren. Ein erstes Klassifikationssystem betrifft die Art der Kooperation. Ein Ausschnitt aus dem Notationssystem verdeutlicht das Indexierungsprinzip (Abbildung 12.4).
Abb. 12.4: Klassifikation der Kooperationsarten T1
Opportunity Offer
T2
Opportunity Demand
TU
Technology Offer
T21
Technology Demand
Till
Know How Offer
T211
Know How Demand
T112
Patent & Licence Offer
T212
Patent & Licence Demand
T186
Venture Capital Offer
T287
Venture Capital Demand
Quelle: International Business Opportunities Service (Ausschnitt). URL: http://www.busi.de
Das zweite eingesetzte Klassifikationssystem ist eine (stark vereinfachte) Variante der Standard Industrial Classification (SIC), das dritte ein Ländercode und das vierte ein Codesystem für Firmenarten (siehe Abbildung 12.5).
12 Ausschreibungen
284 Abb. 12.5: Klassifikation der Firmenarten B52
Import-Export Company
B521
Importer
B522
Exporter
B53
Wholesaler
B54
Retailer
B55
Representative & Agent
B56
Distributor
B6
Business Service
B61
Consultants
B611
Management Consultants
B612
Technology Consultants
B613
Engineering Consultants
B614
Marketing Consultants
B62
Financial Service
Quelle: International Business Opportunities Service (Ausschnitt). URL: http://www.busi.de
Zusätzlich oder alternativ zur Suche mittels Notationen der Klassifikationssysteme ist eine freie Suche nach allen Termen der Datensätze durchführbar. Als Zwischenresultat bekommt der Nutzer eine Liste mit Titel von Angeboten bzw. Gesuchen. Nach Anklicken eines Titels wird die gesamte Anzeige aufgeblättert (siehe als Beispiel Abbildung 12.6.
Abb. 12.6: International Business Opportunities Service. Beispieldatensatz Dokument: 109/213 Datum: 23.10.98
Angebot
12 Ausschreibungen
285
Quelle: WFS Wirtschaftsförderung Sachsen GmbH. Kooperationsbörse Referenz Nummer: FA2105 Deutschland: Fertigungsangebot im Bereich Leuchtenzubehör Hersteller mit langjährigen Erfahrungen in der Fertigung von
elektrischen
Baugruppen und Schaltern sowie elektromechanischen Regelgeräten, Schalterleuchtenkombinationen und Drucktasten bietet freie Produktionskapazitäten in den Bereichen Montage und Stanzerei als auch in der Kunststoffverarbeitung. Leuchtenzubehör Marienberg GmbH Bertram Weigel Dr.-Wilhelm-Külz-Allee 5-6 D-09496 Marienberg Germany Telefon:
+49-3735-9140-0
Fax:
+49-3735-9140-0
Codes:
T120 Manufacturing Offer
Dokumenten-Nummer:
82960007
Quelle: International Business Opportunities Service. URL: http://www.busi.de
Unternehmensnachfolgebörsen Eine Spezialform von Kooperationsbörsen sind Angebote von Unternehmensnachfolgen. Mit solchen Datenbanken wird u.a. der Generationswechsel vor allem in kleinen und mittleren Firmen, man denke z.B. an Handwerksbetriebe, unterstützt. Auch bieten Datenbanken dieser Art Entscheidungsmaterial fiir Existenzgründer, kann man doch durchaus nicht nur an die Neugründung einer beruflichen Existenz denken, sondern auch an die Übernahme eines eingeführten Unternehmens. In Deutschland wird als Initiative der Deutschen Ausgleichsbank, des Zentralverbandes des Deutschen Handwerks und des Deutschen Industrie- und Handelstages die Datenbank „Change/Change" geführt. Aufgebaut und betreut wird diese Datenbank im World Wide Web von der Business Datenbanken GmbH. Als Inserate werden sowohl Angebote zur Unternehmensübemahme als auch entsprechende Gesuche
286
12 Ausschreibungen
aufgenommen. Suchkriterien sind Standorte (Deutschland gesamt oder regionale Eingrenzungen) sowie Branchen.
Am Rande sei erwähnt, daß sich die Eintragungen in den Kooperations- und Nachfolgebörsen auch für die Zusammenstellung von Unternehmensdossiers (etwa Wettbewerberanalysen) eignen. Es ist sicherlich nicht uninteressant zu erfahren, daß eine Firma beispielsweise freie Kapazitäten anbietet oder Partner zur Vermarktung eines neuen Produktes sucht. Alle diese Informationen sind Indizien für unternehmerische Aktivitäten, Probleme oder Pläne des Unternehmens.
12.3 Förderprogramme Der politische Wunsch, gewisse Entwicklungen voranzutreiben, fuhrt dazu, für entsprechende Forschungs- und Entwicklungsleistungen finanzielle Anreize zu bieten. Festgeschrieben sind solche Angebote in den Förderprogrammen politischer Einheiten. Im Bereich der Informationswirtschaft gibt es beispielsweise auf der Ebene der Europäischen Union ein Programm namens „INFO 2000", in Deutschland das Programm „Information als Rohstoff für Innovation". Unter gewissen Bedingungen ist es jedem Unternehmen oder Konsortium von Unternehmen möglich, sich an der Durchführung der Programme zu beteiligen und damit auch, von den finanziellen Mitteln zu profitieren. Bei der Vielzahl von Förderprogrammen ist es notwendig, elektronische Datenbanken zu bemühen, will man die jeweils für das eigene Unternehmen interessanten Projektinformationen nicht übersehen. Die finanzierenden Institutionen sind selber bemüht, ihre Projektinformationen weit zu streuen, um genügend (und genügend gute) Bewerber für ihre Programmdurchführungen zu bekommen. Die Europäische Union unterhält mit der CORDIS-Datenbankgruppe (Community Research and Development Information Service) eine Informationssammlung nicht nur zu Projekten und Programmen, sondern auch zur Anbahnung von Projektpartnerschaften, zu EU-Kontakten oder zu den Ergebnissen bereits abgeschlossener Projekte (vgl. Rahlenbeck 1995c). Wir bringen als Beispiel eine deutsche Datenbank mit Förderprojekten. Es handelt sich um die „Förderdatenbank" des Bundesministeriums für Wirtschaft und Technologie. Diese im World Wide Web frei zugängliche Informationssammlung gibt einen vollständigen und aktuellen Überblick über die Förderprogramme des
12 Ausschreibungen
287
Bundes, der Länder und der Europäischen Union nach einheitlichen Kriterien und in konsistenter Darstellung. Die Richtlinientexte sind stets im Volltext angegeben. Die WWW-Datenbank gestattet folgende Suchoptionen: •
Förderkriterien • •
Gebiet (etwa: Bund, Bund und EU, Bundesland) Antragsberechtigte (u.a. Unternehmen, Bildungseinrichtungen, Existenzgründer, Forschungseinrichtungen, Privatpersonen, Nicht-RegierungsOrganisationen)
•
Förderbereiche (z.B. Aus- und
Weiterbildung,
Existenzgründung,
Garantie / Bürgschaft, Konsolidierung, Regionalförderung, Tourismusförderung, Handwerksförderung, Venture Capital) •
Programmtitel (alle Wörter der offiziellen Programmtitel)
•
Volltextsuche (alle Wörter der Datensätze; egal, wo sie auftauchen).
Die Datensätze sind jeweils gleich aufgebaut. Den Programminformationen (mit den Förderkriterien und Ansprechpartnern) folgen eine Kurzübersicht, der komplette Text der Richtlinie sowie eine Checkliste mit Voraussetzungen, die für eine ggf. erfolgreiche Antragstellung erfüllt sein müssen. Unser Beispieldokument in Abbildung 12.7 ist Resultat einer Suche nach
Programmtitel: Informationsgesellschaft UND Gebiet: Berlin.
Der Originalnachweis erstreckt sich über mehrere Seiten; Abbildung 12.7 ist stark gekürzt und gibt nur die Struktur des Datensatzes wieder. Bei den Ansprechpartnem sind aktive Links hinterlegt.
Abb. 12.7: BMWi-Förderdatenbank. Datensatzbeispiel [BE] Aufbau der Informationsgesellschaft Förderart: Zuschuß Förderbereich: FuE Medien
12 Ausschreibungen
288 Gebiet: BE Berlin NBL Neue Bundesländer
Berechtigte: Unternehmen Forscheinr Freiberufler öffentl. Einrichtungen Ansprechpartner:
Senats Verwaltung für Wirtschaft und Betriebe Investitionsbank Berlin (IBB)
Kurzübersicht Ziel und Gegenstand Um den Weg in die Informationsgesellschaft zu unterstützen, gewährt das Land Berlin Zuschüsse zu Verbundprojekten oder einzelbetrieblichen Vorhaben, die die Entwicklung und prototypischen Anwendung innovativer Produkte, Verfahren und Dienstleistungen auf dem Gebiet der Informationstechnologie zum Ziel haben. Diese Maßnahmen sollen die regionale Wirtschaftskraft stärken und dadurch auch zu einem positiven Beschäftigungseffekt führen. ... [gekürzt; es folgen Angaben zu den Antragsberechtigten, den Voraussetzungen, zu Art und Höhe der Förderung und dem Antragsverfahren] ...
Quelle Amtsblatt für Berlin Nr. 29 vom 29. Mai 1998
...[gekürzt]...
Richtlinie Richtlinie des Landes Berlin über die Gewährung von Zuwendungen zur Förderung innovativer, wirtschaftsnaher Forschungs-, Entwicklungs- und Demonstrationsvorhaben zum Aufbau der Informationsgesellschaft ... [gekürzt; es folgt der Volltext der Richtlinie]...
Checkliste ... [gekürzt; es folgen Kriterien für die Antragstellung]... Quelle: Förderdatenbank des Bundesministeriums für Wirtschaft und Technologie. URL: http://www.bmwi.de/foerderdb/index/html (Recherche am 19.8.99)
12 Ausschreibungen
289
Fazit •
Eine wichtige Aufgabe der betrieblichen Informationswirtschaft im operativen Geschäft ist die gezielte Recherche nach unternehmensrelevanten Ausschreibungen, Kooperationsangeboten und Programmen der Wirtschaftsförderung.
•
Öffentliche Ausschreibungen für alle Mitgliedstaaten der Europäischen Union finden sich tagesaktuell in der Datenbank TED. Weitere Ausschreibungen in Deutschland (einschließlich privater Unternehmen) sind in der Informationsquelle „Subreport" zu finden.
•
Kooperationsbörsen und Unternehmensnachfolgebörsen bieten Inserate zu Angeboten und Gesuchen im Wirtschaftsleben. Hervorzuheben sind in diesem Segment die Aktivitäten der Heidelberger Online GmbH.
•
Als durchaus „zweckentfremdete" Anwendung kommen Informationen aus den Ausschreibungs- wie aus den Kooperationsdatenbanken für die Zusammenstellung von Unternehmensdossiers infrage.
•
Einen Überblick über Förderprogramme politischer Einheiten und daraus abgeleiteter Forschungs- und Entwicklungsprojekte bieten Datenbanken über Förderinformationen. Unternehmen, die Forschung und Entwicklung betreiben und die an öffentlichen Geldern interessiert sind, bekommen hier Basisinformationen über Fördermöglichkeiten.
13 „Selbstdarstellungen" von Unternehmen: Geschäftsberichte und Homepages Unternehmen erstellen diverse Schriften, angefangen von Informationsmaterial über Firmenzeitschriften bis hin zu Geschäftsberichten. Alle diese Informationen sind mehr oder minder subjektiv gefärbt. Stellt man ein umfassendes Unternehmensdossier zusammen, so dürfen diese „Selbstdarstellungen" jedoch nicht fehlen, da auch hier wertvolle Informationen enthalten sein können, die wir an sonst keiner anderen Stelle finden.
13.1 Geschäftsberichte Der Geschäftsbericht ist ein Publizitätsinstrument fiir Unternehmen (vgl. Rüting/ Hütten 1996). Veröffentlichungspflichtige Firmen müssen ihn erstellen, viele weitere Unternehmen produzieren ihn aus Prestige- aber auch Informationsgründen. Unsere Frage hierbei ist: Wie komme ich an Geschäftsberichte heran? Der einfachste Weg ist, das Unternehmen direkt zu kontaktieren. Über dessen Stelle fiir Öffentlichkeitsarbeit dürfte der jeweils letzte Bericht in Printform, über dessen Homepage - soweit vorhanden - könnte der Bericht in elektronischer Form beschafft werden. Ein umfassendes Bild ergibt sich erst, wenn Geschäftsberichte Uber mehrere Jahre vorliegen. Innerhalb der Bilanzanalysen können wir jetzt Zeitreihen erstellen, z.B. zur Umsatz- oder Rentabilitätsentwicklung oder zu den betrieblichen Kennzahlen. Aus den Lageberichten ist u.U. abzuleiten, welche Entwicklungen in den vorangegangenen Jahren erfolgreich und welche weniger erfolgreich verlaufen sind. Als „Depot" für Geschäftsberichte kommen u.a. Wirtschaftsarchive infrage. Mit dem HWWA-Hamburgisches
Welt-Wirtschafts-Archiv haben wir bereits eines kennenge-
lernt (s.o. Kap. 10.4; S. 238 ff.), allerdings werden dort nur Berichte zu rund 3.000 Firmen gesammelt.
Die Sammlungen von Disclosure Einen Zugriff auf Geschäftsberichte mehrerer zehntausend börsennotierter Unternehmen bietet Disclosure an. Disclosure Ltd. mit der deutschen Tochter Disclosure GmbH (in Frankfürt) ist spezialisiert auf Unternehmensinformationen in Form von
13 Homepages und Geschäftsberichte
291
Geschäftsberichten, und zwar sowohl der jeweils aktuellen als auch der zurückliegenden Jahrgänge. Vorgehalten werden Berichte von rund •
2.000 deutschen Unternehmen
•
3.000 britischen Unternehmen
•
12.000 us-amerikanischen Unternehmen
•
15.000 weiteren Unternehmen weltweit.
Schwerpunkte von Disclosure sind Informationen zu britischen und amerikanischen Unternehmen. Disclosure verfiigt über sämtliche Unterlagen aller bei der Londoner Wertpapierbörse eingereichten Unterlagen von Kapitalgesellschaften ab
1982.
Ebenfalls vollständig sind die Unterlagen der amerikanischen Börsenaufsichtsbehörde (SEC) ab 1977 vorhanden. Darunter befinden sich die 10-K Geschäftsberichte an SEC, die 10-Q Vierteljahresberichte und die Unterlagen nicht-amerikanischer Unternehmen 20-F einschließlich der Unterlagen über außerplanmäßige Ereignisse 8-K. Arbeitet man beim Bezug von Originalgeschäftsberichten mit einem Unternehmen der Informationswirtschaft, so hat man - neben der Schnelligkeit der Lieferung und dem Vorhalten zurückliegender Berichte - stets Vertraulichkeit garantiert. Schließlich sind Situationen denkbar, in denen das Zielunternehmen nicht zu wissen braucht, wer an ihm interessiert ist.
13.2 Homepages im World Wide Web Mehr und mehr Unternehmen gehen dazu über, grundlegende Informationen über ihre Firma als eigene Site im World Wide Web anzugeben. Je nach Aufwand, mit dem diese Aktion betrieben wird, schwanken die Angaben zwischen wenigen Basisinformationen und einem ausführlichen Firmenportrait einschließlich Geschäftsbericht und Produktkatalogen. Bei Brancheninformationen sollten die Homepages von Verbänden nicht übergangen werden, enthalten deren Berichte doch zumeist interessante Detailangaben zu Stand und Entwicklung des betreffenden Wirtschaftszweiges. Wie findet man die Homepages von Unternehmen und Verbänden? Der einfachste Weg ist, es schlicht über die URL zu probieren: an die Protokollbezeichnung
292
13 Homepages und Geschäftsberichte
„http://www." den Unternehmensnamen und das Länderkürzel anhängen, etwa „rheinbraun.de". In einigen Fällen dürfte man damit durchaus Erfolg haben.
RealNames Der „normale" Weg fuhrt über die Retrievalsysteme im Web (s.o. Kap. 7.1, S. 175 ff.). Bei Suchmaschinen wird der Unternehmensname eingegeben. Mit etwas Glück liegt die Homepage des gesuchten Unternehmens oben in der Liste. RealNames Corp. in San Carlos (Kalifornien) bietet zusätzlich zu dieser Strategie seinen gleichnamigen Dienst an. Wenn das RealNames Internet Keywords
System
erkennt, daß genau zur Suchfrage passend eine Homepage besteht, so wird dieser RealNames-Link angegeben. Allerdings ist der Dienst nicht problemfrei, da die Links von RealNames nicht nach objektiven Kriterien vergeben, sondern verkauft werden. Auch die nicht zur Homepage führenden weiteren Links (etwa von AltaVista) können für den Suchenden durchaus von Interesse sein, kommen doch andere Quellen zu Wort, die etwas zum Suchargument aussagen.
Homepage - Information und Kontaktanbahnung Eine Homepage dient zwei Zielen. Zum einen möchte das Unternehmen über sich informieren. Die Homepage ist hier „Hochglanzprospekt", Lagebericht sowie Bilanz und damit ein Instrument kommunikationspolitischer Maßnahmen. Dieses „Online Multimedia-Marketing" beinhaltet sowohl traditionelle Verfahren der Kommunikationspolitik (z.B. den Einbezug von Pressemeldungen in die Internet-Site als Hilfsmittel der Öffentlichkeitsarbeit) als auch neue Elemente, die von der Art des Mediums begünstigt werden (etwa interaktive Zugriffsmöglichkeiten oder „Infotainment"). Zum andern ist die Homepage dazu geeignet, Kontakte anzubahnen entweder direkt via E-Mail (und mit Call- bzw. E-Mail-Center im Unternehmen) oder konventionell. Homepages in diesem Sinne wollen •
(potentielle oder bestehende) Aktionäre
•
interessierte Arbeitsuchende
•
mögliche Kunden
ansprechen und zu Aktionen fuhren, die Geldanleger zu Investitionen in die Firma, Jobsuchende zu Bewerbungen und natürlich die Kunden zu Käufen. Insbesondere der
13 Homepages und Geschäftsberichte
293
letztgenannte Aspekte, der E-Commerce, eignet sich jedoch nur für bestimmte Unternehmen oder Branchen (u.a. Buchhandel). Bei der Beschaffung von Unternehmensinformationen ist zu beachten, daß die Homepages kostenfrei angeboten werden. Das Herunterladen eines Geschäftsberichts aus dem World Wide Web wird damit kostengünstiger als der Bezug über die kommerziellen Anbieter der Informationswirtschaft. Man sollte an den Informationsgehalt der in diesem Kapitel skizzierten Quellen keine zu hohen Ansprüche stellen. Insbesondere darf der Nutzer auf keinem Fall erwarten, vollständige Informationen zu erhalten. Eine vergleichende Untersuchung zwischen Geschäftsberichten und Artikeln in einer Wirtschaftszeitung ergab, daß letztere weitaus mehr und z.T. detailliertere Informationen enthielt als der Geschäftsbericht (vgl. Stock 1995, 84).
Fazit •
Geschäftsberichte börsennotierter Unternehmen können durch
spezialisierte
Anbieter bezogen werden. Neben den Wirtschaftsarchiven ist in diesem Marktsegment besonders die Firma Disclosure aktiv. •
Homepages von Unternehmen sind entweder direkt über den Unternehmensnamen im URL oder mittels der Retrievalsysteme im World Wide Web auffindbar. Wichtig ist in diesem Kontext das System RealNames,
das über
bestimmte Suchworte (etwa Unternehmens- oder Produktname) direkt zur Homepage führt. Bedenkenswert ist jedoch, daß die Links keine objektive Inhaltserschließung repräsentieren, sondern verkauft werden. •
Homepages haben eine - stets subjektiv gefärbte - Informationsfunktion und dienen darüber hinaus der Kontaktanbahnung (etwa Personalmarketing oder ECommerce). Teilweise enthalten die Homepages Geschäftsberichte des Unternehmens sowie dessen Pressenotizen.
14 Gesetze und Urteile Gesetze, Erlasse, Verwaltungsvorschriften usw. haben für unternehmerische Aktivitäten hohe Relevanz, können sie diese doch fördern oder behindern. Die Kenntnis der jeweils aktuellen Fassungen der einschlägigen Gesetze muß demnach für ein Unternehmen sichergestellt sein. Aber nicht nur in Gesetzen und anderen Nonnen sind juristische Informationen enthalten, ebenso in Urteilstexten sowie in den Kommentaren der Fachliteratur. Die Informationswirtschaft hält - mehr oder minder vollständig - Sammlungen von gesetztem Recht, Urteilen und Literaturstellen online und auf CD-ROM bereit. Neben der Anwendung der juristischen Informationen bei eigenen Rechtsproblemen bilden gewisse Datenbanken auch eine Quelle für Unternehmensinformationen, beispielsweise über Wettbewerber, Zulieferer oder Kunden, insofern die Datenbanken Angaben über das Vorkommen des Unternehmensnamen im Kontext mit juristischen Texten speichern (etwa: In welche Prozesse war die Rheinbraun in den USA verwickelt?) In diesem Kapitel werden wir den Bereich der Rechtsinformation in Deutschland und in der Europäischen Union genauer ansehen. Zudem stellen wir die Inhalte und Retrievalmöglichkeiten des Weltmarktfiihrers für Rechtsinformationen, Lexis-Nexis, vor. Durch dessen Schwerpunkt auf amerikanisches Recht erfahren wir auch etwas über den Stand der juristischen Information in den Vereinigten Staaten.
14.1 Deutsches Recht Bundesrecht auf CD-ROM Diverse deutsche Gesetze liegen in CD-ROM-Versionen vor. Verlage mit Spezialisierung auf Rechtsliteratur bieten ihre Texte in der Regel parallel in Print (meist als Loseblattsammlungen) und auf CD-ROM an. Als Beispiel dient uns die CD-ROM „Das Deutsche Bundesrecht" des Nomos-Verlages (in Baden-Baden). Die CD-ROM enthält das gesamte geltende Bundesrecht Deutschlands (darunter natürlich auch das Wirtschaftsrecht sowie das Arbeits- und Sozialrecht) in vollem Wortlaut. Die Aktualität der Angaben wird durch vierteljährliche Update-Zyklen sowie durch monatliche Aktualisierungen via Internet gewährleistet. Bei Verweisen in den Texten oder bei zitierten Paragraphen geschieht der Zugriff über einen elektronischen Link.
14 Gesetze und Urteile
295
Juris Juris ist das umfassende juristische Informationssystem für die Bundesrepublik Deutschland mit Sitz in Saarbrücken. Es bearbeitet sowohl Gesetze als auch Grundsatzurteile für die Distribution auf den Kanälen Online und CD-ROM. Den Input in das System erarbeiten Fachdokumentare beim Bundesverfassungsgericht und bei den fünf obersten Gerichtshöfen des Bundes. Die Datensätze bei Juris sind nicht statisch, sondern ändern sich, insofern bereits gespeicherte Entscheidungen mit einem Hinweis versehen werden, wenn neuere Entscheidungen sie zitieren. Auch bei Juris ist das deutsche Bundesrecht elektronisch vertreten, darüber hinaus liegen Verwaltungsvorschriften und Erlasse zum Sozialrecht (ab 1954), zum Steuerrecht (ab 1978) und zum Arbeitsrecht (ab 1986) vor. Das europäische Recht wird durch die Celex-Datenbanken abgedeckt, die wir im nächsten Abschnitt skizzieren werden. Besonders wichtig ist die Jwra-Rechtssprechungsdatenbank mit allen Entscheidungen folgender Gerichte •
Bundesverfassungsgericht (BVerfG)
•
Bundesgerichtshof (BGH)
•
Bundesverwaltungsgericht (BVerwG)
•
Bundesarbeitsgericht (BAG)
•
Bundessozialgericht (BSG)
•
Bundesfinanzhof (BFH)
•
Instanzgerichte (Entscheidungen ab 1976).
Zusätzlich sind interessante weitere Entscheidungen dokumentiert. Insgesamt verfugt die Datenbank derzeit über einen Bestand von rund einer halben Million Urteilen, davon gut ein Fünftel in einem Langtext (als Beispiel betrachte man Abbildung 14.1). In den Langtexten der Urteile sind Angaben zu Unternehmens- und Personennamen abgekürzt und damit anonymisiert. Dies entwertet die Informationen für die Zwecke des Erstellens eines Dossiers über Personen und Unternehmen. (Bei Urteilen der EUGerichtsbarkeit und bei amerikanischen Urteilen ist dies anders.)
296
14 Gesetze und Urteile
Abb. 14.1: Deutsches Grundsatzurteil. Datensatzbeispiel Nr.: KSRE067100918 Gericht: BSG 3. Senat Datum: 6. Februar 1997 Az: 3 RK 1/96 NK: SGB 5 § 33 Abs 1 S 1, S G B 5 § 12 Abs 1, SGB 5 § 34 Abs 4, KVHilfsmV, S G B 1 § 3 6 Abs 1, S G B 5 § 10 Abs 1, R V O § 205 Abs 1, SGG § 71 Abs 2, SGG § 70 N r I Titelzeile (Krankenversicherung - Hilfsmittel - Personalcomputer - behinderter Schüler - Prozeßführungbefugnis durch Stammversicherten - Kostenbeteiligung wegen ersparter Eigenaufwendungen) Leitsatz 1. Zum Anspruch eines behinderten Schülers, der weder verständlich sprechen noch lesbar schreiben kann, auf Versorgung mit zwei behinderungsgerecht ausgestatteten Personalcomputern ... [gekürzt] ... Orientierungssatz 1. Zur gesetzlichen Ermächtigung des Mitglieds einer Krankenkasse (Stammversicherter), den Leistungsanspruch eines in die Familien Versicherung einbezogenen Kindes (§ 10 S G B 5),... [gekürzt]... Fundstelle SozR 3-2500 § 33 Nr 22 (Leitsatz 1-2 und Gründe) RegNr 23147 (BSG-lntern) RdLH 1997, 180-181 (Gründe) Sgb 1998, 84-88 (Leitsatz 1-2 und Gründe) weitere Fundstellen ZIP 1997,431 (red. Leitsatz) D O K 1997, 732 (Kurzwiedergabe) rv 1 9 9 7 , 2 3 6 (Kurzwiedergabe) Diese Entscheidung wird zitiert von: BSG 1997-02-06 3 RK 9/96 Vergleiche RdLH 1997, 181, Schriftleitung (Anmerkung) Sgb 1998, 88-90, Meydam, Jan (Anmerkung) Rechtsbezug: vorgehend SG Bremen 1995-02-14 S 7 Kr 31/94 vorgehend LSG Bremen 1995-11-16 L 1 Kr 7/95 Tatbestand Streitig ist ein Anspruch auf Gewährung von zwei behinderungsgerecht ausgestatteten Personal-Computern (PC) als Hilfsmittel für einen schwerbehinderten Schüler im Rahmen der gesetzlichen Krankenversicherung (KV). ... [gekürzt]... Entscheidunggründe ...[gekürzt]... Quelle: Juris
Ergänzt werden die Gesetze und Entscheidungen durch Datenbanken mit Nachweisen zu Aufsätzen und Entscheidungsbesprechungen aus rund 500 Fachzeitschriften sowie zu juristisch relevanten Büchern. Die Datensätze sind knappe bibliographische Nachweise mit Abstracts. Juris bietet an, den Volltext der Artikel online (bei der Staatsbibliothek zu Berlin) zu bestellen; elektronisch ist er nicht vorhanden.
14 Gesetze und Urteile
297
In der Online-Variante von Juris sind alle Datenbanken zusammengefaßt. Mit einer Suchfrage werden also sowohl Normen, Entscheidungen und Literatur gefunden. Ein beachtenswertes Angebot ist die sog. „Differenzrecherche". Die Oberfläche des Retrievalsystems von Juris ist für die CD-ROM- und die Online-Version identisch („Juris Formular"). Ein Nutzer kann seine Suche zunächst mittels einer CD-ROM abarbeiten; zum Abgleich zwischen der CD-ROM und der - aktuelleren - OnlineVersion dient die Differenzrecherche. So wird jederzeit Aktualität garantiert. Ein Vergleich zwischen Juris und anderen Informationsmitteln wie der „Karlsruher Juristischen Bibliographie" oder den „Fundheften" (Wagner-Döbler 1988, 1990) zeigt schon in der Aufbauphase von Juris dessen Vorteile. Roland
Wagner-Döbler
verweist auf einen weiteren Vorteil von Juris, da hier auch Zitierungen elektronisch abgefragt werden
können.
„Es
ist mittlerweile
kaum
mehr
umstritten,
daß
Rechtsanwender, also Gerichte, ihre Urteile nicht aus Norm und Sachverhalt allein ableiten können. Norm wie Sachverhalt bedürfen vielfältigster Interpretationen. Modelle für solche Interpretationen bilden Präjudizien, also grob gesprochen Entscheidungen anderer Gerichte in ähnlichen Fragen. Auf diese Präjudizien nun, die bei der Entscheidung einer Rechtsfrage eine Rolle spielen, wird im Urteil verwiesen" (Wagner-Döbler
1992,
252).
Die Jwm-Datenbanken
werden
so
zu
einem
Zitationsindex für (die im System enthaltenen) Urteile.
14.2 Europäisches Recht Celex Celex ist eine Datenbank über Rechtsvorschriften der Europäischen Union sowie Uber die Rechtsprechung des Europäischen Gerichtshofes im Volltext. Celex wird bei mehreren Systemen der kommerziellen Informationswirtschaft (darunter von Juris und Lexis-Nexis) sowie - in einer mehrsprachigen Variante - auf einer eigenen Homepage im World Wide Web vertrieben. Eine zentrale Quelle der EU-Normen sind die Reihen C und L des „Amtsblattes". Unsere Abbildung 14.2 betrifft eine solche Rechtsvorschrift aus dem Amtsblatt. Gesucht wurde der Wortlaut der Genehmigung des Zusammenschlusses
von
Daimler-Benz und Chrysler. Die Abbildung bringt einen recht langen Ausschnitt, um zu verdeutlichen, in welchem Umfang Wirtschaftsinformationen (zu den Unternehmen, zu den Produkten, zur Marktstellung bei den einzelnen Produkten sowie zum Konzentrationsprozeß auf diesem Markt) vorhanden sind.
298
14 Gesetze und Urteile
Abb. 14.2: EU-Rechtsvorschrift. Datensatzbeispiel PUBLICATION DATE: August 11, 1998 Official Journal C 252 , 11/08/1998 p. 0008 1998 O J C 252 DOCUMENT DATE: July 22, 1998 C O M M I S S I O N DECISION of 22/07/98 declaring a concentration to be compatible with the common market (Case No IV/M.1204 - DAIMLER - BENZ/CHRYSLER) according to Council Regulation (EEC) No 4064/89 (Only the English text is authentic) A U T H O R : EUROPEAN COMMISSION T Y P E : DECISION K E Y W O R D S : COMPETITION ; RULES APPLYING T O U N D E R T A K I N G S CONCENTRATIONS MERGER PROCEDURE ARTICLE 6(1) (b) DECISION To the notifying parties Subject: Case N o IV/M. 1204 DAIMLER-BENZ / CHRYSLER. Notification of 22 June 1998 pursuant to Article 4 of Council Regulation No 4064/89 1. On 22 June 1998 the Commission received a notification of a proposed concentration pursuant to Article 4 of Council Regulation (EEC) No. 4064/89 OJ L 395, 30.12.1989 p. 1; corrected version OJ L 257 of 21.9.1990, p. 13, as last amended by Regulation (EC) N o 1310/97, OJ L 180, 9.7.1997, p. 1, corrigendum in OJ L 40, 13.2.1998, p. 17. by which Daimler-Benz AG ("Daimler-Benz") and Chrysler Corporation (" Chrysler") merge within the meaning of Article 3(l)(a) of the Council Regulation. 2. After examination of the notification, the Commission has concluded that the notified operation falls within the scope of Council Regulation (EEC) No 4064/89 and does not raise any serious doubts as to its compatibility with the common market and the functioning of the EEA Agreement. I. T H E PARTIES A N D THE OPERATION 3. Daimler-Benz AG, a German corporate company, and its consolidated subsidiaries are active in the development, manufacture and distribution of automotive vehicles, automotive electronics, rail systems, diesel engines, aerospace and defense systems, and the provision of financial services, insurance brokerage, information technology services, telecommunication services, trading and real estate management services. 4. Chrysler Corporation is a US-based car manufacturer which markets vehicles in Europe under the brand names of Chrysler and Jeep. 5. Under the terms of a business combination agreement of 7 May 1998, DaimlerBenz and Chrysler will combine their respective businesses, stockholder groups, managements and other constituencies in a newly incorporated company under German law (" DaimlerChrysler Aktiengesellschaft"). The shares in the new corporation will be offered to Daimler-Benz' and Chrysler's present shareholders. The transaction constitutes a concentration within the meaning of Article 3(1) (a) of the Council Regulation.
14 Gesetze und Urteile
299
III. C O M M U N I T Y D I M E N S I O N 6. In 1997, the combined aggregate worldwide turnover of the undertakings concerned exceeded ECU 5 billion (Daimler-Benz: ECU 64.9 billion; Chrysler: ECU 53.9 billion). The aggregate Community wide turnover of each party exceeds E C U 250 million (Daimler-Benz: ECU 37.9 billion; Chrysler: ECU 1.8 billion). T h e y do n o t achieve more than two-thirds of their turnover in one and the same M e m b e r State. The operation has therefore a Community dimension. IV. T H E R E L E V A N T M A R K E T S A. Relevant product market 7. T h e concentration affects the passenger car sector. ... [gekiirzt] ... V. C O M P E T I T I V E A S S E S S M E N T 14. In 1997 approximately 13.1 million passenger cars were sold in the EEA. Daimler-Benz and Chrysler sold 446 0 0 0 and 88 000 passenger cars respectively and thus held respective market shares o f 3,4 % and 0,7 % . Their combined share in the supply of all passenger cars in the EEA amounted to 4,1 % in terms o f registered cars in 1997. The new entity will rank eighth amongst ist competitors, behind the Volkswagen group (16,5 %), Ford/Mazda (12,4 %), General Motors (12,1 %), the PSA group (11,7 %), Renault (10,3 %), Fiat (9,7 % ) and B M W / R o v e r (5,7 %). If national passenger car markets are considered, Daimler-Benz' and Chrysler's combined shares do not exceed 8,5 % in any EEA country. Therefore, as far as t h e overall passenger car market at EEA or national level is concerned, the concentration will not create or reinforce a dominant position. ... [gekiirzt] ... I N - F O R C E : 1998/07/22=PE V A L I D - T O : 9999/99/99 LEGAL-BASIS: 389R4064-A06Plb OTHER-INFO: NACE=3410 REGISTER: 08400000 DOC-NUMBER: 398M1204 L O A D - D A T E : September 3, 1998 Quelle: Lexis-Nexis; File CELEX
14.3 Rechtsinformationen bei Lexis-Nexis Im Gegensatz zur deutschen Rechtsinformation, die nur Grundsatzurteile und diese z.T. ohne Volltext speichert, ist die us-amerikanische Rechtsdokumentation auf Vollständigkeit ausgelegt. Erklärbar ist dies durch die besondere Relevanz des Falles im Rechtssystem der Vereinigten Staaten, handelt es sich hier - im Gegensatz zum deutschen Recht - doch stark um ein Fallrecht und weniger um gesetztes Recht. In d e r amerikanischen Informationswirtschaft dominieren bei den juristischen Informationen zwei Anbieter, Westlaw und Lexis-Nexis. Elemente des Lexw-Teils von Lexis-Nexis vor.
Wir stellen hier einige zentrale
300
14 Gesetze und Urteile
Inhalte von Nexis Lexis-Nexis (in Dayton, Ohio) ist ein Unternehmen von Reed Elsevier. Der OnlineService besteht aus zwei Teilen, Nexis enthält News, Unternehmensinformationen, Biographien usw., Lexis Rechtstexte, darunter Gesetze, Urteile und Patente. Man kann davon ausgehen, daß Nexis alle juristisch bedeutsamen Texte der USA ab Mitte der 70er Jahre enthält. Das Retrievalsystem von Lexis-Nexis
umfaßt sowohl
einen mengentheoretischen Zugriff als auch einen Zugang über automatische Indexierung (s.u. Kap. 20.2), im ¿ex«-Teil (nahezu ausschließlich) angewandt auf Volltexte. Für die Suche nach Rechtsinformationen hält Lexis-Nexis weitere Funktionen bereit. Wenn von einem Text die Identifikationsnummer (bei Fällen etwa das Aktenzeichen) bekannt ist, wird die Suche durch die Befehle „lexstat" (Zugriff auf Normen) bzw. „lexsee" (Zugriff auf Fälle und weitere Dokumenttypen) eingeleitet. Abbildung 14.3 bringt eine Liste der unterschiedlichen Dokumenttypen bei lexstat und lexsee.
Abb. 14.3: Dokumenttypen bei Lexis (Ausschnitt) Gesetze (via lexstat) Bundesgesetze Staatsgesetze (aller amerikanischer Bundesstaaten) Fälle / Sekundärquellen (via lexsee) cases (federal and State) administrative decisions Congressional record Congressional bilis Federal register law reviews (weit über 500 rechtswissenschaftliche Zeitschriften im Volltext) tax management portfolios revenue procedures reven ue rulings ALR articles Quelle: Lexis-Nexis 1995,25 f.
14 Gesetze und Urteile
301
Beim Zugriff via lexstat ist der Treffer genau ein Paragraph. Da das Verständnis eines isolierten Abschnitts nicht immer gegeben ist, bietet die Retrievalsoftware an, jeweils einen Abschnitt nach vorne oder nach hinten zu blättern. Rechtstexte verweisen in diversen Aspekten auf andere Rechtstexte. Lexis-Nexis trägt diesen Querverweisen Rechnung, indem Links zwischen den Dokumenten gelegt sind. An allen Stellen in der elektronischen Version eines Textes, die mit einem Gleichheitszeichen, etwa
markiert sind, verbirgt sich ein Link zum zitierten Dokument. (Im Druckformat eines Textes, wie in Abbildung 14.4 angegeben, sind die Links nicht vorhanden.) Die Struktur eines Urteilstextes zeigt Abbildung 14.4 am Beispiel eines Treffers einer Suche nach „Rheinbraun". Neben dem Volltext sind alle Angaben zu den Beteiligten des Prozesses (Kläger, Beklagte, Anwälte, Richter) vorhanden. Die Inhaltserschließung („core terms") ist Resultat einer automatischen Schlagwortvergabe. Anmerkungen im Text sind durch „n" markiert; die Fußnote folgt im Fließtext, was die Lektüre teilweise etwas stört.
Abb. 14.4: Volltext eines amerikanischen Urteils bei Lexis-Nexis DOROTHY LOUGHMAN v. CONSOL-PENNSYLVANIA COAL COMPANY, a corp.; RHEIN BRAUN U.S., a corp. MONONGAHELA RAILWAY COMPANY, a corp ... [gekürzt]... Nos. 92-3380, 92-3437, 92-3438, 92-3439, 92-3444, 92-3445, 92-3446, 92-3447, 92-3450, 92-3451 UNITED STATES COURT OF APPEALS FOR THE THIRD CIRCUIT 6 F.3d 88; 1993 U.S. App. LEXIS 23285 May 12, 1993, Argued September 13, 1993, Filed
302
14 Gesetze und Urteile
PRIOR HISTORY: [**1] On Appeal From the United States District Court For the Western District of Pennsylvania. (D.C. Civ. No. 83-00921). (D.C. Civ. No. 93-01675). (D.C. Civ. No. 93-01676). (D.C. Civ. No. 83-01679). (D.C. Civ. No. 83-00921). (D.C. Civ. No. 83-00921). (D.C. Civ. No. 83-01677). (D.C. Civ. No. 83-01678). (D.C. Civ. No. 83-01674). (D.C. Civ. No. 83-01754). CORE TERMS: punitive damages, malpractice, compensatory damages, postjudgment, jointly, interrogatory, original judgment, civil conspiracy, conspiracy, legal malpractice, trebled, reinstated, severally, n.o.v, compensatory, ascertained, punitive, vacated, general verdict, accrue, new trial, several liability, severally liable, sua sponte, conspirator, outrageous, dollar, answers to interrogatories, inconsistency, furtherance COUNSEL: LOUIS M. TARASI, JR., Esquire (Argued), JOSEPH J. HINCHLIFFE, Tarasi & Johnson, P.C., 510 Third Avenue, Pittsburgh, PA 15219, DAVID C. HOOK, Esquire, Hook & Hook, P.O. Box 792, Fort Jackson Building, Waynesburg, PA 15370 ... [gekürzt] ... JUDGES: Before: BECKER, HUTCHINSON, and ROTH, Circuit Judges. OPINIONBY: BECKER OPINION: [*93] OPINION OF THE COURT BECKER, Circuit Judge. This is the second time this case has been before us. See Hughes v. ConsolPennsylvania Coal Co., 945 F.2d 594, 617-18 (3d Cir. 1991), cert, denied, 119 L. Ed. 2d 224, 112 S. Ct. 2300 (1992). Plaintiffs were owners of rural land in southwestern Pennsylvania which they sold for the construction of a railroad to service a major new coal mining operation. Defendants include the coal and [**3] railroad companies that were involved in the venture, the realty company that assisted in the acquisition of the land, individual employees of the realty company, and a lawyer (along with his law firm) who handled the land closings for the purchasers, but who also gave legal advice about one of the land transactions to a plaintiff seller, n l The jury found that the defendants conspired to procure, through fraud, the plaintiffs' land at unfairly low prices, that the lawyers had committed malpractice, and that various defendants also were liable for common law fraud and federal civil RICO violations. The made large compensatory and punitive damage awards. ... [gekürzt; es folgt der komplette Wortlaut des Urteils]... V. Conclusion ... [gekürzt] ... Third, plaintiff Loughman and the Pollock defendants submit that the district court erred in entering Loughman's judgment on the compensatory damages solely against the Pollock [**53] defendants. Because we conclude that the district court failed to harmonize the jury's answers and because we believe that a harmonizing interpretation of the verdict that holds all the defendants jointly and severally liable for Loughman's compensatory damages exists, we will reverse and remand with direction for the district court to enter judgment for Loughman's compensatory damages jointly and severally against all defendants except Reese and Wilson. Quelle: Lexis-Nexis, Mega-Library, Mega-File (stark gekürzt)
14 Gesetze und Urteile
303
Zitationssuche mit Shepard's Links in einem Dokument verweisen grundsätzlich nur auf frühere Texte. Genauso wichtig sind jedoch Informationen darüber, wo ein bestimmter Fall später zitiert wird. Das Instrument für die Suche nach Zitationen im amerikanischen Rechtsbereich ist Shepard's Citations Service. Shepard's ist ein Produkt von McGraw-Hill, das bei Lexis-Nexis zur Verfügung steht. Über Shepard's erhalten wir eine kommentierte Liste von Zitationen, über Lexis-Nexis' Datenbank den direkten Zugriff auf den kompletten Wortlaut der Dokumente. Ausgangspunkt einer Zitationssuche ist ein Fall, über dessen Aktenzeichen die Suche eingeleitet wird. Wenn wir die Zitierungen unseres Beispielurteils aus Abbildung 14.4 recherchieren möchten, leiten wir die Suche mittels
6 F.3d 88; 1993 U.S. App. LEXIS 23285
im Feld „Shepard's" oder mit dem Suchbefehl „shep ...[Nr.]" ein. Man kann entweder nach allen Zitierungen oder nach gewissen Arten von Zitaten suchen. Zu den „Zitationsarten" gehören: •
•
history of case •
parallel citation
•
affirmed
•
connected case
•
dismissed
•
reversed
•
same case
•
superseded
•
vacated
treatment of case •
critized
•
distinguished
304
14 Gesetze und Urteile •
explained
•
examiner's decision
•
followed
•
harmonized
•
dissenting opinion
•
limited
•
limited in part
•
overruled
•
parallel
•
questioned
•
valid
•
void
•
void in part.
In Abbildung 14.5 ist das Retrieval (nach allen Zitierungen) angegeben. Das Ergebnis sind zwei Zitate (aus einem Urteil) mit abweichender Einschätzung. LexisNexis hat auch dem Zitationsindex von Shepard - wie oben bereits beschrieben - die entsprechenden Links hinzugefügt. Über den Link sind wir zum Volltext des zitierenden Urteils gelangt. Die Abbildung zeigt (diesmal als Bildschirmmitschnitt, also mit Links) den Anfang des Datensatzes und das uns interessierende Zitat.
Abb. 14.5: Retrieval nach Urteilszitierungen („Shepardizing") Copyright 1999 Shepard's - 2 Citing references - KWIC view Loughman v. Consol-Pennsylvania Coal Co., 6 F.3d 88, 1993 U.S. App. LEXIS 23285 (3d Cir. Pa. 1993) SHEPARD'S(R) Signal: Caution: Possible negative treatment Restrictions: Unrestricted FOCUS Terms: None Double-click on a number or enter an equal sign followed by the number. FULL Restrictions Show Neg Refs Clear Restrictions Help FOCUS Search Exit SHEPARD'S
14 Gesetze und Urteile
305
CITING REFERENCES (2 citing references) 4th Circuit - Court of Appeals Cited in Dissenting Opinion at Brzonkala v. Virginia Polytechnic Inst. & State Univ., 169 F.3d 820, 1999 U.S. App. LEXIS 3457 (4th Cir. Va. 1999) Cited in Dissenting Opinion at 169 F.3d 820 p.910
Eingabe: ,,=10" LEXIS(R) Case Law Signal: Caution - Consult Citation Services
B R Z O N K A L A v. VIRGINIA P O L Y T E C H N I C INST. & STATE UNIV. No. 96-1814, No. 96-2316 UNITED STATES C O U R T O F APPEALS FOR T H E FOURTH CIRCUIT 169 F.3d 820; 1999 U.S. App. LEXIS 3457 March 3, 1998, Argued March 5, 1999, Decided ... [stark gekürzt]... ... [*910] [**311]
intercourse." 935 F. Supp. at 785. In addition, since
Brzonkala alleged that Morrison and Crawford engaged in a conspiracy to rape her, Morrison's comments are also relevant in assessing Crawford's liability. See
Loughman v. Consol-Pennsylvania Coal Co., 6 F.3d 88,
103 (3rd
Cir. 1993) (in a civil conspiracy "every conspirator is jointly and severally liable for all acts of co-conspirators taken in furtherance of the conspiracy"); United States v. Carpenter, 961 F.2d 824,... Quelle: Lexis-Nexis; Shepard's
Der Dienst von Shepard's
Citations Index umfaßt alle Fälle, insofern diese vom
Informationsproduzenten bereits bearbeitet worden sind. Lexis-Nexis hat eine eigene Zitationsfunktion („lexcite") in das System integriert, die über die Volltexte aller Dokumente recherchiert. Vorteil ist hierbei, daß der Nutzer gewisse weitere Suchkriterien (etwa Datumsangaben) eingeben kann, Nachteil ist, daß die Suche ausschließlich automatisch bearbeitet wird und demnach keinerlei Kommentar vorhanden sein kann.
14 Gesetze und Urteile
306
Fazit •
Jedes Unternehmen benötigt zur Absicherung seiner Aktivitäten juristische Informationen, und zwar sowohl Normen (Gesetze usw.) als auch Entscheidungen und Kommentare bzw. Fachliteratur.
•
Bei der Zusammenstellung eines Dossiers zu einem Unternehmen (oder auch zu einer Person) dürfen Informationen aus Rechtsdatenbanken nicht fehlen, erfahren wir doch hier etwas über deren Verwicklungen in juristische Angelegenheiten.
•
Die zentrale Informationsquelle für deutsches Recht ist das Online-Archiv Juris. Hier werden Normen, Grundsatzurteile sowie juristische Fachartikel und Bücher inhaltlich erschlossen vorgehalten. Volltexte sind für Normen vorhanden, bei einigen Urteilen wird ein sog. „Langtext" angeboten, die restlichen Datensätze sind nur bibliographische Nachweise.
•
Das Recht der Europäischen Union wird durch den Dienst Celex abgebildet. Sowohl die Normen (u.a. aus den Amtsblatt-Reihen C und L) als auch die Entscheidungen des Europäischen Gerichtshofes sind im Wortlaut recherchierbar.
•
Weltmarktfiihrer bei Rechtsinformationen ist Lexis-Nexis. Eine besonders auf den Rechtsbereich zugeschnittene Software ermöglicht einen (nahezu) optimalen Zugriff auf die Volltexte der Normen, Entscheidungen und Fachliteratur. Mehrere Möglichkeiten „Shepardizing").
sind
vorhanden,
Urteilszitierungen
nachzugehen
(u.a.
15 Gewerbliche Schutzrechte als Wirtschaftsinformationen: Patente, Gebrauchsmuster, Marken, Geschmacksmuster
Patentinformationen sind - so könnte man meinen - ausschließlich dem Bereich von Wissenschaft und besonders der Technik zuzuordnen. Diese Ansicht ist irrig, Informationen über gewerbliche Schutzrechte sind auch - vielleicht sogar: vor allem Wirtschaftsinformationen. „Obwohl sie auf dem ersten Blick eine knochentrockene Materie versprechen, sind Patentdatenbanken nicht mehr nur eine Informationsquelle für ausgebildete Fachingenieure und hochspezialisierte Patentanwälte. Sie liefern allen markt- und produktkundigen Professionals Neues aus den Technologien ihrer Branche. Patentdatenbanken schärfen insbesondere das, was die Angelsachsen als Current Awareness schätzen, das geschärfte Bewußtsein zu wissen, was läuft. Dazu gehören gerade die Spin Offs, unerwartete Erfindungen von Firmen aus Industriezweigen, die bisher in der Branche noch nicht von sich reden gemacht haben", notiert Eckhard Rahlenbeck unter dem Titel „Der Konkurrenz auf den Fersen" (Rahlenbeck 1995a, I). Wir geben hier einen Überblick über Informationsquellen zu gewerblichen Schutzrechten aus dem Blickwinkel der Wirtschaftsinformation. Der Blickwinkel der Forschungs- und Entwicklungsabteilung folgt im nächsten Kapitel.
15.1 Gewerbliche Schutzrechte Gewerbliche Schutzrechte werden in die zwei Gruppen der technischen und der nichttechnischen Schutzrechte unterteilt. Letztere umfassen Geschmacksmuster und Warenzeichen, erstere Patente und Gebrauchsmuster (vgl. Haugg/Lokys/Winterfeld 1989).
Nichttechnische Schutzrechte: Warenzeichen und Geschmacksmuster Warenzeichen (Marken) kennzeichnen gewisse Waren oder Dienstleistungen durch Worte oder Bilder (oder Kombinationen aus Wort und Bild). Bei der Anmeldung erfolgt eine formale Prüfung. Schutzdauer der Marke beträgt zehn Jahre und kann um jeweils weitere zehn Jahre verlängert werden. Beim Deutschen
Patent-
und
308 Markenamt
15 Gewerbliche Schutzrechte (DPMA)
werden pro Jahr rund 50.000 bis 60.000 Warenzeichen
angemeldet. Dem Geschmacksmusterschutz sind Muster (in Flächenform) und Modelle (in Raumform) zugänglich (etwa die typische Flaschenform von „Coca-Cola"). Wie bei den Warenzeichen wird auch hier bei der Anmeldung nur formal geprüft. Der Schutz beträgt fünf Jahre und kann um jeweils weitere fünf Jahre (bis maximal 20 Jahre) verlängert werden. Beim DPMA kommen pro Jahr ca. 80.000 Muster und Modelle zusammen, für die Geschmacksmusterschutz beantragt wird.
Technische Schutzrechte: Patente und Gebrauchsmuster Nach dem deutschen Patentgesetz werden „Patente ... für Erfindungen erteilt, die neu sind, auf einer erfinderischen Tätigkeit beruhen und gewerblich anwendbar sind" (§ 1). Die Bearbeitung eines Antrags auf Patentschutz durchläuft stets zwei Phasen (vgl. Cohausz 1995): zunächst die Prüfung anhand formaler Kriterien (Publikation als „Offenlegungsschrift" oder „A-Schrift") und danach - soweit ein Prüfantrag gestellt wird - die inhaltliche Prüfling (Publikation des erteilten Patentes als „Patentschrift" oder „C-Schrift"). Nach der Publikation der Patentschrift läuft eine Einspruchsfrist, die im Einspruchsverfahren entweder zur Aufrechterhaltung oder zum Widerruf des Patentes führt. Patentschutz wird für maximal 20 Jahre gewährt. Danach erlischt das Patent. Es erlischt ebenfalls, wenn der Eigentümer die jährlich anfallenden Gebühren nicht bezahlt oder wenn das Patent zurückgezogen wird. Über alle Ereignisse, die ein Patent betrifft, führt das DPMA die sog. „Patentrolle". Im Jahr 1997 wurden beim Deutschen
Patent-
und Markenamt
Uber 75.000 Patente
angemeldet, für 34.000 wurde Prüfanträge gestellt, erteilt wurden gut 16.000. Gegen erteilte Patente gab es rund 1.400 Einsprüche. Die Voraussetzungen für die Erteilung eines Gebrauchsmusters sind analog zum Patent, der Antrag wird allerdings nicht inhaltlich geprüft. Eine Prüfung findet grundsätzlich nur dann statt, wenn ein Dritter sich mit einem Löschungsantrag gegen das Gebrauchsmuster wendet. Schutzdauer ist zehn Jahre. Beim DPMA
werden
jährlich gut 20.000 Gebrauchsmuster angemeldet, von denen rund 80% (als „USchriften") eingetragen werden. Patente können nicht nur national, sondern auch international angemeldet werden. Das europäische Patent (über das Europäische Patentamt) gestattet die Anmeldung einer Erfindung gleichzeitig in mehreren europäischen
Ländern. Auch
beim
309
15 Gewerbliche Schutzrechte
europäischen Patent gibt es die Phasen (1.) Formalprüfung, (2.) inhaltliche Prüfling und (3.) Einspruchsfrist. Die Laufzeit des europäischen Patents beträgt (vom Tag der Einreichung an) 20 Jahre. Das Europäische Patentamt berichtet von rund 90.000 Patentanmeldungen pro Jahr. Zusätzlich gibt es die Möglichkeit einer internationalen Patentanmeldung (PCT; Patent Cooperation Treaty), die allerdings nur in der ersten (formalen) Phase international gefuhrt wird und dann in der zweiten Phase in die jeweils nationalen Bearbeitungen übergehen. Der Schutz für eine patentierte Erfindung erstreckt sich immer auf ein Land. Möchte man seine Erfindung auch in anderen Ländern schützen, so müssen sie dort angemeldet werden. Die Menge aller Patente derselben Erfindung bezeichnet man als „Patentfamilie".
Technische Informationen außerhalb der Patente und Gebrauchsmuster Nicht jede wissenschaftlich-technische Neuerung schlägt sich in gewerblichen Schutzrechten
nieder. Wir können sechs Gruppen
technischer
Informationen
identifizieren, die nicht in Patenten und Gebrauchsmustern aufscheinen, die aber trotzdem mittels Methoden der Informationswirtschaft gefunden werden können. •
(1) Der Sachverhalt ist gemäß Patent- bzw. Gebrauchsmusterrecht nicht schützbar, wird aber in einem Artikel (etwa in einer Zeitschrift oder einem Kongreßband) beschrieben,
•
(2) Informationen werden publiziert, die nicht genau eine Erfindung betreffen, sondern Übersichten darstellen oder Aspekte der Grundlagenforschung berühren,
•
(3) Informationen über bereits in Patenten oder Gebrauchsmustern gesicherte Neuerungen, ergänzt um Informationen zur Umsetzung in Produkte oder Prozesse, werden publiziert,
•
(4) Grobe und unvollständige Informationen über Erfindungen, die nicht (oder noch nicht) zum Patent oder Gebrauchsmuster angemeldet sind, werden zum Nachweis der Priorität veröffentlicht. Diese Informationen legen nur so viel offen, daß jederzeit die Priorität bewiesen werden kann, verschweigen aber jedes technische Detail. In der Regel erscheinen solche Artikel in der Hauszeitschrift der Unternehmen,
310 •
15 Gewerbliche Schutzrechte (5) Informationen aus Tageszeitungen, etwa resultierend aus Interviews mit Wissenschaftlern eines Unternehmens,
•
(6) Informationen aus Pressenotizen eines Unternehmens oder eines Verbandes, entweder abgedruckt in einer Zeitung oder gespeichert in einer Datenbank einer Presseagentur.
Rechtsschutz dieser Dokumente ist das Copyright. Von den Informationen der ersten drei Gruppen ist zu hoffen, daß sie in den fachspezifischen Literaturdatenbanken abgebildet sind. Bei Gruppe (4) ist dies nicht in aller Vollständigkeit zu erwarten; hier sind ggf. interne Datensammlungen angebracht. Informationen der Gruppen (5) und (6) sind in Zeitungs- bzw. Agenturdatenbanken relativ komplett vorhanden. Um es zu betonen: Erst das Gesamt aus den Patent- und Gebrauchsmusterinformationen, den wissenschaftlich-technischen Literaturinformationen und den Zeitungs- bzw. Agenturinformationen ergibt ein vollständiges und adäquates Bild der FuE eines Unternehmens oder einer Branche.
15.2 Patentrecherchen Patentrecherchen (vgl. Engelhardt 1989; Wittmann 1992) erfordern detaillierte Kenntnisse des nationalen wie internationalen Patentwesens, des Aufbaus der Patentschriften sowie der Patentdatenbanken. Wegen des Doppelcharakters eines Patentes als technische wie als juristische Schrift sind auch Kenntnisse im betreffenden Technikgebiet sowie im Patentrecht hilfreich. Thematische Patentrecherchen werden wesentlich erleichtert durch den weltweiten Einsatz der Internationalen Patentklassifikation (.IPK) (s.o. Kap. 3.2; S. 73 ff.). Jedes Patent wird mittels (mindestens) einer IPK-Notation inhaltlich erschlossen. Wir wollen uns nunmehr den Strategien zuwenden, mittels derer Recherchen nach Patenten durchzuführen sind. Zunächst betrachten wir die Ziele, die man mit einer Patentrecherche verfolgt. Sodann werden wir eine Typologie der Informationsquellen vornehmen, da nicht alle Datenbanken jeweils die Informationen in der gleichen Weise vorhalten. Hiernach
wird das Augenmerk
auf den
Rechtsstand
des
Schutzrechtes gelenkt. Nach diesen Bemerkungen zur Recherchestrategie werden wir (im Kapitel 15.3) beispielhaft einige Patentdatenbanken vorstellen. Zunächst schauen wir uns aber an, wie ein Patent überhaupt aufgebaut ist.
15 Gewerbliche Schutzrechte
311
Struktur von Patentdokumenten Im Vergleich zu technischer Fachliteratur in Zeitschriften haben Patentdokumente stets dieselbe Struktur. Alfred Wittmann betont, „Patentdokumente sind in erster Linie technische Druckschriften, in denen Erfindungen so beschrieben sind, daß sie von einem Durchschnittsfachmann nachvollzogen werden können. Ein Patentdokument repräsentiert aber auch ein vorläufiges oder endgültiges gewerbliches Schutzrecht, das vom Tage seiner Herausgabe an für einen bestimmten Zeitraum zu beachten ist" (Wittmann 1992, 67). Der technische und der juristische Charakters des Patents bedingen ein straffe Strukturierung: •
Die bibliographischen und inhaltserschließenden Angaben befinden sich auf der ersten Seite des Patents. Sie enthalten u.a.
•
•
Patentnummer
•
Name des oder der Anmelders)
•
Name des oder der Erfinder(s)
•
Titel bzw. Bezeichnung der Erfindung
•
Land und Tag der Prioritätsmeldung
•
Notation(en) der IPK
•
Abstract
•
zentral wichtige Zeichnung.
Im Text müssen folgende Sachverhalte abgehandelt werden: •
Patentansprüche (Beschreibung dessen, was geschützt werden soll)
•
Zitationen
•
Zeichnungen
•
Beschreibung der Erfindung.
Die Zeichnungen und die Erfindungsbeschreibung sind eng verzahnt, insofern jedes Element einer Zeichnung mit einer Nummer versehen ist, auf die im Text Bezug genommen wird. Hier sei eine Leseprobe aus einer Patentanmeldung gestattet:
312
15 Gewerbliche Schutzrechte „Düring the operation of the search engine 140, the automated browser 20,
sometimes known as a 'robot', periodically sends out requests 21 to the network 130" (Monier 1995).
Der Fließtext erklärt sich demnach kaum von allein, die Patentzeichnungen müssen zum Verständnis des Textes zwingend hinzugezogen werden.
Rechercheziele Die Ziele einer Patentrecherche sind vielfaltig und reichen von ausschließlich technischen Interessen über die Beobachtung eigener und fremder Patente bis hin zu informetrischen patentstatistischen Verfahren. Wir können folgende Informationsbedarfe und damit Rechercheziele unterscheiden: •
Neuigkeitsrecherche zum Stand der Technik
•
Beobachtung der Entwicklung eines technischen Gebietes
•
Patentinformationen als „Rohstoff' für eigene Forschung und Entwicklung
•
Lizenzrecherche (Suche nach gültigen Patenten, die zur Nutzung angeboten werden)
•
Suche nach „abgelaufenen" fremden Patenten
•
Verletzungsrecherchen (Suche nach fremden Patenten, die eigene möglicherweise verletzen)
•
Abwehrrecherchen (Suche nach Patentanmeldungen, die unsere Interessen ggf. schädigen und bei denen Einspruch möglich ist)
• •
Einspruchrecherchen (Beobachtung der Rechtsprechung von Schiedsstellen) Konkurrenzbeobachtung (Suche nach den jeweils neu angemeldeten bzw. erteilten Patenten eines Wettbewerbers)
•
Patentstatistik (informetrische Verdichtung von Patentinformationen).
Neuigkeitsrecherchen zum Stand der Technik werden dann durchgeführt, wenn ein eigenes Forschungs- und Entwicklungsvorhaben zu einem Patent geführt werden soll. Ein solches Vorhaben ist nur dann erfolgreich durchzuführen, wenn auf dem betreffenden Gebiet noch keine einschlägige Literatur (egal, welcher Art) vorliegt.
15 Gewerbliche Schutzrechte
313
Betreibt unser Unternehmen eigene Forschung und Entwicklung auf einem bestimmten technischen Gebiet, so ist das ganze Gebiet zu beobachten. Man recherchiert hierzu nach den jeweils neuen Patenten, die durch eine gegebene IPK-Notation indexiert worden sind. Die Notationen sollten etwas breiter als das eigene Forschungsgebiet gewählt werden, damit Entwicklungen „am Rande" nicht wegfallen. In Patentdatenbanken schlummern wertvolle technische Informationen, die dank des Offenlegungscharakters des Patents allgemein zugänglich sind. In diesem Sinne bieten die Inhalte der Patente „Rohstoff', etwa Anregungen, für eigene Forschungsaktivitäten. Letztlich kann auch die Erkenntnis, daß eine Idee schon durch ein Patent geschützt ist, dazu führen, daß man Alternativen in Angriff nimmt. So wird mit dem Patentsystem mitnichten ein Status quo fortgeschrieben, sondern das Patentsystem stimuliert im Gegenteil den technischen Fortschritt. (Im Kapitel 16.1 kommen wir kurz auf dieses Thema zurück.) Lizenzrecherchen sind angebracht, wenn man keine eigene Forschung und Entwicklung durchführen will oder kann. Hier versucht man, technisches Know how über Lizenzen einzukaufen. Eine Lizenz kommt auch infrage, wenn bei einer Neuigkeitsoder „Rohstoff'recherche herauskam, daß es bereits einschlägige Patente zum technischen Gegenstand gibt. Patente werden in Deutschland maximal 20 Jahre geschützt. Zum Teil erlischt ein Patent schon früher, wenn die Gebühren nicht gezahlt werden oder das Patent zurückgezogen wird. Das Patent ist jetzt schutzlos; der technische Gegenstand kann von jedermann imitiert werden. Hält unser Unternehmen eigene Patente, so muß überwacht werden, ob neue, fremde Patente unsere Patente ggf. verletzten. Indikator kann u.a. eine Zitation unseres Patents bei der neuen Anmeldung sein. Patentverletzungen können zu Einsprüchen, ggf. auch zu Lizenzverhandlungen fuhren (wenn der Einspruch erfolgreich war). Abwehrrecherchen sind den Verletzungsrecherchen ähnlich. Sie unterscheiden sich nur darin, daß wir im gegebenen Technikgebiet keine eigenen Patente vorliegen haben. Die neue Patentanmeldung kann unserem Unternehmen aber doch (irgendwie) gefahrlich werden. Hier ist zu prüfen, ob die Anmeldung mit einem Einspruch abzuwehren ist (etwa: das Patent erfüllt nicht die Forderung nach Neuheit). Einspruchrecherchen sind - im engeren Sinne - keine Patentrecherchen, sondern Recherchen in den Datenbanken der Schiedsstellen. Man kann z.B. verfolgen, wie die Konkurrenz mit Einsprüchen erfolgreich ist. Ggf. lassen sich auch Verhaltens-
314
15 Gewerbliche Schutzrechte
muster von Unternehmen bzl. der Einsprüche oder der Verteidigung von Ansprüchen eruieren. Konkurrenzbeobachtungen registrieren alle Patentanmeldungen und -erteilungen von Wettbewerbern. Man weiß stets, wie weit die jeweiligen Unternehmen in ihren Forschungs- und Entwicklungsaktivitäten (soweit sie sich durch Patente zeigen) fortgeschritten sind. Die Patentstatistik bedient sich informetrischer Verfahren, um gewisse Mengen von Patenten zusammenfassend zu beschreiben. (Kap. 16.2 widmet sich ausfuhrlich diesem Thema.)
Typen von Patentdatenbanken Patentschriften sind keine starren Einheiten wie etwa Literatur in Zeitschriften, sie werden im Laufe der Zeit geändert. Diese Änderungen betreffen •
den Typ der Schrift (Offenlegungsschrift, Patentschrift)
•
Anmeldungen einer (bereits patentierten) Erfindung in einem weiteren Land
•
Modifikationen am Rechtsstand (etwa: neuer Eigentümer, Patent erloschen).
Patentdatenbanken passen sich in unterschiedlicher Form dieser Art von „dynamischem Dokument" an. Elke Thomä und Rudolf Tribiahn differenzieren nach drei Grundtypen (vgl. Thomä/Tribiahn 1995): •
statisches Konzept
•
dynamisches Konzept
•
statisches Konzept mit Segmentierung.
Im statischen Konzept wird ein einmal bestehender Datensatz nicht mehr verändert. „Zur selben Erfindung nachträglich erschienene Veröffentlichungen werden entweder überhaupt nicht oder mit einem neuen Record in die Datenbank aufgenommen" (Thomä/Tribiahn 1995, 141). Als Beispiel sei die CD-ROM ESPACE-EP genannt. Im
dynamischen
Konzept
werden
Veränderungen
an
der
Patentschrift
im
vorhandenen Datensatz ergänzt. Patentfamilien werden hier stets als ein Datensatz dargestellt. Als Beispiel sei World Patents Index genannt. Das statische Konzept mit Segmentierung faßt Dokumentationseinheiten mit einem umfassenden Datensatz zusammen. Die einzelnen Dokumentationseinheiten (Subeinheiten) entsprechen den
15 Gewerbliche Schutzrechte
315
Datensätzen im statischen Konzept; die Zusammenfassung aller zugehöriger Dokumentationseinheiten zu einem umfassenden Datensatz garantiert den Aufweis von Patentfamilien und Rechtsstandentwicklungen an einer Stelle.
Abb. 15.1: Typen von Patentdatenbanken
Quelle: Thomä/Tribiahn 1995, 152
316
15 Gewerbliche Schutzrechte
Die Datenbank PATOSDE geht in dieser Form vor. In Abbildung 15.1 sind die drei Typen von Patentdatenbanken graphisch dargestellt. Recherchen in Datenbanken mit statischem Konzept ziehen - wird nicht nur die „reine" technische Information gesucht - Recherchen in der selben oder in anderen Datenbanken nach sich, um etwa eine Patentfamilie zusammenzufuhren oder um den aktuellen Rechtsstand zu ermitteln. Eine zweite Unterscheidung der Patentdatenbanken ist die nach (kompletter) Volltextdatenbank (mit allen Zeichnungen) und eingeschränkter Volltextdatenbank (ohne Zeichnungen) bzw. Datenbank mit bibliographischem Nachweis. Bibliographische Datenbanken und auch Volltextdatenbanken
ohne
Patentzeichnungen
erfordern stets einen zweiten Arbeitsschritt, die Beschaffung der Patentschrift, will man die technischen Details bewerten.
Recherchen nach dem Rechtsstand Bei Recherchen nach dem Rechtsstand wollen wir erfahren, in welchem Verfahrensstand sich eine Patentanmeldung befindet, ob - bei erteilten Patenten - Lizenzen angeboten werden und ob ein Patent noch gültig ist; im einzelnen: •
der Verlauf zwischen Anmeldung (Offenlegung) und Patenterteilung (oder Ablehnung) bei einem bestimmten Patentamt
•
der Verlauf zwischen Anmeldung und Erteilung bei weiteren Patentämtern
•
Angebot von Lizenzen
•
Ablauf eines Patentes.
Rechtsstandrecherchen sind bei mehreren Typen von Patentrecherchen relevant, so z.B. bei Lizenzrecherchen, Suchen nach „abgelaufenen" Patenten, Verletzungsrecherchen
oder
Abwehrrecherchen.
Datenbanken,
die
vorwiegend
technische
Informationen bieten, sind für Rechtsstandrecherchen wenig zu gebrauchen. Im Gegenzug enthalten dezidierte Rechtsstanddatenbanken (wie die Patentrolle des Deutschen Patent- und Markenamtes) keinerlei technische Angaben. Ausgewählte Rechtsstanddaten enthalten die Patentdatenbanken nach dem dynamischen Konzept. Online-Rechtsstandrecherchen sind möglich und zielführend. Rudolf Tribiahn und Sabine Milde weisen jedoch darauf hin, daß die erhaltenen Datensätze - juristisch gesehen - nicht verbindlich sind. „Unabhängig davon, ob eine Datenbank von einem
317
15 Gewerbliche Schutzrechte
nichtamtlichen Anbieter stammt oder von dem betreffenden Patentamt, ob sie auf inhaltliche Recherchen oder auf die Wiedergabe des Verfahrensstandes konzentriert ist, muß beachtet werden: Die Angaben in der Datenbank sind zwar wichtig und informativ, aber nicht verbindlich. Eine Datenbankrecherche kann im 'Ernstfall' die Akteneinsicht nicht ersetzen, nur die Akteneinsicht ist verbindlich" (Tribiahn/Milde 1993,241).
15.3 Patentdatenbanken Denvenfs
„World Patents Index"
Eine umfassende bibliographische Patentdatenbank bietet das Unternehmen Derwent an. Derwent ist Teil von Thomson Science and Technology Derwenfs
der Thomson
Corp.
„World Patents Index" enthält die bibliographischen Angaben, eine
Inhaltserschließung nach der Internationalen Patentklassifikation
(sowie nach einem
eigenen Klassifikationssystem) sowie ein Abstract von derzeit über acht Millionen Patentfamilien. Recherchierbar ist also in etwa das, was auf der ersten Seite einer Patentschrift aufscheint. Komplett ausgewertet werden die Patentdokumente aus rund 40 Ländern, darunter alle Industriestaaten und wichtige Schwellenländer. Ab 1974 werden alle technischen Gebiete beobachtet; vorher sind nur ausgewählte Technikgebiete berücksichtigt (wie z.B. Pharmazie seit 1963 und die gesamte Chemie seit 1970). Dokumentationseinheit
ist eine Patentfamilie. Bei der ersten Aufnahme eines
Patentes im „World Patents Index" wird diese als „Basic" gekennzeichnet und formal und inhaltlich erschlossen. Spätere Dokumente zur selben Erfindung werden nicht separat ausgewertet; die neuen Angaben (etwa das weitere Bestimmungsland und die neue Patentnummer) werden lediglich als „Equivalent" dem „Basic"-Datensatz angehängt. Der „World Patents Index" arbeitet demnach als bibliographische Datenbank nach dynamischem Konzept. Als eigene Datenbank wird der „Derwent Patents Citation Index" gepflegt. Für deutsche Patente und Gebrauchsmuster sowie für europäische, britische, japanische, amerikanische und PCT-Patente werden alle Zitationen verwaltet, die die Prüfer in den genannten Patentämtern zu den Patenten notieren. In jedem Datensatz ist eine komplette Liste derjenigen Patente angegeben, die ein bestimmtes Patent zitieren. Die
Derwew/-Patentdatenbanken
werden
über
kommerzielle
Online-Archive
(darunter den Weltmarktfiihrer für wissenschaftlich-technische Information STN-
318
15 Gewerbliche Schutzrechte
International) sowie über die Internet- wie Intranetplattform „Web of Science" des Schwesterunternehmens Institute for Scientific Information angeboten.
Inpadoc Die nach Anzahl der Dokumentationseinheiten größte bibliographische Patentdatenbank ist „Inpadoc" (vgl. Wittmann 1992, 151 ff.). Die inhaltliche Erschließung ist bei „Inpadoc"
kaum
Patentklassifikation
ausgeprägt; (sowie
lediglich
die Notationen
ggf. zusätzlich
vergebene
der
Internationalen
Notationen
nationaler
Klassifikationssysteme) sind vorhanden, aber keine Abstracts. Hergestellt wird „Inpadoc" von „Epidos" (European Patent Information and Documentation Systems), einer Einheit des Europäischen Patentamtes (Dienststelle Wien). Quellen für „Inpadoc" entstammen den Patent- und Gebrauchsmusterschriften aus über 50 Patentämtern seit 1968. „Inpadoc" liegt online in mehreren Versionen auf. Beim Online-Archiv STN-International wird jedes Patentdokument einzeln als Datensatz geführt (statisches Konzept), bei Lexis-Nexis werden die Mitglieder einer Patentfamilie im Sinne des statischen Konzeptes mit Segmentierung zusammengeführt. Unser Beispiel in Abbildung 15.2 wurde der Lexis-Nexis-Version entnommen.
Abb. 15.2: Patentnachweis bei Inpadoc
(Lexis-Nexis-Version)
Copyright (c) 1999 European Patent Office
INPADOC
BASIC-PATENT: Germany (DE) 4,341,752; AI; June 14,1995 PATENT FAMILY Number of Patents: 5 GERMANY (DE) PATENT (Number; Kind; Date): Germany (DE) 4,341,752; AI; June 14, 1995 TITLE: VERFAHREN UND ZENTRALBRENNER ZUM BEHEIZEN VON SCHACHTOEFEN INVENTOR: TREUTLEIN GUENTER DIPL ING, Germany (DE); THIEL LEONHARD, Germany (DE) PRIORITY (Number; Kind; Date): Germany (DE) 93-4341752; A; December 8, 1993 PATENT ASSIGNEE: RHEINISCHE BRAUNKOHLENW AG, Germany (DE); SAUERLAENDISCHE KALKIND, Germany (DE)
15 Gewerbliche Schutzrechte
319
APPLICATION (Number; Kind; Date): Germany (DE) 934341752; A; December 8, 1993 INT-CL: F27B1/16 (Section F, Class 27, Sub-class B, Group 1, Sub-group 16) EURO-CL: C04B2/12; F23D17/00C; F27B1/16; F27D23/00A5 DERWENT NUMBER: C95-216300 PATENT (Number; Kind; Date): Germany (DE) 4,341,752; C2; November 2, 1995 TITLE: VERFAHREN UND ZENTRALBRENNER ZUM BEHEIZEN VON SCHACHTOEFEN INVENTOR: TREUTLEIN GUENTER DIPL ING, Germany (DE); THIEL LEONHARD, Germany (DE) PRIORITY (Number; Kind; Date): Germany (DE) 93-4341752; A; December 8, 1993 PATENT ASSIGNEE: RHEINISCHE BRAUNKOHLENW AG, Germany (DE); SAUERLAENDISCHE KALKIND, Germany (DE) APPLICATION (Number; Kind; Date): Germany (DE) 934341752; A; December 8, 1993 INT-CL: F27B1/16 (Section F, Class 27, Sub-class B, Group 1, Sub-group 16) EURO-CL: C04B2/12; F23D17/00C; F27B1/16; F27D23/00A5 DERWENT NUMBER: C95-216300 PATENT (Number; Kind; Date): Germany (DE) 59,405,033; CO; February 19, 1998 TITLE: VERFAHREN UND ZENTRALBRENNER ZUM BEHEIZEN VON SCHACHTOEFEN INVENTOR: TREUTLEIN GUENTER, Germany (DE); THIEL LEONHARD, Germany (DE) PRIORITY (Number ;Kind; Date): Germany (DE) 94-59405033; A; December 3, 1994 Germany (DE) 93-4341752; A; December 8, 1993 PATENT ASSIGNEE: RHEINISCHE BRAUNKOHLENW AG, Germany (DE); SAUERLAENDISCHE KALKIND, Germany (DE) APPLICATION (Number; Kind; Date): Germany (DE) 9459405033; A; December 3, 1994 INT-CL: F27B1/16 (Section F, Class 27, Sub-class B, Group 1, Sub-group 16) DERWENT NUMBER: C95-216300 GERMANY (DE) Legal Status (Number; Type; Date; Code; Text): DE 4,341,752; P; December 8, 1993; AE; DOMESTIC APPLICATION (PATENT APPLICATION); Germany (DE) 934341752 December 8, 1993; A DE 4,341,752; P; June 14, 1995; A l ; +(Positive Treatment) LAYING OPEN FOR PUBLIC INSPECTION DE 4,341,752; P; June 14, 1995; OP8; +(Positive Treatment) REQUEST FOR EXAMINATION AS TO PARAGRAPH 44 PATENT LAW DE 4,341,752; P; November 2, 1995; D2; +(Positive Treatment) GRANT AFTER EXAMINATION
320
15 Gewerbliche Schutzrechte
DE 4,341,752; P; May 2, 1996; 8364; +(Positive Treatment) NO OPPOSITION DURING TERM OF OPPOSITION DE 59,405,033; P; February 18, 1999; 8364; +(Positive Treatment) NO OPPOSITION DURING TERM OF OPPOSITION DE 59,405,033; P; February 19, 1998; REF; DEREFP; European Patent Office (EP) 660060 February 19, 1998; P
EUROPEAN PATENT OFFICE (EP) PATENT (Number; Kind; Date): European Patent Office (EP) 660,060; Al; June 28, 1995 TITLE: PROCESS AND CENTRAL BURNER FOR HEATING OF SHAFT FURNACES. INVENTOR: TREUTLEIN GUENTER, Germany (DE); THIEL LEONHARD, Germany (DE) PRIORITY (Number; Kind; Date): Germany (DE) 93-4341752; A; December 8, 1993 PATENT ASSIGNEE: RHEINISCHE BRAUNKOHLENW AG, Germany (DE); SAUERLAENDISCHE KALKIND, Germany (DE) APPLICATION (Number; Kind; Date): European Patent Office (EP) 9494119103; A; December 3, 1994 INT-CL: F27B1/16 (Section F, Class 27, Sub-class B, Group 1, Sub-group 16) EURO-CL: C04B2/12; F23D17/00C; F27B1/16; F27D23/00A5 DESIGNATED COUNTRIES: Belgium (BE); Germany (DE); France (FR) LANGUAGE: German DERWENT NUMBER: C95-216300 PATENT (Number; Kind; Date): European Patent Office (EP) 660,060; B l ; January 14, 1998 TITLE: PROCESS AND CENTRAL BURNER FOR HEATING OF SHAFT FURNACES INVENTOR: TREUTLEIN GUENTER, Germany (DE); THIEL LEONHARD, Germany (DE) PRIORITY (Number; Kind; Date): Germany (DE) 93-4341752; A; December 8, 1993 PATENT ASSIGNEE: RHEINISCHE BRAUNKOHLENW AG, Germany (DE); SAUERLAENDISCHE KALKIND, Germany (DE) APPLICATION (Number; Kind; Date): European Patent Office (EP) 9494119103; A; December 3, 1994 INT-CL: F27B1/16 (Section F, Class 27, Sub-class B, Group 1, Sub-group 16) EURO-CL: C04B2/12; F23D17/00C; F27B1/16; F27D23/00A5 DESIGNATED COUNTRIES: Belgium (BE); Germany (DE); France (FR) LANGUAGE: German DERWENT NUMBER: C95-216300 EUROPEAN PATENT OFFICE (EP)
15 Gewerbliche Schutzrechte
321
Legal Status (Number; Type; Date; Code; Text): EP 660,060; P; January 7, 1999; 26N; +(Positive Treatment) NO OPPOSITION FILED EP 660,060; P; April 17, 1998; ET; +(Positive Treatment) FR: TRANSLATION FILED EP 660,060; P; December 8, 1993; AA; PRIORITY (PATENT APPLICATION); Germany (DE) 934341752 December 8, 1993; A EP 660,060; P; December 3, 1994; AE; EP-APPLICATION; European Patent Office (EP) 9494119103 December 3, 1994; A EP 660,060; P; June 28, 1995; AK; +(Positive Treatment) DESIGNATED CONTRACTING STATES IN AN APPLICATION WITH SEARCH REPORT:; B E D E F R ; Al EP 660,060; P; June 28, 1995; A l ; +(Positive Treatment) PUBLICATION OF APPLICATION WITH SEARCH REPORT EP 660,060; P; November 22, 1995; 17P; +(Positive Treatment) REQUEST FOR EXAMINATION FILED; 950926 EP 660,060; P; December 6, 1995; 17Q; +(Positive Treatment) FIRST EXAMINATION REPORT; 951021 EP 660,060; P; January 14, 1998; AK; +(Positive Treatment) DESIGNATED CONTRACTING STATES MENTIONED IN A PATENT SPECIFICATION:; BE DE FR ; B1 EP 660,060; P; January 14, 1998; Bl; +(Positive Treatment) PATENT SPECIFICATION EP 660,060; P; February 19, 1998; REF; CORRESPONDS TO:; Germany (DE) 59405033 February 19, 1998; P LOAD-DATE: April 19, 1999 Quelle: Lexis-Nexis; File Inpadoc
Gesucht wurde nach einem Patent der „Rheinbraun AG". Unser Treffer repräsentiert eine Patentfamilie mit fünf Einzelpatenten. Durch die Segmentierung kann im Nachweis die Geschichte des Patentes verfolgt werden. Zuerst können wir die Historie aus der Sicht des Deutschen Patent- und Markenamtes verfolgen. Eingereicht wurde es am 8. Dezember 1993 beim Deutschen Patentamt, das die A-Schrift am 14. Juni 1995 veröffentlichte. Das deutsche Patent wurde am 2. November 1995 erteilt (CSchrift). (Wegen der Segmentierung der Einzelinformationen wiederholen sich in jedem Segment die formalen Angaben.) Am 14. Januar 1998 wurde das Patent als europäisches Patent mit Bestimmungsland Deutschland erteilt (angedeutet durch das „CO" beim Schrifttyp). Es folgt die Geschichte des Rechtsstandes aus deutscher Sicht. Da das Patent bei einem weiteren Patentamt angemeldet wurde, wird nunmehr die Geschichte aus der Sicht dieses Amtes, hier: des Europäischen
Patentamtes,
322
15 Gewerbliche Schutzrechte
geschildert. Bestimmungsländer sind Deutschland, Belgien und Frankreich. Eingereicht wurde am 28. Juni 1995, die (für Belgien und Frankreich erforderliche) französische Übersetzung ist am 17. April 1998 eingegangen. Erteilt wurde das Patent, wie wir bereits wissen, am 14. Januar 1998; in der folgenden Einspruchsfrist wurden keine Einsprüche erhoben. Aus der Geschichte zum Rechtsstand erfahren wir, daß das Patent (wie in Deutschland) ohne Einsprüche „glatt" durchgegangen ist.
Patente des Europäischen Patentamtes Unser Beispiel einer Volltextdatenbank betrifft die europäischen Patente. Alle Patente, die beim Europäischen Patentamt angemeldet oder zugelassen sind, liegen elektronisch vor. Suchbar sind sie in zwei Varianten. (1.) CD-ROM-Lösung (statisch): Alle Patente liegen im Faksimileformat mit einheitlicher Rechercheoberfläche („MIMOSA") in der CD-ROM-Reihe „ESPACE" vor. Unterschieden werden „Index-CD-ROM" und „Dokumenten-CD-ROM", wobei erstere der Suche dienen, letztere der Volltextausgabe. Produzent dieser CD-ROMEdition ist - wie bei der gerade vorgestellten Datenbank - „Epidos". Die bibliographischen Daten nebst der Sacherschließung nach IPK sowie einem Abstract aller Patente ab 1978 sind in der Index-CD-ROM-Reihe „ESPACE-Access" enthalten. Die Volltexte im Faksimile findet man in den diversen Reihen von ESPACE. Das europäische Patentamt veröffentlicht pro Jahr rund 60.000 Patentanmeldungen (A-Schriften), die in der ESPACE-Serie „ESPACE-EP-A" originalgetreu wiedergegeben sind. Wegen des Graphikformats passen auf eine CD-ROM nur ca. 800 bis 1.000 Dokumente, d.h. es erscheint mindestens jede Woche eine neue CD-ROM (etwa 90 Scheiben pro Jahr - und das seit 1978!). Die erteilten Patente (B-Schriften des Europäischen Patentamtes ab 1980) sind auf der CD-ROM-Reihe „ESPACE-EP-B" enthalten. Ergänzend werden die CD-ROMReihen „ESPACE-Bulletin" (europäisches Patentblatt u.a. mit Verfahrensstand) und „ESPACE-Legal" (Entscheidungen der Beschwerdekammern) herausgegeben. Angesichts der großen Menge an CD-ROM, die bei der Recherche bewältigt werden müssen, tritt hier durchaus ein „Diskjockey"-Syndrom auf. Da selbst große Jukeboxen mit mehreren hundert CD-ROM überfordert sind, ist häufiges CD-ROMWechseln angesagt. Es verwundert nicht, daß in diesem Bereich mit der DVD-Technologie experimentiert wird (vgl. Sabien 1998).
323
15 Gewerbliche Schutzrechte Abb. 15.3: Volltext eines Patentes bei EPOPAT Copyright (c) 1999 European Patent Office
660,060 June 28, 1995 Process and central burner for heating of shaft furnaces GERMAN-TITLE: Verfahren und Zentralbrenner zum Beheizen von Schachtöfen FRENCH-TITLE: Procede et br leur central pour un four a aire INVENTOR: Treutlein, Günter, Diepenbeekallee 2, D-50858 Köln Germany (DE); Thiel, Leonhard, Goldaue 20a, D-34431 Marsberg Germany (DE) APPL-NO: 94119103 FILED: December 3, 1994 GRANTED: January 14, 1998 PRIORITY: December 8, 1993, Germany (DE), 4341752 ASSIGNEE: RHEINBRAUN AG, Stüttgenweg 2, 50935 Köln Germany (DE); DESIGNATED STATES: Europe (EP); LEGAL-REP: Köpsell, Helmut, Dipl.-Ing., Frankenforster Strasse 135-137, 51427 Bergisch Gladbach Germany (DE) APPL-PROP-NO: 207082 REP-NO: 6761 PUB-TYPE: Application published with search report (Al); Granted patent ( B l ) A-DOCUMENT PUBLISHED BY EPO: Yes BULLETIN ISSUE-NO: A l : 95/26, June 28, 1995; A l : 95/27, July 5, 1995; A l : 95/47, November 22, 1995; A l : 95/49, December 6, 1995; A l : 97/28, July 9, 1997; B l : 98/03, January 14, 1998; B l : 99/01, January 7, 1999 LEG-STAT: PUBLISHED APPLICATION (Al): June 28, 1995 CHANGE IN TITLE OF INVENTION (GERMAN) ( A l ) : July 5, 1995 DATE OF FILING OF REQUEST FOR EXAMINATION (Al): November 22, 1995 DATE OF DISPATCH OF FIRST EXAMINATION REPORT (Al): December 6, 1995 DATE OF DISPATCH OF FIRST EXAMINATION REPORT: October 21, 1995 CHANGE IN TRANSFER OF RIGHTS (Al): July 9, 1997 GRANTED PATENT (Bl): January 14, 1998 N O OPPOSITION FILED (Bl): January 7, 1999 FILING-LANG: German (DE) PUB-LANG: German (DE) PROC-LANG: German (DE) INT-CL: F27B1/16, (Section F, Class 27, Sub-class B, Group 1, Sub-group 16) OBL-SUPP-CL: C04B2/12, (Section C, Class 04, Sub-class B, Group 2, Subgroup 12); F23D17/00, (Section F, Class 23, Sub-class D, Group 17, Sub-group
00) HIST-PUB: PUBLICATION DATE FOR FIRST PUBLICATION: June 28, 1995 ISSUE NUMBER FOR FIRST PUBLICATION: 95/26 PUBLICATION DATE OF SEARCH REPORT: June 28, 1995 ISSUE NUMBER OF BULLETIN FOR SEARCH REPORT: 95/26 PUBLICATION DATE OF SECOND PUBLICATION: January 14, 1998
324
15 Gewerbliche Schutzrechte
DESIGNATED CONTRACTING STATES: Belgium (BE), Germany (DE), France (FR) REF-CITED: DE A 3,806,710; Category A - Technological background Category D - Document cited in the application DE C 3,725,559; Category A - Technological background Category D - Document cited in the application SOURCE: Originates from the search report NON-PAT-LIT: ZEMENT, KALK, GIPS, Bd.42, Nr.l, Januar 1989, WIESBADEN DE Seiten 21 - 26, XP000024625 W.H LÜTJE 'Brennstoffaltemativen zum Koks bei konventionellen Schachtöfen 1 ; XP- -000 024 625; (Category A - Technological background) ZEMENT, KALK, GIPS, Bd.38, Nr.2, Februar 1985, WIESBADEN DE Seiten 84 -86 D.LEWERENZ 'Umstellung eines konventionellen Schachtofens auf Braunkohlenstaubfeuerung'; (Category A - Technological background) SUM: Die Erfindung betrifft ein Verfahren zum Beheizen von Schachtöfen für die Wärmebehandlung von mineralischem Gut, beispielsweise Kalkstein oder Dolomit, innerhalb dieses Schachtofens. Die Erfindung betrifft auch einen Zentralbrenner zur Durchfuhrung des Verfahrens, der einen zylinderförmigen Brennerkopf aufweist, aus dessen oberen und unteren Teil jeweils ein brennbares Gas oder Gas-Luft-Gemisch in den Schacht des Ofens austritt. Im mittleren Teil des Brennerkopfes, d. h. zwischen dem oberen und unteren Teil, tritt Spreizluft in den Schacht des Ofens aus. Mit dem Gas oder Gas-Luft-Gemisch wird die Entsäuerungsreaktion des mineralischen Einsatzgutes innerhalb des Schachtes des Ofens bei Temperaturen oberhalb 600 C ausgelöst. Ein gattungsgemäßes Verfahren und Vorrichtung zum Beheizen von Schachtöfen durch einen Zentralbrenner" ist beispielsweise aus der DE 37 25 559 C1 bekannt. ...[gekürzt]... In der nachstehenden Tabelle wird eine Gegenüberstellung des reinen Gasbetriebs mit einem Mischbetrieb von Erdgas und Braunkohlenstaub gegeben. Die Spalte 1 der Tabelle stellt die Verhältnisse bei reinem Erdgasbetrieb dar. Die Spalte 2 der Tabelle stellt die Verhältnisse dar, wie sie sich aus dem gemischten Betrieb von Erdgas und Braunkohlenstaub ergeben.
Ofenleistung spez. Wärmebedarf Energieeintrag ges. Lufteintrag Brennst, o. Ebene Braunkohlenstaub BKS Brennst. Hauptebene Braunkohlenstaub BKS Energieanteil Luftmenge o. Ebene GasVerdünnung Luftm. Hauptebene
t CaO/d 141 kcal/kg CaO 1 122 Gcal/h 6.59 Nm/h 7 760 1.07 Nm/h 295 kg/h 0 "6 35 Nm/h 550 kg/h 0 % 65 "5 0 Nm/h 170 Nm/h 133 * Nm/h 550
142 1 121 6. 63 7 910 1.06 75 300 32 175 600 68 71 120 265 280
325
15 Gewerbliche Schutzrechte Gasverdünnung BKS-Förderluft Spreizluftmenge Unterluftmenge Abgaswerte 0 -doCO -doRest CO Kalkqualität Reaktivität -doGrobkorn
Nm/h Nm/h Nm/h Vol % Vol % Vol % Gew % 0 , 5 - 2 Min 300/370/390
267* 3 580 3 060 31, 9 1,1 0, 8 1,9 1 - 2 Min 311/412/423
535 3 970 2 740 36,0 1,6 0,1 1, 98
GERMAN-CLAIMS: 1. Verfahren zum Beheizen von Schachtöfen für die Wärmebehandlung von mineralischem Gut durch einen Zentralbrenner, wobei aus dem oberen und unteren Teil des Brennerkopfes jeweils ein brennbares Gas oder Gas-Luft-Gemisch und dazwischen aus dem mittleren Teil des Brennerkopfes Spreizluft in den Schacht des Ofens austreten und dort die Entsäuerungsreaktion des mineralischen Gutes ausgelöst wird, dadurch gekennzeichnet, daß man ein Gemisch aus Kohlenstaub und Förderluft... ...[gekürzt]... LOAD-DATE: April 21, 1999 Quelle: Lexis-Nexis; File EPOPAT (stark gekürzt; Umlaute - bei Lexis-Nexis nicht darstellbar - wurden korrigiert)
(2) Online-Lösung (dynamisch). Beim Online-Archiv Lexis-Nexis liegt eine Teilmenge der Schriften des Europäischen Patentamtes in Form von zwei Datenbanken auf. Der File „EPOPAT" umfaßt alle Volltexte von Patentanmeldungen (seit 1986) und erteilten Patenten (seit 1991), der File „EPOBOA" enthält die Entscheidungen der Beschwerdekammern (seit 1979). In Abbildung 15.3 haben wir den EPOPAT-Nachweis des schon in der vorhergehenden Abbildung bemühten Rheinbraun-Patentes eingefügt. Außer uns bereits bekannten Informationen erhalten wir nunmehr den gesamten Fließtext des Patentes mit Zitationen, der Beschreibung der Erfindung sowie den Ansprüchen. Abbildung 15.4 verdeutlicht, welche Informationen in „EPOBOA" zu erwarten sind. Es geht in unserem Beispiel um einen Einspruch gegen ein europäisches Patent. Genannt werden alle Argumente der einsprechenden Partei, die Argumente des Patentanmelders dagegen sowie die ausführlich begründete Entscheidung der Beschwerdekammer in vollem Wortlaut. In unserem Beispiel wurde die Beschwerde zurückgewiesen.
326
15 Gewerbliche Schutzrechte
Abb. 15.4: Volltext einer Entscheidung einer Patent-Beschwerdekammer Ahlmann Baumaschinen GmbH V . Zettelmeyer Baumaschinen GmbH Selbstfahrendes Vielzweckgerät T 0390/93 Technical Board O f Appeal, Mechanics III August 7, 1995 APPL-NO: < = 1 > 8 7 1 1 6 3 8 9 P R O C - T Y P E : Technical PROC-LANG: GERMAN FILING-LANG: GERMAN INT-CL: B 6 0 G 1 7 / 0 0 (Section B, Class 60, Sub-Class G, Group 17, Sub-Group
00)
I S S U E - N O : Gazette 1996/001 A R T I C L E : EPC Art 0 5 6 K E Y W O R D : Erfinderische Tätigkeit (bejaht) OPINION: Sachverhalt und Anträge I. Auf die europäische Patentanmeldung Nr. 87 116 389.5 wurde am 3. April 1991 das europaische Patent Nr. 0 2 6 6 785 erteilt. II. Gegen das erteilte Patent legte die Beschwerdeführerin (Einsprechende) Einspruch ein und beantragte, das Patent zu widerrufen, da der Gegenstand der erteilten Ansprüche 1. bis 12 auf keiner erfinderischen Tätigkeit beruhe. Zur Stützung ihres Einspruchs verwies sie im wesentlichen auf folgende Druckschriften: ( D l ) S E - A - 3 0 9 0 0 8 (mit deutschsprachiger Übersetzung) ( D 2 ) DE-A-2 7 1 0 2 3 9 ( D 3 ) DE-A-3 331 5 1 6 ( D 4 ) Zeichnung 5 . 4 0 9 5 7 4 der Fa. Zettelmeyer, mit Datum 17. Marz 1984 ( D 5 ) Auftragsschreiben der Fa. Rheinbraun, mit Datum 25. Juni 1985, mit technischem Anhang ( D 6 ) DE-A-2 4 5 0 2 3 6 (im Streitpatent erwähnt) ( D 7 ) DE-A-3 301 847. IN. In der mündlichen Verhandlung vor der Einspruchsabteilung vom 19. Januar 1993 reichte die Beschwerdegegnerin (Patentinhaberin) einen neuen Anspruch 10 ein und beantragte die erteilten Ansprüche 1 bis 9, 11 und 12 zusammen mit dem neu formulierten Anspruch 10 als Grundlage für eine Aufrechterhaltung des Patents in geändertem Umfang anzusehen. IV. Am Ende der mündlichen Verhandlung verkündete die Einspruchsabteilung ihre mit schriftlicher Begründung zur Post am 17. Februar 1993 gegebene Entscheidung, das Patent in geändertem Umfang gemäß dem oben erwähnten Antrag der Beschwerdegegnerin aufrechtzuerhalten. V. Die unabhängigen Ansprüche 1 und 3, die der Entscheidung zugrundelagen, haben folgenden Wortlaut: ...[gekürzt] ... VI. Gegen diese Entscheidung hat die Beschwerdeführerin am 27. April 1993 unter gleichzeitiger Entrichtung der Beschwerdegebühr Beschwerde eingelegt. Die Beschwerdebegründung ist am 28. Juni 1993 eingegangen.
15 Gewerbliche Schutzrechte
327
VII. Zur Begründung ihrer Beschwerde hat die Beschwerdeführerin im wesentlichen folgendes vorgetragen: Die Auffassung der Einspruchsabteilung, daß bezüglich der Ansprüche 1 und 3 die Druckschrift Dl nächstliegenden Stand der Technik bilde, sei richtig. ...[gekürzt]... VIII. Die Beschwerdegegnerin hat dagegen das der angefochtenen Entscheidung zugrundeliegende Schutzbegehren gemäß Anspruch 1 und 3 verteidigt und der Relevanz der Druckschriften D l , D2 und D5 im Zusammenhang mit der Frage der erfinderischen Tätigkeit widersprochen. ...[gekürzt]... Entscheidungsgründe 1. Die Beschwerde ist zulässig. 2. Neuheit Die Gegenstande der angegriffenen Ansprüche 1 und 3 sind gegenüber dem im Verfahren befindlichen Stand der Technik neu. ENTSCHEIDUNGSFORMEL Aus diesen Gründen wird entschieden: Die Beschwerde wird zurückgewiesen. LOAD-DATE: August 11, 1999 Quelle: Lexis-Nexis; File EPOBOA (stark gekürzt; Umlaute - bei Lexis-Nexis nicht darstellbar - wurden korrigiert)
Deutsche Patente: PATDPA - PATOSDE - DEPAROM Nachdem die wichtigsten Aspekte der Patentinformation durch unsere Beispiele aus „Inpadoc" und die Datenbanken des Europäischen Patentamtes bereits angesprochen worden sind, müssen wir hier nur noch kurz auf weitere Informationsressourcen im Patentbereich hinweisen. Für das Retrieval nach deutschen Patenten sind zwei bibliographische Datenbanken relevant: die „PATDPA" des Deutschen Markenamtes
und die PATOSDE
STN-International
Patent-
und
des Wila-Verlags. Beide Datenbanken sind bei
online zugänglich.
„PATDPA" berichtet über alle Patente und Gebrauchsmuster, die beim
Deutschen
Patent- und Markenamt angemeldet werden, sowie über europäische bzw. PCT-Anmeldungen, wenn diese Deutschland als Zielland benennen. Die Datensätze enthalten bibliographische Daten, die Indexierung nach IPK, ein Abstract sowie die Historie des Schutzrechtes (dynamisches Konzept). Seit 1968 sind die deutschen Offenlegungsschriften, Patente und Gebrauchsmusterschriften lückenlos nachgewiesen. Eine gewisse Dopplung beim Nachweis deutscher technischer Schutzrechte ergibt sich dadurch, daß auch die Datenbank „PATOSDE" alle Deutschland betreffenden
328
15 Gewerbliche Schutzrechte
Dokumente bibliographisch beschreibt und zur Online-Nutzung anbietet. Hergestellt wird dieses Produkt vom Wila Verlag Wilhelm Lampl (in München). Der Hauptunterschied zu „PATDPA" liegt darin, daß „PATOSDE" nach dem statischen Konzept mit Segmentierung arbeitet. Maximal können drei Segmente vorkommen (Je nachdem, wie weit eine Anmeldung fortschreitet): •
Segment Offenlegungsschrift
•
Segment Patentschrift
•
Segment Rechtsstand.
Genaue Suchen zum Rechtsstand sind bei der Patentrolle des Deutschen Patent- und Markenamtes
möglich. Eine komplette Obersicht über alle Aspekte zum Rechtsstand
wie z.B. die Lizenzbereitschaftserklärung kann nämlich weder in PATDPA noch in PATOSDE erwartet werden. Die faksimilierten Volltexte der deutschen Patente liegen auf der von der Bundesdruckerei (in Berlin) edierten CD-ROM-Reihe „DEPAROM" vor. Wie beim europäischen Pendant gibt es auch hier eine Indexdatenbank
(„DEPAROM-KOM-
PAKT") sowie Dokumenten-CD-ROM, „DEPAROM-ACT" mit Offenlegungs- und Patentschriften bzw. „DEPAROM-U" mit Gebrauchsmusterschriften. Parallel dazu gibt es eine Zugriffsvariante via World Wide Web („DEPAbase") mit Patentdokumenten im PDF-Format (fiir Schriften ab Mitte 1997). Letztlich sei noch der Web-Dienst „esp@cenet" erwähnt, der kostenlos Patentdokumente der jeweils letzten zwei Jahre bereitstellt (vgl. Wenzel 1999). Dieser Dienst ist für professionelle Recherchen wegen der viel zu kurzen Zeitspanne ungeeignet, für Schulungszwecke aber durchaus zu gebrauchen (für weitere Angebote im World Wide Web vgl. Höhne/Ludwig 1996).
Beschaffung von Patentschriften Fehlen die Zeichnungen in den Volltextdatenbanken, oder sind gar nur die bibliographischen Angaben vorhanden, schließt sich an die Recherche als zweiter Schritt die Beschaffung der nachgewiesenen Patentschriften an. Hat man die Faksimiledatenbanken der CD-ROM-Serien nicht selbst vorliegen, so ist man auf externe Dienstleister angewiesen. Es gibt auf Patentliteratur spezialisierte Online-Services für Document Delivery. Wir wollen als Beispiel Paton der TU Ilmenau vorstellen (vgl. Schramm/Ulrich 1998).
15 Gewerbliche Schutzrechte
329
Wenn dem Kunden die Patentnummer bekannt ist, wird eine elektronische Bestellung bei Paton möglich. Die Bestände umfassen alle Patentschriften, die auf CD-ROM enthalten sind. Geliefert wird umgehend entweder elektronisch oder auf dem Postweg. Basis des Ilmenauer Dokumentlieferdienstes sind rund 10 Millionen elektronisch vorliegende Patentdokumente, die durch eine Indexdatenbank erschlossen sind. Der Kunde erfährt direkt bei der Eingabe der Patentnummer, ob das entsprechende Dokument bei Paton vorhanden ist. Auf der WWW-Site von Paton befindet sich außerdem eine kleine Linksammlung, die zu Patentdatenbanken im World Wide Web fuhrt. Letztlich unterhalten die Patentauslegestellen in Deutschland sowie natürlich das Deutsche Patent- und Markenamt
umfangreiche Bibliotheken (vgl. Wittmann 1992,
28 ff.). Die Zahl der gesammelten Patente beim DPMA in dessen beiden Patentbibliotheken in München und Berlin beträgt weit über 60 Millionen Dokumente (auf Papier). Natürlich sind dort auch die Patent-CD-ROM vorhanden. Nachteil für den Nutzer einer (realen) Bibliothek ist, daß die - in der Tat umfangreichen - Bestände nur vor Ort optimal genutzt werden können.
15.4 Markenrecherche Recherchen nach Warenzeichen bzw. Marken sind analog zu den Patentrecherchen durchführbar (vgl. Bugdahl 1995). Ähnlich wie bei der Internationalen fikation
Patentklassi-
liegt auch hier ein einheitlicher thematischer Zugriff auf die Datensätze vor.
Es handelt sich um eine Klassifikation der Waren („Nizza-Klassifikation") und eine Klassifikation der figürlichen Darstellungen („Wiener Klassifikation"). Beide Klassifikationssysteme werden von der World Intellectual
Property Organization
(WIPO)
in Genf gepflegt.
Nizza-Klassifikation Die Markenämter in nahezu allen Teilen der Welt klassifizieren die angemeldeten Marken anhand der „International Classification of Goods and Services for the Purpose of the Registration of Marks under the Nice Agreement". Der Name ergab sich durch den Ort der Konferenz, die 1957 die entsprechenden Aktivitäten in die Wege leitete. Inzwischen liegt die Nizza-Klassifikation in der 7. Auflage (1997) vor.
330
15 Gewerbliche Schutzrechte
Das Klassifikationssystem besteht aus 42 Klassen, von denen 34 Klassen Produkte und acht Klassen Dienstleistungen beschreiben. Die Klassenüberschriften sind recht breit formuliert (etwa: Klasse 15: Musikinstrumente oder 30: Genußmittel). Zu jeder Klasse existiert eine detaillierte Liste von Produkten und Dienstleistungen, die unter die betreffende Klasse fallen. Hier wird exakt gearbeitet: Die Liste der Produkte enthält rund 10.000, die Liste der Dienstleistungen ca. 1.000 Eintragungen.
Wiener Klassifikation Eine Besonderheit von vielen Marken ist ihre figürliche Darstellung (man denke etwa an den Schrägstrich bei der „Deutschen Bank" oder an die lila Kuh von „Milka"). Zur inhaltlichen Erschließung solcher graphischer Elemente wird die „International Classification of the Figurative Elements of Marks (Vienna Classification)" eingesetzt. Auch hier kann eine weite Verbreitung bei Markenämtern unterstellt werden. Seit der Verabschiedung der Klassifikation 1973 in Wien liegt dieses System nunmehr in der vierten Auflage (1998) vor. Das hierarchische Klassifikationssystem besteht aus 29 Kategorien, 144 Abteilungen und 1.634 Sektionen. An gewissen Stellen werden Hilfstafeln eingesetzt. Die Kategorien betreffen sowohl formale Graphikelemente (etwa: Klasse 26: geometrische Figuren oder 29: Farben) als auch inhaltliche Aspekte (z.B. Klasse 2: Menschen, Klasse 15: Maschinen oder Klasse 22: Musikinstrumente). Am Beispiel eines Ausschnitts aus der Kategorie 3 (Tiere) wollen wir in Abbildung 15.5 die Struktur der Wiener Klassifikation verdeutlichen.
Abb. 15.5: Wiener Klassifikation der figürlichen Darstellungen (Ausschnitt) 01 Celestrial bodies, natural phenomena, geographical maps 02 Human beings 03 Animals Notes:
(a)
Heads of quadrupeds and of quadrumana will be placed in the appropriate sections of divisions 3.1 to 3.5 and not in 3.6.25.
(b)
Written or typological matter representing an animal is classified under 27.3.3.
03.01 Quadrupeds (Series I)
331
15 Gewerbliche Schutzrechte 03.01.01 Lions 03.01.04 Tigers or other large felines 03.01.06 Cats or other small felines 03.01.08 Dogs, wolves, foxes 03.01.14 Bears 03.01.15 Pandas 03.01.16 Heads of animals of Series 1 Auxiliary Sections of Division 3.1 Auxiliary Section Associated with Principal Section 3.1.1 A 03.01.02 Heraldic lions ... [gekürzt]... Auxiliary Section Associated with Principal Sections 3.1.1 - 3.1.15 A 03.01.17 Animals of Series I standing A 03.01.18 Animals of Series 1 lying down ... [gekürzt]... A 03.01.24 Animals of Series I stylized A 03.01.25 Animals of Series I in costume 03.02 Quadrupeds (Series II) 03.02.01 Elephants, mammoths Quelle: WIPO (URL: http://classiflcations.wipo.int)
Eine figürliche Darstellung in einer Marke kann mittels einer Notation (aus der Haupttafel) sowie zusätzlich einer Notation aus der jeweils zulässigen Hilfstafel beschrieben werden. Eine Marke, die beispielsweise einen stilisierten Hund enthält, wird durch
03.01.08 und 03.01.24
332
15 Gewerbliche Schutzrechte
dargestellt. Wir haben bei Lexis-Nexis eine Suche nach diesen Notationen der Wiener Klassifikation bei amerikanischen Warenzeichen gesucht und den in Abbildung 15.6 abgedruckten Datensatz gefunden. Mit der Eingabe von „=2" wird ein Faksimile des Design angezeigt.
Abb. 15.6: BeispieldatensatzeinesMarkennachweises Federal Trademarks Get Trademark Design Trademark Name: DB BULLDOG (WORDS AND DESIGN) Filing Date: APRIL 30, 1999 Serial Number: 75-693977 Official Gazette Status: PENDING - INITIALIZED Status Date: MAY 6, 1999 International Class: 36 (INSURANCE, BANKING, AND FINANCIAL SERVICES - PRIMARY CLASS Register Type: PRINCIPAL REGISTER Active/Inactive: ACTIVE Intent to Use: FILED AS INTENT TO USE Word Count: 2 WIPO Design Codes: 03 (ANIMALS) 0301 (CATS, DOGS, WOLVES, FOXES, BEARS) 030108 (DOGS) 03 (ANIMALS) 0301 (CATS, DOGS, WOLVES, FOXES, BEARS) 030124 (STYLIZED ANIMALS IN THIS DIVISION)
15 Gewerbliche Schutzrechte
333
OWNERSHIP INFORMATION Owner: DEUTSCHE BANK INVESTMENT MANAGEMENT INC. (NEW YORK CORPORATION) 31 WEST 52ND STREET NEW YORK, NY 10019 Applicant:
DEUTSCHE BANK INVESTMENT MANAGEMENT INC.
(NEW YORK CORPORATION) 31 WEST 52ND STREET NEW YORK, NY 10019 Quelle: Lexis-Nexis; File CCH Trademark Research Corp. / National Trademarks (gekürzt)
Informationsressourcen mit Markeninformationen Es gibt diverse nationale und internationale Services, die sowohl das Retrieval nach Marken als auch die Faksimileausgabe des entsprechenden Zeichens gestatten. Für Deutschland ist das „Deutsche Elektronische Marken-Suchsystem" (DEMAS) einschlägig, das vom Wila- Verlag produziert und via CD-ROM bzw. über das OnlineArchiv GENIOS vertrieben wird. DEMAS ermöglicht den Zugriff auf alle deutschen Marken, zurückgehend bis ins Jahr 1894, in dem die erste Marke in Deutschland angemeldet wurde. Neben den kommerziellen Systemen bieten weitere Einrichtungen Warenzeichenrecherchen kostenlos im World Wide Web an, so z.B. das us-amerikanische United States Patent & Trademark Office (USPTO) (vgl. Thompson 1999).
Fazit •
Im gewerblichen Rechtsschutz unterscheidet man nichttechnische Schutzrechte (Marken und Geschmacksmuster) und technische Schutzrechte (Patente und Gebrauchsmuster). Außer bei Patenten wird stets nur eine formale Prüfung vorgenommen; nur Patentanmeldungen werden - auf Antrag - inhaltlich geprüft.
334 •
15 Gewerbliche Schutzrechte Patente haben einen Doppelcharakter: einerseits sind sie technische Schriften, andererseits repräsentieren sie ein Rechtsgut. Patentrecherchen bewegen sich demnach im Schnittbereich von Ingenieurwissenschaften und Jura.
•
Da der Patentschutz stets auf ein Land ausgerichtet ist, werden (inhaltsgleiche) Erfindungen ggf. bei mehreren Patentämtern angemeldet. An internationalen Anmeldungen ist die europäische und die PCT-Anmeldung möglich. Die einzelnen Anmeldungen derselben Erfindung bilden zusammen eine Patentfamilie.
•
Diverse Informationsbedarfe lassen sich durch unterschiedliche Formen von Patentrecherchen befriedigen: Neuigkeitsrecherchen zum Stand der Technik, Beobachtung eines technischen Gebietes, Patentinformationen als „Rohstoff' für eigene Innovationen, Lizenzrecherchen, Suchen nach „abgelaufenen" fremden Patenten, Verletzungsrecherchen (Suche nach
fremden
Patenten, die eigene
möglicherweise verletzen), Abwehrrecherchen (Suche nach Patentanmeldungen, die unsere Interessen ggf. schädigen und bei denen Einspruch möglich ist), Einspruchrecherchen (Rechtsprechung von Schiedsstellen), Konkurrenzbeobachtung (Suche nach Patenten eines Wettbewerbers), Patentstatistik. •
Patentdokumente haben dynamischen Charakter. Patentdatenbanken gehen mit diesem Sachverhalt unterschiedlich um. Man unterscheidet Datenbanken mit statischem Konzept, dynamischem Konzept und solchen mit statischem Konzept und Segmentierung.
•
Einige Rechercheformen erfordern das Retrieval nach Rechtsstandinformationen (Verfahrensstand zwischen Offenlegung und Erteilung bzw. Ablehnung des Patents, Lizenzangebote, Erlöschen des Patents).
•
Wichtige bibliographische Patentdatenbanken sind „World Patents Index" und „Inpadoc". Volltexte von Patenten und Einspruchsverfahren haben wir anhand der Datenbanken des Europäischen
Patentamtes
kennengelernt. Für deutsche
technische Schutzrechte sind PATDPA, PATOSDE und DEPAROM einschlägig. •
Patente sind - im globalen Rahmen - stets durch das selbe Hilfsmittel inhaltlich erschlossen {Internationale
Patentklassifikation).
Analoges gilt für die Inhalts-
erschließung von Marken bzw. Warenzeichen. Hier sind die von der WIPO betreuten Hilfsmittel die „Nizza-Klassifikation" (für Waren und Dienstleistungen) sowie die „Wiener Klassifikation" (für figürliche Darstellungen). •
Deutsche Marken sind komplett in der Datenbank „DEMAS" abgebildet.
16 Forschungs- und Entwicklungsaktivitäten von Unternehmen 16.1 Wissenschaftlich-technische Informationen als „Rohstoff für unternehmerische Forschung und Entwicklung
Informationsflüsse zwischen Grundlagenforschung, Technik, Design und Innovationen Unternehmen sind aufgefordert, stets sowohl ihre Produktpalette als auch die Verfahren, solche Produkte zu erstellen, zu überdenken. Unter bestimmten Marktbedingungen ist es geboten, innovativ tätig zu werden. Hierbei spielt der Faktor Information eine herausragende Rolle. Natürlich ist es möglich, daß ein Unternehmen sich alle für eine Innovation nötigen Informationen selbst erarbeitet - dies bedeutet einen
enormen
Arbeits-
und
Kapitalaufwand
und
birgt
das
Risiko,
etwas
Altbekanntes neu zu entdecken.
Abb. 16.1: Informationsflüsse zwischen Wissenschaft, Technik, konstruktivem Design und Innovationen
336
16 Forschung und Entwicklung
Der im Sinne der Informationswirtschaft optimale Weg faßt Information als „Rohstoff" auf und bemüht sich, diesen dergestalt „abzubauen", daß die unternehmensinterne Forschung und Entwicklung auf dem jeweils aktuellen Informationsstand im Bereich der Aufgabe aufsetzen kann (vgl. Kroy/Palme 1995). Abbildung 16.1. zeigt schematisch Informationsflüsse in und zwischen den unterschiedlichen Bereichen der wissenschaftlichen Forschung und Entwicklung. Die linke Seite der Abbildung 16.1 mit dem konstruktiven Design und den Innovationen findet bevorzugt in Unternehmen statt, die rechte Seite mit Grundlagenforschung und technischer Forschung und Entwicklung eher in Hochschulen und Forschungseinrichtungen. Die Pfeile repräsentieren Informationsflüsse. Innerhalb der einzelnen Bereiche funktionieren die Informationsflüsse mehr oder minder gut; d.h. die Grundlagenforschung, die technische Forschung und auch das konstruktive Design sind mit sich selbst informationell rückgekoppelt. Etwas einfacher ausgedrückt: Die Fachleute in einem Spezialgebiet kennen die Wissensquellen in ihrem Spezialgebiet.
Wollen
wir im Unternehmen neue Produkte kreieren oder neue Prozesse installieren, so sind - als informationelle Basis - alle einschlägigen Informationen potentiell relevant. Diese entstammen nicht nur der direkten konstruktiven Umgebung des neuen Produktes oder Prozesses, sondern auch der technischen Forschung oder auch der Grundlagenforschung. Das heißt nicht unbedingt, daß die angestrebte Lösung bereits in einer Publikation beschrieben ist (obwohl auch dies sein kann), der Forscher im Unternehmen kann durch gewisse Informationen vielmehr Anregungen für eigene Ideen bekommen. Letztlich stehen wir bei der Unterstützung der Forschung und Entwicklung im Unternehmen vor der Aufgabe, möglichst alle Informationen, die zur Aufgabenbewältigung beitragen können, zu selektieren. Gefordert ist ein „Weltstandsvergleich" für unser Problem.
Informationsressourcen für Forschung und Entwicklung Informationsquellen wissenschaftlichen
sind alle einschlägigen Publikationen
über
Wissensspeicher,
Patente
bis hin
zu
angefangen
von
unveröffentlichten,
geheimen Berichten der Wettbewerber. Systematisch können wir die Quellen folgendermaßen skizzieren: •
wissenschaftlich-technische Publikationen (Artikel, Bücher usw.)
•
Patente, Gebrauchsmuster
337
16 Forschung und Entwicklung •
Produktbeschreibungen, technische Dokumentationen
(Gebrauchsanweisungen
u.ä.) •
Informationen von Mitarbeitern (erhoben auf Messen bzw. Ausstellungen, aus persönlichen Gesprächen, Unternehmensbesuchen usw.)
•
interne Berichte anderer Unternehmen.
Die ersten beiden Aspekte sind in Datenbanken mehr oder minder vollständig abgebildet. Hier ist der „Rohstoff' Information leicht hebbar. Die beiden nächstgenannten Aspekte erfordern den Aufbau eigener Informationsressourcen. Konkurrenzprodukte müssen beispielsweise beschafft werden, um die Gebrauchsanleitungen zu erhalten. Ggf. interessieren auch die Lieferzettel, wenn logistischen Problemen nachgegangen wird usw. Alle relevanten Informationen werden in einer hausinternen Datenbank abrufbar festgehalten. Der letzte Aspekt verweist auf das Aufspüren geheimgehaltener Informationen und damit auf Bereiche wie Wirtschaftsspionage. Hier sind Informationen natürlich kein freier Rohstoff, sondern geschütztes Eigentum.
Patentinformationen Das Management externer Informationsressourcen im Sinne von Rohstoff für Forschung,
Entwicklung
und
Design
konzentriert
sich
auf
wissenschaftlich-
technische Literaturinformationen und auf Patentinformationen. Eine Anfrage bei umfassenden bibliographischen Patentdatenbanken wie „Inpadoc" oder Derwenfs
„World Patents Index" ist demnach stets angebracht (vgl. Behrmann
1998). Berührt das Informationsproblem technische oder konstruktive Aspekte, so ist eine Patentrecherche sogar unumgänglich. (Zur Beschreibung
einiger
Patent-
datenbanken siehe das vorhergehende Kapitel!) Durch das Feld der Zitationen bei jedem Patent erhalten wir über die einzelnen Patente zusätzlich geprüfte Bibliographien zum Thema des Patentes. „Geprüft" deshalb, weil sowohl Patentanmelder als auch der Prüfer im Patentamt verpflichtet sind, den Gesamtbestand der für eine Erfindung relevanten Vorarbeiten aufzulisten. Abbildung 16.2 zeigt die Zitationen eines Patentes von Michael Burrows
von
AltaVista zu seiner Methode zur Suche und Indexierung von Seiten im World Wide Web. Es werden nicht nur andere Patente genannt, sondern auch wissenschaftlich-
338
16 Forschung und Entwicklung
technische Fachliteratur, j a sogar die Meldung einer Nachrichtenagentur (Business Wire). Bei den Patentzitationen steht beim Host Lexis-Nexis das Gleichheitszeichen, gefolgt von einer Nummer. Dahinter verbirgt sich ein Hyperlink zum Volltext des zitierten Patentes.
Abb. 16.2: Die Zitationen eines Patents als Spezialbibliographie 5,864,863 Jan. 26, 1999 Method for parsing, indexing and searching world-wide-web pages INVENTOR: Burrows, Michael, Palo Alto, California ... ... REF-C1TED: U.S. P A T E N T DOCUMENTS < = =3> < = =4> < = =5>
< = =7> < = =8> < = =9>
5,280,610 5,440,744 5,551,027 5,581,758 5,640,558 5,649,186 5,652,880 5,652,882 5,668,988 5,678,041
1/1994 * Travis, Jr. et al. 8/1995 * Jacobson et al. 8/1996 * Choy et al. 12/1996 : * Burnett et al. 6/1997 * Li 7/1997 * Ferguson 7/1997 * Seagraves 7/1997 * Doktor 9/1997 * Chen et al. 10/1997 '* Baker e t a l .
395#614 395#200.33 395#617 395#614 395#612 707#10 395#614 395#612 707#101 707#9
O T H E R PUBLICATIONS Business Wire, Open Text's Web Search Server for OEM's; Offers Unique Intelligent Search Capabilities, p. 9181355 Jan. 1, 1995. Information Intelligence Inc., World wide Web Search Engines: AltaVista & Yahoo, Dr Link, Accession No. 3168688 May, 1, 1996. Yuwono et al, Wise: A World Wide Web Resource Database System, IEEE Transations on Knowledge and Data Engineering, vol. 8, No. 4, Aug. 1996 Apr. 29, 1996. Steinberg, Seek and Ye Shall Find (maybe), Wired, May 1, 1996, p. 108 et al. Quelle: Lexis-Nexis; Patents Library; ALL File (stark gekürzt)
339
16 Forschung und Entwicklung Wissenschaftlich-technische Literaturinformationen
Literaturinformationen sind entweder allgemeinwissenschaftlich ausgelegt oder - und dies ist die überwiegende Mehrzahl - branchen- bzw. disziplinspezifisch. Letztere enthalten z.T. auch die fachspezifischen Patentinformationen.
Zitationsindices des Institute for Scientific
Information
Bei den großen allgemeinwissenschaftlichen Informationsressourcen dominieren die Zitationsdatenbanken des Institute for Scientific Information (ISI) in Philadelphia, ein Unternehmen der schon mehrfach erwähnten Thomson Corp. Es handelt sich um bibliographische Datenbanken, die als inhaltserschließende Methode die Fußnoten der Artikel angeben. Abbildung 16.4. bringt beispielhaft einen solchen Datensatz. Die Produkte des ISI sind in drei großen Datenbanken sortiert: •
Science Citation Index Expanded
•
Social Sciences Citation Index
•
Arts & Humanities Citation Index.
Der „Science Citation Index Expanded" wertet derzeit rund 5.300 der meistzitierten wissenschaftlichen und technischen Zeitschriften aus; er wächst um etwa 17.000 Nachweise wöchentlich. Diese Quellenartikel enthalten rund 300.000 Zitationen (wohlgemerkt: pro Woche). Über 1.700 sozialwissenschaftliche Zeitschriften bilden die Quellen des „Social Sciences Citation Index". Hier liegt das wöchentliche Wachstum an Quellenartikeln bei 2.800 mit 50.000 darin enthaltenen Zitationen. Über 1.100 geisteswissenschaftliche Periodika fundieren den „Arts & Humanities Index". Darin sind pro Woche 2.200 neue Artikel enthalten, die auf 15.000 Zitationen verweisen. ISI hält alle Volltexte der ausgewerteten Zeitschriften für Artikelbestellungen vor. Der Dokumentlieferdienst firmiert unter der Marke „ISI Document Solution". In Abbildung 16.3 werden die Disziplinen aufgelistet, die in den Zitationsindices durch
ihre
meistzitierten
Zeitschriften
abgebildet
sind.
Ein
Vorteil
dieses
allgemeinwissenschaftlichen Ansatzes ist es, daß Informationsflüsse auch über Disziplingrenzen hinaus nachgezeichnet werden können.
340
16 Forschung und Entwicklung
Die Reihen des ISI werden - mit jeweils unterschiedlichem Umfang und Inhalt - über mehrere Kanäle verteilt: •
online über kommerzielle Archive (u.a. über DIALOG)
•
CD-ROM
•
Magnetbänder (oder via FTP)
•
Druckausgaben
•
Intranet (bzw. - in Ausnahmefällen - auch Internet) als „Web of Science" (hierauf werden wir in den Fallstudien in Kapitel 16.4 detailliert eingehen).
Abb. 16.3: Zitationsindices Acs Institute for Scientific Information. Disziplinen Science Citation Index Expanded Agriculture
Material Science
Physics
Astronomy
Mathematics
Plant Sciences
Biochemistry
Medicine
Psychiatry
Biology
Neuroscience
Surgery
Biotechnology
Oncology
Veterinary Sciences
Chemistry
Pediatrics
Zoology
Computer Science
Pharmacology
Social Sciences Citation Index Anthropology
Linguistics
Social Issues
History
Philosophy
Social Work
Industrial Relations
Political Science
Sociology
Information Science & Library Science
Substance Abuse
Law
Psychology
Urban Studies
Public Health
Women's Studies
341
16 Forschung und Entwicklung Arts & Humanities Citation Index Archaeology
Folklore
Music
Architecture
History
Poetry
Art
Language
Radio, TV, Film
Asian Studies
Linguistics
Religion
Classics
Literary Reviews
Theater
Dance
Literature
Anm.: Einige Disziplinen werden in zwei Indices verzeichnet. Aufgenommen wurde hier nur die erste Nennung. Quelle: Institute for Scientific Information
Das Intranet-Produkt „Web of Science" faßt die drei Reihen der Zitationsindices zu einer großen Datenbank zusammen (vgl. Oxley 1998, Wiley 1998; Stock 1999b). „Web of Science" bietet: •
Navigation nach vorne und hinten entlang der Zitationen
•
Link zu den jeweiligen Originalartikeln (im Original layout) - soweit der Nutzer die elektronische Version der betreffenden Zeitschrift abonniert hat
•
Angabe der Anzahl der Zitierungen für die Quellenartikel
•
assoziatives Retrieval (auf der Basis gemeinsamer Zitationen)
•
Rangordnung von Artikeln nach der Zitationsrate.
Abb. 16.4: Beispielnachweis des „Science Citation Index" DIALOG(R)File 34:SciSearch(R) Cited R e f S c i (c) 1998 Inst for Sei Info. All rts. reserv. 06767552 Genuine Articled ZQ403 Number of References 31 Title: Mercury levels along the food chain and risk for exposed populations Author(s): Renzoni A (REPRINT); Zino F; Franchi E Corporate Source: UNIV SIENA,DIPARTIMENTO BIOL AMBIENTALE, VIA CERCHIA 3/1-53100 SIENA//ITALY/ (REPRINT) Journal: ENVIRONMENTAL RESEARCH, 1998, V77, N2 (MAY), P68-72 ISSN: 0013-9351 Publication date: 19980500
342
16 Forschung und Entwicklung
Publisher: ACADEMIC PRESS INC JNL-COMP SUBSCRIPTIONS, 525 B ST, STE 1900, SAN DIEGO, CA 92101-4495 Language: English Document Type: ARTICLE Geographic Location: ITALY Subfile: CC LIFE—Current Contents, Life Sciences; CC AGRI—Current Contents, Agriculture, Biology & Environmental Sciences Journal Subject Category: PUBLIC, ENVIRONMENTAL & OCCUPATIONAL HEALTH; ENVIRONMENTAL SCIENCES Abstract: Mercury was not regarded as a pollutant of primary importance until many deaths due to mercury poisoning occurred in the 1950s. More recently, adverse health effects have been documented at relatively low exposure levels, and monitoring data must now be interpreted in this light. The Mediterranean basin has been studied in great detail over the past 20 years because of the anomalous natural presence of mercury. Marine animals of this basin have higher mercury body burdens than the same (or similar) species in the Atlantic. The mercury found in marine organisms is mainly in the form of methyl mercury. Long-term and frequent intake of seafood with high mercury levels by populations living in coastal fishing villages is associated with atoxic risk, especially in pregnant women. ( . . . ) This information deserves renewed scrutiny with regard to preventive efforts needed. (C) 1998 Academic Press. Descriptors—Author Keywords: mercury ; fish ; hair ; blood ; fishermen Identifiers—KeyWord Plus(R): SCALP HAIR; FISH CONSUMPTION; FISHERMEN; ISLANDS; HUMANS Cited References: *WHO, 1990, V101, ENV HLTH CRIT AIREY D, 1983, V31, P157, SCI TOTAL ENVIRON BALDI F, 1978, P251, 4 JOURN ET POLL ANT BERLIN M, 1990, V2, P387, HDB TOXICOLOGY METAL BERNHARD M, 1988, 98 UNEP BETTI C, 1993, V22, PI72, ENVIRON MOL MUTAGEN DEFLORA S, 1994, V317, P57, MUTAT RES DITRI FM, 1991, V19, P165, ENVIRON MONIT ASSESS FERGUSSON JE, 1990, HEAVY ELEMENTS CHEM FOO SC, 1988, V72, PI 13, SCI TOTAL ENVIRON FRANCHI E, 1995, V93, P83, MAP TECHNICAL REPORT (...) MONSALVE MV, 1987, V10, P367, ENVIRON MOL MUTAGEN RENZONI A, 1992, V I 6 , P597, ENVIRON MANAGE RENZONI A, 1986, V40, PI7, ENVIRON POLLUT A RENZONI A, 1989, V20, P93, MAR POLLUT BULL RENZONI A, 1989, P207, 2 MED SEAB S CALV MA RENZONI A, 1978, P255, 4 JOURN ET POLL ANT SKERFVING S, 1970, V21, P133, ARCH ENVIRON HEALTH WAGIDA A, 1991, V6, P189, MUTAGENESIS WULF HC, 1986, V47, P81, SCI TOTAL ENVIRON
Quelle: Dialog, File 34 (gekürzt)
16 Forschung und Entwicklung
343
In Abbildung 16.4 ist ein Beispiel aus der Online-Version des „Science Citation Index" beim Host Dialog angegeben. Unser Artikel hat 31 Zitationen, die im Originalnachweis alle aufgeführt sind. Suchbar sind die Zitationen als Ganzes, also z.B.:
CR=BETTI C, 1993, V22, P172, ENVIRON MOL MUTAGEN. (CR : Cited Reference)
Hier findet man alle Artikel, die genau dieses Werk von C. Betti zitieren. Suchbar sind aber auch Aspekte der Zitationen, etwa nach dem zitierten Autor. Mittels
CA=BETTI C (CA : Cited Author)
werden alle Artikel gesucht, die irgendein Werk von C. Betti in ihrem Anmerkungsapparat nennen.
Dissertationen I: Dissertation Abstracts Über alle Disziplinen hinweg arbeiten auch Datenbanken mit Hochschulschriften. Hier steuert nicht ein Fach das Kriterium der Dokumentationswürdigkeit, sondern der Umstand, daß die dokumentarische Bezugseinheit eine Dissertation (oder eine andere Hochschulschrift) ist. Seit 1861 melden us-amerikanische Universitäten ihre Hochschulschriften beim Projekt „Dissertation Abstracts". Derzeit umfaßt die von Bell & Howell and Leaming
Information
produzierte Datenbank rund 1,6 Millionen Nachweise von Doktor-
arbeiten oder Masters Theses. Schwerpunkt sind us-amerikanische Hochschulschriften, enthalten sind aber auch kanadische und britische Arbeiten
sowie
Dissertationen einiger weiterer Länder. Nahezu jede der Dissertationen kann bei Bell & Howell Information and Leaming erworben werden; entweder als Mikrofilm oder als Ausdruck des Mikrofilms. (Britische Dissertationen aus 50 Universitäten des Vereinigten Königreiches werden via British Library verfilmt und auch darüber im Volltext vertrieben.)
Document
Supply
Centre
344
16 Forschung und Entwicklung
Abb. 16.5: Dissertation Abstracts Online - Beispielnachweis ON-BOARD AUTOMATIC AID AND ADVISORY FOR PILOTS OF CONTROL-IMPAIRED AIRCRAFT Author: WAGNER, ELAINE ANN Degree: PH.D. Year: 1988 Corporate Source/Institution: MASSACHUSETTS INSTITUTE OF TECHNOLOGY (0753) SUPERVISOR: LENA VALAVANI Source: VOLUME 49/08-B OF DISSERTATION ABSTRACTS INTERNATIONAL. PAGE 3310. 261 PAGES Descriptors: ENGINEERING, AEROSPACE Descriptor Codes: 0538 This dissertation represents the consideration of the problem of aircraft control failures from a broader, more meaningful viewpoint than with control loop reconfiguration or redesign. The additional considerations involved in making full recoveries from control failures are first categorized. New performance and operating constraints that are best taken into account explicitly are presented, and there is a discussion of the sometimes very important role of explicit post-failure retrim of the aircraft. Because it can be expected that pilots, if unaided, may continue often to be unable to recover aircraft after control failure, these considerations have been cast in the form of knowledge and capabilities that an automatic aid and pilot advisory system should have. Each major element is supported with information from aircraft accident cases and from simulations of post-failure flight of a C-130 aircraft. Because automatic emergency control is seen to be a very significant part of the proposed system, a rule-based expert-type system to find a successful control strategy has been developed for elevator failures on the C-130. This system directs pre-simulation of the control strategy, changing it on the basis of empirical guidelines concerning simple, objective features of the aircraft response to the strategy. As shown in numerous examples, few iterations are required to find successful emergency control. As is discussed, this rule-based approach has no known restrictions with respect to type of aircraft, automatic control also in use, or control failure, as well as length of delay for failure identification. This approach seems to be one that would allow possible use of any remaining control capability, including unusual controls or maneuvering, and of finding the counterintuitive recoveries that, as is shown, are sometimes required. The advisory function of the recovery-aiding system is also described. The issues of pilot interface are discussed, as well as what to calculate to support the advisory during various flight phases. It is believed that the automatic aid and advisory system described, including the rule-based system for finding emergency control, is a good, viable solution to the problem of aircraft control failures.
Quelle: Dialog, File 35
16 Forschung und Entwicklung
345
Die Inhaltserschließung der Dissertationen geschieht über wenige und zudem wenig trennscharfe Deskriptoren sowie durch ausführliche Abstracts (seit 1980). Die formalen Angaben beziehen sich auf Autor, Titel usw. sowie zusätzlich auf den Ort der Dissertation und auf den Betreuer (seit 1988). Dies kann ein interessanter Suchaspekt sein, findet man doch so alle Hochschulschriften, die ein bestimmter Professor betreut hat. Ein Beispielnachweis ist in Abbildung 16.5 abgedruckt. Man findet diesen Datensatz bei einer Suche nach der Betreuerin Lena Valavani vom MIT. Die der Datenbank „Dissertation Abstracts Online" korrespondierenden Druckgegenstücke sind: •
Dissertation Abstracts International
•
American Doctoral Dissertations
•
Comprehensive Dissertation Index
•
Masters Abstracts International.
Dissertationen II: Deutsche Hochschulschriften Deutsche
Hochschulschriften
(Dissertationen
und
Habilitationsarbeiten,
Diplom- oder Magisterarbeiten) werden von der Deutschen Bibliothek
keine
gesammelt.
Neben einer formalen Erfassung nach einem bibliothekarischen Regelwerk („Regeln für die alphabetische Katalogisierung"; RAK) werden alle Schriften inhaltlich durch Schlagwörter erschlossen. Als Dokumentationsmethode finden die „Regeln für den Schlagwortkatalog" (RSWK) Einsatz., deren terminologische Basis die thesaurusähnliche „Schlagwortnormdatei" (SWD) ist. Die RSWK schreiben syntaktische Indexierung durch Kettenbildung vor. Zusätzlich wird ein (recht grobes) Klassifikationssystem
eingesetzt.
Die Deutsche Bibliothek wertet nicht nur Hochschulschriften aus, sondern alle Arten von Literatur, die im Rahmen des Pflichtexemplarrechts an sie geliefert werden. Von allen Veröffentlichungen, die in Deutschland erscheinen, müssen zwei Freiexemplare, eben die „Pflichtexemplare", qua Gesetz an die Deutsche Bibliothek
abge-
geben werden. In den Druckausgaben sind die Hochschulschriften in einer eigenen Reihe zusammengefaßt;
die
Online-Version
(„Bibliodata")
und
die
CD-ROM-Versionen
(„Deutsche Nationalbibliographie"; DNB) umfassen alle Reihen. Sucht man dort
346
16 Forschung und Entwicklung
gezielt nach Hochschulschriften, so muß ein Suchargument explizit die Reihe nennen. Bei der DNB-CD-ROM wird
BR = H ( B R : Bibliographiereihe)
eingegeben. Wie auch unser Beispiel (Abbildung 16.6) zeigt, ist der deutsche Nachweis von Dissertationen qualitativ weitaus dürftiger als bei „Dissertation Abstracts". Abstracts gibt es nicht; die Sacherschließung erschöpft sich in wenigen Schlagwörtern, die kaum über die Titelinformationen hinausgehen; Angaben zum Betreuer der Dissertation sind nicht aufgeführt und damit auch nicht recherchierbar. Letztlich gibt es auch keinen Dokumentlieferservice.
Abb. 16.6: Deutsche Nationalbibliographie - Hochschulschriften. Beispielnachweis DBL:
H 1998 A 821
Geppert, Dietmar: Interaktives Femsehen als Promotor des Home-Shopping : die Akzeptanz der Verbraucher als Engpass der Diffusion ; ein empirischer Beitrag zur Innovationsforschung / von Dietmar Geppert. 1998. - XII, 336, 12 S. : III., graph. Darst. ;21 cm @ Dresden, Techn. Univ., Diss., 1998 DBN 95.429861.6 SW: Interaktives Fernsehen ; Teleshopping ; Adoption (213) (321) SG: 17 Wirtschaft ; 06 Publizistik ; 28 Informatik, Datenverarbeitung ; 41 Nachrichten- und Verkehrswesen Quelle: Deutsche Nationalbibliographie / DNB - CD-ROM
Erläuterungsbedürftig sind die kryptischen Zahlen in den Klammem des Schlagwortfeldes (im Beispiel: 213 und 321). Sie beschreiben „Permutationen" der Reihenfolge der Schlagwörter. Die Ziffern geben die Stelle des Schlagwortes in sinnvollen anderen Ordnungen an. In unserem Beispiel wären demnach drei Lesarten „sinnvoll":
347
16 Forschung und Entwicklung (1) Interaktives Fernsehen ; Teleshopping ; Adoption (Ausgangskette, also 1-2-3) (2) Teleshopping; Interaktives Fernsehen ; Adoption (1. Permutation: 2-1-3) (3) Adoption ; Teleshopping ; Interaktives Femsehen (2. Permutation: 3-2-1).
Permutationen sind nützlich in Druckausgaben der „Deutschen
Nationalbiblio-
graphie", da sie jedes relevante Schlagwort einer Kette einmal nach vorne sortieren und damit im Alphabet suchbar machen.
Fachspezifische Datenbanken Die speziellen Informationen der einzelnen Wissenschafts- bzw. Technikdisziplinen oder Branchen liegen in den jeweiligen - in der Regel bibliographischen - Spezialdatenbanken. Vom Informationstyp aus gesehen, unterscheiden sie sich nicht von den wirtschaftswissenschaftlichen Literaturdatenbanken, die wir im Kapitel 8 besprochen haben. Unternehmen der Papierindustrie werden beispielsweise mit der „PIRA" („Paper, Printing and Packaging Abstracts") arbeiten, Maschinenbauer mit der „DOMA" („Dokumentation
Maschinenbau"), Kreditinstitute mit „MIND"
(„Management-
informationen Deutschland") usw. Ein Beispiel soll eingeschoben werden. Wir nehmen an, ein Unternehmen der Elektroindustrie möchte die internen Berichte nach einem Thesaurus indexieren und in einer Datenbank ablegen. Der Aufbau eines Thesaurus ist ein großes und umfangreiches Projekt. Also informieren wir uns darüber, ob es Vergleichbares bereits gibt.
Abb. 16.7: Bibliographischer Nachweis. Suchfrage: Gibt es bereits einen Thesaurus für die Disziplin Elektrotechnik? AN-
119513, DOMA, 01.09.76; Words: 165
MJ:
Dokumentation, Maschinenbau, Elektrotechnik
348
16 Forschung und Entwicklung
TI:
Zentrales Dokumentationssystem
TX:
Taetigkeit der Dokumentation Maschinenbau (DOMA) und der Zentralstelle Dokumentation Elektrotechnik (ZDE) mit dem zukuenftigen zentralen Dokumentationssystem in der Bundesrepublik. Leistung dieser Dokumentationsstellen am Beispiel der ZDE, Umfang der Auswertung, Leistungsangebot der ZDE, Datensichtstation fiier den direkten Dialogverkehr. Suche in der Datenbank nach entsprechenden Literaturnachweisen anhand des ZDE-Thesaurus Elektrotechnik (Poliacek)
AU:
anonym
SO:
Zeitschriftenaufsatz: TECHN. RDSCH., Band 68 (1976) Heft 27, Seite 2 (1 Seite, 1 Bild)
LG:
DE German
AV:
M76090622694
CC:
3AA *Unternehmensplanung, Betriebsführung/-organisation*
DE:
DOKUMENTATION, MASCHINENBAU; ELEKTROTECHNIK; DATENBANK; DATENSICHTSTATION; DIENSTLEISTUNG; doma; zde; zde-thesaurus
YR:
1976
ED:
197609
PT:
JS Short journal article (J)
TP:
1227 ST=TECHN-RDSCH
Quelle: FIZ Technik; Datenbank DOMA
Abbildung 16.7 zeigt die Antwort auf die Suchfrage
Thesaurus UND Elektrotechnik,
ausgeführt bei der Datenbank DOMA beim Online-Archiv FIZ Technik. Offenbar gibt es - seit langem - einen Thesaurus. Der Volltext des gefundenen Artikels wird
349
16 Forschung und Entwicklung
bestellt - entweder über die Bestellnummer (AV) direkt beim Host oder über einen bibliothekarischen Document Delivery Service (wie Subito). Die Anfrage ersparte Entwicklungskosten von mehreren Mannjahren. Ein umfassendes Branchen- bzw. Disziplinbild dürfte in der Regel durch wenige Datenbanken (rund zehn bis maximal 20) erreichbar sein. Ergänzt werden die bibliographischen
Datenbanken
durch
Volltextdatenbanken
(etwa
wichtiger
Fachzeitschriften oder der Patentschriften), Faktendatenbanken (etwa Werkstoffinformationen oder Informationen Uber Stoffe wie in „Gmelin" oder „Beilstein") sowie durch Ressourcen im World Wide Web.
16.2 Beobachtung der Forschung und Entwicklung von Wettbewerbern und in Technikgebieten Frühindikatoren auf Produkt- und Prozeßinnovationen Im vorigen Abschnitt haben wir besprochen, wie ein Unternehmen die externen Informationsressourcen als Basis für die eigene Forschung und Entwicklung benutzt. Nun interessiert uns die Frage, wie wir Datenbanken einsetzen können, um etwas über die Verhaltensabsichten
von
Prozeßinnovationen
eines
bedürfen
Wettbewerbern Vorlaufes,
der
zu erfahren. Produkt- und ggf.
durch
Patente
und
wissenschaftliche Artikel beschrieben wird. Anhand dieser Informationen ist es möglich, Frühindikatoren auf zu erwartende Innovationen eines Unternehmens abzuleiten.
Auch
lassen
sich
ggf
bislang
branchenfremde
„Quereinsteiger"
identifizieren, deren FuE-Aktivitäten darauf hindeuten, daß sie neue Produkte erstellen wollen. Ebenso ist es mittels Data-Mining aufdeckbar, welche Forschungstrends in einer Branche bzw. in einer Wissenschaftsdisziplin als Ganzes vorherrschen. Wir erhalten hier Basisdaten, um die firmeninterne Strategie der Forschung und Entwicklung abzustimmen mit •
der Forschung und Entwicklung der Wettbewerber und
•
den Forschungs- und Entwicklungstrends in der Branche.
Wenn die Daten zur eigenen Forschung und Entwicklung vergleichend herangezogen werden, wird die Stellung des Unternehmens im Innovationswettbewerb - bezogen auf einzelne Wettbewerber oder auf die gesamte Branche - deutlich.
350
16 Forschung und Entwicklung
Eingesetzt werden Methoden des Data Mining an externen Informationsressourcen, vor allem Rangordnungen und Zeitreihen (s.o. Kapitel 5, S. 137 ff.), angewandt auf Patentdatenbanken und die jeweiligen fachspezifischen Datenbanken. Allgemeinwissenschaftliche Datenbanken wie der Science
Citation
Index kommen dann zum
Tragen, wenn Aspekte der Grundlagenforschung für unsere Fragestellung relevant sind. Die zentralen Quellen bei technischer Forschung und bei der Konstruktion sind j e d o c h die großen multinationalen Patentdatenbanken (vgl. Fendt 1989), auf die wir uns im Folgenden beschränken wollen.
Weltstandsvergleich „Weltstandsvergleiche" zielen auf ein Benchmarking ab, auf einen Vergleich mit d e m „Besten" in einem Technikfeld. Wir können unser eigenes Unternehmen oder einen Wettbewerber als Bezugspunkt wählen. Wir können auch von einem Branchenbild ausgehen. Das Vorgehen ist jeweils gleich. Die Branche wird (möglichst) genau durch eine Notation der „Internationalen Patentklassifikation" beschrieben.
Als
Beispiel fungiere die Branche der Verpackungsmaschinenbauer, die durch die IPKNotation B 6 5 B (Verpackungsmaschinen, -gerate, -Vorrichtungen, Verpackungsverfahren für Gegenstände oder Materialien; Auspacken) bestimmt wird. Da man einen We/istandsvergleich durchführen möchte, muß eine der beiden großen internationalen Patentdatenbanken Inpadoc oder World Patents Index benutzt werden. Bei einem Online-Host, der sowohl Uber diese Datenbanken als auch über informetrische Software verfügt (etwa Questel oder STN International)
wird - ggf. mit Zeiteinschrän-
kung (z.B.: die letzten zehn Jahre) - nach der IPK-Notation gesucht. In unserem Beispiel wurde mit dem World Patents Index beim (ehemaligen) Host Orbit
(heute
Questel) recherchiert. Das Suchergebnis zu IPK B 6 5 B erbrachte (1981 bis Anfang 1994) 22.867 bibliographische Nachweise von Patentfamilien oder, falls nur in einem Land angemeldet, von Einzelpatenten. Diese rund 23.000 Patente bilden die technische Basis der Branche der Verpackungsmaschinen. Benchmarking identifiziert die „Klassenbesten"; insofern ist es sinnvoll, eine Rangordnung nach Patentanmeldern durchzuführen in der Hoffnung, an der Spitze der Hitparade die führenden Unternehmen zu markieren. Mittels des G E T - R A N K Befehls bei Orbit wurden die rund 23.000 Nachweise der Klasse B65B in eine Rangfolge nach Anmeldeunternehmen gebracht. Von den insgesamt 7.448 patentierenden Unternehmen werden in Abbildung 16.8 die ersten zehn angegeben.
351
16 Forschung und Entwicklung
Abb. 16.8: FuE-Weltstandsvergleich. Patentfamilien im Technikgebiet Verpackungsmaschinen absolute H.
relative H.
Unternehmen
1
170
0,74 %
Focke & Co GmbH & Co
2
153
0,66 %
Grace & Co
3
126
0,55 %
Robert Bosch GmbH
4
105
0,45 %
Packaging Filling Equip.
5
92
0,40 %
VEB Kombinat Nagema
6
78
0,34 %
FMC Corp.
7
75
0,32 %
MEAD Corp.
8
70
0,30 %
Schmitt & Co Inc.
9
69
0,30 %
Signode Corp.
10
68
0,29 %
Kaun Poly.
Rang
N = 22.867 Patentfamilien in der IPK-Klasse B65B N ' = 7.448 (unterschiedliche) Unternehmen mit mindestens einem Patent in B65B Quelle: Stock 1994, 264
Obwohl tendenzweise das informetrische Verteilungsgesetz auch hier gilt, so ist doch die Konzentration recht gering, d.h. wir sehen keine ausgeprägte Spitzengruppe. Die Forschungsfront der Verpackungsmaschinenbauer verteilt sich demnach breitgefachert auf diverse Unternehmen. Trotzdem ist es möglich, mit Focke, Grace und Bosch drei führende Firmen zu benennen. Eine Auflistung wie in Abbildung 16.8 ist ein erster Schritt bei der Erstellung eines Weltstandsvergleiches. Bei der Weiterverarbeitung der Rohdaten müssen methodische Probleme der Patentstatistik beachtet werden. Je
nach
Land
und
Patentgesetzen
werden
sowohl
noch
ungeprüfte
Offenlegungsschriften (z.B. in Deutschland) als auch ausschließlich bereits erteilte Patente (z.B. in den Vereinigten Staaten) publiziert und in den Patentdatenbanken abgebildet.
Wir
müssen
demnach
bei
Patentnachweisen
scharf
zwischen
352
16 Forschung und Entwicklung
Publikationen von Patentanmeldungen und Publikationen von (erteilten) Patenten unterscheiden. Patente sind Schutzrechte, die sich auf jeweils genau ein Land beziehen. Will man für seine Erfindung Schutz für mehrere Länder erlangen, so ist die - inhaltlich gleiche Erfindung bei jedem Patentamt erneut zu beantragen. Solche inhaltsgleichen Erfindungen bilden zusammen die „Patentfamilie". Vergleicht man die Anzahl von Einzelpatenten mit der Anzahl von Patentfamilien, so sind sehr große quantitative Verzerrungen zu erwarten. Ggf. kann es aus methodischen Gründen wichtig sein, Gewichtungsfaktoren einzuführen, die sich an der Größe einer Patentfamilie und am Rang des Ziellandes orientieren. Eine Patentpublikation wäre dann umso wichtiger, j e häufiger sie angemeldet ist, und sie wäre wichtiger, wenn sie in Ländern mit hohem Sozialprodukt verzeichnet sind. Es gibt im Patentwesen nationale Unterschiede. In Japan wird beispielsweise feiner patentiert als in anderen Ländern. Eine höhere Anzahl nationaler japanischer Patente bedeutet also keinesfalls, daß auch ein höherer Forschungsoutput vorhanden sein muß. Aus diesem Grunde berücksichtigen manche Patentanalysen nur solche Patente, die außer der Anmeldung im eigenen Land mindestens eine Auslandsanmeldung vorweisen. So geht z.B. die Patentstatistik des ifo Instituts für
Wirtschaftsforschung
in München vor (vgl. Faust 1993; Faust/Buckel 1994). Möchte man die Stellung eines Wettbewerbers in der Rangordnung eruieren, so muß man natürlich nach dem betreffenden Unternehmensnamen innerhalb der IPK-Klasse zusätzlich suchen und die Anzahl der Patente mit der Spitzengruppe der Rangordnung vergleichen. Auch ist klar, daß man nicht - wie wir in unserem Beispiel - mit den I PK-Vierstellern auskommt; es gilt vielmehr, die Klassifikation bis auf die Ebene der Untergruppen ganz auszureizen. Nur so lassen sich die technischen Details erkennen, die Produkte bzw. Prozesse fundieren.
Analyse und Prognose von FuE-Aktivitäten Wann ist auf einem Technikgebiet „etwas los" und wann verläuft die Entwicklung in ruhigen Bahnen? Eine „ruhige" Entwicklung ist immer dann gegeben, wenn die Anzahl der Patente pro Jahr in einer IPK-Rubrik (egal, ob auf Branchen- oder auf Unternehmensebene) mehr oder minder gleich bleibt. Auch hier gibt es zu beachtende Neuerungen - sonst gäbe es j a gar keine Patentanmeldungen -, aber keine
16 Forschung und Entwicklung
353
„revolutionären" Umbrüche. Diese kündigen sich durch ein starkes Anwachsen der Patente an. Die Prognose von technischen Entwicklungen basiert auf der Analyse bisheriger Patentaktivität. Wir sind demnach aufgefordert, Zeitreihen mit den Patentanmeldungen pro Jahr zu erstellen. Ein recht sicheres Prognoseinstrument ist das Uberproportionale Wachstum der Patente, wie Konrad Faust betont. „Die Sachgebiete, die dynamische Technologien erfassen, verzeichnen einen 'Schwall' von Erfindungen, d.h. einen starken Anstieg der Patentaktivität, die sich in der Regel nach wenigen Jahren wieder zurückbildet" (Faust 1993, 162). Die Zeitreihe zeigt einen Verlauf ähnlich einer Glockenkurve; die innovative Phase, die es zu erkennen gilt, liegt in den Bereichen Aufstieg und Sättigung. Berührt das innovative Technikfeld einen Produktbereich des eigenen Unternehmens, so ist - im günstigsten Fall am Anstieg der Glockenkurve - die Informationswirtschaft gefordert, Frühwaminformationen über zu erwartenden Trends abzusenden. Die Prognose auf innovative Technikentwicklungen ist relativ zuverlässig, die Ableitung einer Prognose auf konkrete Umsetzungen in Produkte bzw. Prozesse ist es nicht. Faust resümiert: „Neue Technologien lassen sich mit Hilfe patentstatistischer Analysen frühzeitig erkennen, jedoch ist deren Wirkung und industrielle Zuordnung häufig ungewiß, so daß ohne weiterführende Forschung dieses Wissen nicht genutzt werden kann" (ebd.). „Weiterfuhrende Forschung" deutet auf die technische Analyse der einzelnen Patentaktivitäten, der Strategien der beteiligten Firmen sowie der Vermarktungschancen möglicher neuer Produkte hin. Wir wollen die Frühwarnfunktion der Patentinformetrie an zwei Beispielen vorführen. Einmal führen wir - auf der Unternehmensebene - unser Beispiel zu den Verpackungsmaschinen fort, zum andern betrachten wir eine technische Umwälzung auf Branchenebene.
Markierung der technologischen Entwicklung von Unternehmen Die im Technologiewettbewerb der Branche der Verpackungsmaschinenhersteller führenden Unternehmen sind gemäß Abbildung 16.8 Focke, Grace und Bosch. Für diese drei sollen die Zeitreihen ihrer Patentanmeldungen erstellt werden (Abbildung 16.9). Wir haben drei unterschiedliche Verteilungen vor uns. Die FuE von Bosch hat einen mehr oder minder konstanten Output im Gesamtbereich B65B; revolutionäre Entwicklungen scheinen kaum vorhanden zu sein. Bei Grace sind zwei glockenför-
354
16 Forschung und Entwicklung
mige Kurvenabschnitte zu beachten. Ein erster Innovationsschritt ist in den Jahren zwischen 1983 und 1990 auszumachen, ein zweiter ab 1991. Focke verzeichnet 1986 und - noch ausgeprägter - 1992 einen starken Anstieg der Patentanmeldungen. Im Jahrzehnt zwischen 1983 und 1993 hat dieses Unternehmen die Technologiefiihrerschaft in unserem Beispielgebiet übernommen. Im nächsten Schritt sind die Patente inhaltlich weiter zu untersuchen, zunächst informetrisch über Rangordnungen der IPK-Notationen der Patente der einzelnen Unternehmen, sodann - und hier Uberschreiten wir das Terrain der Informationswirtschaft unter technologischer und ökonomischer Fragestellung.
Abb. 16.9: Patentaktivitäten der führenden Unternehmen im Technikgebiet Verpackungsmaschinen 1981 bis 1993 Patentaktivitäten der führenden Unternehmen bei Verpackungsmaschinen
Quelle: Daten aus: Stock 1994,265
Markierung von Technologietrends in einer Branche Bei der Markierung technischer Entwicklungstrends einer Branche werden alle Patente aller Unternehmen in die Analyse einbezogen und zu Zeitreihen verarbeitet. Wir betrachten hier beispielhaft die Entwicklung im Technikbereich Beschichten in den 80er Jahren (Abbildung 16.10). Die Zeitreihe des IPK-Vierstellers C23C weist kaum revolutionäre Schübe auf. Auch auf der Ebene der IPK-Hauptgruppe C23C016
16 Forschung und Entwicklung
355
(chemisches Abscheiden) sind allenfalls minimale Sprünge (etwa 1987 und 1989) zu verzeichnen. Aus der letzten IPK-Ebene jedoch zeigt sich eine besonders dynamische Entwicklung. Die Zeitreihe bei IPK C23C016/26 (Abscheiden von Kohlenstoff) setzt 1984 bei neun Patenten an, um 1989 bei 56 mit einer Vervielfachung der Patentaktivitäten zu enden. Fast der gesamte Zuwachs der Hauptgruppe C23C016 im Jahr 1989 im Vergleich zum Vorjahr erklärt sich durch den Zuwachs der Untergruppe 26. In diesem Techniksegment ist die Entwicklung völlig neuer Verfahren zu vermuten, was sich auch inhaltlich bestätigen läßt. Hinter „Abscheiden von Kohlenstoff' stehen Verfahren zur Diamantbeschichtung, die in verschiedenen Bereichen zu vielfältigen Anwendungen führten.
Abb. 16.10: Patentaktivitäten im Technikgebiet Beschichten 1984 bis 1989
Jahr
IPKC23C
C23C016
C23C016/26
(Beschichten)
(Chem. Abscheiden)
(Abscheiden von Kohlenstoß)
1984
826
185
9
1985
841
267
14
1986
832
236
22
1987
928
281
29
1988
998
281
29
1989
1.026
325
56
Quelle: Faust 1993, 172
Das Aufspüren der richtungweisenden technischen Erneuerungen ist keine leichte Aufgabe. Außer dem Beherrschen der informationswirtschaftlichen Methoden und Hilfsmittel, hier besonders der Informetrie und der Internationalen Patentklassifikation, sind detaillierte Fachkenntnisse auf dem betreffenden Technikgebiet von Vorteil, um die patentstatistischen Indikatoren auch inhaltlich deuten zu können. Konrad Faust gibt zu bedenken, „eine reizvolle und sehr anspruchsvolle Anwendung finden patentstatistische Indikatoren bei der Analyse der Entwicklung der neuen Technologien, da diese zumeist in der Patentliteratur ihren Niederschlag finden, bevor die entsprechenden technischen Innovationen beobachtet werden können. Hierfür ist jedoch
356
16 Forschung und Entwicklung
Voraussetzung, daß die von der Patentstatistik gebotene Detailliertheit bei der Erhebung der Indikatorwerte soweit genutzt wird, daß die relevanten Technologiesprünge erkennbar werden" (Faust 1993, 161 f.). Von den informetrischen Verfahren wurden hier mit den Rangordnungen und den Zeitreihen nur deren zwei vorgeführt. Die beiden anderen Verfahren sind durchaus auch einsetzbar. Mittels Informationsflußanalysen lassen sich die Quellen auf der einen Seite und die Wirkungen der Patente auf der anderen Seite beschreiben. Wir erhalten so Indikatoren auf die Stellung der FuE eines Unternehmens im internationalen Fluß an wissenschaftlichen und technischen Informationen. Auch läßt sich am Anteil der Zitationen wissenschaftlicher Grundlagenliteratur an der Gesamtmenge der Zitationen in Patenten ablesen, inwieweit ein Unternehmen oder eine Branche „wissenschaftsgebunden" ist (vgl. Grupp/Schmoch 1992). Mittels Clusteranalysen erhält man Verbindungen zwischen Themen. Es ist kaum anzunehmen, daß ein Unternehmen nur genau ein Forschungsthema behandelt, vielmehr werden vielfältige Bemühungen die Regel sein. Die Clusteranalyse zeigt auf, welche FuE-Themen mit welchen anderen zusammenhängen (vgl. Stock 1991b, Stock 1992a, Stock 1994).
Fazit •
Der Einsatz der Informationswirtschaft bei Informationen zur Forschung und Entwicklung verläuft zweigleisig. Zum einen geht es darum, die unternehmensinterne FuE gemäß deren Informationsbedarf optimal mit Informationen zu versorgen. Zum andern sind Forschungstrends in der Branche und bei Wettbewerbern aufzuspüren, um so die Unternehmens- bzw. FuE-Leitung mit Frühwarninformationen über neue Techniken sowie über zu erwartende neue Produkte oder Prozesse zu informieren.
•
Zur Absicherung der unternehmensinternen FuE sind alle Informationsquellen potentiell relevant. Neben Informationen aus der Technik oder dem konstruktiven Design sind dies auch solche aus der Grundlagenforschung. Eine Information muß ein Informationsproblem in der FuE nicht unbedingt restlos lösen (auch dies ist möglich), sie kann auch Ideenlieferant für eigene Forschungen sein.
•
Grundsätzlich notwendig sind Recherchen in Patentdatenbanken. Diese ergeben nicht nur einen Überblick an Patenten und Patentanmeldungen, sondern auch enthalten im Zitationsapparat jedes Patents - Spezialbibliographien zum Suchthema.
16 Forschung und Entwicklung •
357
Bei den allgemeinwissenschaftlichen Datenbanken sind die Zitationsindices des Institute for Scientific Information für Recherchen nach Literatur der wissenschaftlichen Grundlagenforschung hilfreich.
•
Dissertationen bilden einen nicht zu unterschätzenden Fundus an wissenschaftlich-technischen Informationen. Für amerikanische Hochschulschriften sind die „Dissertation Abstracts" einschlägig, Nachweise deutscher Dissertationen sind in der Deutschen Nationalbibliographie enthalten.
•
Für jede Wissenschaftsdisziplin und jede Branche existieren - in der Regel mehrere - Fachdatenbanken. Solche Informationsmittel müssen bei FuE betreibenden Unternehmen präsent und gut bekannt sein.
•
FuE-Benchmarking arbeitet entweder mit den Fachdatenbanken oder mit internationalen Patentdatenbanken. Eingesetzt werden beim Data-Mining Methoden der Informetrie.
•
Rangordnungen von Unternehmen, erstellt mittels Patentdatenbanken, sind Indikator auf die Stellung der betreffenden Firmen im internationalen Technologiewettbewerb.
•
Informetrische Zeitreihen bilden Indikatoren auf Neuerungen innerhalb eines Technikbereichs oder auch innerhalb der FuE eines Unternehmens. Zentrales Hilfsmittel der Patentinformetrie ist die Internationale Patentklassifikation.
17 Personenbezogene Informationen in Datenbanken Personenbezogene Informationen werden in der Unternehmenspraxis vor allem in folgenden zwei Fällen benötigt: •
bei der Suche nach neuen Mitarbeitern
•
bei Einschätzungen von neuen Geschäftspartnern.
Die Informationswirtschaft bietet unterschiedliche Möglichkeiten, relevante Informationen zu Personen zusammenzutragen. Der einfachste Fall liegt vor, wenn ein Personendossier in einer Datenbank vorliegt. Dies ist jedoch nur fiir die wenigsten Personen realisiert. Es ist durchaus denkbar, daß unsere Person selbst Informationen zu sich auf seiner Internet-Homepage zusammengestellt hat, natürlich behaftet mit aller subjektiver Auswahl und Darstellung. Personennamen tauchen in diversen Datenbanken und Datenbanktypen auf, etwa in Zeitungs- oder Agenturmeldungen, in Unternehmensdossiers, in Handelsregistereintragungen, in Gerichtsurteilen oder - als Autorennamen bzw. als zitierter Autor in wissenschaftlich-technischen Literatur- und Patentdatenbanken. Je nach der Relevanz der Person, über die man Informationen erhalten möchte, ist es mehr oder minder sinnvoll, alle potentiell einschlägigen Informationsquellen zu durchsuchen. Wir unterscheiden in diesem Kapitel nicht nur nach Datenbanktypen (hier gäbe es nur einen einschlägigen Typ, die biographische Datenbank), sondern zudem nach Retrievalstrategien, auch aus anderen Datenbanktypen personenbezogene Informationen zu extrahieren: •
biographische Datenbanken
•
Hilfsmittel zum Aufstöbern von Personennamen in Informationssammlungen
•
Erstellen von Rangordnungen von Personen (etwa nach Spezialistentum in einem wissenschaftlich-technischen Fachgebiet).
17.1 Biographische Datenbanken Biographische Informationen zu berühmten Persönlichkeiten - man denke z.B. an „Who's Who" - liegen häufig vor. Schwergewicht der meisten Informationssamm-
17 Personenbezogene Informationen
359
lungen sind jedoch Politiker-, Künstler- oder Wissenschaftlerbiographien, nur „hochkarätige" Manager werden in solchen Werken berücksichtigt.
Munzinger Archiv Das „Munzinger-Archiv" (hergestellt von der Munzinger Archiv GmbH in Ravensburg) beinhaltet Porträts von Persönlichkeiten des öffentlichen Lebens. In der Online-Version (bei GENIOS) werden die Einträge regelmäßig aktualisiert. Neben der Freitextsuche sind Suchen in bestimmten Feldern (etwa nach dem Geburtsdatum) möglich. Abbildung 17.1 bringt (stark gekürzt) das Dossier zu Dietmar Kuhnt (RWE).
Abb. 17.1: Munzinger-Archiv. Beispieldatensatz Munzinger-Archiv/Internationales Biographisches Archiv - Personen aktuell 23/98 / Stand der Ergaenzungen: 6. Oktober 1998 Ersteintrag: 06.06.1998 Rubrik: Wirtschaft Kuhnt, Dietmar deutscher Industriemanager; Dr. jur. Adresse: RWE AG, Postfach 103061,45030 Essen; Tel.: 0201/12-00 * 16.11.1937 Breslau Seine Berufslaufbahn begann K. im Sept. 1966 als Assistent bei der RheinischWestfaelischen Wirtschaftspruefungsgesellschaft mbH in Essen, wo er sein betriebswirtschaftliches Ruestzeug erwarb. Ab Okt. 1968 war er Justitiar in der Rechtsabteilung der Rheinisch-Westfaelischen Elektrizitätswerke AG. Im Jan. 1970 erhielt er dort Handlungsvollmacht, im Juli 1975 Gesamtprokura. ... [gekürzt]... K. ist seit 1966 verheiratet. Er hat einen Sohn und eine Tochter. In seiner Freizeit treibt er gerne Sport (Golf, Tennis, Skifahren), (st)
360
17 Personenbezogene Informationen
Herkunft: Dietmar Kuhnt wurde am 16. Nov. 1937 in Breslau geboren. Seine Familie kam nach dem Krieg in einem Fluechtlingstreck zunaechst nach Bayern und fand 1948 im rheinischen Neuss eine neue Heimat. K.s Vater war dort spaeter Oberstadtdirektor. Ausbildung: Ab 1948 besuchte K. das humanistische Quirinus-Gymnasium in Neuss. Nach dem Abitur (1957) studierte er Rechtswissenschaften an den Universitaeten Koeln und Freiburg. 1961 legte er das Erste, 1966 das Zweite juristische Staatsexamen ab, beide mit Praedikat. Ebenfalls 1966 promovierte er in Freiburg (wiederum mit Praedikat) ueber ein strafrechtliches Thema zum Dr. jur. Mitgliedschaften/Aemter: K. ist Mitglied in mehreren Aufsichts- und Beiraeten, u.a. ist er Aufsichtsratvorsitzender der 'Rheinbraun AG, Koeln, der RWE Energie AG und der RWE Entsorgung AG, beide Essen, sowie der RWE-DEA AG fiier Mineraloel und Chemie. Im Nov. 1997 wurde er zum neuen Moderator des Initiativkreises Ruhrgebiet gewaehlt. Werke: Veroeffentlichungen: K. hat zahlreiche Beitraege, insbesondere auf dem Gebiet des Energiewirtschafts- und Kartellrechts sowie zu atom- und
umweltrechtlichen
Themen, publiziert. Literatur: Lutz Mez: „RWE: ein Riese mit Ausstrahlung" (1996); Dieter Schwer und Wolf Thieme (Hrsg.): „Der glaeserne Riese: RWE - Ein Konzern wird transparent".
Quelle: GENIOS; Datenbank MAPERS
Who's Who In European Business and Industry Kurz hingewiesen sei auf die Sammlung von Biographien des „Who's Who". Im Wirtschaftsbereich dürfte die Datenbank „Who's Who In European Business and Industry" (online bei Lexis-Nexis) einschlägige Bedeutung haben. Im Vergleich zum „Munzinger Archiv" sind die Einträge kürzer; durch eine tabellarische Aufmachung allerdings recht übersichtlich. Angegeben werden: • Name •
Geburtstag, -ort
361
17 Personenbezogene Informationen •
Nationalität
•
Familie
•
Stellung im Unternehmen
•
Unternehmen (Anschrift und Kurzbeschreibung)
•
Karriere
•
Ausbildung
•
Beruf.
17.2 Suche nach personenbezogenen Informationen Personenbezogene Informationen liegen versteckt in den unterschiedlichsten Datenbanktypen vor, und zwar sowohl in den Informationssammlungen der kommerziellen Informationswirtschaft als auch im Internet. Alle in diesem Buch beschriebenen Informationstypen können
potentiell
personenbezogene
Informationen
enthalten.
Entsprechend ist es wichtig, über geeignete Hilfsmittel beim Retrieval zu verfugen. Wir wollen paradigmatisch zwei Werkzeuge skizzieren, eines zum Gebrauch im Internet und eines, das einem kommerziellen Online-Archiv entstammt.
Hilfsmittel im Internet: Switchboard Suchen im Internet beginnen bei den Retrievalsystemen im World Wide Web. Via AltaVista bekommt der Suchende eine lückenlose Liste von URLs, die zu W W W Sites fuhren, in denen der gesuchte Name vorkommt. Wie bei den Unternehmens- oder Produktnamen (s.o. Kap. 13.2, S. 292) erkennt RealNames
gewisse Suchargumente und verweist (über verkaufte Links) auf die
entsprechende Homepage. Eine mit AltaVista
verbundene Firma offeriert eine weitere Dienstleistung zur
Personensuche. Es handelt sich um das Unternehmen Switchboard, ma von Banyan
Worldwide.
Switchboard
eine Tochterfir-
führt zur E-Mail-Adresse und - falls
vorhanden - zur Homepage von Personen. Switchboard
bietet seinen Nutzern die
Möglichkeit, sich selbst einzutragen, und überprüft hiernach die E-Mail-Adresse.
362
17 Personenbezogene Informationen
Weitere Informationen zu AltaVista und Kooperationspartnern sind in der Fallstudie in Kapitel 20.5 zu finden.
Hilfsmittel bei einem Online-Archiv: Dialindex Im Rahmen der Online-Archive der kommerziellen Informationswirtschaft eignen sich zur personenbezogenen Suche vor allem die hostspezifischen Datenbankindices (s.o. Kap. 4.1, S. 93 ff.). So bekommen wir fiir ein Online-Archiv einen Überblick darüber, in welchen Datenbanken dieses Hosts der gesuchte Personenname überhaupt vorkommt. Einer der Hosts mit dem größten Informationsvolumen ist
DIALOG,
seine Indexdatenbank heißt Dialindex (File 411). Die Suche mittels Dialindex durchläuft mehrere Schritte. Nach dem Aufruf der Indexdatenbank ist zunächst festzulegen, in welchen Datenbanktypen überhaupt gesucht werden soll. Zur Wahl stehen entweder alle Datenbanken oder in „Supercategories"
zusammengefaßte
Files,
etwa
„Government",
„Business
Economics", „Company Directories", „Market Research Information", „Newswires" oder „Newspapers" (bzw. hier auch genauer: „European Newspapers" oder „Indiana Newspapers"). Hiernach ist das Suchargument zu formulieren; man achte bei Personennamen auf die unterschiedlichen Reihenfolgen in verschiedenen Feldern (in Volltextfeldem „Vorname Nachname", in Feldern mit Autorennamen umgekehrt „Nachname, Vorname") sowie auf Abkürzungen von Vornamen. Das Suchergebnis wird vom System nach Datenbanknummern geordnet. Über den Befehl „rank files" bekommt man eine nach Häufigkeit sortierte Liste von Datenbanknamen. Ein Beispiel zeigt Abbildung 17.2.
Abb. 17.2: Datenbankliste bei Dialindex Ref
Items
File
N1
137
631 : Boston Globe 1980-1998/Oct 09
N2
99
633: Phil. Inquirerl 983-1998/Oct. 11
N3
94
713: Atlanta J/Const. 1989-1998/Oct. 11
N4
86
632: Chicago TribuneJ985-1998/Oct. 12
Quelle: Dialog
363
17 Personenbezogene Informationen
Im Beispiel von Abbildung 17.2 wäre die Datenbank Boston Globe die für das Suchargument ergiebigste. 137 Datensätze zur Suchfrage werden gefunden. Nach der Recherche im Indexfile 411 muß der Nutzer in die normale Suche wechseln. Er öffiiet entweder alle gefundenen Datenbanken, eine gewisse Teilmenge davon (etwa die ergiebigsten vier) oder auch genau eine. Mit etwas Glück findet man die gewünschten Informationen zur Person, mit Pech erfahrt man, daß es noch weitere Personen gleichen Namens gibt. In diesem Fall muß die Suche durch passende weitere Argumente eingeschränkt werden.
17.3 Informetrische Rangordnungen von Personennamen Wissenschaftlich-technische Leistung und Wirkung Im Kontext des Data Mining bei externen Informationen haben wir die informetrischen Retrievalstrategien kennengelernt. Für unsere jetzigen Zwecke interessieren uns vorrangig die informetrischen Rangordnungen (s.o. Kap. 5.2, S. 137 ff.). Wir wollen wissen, welche Personen in einem Fachgebiet besonders ausgewiesen sind. Hier gibt es zwei unterschiedliche, sich gegenseitig ergänzende Vorgangsweisen: •
die Einschätzung einer Leistung auf einem Fachgebiet (quantifizierbar durch die Anzahl von Publikationen)
•
die Einschätzung einer Wirkung auf einem Fachgebiet (quantifizierbar durch die Anzahl von Zitationen).
Rangordnungen solcher Art sind nur dort durchzuführen, wo publiziert und zitiert wird, also vor allem in den Bereichen Wissenschaft und Technik. Nutzbar sind sie als Entscheidungshilfen beim Aufsuchen von Fachleuten oder als Kriterien bei der Neueinstellung eines Wissenschaftlers. Im Hochschulbereich werden bei der Berufung von Professoren wissenschaftliche Leistung und Wirkung der Bewerber stark beachtet. Entsprechend finden Listen mit Publikations-
und
Zitationsraten
als
Indikatoren
der
Wissenschaftsevaluation
verbreitet Anwendung (vgl. Stock 1995,99 ff.). Zur Einschätzung wissenschaftlicher Wirkung sind wir auf Zitationsdatenbanken angewiesen. Hier sind die Produkte des Institute for Scientific Information einschlägig (s.o. Kap. 16.1. sowie die Fallstudie in Kap. 20.4).
364
17 Personenbezogene Informationen
Die wissenschaftliche Leistung wird durch Publikationen und Patente auf einem Fachgebiet demonstriert. Je nach wissenschaftlich-technischer Disziplin müssen eine oder einige wenige einschlägige Datenbanken ausgewählt werden.
Head Hunting mittels Informetrie Angenommen, ein deutsches Maschinenbauunternehmen sucht für seine FuEAbteilung einen neuen Mitarbeiter, Hauptarbeitsgebiet soll in ernährungswissenschaftlicher Perspektive „Abfüllen von Flaschen" sein. Eine passende Datenbank ist FSTA (Food Science and Technology Abstracts), aufgelegt beim Online-Archiv DIMDI. Der FSTA-Thesaurus drückt das gesuchte Forschungsfeld durch den Deskriptor „bottling" aus.
Abb. 17.3: Rangordnung von Autoren zum Thema „bottling" Rang
Autor
Häufigkeit
1
Kettern W
13
2
Berg F
12
3
Mueller-Spaeth H
9
3
Wenger H
9
5
Stevens B
8
6
Haubs H
6
6
Mernoe E
6
6
Probst W
6
6
Rizzo R
6
N = 1.009 Quelle: DIMDI, File FSTA (entnommen aus: Stock 1992a)
In FSTA suchen wir nach DE=bottling und erhalten insgesamt 1.009 Treffer. Diese Treflfermenge wird mittels des informetrischen Rankingbefehls nach Autoren geordnet. Das Ergebnis ist in Abbildung 17.3 abgedruckt. Für die erstplazierten Autoren
365
17 Personenbezogene Informationen
sind weitere Informationen einzuholen, etwa eine Zeitreihe ihrer Publikationsaktivitäten (um zu sehen, ob der Autor auch aktuell noch am Thema „dran" ist) oder die Angaben zur aktuellen Arbeitsstätte. Mittels dieser Methode könnte ein erfolgreiches „Head-Hunting" eingeleitet werden.
Fazit •
Biographische Datenbanken wie Munzinger
oder Who's
Who In
European
Business and Industry enthalten in der Form eines Dossiers Informationen zu Personen. Leider sind nur wenige Informationen Uber Wirtschaftsmanager enthalten. •
Es gibt sehr viele verstreute Informationen zu einzelnen Personen; relevant ist letztlich nahezu jeder Datenbanktyp. Als problematisch kann sich jedoch die zielgenaue Suche erweisen. Als Hilfsmittel im Internet haben wir den Link sowie die People Search von Switchboard
RealNames-
vorgestellt. In kommerziellen
Online-Archiven eignen sich die hostspezifischen Indexdatenbanken (wie bei DIALOG der File 411 Dialindex) zum Retrieval von Personennamen. •
Wissenschaftlich-technische Leistungen und Wirkungen von Personen lassen sich im Rahmen der Wissenschaftsevaluation durch Publikations- und Zitationsraten (im engen Rahmen gewisser methodischer Grenzen) bestimmen.
•
Durch eine Rangordnung von Autorennamen zu einem eng umrissenen Fachgebiet ergeben sich Hinweise auf ausgewiesene Fachleute. Wir erhalten so eine Informationsbasis für Head-Hunting.
18 Wirtschaftsstatistische Zeitreihen Zeitreihen sind Sammlungen numerischer Werte, geordnet nach der Zeit. So läßt sich zum Beispiel die Zahl der Arbeitslosen in Deutschland zwischen 1960 und 2000 als Zeitreihe mit den jeweiligen jährlichen Durchschnittswerten angeben. Im Wirtschaftsbereich werden die Basiszahlen für die Zeitreihen sowohl durch die amtliche Statistik als auch durch weitere Aktionen von Forschungsinstituten erhoben. Die amtliche Statistik beruft sich auf ihren Gesetzesauftrag; die Befragten müssen Auskunft geben. Die anderen Befragungen sind freiwillig, hier liegen die Rücklaufquoten in der Regel unter 100%. Die Werte der Zeitreihen lassen sich zu unterschiedlichen Aggregationsniveaus verdichten, insofern Werte aus Teilaggregaten zu Ganzheiten zusammengefaßt werden. Ein solches Teilaggregat kann etwa das Volumen des Exports von Etikettiermaschinen von Deutschland nach Japan sein, ein übergeordnetes Aggregat wäre der Export dieser Maschinen aus allen EU-Staaten nach Japan oder der Export aller Maschinenbauerzeugnisse von Deutschland nach Japan. Zeitreihen haben unterschiedliche Periodizität. Variablen können täglich, monatlich, quartalsweise oder jährlich erhoben werden. Von der feineren Erfassung kann man durch Berechnungen zur gröberen gelangen; umgekehrt geht dies natürlich nicht. In der Regel haben Zeitreihen drei inhaltliche Aspekte: •
Region
•
Branche oder Produkt
•
Indikator.
Unser obiges Beispiel bezieht sich demnach auf die Regionen Deutschland und Japan, auf das Produkt Etikettiermaschine und auf den Indikator Exportvolumen. Zeitreihen weisen entweder absolute Zahlen aus (Beispiel: Einkommen eines durchschnittlichen deutschen Haushaltes pro Monat in den Jahren 1990 bis 2000, angegeben in DM des Jahres 1995) oder Indexwerte (hier wird ein Wert auf 100 normiert und alle anderen darauf bezogen). Zum Teil lassen sich bei Zeitreihen saisonale Einflüsse zeigen, die im Jahresrhythmus wiederkehren. Durch statistische Verfahren können solche Verzerrungen herausgerechnet werden. Die entstehenden Zeitreihen weisen dann saisonbereinigte Werte aus.
367
18 Wirtschaftsstatistische Zeitreihen
Bei der Recherche nach Zeitreihen ist der Informationsbedarf auf die Möglichkeiten dieser Informationssammlungen abzustimmen: Um welche Region(en), Branche(n), Indikatoren) handelt es sich? Welches Aggregationsniveau ist gewünscht? Welche Periodizität wird gefordert? Absolut- oder Indexwerte? Saisonbereinigung erforderlich? Trifft keine Zeitreihe diesen Informationsbedarf exakt, so gilt es, andere Zeitreihen zu finden, aus denen sich die gewünschte Zeitreihe errechnen läßt. Gefundene oder errechnete Zeitreihen werden entweder tabellarisch oder graphisch aufbereitet. Das Spektrum der Zeitreiheninformationen ist vielfaltig. Es reicht von Detailinformationen (Anzahl der weinabfullenden Betriebe in Rheinland-Pfalz) bis zu hochaggregierten makroökonomischen Daten (Bruttoinlandsprodukt Deutschlands). Allein die Anzahl der beim deutschen Statistischen
Bundesamt gepflegten Zeitreihen beträgt
rund eine Million. Dieses Kapitel skizziert nur zwei Gesichtspunkte der Zeitreiheninformationen. Da jede Zeitreihe erklärungsbedürftig ist, wollen wir am Beispiel eines konkreten Zahlenwerkes markieren, welches Vorwissen bei der Interpretation dieser Zeitreihe zu beachten ist. Zum andern stellen wir einige Produzenten und Anbieter von Zeitreihendatenbanken vor. Nicht eingehen werden wir auf ökonometrische Verfahren und makroökonomische Modelle, die zwar auf Zeitreihen aufbauen (und damit in den Kontext dieses Kapitels gehören), die aber den Bereich der Informationswirtschaft verlassen (hier sei nur ein Hinweis auf einschlägige Literatur gestattet: Goldrian 1998, Harvey 1994, Harvey 1995, Schlittgen/Streitberg 1994).
18.1 Definition, Datenerhebung und Berechnung einer Zeitreihe Wir wollen uns die Konstruktion einer Zeitreihe genauer ansehen. Es handelt sich hierbei um einen Konjunkturindikator für die deutsche Wirtschaft, erhoben vom ifo Institut für Wirtschaftsforschung in München: das sogenannte „Geschäftsklima". Das Beispiel soll zeigen, daß eine Zeitreihe diverse Voraussetzungen bei Definition, Erhebung und Berechnung hat, daß also umfassendes Vorwissen bei deren Interpretation oder Weiterverarbeitung unbedingt erforderlich ist. Dieser Hinweis ist auch als Warnung zu verstehen, unkritisch an Informationen aus Zeitreihen heranzugehen.
368
18 Wirtschaftsstatistische Zeitreihen
Der Geschäftsklimaindex des ifo Instituts Der „ifo Geschäftsklima-Index" ist ein Frühindikator für die konjunkturelle Entwicklung Deutschlands. Im Gegensatz zu den „harten" Konjunkturindikatoren, wie sie etwa vom Statistischen Bundesamt erhoben werden (Beispiel: Produktionsvolumen), handelt es sich hier um einen „weichen" Indikator, der auf persönlichen Meinungen aufbaut und demnach eine „Stimmungsvariable" repräsentiert. Eingebettet sind die Fragen zur Konjunktur in den monatlich durchgeführten „ifo Konjunkturtest". Diese Befragung verfolgt seit ihrem Beginn (1949) zwei Ziele. Das ifo Institut möchte von den deutschen Unternehmen Informationen über deren Einschätzung der konjunkturellen Lage und Entwicklung auf ihren Märkten erhalten. Dafür bekommen die Unternehmen Informationen über die Entwicklung auf ihren Märkten (derzeit über rund 500 Produktgruppen). Dieses gleichzeitige Nehmen und (zum Teil exklusive) Geben von Informationen erklärt die hohe Bereitschaft der Unternehmen,
regelmäßig
an
den
Befragungen
teilzunehmen.
Rund
7.000
Unternehmen in West- und Ostdeutschland werden befragt; kommt der ausgefüllte Fragebogen nicht rechtzeitig zurück, wird telefonisch nachgehakt. Nicht alle Wirtschaftsbereiche sind durch den ifo Konjunkturtest abgedeckt. Erhoben werden die Einschätzungen in der Industrie, in der Bauwirtschaft und im Groß- und Einzelhandel. Landwirtschaft und weite Bereiche des tertiären Sektors sind demnach nicht vertreten. Die Einschätzung der Wirtschaftskonjunktur kann möglicherweise von kurzfristigen störenden Einflüssen verzerrt sein. Die Teilnehmer bemühen sich daher, saisonale Schwankungen ebenso wie irregulär hohe oder niedrige Ergebnisse nicht auf ihre Bewertungen durchschlagen zu lassen. Die Urteile geben „deshalb zuverlässiger als andere Indikatoren monatlich Auskunft über den augenblicklichen Stand der Konjunktur und die aktuelle Entwicklungsrichtung" (Lindlbauer 1989, 123). Der Fragebogen (einen Ausschnitt zeigt Abbildung 18.1) ist so konzipiert, daß der Zeitaufwand für das Ausfullen so gering wie möglich gehalten wird. Um dies zu garantieren, „werden •
lediglich Größen abgefragt, über die die Geschäftsleitung ohnehin laufend unterrichtet sein muß;
•
die möglichen Antworten - meist drei - bereits vorgegeben, die richtige ist nur noch anzukreuzen;
18 Wirtschaftsstatistische Zeitreihen •
369
die Fragebögen so kurz wie möglich gehalten, meist genügt eine DIN A4-Seite" (ebd., 125).
Abb. 18.1: ifo Konjunkturtest - Fragebogen (Ausschnitt) ifo Konjunkturtest Verarbeitendes Gewerbe Alte Bundesländer Die Fragen betreffen das unten eingedruckte Erzeugnis (nachstehend bezeichnet mit XY). Zutreffendes Kästchen bitte kennzeichnen. Berichtsmonat: April 1997 Bereich: Beurteilung und Entwicklung 1)
Wir beurteilen unsere Geschäftslage für XY z.Z. als gut
•
befriedigend (saisonüblich)
(1) (
schlecht
)
(2)
Q
(3)
...[gekürzt]...
Pläne und Erwartungen 11)
Unsere Geschäftslage für XY wird in den nächsten 6 Monaten in konjunktureller Hinsicht - also unter Ausschaltung rein saisonaler Schwankungen eher günstiger etwa gleich bleiben eher ungünstiger
Q^j
(1) (
) (
(2) )
Quelle: ifo Institut für Wirtschaftsforschung (stark gekürzt)
(3)
18 Wirtschaftsstatistische Zeitreihen
370
Die Motivation zu antworten liegt sicherlich in der Rückkopplung der Informationen an die Unternehmen zurück begründet. „Der raschen Antwort folgt in jedem Monat mit geringer Verzögerung ... der aktuelle Bericht, der so tief gegliedert ist, wie es die Zahl der Teilnehmer für einzelne Märkte zuläßt" (ebd., 125). Im „ifo Konjunkturspiegel" lassen sich aktuelle Entwicklungen auf den Märkten der Abnehmer, Konkurrenten oder Lieferanten ablesen. Die Einzelmeldungen der Unternehmen werden aufbereitet. Den Angaben wird in Abhängigkeit von der Unternehmensgröße ein unterschiedliches Gewicht zugeordnet. „Schließlich trägt ja ein großes Unternehmen auch mehr zur Gesamtleistung bei als ein kleines" (ebd., 125). Die Einzelangaben eines Unternehmens werden mit einem unternehmensspezifischen Wert multipliziert, wobei der Multiplikator in Abhängigkeit von der Branche und der Beschäftigtengrößenklasse der Firma festgelegt ist. Folgendes Beispiel soll das Vorgehen verdeutlichen (vgl. ebd., 126):
Betrieb Meldung
Gewicht
Verteilung der gewichteten Antworten gut
befriedigend
schlecht
6
A
befriedigend
6
B
gut
9
9
C
gut
3
3
D
schlecht
2
2
Summe:
20
12
6
2
Prozent:
100%
60%
30%
10%
Bei der Aggregation zu Produktgruppen, zu Branchen und so weiter bis hin zu den beiden umfassenden Geschäftsklima-Indikatoren für die west- und ostdeutsche Wirtschaft werden Salden berechnet. Nicht in Berechnung gehen die mittleren Werte ein, also „befriedigend" bei der derzeitigen Geschäftslage bzw. „eher gleich" bei der künftigen Geschäftslage. Solche Meldungen gelten als „neutral" und beeinflussen das Ergebnis der Lageeinschätzung nicht. Die beiden anderen Werte werden addiert. Dabei erhält der (bereits gewichtete) Prozentwert bei „gut" bzw. „eher günstiger" ein positives Vorzeichen und der Prozentwert bei „schlecht" bzw. „eher ungünstiger" ein negatives. In unserem Beispiel ergibt sich
18 Wirtschaftsstatistische Zeitreihen
371
+ 6 0 - 1 0 = +50. Das ifo Geschäftsklima besteht aus den beiden Komponenten der Einschätzung der gegenwärtigen Geschäftslage (Frage 1 im Konjunkturtest-Fragebogen) und der Einschätzung der Geschäftslage im Laufe des nächsten halben Jahres (Frage 11). Aus beiden Salden wird das geometrische Mittel berechnet, also die beiden Saldenwerte multipliziert und aus dem Produkt die Quadratwurzel gezogen. Die beiden Komponenten des Geschäftsklimas sowie auch das geometrische Mittel kann zwischen den Extremwerten +100 und -100 schwanken. +100 wird erreicht, wenn jeweils alle Befragten positiv votieren; -100, wenn alle die Geschäftslage negativ einschätzen. Es gilt, ein Spezialproblem zu benennen. Da es nicht möglich ist, eine Wurzel aus einer negativen Zahl zu ziehen, addiert man zu beiden Saldenwerten die Konstante 200 und zieht die 200 vom Ergebnis wieder ab. Damit kann man nun zwar problemlos rechnen, kommt aber mit der Intuition in Konflikt. Wenn etwa die beiden Saldenwerte +50 und -50 sind, erwartet man als Mittelwert 0, ebenso bei +100 und -100. Es ergeben sich aber -6 (bei +50/-50) bzw. -27 (bei +100/-100). Das geometrische Mittel weicht umso mehr vom arithmetischen Mittel ab, je mehr sich die beiden Salden unterscheiden. Der Rechenweg bei +50/-50 lautet: +50 + 200 = 250 -50 + 2 0 0 = 150 250 * 150 = 37.500 V37.500 « 194 1 9 4 - 2 0 0 = -6.
Darstellung der Zeitreihe: Salden- und Indexwerte Die Zeitreihen mit den geometrischen Mittelwerten der Salden zeigt Abbildung 18.2. Danach verlief die Einschätzung in Westdeutschland zwischen Januar und Mai 1999 mit Werten zwischen -13 und -16 nicht erfreulich, um sich ab Juni stark zu verbessern (bis auf -4,7). In Ostdeutschland verläuft die Entwicklung anders; die Voten sind durchgehend nicht so negativ geprägt wie im Westen, dafür fehlt der Optimismus der Sommermonate.
372
18 Wirtschaftsstatistische Zeitreihen
Abb. 18.2: ifo Geschäftsklima der gewerblichen Wirtschaft 1/99 - 8/99 - Salden 6/99
7/99
8/99
-13,1 -15,8 -14,8 -15,9 -14,6 -9,5
-8,1
-4,7
1/99
2/99
3/99
4/98
5/99
Westdeutschl. Ostdeutschl.
-10,4 -10,3
-9,8 -15,0 -11,8 -12,1 -13,9 -12,3
Verarbeitendes Gewerbe, Baugewerbe, Groß- und Einzelhandel Quelle: ifo Institut für Wirtschaftsforschung. URL: http://www.ifo.de/aktuell/gk/gsk. htm (24.9.99)
Das ifo Institut wendet auf seine Zeitreihen ein Verfahren der Saisonbereinigung an und bezieht die einzelnen Saldenwerte auf ein Basisjahr (derzeit ist dies der Mittelwert des Jahres 1991). Der Wert 100 heißt nun, daß der entsprechende Wert genau mit dem 1991er Durchschnittswert übereinstimmt. In Abbildung 18.3 sind die Indexwerte unserer schon bekannten Zeitreihen abgetragen.
Abb. 18.3: ifo Geschäftsklima der gewerblichen Wirtschaft 1/99 - 8/99 - Indexwerte 1/99
2/99
3/99
4/98
5/99
6/99
7/99
8/99
91,1
89,8
90,3
89,8
90,5
93,0
93,7
95,3
Westdeutschl. Ostdeutschl.
106,0 106,1 106,4 103,6 105, 4 105,2 104,3 105,1
Verarbeitendes Gewerbe, Baugewerbe, Groß- und Einzelhandel saisonbereinigte Werte Indexwerte : Westdeutschland (1991 = 100) Indexwerte : Ostdeutschland (1991 = 100) Quelle: ifo Institut für Wirtschaftsforschung. URL: http://www.ifo.de/aktuell/gk/gsk. htm (24.9.99)
373
18 Wirtschaftsstatistische Zeitreihen
In Westdeutschland liegen wir Anfang des Jahres 1999 rund 10 Indexpunkte unter dem Wert des Basisjahrs und verbessern uns bis August auf einen Indexwert von ca. 95. In Ostdeutschland erhalten wir ein - im Vergleich zu 1991 - durchgehend positives Ergebnis: Alle Werte liegen über 100, z.T. über 105. Saldenwerte und Indexwerte geben demnach nicht dieselbe Information - es ist beim Index stets wichtig zu berücksichtigen, welches die Basis ist, womit man also vergleicht.
18.2 Informationsressourcen mit wirtschaftsstatistischen Zeitreihen Bei den Informationsressourcen mit Zeitreiheninformationen unterscheiden wir zwei Arten: zum einen solche Informationsmittel, die ausschließlich die Zahlenwerke (mit Titel, ggf. angereichert durch inhaltserschließende Informationen) anbieten, und solche, die zusätzlich zu den „reinen" Zahlen Weiterverarbeitungssoftware, etwa mit statistischen und ökonometrischen Funktionen bereitstellen. Als Beispiel fiir reine Zahlenwerke skizzieren wir das Angebot von DSI Data Service & Information,
als
Beispiel fiir einen ökonometrisch orientierten Host stellen wir DRI von Standard &
Poor 's vor.
DSI Data Service & Information Das Unternehmen DSI Data Service & Information
in Rheinberg ist spezialisiert auf
die Publikation statistischer Informationen, und dies über Printkanäle, CD-ROM und online, letzteres in Kooperation mit dem Host GENIOS. DSI erstellt in Kooperation mit anderen Institutionen einige der Datenbanken selbst, andere werden im Auftrag der Institutionen verteilt. Zu den Datenlieferanten von DSI gehören u.a.: •
Eurostat
•
International Bank for Reconstruction and Development (Weltbank)
•
Organization for Economic Co-Operation and Development (OECD)
•
Statistisches Bundesamt
•
Statistics Canada („World Trade Database")
•
United Nations (UN)
•
World Trade Organization.
374
18 Wirtschaftsstatistische Zeitreihen
Als Zusammenschnitt diverser Quellen produziert DSI das „International Statistical Yearbook" auf CD-ROM. Die über eine Million Zeitreihen decken weite Bereiche internationaler und deutscher ökonomischer und sozio-ökonomischer Themen ab. Anhand der OECD-Datenbank „Main Economic Indicators" wollen wir eine Recherche nach einer Zeitreihe vorfuhren. Jede OECD-Zeitreihe ist kodiert, wobei der Code folgende Struktur hat:
XX / XXXX / X / XX.
Die vier Bereiche des Codes entsprechen vier Sub-Codes: 1 2
XX
Land
XXXX
3 4
Indikator X
Maß XX
Datentyp.
Für die Sub-Codes existieren jeweils kleine Klassifikationssysteme. Abbildung 18.4 zeigt zur Verdeutlichung Ausschnitte aus den Systemen.
Abb. 18.4: OECD - Statistiken. Klassifikationssysteme Sub-Code 1: Country 00
OECD - Total
01
OECD-Europe
02
European Union Member Countries (EU 15)
... [gekürzt]... 12
Germany
13
Western Germany
14
France
... [gekürzt]... 99
World
18 Wirtschaftsstatistische Zeitreihen Sub-Code 2: Indicator National Accounts GDP at current prices 1001 Total GDP National Income 1011 Personal Income 1013 Corporate Profits ... [gekürzt]... Unemployment Umemployment Rate 4111 Registered as % Labour Force 4113 Survey-based as % Civil Labour Force 4115 Registered as % Dependent Labour Force 4117 Standardised Unemployment Rate ... [gekürzt]... Sub-Code 3: Measure A
Sum of component periods
B
Monthly level
C
Quarterly level
... [gekürzt]... O
National currency, sum of components
P
Index made on national currency series
Sub-Code 4: Type of data SA
Seasonally adjusted
Quelle: DSI. URL: http://www.dsidata.com/_oscplan/meiosc.htm (28.9.99)
375
376
18 Wirtschaftsstatistische Zeitreihen
Je nach Variante der Datenbank (CD-ROM- oder eine der Online-Versionen) kann man entweder mit den Notationen der Klassifikation oder mit den umgangssprachlichen Bezeichnungen suchen. Bei GENIOS ist das Klassifikationssystem 2 (Indikatoren) als Ganzes hinterlegt; zusätzlich ist die Suche nach den natürlichsprachigen Benennungen möglich. Wir suchen nach der Arbeitslosenrate in Deutschland ab der 70er Jahre. Da der Eintrag „Deutschland" ftir die gesamte Bundesrepublik ab 1991 reserviert ist, müssen wir mit „Westdeutschland" arbeiten, erhalten somit aber auch nach 1991 ausschließlich Werte fur das Gesamt der alten Länder. Im Sub-Code 2 gelangen wir über „Unemployment" und „Unemployment Rate" zu den vier möglichen Indikatoren der Arbeitslosenraten. Wir haben „Registered as % Labour Force" ausgewählt. Die Zeitreihe ist in Abbildung 18.5 abgedruckt. Möchte der Nutzer die Zahlen weiterverarbeiten, so müssen die Angaben entweder in ein Tabellenkalkulations- oder in ein Statistikprogramm importiert werden.
Abb. 18.5: OECD - Main Economic Indicators. Beispieldatensatz Erscheinungsdatum 10.08.1999 OECD, Paris (C.), Main Economic Indicators August 1999 / Unemployment / Unemployment Rate Indicator:
UNEMP CIVIL LABOUR FORCE SA\Quantum SA / Unemployment Rate \ Registered as % labour force\Total
Unit:
%
Country:
Western Germany
Source:
OECD, Paris (C.), Main Economic Indicators August 1999 Years
Values
1972
0,9
1973
1,1
1974
2,2
...[gekürzt]... 1990
6,4
18 Wirtschaftsstatistische Zeitreihen 1991
5,7
1992
5,9
1993
7,4
1994
8,3
1995
8,3
1996
9,1
1997
9,8
1998
9,3
377
Deskriptoren: Unemployment / Unemployment Rate Land: Western Germany Quelle: GENIOS; DSI
Zeitreihenanalysen mit DRl Im Bereich der sog. „historischen Daten" ist das Angebot von DRl durchaus dem von DSl ähnlich. Der grundlegende Unterschied liegt in der Bereitstellung statistischer und ökonometrischer Software zur Zeitreihenanalyse. DRl (mit Sitz in Lexington, MA) ist eine Abteilung von Standard & Poor 's, das wiederum zu The McGraw-Hill Companies gehört. Die Datenlieferanten von Standard & Poor's DRl sind die jeweiligen nationalen statistischen Ämter oder Zentralbanken. Neben den amerikanischen ökonomischen Daten sind die wirtschaftsstatistischen Angaben der wichtigsten Industrieländer („G10-Länder") sowie diverser weiterer Länder (darunter der aufstrebenden Volkswirtschaften wie Südafrika oder Taiwan und der ehemaligen sozialistischen Staaten) enthalten. Deutsche Quellen sind Zeitreihen der Bundesbank Instituts fiir Wirtschaftsforschung
und des
Deutschen
(DIW).
Zentrales Anliegen der Zeitreihenanalyse ist die Erklärung einer wirtschaftlichen Entwicklung sowie deren Prognose. Standard & Poor 's DRl bietet als Hilfsmittel seine Software „Econometric Programming System" (EPS) an. EPS umfaßt folgende Funktionen: •
Kreation ökonometrischer Modelle
378
18 Wirtschaftsstatistische Zeitreihen
•
Kreation von Finanzmodellen
•
Regressionsanalyse
•
statistische Analysen (darunter neben deskriptiver und nicht-parametrischer Statistik auch Verfahren zu Saisonbereinigung)
•
Graphik
•
Datenmanagement (zur Verwaltung von Zeitreihen).
Fazit •
Zeitreihen sind Sammlungen numerischer Werte, geordnet nach der Zeit. Meist sind Zeitreihendatenbanken durch Klassifikationssysteme inhaltlich erschlossen. Kategorien sind regionale Aspekte, Produkte bzw. Branchen sowie ökonomische oder sozio-ökonomische Indikatoren. Zeitreihen gibt es in unterschiedlicher Periodizität, auf verschiedenen Aggregationsniveaus, als Indexwerte; ggf. sind sie saisonbereinigt.
•
Der Informationsbedarf nach einer Zeitreihe wird entweder ausschließlich durch das Finden konkreter Zeitreihen oder durch das Umrechnen anderer Zeitreihen befriedigt.
•
In der Regel reicht die „reine" Präsentation nicht aus. Gefordert ist vielmehr eine Zeitreihenanalyse zur Erklärung und Prognose eines ökonomischen Sachverhalts.
•
Jede Zeitreihe erfordert ein spezifisches Hintergrundwissen zur Definition der Zeitreihe, zur Erhebung und der Verarbeitung. Unser Beispiel war der Geschäftsklima-Indikator des i/o Instituts für
•
Wirtschaftsforschung.
Die Informationswirtschaft kennt mehrere Anbieter elektronischer Zeitreiheninformationen. Wir haben als Beispiel für einen Verlag mit „reinen" Zahleninformationen DSl Data Service & Information vorgestellt. Im Gegensatz dazu bietet Standard & Poor's DRI neben den Zahlen auch ökonometrische bzw. statistische Software zur Weiterverarbeitung an.
19 Integration externer Informationen in das betriebliche Informationssystem
19.1 Das „gläserne" Unternehmen? Wie komplett sind die Informationen in elektronischen und konventionellen Informationsmitteln? Wir wollen dieser Frage am Beispiel der Unternehmensinformationen nachgehen. Sammeln wir zunächst die relevanten Informationstypen! An betriebswirtschaftlichen Fakten über Unternehmen (Kap. 11) liegen folgende Datenbanktypen vor: •
Kurzdossiers mit Grunddaten
•
Handelsregistereintragungen
•
Bilanzen
•
Zahlungsgewohnheiten (Indikatoren auf Bonität)
•
Produkte (mit Schnittstelle zum E-Commerce)
•
Unternehmensverflechtungen und Mergers & Acquisitions
•
Börsennotierungen.
Außerhalb der i.e.S. betriebswirtschaftlichen Informationen sind weitere Daten über Unternehmen recherchierbar: •
Brokerberichte (Kap. 9.3)
•
Agenturmeldungen über das Unternehmen (Kap. 10.1)
•
Presseberichte (aus Zeitungen, Newsletter und Zeitschriften) über das Unternehmen (Kap. 8; 10.2; 10.3)
•
Medienpräsenzreports (Kap. 10.4)
•
Kooperationsangebote (Kap. 12.2)
•
Selbstdarstellungen des Unternehmens u.a. in Geschäftsberichten oder Präsentationen im World Wide Web (Kap. 13)
•
Verwicklung in juristische Angelegenheiten (Kap. 14)
•
Patente, Marken und andere Schutzrechte des Unternehmens (Kap. 15)
380 •
19 Integration externer Informationen wissenschaftlich-technische Fachliteratur von Mitarbeitern (Kap. 16.2).
Zum Teil spiegeln die Informationen die Vergangenheit eines Unternehmens wider. So weisen etwa Bilanzinformationen stets zeitlich „nach hinten", d.h. aber auch, daß sie den aktuellen Stand ggf. nur unzureichend abbilden. Kooperationsangebote sagen demgegenüber etwas über gegenwärtige Absichten aus. Patente, die gerade abgeschlossene Forschungs- und Entwicklungsarbeiten beschreiben, berichten möglicherweise etwas Uber die Zukunft, insofern aus den FuE-Ergebnissen neue Produkte oder neue Prozesse entstehen können. Hieraus abgeleitete Innovationsindikatoren weisen so zeitlich „nach vorne". Wenn wir die Fülle an unternehmensspezifischen Informationsquellen betrachten, stellt sich zwangsläufig die Frage nach dem „gläsernen" Unternehmen (vgl. Münch 1995). Ist wirklich jede Information über eine Firma durch Quellen der Informationswirtschaft recherchierbar? Die Antwort ist eindeutig: nein. In einer umfassenden Studie zur Informationsfiille über Firmen stellt Rebecca Corsten fest: „Das gläserne Unternehmen existiert nicht. ... Dafür existieren noch immer zu viele schwarze Flecken" (Corsten 1999, 43). Die Informationsfülle korreliert mit der Unternehmensgröße. Gemäß Corsten gilt tendenzweise, , j e kleiner ein Unternehmen, desto größer werden (prozentual) die Flecken. Die großen Unternehmen kann man zwar nicht als gläsern bezeichnen, aber sie liegen mittlerweile unter einem sehr dünnen Schleier" (ebd.). Informationen zu kleinen Unternehmen sind demnach in der Regel nur unvollständig zu erheben; bei großen Unternehmen nimmt nicht nur die Zahl der Informationen zu, auch die Qualität verbessert sich. Ein „komplettes" Bild eines Großunternehmens ist allerdings auch nicht möglich. Übrig bleibt immer ein unbekannter Rest an Informationen; vollkommene Information (und damit eine Entscheidung unter Sicherheit) gibt es im Wirtschaftsleben nicht. Aber gerade die „nicht-perfekte" Information stimuliert ja zu kreativem unternehmerischen Handeln. Das „Stimulanz" Information befriedigt im Unternehmen unterschiedliche Bedarfe. Wir können unterscheiden: •
den einmaligen, ad-hoc formulierten Informationsbedarf
•
einen über einen Zeitraum konstanten Informationsbedarf
•
den Bedarf an Frühwarninformationen.
19 Integration externer Informationen
381
19.2 Befriedigung des Ad-hoc-Informationsbedarfs durch retrospektive Recherchen
Wissenslücken und Entscheidungsvorbereitungen Sporadisch tritt Informationsbedarf immer dann auf, wenn in gewissen „kritischen Situationen" bewußt wird, daß die informationelle Basis für geplante Aktionen zu schmal ist. In Anknüpfung an Kapitel 1 (s.o. S. 32) sind solche „kritischen Situationen" •
Entscheidungsvorbereitungen und
•
Wissenslücken.
Wissenslücken sind nicht negativ zu verstehen; es geht vielmehr darum, bei einem Projekt die - im globalen Maßstab - bekannten Informationen zusammenzutragen. Solche Projekte entstammen diversen Bereichen, angefangen bei neuen Forschungsaufgaben über die Einführung neuer Betriebsführungsmethoden
oder
Modifikationen an der Infrastruktur bis hin zum Erschließen neuer Märkte. Und hier kann ein Unternehmen nicht alles wissen: Die „Wissenslücken" sind demnach eine notwendige Erscheinung. Wichtig ist, daß man sich die Wissenslücken überhaupt deutlich macht und entsprechend reagiert. Als Warnung sei an Erfahrungen mit Patenten am Deutschen Patent- und Markenamt erinnert (s.o. S. 308)! 1997 wurden rund 75.000 Patente angemeldet, aber nur 16.000 erteilt. Das heißt: Für ca. drei Viertel aller Patentanmeldungen wurde entweder gar kein Prüfantrag gestellt oder das Patent wurde nicht erteilt. Man kann dabei unterstellen, daß ein Großteil der „durchgefallenen" Patentanträge an der Neuheit gescheitert sind. Hätten die Erfinder oder deren Arbeitgeber vor Projektbeginn eine umfassende Neuheitsrecherche durchgeführt, wären die Forschungs- und Entwicklungskosten gespart worden und man hätte etwas anderes, wirklich Neues, angehen können. Wissenslücken treten im operativen Geschäft genauso auf wie bei taktischen oder strategischen Entscheidungen. Letztlich bedarf jede Entscheidung einer Fundierung durch Wissen - egal, ob dieses aus internen oder externen Quellen entstammt. Wenn etwa angedacht wird, ein Unternehmen zu übernehmen, müssen notwendigerweise alle Informationen über diese Firma (die wir im vorherigen Abschnitt aufgelistet haben) zusammengetragen werden.
382
19 Integration externer Informationen
Aufgabe der betrieblichen Informationswirtschaft ist es, (möglichst) alle Informationen, die die externen Informationsressourcen bereitstellen, zu durchsuchen - und die relevanten zu finden. Es geht bei der Befriedigung des ad-hoc auftretenden Informationsbedarfs (im Sinne von Kapitel 1, S. 23 ff.) um die Aufgabe der Informationsvermittlung.
Retrospektive Recherche Die adäquate Tätigkeit beim ad-hoc Informationsbedarf ist die einer retrospektiven Recherche (s.o. S. 117). Ein Informationsbedarf wird zunächst so exakt wie möglich umrissen. Der Recherchierende - wenn dies nicht der Endnutzer selber ist - muß verstehen, um was es überhaupt geht. Ggf. kann eine Proberecherche nützlich sein, um die Vorverständnisse des eigentlichen Nutzers und des Rechercheurs aufeinander abzustimmen. In Abhängigkeit von der Informationsquelle ist der Informationsbedarf in ein Suchargument zu übersetzen (und zwar für jede Informationsressource ggf. anders). Hilfsmittel sind Klassifikationssysteme, Thesauri und weitere Dokumentationsmethoden. Alle Retrievalmethoden - einschließlich des informetrischen Retrievals - und alle Informationsquellen sind zu berücksichtigen. Es werden so viele unterschiedliche Quellen angesprochen, wie nötig sind, den Informationsbedarf zu befriedigen („Berrypicking", s.o. S. 127). Dieser Vorgang kann in Rücksprache mit dem Endnutzer möglicherweise einige Male wiederholt werden. Liegen unter den gefundenen Informationen bibliographische Nachweise vor, so sind die Volltexte zu beschaffen. Ergebnis einer retrospektiven Recherche ist in der Regel ein Reader mit allen zur Lösung des Informationsproblems einschlägigen Dokumentationseinheiten. Je nach Nutzertyp sind die Informationen im Reader weiter aufzubereiten. Ein Vorstand wird kaum einen Reader von 200 Seiten durcharbeiten wollen, ihm genügt eine Zusammenfassung des Wichtigsten (optimal mit Abbildung) auf wenigen Seiten. Nach der Art der Aufbereitung der recherchierten Informationen unterscheidet Ralph Schmidt vier Niveaustufen: •
standardisierte Informationsdienstleistung
•
modifizierende Informationsdienstleistung
•
qualifizierende Informationsdienstleistung
•
evaluierende Informationsdienstleistung (vgl. Schmidt 1990,450 ff.).
19 Integration externer Informationen
383
Standardisierte Dienste bieten eine „Standardrecherche" in gewissen Bereichen an. Da Informationsbedarfe hochspezifisch sind, ist ein Zuschneiden der Informationsdienste auf die Kundeninteressen nahezu immer notwendig, Standarddienste haben kaum eine Bedeutung. Modifizierende Informationsdienste passen recherchierte Informationen den Nutzerbedürfnissen in formaler Hinsicht an, stellen also den Reader in einer gewissen Struktur zusammen (etwa: Kapiteleinteilung, Register), „ohne die Inhalte der Informationen wesentlich zu verarbeiten oder zu transformieren" (Schmidt 1990, 451). Im Unterschied dazu ändern die qualifizierenden Dienste auch den Inhalt, indem sie die zentralen Aussagen der recherchierten Informationen verdichten. „Typische Produkte dieser Form funktionaler Dienste sind Expertisen, Dossiers, Fortschrittsberichte oder Übersichtsstudien, die die Resultate umfangreicher Informationsrecherchen systematisieren, zusammenfassen, gewichten und dem Wissensstand des Klienten entsprechend aufbereiten" (ebd., 451). „Informationsdienstleistungen, die dem Nutzer die problembezogene Bewertung und anwendungsorientierte
Transformation
von
nachgefragten
Informationen
abnehmen,
können als evaluierende funktionale Dienste bezeichnet werden" (ebd., 452). Hier wird eine Grenze der Informationswirtschaft erreicht; wir befinden uns bereits im Grenzbereich zu Beratungsdienstleistungen von Consultants. Drei Modelle sind denkbar, die Informationsvermittlung zu organisieren: •
Outsourcing der Informationsvermittlung (Informationsbroker,
Bibliotheken,
Consultants) •
Informationsvermittlung durch spezielle „Informationsvermittlungsstellen"
•
Informationsvermittlung durch Endnutzer.
Externe Lösung: Informationsbroker, Bibliotheken und Unternehmensberater Lohnt für ein Unternehmen der Aufbau einer betrieblichen Informationswirtschaft nicht, so kann es beim Ad-hoc-Informationsbedarf im Rahmen einer externen Lösung entweder auf private Broker oder Bibliotheken bzw. auf Unternehmensberater zurückgreifen. Diese externe Lösung ist nur dann sinnvoll, wenn ein Unternehmen nur wenig Informationsbedarf artikuliert - und dies dürfte nur selten der Fall sein. Gemäß Michael Klems recherchiert „der selbständige und freie Informationsvermittler ... im Kundenauftrag nach Informationen. Der freie Informationsvermittler hat einen hohen Qualitätsanspruch an die Informationsquellen, da diese die Basis seines
384
19 Integration externer Informationen
Unternehmens sind. Liefert er schlechte Informationen ab, so verliert er möglicherweise einen guten Kunden. Als eigenständiger Unternehmer muß der freie Informationsvermittler seine Vermarktung selber vornehmen. Er ist für sich und sein Unternehmen verantwortlich" (Klems 1994, 8). Auch große Bibliotheken bieten Recherchen an. Ein Beispiel ist die StadtBibliothek Köln
mit einer
Informationsvermittlungsstelle (vgl. Daniel
1998) und
einem
„Express"-Lieferservice für Volltexte (vgl. Holtz 1998). Bibliotheken arbeiten in der Regel kostengünstiger als private Broker. Bei Öffentlichen Bibliotheken wie der StadtBibliothek Köln erklärt sich dies mit deren Auftrag der regionalen bzw. lokalen Wirtschaftsförderung. Unternehmensberater bieten ihre Beratungsdienste auch bei Informationsproblemen, meist in Zusammenhang mit anwendungsbezogenen Problemen (etwa: Umstrukturierung der Firma) an. Die Recherchen nach externen Informationen werden über die (meist sehr gut ausgestatteten) Informationsvermittlungsstellen abgewickelt, die Evaluation der Informationen geschieht durch fachlich ausgewiesene Berater. Je nach dem geforderten Niveau der retrospektiven Recherche kommen unterschiedliche externe Dienstleister infrage. Bibliotheken dürften ausschließlich für die standardisierte oder die modifizierende Informationsdienstleistung zuständig sein. Die privaten Broker bieten modifizierende und qualifizierende Dienste an; die Consultants letztlich agieren ausschließlich im Bereich der evaluierenden Informationsdienstleistungen.
Interne Lösung I: Informationsvermittlung Im theoretischen Modell der betrieblichen
Informationswirtschaft arbeiten
die
Quellen des unternehmensinternen Wissens und die externen Informationsressourcen eng zusammen (s.o. S. 28). Dies legt nahe, auch ad-hoc Informationsbedarfe durch eine innerbetriebliche Lösung zu befriedigen. Eine, m.E. aber suboptimale Lösung ist das Schaffen einer eigenständigen Stelle für Informationsvermittlung. Je nach Nutzerbedarf recherchiert diese Stelle in externen und internen Informationsressourcen und bereitet die gefundenen Informationen auf. Vorteil einer solchen zentralen Lösung ist das nur einmalige Vorhalten der technischen Infrastruktur sowie des informationswirtschaftlichen Know-how. Da aber - an der Schwelle zur Informationsgesellschaft - j e d e r Arbeitsplatz, der EDV benötigt, diese auch installiert hat, ist das Argument der spezifischen technischen Infrastruktur nicht mehr zu halten. Wir
19 Integration externer Informationen
385
können davon ausgehen, daß die meisten Arbeitsplätze über PC und Zugang zum unternehmensspezifischen Intranet und zum Internet verfugen. Nachteil der zentralen Lösung ist das „Abschneiden" der Endnutzer von „ihren" Informationsressourcen. Der Nutzer weiß am besten, was er benötigt und wann er die Informationen braucht. Allerdings fehlt ihm die informationswirtschaftliche Expertise.
Interne Lösung II: Endnutzerkonzept und Informationsvermittlung Es ist demnach nicht möglich, eine völlig dezentrale Lösung zu verwirklichen, wo ausschließlich der Endnutzer recherchiert. Erfolgversprechend ist vielmehr eine Mischform mit zentralen und dezentralen Elementen: •
dezentral: Endnutzer fuhrt einfache Recherchen in ausgewählten Informationsressourcen selber durch (Endnutzerkonzept)
•
zentral: „Schaltstelle" der innerbetrieblichen Informationswirtschaft mit der Aufgabe, die Informationsübermittlungen im Unternehmen zu organisieren.
Der Endnutzer wird dabei in „seinen" Informationsressourcen geschult. Das Basiswissen an Retrievalbefehlen dürfte für jedermann zumutbar sein. Die „Schaltstelle" versteht ihre Aufgabe hier ausschließlich im Coaching, im Betreuen der Endnutzer bei Problemen oder bei technischen, organisatorischen bzw. inhaltlichen Neuerungen. „Schwierige" Recherchen, etwa solche zum Stand der Technik (falls Patentanmeldungen geplant sind), die das Ansprechen diverser Datenbanken betreffen oder die auf informetrischen Befehlen beruhen, können weiterhin zentral abgewickelt werden. Was „schwierig" und was „einfach" ist, dürfte nicht verbindlich festzulegen sein; es hängt von der informationswirtschaftlichen Kompetenz der Mitarbeiter eines Unternehmens und von der betreffenden Schulung ab. Für die Befriedigung des ad-hoc Informationsbedarfs durch retrospektive Recherchen bedarf es demnach weniger eines professionellen InforrnationsvmwViA?«' im Unternehmen, sondern eines Informationsierafers. „Wenn in absehbarer Zeit durch eine Vereinfachung der Speicher- und ZugrifTstechniken für elektronische Informationsbestände mehr und mehr Informationsnutzer Online-Fachinformation direkt anfragen, dann könnten online-geschulte Informationsvermittler und Information Broker überflüssig werden; für die effiziente Nutzung der gesamten verfügbaren Informations-
19 Integration externer Informationen
386
ressourcen bleiben beratende Informationsfachleute und Informationsdienstleistungsunternehmen jedoch auch weiterhin unentbehrlich" (Schmidt 1990,459).
19.3 Befriedigung eines andauernden Informationsbedarfs durch Profildienste und SDI Ist die retrospektive Recherche in der Regel ein Pull-Service (s.o. S. 53), so liegt bei der Befriedigung eines andauernden Informationsbedarfs ein Push-Dienst vor. Der Informationsbedarf eines Mitarbeiters oder einer Abteilung bleibt über einen gewissen Zeitraum konstant. Die Lösung der betrieblichen Informationswirtschaft für dauerhafte Informationsbedarfe ist der Profildienst bzw. SDI
(Selective
Dissemination of Information; s.o. S. 117 f.). Es gibt drei organisatorische Lösungen von Profildiensten: •
Standardprofile (rein externe Lösung)
•
persönliche Profile in externen Systemen (individuell erarbeitete Profile, die auf externe Informationsressourcen angewandt werden)
•
persönliche Profile in einem internen System (individuell erarbeitete Profile, die auf interne wie externe Informationsressourcen angewandt werden).
Standardprofil: News-Bre@k Auch bei den Profildiensten gibt es wie bei den retrospektiven Recherchen die Möglichkeit einer rein externen Lösung. So bieten Online-Archive vordefinierte Themen an, deren Suchargumente periodisch (meist täglich) abgearbeitet werden. Die Treffer werden dem Nutzer zur Auswahl in dessen Mailbox eingestellt. Auf dieser Basis arbeitet z.B. der Informationsdienst „News-Bre@k" von GENIOS. Als Nutzer wählt man aus den diversen (derzeit 4.350) vorbereiteten Standardprofilen „seine" persönlichen Profile aus. Da GENIOS über mehrere tagesaktuelle Quellen verfugt - darunter „Handelsblatt" oder „VDI Nachrichten"
ist für die Aktualität
der Informationen gesorgt. Die Standardprofile sind auf Branchen bzw. Märkte (z.B. Nähnadeln - Stecknadeln, Nudeln, Nüsse oder auch - allgemeiner - Nahrungsmittelbranche), auf Wirtschaftsthemen (Profile u.a. in den Bereichen Forschung & Technologie, Unter-
19 Integration externer Informationen
387
nehmensfuhrung oder Wirtschaft & Konjunktur) und auf Firmen-Monitoring (für deutsche Aktiengesellschaften) ausgerichtet. Erfüllt ein Datensatz die Kriterien des Suchprofils, wird dem Abonnenten der Titel an seine E-Mail-Adresse übertragen (siehe Abbildung 19.1). Nach Prüfung auf mögliche Relevanz kreuzt der Nutzer einen Titel an und erhält daraufhin den gesamten Volltext übertragen.
Abb. 19.1: Standard-Profildienst News-Bre@k: Beispiel für eine E-Mail Von:
GENIOS News-Break
Datum:
Mittwoch, 7. Oktober 1998 20:00
An:
[email protected]
Betreff:
Investmentfonds & Investmentgesellschaften - SICD67
GENIOS News-Break Profil: SICD67 - Investmentfonds & Investmentgesellschaften
•
PERFORMANCE / Britische Aktienfonds: Gartmore setzt auf Standardwerte / BP einer der Favoriten an der Themse
•
US-AKTIENFONDS / Gewinne nur für Absicherungs-Fonds / Indexfonds verkraften Kursverfall besser
•
TRENDS / Fondskonferenz in Luxemburg - Branche konzentriert sich bei Pensionsfonds auf Lobbyarbeit / Deutsche Rentenfonds mit Potential
[Ankreuzen des dritten Titels]
HB Nr. 193 VOM 07.10.98 SEITE 51 Für den Anleger: Investmentfonds
388
19 Integration externer Informationen
TRENDS / Fondskonferenz in Luxemburg - Branche konzentriert sich bei Pensionsfonds auf Lobbyarbeit / Deutsche Rentenfonds mit Potential Auf die Währungsunion sei die Fondsbranche vorbereitet, befanden internationale Fondsexperten auf einer Konferenz in Luxemburg: Das zeigten sowohl eine europäisch ausgerichtete Fondspalette als auch das eher auf Branchen abzielende Management. HANDELSBLATT, Dienstag, 6.10.98 HB/kmc LUXEMBURG. Die Fondsbranche ist gewappnet für den Euro. ...[gekürzt; es folgt der Volltext]... Quelle: GENIOS
Persönliche Profile in externen Systemen Die zweite Variante von Profildiensten unterscheidet sich von der ersten durch die Formulierung der Suchargumente. Diese Arbeit wird hier vor Ort durchgeführt und speziell dem Informationsbedarf des Endnutzers angepaßt. Die Einstellung und Feinjustierung, d.h. Hostauswahl, Datenbankselektion, Formulierung der Suchfragen, Festlegen der Periodizität sind Aufgaben für den Informationswirt; alles andere - also das Abfragen seiner SDIs - erledigt der Endnutzer.
Persönliche Profile in internen Systemen Das aufwendigste, aber zugleich auch ergiebigste Verfahren arbeitet die persönlichen Profile der Mitarbeiter bzw. der Abteilungen an einem internen System ab. Dieses interne Informationssystem wird von diversen externen Informationsquellen gespeist und durch weitere, interne Informationen angereichert. Ein Beispiel für ein solches System ist das Modul „IC Individual News" des Produktes „Information Center" von AGl-lnformation
Management Consultants in Neustadt an der
Weinstraße (vgl. Stock 1999c). „Information Center" besteht aus mehreren Komponenten, die alle auf dem Groupware-System „Lotus Notes" aufsetzen. Für die langfristige Speicherung dient „IC Media Directory", ein integriertes Bibliothekssystem. Wenn man es so ausdrücken möchte, ist das „Media Directory", das elektronische Langzeitgedächtnis des Unternehmens. In diesem Bild wäre „IC Individual News" das Kurz-
19 Integration externer Informationen
389
zeitgedächtnis. Wichtige, für das Unternehmen und seine Mitarbeiter relevanten Informationen werden aus diversen Quellen ausgefiltert, aufbereitet und jedem einzelnen zur Verfügung gestellt. „IC Individual News" verbindet Presseclipping (in einer sehr weiten Form) mit SDI- bzw. Profildiensten und einer Presseschau. In einem herkömmlichen Presseclipping sind ausschließlich Texte aus Zeitungen und ausgewählten Fachzeitschriften die Quellen. „IC Individual News" verallgemeinert den Clipping-Ansatz auf alle Informationen (siehe Abbildung 19.2). In das Clipping-System können übernommen werden: •
Online-Informationen (etwa von Presseagenturen wie Reuters; natürlich auch alle anderen Datensätze der Online-Archive), •
Variante 1: wenn das Online-Archiv Lotus unterstützt, ist eine direkte Übernahme der Daten in „Information Center" möglich,
•
Variante 2: wenn das Online-Archiv Lotus nicht unterstützt, aber eine E-Mail-Ausgabe anbietet, geschieht die Datenübermittlung via EMail;
•
Informationen aus dem World Wide Web, indem Web-Sites übernommen werden (eventuell vorhandene Links bleiben aktiv);
•
Informationen aus einem hauseigenen Satzsystem;
•
papiergebundene Medien (über Scanning);
•
weitere Files via E-Mail;
•
Sound-Dateien;
•
Videosequenzen (z.B. Filmausschnitte, die das Unternehmen in Nachrichtensendungen oder Reportagen zeigen).
Hinter der Quelle „weitere Files" verbirgt sich eine interessante Idee. Manfred Hauer, der Entwickler von „Information Center", hat die durchaus zutreffende Vorstellung, daß Unternehmensmitarbeiter vor Ort über weitere Informationsquellen als die offiziellen verfügen. Wie Korrespondenten sollen sie solche Informationen in einem Bericht zusammenstellen und via E-Mail ins Clipping-System eingeben. Hier wird versucht, Wissenselemente der Mitarbeiter, Zentrum jedes Knowledge Management, in das betriebliche Informationssystem zu integrieren. „Niemand ist in der Regel an den konkreten Fragestellungen dichter dran, als die Mitarbeiter selber", meint Hauer.
390
19 Integration externer Informationen
Abb. 19.2: Informationsflüsse beim Presseciipping im „Information Center"
Quelle: Stock 1999c
Durch den Rückgriff auf Presseagenturen ist sichergestellt, daß (nahezu) alle aktuellen Nachrichten im System vorhanden sind. Dies ist wichtig, wenn man bedenkt, daß nur ein Bruchteil der Agenturmeldungen in Zeitungen oder Zeitschriften weitergegeben wird. Das System „IC Clipping" steuert die Verwandlung der papiergebundenen Informationen in elektronische Informationen. Unterstützt wird das Scannen schwarzweißer und farbiger Vorlagen bis DIN A2, das ggf. nötige Umbrechen auf das A4Format, der OCR-Vorgang, eine systemunterstützte Fehlerkorrektur sowie die Speicherung im Originallayout (als pdf-Datei) sowie als ASCII-Volltext. Alle in das Clipping-System eingegebenen Dokumente werden bibliographisch beschrieben und mit Hilfe der eingesetzten Dokumentationsmethoden inhaltlich erschlossen - Aufgaben fiir Mitarbeiter der betrieblichen Informationswirtschaft.
19 Integration externer Informationen
391
Die Verteilung der Clipping-Informationen erfolgt zweigleisig (in Abbildung 19.2 oben Mitte). In einem Pull-Ansatz sorgt der Nutzer selbst dafür, daß ihn die Informationen erreichen. Für jeden Mitarbeiter (oder auch für gewisse Mitarbeitergruppen, etwa Abteilungen) werden Informationsprofile erarbeitet, die dem jeweiligen Informationsbedarf entsprechen. Die Profile sind durch den Information Professional und durch den Nutzer selbst änderbar. In periodischen Abständen (z.B. arbeitstäglich oder wöchentlich) bekommt der Nutzer diejenigen Informationen aus den Neuzuwächsen der Clipping-Datenbank zugespielt, die seinem Suchprofil entsprechen. Natürlich kann in der Datenbank auch zu beliebigen Themen ad hoc recherchiert werden. Im Push-Ansatz wird die betriebliche Informationswirtschaft aktiv und erarbeitet als „Servicerecherche" - eine (individuelle oder gruppenspezifische) Presseschau. Dies kann sowohl durch Ausdruck auf Papier geschehen als auch durch E-Mail. Datensätze der Clipping-Datenbank werden - dem Modell des Kurzzeitgedächtnisses entsprechend - nach einer gewissen Zeit gelöscht. Grund sind zum einen vertragliche Abmachungen mit Informationslieferanten (etwa eine Lizenz, ReutersMeldungen nur einen Monat zu nutzen) und zum andern ein nicht auszuschließender Information Overload. Das heißt aber nicht, daß prinzipiell alles eliminiert würde; es besteht vielmehr die Möglichkeit, singulare Dokumente als relevant auszuzeichnen. Sie wandern dann ins Langzeitgedächtnis, sprich in das „IC Media Directory".
19.4 Frühwarnsysteme Bei Wissenslücken bzw. Entscheidungsvorbereitungen weiß man vorher, d a ß Informationen zur korrekten Einschätzung einer kritischen Situation fehlen. Bei den Frühwarnsystemen ist dies anders; hier weisen erst die Informationen darauf hin, daß eine kritische Situation besteht (s.o. S. 32 f.). Frühwarninformationen können natürlich auch bei den Profildiensten auftreten, wenn etwa in einem Artikel über entsprechende Entwicklungen berichtet wird. Wir verstehen unter „Frühwarnsystemen" automatisierte Systeme, die den Nutzer auf kritische Situationen aufmerksam machen. Voraussetzung für solche Systeme ist das Vorliegen von definierten Schwellenwerten, mit denen aktuelle Werte aus externen elektronischen Datenbanken verglichen werden. Erreicht oder überschreitet ein Ist-Wert einer Datenbank den Schwellenwert, so wird dies dem Nutzer mit-
392
19 Integration externer Informationen
geteilt. Der Nutzer wird damit aufgerufen, das Problem weiter zu verfolgen, d.h. als ersten Schritt eine umfassende retrospektive Recherche zum Thema zu starten. Die Ist-Werte sind entweder einem Feld eines Datensatzes entnommen oder sie werden mittels informetrischer Methoden des Data Mining berechnet.
Feldspezifische Frühwarninformationen Datenbanken mit numerischen Informationen aktualisieren in gewissen Abständen ihre Zahlenangaben. Nehmen wir an, wir überwachen die Umsatzwerte aller Unternehmen in einem Markt. Das Suchargument in einer Unternehmensdatenbank ist demnach der gegebene Branchencode. Aus der externen Datenbank wird - wie bei einem Profildienst - periodisch der Feldinhalt „Umsatz" (in Kombinationen mit Feldern, die das Unternehmen identifizieren) abgezogen. Alle recherchierten Werte werden mit dem Schwellenwert verglichen. Ausgegeben werden ausschließlich solche Werte, die über dem Schwellenwert liegen. Über die Identifikationsfelder (z.B. datenbankspezifische Unternehmensnummer) kann der gesamte Datensatz abgerufen werden. Die Analyse der Information geschieht in weiteren Schritten; das Frühwarnsystem hat seine Arbeit getan.
Data Mining nach Frühwarninformationen Etwas aufwendiger wird das Frühwarnsystem, wenn die benötigten Daten nicht direkt in der externen Datenbank vorliegen, sondern erst berechnet werden müssen. Unser Beispiel hier sei die Überwachung der Patentanmeldeaktivität in einem Technikbereich. Ein Indikator auf „Patentaktivität" ist die Zahl der Anmeldungen pro Jahr. Das Suchprofil, eingesetzt bei einer Patentdatenbank, recherchiert nach gewissen IPK-Notationen, die den Technikbereich erfassen, und nach dem Jahrgang. Interessant ist zunächst ausschließlich die Anzahl der Treffer. Auch hier wird mit einem Schwellenwert verglichen und nur dann eine Meldung provoziert, wenn dieser überschritten wird. Im Vergleich zu den feldspezifichen Frühwarninformationen gibt es beim Data Mining weitaus mehr Möglichkeiten, kann man doch in jedem Feld - und dies nicht nur bei numerischen Felder - zählen.
393
19 Integration externer Informationen Fazit •
Wie vollständig bilden Informationsmittel Unternehmensdaten ab? Im Zusammenspiel aller Informationstypen (aus der Presse, aus Patentdatenbanken, aus betriebswirtschaftlichen Faktensammlungen usw.) hilft die Informationswirtschaft, Unternehmen für Außenstehende transparent zu machen. Geschäftsrisiken mit (bekannten wie bislang unbekannten) Partnern können so minimiert werden. Das „gläserne" Unternehmen gibt es jedoch nicht. Insbesondere über kleine und mittlere Unternehmen sind die Informationen recht lückenhaft.
•
Informationsbedarf entsteht bei Entscheidungsvorbereitungen,
Wissenslücken
sowie bei der Kontrolle von möglichen Risikofaktoren. Die Informationswirtschaft hält zur Lösung die Instrumente der retrospektiven Recherche, der Profildienste und der Frühwarnsysteme bereit. •
Der ad-hoc auftretende Informationsbedarf von Mitarbeitern wird durch das Instrument der retrospektiven Recherche befriedigt. Das Spektrum der Aufarbeitung des Rechercheergebnisses variiert von einem Standarddienst bis hin zu analytischen und evaluierenden Formen.
•
Der Normalfall bei Informationsdienstleistungen ist, diese im eigenen Hause durchzuführen. Ggf. kommt als externe Lösung die Inanspruchnahme von Bibliotheken, Information Brokern oder Unternehmensberatern infrage.
•
Bei der internen Lösung einer betrieblichen Informationswirtschaft hat sich eine Mischform von Endnutzerkonzept (dezentrale Lösung) und zentraler Informationswirtschaft bewährt. „Einfache" Recherchen führt der Mitarbeiter an seinem Arbeitsplatz selber aus, für „schwierige" Problemfalle ist die zentrale Instanz der betrieblichen Informationswirtschaft zuständig. Wichtig ist die Beratung und Schulung aller Mitarbeiter.
•
Ein Informationsbedarf eines Mitarbeiters oder einer Abteilung, der über einen Zeitraum konstant bleibt, wird durch Informationsprofile und periodisch (etwa arbeitstäglich) durchgeführte SDI-Läufe erledigt. Auch hier gibt es Standardlösungen (wie „News-Bre@k"), frei definierbare Profile bei den Online-Archiven sowie der Zugriff auf ein internes System, das aus externen wie internen Informationsquellen gespeist wird. Ein umfassendes Clipping-System mit Profildiensten (Pull-Funktion) sowie Presseschau (Push-Funktion) bietet „Information Center" an.
394 •
19 Integration externer Informationen Frühwarninformationen entstehen auf der Basis bestimmter Profildienste, wobei
ausgewählte Zahlenwerte mit Schwellenwerten verglichen werden. Das System reagiert erst dann, wenn ein Schwellenwert überschritten wird. Wir unterscheiden hierbei den Fall, wo die gesuchte Zahl bereits in den Feldern einer externen Datenbank enthalten ist, vom informetrischen Fall, wo das System (in der Regel einfache) Zählungen bzw. Berechnungen vornimmt (Data Mining).
20 Fallstudien 20.1 Online-Archiv mit Orientierung auf den Endnutzer: Profound Profound (vgl. Stock 1998b) ist das 1995 eingeführte Produkt der damaligen Firma M.A.I.D (Market Analysis Information Database). Gegründet wurde M.A.I.D im Jahr 1985 von Daniel Wagner (Jahrgang 1963). Spektakulär war der Kauf von Knight-Ridder Information (die beiden großen Online Archive DIALOG und DataStar eingeschlossen) durch M.A.I.D im November 1997. Immerhin hatte KnightRidder Information
einen Jahresumsatz von knapp 300 Millionen US-$ und
M.A.I.D gerademal 40 Millionen US-$. Dan Wagner formte mit der neu entstandenen Dialog Corporation den derzeitigen Weltmarktfuhrer in der Branche der elektronischen Informationsdienste.
The Dialog Corporation Nach Umsätzen gerechnet, hält die neue Dialog Corp. ungefähr 25% des Weltmarktes für elektronische Geschäftsinformationen, knapp gefolgt von Lexis-Nexis (mit 24%). Dialog speichert derzeit rund 9 Terabytes Informationen, was dem 50fachen des heutigen WWW-Angebots ausmacht. Mit Geschäftsstellen in 34 Ländern und über 1.000 Mitarbeitern werden über 20.000 Unternehmen als Kunden betreut. Von den 500 weltgrößten Unternehmen (nach der ,,Fortune"-Liste) hat The Dialog Corp. rund die Hälfte als Kunden, darunter 100% Durchdringung bei Firmen der Pharmazie, Elektronik, Luftfahrt und Kosmetik sowie bei den Brokern. M.A.I.D und als dessen Nachfolger The Dialog Corp. ist seit 1994 an der Börse notiert. Dan Wagner, CEO der Dialog Corp., ist sicherlich eine der schillerndsten Persönlichkeiten der Online-Szene. Anläßlich des Kaufes von Knight-Ridder mutmaßte der Observer,
Information
Wagner „könnte der Rupert Murdoch der Online-
Information werden". M.A.I.Ds Profound war und ist ein Endnutzerprodukt. Seine Zielgruppe sind Unternehmer und ihre Mitarbeiter, die an ihrem Arbeitsplatz mit einfachen Mitteln die sie interessierenden Informationen abrufen. Die Hosts von Knight-Ridder
In-
formation, DIALOG und DataStar, wenden sich demgegenüber an den Information Professional; hier ist Spezialwissen zu Retrievalsprachen und zu Hilfsmitteln einzelner Datenbanken (etwa zu Klassifikationssystemen und Thesauri) erforderlich. Rund 80% der Umsätze beim Host DIALOG werden von professionellen Informa-
396
20 Fallstudien
tionsvermittlern verursacht, die im Kundenauftrag recherchieren. Die neue Dialog Corporation hält an diesen beiden unterschiedlichen Zugangswegen zu den Informationen fest. Der Zugangsweg über den Information Specialist gilt allerdings als reifer Markt (mit moderatem Wachstum), während der Weg direkt zum Endnutzer riesiges Wachstum verspricht. Dan Wagner schließt sich den Prognosen von Forrester Research an, nach denen 1996 nur 2% der Endnutzer Zugang zu elektronischen Informationsquellen hatten, aber 2001 werden es 40% sein. Produkte der Dialog Corp. für den Informationsspezialisten sind: •
DIALOG Classic,
•
DIALOG Web,
•
DataStar Classic und
•
DataStar for Windows.
Produkte für den Endnutzer sind: •
DIALOG Select und
•
Profound.
Angesichts des hohen Stellenwertes der Endnutzer in der Unternehmenspolitik der Dialog Corp. scheint es sehr wichtig fiir die gesamte Informationsbranche, die Endnutzer-Flaggschiffe von Dialog Corp. genau zu studieren. Ist The Dialog Corporation mit Profound (und DIALOG Select) ein Trendsetter? Wird damit bei Routineaufgaben, etwa einem Profildienst, der Informationsfachmann überflüssig? Führt der Endnutzer einfache Recherchen selber durch? Für Dan Wagner hat der Information Professional in seinem Konzept eine „Schlüsselrolle", aber als „Gatekeeper" und „Knowledge Manager" einer Organisation, nicht als Rechercheur.
Profounds Produktpalette Profound läuft unter zwei Oberflächen: •
Profound (mit lokalem Windows-Client) und inhaltsgleich
•
Profound for the Internet.
Ergänzt wird das Basisprodukt durch zwei interessante Angebote:
20 Fallstudien •
Profound Livewire und
•
Dialog Intranet.
397
Außer der „klassischen" WorldSearch (die wir gleich eingehend beschreiben) bietet Profound derzeit „QuickSearch" an. Diese Oberfläche vereinigt die Datenbestände von Profound mit denen von DIALOG Select. Das Kernstück von Profound, InfoSort, ist hier nicht einsetzbar. Uns erscheint QuickSearch als Übergangsprodukt, das - schnell erstellt - Profound-Kunden einen Zugang zu einigen DIALOG-Beständen ermöglicht. Inhalte, die bislang exklusiv bei DataStar oder DIALOG aufliegen, sollen zwar dort bleiben, aber zusätzlich - sofern sinnvoll - bei Profound aufgelegt werden. Dan Wagner denkt dabei an weitere Metadatenbanken wie Profound Sciences oder Profound Medical.
Die Datenbestände im Überblick Profounds Datenbestände entstammen natürlich unterschiedlichen Quellen, werden aber nach einheitlichen Kriterien aufbereitet. Abgesehen von den numerischen Informationen (etwa Börsennotierungen) und den „Briefings" werden die Informationen in sechs Metadatenbanken gegliedert, die einzeln oder gemeinsam abgefragt werden können. (1) „Research 1 ine" ist eine Sammlung der Volltexte von (rund 45.000) Marktforschungsberichten. Erwähnenswert ist in diesem Kontext die Firma Frost & Sullivan Electronic Distribution, ein 50:50 Joint venture zwischen The Dialog Corp. und Frost & Sullivan. Profound sichert sich damit die Rechte, Frost & SullivanBerichte sofort nach dem Erscheinen und mindestens vier Monate danach exklusiv auf seinem Rechner zu haben (siehe auch oben Kapitel 9.3). Diverse weitere führende Marktforschungsinstitute (u.a. Freedonia, Pyramid Research, BIPE, Euromonitor) legen ihre Reports bei Profound auf; darunter befinden sich allerdings keine Quellen in deutscher Sprache. Abbildung 20.1 zeigt einen Überblick aller Ressourcen der Researchline. (2) „Brokerline" beinhaltet (rund 250.000) Finnenanalysen von internationalen Finanzinstituten und Brokern, darunter z.B. Lehman Brothers, Merrill Lynch oder SBC Warburg. Alle Investext-Dokumente sind enthalten.
398
20 Fallstudien
(3) „Newsline" gestattet den englischsprachigen Zugang zu (z.T. übersetzten) Wirtschaftsartikeln aus 4.700 Zeitungen und Zeitschriften aus 190 Ländern. Eine wichtige Quelle, Textline von Reuters, ist jedoch nicht enthalten. (4) „Wireline" bietet Agenturmeldungen im Realtime-Betrieb an. Rund 30 Presseagenturen speisen ihre Informationen bei Profound ein, darunter leider nicht Reuters. Als Beispiele können wir auffuhren: Africa News Service, Agence France Presse, AP-Online, Business Wire, ITAR/TASS News Agency oder United Press International. (5) „Companyline" sammelt Unternehmensdossiers. Nachweise finden sich zu rund 4,5 Millionen Unternehmen, Produzenten sind u.a. Dun & Bradstreet, Extel, ICC, Moody's, Teikoku und Disclosure. Deutsche Produzenten wie Hoppenstedt oder Creditreform sind nicht vertreten, so daß sich sowohl Quantität als auch Qualität der Dossiers deutscher Unternehmen in engen Grenzen halten. (Bei meiner Suche nach einem Kölner Großunternehmen erhielt ich im September 1998 Finanzinformationen mit Stand vom Juni 1996. Da das Rechnungsjahr dieses Unternehmens jeweils im Juni endet, hat unser Nachweis einen Rückstand von zwei Rechnungsjahren.) (6) „Countryline" enthält Länderberichte zu 192 Staaten, erstellt u.a. von der Economist Intelligence Unit und von Datamonitor. „Briefings" bringen knappe, aber übersichtliche Kurzinformationen
zu rund
22.000 Unternehmen, 1.500 Märkten und 150 Ländern. Alle Informationen aus den sechs „Lines" und die Briefings (außer kurzen „Snapshots") sind kostenpflichtig.
Abb. 20.1: Quellen der Researchline Access Asia Aktrin Research Asia IT Baskerville Communications Corp Bloor Research Business Trend Analysts Corporate & Marketing Intelligence Economist Intelligence Unit Emerging Markets Data Espicom EuroStaf
AC Nielsen - MEAL Asian Business Intelligence Asia Strategies Ltd BIPE Business Communication Company Cambridge Market Intelligence DRI / McGraw Hill Electronics International ERC Statistics Euromonitor FAZ
399
20 Fallstudien FIND / SVP Freedonia Group Goulden Reports IAL Consultants ICON Group International IDC Greater China International Business Strategies Jane's KeyNote Market Research Leatherhead Food Research Ass. Maritime Strategies Market & Business Development Market Direction Reports MPA Market Movements Medical Data International New Leisure Markets Packaged Facts PJB Publications Pyramid Research Quest Economics Research Asia Society of Motor Manufacturers & Traders Teltech Resource Network USA Monitor World Information Technologies
Forecast International Frost & Sullivan Groupe DAFSA IBIS Information IDATE Insight Research Corp Japan Monitor Jupiter Communications Lafferty Publications Maclvor Grant / Risk Line Ltd Market Assessment Publications Marketdata Enterprises Marketing Intelligence Service MSI Marketing Research for Industry Market Vision Middle East Consultants Online Data Services PIRA International Political and Economic Risk Consultancy R.A.I.N. SCRL Specialists in Business Information Taylor Nelson AGB Theta Corp WEFA Ltd Yano Research Institute
Quelle: Profound (Stand: 3/1999) InfoSort: Ein Thesaurus für alle Literaturinformationen Alle textbezogenen Informationen werden von einem einzigen Thesaurus verwaltet (vgl. Maller 1998). Egal, aus welcher Quelle oder Datenbank die Informationen stammen, die Indexierung arbeitet grundsätzlich mit InfoSort. Hier liegt ein grundlegender Unterschied zu allen anderen Datenbankanbietern vor. Jene bieten mit den jeweiligen Datenbanken auch deren Terminologie mit an, was zur Konsequenz hat, daß der Nutzer für nahezu jede singulare Datenbank deren Thesaurus bzw. Klassifikationssystem kennen muß. InfoSort ist ein Thesaurus mit drei Facetten: •
Marktsegmente
•
Länder
•
Aspekte (scopes).
20 Fallstudien
400
Die Facette der Marktsegmente ist ein Branchenthesaurus; die Aspekt-Facette umschreibt Kontextterme, die den thematischen Hintergrund eines Textes angeben. Deskriptoren aus der Scope-Facette sind beispielsweise „Advertising and promotion", „Company profile", „Forecasts", „Market shares", „Privatisation" bis hin zu „Theoretical analysis". Die Deskriptorsätze umfassen jeweils eine große Menge von Nicht-Deskriptoren, hinzu kommen Ober- und Unterbegriffe sowie verwandte Begriffe. Die Hierarchierelation ist - verglichen mit anderen Wirtschaftsthesauri - recht dürftig ausgestattet. So führte etwa die Suche zu „G10 (group of ten)", einem Nicht-Deskriptor, zum Deskriptor „G7". Hier hätte man Unterbegriffe erwartet, genaugenommen deren sieben. Das Resultat: kein einziger Unterbegriff. Die Thesaurusfortschreibung geschieht vor allem in der Zuordnung aktuellen Termmaterials (als Nicht-Deskriptoren) zu den Deskriptoren. Die Indexierung verläuft für die unterschiedlichen Lines mittels verschiedener Vorgehensarten. Agenturmeldungen und Zeitungsartikel werden
ausschließlich
automatisch mittels des Vokabulars von InfoSort indexiert, Marktforschungsberichte und Broker-Reports werden zusätzlich intellektuell bearbeitet. Jedes Dokument wird durch ein ausfuhrliches Inhaltsverzeichnis (bis zum letzten Unterpunkt) exakt beschrieben. Kommen im Text Tabellen vor, werden sie einzeln erfaßt. Der Thesaurus, InfoSort, ist ein einsprachiges englisches Indexierungs- und Retrievalhilfsmittel. Die Software der automatischen Indexierung läßt sich nur auf englischsprachige Texte anwenden. Beim Information Retrieval läßt sich der Thesaurus aufrufen. Der Nutzer ist aufgefordert, einen Suchbegriff oder den Anfang davon einzugeben. Der „InfoSort Navigator" bringt sodann einen Ausschnitt aus der alphabetischen Liste aller Deskriptoren und Nicht-Deskriptoren. Deskriptoren sind durch Großbuchstaben ausgezeichnet. Neben der Möglichkeit, im Alphabet zu blättern, werden vier Navigationsarten im Thesaurus unterstützt: •
Oberbegriff
•
Unterbegriff
•
verwandter Begriff
•
(bei Nicht-Deskriptor): Vorzugsbegriff.
20 Fallstudien
401
WorldSearch Die Suche geschieht soweit wie möglich menügefuhrt. Das Eingangsmenü läßt Suchargumente in folgenden Feldern zu: •
Meta-Datenbanken (alle oder eine der sechs Lines)
•
Anzahl der Titelanzeigen
•
Sortierkriterien
•
Marktsegment (thesaurusunterstützt; angedeutet durch ein Lupe-Symbol)
•
Erscheinungsdatum
•
Unternehmen
•
Länder (thesaurusunterstützt)
•
Freitext
•
Herausgeber / Verlag
•
Titel
•
Aspekt (thesaurusunterstützt).
Beim Anklicken der „Lupe" erscheint ein Thesaurusbildschirm des oben beschriebenen InfoSort Navigators. Die Entscheidung für einen Deskriptor wird durch „Use term" markiert. Nicht menügefuhrt sind Verknüpfungsoperatoren, die auf alle textlichen Suchargumente anwendbar sind. Die mengentheoretischen Operatoren werden durch folgende Symbole ausgeführt: +
Boolesches Und
,
Boolesches Oder Boolesches Nicht.
Klammerung ist möglich. Achtung ist beim Nicht-Operator geboten. Mit Bindestrich zusammengesetzte Terme ergeben eine Nicht-Verknüpfung. (Daimler-Benz findet alles zu Daimler unter Ausschluß der Texte, wo Benz vorkommt.) Gelöst wird das Problem durch den Befehl „Ignore Operations" mittels Anfuhrungszeichen (also „Daimler-Benz").
402
20 Fallstudien
Profound kennt einen einzigen Abstandsoperator. Das Zeichen &
Proximity
verknüpft Suchargumente als Und-Verknüpfiing, wobei zusätzlich die beiden Suchargumente unabhängig von deren Reihenfolge im Abstand von maximal 20 Worten stehen. Suchtermfragmentierung (mit *) ist nur als offene Rechtstruncation möglich. Aus der Sicht eines Information Professional sind diese Suchmöglichkeiten erschreckend gering, aus der Sicht eines Endnutzers dürften sie ausreichen; sie könnten sogar zu kompliziert sein (etwa der Unterschied zwischen + und &, unkritischer Einsatz von Fragmentierungen, die Verwendung des Ignore Operators bis hin zum Verständnis der mengentheoretischen Operatoren Und und Oder überhaupt). Über den Search-Buttom wird die Suche eingeleitet, die - geordnet nach Lines - zu Titellisten fuhrt. Durch Ankreuzen von Titeln erhält der Nutzer die Inhalts- und Tabellenverzeichnisse der Berichte. Auch hier ist wiederum anzukreuzen. Ein zielgenaues (und damit preiswertes) Filtern der gesuchten Information (und nur dieser) wird somit möglich. Vor der Ausgabe erscheint die Preisangabe. Erst nach der Bestätigung durch „I Accept" wird die gefundene Information angezeigt. Sucht man im Freitextfeld, so gibt es eine weitere Anzeigemöglichkeit. Im Sinne einer (recht umfänglichen) Keyword-in-Context-Ausgabe taucht zusätzlich ein Get Context-Feld auf. Diese Umgebungsanzeige ist kostenpflichtig. Die Informationsausgabe erfolgt - bei der Internet-Version - entweder direkt über den Druckbefehl des Browsers, im Textformat (.txt) oder - bei Reports - im Portable Document Format (.pdf) mittels Adobe-Acrobat-Reader-Software. Dies garantiert den Druck im ursprünglichen Format einschließlich aller (auch farbiger) Graphiken und Bilder sowie das „Ausschneiden" von Textteilen und Einfügen in andere Anwendungen wie Word, Excel oder PowerPoint.
WorldSearch Alert Manager Rechercheformulierungen lassen sich als Profile für SDIs speichern („Alerts"). Angegeben werden u.a. der Name des Sub-Accounts (für den betreffenden Endnutzer), die Häufigkeit des SDI sowie die E-Mail-Adresse des Kunden. SDIs können jederzeit geändert oder gelöscht werden.
20 Fallstudien
403
Liegen Informationen vor, so werden diese - als Titellisten - an die Mailbox des Nutzers geschickt. Anhand dieser Listen entscheidet der Kunde, ob er an den betreffenden Artikeln, Marktberichten usw. interessiert ist. Durch Anklicken des jeweiligen Attachment wird Profound angewählt und die Titelliste online angezeigt.
Quotes Die numerischen Informationen sind unabhängig von WorldSearch recherchierbar. Börsennotierungen liegen für drei Bereiche vor: •
Aktien
•
Währungen
•
Edelmetalle.
Aktienkurse werden, solange die betreffende Börse geöffnet ist, realtime, ansonsten tagesaktuell mit den üblichen Angaben (u.a. Anfangs- und Schlußkurs, Minimum, Maximum) angezeigt. In einer graphischen Darstellung wird die Kursentwicklung der letzten drei Monate im Überblick geboten. Edelmetallpreise werden für Palladium, Platin, Silber und Gold verfolgt. Man recherchiert Wechselkurse für die wichtigsten Währungen durch Anklicken einer Währung „From Currency" und der Zielwährung „To Currency". Angezeigt werden realtime bzw. tagesaktuell die üblichen Angaben einer bestimmten Börse nebst einer graphischen Übersicht über das letzte Vierteljahr. Die Auswahl der Börsen orientiert sich am Informationsbedarf britischer und amerikanischer Anleger. Die Frankfurter Börse (oder irgendeine andere deutsche Börse) ist im Profound-Angebot derzeit nicht aufgeführt.
Portfolio Profounds Portfolio ist eine SDI-Lösung für kombinierte numerische und literaturbezogene Informationen zu Unternehmen. Es sollte alle die Unternehmen beinhalten, an denen der Kunde Anteile hat, sowie weitere, an denen unser Nutzer irgendwelche Interessen bekundet. Für den Fall der eigenen Anteile muß die Anzahl der Aktien eingegeben werden.
20 Fallstudien
404
Portfolio berechnet (anhand der Aktienmenge und des aktuellen Kurses) den jeweiligen Wert der eigenen Aktien, bezogen auf die einzelnen Unternehmen sowie insgesamt. Der Gesamtwert wird in mehreren Währungen ausgeworfen. Das Portfolio listet folgende Angaben auf: •
Unternehmen (Börse)
•
Anzahl der Aktien am Unternehmen
•
aktueller Preis pro Aktie
•
Veränderung
•
Wert (Produkt aus Anzahl und Preis)
•
Links.
Sortiert sind die Unternehmen nach Währungen, d.h. zunächst alle Bestände auf Dollarbasis, dann auf Pfundbasis usw. Von besonderem Interesse sind die Links. Fünf Symbole finden Verwendung. Sie werden angezeigt, wenn in den Metadatenbanken relevante Information vorliegen. Die Links führen zu •
Quotes
•
News
•
Broker Reports
•
Company Briefings
•
Stock Reports.
Mit dem Anklicken der Symbole werden Suchen ausgelöst, die dem Verfahren in der WorldSearch entsprechen.
Profounds Intranet-Lösung Intranets kombiniert mit Festpreisen sind für Dan Wagner Schlüssellösungen für die Zukunft. Das bedeutet jedoch nicht, daß Profound alle Inhalte liefern könnte, die in einem unternehmensweiten Netzwerk vorzuhalten sind. Hinzu kommen notwendigerweise die firmeninternen Informationen, die gemeinsam mit den Pro-
20 Fallstudien
405
found-Inhalten unter der Profound-Oberfläche (einschließlich InfoSort) verwaltet werden. Der Informationsbedarf des Unternehmens ist zu bestimmen und durch den Zugriff auf spezifizierte Teilbestände von Profound zu operationalisieren. Der jährliche Festpreis orientiert sich am Umfang dieser Bestände. Auf die ausgewählten Teilbestände besteht dann unternehmensweit unbeschränkter Zugang. Die technische Lösung ist nicht trivial und erfordert auf der Nutzerseite Investitionen in Hardware und Software. Profound plaziert die jeweils neuen Informationen auf einem FTP-Server, wobei alle Daten (mittels ZIP) komprimiert sind. Der Kunde überträgt die Daten auf seinen Intranet-Server und dekomprimiert sie. Werden die Daten stets im selben Verzeichnis gespeichert, überschreibt der ZIP-File wenn erforderlich - alte Einträge und hält so die Profound-Bestände aktuell. Grenzen der Intranet-Lösung liegen in der Mächtigkeit von InfoSort. Solange InfoSort nur für englischsprachige Informationen ausgelegt ist, muß die IntranetSprache des Unternehmens, einschließlich aller internen Dokumente, notwendig in englisch gehalten sein.
Lifewire: Der individuelle Tickerdienst Lifewire ist eine besondere Form eines SDI. Genau wie bei einem „normalen" SDI wird ein Suchprofil erstellt, das der Sache entsprechend ausschließlich mit der Metadatenbank Wireline arbeitet. Geliefert werden die Informationen nicht in festgelegten Intervallen, sondern realtime. So entsteht ein individueller Tickerdienst, der seinen Nutzer stets aktuell auf dem Laufenden hält. Wie beim Intranet, so wird auch hier mit einem Festpreis gearbeitet. Mögliche Anwendungsfälle könnten die Überwachung der Tickermeldungen zum eigenen Unternehmen sowie zu den Wettbewerbern oder zum eigenen Marktsegment sein. Zudem dürfte das Angebot für Broker und ggf. für Anleger von Interesse sein.
Preise Die Nutzung der zum Teil exklusiv bei Profound aufliegenden Berichte verschafft Profound-Kunden Informations- und damit Wettbewerbsvorteile. Dies gilt aber nur solange, wie die Wettbewerber keinen entsprechenden Zugang zu den Informatio-
406
20 Fallstudien
nen haben. Verfügen alle über die gleichen Informationen, sind die Wettbewerbschancen für alle gleich und die Informationen wertlos. Profound „schützt" seine Kunden und seine eigenen Umsätze durch eine Hochpreispolitik. Derzeit kostet das Jahresabonnement 10.000 US-$. Hinzu kommen die Kosten für einzelne Dokumente oder Teile (Kapitel, Tabellen) daraus. Für einen umfangreichen Report können die Kosten durchaus bei mehreren tausend DM liegen. Im Jahresabonnement eingeschlossen sind in beliebiger Anzahl die SDI-Läufe, „Snapshots" zu Firmen, Märkten, Ländern sowie die Quotes und das Portfolio. Angesprochen wird mit einem solchen Ansatz die Informationselite unter den Unternehmen. Für kleine und mittlere Unternehmen könnte sich allein der jährliche Fixpreis zu einer Informationsbarriere entwickeln.
Profound: Zusammenfassende Bewertung Unschlagbar ist Profound derzeit beim Volltextangebot von englischsprachigen Marktforschungsberichten und Firmenanalysen. Positiv ist zudem, daß diese Berichte (dank Adobe) im Originallayout ausgegeben werden. Genial ist die (zugegebenermaßen ausgesprochen einfache) Lösung, mit nur einem
Thesaurus
(InfoSort) zu arbeiten, der alle Literaturinformationen inhaltlich erschließt. Der Nutzer arbeitet stets mit der gesamten Profound-Datenbank, nicht mit einzelnen Files. Die Suchmöglichkeiten sind am Endnutzer orientiert; informationswissenschaftliches oder -praktisches Wissen wird nicht vorausgesetzt und ist auch nicht erforderlich. Einen Information Professional dürften die Suchoptionen mitnichten zufriedenstellen. Dazu ist der Umfang an Such- und Ausgabebefehlen viel zu gering. Aber der Information Professional soll j a Profound gar nicht benutzen; seine Rolle beschränkt sich darauf, für seine Endnutzer das System einzurichten, ggf. ein Intranet zu verwalten und die persönlichen SDI- bzw. Tickerdienste der Endnutzer im Intranet zu betreuen. Informationen über deutsche Unternehmen sind bei Profound - im Vergleich zum Angebot bei DataStar,
der GBl oder bei GENIOS - suboptimal. Wichtige Quellen
fehlen. Deutschsprachige Marktforschungsberichte sind nicht vorhanden. Sie können nicht vorgehalten werden, weil InfoSort und das System der automatischen Indexierung nur mit der englischen Sprache arbeiten.
20 Fallstudien
407
Reuters hat seine Datenbanken von den Hosts seiner Mitwettbewerber zurückgezogen und bietet sie unter einer eigenen Oberfläche an (Reuters Business
Brie-
fing). Diese Geschäftspolitik ist durchaus verständlich, reißt aber bei den ehemaligen Partnern große Lücken auf. Profounds Wireline wäre mit den Agenturmeldungen von Reuters ganz einfach besser, genauso wie die Profound Newsline dies mit Reuters Textline wäre. Eine gute Idee ist die Intranet-Lösung von Profound: firmenspezifisch ausgewählte Profound-Informationen und zusätzlich eingegebene unternehmensinterne Informationen, automatisch indexiert mittels des gleichen Vokabulars, angeboten an jedem Arbeitsplatz unter einheitlicher Oberfläche. Leider gilt dies nicht für deutsche Unternehmen. Da deren interne Informationen doch wohl in deutsch vorliegen, kann InfoSort nichts damit anfangen. Die Überwachung eines Portfolio, das nicht nur Kurse und Kursentwicklungen, sondern auch aktuelle Agenturmeldungen, Zeitungsartikel, Unternehmensberichte und Broker-Reports zu den gewünschten Unternehmen bereithält, ist ein wichtiges Produkt von Profound. Eigentlich wäre das Produkt auch für private Anleger von Interesse. Angesichts des hohen Preises werden diese aber wohl auf kostengünstigere alternative Quellen ausweichen. Für deutsche Kunden kommt angesichts der Nichtbeachtung der Frankfurter Börse Profounds Portfolio-Überwachung derzeit kaum infrage. Wer in Deutschland, in Österreich und in Schweiz braucht Profound? Angesprochen sind mittlere bis große Unternehmen aller Branchen, die auf internationalen Märkten operieren, die mit ausländischen Zulieferern oder Kunden zu tun haben und deren unternehmensinterne Informationswirtschaft auf Endnutzerrecherchen fixiert ist. Leitfrage ist: Brauchen wir - direkt nach deren Erscheinen - Marktforschungs- und Unternehmensreports? Wenn ein Unternehmen diese Frage für sich bejaht, kommt es nicht an Profound vorbei.
20.2 Ein System automatischer Indexierung: Freestyle von Lexis-Nexis In der kommerziellen Informationswirtschaft setzen derzeit bereits einige Hosts auf natürlichsprachiges Retrieval. Zu erinnern ist an DIALOG mit Target, Westlaw mit WIN („Westlaw Is Natural") und Lexis-Nexis mit Freestyle. Mit Freestyle wollen wir uns hier exemplarisch befassen (vgl. Stock 1998c). Kann ein Endnutzer
408
20 Fallstudien
damit nutzbringend umgehen? Was bringt Freestyle dem Information Professional? Wird die Recall-Präzision-Begrenzung wirklich aufgehoben? Konkret: Bekommen wir mehr relevante Datensätze als beim Booleschen Retrieval? Und: Wird die Nachweismenge präziser, d.h. ärmer an Ballast?
Freestyle in der Recherchepraxis Lexis-Nexis enthält in der Regel Volltextinformationen, z.T. Fakteninformationen aus weit über 20.000 Quellen. Das System ist in zwei Bereiche unterteilt, einmal in „Lexis" mit amerikanischen (und einigen ausländischen) Rechtstexten, zum andern in „Nexis" mit Nachrichten, Unternehmensinformationen, Medizin und Patenten. Lexis-Nexis arbeitet mit zwei Retrievaloptionen: mengentheoretisches Retrieval (eingeleitet mit .bool) und natürlichsprachiges Retrieval (eingeleitet mit .fr). Die Suche bei Freestyle wird durch einen natürlichsprachigen englischen Satz formuliert. Freestyle analysiert hierbei ausschließlich die vorkommenden Wörter, nicht deren grammatikalischen Zusammenhang. (Man kann also auch mit einem nicht so ausgefeilten Englisch arbeiten, einfache Wortlisten reichen ggf. aus.) Phrasen sollten im Fragesatz mit Anführungszeichen gekennzeichnet werden, da Freestyle nicht alle Phrasen erkennt. Verwandte Begriffe, Synonyme oder Quasisynonyme werden einem Suchwort in Klammern hinzugefügt. Da Fragmentierungen nicht möglich sind, müssen hier auch Formulierungsvarianten angegeben werden. Freestyle bietet fünf Optionen zur Bearbeitung einer Suchfrage an (siehe Abbildung 20.2). Option (1) erlaubt das Streichen und Hinzufügen von Termen. Durch (2) können solche Wörter ausgezeichnet werden, die im Text notwendig vorkommen müssen. Hier kommt durch eine Hintertür das mengentheoretische UND wieder ins Spiel. Option (3) läßt gewisse Einschränkungen zu, etwa zu bestimmten Datumsangaben oder auf Terme, die im Titel vorkommen müssen. (Auch hier liegt wiederum eine Schnittmengenbildung vor.) Wird nichts eingesetzt, so läuft die Suche stets über den gesamten File. (4) führt zu Synonymenwörterbüchern sowie zu „verwandten Begriffen". Aus dem zum Teil reichhaltigen Termangebot wird mit weiteren Wörtern die Suche verfeinert. Option (5) legt die Anzahl der auszugebenden Datensätze fest. Standardeinstellung ist 25; die Menge ist bis auf 1.000 erweiterbar. Unsere Beispielsuche in Abbildung 20.2 wurde in der „Germany Library" im File „ALLNWS" (All News) durchgeführt.
409
20 Fallstudien Abb. 20.2: Freestyle: Optionen zur Bearbeitung einer Suchfrage Search Description:
WHAT OPINIONS FOR THE FUTURE OF GARZWEILER AND HAMBACH HAVE RHEINBRAUN AND WOLFGANG CLEMENT? Press ENTER to start search.
Edit Search Description
Enter/edit Mandatory Terms
Enter/edit Restrictions
Synonyms and Related Concepts
Change number of documents
(e.g., date) Current setting: 50
For further explanation, press the H key (for HELP) and then the ENTER key. FREESTYLE(TM) SEARCH OPTIONS
Quelle: Lexis-Nexis
Zur Veranschaulichung der Mächtigkeit der Wörterbücher sei hier ein Ausschnitt der angebotenen Varianten zu „Opinions" abgedruckt (Abbildung 20.3). Quelle der Wörterbücher sind „The Legal Thesaurus" von William C. Burton sowie „Merriam Webster's Collegiate Thesaurus". Durch Angabe der laufenden Nummern werden die Terme der Suchfrage hinzugefügt.
Die Sortierung der gefundenen Datensätze erfolgt nach Relevanz. Es besteht die Möglichkeit, die Trefferliste - wie gewohnt - nach der Zeit neu zu sortieren. Die Dokumentanzeige
geschieht
sowohl
durch
die
üblichen
Optionen
(bibliographische Angaben, Keyword in Context oder Volltext) als auch zusätzlich durch eine Option „SuperKWIC", die den entsprechend zur Suchfrage wichtigsten Textteil anzeigt.
Abb. 20.3: Freestyle: Wörterbuchunterstützung Synonyms for: OPINIONS (Page 1 of 2) Press ENTER for next page Enter synonym numbers to include in search and press ENTER (e.g. 1,2,3-4)
Return to Search Options
Return to Term Selection
410
20 Fallstudien
Belief 1 assumption
2 attitude
4 conjecture
5 consideration
3 conclusion 6 conviction
7 determination
8 estimate
9 estimation
10 evaluation
11 feeling
12 guess
13 hypothesis
14 idea
15 impression
16 judgment
17 notion
18 outlook
19 perspective
20 persuasion
21 point of view
22 position
23 posture
24 preconception
25 presumption
26 presupposition
27 reaction
28 reflection
29 sentiment
30 stance
31 stand
32 supposition
33 surmise
34 suspicion
35 theory
36 thesis
37 thinking
38 thought
39 view
For further explanation, press the H key (for HELP) and then the ENTER key. SYNONYM SELECTION
Quelle: Lexis-Nexis Auch nach der Anzeige der Treffer sind Modifikationen der Suchanfrage möglich. Dies geschieht durch „MODIFY" bei der Dokumentanzeige und bewirkt ein erneutes Aufrufen des Optionenmenüs (wie in Abbildung 20.2).
Boole und Freestyle in Kombination Das Retrievalsystem von Lexis-Nexis bietet an, die durch Freestyle
gefundene
Treffermenge mittels mengentheoretischer Operatoren weiter zu bearbeiten. Diese Suchverfeinerung wird durch „FOCUS" eingeleitet. Hier lassen sich ausgesprochen interessante Suchstrategien abarbeiten. In einem ersten Schritt grenzt man durch Freestyle eine umfangreiche Menge von Datensätzen auf die relevantesten Dokumente ein. Im zweiten Schritt arbeitet man in dieser Teilmenge mit den gewohnten Booleschen Operatoren. Geschickt eingesetzt, läßt sich die Präzision einer Treffermenge so enorm erhöhen. Der umgekehrte Weg ist ebenfalls möglich. Zunächst wird mengentheoretisch gesucht, danach mittels relevance ranking sortiert. Möglich ist diese Retrievalstrategie allerdings nur bei Treffermengen bis maximal 1.000 Datensätzen. Nach Abschluß der Booleschen Suche leitet man durch den Befehl .rank die Sortierung nach Wichtigkeit ein. Voraussetzung für das relevance ranking ist eine thematische
20 Fallstudien
411
Suche. Eine Suche nach Formalia (etwa „date is 10/9/1998") läßt keine Sortierung nach Relevanz zu. Gibt es bei großen Treffermengen überhaupt Alternativen zum relevance ranking? Eine Beipielsuche bei ALLNWS (Germany Library) nach „Garzweiler" brachte 1.080 Treffer. Freestyle
listet (bei entsprechender Einstellung) die ersten 1.000
Datensätze nach Wichtigkeit auf und erlaubt (auch mengentheoretische) Verfeinerungen. Eine Beschränkung auf Titel (mittels „headline(Garzweiler)"; 215 Treffer) bringt uns kaum weiter, da Titel oftmals durchaus ausdruckslos sind. Recht interessant verlaufen Recherchen mit mehrfach eingesetzten Abstandsoperatoren. Wir probierten es mit
Garzweiler w/25 Garzweiler w/25 Garzweiler
und erhielten 33 hochrelevante Texte. Das Finden des „richtigen" Abstandes ist hierbei allerdings ausgesprochen vage, so daß auch dies keine Alternative (wohl aber eine Ergänzung) zu Freestyle ist.
Automatische Indexierung bei Lexis-Nexis Wie arbeitet Freestyle? Automatisch indexiert werden sowohl die jeweilige Suchfrage als auch der Gesamtbestand an Datensätzen. Stoppwörter werden eliminiert (in unserem Beispiel aus Abbildung 20.2 die Terme „what", „the", „ o f \ „and" und „have"). Terme, die in der Datenbank allzu häufig vorkommen, die also angesichts ihres Wertes der inversen Dokumenthäufigkeit einen sehr kleinen Gewichtungswert haben, werden ebenfalls ausgeschlossen (bei uns waren dies „for" und „fiiture"). Unter .why wird diese Eliminationsart dem Benutzer mitgeteilt. Über die verbleibenden Wörtern wird eine Suche nach Phrasen eingeleitet. Gesucht wird nach Textklumpen, also nach solchen Wortfolgen, die zwischen Stoppwörtem oder Satzzeichen stehen. Zusätzlich werden Eigennamen von Personen durch eine Liste (englischer) Vornamen, Namen von Firmen durch spezifische Bezeichnungen (etwa „Ltd."), Namen von Organisationen durch Zusätze wie „University" oder „Foundation" erkannt. Lexis-Nexis hat die Algorithmen und
412
20 Fallstudien
Listen durch ein Patent (Lu u.a. 1998) schützen lassen. Phrasen werden dem Nutzer durch Anführungsstriche gekennzeichnet. Letztlich wird eine Art rudimentäre Wortstammanalyse durchgeführt. Bearbeitet werden jedoch ausschließlich regelmäßige Plural- und Possessivformen. „City" findet demnach „City", „Cities", „City's" und „Cities'". Unregelmäßige Formen (wie z.B. „Child") werden nicht erkannt. Einige Äquivalente, vorrangig Abkürzungen, werden einander zugeordnet, so z.B. „Ala" und „Alabama", „19th" und „Nineteenth" oder „Oct" und „October". Freestyle verfugt über keinen Algorithmus zur Analyse der Pronomina. - Alle in der Suchfrage erkannten Terme werden in einer Schlagwortliste gesammelt und bilden so den Suchvektor. Informationsstatistisch arbeitet Freestyle sowohl mit der inversen Dokumenthäufigkeit als auch mit der dokumentspezifischen Wortgewichtung. Der Gewichtungswert wird auf ein Intervall abgebildet, dessen Werte zwischen 1 und 100 liegen. Die normierten Gewichtungen für die einzelnen Schlagworte, die durch den Suchvektor vorgegeben sind, werden datensatzweise addiert. Hierdurch wird die Rangordnung hergestellt.
.where und .why: Dem System über die Schulter schauen Den Abgleich des Suchvektors mit den Vektoren der Dokumente kann der Rechercheur partiell verfolgen. Hierzu arbeitet man mit den Befehlen .where und .why.
Abb. 20.4: .WHERE: Wo kommen die Suchargumente vor? 2
1 1 2
3 4 5
HAMBACH
j * *
*
RHEINBRAUN
1 *
*
* *
*
* *
GARZWEILER
1 *
*
*
*
+
*
CLEMENT
1 *
*
* *
+
*
*
OPINIONS WOLFGANG
1 * *
•
*
6 7 8 9 0 1 2 3
*
4 5
*
*
*
*
*
*
* *
* *
*
*
* *
9 0
*
*
*
6 7 8
*
*
*
*
*
* * * * * * * * * *
*
1 2 3 4 5
* *
*
*
* *
* *
* *
* * *
*
1
*
* *
1
*
*
*
1
*
+
1 1
* *
*
*
*
*
*
*
* *
*
*
*
*
*
*
+
*
*
*
1
Quelle: Lexis-Nexis
Der WHERE-Bildschirm (Abbildung 20.4) zeigt die Schlagworte, mit denen die Suchfrage durch Freestyle beschrieben wurde, und deren Vorkommen in den er-
413
20 Fallstudien
sten 25 Dokumenten. Hat der Nutzer die Anzahl der Dokumente auf einen höheren Wert als 25 gestellt, so werden auch die folgenden Datensätze - immer in 25er Blöcken - auf weiteren Bildschirmen angezeigt. Um ein spezielles Dokument anzusehen, muß man seine Nummer eingeben.
Abb. 20.5: .WHY: Welche Gewichtungswerte erhalten die Suchargumente? Documents
Documents
Retrieved
Matched
Term Importance (0-100)
HAMBACH
8
373
29
RHEINBRAUN
49
675
25
GARZWEILER
50
1080
23
CLEMENT
48
4013
15
OPINIONS
1
13003
9
WOLFGANG
46
89679
FUTURE FOR
1
—
—
—
—
—
—
Quelle: Lexis-Nexis
Der WHY-Bildschirm (Abbildung 20.5) listet ebenfalls alle Schlagworte der Freestyle-Suche auf. Genannt werden auch diejenigen Terme, die wegen eines zu niedrigen Gewichtungswertes keine Berücksichtigung beim Retrieval fanden. Der Rechercheur bekommt zu jedem „guten" Schlagwort drei Angaben: •
die Anzahl der Dokumente zu dem Schlagwort in der Treffermenge
•
die Anzahl der Dokumente zu dem Schlagwort in der Datenbank
•
der auf das Intervall [0,100] normierte Gewichtungswert der inversen Dokumenthäufigkeit (IDF).
Die Schlagworte sind nach Wichtigkeit geordnet. In unserer Suche kommt nur das Schlagwort „Garzweiler" in allen 50 Datensätzen vor. Jedes Vorkommen dieses Wortes in einem Text wird mit dem Faktor 23 gewichtet. „Hambach", in der Gesamtdatenbank viel weniger besprochen als „Garzweiler", erhält entsprechend einen größeren Gewichtungswert. Das Wort „Hambach" wird mit 29 gewichtet. Ein Wort wie „Wolfgang", knapp 90.000mal in der Datenbank, fällt kaum ins
414
20 Fallstudien
Gewicht. Ein Auftreten von „Hambach" ist im Schnitt genauso wichtig wie 29mal „Wolfgang". Die Informationen aus den WHERE- und WHY-Bildschirmen zeigen, wie Freestyle mit einer Suchfrage umgegangen ist. Damit klärt sich für den Suchenden, „was überhaupt abläuft". Man kann aber hier auch in das Geschehen eingreifen, indem man etwa gewisse Suchterme als „mandatory" kennzeichnet, einige Terme in der Suchfrage tilgt, Synonyme löscht oder hinzufugt usw. Die natürlichsprachige Suche läßt sich nämlich durchaus optimieren, indem man mit Formulierungsvarianten arbeitet und durch .where und .why seine Frage verbessert.
Assoziatives Retrieval: More Gesetzt den Fall, der Suchende hat einen Datensatz gefunden, der voll zutreffend ist, dann kann er mit diesem Dokument weitersuchen. Der Befehl „More like this" besagt: „Suche mir Datensätze, die meinem Muster so ähnlich wie möglich sind"! Lexis-Nexis öffnet sich damit einer weiteren Retrievalform, dem assoziativen Retrieval. Das Suchargument ist keine mengentheoretische Verknüpfung, auch kein natürlichsprachiger Satz, sondern ein ganzer Text, der als Muster fungiert. In Abbildung 20.6 gehen wir von einem Patent aus. Wie man an sein Muster kommt, ist irrelevant. Es kann durch Boolesches oder natürlichsprachiges Retrieval gefunden worden sein. Es kann auch schon längst bekannt sein; man ruft es in diesem Fall bei Lexis-Nexis auf. Das assoziative Retrieval wird durch den Befehl .more initiiert. Das Musterdokument muß genügend lang sein, sonst findet das System keine Suchbegriffe. M O R E arbeitet in zwei Varianten, erstens mit Schlagworten, die automatisch dem Muster entnommen werden, und zweitens mit Zitationen. Die zitatenanalytische Variante von MORE ist in solchen Fällen möglich, wo in standardisierter Form zitiert wird, bei Lexis-Nexis also bei Patentnummern oder Gerichtsurteilen. Gesucht wird nach solchen Patenten, Fällen usw., deren Zitationen am meisten mit den Zitationen des Modelldokuments übereinstimmen. Die Anzahl der übereinstimmenden Zitationen gilt hierbei ein Ähnlichkeitsmaß der betreffenden Texte.
20 Fallstudien
415
Abb. 20.6: MORE: Automatische Kreation von Suchargumenten 5,144,317 Sep. 1, 1992 Method of determining mining progress in open cast mining by means of satellite geodesy INVENTOR: Duddek, Herbert, Bergheim, Federal Republic of Germany Klemmer, Wilfried, Dahlem, Federal Republic of Germany Koeppen, Herbert, Berqheim, Federal Republic of Germany ASSIGNEE-AT-ISSUE:
Rheinbraun
Aktiengesellschaft, Köln, Federal
Republic of Germany (03) ... (gekürzt) . .. .more Search Description: RECEIVER, BUCKET, WHEEL, EXTRACTION, SATELLITE, DEPOSIT, MINING, EXCAVATOR, APPARATUS, CO-ORDINATE, SIGNAL, JIB, "Pat. No. 4675684" LEXIS searched for the following citation and its parallels: "Pat. No. 4675684"
Quelle: Lexis-Nexis
Die Schlagwortvariante von MORE arbeitet mit Freestyle, d.h. es werden aus dem Musterdokument automatisch Schlagworte selektiert. Wie bei Freestyle, so können auch hier die Suchwörter bearbeitet werden. Das assoziative Retrieval verläuft in vielen Fällen zufriedenstellend, insofern interessante neue Dokumente gefunden werden. Grundvoraussetzung ist, daß mit einem ideal passenden Mustertext gearbeitet wird.
Verwandte Begriffe: Anwendung des statistischen Thesaurus Häufig in einem Vektor gemeinsam vorkommende Wörter werden bei Lexis-Nexis durch
einen
eigenen
Befehl
„Related
Concepts"
aufgelistet.
„rel(Suchterm)" im Booleschen Retrieval oder durch Option (4) im
Mittels Freestyle-
Bearbeitungsbildschirm (Abbildung 20.2) erhält der Rechercheur zu einzelnen Suchwörtern oder Suchphrasen eine Liste von (mehr oder weniger) verwandten Begriffen. Da hier ausschließlich über Zählmaße gearbeitet wird, darf nicht mit der Qualität einer Assoziationsrelation eines Thesaurus gerechnet werden, sondern
20 Fallstudien
416
durchaus mit zum Teil passenden, zum Teil aber völlig inadäquaten Wörtern. Dafür arbeitet die „Related Concepts"-Software auch mit mehreren Suchwörtern. Sucht man, wie wir in Abbildung 20.7, mit zwei Phrasen, so erhält man diejenigen Terme, die mit beiden Suchargumenten häufig zusammen auftreten (und die zusätzlich in den Texten häufig vorkommen). Die empirischen ordnungstheoretischen Analysen bringen interessante und praktisch brauchbare Resultate. Die Liste der gemeinsamen verwandten Begriffe zu „Gerhard Schröder" und „Helmut Kohl" (recherchiert zur Zeit der deutschen Bundestagswahl 1998) enthält erwartungsgemäß „chancellor" (Term 2), „Germany"/ „German" (Terme 1 und 16) und die Namen ihrer beiden Parteien (Terme 5 und 7), aber auch Überraschungen wie „grand coalition" (Term 10) oder die „Greens" (Term 17). Die Wörtersammlung wird als Vorschlagsliste verstanden. Der Nutzer selektiert einige Begriffe und Ubernimmt diese in seine (mengentheoretische oder natürlichsprachige) Suche. Sucht man im Rahmen der Booleschen Logik, so ist die Wahl des Operators freigestellt. Dies ist ein weiterer Unterschied zur Assoziationsrelation eines Thesaurus, die in Richtung eines Booleschen ODER fuhrt. Lexis-Nexis führt zwei „statistische Thesauri", einen für den Rechtsbereich und einen zweiten für den News-Teil. Abb. 20.7: Related Concepts rel(gerhard schroeder) and
(rel(helmut kohl))
TOPIC: "GERHARD SCHROEDER", "HELMUT KOHL" Enter concept numbers of interest and press ENTER (e.g. 1,2,3-4)
Exit Related concepts
1 Germany
2 chancellor
3 coalition
4 reform
5 Christian Democratic Union
6 poll
7 SOCIAL DEMOCRATIC PARTY
8 campaign
9 employer
10 grand coalition
11 politician
12 victory
13 vote
14 voter
15 welfare
16 German
17 Greens
18 Social Democrats
Quelle: Lexis-Nexis
417
20 Fallstudien Bewertung von Freestyle
Kommen wir mit Freestyle dem „heiligen Gral" der Rechercheure näher? Allerdings: ja, wir finden Datensätze, die im Booleschen Retrieval nicht gezeigt werden, erhöhen demnach den Recall, und haben gleich mehrere Möglichkeiten, durch relevance ranking und den kombinierten Einsatz von Freestyle und Boolescher Suche die Präzision der Ergebnismenge zu erhöhen. Das assoziative Retrieval mit Musterdatensätzen (More) eröffnet neue Retrievalperspektiven. Zudem kann die Idee des statistischen Thesaurus (mit den Related Concepts) nur begrüßt werden. Freestyle und More ermöglichen dem Laien, ohne fundiertes informationspraktisches Wissen Ergebnisse zu bekommen. Aber erst in der Anwendung eines Information Professional unter Ausnutzung aller Optionen zeigt sich die Mächtigkeit dieses Retrievalsystems richtig. Die informationslinguistischen, -statistischen und ordnungstheoretischen Vorgaben bei kommerziellen Systemen natürlichsprachiger Suchen - und dies gilt nicht nur für Freestyle, sondern auch für Target, WIN und weitere Systeme - sind bei weitem noch nicht ausgereizt. Wortstammanalysen können besser werden, die Analyse der Pronomina muß in Angriff genommen werden. Bei fachlich einheitlichem Material wäre ein Thesaurus oder Klassifikationssystem, dessen Deskriptoren und Notationen auf der Basis automatischer Indexierung den Dokumenten zugeordnet würden, durchaus hilfreich. (Profound kann dies, und das ist ein großer Wettbewerbsvorsprung. Lexis-Nexis arbeitet für den Lexis-Teil daran.)
20.3 Anatomie einer Online- und CD-ROM-Datenbank: Die ifo Literaturdatenbank Wie kann man fachliches Wissen abfragbar speichern? Mit welchen Methoden werden elektronische (Online- oder CD-ROM-)Datenbanken aufgebaut? Wie werden die Datenbanken aktuell gehalten? Welche Qualitätskriterien gelten beim Aufbau und bei der Fortschreibung von elektronischen Datenbanken? In dieser Fallstudie wird versucht, diese Fragen anhand eines konkreten Beispiels, der ifo Literaturdatenbank,
zu beantworten (vgl. Stock/Fink 1993). Die Auswahl
dieser Datenbank liegt darin begründet, daß der Verfasser deren Anatomie recht gut kennt, da er sie vor einigen Jahren selbst erstellt hat. Diese elektronische Datenbank weist alle Literatur nach, die das ifo Institut für Wirtschaftsforschung in München, eines der großen Wirtschaftsforschungsinstitute Deutschlands, publiziert. Die Daten-
20 Fallstudien
418
bank liegt als Online-Version bei drei Datenbankanbietern {GBl, GENIOS und FIZ Technik) auf, ist Teil des CD-ROM-Produktes WISO und dient als Basis für die Buchreihe ifo Dokumentation.
Zugänge zur ifo Literaturdatenbank Wissenschaftliches Wissen manifestiert sich in der Regel in Publikationen, in Aufsätzen, Büchern oder in der sog. grauen Literatur. Verteilt werden die Publikationen durch informelle Kanäle (Versand an Kollegen) oder durch formale Kanäle (Verlage, Buchhandel, organisierter Schriftentausch zwischen Institutionen). Gesammelt werden sie in den privaten Archiven oder in Bibliotheken. Durch die Masse an Publikationen verliert der einzelne, egal ob Fachwissenschaftler oder Laie, schnell den Überblick, wo etwas Relevantes geschrieben worden ist. Datenbanken helfen bei diesem Problem. Sie speichern die Inhalte der Publikationen abfragbar ab. Die ifo Literaturdatenbank wertet die gesamte Literatur aus, die das Münchner Wirtschaftsforschungsinstitut erarbeitet. Seit dem Jahrgang 1988 sind bis 1999 knapp 7.000 Nachweise gesammelt. Seit August 1990 läuft diese Datenbank unter der Suchsprache TRIP bei GENIOS Wirtschaftsdatenbanken,
seit September 1992 unter
SUDOK bzw. AOS („Advanced Online Search") bei der Gesellschaft für Betriebswirtschaftliche Information (GBl) und seit Januar 1995 als Teil der ifo Wirtschaftsdatenbanken bei FIZ Technik (ebenfalls unter der GBI-Retrievalsprache AOS). Aus der Online-Version der Datenbank bei der GBl wird seit Anfang 1994 die CDROM-Version als Teil der WISO hergestellt (vgl. Stock/Striefler/Thomsen 1994). Im Local Area Network des ifo Instituts ist die Datenbank unter der Software LARS von jedem PC-Arbeitsplatz aus abfragbar. Je nach elektronischer Umgebung ist die Datenbank jeweils anders plaziert. Bei den beiden großen deutschen Wirtschaftshosts GBl und GENIOS wird ein Kontext von Wirtschaftsinformationen vorgefunden; jeweils über 100 wirtschaftspraktische wie wirtschaftswissenschaftliche Datenbanken sind im Angebot, angefangen bei den Volltexten des Handelsblatts bis hin zu den Unternehmensdossiers und Bilanzen der Creditreform-D&XmbdiVkzn. Der Kunde wird die ifo Literaturdatenbank
vorwiegend
nutzen, um Hintergrundinformationen volkswirtschaftlicher Art ergänzend zu seinem wirtschaftlichem
Informationsproblem
zu
recherchieren.
Die
hauptsächlichen
Nutzergruppen der Datenbank liegen bei den großen Dienstleistern (Consultants,
419
20 Fallstudien
Banken, Versicherungen) sowie bei den Informationsstellen der Unternehmen der Großindustrie. FIZ Technik ist ein Datenbankanbieter mit dem Schwergewicht auf technischen Informationen. Wirtschaftsinformationen spielen eine eher beiläufige Rolle. Die ifo Wirtschaftsdatenbank dokumentation
(die außer der ifo Literaturdatenbank
noch die ifo
Osteuropa-
enthält) wird entsprechend als Ergänzung zur einer Technikrecherche
genutzt, etwa um wirtschaftliche Aspekte von Techniken oder von Branchen zu suchen. Auf der CD-ROM WISO II trifft die ifo Literaturdatenbank schaftswissenschaftliche Datenbanken, ECONIS Kiel, die HWWA-Wirtschafisdatenbank
vom HWWA-Institut für Wirtschaftsfor-
schung in Hamburg, die ifo Osteuropadokumentation thek.
Die
WISO
II
enthält
auf vier weitere wirt-
vom Institut für Weltwirtschaft in
demnach
und den Katalog der ifo Biblio-
Nachweise
nahezu
aller
wirtschafts-
wissenschaftlicher Literaturstellen, die in Deutschland vorgehalten werden (vgl. Fink/Smit 1994). Die (zahlenden) Kunden der WISO sind in der Hauptsache die Universitäts- bzw. Fachhochschulbibliotheken, die Nutzer sind Studenten und Hochschulangehörige.
Dokumentationswürdigkeit Die Dokumentationswürdigkeit bei der ifo Literaturdatenbank
wird durch das „Ver-
ursacherprinzip" bestimmt. Demnach ist ein Institut auch für die elektronische Aufbereitung und Verteilung seiner Forschungsergebnisse verantwortlich. Im Rahmen dieser Vorgabe ist die ifo Literaturdatenbank
idealiter komplett. Sie vervollständigt
damit deutsche volkswirtschaftlich orientierte bibliographische Datensammlungen wie ECONIS und HWWA Wirtschafisdatenbank
für Wissenschaft
und Praxis, sowie
die Volltextdatenbanken des Deutschen
Instituts für Wirtschaftsforschung,
des Instituts für
Halle, sowie des
Wirtschaftsforschung,
Instituts für Wirtschaftsforschung,
Berlin,
Rheinisch-Westfälischen
Essen.
Die Themenschwerpunkte der ifo Literaturdatenbank
sind - als Folge des Ver-
ursacherprinzips - mit den Forschungsthemen des ifo Instituts identisch. Die am meisten
abgehandelten
Aspekte
betreffen die
Wirtschaft der
Bundesrepublik
Deutschland (auch mit besonderem Augenmerk auf die neuen Bundesländer), Konjunktur, Geschäftsklima, Industrie bzw. verarbeitendes Gewerbe, Produktion, Inve-
420
20 Fallstudien
stition, Konsum, die Europäische Union bzw. den EU-Binnenmarkt, Bauwirtschaft, Japan, Entwicklungsländer sowie Osteuropa. Aber auch zu speziellen wirtschaftswissenschaftlichen Fragestellungen kann man in der ifo Literaturdatenbank
relevante Nachweise finden, länderspezifisch z.B. zu
Namibia, wissenschaftlich-technisch zu Laser, Abfallentsorgung, Elektronik bis hin zur Elektroschlacke-Umschmelzung, finanzwirtschaftlich z.B. zum japanischen Yen oder zum Endaka-Boom, kulturell zu Design oder Musik. Ergänzt wird die Literatur des ifo Instituts durch die Nachweise von Publikationen von ERECO (European Economic Research and Advisory Consortium, Brüssel), einem internationalen Netzwerk wirtschaftswissenschaftlicher Forschungsinstitute, an dem das ifo Institut beteiligt ist, sowie von CIRET (Centre for International Research on Economic Tendency Surveys, München), dessen Geschäftsstelle beim ifo Institut beheimatet ist. Neben der ifo Literaturdatenbank produziert das Informationszentrum des ifo Instituts eine Datenbank zur Wirtschaft der osteuropäischen Transformationsländer (online via GENIOS, GBl und FIZ Technik) sowie eine Online-Version des Bibliothekskatalogs {GBl). Das Dienstleistungsangebot des ifo Informationszentrums umfaßt neben der Erstellung von Datenbanken eine Online-Informationsvermittlungsstelle sowie eine wirtschaftswissenschaftliche Spezialbibliothek.
Inhaltserschließung Inhaltserschließung
meint die Abbildung aller dokumentationswürdigen Themen
einer literarischen Vorlage auf semantische Felder einer Dokumentationseinheit im Rahmen einer Datenbank mit der Hilfe von Dokumentationsmethoden. Formalbibliographische Erfassung meint die Angabe von eineindeutigen Charakteristika zur Identifikation der literarischen Vorlage, aufgenommen in syntaktischen Feldern mit Hilfe von Regelwerken. Qualitätssicherung meint den richtigen Einsatz der richtigen Dokumentationsmethoden und der bibliographischen Regelwerke sowie das Vermeiden anderer Fehler (z.B. Rechtschreibefehler). Die ifo Literaturdatenbank
setzt bei der Inhaltsabbildung fünf Dokumentations-
methoden ein, die sich gegenseitig ergänzen: •
Deskriptoren des Standard-Thesaurus Wirtschaft
•
Textwortmethode
20 Fallstudien
421
•
Sachgebietsklassifikation
•
Ländercode
•
Abstracts.
Dabei kommen Abstract, Deskriptoren nach dem Thesaurus Wirtschaft bzw. Textwörter sowie mindestens eine Notation der Sachklassifikation in jedem Nachweis zwingend vor. Ländercodes werden nur dann vergeben, wenn ein Dokument die Wirtschaft eines Landes oder einer Region zentral thematisiert. Zu jeder der Dokumentationsmethoden gibt es ein spezielles Feld. Da es hier um die Abbildung von bedeutungstragenden
Informationen geht, sprechen wir von
„semantischen Feldern". Die semantischen Felder werden einzeln und nach unterschiedlichen Regeln mit Termen belegt und müssen entsprechend differenziert abgefragt werden. Eine Suche ohne Feldqualifikation läuft bei den Online-Versionen über alle Datenbankfelder und ist von daher nicht empfehlenswert. Wohl kann man gewisse Felder, deren Inhalte zueinander „passen", gemeinsam abfragen. Bei TRIP lassen sich über den Befehl
DEFINE VIEW BI=DE,KL
beispielsweise die Deskriptoren und Notationen zum Feld "BI" zusammenfassen; bei SUDOK können an einen Suchbegriff mehrere Feldkürzel angehängt werden, etwa: SUCHTERM.TI,TX. Die wichtigste Dokumentationsmethode der Inhaltserschließung bei der ifo Literaturdatenbank ist der Einsatz eines Thesaurus. Gearbeitet wird mit dem StandardThesaurus Wirtschaft. Die Themen des ifo Instituts übersteigen häufig die Grenzen der wirtschaftswissenschaftlichen Terminologie und damit die Ausdruckmöglichkeiten des StandardThesaurus Wirtschaft. Bei Strukturanalysen beispielsweise kommt eine technologische Terminologie ins Spiel oder bei der Kulturökonomie geistes- bzw. kulturwissenschaftlicher Wortschatz. Auch ist die Wirtschaftswissenschaft in ihrer Terminologie Wandlungen ausgesetzt, die erst mit Zeitverzug in einen Thesaurus Eingang finden können.
422
20 Fallstudien
Bei allen Themen, die über den Thesaurus Wirtschaft hinausgehen, wird die Textwortmethode eingesetzt (vgl. Henrichs 1980). Hiernach dürfen nur solche Termini zur Markierung eines Sucheingangs in einen Text Verwendung finden, die im betreffenden Text auch vorliegen. Abgesehen von Normierungen auf eine grammatische Grundform soll dabei das Originaltextwort erhalten bleiben. „Datenbanken ... als Nachweisinstrumente eines in der betreffenden Fachliteratur geführten pluralen Diskurses müssen wohl generell auch als Spiegel für semantisch-pluralen Sprachgebrauch gelten, also prinzipiell mit der Problematik einer Bedeutungsinkonsistenz der (meisten) Einträge ihrer Suchwörterbücher behaftet sein" (Henrichs 1992, 189 f.). Für das Online-Retrieval ist die Textwortmethode in ihrer ursprünglichen Form sehr umständlich, gibt es doch Sucheinstiege in so vielen Sprachen und Formulierungsvarianten, wie es Texte zum Thema gibt, und alle diese muß der Informationssuchende zusammenklauben. Andererseits kann man nur so Änderungen in der Wissenschaftssprache direkt erkennen, denn Thesauri und Klassifikationssysteme mit ihren vorgegebenen Strukturen leisten dies mitnichten. „Die meisten heute zugänglichen bibliographischen Datenbanken bieten damit leider nicht die Voraussetzungen für eine (detaillierte) automatisierte Ermittlung von möglichem Begriffswandel ..." (Henrichs 1992, 192). Für Henrichs sind hierbei „Qualitätsstandards für bibliographische Datenbanken" (Henrichs 1992, 201) angesprochen. Einerseits brauchen wir die Textwortmethode zur Analyse der Terminologie der Wissenschaftssprache und deren Wandel, zum anderen hat die Textwortmethode Probleme im Online-Retrieval. Die i/o Literaturdatenbank
verwendet die Textwortmethode in einer abgewandelten
Form. Da die Datenbank alle Themen in deutscher Sprache ansetzt, arbeitet sie mit der Variante der Textwortmethode mit Übersetzungsrelation (vgl. M.Stock 1989). Ausländische sinntragende Terme werden (bei möglichst wörtlicher Übersetzung) ins Deutsche übertragen; bei deutschsprachiger Literatur wird die Originalform der Textwortmethode eingesetzt. Eine Rezension über die Suchhilfen zur ifo Literaturdatenbank
versorgt uns mit
einem Beispiel. Für den Rezensenten sind „Golf-Konflikt" und „Golf-Krise" „vermutlich identisch". Nach der Textwortmethode hat sich ein Indexer solcher „Vermutungen" zu enthalten und das betreffende Textwort zu übernehmen. Die Verwendung gerade der Textwörter über die Probleme am Persischen Golf zeigt eine Entwicklung vom Term „Golf-Konflikt" (Frühherbst 1990) über „Golfkrise" (Jahreswechsel 1990/1991) hin zum „Golfkrieg" (1991).
423
20 Fallstudien
Wichtig ist diese Dokumentationsmethode auch bei Zeitangaben. Ein Teil der literarischen Vorlagen betrifft Wirtschaftsanalysen und -prognosen für bestimmte Zeiträume. Diese Zeiten werden in der Form jjjj für Jahresangaben bzw. jjjj.mm für Monatsarigaben notiert. Das häufige Vorkommen eines neuen Eintrags im Feld der Textwortmethode deutet auf terminologischen Wandel hin. Sind die betreffenden Einträge irgendwann zu Deskriptoren des Thesaurus geworden, so müssen die Textworteinträge gelöscht und die Deskriptoreinträge im Feld der Deskriptoren neu erstellt werden. Deskriptoren wie Textwörter sagen nichts über die Wichtigkeit eines Themas in einer Vorlage aus, sie markieren lediglich, daß ein Thema überhaupt besprochen wird. Innerhalb der Textwortmethode ist zwar ein gewichtetes Retrieval möglich (vgl. Henrichs 1980), aber nur, wenn man die sog. "Indexziffern" zur Markierung thematischer Ketten benutzt. Da die Softwareprodukte, unter denen die ifo Literaturdatenbank derzeit läuft, weder Indexketten noch gewichtetes Retrieval zulassen, bleibt der ifo Literaturdatenbank
- und nicht nur ihr - dieser (elegante) Weg verschlossen.
Sachgebietsklassifikation Zur groben Verortung der dokumentarischen Bezugseinheiten in Rubriken sind Klassifikationssysteme anwendbar. Diese unterteilen in hierarchischer Manier die Elemente eines Sachgebiets und ordnen den entstehenden Klassen Notationen zu. Solche Notationen arbeiten in der Regel nicht mit umgangssprachlichen Begriffen (wie ein Thesaurus), sondern mit Zahlen- bzw. Buchstabenkombinationen. Die ifo Literaturdatenbank
setzt die Sachklassifikation des Fachinformationsver-
bundes „Internationale Beziehungen und Länderkunde" ein. Dieses Klassifikationssystem arbeitet mit elf großen Rubriken (SB: International/e/s Politik / System; SC: Internationale Sicherheit; SE: Staat; SG: Wirtschaft; SH: Umwelt / Natur usw.). Die Untergliederung für die Rubrik SG (Wirtschaft) zeigt Abbildung 20.8. Jedes Dokument muß mindestens einer Klasse zugeordnet werden. Notiert werden bei der ifo Literaturdatenbank
nicht nur die Notationen, sondern parallel dazu auch
die (deutschsprachigen) Klassentitel. Letzteres ist zwar - logisch gesehen - überflüssig, da nur eine Dopplung, bringt aber für die Nutzer den Vorteil, nicht unbedingt das Notationssystem vorliegen zu haben.
424
20 Fallstudien
Die Sachgebietsklassifikation dient im Online- und CD-ROM-Retrieval zur Grobsuche. Bei der Erstellung von Druckwerken aus der Datenbank ist sie nützlich für die Kapiteleinteilung des entstehenden Buches.
Abb. 20.8: Sachgebietsklassifikation - Rubrik SG: Wirtschaft Notation SG
Klassentitel Wirtschaft
SG01
Wirtschaftsordnung
SG02
Wirtschafts-/Entwicklungspolitik/Staat/Politik
SG02.01 SG03
Wirtschaftsreformen Wirtschaftsentwicklung/-struktur
SG03.01
Wirtschaftsstruktur
SG03.02
Konjunktur
SG03.03
Konsum
SG03.04
Investition/Innovation
SG04
Regionale/lokale Entwicklung
SG05
Agrarwirtschaft
SG05.01
Landwirtschaft/Forstwirtschaft
SG05.02
Viehwirtschaft/Fischereiwirtschaft
SG05.03
Ernährung
SG06
Gewerbliche Wirtschaft
SG06.01
Industrie
SG06.02
Bauwirtschaft
SG07
Tertiärer Sektor/Dienstleistung
SG07.01
Verkehr/Transport/Tourismus
SG07.02
Post-/Fernmeldewesen/Telekommunikation
SG07.03
Geld/Kredit/Banken/Versicherungen
20 Fallstudien
425
SG07.04
Handel
SG07.05
Kultur
SG07.06
Informationswirtschaft
SG08
Arbeit/Beschäftigung/Lohn
SG09
Öffentliche Finanzen
SG10
Unternehmen/Management/Betriebswirtschaft
Quellen: Fachinformationsverbund Internationale Beziehungen und Länderkunde; ifo Institut für Wirtschaftsforschung
Ländercode Eine Notation zum Ländercode wird nur dann vergeben, wenn eine Vorlage die Wirtschaft eines Landes, einer Region, eines Landesteiles usw. zentral abhandelt. Im Gegensatz zu den Deskriptoren bzw. Textwörtern und zu den Notationen der Sachgebietsklassifikation kommen Ländercodes also nicht immer vor. Im internationalen Bereich findet die Codetabelle von Predicasts Verwendung. Die Predicasts Country Codes sind fünfstellige Notationen, deren erste Stelle eine Weltregion (z.B. 1 für USA, 4 für Europa, 9 für Asien und Ozeanien) und deren zweite bis fünfte Stelle ein Land oder eine Region bestimmt, etwa 4EUGE für Deutschland oder 9JAPA für Japan (s.o.Kap. 10.3, S. 234). Für den deutschen Bereich wurde im ifo Institut ein eigener Code entwickelt (Abbildung 20.9). Wie der Predicasts-Code (und auch die Notation der Sachgebietsklassifikation) ist er für den Einsatz der Rechtsfragmentierung ausgelegt, d.h. man kann hierarchisch suchen, indem man an einer bestimmten Stelle das Jokerzeichen setzt. Der Predicasts-Notation für Deutschland werden zur Markierung der alten bzw. neuen Länder A bzw. N angehängt. Die nächsten drei Stellen bestimmen das Bundesland, z.B. BAY für Bayern. Die letzte Stelle ist für Städte vorgesehen (sie wurde allerdings erst einmal vergeben). Die Notation für München setzt sich aus dem PTSCode für Deutschland (4EUGE), A (alte Länder), BAY (Bayern) sowie M (München) zusammen und lautet 4EUGEABAYM.
426
20 Fallstudien
Abb. 20.9: Ländercode - Ausschnitt Deutschland Notation
Land
4EUGE
Deutschland
4EUGEA
alte Bundesländer
4EUGEABAW
Baden-Württemberg
4EUGEABAY
Bayern
4EUGEABAYM
München
4EUGEABER
Berlin
4EUGEABRE
Bremen
4EUGEAHAM
Hamburg
4EUGEAHES
Hessen
4EUGEANIE
Niedersachsen
4EUGEANRW 4EUGEARHP
Nordrhein-Westfalen Rheinland-Pfalz
4EUGEASAA
Saarland
4EUGEASCH
Schleswig-Holstein
4EUGEN
neue Bundesländer
4EUGENBRA
Brandenburg
4EUGENMEV
Mecklenburg-Vorpommern
4EUGENSAC
Sachsen
4EUGENSAA
Sachsen-Anhalt
4EUGENTHU
Thüringen
Quellen: Predicasts / ifo Literaturdatenbank
Fragmentiert man den Suchbegriff etwa durch 4EUGEABAY$, so erhält man alle Literatur zur Wirtschaft Bayerns im allgemeinen und zusätzlich alles über München.
427
20 Fallstudien Abstracts
Während mit Deskriptoren, Textwörtern, Notationen und Codes beschrieben wird, welche Themen in der literarischen Vorlage abgehandelt werden, berichtet das Abstract darüber, was jeweils zu den Themen ausgesagt wird. Es faßt somit die dokumentationswürdigen Sachverhalte zusammen. Der Umfang der Referate der i/o Literaturdatenbank schwankt zum Teil beträchtlich zwischen wenigen Zeilen und einer Bildschirmseite, je nach Länge und Themendichte der Vorlage. Die Indexer sind bemüht, zumindest die zentralen Aussagen und die wichtigsten Zahlenangaben im Abstract unterzubringen, so daß unter Umständen auf die Lektüre der Volltexte verzichtet werden kann.
Tabellenwerke Normalerweise bildet ein Indexat genau eine literarische Vorlage ab. Es gibt eine Ausnahme: Bei periodisch erscheinenden Tabellenwerken sind ausschließlich die jeweiligen Reihen aufgenommen, aber nicht die Stücktitel. (Als Jahresangabe wird hier "9999" notiert.) Die Abstracts von Tabellenwerken orientieren sich an den Tabellenüberschriften und nicht an den numerischen Werten, die in diesem Fall übergangen werden.
Formale Erfassung Das fuhrende Regelwerk für die formale bibliographische Erfassung von literarischen Vorlagen sind im deutschen Sprachraum die Regeln für die alphabetische
Katalogi-
sierung (RAK). „Die RAK wurden 1977 als ein Regelwerk publiziert, das den heutigen
Formen
und
Titelangaben
von
Veröffentlichungen
und
dem
Infor-
mationsverhalten der Benutzer unserer Zeit gerecht zu werden suchte, das den internationalen Konsens in der Katalogisierung anstrebte und das die zur Präzision zwingenden Ansprüche der elektronischen Datenverarbeitung berücksichtigte" (RAK-WB 1983, V). Obwohl ftir Bibliotheken konzipiert, lassen sich die RAK auch - entsprechend modifiziert - bei dokumentarischen Tätigkeiten anwenden. Titelaufhahmen und Namensansetzungen der ifo Literaturdatenbank
orientieren sich an den RAK-
WB. Im Bereich elektronischer Datenbanken haben die Paragraphen 1 bis 208 sowie 501 bis 524 der RAK Relevanz für das korrekte Beschreiben der Titel und die Paragra-
428
20 Fallstudien
phen 301 bis 486 für das Ansetzen von Personen- und Körperschaftsnamen. Kaum sinnvoll für den Online-Einsatz sind die sog. „Nebeneintragungen" (Paragraph 601 ff.), da sich diese auf unterschiedliche KatalogAarte« beziehen, die es in der elektronischen Welt natürlich nicht gibt. In den Datenbanken ist jeder Eintrag jedes Feldes suchbar.
Bibliographische Angaben Formalbibliographische Angaben identifizieren eine literarische Vorlage, d.h. die Vorlage ergibt genau eine Beschreibung, und die jeweilige Beschreibung identifiziert genau eine Vorlage. Die Abbildungsrelation zwischen Vorlage und Beschreibung ist demnach eineindeutig. Zur Aufrahme der Identifikationsinformationen dienen die „syntaktischen Datenbankfelder". Je nach Online-Version (ifo LAN, GENIOS, GBl, Fiz Technik) differenziert die Anzahl der syntaktischen Felder. Während etwa in der Ursprungsversion nach Verlagsort, Verlag, Reihenangabe, Herausgeber u.ä. feldweise unterschieden wird, arbeiten die Online-Versionen mit einem einzigen QuelleFeld, das erst im Schnittstellenprogramm gemäß den Vorgaben der RAK-WB kreiert wird. Trennzeichen innerhalb von Eingabefeldern, z.B. die Trennung des Haupttitels von dem Untertitel und diese untereinander durch „Leerzeichen - Doppelpunkt - Leerzeichen" bzw. „Leerzeichen - Semikolon - Leerzeichen" (RAK-WB 1983, § 122, Pkt. b), werden vom Indexer bei der Dateneingabe berücksichtigt; Trennzeichen zwischen Einträgen
verschiedener
Felder,
etwa
vor
der
Ausgabebezeichnung
(durch
„Leerzeichen - Gedankenstrich - Leerzeichen") oder vor dem Erscheinungsjahr (durch „Leerzeichen - Komma - Leerzeichen"; vgl. RAK-WB 1983, § 120 ff.) werden durch das Schnittstellenprogramm eingefügt. Die Beschränkung der Anzahl von Autorennamen - wie sie die RAK-WB vorschreiben (auf maximal drei; vgl. RAK-WB 1983, § 601, Pkt. 3) - erscheint für elektronische Datenbanken wenig sinnvoll und wird dementsprechend bei der ifo Literaturdatenbank nicht angewandt. Ebenso werden entgegen den RAK (vgl. RAK-WB 1983, § 145, Pkt. 3) alle Verlagsangaben notiert.
429
20 Fallstudien Namensansetzungen Namen kommen in der i/o Literaturdatenbank
in mehreren syntaktischen Feldern
(z.B. Autor, Herausgeber) und im semantischen Feld der Textwörter (bei Namensthemen) vor. Alle Namen werden einheitlich angesetzt. Ansetzungen von Personen- und Körperschaftsnamen folgen ausschließlich den Regeln für die alphabetische Katalogisierung.
Eine Person wird normalerweise
„unter dem von ihr selbst gebrauchten Namen in der von ihr gebrauchten Namensform" (RAK-WB 1983, § 302, Pkt. 1) angesetzt, der erste Vorname wird dem Nachnamen nachgestellt, ein zweiter Vorname wird mit dem Anfangsbuchstaben abgekürzt (vgl. RAK-WB 1983, § 320, Pkt. 1). Fehlen in der Vorlagen Angaben zum Vornamen, so fordert das Regelwerk, „fehlende oder abgekürzte erste Vornamen nach Möglichkeit" zu ermitteln (RAK-WB 1983, § 322, Pkt. 1). Die i/o Literaturdatenbank ergänzt nach Möglichkeit den Vornamen, was allerdings nicht immer geschehen kann, da der Aufwand zur Namensansetzung ein gewisses Arbeitsquantum nicht übersteigen darf. Körperschaften werden im allgemeinen „unter ihrem offiziellen Namen angesetzt" (RAK-WB 1983, § 401, Pkt. 1). Wäre beispielsweise die Zeichenfolge „T. Boone Pickens" in der Vorlage ein Namensthema, so wäre die Ansetzung gemäß Personennamen zutreffend und müßte unter
Pickens, T. B.
aufgenommen werden. Ist die Firma (gleichen Namens) gemeint, so gilt die Körperschaftsaufhahme, und die lautet nach RAK-WB richtig angesetzt
T. Boone Pickens.
Qualitätssicherung In der Regel werden die grundlegenden Qualitätsmerkmale einer Datenbank am Anfang der Geschichte einer Datenbank durch Design, Dokumentationsmethoden und Regelwerk festgelegt. Durch Anpassungen an die Kundenwünsche kann es möglich sein, daß auch grundlegende Merkmale geändert werden können. So wurde bei
430
20 Fallstudien
der i/o Literaturdatenbank
Ende 1994 das Klassifikationssystem N.A.C.E. (das bei
den Nutzern seinerzeit nicht „angekommen" ist) durch die oben beschriebene Sachgebietsklassifikation ausgetauscht. Hierzu mußten alle
Dokumentationseinheiten
überarbeitet werden. Beim Datenbankdesign ist darauf zu achten, die Fehlerquellen durch Zerlegung der Nachweisstruktur in möglichst viele einzelne Felder zu verringern. Bei der Inputversion der i/o Literaturdatenbank
arbeitet der Datenbankproduzent mit 30 Eingabefel-
dern, die Onlineversionen beinhalten bei GENIOS
15 und bei der GBl 12 Felder. So
wird - wie bereits berichtet - das Quelle-Feld in den Onlineversionen aus verschiedenen Feldern der Inputversion erst im Schnittstellenprogramm kreiert. Die Auswahl der richtigen Dokumentationsmethoden bzw. bibliographischen Regelwerke ist ein weiteres Qualitätsmerkmal. Mit einer Vielzahl sich ergänzender Methoden der Inhaltsabbildung sowie mit der Anwendung des führenden Katalogisierungsregelwerkes ist zu hoffen, daß ein hoher Qualitätsstandard erreicht wird. Während die Qualitätssicherung bei den „richtigen Dingen" mit dem Ersterstellen der Datenbank abgeschlossen ist, erfolgt die Überprüfung, diese „Dinge richtig" einzusetzen, ständig. Neben der Schulung der Mitarbeiter als Instrument der Qualitätssicherung werden bei der ifo Literaturdatenbank Kopieren
vorhandener
mehrere Werkzeuge eingesetzt.
Terme. Das für die Inputversion benutzte Datenbanksystem
LARS bietet die Möglichkeit, bereits einmal vergebene Zeichenfolgen aus dem Indexfenster einzukopieren. Das Kopieren der Wörter ist in diversen Feldern mit häufig wiederkehrenden Einträgen (z.B. Autorennamen, Verlage, Verlagsorte, Deskriptoren, Notationen, Regionalcodes) sinnvoll und vermeidet Tippfehler. Beim Kopiervorgang können im Indexfenster Fehler, die bereits vorhanden sind, identifiziert und somit ausgebessert werden. Korrekturen
während
Update. Anhand der Updatenummer werden die zwischen
zwei Updates neu hinzugekommenen Nachweise selektiert und ausgedruckt. Die entstehende Liste wird intellektuell durchgesehen und korrigiert. Nach erfolgter Online-Korrektur wird der Retrievallauf wiederholt, das Ergebnis wird über bestimmte Schnittstellenprogramme (Reports) als Datei ausgegeben. Die Reports werden mittels Turbo-Pascal-Programmen der Software der Hosts angepaßt. Neben der veränderten Feldstruktur wird insbesondere der Zeichensatz verändert. Während der Datenbankproduzent den kompletten ASCII-8-bit-Code ausnutzt, arbeiten die Hosts mit dem ASCII-7-bit-Code. Die Code-Konvertierung arbeitet mit Zuordnungslisten (z.B. „Ä" zu „ Ae"; „ß" zu „ss").
431
20 Fallstudien
Neuladen der Datenbank. Viele Fehler, die in der Inputversion schon längst verbessert wurden, sind in den Online- bzw. CD-ROM-Versionen noch vorhanden. Sie können nur Uber das Neuladen der Datenbank ausgebessert werden, d.h. die gesamte (alte) Datenbank wird beim Host gelöscht und durch eine neue Datenbank ersetzt. Im Rahmen der Online-Geschichte der ifo Literaturdatenbank
erwies es sich bisher
schon mehrmals als notwendig, die gesamte Datenbank neu zu laden.
Abb. 20.10: ifo Literaturdatenbank - Nachweisbeispiel Signatur: ifo str.2 1994,93 (2) Martsch, Silvia; Bauermeister, Junko: Informationsdefizite über Branchen und Märkte in Japan : Ergebnisse einer Unternehmensbefragung des ifo Instituts in: Japan : Analysen, Prognosen Nr. 93 (1994), März 1994, S. 06-19 Thematischer Rahmen: Sachklassifikation: Medien/Information/Meinungsbildung; Unternehmen/ Management/ Betriebswirtschaft Klassifikationscode: SF06; SG10 Ländercode: 9JPN; 4EUGE Schlagworte: Japan; Informationsbeschaffung; Deutschland; Informationsbedarf Abstract: Eine Umfrage bei über 700 west- und ostdeutschen Unternehmen erbrachte folgende Ergebnisse: Innerhalb der Industriesektoren beschäftigt sich die deutsche Investitionsgüterindustrie am intensivsten mit Japan. Große Unternehmen informieren sich auf vielfältigere Art und Weise als mittelständische Unternehmen. Informationsdefizite bestehen unabhängig von Industriesektoren und Beschäftigtenzahl bei Branchen-, Markt- und Technikinformationen; handelt es sich um große Unternehmen, auch bei Unternehmensdaten (Konkurrenzanalysen). In deutschen Unternehmen können kaum japanischsprachige Informationen verarbeitet werden.
Quelle: ifo Literaturdatenbank / Version ifo LAN
Suchhilfen Die Einträge in den semantischen Feldern sind in ständigem Wandel begriffen. Nicht nur, daß neue Themen hinzukommen, es werden auch gewisse Textwörter gelöscht
432
20 Fallstudien
und durch Deskriptoren ersetzt. Zudem werden Tippfehler verbessert. Den zu einer Zeit aktuellen Stand der suchbaren Termini dokumentieren Suchhilfen. Dies sind neben Beschreibungen des Datenbankdesign sowie Suchbeispielen - vorwiegend Listen mit allen Einträgen der semantischen Felder. Schreibfehler sind hierbei bewußt mit einbezogen, kann man doch sonst die betreffenden Vorlagen nicht finden. So geisterte eine gewisse Zeit das „europäische Gemeinschaf' durch die Datenbank; durch das inzwischen erfolgte Hinzusetzen des ,,-t" hat es sein ohnehin nur kurzes Leben beendet. Durch das Bereitstellen der Suchhilfen an den Benutzer hofft der Datenbankproduzent, der Qualitätsunsicherheit des Erfahrungs- oder Vertrauensgutes ifo Literaturdatenbank ein wenig von der Schärfe zu nehmen, weiß der Nutzer doch zumindest, was für Themen er in der Datenbank erwarten kann und welche nicht. Ein typischer Nachweis der ifo Literaturdatenbank wird in Abbildung 20.10 gezeigt.
20.4
Intranet-Lösung
einer wissenschaftlichen
Datenbank:
„Web of Science" „Web of Science" ist eine Intranet-Lösung für große forschungsintensive Unternehmen sowie für wissenschaftliche Bibliotheken. Es enthält alle Daten der Zitationsdatenbanken des „Institute for Scientific Information". Hier sollen nicht die Inhalte der Datenbank besprochen werden (dies wurde in Kapitel 16.1 bereits geleistet), sondern nur die Spezifika einer Intranet-Applikation.
Suchzugänge „Web of Science" hat zwei Zugangswege. Unterschieden wird nach Easy Search und Füll Search. (Es sei gleich hier betont, daß auch die Füll Search leicht zu bedienen ist.) Abbildung 20.11 zeigt den Umfang der Funktionalität von „Web of Science". Bei beiden Sucheinstiegen sind innerhalb der Suchfelder die Booleschen Operatoren AND, OR und NOT einsetzbar. Als einziger Abstandsoperator fungiert SAME (oder auch SENT), er verschärft das UND auf das Vorkommen beider Suchargumente innerhalb eines Satzes. Enthält ein Suchargument die Zeichenfolge eines Operators (z.B. der Zeitschriftentitel Architecture and Urbanism), so ist diese Zeichenfolge in Anfuhrungszeichen zu setzen (also Architecture nism).
„and"
Urba-
20 Fallstudien
433
Abb. 20.11: Funktionalität des „Web of Science" als Ablaufdiagramm
General Search Save Query
Full Search
Cited Reference Search
Topic Easy Seach
Person Place
Results Summary Marked List Sort Cited References
. Save to File
Citing Articles — Related Articles
— Print Link to Full Text
Export 1
— Document Delivery
Quelle: Stock 1999b
Suchtermfragmentierung geschieht durch ? (genau ein Zeichen) und * (beliebig viele Zeichen, einschließlich kein Zeichen). Rechtstruncation durch * erfordert mindestens drei Zeichen. Binnenfragmentierung ist möglich, Linkstruncation nicht. Phrasen werden nicht weiter gekennzeichnet, sondern schlicht in der natürlichen Wortfolge eingegeben.
„Web of Science" enthält ca. 200 Stoppwörter, die nicht suchbar sind. Hierbei handelt es sich um häufig vorkommende Terme wie Artikel (a, an, the), Präpositionen (z.B. of, in, for) oder Pronomina (z.B. it, their, his). Stoppwörter dürfen in Phrasen benutzt werden (beispielsweise in Death in Venice), gelten aber als Wildcard. In unserem Beispiel würden also alle Nachweise gefunden, die Death und Venice mit irgendeinem Wort dazwischen enthalten.
434
20 Fallstudien
Häufig vorkommende Tenne im Adreßfeld sind alleine nicht suchbar (u.a. Univ, Div, Dept), sondern nur als Teil einer Phrase. Relevance Ranking ist an mehreren Stellen im System eingesetzt. Der Algorithmus ist recht einfach gestrickt und berücksichtigt drei Aspekte: (1) gemeinsames Vorkommen der Suchargumente im Datensatz, (2) Häufigkeit des oder der Suchargumente im Datensatz und (3) Nähe der Suchargumente zueinander. Das (elektronische) Handbuch ist als Hypertext strukturiert und läßt kaum Wünsche offen. Es richtet sich an den Endnutzer, es erklärt anfallende Arbeitsvorgänge nachvollziehbar und bringt in der Regel ausfuhrliche Beispiele.
Easy Search: Zugang zu Sachthemen, Personen und Orten Der Nutzer legt zu Beginn seiner „Easy Search" den Umfang der Datenbanken fest (SC1E, SSCI oder A&HCI oder alle zusammen). Der Eingangsbildschirm fuhrt zu drei Optionen: •
Topic
•
Person
•
Place.
Für jede der Optionen ist ein eigener Suchbildschirm angelegt. Die Suche nach Topics erwartet die Eingabe von Suchargumenten zu Sachthemen, verbunden mit Operatoren. Als Sortiermöglichkeiten sind die Ausgabe nach Relevanz sowie nach (umgekehrter) zeitlicher Ordnung anzukreuzen. Die Personensuche unterteilt sich in drei Suchoptionen, (1) in die Suche nach Autoren, (2) nach Zitationen, die den gesuchten Namen zitieren, und (3) nach Artikeln, die die Person thematisieren. Unter Place sind alle Informationen suchbar, die aus den Anschriften der Autoren hervorgehen, also geographische Orte (z.B. alle Artikel von Autoren aus Köln; Achtung: „korrekte" Eingabe für das „Web of Science": Köln, Koeln oder Cologne), Institutionen (etwa nach Fachhochschule Köln) oder auch Abteilungen bzw. Fachbereiche (z.B. Fachhochschule Köln SAME Fachbereich Design). Da die Informationen aus den Adreßangaben der Autoren generiert werden, sind durchaus diverse Schreibweisenvarianten für ein und dieselbe Institution zu erwarten.
20 Fallstudien
435
Full Search: „Allgemeine" Suche und Suche nach zitierter Literatur Im „Füll Search"-Modus wird neben der Auswahl der Datenbank eine zeitliche Einschränkung angeboten. Neben „this week's update" gibt es „latest 2 weeks", „latest 4 weeks", „all years" und eine Jahresauswahl (1999, 1998 usw., soweit zurück, wie man das Produkt erworben hat). „Full Search" verzweigt sich in •
General Search und
•
Cited Reference Search.
Der Bildschirm der „General Search" vereinigt Suchinformationen zu Sachthemen (topics), Autoren, Zeitschriftentiteln und Adressen. Innerhalb der vier Suchfelder sind alle Operatoren zugelassen, die Felder untereinander sind mittels UND verknüpft. Zusätzlich kann man Sprache und Dokumenttyp eingrenzen. Aus jeweils einer Liste werden ein Eintrag oder auch mehrere Werte markiert. Sortiermöglichkeiten bestehen nach Datum, Anzahl der Zitate, Relevanz, Autor und Zeitschriftentitel. Die „Cited Reference Search" fuhrt zu einem Bildschirm mit drei Suchfeldern: Cited Author, Cited Work und Cited Year. „Cited Author" findet alle an erster Stelle genannten Verfasser in Fußnoten. Bei Literatur, die in den abonnierten Segmenten der Zitationsdatenbanken als Quellenartikel enthalten sind, ist eine Recherche nach allen zitierten Autoren möglich. (Hier - und nur hier - ist auch eine UND-Verknüpfung von Autorennamen durchfuhrbar.) „Cited Work" kann ein anderer Artikel, aber auch ein Buch oder ein Patent sein. Patentzitationen ermittelt man am Günstigsten durch die Patentnummer. Zitierte Zeitschriften werden z.T. durch Abkürzungen in den Zitationen verzeichnet. Vor der Suche nach einem Zeitschriftentitel steht demnach das Nachschlagen in der Liste der Abkürzungen an. (Ein „Anklicken" der Abkürzung mit anschließendem Kopieren in das Suchfeld ist nicht möglich. Dies sollte in Zukunft verbessert werden.) Im Anschluß an das Retrieval nach zitierten Literaturstellen erscheinen Bildschirme, die jeweils zehn zitierte Werke zeigen. Suchte man nach Namen, so werden die Fußnoten, in denen der betreffende Autor nicht erstgenannter Autor ist, besonders hervorgehoben. Die Literaturstellen sind entweder einzeln anzukreuzen oder durch „Select All" zu markieren. Begrenzungsmöglichkeiten und Sortiervorgaben sind dieselben wie bei der „General Search".
20 Fallstudien
436 Results Summary und Füll Record
Ergebnis der Suchen sind Listen mit den bibliographischen Angaben der Artikel sowie der Anzahl der Treffer. Je zehn Titel befinden sich auf einer Bildschirmseite. Der Befehl „Mark All" bezieht sich - entgegen der Intuition - nur auf eine Seite, muß also für jeden Zehnerpack wiederholt werden. Durch Anklicken des Sachtitels kommt der Nutzer zu Detailinformationen des Nachweises, zum „Füll Record" (bibliographische Angaben, Abstract, Adressen usw.). Hinter den Informationen zur Anzahl der zitierten Literatur und der Anzahl der Zitierungen befinden sich Links, die den Nutzer auf den Wegen der Informationsübermittlungen weiterleiten.
Abspeichern von Suchanfragen Alle Suchanfragen der „Füll Search" können lokal gespeichert werden. Beim Speichern sollte man einen Dateinamen wählen, der an die Query erinnert, oder sich eine Dokumentation zu seinen Suchfragen anlegen. „Web of Science" unterstützt diesen Vorgang nicht. Der Aufruf einer gespeicherten Query läuft über den Browser. Er wird in der „Füll Search" wirksam, und dies in jeder Datenbank und in jeder Zeitangabe. Ober das Ankreuzen der Zeitangabe „this week's update" läßt sich ein wöchentlicher SDI-Lauf realisieren. (Ein automatischer SDI-Dienst wird derzeit nicht angeboten - hier könnte man am Produkt noch etwas verbessern.)
Zitationssuchen: nach hinten, nach vorne und zur „Verwandtschaft" Mit den Zitationssuchen befinden wir uns im „Filetstück" des „Web of Science". Für jeden gefundenen „Füll Record" gibt es drei Wege, die weiterverfolgt werden können: •
Rekonstruktion der Informationsübermittlungen nach „hinten", d.h. zur zitierten Literatur,
•
Rekonstruktion der Informationsübermittlungen nach „vorne", d.h. zur zitierenden Literatur,
•
assoziatives Retrieval nach „verwandter" Literatur.
Ruft man beim „Füll Record" die „Cited References" auf, so erscheint eine Liste aller Fuß- oder Endnoten des Artikels. Zitierte Literaturstellen, die auch Quel-
20 Fallstudien
437
lenartikel im „Web of Science" sind, sind hervorgehoben. Hinter der Zeile liegt ein Link zum „Füll Record" des zitierten Artikels. Im Bildschirm „Cited References" gibt es den Button „Related Records". Jede der Zitationen auf dem Bildschirm ist standardmäßig angekreuzt. Dies bedeutet, daß sie in die assoziative Suche einbezogen wird. Möchte man eine Fußnote explizit ausschließen, so ist der Haken zu entfernen. Die assoziative Suche arbeitet mit den angekreuzten Zitationen und sucht solche Artikel, die mindestens eine Zitation mit dem Ausgangsdokument gemeinsam haben. Sortiert werden die Artikel nach der Menge gemeinsamer Fußnoten mit dem Ausgangsdokument. Im „Füll Record"-Bildschirm wird die Zahl der „Times Cited" notiert. Auch hier liegen Links, und zwar zu allen zitierenden Artikeln, die im „Web of Science" verzeichnet sind. Suchergebnisse sind wiederum „Füll Records" der zitierenden Dokumente. „Web of Science" weist bei den Zitationssuchen Zusammenhänge zwischen wissenschaftlicher Literatur auf. Dieses Verfahren ist im gesamten Bereich der Informationswirtschaft einmalig und ergänzt so jede Fachdatenbank.
Ausgabeformate Durch diverse Sucheinstiege kommt der Nutzer zu „Summary"-Listen, in denen jeweils die Treffer markiert werden. Über anschließende Recherchen zu zitierten, zitierenden und verwandten Artikeln wird die Trefferliste fortgeschrieben. Dieses Vorgehen ist beliebig weiterfiihrbar. Erst wenn genügend Nachweise gesammelt worden sind, beginnt die Ausgabe. Ausgangspunkt ist die Liste der „Marked Records". Einzutragen sind eine Sortieroption (nach Datum, Autor, Zeitschriftentitel oder der Anzahl der Zitationen), gewünschte Felder (Standard sind die bibliographischen Angaben; alle anderen Felder können hinzukommen) sowie ein Ausgabeformat (Print, Save to File, Export, Document Delivery). „Print" führt zu einem Ausdruck als HTML-Seite, „Save to File" kopiert die Datensätze (mit Feldkürzeln; das Feldschema ist in Abbildung 20.12 angegeben) in eine lokale Datei, „Export" tut dasselbe, allerdings wird jetzt in die Systeme „ProCite" oder „Reference Manager" kopiert; „Document Delivery" initiiert eine Bestellung des Volltextes. Hier gibt es drei Alternativen: die Lieferung (1) über ISIs „Document Solution", (2) über irgendeinen anderen Dokumentlieferdienst oder (3) als E-Mail an die lokale Bibliothek. Der Menüpunkt „Document Delivery" taucht nur dann auf, wenn eine
20 Fallstudien
438
der drei Möglichkeiten vereinbart wurde. Ebenso ist der Link zu den elektronischen Versionen der Artikel nur angegeben, wenn ein entsprechendes Abonnement existiert.
Abb. 20.12: Feldschema der Datensätze des „Web of Science" FN VR PT AU TI DE ID AB RP CI EM TC NR CR CP BP EP PG DT LA SN SO J9 JI SE BS PY PD VL IS PN SU SI GA PU PI
file type file format version number publication type author(s) article title author keywords Keywords Plus abstract reprint addresses research addresses authors' Internet e-mail addresses times cited cited reference count cited references cited patents beginning page ending page page count document type language ISSN full source title 29-character source title abbreviation ISO source title abbreviation book series title book series subtitle publication year publication date volume issue part number supplement special issue ISI document delivery number publisher publisher city
20 Fallstudien PA WP ER
439
publisher address publisher Web address end of record
Quelle: Institute for Scientific Information
Informetrische und szientometrische Untersuchungen Die Zitationsdatenbanken des ISI können (im engen Rahmen gewisser methodischen Grenzen; vgl hierzu Stock 1999b) zu quantitativen Untersuchungen im Kontext von Informetrie oder Wissenschaftsforschung verwendet werden. In der Regel werden Publikationsraten und Zitationsraten zu einzelnen Wissenschaftlern, Instituten, Hochschulen, Zeitschriften, Disziplinen, Städten oder Ländern errechnet. „Einfache" informetrische Analysen sind im „Web of Science" durchfuhrbar (etwa der Art: Publizieren die Wissenschaftler der Universität Köln mehr - pro Jahr - als die der Universität Düsseldorf?). Bei Analysen, die aufwendige Sortierläufe erfordern, versagt „Web of Science", da seine Sortiermächtigkeit auf maximal 300 zu sortierende Dokumente festgelegt ist. So können wir z.B. errechnen: Welches sind die meistzitierten Artikel in „nfd - Information. Wissenschaft und Praxis"?, aber nicht dieselbe Fragestellung für „Science". Hier ist die informetrische Forschung weiterhin auf die Software der kommerziellen Online-Archive angewiesen. Abonnement des „Web of Science" ISI vertreibt sein Produkt vorzugsweise als Intranetlösung. In Ausnahmefallen (und gegen Aufpreis) ist der Zugriff über den ISI-Rechner möglich. Standardsegmente sind die einzelnen Reihen der Zitationsindices sowie Jahrgänge. Das Customizing geht aber so weit, daß auch andere Segmentierungsformen (gewisse Disziplinen, gewisse Zeitschriften - etwa diejenigen, die in der eigenen Bibliothek als Volltext vorliegen) gewählt werden können. Das Update geschieht wöchentlich. Der Preis bestimmt sich u.a. durch die gewählten Segmente und Jahrgänge, durch die Anzahl der Mitglieder eines Konsortiums, die „Web of Science" gemeinsam nutzen wollen, durch die Anzahl der Nutzer im Intranet und durch die Zeit bzw. Intensität, wie die Abonnenten andere ISI-Produkte nutzten. Durch den variablen Produktumfang und die ebenfalls fallspezifischen Situationen können wir keinen
440
20 Fallstudien
Preis angeben. Als Anhaltspunkt kann aber in etwa von einem Preis von rund $ 50.000 pro Jahrgang und Reihe ausgegangen werden. Zu berücksichtigen sind bei der Intranet-Lösung zusätzlich die Investitionskosten für die Hardware.
20.5 Suchmaschine und Portal zum World Wide Web: AltaVista AltaVista ist eine der meistbesuchten Suchmaschinen im World Wide Web, die durch die Erschließung weiter Bereiche des Web einen recht guten Eingang (deshalb: „Portal") ins Web gestattet.
AltaVista im historischen und systematischen Überblick Seine Arbeit nahm AltaVista im Dezember 1995 in den in Palo Alto beheimateten Laboratorien der Digital Equipment Corp. auf. In kurzer Zeit entwickelte sich das Projekt zu einer der populärsten Suchmaschinen. Nach der Übernahme von Digital Equipment kam AltaVista Anfang 1999 in den Besitz von Compac. AltaVista wurde als selbständiges Unternehmen an der Börse notiert. Mitte 1999 verkaufte Compac Computer Corp. die Mehrheit seiner Anteile an AltaVista an den Mischkonzern CMGI in Andover. AltaVista
hat einige Kooperationspartner. Seine eigenen Töchterunternehmen
Shopping.com
und Zip2 bieten E-Commerce an. Die automatische Übersetzung
wird vom französischen Unternehmen Systran SA abgewickelt, für die Personensuche im Kontext „gelber Seiten" gibt es eine Zusammenarbeit mit Switchboard in Westboro, MA. Zudem existiert eine Kooperation mit RealNames für zielgenaue Suche nach Homepages. Laufend beobachtet und kommentiert werden die Aktivitäten von AltaVista und anderen Suchwerkzeugen im World Wide Web durch gewisse „Beobachtungsposten", darunter etwa „Hunter's White Pages" (vgl. Hunter 1998) oder Danny Sullivans „Search Engine Watch" (vgl. Sullivan o.J.).
Die Quellen von AltaVista und ihr „Einsammeln": Scooter Zentrales Element für den Erfolg von AltaVista
ist die große Sammlung von
WWW-Sites. Sie fundiert auf dem Programm „Scooter", das von Louis M. Monier entwickelt worden ist (vgl. Monier 1995; vgl. auch Chun 1999).
20 Fallstudien
Abb. 20.13: Algorithmus des Lokalisierens von Web-Sites von „Scooter"
Quelle: Monier 1995, Fig. 4B
441
442
20 Fallstudien
Grundidee von „Scooter" ist das Verfolgen von Links in bereits bekannten Dokumenten (siehe Abbildung 20.13). Für jede Site werden deren Links abgearbeitet. Zunächst wird die URL des Links mit den bereits vorhandenen URLs verglichen. Ist sie noch nicht vorhanden, wird nach parallelen Sites (etwa Spiegelungen ein und derselben Site auf unterschiedlichen Servern) gesucht. Ist auch dieses negativ, wird das Dokument zur Erschließung auf den Server von AltaVista kopiert. Nicht erreicht werden bei diesem Verfahren alle die Internetseiten, auf die an keiner anderen Stelle verwiesen wird. Man kann demnach bei AltaVista keine vollständige Auswertung aller Dokumente des World Wide Web erwarten. Da die Zahl aller WWW-Sites unbekannt ist, muß man sich bei der Angabe des Abdeckungsgrades auf Schätzungen verlassen. Gemäß S. Lawrence und C.L. Giles erreicht AltaVista rund 28% aller Seiten (vgl. Lawrence/Giles 1998). Da Lawrence/Giles auch die Spiegelungen mitzählen, ist der Wert wahrscheinlich unterschätzt. In einer Untersuchung von Vivien Petras und Matthias Bank zeigte sich für AltaVista im Vergleich zu Hotbot (nach Lawrence/Giles
die umfassendste Suchma-
schine) eine größere Abdeckung des Web. Allerdings ergab sich für AltaVista eine recht große Verzögerung des Inputs, die durchaus bei mehreren Monaten liegen kann (vgl. Petras/Bank 1998). Zusammenfassend stellt Tham Yoke Chun bei seiner Analyse der Lokalisationsinstrumente im Web fest: „Present search robots simply cannot keep pace with the dynamic Web with its large amount of data and the rapid changes in web links and documents" (Chun 1999, 141).
Automatische Indexierung der Quellen Es gibt keinerlei intellektuelle Indexierung der eingesammelten Dokumente, sondern ausschließlich automatisches Information Indexing. Dem Indexierungprozeß vorgelagert ist ein Eliminationsverfahren, das solche WWW-Sites von der Indexierung ausschließt, die gewisse Wörter - in unfairer Ansicht - (meist in den unsichtbaren Meta-Tags) wiederholen, damit die Dokumente beim Ranking oben aufscheinen. Solche wahrscheinlich wertlosen Sites werden als „Spam" ausgeschlossen.
20 Fallstudien
443
Dem Englischen nicht vertraute Zeichen werden umgewandelt. Aus dem deutschen „ä" sowie den französischen „ä" bzw. „ä" wird „a", aus „ß" wird „ss" usw. (vgl. Seltzer/Ray/Ray 1997,28). AltaVista erkennt in großem Umfang Phrasen sowohl durch eigene Software als auch durch den RealNames-Link. Um in einer Suche sicherzugehen, daß ausschließlich mit der Phrase gesucht wird, empfiehlt sich trotzdem die Markierung der Wortfolge durch Anführungszeichen. Bei AltaVista werden - mit einer Ausnahme - die Suchresultate grundsätzlich mittels Relevance Ranking in eine Ordnung gebracht, in der die zur Suchfrage bestpassenden Dokumente nach oben gereiht werden. (Die Ausnahme ist die „Advanced Search" ausschließlich mittels Boolescher Operatoren.) Wörter in den ersten Abschnitten eines Textes (vor allem im Titel) werden höher gewichtet als in mittleren und unteren Textpassagen. Die „Location" ist demnach für die Rangordnung wichtig. Zudem wird die Worthäufigkeit berücksichtigt, aber nur bis zu einem Grenzwert: Ob ein Term lOmal oder 70mal in einem Text vorkommt, ist irrelevant. Bei mehreren Suchargumenten gibt es weitere Sortierkriterien. Zunächst erfolgt eine Sortierung nach der Anzahl der gemeinsamen Suchwörter; bei gleicher Anzahl wird höher gewichtet, wenn die Suchwörter näher nebeneinander stehen (vgl. Courtois/Berry 1999, 43) AltaVista
akzeptiert umgangssprachliche Nutzereingaben (außer bei der Boole-
schen Suche). Über eine Stoppwortliste werden alle nicht-sinntragenden Terme entfernt und mit den übrigen - zeichengetreu - gesucht. Jedes Suchargument durchläuft eine Rechtschreibprüfung. Es erfolgt keine automatische Korrektur, sondern ein Vorschlag.
AltaVista verfügt über zwei Suchbildschirme: • •
„Simple Search" (ausschließlich natürlichprachiges Retrieval) „Advanced Search" (mengentheoretisches Retrieval; Relevance Ranking zusätzlich möglich).
444
20 Fallstudien
Einfache Suche Die
„einfache Suche" gestattet die
Formulierung natürlichsprachiger
Sätze.
Zielführender ist jedoch, mit einzelnen Suchwörtern oder -phrasen zu arbeiten. Dieses Vorgehen erfordert die Kenntnis einiger Symbole und Verabredungen: •
Groß- bzw. Kleinschreibung: Werden alle Buchstaben eines Wortes oder einer Phrase kleingeschrieben, so werden alle Schreibweisevarianten gefunden (zum Beispiel findet „turkey" die Terme „turkey", „Turkey" oder „TURKEY". Ansonsten wird nur die konkrete Zeichenfolge der Eingabe gefunden („Turkey" findet ausschließlich die Schreibweise mit dem großen „T").
•
Bei mehreren Suchwörter oder -phrasen gilt grundsätzlich das Boolesche „Oder".
•
Diverse Phrasen werden zwar automatisch erkannt; die Kennzeichnung einer Phrase durch Anfuhrungszeichen kann jedoch nicht schaden.
•
Suchtermfragmentierung geschieht durch „*". Es ist sowohl Binnen- als auch Rechtsfragmentierung möglich. Der Befehl arbeitet nur bei Fragmenten, die mindestens drei Zeichen lang sind. „*" ersetzt maximal fünf Zeichen.
•
Wenn ein Suchwort auf jedem Fall im Dokument vorkommen soll, ist vor das Wort „+" zu setzen (Achtung: „+" meint nicht „und").
•
Wenn ein Suchwort keinesfalls vorkommen soll, muß „-" verwendet werden.
•
Die feldspezifische Suche (etwa nach Titel, Links, URLs, Host) ist möglich. Sie wird mit „Feldname:" eingeleitet.
Durch Ankreuzen am Suchbildschirm kann eine Suche ausschließlich nach Sounddateien, Bildern und Videosequenzen initiiert werden. Der „Family Filter" grenzt gewisse Bereiche des WWW (etwa pornographischen Inhalts) aus der Treffermenge aus. Will man das gesamte Web durchsuchen, muß der Filter ausgeschaltet werden. (Einen Überblick über Kommandos bei AltaVista geben Hock 1999 sowie Hunter 1998; fiir eine umfassende Einführung vgl. Seltzer/ Ray/Ray 1997).) In Abbildung 20.14 sind Varianten eines Sucharguments („Schwebebahn in Wuppertal") angegeben. Die Anzahl der Treffer verdeutlicht, wie sehr das Suchergebnis variiert, wenn man die Retrievalstrategie ändert. (Man beachte nur die Unterschiede bei der Anzahl der Treffer, nicht die absoluten Werte; die ändern sich auch bei identischem Suchargument - bei AltaVista ohnehin andauernd.)
20 Fallstudien Abb. 20.14: „Einfache" Suche bei AltaVista:
445 Suchvarianten
Suchargument
Anzahl Treffer
1
Wuppertal Schwebebahn
86.805
2
Wuppertal* Schwebebahn
93.455
3
Wuppertal* Schwebebahn
90.450
4
+Wuppertal* +Schwebebahn*
5
-Wuppertal* +Schwebebahn
504
6
-Wuppertal* +Schwebebahn
509
7
„Wuppertal* Schwebebahn*"
299
8
„Wuppertaler Schwebebahn"
210
1.004
Quelle: AltaVista. URL: http://www.altavista.com
In Abhängigkeit vom Einsatz von Fragmentierungszeichen, Groß- und Kleinschreibung, den Operatoren „+" bzw. „-" sowie der Phrasensuche differieren die Ergebnismengen zwischen über 90.000 und rund 200 Treffern. Eine „optimale" durchschnittliche Recherche bei einer Suchmaschine sollte sicherstellen, daß nach dem Relevance Ranking die „entscheidenden" rund 30 Treffen oben stehen, da die wenigsten Nutzer darüberhinaus die Ergebnislisten durchblättern.
Fortgeschrittene Suche Die „Advanced Search" von AltaVista erlaubt eine Suche mit mengentheoretischen Operatoren und optional ein Relevance Ranking. Im einzelnen sind folgende Kenntnisse nötig: • •
Die Booleschen Operatoren AND, OR und AND NOT sind einsetzbar. Der einzige Abstandsoperator NEAR sucht solche Wörter, die im Dokument im Abstand von maximal zehn Wörtern stehen.
•
Klammerung ist möglich.
20 Fallstudien
446 •
Durch zwei Eingabefelder auf dem Bildschirm (Range of Dates / From / To) wird eine Datumssuche eingeleitet.
•
Feldspezifische Suche ist genauso wie bei der einfachen Suche durchzuführen. Ebenso ist das Fragmentierungszeichen einsetzbar, die Operatoren „+" und „-" sind dies im Feld „Boolean Expression" jedoch nicht.
•
Werden Suchargumente nur im Feld „Boolean Expression" eingetragen, erfolgt keine Sortierung nach Relevanz.
•
Sollte ein Relevance Ranking erwünscht sein, so müssen im Feld „Ranking Keywords" die Suchargumente eingegeben werden, nach denen die in der Booleschen Suche gefundenen Treffer sortiert werden sollen.
Abb. 20.15: „Fortgeschrittene" Suche bei AltaVista:
Suchvarianten Anzahl Treffer
Suchargument 1
Wuppertal* AND Schwebebahn*
1.056
2
Wuppertal* AND Schwebebahn*
1.004
3
Wuppertal* NEAR Schwebebahn*
4
TITLE: Wuppertal* NEAR Schwebebahn
705 8
Quelle: AltaVista. URL: http://www.altavista.com
In Abbildung 20.15 sehen wir einige Suchfragevarianten der fortgeschrittenen Suche. Je nach Retrievalstrategie ergeben sich hier - ähnlich wie bei der einfachen Suche große Unterschiede beim Umfang der Treffennenge. Allerdings wird allein durch die Treffennenge deutlich, daß die fortgeschrittene Suche - richtig durchgeführt - zu kleineren und - in den meisten Fällen - genaueren Ergebnissen führt.
Der
RealNames-Link
Durch die Kooperation mit RealNames
erfolgt bei einem dort registrierten (ver-
kauften) Schlagwort der Verweis auf die entsprechende Homepage, wobei dieser Link vor alle von AltaVista selbst gefundenen Dokumente - außerhalb der Zählung - sortiert wird. Bei einer Recherche nach „Rheinbraun" (Abbildung 20.16) sieht
20 Fallstudien
447
man die Nützlichkeit dieses Vorgehens. Sucht man ausschließlich die Homepage des Unternehmens, so liegt der Link sofort bereit und erspart dem Nutzer das Durchblättern der Treffermenge nach dem gesuchten Dokument.
Abb. 20.16: Trefferanzeige bei AltaVista [Suchargument: Rheinbraun] AltaVista found 986 Web pages.
Rheinbraun Click on this Internet Keyword to go directly to the Rheinbraun Web site.
1. Cameco Achieves Record Production in 1997 Cameco Acquires Uranerz Exploration an Mining Limited & Uranerz U.SA., Inc. Saskatoon, Saskatchewan, Canada, April 17, 1998. Cameco Corporation today... URL: www.cameco.com/investor/news_releases/1998-apr-17 .htm Last modified 2-Mar-99 - page size 7 K - in English (Translate) 2. ERA Shareholder Information Web site of Energy Resources of Australia ...[gekürzt] ...
Quelle: AltaVista. URL: http://www.altavista.com
Suche nach Personen: Switchboard Bei der Recherche nach Anschrift, Telefonnummer oder E-Mail-Adresse ist der Link über „People Finder" zur Suchmaschine von Switchboard hilfreich. Die Suche wird durch die gängigen Identifikationsmerkmale (Vorname, Nachname, Ort, Land) gestartet (s. Abbildung 20.17). Fortgeschrieben wird die Datenbank u.a. durch die aktive Mitarbeit der Nutzer. Findet man seinen eigenen Namen nicht bei Switchboard, so kann man diesen eintragen.
448
20 Fallstudien
Ein interessanter Zusatzdienst, allerdings nicht von Switchboard, sondern von Zip2, ist das Angebot eines Kartenausschnittes zum Wohnort (bis auf Straßenebene) einer recherchierten Person, allerdings nur für Kartenausschnitte der Vereinigten Staaten.
Abb. 20.17: Personensuche bei Switchboard AltaVista Connections People Search
Find business
Find a person
Find an email address
Get a map
Get directions
Find a Person First Name:
Can't find yourself in the
Last Name:
directory? Add your free listing
City:
today!
State: AltaVista /...Switchboard. (State List) URL: http://altavista.switchboard.com (19.8.99) Quelle:
Systran: Automatische Übersetzung - mit Problemen Bei der Ausgabe der Treffer ist bei jedem Dokumentennachweis „Translate" angegeben. Der Nutzer wird hier zum Übersetzungsservice von Systran gefuhrt. Der Weg zu Systran ist auch bei den beiden Suchbildschirmen (über „Translation") einzuschlagen. Eingegebene Texte werden dort - in der Regel wortweise - übersetzt. Ergebnis ist keinesfalls eine zufriedenstellende Übersetzung, sondern allenfalls ein Rohentwurf für weitere Arbeiten. Testfälle für Übersetzungssysteme sind Übersetzungen mit anschließender Rückübersetzung. Wir probierten dies für deutsch-englisch und entsprechend danach englisch-deutsch. Der Ausgangstext ist ein „Klassiker": Habe nun,ach! Philosophie, Juristerei und Medizin, und leider auch Theologie
20 Fallstudien
449 durchaus studiert, mit heißem Bemühn. Da steh ich nun, ich armer Tor! Und bin klug als wie zuvor.
Die Übersetzung ins Englische birgt einige überraschende Wendungen: Property now, oh! Philosophy, lawyers' tricks and medicine, and unfortunately also theology quite study, with hot Bemuehn. There be I now, I poor gates! And are intelligent as like before. Die Rückübersetzung ins Deutsche läßt Goethes Original vergessen: Eigenschaft jetzt, OH-! Philosophie, Tricks und Medizin der Rechtsanwälte und leider auch der Theologie Studie durchaus, mit heißem Bemuehn. Es gibt I jetzt, i-Armegatter! Und seien Sie intelligent wie wie vorher. In Informationswirtschaft sowie Informationswissenschaft - und dies nicht nur im Bereich der automatischen Übersetzung - gibt es offensichtlich noch einiges zu tun.
Anschriften APA - Austria Presse Agentur siehe unter GENIOS (Gateway zu APA) British Library Document Supply Centre The British Council British Library Agentur Hahnenstr. 6 50667 Köln Tel.: 0221/20644-58 Fax: 0221/20644-68 Homepage: www.britcoun.de/d/gerdoc.htm DataStar siehe unter Dialog Deutsche Zentralbibliothek für Wirtschaftswissenschaften (ZBW) Bibliothek des Instituts für Weltwirtschaft Düsternbrooker Weg 120 24105 Kiel Tel.: 0431/8814-1 Fax: 0431/8814-520 Homepage: www.uni-kiel.de:8080/IfW/zbw/econis.htm Dialog Corp. Ostbahnhofstr. 13 60314 Frankfurt Tel.: 069/444063 Fax: 069/442084 Homepage: www.dialog.com Produkte: DataStar, DIALOG, Profound DIMDI Weißhausstr. 27 50939 Köln Tel.: 0221/4724-1 Fax: 0221/411429 Homepage: www.dimdi.de
Anschriften FIZ Technik Ostbahnhofstr. 13 60314 Frankfurt Tel.: 069/4308-111 Fax: 069/4308-200 Homepage: www.fiz-technik.de GENIOS Gärtnerweg 4-8 60322 Frankfurt Tel.: 069/9551080 Fax: 069/5963434 Homepage: www.genios.de Gesellschaft für Betriebswirtschaftliche Information (GBl) Freischützstr. 96 81927 München Tel.: 089/992879-0 Fax: 089/992879-99 Homepage: www.gbi.de HWWA-Hamburgisches Welt-Wirtschafts-Archiv Neuer Jungfemstieg 21 20347 Hamburg Tel.: 040/3562-1 Fax: 040/351900 Homepage: www.hwwa.uni-hamburg.de Juris Gutenbergstr. 23 66117 Saarbrücken Tel.: 0681/5866-0 Fax: 0681/5866-239 Homepage: www.juris.de Lexis-Nexis Lindenstr. 37 60325 Frankfurt Tel.: 069/740534 Fax: 069/740638 Homepage: www.lexis.nexis.com
451
452 Online GmbH Kurfürsten-Anlage 6 69115 Heidelberg Tel.: 06221/22671 Fax: 06221/21536 Homepage: www.online-gmbh.com Profound siehe unter Dialog Questel c/o MineSoft Ltd. Wittelsbacher Allee 34 60316 Frankfurt Tel.: 069/405903-38 Fax: 069/405903-39 Homepage: www.questel.fr Reuters Messeturm 60049 Frankfurt Tel.: 069/7565-0 Fax: 069/752758 Homepage: www.reuters.com STN / FIZ Karlsruhe Hermann-von-Helmholtz-Platz 1 76344 Eggenstein-Leopoldshafen Tel.: 07247/808-555 Fax: 07247/808-131 Homepage: www.flz-karlsruhe.de
Anschriften
Literatur (Argus 1996a) Analyse-Profile zur Medien-Präsenz und Medien-Resonanz. - Fellbach: Argus Media, 1996. (Argus 1996b) Publication Monitor. - Fellbach: Argus Media, 1996. (Augustin 1990) Augustin, Siegfried: Information als Wettbewerbsfaktor. Informationslogistik Herausforderung an das Management. - Zürich: Verlag Industrielle Organisation; Köln: Verlag TÜV Rheinland, 1990. (Augustin 1993) Augustin, Siegfried: Informationslogistik als Erfolgsstrategie. Vergleich zwischen japanischen und deutschen Unternehmen. - In: Erfolgsfaktor Information. Schlüssel zu Wettbewerbsvorsprüngen. - München: Bayerisches Staatsministerium für Wirtschaft und Verkehr, 1993, 27-33. (Babiak 1998) Babiak, Ulrich: Effektive Suche im Internet. Suchstrategien, Methoden, Quellen. Cambridge: O'Reilly, 2 1998. (Bäsch 1990) Bäsch, Reva: Die sieben Todsünden der Volltextrecherche. - In: Nachrichten fur Dokumentation 41 (1990), 229-235. (Bates 1989) Bates, Marcia J.: The Design of Browsing and Berrypicking Techniques for the Online Search Interface. - In: Online Review 13 (1989), 407-424. (Becker 1997) Becker, Carsten: Betriebliches Informationsverhalten im Online-Bereich. - In: Gerhard J. Mantwill (Hrsg.): Informationswirtschaft und Standort Deutschland. Der Beitrag der Informationswirtschaft zur Wettbewerbsfähigkeit der Unternehmen. Baden-Baden: Nomos, 1997. - (Veröffentlichungen des HWWA-Instituts fur Wirtschaftsforschung - Hamburg; 37), 113-128. (Behrmann 1998) Behrmann, Niels: Technisches Wissen aus Patenten. Eine empirische Untersuchung auf der Grundlage von Ansätzen des Wissensmanagements. - Dissertation, Universität St. Gallen, 1998.
Literatur
454 (Benscheck 1999)
Benscheck, Wolfgang: Eine skeptische Einschätzung der Zukunft der Hosts. - In: Password Nr. 6 (1999), 2,4. (Best, Hg., 1995) Best, David P. (Hrsg.): The Fourth Resource. Information and Its Management. Aldershot: Aslib / Gower, 1995. (Bieletzki/Roth 1998) Bieletzki,
Christine; Roth, Kristiina: Online-Hosts und Öffentliche Bibliotheken.
Neue Nutzer - neue Märkte. - Köln: FH Köln, Fachbereich Bibliotheks- und Informationswesen, 1998. - (Kölner Arbeitspapiere zur Bibliotheks- und Informationswissenschaft; 12). (Bode 1997) Bode, Jürgen: Der Informationsbegriff in der Betriebswirtschaftslehre. - In: Zeitschrift für betriebswirtschaftliche Forschung 49 (1997), 449-468. (Boni 1994) Boni, Manfred: Datenbanken in Wirtschafts- und Sozialwissenschaften. Elektronische Fachinformation für Studium und Berufspraxis. - München: Vahlen, 1994. (WiSt-Taschenbücher). (Boni 1996) Boni, Manfred: Internet für Wirtschafts- und Sozialwissenschaftler. - München: Vahlen, 1996. (Bonin 1996) Bonin, Hinrich E.G.: < H T M L > Ratgeber. Multimediadokumente im World-WideWeb programmieren. - München; Wien: Hanser, 1996. (Bonitz 1986a) Bonitz, Manfred: Wissenschaftliche Information und wissenschaftliches Verhalten. - Berlin: Zentralinstitut für Information und Dokumentation der Deutschen Demokratischen Republik, 1986. - (ZIID-Schriftenreihe). (Bonitz 1986b) Bonitz, Manfred: Holographie- und Tempoprinzip: Verhaltensprinzipien im System der wissenschaftlichen Kommunikation. - In: Informatik 33 (1986), 191-193.
455
Literatur (Boyce/Meadow/Kraft 1994) Boyce, Bert R.; Meadow,
Charles T.; Kraft, Donald H.: Measurement in Informa-
tion Science. - San Diego [u.a.]: Academic Press, 1994. (Bradford 1934) Bradford,
Samuel C.: Sources of Information on Specific Subjects. - In: Engi-
neering 137 (1934), 85-86. (Bredemeier/Schwuchow 1997) Bredemeier, Willi; Schwuchow, Werner: Elektronische Dienste aus regionaler Sicht. - In: Gerhard J. Mantwill (Hrsg.): Informationswirtschaft und Standort Deutschland. Der Beitrag der Informationswirtschaft zur Wettbewerbsfähigkeit der Unternehmen. - Baden-Baden: Nomos, 1997. - (Veröffentlichungen des H W W A Instituts für Wirtschaftsforschung - Hamburg; 37), 69-1 12. (Brendel et al. 1998) Brendel, Matthias; Brendel, Frank; Schertz, Christian; Schreiber, Henrik: Richtig recherchieren. - Frankfürt: Institut für Medienentwicklung und Kommunikation mbH in der Verlagsgruppe Frankfurter Allgemeine Zeitung, 2 1998.- (Kommunikation heute und morgen; 26). (Brenner 1996) Brenner, Everett H.: Beyond Boolean - New Approaches to Information Retrieval. - Philadelphia, PA: The National Federation of Abstracting and Information Services, 1996. - (NFAIS Report Series New Technologies and New Relationships; 3). (Brynjolfsson 1993) Brynjolfsson,
Erik: The Productivity Paradox of Information Technology. - In:
Communications of the ACM 36 (1993), Nr. 12, 67-77. (Bugdahl 1995) Bugdahl,
Volker: Marken-Recherche. Online-Datenbanken. - In: Die Absatzwirt-
schaft 38, Nr. 12 (1995), 106-110. (Bundesregierung 1996) Bundesregierung: Info 2000 - Deutschlands Weg in die Informationsgesellschaft. Deutscher Bundestag; 13. Wahlperiode; Unterrichtung durch die Bundesregierung. Drucksache 13/4000 vom 7. März 1996. (Burrows 1998) Burrows, Michael: Method For Indexing Information of a Database. - Patent Nr. US 5745899 vom 28.4.1998.
456
Literatur
(Capurro 1986) Capurro, Rafael: Hermeneutik der Fachinformation. - Freiburg; München: Alber, 1986. (Chun 1999) Chun, Tham Yoke: World Wide Web Robots: An Overview. - In: Online & CDROM Review 23 (1999), 135-142. (Ciaassen, Hg., 1988) Ciaassen, Walter (Hrsg.): Fachwissen Online-Recherche. Suchstrategien in OnlineDatenbanken. - Essen: Klaes, 1988. (Cleveland/Cleveland 1990) Cleveland, D.B.; Cleveland, A.D.: Introduction to Indexing and Abstracting. - Englewood, NJ: Libraries Unlimited, 1990. (Cohausz 1995) Cohausz, Helge B.: Patente & Muster. - München: Wila, 2 1995. (Corsten 1999) Corsten, Rebecca: Das gläserne Unternehmen? Firmeninformationen in Datenbanken. - Dipl.-Arb. FH Köln, 1999. (Courtois/Berry 1999) Courtois, Martin P.; Berry, Michael W.: Results Ranking in Web Search Engines. In: Online 23 (1999), Nr. 3, 39-46. (Crossley 1984) Crossley, Charles A.: Using the Economics Library. - In: John Fletcher (Hrsg.): Information Sources in Economics. - London [u.a.]: Butterworths, 2 1984. (Butterworths Guides to Information Sources), 16-33. (Crowther 1994) Crowther, Warren: Information Resource Management for Knowledge and Records Management in Central American Academic Institutions and Centres of Excellence. In: SIG/TIRM 1994b, 44-69. (Daniel 1998) Daniel, Frank: Servicestation auf der Datenautobahn. Die Abteilung „Beratung und Elektronische Dienste" der StadtBibliothek Köln. - In: Buch und Bibliothek 50 (1998), 234-237.
457
Literatur (Darby/Karni 1973)
Darby, Richard R.; Kami, Edi: Free Competition and the Optimal Amount of Fraud. - In: Journal of Law and Economics 16 (1973), 67-88. (DDC 1989) Dewey Decimal Classification and Relative Index. - 4 Bde. - Albany, New York: Forest Press, 2 0 1989. (Dehnert-Kleibrink/Stock 1997) Dehnerl-Kleibrink, Dagmar; Stock, Wolfgang G.: Informationsspezialisten in der Informationsgesellschaft. Berufsfeld und Beschäftigungschancen für Informationswirte. - Köln: Fachhochschule Köln; Fachbereich Bibliotheks- und Informationswesen, 1997. - (Kölner Arbeitspapiere zur Bibliotheks- und Informationswissenschaft; 6). (DIN 1463/1) Erstellung und Weiterentwicklung von Thesauri. Einsprachige Thesauri. - DIN 1463, Teil 1.-Berlin: Beuth, 1987. (DIN 2331) Begriffssysteme und ihre Darstellung. - DIN 2331. - Berlin: Beuth, 1980. (DIN 31623/1) Indexierung zur inhaltlichen Erschließung von Dokumenten. Begriffe, Grundlagen. DIN 31623, Teil 1. - Berlin: Beuth, 1988. (DIN 31623/2) Indexierung
zur
inhaltlichen
Erschließung
von
Dokumenten.
Gleichordnende
Indexierung mit Deskriptoren. - DIN 31623, Teil 2. - Berlin: Beuth, 1988. (DIN 31623/3) Indexierung zur inhaltlichen Erschließung von Dokumenten. Syntaktische Indexierung mit Deskriptoren. - DIN 31623, Teil 3. - Berlin: Beuth, 1988. (DIN 32705) Klassifikationssysteme.
Erstellung und
Weiterentwicklung
von
Klassifikations-
systemen. - DIN 32705. - Berlin: Beuth, 1987. (Diodato 1994) Diodato,
Virgil P.: Dictionary of Bibliometrics. - New York; London; Norwood:
Haworth, 1994).
458
Literatur
(Ditfurth/Kathöfer 1997) Ditfurth, Christian von; Kathöfer,
Ulrich: Internet fiir Wirtschaftswissenschaftler. -
Frankfurt: Campus, 1997. (Dohse/Jürgens/Malsch 1985) Dohse, Knuth; Jürgens,
Ulrich; Malsch, Thomas: From „Fordism" to „Toyotism"?
The social organization of the labor process in the Japanese automobile industry. In: Politics and Society 14 (1985), Nr. 2, 115-146. (Dostal 1995) Dostal, Werner: Die Informatisierung der Arbeitswelt - Multimedia, offene Arbeitsformen und Telearbeit. - In: Mitteilungen aus der Arbeitsmarkt- und Berufsforschung 28 (1995), 527-543. (Egghe/Rousseau 1990) Egghe, Leo; Rousseau, Ronald: Introduction to Informetrics. - Amsterdam: Elsevier, 1990. (Endres-Niggemeyer 1998) Endres-Niggemeyer, 1998.
Brigitte: Summarizing Information. - Berlin [u.a.]: Springer,
(Engelhardt 1989) Engelhardt,
Klaus: Die Patentrecherche. - In: Fachwissen Patentinformation. Daten-
banken strategisch genutzt. - Essen: Klaes, 1989,63-136. (Englert 1990) Englert, Marianne: Pressedokumentation. - In: Marianne Buder; Werner Rehfeld-, Thomas Seeger (Hrsg.) Grundlagen der praktischen Information und Dokumentation. - München [u.a.]: 3 1990,487-500. (EUR-OP 1999) TED Internet Version of the Supplement of the Official Journal S. - Luxembourg: EUR-OP, 1999. - URL:http://ted.eur-op.eu.int/ (Evans 1994) Evans, Ross: Beyond Boolean: Relevance Ranking, Natural Language and the New Search Paradigm. - In: Proceedings of the Fifteenth National Online Meeting. Medford, NJ: Learned Information, 1994, 121-128.
459
Literatur (Fank 1996)
Fank, Matthias: Einfuhrung in das Informationsmanagement. Grundlagen, Methoden, Konzepte. - München; Wien: Oldenbourg, 1996. (Fank 1998) Fank, Matthias: Informationsmanagement als Antwort auf ein verändertes Unternehmensumfeld. - In: Matthias Fank, Thomas Schildhauer, Michael Klotz (Hrsg.): Informationsmanagement: Umfeld-Fallbeispiele. - München; Wien: Oldenbourg, 1998, 17-34. (Faust 1993) Faust, Konrad: Patentanmeldungen als Indikator von technologischen Entwicklungen - Ergebnisse und Erfahrungen mit der ifo Patenttstatistik. - In: Results and Methods of Economic Patent Research. - München: Europäisches Patentamt; ifo Institut für Wirtschaftsforschung, 1993, 155-172. (Faust/Buckel 1994) Faust,
Konrad; Buckel,
Eberhard: Ifo Patent Statistics. Actors in Technological
Competition. Company Report 1994. - 3 Bände in 5 Teilbänden. - München: ifo Institut fur Wirtschaftsforschung, 1994. (Feldman 1999) Feldman, Susan: NLP Meets the Jabberwocky. Natural Language Processing in Information Retrieval. - In: Online 23 (1999), Nr. 3, 62-72. (Fendt 1989) Fendt, Heinz: Systematische Patentanalyse. - In: Fachwissen Patentinformation. Datenbanken strategisch genutzt. - Essen: Klaes, 1989,29-62. (Ferstl/Sinz 1998) Ferstl, Otto K.; Sinz, Elmar J.: Grundlagen der Wirtschaftsinformatik. Band 1. München/Wien: Oldenbourg, 3 1998. (FH Darmstadt 1992) Fachhochschule
Darmstadt;
Studienberatung:
Studieninformation Information und
Dokumentation. - Darmstadt, 1992. (FH Köln 1997) Die Informationslandschaften Hamburgs und Wiens. - Köln: FH Köln; Fachbereich Bibliotheks- und Informationswesen, 1997. - (Kölner Arbeitspapiere zur Bibliotheks- und Informationswissenschaft; 3).
Literatur
460 (Fink/Smit 1994)
Fink, Sabine; Smit, Sabine: The Production of a Multi-Database CD-ROM in Economics. - In: David J. Raitt; Ben Jeapes (Hrsg.): Online Information 1994. 18th International Online Information Meeting. - Oxford: Learned Information, 1994, 535-547. (Forum Informationsgesellschaft 1996) Forum Informationsgesellschaft: Netzwerke fur Menschen und ihre Gemeinschaften. Die Umsetzung der Informationsgesellschaft in der Europäischen Union. Erster Jahresbericht des Forums Informationsgesellschaft an die Europäische Kommission. - Brüssel; Luxemburg: ECSC-EC-EAEC, 1996. (Frants/Shapiro/Voiskunskii 1997) Frants, Valery I.; Shapiro, Jacob; Voiskunskii, Vladimir G.: Automated Information Retrieval. Theory and Methods. - San Diego [u.a.]: Academic Press, 1997. (Friedrichs 1997) Friedrichs,
Jürgen: Globalisierung - Begriff und grundlegende Annahmen. - In:
Aus Politik und Zeitgeschichte B 33-34 (1997), 3-1 1. (Fugmann 1999) Fugmann,
Robert: Inhaltserschließung durch Indexieren: Prinzipien und Praxis. -
Frankfurt: Deutsche Gesellschaft fur Dokumentation, 1999. - (DGD Schrift. Informationswissenschaft; 3). (Gale/1) Gale Directory of Databases. - Vol. 1: Online-Databases. - New York [u.a.]: Gale (periodisch) (Gale/2) Gale Directory of Databases. - Vol. 2: CD-ROM, Diskette, Magnetic Tape, Handheld, and Batch Access Database Products. - New York [u.a.]: Gale (periodisch) (Ganzmann 1998) Ganzmann,
Jochen: Das F.A.Z.-Datenbank-Handbuch. Suchhilfen für die Datenban-
ken der Frankfurter Allgemeinen Zeitung online und auf CD-ROM. - Frankfurt: Frankfurter Allgemeine, 1998. (Garfield 1977) Garfield, Eugene: The Mystery of the Transposed Journal List - Wherein Bradford's Law of Scattering is Generalized According to Garfield's Law of Concentration. - In:
Literatur
461
Garfield, Eugene: Essays of an Information Scientist. - Vol. 1. - Philadelphia, ISI Press, 1977, 222-223. (Garfield 1979) Garfield, Eugene: Citation Indexing - Its Theory and Application in Science, Technology, and Humanities. - New York [u.a.]: Wiley, 1979. (Garman 1999) Garman, Nancy: Meta Search Engines. - In. Online 23 (1999), Nr. 3, 74-78. (Gastmeyer 1994) Gastmeyer, Manuela: Thesaurus Wirtschaft. Entstehung, Konzeption und Aufbau. Hamburg: HWWA-Informationszentrum, 1994. - (Veröffentlichungen des H W W A Institut für Wirtschaftsforschung-Hamburg. Aktuelle Fachinformation; 7). (Georgy 1995) Georgy, Ursula: Wer suchet... Qualität deutscher Produktinformationen. - In: Cogito Nr. 6(1995), 22-23. (Gessner 1994) Gessner, Dieter: Kommerzialisierung von Verlagsarchiven? - In: Password Nr. 10 (1994), 4-5. (Gödert/Lepsky 1997) Gödert,
Winfried; Lepsky,
Klaus: Semantische Umfeldsuchen im
Information
Retrieval in Online-Katalogen. - Köln: FH Köln; Fachbereich Bibliotheks- und Informationswesen, 1997. - (Kölner Arbeitspapiere zur Bibliotheks- und Informationswissenschaft; 7). (Goffe 1994) Goffe, William L.: Computer Network Resources for Economists. - In: Journal of Economic Perspectives 8 (1994), Nr. 3, 97-119. (Goldrian 1998) Goldriart, Georg: Zur Verdeutlichung der aktuellen konjunkturellen Aussage einer wirtschaftlichen Zeitreihe. - München: ifo Institut für Wirtschaftsforschung, 1998. (ifo Diskussionsbeiträge; 58). (Graumann 1998) Graumann,
Sabine: Der Einsatz des Internet in der Marktforschung. Erfahrungen aus
einer internationalen Fallstudie. - In: Marlies Ockenfeld; Gerhard J. Mantwill (Hrsg.):
462
Literatur
Information und Märkte. 50. Deutscher Dokumentartag. - Frankfurt: Deutsche Gesellschaft fur Dokumentation, 1998, 1 15-131. (Grupp/Schmoch 1992) Grupp, Hariolf; Schmoch, Georg: Wissenschaftsbindung der Technik. - Heidelberg: Physica, 1992. (Hacker 1992) Hacker, Rupert: Bibliothekarisches Grundwissen. - München [u.a.]: Saur, 61992. (Harm an 1986) Harman, Donna: An Experimental Study of Factors Important in Document Ranking. - In: Proceedings of the ACM Conference on Research and Development in Information Retrieval. - Pisa, 1986, 186-193. (Harman 1998) Harman, Donna: The Text Retrieval Conferences (TRECs) Providing a Test-Bed for Information Retrieval Systems. - In: Bulletin of the American Society for Information Science, April/May 1998, 11-13. (Harvey 1994) Harvey, Andrew C.: Ökonometrische Analyse von Zeitreihen. - München; Wien: Oldenbourg, 2 1994. (Harvey 1995) Harvey, Andrew C.: Zeitreihenmodelle. - München; Wien: Oldenbourg, 21995. (Haugg/Lokys/Winterfeld 1989) Haugg, Norbert; Lokys, Andreas; Winterfeld, Volker: Gewerbliches Schutzrecht. - In: Fachwissen Patentinformation. Datenbanken strategisch genutzt. - Essen: Klaes, 1989, 199-203. (Heinrich 1999) Heinrich, Lutz J.: Informationsmanagement. Planung, Überwachung und Steuerung der Informationsinfrastruktur. - München; Wien: Oldenbourg, 6 1999. (Heinzelbecker 1995) Heinzelbecker, Klaus: Anwendungsgebiete und Einsatzmöglichkeiten externer Datenbanken in der Marktforschung. - In: Wolfram Neubauer, Ralph Schmidt (Hrsg.): „Online und darüber hinaus ... Tendenzen der Informationsvermittlung. 17. Online-Tagung der DGD. - Frankfurt: Deutsche Gesellschaft für Dokumentation, 1995,217-225.
Literatur
463
(Hennes 1995) Hermes, Wolfgang: Informationsbeschaffung online. Wettbewerbsvorteile durch weltweite Kommunikation. - Frankfurt [u.a.]: Campus, 1995. (Henrichs 1975) Henrichs, Nobert: Sprachprobleme beim Einsatz von Dialog-Retrieval-Systemen. In: Rudi Kunz, Peter Port (Bearb.): Deutscher Dokumentartag 1974. Bonn-Bad Godesberg vom 07. bis 11.10.1974. Band 2. - München: Verlag Dokumentation, 1975, S. 219-232. (Henrichs 1980) Henrichs,Norbert : Benutzungshilfen für das Retrieval bei wörterbuchunabhängig indexiertem Textmaterial, in: Rainer Kuhlen (Hrsg.): Datenbasen - Datenbanken Netzwerke, Bd. 3. - München [u.a.]: Saur, 1980, 157-168. (Henrichs 1992) Henrichs, Norbert: Begriffswandel in Datenbanken, in: Wolfram Neubauer, KarlHeinz Meier (Hrsg.): Deutscher Dokumentartag 1991. Information und Dokumentation in den 90er Jahren. Neue Herausforderungen, neue Technologien. - Frankfurt: Deutsche Gesellschaft fiir Dokumentation, 1992 . - (DGD-Schrift [DOK-4] 3/92), 183-202. (Henzler 1992) Henzier, RolfG.: Information und Dokumentation. - Berlin [u.a.]: Springer, 1992. (Herget 1992) Herget, Josef: Information Resources Management. - Konstanz, 1992. - (Universität Konstanz / Informationswissenschaft; Bericht 8/92). (Herget 1997) Herget, Josef: Informationsmanagement. - In: Marianne Buder; Werner Rehfeld, Thomas Seeger; Dietmar Strauch (Hrsg.): Grundlagen der praktischen Information und Dokumentation. - München [u.a.]: Saur, 4 1997, 781-794. (Hilberer 1998) Hilberer, Thomas: Die Düsseldorfer Virtuelle Bibliothek. - In: nfd. Information Wissenschaft und Praxis 49 (1998), 196-198. (Hock 1999) Hock, Randolph: Web Search Engines Features and Commands. - In: Online 23 (1999), Nr. 3,24-28.
Literatur
464 (Höhne/Ludwig 1996)
Höhne, Margit; Ludwig, Jan: Patentinformation im Internet. - In: Wolfram Neubauer, Ralph Schmidt 18. Online-Tagung der DGD. Information ohne Grenzen - Wissensvermittlung im Zeitalter der Datennetze. - Frankfurt: Deutsche Gesellschaft für Dokumentation, 1996,261-280. (Hofmann/Saul 1996a) Hofmann, Herbert; Saul, Christoph: Qualitative und quantitative Auswirkungen der Informationsgesellschaft auf die Beschäftigung. - München: ifo Institut ftir Wirtschaftsforschung, 1996. - (ifo Studien zur Strukturforschung; 23). (Hofmann/Saul 1996b) Hofmann, Herbert; Saul, Christoph: Qualitative und quantitative Auswirkungen der Informationsgesellschaft auf die Beschäftigung. - In: ifo Schnelldienst Nr. 10 (1996), 12-24. (Hofmann 1999) Hofmann,
Ulrich: Globale Informationswirtschaft. Management,
Technologien,
Strategien. - München; Wien: Oldenbourg, 1999. (Holthuis 1998) Holthuis, Jan: Der Aufbau von Data Warehouse-Systemen. Konzeption - Datenmodellierung - Vorgehen. - Wiesbaden: Deutscher Universitäts-Verl.; Gabler, 1998. (Holtz 1998) Holtz, Christiane: Neue Perspektiven für Öffentliche Bibliotheken. Der „ExpressService" der StadtBibliothek Köln. - In: Buch und Bibliothek 50 (1998), 22-23. (Horton 1991) Horton Jr., Forest: The Concepts and Trends of Information Resource Management. - In: FID News Bulletin 41 ( 1991 ), Nr. 4, 71 -78. (Horvath 1996) Horvath, Peter: Online-Recherche. Neue Wege zum Wissen der Welt. - Wiesbaden: Vieweg, 2 1996. (Hughes/Moore 1992) Hughes, Kirsty; Moore, Nick: The Role of Information in Economy and Society. An Overview. - London: Policy Studies Institute, 1992.
Literatur
465
(Hunter 1998) Hunter, Michael: Hunter's White Pages for AltaVista (November 3, 1998). - URL: http://www.hws.edu/aca/library/AVWHP.html. ( H W W A 1998) H W W A Informationservice fur Forschung und Praxis. - Hamburg: H W W A Informationszentrum / Beratung und Information, 1998. (IMO 1994a) Information Market Observatory. The Internet and the European Information Industry. - Luxembourg: European Commission, DG XIII, 1994. - (IMO Working Paper; 94/3). (IMO 1994b) Information Market Observatory. Company Information in Europe. - Luxembourg: European Commission, DG XIII, 1994. - (IMO Working Paper; 94/4). (IMO 1995) Information dem
Market Observatory.
Die wichtigsten Ereignisse und Entwicklungen auf
Informationsmarkt in den Jahren
1993-1994.
- Luxembourg:
European
Commission, Programm IMPACT, 1995. (IMU 1995) Institut für Informationsmanagement und Unternehmensführung: Ziele des Instituts. - Osnabrück: Universität Osnabrück 1995. - URL: http://godard.oec. UniOsnabrueck.DE/insttt/imu/imuziel.html (Version vom 7.3.1995). (Inan/Rautenstrauch 1997) Inan, Yakub; Rautenstrauch, Claus: Modellierung von Data-Warhouse-Systemen. In: Harald Reiterer, Thomas Mann (Hrsg.): Informationssysteme als Schlüssel zur Unternehmensführung - Anspruch und Wirklichkeit. - Konstanz: Universitätsverlag, 1997. - (Schriften zur Informationswissenschaft; 31), 155-168. (Inmon 1996) Inmon, W.H.: Building the Data Warehouse. - New York: Wiley, 2 1996. (IPK 1994) Internationale Patentklassifikation. - 9 Bde. - München [u.a..]: Heymanns 6 1994. (ISBN 1995) Publisher's International ISBN Directory. - München [u.a.]: Saur, 2 2 1995/96.
466
Literatur
(Jacobs 1982) Jacobs, J. R.: Finding Words That Sound Alike. The Soundex Algorithm. - In: Byte 7(1982), March, 473-474. (Janko 1993) Janko, Wolfgang H.: Informationswirtschaft 1. Grundlagen der Informatik für die Informationswirtschaft. - Berlin [u.a.]: Springer, 1993. (Kämper/Wolff 1999) Kämper, Ulrich; Wolff, Christiane: Internet versus Host. Kostenlose Recherchen als Zeitfresser und mit höheren Kosten. - In: Password Nr. 2 (1999), 17. (Kassel 1998) Kassel, Amelia: Research Bank from the Investext Group. - In: Searcher (1998) Oct., 26 ff. (Kaye 1991) Kaye, David: Information and Business. An Introduction. - London: Library Association Publ., 1991. (Keenan 1988) Keenan, M.: Report on the 1987 Membership Survey. - In: Journal of Finance 43 (1988), 767-777. (Keitz/Keitz/Gerlach 1993) Keitz, Saiedeh von; Keitz, Wolfgang von; Gerlach, Hubertus: Online-Retrieval. Der Weg zu den Wissensspeichern der Welt am Beispiel der Dialog-Datenbanken. Weinheim [u.a.]: VCH, 1993. (Klassen-Meurer 1994) Klassen-Meurer, Jutta: Qualitätskontrolle am Beispiel der FAKT-Datenbank. - In. Wolfram Neubauer (Hrsg.) : Qualität und Information. Deutscher Dokumentartag 1993. - Frankfurt: Deutsche Gesellschaft für Dokumentation, 1994, 507-517. (Klems 1994) Klems, Michael: Informations-Broking. Mit einem Informationsbroker durch die Netze und Online-Datenbanken der Welt. - Bonn [u.a.]: International Thomson Publ., 1994. (Kmuche 1992) Kmuche, Wolfgang: Umgang mit externen Datenbanken. - Planegg: Verlag Wirtschaft, Recht und Steuern, 4 1992.
Literatur
467
(Kondratieff 1926) Kondratieff,
Nikolai D.: Die langen Wellen der Konjunktur. - In: Archiv für
Sozialwissenschaft und Sozialpolitik 56 (1926), 573-609. (Kowalski 1997) Kowalski, Gerald: Information Retrieval Systems. Theory and Implementation. Boston; Dordrecht; London: Kluwer, 1997. - (The Kluwer International Sériés on Information Retrieval). (Kraft 1997) Kraft, H.P.: Untersuchung über den Nutzen von Wirtschaftsinformationen in Tageszeitungen. - Frankfurt: Lang, 1997. (Krahl/Windheuser/Zick 1998) Krahl, Daniela; Windheuser,
Ulrich; Zick, Friedrich-Karl: Data Mining. Einsatz in
der Praxis. - Bonn: Addison-Wesley-Langman, 1998. (Krichel/Wichmann 1994) Krichel, Thomas; Wichmann, Thorsten: Internet Primer for Economists. - In: The Economic Journal 104(1994), 1496-1523. (Kroy/Palme 1995) Kroy, Walter; Palme, Klaus: Innovation und Information als Produktionsfaktor. Köln: Deutscher Instituts-Verlag, 1995. - (Beiträge zur Gesellschafts- und Bildungspolitik; 201). (Küting/Hütten 1996) Kating, Karlheinz; Hütten, Christoph: Der Geschäftsbericht als Publizitätsinstrument. - In: Der Betriebs-Berater 51 (1996), 2671-2679. (Küting/Mohrens 1992) Kating, Karlheinz; Mohrens,
Stephan W.: Jahresabschlußpublizität und Datenban-
ken. - In: Der Betriebs-Berater 47 (1992), Heft 3, Beilage 2, 1-14. (Küting/Weber 1999) Kating, Karlheinz; Weber, Claus-Peter: Die Bilanzanalyse. Lehrbuch zur Beurteilung von Einzel- und Konzernabschlüssen. - Stuttgart: Schäffer-Poeschel, 4 1999. (Küting/Weber/Hayn 1999) Kating, Karlheinz; Weber, Claus-Peter; Hayn, Benita: Der Konzernabschluß. Lehrbuch und Fallstudie zur Praxis der Konzernrechnungslegung. - Stuttgart: SchäfferPoeschel, 5 1999.
468
Literatur
(Kuhlen 1996) Kuhlen, Rainer: Informationsmarkt. Chancen und Risiken der Kommerzialisierung von Wissen. - Konstanz: Universitätsverlag,21996. - (Schriften zur Informationswissenschaft; 15). (Ladewig 1997) Ladewig, Christa: Grundlagen der inhaltlichen Erschließung. - Potsdam: Institut fur Information und Dokumentation, 1997. - (Schriftenreihe des Instituts fur Information und Dokumentation (IID) der Fachhochschule Potsdam; 1 ). (Lancaster 1979) Lancaster, F. Wilfrid: Information Retrieval Systems. Characteristics, Testing, Evaluation. - New York: Wiley, 1979. (Lancaster 1998) Lancaster, F. Wilfrid: Indexing and Abstracting in Theory and Practice. Champaigne, IL: Graduate School ofLibrary and Information Science, 21998. (Lawrence/Giles 1998) Lawrence, S.; Giles, C.L.: Searching the World Wide Web. - In: Science 280, Nr. 5360(1998), 98-100. (Lepsky 1994) Lepsky, Klaus: Maschinelle Indexierung von Titelaufnahmen zur Verbesserung der sachlichen Erschließung von Online-Publikumskatalogen. - Köln: Greven, 1994. (Kölner Arbeiten zum Bibliotheks- und Dokumentationswesen; 18). (Levitan 1982a) Levitan, Karen B.: Information Resource(s) Management. - In: Annual Review of Information Science and Technology 17 (1982), 227-266. (Levitan 1982b) Levitan, Karen B.: Information Resources as „Goods" in the Life Cycle of Information Production. - In: Journal of the American Society for Information Science 33 (1982), 44-54. (Lexis-Nexis 1995) Learning Lexis. A Handbook for Modern Legal Research. - Dayton, OH: LexisNexis, 1995.
Literatur
469
(Lindlbauer 1989) Lindlbauer, Jürg-Dieter: Konjunkturtest. - In: Karl H. Oppenländer, Günter Poser (Hrsg.): Handbuch der Ifo-Umfragen. - Berlin: Duncker & Humblot, 1989,122-187. (Lipka 1999) Lipka, Alois: Reale Milliarden im Internet. Größte Ausschreibungsdatenbank - für alle was dabei. - In: Buch und Bibliothek 51 (1999), Nr. 3, 197-198. (Lotka 1926) Lotka, Alfred J.: The Frequency Distribution of Scientific Productivity. - In: Journal of the Washington Academy of Sciences 16 (1926), 317-323. (Lu/Miller/Wassum 1998) Lu, Xin A.; Miller, David J.; Wassum, John R.: Phrase Recognition Method and Apparatus. - US-Pat. Nr. 5.819.260. - Anmeldetag: 22.1.1996; erteilt am 6.10.1998. (Lytle 1986) Lytle, Richard H.: Information Resource Management 1981-1986. - In: Annual Review of Information Science and Technology 21 (1986), 227-266. (Mailer 1998) Mailer, Steve: What is InfoSort? - In: Dialect Nr. 3 (1998). - URL:http://libraiy. dialog.com/newsltrs/dialect/issue3/infosort.html. (Mantwill 1997) Mantwill, Gerhard J.: Vorwort. - In: Gerhard J. Mantwill (Hrsg.): Informationswirtschaft und Standort Deutschland. Der Beitrag der Informationswirtschaft zur Wettbewerbsfähigkeit der Unternehmen. - Baden-Baden: Nomos, 1997. (Veröffentlichungen des HWWA-Instituts für Wirtschaftsforschung - Hamburg; 37), 7-12. (Martin, Hg. 1998) Martin, Wolfgang (Hrsg.): Data Warehousing. Data Mining- OLAP. - Bonn [u.a.]: Thomson, 1998. (Meadow 1992) Meadow, Charles T.: Text Information Retrieval Systems. - New York [u.a.]: Academic Press, 1992. (Meffert/Bruhn 1997) Meffert, Heribert; Bruhn, Manfred: Dienstleistungsmarketing. Konzepte - Methoden. - Wiesbaden: Gabler, 2 1997.
Grundlagen
-
470
Literatur
(Mensch 1975) Mensch, Gerhard: Das technologische Patt. Innovationen überwinden die Depression. - Frankfurt, 1975. (Monier 1995) Monier, Louis M.: System and Method for Locating Pages on the World Wide Web and for Locating Documents From a Network of Computers. - Patentanmeldung Nr. W097/22069. (Prioritätsdatum 13.12.1995). (Mucksch/Behme 1998) Mucksch, Harry; Behme, Wolfgang: Das Data Warehouse-Konzept als Basis einer unternehmensweiten Informationslogistik. - In: Mucksch, Harry; Behme, Wolfgang (Hrsg.): Das Data Warehouse-Konzept.- Wiesbaden: Gabler, 3 1998,33-100. (Münch 1995) Münch, Vera: Die gläserne Firma. Wirtschaftsdatenbanken legen Unternehmen, Trends und Weltmärkte offen. - In: Cogito Nr. 2 (1995), 5-10. (NACE 1990) NACE REV. 1. - In: Amtsblatt der Europäischen Gemeinschaften, Nr. L/293 vom 24.10.1990, 1-26. (Nefiodow 1991) Neßodow, Leo A.: Der fünfte Kondratieff. Strategien zum Strukturwandel in Wirtschaft und Gesellschaft. - Frankfurt: Frankfurter Allgemeine; Wiesbaden: Gabler, 2 1991. (Nefiodow 1994) Nefiodow, Leo A.: Informationsgesellschaft: Arbeitsplatzvernichtung oder Arbeitsplatzgewinne? - In: ifo Schnelldienst Nr. 12 (1994), 11-19. (Nelson 1970) Nelson, Phillip: Information and Consumer Behaviour. - In: Journal of Political Economy 78 (1970), 311-329. (Norpoth/Nüßlein 1995) Norpoth, Susanne; Nüßlein, Desiree: Datenbanken in der Marktforschung aus Sicht eines Nutzers und eines Datenbankproduzenten. - In: Wolfram Neubauer, Ralph Schmidt (Hrsg.): „Online und darüber hinaus ... Tendenzen der Informationsvermittlung. 17. Online-Tagung der DGD. - Frankfurt: Deutsche Gesellschaft für Dokumentation, 1995, 201-215.
Literatur
471
(O'Connor 1996) O'Connor, B.: Explorations in Indexing and Abstracting: Pointing, Virtue, and Power. - Englewood, NJ: Libraries Unlimited, 1996. (Otto 1997) Otto, Michael: Suchstrategien im Internet - Search Engines, Themenkataloge, Besprechungsdienste. - Bonn [u.a.]: Thomson, 1997. (Owen 1994) Owen, Darrel 1 E.: IRM Concepts: Building Blocks for the 1990s. - In: SIG/TIRM 1994b), 102-114. (Oxley 1998) Oxley, Harriet: ISI Spins a Web of Science. - In: Database 21 (1998), Nr. 2, 37-40. (Petras/Bank 1998) Petras, Vivien; Bank, Matthias: Vergleich der Suchmaschinen AltaVista und HotBot bezüglich Treffermengen und Aktualität. - In: nfd. Information : Wissenschaft und Praxis 49 (1998), 453-458. (Picot/Scheuble 1997) Picot, Arnold; Scheuble, Sven: Die Bedeutung der Information für Innovation und Wettbewerbsfähigkeit von Unternehmen. - In: Gerhard J. Mantwill (Hrsg.): Informationswirtschaft und Standort Deutschland. Der Beitrag der Informationswirtschaft zur Wettbewerbsfähigkeit der Unternehmen. - Baden-Baden: Nomos, 1997. (Veröffentlichungen des HWWA-Instituts fur Wirtschaftsforschung - Hamburg; 37), 15-41. (Poetzsch 1998) Poetzsch, Eleonore: Information Retrieval. Einführung in Grundlagen und Methoden. - Potsdam: Verlag für Berlin-Brandenburg, 1998. - (Materialien zur Information und Dokumentation; 5). (Porter 1992) Porter, Michael E.: Wettbewerbsvorteile (Competitive Advantage). Spitzenleistungen erreichen und behaupten. - Frankfurt: Campus, 3 1992. (Potempa et al. 1998) Potempa, Thomas; Franke, Peter; Osowski, Wilfried; Schmidt, Maria-Elisabeth: Informationen finden im Internet. Leitfaden für die gezielte Online-Recherche. München; Wien: Hanser, 1998.
472
Literatur
(Predicasts 1993) Predicasts Wörterbuch und Thesaurus. - Foster City, Cal.: Information Access Company, 1993. (Probst 1999) Probst, Gilbert: Aufbruch ins Wissensmanagement - Bausteine, Menschen, Hindernisse. - In: Ralph Schmidt (Hrsg.): 21. Online-Tagung der DGI. Aufbruch ins Wissensmanagement. - Frankfurt: Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis, 1999, 25-33. (Probst/Raub/Romhardt 1998) Probst, Gilbert; Raub, Steffen; Romhardt, Kai: Wissen managen - Wie Unternehmen ihre wertvollste Ressource optimal nutzen. - Frankfurt; Wiesbaden: F.A.Z., 1998. (Pulic 1993) Pulic, Ante: Elemente der Informationswirtschaft. Jenseits von Smith und Keynes. - Wien: Böhlau, 1993. (Rabin/Jackowski, Hg., 1988) Rabin, J.; Jackowski, E.M. (Hrsg.): Handbook of Information Resource Management. - New York; Basel: Dekker, 1988. (Rahlenbeck 1995a) Rahlenbeck, Eckhard: Patentliteratur in Online-Datenbanken: Der Konkurrenz auf den Fersen. - In: Password Nr. 3 (1995), I-VII. (Rahlenbeck 1995b) Rahlenbeck, Eckhard: TED, BfAI und andere: Aufträge und Kooperationen online. - In: Password Nr. 4 (1995), I-VI. (Rahlenbeck 1995c) Rahlenbeck, Eckhard: Cordis, BMBF und andere: Die Öffentliche Hand gibt Geld. Subventionen und Förderprogramme online und offline. - In: Password Nr. 6 (1995), I-VII. (Rahlenbeck 1995/96) Rahlenbeck, Eckhard: Firmen, Fakten und Produkte weltweit. Online Datenbanken mit ausländischen Unternehmen. - 3 Teile. - In: Password Nr. 11 (1995), I-VII; Nr. 12 (1995), I-VII; Nr. 1 (1996), I-VII.
Literatur
473
(Rahlenbeck 1996) Rahlenbeck, Eckhard: Quellen, Branchen, Quoten aktuell: Reuters geballte Infopower. Reuters Business Briefing mit deutscher Oberfläche. - In: Password Nr. 10 (1996), I-VI. (Rahlenbeck 1998) Rahlenbeck, Eckhard: Aktienmärkte im Web: Performance im Portfolio - Internet macht Börsen transparenter. - In: Password Nr. 2 (1998), 21-23. (RAK-WB 1983) Regeln für die alphabetische Katalogisierung RAK. Band 1: Regeln fur wissenschaftliche Bibliotheken RAK-WB. - Wiesbaden: Reichert, 1983 (Rauch 1988) Rauch, Wolf: Was ist Informationswissenschaft? - Graz: Kienreich, 1988. - (Grazer Universitätsreden; 32). (Rauch 1994) Rauch, Wolf: Informationsdynamik und Informationspragmatik. - In: Wolf Rauch-, Franz Strohmeier, Harald Hiller, Christian Schlögl (Hrsg.): Mehrwert von Information - Professionalisierung der Informationsarbeit. - Konstanz: Universitätsverlag, 1994. - (Schriften zur Informationswissenschaft; 16), 15-18. (Reiterer/Mann, Hg., 1997) Reiterer, Harald; Mann, Thomas (Hrsg.): Informationssysteme als Schlüssel zur Unternehmensführung - Anspruch und Wirklichkeit. - Konstanz: Universitätsverlag, 1997. - (Schriften zur Informationswissenschaft; 31). (Reitmayer 1995) Reitmayer, Thomas: Das Datenbank- und Informationsangebot im Bereich der Wirtschafts- und Sozialwissenschaften. - In: Nachrichten für Dokumentation 46 (1995), 341-348. (Sabien 1998) Sabien, Heiko: Die gegenwärtige und zukünftige Bedeutung der CD-ROM-Produkte für die Patentinformation im Umfeld neuer globaler Netze. - In: Marlies Ockenfels, Gerhard Mantwill (Hrsg.): 50. Deutscher Dokumentartag 1998. Information und Märkte. - Frankfurt: Deutsche Gesellschaft für Dokumentation, 1998, 63-70.
474
Literatur
(Sachse/Liebig/Gödert 1998) Sachse, Elisabeth; Liebig, Martina; Gödert, Winfried: Automatische Indexierung unter Einbeziehung semantischer Relationen: Ergebnisse des Retrievaltests zum MILOS II - Projekt. - Köln: Fachhochschule Köln; Fachbereich Bibliotheks- und Informationswesen, 1998. - (Kölner Arbeitspapiere zur Bibliotheks- und Informationswissenschaft; 14). (Sänger 1993) Sänger, Thomas: Die Erschließung der Datenbank BLISS in der Online- und in der CD-ROM-Version. - Dipl.-Arb. - Köln: Fachhochschule für Bibliotheks- und Dokumentationswesen, 1993. (Salton 1968) Salton, Gerald: Automatic Information Organization and Retrieval. - New York: McGraw Hill, 1968. (Salton, Hg., 1971) Salton, Gerald: The SMART Retrieval System - Experiments in Automatic Document Processing. - Englewood Cliffs, NJ: Prentice-Hall, 1971. (Salton/McGill 1987) Salton, Gerald; McGill, Michael J.: Information Retrieval. Grundlegendes für Informationswissenschaftler. - Hamburg [u.a.]: McGraw-Hill, 1987. (Schäfer 1998) Schäfer, Sabine: Virtuelle Wirtschaftsbibliotheken im Vergleich. Universitäre Linksammlungen. - In: Password Nr. 12 (1998), 21-28. (Schieber, Hg., 1995) Schieber, Peter (Hrsg.): Informationsmanagement in der Informationsgesellschaft. - Konstanz: Universitätsverlag, 1995. - (Schriften zur Informationswissenschaft; 23). (Schlittgen/Streitberg 1994) Sehlingen, Rainer; Streitberg, Oldenbourg, 5 1994.
Bernd H.: Zeitreihenanalyse. - München; Wien:
(Schmidt 1990) Schmidt, Ralph: Funktionale Dienste - In: Marianne Buder; Werner Rehfeld-, Thomas Seeger (Hrsg.): Grundlagen der praktischen Information und Dokumentation. - München [u.a.]: Saur, 1990, 440-461.
Literatur
475
(Schmoch 1990) Schmoch, Ulrich: Wettbewerbsvorsprung durch Patentinformation. - Köln: Verlag TÜV Rheinland, 1990. (Schramm/Ludwig 1998) Schramm, Reinhard; Ludwig, Jan: Regionales Patentnetz in Thüringen - neue Informationsleistungen. - In: Marlies Ockenfeld; Gerhard Mantwill (Hrsg.): 50. Deutscher Dokumentartag 1998. Information und Märkte. - Frankfurt: Deutsche Gesellschaft für Dokumentation, 1998, 37-61. (Schütte 1995) Schütte, Silke: Ist die Qualität von Informationsdienstleistungen eine entscheidende Voraussetzung fur den erfolgreichen Einsatz von EIS? - In: Wolfram Neubauer, Ralph Schmidt (Hrsg.): 17. Online-Tagung der DGD. „Online und darüber hinaus ... Tendenzen der Informationsvermittlung". - Frankfurt: Deutsche Gesellschaft für Dokumentation, 1995. - (DGD-Schrift [OLBG-16]), 335-359. (Schütte 1997) Schütte, Silke: Möglichkeiten fur die Präsenz einer Rückversicherung im Internet mit Berücksichtigung der Individualität von Geschäftsbeziehungen. - In: Harald Reiterer, Thomas Mann (Hrsg.): Informationssysteme als Schlüssel zur Unternehmensführung - Anspruch und Wirklichkeit. - Konstanz: Universitätsverlag, 1997. (Schriften zur Informationswissenschaft; 31), 102-114. (Schuhböck 1997) Schuhböck, Hans P.: Risk Management - Anmerkungen zur Qualität von Bonitätsauskünften. - In: Nachrichten für Dokumentation 48 (1997), 67-77. (Schumpeter 1961) Schumpeter, Joseph A.: Konjunkturzyklen. Eine theoretische, historische und statistische Analyse des kapitalistischen Prozesses. - Göttingen: Vandenhoek & Ruprecht, 1961. (Schwarz 1998) Schwarz, Astrid M.: Branchenberichte als Informationsprodukt. - Dipl.-Arb. FH Köln, 1998. (Seeger, Hg., 1995) Seeger, Thomas (Hrsg.): Aspekte der Professionalisierung des Berufsfeldes Information. - Konstanz: Universitätsverlag, 1995. - (Schriften zur Informationswissenschaft; 21).
476
Literatur
(Seltzer/Ray/Ray 1997) Seltzer, Richard; Ray, Deborah S.; Ray, Eric J.: The AltaVista Search Revolution. Berkeley: Osborne McGraw-Hill, 1997. (SIG/TIRM 1994a) FID Special Interest Group for Training for Information Resources Management (SIG/TIRM): Training for Information Resources Management. Section A: Tutorial on Information Resources Management. - The Hague: International Federation for Information and Documentation (FID), 1994. - (FID Occasional Paper; 7 / FID Publication 706). (SIG/TIRM 1994b) FID Special Interest Group for Training for Information Resources Management (SIG/TIRM): Training for Information Resources Management. Section B: Information Resources Management Case Studies. - The Hague: International Federation for Information and Documentation (FID), 1994. - (FID Occasional Paper; 8 / FID Publication 707). (Sparck Jones 1972) Sparck-Jones, Karen: A Statistical Interpretation of Term Specifity and Its Application in Retrieval. - In: Journal of Documentation 28 (1972), 11-21. (Staud 1991a) Staud, Josef L.: Online-Datenbanken. Aufbau, Struktur, Abfragen. - Bonn [u.a.]: Addison-Wesley, 1991. (Staud 1991b) Staud, Josef L.: Statistische Datenbanken, ihre Anbieter und Produzenten. - Frankfurt [u.a.]: Lang, 1991. (Staud 1992) Staud, Josef L.: Fachinformation Online. Ein Überblick über Online-Datenbanken unter besonderer Berücksichtigung von Wirtschaftsinformationen. - Berlin [u.a.]: Springer, 1992. (Staud 1997) Staud, Josef L.: Statistische Informationen. - In: Marianne Buder, Werner Rehfeld, Thomas Seeger; Dietmar Strauch (Hrsg.): Grundlagen der praktischen Information und Dokumentation. - München [u.a.]: Saur, 4 1997, 327-340.
Literatur
477
(Steinhaus 1997) Steinhaus, Ingo: Online recherchieren. Ökonomische Wege zu Informationen. Reinbek bei Hamburg: Rowohlt Taschenbuch Verlag, 1997. (Stock, M. 1989) Stock, Mechtild: Textwortmethode und Übersetzungsrelation. - In: ABI-Technik 9 (1989), 309-313 (Stock,M. 1999) Stock, Mechtild: Standard-Thesaurus Wirtschaft. Ein neuer Standard der Wirtschaftsinformation? - In: Password Nr. 1 (1999), 22-29. (Stock 1991a) Stock, Wolfgang G.: Wirtschaftsinformationen aus Online-Datenbanken. - München: ifo Institut für Wirtschaftsforschung, 1991. - (ifo Diskussionsbeiträge; 2). (Stock 1991b) Stock, Wolfgang G.: Das „Online-Untemehmensbild" anhand von Wirtschaftsdaten und informetrischen F&E-Indikatoren. - In: Harald Killenberg, Rainer Kuhlen, HansJürgen Manecke (Hrsg.): Wissensbasierte Informationssysteme und Informationsmanagement. - Konstanz: Universitätsverlag, 1991. - (Schriften zur Informationswissenschaft; 2), 376-386. (Stock 1992a) Stock, Wolfgang G.: Wirtschaftsinformationen aus informetrischen Online-Recherchen. - In: Nachrichten für Dokumentation 43 (1992), 301-315. (Stock 1992b) Stock, Wolfgang G.: Literaturdatenbanken zur deutschen Wirtschaft: eine Bestandsaufnahme. - In: Reinhold Gokl (Hrsg.): Externe Wirtschaftsdatenbanken im betrieblichen Informationsprozeß. Angebote, Erfahrungen der Anwender, Einsatzbereiche, Trends. - Frankfurt; Düsseldorf: GENIOS-Wirtschaftsdatenbanken, 1992, 175-196. (Stock 1993a) Stock, Wolfgang G.: Die Rolle von Informationen in Wirtschaft und Gesellschaft. In: ifo Schnelldienst Nr. 1-2 (1993), 23-26. (Stock 1993b) Stock, Wolfgang G.: Der Markt für elektronische Informationsdienstleistungen. - In: ifo Schnelldienst Nr. 14 (1993), 22-31.
478
Literatur
(Stock 1994) Stock, Wolfgang G.: Benchmarking, Branchen- und Konkurrenzanalysen mittels elektronischer Informationsdienste. - In: Wolfram Neubauer, Ralph Schmidt (Hrsg.): Information und Medienvielfalt. - Frankfurt: Deutsche Gesellschaft für Dokumentation, 1994. - (DGD-Schrift [OLBG-15] 2/94), 243-272. (Stock 1995) Stock, Wolfgang G.: Elektronische Informationsdienstleistungen und ihre Bedeutung für Wirtschaft und Wissenschaft. - München: ifo Institut für Wirtschaftsforschung, 1995. - (ifo Studien zur Innovationsforschung; 3). (Stock 1996) Stock, Wolfgang G.: Informationsgesellschaft und Telekommunikationsnetze in der europäischen Informationspolitik. - In: Wulfdieter Zippel (Hrsg.): Transeuropäische Netze. - Baden-Baden: Nomos, 1996. - (Schriftenreihe des Arbeitskreises Europäische Integration e.V.; 39), 77-105. (Stock 1997) Stock, Wolfgang G.: Die Informationsgesellschaft: Neue Berufe, mehr Beschäftigung? - In: Gerhard J. Mantwill (Hrsg.): Informationswirtschaft und Standort Deutschland. Der Beitrag der Informationswirtschaft zur Wettbewerbsfähigkeit der Unternehmen. - Baden-Baden: Nomos, 1997. - (Veröffentlichungen des HWWAInstituts für Wirtschaftsforschung - Hamburg; 37), 141-171. (Stock 1998a) Stock, Wolfgang G.: Was heißt „Informationswirtschaft"? Eine empirische Untersuchung der Einschätzungen von Informationsspezialisten. - In: nfd. Information: Wissenschaft und Praxis 49 (1998), 172-176. (Stock 1998b) Stock, Wolfgang G.: Profound. Endnutzersystem für internationale Geschäftsinformationen. - In: Password Nr. 10 (1998), 22-28. (Stock 1998c) Stock, Wolfgang G.: Lexis-Nexis' Freestyle. Natürlichsprachige Suche - More like this! - In: Password Nr. 11 (1998), 21-28. (Stock 1999a) Stock, Wolfgang G.: Marketing der Online-Archive („Hosts"). Gefordert: Neue Produkt-, Preis- und Distributionspolitik. - In: Password Nr. 2 (1999), 20-28.
Literatur
479
(Stock 1999b) Stock, Wolfgang G.: Web of Science: Ein Netz wissenschaftlicher Informationen gesponnen aus Fußnoten. - In: Password Nr. 7/8 (1999), 21-25. (Stock 1999c) Stock, Wolfgang G.: Information Center von AGI-Information Management Consultants: Management interner und externer Informationsressourcen in einem einheitlichen Groupware-System. - In: Password Nr. 3 (1999), 21-27. (Stock/Fink 1993) Stock, Wolfgang G.; Fink, Sabine: Die Literaturdatenbanken des ifo Instituts fur Wirtschaftsforschung : ifo Literaturdatenbank, ifo Osteuropadokumentation, Katalog der ifo Bibliothek. - In: ifo Literaturdatenbanken : Suchhilfen / hrsg. vom Informationszentrum des ifo Instituts fur Wirtschaftsforschung. - München: ifo Institut, 1993, 7-24. (Stock/Striefler/Thomsen 1994) Stock, Wolfgang G.; Striefler, Hubert-Günter; Thomsen, Horst: Wirtschaftsinformationen auf CD-ROM: die WISO II. - In: ifo Schnelldienst Nr. 7 (1994), 39-43. (Strohmeier 1994) Strohmeier, Franz: Informationsbedarf und Informationsmanagement. - In: Wolf Rauch\ Franz Strohmeier, Harald Hiller, Christian Schlögl (Hrsg.): Mehrwert von Information - Professionalisierung der Informationsarbeit. - Konstanz: Universitätsverlag, 1994. - (Schriften zur Informationswissenschaft; 16), 498-505. (STW 1998) Standard-Thesaurus Wirtschaft / Hrsg.: Bibliothek des Instituts für Weltwirtschaft Deutsche Zentralbibliothek fur Wirtschaftswissenschaften; GBl Gesellschaft für Betriebswirtschaftliche Information mbH; HWWA-Institut für WirtschaftsforschungHamburg - Informationszentrum; ifo Institut für Wirtschaftsforschung e.V. - Informationszentrum. - 3 Bde. (Bd. 2 in 6 Teilen). - Kiel [u.a.], 1998. (Sullivan o.J.) Sullivan, Danny: Search Engine Watch. - URL: http://searchenginewatch.com/ (Thomä/Tribiahn 1995) Thomä, Elke; Tribiahn, Rudolf: Online-Patentdatenbanken: Vergleich von Inhalt, Struktur und Recherchemöglichkeiten. - In: Wolfram Neubauer, Ralph Schmidt (Hrsg.): 17. Online-Tagung der DGD. Online und darüber hinaus ... Tendenzen der Informationsvermittlung. - Frankfurt: Deutsche Gesellschaft für Dokumentation, 1995, 139-154.
480
Literatur
(Thompson 1999) Thompson, N.J.: Web Trademark Database irom USPTO. - In: Database 22 (1999), June/July, 48-50. (Tribiahn/Milde 1993) Tribiahn, Rudolf; Milde, Sabine: Die Widerspiegelung des Rechtsstandes von Patenten in Patentdatenbanken. - In: Nachrichten für Dokumentation 44 (1993), 241-253. (Univ. Karlsruhe 1997a) Universität Karlsruhe (TH): Neuer Studiengang Informationswirtschaft - Presseinformation Nr. 074/1997 vom 8. August 1997. - URL: http://www.uni-karlsruhe.de/ ~presse/Pressestelle/pi074.htm. (Univ. Karlsruhe 1997b) Universität Karlsruhe (TH): Studiengang Informationswirtschaft Informationen der Fakultät für Informatik, 1997. - URL: http://www.wior.uni-karlsruhe.de/wior/ waldmann/~infowirt/infowirt.htm. (van Rijsbergen 1979) van Rijsbergen, C.J.: Information Retrieval. - London: Buttersworths, 2 1979. (Viesels 1997) Viesels, Ulrike (Bearb.): Retrievalsprachen. Eine Zusammenstellung der wichtigsten Befehlsarten. - Köln: FH Köln, Fachbereich Bibliotheks- und Informationswesen, 1997. (VIW o.J.) VIW e.V. : Verband der Informationswirtschaft. - Eschborn, o.J. - URL: http://www. viw.de. (Vogel 1990) Vogel, Elisabeth: Informationsmanagement. Stand und Perspektiven des Managements von Informationsressourcen. - In: Marianne Buder, Werner Rehfeld; Thomas Seeger (Hrsg.): Grundlagen der praktischen Information und Dokumentation. - München [u.a.]: Saur 3 1990, 897-927. (vom Kolke 1994) vom Kolke, Ernst-Gerd: Online-Datenbanken. Systematische Einführung in die Nutzung elektronischer Fachinformation. - München; Wien: Oldenbourg, 1994.
Literatur
481
(Wagner-Döbler 1988) Wagner-Döbler, Roland: Karlsruher Juristische Bibliographie und juris: Ein Vergleich. - In: Informatik und Recht Nr. 3 (1988), 458-461. (Wagner-Döbler 1990) Wagner-Döbler, Roland: Fundhefte und juris. Ein quantitativer Vergleich. - In: Computer und Recht Nr. 6 (1990), 412-414. (Wagner-Döbler 1992) Wagner-Döbler, Roland: „Juris", ein juristischer Zitationsindex: Rechts-, informationswissenschaftliche und dokumentarische Anwendungsmöglichkeiten. - In: Wolfram Neubauer; Karl-Heinz Meier (Hrsg.): Deutscher Dokumentartag 1991. Information und Dokumentation in den 90er Jahren: Neue Herausforderung, neue Technologien. - Frankfurt: Deutsche Gesellschaft für Dokumentation, 1992, 251-264. (Walker/Jones 1987) Walker, Stephen; Jones, Richard M.: Improving Subject Retrieval in Online Catalogues. - Boston Spa: British Library, 1987. - (British Library Research Paper; 24). (Weigend 1997) Weigend, Arno: Wirtschaftsdatenbanken. - In: Marianne Buder; Werner Rehfeld; Thomas Seeger, Dietmar Strauch (Hrsg.): Grundlagen der praktischen Information und Dokumentation. - München [u.a.]: Saur, 4 1997,318-326. (Wenzel 1999) Wenzel, Alfred: esp@cenet - Schlüsselelement der europäischen Patentinformationspolitik. - In: Marlies Ockenfeld; Gerhard Mantwill (Hrsg.): Information und Region. Frankfurt: Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis, 1999, 103-109. (Wersig 1985) Wersig, Gernot: Thesaurus-Leitfaden. Eine Einführung in das Thesaurus-Prinzip in Theorie und Praxis. - München [u.a.]: Saur, 2 1985. (Wichmann 1997) Wichmann, Thorsten: NetEc - The Economist's Internet Library. - In: The Economic Journal 107(1997), 1620 ff.
482
Literatur
(Wieken 1998) Wieken, John-Harry: Meta-Daten für Data Marts und Data Warehouses. - In: Mucksch, Harry; Behme, Wolfgang (Hrsg.): Das Data Warehouse-Konzept.Wiesbaden: Gabler, 3 1998, 275-315. (Wiley 1998) Wiley, Deborah Lynne: Cited References on the Web: A Review of ISI's Web of Science. - In: Searcher 6 (1998), Nr. 1, 32-39. (Wittmann 1992) Wittmann, Alfred: Grundlagen der Patentinformation und Patentdokumentation. Berlin; Offenbach: VDE-Verlag, 1992. (W.O.D. 1998a) Welt der Online-Datenbanken. Wirtschaftsdatenbanken. - Köln: Scientific Consulting Dr. Schulte-Hillen, 1998. - (CD-ROM- und Internet-Version). (W.O.D. 1998b) Welt der Online-Datenbanken. Datenbanken für Naturwissenschaft, Technik, Patente. - Köln: Scientific Consulting Dr. Schulte-Hillen, 1998. - (CD-ROM- und Internet-Version). (ZBW 1998) Wirtschaftswissenschaftliche Literatur. Bibliothek - Dokumentation - Information. Kiel: Deutsche Zentralbibliothek fiir Wirtschaftswissenschaften (ZBW), 5 1998. (Zipf 1949) Zipf, George K.: Human Behavior and the Principle of Least Effort. - Cambridge, MA: Addison-Wesley, 1949.
Literatur
Zeitschriften und Newsletter der Informationswirtschaft Auswahl
Business Information Review ISSN 0266-3821 Database ISSN 0162-4105 Information Management ISSN 1080-286X Information Processing & Management ISSN 0306-4573 Information Resources Management Journal ISSN 1040-1628 Information Today ISSN 8755-6286 Information World Review ISSN 0950-9879 International Journal of Information Management ISSN 0268-4012 Journal of Global Information Management ISSN 1062-7375 Knowledge Management ISSN 1463-1822 Link-Up ISSN 0158-5460
483
484 Managing Information ISSN 1352-0229 nfd - Information. Wissenschaft und Praxis ISSN 1434-4653 (in deutscher Sprache) Online ISSN 0146-5422 Online & CD-ROM-Review ISSN 1353-2642 Password ISSN 0930-3693 (in deutscher Sprache) Searcher ISSN 1070-4795
Messen der Informationswirtschaft Auswahl Infobase Messe Frankfurt; jährlich im Mai Online Information Olympia Londonjährlich im Dezember
Literatur
Register A A-Schrift 308 ABI/INFORM 197-198 Abstandsoperator 107-109, 199,402, 411,432 Abstract 194,427 Abstraktionsrelation 60-61 Abwehrrecherche 313 Ad-hoc-Informationsbedarf 381 -385 Adresseninformation 251 Advanced Search (AltaVista) 443, 445-446 Ähnlichkeit, semantische 141-142 Äquivalenzrelation 77 Agenturmeldung 224-227 Aggregation 370 AGI-Information Management Consultants 388-391 Agrargesellschaft, informatisierte 5 Aktienkurs 274,403-404 AltaVista 176, 178, 292,337, 361-362,440-449 American Economic Association 191 Ameri tec h Corp. 268 Amtsblatt der Europäischen Gemeinschaften / Reihe C 297 Amtsblatt der Europäischen Gemeinschaften / Reihe L 297 Amtsblatt der Europäischen Gemeinschaften / Reihe S 276 Ankreuzen eines Datensatzes 115 Anzeigebefehl 114-115 Arbeitsplatz 10 Arbeitsteilung, industrielle 8 Arbeitsteilung, internationale 7 Archiv 238 Argus Media 240-244 Artikel, wissenschaftlicher 133 Artikellänge 203
Arts & Humanities Citation Index 339, 341 ASCII-Format 115 Assoziationsrelation 60-62, 78,415 Aufbereitung recherchierter Informationen 382-383 Auftragsforschung 37 Augustin, Siegfried 31,57 Ausgabeformat 437-438 Ausschreibung 276-282 Ausschreibung, öffentliche 276-282 Ausschreibungscode 277-278 Autonomie, informationelle 33 Autor, wissenschaftlicher 135-136 Axel-Springer-Verlag 237
B Ballast 121 bandwagon effect 2 Bank 216 Bank, Matthias 442 Banyan Worldwide 361 Bäsch, Reva 199 Basic Index 98-100 Basisinnovation 2-4 Basissystem 29 Bates, Marcia J. 126-127 Begriff 125 Begriffskombination 79-80 Begriffsleiter 60-61 Begriffsreihe 60-61 Begriffssystem 59-62 Behrmann, Niels 337 Bell & Howell Information and Learning 197, 343 Benchmarking 350 Benscheck, Wolfgang XXII Berry, Michael W. 177,443 Berrypicking-Modell 126-127 Best, David P. 30 Bestandsrelation 60-61 Bestellung von Literatur 116-117
486
Register
Betriebswirtschaft 246 Betriebswirtschaftslehre 18, 193-198 Bevölkerungsstrukturdaten 212-213 Bezugseinheit, dokumentarische 91,123-124 Bibliodata 345 Bibliographie 47 Bibliothek 23-24,37,116, 181,384 Bibliothek, digitale 181 Bibliothek, virtuelle 181-184 Bibliothekskatalog 66-69 Bieletzki, Christine 24 Bilanz 257-261 Bilanzanalyse 261 Bild 226 Bildschirmausgabe 115 Bindestrichergänzung 170-171 Biographie 358-361 Blättern im Wörterbuch 101-102 BLISS 193-197 Bluesheet 96-97 Börseninformation 274 Boni, Manfred 194, 198,205 Bonin, Hinrich E.G. 175 Bonität 261-268 Bonitätsindex 262 Bonitätsinformation 261-268 Bonitz, Manfred 4-5 Boole, George 104 Boolescher Operator 5. Operator, mengentheoretischer Bradford, Samuel C. 133-135 Bradford-Multiplikator 133 Bradford-Zipf-Bibliograph 133-135 Brancheninformation 233-237 Bredemeier, Willi 20 British Library 65,68-69 British Library Document Supply Centre 193, 343 British National Bibliography Broker 216
68-69
Brokerline (Profound) 253, 397-398
Browsen 175 Bruhn, Manfred 207 Brynjolfsson, Eric 13 Buch 45-46, 184-185 Buckel, Eberhard 352 Bugdahl, Volker 329 Bundesanzeiger 254-257 Bundesbank 377 Bundesdruckerei 328 Bundesministerium für Wirtschaft und Technologie 286-288 Bundesrecht, deutsches 294-295 Bureau van Dijk 248 Burrows, Michael 337 Burton, William C. 156 Business Datenbanken GmbH 283 Business Wire 226-227
c C-Schrift 308 Call-Center 292 Capurro, Rafael 41 CCH Trademark Research Corp. 333 CD-ROM 48-49, 322 CD-ROM-Datenbank 48 CD-ROM-Verlag 23 Celex 297-299, 306 Chart-Library (GENIOS) 233 Chun, Tham Yoke 440,442 CIRET 420 Clipping 240, 389-391 Cleveland, A.D. 59 Cleveland, D.B. 59 Clusteranalyse 141-143,356 CMG1440 Co-Citation-Analysis 168 Cohausz, Helge B. 308 Common Procurement Vocabulary 5. CPV Compac Computer Corp. 440 Company Line (Profound) 398
487
Register Consulting 37, 384 Consumer Service 22 Copyright 310 CORDIS 286 Corsten, Rebecca 380 Country Line (Profound) 398 Courtois, Martin P. 177,443 CPV 277-278 Creditreform 248, 250, 252-253, 260-262 Cross ley, Charles A. 65
D Daniel, Frank 384 Darby, Richard 39 Darmstadt, FH 14-15 Darstellung, figürliche (Klassifikation) 330-332 Data Mining 52-53, 130-146, 350-356, 363-365, 392 Data Warehouse 50-57 Database-Marketing 251 DataStar XXVIII, 94-95, 210-212, 215-216, 218-221, 228, 395-397, 406 Daten 40,51-52 Datenbank, bibliographische 90-91,96, Datenbank, Datenbank, Datenbank, Datenbank,
187,214-216 biographische 358-361 elektronische 47 operative 51 statistische
90-91, 113-114 Datenbankaufruf 98 Datenbankaufruf, datenbankübergreifender 98 Datenbankbeschreibung 96-97 Datenbankführer 91 -93 Datenbankindex 93-95, 362 Daten integration 51 Datentransformation 51 Datenverarbeitung 25-26,40
Datex-P 20,47 DDC 64-69, 180 Dehnert-Kleibrink, Dagmar 13 DEMAS 333-334 DEPAROM 328, 334 Derwent 2 3 3 , 3 1 7 , 3 3 7 Derwent Patents Citation Index 317 Deskriptor 77-81,83-84, 139,400 Deskriptorsatz 85-86,400 Deskriptorvergabe, automatische 164-165,400 Deutsche Morgan Grenfell 216 Deutsche Nationalbibliographie s. DNB Deutsches Institut für Wirtschaftsforschung 377,419 Deutsches Patent- und Markenamt 307-308, 316, 321, 327-329, 381 Dewey Decimal Classification s. DDC Dewey, Melvil 64 Dezimalklassifikation 64, 180 Dialindex 362-363 DIALOG XXVIII, 96,111-112, 193, 197, 236, 274, 340, 342-344, 362, 365, 395-397,407 Dialog Corp. XXVIII, 216, 222, 395-397 Die Deutsche Bibliothek 345-347 Dienstleistungsgesellschaft, informatisierte 5 Differenzrecherche 297 Digital Equipment Corp. 440 D1MDI110, 364 Diodato, Virgil P. 132 Disclosure 290-291,293 Diskjockey-Syndrom 322 Dissertation 343-347 Dissertation Abstracts 343-345 DNB 345-347 Document Delivery Service 116,296, 328-329, 339
488 Dohse, Knuth 9 Dokumentation 19,43 Dokumentationseinheit 91,123-124 Dokumentationsmethode 59,124-125 Dokumentationssprache 164-165 Dokumentationswürdigkeit 123-124, 419-420 Dokumenthäufigkeit, inverse 162-163 Dossierprinzip 237 Dostal, Werner 10-11 Dow Jones 224 Dow Jones Reuters Business Interactive 224-227 DRI373, 377-378 DSI DataService & Information 373-378 Dublette 111-112 Dublettenelimination 111 Dublettenidentifikation 111 Düsseldorfer Virtuelle Bibliothek 182-183 Dun & Bradstreet 247-248, 253, 263-268 Dun (4 Bradstreet Schimmelpfeng 263 DUNS Number 247, 268 DVD 322
E E-Commerce 268-269, 293 E-Mail 45,54, 386-388 E-Mail-Adresse 361 Easy Search (Web of Science) 434 ECONIS 188-191,419 EconLit 191-193 economy of scale 38 Egghe, Leo 131-132 Einkauf 271 Einspruchrecherche 313-314 EIS 51-52 Empfänger 41 -44 Endnutzerrecherche 24, 385-386,
Register 395-407 Engelhardt, Klaus 310 Englert, Marianne 237 Entscheidung 31,119, 3 81 -3 82 Epidos 318, 322 EPOBOA 325-327 EPOPAT 323,325 ERECO 420 Erfahrungsgut 38-39 Erfassung, formale 427-429 Erlaß 294 ESPACE-EP 314, 322 EUR-OP 276 Europäische Union 70, 297-299 Europäisches Patentamt 308-309, 321-327, 334 Evans, Ross 147-148 Event-Code 234-235 Event-Marketing 243 Executives Information System s. EIS Exklusionsmenge 104, 106 Export 274
F Fachbibliothek, virtuelle 183 Fachinformationsverbund Internationale Beziehungen und Länderkunde 423-425 Fachterminologie 80 Fachwissen 42 FAKT 208-212 Faktendatenbank 90-91 Fakteninformation 22,120, 208-214, 246-247 Fall (Rechtsprechung) 299-301, 303-305 Fank, Matthias XXIX, 29-30 Faust, Konrad 352-353, 355-356 FAZ 228-233 Fehleridentifikation 157-159 Fehlertoleranz 157-159 Feld, alphanumerisches 98-99
Register Feld, numerisches 98-99, 392 Feldkürzel 96 Feldschema 96 Fendt, Heinz 350 Ferstl, Otto K. XXIX, 29 Fink, Sabine 4 1 7 , 4 1 9 FINN (Creditreform) 260 F1Z Karlsruhe XXVIII FIZ Technik XXVIII, 348, 418-420, 428 Förderdatenbank (BMWi) 286-288 Förderprogramm 286-288 Food Science and Technology Abstracts 364 Fordismus 8-9 Forschung und Entwicklung s. FuE Forum Informationsgesellschaft 10 Fragmentierung 68, 103-104,433 Franke, Peter 177-178 Frants, Valery I. 120, 152 Freestyle (Lexis-Nexis) 407-417 Friedrichs, Jürgen 8 Frost & Sullivan 216, 222, 397 Frost & Sullivan Electronic Distribution 216, 222, 397 Frühwarninformation 32, 119, 349-350,353,391-392 FuE 335-357 Fünfter Kondratieff 1,3,6 Fugmann, Robert 59 Full Search (Web of Science) 435
G Gale Group 233 Gale Research 48, 91 -93, 233
489 Gegenstand, thematisierter 125 Genauigkeitsrate 121 GENIOSXXV III, 189,203,212, 214, 227, 232, 274, 276, 281, 333, 359-360, 373, 376-377, 386-388, 406,418, 420, 428, 430 Genossenschaftsregister 255 Georgy, Ursula 269 Geschäftsanbahnung 282-286 Geschäftsbericht 238,290-291, 293 Geschäftsklima 367-373 Geschmacksmuster 307-308 Gesetz (Rechtsnorm) 294-306 Gesetz, Bradfordsches 133-135 Gesetz, Garfieldsches 136-137 Gesetz, informetrisches 130-132 Gesetz, Lotkasches 135-136 Gesetz, Zipfsches 132 Gespräch 43-45 Gessner, Dieter 238 Gewinn- und Verlustrechnug 260 GfK-Marktforschung 212-214 Giles, C.L. 442 global sourcing 7 Globalbase 236-237 Globalisierung 7-8 GO 274 Gödert, Winfried 79, 168 Goffe, William L. 204-205 Goldrian, Georg 367 Graumann, Sabine 207, 216 Groupware 7, 388 Grundsatzurteil 296 Gruner & Jahr 237 Grupp, Hariolf356
Ganzmann, Jochen 228, 230 Garfield, Eugene 136-137
H
Garman, Nancy 180
Hacker, Rupert 181
Gastmeyer, Manuela 84
Häufigkeitsoperator 109-110, 199
GBl XXVIII, 84, 189, 193-197, 228,
Handelsblatt
260,406,418,420,428,430 Gebrauchsmuster 308-309, 327
225, 227, 232-233, 386
Handelsregister 254-257 Handlung 40-41
490 Harman, Donna 161, 168 Harvey, Andrew C. 367 Hauer, Manfred 389 Haugg, Norbert 308 Haupttafel (DDC) 64-65 Hayn, Benita 257 Head Hunting 364-365 Heinrich, Lutz J. XXIX Henrichs, Norbert 150, 422 Hermeneutik 41 Hierarchierelation 60-61,78 Hilberer, Thomas 181 Hilfstafel (DDC) 65 Hochfrequenzwort 132, 160 Hochschulschrift 343-347 Hock, Randolph 444 Höhne, Margit 328 Hofrnann, Herbert 7-9,12 Holographie-Prinzp 4-5 Holtz, Christiane 384 Homepage 291-293 Homepageretrieval 2 9 2 , 4 4 7 Homonym 77-78 Homonymzusatz 78 Hoppenstedt 248-251, 253, 257, 270-271 Host 22-23,47-48, 93 Hotbot 442 Houlihan, Lokey Howard & Zukin Inc. 272 H T M L 20, 175-176 H T T P 175 Hütten, Christoph 290 Hughes, Kirsty 31 Hunter, Michael 4 4 0 , 4 4 4 HWWA-Firmendatenbank 239 HWWA-Hamburgisches Weltwirtschaftsarchiv 84, 238-240, 290 HWWA- Wirtschaftsdatenbank 419 Hypertext 174
Repister
I IDF 162-163,412-413 ifo Institut für Wirtschaftsforschung 84, 352, 367-373, 378, 417 ifo Literaturdatenbank
417-432
Ilmenau, TU 328 Image (eines Unternehmens) 240 Import 274 IMO 254 IMU 11, 13 Inan, Yakub 51 Index (Zeitreihe) 371-372 Indexierung 5. Information Indexing Indexierungsbreite 82 Indexierungskonsistenz 82-83 Indexierungsspezifität 82 Indexierungstiefe 82 Indexsuche 94-95 Indikatorbegriff 153-154 Individual News (AGI) 388-391 Individualkommunikation 43-45 Industriegesellschaft, informatisierte 5 Info 2000 14-15 Information 4-5,29,36-58 Information Access Company 72, 229, 233-237 Information als Objektart 29 Information als Produktionsfaktor 9,30 Information als Rohstoff 36-37, 335-337 Information Information Information Information Information 393
als Vertrauensgut 38-39 als Ware 36-38 als Wirtschaftsgut 36-39 als Wirtschaftssektor 5 Center (AGI) 388-391,
Information Indexing 81-84, 123-126, 147-173, 225, 228-230, 420-427 Information Indexing, automatisches
Register
491
147-173, 177-178, 407-417, 442-443 Information Indexing, gleichordnendes 83 Information Indexing, syntaktisches 83-84,88, 109 Information Overload 208 Information Retrieval 90-130, 137-144, 147-148, 175-185, 199-200,381-392 Information Retrieval, assoziatives 166-167,414-415,436 Information Retrieval, datenbankübergreifendes 111-112 Information Retrieval, feldspezifisches 98-99 Information Retrieval, hierarchisches
119-121,247 Informationsbedarf, objektiver 55-56 Informationsbedarf, problemorientierter 119-121, 147,247 Informationsbedarf, subjektiver 55-56 Informationsbedürftiis 55 Informationsberater 385 Informationsberuf 10 Informationsbewertung 38 Informationsbroker 383-384 Informationsdienstleistung 382-383 Informationsfluß 28, 143-145 Informationsflußgraph 143-145, 356 Informationsflut 224 Informationsgesellschaft 1-13 Informationsgesellschaft,
78-79, 110-111 Information Retrieval, informe-
Definition 6-7 Informationshermeneutik 41 Informationsinhalt XVII,
trisches 130-131, 137-146 Information Retrieval, natürlichsprachiges 147-148, 199, 407-417, 444
6,13,27,31,81-82 Informationskanal 43-50 Informationskanal, elektronischer 46-50
Information und Dokumentation 14 Information, Definition 39-40 Information, externe 20-25, 27-28, 32-33,51,58, 130, 251
Informationskanal, formaler 45-50 Informationskanal, nichtformaler 43-45 Informationslinguistik 149-159,
Information, Information, Information, Information,
interne 32,50 nicht-perfekte 380 „richtige" 31 personenbezogene
250-251,358-365 Information, vertrauliche 45 Information, zielgruppenspezifische 54 Informationsabfrage 51 -52 Informationsanalyse 51 -52 Informationsanbieter 22-23 Informationsbedarf 54-57,119-121,125-126,381-394 Informationsbedarf, konkreter
168-171 Informationslogistik 31,50-57 Informationsmanagement XV, 27,29-30 Informationsmangel 32 Informationsnetz, informelles 45 Informationsökonomie 38-39 Informationsorganisation 11,13,27 Informationsparadoxon 38 Informationsproduzent 21 -22 Informationsressource 13,25,50 Informationsressourcenmanagement XV, 20,27,31-33,48 Informationsstatistik 159-164 Informationssystem, betrieb-
Register
492 liches XV-XVIII, 13,27-29,33,53 381-394 Informationstechnik 6-7,11,13 Informationstheorie 40 Informationsübermittlung 41-43,53-54, 144 Informationsübermittlung, aktive 53-54 Informationsübermittlung, passive 53-54 Informationsverdichtung 51-52 Informationsveredelung 32 Informationsvermittler 23-25, 383-386 Informationsvermittlungsstelle 24, 384-385 Informationswirtschaft XV-XXIX, 1-35
381-394 Inter-Indexer-Konsistenz 82-83 International Business Opportunities Service 283-285 International Market Research Information (IMRI) 214-216 Internationale Patentklassifikation s. IPK Internet 50, 174 Internet-Provider 23 Intra-Indexer-Konsistenz 83 Intranet 49-50, 404-405, 432 Investext 216-222, 253 Investext Group 216-217, 233 IPK 7 3 - 7 6 , 3 1 0 , 3 1 7 - 3 1 8 , 3 5 0 ISI Document Solution 339
J
Informationswirtschaft als betriebliche Funktion 25-34 Informationswirtschaft als Studienfach 14-15 Informationswirtschaft als Wirt-
Jaccard-Sneath-Koeffizient 141-142
schaftsbranche 20-25 Informationswissenschaft XV, 19 Informetrie 130-146, 240, 350-356,
Jokerzeichen 103-104
363-365,392,439 Informieren 29 InfoSort (Profound) 399-400 Infratest Burke 208-209 ING Barings 216 Inhaltsabbildung 60,81-84 Initiierungsindex 243 Inmon, W.H. 51 Innovation 2-4, 32, 335-336, 349 Inpadoc 318-322, 334, 337 Institut für Weltwirtschaft, Kiel 188 Institut für Wirtschaftsforschung, Halle 419 Instiute for Scientific
Information
233, 318, 339-343, 357, 363, 432 Integration externer Informationen
Jacobs, J.R. 157 Jahresabschlußbilanz 257 Janko, Wolfgang H. XXIX, 27,29 Java 20 Jones, Richard M. 157-158 Journal of Commerce 274 Journal of Economic Literature 191 Journal of Marketing 200-203 Jürgens, Ulrich 9 Juris XXVIII, 295-297, 306 Just-in-time Information 56-57
K Kämper, Ulrich 174 Kanal 41-43 Karlsruhe, Universität 14-15 Kami, Edi 39 Kassel, Amalia 218 Kaufkraft 212-214 Kaufkraft, einzelhandelsrelevante 213 Kaufkraft, sortimentsbezogene
493
Register 213-214 Kaufkraftkennziffer 212-214 Keenan, M . 136 Kennzahl, betriebliche 260 Keyword in Context s. KWIC Klassen-Meurer, Jutta 209 Klassifikation 59,62-76, 110 Klassifikationssystem 62-63, 164-165, 176, 178-180, 195, 233-235, 277-278, 283-284 329-332, 374-376, 423-426 Klems, Michael 226, 383-384
Knight-Ridder Information 395 Knowledge Management XV, 41, 389 Köln, FH 14 Körperschaftsname 153-154,429 Kombinationsbegriff 79-80 Kommunikation 28,30,43-50 Kommunikationspolitik 240, 292
Kompass 248 Kompositazerlegung 171 Kondratieff, Nikolai D. 1-4 Kondratieff-Welle 1-4 Konjunktur 3-4 Konjunkturtest 368-370 Konkurrenzbeobachtung 314, 349-354 Konkurs 2 5 6 Kontaktanbahnung via W W W 292-293 Konvergenz der Informationsbranchen 15 Konzernstrukturdatenbank 270 Konzernverflechtung 270-271 Kooperationsbörse 283-285 Krahl, Daniela 52-53 Kreditwürdigkeit 261 -268 Krichel, Thomas 203 Kroy, Walter 336 Kating, Karlheinz 2 5 7 , 2 9 0
Kuhlen, Rainer 32-33 KWIC 200
L Ladewig, Christa 59 Landkarte 448 Ländercode 234, 277,425-426 Lancaster, F. Wilfrid 59 Lange Welle 1-4 Lawrence, S. 442 Leistung, wissenschaftliche 363 Lemmatisierung 169-170 Lepsky, Klaus 79, 169 Lexis-Nexis XXVIII, 100,102, 110, 154, 156, 197, 200, 202-203, 228, 250, 253, 257, 260, 267, 271, 274, 294, 297, 299-306, 318, 321, 325, 327, 332-333, 338, 360, 395, 407417 Library of Congress 66,67-68 Liebig, Martina 168
Lifewire (Profound) 405 Lindlbauer, Jürg-Dieter 368-370
Link (Springer- Verlag) 185 Link, bezahlter 292 Link-"Popularität" 164 Linksammlung 182-184, 203-205 Linksammlung, thematische 183-184 Lipka, Alois 280, 282 Literatur, zitierende 436 Literatur, zitierte 436 Lizenz 37 Lizenzrecherche 313 Lokalisieren von Web-Sites 441 Lokys, Andreas 307 Loseblattsammlung 294 Lotka, Alfred J. 135-136 Lotus-Notes 388-390 Lu, Xin A. 153-154,412 Ludwig, Jan 328
494
M M.A.I.D. 395 Main Economic Indicators 374-377 Maller, Steve 399 Malsch, Thomas 9 Management 251 Managementinformationssystem s. MIS Managementlehre 29-30 Mantwill, Gerhard J. 33-34 Mapping 112-113 Marke 307-308, 329-333 Markenrecherche 329-333 Marketing 2 4 0 , 2 5 1 , 2 9 2 Marktbericht 37, 216-222 Marktforschung 207-223, 406-407 Marktforschungsinstitut 215-216 Markus (CD-ROM) 248 Masters Theses 343 McGill, Michael J. 121, 149 McGrcm-Hill 303, 377 Media Control 210-211 Medienpräsenz 240-244 Medienpräsenzanalyse 240-244 Medienresonanz 243-244 Meffert, Heribert 207 Mehrwortausdruck 153-155, 171 Mensch, Gerhard 4 Mergers & Acquisitions 272-274 Mergerstat M&A Database 272-274 Meta-Tag 175 MetaCrawler 176 Metadaten 51-52 Metamorphose-Modell 4 Metasuchmaschine 176, 180-181 Milde, Sabine 316-317 Miller, David J. 153-154 M1LOS 169 MIS 51-52 Modell, ökonometrisches 377 Mohrens, Stephan W. 257 Monier, Louis M. 312,440-441
Register Monohierarchie 61 Moore, Nick 3 More (Lexis-Nexis) 414-415 Münch, Vera 380 Multimedia-Marketing 292 Munzinger Archiv 359-360, 365 Musterdokument 167,414
N N-Gramm 150 NACE 70-71,86-87, 194 NACE-STW-Konkordanz 86-87, 194 Nachricht (als Aspekt von „Information") 39-43 Nachrichten 224-245 Nachrichtenagentur 49, 224-227 Nachweisinformation 22 Nadel-im-Heuhaufen-Syndrom 46, 90, 119 Namensansetzung 429 Nefiodow, Leo A. 2-4 Nelson, Phillip 38 NetEc 203-205 Netz, semantisches 141-143 Neuigkeitsrecherche 312-313,381 News-Bre@k (GENIOS) 386-388, 393 Newsletter 233-237 Newsletter Database 237 Newsline (Profound) 398 Nicht-Deskriptor 77, 156, 165,400 Nicht-Deskriptorsatz 86 Nicht-Operator 104,106 Nizza-Klassifikation 329-330 Nomenclature des unités territoriales statistiques s. NUTS Nomenclature général des activités économiques s. N A C E Nomos Verlag 294 Norpoth, Susanne 209, 214 Norton Sterling Associates 214 Notation 63-64,67-69
Register Notation, hierarchische 63 Notation, sequentielle 63 Notationsvergabe, automatische 164-165 Nüßlein, Desirée 209,214 Null-Treffer-Recherche 122-123 NUTS 277-278
o O'Connor, B. 59 Oberbegriff 61 Oder-Operator 104-105, 148 OECD 374-377 Öffentlichkeitsarbeit 243-244, 292 Ökonometrie 113-114, 377-378 Offenlegungsschrift 308 Offl ine-1 nformationsanbieter 22-23 Okapi 157-159 Online-Archiv 23,47-49, 227 Online-Datenbank 47,49 Online GmbH 283 Online-Informationsanbieter 22-23,47-49 Online-Sekundärmarktforschung 207 OPAC 23 Operator, hierarchischer 110 Operator, mengentheoretischer 104-107, 147-148, 401,408, 410-411,432,445-446 Operator, ökonometrischer 113-114 Ordnung 42,59 Ordnungstheorie 164-166 Organisation 11,13 Osowski, Wilfried 177-178 Otto, Michael 178, 181 Outsourcing von Informationswirtschaft 24-25, 383-384 Oxley, Harriet 341
495
P Palme, Klaus 336 Paragraph (Gesetz) 301 Partnerschaftsregister 255 Partnersuche 283 PATDPA 327, 334 Patent 46, 73, 308-309, 311-312, 337-338,351-352 Patentbeschwerdekammer 325-327 Patentdatenbank 314-329, 350-356 Patenterteilung 381 Patentfamilie 309, 314, 317 Patentklassifikation 73-76 Patentrecherche 310-329 Patentrolle 308,316, 328 Patentstatistik 350-356 Patentschutz 308 Paton 328-329 PATOSDE 316, 327-328, 334 PCT-Anmeldung 309 PDF-Format 115 Permutation (RSWK) 346-347 Personeninformation 250-251, 358-365, 447-448 Personenname 154,429 Petras, Vivien 442 Pflichtexemplarrecht 345 Phonetik 157 Phrase 153-155,411-412 Phrasenerkennung 153-155,411-412, 443 Phraseninvertierung 101 Picot, Arnold 38 PIERS 214 Plural (Suchfunktion) 100 Pluralbildung, automatische 100 Poetzsch, Eleonore 94-95 Polyhierarchie 61 Portal (zum W W W ) 440-449 Porter, Michael E. 32-33 Portfolio 118,403-404 Potempa, Thomas 176-178
Register
496 Präjudiz 297 Präkombination 63 Präsenzreport 241-243 Precision 121-123, 147 Predicasts Country Code 234,
Qualität 38-39 Qualitätssicherung 429-431
425-426 Predicasts Event Code 234-235
R
Predicasts Inc. 233 Predicasts Product Code 72-73, 233 Preis 36, 97,405-406,439-440 Presseagentur 224-227 Pressearbeit 244 Pressearchiv 237-238 Pressedokumentation 237-238 Pressemitteilung 224, 292 Pressespiegel 117, 391
Primary Source Media 233 Primärforschung (Marktforschung) 207 Printmedien 45-46 Probst, Gilbert XVI Produkt-Code 72-73, 234 Produktinformation 233-237, 268-269 Produktinnovation 349-350 Produktivitätsparadoxon der Informationstechnik 13 Profildienst 117-118, 386-391 ProfoundXXVIII, 118, 156, 222, 253,274,395-407,417 Projektinformation 286 PROMT 235-237 Pronomen 157 Prozeßinnovation 349-350 Publikation, wissenschaftliche 135-136,363 Publikationsrate 363 Publizitätspflicht von Unternehmen 253-254, 290 Pull-Ansatz 53-54, 391 Push-Ansatz 53-54, 391
Q Questel-Orbit 113, 140, 350
Rahlenbeck, Eckhard 224,247,274, 276, 286, 307 RAK 427-429 Rangordnung 137-139, 210, 351, 364 Rautenstrauch, Claus 51 Ray, Deborah S. 443-444 Ray, Eric J. 443-444 RealNames 292-293, 361, 365,443, 446-447
RealNames Corp. 292, 440 Realtime-Finanzinformation 23,49 Realtime-Information 49 Realtime-N achrichten 23,49 Recall 121-123, 147 Recherche, retrospektive 117, 381-386 Recht, amerikanisches 300-302 Recht, deutsches 294-297 Recht, europäisches 297-299 Rechtsinformation 294-306 Rechtsprechungsdatenbank 295-296 Rechtsstand (eines Patentes) 316-317, 328 Rechtsstanddatenbank 316
Reed Elsevier 300 Referateblatt 47 Regelkreismodell 4 Regeln für den Schlagwortkatalog 5. RSWK Regeln für die alphabetische Katalogisierung s. RAK Relation 60-62,78 Relevance Ranking 163-164, 177, 409-411,434,443-446 Relevanz 119-123, 163-164
497
Register Reportausgabe 115 Research Bank Web 218 Researchline (Profound) 397-399 Resonanzkontrolle 240 Retrieval s. Information Retrieval Reuters XXVIII, 224-227, 274, 389, 391,407 Revolution, telematische 6 Rheinisch-Westfälisches Institut für Wirtschaftsforschung 419 Risikobewertung 262 Robot 177 Roth, Kristiina 24 Rousseau, Ronald 131-132 RSWK 345-347
s Saarinen, Lauri 183 Sabien, Heiko 322 Sachgebietsklassifikation 423-425 Sachse, Elisabeth 168 Sänger, Thomas 194 Salton, Gerald 121, 149, 166 Saul, Christoph 7-9,12 Scannen 390 Schäfer, Sabine 203-205 Schawe Verlag 280 schedule (DDC) s. Haupttafel (DDC) Scheuble, Sven 38 Schlagwort (RSWK) 346-347 Schlagwortvergabe, automatische 165-166, 301 Schlittgen, Rainer 367 Schmidt, Maria-Elisabeth 177-178 Schmidt, Ralph 382-383, 385-386 Schmoch, Georg 356 Schnittmenge 104-105 Schramm, Reinhard 328 Schütte, Silke 43-44,53-54 Schuhböck, Hans P. 261-263 Schumpeter, Joseph A. 2 , 4 Schutzrecht 37
Schutzrecht, gewerbliches 307-334 Schutzrecht, nichttechnisches 307-308 Schutzrecht, technisches 308-309 Schweitzer Sortiment 185 Schwuchow, Werner 20 Science Citation Index 136-137, 339343,350 Scientific Consulting Scooter 440-442
93
SDI 117-118, 386-391, 402-403, 405 Search Engine Watch 440 SEC 254, 291 SEC 8-K 291 SEC 10-K291 SEC 10-Q291 SEC 20-F 291 Sekundärforschung (Marktforschung) 207-208 Selective Dissemination of Information s. SDI Seltzer, Richard 443-444 Sender 41-44 Shannon, Claude 40 Shapiro, Jacob 120, 152 Shepard's Citations Service 303-305 Shepardizing 303-305 Shopping.com 440 SIC 72, 194, 229, 232, 234 Signal 39-43 Signalübertragung 42 Simple Search (AltaVista) 443-445 Singular (Suchfunktion) 100 Sinz, Elmar J. XXIX, 29 Site-Zugriff 164 Situation, kritische 32, 381, 391 SMART 166 Smit, Sabine 419 Social Sciences Citation Index 339-340 Sondersammelgebiet Betriebswirtschaft, Univ. Köln 194
498
Register
Sortierung 115 Soundex-Verfahren 157-159 Spam 442 Sparck Jones, Karen 162 Spider 177 Spiegel- Archiv 237-238 Sponsoring 244 Sprache, deutsche 168-171 Sprache, englische 148 Springer-Verlag 185 Staatsbibliothek zu Berlin 296 Standard & Poor 's 377 Standard & Poor's DR! s. DR1 Standard Industrial Classification s. SIC
Suchmaschine 23,50, 176-178, 440-449 Suchphrase 107-108 Suchprofil 117-118 Suchschrittanzeige 114 Suffix 151-152 Sullivan, Danny 440 Switchboard 361,440,447-448 Synomyn 77, 156 Synonymwörterbuch 102,408-40 Systematik der Wirtschaftszweige 70-71
Standard Thesaurus Wirtschaft s. STW Standardprofil 386-388 Statistisches Amt 70 Statistisches Bundesamt 367-368 Staud, Josef L. 113 Steinhaus, Ingo 180 STN-International XXVIII, 197, 317-318, 327,350 Stock, Mechtild 84,422 Stoppwort 149, 151, 154,411,433 Stoppwortelimination 151,411, 433 Straßburger Abkommen 73 Streitberg, Bernd H. 367 Striefler, Hubert-Günter 88,418 Strohmeier, Franz 55 Strukturierung von Informationen 142 STW 84-88, 189, 194, 421 STW-NACE-Konkordanz 86-87, 194 Subito 116
T
Subreport 276, 280-282 Suche s. Information Retrieval Suchergebnisanzeige 114-115 Suchfrageformulierung 126-127, 142-143 Suchgut 38-39 Suchhilfe 431-432
Systran 440, 448-449 Szientometrie 439
Tabellendatenbank 208-212 Tabellenwerk 427 table (DDC) s. Hilfstafel (DDC) Tageszeitung 227-233 Technikinformation 309-310, 335-357 Technologieführerschaft 145 Technologietrend 353-355 Teilbegriff 61 Teilmenge, thematische 84 Telearbeit 9-11 Telefon 20 Telekommunikation 7 Telekommunikationsnetz 3,23 Telematik 5-7 Telnet 47 Tempo-Prinzip 4-5 Tenders Electronic Daily 276-280 Terminologie 80 Terminologische Kontrolle 77-78 Text Retrieval Conference (TREC) 168 Textinformation 22 Textklumpen 154-155,411 Textwortmethode 422 Thesaurus 59,76-88, 110, 156,
Register
499 Unternehmensberatung 384
1 6 4 - 1 6 5 , 3 9 9 - 4 0 0 , 421 Thesaurus Wirtschaft s. S T W
Untemehmensbeteiligung 272
Thesaurus, statistischer 1 6 6 , 4 1 5 - 4 1 6
Unternehmensgröße 380
Thesaurusaufbau 80-81
Unternehmensgrunddaten 247-257
Thesaurusfortschreibung 81
Unternehmensinformation 21, 294, 379-380
Thomä, Elke 314-315 Thompson, N.J. 333
Unternehmensinformation, betriebs-
Thomsen, Horst 8 8 , 4 1 8
wirtschaftliche 246-275
Thomson Business Information 233 Thomson Corp. 217, 233, 317, 339 Thomson Financial Sécurités
Unternehmenskurzdossier 2 4 7 - 2 5 4
Services 216-217 Thomson Financial Services 217 Thomson Science and Technology
Unternehmensstatus 254
Unternehmenskauf 272 Unternehmensnachfolgebörse 285-286 Untemehmensverflechtung 2 6 9 - 2 7 4 U R L 441-442
233,317 Tickerdienst 49
Urteil 294-306
Tickerdienst, individueller 1 1 8 , 4 0 5
Urteilszitation 303-305
Titelwerk 125
USA 300
Toyotismus 8-9
USPTO 333
Trade c£ Industry Database
236-237
Transaktionssystem 49, 2 7 4 Tribiahn, Rudolf314-317
Trierischer Volksfreund 221 Truncation s. Fragmentierung
V VDI Nachrichten 386 Vektor 166 Verband der Informationswirtschaft 14-15
u
Vereinigungsmenge 104-105
U-Schrift 308
Verlag 4 6
Übersetzung, automatische 4 4 8 - 4 4 9
Verletzungsrecherche 313
UMI197
Verlustrate 121
UnCover 116
Verstehen 41-42
Und-Operator 104-105, 147
Verteilungsgesetz, informe-
Universalklassifikation 64
trisches 130-131
Unsicherheit 31-32
Vertrauensgut 38-39
Unsicherheit, kreative 31
Verursacherprinzip 419
Unterbegriff 61,79
Verwaltungsvorschrift 2 9 4
Unternehmen (in der Infor-
Videosequenz 389
mationsgesellschaft) 7-13 Unternehmen, börsennotiertes 254, 290-291
Videotex 47-48 Viesels, Ulrike 98 Voiskunskii, Vladimir G. 120, 152
Unternehmen, „gläsernes" 379-380
Volkswirtschaft 188-193
Unternehmen, globales 8
Vollständigkeitsrate 121
Unternehmen, virtuelles 9-11
Volltextbeschaffung 116, 190
500
Register
Volltextdatenbank 47, 90-91, 100, 197, 199-203,216-222, 224-225, 322, 325,408 vom Kolke, Ernst-Gerd 46, 98 vwd 226
Wiley, Deborah Lynne 341 Windheuser, Ulrich 52-53 Windows-Client 20 Winterfeld, Volker 307 WIPO 3 2 9 , 3 3 1 , 3 3 4
W
Wirkung, wissenschaftliche 363 Wirtschaftsarchiv 237-240 Wirtschaftsdokumentation 59 Wirtschaftsförderung 286-288 Wirtschaftsgut 36-39 Wirtschaftsgut, immaterielles 38 Wirtschaftsinformatik XV, 27-29 Wirtschaftsinformation XXVI Wirtschaftsinformation, regionale 227 Wirtschaftsklassifikation 70-73 Wirtschaftskonjunktur 368-370 Wirtschaftsnachricht 224-245 Wirtschaftspolitik 4 Wirtschaftsprognose 377 Wirtschaftsrecht 294 Wirtschaftssektor 5 Wirtschaftsstatistik 70-71 Wirtschaftsthesaurus 84-88 Wirtschaftswissenschaft 187-206 Wirtschaftszeitung 232-233 WISOI (CD-ROM) 195-196 WISO II (CD-ROM) 88, 189, 418 Wissen XV-XVI, 5,40-42 Wissen, Definition 41 Wissen, handlungsrelevantes
Wireline (Profound) 398 Wagner, Daniel 395-396,404 Wagner-Döbler, Roland 297 Walker, Stephan 157-158 Wandel, terminologischer 423 Ware 36-38 Warenklassifikation 329-330 Warenzeichen s. Marke Wassum, John R. 153-154 Weaver, W. 40 Web of Science 340-341, 432-440 WebEc 183-184,205 Weber, Claus-Peter 257 Webster, Merriam 156 W D F 161-162,412 Weltstandsvergleich 350-352 Weltwirtschaft 7 Wenzel, Alfred 328 Wer liefert was? 268-269 Werbung 274 Wersig, Gernot 76 Wertschöpfungskette der Informationswirtschaft 20-25
Westlaw 299, 407 Wettbewerb 32-33 Wettbewerber 246 Wettbewerbsvorteil durch Informationen 12,33-34
. where (Lexis-Nexis) 412-413 Who 's Who In European Business and Industry 360-361, 365
. why (Lexis-Nexis) 412-413 Wichmann, Thorsten 205 Wien, Wirtschaftsuniversität 14 Wiener Klassifikation 330-332 Wila Verlag 327-328, 333
40-41,119 Wissen, wissenschaftliches 5 Wissenschaftsevaluation 363 Wissenschaftsforschung 439 Wissenschaftsinformation 335-357 Wissenschaftspolitik 4 Wissensgesellschaft 4-6 Wissenslücke 32,119, 381-382 Wittmann, Alfred 310-311,318, 329 Wörterbuch 101-102 Wolff, Christiane 174
Register
501
Working Paper-Reihe, elektronische 185
World Intellectual Property Organizations. WIPO World Patents Index 314,317-318, 334, 337 World Wide Web 20,23,30,48,50, 174-186, 203-205, 227, 291 -293 333,361,440-449 WorldSearch (Profound) 401-402 Wort 150, 159 Wortabstand 163 Wortgewichtung, dokumentspezifische 161-162, 177 Wortgewichtung, inverse 162-163 Worthäufigkeit 160-161 Wortinvertierung 101 Wortschatz 76 Wortstammanalyse 151 -152, 412 Wortverteilung 132
Zentralbibliothek für Wirtschaftswissenschaften 193
84, 117, 188-191,
Zentralhandelsregister 254-257 Zick, Friedrich-Karl 52-53 Zielgruppe (Marketing) 212-213 Zimmermann, Christian 204-205 Zimmermann, Harald H. 169 Zip2 4 4 0 , 4 4 8 Zipf, George K. 132 Zitation 136-137, 143-145, 167-168, 297, 303-305, 317, 338-343, 363, 435 Zitationsart (bei Urteilen) 303-304 Zitationsdatenbank 145, 168, 303-305, 317 339-343, 432-440 Zitationsindex 136-137,297, SOSSOS, 339-343 Zitationsrate 363 Zitationssuche 436-437
X (Anm.: Nicht aufgenommen sind die Namen aus der Bibliographie und die Adressen.)
X.25 4 7
Y
Yahoo! 176 Yahoo! Deutschland
178-180
z Zahlungsgewohnheit von Unternehmen 261-268 Zeitreihe 113-114, 366-378 Zeitreihe, informetrische 139-140, 354 Zeitreihenanalyse 377-378 Zeitschrift, elektronische 184-185 Zeitschrift, wissenschaftliche 45-46,133, 184-185,203 Zeitschriftendatenbank 116 Zeitung 46,227-233 Zeitungsartikel 228