288 57 3MB
German Pages 190
Wolfgang Riggert ECM – Enterprise Content Management
Wolfgang Riggert
ECM – Enterprise Content Management Konzepte und Techniken rund um Dokumente Mit 39 Abbildungen und 17 Tabellen STUDIUM
Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über abrufbar.
Das in diesem Werk enthaltene Programm-Material ist mit keiner Verpflichtung oder Garantie irgendeiner Art verbunden. Der Autor übernimmt infolgedessen keine Verantwortung und wird keine daraus folgende oder sonstige Haftung übernehmen, die auf irgendeine Art aus der Benutzung dieses Programm-Materials oder Teilen davon entsteht. Höchste inhaltliche und technische Qualität unserer Produkte ist unser Ziel. Bei der Produktion und Auslieferung unserer Bücher wollen wir die Umwelt schonen: Dieses Buch ist auf säurefreiem und chlorfrei gebleichtem Papier gedruckt. Die Einschweißfolie besteht aus Polyäthylen und damit aus organischen Grundstoffen, die weder bei der Herstellung noch bei der Verbrennung Schadstoffe freisetzen.
1. Auflage 2009 Alle Rechte vorbehalten © Vieweg+Teubner | GWV Fachverlage GmbH, Wiesbaden 2009 Lektorat: Sybille Thelen | Walburga Himmel Vieweg+Teubner ist Teil der Fachverlagsgruppe Springer Science+Business Media. www.viewegteubner.de Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlags unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Umschlaggestaltung: KünkelLopka Medienentwicklung, Heidelberg Druck und buchbinderische Verarbeitung: Krips b.v., Meppel Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier. Printed in Germany ISBN 978-3-8348-0841-7
Vorwort EnterpriseȱContentȱManagementȱistȱeineȱrelativȱneueȱWortschöpfungȱimȱITȬUmfeld.ȱ DiesesȱBuchȱversuchtȱinȱFormȱeinerȱMomentaufnahme,ȱdieȱmitȱdiesemȱBegriffȱverȬ bundenenȱ Technikenȱ vorzustellenȱ undȱ ihreȱ wesentlichenȱ Merkmaleȱ undȱ EigenȬ schaftenȱzuȱanalysieren.ȱMomentaufnahmeȱdeshalb,ȱweilȱvieleȱAnalystenȱEnterpriȬ seȱContentȱManagementȱnurȱalsȱZwischenstufeȱzuȱweiterenȱIntegrationsbemühunȬ genȱansehenȱundȱdemȱBegriffȱselbstȱnurȱeineȱkurzeȱLebensdauerȱvoraussagen.ȱȱ ȱ WieȱstetsȱwennȱesȱsichȱumȱaktuelleȱThemenȱhandelt,ȱdieȱeineȱgroßeȱDynamikȱaufȬ weisen,ȱ kannȱ dasȱ Buchȱ nichtȱ allenȱ Anforderungenȱ gerechtȱ werden.ȱ Einigeȱ Leserȱ mögenȱ dieȱ Ausführungenȱ zuȱ Informationȱ Retrievalȱ alsȱ zuȱ umfangreichȱ undȱ techȬ nischȱ ansehen,ȱ andereȱ vermissenȱ möglicherweiseȱ eineȱ ausführlichereȱ Darstellungȱ derȱ Textklassifikation.ȱ Wiederȱ anderenȱ erscheintȱ dasȱ Themaȱ Workflowȱ undȱ GroupwareȱüberholtȱundȱderȱWunschȱnachȱneuenȱStandardsȱwieȱPDF/AȱoderȱReȬ cordsȱManagementȱdringlich.ȱBeiȱallerȱKritikȱbleibtȱesȱjedochȱunmöglich,ȱallenȱAsȬ pektenȱinȱentsprechenderȱAusführlichkeitȱRechnungȱzuȱtragen.ȱDerȱgeneigteȱLeserȱ mögeȱ alsoȱ entschuldigen,ȱ wennȱ erȱ nurȱ teilweiseȱ zufriedenȱ stellendȱ bedientȱ wird.ȱ DennochȱbinȱichȱfürȱalleȱAnregungenȱundȱVerbesserungsvorschlägeȱdankbar.ȱUmȬ fassendeȱ ergänzendeȱ Materialienȱ zuȱ denȱ Inhaltenȱ desȱ Buchesȱ findenȱ Sieȱ aufȱ derȱ begleitendenȱWebsiteȱunter:ȱhttp://www.wi.fhȬflensburg.de/riggert/dmsȱ ȱ ȱ ȱ Augustȱȱ2009ȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱDr.ȱWolfgangȱRiggertȱ [email protected]Ȭflensburg.deȱ ȱ
ȱ
Vȱ
Inhaltsverzeichnis ȱ
Vorwortȱ...............................................................................................................................ȱV 1ȱȱEinführungȱ......................................................................................................................ȱ1 1.1ȱȱContentȱundȱContentȬManagementȱ.......................................................................ȱ1ȱ 1.2ȱȱWebȬContentȬManagement.....................................................................................ȱ3ȱ 1.3ȱȱEnterpriseȱContentȬManagementȱ...........................................................................ȱ4ȱ 1.4ȱȱTrendȱ..........................................................................................................................ȱ9ȱ 2ȱȱECMȱCaptureȬKomponenteȱ........................................................................................ȱ11 2.1ȱȱAutomatischeȱDokumentenerfassungȱ.................................................................ȱ12ȱ 2.1.1ȱ
Texterkennungȱ........................................................................................ȱ15ȱ
2.1.2ȱ
Textklassifikationȱ....................................................................................ȱ15ȱ
2.1.3ȱ
Textextraktionȱ..........................................................................................ȱ16ȱ
2.1.4ȱ
TextȬMiningȱ.............................................................................................ȱ22ȱ
2.1.5ȱ
Trendȱ.........................................................................................................ȱ24ȱ
2.2ȱȱEDIȱ(ElectronicȱDataȱInterchange)ȱ.......................................................................ȱ24ȱ 2.2.1ȱ
EDIȬBenutzergruppenȱundȱȬorganisationenȱ.......................................ȱ26ȱ
2.2.2ȱ
EDIȬNutzenȱ..............................................................................................ȱ28ȱ
2.2.3ȱ
EDIȬBeispielȱ.............................................................................................ȱ29ȱ
2.2.4ȱ
EDIȬSyntaxȱ...............................................................................................ȱ31ȱ
2.2.5ȱ
ProblemeȱderȱEDIȬImplementierungȱ....................................................ȱ40ȱ
2.2.6ȱ
EDIȬErweiterungenȱ.................................................................................ȱ40ȱ
2.3ȱȱXMLȱ(ExtensibleȱMarkupȱLanguage)ȱ..................................................................ȱ43ȱ 2.3.1ȱ
XMLȬDokumentenȬErstellungȱ...............................................................ȱ45ȱ
2.3.2ȱ
GrenzenȱvonȱXMLȱ...................................................................................ȱ47ȱ
2.3.3ȱ
EDIȱundȱXMLȱ..........................................................................................ȱ48ȱ
ȱ
VII
Inhaltsverzeichnisȱ 2.4ȱȱKontrollfragenȱ........................................................................................................ȱ49ȱ 3ȱȱECMȱManageȬKomponenteȱ.......................................................................................ȱ51 3.1ȱȱDokumentenmanagementȱ....................................................................................ȱ51ȱ 3.1.1ȱ
Dokumentȱ................................................................................................ȱ52ȱ
3.1.2ȱ
Dokumentenmanagementsystemeȱ......................................................ȱ54ȱ
3.1.3ȱ
Papierȱ.......................................................................................................ȱ57ȱ
3.1.4ȱ
Informationsartenȱ...................................................................................ȱ59ȱ
3.1.5ȱ
InformationsartenȱundȱbetrieblicherȱAblaufȱ......................................ȱ64ȱ
3.1.6ȱ
Trendȱ........................................................................................................ȱ65ȱ
3.2ȱȱWorkflowmanagementȱ.........................................................................................ȱ65ȱ 3.2.1ȱ
Workflowȱ.................................................................................................ȱ66ȱ
3.2.2ȱ
WorkflowmanagementȬSystemeȱ..........................................................ȱ72ȱ
3.2.3ȱ
Workflowkategorienȱ..............................................................................ȱ79ȱ
3.3ȱȱCollaborationȱ..........................................................................................................ȱ81ȱ 3.3.1ȱ
Groupwareȱ..............................................................................................ȱ81ȱ
3.3.2ȱ
Groupwaresystemeȱ................................................................................ȱ81ȱ
3.3.3ȱ
Kooperationssituationenȱ.......................................................................ȱ83ȱ
3.3.4ȱ
Workflowȱ–ȱCollaborationȱ....................................................................ȱ87ȱ
3.3.5ȱ
Trendȱ........................................................................................................ȱ89ȱ
3.4ȱȱInformationȱRetrievalȱ............................................................................................ȱ90ȱ 3.4.1ȱ
Gütemaßeȱ................................................................................................ȱ93ȱ
3.4.2ȱ
DeskriptorenȱundȱIndexierungȱ.............................................................ȱ95ȱ
3.4.3ȱ
Deskriptorerzeugungȱ.............................................................................ȱ98ȱ
3.4.4ȱ
Rechercheinstrumenteȱ.........................................................................ȱ103ȱ
3.4.5ȱ
FortschrittlicheȱIndexierungstechnikenȱ............................................ȱ107ȱ
3.4.6ȱ
InformationȱRetrievalȱundȱInternetȱ...................................................ȱ110ȱ
3.4.7ȱ
TopicȱMapsȱ............................................................................................ȱ111ȱ
3.5ȱȱTextȱMiningȱ..........................................................................................................ȱ112ȱ 3.5.1ȱ
Grundlagenȱ...........................................................................................ȱ113ȱ
3.5.2ȱ
Technikenȱ..............................................................................................ȱ116ȱ
VIII ȱ
Inhaltsverzeichnisȱ 3.6ȱȱKontrollfragenȱ......................................................................................................ȱ116ȱ 4ȱȱECMȱDeliverȬKomponenteȱ.......................................................................................ȱ119 4.1ȱȱSicherheitȱ...............................................................................................................ȱ122ȱ 4.1.1ȱ
SignaturenȱzurȱBeweissicherungȱ........................................................ȱ122ȱ
4.1.2ȱ
Kryptographieȱ.......................................................................................ȱ124ȱ
4.1.3ȱ
SymmetrischeȱVerfahrenȱ......................................................................ȱ125ȱ
4.1.4ȱ
AsymmetrischeȱVerfahrenȱ...................................................................ȱ127ȱ
4.1.5ȱ
HybrideȱVerschlüsselungsverfahrenȱ..................................................ȱ128ȱ
4.1.6ȱ
Hashfunktionenȱ.....................................................................................ȱ129ȱ
4.1.7ȱ
DigitaleȱSignaturȱ...................................................................................ȱ130ȱ
4.1.8ȱ
Authentifizierungȱ.................................................................................ȱ133ȱ
4.1.9ȱ
Zertifikateȱ...............................................................................................ȱ133ȱ
4.1.10ȱ
PublicȱKeyȱInfrastrukturȱ......................................................................ȱ136ȱ
Kontrollfragenȱ.............................................................................................................ȱ138ȱ 5ȱȱECMȱPreserveȬKomponenteȱ.....................................................................................ȱ139 5.1ȱȱComplianceȱ...........................................................................................................ȱ139ȱ 5.2ȱȱArchivierungȱ.........................................................................................................ȱ140ȱ 5.2.1ȱ
ȱRevisionssichereȱArchivierungȱ..........................................................ȱ147ȱ
5.2.2ȱ
Archivierungskomponentenȱ...............................................................ȱ150ȱ
5.2.3ȱ
MailȬArchivierungȱ................................................................................ȱ151ȱ
5.2.4ȱ
RechtlicheȱAspekteȱelektronischerȱArchivierungȱ.............................ȱ153ȱ
5.3ȱȱTrendȱ......................................................................................................................ȱ155ȱ 5.4ȱȱKontrollfragenȱ......................................................................................................ȱ158ȱ 6ȱȱECMȱStoreȬKomponenteȱ...........................................................................................ȱ159 6.1ȱȱRepositoriesȱ...........................................................................................................ȱ159ȱ 6.1.1ȱ
DataȱWarehouseȱ....................................................................................ȱ159ȱ
6.1.2ȱ
Filesystemeȱ.............................................................................................ȱ160ȱ
6.2ȱȱLibraryȱServiceȱ......................................................................................................ȱ161ȱ 6.3ȱȱSpeichermedienȬTechnologienȱ...........................................................................ȱ161ȱ 6.4ȱȱSpeichermedienȬHaltbarkeitȱ...............................................................................ȱ166ȱ
ȱ
IXȱ
Inhaltsverzeichnisȱ 6.5ȱȱInformationȱLifecycleȱManagementȱ..................................................................ȱ167ȱ 6.6ȱȱStorageȱAreaȱNetworksȱ.......................................................................................ȱ169ȱ 6.6.1ȱ
NASȬTechnologieȱ.................................................................................ȱ170ȱ
6.6.2ȱ
SANȬTechnologieȱ.................................................................................ȱ172ȱ
6.7ȱȱTrendȱ.....................................................................................................................ȱ175ȱ 6.8ȱȱKontrollfragenȱ......................................................................................................ȱ175ȱ 7ȱȱDieȱZukunftȱvonȱECMȱ..............................................................................................ȱ177 8ȱȱLiteraturȱ.......................................................................................................................ȱ179 Sachwortverzeichnisȱ.....................................................................................................ȱ183 ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ
X
ȱ
1 Einführung DieȱKernfrageȱdieserȱrelativȱneuenȱTechnologienȱist:ȱWasȱistȱeigentlichȱunterȱConȬ tentȱzuȱverstehen?ȱȱ Dieȱ Antwortȱ istȱ nichtȱ immerȱ befriedigendȱ undȱ nichtȱ immerȱ präzise.ȱ Mitȱ Contentȱ wirdȱoftȱderȱInhaltȱbezeichnet,ȱderȱsichȱdemȱBetrachterȱaufȱeinemȱInformationsträȬ gerȱoptischȱrepräsentiert.ȱHierȱgehtȱesȱumȱdigitaleȱBücher,ȱdigitaleȱVideos,ȱdigitaleȱ Musik,ȱ dieȱ verwaltet,ȱ abgerechnet,ȱ geschütztȱ undȱ verteiltȱ werdenȱ sollen.ȱ Damitȱ umfasstȱ derȱ Begriffȱ imȱ Wesentlichenȱ dieȱ Summeȱ derȱ Einzelinformationenȱ mitȱ Strukturȱ undȱ Darstellungsform.ȱ Dieseȱ elementareȱ Einteilungȱ findetȱ auchȱ Eingangȱ inȱdieȱVerwaltungȱdesȱeigentlichenȱContents,ȱseinesȱZugriffsȱundȱseinerȱAktualisieȬ rungȱundȱVerteilung.ȱDieȱAuffassungȱvonȱContentȱistȱstarkȱmitȱdemȱInternetȱverȬ bunden,ȱeinerȱEinschränkung,ȱdieȱoftmalsȱalsȱzuȱrestriktivȱangesehenȱwirdȱ[BerchȬ tenbreiter,ȱ S.212],ȱ soȱ dassȱ derȱ Begriffȱ eherȱ alsȱ vonȱ Personenȱ erzeugteȱ undȱ inȱ meȬ dienspezifischerȱ Formȱ präsentierteȱ digitaleȱ Informationȱ aufgefasstȱ wird.ȱ Darüberȱ hinausȱ kommtȱ mitȱ derȱ wachsendenȱ Bedeutungȱ desȱ Worldȱ Wideȱ Webȱ derȱ SicherȬ stellungȱ derȱ Aktualität,ȱ derȱ Auffindbarkeitȱ undȱ derȱ mehrfachenȱ Verwendbarkeitȱ jeglicherȱArtȱvonȱContentȱeineȱwachsendeȱBedeutungȱzu.ȱȱ DieȱFunktionalitätȱlässtȱesȱsinnvollȱerscheinen,ȱzwischenȱderȱgenerellenȱKategorieȱ CMSȱ ContentȬManagementȬSystemeȱ sowieȱ zweiȱ speziellenȱ Ausprägungen,ȱ denȱ WCMSȱ WebȬContentȬManagementȬSystemenȱ undȱ denȱ ECMȱ EnterpriseȬContentȬ ManagementȬSystemenȱzuȱunterscheiden.ȱȱ
1.1 Content und Content-Management Unternehmenȱ sehenȱ sichȱeinemȱ Bergȱ vonȱ Contentȱ inȱ Formȱstrukturierterȱ undȱ unȬ strukturierterȱ Inhalteȱ gegenüber.ȱ Sieȱsindȱ kaumȱ inȱderȱ Lage,ȱdiesenȱ Bergȱ sinnvollȱ zuȱklassifizierenȱundȱkönnenȱdemzufolgeȱnichtȱeinschätzen,ȱobȱerȱwertvolleȱInforȬ mationenȱenthältȱoderȱnurȱihreȱDatenablageȱverstopft.ȱZudemȱwissenȱsieȱoftȱnicht,ȱ werȱ Zugangȱzuȱ Anwendungenȱ hatȱundȱ werȱ darüberȱ Kontrolleȱausübt.ȱ InformatiȬ onsobjekteȱ könnenȱ inȱ vielenȱ Dokumentenȱ enthaltenȱ sein,ȱ dieȱ Auswirkungenȱ vonȱ ÄnderungenȱundȱAktualisierungenȱlassenȱsichȱaberȱgeradeȱdeshalbȱkaumȱüberbliȬ cken. Diesesȱ Szenarioȱ machtȱ dieȱ Bedeutungȱ einesȱ entsprechendenȱ Managementsȱ deutlich. ȱ
ȱ
1ȱ
1ȱȱEinführungȱ ContentȬManagementȱ beschreibtȱ dieȱ Planung,ȱ Verwaltung,ȱ Steuerungȱ undȱ KoorȬ dinationȱallerȱAktivitäten,ȱdieȱaufȱdenȱContentȱundȱdessenȱPräsentationȱinȱUnterȬ nehmenȱabstellen.ȱȱ
ȱ Dieseȱ Definitionȱ [Berchtenbreiter,ȱ S.212]ȱ verdeutlichtȱ dieȱ Näheȱ desȱ ContentȬ Managementsȱ zumȱ Dokumentenmanagement.ȱ Einȱ ContentȬManagementȬSystemȱ beinhaltetȱ demnachȱ mehrȱ alsȱ dieȱ alleinigeȱ Verwaltungȱ vonȱ Inhalten.ȱ ContentȬ ManagementȬSystemeȱ(CMS)ȱsindȱAnwendungen,ȱdieȱdasȱErstellen,ȱdieȱKontrolle,ȱ dieȱ Freigabe,ȱ dieȱ Publikation,ȱ dieȱ Archivierungȱ undȱ dieȱ Individualisierungȱ vonȱ Inhaltenȱ imȱ InterȬ,ȱ IntraȬȱ oderȱ Extranetȱ ermöglichen.ȱ Sieȱ sindȱ daraufȱ ausgelegt,ȱ einerseitsȱ demȱ Anwenderȱ einenȱ einfachenȱ Zugangȱ zumȱ Publikationsprozessȱ zuȱ verschaffenȱundȱandererseitsȱeineȱsystemtechnischeȱGrundlageȱfürȱdieȱVerwaltungȱ darzustellen.ȱCharakteristischȱfürȱeinȱCMSȱistȱdieȱdezentraleȱErstellungȱvonȱInhalt.ȱ UnterschiedlicheȱPersonenȱerstellenȱdieȱInhalte,ȱandereȱwiederumȱgebenȱdieseȱfrei.ȱ Mitȱ dieserȱ differenziertenȱAufgabenverteilungȱ gehenȱ unterschiedlicheȱ Rechteȱ einȬ her.ȱInsbesondereȱwirdȱdieȱVerantwortungȱfürȱdieȱErstellungȱwiederȱanȱdieȱFachȬ ebeneȱ zurückgegeben.ȱ Hierzuȱ geselltȱ sichȱ einȱ Versionsmanagement,ȱ dasȱ steuert,ȱ wannȱeinzelneȱContentsȱarchiviert,ȱvernichtetȱoderȱzurȱPflegeȱundȱdamitȱBearbeiȬ tungȱanȱdenȱRedakteurȱweitergereichtȱwerden.ȱ DasȱContentȬManagementȱkannȱalsȱLebenszyklusȱaufgefasstȱwerden:ȱ DenȱBeginnȱbildetȱdieȱIdeeȱfürȱeinenȱContent,ȱderȱentwederȱfremdȱbeschafftȱoderȱ unternehmensinternȱerstelltȱwerdenȱkann.ȱBevorȱdieserȱzurȱNutzungȱverfügbarȱist,ȱ wirdȱeinȱQualitätssicherungsschrittȱintegriert,ȱindemȱentsprechendeȱFreigabeȬȱundȱ VerwaltungsschritteȱvorȱderȱPublikationȱzuȱdurchlaufenȱsind.ȱNachȱderȱBereitstelȬ lungȱ ergebenȱ sichȱ zweiȱ Möglichkeiten:ȱ entwederȱ kannȱ derȱ Contentȱ nachȱ BeendiȬ gungȱseinerȱLebensdauerȱvernichtetȱbzw.ȱarchiviertȱwerden,ȱoderȱerȱkannȱinȱeinemȱ Überarbeitungsschrittȱmodifiziertȱwerden.ȱȱ DerȱZugriffȱaufȱContentȱkannȱsowohlȱvonȱkundenȬȱalsȱauchȱunternehmensinternerȱ Seiteȱflexibelȱüberȱ dieȱ unterschiedlichstenȱ Kanäleȱ erfolgen.ȱBeispieleȱ fürȱ derartigeȱ Kanäleȱ sindȱ internetbasierteȱ Zugriffe,ȱ Personalȱ Digitalȱ Assistantsȱ (PDA),ȱ Handyȱ (WAP,ȱSMS),ȱTV,ȱPrint.ȱDerȱspezifischeȱCharakterȱeinesȱCMS,ȱdiesenȱZugriffȱkanalȬ,ȱ aberȱ auchȱ nutzungsprozessunabhängigȱ zuȱ gewährleistenȱ undȱ eineȱ MehrfachverȬ wendungȱ zuȱ unterstützen,ȱ wirdȱ dadurchȱ deutlich.ȱ Dieȱ Verwaltungȱ vonȱ Contentȱ basiert vermehrtȱ aufȱ XMLȬbasiertenȱ Konzepten,ȱ daȱ XMLȱ alsȱ Metaspracheȱ eineȱ TrennungȱzwischenȱInhalt,ȱStrukturȱundȱLayoutȱkenntȱundȱdamitȱderȱPhilosophieȱ vonȱ CMSȱ folgt.ȱ Dieȱ XMLȬDateiȱ selbstȱ enthältȱ denȱ Content,ȱ dieȱ zugehörigeȱ DokuȬ menttypdefinitionȱ(DTD)ȱbeschreibtȱdieȱStruktur,ȱundȱStyleguidesȱlegenȱdasȱAusȬ sehenȱ festȱ (XLSȬStylesheetsȱ oderȱ Cascadingȱ Styleȱ Sheets(CSS)).ȱ Überȱ sieȱ kannȱ derȱ Contentȱ dannȱ inȱ dieȱ unterschiedlichstenȱ Ausgabeformateȱ wieȱ HTMLȬȱ oderȱ PDFȬ Dateienȱkonsistentȱtransformiertȱwerdenȱ[Berchtenbreiter,ȱS.ȱ213].ȱ
2
ȱ
1.2ȱȱWebȬContentȬManagementȱ DieȱdominierendeȱRolleȱvonȱXMLȱkannȱdurchȱweitereȱGründeȱunterstrichenȱwerȬ den:ȱȱ – XMLȱ istȱ einȱ offnenerȱ Standardȱ mitȱ allgemeinerȱ Syntax,ȱ aberȱ unendlicherȱ Semantikȱ – XMLȱerlaubtȱeinenȱuniversellenȱDatenaustausch.ȱAufȱdieseȱWeiseȱkannȱderȱ gleicheȱ Inhaltȱ aufȱ unterschiedlicheȱ Ausgabegeräteȱ ohneȱ großeȱ Müheȱ angeȬ passtȱwerdenȱ – XMLȱermöglichtȱeineȱflexibleȱAuswahlȱvonȱTagsȱundȱkannȱdaherȱsehrȱindiȬ viduelleȱBereicheȱabdeckenȱundȱdenȱDatenȱeineȱeigeneȱBedeutungȱgebenȱȱ Nebenȱ derȱ Verwaltungȱ spieltȱ dieȱ Bearbeitungȱ desȱ Contentsȱ eineȱ herausragendeȱ Rolle.ȱTemplatesȱorganisierenȱdieȱPräsentationȱaufȱdenȱunterschiedlichstenȱAusgaȬ bemedienȱ(Web,ȱPrint,ȱMobileȱetc.)ȱundȱermöglichtȱsoȱdasȱ„singleȱsourceȱmultipleȱ platform“ȬPrinzip.ȱZumȱZweckeȱderȱTemplatebildungȱwirdȱdieȱStrukturȱdesȱConȬ tentsȱanalysiertȱundȱinȱseineȱStrukturbestandteileȱzerlegt,ȱz.B.ȱÜberschrift,ȱAbstract,ȱ BildȱundȱCopytextȱ[Berchtenbreiter,ȱS.ȱ220].ȱ CMSȱlassenȱsichȱinȱzweiȱGrundtypenȱeinteilen[Berchtenbreiter,ȱS.ȱ224]:ȱ – StatischeȱCMSȱgenerierenȱalleȱInhalteȱstatisch.ȱDiesȱführtȱzwarȱzurȱschnellenȱ Anzeige,ȱbesitztȱaberȱdenȱNachteilȱmangelnderȱAktualitätȱderȱInhalte.ȱ – DynamischeȱCMSȱgenerierenȱdieȱWebsiteȱerstȱimȱMomentȱdesȱZugriffsȱundȱ setzenȱsieȱaufȱBasisȱihrerȱBestandteileȱzusammen.ȱEinȱderartigesȱVorgehenȱ gehtȱzuȱLastenȱderȱSchnelligkeit,ȱermöglichtȱjedochȱstetsȱaktuelleȱInhalte.ȱ Nebenȱ diesenȱ operationalenȱ Fragenȱ leitetȱ ContentȬManagementȱ seineȱ Bedeutungȱ ausȱ dreiȱ Bestrebungenȱ ab,ȱ dieȱ sichȱ inȱ Dringlichkeitȱ undȱ Ausrichtungȱ unterscheiȬ den:ȱCompliance,ȱCollaborationȱundȱKonsolidierungȱsindȱhierȱführendeȱStichworte.ȱ Währendȱ sichȱ Complianceȱ mitȱ denȱ ordnungspolitischenȱ Rahmenbedingungenȱ auseinanderȱ setzt,ȱ ȱ zieltȱ Collaborationȱ verstärktȱ aufȱ eineȱ Technologieȱ zurȱ ZusamȬ menarbeit.ȱ Dieȱ dritteȱ Säuleȱ derȱ Konsolidierungȱ lässtȱ sichȱ alsȱ strategischerȱ Faktorȱ interpretieren.ȱ Hierȱ liegtȱ derȱ Fokusȱ aufȱ Optimierungȱ derȱ Bereitstellungȱ vonȱ ITȬ Diensten.ȱ
1.2 Web-Content-Management Dieȱ zweiteȱ Ausprägungȱ istȱ ContentȬManagementȱ imȱ Sinneȱ vonȱ WebȬContentȬ Managementȱ (WCM),ȱ dasȱ dieȱ Verwaltungȱ vonȱ Contentȱ aufȱ internetȬbasiertenȱ WebȬSitesȱundȱPortalenȱbezieht.ȱȱ ȱ WCMȱ istȱ bestrebt,ȱ eineȱ zentraleȱ Verwaltungȱ desȱ Layoutsȱ zuȱ ermöglichen,ȱ einȱ LinkȬManagementȱzurȱkonsistentenȱPflegeȱderȱHyperlinksȱzuȱunterstützen,ȱautoȬ matisierteȱNavigationshilfenȱeinzuführenȱundȱInhaltȱundȱLayoutȱstriktȱzuȱtrennen.ȱ
ȱ
ȱ
3ȱ
1ȱȱEinführungȱ DieseȱDefinitionȱbeinhaltetȱmehrereȱVorteileȱbeiȱderȱVerwaltungȱeinerȱWebsite:ȱ – Einhaltungȱ derȱ Corperateȱ Identity:ȱ Durchȱ dieȱ Trennungȱ vonȱ Inhaltȱ undȱ LayoutȱerscheintȱderȱWebauftrittȱimmerȱdurchgängigȱȱimȱCorperateȱDesignȱ desȱUnternehmensȱȱ – ContentȬDistribution:ȱDaȱInhalteȱvomȱLayoutȱgetrenntȱsind,ȱkannȱderȱConȬ tentȱüberȱSchnittstellenȱanderenȱMedienȱzurȱVerfügungȱgestelltȱwerdenȱȱ – DynamischeȱErstellungȱvonȱNavigationen:ȱMenüsȱwerdenȱüberȱdasȱSystemȱ automatischȱgeneriert.ȱEineȱProgrammierungȱistȱdamitȱüberflüssigȱ – Zeitgesteuertesȱ Einblenden:ȱ Oftmalsȱ sindȱ Inhalteȱ fürȱ denȱ Webuserȱ nurȱ zuȱ bestimmtenȱ Zeitenȱ interessant,ȱ z.B.ȱ ȱ Weihnachtsangebote,ȱ Sonderverkäufeȱ oderȱAktionen.ȱDieseȱwerdenȱvomȱSystemȱzuȱeinemȱbestimmtenȱDatumȱeinȬȱ oderȱausgeblendetȱȱ WCMȱ unterscheidenȱ mehrereȱ Anwendergruppen:ȱ Redakteureȱ sindȱ vorȱ allenȱ fürȱ denȱInhaltȱdesȱInternetauftrittsȱzuständig,ȱ DesignerȱerstellenȱdasȱLayoutȱdesȱWebȬ auftrittsȱinȱZusammenarbeitȱmitȱdemȱKunden,ȱderȱAdministratorȱverwaltetȱBenutȬ zer,ȱGruppenȱundȱDomains,ȱundȱeinȱWebmasterȱistȱverantwortlichȱfürȱdieȱtechnischeȱ Aufbereitungȱ undȱdieȱHTMLȬProgrammierungȱspeziellerȱInhalte.ȱDerȱPublishingȬ ProzessȱunterscheidetȱsichȱvorȱdiesemȱHintergrundȱstarkȱvomȱVorgehenȱbeiȱCMS.ȱ
1.3 Enterprise Content-Management Dieȱ dritteȱ Strömung,ȱ Enterpriseȱ ContentȬManagementȱ (ECM)ȱ istȱ aufȱ denȱ erstenȱ BlickȱnurȱeineȱTransformationȱbestehenderȱTechnologienȱundȱbesitztȱdamitȱzuȱdenȱ beidenȱ Vorgängerkonzeptenȱ eineȱ inhaltlicheȱ Distanzȱ [Kampffmeyerȱ 2003].ȱ Wennȱ vonȱECMȱgesprochenȱwird,ȱmeinenȱalleȱdasȱGleicheȱundȱdochȱetwasȱanderes.ȱDerȱ Grundȱ fürȱ dieȱ Unklarheitȱ liegtȱ darin,ȱ dassȱ ECMȱ alsȱ Sammelbegriffȱ fürȱ sämtlicheȱ Produkte,ȱ Technikenȱ undȱ Prozesseȱ verwendetȱ wird,ȱ mitȱ denenȱ strukturierteȱ undȱ unstrukturierteȱ Informationenȱ erfasst,ȱ bearbeitet,ȱ verwaltet,ȱ publiziertȱ undȱ archiȬ viertȱwerden.ȱZuȱeinemȱtieferenȱVerständnisȱhatȱderȱBegriffȱnurȱwenigȱbeigetragen.ȱ VielmehrȱsehenȱsichȱdieȱNutzerȱunterschiedlichstenȱProduktkategorienȱgegenüber,ȱ dieȱmeistȱnurȱTeilfunktionenȱausȱdemȱbuntenȱStraussȱderȱAnwendungenȱrundȱumȱ dieȱ Dokumentenverwaltungȱ abdecken,ȱ denenȱ aberȱ gemeinȱ ist,ȱ dassȱ sieȱ beiȱ derȱ Verwaltungȱ vonȱ Contentȱ imȱ Unternehmenȱ zumȱ Einsatzȱ kommen.ȱ Hinzuȱ kommt,ȱ dassȱdieȱÜbergängeȱzwischenȱdenȱeinzelnenȱProduktenȱfließendȱsind.ȱ ZielȱdesȱECMȱistȱes,ȱdieȱunternehmensrelevantenȱDaten,ȱseienȱesȱstrukturierteȱoderȱ unstrukturierteȱ Dokumenteȱ ausȱ unterschiedlichenȱ Quellen,ȱ zusammenzuführenȱ undȱ denȱ Mitarbeiternȱ anhandȱ vonȱ Aufgabenȱ undȱ Rollenȱ zuzuteilenȱ [Böhm].ȱ Dasȱ Konzeptȱ gehtȱ davonȱ aus,ȱ alleȱ Informationenȱ einesȱ Unternehmensȱ internȱ oderȱ exȬ ternȱ bereitzustellenȱ undȱ mitȱ herkömmlicherȱ Informationstechnologieȱ wieȱ DokuȬ mentenmanagement,ȱWorkflowȱundȱArchivierungȱzuȱverwalten.ȱDamitȱgelingtȱes,ȱ eineȱDatenȬȱundȱDokumentenredundanzȱzuȱvermeiden,ȱdenȱZugriffȱeinheitlichȱzuȱ
4
ȱ
1.3ȱȱEnterpriseȱContentȬManagementȱ regeln,ȱ unabhängigȱ vonȱ derȱ Quelleȱ beliebigeȱ Informationenȱ anzubietenȱ undȱ dieȱ erforderlichenȱProzesseȱfürȱdieseȱAufgabenȱzuȱsteuern.ȱ Derȱ Begriffȱ Enterpriseȱ ContentȬManagement kannȱ alsȱ Wortschöpfungȱ derȱ AIIMȱ (AssociationȱforȱInformationȱandȱImageȱManagement)ȱgelten.ȱȱȱ ȱ ECMȱ bestehtȱ ausȱ Technologien,ȱ Werkzeugenȱ undȱ Methoden,ȱ umȱ Inhalteȱ (ConȬ tent)ȱ unternehmensweitȱ zuȱ erfassen,ȱ zuȱ verwalten,ȱ zuȱ speichern,ȱ zuȱ schützenȱ undȱzuȱverteilen.ȱȱ
ȱ DieseȱDefinitionȱistȱsehrȱallgemein,ȱaberȱauchȱäußerstȱumfassend,ȱsoȱdassȱgroßerȱ SpielraumȱfürȱInterpretationenȱbesteht.ȱȱ ECMȬLösungenȱ basierenȱ aufȱ bewährtenȱ Bausteinenȱ wieȱ elektronischerȱ ArchivieȬ rung,ȱCOLD,ȱWorkflow,ȱRecordsȱManagementȱoderȱWebȬContentȬManagement.ȱ BeimȱAufbauȱeinerȱECMȬLösungȱsindȱvorabȱmehrereȱFragenȱzuȱklären:ȱ – Wieȱ sollenȱ Objekteȱ übernommenȱ werden,ȱ d.h.ȱ erfolgtȱ eineȱ Einbindungȱ inȱ manuellerȱFormȱoderȱsystemgesteuert?ȱ – WasȱsollȱmitȱdenȱObjektenȱimȱUrsprungssystemȱgeschehen?ȱInȱderȱMehrzahlȱ derȱFälleȱbietetȱesȱsichȱan,ȱausȱGründenȱderȱDatenkonsistenzȱalleȱübernomȬ menenȱObjekteȱzuȱlöschenȱ – WieȱkommtȱdasȱQuellsystemȱanȱdieȱObjekteȱdesȱECM?ȱKönnenȱbeideȱAnȬ wendungenȱsoȱverknüpftȱwerden,ȱdassȱeinȱZugriffȱmöglichȱist?ȱ DerȱAIIMȱfolgend,ȱlassenȱsichȱECMȬKomponentenȱundȱȬTechnologienȱinȱfünfȱKaȬ tegorienȱeinordnen:ȱȱ – Erfassungȱ(Capture),ȱȱ – Verwaltungȱ(Manage),ȱȱ – Ausgabeȱ(Deliver),ȱȱ – LangfristigeȱSicherungȱ(Preserve),ȱ – Speicherungȱ(Store)ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ
ȱ
5ȱ
1ȱȱEinführungȱ
Capture
Store
Manage Enterprise Content Management
ȱ ȱ
Preserve
Deliver
ȱ Abbildungȱ1.1:ȱECMȬKomponentenȱ
DieȱKategorieȱ„Capture“ȱbeinhaltetȱFunktionalitätȱzurȱErstellung,ȱErfassung,ȱAufȬ bereitungȱundȱVerarbeitungȱvonȱanalogenȱundȱelektronischenȱInformationen.ȱDaȬ beiȱlassenȱsichȱmehrereȱStufenȱundȱTechnologienȱunterscheiden,ȱvonȱderȱeinfachenȱ Erfassungȱderȱ Informationȱ bisȱzurȱ komplexenȱ Aufbereitungȱ durchȱ eineȱautomatiȬ scheȱKlassifikation.ȱBeiȱderȱmanuellenȱErfassungȱkönnenȱalleȱFormenȱvonȱInformaȬ tionenȱ auftreten,ȱ vonȱ Papierdokumenten,ȱ elektronischenȱ OfficeȬDokumenten,ȱ EȬ Mails,ȱ Vordrucken,ȱ MultiȬMediaȬObjekten,ȱ digitalisierterȱ Spracheȱ undȱ Videoȱ bisȱ zumȱ Mikrofilm.ȱ Beiȱ derȱ teilautomatischenȱ oderȱ automatischenȱ Erfassungȱ könnenȱ EDIȬȱ oderȱ XMLȬDokumente,ȱ kaufmännischeȱ undȱ ERPȬAnwendungenȱ oderȱ besteȬ hendeȱFachanwendungenȱdieȱQuelleȱfürȱdieȱErfassungȱseinȱ[Kampffmeyer,ȱ2003].ȱ Fürȱ dieȱ Weiterleitungȱ undȱ inhaltlicheȱ Erschließungȱ kommenȱ inȱ derȱ CaptureȬ Komponenteȱ weitereȱ Konzepteȱ hinzu,ȱ dieȱ dieȱ erfasstenȱ undȱ digitalȱ vorliegendenȱ Informationenȱ aufbereitenȱ undȱ umȱ beschreibendeȱ Merkmaleȱ ergänzen.ȱ Hierzuȱ gehörenȱ[Kampffmeyer,ȱ2003:ȱECMȱ–ȱZwischenȱVisionȱundȱRealität]:ȱ – Indexingȱ(manuelleȱIndizierung):ȱAndersȱalsȱimȱDeutschenȱbeschränktȱsichȱ imȱAngloamerikansichenȱderȱBegriffȱIndexingȱaufȱdieȱmanuelleȱVergabeȱvonȱ Indexattributen,ȱ dieȱ inȱ derȱ Datenbankȱ einerȱ „ManageȈȬKomponenteȱ fürȱ VerwaltungȱundȱZugriffȱaufȱdieȱInformationenȱbenutztȱwird.ȱImȱDeutschenȱ werdenȱ hierȱ auchȱ Begriffeȱ wieȱ „IndizierenȈ,ȱ „AttributierenȈȱ oderȱ „VerȬ schlagwortenȈȱbenutzt.ȱȱ – InputȱDesignsȱ(Profile):ȱSowohlȱdieȱautomatischeȱalsȱauchȱdieȱmanuelleȱAtȬ tributierungȱ kannȱ durchȱ hinterlegteȱ Profileȱ erleichtertȱ undȱ verbessertȱ werȬ
6
ȱ
1.3ȱȱEnterpriseȱContentȬManagementȱ den.ȱSolcheȱProfileȱkönnenȱz.B.ȱDokumentenklassenȱbeschreiben,ȱdieȱdieȱAnȬ zahlȱ derȱ möglichenȱ Indexwerteȱ beschränkenȱ oderȱ bestimmteȱ Kriterienȱ auȬ tomatischȱ vergeben.ȱ Inputȱ Designsȱ schließenȱ auchȱ dieȱ Eingabemaskenȱ undȱ derenȱLogikȱbeiȱderȱmanuellenȱIndizierungȱein.ȱȱ – Categorizationȱ (automatischeȱ Klassifikationȱ oderȱ Kategorisierung):ȱȱ Aufȱ Basisȱ derȱ inȱ denȱ elektronischenȱ Informationsobjektenȱ enthaltenenȱ InȬ formationenȱ könnenȱ Programmeȱ zurȱ automatischenȱ Klassifikationȱ selbstȬ ständigȱ IndexȬ,ȱ ZuordnungsȬȱ undȱ Weiterleitungsdatenȱ extrahieren.ȱ Solcheȱ Systemeȱ könnenȱ aufȱ Basisȱ vordefinierterȱ Kriterienȱ oderȱ selbstlernendȱ InȬ formationenȱauswerten.ȱȱ DieȱfolgendenȱAnwendungsfelderȱbildenȱdieȱ„Manage“ȬKomponente:ȱ – Dokumentenmanagementȱ (DMS)ȱ undȱ Druckdateien,ȱ derenȱ Berichteȱ oderȱ ListenȱsichȱmitȱderȱCOLDȬTechnologieȱinȱeinȱArchivȱüberführenȱlassen.ȱDaȬ zuȱ werdenȱ dieȱ Druckdatenȱ inȱ Einzeldokumenteȱ zerlegtȱ undȱ inȱ einȱ ZielforȬ mat,ȱz.B.ȱTIFFȱoderȱPDFȱumgewandelt.ȱAufȱdieseȱWeiseȱlassenȱsieȱsichȱauchȱ einerȱvirtuellenȱAkteȱzuordnen.ȱ – Collaborationȱ(dieȱZusammenarbeitȱunterstützendeȱSysteme,ȱGroupware)ȱ – WebȬContentȬManagement.ȱ – Workflowȱ/BPMȱBusinessȱProcessȱManagementȱ(Vorgangsbearbeitung)ȱȱ Dieȱ„ManageȈȬKomponenteȱ dientȱ zurȱVerwaltung,ȱ Bearbeitungȱundȱ Nutzungȱderȱ Informationen.ȱSieȱbesitztȱhierfürȱȱ – DatenbankenȱfürȱdieȱVerwaltungȱundȱdasȱWiederauffindenȱȱ – BerechtigungssystemeȱzurȱZugriffsabsicherungȱundȱzumȱSchutzȱȱ vonȱ Informationen.ȱ Dokumentenmanagement,ȱ Webȱ ContentȬManagement,ȱ CollaȬ boration,ȱWorkflowȱundȱBusinessȱProcessȱManagementȱsindȱdamitȱfürȱdenȱdynaȬ mischenȱTeilȱdesȱLebenszyklusȱvonȱInformationȱzuständig.ȱȱ Unterȱ „Deliver“ȱ lassenȱ sichȱ dieȱ Anwendungenȱ zusammenfassen,ȱ dieȱ einȱ OutputȬ ManagementȱzumȱZielȱhaben.ȱDarunterȱkannȱnebenȱherkömmlichenȱTechnologienȱ wieȱCOLDȱauchȱdieȱPräsentationȱvonȱInhaltenȱüberȱWebȬPortale,ȱeBooksȱoderȱdigiȬ taleȱMedienȱwieȱHandysȱoderȱPDAsȱverstandenȱwerden.ȱ DieȱKategorieȱ„Preserve“ȱentsprichtȱderȱLangzeitarchivierung,ȱalsoȱderȱlangfristigȱ stabilenȱundȱunveränderbarenȱAufbewahrungȱvonȱInformationen.ȱȱ Derȱ englischeȱ Sprachgebrauchȱ kenntȱ denȱ Begriffȱ „Recordsȱ Management“,ȱ derȱ jeȬ dochȱ nichtȱ mitȱ derȱ elektronischenȱ Archivierungȱ deutschenȱ Zuschnittsȱ gleichzuȬ setzenȱ ist.ȱ Recordȱ meintȱ dortȱ einȱ aufbewahrungspflichtigesȱ bzw.ȱ aufbewahrungsȬ würdigesȱObjekt,ȱdessenȱInhaltȱsichȱaufȱdieȱGeschäftstätigkeitȱoderȱeineȱTransaktiȬ onȱbezieht.ȱDieȱphysischeȱFormȱoderȱbesondereȱMerkmaleȱspielenȱdabeiȱkeineȱRolȬ le.ȱInȱdeutscherȱÜbersetzungȱwirdȱderȱBegriffȱSchriftgutverwaltungȱgewähltȱ(ISOȬ Normȱ15ȱ489).ȱ ȱ
ȱ
7ȱ
1ȱȱEinführungȱ Unterȱ Recordsȱ Managementȱ werdenȱ allgemeinȱ dieȱ Methoden,ȱ Verfahrenȱ undȱ Anwendungenȱ verstanden,ȱ dieȱ zuȱ einerȱ geordnetenȱ Verwaltung,ȱ Erschließung,ȱ Aufbewahrung,ȱSicherungȱundȱLöschungȱelektronischerȱInformationenȱdienen.ȱȱ
Dieȱ Informationenȱ habenȱ dabeiȱ Geschäftsvorfälleȱ oderȱ Rechtshandlungenȱ zumȱ Gegenstand,ȱ dieȱ dieȱ Einhaltungȱ rechtlicherȱ undȱ regulativerȱ Vorgabenȱ verlangenȱ undȱ dieȱ folglichȱ nachvollziehbarȱ dokumentiertȱ seinȱ müssen.ȱ Imȱ Gegensatzȱ zuȱ elektronischenȱ Archivenȱ bezeichnetȱ Recordsȱ Managementȱ dieȱ reineȱ Verwaltungȱ derȱInformationenȱmitȱFunktionenȱwie:ȱ – AbbildungȱvonȱAktenplänenȱ – KontrollierteȱIndizierungȱderȱInformationenȱz.B.ȱmittelsȱeinesȱThesaurusȱ – VerwaltungȱvonȱAufbewahrungsfristenȱundȱVernichtungszeitpunktenȱȱ Gegenstandȱ sindȱ damitȱ dieȱ StrukturierungsȬ,ȱ VerwaltungsȬȱ undȱ OrganisationsȬ komponentenȱzurȱHandhabungȱvonȱAufzeichnungen.ȱ DieȱKomponenteȱ„Store“ȱwidmetȱsichȱderȱtemporärenȱSpeicherungȱvonȱInformaȬ tionen,ȱ dieȱ nichtȱ archivierungswürdigȱ oderȱ Ȭpflichtigȱ sind.ȱ Sieȱ entsprichtȱ damitȱ eherȱeinerȱAblageȱdennȱeinemȱArchiv.ȱAllgemeinȱexistiertȱeineȱMengeȱvonȱMetadaȬ ten,ȱ dieȱ Speichersystemeȱ charakterisieren.ȱ Dasȱ Materialȱ spieltȱ eineȱ entscheidendeȱ RolleȱfürȱdieȱDauerhaftigkeitȱundȱdieȱZugriffsgeschwindigkeit.ȱMagnetbänderȱoderȱ MagnetplattenȱsindȱhierfürȱeinȱBeispiel.ȱDesȱWeiterenȱkönnenȱdieȱMedienȱinȱunterȬ schiedlicheȱFormenȱundȱGrößenȱunterschiedenȱwerden.ȱFürȱMagnetbänderȱgibtȱesȱ mehrereȱAufzeichnungsverfahren,ȱdieȱunterschiedlicheȱSpeichervoluminaȱzulassen.ȱ Eineȱ weitereȱ Unterscheidungslinieȱ kannȱ zwischenȱ visuellenȱ undȱ elektronischenȱ Systemenȱgezogenȱwerden.ȱWährendȱPapierȱinȱdieȱersteȱKategorieȱfällt,ȱbildenȱalleȱ Datenfilesȱ einȱ Beispielȱ fürȱ denȱ zweitenȱ Fall.ȱ Dieȱ Vielfaltȱ wirdȱ weiterȱ durchȱ dasȱ Speichermediumȱerhöht,ȱwennȱFestplatten,ȱCDs,ȱoptischeȱPlattenȱoderȱUSBȬSticksȱ zurȱAuswahlȱstehen.ȱ Derȱ Speicherwunschȱ fürȱDatenȱ kannȱmeistensȱ nichtȱ durchȱ einȱMediumȱ befriedigtȱ werden.ȱ Ähnlichȱ wieȱ Bücherȱ nachȱ einheitlicherȱ Systematikȱ inȱ Bibliothekenȱ unterȬ gebrachtȱwerden,ȱwirdȱversucht,ȱelektronischeȱSpeichermedienȱinȱJukeboxenȱoderȱ RAIDȬSystemenȱ zuȱ organisieren.ȱ Insbesondereȱ RAIDȬSystemeȱ habenȱ eineȱ rasanteȱ Entwicklungȱ erfahren.ȱ Jeȱ nachȱ Anforderungȱ lassenȱ sichȱ bisȱ zuȱ fünfȱ Levelȱ unterȬ scheiden.ȱDieȱKomplexitätȱwirdȱweiterȱgesteigert,ȱwennȱAspekteȱwieȱSchnittstellenȱ oderȱ Speicherarchitekturenȱ hinzukommen.ȱ Dannȱ gewinnenȱ Abkürzungenȱ wieȱ SCSI,ȱ SATAȱ oderȱ Firewireȱ Bedeutungȱ oderȱ Infrastrukturvorschlägeȱ wieȱ NASȱ (Networkȱ Attachedȱ Storage)ȱ oderȱ SANȱ (Storageȱ Areaȱ Network).ȱ Imȱ Bereichȱ derȱ ArchivierungȱbesitztȱdasȱAkronymȱHSMȱ(HierarchicalȱStorageȱManagement)ȱeineȱ zunehmendeȱ Relevanz.ȱ Hierȱ erfolgtȱ eineȱ Einteilungȱ derȱ Medienȱ nachȱ „online“,ȱ „nearȬline“ȱundȱ„offline“,ȱumȱdieȱDatenlokationȱundȱdieȱSchnelligkeitȱdesȱZugriffsȱ zuȱ beschreiben.ȱ Dieȱ Sichtweiseȱ derȱ Storelösungenȱ liegtȱ hierȱ aufȱ derȱ Hardware.ȱ WerdenȱSpeichersystemeȱmitȱSoftwareȱergänzt,ȱumȱeineȱeffizienteȱVerwaltungȱderȱ
8
ȱ
1.4ȱȱTrendȱ Informationenȱ zuȱ ermöglichen,ȱ ergibtȱ sichȱ eineȱ neueȱ Klasseȱ vonȱ Anwendungen,ȱ dieȱunterȱdemȱNamenȱInformationȱLifecycleȱManagementȱzusammengefasstȱwird.ȱ
1.4 Trend „Nichtsȱ istȱ soȱ beständigȱ wieȱ derȱ Wandel”,ȱ dieseȱ Erkenntnisȱ giltȱ fürȱ dieȱ ITȱ allgeȬ mein.ȱProduktzyklenȱwerdenȱimmerȱkürzer,ȱReleasesȱbringenȱinȱimmerȱschnellerenȱ Zeitabständenȱ neueȱ Funktionalitäten,ȱ undȱ neueȱ inhaltlichȱ oderȱ vomȱ Marketingȱ geprägteȱBegriffeȱtauchenȱaufȱundȱverschwinden.ȱDiesesȱaufȱundȱabȱistȱanȱderȱIdeeȱ desȱ Knowledgeȱ Managementsȱ abzulesen,ȱ möglicherweiseȱ kannȱ sichȱ auchȱ dasȱ EnȬ terpriseȱ Contentȱ Managementȱ dieserȱ Unsicherheitȱ undȱ Schnelllebigkeitȱ nichtȱ entȬ ziehen.ȱLangeȱZeitȱherrschteȱUnklarheitȱdarüber,ȱwasȱderȱBegriffȱumfassenȱsollte.ȱ DieȱAIIMȱ(AssociationȱforȱInformationȱandȱImageȱManagement)ȱhatȱ2005ȱdieȱhierȱ verwendeteȱDefinitionȱgeprägt.ȱAufmerksameȱLeserȱwerdenȱdabeiȱdasȱBPMȱ(BusiȬ nessȱProcessȱManagement)ȱvermissen.ȱAnlehnendȱanȱdieȱSichtweiseȱderȱAIIMȱfinȬ detȱ sichȱ daherȱ keinȱ Kapitelȱ zumȱ Geschäftsprozessmanagementȱ inȱ diesemȱ Buch.ȱ Nichtsdestotrotzȱ erlebtȱ dieserȱ Aspektȱ einenȱ großenȱ Aufmerksamkeitsschub.ȱ Inȱ Prozessenȱ stecktȱ vermutlichȱ dasȱ größteȱ Rationalisierungspotenzialȱ derȱ ECMȬIdee.ȱ BPMȱ istȱ keinȱ isoliertesȱ Konzept,ȱ sondernȱ erfährtȱ erstȱ Lebenȱ durchȱ Integrationȱ inȱ wichtigeȱ Anwendungenȱ wieȱ dieȱ ERPȬSysteme.ȱ Integrationȱ inȱ Richtungȱ umfassenȬ desȱInformationsmanagementȱdürfteȱderȱTrendȱderȱZukunftȱsein.ȱErsteȱAnzeichenȱ sindȱ daranȱ abzulesen,ȱ dassȱ dasȱ Profilȱ vonȱ ECMȱ zunehmendȱ verschwommenerȱ wirdȱundȱesȱimmerȱwenigerȱgelingt,ȱeineȱProduktgruppeȱoderȱeinenȱAnbieterȱeinerȱ KernȬECMȬAnwendungȱ zuȱ identifizieren.ȱ Zuȱ vieleȱ springenȱ aufȱ denȱ Zugȱ desȱ Trendsȱ aufȱ undȱ Etikettierenȱ ihreȱ Produkteȱ mitȱ demȱ ECMȬSiegel.ȱ Einȱ andererȱ BeȬ griffȱ hatȱ möglicherweiseȱ dieȱ Chanceȱ zuȱ überlebenȱ undȱ zumȱ Sammelbeckenȱ derȱ dokumentzentriertenȱ Technologienȱ zuȱ werden:ȱ Documentȱ Relatedȱ Technologiesȱ (DRT).ȱ NebenȱderȱtechnischenȱsiehtȱsichȱdieȱinhaltlicheȱWeiterentwicklungȱgänzlichȱandeȬ renȱAnforderungenȱgegenüber.ȱAnalogȱzuȱWebȱ2.0ȱgibtȱesȱauchȱinȱdemȱBereichȱdesȱ ECMȱersteȱÜberlegungen,ȱwasȱeinȱECMȱ2.0ȱbeinhaltenȱkönnte.ȱVorschlägeȱzielenȱinȱ dieȱRichtungȱArchivierungȱzurȱIntegrationȱvonȱWikis,ȱBlogsȱoderȱRSS,ȱimmerȱvorȱ demȱ Hintergrundȱ derȱ zugrundeȱ liegendenȱ Geschäftsprozesse.ȱ BPMȱ bleibtȱ damitȱ virulent.ȱ Aberȱ auchȱ eineȱ Wiederbelebungȱ desȱ Knowledgeȱ Managementsȱ inȱ KomȬ binationȱmitȱdenȱgenanntenȱTechnologienȱkönnteȱeineȱEntwicklungsrichtungȱsein.ȱ Dazuȱ gesellenȱ sichȱ neueȱ Formenȱ derȱ inhaltlichenȱ Erschließungȱ jenseitsȱ derȱ herȬ kömmlichenȱIndizierungȱoderȱKlassifizierung.ȱVoting,ȱRatingȱoderȱTaggingȱkönnȬ tenȱzukünftigȱMittelȱsein,ȱdurchȱdieȱWissensbasenȱtransparenterȱfürȱdieȱAnwenderȱ aufgebautȱwerdenȱkönnenȱ[Kampffmeyerȱ2007;ȱS.41].ȱȱ Insbesondereȱ bleibtȱ zuȱ berücksichtigen,ȱ wieȱ dieȱ „Globalȱ Player“ȱ (EMCȱ mitȱ DocuȬ mentum,ȱ OpenTextȱ mitȱ Liveȱ LinkȱundȱIBMȱ mitȱ Filenet)ȱ dieȱ Entwicklungȱaufȱ dieȬ semȱMarktȱantizipieren.ȱ
ȱ
9ȱ
2 ECM Capture-Komponente DasȱprophezeiteȱpapierloseȱBüroȱgibtȱesȱnicht.ȱWieȱinȱderȱVergangenheitȱȱstapelnȱ sichȱ großeȱ Papierberge,ȱ dieȱ aufȱ eineȱ effizienteȱ Bearbeitungȱ warten.ȱ Dieȱ papiergeȬ bundeneȱOrganisationȱgiltȱdamitȱalsȱHauptursacheȱfürȱmangelndeȱEffizienz,ȱgerinȬ geȱWirtschaftlichkeitȱoderȱunzureichendeȱServicequalität.ȱDieȱZielsetzung,ȱVerwalȬ tungskostenȱ zuȱ reduzierenȱ undȱ gleichzeitigȱ dieȱ Qualitätȱ derȱ Arbeitȱ nachhaltigȱ zuȱ steigern,ȱ istȱ Motivȱ undȱ Antriebsfederȱ fürȱ eineȱ Automationȱ derȱ DokuȬ menteneingangsbearbeitung.ȱ Dieȱ Herausforderungȱliegtȱ damitȱinȱ einerȱdurchgänȬ gigenȱ Verarbeitungȱ derȱ Eingangspost.ȱ Nurȱ durchȱ eineȱ medienbruchfreieȱ undȱ transparenteȱ Verarbeitungȱ lassenȱ sichȱ dieȱ wachsendenȱ Anforderungenȱ anȱ Zeit,ȱ Qualität,ȱ Kostenȱ undȱ Leistungȱ bewältigen.ȱ Jederȱ dieserȱ Faktorenȱ fürȱ sichȱ istȱ beȬ deutsam,ȱinȱSummeȱbildenȱsieȱjedochȱeinenȱentscheidendenȱWettbewerbsfaktorȱzurȱ VerbesserungȱderȱwertschöpfendenȱKernprozesse:ȱ Kostenȱȱ – Kostenreduktionȱ durchȱ Wegfallȱ manuellerȱ Papierverteilungȱ undȱ begleitenȬ derȱTätigkeitenȱwieȱsichten,ȱkopieren,ȱsortierenȱ – VermeidungȱvonȱMedienbrüchenȱȱ – NutzungȱderȱentlastetenȱMitarbeiterȱfürȱhöherwertigeȱTätigkeitenȱ–ȱJobȬ Enrichmentȱ Leistungȱȱ – AutomatischeȱZuordnungȱvonȱDokumentenȱzuȱMitarbeiternȱundȱVorgängenȱ zuȱWorkflowsȱnachȱinhaltlichenȱKriterienȱ – VerringerungȱderȱDurchlaufzeitȱdurchȱautomatisierteȱWeitergabeȱvonȱDokuȬ mentenȱ – VerzichtȱaufȱsichȱwiederholendeȱTätigkeitenȱwieȱmanuelleȱDatenerfassungȱ oderȱPostsortierungȱ Qualitätȱȱ – Fehlerfreiesȱ Erfassenȱ relevanterȱ Informationenȱ undȱ damitȱ Steigerungȱ derȱ DatenqualitätȱundȱderȱDatenintegrität,ȱd.hȱderȱlogischenȱKorrektheitȱderȱDaȬ tenȱ – InhaltlicheȱErschließungȱderȱDokumenteȱ – UnmittelbareȱAuskunftsbereitschaftȱdurchȱgezieltenȱZugriffȱaufȱalleȱInforȬ mationenȱ NebenȱdemȱAspektȱderȱPapiergebundenheitȱkommtȱeinȱweiteresȱArgumentȱhinzu,ȱ dasȱeinȱautomatisiertesȱVorgehenȱnaheȱlegt:ȱdieȱBedeutungȱderȱInformation.ȱEinerȬ seitsȱ sindȱ Informationenȱ lebenswichtigȱ fürȱ dasȱ Unternehmen,ȱ andererseitsȱ raubtȱ
ȱ
11
2ȱȱECMȱCaptureȬKomponenteȱ derȱ Umgangȱ mitȱ ihnenȱ Mitarbeiternȱ wertvolleȱ Zeit.ȱ Obȱ dieȱ Datenquelleȱ Papierȱ oderȱelektronischeȱDateienȱsind:ȱausȱUnternehmenssichtȱenthaltenȱsieȱgeschäftskriȬ tischeȱ Inhalte.ȱ Dieseȱ müssenȱ schonȱ beimȱ Eingangȱ desȱ Dokumentesȱ erkanntȱ undȱ extrahiertȱwerden;ȱdennȱnurȱthematischȱgeordneteȱInformationenȱhelfen,ȱdieȱAufȬ gabenȱzuȱerfüllen.ȱȱ UmȱdiesemȱAnspruchȱgerechtȱzuȱwerden,ȱdientȱdieȱmanuelleȱKlassifikationȱalsȱdieȱ wohlȱ bekanntesteȱ Formȱ derȱ Strukturierung.ȱ Dabeiȱ kommenȱ jeȱ nachȱ Artȱ undȱ UmȬ fangȱ Mitarbeiterȱ derȱ Fachabteilungen,ȱ Redakteureȱ oderȱ spezielleȱ Ontologenȱ zumȱ Einsatz.ȱ Dieȱ Suchmaschineȱ Yahooȱ arbeitetȱ nachȱ diesemȱ Prinzip.ȱ Dieȱ WebȬSeitenȱ werdenȱinȱeinȱSystemȱausȱhierarchischenȱKategorienȱeingeordnet,ȱdasȱalsȱBasisȱderȱ Sucheȱ dient.ȱ Dieserȱ Aufbauȱ hatȱ Yahooȱ langeȱ einenȱ Vorsprungȱ vorȱ anderenȱ SuchȬ portalenȱ beschert.ȱ Imȱ Unternehmenȱ übernimmtȱ dieȱ Aufgabeȱ derȱ InformationszuȬ ordnungȱ typischerweiseȱ dieȱ Poststelle.ȱ Leiderȱ istȱ dieȱ manuelleȱ Vorgehensweiseȱ zeitintensiv,ȱ undȱ zudemȱ stehenȱ nichtȱ dieȱ nötigenȱ Mittelȱ bereit,ȱ umȱ elektronischeȱ Datenströmeȱ zuȱ erzeugen.ȱ Dieȱ Lösungȱ bestehtȱ daherȱ darin,ȱ einȱ virtuellesȱ EinȬ gangsportalȱ fürȱ alleȱ Formenȱ vonȱ Eingangsdokumentenȱ zuȱ etablieren,ȱ dasȱ sowohlȱ Papierpost,ȱ alsȱ auchȱ Faxdokumente,ȱ Mailsȱ oderȱ OnlineȬDokumenteȱ entgegenȬ nimmtȱundȱzielgerichtetȱweiterleitet.ȱGrundlageȱdiesesȱProzessesȱistȱdieȱzuverläsȬ sigeȱ Erkennungȱ undȱ Klassifizierungȱ vonȱ Dokumenten.ȱ Damitȱ istȱ dieȱ grundȬ sätzlicheȱ Dokumentenstrukturȱ erkannt.ȱ Schwierigerȱ istȱ es,ȱ dieȱ Syntaxȱ undȱ denȱ Satzbauȱnachzuvollziehen,ȱumȱaufȱdieȱBedeutungȱeinzelnerȱTextelementeȱoderȱdesȱ Satzesȱzuȱschließen.ȱNichtȱseltenȱmussȱdafürȱderȱvorausgegangeneȱoderȱderȱnachȬ folgendeȱSatzȱzuȱRateȱgezogenȱwerden.ȱDieserȱUmstandȱlässtȱdieȱKomplexitätȱderȱ notwendigenȱVerfahrenȱerahnen.ȱ
2.1 Automatische Dokumentenerfassung DieȱVerarbeitungȱeingehenderȱPostȱistȱkomplex:ȱUmschlägeȱmüssenȱgeöffnet,ȱDoȬ kumenteȱ entnommen,ȱ geleerteȱ Umschlägeȱ kontrolliert,ȱ Dokumenteȱ anschließendȱ datiert,ȱgeheftetȱundȱsortiertȱwerden.ȱDerȱtechnischeȱEntwicklungsstandȱerlaubtȱes,ȱ Briefumschlägeȱ unterschiedlichstenȱ Formatesȱ undȱ Gewichtesȱ zuȱ öffnenȱ undȱ dieȱ zuvorȱ manuellenȱ Tätigkeitenȱ zuȱ automatisieren.ȱ Diesesȱ istȱ derȱ ersteȱ Schrittȱ einerȱ digitalenȱPostbearbeitung.ȱ Derȱ zweiteȱ Phaseȱ wandeltȱ papiergebundeneȱ Dokumenteȱ inȱ elektronischeȱ SchriftȬ stückeȱ um.ȱ Imȱ nächstenȱ Schrittȱ –ȱ derȱ Dokumentenerkennungȱ –ȱ werdenȱ dieȱ nunȱ elektronischȱ vorliegendenȱ Dokumenteȱ klassifiziert,ȱ d.h.ȱ einerȱ Klasseȱ hinzugefügt.ȱ Obȱ esȱ sichȱ beiȱ demȱ Schreibenȱ umȱ eineȱ Adressenänderung,ȱ eineȱ Kündigungȱ oderȱ eineȱ Rechnungȱ handelt,ȱ wirdȱ zuverlässigȱ erkannt.ȱ Derȱ vierteȱ Schrittȱ bestehtȱ dannȱ darin,ȱfürȱdieseȱDokumentenklasseȱdieȱKerndatenȱausȱdemȱDokumentȱzuȱextrahieren.ȱ ȱ ȱ
12 ȱ
2.1ȱȱAutomatischeȱDokumentenerfassungȱ Beispiel:ȱPosteingangȱ EingehendeȱPostȱwirdȱinȱunterschiedlichenȱFormatenȱempfangen:ȱEȬMail,ȱ papiergebundeneȱ Briefe,ȱ Faxȱ etc.ȱ Darausȱ entstehtȱ dasȱ Problemȱ derȱ einȬ heitlichenȱHandhabung.ȱZwarȱverteiltȱdieȱPoststelleȱdieȱpapierbezogeneȱ Korrespondenz,ȱ EȬMailȱ hingegenȱ wirdȱdirektȱ überȱ ITȬSystemeȱ demȱ AdȬ ressatenȱzugestellt.ȱȱ Beispiel:ȱelektronischeȱRechnungȱ Vierȱ vonȱ fünfȱ Unternehmenȱ erhaltenȱ mehrȱ alsȱ 75%ȱ ihrerȱ EingangsrechȬ nungenȱperȱPost.ȱEtwaȱ70%ȱderȱeingehendenȱPapierrechnungenȱwerdenȱ vomȱEmpfängerȱgescannt,ȱinȱfastȱ40%ȱderȱFälleȱjedochȱerstȱnachȱderȱBeȬ arbeitung,ȱ alsoȱ zuȱ Archivierungszwecken.ȱ Dieseȱ ineffizienteȱ VerarbeiȬ tungȱergabȱeineȱUmfrageȱ[ECMȱ2007]ȱ ȱ Umȱ denȱ digitalenȱPosteingangȱzuȱ verstehen,ȱ mussȱ dieȱ Unterschiedlichkeitȱ derȱzuȱ verarbeitendenȱDokumenteȱbekanntȱsein.ȱGrundsätzlichȱlassenȱsichȱdreiȱArtenȱderȱ Dokumentstrukturȱunterscheiden:ȱ – Unstrukturierteȱ Dokumenteȱ weisenȱ einenȱ Aufbauȱ auf,ȱ derȱ keinerȱ Vorlageȱ undȱ keinerȱ wiederkehrendenȱ Logikȱ entspricht.ȱ Hierzuȱ gehörenȱ Briefe,ȱ BeȬ schwerdenȱoderȱAnschreiben.ȱ – TeilstrukturierteȱDokumenteȱenthaltenȱvoraussehbareȱDaten,ȱallerdingsȱanȱ unterschiedlichenȱ Stellen.ȱ Einȱ Unternehmenȱ kannȱ nichtȱ wissen,ȱ wieȱ seineȱ KundenȱoderȱLieferantenȱihreȱRechnungȱmitȱAnschrift,ȱRechnungsnummer,ȱ BetragȱundȱDatumȱaufbauen.ȱInȱdieseȱKlasseȱfallenȱRechnungenȱoderȱLieferȬ scheineȱ – StrukturierteȱDokumenteȱsindȱinȱBezugȱaufȱdieȱPositionȱihrerȱElementeȱ vordefiniertȱȱHierbeiȱhandeltȱesȱsichȱüblicherweiseȱumȱFormulare,ȱbeiȱdenenȱ Daten,ȱSpaltenüberschriftenȱoderȱLayoutinformationenȱimmerȱamȱselbenȱOrtȱ erscheinen,ȱz.B.ȱRezepteȱoderȱÜberweisungenȱ Zielȱ einerȱ Automatisierungȱ desȱ Posteingangesȱ istȱ es,ȱ vorȱ demȱ Hintergrundȱ derȱ HeterogenitätȱdesȱSchriftgutesȱzuȱentscheiden,ȱzuȱwelchemȱThemaȱdasȱDokumentȱ gehörtȱundȱanȱwenȱesȱweiterzuleitenȱist.ȱDabeiȱgilt:ȱjeȱwenigerȱStrukturȱeinȱDokuȬ mentȱhat,ȱdestoȱintelligenterȱmussȱdieȱSoftwareȱsein,ȱumȱdieȱverarbeitungsrelevanȬ tenȱInhalteȱzuȱextrahieren.ȱ
ȱ
13
2ȱȱECMȱCaptureȬKomponenteȱ Einȱ idealerȱ Ablaufȱ fürȱ dieȱ automatischeȱ Bearbeitungȱ derȱ Eingangspostȱ benötigtȱ daherȱfolgendeȱSchritte1:ȱ 1.
2.
3.
4.
5.
6.
Dokumentenumwandlung:ȱ Papierdokumenteȱ werdenȱ durchȱ Scannenȱ inȱ elektronischeȱBilderȱumgewandeltȱundȱaufȱdieseȱWeiseȱfürȱdieȱweitereȱVerȬ arbeitungȱ vorbereitet.ȱBesondereȱSorgfaltȱ liegtȱ hierbeiȱ aufȱ derȱ Qualitätȱ derȱ Scanner;ȱ dennȱ nurȱ qualitativȱ hochwertigeȱ Ergebnisseȱ eignenȱ sichȱ fürȱ eineȱ Weiterverarbeitungȱ Texterkennung:ȱDieȱBehandlungȱderȱBildinformationȱmitȱeinemȱZeichenerȬ kennungswerkzeugȱ überführtȱ dasȱ Bildȱ inȱ einȱ elektronischȱ bearbeitbaresȱ Dokument.ȱNebenȱderȱZeichenerkennungȱvonȱMaschinenschriftȱundȱBlockȬ buchstabenȱmussȱauchȱdieȱErkennungȱvonȱBarcodesȱunterstütztȱwerden.ȱ Dokumentimport:ȱNebenȱPapierdokumentenȱerhältȱeinȱUnternehmenȱauchȱ elektronischeȱDokumenteȱwieȱEȬMails,ȱPDFsȱoderȱTextverarbeitungsdateien.ȱ Inȱ diesemȱ Fallȱ entfallenȱ dieȱ vorgenanntenȱ Phasenȱ desȱ Scannensȱ undȱ derȱ Texterkennung.ȱ Klassifikationȱ=ȱAutomatischeȱinhaltsbezogeneȱZuordnungȱvonȱDokumenȬ ten:ȱ Derȱ eigentlicheȱ Schrittȱ derȱ Automatisierungȱ verlangtȱ eineȱ Zuordnungȱ derȱ elektronischenȱ Dokumenteȱ zuȱ Vorgängen,ȱ Abteilungen,ȱ Produktenȱ oderȱ Anwendungen,ȱumȱdieȱgrundlegendeȱ Bearbeitungȱzuȱ starten.ȱVorbeȬ reitendȱ hierzuȱ dienenȱ Verfahren,ȱ dieȱ aufȱ Lerntechnikenȱ beruhen.ȱ Anhandȱ einerȱ geringenȱ Zahlȱ ähnlicherȱ Dokumenteȱ lerntȱ dasȱ Systemȱ dieȱ CharakteȬ ristikenȱundȱgefordertenȱMerkmaleȱdesȱSchriftgutesȱkennenȱundȱkannȱdieseȱ inȱderȱFolgeȱaufȱweitereȱDokumenteȱanwenden.ȱȱ Extraktion:ȱMitȱderȱKlassifikationȱistȱdieȱExtraktionȱverbunden,ȱdieȱdasȱauȬ tomatischeȱ Lokalisierenȱ undȱ Auslesenȱ derȱ verarbeitungsrelevantenȱ InforȬ mationenȱumfasst.ȱBeideȱSchritteȱstehenȱinȱengerȱBeziehungȱzueinander:ȱJeȱ präziserȱsichȱeinȱDokumentȱeinemȱbestimmtenȱKontextȱzuordnenȱlässt,ȱdesȬ toȱexakterȱlässtȱsichȱbestimmen,ȱwelcheȱInformationenȱdemȱDokumentȱderȱ Klasseȱ zuȱ entnehmenȱ sind.ȱ Soȱ sindȱ z.B.ȱ dieȱ ausȱ einemȱ Antragȱ zuȱ entȬ nehmendenȱ Datenȱ andereȱ alsȱ dieȱ zuȱ einerȱ Beschwerdeȱ zuȱ einemȱ Produkt.ȱ InsȬbesondereȱ beiȱ derȱ Isolierungȱ vonȱ KundenȬȱ oderȱ Produktnummer,ȱ dieȱ alsȱ identifizierenderȱ Schlüsselȱ fürȱ denȱ Zugriffȱ aufȱ dieȱ EinstiegsinformatioȬ nenȱgelten,ȱmüssenȱdieȱExtraktionsmethodenȱverlässlichȱarbeiten.ȱ ValidierungȱundȱVerifikation:ȱBeideȱGesichtspunkteȱdienenȱderȱQualitätsȬ sicherung.ȱNurȱvollständigeȱundȱrichtigeȱInformationenȱsollenȱautomatischȱ anȱnachfolgendenȱAnwendungenȱweitergegebenȱwerden.ȱȱȱ
DieȱSkizzierungȱdiesesȱidealtypischenȱAblaufsȱzeigt,ȱdassȱderȱFestlegungȱvonȱDoȬ kumentenklassenȱeineȱbesondereȱRolleȱzukommt.ȱDokumentenklassenȱwerdenȱaufȱ derȱ Grundlageȱ vonȱ Geschäftsprozessenȱ oderȱ ihrerȱ ITȬtechnischenȱ Abbildungȱ inȱ Workflowsȱdefiniert.ȱȱNebenȱdemȱreinenȱErkennenȱderȱZeichenȱistȱesȱdemzufolgeȱ ȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱ 1
ȱ
Vgl.ȱSER,ȱInformationsbroschüreȱzuȱDOXISȱInboundȱCenter,ȱS.ȱ12/13.ȱ
14 ȱ
2.1ȱȱAutomatischeȱDokumentenerfassungȱ notwendig,ȱdieȱArtȱundȱStrukturȱdesȱzugrundeȱliegendenȱDokumentesȱzuȱberückȬ sichtigen.ȱ Einzelneȱ Dokumententypenȱ lassenȱ sichȱ anhandȱ ähnlicherȱ Textpassagenȱ einerȱKlasseȱzuordnen,ȱandereȱZuordnungenȱbasierenȱaufȱLayoutmerkmalen,ȱForȬ mularkennzeichenȱoderȱDokumentengröße.ȱAlsȱOrdnungsschemaȱdientȱeinȱKlassiȬ fikationsbaum,ȱ derȱ z.B.ȱ dieȱ Organisationȱ einesȱ Unternehmensȱ undȱ dieȱ dabeiȱ zuȱ berücksichtigendenȱDokumentenklassenȱinȱeinerȱhierarchischenȱAbbildungȱwiderȬ spiegelt.ȱ
2.1.1
Texterkennung
Zurȱ Verarbeitungȱ vonȱ gescanntenȱ Faksimilesȱ zuvorȱ analogerȱ Informationenȱ werȬ denȱverschiedeneȱErkennungstechnologienȱ(Recognition)ȱeingesetzt.ȱDabeiȱgehtȱesȱ darum,ȱ Dokumenteȱ mitȱ Zugriffsinformationenȱ zuȱ versehen.ȱ Zuȱ denȱ verwendetenȱ Erkennungstechnikenȱgehörenȱ[Kampffmeyerȱ2003]:ȱ – OCRȱ(OpticalȱCharacterȱRecognition)ȱȱdieȱBildinformationenȱinȱmaschinenȬ lesbareȱZeichenȱumsetzt.ȱOCRȱwirdȱfürȱMaschinenschriftȱeingesetzt.ȱȱ – HCRȱ (Handprintȱ Characterȱ Recognition)ȱ ȱ alsȱ eineȱ Weiterentwicklungȱ vonȱ OCR,ȱdieȱjedochȱbeiȱFließtextenȱimmerȱnochȱnichtȱzufriedenstellendeȱErgebȬ nisseȱliefert.ȱBeimȱAuslesenȱvonȱdefiniertenȱFeldinhaltenȱistȱdieȱMethodeȱjeȬ dochȱbereitsȱsehrȱsicher.ȱȱ – ICRȱ (Intelligentȱ Characterȱ Recognition)ȱ ȱ alsȱ eineȱ Weiterentwicklungȱ vonȱ OCRȱundȱHCR,ȱdieȱdieȱQualitätȱderȱausgelesenenȱErgebnisseȱdurchȱVergleiȬ che,ȱ logischeȱ Zusammenhänge,ȱ Abgleichȱ mitȱ Referenzlistenȱ oderȱ Prüfungȱ gegenȱvorhandeneȱStammdatenȱverbessert.ȱȱ – OMRȱ (Opticalȱ Markȱ Recognition),ȱ ȱ dieȱ mitȱ hoherȱ Sicherheitȱ spezielleȱ MarȬ kierungenȱinȱvordefiniertenȱFeldernȱausliestȱundȱsichȱbeiȱFragenbogenaktioȬ nenȱundȱanderenȱVordruckenȱbewährt.ȱȱ – Barcode,ȱdieȱbeimȱVersendenȱvonȱVordruckenȱundȱbeimȱEinlesenȱderȱRückȬ läuferȱautomatisiertȱerkanntȱundȱzugeordnetȱwerden.ȱȱ Alleȱ Artenȱ benötigenȱ einenȱ erheblichenȱ Anteilȱ manuellerȱ Nachbearbeitung.ȱ Soȱ kannȱesȱvorkommen,ȱdassȱinȱderȱSchriftartȱeineȱ0ȱ(Null)ȱwieȱeinȱOȱ(Buchstabe)ȱausȬ siehtȱ oderȱ aufȱ einemȱ geringȱ aufgelöstenȱ Faxbildȱ eineȱ 8ȱ (Zahl)ȱ inȱ einerȱ kleinenȱ Schriftgrößeȱ nichtȱ vonȱ einemȱ Bȱ (Buchstabe)ȱ zuȱ unterscheidenȱ ist.ȱ Dieȱ Verfahrenȱ entsprechenȱdamitȱnichtȱdemȱIdealȱeinesȱautomatischenȱAblaufs.ȱȱ
2.1.2
Textklassifikation
DieseȱPhaseȱversucht,ȱnachȱeinemȱvorausgehendenȱLernvorgang,ȱDokumenteȱohneȱ manuellenȱEingriffȱzuȱklassifizierenȱundȱinȱihreȱwesentlichenȱBestandteileȱzuȱzerleȬ gen.ȱ ȱ Voraussetzungȱ istȱ dieȱ Bildungȱ vonȱ Dokumentenklassen,ȱ dieȱ eineȱ GruppieȬ rungȱvonȱObjektenȱmitȱgleichenȱAttributenȱundȱEigenschaftenȱerlauben.ȱLeistungsȬ fähigeȱAlgorithmenȱfürȱdieȱMustererkennungȱȱinȱKombinationȱmitȱeinerȱausgefeilȬ tenȱKontextanalyseȱermöglichenȱdieȱautomatischeȱEinordnungȱvonȱDokumentenȱinȱ dieseȱ zuvorȱ gebildetenȱ Kategorien,ȱ erstellenȱ Querverweiseȱ inȱ andereȱ Dokumenteȱ
ȱ
15
2ȱȱECMȱCaptureȬKomponenteȱ undȱunterstützenȱdasȱeffizienteȱAuffindenȱvonȱInformationen.ȱDieȱgenutztenȱVerȬ fahrenȱlassenȱsichȱinȱmehrereȱKlassenȱeinteilen2:ȱ TemplateȬKlassifikation:ȱ diesesȱ Konzeptȱ wirdȱ aufȱ Dokumenteȱ angewendet,ȱ dieȱ imȱ KopfȬȱ und/oderȱ Fußteilȱ statischeȱ Elementeȱ aufweisen.ȱ Hierunterȱ fallenȱ Standardbriefe,ȱ Formulareȱ oderȱ Rechnungen.ȱ Dieseȱ Formȱ wirdȱ anhandȱ vonȱ Beispieldokumentenȱ fürȱ jedeȱKlasseȱtrainiert.ȱ 2. KlassifikationȱmitȱassoziativerȱSuche:ȱHierȱwerdenȱDokumenteȱnachȱ inhaltlichenȱKriterienȱanalysiert.ȱDazuȱwerdenȱTextblöckeȱhinsichtlichȱ derȱ Übereinstimmungȱ mitȱ derȱ jeweiligenȱ Zielklasseȱ assoziativȱ verglichen.ȱȱ 3. PhrasenȬKlassifikation:ȱErgänzendȱzuȱdenȱlernendenȱVerfahrenȱkannȱ explizitesȱ Wissenȱ auchȱ inȱ Formȱ vonȱ feststehendenȱ Phrasenȱ definiertȱ werden.ȱ Diesȱ istȱ derȱ Fallȱ beiȱ starkȱ formalisierterȱ Kommunikation,ȱ wennȱ bestimmteȱ Schlüsselworteȱ oderȱ feststehendeȱ Wortfolgenȱ angegebenȱwerdenȱkönnen.ȱ 4. ImageȬSizeȬKlassifikation:ȱVieleȱDokumenteȱlassenȱsichȱbereitsȱanȬ handȱihresȱFormatesȱeinordnen,ȱz.B.ȱFlugscheine,ȱRezepteȱoderȱBons.ȱ 1.
2.1.3
Textextraktion
NachdemȱeingehendeȱDokumenteȱerfolgreichȱeinerȱKlasseȱzugeordnetȱsind,ȱmussȱ imȱnächstenȱSchrittȱihrȱInhaltȱanalysiertȱwerden.ȱDazuȱdientȱdieȱExtraktion.ȱDieȱamȱ weitestȱverbreiteteȱȱMethodeȱderȱInhaltsprüfungȱistȱdieȱFormatanalyse.ȱEinȱFeldtyp,ȱ wieȱz.B.ȱdasȱDatumȱwirdȱinȱeinerȱvorgegebenenȱDokumentenzoneȱgesucht,ȱwobeiȱ dieȱZoneȱauchȱdasȱgesamteȱDokumentȱumfassenȱkann.ȱMittelsȱoptischerȱZeichenȬ erkennungȱwirdȱversucht,ȱeineȱStrukturȱzuȱerkennen,ȱdieȱzuȱeinerȱDatumsangabeȱ passenȱkann.ȱVielfältigeȱParameterȱsteuernȱdiesenȱSuchprozess.ȱSoȱkannȱangegebenȱ werden,ȱ obȱ dieȱ Formatangabeȱ sichȱ aufȱ dieȱ amerikanischeȱ Schreibweise,ȱ dieȱ deutscheȱoderȱeineȱbeliebigeȱbeziehenȱsoll.ȱWeitereȱanwendungsspezifischeȱDatenȬ typenȱwieȱBestellȬȱoderȱRechnungsnummernȱwerdenȱtypischerweiseȱmithilfeȱreguȬ lärerȱAusdrückeȱmodelliert.ȱ DerȱKernȱdieserȱKonzepteȱberuhtȱaufȱdenȱPrinzipienȱzurȱInformationstheorieȱvonȱ C.ȱ Shannon,ȱ demȱ Bayes’schenȱ Theoremȱ derȱ Wahrscheinlichkeitstheorieȱ undȱ denȱ neuestenȱ Erkenntnissenȱ ausȱ demȱ Bereichȱ derȱ neuronalenȱ Netze.ȱ Anhandȱ dieserȱ Technikenȱ werdenȱ Textmusterȱ identifiziert,ȱ umȱ sieȱ dannȱ inȱ anderenȱ Quellenȱ schnellȱundȱautomatischȱwiederȱzuȱerkennen.ȱDochȱdamitȱnichtȱgenug.ȱLetztlichȱistȱ esȱdasȱZiel,ȱdieȱKernaussagenȱeinesȱTextesȱaufgrundȱderȱHäufigkeitȱundȱderȱBezieȬ hungenȱ derȱ Begriffeȱ zueinander,ȱ zuȱ ermitteln.ȱ Aufȱ dieseȱ Weiseȱ wirdȱ dieȱ digitaleȱ EssenzȱeinesȱDokumentes,ȱdieȱihmȱseineȱBedeutungȱverleiht,ȱextrahiert.ȱSobaldȱderȱ ȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱ 2
ȱ
Vgl.ȱSER,ȱInformationsbroschüreȱDOXISȱInboundȱCenter,ȱS.ȱ25
16 ȱ
2.1ȱȱAutomatischeȱDokumentenerfassungȱ unverwechselbareȱ Fingerabdruckȱ derȱ Kernaussageȱ vorliegt,ȱ könnenȱ Websites,ȱ NachrichtenȬ,ȱ EȬMailȬȱ undȱ Dokumentenarchiveȱ nachȱ sinnverwandtenȱ Inhaltenȱ durchsuchtȱwerden.ȱȱ Agentenȱ sindȱ Programme.ȱ dieȱ nichtȱ nachȱ Stichwörternȱ suchen,ȱ sondernȱ sichȱ anȱ thematischenȱ oderȱ inhaltlichenȱ Musternȱ orientieren,ȱ d.h.ȱ sieȱ leitenȱ dieȱ Ideeȱ oderȱ denȱ intellektuellenȱ Gehaltȱ durchȱ dasȱ Musterȱ derȱ Begriffeȱ undȱ derȱ kontextuellenȱ Beziehungenȱ ab.ȱ Dabeiȱ istȱ dasȱ Musterȱ selbstȱ nichtȱ vonȱ spezifischenȱ sprachlichenȱ Strukturenȱ oderȱ derȱ Semantikȱ abhängigȱ undȱ wirdȱ daherȱ auchȱ nichtȱ vonȱ umȬ gangssprachlichenȱ Variantenȱ oderȱ grammatikalischenȱ undȱ regionalenȱ Feinheitenȱ verfälscht.ȱDaȱderȱAgentȱimmerȱkontextbezogenȱarbeitet,ȱweißȱer,ȱobȱeinȱBenutzer,ȱ derȱ nachȱ „Hamburger“ȱ fragt,ȱ Informationenȱ zuȱ denȱ Einwohnernȱ derȱ Stadtȱ oderȱ überȱ dasȱ Produktȱ derȱ Gastronomieȱ anfordert.ȱ Agentenȱ könnenȱ aberȱ auchȱ dazuȱ dienen,ȱumȱautomatischȱDokumenteȱnachȱKategorienȱzuȱordnen.ȱSoȱkannȱz.B.ȱeinȱ Agentȱ fürȱ Newsȱ eingehendeȱ Nachrichtenȱ entgegennehmenȱ undȱ sortieren.ȱ ProbȬ lemeȱentstehenȱdann,ȱwennȱKlassenȱhierarchischȱangeordnetȱsindȱoderȱwennȱMusȬ terȱmehrerenȱKlassenȱzugeordnetȱwerdenȱkönnen.ȱInȱdiesenȱFällenȱkannȱdieȱTreffȬ sicherheitȱerheblichȱleiden.ȱ EinȱhäufigȱauftretendesȱProblemȱistȱdieȱBestimmungȱderȱRelevanzȱeinesȱDokumenȬ tesȱfürȱeineȱAbfrage.ȱHierȱleistetȱdieȱTheorieȱvonȱBayesȱwertvolleȱHilfe,ȱdaȱsieȱEinȬ schätzungenȱ mitȱ bereitsȱ bekanntenȱ Informationenȱ verknüpft.ȱ Bayesȱ befassteȱ sichȱ mitȱ derȱ Bestimmungȱ derȱ Wahrscheinlichkeitȱ zwischenȱ mehrerenȱ Variablenȱ undȱ derȱBerechnungȱderȱWirkungȱeinerȱVariablenȱaufȱdieȱanderen.ȱDiesesȱKonzeptȱistȱ soȱvariabel,ȱdasȱproblemlosȱErweiterungenȱmöglichȱsind.ȱMitȱdemȱAPCMȬKonzeptȱ (Adaptiveȱ Probalisticȱ Conceptȱ Modelling)ȱ könnenȱ Korrelationenȱ zwischenȱ DokuȬ mentmerkmalenȱhergestelltȱwerden.ȱȱ EineȱweitereȱIdeeȱbasiertȱaufȱderȱTheorieȱShannons,ȱdieȱ–ȱwieȱimȱKapitelȱInformaȬ tionȱ Retrievalȱ ausgeführtȱ –ȱ besagt,ȱ dassȱ eineȱ Kommunikationseinheitȱ –ȱ alsoȱ etwaȱ einȱ Ortȱ oderȱ Satzȱ –ȱ umsoȱ mehrȱ Informationsgehaltȱ besitzt,ȱ jeȱ wenigerȱ sieȱ auftritt.ȱ Begriffe,ȱ dieȱ imȱ Kontextȱ einerȱ Unterhaltungȱ seltenȱ vorkommen,ȱ tragenȱ alsoȱ mehrȱ Bedeutung.ȱAnsatzweiseȱlässtȱsichȱdieseȱAussageȱdurchȱdenȱhohenȱRedundanzgeȬ haltȱ natürlicherȱ Sprachenȱ verifizieren.ȱ Eineȱ Unterhaltungȱ lässtȱ sichȱ häufigȱ auchȱ dannȱ verfolgen,ȱ wennȱ vieleȱ Umfeldgeräuscheȱ einigeȱ Wörterȱ unverständlichȱ erȬ scheinenȱlassen.ȱGleichesȱgiltȱfürȱdasȱLesenȱvonȱZeitungsartikeln.ȱOftmalsȱwirdȱderȱ Sinnȱschonȱdurchȱ„Überfliegen“ȱdesȱTextesȱerfasst.ȱ Alleȱ dieseȱ Konzepteȱ sindȱ dasȱ Ergebnisȱ derȱ Unzulänglichkeitȱ herkömmlicherȱ VerȬ fahren:ȱ – Dieȱ Stichwortsucheȱ führtȱ häufigȱ zuȱ einemȱ Informationsüberfluss.ȱ Obwohlȱ Dokumenteȱ identifiziertȱ werden,ȱ inȱ denenȱ derȱ Suchbegriffȱ vorkommt,ȱ sindȱ sieȱnichtȱinȱderȱLage,ȱdieȱRelevanzȱdesȱDokumentesȱabzuschätzen.ȱDasȱProbȬ lemȱderȱSuchstrategieȱbestehtȱdarin,ȱdassȱsieȱaufȱderȱAnnahmeȱbasiert,ȱdassȱ einȱBegriff,ȱderȱinȱeinemȱDokumentȱbesondersȱhäufigȱauftaucht,ȱauchȱbesonȬ
ȱ
17
2ȱȱECMȱCaptureȬKomponenteȱ
ȱ
dersȱ relevantȱ fürȱ dieȱ Sucheȱ seinȱ muss.ȱ Derȱ folgendeȱ Satzȱ liefertȱ hierfürȱ einȱ Beispiel:ȱ„ȱKürzlichȱwarȱichȱabendsȱaufȱderȱStraße.ȱEsȱwarȱeineȱlangeȱStraßeȱ...ȱ undȱ beiȱ derȱ Einmündungȱ inȱ eineȱ weitereȱ Straßeȱ entdeckteȱ ichȱ eineȱ PolizeiȬ streife.“ȱObwohlȱdasȱWortȱStraßeȱhierȱdreimalȱvorkommt,ȱhatȱderȱSinnȱmehrȱ mitȱderȱEntdeckungȱderȱPolizeistreifeȱzuȱtun.ȱ – Beiȱ derȱ kollaborativenȱ Filtertechnikȱ werdenȱ persönlicheȱ Informationenȱ ausȱ demȱVergleichȱvonȱFormularenȱzusammengestellt,ȱdieȱderȱBenutzerȱausfülȬ lenȱmuss.ȱDiesesȱVorgehenȱistȱausȱdemȱInternetȱbekanntȱundȱTeilȱderȱPortale,ȱ dieȱ denȱ Benutzerȱ beiȱ wiederholtemȱ Besuchȱ derȱ Websiteȱ persönlichȱ anspreȬ chenȱundȱEmpfehlungenȱmachen.ȱFolgendesȱBeispielȱzeigtȱdasȱgrundsätzliȬ cheȱVerfahrenȱ:ȱ o o o ȱ
Michaelȱnennt:ȱ Elvisȱ BuddyȱHollyȱ LittleȱRichardȱ Hansȱnennt:ȱȱ JimmyȱHendrixȱ JamesȱBrownȱ ArethaȱFranklinȱ Egonȱnennt:ȱ Elvisȱ JerryȱLeeȱLewisȱ LittleȱRichardȱ
Derȱ automatischeȱ Vergleichȱ derȱ Angabenȱ stelltȱ fest,ȱ dassȱ Michaelȱ undȱ EgonȱÄhnlichkeitenȱaufweisen.ȱMichaelȱerhältȱdenȱVorschlagȱJerryȱLeeȱLeȬ wisȱauszuprobieren,ȱEgonȱwirdȱaufȱBuddyȱHollyȱverwiesen.ȱDieseȱTechnikȱ arbeitetȱnurȱmitȱeinemȱbeschränktenȱSatzȱvonȱArtikelnȱ(z.B.ȱMusik,ȱBücher).ȱ FürȱOnlineȬDienste,ȱdieȱaktuelleȱInformationenȱoderȱArtikelȱzumȱKaufȱanȬ bieten,ȱeignenȱsieȱsichȱnurȱbedingt,ȱweilȱdieȱThemenkreiseȱzuȱunterschiedȬ lichȱundȱzuȱbreitȱgefächertȱsind.ȱAußerdemȱhabenȱdieȱBenutzerwertungenȱ keinenȱzusätzlichenȱInformationswert,ȱderȱüberȱdieȱunmittelbareȱAuswahlȱ hinausgeht.ȱ Beiȱ wachsendenȱ Benutzerzahlenȱ tretenȱ zudemȱ SkalierungsȬ problemeȱ auf,ȱ daȱ sichȱ einȱ aussagekräftigerȱ multidimensionalerȱ Vergleichȱ alsȱsehrȱaufwändigȱgestaltet.ȱ – WechselndeȱsemantischeȱBedeutungenȱerschwerenȱdasȱVerständnisȱvonȱZuȬ sammenhängenȱ undȱ führenȱ oftȱ zuȱ Fehlinterpretationenȱ beiȱ maschinellenȱ Analysen.ȱDerȱVersuch,ȱdurchȱgrammatikalischeȱRegelnȱoderȱWortlistenȱdenȱ SinnȱvonȱAussagenȱzuȱerkennen,ȱführtȱnichtȱimmerȱzumȱgewünschtenȱErfolg.ȱ Dieȱ Grenzenȱ desȱ Ansatzes,ȱ insbesondereȱ beiȱ derȱ Auflösungȱ vonȱ MehrdeuȬ tigkeiten,ȱzeigenȱfolgendeȱBeispiele:ȱ ȱ Beispielȱ1:ȱ„DerȱHundȱsetzteȱsichȱaufȱdenȱTeppich;ȱerȱwarȱweiß.“ȱ ȱ Hierȱ istȱ unklar,ȱ woraufȱ sichȱ weißȱ bezieht;ȱ aufȱ denȱ Teppichȱ oderȱ denȱ Hund.ȱ Würdeȱ derȱ zweiteȱ Halbsatzȱ „erȱ fingȱ anȱ zuȱ bellen“ȱ oderȱ „erȱ warȱ vollȱ vonȱ Sitzkissen“,ȱ bestündenȱ fürȱ einenȱ Leserȱ keineȱ VerständnisȬ probleme,ȱfürȱeinenȱRechnerȱaberȱdurchaus.ȱ ȱ
18 ȱ
2.1ȱȱAutomatischeȱDokumentenerfassungȱ Beispielȱ2:ȱ„Fliegen,ȱdasȱistȱallgemeinȱbekannt,ȱkönnenȱschnellerȱfliegenȱ alsȱBienen.“ȱ ȱ Dieȱ Nutzungȱ desȱ Wortesȱ „Fliegen“ȱ alsȱ Subjektȱ undȱ alsȱ Verbȱ kannȱ möglicherweiseȱ geklärtȱ werden.ȱ Wieȱ verhältȱ esȱ sichȱ aberȱ mitȱ demȱ Wortȱ „das“,ȱdasȱsichȱaufȱȱetwasȱAbstraktesȱbezieht?ȱ ȱ Beispielȱ3:ȱ„DerȱPräsidentȱbenutzteȱfürȱseinȱTreffenȱmitȱdemȱ französischenȱAußenministerȱeineȱLimousine“ȱ ȱ Daȱ dieȱ relativeȱ Bedeutungȱ vonȱ stichwortȬbasiertenȱ Konzeptenȱ nichtȱ erkanntȱwird,ȱkommenȱdortȱdenȱBegriffenȱPräsident,ȱAußenministerȱundȱ Limousineȱ dasȱ gleicheȱ Gewichtȱ zu.ȱ Dieȱ Bedeutungȱ derȱ einzelnenȱ Stichworteȱ hängtȱ aberȱ starkȱ vomȱ Zusammenhangȱ ab.ȱ Erschwerendȱ kommtȱ hinzu,ȱ dasȱ alleȱ derartigenȱ Konzepteȱ sprachspezifischȱ sindȱ undȱ dassȱ dieȱ Abhängigkeitȱ vonȱ derȱ Grammatikȱ eineȱ Berücksichtigungȱ derȱ Umgangsspracheȱ oderȱ vonȱ unkorrektemȱ Sprachgebrauchȱ nichtȱ zulässt.ȱ DarausȱresultiertȱdieȱÜberlegenheitȱderȱneuen,ȱaufȱderȱMustererkennungȱ beruhendenȱTechnologien.ȱȱ
ȱ
WieȱarbeitetȱTextextraktionȱnunȱkonkret?ȱRechnungenȱlesenȱ–ȱwieȱgehtȱeinȱMenschȱ dazuȱ vor?ȱ Woranȱ erkenntȱ erȱ einenȱ bestimmtenȱ Lieferanten?ȱ Anȱ welcherȱStelleȱeiȬ nesȱ Formularsȱ stehenȱ dieȱ relevantenȱ Informationen?ȱ Einȱ Menschȱ kenntȱ dieȱ typiȬ schenȱPositionen,ȱanȱdenenȱsichȱAnschriftȱoderȱRechnungsnummerȱbefinden.ȱFerȬ nerȱ erkenntȱ erȱ dieȱ Artȱ derȱ Informationȱ intuitivȱ anhandȱ vonȱ Formatierungenȱ oderȱ Schlüsselworten.ȱ Dieseȱ menschlicheȱ Vorgehensweiseȱ versuchenȱ neuereȱ Verfahrenȱ zuȱ imitieren.ȱ Mitȱ derȱ Klassifikationȱ istȱ dasȱ ersteȱ Teilzielȱ einerȱ automatischenȱ DoȬ kumentenverarbeitungȱ erreicht,ȱ nämlichȱ dieȱ Zuordnungȱ desȱ Dokumentesȱ zuȱ inȬ haltlichȱgleichen.ȱUmȱeineȱweitereȱAutomatisierungsstufeȱzuȱrealisieren,ȱmüssenȱinȱ einemȱnächstenȱSchrittȱalleȱbearbeitungsrelevantenȱInformationenȱausȱdemȱDokuȬ mentȱ isoliertȱ werden.ȱ Grundsätzlichȱ wirdȱ zwischenȱ regelbasierten,ȱ statistischenȱ undȱlernendenȱAnsätzenȱunterschieden.ȱ Dasȱ regelbasierteȱ Verfahrenȱ istȱ dasȱ bekanntesteȱ Konzept.ȱ Logischȱ formulierteȱ Regelnȱ extrahierenȱ einenȱ Datensatzȱ oderȱ einȱ Dokument.ȱ Dieȱ Regelnȱ enthaltenȱ Schlüsselbegriffeȱwieȱ„Rechnung“ȱoderȱ„Quittung“.ȱInsgesamtȱlassenȱsichȱbuchhalȬ terischeȱ Belegeȱ relativȱ einfachȱ alsȱ Dokumententypenȱ durchȱ Regelnȱ beschreiben.ȱ Vereinfachendȱ kommtȱ hinzu,ȱ dassȱ oftȱ dieȱ Lageȱ derȱ zuȱ isolierendenȱ Begriffeȱ beȬ kanntȱist.ȱSoȱweisenȱaufȱeinerȱRechnungȱderȱMehrwertsteuerbetragȱundȱdieȱRechȬ nungssummeȱ erwartungsgemäßȱ eineȱ Nachbarschaftȱ auf.ȱ Imȱ Gegensatzȱ zuȱ denȱ lernendenȱSystemenȱwerdenȱbeiȱregelbasiertenȱVerfahrenȱdieȱKlassenȱdurchȱBooleȬ scheȱTermeȱspezifiziert.ȱEinȱDokumentȱgehörtȱzurȱKlasse,ȱwennȱesȱdemȱBooleschenȱ Ausdruck:ȱ Autobahnȱ :=ȱ Straßeȱ ANDȱ (Autoȱ ANDȱ NOTȱ Fahrrad)ȱ gehorcht.ȱ Diesesȱ
ȱ
19
2ȱȱECMȱCaptureȬKomponenteȱ Verfahrenȱ besitztȱ einigeȱ Vorteile,ȱ insbesondereȱ seineȱ hoheȱ Klassifikationsqualität,ȱ seineȱEffizienzȱinȱderȱAnfangsphaseȱundȱdieȱMöglichkeitȱseinerȱmanuellenȱAnpasȬ sungȱstechenȱhervor.ȱ StatistischeȱVerfahrenȱarbeitenȱgrundsätzlichȱandersȱalsȱdieȱregelbasiertenȱMethoȬ den.ȱ Einȱ Verfahrenȱ dieserȱ Klasseȱ istȱ dieȱ ausȱ demȱ Informationȱ Retrievalȱ bekannteȱ VektorraumȬMethode,ȱ beiȱ derȱ dieȱ Klassenzugehörigkeitȱ überȱ Vektorenȱ bzw.ȱ mitȬ telsȱderȱÄhnlichkeitȱdesȱDokumentesȱzumȱReferenzvektorȱermitteltȱwird.ȱBasisȱistȱ einȱÄhnlichkeitsmaß.ȱDiesesȱerlaubtȱdieȱBildungȱvonȱCluster,ȱermöglichtȱaberȱkeinȱ Feedback.ȱ Eineȱ großeȱ Herausforderungȱ bestehtȱ darin,ȱ dassȱ dieseȱ Ansätzeȱ eineȱ Lernphaseȱ benötigen.ȱ Mitȱ einerȱ Auswahlȱ anȱ Inhaltenȱ wirdȱ dasȱ Systemȱ aufȱ beȬ stimmteȱ Inhaltstypenȱ vorbereitet.ȱ Daherȱ besitztȱ dieȱ verwendeteȱ Lernmengeȱ einenȱ großenȱ Einflussȱ aufȱ dieȱ Wörter,ȱ dieȱ dasȱ Verfahrenȱ erkennenȱ muss,ȱ umȱ denȱ entȬ sprechendenȱ Dokumenttypenȱ zuordnenȱ zuȱ können.ȱ Umȱ dieȱ Treffsicherheitȱ zuȱ erhöhen,ȱwerdenȱoftmalsȱlinguistischeȱModuleȱgenutzt,ȱdieȱdurchȱStoppwortȬȱundȱ SynomymlistenȱdenȱWortschatzȱreduzierenȱundȱzuȱeinerȱpräziserenȱKlassifikationȱ beitragen.ȱ Einȱ weiteresȱ Mittelȱ derȱ Präzisionsförderungȱ istȱ dieȱ Einbeziehungȱ derȱ Textstruktur,ȱalsoȱdieȱBewertungȱderȱRolleȱvonȱÜberschriften,ȱFußnotenȱoderȱGlosȬ saren.ȱȱȱ Lernendeȱ Konzepteȱ kommenȱ ohneȱ Menschenȱ nichtȱ aus.ȱ Sieȱ benötigenȱ speziellȱ ausgesuchteȱDokumenteȱalsȱ Lernmengeȱ undȱ versuchenȱ durchȱ Clusteranalyseȱ ZuȬ sammengehörigesȱ einanderȱ zuzuordnen.ȱ Lernendeȱ Systemeȱ passenȱ Begriffeȱ inȱ ihrerȱ Bedeutungȱ anhandȱ derȱ Merkmalsgewichtungȱ gemäßȱ derȱ statistischenȱ Maßeȱ desȱInformationȱRetrievalȱan.ȱAussagen,ȱdieȱimȱursprünglichenȱTextȱvorkommen,ȱ aberȱ inȱ denȱ weiterenȱ Quellenȱ nichtȱ mehrȱ auftreten,ȱ könnenȱ dannȱ eineȱ geringereȱ Bedeutungȱ erhaltenȱ oderȱ fallenȱ ganzȱ heraus.ȱ Dasȱ Nachtrainierenȱ istȱ besondersȱ dannȱ wichtig,ȱ wennȱ neueȱBegriffeȱundȱKonzepteȱ hinzukommen.ȱNurȱ durchȱ stänȬ digeȱAnpassungȱlässtȱsichȱdieȱTreffsicherheitȱverbessernȱundȱerhöhen.ȱDaȱeinȱClusȬ terȱ überȱ seineȱ Dokumenteȱ definiertȱ wird,ȱ ändernȱ sichȱ Clusterȱ währendȱ derȱ BearȬ beitungȱderȱDokumente.ȱDieseȱFlexibilitätȱbirgtȱeineȱGefahr:ȱwennȱdieȱKategorienȱ zuȱ dynamischȱ aufȱ Veränderungenȱ reagieren,ȱ könnenȱ ganzeȱ Clusterȱ plötzlichȱ verȬ schwinden,ȱ andereȱ bisherȱ unbekannteȱ aberȱ auftauchenȱ undȱ dieȱ gesamteȱ OrdȬ nungsgrundlageȱzerstören.ȱ Dasȱ Zielȱ derȱ Dokumentenanalyseȱ bestehtȱ darin,ȱ ähnlicheȱ Dokumenteȱ inȱ eineȱ geȬ meinsameȱ Klasseȱ zuȱ gruppieren.ȱ Dieȱ Dokumenteȱ sollenȱ dabeiȱ Ähnlichkeitenȱ aufȬ weisen,ȱ umȱ versteckteȱ Gemeinsamkeitenȱ zuȱ erkennen,ȱ einenȱ Überblickȱ überȱ dieȱ Dokumenteȱ einesȱ Wissensgebietesȱ zuȱ erlangenȱ oderȱ ähnlicheȱ Informationenȱ zuȱ finden.ȱ Dieserȱ Prozessȱ erhöhtȱ dieȱ Trennschärfeȱ desȱ Suchprozessesȱ fürȱ dieȱ DokuȬ menteȱ innerhalbȱ einerȱ Kategorie.ȱ Kritischerȱ Prozessȱdieserȱ Ideeȱ istȱ dieȱ Festlegungȱ desȱ Ähnlichkeitsmaßstabes.ȱ Eineȱ einfacheȱ Möglichkeitȱ wäreȱ die,ȱ denȱ Gradȱ derȱ Übereinstimmungȱ einzelnerȱ Worteȱ zuȱ prüfen.ȱ Eineȱ Alternativeȱ beständeȱ inȱ derȱ semantischenȱ Analyseȱ derȱ Dokumente,ȱ umȱ konzeptionelleȱ Gemeinsamkeitenȱ zuȱ entdecken.ȱEinȱweitererȱAnsatzȱversucht,ȱeineȱGruppeȱvonȱWortenȱzuȱextrahieren,ȱ
20 ȱ
2.1ȱȱAutomatischeȱDokumentenerfassungȱ dieȱ inȱ kurzemȱ Abstandȱ zueinanderȱ stehen.ȱ Insgesamtȱ zeigtȱ sichȱ dieȱ Wortanalyseȱ alsȱschwierigerȱProzess.ȱ ȱ
Posteingang
ȱ ȱ
SCANNEN
ȱ
VORVERARBEITEN
TEXTERKENNUNG
KLASSIFIZIEREN
ȱ ȱ ȱ ȱ
INFORMATION EXTRAHIEREN
RESULTATE
ȱ ȱ Korrekturarbeitsplatz
ȱ ȱ
Abbildungȱ2.1:ȱ GeschäftsprozessȱmitȱKlassifikationȱundȱExtraktionȱ (Quelle:ȱHinkelmann,ȱFHȱNordwestschweiz)ȱ
Beispielȱ ȱ WelcheȱSchwierigkeitenȱauftauchenȱkönnen,ȱverdeutlichenȱdieȱfolgendenȱ Beispiele.ȱDerȱErkennungsvorgangȱkannȱsichȱaufȱdreiȱGruppenȱrichten:ȱ o o o
NamenȱvonȱPersonen,ȱOrganisationenȱoderȱOrtenȱ Abkürzungenȱ BegriffeȱwieȱDatumȱoderȱWährungseinheitȱ
Alleȱ Namen,ȱdieȱzurȱgleichenȱ Kategorieȱ gehören,ȱsollenȱalsȱ solcheȱ erȬ kanntȱ werden.ȱ Unabhängigȱ vomȱ Ausdruckȱ „Präsidentȱ Clinton“,ȱ „Mr.ȱ Clinton“ȱoderȱ„BillȱClinton“ȱmussȱstetsȱaufȱdieȱgleicheȱPersonȱverwieȬ senȱwerden.ȱNebenȱdiesemȱProblemȱexistiertȱdieȱFrageȱdesȱUmgangesȱ mitȱ zweideutigenȱ Varianten.ȱ Bedeutetȱ IRAȱ nunȱ dieȱ Abkürzungȱ fürȱ irischȬrepublikanischeȱArmeeȱoderȱderȱweiblicheȱVornamen?ȱAuchȱdieȱ UnterscheidungȱvonȱpotentiellenȱStoppwörternȱalsȱNamensbestandteilȱ bereitȱSchwierigkeiten.ȱDasȱWortȱ„und“ȱkannȱzweiȱBegriffeȱverbindenȱ (SpanienȱundȱEngland),ȱkannȱaberȱauchȱzuȱeinemȱNamenȱselbstȱgehöȬ renȱ(MinisteriumȱfürȱBildung,ȱWissenschaftȱundȱTechnologie).ȱȱ ȱ
ȱ
21
2ȱȱECMȱCaptureȬKomponenteȱ Abkürzungenȱ bereitenȱ ähnlicheȱ Problemsituationenȱ wieȱ Namen.ȱ Dieȱ Extraktionȱ sollȱ erkennen,ȱ dassȱ „EEPROM“ȱ dasȱ gleicheȱ meintȱ wieȱ „electricallyȱ erasableȱ PROM“ȱ undȱ aufȱ „electricallyȱ erasableȱ programȬ mableȱreadȬonlyȱmemory“ȱverweisen.ȱȱ DieȱumfassendsteȱKategorieȱpotentiellerȱMissverständnisseȱdürfteȱderȱ nichtȱinȱdieseȱbeidenȱKlassenȱfallendeȱTeilȱsprachlicherȱVerkürzungenȱ sein.ȱ Soȱ könnenȱ Zahlenȱ ausgeschriebenȱ werdenȱ oderȱ alsȱ Ziffernȱ erȬ scheinen.ȱ Gleichesȱ giltȱ fürȱ Datumsangabenȱ dieȱ Formenȱ wieȱ 27.3.2008,ȱ 27.ȱ Märzȱ 2008,ȱ 27ȱ Märzȱ 08ȱ oderȱ morgenȱ bzw.ȱ vorȱ einemȱ Jahrȱ annehȬ menȱkönnen.ȱAberȱauchȱWährungsangabenȱkönnenȱsehrȱunterschiedliȬ cheȱ Ausprägungenȱ annehmen:ȱ 27,00ȱ €,ȱ €ȱ 27ȱ oderȱ siebenundzwanzigȱ Euro.ȱ
2.1.4
Text-Mining
DasȱKonzeptȱdesȱTextȬMiningȱbewegtȱsichȱjenseitsȱderȱKlassifikation.ȱTextȱMiningȱ umfasstȱ eineȱ Verbindungȱ vonȱ Verfahrenȱ derȱ Sprachverarbeitungȱ mitȱ DatenbankȬȱ undȱ Informationssystemtechnologien.ȱ Esȱ entstandȱ ausȱ derȱ Beobachtung,ȱ dassȱ ca.ȱ 85%ȱ allerȱ Datenbankinhalteȱ nurȱ inȱ unstrukturierterȱ Formȱ vorliegen,ȱ soȱ dassȱ sichȱ dieȱ Technikenȱ desȱ klassischenȱ Dataȱ Miningȱ zurȱ Wissensgewinnungȱ nichtȱ anwenȬ denȱ lassen.ȱ Imȱ Gegensatzȱ zumȱ Informationȱ Retrievalȱ gehtȱ esȱ beimȱ Textȱ Miningȱ nichtȱdarum,ȱlediglichȱDokumenteȱanhandȱvonȱAnfragenȱaufzufinden,ȱsondernȱausȱ einemȱ einzelnenȱ oderȱ einemȱ Satzȱ vonȱ Dokumentenȱ neuesȱ Wissenȱ zuȱ gewinnenȱ [Witte,ȱMüller].ȱ ȱ Textȱ Miningȱ filtertȱ mitȱ statistischenȱ undȱ linguitischenȱ Methodenȱ Informationenȱ ausȱ unstrukturiertenȱ Texten,ȱ umȱ fundiertereȱ Unternehmensentscheidungenȱ zuȱ ermöglichen.ȱ
Zielȱistȱesȱfolglich,ȱeinenȱRessourcenȱsparenden,ȱschnellenȱMechanismusȱzurȱVerfüȬ gungȱ zuȱ haben,ȱ dessenȱ Qualitätȱ einerseitsȱ weitgehendȱ unabhängigȱ vomȱ Nutzerȱ undȱandrerseitsȱflexibelȱgenugȱist,ȱaufȱneueȱThemenȱzuȱreagieren.ȱȱ DreiȱKonzepteȱzurȱTextanalyseȱstehenȱzurȱAuswahlȱ[Alexander,ȱ2008,ȱS.ȱ18]:ȱ 1.
2.
22 ȱ
Mitarbeiterȱ könnenȱ Texteȱ manuellȱ erfassen,ȱ durchlesen,ȱ mitȱ Kommentarenȱ versehenȱ undȱ anschließendȱ bestimmtenȱ Kategorienȱ zuordnen.ȱ Dieserȱ Ansatzȱ istȱ sehrȱ präzise,ȱ nimmtȱ aberȱ vielȱ Zeitȱ undȱ Ressourcenȱ inȱ Anspruchȱ undȱ istȱ vorȱ diesemȱ Hintergrundȱ kaumȱ praktikabel.ȱ Einȱ zweiterȱ Wegȱ bestehtȱ inȱ einerȱ automatisiertenȱ Statistiklösung.ȱ Dabeiȱ werdenȱ oftȱ nurȱ Worthäufigkeitenȱ undȱ Ähnlichkeitenȱ zuȱ verwandtenȱ Begriffenȱ berücksichtigt.ȱ Dieȱ Mehrdeutigkeitȱ vonȱ Begriffenȱ oderȱ Verkettungenȱ gehenȱ verloren.ȱ Umȱ diesenȱ Mangelȱ zuȱ
2.1ȱȱAutomatischeȱDokumentenerfassungȱ
3.
beheben,ȱ könnenȱ Regelwerkeȱ definiertȱ werden,ȱ derenȱ Pflegeȱ sichȱ allerdingsȱ alsȱ sehrȱ aufwändigȱ gestaltet.ȱ Dazuȱ werdenȱ alleȱ relevantenȱ Wortkombinationenȱ berücksichtigt,ȱ anstattȱ sichȱ aufȱ vorabȱ definierteȱ Stichwörterȱ oderȱ Metainformationenȱ zuȱ beschränken.ȱ Weiterhinȱ wirdȱ durchȱ StoppȬȱ undȱ Startlistenȱ dasȱ Fachvokabularȱ gesteuert,ȱ Wörterȱ zuȱ Wortstämmenȱ verdichtet,ȱ Entitätenȱ wieȱ Produkteȱ oderȱ Firmennamenȱ extrahiertȱundȱsignifikanteȱWortkompositionenȱerkannt.ȱ EinȱletztesȱKonzeptȱberuhtȱausȱverfeinertenȱstatistischenȱMethodenȱwieȱ Bayesschenȱ Netzenȱ oderȱ neuronalenȱ Netzwerken.ȱ Obwohlȱ dieseȱ VerȬ fahrenȱsehrȱeffektivȱarbeiten,ȱstehenȱsieȱinȱdemȱRuf,ȱhochkomplizierteȱ „Blackȱ Boxen“ȱ zuȱ sein,ȱ fürȱ derenȱ Verständnisȱ undȱ Funktionsweiseȱ esȱ besonderenȱWissensȱbedarf.ȱ
EinȱzentralerȱAnwendungsbereichȱistȱdasȱinhaltlicheȱStrukturierenȱundȱErschließenȱ bereitsȱ vorhandenerȱ Kundenkorrespondenz.ȱ Dokumente,ȱ dieȱ aufȱ Grundȱ ihrerȱ Wortkonzepteȱalsȱähnlichȱerkanntȱwerden,ȱfasstȱdieȱLösungȱinȱGruppenȱzusammenȱ undȱbenenntȱfürȱjedeȱGruppeȱeinenȱsieȱkennzeichnendenȱBegriffȱ[SAS].ȱAufȱdieseȱ WeiseȱerschließtȱTextȬMiningȱselbständigȱneueȱThemenkomplexe.ȱȱ ȱ Beispielȱ1ȱ ȱ Einȱ Automobilherstellerȱ nutztȱ TextȬMining,ȱ umȱ KundenȬEȬMails,ȱ CallȬCenterȬAufzeichnungenȱ undȱ Werkstattberichteȱ hinsichtlichȱ Qualitätsmängelȱ seinerȱ Fahrzeugeȱ auszuwerten.ȱ Entstehtȱ dabeiȱ eineȱSammlungȱvonȱDokumentenȱmitȱunbeachtetenȱFehlerkonstelȬ lationenȱoderȱnimmtȱdieȱKlasseȱ„Schaden“ȱschnellȱanȱUmfangȱzu,ȱ deutetȱdiesȱaufȱmöglicheȱQualitätsproblemeȱhin.ȱDieȱVerknüpfungȱ derȱ Meldungenȱ mitȱ Vertriebszahlen,ȱ Ersatzteilcodierungenȱ oderȱ ZulieferdatenȱerlaubtȱdieȱgenauereȱAnalyse.ȱȱ ȱ Beispielȱ2ȱ ȱ Einȱ weiteresȱ Anwendungsgebietȱ istȱ dasȱ selbständigeȱ Zuordnenȱ neuerȱDokumenteȱinȱdefinierteȱGruppen.ȱAufȱderȱBasisȱeinerȱvorabȱ festgelegtenȱ Sortierungȱ vonȱ Textenȱ inȱ Klassenȱ lerntȱ TextȬMiningȱ einȱ Dokumentȱ demȱ „richtigen“ȱ Stapelȱ zuzuweisen.ȱ Geradeȱ fürȱ Helpdesksȱ ergibtȱ sichȱ einȱ enormesȱ Potenzial,ȱ wennȱ EȬMailsȱ vorsortiertȱ undȱ bereitsȱ mitȱ Vorschlägenȱ versehenȱ werden.ȱ Dieseȱ basierenȱ aufȱ einerȱ logischenȱ Verbindungȱ zurȱ Fehlerdatenbank,ȱ soȱ dassȱautomatischȱAntwortentwürfeȱgeneriertȱwerdenȱkönnen.ȱȱ
ȱ
ȱ
23
2ȱȱECMȱCaptureȬKomponenteȱ
2.1.5
Trend
DieȱcaptureȬKomponenteȱentwickeltȱsichȱzunehmendȱzuȱeinerȱeigenständigenȱDisȬ ziplin.ȱ Sieȱ dientȱ nichtȱ nurȱ aufȱ derȱ Erfassungsseiteȱ alsȱ Hilfsmittelȱ zurȱ Extraktionȱ unternehmenswichtigerȱInformationenȱundȱzurȱSteuerungȱvonȱGeschäftsprozessen,ȱ sondernȱauchȱdieȱArchivierungȱundȱdasȱOutputȬManagementȱbegreifenȱdieȱBedeuȬ tungȱ einerȱ gezieltenȱ Sucheȱ undȱ Ausgabe.ȱ Insbesondereȱ dieȱ verbesserteȱ ErkenȬ nungsmöglichkeitȱ anwendungsbezogenerȱ Datenfelderȱ eröffnetȱ vielfältigeȱ EinsatzȬ möglichkeiten.ȱInȱHinblickȱaufȱdieȱIntegrationȱerfolgtȱhierȱderȱersteȱautomatisierteȱ SchrittȱderȱVerarbeitungsketteȱeinesȱVorganges,ȱderȱKostenȱspart,ȱeineȱZusammenȬ arbeitȱ unterstützt,ȱ Prozesseȱ vereinfachtȱ undȱ Arbeitsabläufeȱ verbessert.ȱ Captureȱ bietetȱ dieȱ notwendigeȱ Klammer,ȱ umȱ Informationenȱ ausȱ unterschiedlichenȱ DokuȬ mententypenȱzuȱisolierenȱundȱinȱintegriertenȱAnwendungenȱzusammenȱzuȱführen.ȱ UnterȱdemȱGesichtspunktȱderȱVerringerungȱderȱKostenȱdürfteȱmitȱdieserȱTechnoȬ logieȱ einȱschnellerȱ undȱ nachhaltigerȱ Effektȱ zuȱ erzielenȱ sein.ȱ Derȱ Engpassȱ derȱmaȬ nuellenȱIndizierungȱwirdȱlangfristigȱverschwinden.ȱZunehmendȱwerdenȱautomatiȬ scheȱ KlassifizierungsȬȱ undȱ Erkennungsverfahrenȱ beimȱ Scannenȱ undȱ derȱ EȬMailȬ BearbeitungȱdieȱtraditionellenȱAbläufeȱersetzen.ȱ
2.2 EDI (Electronic Data Interchange) Dieȱ Entwicklungȱ desȱ nationalenȱ undȱ internationalenȱ Handelsȱ undȱ seineȱ zunehȬ mendeȱVerflechtungȱbedingtȱeinenȱwachsendenȱInformationsbedarfȱzwischenȱallenȱ beteiligtenȱ Partnernȱ überȱ sämtlicheȱ Handelsstufen.ȱ Dieseȱ Anforderungenȱ gehenȱ mitȱ einemȱ Bedarfȱ nachȱ beschleunigterȱ Informationsübermittlungȱ einher.ȱ EDIȱ alsȱ AblösungȱdesȱtraditionellenȱWegesȱderȱÜbertragungȱvonȱPapierdokumentenȱzwiȬ schenȱ denȱ Kommunikationspartnernȱ istȱ inzwischenȱ zuȱ einemȱ vertrautenȱ Begriffȱ derȱITȬWeltȱgeworden.ȱDieȱRationalisierungsȬȱundȱLogistikpotentiale,ȱdieȱsichȱmitȱ diesemȱVerfahrenȱrealisierenȱlassen,ȱsindȱbeeindruckend:ȱZahlenȱwieȱSenkungȱdesȱ Transaktionsaufwandsȱ umȱ 70ȱ %,ȱ Reduktionȱ derȱ Durchlaufzeitenȱ vonȱ 50ȱ %ȱ undȱ VerringerungȱderȱKapitalbindungȱumȱ30ȱ%ȱwerdenȱoftȱgenannt.ȱ EDIȱbeschreibtȱdenȱinterventionsfreienȱAustauschȱvonȱGeschäftsdatenȱfirmenȬȱundȱ branchenübergreifendȱ nachȱ internationalenȱ Standardsȱ direktȱ zwischenȱ denȱ ComȬ puternȱderȱbeteiligtenȱGeschäftspartner.ȱZielsetzungȱistȱes:ȱ – manuelleȱ Arbeitsvorgängeȱ zurȱ Erstellungȱ undȱ Weiterverarbeitungȱ vonȱ GeȬ schäftsdokumentenȱzuȱersetzen,ȱ – alsȱSenderȱundȱEmpfängerȱvonȱNachrichtenȱnichtȱmehrȱMitarbeiter,ȱsondernȱ dieȱbeteiligtenȱAnwendungsprogrammeȱanzusehen.ȱ TragfähigȱwirdȱdieseȱIdeeȱderȱautomatischenȱAbwicklungȱvonȱGeschäftsaktivitätenȱ aberȱ nur,ȱ fallsȱ bereitsȱ dieȱ Existenzȱ computergestützterȱ Außenbeziehungenȱ einesȱ Unternehmensȱ inȱ nennenswertemȱ Umfangȱ existiert.ȱ Leiderȱ trifftȱ dieseȱ Bedingungȱ
24 ȱ
2.2ȱȱEDIȱ(ElectronicȱDataȱInterchange)ȱ keineswegsȱfürȱdasȱGrosȱderȱmittlerenȱundȱkleinenȱUnternehmenȱzu.ȱInsofernȱistȱesȱ nichtȱverwunderlich,ȱdassȱEDIȱeherȱgrößerenȱBetriebenȱvorbehaltenȱist.ȱ Unabhängigȱ vonȱ ihrerȱ Größeȱ sindȱ alleȱ Unternehmenȱ überȱ verschiedeneȱ Aktionenȱ mitȱFirmenȱunterschiedlicherȱBranchenȱverbunden.ȱHierausȱergibtȱsichȱeinȱindiviȬ duellesȱ Beziehungsgeflechtȱ jedesȱ Unternehmens.ȱ Umȱ KommunikationsbeziehunȬ genȱzuȱjedemȱGeschäftspartnerȱaufzubauen,ȱhatȱeinȱUnternehmenȱdabeiȱdieȱWahl,ȱ einȱAustauschformatȱselbstȱzuȱdefinierenȱoderȱaufȱeinȱstandardisiertesȱFormatȱzuȬ rückzugreifen.ȱ DasȱfreieȱFormatȱbesitztȱdenȱVorteilȱeinerȱbeliebigenȱGestaltbarkeitȱwasȱInhaltȱundȱ Reihenfolgeȱ derȱ Datenfelderȱ angeht.ȱ Esȱ werdenȱ nurȱ dieȱ alsȱ notwendigȱ erachtetenȱ Datenȱübermittelt,ȱsoȱdassȱkeinȱZwangȱbesteht,ȱFelderȱzuȱbedienen,ȱdieȱnichtȱausȬ gewertetȱwerden.ȱInfolgedessenȱentsprechenȱdieȱübertragenenȱDatenȱdemȱtatsächȬ lichȱ gefordertenȱ Volumen.ȱ Istȱ nurȱ eineȱ Kommunikationsbeziehungȱ zuȱ verwirkliȬ chen,ȱ soȱ bedeutetȱ esȱ keinenȱ großenȱ Aufwand,ȱ einȱ individuellesȱ Programmȱ zurȱ DatenselektionȱundȱȬübertragungȱinȱdieȱbestehendeȱUmgebungȱeinzubetten.ȱ Kommuniziertȱ einȱ Unternehmenȱ aberȱ überȱ vielfältigeȱ Verbindungenȱ mitȱ seinemȱ Geschäftsumfeld,ȱhatȱdieserȱAnsatzȱzurȱFolge,ȱdassȱfürȱjedenȱPartnerȱjeȱKommuniȬ kationsrichtungȱundȱDokumententypȱeinȱFormatȱfestgelegtȱundȱumgesetztȱwerdenȱ muss.ȱ Abgesehenȱ vonȱ demȱ beträchtlichenȱ Verwaltungsaufwand,ȱ denȱ vieleȱ KomȬ munikationsverbindungenȱ unterschiedlicherȱ Artȱ mitȱ sichȱ bringen,ȱ entstehenȱ graȬ vierendeȱProbleme,ȱsobaldȱsichȱdieȱSystemanforderungenȱändern,ȱdaȱdannȱzahlreiȬ cheȱProgrammmodifikationenȱnotwendigȱwerden.ȱOhneȱeineȱNormȱfürȱdenȱDatenȬ austauschȱführenȱbilateraleȱVereinbarungenȱdazu,ȱdassȱdieȱAnzahlȱbenutzterȱForȬ mateȱgleichȱderȱȱAnzahlȱderȱPartnerȱist.ȱ ȱ Beispiel:ȱBatterieherstellerȱ ȱ Einemȱ Batteriehersteller,ȱ derȱ Zuliefererȱ derȱ Automobilindustrie,ȱ derȱ Lieferantȱ vonȱ TaschenȬȱ undȱ Radiobatterienȱ fürȱ GroßȬȱ undȱ Einzelhandelȱ undȱ derȱ Beliefererȱ individuellerȱ Kundenȱ ist,ȱ stelltȱ sichȱdieȱFrage:ȱwelcherȱKundeȱerhältȱwelcheȱRechnungȱinȱwelchemȱ Layout?ȱ
ȱ
EineȱinternationaleȱNormungȱgarantiertȱinȱdiesemȱFallȱeineȱproblemloseȱKommuȬ nikationȱ mitȱ allenȱ Partnern.ȱ Daȱ alleȱ Beteiligtenȱ mitȱ gleichenȱ Formatenȱ arbeiten,ȱ sindȱkeineȱAnpassungenȱfürȱeinzelneȱKommunikationsverbindungȱnotwendig.ȱDieȱ benötigtenȱ Elementeȱ einesȱ Dokumententypsȱ werdenȱ mitȱ entsprechendenȱ WerkȬ zeugenȱinternenȱDatenfeldernȱzugewiesen,ȱsoȱdassȱÄnderungenȱinȱderȱfirmeneigeȬ nenȱ Datenstrukturȱ nurȱ einmalȱ jeȱ Dokumententypȱ undȱ nichtȱ jeȱ Verbindungȱ nachȬ vollzogenȱ werdenȱ müssen.ȱ Auchȱ bedarfȱ esȱ keinesȱ zeitraubendenȱ AbstimmungsȬ prozessesȱ zwischenȱ einzelnenȱ Partnernȱ bezüglichȱ derȱ ȱ übermitteltenȱ Datenfelderȱ
ȱ
25
2ȱȱECMȱCaptureȬKomponenteȱ mehr,ȱdaȱderȱStandardȱeinenȱeindeutigenȱRahmenȱfürȱjedesȱDokumentȱfestschreibt.ȱ Allerdingsȱ gestattenȱ optionaleȱ Elementeȱ eineȱ gewisseȱ Flexibilität,ȱ dieȱ denȱ Vorteilȱ derȱ Verwendungȱ einesȱ fixenȱ Standardsȱ einschränkt,ȱ dochȱ dieȱ Beschränkungȱ aufȱ „Musselemente“ȱkannȱhierȱAbhilfeȱschaffen.ȱ Wannȱundȱ mitȱ welchenȱ Partnernȱ nebenȱdemȱ Formatgesichtspunktȱdieȱ Aufnahmeȱ desȱexternenȱGeschäftsverkehrsȱvorteilhaftȱist,ȱlässtȱsichȱnichtȱprinzipiellȱbeantworȬ ten.ȱZuȱoftȱbestimmenȱdieȱbestehendenȱAbhängigkeitenȱzwischenȱLieferantenȱundȱ ihrenȱ Kundenȱ dieseȱ Entscheidung.ȱ Einenȱ Indikatorȱ bildetȱ jedochȱ dasȱ zuȱ bewältiȬ gendeȱ Belegvolumen.ȱ Eineȱ kleinereȱ Zahlȱ vonȱ Unternehmenȱ zeigtȱ EinführungsbeȬ reitschaftȱ auchȱ ausȱ strategischȬinnovativenȱ Gründen,ȱ obwohlȱ dasȱ Belegvolumenȱ eherȱgeringȱist.ȱ NebenȱdemȱeigentlichenȱBelegaufkommenȱspieltȱaberȱauchȱdieȱinhaltlicheȱKompoȬ nenteȱdesȱAustauschesȱeineȱRolle,ȱdennȱGeschäftsdatenȱbeziehenȱsichȱinȱderȱRegelȱ aufȱalleȱFelderȱunternehmerischerȱAktivität.ȱVonȱNachteilȱfürȱdieȱVerbreitungȱvonȱ EDIȱ istȱ esȱ daher,ȱ dassȱ inȱ derȱ internationalenȱ Standardisierungsvarianteȱ vonȱ EDI,ȱ EDIFACT,ȱ nurȱ einȱ Bruchteilȱ wünschenswerterȱ Nachrichtenȱ genormtȱ undȱ folglichȱ dasȱ Einsatzfeldȱ vonȱ vornhereinȱ eingeschränktȱ ist.ȱ Dadurchȱ behaltenȱ nationale,ȱ bilateraleȱundȱbranchenspezifischeȱVereinbarungenȱweiterhinȱihrenȱReiz,ȱundȱUnȬ ternehmen,ȱdieȱaufȱdieserȱBasisȱarbeiten,ȱsindȱkaumȱbereit,ȱsichȱzusätzlichȱaufȱdasȱ TestfeldȱEDIȱzuȱwagen.ȱ
2.2.1
EDI-Benutzergruppen und -organisationen
DerȱEinsatzȱvonȱEDIFACTȱwirdȱinsbesondereȱvonȱdenȱDachverbändenȱderȱunterȬ schiedlichstenȱ Branchenȱ gefördert.ȱ Derȱ Arbeitskreisȱ EDIFACTȱ desȱ BHBȱ (BundesȬ verbandȱ deutscherȱ HeimwerkerȬ,ȱ BauȬȱ undȱ Gartenfachmärkte)ȱ beispielsweiseȱ beȬ reitetȱ dieȱ Verwendungȱ desȱ EANCOMȬSubsetsȱ (EDIȬTeilmengeȱ derȱ KonsumgüȬ terbranche,ȱdasȱdieȱZentraleȱfürȱKoorganisationȱinȱKölnȱverwaltet)ȱvor.ȱAberȱauchȱ dieȱ Büromöbelherstellerȱ undȱ derȱ Sanitärfachhandelȱ setzenȱ verstärktȱ aufȱ dieȱ NutȬ zungsmöglichkeitenȱ vonȱ EDIFACT.ȱ Zuȱ denȱ Nachrichtenartenȱ nebenȱ Rechnungȱ undȱ Bestellung,ȱ dieȱ fürȱ vieleȱ Unternehmenȱ attraktivȱ sind,ȱ zählenȱ derȱ ArtikelȬ stammdatenaustauschȱ (PRICAT),ȱ dieȱ Bestellbestätigungȱ (ORDRSP)ȱ undȱ dieȱ ZahȬ lungsavisenȱ(REMADV).ȱAuchȱandereȱBranchenȱpraktizierenȱEDIȱz.B.ȱdasȱBankweȬ senȱ(Swift)ȱoderȱdieȱAutomobilindustrieȱ(Odette).ȱ EDIFACTȱ stelltȱ keinenȱ einzelnenȱ Standardȱ dar,ȱ sondernȱ istȱ eineȱ Sammlungȱ vonȱ StandardsȱundȱRegeln,ȱdieȱvonȱdenȱVereintenȱNationenȱimȱsog.ȱUNTDIDȱ(Unitedȱ Nationsȱ Tradeȱ Dataȱ Interchangeȱ Directory)ȱ verwaltetȱ werden.ȱ Dieȱ Grundlageȱ fürȱ denȱ internationalen,ȱ systemunabhängigenȱ Geschäftsdatenaustauschȱ bildenȱ dieȱ EDIFACTȬSyntaxregeln,ȱ dieȱ 1988ȱ alsȱ ISOȬStandardȱ 9735ȱ (EDIFACTȱ –ȱ Applicationȱ levelȱ syntaxȱ rules)ȱ veröffentlichtȱ wurden.ȱ Gemäßȱ derȱ Kriterienȱ Brancheȱ undȱ GülȬ tigkeitsbereichȱlässtȱsichȱEDIFACTȱwieȱfolgtȱzuȱanderenȱStandardsȱpositionieren:ȱ ȱ
26 ȱ
2.2ȱȱEDIȱ(ElectronicȱDataȱInterchange)ȱ Tabelleȱ2.1:ȱEDIȱimȱVergleichȱzuȱanderenȱStandardsȱȱ ODETTE
EDIFACT
international
VDA
ANSI X.12
national
branchenabhängig
branchenunabhängig
ȱ Inȱ derȱ Vergangenheitȱ sindȱ mehrereȱ Organisationenȱ inȱ unterschiedlichenȱ WirtȬ schaftszweigenȱ gegründetȱ worden,ȱ umȱ denȱ EDIȬGedankenȱ inȱ derȱ Industrieȱ zuȱ publizieren:ȱ – ODETTEȱȱ(OrganisationȱforȱDataȱExchangeȱbyȱTeleȱTransmissionȱinȱEurope)ȱ wurdeȱAnfangȱ1984ȱinsȱLebenȱgerufenȱundȱsetztȱsichȱsowohlȱausȱHerstellernȱ alsȱauchȱausȱLieferantenȱzusammen.ȱSchwerpunktȱderȱTätigkeitȱistȱdieȱEntȬ wicklungȱ vonȱ Nachrichtenȱ fürȱ denȱ Geschäftsverkehrȱ zwischenȱ AutomobilȬ herstellernȱundȱ ihrenȱ Lieferanten.ȱ DieȱArbeitenȱ betreffenȱ denȱ gesamtenȱ euȬ ropäischenȱRaumȱundȱwerdenȱinȱfestenȱArbeitsgruppenȱdurchgeführt.ȱDerȱinȬ haltlicheȱRahmenȱgehtȱüberȱEDIȱhinausȱundȱbetrifftȱauchȱFragenȱderȱBarcodeȬ markierungȱgenormterȱContainerȱoderȱdesȱAustauschesȱtechnischerȱDaten.ȱ – CEFICȱ ȱ (Centreȱ Europeenȱ desȱFederationsȱ deȱl’Industrieȱ Chimique)ȱ vertrittȱ seitȱ 1987ȱ fünfzehnȱ Verbändeȱ derȱ chemischenȱ Industrieȱ Westeuropas.ȱ Dreiȱ Arbeitsgruppenȱ leistenȱ dieȱ praktischeȱ Arbeitȱ diesesȱ Zusammenschlusses.ȱ Eineȱ Nachrichtengruppeȱ beschäftigtȱ sichȱ mitȱ derȱ Entwicklungȱ vonȱ MitteiȬ lungenȱ fürȱ dieȱ chemischeȱ Industrieȱ inȱ denȱ Bereichenȱ Geschäftsverkehr,ȱ TransportȱundȱVerwaltung;ȱeineȱtechnischeȱArbeitsgruppeȱprüftȱdieȱbetriebȬ lichenȱ Voraussetzungenȱ fürȱ denȱ elektronischenȱ Datenaustausch,ȱ undȱ eineȱ dritteȱGruppeȱversucht,ȱdieȱgeschäftsinnovativenȱAspekteȱvonȱEDIȱzuȱidenȬ tifizieren.ȱ – EDIFICEȱȱ(EDIȬForumȱforȱCompaniesȱwithȱInterestȱinȱComputingȱandȱElectȬ ronics)ȱ wurdeȱ 1986ȱ unterȱ Beteiligungȱ europäischerȱ Elektronikkonzerneȱ geȬ gründet.ȱ Seitdemȱ arbeitetȱ EDIFICEȱ aufȱ sämtlichenȱ Stufenȱ desȱ EDIFACTȬ Boardsȱ undȱ derȱ Nachrichtenentwicklungsgruppenȱ mit.ȱ Mehrereȱ Mitgliederȱ sindȱTochterunternehmenȱgroßerȱamerikanischerȱKonzerne.ȱ – Dieȱ deutscheȱ Konsumgüterindustrie,ȱ dieȱ zunächstȱ SEDASȱ (StandardȬ regelungenȱeinheitlicherȱDatenaustauschsystemeȱ[Dedig,ȱS.ȱ35])ȱalsȱihrȱpropȬ rietäresȱInstrumentȱdesȱDatenaustauschesȱnutzte,ȱerkannteȱbereitsȱEndeȱderȱ achtzigerȱ Jahreȱ dieȱ Bedeutungȱ einesȱ einheitlichenȱ Standardsȱ undȱ forcierteȱ denȱEntwurfȱeinerȱEDIȬTeilmenge.ȱDaȱdieseȱNachrichtenȱstarkȱmitȱderȱArtiȬ kelidentifikationȱ verwobenȱ sind,ȱ wählteȱ manȱ denȱ Namenȱ EANCOM,ȱ fürȱ denȱ mittlerweileȱ 19ȱ Nachrichtenȱ existieren.ȱ Nebenȱ demȱ traditionellenȱ KonȬ sumgüterbereichȱ wirdȱ EANCOMȱ zunehmendȱ auchȱ vonȱ denȱ Baumärkten,ȱ derȱBürowirtschaft,ȱderȱKeramikȬ,ȱKosmetikȬȱundȱSanitärindustrieȱeingesetzt.
ȱ
27
2ȱȱECMȱCaptureȬKomponenteȱ
2.2.2
EDI-Nutzen
Dieȱ Vorteileȱ vonȱ EDIȱ beruhenȱ imȱ Kernȱ aufȱ beschleunigtenȱ Geschäftsprozessenȱ inȱ derȱ unternehmensübergreifendenȱ Vorgangsketteȱ undȱ sindȱ dementsprechendȱ schwerȱ zuȱ quantifizieren.ȱ Unternehmen,ȱ dieȱ sichȱ aufȱ rechenbareȱ Kalküleȱ zurückȬ ziehen,ȱ habenȱ demnachȱ großeȱ Schwierigkeiten,ȱ eineȱ ausreichendeȱ ArgumentatiȬ onsbasisȱ fürȱ denȱ Einsatzȱ vonȱ EDIȱ zuȱ finden.ȱ Weiterhinȱ wirdȱ dieȱ Zurechenbarkeitȱ vonȱ KostenȬȱ undȱ Leistungswirkungenȱ deutlichȱ dadurchȱ erschwert,ȱ dassȱ zeitlichȱ verzögerteȱoderȱräumlichȱundȱorganisatorischȱverteilteȱEffekteȱauftreten.ȱDerȱVerȬ such,ȱ dennochȱ eineȱ Klassifizierungȱ derȱ positivenȱ Effekteȱ unterȱ allgemeinemȱ undȱ betriebswirtschaftlichemȱ Blickwinkelȱ zuȱ wagen,ȱ konzentriertȱ sichȱ aufȱ folgendeȱ Aspekte:ȱ ȱ
Abbildungȱ2.2:ȱTraditionelleȱversusȱelektronischeȱAbläufeȱ Tabelleȱ2.2:ȱNutzenaspekteȱvonȱEDIȱ Aspekt allgemeiner Natur
Vorteile wirtschaftlicher, schnellerer, sicherer und korrekterer Datenaustausch elektronische Verfügbarkeit der Geschäftsdaten Verringerung der Eingabe- und Übertragungsfehler
Betriebswirtschaftlicher Natur
bessere und eindeutigere Lieferinformation Senkung der Fehler- und Fehlmengenkosten Einsparung von Gemeinkosten im Verwaltungsablauf Senkung der Kapitalkosten bei Kreditoren/Debitoren Reduktion der Logistikkosten entlang der gesamten Prozesskette Reduktion der Porto- und Papierkosten
28 ȱ
2.2ȱȱEDIȱ(ElectronicȱDataȱInterchange)ȱ Aspekt
Vorteile
Produktivitätsanstieg durch
Verminderung der Papierflut Reduzierung des Management-/Verwaltungsaufwandes Vermeidung wiederholter Datenerfassung Verringerung der Eingabefehler Bestelldatenübernahme in die DV-Anwendung
Erhöhung der Logistikleistung durch
Anbindung an Just-in-Time-Konzepte Verminderung der Lagerbestände, Reduktion von Lagerflächen geringere Kapitalbindung kürzere Beschaffungszeiten, kleinere Bestellmengen, schnellere Bestellübermittlung Reduzierung des Warenbeschaffungsrisikos
normbedingter Natur
weltweit eindeutig soft- und hardwareneutral
DiesenȱVorteilenȱstehenȱaberȱdurchausȱinnerbetrieblicheȱProblemeȱgegenüber,ȱdieȱ nichtȱzuȱunterschätzenȱsind.ȱEDIȱbedeutetȱnämlichȱnichtȱnurȱdieȱInstallationȱeinesȱ neuenȱ Kommunikationsmechanismus,ȱ sondernȱ schafftȱ eineȱ neueȱ Qualitätȱ inȱ derȱ internenȱundȱexternenȱAufgabenabwicklung,ȱdieȱzuȱunterschiedlichȱstarkenȱorgaȬ nisatorischenȱAnpassungenȱführt.ȱDieȱdirekteȱIntegrationȱbetrieblicherȱAnwendunȬ genȱ substituiertȱ Funktionen,ȱ dieȱ beiȱ herkömmlicherȱ Geschäftsabwicklungȱ aufȱ PaȬ pierbasisȱmitȱderȱmanuellenȱWeiterleitungȱundȱVerarbeitungȱderȱDatenȱbeschäftigtȱ waren.ȱ Funktionenȱ desȱ Posteingangs,ȱ derȱ Sichtungȱ undȱ Verteilungȱ undȱ derȱ maȬ nuellenȱDokumentbearbeitungȱwerdenȱschlagartigȱüberflüssig.ȱDemȱstehtȱgegenüȬ ber,ȱ dassȱ durchȱ überbetrieblicheȱ Prozesskettenȱ mitȱ einerȱ engenȱ Verzahnungȱ derȱ zusammenhängendenȱFunktionen,ȱbilateraleȱAbsprachenȱüberȱInhalt,ȱDatenfelder,ȱ Formate,ȱ Bereinigungȱ vonȱ Fehlersituationen,ȱ effektiveȱ Betriebsstundenȱ undȱ vielesȱ mehrȱ zuȱ führenȱ sind,ȱ dieȱ imȱ Einzelfallȱ fachlichesȱ KnowȬHowȱ erfordern.ȱ Dasȱ zuȬ sätzlicheȱ KnowȬHowȱ undȱ dieȱ fürȱ dessenȱ Erwerbȱ erforderlichenȱ Kostenȱ stellenȱ eiȬ nenȱ vonȱ denȱ Unternehmenȱ alsȱ nichtȱ geringȱ erachtetenȱ Hemmschuhȱ fürȱ eineȱ weitȱ reichendeȱEDIȬUmsetzungȱdar.ȱ
2.2.3
EDI-Beispiel
Trotzȱ einesȱ verhaltenenȱ Bekanntheitsgradesȱ imȱ kleinȬȱ undȱ mittelständischenȱ BeȬ reich,ȱ wirdȱ EDIȱ inȱ vielenȱ kommerziellenȱ Anwendungenȱ mitȱ zentralerȱ Bedeutungȱ verwendet.ȱDieȱKommunikationȱbeiȱdenȱvonȱderȱBundesnetzagenturȱfürȱdenȱEnerȬ giemarktȱ definiertenȱ Marktprozessenȱ wirdȱ durchgängigȱ überȱ EDIFACTȱ realisiert.ȱ Dabeiȱ kommenȱ sechsȱ Nachrichtentypenȱ zumȱ Einsatz.ȱ Fürȱ dieȱ NetznutzungsabȬ rechnungȱwerdenȱdieȱNachrichtentypenȱINVOICȱzurȱStellungȱderȱNetznutzungsȬ abrechnungȱ undȱ REMADVȱ zurȱ Bestätigungȱ bzw.ȱ Ablehnungȱ derȱ offenenȱ FordeȬ rungȱ verwendet.ȱ Beideȱ Nachrichtentypenȱ werdenȱ inȱ derȱ Versionȱ D.99Aȱ genutzt.ȱ Darüberȱhinausȱwirdȱvorgeschlagen,ȱbeiȱjedemȱEmpfangȱeinesȱDokumentesȱdessenȱ
ȱ
29
2ȱȱECMȱCaptureȬKomponenteȱ Syntaxȱ undȱ Inhaltȱ zuȱ prüfenȱ undȱ demȱ Absenderȱ umgehendȱ eineȱ CONTRLȬȱ undȱ APERAKȬNachrichtȱzurückzuschicken.ȱȱ GroßeȱEnergieversorgerȱstellenȱseitȱderȱLiberalisierungȱganzeȱAbteilungenȱdazuȱab,ȱ Netznutzungsabrechnungenȱeinzuscannenȱundȱzuȱverarbeiten.ȱUmȱdiesenȱundȱalleȱ weiterenȱ unternehmensübergreifendenȱ Kommunikationsprozesseȱ branchenweitȱ schlankerȱzuȱgestalten,ȱsteckteȱdieȱBundesnetzagenturȱmitȱihremȱBeschlussentwurfȱ fürȱ dieȱ GPKEȱ (Geschäftsprozesseȱ zurȱ Kundenbelieferungȱ mitȱ Elektrizität)ȱ klareȱ VorgabenȱfürȱdieȱelektronischeȱKommunikationȱmitȱdenȱNachrichtenformatenȱdesȱ internationalenȱ Standardsȱ UN/EDIFACTȱ ab.ȱ Dieserȱ Kommunikationswegȱ sollȱ fürȱ dieȱzwischenbetrieblichenȱKommunikationsprozesseȱinȱZukunftȱobligatorischȱundȱ soȱ weitȱ alsȱ möglichȱ automatisiertȱ werden.ȱ Mitȱ derȱ Anlageȱ desȱ Beschlussesȱ veröfȬ fentlichteȱ dieȱ Bundesnetzagenturȱ nebenȱ einerȱ Reiheȱ weitererȱ Standardprozesse,ȱ einenȱ vorgeschriebenenȱ Prozessentwurfȱ fürȱ dieȱ Netznutzungsabrechnung.ȱ Dieȱ NachrichtenartȱMSCONS,ȱdieȱfürȱdenȱAustauschȱderȱtechnischenȱDatenȱwieȱLastȬ gängenȱ undȱ Zählständenȱ sorgen,ȱ gehörtȱ logischȱ gesehenȱ zwarȱ nichtȱ zumȱ Prozessȱ derȱ Netznutzungsabrechnung,ȱ istȱ ihmȱ aberȱ grundsätzlichȱ durchȱ denȱ Prozessȱ „Zählwertübermittlung“ȱvorangestellt.ȱ DieȱzentraleȱAnforderungȱanȱdieȱITȬSystemeȱinnerhalbȱdiesesȱProzessesȱistȱalsoȱdieȱ Fähigkeit,ȱ dieȱ verwendendenȱ Nachrichtentypenȱ abzubildenȱ undȱ eineȱ KonvertieȬ rungȱderȱhausinternenȱFormateȱausȱdenȱAbrechnungssystemenȱaufȱdenȱEDIFACTȬ Standardȱ durchzuführen.ȱ Fürȱ eingehendeȱ Nachrichtenȱ mussȱ entsprechendȱ dieȱ UmwandlungȱvomȱEDIFACTȱinȱdasȱinterneȱFormatȱvorgenommenȱwerdenȱkönnen.ȱ Tabelleȱ2.3:ȱNachrichtentypenȱfürȱdieȱNetznutzungsabrechnungȱ
ȱ
Anwendungsgebiet
Nachrichtentyp
Version
Übermittelte Inhalte
ȱ
Technisch
UTILMD
D.02B
Stammdaten zu Kunden, Verträgen und Zählpunkten
ȱ
MSCONS
D.99A
Lieferungs-, Erzeugungs- und Verbauchs-Zählwerte
ȱ
INVOIC
D.99A
Abrechnung von Netz- und Energiedienstleistungen
ȱ
REMADV
D.99A
Zahlungsavise (Bestätigung oder Ablehnung der offenen Posten)
CONTRL
D.99A
Syntax- und Übertragungsprotokollnachrichten
APERAK
D.99A
Anwendungsfehler- und Bestätigungsmeldungen
ȱ
REQDOC
D.99A
Dokumentenanforderungen
ȱ
Abrechnung
Qualitätssicherung
30 ȱ
ȱ ȱ ȱ ȱ ȱ ȱ
2.2ȱȱEDIȱ(ElectronicȱDataȱInterchange)ȱ
2.2.4
EDI-Syntax
Eineȱ EDIFACTȱ Geschäftstransaktionȱ istȱ imȱ Wesentlichenȱ eineȱ Textdateiȱ mitȱ einerȱ festgelegtenȱ Strukturȱ undȱ Syntaxȱ fürȱ dieȱ darinȱ übermitteltenȱ Daten.ȱ Überdiesȱ istȱ dieȱSyntaxȱweltweitȱeinheitlich.ȱSieȱhatȱdieȱAufgabe,ȱjedesȱFeldȱundȱalleȱEinzelheiȬ tenȱ derȱ Inhalteȱ soȱ darzustellen,ȱ dassȱ alleȱ Systeme,ȱ überȱ welcheȱ mittelsȱ UN/EDIFACTȱelektronischenȱDatenaustauschȱbetriebenȱwird,ȱstetsȱexaktȱdasȱGleiȬ cheȱverstehen.ȱ Wieȱ istȱ nunȱ eineȱ EDIȬDateiȱ alsȱ dieȱ eigentlicheȱ Basisȱ desȱ Datenaustauschesȱ aufgeȬ bautȱundȱausȱwelchenȱEinzelelementenȱsetztȱsieȱsichȱzusammen?ȱEDIȱzeichnetȱsichȱ gegenüberȱ denȱ historischenȱ Formatenȱ wieȱ VDAȱ undȱ SEDASȱ durchȱ variableȱ SatzȬ längenȱundȱFormateȱaus.ȱAlsȱFolgeȱdieserȱflexiblenȱStrukturȱistȱesȱnichtȱmehrȱnotȬ wendig,ȱnichtȱverwendeteȱFelderȱleerȱzuȱübertragen.ȱDesȱWeiterenȱkannȱdurchȱdenȱ VerzichtȱaufȱfesteȱSatzvorgabenȱdasȱÜbertragungsvolumenȱstarkȱreduziertȱwerden,ȱ wasȱsichȱpositivȱaufȱdieȱÜbertragungskostenȱauswirkt.ȱȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ Abbildungȱ2.3:ȱEDIȬStrukturelementeȱ
DerȱEinsatzȱvonȱEDIȱsetztȱdieȱVerständigungȱaufȱeinenȱZeichensatz,ȱeineȱeinheitliȬ cheȱ Darstellungȱ inȱ Formȱ vonȱ Datenelementen,ȱ eineȱ Strukturierungȱ derȱ NachrichȬ teninhalteȱ durchȱ einȱ Nachrichtenaufbaudiagrammȱ undȱ dieȱ Existenzȱ einerȱ NetzȬ werkanbindungȱ alsȱ Transportmediumȱ derȱ Nachrichtȱ voraus.ȱ Dieȱ Datenelementeȱ sindȱinȱEDIFACTȱDirectoriesȱenthalten,ȱdieȱinternationalȱvonȱderȱUN/ECEȱundȱinȱ DeutschlandȱvonȱderȱDINȱveröffentlichtȱwerden.ȱSieȱumfassenȱdieȱDefinitionȱundȱ BeschreibungȱallerȱeinzelnenȱSyntaxelementeȱ[NA,ȱS.ȱ7ȱff].ȱȱ
ȱ
31
2ȱȱECMȱCaptureȬKomponenteȱ
ȱ
– VerwendeteȱZeichensätze:ȱZurȱDarstellungȱderȱNachrichteninhalteȱwerdenȱ mehrereȱTypenȱvonȱZeichensätzenȱverwendet:ȱ o TypȱAȱenthältȱausschließlichȱdruckbareȱZeichen.ȱ o Typȱ Bȱumfasstȱ alleȱ zulässigenȱ Zeichenȱdesȱ7ȬBitȱundȱ ȱ8ȬBitȬCodesȱ undȱ definiertȱ nebenȱ denȱ allgemeinȱ üblichenȱ Druckzeichenȱ damitȱ auchȱSteuerȬȱundȱTrennsymbole.ȱ o TypȱC,ȱD,ȱEȱundȱFȱȱkönnenȱfürȱnationaleȱZeichensätzeȱgenutztȱwerȬ den.ȱ – Qualifier:ȱ Sieȱ legenȱ aufgrundȱ ihresȱ Inhaltesȱ nachfolgendeȱ oderȱ vorausgeȬ hendeȱ Elementeȱ bisȱ zuȱ gesamtenȱ Segmentenȱ fest.ȱ Aufȱ dieseȱ Weiseȱ könnenȱ gleicheȱSegmenteȱmitȱunterschiedlichenȱQualifiernȱversehen,ȱmehrmalsȱvorȬ kommen.ȱ – Datenelement:ȱ Hierbeiȱ handeltȱ esȱ sichȱ umȱ denȱ Basisbausteinȱ einerȱ NachȬ richt,ȱmitȱfolgendenȱEigenschaften:ȱ o Erȱ bildetȱ dieȱ kleinsteȱ Informationseinheit:ȱ Bestellnummerȱ oderȱ Preisȱ|ȱDatenfeldȱeinerȱBildschirmmaske.ȱ o Erȱ stehtȱ inȱ denȱ übergeordnetenȱ Strukturenȱ stetsȱ anȱ derȱ gleichenȱ Stelle.ȱSeineȱIdentifikationȱgeschiehtȱalsoȱanhandȱderȱPositionȱ – Datenelementgruppe:ȱ Dieȱ Datenelementgruppeȱ istȱ eineȱ Zusammenfassungȱ vonȱDatenelementenȱmitȱInformationen,ȱdieȱinȱeinemȱlogischenȱZusammenȬ hangȱ stehen.ȱ Auchȱ hierȱ istȱ dieȱ Positionȱ innerhalbȱ einesȱ Segmentesȱ identifiȬ zierend.ȱȱ – Segment:ȱSegmenteȱfassenȱlogischȱzusammenhängendeȱDatenelementeȱoderȱ Datenelementgruppen,ȱ z.B.ȱ Adresseȱ oderȱ Bankverbindungȱ zusammenȱ undȱ zeichnenȱsichȱdurchȱfolgendeȱMerkmaleȱaus:ȱ o Dieȱ Identifikationȱ erfolgtȱdurchȱ einenȱ Segmentbezeichnerȱ =ȱ KomȬ binationȱausȱdreiȱBuchstaben.ȱ o Dieȱ Reihenfolgeȱ desȱ Auftretensȱ einzelnerȱ Segmenteȱ istȱ imȱ NachȬ richtenaufbaudiagrammȱfestgelegt.ȱ o EsȱexistierenȱzweiȱSegmentarten:ȱ Nutzdatensegment:ȱInformationenȱbezüglichȱdesȱGeschäftsȬ vorgangesȱ Servicesegment:ȱIdentifikationȱ undȱ Strukturierungȱ derȱ ausȬ zutauschendenȱDatenȱ o DerȱSegmentstatusȱkannȱmussȱoderȱoptionalȱsein.ȱDarausȱergebenȱ sichȱ dieȱ Definitionsmöglichkeitȱ vielerȱ speziellerȱ Nachrichtenȱ undȱ dieȱVielfaltȱderȱEDIȬTeilmengen.ȱ o Segmentwiederholungenȱ sindȱ zulässig.ȱ Grundsätzlichȱ bestehtȱ dieȱ Möglichkeit,ȱeinzelneȱSegmenteȱbisȱzuȱeinerȱHöchstgrenzeȱzuȱwieȬ derholen,ȱ z.B.ȱ Lieferpositionen.ȱ Segmenteȱ könnenȱ auchȱ geschachȬ teltȱwerdenȱ(nestedȱloops).ȱ
ȱ
32 ȱ
2.2ȱȱEDIȱ(ElectronicȱDataȱInterchange)ȱ Beispiel: geschachtelte Segmente
ȱ
Segmentgruppeȱ1ȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱkannȱ5ȱ
ȱ
ȱȱȱȱȱȱȱSegmentȱAȱȱȱȱȱȱȱȱȱȱȱȱȱmussȱ1ȱ
ȱ
ȱȱȱȱȱȱȱSegmentȱBȱȱȱȱȱȱȱȱȱȱȱȱȱkannȱ5ȱ
ȱ
ȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱmussȱ5ȱ
ȱ
ȱȱȱȱȱȱȱSegmentgruppeȱ2ȱ
ȱ
ȱȱȱȱȱȱȱSegmentȱCȱȱȱȱȱȱȱȱȱȱȱȱmussȱ1ȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱ
ȱ
ȱȱȱȱȱȱȱSegmentȱDȱȱȱȱȱȱȱȱȱȱȱȱkannȱ8ȱȱȱ Segmentgruppeȱ 2ȱ istȱ inȱ Segmentgruppeȱ 1ȱ eingebettet.ȱ Segmentgruppeȱ 1ȱ mussȱmindestensȱeinmalȱundȱdarfȱmaximalȱfünfmalȱauftreten.ȱSegmentȱAȱ mussȱ beiȱ jedemȱ Auftretenȱ derȱ Segmentgruppeȱ 1ȱ vorkommen,ȱ Segmentȱ Bȱ kannȱbisȱzuȱfünfmalȱdarinȱenthaltenȱseinȱ
ȱ
– Nachricht:ȱ Eineȱ Zusammenfassungȱ allerȱ Segmente,ȱ dieȱ zurȱ Darstellungȱ eiȬ nesȱGeschäftsvorgangsȱgehören,ȱbildetȱeineȱEDIȬNachricht.ȱ o DieȱIdentifikationȱeinerȱNachrichtȱerfolgtȱdurchȱUNHȱ=ȱKopfȬȱundȱ UNTȱ=ȱEndesegment.ȱ o DieȱNachrichtenstrukturȱ istȱ imȱNachrichtenaufbaudiagrammȱfestȬ gelegt.ȱ – Nachrichtengruppe:ȱ Dieȱ Zusammenfassungȱ gleicherȱ Nachrichtenartenȱ fürȱ denȱgleichenȱEmpfängerȱführtȱzuȱeinerȱNachrichtengruppe.ȱ o Dieȱ Identifikationȱ erfolgtȱ durchȱ UNGȱ =ȱ KopfȬȱ undȱ UNEȱ =ȱ EndeȬ segment.ȱ o Zurȱ Identifikationȱ einerȱ Nachrichtȱ inȱ einerȱ Nachrichtengruppeȱ dientȱ eineȱ Referenznummer,ȱ soȱ dassȱ dieȱ Reihenfolgeȱ einzelnerȱ Nachrichtenȱbeliebigȱseinȱkann.ȱ – Übertragungsdatei:ȱSieȱbildetȱdieȱZusammenfassungȱvonȱNachrichtenȱoderȱ NachrichtengruppenȱeinesȱAbsendersȱfürȱeinenȱEmpfängerȱȱ o Dieȱ Identifikationȱ erfolgtȱ durchȱ UNBȱ =ȱ KopfȬȱ undȱ UNZȱ =ȱ EndeȬ segment.ȱ o Dieȱ Identifikationȱ einerȱ Nachrichtȱ inȱ einerȱ Übertragungsdateiȱ geȬ schiehtȱdurchȱAbsenderȬȱundȱEmpfängerangaben.ȱDieȱReihenfolgeȱ istȱdemgemäßȱbeliebig.ȱ
ȱ
ȱ
33
2ȱȱECMȱCaptureȬKomponenteȱ
ȱ
– Trennzeichen:ȱSieȱbietenȱdieȱMöglichkeit,ȱnurȱdenȱbedeutungstragendenȱInȬ haltȱvonȱNachrichtenȱzuȱübertragen.ȱFolgendeȱDefinitionenȱsindȱüblich:ȱ o +ȱ fürȱ Segmentbezeichnerȱ undȱ folgendeȱ Datenelementeȱ sowieȱ DaȬ tenelementeȱuntereinanderȱ o :ȱfürȱDatenelementeȱinȱeinerȱDatenelementgruppeȱ o ‘ȱalsȱSegmentendezeichenȱ
ȱ ȱ ȱ
Verbindungsaufbau
bestehende Verbindung
Übertragungsdatei
Übertragungsdatei
Verbindungsabbau
ȱ ȱ ȱ
Übertragungsdatei
ȱ ȱ
UNA
‘
UNB
ȱ
Nachrichtengruppe
oder einzelne Nachrichten
UNZ
‘
UNE
‘
UNT
‘
ȱ ȱ ȱ
UNG
‘
Nachricht
UNH
‘
Segment
Nachricht
Nachricht
ȱ ȱ ȱ
Segment
Segment
ȱ ȱ ȱ
Segm.Bezeichner
+
einfaches Datenelement
:
Zähler
+
Datenelementgruppe
‘
ȱ ȱ
Kennung
GD
ȱ ȱ ȱ
b e d e u te t a lt e r n a t iv z u m
34 ȱ
GD
Wert
G D = G r u p p e n d a t e n e le m e n t
Abbildungȱ2.4:ȱStrukturȱeinerȱEDIȬÜbertragungsdateiȱ
ȱ
:
Wert
Wert
2.2ȱȱEDIȱ(ElectronicȱDataȱInterchange)ȱ – Verkürzungȱ einerȱ Übertragungsdatei:ȱ Inȱ einerȱ Nachrichtȱ nichtȱ benötigteȱ Datenelementeȱ undȱ Segmenteȱ könnenȱ ausgelassenȱ werden,ȱ sofernȱ esȱ sichȱ umȱ KANNȬElementeȱ handelt,ȱ daȱ vieleȱ Anwendungenȱ nichtȱ alleȱ imȱ NachȬ richtenaufbaudiagrammȱ festgelegtenȱ Strukturenȱ auswerten.ȱ Derȱ Verzichtȱ aufȱ syntaktischeȱ Elementeȱ wirdȱ durchȱ Trennzeichenȱ angezeigt,ȱ wobeiȱ alleȱ inhaltslosenȱ Datenelementeȱ amȱ Endeȱ einesȱ Segmentesȱ lediglichȱ durchȱ einȱ einzelnesȱTrennzeichenȱsymbolisiertȱwerden.ȱȱ – Prinzipienȱ desȱ Nachrichtenaufbaus:ȱ Jedeȱ Nachrichtȱ wirdȱ durchȱ einȱ NachȬ richtenaufbaudiagrammȱdefiniertȱmitȱfolgendenȱAnforderungen:ȱ o MussȬElementeȱstehenȱstetsȱamȱSegmentanfang.ȱ o Segmenttypenȱ solltenȱ möglichstȱ inȱ unterschiedlichenȱ NachrichȬ tentypenȱwiederȱverwendetȱwerdenȱ ȱ ȱȱȱȱȱȱȱSyntaxȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱFestlegungȱinternationalerȱRegelnȱfürȱdieȱ ȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱGestaltungȱvonȱNachrichtenȱ ȱ ȱȱȱȱȱDatenelementeȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱBasisbausteineȱderȱNachrichtenȱ ȱ ȱ ȱȱȱȱȱȱSegmenteȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱlogischeȱDatensätzeȱ ȱ ȱ ȱȱȱȱȱȱNachrichtenȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱDarstellungȱsämtlicherȱInformationenȱȱ ȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱfürȱeinenȱGeschäftsvorgangȱ ȱ Abbildungȱ2.5:ȱBereicheȱvonȱEDIȬNormenȱ
– Subsets:ȱAufgrundȱderȱKomplexitätȱbranchenübergreifenderȱStandardnachȬ richtenȱundȱdenȱdamitȱverbundenenȱIntegrationsproblemenȱentschiedenȱsichȱ vieleȱ Anwendergruppenȱ inȱ derȱ Vergangenheitȱ fürȱ eineȱ Reduzierungȱ derȱ Nachrichtentypenvielfaltȱ aufȱ denȱ inȱ ihrerȱ Brancheȱ notwendigenȱ Umfang.ȱ Dieseȱ branchenspezifischenȱ Untermengenȱ derȱ ursprünglichenȱ NachrichtenȬ typenȱ bildenȱ dieȱ sog.ȱ Subsets.ȱ Einȱ Subsetȱ einesȱ EDIȬNachrichtentypesȱ stelltȱ alsoȱeineȱNachrichtȱdar,ȱdieȱdirektȱvonȱderȱzugehörigenȱNormȱabgeleitetȱistȱ undȱdieselbenȱFunktionenȱwieȱdasȱOriginalȱerfüllt:ȱ o Alleȱ MussȬDatenelementeȱ oderȱ ȬSegmenteȱ sindȱ enthalten.ȱ Esȱ darfȱ keineȱ Änderungenȱ desȱ Statusȱ oderȱ desȱ Aufbausȱ innerhalbȱ derȱ Nachrichtȱgeben.ȱ
ȱ
35
2ȱȱECMȱCaptureȬKomponenteȱ o o o
SegmenteȱoderȱDatenelementeȱdürfenȱnichtȱneuȱeingefügtȱwerden.ȱ Derȱ Nachrichtentyp,ȱ dieȱ verwaltendeȱ Organisation,ȱ dieȱ Versionȱ undȱdieȱFreigabenummerȱbleibenȱunverändert.ȱ DieȱWiederholbarkeitȱeinzelnerȱElementeȱkannȱdasȱdefinierteȱMaȬ ximumȱunterschreiten,ȱaberȱniemalsȱüberschreiten.ȱ
MitȱderȱDefinitionȱvonȱEDIFACTȬSubsetsȱergebenȱsichȱwiederumȱKompatibilitätsȬ probleme,ȱdaȱnichtȱsichergestelltȱist,ȱdassȱjederȱKommunikationspartnerȱdieselbenȱ Teilmengenȱ desȱ Gesamtstandardsȱ benutztȱ und/oderȱ inȱ seinenȱ AnwendungsprogȬ rammenȱimplementiertȱhat.ȱ ȱ ȱ
Beispiel:ȱEDIȬNachrichtȱINVOICȱ
EDIFACTȬNachricht:ȱRechnungȱ=ȱINVOICEȱ FirmaȱMeyerȱKGȱ ElektronischeȱBauteileȱ Edistrasseȱ 24943ȱFlensburgȱ Herrnȱ HansȱMusterȱ Fördestr.ȱ12ȱ 24943ȱFlensburgȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱ17.11.2008ȱ ȱ RechnungȱNr.ȱ12Ȭ333/07ȱ ArtikelȬ BezeichȬ nummerȱ nungȱ
Stück
Preis
Betrag
123Ȭ1071ȱ
Transistor
20
0.50
10.00
137Ȭ3533ȱ
Transistor
10
6.40
64.00
188Ȭ7400ȱ
ICȱTTL
50ȱ
0.90
45.00
ȱ PortoȱundȱVerpackungȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱ€ȱȱȱȱȱ6.50ȱ Gesamtsummeȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱ€ȱȱ125.50ȱ Zahlbarȱ30ȱTageȱnettoȱaufȱKtoȬNr.ȱ80Ȭ11111Ȭ7ȱ beiȱderȱVolksbankȱFlensburgȱ Achtung: Betriebsferien vom 9.6 - 21.6.2009 ȱ ȱ
36 ȱ
2.2ȱȱEDIȱ(ElectronicȱDataȱInterchange)ȱ UNA:+.?’ȱ UNB+UNOA:1+126401+126891+991117:1436+REF700’ȱ UNH+INV001+INVOIC:1++1’ȱ BGM+380+12Ȭ333/97+20081117’ȱ REF+94003ȬT001:PO+004:20071009’ȱ NAD+BY+126891++HANSȱMUSTER+ȱFÖRDESTR.12+FLENSBURG+24943’ȱ NAD+SE+126401++FIRMAȱMEIERȱKG+EDISTRASSE+FLENSBURG+24943’ȱ UNS+D’ȱ LIN++123Ȭ1071+20:21:PC+0.5:CA:1+20+10’ȱ LIN++137Ȭ3533+10:21:PC+6.4:CA:1+10+64’ȱ LIN++188Ȭ7400+50:21:PC+0.9:CA:1+50+45’ȱ LIN++999Ȭ9901++++6.5’ȱ UNS+S’ȱ TMA+125.5ȱ UNT+13+INV001’ȱ UNZ+1+REF700’ȱ
Segmentbezeichner
Erläuterung
muss/kann-Segment
UNA
Segment für Trennzeichenvorgabe
k
UNB
Nutzdatenkopfsegment
m
UNH
Nachrichtenkopfsegment
m
BGM
Nachrichtenbeginn
m
REF
Referenzangaben
k
NAD
Name und Anschrift
k
TRI
Steuerangaben
k
PAT
Zahlungsbedingungen
k
UNS
Abschnittskontrollsegment
m
LIN
Positionsdaten
m
UNS
Abschnittskontrollsegment
m
TMA
Endsumme
m
UNT
Nachrichtenendesegment
m
UNZ
Nutzdatenendesegment
m
ȱ
ȱ
37
2ȱȱECMȱCaptureȬKomponenteȱ DieȱeinzelnenȱSegmenteȱbesitzenȱfolgendeȱBedeutung:ȱ – UNA:ȱSegmentȱzurȱDefinitionȱderȱTrennzeichensätzeȱ – UNB:ȱ Enthältȱ Angabenȱ überȱ denȱ verwendetenȱ Standardȱ undȱ dieȱ Versionȱ (UNOA:ȱ 1),ȱ EDIFACTȬspezifischeȱ AbsenderȬȱ undȱ Empfängeradressenȱ (126402,ȱ 126981),ȱ Erstellungsdatumȱ derȱ Dateiȱ undȱ eineȱ ReferenzȬNr.ȱ (REF700).ȱ – UNH:ȱMarkiertȱdenȱNachrichtenstartȱundȱbenutztȱeineȱNachrichtenreferenzȬ nummerȱdesȱAbsendersȱ(INV001)ȱundȱdenȱNachrichtentypenȱ(INVOIC).ȱ – BGM:ȱ Enthältȱ denȱ Codeȱ fürȱ eineȱ kommerzielleȱ Rechnungȱ (380),ȱ dieȱ RechȬ nungsnummerȱundȱdasȱRechnungsdatumȱ – REF:ȱ Enthältȱ Verweiseȱ aufȱ andereȱ Dokumente,ȱ dieȱ einenȱ Bezugȱ zuȱ dieserȱ Rechnungȱhaben,ȱz.B.ȱdieȱauslösendeȱBestellungȱ – NAD:ȱ Nameȱ undȱ Adresseȱ desȱ Absendersȱ (BY=Buyer)ȱ undȱ desȱ Empfängersȱ (SE=Seller),ȱderenȱEDIȬspezifischeȱNummerȱmitȱderenȱHerkunftȱ(91=Vergabeȱ vomȱVerkäufer,ȱ92=VergabeȱdurchȱdenȱKäufer)ȱ – UNS+D:ȱMarkiertȱdenȱAnfangȱderȱAufzählungȱderȱRechnungspositionenȱ – LIN:ȱ Rechnungspositionenȱ mitȱ Artikelnummer,ȱ Bestellmengeȱ (20,ȱ PC=Maßeinheitȱ istȱ Stückzahl),ȱPreisȱ(0.50;ȱ CA=gemäßȱ Katalog;ȱ1=Größeȱ derȱ Preiseinheit),ȱAnzahlȱundȱGesamtpreisȱderȱPositionȱ – UNS+S:ȱMarkiertȱdasȱEndeȱderȱRechnungspositionenȱ – TMA:ȱGesamtbetragȱderȱRechnungȱ – UNT:ȱ Endesegmentȱ derȱ Nachrichtȱ mitȱ Nachrichtenidentifikationȱ (INV001)ȱ undȱGesamtzahlȱderȱSegmenteȱ(13)ȱ – UNZ:ȱEndesegmentȱderȱÜbertragungsdateiȱmitȱReferenznummerȱ(REF700).ȱȱ Beispielȱ–ȱBundesnetzagenturȱȬȱInvoice3ȱ FürȱeineȱeinheitlicheȱPositionsbeschreibungȱstelltȱderȱVerbandȱdeutscherȱ Energiewirtschaftȱ VDEWȱ eineȱ Artikelnummernlisteȱ zurȱ Verfügung,ȱ dieȱ anstelleȱ einerȱ Textbeschreibungȱ verwendetȱ werdenȱ sollte.ȱ Daranȱ knüpftȱ sichȱ eineȱ Informationȱ überȱ dieȱ Artȱ derȱ codiertenȱ Leistungsnummer,ȱ inȱ diesemȱFallȱhandeltȱesȱsichȱumȱdieȱ„InternationalȱArticleȱNumberingȱAsȬ sociationȱ(EAN)“ȱundȱzumȱSchlussȱdieȱverantwortlicheȱStelleȱfürȱdieȱCoȬ depflegeȱ(293ȱstehtȱfürȱdenȱVDEW).ȱ LIN+3++4044038000256:EN::293'
DasȱnächsteȱSegmentȱQTYȱmachtȱeineȱAussageȱüberȱdieȱMengeȱderȱPosiȬ tion.ȱ Dieȱ Codenummerȱ 47ȱ stehtȱ fürȱ eineȱ berechneteȱ Menge,ȱ dannȱ folgtȱ ȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱ 3
ȱ
Vgl.ȱBoeck,ȱD.:ȱKonzeptionȱundȱUmsetzungȱdigitalerȱRechnungsstellungsprozesseȱimȱEnergiemarktȱ mitȱHilfeȱvonȱEDIFACTȱamȱBeispielȱderȱStadtwerkeȱFlensburgȱGmbH,ȱDiplomarbeit,ȱ2007ȱ
38 ȱ
2.2ȱȱEDIȱ(ElectronicȱDataȱInterchange)ȱ dieȱ Mengeȱ selbstȱ (25)ȱ gefolgtȱ vonȱ einerȱ Maßeinheitȱ (KWH).ȱ Beiȱ dieserȱ Positionȱhandeltȱesȱsichȱalsoȱumȱ25ȱKilowattstunden.
ȱ QTY+47:25:KWH'
ȱ Dieȱ folgendenȱ DTMȬSegmenteȱ sindȱ fürȱ dieȱ Angabeȱ einesȱ Zeitraumesȱ vorgesehen.ȱ Dabeiȱ stehenȱ dieȱ Qualifierȱ 155ȱ bzw.ȱ 156ȱ fürȱ einȱ AnfangsȬȱ bzw.ȱ einȱ Enddatum.ȱ Derȱ folgendeȱ Qualifierȱ 102ȱ stehtȱ fürȱ dasȱ Formatȱ inȱ demȱdieȱDatumsangabenȱübertragenȱwerdenȱ(hierȱTTMMJJJJ).ȱ ȱ DTM+155:01122006:102' DTM+156:31122006:102'
ȱ Inȱ demȱ MOAȬSegmentȱ wirdȱderȱ monetäreȱNettobetragȱ derȱ Positionȱ anȬ gezeigt.ȱDabeiȱstehtȱderȱersteȱQualifierȱfürȱdieȱArtȱdesȱBetragesȱ(203=ȱPoȬ sitionsbetragȱ ohneȱ MWSt.),ȱ danachȱ folgtȱ derȱ Geldbetragȱ undȱ dieȱ WähȬ rung.ȱ ȱ MOA+203:378,81:EUR'
ȱ DasȱPRIȬSegmentȱistȱfürȱdieȱÜbertragungȱvonȱPreisinformationenȱvorgeȬ sehen.ȱDabeiȱstehtȱderȱersteȱQualifierȱfürȱdieȱArtȱdesȱPreisesȱ(CALȱ=ȱBeȬ rechnungspreis).ȱ Dasȱ folgendeȱ Feldȱ beinhaltetȱ denȱ Preisbestandteil.ȱ Derȱ übertrageneȱPreisȱmussȱimmerȱderȱLogikȱMengeȱ(QTYȬSegment)ȱ*ȱPreisȱ (PRIȬSegment)ȱ=ȱPositionsbetragȱ(MOAȬSegment)ȱentsprechen.ȱ ȱ PRI+CAL:0,0429'
ȱ Derȱ letzteȱ Teilȱ imȱ Positionsteilȱ istȱ dasȱ TAXȬSegment.ȱ Anȱ dieserȱ Stelleȱ könnenȱZollȬȱoderȱSteuerangabenȱhinterlegtȱwerden.ȱZunächstȱmussȱeinȱ Qualifierȱ fürȱ dieȱ Gebührenklasseȱ (7ȱ =ȱ Steuer)ȱ angegebenȱ werden.ȱ Imȱ nächstenȱ Feldȱ wirdȱ dieseȱ Gebührenklasseȱ genauerȱ spezifiziertȱ (VATȱ =ȱ Mehrwertsteuer).ȱ Esȱ folgenȱ eineȱ Reiheȱ vonȱ nichtȱ verwendetenȱ Feldern.ȱ AlsȱletztesȱwirdȱdieȱAngabeȱdesȱGebührensatzesȱ(hierȱ16%)ȱgefordert.ȱ ȱ TAX+7+VAT+++:::16+S'
DieseȱReihenfolgeȱwiederholtȱsichȱinȱderȱnächstenȱPositionȱentsprechend.ȱ
ȱ
39
2ȱȱECMȱCaptureȬKomponenteȱ –
LIN+6++Fest:EN::293'
–
QTY+47::'
–
DTM+155:01122006:102'
–
DTM+156:31122006:102'
–
MOA+203:21,47:EUR'
–
PRI+CAL:21,47'
–
TAX+7+VAT+++:::16+S'
2.2.5
Probleme der EDI-Implementierung
Ausȱ derȱ Kostenverteilungȱ undȱ demȱ zögerlichenȱ Einsatzȱ inȱ weitenȱ Bereichenȱ derȱ Wirtschaftȱ wirdȱ deutlich,ȱ dassȱ eineȱ EDIȬImplementierungȱ aufȱ großeȱ Vorbehalteȱ undȱ Hindernisseȱ stößt.ȱ Dieȱ Schwierigkeiten,ȱ EDIȱ inȱ denȱ Geschäftsablaufȱ zuȱ inteȬ grieren,ȱstammenȱausȱzweiȱQuellen:ȱ Syntaktischeȱ Probleme:ȱ Dieserȱ Problemtypȱ zieltȱ aufȱ strukturelleȱ Problemeȱ zwiȬ schenȱApplikationȱundȱEDIȱ[Georg,ȱS.ȱ125]:ȱ – VonȱEDIȱdefinierteȱobligatorischeȱFelderȱsindȱinȱderȱApplikationȱnichtȱvorȬ handen.ȱ – Vomȱ Standardȱ definierteȱ Feldlängenȱ stimmenȱ mitȱ denjenigenȱ derȱ ApplikaȬ tionȱnichtȱüberein.ȱ – InternȱverwendeteȱDatenfelderȱkönnenȱinȱEDIȱnichtȱabgebildetȱwerden.ȱ – DieȱWiederholfaktorenȱderȱSegmenteȱstellenȱeineȱBeschränkungȱgegenüberȱ derȱApplikationȱdar.ȱ Semantischeȱ Probleme:ȱ Schwierigkeitenȱ ergebenȱ sichȱ ausȱ denȱ unterschiedlichenȱ InterpretationsmöglichkeitenȱderȱFelderȱ[Fischer,ȱS.ȱ243]:ȱ – Heterogeneȱ Bewertungssystemeȱ ȱ innerhalbȱ derȱ Logistikketteȱ Herstellerȱ –ȱ Handelȱ–ȱVerbraucherȱführenȱdazu,ȱdassȱvonȱjedemȱTeilnehmerȱeinȱArtikelȱ hinsichtlichȱArt,ȱAusführung,ȱVerpackung,ȱIdentifikation,ȱGebindegrößeȱanȬ dersȱ spezifiziertȱ wird.ȱ Dieȱ 13Ȭstelligeȱ EANȬArtikelnummerȱ gestattetȱ –ȱ nachȱ Abzugȱ derȱ Stellenȱ fürȱ dieȱ BBNȱ (=Bundeseinheitlicheȱ Betriebsnummer)ȱ zurȱ IdentifizierungȱvonȱHerkunftslandȱundȱȬunternehmenȱundȱPrüfzifferȱ–ȱnochȱ fünfȱStellenȱfürȱdieȱherstellerspezifischeȱArtikelnummer.ȱDieȱdadurchȱmögliȬ cheȱBezeichnungȱvonȱ99ȱ999ȱArtikelnȱmagȱfürȱvieleȱUnternehmenȱausreichen,ȱ fürȱsolcheȱmitȱeinemȱtiefenȱSortimentȱoderȱmitȱkomplexenȱProduktenȱistȱdiesȱ allerdingsȱ eineȱ ernsteȱ Einschränkung.ȱ Diesȱ giltȱ insbesondereȱ deshalb,ȱ weilȱ Artikelnummernȱsichȱalsȱsehrȱlanglebigȱerweisen.ȱ – Eineȱ Interpretationȱ vonȱ Textfeldernȱ mussȱ manuellȱ geschehen.ȱ Dadurchȱ wirdȱdieȱreinȱmaschinelleȱVerarbeitungsketteȱunterbrochen.ȱ
2.2.6
EDI-Erweiterungen
Internet,ȱWWWȱundȱXMLȱgeltenȱalsȱdieȱSchlüsseltechnologien,ȱdieȱesȱauchȱkleinenȱ undȱmittelständischenȱUnternehmenȱerlauben,ȱamȱelektronischenȱDatenaustauschȱ
40 ȱ
2.2ȱȱEDIȱ(ElectronicȱDataȱInterchange)ȱ teilzunehmen.ȱNieȱzuvorȱkonntenȱüberȱdasȱInternetȱsoȱvieleȱUnternehmenȱerreichtȱ werden,ȱ soȱ dassȱ einȱ folgerichtigerȱ Schrittȱ darinȱ besteht,ȱ dieseȱ KommunikationsȬ plattformȱ zuȱ nutzen,ȱ umȱ auchȱ dieȱ bisherȱ EDIȱ reserviertȱ gegenüberstehendenȱ UnȬ ternehmenȱeinzubinden.ȱ EntschließenȱsichȱdieȱGeschäftspartnerȱdasȱInternetȱalsȱTransportmediumȱzwischenȱ ihrenȱITȬSystemenȱeinzusetzen,ȱkönnenȱsieȱaufȱeinigeȱVorteileȱverweisen.ȱDasȱNetzȱ besitztȱeineȱinternationaleȱVerfügbarkeit,ȱeineȱhoheȱAkzeptanzȱbeiȱdenȱAnwendernȱ undȱ geringeȱ AnbindungsȬȱ undȱ Übertragungskosten.ȱ Demgegenüberȱ stehenȱ allerȬ dingsȱauchȱNachteile.ȱDieȱStrukturȱdesȱInternetsȱistȱchaotisch,ȱdieȱQualitätȱderȱanȬ gebotenenȱ Diensteȱ entsprichtȱ nichtȱ denȱ EDIȬVerfahren,ȱ undȱ SicherheitsmechanisȬ menȱsindȱnichtȱBestandteilȱderȱInfrastrukturȱundȱmüssenȱdaherȱdurchȱergänzendeȱ Funktionenȱ wieȱ Verschlüsselungȱ oderȱ digitaleȱ Unterschriftȱ nachgerüstetȱ werden.ȱ Alsȱ Kommunikationsmechanismenȱ kommenȱ zweiȱ Konzepteȱ inȱ Frageȱ [SchreckenȬ bach]:ȱ – PunktȬzuȬPunktȬVerbindungenȱ überȱ FTP:ȱEDIȬNachrichtenȱwerdenȱalsȱseȬ parateȱDateiȱübertragen.ȱDarausȱergibtȱsichȱeineȱkurzeȱTransferzeitȱundȱeineȱ unmittelbareȱ Bestätigungsmöglichkeit.ȱ Einȱ Problemȱ bildenȱ dieȱ SicherheitsȬ mechanismen,ȱdaȱbeiȱderȱNutzungȱZugriffsrechteȱvergebenȱundȱPasswörterȱ verwaltetȱwerdenȱmüssen.ȱ – Asynchroneȱ Verbindungenȱ überȱ EȬMail:ȱ EDIȬDatenȱ werdenȱ alternativȱ alsȱ Anhangȱ oderȱ alsȱ eigentlicherȱ MailȬInhaltȱ übertragen.ȱ Dasȱ MIMEȬProtokollȱ (MultipurposeȱInternetȱMailȱExtensions)ȱerlaubtȱdieȱTypisierungȱderȱMailinȬ halteȱdurchȱeineȱReiheȱneuerȱHeaderfelder.ȱDadurchȱwirdȱderȱNutzerȱinȱdieȱ Lageȱversetzt,ȱnormaleȱEȬMailsȱvonȱsolchenȱmitȱEDIȬInhaltȱzuȱunterscheiden.ȱ Dieȱ Beschreibungȱ derȱ Datenȱ erfolgtȱ imȱ Feldȱ „ContentȬType“,ȱ dasȱ zurȱ AnȬ gabeȱ vonȱ Attributenȱ undȱ Wertenȱ desȱ Mailinhaltesȱ dient.ȱ Einȱ zweitesȱ Feldȱ „ContentȬTransferȬEncoding“ȱenthältȱAngabenȱzurȱÜbertragungscodierung.ȱ DieȱMIMEȬErweiterungȱgestattetȱnunȱdieȱÜbertragungȱverschiedenerȱDatenȬ typen,ȱaberȱauchȱmehrererȱTeilnachrichtenȱunterschiedlichenȱDatentyps.ȱMitȱ demȱContentȬTypȱ„Application“ȱlassenȱsichȱdieȱübertragenenȱInformationenȱ einerȱ Anwendungȱ zuordnen,ȱ soȱ dassȱ demȱ Empfängersystemȱ dieȱ automatiȬ scheȱ Weiterverarbeitungȱ möglichȱ wird.ȱ Momentanȱ existierenȱ dieȱ Variantenȱ EDIFACT,ȱ EDIȬX12ȱ undȱ EDIȬContentȱ zurȱ Beschreibung.ȱ Dieȱ InȬ haltsspezifikationȱ„signed“ȱoderȱ„encrypted“ȱkennzeichnetȱimȱNachrichtenȬ kopfȱdieȱArtȱdesȱgenutztenȱSicherheitsverfahrens.ȱDabeiȱkannȱesȱsichȱsowohlȱ umȱdieȱAuthentifizierungȱeinerȱNachrichtȱmitȱeinerȱdigitalenȱUnterschriftȱalsȱ auchȱumȱeineȱVerschlüsselungȱzurȱGeheimhaltungȱdesȱInhaltesȱhandeln.ȱAlsȱ weitereȱErgänzungȱkommenȱEmpfangsbestätigungenȱhinzu,ȱdieȱdieȱkorrekteȱ ÜbertragungȱundȱdieȱvomȱEmpfängerȱgeprüfteȱIntegritätȱderȱNachrichtȱbeȬ legen.ȱ NebenȱdenȱklassischenȱInternetdienstenȱinȱFormȱvonȱEȬMailȱoderȱFiletransferȱentȬ standȱ 1997ȱ dieȱ Idee,ȱ Unternehmenȱ überȱ einȱ formularbasiertesȱ DokumentenmanaȬ
ȱ
41
2ȱȱECMȱCaptureȬKomponenteȱ gementȱ anzubinden.ȱ Unternehmenȱ stellenȱ ihrenȱ Geschäftspartnernȱ Formulareȱ fürȱ Transaktionenȱ wieȱ Bestellungen,ȱ Lieferabrufȱ oderȱ Anfragenȱ aufȱ Basisȱ vonȱ HTMLȱ undȱ JAVAȱ bereit,ȱ dieȱ vonȱ diesenȱ mitȱ herkömmlichenȱ WWWȬBrowsernȱ bearbeitetȱ werden.ȱ Dieseȱ Architekturȱ besitztȱ denȱ Vorteil,ȱ auchȱ solcheȱ Geschäftspartnerȱ anȬ bindenȱ zuȱ können,ȱ dieȱ aufgrundȱ mangelnderȱ Infrastruktur,ȱ geringemȱ TransaktiȬ onsvolumenȱ oderȱ mangelndemȱ KnowȬhowȱ bisherȱ nichtȱ inȱ derȱ Lageȱ waren,ȱ dasȱ herkömmlicheȱEDIȬVerfahrenȱzuȱnutzen.ȱUnternehmen,ȱdieȱklassischesȱEDIȱbereitsȱ einsetzen,ȱ bietetȱ sichȱ daherȱ dieȱ Möglichkeit,ȱ mitȱ geringemȱ Zusatzaufwandȱ auchȱ kleineȱPartnerȱinȱdieȱEDIȬLandschaftȱzuȱintegrierenȱundȱaufȱdieseȱWeiseȱeineȱumȬ fassendeȱ EDIȬgestützteȱ Anwendungsumgebungȱ aufzubauen.ȱ Dieȱ unterschiedliȬ chenȱBeweggründeȱfürȱWebȬEDIȱspiegeltȱfolgendeȱTabelleȱwiderȱ[Schreckenbach]:ȱ Tabelleȱ2.4:ȱWebȬEDIȱzwischenȱPartnerȱundȱBetreiberȱ Angebundener Partner
Web-EDI Betreiber
Zu geringes Belegvolumen für klassisches EDI
EDI-Anbindung auch kleiner Geschäftspartner
Mangel an Know-How und entsprechender EDV-Infrastruktur
Keine Notwendigkeit von Absprachen bezüglich Support oder Implementierung mit den Partnern
Kostengünstige Möglichkeit, der Forderung von Partnern nach EDI nachzukommen
Nur EDI-Inhouse-Schnittstelle erforderlich
Soȱ elegantȱ dieseȱ Lösungȱ erscheint,ȱ birgtȱ sieȱ jedochȱ aufȱ beidenȱ Seiten,ȱ derȱ desȱ BeȬ treibersȱundȱderȱdesȱAnwenders,ȱProbleme.ȱEinȱBetreiberȱbenötigtȱzusätzlicheȱInȬ frastruktur,ȱdieȱgepflegtȱundȱgewartetȱwerdenȱwill,ȱeinȱAnwenderȱmussȱdieȱDatenȱ weiterhinȱmanuellȱerfassen,ȱwasȱfehleranfälligȱundȱzeitaufwendigȱist.ȱDerȱHauptȬ nachteilȱliegtȱaberȱinȱderȱmangelndenȱIntegrationȱinȱdieȱInhouseȬSysteme.ȱWebȬEDIȱ istȱalsȱClientȬ/ServerȬAnwendungȱrealisiert,ȱbeiȱderȱderȱServerȱEDIȬDatenȱalsȱWebȬ Formulareȱ bereitstelltȱ undȱ derȱ Clientȱ desȱ Partnersȱ dieseȱ fürȱ dieȱ Datenerfassungȱ überȱ dasȱ Mediumȱ Internetȱ abruft.ȱ Üblicherweiseȱ entstehtȱ beiȱ WebȬEDIȱ fürȱ denȱ angebundenenȱ Partnerȱ einȱ Medienbruch,ȱ derȱ billigendȱ inȱ Kaufȱ genommenȱ wird,ȱ daȱjedeȱFormȱderȱAnwendungsintegrationȱsichȱausȱGründenȱdesȱfehlendenȱBelegȬ volumensȱoderȱderȱmangelndenȱEDVȬAusstattungȱalsȱunrentabelȱerweist.ȱEinȱtypiȬ scherȱAblaufȱdesȱNachrichtenversandsȱlässtȱsichȱfolgendermaßenȱvorstellen:ȱ 1. 2.
42 ȱ
Dieȱ Absprachenȱ bezüglichȱ desȱ WebȬEDIȬBetriebsȱ beschränkenȱ sichȱ aufȱ dieȱ Vereinbarungȱ vonȱ WebȬAdresse,ȱ UserȬIDȱ undȱ Passwortȱ undȱ entsprechenȱ damitȱdenȱErfordernissenȱeinesȱüblichenȱLoginȬVorganges.ȱȱ DerȱNutzerȱwähltȱausȱeinerȱListeȱverfügbarerȱNachrichtentypenȱdenȱzutrefȬ fendenȱ aus,ȱ fülltȱ dasȱ entsprechendeȱ Formularȱ mitȱ Datenȱ undȱ versendetȱ esȱ anȱdenȱPartner.ȱ
2.3ȱȱXMLȱ(ExtensibleȱMarkupȱLanguage)ȱ 3.
4.
BeimȱWebȬEDIȬBetreiberȱerfolgtȱdieȱIntegrationȱankommenderȱNachrichtenȱ vollständigȱ interventionslos.ȱ Dieȱ eingehendenȱ Datenȱ werdenȱ vomȱ WebȬ EDIȬSystemȱ anȱ dasȱ EDIȬSystemȱ übergeben,ȱ konvertiertȱ undȱ überȱ eineȱ Schnittstelleȱ derȱ Anwendungȱ zurȱ Weiterverarbeitungȱ zurȱ Verfügungȱ geȬ stellt.ȱ AusgehendeȱDatenȱwerdenȱdemȱWebȬEDIȬSystemȱalsȱDateiȱoderȱEDIFACTȬ Dateiȱübergeben,ȱfürȱdasȱWWWȱaufbereitetȱundȱdemȱPartnerȱangeboten.ȱȱ
Geschäftsanwendungen
Intranet
X12/EDIFACT Mainframe/VAN XML/EDI
Web-Browser Web-Server
E-Commerce
ȱ
Abbildungȱ2.6:ȱKommunikationsstandards,ȱXMLȱundȱEDIȱ
2.3 XML (Extensible Markup Language) Inȱ derȱ Vergangenheitȱ dienteȱ dieȱ Informationstechnologieȱ denȱ Unternehmenȱ inȱ ersterȱ Linieȱ dazu,ȱ ihreȱ Verarbeitsprozesseȱ zuȱ beschleunigen.ȱ Inȱ Zeitenȱ desȱ Worldȱ WideȱWebȱwirdȱdieserȱAnspruchȱumȱweitereȱAspekteȱergänzt.ȱDerȱzufriedenȱstelȬ lendeȱKundenserviceȱbedeutetȱnunȱnichtȱnur,ȱdasȱrichtigeȱProduktȱzuȱliefern,ȱsonȬ dernȱauchȱdasȱKaufenȱundȱBezahlenȱzuȱunterstützenȱoderȱaufȱandereȱWeiseȱeinenȱ Mehrwertȱanzubieten.ȱDieȱdamitȱverbundenenȱAktivitätenȱbasierenȱzuȱeinemȱgroȬ ßenȱ Teilȱ aufȱ Informationen,ȱ derenȱ Basisȱ dasȱ Internetȱ ist.ȱ XMLȱ alsȱ universellesȱ Sprachmodellȱ zurȱ Entwicklungȱ vonȱ InternetȬAnwendungenȱ wirdȱ vielfachȱ alsȱ dieȱ neueȱ Metaspracheȱ angesehen,ȱ mitȱ derenȱ Hilfeȱ sichȱ dieserȱ Anspruchȱ schnellȱ undȱ mitȱausreichenderȱFlexibilitätȱumsetzenȱlässt.ȱȱȱ ImȱJahreȱ1996ȱbegannȱeinȱTeamȱvonȱExpertenȱunterȱderȱLeitungȱvonȱJonȱBosakȱmitȱ Unterstützungȱ desȱ Worldȱ Wideȱ Webȱ Consortiumsȱ (W3C)ȱ mitȱ derȱ Entwicklungȱ
ȱ
43
2ȱȱECMȱCaptureȬKomponenteȱ einesȱneuenȱStandards,ȱdessenȱZielȱesȱwar,ȱGeschäftsdatenȱallerȱArtȱeinfach,ȱleichtȱ erweiterbarȱundȱlesbarȱdarzustellen.ȱȱAnalogȱzuȱSGMLȱbeschreibtȱXMLȱdieȱArt,ȱinȱ derȱDatenȱformatiertȱsind.ȱJenseitsȱeinerȱreinenȱAbbildungȱdesȱTextesȱdurchȱTagsȱ zurȱ Formatierung,ȱ Gliederungȱ oderȱ Darstellungȱ versuchtȱ XMLȱ auchȱ inhaltlicheȱ Strukturenȱ zuȱ erfassenȱ undȱ fürȱ denȱ intelligentenȱ Datenaustauschȱ nutzbarȱ zuȱ maȬ chen.ȱ Dieȱ Architekturȱ vonȱ XMLȱ strebtȱ alsoȱ einȱ vielfältigesȱ Nutzenpotentialȱ an.ȱ Dabeiȱ stehtȱ derȱ Nameȱ Extensibleȱ Markupȱ genauȱ genommenȱ wederȱ fürȱ eineȱ AusȬ zeichnungssprache,ȱdieȱsichȱerweiternȱlässt,ȱetwaȱinȱRichtungȱHTML,ȱnochȱhandeltȱ esȱ sichȱ umȱ eineȱ Obermengeȱ vonȱ HTML.ȱ XMLȱ istȱ zwarȱ eineȱ Spracheȱ undȱ umfasstȱ auchȱ Regeln,ȱ aberȱ sieȱ schreibtȱ keinenȱ festenȱ Satzȱ vonȱ Vokabelnȱ vorȱ undȱ definiertȱ auchȱkeineȱstrukturellenȱBeziehungenȱzwischenȱdenȱausgezeichnetenȱDaten.ȱ Werȱ dieȱ Verschiedenartigkeitȱ derȱ Informationsdarstellungȱ ausdrückenȱ möchte,ȱ kannȱ diesȱ durchȱ soȱ unterschiedlicheȱ Formateȱ wieȱ RTF,ȱ PDFȱ oderȱ HTML.ȱ Sieȱ steuernȱdieȱVerarbeitungȱeinesȱDokumentesȱmittelsȱeinesȱFormatierers.ȱImȱGegenȬ satzȱ dazuȱ trenntȱ XMLȱ Inhaltȱ undȱ Layout.ȱ Dabeiȱ werdenȱ dieȱ Informationenȱ aberȱ nichtȱnurȱdurchȱNamenȱundȱderenȱAttributeȱidentifiziert,ȱsondernȱauchȱdurchȱihreȱ hierarchischeȱundȱsequentielleȱStellung.ȱXMLȱkenntȱnebenȱdenȱNamenȱdaherȱauchȱ dieȱHäufigkeitȱvonȱElementen,ȱderenȱSchachtelungȱundȱderenȱAbfolge.ȱDasȱLayoutȱ wirdȱinȱFormȱvonȱStylesheetsȱphysischȱgetrenntȱvomȱeigentlichenȱDokumentȱaufȬ bewahrtȱundȱinȱAbhängigkeitȱvonȱAdressatȱundȱMediumȱzugewiesen.ȱȱ Tabelleȱ2.5:ȱȱVorzügeȱvonȱXMLȱ[SAGȱ1999]ȱ Eigenschaft
Beschreibung
Einfach
XML ist leicht lesbar und folglich für Rechner leicht zu verarbeiten.
Offener Standard
XML ist ein W3C-Standard
Erweiterbar
Die Menge der Tags ist nicht im Voraus definiert, sondern kann fallweise je nach Anforderung festgelegt werden.
Selbstbeschreibend
Im Gegensatz zu Datenbanken, deren Tabellen durch ein Schema beschrieben werden, erlaubt XML die Dokumentenablage ohne Definitionen, da Metadaten in Form von Tags und Attributen zum Sprachumfang gehören.
Kontextinformationen
Tags, Attribute und Elementstrukturen liefern Kontextinformationen, die die Interpretation des Dokumenteninhaltes erlauben und auf diese Weise Suchen und Auswertungen ermöglichen.
Trennung von Inhalt und Darstellung
XML-Tags legen eine Bedeutung, aber keine Darstellung fest, d.h. ein XML-Dokument kann auf mehrere Arten präsentiert werden.
Einbettung unterschiedlicher Datentypen
XML-Dokumente können unterschiedlichste Datentypen von Multimedia (Bild, Sound, Video) bis aktive Komponenten (Java Applets) aufnehmen.
Einbettung existierender Daten
Die Einbindung vorhandener Datenstrukturen wie Filesysteme oder relationale Datenbanken ist unter XML möglich.
Verteilte Daten
XML-Dokumente können geschachtelt über mehrere Server verteilt liegen.
44 ȱ
2.3ȱȱXMLȱ(ExtensibleȱMarkupȱLanguage)ȱ DieȱStärkeȱvonȱXMLȱistȱgleichzeitigȱdieȱSchwächeȱderȱanderenȱDatenbeschreibunȬ gen:ȱdieȱDatendarstellungȱinȱleichtȱverständlicherȱFormȱmitȱeinfacherȱInterpretatiȬ onsmöglichkeit.ȱ Selbstȱ wennȱ eineȱ Anwendungȱ inȱ derȱ Lageȱ ist,ȱ zuȱ identifizieren,ȱ dassȱeineȱHTMLȬSeiteȱeinȱAngebotȱenthält,ȱsoȱistȱdieȱIsolierungȱderȱeinzelnenȱEleȬ menteȱ wieȱ Preis,ȱ Produktnameȱ undȱ Mengeȱ äußerstȱ aufwendig.ȱ Diesenȱ Mangelȱ versuchtȱXMLȱzuȱbeseitigen.ȱEineȱAnwendung,ȱdieȱXMLȱversteht,ȱkannȱdieȱerhalȬ tenenȱ Datenȱ zergliedernȱ undȱ einzelneȱ Datenȱ inhaltlichȱ interpretieren.ȱ Diesȱ führtȱ dazu,ȱdassȱWebȬShops,ȱdieȱihreȱProduktdatenȱimȱXMLȬFormatȱablegen,ȱEinkaufsȬ abteilungenȱermöglichen,ȱihrȱAngebotȱnachȱbestimmtenȱArtikelnȱgezieltȱzuȱanalyȬ sierenȱundȱdamitȱdenȱInhaltȱnachȱspeziellenȱInteressenȱzuȱfiltern.ȱDasȱAusblendenȱ oderȱ Anzeigenȱ bestimmterȱ Dokumentenpassagenȱ istȱ derartȱ flexibel,ȱ dassȱ indiviȬ duelleȱ Sichtenȱ auchȱ fürȱ einzelneȱ Abteilungenȱ denkbarȱ sind.ȱ Soȱ könntenȱ sichȱ ProȬ duktdokumentationenȱ anȱ denȱ Kundendienstȱ undȱ dasȱ Marketingȱ wenden,ȱ wobeiȱ dasȱMarketingȱnichtȱanȱtechnischenȱDetailsȱinteressiertȱwäre.ȱEntsprechendȱließenȱ sichȱ alsȱ technischȱ markierteȱ Dokumententeileȱ fürȱ diejenigenȱausblenden,ȱ dieȱdemȱ Benutzerprofilȱ„Marketing“ȱzugeordnetȱsind.ȱȱ XMLȱ unterscheidetȱ sichȱ vonȱ HTMLȱ inȱ einemȱ wesentlichenȱ Punkt;ȱ esȱ istȱ keineȱ diȬ rektȱ anwendbareȱ Sprache,ȱ sondernȱ eineȱ Metasprache,ȱ dieȱ einenȱ Rahmenȱ inȱ Formȱ einerȱ allgemeinenȱ Grammatikȱ darstellt,ȱ mittelsȱ dererȱ sichȱ Anwendungenȱ realisieȬ renȱlassen.ȱXMLȱlebtȱalsoȱdurchȱdas,ȱwasȱdieȱAnwenderȱschaffen.ȱJederȱAnwenderȱ kannȱmitȱXMLȱneue,ȱeigeneȱTagsȱfürȱseineȱAnforderungenȱdefinieren.ȱZurȱFormuȬ lierungȱ vonȱ Theaterstückenȱ sindȱ Tagsȱ fürȱ Akt,ȱ Szeneȱ oderȱ Rolleȱ unerlässlich,ȱ fürȱ Geschäftsprozesseȱ sindȱ Tagsȱ wieȱ Preis,ȱ Menge,ȱ Bestellnummerȱ oderȱ ArtikelbeȬ zeichnungȱ wichtigȱ undȱ fürȱ Applikationenȱ imȱ Gesundheitswesenȱ wärenȱ Tagsȱ fürȱ Namen,ȱ Versicherungȱ oderȱ Diagnoseȱ erforderlich.ȱ XMLȱ liefertȱ fürȱ jedeȱ AnwenȬ dungȱ keineȱ speziellenȱ Tags,ȱ sondernȱ nurȱ dieȱ Vorschrift,ȱ wieȱ dieseȱ standardkonȬ formȱzuȱdefinierenȱsind.ȱȱ
2.3.1
XML-Dokumenten-Erstellung
Einȱ XMLȬDokumentȱ bestehtȱ primärȱ ausȱ einerȱ geschachteltenȱ Hierarchieȱ vonȱ EleȬ mentenȱmitȱeinerȱeindeutigenȱWurzelȱalsȱAusgangspunktȱ[Pfeiffer].ȱElementeȱstelȬ lenȱfolglichȱdieȱlogischeȱStrukturȱdarȱundȱkönnenȱselbstȱwiederȱNachfolgeelemente,ȱ DatenȱoderȱeineȱMischungȱausȱbeidenȱenthalten.ȱZusätzlichȱkönnenȱsieȱdurchȱAtȬ tributeȱ näherȱ beschriebenȱ werden.ȱ Währendȱ Elementeȱ undȱ Datenȱ einerȱ festenȱ Ordnungȱfolgen,ȱkönnenȱAttributeȱinȱbeliebigerȱReihenfolgeȱhinzugefügtȱwerden.ȱ XMLȱerlaubtȱesȱNutzernȱdurchȱdiesenȱflexiblenȱAufbau:ȱ – mehrereȱDokumenteȱzuȱeinemȱCompoundȱDocumentȱzuȱkombinierenȱ – dieȱ Positionȱ undȱ dasȱ Formatȱ festzulegen,ȱ anȱ derȱ bzw.ȱ mitȱ demȱ Graphikenȱ eingebundenȱwerdenȱsollenȱ – zusätzlichenȱKommentarȱhinzuzufügenȱ – Verarbeitungskontrollinformationenȱanzuhängen.ȱ
ȱ
45
2ȱȱECMȱCaptureȬKomponenteȱ Wichtigȱistȱallerdingsȱzuȱbeachten,ȱdassȱXMLȱnichtȱ – ausȱeinerȱMengeȱvordefinierterȱTagsȱbestehtȱ – standardisierteȱTemplatesȱfürȱDokumenteȱenthält.ȱ XMLȱistȱflexibelȱgenug,ȱjedeȱlogischeȱTextstrukturȱabzubilden.ȱȱ ȱ
ȱ
Beispiel:ȱAdressbuchȱȱ ȱ Benutzerȱ vonȱ EȬMailȱ habenȱ inȱ mühevollerȱ Kleinarbeitȱ einȱ individuellesȱ NamensȬȱ undȱ Adressbuchȱ angelegt.ȱ Diesesȱ kannȱ durchȱ einenȱ Systemabsturz,ȱ einenȱ Firmenwechselȱ oderȱ denȱ Austauschȱ desȱ EȬMailȬProgrammsȱ wertlosȱ werden.ȱ Wieȱ kannȱ dasȱ Adressbuchȱ beiȱ RechnerȬ,ȱ FirmenȬȱ oderȱ Mailprogrammwechselȱ erhaltenȱbleiben?ȱEineȱnaheliegendeȱMöglichkeitȱbestehtȱdarin,ȱfürȱ diesesȱwichtigeȱDokumentȱeineȱXMLȬStrukturȱzuȱhinterlegen.
DieȱEleganzȱvonȱXMLȱzeigtȱsichȱdarin,ȱdassȱneueȱTagsȱundȱdamitȱneueȱMerkmaleȱ problemlosȱ eingefügtȱ werdenȱ können.ȱ Dieseȱ Möglichkeitȱ erlaubtȱ dieȱ Abbildungȱ beliebigerȱ Adressbuchvarianten,ȱ weilȱ ihrȱ individuellerȱ Aufbauȱ alsȱ Teilmengeȱ fürȱ jedenȱBenutzerȱfreiȱvereinbarȱist.ȱIstȱeinmalȱeineȱDefinitionȱfestgelegt,ȱkönnenȱbelieȬ bigeȱ Adressdatenȱ daraufhinȱ geprüftȱ werden,ȱ obȱ sieȱ mitȱ derȱ XMLȬVorgabeȱ überȬ einstimmen.ȱAbweichungenȱvonȱderȱvorgegebenenȱStrukturȱsindȱdannȱnichtȱmehrȱ möglich.ȱ Autoren,ȱ dieȱ anȱ verschiedenenȱ Standortenȱ arbeiten,ȱ könnenȱ aufȱ dieseȱ Weiseȱ Dokumenteȱ erstellen,ȱ dieȱ zumindestȱ strukturellȱ zusammenpassen.ȱ Diesȱ bedeutetȱnicht,ȱdassȱdieȱDokumenteȱsichȱaufȱgleicheȱInhalteȱbeziehen.ȱȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ
46 ȱ
2.3ȱȱXMLȱ(ExtensibleȱMarkupȱLanguage)ȱ Beispiel:ȱAdressbuchȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ
2.3.2
ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱMeyerȱȱHansȱȱ ȱ ȱ ȱ [email protected]ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱMuellerȱȱFranzȱȱ ȱ ȱ ȱ [email protected]ȱ ȱ ȱ ȱ ȱ ȱ
Grenzen von XML
Alsȱ einȱ Mangelȱ allerȱ Formenȱ desȱ Datenaustauschesȱ gilt,ȱ dassȱ Elementenȱ oderȱ AtȬ tributenȱkeineȱDatentypenȱzugeordnetȱwerdenȱkönnen,ȱwieȱsieȱvonȱProgrammierȬ sprachenȱbekanntȱsind.ȱDieseȱSchwächeȱwirdȱdurchȱdenȱStandardȱXMLȬSchemataȱ beseitigt.ȱ Wieȱ bisherȱ legtȱ erȱ fest,ȱ wieȱ Dokumenteȱ auszusehenȱ haben,ȱ dieȱ sichȱ alsȱ Ausprägungȱ einesȱ Schemasȱ verstehen.ȱ Dieȱ Beschreibungȱ desȱ Vokabularsȱ undȱ dieȱ VerwendungsregelnȱerfolgenȱinȱXMLȬSyntaxȱmitȱeinerȱErgänzungȱdurchȱDatentyȬ penȱundȱderenȱeindeutigerȱZuordnungȱzuȱElementen.ȱFürȱFälle,ȱinȱdenenȱdieȱvorȬ gegebenenȱTypenȱnichtȱausreichen,ȱkannȱmitȱHilfeȱregulärerȱAusdrückeȱdieȱFormȱ zulässigerȱDatentypenȱausgeweitetȱwerden.ȱ AngesichtsȱderȱgroßenȱUnterstützung,ȱdieȱXMLȱausȱderȱWirtschaftȱerfährt,ȱentwiȬ ckeltȱsichȱdiesesȱKonzeptȱzurȱLinguaȱFrancaȱdesȱEȬBusiness.ȱUmȱdortȱFußȱzuȱfassen,ȱ istȱ esȱ aberȱ notwendig,ȱ ȱ Schutzmechanismenȱ fürȱ XMLȬDokumenteȱ zuȱ entwickeln.ȱ Dieȱ bisherigenȱ Verfahrenȱ nehmenȱ wenigȱ Bezugȱ zuȱ denȱ spezifischenȱ Merkmalenȱ vonȱ XML.ȱ Mitȱ XMLȬSignaturesȱ stehtȱ nunȱ einȱ Verfahrenȱ zurȱ Verfügung,ȱ dasȱ zumȱ einenȱ dieȱ XMLȬSyntaxȱ nutzt,ȱ umȱ alleȱ Informationenȱ einerȱ digitalenȱ Signaturȱ darȬ
ȱ
47
2ȱȱECMȱCaptureȬKomponenteȱ zustellen,ȱ undȱ zumȱ anderenȱ dieȱ Möglichkeitȱ bietet,ȱ einzelneȱ DokumentenabȬ schnitteȱzuȱsignieren.ȱȱ
2.3.3
EDI und XML
Verstehenȱkönnenȱsichȱnurȱdiejenigen,ȱdieȱdieȱgleicheȱSpracheȱsprechen.ȱDiesȱgiltȱ nichtȱ nurȱ fürȱ Personen,ȱ sondernȱ auchȱ fürȱ Anwendungssysteme.ȱ Standardsȱ imȱ elektronischenȱ Geschäftsverkehrȱ sollenȱ dafürȱ sorgen,ȱ dassȱ Unternehmenȱ nahtlosȱ miteinanderȱkommunizierenȱ können.ȱMitȱ demȱ Auftauchenȱ vonȱXMLȱalsȱ KonkurȬ rentȱ zuȱ EDIȱ wuchsȱ dieȱ Zahlȱ derȱ Kommunikationskonzepteȱ erheblich,ȱ soȱ dassȱ einȱ Überblickȱzunehmendȱschwerȱfällt.ȱZuȱdenȱeingesetztenȱStandardsȱgehören:ȱBMEȬ cat,ȱ xCBL,ȱ cXML,ȱ ICE,ȱ Rosettaȱ Net,ȱ OBI,ȱ Biztalkȱ undȱ ebXML.ȱ Welcherȱ Standardȱ verwendetȱwird,ȱhängtȱvonȱderȱeingesetztenȱSoftwarelösungȱab.ȱȱ Tabelleȱ2.6:ȱXMLȬFormateȱ[Bryan]:ȱ Basis
Umfang
Beteiligte Unternehmen
BMEcat
XML
Einheitliche Katalogsprache
Visa, Siemens, Lufthansa, Audi
cXML
XML
Einheitliche Katalogsprache und vordefinierte Dokumententypen
Microsoft, SAP, Sun
ICE
XML
Kommunikationsprotokoll
Microsoft, HP
Rosetta Net
XML
Dokumententypen, Produktcodes
IBM, Intel, Cisco, Sony
OBI
ANSI X.12
Transportprotokolle, Dokumententypen, Sicherheitsprotokolle, organisatorisches Modell
BASF, Sun, Oracle,
Biztalk
ANSI X.12
Dokumententypen, Sicherheitsprotokolle, Vorgehensmodell
Boing, SAP
ebXML
XML
Dokumententypen, Infrastruktur für die Datenkommunikation
Oasis, UN/CEFACT, Oracle
ZwischenȱEDIȱundȱXMLȱfindetȱeineȱAnnährungȱstatt,ȱdaȱsieȱgleichermaßenȱfürȱdenȱ Datenaustauschȱ genutztȱ werdenȱ können.ȱ Dieȱ EDIFACTȬNormȱ konkretisiertȱ mitȱ ihrerȱ Syntaxȱ fürȱ Nachrichtentypenȱ undȱ ihremȱ Repositoryȱ fürȱ Elementeȱ undȱ SegȬ menteȱ denȱ Austauschȱ vonȱ Geschäftsdaten.ȱ Fürȱ XMLȱ müssenȱ dieseȱ Einzelheitenȱ erstȱnochȱdefiniertȱwerden.ȱDieȱXML/EDIȬInitiativeȱhatȱhierfürȱbereitsȱVorarbeitenȱ geleistet,ȱ indemȱ sieȱ dieȱ bestehendeȱ ANSIȱ X12.Notationȱ nutztȱ undȱ inȱ eineȱ XMLȬ Semantikȱ überträgt.ȱ Derȱ Schwerpunktȱ liegtȱ dabeiȱ nichtȱ aufȱ derȱ exaktenȱ TransforȬ mationȱderȱeinzelnenȱNachrichtentypen,ȱsondernȱinȱderȱBereitstellungȱeinerȱstrukȬ turiertenȱ Umsetzungsmethodik.ȱ Dieseȱ beinhaltetȱ nebenȱ derȱ Konventionȱ zurȱ einȬ deutigenȱ Namensvergabeȱ auchȱ dieȱ Realisierungȱ vonȱ Wiederholungen,ȱ semantiȬ
48 ȱ
2.4ȱȱKontrollfragenȱ schenȱ Hierarchienȱ undȱ Codelisten.ȱ Inȱ einemȱ XMLȬDTDȱ werdenȱ dazuȱ ElementȬ gruppenȱ undȱ ihreȱ Attributeȱ definiert,ȱ TagȬBezeichnungenȱ zugewiesenȱ undȱ dieȱ BeziehungenȱzwischenȱdenȱeinzelnenȱTagsȱinȱFormȱvonȱHierarchienȱfestgelegt.ȱFürȱ dieȱZuordnungȱmussȱjedemȱEDIȬElementȱundȱȬCodeȱeinȱeindeutigerȱIdentifikatorȱ entsprechen.ȱ Beiȱ derȱ entsprechendenȱ TagȬVergabeȱ imȱ XMLȬKontextȱ spieltȱ nebenȱ derȱ Eindeutigkeitȱauchȱdieȱ Vergabeȱ„sprechender“ȱBezeichnerȱ eineȱ Rolle.ȱ Hierfürȱ istȱesȱwichtig,ȱeinenȱNamensraumȱzuȱschaffen,ȱderȱeineȱstrukturierte,ȱmethodischeȱ Vergabepraxisȱerlaubt.ȱDamitȱzeigtȱsich,ȱdassȱEDIȱundȱXMLȱkeineswegsȱohneȱAnȬ passungsaufwandȱineinanderȱüberführbarȱsind.ȱ Tabelleȱ2.7:ȱXMLȱversusȱEDIFACTȱ XML
EDIFACT
Generische Auszeichnungssprache für beliebige Anwendungen
Schwerpunkt Geschäftsdatenaustausch
Frei definierbare Tags ohne Standardsemantik
Normierte Syntax und Semantik
Sowohl Mensch-Maschine- als auch Maschine-Maschine-Kommunikation
Ausschließlich Maschine-MaschineKommunikation
Verschiedenste Anwendungsbereiche
Geschäftsprozessorientierung
Kostengünstige Basistechnologie
Aufwendige Infrastruktur
2.4 Kontrollfragen 1. 2. 3. 4. 5. 6.
WieȱwirkenȱKlassifikationȱundȱExtraktionȱzusammen?ȱ WelcheȱSchwächenȱweisenȱstatistischeȱVerfahrenȱderȱExtraktionȱauf?ȱ WelchesȱPotentialȱlässtȱdasȱKonzeptȱdesȱTextȬMiningsȱerkennen?ȱ AnȱwelchenȱMerkmalenȱlässtȱsichȱAlterȱundȱHerkunftȱvonȱEDIȱerkennen?ȱ WelcheȱVorȬȱundȱNachteileȱhatȱderȱAustauschȱvonȱGeschäftsdatenȱmitȱEDI?ȱ WelcheȱProblemeȱexistierenȱsowohlȱbeimȱEinsatzȱvonȱEDIȱalsȱauchȱbeiȱderȱ VerwendungȱvonȱXML?ȱ 7. WelcheȱIdeeȱstecktȱhinterȱWebȬEDIȱundȱwasȱsollȱdiesesȱKonzeptȱerreichen?ȱ 8. WelchesȱsindȱdieȱbesonderenȱMerkmaleȱvonȱXML?ȱ 9. WelcheȱBegleitstandardsȱexistierenȱzuȱXML?ȱ 10. WieȱunterstütztȱOCRȱdieȱKlassifikation?ȱ
ȱ
49
3 ECM Manage-Komponente 3.1 Dokumentenmanagement Datenȱ sindȱ nichtȱ gleichȱ Daten.ȱ Dieȱ Artȱ wieȱ sieȱ inȱ Unternehmenȱ benötigtȱ werden,ȱ bestimmtȱ ihrenȱ Wert.ȱ Anȱ ersterȱ Stelleȱ stehenȱ unternehmenskritischeȱ Daten.ȱ Sieȱ müssenȱständigȱverfügbarȱsein,ȱumȱGeschäftsprozesseȱzuȱjederȱZeitȱvonȱjedemȱOrtȱ zuȱ unterstützen.ȱ Amȱ Endeȱ derȱ Wertskalaȱ stehenȱ unkritischeȱ Daten,ȱ dieȱ nurȱ nochȱ ausȱ rechtlichenȱ Gründenȱ aufbewahrtȱ werdenȱ müssen,ȱ aberȱ fürȱ denȱ eigentlichenȱ GeschäftsablaufȱkeineȱBedeutungȱmehrȱbesitzen.ȱDochȱauchȱimȱzeitlichenȱVerlaufȱ istȱderȱWertȱderȱDatenȱnichtȱkonstant:ȱDatenȱhabenȱeinenȱindividuellenȱLebenszykȬ lus,ȱderȱsieȱzumȱeinemȱZeitpunktȱextremȱwertvoll,ȱzuȱeinemȱanderenȱnurȱnochȱalsȱ Ablageȱerscheinenȱlässt.ȱGekoppeltȱmitȱdemȱMerkmalȱZeitȱwächstȱauchȱdasȱMerkȬ malȱUmfang.ȱ UmȱdieȱständigȱwachsendeȱInformationsflutȱinȱderȱbetrieblichenȱInformationsverȬ arbeitungȱ zuȱ bändigen,ȱ müssenȱ Datenȱ schnellȱ undȱ unproblematischȱ bearbeitet,ȱ weitergegebenȱundȱentsprechendȱihrerȱBestimmungȱverwaltetȱundȱarchiviertȱwerȬ den.ȱ Überallȱ istȱ esȱ aberȱ dasȱ Papierȱ bzw.ȱ seinȱ Wegȱ durchȱ dasȱ Unternehmen,ȱ dasȱ Tempo,ȱQualitätȱundȱKostenȱderȱVorgangsbearbeitungȱbestimmt.ȱDieseȱDominanzȱ desȱ Papiersȱ alsȱ Trägermediumȱ fürȱ Informationenȱ ändertȱ sichȱ nurȱ sehrȱ langsam.ȱ Zwarȱ istȱ seinȱ Anteilȱ rückläufig,ȱ dieȱ herausragendeȱ Rolleȱ desȱ Papiersȱ alsȱ Mediumȱ derȱArbeitsorganisationȱbleibtȱinȱnaherȱZukunftȱjedochȱunangetastet.ȱErschwerendȱ kommtȱeinȱweitererȱTrendȱhinzu.ȱEinȱGroßteilȱderȱkritischenȱInformationȱliegtȱvorȬ aussichtlichȱ alsȱ EȬMailȱ vor.ȱ Dieseȱ sindȱ wieȱ Briefeȱ oderȱ Schriftstückeȱ inȱ Faxformatȱ gleichwertigeȱDokumenteȱmitȱvollerȱkaufmännischerȱRelevanz.ȱIhrȱVorteilȱist,ȱdassȱ sieȱimȱUnterschiedȱzuȱSchriftstückenȱdigitalȱexistierenȱundȱinȱderȱRegelȱdirektȱeiȬ nemȱMitarbeiterȱzugeordnetȱsind.ȱȱ Dennoch:ȱ Dokumentenmanagementȱ alsȱ einesȱ derȱ Lösungskonzepteȱ zurȱ EindämȬ mungȱ derȱ Papierlawineȱ bedeutetȱ nichtȱ dasȱ Wiederbelebenȱ derȱ altenȱ Visionȱ vomȱ papierlosenȱBüro,ȱsondernȱverfolgtȱdasȱZiel,ȱdieȱProblemeȱpapiergebundenerȱVorȬ gängeȱ undȱ Informationenȱ zuȱ mildern.ȱ Damitȱ wirdȱ esȱ zurȱ Schaltzentraleȱ fürȱ dieȱ Erstellung,ȱVerteilungȱ undȱ Archivierungȱ jeglicherȱArtȱ vonȱ Vorgängen.ȱVieleȱAufȬ gabenȱdesȱklassischenȱDokumentenmanagementsȱbeziehenȱsichȱaufȱoperativeȱGeȬ schäftsprozesse:ȱ Funktionenȱ wieȱ Scannen,ȱ Weiterleitenȱ anȱ Arbeitsplätzeȱ undȱ BeȬ legarchivierungȱ unterstützenȱ dieȱ Abwicklungȱ desȱ Tagesgeschäftes.ȱ Dieȱ hierfürȱ eingesetztenȱ Systemeȱ sindȱ aufȱ dieȱ Steuerungȱ desȱ Dokumentenflussesȱ undȱ dieȱ Verwaltungȱ desȱ Dokumentenlebenszyklusȱ ausgerichtet.ȱ Entscheidungsträgerȱ stelȬ lenȱhäufigȱandereȱAnforderungen:ȱȱ
ȱ
51
3ȱȱECMȱManageȬKomponenteȱ – Langfristigeȱ Sammlungȱ undȱ Verfügbarkeitȱ entscheidungsrelevanterȱ DokuȬ menteȱwieȱProjektberichteȱoderȱMarktanalysenȱ – Organisationȱ derȱ Dokumentensammlungȱ nachȱ unternehmensbestimmenȬ denȱSachverhaltenȱwieȱProdukten,ȱFilialenȱoderȱZeitspannenȱ – SucheȱundȱRelevanzbewertungȱimȱKontextȱderȱEntscheidungssituationȱ – Verknüpfungȱ mitȱ quantitativenȱ Informationenȱ wieȱ Umsatzkennzahlen,ȱ AbȬ satzzahlenȱoderȱMarktanteilenȱȱȱȱ
3.1.1
Dokument
WasȱeinȱDokumentȱist,ȱdieseȱFrageȱanȱeinenȱNotarȱgerichtetȱwirdȱeineȱandereȱAntȬ wortȱhervorrufenȱalsȱeinemȱHistorikerȱgestellt.ȱ ȱ EinȱDokumentȱimȱklassischenȱSinneȱistȱeinȱSchriftstück,ȱinȱdemȱdieȱGedankenȱvonȱ Menschen,ȱ mitȱ Hilfeȱ vonȱ herkömmlichenȱ Zeichenȱ oderȱ Symbolen,ȱ dargestelltȱ werden.ȱEinȱDokumentȱsollȱalsoȱetwasȱ„dokumentieren“,ȱd.h.ȱeinenȱNachweisȱerȬ bringen,ȱeinȱEreignisȱoderȱeinenȱVorgangȱfesthaltenȱoderȱeineȱchronologischeȱAufȬ zeichnungȱvornehmen.ȱDokumenteȱimȱITȬSinneȱsindȱalleȱObjekteȱaufȱPapierȱoderȱ inȱelektronischerȱForm,ȱdieȱInformationenȱfürȱdieȱjeweiligenȱbetrieblichenȱProzesȬ seȱzurȱVerfügungȱstellen.ȱDokumenteȱwerdenȱgruppiertȱundȱgemäßȱihresȱInhaltesȱ kategorisiert,ȱz.B.ȱnachȱRechnungen,ȱVerträgenȱetc.ȱ
ȱ Derȱ Begriffȱ Dokumentȱ spiegeltȱ damitȱ einenȱ konkretenȱ Bezugȱ zuȱ papiergebundeȬ nemȱSchriftgutȱwider.ȱMitȱeinemȱDokumentȱwirdȱallgemeinȱeineȱhoheȱinhaltlicheȱ QualitätȱundȱeineȱrechtlicheȱBedeutungȱverbunden,ȱsowieȱeineȱunmittelbareȱNäheȱ zurȱUrkunde.ȱ Einȱ Dokumentȱ wirdȱ häufigȱ nachȱ Informationenȱ beurteilt,ȱ dieȱ esȱ imȱ ZusammenȬ hangȱ mitȱ einerȱ Aufgabeȱ erfüllt.ȱ Soȱ lassenȱ sichȱ formaleȱ Angabenȱ wieȱ Autorȱ oderȱ Erstellungsdatum,ȱ externeȱ Elementeȱ wieȱ Deskriptorenȱ oderȱ interneȱ BeschreiȬ bungsmerkmaleȱ wieȱ Stichwörterȱ unterscheiden.ȱ Alsȱ Erweiterungȱ derȱ papiergeȬ bundenenȱ Sichtȱ wirdȱ einȱ elektronischesȱ Dokumentȱ alsȱ physischerȱ Ausdruckȱ aufȱ einemȱdigitalenȱDatenträgerȱverstanden.ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ
52 ȱ
3.1ȱȱDokumentenmanagementȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ Abbildungȱ3.1:ȱDokumenteneigenschaftenȱ
Einȱ Dilemmaȱ bestehtȱ darin,ȱ dassȱ vieleȱ Dokumenteȱ Animationen,ȱ Video,ȱ Soundȱ oderȱ Multimediaanteileȱ enthaltenȱ undȱ damitȱ dieȱ Vorstellungȱ herkömmlicherȱ ForȬ menȱ sprengen.ȱ Dieseȱ Sichtweiseȱ legtȱ esȱ nahe,ȱ Dokumenteȱ nichtȱ mehrȱ ausschließȬ lichȱ alsȱ Papierkopieȱ zuȱ betrachten,ȱ sondernȱ alsȱ Informationsträgerȱ fürȱ denȱ menȬ schlichenȱKonsumȱ[Techguide].ȱȱ Durchȱ dieȱ Einführungȱ derȱ WebȬTechnologienȱ wandeltȱ sichȱ derȱ Begriffȱ „DokuȬ ment“ȱweiterȱfundamental.ȱWirdȱeinȱDokumentȱklassischerweiseȱalsȱeinȱgeschlosȬ senesȱGanzesȱbetrachtet,ȱgewinntȱzunehmendȱdieȱinnereȱStrukturȱfürȱdieȱNutzungȱ anȱ Bedeutung.ȱ Gleicheȱ Inhalteȱ müssenȱ fürȱ unterschiedlicheȱ Zielgruppenȱ undȱ fürȱ unterschiedlicheȱMedienȱaufbereitetȱwerden.ȱDieseȱAufgabeȱgewinntȱzusätzlichȱanȱ Komplexität,ȱ wennȱ dieȱ Inhalteȱ inȱ verschiedenenȱ Sprachen,ȱ fürȱ Produktvariantenȱ oderȱinȱdiversenȱVersionenȱgepflegtȱwerdenȱmüssen.ȱȱ EineȱbesondereȱQualitätȱgewinntȱderȱDokumentbegriffȱdurchȱdieȱdigitaleȱSignaturȱ [Kampffmeyer].ȱIhrȱsollȱalsȱSicherheitsmerkmalȱzurȱGewährleistungȱderȱAuthentiȬ zitätȱ desȱ Absendersȱ undȱ derȱ Integritätȱ desȱ Inhaltesȱ dieȱ gleicheȱ rechtlicheȱ BedeuȬ tungȱ zukommenȱ wieȱ derȱ Unterschriftȱ aufȱ Papier.ȱ Durchȱ einȱ Signaturgesetzȱ hatȱ
ȱ
53
3ȱȱECMȱManageȬKomponenteȱ DeutschlandȱdieȱentsprechendenȱRahmenbedingungenȱdazuȱgeschaffen.ȱBeiȱbreiterȱ AkzeptanzȱkönnenȱohneȱdenȱUmwegȱdesȱPapiers,ȱd.h.ȱohneȱMedienbrücheȱVerträȬ geȱ geschlossen,ȱ Bestellungenȱ getätigtȱ oderȱ Rechnungenȱ zugestelltȱ werden.ȱ Dasȱ rechtswirksameȱelektronischeȱDokumentȱstelltȱdaherȱeinenȱentscheidendenȱDurchȬ bruchȱfürȱdasȱDokumentenmanagementȱdar.ȱ
3.1.2
Dokumentenmanagementsysteme
Dieȱ Zusammenfassungȱ derȱ Dokumenteȱ undȱ ihreȱ Verwaltungȱ istȱ Aufgabeȱ einesȱ Dokumentenmanagementsystems:ȱ ȱ Einȱ Dokumentenmanagementsystemȱ dientȱ zurȱ Organisationȱ undȱ Koordinationȱ derȱ Entwicklung,ȱ Überarbeitung,ȱ Überwachungȱ undȱ Verteilungȱ vonȱ Dokumentenȱ allerȱ Artȱ überȱ ihrenȱ gesamtenȱ LebensȬ zyklusȱvonȱihrerȱEntstehungȱbisȱzuȱihrerȱVernichtung.ȱZwischenȱdiesenȱ Etappenȱ liegenȱ KontrollȬ,ȱ SteuerungsȬȱ undȱ Weiterleitungsfunktionen.ȱ Dieȱ Erschließungȱ desȱ Dokumenteninhaltes,ȱ seineȱ vorübergehendeȱ Speicherung,ȱ dieȱ gesetzlichȱ vorgeschriebeneȱ Langzeitarchivierung,ȱ dieȱ Bearbeitung,ȱ derȱ Ausdruckȱ undȱ dieȱ Übermittlungȱ anȱ andereȱ anȱ derȱ Bearbeitungȱ beteiligtenȱ Organisationseinheitenȱ oderȱ Mitarbeiterȱ werdenȱ durchȱ dieȱ siebenȱ Vsȱ beschrieben:ȱ Verarbeiten,ȱ Verwahren,ȱ Verhindern,ȱ Verfügen,ȱ Verändern,ȱ Verwaltenȱ undȱ Vernichtenȱ [DMSȬ Fibel].ȱ Eineȱ Informationȱ entsteht,ȱ wirdȱ archiviert,ȱ mussȱ vorȱ unberechtigtemȱ Zugriffȱ geschütztȱ werden,ȱ sollȱ wiedergefunden,ȱ kannȱ bearbeitet,ȱ mussȱ gepflegtȱ undȱ verwaltetȱ werden,ȱ umȱ zuȱ einemȱ festgelegtenȱZeitpunktȱgezieltȱgelöschtȱzuȱwerden.ȱ ȱ Unabhängigȱ vomȱ Zielȱ stehenȱ alleȱ schriftlichenȱ Unterlagenȱ mitȱ anderenȱ Objektenȱ derȱ Geschäftstätigkeitȱ inȱ Verbindung:ȱ mitȱ Bearbeiternȱ undȱ derenȱ Vertretern,ȱ mitȱ anderenȱDokumentenȱoderȱKundenȱundȱLieferanten.ȱEinȱidealesȱDokumentenmaȬ nagementȱ unterstütztȱ alleȱ dieseȱ Schritte:ȱ jedesȱ Schriftstückȱ mitȱ allenȱ relevantenȱ Zusatzinformationenȱ zuȱ erfassen,ȱ inȱ elektronischeȱ Objekteȱ zuȱ verwandeln,ȱ mitȱ einemȱ Indexȱ zuȱ versehenȱ undȱ anȱ dieȱ autorisierteȱ Endstationȱ zuȱ verteilen.ȱ Obȱ alsȱ BasisȱeineȱDatei,ȱeinȱDatensatzȱoderȱeinȱVerweisȱdient,ȱistȱfürȱdenȱAnwenderȱunerȬ heblich.ȱ Dieseȱ Möglichkeitenȱ verändernȱ aberȱ dieȱ Anforderungenȱ anȱ dieȱ ehemalsȱ papiergebundeneȱ Sichtweise.ȱ Dokumentenmanagementsystemeȱ müssenȱ denȱ ZuȬ stand,ȱ dieȱ Zusammensetzung,ȱ dieȱ Formȱ undȱ denȱ Inhaltȱ wiedergeben,ȱ denȱ einȱ Schriftstückȱ beiȱ seinerȱ Erstellungȱ hatte.ȱ Durchȱ automatischeȱ Aktualisierungen,ȱ dynamischeȱ Linksȱ oderȱ Abhängigkeitenȱ vonȱ Darstellungȱ undȱ Laufzeitumgebungȱ erweitertȱsichȱeinerseitsȱderȱBegriffȱdesȱDokumentes,ȱschafftȱaberȱandererseitsȱneueȱ Manipulationsmöglichkeiten.ȱ Dokumenteȱ wandelnȱ sichȱ damitȱ zuȱ einemȱ umfasȬ sendenȱ Objekt,ȱ dasȱ nebenȱ seinemȱ Inhaltȱ durchȱ Umfeldparameterȱ undȱ Merkmale,ȱ
54 ȱ
3.1ȱȱDokumentenmanagementȱ dieȱ zumȱ Wiederauffindenȱ oderȱ zurȱ Reproduktionȱ dienen,ȱ beschriebenȱ wirdȱ [Kampffmeyer].ȱȱȱ Einȱ Dokumentenmanagementsystemȱ stelltȱ unabhängigȱ vonȱ seinerȱ inhaltlichenȱ PositionierungȱundȱFunktionalitätȱimȱGeschäftsablaufȱEinzelaktivitätenȱzurȱVerfüȬ gung,ȱ dieȱ sichȱ alleinȱ aufȱ dieȱ Verwaltungȱ derȱ einzelnenȱ Dokumenteȱ beziehen.ȱ Esȱ decktȱfolgendeȱFunktionenȱab:ȱ – – – – – – – –
BenutzerverwaltungȱundȱZugriffssteuerung,ȱ Dokumentenimport,ȱ automatische,ȱrechnergestützteȱoderȱmanuelleȱIndexierung,ȱ AblageȱundȱArchivierungȱ BearbeitungȱmitȱCheckȬInȱundȱCheckȬOut,ȱ VerwaltungȱundȱVersionierung,ȱ SuchenȱundȱFinden,ȱ ArchivierungȱundȱLöschung.ȱ
DieseȱFunktionenȱwerdenȱangereichertȱdurchȱdieȱimȱVerwaltungsumfeldȱtypischenȱ FunktionalitätenȱWiedervorlage,ȱHaftnotizen,ȱVorgangsmappeȱoderȱPostkorb.ȱUmȱ denȱ Leistungsumfangȱ sinnvollȱ inȱ einenȱ geschäftlichenȱ Ablaufȱ zuȱ integrieren,ȱ beȬ darfȱes:ȱ – derȱ Sicherstellung,ȱ dassȱ dieȱ richtigeȱ Informationȱ derȱ richtigenȱ Personȱ zumȱ richtigenȱZeitpunktȱvorliegtȱȱ – derȱ Überwachungȱ derȱ Abhängigkeitenȱ zwischenȱ Dokumentenȱ undȱ derjeniȬ genȱ Daten,ȱ dieȱ fürȱ dieȱ Dokumentenbearbeitungȱ benötigtȱ werden,ȱ undȱ derȱ IndizierungȱzurȱNutzungȱvonȱSuchtechnologienȱȱ – derȱVerwaltungȱderȱZugriffsberechtigungenȱundȱunterschiedlicherȱVersiȬ onsstände,ȱderȱSicherstellungȱeinesȱkonsistentenȱBestandesȱdurchȱCheckȬ in/CheckȬoutȬVerfahrenȱȱ Dokumentenmanagementsystemeȱ gestattenȱ dieȱ Verwaltungȱ mehrererȱ Versionenȱ desselbenȱDokumentes,ȱumȱderenȱLebenszyklusȱnachzuvollziehen.ȱDieserȱMechaȬ nismusȱ hatȱ Bedeutungȱ fürȱ Dokumente,ȱ dieȱ einerȱ ständigenȱ Weiterentwicklungȱ unterliegenȱ undȱ derenȱ Entwicklungsständeȱ zeitpunktbezogenȱ protokolliertȱ werȬ denȱ müssen.ȱ Diesȱ trifftȱ z.B.ȱ fürȱ Konstruktionszeichnungenȱ fürȱ dieȱ Bauindustrieȱ oderȱfürȱdieȱChargenverwaltungȱderȱpharmazeutischenȱIndustrieȱzu.ȱDieȱzugrunȬ deȱliegendeȱCheckȬinȱ/ȱCheckȬoutȬProzedurȱgewährleistetȱeineȱzuverlässigeȱAktuaȬ litätȱderȱDokumente.ȱDerȱCheckȬoutȬVorgangȱsperrtȱdasȱDokumentȱfürȱdieȱweitereȱ Bearbeitungȱ undȱ erlaubtȱ lediglichȱ einenȱ Lesezugriff.ȱ ȱ Derȱ Versuch,ȱ einȱ „ausgeȬ checktes“ȱDokumentȱzuȱbearbeiten,ȱführtȱzuȱeinemȱHinweisȱfürȱdenȱAnwenderȱaufȱ denjenigen,ȱderȱdasȱDokumentȱgeradeȱbearbeitet.ȱDieȱSperrungȱwirdȱerstȱaufgehoȬ ben,ȱȱwennȱdasȱDokumentȱdieȱvorgeseheneȱCheckȬinȬProzedurȱerfolgreichȱdurchȬ laufenȱhat.ȱȱȱ ȱ
ȱ
55
3ȱȱECMȱManageȬKomponenteȱ Zurȱ Einbindungȱ inȱ dasȱ betrieblicheȱ Geschehenȱ mussȱ jedesȱ DokumentenmanageȬ mentsystemȱseineȱeinzelnenȱDokumenteȱinhaltlichȱerschließen.ȱNurȱdannȱsindȱdieȱ zuvorȱ beschriebenenȱ Funktionenȱ aufȱ denȱ Dokumentenȱ durchführbar.ȱ InformatioȬ nenȱlassenȱsichȱinȱzweiȱKategorienȱeinteilen:ȱstrukturierteȱundȱunstrukturierteȱDaȬ ten.ȱ Währendȱ dieȱ Bearbeitungȱ strukturierterȱ Dokumenteȱ formalenȱ GesichtspunkȬ tenȱ gehorchtȱ undȱ überȱ Mechanismenȱ wieȱ Textanalyseȱ oderȱ Klassifikationȱ weitgeȬ hendȱ automatisiertȱ werdenȱ kann,ȱ liegtȱ imȱ Bereichȱ schwachȱ strukturierterȱ DokuȬ menteȱundȱihrerȱinhaltlichenȱErschließungȱnochȱgroßesȱPotenzial.ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ Abbildungȱ3.2:ȱVerteilungȱstrukturierterȱundȱschwachȱstrukturierterȱDokumenteȱ
EineȱquantitativeȱEinschätzungȱdesȱPotentialsȱeinesȱDMSȬEinsatzesȱzeigtȱfolgendeȱ Übersichtȱ[Arbeitsgemeinschaft]:ȱ Tabelleȱ3.1:ȱEinsparpotentialȱdurchȱDokumentenmanagementȱ Tätigkeit
Veränderung
Reduzierung der Bearbeitungszeit
50 – 90 %
Herabsetzung des Sachbearbeiteraufwandes
10 – 35 %
Erhöhung der Sachbearbeiterproduktivität
20 – 30 %
Senkung der Bearbeitungskosten je Dokument
20 – 40 %
Verkürzung der Durchlaufzeit
20 – 40 %
Einsparung an Bürofläche
30 – 50 %
Steigerung der Kundenzufriedenheit
30 – 50 %
ȱ
56 ȱ
3.1ȱȱDokumentenmanagementȱ ȱ
Abbildungȱ3.3:ȱProblemeȱdesȱDokumentenmanagementsȱ
3.1.3
Papier
BevorȱelektronischeȱUnterschriftȱundȱdigitaleȱSignaturȱWirklichkeitȱwerden,ȱbasieȬ renȱ dieȱ Büroabläufeȱ weiterhinȱ aufȱ Papier.ȱ Trotzȱ dieserȱ Einsichtȱ werdenȱ ArbeitsȬ vorgängeȱundȱȬabläufeȱnochȱimmerȱweitgehendȱmanuellȱgesteuert:ȱdieȱDokumenteȱ gelangenȱ inȱ dieȱ Ablageȱ desȱ Mitarbeitersȱ undȱ werdenȱ bisȱ zurȱ Freigabeȱ perȱ Handȱ weitergereicht.ȱDieȱVorgangsbearbeitungȱimȱTeamȱbleibtȱeherȱdieȱAusnahme.ȱ PapierȱhatȱeineȱlangeȱTradition.ȱAberȱnichtȱnurȱGewohnheitȱundȱTraditionȱlassenȱ amȱPapierȱfesthalten.ȱEsȱbietetȱgegenüberȱTastatur,ȱMaus,ȱBildschirmȱundȱanderenȱ GerätenȱvieleȱpraktischeȱVorteile.ȱEsȱistȱleicht,ȱhandlichȱundȱmobil;ȱesȱkannȱangeȬ fasstȱ werdenȱ undȱ sprichtȱ aufȱ dieseȱ Weiseȱ mehrȱ Sinneȱ anȱ alsȱ dasȱ elektronischeȱ Äquivalent.ȱ Auchȱ räumlicheȱ Aspekteȱ erleichternȱ denȱ Umgangȱ mitȱ Dokumenten:ȱ Papierȱ kannȱ nebenȬȱ undȱ übereinanderȱ gelegtȱ werden.ȱ Ebenfallsȱ Bedeutungȱ trägtȱ derȱ Vorteil,ȱ dassȱ Informationenȱ aufȱ Papierȱ leichterȱ annotiertȱ werdenȱ könnenȱ alsȱ elektronischeȱ Dokumente.ȱ Imȱ Rahmenȱ derȱ „Büroumfrageȱ 2003“ȱ untersuchteȱ dasȱ GallupȬInstitutȱ dieȱ PapierȬGewohnheitenȱ inȱ europäischenȱ Büros.ȱ Dasȱ Ergebnisȱ dieserȱStudieȱzeigt,ȱdassȱüberȱ70%ȱderȱbefragtenȱMitarbeiterȱdemȱMediumȱPapierȱ immerȱ nochȱ denȱ Vorzugȱ geben.ȱ Diesȱ lässtȱ sichȱ anhandȱ weitererȱ Vorteileȱ desȱ MeȬ diumsȱ„Papier“ȱbegründen:ȱ – DokumenteȱsindȱaufȱPapierȱbesserȱlesbarȱalsȱaufȱdemȱBildschirm.ȱ – Dieȱ Fehlersucheȱ istȱ aufȱ ausgedrucktenȱ Dokumentenȱ besserȱ ausführbar,ȱ daȱ dieȱKonzentrationsfähigkeitȱhöherȱist.ȱ
ȱ
57
3ȱȱECMȱManageȬKomponenteȱ – Dieȱ direkteȱ Vervielfältigungȱ mittelsȱ Kopierenȱ ermöglichtȱ eineȱ schnellereȱ WeiterreichungȱdesȱDokumentesȱanȱDritte.ȱ – ZurȱVerwendungȱalsȱInformationsträgerȱbedarfȱesȱinȱkeinemȱLandȱderȱErdeȱ desȱErlernensȱdesȱUmgangsȱmitȱihm.ȱ DemȱstehenȱnaturgemäßȱauchȱNachteileȱentgegen:ȱ – Aufgrundȱ vonȱ Medienbrüchenȱ istȱ keineȱ BeȬȱ undȱ Verarbeitungsmöglichkeitȱ vonȱPapierȱinȱelektronischenȱGeschäftsprozessenȱmöglich.ȱ – DurchȱAblageȱunwichtigerȱDokumenteȱentstehtȱeinȱhoherȱPlatzverbrauchȱimȱ Büro.ȱ – DurchȱzeitaufwändigesȱBearbeitenȱvonȱGeschäftsprozessenȱentstehtȱeinȱImȬ ageverlustȱdesȱUnternehmens.ȱ – Dieȱ langsameȱ verbaleȱ oderȱ schriftlicheȱ Kommunikationȱ verhindertȱ einȱ schnellesȱ Auffindenȱ vonȱ abgelegtenȱ Dokumenten;ȱ dadurchȱ wirdȱ eineȱ nahtȬ loseȱEinbindungȱinȱexistierendeȱInformationssystemeȱerschwert.ȱ – EsȱentstehenȱhoheȱWiederherstellkostenȱoderȱrechtlicheȱKonsequenzenȱbeimȱ FehlenȱwichtigerȱDokumente.ȱ – EineȱzuverlässigeȱTerminverfolgung,ȱDurchlaufkontrolle,ȱLokalisierungȱundȱ WiedervorlageȱvonȱVorgängenȱistȱkaumȱmöglich.ȱ – PapierȱalsȱInformationsträgerȱbedingtȱunproduktiveȱSortierȬ,ȱAblageȬ,ȱSuchȬ,ȱ KopierȬ,ȱ TransportȬȱ undȱ Liegezeitenȱ undȱ provoziertȱ aufwendigeȱ MedienȬ brüche.ȱ Letztlichȱgilt:ȱPapierȱ – – – – – – –
gehtȱverlorenȱ istȱunvollständigȱ istȱimȱUmlaufȱ wirdȱfalschȱabgelegtȱ wirdȱlangsamȱtransportiertȱ wirdȱfalschȱzugestelltȱ wirdȱkopiertȱ
undȱistȱalsȱFunktionsträgerȱbeschränkt,ȱweilȱesȱalsȱpassivesȱMediumȱ – – – – – –
keineȱPlausibilitätskontrolleȱ keineȱWarnungenȱ keineȱErinnerungenȱ keineȱLinksȱzuȱexternerȱInformationȱ keineȱKontrolleȱaufȱVollständigkeitȱ keineȱVorschriftenȱbezüglichȱStrukturȱundȱEinträgenȱ
erlaubt.ȱ Papierȱ alsȱ Basisinformationsträgerȱ wirdȱ logischȱ zuȱ Aktenȱ zusammengefasst,ȱ fürȱ dieȱ weitgehendȱ dieȱ gleichenȱ Restriktionenȱ wieȱ fürȱ einzelneȱ Blätterȱ gelten.ȱ Aktenȱ werdenȱ gesucht,ȱ befindenȱ sichȱ nichtȱ amȱ Arbeitsplatz,ȱ sindȱ verlegtȱ oderȱ geradeȱ
58 ȱ
3.1ȱȱDokumentenmanagementȱ durchȱ einenȱ Kollegenȱ inȱ Gebrauch.ȱ Dieȱ Schwachstellenȱ derȱ Papiergebundenheitȱ liegenȱaufȱderȱHand:ȱ – Sachbearbeiterȱ habenȱ keineȱ direkteȱ Recherchemöglichkeitȱ undȱ keinenȱ unȬ mittelbarenȱ Zugriffȱ aufȱ denȱ Aktenbestand,ȱ außerȱ aufȱ ihreȱ Handaktenȱ amȱ Arbeitsplatzȱ – Dokumente,ȱ dieȱ mehrerenȱ Themenȱ zugeordnetȱ sind,ȱ erfordernȱ Kopienȱ zurȱ Mehrfachablageȱ – EsȱentstehtȱeinȱhoherȱAufwandȱzurȱÜberwachungȱvonȱTerminenȱundȱFristen,ȱ z.B.ȱfürȱdieȱWiedervorlageȱ – DerȱNachweisȱdesȱVerbleibsȱundȱderȱErhaltȱderȱVollständigkeitȱgestaltetȱsichȱ schwierig,ȱweilȱAktenȱweitergegebenȱwerden,ȱohneȱdassȱderȱWegȱnachvollȬ ziehbarȱistȱ NebenȱPapierȱbedarfȱdaherȱauchȱeineȱAkteȱeinerȱelektronischenȱAbbildung.ȱNurȱsoȱ kannȱ dieȱ Übersichtlichkeitȱ erreichtȱ werden,ȱ dieȱ eineȱ flexibleȱ Ablageȱ durchȱ eineȱ beliebigeȱGliederungstiefeȱerlaubt.ȱElektronischeȱAktenȱgestattenȱeineȱbenutzerbeȬ zogeneȱ Sichtȱ (Vertrieb,ȱ Buchhaltung,ȱ Technik,...)ȱ undȱ könnenȱ Inhaltsbereicheȱ abȬ hängigȱvonȱderȱAbteilungszugehörigkeitȱausblenden,ȱschützenȱoderȱhervorheben.ȱ Außerdemȱ sindȱ dieȱ Eigenschaftenȱ derȱ jederzeitigenȱ schnellenȱ Verfügbarkeitȱ undȱ derȱ stetenȱ Vollständigkeitȱ Gesichtspunkte,ȱ dieȱ zuȱ einerȱ beschleunigtenȱ SachbearȬ beitungȱ wesentlichȱ beitragen.ȱ Eineȱ Ablageȱ sollteȱ stetsȱ soȱ gestaltetȱ sein,ȱ dassȱ dieȱ notwendigenȱInformationenȱschnellȱauffindbarȱundȱfürȱjedenȱMitarbeiterȱtranspaȬ rentȱsind.ȱDiesemȱZielȱdienenȱverschiedeneȱOrdnungssysteme:ȱ – – – – –
3.1.4
Alphabetischȱ(nachȱFirmennamen).ȱ Numerischȱ(nachȱRechnungsnummer).ȱ Alphanumerisch.ȱ Chronologischȱ(nachȱEingangsdatumȱderȱRechnung).ȱ Mnemotechnischȱ (nachȱ bestimmtenȱ Kriterienȱ wieȱ Farbenȱ oderȱ AbkürzunȬ gen).ȱ
Informationsarten
Obwohlȱ imȱ Grundsatzȱ alleȱ Dokumenteȱ inȱ einȱ Dokumentenmanagementsystemȱ eingestelltȱwerdenȱmüssen,ȱverlangenȱWirtschaftlichkeitsgründeȱhäufigȱeineȱDiffeȬ renzierung.ȱSoȱistȱdieȱÜbernahmeȱkurzlebigerȱDokumenteȱwieȱEȬMailsȱoderȱNotiȬ zenȱfastȱimmerȱunwirtschaftlich,ȱsoȱdassȱderȱSchwerpunktȱeherȱaufȱSchriftstückenȱ mitȱ unmittelbaremȱ geschäftlichenȱ Bezugȱ liegt.ȱ Jeȱ nachȱ Lebensphaseȱ einesȱ DokuȬ mentesȱlassenȱsichȱzweiȱFunktionsbereicheȱunterscheiden:ȱ – Elektronischeȱ Archivierung:ȱDieserȱProzessȱstehtȱamȱEndeȱdesȱLebenszykȬ lusȱeinesȱDokumentes.ȱAbgelegtȱaufȱoptischeȱSpeichermedienȱwieȱCDsȱoderȱ WORMsȱ werdenȱ ehemaligeȱ Papierdokumenteȱ revisionssicherȱ elektronischȱ gespeichert.ȱ
ȱ
59
3ȱȱECMȱManageȬKomponenteȱ
ȱ
– Workflowmanagement:ȱ Dieȱ WorkflowȬFunktionalitätȱ beschreibtȱ dieȱ aktiveȱ Phaseȱ derȱ Dokumentenbearbeitung.ȱ Dokumenteȱ werdenȱ gemäßȱ definierterȱ Bearbeitungsschritteȱ weitergeleitet,ȱ indemȱ derȱ bestehendeȱ organisatorischeȱ AblaufȱnachȱdefiniertenȱRegelnȱdetailliertȱeingehaltenȱwird.ȱDazuȱistȱesȱnotȬ wendig,ȱalleȱphysischenȱOrte,ȱdenenȱDokumenteȱzugestelltȱwerden,ȱzuȱkenȬ nen,ȱdieȱAufgaben,ȱdieȱdortȱerledigtȱwerden,ȱzuȱdefinierenȱundȱfestzulegenȱ undȱeinȱDokumentȱvonȱeinemȱOrtȱzumȱnächstenȱzuȱtransportieren.ȱ
W Workflow HOST
Applikationen .doc
.txt
COLD
DMS .tif
E-Mail
Scanner Report
pcl .tif
Datenbank
Drucker Fax
ȱ Abbildungȱ3.4:ȱDigitalerȱDokumentenflussȱ
DemȱDokumentenmanagementȱliegtȱzwarȱdieȱrelativȱeinfacheȱIdeeȱzugrunde,ȱpaȬ piergebundeneȱ Vorgängeȱ elektronischȱ abzubilden,ȱ dieȱ Schwierigkeitenȱ steckenȱ aberȱ inȱ demȱ zuȱ bewältigendenȱ Informationsvolumenȱ undȱ derȱ fürȱ eineȱ KonvertieȬ rungȱ zurȱ Verfügungȱ stehendenȱ Technik.ȱ Umȱ dieȱ benötigtenȱ Informationenȱ jederȬ zeitȱverfügbarȱzuȱhaben,ȱwerdenȱPapierdokumenteȱdurchȱScannenȱoderȱdurchȱdieȱ UmwandlungȱinȱDatenaustauschformateȱdigitalisiert.ȱLetztlichȱentscheidetȱsichȱbeiȱ demȱÜbergangȱaufȱdigitaleȱMedien,ȱwieȱeffektiv,ȱkomfortabelȱundȱanȱdieȱArbeitsȬ vorgängeȱangepasstȱeinȱDokumentenmanagementsystemȱarbeitet:ȱ ȱ
60 ȱ
3.1ȱȱDokumentenmanagementȱ CIȬInformationȱ (codedȱ information):ȱ Informationen,ȱ dieȱ bereitsȱ inȱ einemȱ digitalenȱ Formatȱ vorliegen,ȱ seiȱ es,ȱ dassȱ sieȱ aufȱ Datenträgernȱ verfügbarȱ sindȱ oderȱ durchȱ dieȱ eigeneȱ ITȱ produziertȱ wurden.ȱ Dieȱ Übernahmeȱ vonȱ CIȬDokumentenȱ erfolgtȱ daherȱ ohneȱ Medienbrüche,ȱ manuellesȱ Sortierenȱ oderȱ Scanvorbereitungenȱ entfallen,ȱ dieȱ IndexieȬ rungȱ kannȱ automatisiertȱ werdenȱ undȱ Ressourcenȱ inȱ Formȱ vonȱ SpeicherkapazitätȱundȱRechnerleistungȱwerdenȱsparsamȱgenutzt.ȱ ȱ NCIȬInformationenȱ(NonȬCodedȬInformation):ȱInformationen,ȱdieȱnurȱ bildlichȱ inȱ Formȱ vonȱ PixelȬ/Rastergraphikȱ vorliegenȱ undȱ sichȱ perȱ ITȱ inhaltlichȱ nichtȱ erschließenȱ lassen.ȱ Hierbeiȱ handeltȱ esȱ sichȱ umȱ Geschäftsbriefe,ȱ Kaufverträgeȱ u.ä.,ȱ dieȱ dasȱ Unternehmenȱ verlassen,ȱ oderȱ esȱ überȱ denȱ Posteingangȱ erreichen.ȱ Eineȱ anschließendeȱ KonvertierungȱderȱDokumenteȱperȱOCRȱerfolgtȱzwarȱinȱderȱMehrzahlȱ derȱ Fälleȱ fehlerfrei,ȱ inȱ derȱ Praxisȱ dürftenȱ aberȱ allenfallsȱ 5ȱ –ȱ 10ȱ %ȱ derȱ Schriftstückeȱ perȱ OCRȱ bearbeitetȱ werden.ȱ Dazuȱ gehörenȱ wederȱ KorrespondenzȱnochȱProspekte,ȱaberȱEingangsrechnungenȱoderȱLieferȬ scheine. ȱ DieȱErscheinungsformȱistȱinȱderȱRegelȱvonȱderȱEntstehungȱderȱDokumenteȱabhänȬ gig.ȱ Einȱ gescanntesȱ Papierdokumentȱ istȱ einȱ NCIȬDokument,ȱ dennȱ dieȱ erzeugtenȱ elektronischenȱ Datenȱ repräsentierenȱ lediglichȱ einȱ fotographischesȱ Abbildȱ desȱ DoȬ kumenteninhalts.ȱEineȱAuswertung,ȱderȱTextinhalteȱistȱnichtȱmöglich.ȱWirdȱhingeȬ genȱ einȱ vorhandenesȱ NCIȬDokumentesȱ mitȱ einerȱ Schrifterkennungssoftwareȱ oderȱ einerȱVektorisierungssoftwareȱzurȱNachdigitalisierungȱvonȱGrafikenȱbearbeitet,ȱsoȱ könnenȱeinȱoderȱmehrereȱCIȬDokumenteȱerzeugtȱwerden,ȱdieȱparallelȱzumȱursprüngȬ lichenȱNCIȬDokumentȱexistieren.ȱ DerȱeigentlicheȱScanȬVorgangȱvollziehtȱsichȱinȱmehrerenȱTeilschritten:ȱ – Dokumentenvorbereitung:ȱ Größe,ȱArtȱundȱ Qualitätȱderȱ Dokumenteȱ habenȱ direktenȱEinflussȱaufȱdieȱVerarbeitungsgeschwindigkeitȱundȱsindȱdemzufolȬ geȱ einȱ wichtigerȱ Faktorȱ beiȱ derȱ Analyse,ȱ wieȱ schnellȱ neuȱ aufgenommeneȱ DokumenteȱdemȱBenutzerȱzurȱVerfügungȱstehen.ȱȱ – Dokumentenaufbereitung:ȱ Dieȱ Dokumentenvorlageȱ durchȱ Sortieren,ȱ EntȬ klammern,ȱGlättenȱoderȱAnfertigenȱeinerȱKopieȱvorzubereiten,ȱerfordertȱeiȬ nenȱerheblichenȱmanuellenȱMehraufwand.ȱȱ – Scangeschwindigkeit:ȱ Dieȱ Unterschiedlichkeitȱ derȱ Dokumenteȱ beeinflusstȱ dieȱ Geschwindigkeit,ȱ mitȱ derȱ Scannerȱ einȱ optimalesȱ Konversionsergebnisȱ liefern.ȱ Vonȱ derȱ Homogenitätȱ desȱ Schriftgutesȱ hängtȱ esȱ ab,ȱ wieȱ häufigȱ dieȱ ScanvorbereitungenȱinȱFormȱvonȱParametereinstellungenȱsindȱbzw.ȱwieȱexȬ zessivȱdieȱStapelverarbeitungȱüberȱeinenȱEinzugsscannerȱerfolgenȱkann.ȱ
ȱ
61
3ȱȱECMȱManageȬKomponenteȱ – Qualitätskontrolle:ȱ Inȱ Abhängigkeitȱ vonȱ derȱ Papierqualitätȱ undȱ derȱ Güteȱ desȱScannersȱvariiertȱdasȱUmwandlungsergebnisȱeinesȱDokumentesȱinȱseineȱ elektronischeȱ Form.ȱ Zurȱ Erzielungȱ einesȱ zufriedenstellendenȱ Ergebnissesȱ sindȱhäufigȱQualitätsstichprobenȱzuȱziehen.ȱDieȱQualitätȱdesȱErgebnissesȱbeȬ stimmtȱdenȱGradȱderȱNachbereitungȱerfassterȱDokumente.ȱ – Indexierung:ȱDasȱWiederauffindenȱeinesȱDokumentesȱhängtȱvonȱdenȱvergeȬ benenȱStichwörternȱseinerȱInhaltserfassungȱab.ȱOhneȱkorrekteȱundȱtreffendeȱ BegriffeȱverliertȱeinȱDokumentȱseineȱBedeutung.ȱȱ Dieȱ Qualitätsprüfungȱ mussȱ sicherstellen,ȱ dassȱ dasȱDokumentȱ korrekt,ȱ d.h.ȱseitenȬ richtig,ȱnichtȱverdreht,ȱohneȱgroßeȱVerschmutzungen,ȱmitȱkorrekterȱHelligkeitȱundȱ richtigemȱKontrastȱinȱderȱnotwendigenȱAuflösungȱerfasstȱwurde.ȱBeiȱmehrseitigenȱ Dokumentenȱistȱzuȱbedenken,ȱdassȱdieȱeingescannteȱSeitenfolgeȱeineȱlogischeȱZuȬ sammengehörigkeitȱdarstellt.ȱUmȱdieȱSeparationȱeinzelnerȱDokumenteȱzuȱgewährȬ leisten,ȱwerdenȱmehrereȱVerfahrenȱangeboten:ȱ – Durchȱ Einstellenȱ einesȱ Seitenzählersȱ wirdȱ automatischȱ dieȱ DokumentenȬ grenzeȱerkannt.ȱ – Alleȱ Seitenȱ werdenȱ zunächstȱ alsȱ Seitenȱ einesȱ einzigenȱ Dokumentesȱ behanȬ delt,ȱundȱderȱAnwenderȱlegtȱinȱeinemȱseparatenȱBearbeitungsschrittȱdieȱDoȬ kumentengrenzeȱexplizitȱfest.ȱ – EinzelneȱDokumenteȱwerdenȱdurchȱschwarzeȱSeitenȱgetrennt,ȱdieȱzuvorȱ demȱStapelȱzuȱscannenderȱDokumenteȱmanuellȱbeigefügtȱwerden.ȱ Zurȱ Reduzierungȱ desȱ Speicherbedarfsȱ werdenȱ Kompressionsalgorithmenȱ eingeȬ setzt,ȱdieȱsichȱinȱzweiȱVerfahrensgruppenȱteilen:ȱ – Kompressionȱ mitȱ Datenverlust,ȱ beiȱ denenȱ dieȱ Reduzierungȱ desȱ DatenvoȬ lumensȱmitȱEinschränkungenȱderȱWiedergabequalitätȱverbundenȱist,ȱwieȱsieȱ z.B.ȱdieȱStandardsȱJPEGȱundȱMPEGȱfürȱStandȬȱbzw.ȱBewegbilderȱbieten.ȱ – KomprimierungȱohneȱDatenverlust,ȱbeiȱderȱdieȱKompressionsrateȱdeutlichȱ niedrigerȱliegtȱundȱdieȱvornehmlichȱfürȱdasȱDokumentenmanagementȱeinȬ gesetztȱwird,ȱdasȱdenȱVerlustȱvonȱInformationȱimȱGegensatzȱzuȱBildinȬ formationenȱnichtȱtoleriert.ȱ Dieȱ Indizierungȱ legtȱ dieȱ Auswahlkriterienȱ fürȱ dasȱ Retrievalȱ derȱ Dokumenteȱ fest.ȱ Unabhängigȱ vonȱ derȱ Dokumentenartȱ CIȱ oderȱ NCIȱ mussȱ garantiertȱ sein,ȱ dassȱ dieȱ Indexdatenȱkorrektȱerfasstȱwerden,ȱdaȱeinȱfalscherȱIndexȱdazuȱführt,ȱdassȱeinȱDoȬ kumentȱunwiederbringlichȱverlorenȱgeht.ȱFürȱdasȱRetrievalȱderȱDokumenteȱbesitȬ zenȱdieȱDeskriptorenȱdamitȱdieȱgleicheȱBedeutungȱwieȱdieȱPrimärschlüsselȱfürȱdieȱ Identifizierungȱ vonȱ Sachverhaltenȱ inȱ relationalenȱ Datenbanken.ȱ Dieȱ bisherigeȱ paȬ piergebundeneȱ Ablageȱ basiertȱ aufȱ derȱ Vergabeȱ nurȱ einesȱ Kriteriumsȱ alsȱ SuchȬ grundlageȱundȱ schränktȱ damitȱdieȱ natürlicheȱ ArbeitsȬȱundȱ Denkweiseȱ derȱ BenutȬ zerȱ erheblichȱ ein.ȱ Wünschenswertȱ istȱ dieȱ freieȱ Vergabeȱ vonȱ Suchkennzeichen,ȱ soȱ dassȱdieȱInformationȱeindeutigȱidentifizierbarȱist,ȱdieȱFreiheitȱderȱIndexierungȱaberȱ nichtȱleidet.ȱGrundsätzlichȱlässtȱsichȱdieȱIndexierungȱinȱeineȱautomatischeȱundȱeineȱ
62 ȱ
3.1ȱȱDokumentenmanagementȱ manuelleȱ Varianteȱ einteilen.ȱ Beimȱ manuellenȱ Vorgehenȱ seinerseitsȱ ergebenȱ sichȱ wiederumȱzweiȱKonzepte:ȱ DasȱEinzelblattȬScannen,ȱd.h.ȱdieȱzuȱerfassendenȱKriterienȱwerdenȱ demȱ Belegȱ entnommenȱ undȱ überȱ eineȱ Erfassungsmaskeȱ eingegeȬ ben.ȱ Erstȱ danachȱ wirdȱ derȱ Belegȱ gescanntȱ undȱ mitȱ denȱ erfasstenȱ Datenȱarchiviert.ȱ o Dasȱ StapelȬScannen,ȱ d.h.ȱ dieȱ Belegeȱ werdenȱ stapelweiseȱ eingesȬ canntȱundȱinȱeinerȱErfassungsmaskeȱsukzessiveȱmitȱIndizesȱverseȬ hen.ȱ – Indexierenȱ vonȱ NCIȬDokumenten:ȱ Dieȱ Indexvergabeȱ fürȱ NCIȬDokumenteȱ kannȱaufȱdreiȱArtenȱerfolgen:ȱ o Fürȱ jedesȱ Dokumentȱ werdenȱ mehrereȱ Ordnungsmerkmaleȱ vergeȬ ben,ȱ dieȱ denȱ Kriterienȱ konventionellerȱ Archiveȱ entsprechen,ȱ wieȱ z.B.ȱ Name,ȱ Dokumentenart,ȱ Datum.ȱ Dieseȱ Merkmaleȱ werdenȱ alsȱ formaleȱDeskriptorenȱbezeichnet.ȱ o EsȱerfolgtȱeineȱVergabeȱvonȱBarcodes,ȱanhandȱdererȱeinȱDokumentȱ eindeutigȱidentifizierbarȱwird.ȱȱ o Programmeȱ zurȱ optischenȱ Zeichenerkennungȱ (OCR)ȱ überführenȱ NCIȬȱinȱCIȬDokumenteȱundȱverwendenȱderenȱVorgehenȱ – IndexierenȱvonȱCIȬDokumenten:ȱCIȬDokumenteȱwerdenȱsoftwaremäßigȱauȬ tomatischȱindexiert.ȱDabeiȱwerdenȱunterȱBerücksichtigungȱvonȱStoppwörȬ ternȱundȱWortstämmenȱdieȱDokumentenfelderȱextrahiert,ȱdieȱfürȱeineȱInȬ dexbildungȱrelevantȱsind.ȱȱ o
BeiȱderȱSucheȱinȱTextenȱundȱDokumentenȱstellenȱsichȱhäufigȱeinigeȱUnsicherheitenȱ einȱ[Fuhr,ȱ2004,ȱS.8]:ȱ – Dieȱ Formulierungȱ einerȱ zumȱ aktuellenȱ Informationsbedürfnisȱ passendenȱ AnfrageȱbereitetȱerheblicheȱProbleme.ȱ – MeistensȱdurchläuftȱderȱProzessȱderȱAnfrageformulierungȱmehrereȱIteratioȬ nen,ȱbisȱpassendeȱAntwortenȱgefundenȱwerden.ȱ – Anfragenȱ liefernȱ potentiellȱ sehrȱ vieleȱ Antwortenȱ (vgl.ȱ dieȱ Gesamtzahlȱ derȱ Trefferȱ beiȱ InternetȬSuchmaschinen),ȱ aberȱ nurȱ wenigeȱ davonȱ sindȱ fürȱ denȱ Nutzerȱinteressant.ȱ – DasȱvorgenannteȱProblemȱentschärftȱsichȱdurchȱdieȱvomȱSystemȱbereitgestellteȱ Rangordnungȱ derȱ Antworten,ȱ wodurchȱ potentiellȱ relevanteȱ Antwortenȱ geȬ häuftȱ amȱ Anfangȱ derȱ Ranglisteȱ auftauchenȱ (z.B.ȱ betrachtenȱ beiȱ InternetȬ Suchmaschinenȱmehrȱalsȱ90%ȱallerȱNutzerȱnurȱdieȱerstenȱ10ȱAntworten)ȱ DasȱRetrievalȱvonȱDokumentenȱinȱDokumentenmanagementsystemenȱerfolgtȱübliȬ cherweiseȱüberȱdieȱvorherȱfestgelegtenȱDeskriptoren.ȱInȱvielenȱFällenȱstellenȱdieseȱ eindeutigeȱ Merkmaleȱ wieȱ VertragsȬ,ȱ BuchungsȬȱ oderȱ Mitgliedsnummernȱ dar.ȱ DoȬ kumenteȱ könnenȱ aberȱ auchȱ überȱ eineȱ Auswahlȱ vonȱ beschreibendenȱ Merkmalenȱ referenziertȱwerden,ȱdieȱbeliebigȱkombinierbarȱsindȱundȱnichtȱnotwendigȱeineȱeinȬ deutigeȱBeschreibungȱliefern.ȱȱ
ȱ
63
3ȱȱECMȱManageȬKomponenteȱ
3.1.5
Informationsarten und betrieblicher Ablauf
DerȱAufhängerȱzurȱIntegrationȱvonȱNCIȬDokumentenȱinȱdenȱbetrieblichenȱAblaufȱ stelltȱdieȱPosteingangsstelleȱdar.ȱDeshalbȱorientiertȱsichȱdieȱImplementierungȱstarkȱ anȱPostabläufen,ȱdieȱdenȱDokumentenflussȱoftȱdurchȱFilterfunktionen,ȱObjekteȱwieȱ EȬMailsȱ oderȱ Triggermeldungenȱ vonȱ Nachrichtenagenturenȱ ergänzenȱ undȱ inhaltȬ lichȱ analysieren.ȱ Jeȱ nachȱ Zeitpunktȱ derȱ Überführungȱ derȱ NCIȬDokumenteȱ inȱ einȱ elektronischesȱÄquivalentȱlassenȱsichȱdreiȱFormenȱunterscheiden:ȱ – SpätesȱErfassenȱbildetȱdieȱbisherigeȱVorgehensweiseȱderȱpapiergebundenenȱ Bearbeitungȱexaktȱnach.ȱDieȱDokumenteȱwerdenȱdurchȱeineȱneuȱeinzurichȬ tendeȱzentraleȱErfassungsstelleȱgescanntȱundȱarchiviert,ȱsobaldȱihreȱBearbeiȬ tungsphaseȱ abgeschlossenȱ ist.ȱ Anschließendȱ werdenȱ sieȱ nichtȱ physischȱ transportiert,ȱ sondernȱ inȱ Formȱ vonȱ Referenzenȱ denȱ Mitarbeiternȱ angezeigt.ȱ Hierdurchȱ wirdȱ gewährleistet,ȱ dassȱ alleȱ Änderungenȱ undȱ Ergänzungenȱ zuȱ einemȱDokumentȱvorgenommenȱwurdenȱundȱkeineȱNachbearbeitungȱerforȬ derlichȱist.ȱFürȱdieȱinvolviertenȱMitarbeiterȱbedeutetȱdieserȱAblaufȱnurȱeineȱ minimaleȱ VerhaltensȬȱ undȱ Verfahrensanpassung.ȱ Organisatorischeȱ UmstelȬ lungenȱ mitȱ ihrenȱ zeitlichenȱ undȱ psychologischenȱ Problemenȱ sindȱ deutlichȱ geringerȱ alsȱ beiȱ denȱ folgendenȱ Szenarien.ȱ Derȱ ursprünglicheȱ GeschäftsproȬ zessȱwirdȱlediglichȱdurchȱdieȱzentraleȱErfassungȱergänzt,ȱbeiȱderȱdieȱDokuȬ menteȱzusätzlichȱnochȱeinerȱPrüfungȱunterzogenȱundȱabgezeichnetȱwerdenȱ können.ȱ Darüberȱ hinausȱkönnenȱ dieȱMitarbeiterȱ durchȱ denȱ intensivenȱUmȬ gangȱmitȱderȱTechnologieȱsehrȱschnellȱdieȱQualitätȱderȱErfassungȱbeurteilen.ȱ Einȱ Nachteilȱ desȱ Verfahrensȱ bestehtȱ darin,ȱ dassȱ nichtȱ dasȱ volleȱ Potentialȱ elektronischerȱ Verteilungȱ vonȱ Dokumentenȱ ausgeschöpftȱ wird.ȱ Hinzuȱ kommtȱeineȱgrößereȱWahrscheinlichkeitȱfürȱeinȱVerlorengehenȱoderȱeineȱBeȬ schädigungȱ derȱ Dokumenteȱ aufȱ demȱ Transportȱ zwischenȱ Posteingangȱ undȱ Bearbeiter.ȱ – GleichzeitigesȱErfassenȱunterstütztȱdieȱErfassungȱamȱBearbeiterarbeitsplatz.ȱ Derȱ Bearbeiterȱ begutachtetȱ dieȱ Bildqualität,ȱ nimmtȱ eventuelleȱ Korrekturenȱ vorȱ undȱ archiviertȱ schließlichȱ dasȱ Dokument.ȱ Derȱ Vorteilȱ einesȱ derartigenȱ Ablaufsȱ liegtȱ darin,ȱ dassȱ vorȱ demȱ eigentlichenȱ Ablegenȱ desȱ Dokumentesȱ nochȱ Korrekturenȱ möglichȱ sind.ȱ Derȱ hoheȱ Prüfaufwandȱ schränktȱ dieȱ AnȬ wendbarkeitȱ jedochȱ ein.ȱ Überallȱ dort,ȱ woȱ Fremdbelegeȱ andererȱ UnternehȬ menȱzumȱTagesgeschäftȱgehören,ȱgibtȱesȱjedochȱfaktischȱhierzuȱkeineȱAlterȬ native.ȱGleichesȱgiltȱfürȱAbteilungenȱmitȱbesonderenȱAnforderungenȱanȱdieȱ Vertraulichkeitȱ desȱ Posteingangesȱ wieȱ VorstandsȬȱ undȱ Geschäftsführung,ȱ PersonalverwaltungȱoderȱRevision.ȱNachteiligȱwirktȱsichȱeinȱtechnischerȱAsȬ pektȱaus:ȱjederȱArbeitsplatzȱbenötigtȱeinenȱScanner.ȱ – Frühesȱ Erfassenȱ nimmtȱ dieȱ Originalbelegeȱ nachȱ einerȱ Prüfungȱ imȱ PosteinȬ gangȱ zentralȱ aufȱ undȱ ordnetȱ sieȱ Geschäftsvorfällenȱ zu.ȱ Daȱ typischerweiseȱ großeȱ Dokumentenmengenȱ zuȱ verarbeitenȱ sind,ȱ istȱ hierzuȱ einȱ effizientesȱ KlassifizierungsȬȱundȱVerteilverfahrenȱnotwendig.ȱDieȱAblageȱderȱBelegeȱerȬ
64 ȱ
3.2ȱȱWorkflowmanagementȱ folgtȱ inȱ einemȱ Erfassungsdialog.ȱ Fürȱ dieȱ weitereȱ Bearbeitungȱ werdenȱ nurȱ nochȱ Verweiseȱ aufȱ dasȱ Dokumentȱ verwendet,ȱ soȱ dassȱ keinȱ DokumentenȬ transportȱmehrȱnotwendigȱist.ȱDerȱSachbearbeiterȱruftȱausȱeinerȱArbeitslisteȱ dieȱ zurȱ Bearbeitungȱ anstehendenȱ Dokumenteȱ ab,ȱ indiziertȱ sie,ȱ fordertȱ dieȱ notwendigenȱ Zusatzangabenȱ ausȱ derȱ Datenbankȱ anȱ undȱ legtȱ anschließendȱ dasȱ vollständigȱ bearbeiteteȱ Dokumentȱ imȱ Speicherȱ ab.ȱ Dieserȱ Ablaufȱ erforȬ dertȱ Veränderungenȱ inȱ derȱ Ablauforganisation,ȱ derȱ Arbeitsmethodikȱ undȱ demȱMitarbeiterverhalten.ȱErȱeignetȱsichȱfürȱBearbeitungsvorgänge,ȱdieȱeineȱ eindeutigeȱ Dokumentenstrukturȱ undȱ eineȱ klareȱ Zuordnungȱ zumȱ SachbearȬ beiterȱ aufweisen.ȱ Diesesȱ Verfahrenȱ istȱ dieȱ optimaleȱ Organisationsformȱ beiȱ derȱEinführungȱeinesȱDokumentenmanagementsystems,ȱbegleitetȱvonȱmehȬ rerenȱVorteilen:ȱ o dieȱGeräteȬȱundȱPersonalressourcenȱwerdenȱoptimalȱgenutztȱ o derȱ intensiveȱ Umgangȱ mitȱ derȱ Technologieȱ anȱ zentralerȱ Stelleȱ führtȱ schnellȱ zuȱ optimalerȱ Qualitätȱ derȱ Erfassungȱ undȱ WeiterleiȬ tungȱ UnterȱdemȱGesichtspunktȱeinesȱWorkflowsȱsindȱDokumentenmanagementsystemeȱ alsȱSprungbrettȱzumȱEinstiegȱinȱdenȱProzessgedankenȱanzusehen.ȱDabeiȱentsprichtȱ dasȱ früheȱ Erfassenȱ mitȱ seinerȱ sofortigenȱ Umwandlungȱ papiergebundenerȱ DokuȬ menteȱundȱderȱZuordnungȱzuȱVorgängenȱweitȱmehrȱderȱGrundideeȱalsȱdasȱspäteȱ Erfassen,ȱdasȱlediglichȱdieȱVoraussetzungȱfürȱdieȱOptimierungȱpapiergebundenerȱ VorgängeȱfürȱeineȱspätereȱVerwendungȱschafft.ȱȱ
3.1.6
Trend
Dokumentenmanagementtechnologienȱ sindȱ dieȱ Fortsetzungȱ herkömmlicher,ȱ aufȱ Massendatenverarbeitungȱ fixierterȱ Datenverarbeitung.ȱ Sieȱ führenȱ unterschiedlichȱ strukturierteȱDokumenteȱzusammen,ȱeinȱVorgang,ȱderȱinȱöffentlichenȱVerwaltunȬ genȱundȱUnternehmenȱzumȱTagesgeschäftȱgehört.ȱInȱihrenȱGrundfunktionenȱsindȱ dieseȱSystemeȱausgereift,ȱdieȱerhältlichenȱProdukteȱstabilȱundȱverlässlich.ȱSubstanȬ tielleȱinhaltlicheȱVeränderungenȱsindȱinȱdieserȱAnwendungsklasseȱkaumȱzuȱerwarȬ ten.ȱ Allenfallsȱ dieȱ Bedienoberflächeȱ hinȱ zuȱ einemȱ Verzichtȱ aufȱ Menüsteuerungȱ dürfteȱeineȱHerausforderungȱdarstellen.ȱDieȱwesentlichenȱfunktionalenȱErgänzunȬ genȱ spielenȱ sichȱ aufȱ anderenȱ Anwendungsfeldernȱ ab.ȱ Integrationsbemühungenȱ durchȱ BPM,ȱ ComplianceȬAnforderungen,ȱ Archivierungsnotwendigkeitenȱ oderȱ KlassifikationȱundȱExtraktionȱsindȱdieȱSchlagworte,ȱdieȱdieȱDiskussionȱaufȱabsehȬ bareȱZeitȱprägenȱwerden.ȱȱȱ
3.2 Workflowmanagement Dieȱ tiefȱ greifendeȱ Umgestaltungȱ derȱ Unternehmenȱ wirdȱ vonȱ einerȱ zunehmendenȱ Durchdringungȱ allerȱ betrieblichenȱ Funktionenȱ mitȱ informationstechnischenȱ AnȬ wendungenȱbegleitet.ȱDieȱBedeutungȱdesȱWandelsȱlässtȱsichȱmitȱderȱorganisatoriȬ
ȱ
65
3ȱȱECMȱManageȬKomponenteȱ schenȱ Dezentralisierungswelleȱ Endeȱ derȱ 80erȱ Jahreȱ undȱ demȱ daraufȱ basierendenȱ ClientȬServerȬKonzeptȱ vergleichen,ȱ nurȱ dassȱ gegenwärtigȱ keineȱ RechnerkonzeptiȬ onȱ imȱ Vordergrundȱ steht,ȱ sondernȱ derȱ organisatorischeȱ Trendȱ derȱ GeschäftsproȬ zessorientierung,ȱderȱseineȱUmsetzungȱimȱWorkflowgedankenȱhat.ȱWorkflowȱgehtȱ dabeiȱ weitȱüberȱ eineȱ einfacheȱ Informationsteilungȱhinaus.ȱ Esȱ gestattetȱ denȱ UnterȬ nehmen,ȱmitȱdenȱ„zweiȱP’sȱundȱdenȱdreiȱR’s“:ȱProzessenȱundȱPolitik,ȱsowieȱRouten,ȱ RegelnȱundȱRollenȱsinnvollȱumzugehen.ȱHierdurchȱeröffnenȱsichȱChancen,ȱdieȱbisȱ vorȱkurzemȱalsȱunmöglichȱgalten:ȱȱ – dieȱ aktenloseȱ JustȬinȬtimeȬKommunikationȱ derȱ Mitarbeiterȱ allerȱ HierarchieȬ ebenenȱbezüglichȱderȱeinzelnenȱVorgängeȱundȱderenȱVerarbeitungsschritteȱ – dieȱunternehmensweiteȱBereitstellung,ȱTeilungȱundȱVerfolgungȱvonȱInforȬ mationen.ȱȱ Dabeiȱgehtȱesȱvorȱallemȱdarum,ȱdieȱPrinzipienȱderȱGestaltungȱvonȱProduktionsabȬ läufenȱ aufȱ dieȱ Verwaltungsprozesseȱ derȱ Unternehmenȱ zuȱ übertragen.ȱ Stattȱ desȱ Materialflussesȱ wirdȱ nunȱ derȱ Informationsstromȱ betrachtet,ȱ derȱ Computerȱ überȬ nimmtȱdieȱRolleȱderȱMaschinenȱundȱAnlagen,ȱundȱderȱMenschȱalsȱEntscheidungsȬ trägerȱfügtȱdieȱnötigenȱZusatzinformationenȱundȱSteueranweisungenȱhinzu.ȱȱ
3.2.1
Workflow
WorkflowsȱautomatisierenȱvorȱallemȱformalisierbareȱundȱteilȬformalisierbareȱVorȬ gängeȱmitȱdenȱMerkmalen,ȱdass:ȱ – dieȱeinzelnenȱVorgangsschritteȱklarȱgegeneinanderȱabgegrenztȱsindȱ – derȱAblaufȱeinesȱVorgangesȱnachȱklarenȱRegelnȱeindeutigȱdefiniertȱistȱ – denȱanȱderȱVorgangsbearbeitungȱbeteiligtenȱMitarbeiternȱFunktionen,ȱRollenȱ undȱKompetenzenȱzukommenȱ – dieȱInformationsbearbeitungȬȱundȱȬbereitstellungȱautomatisierbarȱist,ȱsoȱdassȱ derȱgesamteȱArbeitsprozessȱvomȱDokumentenzugriffȱbisȱzurȱArchivierungȱ transparentȱwird.ȱ AbhängigȱvomȱAusmaßȱautomatisierbarerȱAufgabenȱbestehtȱeinȱerheblichesȱRatioȬ nalisierungsreservoir,ȱdasȱdieȱAnalyseȱundȱderȱNeuentwurfȱvonȱGeschäftsabläufenȱ undȱ folglichȱ dieȱ AblaufȬȱ undȱ Aufbauorganisationȱ aufȱ allenȱ Ebenenȱ beeinflusst.ȱ NichtȱmehrȱdasȱfunktionaleȱSpartendenkenȱistȱgefragt,ȱsondernȱintegrierteȱAbläufeȱ überȱOrganisationsgrenzenȱhinweg.ȱNurȱunterȱdiesemȱPostulatȱistȱeineȱeffektivereȱ Gestaltungȱ undȱ eineȱ Kosteneinsparungȱ erreichbar.ȱ Damitȱ wirktȱ derȱ WorkflowgeȬ dankeȱaufȱalleȱdreiȱplanerischenȱUnternehmensebenen:ȱ – Zurȱ strategischenȱ Ebeneȱ gehörtȱ es,ȱ Kernprozesse,ȱ dieȱ fürȱ denȱ ErfüllungsȬ gradȱ derȱ kritischenȱ Erfolgsfaktorenȱ entscheidendȱ sind,ȱ neuȱ zuȱ gestalten.ȱ HierȱspiegeltȱsichȱdieȱIdeeȱderȱGeschäftsprozessoptimierungȱwider.ȱAufȱdieȬ serȱ Makroebeneȱ sindȱ Geschäftsprozesseȱ durchȱ ihreȱ Leistungenȱ charakteriȬ siert,ȱdieȱUnternehmenȱzugunstenȱihrerȱKundenȱerbringen.ȱȱ
66 ȱ
3.2ȱȱWorkflowmanagementȱ
ȱ
– Aufȱ derȱ taktischenȱ Ebeneȱ werdenȱ dieȱ Prozesseȱ eingehendȱ modelliertȱ undȱ simuliert,ȱ umȱ dieȱ Flexibilitätȱ derȱ Prozesseȱ zuȱ erhöhenȱ oderȱ denȱ Gradȱ derȱ Arbeitsteilungȱzuȱverändern.ȱ – DieȱoperativeȱEbeneȱsetztȱschließlichȱdieȱErkenntnisseȱderȱvorangegangenenȱ EbenenȱinȱeinenȱfürȱdasȱWorkflowȬSystemȱtauglichenȱArbeitsablaufȱum.ȱAufȱ dieserȱ Mikroebeneȱ entstehtȱ alsoȱ dieȱ Prozessketteȱ alsȱ realerȱ Ausdruckȱ desȱ Leistungsbündels,ȱ dasȱ fürȱ einenȱ internenȱ oderȱ externenȱ Kundenȱ erbrachtȱ wird.ȱ Einȱ Workflowȱ bezeichnetȱ mehrereȱ dynamische,ȱ abteilungsüberȬ greifende,ȱaberȱfachlichȱzusammenhängende,ȱarbeitsteiligeȱAktivitäten,ȱ dieȱ inȱ logischerȱ oderȱ zeitlicherȱ Abhängigkeitȱ zueinanderȱ stehen.ȱ Ausȱ betriebswirtschaftlicherȱSichtȱbedeutetȱdies,ȱdassȱGeschäftsprozesseȱalsȱ Bestandteilȱ derȱ Ablauforganisationȱ mitȱ Elementenȱ derȱ AufbauȬ organisationȱ wieȱ Mitarbeiterȱ oderȱ Gruppenȱ korrelieretȱ sind.ȱ InformaȬ tionstechnischeȱ Unterstützungȱ aufȱ Rechnerbasisȱ bildetȱ dabeiȱ keineȱ notwendigeȱVoraussetzung.ȱȱ
ȱ Dieȱ kleinsteȱ Einheitȱ einesȱ Workflowsȱ stelltȱ eineȱ Aufgabeȱ dar,ȱ dieȱ einȱ Mitarbeiterȱ ohneȱUnterbrechungȱdurchführtȱundȱdieȱsichȱunterȱmehrerenȱFacettenȱbetrachtenȱ lässt:ȱ – – – – – –
werȱerledigtȱdieȱAufgabe: welcheȱDatenȱwerdenȱbenötigt: warumȱwirdȱdieȱAufgabeȱerledigt: womitȱwirdȱdieȱAufgabeȱdurchgeführt: wieȱlangeȱdauertȱdieȱBearbeitung: welcheȱ Qualifikationȱ verlangt die BearȬ beitung:ȱ
Organigramm Unternehmensdatenmodellȱ strategischesȱFirmenzielȱ allgemeineȱoderȱDVȬȱInfrastrukturȱ Durchlaufzeit Ausbildungȱ
ȱ
ȱ
67
3ȱȱECMȱManageȬKomponenteȱ
Aktivitäten:
Wassollgemachtwerden?
OrganisatorischeEinheiten: Wersolletwasmachen?
Informationsobjekte/Dokumente: (1)
WelcheInformationensindzurAusführungderAktivitätnotwendig?
(2)
WelcheInformationenwerdenbeiderDurchführungderAktivitäterzeugt?
Werkzeuge/Anwendungssysteme: WelcheTechnikbzw.WerkzeugeundDVͲAnwendungenkommenbeiderDurchführung derAktivitätzumEinsatz? Quelleȱ:ȱCOIȱ
Abbildungȱ3.5:ȱWorkflowbestandteileȱ
Eineȱ einzelneȱ Aufgabeȱ beschreibtȱ Aktivitätenȱ wieȱ Wiedervorlage,ȱ Anbringenȱ vonȱ Notizen,ȱ Mitzeichnungsverfahren,ȱ automatischeȱ Zusteuerungȱ benötigterȱ Aktenȱ oderȱ eineȱ Verzweigungȱ inȱ derȱ Workflowausführung.ȱ Nachȱ Zuweisungȱ dieserȱ Funktionalitätȱ müssenȱ dieȱ agierendenȱ Personenȱ überȱ dieȱ anstehendenȱ Aufgabenȱ informiertȱwerden.ȱGrundsätzlichȱfallenȱdreiȱTeilproblemeȱan:ȱ – WieȱwirdȱeinȱamȱVorgangȱBeteiligterȱinformiert?ȱ(Notifikation)ȱ – WieȱsynchronisierenȱsichȱdieȱanȱeinemȱVorgangȱBeteiligten?ȱ (Synchronisation)ȱ – WieȱverwaltetȱderȱBearbeiterȱdieȱauszuführendenȱTätigkeiten?ȱ(Arbeitsliste)ȱ Einȱ leistungsfähigerȱ Workflowȱ hältȱ alleȱ Möglichkeitenȱ überȱ einenȱ elektronischenȱ Schreibtischȱ bereit.ȱ Derȱ Sachbearbeiterȱ verfügtȱ überȱ einenȱ Arbeitsvorratskorbȱ inȱ FormȱeinerȱArbeitslisteȱanalogȱzumȱPosteingang,ȱeinenȱFormularkastenȱmitȱVorlaȬ genȱfürȱeinzelneȱVorgangstypenȱsowieȱeinemȱAusgangskorb.ȱFernerȱbedarfȱesȱderȱ IntegrationȱeinesȱDokumentenmanagementsystems,ȱumȱallenȱbeteiligtenȱMitarbeiȬ ternȱohneȱMedienbruchȱdigitalisierteȱDokumenteȱzurȱVerfügungȱzuȱstellen.ȱ DaȱWorkflowsȱsichȱausȱvielenȱeinzelnenȱAktionenȱundȱAufgabenȱzusammensetzen,ȱ sindȱsieȱseltenȱhomogen,ȱsondernȱweisenȱimȱGegenteilȱhäufigȱsehrȱunterschiedlicheȱ Attributeȱaufȱ[Heilmann,ȱS.ȱ11/12]:ȱ – Strukturiertheitȱ undȱ Komplexität:ȱ Einȱ Workflowȱ wirdȱ durchȱ dieȱ Anzahl,ȱ dieȱVerschiedenheitȱundȱdenȱGradȱderȱNebenläufigkeitȱeinzelnerȱAufgabenȱ beschrieben.ȱ
68 ȱ
3.2ȱȱWorkflowmanagementȱ – Detaillierungsgrad:ȱEinȱWorkflowȱweistȱeinenȱniedrigenȱDetaillierungsgradȱ auf,ȱwennȱdieȱeinzelnenȱTeilschritteȱbisȱaufȱelementareȱAufgabenȱohneȱgroȬ ßenȱHandlungsspielraumȱzerlegbarȱsind.ȱ – Arbeitsteilungsgrad:ȱȱDieseȱEigenschaftȱgibtȱAuskunftȱüberȱdieȱZahlȱderȱBeȬ arbeiterȱeinesȱWorkflowsȱundȱistȱdamitȱindirektȱeinȱMaßȱfürȱdenȱzuȱerwarȬ tendenȱAbstimmungsȬȱundȱKoordinationsaufwand.ȱ – Interprozessverflechtung:ȱDiesesȱAttributȱdrücktȱdieȱVerbindungȱzuȱandeȬ renȱProzessenȱüberȱSchnittstellenȱausȱundȱbildetȱdamitȱeinenȱGradmesserȱfürȱ dasȱWabengefügeȱeinerȱOrganisationȱ(gemeinsameȱDatenȱundȱRessourcen,ȱ VerflechtungȱderȱTeilergebnisse).ȱ DerȱidealisierteȱAblaufȱeinesȱWorkflowsȱlässtȱsichȱwieȱfolgtȱbetrachten:ȱ – Einȱ Workflowȱ wirdȱ durchȱ einenȱ Triggerȱ ausgelöst.ȱ Hierunterȱ kannȱ sowohlȱ einȱzyklischerȱwieȱazyklischerȱAuslöserȱverstandenȱwerden.ȱȱ – Derȱ Workflowȱ selbstȱ setztȱ sichȱ ausȱ mehrerenȱ Aktionen,ȱ Aktivitätenȱ undȱ Aufgabenȱzusammen.ȱ – DieȱeinzelnenȱAufgabenȱwerdenȱalternativ,ȱsequentiellȱoderȱȱparallelȱausgeȬ führt.ȱ Beiȱ alternativerȱ Ausführungȱ entscheidetȱ eineȱ Ablaufbedingungȱ überȱ dasȱ Ablaufschema,ȱ beiȱ seriellerȱ mussȱ dasȱ Ablaufschemaȱ striktȱ eingehaltenȱ werden,ȱ beiȱ parallelerȱ Ausführungȱ sindȱ dieȱ einzelnenȱ Schritteȱ unabhängigȱ voneinanderȱundȱwerdenȱsimultanȱbearbeitetȱundȱwiederȱzusammengeführt.ȱȱ – DenȱAbschlussȱeinesȱWorkflowsȱbildetȱeinȱeindeutigesȱErgebnisȱoderȱeinȱdeȬ finiertesȱEreignis.ȱ – DerȱeigentlicheȱWorkflowȱundȱseineȱAblaufsteuerungȱerfolgtȱüberȱProzeduȬ renȱmitȱKontrollregelnȱhinsichtlich:ȱ o zeitlicherȱAspekte:ȱEinerseitsȱkannȱdieȱAusführungȱeinesȱSchrittesȱ durchȱdieȱAusführungȱeinesȱanderenȱeingeschränktȱsein,ȱandererȬ seitsȱkannȱeinȱSchrittȱzeitbezogenȱvonȱeinemȱanderenȱabhängen.ȱ o ArtȱundȱUmfangȱauszutauschenderȱInformationȱ o DefinitionȱvonȱAusnahmen,ȱz.B.ȱnichtȱtermingerechteȱErledigung:ȱ Aufforderungȱ desȱ Sachbearbeiters,ȱ Hinweisȱ (EȬMail)ȱ anȱ Vorgesetzteȱüberȱ drohendenȱ Verzug,ȱWeiterleitungȱ desȱ Vorgangsȱ anȱeineȱAlternativperson.ȱ
ȱ
69
3ȱȱECMȱManageȬKomponenteȱ
Aktivität
Alternative Abschnitte
Parallele Abschnitte IF
Schleife
Quelle : Seidel SAP
Abbildungȱ3.6:ȱWorkflowȱundȱRegelnȱ
Dieȱ Bearbeiterȱ führenȱ dieȱ definiertenȱ Vorgangsschritteȱ mitȱ unterschiedlichemȱ Handlungsspielraumȱ aus.ȱ Sieȱ müssenȱ Vorgängeȱ aufrufen,ȱ sieȱ identifizieren,ȱ einȬ ordnenȱundȱbearbeitenȱsowieȱdieȱErgebnisseȱfesthaltenȱundȱweiterreichen.ȱHierfürȱ erhaltenȱ sieȱ dieȱ erforderlichenȱ Zugriffsrechteȱ aufȱ dieȱ vorgangsrelevantenȱ DokuȬ menteȱ derȱ elektronischenȱ Ablage,ȱ seiȱ esȱ imȱ Archivȱ oderȱ inȱ einerȱ Datenbank.ȱ Fürȱ jedenȱ Arbeitsschrittȱ sindȱ demzufolgeȱ dieȱ Personenȱ oderȱ Organisationseinheitenȱ undȱdieȱihrȱzugeordnetenȱDokumenteȱundȱDatenȱfestgelegt.ȱDabeiȱkönnenȱzusätzȬ lichȱ Bedingungenȱ fürȱ dieȱ automatischeȱ Steuerungȱ überȱ Termine,ȱ BearbeitungsȬȱ undȱWartezeiten,ȱSperrȬȱundȱMahnfristenȱoderȱperiodischeȱEreignisseȱhinzugefügtȱ werden.ȱ Überdiesȱ lassenȱ sichȱ individuelleȱ Regelnȱ definieren,ȱ dieȱ beliebigeȱ KriteȬ rien,ȱ etwaȱ dieȱ Vollständigkeitȱ einesȱ Arbeitsschrittes,ȱ überprüfen.ȱ Fürȱ eventuellȱ auftretendeȱAusnahmesituationenȱkannȱdieȱMöglichkeitȱeingeräumtȱwerden,ȱeinenȱ Arbeitsschrittȱ zurückzusetzen,ȱ ihnȱ zuȱ überspringen,ȱ einzufügen,ȱ ihnȱ aufzuteilenȱ oderȱ mitȱ anderenȱ Vorgängenȱ zuȱ verbinden.ȱ Derartigeȱ Ausnahmenȱ sindȱ dadurchȱ gekennzeichnet,ȱdassȱwenigstensȱeinȱMerkmal:ȱbeteiligteȱPerson,ȱDokumente,ȱAbȬ folgeȱ zuȱ bearbeitenderȱ Funktionenȱ etc.ȱ mitȱ demȱ konfiguriertenȱ WorkflowȬModellȱ nichtȱ übereinstimmt.ȱ Dieȱ zurȱ Ausnahmebehandlungȱ notwendigenȱ Anpassungenȱ könnenȱ abȱ demȱ Zeitpunktȱ ihrerȱ Ausführungȱ entwederȱ temporär,ȱ d.h.ȱ genauȱ fürȱ denȱ aktuellenȱ Vorgang,ȱ oderȱ permanentȱ fürȱ alleȱ zukünftigenȱ Geschäftsvorfälleȱ gültigȱsein.ȱȱ
70 ȱ
3.2ȱȱWorkflowmanagementȱ Ausȱ Revisionsgründen,ȱ umȱ einenȱ bearbeitetenȱ Vorgangȱ lückenlosȱ rekonstruierenȱ zuȱ können,ȱ werdenȱ zusätzlichȱ Vorgangsprotokolleȱ geführt,ȱ anhandȱ dererȱ dieȱ durchschnittlicheȱ LiegeȬ,ȱ TransportȬȱ undȱ Bearbeitungszeitȱ ausgewertetȱ werdenȱ kann.ȱ Dieseȱ Workflowinformationȱ garantiertȱ auchȱ dieȱ Nachvollziehbarkeitȱ desȱ Workflowsȱ durchȱ Statistikenȱ undȱ Auswertungenȱ überȱ Auslastungen,ȱ aktuellenȱ Sachstandȱ undȱ andereȱ Sachverhalte.ȱ Zusätzlichȱ istȱ eineȱ Arbeitsvorratsverwaltungȱ integriert,ȱdieȱzuȱbearbeitendeȱVorgängeȱdenȱMitarbeiternȱdirektȱzustellt.ȱ Dieȱ Sichtweisenȱ scheidenȱ sichȱ aber,ȱ wennȱ esȱ gilt,ȱ demȱ Nutzerȱ imȱ Einzelfallȱ dasȱ PrivilegȱderȱModifikationȱdesȱWorkflowȬSystemsȱzuȱübertragen.ȱHierȱistȱzuȱprüfen,ȱ obȱ dieȱ Strukturierungȱ desȱ Ablaufesȱ dieȱ Möglichkeitȱ einräumt,ȱ Arbeitsschritteȱ anȱ andereȱMitarbeiterȱzuȱdelegierenȱoderȱzusätzlicheȱeinzufügen.ȱDaranȱknüpfenȱsichȱ weitereȱFragen:ȱ – Sollȱ derȱ Mitarbeiterȱ dieȱ Möglichkeitȱ haben,ȱ einenȱ bereitsȱ weitergegebenenȱ Vorgangȱzurückzuholen?ȱ – DarfȱeinȱMitarbeiterȱdieȱAnnahmeȱvonȱVorgängenȱverweigern?ȱ – Sollȱesȱmöglichȱsein,ȱeinenȱzusätzlichenȱparallelenȱVorgangȱzuȱerzeugenȱundȱ ihnȱentsprechendȱeinzubinden?ȱ Daȱ WorkflowȬSystemeȱ sichȱ schwerpunktmäßigȱ aufȱ starkȱ strukturierteȱ Vorgängeȱ richten,ȱ beziehenȱ sieȱ einenȱ Großteilȱ ihrerȱ Vorteileȱ ausȱ denȱ Schwächenȱ derȱ herȬ kömmlichenȱfunktionsorientiertenȱAnwendungen:ȱȱ – Fürȱ dieȱ einbezogenenȱ Bearbeiterȱ erhöhtȱ sichȱ dieȱ Prozesstransparenz.ȱ Sieȱ werdenȱvonȱRoutineentscheidungenȱentlastet.ȱ – FehlerȱwerdenȱdurchȱVermeidungȱvonȱMehrfacheingabenȱundȱVerringerungȱ vonȱMedienbrüchenȱreduziert.ȱ – Durchlaufzeitenȱverringernȱsich,ȱdaȱnichtȱmehrȱerheblicheȱZeitanteileȱfürȱdieȱ SucheȱundȱdasȱWiederauffindenȱvonȱDokumentenȱnotwendigȱsind.ȱ EinȱweiteresȱPotentialȱerschließtȱsichȱdurchȱdieȱprozessorientierteȱSichtweise:ȱ – Durchȱ einȱ gezieltesȱ Workflowmanagementȱ lassenȱ sichȱ erheblicheȱ ProduktiȬ vitätsgewinneȱ erzielen.ȱ Vorgängeȱ werdenȱ einheitlichȱ undȱ personenȬ unabhängigȱ abgewickelt,ȱ undȱ dieȱ Bearbeiterȱ derȱ Aufgabenȱ könnenȱ dieseȱ durchȱ Filternȱ undȱ Priorisierenȱ individuellȱ organisieren.ȱ Derȱ ArbeitseinȬ gangskorbȱ enthältȱ Dokumenteȱ undȱ Datenȱ dieȱ fürȱ dieȱ Vorgangsbearbeitungȱ notwendigȱsindȱundȱentbindetȱdamitȱvonȱaufwendigenȱRecherchetätigkeitenȱ –ȱeinerȱHauptursacheȱvonȱIneffizienz.ȱȱ – Führungskräfteȱ könnenȱ durchȱ Eingriffeȱ fürȱ eineȱ gleichmäßigeȱ MitarbeiterȬ auslastungȱsorgen,ȱVorgängeȱaufȱTermintreueȱüberwachenȱundȱinȱAusnahȬ mefällenȱdenȱWorkflowȱaktivȱmodifizieren.ȱ – Derȱ inhaltlicheȱ Zusammenhangȱ allerȱ Schritteȱ kannȱ durchȱ eineȱ konsistenteȱ Modellierungȱhergestelltȱwerden.ȱDaȱdieȱProzessregelnȱnunȱnichtȱmehrȱausȬ schließlichȱinȱdenȱKöpfenȱderȱMitarbeiterȱruhen,ȱverbessertȱsichȱdieȱProzessȬ kontrolleȱundȱȬtransparenz.ȱ
ȱ
71
3ȱȱECMȱManageȬKomponenteȱ Dennochȱ sindȱ Szenarienȱ denkbar,ȱ inȱ denenȱ derȱ gewünschteȱ Erfolgȱ einesȱ WorkȬ flowȬEinsatzesȱ ausbleibtȱ [Trammell].ȱ Einȱ Grundȱ kannȱ darinȱ bestehen,ȱ dassȱ dieȱ Anzahlȱ derȱ potentiellenȱ Ausprägungenȱ undȱ Ergebnisseȱ derȱ einzelnenȱ VorgangsȬ schritteȱunterschätztȱwurde.ȱWorkflowȬSystemeȱverlangenȱwohlȱdefinierteȱRegeln,ȱ Rollenȱ undȱ Bedingungenȱ mitȱ derȱ Folge,ȱ dassȱ derȱ Entwurfȱ einesȱ automatischenȱ Ablaufsȱ alleȱ Alternativenȱ erfassenȱ undȱ umsetzenȱ muss.ȱ Dieseȱ Aufgabeȱ kannȱ inȱ ihrerȱ Komplexitätȱ dasȱ Potentialȱ einesȱ WorkflowȬSystemsȱ übersteigen.ȱ Zudemȱ beȬ stehtȱ nurȱ sehrȱ eingeschränktȱ dieȱ Möglichkeit,ȱ subjektiveȱ Entscheidungenȱ vorherȬ zusehenȱundȱinȱdenȱAblaufȱzuȱintegrieren.ȱHierȱkommtȱderȱUmstandȱzumȱTragen,ȱ dassȱ sichȱ WorkflowȬSystemeȱ schwerpunktmäßigȱ aufȱ starkȱ strukturierteȱ Prozesseȱ richten.ȱ Eineȱ weitereȱ Schwächeȱ kannȱ inȱ derȱ Schwierigkeitȱ liegen,ȱ dynamischȱ ProȬ zesseȱanpassen,ȱausbauenȱoderȱvollständigȱneuȱgestaltenȱzuȱmüssen.
3.2.2
Workflowmanagement-Systeme
Derȱ skizzierteȱ Workflowablaufȱ zeigt,ȱ dassȱ einȱ wesentlichesȱ Kennzeichenȱ einesȱ Workflowsȱ imȱ Unterschiedȱ zurȱ traditionellenȱ funktionsorientiertenȱ Bearbeitungȱ dieȱInitiierungȱnotwendigerȱAktionenȱbeiȱvordefiniertenȱEreignissenȱist.ȱUmȱdieseȱ Funktionalitätȱ zuȱ gewährleisten,ȱ sindȱ analogȱ zurȱ Geschäftsprozessmodellierungȱ mehrereȱinhaltlichȱgetrennteȱSystemkomponentenȱnotwendig.ȱ ȱ Einȱ WorkflowmanagementȬSystemȱ istȱ einȱ Anwendungssystem,ȱ mitȱ dessenȱ Hilfeȱ Workflowsȱ definiert,ȱ verwaltetȱ undȱ ausgeführtȱ werdenȱ können.ȱ Dieȱ Ausführungsreihenfolgeȱ istȱ durchȱ eineȱ formaleȱ RepräsentationȱderȱProzesslogikȱimȱAnwendungssystemȱdeterminiert.ȱ EinȱWorkflowmanagementȬSystemȱkannȱausȱmehrerenȱBausteinenȱbestehen:ȱ – – – – – –
demȱfunktionalen,ȱ demȱoperationalen,ȱ demȱverhaltensbezogenen,ȱ demȱinformationsbezogenen,ȱ demȱorganisatorischenȱsowieȱ demȱkausalen,ȱhistorischenȱundȱtransaktionalenȱAspekt.
Derȱ funktonaleȱ Aspektȱ beschreibt,ȱ wasȱerledigtȱ werdenȱ soll.ȱ Dazuȱ werdenȱ WorkȬ flowsȱdefiniert,ȱdieȱselbstȱwiederȱTeilȱeinesȱweiterenȱWorkflowsȱseinȱkönnen.ȱDerȱ operationaleȱ Blickwinkelȱ gibtȱ an,ȱ welcheȱ Funktionenȱ mitȱ welchenȱ Applikationenȱ ausgeführtȱ werdenȱ sollen.ȱ Denȱ Ausführungszeitpunktȱ beleuchtetȱ derȱ verhaltensȬ bezogeneȱAspektȱ(wann).ȱDieȱorganisatorischeȱBetrachtungsweiseȱveranschaulicht,ȱ welcheȱPersonȱ(Stelle)ȱdenȱProzessschrittȱausführtȱ(wer).ȱDerȱinformationsbezogeȬ neȱAspektȱgibtȱdenȱDatenflussȱinnerhalbȱeinesȱWorkflowsȱanȱ(welcheȱDaten).ȱEinȱ solcherȱDatenflussȱbestehtȱausȱProduktionsȬȱundȱKontrolldaten.ȱProduktionsdatenȱ
72 ȱ
3.2ȱȱWorkflowmanagementȱ kommenȱ innerhalbȱ vonȱ Applikationenȱvor.ȱ Kontrolldatenȱsindȱlediglichȱ inȱ WorkȬ flowmanagementȬSystemenȱ selbstȱ vonȱ Bedeutung.ȱ Dieȱ Kontrolldatenȱ steuernȱ dieȱ Vorgangsbearbeitung.ȱDerȱkausaleȱAspektȱklärtȱdieȱFrageȱnachȱderȱUrsacheȱeinesȱ Workflows:ȱWarumȱwirdȱeinȱWorkflowȱausgeführt?ȱDieȱProtokollierungȱvonȱProȬ duktionsȬȱundȱKontrolldatenȱwerdenȱunterȱdemȱhistorischenȱAspektȱzusammengeȬ fasstȱ(WannȱwurdenȱwelcheȱDatenȱbearbeitet?).ȱSchließlichȱbeschreibtȱderȱtransakȬ tionaleȱAspektȱdieȱKontrolleȱderȱWorkflowȬBearbeitung.ȱ[Jablonski,ȱS.18]ȱ ȱ ȱ ȱ ȱ ȱ ȱȱȱȱ ȱ ȱ ȱ ȱ ȱ Abbildungȱ3.7:ȱWorkflowmanagementȬSystemȱ
Dieȱ hierausȱ resultierendenȱ Anforderungenȱ anȱ einȱ idealesȱ WorkflowmanagementȬ SystemȱschlagenȱsichȱsystemtechnischȱinȱunterschiedlichenȱModulenȱniederȱ[RathȬ geb,ȱS.ȱ80ȱȬȱ82].ȱ
ȱ
– EinȱWorkflowmonitorȱbildetȱdenȱspeziellenȱWorkflowȱmitȱseinenȱeinzelnenȱ Vorgangsschrittenȱab.ȱAlsȱzentralerȱTeilȱderȱAusführungseinheitȱüberwachtȱ erȱ dieȱ Vorgangssteuerungȱ undȱ referenziertȱ fürȱ jedenȱ Vorgangsschrittȱ dieȱ entsprechendeȱ Anwendung.ȱ Dieȱ Organisationsdatenbankȱ steuertȱ dieȱ entȬ sprechendenȱ Rollenȱ derȱ amȱ Vorgangȱ beteiligtenȱ Mitarbeiter.ȱ Derȱ Benutzerȱ selektiertȱundȱbearbeitetȱletztlichȱdenȱBestandȱseinerȱArbeitsliste.ȱȱ – Dasȱ Modellierungssystemȱ dientȱ derȱ Konstruktionȱ undȱ Beschreibungȱ vonȱ Abläufen.ȱPrimäreȱAufgabeȱistȱes,ȱdieȱimȱUnternehmenȱablaufendenȱProzesȬ seȱzuȱentwerfenȱundȱvisuellȱtransparentȱzuȱmachen.ȱDieseȱKomponenteȱsiehtȱ ihrenȱSchwerpunktȱdamitȱinȱderȱGeschäftsprozessmodellierungȱundȱistȱfolgȬ lichȱnichtȱnotwendigȱBestandteilȱeinesȱlauffähigenȱWorkflows.ȱȱ
ȱ
73
3ȱȱECMȱManageȬKomponenteȱ Tabelleȱ3.2:ȱBezugȱzwischenȱGeschäftsprozessmodellierungȱundȱWorkflowȱ
ȱ Geschäftsprozessmodellierung
Workflow
Ist-Analyse der Unternehmensprozesse
Modellierungssystem des Vorganges und seiner Restriktionen
Prozessoptimierung
Simulation
Implementierung des neuen Prozessmodells
Ausführungssystem des Workflows
Permanente Optimierung und Nutzenkontrolle
Analyse der protokollierten Informationen
ȱ
ȱ
– EineȱSimulationȱzeigtȱauf,ȱobȱdasȱVorgangsmodellȱlogischȱschlüssigȱistȱundȱ obȱ Engpässeȱ aufgrundȱ desȱ aktuellenȱ Entwurfsȱ zuȱ erwartenȱ sind.ȱ BeispielsȬ weiseȱ lassenȱ sichȱ Vorgangsschritteȱ ermitteln,ȱ denenȱ nochȱ keineȱ Rolleȱ zugeȬ wiesenȱwurde.ȱ – DerȱorganisatorischeȱRahmenȱeinesȱWorkflowsȱwirdȱdurchȱObjekteȱwieȱAnȬ gestellter,ȱGruppeȱoderȱAbteilungȱdargestellt,ȱdieȱihrerseitsȱdurchȱRelationenȱ wieȱ istȱ „Vorgesetzterȱ von,ȱ berichtetȱ an,ȱ gehörtȱ zuȱ Bereich“ȱ beschriebenȱ ist.ȱ Dieȱ einzelnenȱ Vorgängeȱ sindȱ anȱ bestimmteȱ Personenȱ gebunden.ȱ Wasȱ pasȬ siertȱ aber,ȱ wennȱ eineȱ dieserȱ Personenȱ dieȱ Organisationȱ verlässtȱ undȱ einȱ StellvertreterȱdieȱPositionȱübernimmt.ȱDieȱstatischeȱZuordnungȱinȱFormȱvonȱ Personenȱ erweistȱ sichȱ alsȱ zuȱ unflexibelȱ undȱ wirdȱ üblicherweiseȱ durchȱ eineȱ Rolleȱersetzt.ȱEinȱintegriertesȱRollenkonzeptȱspiegeltȱdieȱRechteȱundȱPflichȬ tenȱ einzelnerȱ Mitarbeiterȱ gemäßȱ derȱ Aufbauorganisationȱ undȱ derȱ AblaufȬ schabloneȱ wider.ȱ Dabeiȱ gehtȱ esȱ darum,ȱ eineȱ Personȱ zuȱ bestimmen,ȱ dieȱ ausȱ betriebswirtschaftlichȱ funktionalerȱ Sichtȱ fürȱ dieȱ Erledigungȱ desȱ VorgangsȬ schrittesȱ verantwortlichȱ ist.ȱ Inȱ einerȱ Rollendefinitionȱ werdenȱ dazuȱ Regelnȱ festgelegt,ȱnachȱdenenȱzumȱaktuellenȱBearbeitungszeitpunktȱdieȱzuständigeȱ Personȱermitteltȱwird.ȱ
ȱ ȱ ȱ
74 ȱ
3.2ȱȱWorkflowmanagementȱ
A bläufe W orkflow -M anagem ent
Beteiligte A nw endungsm odule ȱ
Quelle:ȱDialogicaȱ
ȱ Abbildungȱ3.8:ȱWorkflowkomponentenȱ
Beispielȱ ȱ Einȱ bestimmterȱ Belegȱ sollȱ nichtȱ vonȱ allenȱ Personenȱ desȱ Unternehmens,ȱ dieȱ dieȱ Berechtigungȱ fürȱ dieȱ Aufgabeȱ „Belegȱ buchen“ȱ besitzen,ȱ durchgeführtȱ werden.ȱ Vielmehrȱ sollȱ gezieltȱ eineȱ Personȱ ausȱ demȱ Kreisȱ „Sachbearbeiterȱ FI“ȱ ausgewähltȱ werden,ȱ derȱ alphabetischȱ fürȱ denȱ Kundenȱ zuständigȱ istȱ undȱ dieȱ Berechtigungȱ besitzt,ȱ Beträgeȱ inȱ entsprechenderȱ Höheȱ zuȱ verbuchen.ȱ Zurȱ tatsächlichenȱ Bearbeitungszeitȱ mussȱalso,ȱinȱAbhängigkeitȱvonȱParametern,ȱdieȱerstȱzurȱAusführungszeitȱ bekanntȱ sind,ȱ dieȱ Zuordnungȱ zumȱ konkretenȱ Vorgangsschrittȱ erfolgen.ȱ Hierzuȱ istȱ esȱ notwendig,ȱ dieȱ Rolleȱ „Buchungssachbearbeiter“ȱ zuȱ definierenȱ undȱ Rollenparameterȱ fürȱ „Kundenname“ȱ undȱ „Buchungshöhe“ȱzuȱvereinbaren,ȱdieȱzurȱBearbeitungszeitȱdannȱkonkreteȱ Bezügeȱtragen.ȱ
ȱ ȱ ȱ ȱ ȱ ȱ
ȱ
75
3ȱȱECMȱManageȬKomponenteȱ
z Rolle
Einschränkung der möglichen Bearbeiter durch "Organisations-Filter"
Sachbearbieter FI
Kundenname A-G
z Aufgabe (Definition) Beleg buchen Î Verknüpft mit Stelle Sachbearbeiter FI
z Rolle (Bearbeiter)
Buchungssachbearbeiter Î Parameter der Rolle Kundenname Rechnungshöhe z Aktivität zur Laufzeit Beleg 4712 buchen Î Kunde H. Müller KG Î Rechnungshöhe 250,000,-- DM
Kundenname H- N Kundenname O- Z
Rechnungshöhe: < 50.000,-- DM Rechnungshöhe: > 50.000,-- DM
Quelle : Seidel SAP
ȱ Abbildungȱ3.9:ȱBezugȱzwischenȱWorkflowȱundȱRolleȱ
DieȱȱWFMCȱ(WorkflowȱManagementȱCoalition)ȱhatȱdieȱArchitekturȬÜberlegungenȱ zumȱWorkflowȱinȱStandardisierungsbemühungenȱeinfließenȱlassenȱundȱdieȱModelȬ lierungskomponenteȱalsȱ„BuildȬTime“ȱsowieȱdasȱAusführungsȬȱundȱInformationsȬ systemȱalsȱ„RunȬTime“ȬKomponenteȱdefiniert.ȱAusgespartȱbleibtȱdieȱSimulation.ȱ ȱ ȱ ȱ
Dokumentensicht ROOT
Document
Document
Buildtime Buildtime
Data Element Data Element
Modellierung
ȱ ȱ
Workflow-Steuerung
ȱ ȱ ȱ
Runtime Runtime
Ausführung
ȱ Überwachung
Abbildungȱ3.10:ȱReferenzmodellȱderȱWfMCȱ
76 ȱ
3.2ȱȱWorkflowmanagementȱ ZurȱSystemintegrationȱsindȱdarüberȱhinausȱSchnittstellenȱvorgesehen.ȱDieȱModellȬ strukturȱzeichnenȱfünfȱKategorienȱvonȱInterfacesȱaus,ȱdieȱdieȱInteroperabilitätȱundȱ Kommunikationȱgewährleistenȱsollen.ȱDieȱWorkflowȬEnactmentȱistȱdabeiȱzentralesȱ Elementȱ desȱ Referenzmodells.ȱ Sieȱ kannȱ eineȱ oderȱ mehrereȱ WorkflowȬEnginesȱ beȬ inhaltenȱundȱstelltȱdieȱRunȬTimeȬUmgebungȱzurȱVerfügungȱ[Kampffmeyer]:ȱ ȱ
Abbildungȱ3.11:ȱSchnittstellenmodellȱderȱWfMCȱ
ȱ
– Schnittstelleȱ1ȱȱliegtȱzwischenȱProzessdefinitionsȬWerkzeugȱundȱWorkflowȬ Enactment.ȱZurȱAnalyse,ȱModellierungȱundȱBeschreibungȱderȱGeschäftsproȬ zesseȱ sollȱ überȱ diesenȱ Kanalȱ dieȱ Möglichkeitȱ geschaffenȱ werden,ȱ unterȬ schiedlicheȱWerkzeugeȱmitȱderȱgesamtenȱFacetteȱvonȱInformationsartenȱeinȬ zubinden:ȱ o BedingungenȱfürȱProzessstartȱundȱȬendeȱ o Prozessaktivitätenȱ o DefinitionȱvonȱBedingungenȱundȱRegelnȱ o ZuteilungȱvonȱRessourcenȱ – Schnittstelleȱ 2ȱ beschreibtȱ dasȱ Zusammenspielȱ vonȱ WorkflowȬEnactmentȱ undȱ Benutzerinteraktionȱ inȱ Formȱ desȱ WorkflowȬClients.ȱ Dieserȱ präsentiertȱ demȱ Benutzerȱ eineȱ Arbeitslisteȱ mitȱ auszuführendenȱ Tätigkeiten,ȱ ausȱ derȱ Programmeȱ mitȱ denȱ dazugehörigenȱ Datenȱ aufgerufenȱ werden.ȱ Dieȱ WorkȬ flowȬClientȬApplikationȱ kannȱ Teilȱ desȱ eigentlichenȱ WorkflowmanagementȬ systemsȱsein,ȱsieȱkannȱaberȱauchȱalsȱseparateȱKomponenteȱinȱFormȱeinerȱEȬ MailȬApplikationȱoderȱeinerȱindividuellenȱAnwendungȱauftreten.ȱ
ȱ
77
3ȱȱECMȱManageȬKomponenteȱ – Schnittstelleȱ3ȱerkenntȱalleȱaufgerufenenȱexternenȱApplikationenȱundȱbildetȱ damitȱ dieȱ zentraleȱ Komponente,ȱ umȱ Fremdsystemeȱ anzubinden.ȱ TypiȬ scherweiseȱ arbeitenȱ WorkflowȬSystemeȱ mitȱ anderenȱ Dienstenȱ wieȱ Fax,ȱ EȬ MailȱoderȱDokumentenmanagementȱzusammen.ȱȱ – Schnittstelleȱ 4ȱ ermöglichtȱ dasȱ Zusammenwirkenȱ mitȱ anderenȱ WorkflowȬ Systemen.ȱȱ – Schnittstelleȱ5ȱbetrifftȱdieȱZusammenarbeitȱderȱAdministrationsȬȱundȱMoniȬ toringȬWerkzeugeȱ einesȱ Herstellersȱ mitȱ demȱ WorkflowȬEnactmentȱ undȱ erȬ möglicht:ȱ o dieȱBenutzerverwaltungȱ o dieȱRollenzuordnungȱ o dasȱBerechtigungsmanagementȱ o dieȱRessourcenkontrolleȱ ObwohlȱvonȱAnwenderȬȱalsȱauchȱvonȱHerstellerseiteȱhäufigȱdasȱFehlenȱverbindliȬ cherȱVereinbarungenȱbeklagtȱwird,ȱscheinenȱdieȱBemühungenȱderȱWfMCȱnurȱvonȱ wenigȱErfolgȱgekröntȱzuȱsein.ȱȱ DieseȱEinordnungȱverdeutlichtȱjedoch,ȱdassȱWorkflowȱkeineȱisolierteȱAnwendungȱ ist,ȱsondernȱalleȱgängigenȱbetriebswirtschaftlichenȱundȱorganisatorischenȱApplikaȬ tionenȱ einbindet.ȱ Workflowmanagementsystemeȱ sindȱ alsȱ Drehscheibeȱ zwischenȱ Anwendungsprogrammenȱzuȱverstehen,ȱdieȱdieȱKommunikationȱzwischenȱdiesenȱ regeltȱundȱüberȱdieȱArbeitslisteȱdenȱArbeitsfortschrittȱdenȱbetroffenenȱMitarbeiternȱ transparentȱmacht.ȱȱ
78 ȱ
3.2ȱȱWorkflowmanagementȱ
Historie aufzeichnen
Bedingungen auswerten
Verarbeitung synchronisieren
Aufgabe erzeugen
Bearbeiter zuordnen
Engine Engine Zeitvorgaben überwachen
Datenfluß organisieren Ereignisse verarbeiten Quelle : Seidel SAP
Abbildungȱ3.12:ȱFunktionalitätȱeinesȱWorkflowsystemsȱ
3.2.3
Workflowkategorien
GeschäftsprozesseȱunterscheidenȱsichȱinȱihrenȱAusprägungenȱsehrȱstark.ȱEinȱprakȬ tischerȱ Weg,ȱ Workflowsȱ zuȱ kategorisieren,ȱ bestehtȱ darin,ȱ sieȱ gemäßȱ derȱ AnwenȬ dung,ȱdieȱsieȱschwerpunktmäßigȱunterstützen,ȱinȱProduktionsȬ,ȱAdHocȬ,ȱCollaboȬ rativerȱundȱAnwenderȬzentrierteȱFormȱzuȱunterteilenȱ[Rathgeb,ȱS.ȱ4Ȭ6]:ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ
ȱ
79
3ȱȱECMȱManageȬKomponenteȱ Tabelleȱ3.3:ȱWorkflowkategorienȱ Gruppe
Beschreibung
Production Workflow
Merkmal ist, dass das System die Kontrolle ausübt, die Erledigung der Aufgaben überwacht und die definierte Organisationsstruktur einhält. Folglich ist die Bearbeitung monoton und wiederholt sich häufig – starke Strukturierung. Ausnahmen existieren nicht, so dass das System starr und unflexibel ist – Kreditanträge.
Ad-Hoc-Workflow
Der Benutzer oder Auslöser kontrolliert den Ablauf rund um die Aufgabe. Er besitzt demzufolge einen eigenen Entscheidungsspielraum, so dass dieser Typus für unstrukturierte, einmalig auftretende Vorgänge geeignet ist. Die Prozessbedingungen sind nicht vordefiniert, sie entstehen während des Ablaufes. Prozessbeteiligte werden situationsabhängig eingebunden oder ausgeschlossen – Nähe zu Groupware, Dokumentenweiterleitung, da Teams und nicht Prozesse als organisatorische Bezugsobjekte dienen.
Collaborativer Workflow
Die Prozesse weisen eine hohe Komplexität auf und sind nur wenig strukturiert. Gegenüber der Ad-Hoc-Variante haben Informationen jedoch einen wesentlich höheren Stellenwert - Produktentwicklung
AnwenderzentrierterWorkflow
Wie beim Production Workflow ist der Prozess streng definiert. Wesentlich ist allerdings, dass nicht nur Dokumente weitergereicht werden, sondern dass simultan Anwendungen initiiert werden, die einen Teil der Vorgangsbearbeitung übernehmen. Dieses Konzept setzt voraus, dass klassische Workflow-Tools auch Anwendungen einbinden können. Zusätzlich bietet die Integration des Internets die Möglichkeit, Geschäftsprozesse auf Kunden und Lieferanten auszudehnen. Neuartige Web-Anwendungen erweitern das Segment der kundenzentrierten Anwendungen über Unternehmensgrenzen hinweg und stellen einen direkten Weg zu vor- und nachgelagerten Bereichen her.
ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ Abbildungȱ3.13:ȱWorkflowkategorieȱ
80 ȱ
3.3ȱȱCollaborationȱ
3.3 Collaboration 3.3.1
Groupware
ȱ GroupwareȱistȱdieȱfürȱdieȱComputerunterstützungȱgruppenorientierterȱ Arbeitsabläufeȱ bereitgestellteȱ Softwareȱ [IS,ȱ S.345].ȱ Darunterȱ verstehtȱ manȱdenȱkoodiniertenȱAustauschȱȱgruppenbezogenerȱInformationȱundȱ ihreȱ kooperativeȱ Bearbeitung.ȱ Groupwareȱ richtetȱ sichȱ damitȱ schwerpunktmäßigȱaufȱdieȱAbbildungȱnichtȱformalisierbarerȱVorgängeȱ undȱbildetȱdenȱKontrapunktȱbezüglichȱderȱgeschäftsprozessorientiertenȱ SichtweiseȱderȱWorkflowȬSysteme.ȱ DerȱGroupwaregedankeȱintegriertȱunterschiedlicheȱPersonenȱundȱFunktionsträgerȱ zuȱ Teams.ȱ Einerseitsȱ existierenȱ Gruppen,ȱ derenȱ Mitgliederȱ gleichberechtigtȱ sind,ȱ wieȱz.B.ȱProjektteams,ȱandererseitsȱgibtȱesȱGruppen,ȱderenȱMitgliederȱbewusstȱmitȱ unterschiedlichenȱ Funktionenȱausgestattetȱ sind,ȱz.B.ȱKonferenzteilnehmerȱ mitȱSitȬ zungsleiter,ȱaktivenȱTeilnehmernȱundȱBeobachtern.ȱ Dieȱ Groupwareideeȱ erhältȱ Nahrungȱ durchȱ ihreȱ Etablierungȱ alsȱ interdisziplinäresȱ Forschungsgebietȱ imȱ Sinneȱ desȱ Computerȱ Supportedȱ Cooperativeȱ Workȱ (CSCW),ȱ dasȱ sichȱ mitȱ denȱ Potentialenȱ derȱ InformationsȬȱ undȱ Kommunkationstechnologieȱ fürȱdieȱZusammenarbeitȱvonȱPersonenȱundȱGruppenȱeinerseitsȱundȱandrerseitsȱmitȱ denȱ sozialen,ȱ psychologischenȱ undȱ organisatorischenȱ Effektenȱ derȱ Gruppenarbeitȱ auseinandersetzt.ȱ ȱ ComputerȱSupportedȱCooperativeȱWorkȱ(CSCW)ȱistȱdieȱBezeichnungȱ desȱ Forschungsgebietes,ȱ ȱ welchesȱ aufȱ interdisziplinärerȱ Basisȱ untersucht,ȱ wieȱ Individuenȱ inȱ Arbeitsgruppenȱ oderȱ Teamsȱ zusammenarbeitenȱ undȱ wieȱ sieȱ dabeiȱ durchȱ InformationȬȱ undȱ Kommunikationstechnologieȱunterstütztȱwerdenȱkönnenȱ[Teufel].ȱ ȱ Derȱ Begriffȱ Groupwareȱ istȱ zunehmendȱ derȱ Bezeichnungȱ Collaborationȱ gewichen,ȱ obwohlȱinhaltlicheȱUnterschiedeȱeherȱmarginalȱsind.ȱȱ
3.3.2
Groupwaresysteme
Groupwaresystemeȱ werdenȱ insbesondereȱ durchȱ Mechanismenȱ derȱ ZusammenarȬ beitȱderȱeinzelnenȱGruppenmitgliederȱcharakterisiert.ȱZusammenarbeitȱentstehtȱinȱ derȱInteraktionȱzwischenȱPersonen,ȱdieȱunterschiedlicheȱFormenȱundȱAusprägunȬ
ȱ
81
3ȱȱECMȱManageȬKomponenteȱ genȱ zwischenȱ denȱ Beteiligtenȱ annehmenȱ kann.ȱ Dieȱ Grundlageȱ bildenȱ mehrereȱ Interaktionsmodelle:ȱȱ
ȱ
– PartitionierungȱteiltȱdasȱProjektȱinȱArbeitsschritteȱundȱweistȱdenȱGruppenȬ mitgliedernȱTeilaufgabenȱzuȱ – KoordinationȱorganisiertȱdieȱTeamzusammenarbeit.ȱSieȱstimmtȱdieȱTätigkeiȬ tenȱderȱbeteiligtenȱBenutzerȱab,ȱlöstȱKonflikteȱzwischenȱdiesenȱundȱvermeiȬ detȱMehrfachȬȱoderȱsichȱwidersprechendeȱTätigkeiten.ȱDieȱKoordinationȱderȱ InteraktionȱistȱabhängigȱvonȱderȱGruppengrößeȱsowieȱvonȱderȱbevorzugtenȱ Arbeitsweiseȱ ihrerȱ Gruppenmitglieder.ȱ Kleineȱ Teamsȱ benötigenȱ wenigerȱ KoordinationȱalsȱgroßeȱGruppen.ȱWieȱinȱWorkflowȬSystemenȱexistierenȱhierȱ festeȱRegeln,ȱdieȱdenȱAblaufȱsteuernȱundȱüberwachen.ȱ – Kooperationȱ widmetȱ sichȱ demȱ zugrundeȱ liegendenȱ Geschäftsprozessȱ undȱ stelltȱ einenȱ gemeinsamenȱ virtuellenȱ Arbeitsplatzȱ zurȱ Verfügung.ȱ Dazuȱ istȱ einȱgemeinsamerȱZugriffȱaufȱInformationenȱundȱdieȱKontrolleȱüberȱerfüllteȱ undȱzuȱerfüllendeȱAufgabenȱnotwendig.ȱ – Kommunikationȱ sichertȱ denȱ Informationsaustauschȱ zwischenȱ beteiligtenȱ Benutzern.ȱ A u fg ab e
ȱ ȱ
G rupp e
ȱ ȱ
Z iel
A rb eitsg rupp e
T eam
G rupp enp ro zesse
ȱ ȱ
K o m m unikation
ȱ ȱ
A b stim m un g
K oo rdination
ȱ ȱ
Ziele K oo peration
ȱ ȱ Abbildungȱ3.14:ȱGroupwaremerkmaleȱ[Teufel]ȱ
Dieȱ Umsetzungȱ desȱ Collaborationsgedankensȱ inȱ eineȱ erfolgreicheȱ Teamarbeitȱ erȬ fordert:ȱ – diszipliniertesȱVerhaltenȱundȱsozialesȱDenkenȱ – qualitativȱhochwertigeȱArbeitsmittelȱinȱentsprechenderȱVielfaltȱ
82 ȱ
3.3ȱȱCollaborationȱ EinȱHilfsmittelȱhierfürȱbildetȱnaturgemäßȱderȱEȬMailȬMechanismus,ȱderȱimȱCollaȬ borationsumfeldȱ allerdingsȱ weitȱ überȱ dieȱ Nachrichtenfunktionȱ hinausgeht.ȱ Dieseȱ Anwendungenȱsollenȱhelfen,ȱinsbesondereȱdenȱFlussȱvonȱunstrukturiertenȱInformaȬ tionenȱinnerhalbȱvonȱArbeitsabläufenȱzuȱlenken,ȱundȱzwarȱaufȱderȱTeamebeneȱgeȬ nausoȱwieȱzwischenȱverschiedenenȱUnternehmen.ȱCollaborationȱstelltȱWissenȱunabȬ hängigȱvonȱZeitzonen,ȱräumlichenȱEntfernungenȱundȱNetzwerkgrenzenȱzurȱVerfüȬ gungȱundȱbildetȱdamitȱdieȱkollektiveȱIntelligenzȱdesȱUnternehmens,ȱumȱunstruktuȬ rierteȱInformationsquellenȱzuȱerschließen.ȱ
3.3.3
Kooperationssituationen
EineȱZusammenarbeitȱvonȱIndividuenȱimȱHinblickȱaufȱeinȱgemeinsamesȱZielȱsetztȱ eineȱWechselbeziehungȱzwischenȱdenȱeinzelnenȱAkteurenȱundȱderȱGruppeȱvoraus.ȱ Dazuȱ bedarfȱesȱ einerseitsȱderȱ KommunikationȱzumȱZweckeȱ desȱ InformationsausȬ tauschesȱundȱandererseitsȱderȱSynchronisation,ȱumȱdieȱGruppenmitgliederȱinȱihrenȱ Aktionenȱ aufeinanderȱ abzustimmen.ȱ Dieȱ Abbildungȱ dieserȱ Anforderungenȱ kenntȱ zweiȱModellvarianten:ȱ – Dasȱ Sendemodellȱ stütztȱ sichȱ aufȱ dieȱ MailȬKomponenteȱ undȱ dientȱ primärȱ derȱ Weiterleitungȱ vonȱ Dokumentenȱ nachȱ jedemȱ Bearbeitungsschritt.ȱ Dieȱ Collaborationsbeschreibungȱ liegtȱ inȱ derȱ Festlegungȱ desȱ Weges,ȱ denȱ eineȱ NachrichtȱaufȱdemȱWegȱbisȱzurȱvollständigenȱBearbeitungȱzurücklegt.ȱ – BeimȱgemeinsamȱgenutztenȱModellȱliegenȱdieȱdieȱGruppeȱbetreffendenȱDoȬ kumenteȱ inȱ einerȱ Datenbank,ȱ dieȱ inȱ regelmäßigenȱ Abständenȱ vonȱ allenȱ Teammitgliedernȱaufȱ fürȱsieȱ relevanteȱüberprüftȱ wird.ȱ Gegebenenfallsȱ werȬ denȱAntwortdokumenteȱerstelltȱoderȱdasȱOriginalȱbearbeitet.ȱ Eineȱ gängigeȱ Klassifizierungȱ derȱ Interaktionsartenȱ erfolgtȱ nachȱ räumlicherȱ undȱ temporärerȱȱVerfügbarkeitȱinȱvierȱKooperationssituationenȱ[Gappmeier,ȱS.ȱ341]:ȱ – gleicheȱ Zeitȱ /ȱ amȱ gleichenȱ Ort:ȱ DiesesȱSchemaȱ entsprichtȱ weitgehendȱ demȱ Workflowgedanken.ȱ – verschiedeneȱZeitȱ/ȱamȱgleichenȱOrt:ȱHierunterȱwerdenȱalleȱAnwendungenȱ zusammengefasst,ȱ dieȱ derȱ zentralenȱ Kooperationsunterstützungȱ dienen.ȱ PrimäreȱZielgruppeȱistȱhierȱdasȱTeam.ȱ – gleicheȱZeitȱ/ȱanȱverschiedenenȱOrten:ȱDieȱOrtsunabhängigkeitȱbetontȱdenȱ dezentralenȱKooperationsaspektȱeinerȱGruppe.ȱ – verschiedeneȱZeitȱ/ȱanȱverschiedenenȱOrten:ȱDieseȱSituationȱistȱtypischȱfürȱ denȱ Nachrichtenaustausch,ȱ beiȱ demȱ zeitversetzt,ȱ derȱ Empfängerȱ nichtȱ synȬ chronȱerreichbarȱseinȱmuss.ȱ Collaborationȱ lässtȱ sichȱ nurȱ schwierigȱ alsȱ geschlossenesȱ Systemȱ undȱ dementspreȬ chendȱ alsȱ einheitlicheȱ Softwareȱ auffassen.ȱ Sieȱ repräsentiertȱ sichȱ vielmehrȱ durchȱ ihreȱ Einzelkomponenten.ȱ Dieseȱ erstreckenȱ sichȱ aufȱ dieȱ demȱ CollaborationsgedanȬ kenȱ zugrundeȱ liegendenȱ Kooperationssituationenȱ undȱ werdenȱ häufigȱ inȱ dieȱ vierȱ KlassenȱKommunikation,ȱWorkgroup,ȱWorkflowȱundȱKooperationȱgeteilt.ȱ
ȱ
83
3ȱȱECMȱManageȬKomponenteȱ
Kommunikation
Workgroup
Workflow
Kooperation
verschiedene Zeit, verschiedener Ort: Mail, Fax, Terminverwaltung
verschiedene Zeit, gleicher Ort: Kooperationsunterstützung Aufgabenmanagement
gleicher Ort, gleiche Zeit: Dokumentenverwaltung
Verschiedener Ort, gleiche Zeit: Videokonferenz
Abbildungȱ3.15:ȱKooperationssituationenȱundȱpotentielleȱAnwendungenȱ
Beispiel:ȱWerbeagenturȱ ȱ Eineȱ Werbeagenturȱ mitȱ zweiȱ räumlichȱ getrenntenȱ Filialenȱ legtȱ ihreȱ Werbespotsȱ inȱ einerȱ zentralenȱ Collaborationsdatenbankȱ ab.ȱ Damitȱ wirdȱ dieȱ herkömmlicheȱ Artȱ derȱ Vorführungȱ undȱ Verteilungȱ derȱ Filmeȱ umgangen,ȱ undȱ denȱ Kundenȱ kannȱ dieȱ Realisierungsmöglichkeitȱ undȱ Wirkungȱ vonȱ Werbespotsȱ vonȱ jedemȱ Agenturstandortȱ demonstriertȱ werden.ȱ Andererseits,ȱ daȱ beideȱ Filialenȱ gemeinsamȱ Projekteȱ bearbeiten,ȱ werdenȱ anȱ verschiedenenȱ Standortenȱ Teileȱ derȱ Aufträgeȱ übernommen.ȱ Dieȱ jeweiligenȱ aktuelleȱ Bearbeitungsständeȱ werdenȱ zunächstȱ inȱ derȱ lokalenȱ Datenbankȱ abgelegtȱ undȱ überȱ einenȱ automatischenȱ Abgleichȱ zuȱ einemȱ späterenȱ Zeitpunktȱ unternehmensweitȱ verfügbarȱ gemacht.ȱ Aufȱ dieseȱ Weiseȱ lassenȱ sichȱ neueȱ Spotsȱ problemlosȱ ergänzenȱ oderȱ durchȱ überarbeiteteȱ ersetzen.ȱ Derȱ Agenturȱ istȱ esȱ somitȱ möglichȱ geworden,ȱ Interessentenȱ inȱ jederȱ Niederlassungȱ dieȱ aktuellenȱ Inhalteȱ zuȱ präsentieren,ȱ ohneȱ beiȱ Vorführungenȱ OnlineȬVerbindungenȱ mitȱ hoherȱ Bandbreiteȱzuȱbenötigen.ȱ ȱ Beispiel:ȱRedaktionȱ ȱ Inȱ derȱ Redaktionȱ einesȱ Nachrichtenmagazinsȱ findetȱ inȱ einerȱ vernetztenȱ MultimediaȬUmgebungȱ eineȱ abschließendeȱ Sitzungȱ zurȱ Wochenausgabeȱ
84 ȱ
3.3ȱȱCollaborationȱ statt.ȱDerȱChefredakteurȱbesprichtȱmitȱderȱHerausgeberinȱdasȱendgültigeȱ Layout.ȱ Dazuȱ benutzenȱ beideȱ mehrereȱ Anwendungen.ȱ Mitȱ einemȱ Telezeigerȱ deutenȱ sieȱ aufȱ kritische,ȱ diskussionswürdigeȱ Dokumentenstellen,ȱ undȱ überȱ eineȱ AudioȬȱ undȱ Videoverbindungȱ unterhaltenȱ sieȱ sichȱ zuȱ diesenȱ Textstellenȱ mittelsȱ sprachlicherȱ ErklärungenȱundȱGestik.ȱStoßenȱbeideȱaufȱeinȱProblemȱbeiȱeinemȱArtikelȱ derȱ Sportredakteurin,ȱ ladenȱ sieȱ dieseȱ elektronischȱ ein,ȱ Stellungȱ zuȱ beziehen,ȱ ohneȱ eineȱ weitereȱ Redaktionssitzungȱ einberufenȱ zuȱ müssen.ȱ Dieȱ Sportredakteurinȱ unterbrichtȱ ihreȱ aktuelleȱ Sitzungȱ mitȱ einemȱ Kollegenȱ undȱ erklärtȱ denȱ beidenȱ Verantwortlichenȱ dieȱ problematischeȱ Stelle.ȱȱ DieȱStärkenȱvonȱCollaborationȱliegenȱinȱfolgendenȱBereichen:ȱ
ȱ
– HaupteinsatzgebietȱistȱderȱBereichȱunstrukturierterȱdokumentenbasierterȱInȬ formation.ȱ Damitȱ entziehtȱ sichȱ Collaborationȱ demȱ Feldȱ derȱ MassenȬ datenverarbeitung.ȱ – Collaborationȱ unterstütztȱ einenȱ dezentralenȱ Ansatz.ȱ Ausdruckȱ dieserȱ ZielȬ richtungȱistȱderȱReplikationsmechanismusȱalsȱAbgleichȱundȱSynchronisationȱ räumlichȱ verteilterȱ dynamischerȱ Datenbestände.ȱ Daȱ dadurchȱ bewusstȱ reȬ dundanteȱ Datenbeständeȱ anȱ unterschiedlichenȱ Ortenȱ inȱ Kaufȱ genommenȱ werden,ȱistȱCollaborationȱkeinȱInstrumentȱzurȱTransaktionsverarbeitung.ȱ – CollaborationȱintegriertȱzurȱKommunikationȱderȱGruppenmitgliederȱeineȱEȬ MailȬKomponenteȱ sowieȱ weitereȱ Konzepteȱ zurȱ Unterstützungȱ derȱ TeamarȬ beit.ȱ Inȱ Verbindungȱ mitȱ derȱ Dokumentenorientierungȱ undȱ derȱ Replikationȱ entstehtȱ damitȱ einȱ Werkzeugȱ zurȱ Abbildungȱ ortsübergreifenderȱ GeschäftsȬ prozesse.ȱ
ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ Abbildungȱ3.16:ȱGroupwareeinordnungȱundȱȬanwendungenȱ[Teufel]ȱ
ȱ
85
3ȱȱECMȱManageȬKomponenteȱ EineȱabschließendeȱGegenüberstellungȱderȱStärkenȱundȱSchwächenȱvonȱCollaboraȬ tionȱzeigtȱfolgendesȱBild:ȱ Tabelleȱ3.4:ȱStärkenȱundȱSchwächenȱvonȱCollaborationȱ[Dierker,ȱS.ȱ63]ȱ Stärken
Schwächen
Verarbeitung „weicher“ Daten in semistrukturierten Prozessen
keine transaktionsorientierte Verarbeitung „harter“ Daten in stark strukturierten Prozessen
Verarbeitung gruppenbezogener Daten
keine Massendatenverarbeitung
Unterstützung mobiler Anwendungen
Performanceeinbußen bei großen Datenbeständen
Replikation zum gezielten Austausch und Abgleich verteilter dynamischer Datenbestände.
kein Sperren von Daten bei konkurrierendem Zugriff
integrierte E-Mail-Komponente und Werkzeuge zur Unterstützung gruppenorientierter Abläufe
keine ständige Gewährleistung der Datenkonsistenz Datenredundanz durch Mehrfachspeicherung in verteilten Umgebungen
ȱ Derȱ Nutzenȱ einesȱ Collaborationeinsatzesȱ richtetȱ sichȱ aufȱ sehrȱ unterschiedlicheȱ Aspekte.ȱSieȱreichenȱ vonȱgruppendynamischenȱ Prozessenȱüberȱ typischeȱ KommuȬ nikationsaktivitätenȱbisȱzuȱpositivenȱorganisatorischenȱAuswirkungen:ȱ – dieȱ Kreativitätȱ Einzelnerȱ wirdȱ stimuliertȱ undȱ dieȱ Gruppenzusammenarbeitȱ gefördertȱ – dieȱ Zahlȱ derȱ Medienbrücheȱ beiȱ Geschäftsvorgängenȱ wirdȱ verringertȱ undȱ damitȱdasȱAusräumenȱeinerȱSchwachstelleȱderȱherkömmlichenȱKommunikaȬ tionȱerreicht.ȱ – MitarbeiterȱwerdenȱstärkerȱinȱdasȱOrganisationsgefügeȱintegriert.ȱDieȱMitglȬ iederȱ einerȱ Gruppeȱ geratenȱ damitȱ bezüglichȱ ihrerȱ Projekteȱ verstärktȱ inȱ dieȱ RolleȱderȱBringschuldȱvonȱgruppenbetreffendenȱInformationen.ȱ – dieȱ Bildungȱ virtuellerȱ Teamsȱ querȱ zurȱ Organisationȱ bietetȱ dieȱ aufgabenbeȬ zogeneȱZusammenarbeitȱEinzelnerȱanȱProjektenȱjenseitsȱderȱüblichenȱGrenȬ zenȱderȱAufbauorganisation.ȱ – derȱ Austauschȱ problemorientierterȱ Informationȱ ohneȱ dasȱ notwendigeȱ WisȬ senȱ überȱ dieȱ Datenorganisationȱ kannȱ erleichtertȱ werden.ȱ Collaborationȱ orȬ ganisiertȱ dasȱ Wissenȱ undȱ KnowȬHowȱ desȱ Unternehmensȱ undȱ erleichtertȱ dessenȱManagement.ȱOhneȱzusätzlichesȱHilfsmittelȱwürdeȱdasȱgesamteȱUnȬ ternehmenswissenȱ weiterhinȱ inȱ Dateienȱ oderȱ denȱ Köpfenȱ derȱ Mitarbeiterȱ schlummernȱ–ȱeinȱZustandȱderȱfürȱTeamarbeitȱuntragbarȱist.ȱȱ Trotzȱ vielerȱ positiverȱ Gesichtspunkteȱ existierenȱ auchȱ Problemeȱ vorȱ allemȱ ausȱ folȬ gendenȱGründen:ȱ
86 ȱ
3.3ȱȱCollaborationȱ – Eineȱ Transparenzȱ derȱ Gruppenarbeitsweiseȱ kannȱ Akzeptanzproblemeȱ beiȱ Gruppenmitgliedernȱauslösen.ȱEinȱ„opinionȱleader“ȱdominiertȱdasȱKommuȬ nikationsverhaltenȱderȱgesamtenȱGruppe.ȱ – Collaborationȱ führtȱ zuȱ einerȱ Schwächungȱ desȱ sozialenȱ Umfeldes.ȱ Dieȱ KonȬ takteȱEinzelnerȱaußerhalbȱderȱOrganisationsstrukturȱwerdenȱdurchȱeinȱstrafȬ fesȱKommunikationsmanagementȱfaktischȱwertlos.ȱȱ – CollaborationȱbeeinflusstȱalleȱherkömmlichenȱUnternehmensstrukturen:ȱ o Dieȱ AufbauȬȱ undȱ Ablauforganisationȱ wirdȱ jeȱ nachȱ Gradȱ derȱ ErnsthaftigkeitȱdesȱCollaborationeinsatzesȱdurchȱeinȱRedesignȱvonȱ GeschäftsprozessenȱstarkenȱVeränderungenȱunterworfen.ȱ o Dieȱ Rollenverteilungȱ vonȱ Gruppenmitgliedernȱ mussȱ neuȱ überȬ dachtȱ undȱ möglicherweiseȱ durchȱ einȱ JobȬEnrichmentȱ attraktiverȱ werden.ȱ o Dieȱ Collaborationsbeteiligungȱ spiegeltȱ dieȱ persönlicheȱ KommuniȬ kationspräferenzȱ widerȱ undȱ kannȱ vonȱ vollständigerȱ Ablehnungȱ bisȱzurȱpermanentenȱSelbstdarstellungȱreichen.ȱ o OhneȱdasȱentsprechendeȱBewusstseinȱundȱdieȱMotivationȱderȱMiȬ tarbeiterȱ stelltȱ sichȱ nurȱ schwerȱ einȱ Erfolgȱ ein;ȱ dennȱ dieȱ VerändeȬ rungenȱinȱdenȱDenkprozessenȱundȱVerhaltensstrukturenȱsindȱnurȱ durchȱeinȱevolutionäresȱVorgehenȱzuȱerreichen.ȱ
3.3.4
Workflow – Collaboration
Esȱzeigtȱsich,ȱdassȱCollaborationȱinȱersterȱLinieȱkeineȱtechnischeȱHerausforderungȱ darstellt,ȱsondernȱderȱNutzerȱeineȱklareȱVorstellungȱderȱWirkungszusammenhängeȱ besitzenȱmuss,ȱdaȱsonstȱorganisatorischeȱundȱunternehmenskulturelleȱFaktorenȱderȱ Akzeptanzȱ imȱ Wegeȱ stehen.ȱ Überhauptȱ dürftenȱ esȱ vorwiegendȱ zwischenȬ menschlicheȱKomponentenȱsein,ȱdieȱdieȱȱAnpassungȱderȱGeschäftsabläufeȱverhinȬ dern.ȱSoȱwerdenȱdieȱErgebnisseȱeinerȱPlanungsgruppe,ȱdieȱquerȱzurȱOrganisationȱ etabliertȱist,ȱoftȱalsȱAngriffȱaufȱdasȱinterneȱMachtgefügeȱangesehen.ȱOhneȱdieȱKläȬ rungȱ undȱ Transparenzȱ derȱ neuenȱ organisatorischenȱ Strukturȱ reichtȱ dieȱ reineȱ EinȬ führungȱvonȱCollaborationȱzurȱStraffungȱalthergebrachterȱVerfahrensweisenȱnichtȱ aus.ȱ Eineȱ Bewertungȱ derȱ beiderȱ Konzepteȱ –ȱ Workflowȱ undȱ Collaborationȱ –ȱ stelltȱ dieȱ konzeptionellenȱSchwerpunkteȱinȱdenȱMittelpunkt:ȱ – CollaborationȱzieltȱaufȱdieȱUnterstützungȱprojektorientierter,ȱfallweiserȱundȱ nurȱ wenigȱ strukturierterȱ Teamarbeit.ȱ Währendȱ derȱ Durchführungȱ könnenȱ AdȬhocȬEinflüsseȱauftreten,ȱdieȱeineȱÄnderungȱdesȱBearbeitungsablaufesȱerȬ zwingen.ȱ Workflowsȱ dagegenȱ unterstützenȱ prozessorientierte,ȱ gutȱ struktuȬ rierteȱoderȱstrukturierbareȱGeschäftsvorgänge.ȱDieȱdeterministischeȱAbfolgeȱ derȱeinzelnenȱArbeitsschritteȱerinnertȱanȱeineȱFließbandstruktur.ȱȱ – BeimȱWorkflowȬAnsatzȱspieltȱdasȱSystemȱeineȱaktiveȱRolle,ȱsteuertȱAbläufe,ȱ löstȱ Aktionenȱ aus,ȱ reichtȱ Dokumenteȱ weiter.ȱ Derȱ Anwenderȱ istȱ passivȱ undȱ
ȱ
87
3ȱȱECMȱManageȬKomponenteȱ
ȱ
reagiertȱ nurȱ aufȱ Systemvorschläge.ȱ Dieseȱ Strategie,ȱ beiȱ derȱ dasȱ Systemȱ denȱ BenutzerȱtreibtȱundȱihmȱdieȱzuȱbearbeitendenȱAufgabenȱsowieȱdieȱnotwenȬ digenȱWerkzeugeȱundȱDatenȱvorgibt,ȱwirdȱalsȱPushȬStrategieȱumschrieben.ȱ DemȱBenutzerȱbleibtȱallenfallsȱeineȱwertendeȱFunktion;ȱaufȱdenȱAblaufȱkannȱ erȱjedochȱkeinenȱEinflussȱnehmen.ȱ – DasȱGegenteilȱderȱPushȬStrategieȱbildetȱdasȱPullȬPrinzip,ȱbeiȱdemȱdasȱTeamȱ dasȱsteuerndeȱElementȱdarstellt,ȱautomatischȱdieȱbestgeeignetenȱWerkzeugeȱ auswählt,ȱdieȱnotwendigenȱInformationenȱzusammenstelltȱundȱdieȱProzessȬ fortführungȱdefiniert.ȱDiesesȱVorgehenȱentsprichtȱweitgehendȱdemȱCollaboȬ rationsgedanken,ȱderȱinȱseinerȱFlexibilitätȱauchȱeinȱStückȱFirmenphilosophieȱ beinhaltet.ȱ – CollaborationȱsetztȱimȱGegensatzȱzuȱWorkflowȱaktiveȱTeamsȱoderȱAnwenȬ derȱ voraus.ȱ Ihnenȱ obliegtȱ dieȱ Organisationȱ derȱ Gruppe,ȱ ihreȱ Koordinationȱ undȱ Kommunikation.ȱ Hierȱ eröffnetȱ sichȱ alsoȱ einȱ gewaltigerȱ GestaltungsȬ spielraum.ȱȱ
ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ Abbildungȱ3.17:ȱWorkflowȱvs.ȱGroupwareȱ
ȱ
88 ȱ
3.3ȱȱCollaborationȱ Tabelleȱ3.5:ȱMerkmaleȱvonȱWorkflowȱundȱCollaborationȱ[Rentergent]ȱ Merkmal
Workflow
Collaboration
Prozesse
stark strukturiert, prozessorientiert
unstrukturiert, projektorientiert
Modellierung des Vorgangsablaufes
ja – aktiver Eingriff in die Gestaltung von Arbeitsabläufen
Nein – kein Eingriff in die Abläufe; nur Bereitstellung der Daten
Geschäftsregeln
im Vorgangsdesign enthalten
in der Anwendung hinterlegt
Kontrolle
durch das System
durch die Benutzer eigenverantwortlich
Fokus der EDV-Umsetzung
Geschäftsprozesse
Informationsfluss
Integration von DesktopAnwendungen
häufig
immer
Benutzer
passiv/push-Prinzip
aktiv/pull-Prinzip
System
aktiv
passiv
Benutzerzahl
wenige
sehr viele
Datenvolumen
groß – hoher Imageanteil
moderat
Administration
zentral
dezentral
Produktivitätssteigerung
Prozess – Vorgang steht im Mittelpunkt
Team – Mitarbeitergruppe steht im Mittelpunkt
ȱ ObwohlȱWorkflowmanagementȬȱundȱCollaborationssystemeȱvonȱihremȱAnsatzȱherȱ unterschiedlicheȱ Zieleȱ verfolgen,ȱ soȱ könnenȱ sieȱ dochȱ gemeinsamȱ inȱ denȱ UnterȬ nehmenȱ effizientȱ eingesetztȱ werden.ȱ WorkflowȬKomponentenȱ unterstützenȱ dieȱ korrekteȱundȱeffektiveȱAbarbeitungȱvonȱRoutineaufgaben,ȱCollaborationȱkonzentȬ riertȱsichȱaufȱdieȱBewältigungȱunkonventionellerȱFälleȱundȱPlanungsaufgabenȱ
3.3.5
Trend
WorkflowȱistȱeineȱAnwendung,ȱdieȱimȱZugeȱeinesȱverstärktȱinsȱBewusstseinȱrückȬ endenȱ BPMȱ neuenȱ Rückenwindȱ erfahrenȱ wird.ȱ Geschäftsprozesseȱ müssenȱ nichtȱ nurȱ identifiziert,ȱ analysiertȱ undȱ modelliert,ȱ sondernȱ auchȱ inȱ konkreteȱ Abläufeȱ übertragenȱ werden.ȱ Dieseȱ Transformationȱ wirdȱ verstärktȱ vonȱ Workflowsȱ überȬ nommen.ȱȱ Collaborationȱ istȱ derȱ weitgehendeȱErsatzȱderȱ altenȱ GroupwareȬVokabel.ȱ Dabeiȱistȱ zuȱ beobachten,ȱ dassȱ nichtȱ nurȱ imȱ Zusammenhangȱ mitȱ ECMȱ verstärktȱ überȱ denȱ AspektȱderȱZusammenarbeitȱvonȱGruppenȱnachgedachtȱwird,ȱsondernȱauchȱandeȬ reȱBranchenȱwieȱdieȱNetzwerkherstellerȱhierȱeinenȱMarktȱentdecktȱhaben.ȱSicherȱistȱ dieȱInterpretationȱinȱbeidenȱFällenȱnichtȱdeckungsgleich.ȱAufȱECMȬSeiteȱdieȱKonȬ zentrationȱaufȱdieȱMöglichkeitȱderȱinhaltlichenȱZusammenarbeitȱvonȱGruppenȱaufȱ
ȱ
89
3ȱȱECMȱManageȬKomponenteȱ Anwendungsebene,ȱ aufȱ derȱ Netzwerkseiteȱ dieȱ technischeȱ Verschmelzungȱ vonȱ Kommunikationsdienstenȱ undȱ dieȱ Erreichbarkeitȱ derȱ Gruppenteilnehmer.ȱ DenȬ nochȱgehörenȱbeideȱSeitenȱzusammen,ȱsollȱderȱProzessȱderȱZusammenarbeitȱunabȬ hängigȱvonȱZeitȱundȱRaumȱreibungslosȱablaufen.ȱȱȱȱȱ
3.4 Information Retrieval Dieȱ Informationssucheȱ stelltȱ einȱ Grundbedürfnisȱ jeglicherȱ InformationsverarbeiȬ tungȱ dar.ȱ Sieȱ reichtȱ historischȱ gesehenȱ vonȱ derȱ Sucheȱ nachȱ Zeichenmusternȱ undȱ Dateinamenȱ aufȱ Betriebssystemebeneȱ bisȱ zuȱ umfassenderȱ komfortablerȱ RetrievalȬ funktionalitätȱ inȱ allenȱ Komponentenȱ integrierterȱ undȱ funktionalerȱ Systemeȱ wieȱ Textverarbeitung,ȱ Tabellenkalkulationȱ oderȱ Groupware.ȱ Verstärkteȱ AufmerksamȬ keitȱerfährtȱdasȱInformationȱRetrievalȱdurchȱdieȱPopularitätȱdesȱInternetsȱundȱhierȱ insbesondereȱdesȱWWWȱ(WorldȱWideȱWeb).ȱDasȱDilemmaȱderȱInformationssucheȱ istȱ derȱ Wildwuchs.ȱ Esȱ existierenȱ keineȱ eindeutigenȱ Regelnȱ wieȱ Straßenschilder,ȱ nachȱdenenȱeinȱortsunkundigerȱNutzerȱgezieltȱsuchenȱkann.ȱDiesȱistȱdieȱLückeȱfürȱ Suchmaschinen,ȱ dieȱ zuȱ denȱ attraktivstenȱ Adressenȱ desȱ WWWȱ gehören.ȱ Vieleȱ InternetnutzerȱorientierenȱsichȱvermutlichȱüberȱdieȱreineȱEingabeȱeinesȱBegriffsȱimȱ schierȱunerschöpflichenȱDatenmeer.ȱDurchȱȱ – – – –
einenȱaussagekräftigenȱSystemvergleichȱȱ unterschiedlicheȱMöglichkeitenȱderȱIndexierungȱvonȱDokumentenȱallerȱArtȱ einfacheȱundȱeffizienteȱSuchverfahrenȱ eineȱschnelleȱAnzeigeȱderȱrecherchiertenȱDokumenteȱ
wirdȱdasȱInformationȱRetrievalȱzuȱeinerȱBasistechnologieȱdesȱInternets.ȱSchwierigȬ keitenȱbereitenȱvorȱallemȱdieȱAnfrageformulierungȱundȱdieȱErgebnisflut:ȱ – Häufigȱ durchläuftȱ dieȱ Anfrageformulierungȱ mehrereȱ Iterationen,ȱ bisȱ pasȬ sendeȱAntwortenȱgefundenȱwerdenȱ – AnfragenȱliefernȱsehrȱvieleȱAntworten,ȱaberȱnurȱwenigeȱdavonȱsindȱfürȱdenȱ Nutzerȱinteressant.ȱ – BeiȱTextdokumenten,ȱaberȱnochȱstärkerȱbeiȱBildernȱzeigtȱsich,ȱdassȱdieȱsysȬ teminternȱverwendeteȱRepräsentationȱdesȱInhaltsȱteilweiseȱinadäquat,ȱaufȱ jedenȱFallȱaberȱmitȱUnsicherheitȱbehaftetȱist.ȱȱ Inȱ seinerȱ allgemeinenȱ Definitionȱ beinhaltetȱ Informationȱ Retrievalȱdieȱ Darstellung,ȱ dieȱ Speicherungȱ undȱ dieȱ Organisationȱ vonȱ Informationenȱ sowieȱ denȱ Zugriffȱ aufȱ dieseȱ undȱ gehtȱ damitȱ überȱ dieȱ reinȱ suchorientierteȱ Sichtweiseȱ derȱ Anwendungenȱ deutlichȱ hinaus.ȱ Alsȱ Suchgegenstandȱ beziehtȱ sichȱ dasȱ Retrievalȱ aufȱ jeglicheȱ Formȱ vonȱDokumenten,ȱd.h.ȱBriefe,ȱBücher,ȱZeitungsartikel,ȱProtokolle,ȱAudioȬȱundȱViȬ deoinformationen,ȱdieȱinȱeinerȱDokumentensammlungȱzusammengefasstȱvorliegen.ȱ Hinzuȱ kommt,ȱ dassȱ dasȱ Fehlenȱ vonȱ Inhaltsinformationenȱ undȱ unterschiedlicheȱ Dateiformateȱ denȱ Zugangȱ zuȱ denȱ Datenȱ erschweren.ȱ Oftȱ sindȱ Dokumenteȱ überȱ mehrereȱ Standorteȱ verteiltȱ undȱ mitȱ differierendenȱ Berechtigungenȱ versehen,ȱ UmȬ
90 ȱ
3.4ȱȱInformationȱRetrievalȱ stände,ȱ dieȱ eineȱ einheitlicheȱ Sucheȱ unmöglichȱ machenȱ undȱ nachȱ systemübergreiȬ fendenȱSuchwerkzeugenȱverlangen.ȱ Dieȱ Aufgabeȱ einerȱ Sucheȱ bestehtȱ darin,ȱ alleȱ relevantenȱ vorhandenenȱ Dokumenteȱ einerȱDokumentensammlungȱmittelsȱeinerȱSuchanfrageȱnachzuweisen.ȱDazuȱwerȬ denȱdreiȱAbstraktionsstufenȱunterschiedenȱ[Fuhrȱ2004,ȱS.ȱ8]:ȱ
ȱ
– SyntaxȱfasstȱeinȱDokumentȱalsȱFolgeȱvonȱSymbolenȱauf.ȱMethoden,ȱdieȱaufȱ dieserȱEbeneȱarbeiten,ȱsindȱdieȱZeichenkettensucheȱinȱTextenȱsowieȱBildretȬ rievalverfahren,ȱdieȱnachȱMerkmalenȱwieȱFarbe,ȱTexturȱundȱKonturȱsuchen.ȱ – SemantikȱbeschäftigtȱsichȱmitȱderȱBedeutungȱeinesȱDokumentes.ȱ – Pragmatikȱ orientiertȱ sichȱ anȱ derȱ Nutzungȱ einesȱ Dokumentesȱ fürȱ einenȱ beȬ stimmtenȱ Zweck.ȱ Zumȱ Beispielȱsuchtȱ einȱ Studentȱ Literaturȱzuȱ einemȱ SemiȬ narthema.ȱȱ
ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ Abbildungȱ3.18:ȱGrundmodellȱdesȱDokumentenretrievalsȱ[Fuhrȱ2002,ȱS.ȱ9]ȱ
Generellȱlässtȱsichȱfesthalten,ȱdassȱNutzerȱmeistensȱanȱeinerȱSucheȱaufȱderȱpragmaȬ tischenȱEbeneȱinteressiertȱsind.ȱ DieȱSuchanfrageȱinȱihrerȱklassischenȱFormȱbasiertȱaufȱSchlüsselwörternȱundȱbirgtȱ damitȱ dieȱ Gefahr,ȱ einenȱ unscharfenȱ Suchbegriffȱ zuȱ verwendenȱ oderȱ denȱ Kontextȱ derȱ Anfrageȱ zuȱ missachten.ȱ Darüberȱ hinausȱ findetȱ eineȱ reinȱ syntaktischeȱ Sucheȱ statt,ȱ ohneȱ dieȱ Bedeutungȱ derȱ Wörterȱ innerhalbȱ desȱ Kontextesȱ derȱ einzelnenȱ DoȬ kumenteȱzuȱberücksichtigen.ȱSoȱergibtȱdieȱEingabeȱdesȱBegriffsȱ„Bank“ȱeineȱVielȬ zahlȱvonȱVerweisen,ȱdieȱsowohlȱaufȱFinanzdienstleisterȱwieȱaufȱSitzmöbelȱverweiȬ sen.ȱ Dennochȱ bildetȱ dieȱ RetrievalȬFunktionȱ eineȱ Basisfunktionalitätȱ allerȱ DokuȬ
ȱ
91
3ȱȱECMȱManageȬKomponenteȱ mentenmanagementsystemeȱundȱdesȱInternets.ȱDieȱGegenüberstellungȱeinerȱLiteȬ raturrechercheȱmitȱundȱohneȱRetrievalmechanismenȱunterstreichtȱdieȱBedeutung: Tabelleȱ3.6:ȱLiteraturrechercheȱundȱInformationȱRetrievalȱ Dokumentensuche ohne Information Retrieval
Dokumentensuche mit Information Retrieval
Klassifikation von Dokumenten nach Ordnungskriterien
Dokumentenerschließung mittels Deskriptoren
Suche mit Schlag-/Stichwörtern oder Katalogen
Recherche mit Suchanfragesprache in Datenbanken
ȱ Dieȱ Systemarchitekturȱ einesȱ vollständigenȱ Informationȱ RetrievalȬSystemsȱ umfasstȱ inȱseinerȱallgemeinenȱAusprägungȱvierȱSäulen:ȱȱ
ȱ
– Dokumentenerfassungȱ – IndexierungȱalsȱdasȱKennzeichnenȱundȱFeststellenȱdesȱDokumenteninhaltesȱ überȱausgewählte,ȱdasȱDokumentȱrepräsentierendeȱBegriffe,ȱsog.ȱDeskriptoȬ ren.ȱ ȱ Jedesȱ Dokumentȱ erhältȱ „einȱ Etikett“,ȱ dasȱ überȱ seinenȱ Inhaltȱ Auskunftȱ gibt.ȱ – RechercheȱzumȱgezieltenȱSuchenȱundȱWiederauffindenȱvonȱDokumenten.ȱ – SpeicherungȱzurȱAblageȱvonȱDokumenten,ȱDeskriptorenȱundȱVerweisen.ȱ
ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ Abbildungȱ3.19:ȱAufbauȱeinesȱInformationȱRetrievalȬSystemsȱ[Bekavac,ȱS.5]ȱ
92 ȱ
3.4ȱȱInformationȱRetrievalȱ
3.4.1
Gütemaße
FürȱNutzerȱvonȱInformationȱRetrievalȬSystemenȱstelltȱsichȱdieȱFrage,ȱanhandȱwelȬ cherȱ Kriterienȱ sieȱ dieȱ Güteȱ desȱ vorhandenenȱ oderȱ auszuwählendenȱ RetrievalȬ systemsȱ einschätzenȱ können.ȱ Danebenȱ orientiertȱ sichȱ eineȱ technischeȱ Beurteilungȱ anȱKriterienȱwieȱsieȱfürȱalleȱAnwendungssystemeȱgelten.ȱHierzuȱzählen:ȱSpeicherȬ platzverbrauch,ȱ Antwortzeitverhalten,ȱ Stabilität,ȱ SoftwareȬErgonomie,ȱ ZuverläsȬ sigkeit,ȱErweiterbarkeit,ȱWartbarkeitȱoderȱAufbauȱderȱSuchdateien.ȱDieseȱAspekteȱ werdenȱ durchȱ spezielleȱ Informationȱ RetrievalȬGesichtspunkteȱ ergänzt,ȱ dieȱ sichȱ inȱ dreiȱHauptbereicheȱgliedern:ȱ
ȱ
– LeistungsparameterȱderȱDokumentenerfassung:ȱ o dieȱFehlerrateȱbeiȱderȱErfassungȱ o dieȱ Zeitverzögerungȱ zwischenȱ Erscheinenȱ undȱ Aufnahmeȱ einesȱ Dokumentesȱ o dieȱ Sachgebietsabdeckungȱ alsȱ demȱ Anteilȱ relevanterȱ Dokumenteȱ anȱ allenȱ relevantenȱ desȱ Sachgebietes.ȱ Soȱ wäreȱ eineȱ juristischeȱ UrȬ teilssammlungȱohneȱhoheȱSachgebietsabdeckungȱpraktischȱwertlos.ȱ DerȱNutzenȱeinerȱDokumentensammlungȱistȱabhängigȱvon:ȱ x derȱAktualitätȱ=ȱeinerȱzeitnahenȱDokumentenaufnahmeȱ x derȱ Vollständigkeitȱ =ȱ einerȱ Aufnahmeȱ allerȱ relevantenȱ Dokumenteȱ
ȱ
ȱ
– Implementationsparameter:ȱ o Indexierungsmöglichkeitenȱ unterȱ Einschlussȱ einesȱ BegriffswörterȬ buchesȱinȱFormȱeinesȱsog.ȱThesaurusȱundȱeinerȱListeȱmitȱWörternȱ gleicherȱ Bedeutungȱ zurȱ Vereinheitlichungȱ derȱ ausgewähltenȱ DesȬ kriptorenȱ o eineȱ Suchanfragesprache,ȱ dieȱ dieȱ Artȱ derȱ formulierbarenȱ Suchenȱ mittelsȱ vorgefertigterȱ Elementeȱ oderȱ durchȱdieȱȱ Eingabeȱ vonȱSQLȱ (StructuredȱQueryȱLanguage)ȬähnlicherȱSyntaxȱvorgibt.ȱ – Gütemaße.ȱSieȱbeschreibenȱȱdieȱEinschätzungȱderȱQualitätȱvonȱInformationȱ RetrievalȬSystemenȱdurchȱzweiȱFaktorenȱ[Jones,ȱS.ȱ43],ȱ[Salton,ȱS.ȱ174ff.]:ȱ o PrecisionȱalsȱAnteilȱ allerȱrelevantenȱ Dokumenteȱanȱdenȱ selektierȬ tenȱDokumentenȱeinerȱSuchanfrage.ȱSieȱbezeichnetȱdasȱMaßȱderȱinȱ derȱ Trefferlisteȱ enthaltenen,ȱ bezüglichȱ derȱ Aufgabenstellungȱ beȬ deutungsvollenȱDokumenteȱ o Recallȱ alsȱ Anteilȱ allerȱ relevantenȱ Dokumenteȱ anȱ derȱ Gesamtzahlȱ relevanterȱ Dokumenteȱ derȱ Dokumentensammlung.ȱ Hierbeiȱ hanȬ deltȱesȱsichȱumȱdasȱMaßȱfürȱdieȱVollständigkeitȱeinerȱTrefferliste.ȱ
ȱ
93
3ȱȱECMȱManageȬKomponenteȱ Eineȱ Rechercheȱ teiltȱ eineȱDokumentensammlungȱimȱ Ergebnisȱ damitȱ inȱ selektierteȱ undȱnichtȱselektierteȱDokumenteȱundȱunterȱlogischenȱGesichtspunktenȱinȱrelevanteȱ undȱnichtȱrelevante.ȱDreiȱArtenȱvonȱRelevanzȱlassenȱsichȱunterscheiden:ȱ – SituativeȱRelevanzȱbeschreibtȱdieȱ(tatsächliche)ȱNützlichkeitȱdesȱDokumenȬ tesȱinȱBezugȱaufȱdieȱAufgabe,ȱausȱderȱdasȱInformationsbedürfnisȱentstandenȱ ist.ȱDieseȱAuffassungȱvonȱRelevanzȱorientiertȱsichȱalsoȱanȱderȱȱDefinitionȱdesȱ Informationsbegriffs.ȱ Allerdingsȱ lässtȱ sichȱ dieȱ situativeȱ Relevanzȱ praktischȱ kaumȱerfassen.ȱ – ObjektiveȱRelevanzȱistȱdieȱvonȱeinemȱoderȱmehrerenȱneutralenȱBeobachternȱ beurteilteȱ Beziehungȱ zwischenȱ demȱ geäußertenȱ Informationswunschȱ undȱ demȱ Dokument.ȱ Dieserȱ Relevanzbegriffȱ wirdȱ häufigȱ beiȱ SystemevaluierunȬ genȱzugrundeȱgelegt.ȱ – Systemrelevanzȱ bezeichnetȱ dieȱ vonȱ einemȱ Systemȱ geschätzteȱ Relevanzȱ desȱ DokumentesȱinȱBezugȱaufȱdieȱformaleȱAnfrage.ȱ
ȱ Abbildungȱ3.20:ȱRecallȱundȱPrecisionȱ[Bekavac,ȱS.ȱ15]ȱȱ
DieȱMaßeȱRecallȱundȱPrecisionȱbildenȱentscheidendeȱKennzahlenȱfürȱeinȱInformaȬ tionȱRetrievalȬSystem.ȱEinȱidealesȱSystemȱwürdeȱinȱeinerȱSuchanfrageȱalleȱrelevanȬ tenȱDokumenteȱeinerȱDokumentensammlungȱunterȱAusschlussȱnichtȱzutreffenderȱ
94 ȱ
3.4ȱȱInformationȱRetrievalȱ Dokumenteȱselektieren,ȱsoȱdassȱdieȱBereicheȱBȱundȱCȱleerȱblieben.ȱAnȱdieserȱIdealȬ konstellationȱrichtenȱsichȱdieȱGütemaßeȱaus.ȱ Dieȱ theoretischeȱ Bedeutungȱ derȱ Gütemaßeȱ Recallȱ undȱ Precisionȱ wirdȱ zwarȱ allgeȬ meinȱ anerkannt;ȱ dennochȱ entzündetȱ sichȱ anȱ ihrerȱ unscharfenȱ BestimmungsȬ möglichkeitȱKritik:ȱ – Beideȱ Maßeȱ beziehenȱ sichȱ aufȱ eineȱ Dokumentensammlung.ȱ Demzufolgeȱ istȱ keinȱLeistungsvergleichȱunterschiedlicherȱSystemeȱfürȱunterschiedlicheȱDoȬ kumentensammlungenȱundȱBenutzergruppenȱmöglich.ȱ – BeideȱMaßeȱverändernȱsichȱmitȱdemȱUmfangȱderȱDokumentensammlung,ȱdaȱ relevanteȱundȱirrelevanteȱDokumenteȱimȱAllgemeinenȱeineȱungleichmäßigeȱ Entwicklungȱnehmen.ȱ – DieȱRelevanzeinstufungȱderȱDokumenteȱistȱsubjektiv.ȱDaherȱsindȱbeideȱMaȬ ßeȱweitgehendȱpersonengebundenȱundȱkeinȱobjektivesȱLeistungskriterium.ȱ – Dieȱ potentiellenȱ Suchmöglichkeitenȱ bestimmenȱ dasȱ Messergebnis,ȱ soȱ dassȱ dieȱSuchanfragespracheȱentscheidendȱdenȱWertȱbeiderȱMaßeȱbeeinflusst.ȱ
3.4.2
Deskriptoren und Indexierung
EinȱKerngesichtspunktȱvonȱInformationȱRetrievalȬSystemenȱbestehtȱinȱderȱIdentifiȬ zierungȱ sinnȬȱ undȱ bedeutungstragenderȱ Begriffeȱ einesȱ Dokumentes,ȱ dieȱ demȱ BeȬ nutzerȱalsȱSuchkriterienȱbeiȱderȱFormulierungȱseinerȱAnfrageȱdienen.ȱVorausgehenȱ dieserȱBegriffsfindungȱzweiȱFragen:ȱ
ȱ
– WelcheȱBegriffeȱsindȱalsȱDeskriptorenȱüberhauptȱgeeignet?ȱDieȱAntwortȱhieȬ raufȱistȱsicherȱauchȱinȱAbhängigkeitȱvonȱderȱSpracheȱzuȱsehen.ȱ – Gebenȱ Deskriptorenȱ denȱ Dokumenteninhaltȱ zutreffendȱ wieder?ȱ Hierȱ stehtȱ dieȱQualitätȱderȱbeschreibendenȱBegriffeȱimȱMittelpunkt.ȱ
ȱ ȱ
Dokument Dokument Dokument
ȱ ȱ ȱ ȱ ȱ ȱ ȱ
Zusammenfassungen Zusammenfassungen
Themen Themen
ȱ
GenerischeListen
Deskriptoren
Abbildungȱ3.21:ȱInformationsgewinnungȱ
ȱ
95
3ȱȱECMȱManageȬKomponenteȱ NachȱihrerȱHerkunftȱlassenȱsichȱdieȱbeschreibendenȱBegriffeȱinȱzweiȱKlassenȱteilen:ȱȱ – formaleȱDeskriptorenȱverwendenȱAutor,ȱOrt,ȱTitel,ȱStichwörterȱundȱähnlicheȱ Begriffe,ȱ dieȱ keinenȱ Bezugȱ zumȱ Dokumenteninhaltȱ besitzen,ȱ fürȱ dieȱ Sucheȱ [Schumann,ȱ S.ȱ 27Ȭ30].ȱ Inȱ vielenȱ Anwendungenȱ werdenȱ zuȱ ihrerȱ Erfassungȱ automatischȱ Formulareȱ eingeblendet,ȱ inȱ denenȱ Auswahllistenȱ hinterlegtȱ oderȱ KannȬȱ undȱ MussȬFelderȱ definiertȱ sind.ȱ Diesȱ schafftȱ dieȱ Möglichkeit,ȱ Dokumenteȱsoȱabzulegen,ȱwieȱesȱdemȱUnternehmenȱoderȱdemȱEinsatzgebietȱ entspricht.ȱ – dieȱinhaltlicheȱErschließungȱȱvergibtȱinhaltsabhängigeȱSuchbegriffeȱfürȱeineȱ inhaltsbezogeneȱSucheȱbisȱzurȱVolltextrecherche.ȱSieȱtrifftȱaufȱdieȱSchwierigȬ keitenȱderȱSprache,ȱWortstämmeȱundȱsemantischeȱBezügeȱzuȱentwirrenȱundȱ nurȱsinntragendeȱWorteȱzuȱisolieren.ȱ AuchȱdieȱVerfahrenȱzurȱBestimmungȱderȱSuchbegriffeȱlassenȱzweiȱVariantenȱzu:ȱȱ – dieȱ manuelleȱ Indexierungȱ [Freiburg,ȱ S.ȱ 85]ȱ wirdȱ vonȱ Expertenȱ mittelsȱ TerȬ minologielistenȱ undȱ ähnlichenȱ Regelwerkenȱ kontrolliertenȱ Vokabularsȱ durchgeführt;ȱsieȱgestattetȱeineȱSprachanalyseȱindividuellerȱFormulierungenȱ undȱ eineȱ Synonymvergabe,ȱ besitztȱ aberȱ denȱ Nachteil,ȱ dassȱ sieȱ aufwendig,ȱ langsamȱundȱ teuerȱist,ȱ ihreȱ Qualitätȱ vonȱ derȱ konsistentenȱ Arbeitsweiseȱ desȱ Personalsȱ abhängtȱ undȱ derȱ vordefinierteȱ Deskriptorwortschatzȱ statischȱ ist.ȱ Zudemȱ mussȱ derȱ Benutzerȱ dasȱ Indexierungsvokabularȱ kennen,ȱ umȱ DokuȬ menteȱ zuȱ recherchieren.ȱ Eineȱ besondereȱ Ausprägungȱ dieserȱ IndexierungsȬ formȱ istȱ dieȱ Kategorisierungȱ derȱ Internetadressenȱ inȱ bestimmteȱ WissensgeȬ bieteȱoderȱRubriken.ȱEinigeȱderȱbekanntestenȱSuchmaschinenȱ(Yahoo,ȱLycos)ȱ setzenȱdiesesȱVerfahrenȱein,ȱumȱdemȱBenutzerȱeinȱbibliotheksähnlichesȱAnȬ gebotȱzuȱschaffen.ȱAllerdingsȱbedarfȱesȱeinesȱhohenȱPersonalaufwandes,ȱumȱ dieȱAdressenȱdenȱentsprechendenȱGebietenȱzuzuweisen.ȱDabeiȱist,ȱundȱdasȱ beeinträchtigtȱ dasȱSuchergebnis,ȱ nichtȱ gewährleistet,ȱ dassȱ alleȱSortiererȱalleȱ Informationenȱ gleichȱ interpretieren.ȱ Gehörtȱ derȱ Begriffȱ Kinoȱz.B.ȱ inȱ dieȱ KaȬ tegorieȱKunstȱoderȱUnterhaltung?ȱȱ – dieȱ automatischeȱ Indexierungȱ verläuftȱ alsȱ computergestützteȱ Indexierungȱ mitȱbeliebigemȱVokabular,ȱsoȱdassȱdieȱgesamteȱBandbreiteȱderȱSpracheȱmitȱ allenȱMehrdeutigkeitenȱundȱFehlinterpretationenȱanalysiertȱwird;ȱsieȱunterȬ stütztȱ dieȱ Eliminierungȱ häufigȱ wiederkehrenderȱ Begriffeȱ undȱ dieȱ Analyseȱ vonȱWortstämmenȱundȱistȱschnellȱundȱpreiswert.ȱȱ WerdenȱkeineȱEinzelbegriffeȱinȱFormȱvonȱStichwörternȱzurȱBeschreibungȱdesȱDoȬ kumenteninhaltesȱ verwendet,ȱ sondernȱ Deskriptorenȱ kombiniert,ȱ existierenȱ zweiȱ MöglichkeitenȱdesȱDeskriptoraufbaus:ȱ – Präkoordinationȱ alsȱ Kombinationȱ komplexerȱ kontextbezogenerȱ DeskriptoȬ renȱ zuȱ einemȱ Indexierungsbegriff,ȱ z.B.ȱ „Informationȱ Retrieval“ȱ alsȱ MehrȬ wortbegriffȱanstelleȱzweierȱEinzeldeskriptoren.ȱ
96 ȱ
3.4ȱȱInformationȱRetrievalȱ – PostkoordinationȱalsȱVerknüpfungȱvonȱEinzeldeskriptorenȱzuȱMehrwortbeȬ griffenȱmittelsȱKontextoperatoren,ȱz.B.ȱ„InformationȱADJȱ val“ȱ(ADJ=adjacent).ȱ Dieȱ Herausforderungȱ desȱ Informationȱ Retrievalȱ bestehtȱ nunȱ darin,ȱ Verfahrenȱ zurȱ automatischenȱIndexierungȱzuȱentwickeln,ȱdieȱeineȱguteȱRetrievalleistungȱimȱSinneȱ vonȱPrecisionȱundȱRecallȱliefern.ȱNachȱsteigenderȱLeistungȱunterscheidetȱmanȱdreiȱ anȱdenȱGütemaßenȱorientierteȱKonzepte:ȱ – DerȱzeichenkettenorientierteȱAnsatzȱbeinhaltetȱdieȱisolierteȱBetrachtungȱeinȬ zelnerȱ Wörter,ȱ wobeiȱ alleȱ „nichtȱ trivialenȱ Wörter“ȱ dasȱ IndexierungsȬ vokabularȱbilden.ȱInȱseinerȱreinenȱAusprägungȱerbringtȱerȱnurȱeineȱgeringeȱ Retrievalleistung.ȱ – DerȱstatistischeȱAnsatzȱerfasstȱdieȱHäufigkeitsverteilungȱderȱBegriffeȱinȱdenȱ Dokumentenȱ einerȱ Dokumentensammlungȱ undȱ stelltȱ aufȱ dieserȱ Basisȱ eineȱ BeziehungȱderȱDokumenteȱuntereinanderȱher.ȱDarausȱergibtȱsichȱeineȱgezielȬ tereȱ Dokumentenauswahl,ȱ insbesondereȱ wennȱ dieȱ gefundenenȱ Dokumenteȱ inȱeineȱRelevanzreihenfolgeȱgebrachtȱwerden.ȱ – Derȱ linguistischeȱ Ansatzȱ steigertȱ dieȱ Retrievalleistungȱ durchȱ eineȱ syntaktiȬ scheȱ Dokumentenanalyseȱ undȱ eineȱ GrundȬȱ undȱ Wortstammreduktionȱ derȱ Begriffe.ȱDabeiȱistȱvorȱallemȱauchȱanȱeineȱBehandlungȱvonȱWortzusammenȬ setzungenȱgedacht.ȱInȱdiesemȱZusammenhangȱsindȱeinigeȱDefinitionenȱvonȱ Interesse,ȱ dieȱ dieȱ sprachlichenȱ Möglichkeitenȱ ausdrücken,ȱ dasȱ IndexieȬ rungsvokabularȱzuȱreduzierenȱ[Jones,ȱS.49]:ȱ o o o o
dieȱGrundformȱbildetȱdieȱlexikalischeȱFormȱeinesȱWortes,ȱz.B.ȱInfiȬ nitivȱ dasȱ Derivatȱ leitetȱ sichȱ ausȱ derȱ Grundformȱ abȱ z.B.ȱ Schönheitȱ ausȱ schön.ȱ dieȱ Flexionȱ beinhaltetȱ dieȱ Deklinationȱ oderȱ Konjugationȱ einesȱ Wortesȱ dieȱ Stammformȱ umfasstȱ denȱ Teilȱ desȱ Wortes,ȱ beiȱ derȱ Grundformȱ undȱDerivatȱidentischȱsind,ȱz.B.ȱprogrammieren,ȱProgrammiererȱ ȱ Stammform:ȱProgramm.ȱ
DasȱZielȱinsbesondereȱderȱStammformreduktionȱistȱdurchȱmehrereȱAspekteȱmotiȬ viert:ȱ – eineȱ Verringerungȱ derȱ Komplexitätȱ sämtlicherȱ Wörterbücherȱ wieȱ desȱ TheȬ saurus.ȱ – dieȱ Verbesserungȱ derȱ statistischenȱ Grundlageȱ derȱ Deskriptorwahlȱ durchȱ ReduktionȱderȱBegriffsvielfalt.ȱ – eineȱSteigerungȱderȱBenutzerfreundlichkeit,ȱdaȱsonstȱeinȱhohesȱMaßȱanȱEinȬ sichtȱinȱdieȱMorphologieȱeinerȱSpracheȱerforderlichȱist.ȱ ȱ
ȱ
97
3ȱȱECMȱManageȬKomponenteȱ Allerdingsȱ bereitenȱ Wortzusammensetzungenȱ Probleme.ȱ Sieȱ ȱ erzeugenȱ vieleȱ speȬ zielleȱ Begriffe,ȱ wieȱ z.B.ȱ Programmiersprache,ȱ Ȭumgebungȱ undȱ Ȭtechnikȱ eineȱ hoheȱ SpezifitätȱderȱDeskriptoren,ȱdieȱRecallverlusteȱundȱeineȱsteigendeȱKomplexitätȱdesȱ Thesaurusȱverursachen.ȱ
3.4.3
Deskriptorerzeugung
Dasȱ Zielȱ vonȱ Informationȱ RetrievalȬSystemen,ȱ Verfahrenȱ vorzuschlagen,ȱ dieȱ guteȱ Deskriptorenȱ imȱ Sinneȱ derȱ Gütemaßeȱ erzeugen,ȱ lässtȱ sichȱ theoretischȱ inȱ mehrereȱ Phasenȱ gliedernȱ undȱ aufȱ denȱ einzelnenȱ Stufenȱ nahezuȱ beliebigȱ verfeinern.ȱ Alsȱ Ausgangspunktȱ dientȱ häufigȱ einȱsehrȱ einfacherȱ Ansatz,ȱ derȱlediglichȱ WorthäufigȬ keitenȱberücksichtigt.ȱ Dasȱ Zipfscheȱ Gesetzȱ konstruiertȱ eineȱ Begriffsrangfolgeȱ aufȱ derȱ Grundlageȱ derȱ Häufigkeitȱ innerhalbȱ einesȱ Dokumentesȱ undȱ leitetȱ darausȱ einȱ Indizȱ fürȱ dieȱ EntȬ scheidungsstärkeȱeinesȱBegriffesȱab:ȱ 1. 2.
Dieȱ Wörterȱ einesȱ Dokumentesȱ werdenȱ absteigendȱ nachȱ ihrerȱ HäufigȬ keitȱgeordnetȱ Dannȱgiltȱ[Salton,ȱS.ȱ65]:ȱȱ ȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱHäufigkeitȱ*ȱRangȱ#ȱkonstantȱ
3.
Wärenȱ Wörterȱ imȱ Dokumentȱ gleichȱ verteilt,ȱ wäreȱ keinȱ quantitativesȱ Unterscheidungsmerkmalȱbeobachtbar.
Dieȱ Entscheidungsstärkeȱ beschreibtȱ dieȱ Fähigkeitȱ desȱ Deskriptors,ȱ relevanteȱ DoȬ kumenteȱzuȱselektierenȱbzw.ȱirrelevanteȱzuȱerkennen.ȱDieȱentscheidungsstärkstenȱ DeskriptorenȱliegenȱdemȱZipfschenȱGesetzȱzufolgeȱimȱmittlerenȱHäufigkeitsbereich,ȱ daȱsehrȱhäufigȱauftretendeȱBegriffeȱdasȱDokumentȱwenigȱbeschreibenȱundȱgegenüȬ berȱ anderenȱ abgrenzenȱ undȱ seltenȱ vorkommendeȱ Wörterȱ eineȱ Charakterisierungȱ eherȱzufälligȱerscheinenȱlassen.ȱ Aberȱ auchȱ derȱ Kontext,ȱ inȱ demȱ dieȱ einzelnenȱ Begriffeȱ stehen,ȱ istȱ vonȱ Bedeutung.ȱ Derȱ Begriffȱ „Computer“ȱ findetȱ sichȱ häufigȱ inȱ einerȱ Dokumentensammlungȱ überȱ Informatikthemenȱ undȱ bildetȱ daherȱ gemäßȱ derȱ Entscheidungsstärkeȱ keinenȱ verȬ wertbarenȱDeskriptor;ȱtrittȱerȱallerdingsȱinȱeinerȱelektrotechnischenȱSammlungȱauf,ȱ stelltȱerȱaufȱGrundȱseinerȱSeltenheitȱeinenȱverwertbarenȱDeskriptorȱdar.ȱ ȱ Einȱ entscheidungsstarkerȱ Deskriptorȱ kommtȱ inȱ wenigenȱ Dokumentenȱ häufigȱundȱinȱvielenȱseltenȱvor.ȱ ȱ
98 ȱ
3.4ȱȱInformationȱRetrievalȱ UmȱdasȱbisherigeȱVerfahrenȱzuȱverbessern,ȱwerdenȱWortunterscheidungenȱgetrofȬ fen:ȱȱ – Stoppwörterȱ sindȱ Wörterȱ mitȱ einemȱ niedrigenȱ Rangplatzȱ gemäßȱ derȱ HäuȬ figkeitsverteilungȱinȱeinerȱDokumentensammlung,ȱi.a.ȱFunktionswörterȱwie:ȱ und,ȱaber,ȱauf,ȱwie,ȱder,ȱdie,ȱdasȱetc.ȱAufgrundȱdesȱZipfschenȱGesetzesȱsindȱ sieȱ alsȱ nichtȱ bedeutungstragendȱ einzuordnenȱ undȱ werdenȱ inȱ einerȱ StoppȬ wortlisteȱzusammengefasst.ȱ – Frequenzȱ bezeichnetȱ dieȱ Begriffshäufigkeitȱ inȱ einemȱ Dokument.ȱ Sieȱ bildetȱ dieȱ Basisȱ fürȱ einȱ Ranking:ȱ Jeȱ häufigerȱ einȱ Suchbegriffȱ inȱ einemȱ Dokumentȱ auftauchtȱ undȱ jeȱ weiterȱ vornȱ erȱ imȱ Textȱ steht,ȱ destoȱ weiterȱ obenȱ stehtȱ dasȱ Dokumentȱ inȱ derȱ Ergebnisliste.ȱ Unbestechlichȱ sindȱ Rankingsȱ allerdingsȱ nicht.ȱ Insbesondereȱ wennȱ sieȱ aufȱ Keywordsȱ beschränktȱ werden,ȱ kannȱ derȱ VerfasserȱdurchȱeineȱwillkürlicheȱVergabeȱdieserȱSuchbegriffeȱungerechtferȬ tigterweiseȱeineȱhoheȱTrefferquoteȱherbeiführen.ȱ – DokumentfrequenzȱgibtȱdieȱAnzahlȱderȱDokumenteȱderȱDokumentenȬ sammlungȱan,ȱinȱdenenȱderȱBegriffȱvorkommt.ȱ DieȱZusammenfassungȱderȱbisherigenȱÜberlegungenȱlegtȱdieȱersteȱFormȱeinesȱauȬ tomatischenȱIndexierungsverfahrensȱ[Salton,ȱS.ȱ66]ȱnahe:ȱ 1. 2.
BestimmungȱderȱHäufigkeitȱdesȱBegriffesȱkȱimȱDokumentȱi:ȱFREQikȱ BestimmungȱderȱHäufigkeitȱdesȱBegriffesȱkȱinȱderȱgesamtenȱDokumenȬ tensammlungȱn:ȱ
ȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱnȱ TOTFREQkȱ=ȱȱ6ȱȱFREQikȱ ȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱi=1ȱ
3.
4.
3.4.3.1
OrdnungȱderȱBegriffeȱnachȱabnehmenderȱTOTFREQ.ȱEliminierungȱalȬ lerȱ Begriffeȱ oberȬȱ undȱ unterhalbȱ einesȱ Schwellenwertesȱ gemäßȱ desȱ Zipfschenȱ Gesetzes,ȱ daȱ dieseȱ Begriffeȱ vonȱ mindererȱ EntscheidungsȬ stärkeȱsind.ȱ AlleȱübrigenȱWörterȱbildenȱpotentielleȱDeskriptoren.ȱ
Statistisches Verfahren zur Deskriptorgewichtung
EineȱMöglichkeit,ȱdenȱBegriffȱderȱEntscheidungsstärkeȱauszubauen,ȱbestehtȱdarin,ȱ eineȱ Beziehungȱ zwischenȱ derȱ Auftretenshäufigkeitȱ einesȱ Begriffesȱ imȱ Dokumentȱ einerseitsȱ undȱ inȱ derȱ Dokumentensammlungȱ andererseitsȱ herzustellen.ȱ Dieseȱ Interpretationȱistȱweitȱreichender,ȱdaȱnichtȱnurȱeinȱabsoluterȱWertȱdasȱAuswahlkriȬ teriumȱbildet,ȱsondernȱeineȱRelation:ȱ ȱ ȱ
ȱ
99
3ȱȱECMȱManageȬKomponenteȱ Gewichtsfunktionȱ IDFikȱ =ȱ inverseȱ Dokumentfrequenzȱ desȱ Begriffesȱ kȱ imȱDokumentȱiȱ ȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱFREQikȱ ȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱIDFik:=ȱȬȬȬȬȬȬȬȬȬȬȬȬȬȬȬȬȬȬȬȬȬȬȬȬȬȬȬȬȬȬȬȬȬȬȬȬȬȬȬȬȬȬȬȬȱ ȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱTOTFREQȱkȱȱ ȱ DieȱinverseȱDokumentfrequenzȱkannȱalsȱGewichtsfunktionȱzurȱDeskriptorauswahlȱ herangezogenȱwerden.ȱ ȱ Guteȱ Deskriptorenȱ weisenȱ eineȱ hoheȱ Frequenzȱ beiȱ niedrigerȱ Dokumentfrequenzȱ auf.ȱ Jeȱ höherȱ derȱ IDFȬWertȱ ist,ȱ destoȱ bedeutungstragenderȱistȱderȱDeskriptorȱzuȱbeurteilen.ȱ ȱ MittelsȱderȱIDFȱlässtȱsichȱeineȱzweiteȱVarianteȱeinesȱautomatischenȱIndexierungsȬ verfahrensȱformulieren:ȱȱ 1. 2. 3.
3.4.3.2
VerwendungȱdesȱVerfahrensȱaufȱBasisȱdesȱZipfschenȱGesetzes.ȱ BerechnungȱvonȱIDFikȱfürȱjedenȱverbleibendenȱBegriffȱbezüglichȱjedenȱ Dokumentes.ȱ AuswahlȱderjenigenȱBegriffeȱȱkȱalsȱDeskriptorȱfürȱeinȱDokumentȱi,ȱdeȬ renȱIDFikȱeinenȱSchwellenwertȱüberschreitet.ȱ
Ähnlichkeit
Einerȱ weiterenȱ Verfahrensverbesserungȱ liegtȱ dieȱ Ideeȱ derȱ Entwicklungȱ einesȱ „naȬ türlichsprachlichen“ȱ Anfragemodells,ȱ dasȱ dieȱ Suchanfrageȱ desȱ Benutzersȱ mitȱ denȱ Deskriptorenȱ derȱ Dokumenteȱ inȱ derȱ Dokumentsammlungȱ inȱBeziehungȱsetzt,ȱzuȬ grunde.ȱ Derȱ Anfrageprozessȱ vergleichtȱ dabeiȱ denȱ „Deskriptorvektor“ȱ derȱ Sucheȱ mitȱdemjenigenȱderȱDokumenteȱaufȱderȱGrundlageȱvonȱÄhnlichkeitenȱ(mathemaȬ tisch:ȱ Skalarprodukt)ȱ undȱ ordnetȱ dieȱ selektiertenȱ Dokumenteȱ nachȱ abnehmenderȱ Ähnlichkeitȱ =ȱ Ranking.ȱ Diesesȱ Verfahrenȱ wurdeȱ schonȱ Endeȱ derȱ sechzigerȱ Jahreȱ vorgeschlagenȱ[Salton,ȱS.ȱ72f.].ȱȱ ȱ ÄhnlichkeitȱzwischenȱDokumentenȱ ȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱnȱ ȱȱȱȱȱȱȱȱȱȱȱȱÄhn(Di,Dj)ȱ=ȱ1/nȱȱ6ȱgikȱgjkȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱnȱAnzahlȱderȱDeskriptorenȱ ȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱk=1ȱȱ ȱȱȱȱȱȱȱȱȱȱȱgikȱGewichtȱdesȱDeskriptorsȱkȱimȱDokumentȱDiȱȱȱ ȱ
100 ȱ
3.4ȱȱInformationȱRetrievalȱ DieȱWahlȱderȱGewichteȱistȱbeliebig.ȱDieȱeinfachsteȱFormȱistȱdiejenigeȱalsȱBinärvekȬ tor,ȱderȱbeiȱAuftretenȱdesȱDeskriptorsȱeineȱEins,ȱsonstȱeineȱNullȱenthält.ȱEinȱVektorȱ einesȱ Dokumentesȱ Diȱ hätteȱ dannȱ dieȱ Form:ȱ (1,1,1,0),ȱ fallsȱ dreiȱ derȱ vierȱ möglichenȱ DeskriptorenȱderȱDokumentenbasisȱvorhandenȱwären,ȱeinȱzweiterȱVektorȱfürȱdasȱ Dokumentȱ Djȱ denȱ Wert:ȱ(0,0,1,1),ȱ fallsȱ nurȱdieȱletztenȱ beidenȱ Deskriptorenȱinȱ dieȬ semȱ Dokumentȱ vorkämen.ȱ Diesemȱ Aufbauȱ liegtȱ folgendeȱ einfacheȱ Interpretationȱ zugrunde:ȱ – Ähn(Di,Dj)ȱ=ȱ0ȱbeiȱkeinerȱÜbereinstimmungȱvonȱSuchanfrageȱundȱDeskriptoȬ renȱdesȱDokumentes;ȱȱ – Ähn(Di,Dj)ȱ=ȱ1ȱbeiȱvölligerȱÜbereinstimmungȱvonȱSuchanfrageȱundȱDeskripȬ toren;ȱȱ – Ähn(Di,Dj)ȱȱ2002ȱ Ergebnis:ȱDieseȱRecherchemöglichkeitȱbietetȱalleȱVeröffentlichungenȱzumȱ StichwortȱDatenbankȱseitȱ2002.ȱȱ
3.4ȱȱInformationȱRetrievalȱ WeitereȱSuchoptionenȱ – DieȱphonetischeȱSucheȱversuchtȱgleichȱklingendeȱBegriffe,ȱz.B.ȱMeier,ȱMayer,ȱ Meyer,ȱzuȱidentifizieren.ȱ – BenutzerdefinierteȱOperatorenȱinȱFormȱzusammengesetzterȱSuchoperatorenȱ unterstützenȱ besondereȱ Suchanforderungen,ȱ z.B.ȱ ASPSYN:=ȱ ASPECTȱ ANDȱ SYNONYM.ȱ – SuchprofileȱalsȱAblageȱeinerȱGruppeȱvonȱAnfragenȱ–ȱvergleichbarȱdenȱViewsȱ derȱ Datenbankenȱ –ȱ erleichternȱ dasȱ Formulierenȱ wiederholterȱ gleichȱ lautenȬ derȱAnfragen.ȱ – Dieȱ Sucheȱ inȱ vordefiniertenȱ Bereichenȱ desȱ Volltextes,ȱ z.B.ȱ nurȱ inȱ Abstracts,ȱ schränktȱ denȱ Suchbereichȱ einȱ undȱ erhöhtȱ aufȱ dieseȱ Weiseȱ dieȱ SuchgeȬ schwindigkeit.ȱ – FürȱverschiedeneȱBenutzergruppenȱkönnenȱunterschiedlicheȱIndexeȱfestgeȬ legtȱwerdenȱ–ȱeinȱausȱSicherheitsgründenȱwichtigerȱAspekt.ȱSoȱlässtȱsichȱz.B.ȱ unterbinden,ȱdassȱderȱVertriebȱdieȱDokumenteȱderȱBuchhaltungȱrecherchieȬ renȱkann.ȱ Fürȱ eineȱ korrekteȱ Berücksichtigungȱ nichtȬalphanumerischerȱ Zeichenȱ müssenȱ zuȬ sätzlicheȱ Optionenȱ vorgesehenȱ sein.ȱ Soȱ sollenȱ Begriffe,ȱ dieȱ imȱ Textȱ durchȱ einenȱ Bindestrichȱverbundenȱsind,ȱalsȱeinȱzusammenhängenderȱBegriffȱerkanntȱwerden.ȱ Andernfallsȱwürdenȱ sieȱwieȱzweiȱseparateȱ Begriffeȱ behandelt,ȱwasȱ leichtȱzuȱ einerȱ missverständlichenȱ Interpretationȱ derȱ Ergebnismengeȱ führenȱ kann.ȱ Vorȱ diesemȱ HintergrundȱsollteȱderȱBenutzerȱdieȱMöglichkeitȱbesitzen,ȱspezifischeȱZeichenȱfürȱ Wortverbindungenȱ anzugeben.ȱ Zuȱ unterscheidenȱ istȱ derȱ Bindestrichȱ alsȱ VerbinȬ dungselementȱ innerhalbȱ einerȱ Zeileȱ allerdingsȱ auchȱ vonȱ seinemȱ Gebrauchȱ alsȱ Trennsymbolȱ amȱ Zeilenende.ȱ Derȱ Suchalgorithmusȱ mussȱ alsoȱ dieȱ Positionȱ desȱ Bindestrichesȱ identifizierenȱ undȱ aufȱ Basisȱ dieserȱ Informationȱ entscheiden,ȱ obȱ esȱ sichȱumȱeinenȱzusammengesetztenȱoderȱgetrenntenȱBegriffȱhandelt.ȱ
3.4.5
Fortschrittliche Indexierungstechniken
AlleȱVerfahren,ȱdieȱderȱbesserenȱUnterscheidungȱinȱselektierteȱundȱnichtȱselektierteȱ Dokumenteȱdienen,ȱarbeitenȱmitȱGewichten,ȱdieȱfürȱdieȱDeskriptorenȱeinesȱDokuȬ mentesȱberechnetȱwerden,ȱumȱÄhnlichkeitskennziffernȱabzuleiten.ȱȱ
3.4.5.1
Clusterverfahren
Clusterverfahrenȱ[Salton,ȱS.ȱ228ff.]ȱversuchen,ȱDokumenteȱzuȱklassifizieren,ȱsoȱdassȱ ähnlicheȱ oderȱ miteinanderȱ inȱ Beziehungȱ stehendeȱ Dokumenteȱ inȱ einemȱ gemeinȬ samenȱDokumentenpoolȱzusammengefasstȱwerden.ȱDadurchȱtrittȱeineȱBeschleuniȬ gungȱdesȱSuchverfahrensȱein,ȱdaȱsämtlicheȱrelevantenȱDokumenteȱimȱgünstigstenȱ FallȱmitȱeinemȱeinzigenȱZugriffȱselektiertȱwerdenȱkönnen.ȱNebenȱDokumentenähnȬ lichkeitenȱspielenȱaberȱauchȱSynonymeȱalsȱsemantischȱähnlicheȱWorteȱeineȱbedeuȬ tendeȱRolle.ȱSoȱsollteȱeineȱSucheȱnachȱdemȱBegriffȱ„Wort“ȱauchȱeineȱTrefferlisteȱfürȱ Kommentar,ȱBemerkung,ȱBehauptungȱoderȱTermȱpräsentieren.ȱȱ
ȱ
107
3ȱȱECMȱManageȬKomponenteȱ ProblemeȱentstehenȱausȱderȱArtȱderȱZusammenfassungȱvonȱDokumenten:ȱ – DieȱClusterȱmüssenȱstabilȱundȱvollständigȱsein.ȱ – DieȱZahlȱderȱDokumenteȱinȱeinemȱClusterȱundȱdamitȱdieȱresultierendeȱTrefȬ ferlisteȱkannȱbeiȱspeziellenȱDokumentationenȱmitȱhomogenenȱDokumentenȱ sehrȱhochȱsein.ȱImȱumgekehrtenȱFallȱkannȱdieȱZahlȱderȱClusterȱwachsenȱbisȱ zumȱExtremfall,ȱinȱdemȱClusterȱnurȱausȱjeweilsȱeinemȱDokumentȱbestehen.ȱ – DieȱÜberschneidungsrateȱderȱDokumente,ȱdieȱinȱmehrȱalsȱeinemȱClusterȱlieȬ gen,ȱistȱkaumȱkontrollierbar.ȱ EinȱwichtigesȱEinsatzfeldȱderȱClusterbildungȱvonȱDokumentenȱstelltȱdasȱWissensȬ managementȱ dar.ȱ Dokumentiertesȱ Wissenȱ zuȱ organisieren,ȱ wirdȱ zunehmendȱ eineȱ Herausforderungȱ einerȱ lernendenȱ Organisation.ȱ Dieȱ Kernfrageȱ inȱ diesemȱ ZusamȬ menhangȱ lautet:ȱ Woȱ liegenȱ inhaltlicheȱ Zusammenhängeȱ zwischenȱ einzelnenȱ DoȬ kumentenȱ undȱ woȱ lassenȱ sichȱ wichtigeȱ Informationenȱ verdichten?ȱ Automatischȱ berechneteȱ Dokumentenlandkartenȱ könnenȱ dazuȱ beitragen,ȱ dieȱ Orientierungȱ inȱ derȱ Flutȱ derȱ Informationenȱ zuȱ erleichternȱ undȱ wertvolleȱ Wissensquellenȱ zuȱ erȬ schließen.ȱ Wieȱ kannȱ nunȱ dieȱ inhaltlicheȱ Erschließungȱ derȱ Dokumenteȱ inȱ dieseȱ Richtungȱunterstütztȱwerden?ȱZunächstȱwerdenȱdieȱTexteȱdurchȱdieȱzuvorȱvorgeȬ stelltenȱstatistischȬlinguistischenȱVerfahrenȱanalysiertȱundȱmiteinanderȱverglichen.ȱ Aufȱ derȱ Basisȱ vonȱ Ähnlichkeitenȱ werdenȱ anschließendȱ interessante,ȱ bisherȱ unbeȬ kannteȱBeziehungenȱzwischenȱDokumentenȱerkannt.ȱDieseȱVerflechtungenȱdienenȱ alsȱGrundlageȱeinerȱVisualisierungȱinȱFormȱeinesȱDokumentenraumes.ȱDieȱinhaltȬ licheȱVerwandtschaftȱ wirdȱ dabeiȱ durchȱeineȱ räumlicheȱ AnordnungȱinȱFormȱ einerȱ zweidimensionalenȱLandkarteȱausgedrückt.ȱJeȱnäherȱdieȱdurchȱSymboleȱdargestellȬ tenȱDokumenteȱzusammenȱliegen,ȱdestoȱgrößerȱistȱihreȱinhaltlicheȱNähe.ȱJeȱstärkerȱ sichȱdieȱTexteȱthematischȱunterscheiden,ȱdestoȱweiterȱliegenȱsieȱaufȱderȱKarteȱvoneinȬ anderȱentfernt.ȱDieȱDokumentenkarteȱistȱalsȱvisuelleȱDarstellungȱzunächstȱpassiv.ȱ Zwarȱ istȱ dieȱ globaleȱ Strukturȱ aufȱ denȱ erstenȱ Blickȱ erkennbar,ȱ zuȱ einemȱ echtenȱ HilfsmittelȱderȱRechercheȱwirdȱsieȱaberȱerstȱdurchȱZusatzeigenschaftenȱwieȱAufruf,ȱ Schlagwortermittlung,ȱKartenausschnitteȱoderȱgezielterȱSuche.ȱ
3.4.5.2
Relevanzfeedbackverfahren
Dieserȱ Ansatzȱ wertetȱ dieȱ Relevanzangabenȱ desȱ Benutzersȱ fürȱ bereitsȱ selektierteȱ Dokumenteȱaus,ȱumȱdieȱursprünglicheȱSuchanfrageȱneuȱzuȱformulieren.ȱDieȱneueȱ SuchanfrageȱbesitztȱdannȱeineȱgrößereȱÄhnlichkeitȱzuȱdenȱvomȱBenutzerȱalsȱreleȬ vantȱgekennzeichnetenȱDokumentenȱundȱeineȱgeringereȱzuȱdenȱirrelevanten.ȱDazuȱ werdenȱ Deskriptorenȱ derȱ relevantenȱ Dokumenteȱ derȱ Ausgangsanfrageȱ hinzugeȬ fügtȱ undȱ gleichzeitigȱ einigeȱ Deskriptorenȱ derȱ irrelevantenȱ Dokumenteȱ entfernt.ȱ DasȱErgebnisȱistȱeineȱmodifizierteȱSuchanfrage,ȱdieȱzuȱeinerȱsignifikantȱverbesserȬ tenȱDokumentenrechercheȱführt.ȱ Dasȱ Retrievalergebnisȱ fälltȱ amȱ bestenȱ aus,ȱ fallsȱ dieȱ relevantenȱ undȱ irrelevantenȱ DokumenteȱsichȱjeweilsȱinȱClusterȱanordnenȱlassen;ȱdieȱSucheȱverliertȱanȱRelevanz,ȱ wennȱdieȱselektiertenȱstarkȱmitȱdenȱnichtȱselektiertenȱvermischtȱsind.ȱȱ
108 ȱ
3.4ȱȱInformationȱRetrievalȱ
3.4.5.3
Relevanzranking
Dasȱ Rankingȱ derȱ Suchergebnisseȱ nachȱ Relevanzȱ stehtȱ fürȱ denȱ Benutzerȱ imȱ ZentȬ rumȱ seinesȱ Interesses.ȱ Dabeiȱ spieltȱ dieȱ Einschätzungȱ derȱ Relevanzȱ dieȱ entscheiȬ dendeȱ Rolle.ȱ Dieȱ dreiȱ Elementeȱ desȱ Informationȱ Retrieval:ȱ dieȱ InformationsresȬ sourceȱ wieȱ dasȱ Internet,ȱ dieȱ Vermittlungsinstanzȱ wieȱ eineȱ Suchmaschineȱ undȱ derȱ Benutzerȱ inȱ seinemȱ fragendenȱ Gemütszustand,ȱ bildenȱ dieȱ Säulenȱ jedenȱ SuchproȬ zesses.ȱ DieȱRelevanzȱ spiegeltȱ nunȱ denȱGradȱderȱ Angemessenheitȱ einesȱ InformatiȬ onsobjektesȱ fürȱ dieȱ Fragesituationȱ desȱ Benutzersȱ wider.ȱ Dabeiȱ wirdȱ thematischeȱ Relevanz,ȱdieȱsichȱalsȱsemantischeȱNäheȱvonȱSuchkonzeptȱundȱInformationsobjektȱ verstehtȱvonȱderȱpragmatischenȱRelevanz,ȱdieȱsichȱausȱdemȱNutzenȱfürȱdenȱNutzerȱ ableitet,ȱunterschieden.ȱDieseȱDefinitionenȱverhelfenȱaberȱkaumȱzurȱOperationaliȬ sierungȱdesȱKonzeptes;ȱdennȱalsȱformalisierteȱBeziehungȱzwischenȱRessourceȱundȱ Anfrageȱ istȱ Relevanzȱ letztlichȱ einȱ Artefaktȱ undȱ nichtȱ dieȱ empirischeȱ Größe,ȱ dieȱ eigentlichȱRankingȱausmacht.ȱȱ Dieȱ meistenȱ Informationȱ RetrievalȬSystemeȱ interpretierenȱ Relevanzȱ aufȱ derȱ Basisȱ einesȱVergleichsȱderȱBenutzeranfrageȱmitȱderȱDarstellungȱderȱInformationsobjekte.ȱ Imȱ Unterschiedȱ zuȱ Datenbankanfragenȱ istȱ dieserȱ Vergleichȱ grundsätzlichȱ unvollȬ ständig,ȱ daȱ nichtȱ alleȱ relevanteȱ Objekteȱ gefundenȱ werdenȱ müssen,ȱ undȱ unsicher,ȱ daȱ nichtȱ alleȱ gefundenenȱ Objekteȱ relevantȱ sind.ȱ Relevanzfunktionenȱ versuchenȱ daher,ȱeineȱnichtȱdirektȱmessbareȱempirischeȱGrößeȱausȱdenȱElementenȱBenutzersiȬ tuation,ȱAnfrage,ȱProfilenȱundȱRessourceȱabzuleiten.ȱȱ EinȱVerfahrenȱhatȱbesondereȱpraktischeȱBedeutungȱerlangt:ȱ Pageȱ Rank:ȱ Diesesȱ Verfahrenȱ nutztȱ dieȱ graphentheoretischenȱ Eigenschaftenȱ vonȱ Hypertextȱ ausȱ undȱ istȱ deshalbȱ insbesondereȱ fürȱ dasȱ Internetȱ geeignet.ȱ AusgenutztȱwirdȱdieȱBeziehungȱderȱDokumenteȱuntereinander.ȱDabeiȱgeltenȱ folgendeȱAnnahmenȱ[Menkeȱ2005,ȱSȱ6]:ȱȱ Webseitenlinksȱ implizierenȱ eineȱ (subjektive)ȱ hoheȱ Meinungȱ vonȱ anderenȱWebseitenȱ o DieȱGesamtheitȱderȱsubjektivenȱWertschätzungenȱistȱeineȱobjektiveȱ Bewertungȱ o Jeȱ mehrȱ Linksȱ aufȱ eineȱ bestimmteȱ Seiteȱ zeigen,ȱ destoȱ „bedeutenȬ der“ȱistȱdieseȱ o Jeȱ„bedeutender“ȱdieȱLinksȱsind,ȱdieȱaufȱeineȱbestimmteȱSeiteȱzeiȬ gen,ȱdestoȱ„bedeutender“ȱscheintȱdieseȱSeiteȱzuȱseinȱ o Jeȱ„bedeutender“ȱeineȱSeiteȱist,ȱdestoȱbedeutenderȱsindȱdieȱaufȱihrȱ enthaltenenȱLinksȱ o Jeȱ wenigerȱ Linksȱ eineȱ Seiteȱ enthält,ȱ destoȱ „bedeutender“ȱ istȱ jederȱ einzelneȱLink.ȱ Aufȱ Grundȱ derȱ schwachenȱ HTMLȬLinksemantikȱ unterscheidetȱ derȱ Pageȱ Rankȱ nichtȱ zwischenȱ semantischenȱ undȱ pragmatischenȱ Verweisen.ȱ Auffälligȱ ist,ȱ dassȱ o
ȱ
109
3ȱȱECMȱManageȬKomponenteȱ diesesȱ Verfahrenȱ ohneȱ Bezugȱ zurȱ Anfrageȱ auskommtȱ undȱ deshalbȱ imȱ Vorausȱ beȬ rechnetȱwerdenȱkann.ȱDiesesȱKonzeptȱistȱBasisȱderȱSuchmaschineȱGoogle.ȱ
3.4.6
Information Retrieval und Internet
Dieȱ Geschichteȱ derȱ Suchmaschinenȱ reichtȱ weitȱ inȱ dieȱ Anfangszeitenȱ desȱ Internetȱ zurück.ȱ Mitȱ demȱ wachsendenȱ Informationsangebotȱ imȱ Internetȱ wurdenȱ differenȬ ziertereȱOrientierungshilfenȱnötig.ȱArchie,ȱhießȱderȱersteȱVersuchȱ1990ȱderȱMcGillȱ Universität,ȱ Kanada,ȱ dieȱ Datenȱ imȱ Internetȱ zuȱ strukturieren.ȱ Archieȱ durchsuchteȱ dieȱInhaltsverzeichnisseȱderȱanonymenȱFTPȬServerȱundȱfungierteȱalsȱSammlerȱvonȱ Daten,ȱdieȱdieȱAnwenderȱmittelsȱSuchwortenȱabfragenȱkonnten.ȱMitȱVeronicaȱ(VeȬ ryȱeasyȱrodentȬorientedȱnetȬwideȱindexȱtoȱcomputerizedȱarchives),ȱentwickeltȱvonȱ derȱUniversityȱofȱNevadaȱinȱReno,ȱUSA,ȱwurdeȱeinȱneuesȱSuchprinzipȱeingeführt,ȱ dasȱauchȱheuteȱnochȱbeiȱvielenȱSuchmaschinenȱeingesetztȱwird.ȱMitȱHilfeȱderȱBooȬ leschenȱ Operatorenȱ AND,ȱ ORȱ undȱ NOTȱ werdenȱ dieȱ Suchergebnisseȱ eingegrenzt.ȱ 1995ȱwurdeȱdasȱWorldȱWideȱWebȱeinerȱbreitenȱÖffentlichkeitȱzugänglichȱgemacht.ȱ Yahoo!ȱ–ȱvonȱJerryȱYangȱundȱDavidȱFilo,ȱzweiȱDoktorandenȱderȱStanfordȱUniversiȬ tätȱgegründetȱ–ȱgehörtȱzuȱdenȱSuchmaschinenȬPionierenȱimȱWeb.ȱAusȱihrenȱprivaȬ tenȱLinksammlungenȱentwickeltenȱdieȱbeidenȱAmerikanerȱeinȱhierarchischȱgeordȬ netesȱLinkȬVerzeichnis.ȱ Suchmaschinenȱ imȱ WWWȱ nutzenȱ vieleȱ derȱ vorgestelltenȱ Retrievaltechniken,ȱ umȱ imȱ gigantischenȱ Heuhafenȱ desȱ WWWȱ demȱ Nutzerȱ zuverlässige,ȱ exakteȱ SucherȬ gebnisseȱzuȱliefern.ȱ Dieȱältesteȱ Art,ȱ Informationenȱ ausȱ demȱ Internetȱ zuȱ präsentieȬ ren,ȱbestehtȱdarin,ȱeineȱeinfacheȱListeȱvonȱVerweisenȱanzubieten.ȱDerartigeȱAdresȬ sensammlungenȱbefindenȱsichȱaufȱzahllosenȱHomepages.ȱVaterȱdieserȱSuchideeȱistȱ Yahoo,ȱ dessenȱ Inhalteȱ vonȱ Redakteurenȱ bewertetȱ undȱ inȱ Kategorienȱ klassifiziertȱ werden.ȱ Daȱ dieseȱ Tätigkeitȱ zeitintensivȱ istȱ undȱ einerȱ manuellenȱ Indexierungȱ entȬ spricht,ȱ fehlenȱ oftȱ Verweiseȱ aufȱ dieȱ neuestenȱ Informationen.ȱ Umȱ dieseȱ Schwächeȱ auszugleichen,ȱ bedienenȱ sichȱ Suchmaschinenȱ Softwareprogramme,ȱ sog.ȱ Robots,ȱ Crawlerȱ oderȱ Spider,ȱ dieȱähnlichȱ derȱ Arbeitȱ menschlicherȱ Surferȱdasȱ WWWȱ nachȱ interessantenȱ Informationenȱ anhandȱ vonȱ Linksȱ durchsuchen,ȱ dieseȱ sortierenȱ undȱ inȱ eineȱ Datenbankȱ einfügen.ȱ Eineȱ ausführlicheȱ Textanalyseȱ gestattenȱ sieȱ jedochȱ nicht.ȱ Homonyme,ȱ Synonyme,ȱ Pluraleȱ oderȱ Konjugationenȱ überfordernȱ dieȱ SoftȬ ware:ȱWerȱnachȱdemȱBegriffȱ„Film“ȱsucht,ȱmussȱauchȱmitȱAngabenȱzuȱÖlfilmȱoderȱ Photofilmȱ rechnen.ȱ Inȱ dieserȱ Hinsichtȱ sindȱ manuellȱ bearbeiteteȱ Katalogeȱ dankȱ menschlicherȱ Analyseleistungȱ wesentlichȱ leistungsstärker.ȱ Dieȱ Suchdiensteȱ desȱ InternetsȱlassenȱsichȱgrundsätzlichȱinȱmehrereȱKlassenȱeinteilen:ȱ – Suchmaschinen,ȱdieȱdasȱAngebotȱanȱWWWȬSeitenȱdesȱInternetsȱselbständigȱ analysieren.ȱQualitätsmaßstabȱihrerȱLeistungsfähigkeitȱsindȱdieȱAlgorithmenȱ zurȱ Relevanzbestimmung.ȱ Dieȱ Identifikationȱ derȱ tatsächlichȱ relevantenȱ SeiȬ tenȱ ausȱ derȱ Vielzahlȱ derȱ zuȱ einerȱ Anfrageȱ ermitteltenȱ Seitenȱ bestimmtȱ weȬ sentlichȱdieȱBenutzerakzeptanz.ȱEinȱBeispielȱfürȱdiesenȱTypusȱistȱGoogle.ȱ
110 ȱ
3.4ȱȱInformationȱRetrievalȱ – Kataloge,ȱdieȱandersȱalsȱSuchmaschinenȱkeineȱautomatischeȱAnalyseȱbetreiȬ ben,ȱsondernȱvonȱRedakteurenȱangelegtȱwerden.ȱSieȱbietenȱdieȱMöglichkeit,ȱ themenspezifischeȱ Informationenȱ schnellȱ zuȱ finden.ȱ Aufgrundȱ derȱ notwenȬ digenȱredaktionellenȱArbeitȱistȱihrȱUmfangȱjedochȱbegrenzt.ȱFürȱdieseȱKlasseȱ istȱYahooȱderȱherausragendeȱVertreter.ȱ – HybridȬSuchmaschinen,ȱ dieȱ überȱ keineȱ eigeneȱ Datenbasisȱ verfügen,ȱ sonȬ dernȱ andereȱ Suchdiensteȱ nutzen,ȱ umȱ eineȱ Anfrageȱ zuȱ bedienen.ȱ MetaȬ CrawlerȱistȱderȱbekanntesteȱDienstȱdieserȱKlasse.ȱȱ – DatenbankenȱstellenȱeineȱweitereȱwichtigeȱInformationsquelleȱdar.ȱSieȱweiȬ senȱmeistȱstrukturierteȱDatenȱauf,ȱwodurchȱdieȱSucheȱaufȱdefinierteȱFelderȱ wieȱTitel,ȱAutorȱoderȱDatumȱeingeschränktȱwerdenȱkann.ȱFürȱnahezuȱjedesȱ WissensgebietȱbestehenȱmittlerweileȱkostenloseȱoderȱkostenpflichtigeȱDaȬ tenbanken.ȱAllerdingsȱweisenȱsieȱjeȱnachȱAnwendungsgebietȱsehrȱunterȬ schiedlicheȱBenutzeroberflächenȱaufȱundȱerlaubenȱkeineȱCrossȬRechercheȱinȱ DatenbankenȱbenachbarterȱGebiete.ȱȱ Nichtȱ jedeȱ Sucheȱ imȱ Internetȱ verläuftȱ erfolgreichȱ undȱ zurȱ Zufriedenheitȱ desȱ NutȬ zers.ȱDerȱGrundȱhierfürȱkannȱinȱeinerȱZahlȱallgemeinerȱBeschränkungenȱliegen,ȱdieȱ einerseitsȱ technischerȱ Naturȱ sind,ȱ aberȱ andererseitsȱ auchȱ softwareergonomischeȱ Grenzenȱwiderspiegelnȱ[nachȱKoster]:ȱ Tabelle 3.7: Beschränkungen des Information Retrieval Merkmal
Beschreibung
Zahl der indexierten Dokumente
Jede Suchmaschinen verfügt nur über eine begrenzte Kapazität. Sie kann daher nur einen Teil der weltweit erreichbaren Dokumente wiedergeben.
Aktualität
Sowohl das Personal zur Dokumentklassifizierung der Kataloge als auch die automatischen Suchmöglichkeiten zur Volltextindizierung können alle Seiten nur mit zeitlicher Verzögerung berücksichtigen.
Suchtiefe
Die Analyse der gesamten Verzeichnisstruktur einer Web-Site überfordert selbst die leistungsfähigsten Suchprogramme.
Seitenausschluss
Jeder Betreiber eines Web-Servers kann bestimmte Verzeichnis- oder Dateistrukturen von einer Indizierung ausschließen.
Dynamisch generierte Seiten
HTML-Seiten, die als Ergebnis einer Datenbankrecherche entstehen, sind aufgrund ihrer temporären Existenz nicht suchbar.
Eingabesyntax
Eigenwillige Formulierungen der Suchanfragen erschweren die Bedienung und Akzeptanz der Suchmechanismen.
ȱ
3.4.7
Topic Maps
Dasȱ Retrievalȱ inȱ Formȱ derȱ Volltextsucheȱ stelltȱ wertvollesȱ konzeptionellesȱ Wissenȱ dar,ȱdasȱnachȱderȱRechercheȱverlorenȱgeht.ȱUmȱdiesemȱVerlustȱvorzubeugenȱundȱ denȱ ausȱ derȱ praktischenȱ Anwendungȱ gewonnenenȱ Erfahrungsschatzȱ derȱ AnwenȬ derȱ zuȱ sichernȱ undȱ weiterzuentwickeln,ȱ könnenȱ dieȱ Suchmusterȱ inȱ semantischeȱ
ȱ
111
3ȱȱECMȱManageȬKomponenteȱ Abfragenetzeȱintegriertȱwerden.ȱImȱUnterschiedȱzuȱbaumartigȱstrukturiertenȱKateȬ gorienȱwerdenȱsämtlicheȱQuerbeziehungenȱeinesȱThemasȱsichtbar.ȱDieseȱintelligenȬ tenȱWissensnetzeȱberücksichtigenȱbeiȱderȱinhaltlichenȱErschließungȱvonȱTextenȱdieȱ BedeutungȱderȱZusammenhängeȱvonȱWörtern.ȱWährendȱdieȱVolltextsucheȱnurȱdieȱ Inhalteȱ derȱ Informationsquellenȱ auflistet,ȱ wertetȱ dieserȱ Ansatzȱ Metastrukturenȱ überȱ denȱ eigentlichenȱ Inhaltȱ aus.ȱ Imȱ Herbstȱ 1999ȱ hatȱ dieȱ ISOȱ diesesȱ Prinzipȱ alsȱ BasisȱdesȱStandardsȱ13250ȱ„TopicȱMaps“ȱformuliert.ȱTopicȱMapsȱ[Gerick]ȱdefinieȬ renȱeinȱModellȱundȱeineȱArchitekturȱfürȱeinȱstrukturiertesȱNetzȱausȱHyperlinks,ȱdieȱ dieȱentsprechendenȱInformationsobjekteȱmiteinanderȱverknüpfen.ȱDieȱwichtigstenȱ Bausteineȱsind:ȱ – Topicsȱ=ȱThemen,ȱKnotenȱ – Angaben,ȱwoȱdieseȱThemenȱvorkommenȱ – Assoziationenȱ=ȱBeziehungenȱzwischenȱdiesenȱThemenȱ
ȱ
Beispielȱ Einȱ Volltextsuchstringȱ zumȱ Stichwortȱ „Geldwäsche“ȱ kannȱ einenȱ komplexenȱAufbauȱbesitzen,ȱumȱverwandteȱGebieteȱzuȱerschließen.ȱDazuȱ gehörtȱ nebenȱ demȱ Ordnungsaspektȱ Sicherheitȱ möglicherweiseȱ auchȱ dieȱ KategorieȱAufsichtswesenȱmitȱGesetzȱoderȱAnderkonto:ȱ ȱ GWGȱorȱGeldwäschegesetz*ȱorȱGeldw??schegesetz*ȱorȱȱ Geldw?schegesetz*ȱorȱ(anderkont*ȱandȱgesetz)ȱorȱȱ (schmutzigesȱgeldȱandȱgesetz)ȱorȱ (schwarz*ȱkont*ȱandȱgesetz)ȱ
ȱ
Mitȱ Blickȱ aufȱ Geldwäscheȱ wärenȱ danebenȱ auchȱ Geldwäschegesetzȱ oderȱ Pflichtenȱ zutreffendeȱ Stichworte.ȱ Suchorteȱ könntenȱ Artikel,ȱ Kommentarȱ oderȱ Gesetzestextȱ sein.ȱ Assoziationenȱ formulierenȱ dieȱ Beziehung,ȱ dassȱ dasȱ Geldwäschegesetzȱ AufȬ bewahrungspflichtenȱregeltȱoderȱdurchȱMaßnahmenȱwieȱLauschangriffȱbeiȱorganiȬ sierterȱKriminalitätȱbekämpftȱwird.ȱȱ Dasȱ Austauschformatȱ fürȱ Topicȱ Mapsȱ bildetȱ XML.ȱ Dadurchȱ wirdȱ gewährleistet,ȱ dassȱdieȱTexteȱdurchȱentsprechendeȱAuszeichnungenȱsemantischȱqualifiziertȱwerȬ den,ȱumȱihreȱkontextbezogenenȱVerwendungȱzuȱsichern.ȱ
3.5 Text Mining VieleȱderȱimȱInformationȱRetrievalȱverwendetenȱTechnikenȱundȱErkenntnisseȱlasȬ senȱsichȱauchȱfürȱdasȱTextȱMiningȱverwenden.4ȱMitȱderȱEinführungȱvonȱ„EnterpriȬ ȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱ 4
ȱ
Dieȱ folgendenȱ Ausführungenȱ orientierenȱ sichȱ anȱ einemȱ internenȱ Paperȱ derȱ FHȱ Flensburg;ȱ Hartl,ȱ Kühl,ȱRuge:ȱTechnikenȱdesȱTextȱMinings,ȱ2008ȱ
112 ȱ
3.5ȱȱTextȱMiningȱ seȬContentȬManagement“ȬSystemenȱwerdenȱimmerȱmehrȱDokumenteȱelektronischȱ verfügbar.ȱ Imȱ Vergleichȱ zuȱ Rechnernȱ istȱ esȱ fürȱ denȱ Menschenȱ inȱ derȱ Regelȱ rechtȱ einfach,ȱTexteȱzuȱlesen,ȱzuȱverstehenȱundȱsieȱinȱeinenȱKontextȱeinzuordnen.ȱȱSollenȱ hingegenȱ Texteȱ mitȱ Hilfeȱ vonȱ geeigneterȱ Softwareȱ analysiert,ȱ interpretiertȱ undȱ miteinanderȱ inȱ Beziehungȱ gestelltȱ werden,ȱ gestaltetȱ sichȱ eineȱ automatischeȱ AusȬ wertungȱwesentlichȱschwieriger.ȱZurȱAnalyseȱziehtȱmanȱverschiedensteȱTechnikenȱ ausȱdenȱDisziplinenȱderȱlinguistischenȱSprachstatistik,ȱdemȱDataȱMiningȱundȱdemȱ InformationȱRetrievalȱheran.ȱDieȱeinzelnenȱDisziplinenȱlassenȱsichȱwieȱfolgtȱgegeȬ neinanderȱabgrenzenȱ[Heyerȱ2005]:ȱ Tabelleȱ3.8:ȱPositionierungȱvonȱTextȱMiningȱ Suche
Entdeckung
Strukturierte Daten
Data Retrieval
Data Mining
Unstrukturierte Daten
Information Retrieval
Text Mining
ȱ TextȱMiningȱversuchtȱanhandȱvonȱMusternȱundȱBeziehungenȱinȱdenȱunstrukturierȬ tenȱ Datenȱ neueȱ Erkenntnisseȱ zuȱ gewinnen.ȱ Imȱ Gegensatzȱ dazuȱ versuchtȱ dasȱ InȬ formationȱ Retrievalȱ mitȱ demȱ Auffindenȱ vonȱ Informationenȱ inȱ unstrukturiertenȱ Datenȱ eineȱ effizienteȱ Sucheȱ zuȱ unterstützen.ȱ Derȱ wesentlicheȱ Unterschiedȱ zumȱ Dataȱ Miningȱ liegtȱ inȱ derȱ Strukturȱ derȱ zugrundeȱ liegendenȱ Daten.ȱ Dataȱ Miningȱ richtetȱ sichȱaufȱstrukturierteȱ Daten,ȱ wieȱ z.B.ȱ wirtschaftlicheȱ Kennzahlen,ȱ dieȱ typiȬ scherweiseȱ inȱ relationalenȱ Datenbankenȱ abgespeichertȱ sind,ȱ umȱ neuesȱ Wissenȱ zuȱ extrahieren.ȱDerȱBezugȱzuȱWebȱ2.0ȱwirdȱdurchȱdenȱBegriffȱWebȱMiningȱzumȱAusȬ druckȱgebracht.ȱDasȱWebȱMiningȱbefasstȱsichȱjedochȱnurȱmitȱInformationen,ȱdieȱimȱ WorldȱWideȱWebȱ verfügbarȱ sind,ȱundȱmachtȱ nebenȱ denȱ eigentlichenȱ SeiteninhalȬ tenȱauchȱdieȱStrukturȱderȱWebseitenȱsowieȱdasȱNutzerverhaltenȱzumȱGegenstandȱ derȱUntersuchung.ȱ
3.5.1
Grundlagen
Wortformenȱ lassenȱ sichȱ inȱ einerȱ vonȱ derȱ Aussageȱ herȱ bestimmtenȱ Weiseȱ entspreȬ chendȱdenȱsyntaktischen,ȱstilistischenȱundȱrhetorischenȱRegelnȱeinerȱSpracheȱmitȬ einanderȱ kombinierenȱ undȱ somitȱ auchȱ statistischȱ untersuchen.ȱ Schwerpunktȱ derȱ AnalyseȱsindȱeinerseitsȱdieȱHäufigkeitsverteilungenȱvonȱWortenȱundȱandererseitsȱ wahrscheinlichkeitsbasierteȱ Aussagenȱ überȱ Wortkombinationen.ȱ Zurȱ erstenȱ KateȬ gorieȱgehörtȱdasȱZipfscheȱGesetz.ȱHierȱgiltȱes,ȱAussagenȱzumȱUmfangȱdesȱVokabuȬ larsȱbzw.ȱseinȱAnwachsenȱbeiȱeinerȱVergrößerungȱderȱTextmengeȱzuȱmachen.ȱ Dieȱ Differenzanalyseȱ versucht,ȱ diskriminierendeȱ Termeȱ durchȱ dieȱ Auswertungȱ vonȱ Verteilungenȱ vonȱ Wortformenȱ bzw.ȱ Wortformenkombinationenȱ inȱ Textenȱ zuȱ ermitteln.ȱ Einȱ diskriminierenderȱ Termȱ istȱ einȱ Wortȱ bzw.ȱ eineȱ Wortform,ȱ dieȱ gutȱ zurȱUnterscheidungȱvonȱTextenȱeingesetztȱwerdenȱkann.ȱȱAusgangspunktȱfürȱdieȱ
ȱ
113
3ȱȱECMȱManageȬKomponenteȱ Differenzanalyseȱ bildenȱ zweiȱ Textmengen:ȱ einȱ AnalyseȬȱ undȱ einȱ Referenzkorpus.ȱ Dasȱ Analysekorpusȱ bestehtȱ ausȱ denȱ Texten,ȱ ausȱ denenȱ diskriminierendeȱ Termeȱ extrahiertȱwerdenȱsollen.ȱJeȱnachȱAufgabenstellungȱbzw.ȱEinsatzgebietȱwirdȱdieserȱ Korpusȱ ausȱ Fachtexten,ȱ Pressemitteilungenȱ o.ä.ȱ zusammengestellt.ȱ Dieȱ zweiteȱ Textmenge,ȱ derȱ Referenzkorpus,ȱ istȱ einȱ allgemeinȱ sprachlicherȱ Textkorpus,ȱ derȱ beispielsweiseȱausȱZeitungstextenȱzusammengesetztȱwird.ȱEinȱVergleichȱderȱAufȬ tretenswahrscheinlichkeitenȱ einzelnerȱ Wortformenȱ bzw.ȱ WortformenkombinatioȬ nenȱderȱbeidenȱTextkorporaȱerlaubtȱdieȱgrundsätzlicheȱEinteilungȱderȱWortformenȱ inȱvierȱKlassenȱ[Heyerȱ2005]:ȱȱ – Wortformen,ȱ dieȱ imȱ Referenzkorpusȱ nichtȱ vorkommen:ȱ Dieseȱ Wortformenȱ sindȱidealȱzurȱIdentifikationȱdesȱFachtextes.ȱInȱderȱRegelȱhandeltȱesȱsichȱumȱ FachausdrückeȱdesȱThemengebietes.ȱ – Wortformen,ȱ dieȱ imȱ Analysekorpusȱ häufigerȱ vorkommenȱ alsȱ imȱ ReferenzȬ korpus:ȱEsȱkannȱnurȱmitȱeinerȱgewissenȱWahrscheinlichkeitȱgesagtȱwerden,ȱ dassȱ esȱ sichȱ hierbeiȱ umȱ Fachtermeȱ handelt.ȱ Ausȱ diesemȱ Grundȱ mussȱ einȱ Schwellenwertȱ definiertȱ werden,ȱ z.B.ȱ eineȱ Mindestdifferenzȱ derȱ HäufigȬ keitsklassenȱimȱAnalyseȬȱbzw.ȱReferenzkorpus,ȱsoȱdassȱeineȱeindeutigeȱEinȬ teilungȱvorgenommenȱwerdenȱkannȱ – Wortformen,ȱdieȱinȱbeidenȱTextkorporaȱmitȱetwaȱderȱgleichenȱrelativenȱHäuȬ figkeitȱvorkommen:ȱEsȱsindȱmeistȱStoppwörter,ȱwieȱz.B.ȱArtikel,ȱKonjunktiȬ onȱoderȱPräpositionȱoderȱallgemeineȱBegriffe.ȱSieȱeignenȱsichȱnicht,ȱumȱeineȱ ZuordnungȱzuȱeinerȱbestimmtenȱThematikȱzuȱvollziehen,ȱsoȱdassȱsieȱkeinerȬ leiȱRelevanzȱhabenȱ – Wortformen,ȱdieȱimȱFachtextȱseltenerȱalsȱimȱallgemeinenȱsprachlichenȱTextȬ korpusȱvorkommen:ȱAufgrundȱdesȱgeringenȱVorkommensȱimȱFachkorpusȱ handeltȱesȱsichȱauchȱhierȱnichtȱumȱdeterminierendeȱTerme,ȱsoȱdassȱsieȱebenȬ fallsȱnichtȱberücksichtigtȱwerdenȱsollten.ȱ Bessereȱ Ergebnisseȱ ergebenȱ sich,ȱ wennȱ verschiedeneȱ Filterȱ angewendetȱ werden,ȱ dieȱweiteresȱSelektierenȱzulassen.ȱSoȱkannȱeineȱBeschränkungȱaufȱNomenȱdasȱAufȬ findenȱvonȱFachausdrückenȱwesentlichȱerleichtern.ȱ Beiȱ statistikȬbasiertenȱ Textȱ MiningȬVerfahrenȱ werdenȱ dieȱ statistischenȱ AbhängigȬ keitenȱ vonȱ Wortformenȱ inȱ Formȱ vonȱ bedingtenȱ Wahrscheinlichkeitenȱ untersucht.ȱ Dazuȱ werdenȱ sowohlȱ syntaktischeȱ alsȱ auchȱ semantischeȱ Beschränkungenȱ fürȱ dieȱ Kombinationsmöglichkeitenȱ vonȱ Wortformenȱ berücksichtigt.ȱ Esȱ giltȱ ganzȱ grundȬ sätzlichȱ zuȱ prüfen,ȱ obȱ dieȱ gegebeneȱ Kombinationȱ derȱ Wortformenȱ einenȱ syntakȬ tischȱ undȱ semantischȱ korrektenȱ Satzȱ einerȱ vorherȱ definiertenȱ Spracheȱ ergibt.ȱ Dieȱ Vielzahlȱ vonȱ möglichenȱ Kombinationen,ȱ dieȱ korrekteȱ Sätzeȱ einerȱ Spracheȱ bilden,ȱ lässtȱsichȱjedochȱnichtȱvollständigȱabbilden.ȱ Dieȱ Erkennungȱ einesȱ semantischenȱ Zusammenhangsȱ einzelnerȱ Wortformenȱ inȱ einemȱ Textȱ bleibtȱ eineȱ derȱ zentralenȱ Herausforderungenȱ desȱ Textȱ Minings.ȱ Dieȱ UntersuchungȱvonȱTextenȱaufȱBasisȱvonȱKookkurrenzenȱgehtȱdavonȱaus,ȱdassȱhäuȬ figesȱgemeinsamesȱAuftretenȱvonȱWortformenȱinȱeinemȱTextȱeinȱstarkesȱIndizȱfürȱ
114 ȱ
3.5ȱȱTextȱMiningȱ einenȱ semantischenȱ Zusammenhangȱ bildet.ȱ Unterȱ Kookkurrenzȱ wirdȱ dasȱ AuftreȬ tenȱzweierȱWortformenȱinȱeinemȱdefiniertenȱTextabschnittȱ(z.B.ȱSatz)ȱverstanden.ȱ ȱ Beispiel:ȱWortpaareȱ ȱ Losȱ–ȱAngelesȱ schwereȱ–ȱKrankheitȱ Romeoȱ–ȱJuliaȱ Polizeiȱ–ȱverhaftetȱ derȱ–ȱdieȱ Parisȱ–ȱLondonȱ ZielȱeinerȱstatistischenȱHerangehensweiseȱanȱdiesesȱProblemȱzurȱBestimmungȱderȱ Signifikanzȱ istȱ es,ȱ eineȱ Zahlȱ zuȱ definieren,ȱ dieȱ eineȱ Aussageȱ überȱ dieȱ Signifikanzȱ derȱ Kookkurrenzȱ erlaubt,ȱ umȱ demȱ intuitivenȱ Gefühlȱ derȱ Zusammengehörigkeitȱ vonȱWortformenȱzuȱentsprechen.ȱ ȱ Beispiel:ȱKookkurrenzȬVergleichȱ ȱ Esȱistȱnichtȱklar,ȱwieȱdieȱKookkurrenzȱvonȱ„Polizeiȱ–ȱverhaftet“ȱmitȱderȱ Zusammengehörigkeitȱ vonȱ „Romeoȱ –ȱ Julia“ȱ verglichenȱ werdenȱ soll.ȱ Leichterȱ istȱ daȱ derȱ Vergleichȱ vonȱ Kookkurrenzen,ȱ beiȱ denenȱ eineȱ WortȬ formȱunverändertȱbleibt.ȱIntuitivȱerscheintȱderȱZusammenhangȱvonȱ„PoȬ lizeiȱ–ȱverhaftet“ȱmitȱ„Polizeiȱ–ȱberitten“ȱgrößer.ȱ ȱ Dasȱ Auffindenȱ vonȱ signifikantenȱ Kookkurrenzenȱ deutetȱ inȱ vielenȱ Fällenȱ aufȱ seȬ mantischeȱZusammenhänge,ȱwieȱOberȬȱundȱUnterbegriffe,ȱtypischeȱEigenschaftenȱ oderȱtypischeȱTätigkeitenȱhin.ȱDarüberȱhinausȱwerdenȱhäufigȱmehrereȱWortformenȱ ausȱeinemȱSachgebietȱȱoderȱausȱeinemȱsprachlichenȱBereichȱgefunden.ȱ ȱ Beispiel:ȱNutzenȱderȱsignifikantenȱKookkurrenzȱ ȱ Frage:ȱ„MitȱwemȱstandȱEdmundȱHillaryȱ1953ȱaufȱdemȱGipfelȱdesȱMountȱ Everest?“ȱ Nasreddinȱ Hodscha,ȱ Nursayȱ Pimsorn,ȱ Tenzingȱ Norgayȱ oderȱ AbrindranathȱSingh.ȱ ȱ
ȱ
115
3ȱȱECMȱManageȬKomponenteȱ Sollȱ nunȱ eineȱ Antwortȱ gefundenȱ werden,ȱ soȱ könnenȱ dieȱ signifikantenȱ Kookkurrenzenȱ eineȱ Lösungȱ liefern.ȱ Handeltȱ esȱ sichȱ beiȱ denȱ AntwortȬ möglichkeitenȱumȱFantasienamenȱoderȱumȱPersonen,ȱdieȱnichtsȱmitȱEdȬ mundȱ Hillaryȱ zuȱ tunȱ haben,ȱ soȱ werdenȱ dieseȱ Namenȱ auchȱ nichtȱ unterȱ denȱ signifikantenȱ Kookkurrenzenȱ auftauchen.ȱ Somitȱ erhöhtȱ sichȱ dieȱ Wahrscheinlichkeitȱ einerȱ richtigenȱ Antwort.ȱ Dieȱ stärkstenȱ signifikantenȱ Kookkurrenzenȱ zuȱ Edmundȱ Hillaryȱ sind:ȱ Hillaryȱ (340),ȱ Edmundȱ (240),ȱ EverestȬBezwingerȱ(126),ȱEverestȱ(104),ȱNorgayȱ(90),ȱTenzingȱ(90),ȱMountȱ (79),ȱ Erstbesteigerȱ (66),ȱ Bergsteigerȱ (44),ȱ Inglisȱ (37),ȱ Erstbesteigungȱ (37).ȱ Mehrwortkookurrenzenȱ zuȱ Edmundȱ Hillaryȱ sind:ȱ Tenzingȱ Norgayȱ (90),ȱ Mountȱ Everestȱ (86),ȱ nachȱ demȱ (7)5.ȱ Daȱ esȱ nurȱ eineȱ Übereinstimmungȱ zwischenȱdenȱgefundenenȱKookkurrenzenȱundȱdenȱAntwortmöglichkeiȬ tenȱ gibt,ȱ wähltȱ manȱ dieseȱ ausȱ undȱ bekommtȱ mitȱ derȱ drittenȱ Antwortȱ Recht.
3.5.2
Techniken
Einȱ Verfahrenȱ zurȱ computergestütztenȱ Analyseȱ vonȱ Textenȱ imȱ Rahmenȱ desȱ Textȱ Miningȱ bildetȱ dasȱ ClusterȬVerfahrenȱ mitȱ seinemȱ zugrundeȱ liegendenȱ Begriffȱ derȱ Ähnlichkeit,ȱ vgl.ȱ 3.4.5.1.ȱ Zusätzlichȱ sindȱ auchȱ musterbasierteȱ Verfahrenȱ vonȱ beȬ sondererȱ Bedeutung.ȱ Beiȱ derȱ Anwendungȱ morphologischerȱ Musterȱ wirdȱ dasȱ ErȬ scheinungsbildȱ derȱ Texteȱ vollkommenȱ vernachlässigtȱ undȱ nurȱ dieȱ Bedeutungȱderȱ einzelnenȱWorteȱinȱdenȱMittelpunktȱgestelltȱ[Stockȱ00].ȱDiesȱwirdȱdurchȱdieȱRedukȬ tionȱ derȱ einzelnenȱ Worteȱ aufȱ ihreȱ Grundformȱ erreicht.ȱ Weiterhinȱ wirdȱ beiȱ denȱ morphologischenȱMusternȱaufȱWorteȱohneȱsinntragendeȱBedeutung,ȱsoȱgenannterȱ Stoppworte,ȱvollkommenȱverzichtet.ȱEinȱweitererȱSchrittȱstelltȱdieȱKompositazerleȬ gungȱ dar.ȱ Diesesȱ Verfahrenȱ istȱ inȱ derȱ deutschenȱ Spracheȱ vonȱ besondererȱ BedeuȬ tung,ȱumȱzusammengesetzteȱWorteȱinȱseineȱEinzelteileȱzuȱzerlegen,ȱdieȱwiederumȱ einzelnenȱKategorienȱzugeordnetȱwerden.ȱ
3.6 Kontrollfragen 1. 2. 3. 4. 5.
WelcheȱProblemeȱentstehenȱbeiȱderȱNutzungȱdesȱMediumsȱPapierȱimȱDoȬ kumentenmanagement?ȱ WelcheȱFunktionenȱsollteȱeinȱDokumentenmanagementsystemȱbesitzen?ȱ Wasȱ sindȱ dieȱ Problemeȱ beiȱ derȱ Nachbildungȱ einerȱ Stempelfunktionȱ imȱ Dokumentenmanagement?ȱ Wasȱ istȱ unterȱ CSCWȱ zuȱ verstehenȱ undȱ welcheȱ Komponentenȱ sollteȱ eineȱ GroupwareȬLösungȱbeinhalten?ȱ Wieȱ stehenȱ dieȱ Begriffeȱ Workflow,ȱ Geschäftsprozessȱ undȱ Groupwareȱ zuȬ einander?ȱ
ȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱ 5
ȱ
http://wortschatz.uniȬleipzig.deȱ
116 ȱ
3.6ȱȱKontrollfragenȱ 6.
ȱ
WarumȱhatȱderȱBegriffȱderȱRolleȱeineȱherausragendeȱBedeutungȱimȱWorkȬ flowȬKonzept?ȱ 7. AusȱwelchenȱKomponentenȱbestehtȱeinȱWorkflowmanagementȬSystem?ȱ 8. WelcheȱSuchprinzipienȱzeichnenȱRetrievalsystemeȱaus?ȱ 9. WasȱwirdȱunterȱMetadatenȱverstanden?ȱ 10. WasȱistȱdasȱbesondereȱMerkmalȱvonȱDeskriptoren?ȱ
ȱ
117
4 ECM Deliver-Komponente Dieȱ „Deliver“ȬKomponenteȱ ȱ dientȱ zurȱ Bereitstellungȱ derȱ Informationenȱ ausȱ denȱ „Manage“Ȭ,ȱ„Store“Ȭȱundȱ„Preserve“ȬKomponenten.ȱSieȱbeinhaltetȱaberȱauchȱFunkȬ tionen,ȱdieȱwiederumȱfürȱdieȱEingabeȱvonȱInformationenȱinȱSystemeȱ(zumȱBeispielȱ Informationsübergabeȱ aufȱ Medienȱ oderȱ Erzeugungȱ formatierterȱ Ausgabedateien)ȱ oderȱ fürȱ dieȱ Aufbereitungȱ vonȱ Informationenȱ (zumȱ Beispielȱ Konvertierungȱ oderȱ Kompression)ȱ fürȱ dieȱ „Store“Ȭȱ undȱ „Preserve“Ȭȱ Komponentenȱ dienenȱ [Kampffmeyerȱ 2007,ȱ S.ȱ 76].ȱ Derȱ Begriffȱ selbstȱ hatȱ bisherȱ keinenȱ hohenȱ BekannȬ theitsgradȱ erlangt.ȱ Dieȱ nachfolgendeȱ Definitionȱ folgtȱ keinerȱ allgemeinenȱ FestleȬ gung,ȱsondernȱdientȱeherȱdemȱVerständnis:ȱȱ ȱ DasȱOutputȬManagementȱalsȱAusdruckȱderȱDeliverȬFunktionȱformatiert,ȱ produziert,ȱ verwaltetȱ undȱ verteiltȱ alsȱ virtuelleȱ Drehscheibeȱ Dokumente.ȱ DieȱdiesemȱProzessȱzugrundeȱliegendenȱDokumenteȱwerdenȱgesammelt,ȱ gebündelt,ȱ sortiert,ȱ verarbeitetȱ undȱ passendȱ formatiertȱ anȱ dieȱ AusgabeȬ medienȱweitergeleitet.ȱȱ
ȱ Dieȱ„Deliver“ȬKomponenteȱumfasstȱFunktionenȱundȱMedienȱzurȱDistribution,ȱzurȱ TransformationȱundȱzurȱSicherheitȱ[CM].ȱ Distribution:ȱ Dieseȱ Kategorieȱ dientȱ imȱ Wesentlichenȱ dazu,ȱ dieȱ unterschiedlichenȱ InhalteȱkontrolliertȱundȱnutzungsorientiertȱeinerȱZielgruppeȱaufȱunterschiedlichenȱ Wegenȱ bereitzustellen.ȱ Hierzuȱ könnenȱ aktiveȱ Komponentenȱ wieȱ Versandȱ alsȱ EȬ Mail,ȱ aufȱ Datenträgernȱ oderȱ alsȱ Rundschreibenȱ ebensoȱ gehörenȱ wieȱ dieȱ passiveȱ PublikationȱaufȱWebseitenȱ undȱ Portalen,ȱ vonȱ denenȱ sichȱ dieȱ Zielgruppeȱausȱ demȱ Informationsangebotȱ selbstȱ bedient.ȱ Dasȱ Zielȱ istȱ einȱ weitgehendȱ automatisierterȱ Arbeitsprozessȱ vomȱ Erstellenȱ derȱ Dokumenteȱ bisȱ zumȱ Versand.ȱ Wirdȱ alsoȱ einȱ Schriftstückȱ oderȱ einȱ ganzesȱ Briefpaketȱ inȱ Auftragȱ gegeben,ȱ soȱ übernimmtȱ dasȱ OutputȬManagementȱdasȱSchriftgut,ȱfertigtȱdieȱerforderlichenȱKopien,ȱbringtȱMarȬ kierungenȱfürȱ dieȱ Poststraßeȱ anȱ undȱarchiviertȱ denȱganzenȱVorgangȱ elektronisch.ȱ Nebenȱ dieserȱ Formȱ desȱ OutputȬManagementsȱ existiertȱ eineȱ weitereȱ Ausprägung,ȱ dieȱdieȱAufgabeȱdarinȱsieht,ȱfürȱjedenȱEmpfängerȱdieȱrichtigeȱArtȱdesȱVersandsȱzuȱ wählen.ȱ ȱ ȱ
ȱ
119
4ȱȱECMȱDeliverȬKomponenteȱ OutputȬManagementȱ sorgtȱ folglichȱ dafür,ȱ dassȱ dasȱ richtigeȱ Dokumentȱ zurȱ richtiȬ genȱ Zeitȱimȱ richtigenȱFormatȱ zuȱ denȱ jeweilsȱ günstigstenȱ Kostenȱ zuverlässigȱbeimȱ richtigenȱ Empfängerȱ ankommt.ȱ Denȱ Empfängerȱ sollenȱ dieseȱ Dokumenteȱ inȱ beȬ stimmtemȱFormatȱmitȱbestimmtemȱLayoutȱerreichen.ȱSollȱgedrucktȱwerden,ȱkomȬ menȱ Druckmanagement,ȱ DVȬFreimachungȱ undȱ Portooptimierungȱ hinzu.ȱ Zielȱ istȱ letztlichȱ dasȱ perfekteȱ Dokumentȱ mitȱ derȱ Nebenbedingung,ȱ dassȱ GeschäftsschreiȬ benȱimmerȱpersönlicherȱwerdenȱsollen,ȱundȱzwarȱinhaltlichȱalsȱauchȱinȱBezugȱaufȱ denȱVertriebsweg.ȱDieseȱFeststellungȱgehtȱeinherȱmitȱderȱErkenntnis,ȱdassȱKontoȬ auszüge,ȱ Rechnungenȱ oderȱ Bescheideȱ sichȱ nurȱ inȱ großenȱ Mengenȱ kostengünstigȱ druckenȱlassen.ȱAufȱBasisȱeinerȱDruckvorlageȱundȱderȱDatenȱwirdȱeinȱDruckstromȱ mitȱ mehrerenȱ Tausendȱ Schreibenȱ erzeugtȱ undȱ aufȱ einenȱ oderȱ mehrereȱ zentraleȱ Druckerȱ verteilt.ȱ Dieȱ Kunstȱ desȱ OutputȬManagementsȱ bestehtȱ dannȱ darin,ȱ denȱ SpagatȱzwischenȱIndividualisierungȱdesȱDokumentsȱundȱMassendruckȱzuȱschaffen.ȱ [Grenzebachȱ1]ȱ EinesȱderȱprimärenȱZieleȱdesȱOutputȬManagementsȱbestehtȱdarin,ȱdieȱDruckkostenȱ zuȱ senken.ȱ Nebenȱ diesenȱ reinȱ monetärenȱ Aspektȱ tretenȱ aberȱ weitereȱ qualitativeȱ Erwägungen:ȱ – Eineȱ Zentralisierungȱ desȱ Druckensȱ ermöglichtȱ eineȱ wesentlichȱ einfachereȱ Administration,ȱ eineȱ effektivereȱ Lagerhaltung,ȱ eineȱ bessereȱ Anpassungȱ derȱ GeräteausstattungȱundȱeineȱPortooptimierung.ȱ – Einȱ einheitlichesȱ Erscheinungsbildȱ imȱ Sinneȱ einerȱ Corporateȱ Identityȱ istȱ leichterȱzentralȱalsȱdezentralȱdurchzusetzen.ȱ – DieȱautomatischeȱArchivierungȱdesȱspeicherungsbedürftigenȱSchriftgutesȱistȱ schnellerȱumzusetzenȱalsȱeineȱarbeitsplatzbezogeneȱEinführung.ȱ – Dieȱ Kostenȱ lassenȱ sichȱ transparenterȱ feststellen,ȱ ȱ daȱ dieȱ gängigenȱ Systemeȱ Statistikenȱ überȱ Artȱ undȱ Mengeȱ vonȱ Papier,ȱ Portoklassenȱ vonȱ Briefenȱ u.ä.ȱ erzeugen.ȱ Transformation:ȱ ȱ Transformationenȱ beziehenȱ sichȱ aufȱ dieȱ Anpassungȱ derȱ Datenȱ fürȱdieȱAusgabeȱbzw.ȱderenȱUmwandlungȱinȱentsprechendeȱFormate.ȱTransformaȬ tionenȱsollenȱimmerȱverlustfrei,ȱkontrolliertȱundȱnachvollziehbarȱablaufen.ȱHierfürȱ kommenȱDiensteȱzumȱEinsatz,ȱdieȱsichȱdemȱEndanwenderȱinȱderȱRegelȱnichtȱzeiȬ genȱ[Grenzebachȱ2]:ȱ – COLDȱ/ȱERMȱistȱhierȱimȱGegensatzȱzurȱ„Capture“ȬȱKomponenteȱalsȱAufbeȬ reitungȱ vonȱ Datenȱ vonȱ Ausgabenȱ fürȱ Verteilung,ȱ Druckȱ undȱ Übergabeȱ anȱ dasȱArchivȱzuȱsehen.ȱTypischeȱAnwendungenȱsindȱListenȱundȱformatierterȱ Output.ȱInzwischenȱstehtȱderȱBegriffȱCOLDȱallgemeinȱfürȱdieȱdigitaleȱArchiȬ vierungȱvonȱDruckȬȱundȱListenausgaben,ȱgleichgültigȱaufȱwelchemȱdigitalenȱ Speichermedium.ȱEinȱArchivnutzerȱmöchteȱeinenȱZugriffȱaufȱjedesȱeinzelneȱ Dokumentȱ haben.ȱ Eineȱ COLDȬAnwendungȱ mussȱ daherȱ MehrdokumentenȬ stapelȱ auftrennenȱ oderȱ segmentieren.ȱ Fürȱ eineȱ Dokumententrennungȱ bietetȱ entwederȱdasȱAusgabeformatȱselbstȱdieȱzugehörigenȱStrukturelementeȱoderȱ aberȱListenȱmüssenȱmittelsȱlogischerȱKriterienȱaufgeteiltȱwerden.ȱDazuȱkönȬ
120 ȱ
4.1ȱȱSicherheitȱ nenȱz.B.ȱSeitenzahlenȱdienen,ȱdieȱstetsȱanȱderȱgleichenȱStelleȱstehen.ȱBeiȱderȱ SegmentierungȱbleibtȱderȱDokumentenstromȱerhalten.ȱDieȱeinzelnenȱDokuȬ menteȱ werdenȱ durchȱ Pointerȱ identifiziert.ȱ Derȱ Vorteilȱ diesesȱ Verfahrensȱ istȱ derȱ sehrȱ schnelleȱ Archivierungslauf.ȱ Entscheidenderȱ Vorteilȱ derȱ COLDȬ Archivierungȱ istȱ dieȱ Möglichkeit,ȱ Suchindizesȱ direktȱ auszulesen.ȱ Beimȱ EinȬ scannenȱvonȱDokumentenȱhingegenȱmüssenȱIndizesȱmanuellȱvergebenȱwerȬ den.ȱȱ – XMLȱ(eXtendedȱMarkupȱLanguage)ȱistȱeineȱBeschreibungssprache,ȱdieȱesȱerȬ laubt,ȱDokumenteȱzuȱbeschreiben.ȱXMLȱsetztȱsichȱalsȱdieȱuniverselleȱTechnoȬ logieȱzumȱDatenaustauschȱdurchȱ[vgl.ȱKapitelȱ2.3,ȱKampffmeyerȱ2003].ȱ – PDFȱ(PrintableȱDocumentȱFormat)ȱistȱeinȱintelligentesȱDruckȬȱundȱDistribuȬ tionsformat,ȱ dasȱ esȱ erlaubt,ȱ Informationenȱ plattformunabhängigȱ bereitzusȬ tellen.ȱImȱGegensatzȱzuȱreinenȱBildformatenȱwieȱTIFFȱkönnenȱinȱPDFȱInhalteȱ gesucht,ȱ Metadatenȱ beigefügtȱ undȱ elektronischeȱ Signaturenȱ eingebettetȱ werden.ȱPDF/AȱistȱdasȱzugehörigeȱStandardȬArchivformatȱ[vgl.ȱKapitelȱ5.2,ȱ Kampffmeyerȱ2003].ȱ – KonverterȱundȱViewerȱdienenȱeinerseitsȱzurȱUmformatierungȱvonȱInformaȬ tionen,ȱumȱeinheitlicheȱFormateȱzuȱerzeugen,ȱundȱandererseitsȱumȱInformaȬ tionenȱunterschiedlichenȱFormatesȱwiederȱanzuzeigenȱundȱauszugeben.ȱ – Kompressionȱ wirdȱ benutzt,ȱ umȱ denȱ Speicherplatzbedarfȱ fürȱ ȱ BildinȬ formationenȱzuȱreduzieren.ȱMitȱTIFFȱfürȱschwarz/weissȱBilderȱundȱJPEG2000ȱ fürȱFarbbilderȱstehenȱzweiȱStandardsȱzurȱVerfügung.ȱTIFFȱunterstütztȱmehrȬ seitigeȱ Dokumente,ȱ istȱ standardisiert,ȱ besitztȱ aberȱ denȱ Nachteilȱ derȱ ImageȬ Speicherung,ȱ d.h.ȱ alleȱ textuellenȱ Informationenȱ zurȱ elektronischenȱ Sucheȱ oderȱAuswertungȱvonȱTextstellenȱgehenȱverloren.ȱ FürȱdenȱMassendruckȱistȱdasȱAdvancedȱFunctionȱPresentationȱ(AFP)ȱvonȱIBMȱinȱ denȱ70erȱJahrenȱentwickeltȱworden.ȱNachȱwieȱvorȱistȱesȱfürȱdiesenȱBereichȱdasȱfühȬ rendeȱ Format.ȱ Esȱ verwendetȱ soȱ genannteȱ Druckschablonenȱ oderȱ Dataȱ Maps,ȱ dieȱ Informationenȱ wieȱ SimplexȬȱ oderȱ Duplexdruck,ȱ dieȱ Schachtsteuerungȱ undȱ dieȱ Funktionenȱ derȱ Nachbearbeitungȱ beinhalten.ȱ AFPȱ zeichnetȱ sichȱ durchȱ eineȱ TrenȬ nungȱ vonȱ Nutzdatenȱ undȱ wiederkehrendenȱ Strukturenȱ wieȱ Formularenȱ aus.ȱ Esȱ berücksichtigtȱ leichtȱ geänderteȱ Seiteninhalteȱ undȱ Anforderungenȱ wieȱ denȱ NachȬ druckȱeinzelnerȱSeiten.ȱ Sicherheit:ȱ Dieȱ Sicherheitstechnologienȱ gehörenȱ zuȱ denȱ Querschnittfunktionen,ȱ dieȱ allenȱ ECMȬKomponentenȱ zurȱ Verfügungȱ stehen.ȱ Soȱ kommenȱ elektronischeȱ SignaturenȱnichtȱnurȱbeiȱderȱVersendungȱvonȱDokumentenȱzumȱEinsatz,ȱsondernȱ könnenȱauchȱbeiȱderȱErfassungȱbenötigtȱwerden,ȱumȱdieȱVollständigkeitȱdesȱEmpȬ fangsȱzuȱdokumentieren.ȱDazuȱgehörtȱdieȱPKIȱ(PrivateȱKeyȱInfrastructure)ȱalsȱBaȬ sistechnologie.ȱSieȱverwaltetȱSchlüsselȱundȱZertifikateȱundȱprüftȱdieȱAuthentizitätȱ vonȱSignaturenȱ[Kampffmeyerȱ2003].ȱ ȱ
ȱ
121
4ȱȱECMȱDeliverȬKomponenteȱ
4.1 Sicherheit Durchȱ dieȱ Öffnungȱ derȱ unternehmensinternenȱ InformationsȬȱ undȱ KommunikatiȬ onssystemeȱgewinntȱderȱschnelle,ȱsichereȱundȱdirekteȱDatenaustauschȱmitȱPartnerȬ unternehmen,ȱKundenȱundȱLieferantenȱanȱBedeutung.ȱDieȱZukunftȱgehörtȱSicherȬ heitsarchitekturen,ȱdieȱesȱermöglichen,ȱTeilnehmerȱsicherȱzuȱauthentisieren,ȱDatenȱ gezieltȱ zuȱ verschlüsselnȱ undȱ dieȱ Urheberschaftȱ undȱ Integritätȱ vonȱ Informationenȱ sicherzustellen.ȱȱ WerȱvertraulicheȱInformationenȱüberȱdasȱInternetȱschicktȱundȱdazuȱdieȱverbreiteȬ tenȱ EȬMailȬProtokolleȱ SMTPȱ oderȱ POPȱ nutzt,ȱ sendetȱ dieȱ Nachrichtenȱ imȱ Klartext.ȱ Angreiferȱ könnenȱ daherȱ Informationenȱ jederzeitȱ abfangen,ȱ dieseȱ lesenȱ oderȱ garȱ verfälschen.ȱWerȱsicherȱgehenȱwill,ȱdassȱnurȱderȱAdressatȱdieȱNachrichtȱliest,ȱmussȱ dieseȱ codieren.ȱ Umgekehrtȱ kannȱ derȱ Empfängerȱ nurȱ dannȱ sicherȱ sein,ȱ dassȱ dieȱ NachrichtȱvomȱangegebenenȱAbsenderȱstammtȱundȱaufȱdemȱWegȱnichtȱverändertȱ wurde,ȱwennȱsieȱverschlüsseltȱundȱmitȱeinerȱSignaturȱversehenȱankommt.ȱ PublicȱKeyȬVerfahrenȱhelfen,ȱdieseȱAnforderungenȱzuȱerfüllenȱundȱgeschäftskritiȬ scheȱ Prozesseȱ ohneȱ Medienbruchȱ überȱ mehrereȱ Systemeȱ zuȱ transportieren.ȱ VorȬ aussetzungȱfürȱdieȱAnwendungȱdieserȱKonzepteȱistȱderȱAufbauȱeinerȱPublicȱKeyȬ Infrastrukturȱ mitȱ einerȱ Zertifizierungsstelle,ȱ dieȱ Nutzerȱ undȱ Rechnerȱ mitȱ einerȱ digitalenȱIdentitätȱausstattet.ȱȱ
4.1.1
Signaturen zur Beweissicherung
Dasȱ Signaturgesetzȱ legtȱ fest,ȱ dassȱ gesetzeskonformeȱ elektronischeȱ Signaturenȱ alsȱ sicherȱ geltenȱ könnenȱ undȱ somitȱ einerȱ Privaturkundeȱ entsprechen.ȱ Dieȱ EchtheitsȬ vermutungȱ mussȱ daherȱ vomȱ Prozessgegnerȱ widerlegtȱ werden.ȱ Elektronischeȱ SigȬ naturenȱgibtȱesȱinȱvierȱArten:ȱ – – – –
ElektronischeȱSignaturȱ FortgeschritteneȱelektronischeȱSignaturȱ QualifizierteȱelektronischeȱSignaturȱ QualifizierteȱelektronischeȱSignaturȱmitȱAnbieterakkreditierungȱ
Fürȱ denȱ praktischenȱ Gebrauchȱ kommenȱ nurȱ dieȱ dreiȱ letztenȱ Formenȱ inȱ Betracht.ȱ FortgeschritteneȱelektronischeȱSignaturenȱkönnenȱzwarȱdurchȱdenȱAnwenderȱerstelltȱ undȱgenutztȱwerden,ȱweisenȱaberȱdieȱgeringsteȱBeweiskraftȱauf.ȱQualifizierteȱelektȬ ronischeȱSignaturenȱwerdenȱweitgehendȱderȱhandschriftlichenȱUnterschriftȱgleichȬ gestellt,ȱ verlangenȱaberȱ einȱ Zertifikat.ȱDieȱletzteȱ Formȱ besitztȱ dieȱ höchsteȱ BeweisȬ kraftȱundȱ – – – – –
122 ȱ
setztȱfürȱdieȱHerstellungȱeinȱspeziellesȱRegistrierungsverfahrenȱvorausȱ mussȱverbindlichȱdurchȱdenȱakkreditiertenȱAnbieterȱhergestelltȱwerdenȱ erfülltȱdieȱKriterienȱderȱAuthentizitätȱundȱIntegritätȱ werdenȱvomȱZertifizierungsanbieterȱ30ȱJahreȱaufbewahrtȱ stellenȱdieȱmitȱihnenȱverknüpftenȱDateienȱderȱSchriftformȱgleichȱ
4.1ȱȱSicherheitȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ Quelle:ȱAuthentiDateȱ
Abbildungȱ4.1:ȱArtenȱderȱelektronischenȱSignaturȱ
MitȱderȱNovellierungȱdesȱSignaturgesetzesȱundȱdenȱAnpassungenȱimȱprivatenȱundȱ öffentlichenȱRechtȱistȱseitȱ2002ȱeinȱLösungsansatzȱfürȱdieȱrechtlicheȱAnerkennungȱ derȱelektronischenȱLangzeitarchivierungȱgegebenȱ[Häber,ȱDujat,ȱS.ȱ26Ȭ27].ȱFürȱalleȱ DokumenteȱundȱBelege,ȱdieȱeineȱdigitaleȱUmwandlungȱerfahren,ȱwirdȱeineȱqualifiȬ zierteȱelektronischeȱSignaturȱverlangt.ȱHintergrundȱist,ȱdasȱeineȱnatürlicheȱPersonȱ dieȱ ordnungsgemäßeȱ Transformationȱ bezeugenȱ kann.ȱ Ausȱ praktischenȱ Gründenȱ wirdȱfürȱhoheȱBelegvoluminaȱeinȱStichprobenverfahrenȱanerkannt.ȱAußerdemȱsindȱ beimȱ Einsatzȱ elektronischerȱ Signaturenȱ einigeȱ Rahmenbedingungenȱ zuȱ beachtenȱ [Häber,ȱDujat,ȱS.ȱ25]:ȱ – ElektronischeȱSignaturenȱsolltenȱaufȱeinemȱlangfristigȱstabilenȱundȱstandarȬ disiertenȱFormatȱberuhen,ȱsoȱdassȱdieȱtechnischenȱKomponentenȱzurȱVerifiȬ zierungȱüberȱdenȱAufbewahrungszeitraumȱhinausȱexistieren.ȱ – AlleȱzurȱVerifizierungȱerforderlichenȱDatenȱmüssenȱbeschafftȱundȱüberȱdenȱ AufbewahrungszeitraumȱinȱberweiskräftigerȱFormȱverfügbarȱsein.ȱDazuȱgeȬ hörenȱnebenȱdenȱSignaturwertenȱweitereȱInformationenȱdieȱdieȱEchtheitȱundȱ Gültigkeitȱ dokumentierenȱ wieȱ Signaturschlüsselzertifikate,ȱ GütigkeitsangaȬ ben,ȱZeitstempelȱoderȱSperren.ȱ – ElektronischȱsignierteȱDokumenteȱmüssenȱerneutȱsigniertȱwerden,ȱwennȱdieȱ zugrundeȱ liegendenȱ Mechanismenȱ undȱ Verfahrenȱ ihreȱ Sicherheitseignungȱ verlieren.ȱ Dazuȱ sindȱ dieȱ Veröffentlichungenȱ derȱ nachȱ demȱ Signaturgesetzȱ zuständigenȱBehördeȱzuȱberücksichtigen.ȱȱ
ȱ
123
4ȱȱECMȱDeliverȬKomponenteȱ DasȱInteresseȱamȱEinsatzȱelektronischerȱSignaturenȱwächstȱinȱeinigenȱBereichȱwieȱ z.B.ȱ beiȱ derȱ Behandlungȱ elektronischerȱ Rechnungen.ȱ Allerdingsȱ existierenȱ beiȱ derȱ elektronischenȱ Rechnungȱ Anforderungen,ȱ dieȱ dasȱ Papiergegenstückȱ nichtȱ kennt.ȱ Wesentlichȱist,ȱdassȱderȱVersenderȱderȱRechnungȱlautȱSignaturgesetzȱdieȱRechnungȱ mitȱ einerȱ qualifiziertenȱ elektronischenȱ Signaturȱ versehenȱ muss,ȱ umȱ dieȱ Integritätȱ undȱ Authentizitätȱ sicherzustellen.ȱ Weiterhinȱ wirdȱ derȱ Empfängerȱ verpflichtet,ȱ gemäßȱGDPdUȱSignaturȱundȱZertifikatȱzuȱprüfen,ȱdieȱPrüfungȱnachzuweisenȱundȱ beidesȱzehnȱJahreȱrevisionssicherȱzuȱarchivieren.ȱDerȱGesetzgeberȱhatȱfaktischȱdaȬ mitȱ festgelegt,ȱ dassȱ dieȱ Einführungȱ elektronischerȱ Rechnungenȱ keineȱ EinbahnȬ strasseȱist,ȱsondernȱdasȱEinverständnisȱderȱPartnerȱvorliegenȱmuss.ȱHäufigȱistȱaberȱ vorȱallemȱeineȱSeiteȱdaranȱinteressiert,ȱmöglichstȱvieleȱPartnerȱfürȱdasȱneueȱVerfahȬ renȱ zuȱ gewinnen.ȱ Diesȱ istȱ dieȱ Stundeȱ externerȱ Dienstleister,ȱ dieȱ alsȱ beauftragteȱ Dritteȱagieren.ȱLautȱUStGȱistȱdieseȱKonstellationȱausdrücklichȱanerkannt.ȱ ȱ ȱ
Beispiel:ȱRechnungenȱperȱInternetȱ Denȱ meistenȱ Unternehmenȱ istȱ derȱ Versandȱ elektronischerȱ Rechnungenȱ zuȱ kompliziert,ȱ daȱ sieȱ mitȱ einerȱ qualifiziertenȱ elektronischenȱ Signatur,ȱ dieȱ vomȱ Finanzamtȱ akzeptiertȱ ist,ȱ ausgestattetȱ seinȱ müssen.ȱ Allerdingsȱ reichtȱesȱnichtȱaus,ȱdieȱRechnungȱmitȱderȱSignaturȱzuȱversehen,ȱderȱEmpȬ fängerȱ mussȱ zusätzlichȱ inȱ derȱ Lageȱ sein,ȱ dasȱ zugehörigeȱ Zertifikatȱ zuȱ verifizieren.ȱErhältȱeinȱUnternehmenȱnunȱRechnungenȱvonȱPartnern,ȱdieȱ unterschiedlicheȱ TrustȬCenterȱ benutzen,ȱ mussȱ jeweilsȱ eineȱ gesonderteȱ Verifizierungȱerfolgen.ȱ
ȱ
4.1.2
Kryptographie
TechnologischeȱBasisȱeinerȱSicherheitsinfrastrukturȱsindȱmathematischeȱVerfahrenȱ zurȱ Verschlüsselung.ȱ Schonȱ imȱ Altertumȱ bestandȱ dasȱ Bedürfnis,ȱ vertraulicheȱ NachrichtenȱeinemȱPartnerȱzukommenȱzuȱlassen.ȱDaȱdieȱTransportwegeȱunsicherȱ waren,ȱentstandenȱVerfahren,ȱdieȱeineȱNachrichtȱ(Klartext)ȱinȱeineȱTransportformȱ (Geheimtext)ȱumwandelten,ȱdieȱvonȱeinemȱunberechtigtenȱLeserȱnichtȱverstandenȱ werdenȱkonnte.ȱErstȱbeimȱEmpfängerȱwurdeȱdieȱchiffrierteȱNachrichtȱinȱdieȱursprüngȬ licheȱFormȱ zurückverwandelt.ȱ Imȱ Computerzeitalterȱ mitȱ denȱ Möglichkeitenȱ einesȱ schnellenȱ Ausprobierensȱ vonȱ Kombinationenȱ könnenȱ dieseȱ VerschlüsselungsverȬ fahrenȱnichtȱdieȱgewünschteȱSicherheitȱbieten.ȱBeiȱderȱKonstruktionȱeinesȱVerfahȬ rensȱmussȱdaherȱdieȱverfügbareȱRechenleistungȱeinbezogenȱwerden.ȱDasȱunbefugȬ teȱEntschlüsselnȱeinerȱNachrichtȱmussȱsovielȱzeitlichenȱundȱmateriellenȱAufwandȱ erfordern,ȱdassȱdieȱentschlüsselteȱNachrichtȱkeinenȱWertȱmehrȱdarstellt.ȱDieȱinterȬ neȱ Darstellungȱ vonȱ Textenȱ inȱ Rechnersystemenȱ geschiehtȱ alsȱ binäreȱ Zahl.ȱ Dieȱ Chiffrierungȱ undȱ Dechiffrierungȱ istȱ folglichȱ alsȱ eineȱ numerischeȱ Operationȱ darȬ
124 ȱ
4.1ȱȱSicherheitȱ stellbar,ȱ dieȱ mitȱ mathematischenȱ Methodenȱ analysiertȱ werdenȱ kann.ȱ ȱ Nebenȱ derȱ PrimfaktorzerlegungȱistȱdieȱTheorieȱelliptischerȱKurvenȱdasȱbevorzugteȱGebiet,ȱausȱ demȱsichȱVerschlüsselungsalgorithmenȱherleitenȱlassen.ȱȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ
K la rte x t N e tz w e rk
v e rs c h lü s s e lte r Text V e rs c h lü s s e lu n g
& ^ $ !@ # l:{Q
E n ts c h lü s s e lu n g
O r ig in a l K la rte x t N e tz w e rk
ȱ Abbildungȱ4.2:ȱkryptographischesȱBasismodellȱ
Aufgrundȱ ihrerȱ unterschiedlichenȱ Eigenschaftenȱ werdenȱ fastȱ ausnahmslosȱ HybȬ ridansätzeȱeingesetzt,ȱdieȱsymmetrischeȱundȱasymmetrischeȱVerschlüsselungsalgoȬ rithmenȱ vereinenȱ undȱ derȱ Familieȱ derȱ parametrisiertenȱ Verfahrenȱ entstammen.ȱ DerȱfürȱeineȱKommunikationsbeziehungȱausgewählteȱSchlüsselȱmussȱdabeiȱjeȱnachȱ Varianteȱvollständigȱoderȱteilweiseȱgeheimȱgehaltenȱwerden.ȱDieȱMengeȱallerȱmögȬ lichenȱ Schlüsselȱ mussȱ eineȱ bestimmteȱ Vielfältigkeitȱ erlauben,ȱ umȱ dieȱ benötigtenȱ Kommunikationsbeziehungenȱ abbildenȱ zuȱ können;ȱ dennȱ werdenȱ häufigȱ ähnlicheȱ Schlüsselȱ generiertȱ oderȱ istȱ derȱ Schlüsselȱ statistischȱ vorhersagbar,ȱ gestaltetȱ sichȱ eineȱEntschlüsselungȱeinfach.ȱ
4.1.3
Symmetrische Verfahren
SymmetrischeȱVerfahrenȱverwendenȱfürȱdieȱVerȬȱundȱEntschlüsselungȱeinenȱidenȬ tischenȱ Schlüssel.ȱ Umȱ dieȱ Sicherheitȱ derȱ Nachrichtȱ zuȱ gewährleisten,ȱ darfȱ derȱ Schlüsselȱ nurȱ denȱ Kommunikationspartnernȱ bekanntȱ sein.ȱ Symmetrischeȱ VerfahȬ renȱ ermöglichenȱ es,ȱ großeȱ Datenmengenȱ zuȱ verschlüsseln,ȱ besitzenȱ jedochȱ denȱ Nachteil,ȱdassȱerstȱeinȱgemeinsamerȱSchlüsselȱzwischenȱdenȱPartnernȱausgetauschtȱ werdenȱmuss.ȱDieȱamȱhäufigstenȱverwendetetȱVerfahrenȱsind:ȱ – RC2,ȱRC4ȱbzw.ȱRC5ȱ(RivestȱCipher)ȱmitȱeinerȱSchlüssellängeȱvonȱ40ȱBitȱbeiȱ RC2ȱundȱLängenȱvonȱ40ȱbisȱ128ȱBitȱbeiȱRC5.ȱȱDerȱAufbauȱvonȱRC4ȱwirdȱvonȱ RSAȱ Dataȱ Securityȱ geheimȱ gehalten,ȱRC5ȱ gehtȱ aufȱ eineȱ Initiativeȱ vonȱNetsȬ capeȱzurück.ȱ – DataȱEncryptionȱSchemeȱ(DES)ȱmitȱeinemȱmaximalȱ56ȱBitȱlangenȱSchlüsselȱ bzw.ȱTripleȬDESȱmitȱ112ȱBitȱwurdeȱ1974ȱvomȱNationalȱBureauȱofȱStandards,ȱ demȱ heutigenȱ Nationalȱ Instituteȱ ofȱ Standardsȱ andȱ Technologyȱ (NIST),ȱ derȱ NationalȱSecurityȱAgencyȱundȱIBMȱentwickeltȱundȱ1977ȱvomȱDoDȱundȱderȱ
ȱ
125
4ȱȱECMȱDeliverȬKomponenteȱ NSAȱ zumȱ öffentlichenȱ Verschlüsselungsstandardȱ erhoben.ȱ DESȱ giltȱ heuteȱ nichtȱmehrȱalsȱsicherȱundȱwurdeȱ2000ȱdurchȱAESȱabgelöst.ȱ – AdvancedȱEncryptionȱStandardȱ(AES)ȱmitȱeinerȱSchlüssellängeȱvonȱ128ȱBitȱ wurdeȱ1997ȱdurchȱdieȱNISTȱaufȱderȱBasisȱeinesȱweltweitenȱWettbewerbesȱinȬ itiiert.ȱ Nachȱ öffentlicherȱ Prüfungȱ gewannenȱ dieȱ belgischenȱ Kryptologenȱ Rijmenȱ undȱ Daemenȱ dieȱ Ausschreibung.ȱ Dieȱ Verschlüsselungȱ erfolgtȱ inȱ mehrerenȱRunden,ȱderenȱgenaueȱAnzahlȱvonȱderȱSchlüsselȬȱundȱBlocklängeȱ abhängigȱist.ȱ BeiȱVerwendungȱ desȱsymmetrischenȱVerfahrensȱ mussȱ derȱSchlüsselȱvorȱ demȱDaȬ tenaustauschȱbeidenȱTeilnehmernȱbekanntȱsein,ȱumȱdieȱVertraulichkeitȱzuȱgewährȬ leisten.ȱ Derȱ sichereȱ Austauschȱ desȱ Schlüsselsȱ stelltȱ somitȱ einȱ Problemȱ dar.ȱ Denȱ SchlüsselȱzusammenȱmitȱderȱchiffriertenȱNachrichtȱzuȱversenden,ȱverbietetȱsichȱausȱ Sicherheitsgründen.ȱ Zurȱ Lösungȱ diesesȱ Verteilungsproblemsȱ existierenȱ mehrereȱ Möglichkeiten:ȱ – Schlüsselaustauschȱ aufȱ nichtelektronischemȱ Weg:ȱ dieȱ Schlüsselȱ werdenȱ aufȱ einemȱ separatenȱ Kommunikationsweg,ȱ z.B.ȱ perȱ Post,ȱ zugestellt.ȱ Dieserȱ AbȬ laufȱistȱnurȱsinnvoll,ȱwennȱdieȱAnzahlȱderȱKommunikationspartnerȱbegrenztȱ istȱundȱimȱVorausȱfeststeht.ȱ – Schlüsselaustauschȱ mitȱ HybridȬVerfahren:ȱ derȱ verwendeteȱ Schlüsselȱ (sessiȬ onȱkey)ȱwirdȱseparatȱmitȱeinemȱasymmetrischenȱVerfahrenȱübertragen.ȱDaȬ beiȱ wirdȱ zumȱ Verschlüsselnȱ derȱ öffentlicheȱ Schlüsselȱ desȱ Empfängersȱ beȬ nutzt.ȱDiesȱhatȱdenȱVorteil,ȱdassȱkeinȱgeheimȱzuȱhaltenderȱSchlüsselȱvorȱderȱ Kommunikationȱ aufȱ einemȱ speziellȱ gesichertenȱ Wegȱ übertragenȱ werdenȱ muss.ȱLediglichȱdieȱrichtigeȱZuordnungȱderȱöffentlichenȱSchlüsselȱmussȱfestȬ stehen.ȱ
ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ Abbildungȱ4.3:ȱAblaufȱderȱsymmetrischenȱVerschlüsselungȱȱ
126 ȱ
4.1ȱȱSicherheitȱ
4.1.4
Asymmetrische Verfahren
AsymmetrischeȱVerfahrenȱverwendenȱzurȱVerȬȱundȱEntschlüsselungȱzweiȱkorresȬ pondierendeȱSchlüssel.ȱNachrichten,ȱdieȱmitȱeinemȱderȱSchlüsselȱchiffriertȱwerden,ȱ könnenȱ ausschließlichȱ mitȱ demȱ dazuȱ korrespondierendenȱ zweitenȱ Schlüsselȱ deȬ chiffriertȱwerden.ȱAusȱdiesemȱGrundȱmussȱeinerȱderȱbeidenȱSchlüsselȱgeheimȱgeȬ haltenȱ werden,ȱ währendȱ derȱ zweiteȱ öffentlichȱ zugänglichȱ seinȱ kann,ȱ vergleichbarȱ demȱ Eintragȱ inȱ einemȱ Telefonbuch.ȱ Wirdȱ eineȱ vertraulicheȱ Nachrichtȱ durchȱ dieȱ Anwendungȱ desȱ öffentlichenȱ Schlüsselsȱ erzeugt,ȱ kannȱ nurȱ derȱ Empfängerȱ dieȱ Nachrichtȱ mitȱ seinemȱ geheimenȱ Schlüsselȱ entschlüsseln.ȱ Dieȱ Schlüsselȱ sindȱ aufȱ GrundȱihrerȱLängeȱvonȱ1024ȱBitȱsehrȱrechenintensivȱundȱeignenȱsichȱdaherȱnurȱfürȱ kleineȱDatenmengen.ȱMehrereȱVerfahrenȱhabenȱsichȱherauskristallisiert:ȱ
ȱ
– DiffieȬHellmanȬVerfahren:ȱDieserȱVorschlagȱwurdeȱ1976ȱvorgestelltȱundȱistȱ damitȱdasȱältesteȱasymmetrischeȱVerfahren.ȱSeineȱSicherheitȱberuhtȱdarauf,ȱ denȱ diskretenȱ Logarithmusȱ fürȱ großeȱ Zahlenȱ zuȱ berechnen.ȱ Dasȱ primäreȱ Einsatzgebietȱ istȱ derȱ Austauschȱ vonȱ Schlüsselinformationen.ȱ Esȱ liegtȱ daherȱ denȱSicherheitsverfahrenȱwieȱInternetȱKeyȱExchangeȱzugrunde.ȱ – RSAȬVerfahren:ȱEsȱistȱdasȱamȱbestenȱuntersuchteȱasymmetrischeȱVerschlüsȬ selungsverfahrenȱ undȱ wurdeȱ 1978ȱ vonȱ Rivest,ȱ Shamirȱ undȱAdlemanȱ veröfȬ fentlicht.ȱSeineȱSicherheitȱstütztȱsichȱaufȱdieȱSchwierigkeit,ȱeineȱgroßeȱnatürȬ licheȱZahlȱzuȱfaktorisieren,ȱd.h.ȱalleȱPrimzahlenȱzuȱfinden,ȱdurchȱdieȱsichȱeiȬ neȱZahlȱohneȱRestȱteilenȱlässt.ȱ
ȱ ȱ ȱ ȱ ȱ ȱ ȱ Abbildungȱ4.4:ȱAblaufȱderȱasymmetrischenȱVerschlüsselungȱ
DaȱasymmetrischeȱVerfahrenȱauchȱinȱumgekehrterȱFormȱangewendetȱwerdenȱkönȬ nen,ȱ istȱ esȱ möglich,ȱ Datenȱ mittelsȱdesȱprivatenȱSchlüsselsȱ zuȱ chiffrierenȱundȱüberȱ denȱ öffentlichenȱ Schlüsselȱ zuȱ entschlüsseln.ȱ Durchȱ diesesȱ Vorgehenȱ lässtȱ sichȱ dieȱ UrheberschaftȱderȱInformationȱeindeutigȱklären.ȱDaȱesȱzuȱrechenintensivȱwäre,ȱeinȱ gesamtesȱDokumentȱzuȱverschlüsseln,ȱwirdȱfürȱdasȱDokumentȱimȱSinneȱeinesȱFinȬ gerabdruckesȱmitȱeinemȱHashverfahrenȱeinȱBitmusterȱerzeugt,ȱdasȱdenȱAnspruchȱ
ȱ
127
4ȱȱECMȱDeliverȬKomponenteȱ erhebt,ȱalleȱjemalsȱerstelltenȱundȱzuȱerstellendenȱDokumenteȱeindeutigȱkennzeichȬ nenȱ zuȱ können.ȱ Dieseȱ Verfahrenȱ habenȱ denȱ Sinn,ȱ schonȱ geringfügigsteȱ VerändeȬ rungȱ anȱ denȱ Ursprungsdaten,ȱ etwaȱ dieȱ Verschiebungȱ einerȱ Kommastelleȱ desȱ Kaufpreises,ȱ sichtbarȱ zuȱ machen,ȱ d.h.ȱ esȱ gibtȱ keineȱ zweiȱ nichtidentischenȱ DokuȬ mente,ȱ dieȱ denȱ gleichenȱ Hashwertȱ aufweisen.ȱ Hashfunktionenȱ reduzierenȱ einȱ beȬ liebigȱ langesȱ Dokumentȱ inȱ einenȱ Wertȱ festerȱ Längeȱ (Hashwert,ȱ Messageȱ Digest),ȱ ausȱdemȱdieȱoriginaleȱNachrichtȱnichtȱzurückȱgewonnenȱwerdenȱkann.ȱȱ
4.1.5
Hybride Verschlüsselungsverfahren
Symmetrischeȱ Verfahrenȱ besitzenȱ dieȱ Schwierigkeit,ȱ denȱ Schlüsselȱ aufȱ geheimemȱ Wegȱ austauschenȱ zuȱ müssen.ȱ Asymmetrischeȱ Verfahrenȱ behebenȱ zwarȱ diesesȱ Problem,ȱbenötigenȱaberȱsehrȱvielȱRechenleistungȱfürȱdieȱVerȬȱundȱEntschlüsselung.ȱ HybrideȱVerfahrenȱversuchen,ȱdieȱNachteileȱbeiderȱKonzepteȱzuȱkompensieren.ȱInȱ derȱRegelȱverwendenȱsieȱdieȱasymmetrischeȱVerschlüsselungȱlediglichȱfürȱdieȱIniȬ tialisierungȱ einerȱ Sitzungȱ undȱ schwenkenȱ dannȱ aufȱ dasȱ symmetrischeȱ Verfahrenȱ um.ȱȱ SeienȱAliceȱundȱBob6ȱdieȱbeidenȱKommunikationspartner.ȱUmȱeineȱsichereȱ NachrichtȱanȱBobȱzuȱversenden,ȱbenötigtȱAliceȱeinenȱöffentlichenȱSchlüssel.ȱ Dieserȱ liegtȱ üblicherweiseȱ inȱ einemȱ Verzeichnis,ȱ inȱ demȱ erȱ allgemeinȱ zuȬ gänglichȱ ist.ȱ Aliceȱ verschlüsseltȱ nunȱ dieȱ Nachrichtȱ mitȱ demȱ öffentlichenȱ Schlüsselȱ undȱ unterschreibtȱ mitȱ ihremȱ privaten,ȱ d.h.ȱ geheimenȱ Schlüssel.ȱ Dadurchȱ kannȱ Bobȱ durchȱ Vergleichȱ mitȱ demȱ öffentlichenȱ Schlüsselȱ vonȱ Aliceȱ derenȱ eindeutigeȱ Identitätȱ feststellen.ȱ Entsprechendȱ kannȱ dieȱ vonȱ AliceȱverschlüsselteȱNachrichtȱnurȱBobȱlesen,ȱdaȱerȱdenȱdazuȱnotwendigenȱ geheimenȱSchlüsselȱbesitzt.ȱȱ FolglichȱläuftȱdasȱVerfahrenȱinȱdreiȱSchrittenȱab:ȱ – ZunächstȱerzeugtȱAliceȱeinenȱzufälligenȱgeheimenȱSchlüsselȱundȱverschlüsȬ seltȱdiesenȱmitȱdemȱöffentlichenȱSchlüsselȱvonȱBobȱ – Dannȱwirdȱderȱverschlüsselte,ȱgeheimeȱSchlüsselȱanȱBobȱübertragenȱ – Bobȱ entschlüsseltȱ denȱ geheimenȱ Schlüsselȱ vonȱ Aliceȱ mitȱ seinemȱ geheimenȱ SchlüsselȱundȱistȱnunȱimȱBesitzȱvonȱAlicesȱGeheimnis.ȱ Dasȱ hybrideȱ Verfahrenȱ nutztȱ dasȱ asymmetrischeȱ Verfahren,ȱ umȱ einenȱ geheimenȱ Schlüsselȱ zuȱ übermitteln.ȱ Sindȱ beideȱ Kommunikationspartnerȱ imȱ Besitzȱ derȱ geȬ heimenȱ Schlüssel,ȱ setzenȱ sieȱ dasȱ symmetrischeȱ Verfahrenȱ fürȱ dieȱ DatenübertraȬ gungȱein.ȱ ȱ
ȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱ 6
ȱ
DieseȱNamenȱwerdenȱseitȱDiffie/Hellmanȱverwendetȱ
128 ȱ
4.1ȱȱSicherheitȱ
4.1.6
Hashfunktionen
JederȱEmpfängerȱsollteȱinȱderȱLageȱsein,ȱzuȱverifizieren,ȱobȱdieȱDatenȱvomȱ„wahȬ ren“ȱAbsenderȱstammenȱundȱobȱwährendȱderȱÜbermittlungȱManipulationenȱvorȬ genommenȱwurden.ȱEineȱHashfunktionȱermöglichtȱdieȱErstellungȱeinerȱnichtȱmaȬ nipulierbarenȱ Prüfsummeȱ fürȱ eineȱ Datenfolgeȱ bzw.ȱ einȱ Dokument.ȱ Dieseȱ PrüfȬ summeȱkannȱalsȱ„Fingerabdruck“ȱeinerȱNachrichtȱinterpretiertȱwerden.ȱDieȱHashȬ funktionȱ selbstȱ bildetȱ eineȱ Informationȱ beliebigenȱ Umfangsȱ aufȱ einenȱ Hashwertȱ festerȱ Längeȱ ab.ȱ Derȱ entstehendeȱ Wertȱ bildetȱ dasȱ Komprimatȱ desȱ Datenblocks.ȱ DamitȱdieȱHashfunktionȱfürȱeinenȱsicherenȱkrytographischenȱEinsatzȱgeeignetȱist,ȱ mussȱsieȱzweiȱBedingungenȱerfüllen:ȱ – Jedeȱ Hashfunktionȱ mussȱ kollisionsfreiȱ sein,ȱ d.h.ȱ esȱ mussȱ unmöglichȱ sein,ȱ zweiȱDatenblöckeȱzuȱfinden,ȱdieȱdenȱgleichenȱHashwertȱerzeugenȱ – JedeȱHashfunktionȱmussȱeineȱEinwegfunktionȱsein,ȱd.h.ȱesȱmussȱnurȱmitȱeiȬ nemȱ unvertretbarȱ hohenȱ Rechenaufwandȱ möglichȱ sein,ȱ denȱ Datenblockȱ wiederherzustellen,ȱ derȱ dieseȱ Prüfsummeȱ ergebenȱ hat.ȱ Dieseȱ Anforderungȱ beinhaltet,ȱdassȱdieȱUmkehrfunktionȱzurȱHashfunktionȱnichtȱzuȱbestimmenȱ ist.ȱHierinȱliegtȱdieȱSicherheitȱdesȱVerfahrensȱbegründet.ȱ Hashfunktionenȱsindȱnichtȱgeheim.ȱDieȱwichtigstenȱsind:ȱ – MessageȱDigestȱ5ȱ(MD5):ȱeineȱ1991ȱvonȱRivestȱentwickelteȱFunktionȱmitȱeiȬ nemȱ128ȱBitȱHashwertȱ – Secureȱ Hashȱ Algorithmȱ 1ȱ (SHAȬ1):ȱ mitȱ einemȱ 160ȱ Bitȱ Hashwert,ȱ dasȱ geȬ genwärtigȱalsȱsicherstesȱVerfahrenȱgiltȱ – MessageȱAuthentificationȱCodeȱ(MAC):ȱeineȱbesondereȱArtȱeinerȱHashȬ funktion,ȱdaȱsieȱvonȱeinemȱParameterȱabhängigȱist,ȱderȱz.B.ȱdasȱPasswortȱdesȱ AbsendersȱoderȱseinȱgeheimerȱSchlüsselȱseinȱkann.ȱDieseȱFunktionȱwirdȱfürȱ dieȱsimultaneȱÜberprüfungȱderȱDatenintegritätȱundȱderȱAuthentifizierungȱ verwendet.ȱ DerȱVerfahrensablaufȱstelltȱsichȱwieȱfolgtȱdar:ȱBeideȱKommunikationspartnerȱmüsȬ senȱ zunächstȱ eineȱ übereinstimmendeȱ Hashfunktionȱ auswählen.ȱ Dannȱ berechnetȱ derȱ Absenderȱ ausȱ denȱ zuȱ übertragendenȱ Datenȱ einenȱ Hashwertȱ gemäßȱ dieserȱ Funktion.ȱ Dieseȱ Prüfsummeȱ wirdȱ amȱ Abschlussȱ derȱ eigentlichenȱ DatenübertraȬ gungȱanȱdenȱEmpfängerȱübermittelt.ȱDerȱEmpfängerȱbildetȱnunȱausȱdenȱerhaltenenȱ DatenȱnachȱdemȱgleichenȱVerfahrenȱdenȱHashwertȱundȱvergleichtȱdenȱberechnetenȱ mitȱ demȱ empfangenenȱ Wert.ȱ Ergibtȱ sichȱ eineȱ Übereinstimmung,ȱ tratȱ aufȱ demȱ ÜbertragungswegȱkeineȱManipulationȱauf.ȱ EinȱweitererȱAspektȱistȱdieȱFrage,ȱobȱdieȱDatenȱvomȱ„wahren“ȱAbsenderȱstammen.ȱ Dieseȱ Prüfungȱ kannȱ ebenfallsȱ mitȱ demȱ Hashverfahrenȱ vorgenommenȱ werden.ȱ DazuȱbenutzenȱbeideȱKommunikationspartnerȱdieȱgleicheȱHashfunktionȱundȱeinenȱ geheimenȱSchlüssel,ȱderȱnurȱihnenȱbekanntȱist.ȱNachȱdemȱMACȬKonzeptȱberechnetȱ derȱAbsenderȱdenȱHashwertȱausȱdenȱzuȱübertragendenȱDatenȱundȱdemȱSchlüsselȱ undȱ übermitteltȱ denȱ erzeugtenȱ Wertȱ amȱ Endeȱ derȱ Übertragung.ȱ Derȱ Empfängerȱ
ȱ
129
4ȱȱECMȱDeliverȬKomponenteȱ gehtȱ nachȱ demȱ gleichenȱ Schemaȱ vor.ȱ Daȱ nurȱ erȱ denȱ geheimenȱ Schlüsselȱ kennt,ȱ kannȱauchȱnurȱerȱdenȱHashwertȱberechnenȱundȱmitȱdemȱerhaltenenȱWertȱvergleiȬ chen.ȱ
4.1.7
Digitale Signatur
DigitaleȱSignaturenȱkönnenȱalsȱGegenstückȱzurȱhandgeschriebenenȱSignaturȱangeȬ sehenȱ werden.ȱ Mitȱ einerȱ Unterschriftȱ unterȱ einȱ Dokumentȱ bestätigtȱ derȱ UnterȬ zeichnende,ȱsichȱdesȱInhaltsȱdesȱSchriftstücksȱbewusstȱzuȱsein.ȱDerȱLeserȱdesȱDoȬ kumentesȱ kannȱ somitȱ dieȱ Authentizitätȱ undȱ Verbindlichkeitȱ feststellen.ȱ Mitȱ derȱ eigenhändigenȱUnterschriftȱwerdenȱdabeiȱdieȱfolgendenȱEigenschaftenȱverbunden:ȱ BeimȱUnterschreiben:ȱ 1. dieȱangegebeneȱIdentitätȱwirdȱdurchȱdieȱUnterschriftȱauthentisch,ȱ 2. derȱ Signierendeȱ mussȱ durchȱ eineȱ Aktionȱ (dieȱ Unterschriftbildung)ȱ seinenȱ Willenȱbekräftigen,ȱ 3. derȱSignierendeȱbestätigtȱdurchȱseineȱUnterschriftȱobjektivȱdenȱGegenstandȱ dessen,ȱ wasȱ unterschriebenȱ werdenȱ soll,ȱ undȱ zwarȱ durchȱ dieȱ Position,ȱ anȱ derȱdieȱUnterschriftȱangebrachtȱwird,ȱ 4. derȱ Signierendeȱ bestätigtȱ durchȱ seineȱ Unterschriftȱ subjektivȱ (alsoȱ durchȱ seineȱInterpretationȱdesȱInhaltes)ȱdieȱIntegritätȱdessen,ȱwasȱerȱnachȱ3.ȱunterȬ schreibt.ȱ BeimȱPrüfen:ȱ 1. dieȱbeteiligtenȱIdentitätenȱwerdenȱerkannt,ȱ 2. dieȱ Unterschriftȱ kannȱ aufȱ Echtheitȱ undȱ damitȱ dieȱ Authentizitätȱ überprüftȱ werden,ȱdaȱdieȱUnterschriftȱindividuellȱist,ȱ 3. dieȱvomȱUnterzeichnerȱgeleisteteȱUnterschriftȱkannȱnichtȱgeleugnetȱwerden,ȱ daȱsieȱindividuellȱist,ȱ 4. derȱ Inhaltȱ kannȱ aufȱ Integritätȱ (z.ȱ B.ȱ nachträglicheȱ Änderungen)ȱ überprüftȱ werden,ȱ 5. esȱkannȱfestgestelltȱwerden,ȱobȱdasȱOriginaldokumentȱoderȱeineȱKopieȱvorȬ liegt.ȱ Dieȱ digitaleȱ Signaturȱ sollȱ nunȱ alleȱ Eigenschaftenȱ mitȱ größererȱ Praktikabilitätȱ undȱ Manipulationssicherheitȱ nachbilden.ȱ Digitaleȱ Signaturenȱ erfüllenȱ daherȱ dreiȱ AufȬ gaben:ȱȱ – sieȱerlaubenȱdieȱIdentifikationȱdesȱAbsenders,ȱȱ – sieȱsichernȱdieȱIntegritätȱderȱDatenȱȱ – sieȱvermittelnȱeineȱWillenserklärungȱdurchȱdieȱUnterschriftsfunktion.ȱ DieȱDigitaleȱSignaturȱistȱeinȱasymmetrischesȱVerfahren.ȱDiesȱbedeutet,ȱdassȱbeiȱderȱ SignaturbildungȱeinȱandererȱSchlüsselȱeingesetztȱwirdȱalsȱbeiȱderȱSignaturprüfung.ȱ Mitȱ demȱ privatenȱ Schlüsselȱ –ȱ undȱ nurȱ mitȱ diesemȱ –ȱ kannȱ eineȱ digitaleȱ Signaturȱ erzeugtȱ undȱ mitȱ demȱ zugehörigenȱ öffentlichenȱ Schlüsselȱ –ȱ undȱ nurȱ mitȱ diesemȱ –ȱ verifiziertȱ werden.ȱ Willȱ manȱ zusätzlichȱ Authentizitätȱ derȱ öffentlichenȱ Schlüsselȱ
130 ȱ
4.1ȱȱSicherheitȱ sicherstellen,ȱ bedarfȱ esȱ einerȱ Sicherungsinfrastrukturȱ mitȱ einemȱ „VertrauenswürȬ digenȱ DrittenȈ,ȱ derȱ dieȱ Zuordnungȱ einerȱ Personȱ zuȱ einemȱ öffentlichenȱ Schlüsselȱ durchȱeinȱZertifikatȱbestätigt.ȱȱ
ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ Abbildungȱ4.5:ȱPrinzipȱderȱdigitalenȱSignaturȱ
Beiȱ derȱ Signaturbildungȱ werdenȱ dieȱ zuȱ signierendenȱ Datenȱ mittelsȱ einesȱ HashȬ verfahrensȱ aufȱ einenȱ charakteristischenȱ Wert,ȱ demȱ soȱ genanntenȱ Fingerabdruck,ȱ komprimiert.ȱ Dieserȱ Fingerabdruckȱ wirdȱ anschließendȱ unterȱ Verwendungȱ desȱ privatenȱSchlüsselsȱdesȱUnterzeichnersȱsigniert.ȱAlsȱErgebnisȱerhältȱmanȱdieȱSignaȬ tur,ȱdieȱzusammenȱmitȱdenȱunterschriebenenȱDatenȱanȱdenȱEmpfängerȱübertragenȱ wird.ȱ ȱ ȱ ȱ ȱ ȱ
ȱ
131
4ȱȱECMȱDeliverȬKomponenteȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ Quelle:ȱLeitfadenȱElektronischeȱSignaturȱȬȱVersionȱ5ȱȬȱ©ȱ2008ȱSignatureȱPerfectȱKGȱ
Abbildungȱ4.6:ȱSignaturbildungȱ
Derȱ Empfängerȱ mussȱ beiȱderȱ Signaturprüfungȱausȱdenȱ betreffendenȱ Datenȱ ebenȬ fallsȱdenȱFingerabdruckȱberechnenȱundȱanschließendȱfeststellen,ȱobȱdieȱmitgeteilteȱ Signaturȱ zuȱ demȱ neuȱ berechnetenȱ Hashwertȱ undȱ demȱ öffentlichenȱ Schlüsselȱ desȱ Unterzeichnersȱgehört.ȱWurdenȱdieȱzuȱprüfendenȱDatenȱverändertȱ (IntegritätsverȬ lust)ȱoderȱeinȱfalscherȱoderȱungültigerȱöffentlicherȱSchlüsselȱ(Authentizitätsverlust)ȱ verwendet,ȱsoȱfälltȱdieseȱÜberprüfungȱnegativȱaus.ȱ
Quelle:ȱLeitfadenȱElektronischeȱSignaturȱȬȱVersionȱ5ȱȬȱ©ȱ2008ȱSignatureȱPerfectȱKGȱ
Abbildungȱ4.7:ȱSignaturprüfungȱȱ
132 ȱ
4.1ȱȱSicherheitȱ
4.1.8
Authentifizierung
UnterȱAuthentifizierungȱistȱderȱVorgangȱzuȱverstehen,ȱbeiȱdemȱeinȱKommunikatiȬ onspartnerȱprüft,ȱobȱerȱmitȱdemjenigenȱeineȱVerbindungȱunterhält,ȱderȱseinȱ„wahȬ rer“ȱGegenüberȱseinȱsollte.ȱZweiȱArtenȱlassenȱsichȱunterscheiden:ȱ 1. 2.
Dieȱ einmaligeȱ Authentifizierungȱ vorȱ derȱ Übertragungȱ verlangtȱ denȱ AusȬ weisȱüberȱPasswortȱoderȱdieȱAbfrageȱeinesȱZertifikatsȱ Dieȱ fortlaufendeȱ Authentifizierungȱ prüftȱ dieȱ Identitätȱ desȱ KommunikatiȬ onspartnersȱnachȱErhaltȱjedenȱDatenblocks.ȱHierzuȱdienenȱdigitaleȱSignatuȬ renȱundȱspezielleȱHashfunktionen.ȱ
Dieȱ Verwendungȱ vonȱ Passwörternȱ giltȱ allgemeinȱ alsȱ schwacheȱ SicherheitsmaßȬ nahme.ȱ Umȱ eineȱ sichereȱ Authentifizierungȱ zuȱ garantieren,ȱ werdenȱ daherȱ krytoȬ graphischeȱ Verfahrenȱ herangezogen.ȱ Derȱ Einsatzȱ vonȱ Zertifikatenȱ undȱ dasȱ ChalȬ lengeȬVerfahrenȱhabenȱsichȱhierzuȱalsȱadäquateȱMittelȱherausgeschält.ȱ Dasȱ ChallengeȬVerfahrenȱ basiertȱ aufȱ einerȱ Hashfunktion.ȱ Dazuȱ generiertȱ derȱ Überprüferȱ eineȱ Zufallsfolgeȱ undȱ sendetȱ sieȱ anȱ seinenȱ Partner.ȱ Dieserȱ berechnetȱ ausȱ dieserȱ Folgeȱ undȱ seinemȱ Passwortȱ –ȱ dasȱ auchȱ demȱ Überprüferȱ bekanntȱ istȱ –ȱ denȱHashwertȱundȱüberträgtȱihnȱanȱdenȱAbsenderȱzurück.ȱDieserȱwendetȱdasȱgleiȬ cheȱ Verfahrenȱ anȱ undȱ vergleichtȱ denȱ berechnetenȱ mitȱ demȱ erhaltenenȱ Hashwert.ȱ NurȱbeiȱÜbereinstimmungȱkannȱderȱÜberprüferȱsicherȱsein,ȱmitȱdemȱangestrebtenȱ Partnerȱzuȱkommunizieren.ȱȱ
4.1.9
Zertifikate
Derȱ wichtigsteȱ Bestandteilȱ desȱ asymmetrischenȱ Verfahrensȱ bestehtȱ darin,ȱ dassȱ jederȱderȱbeidenȱKommunikationspartnerȱdemȱanderenȱseinenȱöffentlichenȱSchlüsȬ selȱzurȱVerfügungȱstellenȱmuss.ȱWieȱkannȱaberȱjederȱTeilnehmerȱsicherȱsein,ȱdassȱ derȱ öffentlicheȱ Schlüsselȱ auchȱ demȱ Absenderȱ gehört,ȱ derȱ erȱ vorgibtȱ zuȱ sein?ȱ Umȱ einemȱMissbrauchȱvorzubeugen,ȱmussȱjederȱöffentlicheȱSchlüsselȱdurchȱeinȱZertifiȬ katȱbeglaubigtȱwerden.ȱ Fürȱ dieȱ Ausstellungȱ undȱ Publikationȱ desȱ öffentlichenȱ Schlüsselsȱ bedarfȱ esȱ einerȱ vertrauenswürdigenȱInstanzȱ–ȱderȱZertifizierungsstelleȱ(CAȱCertificationȱAuthoriȬ ty).ȱ Aufgabeȱ dieserȱ Instanzȱ istȱ dieȱ Beglaubigung,ȱ dassȱ derȱ publizierteȱ öffentlicheȱ Schlüsselȱ demȱ angegebenenȱ Inhaberȱ gehört.ȱ Dieseȱ Bestätigungȱ erfolgtȱ durchȱ einȱ digitalesȱZertifikat.ȱNebenȱderȱVergabeȱvonȱZertifikatenȱgehörtȱauchȱdasȱPublizieȬ renȱundȱdasȱSperrenȱungültigerȱZertifikateȱzuȱdenȱKernaufgabenȱeinerȱCA.ȱ FürȱdieȱdigitaleȱSignaturȱsindȱdurchȱdasȱSignaturgesetzȱgesetzlicheȱRahmenbedinȬ gungenȱ geschaffenȱ worden.ȱ Alsȱ gesetzlicheȱ digitaleȱ Signaturȱ giltȱ demnachȱ eineȱ Kombinationȱ vonȱ öffentlichemȱ undȱ privatemȱ Schlüssel,ȱ dieȱ vonȱ einerȱ ZertifizieȬ rungsstelleȱverwaltetȱwird.ȱUmȱerstmalsȱeinȱSignaturschlüsselȬZertifikatȱzuȱerhalȬ ten,ȱ mussȱ derȱ Antragstellerȱ sichȱ beiȱ einerȱ Annahmestelleȱ einerȱ behördlichȱ genehȬ migtenȱ Zertifizierungsstelleȱ ausweisenȱ undȱ einenȱ schriftlichenȱ Antragȱ einreichen.ȱ Vertretungsrechte,ȱ Vollmachtenȱ undȱ berufsrechtlicheȱ Zulassungenȱ könnenȱ inȱ eiȬ
ȱ
133
4ȱȱECMȱDeliverȬKomponenteȱ nemȱ zusätzlichenȱ AttributȬZertifikatȱ aufgenommenȱ werden.ȱ Mitȱ einemȱ ZeitstemȬ pelȱ bescheinigtȱ dieȱ Zertifizierungsstelle,ȱ dassȱ ihrȱ bestimmteȱ Datenȱ zuȱ einemȱ beȬ stimmtenȱ Zeitpunktȱ vorgelegenȱ haben.ȱ Damitȱ wirdȱ einȱ VorȬȱ oderȱ Rückdatierenȱ verhindert,ȱwasȱimȱStreitfallȱbeweiserheblichȱist.ȱ DasȱEuropäischeȱParlamentȱhatȱimȱNovemberȱ1999ȱdieȱRichtlinieȱfürȱgemeinsameȱ Rahmenbedingungenȱ fürȱ elektronischeȱ Signaturenȱ verabschiedet.ȱ Anȱ Stelleȱ desȱ deutschenȱGenehmigungsverfahrensȱistȱeinȱÜberwachungsverfahrenȱgetreten,ȱdasȱ eineȱ Haftpflichtȱ fürȱ Schädenȱ umfasst,ȱ dieȱ durchȱ unrichtigȱ ausgestellteȱ Zertifikateȱ entsteht.ȱ Zweckȱ dieserȱ Richtlinieȱ istȱ dieȱ Schaffungȱ einesȱ europaweitenȱ Standardsȱ alsȱ Ersatzȱ fürȱ dieȱ handschriftlicheȱ Unterschrift.ȱ Dieȱ fortgeschritteneȱ elektronischeȱ SignaturȱistȱausschließlichȱdemȱUnterzeichnerȱzugeordnet,ȱermöglichtȱdieȱIdentifiȬ zierungȱdesȱUnterzeichnersȱundȱistȱmitȱMittelnȱerstellt,ȱdieȱderȱUnterzeichnerȱunterȱ alleinigerȱ Kontrolleȱ hält.ȱ Dieȱ Signaturȱ wirdȱ derartȱ mitȱ denȱ Datenȱ verknüpft,ȱ dassȱ eineȱnachträglicheȱVeränderungȱsofortȱerkanntȱwird.ȱUmȱdieseȱAnforderungenȱinȱ deutschesȱRechtȱzuȱüberführen,ȱistȱeinȱÄnderungsentwurfȱbezüglichȱdesȱursprüngȬ lichenȱ Signaturgesetzesȱ notwendig.ȱ Dieserȱ siehtȱ zweiȱ Typenȱ vonȱ ZertifizierungsȬ stellenȱ vor:ȱ freiwilligȱ akkreditierteȱ undȱ angemeldete.ȱ Beideȱ vergebenȱ qualifizierteȱ Zertifikateȱ nachȱ denȱ Anforderungenȱ derȱ Signaturrichtlinieȱ mitȱ demȱ Unterschied,ȱ dassȱ dieȱ freiwilligȱ akkreditierteȱ Zertifizierungsstelleȱ vonȱ derȱ Aufsichtsbehördeȱ geprüftȱistȱundȱdieȱangemeldeteȱZertifizierungsstelleȱnurȱangemeldetȱist.ȱDieȱausȬ gestelltenȱSignaturenȱunterscheidenȱsichȱinȱeinemȱwesentlichenȱPunkt:ȱdieȱQualitätȱ derȱ elektronischenȱ Signaturenȱ derȱ lediglichȱ angemeldetenȱ Zertifizierungsstelleȱ beruhtȱaufȱErklärungenȱderȱUnternehmen,ȱdieȱdieȱdafürȱbenötigtenȱProdukteȱundȱ Dienstleistungenȱ anbieten,ȱ währendȱ dieȱ Signaturenȱ derȱ freiwilligȱ akkreditiertenȱ Zertifizierungsstelleȱ durchȱ unabhängigeȱ Dritteȱ geprüft,ȱ bestätigtȱ undȱ dokumenȬ tiertȱsind.ȱȱȱ MitȱsteigendemȱBedarfȱanȱDatensicherheitȱundȱDatenschutzȱnimmtȱauchȱdieȱNotȬ wendigkeitȱ zu,ȱ Verschlüsselungsverfahrenȱ einzusetzen.ȱ Insbesondereȱ beiȱ DokuȬ mentenȱ mitȱ Langzeitspeicherungȱ ergibtȱ sichȱ hierausȱ einȱ Problem,ȱ daȱ auchȱ nachȱ einerȱlangenȱZeitspanneȱdieȱVertraulichkeitȱnochȱbestehenȱundȱauchȱdieȱEntschlüsȬ selungȱ gewährleistetȱ seinȱ muss.ȱ Danebenȱ istȱ zuȱ bedenken,ȱ dassȱ derȱ VerschlüsseȬ lungsvorgangȱalsȱsolcherȱsehrȱrechenintensivȱistȱundȱdaherȱausreichendeȱRessourȬ cenȱverlangt.ȱ Einȱ Zertifikatȱ istȱ einȱ genormtes,ȱ digitalesȱ Dokument,ȱ dasȱ dieȱ Zuordnungȱ einesȱ öffentlichenȱSchlüsselsȱzuȱeinerȱjuristischenȱPerson,ȱzuȱeinerȱHardȬȱoderȱSoftwareȬ einheitȱmitȱHilfeȱeinerȱdigitalenȱSignaturȱerlaubt.ȱȱ Zertifikateȱ folgenȱ demȱ Standardȱ X.509ȱ derȱ ITUȱ undȱ enthaltenȱ ähnlicheȱ Angabenȱ wieȱ einȱ Personalausweis:ȱ Zertifizierungsstelle,ȱ Gültigkeitsdauer,ȱ Name,ȱ ZertifiȬ katsnummer,ȱöffentlichenȱSchlüsselȱdesȱZertifikatsinhabers,ȱSignaturȱderȱZertifizieȬ rungsstelle.ȱ Einȱ Zertifikatȱ istȱ damitȱ eineȱ Artȱ digitalerȱ Ausweisȱ mitȱ integriertemȱ Schlüssel,ȱ derȱ vonȱ einerȱ Zertifizierungsstelleȱ überprüftȱ undȱ „gestempelt“ȱ wurde.ȱ Zertifikateȱ sindȱ imȱ Gegensatzȱ zumȱ privatenȱ Schlüsselȱ fürȱ dieȱ Öffentlichkeitȱ geȬ
134 ȱ
4.1ȱȱSicherheitȱ dacht.ȱ Sieȱ werdenȱ veröffentlicht,ȱ damitȱ derȱ darinȱ enthalteneȱ öffentlicheȱ Schlüsselȱ anderenȱ Personenȱ fürȱ dieȱ Verschlüsselungȱ derȱ Datenȱ undȱ dieȱ Überprüfungȱ vonȱ Signaturenȱdienenȱkann.ȱ Zurȱ Signierungȱ wirdȱ einȱ Hashwertȱ ausȱ allenȱ Angabenȱ desȱ Zertifikatsȱ außerȱ demȱ SignaturalgorithmusȱundȱderȱSignaturȱgebildet.ȱDieserȱwirdȱmitȱeinemȱasymmetriȬ schenȱVerschlüsselungsverfahrenȱcodiertȱundȱalsȱSignaturȱimȱZertifikatȱgespeichert.ȱ NachȱwelchemȱAlgorithmusȱdieȱSignaturȱerrechnetȱwurde,ȱwirdȱimȱFeldȱSignaturȬ algorithmusȱabgelegt.ȱDaȱausȱdemȱHashwertȱdasȱursprünglicheȱunsignierteȱZertiȬ fikatȱ nichtȱ ermitteltȱ werdenȱ kann,ȱ istȱ eineȱ Fälschungȱ desȱ öffentlichenȱ Schlüsselsȱ unmöglich.ȱUmȱeinȱZertifikatȱzuȱerhalten,ȱsindȱmehrereȱSchritteȱnotwendig:ȱ 1. 2. 3. 4. 5.
AntragstellungȱdesȱTeilnehmersȱbeiȱderȱzuständigenȱRegistrierungsinstanzȱ derȱZertifizierungsstelle.ȱ IdentifizierungȱdesȱTeilnehmersȱ Schlüsselgenerierungȱ undȱ Zertifikatserstellungȱ durchȱ dieȱ derȱ ZertifizieȬ rungsstelleȱzugeordnetenȱSchlüsselerzeungsungsinstanzȱ Personalisierung,ȱ d.h.ȱ Übergabeȱ vonȱ Zertifikatȱ undȱ privatemȱ Schlüsselȱ anȱ einenȱService,ȱderȱeinȱSicherheitsmediumȱz.B.ȱinȱFormȱeinerȱChipkarteȱmitȱ demȱZertifikatȱundȱSchlüsselȱerzeugt.ȱ Veröffentlichungȱ desȱ Zertifikatsȱ inȱ einemȱ Verzeichnisdienst,ȱ derȱ überȱ öfȬ fentlicheȱNetzeȱerreichbarȱist.ȱ
EinȱZertifikatȱistȱgültig,ȱwennȱesȱfolgendeȱBedingungenȱerfüllt:ȱ – eineȱvertrauenswürdigeȱInstanzȱhatȱdasȱZertifikatȱsigniertȱ – dieȱIntegritätȱdesȱZertifikatsȱistȱgegebenȱ – dasȱZertifikatȱliegtȱinȱseinemȱGültigkeitsraumȱ – dasȱZertifikatȱistȱnichtȱgesperrtȱ Fürȱ eineȱ Sperreȱ kannȱ esȱ mehrereȱ Gründeȱ geben.ȱ Soȱ könnenȱ sichȱ dieȱ Angabenȱ imȱ Zertifikatȱ geändertȱ habenȱ oderȱ esȱ bestehtȱ derȱ begründeteteȱ Verdachtȱ desȱ MissȬ brauchs.ȱ ȱ ȱ ȱ
ȱ ȱ ȱ ȱ ȱ
ȱ
135
4ȱȱECMȱDeliverȬKomponenteȱ
Abbildungȱ4.8:ȱZertifikatȱȱ
4.1.10 Public Key Infrastruktur PublicȬKeyȬInfrastrukturȱ (PKI)ȱ istȱ einȱ umfassendesȱ Sicherheitssystem,ȱ dasȱ sichȱ digitalerȱZertifikateȱbedient,ȱumȱAnwenderȱzuȱidentifizieren,ȱdenȱZugangȱzuȱResȬ sourcenȱzuȱkontrollierenȱundȱDateienȱbzw.ȱDokumenteȱzuȱverschlüsselnȱundȱdigiȬ talȱzuȱsignierenȱ[CWȱ2004].ȱȱ DamitȱdieseȱInfrastrukturȱreibungslosȱabläuft,ȱbedarfȱesȱeinigerȱKomponenten:ȱ – DieȱZertifizierungsstelleȱgibtȱdieȱdigitalenȱZertifikateȱundȱdieȱSchlüsselpaaȬ reȱaus,ȱpubliziertȱdenȱöffentlichenȱSchlüsselȱundȱverwaltetȱdiese.ȱAußerdemȱ verifiziertȱsieȱaufȱAnfrageȱdieȱvonȱihrȱausgestelltenȱZertifikate.ȱȱ – Dieȱ Registrierungsstelleȱ stelltȱdieȱSchnittstelleȱzwischenȱNutzerȱundȱZertiȬ fizierungsstelleȱdar.ȱSieȱüberprüftȱdieȱIdentitätȱderȱNutzer,ȱsoȱdassȱsicherȱgeȬ stelltȱist,ȱdassȱderȱöffentlicheȱSchlüsselȱundȱdasȱdigitaleȱZertifikatȱdemȱNutȬ zerȱauchȱwirklichȱgehören.ȱ – DasȱSpeicherȬȱundȱVerteilsystemȱfürȱdieȱSchlüssel,ȱZertifikateȱundȱSperrlisȬ tenȱhängtȱvonȱdenȱAnforderungenȱdesȱUnternehmensȱab.ȱHäufigȱwirdȱfürȱ diesesȱAufgabengebietȱeinȱLDAPȬfähigesȱVerzeichnissystemȱgewählt.ȱ Dasȱ Hauptproblemȱ einerȱ PKIȬInfrastrukturȱ bleibtȱ dieȱ Verwaltungȱ derȱ Schlüsselȱ undȱZertifikate.ȱFürȱalleȱMitarbeiterȱmüssenȱsowohlȱSchlüsselȱalsȱauchȱZertifikateȱ erzeugtȱ undȱ verteiltȱ werden.ȱ Anschließendȱ müssenȱ dieȱ öffentlichenȱ Schlüsselȱ derȱ eigenenȱ Mitarbeiterȱ sowieȱ allerȱ externenȱ Kommunikationspartnerȱ imȱ Firmennetzȱ zugänglichȱ sein.ȱ Zusätzlichȱ wollenȱ auchȱ dieȱ externenȱ Teilnehmerȱ dieȱ öffentlichenȱ
136 ȱ
4.1ȱȱSicherheitȱ SchlüsselȱderȱUnternehmensmitarbeiterȱnutzen.ȱWeitererȱAufwandȱentsteht,ȱwennȱ einȱMitarbeiterȱdasȱUnternehmenȱverlässtȱundȱseinȱöffentlicherȱSchlüsselȱeingezoȬ genȱ werdenȱ muss.ȱ Gesteigerteȱ Komplexitätȱ erfährtȱ dieȱ Infrastruktur,ȱ wennȱ alleȱ Schlüsselȱ undȱ Zertifikateȱ zeitlichȱ befristetȱ werden,ȱ umȱ derȱ Gefahrȱ zuȱ begegnen,ȱ dassȱeinȱSchlüsselȱunbemerktȱgestohlenȱoderȱgefälschtȱwurde.ȱȱ WieȱZertifikateȱeingesetztȱwerdenȱkönnen,ȱzeigenȱvierȱBeispieleȱ[Foest]:ȱ ȱ SignierenȱvonȱEȬMails/Dokumentenȱȱ Mitȱ einerȱ digitalenȱ Signaturȱ wirdȱ sichergestellt,ȱ dassȱ derȱ Inhaltȱ derȱ EȬ Mailȱ oderȱ desȱ Dokumentesȱ nachȱ demȱ Signierenȱ nichtȱ verändertȱ wurde.ȱ InsbesondereȱfürȱEȬMailsȱergibtȱsichȱeinȱgroßesȱAnwendungsfeld,ȱdaȱohȬ neȱgroßeȱtechnischeȱSchwierigkeitenȱeinȱfalscherȱAbsenderȱvorgetäuschtȱ werdenȱ kann.ȱ Zudemȱ werdenȱ EȬMailsȱ vorzugsweiseȱ imȱ Klartextȱ überȬ tragen,ȱ soȱ dassȱ Nachrichtenȱ aufȱ demȱ Wegȱ zumȱ Empfängerȱ inhaltlichȱ manipuliertȱwerdenȱkönnen.ȱDurchȱdenȱEinsatzȱvonȱZertifikaten,ȱdieȱdieȱ AuthentizitätȱdesȱVerfassersȱsichernȱundȱÄnderungenȱamȱDokumentȱerȬ kennenȱ lassen,ȱ kannȱ diesemȱ Mißbrauchȱ begegnetȱ werden.ȱ Inȱ derȱ Praxisȱ gestaltetȱ sichȱ dieȱ Verwendungȱ einfach.ȱ Istȱ dasȱ Zertifikatȱ inklusiveȱ desȱ privatenȱSchlüsselsȱinstalliert,ȱkönnenȱEȬMailsȱbeimȱVersendenȱautomaȬ tischȱsigniertȱwerden.ȱ VerschlüsselnȱvonȱEȬMails/Dokumentenȱȱ MitȱderȱVerschlüsselungȱwirdȱdieȱPrivatspäreȱvonȱPersonenȱundȱdieȱVerȬ traulichkeitȱ derȱ Kommunikationȱ sichergestellt.ȱ Zumȱ Ablaufȱ wirdȱ dasȱ Zertifikatȱ desȱ Empfängersȱ einerȱ verschlüsseltenȱ Nachrichtȱ benötigt.ȱ EȬ MailȬProgrammeȱführenȱdieȱautomatischeȱSucheȱnachȱZertifikatenȱtransȬ parentȱ fürȱ denȱ Nutzerȱ vorȱ demȱ eigentlichenȱ Sendeprozessȱ durch.ȱ AnȬ schließendȱwirdȱgeprüft,ȱobȱdasȱZertifikatȱgültigȱundȱderȱdarinȱenthalteȬ neȱSchlüsselȱdemȱEmpfängerȱzuzuordnenȱist.ȱȱDannȱwirdȱdieȱNachrichtȱ mitȱ demȱ öffentlichenȱ Schlüsselȱ codiertȱ undȱ verschickt.ȱ Derȱ Empfängerȱ kannȱalsȱeinzigerȱmitȱseinemȱprivatenȱSchlüsselȱdieȱNachrichtȱinȱKlartextȱ umwandeln.ȱ ȱ AuthentisierungȱvonȱNutzernȱȱ NurȱderȱInhaberȱeinesȱZertifikatesȱistȱimȱBesitzȱdesȱdazugehörigenȱprivaȬ tenȱ Schlüssels.ȱ Daherȱ egibtȱ sichȱ dieȱ Möglichkeit,ȱdieȱ Berechtigungȱ einesȱ Nutzersȱzuȱprüfen.ȱDerȱNutzerȱsendetȱseinȱZertifikatȱanȱeinenȱServerȱundȱ beweistȱ durchȱ eineȱ digitaleȱ Signatur,ȱ dassȱ erȱ imȱ Besitzȱ desȱ privatenȱ Schlüsselsȱist.ȱDerȱServerȱverifiziertȱdasȱZertifikatȱundȱkannȱalsȱFolgeȱdenȱ
ȱ
137
4ȱȱECMȱDeliverȬKomponenteȱ Zugangȱ gewährenȱ oderȱ ablehnen.ȱ Dieserȱ Mechanismusȱ kannȱ fürȱ denȱ ZugangȱzuȱgeschütztenȱWebȬServernȱgenutztȱwerden.ȱBrowserȱunterstütȬ zenȱüberȱdasȱHTTPSȬProtokollȱdieseȱFormȱderȱAuthentifizierung.ȱDaȱimȱ Nutzerzertifikatȱ bereitsȱ Datenȱ überȱ dieȱ Personȱ enthaltenȱ sind,ȱ istȱ keinȱ Nameȱmehrȱnotwendig.ȱDurchȱdieȱVerwendungȱdesȱprivatenȱSchlüsselsȱ aufȱNutzerseiteȱwirdȱniemalsȱeinȱPasswortȱübertragen.ȱ AuthentisierungȱvonȱWebȬServernȱ EineȱverbreiteteȱAnwendungȱderȱZertifikateȱistȱdieȱAuthentisierungȱvonȱ WebȬServernȱüberȱHTTPS.ȱDazuȱweistȱsichȱderȱWebȬServerȱvorȱderȱÜberȬ tragungȱdurchȱeinȱZertifikatȱaus.ȱDurchȱdieȱVerwendungȱeinerȱdigitalenȱ Signaturȱ beweistȱ derȱ Server,ȱ dassȱ erȱ imȱ Besitzȱ desȱ zumȱ Zertifikatȱ gehöȬ rendenȱ privatenȱ Schlüsselsȱ istȱ undȱ damitȱ seineȱ Identitätȱ geklärtȱ ist.ȱ DaȬ durchȱ istȱ fürȱ seinȱ Gegenüberȱ sichergestellt,ȱ dassȱ erȱ mitȱ demȱ korrektenȱ WebȬServerȱ verbundenȱ ist.ȱ Einȱ weitererȱ Vorteilȱ desȱ HTTPSȬProtokollsȱ bestehtȱ darin,ȱ dassȱ derȱ gesamteȱ Netzverkehrȱ verschlüsseltȱ wird.ȱ Dazuȱ wirdȱ einȱ zufälligȱ erzeugterȱ Sitzungsschlüsselȱ verwendet,ȱ derȱ nurȱ denȱ beidenȱKommunikationspartnernȱbekanntȱist.ȱȱ
Kontrollfragen 1.
ȱ ȱ
138 ȱ
WasȱistȱunterȱdemȱCOLDȬVerfahrenȱzuȱverstehenȱundȱwoȱwirdȱesȱeinȬ gesetzt?ȱ 2. WelcheȱFunktionenȱwerdenȱmitȱderȱDeliverȬKomponenteȱverbunden?ȱ 3. Fälltȱ derȱ Begriffȱ Kompressionȱ vorbehaltlosȱ inȱ dieȱ Klasseȱ derȱ TransforȬ mationȱTechnologies?ȱ 4. WieȱistȱallgemeinȱderȱBegriffȱOutputȬManagementȱdefiniert?ȱ 5. WelcheȱFunktionȱhatȱeineȱPKIȱ(PublicȱKeyȱInfrastructure)?ȱ 6. WoraufȱberuhtȱdieȱSicherheitȱderȱVerschlüsselungsverfahren?ȱ 7. DieȱasymmetrischeȱVerschlüsselungȱkannȱfürȱzweiȱgrundlegendȱunterȬ schiedlicheȱ Szenarienȱ –ȱ jeȱ nachȱ Kenntnisȱ desȱ Schlüsselsȱ –ȱ eingesetztȱ werden.ȱUmȱwelcheȱhandeltȱesȱsich?ȱ 8. Worinȱ unterscheidenȱ sichȱ symmetrischeȱ undȱ asymmetrischeȱ VerfahȬ ren?ȱHatȱdieserȱUnterschiedȱEinflussȱaufȱdasȱEinsatzgebiet?ȱ 9. Wieȱ siehtȱ derȱ idealeȱAblaufȱ unterȱVerwendungȱ derȱDigitalenȱSignaturȱ aus?ȱ 10. WasȱwirdȱunterȱsubjektiverȱSicherheitȱverstanden?ȱ
5 ECM Preserve-Komponente Dieseȱ Komponenteȱ dientȱ zurȱ langfristigenȱ undȱ unveränderbarenȱ Aufbewahrungȱ vonȱInformationen.ȱHäufigȱwirdȱsieȱmitȱderȱelektronischenȱArchivierungȱgleichgeȬ setzt.ȱ Imȱ Laufeȱ derȱ Zeitȱ hatȱ sichȱ dieȱ Funktionalitätȱ jedochȱ angereichert,ȱ soȱ dassȱ Aspekteȱ wieȱ Compliance,ȱ Revisionssicherheit,ȱ MailȬArchivierungȱ undȱ rechtlicheȱ Gesichtspunkteȱhinzugekommenȱsind.ȱImȱGegensatzȱzurȱeinfachenȱAblageȱinȱFormȱ einerȱ Datenspeicherungȱ spieltȱ hierȱ dieȱ Archivierungspflichtȱ eineȱ herausragendeȱ Rolle.ȱ
5.1 Compliance Seitȱ langerȱ Zeitȱ arbeitetȱ dieȱ EUȱ anȱ einerȱ Richtlinieȱ zuȱ Corporateȱ Governanceȱ undȱ Compliance.ȱ Darinȱ sollȱ verbindlichȱ geregeltȱ werden,ȱ wieȱ Unternehmenȱ ihreȱ GeȬ schäftskorrespondenz,ȱ Bücher,ȱ Buchungsbelegeȱ undȱ andereȱ steuerlichȱ relevantenȱ Datenȱelektronischȱablegenȱmüssen.ȱEtlicheȱRegelungenȱgeltenȱbereits,ȱdochȱdürfteȱ nurȱ wenigenȱ Unternehmenȱ klarȱ sein,ȱ dassȱ beiȱ Außenprüfungenȱ nichtȱ nurȱ kaufȬ männischeȱUnterlagen,ȱsondernȱauchȱEȬMailsȱeingesehenȱwerdenȱdürfen.ȱVorbildȱ fürȱdieȱEUȱistȱderȱSarbanesȱOxleyȱActȱ(SOX),ȱderȱseitȱ2002ȱTransparenzȱfürȱunterȬ nehmerischeȱTätigkeitȱeinfordert.ȱDieȱSenatorenȱPaulȱSarbanesȱundȱMichaelȱOxleyȱ habenȱ dieseȱ Regelungȱ alsȱ Reaktionȱ aufȱ dieȱ Finanzskandaleȱ derȱ Unternehmenȱ EnȬ ronȱundȱWorldcomȱinsȱLebenȱgerufen.ȱDarinȱwerdenȱkonkreteȱAnforderungenȱanȱ dieȱinterneȱ Prozessdokumentationȱ vonȱbörsennotiertenȱ Unternehmenȱ gestellt,ȱdeȬ renȱ Geschäfteȱ undȱ vorȱ allemȱ Risikenȱ aufȱ dieseȱ Weiseȱ transparenterȱ werden.ȱ Derȱ Abschnittȱ 404ȱ inȱ SOXȱ schreibtȱ fest,ȱ dassȱ alleȱ Geschäftsprozesse,ȱ dieȱ dieȱ VorbereiȬ tung,ȱ Erfassungȱ undȱ Verarbeitungȱ vonȱ berichtsrelevantenȱ Datenȱ betreffen,ȱ ausȬ führlichȱdokumentiertȱundȱkontrolliertȱwerdenȱmüssen.ȱȱ Mitȱ derȱ Complianceȱ hatȱ sichȱ einȱ neuerȱ Begriffȱ aufȱ demȱ ECMȬMarktȱ gebildet.ȱ ComplianceȬAnforderungenȱ könnenȱauchȱ vonȱ deutschenȱUnternehmenȱ nichtȱverȬ nachlässigtȱ werden,ȱ weilȱ dieȱ rechtlichenȱ undȱ regulativenȱ Vorgabenȱ derȱ GDPdUȱ oderȱ vonȱ Baselȱ IIȱ greifen.ȱ Oftȱ wirdȱ Complianceȱ aufȱ dieȱ Erfüllungȱ rechtlicherȱ AnȬ forderungenȱ reduziert.ȱ Allenfallsȱ dieȱ Nachweisbarkeitȱ geschäftsrelevanterȱ UnterȬ lagenȱwirdȱalsȱGegenstandȱgesehen.ȱWieȱlässtȱsichȱderȱBegriffȱnunȱallgemeinȱverȬ stehen?ȱȱ ȱ Complianceȱ istȱ dieȱ Übereinstimmungȱ mitȱ undȱ Erfüllungȱ vonȱ rechtlichenȱundȱregulativenȱVorgabenȱ[Kampffmeyerȱ2007/2,ȱS.6]ȱ
ȱ
139
5ȱȱECMȱPreserveȬKomponenteȱ Dieseȱ Definitionȱ hatȱ Dokumenteȱ undȱ derenȱ Dokumentationspflichtȱ imȱ Blickfeldȱ undȱ verlangt,ȱ dassȱ sichȱalleȱ Handelndenȱ imȱUnternehmenȱ rechtsȬȱ undȱ regelungsȬ konformȱverhalten.ȱSieȱschließtȱpapiergebundeneȱGeschäftsvorfälleȱebensoȱeinȱwieȱ elektronischeȱ Akten.ȱ Imȱ Unternehmenȱ eingesetzteȱ Informationstechnologieȱ allgeȬ meinȱ birgtȱ organisatorische,ȱ infrastrukturelle,ȱ aberȱ auchȱ anwendungsȬȱ undȱ proȬ zessbezogeneȱ Risiken.ȱ Damitȱ erlangenȱ auchȱ elektronischeȱ Faxe,ȱ EȬMailsȱ oderȱ AnȬ hängeȱ Bedeutung.ȱ Auchȱ fürȱ sieȱ gilt,ȱ dassȱ Eigenschaftenȱ wieȱ Authentizität,ȱ VollȬ ständigkeit,ȱ Nachvollziehbarkeit,ȱ Integritätȱ undȱ Unverändertheitȱ sicherzustellenȱ sind.ȱ Nebenȱ denȱ technischenȱ Herausforderungenȱ ergebenȱ sichȱ damitȱ vorȱ allemȱ inhaltlicheȱ Probleme.ȱ Fürȱ jedesȱ Objektȱ mussȱ erkanntȱ werden,ȱ obȱ esȱ einerȱ AufbeȬ wahrungspflichtȱunterliegtȱoderȱnicht.ȱComplianceȱdefiniertȱalsoȱdasȱregelkonforȬ meȱ Verhaltenȱ einesȱ Unternehmens,ȱ d.h.ȱ dieȱ Übereinstimmungȱ seinerȱ Aktivitätenȱ mitȱgesetzlichenȱundȱregulativenȱAnforderungen,ȱdieȱsicherstellenȱsollen,ȱdassȱdieȱ mitȱ derȱ unternehmerischenȱ Tätigkeitȱ verbundenenȱ Risikenȱ antizipiertȱ werdenȱ können.ȱ Complianceȱ imȱ Sinneȱ vonȱ gesetzeskonformerȱ Verwaltungȱ undȱ Archivierungȱ vonȱ Informationenȱ hatȱ damitȱ Einflussȱ aufȱ Geschäftsprozesseȱ undȱ aufȱ derenȱ überprüfȬ bareȱKontrollmechanismen.ȱDazuȱgehörtȱauchȱeineȱArchivierungȱvonȱEȬMails,ȱdieȱ verstärktȱTeilȱvonȱAbläufenȱwerden.ȱOftȱgenugȱzeigtȱdasȱBemühenȱumȱCompliance,ȱ dassȱ Geschäftsprozesseȱ unkoordiniertȱ undȱ voneinanderȱ losgelöstȱ verlaufen,ȱ keinȱ Zugriffȱ aufȱ zentraleȱ aktuelleȱ Datenȱ möglichȱ istȱ undȱ eineȱ unstrukturierteȱ SpeicheȬ rungȱ undȱ Archivierungȱ einerȱ lückenlosenȱ Dokumentationȱ undȱ NachvollziehbarȬ keitȱimȱWegeȱstehen.ȱHinzuȱkommt,ȱdassȱdasȱVertrauenȱinȱdieȱreineȱelektronischeȱ Archivierungȱ wenigȱ ausgeprägtȱ ist.ȱ EȬMailsȱ undȱ Dateienȱ werdenȱ oftȱ ausgedrucktȱ undȱ abgeheftet,ȱ obwohlȱ sieȱ sowohlȱ aufȱ Servernȱ alsȱ auchȱ aufȱ BackupȬMedienȱ geȬ speichertȱsind.ȱȱ DieȱUmstellungȱvonȱPapierȱaufȱdieȱdigitaleȱNutzung,ȱVerteilungȱundȱArchivierungȱ bleibtȱfürȱvieleȱUnternehmenȱeineȱHerausforderung.ȱFälschlicherweiseȱgehenȱvieleȱ Firmenȱdavonȱaus,ȱdieȱAufbewahrungȱinȱPapierformȱseiȱdieȱverlangteȱundȱsichersȬ teȱ Methode.ȱ Daȱ inȱ derȱ amerikanischenȱ Gesetzgebungȱ auchȱ dieȱ gesamteȱ KorresȬ pondenzȱperȱEȬMailȱalsȱNachweisȱfürȱmöglicheȱGesetzesverstößeȱeineȱRolleȱspielt,ȱ dürfteȱesȱnurȱeineȱFrageȱderȱZeitȱsein,ȱbisȱentsprechendeȱRegelungenȱinȱdieȱeuropäȬ ischenȱGesetzeȱEingangȱfinden.
5.2 Archivierung Einȱ Archivȱ istȱ eineȱ Einrichtungȱ zurȱ systematischenȱ Erfassung,ȱ Erhaltungȱ undȱ BeȬ treuungȱ rechtlichenȱ undȱ politischenȱ Schriftgutes.ȱ Esȱ sammeltȱ folglichȱ QuellenmaȬ terialȱinȱFormȱvonȱUrkunden,ȱAkten,ȱAmtsbüchern,ȱKarten,ȱPlänenȱetc.ȱSeineȱAufȬ gabeȱ bestehtȱ darin,ȱ dieȱ technischeȱ Sicherungȱ derȱ Archivalienȱ undȱ ihreȱ ErschlieȬ ßungȱundȱihrȱVerfügbarmachenȱfürȱInteressenten,ȱvorȱallemȱfürȱdieȱForschungȱzuȱ gewährleisten.ȱ Darausȱ ergibtȱ sich,ȱ dassȱ dasȱ Materialȱ „achivierungswürdig“ȱ seinȱ
140 ȱ
5.2ȱȱArchivierungȱ muss,ȱ einȱ Interesseȱ amȱ Inhaltȱ bestehenȱ sollȱ undȱ esȱ dasȱ Handelnȱ einesȱ UnternehȬ mensȱwiderspiegelt.ȱ ȱ „BeiȱderȱArchivierungȱhandeltȱesȱsichȱumȱeineȱ[...]ȱanalytischeȱAufgabe.ȱ Dieȱ Archivareȱ müssenȱ festlegen,ȱ wasȱ archiviertȱ wirdȱ undȱ wasȱ vernichtetȱ werdenȱ kann.ȱ Dabeiȱ sindȱ derȱ soȱ genannteȱ „Evidenzwert“ȱ –ȱ spiegeltȱ derȱ Inhaltȱ derȱ Akteȱ dasȱ tatsächlicheȱ Handelnȱ derȱ Behördeȱ widerȱ –ȱ undȱ eineȱ Abwägungȱ derȱ Speicherungswürdigkeitȱ vonȱ MassenaktenȱdieȱbestimmendenȱGrößen.“ȱ[Becker]ȱ ȱ NochȱbisȱvorȱwenigenȱJahrenȱwurdenȱsämtlicheȱArbeitsvorgängeȱundȱInformatioȬ nenȱ fastȱ ausschließlichȱ aufȱ Papierȱ festgehalten,ȱ verwaltetȱ undȱ weiterverarbeitet.ȱ DieȱBearbeitungȱerfolgteȱanhandȱderȱWiedervorlageȱundȱdieȱAblageȱinȱFormȱsysȬ tematischerȱArchive.ȱHattenȱdieȱUnterlagenȱdenȱZenitȱderȱNutzungȱüberschritten,ȱ wurdenȱsieȱvomȱSchreibtischȱinȱdenȱKellerȱverfrachtet.ȱElektronischeȱAblageȬȱundȱ Archivierungssystemeȱ sindȱ daherȱ nichtȱ revolutionär.ȱ Ihrȱ grundlegendesȱ Konzeptȱ hatȱsichȱüberȱdieȱZeitȱnichtȱverändert,ȱwasȱsichȱaberȱgewandeltȱhat,ȱistȱdieȱInformaȬ tionsmenge.ȱ Dieȱ Informationsflutȱ nimmtȱ ständigȱ zu,ȱ ohneȱ dassȱ dieȱ zugrundeȱ lieȬ gendenȱ Prozesseȱ angepasstȱ werden.ȱ Überdecktȱ wirdȱ dieseȱ Tatsacheȱ durchȱ verfeiȬ nerteȱMethodenȱderȱSuche,ȱderȱautomatischenȱKlassifikationȱundȱderȱtechnischenȱ Verwaltungsabläufe.ȱ ArchiveȱunterscheidenȱzweiȱgrundsätzlicheȱAspekte:ȱ – DieȱLangzeitablage,ȱbeiȱderȱesȱdarumȱgeht,ȱdieȱInformationenȱlangfristigȱabȬ zulegenȱundȱzugreifbarȱzuȱhaltenȱ – DieȱrevisionssichereȱAblageȱnachȱdenȱVorgabenȱdesȱHandelsgesetzbuchesȱ (HGB),ȱderȱAbgabenordnungȱ(AO)ȱoderȱdenȱGrundsätzenȱordnungsgemäȬ ßerȱBuchführungȱ(GoBS)ȱ ImȱLebenszyklusȱeinesȱDokumentesȱistȱdieȱAblageȱdieȱletzteȱStation.ȱDieȱDauerȱderȱ Aufbewahrungȱ–ȱbestimmtȱdurch:ȱ – gesetzlicheȱAufbewahrungsfristenȱfürȱvieleȱGeschäftsvorfälleȱ – organisatorischeȱAnforderungenȱinȱFormȱeinesȱDokumentationsȬȱundȱReviȬ sionswunschesȱ – dieȱZugriffshäufigkeitȱ – ihreȱhistorischeȱBedeutungȱȱ – ihrenȱInformationsgehaltȱȱ entscheidetȱdabeiȱdarüber,ȱwelcheȱArchivformȱgewähltȱwerdenȱkann:ȱ – Arbeitsplatzarchiv:ȱbestehtȱausȱaktuellȱbearbeitetenȱDokumenten,ȱwobeiȱdieȱ Ordnungȱ vonȱ derȱ Bearbeitungsmethodeȱ abhängtȱ undȱ individuellȱ definiertȱ wird.ȱ
ȱ
141
5ȱȱECMȱPreserveȬKomponenteȱ – Abteilungsarchiv:ȱ besitztȱ lediglichȱ Informationsstatusȱ undȱ betrifftȱ nurȱ weȬ nigeȱ Dokumente.ȱ Dieȱ Ordnungskriterienȱ derȱ abgelegtenȱ Dokumenteȱ sindȱ abteilungsübergreifendȱ mitȱ entsprechendenȱ Zugriffsberechtigungenȱ festȬ gelegt.ȱ – Unternehmensarchiv:ȱ Langzeitarchivȱ zurȱ Erfüllungȱ gesetzlicherȱ undȱ orgaȬ nisatorischerȱBestimmungenȱmitȱeinerȱgeringenȱRückgriffsquoteȱundȱȱzentralȱ definiertenȱOrdnungskriterien.ȱ Zugriffshäufigkeit Vorgang VorgangAA
Bearbeitungszeitraum
Jahresabschluss Revision
Zeit
Abbildungȱ5.1:ȱDokumentenzugriffȱimȱZeitverlaufȱ
DerȱNutzenȱelektronischerȱArchiveȱergibtȱsichȱfastȱzwangsläufigȱausȱdenȱNachteiȬ lenȱ herkömmlicherȱ Ablagetechnik.ȱ Jedesȱ Dokumentȱ wirdȱ nurȱ einȱ einzigesȱ Malȱ erfasstȱ undȱ imȱ zentralenȱ Archivȱ abgelegtȱ –ȱ unabhängigȱ vonȱ Artȱ undȱ Herkunft.ȱ Eineȱ Vielzahlȱ vonȱ Arbeitsvorgängen,ȱ angefangenȱ beimȱ Kopierenȱ überȱ dasȱ VerteiȬ len,ȱdieȱZwischenablageȱbisȱhinȱzumȱAbheftenȱundȱEinordnenȱentfällt.ȱDamitȱwerȬ denȱerheblicheȱMengenȱanȱPapierȱgespart,ȱundȱwasȱentscheidenderȱist,ȱlangesȱSuȬ chen,ȱweiteȱWege,ȱdieȱFrage,ȱobȱeinȱBelegȱauchȱtatsächlichȱinȱderȱneuestenȱVersionȱ vorliegt,ȱ sindȱ Probleme,ȱ dieȱ derȱ Vergangenheitȱ angehören.ȱ Aufȱ Knopfdruckȱ lässtȱ sichȱ jedesȱ Dokumentȱ amȱ Bildschirmȱ reproduzieren,ȱ wasȱ dieȱ Transparenzȱ auchȱ überȱ Abteilungsgrenzenȱ hinwegȱ merklichȱ erhöht.ȱ Arbeitsabläufeȱ lassenȱ sichȱ aufȱ dieserȱ Basisȱ besserȱ optimieren,ȱ wasȱ nebenȱ Kostenvorteilenȱ undȱ Komfortȱ fürȱ dieȱ MitarbeiterȱauchȱzurȱVerbesserungȱdesȱServicesȱnachȱaußenȱbeiträgt.ȱInsofernȱleisȬ tetȱelektronischeȱArchivierungȱeinenȱnichtȱunerheblichenȱBeitragȱzurȱDeckungȱdesȱ steigendenȱ Kommunikationsbedarfesȱ einesȱ Unternehmensȱ undȱ zurȱ verbessertenȱ InformationsversorgungȱderȱanȱeinemȱGeschäftsprozessȱbeteiligtenȱPersonengrupȬ pen.ȱ Einȱ zweitesȱ Argumentȱ bestehtȱ inȱ derȱ Kombinationsmöglichkeitȱ vielerȱ einzelnerȱ Dokumenteȱ zuȱ virtuellenȱ Akten.ȱ Üblicherweiseȱ werdenȱ Datenȱ medienbezogenȱ gespeichert.ȱ Zuȱ jedemȱ Vorgangȱ imȱ ERPȬSystemȱ gehörenȱ aberȱ EȬMails,ȱ OfficeȬ Dokumenteȱ undȱ Papierbelege,ȱ dieȱ ebenfallsȱ abgelegtȱ werdenȱ müssen.ȱ Eineȱ elektȬ ronischeȱ Akteȱ beseitigtȱ hierȱ denȱ Medienbruchȱ undȱ erlaubtȱ eineȱ themenbezogeneȱ Bearbeitung.ȱ Dieȱ virtuelleȱ Akteȱ übernimmtȱ damitȱ dieȱ Rolleȱ einerȱ strukturiertenȱ Anzeigeȱ vonȱ Informationen,ȱ dieȱ inȱ einemȱ logischenȱ Sachzusammenhangȱ stehenȱ wieȱ etwaȱ Vorgang,ȱ Kunde,ȱ Produktȱ undȱ Bestellung.ȱ Dieseȱ Eigenschaftȱ machtȱ dieȱ
142 ȱ
5.2ȱȱArchivierungȱ virtuelleȱAkteȱüberȱdieȱreineȱArchivierungȱauchȱfürȱdieȱVorgangsbearbeitungȱeinȬ setzbar.ȱJeȱnachȱBerechtigungȱundȱDatenbasisȱsindȱunterschiedlicheȱSichtenȱaufȱdieȱ Archivdatenȱmöglich,ȱsoȱdassȱjederȱMitarbeiterȱgemäßȱseinerȱRolleȱdieȱfürȱihnȱbeȬ stimmtenȱDatenȱeinsehenȱundȱbearbeitenȱkann.ȱȱ Fürȱ Unternehmenȱ stelltȱ sichȱ dieȱ Frage,ȱ welcheȱ Anforderungenȱ beiȱ derȱ ArchivieȬ rungȱvonȱdigitalenȱDaten,ȱinsbesondereȱauchȱunterȱLangzeitarchivgesichtspunkten,ȱ beachtetȱ werdenȱ müssen.ȱ Ausȱ gesetzlicherȱ Sichtȱ dürfenȱ archivierteȱ Dokumenteȱ nachträglichȱnichtȱmehrȱverändertȱwerden,ȱd.h.,ȱdassȱnachweisbarȱseinȱmuss,ȱdassȱ keineȱ Veränderungȱ anȱ denȱ Dokumentenȱ vorgenommenȱ wurde.ȱ Hierfürȱ istȱ eineȱ Verfahrensdokumentationȱ notwendig,ȱ inȱ derȱ derȱ Umgangȱ mitȱ Dokumentenȱ undȱ derȱ Ablaufȱ derȱ damitȱ verbundenenȱ Tätigkeitenȱ niedergelegtȱ sind.ȱ Dieȱ Beachtungȱ derȱVerfahrensdokumentationȱistȱdabeiȱinȱregelmäßigenȱAbständenȱzuȱüberprüfen.ȱ Archivierte,ȱ personenbezogeneȱ Informationenȱ unterliegenȱ Aufbewahrungsfristen,ȱ nachȱ derenȱ Ablaufȱ sieȱ zuȱ vernichtenȱ sind.ȱ Kaufmännischeȱ Dokumenteȱ sindȱ imȱ GegensatzȱdazuȱfürȱeinenȱMindestzeitraumȱvorzuhalten,ȱkönnenȱjedochȱauchȱdarȬ überȱhinausȱarchiviertȱwerden.ȱȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ Abbildungȱ5.2:ȱVerfahrensdokumentationȱ
Imȱ Laufeȱ derȱ Zeitȱ habenȱ sichȱ unterschiedlicheȱ rechtlicheȱ Grundlagenȱ herausgeȬ schält,ȱ dieȱ ausȱ Archivierungssichtȱ beachtetȱ werdenȱ müssen.ȱ Zuȱ denȱ wichtigstenȱ gesetzlichenȱ Regelungenȱ zählenȱ dasȱ HGB,ȱ dieȱ Abgabenordnungȱ (AO),ȱ dasȱ BGB,ȱ dieȱ Grundsätzeȱ ordnungsgemäßerȱ Buchführungȱ (GoBS)ȱ undȱ dieȱ Grundsätzeȱ desȱ
ȱ
143
5ȱȱECMȱPreserveȬKomponenteȱ DatenzugriffsȱundȱderȱPrüfbarkeitȱdigitalerȱUnterlagenȱ(GDPdU).ȱAufȱdiesenȱGeȬ setzenȱundȱdenȱhierausȱabgeleitetenȱGrundsätzenȱbasierenȱdieȱAnforderungenȱanȱ dieȱelektronischeȱArchivierung.ȱȱ Fürȱ dieȱ Grundsätzeȱ ordnungsgemäßerȱ Buchführungssystemeȱ giltȱ folgenderȱ RahȬ men:ȱȱ ȱ „Alsȱ DVȬgestütztesȱ Buchführungssystemȱ sollȱ eineȱ Buchführungȱ bezeichnetȱ werden,ȱ dieȱ insgesamtȱ oderȱ inȱ Teilbereichenȱ kurzfristigȱ oderȱ aufȱ Dauerȱ unterȱ Nutzungȱ vonȱ Hardwareȱ undȱ Softwareȱ aufȱ DVȬ Datenträgernȱgeführtȱwird.ȱDabeiȱistȱsicherzustellen,ȱdassȱwährendȱderȱ DauerȱderȱDVȬSpeicherungȱdieȱBücher,ȱBelegeȱundȱsonstȱerforderlichenȱ AufzeichnungenȱjederzeitȱinnerhalbȱangemessenerȱFristȱverfügbarȱundȱ lesbarȱgemachtȱwerdenȱkönnen.“ȱ ȱ Alsȱ generelleȱ Anforderungenȱ anȱ zuȱ archivierendeȱ Dokumenteȱ leitenȱ sichȱ darausȱ gemäßȱ§§ȱ238,ȱ239ȱHGBȱmehrereȱAnforderungenȱab.ȱDokumenteȱhaben:ȱ – – – – – – –
vollständigȱ geordnetȱ sachlichȱrichtigȱ zeitgerechtȱ inȱangemessenerȱZeitȱnachvollziehbarȱ mitȱdemȱOriginalȱinhaltlichȱundȱbildlichȱübereinstimmendȱundȱ überȱdenȱArchivierungszeitraumȱhinwegȱinȱangemessenerȱZeitȱverfügbarȱ undȱlesbarȱzuȱmachenȱ
zuȱsein.ȱ „Geschäftsvorfälleȱ beiȱ DVȬBuchführungenȱ sindȱ dannȱ ordnungsgemäßȱ gebucht,ȱ wennȱ sieȱ nachȱ einemȱ Ordnungsprinzipȱ vollständig,ȱ formalȱ richtig,ȱ zeitgerechtȱ undȱ verarbeitungsfähigȱ erfasstȱ undȱ gespeichertȱ sind.“ȱ Dieȱ VerfahrensdokumenȬ tationȱ nachȱ denȱ Grundsätzenȱ ordnungsgemäßerȱ DVȬgestützterȱ BuchführungssysȬ temeȱ (GoBS)ȱ enthältȱ keineȱ präzisenȱ Vorgaben,ȱ wohlȱ aberȱ Elemente,ȱ dieȱ enthaltenȱ seinȱmüssen.ȱDazuȱzählenȱdieȱDarlegungȱderȱRechtsgrundlagenȱfürȱdieȱArchivierung,ȱ dieȱBeschreibungȱderȱsachlogischenȱLösungȱausȱAnwenderȬȱundȱausȱProgrammsicht,ȱ dieȱErfassungȱderȱOriginale,ȱdieȱDatensicherheitȱundȱeinȱinternesȱKontrollsystem.ȱ Dieȱ Leitlinienȱ zeigenȱ denȱ ordnungspolitischenȱ Rahmenȱ auf,ȱ inȱ demȱ sichȱ UnterȬ nehmenȱmitȱelektronischerȱBuchführungȱbewegen.ȱDieȱkonkreteȱUmsetzungȱkenntȱ neunȱBereiche,ȱfürȱdieȱVorkehrungenȱgetroffenȱwerdenȱmüssen,ȱumȱdenȱformulierȬ tenȱAnforderungenȱzuȱgenügen:ȱ ȱ ȱ
144 ȱ
5.2ȱȱArchivierungȱ 1. 2. 3. 4. 5. 6. 7. 8. 9.
Anwendungsbereichȱ BelegȬ,ȱJournalȬȱundȱKontenfunktionȱ Buchungȱ InternesȱKontrollsystemȱIKSȱ Datensicherheitȱ DokumentationȱundȱPrüfbarkeitȱ Aufbewahrungsfristenȱ WiedergabeȱderȱaufȱDatenträgernȱgeführtenȱUnterlagenȱ Verantwortlichkeitȱ
ErgänztȱwerdenȱdieseȱBereicheȱdurchȱGrundsätzeȱdesȱDatenzugriffsȱundȱderȱPrüfȬ barkeitȱ digitalerȱ Unterlagenȱ (GDPdU).ȱ Durchȱ Änderungenȱ derȱ Abgabenordnungȱ erhieltȱdieȱFinanzverwaltungȱabȱdemȱ1.1.2002ȱimȱRahmenȱvonȱBetriebsprüfungenȱ weitgehende ZugriffsrechteȱaufȱdieȱITȬSystemeȱderȱUnternehmenȱ[Bitkomȱ2005]:ȱ – Dieȱ GDPdUȱ geltenȱ fürȱ alleȱ steuerrelevantenȱ Daten.ȱ Diesȱ sindȱ insbesondereȱ DatenȱausȱderȱFinanzbuchhaltung,ȱderȱLohnbuchhaltungȱundȱderȱAnlagenȬ buchhaltung.ȱȱ – Aberȱ auchȱ weitereȱ Datenȱ könnenȱ steuerrelevantȱ sein,ȱ wennȱ sieȱ fürȱ dieȱ BeȬ steuerungȱdesȱUnternehmensȱvonȱBedeutungȱsind.ȱWirdȱzumȱBeispielȱinȱeiȬ nemȱ Unternehmenȱ einȱ eigenesȱ Systemȱ fürȱ dieȱ Reisekostenabrechnungȱ beȬ triebenȱundȱnurȱdieȱSummenbuchungenȱinȱdieȱLohnbuchhaltungȱübernomȬ men,ȱ dannȱ wäreȱ auchȱ diesesȱ Reisekostenabrechnungssystemȱ fürȱ dieȱ LohnȬ steuerȱrelevant.ȱȱ – Desgleichenȱ sindȱ alleȱ elektronischȱ (z.B.ȱ alsȱ ExcelȬDatei)ȱ erstelltenȱ BerechȬ nungsgrundlagenȱfürȱdenȱDatenzugriffȱzugänglichȱzuȱhalten,ȱwennȱlediglichȱ dieȱ Berechnungsergebnisseȱ inȱ dieȱ Buchführungȱ eingegangenȱ sind.ȱ Soȱ könȬ nenȱ z.B.ȱ Preiskalkulationenȱ steuerrelevantȱ sein,ȱ wennȱ sieȱ zurȱ Bestimmungȱ derȱHerstellungskostenȱoderȱalsȱVergleichsmaßstabȱfürȱkonzerninterneȱVerȬ rechnungspreiseȱherangezogenȱwerdenȱkönnenȱ Derȱ Zugriffȱ kannȱ inȱ dreiȱ Formenȱ erfolgen,ȱ derenȱ Auswahlȱ grundsätzlichȱ derȱ FiȬ nanzverwaltungȱobliegt:ȱ – Z1ȱ unmittelbarerȱ Zugriff:ȱVorȱOrtȱZugriffȱmitȱUnternehmenssoftware.ȱDasȱ Unternehmenȱ hatȱ demȱ Prüferȱ dieȱ erforderlichenȱ Hilfsmittelȱ zurȱ Verfügungȱ zuȱstellenȱundȱihnȱinȱdasȱSystemȱeinzuweisen.ȱ – Z2ȱ mittelbarerȱ Zugriff:ȱmitȱderȱITȱvertrauteȱMitarbeiterȱzeigenȱdemȱPrüferȱ geforderteȱDatenȱundȱexportiertȱdieseȱaufȱWunschȱ – Z3ȱDatenträgerüberlassung:ȱÜberlassungȱvonȱDatenȱaufȱDatenträgerȱ DerȱPrüferȱkannȱnachȱpflichtgemäßemȱErmessenȱwählen,ȱwelcheȱdieserȱZugriffsarȬ tenȱ erȱ anwendenȱ möchte.ȱ Dabeiȱ istȱ erȱ nichtȱ aufȱ eineȱ Zugriffsartȱ beschränkt,ȱ sonȬ dernȱkannȱauchȱmehrereȱMöglichkeitenȱparallelȱinȱAnspruchȱnehmen.ȱSoȱkannȱerȱ etwaȱvonȱeinemȱDVȬSystemȱmaschinellȱerzeugteȱBelegeȱdirektȱeinsehen,ȱsichȱvomȱ SteuerpflichtigenȱeineȱSaldenlisteȱanfertigenȱundȱsichȱdieȱBuchungenȱderȱUmsätzeȱ
ȱ
145
5ȱȱECMȱPreserveȬKomponenteȱ aufȱeinerȱCDȱübergebenȱlassen.ȱAuchȱhierbeiȱistȱjedochȱderȱGrundsatzȱderȱVerhältȬ nismäßigkeitȱzuȱbeachten.ȱSelbstverständlichȱdürfenȱDatenȱauchȱnachȱInkrafttretenȱ desȱRechtsȱaufȱDatenzugriffȱverschlüsseltȱwerden.ȱAllerdingsȱdarfȱdurchȱdieȱVerȬ schlüsselungȱdieȱmaschinelleȱAuswertbarkeitȱsowieȱdieȱLesbarmachungȱderȱDatenȱ nichtȱbeeinträchtigtȱwerden.ȱȱ – EsȱistȱausȱrechtlicherȱSichtȱnichtȱerforderlich,ȱBuchführungsdatenȱundȱsonsȬ tigeȱ steuerrelevanteȱ Unterlagenȱ inȱ einȱ gesondertesȱ Archivierungssystemȱ zuȱ überführen.ȱ Dieȱ Anforderungenȱ derȱ GDPdUȱ sindȱ auchȱ erfüllt,ȱ wennȱ dieȱ steuerlichȱ relevantenȱ Datenȱ währendȱ derȱ gesetzlichenȱ AufbewahrungsfrisȬ tenȱfürȱdenȱDatenzugriffȱimȱProduktivsystemȱvorgehaltenȱwerdenȱ[Bitkom,ȱ 2005].ȱ – Fürȱ dieȱ Anforderungenȱ anȱ dieȱ Speichermedien,ȱ aufȱ dieȱ archiviertȱ werdenȱ soll,ȱ geltenȱ dieȱ allgemeinenȱ Aufbewahrungsvorschriftenȱ derȱ AbgabenordȬ nung.ȱDurchȱdieȱGDPdUȱsindȱkeineȱspeziellenȱSpeichermedienȱvorgeschrieȬ benȱ Derȱ Steuerbehördeȱ istȱ derȱ elektronischeȱ Zugriffȱ aufȱ dieseȱ Datenȱ zuȱ gestatten.ȱ BeȬ troffenȱ sindȱ alleȱ steuerpflichtigenȱ Unternehmen,ȱ sofernȱ sieȱ steuerlichȱ relevanteȱ UnterlagenȱperȱComputerȱerstellen,ȱbearbeitenȱoderȱdigitalȱversenden.ȱWerdenȱdieȱ Anforderungenȱ derȱ GDPdUȱ nichtȱ erfüllt,ȱ drohenȱ denȱ betreffendenȱ Unternehmenȱ SanktionenȱinȱFormȱvonȱBußgeld,ȱZwangsmittelnȱoderȱSchätzungen.ȱDEAȱ(InterakȬ tiveȱ DatenȬExtraktionȱundȱȬAnalyse)ȱistȱdieȱ offizielleȱPrüfsoftwareȱderȱ FinanzverȬ waltung.ȱDasȱBundesministeriumȱfürȱFinanzenȱhatȱsichȱimȱRahmenȱeinesȱeuropaȬ weitenȱ Ausschreibungsverfahrensȱ fürȱ denȱ Einsatzȱ dieserȱ speziellenȱ PrüfungssoftȬ wareȱentschieden.ȱ Neuȱ erschienenȱ sindȱ dieȱ Wirtschaftsprüfungsgrundsätzeȱ desȱ IDWȱ RSȱ FAITȱ 3ȱ (Grundsätzeȱ derȱ ordnungsgemäßenȱ Buchführungȱ beimȱ Einsatzȱ elektronischerȱ Archivierungsverfahrenȱ desȱ Fachausschussesȱ fürȱ Informationstechnik)ȱ desȱ InstiȬ tutsȱfürȱWirtschaftsprüferȱ(IDW)ȱ[CWȱ2007].ȱHierbeiȱhandeltȱesȱsichȱumȱeinenȱAnȬ forderungskatalogȱ anȱ denȱ Betriebȱ vonȱ ECMȬLösungenȱ ausȱ Sichtȱ derȱ WirtschaftsȬ prüfer,ȱ derȱ imȱ Gegensatzȱ zuȱ anderenȱ Regelungenȱ gezieltȱ ECMȬspezifischeȱ ErforȬ dernisseȱ formuliert.ȱ Dazuȱ zählenȱ Sicherheitszieleȱ wieȱ Vertraulichkeit,ȱ AutorisieȬ rung,ȱ Authentizität,ȱ Integritätȱ undȱ Nachweisbarkeit,ȱ aberȱ auchȱ Aspekteȱ wieȱ KorȬ rektheit.ȱ Soȱ wirdȱ fürȱ diesesȱ Kriteriumȱ dieȱ bildlicheȱ undȱ inhaltlicheȱ Gleichheitȱ konkretisiertȱoderȱVorgabenȱfürȱdasȱFarbȬScannenȱgemacht.ȱ ȱ ȱ ȱ ȱ
146 ȱ
5.2ȱȱArchivierungȱ Tabelleȱ5.1:ȱRechtsvorschriftenȱundȱArchivierungȱ[Brand]ȱ Regelung, Gesetz
Anforderung
Steuer- und Handelsgesetz – HGB, FAIT 3, AO, GoBS
Unveränderbarkeit und Vollständigkeit; Einhaltung der Aufbewahrungsfristen, Existenz einer Verfahrensdokumentation
Umsatzsteuerrecht
Archivierung von Rechnungen; Anforderungen für elektronische Rechnungen mit qualifizierter digitaler Signatur,
GDPdU
Bereitstellung von Daten und Dokumenten im Rahmen der Außenprüfung
Zivilrecht, BGB
Sicherstellung der Unveränderbarkeit und Vollständigkeit;
Produkthaftung
Prozessdokumentation der Archivierung; Aufbewahrungsfristen
Signaturgesetz
Nutzung der digitalen Signatur
Datenschutzgesetz
Einrichtung eines Berechtigungskonzeptes; Verwaltung personenbezogener Daten
Basel II
Bereitstellung von Auswertungen für das Risiko-Controlling
Sarbanes-Oxley-Act
Nur für in USA börsennotierte Unternehmen
5.2.1
Revisionssichere Archivierung
BeiȱderȱArchivierungȱvonȱDatenȱundȱDokumentenȱentstehenȱmitunterȱbegrifflicheȱ Unschärfen.ȱ Umȱ denȱ darausȱ resultierendenȱ Problemenȱ entgegenȱ zuȱ wirken,ȱ hatȱ derȱ Arbeitskreisȱ Archivierungstechnologienȱ imȱ VOIȱ Ebenenȱ derȱ elektronischenȱ Archivierungȱdefiniert.ȱDanachȱwirdȱdieȱArchivierungȱalsȱrevisionssicherȱbezeichȬ net,ȱwennȱsieȱdieȱVorgabenȱderȱAOȱundȱderȱGoBSȱerfüllt.ȱDazuȱwirdȱunterȱpraktiȬ schenȱ Gesichtspunktenȱ dieȱ physikalischeȱ Ebene,ȱ zuȱ derȱ Speichermedienȱ undȱ DaȬ teisystemeȱzählen,ȱdieȱlogischeȱEbeneȱmitȱDateien,ȱIndizesȱundȱZugriffsmechanisȬ menȱ undȱ letztlichȱ dieȱ Dokumentenebeneȱ alsȱ Datenstromȱ unterschieden.ȱ Beiȱ derȱ Frageȱ nachȱ derȱ Medientauglichkeitȱ zurȱ Langzeitarchivierungȱ vonȱ Datenȱ istȱ esȱ unerheblich,ȱobȱTonaufnahmen,ȱVideos,ȱBilderȱoderȱGeschäftsbriefeȱabgelegtȱwerȬ den,ȱsolangeȱdieȱDatenȱinȱeinemȱelektronischenȱcodiertenȱFormatȱvorliegen.ȱBeiȱderȱ logischenȱ Verwaltungȱ vonȱ Dokumentenȱ mitȱ Suchkriterien,ȱ Versionierungȱ undȱ ZugriffsrechtenȱspieltȱderȱinterneȱAufbauȱkeineȱRolle,ȱsofernȱsichergestelltȱwerdenȱ kann,ȱdassȱdieȱDokumenteȱdurchȱgeeigneteȱProgrammeȱreproduzierbarȱsind.ȱErstȱ dieȱ Ebeneȱ derȱ Dokumenteȱ beschäftigtȱ sichȱ mitȱ derȱ internenȱ Struktur,ȱ d.h.ȱ demȱ FormatȱderȱzuȱeinemȱDokumentȱgehörendenȱDatei.ȱ Fürȱ denȱ Dokumentbegriffȱ könnenȱ zurȱ näherenȱ Beschreibungȱ mehrereȱ Kriterienȱ herangezogenȱwerden:ȱ – EinȱDokumentȱistȱfastȱimmerȱinȱeinerȱDateiȱabgelegtȱ – ElektronischeȱDokumenteȱsindȱhäufigȱauchȱinȱPapierformȱvorhandenȱ – Dokumenteȱ könnenȱ nahezuȱ unverändertȱ inȱ verschiedenenȱ Dateiformatenȱ gespeichertȱwerdenȱ – DasȱzurȱErstellungȱgenutzteȱProgrammȱmussȱnichtȱdemȱzurȱReproduktionȱ genutztenȱentsprechen.ȱ
ȱ
147
5ȱȱECMȱPreserveȬKomponenteȱ DieȱeinfachsteȱFormȱeinesȱArchivsȱsetztȱeinȱDokumentȱmitȱeinerȱDateiȱgleich.ȱAusȬ gefeilterȱistȱjedochȱdieȱMöglichkeit,ȱmehrereȱVersionenȱeinesȱDokumentesȱinȱunterȬ schiedlichenȱ Dateienȱ zuȱ verwaltenȱ undȱ alsȱ logischȱ zusammengehörigȱ zuȱ kennȬ zeichnen.ȱEinigeȱArchivsystemeȱerlaubenȱdarüberȱhinausȱdieȱAblageȱdesȱgleichenȱ DokumentesȱinȱmehrerenȱFormaten.ȱDamitȱkannȱbeimȱAblegenȱeinesȱinȱWordȱerstellȬ tenȱBriefesȱgleichzeitigȱeineȱKopieȱalsȱPDFȬFileȱzurȱAnzeigeȱerstelltȱwerden.ȱ Dieȱ Frage,ȱ welchesȱ Datenformatȱ inȱ einemȱ elektronischenȱ Archivȱabgelegtȱ werdenȱ soll,ȱhängtȱvonȱeinerȱVielzahlȱvonȱFaktorenȱab.ȱEineȱAnforderungȱstehtȱjedochȱanȱ obersterȱStelle:ȱdieȱsichereȱReproduktionȱdesȱDokumentesȱauchȱnachȱvielenȱJahrenȱ oderȱ nachȱ mehrerenȱ Releasewechselnȱ derȱ zugrundeȱ liegendenȱ Softwareȱ [Bitkomȱ 2005].ȱ Fürȱ denȱ öffentlichenȱ Bereichȱ wurdeȱ dasȱ DOMEAȬKonzeptȱ fürȱ dasȱ DokumentenȬ managementȱundȱdieȱelektronischeȱArchivierungȱentwickelt.ȱWesentlichesȱZielȱistȱ dieȱEinführungȱeinerȱelektronischenȱAkte,ȱumȱeineȱmedienbruchfreieȱITȬgestützteȱ Vorgangsbearbeitungȱzuȱermöglichen.ȱSoȱmüssenȱelektronischeȱAktenȱhinreichenȬ denȱInhaltȱundȱStrukturȱaufweisen,ȱsichȱinȱeinenȱKontextȱeinordnenȱlassenȱundȱwieȱ ihreȱ Vorgängerȱ inȱ Papierformȱ eineȱ Nachweisfunktionȱ erfüllen.ȱ Dasȱ Konzeptȱ liegtȱ seitȱNovemberȱ2005ȱinȱderȱVersionȱ2.1ȱvor.ȱ Fürȱ eineȱ revisionssichereȱ Archivierungȱ istȱ eineȱ orginalȱ getreueȱ Bildwiedergabeȱ (Originalauszugȱ HGBȱ „übereinstimmendeȱ Wiedergabe“)ȱ sicherzustellen.ȱ Dasȱ seitȱ JahrenȱbereitsȱvorhandeneȱTIFFȬFormatȱerfülltȱdieseȱAnforderungenȱamȱsichersten,ȱ daȱ esȱ sichȱ umȱ einȱ soȱ genanntesȱ RasterȬFormatȱ handelt.ȱ Diesȱ bedeutet,ȱ dassȱ jederȱ einzelneȱBildpunktȱgespeichertȱwirdȱundȱeineȱVerfälschungȱaufgrundȱdesȱFormatsȱ nichtȱ möglichȱ ist.ȱ Imȱ Bereichȱ gescannterȱ Dokumenteȱ habenȱ sichȱ JPEGȬ2000Ȭ Formateȱetabliert.ȱDiesȱgiltȱinsbesondereȱfürȱArchiveȱundȱBibliotheken,ȱaberȱauchȱ fürȱgroßformatigenȱKartenȱwieȱimȱdeutschenȱKatasterȬȱoderȱVermessungsbereich.ȱ DochȱTIFFȱundȱJPEGȱhabenȱNachteileȱbeiȱderȱVerwendungȱfürȱDokumente.ȱZumȱ einenȱverändernȱsieȱdasȱoriginäreȱAussehenȱderȱDateiȱ[Heiermann].ȱBetroffenȱsindȱ Farbinformationen,ȱ dieȱ beiȱ derȱ Umwandlungȱ inȱ TIFFȱ verlorenȱ gehen,ȱ währendȱ JPEGȱ schlechteȱ Darstellungsqualitätȱ oderȱ großeȱ Dateienȱ erzeugt.ȱ Darüberȱ hinausȱ sindȱBildformateȱnichtȱvolltextrecherchefähig.ȱDerȱSinnȱvonȱBuchstabenȱgehtȱdurchȱ „dasȱRastern“ȱoderȱ„dasȱVerpixeln“ȱverloren,ȱsoȱdassȱTIFFȱzwarȱdieȱReproduzierȬ barkeitȱ derȱ Dokumenteȱ langfristigȱ gewährleistet,ȱ aberȱ Schwierigkeitenȱ beimȱ DurchsuchenȱderȱarchiviertenȱBeständeȱoffenbart.ȱȱ OffenȱwarȱdaherȱbisherȱdieȱFrageȱnachȱFormatenȱfürȱSchriftstücke.ȱSeitȱHerbstȱ2005ȱ existiertȱ mitȱ PDF/Aȱ jedochȱ eineȱ ausȱ PDFȱ 1.4ȱ abgeleiteteȱ Variante,ȱ dieȱ alsȱ ISOȬ FormatȱISOȱ19005Ȭ1ȱfürȱdieȱLangzeitarchivierungȱzugelassenȱwurde.ȱDerȱStandardȱ präzisiertȱ imȱ Wesentlichenȱ spezifischeȱ Eigenschaftenȱ derȱ PDFȱ Referenzȱ 1.4ȱ undȱ legtȱ fest,ȱ obȱ sieȱ obligatorisch,ȱ empfohlen,ȱ eingeschränktȱ oderȱ verbotenȱ sindȱ [Heiermann].ȱ Dieȱ zugrundeȱ liegendeȱ Syntaxȱ gibtȱ detailliertȱ vor,ȱ welcheȱ Inhalteȱ erlaubtȱsind.ȱSoȱmussȱderȱeigentlicheȱContentȱinȱderȱDateiȱenthalten,ȱFremdabhänȬ gigkeitenȱoderȱReferenzenȱinȱFormȱvonȱLinksȱaufȱexternenȱQuellenȱausgeschlossen,ȱ
148 ȱ
5.2ȱȱArchivierungȱ dieȱ genutztenȱ Schriftenȱ komplettȱ eingebundenȱ undȱ eineȱ Verschlüsselungȱ oderȱ Zugriffsbeschränkungenȱnichtȱzugelassenȱsein.ȱDurchȱdieseȱundȱweitereȱVorschrifȬ tenȱsollȱdieȱlangfristigeȱLesbarkeitȱderȱDokumenteȱgewährleistetȱwerdenȱundȱzwarȱ unabhängigȱ davon,ȱ mitȱ welcherȱ Softwareȱ undȱ aufȱ welchemȱ Betriebssystemȱ dieȱ Dokumenteȱursprünglichȱerstelltȱwurden.ȱNebenȱdenȱDokumenteninhaltenȱspielenȱ Metadatenȱ eineȱ großeȱ Rolle.ȱ PDF/Aȱ lässtȱ ihreȱ Nutzungȱ zuȱ undȱ fordertȱ zwingendȱ Angabenȱ wieȱ Erstellerȱ undȱ Erstellungsdatum,ȱ soȱ dassȱ wieȱ inȱ einemȱ Papierarchivȱ Indizes,ȱDateilisten,ȱRegisterȱoderȱOrdnerrückenȱinȱdieȱSucheȱeingebundenȱwerdenȱ können.ȱ Dieȱ Metadatenschemataȱ imȱ PDFȬFormatȱ sindȱ sowohlȱ vonȱ Nutzernȱ alsȱ auchȱ vonȱ Anwendungsprogrammenȱ lesbar.ȱ Nebenȱ demȱ Vorteil,ȱ dasȱ einzigeȱ geȬ normteȱ ISOȬDokumentenformatȱ zuȱ sein,ȱ zeichnetȱ sichȱ dieȱ Größeȱ derȱ PDFȬ DokumenteȱdurchȱKompaktheitȱaus.ȱPDF/AȬDateienȱbenötigenȱnurȱeinenȱBruchteilȱ desȱ Speicherplatzesȱ derȱ Originaldateiȱ oderȱ einerȱ vergleichbarenȱ TIFFȬDatei,ȱ ohneȱ anȱQualitätȱzuȱverlieren.ȱDieȱgeringeȱDateigrößeȱwirktȱsichȱvorȱallemȱauchȱinȱderȱ elektronischenȱÜbermittlungȱpositivȱaus.ȱ PDF/AȱistȱalsȱNormreiheȱangelegtȱundȱinȱzweiȱKonformitätsebenenȱunterteilt.ȱBeiȬ deȱ Konformitätslevelȱ berücksichtigen,ȱdassȱ unterschiedlicheȱ Anwenderkreiseȱ verȬ schiedeneȱ Anforderungenȱanȱ einȱ Dateiformatȱ fürȱ dieȱ Langzeitarchivierungȱ habenȱ undȱdassȱsichȱdasȱAusgangsmaterialȱzumȱTeilȱstarkȱunterscheidetȱ[PDFȬTools].ȱ – PDF/AȬ1Aȱ (accessible)ȱ bedeutetȱ dieȱ vollständigeȱ Übereinstimmungȱ mitȱ derȱ PDF/AȬNormȱ undȱ erfordertȱ inȱ derȱ Regelȱ einenȱ höherenȱ Aufwandȱ beiȱ derȱ Erstellung.ȱSowohlȱeindeutigeȱvisuelleȱReproduzierbarkeitȱalsȱauchȱAbbildȬ barkeitȱ vonȱ Textȱ nachȱ Unicodeȱ undȱ inhaltlicheȱ Strukturierungȱ desȱ DokuȬ mentesȱistȱdamitȱgewährleistet.ȱȱ – PDF/AȬ1Bȱ(basic)ȱgarantiertȱlediglichȱdieȱIntegritätȱderȱvisuellenȱDarstellungȱ Umȱzuȱprüfen,ȱobȱeinȱvorliegendesȱPDFȬDokumentȱmitȱdemȱStandardȱPDF/AȱverȬ einbarȱist,ȱexistierenȱValidierer.ȱAbweichungenȱzuȱgesetzlichenȱundȱinternenȱRegeȬ lungenȱ werdenȱ inȱ Reportsȱ zurȱ Weiterbearbeitungȱ aufgelistet.ȱ Eineȱ Besonderheitȱ dieserȱWerkzeugeȱist,ȱdassȱzusätzlichȱzurȱPDF/AȬSpezifikationȱweitereȱComplianȬ ceȬVorgabenȱ definiertȱ werdenȱ können.ȱ Fürȱ Endeȱ 2008ȱ beziehungsweiseȱ Anfangȱ 2009ȱwirdȱPDF/AȬ2ȱerwartet.ȱDieseȱPDF/AȬNormȱerlaubtȱTransparenzȱundȱneuereȱ PDFȬFeatures,ȱ daȱ sieȱ aufȱ PDFȱ 1.7ȱ basiertȱ ȱ Dazuȱ zählen:ȱ JPEG2000,ȱ PDFȬEbenen,ȱ Seitenskalierung,ȱseitȱPDFȱ1.4ȱneuȱeingeführteȱKommentarȬTypenȱsowieȱUnicodeȬ PfadeȱfürȱHyperlinks.ȱ Dieȱ Migrationȱ vonȱ bestehendenȱ PapierȬȱ oderȱ elektronischenȱ Archivenȱ inȱ PDF/AȬ konformeȱ Archiveȱ istȱ vonȱ erheblicherȱ praktischerȱ Relevanz.ȱ Bevorȱ dieȱ transforȬ miertenȱDokumenteȱvernichtenȱwerden,ȱistȱesȱunerlässlich,ȱgesetzlicheȱRegelungenȱ imȱAugeȱzuȱhaben:ȱ – ImȱHandelsȬȱundȱSteuerrechtȱistȱesȱzulässig,ȱeineȱVielzahlȱvonȱDokumentenȱ aufȱmaschinenlesbarenȱDatenträgernȱabzulegen.ȱGrundlageȱhierfürȱsindȱdieȱ GrundsätzeȱordnungsgemäßerȱDVȬgestützterȱBuchführungȱ
ȱ
149
5ȱȱECMȱPreserveȬKomponenteȱ – Fürȱ Sozialbehördenȱ gilt,ȱ dassȱ schriftlicheȱ Unterlagenȱ aufȱ Datenträgernȱ dauerhaftȱaufbewahrtȱwerdenȱdürfenȱ – FürȱdieȱJustizȱkannȱeineȱinȱPapierformȱeingereicheteȱUnterlageȱinȱeinȱelektȬ ronischesȱDokumentȱumgewandeltȱwerden,ȱdasȱeinenȱVermerkȱerhält,ȱwannȱ undȱdurchȱwenȱdieȱÜbertragungȱerfolgtȱist.ȱ – DieȱBeweiskraftȱelektronischerȱDokumenteȱhängtȱvonȱderȱBeweiswürdigungȱ durchȱ dasȱ Gerichtȱ ab.ȱ Qualifizierteȱ elektronischeȱ Dokumenteȱ besitzenȱ denȱ gleichenȱBeweiswertȱwieȱihrȱpapiergebundenesȱGegenstück.ȱ EinȱMangelȱbestehtȱderzeitȱimȱBereichȱderȱelektronischenȱRechnungsverarbeitung,ȱ inȱdemȱPDF/Aȱnochȱnichtȱverwendetȱwird.ȱDerȱGrundȱhierfürȱliegtȱdarin,ȱdassȱdieȱ Verarbeitungȱ derȱ qualifiziertenȱ elektronischenȱ Signaturȱ nochȱ nichtȱ geregeltȱ ist.ȱ Dieseȱistȱ beiȱDokumentenȱ anȱ eineȱ Prüfungȱ durchȱ einȱ externesȱ TrustcenterȱgekopȬ peltȱ–ȱeineȱHürdeȱdieȱderȱaktuelleȱStandardȱnochȱnichtȱgenommenȱhat.ȱErstȱmitȱderȱ Versionȱ2ȱdürfteȱhierȱAbhilfeȱgeschaffenȱwerden.ȱ
5.2.2
Archivierungskomponenten
Zuȱ denȱ „Preserve“ȬKomponentenȱ werdenȱ unterschiedlicheȱ Medienȱ gerechnetȱ [Kampffmeyerȱ2007,ȱS.74]:ȱ – WORMȱ (Writeȱ Onceȱ Readȱ Many)ȱ rotierendeȱ digitalȱ optischeȱ SpeichermeȬ dien,ȱzuȱdenenȱdieȱklassischenȱWORMȱinȱeinerȱSchutzhülleȱinȱ5ȱ¼“ȱoderȱ3ȱ½“Ȭ TechnologieȱebensoȱwieȱCDȬRȱundȱDVDȬRȱgehören.ȱȱ – WORMȬTapesȱ(MagnetbandȱmitȱWORMȬEigenschaften)ȱwerdenȱinȱspezielȬ lenȱ Laufwerkenȱ eingesetzt,ȱ dieȱ mittelsȱ besondersȱ gesicherterȱ Bänderȱ beiȱ ordnungsgemäßemȱ Betriebȱ eineȱ ähnlicheȱ Sicherheitȱ wieȱ einȱ herkömmlichesȱ WORMȬMediumȱerreichenȱkönnen.ȱ – CASȱ (Contentȱ Adressedȱ Storage)ȱ istȱ eineȱ neuereȱ Technologie,ȱ umȱ dieȱ Schwächenȱ herkömmlicherȱ Archivierungsverfahrenȱ zuȱ überwinden.ȱ Dieȱ ContentȬAdresseȱ istȱ einȱ Identifikator,ȱ derȱ denȱ Inhaltȱ einerȱ Dateiȱ undȱ nichtȱ seinenȱ Speicherortȱ eindeutigȱ kennzeichnet.ȱ Dieȱ ContentȬAdresseȱ istȱ daherȱ einmalig,ȱundȱeinmalȱberechnet,ȱbleibtȱsieȱfürȱdieȱDauerȱderȱExistenzȱderȱDaȬ teiȱkonstant.ȱNurȱwennȱderȱInhaltȱderȱDateiȱsichȱverändert,ȱmussȱderȱIdentiȬ fikatorȱzwangsläufigȱneuȱbestimmtȱwerden.ȱDerȱSpeichervorgangȱverläuftȱinȱ mehrerenȱ Phasen:ȱ Derȱ Nutzerȱ übergibtȱ seineȱ Dateiȱ derȱ CASȬAnwendung,ȱ dieȱdieȱMetadatenȱsepariert.ȱVonȱdenȱKerndatenȱwirdȱanschließendȱdieȱConȬ tentȬAdresseȱberechnet.ȱDieȱContentȬAdresseȱundȱdieȱMetadatenȱwerdenȱinȱ eineȱXMLȬDatei,ȱdenȱsoȱgenanntenȱContentȱFileȱDescriptorȱ(CFD)ȱübertragen.ȱ Dieȱ CASȬAnwendungȱ berechnetȱ dieȱ ContentȬAdresseȱ derȱ Originaldateiȱ erȬ neut,ȱ vergleichtȱ beideȱ ContentȬAdressenȱ undȱ speichertȱ dasȱ Objekt.ȱ InsbeȬ sondereȱSpeicherherstellerȱwieȱEMCȱfavorisierenȱdiesesȱVerfahren.ȱȱ
150 ȱ
5.2ȱȱArchivierungȱ – MikrofilmeȱkönnenȱalsȱSicherungsmediumȱeingesetztȱwerden,ȱwennȱdieȱInȬ formationenȱ nichtȱ mehrȱ inȱ derȱ Nutzungȱ sindȱ undȱ keineȱ maschinelleȱ AusȬ wertbarkeitȱgefordertȱist.ȱ – PapierȱistȱalsȱLangzeitspeicherȱvonȱInformationenȱebenfallsȱweiterhinȱzuȱbeȬ rücksichtigen,ȱ daȱ dieȱ Aufzeichnungȱ migrationsfreiȱ istȱ undȱ ohneȱ Hilfsmittelȱ gelesenȱwerdenȱkann.ȱ
5.2.3
Mail-Archivierung
EȬMailsȱ sindȱ einȱ Transportmediumȱ fürȱ Informationen.ȱ Sieȱ transportierenȱ ebensoȱ wieȱdieȱklassischenȱMedienȱPapierȱundȱSpracheȱgeschäftlicheȱDaten,ȱdieȱausȱrechtliȬ chenȱ Gesichtspunkten,ȱ aberȱ auchȱ ausȱ wirtschaftlichenȱ undȱ Nutzungserwägungenȱ aufbewahrtȱundȱverfügbarȱgehaltenȱwerdenȱmüssen.ȱDerȱInhaltȱvonȱEȬMailsȱstelltȱ einenȱWertȱfürȱAbsenderȱundȱEmpfängerȱdar.ȱEȬMailsȱdokumentierenȱGeschäftstäȬ tigkeitenȱ undȱ stehenȱ inȱ einemȱ Zusammenhangȱ mitȱ Geschäftspartnernȱ undȱ GeȬ schäftsprozessen.ȱ Deshalbȱ gehörenȱ sieȱ nichtȱ inȱ einenȱ eigenenȱ Datenpool,ȱ sondernȱ müssenȱ ihrenȱ Sachzusammenhang,ȱ inȱ KundenȬ,ȱ ProjektȬ,ȱ VorgangsȬȱ undȱ anderenȱ virtuellenȱelektronischenȱAktensichtenȱdokumentierenȱ[Kampffmeyerȱ2007,ȱS.ȱ3].ȱȱ EntscheidendȱfürȱdieȱOrdnungȱundȱZuordnungȱsindȱderȱInhaltȱundȱdieȱBedeutungȱ derȱ EȬMail.ȱ Durchȱ dieȱ separateȱ Speicherungȱ vonȱ EȬMailsȱ außerhalbȱ derȱ SachzuȬ sammenhängeȱwirdȱnichtȱnurȱdasȱArbeitenȱinȱderȱelektronischenȱBüroweltȱschwieȬ rigerȱundȱunübersichtlicher,ȱsondernȱauchȱdieȱNachweisfähigkeitȱvonȱSachverhalȬ tenȱwirdȱdramatischȱbeeinträchtigt.ȱ DasȱWachstumȱdesȱEȬMailȬVerkehrsȱrührtȱnichtȱnurȱdaher,ȱdassȱimmerȱmehrȱPostȱ elektronischȱ verschicktȱ wird,ȱ sondernȱ auchȱ daher,ȱ dassȱ ganzeȱ Geschäftsprozesseȱ mittlerweileȱ rechentechnischȱ abgewickeltȱ werden.ȱ Aufträgeȱ undȱ Rechnungenȱ elektronischȱ zuȱ bearbeiten,ȱ generiertȱ oftȱ mehrereȱ Mails,ȱ dieȱ vonȱ Mitarbeiterȱ zuȱ Mitarbeiter,ȱzumȱKundenȱoderȱGeschäftspartnerȱweiterȱgeleitetȱwerden.ȱȱ Dieȱ Archivierungȱ elektronischerȱ Korrespondenzȱ istȱ daherȱ inȱ vielenȱ Unternehmenȱ zuȱeinemȱProblemȱ geworden.ȱ Eineȱ Frageȱ bleibtȱ beiȱ diesemȱ pragmatischenȱ VorgeȬ henȱ jedochȱ ungelöst:ȱ wieȱ istȱ dieȱ Zusammengehörigkeitȱ vonȱ Dokumentenȱ undȱ EȬ MailsȱinȱdenȱEinȬȱundȱAusgabebeständenȱzuȱerkennen?ȱ Hinzuȱ kommt,ȱ dassȱ steuerrelevanteȱ Unterlagenȱ seitȱ denȱ 2002ȱ geltendenȱ SteuerȬ richtlinienȱelektronischȱzuȱarchivierenȱsind,ȱwasȱfolglichȱauchȱEȬMailsȱbetrifft.ȱFürȱ geschäftlicheȱEȬMailsȱmussȱinsbesondereȱsichergestelltȱsein,ȱdassȱdieȱDatenȱmitȱdenȱ empfangenenȱ Handelsbriefen,ȱ Buchungsbelegenȱ undȱ anderenȱ Unterlagenȱ inhaltȬ lichȱübereinstimmen.ȱFernerȱmüssenȱsieȱjederzeitȱundȱinȱeinerȱangemessenenȱFristȱ lesbarȱ gemachtȱ werdenȱ könnenȱ undȱ maschinellȱ ȱ auswertbarȱ sein.ȱ Verschärfendȱ kommtȱdasȱseitȱAnfangȱ2007ȱgeltendeȱ„GesetzȱüberȱelektronischeȱHandelsregisterȱ undȱGenossenschaftsregisterȱsowieȱdasȱUnternehmensregister“ȱhinzu,ȱdasȱEȬMailsȱ Geschäftsbriefenȱgleichgestellt,ȱdieȱalsȱelektronischesȱOriginalȱaufzubewahrenȱsind.ȱ
ȱ
151
5ȱȱECMȱPreserveȬKomponenteȱ Dieȱ Folgeȱ dieserȱ Rahmenbedingungenȱ ist,ȱ dasȱ Unternehmenȱ Kontrollstrukturenȱ einrichtenȱ müssen,ȱ dieȱ nachweisen,ȱ wieȱ Informationenȱ entstandenȱ sindȱ undȱ aufȱ welchenȱQuellenȱsieȱberuhen.ȱDamitȱstellenȱsichȱmehrereȱFragen:ȱ – Lässtȱ sichȱ EȬMailȱ ohneȱ hohenȱ manuellenȱ Aufwandȱ nachȱ Relevanzȱ fürȱ dieȱ Geschäftstätigkeitȱklassifizieren?ȱ – Könnenȱ dieseȱ Informationenȱ inȱ Einklangȱ mitȱ gesetzlichenȱ undȱ unternehȬ mensinternenȱRichtlinienȱabgelegtȱwerden?ȱ – IstȱjedeȱInformationȱohneȱlangwierigeȱSucheȱwiederȱauffindbar?ȱ AuchȱbleibtȱdieȱFrage,ȱwasȱdieȱQuelleȱderȱEȬMailȬArchivierungȱseinȱsoll.ȱEineȱMögȬ lichkeitȱ bestehtȱ darin,ȱdieȱNachrichtenȱdenȱ Empfängerpostfächernȱ zuȱ entnehmen.ȱ HierȱliegtȱjedochȱeinȱProblemȱderȱRevisionssicherheit,ȱdennȱhatȱdieȱMailȱdenȱEmpȬ fängerȱ erreicht,ȱ lässtȱ sichȱ nichtȱ sicherȱ feststellen,ȱ obȱ sieȱ vonȱ ihmȱ nichtȱ verändertȱ wurde.ȱ Sichererȱ erscheintȱ es,ȱ eineȱ zentraleȱ EȬMailȬInfrastrukturȱ einzurichtenȱ undȱ dortȱalleȱNachrichtenȱvorȱderȱZustellungȱ„archivierungstauglich“ȱzuȱmachen.ȱȱ DasȱManagementȱderȱEȬMailȬFlutȱverlangtȱdaherȱintelligenteȱKonzepte.ȱEȬMailȱistȱ nurȱeinȱInformationstypȱunterȱvielen.ȱErȱistȱschwachȱstrukturiert,ȱweitgehendȱunȬ kontrolliert,ȱundȱdieȱordnungsgemäßeȱSpeicherungȱundȱZuordnungȱistȱimȱstarkenȱ MaßeȱvonȱderȱDisziplinȱderȱMitarbeiterȱabhängig.ȱȱ Technologienȱ zurȱ EȬMailȬArchivierungȱ tretenȱ gemeinsamȱ mitȱ DokumentenmanaȬ gementȬȱ oderȱ ECMȬSystemenȱ auf.ȱ Daȱ EȬMailsȱ inȱ einemȱ Zusammenhangȱ mitȱ geȬ schäftlichenȱ Aktivitätenȱ stehen,ȱ liegtȱ dieseȱ Verknüpfungȱ nahe.ȱ Imȱ Gegensatzȱ zuȱ Dokumentenȱ sindȱ EȬMailsȱ jedochȱ facettenreicher.ȱ Spamȱ istȱ vonȱ NichtȬSpamȱ zuȱ unterscheiden,ȱ VirenȬMailsȱ vonȱ harmlosenȱ Nachrichtenȱ oderȱ interneȱ Mailsȱ vonȱ externen.ȱ Diesȱ zeigt,ȱ dassȱ EȬMailȬLösungenȱ zwarȱ denȱ manuellenȱ Aufwandȱ reduȬ zieren,ȱaberȱletztlichȱnichtȱdasȱkritischeȱAugeȱdesȱAnwendersȱvollständigȱersetzenȱ können.ȱ Einȱ weiteresȱ Problemȱ entstehtȱ imȱ Zusammenhangȱ mitȱ denȱ ComplianceȬ Anforderungen,ȱ wennȱ Unternehmenȱ Mitarbeiternȱ gestatten,ȱ EȬMailȬKontenȱ fürȱ privateȱ Zweckeȱ zuȱ nutzen.ȱ Imȱ Sinneȱ desȱ Telekommunikationsgesetzesȱ wirdȱ dasȱ Unternehmenȱ damitȱ zuȱ einemȱ ServiceȬProvider,ȱ dasȱ nurȱ mitȱ derȱ ausdrücklichenȱ Einwilligungȱ desȱ Mitarbeitersȱ undȱ unterȱ Berücksichtigungȱ seinerȱ DatenschutzȬ interessenȱaufȱdieȱInhalteȱzugreifenȱkann.ȱUmȱnichtȱinȱjedemȱEinzelfallȱdasȱEinverȬ ständnisȱeinholenȱzuȱmüssen,ȱmussȱeineȱentsprechendeȱBetriebsvereinbarungȱoderȱ eineȱ Regelungȱ imȱ Arbeitsvertragȱ festgehaltenȱ werden.ȱ Inȱ diesemȱ Zusammenhangȱ entstehtȱ eineȱ weitereȱ Schwierigkeit:ȱ Wirdȱ eineȱ Mailȱ vomȱ Benutzerȱ gelesenȱ undȱ sofortȱ gelöscht,ȱ werdenȱ dieȱ meistenȱ Archivsystemeȱ umgangen.ȱ Unkenntnisȱ derȱ Rechtslageȱ führtȱ daherȱ dazu,ȱ dassȱ Informationenȱ verändert,ȱ gelöschtȱ oderȱ nachȱ eigenenȱOrdnungsprinzipienȱabgelegtȱwerden.ȱȱ ȱ
152 ȱ
5.2ȱȱArchivierungȱ
5.2.4
Rechtliche Aspekte elektronischer Archivierung
AufȱGrundȱderȱTatsache,ȱdassȱoptischeȱMedienȱnichtȱzuȱüberschreibenȱsind,ȱeignenȱ sieȱsichȱfürȱdasȱSpeichernȱvonȱDaten,ȱdieȱalsȱBeweismittelȱdienenȱmüssen.ȱDerȱEinȬ satzȱ elektronischerȱ Speichermedienȱ vorȱ Gerichtȱ istȱ grundsätzlichȱ zulässig,ȱ jedochȱ nichtȱkonkretȱgeregelt.ȱ Jedeȱ Aufzeichnungȱ kannȱ mitȱ ausreichenderȱ Technikȱ undȱ Fachkenntnissenȱ veränȬ dertȱ werden.ȱ Inȱ diesemȱ Sinneȱ istȱ jedesȱ Speichermediumȱ manipulierbar,ȱ wennȱ dieȱ internenȱKontrollenȱversagen.ȱȱUnternehmenȱhebenȱihreȱAufzeichnungenȱausȱeinerȱ VielzahlȱvonȱGründenȱauf:ȱalsȱGedächtnisȱdesȱUnternehmens,ȱumȱdenȱGesetzenȱzuȱ entsprechenȱ undȱ umȱ dasȱ Unternehmenȱ imȱ Falleȱ einerȱ gerichtlichenȱ Überprüfungȱ vorȱErmittlungȱundȱKlageȱzuȱschützen.ȱȱ Dieȱ elektronischeȱ Archivierungȱ mussȱ nachȱ Vorgabenȱ desȱ Gesetzgebersȱ strengenȱ formalenȱVorschriftenȱgenügen.ȱDerȱGesetzgeberȱnimmtȱbeiȱseinenȱBestimmungenȱ dabeiȱ nichtȱ aufȱ bestimmteȱ Technologienȱ Rücksicht,ȱ sondernȱ definiertȱ allgemeinȬ gültigeȱVorschriften,ȱdieȱfürȱalleȱArtenȱvonȱAblagenȱundȱArchivenȱGültigkeitȱbesitȬ zen.ȱDieseȱBeschränkungȱaufȱallgemeingültigeȱRegelungenȱistȱgrundsätzlichȱposiȬ tivȱ zuȱ bewerten,ȱ daȱ sichȱ Gesetzeȱ undȱ Verordnungenȱ nichtȱ inȱ eineȱ Abhängigkeitȱ vonȱ SoftȬȱ undȱ Hardwaretechnologieȱ begeben.ȱ Fürȱ denȱ Anwenderȱ ergibtȱ sichȱ hieȬ rausȱ jedochȱ dieȱ Notwendigkeitȱ zuȱ prüfen,ȱ obȱ dieȱ einzelnenȱ Systemeȱ denȱ Regelnȱ desȱGesetzgebersȱentsprechen.ȱDazuȱhatȱderȱVerbandȱOrganisationsȬȱundȱInformaȬ tionssystemeȱ(VOI)ȱ10ȱArchivȬGeboteȱformuliert.ȱ ȱ 1. 2. 3. 4. 5. 6. 7. 8.
ȱ
JedesȱDokumentȱmussȱunveränderbarȱarchiviertȱwerden.ȱ Esȱ darfȱ keinȱ Dokumentȱ aufȱ demȱ Wegȱ inȱ dasȱ Archivȱ oderȱ imȱ Archivȱselbstȱverlorenȱgehen.ȱ Jedesȱ Dokumentȱ mussȱ mitȱ geeignetenȱ Retrievaltechnikenȱ wiederȱauffindbarȱsein.ȱ Esȱ mussȱ genauȱ dasȱ Dokumentȱ gefundenȱ werden,ȱ dasȱ gesuchtȱ wurde.ȱ KeinȱDokumentȱdarfȱwährendȱseinerȱvorgesehenenȱLebenszeitȱ zerstörtȱwerdenȱkönnen.ȱ Jedesȱ Dokumentȱ mussȱ inȱ genauȱ derȱ Form,ȱ inȱ derȱ esȱ erfasstȱ wurde,ȱangezeigtȱwerdenȱkönnen.ȱ Jedesȱ Dokumentȱ mussȱ zeitnahȱ wiedergefundenȱ werdenȱ können.ȱ Alleȱ Aktionenȱ imȱ Archiv,ȱ dieȱ Veränderungenȱ ȱ inȱ derȱ Organisationȱ undȱ Strukturȱ bewirken,ȱ sindȱ derartȱ zuȱ protokollieren,ȱdassȱdieȱWiederherstellungȱdesȱursprünglichenȱ Zustandesȱmöglichȱist.ȱ
153
5ȱȱECMȱPreserveȬKomponenteȱ 9.
ElektronischeȱArchiveȱsindȱsoȱauszulegen,ȱdassȱeineȱMigrationȱ aufȱ neueȱ Plattformen,ȱ Medien,ȱ SoftwareȬVersionenȱ undȱ KomponentenȱohneȱInformationsverlustȱmöglichȱist.ȱ 10. Dasȱ Systemȱ mussȱ demȱ Anwenderȱ ermöglichen,ȱ dieȱ gesetzlichenȱ Bestimmungenȱ sowieȱ dieȱ betrieblichenȱ Vorgabenȱ desȱ Anwendersȱ hinsichtlichȱ Datensicherheitȱ undȱ Datenschutzȱ überȱdieȱLebensdauerȱdesȱArchivsȱsicherzustellen.ȱ ȱ OhneȱdieȱjuristischeȱAbsicherungȱdesȱVorgehensȱbeiȱeinerȱelektronischenȱArchivieȬ rungȱ istȱ dieseȱ sinnlos.ȱ Wennȱ Dokumenteȱ aufȱ optischenȱ Archivsystemenȱ aufgeȬ zeichnetȱ undȱ anschließendȱ inȱ ihrerȱ Papierformȱ vernichtetȱ werden,ȱ soȱ mussȱ dasȱ Aufzeichnungsverfahrenȱ denselbenȱ gesetzlichenȱ Anforderungenȱ genügenȱ wieȱ dieȱ Ablageȱ aufȱ Mikrofilmȱ oderȱ Papierȱ [Rasche,ȱ S.ȱ 35].ȱ Dazuȱ gehörtȱ dieȱ AufbewahȬ rungspflichtȱmitȱihrenȱAufbewahrungsfristen.ȱDerȱGesetzgeberȱschreibtȱnachȱ§147ȱ Abs.ȱ 1ȱ undȱ 3ȱ derȱ Abgabenordnungȱ unterschiedlicheȱ Aufbewahrungsfristenȱ vor.ȱ FürȱBilanzen,ȱInventare,ȱHandelsbücher,ȱJahresabschlüsseȱundȱLageberichteȱgeltenȱ 10ȱ Jahre,ȱ fürȱ empfangeneȱ oderȱ gesendeteȱ GeschäftsȬȱ oderȱ Handelsbriefeȱ undȱ BuȬ chungsbelegeȱsindȱ6ȱJahreȱausreichend.ȱAber:ȱ – optischeȱ Archivsystemeȱ sindȱ vomȱ Gesetzgeberȱ wederȱ verbotenȱ nochȱ geȬ nehmigtȱ – derȱ Gesetzgeberȱ schreibtȱ keineȱ Technikȱ vor,ȱ sondernȱ stelltȱ lediglichȱ AnforȬ derungenȱanȱdasȱAufbewahrungsverfahrenȱ[Rasche,ȱS.ȱ36]:ȱȱ o Dokumentenechtheitȱ o Vollständigkeitȱ o schnellerȱZugriffȱundȱReproduktionȱ o SicherungȱvorȱManipulationȱ o Richtigkeitȱ DerȱBeweischarakterȱeinerȱUrkundeȱistȱnurȱüberȱdasȱOriginalȱgegeben.ȱDamitȱdürȬ fenȱ Urkundenȱ zwarȱ digitalisiert,ȱ aberȱ nichtȱ vernichtetȱ werden.ȱ Grundlageȱ einerȱ optischenȱArchivierungȱbildetȱeineȱschriftlicheȱVerfahrensbeschreibung,ȱbestehendȱ aus:ȱ
ȱ
– – – – – –
154 ȱ
SystembeschreibungȱmitȱAufbauȬȱundȱAblauforganisationȱ OrdnungsprinzipȱderȱDokumenteȱ RegelnȱzurȱDokumenteneingabeȱ Kontrollverfahrenȱ Verarbeitungsvorschriftenȱ Sicherungsmechanismenȱ
5.3ȱȱTrendȱ GemäßȱderȱgesetzlichenȱNomenklaturȱlässtȱsichȱdieȱNutzungȱoptischerȱArchiveȱinȱ Aufzeichnung,ȱAufbewahrungȱundȱWiedergabeȱeinteilen.ȱDieȱgesetzlichenȱGrundȬ lagenȱfußenȱaufȱmehrerenȱSäulenȱ[Rasche,ȱS.ȱ37]:ȱȱ ȱ 1.
2.
3.
4. 5. 6.
Abgabenordnung:ȱ Durchȱ dieȱ Änderungenȱ derȱ Abgabenordnungȱ (AO)ȱ inȱ denȱ §146,ȱ 147ȱ undȱ 200ȱ vomȱ 23.10.2000ȱ hatȱ dieȱ Finanzverwaltungȱ seitȱ demȱ 1.1.2002ȱ umfangreicheȱ Zugriffsrechteȱ aufȱ dieȱ ITȬSystemeȱ vonȱ Unternehmen.ȱ Diesesȱ Zugriffsrechtȱ giltȱ unabhängigȱ vonȱ derȱ Unternehmensgrößeȱ undȱ beziehtȱ sichȱ aufȱ Betriebsprüfungenȱ allerȱArtȱ GDPdU:ȱ „Dieȱ Grundsätzeȱ zumȱ Datenzugriffȱ undȱ zurȱ Prüfbarkeitȱ digitalerȱ Unterlagen“ȱ sindȱ eineȱ Ergänzungȱ zurȱ gesetzlichenȱ Neuregelungȱ derȱ Abgabenordnungȱ undȱ stellenȱ dieȱ Sichtȱ undȱ Interpretationȱ derȱ Finanzverwaltungenȱ dar.ȱ Gegenüberȱ denȱ nachgeordnetenȱ Stellenȱ besitzenȱ sieȱ Verbindlichkeitscharakterȱ GoBS:ȱ Dieȱ „Grundsätzeȱ ordnungsgemäßerȱ DVȬgestützterȱ Buchführung“ȱ wurdenȱ imȱ Schreibenȱ desȱ Bundesministeriumsȱ derȱFinanzenȱanȱdieȱoberstenȱFinanzbehördenȱderȱLänderȱvomȱ 7.11.1995ȱ veröffentlicht.ȱ Sieȱ definierenȱ ergänzendȱ dieȱ handelsȬȱ undȱ steuerrechtlichenȱ Anforderungenȱ anȱ eineȱ DVȬgerechteȱ Buchführung,ȱ dieȱ ausȱ Sichtȱ desȱ Buchführungspflichtigenȱ alsȱ Mindestanforderungȱ zuȱ erfüllenȱ ist.ȱ Enthaltenȱ sindȱ Vorschriftenȱ zurȱ Aufbewahrungspflichtȱ steuerrelevanterȱ Dokumenteȱ undȱ Daten,ȱ zurȱ Prüfbarkeitȱ undȱ zurȱ DatenwiedergabeȱundȱȬablage.ȱ Handelsrecht:ȱ §238ȱ Buchführungspflicht,ȱ §239ȱ Führungȱ derȱ Handelsbücher,ȱ§261ȱUnterlagenȱaufȱBildȬ/Datenträgernȱ Steuerrecht:ȱ §146ȱ AOȱ Buchführungȱ undȱ Aufzeichnung,ȱ §147ȱ AOȱAufbewahrungȱvonȱUnterlagenȱ ZudemȱistȱaufȱfolgendeȱStellungnahmenȱhinzuweisen:ȱFAMAȬ Stellungnahmeȱ 1/1987ȱ undȱ Grundsätzeȱ ordnungsgemäßerȱ Speicherbuchführung,ȱBMF,ȱ1978ȱ
ȱ ȱ
5.3 Trend ArchivierungȱwarȱlangeȱZeitȱderȱauslösendeȱFaktorȱfürȱDokumentenmanagement.ȱ DieȱNotwendigkeit,ȱsichȱderȱüberquellendenȱPapierbergeȱzuȱentledigenȱundȱPlatzȱ
ȱ
155
5ȱȱECMȱPreserveȬKomponenteȱ sparendereȱMedienȱwieȱMikrofilmȱoderȱWORMȬPlattenȱeinzusetzen,ȱwarȱfürȱvieleȱ Unternehmenȱ dasȱ Motiv,ȱ eineȱ ersteȱ Berührungȱ mitȱ Dokumentenmanagementȱ zuȱ wagen.ȱVerdrängtȱwurdeȱdasȱProblem,ȱdassȱdurchȱdieȱTransformationȱdesȱPapiersȱ aufȱeinȱanderesȱMediumȱeineȱneueȱAbhängigkeitȱentsteht.ȱDieseȱAbhängigkeitȱistȱ zweifach:ȱeinerseitsȱdieȱvonȱderȱTechnik,ȱdieȱesȱermöglichenȱsoll,ȱdassȱdasȱabgelegȬ teȱ Schriftgutȱ überȱ einenȱ definiertenȱ Zeitraumȱ reproduzierbarȱ ist,ȱ andererseitsȱ dieȱ HaltbarkeitȱdesȱMediumȱselbst.ȱEinȱVergleichȱmitȱdenȱVerfahrenȱfrühererȱGeneraȬ tionȱzeigtȱdieȱGrenzen:ȱwährendȱHöhlenzeichnungenȱsichȱauchȱnachȱ15ȱ000ȱJahrenȱ erkennenȱlassen,ȱsinktȱdieȱHaltbarkeitȱvonȱMikrofilmenȱaufȱ400ȱJahreȱundȱdieȱvonȱ CDsȱ garȱ aufȱ 10ȱ Jahre.ȱ Hierȱ wirdȱ dieȱ grundsätzlicheȱ Problematikȱ derȱ AufbewahȬ rungȱsichtbar.ȱȱ Elektronischeȱ Signaturenȱ genießenȱ höchsteȱ Beweiskraft.ȱ Aberȱ andersȱ alsȱ dieȱ maȬ nuelleȱ Unterschriftȱ kannȱ ihreȱ Beweiskraftȱ sinken,ȱ wennȱ dieȱ zugrundeȱ liegendenȱ Algorithmenȱ unsicherȱ werden.ȱ Dieȱ Bundesnetzagenturȱ veröffentlichtȱ imȱ BundesȬ anzeigerȱdieȱZeiträumeȱinnerhalbȱdererȱdieȱfürȱelektronischeȱSignaturenȱverwendeȬ tenȱ Algorithmenȱ alsȱ sicherȱ gelten.ȱ Alsȱ Konsequenzȱ zeigtȱ derȱ Algorithmenkatalogȱ desȱ Bundesamtesȱ fürȱ Sicherheitȱ inȱ derȱ Informationstechnologieȱ (BSI),ȱ dassȱ eineȱ Erhöhungȱ derȱ Schlüssellängeȱ desȱ gängigenȱ Signaturverfahrensȱ RSAȱ aufȱ 2048ȱ Bitȱ notwendigȱist,ȱdaȱRSAȬ1024ȱnurȱbisȱzumȱ31.12.2007ȱvertrauenswürdigȱistȱundȱauchȱ dieȱHashfunktionȱSHAȬ1ȱalsȱnichtȱmehrȱzuverlässigȱeingestuftȱwird.ȱDieȱerfolgreiȬ chenȱAngriffeȱchinesischerȱForscherȱaufȱdasȱSHAȬ1ȬVerfahrenȱhabenȱgezeigt,ȱdassȱ dieȱHalbwertzeitȱalsȱsicherȱeingestufterȱKonzepteȱsinkt.ȱDiesȱbedeutetȱzwarȱnicht,ȱ dassȱdasȱFälschenȱoderȱEntschlüsselnȱsignierterȱDokumenteȱsehrȱleichtȱmöglichȱist,ȱ daȱnochȱimmerȱfürȱderartigeȱAngriffeȱunrealistischeȱZeitvorstellungenȱundȱenormeȱ Hardwareȱerforderlichȱist.ȱDennochȱreduziertȱsichȱdasȱSicherheitsniveau.ȱFürȱUnȬ ternehmenȱbedeutetȱdiesȱzweierlei:ȱsieȱmüssenȱnichtȱnurȱdieȱneuestenȱAlgorithmenȱ fürȱdasȱHashenȱundȱSignierenȱvonȱneuȱhinzukommendenȱDokumentenȱverwenden,ȱ sondernȱ auchȱ Vorsorgeȱfürȱ denȱ Zeitpunktȱ tragen,ȱzuȱdemȱ dieseȱVerfahrenȱ anȱ BeȬ weiskraftȱ verlieren.ȱ Damitȱ gehtȱ einȱ Kostenargumentȱ einher:ȱ dasȱ erneuteȱ Hashenȱ großerȱ Dokumentenmengenȱ istȱ teuer,ȱ erfordertȱ Rechenkapazitätȱ undȱ bindetȱ ArȬ beitskraft,ȱdaȱjedesȱDokumentȱeinzelnȱausȱdemȱArchivȱaufgerufenȱwerdenȱmuss.ȱ Einenȱ alternativenȱ Wegȱ zurȱ rechtssicherenȱ Langzeitarchivierungȱ beschreibtȱ derȱ 2007ȱ verabschiedeteȱ IETFȬStandardȱ Evidenceȱ Recordȱ Syntaxȱ (ERS),ȱ mitȱ demȱ sichȱ Signaturenȱ fürȱ größereȱ Dokumentenmengenȱ automatischȱ undȱ beliebigȱ oftȱ erȬ neuernȱlassen.ȱERSȱerzeugtȱfürȱjedesȱarchivierteȱDokumentȱeinȱweiteresȱBeweisdoȬ kumentȱ(EvidenceȱRecord),ȱmitȱdemȱbewiesenȱwerdenȱkann,ȱdassȱdieȱverwendeteȱ Signaturȱ alsȱ auchȱ dasȱ Dokumentȱ vorȱ ihremȱ Verfallsdatumȱ existiertenȱ undȱ nichtȱ verändertȱwurden.ȱZurȱSignaturerneuerungȱfolgtȱERSȱeinerȱeinfachenȱIdee:ȱAnstattȱ jedesȱeinzelneȱDokumentȱneuȱmitȱeinemȱZeitstempelȱzuȱversehen,ȱwerdenȱBestänȬ deȱinȱeinemȱHashbaumȱzusammengefasst,ȱinȱdemȱdieȱHashwerteȱderȱDokumenteȱ dieȱBlätterȱbilden.ȱNurȱdieȱWurzelȱverfügtȱüberȱdenȱaktuellenȱZeitstempel,ȱderȱdieȱ IntegritätȱdesȱBaumesȱgarantiert.ȱDieȱSicherheitȱkannȱnochȱeineȱStufeȱweiterȱgetrieȬ
156 ȱ
5.3ȱȱTrendȱ benȱ werden,ȱ indemȱ dieȱ Dokumenteȱ mitȱ einemȱ zweitenȱ HashȬAlgorithmusȱ verȬ schlüsseltȱwerden.ȱSoȱentstehenȱzumȱgleichenȱDokumentenbestandȱzweiȱverschieȬ deneȱ Hashbäume,ȱ dieȱ mitȱ Zeitstempelnȱ signiertȱ werden.ȱ Selbstȱ wennȱ einȱ HashȬ Algorithmusȱ nichtȱ mehrȱ alsȱ rechtssicherȱ angesehenȱ wird,ȱ istȱ dieȱ Sicherheitȱ durchȱ denȱanderenȱAlgorithmusȱgewährleistet.ȱ DerȱNutzenȱdiesesȱVorschlagesȱwirdȱevident,ȱwennȱeinȱangewendetesȱSignaturverȬ fahrenȱ seineȱ Rechtssicherheitȱ verliertȱ undȱ dieȱ Dokumenteȱ mitȱ einerȱ größerenȱ Schlüssellängeȱ nachsigniertȱ werdenȱ müssen.ȱ Dieȱ Dokumenteȱ selbstȱ bleibenȱ unbeȬ rührt,ȱvielmehrȱwerdenȱnurȱdieȱEinträgeȱderȱbestehendenȱHashbäumeȱ(Hashwertȱ derȱ Dokumenteȱ undȱ Zeitstempel)ȱ inȱ einenȱ neuenȱ Hashbaumȱ übertragenȱ undȱ mitȱ einemȱgültigenȱZeitstempelȱversehen.ȱAufwändigerȱistȱdasȱzweiteȱSzenario,ȱwennȱ derȱHashalgorithmusȱanȱBeweiskraftȱverliertȱundȱdurchȱeinenȱvollständigȱanderenȱ Algorithmusȱersetztȱwerdenȱmuss.ȱInȱdiesemȱFallȱgehtȱkeinȱWegȱanȱeinemȱerneuȬ tenȱSignierprozessȱvorbei,ȱallerdingsȱexistiertȱzurȱSicherheitȱderȱzweiteȱHashbaum,ȱ soȱdassȱdasȱZeitargumentȱfürȱdasȱResignierenȱentfälltȱ[Horst,ȱS.ȱ62Ȭ64]ȱȱ Einȱ weitererȱ Gesichtspunktȱ inȱ derȱ Funktionȱ desȱ Markttreibersȱ istȱ derȱ ComplianȬ cedruck.ȱDieȱEinhaltungȱrechtlicherȱundȱregulativerȱVorgabenȱinȱFormȱprozessbeȬ gleitenderȱ Dokumentationȱ istȱ seitȱ demȱ Septemberȱ 2001ȱ starkȱ gestiegen.ȱ Sichereȱ Speicherungȱ undȱ vorȱ allemȱ Nachvollziehbarkeitȱ derȱ Transaktionenȱ sindȱ fürȱ eineȱ Vielzahlȱ vonȱ Unternehmenȱ zurȱ Pflichtȱ geworden.ȱ Regelungenȱ wieȱ derȱ SarbanesȬ Oxleyȱ Actȱ oderȱ Baselȱ IIȱ erhöhenȱ zwarȱ dieȱ Qualitätȱ undȱ dieȱ Transparenzȱ derȱ ProȬ zesse,ȱ sindȱ aberȱ aufȱ derȱ anderenȱ Seiteȱ naturgemäßȱ auchȱ Kostentreiber.ȱ Bedingtȱ durchȱ dieseȱ Entwicklungȱ erlangtȱ derȱ Begriffȱ desȱ Recordsȱ Managementsȱ eineȱ beȬ sondereȱ Bedeutung.ȱ Recordsȱ Managementȱ hatȱ dasȱ Zeugȱ dazu,ȱ dieȱ herkömmlicheȱ elektronischeȱArchivierungȱzuȱersetzen.ȱDieȱkonzeptionelleȱTrennungȱvonȱArchivȬ speichernȱ undȱ Verwaltungȱ vonȱ Records,ȱ d.h.ȱ zuȱ archivierenderȱ Datensätzeȱ stehtȱ dabeiȱ imȱ Mittelpunkt.ȱ Getriebenȱ wirdȱ dieserȱ Trendȱ durchȱ Standardsȱ wieȱ PDF/Aȱ oderȱMoReq2ȱ(ModelȱRequirementsȱforȱtheȱManagementȱofȱElectronicȱRecords).ȱȱ MitȱMoReq2ȱexistiertȱseitȱ2001ȱdieȱeinzigeȱbranchenunabhängigeȱSpezifikationȱfürȱ denȱAufbauȱundȱBetriebȱvonȱDokumentenȬȱundȱRecordsȱManagementȬSystemenȱinȱ Europaȱ alsȱ Ergebnisȱ einerȱ Initiativeȱ derȱ EU,ȱ dieȱ einenȱ einheitlichenȱ DokumentenȬ austauschȱ mitȱ denȱ Regierungenȱ derȱ Mitgliedsstaatenȱ imȱ Augeȱ hat.ȱ Dieȱ aktuelleȱ Versionȱ MoReq2ȱ wurdeȱ imȱ Frühjahrȱ 2008ȱ freigegeben.ȱ Dieȱ Spezifikationȱ umfasstȱ rundȱ390ȱRichtlinienȱausȱdenȱBereichenȱSystemfunktionen,ȱKlassifikationsschemata,ȱ Zugriffsverwaltungȱ undȱ Sicherheit,ȱ Aufbewahrungȱ undȱ Vernichtung,ȱ Erfassungȱ vonȱ Schriftgut,ȱ Retrievalȱ undȱ Ausgabe.ȱ Derȱ Vorteilȱ dieserȱ Standardisierungȱ liegtȱ darin,ȱdassȱdieȱHerstellerȱeinenȱverbindlichenȱOrientierungspunktȱfürȱihreȱProdukȬ teȱ besitzenȱ undȱ darüberȱ hinausȱ nichtȱ jedesȱ Landȱ einenȱ eigenenȱ Vorschlagȱ inȱ derȱ Implementierungȱ unterstützenȱ kann.ȱ Anwenderȱ erhaltenȱ damitȱ einȱ standardisierȬ tes,ȱaustauschbaresȱundȱkompatiblesȱProdukt.ȱMoReqȱschließtȱfernerȱAnforderunȬ genȱ anȱ begleitendeȱ Systemeȱ ein,ȱ dieȱ dieȱ Verwaltungȱ vonȱ Recordsȱ begleiten;ȱ dazuȱ zählenȱWorkflow,ȱEȬMailȬManagementȱoderȱdigitaleȱSignaturen.ȱDasȱDMSȬUmfeldȱ
ȱ
157
5ȱȱECMȱPreserveȬKomponenteȱ knüpftȱ großeȱ Hoffnungenȱ anȱ diesenȱ Standard.ȱ Erȱ könnteȱ dieȱ Entwicklungȱ undȱ europaweiteȱ Einführungȱ entsprechendȱ zertifizierterȱ Systemeȱ beschleunigen,ȱ alsȱ Referenzȱ dienenȱ oderȱ ServiceȬLevelȱ imȱ Recordsmanagementȱ vorschreibenȱ [CWȱ 2008,ȱS.ȱ9].ȱAllerdingsȱentzündetȱsichȱauchȱKritikȱanȱdenȱumfassendenȱFestlegunȬ genȱdesȱStandards.ȱEinȱdiskutierterȱGesichtspunktȱistȱdieȱErkenntnis,ȱdassȱsichȱdieȱ AnforderungenȱdesȱursprünglichenȱMoReqȬGedankensȱnurȱteilweiseȱmitȱdenȱklasȬ sischenȱDokumentenmanagementȬȱoderȱArchivfunktionenȱdecken.ȱZuȱdenȱfehlenȬ denȱ Merkmalenȱ zählenȱ Aspekteȱ wieȱ virtuelleȱ Aktenȱ oderȱ journalbasierteȱ MailȬ Archivierung.ȱZudemȱwirdȱbemängelt,ȱdassȱMoReq2ȱunnötigȱdetaillierteȱVorgabenȱ fürȱeinigeȱ Funktionenȱ festlegt,ȱ dieȱ technischeȱ Konsequenzenȱ beiȱderȱ SystemarchiȬ tekturȱ nachȱ sichȱ ziehen.ȱ Einȱ Beispielȱ hierfürȱ istȱ dasȱ statischȱ hierarchischeȱ AktenȬ modell,ȱdasȱdenȱUmgangȱmitȱvirtuellenȱAktenȱaushebelt.ȱ
5.4 Kontrollfragen 1. 2. 3.
ȱ
WasȱsindȱdieȱHerausforderungenȱderȱEȬMailȬArchivierung?ȱ IstȱComplianceȱnurȱeinȱModethema?ȱ Istȱ revisionssichereȱ Archivierungȱ einȱ Synonymȱ fürȱ langfristigeȱ ArchivieȬ rung?ȱ 4. Welcherȱ Bezugȱ bestehtȱ zwischenȱ Dokumentdeskriptorenȱ undȱ ArchivieȬ rung?ȱ 5. WelcheȱAspekteȱbestimmenȱdieȱArchivierungȱundȱdieȱArchivierungsdauer?ȱ 6. WelcheȱgesetzlichenȱGrundlagenȱbeeinflussenȱdieȱArchivierung?ȱ 7. Warumȱ istȱ nichtȱ jedesȱ Mediumȱ zurȱ revisionssicherenȱ Archivierungȱ geeigȬ net?ȱ 8. WelcheȱZugriffsformenȱunterscheidetȱdieȱGDPdU?ȱ 9. Welcheȱ Problemeȱ existierenȱ fürȱ dieȱ Festlegungȱ einesȱ Attributesȱ „GDPdUȬ konform“?ȱ 10. WelcheȱAspekteȱlöstȱeinȱArchivierungsstandardȱPDF/Aȱundȱwelcheȱbleibenȱ offen?ȱ
158 ȱ
6 ECM Store-Komponente Dieȱ „Store“ȬKomponenteȱ dientȱ zurȱ temporärenȱ Speicherungȱ vonȱ Informationen,ȱ dieȱ nichtȱ archivierungswürdigȱ oderȱ archivierungspflichtigȱ sind.ȱ Auchȱ wennȱ MeȬ dienȱzumȱEinsatzȱkommen,ȱdieȱfürȱeineȱLangzeitarchivierungȱgeeignetȱsind,ȱistȱderȱ „StoreȬ“ȱ vomȱ „Preservation“ȬTeilȱ durchȱ denȱ Inhaltȱ abgegrenzt.ȱ Imȱ deutschenȱ Sprachgebrauchȱ sindȱ dieseȱ Komponentenȱ mitȱ der„Ablage“ȱ imȱ Unterschiedȱ zumȱ „Archiv“ȱgleichzusetzenȱ[Kampffmeyerȱ2007,ȱS.ȱ64].ȱ DieȱvonȱderȱAIIMȱaufgeführtenȱ„Store“ȬKomponentenȱlassenȱsichȱdreiȱunterschiedȬ lichenȱBereichenȱzuordnen,ȱ„Repositories“ȱalsȱSpeicherorte,ȱ„LibraryȱServices“ȱalsȱ Verwaltungskomponenteȱ fürȱ dieȱ Speicherorte,ȱ undȱ „Technologies“ȱ alsȱ unterȬ schiedlicheȱSpeichertechnologienȱ[ebenda].ȱ
6.1 Repositories Zuȱ denȱ Repositoriesȱ gehörenȱ Contentȱ ManagementȬSysteme,ȱ Datenbanken,ȱ Dataȱ Warehousesȱ oderȱ Filesysteme.ȱ Contentȱ ManagementȬSystemeȱ sindȱ bereitsȱ inȱ 1.1ȱ näherȱerläutertȱworden.ȱ
6.1.1
Data Warehouse
Derȱ Begriffȱ wurdeȱ 1992ȱ vonȱ W.ȱ Immonȱ geprägt.ȱ Dataȱ Warehouseȱ bezeichnetȱ daȬ nachȱeineȱthemenorientierte,ȱintegrierte,ȱzeitbezogeneȱundȱdauerhafteȱDatensammȬ lungȱzurȱEntscheidungsunterstützungȱdesȱManagements.ȱDieȱThemenorientierungȱ richtetȱsichȱaufȱdenȱAufbauȱnachȱObjektenȱwieȱProdukte,ȱKundenȱoderȱMärkte,ȱdieȱ Integrationȱ beschreibtȱ dieȱ Zusammenführungȱ verteilterȱ Informationenȱ inȱ einenȱ einheitlichen,ȱunternehmensweitenȱDatenbestand,ȱwobeiȱsichȱderȱZeithorizontȱaufȱ historische,ȱgegenwärtigeȱundȱzukünftigeȱEntwicklungenȱausrichtet.ȱImȱGegensatzȱ zuȱdenȱoperativenȱSystemenȱhandeltȱesȱsichȱbeiȱeinemȱDataȱWarehouseȱumȱeinenȱ dauerhaftenȱDatenbestand.ȱDaȱdieȱDatenȱnichtȱmehrȱvolatilȱsind,ȱlassenȱsichȱaussaȬ gekräftigeȱ Zeitvergleicheȱ herstellenȱ undȱ Auswertungenȱ undȱ Analysenȱ jederzeitȱ wiederholenȱoderȱreproduzieren.ȱ Technischȱ betrachtetȱ istȱ einȱ Dataȱ Warehouseȱ einȱ Datenbanksystem,ȱ inȱ demȱ dieȱ Datenȱ ausȱ unterschiedlichenȱ Systemen,ȱ eventuellȱ ergänztȱ umȱ externeȱ Daten,ȱ einȬ fließenȱ undȱ inȱ einenȱ abteilungsübergreifendenȱ Zusammenhangȱ gestelltȱ werden.ȱ HäufigȱwerdenȱdieȱBegriffeȱDataȱWarehouseȱundȱDataȱWarehousingȱverwechselt.ȱ UnterȱDataȱWarehousingȱistȱdieȱGesamtheitȱderȱProzesse,ȱdieȱdasȱDataȱWarehouseȱ aufbauen,ȱ zuȱ verstehen.ȱ Hierunterȱ fälltȱ dasȱ Sammelnȱ entscheidungsrelevanterȱ Detaildatenȱ inȱ einenȱ gemeinsamenȱ unternehmensweitenȱ Datenpool.ȱ Dataȱ WareȬ
ȱ
159
6ȱȱECMȱStoreȬKomponenteȱ houseȱ richtetȱ sichȱ aufȱ denȱ Anspruch,ȱ ausȱ derȱ Vielzahlȱ derȱ vorhandenenȱ UnterȬ nehmensdatenȱentscheidungsrelevanteȱfürȱdieȱZweckeȱderȱAuswertungȱȱbereitȱzuȱ stellen.ȱ Durchȱ seineȱ ständigeȱ Veränderungȱ erscheintȱ einȱ Dataȱ Warehouseȱ dynaȬ misch.ȱ Veränderteȱ Produkte,ȱ neueȱ Kundenȱ oderȱ hinzugekommeneȱ Märkteȱ erforȬ dernȱdieȱAufnahmeȱweitererȱDaten,ȱdieȱdenȱDetaillierungsgradȱbeeinflussen.ȱȱ
6.1.2
Filesysteme
Alleȱ Anwendungenȱ müssenȱ Informationenȱ speichernȱ undȱ wiederȱ finden.ȱ Dazuȱ müssenȱDatenȱinȱeinemȱSystemȱdauerhaftȱabgelegtȱsein.ȱBetriebssystemeȱunterstütȬ zenȱ dieȱ Datenablage,ȱ indemȱ sieȱ Informationenȱ inȱ Dateienȱ zusammenfassen.ȱ Dieȱ BenutzerȱinteressierenȱdabeiȱinȱersterȱLinieȱAspekteȱwieȱEigenschaftenȱeinerȱDatei,ȱ ihrȱNameȱundȱwelcheȱOperationenȱaufȱihnenȱerlaubtȱsind.ȱDieȱDetailsȱderȱVerwalȬ tungȱbelegtenȱoderȱfreienȱSpeicherplatzesȱsindȱfürȱihnȱvonȱgeringeremȱInteresse.ȱ WichtigeȱAufgabenȱundȱEntwurfskriterienȱsindȱdaher: – StrukturierungȱvonȱDateien – BenennungȱundȱPfade – Zugriffȱ(Operationen,ȱFormen,ȱSpeicherung) – SchutzȬȱundȱSicherheitsmechanismen – Implementierung Geradeȱ inȱ derȱ Architekturȱ dieserȱ Strukturȱ liegtȱ dieȱ Besonderheitȱ derȱ einzelnenȱ Konzepte.ȱ Obwohlȱ UNIX/LINUXȱ undȱ MSȬWindowsȱ ähnlicheȱ Ansätzeȱ verfolgen,ȱ unterscheidenȱsieȱsichȱimȱDetailȱerheblich.ȱDifferenzenȱexistieren:ȱ – inȱderȱdynamischenȱErweiterbarkeitȱvonȱFilesystemenȱ – derȱZuordnungȱfesterȱSpeichergrößeȱfürȱeinzelneȱBenutzerȱ – derȱDefinitionȱvonȱFilesystemenȱüberȱmehrereȱMedienȱ Eineȱ Dateiȱ bestehtȱ ausȱ einerȱ unstrukturiertenȱ Mengeȱ vonȱ Bytes,ȱ wobeiȱ dasȱ BeȬ triebssystemȱ nichtsȱ überȱ denȱ Dateiinhaltȱ weiß.ȱ Ausȱ diesemȱ Organisationsprinzipȱ resultiertȱeineȱmaximaleȱFlexibilitätȱbezüglichȱderȱInformationsnutzung,ȱdaȱkeinerȬ leiȱRestriktionenȱhinsichtlichȱInhalt,ȱAnwendungȱundȱInterpretationȱbestehen.ȱDaȬ teienȱsollenȱ – aufȱnichtflüchtigenȱMedienȱmitȱ – geringenȱZugriffszeitenȱundȱzuȱgeringenȱKostenȱ – gespeichertȱwerdenȱundȱlesendenȱundȱschreibendenȱZugriffȱgewähren.ȱ DateienȱkönnenȱdreiȱErscheinungsformenȱannehmen:ȱ – Gewöhnlicheȱ Dateienȱ sindȱ inȱ derȱ Regelȱ ASCIIȬȱ oderȱ Binärdateien.ȱ UNIXȱ kenntȱdarüberȱhinausȱvieleȱweitereȱVarianten:ȱShellȬScripts,ȱSCCSȬFiles,ȱetc.ȱ – Verzeichnisseȱ dienenȱ alsȱ Systemdateienȱ zurȱ Verwaltungȱ undȱ StrukturieȬ rungȱdesȱFilesystemsȱ – SpezialdateienȱbeschreibenȱdieȱBetriebsmittel.ȱSieȱunterscheidenȱsichȱinȱzeiȬ chenȬȱundȱblockorientierteȱVarianten.ȱ
160 ȱ
6.3ȱȱSpeichermedienȬTechnologienȱ Einȱ Filesystemȱ entsprichtȱ damitȱ derȱ Organisationȱ vonȱ Blöckenȱ aufȱ demȱ SpeicherȬ mediumȱzurȱAblageȱvonȱ – VerzeichnissenȱfürȱdasȱganzeȱFilesystemȱ – VerzeichnissenȱfürȱBeschreibungenȱallerȱDateienȱ – VerzeichnissenȱvonȱVerkettungenȱvonȱBlöckenȱ – NutzdatenȱfürȱbelegteȱsowieȱfreieȱBlöckeȱ
6.2 Library Service Derȱ Libraryȱ Serviceȱ istȱ letztlichȱ fürȱ denȱ Empfangȱ undȱ dieȱ Speicherungȱ derȱ InforȬ mationenȱ ausȱ denȱ ȱ „Capture“Ȭȱ undȱ denȱ „Manage“ȬKomponentenȱ verantwortlich.ȱ Erȱ verwaltetȱ gleichermaßenȱ dieȱ Speicherorteȱ inȱ derȱ dynamischenȱ Ablage,ȱ demȱ eigentlichenȱ„Store“ȱundȱimȱLangzeitarchiv,ȱdemȱ„Preserve“.ȱȱ Währendȱ dieȱ Datenbankȱ keineȱ Kenntnisȱ überȱ denȱ physischenȱ Speicherortȱ einesȱ Objektesȱhat,ȱverwaltetȱderȱLibraryȱServiceȱ[Kampffmeyerȱ2007,ȱS.67]:ȱ – OnlineȬSpeicherȱfürȱDatenȱundȱDokumenteȱimȱdirektenȱZugriff,ȱ – NearlineȬSpeicherȱ fürȱ Datenȱ undȱ Dokumenteȱ aufȱ einemȱ Medium,ȱ dasȱ sichȱ imȱ Zugriffȱ desȱ Laufwerksȱ befindet,ȱ aberȱ erstȱ durchȱ eineȱ Robotikȱ eingelegtȱ werdenȱmussȱ – OfflineȬSpeicherȱfürȱDatenȱundȱDokumenteȱaufȱeinemȱMedium,ȱdasȱausgeȬ lagertȱwurdeȱundȱsichȱnichtȱimȱautomatisiertenȱZugriffȱeinesȱSystemsȱbefinȬ det.ȱ Fürȱ dieȱ Speicherungȱ derȱ Informationenȱ könnenȱ jeȱ nachȱ Anwendungszweckȱ undȱ Systemumgebungȱ sehrȱ unterschiedlicheȱ Medienȱ zumȱ Einsatzȱ kommen:ȱ Mehrfachȱ beschreibbareȱ magnetischeȱ OnlineȬSpeicher,ȱ Tapesȱ (Magnetbänder)ȱ oderȱ digitaleȱ optischeȱSpeichermedien.ȱ
6.3 Speichermedien-Technologien Dieȱ Eignungȱ einerȱ Speichertechnologieȱ hängtȱ entscheidendȱ vonȱ ihrenȱ technischȬ physikalischenȱEigenschaftenȱab:ȱȱ – Herkömmlicheȱ magnetischeȱ Speichermedienȱ sindȱ nichtȱ geeignetȱ fürȱ dieȱ elektronischeȱ Archivierung,ȱ daȱ dieȱ gespeichertenȱ Informationenȱ jederzeitȱ geändertȱ undȱ überschriebenȱ werdenȱ können.ȱ Diesȱ betrifftȱ imȱ besonderenȱ Maßeȱ Festplatten,ȱ dieȱ vonȱ Betriebssystemenȱ dynamischȱ verwaltetȱ werden.ȱ MagnetischeȱEinflüsse,ȱ„HeadȬCrashs“ȱundȱandereȱRisikenȱweisenȱdenȱFestȬ plattenȱdieȱRolleȱderȱreinenȱOnlinespeicherȱzu.ȱȱ – BeiȱMagnetbändernȱkommtȱnebenȱderȱLöschbarkeitȱhinzu,ȱdassȱdieseȱhohenȱ BelastungenȱundȱAbnutzungenȱsowieȱmagnetischenȱÜberlagerungenȱbeiȱzuȱ langerȱAufbewahrungȱunterliegen.ȱȱ ȱ
ȱ
161
6ȱȱECMȱStoreȬKomponenteȱ Revisionssichereȱ Archiveȱ erweiternȱ aufgrundȱ ihrerȱ Funktionalitätȱ dieȱ AnfordeȬ rungspaletteȱanȱSpeichermedien:ȱ – DieȱabgelegtenȱDatenȱdürfenȱnachträglichȱnichtȱmodifiziertȱwerdenȱkönnen.ȱ – EinȱArchivȱmussȱauchȱnachȱeinerȱAufbewahrungsfristȱvonȱ30ȱJahrenȱdieȱDoȬ kumenteȱimȱOriginalzustandȱreproduzierenȱkönnen.ȱ Beideȱ Anforderungenȱ lassenȱ sichȱ gegenwärtigȱ nurȱ mitȱ optischenȱ Medienȱ realisieȬ ren.ȱHinzuȱkommenȱausȱHardwaresichtȱJukeboxes,ȱdieȱalsȱRoboterȱeinenȱautomatiȬ schenȱWechselȱderȱMedienȱzwischenȱihrenȱLagerplätzenȱundȱdenȱoptischenȱLaufȬ werkenȱ erlauben.ȱ Grundsätzlichȱ lassenȱ sichȱ dreiȱ Kategorienȱ optischerȱ DatenspeiȬ cherȱunterscheiden:ȱ – Voraufgezeichneteȱ Medien:ȱ Inȱ dieseȱ Klasseȱ fallenȱ dieȱ CDȬROMȱ (Compactȱ DiskȱReadȱOnlyȱMemory)ȱundȱinteraktiveȱVideodisksȱinȱFormȱderȱklassischeȱ AudioȬCDȱ oderȱ derȱ CDȱ zurȱ Softwaredistribution.ȱ Ursprünglichȱ konntenȱ CDsȱnurȱ74ȱMinutenȱhochqualitativenȱdigitalisiertenȱTonȱaufnehmen,ȱinzwiȬ schenȱspeichernȱsieȱ650ȱMBȱComputerdatenȱoderȱ74ȱMinutenȱVideoȱinȱVHSȬ Qualität.Technischȱ bedingtȱ ergebenȱ sichȱ relativȱ geringeȱ Transferraten,ȱ weilȱ dieȱDatenȱzwarȱmitȱgleicherȱSpeicherdichteȱaufgenommenȱwerden,ȱdieȱRotaȬ tionsgeschwindigkeitȱ sichȱ aberȱ zwischenȱ Scheibenmitteȱ undȱ Ȭrandȱ unterȬ scheidet.ȱSollȱdieȱDatenrateȱunterȱdemȱLesekopfȱkonstantȱsein,ȱmussȱdieȱRoȬ tationsgeschwindigkeitȱ jeȱ nachȱ Lesekopfpositionȱ angepasstȱ werden,ȱ daȱ inȱ denȱ äußerenȱScheibenbereichenȱ mehrȱ Informationenȱuntergebrachtȱ sindȱalsȱ inȱdenȱinneren.ȱFürȱdieȱArchivierungȱeignenȱsichȱCDȬROMsȱnurȱbedingt,ȱdaȱ dasȱ Schreibenȱ inȱ einemȱ ununterbrochenenȱ Arbeitsgangȱ erfolgenȱ mussȱ undȱ einȱLesenȱderȱInformationenȱerstȱdannȱmöglichȱist,ȱwennȱeineȱCDȱvollstänȬ digȱbeschriebenȱist.ȱ – Einmalbeschreibbareȱ Medien:ȱ Dasȱ Mediumȱ kannȱ direktȱ vomȱ Anwenderȱ beschriebenȱ werden,ȱ erlaubtȱ aberȱ keineȱ anschließendeȱ Manipulationȱ ohneȱ Zerstörungȱ desȱ Mediums.ȱ Dieserȱ Medientypȱ wahrtȱ damitȱ dieȱ rechtlichenȱ Vorschriftenȱ undȱ bildetȱ demzufolgeȱ dieȱ Grundlageȱ derȱ revisionssicherenȱ ArchivierungȱundȱAufzeichnungȱkritischerȱDaten.ȱ o
WORMȱ(WriteȱOnceȱReadȱManyȱ):ȱWORMȬFestplattenȱmitȱbisȱzuȱ einemȱTerabyteȱSpeicherkapazitätȱsowieȱWORMȬBänderȱmitȱbisȱzuȱ 800ȱ Gigabyteȱ Größeȱ habenȱ sichȱ inȱ dieserȱ Kategorieȱ alsȱ Standardȱ etabliert.ȱDieȱBedienungȱdiesesȱMediumsȱunterscheidetȱsichȱerhebȬ lichȱvonȱüblichenȱmagnetischenȱSpeichermedien.ȱSoȱentfälltȱ
dieȱFormatierung,ȱdaȱsieȱnurȱeinmalȱbeschreibbarȱsindȱȱ einȱVerzeichnisȱderȱbeschädigtenȱSpeicherstellen.ȱȱ
BeiȱjedemȱSchreibvorgangȱmussȱgeprüftȱwerden,ȱobȱdieȱgeschriebeȬ neȱ Informationȱ auchȱ lesbarȱ ist.ȱ Imȱ Fehlerfallȱ werdenȱ dieȱ Datenȱ erȬ neutȱanȱeineȱandereȱStelleȱgeschrieben.ȱDieserȱUmstandȱführtȱzuȱeiȬ nemȱhohenȱPrüfaufwandȱundȱreduziertȱdieȱSchreibgeschwindigkeit.ȱ
162 ȱ
6.3ȱȱSpeichermedienȬTechnologienȱ Dennochȱ sorgtȱ eineȱ spezielleȱAdressierungȱ undȱ Kodierungȱ fürȱdieȱ SicherheitȱderȱInformation.ȱHinzuȱkommtȱdieȱHaltbarkeit:ȱHerstelȬ lerȱgarantierenȱinȱderȱRegelȱ30ȱJahre.ȱDiesȱistȱnurȱeineȱSeiteȱderȱMeȬ daille:ȱUnternehmenȱmüssenȱsicherstellen,ȱdassȱdieȱabgelegtenȱDaȬ tenȱ währendȱ desȱ Aufbewahrungszeitraumsȱ nichtȱ nurȱ physikalischȱ lesbar,ȱ sondernȱ auchȱ logischȱ verarbeitbarȱ bleiben.ȱ Dieseȱ AnfordeȬ rungȱkannȱbesondersȱbeiȱproprietärenȱFormatenȱzuȱSchwierigkeitenȱ führen.ȱ Optischeȱ Medienȱ sindȱ eineȱ derȱ wenigenȱ Technologien,ȱ dieȱ eineȱ Langzeitarchivierungȱlängerȱalsȱ50ȱJahreȱundȱeineȱphysikalischȱgaȬ rantierteȱWORMȬFunktionalitätȱgewährleisten.ȱUDOȱ–ȱUltraȱDensiȬ tyȱOpticalȱ–ȱhatȱsichȱalsȱNachfolgerȱderȱäußerstȱzuverlässigenȱMOȬ Technologieȱ etabliert.ȱ Mitȱ UDO2ȱ –ȱ 60ȱ GBȱ proȱ Mediumȱ –ȱ erzielenȱ SpeichersystemeȱeinenȱsehrȱgünstigenȱPreisȱproȱGB.ȱDieȱTechnoloȬ gieȱ gibtȱ esȱ inȱ zweiȱ Formen:ȱ wiederȱ beschreibbareȱ undȱ einmalȱ beȬ schreibbareȱ Medienȱ inȱ einerȱ Cartridge.ȱ Dieȱ einmalȱ beschreibbarenȱ Medienȱ sindȱ Trueȱ Writeȱ OnceȬMedien.ȱ Sieȱ sindȱ idealȱ fürȱ dieȱ vomȱ GesetzgeberȱverlangteȱrevisionssichereȱArchivierung.ȱ o
CDȬRȱ (Compactȱ Diskȱ Recordableȱ ):ȱCDȬRȱundȱdieȱdamitȱzusamȬ menhängendenȱ Medienȱ ermöglichenȱ es,ȱ dieȱ Unveränderbarkeitȱ derȱ Dokumenteȱ zuȱ gewährleisten.ȱ Somitȱ stehtȱ dieseȱ Technologieȱ alsȱinteressanteȱAlternativeȱzuȱWORMȱzurȱVerfügung.ȱDerȱVorteilȱ desȱ Einsatzesȱ derȱ CDȬRȬTechnologieȱ liegtȱ inȱ derȱ preislichenȱ AtȬ traktivitätȱgegenüberȱdenȱWORMȬMedien.ȱDerȱNachteilȱderȱCDȬRȬ TechnologieȱliegtȱinȱderȱTatsache,ȱdassȱnochȱkeineȱErfahrungswerȬ teȱ fürȱ dieȱ Haltbarkeitȱ überȱ einenȱ längerenȱ Zeitraumȱ wieȱ fürȱ WORMȬMedienȱvorliegen. EndeȱSeptemberȱ1997ȱwurdeȱderȱStandardȱfürȱDVDȬRȱverabschieȬ det,ȱ derȱ dasȱ einmaligeȱ Schreibenȱ gestattetȱ undȱ einȱ Löschenȱ oderȱ Überschreibenȱunmöglichȱmachtȱ(wieȱschonȱbeiȱCDȬR).ȱDieȱKapaȬ zitätȱbetrugȱursprünglichȱ3,95ȱGigabyteȱproȱSeite.ȱDasȱistȱwenigerȱ alsȱ dieȱ 4,7ȱ GBȱ einerȱ fabrikgepresstenȱ DVDȱ undȱ hängtȱ damitȱ zuȬ sammen,ȱ dassȱ derȱ Spurabstandȱ mitȱ 0,8ȱ Mikronȱ imȱ Vergleichȱ zuȱ 0,78ȱMikronȱetwasȱgrößerȱgewähltȱwurde.ȱDarausȱergebenȱsichȱfürȱ dasȱ Abspielenȱ inȱ DVDȬROMȬSpielernȱ aberȱ keineȱ Probleme,ȱ dennȱ dieȱGeräteȱstellenȱsichȱautomatischȱaufȱdenȱSpurabstandȱein.ȱMittȬ lerweileȱistȱeineȱKapazitätȱvonȱ4,7ȱGBȱproȱSeiteȱüblich.ȱ DasȱSpeichernȱderȱDatenȱberuhtȱaufȱderȱorganicȱdyeȬTechnologie,ȱ dieȱ vomȱ Funktionsprinzipȱ demȱ CDȬRȬAufzeichnungsverfahrenȱ ähnelt:ȱInȱdasȱtransparenteȱSubstratȱdesȱDVDȬRȬRohlingsȱwirdȱeineȱ ausȱ organischerȱ Farbeȱ bestehende,ȱ ebenfallsȱ transparenteȱ AufȬ zeichnungsschichtȱgepresstȱundȱmitȱeinerȱmetallischenȱReflexionsȬ
ȱ
163
6ȱȱECMȱStoreȬKomponenteȱ schichtȱhinterlegt.ȱAlsȱMaterialȱfürȱdenȱorganischenȱFarbstoffȱdientȱ Cyanin,ȱ Phtalocyaninȱ oderȱ Azure.ȱ Derȱ MetallȬLayerȱ bestehtȱ zuȬ meistȱ ausȱ Gold.ȱ Dieȱ farblicheȱ Kombinationȱ derȱ organicȱ dyeȬȱ undȱ ReflexionsschichtȱverleihtȱdenȱRohlingenȱihrenȱFarbton.ȱȱ Währendȱ desȱ Schreibvorgangsȱ erhitztȱ einȱ Laserȱ dieȱ AufzeichȬ nungsschichtȱ anȱ denȱ Stellen,ȱ dieȱ späterȱ Pitsȱ entsprechenȱ sollen.ȱ DurchȱstetigesȱVariierenȱderȱLaserleistungȱ(inȱeinemȱBereichȱvonȱ6ȱ bisȱ 12ȱ mW)ȱ vermeidetȱ manȱ eineȱ zuȱ starkeȱ punktuelleȱ HitzeentȬ wicklung,ȱdieȱansonstenȱzuȱgroßeȱPitsȱzurȱFolgeȱhätte.ȱAnȱdenȱerȬ hitztenȱStellenȱverfärbtȱsichȱdieȱorganischeȱFarbschichtȱdunkelȱundȱ reflektiertȱ soȱ denȱ Laserstrahlȱ wenigerȱ starkȱ alsȱ einȱ transparenterȱ Bereich.ȱ Dieȱ Strukturȱ vonȱ wenigȱ reflektierendenȱ undȱ starkȱ reflekȬ tierendenȱ Bereichenȱ entsprichtȱ derȱ Folgeȱ vonȱ Pitsȱ undȱ Landsȱ aufȱ gepresstenȱDVDsȱ DieȱbisherigenȱEntwicklungenȱzeigen,ȱdassȱKapazitätssteigerungenȱ größtenteilsȱ durchȱ eineȱ Verbesserungȱ derȱ Informationsdichteȱ anȬ gestrebtȱ werden.ȱ Durchȱ dieȱ Idee,ȱ mehrlagigeȱ optischeȱ Plattenȱ zuȱ verwenden,ȱ lässtȱ sichȱ dieȱ optischeȱ Datenspeicherungȱ analogȱ zurȱ Festplatteȱ inȱ dieȱ dritteȱ Dimensionȱ ausdehnen.ȱ Dieseȱ Ideeȱ machtȱ sichȱ dieȱ DVDȬTechnologieȱ zueigen.ȱ Imȱ Vergleichȱ zurȱ CDȬRȱ stelltȱ sieȱ eineȱ deutlichȱ höhereȱ Speicherdichteȱ zurȱ Verfügungȱ –ȱ beiȱ gleiȬ chemȱKomfort.ȱInȱBezugȱaufȱdieȱHaltbarkeitȱderȱDVDȬMedienȱlieȬ genȱnochȱkeineȱErkenntnisseȱvor.ȱEinȱNachteilȱdieserȱSpeichertechȬ nologieȱ liegtȱ darin,ȱ dassȱ dieȱ Speicherkapazitätȱ vonȱ DVDȬMedienȱ nichtȱ inȱ Sektorenȱ eingeteiltȱ ist.ȱ Eineȱ Inkonsistenzȱ oderȱ einȱ Defektȱ derȱDatenȱaufȱdemȱMediumȱführenȱdeshalbȱzumȱVerlustȱallerȱDaȬ ten.ȱȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ
164 ȱ
6.3ȱȱSpeichermedienȬTechnologienȱ Derȱ grundsätzlicheȱ Unterschiedȱ zwischenȱ einerȱ CDȱ undȱ einerȱ DVDȱ wirdȱ inȱ derȱ Tabelleȱ6.1ȱdeutlich.ȱ Tabelleȱ6.1:ȱCDȱ–ȱDVDȱ[nachȱwww.dvdforum.ch]ȱ CD
DVD
Durchmesser
120 mm
120 mm
Dicke
1,2 m
1,2 mm
Struktur
aus einem Stück
aus zwei miteinander verklebten Teilen von je 0,6 mm Dicke
Laser Wellenlänge
780 Nanometer (Infrarot)
650 und 635 Nanometer (Rot)
Numerische Öffnung der Fokussierlinse
0,45
0,6
Spurabstand
1,6 Mikrometer
0,74 Mikrometer
Signalmodulation
8 - 14
8 - 16
Kleinste Pitlänge
0,83 Mikrometer
0,4 Mikrometer
Rotationsgeschwindigkeit minimal
3,5 Hz
10,5 Hz
Rotationsgeschwindigkeit maximal
8 Hz
25,5 Hz
Abtastgeschwindigkeit
1,2 Meter/sec. (konstante Lineargeschwindigkeit)
4,0 Meter/sec. (konstante Lineargeschwindigkeit
Datenebenen
1
1 - 2 pro Seite
Abstand der Datenebenen
-
40 - 70 m
Korrigierbare Fehlerlänge
2,5 mm
6 mm
User-Datenrate
Mode 1: 153,6 kByte/sec. Mode 2: 176,4 kByte/sec.
1108 kByte/sec.
ȱ
ȱ
ȱ – Wiederbeschreibbareȱ Medien:ȱ Einȱ oftȱ verwendeterȱ Wegȱ derȱ Archivierungȱ istȱ dieȱ Verwendungȱ vonȱ RAIDȬSystemen.ȱ Dieseȱ Technologieȱ istȱ nahezuȱ beiȱ allenȱ Unternehmenȱ imȱ Einsatzȱ undȱ bietetȱ sehrȱ komfortableȱ Möglichkeitenȱ derȱ Erweiterung.ȱ Einȱ Nachteilȱ bestehtȱ darin,ȱ dassȱ dieȱ Medienȱ (Festplatten)ȱ vonȱsichȱausȱleiderȱkeineȱUnveränderbarkeitȱderȱaufȱihnenȱgespeichertenȱInȬ formationenȱsicherstellenȱkönnen.ȱBeiȱFestplattenȱhandeltȱesȱsichȱgrundsätzȬ lichȱ umȱ flüchtigeȱ Speichermedien,ȱ dieȱ dafürȱ ausgelegtȱ sind,ȱ Datenȱ abzuleȬ gen,ȱzuȱverwalten,ȱzuȱbearbeitenȱundȱauchȱwiederȱdavonȱentfernenȱzuȱkönȬ nen.ȱAusȱdiesemȱGrundeȱeignetȱsichȱdieȱTechnologieȱnurȱbedingtȱundȱunterȱ eingeschränktenȱVorraussetzungenȱfürȱeineȱLangzeitarchivierung.ȱȱ – AITȱ(AdvancedȱIntelligentȱTapes):ȱMagnetbänderȱfindenȱimȱITȬBereichȱdieȱ größteȱ Verbreitungȱimȱ Segmentȱ derȱ BackupȬLösungen.ȱ Daȱ beiȱ derȱ SpeicheȬ rungȱ aufȱ Magnetbändernȱ mechanischeȱ Verfahrenȱ zumȱ Beschreibenȱ zumȱ
ȱ
165
6ȱȱECMȱStoreȬKomponenteȱ Einsatzȱkommen,ȱistȱgrundsätzlichȱeineȱ„Abnutzung“ȱderȱMedienȱnichtȱausȬ zuschließen.ȱ Inȱ Bezugȱ aufȱ Revisionssicherheitȱ ermöglichenȱ Magnetbänderȱ einȱ mehrfachesȱ Beschreibenȱ undȱ wärenȱ fürȱ denȱ Einsatzȱ alsȱ LangzeitspeiȬ chermediumȱsomitȱnichtȱgeeignet.ȱȱ
6.4 Speichermedien-Haltbarkeit DieȱHaltbarkeitȱderȱTrägermedienȱspieltȱeineȱbesondereȱRolle.ȱWährendȱaltesȱPerȬ gamentȱ undȱ säurefreiesȱ Papierȱ beiȱ angemessenerȱ Lagerungȱ hunderteȱ vonȱ Jahrenȱ haltbarȱsind,ȱgiltȱdiesȱnichtȱinȱgleichemȱMaßeȱfürȱneueȱSpeichermedien.ȱDieȱmeisȬ tenȱ Publikationenȱ ausȱ derȱ erstenȱ Hälfteȱ desȱ 20.ȱ Jahrhundertsȱ sindȱ aufȱ Papierȱ geȬ druckt,ȱ dasȱ anfälligȱ fürȱ Säurefraßȱ ist.ȱ Beiȱ älterenȱ Druckerzeugnissenȱ undȱ HandȬ schriftenȱstelltȱdieȱeisenhaltigeȱTinte,ȱdieȱdurchȱFeuchtigkeitseinwirkungȱrostetȱundȱ LöcherȱinȱdenȱSeitenȱzurücklässt,ȱeinȱProblemȱdar.ȱFeuchtigkeitsȬȱundȱTemperaturȬ schwankungenȱ könnenȱ auchȱ Pergamentȱ zusetzen,ȱ wennȱ durchȱ Dehnungȱ undȱ KontraktionȱdieȱaufgetrageneȱSchriftȱabplatzt.ȱDigitaleȱundȱanalogeȱMedienȱzeichȬ nenȱ sichȱ gegenüberȱ Papierȱ durchȱ weitȱ kürzereȱ Haltbarkeitsfristenȱ aus,ȱ daȱ sieȱ aufȱ chemischeȱundȱphysikalischeȱUmwelteinflüsseȱstarkȱreagieren.ȱ DieȱlangfristigeȱDatenablageȱwirdȱallgemeinȱinȱdieȱBereicheȱBackupȱundȱArchivieȬ rungȱ unterteilt.ȱ Unterȱ Backupȱ wirdȱ dabeiȱ dasȱ regelmäßigeȱ Erstellenȱ vonȱ SicheȬ rungskopienȱ derȱ Datenbeständeȱ verstanden.ȱ Backupsȱ habenȱ eineȱ begrenzteȱ LeȬ bensdauerȱ undȱ müssenȱ daherȱ wiederholtȱ aktualisiertȱ werden.ȱ Zielȱ istȱ es,ȱ dieȱ DaȬ tenbeständeȱ beiȱ zerstörerischenȱ HardȬȱ oderȱ Softwarefehlern,ȱ beiȱ Virenbefallȱ oderȱ imȱ Fallȱ unbeabsichtigterȱ Löschungȱ schnellȱ undȱ komfortabelȱ rekonstruierenȱ zuȱ können.ȱArchivierungȱistȱimȱGegensatzȱdazuȱeinȱProzess,ȱbeiȱdemȱDatenȱlangfristigȱ aufȱ Speichermedienȱ ausgelagertȱ werden,ȱ umȱ imȱ Falleȱ ihresȱ Gebrauchsȱ daraufȱ schnellȱ undȱ sicherȱ zugreifenȱ zuȱ können.ȱ Währendȱ dieȱ meistenȱ Datenȱ nachȱ einerȱ bestimmtenȱDauerȱvernichtetȱwerdenȱkönnen,ȱgiltȱesȱfürȱdieȱGesellschaft,ȱwertvolleȱ InformationenȱunbegrenztȱfürȱdieȱNachweltȱzuȱerhalten.ȱ Dieȱ digitaleȱ elektronischeȱ Archivierungȱ unterliegtȱ physikalischenȱ Gegebenheiten,ȱ dieȱsichȱdurchȱmehrereȱParameterȱbeschreibenȱlassen:ȱ – Aufzeichnungsverfahrenȱ – StabilitätȱderȱAufzeichnungȱ – LagerbedingungenȱderȱDatenträgerȱ – HäufigkeitȱdesȱLesensȱundȱVerschleißȱbeiȱdiesemȱVorgangȱ – VerfügbarkeitȱgeeigneterȱLesegeräteȱundȱDekodierungssoftwareȱ Optischeȱ Medien,ȱ dieȱ beimȱ Datenzugriffȱ keinenȱ direktenȱ Kontaktȱ zumȱ Lesegerätȱ benötigen,ȱ unterliegenȱ einerȱ geringerenȱ Beanspruchungȱ alsȱ Magnetbänderȱ oderȱ Disketten,ȱ dieȱ mitȱ einemȱ SchreibȬ/Lesekopfȱ inȱ Berührungȱ kommen.ȱ Sieȱ erweisenȱ sichȱ allerdingsȱ alsȱ deutlichȱ empfindlicherȱ gegenüberȱ anderenȱ mechanischenȱ oderȱ thermischenȱ Belastungenȱ wieȱ Kratzern,ȱ Verbiegungenȱ oderȱ Temperaturen.ȱ Einȱ weitererȱoftȱdiskutierterȱGesichtspunktȱistȱdieȱVerfügbarkeitȱgeeigneterȱLesegeräte.ȱ
166 ȱ
6.5ȱȱInformationȱLifecycleȱManagementȱ Werdenȱ mitȱ einemȱ bestimmtenȱ Verfahrenȱ auchȱ dessenȱ FehlerkorrekturmechanisȬ menȱbenutzt,ȱhängtȱdieȱReproduzierbarkeitȱderȱDatenȱunmittelbarȱmitȱderȱExistenzȱ derȱ entsprechendenȱ Treibersoftwareȱ zusammenȱ –ȱ eineȱ nichtȱ unproblematischeȱ Verbindung.ȱ Auchȱ wennȱ Magnetbandmedienȱ fürȱ langeȱ Aufbewahrungsfristenȱ konzipiertȱ sind,ȱ könnenȱ Umweltfaktorenȱ erheblichenȱ Einflussȱ aufȱ dieȱ Medienstabilitätȱ ausüben.ȱ Entscheidenderȱ Aspektȱ fürȱ dieȱ Lagerungȱ sindȱ TemperaturȬȱ undȱ FeuchtigkeitsbeȬ dingungen.ȱÜberraschendȱistȱoftȱauchȱdieȱErkenntnis,ȱdassȱbeschreibbareȱCDsȱoderȱ DVDsȱimȱHaltbarkeitsvergleichȱmitȱmagnetischenȱMedienȱnurȱunwesentlichȱbesserȱ abschneiden.ȱ Ursacheȱ istȱ dieȱ Veränderungȱ derȱ Beschichtungȱ aufgrundȱ vonȱ AlteȬ rungȱ undȱ Lichteinwirkung,ȱ beidesȱ Effekte,ȱ dieȱ inȱ denȱ verwendetenȱ Werkstoffenȱ begründetȱliegen.ȱCDsȱmitȱeinerȱSchutzschichtȱausȱorganischemȱFarbstoffȱPhythaȬ locyaninȱbesitzenȱeineȱhöhereȱReflektionsfähigkeitȱalsȱCyaninȱoderȱAzo.ȱEinȱhohesȱ Risikoȱ bestehtȱ auchȱ beiȱ 3,5ȱ ZollȬFestplatten.ȱ Dieȱ Annahme,ȱ magnetischeȱ InformaȬ tionenȱseienȱaufȱeinemȱgekapseltenȱDatenträgerȱresistentȱgegenüberȱUmweltȬȱundȱ Temperatureinflüssenȱ undȱ folglichȱ Magnetbändernȱ überlegen,ȱ istȱ nichtȱ immerȱ richtig.ȱ Dieȱ Beschichtungȱ vonȱ Magnetbändernȱ verwendetȱ chemischeȱ VerbindunȬ gen,ȱ dieȱ speziellȱ fürȱ dieȱ Langzeitarchivierungȱ konzipiertȱ sind,ȱ einȱ Faktor,ȱ derȱ fürȱ FestplattenȱvonȱuntergeordneterȱBedeutungȱist.ȱȱ Aufȱ Grundȱ derȱ kompaktenȱ Bauformȱ undȱ derȱ niedrigenȱ Preiseȱ gewinnenȱ halbleiȬ terbasierteȱ NANDȬFlashspeicherȱ anȱ Verbreitung.ȱ Denȱ Vorteilenȱ einesȱ geringenȱ Stromverbrauchs,ȱeinerȱUnempfindlichkeitȱgegenȱErschütterungenȱundȱeinerȱhohenȱ Kapazitätȱ stehenȱ allerdingsȱ Nachteileȱ wieȱ geringeȱ Schreibgeschwindigkeitȱ undȱ begrenzteȱ Wiederbeschreibbarkeitȱ gegenüber.ȱ StandardȬFlashspeicherȱ sindȱ übliȬ cherweiseȱ mitȱ MLCȬNANDȬChipsȱ ausgestattet,ȱ dieȱ eineȱ Lebensdauerȱ vonȱ 10.000ȱ Schreibzyklenȱ aufweisen.ȱ Höherwertigeȱ Chipsȱ erlaubenȱ eineȱ dreifachȱ höhereȱ SchreibgeschwindigkeitȱbeiȱeinerȱLebensdauerȱvonȱ100.000ȱSchreibzyklen.ȱ
6.5 Information Lifecycle Management Derȱ Bedarfȱ anȱ Speichertechnologieȱ steigtȱ ständig,ȱ soȱ dassȱ eineȱ effektiveȱ VerwalȬ tungȱ immerȱ dringenderȱ erscheint.ȱ Einȱ durchgängigesȱ Konzeptȱ beginntȱ mitȱ derȱ EntstehungȱderȱInformationȱundȱendetȱmitȱihrerȱEntsorgung.ȱȱ ȱ Informationȱ Lifecycleȱ Managementȱ befasstȱ sichȱ mitȱ Strategien,ȱ Methoden,ȱ Prozessenȱ undȱ Anwendungen,ȱ umȱ Datenȱ automatisiertȱ entsprechendȱ ihremȱ Wertȱ undȱ ihrerȱ Nutzungȱ aufȱ denȱ jeweilsȱ kostengünstigstenȱ Medienȱ abzulegen,ȱ sieȱ zuȱ erschließenȱ undȱ sieȱ langfristigȱsicherȱzuȱarchivierenȱ[Bitkomȱ2004].ȱȱ ȱ
ȱ
167
6ȱȱECMȱStoreȬKomponenteȱ Informationȱ Lifecycleȱ Managementȱ (ILM)ȱ istȱ einȱ StorageȬManagementȬKonzept,ȱ dasȱ Informationenȱ währendȱ derȱ gesamtenȱ Lebenszeitȱ aktivȱ verwaltet.ȱ Dabeiȱ beȬ stimmtȱ einȱ Regelwerkȱ unterȱ Berücksichtigungȱ vonȱ Vorgabenȱ ausȱ denȱ GeschäftsȬ prozessenȱ undȱ derȱ Bewertungȱ derȱ Kostenstrukturenȱ derȱ Speicherhierarchieȱ denȱ amȱbestenȱgeeignetenȱSpeicherplatzȱderȱInformationenȱ[ECMȱ2005].ȱ Alsȱ Grundgedankeȱ liegtȱ demȱ Konzeptȱ zugrunde,ȱ dassȱ sichȱ derȱ Wertȱ derȱ meistenȱ Informationenȱ undȱ damitȱ dasȱ Zugriffsmusterȱ imȱ Laufeȱ derȱ Zeitȱ verändert.ȱ Derȱ Wertȱ vonȱ Informationenȱ istȱ jedochȱ nurȱ schwerȱ zuȱ ermitteln.ȱ Dieȱ meistenȱ UnterȬ nehmenȱwissenȱnicht,ȱwasȱesȱkostet,ȱeinenȱBriefȱzuȱerstellen,ȱeinȱDokumentȱaufzuȬ findenȱoderȱeineȱEȬMailȱzuȱbeantworten.ȱZudemȱverändertȱsichȱderȱWertȱwährendȱ derȱLebensdauer.ȱEinȱDokument,ȱdasȱanȱseinemȱErstelldatumȱimmensȱwichtigȱwar,ȱ weilȱesȱfristgebundenȱist,ȱverliertȱüberȱdieseȱFristȱhinausȱanȱBedeutung.ȱEinȱandeȬ resȱ Dokumentȱ kannȱ erstȱ nachȱ langerȱ Zeitȱ Wichtigkeitȱ erlangen,ȱ weilȱ esȱ z.B.ȱ inȱ eiȬ nemȱProdukthaftungsverfahrenȱausȱdemȱArchivȱgeholtȱwird.ȱGesetzlicheȱundȱanȬ dereȱ regulatorischeȱ Bestimmungenȱ legenȱ z.T.ȱ fest,ȱ wieȱ undȱ wieȱ langeȱ InformatioȬ nenȱgespeichertȱundȱinȱwelcherȱFormȱsieȱaufȱAnforderungȱzurȱVerfügungȱgestelltȱ werdenȱ müssen.ȱ Dabeiȱ istȱ sicher,ȱ dassȱ derȱ Umfangȱ derȱ ordnungsgemäßȱ zuȱ speiȬ cherndenȱ Informationenȱ undȱ dieȱ Längeȱ derȱ Aufbewahrungsfristenȱ erheblichȱ zuȬ nehmenȱwerden.ȱ ILMȱkannȱumsoȱwirksamerȱarbeiten,ȱjeȱbesserȱderȱgesamteȱSpeicherbereichȱstrukȬ turiertȱist.ȱDieȱtechnologischeȱBasisȱbestehtȱüblicherweiseȱausȱvernetzten,ȱmehrstuȬ figenȱ Speicherhierarchienȱ undȱ Speicherklassen.ȱ Speicherhierarchienȱ ergebenȱ sichȱ durchȱ dieȱ Klassifizierungȱ vonȱ Speichertechnologienȱ nachȱ technischenȱ oderȱ nachȱ Kostengesichtspunktenȱ inȱ einerȱ absteigendenȱ bzw.ȱ aufsteigendenȱ Ordnung.ȱ Dieȱ Hierarchieȱ beginntȱ mitȱ demȱ hochȱ performantenȱ OnlineȬBereich.ȱ Dasȱ wesentlicheȱ Charakteristikumȱ desȱ OnlineȬBereichsȱ ist,ȱ dassȱ dieȱ Datenȱ unverzüglichȱ verfügbarȱ sind.ȱ ImȱAnschlussȱanȱ denȱ OnlineȬBereichȱsindȱSystemeȱ mitȱATAȬPlattenȱ positioȬ niert.ȱ Dieseȱ Hierarchieȱ hatȱ ebenfallsȱ DirektȬZugriffseigenschaftenȱ istȱ aberȱ imȱ GeȬ gensatzȱzumȱhochȱ performantenȱ OnlineȬBereichȱ mitȱhochȱ kapazitivenȱ Plattenȱmitȱ moderaterenȱDurchsatzratenȱundȱgeringerenȱKostenȱproȱMegabyteȱaufgebaut.ȱAmȱ Endeȱ derȱ Hierarchieȱ stehtȱ derȱ OfflineȬBereichȱ mitȱ Bandtechnologienȱ undȱ denȱ geȬ ringstenȱ Kostenȱ proȱ Megabyte.ȱ Inȱ Ergänzungȱanȱ dieȱ OfflineȬEbeneȱ kannȱ manȱmitȱ derȱ manuellenȱ Bereitstellungȱ nochȱ eineȱ weitereȱ AuslagerungsȬEbeneȱ hinzufügenȱ [Bitkomȱ 2004,ȱ S.ȱ 8].ȱ Intelligenteȱ Speichernetzwerke,ȱ wieȱ Storageȱ Areaȱ Networksȱ (SAN),ȱNetworkȱAttachedȱStorageȱ(NAS)ȱundȱIPȱStorage,ȱerleichternȱdieȱoperativeȱ UmsetzungȱderȱdynamischenȱILMȬEntscheidungenȱerheblich.ȱȱ ILMȱistȱkeinȱProdukt,ȱsondernȱeineȱKombinationȱvonȱProzessenȱundȱTechnologien.ȱ Jeȱ wichtigerȱdieȱDatenȱfürȱeinȱUnternehmenȱundȱseineȱProzesseȱsind,ȱdestoȱhöherȱ sollteȱihreȱVerfügbarkeitȱseinȱundȱdestoȱteurerȱsindȱdieȱverwendetenȱSpeichertechȬ nologien.ȱ Einȱ Regelwerkȱ bestimmt,ȱ wieȱ Informationenȱ durchȱ eineȱ SpeicherinȬ frastrukturȱ ausȱ unterschiedlichenȱ Speicherhierarchien/Ȭklassenȱ fließenȱ undȱ entȬ sprechendeȱ Anforderungenȱ anȱ dieȱ Datenȱ sicherstellen.ȱ Informationsobjekteȱ sindȱ
168 ȱ
6.6ȱȱStorageȱAreaȱNetworksȱ Volumesȱ (LUNs),ȱ Filesysteme,ȱ Dateien,ȱ EȬMailȬNachrichtenȱ inklusiveȱ Anhänge,ȱ digitalisierteȱ Verträge/Policenȱ oderȱ Patientenunterlagenȱ inȱ Krankenhäusern.ȱ Einȱ Regelwerkȱlegtȱfest,ȱaufȱwelcherȱSpeicherhierarchie/ȬklasseȱeinȱInformationsobjektȱ zuȱ einemȱ bestimmtenȱ Zeitpunktȱ liegenȱ soll.ȱ Variablenȱ fürȱ denȱ OptimierungsproȬ zessȱsindȱaufȱderȱeinenȱSeiteȱderȱWertȱderȱInformation,ȱdieȱZugriffshäufigkeit,ȱdasȱ Alterȱ desȱ Informationsobjekts,ȱ gesetzliche/regulatorischeȱ Anforderungenȱ undȱ aufȱ derȱ anderenȱ Seiteȱ dieȱ Kostenȱ proȱ Speichereinheit,ȱ dieȱ geforderteȱ ZugriffsgeȬ schwindigkeitȱundȱdieȱverfügbareȱKapazitätȱinȱderȱjeweiligenȱSpeicherhierarchie/ȱȬ klasseȱ[Bitkomȱ2004,ȱS.ȱ7].ȱ Dasȱ ILMȬModellȱ bestehtȱ ausȱ mehrerenȱ funktionalenȱ Komponenten:ȱ ErstplatzieȬ rung,ȱ Datensicherungȱ inklusiveȱ Recovery,ȱ Replikation,ȱ Verdrängung,ȱ ArchivieȬ rung,ȱ sowieȱ Verlagerungȱ undȱ Löschungȱ vonȱ Informationsobjekten.ȱ Dieȱ Szenarienȱ zeigen,ȱ dassȱ ILMȱ zuȱ einerȱ Überlappungȱ derȱ Komponentenȱ „Preserve“ȱ undȱ „StoȬ re“ȱ desȱ ECMȱ führtȱ undȱ Anwendungenȱ wieȱ Dokumentenmanagementȱ undȱ ArchiȬ vierungȱtransparentȱeinbindet.ȱEsȱwirdȱaberȱauchȱdeutlich,ȱdassȱesȱwichtigȱist,ȱdieȱ gespeichertenȱ Dokumenteȱ zuȱ klassifizierenȱ undȱ zuȱ kategorisieren,ȱ dennȱ nurȱ aufȱ dieseȱWeiseȱistȱesȱmöglich,ȱdieȱMengeȱanȱDokumentenȱeinzelnenȱKlassenȱzuzuordȬ nen.ȱ
6.6 Storage Area Networks WerȱHighȬSpeedȱsagt,ȱdenktȱinȱersterȱLinieȱanȱGigabitȬEthernet.ȱDassȱjedochȱnichtȱ nurȱderȱTransferȱvonȱDatenȱzwischenȱdenȱRechnern,ȱsondernȱauchȱderȱZugriffȱaufȱ dieȱDatenȱdieȱNetzgeschwindigkeitȱbeeinflusst,ȱwirdȱmeistȱaußerȱBetrachtȱgelassen.ȱ Dasȱumsoȱmehr,ȱdaȱdurchȱdieȱvirtuelleȱWeltȱdieȱMengeȱderȱpotentiellȱverfügbarenȱ Datenȱdramatischȱansteigt.ȱMitȱderȱMengeȱanȱInformationenȱwächstȱaberȱauchȱdieȱ Schwierigkeit,ȱ dieseȱ sinnvollȱ zuȱ organisieren.ȱ Ohneȱ dieseȱ Fähigkeitȱ kannȱ einȱ UnȬ ternehmenȱ aberȱ schwerlichȱ innovativȱundȱ kundenorientiertȱarbeiten;ȱ dennȱinȱ denȱ DatenȱschlummertȱdasȱWissenȱüberȱKundenȱundȱderenȱWünsche.ȱDiesȱgiltȱinsbeȬ sondereȱ unterȱ demȱ Vorzeichenȱ webȬbasierterȱ Geschäftsprozesse.ȱ Informationen,ȱ dieȱ sowohlȱ demȱ Marketing,ȱ demȱ Vertriebȱ alsȱ auchȱ derȱ Produktentwicklungȱ zeitȬ gleichȱzurȱVerfügungȱstehen,ȱsynchronisierenȱauchȱdieȱArbeitȱdieserȱBereiche.ȱDerȱ bisherigeȱDataȱAttachedȱStorageȬAnsatzȱkannȱdieseȱProblemeȱkaumȱlösen.ȱBeiȱihmȱ istȱ derȱ gesamteȱ Speicherȱ anȱ dieȱ Serverȱ gekoppelt,ȱ wasȱ eineȱ erhöhteȱ CPUȬLastȱ erȬ zeugtȱundȱdurchȱständigenȱI/OȬVerkehrȱauchȱdasȱNetzwerkȱbelastet.ȱ Vorȱ diesemȱ Hintergrundȱ explodierenderȱ Datenvoluminaȱ undȱ demȱ Auftauchenȱ neuerȱSpeichertechnikenȱwieȱ NASȱ undȱ SANȱstehtȱ dieȱSpeicherverwaltungȱinȱ UnȬ ternehmenȱvorȱneuenȱHerausforderungenȱhinsichtlichȱZuverlässigkeit,ȱZugriffsgeȬ schwindigkeitȱundȱVerfügbarkeit.ȱDieȱSpeicherkapazitätȱvonȱSystemenȱverdoppeltȱ sichȱnachȱEinschätzungȱvielerȱMarktbeobachterȱjährlichȱundȱeinȱEndeȱdesȱWachsȬ tumsȱistȱnichtȱinȱSicht.ȱDamitȱzählenȱDatenspeichertechnologienȱzuȱdenȱwichtigsȬ tenȱ Investitionenȱ derȱ Informationstechnologie.ȱ Begleitetȱ wirdȱ diesȱ durchȱ dieȱ VerȬ
ȱ
169
6ȱȱECMȱStoreȬKomponenteȱ waltungȱ derȱ kontinuierlichȱ wachsendenȱ Mengeȱ unternehmenskritischerȱ Daten.ȱ Einschätzungenȱbesagen,ȱdassȱdieȱKostenȱdesȱBetriebsȱeinerȱSpeicherlösungȱderenȱ reineȱ Hardwarekostenȱ umȱ bisȱ zumȱ 20Ȭfachenȱ übersteigen.ȱ Auslöserȱ dieserȱ EntȬ wicklungȱsindȱzweiȱFaktoren:ȱ – Dieȱ Komplexitätȱ derȱ Infrastrukturȱ derȱ ITȱ nimmt,ȱ wasȱ dieȱ Serverlandschaftȱ undȱderenȱPlattensystemeȱbetrifft,ȱständigȱzuȱ – Dieȱ Entstehungȱ neuerȱ Handelsmodelleȱ wieȱ dasȱ EȬBusinessȱ stellenȱ gänzlichȱ neueȱ Bedingungenȱ anȱ dieȱ Performanceȱ undȱ Verfügbarkeitȱ derȱ SpeicherresȬ sourcen,ȱdenenȱdieȱtraditionellenȱSpeichermodelleȱnichtȱgewachsenȱsind.ȱȱ GemeinsamȱlösenȱdieseȱAnforderungenȱeinenȱParadigmenwechselȱinȱderȱAusrichȬ tungȱundȱderȱStrategieȱdesȱSpeichermanagementsȱaus.ȱTraditionelleȱVerfahrenȱmitȱ mehrstündigenȱ Sicherungsläufenȱ währendȱ derȱ Nachtstundenȱ beiȱ Stillstandȱ desȱ Produktivbetriebesȱ sindȱ fürȱ heutigeȱ EȬBusinessȬAnwendungenȱ vollkommenȱ unȬ geeignet.ȱ Benötigtȱ werdenȱ Konzepte,ȱ dieȱ fürȱ eineȱ Sicherungȱ keineȱ Rücksichtȱ aufȱ dieȱbislangȱerforderlichenȱZeitfensterȱnehmen.ȱFunktionenȱwieȱserverȬunabhängigeȱ Backupsȱundȱ„nearȬline“ȬSpeicherȱzumȱschnellenȱWiederherstellenȱsindȱhierȱersteȱ Wahl.ȱDazuȱwirdȱeinȱDatenbestandȱdirektȱaufȱeinȱlokalesȱoderȱremoteȱangeschlosȬ senesȱPlattensystemȱimȱBandformatȱzwischengespeichertȱundȱanschließendȱaufȱeinȱ Band,ȱ einȱ SANȬLaufwerkȱ oderȱ einenȱ NASȬServerȱ übertragen.ȱ Weitereȱ Zeitȱ lässtȱ sichȱdurchȱinkrementelleȱoderȱdifferentielleȱDatensicherungȱeinsparen.ȱȱDieȱVorteiȬ leȱeinerȱZentralisierungȱderȱSpeicherressourcenȱfürȱeinȱUnternehmenȱinȱFormȱeinesȱ StorageȱNetworksȱlassenȱsichȱwieȱfolgtȱzusammenfassen:ȱ – – – – – – –
6.6.1
SpeicherkonsolidierungȱdurchȱzentralesȱDatenmanagementȱ Zentrales,ȱLANȬfreiesȱBackupȱ SkalierbarkeitȱhinsichtlichȱderȱSpeichermedienȱ UnabhängigeȱSkalierungȱvonȱSpeicherȱundȱServerȱ SchutzȱderȱDatenȱinȱsicherenȱKonfigurationenȱ EinrichtungȱeinesȱeinzigenȱKontrollpunktesȱ GewinnungȱeinesȱeinheitlichenȱBlickesȱaufȱdieȱSpeicherressourcenȱ
NAS-Technologie
WennȱeinȱUnternehmenȱeinenȱAnwendungsȬȱoderȱFileserverȱinȱBetriebȱhat,ȱderȱmitȱ einerȱoderȱmehrerenȱFestplattenȱausgerüstetȱistȱundȱdieȱNutzerȱüberȱeinȱNetzwerkȱ mitȱ Datenȱ versorgt;ȱ wasȱ passiert,ȱ wennȱ dieserȱ Serverȱ dieȱ Grenzeȱ seinerȱ SpeicherȬ kapazitätȱerreicht?ȱZumȱEinbauȱweitererȱPlattenȱmüssteȱerȱangehaltenȱwerdenȱundȱ durchȱzusätzlichenȱSpeicherȱundȱdasȱzugehörigeȱManagementȱdieȱLeistungȱerweiȬ tern.ȱ AlsȱAlternativeȱkönnteȱ einȱ weitererȱ Serverȱinstalliertȱ undȱ einȱ Teilȱ derȱ Datenȱ dorthinȱausgelagertȱwerden.ȱDieserȱAuswegȱistȱnichtȱnurȱkostspielig,ȱsondernȱauchȱ arbeitsintensiv,ȱ weilȱ jetztȱzweiȱ Serverȱzuȱ verwaltenȱsindȱundȱ dieȱ Datenverteilungȱ zuȱüberwachenȱist.ȱ ȱ
170 ȱ
6.6ȱȱStorageȱAreaȱNetworksȱ Einȱ NASȱ (Networkȱ Attachedȱ Storage)ȱ dagegenȱ istȱ einȱ systemunabhängigerȱSpeicher,ȱderȱdirektȱinȱdasȱLANȱintegriertȱistȱundȱ vonȱallenȱClientsȱundȱServernȱdesȱNetzesȱgenutztȱwird.ȱDabeiȱarbeitetȱ einȱ NASȬDeviceȱ alsȱ Server,ȱ mitȱ demȱ ausschließlichenȱ Zweck,ȱ Fileservicesȱbereitzustellen,ȱumȱdieȱAnwendungsserverȱzuȱentlasten.ȱȱ ȱ NASȱ unterstütztȱ heterogeneȱ Clientsȱ undȱ Server,ȱ dieȱ aufȱ einenȱ gemeinsamenȱ DaȬ tenbestandȱzugreifen.ȱÜberȱEthernetȬPortsȱanȱdasȱbestehendeȱIPȬNetzȱangebunden,ȱ holenȱsichȱdieȱAnwenderȱdieȱüblicherweiseȱaufȱCDȱoderȱFestplattenȱgespeichertenȱ DatenȱunmittelbarȱüberȱdasȱNetzwerk.ȱDieȱNASȬTechnologieȱbasiertȱdamitȱaufȱderȱ traditionellenȱ Netzinfrastrukturȱ undȱ hatȱ sichȱ demȱ klassischenȱ FilesharingȬDienstȱ verschrieben.ȱ Protokolleȱ wieȱ dasȱ Commonȱ Internetȱ Fileȱ Systemȱ (CIFS)ȱ fürȱ WinȬ dowsȬBetriebssystemeȱ undȱ Networkȱ FileȱSystemȱ(NFS)ȱ fürȱ UnixȬDialekteȱ realisieȬ renȱ denȱ plattformübergreifendenȱ Zugriff.ȱ Dadurch,ȱ dasȱ derȱ gesamteȱ Speicherȱ alsȱ logischeȱEinheitȱaufgefasstȱwird,ȱerscheintȱderȱSpeicherbereichȱzentralisiert.ȱFolgeȱ diesesȱ Konstruktesȱ ist,ȱ dassȱ sichȱ NASȬSystemeȱ denȱ Vorwurfȱ derȱ Speicherinselnȱ gefallenȱlassenȱmüssen.ȱȱ WeiterhinȱbesitztȱdiesesȱKonzeptȱdieȱSchwächeȱeinesȱgroßenȱProtokollȬOverheads,ȱ weilȱLANȬProtokolleȱebenȱnichtȱfürȱSpeicherbelangeȱausgelegtȱsind.ȱAbhängigȱvonȱ derȱAnzahlȱderȱClientsȱundȱderȱDatenlastȱkannȱdieȱBandbreiteȱdesȱNetzesȱschnellȱ erschöpftȱ sein.ȱ Hinzuȱ kommt,ȱ dassȱ Server,ȱ dieȱ anȱ ihrerȱ Leistungsgrenzeȱ arbeiten,ȱ schnellȱzumȱEngpassȱfürȱdieȱgesamteȱInfrastrukturȱwerden.ȱDeshalbȱmussȱentweȬ derȱeinȱzweitesȱEthernetȱoderȱeineȱexklusiveȱFibreȬChannelȬVerbindungȱaushelfen.ȱ DieȱmeistenȱNASȬSystemeȱsindȱaufȱdiesenȱFallȱvorbereitetȱundȱbietenȱentsprechenȬ deȱFCȬUplinks,ȱumȱeinȱFCȬbasiertesȱSANȱanzubinden.ȱ NASȱkonsolidiertȱdenȱSpeicherplatzȱangeschlossenerȱClientsȱmitȱunterschiedlichenȱ Betriebssystemenȱ inȱ einemȱ zentralenȱ Datenpool.ȱ Einemȱ Unternehmenȱ mitȱ vielenȱ Desktops,ȱ dieȱ inȱ einerȱ ClientȬ/ServerȬUmgebungȱ arbeiten,ȱ eröffnetȱ sichȱ mitȱ NASȱ einȱ Performancezuwachsȱ gegenüberȱ einemȱ herkömmlichenȱ FileserverȬSzenario.ȱ DankȱderȱmodularenȱArchitekturȱskalierenȱNASȬServerȱgutȱundȱkönnenȱsichȱdaherȱ denȱ wachsendenȱ Speicheranforderungenȱ gutȱ anpassen.ȱ Dieȱ Begrenzungenȱ derȱ NASȬLösungȱergebenȱsichȱausȱzweiȱGesichtspunkten:ȱ
ȱ
– FehlenȱdesȱZugriffsȱaufȱBlockȱLevelȬDaten:ȱNASȱermöglichtȱnichtȱdenȱdirekȬ tenȱZugriffȱaufȱBlockdaten,ȱdieȱaufȱSCSIȬGerätenȱoderȱFCȬSANsȱliegenȱ – Eineȱ Anwendungȱ aufȱ einemȱ Client,ȱ dieȱ aufȱ Datenȱ einesȱ NASȬDevicesȱ zuȬ greift,ȱmussȱalleȱsiebenȱSchichtenȱdesȱOSIȬModellsȱpassieren,ȱdasȱNetzwerkȱ durchqueren,ȱ aufȱ demȱ Serverȱ erneutȱ dieȱ siebenȱ Schichtenȱ durchlaufen,ȱ dieȱ Datenȱ holenȱ undȱ sieȱ überȱ dasȱ Netzwerkȱ zurückȱ transportieren.ȱ Dieserȱ AbȬ laufȱerscheintȱnichtȱsonderlichȱeffizient.ȱ
ȱ
171
6ȱȱECMȱStoreȬKomponenteȱ
6.6.2
SAN-Technologie
AusȱdiesenȱBegrenzungenȱergebenȱsichȱdieȱkomplementärenȱStärkenȱeinesȱSAN.ȱȱ ȱ Einȱ Storageȱ Areaȱ Networkȱ (SAN)ȱ istȱ einȱ Netz,ȱ dasȱ Rechnerȱ undȱ Massenspeicherȱ überȱ eineȱ gesonderteȱ Infrastrukturȱ miteinanderȱ verknüpft.ȱȱ ȱ Willȱ einȱ Nutzerȱ Datenȱ abrufen,ȱ greiftȱ erȱ nichtȱ mehrȱ aufȱ denȱ Speicherȱ desȱ Serversȱ imȱLANȱzu,ȱsondernȱaufȱdieȱAnwendung.ȱDieseȱbesitztȱeinenȱZugangȱzuȱeinemȱmitȱ demȱSANȱverbundenenȱServerȱundȱleitetȱdieȱAnfrageȱanȱeinȱSANȬSubsystemȱweiȬ ter.ȱ Derȱ BegriffȱSANȱimpliziertȱ einȱ gesondertesȱ Netzwerk,ȱ dasȱalsȱ I/OȬKanalȱzwiȬ schenȱ Servernȱ undȱ Speichereinheitenȱ arbeitet.ȱ SANsȱ entkoppelnȱ physikalischȱ dieȱ SpeicherlaufwerkeȱvonȱdenȱServernȱundȱstellenȱdieȱMassenspeicherȱinȱeinȱseparaȬ tesȱ Netzwerkȱ „hinter“ȱ dieȱ Server.ȱ Dafürȱ kannȱ alsȱ einfachesȱ Verbindungsmediumȱ einȱSCSIȬBusȱdienen;ȱeinenȱschnellerenȱZugriff,ȱeineȱeinfachereȱKonfigurationȱundȱ dieȱ Integrationȱ wesentlichȱ mehrererȱ Geräteȱ bietetȱ aberȱ dieȱ Fibreȱ ChannelȬ Technologie.ȱ Sowohlȱ SCSIȱ alsȱ auchȱ Fibreȱ Channelȱ sindȱ BlocktransferȬProtokolleȱ undȱunterscheidenȱsichȱdamitȱgrundsätzlichȱvonȱpaketorientiertenȱProtokollenȱderȱ IPȬWelt.ȱ Denȱ Clientsȱ stelltȱ derȱ Serverȱ wieȱ bisherȱ dieȱ üblichenȱ Servicesȱ zurȱ VerfüȬ gung,ȱerȱverliertȱaberȱdieȱzentraleȱRolleȱeinesȱSpeichergerätes.ȱTrueȱDataȱSharingȱ–ȱ einȱ Hauptzielȱ vonȱ SANsȱ –ȱ istȱ damitȱ gleichbedeutendȱ mitȱ einerȱ datenzentrischenȱ Informationstechnologie,ȱ alsoȱ einerȱ Umgebung,ȱ beiȱ derȱ Datenȱ undȱ Informationenȱ imȱMittelpunktȱderȱBetrachtungȱstehen.ȱȱGegenüberȱderȱbisherigenȱSpeicherarchiȬ tekturȱbietetȱeinȱSANȱmehrereȱVorzüge:ȱ – Gesteigerteȱ BackupȬGeschwindigkeit:ȱ Dieȱ Konzentrationȱ weniger,ȱ aberȱ leistungsfähigerȱ Systemeȱ aufȱ wenigeȱ Standorteȱ alsȱ Folgeȱ einerȱ KonsolidieȬ rungȱ desȱ Speicherumfeldesȱ führtȱ zuȱ einerȱ zentralenȱ BackupȬMöglichkeit.ȱ DamitȱlässtȱsichȱeinȱBackupȱnichtȱnurȱbesserȱüberwachenȱundȱzentralȱdurchȬ führen,ȱsondernȱauchȱdasȱdafürȱnotwendigeȱZeitfensterȱdürfteȱsichȱverkleiȬ nernȱ – Remotespeicherung:ȱ Speichersystemeȱ werdenȱ häufigȱ überȱ lokaleȱ SCSIȬ SchnittstellenȱmitȱdemȱBackupȬRechnerȱverbunden.ȱDieȱBuslängeȱbeträgtȱbeiȱ diesemȱ Konzeptȱ maximalȱ 25ȱ Meter,ȱ wasȱ eineȱ räumlicheȱ Trennungȱ ausȱ SiȬ cherheitsgründenȱ unmöglichȱ macht.ȱ Einȱ SANȱ löstȱ diesesȱ Problem,ȱ daȱ dieȱ Fibreȱ ChannelȬTechnologieȱ Entfernungenȱ bisȱ zuȱ 10ȱ kmȱ erlaubt.ȱ Datenȱ könȬ nenȱinȱeinemȱSANȱdaherȱwesentlichȱeinfacherȱmitȱguterȱPerformanceȱgeograȬ phischȱverteiltȱwerden.ȱ ȱ
172 ȱ
6.6ȱȱStorageȱAreaȱNetworksȱ – EntlastungȱdesȱLAN:ȱDurchȱdieȱSchaffungȱeinerȱseparatenȱSpeicherinfrastrukȬ turȱwirdȱdasȱLANȱvonȱderȱAblageaufgabeȱentbundenȱundȱstehtȱdenȱNutzernȱ fürȱderenȱKernaufgabenȱzurȱVerfügung.ȱȱ – Geteilterȱ Speicher:ȱ Dieȱ SCSIȬSchnittstelleȱ koppeltȱ Serverȱ undȱ Speicher,ȱ soȱ dassȱ andereȱ Rechnerȱ dieȱ gleicheȱ Ressourceȱ kaumȱ nutzenȱ können.ȱ Fälltȱ einȱ derartȱ konzipierterȱ Serverȱ aus,ȱ sindȱ auchȱ dieȱ entsprechendenȱ BackupȬ Medienȱ nichtȱ mehrȱ erreichbar.ȱ Inȱ einemȱ SANȱ hingegenȱ teilenȱ sichȱ mehrereȱ ServerȱdieȱDatenspeicher,ȱsoȱdassȱtrotzȱeinesȱServerausfallsȱdieȱSpeichermeȬ dienȱerreichbarȱbleiben.ȱAnȱdiesesȱMerkmalȱistȱdieȱSkalierbarkeitȱalsȱweiteȬ rerȱ Vorteilȱ geknüpft.ȱ Daȱ dieȱ Speicherȱ unabhängigȱ vonȱ denȱ Servernȱ sind,ȱ könnenȱ sieȱ getrenntȱ konfiguriert,ȱ ausgetauscht,ȱ oderȱ ergänztȱ werden.ȱ Derȱ SpeicherȱeinesȱSANȱlässtȱsichȱdaherȱimȱlaufendenȱBetriebȱanȱsichȱänderndeȱ Anforderungenȱanpassen,ȱohneȱdassȱseineȱFunktionsfähigkeitȱberührtȱwird.ȱȱ – Zentralesȱ Management:ȱ Inȱ einemȱ SANȱ erleichtert,ȱ wieȱ inȱ einemȱ LAN,ȱ einȱ zentralesȱ Managementȱ dieȱ Verwaltungȱ derȱ Ressourcen.ȱ Diesȱ führtȱ zuȱ beȬ trächtlichenȱKosteneinsparungen,ȱlässtȱsichȱproblemlosȱaberȱnurȱinȱhomogeȬ nenȱ Umgebungenȱ durchführen.ȱ Sobaldȱ Komponentenȱ unterschiedlicherȱ Herstellerȱ verwendetȱ werden,ȱ sindȱ Schwierigkeitenȱ vorhersehbar,ȱ daȱ dieȱ StrukturȱvieleȱIndividualitätenȱzuläßt.ȱ EinȱSANȱzeichnetȱdamitȱeineȱoptimaleȱSpeicherinfrastruktur,ȱeineȱhoheȱBandbreiteȱ undȱ eineȱ problemloseȱ Skalierbarkeitȱ aus.ȱ Dasȱ SANȬKonzeptȱ erweistȱ sichȱ alsȱ dieȱ höchsteȱEntwicklungsstufeȱderȱVerschmelzungȱvonȱServerȱundȱSpeicher.ȱ Derȱ Aufbauȱeinesȱ SANȱ wirdȱallerdingsȱ erstȱ durchȱdieȱ Fibreȱ ChannelȬTechnologieȱ möglich.ȱDieȱMassenspeicherȱarbeitenȱimȱGegensatzȱzurȱherkömmlichenȱTopologieȱ nichtȱimȱServerȱintegriert,ȱsondernȱalsȱdessenȱzugeordneteȱPeripheriegeräte.ȱServerȱ besitzenȱ damitȱ zweiȱ „Netzverbindungen“:ȱ einerseitsȱ überȱ dieȱ LANȬTechnologieȱ wieȱ Ethernetȱ zuȱ denȱ Clients,ȱ andererseitsȱ durchȱ einenȱ Fibreȱ Channelȱ Hubȱ oderȱ SwitchȱzuȱdenȱSpeichern.ȱȱ ȱ
ȱ
173
6ȱȱECMȱStoreȬKomponenteȱ
ȱ
ȱ
Abbildungȱ6.1:ȱSANȬArchitekturȱ
Imȱ SANȱ wirdȱ derȱ gesamteȱ Speicher,ȱ unabhängigȱ vonȱ seinemȱ physikalischenȱ Standort,ȱvonȱeinemȱgesondertenȱManagementȬToolȱverwaltetȱundȱgegebenenfallsȱ zuȱ virtuellenȱ Einheitenȱ überȱ Standortgrenzenȱ hinausȱ zusammengefasst.ȱ Dieȱ SpeiȬ cherkapazitätȱ einesȱ Unternehmensȱ bildetȱ damitȱ eineȱ logischeȱ Einheit,ȱ obwohlȱ sieȱ ausȱ dezentralȱ verteiltenȱ Einzelspeichernȱ aufgebautȱ ist.ȱ Einȱ besonderesȱ Problemȱ entstehtȱ dabeiȱ durchȱ dieȱ Vergabeȱ vonȱ Zugriffsrechtenȱ undȱ Beschränkungen.ȱ Derȱ Verwaltungȱ virtuellerȱ Teilsystemeȱ undȱ ihrerȱ Attributeȱ durchȱ einȱ leistungsfähigesȱ ManagementȬToolȱkommtȱdaherȱbesondereȱBedeutungȱzu.ȱ ȱ
174 ȱ
6.8ȱȱKontrollfragenȱ DieȱDatenȱwerdenȱdirektȱzwischenȱdenȱSpeichersystemenȱausgetauscht,ȱohneȱdassȱ dasȱ primäreȱ LANȱ belastetȱ wird.ȱ Dieȱ Speicherkomponentenȱ innerhalbȱ einesȱ SANȬ SystemsȱkommunizierenȱdaherȱüberȱAnyȬtoȬAnyȬVerbindungen.ȱBackupȬProzesseȱ wickeltȱdasȱSystemȱstandardmäßigȱLANȬfreiȱoderȱServerȬlosȱab.ȱSANsȱübertragenȱ DatenȱnichtȱalsȱFiles,ȱsondernȱblockȬorientiert,ȱumȱgroßeȱDatenmengenȱzuȱtransfeȬ rieren.ȱDasȱlogischeȱProtokollȱeinesȱSANȱbleibtȱdabeiȱweiterhinȱSCSI.ȱZurȱÜbertraȬ gungȱ dientȱ allerdingsȱ derȱ Fibreȱ Channel,ȱ eineȱ Technologie,ȱ dieȱ sichȱ durchȱ hoheȱ Übertragungsratenȱȱ(1000ȱMbit/s)ȱundȱeineȱgesteigerteȱReichweiteȱ(10ȱkmȱzwischenȱ zweiȱKnoten)ȱauszeichnet.ȱ
6.7 Trend KeineȱSpezialmedien,ȱsondernȱherkömmlicheȱFestplattenȱsindȱfürȱdieȱelektronischeȱ ArchivierungȱaufȱdemȱVormarsch.ȱGrundȱistȱeinerseitsȱderȱPreisverfallȱdieserȱMeȬ dien,ȱzumȱanderenȱdieȱeinfacheȱMöglichkeit,ȱsieȱinȱSANȬȱoderȱNASȬUmgebungenȱ zuȱintegrieren.ȱDerȱBedienkomfortȱundȱdasȱhoheȱSpeichervolumen,ȱsowieȱdieȱZuȬ verlässigkeitȱ inȱ derȱ Nutzungȱ dürftenȱ weitereȱ Argumenteȱ fürȱ einenȱ verstärktenȱ Einsatzȱsein.ȱObȱsichȱderȱAnspruchȱanȱdasȱInformationȱLifecycleȱManagementȱerȬ füllenȱ lässt,ȱ bleibtȱ fraglich.ȱ Zuȱ hochȱ sindȱ dieȱ Hürdenȱ desȱ Managementsȱ undȱ derȱ zeitlichenȱSteuerungȱundȱKlassifikation.ȱȱȱ Wasȱsichȱdennochȱerkennenȱlässt,ȱistȱderȱallgemeineȱTrendȱzurȱRezentralisierung.ȱ SicherȱkeineȱneueȱEntwicklung,ȱfindetȱsieȱdochȱinȱderȱgesamtenȱITȱstatt,ȱdochȱeineȱ mitȱ besonderenȱ Rahmenbedingenȱ eröffnetȱ sieȱ mehrȱ Sicherheitȱ undȱ eineȱ bessereȱ IntegrationȱinȱdieȱAnwendungslandschaft.ȱȱ
6.8 Kontrollfragen 1. 2.
ȱ
WasȱlässtȱsichȱunterȱHierarchicalȱStorageȱManagementȱverstehen?ȱ Welcheȱ Merkmaleȱ müssenȱ Speichermedienȱ fürȱ dieȱ elektronischeȱ ArchivieȬ rungȱbesitzen?ȱ 3. WasȱistȱdieȱBesonderheitȱderȱWORMȬMedien?ȱ 4. WelchesȱProblemȱ versprichtȱ dasȱ InformationȱLifecycleȱ Managementȱ zuȱlöȬ sen?ȱ 5. Wasȱ unterscheidetȱ optischeȱ vonȱ magnetischenȱ Medienȱ hinsichtlichȱ ihrerȱ EignungȱfürȱdieȱlangfristigeȱDatenablage?ȱ 6. Worinȱ liegenȱ dieȱ wesentlichenȱ Unterschiedeȱ vonȱ NASȬȱ undȱ SANȬ Technologie?ȱ 7. WelcheȱVorteileȱsindȱmitȱderȱSANȬArchitekturȱverbunden?ȱ 8. GibtȱesȱeineȱTechnologieauswahlȱzurȱRealisierungȱvonȱSANs?ȱ 9. WorinȱunterscheidetȱsichȱdieȱStoreȬȱvonȱderȱPreserveȬKomponente?ȱ 10. HatȱdieȱFibreȱChannelȬTechnologieȱeineȱZukunft?ȱ
ȱ
175
7 Die Zukunft von ECM WieȱbeiȱallenȱimȱUmbruchȱbefindlichenȱTechnologienȱistȱeinȱverbindlichesȱSzenarioȱ fürȱ dieȱ Zukunftȱ vonȱ ECMȱ nichtȱ auszumachen.ȱ Lediglichȱ Entwicklungsrichtungenȱ lassenȱsichȱerahnen.ȱDieȱnahtloseȱIntegrationȱderȱeinzelnenȱECMȬKomponentenȱzuȱ einemȱ homogenenȱ Ganzenȱ wirdȱ sicherlichȱ eineȱ Rolleȱ spielenȱ genausoȱ wieȱ dieȱ InȬ tegrationȱmitȱdenȱbetriebswirtschaftlichenȱKernanwendungen.ȱDieȱNaturȱvonȱECMȱ wirdȱ sichȱ verändern,ȱ sobaldȱ sichȱ dieȱ Auffassungȱ vonȱ Contentȱ oderȱ Collaborationȱ wandeltȱ undȱ neueȱ Technikenȱ verfügbarȱ werden.ȱ Vorȱ diesemȱ Hintergrundȱ lassenȱ sichȱfünfȱTrendsȱausmachenȱ[Jenkins,ȱS.ȱ274]:ȱ – – – – –
Integrationȱ Complianceȱ Sicherheitȱ Collaborationȱ Mobilitätȱ
Inȱ derȱVergangenheitȱ habenȱ dieȱ Unternehmenȱ verstärktȱinȱ betriebswirtschaftlicheȱ Anwendungenȱ wieȱ ERP,ȱ CRMȱ oderȱ SCMȱ investiert.ȱ Dieȱ dazugehörigenȱ InformaȬ tionenȱ undȱ Geschäftsprozesseȱ sindȱ dementsprechendȱ verstreutȱ ohneȱ einheitlicheȱ Zugriffslogikȱ geblieben.ȱ Dieseȱ Architekturȱ legtȱ nahe,ȱ eineȱ zentraleȱ ECMȬ Komponenteȱeinzuführen,ȱdieȱdieȱunterschiedlichenȱInformationsbruchstückeȱverȬ bindet,ȱ soȱ dassȱ nahtlosȱ undȱ medienbruchfreiȱ aufȱ Informationenȱ zugegriffenȱ werȬ denȱkann,ȱohneȱdieȱZugehörigkeitȱzuȱeinemȱVorgangȱoderȱProzessȱzuȱkennen.ȱ TransparenzȱimȱZugeȱderȱComplianceȬDiskussionȱwirdȱeinȱimmerȱbedeutsameresȱ Thema.ȱ DieȱAufzeichnungȱ allerȱ entscheidungsrelevantenȱ Prozesseȱundȱ derenȱ DoȬ kumenteȱ istȱ dafürȱ entscheidend.ȱ Derȱ daranȱ geknüpfteȱ Anspruchȱ reichtȱ überȱ dieȱ reineȱ dokumentenzentrierteȱ Sichtweiseȱ hinausȱ bisȱ zuȱ EȬMailȬVerkehrȱ undȱ Instantȱ Messaging.ȱ Zukünftigȱ werdenȱ Unternehmenȱ demonstrierenȱ müssen,ȱ dassȱ sieȱ denȱ ComplianceȬAnforderungenȱ genügen.ȱ Dasȱ bedeutetȱ nichtȱ nurȱ zusätzlicheȱ Kosten,ȱ sondernȱauchȱeineȱZunahmeȱvonȱAuditsȱundȱweitererȱKontrollmaßnahmen.ȱAuchȱ inȱdiesemȱKontextȱkannȱeinȱzentralesȱECMȬGedächtnisȱeineȱHilfeȱdafürȱsein,ȱConȬ tentȱundȱDokumenteȱzeitnahȱundȱkostengünstigȱbereitȱzuȱstellen.ȱ SicherheitȱistȱeinȱzentralesȱElement,ȱwasȱnichtȱnurȱECMȱbetrifft.ȱInformationenȱaufȱ einemȱ Rechnerȱ sindȱ angreifbar,ȱ aberȱ auchȱ aufȱ physikalischerȱ Seiteȱ lauernȱ BedroȬ hungen,ȱ wennȱ z.B.ȱ einȱ Laptopȱ gestohlenȱ wirdȱ oderȱ CDsȱ undȱ andereȱ SicherungsȬ medienȱ verlorenȱ gehen.ȱ Unternehmenȱ sindȱ alsoȱ gefordert,ȱ Sicherheitsstrategienȱ einzuführen,ȱ umȱ denȱ Contentȱ jederzeitȱ reproduzierenȱ zuȱ können.ȱ Dieseȱ NotwenȬ digkeitȱ führtȱ zuȱ einerȱ Wiederbelebungȱ desȱ Zentralisierungsgedankens.ȱ ServerȬ
ȱ
177
7ȱȱDieȱZukunftȱvonȱECMȱ zentrierteȱArchitekturenȱinȱServerfarmenȱanȱeinemȱzentralenȱOrtȱbildenȱdasȱMittel,ȱ denȱgehobenenȱSicherheitsbedürfnissenȱgerechtȱzuȱwerden.ȱȱ Inȱ derȱ Vergangenheitȱ scheiterteȱ Collaborationȱ häufigȱ anȱ mangelnderȱ Bandbreite.ȱ Videokonferenzenȱ inȱ nichtȱ ausreichenderȱ Bildqualitätȱ stelltenȱ eherȱ einȱ Hemmnisȱ dennȱeinenȱFortschrittȱdar.ȱMitȱhoherȱBandbreiteȱhingegenȱlässtȱsichȱZusammenarȬ beitȱ inȱ Echtzeitȱ nachbilden.ȱ Damitȱ istȱ derȱ Übergangȱ vomȱ asynchronenȱ Gerätezooȱ wieȱHandy,ȱPDA,ȱBlackberryȱetc.ȱhinȱzuȱeinemȱGeschäftsprozess,ȱderȱKommunikaȬ tionȱnichtȱalsȱUnterbrechung,ȱsondernȱalsȱintegralenȱBestandteilȱsieht,ȱzuȱschaffen.ȱ DieȱVerschmelzungȱderȱZugänge,ȱdieȱKontrolleȱderȱErreichbarkeitȱundȱdieȱQualitätȱ derȱKommunikationȱsindȱhierfürȱwesentlicheȱVoraussetzungen.ȱDasȱTelepresenceȬ systemȱvonȱCiscoȱgibtȱhierȱeinenȱVorgeschmackȱaufȱdieȱEntwicklungsrichtung.ȱ DenȱstärkstenȱUmbruchȱbildetȱmöglicherweiseȱdieȱsteigendeȱMobilität.ȱDiesȱerforȬ dertȱ nichtȱ nurȱ denȱ Nutzerȱ ortsunabhängig,ȱ sondernȱ auchȱ geräteunabhängigȱ ausȬ findigȱzuȱmachen,ȱihmȱdenȱZugriffȱaufȱAnwendungenȱzuȱgestattenȱundȱdamitȱdieȱ MöglichkeitȱzurȱCollaborationȱeinzuräumen.ȱDamitȱwandeltȱsichȱdasȱBildȱderȱAnȬ wendungȱ vonȱ einerȱ individuellenȱ produktivitätsbezogenenȱ DokumentenbearbeiȬ tungȱ zuȱ einerȱ dialogorientiertenȱ Gruppenarbeit.ȱ Anwenderȱ könnenȱ wesentlichȱ flexiblerȱ andereȱ Gruppenmitgliederȱ zuȱ Echtzeittreffenȱ einladenȱ undȱ Themenȱ disȬ kutierenȱohneȱBewusstseinȱfürȱräumlicheȱSchranken.ȱ Dasȱ Stichwortȱ Recordsȱ Managementȱ wirdȱ möglicherweiseȱ einȱ Begriff,ȱ demȱ dieȱ Zukunftȱgehört.ȱAnwendungenȱdieserȱKlasseȱfindenȱihrenȱEinsatzȱdort,ȱwoȱUnterȬ nehmenȱ eineȱ durchgehendeȱ Kontrolleȱ ihrerȱ relevantenȱ Informationenȱ anstreben.ȱ Aufgabenȱ wieȱ ComplianceȬVorgabenȱ einhalten,ȱ geschäftlicheȱ Anforderungenȱ erȬ füllenȱoderȱRisikenȱminimierenȱgehörenȱhierzu.ȱȱ
178 ȱ
8 Literatur [Alexander]ȱAlexander,ȱS.:ȱUnstrukturierteȱDatenȱentschlüsseln,ȱin:ȱCWȱ29Ȭ30,ȱ2008,ȱ S.ȱ18/19.ȱ [Arbeitsgemeinschaft]ȱ Arbeitsgemeinschaftȱ fürȱ wirtschaftlicheȱ Verwaltungȱ zitiertȱ nach:ȱAllesȱinȱeinemȱKorb,ȱFACTS,ȱHeftȱ5,ȱ1999,ȱS.ȱ38ȱ–ȱ43ȱȱ [Becker]ȱ Becker,ȱ Th.:ȱ Sinnȱ undȱ Zweckȱ derȱ Archivierungȱ vonȱ Altakten,ȱ http://members.aol.com/tombec/altakten.htmlȱ [Bekavac]ȱBekavac,ȱB.:ȱInformationȱRetrieval,ȱVorlesungsskript,ȱ2002ȱȱ [Berchtenbreiter]ȱ Berchtenbreiter,ȱ R.:ȱ Grundlagenȱ vonȱ ContentȬManagementȬSysteȬ menȱundȱAnsätzeȱihrerȱBedeutungȱfürȱdasȱCRM,ȱ2004ȱȱ [Bitkomȱ2004]ȱBitkom:ȱLeitfadenȱzumȱThemaȱ„InformationȱLifecycleȱManagement“,ȱ 2004,ȱhttp://ȱwww.bitkom.deȱ [Bitkomȱ 2005]ȱ Bitkom:ȱ Leitfadenȱ zumȱ Themaȱ „EȬMailȱ Archivierung“,ȱ 2005,ȱ http://ȱ www.bitkom.deȱȱ [Böhm]ȱ Böhm,ȱ M:ȱ Aufȱ demȱ Wegȱ zurȱ ganzheitlichenȱ Informationsverwaltung,ȱ in:ȱ BARCȬGuide,ȱAusgabeȱI,ȱ2007ȱ [Boeck]ȱ Boeck,ȱ D.:ȱ Konzeptionȱ undȱ Umsetzungȱ digitalerȱ RechnungsstellungsproȬ zesseȱimȱEnergiemarktȱmitȱHilfeȱvonȱEDIFACTȱamȱBeispielȱderȱStadtwerkeȱFlensȬ burgȱGmbH,ȱDiplomarbeit,ȱ2007ȱ [Brand]ȱBrand,ȱTh.:ȱWasȱBetriebsprüferȱvomȱDMSȱfordern,ȱin:ȱCWȱ39/2007,ȱS.ȱ16Ȭ18ȱ [Byran]ȱByran,ȱM.:ȱ Guidelinesȱforȱ Usingȱ XMLȱ forȱ Electronicȱ Dataȱ InterchangeȱunȬ ter:ȱhttp://www.geocities.comȱ,ȱ1998ȱȱ [CM]ȱ Contentmanager,ȱ unter:ȱ http://www.contentmanager.de/magazin/artikeȬ l_400_ecm_teil_ii.htmlȱ [CWȱ2004]ȱComputerwoche:ȱAnwenderȱgehenȱPKIȬProjekteȱgezielterȱan,ȱ39/2004ȱ [CWȱ2008]ȱComputerwoche:ȱMoReq:ȱEinheitlicheȱAktenverwaltungȱinȱderȱEU,ȱ1/2008,ȱ S.ȱ9ȱ [DEDIG]ȱDEDIGȱ(Hrsg.):ȱEDIȬJahrbuchȱ95ȱ [Dierker]ȱDierker,ȱM.,ȱSander,ȱM.:ȱLotusȱNotesȱ4.x,ȱȱAddisonȱWesley,ȱ1996ȱȱ [DMS]ȱDMSȬFibelȱunter:ȱ:ȱhttp://www.aisȬgmbh.deȱ [ECMȱ 2005]ȱ ECM:ȱ Informationȱ Lifecycleȱ Management:ȱ Vomȱ Wertȱ derȱ InformatioȬ nen,ȱȱ2005,ȱȱhttp://www.ecin.de/strategie/ilmȱ
ȱ
179
8ȱȱLiteraturȱ [ECMȱ2007]ȱECMGuide:ȱZuȱwenigȱFirmenȱnutzenȱelektronischeȱRechnungen,ȱECMȬ News,ȱ2007ȱ [Fischer]ȱFischer,ȱJ.:ȱUnternehmensübergreifendeȱDatenmodellierungȱȬȱderȱnächsteȱ folgerichtigeȱSchrittȱderȱzwischenbetrieblichenȱDatenverarbeitung,ȱin:ȱWirtschaftsȬ informatik,ȱHeftȱ3,ȱ1995,ȱS.ȱ241ȱ–ȱ254ȱȱ [Foest]ȱFoest,ȱG.,ȱMönnich,ȱJ.,ȱPattloch,ȱM.:ȱFürȱalleȱFälleȱPKI,ȱin:ȱDFNȱMitteilungenȱ 2006,ȱS.ȱ29Ȭ32ȱ [Freiburg]ȱ Freiburg,ȱD.:ȱ Ergonomieȱ inȱ Dokumentenretrievalsystemen,ȱ in:ȱ MenschȬ ComputerȬKommunikation,ȱBandȱ3,ȱdeȱGruyter,ȱ1987ȱȱ [Fuhrȱ2002]ȱFuhr,ȱN.:ȱDatenbankenȱIRȬTeil,ȱVorlesungsskript,ȱ2002ȱ [Fuhrȱ2004]ȱFuhr,ȱN.:ȱInformationȱRetrieval,ȱSkriptumȱzurȱVorlesungȱSS04,ȱ2004ȱ [Georg]ȱGeorg,ȱT.:ȱGeplantesȱVorgehen,ȱin:ȱiX,ȱHeftȱ10,ȱ1993,ȱS.ȱ124ȱ–ȱ131.ȱȱ [Gerick]ȱ Gerick,ȱTh.:ȱ TopicȱMapsȱ–ȱ derȱ neueȱ Standardȱ fürȱ intelligentesȱ Knowledgeȱ Retrieval,ȱinȱWissensmanagement,ȱHeftȱ2,ȱ2000,ȱS.ȱ8ȱ–ȱ12.ȱ [Goeser]ȱGoeser,ȱS.:ȱRelevanzranking,ȱinȱDatenbankȱSpektrum,ȱHeftȱ10,ȱ2004,ȱS46ȱȬȱ 48.ȱȱ [Grappmeier]ȱ Gappmeier,ȱ M.:ȱ Computerunterstützungȱ kooperativenȱ Arbeitensȱ (CSCW),ȱin:ȱWirtschaftsinformatik,ȱHeftȱ3,ȱ1992,ȱS.ȱ340ȱ–ȱ343ȱȱ [Grenzebachȱ1]ȱGrenzebach,ȱE.ȱ1:ȱOutputȬManagement:ȱMehrȱalsȱDrucken,ȱin:ȱECMȬ guideȱ2006ȱ [Grenzebachȱ2]ȱGrenzebach,ȱE.ȱ2:ȱCOLDȬArchivierung:ȱDieȱZukunftȱderȱVergangenȬ heit,ȱin:ȱECMguideȱ2006ȱȱ [Häber]ȱ Häber,ȱA.,ȱDujat,ȱC.,ȱSchmücker,ȱP.:ȱ Leitfadenȱ fürȱ dasȱ rechnergestützteȱ DoȬ kumentenmanagementȱundȱdieȱdigitaleȱArchivierungȱvonȱPatientenunterlagenȱimȱ Gesundheitswesen,ȱGITȬVerlag,ȱ2005ȱ [Hartl]ȱHartl,ȱS.,ȱKühl,ȱL.,ȱRuge,ȱT.:ȱTechnikenȱdesȱTextȱMining,ȱinternersȱPaperȱFHȱ Flensburg,ȱ2008ȱ [Heiermann]ȱHeiermann,ȱC.:ȱAufȱzumȱneuenȱArchiv,ȱ2006,ȱhttp://www.pdfa.orgȱ [Heilmann]ȱ Heilmann,ȱ H.:ȱ Workflowȱ Management:ȱ Integrationȱ vonȱ Organisationȱ undȱInformationsverarbeitungȱin:ȱHMDȱ176,ȱ1994,ȱS.ȱ8ȱ–ȱ21.ȱ [Heyerȱ 2005]ȱ Heyer,ȱ G.;ȱ Quasthoffȱ U.;ȱ Witting,ȱ T.:ȱ Textȱ Mining:ȱ Wissensrohstoffȱ Text,Bochum,ȱW3LȱGmbH,ȱ2005.ȱ [Horst]ȱHorst,ȱH.:ȱSichereȱLangzeitarchivierung:ȱWasȱzähltȱistȱderȱProzess,ȱin:ȱDOK.,ȱ 2/2008,ȱS.ȱ62Ȭ64.ȱ [IS]ȱInformatikȬSpektrum,ȱHeftȱ14,ȱ1991,ȱS.ȱ345ȱ–ȱ348.ȱ [Jablonski]ȱJablonski,ȱS.:ȱWorkflowȬManagementȬSysteme.ȱModellierungȱundȱArchiȬ tektur.ȱBonn,1995ȱ
180 ȱ
8ȱȱLiteraturȱ [Jenkins]ȱ Jenkins,ȱ T.:ȱ Enterpriseȱ Contentȱ Managementȱ –ȱ Technology,ȱ Openȱ Text,ȱ 2007ȱ [Jones]ȱ Jones,ȱ S.:ȱ Textȱ andȱ Context:ȱ Documentȱ Processingȱ andȱ Storage,ȱ Springer,ȱ 1991ȱ [Kampffmeyerȱ 1996]ȱ Kampffmeyer,ȱ U.,ȱ Merkel,ȱ B.:ȱ Standardsȱ fürȱ offeneȱ Systeme:ȱ WorkflowȱManagementȱCoalition,ȱin:ȱComputerwocheȱ20,ȱ1996,ȱS.ȱ45/46.ȱ [Kampffmeyerȱ2003]ȱKampffmeyer,ȱU.:ȱEnterpriseȱContentȱManagementȱȬȱZwischenȱ Visionȱ undȱ Realität,ȱ 2003ȱ unter:ȱ http://www.contentmanager.de/magazin/ȱ artiȬ kel_398Ȭ97_ecm_zwischen_vision_und_realitaet.htmlȱ [Kampffmeyerȱ 2007/1]ȱ Kampffmeyer,ȱU.:ȱ Enterpriseȱ Contentȱ Management,ȱ ProjectȬ ConsultȱundȱIBM,ȱ2007ȱȱ [Kampffmeyerȱ2007/2]ȱKampffmeyer,ȱU.:ȱEȬMailȬManagement,ȱIBMȬPaper,ȱ2007ȱ [Kampffmeyer]ȱKampffmeyer,ȱU.:ȱParadigmenwechselȱimȱDokumentenmanagement,ȱ unter:ȱhttp://www.aisȬgmbh.deȱȱ [Koster]ȱ Koster,ȱ M.:ȱ Robotsȱ inȱ theȱ http://info.webcrawler.com/mak/projects/robotsȱȱ
Web:ȱ
Threatȱ
orȱ
Treat?ȱȱ
[Menke]ȱ Menke,ȱ N.:ȱ Pagerankȱ +ȱ Erweiterungen,ȱ 2005,ȱ http://www.uniȬkasȬ sel.de/~menke/pagerank.pdfȱ [NA]ȱNormenausschussȱBürowesenȱ (Hrsg.):ȱEinführungȱ inȱ EDIFACTȱ Ȭȱ Entwicklung,ȱ GrundlagenȱundȱEinsatz,ȱ4.ȱAufl.ȱ1991ȱ [PDFȬTools]ȱPDFȬTools:ȱPDF/Aȱ–ȱEinȱneuerȱStandardȱfürȱdieȱLangzeitȬArchivierung,ȱ 2007ȱ [Pfeiffer]ȱ Pfeiffer,ȱ R.:ȱ XMLȱ Tutorialsȱ http://www.software.ibm.com/xml/educationȱ
forȱ
Programmers,ȱ
unter:ȱȱȱ
[Rasche]ȱ Rasche,ȱ R.:ȱ Rechtlicheȱ Rahmenbedingungenȱ fürȱ optischeȱ Archivsysteme,ȱ in:ȱComputerwocheȱ22(1992),ȱS.ȱ35ȱȬȱ39.ȱȱ [Rathgeb]ȱRathgeb,ȱM.;ȱWeiß,ȱD.:ȱRechnerbasierteȱUnterstützungȱvonȱGeschäftsproȬ zessen,ȱin:ȱPCȬNetze,ȱHeftȱ4,ȱ1995,ȱS.ȱ80ȱ–ȱ82.ȱ [Reisen]ȱReisen,ȱA.:ȱDigitaleȱSignaturen,ȱBundesamtȱfürȱSicherheitȱinȱderȱInformatiȬ onstechnik,ȱ1998.ȱ [Rentergent]ȱRentergent,ȱJ.:ȱAusȱderȱKombinationȱzweierȱGegensätzeȱeinenȱGewinnȱ erzielen,ȱin:ȱComputerwocheȱ14,ȱ1996,ȱS.ȱ34.ȱ [Robie]ȱRobie,ȱJ.:ȱȱXQLȬTutorialȱunter:ȱhttp://metalab.unc.edu/xqlȱ [SAGȱ1991]ȱSoftwareȱAG:ȱTextȱRetrievalȱTechnology:ȱOverview,ȱWhiteȱPaper,ȱ1991ȱ [SAGȱ1999]ȱSoftwareȱAG:ȱTaminoȱ–ȱWhiteȱPaper,ȱ1999.ȱ ȱ
ȱ
181
8ȱȱLiteraturȱ [Salton]ȱSalton,ȱG.,ȱMcȱGill,ȱM.:ȱInformationȱRetrievalȱȬȱGrundlegendesȱfürȱInformaȬ tionswissenschaftler,ȱMcȱGrawȱHill,ȱ1983.ȱ [SAS]ȱ SAS:ȱ Texteȱ werdenȱ maschinenlesbar,ȱ unter:ȱ http://www.computerzeitung.de/articles/textinhalte_werden_maschinenlesbar:/200 8038/31618660_ha_CZ.html?rss=1ȱ [Scheckenbach]ȱ Scheckenbach,ȱ R.:ȱ WebȬEDIȱ –ȱ EDIȱ fürȱ kleineȱ undȱ mittelständischeȱȱ Unternehmen,ȱDEDIG,ȱ1999ȱȱ [Schumann]ȱ Schumann,ȱ H.:ȱ Eingangspostbearbeitungȱ inȱ BürokommuniȬ kationssystemen,ȱBetriebsȬȱundȱWirtschaftsinformatikȱBandȱ19,ȱSpringer,ȱ1986.ȱȱ [Stock]ȱ Stock,ȱ W.ȬG.:ȱ Informationswirtschaft:ȱ Managementȱ externenȱ Wissens.ȱ OlȬ denbourgȱWissenschaftsverlagȱGmbH,ȱMünchenȱȬȱWien,ȱ2000ȱ [Techguide]ȱ Techguide:ȱ Flanagan,ȱ T.,ȱ Safdie,ȱ E.:ȱ Workflowȱ onȱ theȱ Web,ȱ 1997,ȱ http://www.techguide.comȱȱ [Teufel]ȱ Teufel,ȱS.:ȱ Computerunterstützteȱ Gruppenarbeit.ȱ Eineȱ Einführung,ȱ in:ȱ ÖsȬ terle,ȱH.ȱ(Hrsg.):ȱPraxisȱdesȱWorkflowȬManagements.ȱGrundlagen,ȱVorgehen,ȱBeiȬ spiele.ȱBraunschweig,ȱ1996.ȱ [Trammell]ȱTrammell,ȱK.:ȱWorkflowȱwithoutȱFear,ȱin:ȱByte,ȱHeftȱ4,ȱ1996,ȱS.ȱ55ȱ–ȱ60.ȱȱ [Witte]ȱWitte,ȱR.;ȱMüller,ȱJ.:ȱTextȱMining:ȱWissensgewinnungȱausȱnatürlichsprachiȬ genȱDokumenten,ȱInternerȱBerichtȱderȱUniȱKarlsruhe,ȱ2006.ȱ ȱ
182 ȱ
Sachwortverzeichnis Aȱ
Cȱ
Abgabenordnungȱȱ154ȱ AbgabenordnungȱAOȱȱ141,ȱ143,ȱ145ȱf.,ȱ 154ȱf.ȱ Ablauforganisationȱȱ65,ȱ67,ȱ87,ȱ154ȱ AESȱȱ126ȱ AFPȱȱ121ȱ Ähnlichkeitȱȱ20,ȱ100ȱff.,ȱ108,ȱ116ȱ AIIMȱȱ5,ȱ9,ȱ159ȱ Aktivitätȱȱ2,ȱ43,ȱ67ȱff.,ȱ140,ȱ152ȱ Analysekorpusȱȱ114ȱ ANSIȱX.12ȱȱ27,ȱ48ȱ Arbeitslisteȱȱ65,ȱ68,ȱ73,ȱ77ȱf.ȱ Archivȱ Abteilungȱȱ142ȱ Arbeitsplatzȱȱ141ȱ Unternehmenȱȱ142ȱ ArchivȬGebotȱȱ153ȱ ATAȬPlatteȱȱ168ȱ Attributȱȱ69,ȱ134ȱ Aufbauorganisationȱȱ66ȱf.,ȱ74,ȱ86ȱ Aufbewahrungsfristȱȱ162ȱ Aufbewahrungsfrist,ȱgesetzlichȱȱ141ȱ Aufbewahrungsverfahrenȱȱ154ȱ Aufzeichnungsverfahrenȱȱ8,ȱ154,ȱ163,ȱ166ȱ Authentizitätȱȱ53,ȱ121ȱf.,ȱ124,ȱ130,ȱ137,ȱ140,ȱ 146ȱ
CASȱȱ150ȱ CASEȱȱ106ȱ CDȬRȱȱ150,ȱ162ȱff.ȱ CDȬROMȱȱ162ȱ CEFICȱȱ27ȱ CheckȬIn/CheckȬOutȱȱ55ȱ Chiffrierungȱȱ124ȱ Chipkarteȱȱ135ȱ CIFSȱȱ171ȱ CIȬInformationȱȱ61ȱ ClientȬ/Serverȱȱ42,ȱ66ȱ Clusterȱȱ20,ȱ108,ȱ116ȱ COLDȱȱ5,ȱ7,ȱ120,ȱ138ȱ CompoundȱDocumentȱȱ45ȱ ContentȬManagementȱȱ1ȱff.,ȱ7,ȱ9,ȱ159ȱ CSCWȱȱ81,ȱ116ȱ
Bȱ Backupȱȱ140,ȱ165ȱf.,ȱ170,ȱ172ȱf.,ȱ175ȱ Barcodeȱȱ15ȱ Bearbeitungszeitȱȱ56,ȱ71,ȱ75ȱ Beweiskraftȱȱ122,ȱ150,ȱ156ȱf.ȱ Blocklevelȱȱ171ȱ BPMȱȱ7,ȱ9,ȱ65ȱ
ȱ
Dȱ DataȱMiningȱȱ22,ȱ113ȱ DataȱWarehouseȱȱ159ȱ Datenelementȱȱ32,ȱ34ȱ Datenelementgruppeȱȱ32,ȱ34ȱ Datenqualitätȱȱ11ȱ Datenspeicher,ȱoptischȱȱ164ȱ DESȱȱ125ȱ Deskriptorȱȱ98,ȱ100ȱff.ȱ Deskriptorȱ formalȱȱ63,ȱ96ȱ DiffieȬHellmanȬVerfahrenȱȱ127ȱ Diskriminanzwertȱȱ100ȱ Distributionȱȱ4,ȱ119ȱ Dokumenteȱ irrelevantȱȱ95ȱ relevantȱȱ98ȱ
183
Sachwortverzeichnisȱ Dokumenteȱstrukturiertȱȱ65ȱ Dokumenteȱunstrukturiertȱȱ4ȱ Dokumentenanalyseȱȱ20,ȱ97ȱ Dokumentenaustauschȱȱ157ȱ Dokumentenerfassungȱȱ12,ȱ92ȱf.ȱ Dokumentenklasseȱȱ12ȱ Dokumentenwurzelȱȱ45,ȱ156ȱ Dokumentfrequenzȱȱ99ȱf.,ȱ102ȱ DOMEAȱȱ148ȱ DRTȱȱ9ȱ DTDȱȱ2,ȱ49ȱ Durchlaufzeitȱȱ11,ȱ56,ȱ67ȱ DVDȱȱ150,ȱ163ȱff.ȱ
Eȱ EANCOMȱȱ26ȱf.ȱ ECMȱ2.0ȱȱ9ȱ EDIFACTȱȱ26ȱf.,ȱ29ȱff.,ȱ36,ȱ38,ȱ41,ȱ43,ȱ48,ȱ49ȱ EDIFICEȱȱ27ȱ EȬMailȱȱ41,ȱ46ȱf.,ȱ69,ȱ77ȱf.ȱ Entscheidungsstärkeȱȱ98ȱf.ȱ Erfolgsfaktorenȱȱ66ȱ Ethernetȱȱ169,ȱ171,ȱ173ȱ Extraktionȱȱ14,ȱ16,ȱ21ȱf.,ȱ24,ȱ49,ȱ65,ȱ146ȱ Extranetȱȱ2ȱ
Fȱ FibreȬChannelȱȱ172ȱf.,ȱ175ȱ Fingerabdruckȱȱ17,ȱ129,ȱ131ȱf.ȱ Frequenzȱȱ99ȱf.ȱ FTPȱȱ41,ȱ110ȱ
Gȱ GDPdUȱȱ124,ȱ139,ȱ143,ȱ145ȱff.,ȱ155,ȱ158ȱ Gewichtsfunktionȱȱ100ȱ GoBSȱȱ141,ȱ144,ȱ147,ȱ155ȱ
Hȱ Handelsbücherȱȱ154ȱf.ȱ Handelsrechtȱȱ155ȱ Hashfunktionȱȱ129,ȱ133,ȱ156ȱ
184 ȱ
HCRȱȱ15ȱ HTMLȱȱ42,ȱ45ȱ HybridȬVerfahrenȱȱ126ȱ
Iȱ IBIȱȱ48ȱ ICRȱȱ15ȱ IDWȱȱ146ȱ Indexierungȱȱ61ȱf.,ȱ90,ȱ92,ȱ95ȱff.,ȱ102,ȱ110ȱ Indexierungȱ manuellȱȱ55,ȱ96,ȱ102ȱ Indexierungȱ automatischȱȱ96ȱ Indexierungsvokabularȱȱ96ȱf.,ȱ102ȱf.ȱ InformationȱLifecycleȱȱ9,ȱ167f.,ȱ175ȱ inhaltlicheȱErschließungȱȱ6,ȱ96,ȱ108ȱ Integritätȱȱ41,ȱ53,ȱ122,ȱ124,ȱ130,ȱ135,ȱ140,ȱ 146,ȱ149,ȱ156ȱ Internetȱȱ40ȱff.,ȱ105,ȱ111ȱ
Jȱ JAVAȱȱ42ȱ JPEGȱȱ62,ȱ148ȱ JustȬinȬtimeȱȱ66ȱ
Kȱ Klassifikationȱȱ6ȱf.,ȱ14,ȱ16,ȱ19ȱff.,ȱ49,ȱ56,ȱ65,ȱ 92,ȱ141,ȱ175ȱ Klassifikationȱmanuellȱȱ12ȱ Kompressionȱȱ62,ȱ119,ȱ121,ȱ138ȱ Kontrollregelȱȱ69ȱ Konverterȱȱ121ȱ Kooperationȱȱ82ȱf.ȱ
Lȱ Langzeitarchivierungȱȱ7,ȱ54,ȱ123,ȱ147ȱff.,ȱ 156,ȱ159,ȱ163,ȱ167ȱ
Mȱ Massendruckȱȱ120ȱf.ȱ
Sachwortverzeichnisȱ Medienbruchȱȱ42,ȱ68,ȱ122,ȱ142ȱ MessageȱDigestȱȱ128ȱf.ȱ Metadatenȱȱ8,ȱ44,ȱ117,ȱ121,ȱ149ȱf.ȱ Metaspracheȱȱ2,ȱ43,ȱ45ȱ Mikrofilmȱȱ6,ȱ154,ȱ156ȱ MIMEȱȱ41ȱ MoReq2ȱȱ157ȱ
Nȱ Nachrichtenaufbaudiagrammȱȱ31ȱff.,ȱ35ȱ Nachrichtengruppeȱȱ27,ȱ33ȱ Nachrichtentypȱ INVOICȱȱ29ȱf.,ȱ36ȱff.ȱ NANDȬSpeicherȱȱ167ȱ NASȱNetworkȱAttachedȱStorageȱȱ8,ȱ168ȱff.,ȱ 175ȱ NCIȬInformationȱȱ61ȱ NearlineȬSpeicherȱȱ161ȱ NFSȱȱ171ȱ
Oȱ OCRȱȱ15,ȱ49,ȱ61,ȱ63ȱ ODETTEȱȱ27ȱ OfflineȬSpeicherȱȱ161ȱ OnlineȬSpeicherȱȱ161ȱ Organigrammȱȱ67ȱ OutputȬManagementȱȱ7,ȱ24,ȱ119ȱf.,ȱ138ȱ
Pȱ PDF/Aȱȱ121,ȱ148ȱff.,ȱ157ȱf.ȱ PKIȱȱ121,ȱ136,ȱ138ȱ Platzhalterȱȱ104ȱ Postkoordinationȱȱ97ȱ Präkoordinationȱȱ96ȱ Precisionȱȱ93ȱff.,ȱ97,ȱ103ȱ Primfaktorzerlegungȱȱ125ȱ Prozeßketteȱȱ28ȱ PublicȱKeyȱȱ122,ȱ136,ȱ138ȱ
Qȱ Qualifierȱȱ32,ȱ39ȱ
ȱ
Queryȱȱ93ȱ
Rȱ RAIDȬSystemȱȱ8,ȱ165ȱ Rankingȱȱ99ȱff.,ȱ109ȱ Ratingȱȱ9ȱ RC2ȱȱ125ȱ RC4ȱȱ125ȱ Recallȱȱ93ȱff.,ȱ97ȱ Rechtssicherheitȱȱ157ȱ RecordsȱManagementȱȱ5,ȱ7ȱf.,ȱ157,ȱ178ȱ Referenzȱȱ38,ȱ148,ȱ158ȱ Referenzkorpusȱȱ114ȱ Referenzmodellȱȱ76ȱf.ȱ Registrierungsstelleȱȱ136ȱ Replikationȱȱ85ȱf.,ȱ169ȱ Repositoriesȱȱ159ȱ Revisionssicherheitȱȱ139,ȱ152,ȱ166ȱ Robotsȱȱ110ȱ Rolleȱȱ3,ȱ8,ȱ14,ȱ20,ȱ26,ȱ45,ȱ49,ȱ51,ȱ66,ȱ74ȱf.,ȱ 86ȱf.,ȱ107,ȱ109,ȱ117,ȱ139ȱf.,ȱ142,ȱ147,ȱ149,ȱ 161,ȱ166,ȱ172,ȱ177ȱ Rollenkonzeptȱȱ74ȱ RSAȱȱ125,ȱ127,ȱ156ȱ
Sȱ SANȱStorageȱAreaȱNetworkȱȱ8,ȱ168ȱff.ȱ SarbanesȱOxleyȱActȱȱ139ȱ Scannerȱȱ61,ȱ64ȱ ScanȬVorgangȱȱ61ȱ Schlüsselaustauschȱȱ126ȱ Schlüssellängeȱȱ125ȱf.,ȱ156ȱf.ȱ Schreibgeschwindigkeitȱȱ162,ȱ167ȱ Schreibzyklenȱȱ167ȱ Scoresȱȱ102ȱ SCSIȱȱ8,ȱ171ȱff.,ȱ175ȱ SEDASȱȱ27,ȱ31ȱ Segmentȱȱ32ȱf.,ȱ35,ȱ37ȱff.,ȱ80,ȱ165ȱ Segmentȱ Statusȱȱ32ȱ Segmentȱ Gruppeȱȱ33ȱ
185
Sachwortverzeichnisȱ SHAȱȱ129,ȱ156ȱ Signaturȱdigitalȱȱ130ȱ Signaturȱelektronischȱȱ122ȱf.,ȱ132,ȱ156ȱ Signaturȱelektronischȱqualifiziertȱȱ122ȱ Signaturgesetzȱȱ53,ȱ122ȱff.,ȱ133,ȱ147ȱ Simulationȱȱ74,ȱ76ȱ Spiderȱȱ110ȱ Stammformȱȱ97,ȱ102,ȱ106ȱ Steuerrechtȱȱ149,ȱ155ȱ Stichwortȱȱ106,ȱ112,ȱ178ȱ Stoppwortȱȱ20ȱ Strukturȱ logischȱȱ45ȱ Suchanfrageȱȱ91,ȱ93ȱf.,ȱ100ȱf.,ȱ103ȱff.,ȱ108ȱ Sucheȱ kontextabhängigȱȱ104ȱ synonymabhängigȱȱ105ȱ wortstammabhängigȱȱ106ȱ Suchmaschineȱȱ12,ȱ109ȱf.ȱ
Tȱ Tagȱȱ49ȱ Taggingȱȱ9ȱ Texterkennungȱȱ14ȱf.ȱ Thesaurusȱȱ8,ȱ93,ȱ97ȱf.,ȱ102ȱf.,ȱ105ȱ TIFFȬFormatȱȱ7,ȱ121,ȱ148ȱf.ȱ Trennzeichenȱȱ34ȱf.,ȱ38ȱ Triggerȱȱ69ȱ TrustȬCenterȱȱ124ȱ
Uȱ Übertragungsdateiȱȱ33ȱff.,ȱ38ȱ UTFȬ8ȱȱ47ȱ
ȱ ȱ ȱ ȱ ȱ ȱ ȱ
186 ȱ
Vȱ Validierungȱȱ14ȱ VDAȱȱ27,ȱ31ȱ Vektorraummodellȱȱ102ȱ Verschlüsselungȱȱ41,ȱ124,ȱ126ȱff.,ȱ135,ȱ137ȱ f.,ȱ146,ȱ149ȱ Verschlüsselungsstandardȱȱ126ȱ Verschlüsselungsverfahrenȱȱ124,ȱ127ȱf.,ȱ 134ȱf.,ȱ138ȱ Vertraulichkeitȱȱ64,ȱ126,ȱ134,ȱ137,ȱ146ȱ Verweisȱȱ54ȱ Votingȱȱ9ȱ
Wȱ Wahrscheinlichkeitstheorieȱȱ16ȱ Webȱ2.0ȱȱ9,ȱ113ȱ WebȬEDIȱȱ42ȱf.,ȱ49ȱ WFMCȱȱ76ȱ Workflowȱcollaborativȱȱ80ȱ WorkflowȱProductionȱȱ80ȱ Workflowmonitorȱȱ73ȱ Workgroupȱȱ83ȱ WORMȱȱ59,ȱ150,ȱ156,ȱ162ȱf.,ȱ175ȱ Wortstammȱȱ97,ȱ102ȱ WWWȱȱ40,ȱ43,ȱ90ȱ
Zȱ Zeitstempelȱȱ123,ȱ134,ȱ156ȱf.ȱ Zertifikatȱȱ122,ȱ124,ȱ131,ȱ133ȱff.ȱ Zertifizierungsstelleȱȱ122,ȱ133ȱff.ȱ Zugriffȱmittelbarȱȱ145ȱ Zugriffȱunmittelbarȱȱ145ȱ