168 86 32MB
German Pages 76 [89] Year 1985
HERAUSGEBER HUBERT FEGER
C. F. G R A U M A N N KLAUS HOLZKAMP MARTIN IRLE
BAND
15 1 9 8 4 H E F T 2
V E R L A G HANS H U B E R BERN STUTTGART WIEN
Zeitschrift für Sozialpsychologie 1984, Band 15, Heft 2 INHALT 7M diesem Heft
103
Theorie und Methoden PLAUM, E.: «Pascalsche» versus «Baconsche» Wahrscheinlichkeit in der psychologischen Forschung und Praxis
104
Empirie H.-G.: Bedingungen der Informiertheit über eine öffentliche P l a n u n g - d e r aktive Rezipient D O H M E N , P. & F E G E R , H . : Untersuchungen zum Komponentenmodell der Einstellungsobjekte: II. Experimentelle Prüfungen PRESTER,
120 136
Diskussion Apriorische Elemente in psychologischen Forschungsprogrammen: Weiterführende Argumente und Beispiele W E S T E R M A N N , R . & H A G E R , W . : Z u r Verwendung von Effektgrößen in dertheorie-orientierten Sozialforschung BRANDTSTÄDTER, J . :
151 159
Literatur Neuerscheinungen
167
Titel u n d Abstracta
168
Nachrichten und Mitteilungen
169
Autoren
177
Vorschau
178
Copyright 1984 Verlag Hans Huber Bern Stuttgart Wien Herstellung: Satzatelier Paul Stegmann, Bern Printed in Switzerland Library ofCongress Catalog Card Number 78-126626 Die Zeitschrift für Sozialpsychologie wtrd in Social Sciences Citation /«ifct(SSCI)und Current Contents/ Social and Behavioral Sciences erfaßt.
103
Zeitschrift fiir Sozialpsychologie 1984
Zu diesem Heft Die (im vorigen Editorial schon von mir aufgeworfene) Frage, wie der in der Zeitschrift zu beobachtende Trend zu methodisch-methodologischen Analysen einzuschätzen ist, läßt sich zunächst aus dem Negativen beleuchten: Woran es uns mangelt, ist ein Angebot an Artikeln mit weitgespannten, wohldurchdachten, inhaltsreichen theoretischen Entwürfen und deren gegenstandsadäquater empirischer Prüfung. In dieser Sicht scheint mir die Tendenz zu statistisch-experimenteller Methodologie als Ausdruck eines (für das gesamte Fach charakteristischen) Rückzugs vor dem Risiko anspruchsvoller theoretischer Klärungen (für die allgemein akzeptierte Kriterien kaum vorliegen) auf ein Feld, das man - sofern man das Problem des Ansatzes bzw. Gegenstandsbezugs, wie üblich, ausklammert - im Einklang mit einem tradierten Verfahrenskanon so bearbeiten zu können meint, daß dabei die Anerkennung der Fachkollegen sicher ist. Dies geht so weit, daß selbst in empirischen Untersuchungen das dabei behandelte Problem des öfteren lediglich zum relativ beliebigen Beispiel für eine aus die-
sem Anlaß vorzuführende Verfahrensweise «enteigentlicht» wird (und man so dem Vorwurf der Unschärfe des Theoretisierens und der Trivialität der Aussage sich entziehen zu können meint). Wenn man die methodologischen Beiträge aus der letzten Zeit bis hin zu diesem Heft genauer ansieht, so bietet sich indessen noch eine andere, positivere Einschätzung an: Manche der einschlägigen Arbeiten enthalten in der Kritik der experimentell-statistischen Forschungslogik und darüber hinaus (wenn auch noch zaghafte) Andeutungen auf alternative Forschungskonzeptionen, in denen die bestehende Gegenläufigkeit zwischen theoretischer Tragfähigkeit und methodischer Präzision sozialpsychologischer Untersuchungen sich allmählich aufheben könnte. Wir werden (soweit möglich) diesen Trend in unserer zukünftigen Herausgeber- und Redaktionsarbeit zu unterstützen trachten. ^ KLAUS HOLZKAMP
I
J
104
Plaum: «Pascalsche» versus «Baconsche» Wahrscheinlichkeit
Theorie und Methoden «Pascalsche» versus «Baconsche» Wahrscheinlichkeit in der psychologischen Forschung und Praxis ERNST PLAUM Katholische Universität Eichstätt
Es wird dargestellt, daß in der Psychologie mit zwei verschiedenen WahrscheinlichkeitsbegrifFen gearbeitet wird, wobei der eine der gängigen Wahrscheinlichkeitstheorie und -rechnung entspricht (und worauf sich auch die Statistik stützt), der andere aber mit der «Logik des Experimentierens» im Sinne BACONS in Beziehung zu bringen ist. Beide sind unterschiedlichen Vorgehensweisen zuzuordnen, was anhand von Beispielen aus Forschung und Praxis aufgewiesen werden kann. L.J. COHEN war bemüht, den Rückstand der BACONschen Tradition gegenüber einer anderen Orientierung aufzuholen und hat damit vielversprechenden, aber zurückgedrängten Ansätzen in der Psychologie erneut Auftrieb gegeben. Dies ist insbesondere von Bedeutung bei Einzelfalluntersuchungen, aber auch der experimentellen Hypothesenprüfung insgesamt.
It is argued that in psychology there exist two distinct concepts of probability. One of these is in accord with the well known probability theory and calculus and constitutes the basis of statistics as well, while the other has to do with the logic of experimentation in a BACONian sense. Both are associated with different modes of proceeding which can be demonstrated with the aid of instructive examples in science and practice. L.J. COHEN made up for the outstanding debt in BACONian tradition of reasoning in comparison with other tendencies and thus gave rise to directions in psychology which have been repressed. This is especially important with respect to single case assessment in clinical psychology, but also in connection with experimental strategies in general.
1. Exposition des Themas
Statistische Regelmäßigkeiten eröffnen durchaus Möglichkeiten auch für die praktische Anwendung psychologischer Erkenntnisse: So mag beispielsweise die Berücksichtigung weniger Variablen in der Eignungsdiagnostik einen Ausleseprozeß im Hinblick auf ein Kollektiv, unter dem Kosten-Nutzen-Aspekt, effektiv gestalten, auch wenn nur ein gewisser Prozentsatz an vorteilhafteren Entscheidungen möglich erscheint. Nun kann die Feststellung derart grober Regelmäßigkeiten aber dem Anspruch der Psychologie als einer akademischen Disziplin letztlich nicht genügen; jede Wissenschaft hat das Ziel, Gesetzmäßigkeiten aufzudecken, die über oberflächliche, empirisch feststellbare Datenverteilungen hinausgehen (vgl. z.B. H O L Z K A M P , 1981). Probleme entstehen vor allem bei der Suche nach universellen Gesetzen, die für jeden Einzelfall gelten. Die Unzufrie-
Es wird fast schon als eine Selbstverständlichkeit betrachtet, daß in der Psychologie nur statistisch faßbare Gesetzmäßigkeiten aufzufinden und daher ausschließlich probabilistische Modelle angemessen seien (siehe z.B. W I T T E , 1977; K R A A K , 1981). Feststellungen zum Einfluß einzelner Variablen oder von Merkmalskombinationen stellen sich nur als Wahrscheinlichkeitsaussagen dar, unabhängig davon, ob nun streng deterministische Kausalgesetze gar nicht postuliert werden oder nur de facto als nicht erkennbar gelten, weil die Anzahl relevanter Gegebenheiten zu groß ist, deren Beziehungen zueinander hochkomplex bzw. unüberschaubar sind und schon gar nicht in Experimenten voll kontrollier- und manipulierbar erscheinen (CRONBACH, 1975; EPSTEIN, 1980).
105
Zeitschrift für Sozialpsychologie 1984, 15, 1 0 4 - 1 1 9
denheit mit Forschungsergebnissen, welche die Psychologie anzubieten hat, bezieht sich hauptsächlich auf die Unmöglichkeit einer irrtumsfreien Anwendung hinsichtlich eines konkreten Individuums (vgl. etwa BECKERMANN, 1977; WOTTAWA, 1981). Einen Versuch, diese Schwierigkeiten zu bewältigen, hat SMEDSLUND (1979, 1981) unternommen. Er fordert ein System logisch notwendiger Theoreme, welches die Basis einer wissenschaftlichen Psychologie bilden solle (hierzu auch BRANDTSTÄDTER, 1982), generalisierbare Resultate aufgrund einer empirischen Forschung werden dagegen als prinzipiell nicht realisierbar betrachtet: «Theories which aim at being testable and empirically valid, must fit the local cultural conditions and hence, cannot be general. Theories which aim at being general cannot fit particular local conditions and hence cannot be testable and empirically valid. Their validity has to be purely formal» (SMEDSLUND, 1979, p. 139). Empirische Forschung könne stets nur Resultate unter spezifischen Bedingungen erbringen (und daher zur Lösung konkreter praktischer Probleme beitragen). So benutze beispielsweise der Navigator Daten, um Positionen zu berechnen, nicht aber, um die Richtigkeit der geometrischen und trigonometrischen Formeln zu belegen, auf denen diese Berechnungen beruhen. Das andere Extrem besteht in der Feststellung, man könne nun einmal nur statistische Regelmäßigkeiten erkennen und auch die Entscheidung im Einzelfall müsse sich notgedrungen hieran orientieren. Dies führte zu der seinerzeit von MEEHL (1954) propagierten «statistischen» Vorhersage anstelle eines «klinischen» Vorgehens. Dagegen wurde geltend gemacht, daß zumindest bei bestimmten Bedingungen im Einzelfall solche Entscheidungsregeln sicher nicht anwendbar seien, wenn beispielsweise ein Beinbruch bestimmte Verhaltensweisen (etwa vorherzusagende motorische Aktivitäten) unmöglich mache (hierzu MEEHL, 1 9 5 7 ; PULVER, LANG & SCHMID, 1 9 7 8 ) . D i e B e -
fürworter statistischer Vorhersagen erklärten jedoch, solche offensichtlichen Ausnahmefalle seien im allgemeinen irrelevant (siehe MEEHL, 1957; WIGGINS, 1973). Daher hat man nicht nur Prognosen im Hinblick auf Gruppentrends wo dies angemessen wäre - nach dem Modell
der Wettervorhersage konzipiert, sondern wollte die Diagnostik des Individuums ebenfalls auf die gleiche Weise behandeln (WINKLER & MURPHY, 1973).
Zu einer dritten Lösungsmöglichkeit des obengenannten Dilemmas führt die Überzeugung, daß sowohl der konkrete Einzelfall als auch generelle Trends durch strenge Gesetzmäßigkeiten determiniert sind. Aufgabe des Wissenschaftlers m u ß es demnach sein, herauszufinden, welche allgemeinen Gesetze gelten und wie diese durch besondere Bedingungen (bei speziellen G r u p p e n oder Individuen) modifiziert werden können (so daß unter Umständen sogar qualitative Veränderungen auftreten, die bei einer rein phänomenologischen Betrachtung überhaupt nichts mit den sonstigen Gegebenheiten gemeinsam zu haben scheinen). Die Entdeckung einer rein statistischen Regelmäßigkeit ist für einen Forscher dieser Orientierung ein Hinweis auf einen lediglich partiellen Erfolg seiner Bemühungen; ein solches Resultat sagt ihm, daß er noch nicht alle relevanten Einflußgrößen kennt bzw. sie nicht in angemessener Weise berücksichtigt hat. Ein derartiges Ergebnis dient allenfalls der vorläufigen Orientierung und m u ß Anlaß für weitere (besser konzipierte) Experimente sein. Während also der probabilistisch orientierte Wissenschaftler eher als der von (deterministischen) Gesetzmäßigkeiten überzeugte geneigt sein wird, sich mit einem Forschungsresultat, welches nur eine statistische Regelmäßigkeit erkennen läßt, zufriedenzugeben, rechnet der letztere von vorneherein mit einer Serie von Experimenten, um seine Vermutungen hinreichend absichern zu können. Was nun ein (statistisches) Einzelergebnis (eines einzigen Versuchs, anhand einer Stichprobe gewonnen) betrifft, so sind sich Forscher beider Richtungen darin einig, daß es eine Hypothese allenfalls mit einer gewissen «Wahrscheinlichkeit» zu stützen vermag. (Selbst diese Auffassung ist, streng genommen, nicht korrekt, da sich die üblicherweise verwendete Inferenzstatistik nur auf Wahrscheinlichkeiten von Einzelereignissen, unter der Voraussetzung einer statistischen Hypothese bezieht. Eine U m kehrung dieses Schlusses wäre bereits mit der Problematik eines Kalküls der induktiven Wahrscheinlichkeit belastet). Anders als der
106 (begrifflich nicht sehr exakt vorgehende) probabilistisch Orientierte spricht der «Determinist» im allgemeinen aber auch dann noch von einem nur «wahrscheinlichen» Sachverhalt, wenn selbst in einer größeren Stichprobe jeder Einzelfall - ohne eine Ausnahme - eine bestimmte Vermutung zu bestätigen scheint. Anscheinend handelt es sich dabei um zwei verschiedene Wahrscheinlichkeitsbegriffe, von denen der eine zusätzlich zum «statistischen» herangezogen werden kann. Allerdings geschieht dies nur durch Wissenschaftler, die Kausalgesetze voraussetzen und diese entdekken möchten. Für «Statistiker» existiert dieser zweite Wahrscheinlichkeitsbegriff nicht. Da statistische Ansätze gegenwärtig in der psychologischen Methodenlehre dominierend sind, wird es schwer fallen, einen «methodenbewußten» Psychologen davon zu überzeugen, daß ein anderes Verständnis von «Wahrscheinlichkeit» überhaupt legitim ist.
2. Zwei unterschiedliche Forschungstraditionen Während die bisherigen Darlegungen lediglich die bestehende Problematik verdeutlichen sollten, müssen im folgenden - unter Bezugnahme auf relevante Literatur - detailliertere Erläuterungen gegeben werden. Es ist das Verdienst des britischen Philosophen L. JONATHAN COHEN ( 1 9 7 0 , 1 9 7 7 ) , die Bedeutung des zweiten Wahrscheinlichkeitsbegriffes herausgearbeitet und dessen Formalisierung - soweit möglich - vorangetrieben zu haben. An dieser Stelle können nur die wichtigsten und für die psychologische Forschung entscheidenden Gesichtspunkte Erwähnung finden. COHEN unterscheidet zwei historische Strömungen im Hinblick auf die philosophische Behandlung des Begriffes «Wahrscheinlichkeit». Die eine führte zu der geläufigen Darstellung in Form der Wahrscheinlichkeitsrechnung und begründete die moderne Statistik; sie geht auf BERNOULLI, LEIBNIZ und letztlich F E R MAT und PASCAL zurück, weshalb COHEN in diesem Zusammenhang von der «Pascalian probability» spricht. (Wir wollen sie hier abkürzend «P-Wahrscheinlichkeit» nennen.) Dieser Tradition stellt er eine andere gegenüber, die sich
Plaum: «Pascalsche» versus «Baconsche» Wahrscheinlichkeit
über J . S. M I L L und H O O K E bis zu FRANCIS B A CON zurückverfolgen läßt; entsprechend ist bei COHEN von «Baconian probability» die Rede (im folgenden «B-Wahrscheinlichkeit» genannt). Es kann an dieser Stelle nicht diskutiert werden, inwieweit dieser historischen Rückführung Allgemeinverbindlichkeit zukommt; BACON dürfte jedenfalls weitgehend als ein Begründer des empirisch-experimentellen Denkens in den Wissenschaften anerkannt sein (vgl. SACHSSE, 1 9 7 9 ) , wenn ihm auch unterstellt wird, er habe die Bedeutung der Mathematik dabei noch nicht so recht verstanden und seit JUSTUS VON LIEBIGS vernichtender Kritik vielfach wenig Interesse an diesem Denker besteht (siehe VOLHARD, 1 9 0 9 ; U R M S O N , 1 9 6 7 , p. 5 7 59).
Zweifellos spielen die beiden von COHEN herausgearbeiteten Wahrscheinlichkeitsbegriffe nun gerade in der Psychologie eine ganz entscheidende Rolle und es läßt sich zeigen, daß sie mit zwei unterschiedlichen Forschungstraditionen zusammenhängen, die einander bis auf den heutigen Tag teilweise recht unversöhnlich gegenüberstehen. Worin bestehen nun (nach COHEN) die wesentlichsten Unterschiede zwischen P- und BWahrscheinlichkeit? Zunächst einmal wird die letztere auf Kausalgesetze bezogen; sie ist auf «Notwendigkeiten in der Natur» gerichtet, während überall dort, wo keine Informationen zur Kausalität vorliegen, zwangsläufig statistische Regelmäßigkeiten ins Blickfeld rücken (siehe v.a. COHEN, 1 9 7 9 ) . Hier ist der Grund dafür zu sehen, daß man dieselben keineswegs einer fortgeschrittenen Phase des Forschens bzw. Experimentierens zuordnet. Wenn strenge (deterministische) Kausalgesetze postuliert werden, dann müssen diese nicht nur (tendenzmäßig) für ganze Kategorien von Ereignissen bzw. Personen gelten, sondern für jeden relevanten Einzelfall. COHEN stellt seine Überlegungen bemerkenswerterweise am Beispiel des Kriminalfalles dar, bei dem unter ganz konkreten, individuellen Bedingungen über Schuld und Unschuld geurteilt wird, um zu demonstrieren, daß ein Vorgehen unter dem Gesichtspunkt der B-Wahrscheinlichkeit gerade auch in der Einzelfallarbeit angemessen ist. Betrachtet man ein «statistisches» Forschungsergebnis als endgültiges (und publika-
107
Zeitschrift für Sozialpsychologie 1984, 15, 1 0 4 - 1 1 9
tionswürdiges) Ziel, so kann dies legitimerweise nur unter der Annahme geschehen, es seien dabei alle relevanten Fakten berücksichtigt worden. Da dies aber kaum jemals für eine einzige Untersuchung zutreffen dürfte (vgl. H O L Z KAMP, 1 9 8 1 ) , sagt selbst ein Resultat, bei welchem in jedem Einzelfall ein gleichsinniger Befund zu verzeichnen ist, noch nichts Endgültiges über die Bestätigung oder Verwerfung einer Hypothese aus (zum Unterschied zwischen statistischer und wissenschaftlicher Hypothese siehe etwa BOLLES, 1 9 6 2 ; WESTERMANN & H A GER, 1 9 8 2 ) .
So stellt beispielsweise eine Punktwerte-Erhöhung aller untersuchten Probanden nach einem Trainingsprogramm keine Bestätigung der Hypothese dar, daß diese Intervention Leistungssteigerungen bewirkt, wenn der verwendete Test vorwiegend nicht Leistungen, sondern Leistungsmotivation erfaßt. Einer «hundertprozentigen» P-Wahrscheinlichkeit steht in diesem Falle eine äußerst geringe B-Wahrscheinlichkeit gegenüber, die für die genannte Vermutung sprechen würde. (Streng genommen kann man natürlich nur ein hochsignifikantes Ergebnis konstatieren, was mit einer 100%igen Wahrscheinlichkeit nichts zu tun hat, doch entspricht die hier gewählte Ausdrucksweise einem vorwissenschaftlichen Verständnis.) B-Wahrscheinlichkeiten kennzeichnen nämlich die Sicherheit, mit der man annehmen kann, alle relevanten Fakten seien berücksichtigt und setzen nicht bereits voraus, daß Zweifel in dieser Hinsicht völlig ausgeräumt sind. Während also P-Wahrscheinlichkeiten auf einer zusammenfassenden Quantifizierung von Endresultaten einer (einzigen) Untersuchung beruhen, zielt die B-Wahrscheinlichkeit auf den Stellenwert von Befunden innerhalb einer Serie von Experimenten ab, d.h. sie bezieht sich auf den Verifikations- bzw. Falsifikationsprozeß, und zwar unter Berücksichtigung sachimmanenter inhaltlicher Gesichtspunkte. Wahrscheinlichkeitskriterien werden daher nach der von C O H E N SO genannten «Methode der relevanten Variablen» gewonnen, wobei er hierin ein übergeordnetes Prinzip erkennt, welches die bei J. S. M I L L genannten Methoden der «Differenz» und der «Übereinstimmung» einschließt. Es geht darum, die für die Prüfung einer Hypothese relevanten Variablen zu-
nächst einmal zu finden und dann in Experimenten angemessen zu berücksichtigen. Da die relevanten Variablen nicht von vorneherein bekannt sind, kostet es einige Mühe, dieselben aufzufinden, mit ihnen zu arbeiten und je nachdem, wie es gelingt, auf diese Weise erhaltene, klare Ergebnisse schlüssig auf die Wirkung eben dieser Variablen zurückzuführen, kann man sagen, daß eine Hypothese mit mehr oder weniger großer «Wahrscheinlichkeit» bestätigt wird. Anders als bei der P-Wahrscheinlichkeit handelt es sich hierbei um die Sicherheit, mit der aufgrund der bislang durchgeführten Experimente und der dabei berücksichtigten Variablen auf das tatsächliche Zutreffen einer bloßen Vermutung geschlossen werden kann oder nicht. (Es mag an dieser Stelle die Frage auftauchen, ob es nicht besser wäre, dabei einfach nur von «Sicherheit», anstatt von «Wahrscheinlichkeit» zu sprechen, um Begriffsverwirrungen zu vermeiden, doch hat C O H E N nun einmal den Begriff der «Baconian probability» eingeführt, und es entspricht auch dem Alltagsverständnis, in diesem Falle ebenfalls von «wahrscheinlich» zu r e d e n - v g l . SACHSSE, 1979.) Wie man sieht, sind Versuchsreihen, die mit dem Ziel geplant werden, «eigentlich» relevante Variable zu finden (welche eine statistische Betrachtungsweise im günstigsten Falle überflüssig erscheinen lassen) auf B- und nicht PWahrscheinlichkeiten hin orientiert. Dies ist im Hinblick auf die Beurteilung psychologischer Untersuchungen besonders wichtig, da es eine gute Tradition experimentellen Vorgehens in der Psychologie gibt, bei der die Suche nach kausalen (nicht nur statistischen) Zusammenhängen im Vordergrund steht.
3. Weitere Besonderheiten der «B-Wahrscheinlichkeit» Die Frage, wie man experimentelle Unterstützungen für eine kausale Hypothese gewinnen kann, berührt ein zentrales Thema der gegenwärtigen wissenschaftstheoretischen Diskussion. In diesem Zusammenhang ist es nicht möglich, hierauf weiter einzugehen. Einige für die psychologische Forschung und Praxis wichtige Aspekte müssen aber noch erwähnt werden.
108 Zunächst einmal wäre festzuhalten, daß man die Wahrscheinlichkeitsrechnung nicht auf BWahrscheinlichkeiten anwenden kann. Vor allem darf die Wahrscheinlichkeit, mit der eine Alternative A gegeben ist, nicht als komplementär zur Wahrscheinlichkeit gesehen werden, mit welcher non-A (die zweite Alternative) einhergeht. Dies läßt sich recht gut am Beispiel von G r u n d r a t e n (base rates) verdeutlichen: N e h m e n wir an, in einer Rehabilitationseinrichtung für Hirngeschädigte hätten 5% der eingewiesenen Patienten in Wirklichkeit gar keine hirnorganische Beeinträchtigung und es werde n u n einem Psychodiagnostikerdie Aufgabe gestellt, die Hirngesunden herauszufinden. (Diese A n n a h m e entspricht in etwa den Gegebenheiten einer dem Verfasser bekannten Klinik.) W ü r d e man sich ausschließlich an P-Wahrscheinlichkeiten orientieren, so wäre von vorneherein klar, d a ß jeder beliebig herausgegriffene «Patient» mit sehr hoher Wahrscheinlichkeit (95 : 5, aufgrund der base rate) ein Hirnorganiker ist. Wenn es keinen Hirnorganikertest gibt, der besser als die G r u n d r a t e zwischen Geschädigten und Gesunden zu differenzieren vermag, d a n n könnte m a n meinen, jede Psychodiagnostik sei hier sinnlos. Eben diese Auffassung wird in gängigen Diagnostiklehrbüchern tatsächlich vertreten (siehe etwa DRENTH, 1969; WIGGINS, 1973). Dessen ungeachtet m a c h e n sich Psychologen in der Praxis die M ü h e , auch in solchen Fällen zu diagnostizieren. Tun sie dies, weil sie zu wenig von ihrem Fach verstehen, sind sie zu d u m m , u m einfache Wahrscheinlichkeitsüberlegungen nachvollziehen zu können, brauchen sie Nachhilfeunterricht in elementarer Mat h e m a t i k - zeigt sich hier, kurz gesagt, eine bestürzende «psychologische U n v e r n u n f t » ? Diese Diagnostiker sind sehr wohl in der Lage, Wahrscheinlichkeiten in ihre Überlegungen einzubeziehen, allerdings handelt es sich dabei nicht u m P-, sondern u m B-Wahrscheinlichkeiten. Da die letzteren mit kausal relevanten Variablen in Verbindung gebracht werden, ist die G r u n d r a t e (P-Wahrscheinlichkeit) in diesem Z u s a m m e n hang völlig bedeutungslos. Kausal bedeutsam im Hinblick auf Hirnschädigungen sind hingegen die verschiedenartigen Funktionsschwächen, die man unter der Bezeichnung «hirnorganisches Psychosyndrom» zusammengefaßt hat. Natürlich weiß der praktizierende Diagnostiker sehr genau, d a ß ein einzelner Hirnorganikertest keine absolut sicheren Schlußfolgerungen erlaubt - schon allein deshalb nicht, weil das «hirnorganische Psychosyndrom» k a u m jemals vollständig ausgeprägt v o r k o m m t (manche Funktionsschwächen fehlen oft völlig, einige sind stärker akzentuiert als andere, was beispielsweise mit der unterschiedlichen Lokalisation der Schädigungen z u s a m m e n h ä n g e n kann). Der Praktiker wird daher versuchen, alle möglichen Aspekte des Psychosyndroms systematisch abzutasten, wie es etwa d e m Vorgehen LURIAS entspricht (HAMSTER, LANGNER & MAYER, 1980). Auf diese Weise hofft er, Befunde zu gewinnen, die in kausaler Beziehung zu Hirnschädigungen stehen; für eine solche Fragestellung ist die G r u n d r a t e irrelevant. W ä h r e n d also aufgrund derselben die P-Wahrscheinlichkeit, d a ß ein beliebig ausgewählter Proband hirnorganische Beeinträchtigungen aufweist, als sehr hoch an-
Plaum: «Pascalsche» versus «Baconsche» Wahrscheinlichkeit gesehen werden m u ß (und die k o m p l e m e n t ä r e Wahrscheinlichkeit, einen Hirngesunden herausgegriffen zu haben, als entsprechend niedrig) liegt die B-Wahrscheinlichkeit, einen Hirnorganiker vor sich zu haben, bei Null (wobei es nicht unbedingt sinnvoll erscheinen mag, einen solchen exakten Wert ü b e r h a u p t zu nennen) - soweit keinerlei Informationen (etwa Leistungstestergebnisse) vorliegen, die (im G e gensatz zur base rate) in eine kausale Beziehung zur Hirnschädigung zu bringen sind. Es ist unmittelbar einsichtig, daßdie(B-)Wahrscheinlichkeit, keinen Hirnorganiker ausgewählt zu haben, n u n nicht etwa d e m k o m p l e m e n t ä r e n Wert 1 zustrebt, entsprechend der bekannten Formel p [ B / A ] = 1 — p[B/A] (vgl. N A G E L , 1939; C O H E N , 1979), sondern ebenfalls bei Null liegt, da auch zur Frage einer fehlenden Hirnschädigung (kausal) relevante Informationen erst noch zu gewinnen wären.
Die Besonderheiten der B-Wahrscheinlichkeiten lassen sich auch anhand von Forschungsstrategien darstellen, da sie ja die «Logik des Experimentierens» beschreiben sollen. C O H E N ( 1 9 7 7 ) führt als Beispiel die Versuche an, welche V O N F R I S C H mit Bienen durchgeführt hat und die auch unter Psychologen als vorbildlich gelten (siehe z. B. S M I T H , 1 9 6 0 ) . Aus Gründen der Übersichtlichkeit für unsere Zwecke etwas aufbereitet, kann das Vorgehen dabei wie folgt dargestellt werden: Hypothese, die zur Ü b e r p r ü f u n g ansteht: Die Ursache für die R ü c k k e h r von Bienen zu einer Nahrungsquelle ist darin zu sehen, d a ß die Tiere Farben erkennen können (bzw. nicht «farbblind» sind). Die Serie d u r c h z u f ü h r e n d e r Experimente kann sich n u n an d e m in Abb. 1 dargestellten « F l u ß d i a g r a m m » orientieren. Dieses Schema spiegelt n u r die tatsächlich von VON FRISCH d u r c h g e f ü h r t e n Experimente und deren Resultate wider; keiner der Versuche sprach für das Vorliegen von Farbenblindheit bei Bienen.
Im Vergleich zu den üblichen statistisch auszuwertenden Untersuchungen in der Psychologie sind nun folgende Punkte wichtig: Zunächst wird davon ausgegangen, daß sämtliche am Versuch beteiligten Bienen das gleiche Verhalten zeigen (eine statistische Behandlung der Resultate erübrigt sich somit). Sollte dies nicht der Fall sein, so muß man mit dem Einfluß irrelevanter Variablen rechnen; es könnte z.B. ein Teil der Tiere sein «Arbeitspensum» bereits erledigt haben und ein weiteres Ausfliegen zu einer Nahrungsquelle wäre daher nicht mehr notwendig. Diese Tatsache hätte aber keinerlei Relevanz im Hinblick auf die Frage nach der Farbentüchtigkeit. Die irrelevante Variable «Erledigung des Arbeitspensums» ließe sich auf triviale Weise aus-
109
Zeitschrift für Sozialpsychologie 1984, 15, 1 0 4 - 1 1 9 Experiment 1 spricht für Farbentüchtigkeit
ja
Rückkehr zu einer blauen Nahrungsquelle?
j
nein
spricht für Farbenblindheit
\ J
ia
spricht für Farbenblindheit
)J
^
spricht für Farbenblindheit
\J
^
spricht für Farbenblindheit
J
Experiment 2 spricht für Farbentüchtigkeit
Nur Helligkeitsunterschiede erkannt?
Experiment 3 spricht für Farbentüchtigkeit
Räumliche Lage entscheidend?
Experiment 4 spricht für Farbentüchtigkeit
Verschiedene Reaktionen bei unterschiedlichen Düften?
I I I Abb. I: Schematische Darstellung der Experimente VON FRISCHS.
schalten, indem nur Bienen berücksichtigt werden, die ausfliegen. Es hängt vom Können des Experimentators ab, die relevanten Gegebenheiten aufzufinden und von den übrigen zu unterscheiden; mit Statistik hat dies nicht sehr viel zu tun. Vielmehr scheint es - da die «Logik des Experimentierens» zur Diskussion steht - als ob ein System logisch notwendiger Theoreme, wie es SMEDSL U N D (1979) fordert, hier von Nutzen sein könnte. Während der Vorschlag des soeben genannten Autors mit der von L . J. C O H E N vertretenen Richtung die Skepsis gegenüber P-Wahrscheinlichkeiten gemeinsam hat, stimmt die BACONsche Tradition mit der statistisch orientierten Experimentalpsychologie wiederum bezüglich der Hochschätzung der Empirie überein. Die Betonung von B-Wahrscheinlichkeiten hat also Gemeinsamkeiten mit den bei-
den anderen Ansätzen und stellt einen dritten Weg dar, um eine Lösung des eingangs charakterisierten Dilemmas zu finden. Ein zweiter, entscheidender Punkt ist ebenfalls offensichtlich: Obwohl vorausgesetzt wird, daß 100% aller Bienen gleiches Verhalten an den Tag legen (wie groß auch immer die Stichprobe sein mag), bedeutet dies selbstverständlich keine «100%ige» Bestätigung der Hypothese (eine solche Interpretation wäre streng genommen nicht einmal bei der Anwendung eines inferenzstatistischen Tests möglich), denn es kommen - nach dem ersten Experiment - noch immer Helligkeit, räumliche Lage oder Duft der Nahrungsquelle als Ursachen für die Rückkehr der Bienen in Frage (vgl. hierzu das «Repräsentanz»-Problem bei H O L Z K A M P , 1981). Dennoch läßt das Resultat des ersten Versuchs bereits die Farbentüchtigkeit der Tie-
110
Plaum: «Pascalsche» versus «Baconsche» Wahrscheinlichkeit
re ein wenig «wahrscheinlich» werden. (Man könnte vielleicht sagen, die «Wahrscheinlichkeit» für diese Erklärungsmöglichkeit ist etwas «größer als Null».) Für Farbenblindheit (d.h. die andere Alternative) spricht dagegen überhaupt nichts (Wahrscheinlichkeit «Null»). Obgleich also die Wahrscheinlichkeit der einen Alternative nur geringfügig von «Null» abweicht, verhält sich die der anderen nicht etwa komplementär (so als würde die Addition beider den Wert «Eins» ergeben); die letztere bleibt bei «Null» und wird nicht etwa umso größer, je geringer die andere hiervon abweicht. Es können also nicht nur zwei einander ausschließende Alternativen gleichzeitig die BWahrscheinlichkeit «Null» haben, sondern es kann auch bezüglich der einen dabei bleiben, während sich die andere von diesem Wert zunehmend entfernt. Denkt man an zwei methodisch gleich gute Untersuchungen zur gleichen Hypothese mit widersprüchlichen Ergebnissen - ein in der psychologischen Forschung durchaus geläufiger Sachverhalt - so ließe sich sogar eine gleich hohe Wahrscheinlichkeit «größer Null» sowohl für A als auch non-A annehmen! (vgl. zu dieser Problematik T R O U T M A N & SHANTEAU, 1 9 7 7 ; COHEN, 1980).
Ein drittes Prinzip betrifft die Verknüpfung verschiedener experimenteller Befunde, die in die gleiche Richtung weisen. Geht man einmal
bei dem Beispiel VON F R I S C H S mit den Bienen von einer Vierfarbentheorie aus (da es sich in diesem Fall nur um ein didaktisch relevantes «Gedankenexperiment» handelt, ist dies ohne weiteres möglich), so wäre die für Farbentüchtigkeit sprechende B-Wahrscheinlichkeit bei einer blauen Nahrungsquelle ebenso groß, wie wenn eine grüne Verwendung gefunden hätte, und die Wahrscheinlichkeit für (völlige) Farbentüchtigkeit (sowohl das Gelb-Blau-System als auch das Rot-Grün-System betreffend) beim Vorliegen dieser beiden Befunde würde dann sicherlich höher anzusetzen sein als jede dieser Einzelwahrscheinlichkeiten (für sich genommen). - Anders im Falle der P-Wahrscheinlichkeiten: Ließe sich jeweils in 20% der Fälle Rot-Grün- und Blau-Gelb-Farbentüchtigkeit feststellen, so erhielte man nach dem Multiplikationssatz für unabhängige Ereignisse (d. h. unter der Voraussetzung, daß der Anteil rot-grün-farbenblinder Tiere bei den gelbblau-farbenblinden ebenso hoch wie bei den Bienen insgesamt ist - siehe N A G E L , 1 9 3 9 ) , eine (kombinierte) Wahrscheinlichkeit für völlige Farbentüchtigkeit (in beiden Farbsystemen) von 0,04 - also wesentlich niedriger als jede Einzel Wahrscheinlichkeit! Diese multiplikative Verknüpfung gilt also für B-Wahrscheinlichkeiten nicht, ja es läßt sich sogar sagen, daß jede exakte Quantifizierung überhaupt unmög-
P-Wahrscheinlichkeiten 1 nn
A
B-Wahrscheinlichkeiten Non-A
nn
.90
10
80
?n
70
sn
Rf)
40
.50
Rn ^
40
RO
Maximale Unsicherheit
7n ?n
an
10
.90
OD
1
m
Abb. 2: Unterschiede zwischen P- und B-Wahrscheinlichkeiten.
A
Non-A
t I I I I
t I
V
V
IV
IV
III
III
II
II
I I
I 0
I Maximale Unsicherheit
0
111
Zeitschrift für Sozialpsychologie 1984, 15, 1 0 4 - 1 1 9
lieh ist. P- und B-Wahrscheinlichkeiten sind nicht kompatibel, weil die ersteren Anteile einer Gesamtgruppe von Ereignissen (bzw. Personen) kennzeichnen, die letzteren aber auf die Sicherheit eines induktiven Schlusses, bei nicht vorauszusetzender Variabilität der Ereignisse (bzw. Personen) abzielen! Die wesentlichen Unterschiede dieser beiden Wahrscheinlichkeitsbegriffe können (in Anlehnung an COHEN, 1979) mit Hilfe unterschiedlicher Skalen anschaulich dargestellt werden (Abb. 2). Während die Skala der P-Wahrscheinlichkeiten von 0 bis 1 (bzw. 100, maximal hohe Wahrscheinlichkeit) reicht, läßt sich die BWahrscheinlichkeit allenfalls als Rangskala darstellen (schon allein aus diesem Grund kann die Wahrscheinlichkeitsrechnung hierauf nicht angewandt werden). Jeder P-Wahrscheinlichkeit für A entspricht ein bestimmter Komplementärwert für non-A, dagegen sind die Skalen für A und non-A bei den B-Wahrscheinlichkeiten im Prinzip unabhängig voneinander zu konzipieren. Hieraus folgt, daß einer maximalen Unsicherheit im Hinblick auf P-Wahrscheinlichkeiten der Wert 0,50 (bzw. 50) entspricht; völlige Unklarheit bezüglich der BWahrscheinlichkeit findet man hingegen beim Wert «Null». (Die Inkompatibität der jeweiligen Zahlenangaben wird durch die Verwendung römischer Ziffern im Falle der B-Wahrscheinlichkeiten angedeutet.) Außerdem reicht die P-Skala bis zum Maximalwert 1, die B-Skala ist hingegen grundsätzlich nach oben hin offen. (Der Maximalwert hängt von den bei einer konkreten Fragestellung notwendigen experimentellen Schritten ab.)
4. Bedeutung für die psychologische Forschung und Praxis P-Wahrscheinlichkeiten bestimmen probabilistische Denkmodelle und Signifikanzbestimmungen in der psychologischen Forschung. Obgleich seit dem Zweiten Weltkrieg auch in Mitteleuropa eine fast ausschließlich auf solchen Voraussetzungen beruhende Psychologie die Oberhand gewonnen hat, setzen dennoch immer wieder einzelne Autoren ihren guten Ruf als «Wissenschaftler» aufs Spiel, indem sie
gegen diese Richtung argumentieren (siehe z. B. BRANDT,
1976;
HARNATT,
1979;
ARGYRIS,
1980; auch HOLZKAMP, 1981; dagegen etwa KRAUSE & METZLER, 1978); d e r K o n f l i k t z w i -
schen «Probabilisten» und «Deterministen» schwelt untergründig weiter. Er ist nicht ganz ohne ideologischen Zündstoff (vgl. auch SACHSSE, 1979): CAPLAN (1979) hat darauf hingewiesen, daß das Auszählen und die Feststellung relativer Häufigkeiten typisch für die amerikanische Demokratie sei, und bei der Auseinandersetzung um den Stellenwert quantitativer Methoden in der Psychologie, wie sie nach dem Krieg in Deutschland geführt wurde, schwang denn gelegentlich auch der Vorwurf des «Faschismus» im Hinblick auf Vertreter anderer Vorgehensweisen mit (siehe z.B. MERZ, 1960; ADLER & ROSEMEIER, 1970). W a s diese A n -
schuldigung betrifft, so dürfte das Verlassen auf B- statt auf P-Wahrscheinlichkeiten - und eine damit einhergehende deterministische Wissenschaftsauffassung, die insbesondere an der Aufklärung der nicht dem Gruppentrend folgenden Abweichungen einzelner Fälle interessiert ist - jedoch völlig unverdächtig sein (hierzu auch HOLZKAMP, 1981). EYSENCK (1964) hat beispielsweise darauf hingewiesen, daß eine derartige Einstellung der Tradition sowjetischer Forscher entspricht; PAWLOWS Experimente sind ein gutes Beispiel dafür. Die Unterschiede zwischen einer an B-Wahrscheinlichkeiten orientierten psychologischen Forschung und der angloamerikanischen Tradition werden sehr schön am Beispiel einer Arbeit von ASNIN (1980/1981) deutlich. Obwohl dieser Artikel bereits 1941 erstmals publiziert wurde, hat man es für sinnvoll erachtet, ihn zu Beginn der Achtzigerjahre in englischer Übersetzung erneut der Öffentlichkeit zu präsentieren. Der wesentliche Gehalt dieser Abhandlung ist heute kaum weniger aktuell als damals, zumal immer wieder die geringe Effektivität der üblichen Forschungsaktivitäten in der Psychologie beklagt wird (siehe z.B. MEEHL, 1978; F I N K E L M AN, 1 9 7 8 ; EPSTEIN, 1 9 8 0 ; WACHTEL,
1980). ASNIN (1980/1981) geht davon aus, daß statistische Kriterien allenfalls zu Beginn des Datensammelns im Zusammenhang mit einer bestimmten Fragestellung sinnvoll erscheinen, solange die Betonung der Häufigkeit des Auf-
112 tretens eines Phänomens bzw. dessen Wiederholbarkeit als bedeutsam erachtet werden. Dadurch erhalte die Psychologie zwar einen wissenschaftlichen Anstrich, bleibe aber bei externen Faktoren und oberflächlichen Techniken stehen und führe kaum zu einem tieferen Verständnis psychischer Prozesse. Der genannte Autor beruft sich auf L E W I N , der die Ansicht vertreten hatte, strenge Gesetzmäßigkeiten müßten sich in jedem Einzelfall zeigen; ein vom Gruppentrend abweichender Fall könne eine wesentlichere Gesetzmäßigkeit zu erkennen geben als ein wiederholbares Phänomen. Ziel einer experimentellen Psychologie müßten daher individuelle empirische Untersuchungen unter Beachtung relevanter Variablen sein; dabei gehe es nicht nur darum, äußere Reliabilitätsgesichtspunkte zu bedenken (selbst das im allgemeinen so wenig berücksichtigte Kriterium der Lebensnähe sei noch als externer Aspekt anzusehen), sondern vor allem die inneren Bedingungen (etwa der Inhalt einer Aufgabe und deren Bedeutung für die Versuchsperson - vgl. hierzu wiederum die Abhandlung von HOLZKAMP, 1 9 8 1 , zum Repräsentanz-Problem). A S N I N (1980/1981) berichtet über Experimente zum intelligenten Verhalten, die auf W. KÖHLER zurückgehen (ein begehrter Gegenstand sollte herangeholt werden, dies gelang aber nur unter Zuhilfenahme eines Stockes); sie eignen sich aufgrund ihrer Einfachheit und Übersichtlichkeit gut, um die wesentlichen Überlegungen darzustellen, welche dann auch für komplexere Verhältnisse Geltung haben. Im Gegensatz zu jüngeren Kindern schienen ältere (zwischen 7 und 12 Jahren) meist nicht imstande zu sein, die gestellte Aufgabe zu lösen. Natürlich wäre es unsinnig, sich nur an diesem Endresultat orientieren zu wollen (obgleich ein derartiges Vorgehen in der Psychologie vielfach praktiziert wird) und hieraus etwa zu schließen, älteren Kindern sei eine in jüngerem Alter zur Verfugung stehende «Fähigkeit» wieder abhandengekommen.
Eine zweite Versuchsreihe zeigte, daß die Anwesenheit des Untersuchers offenbar von Bedeutung war; verließ dieser den Raum, dann kamen auch die meisten (nicht alle) älteren Kinder an das begehrte Objekt heran. Würde man nun - wie üblich - nur das Endergebnis
Plaum: «Pascalsche» versus «Baconsche» Wahrscheinlichkeit
betrachten, so ließe sich vielleicht ein «signifikanter» Versuchsleitereinfluß feststellen und es könnte der Gedanke aufkommen, einen Versuchsplan aufzustellen, der diese Bedingung und das Alter als unabhängige Variable zu betrachten erlaubt, um die «Interaktion» zwischen diesen beiden Merkmalen statistisch absichern zu wollen. (Eine solche Art des Hypothesentestens ist in der Psychologie recht geläufig.) Aber für A S N I N sind weder «signifikante» Einflüsse des Alters noch der Versuchsleitereffekt sonderlich interessant; da keineswegs bei allen älteren Kindern die Abwesenheit des Untersuchers zu einer Aufgabenlösung führte, kann es sich dabei nicht um die eigentlich relevanten Variablen (im Sinne L. J. COHENS) handeln. Bei einer dritten Versuchsreihe wurden Probanden, die unter den vorhergehenden Bedingungen keine Lösungen zustandebrachten, allein im Raum gelassen und durch eine einseitig durchlässige Scheibe beobachtet: Es stellte sich heraus, daß diese Kinder schließlich den Gegenstand mit dem Werkzeug nur ein klein wenig heranholten, ihn dann aber unter Aufbietung aller Kräfte mit den Händen zu erreichen versuchten. Offenbar sahen die Versuchspersonen den Sinn dieser Aufgabe im Einsatz eigener (körperlicher) Anstrengungen; da diese übergeordnete Zielvorstellung auch dann noch (partiell) erreicht war, wenn man sich größte Mühe gab, konnte die Aufgabe letztlich doch gelöst werden. (Der Einsatz des Werkzeugs läßt diesen Lösungsweg in der Terminologie der LEwiN-Schule - von den Probanden her gesehen somit als «Ersatzhandlung» erscheinen.) Daß die «Einstellung zur Aufgabe» - genauer: die erlebte Schwierigkeit derselben entscheidend war, hatte schon die zweite Versuchsreihe vermuten lassen: Bereits hier wurden die Probanden durch die einseitig durchlässige Scheibe beobachtet, und die Experimente fanden außerdem in Gegenwart eines (jüngeren) Kindes statt, welches die Aufgabe bereits gut bewältigt hatte. Wenn dieses nun (entgegen der Instruktion) auf die Verwendung des Stockes hinwies, reagierte die eigentliche Versuchsperson verächtlich-abweisend, indem sie etwa sagte: «Laß das doch, so kann das ja jedes Baby.» (In den meisten Fällen ließ sie sich dann aber doch bewegen - das jüngere Kind als
Zeitschrift für Sozialpsychologie 1984, 15, 1 0 4 - 1 1 9
eingeweihten « K o m p l i z e n » betrachtend - den Gegenstand auf diese scheinbar illegitime Weise heranzuholen.) Offensichtlich waren also weder Alter noch Versuchsleitereinfluß «relevante Variable» - trotz ihrer bedeutsamen Beziehungen zu den Ergebnissen der Experimente; sie sind bestenfalls von sekundärem Interesse und erhellen das zugrundeliegende psychische Geschehen kaum. Ähnliche Probleme entstehen in der Praxis, etwa bei der Suche nach relevanten diagnostischen Befunden. Versuchsanordnungen, wie die von A S N I N verwendete, haben auch Bedeutung für eine Einzelfalldiagnostik innerhalb des «experimentellen Modells» (siehe PLAUM, 1981a). Dabei geht es ebenfalls u m die Suche nach «relevanten Variablen», welche das Zustandekommen von Untersuchungs- (bzw. Test-)Ergebnissen erklären können, wobei aufgrund einer deterministischen Konzeption eine statistische (probabilistische) Testtheorie irrelevant wird (PLAUM, 1983). - Auf die Kontroverse «statistische versus klinische Vorhersage» wurde bereits hingewiesen (vgl. auch PLAUM, 1982). Im Gegensatz zu einer gruppenorientierten Eignungsdiagnostik genügen dem verantwortungsbewußten klinischen Einzelfalldiagnostiker bloße P-Wahrscheinlichkeiten (mit entsprechenden Irrtumsmöglichkeiten, da die eigentlich entscheidenden Variablen unentdeckt bleiben würden) nicht (PLAUM, 1979, 1981a). Er wird vielmehr b e m ü h t sein, kausal relevante Informationen zu sammeln und versuchen, festzustellen, inwieweit die verschiedenen Befunde, insgesamt betrachtet, bestimmte Schlußfolgerungen mit hinreichender Sicherheit nahelegen (COHEN, 1977; DURCHHOLZ, 1981). Auf jeden Fall m u ß die Entscheidung eines klinischen Psychologen im Einzelfall aufgrund von B-Wahrscheinlichkeiten erfolgen, wobei P-Wahrscheinlichkeiten allenfalls von untergeordneter Bedeutung sein können. Es wäre keineswegs n u r Utopie, die letzteren auf ein konkretes Individuum in seiner jeweils spezifischen Problemlage beziehen zu wollen (GOLDMAN, 1961), sondern nicht einmal wünschenswert, weil die relevanten Variablen ohnedies erst in der Auseinandersetzung mit dem jeweiligen Einzelfall e r k e n n b a r werden (siehe PLAUM, 1983). U n t e r solchen Bedingungen
113 wird nicht die Wettervorhersage z u m Paradigm a des Diagnostikers, sondern die Arbeit eines Detektivs (vgl. SCHUM, D U CHARME & D E PITTS, 1973; PHELPS & SHANTEAU, 1978).
5. Einwände gegen die Berücksichtigung von B-Wahrscheinlichkeiten Die Überzeugung von der Realitätsferne deterministischer Konzeptionen d ü r f t e wohl a m ehesten einer psychologischen Forschung und Praxis im Wege stehen, die hauptsächlich BWahrscheinlichkeiten berücksichtigt. Es handelt sich hier u m ein fundamentales philosophisches Problem, welches an dieser Stelle nicht im entferntesten hinreichend diskutiert werden kann. Zweifellos haben aber u n a b h ä n gig von dieser G r u n d f r a g e nach letzten Ursachen und Gesetzlichkeiten im U n i v e r s u m deterministische Modelle in den Wissenschaften zu erheblichen Fortschritten geführt und es ist sicher, d a ß sie in bestimmten Bereichen praktisch b r a u c h b a r sind; z u d e m findet m a n auch bezüglich der (auf naturwissenschaftlichen Erkenntnissen beruhenden) A n n a h m e einer Notwendigkeit des Indeterminismus verschiedene Ansichten (siehe etwa KÖHLER, 1968; BECKERMANN, 1977; SACHSSE, 1979; N O R D I N , 1982). Somit besteht für die Psychologie keine Veranlassung, von vorneherein davon auszugehen, es seien auf ihrem Gebiet n u r probabilistische Konzeptionen und «statistische Gesetzmäßigkeiten» möglich; derartigen persönlichen Auffassungen einzelner Forscher im Hinblick auf die Beschaffenheit der Welt k o m m t keine Allgemeinverbindlichkeit zu. Im Z u s a m m e n h a n g mit der Überzeugung von der Realitätsferne deterministischer Gesetz e s a n n a h m e n steht die Behauptung von der praktisch nicht feststellbaren Einheitlichkeit psychologischer Befunde; Variabilität der Resultate sei tatsächlich i m m e r zu beobachten. Zweifellos unterscheiden sich verschiedene Individuen unter irgendwelchen Aspekten voneinander. Weder VON FRISCHS Bienen noch AsNINS Kinder werden exakt das gleiche Verhalten gezeigt haben. Aber im Hinblick auf die relevanten Variablen und unter den jeweils gegebenen experimentellen Bedingungen haben sie so reagiert, d a ß ein einheitliches (nicht nur
114
statistisch bedeutsames) Ergebnis vorlag. (Die Bienen kamen alle - wenn auch auf unterschiedliche Weise - zur Nahrungsquelle zurück und die Kinder ließen alle die Bedeutung der erlebten Schwierigkeit der Aufgabe als relevante Variable erkennen.) Gleichsinnige Resultate bei sämtlichen Versuchspersonen kommen durchaus vor und zwar nicht nur im Bereich elementarer Wahrnehmungen, psychophysiologischer Reaktionen oder klar voneinander abgrenzbarer Entwicklungsphasen (vgl. etwa RICHTER, 1957; TRAXEL, 1962). Über derartige Befunde wird interessanterweise vor allem aus Forscherkreisen - wie etwa der LEWIN-Schule berichtet, denen B-Wahrscheinlichkeiten wichtiger sind als P-Wahrscheinlichkeiten (sieh e z . B . FREUND, 1 9 3 0 ; BROWN, 1 9 3 3 ; D U N K KER, 1 9 3 5 ; VIER, 1 9 5 6 ) .
Allerdings - und dies ist ein sehr entscheidender Gesichtspunkt - gilt es, nicht nur in Einzelfällen, sondern bereits bei der Untersuchung bestimmter Gruppen, die jeweils relevanten Variablen immer wieder neu zu bestimmen. Für die von ASNIN untersuchten jüngeren Kinder war eine bestimmte Einstellung zur Aufgabe irrelevant; dennoch ließ sich eine Gesetzmäßigkeit finden, die vielleicht wie folgt zu formulieren wäre: Eine sehr geringe subjektive Aufgabenschwierigkeit beeinträchtigt die Bewältigung der gestellten Anforderungen. Die «Einstellung zur Aufgabe» - von A S N I N als relevant erachtet - betrifft nur die älteren Probanden. Man kann hier durchaus eine deterministische Variante des Moderatoreffektes erkennen; die Behauptung, daß generelle Aussagen in der Psychologie eine Fiktion seien und man feststellen müsse, unter welchen Bedingungen bzw. für welche Subgruppen von Individuen bestimmte Gesetzmäßigkeiten gelten, ist keineswegs neu (vgl. z.B. WOTTAWA, 1981). Auch die Bedeutung der Einzelfallforschung wird prinzipiell anerkannt (siehe etwa BREDENKAMP, 1 9 7 2 ; PETERMANN & HEHL, 1 9 7 9 ) .
Die ausdrückliche Berufung auf B-Wahrscheinlichkeiten bringt aber, im Gegensatz zur üblichen Forschungspraxis, eine sehr gründliche Suche nach relevanten Variablen mit sich. A S N I N hätte die Leistungsresultate beispielsweise in Beziehung setzen können zu Alter, Versuchsleitereinfluß und vielleicht noch einem Rigiditätsmaß - um es dabei zu belassen.
Plaum: «Pascalsche» versus «Baconsche» Wahrscheinlichkeit
Dies wäre durchaus plausibel gewesen und man würde auf diese Weise möglicherweise zu signifikanten Ergebnissen kommen. Trotz ihrer Bedeutsamkeit für das Zustandekommen der Resultate waren diese Variablen dennoch keineswegs die entscheidenden. Man sieht an diesem Beispiel deutlich, was das Auffinden eines relevanten Aspektes bewirken kann: Nicht nur alle Abweichungen vom Gruppentrend werden erklärbar, sondern es reduziert sich auch die Anzahl der für diese Erklärung heranzuziehenden Variablen; ohne diese wesentliche Erkenntnis wären mindestens Alter und Versuchsleitereinfluß, eventuell noch die «Rigidität» bei weiteren Untersuchungen, zu berücksichtigen gewesen - all diese Merkmale entfallen im weiteren Verlauf der empirischen Abklärung der vermuteten Gesetzmäßigkeit! Dieser Gesichtspunkt ist besonders wichtig im Zusammenhang mit der Feststellung, man könne unmöglich die vielen bedeutsamen Variablen mit ihren Interaktionen überblicken (siehe etwa CRONBACH, 1975; FLAMMER, 1978): Es wäre nunmehr zu fragen, inwieweit sich ein derartiger Eindruck nur deshalb aufdrängt, weil die wenigen im Sinne COHENS tatsächlich relevanten Gesichtspunkte bislang nur nicht entdeckt worden sind, so daß dann eben alle möglichen Variablen, die mit einem bestimmten Befund «irgendwie» (vielleicht auf recht periphere Weise) in Beziehung stehen, gleichzeitig betrachtet werden müssen. Zum Beispiel lassen sich sicher Aussagen zur P-Wahrscheinlichkeit gewinnen, mit der ein Arbeiter für Fließbandarbeit geeignet ist (wobei ein Eignungskriterium etwa von Arbeitsausfallen her zu fassen wäre), indem man Alter und Geschlecht sowie zahlreiche Fragebogen- und Intelligenztestresultate als Prädiktoren heranzieht. Vielleicht kommt aber ein Psychologe auf den Gedanken, die Sättigungsgeschwindigkeit (im Sinne von KARSTEN, 1928) sei ein wesentlich relevanteres Maß, und führt, um zu einer Prognose zu kommen, einfach nur Sättigungsexperimente durch, weil diese in ihrer Handlungsstruktur der Tätigkeit am Fließband recht gut entsprechen. Es könnte sich dabei herausstellen, daß nur dieser eine Meßwert genügt und alle anderen Variablen - da nicht eigentlich relevant - unwichtig erscheinen.
Wie das letzte Beispiel zeigt, sind vielleicht die komplexeren und unter lebensnäheren Bedingungen gewonnenen Variablen die relevanteren, wenn Aussagen zum Verhalten gefordert werden. Ob man damit jedoch alle wichtigen
Zeitschrift für Sozialpsychologie 1984, 15, 1 0 4 - 1 1 9
kausalen Verknüpfungen erfassen kann, ist allerdings sehr fraglich. Zumindest unter pragmatischen Gesichtspunkten darf man hierin dennoch einen Gewinn sehen: Das Resultat lebensnahen Denkhandelns, wie es von Aufgaben gefordert wird, die A S N I N verwendet hat, dürfte relevanter sein für die Lebensbewältigung als die Ergebnisse von Papier-Bleistift-Intelligenztests (hierzu L I P M A N & B O G E N , 1923; P L A U M , 1981). Unabhängig von der Kausalitätsfrage sind so bessere «Prognosen» im Einzelfall möglich. Die erwähnten Beispiele lassen erkennen, daß B-Wahrscheinlichkeiten auch in der Sozialpsychologie - einer Teildisziplin, bei der das Individuum in den Hintergrund zu treten scheint - von erheblicher Bedeutung sein können. A S N I N S Versuche wiesen auf die soziale Bedeutung der Aufgabenschwierigkeit hin; die psychische Sättigung ist bekanntlich ein sehr entscheidender Faktor im Hinblick auf die Zufriedenheit mit der eigenen Arbeit. Vor allem bei den vielverwendeten Fragebogenmethoden taucht das Problem auf, inwieweit hier tatsächlich relevante Variable erfaßt werden ( P L A U M , 1981b). So konnte z.B. der Verfasser, gemeinsam mit S P E I G H T (1983), nachweisen, daß Attributionen von Erfolgen und Mißerfolgen in lebensnahen Situationen keineswegs mit den Ergebnissen eines entsprechenden Attributionsfragebogens zusammenhängen. Auf solche Art erfragte «Attributionstendenzen» sind offenbar keine relevanten Variablen, wenn das Verhalten im Alltag zur Diskussion steht. Dieser Befund stimmt mit den Resultaten von E L I G & FRIEZE (1979) überein; KELLY & M I C H E L A (1980, p. 490) sprechen in diesem Zusammenhang von der «zentralen Ironie der Attributionsforschung», rückführbar auf unbefriedigende Untersuchungsverfahren. Es ist bezeichnend für die methodische Einseitigkeit in einem der zur Zeit wichtigsten Forschungsbereiche der Sozialpsychologie, wenn E L I G & FRIEZE (1979) - trotz ihrer wenig ermutigenden Ergebnisse - weiterhin die Verwendung von Attributionsfragebögen empfehlen, weil diese formalen psychometrischen Kriterien besser entsprechen! Nun hängt es sicher vom empirischen Forschungskontext ab, ob eine Reduzierung auf wenige, leicht zu überblickende Aspekte unter
115 praktischen Gesichtspunkten gelingt, indem relevante Variable gefunden und relativ periphere vernachlässigt werden können. Umso mehr m u ß die Frage offen bleiben, inwieweit kausale Gesetzmäßigkeiten nicht-statistischer Art überhaupt auf diese Weise zu entdecken sind. Daß dies wenigstens bis zu einem gewissen Grad möglich ist, dürfte aber nach den bisherigen Ausfuhrungen klar sein. - Das Elend der gegenwärtigen psychologischen Forschung hat seinen Grund wohl nicht primär in der komplexen Vernetzung ungezählter Variablen mit unübersehbar vielen Interaktionen x-ter Ordnung, sondern ist auf das voreilige Stehenbleiben bei diesem Sachverhalt, und infolgedessen probabilistischen Modellen, nur statistischen Gesetzmäßigkeiten, bzw. dem Zufriedensein mit Signifikanzbestimmungen, zurückzuführen. Es wird nicht nachgeprüft, wie weit die Annahme kausaler (nichtstatistischer) Zusammenhänge tatsächlich trägt und ob sich eine geduldige Suche nach wenigen relevanteren Variablen nicht eventuell doch auszahlen könnte, sondern man gibt sich mit dürftigeren Resultaten zufrieden, in der Annahme, etwas Besseres sei ohnehin nicht zu leisten (vgl. zu dieser Problemlage etwa A R G Y R I S , 1 9 8 0 ; VON C R A N A C H , 1 9 8 0 , oder die von BASSECHES, 1 9 8 0 , untersuchten Denkstile). Daß eine solche Überzeugung in Anbetracht der Geschichte der Psychologie aufkommen konnte, bleibt zunächst rätselhaft. Die bahnbrechenden Forschungsergebnisse von PAWLOW, S K I N N E R , K Ö H L E R und L E W I N sind nämlich aufgrund deterministischer Grundannahmen zur Kausalität und ohne die Zuhilfenahme statistischer Prüfverfahren zustandegekommen - mit anderen Worten, es lag ihnen eine Orientierung an B-, nicht aber an P-Wahrscheinlichkeiten zugrunde. Mit Recht läßt sich daher die Auffassung vertreten, gerade sehr wesentliche Erkenntnisse in der Psychologie seien keineswegs aufgrund der heute üblichen Forschungsmethoden gefunden worden. Man mag einwenden, die von C O H E N beschriebene «Logik des Experimentierens» sei jedem empirischen Forscher klar, er versuche sich selbstverständlich auch danach zu richten und es bestehe daher keine Notwendigkeit, einen hochtrabenden Begriff («Baconian probability») zur Charakterisierung von Trivialitä-
116
Plaum: «Pascalsche» versus «Baconsche» Wahrscheinlichkeit
ten einzuführen. Zum Teil ist dies sicherlich richtig; gerade C O H E N ( 1 9 7 9 ) betont, daß BWahrscheinlichkeiten im Alltag recht wichtig sind und dementsprechend wird auch der Wissenschaftler bei der Planung seiner Untersuchungen entsprechende Überlegungen mit einbeziehen. Doch mißt man der oft langwierigen und aufwendigen Suche nach relevanten Variablen meist wenig Bedeutung bei. (Der Operationismus hat zu dieser Entwicklung sicherlich wesentlich beigetragen.) - Auf der anderen Seite werden bereits in Einfuhrungstexten für Anfänger statistische Methoden als das non plus ultra psychologischer Forschung herausgestellt (vgl. etwa K A G A N & HAVEMANN, 1 9 6 8 ; W A L KER, 1970, um nur zwei prägnante Beispiele herauszugreifen), ja sie sollen bereits das gesamte experimentelle Vorgehen bestimmen ( H E R Z O N & H O O P E R , 1 9 7 6 , p. 3 9 9 ) . Doch zeigen die häufig uninteressanten Resultate statistisch orientierter Forschung - verglichen etwa mit den Erfolgen von PAWLOW, S K I N N E R , K Ö H L E R oder L E W I N - wie wenig trivial die Berücksichtigung relevanter Variablen und von B-Wahrscheinlichkeiten tatsächlich ist. Wie schwer es vielen Psychologen fallt, einen zweiten Wahrscheinlichkeitsbegriffüberhaupt zu akzeptieren, verdeutlicht schließlich auch die bemerkenswerte Kontroverse zwischen C O H E N u n d K A H N E M A N & TVERSKY ( C O H E N , 1977,
1979,
1980;
KAHNEMAN
&
TVERSKY,
siehe auch K A H N E M A N , SLOVIC & T V E R SKY, 1 9 8 2 ) . Selbst in der klinischen Einzelfalldiagnostik und sogar noch im Rahmen des «experimentellen Modells» werden immer wieder ausschließlich P-Wahrscheinlichkeiten in den Vordergrund gestellt (vgl. etwa PAYNE & JONES, 1 9 5 7 ; H U B E R , 1 9 7 3 ) . Die Auffassung, daß dieselben allenfalls in einer Vorphase gründlicher experimenteller Erforschung relevanter Variablen als sinnvoll erachtet werden mögen, ist daher dem gegenwärtigen Trend des psychologischen Wissenschaftsbetriebes entgegengesetzt und alles andere als selbstverständlich. 1979;
Die Bedeutung von P-Wahrscheinlichkeiten wurde im Hinblick auf den «context of justification» (REICHENBACH) herausgestellt, nicht hingegen den «context of discovery» (d. h. Finden und Entdecken); REICHENBACH ( 1 9 6 6 ) hat den letzteren sogar als erkenntnistheoretisch unwichtig bezeichnet. In neuerer Zeit ist zu-
nehmend erkannt worden, daß der «context of discovery» insbesondere für die Tätigkeit von Detektiven bzw. den juristischen Einzelfall oder die psychologische Individualdiagnostik, aber auch die Wissenschaft überhaupt von Belang ist (hierzu etwa CARMICHAEL, 1 9 3 0 ; W I G GINS, 1 9 7 3 ; SACHSSE, 1 9 7 9 ; PULVER, L A N G
&
Da der «context of discovery» mit Hilfe von P-Wahrscheinlichkeiten kaum zu behandeln sein dürfte, gewinnen B-Wahrscheinlichkeiten von daher ebenfalls Bedeutung (was keineswegs heißen soll, daß der «context of justification» auf sie verzichten könnte). Bei genauerem Zusehen lassen sich viele Kontroversen, die im Laufe der Geschichte der Psychologie aufgetreten sind - etwa einzelfallvs. gruppenorientiert, qualitative vs. quantitative Methoden, «klinische» vs. statistische Vorhersage, nomothetisches vs. idiographisches Vorgehen - nunmehr mindestens teilweise auf die unterschiedliche Bedeutung zurückführen, die den B-Wahrscheinlichkeiten (anstelle von P-Wahrscheinlichkeiten) zuerkannt wird. Die Vernachlässigung des «context of discovery» (und damit der B-Wahrscheinlichkeiten) in der Wissenschaftstheorie hat zu einem sehr einseitigen Verständnis experimentellen Vorgehens geführt. Wir verdanken WACHTEL ( 1 9 8 0 ) einen Hinweis auf unterschiedliche Begabungsschwerpunkte auch bei Forscherpersönlichkeiten ; der gute Theoretiker ist nicht notwendigerweise ein kreativer Experimentator und beide müssen keine mathematischen Genies sein. Dem Vertreter einer nichtstatistischen Orientierung begegnet man aber oft mit einer Überlegenheit, die Mathematik und formale Logik anscheinend zu verleihen vermögen, so daß er meist hilflos kapitulieren muß. Seit C O H E N in seinen Hauptwerken ( 1 9 7 0 , 1 9 7 7 ) jedoch versucht hat, den zugegebenermaßen vorhandenen Rückstand der BACONschen Logik des Experimentierens, gegenüber dem in Philosophie bzw. Wissenschaftstheorie sehr viel gründlicher bearbeiteten Konzept der P-Wahrscheinlichkeit, aufzuholen, dürfte es nunmehr nicht mehr so leicht gelingen, einen Experimentalpsychologen wie A S N I N als unwissenschaftlich hinzustellen. Selbst wenn man den Formalisierungen COHENS nicht in allen Details folgen mag, so kann heute doch durch seine BemüSCHMID, 1 9 7 8 ; COHEN, 1979).
Zeitschrift f ü r Sozialpsychologie 1984, 15, 1 0 4 - 1 1 9
117
hungen der gängigen Wahrscheinlichkeitstheorie ein respektables System von Überlegungen, die auf BACON zurückgehen, an die Seite gestellt werden (OCKELTON, 1 9 8 2 ; COHEN, 1 9 8 2 ) . Daß ein induktivistisches Vorgehen überhaupt (auch in der Inferenzstatistik) nicht ohne Probleme ist, soll hier nur angedeutet, nicht aber weiterverfolgt werden. Es wurde eingangs erwähnt, daß auch eine ausschließlich an P-Wahrscheinlichkeiten orientierte Forschung zu sinnvollen Ergebnissen - selbst für die Praxis - kommen kann (siehe KRAAK, 1981; auch KATONA, 1 9 7 9 ) . Nach C O HEN sollten beide Ansätze einander ergänzen, weil jeder unter bestimmten Gesichtspunkten seine Berechtigung hat. In der Psychologie geht es heute darum, die Intoleranz, der ein Wissenschaftler begegnet, wenn sein Vorgehen weniger an statistischen Methoden, sondern vielmehr an B-Wahrscheinlichkeiten ausgerichtet ist, zu überwinden (vgl. hierzu WELLEK, 1 9 6 3 ; WEINERT, 1 9 8 2 ) . Einer Äußerung SKINNERS aus dem Jahre 1956 (p. 233) zu diesem Problem wäre auch heute noch nichts hinzuzufügen: «We have no more reason to say that all psychologists should behave as I have behaved than that they should all behave like R.A. Fisher . . . When we have at last an adequate empirical account of the behavior of Man Thinking, we shall understand all this. Until then, it may be best not to try to fit all scientists into any single mold.» Literatur ADLER, M . &
ROSENMEIER, H . P .
1970. I n f o r m a t i o n
und
Dokumentation. Analyse der in der deutschen Psychologie benützten Methoden. Archiv für Psychologie, 122, 327-338. ARGYRIS, C. 1980. Inner contradictions of rigorous research. New York: Academic Press. ASNIN, V.l. 1980/1981. The conditions for reliability of a psychological experiment. Soviet Psychology, 19, 80 — 99. BASSECHES, M. 1980. Dialectical schemata. A framework for the empirical study of the development of dialectical thinking. H u m a n Development,23,400—421. BECKERMANN, A. 1977. G r ü n d e und Ursachen. Kronberg/ Ts.: Scriptor. BOLLES, R. C. 1962. The difference between statistical hypotheses and scientific hypotheses. Psychological Reports, 11,639-645.
BRANDT, L.W. 1976. Zur Sozialpsychologie der Statistik. Psychologische Beiträge, 1 8 , 4 8 1 - 4 9 0 .
BRANDTSTÄDTER, J. 1982. Apriorische Elemente in psychologischen Forschungsprogrammen. Zeitschrift für Sozialpsychologie, 1 3 , 2 6 7 - 2 7 7 . BREDENKAMP, J. 1972. Der Signifikanztest in der psychologischen Forschung. Frankfurt a.M.: Akademische Verlagsanstalt. BROWN, J.F. 1933. Über die dynamischen Eigenschaften der Realitäts- und Irrealitätsschichten. (Untersuchungen zur Handlungs- und Affektpsychologie, hrsg. v. K. Lewin, XIV). Psychologische Forschung, 18,2 - 2 6 . CAPLAN, P. J. 1979. Beyond the box score: a boundary condition for sex differences in aggression and achievement striving. In: Mäher, B. A. (Ed.): Progress in experimental personality research, 9 , 4 1 —87. CARMICHAEL, R . D . 1930. T h e logic of discovery. Chicago: Open Court Publishing Co. C R A N A C H , M . VON, K A L B E R M A T T E N , U . , I N D E R M Ü H L E , K . &
GUGLER, B. 1980. Zielgerichtetes Handeln. Bern/Stuttgart/Wien: Huber. COHEN, L.J. 1970. The implications ofinduction. London: Methuen. COHEN, L.J. 1977. The probable and the provable. Oxford: Clarendon Press. COHEN, L.J. 1979. On the psychology of prediction: whose is the fallacy?Cognition, 7,385 - 4 0 7 . COHEN, L.J. 1980. Whose is the fallacy? A rejoinder to Daniel Kahneman and Amos Tversky. Cognition, 8, 89-92. COHEN, L.J. 1982. Das Problem der Ausgangswahrscheinlichkeit bei forensischen Beweisen. R a t i o , 2 4 , 7 1 —76. CRONBACH, L.J. 1975. Beyond the two disciplines of scientific psychology. American Psychologist, 30,116 — 127. DRENTH, D . J . D . 1969. D e r p s y c h o l o g i s c h e T e s t . M ü n c h e n :
Barth. DUNCKER, K. 1935. Z u r Psychologie des produktiven Denkens. Berlin: Springer. DURCHHOLZ, E. 1981. Der psychodiagnostische Prozeß. In: Wehner, E.G. (Hrsg.): Psychodiagnostik in Theorie und Praxis. Frankfurt a.M.: Lang, 260 — 307. ELIG, T.W. & FRIEZE, I.H. 1979. Measuring causal attribution for success and failure. Journal of Personality and Social Psychology, 37,621 - 6 3 4 . EPSTEIN, S. 1980. The stability of behavior. II. Implications for psychological research. American Psychologist, 35, 790-806.
EYSENCK, H.J. 1964. Introduction. In: Gray, J.A. (Ed.): Pavlov's Typology. Recent theoretical and experimental developments from the laboratory of B. M. Teplov, Institute of Psychology, Moscow. Oxford: Pergamon Press, V I I - I X . FINKELMAN, D. 1978. Science and psychology. American Journal of Psychology, 91,179 - 199. FLAMMER, A. 1978. Die Differentielle Psychologie in Krise. In: Pulver, U „ Lang, A. & Schmid, F.W. (Hrsg.): 1st Psychodiagnostik verantwortbar? Bern/Stuttgart/Wien: Huber, 76 —81. FREUND, A. 1930. Psychische Sättigung im Menstruum und Intermenstruum (Untersuchungen zur Handlungsund Affektpsychologie, hrsg. v. K. Lewin, VII). Psychologische Forschung, 1 3 , 1 9 8 - 2 1 7 . GOLDMAN, L. 1961. Using tests in counseling. New York: Appleton-Century-Crofts.
118
Plaum: «Pascalsche» versus «Baconsche» Wahrscheinlichkeit T Ü L U C -
PHELPS, R . H . &SHANTEAU, J. 1978. L i v e s t o c k j u d g e s : h o w
Neuropsychologische Testbatterie. Weinheim: Beltz Test. HARNATT, J. 1979. Nicht Rechtfertigung, sondern kritische Prüfung. Eine Erwiderung zu E. Witte (1977). Psychologische Beiträge, 21,496 - 502.
much information can an expert use? Organizational Behavior and H u m a n Performance, 21,209 - 219. PLAUM, E. 1979. Das Post-Streß-Interview innerhalb eines realitätsgerechten Rahmenkonzeptes klinisch-psychologischer Diagnostik. In: Müller-Küppers, M. & Specht, F. (Hrsg.): R e c h t - B e h ö r d e - K i n d . Bern/Stuttgart/ Wien: Huber, 1 2 0 - 1 3 5 . PLAUM, E. 1981a. Psychologische Testverfahren zur Intelligenz- und Leistungsmessung. In: Rey, E.-R. (Hrsg.): Klinische Psychologie. Stuttgart: G. Fischer. PLAUM, E. 1981b. Methodische Probleme einer Diagnostik auf interaktionstheoretischer Basis. Psychologie und Praxis, 25,91 - 9 8 . PLAUM, E. 1982. Thesen zur Klinisch-psychologischen Diagnostik. In: Plaum, E. (Hrsg.): Diagnostik zwischen Grundlagenforschung und Intervention. Versuche einer Standortbestimmung. Weinheim: Beltz, 13 — 34. PLAUM, E. 1983. Handlungstheorien und klinisch-psychologische Diagnostik. Unveröff. Manuskript. Vortrag auf dem 12. BDP-Kongreß für Angewandte Psychologie in Düsseldorf.
HAMSTER, W . , LANGNER, W . & MAYER, K . 1 9 8 0 .
HERZON, F . D . & HOOPER, M . 1976. I n t r o d u c t i o n t o statis-
tics for the social sciences. New York: T h o m a s Y. Crowell. HOLZKAMP, K. 1981. Theorie und Experiment in der Psyc h o l o g i e s . Aufl. Berlin: D e G r u y t e r . HUBER, H.P. 1973. Psychometrische Einzelfalldiagnostik. Weinheim: Beltz. KAGAN, J. & HAVEMANN, E. 1968. P s y c h o l o g y . A n i n t r o -
duction. New York: Harcourt, Brace & World. K A H N E M A N , D . , SLOVIC, P. & TVERSKY, A . ( E d s . )
1982.
Judgment under uncertainty: heuristics and biases. Cambridge: Cambridge University Press. K A H N E M A N , D . & TVERSKY, A . 1 9 7 9 . O n t h e i n t e r p r e t a t i o n
of intuitive probability: a reply to Jonathan Cohen. Cognition, 7 , 4 0 9 - 4 1 1 . KARSTEN, A. 1928. Psychische Sättigung (Untersuchungen zur Handlungs- und Affektpsychologie, hrsg. v. K. Lewin, V). Psychologische Forschung, 1 0 , 1 4 2 - 2 5 4 . KATONA, G. 1979. Toward a macropsychology. American Psychologist, 3 4 , 1 1 8 - 1 2 6 .
PULVER, U . , L A N G , A . & SCHMID, F . W . 1 9 7 8 . Ist P s y c h o -
KÖHLER, W. 1968. Werte und Tatsachen. Berlin: Springer. KRAAK, B. 1981. Probabilistische Theorien in der Psychologie. Psychologische Beiträge, 2 3 , 1 - 1 7 .
diagnostik verantwortbar? Bern/Stuttgart/Wien: Huber. REICHENBACH, H. 1966 6 . Experience and prediction. Chicago: University ofChicago Press. RICHTER, H. 1957. Z u m Problem der ideomotorischen Phänomene. Zeitschrift für Psychologie, 161,161 - 2 5 4 . SACHSSE, H. 1979. Kausalität - Gesetzlichkeit - Wahrscheinlichkeit. Darmstadt: Wissenschaftliche Buchgesellschaft.
KRAUSE, B. & METZLER, P. 1 9 7 8 . Z u r A n w e n d u n g d e r I n f e -
SCHUM, D . A . , D u CHARME, W . M . & D E PITTS, K . E .
renzstatistik in der psychologischen Forschung. Zeitschrift für Psychologie, 1 8 6 , 2 4 4 - 2 6 7 . LIPMANN, O. & BOGEN, H. 1923. Naive Physik. Leipzig: Barth. MEEHL, P.E. 1954. Clinical versus statistical prediction: a theoretical analysis and a review of the evidence. Minneapolis: University of Minnesota Press. MEEHL, P.E. 1957. When shall we use our heads instead of the formula? Journal of Counseling Psychology, 4,
Research on h u m a n multistage probabilistic inference processes. Organizational Behavior and H u m a n Performance, 1 0 , 3 1 8 - 3 4 8 . SKINNER, B.F. 1956. A case history in scientific method. American Psychologist, 11,221 - 2 3 3 . SMEDSLUND, J. 1979. Between the analytic and the arbitrary: a case study of psychological research. Scandinavian Journal of Psychology, 20,129 - 140. SMEDSLUND, J. 1981. The logic of psychological treatment. Scandinavian Journal of Psychology, 22,65 - 7 7 . SMITH, F. V. I960 2 . Explanation of human behaviour. London: Constable. SPEIGHT, 1.1983. Validitätsstudie zu einer neuentwickelten Testbatterie zur Erfassung der Leistungsmotivation. Unveröffentlichte Diplomarbeit, Sozialwissenschaftliche Fakultät der Universität Konstanz. TRAXEL, W. 1962. Kritische Untersuchungen zur Eidetik. Archiv fur die gesamte Psychologie, 114,260 — 336.
KELLEY, H . H . & MICHELA, J . L . 1980. A t t r i b u t i o n t h e o r y
and research. Annual Review of Psychology, 3 1 , 4 5 7 501.
268-273.
MEEHL, P.E. 1978. Theoretical risks and tabular asterisks: Sir Karl, Sir Ronald, and the slow progress of soft psychology. Journal of Consulting and Clinical Psychology, 46,806-834.
MERZ, F. 1960. Amerikanische und deutsche Psychologie. Psychologie und Praxis, 4 , 7 8 — 91. NAGEL, E. 1939. Principles of the theory of probability. International Encyclopedia of Unified Science, Vol. I, No. 6. Chicago: University ofChicago Press. NORDIN, I. 1982. Physikalischer Determinismus. Ratio, 24,126-140. OCKELTON, C . M . G .
1982. M a t h e m a t i s c h e
Wahrschein-
lichkeiten und die Bewertung bestätigender oder konvergierender Beweismittel. R a t i o , 2 4 , 6 1 —70. PAYNE, R . W . & JONES, H . G . 1957. Statistics f o r t h e i n v e s t i -
gation of individual cases. Journal of Clinical Psychology, 1 3 , 1 1 5 - 1 2 1 . PETERMANN, F. & HEHL, F.-J. (Hrsg.). 1979. E i n z e l f a l l a n a -
lyse. München: Urban & Schwarzenberg.
1973.
TROUTMAN, C . M . & SHANTEAU, J. 1977. I n f e r e n c e s b a s e d
on nondiagnostic information. Organizational Behavior & H u m a n Performance, 19,43 — 55. URMSON, J.O. (Ed.) 1967. The concise encyclopedia of western philosophy and philosophers. New York: Hawthorn. VIER, W. 1956. Sättigung, Übersättigung und E r m ü d u n g in ihrer Wirkung auf die optische Verschmelzungsfrequenz. Zeitschrift für Psychologie, 159,246 - 2 7 9 . VOLHARD, J. 1909. Justus von Liebig, II. Band. Leipzig: Barth.
Zeitschrift für Sozialpsychologie 1984, 15, 1 0 4 - 1 1 9 WACHTEL, P.L. 1980. Investigation and its discontents. Some constraints on progress in psychological research. American Psychologist, 35,399 — 408. WALKER, H . M . 197010. Statistische Methoden für Psychologen und Pädagogen. Weinheim: Beltz. WEINERT, F.E. 1982. Wünschbare und machbare Sozialwissenschaft. Forschung (Mitteilungen der DFG) 4/1982,5. WELLEK, A . 1 9 6 3 . D i e W i s s e n s c h a f t s p r o b l e m a t i k d e r P s y -
chologie als einer anthropologischen Disziplin. Psychologische Rundschau, 14,75 —92. WESTERMANN, R . & H A G E R , W . 1 9 8 2 . E n t s c h e i d u n g ü b e r
statistische und wissenschaftliche Hypothesen: Zur Differenzierung und Systematisierung der Beziehungen. Zeitschrift für Sozialpsychologie, 13,13—21.
119 WIGGINS, J.S. 1973. Personality and prediction: principles of personality assessment. Reading, Mass.: AddisonWesley. WINKLER, L . L . & MURPHY, A . H . 1 9 7 3 . E x p e r i m e n t s in t h e
laboratory and the real world. Organizational Behavior and H u m a n Performance, 10,252 - 270. WITTE, E. 1977. Zur Logik und Anwendung der Inferenzstatistik. Psychologische Beiträge, 19,290 — 303. WOTTAWA, H. 1981. Allgemeine Aussagen in der psychologischen Forschung: Eine Fiktion. In: Michaelis, W. (Hrsg.): Bericht über den 32. Kongreß der Deutschen Gesellschaft für Psychologie in ^ ^ H Zürich 1980. Bd. 1. Göttingen: Hogrefe, 131 136. I J
120
Prester: Bedingungen der Informiertheit
Empirie Bedingungen der Informiertheit über eine öffentliche Planungder aktive Rezipient H A N S - G E O R G PRESTER Universität Konstanz
In einer Sekundäranalyse wird der Frage nachgegangen, welche Faktoren das Wissen von Anwohnern über eine örtliche Planung bestimmen. Die Daten entstammen einer Panel-Studie im Feld, bei der vom geplanten Ausbau einer Eisenbahnstrecke betroffene Anwohner befragt wurden. Als Ausgangspunkt für die statistische Analyse dient ein theoretisches Rahmenmodell, das individuelle Merkmale, Informationssucheverhalten und Wissen verbindet. Das Rahmenmodell wird in Kausalmodelle mit latenten Variablen und multiplen Indikatoren übersetzt und mit LISREL analysiert. Sowohl Querschnitt- als auch Längsschnitt-Ergebnisse zeigen, daß aktive Informationssuche eine zentrale Determinante des Wissens ist, und d a ß Informationssuche über die Planung beeinflußt wird von individueller Betroffenheit und von generellen Gewohnheiten des sich Informierens über Politik, die ihrerseits eng mit soziodemographischen Merkmalen in Beziehung stehen.
Which factors determine the knowledge of citizens about local planning is studied by means of a secondary analysis. T h e data stem from a panel study in the field which examined how residents reacted to the planned extension of a railway track. A theoretical framework is presented which connects individual characteristics, information-seeking behavior and knowledge. Causal models with latent variables and multiple indicators are derived from the theoretical framework and analysed with LISREL. Cross-sectional as well as longitudinal results show that the active search for information is a central determinant of knowledge, and that information-seeking about the plan is influenced by the degree of residents' concern about the local environment and by general habits of political information-seeking which are closely related to sociodemographic characteristics.
1.
etwa Atomkraftwerke, chemische Fabriken usw. Seit den sechziger Jahren nimmt die Diskussion über politische Partizipation, d. h. über Möglichkeiten der Einflußnahme und der Beteiligung von Bürgern bei solchen Planungsund Genehmigungsverfahren, die über die traditionellen Formen der politischen Beteiligung in der repräsentativen Demokratie hinausgehen, einen breiten Raum ein (siehe z. B . BUSE & NELLES, 1 9 7 5 ; L A N G T O N , 1 9 7 8 ) . Entsprechend versuchen zahlreiche Bürgerinitiativen bei den verschiedensten Planungsverfahren ihre Interessen zu formulieren und durchzusetzen. Ein wesentliches Instrument der Einflußnahme sind von Bürgerinitiativen organisierte kollektive Aktionen, wie Demonstrationen, Unterschriftensammlungen usw., bei denen viele Betroffene ihren Standpunkt sichtbar artikulieren
1.1
Problemstellung Einleitung
In der Bundesrepublik Deutschland wie auch in anderen Industriestaaten greifen politisch/ administrative Entscheidungen oft nachhaltig in die Umweltbedingungen der Bürger ein. Besonders augenfällig vollzieht sich dies bei der Planung und Durchfuhrung öffentlicher Großprojekte, wie etwa Stadtsanierungen, Fernstraßenbau usw., oder bei behördlichen Genehmigungsverfahren für industrielle Projekte, wie Zu diesem Beitrag: Diese Arbeit ist im Sonderforschungsbereich 24, Sozialwissenschaftliche Entscheidungsforschung, der Universität Mannheim unter Verwendung der von der Deutschen Forschungsgemeinschaft zur Verfugung gestellten Mittel und mit Unterstützung des Landes Baden-Württemberg entstanden.
(vgl. z . B . MAYER-TASCH, 1 9 7 6 ; ANDRITZKY &
121
Zeitschrift für Sozialpsychologie 1984, 15, 1 2 0 - 135 WAHL-TERLINDEN,
1978;
TEICHMANN
&
Solche Partizipationsformen können jedoch nur dann genutzt werden, wenn zuvor das anstehende Planungs- bzw. Genehmigungsverfahren vielen Bürgern bekannt ist. Weiterhin muß eine rationale Meinungsbildung auf Informationen über Merkmale und Auswirkungen des geplanten Projekts basieren. Ein wichtiges Problem in einem Partizipationsprozeß stellen daher Fragen der Informationsübermittlung dar (siehe z.B. F E H L A U & N E D D E N S , 1 9 7 5 ) . Die Informiertheit der Bürger hängt dabei von Faktoren auf verschiedenen Ebenen ab: etwa von der Informationspolitik der planenden/genehmigenden Behörde, von der Berichterstattung in den Medien, von der Informationspolitik der Bürgerinitiativen und vom Rezeptionsverhalten der Bürger selbst. Dieser letzten Ebene gilt die vorliegende Studie. WATTS,
1.3 Theoretische
Vorbemerkungen
1981).
1.2 Ausgangspunkt
der Studie
Die angesprochene Kommunikationsproblematik war teilweise Gegenstand des Forschungsprojekts «Determinanten von Partizipation bei Umweltproblemen» (siehe PRESTER et al., 1 9 8 1 , 1 9 8 2 ) . In diesem sozialpsychologisch orientierten Projekt wurde am Beispiel des Ausbaus einer Eisenbahnstrecke untersucht, welche Faktoren bestimmen, ob betroffene Anwohner Protestaktivitäten ergreifen. Die Studie berücksichtigte zwar die Informiertheit der Betroffenen über die Planung als eine wichtige Vorbedingung des Protests, hatte aber nicht die Erklärung des Informationsstands zum Ziel. Das vorliegende Datenmaterial gestattet jedoch, in einer Sekundäranalyse der Informiertheitsproblematik gezielt nachzugehen. Entsprechend der Art der vorliegenden Daten muß sich diese Analyse allerdings auf das Rezeptionsverhalten der Betroffenen beschränken. Es soll erklärt werden, wieso von einer Planung betroffene Anwohner, denen im wesentlichen das gleiche Informationsangebot zur Verfügung steht, unterschiedlich gut über die Planung Bescheid wissen.
Ausgehend von der auf LASSWELL ( 1 9 4 8 ) zurückführbaren Grundfrage der Kommunikationswissenschaft: «Who says what in which Channel to whom with what effect?» (p. 37) kann die Fragestellung dieser Studie weiter strukturiert werden. Die Quelle der Nachricht ist hier eine planende/genehmigende Behörde; die interessierende Nachricht betrifft Informationen über Merkmale, Ziele und Auswirkungen eines geplanten Großprojekts; die Kanäle, über die sich die Nachricht verbreitet, können sein: Tageszeitung, Rundfunk, Informationsbroschüren, Flugblätter sowie persönlicher Kontakt; die Rezipienten sind von der Planung betroffene Bürger und der interessierende Effekt ist der Informationsstand der Bürger über die Planung. Betrachtet man diesen Kommunikationsprozeß unter dem Aspekt der Diffusion der Informationen, so läßt sich vermuten, daß die Tageszeitung eine dominierende Rolle spielt. Zum einen deshalb, weil lokale Themen vor allem von der Tageszeitung aufgegriffen werden, zum anderen zeigen Studien zum «twostep-flow of communication», daß außer bei ganz außergewöhnlichen Ereignissen von hohem Nachrichtenwert sich Neuigkeiten hauptsächlich über Massenmedien verbreiten und weniger über persönliche Kontakte (siehe hierzu die Übersichten von M Ü L L E R , 1 9 7 0 ; RENCKSTORF, 1 9 7 3 ; SCHENK, 1 9 7 8 ; K U N C Z I K , 1979).
Personen werden jedoch nicht automatisch von der Tageszeitung erreicht, man muß vielmehr davon ausgehen, daß sie aktiv Medien und Nachrichten benutzen und auswählen. Als Gründe für eine solche selektive Nutzung werden vor allem erwartete Gratifikationen genannt (vgl. WEISS, 1 9 6 9 ; BAUER, 1 9 7 3 ; K A T Z , BLUMLER & G U R E V I T C H , 1 9 7 4 ) . Diese Gratifikationen können etwa in der Unterhaltung liegen, die der Medienkonsum bietet, im instrumenteilen Nutzen, den Informationen für beabsichtigte Handlungen haben, oder auch im sozialen Kontext, in dem der Medienkonsum stattfindet (z. B. mit Freund bzw. Freundin ein Kino besuchen). In empirischen Studien zur Mediennutzung werden allerdings hauptsächlich soziodemo-
122
Prester: Bedingungen der Informiertheit
graphische Daten berücksichtigt. Über das Zeitungsleseverhalten ist bekannt, daß: - Männer häufiger die Tageszeitung lesen als Frauen, - die Lesehäufigkeit in mittleren Altersgruppen am höchsten ist und - die Lesehäufigkeit mit der Schulbildung, dem sozioökonomischen Status, sowie mit dem Interesse an Politik steigt. (Siehe z.B. VERBAND
SCHRAMM & WHITE, DEUTSCHER
1954; B U N D E S -
ZEITUNGSVERLEGER,
1 9 6 6 ; KNOCHE & R U D O L F , 1 9 7 3 ; ZOLL & H E N NIG, 1 9 7 3 ; HOLZER, 1 9 8 0 ; KIEFER, 1 9 8 1 . ) D i e
Einordnung dieser erklärungsbedürftigen Kovariationen zwischen soziodemographischen Variablen und Leseverhalten in den theoretischen Kontext des oben erwähnten «uses and gratification approach» scheint bisher nur in relativ allgemeiner Weise erfolgt zu sein. Es kann vermutet werden, daß Geschlecht, Alter und Status unterschiedliche Sozialisationsprozesse und unterschiedliche aktuelle Lebensbedingungen indizieren und damit unterschiedliche Bedürfnisstrukturen, die ihrerseits wieder zu spezifischen Nutzungsmustern der Medien führen. Auch ein generell aktives Informationsverhalten - insbesondere die häufige Lektüre der Tageszeitung- kann jedoch alleine nicht garantieren, daß spezielles Wissen über die Planung entsteht. In Anlehnung an ein Stufenmodell des personeninternen Informationsverarbeitungsprozesses von M C G U I R E (1973) müßten dazu weitere Fragen geklärt werden: Wird den gesendeten Nachrichten über die Planung überhaupt Aufmerksamkeit zugewandt? Werden
die Nachrichten verstanden? Werden sie im Gedächtnis ab gespeichert! Werden sie behalten oder vergessen? Wird schließlich das abgespeicherté Wissen bei der Abfrage durch den Forscher auch wiedergegeben? Man muß davon ausgehen, daß auch auf diesen Verarbeitungsstufen Selektionsprozesse stattfinden, bei denen Rezipienteneigenschaften eine Rolle spielen (vgl. BAUER, 1973). R E N C K S T O R F ( 1 9 8 0 ) konnte dies beispielsweise für die Erinnerung an die Inhalte von Nachrichtensendungen aus dem Fernsehen zeigen. Von besonderem Interesse für den Wissenserwerb dürften Aufmerksamkeitsprobleme sein, da Aufmerksamkeit am Anfang des Verarbeitungsprozesses steht und Grundvoraussetzung für die aktive Suche nach weiteren Informationen ist. Nach ATKIN (1973) haben Personen ein Bedürfnis, den Teil der Umwelt, der sie persönlich betrifft, zu verstehen. Dies führt u.a. dazu, daß Personen Informationen über solche Ereignisse Aufmerksamkeit zuwenden, von denen sie vermuten, daß sie ihr persönliches Wohlergehen beeinflussen können. Bei diesen Informationen ist nämlich ein instrumenteller Nutzen erwartbar - sie ermöglichen adäquate Anpassungsreaktionen. Es wird daher angenommen, daß vor allem solche Personen Aufmerksamkeit für Nachrichten über eine öffentliche Planung haben und nach weiteren Informationen suchen, die sich subjektiv betroffen fühlen. Damit ist gemeint, daß sie einen Zusammenhang zwischen dem Umweltbereich, in den die Planung eingreift, und ihrem persönlichen Wohlergehen bzw. ihrem privaten Verhaltensbereich sehen.
W i s s e n über die Planung
Abb. 1: Theoretisches Rahmenmodell Bedingungen der Informiertheit über eine öffentliche Planung.
Zeitschrift für Sozialpsychologie 1984, 15, 1 2 0 - 1 3 5
Auf die weiteren Stufen des Verarbeitungsmodells wird hier nicht näher eingegangen. Abbildung 1 skizziert das aus dem bisher Erörterten folgende theoretische Rahmenmodell. Darin wird davon ausgegangen, daß Wissen über die Planung vor allem davon abhängt, ob den Nachrichten über die Planung Aufmerksamkeit zugewendet wird. Informationssuche ihrerseits hängt davon ab, ob die Person sich generell für politische Themen interessiert und darüber informiert und, ob die Person sich subjektiv vom Umweltbereich, in den die Planung eingreift, betroffen fühlt. Aktives Informationsverhalten hinsichtlich politischer Themen wird schließlich in Abhängigkeit von den soziodemographischen Merkmalen Alter, Geschlecht und Status gesehen.
2.
Untersuchter Problemfall
2.1 Darstellung
des Falls
Der untersuchte Problemfall ist ein Planfeststellungsverfahren für eine Planung der Deutschen Bundesbahn (DB), nämlich die «Westliche Einführung der Riedbahn» (WER) in Mannheim. Dabei geht es um den Ausbau und teilweisen Neubau einer Eisenbahnstrecke. Die DB begründete ihr Vorhaben so: «Im Netz der Deutschen Bundesbahn hat der Hauptbahnhof M a n n h e i m als Knotenpunkt mehrerer Eisenbahnlinien eine besonders wichtige Funktion. . . Züge aus Richtung Frankfurt (müssen) derzeit noch von Osten her kommend über die in den Hauptbahnhof einfahren. Die Weiterfahrt nach Süden ist nur nach Fahrtrichtungswechsel und Kreuzung aller übrigen Gleise möglich. Gleiches gilt für Züge der Süd-NordRichtung nach Frankfurt. Der unvermeidbare Fahrtrichtungswechsel des Zuges, das , bedingt stets auch einen Wechsel der L o k o m o t i v e - e i n kostspieliger und zeitaufwendiger Vorgang. Dies ist für einen der wichtigsten IC-Knotenpunkte im Nord-Süd-Verkehr auf Dauer nicht tragbar» (DEUTSCHE BUNDESBAHN, ohne Jahr).
Durch die WER sollen die angeführten Nachteile behoben werden. Im betrachteten Planfeststellungsbereich 3 der WER wird die bereits bestehende Bahnstrecke ausgebaut, die dort die Mannheimer Vororte Schönau und Gartenstadt tangiert und den Vorort Waldhof durchschneidet. Infolge der beabsichtigten Erhöhung der
123 Zugfrequenz und höheren Geschwindigkeiten der Züge befürchten viele Anwohner in den genannten Stadtteilen eine Vermehrung der Belastung durch Geräusche und Erschütterungen. Eine lokale Bürgerinitiative (BI) artikulierte die Bedenken gegen die Planung in Leserbriefen, Schreiben an Stadträte, Parteien, Bundesbahn usw. Sie sammelte, zusammen mit Kritikern der Ausbauplanung aus allen im Stadtrat vertretenen Parteien, etwa 1000 Unterschriften für eine Sammeleinwendung und organisierte 3 Bürgerforen, auf denen mit Vertretern der Bahn diskutiert werden konnte. Die BI setzte sich für mehr Lärmschutzmaßnahmen, insbesondere für eine Tieflage der Bahn ein. Eine Untertunnelung wurde nicht zuletzt deshalb präferiert, weil damit eine Verminderung der bereits bestehenden Lärmbelastung und eine verbesserte Verbindung der beiden, vom Schienenstrang durchschnittenen Teile Waldhofs, hätte erreicht werden können. Auf dem gesetzlich vorgeschriebenen Erörterungstermin, auf dem die vorgebrachten Einwendungen diskutiert wurden, in den Bürgerforen und in einer Broschüre, die an die Haushalte verteilt wurde, machte die DB deutlich, daß eine Tieflage des Streckenabschnitts für sie nicht in Frage kommt. Die Argumente waren wie folgt: Ein erheblicher Teil der Geräuschbelastung im Stadtteil Waldhof stamme nicht von der Bahn, sondern gehe von der dortigen Ausfallstraße und der Straßenbahn aus; die vielen Anschlußgleise für Industrieanlagen im Planungsbereich 3 würden die Tieflage technisch sehr schwierig machen und die Kosten wären unvertretbar hoch. Die Stadt Mannheim stimmte dem Bau der WER grundsätzlich zu, wenn dabei Schallschutzmaßnahmen eingeplant würden, die zu erweitern wären, wenn nach Inbetriebnahme der neuen Strecke die Geräuschbelastung im Mittelungspegel um mehr als 1 dB(A) ansteigen würde. In einem Umweltvertrag zwischen Stadt und DB wurden die Einzelheiten geregelt, insbesondere wurden Schallschutzwände und Zuschüsse für Schallschutzfenster vereinbart. Im festgestellten Plan ist geregelt, daß die WER ebenerdig ausgeführt wird, Höchstgeschwindigkeiten bis zu 160 km/h erlaubt sind, Schallschutzwände gebaut werden und Schallschutzfenster in bestimmten Bereichen bezu-
124
Prester: Bedingungen der Informiertheit
schußt werden. Gegen diesen Planfeststellungsbeschluß wurden von den Bürgern keine rechtlichen Schritte unternommen.
2.2 Rahmenbedingungen
der
Informiertheit
Über den Bahnausbau konnten die betroffenen Bürgerauf mehreren Wegen Informationen erhalten. Zunächst über die Lokalpresse, die bereits seit 1977 wiederholt Meldungen zum geplanten Ausbau brachte. In der Tageszeitung «Mannheimer Morgen» wurden im Jahr 1979 etwa 20 Artikel, 1980 und 1981 jeweils etwa 10 Artikel sowie Leserbriefe, Veranstaltungshinweise und Bekanntmachungen zum Thema WER veröffentlicht. Außerdem verteilte die DB Anfang 1980 eine bebilderte Broschüre, in der das Projekt erläutert wurde und insbesondere mögliche Schallschutzmaßnahmen und Probleme bei einer Tieflegung der WER angesprochen wurden. An schriftlichem Material gab es weiterhin Plakate und Flugblätter, die zu den Bürgerforen einluden, sowie Mitteilungen in Gemeindebriefen der Pfarreien und in Vereinsnachrichten. Weitere Informationen konnten auf verschiedenen öffentlichen Veranstaltungen gesammelt werden, so vor allem auf den Bürgerforen, dem Erörterungstermin und einer Ausstellung der Bundesbahn sowie auf Gemeinderatssitzungen, Bezirksbeiratssitzungen usw. Schließlich ist es wahrscheinlich, daß Informationen auch über persönliche Kontakte weitergegeben wurden, so z. B. über die Unterschriftensammler oder Nachbarn. Insgesamt muß davon ausgegangen werden, daß Informationen über die WER sich über mehrere Kanäle und in mehreren Stufen verbreiteten.
— Befragung von Zufallsstichproben der 18 - 70jährigen Anwohner aus Teilgebieten der Stadtteile Waldhof und Gartenstadt; — Differenzierung von 2 Betroffenheitsstufen gemäß der Exponierung (Geräuschbelastung der Wohnung durch den Bahnbetrieb); — Betrachtung von zwei Zeitpunkten: t, = vor; t2 = nach der Planfeststellung als kritischem Ereignis; — Stichprobenzielwerte: 240 Befragungen in t,. Angestrebt waren 75% Panelausschöpfung. Die Daten wurden von einem eigenen Interviewer-Team in mündlichen Interviews mit einem standardisierten Fragebogen erhoben. Die erste Befragungswelle fand im Herbst 1980 statt, die zweite im Herbst 1981. In t, konnten 229 Personen befragt werden (71 % der befragbaren Adressen), von diesen konnten 79% (182 Personen) in t 2 wieder befragt werden.
3.2 Ausgewählte
Zur Sekundäranalyse wurden diejenigen Variablen ausgewählt, die als Indikatoren für die theoretischen Konstrukte des Rahmenmodells geeignet erscheinen. Näheres zur Operationalisierung findet sich in PRESTER et al. (1981). Tabelle 1 gibt eine Übersicht zu den Variablen, geordnet nach den Kategorien des Rahmenmodells. Die Zusätze «-1» bzw. «-2» an den Variablenkurznamen geben den Erhebungszeitpunkt der Variablen an. Die rechten Spalten geben meßtechnische Hinweise zu den Variablen. Sofern die Variablen bereits Zusammenfassungen mehrerer Items darstellen, ist in der letzten Spalte angegeben, ob über die Items gemittelt wurde oder ob durch logische Verknüpfungen eine 0/1 -Größe gebildet wurde. Die Variablen des Wissensblocks beruhen auf einer Reihe von frei zu beantwortenden Wissensfragen. Anhand der notierten Antworten vergab ein Codierer «Informiertheitspun kte», außerdem schätzte der Interviewer die Informiertheit des Befragten während der Beantwortung der Wissensfragen im Interview ein. Da jedoch etwa 'A der Befragten überhaupt keine Kenntnis über die Planung hatte, hätten sich sehr schiefe mehrstufige Verteilungen ergeben, so daß vorgezogen wurde, die Wissensvariablen zu dichotomisieren. Die Stufe «0» faßt dabei gar kein und n u r geringes Wissen zusammen.
3.3 3.
Variablen
Auswertungskonzept
Methodik
3.1 Untersuchungsplan der Studie
und
Durchführung
Der Untersuchungsplan ist entsprechend den ursprünglichen Zielen der Studie angelegt (eine ausführliche Darstellung geben PRESTER et al., 1981). Er wird hier nur kurz in seinen wesentlichen Merkmalen zusammengefaßt:
Bei der Auswertung werden die in Tabelle 2 aufgeführten Variablen als Indikatoren für die Konstrukte des Rahmenmodells verstanden. Aufeinander aufbauend werden folgende Analyseschritte ausgeführt: — Mittelwertsvergleiche zwischen gut und schlecht Informierten, — Diskriminanzanalysen für ein Informiertheitskriterium, — Überprüfung des Rahmenmodells mit kausalanalytischen Verfahren.
125
Zeitschrift fiir Sozialpsychologie 1984, 15, 1 2 0 - 1 3 5 Tab. 1: Variablenliste. Kurzname
Meßtechnisches
Inhalt; Erläuterungen
Typ Soziodemographische Variablen SEX-1 Geschlecht des Befragten (Mann = 0; Frau = 1) ALT-1 Alter des Befragten IAS-1 Index Ausbildungsstatus IBS-1 Index Berufsstatus IES-1 Index Einkommensstatus
Items n Skala
Sek. Var.
B F F F F
1 1 1 1 1
0/1 18. .70 6 . . 20 1 .. .4 0 . . 130
F
3
1 . . .5
F/C
1
0/1
Aktives Informationsverhalten hinsichtlich Politik HLP-1 Häufigkeit der Lektüre des politischen Teils der Zeitung HDP-1 Häufigkeit der Diskussion über Politik
F F
1 1
1 . . .5 1 . . .5
Spezielle Informationssuche über die Planung ZNP-1 Zeitungsnachrichten über Planung verfolgt BVP-1 Besuch von Informationsveranstaltungen über Planung
F F
1 3
0/1 0/1
d
ZNP-2 BVP-2
F F
1 3
0/1 0/1
d
Wissen über die Planung IPI-1 Informiertheit über Planung vom Interviewer geschätzt IPC-1 Informiertheit über Planung vom Codierer geschätzt
F/I F/C
3 3
1 . . .5 1 .. .3
d d
IPI-2 IPC-2
F/I F/C
1 1
1 .. .5 1 .. .3
d d
Subjektive GIU-1 GBB-1
Betroffenheit Gestörtheit/Ist Umwelt; Gestörheit durch bestehenden Bahnbetrieb (Lärm; Vibrationen; Trennwirkung) Gestörtheit durch Bahnbetrieb; Spontannennung der Bahn als störende Wohnbedingung
Zeitungsnachrichten über Planung verfolgt Besuch von Informationsveranstaltungen über Planung
Informiertheit über Planung vom Interviewer geschätzt Informiertheit über Planung vom Codierer geschätzt
-
m -
-
-
-
Itemtypen: F = direkte Frage; B = beobachtete Eigenschaften; I = von Interviewer eingeschätzt; C = vom Codierer eingeschätzt anhand notierter freier Antworten des Befragten. Sekundärvariablen: d = D u m m y ( 0 / l ) ; m = Mittelwert über die Items
Da Informiertheitskriterien in beiden Phasen des Panels erhoben wurden, lassen sich für Phase 1 und Phase 2 getrennte Analysen durchfuhren. Außerdem entsteht somit die Möglichkeit, das Rahmenmodell zu einem Längsschnittmodell zu erweitern; dies erfolgt nach der Darstellung der Analyse der Querschnittsdaten. Als Analysestichprobe dient einheitlich - auch für Analysen mit Phase 1D a t e n - d i e Panel-Stichprobe (N = 182). Als kausalanalytisches Verfahren wird LISREL (JÖRESKOG & SÖRBOM, 1981) verwendet. LISREL erlaubt die Unterscheidung zwischen empirischen Indikatoren und latenten theoretischen Konstrukten. Dies hat den Vorteil, daß einerseits ein Meßmodell formuliert werden kann, das die Beziehungen zwischen Indikatoren und Konstrukten beschreibt, und andererseits ein Strukturmodell, das die Beziehungen zwischen den Konstrukten - und damit die theoretischen Annahmen - beschreibt. Das Meßmodell kann analog zur konfirmatorischen Faktorenanalyse interpre-
tiert werden (zur Faktorenanalyse siehe z.B. LAWLEY & MAXWELL, 1971), das Strukturmodell analog zur Pfadanalyse (zur Pfadanalyse siehe z.B. BLALOCK, 1971; OPP & SCHMIDT, 1976). Die LISREL-Koeffizienten werden jedoch i.a. nicht mit Faktorladungen bzw. Pfadkoeffizienten identisch sein, da andere Annahmen und andere Schätzverfahren zugrunde liegen. Durch die Integration eines Meßmodells sind bessere Schätzungen der StrukturkoefTizienten möglich als bei der herkömmlichen Pfadanalyse, außerdem läßt LISREL Meßfehler- und Residualkorrelationen zu (siehe JÖRESKOG, 1973). Die LISREL-Analysen wurden mit d e m P r o g r a m m L I S R E L V (JÖRESKOG & SÖRBOM,
1981)
durchgeführt, die sonstigen Rechenarbeiten mit SPSS-Prozeduren (NIE etal., 1975).
126
Prester: Bedingungen der Informiertheit
Tab. 2: Vergleiche zwischen gut und schlecht Informierten. Informiertheitskriterium:
Variablen
Mittelwerte bzw. Prozente IPI-1
Korrelationen IPI-2
IPI-1
IPI-2
schlecht (0) informiert
gut(l) informiert
schlecht (0) informiert
gut(l) informiert
N = 85
N = 97
N = 66
N = 116
58% 41,6 9,0 2,2 30,6
52% 43,2 9,6 2,5 30,7
-.14 .01 .16 .23 .16
-.06 .06 .13 .17 .00
2,4 57%
.16 .19
.11 .11
SEX-1 ALT-1 IAS-1 IBS-1 IES-1
Geschlecht (Frauen) Alter Ausbildung Beruf Einkommen
61% 42,4 9,0 2,2 28,0
* ** *
47% 42,7 9,8 2,6 33,1
GIU-1 GBB-1
Gestörtheit/Ist Gestörtheit/Bahn
2,2 42%
* *
2,4 62%
2,2 45%
HLP-1 HDP-1
Lektüre Politik Diskussion Politik
2,7 3,2
** *
3,5 3,5
2,8 3,2
•*
3,4 3,5
.32 .16
.22 .10
ZNP-1 BVP-1
Zeitung Veranstaltung
6% 1%
" **
71% 19%
17% 2%
**
54% 15%
.66 .28
.37 .22
ZNP-2 BVP-2
Zeitung Veranstaltung
32% 0%
**
73% 13%
_
.40 .23
IPI-1 IPC-1
Informiertheit Informiertheit
**
67% 58%
_ -
.37 .34
MAG-1
mittlere Altersgruppe 1
53%
.23
.07
—
—
-
-
—
_
-
-
29% 23%
61%
46%
28%
*
*
**
•*
-
2
*/** signifikant bei p sc .05/.01 (t-Testbzw. Chi ). 1 Siehe Erläuterung im Text.
4.
Ergebnisse
4.1 Vergleiche zwischen gut und schlecht Informierten Um zu erkennen, welche Variablen mit dem Grad der Informiertheit kovariieren, wurden zunächst Vergleiche zwischen den gut und den schlecht Informierten durchgeführt. Siehe hierzu Tabelle 2. Als Kriterien für die Stichprobenzerlegung in gut und schlecht Informierte, wurden die Einschätzungen der Interviewer (IPI-1 und IPI-2) verwendet. (Für die Einschätzungen der Codierer IPC-1 und IPC-2 ergibt sich im wesentlichen das gleiche Bild.) Zusätzlich sind in den beiden rechten Spalten von Tabelle 2 die Korrelationen zwischen den Informiertheitskriterien und den Variablen aufgeführt. Je nach Meßniveau handelt es sich dabei um Phi-Koeflizienten bzw. punktbiseriale Korrelationen. Wie Tabelle 2 zeigt, haben gut Informierte ein deutlich ausgeprägteres Informationssucheverhalten über die Planung (ZNP, BVP), be-
schäftigen sich mehr mit politischen Fragen (HLP, HDP), sind etwas stärker durch den Bahnbetrieb betroffen (GIU, GBB) und haben etwas höheren Status (I AS, IBS, IES). Es zeigen sich nur schwache Zusammenhänge mit dem Geschlecht und keine mit dem Alter. Allgemein ist festzustellen, daß die Beziehungen beim zweiten Zeitpunkt (siehe IPI-2) schwächer sind als beim ersten (siehe IPI-1). Dies kann daran liegen, daß bei der ersten Befragungswelle auch durch das Interview selbst Informationen über die WER vermittelt wurden und die Aufmerksamkeit für das Planungsgeschehen vermutlich erhöht wurde. Dafür spricht auch, daß die Zahl derjenigen, die das Geschehen in der Zeitung verfolgen, beim zweiten Zeitpunkt höher ist, als beim ersten (vgl. ZNP-1 mit ZNP-2). Dies würde die bei der Erstbefragung vorgefundenen Unterschiede verwischen. Das Alter, das offensichtlich keinen linearen Zusammenhang mit der Informiertheit hat, wurde schließlich auf nichtlineare Zusammenhänge überprüft. Dabei zeigten sich ausgeprägt
127
Zeitschrift für Sozialpsychologie 1984, 15, 1 2 0 - 1 3 5
umgekehrt U-fÖrmige Beziehungen zur Informiertheit in Phase 1. Um diesen nichtlinearen Zusammenhang abbilden zu können, wurde eine Dummy-Variable «mittlere Altersgruppe» (MAG-1) gebildet, die für Personen zwischen 35 und 55 Jahren den Wert «1» annimmt, für die jüngeren und älteren den Wert «0»; sie ist in der letzten Zeile von Tabelle 2 aufgeführt. Ferner läßt sich erkennen, daß Informiertheit zum zweiten Zeitpunkt (IPI-2) mit der Informiertheit zum ersten Zeitpunkt (IPI-1) zusammenhängt. Daß der Zusammenhang nicht noch enger ist, dürfte daran liegen, daß zum zweiten Zeitpunkt ein etwas anderer Aspekt abgefragt wurde (Wissen über das endgültig als Plan Beschlossene) als zum ersten Zeitpunkt (Wissen über das Geplante). Allgemein zeigt sich, daß Variablen, die nach den Annahmen des Rahmenmodells (Abb. 1) direkt auf die Informiertheit wirken, höher mit den Informiertheitskriterien korrelieren als solche, von denen angenommen wurde, daß sie nur vermittelt über andere Variablen wirken. Insofern entsprechen die bisherigen Ergebnisse den Annahmen des Rahmenmodells.
Tab. 3: Schrittweise Diskriminanzanalysen für Informiertheitskriterien.
4.2 Multiple Prädiktion
4.3 Überprüfung des Rahmenmodells der Querschnittsdaten
der
Informiertheit
Um einen Überblick über die gemeinsame Erklärungskraft aller Prädiktoren für die Informiertheit zu gewinnen, wurden schrittweise Diskriminanzanalysen (vgl. TATSOUKA, 1971; MCLAUGHLIN, 1980) mit IPI-1 bzw. IPI-2 als Kriterium gerechnet. Die Variablen wurden Schritt für Schritt in die Analyse eingeführt und zwar zuerst die entsprechend den Annahmen des Rahmenmodells nur indirekt wirkenden. Tabelle 3 weist für jeden Indikatorblock den Zuwachs an erklärter Varianz bei seiner Hinzunahme in die Analyse aus (dabei hängt der Varianzzuwachs von der Reihenfolge ab). Tabelle 3 zeigt, daß die Indikatoren für die spezielle Informationssuche (ZNP, BVP) die höchste Erklärungskraft haben, auch wenn alle anderen Variablen schon in Betracht gezogen wurden. Ferner zeigt sich die deutliche Abnahme der Prädiktionsleistung, wenn IPI-2 als Kriterium verwendet wird, dies könnte auf den oben erläuterten möglichen Befragungseffekt zurückzuführen sein. Immerhin können durch
Informiertheitskriterium: N': Variablen Mittl. Altersgruppe (MAG-1) Geschlecht (SEX-1) Status (I AS-1, IBS-1, IES-1) Subj. Betroffenheit (GIU-1,GBB-1) Akt. Informationsverhalten (HLP-1, HDP-1) Spez. Informationssuche 11 (ZNP-1, BVP-1) Spez. Informationssuche t2 (ZNP-2, BVP-2) 2
R:
IPI-1 82/93
IPI-2 65/110
dR 2
dR2
6 1 6 7
0 1 3 3
3
2
29
-
-
52
14 23
2
dR : Zuwachs an erklärter Varianz. ' Es ergeben sich verringerte Fallzahlen, da das Programm fehlende Werte nur fallweise ausschließt.
IPI-1 52% und durch IPI-2 23% der Varianz in der jeweiligen Diskriminanzfunktion aufgeklärt werden.
anhand
Die Überprüfung der im Rahmenmodell behaupteten Kausalstruktur mit Hilfe von LISREL kann hier aus Platzgründen nicht in allen Schritten vorgestellt werden. Das LISRELModell wurde zunächst analog dem Rahmenmodell aufgebaut, dann wurde versucht, die Anpassung zwischen Daten und Modell durch sinnvolle Modellveränderungen zu verbessern. Ausgangspunkt des Verfahrens stellt die Korrelationsmatrix der Indikatoren dar. Entsprechend dem unterschiedlichen Skalenniveau der Indikatoren (Intervallskala bzw. Dichotomien) enthält die Korrelationsmatrix ProduktMoment-Korrelationen bzw. als Derivate davon (vgl. BORTZ, 1977) Phi-Koeffizienten und punktbiseriale Korrelationen. Eine solche «gemischte» Korrelationsmatrix ist aller Erfahrung nach dann unproblematisch, wenn die dichotomen Variablen annähernd 50 : 50 verteilt sind. Dies ist bei allen Dichotomien außer bei den extrem verteilten Variablen BVP-1 und
128
Prester: Bedingungen der Informiertheit
B V P - 2 der Fall; hier unterschätzen vermutlich die punktbiseriale Korrelation und der PhiKoeffizient die Zusammenhänge zu anderen V a r i a b l e n ( v g l . h i e r z u G U I L F O R D , 1965). A u f -
grund des geringen Skalenniveaus der meisten Daten wurde ferner als Methode der Parameterschätzung die «unweighted least square-Methode» ( U L S ) gewählt, die keine Verteilungsannahmen macht, und nicht das « m a x i m u m likelihood-Schätzverfahren»
(vgl.
JÖRESKOG
&
S Ö R B O M , 1981).
In Abbildung 2 ist das endgültige L I S R E L Modell dargestellt. D i e theoretischen Konstrukte sind umkreist, die empirischen Indikatoren rechteckig umrandet. Die Koeffizienten für die Beziehungen «Konstrukt —»Indikator»
MESSMODELL
SEX-1
Abbildung 2 zeigt, daß die Struktur des Rahmenmodells gut mit den Daten verträglich ist, mit einer Abweichung: das Modell wird besser, wenn «mittlere Altersgruppe» direkt auf « W i s sen» wirkt und nicht (wie im Rahmenmodell vorgesehen) auf «aktives Informationsverhalten». In theoretischer Hinsicht würde das bedeuten, daß bei gleichem Informationssucheverhalten Personen mittleren Alters etwas
STRUKTURMODELL
Meßfehler Indikatoren (Varianzen) (.00)
und «Konstrukt —» Konstrukt» stehen in standardisierter Form an den jeweiligen Pfeilen; Korrelationen sind durch das Symbol wiedergegeben. D i e unerklärte Varianz der endogenen Konstrukte steht in Klammern über den Konstrukten, die Meßfehlervarianz in Klammern neben den Indikatoren.
exogene Konstrukte
1.0
endogene Konstrukte (Residualvarianzen)
MESSMODELL Indikatoren
Geschlecht V
Index der Anpassungsgüte: . 9 8 Mittlere quadratische Abweichung zwischen empirischen und rückgerechneten Korrelationen: . 0 5 Abb. 2: Querschnitt-LISREL-Modell 1: Bedingungen des Wissens zu 11.
Meßfehler (Varianzen)
129
Zeitschrift für Sozialpsychologie 1984, 15, 120-135
mehr wissen als Jüngere und Ältere. Warum dies so ist, läßt sich mit dem hier vorliegenden Variablensatz nicht klären. Das Modell läßt ferner eine Korrelation zwischen «Status» und «subjektive Betroffenheit» zu; dies deshalb, weil aufgrund von Eigenheiten der Untersuchungsgebiete ein Zusammenhang zwischen Status und Nähe zur Bahn besteht. Alle Strukturkoeffizienten sind signifikant von Null verschieden (t-Test) und so groß, daß von substantiellen Beziehungen ausgegangen werden kann. Dieses Modell klärt 88% der Varianz in der latenten Variable «Wissen» auf. Falls die Struktur des Rahmenmodells Gültigkeit hat, muß das gleiche Modell auch bei
MESSMODELL Meßfehler Indikatoren (Varianzen)
Verwendung der Zweitmessungen für «spezielle Informationssuche» und «Wissen» empirisch angemessen sein. Abbildung 3 zeigt dieses LISREL-Modell. Die Struktur von Modell 1 ist auch mit den Daten aus t2 vereinbar, doch zeigen sich deutlich schwächere Beziehungen zu «Wissen t2» als zu «Wissen t l » , was sich auch darin bemerkbar macht, daß dieses Modell nur 36% der Varianz in der latenten Variablen «Wissen» aufklärt. Tabelle 4 demonstriert die Anpassungsgüte der Modelle. Und zwar werden für Modell 1 und Modell 2 die empirisch vorliegenden Korrelationsmatrizen (obere Dreiecksmatrizen)
STRUKTURMODELL exogene Konstrukte
endogene Konstrukte (Residualvarianzen)
MESSMODELL Indikatoren
Index der Anpassungsgüte:.98 Mittlere quadratische Abweichung zwischen empirischen und rückgerechneten Korrelationen: .05 Abb. 3: Querschnitt-LISREL-Modell 2: Bedingungen des Wissens zu t2.
Meßfehler (Varianzen)
Prester: Bedingungen der Informiertheit
130
— CU 0 so 0 0 fN O cnfN • 1 VO 00 XQO. - O fN VO O.fN vi O O 0 c