233 101 25MB
German Pages 383 [384] Year 2004
Aria A d l i Grammatische Variation und Sozialstruktur
studia grammatica Herausgegeben von Manfred Bierwisch unter Mitwirkung von Hubert Haider, Stuttgart Paul Kiparsky, Stanford Angelika Kratzer, Amherst Jürgen Kunze, Berlin David Pesetsky, Cambridge (Massachusetts) Dieter Wunderlich, Düsseldorf
studia grammatica 58 Grammatische Variation und Sozialstruktur
Akademie Verlag
ISBN 3-05-004102-1 ISSN 0081-6469 © Akademie Verlag GmbH, Berlin 2004 Das eingesetzte Papier ist alterungsbeständig nach DIN/ISO 9706. Alle Rechte, insbesondere die der Übersetzung in andere Sprachen, vorbehalten. Kein Teil des Buches darf ohne Genehmigung des Verlages in irgendeiner Form - durch Photokopie, Mikroverfilmung oder irgendein anderes Verfahren - reproduziert oder in eine von Maschinen, insbesondere von Datenverarbeitungsmaschinen, verwendbare Sprache übertragen oder übersetzt werden. All rights reserved (including those of translation into another languages). No part of this book may be reproduced in any form - by photoprinting, microfilm, or any other means - nor transmitted or translated into a machine language without written permission from the publishers. Druck und Bindung: Medienhaus Berlin Printed in the Federal Republic of Germany
Inhaltsverzeichnis Abbildungsverzeichnis
8
Einleitung
10
TEIL I GRAMMATIKTHEORIE UND SOZIALE VARIATION - EINE THEORETISCHE UND METHODOLOGISCHE HERAUSFORDERUNG
13
1 1.1 1.2 1.3 1.4 2 2.1 2.2 2.3 3 3.1 3.2 3.3 3.4
Linguistische Forschung im Widerstreit von Homogenitätsannahme und Variationsphänomenen Soziale grammatische Variation: Eine theoretische Herausforderung Beispiele aus der variationslinguistischen Literatur zum Französischen Die Frage des Datentyps und der Datenverwendung für die Theorie Grundzüge dieser empirischen Studie
15 15 25 31 41
Syntaktische Problematik: Ausgewählte Bewegungsphänomene französischer Interrogativa Wortstellungsvarianten: Wi-in-situ und stilistische Inversion Zum schwierigen Thema der Optionalität Subjekt-Objekt-Interrogativa
55 55 61 68
Operationalisierung von Grammatikalität und Komplexität Qualitative Grammatikalitätsurteile in halbstandisierten Interviews Messung gradierter Grammatikalitätsurteile Messung der kognitiven Verarbeitung Reliabilitätsanalysen der Grammatikalitätsbeurteilung und der Lesezeitmessung
77 77 81 97 103
TEIL II DAS EINHEITLICHE FUNDAMENT - DATENANALYSE AUS DER SICHT EINER HOMOGENEN GRAMMATIK
113
4 4.1 4.2
115 115 123
Statistische Grundlagen Methodologie inferenzstatistischen Vorgehens Prinzipien der Varianzanalyse
6
5 5.1 5.2
Inhaltsverzeichnis
5.3 5.4
Auswertung der WortstellungsVarianten im Interrogativbereich Ergebnisse der gradierten Grammatikalitätsbeurteilung Ergänzende qualitative Interviews zum w/i-in-situ-Phänomen: Evidenz gegen LF-Bewegung Das Verarbeitungsmoment: Gibt es Performanzpräferenzen? Die stilistische motivierte Wahl der Wortstellungsvariante
137 149 153
6 6.1 6.2 6.3
Auswertung der Subjekt-Objekt-Interrogativa Ergebnisse der gradierten Grammatikalitätsbeurteilung Die Geometrie der Grammatikalitätsverläufe: Trendtests und Kontrasteffekte Subjekt-Objekt-Kontrast, дие-дш-Problematik und Parenthesestruktur
155 155 163 165
TEIL III DER SCHRITT ZUR VARIATION - EINFLUSS DER SOZIALEN MERKMALE AUF DIE GRAMMATIKALITÄTSDATEN
177
7
133 133
7.1 7.2 7.3
Lebensstil und soziokulturelle Theorie Bourdieus als variationslinguistische Untersuchungsperspektive Der lebensstilsoziologische Ansatz Bourdieus soziokulturelle Theorie Sprachliche Variation aus der Sicht der soziokulturellen Theorie Bourdieus
179 180 188 200
8 8.1 8.2 8.3
Operationalisierung der Sozialstruktur Fragebogenstruktur und Erhebung der sozialen Merkmale Faktorenanalyse der Lebensstildaten Clusteranalytische Bildung der vier Lebensstiltypen
204 204 209 224
9 9.1 9.2 9.3
Das innere Gefüge der Sozialstruktur Zur Methode: Ausführungen zu den angewendeten statistischen Verfahren Prägnante mehrdimensionale Merkmalskombinationen mit dem Lebensstil Zusammenhang zwischen dem Lebensstil und den soziodemographischen Merkmalen Zusammenhang unter den soziodemographischen Merkmalen Darstellung des Gesamtzusammenhangs in einer kanonischen Korrelation
239 239 250
Soziale Variation der Wortstellungsvarianten Zur Methode: Festlegung der α- und ß-Fehlerniveaus und der Effektstärke Auswertung der Rolle des Lebensstils Auswertung der Rolle der soziodemographischen Merkmale Ausnahmen von der Regel oder der selektive wirkende normative Einfluss: Мг-in-situ vs. w/z-Bewegung Zusammenfassung
275 276 281 286
9.4 9.5 10 10.1 10.2 10.3 10.4 10.5
256 264 273
290 294
Inhaltsverzeichnis
11 11.1 11.2 11.3 11.4 11.5 12 12.1 12.2 12.3 12.4
12.5
7
Soziale und kognitive Variation der Subjekt-Objekt-Interrogativa Auswertung der Rolle des Lebensstil Auswertung der Rolle der soziodemographischen Merkmale Syntaktische Suboptimalität und die Rolle des Alters Ausnahmen von der Regel oder der selektiv wirkende normative Einfluss: Subjekt- vs. Objektfragen Zusammenfassung
295 297 301 306
Von Interaktionseffekten des Lebensstils zur Theorie Bourdieus Methodische Aspekte Wortstellungsvarianten und Interaktionseffekte des Lebensstils Subjekt-Objekt-Interrogativa und Interaktionseffekte des Lebensstils Weiterführende Analysen zu selektiven Beurteilungsmustern: Wi-in-situ vs. w/z-Bewegung
313 313 316 319
Variation bei wh-Fragen aus der Sicht der soziokulturellen Theorie Bourdieus
324
309 312
321
Ergebnis und Schlussplädoyer
331
Literatur
339
Anhang I: Beispielkopien des Grammatikalitätsbeurteilungs-Tests
359
Anhang II: Bildschirmkopien der Lesezeituntersuchung
363
Anhang III: Soziokultureller Fragebogen (mit Methodenfragen)
367
Anhang IV: Experimentelle, schriftliche Instruktionen und Materialien
374
Abbildungsverzeichnis 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37
Ergebnisse aus Coveney (1996: 234) zur Variation bei w/i-Fragen Graphische Illustration der Anfangshypothesen Stichprobenaufteilung je nach untersuchtem Phänomenbereich und Methode „Ich habe nicht nur große, sondern auch kleine Unterschiede zwischen den Sätzen gespürt." „Ich fand es nicht schwierig, mir ein Urteil über die verschiedenen Sätze zu bilden." Reliabilitätsanalysen im Vergleich Teststärkeverlauf bei steigendem Stichprobenumfang Zweifaktorieller varianzanalytischer Plan für Wortstellungsvarianten Zweifaktorieller varianzanalytischer Plan für Subjekt-Objekt-Interrogativa Subjekt-Objekt-Fragen Subjekt-Objekt-Fragen Lineare, quadratische und kubische Trendkomponenten Subjektfragen mit polynomialer Regression 3. Ordnung Beurteilungskonsistenz bei den Subjekt-Objekt-Fragen Prinzip der faktorenanalytischen Datenreduzierung Screeplot der Faktoren zur Aktivitätenskala Faktorenanalytische Komponentenmatrix der Lebensstil-Skala 'Aktivitäten' Faktorenanalytische Komponentenmatrix der Lebensstil-Skala 'Medien' Prinzip der clusteranalytischen Gruppenbildung Struktogramm der hierarchischen Clusteranalyse Clusterumfänge Profile der vier Lebensstil-Cluster auf den neun Faktoren Clusterzentren der endgültigen Lösung Diskriminanzanalytische Strukturmatrix Geschlechterverhältnis der Lebensstile Altersverteilung der Lebensstilgruppen Erlangter Bildungsabschluss nach Lebensstil Abiturtypen nach Lebensstil Studienrichtungen nach Lebensstil Erlangter Bildungsabschluss nach Geschlecht Studienrichtungen nach Abiturtyp Streudiagramm Alter χ Ausbildungsgrad mit Regressionsgerade Abiturtypen nach Geschlecht Studienrichtungen nach Geschlecht Mittlerer Ausbildungsgrad nach Abiturtyp Mittlerer Ausbildungsgrad nach Studienrichtung Interkorrelationsstruktur der sozialen Merkmale
28 43 53 95 96 108 117 135 157 158 159 163 164 167 212 215 221 223 224 228 229 230 231 237 256 258 260 262 263 264 265 267 269 270 271 272 273
Abbildungsverzeichnis 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58
Dreifaktorieller varianzanalytischer Plan zu interrogativen Wortstellungsvarianten und Lebensstil Beurteilung der invertierbaren Objektfragen nach Lebensstiltypen Beurteilung der wft-Fragen nach Lebensstiltypen Dreifaktorieller varianzanalytischer Plan für Subjekt-Objekt-Fragen und Lebensstil Beurteilung von subjektinitialen Fragesätzen für zwei Altersgruppen Vierfaktorieller varianzanalytischer Plan zu interrogativen Wortstellungsvarianten mit Lebensstil und Abiturtyp Dreifaktorieller varianzanalytischer Plan der Subjekt- und Objektfrage mit parenthetischer Konstituente mit Lebensstil und Abiturtyp Variation in der Beurteilung von wA-Fragen vor dem Hintergrund von Bourdieus Theorie Graphische Illustration der empirischen Zusammenhänge Beispiel a, Beurteilung einer stilistischen Inversion Beispiel b, Beurteilung einer w/i-in-situ-Struktur Verifikationssatz zum Experimentalsatz aus Abbildung 48 Satzstreifen aus der Instraktions- und Trainingsphase: Kontextsatz und vier zu bewertende Interrogativstrukturen Referenzsatzbewertung in der Instruktions- und Trainingsphase Kontextsatz mit Fixationskreuz Experimentalsatz Drei mögliche Verifikationsantworten zur Auswahl Feedback nach korrekter Beantwortung Feedback nach inkorrekter Beantwortung Füllersatz mit Nichtwort Feedback nach nicht-identifiziertem Nichtwort
9
282 283 284 297 306 314 319 329 337 359 360 361 362 362 363 363 364 364 365 365 366
Danksagung Die vorliegende Arbeit ist eine überarbeitete Fassung meiner Dissertation, die im Juli 2003 an der Universität Tübingen verteidigt wurde. An ihrer Verwirklichung haben viele Personen wesentlichen Anteil gehabt. Die Rolle, die mein Hauptbetreuer Jürgen M. Meisel gespielt hat, kann nicht hoch genug eingeschätzt werden. Bei ihm fand ich die richtige Kombination aus Optimismus, sachlicher Kritik und stetem Interesse am Fortgang der Arbeit. Ich möchte auch besonders Wolfgang Sternefeld, Marga Reis, Peter Koch und Josef Held danken, die die Entwicklung dieses Projekts gefördert haben und wichtige Gesprächspartner waren. Gleichzeitig fand ich im Tübinger Sonderforschungsbereich „Linguistische Datenstrukturen" ein Umfeld, in dem sich Ideen entwickeln und die alltägliche Arbeit produktiv durchgeführt werden konnte. Ich erlebte eine wirklich großzügige Bereitschaft vieler Freunde und Kollegen, Teile des Manuskripts Korrektur zu lesen, wobei sie mir ganz entscheidende inhaltliche Anregungen gaben.
Einleitung Üblicherweise hält man entweder eine grammatiktheoretische oder eine soziolinguistische Arbeit in den Händen. Die vorliegende Arbeit dagegen versucht einen Brückenschlag zwischen beiden Ansätzen anhand ausgewählter Phänomene der französischen Interrogativsyntax vorzunehmen. Die Idee entsprang verschiedenen Beobachtungen: Zum einen meinte ich dazu innerhalb der Grammatiktheorie ein erfreulicherweise - steigendes Interesse an der Untersuchung des Verhältnisses zwischen Theorie und Empirie und den hiermit verbundenen Fragen der Datengüte und des Einflusses externer Faktoren ausmachen zu können. Diese Perspektive wurde zweifellos durch meine Mitarbeitertätigkeit im von Wolfgang Sternefeld geleiteten Projekt „Suboptimale syntaktische Strukturen" des SFB 441 „Linguistische Datenstrukturen: Theoretische und Empirische Grundlagen der Grammatikforschung" geprägt. Zum anderen bemerkte ich, dass diese Fragestellung für mein reges Interesse an der empirischen Methodenlehre eine spannende und - wie ich nie bezweifelte auch dankbare Herausforderung darstellen würde. Ein solches Unterfangen beginnt immer mit der Operationalisierung seiner theoretischen Konzepte in Form messbarer Einheiten. Diese empirische Umsetzung mit quantifizierbaren Größen ebnete den Weg zu zwei unterschiedlichen, in dieser Arbeit aber zusammengeführten Punkten: Zum einen musste die Frage nach der Messbarkeit von Grammatikalitätsdaten weiterentwickelt werden, welches ein bisher noch wenig erforschtes Gebiet darstellt. Diese Datengrundlage wurde durch Lesezeitmessungen und qualitative Interviewerhebungen erweitert. Zum anderen stellte ich mir die Frage, warum Arbeiten aus der Variationellen Soziolinguistik eigentlich fast immer dieselben soziodemographischen Merkmale betrachten, und warum die Entwicklung in den modernen Sozialwissenschaften nicht genauer zur Kenntnis genommen wird. Gerade wenn der Einfluss sozialer Faktoren auf sprachliche Merkmale analysiert wird, sollte die soziale Dimension der Studie auch auf einer plausiblen Gesellschaftstheorie beruhen. Einen viel versprechenden Ansatz sah ich in der soziokulturellen Theorie von Pierre Bourdieu. Dies führte mich zur Wahl des Lebensstilkonzepts als zentralem sozialem Merkmal Dieses Vorgehen schien mir auch dadurch gestützt, dass Pierre Bourdieu seine Theorie vor dem Hintergrund der modernen französischen Nachkriegsgesellschaft entwickelte und die in der vorliegenden Arbeit untersuchten sprachlichen Phänomene aus der französischen Interrogativsyntax stammen. Die Arbeit analysiert zunächst die Daten aus der Sicht einer homogenen Grammatik und macht erst dann den Schritt zur Untersuchung der Variation. Sie folgt darin der natürlichen Richtung vom Einfachen zum Komplexen. Es ist schon viel getan, wenn man gründliche empirische Analysen durchführt. In diesem Sinne wird hier nicht das Ziel verfolgt, eine umfassende Theorie zu konstruieren, in der wesentliche Aspekte der Syntaxtheorie und der Sozialtheorie verkoppelt werden. Vielmehr wird die Frage nach
12
Einleitung
dem Zusammenhang zwischen Grammatik und sozialer Variation konkret am empirischen Material erörtert. Dies führt allerdings dazu, dass man bestimmte Grundannahmen problematisieren muss: Ist es z.B. sinnvoll, das Konzept der Autonomie der Syntax oder das Konzept des idealen Sprecher / Hörers so auszulegen, dass Zweifel an der Datengüte der Introspektion gar nicht mehr möglich oder gar zulässig sind? Die Ergebnisse dieser Studie dokumentieren zumindest bedenkenswerte Einflüsse von externen Faktoren. Die soziokulturelle Theorie von Bourdieu erlaubt ein Verständnis dieser Ergebnisse im Kontext einer elaborierten Gesellschaftstheorie. Warum beschränkt man sich in der Grammatikforschung, wenn auf übergeordnete Paradigmen verwiesen wird, nur auf die Kognitionswissenschaft komputationeller Prägung? So wichtig deren Erkenntnisse sind, so stößt ihre Erklärungskraft manchmal auch an Grenzen. Wichtig war mir, im Verlaufe dieser Arbeit die Bedeutung und die korrekte Anwendung der empirischen Methoden plausibel darzustellen. Diese Arbeit entsprang, wie schon gesagt, einem empirischen Ansatz. Die Statistik ist - von vielen unbemerkt - zu einer (wenn auch rudimentären) Brücke zwischen einer ganzen Reihe von Disziplinen geworden: Daten sind nun einmal Daten und einem Test ist es gleichgültig, wofür die Zahlen eigentlich stehen. In empirischen Methoden steckt für die moderne Linguistik noch viel brachliegendes Potential. Die Formeln haben sich zum Glück nicht gesträubt, die grammatischen und sozialwissenschaftlichen Daten gemeinsam zu verrechnen. Möge der Leser diesem Weg im Verlauf der Lektüre ebenfalls folgen.
Teil I
Grammatiktheorie und soziale Variation - eine theoretische und methodologische Herausforderung
1
Linguistische Forschung im Widerstreit von Homogenitätsannahme und Variationsphänomenen
Untersuchungen zur sozialen grammatischen Variation sind bisher sehr selten. Einer der Gründe hierfür liegt in den diversen Schwierigkeiten, mit denen solche Untersuchungen konfrontiert sind. Eine Auseinandersetzung mit diesen Problemen ist nicht nur im Sinne der theoretischen Weiterentwicklung von Grammatik- und Variationsforschung, sondern auch eine Notwendigkeit für die Planung von empirischen Untersuchungen mit gut begründeten theoretischen Hypothesen. Eines der augenscheinlichsten Probleme betrifft die Frage der Definition von Variation. Dies manifestiert sich an der Heterogenität des Variationsbegriffs, an dem sich mittlerweile die Linguistengemeinschaft fast wie an einem Prisma in verschiedene paradigmatische Couleurs bricht. Gerade generative Syntaktiker und variationelle Soziolinguisten scheinen, um es etwas vereinfacht und plakativ zu sagen, zwei entgegengesetzte Punkte eines Spektrums zu besetzen. Erstere sind in ihren Bemühungen zur Formulierung einer adäquaten Grammatiktheorie vor allem vom Universalitätspostulat geleitet, während letztere ihre Perspektive vornehmlich auf die von verschiedenen internen und externen Faktoren determinierte Diversität richten. Aus beiden grundsätzlichen Sichtweisen ergeben sich dann auch Theorien mit verschiedenen Schwerpunkten.1 Gelegentlich sind allerdings auch Bemühungen zu beobachten, die Definitionen und die grundsätzlichen Sichtweisen der jeweils „Anderen" kennen zu lernen, um die Gefahr des Aneinander-Vorbeiredens (wenn überhaupt miteinander geredet wird) zu reduzieren.
1.1
Soziale grammatische Variation: Eine theoretische Herausforderung
Hinsichtlich dieser unterschiedlichen Sichtweisen ist vorweg zu bemerken, dass generative Grammatiker in der Regel einen kognitiven Ansatz verfolgen, der vom Postulat der psychologischen Realität der Universalgrammatik und des idealen Sprecher / Hörers geprägt ist (s. z.B. Fanselow & Felix, 1990a). Variationelle Soziolinguisten fokussieren auf externe Faktoren, die das Sprachverhalten determinieren. Sie 1
Die Konstitution unterschiedlicher Sichtweisen auf menschliche Eigenschaften und Fähigkeiten ist dabei durchaus nicht ein spezifisches Phänomen der heutigen Linguistik, sondern auch in anderen erfahrungs- und humanwissenschaftlichen Disziplinen zu finden. So existiert innerhalb der Psychologie auf der einen Seite das Teilgebiet der Allgemeinen Psychologie, deren Forschungsgegenstand allgemeingültige Gesetzmäßigkeiten sind, und auf der anderen Seite die Teilgebiete der Differentiellen Psychologie und der Sozialpsychologie, die Unterschiede zwischen Individuen und Gruppen berücksichtigen und untersuchen. Diese im Grunde plausible Aufteilung führt dort ebenfalls zu Schwierigkeiten (cf. Schönpflug, 1999).
16
I. Grammatiktheorie und soziale Variation
suchen die Heterogenität zwischen verschiedenen Gruppen der Sprechergemeinschaft, so dass ihnen das universalgrammatische Konzept des idealen Sprecher / Hörers häufig ein Dorn im Auge ist. Klein (1987) verweist diesbezüglich auf die Kluft, die zwischen der universalgrammatischen und der variationellen Sicht entstanden ist. Bierwisch (1987) versucht dieser Tatsache durch die Annahme einer heterogenen Kompetenz gerecht zu werden, die sich aus dem eigentlichen sprachlichen Wissen und aus dem variationslinguistischen Wissen (z.B. zu stilistischer, sozialer oder regionaler Markierung) zusammensetzt. Letzteres bezeichnet er als konnotative Kompetenz. Beide Wissenssysteme sind durch Zuordnungsregeln miteinander verbunden (s. hierzu Abschnitt 5.4). 1.1.1
Zur Heterogenität des Variationsbegriffs
Diese grob skizzierten paradigmatischen Unterschiede finden ihren Niederschlag in den jeweiligen Definitionen des Begriffs Variation. Würde es sich nur um Definitionsunterschiede zwischen Teilgebieten der Linguistik handeln, so könnte man dies noch als ein nachvollziehbares und häufiger beobachtbares Phänomen in der Entwicklung einer Wissenschaft bezeichnen (obwohl auch dies für einen Austausch zwischen Teilgebieten nicht immer wünschenswert ist). Problematisch wird es aber zweifellos, wenn schon innerhalb eines Teilgebiets Vieldeutigkeit und Uneindeutigkeit notorisch zu werden drohen. In Bezug auf die Variationslinguistik bemängelt Cheshire (1987: 260) zurecht: "There is considerable inconsistency among different writers in their use of the term .syntactic variation'". Die wichtigsten Verwendungsweisen des Terminus „Variation" fasse ich in folgender Dreiteilung zusammen: (i) Variation zwischen Sprachen, (ii) satzinterne, strukturelle Variation und (iii) sprachliche Variation zwischen Gruppen (oder Individuen) aufgrund externer (sozialer und/oder kognitiver) Faktoren. Eine solche explizite Auflistung hilft zum einen bei Literaturdurchsichten trotz der gelegentlich verwirrenden Polysemie den Überblick zu behalten. Zum anderen dient sie aber, wie in Abschnitt 1.1.3 näher ausgeführt wird, auch der genaueren Beschreibung der spezifischen Probleme bei der Untersuchung sozialer grammatischer Variation. In der Generativen Grammatik versteht man „Variation" meistens im Sinne von (i). Bei der Beschäftigung mit Variation geht es dort also um die sprachvergleichende Untersuchung universalgrammatischer Prinzipien und typologische Unterschiede zwischen Sprachen oder Dialekten. In diesem Sinne ist auch die Aussage von Haie (1997: 72) zu verstehen: „We cannot learn what we seek to know about that which is invariant in grammar without studying that which is variable in it. We need linguistic diversity." Obwohl sich Syntax und Soziolinguistik in der Forschungspraxis selten berühren, haben sie doch ein gemeinsames Problem: den adäquaten Umgang mit und die Definition von satzinterner, struktureller Variation, also Bedeutung (ii). Die schwierige Frage ist, aufgrund welcher Kriterien und Prinzipien man zwei (oder mehr) syntaktische Formen als Varianten ansehen kann.
1. Widerstreit von Homogenitätsannahme und Variationsphänomenen
17
Diese Frage ist zugleich mit dem Thema der syntaktischen Optionalität verbunden, da es sich bei dieser um eine Wahlmöglichkeit zwischen strukturellen Varianten handelt. Die theoretische Einbindung dieses Phänomens ist allerdings seit dem Minimalistischen Programm sehr schwierig geworden. Meines Erachtens sprechen, um ein konkretes Beispiel zu nennen, gute Gründe dafür, im Französischen Interrogativa mit Bewegung des w/i-Elements und Interrogativa mit w/z-in-situ als optionale Varianten zu bezeichnen (dieses Phänomen wird in den Abschnitten 2.1 und 2.2 eingehender diskutiert). Aus einer allgemein soziolinguistischen (oder auch sozialwissenschaftlichen) Perspektive bezeichnet der Begriff der syntaktischen Variation in erster Linie sprachliche Unterschiede zwischen sozialen Gruppen, also Bedeutung (iii). Es handelt sich hierbei weder um die sprachvergleichende noch um die satzstrukturelle Perspektive, sondern um die Perspektive auf die Diversität innerhalb einer Sprachgemeinschaft. Diese Definition des Variationsbegriffs, also die Frage nach dem Einfluss externer Faktoren, ist in der Syntaxtheorie kaum anzutreffen, wohl nicht zuletzt aufgrund der Gefahr der Bildung eines inneren Widerspruchs mit der Homogenitätsannahme. Das seit Labov (1963) rezipierte Konzept der linguistic variable, im Deutschen entweder mit „sprachliche Variable" (z.B. Dittmar, 1997) oder „linguistische Variable" (z.B. Lieb, 1998) wiedergegeben, erfordert nun die Kombination der Bedeutungen (ii) und (iii). Ihre Anwendung in der variationeilen Soziolinguistik (variational sociolinguistics) führt im Bereich der Syntax zur Kombination der satzstrukturellen Variation und der Variation zwischen sozialen Gruppen. Die sprachliche Variable bezeichnet eine strukturelle Einheit (structural unit) mit zwei oder mehr Varianten, die mit anderen sprachlichen und / oder sozialen Variablen korrelieren. Diese Varianten unterscheiden sich dabei nicht in der Bedeutung, sondern in der Form, d.h. sie sind „alternative ways of saying the same thing" (vgl. Lieb, 1998, für eine formaltheoretische Definition verbunden mit einer Uminterpretierung). Das Konzept der sprachlichen Variable hat sich innerhalb der variationellen Soziolinguistik insbesondere für Phänomene aus der Phonetik und Phonologie bewährt, zu denen bisher auch die meisten Untersuchungen durchgeführt wurden (vgl. hierzu Cheshire, 1987: 259). In diesem Fall werden auf der innersprachlichen Ebene nicht satzstrukturelle, sondern phonologische Varianten (z.B. Allophone) untersucht. Bezüglich sprachbeschreibender Ebenen jenseits der Phonologie, oder „above phonology", wie es Sankoff (1980) in ihrer Auflistung von Anwendungsbeispielen nennt, sind allerdings kritische Debatten in der soziolinguistischen Literatur geführt worden (cf. Labov, 1978; Lavandera, 1978; Winford, 1984 und 1996; Romaine, 1984; Cheshire, 1987). Die genannten Autoren diskutieren alle die Frage, ob die theoretische und methodische Übertragung des Labov'sehen Ansatzes auf diese Ebenen gerechtfertigt sei. Dabei hatte Labov (1972) einige Jahre vorher noch gefordert, Untersuchungen zur variationellen Linguistik nicht nur auf phonetische und phonologische Variablen zu beschränken. Armstrong (2001: 121) schreibt diesbezüglich: „The analysis of variation on the morpho-syntactic levels raises not only serious methodological difficulties, but also very fundamental issues of sociolinguistic definition."
18
I. Grammatiktheorie und soziale Variation
Hat man sich erst mal Klarheit über die verschiedenen Verwendungsweisen des Begriffs der Variation in den unterschiedlichen Teilgebieten der Linguistik verschafft was nicht alle im letzten Absatz zitierten Autoren leisten - so kann man den Ursprung der Kontroversen hinsichtlich der theoretischen und methodischen Übertragung des variationslinguistischen Ansatzes auf die Syntax besser lokalisieren: Eine grammatiktheoretisch plausible und soziolinguistisch sinnvolle Definition von satzinterner struktureller Variation in der Syntax, also Bedeutung (ii) des Variationsbegriffs, stellt den wirklich schwierigen Punkt dar. Es handelt sich hierbei durchaus nicht um ein Problem, mit dem bloß Variationslinguisten zu kämpfen hätten. Die formale Grammatiktheorie, zumindest die in dieser Arbeit verwendete Generative Grammatik, bietet hierfür bisher ebenfalls keine Lösungsansätze. Es handelt sich also um eine Schwierigkeit grundsätzlicher Art, die nicht ein wie auch immer geartetes, spezifisches Problem der variationslinguistischen Begrifflichkeit ist. Dieses Problem führt, je nach linguistischem Teilgebiet, zu spezifischen Debatten: In der Grammatiktheorie manifestiert sie sich in Form häufig unbefriedigender Erklärungsansätze für das Phänomen optionaler syntaktischer Varianten; in der Variationslinguistik führt sie zur ebenso notorisch problematischen Frage, was eigentlich eine sprachliche Variable in der Untersuchung syntaktischer Variation sei. Im Folgenden wird diese Problematik aus variationslinguistischer Sicht erörtert (die Thematik der Optionalität aus grammatiktheoretischer Perspektive werde ich in Abschnitt 2.2 bei der Darstellung der untersuchten syntaktischen Phänomenbereiche behandeln). 1.1.2
Zur Skepsis in der Soziolinguistik gegenüber Variation in der Syntax
Quantitative variationslinguistische Untersuchungen zur Syntax sind bis auf einige Ausnahmen bisher, wohl nicht nur aufgrund dieser theoretischen Herausforderungen, kaum durchgeführt worden. Einer der Gründe, der zu dieser Entwicklung beigetragen haben mag, ist die weitverbreitete Annahme, dass sich soziale Effekte auf der Ebene der Syntax entweder gar nicht oder in kaum erkennbarem Ausmaß zeigen. Generative Grammatiker haben bekanntlich theorieinterne Gründe für ihre Skepsis, auch wenn eine solche Ausblendung von möglichen Einflussfaktoren letztlich auch nicht dem Interesse einer empirisch soliden Syntaxtheorie dient (s. Abschnitt 1.3.2). Auf der Seite der Soziolinguistik lässt sich diese Skepsis jedoch nicht nachvollziehen. Hudson (1996: 45) postuliert etwa eine allgemeine, in gewisser Hinsicht universale Tendenz der Unterdrückung von grammatischer Variation bei gleichzeitiger Verstärkung phonologischer Variation in einer Sprache. Dies leitet er aus etwas skurril anmutenden sprachsoziologischen Vorstellungen ab, die den Ebenen der Phonologie und der Syntax unterschiedliche soziale Funktionen zuweisen. Er schreibt hierzu: „Syntax is the marker of cohesion in society, with individuals trying to eliminate alternatives in syntax from their language. [...] Pronunciation reflects the permanent social group with which the speaker identifies. This results in a tendency for individuals to suppress alternatives, but in contrast to the tendency with syntax, different groups suppress different alternatives in order to distinguish themselves from each other."
1. Widerstreit von Homogenitätsannahme und Variationsphänomenen
19
Armstrong (2001: 131) versucht die These, dass sich Variation in der Syntax nur in minderem Umfang zeige, mit dem Hinweis auf kommunikative Funktionen zu stützen: „Broadly speaking, one can suggest that the higher the level of the syntactic structure in question, the greater the extent to which meaning, and hence possible miscomprehension, are involved." Diese Aussage zeugt von den schon angesprochenen heterogenen und unklaren Verwendungen des Variationsbegriffs: Wenn Variation zwischen Dialekten gemeint ist, also die oben genannte Bedeutung (i), so würde es sich um ein allgemeines Problem der Idiomdistanz handeln, das keineswegs syntaxspezifisch ist. Wenn allerdings strukturelle Varianten gemeint sind, also Bedeutung (ii), so dürften Missverständnisse aus Variationsgründen allein deswegen nicht entstehen, weil die verschiedenen Formen semantisch hinreichend äquivalent sein müssen, um überhaupt als Varianten gelten zu können. Weiterhin begegnet man in der Literatur der Ansicht, dass die Syntax in irgendeiner Weise „kognitiver" als die Phonologie sei und sich daher nicht so gut dafür eigne, „Soziales" zu reflektieren. So etwa bei Armstrong (2001: 128): „While variable phonological features encode aspects of a speaker's social/regional origins, variable grammar may be evaluated as being more cognitive', in the sense of referring to a speaker's level of education, literacy, and therefore perhaps intelligence." Mir ist nicht klar, was Armstrong hier genau unter „kognitiv" und „sozial" versteht. Ich vermute, dass er mit sozialem Ursprung eine Unterscheidung nach traditionellen Klassen- und Schichtsystemen meint, und dass er andererseits Bildung vor allem intelligenztheoretisch betrachtet. Ich wüsste nicht, wie diese Argumentation anders zu entschlüsseln wäre. Sobald man jedoch den sozialen Aspekt der Bildung und den kognitiven Aspekt sozialstruktureller Konzepte mitbedenkt (s. hierzu Abschnitt 6), lösen sich solche scheinbaren Widersprüche auf. Armstrong hat hier offenbar eine Eigenschaft der Theorie, nämlich die kognitionswissenschaftliche Verortung der Grammatiktheorie, und die Ebene des menschlichen Verhaltens konfundiert. Auf solche fehlgeleiteten Analogieschlüsse in der Theoriebildung zu kognitiven Prozessen hat schon Gigerenzer (1988) hingewiesen. Als Beispiel nennt er den statistischen Signifikanztest, der ursprünglich als Instrument zur Theorieprüfung entwickelt wurde und später als inhaltlicher Bestandteil bestimmter Modelle auftrat, in denen menschlichen Verhaltensweisen inferenzstatistische Prozesse zugrundegelegt wurden. Zumindest ist Armstrong zugute zu halten, dass er seiner Aussage keine universale Gültigkeit zuspricht, sondern mit ihr vor allem die Situation im Englischen zu erklären versucht. Er weist auf die im Vergleich sehr unterschiedlichen Ausprägungen syntaktischer Variationsphänomene im Französischen hin und schließt daraus (S. 142): „Nonstandard grammar is not inevitably associated across languages with lack of education and therefore perceived low intelligence." Seine Idee ist, dass Sprecher des Englischen aufgrund eines Phänomens der sozialen Wahrnehmung, wohl ähnlich dem Effekt der sozialen Erwünschtheit (vgl. hierzu Abschnitt 3.1.2), auf die Verwendung von grammatischen Formen außerhalb des Regelbereichs der Standardsprache verzichten, weil dies als Zeichen ungenügender Bildung oder gar mangelnder intellektueller Begabung angesehen würde.
20
I. Grammatiktheorie und soziale Variation
Mit dieser spezifischen Situation im anglophonen Raum, die übergeneralisiert wurde, hängt möglicherweise die in der soziolinguistischen Theorie herrschende Skepsis gegenüber der Existenz hinreichend markanter syntaktischer Variation zusammen. Bisher wurden die meisten Studien im Paradigma der variationeilen Soziolinguistik für das Englische durchgeführt. Es wird behauptet, dass sich dort keine deutlichen, im normativen Sinne kodifizierten, stilistischen Kontraste zwischen syntaktischen Varianten zeigen.2 Diesbezüglich schreibt Cheshire (1987: 272): „When we consider variables that are more syntactic in kind, however, we often encounter variation that has been inconsistently codified [...] or variation that has not been codified at all. This is particularly likely for variation in the spoken language." In Anbetracht der normativen Einflüsse auf die französische Grammatik überrascht diese Aussage. Zudem werden stilistische Kontraste unter Einbeziehung kolloquialer Phänomene wie der w/i-in-situ-Struktur im Französischen sogar noch deutlicher. Armstrong (2001: 3) spricht daher hinsichtlich der Variation im Französischen im Vergleich zum Englischen - und dabei nicht nur auf die Grammatik bezogen - von „distinctive effects on the social-stylistic relationship in this language of the considerable standardisation and levelling pressures that have been exerted (and continue to be exerted) upon speakers of the French language". Es gibt im Bereich der Syntax zweifellos Bedarf an einschlägiger Forschung, worauf Cheshire selbst anschließend hinweist: „The social and stylistic distribution of variation of this type has not, as far as I am aware, been systematically investigated." Obwohl diese Aussage aus dem Jahre 1987 stammt, so ist sie im Grunde immer noch zutreffend. Die vorliegende Studie möchte einen Beitrag zu diesem Forschungsbereich leisten. 1.1.3
Das Definitionsproblem der sprachlichen Variable in der Syntax
Die in der Literatur diskutierten Probleme bezüglich der Untersuchung syntaktischer Variation mit Hilfe des Konzepts der sprachlichen Variable betreffen zwei denkbar grundständige Fragen: Erstens, welche Phänomene können wir als syntaktische Phänomene bezeichnen? Und zweitens, was macht zwei syntaktische Strukturen zu Varianten voneinander? Dieser zweite Punkt wird häufig mit der Frage, wann zwei Sätze als semantisch äquivalent anzusehen sind, in Zusammenhang gebracht. Hinsichtlich der ersten Frage, nämlich welche Variationsphänomene der Syntax zuzuordnen sind, wurden in der Literatur einige Debatten geführt. Romaine (1980) und Winford (1984) schlagen etwa Typologien vor, die von „rein" phonologisch bis „rein" syntaktisch reichen, mit jeweils zwei bzw. fünf Zwischenstufen über die Morphologie. Cheshire (1987) wiederum versucht diesem Problem nicht mit einer diskreten, sondern mit einer graduellen Abstufung für die problematische „nicht-phonologische" Variation gerecht zu werden, bei der bestimmte sprachliche Phänomene irgendwo zwischen den Skalenenden Morphologie und Syntax platziert werden können. Die Relevanz dieser Debatten ist mir größtenteils nicht ersichtlich (hiervon trenne ich die technische Frage nach syntaktischen Kriterien in der Variantenbestimmung, die ich 2
Diese Behauptung ist durchaus bestreitbar, man denke nur an die „split infinitives".
1. Widerstreit von Homogenitätsannahme und Variationsphänomenen
21
weiter unten anspreche). Ob nun ein strukturelles Phänomen als „rein" syntaktische Variation oder als ein Variationsphänomen, welches irgendwo zwischen Syntax und Morphologie liegt, bezeichnet wird, ist theorieabhängig und die Syntaxtheorie bekanntlich auch sehr wandlungsfähig. Man denke nur an das Gewicht, das die morphologische Komponente seit dem Minimalistischen Programm hinzugewonnen hat. Dieser Frage kann man nur dadurch sinnvoll begegnen, dass man sich auf eine Grammatiktheorie festlegt und vor dem Hintergrund der theoriespezifischen Begrifflichkeit arbeitet, was bei den genannten Typologien nicht der Fall ist. Es hat auch manchmal auf Untersuchungen, die auf formaler Ebene nicht explizit theoriebasiert sind, geringen Einfluss, in welcher strukturellen Ebene die Variation anzunehmen ist, da es z.T. um allgemeine soziolinguistische Hypothesen zur Frage des Einflusses externer Faktoren auf das Sprachverhalten als Ganzes geht. Die zweite Frage ist meines Erachtens der theoretisch wirklich entscheidende Punkt, nämlich die Frage, welche syntaktischen Formen als Varianten voneinander zu bezeichnen sind. Die Lage stellte sich in der Phonologie, in der die Zuweisung verschiedener Allomorphe an ein Phonem gefordert ist, noch als vergleichsweise einfach dar. Auch in der Morphologie führt die Verhältnisbestimmung AllomorphMorphem nicht zu denselben Problemen wie in der Syntax. Dort scheitern diese strukturell einfachen Zuweisungsregeln daran, dass es keine der Phonologie oder Morphologie analogen „emischen" Elemente gibt. Da das Labov'sche Konzept der sprachlichen Variable von „alternative ways to say the same thing" spricht, wurde als eines der Kriterien sinnigerweise semantische Äquivalenz zwischen den Varianten gefordert. Das Problem beschreibt Gadet (1998: 57) folgendermaßen: „Peut-il у avoir ,differentes fa^ons de dire la meme chose', ou bien est-ce que, si on le dit differemment, on dit autre chose ? [...] S'il est facile d'admettre l'equivalence au niveau non significatif (phonologie), la demonstration est ä construire aux niveaux significatifs. Que serait cette synonymie ? Identite de denotation, signification lexicale semblable, sens globalement correspondants des discours, identite des effets communicatifs ou interactifs ?" In Labov (1972: 271) lesen wir: „Social and stylistic variation presupposes the option of saying ,the same thing' in several different ways: that is: the variants are identical in reference or truth value, but opposed in their social and/or stylistic significance." Die Forderung nach demselben Wahrheitswert wird auch in Labov (1978: 2) vertreten. Weiner & Labov (1983) hingegen verwenden ein weniger eng definiertes Kriterium: „[The variants] should be truth-conditionally equivalent and used on the whole to refer to the same states of affairs." Lyons (1977) wiederum argumentiert, dass die Synonymie zwischen den Varianten nur anhand der Identität deskriptiver Bedeutungen und nicht anhand der Wahrheitsbedingung oder der referentiellen Bedeutung definiert werden könne. Romaine (1984: 426) findet diese Kriterien alle zu eng und gibt sich mit gleichen kommunikativen Intentionen bzw. Funktionen der Äußerungen zufrieden. Das Problem der Definition semantischer Äquivalenz findet man schon in den ersten überlieferten Diskussionen zum Synonymiebegriff in der Philosophie. Es gibt keine konventionelle Definition. Wir lesen diesbezüglich in Winford (1996: 184): „The
22
I. Grammatiktheorie und soziale Variation
major problem here seems to be the lack of any clearly articulated set of principles for deciding semantic equivalence in sociolinguistic investigation." Und weiter (S. 187): „Confusion of one type of meaning with another can only lead to questionable methods of analysis and equally questionable claims about the nature of the variation." In der Tat ist es besonders schwierig, eine angemessene und sinnvolle Definition semantischer Äquivalenz zu geben. Für unbrauchbar halte ich allerdings auf jeden Fall die unpräzise Begriffsverwendung von Romaine (1984), die schon Sätze wie (la) bis (le) als syntaktische Varianten ansieht, (la) It's cold in here, (lb) I'm cold, (lc) Are you cold? (Id) Would you close the window? (le) Close the window. Selbst wenn ich für das Problem der semantischen Äquivalenz letztlich keine Lösung anbieten kann, so halte ich Ansätze wie bei Romaine für kontraproduktiv. Angesichts der geradezu ausufernden Menge möglicher syntaktischer Varianten, die die Konsequenz einer solch unpräzisen, Semantik und Pragmatik konfundierenden, Definition ist, erscheint es auch einleuchtend, dass Winford (1996) die strengstmögliche Formulierung für semantische Äquivalenz fordert - wobei allerdings auch er eine präzise Operationalisierung schuldig bleibt. Die Definition semantischer Äquivalenz kann meines Erachtens nur theorieabhängig gelöst werden. Welche semantischen Kriterien und vor allem Tests durchzuführen sind, hängt letztlich mit der Konzeption der verwendeten Syntaxtheorie zusammen, die bestimmte Annahmen zur Rolle der Semantik und zum Verhältnis Syntax-Semantik macht. Allerdings ist auch zu bedenken, dass eine Formulierung semantischer Äquivalenz unter Umständen zu streng und mit Kriterien verbunden werden kann, die die Annahme syntaktischer Varianten in der Praxis kaum möglich werden lassen. Angenommen eine Sprache X böte die Möglichkeit der Wortstellungsvariation bei Interrogativstrukturen. Angenommen, man würde nun die Lesarten im besonderen Fall von Mehrfach-wft-Fragen betrachten. Nehmen wir weiter an, dass eine der Wortstellungen eine zusätzliche Lesart ermöglicht, die die andere Variante nicht vorsieht. Semantische Analysen dieser Art sind bekanntlich erforderlich, wenn man sich über bestimmte Operationen und Eigenschaften auf der Ebene der Logischen Form Klarheit verschaffen möchte. Ein solches Beispiel „subtiler" Unterschiede finden wir etwa beim w/i-Scrambling im Japanischen. Strukturen mit und ohne w/i-Scrambling besitzen die gleiche semantische Interpretation. Man kann mit Fug und Recht behaupten, dass es sich um strukturelle Varianten handelt. Konstruiert man jedoch Mehrfach-w/z-Fragen, so kann man feststellen, dass die Variante ohne w/i-Scrambling sowohl die single pair- (SP) als auch die pair /isf-Lesart (PL) erlaubt, wohingegen die Variante mit w/z-Scrambling eine starke Präferenz für die single pair-Lesait zeigt. Hagstrom (1998: 74), der diesen Kontrast anhand der Strukturen (2a) und (2b) verdeutlicht, schreibt: „If the lower of the two wh-words is moved over kinoo, as in [(2b)], the pair list reading becomes
1. Widerstreit von Homogenitätsannahme und Variationsphänomenen
23
detectably more difficult (für weitere Hinweise zum w/z-Scrambling im Japanischen, cf. Hoji, 1985): (2a)
dare-ga kinoo nani-o katta no? wer-NOM gestern was-AKK kaufte Q ,Wer kaufte was gestern?' (PL, SP)
(2b)
nani-Oj kinoo dare-ga ti katta no? was-AKK gestern wer-NOM kaufte Q ,Was kaufte wer gestern?' (?*PL, SP) Es ist allerdings meines Erachtens fragwürdig, ob ein solcher Unterschied für die variationslinguistische Fragestellung der Definition syntaktischer Strukturvarianten sinnvoll ist. Würde sich der einzige semantische Unterschied, um bei obigem Beispiel zu bleiben, erst nach der Konstruktion von Strukturen mit mehreren wft-Elementen wie (2a) und (2b) zeigen, so bezweifle ich, ob diese Differenz Sprecher des Japanischen davon abhält, in ihrem Sprachgebrauch Strukturen mit und ohne wto-Scrambling als optionale Varianten zu behandeln. Abgesehen vom seltenen Fall von Fragesituationen, in denen es tatsächlich auf die zusätzliche pair //si-Lesart bei Mehrfach-w/z-Fragen ankommt, sind gescrambelte und nicht-gesrambelte Konstruktionen im Japanischen nämlich semantisch äquivalent.3 Eine variationslinguistische Perspektive darf den Sprachgebrauchs nicht aus den Augen verlieren.
Ich hielte es daher bezüglich dieses Beispiels für sinnvoll, Strukturen mit und ohne w/i-Scrambling als semantisch äquivalent zu definieren und die Äquivalenzaussage zugleich mit einer Ausschlussmenge zu ergänzen, in der diese Lesart-Asymmetrie in Mehrfach-w/z-Konstruktionen zu notieren wäre. Somit plädiere ich dafür, zunächst von einer „strengen" Formulierung semantischer Äquivalenz auszugehen und sich dann in Form dieser Ausschlussmenge einen Ermessensspielraum einzuräumen, der dann allerdings auch im speziellen Fall transparent darzulegen und zu begründen wäre. Dieses Vorgehen soll dem Desiderat gerecht werden, dass man erstens theoriegeleitet argumentieren und zweitens die Definition von semantischer Äquivalenz sowohl von der jeweils verwendeten Theorie als auch von der jeweiligen Fragestellung und Zielsetzung der Arbeit abhängig machen sollte. In der Literatur sind neben den schon unter (la) bis (le) erwähnten Beispielen auch andere Daten zu finden, deren Bezeichnung als syntaktische Varianten nicht aufrecht zu erhalten ist. Eine hinreichend „strenge" Definition semantischer Äquivalenz kann, zumindest teilweise, dieses Problem lösen. So bezeichnet Cheshire (1982) die Form never + simple past als syntaktische Variante von didn 't + Infinitiv. (3a) She hit my brother over the head, and he never even went down. (3b) She hit my brother over the head, and he didn't even go down.
3
Um nicht das Missverständnis aufkommen zu lassen, diese Aussage führe zu einem inneren Widerspruch, präzisiere ich, dass ich hier einen intuitiven, vortheoretischen Begriff semantischer Äquivalenz meine.
24
I. Grammatiktheorie und soziale Variation
Cheshires übersieht, wie Windford (1996: 269ff.) bezüglich ähnlicher Negationsdaten anmerkt, dass beide Formen syntaktisch unterschiedliches Verhalten zeigen. Zudem besitzt never eine emphatische Funktion, die die Variante mit didn 't nicht besitzt. Es ist im Übrigen nicht verwunderlich, dass Cheshire solche Daten als syntaktische Varianten bezeichnet, wenn sie sich mit einer derart einfachen Definition wie der folgenden zufrieden gibt: „Variation involving more than one item in a construction can then be considered as a relatively clearcut example of syntactic variation" (Cheshire, 1987: 265). Sankoff (1973: 55) wiederum diskutiert das Alternationsphänomen zwischen on, vous und tu in ihrem Gebrauch als indefinit markierte Pronomina im Sinne syntaktischer Varianten anhand des folgenden Beispiels. (4)
Tu as beau parier de Γ elephant, du serpent, mais si on peut pas le decrire, hein ? In (4) spielt sich allerdings die Alternation zwischen diesen Varianten auf der Ebene des Lexikons und nicht auf der Ebene der Syntax ab, auch wenn die Referenzfunktion der indefinit markierten Pronomina gewahrt bleibt. Es ist also notwendig, neben dem Kriterium der semantischen Äquivalenz auch syntaktische Kriterien in der Definition syntaktischer Varianten anzusetzen. Auch dieses Problem ist, ähnlich wie die semantische Äquivalenz, nicht mit einer Standardformel zu lösen. Noch stärker als bei der Definition der semantischen Äquivalenz zeigt sich hierbei die Notwendigkeit einer theorieabhängigen Definition. Einen solchen Ansatz verfolgt Downes (1984 : 210), der sich zur Definition syntaktischer Varianten an die Transformationsgrammatik von Chomsky anlehnt und solche Phänomene als Varianten voneinander ansieht, die die gleiche Tiefenstruktur haben und bei denen die Oberflächenstruktur aus der Tiefenstruktur ausschließlich durch Transformationen wie Bewegung, Tilgung oder Einfügung entstehen. Er stellt eine Liste von neun verschiedenen Beispielen auf, zu denen etwa Links- und Rechtsdislozierung, Topikalisierung, Bildung von cleft- und Pseudocleft-Strukturen gehören. Ich halte seine Idee im Ansatz für richtig, obwohl ich nicht unbedingt mit seinen Schlussfolgerungen einverstanden bin. Es ist z.B. durchaus fragwürdig, ob Topikalisierung als semantisch äquivalent anzusehen ist. Im Englischen (wie übrigens auch im Deutschen) dient die Position in der Baumstruktur, in die topikalisierte Elemente bewegt werden, ebenfalls der Fokussierung (vgl. Sternefeld, 1991: 180ff.), was entsprechende syntaktische und semantische Konsequenzen nach sich zieht. Ich kann, wie schon bei der Frage der semantischen Äquivalenz, letztlich keine genaue Definition des syntaktischen Kriteriums geben. Allerdings geht mein Vorschlag in eine ähnliche Richtung wie Downes. Bewegungsoperationen, die in einer Sprache die Wahl zwischen Wortstellungsvarianten ermöglichen, sollten schon einmal in den engeren Kreis derjenigen Phänomene aufgenommen werden, die es genauer zu betrachten lohnt. Eine Analyse des syntaktischen und semantischen Verhaltens hilft dann bei der Entscheidung, ob ein bestimmtes Phänomen der Wortstellungsvariation als optional bezeichnet werden kann (vgl. hierzu auch Abschnitt 2.2.1). Es ist ebenfalls zu erwägen, ob bestimmte offensichtlich optional lexikalisch realisierbare funktionale Kategorien unter dem Phänomen der syntaktischen Variation zu
1. Widerstreit von Homogenitätsannahme und Variationsphänomenen
25
fassen sind. Dies wurde z.B. von Eguia (2002) für die Objektpronomina im spanischen Regionaldialekt des Baskenlandes angenommen. Das Scrambling im Deutschen wurde etwa von Haider und Rosengren (2003) als optionale Bewegung analysiert. Meines Erachtens sprechen gute Gründe dafür, im Französischen die wft-Bewegung und die stilistische Inversionsbewegung als optionale Wortstellungsvarianten anzusehen. Diese Gründe werde ich in Abschnitt 2.1.1, 2.2, 5.3 und 5.4 genauer darlegen. Diese Wortstellungsvariationen der französischen Interrogativsyntax bieten sich im Übrigen gut als sprachliche Variable im Labov'sehen Sinne an, da es sich um Varianten handelt, die mit stilistischen und sozialen Variablen korrelieren. Die stilistischen Unterschiede sind bekannt (bei der stilistischen Inversion ist ja der Name schon Programm; vgl. allerdings auch Fußnote 19 in Abschnitt 2.1.2 bzgl. kritischer Stimmen zu dieser Bezeichnung). Die sozialen Effekte werden in Teil III dieser Arbeit analysiert und dargelegt. Armstrong (2001: 134) spricht hinsichtlich der variationslinguistischen Untersuchung von französischen wA-Interrogativstrukturen von einer „area of French syntax that is undoubtedly socially and stylistically diagnostic, and which raises issues of method and theory that are more fundamental and more complex than those associated with low-level grammatical items such as ne".
1.2
Beispiele aus der variationslinguistischen Literatur zum Französischen
Im Folgenden führe ich einige ausgewählte Beispiele aus der variationslinguistischen Literatur auf, die von den jeweiligen Autoren als sprachliche Variable im Labov'sehen Sinne und somit als grammatische Varianten aufgefasst werden. Ob diese Analyse jeweils gerechtfertigt ist oder nicht, werde ich hier nicht diskutieren. Die Beispiele beziehen sich, bis auf die am Ende von Abschnitt 1.2.2 erwähnte Arbeit, alle auf das Französische. Diese Auflistung soll einen Einblick in den Umgang mit diesem Begriff in der Forschungspraxis geben und zudem auf einige der vergleichsweise raren Arbeiten zur grammatischen Variation im Französischen verweisen. Abschnitt 1.2.1 stellt Arbeiten zum Thema der w/z-Interrogation vor, welches einen zentralen Untersuchungsbereich dieser Studie darstellt. Abschnitt 1.2.2 erwähnt Arbeiten zu anderen Phänomenen, wie etwa zum Negationselement ne. 1.2.1
Untersuchungen zu wh-Fragen
Wie schon erwähnt, bieten wh-Fragen im Französischen aufgrund der Vielzahl struktureller Varianten eine dankbare Datengrundlage für variationslinguistische Untersuchungen. Behnstedt (1973: 209) führt in seiner Auflistung immerhin zehn verschiedene strukturelle Varianten der Frage „Wohin ist er gegangen?" auf, von denen viele geläufig, einige jedoch auch weniger geläufig sind. Gadet (1997) listet sogar 14 verschiedene Formen auf. Sie verweist darauf, dass Sprecher des Französischen ein
26
I. Grammatiktheorie und soziale Variation
großes Repertoire an unterschiedlichen wA-Strukturvarianten besitzen - wenngleich nicht alle Sprecher von allen Möglichkeiten Gebrauch machen. Die folgende Darstellung beschränkt sich auf „nur" neun verschiedene Strukturen. Zunächst sind die Strukturen (5a) und (5b) aufgeführt, die nur mit lexikalischem Subjekt möglich sind. (5b) zeigt das unter dem Begriff stilistische Inversion bekannte Wortstellungsphänomen, (5a) dagegen die verwandte komplexe Inversion mit klitischem Pronomen. Die folgenden sieben Varianten (6a) bis (6g) stellen unterschiedliche Realisierungen der Frage „Wann kommt ihr?" dar. Die Sätze (5a) und (5b) wurden nicht in die Liste der Varianten (6a) bis (6g) aufgenommen, da sie aufgrund ihres lexikalischen Subjekts nur mit einem Teil der unter (6a) bis (6g) dargestellten Wortsequenzen alternieren können. Zur Kodifizierung der sequentiellen Wortstellung wird die in Coveney (1990: 117) verwendete Notation gebraucht. Hierbei bedeutet: Q = w/i-Element, V = Verb, S = Subjekt, NP = lexikalische Subjekt-NP, CL = klitisches Pronomen, Ε = Interrogativform est-ce que/qui, к = que, sek = с 'est que. Die Reihenfolge der Varianten (6a) bis (6g) soll die angenommene stilistische Ordnung abbilden: Die oberen Sätze sind als hoch markiert, die unteren als niedrig markiert. Anders als Armstrong (2001: 135) oder Pinchon (1967: 48) sehe ich im Übrigen keinen Anlass dazu, die kolloquiale wh-insitu-Struktur (6c) der Variante (6d) stilistisch nachzustellen (vgl. hierzu auch Koch & Oesterreicher, 1990). Möglicherweise liegt dem eine Konfundierung des Gebrauchs als Echo-Frage und des Gebrauchs als echte Informationsfrage zugrunde. Der Gebrauch als Echo-Frage ist natürlich stilistisch nicht niedrigwertig, sondern die einzig mögliche und angemessene Form in dieser Situation. Die Wahlmöglichkeit zwischen verschiedenen strukturellen Varianten gibt es also bei französischen wA-Fragen nur für echte Informationsfragen. (5a) (5b)
quand Jeanne vient-elle ? quand viennent les enfants ?
[Q NP V-CL] [Q V NP]
quand venez-vous ? (6a) [Q V-CL] [Q Ε S V] quand est-ce que vous venez ? (6b) quand vous venez ? [QSV] (6c) [SVQ] vous venez quand ? (6d) quand que vous venez ? [QkSV] (6e) quand c'est que vous venez ? [Q sek S V] (6f) quand que c'est que vous venez ? [Q к sek S V] (6g) Behnstedt (1973) untersucht anhand von einigen Aufzeichnungen die Verwendungshäufigkeit dieser neun verschiedenen Strukturen. Hierzu verwendet er drei Quellen, die er drei verschiedenen Stilebenen zuweist: Gespräche aus einer Arbeitstätigkeit als LKW-Beifahrer, Gespräche aus Alltagsunterhaltungen von Personen, die er der Mittelschicht zuordnet und schließlich Interview- und Gesprächsaufzeichnungen aus Radiosendungen des Senders France Inter (cf. Behnstedt, 1973: 109ff.). Er ordnet die erste Datenquelle dem Stil frangais populaire, die zweite dem frangais familier zu. Bei der
1. Widerstreit von Homogenitätsannahme und Variationsphänomenen
27
dritten Datenquelle spricht er von der „Rundfunksprache". 4 Auch wenn diese drei Datenquellen spezifischen Sprachgebrauch vermuten lassen, ist es dennoch fragwürdig, ob man sie auf diese Weise unterschiedlichen Registern zuweisen kann (s. hierzu auch Fußnote 5). Es stellt sich bei Behnstedts Vorgehensweise ein weiteres, methodisches Problem. Man kann diese neun Strukturen hinsichtlich ihrer prozentualen Verwendungshäufigkeit nicht direkt miteinander vergleichen. Der prozentuale Vergleich setzt voraus, dass jede der neun Strukturen auch durch alle anderen substituierbar ist. Dies wäre der Fall gewesen, wenn man nur die sieben w/z-Interrogativformen (6a) bis (6g) verwendet hätte, trifft jedoch bei Einbeziehung der Formen (5a) und (5b) nicht zu. Aus diesen Gründen verzichte ich hier auf die Wiedergabe seiner genauen Prozentwerte und verweise vielmehr auf die Ergebnisse aus Coveneys (1996) Studie, die weiter unten dargestellt sind. Dennoch möchte ich auf folgenden Befund hinweisen: In Behnstedts Daten finden sich die Strukturen (6e), (6f) und (6g) fast ausschließlich in dem Sprachmaterial, welches er bei seiner Tätigkeit als LKW-Beifahrer gesammelt hat. Auf der anderen Seite treten die Strukturen (5a) und (6a) fast ausschließlich in den Mitschnitten der Radiosendungen auf. Somit scheinen die Strukturvarianten Q к S V, Q sek S V, sowie Q к sek S V nur von einer bestimmten sozialen Gruppe verwendet zu werden. Es handelt sich um diejenigen Personen, die Behnstedt dem frangais populaire zugeordnet hat. In gleicher Weise sind die Frageformen Q NP V-CL und Q V-CL in seiner Untersuchung praktisch nur in der „Rundfunksprache" zu finden, wobei selbst dort die komplexe Inversionsstruktur (5a) kaum vorkommt. Beide Formen sind der Varietät der Schriftsprache zuzuordnen, welches im Besonderen auf die komplexe Inversion zutrifft (vgl. Koch & Oesterreicher, 1990: 160).5
4
Genaugenommen spricht Behnstedt (1973: 48/49) im zweiten Fall von der „Sprache der Mittelschicht", als deren Bestandteil er die „langue familiere" sieht. Im dritten Fall spricht Behnstedt (1973: 108) von der „Rundfunksprache", welche er mit der Schriftsprache verwandt sieht. Würde man diesen Begriff trotz aller Vorbehalte in die heute geläufige Registerterminologie übersetzen wollen, so käme er wohl dem frangais soutenu am nächsten. Um dem mit den französischen Radioprogrammen weniger vertrauten Leser eine Orientierung zu geben, sei angemerkt, dass der Sender France Inter - zumindest heutzutage - als eher „niveauvoller" Sender bekannt ist, der jedoch zugleich im Gegensatz zu France Culture nicht als reiner „Intellektuellensender" gilt. Hinsichtlich des Musikprogramms bietet France Inter sowohl klassische Musik als auch Unterhaltungsmusik an.
5
Behnstedts Vorgehen führt unweigerlich zu einer gewissen Unklarheit bezüglich der jeweils relevanten Varietätendimension. Das frangais populaire ist dort einer spezifischen sozialen Gruppe zugeordnet, nämlich der Gruppe der LKW-Fahrer. Deren Präferenzen für einige wh-Varianten stellen also in der Terminologie von Coseriu (1988: 24ff.) ein diastratisches Variationsphänomen dar. Der Gebrauch der wA-Formen in der „Rundfunksprache" ist hingegen ein diaphasisches Variationsphänomen (die Situationsbezogenheit lässt sich schon an der Bezeichnung „Rundfunksprache" ablesen). Der Gebrauch der wh-Formen in Alltagsunterhaltungen (Situation) von Personen der Mittelschicht (soziale Gruppe) ist wiederum als ein Variationsphänomen zu verstehen, in dem sich diaphasische und diastratische Elemente vermischen.
28
I. Grammatiktheorie und soziale Variation
Diese Ergebnisse bedeuten zugleich, dass es ein Mittelfeld innerhalb dieses Strukturrepertoires gibt, dessen Formen in allen drei von Behnstedt verwendeten Datenquellen in Gebrauch sind. Coveney (1996) präsentiert in seiner Studie ebenfalls Prozentwerte zur Verwendungshäufigkeit von vier verschiedenen w/z-Interrogativstrukturen, bei denen jedoch zumindest das methodische Problem der nicht gewährleisteten Vergleichbarkeit von grammatischen Formen nicht auftritt. Er beschränkt sich nämlich auf den Vergleich der Formen mit klitischem Pronomen wie in (6a), mit Interrogativelement est-ce que wie in (6b), mit kanonischer Subjekt-Verb-Abfolge und w/i-Bewegung wie in (6c) und schließlich der vWz-in-situ-Form in (6d). Zum anderen erhebt Coveney ebenfalls soziodemographische Daten. Er führt somit eine variationslinguistische Untersuchung unter Berücksichtigung sowohl der stilistischen als auch der sozialen Komponente durch. Die Daten stammen aus Aufnahmen, die in den 1980er Jahren in Ferienlagern für Kinder (colonie de vacances) in der Picardie durchgeführt wurden. Die Informanten waren hierbei überwiegend die Betreuer. Mit ihnen wurden freie, informelle Interviews durchgeführt, aufgezeichnet und als Korpus gespeichert. Der Gesamtumfang betrug ca. 250.000 Wörter. Abbildung 1: Ergebnisse in Prozent aus Coveney (1996: 234) zur Variation bei wh-Fragen
Q V-CL, Q E S V, vgl. (6a) vgl. (6b)
Alter
Geschlecht
QS v, vgl. (6c)
SVQ, vgl. (6d)
17-22 Jahre 24-37 Jahre 50-60 Jahre
0 6,2 16,7
46,4 49,2 50
56,3 51,4 2/7
26,3 27,9 '/4
weiblich männlich
4,4 4,4
69,6 41,4
1/10 63,4
35,3 24,4
0/7 6,8 2,7
4/7 56,8 42,1
0/5 13/19 47,8
3/7 15,4 34,6
5,8
48,6
50
27,7
Arbeiterschicht soziale Mittelschicht Zugehörigkeit Oberschicht Gesamt
Es stellt sich allerdings auch in Coveney's Studie eine Schwierigkeit bei der Interpretation der Ergebnisse: Er beobachtete, dass einige Fragesätze mit spezifischer pragmatischer Funktion feste Formulierungen darstellen, die nicht durch andere strukturelle Formen substituierbar sind. Ein Beispiel stellt etwa der Ausdruck qu'est-ce qu'il у а? im Sinne von „Was ist los?" dar. Solche Ausdrücke sind, wie er bemerkt (S. 202), in seinen Daten zu gesprochener Sprache häufig. Er versucht daraufhin seine Ergebnisse in gewisser Hinsicht bezüglich dieses Phänomens zu bereinigen, indem er in jeder
1. Widerstreit von Homogenitätsannahme und Variationsphänomenen
29
Zelle nur für jene Fälle die prozentuale Auftretenshäufigkeit wiedergibt, in denen Wortstellungsvariation nicht durch pragmatische oder idiomatische Gründe blockiert gewesen wäre. Dies wiederum führt jedoch dazu, dass sich die Prozentwerte in jeder Zeile nicht gleichmäßig auf 100 aufaddieren, sondern jeweils unterschiedlich sind. Coveney Ausweitungsverfahren erhöht somit zwar auf der einen Seite durch den Ausschluss nur scheinbarer Varianten die Interpretierbarkeit, mindert sie jedoch zugleich durch die erschwerte Vergleichbarkeit aufgrund der unterschiedlichen Prozentsätze. Es stellt sich die Frage, warum Coveney zur im Grunde wünschenswerten Beschränkung auf die de-facto-Vananten nicht zunächst alle zweifelhaften Fälle aus seinem Korpus entfernt und dann mit diesem reduzierten Datensatz ganz normal gerechnet hat. Außerdem sind die Auftretenshäufigkeiten in einigen Zellen sehr gering, so dass Coveney selbst hervorhebt, dass die Ergebnisse nur vorsichtig zu interpretieren sind. Schätzte er eine Auftretenshäufigkeit als extrem gering ein, so gab er statt Prozentwerten absolute Werte an. Coveney (1996: 91) unterstreicht, dass indirekte Fragen relativ häufig vorkommen. Die geringe Frequenz direkter Fragen ist vermutlich auf die spezifische Situation dieser Interviewform zurückzuführen, die offenbar nicht die beste Möglichkeit zur Elizitierung direkter Fragen darstellt. Aufgrund dieser Mängel, die die Vergleichbarkeit mindern, halte ich es für sinnvoll, nur bestimmte, deutliche Tendenzen zu interpretieren. Wir können zum einen feststellen, dass Strukturen der Form (6a) mit klitischem Subjektpronomen in der gesprochenen Sprache erwartungsgemäß selten sind. Weiterhin fällt auf, dass die Struktur (6c) mit w/i-Bewegung (jedoch ohne das Element est-ce que und ohne klitisches Subjekt) sowie die w/z-in-situ-Struktur (6d) kaum von der Alterskategorie der 5060-Jährigen gebraucht wird. Es zeigt sich zudem eine komplementäre Präferenzverteilung der QSV-Sequenz (6c) und der w/z-in-situ-Form (6d) zwischen Frauen und Männern. Erstere verwenden die w/z-in-situ-Form gemäß seiner Daten kaum. Allerdings kann dieser Befund meines Erachtens ohne eine nähere Analyse der Interaktion zwischen Alter und Geschlecht unter den von Coveney befragten Personen nicht interpretiert werden (der inhaltliche Gedanke hinter dieser Interpretationsproblematik wird im Abschnitt 4.2.3.1 zu Interaktionen in der Varianzanalyse verdeutlicht). Weiterhin zeigt sich bei den Personen, die Coveney der Mittelschicht zuweist, offensichtlich eine Präferenz für die wA-in-situ-Form (6d) im Vergleich zur QSV-Sequenz in (6c), wohingegen bei den von ihm der Oberschicht zugeordneten Personen dieser Trend scheinbar in die genau entgegengesetzte Richtung weist. Welche Schlüsse man auch immer aus Coveneys Daten ziehen mag, so stellen sie zweifellos ein brauchbares Gegenargument zu den in Abschnitt 1.1 genannten Stimmen dar, die stilistische und soziale Variation in der Grammatik für eher unplausibel halten. 1.2.2
Sonstige Untersuchungen
Im Französischen wurde insbesondere die Beibehaltung oder die Tilgung des präverbalen Negationselementes ne variationslinguistisch untersucht. Dies ist laut Coveney (1996: 55) „possibly the best known sociolinguistic variable in contemporary French."
30
I. Grammatiktheorie und soziale Variation
Es ist jedoch durchaus bestreitbar, ob dieses Phänomen als syntaktische Variation zu bezeichnen ist, oder ob nicht phonologische Prozesse (wie etwa eine Tilgung auf PF im generativen Modell) hierfür verantwortlich sind. Die Ergebnisse von Ashby (1981) und Coveney (1996) zeigen, dass sowohl syntaktische als auch phonologische Faktoren dieses Phänomen beeinflussen. Zugleich zeigen die Ergebnisse von Coveney, dass das Alter und die soziale Klassenzugehörigkeit externe Faktoren darstellen (vgl. hierzu auch Ashby, 2001 und Armstrong & Smith, 2002). Smith (2000) untersucht hierzu Aufnahmen von Rundfunksendungen aus den Jahren 1960/1961 und 1995/1996. Diese diachrone Perspektive scheint auf eine gegenwärtige Entwicklung hinzudeuten, in der der Gebrauch von ne, zumindest in der hier betrachteten Sprachvarietät gesprochener Sprache im Rundfunkmedium, abnimmt. Zu diesem Phänomen wurden von Poplack & St-Amand (2002) diachrone Daten anhand von Auswertungen historischer Tonaufnahmen von Personen, deren kindliche Spracherwerbsphase im 19. Jahrhundert anzusiedeln ist, für linguistische Forschungszwecke zugänglich gemacht. Erste Auswertungen scheinen jedoch darauf hinzudeuten, dass schon damals der Gebrauch von ne in gesprochener Sprache selten war. Sankoff & Thibault (1980) behandeln in ihrer empirischen Untersuchung die Auxiliarselektion (etre, avoir) in Ausdrücken wie je suis venu bzw. j'ai venu aus der regionalen Varietät von Montreal als eine sprachliche Variable, wobei die Form j'ai venu die Standard-Variante darstellt. Auch ein Verb wie rester wurde untersucht, das in dieser Varietät eine optionale Auxialiarselektion zulässt, d.h. keine eindeutig identifizierbare Standardform besitzt. Sie kommen zu dem Schluss, dass sich vermutlich gerade eine Standardform, und zwar mit dem Auxiliar etre, entwickelt. Emirkanian & Sankoff (1985) untersuchen, ebenfalls in der Varietät von Montreal, den Gebrauch der einfachen und der periphrastischen Futurformen in Ausdrücken wie j'irai versus je vais aller und zeigen, dass die synthetische Form im Rückgang begriffen ist. Coveney (2000) analysiert den Gebrauch der Pronomina nous und on mit definiter Referenzfunktion der 1. Person Plural in der Regionalvarietät der Picardie in Ausdrücken wie nous allons versus on να als sprachliche Variable. Ashby (1992) führt eine Untersuchung zum Gebrauch der Pronomina on versus vous bzw. tu mit indefiniter Referenzfunktion in der Regionalvarietät von Tours in Ausdrücken wie on να versus vous allez bzw. tu vas durch. Nadsadi (1995) analysiert im Rahmen einer Studie in Ontario die Möglichkeit der pronominalen Subjektverdopplung in Strukturen wie (7a) im Vergleich zu (7b) als sprachliche Variable. (7a) Mon pere, il a une voiture de service. (7b) Mon pere a une voiture de service. Cedergren & Sankoff (1974) untersuchen in der Varietät von Montreal die Möglichkeit der Tilgung des Komplementierers que (s. hierzu Abschnitt 2.3.1.2, dort insbesondere Satz (62)).
1. Widerstreit von Homogenitätsannahme und Variationsphänomenen
31
1.3
Die Frage des Datentyps und der Datenverwendung für die Theorie
1.3.1
Kategoriale versus metrische Daten in der Variationslinguistik
Die Frage, welche syntaktischen Formen als Varianten voneinander gelten können, stellt sich in der Variationslinguistik aufgrund des Labov'schen Konzepts der sprachlichen Variable. Hiermit sind, wie schon in Abschnitt 1.1.1 dargelegt, alternative Strukturen einer übergeordneten Einheit gemeint, die mit linguistischen und/oder externen Faktoren korrelieren. Gelegentlich kommt der Eindruck auf, als ob ohne die Verwendung dieses Konzepts keine variationslinguistische Untersuchung möglich oder sinnvoll sei. In Abschnitt 1.1.1 wurden drei Bedeutungen des Begriffs syntaktische Variation vorgestellt. Bedeutung (iii), die sprachliche Variation zwischen Gruppen oder Individuen aufgrund externer Faktoren, birgt dabei die eigentliche soziolinguistische Komponente variationslinguistischer Untersuchungen. Die sprachliche Variable stellt einen Spezialfall dieses Ansatzes dar, indem sie nur jene sprachlichen Phänomene als Untersuchungsobjekt wählt, die auch Bedeutung (ii) erfüllen, also als strukturelle Varianten gelten. Wichtig ist, dass die Untersuchung des Einflusses externer Faktoren zunächst nur auf Bedeutung (iii) beruht und es keine soziolinguistischen Motive gibt, die eine Kombination von (ii) und (iii) grundsätzlich erzwingen. Vielmehr hängt der gewählte Ansatz von der jeweiligen inhaltlichen Fragestellung ab, wie weiter unten näher ausgeführt wird. Die Arbeit mit dem Konzept der sprachlichen Variable ergibt sich jedoch bei einem bestimmten Typus empirischer Daten sozusagen als methodischer Nebeneffekt. Dies tritt immer dann ein, wenn mit Häufigkeitsdaten, also nominalskalierten Daten, gearbeitet wird. Dieser Datentyp prägt die variationeile Soziolinguistik, wobei er in den Anfangsjahren praktisch allein das Feld beherrschte. Von Häufigkeitsdaten spricht man, wenn kategoriale Merkmale ausgezählt werden, also Merkmale, die nicht Werte auf einer Skala von z.B. 0 bis 10, sondern nur eine von verschiedenen Eigenschaften wie „vorhanden" oder „nicht vorhanden" annehmen (cf. Abschnitt 4.1.5 für weitere Ausführungen zu den unterschiedlichen Skalenarten). Diese Auszählungen fanden etwa bei den klassischen Auswertungen von Interviewaufnahmen in phonologischen Variationsstudien statt. Hierbei wurden Auftretenshäufigkeiten der verschiedenen Varianten (Allophone) einer bestimmten sprachlichen Variable (Phonem) verglichen. Wenn man nun etwa in einer quantitativen Studie feststellen möchte, ob das Vorhandensein eines Merkmals mit einem externen Faktor korreliert, so impliziert dies, dass für ein dichotomes Merkmal nicht nur die Fälle mit dem Wert „vorhanden", sondern auch mit dem Wert „nicht vorhanden" ausgezählt und diese im Hinblick auf einen solchen Zusammenhang überprüft werden müssen. Arbeitet man allerdings nicht mit Häufigkeitsdaten, sondern mit intervallskalierten Daten, also mit einem metrischen sprachlichen Merkmal aus gradueller Messung, so genügt dieser eine Wert, um eine Korrelation mit einer weiteren Variable, nämlich mit dem externen sozialen Faktor, zu berechnen. Anhand eines anschaulichen, nicht-linguistischen Beispiels kann man sich diesen methodischen Gedankengang klar machen. Angenommen man möchte herausfinden,
32
I. Grammatiktheorie und soziale Variation
ob das Sehvermögen bei Menschen mit dem externen Faktor Schulbildung in Zusammenhang stünde, da behauptet wird, dass das Sehvermögen mit steigender Studien- und Leseaktivität abnimmt. Um das Sehvermögen zu erfassen, kann man nun entweder den Anteil der Brillenträger ermitteln (wobei moderierende Drittvariablen wie die Bereitschaft zum Tragen einer Brille außer Acht gelassen sind) oder direkt Dioptriewerte erheben. Wählt man den Weg über die Zählung der Brillenträger, also über Häufigkeitsdaten, so erhebt man zwangsläufig die Auftretenshäufigkeit der „Variante" mit Brille wie auch der „Variante" ohne Brille und überprüft, ob es hier einen signifikanten Zusammenhang mit der Schulbildung gibt. Man kann diese Form der Analyse gar nicht erst mit nur einer „Variante" durchführen, weil das zugrundeliegende Konzept dichotom ist. Wählt man hingegen den Weg über die Dioptriemessung, so misst man bei allen untersuchten Personen die Ausprägung dieses einen metrischen Merkmals, dessen Korrelation mit der Schulbildung sodann berechnet werden kann. In gewisser Hinsicht kann man sich alle möglichen Werte eines intervallskalierten Merkmals, die eine unendlich große Menge bilden, als „Varianten" vorstellen. Dieser Vergleich weist zudem auf eine skalentheoretische Eigenschaft von methodologischer Relevanz hin: Der Informationsgehalt ist bei intervallskalierten Daten grundsätzlich höher als bei nominalskalierten Daten. Daher sollten Merkmale, die intervallskaliert operationalisiert werden können, grundsätzlich so erhoben und, wann immer möglich, auch so ausgewertet werden. Die Forderung, dass die Untersuchung der Variation grundsätzlich im Sinne der sprachlichen Variable an strukturellen Varianten durchzuführen sei, also die Kombination von Bedeutung (ii) und (iii) von Variation, stellt somit eine Konfundierung theoretischer und methodischer Aspekte dar. Sobald eine Variable intervallskaliert ist, kann man, wie das Beispiel illustriert hat, sehr wohl den Einfluss externer Faktoren überprüfen, also Bedeutung (iii). Auch Labov führt im Übrigen seine quantitativen Analysen, wenn er mit intervallskalierten Daten arbeitet, nach der Bedeutung (iii) durch. Dies ist der Fall bei den akustischen Formantenmessungen von Vokalen. In Labov (2001: 165) korreliert er z.B. die intervallskalierten Formantenwerte für jeden einzelnen Laut mit dem Alter. Bei den untersuchten Lauten handelt es sich auch nicht immer um Phoneme mit verschiedenen Allophonen. Es gibt also weder einen zwingenden variationstheoretischen noch einen methodischen Grund, bei intervallskalierten Daten die Frage des Einflusses externer Faktoren nur auf strukturelle Varianten, also auf die Kombination von Bedeutung (ii) und (iii), zu beschränken. Da die in dieser Studie gemessenen gradierten Grammatikalitätsurteile intervallskalierte Daten darstellen, wird in Teil III der Einfluss externer Faktoren für jeden einzelnen Satz (bzw. im Rahmen der Datenzusammenstellung im varianzanalytischen Plan auch für einzelne Strukturtypen) ausgewertet. Ein Großteil der statistischen Analysen, z.B. die Berechnungen einfacher Haupteffekte und Interaktionen, verwendet daher folgerichtig Bedeutung (iii) von syntaktischer Variation. Labov verfolgt allerdings mit seinem Ansatz ebenfalls das Ziel, den Sprachwandel über die Untersuchung des Einflusses sozialer, kognitiver und sprachlicher Faktoren
1. Widerstreit von Homogenitätsannahme und Variationsphänomenen
33
näher zu erklären (cf. Labov, 1994 und 2001).6 In diesem Fall ist die Kombination der Bedeutungen (ii) und (iii), d.h. die Untersuchung dieser Einflussfaktoren anhand struktureller Varianten, durchaus einleuchtend. Befasst sich eine Untersuchung, wie die vorliegende Arbeit, jedoch nicht mit der Fragestellung des Sprachwandels, so entfällt zumindest dieses Motiv für einen Ansatz nach dem Konzept der sprachlichen Variable. Allerdings können strukturelle Varianten als Untersuchungsobjekte in Studien zum Einfluss externer Faktoren durchaus attraktiv sein. Auf syntaktischer Ebene etwa können sich stilistische Kontraste nur zwischen strukturellen Varianten zeigen (der stilistische Vergleich zwischen beliebigen Sätzen macht wenig Sinn).7 Zugleich zeigen soziale Faktoren bevorzugt einen Effekt bei genau jenen strukturellen Varianten, die sich auf stilistischer Ebene unterscheiden. Diesbezüglich hebt Bell (1984: 152/153) hervor, dass stilistische Effekte immer die Folge sozialer Effekte seien, wobei das Umgekehrte allerdings nicht gelte: „Style variation [...] derives from and mirrors .social' variation". Mit anderen Worten: Wo wir strukturelle Varianten mit stilistischen Unterschieden finden, haben wir gute Gründe, Hypothesen zum sozialen Einfluss zu formulieren. Ob allerdings stilistische Variation zwingend soziale Variation bedeutet, wie Bell annimmt, sei hier allerdings dennoch in Frage gestellt. Bell hält Abweichungen von seiner These für außerordentlich selten und theoretisch fast vernachlässigbar. Nichtsdestotrotz verweist er auf Arbeiten zum Persischen als einzige, ihm bekannte Ausnahme (Jahangiri, 1980; Jahangiri & Hudson, 1982). Dort zeige sich das von ihm als „hyperstyle variation" bezeichnete Phänomen. Ich halte es mit Blick auf das Französische für denkbar, dass einige stilistische Variationsphänomene nicht mit sozialen Merkmalen korrelieren - zumindest sehe ich keinen Grund, diesen Fall wie Bell aus den Hypothesen auszuschließen. Der Grundgedanke, dass stilistische Variation soziale Variation vermuten lässt, begründet auch die Wahl der stilistischen Inversionsbewegung und der w/i-Fragen im Französischen als Untersuchungsgegenstand in dieser Arbeit. Die statistischen Analysen in den Abschnitten 10.4 und 12.4, die die Beurteilungsmuster für jeweils beide Varianten zwischen einzelnen sozialen Teilgruppen vergleichen, folgen somit dem Ansatz, der auf dem Konzept der sprachlichen Variable beruht. Dort werden Bedeutung (ii) und (iii) kombiniert. Wichtig ist, dass die inhaltiche Fragestellung die jeweilige Vorgehensweise determiniert. Hätte ich mich nur auf die Untersuchung der w/i-Fragevarianten und der stilistischen Inversion beschränkt, so wäre eine umfassende Untersuchung der Frage nach dem Einfluss externer Faktoren gar nicht möglich gewesen. Die ebenfalls untersuchten suboptimalen und agrammtischen Strukturen aus dem Bereich der Subjekt6
7
Labov (2001: xiv) kündigt, nach dem Band zu internen Faktoren (Labov, 1994) und dem Band zu sozialen Faktoren (Labov, 2001), im Rahmen seines Projekts eines dreiteiligen Werks ebenfalls einen Band zu kognitiven Faktoren an. Textsemiotische und -ästhetische Überlegungen zur stilistischen Funktion der Satzkomplexität in der Literaturwissenschaft (z.B. in der Sekundärliteratur zu Prousts A la recherche du temps perdu), in der auch Vergleiche zwischen beliebigen Strukturen durchgeführt werden, sind hier nicht berücksichtigt.
34
I. Grammatiktheorie und soziale Variation
Objekt-Interrogativa wären hier schon illegitime Untersuchungsgegenstände gewesen, da sie nicht als optionale strukturelle Varianten betrachtet werden können und somit keine sprachliche Variable im Sinne Labovs bilden. Eine methodische Herausforderung, die indirekt mit den Ausführungen zur Skalenqualität zu tun hat, betrifft den empirischen Datentyp, der zu verwenden ist. Die Syntaxtheorie arbeitet mit Grammatikalitätsurteilen. Die variationelle Soziolinguistik favorisiert hingegen die Auswertung spontaner, gesprochener Sprache und kritisiert zugleich den Stellenwert, den Introspektionsdaten in der Generativen Grammatik einnehmen. Diesem methodischen Datentypkonflikt muss sich eine Arbeit stellen, die soziale grammatische Variation untersucht, insbesondere wenn für eine solide syntaktische Theoriebasierung in solchen Studien plädiert wird. Labov gehört wahrscheinlich zu den schärfsten Kritikern des methodischen Vorgehens in der Generativen Grammatik. Er lehnt zwar Introspektionsurteile nicht grundsätzlich ab, spricht ihnen jedoch im Vergleich zu Produktionsdaten geringere Validität zu. Dies fasst Labov (1996: 83) in seinem ,Validitätsprinzip' zusammen: „When the use of language is shown to be more consistent than introspective judgments, a valid description of the language will agree with that use rather than with intuitions". Bezüglich der Favorisierung von Produktionsdaten in der variationellen Soziolinguistik schreibt Cheshire (1987: 263): „The discipline has prided itself on analyzing ,real' language as it is spoken in everyday life." In dieser Studie verwende ich keine Daten aus der spontanen Sprachproduktion. In dieser Hinsicht bin ich nicht auf einer Linie mit vielen Arbeiten der variationellen Soziolinguistik. Durch die Verwendung von Grammatikalitätsurteilen kann ich jedoch eine methodische Brücke zur Grammatikforschung schlagen. Durch die Verwendung des Datentyps aus der Grammatikforschung im Rahmen einer Untersuchung zur sozialen Variation entsteht eine Schnittmenge zwischen Soziolinguistik und Syntax, die in einer Studie zur syntaktischen Variation sinnvoll ist. Diesen Punkt bedenkt Labov nicht. Bezeichnet man Grammatikalitätsurteile grundsätzlich als minder valide, dann engt man die Möglichkeiten variationslinguistischer Untersuchung der Syntax unnötig ein. Die Validität von Daten hängt ja per defmitionem davon ab, was man messen will (cf. hierzu Abschnitt 3.2.3), und dies wiederum hängt von der jeweiligen Fragestellung und den Zielsetzungen ab. Coveney (1996: 121) verweist im Zusammenhang einer variationslinguistischen Untersuchung der französischen w/i-Frageformen darauf, dass bestimmte theoretische Punkte die Verwendung von Grammatikalitätsurteilen erfordern und schreibt: "There is a certain irony in the fact that a variationist analysis should require the use of intuitive judgments of this kind, since sociolinguists have in the past attacked the uncontrolled use of intuitions as practised by linguists of other persuasions." Und auch Armstrong (2001: 135) schreibt in seinen variationslinguistischen Ausführungen zum gleichen Thema, dass „the acceptability of a variant in a given context will ultimately depend on the linguist's judgment, perhaps endorsed by those of native speakers". Man kann sich der linguistischen Forschung nur wünschen, dass jene Stimmen, die Datenvielfalt und Methodenkomplementarität das Wort reden, an Gewicht gewinnen. In der vorliegenden
1. Widerstreit von Homogenitätsannahme und Variationsphänomenen
35
Studie wurden mehrere Arten von Perzeptionsdaten erhoben und für verschiedene theoretische Aspekte auf komplementäre Weise verwertet: experimentell erhobene, gradierte Grammatikalitätsurteile für die syntaktische und die variationslinguistische Diskussion, Lesezeiten für die Kontrollierung der Verarbeitungskomponente und Urteile aus qualitativen Interviews für spezielle, weitergehende Fragen zum französischen wA-in-situ-Phänomen. Labov (1996: lOOff.) verweist nicht zu Unrecht auf Störvariablen, die Introspektionsdaten verzerren können. Er spricht von "five conditions that promote the failure of linguistic intuitions", die er als (i) social intervention, (ii) physical collapse, (iii) semantic suspension, (iv) cognitive strategies und (ν) pragmatic opacity bezeichnet. Hieraus sollte man vielmehr schlussfolgern, dass die Qualität von Grammatikalitätsurteilen evaluiert und gesteigert werden sollte und nicht, dass sie in der linguistischen Forschungspraxis gewissermaßen auf ein Abstellgleis gehören. Dieser Datentyp wird daher in dieser Arbeit mit Hilfe eines sorgfältig evaluierten Instruments unter experimentellen Bedingungen in gradierter Form gemessen und statistisch ausgewertet (cf. Abschnitt 3.2). Der Umgang mit den Daten entspricht somit durchaus den methodologischen Ansprüchen der quantitativen, variationeilen Soziolinguistik, auch wenn der Typ ein anderer ist. Über die Frage nach dem angemessenen Datentyp kann man im Zusammenhang der Theorie-Empirie-Debatte streiten, zur Frage nach dem Umgang und der Auswertung sollten aber einige Standards generell beachtet werden. 1.3.2
Empirische Messung von Grammatikalitätsurteilen und ihr Nutzen für die Syntaxtheorie
Eine sorgfältige, empirische Erhebung von Grammatikalitätsurteilen und eine Kenntnis externer Einflussfaktoren tragen dazu bei, die Qualität der Daten zu steigern und somit die Theoriebildung auf verlässlichere Urteile zu stützen. Die Urteile werden nicht nur an einer Einzelperson, sondern an einer Stichprobe erhoben, deren Varianz sodann statistisch untersucht wird. Erst eine genaue Kenntnis der externen Einflussfaktoren und ihrer Wirkung versetzt einen in die Lage, diese effektiv zu kontrollieren bzw. konstant zu halten. Selbst wenn man noch kein genaues Bild über die Art und Wirkungsweise externer Einflussfaktoren besitzt, trägt schon das Wissen um potentielle Störfaktoren zu größerer Sorgfalt in der Datenerhebung bei - welches sich zum Beispiel in einem zuvor konstruierten theoretischen Stichprobenplan (cf. Abschnitt 1.4.4), in der Vorbereitung der Versuchspersonen auf die Beurteilungsaufgabe (cf. Abschnitt 3.2.2) oder in der Einbindung miterhobener externer Variablen in das statistische Modell zur weiteren Aufklärung von Varianz manifestiert (cf. Teil III). Die Unreliabilität bestimmter Daten ist in der Grammatikforschung durchaus ein Problem. Schon Levelt (1974, Bd. 2: 6) hat auf dieses Problem hingewiesen: „It is becoming more and more apparent that decisions on very important areas of theory are dependent on very unreliable observations."
36
I. Grammatiktheorie und soziale Variation
Im Folgenden sollen einige Beispiele für offensichtlich unzuverlässige Daten aus der syntaxtheoretischen Literatur vorgestellt werden. Sternefeld (1998a: 156) geht auf dieses methodische und auch theoretische Datenproblem in der Grammatikforschung ein und schreibt: „Ich denke, die generative Theoriebildung ist in eine Situation geraten, wo sie es sich nicht mehr leisten darf, harte Prinzipien mit weichen Daten zu begründen." Er weist weiterhin auf das Problem hin, dass viele Daten mit fragwürdigen Urteilen von Autoren zitiert werden, die der jeweiligen Sprache nicht mächtig sind und die in international rezipierter Fachliteratur gewissermaßen zur Bildung von Mythen beitragen. Als Beispiel stellt er die Beurteilungslage für einen Satz wie (8) dar und fragt: „Wohin soll es führen, wenn man Fanselow und Mahajans (1996) Bewertung [von (8)] als grammatisch übernimmt, in Unkenntnis der Tatsache, daß Müller (1989) eine Theorie entwickelt hat, die gerade erklären soll, warum ein es im Mittelfeld bei gleichzeitiger Extraktion ungrammatisch ist?" (8)
Wen glaubst du es mir nicht, daß sie liebt?
Sternefeld (1998a) berichtet sogar hinsichtlich der Beurteilung von (9a) und (9b) von einem Fall von Divergenzen innerhalb einer selben Person. (9a) (9b)
daß alle [dieses Buch]i [CP ohne ei zu lesen] ti ins Regal gestellt haben daß alle [CP ohne e; zu lesen] [dieses Buch]j ins Regal gestellt haben
In Fanselow (1990: 119) lesen wir nämlich, dass (9a) und (9b) ungrammatisch sind. In Fanselow (1991: 8) lesen wir aber, dies in Einklang mit der vorherrschenden Meinung, dass (9a) grammatisch und (9b) ungrammatisch ist. Schließlich finden wir in Fanselow (1992: 6) die Auffassung, dass beide Strukturen grammatisch sind. In Birdsong (1989) und Schütze (1996) finden wir eine Aufzählung einer Vielzahl divergierender Grammatikalitätsurteile in der englischen generativen Literatur. Schütze (1996: 38ff.) weist auf einen anderen Fall offensichtlich widersprüchlicher Datenbeurteilung hin. Hierbei geht es um die Modifikation des Prinzips strenger Rektion bei Lasnik & Saito (1984). Diese beiden Autoren verändern die Theorie, damit auch Sätze wie (10) erklärt werden können. Sie nehmen an, dass dieser Satz sowohl die Lesart zulässt, mit der nach dem Grund des Denkens als auch nach dem Grund des Weggehens gefragt wird. Daraus leiten sie für die Theorie ab, dass w/i-Adj unkte keinen that-trace-Effekt auslösen. (10) Why do you think that he left? Diese Beurteilung ist, wie Schütze darstellt, sowohl bestreitbar wie umstritten. Und dennoch wird auf ihrer Grundlage eine Theorie formuliert. 8 Ein weiteres Beispiel für eine schwer nachvollziehbare Datenbeurteilung stellen die spanischen w/i-in-situ-Strukturen von Uribe-Etxebarria (2003) dar. Für sie sind sie in 8
Nur als Beispiel sei die Darstellung der Rektions- und Bindungstheorie in Fanselow & Felix (1990b) erwähnt. Nachdem dort die Reformulierung des ECP ä la Lasnik & Saito (1984) vorgestellt wurde, wird der Leser gleich in die daraus folgenden, tiefgreifenden theoretischen Konsequenzen eingewiesen: „Nach der [...] vorgestellten Neufassung von Subjazenz und ECP sind diese beiden Prinzipien in ihrer Grundkonzeption einander erheblich näher gerückt."
1. Widerstreit von Homogenitätsannahme und Variationsphänomenen
37
bestimmten Kontexten grammatisch (vgl. auch Jimenez, 1997).9 Dabei versicherten mir alle Teilnehmer eines Syntaxkolloquiums in Barcelona einstimmig, dass wft-in-situ im Spanischen grundsätzlich nicht existiert.10 (11)
0,4 oder > 0,4 ist, werden aus der Analyse ausgeschlossen, da sie offensichtlich inkohärente Urteile abgeben und das Instrument nicht korrekt anwenden. Dies betraf 10 der insgesamt 78 Versuchsteilnehmer (12,9%). Neben dem Kriterium verletzter Trivialurteile galt eine extreme Beurteilung des Referenzsatzes, d.h. ein Wert in der Nähe einer der beiden Skalenenden, ebenfalls als Ausschlusskriterium. Die Versuchspersonen sollten den Referenzsatz frei beurteilen. Dennoch wurden sie durch die Instruktions- und Trainingsphase dahin geführt, diesen Satz ungefähr in die Mitte ihres Wertebereichs zu setzen. Während dieser Phase wurden ihnen zu diesem Zweck sowohl eindeutig agrammatische als auch grammatisch einwandfreie Sätze präsentiert, damit sie das gesamte Spektrum überblicken. Ein Referenzwert in der Nähe der Skalenenden würde die Reliabilität des Messinstruments aufgrund des nun auftretenden Ceiling- oder F/oor-Effekts (cf. Abschnitt 3.2.1) stark senken. Der Referenzwert sollte daher mindestens 20% und höchstens 80% der maximalen Skalenlänge betragen. Zwei Personen (3,8 %) wurden aufgrund dieses Kriteriums aus der Datenanalyse ausgeschlossen. Drittens wurden Personen aus der Datenanalyse ausgeschlossen, die trotz größter Bemühungen seitens des Versuchsleiters während der Instruktions- und Trainingsphase die Testaufgabe offensichtlich nicht korrekt verstanden bzw. die nicht in der Lage waren, ihr Verständnis in eine praktische Grammatikalitätsbeurteilung umzusetzen. Dies betraf eine Person. Zwei der insgesamt 13 ausgeschlossenen Personen erfüllten gleich mehrere dieser drei Ausschlusskriterien. Von den 78 Personen gingen somit die Daten von 65 Versuchspersonen, d.h. 83,3%, in die Auswertung ein. 37
38
Es sei darauf hingewiesen, dass im Vorfeld der Aufstellung der Gleichungen tc und tA durch die Berechnung von relativen Häufigkeiten schon eine Gewichtung vorgenommen worden ist, da die Anzahl der Sätze, die den relativen Häufigkeiten zugrunde liegt, unterschiedlich ist. Diese erste Gewichtung wurde bei der Aufstellung der Gleichungen berücksichtigt. Stengelblattdiagramme dienen der explorativen Analyse von Ausreißern bzw. Extremwerten in einer gegebenen Werteverteilung. Hierbei beginnt der extreme Wertebereich für tA bei 0,3 und der extreme Wertebereich für tG bei 0,4. Zur Bildung eines einheitlichen Wertes für beide Indizes wird gemäß einem strengen Ausschlusskriterium die höhere Extremwertgrenze von 0,4 gewählt.
92 3.2.4
I. Grammatiktheorie und soziale Variation S y s t e m a t i s c h e B e f r a g u n g zur Testhandhabung
Im Anschluss an die Testdurchführung wurden die Personen zu verschiedenen Aspekten dieses Instruments befragt. Hiermit sollte systematisch überprüft werden, ob die Versuchsteilnehmer die Instruktion und die Testhandhabung verstanden hatten und w i e sie die Schwierigkeit verschiedener Aspekte der kognitiv anspruchsvollen Aufgabe einer gradierten Grammatikalitätsbeurteilung einschätzten.
^
—
1.) Ich glaube, übertriebene Urteile abgegeben zu haben (zu kurze oder zu lange Linie) 2.) Die schriftlichen Anweisungen und die mündlichen Erläuterungen waren klar. Ich habe verstanden, was ich machen soll und wie ich es machen soll. 3.) Während der Trainingsphase habe ich nachgeprüft, ob ich die Anweisungen richtig verstanden hatte. 4.) Ich habe immer beide Sätze auf dem unteren Blatt gelesen. 5.) Ich fand diese Aufgabe zu schwierig. 6.) Ich habe nicht nur große, sondern auch kleine Unterschiede zwischen den Sätzen gespürt. 7.) Ich fand es nicht schwierig, mir ein Urteil über die verschiedenen Sätze zu bilden. 8.) Mit Hilfe der Linien konnte ich mein Urteil über die Sätze präzise ausdrücken. 9.) Diese Arbeit hat zu lange gedauert. 10.) Der Vergleichssatz hat mir in meiner Urteilsbildung geholfen. 11.) Jedesmal vor dem Ziehen einer Linie habe ich ein Auge auf den Vergleichssatz oben geworfen. 12.) Ich habe meine Konzentration von Anfang bis Ende beibehalten. 13.) Ich fühlte mich nach einer bestimmten Anzahl an Sätzen durcheinander.
^
trifft trifft eher trifft eher trifft voll überhaupt nicht zu zu und ganz nicht zu zu 21,8%
53,8%
24,4%
0%
0%
0%
42,3%
57,7%
0%
2,6%
46,2%
51,3%
1,3%
5,1%
16,7%
76,9%
61,0%
35,1%
3,9%
0%
1,3%
2,6%
55,1%
41,0%
6,4%
42,3%
43,6%
7,7%
14,1%
42,3%
34,6%
9,0%
35,9%
46,2%
17,9%
0%
2,6%
20,5%
57,7%
19,2%
10,3%
39,7%
42,3%
7,7%
0%
10,3%
50,0%
39,7%
20,5%
28,2%
41,0%
10,3%
eher am eher in eher am Anfang der Mitte Ende
14.) Wenn Sie mit „trifft eher zu" oder „trifft voll und ganz zu" geantwortet haben, geben Sie bitte den Zeitpunkt an, an dem ihr 2,8% Eindruck, sich durcheinander zu fühlen, begann. Der Eindruck, mich (8,1%) durcheinander zu fühlen, begann...
25,6% 17,9% (54,1%) (37,8%)
3. Operationalisierung von Grammatikalität und Komplexität
93
Wie Abschnitt 3.2.5 ausführt, handelt es sich bei diesen Antworten nicht um Daten, die die Überprüfung kognitiver Modelle gestatten, was auch nicht Ziel dieser Befragung war. Vielmehr sollte ein Einblick in das Testverhalten gewonnen werden, was z.B. für die Weiterentwicklung dieses Instruments von praktischer Relevanz sein kann. Die Fragen zur Testhandhabung wurden allen 78 Personen, die den Grammatikalitätsbeurteilungs-Test durchgeführt hatten, gestellt. Das bedeutet, dass auch die Aussagen jener 13 Personen, die unter die Ausschlusskriterien fielen und deren Grammatikalitätsdaten nicht in die Analysen eingingen, als wichtig und informativ eingestuft wurden (vgl. hierzu auch Fußnote 45 zur Reliabilitätsanalyse in Abschnitt 3.4.2). Die Befragung zur Testhandhabung wurde den soziokulturellen Fragen vorangestellt und findet sich in Anhang III auf Seite 368. Die oben abgebildete Tabelle zeigt die Antworten auf alle 14 Fragen in der Originalreihenfolge. Die Fragen sind hier in ihrer deutschen Übersetzung aufgeführt (das französische Original findet man in Anhang III). Wie in der Konstruktion solcher Fragebögen üblich, werden einige Fragen positiv, andere negativ formuliert, um einseitigen Tendenzen des Beantwortungsverhaltens entgegenzuwirken. Frage 14 war so formuliert, dass sie in Abhängigkeit ihrer Antwort zu Frage 13 nur von einem Teil der Personen zu beantworten war. Dementsprechend bezieht sich dort der erste Prozentwert auf alle 78 Personen und der in Klammern stehende Wert auf diejenigen 37 Personen, die diese Frage zu beantworten hatten. Folgende Schlüsse können aus diesem Antwortmuster gezogen werden: Wie die Antworten auf Frage 2 und Frage 3 zeigen, wurden Instruktion und Training als effektiv eingeschätzt. Die Versuchsteilnehmer fühlten sich auf die Aufgabe hinreichend vorbereitet. Außerdem sahen sie sich durch die Testaufgabe nicht überfordert (s. Frage 4), was auch auf die erfolgreiche Instruktion und das Training zurückgeführt werden kann. Der Skalenanker (der Referenzsatz) wurde von den meisten Teilnehmern als hilfreich empfunden (s. Frage 10). Ein sorgfältiges Vorgehen war gemäß der Einschätzung der Teilnehmer gewährleistet: Sie lasen grundsätzlich sowohl den deklarativen Kontextsatz als auch den experimentellen Fragesatz (s. Frage 4). Es wurde allerdings, wie die Antworten auf Frage 11 zeigen, nicht immer ein Blick auf den Referenzsatz geworfen. Es ist jedoch auch vorstellbar, dass hier ein Automatismus entstand, der zwar durchgeführt aber irgendwann nicht mehr bewusst wahrgenommen wurde. Die Antwort auf diese Frage zeigt zumindest keinerlei Zusammenhang mit der Validität, die durch die beiden Indizes zu verletzten Trivialurteilen operationalisiert wurde (cf. Abschnitt 3.2.3): Sowohl die Korrelation mit tA (r = -0,022; ρ < 0,849) als auch die Korrelation mit tG (r = 0,175; ρ < 0,125) ist unsignifikant. Die Aufgabe, Grammatikalitätsunterschiede zu spüren (s. Frage 6) wurde einerseits als nicht schwierig betrachtet, jedoch wurde eine gewisse Schwierigkeit im Prozess der Urteilsbildung gesehen (s. Frage 7). Das Spüren von Unterschieden und das Bilden eines Urteils sind also zwei unterschiedliche Aufgabenbereiche, was in Abschnitt 3.2.5 weiter ausgeführt wird. Es überrascht dabei nicht, dass das Antwortmuster zu Frage 8 (das Ausdrücken von Urteilen) dem Antwortmuster zu Frage 7 (dem Bilden von Urteilen) ähnelt, da das erste vom zweiten abhängt: Erst bildet man sich ein Urteil, dann drückt man dieses aus.
94
I. Grammatiktheorie und soziale Variation
Zwar wurde die Aufgabe weder als zu schwierig noch als zu lang empfunden, dennoch berichten etwa die Hälfte der Teilnehmer von einem gewissen Verwirrungsgefühl („trifft eher zu" oder „trifft voll und ganz zu" bei Frage 13). Die hiervon betroffenen Personen berichten, dass der Eindruck überwiegend in der Mitte oder am Ende des Tests auftrat (s. Frage 14). Es stellt sich die Frage, ob dieses Verwirrungsgefühl auch mit der Wahrnehmung der Schwierigkeit in der Urteilsbildung (Frage 7) zusammenhängt. Dies ist in der Tat der Fall (r = -0,414; ρ < 0,000). Die Aufgabe, eine Vielzahl gradierter Grammatikalitätsurteile abzugeben, ist kognitiv anspruchsvoll und anstrengend. Von praktischer Relevanz ist nun die Frage, ob hier eine Überforderung vorlag, die zur Minderung der Fähigkeit zur korrekten Testdurchführung führte. Auch hier wurde ein Zusammenhang mit dem Validitätskriterium verletzter Trivialurteile untersucht: Es zeigt sich, dass dieses Verwirrungsgefühl weder zu einem Anstieg des Index tA (r = 0,023; ρ 2 Stufen ähneln paarweise Einzel vergleiche auf den ersten Blick dem Vorgehen bei t-Tests zum Vergleich von zwei Stichproben. Dies ist ein Trugschluss, da varianzanalytische Einzelvergleiche zur Schätzung der Varianz des untersuchten Faktors (genauer, zur Schätzung der Prüfvarianz) auch bei Einzelvergleichen die Messungen aller - und nicht nur der beiden verglichenen - Faktorstufen heranziehen. Sie besitzen eine höhere Teststärke und sind somit t-Tests überlegen. Auch bedingte Haupteffekttests in mehrfaktoriellen Plänen berücksichtigen zur Schätzung der Prüfvarianz alle Messungen des untersuchten Faktors. Einzelvergleiche kann man auch zwischen beliebigen Kombinationen von Stufen durchführen. So kann man im o.g. Beispiel die Stufen ai und a 2 mit den Stufen a 3 und &4 vergleichen. Dies gründet in der Möglichkeit, die Differenz beliebiger Kombinationen von Faktorstufen als Linearkombination darzustellen, wobei die einzelnen Stufenwerte unterschiedlich gewichtet werden können. Man konstruiert somit Sätze verschiedener Einzelvergleiche, mit denen sich eine Vielzahl inhaltlicher Fragestellungen ausdrücken lassen. Zwei Einzelvergleiche können zudem so konstruiert werden, dass sie jeweils spezifische Informationen enthalten und damit voneinander unabhängig sind. Man bezeichnet sie in diesem Fall als orthogonal. Man spricht von einem vollständigen Satz orthogonaler Einzel vergleiche bei p-1 wechselseitig orthogonalen Einzelvergleichen (p ist die Stufenanzahl des Faktors). Ein Beispiel findet sich in Abschnitt 6.2.1. Vollständige Sätze orthogonaler Einzelvergleiche sind, wenn sie inhaltlich sinnvoll konstruierbar sind, aus methodologischen oder forschungslogischen Gründen zu bevorzugen, weil sie den Informationsgehalt der globalen Signifikanz vollständig und ohne Redundanzen in Einzelkomponenten zerlegen. Technisch gesprochen, ist in einem solchen Satz die gesamte Varianzaufklärung enthalten (cf. Abschnitt 4.2.4). 4.2.3.3
Bedingte Einzelvergleiche
Einzelvergleiche eines Faktors können jedoch ebenfalls unter den verschiedenen Stufen eines anderen Faktors (oder unter den verschiedenen Faktorstufenkombinationen mehrerer anderer Faktoren) getrennt ausgewertet werden. In diesem Fall spricht man von bedingten Einzelvergleichen. Auch hierbei können sowohl bedingte, paarweise Einzelvergleiche oder bedingte Einzelvergleiche zwischen beliebigen Kombinationen einzelner Stufen durchgeführt werden. Auch hier werden die adäquaten Einzelvergleiche aus den inhaltlichen Fragestellungen abgeleitet und, bei vollständigen Sätzen orthogonaler Einzelvergleiche, unter Beachtung der Kontrastbedingung und der Orthogonalitätsbedingung der Koeffizientenmatrix, konstruiert (cf. Bortz, 1999: 296/297). 4.2.3.4
Trendtests
Mit Hilfe einer speziellen Form von Einzelvergleichen, nämlich Trendtests, wird der Effekt eines Faktors in p-1 polynomiale Trendkomponenten zerlegt, mit denen man Entwicklungen zwischen den einzelnen Stufen eines Faktors aufdecken, zwischen linearer und nicht-linearer Komponente unterscheiden und, bei mehr als drei Stufen,
4. Statistische Grundlagen
129
die nicht-lineare Komponente präziser in unterschiedliche polynomiale Verläufe höherer Ordnung differenzieren kann. Der Effekt eines 4-stufigen Faktors wird z.B. in eine lineare, eine quadratische und in eine kubische Trendkomponente aufgespalten. Dieses Vorgehen wird in Abschnitt 6.2 für den untersuchten Phänomenbereich der Subjekt-Objekt-Interrogativa durchgeführt. Die p-1 Trendkomponenten bilden ebenfalls einen vollständigen Satz orthogonaler Einzelvergleiche. Zu beachten ist hierbei, dass die Art der Trends wesentlich von der Ordnung der Stufen abhängt. D.h., dass man nur dann sinnvolle Trendhypothesen überprüfen kann, wenn man die Stufen vorher entsprechend anordnet, d.h. eine Hypothese zur Verlaufsform schon vor der Auswertung der Daten besitzt. Ebenfalls ist zu beachten, dass es parametrische und verteilungsfreie Varianten von Trendtests gibt. Bei der parametrischen Variante setzt man voraus, dass nicht nur abhängige, sondern auch die unabhängige Variable intervallskaliert ist (vgl. Cohen, 1980; Bortz & Lienert, 1998: 149ff.). 4.2.4
Varianzaufklärung
Die Signifikanzaussage gibt darüber Auskunft, ob man sich für oder gegen die Nullhypothese entscheidet. Für die Interpretation varianzanalytischer Ergebnisse ist ebenfalls die Aussage von Bedeutung, wie hoch der Anteil der Varianz ist, der durch einen bestimmten signifikanten Effekt aufgeklärt wird. Man ermittelt somit ein deskriptives Maß der Effektstärke, welches man in seine Interpretation mit einbezieht. Dieses Maß ist deskriptiver Natur und darf nicht in der Weise missverstanden werden, dass ein Ergebnis „signifikanter" oder „weniger signifikant" sei als ein anderes. Signifikanzaussagen können per defmitionem nur dichotom sein, es gibt kein ,mehr oder weniger'. Somit sind auch die gelegentlich anzutreffenden Begriffe wie „hochsignifikant oder „marginal signifikant" unberechtigt. Vielmehr wird einer varianzanalytischen Signifikanzaussage eine weitere, nichtinferenzstatistische Information hinzugefügt, eben die Varianzaufklärung. Obwohl einige Autoren auf die Bedeutung dieser zusätzlichen Information hingewiesen haben (z.B. Dwyer, 1974), wird sie trotzdem selten in der Darstellung von Ergebnissen angegeben. Keren & Lewis (1979: 119) schreiben hierzu: „Unfortunately, the impact of these efforts has been rather slight, as is evident from a perusal of the current literature in experimental psychology." Zwei inhaltlich unterschiedliche Ansätze sind bei der Bestimmung der Varianzaufklärung zu unterscheiden, die Cohen (1973) anhand verschiedener Beispiele verdeutlicht. Zum einen kann man den Anteil der Varianz eines Effekts an der Gesamtvarianz 2 (QSTOT) berechnen (QSA / QStot) . Diese Größe wird als η („eta-quadrat") bezeichnet. Sie ist eine Verallgemeinerung des Determinationskoeffizienten r2 aus der bivariaten Korrelationsrechnung (cf. Cohen, 1988: 280). Zum anderen kann man den Anteil der Varianz eines Effekts an der Gesamtvarianz (d.h. die totale Quadratsumme) berechnen, aus der man zuvor den Varianzanteil aller anderen Effekte herauspartialisiert hat. Dieses Maß bezeichnet man daher als partielles η2.
130
II. Das einheitliche Fundament
Gleichung 3: partielles η2 =
QSA+QSE
wobei QS a die Quadratsumme des Faktors Α und QSE die Fehlerquadratsumme darstellt. (Cohen, 1973: 110) stellt klar, dass es in vielen Fällen sinnvoll ist, andere Varianzquellen als den jeweils beobachteten Effekt herauszupartialisieren. Dies ist insbesondere bei kontrolliert veränderten oder konstant gehaltenen Variablen eines mehrfaktoriellen experimentellen Designs der Fall: „In general, one wishes to partial out variables which are not properly considered ,error' in one's conception of the background against which a factor A is to be appraised". 4.2.5 4.2.5.1
Festlegung der α- und ß-Fehlerniveaus und der Effektstärke Auswertung der Grammatikalitätsurteile
Das α-Fehlerniveau für die verschiedenen varianzanalytischen Hypothesentests (einfache und bedingte Haupteffekte, Interaktion, Einzelvergleiche, etc.) in den reinen zweifaktoriellen Messwiederholungsdesigns in den Abschnitten 4 und 5 wurde auf 5% gesetzt. Bei N = 65 und mittlerer Effektstärke ist damit gleichzeitig eine hohe Teststärke gewährleistet, welches näherungsweise faires Testen erlaubt (cf. Abschnitt 4.1.3). Bei den mehrfaktoriellen Designs mit Gruppierungsfaktoren in Teil III ist die Parameterwahl anders und wird dort begründet (cf. z.B. Abschnitt 10.1). Die Teststärke für die verschiedenen Hypothesentests im Rahmen des zweifaktoriellen Messwiederholungsplans wurden mit einer Teststärkeanalyse für den t-Test für zwei abhängige Stichproben geschätzt. Dieses Verfahren stellt ebenfalls ein reines Messwiederholungsdesign dar und entspricht einer Varianzanalyse mit einem 2-fach gestuften Messwiederholungsfaktor. Der t-Test für zwei abhängige Stichproben erlaubt bei Npaare = 65, mittlerer Effektstärke (ε = 0,5s; wobei hier s = 1 angenommen wird 55 ) auf dem 3,5%-Niveau ein faires, zweiseitiges Hypothesentesten (der in Abbildung 7, Seite 230, exemplarisch dargestellte Graph bezieht sich auf diese Teststärkeanalyse). Auch eine eventuell geringfügige Überschätzung der Teststärke bei einigen der folgenden Hypothesentests ist bei einem α-Fehlerniveau von 5% somit korrigiert. Faires Hypothesentesten, d.h. ein α/β-Verhältnis von 1, halte ich im Falle der vergleichenden Untersuchung der verschiedenen Satzstrukturen für inhaltlich ratsam. Die Aussage, dass die Akzeptabilität bestimmter syntaktischer Strukturen identisch ist (d.h. ein unsignifikantes Ergebnis) und die Aussage, dass sich die Akzeptabilität bestimmter syntaktischer Strukturen unterscheidet (d.h. ein signifikantes Ergebnis), sind in ihrer praktischen Konsequenz für die Grammatikforschung ähnlich bedeutsam. Beide Aussagen sollten daher mit der gleichen statistischen Fehlerwahrscheinlichkeit verbunden sein. 55
s ist die Standardabweichung der Differenz. Diese hängt von der Standardabweichung beider abhängiger Stichproben und der Korrelation zwischen ihnen ab. Die Standardabweichung der Differenz s = 1 errechnet sich aus Si = 1 (Standardabweichung der ersten Stichprobe), s 2 = 1 (Standardabweichung der zweiten Stichprobe) und r = 0,5 (Korrelation zwischen beiden Stichproben).
4. Statistische Grundlagen
131
Beide Fehlerwahrscheinlichkeiten sind hierbei gering gehalten. Als praktisch bedeutsam sind in dieser Untersuchung mittlere Effekte angesetzt. Größere Effektstärkefestlegungen als die von Cohen definierte mittlere Effektgröße sehe ich in der alleinigen Auswertung der Grammatikalitätsdaten in diesem zweiten Teil der Arbeit auch im Hinblick auf den Zusammenhang von Reliabilität und Effektstärkemessung als nicht sinnvoll (cf. Abschnitt 3.4). Die methodologische Forschung und Praxis der experimentellen Grammatikalitätsmessung ist nach wie vor nicht weit fortgeschritten, da diese Verfahren in der theoretischen Syntax relativ neu sind. Da sich diese Verfahren noch in Phase der Testentwicklung und Testoptimierung befinden, ist es durchaus ratsam, Minderungen der gemessenen Effektstärke zu berücksichtigen, die bei der Verwendung größerer statistischer Effektstärkewerte zu unbefriedigender Testsensibilität führen könnten. Durch diese hier angesetzten Werte für die Fehlerwahrscheinlichkeiten und der Effektstärke können die Auswertungen der Grammatikalitätsurteile auch für einen Wissenschaftszweig wie der theoretischen Grammatikforschung, in dem gerne mit nuancierten Vergleichen von zunächst schwer parsbaren Strukturen argumentiert wird, überzeugend gestaltet werden. Bei den Einzelvergleichen und den bedingten Haupteffekten der Grammatikalität zwischen den Satzstrukturen, die im Rahmen der varianzanalytischen Auswertung durchgefühlt werden, handelt es sich um α priori Hypothesen, d.h. Fragestellungen, die von vornherein begründet sind. Der Vergleich einzelner Sätze ist integraler Bestandteil der inhaltlichen Hypothesen, die zu den syntaxtheoretischen Themen aufgestellt werden, und nicht eine reine α posteriori Analyse einer globalen Signifikanz aus den einfachen Haupteffekten oder der Interaktion der Varianzanalyse. Somit darf in diesem Fall keine α-Fehlerkorrektur durchgeführt werden, da dies sonst zu sogenannten konservativen Fehlentscheidungen führen kann, d.h. tatsächlich vorhandene Unterschiede könnten unentdeckt bleiben (s. hierzu auch Abschnitt 4.1.4). 4.2.5.2
Auswertung der Lesezeitmessungen
Da t-Tests im Grunde die einfachste Form einer Varianzanalyse darstellen, werden auch die Werte für die statistische Auswertung der Lesezeitmessung in diesem Abschnitt zu den Grundlagen der Varianzanalyse dargestellt. Im folgenden werden die Werte der Teststärkeanalysen für den Phänomenbereich der Wortstellungsvarianten angegeben. Die Sätze wurden, wie Abbildung 3 (Seite 53) zeigt, an zwei unabhängigen Stichproben getestet. Auch bei den Lesezeitmessungen sollen die Hypothesen - aus den schon im vorhergehenden Abschnitt für die Grammatikalitätsbeurteilung genannten Gründen - fair getestet werden. Die Effektstärke wird ebenfalls auf eine mittlere Größe gesetzt. Die stilistisch invertierbaren Objektfragen und die w/i-Fragen werden jeweils mit einem t-Test für zwei unabhängige Stichproben ausgewertet. Bei einem Stichprobenumfang von ni=56 und n2=51 sowie einer mittleren Effektstärke von ε = 0,50s (s = 1) wird faires Hypothesentesten bei α = β = 14% erreicht.
132
II. Das einheitliche Fundament
Der aufmerksame Leser bemerkt nun vielleicht, dass diese Wertekombination der in Abschnitt 4.1.3 dargestellten Entscheidungslogik widerspricht. Als einzige Ausnahme unter den vielen Hypothesentests in dieser Arbeit wird bei diesen beiden Tests jedoch von dieser Entscheidungslogik abgewichen, da der Strategie des fairen Hypothesentestens hier aus inhaltlichen Gründen Priorität eingeräumt wird. Daher übersteigt das aFehlerniveau 10%, um das ß-Fehlerniveau geringer zu halten.56 Beide Aussagen, sowohl die Identität als auch die Unterschiedlichkeit der Lesezeiten, müssen in der Interpretation gleiches Gewicht haben.
56
Gemäß der Entscheidungslogik aus Abschnitt 4.1.3 hätte bei mittlerer Effektstärke (ε = 0,5s) das a-Fehlerniveau 10% und die Teststärke 1-ß 82% (bzw. das ß-Fehlerniveau 18%) betragen. Es wäre also nicht fair getestet worden.
5
Auswertung der Wortstellungsvarianten im Interrogativbereich
In diesem Abschnitt wird der in Abschnitt 2.1 vorgestellte Phänomenbereich interrogativer Wortstellungsvarianten des Französischen mit Hilfe verschiedener Verfahren empirisch untersucht. Hiermit soll ein Beitrag zu einem konstruktiveren Umgang mit diesem grammatiktheoretisch problematischen Gebiet, auch hinsichtlich der Frage nach der Existenz optionaler Bewegung (cf. Abschnitt 2.2), geleistet werden. Um dieser komplexen Fragestellung empirisch gerecht zu werden, werden drei verschiedene empirische Datentypen und -erhebungsmethoden eingesetzt: Abschnitt 5.1 behandelt die statistische Auswertung der Ergebnisse aus den Tests zur gradierten Grammatikalitätsbeurteilung. Hierbei werden die w/z-in-situ-Struktur und eine Form mit w/i-Bewegung, sowie Objektfragen mit und ohne stilistische Inversion in einer zweifaktoriellen Varianzanalyse untersucht. Die Debatte um die Existenz optionaler Bewegung wird für das Französische vor allem in Bezug auf die w/z-Frageformen geführt. Aus diesem Grund werden für diesen Strukturtyp die Ergebnisse aus dem experimentellen Ansatz zur Grammatikalitätsbeurteilung um qualitative, sogenannte halbstandardisierte, Interviews erweitert. Diese werden in Abschnitt 5.2 dargestellt und ausgewertet. In Abschnitt 5.3 wird schließlich das Verarbeitungsmoment einbezogen und ebenfalls experimentell untersucht. Hierbei wird die Sprachverarbeitung der Objektfragen mit und ohne stilistische Inversion sowie der wh-Fragen mit w/i-in-situ bzw. wh-Bewegung mit Hilfe des self-paced-reading-Verfahrens gemessen. Alle diese empirischen Ergebnisse werden zueinander in Bezug gesetzt und in ihrer theoretischen Bedeutung in Abschnitt 5.4 diskutiert. Der Phänomenbereich interrogativer Wortstellungsvarianten wird dann in Teil III unter einem weiteren Blickwinkel betrachtet. Dort wird der variationslinguistische Aspekt, vor allem hinsichtlich der Interaktion stilistischer und sozialer Komponenten, untersucht. Gerade für ein Phänomen, welches offensichtlich Wahlmöglichkeiten in der grammatischen Realisierung bietet und zugleich stilistische Wertigkeitsunterschiede zeigt, lassen sich dadurch weitere wichtige Einsichten gewinnen.
5.1
Ergebnisse der gradierten Grammatikalitätsbeurteilung
Bevor hier die Grammatikalitätsbeurteilungen zu den beiden Varianten stilistisch invertierbarer Objektfragen (22a) und (22b) und zu den beiden vWi-Interrogativvarianten (23a) und (23b) statistisch analysiert werden, seien zur Erinnerung diese vier auf Seite 45 aufgeführten Sätze hier (unter Beibehaltung ihrer Satznummern) wiederholt: (22a) Quelle est l'armoire que refont les employes de la scierie ? (22b) Quelle est l'armoire que les employes de la scierie refont ?
134 (23a) (23b)
II. Das einheitliche Fundament A qui eile prete sa carte bancaire ? Elle prete sa carte bancaire ä qui ?
Diese vier Sätze werden in einem sogenannten varianzanalytischen Plan angeordnet (siehe Abbildung 8), um die gradierten Grammatikalitätswerte anschließend in einer zweifaktoriellen Varianzanalyse auswerten zu können. Die Anordnung folgt hierbei einer logischen Strukturierung, die gemeinsame Merkmale unter einer varianzanalytischen Faktorstufe zusammenfasst und unterschiedliche Merkmale verschiedenen Faktorstufen zuweist. Durch die Verwendung mehrerer Faktoren werden zudem mehrere Ordnungsprinzipien gleichzeitig berücksichtigt und auch in ihrem Zusammenwirken statistisch ausgewertet. Wir können zunächst zwischen zwei verschiedenen syntaktischen Strukturtypen, einerseits den stilistisch invertierbaren Objektfragen und andererseits den w/z-Fragen, unterscheiden. Diese Unterscheidung ist hier im Faktor В - einer unvermeidlichen Benennungswillkür folgend „syntaktische Konstruktion" genannt - wiedergegeben. Jede syntaktische Konstruktion oder jeder Strukturtyp entspricht hier einer der beiden Faktorstufen bi und bj. Im unten dargestellten varianzanalytischen Plan finden sich die Stufen in den beiden Spalten wieder. Für jeden Strukturtyp gibt es eine Variante ohne und eine Variante mit einer zusätzlichen Bewegungsoperation an der Oberfläche. Dieser Unterschied wird in Faktor A, „syntaktische Bewegung" genannt, dargestellt. Die Faktorstufe ai fasst die Objektfrage ohne stilistische Inversion (22b) und die wft-in-situ-Form (23b) zusammen. Auf der anderen Seite fällt unter die Faktorstufe a2 die Objektfrage mit stilistischer Inversion (22a) und die wh-Frage mit bewegtem wA-Element (23a). Diese varianzanalytische Anordnung erlaubt es nun, nach verschiedenen Effekten zu unterscheiden und sie getrennt voneinander auf Signifikanz zu testen. Es wird zunächst geprüft, ob anhand des Faktors Α ein Effekt der „syntaktischen Bewegung" festgestellt werden kann. Das Signifikanzergebnis bezüglich des Faktors В „syntaktische Konstruktion" wird zwar ebenfalls angegeben, aber, wie unten dargestellt ist, aus inhaltlichen Gründen nicht interpretiert. Die zweifaktorielle Varianzanalyse erlaubt weiterhin die Überprüfung eines Interaktionseffektes zwischen den Faktoren Α und B, welcher nicht auf die einzelnen Faktoren reduzierbar ist. Hiermit können wir etwa der Frage nachgehen, ob es - unabhängig von eventuell festgestellten Haupteffekten der einzelnen Faktoren - auch konstruktionsspezifische Bewegungseffekte gibt. Diese Untersuchung der einfachen Haupteffekte und der Interaktion erlauben die Betrachtung der Grammatikalitätsbeurteilungen der vier untersuchten Sätze in ihrer Gesamtheit. Wir können somit der logischen Anordnung im varianzanalytischen Plan folgend auch diese Sätze gemeinsam auswerten. Gleichzeitig werden ergänzend auch Detailanalysen in Form von bedingten Haupteffekten durchgeführt. Da nur das Ergebnis bezüglich des Haupteffekts Α „syntaktische Bewegung" inhaltlich interpretiert wird, beschränken sich die bedingten Haupteffekte auch nur auf diesen Faktor. In zwei bedingten Haupteffekttests wird der Frage der syntaktischen Bewegung getrennt für jede im Faktor В dargestellte syntaktische Konstruktion nachgegangen. Anders als der sogenannte einfache Haupteffekttest A, der einen Bewegungseffekt für den gesamten varianzanalytischen Plan untersucht, gibt der bedingte Haupteffekt
5. Auswertung der Wortstellungsvarianten im Interrogativbereich
135
A|bi darüber Auskunft, ob sich ein Bewegungseffekt nur für stilistisch invertierbare Objektfragen zeigt. Der bedingte Haupteffekt A|b2 untersucht analog dazu, ob es einen Bewegungseffekt nur für w/i-Fragen gibt. Gerade im Kontext grammatiktheoretischer Fragen ist auch die Untersuchung der Einzelsätze wichtig und gehört zu den Standardhypothesen. Aus diesem Grunde handelt es sich hierbei, wie in Abschnitt 4.2.3.1 erläutert ist, um α priori Hypothesen.
Faktor A: Syntaktische Bewegung i
Abbildung 8: Zweifaktorieller varianzanalytischer Plan für den Phänomenbereich optionaler Wortstellungsvarianten
Faktor B: -> Syntaktische Konstruktion
bi: stilistisch invertierbare Objektfragen
b2: и'/г-Fragen
aj: unbewegt
(22b)
(23b)
a2: bewegt
(22a)
(23a)
Es sei an dieser Stelle darauf verwiesen, dass bei allen Hypothesentests, zu deren Ergebnisbild mehrere Größen der jeweils verwendeten Prüfstatistik gehören, diese in den Fußnoten vollständig wiedergegeben sind. Hierdurch erfährt der einschlägig interessierte Leser nicht nur die Signifikanzaussage, sondern alle Werte, die für eventuell weitergehende Auseinandersetzungen mit den statistischen Ergebnissen (z.B. Metaanalysen) notwendig und hilfreich sind. Die Ergebnisse der zweifaktoriellen Varianzanalyse zeigen folgendes Bild: Wir können zunächst festhalten, dass die Testvoraussetzung der Sphärizität für Faktor A, Faktor В und für die Interaktion Α χ В erfüllt ist.57 Eine Voraussetzung zur Berechnung von univariaten Varianzanalysen mit Messwiederholungen ist die sogenannte Zirkularitätsannahme. Diese besagt u.a., dass die Varianzen der einzelnen Faktorstufen und die Korrelationen zwischen den Faktorstufen homogen sind. Überprüft wird diese Voraussetzung mit dem Sphärizitätstest nach Mauchly. Ist diese Voraussetzung verletzt, d.h. wird die Ho des Mauchly-Tests verworfen, so berechnet man den F-Wert mit modifizierten Freiheitsgraden.58 Da dies hier nicht der Fall ist, 57
58
Faktor A: Mauchly-W=l,0; df=0; Faktor B: Mauchly-W=l,0; df=0; Interaktion AxB: MauchlyW=1,0; df=0 Der Bartlett-Test zur Überprüfung der Varianzhomogenität wird hier nicht verwendet, da er seinerseits an bestimmte Verteilungsvoraussetzungen gebunden ist und dessen Anwendbarkeit zur Überprüfung der Verteilungsvoraussetzungen daher fragwürdig ist (s. hierzu Bortz, Lienert & Boehnke,
2000: 81).
136
II. Das einheitliche Fundament
bedarf es keiner sogenannten Freiheitsgradkorrektur bei der Auswertung der statistischen Ergebnisse.59 Der Haupteffekt A, d.h. der Effekt des Faktors Α „syntaktische Bewegung", erweist sich als nicht signifikant (p < 0,875).60 Das bedeutet, dass syntaktische Bewegung keinen Einfluss auf die Grammatikalitätswerte ausübt. Beide Wortstellungsvarianten, mit oder ohne zusätzlicher Bewegungsoperation, sind ähnlich akzeptiert. Syntaktische Bewegung hat auch dann keinen Einfluss, wenn der Effekt in bedingten Haupteffekttests getrennt für die wft-Fragen bzw. für Objektfragen betrachtet wird: Der bedingte Haupteffekt A|bi, d.h. (22a) vs. (22b) oder der Effekt der stilistischen Inversionsbewegung, ist unsignifikant (p271 ).87 Der bedingte Haupteffekt В|аз, d.h. der Unterschied zwischen Subjekt- und Objektfragen bei VImC-Konstruktionen, (26b) und (26c), ist ebenfalls signifikant. Hier haben allerdings Subjektfragen einen niedrigeren Grammatikalitätswert als Objektfragen (p < 0,000; partielles η2 В|аз = 0,574).88 Ein Vergleich der partiellen η2-Werte der bedingten Haupteffekte В|а; zeigt, dass es einen steigenden Verlauf für die Größe des Unterschieds gibt: Der Kontrast zwischen Subjekt- und Objektfragen ist zwar unter allen Konstruktionstypen signifikant, bei PK84 85
a, vs. a 2 : QS A x B = 647,183; df A x B =l; df Fehler =64; F A x B = 1,553; partielles t f A x B = 0,024 ; ρ < 0,217 a! und a 2 vs. a3: QS A x B = 43545,918; df A x B =l; df Feh , er =64; F A x B = 98,225; partielles i f A x B = 0,605;
ρ < 0,000 86 87 88
Pillais PSB|ai = 0,068; F B[al = 4,7; dfB|ai = 1; df Feh , er = 64; partielles if B | a l = 0,068; ρ < 0,034 Pillais PS B | a2 = 0,271; FB|a2 = 23,842; df B ! a 2 = 1; df Fehlcr = 64; partielles tf B | a 2 = 0,271; ρ < 0,000 Pillais PS B | a3 = 0,574; FB|a3 = 86,093; df B[a3 = 1; df Fehler = 64; partielles η 2 B|a3 = 0,574; ρ < 0,000
162
II. Das einheitliche Fundament
Konstruktionen jedoch geringer als bei VIoC-Konstruktionen, die wiederum einen geringeren Unterschiedseffekt zeigen als VImC-Konstruktionen. Letztere zeigen also den größten Unterschied zwischen der Subjekt- und der Objektform. 6.1.3.2
Bedingte Haupteffekte für den Faktor Α „intervenierendes Element"
Anders als beim Haupteffekt В „satzinitiales Element" ist der einfache Haupteffekt А interpretierbar, da die hybride Interaktion wie in 6.1.2 gezeigt nur die Interpretierbarkeit des Haupteffekts В beeinträchtigt. Bedingte Haupteffekte A|bj werden daher hier nur als Ergänzung und Präzisierung und nicht als Substitut zum einfachen Haupteffekt untersucht. Wie zu erwarten ist sowohl der bedingte Haupteffekt A|b b d.h. der Effekt des »intervenierenden Elements' nur für subjektinitiale Sätze, als auch der bedingte Haupteffekt А|Ьг, d.h. der Effekt des ,intervenierenden Elements' nur für objektinitiale Sätze, signifikant. Im ersten Fall werden nur (24a), (25a) und (26b), im zweiten Fall nur (24b), (25b) und (26c) betrachtet: Der fallende Trend des Grammatikalitätswerts für die drei verschiedenen intervenierenden Elemente - parenthetische Konstituente, VIoC und VImC - findet sich sowohl bei Subjektfragen (p < 0,000; partielles л2а|ы=0,894) als auch bei Objektfragen (p < 0,000; partielles η2Α^2 = 0,620).89 Ein Blick auf die beiden partiellen r|2-Werte dieser bedingten Haupteffekttests zeigt, dass der Unterschied zwischen den drei intervenierenden Elementen insgesamt sehr deutlich ist, bei Subjektfragen jedoch noch stärkere Ausprägung zeigt. Dieser fallende Trend wird in Abschnitt 6.2 für Subjekt- und Objektfragen getrennt näher untersucht. 6.1.3.3
Vergleich der intervenierenden Elemente
Einfache, paarweise Einzelvergleiche zwischen den Stufen des Faktors Α geben darüber Aufschluss, welche intervenierenden Elemente für den einfachen Haupteffekt verantwortlich sind. Zudem erfahren wir die Effektgröße des jeweiligen Einzelvergleichs. Im Gegensatz zu den bedingten Einzelvergleichen in 6.1.3.2 werden Subjektund Objektfragen gemeinsam betrachtet. Faktorstufen ai vs. a2: PK-Konstruktionen, (24a) und (24b), unterscheiden sich signifikant von VIoC-Konstruktionen, (25a) und (25b) (p < 0,000; partielles Л2а1 vs. a2 = 0 , 2 8 6 ) . 9 0
Faktorstufen a 2 vs. a3: VIoC-Konstruktionen, (25a) und (25b), unterscheiden sich signifikant von VImC-Konstruktionen, (26b) und (26c) (p < 0,000; partielles 91 I f a 2 v , a 3 = 0,718). 89
Subjektfragen: Pillais PS A j bl = 0,894; F A | bl = 264,332; df A | b , = 2; dfFehier = 63; partielles if A |bi = 0,894; ρ < 0,000 Objektfragen: Pillais PS A | b2 = 0,620; F A | b2 = 51,461; dfA|b2 = 2; df Fehler = 63; partielles if A | b 2 = 0,620; ρ < 0,000
90
QS a i vs.a2=30911,189; df a l vs a 2 = l ; df F e h l e r =64; F al v s a 2 = 2 5 , 6 6 6 ; partielles η 2 3 , vs. a2 =0,286; p 2000) durchgeführt.
9. Das innere Gefüge der Sozialstruktur
247
erwähnt, dass Krauth (1993: 23ff.), wenn auch aus zweifelhaften inhaltlichen und nicht aus testmethodischen Gründen, ganz auf die Identifikation von Antitypen verzichtet. Zu Beginn einer KFA ist es empfehlenswert, eine sogenannte absteigende Interaktionsstrukturanalyse (abgekürzt: absteigende ISA) durchzuführen. Mit dieser Voranalyse wird eine Datenexploration durchgeführt, um diejenigen Merkmale zu eliminieren, die in keinem starken Zusammenhang mit den restlichen Merkmalen stehen (cf. Krauth, 1993: 98ff.). Dies kann die Prägnanz eventueller Typen unter den zusammenhängenden Merkmalen erhöhen. In einer ISA werden die t Merkmale eines Modells in zwei Teilmengen aufgeteilt. In der einen Teilmenge steht jeweils ein Merkmal Mi und in der anderen Teilmenge eine Art Übermerkmal Mj, welche alle anderen t-1 Merkmale enthält. Mit einem kxl χ2Test prüft man sodann, ob das Merkmal Mj von dem „Übermerkmal" Mj, welche alle anderen t-1 Merkmale enthält, unabhängig ist. Ist das Ergebnis unsignifikant, so handelt es sich beim Merkmal Mj um ein isoliertes Merkmal. Da die Frage der Isoliertheit für jedes der t Merkmale überprüft wird, werden in einer absteigenden ISA auch t kxl x2-Tests durchgeführt. Das Ergebnis einer absteigenden ISA ist als Empfehlung für die Auswahl der Merkmale zu verstehen und nicht als ein Gebot der teststatistischen Voraussetzungen. Gibt es gute inhaltliche Gründe, die für die Beibehaltung von isolierten Merkmalen in einem Modell stehen, so kann man nach einer Ermessensentscheidung auch mit dem vollständigen Merkmalssatz weiterrechnen. Man muss sich nur darüber im klaren sein, dass man eventuell weniger Typen aufdeckt. Um diesem Empfehlungscharakter gerecht zu werden und um das Ausschlusskriterium nicht zu eng zu definieren, werden absteigende IS As mit einem α-Fehlerniveau von 10% gerechnet. Es empfiehlt sich ebenfalls, das Ergebnis einer Konfigurationsanalyse um eine sogenannte aufsteigende Interaktionsstrukturanalyse (abgekürzt: aufsteigende ISA) zu ergänzen (cf. Krauth, 1993: lOOff.). In einer aufsteigenden ISA wird, ähnlich wie in Interaktionstests mehrfaktorieller Varianzanalysen (z.B. Abschnitte 4.2.2 und 12.1), die Abhängigkeitsstruktur der verschiedenen Merkmale untersucht. Da nach der Durchführung einer absteigenden ISA und einer eventuellen Elimination von Merkmalen gewährleistet ist, dass es keine isolierten Merkmale gibt, ist nun das Ziel der aufsteigenden ISA, die genaue Form der Interaktionsstruktur zu bestimmen (daher ist es sinnvoll, für die aufsteigende ISA dasselbe α-Fehlerniveau zu verwenden wie in der absteigenden ISA). Hierbei ist etwa die Frage interessant, ob die Interaktionsstruktur der Merkmale auf Interaktionen 1. Ordnung zurückgeführt werden kann, oder ob es Merkmalsbündel gibt, bei denen die Interaktion nicht paarweise, sondern erst in der multivariaten Kombination auftritt (Interaktionen höherer Ordnung). Entsprechend werden zunächst alle möglichen paarweisen Kombinationen aus den t Merkmalen in kxl x2-Tests auf Interaktionen 1. Ordnung geprüft. Lässt sich auf dieser Ebene noch nicht die komplette Interaktionsstruktur aufklären, so geht man zwecks Überprüfung von Interaktionen 2. Ordnung zu kxl x2-Tests, über, in denen man eine Häufigkeitstabelle mit einem Merkmal einerseits und einem aus zwei Merkmalen bestehenden Übermerkmal andererseits auf Kontingenz überprüft. Ist auch unter
248
III. Der Schritt zur Variation
Einbeziehung der Interaktionen 2. Ordnung nicht die gesamte Interaktionsstruktur aufgeklärt, so fährt man entsprechend auf höheren Ordnungen fort. 9.1.5
Multivariater Zusammenhang gemischt skalierter Daten in der kanonischen Korrelation
Die Darstellung der Konfigurationsanalyse in Abschnitt 9.1.4.2 führte schon in die Eigenschaft der multivariaten Statistik, den Zusammenhang von mehr als zwei Variablen zu untersuchen, ein. Die KFA ist speziell auf nominalskalierte Daten ausgerichtet. Ihre Stärke liegt in der Möglichkeit, einzelne prägnante Merkmalskombinationen zu identifizieren. Allgemein findet der multivariate Ansatz in Fragestellungen Anwendung, in denen komplexe Merkmalszusammenhänge untersucht werden. Ein häufig eingesetztes, multivariates Verfahren für Datensätze, die auch intervallskalierte Merkmale enthalten, ist die multiple Korrelations- und Regressionsrechnung. Hierbei wird der Zusammenhang zwischen einer Kriteriumsvariable und mehreren Prädiktorvariablen gleichzeitig untersucht. Dabei werden nicht nur der Einfluss jedes Prädiktors auf die Kriteriumsvariable, sondern auch die Zusammenhänge innerhalb des Prädiktorvariablensatzes berücksichtigt. Eine Verallgemeinerung der multiplen Korrelations- und Regressionsrechnung stellt die kanonische Korrelation dar. Sie erlaubt die Analyse des Zusammenhangs zwischen zwei Variablensätzen, wobei in jedem Satz die Variablen beliebige Skalenqualität besitzen können (cf. Abschnitt 4.1.5 zu den unterschiedlichen Skalenniveaus). Cohen (1982: 302) schreibt hierzu: „Research factors (e.g., age, trial block, experimental condition, socioeconomic status, diagnosis) are expressed as sets of variables, and it is these functional sets rather than single variables that are the primary units of analysis." Abschnitt 9.5 demonstriert eine konkrete Anwendung. Dort wird im Anschluss an die bivariaten Analysen der Zusammenhang zwischen dem nominalskalierten Lebensstil einerseits und allen soziodemographischen Variablen andererseits berechnet. Da viele elementarstatistische Verfahren (t-Test, Varianzanalyse, etc.) im Allgemeinen Linearen Modell auf die multiple Korrelations- und Regressionsrechnung zurückgeführt werden können, stellen diese elementarstatistischen Verfahren ebenfalls Spezialfälle der kanonischen Korrelation dar. Zwar bezeichnet Cohen (1982: 339) die kanonische Korrelation und seinen hierauf aufbauenden Ansatz der set-correlation als ein „allgemeines, multivariates System der Datenanalyse" und stellt die vielseitigen Anwendungsvarianten heraus: „Information in any form (including nominal scales) may be represented as sets of variables, sets may be partialled from other sets, and the strength and nature of the association between sets determined". Jedoch werden aufgrund ihrer komplexen mathematischen Grundlagen die verschiedenen elementarstatistischen Verfahren in der Praxis häufig nicht aus der kanonischen Korrelation abgeleitet, was normalerweise auch nicht notwendig ist. Es gibt aber durchaus Situationen, in denen der Entwurf eines bestimmten Testinstrumentariums auf der Grundlage der Prinzipien der kanonischen Korrelationsrechnung aufgrund spezifischer Analyseanforderungen sinnvoll ist. An dieser Stelle sei etwa als Nachtrag zu den Ausführungen in Abschnitt 9.1.4.2 auf eine alternative
9. Das innere Gefüge der Sozialstruktur
249
Möglichkeit der Auswertung mehrdimensionaler Häufigkeitstabellen verwiesen, welche Bortz, Lienert & Boehnke (2000: 39Iff.) darstellen. Es handelt sich um ein Verfahren für (ρ χ q χ ...) χ г - Tafeln, welches auf der kanonischen Korrelationsanalyse beruht (vgl. hierzu auch Cohen (1982: 336ff.). Um die Korrelation zwischen zwei Variablensätzen zu berechnen, ist ein Maß für ihren Gesamtzusammenhang notwendig. Das Ergebnis einer kanonischen Korrelation besteht nämlich zunächst nicht aus einer Größe, sondern aus mehreren kanonischen Korrelationswerten CR (siehe z.B. Fußnote 152 auf Seite 274). Dies gründet kurzgesagt darin, dass die Darstellung des Zusammenhangs zwischen zwei Variablensätzen nur durch eine komplexe Lösung zu bewerkstelligen ist, die selbst - wenn in einer Fragestellung die konkrete Form des multivariaten Zusammenhanggefüges interessiert - Gegenstand der Diskussion werden kann. Die topologische Darstellung von Rozeboom (1965) kann zu einem Verständnis dieser Problemstellung verhelfen: Seine Ausführungen beruhen darauf, dass jeder Variablensatz einen Raum aufspannt, wobei der Anteil der Überlappung der Räume dem Zusammenhang zwischen den Variablensätzen entspricht. Ein statistisches Maß des Gesamtzusammenhangs von zwei Variablensätzen soll jedoch in einer einzigen Zahl zumindest den quantitativen Umfang angeben. Es muss hierfür drei Bedingungen erfüllen: Erstens muss sie eine natürliche Verallgemeinerung des multiplen Korrelationswertes R2 mit identischem Wertedefinitionsbereich darstellen. Zweitens muss sie die Überlappung der Räume getreu wiedergeben, wobei diese gegenüber linearen Transformationen invariant sein müssen. Drittens muss sie schließlich die Symmetriebedingung erfüllen, d.h. die Beziehung des Variablensatzes X zu Y entspricht der Beziehung des Variablensatzes Y zu X. Cramer & Nicewander (1979) stellen sieben verschiedene Maße vor, die diesen Bedingungen entsprechen. Nur bei zweien dieser Maße sieht jedoch Cohen (1982) eine hinreichend vielseitige Anwendbarkeit gegeben: Es handelt sich zum einen um das Verhältnis verallgemeinerter Varianz {proportion of generalized variance), Ry,x, welches eher den kumulativen Gesamteffekt abbildet, und zum anderen um das Verhältnis additiver Varianz und Spurkorrelation {proportion of additive variance and trace correlation), Ty,x , welches eher den Durchschnittseffekt darstellt. Bezüglich der Wahl zwischen beiden Maßen schlägt Cohen (1982: 312) folgendes vor: Wenn sich die Anzahl der Variablen in den Variablensets unterscheidet, ist Ty,x vorzuziehen. Wenn jedoch eines der Variablensets ein einzelnes Konstrukt darstellt, wie etwa im Falle einer durch Indikatorvariablen kodierten, nominalskalierten Variable, so ist Ry,x die geeignetere Größe. Die setcorrelation Ry,x berechnet sich wie folgt aus den quadrierten kanonischen Korrelationen CR bzw. den Eigenwerten: Gleichung4: R2yx = l - ( l - C Ä , 2 ) x ( l - C R | ) x . . . x ( l - C Ä r 2 ) Die Signifikanzprüfung des durch alle kanonischen Korrelationen beschriebenen Gesamtzusammenhangs geschieht mit der auf Rao (1952) zurückgehenden Formel (auch in Bortz, 1999: 618 dargestellt).
250
9.2
III. Der Schritt zur Variation
Prägnante, mehrdimensionale Merkmalskombinationen mit dem Lebensstil
Im Folgenden werden Konfigurationsanalysen durchgeführt, in denen der multivariate Zusammenhang zwischen dem Lebensstil und jeweils mehreren, anderen sozialen Merkmalen untersucht wird. Dabei sollen prägnante Merkmalskombinationen von einzelnen Lebensstilgruppen mit bestimmten soziodemographischen Eigenschaften aufgedeckt werden. Die Wahl der KFA-Modelle unterliegt, in Abhängigkeit von der Stichprobengröße, technischen Grenzen hinsichtlich der maximalen Konfigurationsanzahl. Dies setzt der Anzahl der zu berücksichtigenden Variablen Grenzen. Die soziodemographischen Variablen, bei denen es möglich ist, eine Auswahl zusammen mit dem Lebensstil in ein Modell aufzunehmen, sind Studienrichtung, Abiturtyp, Geschlecht, Ausbildungsgrad und Alter. Diese Variablen sind entweder genuin nominalskaliert oder wurden, da die KFA nur mit kategorialen Daten rechnet, auf Nominalskalenniveau transformiert. Außer den Variablen Lebensstil, die vierstufig ist, und Studienrichtung, die dreistufig ist, sind alle anderen Variablen dichotom (cf. Abschnitt 8.1.1). Die hier verwendete dichotomisierte Altersvariable wurde in den folgenden Modellen nicht berücksichtigt. Im Rahmen der hier durchgeführten, rein sozialstrukturellen Analyse erscheint die nominalskalierte Form dieses Merkmals, welches zwischen Personen bis einschließlich 22 Jahren und Personen ab 23 Jahren unterscheidet, nicht hinreichend informativ (in den Varianzanalysen in den Abschnitten 9, 10 und 11, in denen der Einfluss auf die Grammatikalitätsbeurteilungen untersucht wird, sehe ich das anders, da die kognitive Komponente der Grammatikalitätsdaten die Formulierung einer Zusammenhangshypothese auch mit der dichotomisierten Form der Altersvariable plausibel erscheinen lässt). In den bivariaten Analysen in den Abschnitten 9.3 und 9.4 und in der kanonischen Korrelationsrechnung in Abschnitt 9.5 wird hingegen die informationsreichere intervall- oder ordinalskalierte Altersvariable verwendet. In Abschnitt 9.1.4.2 wurde für diese untersuchungsspezifische Stichprobe festgelegt, dass die Anzahl der Konfigurationen der Häufigkeitstabelle (η χ r2 x... x rt) nicht größer als 37 sein sollte. Das bedeutet, dass mit den existierenden Variablen entweder eine dreidimensionale Häufigkeitstabelle mit 4 χ 3 χ 2 = 24 Konfigurationen oder eine vierdimensionale Häufigkeitstabelle mit 4 x 2 x 2 x 2 = 32 Konfigurationen erstellt werden kann. Für die vierdimensionale Tabelle gibt es (nach Ausschluss der Altersvariable) nur ein mögliches Modell, nämlich die KFA mit den Variablen Lebensstil, Abiturtyp, Geschlecht und Ausbildungsgrad in Abschnitt 9.2.1. Mit einer dreidimensionalen Häufigkeitstabelle lassen sich drei verschiedene Modelle konstruieren, nämlich entweder die KFA Lebensstil χ Studienrichtung χ Abiturtyp, oder Lebensstil χ Studienrichtung χ Geschlecht oder Lebensstil χ Studienrichtung χ Ausbildungsgrad, die man in den Abschnitten 9.2.2, 9.2.3 und 9.2.4 findet. Es ist schwierig, in der KFA die Wahl der Irrtumswahrscheinlichkeiten genau zu begründen. Schon für den bivariaten k x l x2-Test ist es nicht möglich, sinnvolle Häufigkeitsdifferenzen zur Festlegung von Effektstärkekonventionen anzusetzen (cf.
9. Das innere Gefüge der Sozialstruktur
251
Abschnitt 9.1.4.1). Dieses Problem stellt sich in der KFA umso mehr, wenn Effektstärken für eine einzige, auf die gesamte Kontingenztafel bezogene, H 0 definiert werden sollen, da es in mehrdimensionalen Tabellen in der Regel auch mehr Zellen gibt. Denkbar wäre hingegen die Angabe von prototypischen Häufigkeitsdifferenzen zur Spezifikation von Effektstärkekonventionen auf der Ebene der einzelnen Konfigurationen. Meines Wissens gibt es hierzu jedoch noch keine einschlägigen Vorschläge. Dementsprechend kann die Wahl des α-Fehlerniveaus nicht anhand des ß-Fehlerniveaus und der Effektstärke begründet werden. Mangels konkreter Anhaltspunkte bleibt nichts Anderes übrig, als die Heuristik der Konventionen heranzuziehen. Somit habe ich das α-Fehlerniveau in den folgenden KFAs auf 5% gesetzt.131 Die absteigende ISA ergab in allen folgenden Berechungen in Abschnitt 9.2, dass es kein isoliertes Merkmal gibt. Bei allen hier durchgeführten KFAs konnte somit der gesamte Merkmalssatz beibehalten werden. Zur Identifikation von Typen und Antitypen wurde die Simulationsversion des exakten hypergeometrischen Tests verwendet (Krauth, 1993). Hierbei wurde eine sehr hohe Replikationsanzahl (150.000) gewählt, um die Ergebnisgenauigkeit zu garantieren. Weiterhin zeigen die aufsteigenden ISAs, dass die Interaktionsstruktur bei allen vier hier dargestellten KFA-Modellen auf Interaktionen 1. Ordnung zurückgeführt werden kann. In den folgenden Ergebnisdarstellungen werden zunächst die sogenannten eindimensionalen Randsummen angegeben, die die Häufigkeitsverteilung der Kategorien für jedes Merkmal angeben. Aus diesen eindimensionalen Randsummen errechnen sich die erwarteten Häufigkeiten wie in Fußnote 127 dargestellt. Danach werden in tabellarischer Form alle identifizierten Typen mit Angabe der tatsächlichen Häufigkeit, der erwarteten Häufigkeit, der Konfigurationswahrscheinlichkeit und schließlich dem Signifikanzwert angegeben. Letzterer wurde, wie schon erwähnt, am Bonferronikorrigierten Fehlerniveau getestet. Die inhaltliche Interpretation der gefundenen Typen wird an dieser Stelle noch nicht durchgeführt. Vielmehr werden an verschiedenen Stellen in den nachfolgenden Analysen diese prägnanten Merkmalskombination aufgegriffen und in Zusammenhang mit weiteren empirischen Ergebnissen gestellt und interpretiert. Allerdings verhilft die Betrachtung der prägnanten Merkmalskombinationen schon zu einem ersten Verständnis des empirischen Bildes und der Lebensstil-Charakteristika, welches in den folgenden Abschnitten vervollständigt wird.
131
Dennoch sei erwähnt, dass auf dieser nun einmal heuristischen Ebene auch ein α-Fehlerniveau von 10% mit Verweis auf die Senkung der ß-Fehlerwahrscheinlichkeit in Betracht hätte gezogen werden können.
252 9.2.1
III. D e r S c h r i t t z u r V a r i a t i o n K F A - M o d e l l Lebensstil χ Abiturtyp χ Geschlecht χ Ausbildungsgrad
D i e eindimensionalen R a n d s u m m e n der M e r k m a l e Lebensstil, Abiturtyp, Geschlecht und A u s b i l d u n g s g r a d sind wie untenstehend. Lebensstil
Abiturtyp
Geschlecht
/!... = 58
/.,.. = 100
/ . . b = 106
/...i = 75
Ausbildungsgrad
/2... = 3 2
/ г - = 84
/..2. = 78
/ . . . 2 = 109
/3... = 4 2 / 4 - = 52 Lebensstil:
Geschlecht
Ausbildungsgrad
к,: introvertiert ohne Schwerpunkte
Abiturtyp k,: literarisch
kj: weiblich
k,: vor Vordiplom
k 2 : unterhaltungssuchend, vielseitig
k 2 : nicht-literarisch
k 2 : männlich
k 2 : nach Vordiplom
кз: sportorientiert, vielseitig k4: kulturell aktiv, politisch kritisch
In d i e s e r K F A w e r d e n z w e i T y p e n i d e n t i f i z i e r t . D i e s e p r ä g n a n t e n M e r k m a l s k o m b i n a t i o n e n s i n d in d e r n a c h f o l g e n d e n E r g e b n i s t a b e l l e a u f g e f ü h r t . 1 3 2 Lebensstil
Abiturtyp Geschlecht Ausbildungsgrad fili2i3i4 ηχπ°€
; r 0 c Pili2i3l4
vielseitig interessiert, 1. unterhaltungssuchend literarisch
weiblich
vor Vordiplom
15
4
0,0222 0,0000
männlich
Nach Vordiplom
16
5
0,0262 0,0000
vielseitig interessiert, nicht2. sportorientiert
132
literarisch
Technische Modellinformationen: N = 184; Anzahl Konfigurationen Γι χ r 2 χ r 3 χ r 4 = 32; Bonferroni-Korrektur des α-Niveaus von 5%: α ' = 0,05/32 = 0,00156. Absteigende ISA: Keines der vier Merkmale ist isoliert: (a) Lebensstil vs. Rest: χ 2 = 60,069875; df=21; ρ < 0,0000; (b) Abiturtyp vs. Rest: χ 2 = 23,092995; df = 14; ρ < 0,0588; (с) Geschlecht vs. Rest: χ 2 = 47,0161; df=15; ρ < 0,0000; (d) Ausbildungsgrad vs. Rest: χ 2 =2,6564; df=14; p < 0,0661 (das α-Fehlerniveau wurde für die absteigende I S A auf 10% gesetzt, cf. Abschnitt 9.1.4.2). Aufsteigende ISA: Die Interaktionsstruktur kann vollständig auf Interaktionen 1. Ordnung zurückgeführt werden: (a) Lebensstil vs. Abiturtyp: χ 2 = 12,8645; df = 3; ρ < 0,0049; (b) Lebensstil vs. Geschlecht: χ 2 = 37,9835; df = 3; ρ < 0,0000; (с) Lebensstil vs. Ausbildungsgrad: χ 2 = 12,990; df = 3; ρ < 0,0047; (d) Abiturtyp vs. Geschlecht: χ 2 = 7,8679; d f = 1 ; ρ < 0,0050; (e) Abiturtyp vs. Ausbildungsgrad: χ 2 = 1,6213; df = 1; ρ < 0,2029; (f) Geschlecht vs. Ausbildungsgrad: χ 2 = 8,7917; df = 1; ρ < 0 , 0 0 3 0 . Testvoraussetzungen: Obwohl der Anteil der Zellen mit einer erwarteten Häufigkeit < = 5 mit 43,8% hoch ist, ist der Anteil der Zellen mit einer erwarteten Häufigkeit < = 3 mit 3,1% wiederum sehr gering. D.h., es gibt kaum Zellen mit extrem geringer Besetzung. Aufgrund der Robustheit des Tests ist daher nicht mit nennenswerten Verzerrungen zu rechnen.
253
9. Das innere Gefüge der Sozialstruktur 9.2.2
K F A - M o d e l l Lebensstil χ Studienrichtung χ Abiturtyp
Zunächst sind hier die eindimensionalen Randsummen aufgeführt. Man erkennt deutlich, die asymmetrische Verteilung bei der Variable Studienrichtung, in der die Zahl der Studierenden der Fächergruppe Mathematik, Naturwissenschaften und Ökonomie sehr viel kleiner ist. Lebensstil / . - = 58 / 2 - = 32 /з-. = 4 2 /4- = 52 Lebensstil:
Studienrichtung /·.· = 50 f.2- = 119
Abiturtyp /·• ι = 100 / · · 2 = 84
/•3. = 15
Studienrichtung
Abiturtyp
ki: introvertiert ohne Schwerpunkte
k,: Sprache und Künste
кь literarisch
k2: unterhaltungssuchend, vielseitig
k2: Human- und Sozialw.
k2: nicht-literarisch
кэ: sportorientiert, vielseitig
k3: Math., Naturw., Ökon.
kt: kulturell aktiv, politisch kritisch
Die folgende Ergebnistabelle dieser KFA zeigt drei Typen, die jeweils eine prägnante Merkmalskombination von Lebensstil, Studienrichtung und Abiturtyp aufzeigen: 33
1. 2. 3.
133
Lebensstil vielseitig interessiert, unterhaltungssuchend vielseitig interessiert, sportorientiert kulturell aktiv, politisch kritisch
Studienrichtung
Abiturtyp
Sprache und Künste
literarisch
Mathematik, Naturw., nichtliterarisch Ökonomie Sprache und Künste
literarisch
fjli2i3 nx
ж0с
π
Pjlj2j3
11
5 0,0257 0,0027
7
2 0,0085 0,0002
17
8 0,0417 0,0003
Technische Modellinformationen: N = 184; Anzahl Konfigurationen τ ι χ τ2 χ r3 = 24; BonferroniKorrektur des α-Niveaus von 5%: α' = 0,05/24 = 0,00208. Absteigende ISA: Keines der drei Merkmale ist isoliert: (a) Lebensstil vs. Rest: χ2 = 22,1274; df = 12; ρ < 0,0361; (b) Studienrichtung vs. Rest: χ2 = 41,4348; df = 14; ρ < 0,0002; (с) Abiturtyp vs. Rest: χ2 = 35,5452; df = 11; ρ < 0,0002. Aufsteigende ISA: Die Interaktionsstruktur kann vollständig auf Interaktionen 1. Ordnung zurückgeführt werden: (a) Lebensstil vs. Studienrichtung: χ2 = 14,759; df = 6; ρ < 0,0222; (b) Lebensstil vs. Abiturtyp: χ2 = 12,8645; df = 3; ρ < 0,0049; (с) Studienrichtung vs. Abiturtyp: χ2 = 29,4272; df = 2; ρ < 0,0000. Testvoraussetzungen: Der Anteil der Zellen mit einer erwarteten Häufigkeit < 5 (41,7%) bzw. < 3 (33,3%) ist hoch. Dies liegt an den asymmetrischen Randverteilungen der Variablen Studienrichtung. Für die Interpretierbarkeit der Ergebnisse spricht jedoch, dass die Typenidentifikation in der KFA ein relativ robustes Verfahren darstellt und dass bei der Identifikation von Antitypen Zellen mit einer erwarteten Häufigkeit unter 5 nicht berücksichtigt wurden.
254
III. Der Schritt zur Variation
9.2.3
K F A - M o d e l l Lebensstil χ Studienrichtung χ G e s c h l e c h t
D i e eindimensionalen Randsummen sind bis auf die Variable Geschlecht mit den Randsummen aus d e m KFA-Modell Lebensstil χ Studienrichtung χ Abiturtyp identisch. Lebensstil / . - = 58 / 2 - = 32 /з·· = 4 2 /4- = 52
Studienrichtung U = 50 и =119 U = 15
Lebensstil:
Geschlecht / · · ι = 106 / · · 2 = 78
Studienrichtung
Geschlecht
ki: introvertiert ohne Schwerpunkte
ki: Sprache und Künste
ki: weiblich
кг: unterhaltungssuchend, vielseitig
k2: Human- und Sozialw.
k2: männlich
k3: sportorientiert, vielseitig
k3: Math., Naturw., Ökon.
к»: kulturell aktiv, politisch kritisch
D i e Konfigurationsanalyse mit den Merkmalen Geschlecht bringt drei Typen zum Vorschein: 134
1. 2. 3.
134
Lebensstil vielseitig interessiert, unterhaltungssuchend vielseitig interessiert, sportorientiert vielseitig interessiert, sportorientiert
Studienrichtung Sprache und Künste Human- und Sozialwissenschaften Mathematik, Naturw., Ökonomie
Lebensstil,
Geschlecht
f
ili2.i3
Studienrichtung
nxn0c
К
und
P.ilJ2i3
weiblich
13
5 0,0272 0,0002
männlich
24
12 0,0626 0,0000
männlich
7
1 0,0079 0,0002
Technische Modellinformationen: N = 184; Anzahl Konfigurationen η χ r2 χ r3 = 24; BonferroniKorrektur des α-Niveaus von 5%: α ' = 0,05/24 = 0,00208. Absteigende ISA: Keines der drei Merkmale ist isoliert: (a) Lebensstil vs. Rest: χ2 = 60,3917; df = 15; ρ < 0,0000; (b) Studienrichtung vs. Rest: χ 2 = 27,3597; df = 14; ρ < 0,0173; (с) Geschlecht vs. Rest: χ2 = 48,7814; df = 11; ρ < 0,0000. Aufsteigende ISA: Die Interaktionsstruktur kann vollständig auf Interaktionen 1. Ordnung zurückgeführt werden: (a) Lebensstil vs. Studienrichtung: χ2 = 14,7590; df = 6; ρ < 0,0222; (b) Lebensstil vs. Geschlecht: χ2 = 37,9835; df = 3; ρ < 0,0000; (с) Studienrichtung vs. Geschlecht: χ2 = 10,2519; df = 2; ρ < 0,0059. Testvoraussetzungen: Der Anteil der Zellen mit einer erwarteten Häufigkeit < 5 (41,7%) bzw. < 3 (33,3%) ist hoch. Dies liegt an den asymmetrischen Randverteilungen der Variablen Studienrichtung (cf. Fußnote 133).
255
9. Das innere Gefüge der Sozialstruktur 9.2.4
KFA-Modell Lebensstil χ Studienrichtung χ Ausbildungsgrad
In diesem Modell unterscheiden sich die eindimensionalen Randsummen von Lebensstil und Studienrichtung leicht von den Werten aus den vorhergehenden Modellen, da die Stichprobe nun um zwei Fälle umfangreicher ist. Außerdem findet man nachfolgend die Häufigkeitsverteilung des Merkmals Ausbildungsgrad. Lebensstil f x -
= 60
= 32 /з·· = 42 и . = 52 h -
Studienrichtung /-ι. = 50 / 2· = 121 U = 15
Ausbildungsgrad /••1 = 75 /••2=111
Die Konfigurationsanalyse mit den Merkmalen Lebensstil, Studienrichtung und Ausbildungsgrad zeigt als einziges Modell nicht nur Typen, sondern ebenfalls einen Antitypen (cf. Abschnitt 9.1.4.2 und Fußnote 130 zu den zusätzlichen Voraussetzungen für die Interpretierbarkeit von Antitypen). Zunächst sind nachfolgend die beiden Typen aufgeführt:
135
Lebensstil
Studienrichtung
Ausbildungsgrad fjlj2j3
Sprache und
1.
vielseitig interessiert, unterhaltungssuchend
vor dem Vordiplom
12
3
0,0186
0,0000
Mathematik,
2.
vielseitig interessiert, sportorientiert
nach dem Naturw., Ökonomie Vordiplom
7
2
0,0109
0,0014
Künste
ПХ7С0с
Pjlj2j3
π
Beim identifizierten Antityp handelt es sich um folgende Merkmalskombination:
1.
135
Lebensstil
Studienrichtung
vielseitig interessiert, sportorientiert
Ausbildungsgrad f|l|2j3 п
nach dem Sprache und Künste Vordiplom
1
х к
0 с
π
7
P.11j2i3
0,0362 0,9996
Technische Modellinformationen: N = 186; Anzahl Konfigurationen Γ| χ r 2 χ r 3 = 24; BonferroniKorrektur des α-Niveaus von 5%: a ' = 0,05/24 = 0,00208. Absteigende ISA: Keines der drei Merkmale ist isoliert: (a) Lebensstil vs. Rest: χ2 = 35,1068; df = 15; ρ < 0,0024; (b) Studienrichtung vs. Rest: χ 2 = 34,4595; df = 14; ρ < 0,0018; (с) Ausbildungsgrad vs. Rest: χ 2 = 29,8901; df = 11; ρ < 0,0016. Aufsteigende ISA: Die Interaktionsstruktur kann vollständig auf Interaktionen 1. Ordnung zurückgeführt werden: (a) Lebensstil vs. Studienrichtung: χ 2 = 14,7590; df = 6; ρ < 0,0222; (b) Lebensstil vs. Ausbildungsgrad: χ 2 = 12,990; df = 3; ρ < 0,0047; (с) Studienrichtung vs. Ausbildungsgrad: χ 2 = 13,9029; df = 2; ρ < 0,0001.
256
III. Der Schritt zur Variation
Die vier Konfigurationsfrequenzanalysen verdeutlichen den multivariaten Zusammenhang zwischen dem Lebensstil und den soziodemographischen Merkmalen. Die verschiedenen Lebensstiltypen finden sich in Merkmalskombinationen mit Eigenschaften mehrerer soziodemographischer Variablen wieder. In den Abschnitten 9.3 und 9.4 werden zunächst die (bivariaten) Zusammenhänge zwischen Variablenpaaren analysiert. In Abschnitt 9.5 wird der multivariate Ansatz wieder aufgegriffen und die kanonische Korrelation zwischen dem Lebensstil einerseits und den soziodemographischen Variablen andererseits berechnet.
9.3
Zusammenhang zwischen dem Lebensstil und den soziodemographischen Merkmalen
9.3.1
Lebensstil und Geschlecht
Abbildung 25: Geschlechterverhältnis der Lebensstile 50%
40%
30%
с 20% Φ Ν О
Geschlecht
10%
•weiblich ( g l männlich
0%
Lebensstiltypen Lebensstiltyp Lebensstiltyp Lebensstiltyp Lebensstiltyp
1: Introvertierter Typ ohne Interessensschwerpunkte 2: Vielseitig interessierter, unterhaltungssuchender Typ 3: Vielseitig interessierter, sportorientierter Typ 4: Kulturell aktiver, politisch kritischer Typ
Testvoraussetzungen: Der Anteil der Zellen mit einer erwarteten Häufigkeit < 5 (41,7%) bzw. < 3 (33,3%) ist hoch. Dies liegt an den asymmetrischen Randverteilungen der Variablen Studienrichtung (cf. Fußnote 133).
9. Das innere Gefüge der Sozialstruktur
257
Aufgrund der hohen beobachteten Effektgröße (w = 0,452) und der relativ großen Stichprobe (N = 188) wird die ß-Fehlerwahrscheinlichkeit bei α = 5% kleiner als α (d.h. die Teststärke 1-ß ist größer als 95%). Daher wird gemäß (i) der Entscheidungslogik in 4.1.3 faires Hypothesentesten angewandt, welches mit α = β = 0,5% möglich ist. Diese Werte stellen äußerst geringe Fehlerwahrscheinlichkeiten dar. Es gibt einen Zusammenhang zwischen Lebensstil und Geschlecht. Der k x l x2-Test zeigt einen signifikanten Unterschied in der Geschlechterverteilung beim Lebensstil (χ2 = 38,572; df = 3; ρ < 0,000). Das nominale Zusammenhangsmaß Cramer-V beträgt 0,453 (p < 0,000). Diagrammbeschreibung: Starke Unterschiede in der Geschlechterverteilung finden sich beim vielseitig interessierten, unterhaltungssuchenden Typ, bei dem der Frauenanteil besonders hoch ist, sowie beim vielseitig interessierten, sportorientierten Typ, bei dem der Männeranteil besonders hoch ist. Weiterhin sind Frauen häufiger unter dem kulturell aktiven, politisch kritischen Typ zu finden, wohingegen Männer etwas häufiger unter dem introvertierten Typ ohne Interessensschwerpunkte zu finden sind. Die deutlichen Geschlechtsunterschiede beim vielseitig interessierten, unterhaltungssuchenden Typ und beim vielseitig interessierten, sportorientierten Typ zeigen sich auch an den identifizierten prägnanten Merkmalskombinationen im KFA-Modell Lebensstil x Abiturtyp x Geschlecht x Ausbildungsgrad (cf. Abschnitt 9.2.1), ebenso wie im KFA-Modell Lebensstil x Studienrichtung x Geschlecht (cf. Abschnitt 9.2.3). 9.3.2
Lebensstil und Alter
Die Teststärke für den verteilungsfreien Kruskal-Wallis-H-Test wird mit einer Teststärkeanalyse für die parametrische Varianzanalyse geschätzt. Da hierbei, wie in 9.1.3.2 erläutert ist, die tatsächliche Teststärke überschätzt wird, werden zur Korrektur die Analysen mit einer Mindestteststärke von 88% statt 80% gerechnet. Bei α = 5%, einem Gesamtstichprobenumfang von N = 188 und mittlerer Effektstärke (f = 0,25) erreicht die Varianzanalyse mit einem 4-fach gestuften Faktor nur eine Teststärke 1-ß von 82%. Gemäß (iii) der Entscheidungslogik in 4.1.3 wird α daher auf 10% gesetzt, wodurch nun eine Teststärke von 89% erreicht wird. Im Kruskal-Wallis-H-Test zeigt sich ein signifikanter Altersunterschied zwischen den Typen des Lebensstils (χ2 = 15,058; df = 3; ρ < 0,002).136
136
Das Zusammenhangsmaß Cramer-V unterschätzt in diesem Fall den wahren Zusammenhang, da es nicht die ordinale Information der Altersvariablen berücksichtigt (Cramer-V = 0,315; ρ < 0,314). Es ist daher ratsam, dieses Maß hier nicht zu interpretieren (cf. Abschnitt 9.1.3.2).
258
III. Der Schritt zur Variation
Abbildung 26: Altersverteilung der Lebensstilgruppen 70%
со
60% •
Φ t: CD
С Φ Ν О CL
Φ Φ Q. CO И Φ СП
-4—'
19
20
21
22
23
24
25
26
27
28
29
30
Alter (6 Einzelfälle älter als 30 nicht angezeigt)
Lebensstiltyp Lebensstiltyp Lebensstiltyp Lebensstiltyp Altersmittelwerte
1: Introvertierter Typ ohne Interessensschwerpunkte 2: Vielseitig interessierter, unterhaltungssuchender Typ 3: Vielseitig interessierter, sportorientierter Typ 4: Kulturell aktiver, politisch kritischer Typ
der Lebensstiltypen:
XTypX
= 23,6;
X Ту ρ 4
= 23,5
хтур2
— 21,4;
хтуръ
— 22,9;
Diagrammbeschreibung: Die Verteilungen des introvertierten Typs ohne Interessensschwerpunkte, des vielseitig interessierten, sportorientierten Typs und des kulturell aktiven, politisch kritischen Typs sind approximativ allesamt beidseitig abfallend mit einer Konzentration im Bereich zwischen 21 und 24 Jahren. Nur die Verteilung des vielseitig interessierten, unterhaltungssuchenden Typs hat einen linkssteilen, einseitig abfallenden Verlauf, wodurch sich die Fälle in den jüngsten Alterssparten (19 und 20 Jahre) konzentrieren. Dieses Ergebnis ähnelt dem Verteilungsmuster des Lebensstils hinsichtlich des Ausbildungsgrades (cf. Abschnitt 9.3.1). Einzelvergleiche: Für den Kruskal-Wallis-H-Test wurden mit dem Mann-Whitney-UTest Einzelvergleiche zwischen den vier Lebensstilgruppen gerechnet.:
9. Das innere Gefüge der Sozialstruktur
259
Bei 6 möglichen paarweisen Einzelvergleichen ergibt die α-Fehlerkorrektur nach Bonferroni bei 10%igem α-Fehlerniveau ein korrigiertes α' von 0,1 / 6 = 0,017 (cf. Abschnitt 4.1.4). Die Teststärke für den verteilungsfreien Mann-Whitney-U-Test wird mit einem tTest für zwei unabhängige Stichproben geschätzt. Da auch hierbei, wie in 9.1.3.1 erläutert ist, die tatsächliche Teststärke überschätzt wird, werden zur Korrektur die Analysen mit einer Mindestteststärke von 88% statt 80% gerechnet. Auch bei α = 10% (d.h. α' = 0,017) erreichen die t-Tests bei mittlerer Effektstärke (ε = 0,5s; s = 1) nicht die Mindestteststärke 1-ß von 88%. Gemäß (iv) der Entscheidungslogik in 4.1.3 wird somit von mittleren Effektstärken abgewichen und die im Test angesetzte Effektstärke auf einen höheren Wert gesetzt, um die Mindesteffektstärke von 88% zu gewährleisten. Da die Gruppengrößen der einzelnen Lebensstiltypen nicht identisch sind, gibt es von Einzelvergleich zu Einzelvergleich etwas variierende Effektstärkewerte, die im Folgenden angegeben sind. Es zeigen sich nach Bonferroni-Korrektur signifikante Unterschiede auf dem 10%Niveau zwischen a.) Lebensstiltyp 2 und 1, d.h. zwischen dem vielseitig interessierten, unterhaltungssuchenden Typ und dem introvertierten Typ ohne Interessensschwerpunkte (MannWhitney-U = 500; ρ < 0,000). Dieser Einzelvergleich weist Effekte der Größe ε = 0,80s nach. b.) Lebensstiltyp 2 und 3, d.h. zwischen dem vielseitig interessierten, unterhaltungssuchenden Typ und dem vielseitig interessierten, sportorientierten Typ (MannWhitney-U = 427; ρ < 0,007). Dieser Einzelvergleich weist Effekte der Größe ε = 0,85s nach. c.) Lebensstiltyp 2 und 4, d.h. zwischen dem vielseitig interessierten, unterhaltungssuchenden Typ und dem kulturell aktiven, politisch kritischen Typ (Mann-Whitney-U = 503,5; ρ < 0,002). Dieser Einzelvergleich weist Effekte der Größe ε = 0,81s nach. Es zeigt sich somit, dass die Einzelvergleiche nur große Effekte aufzeigen können (die von Cohen vorgeschlagene Konvention für große Effekte liegt bei ε = 0,8s). Die Einzelvergleichstests reagieren somit hinsichtlich der Effektstärke deutlich unsensibler als der globale Kruskal-Wallis-H-Test, der auf mittlere Effekte (ε = 0,5s) reagiert. Dies bedeutet, dass es unter den drei Einzelvergleichen, die nicht signifikant wurden, möglicherweise tatsächliche Unterschiede gibt, die unentdeckt geblieben sind (die Effektstärken der drei nicht signifikanten Einzelvergleichstests liegen in einem Wertebereich von 0,68s