118 52 7MB
German Pages 269 [271] Year 2013
BEIHEFTE
Simon Pickl
Probabilistische Geolinguistik Geostatistische Analysen lexikalischer Variation in Bayerisch-Schwaben
Germanistik
ZDL
Franz Steiner Verlag
zeitschrift für dialektologie und linguistik
beihefte
154
Simon Pickl Probabilistische Geolinguistik
zeitschrift für dialektologie und linguistik beihefte In Verbindung mit Michael Elmentaler und Jürg Fleischer herausgegeben von Jürgen Erich Schmidt
band 154
Simon Pickl
Probabilistische Geolinguistik Geostatistische Analysen lexikalischer Variation in Bayerisch-Schwaben
Franz Steiner Verlag
Gedruckt mit freundlicher Unterstützung durch die Stiftungsund Förderungsgesellschaft der Paris-Lodron-Universität Salzburg und durch die Graduiertenschule für Geistes- und Sozialwissenschaften Augsburg.
Bibliografische Information der Deutschen Nationalbibliothek: Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über abrufbar. Dieses Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist unzulässig und strafbar. © Franz Steiner Verlag, Stuttgart 2013 Druck: Laupp & Göbel GmbH, Nehren Gedruckt auf säurefreiem, alterungsbeständigem Papier. Printed in Germany. ISBN 978-3-515-10463-0
According to quantum physics, no matter how much information we obtain or how powerful our computing abilities, the outcomes of physical processes cannot be predicted with certainty because they are not determined with certainty. Instead, given the initial state of a system, nature determines its future state through a process that is fundamentally uncertain. In other words, nature does not dictate the outcome of any process or experiment, even in the simplest of situations. Rather, it allows a number of different eventualities, each with a certain likelihood of being realized. … Quantum physics might seem to undermine the idea that nature is governed by laws, but that is not the case. Instead it leads us to accept a new form of determinism: given the state of a system at some time, the laws of nature determine the probabilities of various futures and pasts rather than determining the future and past with certainty. Though that is distasteful to some, scientists must accept theories that agree with experiment, not their own preconceived notions. What science does demand of a theory is that it be testable. If the probabilistic nature of the predictions of quantum physics meant it was impossible to confirm those predictions, then quantum theories would not qualify as valid theories. But despite the probabilistic nature of their predictions, we can still test quantum theories. For instance, we can repeat an experiment many times and confirm that the frequency of various outcomes conforms to the probabilities predicted. – Stephen h awking / Leonard MLodinow, „The Grand Design“
VoRWoRT Die vorliegende Arbeit wurde im Februar 2012 von der philologisch-historischen Fakultät der Universität Augsburg als Dissertation angenommen. Sie ist im Rahmen des DFG-finanzierten interdisziplinären Forschungsprojekts Neue Dialektometrie mit Methoden der stochastischen Bildanalyse entstanden (Lehrstuhl für Deutsche Sprachwissenschaft, Universität Augsburg, und Institut für Stochastik, Universität Ulm). Für die Drucklegung wurde sie leicht überarbeitet und aktualisiert. An dem Gelingen der Arbeit waren mehrere Personen und Institutionen auf unterschiedliche Weise beteiligt, denen ich an dieser Stelle danken möchte. Mein ganz besonderer Dank gilt meinen beiden Betreuern, Prof. Dr. Stephan Elspaß und Prof. Dr. Werner König. Beiden habe ich für diese Arbeit und darüber hinaus mehr zu verdanken, als ich hier aufzählen kann. Prof. Dr. Dieter Götz danke ich dafür, dass er sich kurzfristig und unkompliziert als Drittprüfer für die mündliche Prüfung zur Verfügung gestellt hat. Weiterhin möchte ich allen weiteren am Projekt beteiligten Wissenschaftlern aus Augsburg und Ulm meinen herzlichen Dank aussprechen, ohne die diese Arbeit nicht möglich gewesen wäre. Insbesondere danke ich Simon Pröll, Dr. Jonas Rumpf, Henrik Haßfeld, Aaron Spettl und allen weiteren wissenschaftlichen Mitarbeitern und Hilfskräften für die gute Zusammenarbeit und viele fruchtbare Diskussionen. Herzlich danken möchte ich allen Freunden und Kollegen von der Universität Augsburg, die auf unterschiedlichste Art und Weise zum Gelingen der Arbeit beigetragen haben, nicht zuletzt dadurch, dass sie mir ermöglicht haben, in einem ‒ menschlich wie akademisch ‒ äußerst angenehmen und produktiven Umfeld arbeiten zu können. Besonders sei hier Dr. oliver Ernst für viele wertvolle Ratschläge gedankt, Dr. Ulrike Zuckschwerdt für den intensiven und offenen Austausch und Elisabeth Bunz für so manche unbürokratische Hilfe. Darüber hinaus bedanke ich mich bei der Deutschen Forschungsgemeinschaft dafür, dass sie diese Forschung ermöglicht hat, und den Herausgebern der Beihefte der Zeitschrift für Dialektologie und Linguistik für die Aufnahme meiner Arbeit in ihre Reihe. Der Stiftungs- und Förderungsgesellschaft der Paris-Lodron-Universität Salzburg und der Graduiertenschule für Geistes- und Sozialwissenschaften Augsburg danke ich für die großzügige Gewährung von Druckkostenzuschüssen. Widmen möchte ich diese Arbeit meinen Eltern, ohne deren Liebe zum Dialekt diese Arbeit wohl nicht entstanden wäre. Salzburg, Mai 2013
Simon Pickl
InHALTSVERZEIcHnIS VoRWoRT ........................................................................................................... 7 1 EInLEITUnG ................................................................................................ 13 1.1 Motivation ................................................................................................ 14 1.1.1 Die Variation in der Variation ........................................................ 16 1.1.2 Ziele ............................................................................................... 21 1.2 Forschungsgeschichtliche Grundlagen .................................................... 23 1.2.1 Faktoren sprachgeographischer Strukturen ................................... 24 1.2.1.1 Innersprachliche Faktoren ................................................ 25 1.2.1.2 Außersprachliche Faktoren ............................................... 28 1.2.2 Quantitative Methoden in der Sprachgeographie .......................... 31 2 THEoRIE ....................................................................................................... 36 2.1 Sprachdynamik im Raum ........................................................................ 36 2.1.1 Synchronie und Diachronie ........................................................... 38 2.1.2 Sprachvariation und Sprachwandel ................................................ 39 2.1.3 Mechanismen des Sprachwandels .................................................. 42 2.1.3.1 Innovation ......................................................................... 44 2.1.3.2 Etablierung ........................................................................ 47 2.1.3.3 Diffusion ........................................................................... 51 2.2 Raumkonzepte ......................................................................................... 56 2.2.1 Euklidischer Raum ........................................................................ 58 2.2.2 Sozialer Raum ................................................................................ 60 2.2.3 Kognitiver Raum ............................................................................ 61 2.2.4 Kommunikationsraum ................................................................... 62 2.3 Diatopische Varietäten ............................................................................. 63 3 DATEn ........................................................................................................... 72 3.1 Struktur der Daten ................................................................................... 72 3.2 Lexikalische Systematik .......................................................................... 75 4 METHoDIK ................................................................................................... 79 4.1 Der sprachliche Beleg als statistische Stichprobe ................................... 81 4.2 Von der Punktsymbol- zur Flächenkarte ................................................ 82 4.2.1 Datenseparation und Belegkarten .................................................. 83 4.2.2 Intensitätsschätzung ....................................................................... 86 4.2.3 Gradierte Flächenkarten ................................................................ 92
10
Inhaltsverzeichnis
4.3 Abstandsmaß ............................................................................................ 96 4.3.1 Lexikalische Distanz ..................................................................... 98 4.3.2 Implementierung .......................................................................... 102 4.4 Distributionskennwerte ......................................................................... 104 4.4.1 Komplexität .................................................................................. 106 4.4.2 Kompaktheit ................................................................................. 107 4.4.3 Homogenität ................................................................................. 108 4.4.4 Zusammenfassung und Beispiele ................................................ 109 4.5 Wahl der Parameter ................................................................................110 4.5.1 Bandbreite .....................................................................................110 4.5.2 Kernfunktion ................................................................................113 4.5.3 Abstandsmaß .................................................................................114 4.5.4 Abstraktionslevel ..........................................................................116 4.6 Statistische Verfahren .............................................................................116 4.6.1 Testen von Hypothesen .................................................................116 4.6.2 Monte-carlo-Methoden ................................................................117 4.6.3 Faktorenanalyse ............................................................................118 5 AnALySE .................................................................................................... 120 5.1 Konfirmatorisch (data-based) ............................................................... 120 5.1.1 Gebrauchsfrequenz ...................................................................... 120 5.1.2 Variablengruppen ......................................................................... 125 5.1.2.1 Wortarten ........................................................................ 128 5.1.2.2 Bände .............................................................................. 129 5.1.2.3 Themengebiete ................................................................ 130 5.1.2.4 Zusammenfassung ...........................................................135 5.1.3 Barrieren und Verstärker ..............................................................141 5.1.3.1 Flüsse .............................................................................. 146 5.1.3.2 Politische Grenzen ...........................................................148 5.1.3.3 Exploratorengrenzen ....................................................... 154 5.1.3.4 Zusammenfassung ...........................................................157 5.2 Explorativ (data-driven): Faktorenanalyse .............................................158 5.2.1 Beschaffenheit der Daten ..............................................................159 5.2.2 Faktorenzahl ................................................................................ 160 5.2.3 Faktorladungen .............................................................................161 5.2.4 Faktorwerte ...................................................................................163 5.2.5 Faktoren und Dialekttypen ...........................................................167 5.2.6 Die Faktoren ..................................................................................170 Faktor 1: ‚Allgäuerisch‘.................................................................170 Faktor 2: ‚nordostschwäbisch‘ ......................................................171 Faktor 3: ‚Lechrainisch‘ ................................................................172 Faktor 4: ‚Mittelostschwäbisch‘ ....................................................174 Faktor 5: ‚Mittelbairisch‘...............................................................174 Faktor 6: ‚nordbairisch‘ ................................................................176
Inhaltsverzeichnis
11
Faktor 7: ‚Region Ulm‘ .................................................................176 Faktor 8: ‚Donau-Lech-Winkel‘ ................................................... 180 Faktor 9: Teilaufnahmen und fehlende Belege ............................ 180 Faktor 10: ‚Region Lauingen / Westteil Pfalz-neuburg‘ ...............182 Faktor 11: ‚Stauden‘...................................................................... 184 Faktor 12: ‚Einzugsgebiete Iller und Lech‘ ...................................185 Faktor 13: ‚Städte‘ .........................................................................187 Faktor 14: ‚Region Weilheim‘ .......................................................189 Faktor 15: ‚Region Memmingen‘ ................................................. 190 Faktor 16: ‚Region Mindelheim‘ .................................................. 192 Faktor 17: ‚ostteil Pfalz-neuburg‘ ............................................... 192 Faktor 18 ...................................................................................... 194 Faktor 19 ...................................................................................... 194 Faktor 20 ...................................................................................... 196 5.2.7 Fazit: Vor- und nachteile der Faktorenanalyse ............................ 196 5.2.8 Ortsprofile .................................................................................... 198 5.2.9 Ausblick: Faktorenanalyse als Schätzverfahren .......................... 200 6 MoDELL ..................................................................................................... 204 6.1 Varianten im Raum ................................................................................ 205 6.1.1 Innovation .................................................................................... 207 6.1.2 Etablierung ....................................................................................210 6.1.3 Diffusion .......................................................................................217 6.2 Varietäten im Raum ............................................................................... 223 6.2.1 Dialekte und Dialekttypen ........................................................... 224 6.2.2 Varietäten und Varianten ............................................................. 226 7 ScHLUSS ..................................................................................................... 228 7.1 Ergebnisse .............................................................................................. 228 7.1.1 Methodik ...................................................................................... 228 7.1.2 Analyse ........................................................................................ 229 7.1.3 Theorie und Modell ..................................................................... 230 7.2 Ausblick ..................................................................................................231 LITERATURVERZEIcHnIS .......................................................................... 233 AnHAnG ......................................................................................................... 247 A.1 Liste der Aufnahmeorte ......................................................................... 247 A.2 Farbabbildungen ..................................................................................... 249
1 EInLEITUnG Im Jahr 1969 führte wiLLiaM Labov das Konzept der „variablen Regel“ ein, das es erstmals erlaubte, Variation systematisch als integralen Teil der Sprache eines Sprechers oder einer Sprechergemeinschaft zu beschreiben (Labov 1969). Bis dahin war sprachliche Variation – vor allem von der generativistischen Schule – oft als reines Performanzphänomen ohne systematischen charakter gesehen worden. Fünf Jahre nach LabovS Vorstoß wurde das Konzept der variablen Regel durch henrietta J. Cedergren und david Sankoff in ein mathematisches Modell überführt, das sprachliche Äußerungen als statistische Stichproben aus einer probabilistischen Sprecherkompetenz behandelt. Cedergren/Sankoff (1974, 353) „distinguish rule probabilities from rule frequencies, assigning the former to competence and the latter to performance“. Ihr Modell beschreibt sprachliche Variablen als Wahrscheinlichkeitsräume, die das Auftreten ihrer Varianten probabilistisch steuern. Die Wahrscheinlichkeiten werden dabei von inner- oder außersprachlichen Bedingungsfaktoren (sogenannten constraints) beeinflusst und manifestieren sich an der beobachtbaren Oberfläche als messbare relative Variantenfrequenzen. Die Kompetenz eines Sprechers wird so durch bedingte Auftretenswahrscheinlichkeiten von Varianten beschrieben. Die anfänglich vor dem Hintergrund des von ChoMSky begründeten generativistischen Paradigmas entstandene, von Labov und Cedergren/Sankoff maßgeblich geprägte Theorie der Sprachvariation entwickelte sich zu einem neuen Paradigma, der jungen Soziolinguistik, die sich bald dezidiert gegen das Axiom der Generativisten stellte, sprachliche Variation sei ein reines Performanzphänomen (vgl. Cedergren/Sankoff 1974, 352; britain 2010, 74). In der Soziolinguistik wird sprachliche Variation als integraler Bestandteil der Sprecherkompetenz und der Sprachproduktion betrachtet. Während die Annahme von systeminhärenter Variation zum wesentlichen Merkmal der Sozio- bzw. Variationslinguistik schlechthin wurde, lebt das mathematische Modell von Cedergren/Sankoff vor allem in Form des Analyseprogramms Varbrul und seiner Derivate weiter, die den Einfluss von constraints auf Variantenwahrscheinlichkeiten berechnen und so bei der praktischen Analysearbeit wertvolle Einsichten in das Verhältnis von Variablen zu ihrem inner- und außersprachlichen Kontext liefern. Die Beschäftigung mit den theoretischen Implikationen eines probabilistischen Variationsmodells sowie der Ausbau seiner Anwendung in den variationslinguistischen Teilbereichen führte dagegen eher ein Schattendasein;1 insbesondere im Bereich der Dialektologie, die v. a. im angloamerikanischen Raum mittlerweile als ein Teilbereich der Soziolinguistik behandelt wird und sich ihren Methoden auch im deutschsprachigen Raum im1
Es gibt Ausnahmen (z. B. Mendoza-denton/h ay/Jannedy 2003). Im Bereich der quantitativen Linguistik wurden einige Modelle erarbeitet, die zumindest implizit probabilistisch arbeiten (z. B. a LtMann et al. 1983).
14
Einleitung
mer mehr öffnet, fehlt bislang eine probabilistisch ausgerichtete Theorien- und Modellbildung. Die vorliegende Arbeit nimmt konkrete dialektologische Fragestellungen zum Anlass, um diesen in meinen Augen überfälligen Schritt zu unternehmen und die Dialektologie mit einem probabilistisch-variationslinguistischen Modell auszustatten. Als konkrete Untersuchungsgegenstände dienen dabei die geographischen Verteilungen lexikalischer Varianten. Mit den wortgeographischen Karten des „Sprachatlas von Bayerisch-Schwaben“ (SBS) steht ein umfangreiches Kartenkorpus als Datengrundlage bereit (vgl. Kapitel 3), das insofern aus einem ‚klassischen‘ Dialektatlas stammt, als der SBS in erster Linie den zur Zeit der Erhebung ältesten erreichbaren Stand des Basisdialekts dokumentiert (vgl. SBS, Bd. 1, 15, 26). Die Methoden zur Vorverarbeitung und Auswertung der Daten wurden im Rahmen des DFG-finanzierten, interdisziplinären Forschungsprojekts Neue Dialektometrie mit Methoden der stochastischen Bildanalyse entwickelt, einer Kollaboration des Lehrstuhls für Deutsche Sprachwissenschaft, Universität Augsburg, und des Instituts für Stochastik, Universität Ulm (weitere in Zusammenhang mit dem Projekt stehende Publikationen sind: ruMpf et al. 2009; 2010; piCkL/ruMpf 2011; 2012; MeSChenMoSer /pröLL 2012a; 2012b; pröLL 2013; piCkL 2013; pröLL/piCkL/SpettL [i. E.]; piCkL et al. [i. V.]).2 Mit eigens implementierten und/oder entwickelten geostatistischen Methoden werden die Daten zunächst unter Berücksichtigung empirisch-statistischer und variationslinguistischer Grundlagen vorverarbeitet. Die so aufbereiteten Daten werden sodann mittels statistischer Tests ausgewertet, um den Einfluss von inner- und außersprachlichen Faktoren auf geographische Variantenverbreitungen im Korpus zu erhellen. Im Anschluss wird ein Data-MiningVerfahren zur Identifikation von latenten Strukturen in den Daten angewandt. Auf der Grundlage der Ergebnisse folgt schließlich ein Versuch der probabilistischen Modellierung geolinguistischer Variation. 1.1
MoTIVATIon
[…] dialectologists should not be content simply to describe the geographical distribution of linguistic features. They should also be concerned to explain – or perhaps, more accurately, to adduce reasons for – this distribution. only in this way will we be able to arrive at an understanding of the sociolinguistic mechanisms that lie behind the geographical distribution of linguistic phenomena, the location of isoglosses, and the diffusion of linguistic innovations. (trudgiLL 1974, 216–217)
In diesem Zitat fasst peter trudgiLL die Essenz dessen zusammen, was das Erkenntnisinteresse der Dialektologie bzw. der Geolinguistik3 ausmacht: die Identifikation von Mechanismen und Faktoren der räumlichen Verbreitung sprachlicher 2 3
Ich danke meinen Kollegen aus Augsburg und Ulm herzlich für die hervorragende Zusammenarbeit. obwohl ein nicht zu vernachlässigender Unterschied zwischen den Termini Dialektologie und Geolinguistik besteht, sind sie in dieser Arbeit an vielen Stellen austauschbar.
Motivation
15
Varianten. Der Beitrag, den diese Arbeit auf diesem Gebiet leisten soll, lässt sich in drei Hauptpunkten zusammenfassen: 1. Auf der methodischen Ebene die Bereicherung der quantitativen Analyseverfahren der Geolinguistik um geeignete und sinnvolle Ergänzungen, 2. auf praktischer Ebene die Auswertung von empirischen Daten mit den entwickelten Methoden, um diese zu erproben und Erkenntnisse über die sprachgeographischen Verhältnisse im untersuchten Bereich zu gewinnen, und 3. auf theoretischer Ebene die Bereitstellung eines Deutungsrahmens für die Ergebnisse und die Methoden, der sie in den größeren Rahmen geo- und soziolinguistischer Theorie stellt. Besonderes Augenmerk liegt dabei auf der Anpassung probabilistischer Modelle aus der Soziolinguistik für die Geolinguistik. Die Methoden müssen dabei so beschaffen sein, dass sie auf die Theorie bezogen und mit ihr vereinbar sind. Insbesondere wird sich zeigen, dass die diatopische Ausprägung des probabilistischen Variationsbegriffs bei Cedergren/Sankoff, der die theoretische Seite dieser Arbeit bestimmt, ihr praktisches und geradezu natürliches Gegenstück in geostatistischer Methodik hat, die bisher in der Sprachgeographie wenig Anwendung fand (vgl. Kapitel 4). Im Jahr 1993 schrieben Jay Lee und wiLLiaM a. k retzSChMar Jr. in ihrem Aufsatz „Spatial analysis of linguistic data with GIS functions“: It is somewhat surprising that up to this point linguistic researchers have not maintained closer relations with other geographers except for cartographic assistance. During the 1980s geographers have achieved major advances in two areas: development of powerful GIS software and development of statistical models for analysis of geographical patterns of data, such as point pattern analysis, spatial autocorrelation, spatial filtering, and many others. Using this progress, a bridge between dialectologists and professional geographers can be built for mutual benefit. For those interested in language variation, finally there will be tools available for validation of areal boundaries and patterns to parallel those now in use to discuss social patterns. Geographers will be able to consider language data on the same terms as data from other fields. Finally, there is an opportunity here to use validated empirical evidence to improve our notions of dialects as well as to study differences in geographical distribution of single features. (Lee/k retzSChMar 1993, 541)
Umso überraschender ist es, dass diese Idee in den 20 Jahren, die seit Erscheinen dieses programmatischen Artikels vergangen sind, praktisch nicht weiterverfolgt wurde und nur sehr sporadisch dialektologische Arbeiten erschienen sind, die sich geostatistische Methoden zunutze machen (vgl. auch hoCh/hayeS 2010, 24).4 Der Fokus der quantitativ arbeitenden Dialektologie scheint in den letzten Dekaden fast ausschließlich auf aggregative, klassifikatorische Verfahren gerichtet gewesen zu sein, bei denen die Geographie oft erst bei der kartographischen Darstellung eine Rolle spielt (vgl. 2.2). Das primäre Erkenntnisinteresse war es, auf quantitativem Wege Dialektregionen und -grenzen zu ermitteln. Sogar in dem oben zitierten Aufsatz wird die Einteilung des Raums in Sprachregionen als ultimatives Ziel der
4
Ausnahmen sind etwa Light/k retzSChMar (1996) oder grieve (2009).
16
Einleitung
geostatistischen Methoden dargestellt, obwohl diese primär für die Analyse einzelner Variablen gedacht sind.5 Es lässt sich also konstatieren, dass in der Sprachgeographie Untersuchungen mit (geo-)statistischen Mitteln weiterhin unterrepräsentiert sind. Ein Schritt, die Anregung von Lee/k retzSChMar aufzugreifen und fortzuführen, wurde mit dem Augsburg/Ulmer Forschungsprojekt Neue Dialektometrie (vgl. 1) unternommen. Die dort entwickelten Verfahren sind darauf zugeschnitten, die individuelle Variation einzelner Variablen zu bewahren, gesondert auszuwerten und zu vergleichen, um den durch Aggregation herbeigeführten Variationskollaps (vgl. 1.2.2, 4) zu vermeiden. Dadurch eröffnen sich völlig neue Möglichkeiten, eine Dimension der geolinguistischen Variation zu untersuchen, die bisher von quantitativen Methoden weitgehend unberührt geblieben ist: Die ‚Variation in der Variation‘, d. h. die Unterschiede, Gemeinsamkeiten und Besonderheiten der geographischen Verteilungen individueller sprachlicher Variablen und Varianten. 1.1.1 Die Variation in der Variation Jede sprachliche Veränderung und mithin auch die Entstehung jeder dialektischen Eigentümlichkeit hat ihre besondere Geschichte. Die Grenze, bis zu welcher sich die eine erstreckt, ist nicht massgebend für die Grenze der anderen. – herMann pauL, „Prinzipien der Sprachgeschichte“
Wenn man in erster Linie mit der traditionellen Dialektometrie, wie sie in Abschnitt 1.2.2 umrissen wird, vertraut ist, so ist man wahrscheinlich vor allem an der Abgrenzung und Einteilung von Dialekten interessiert und hat von Haus aus wenig Interesse an der Variation z wischen den räumlichen Verteilungen sprachlicher Variablen. Die Beschäftigung mit der Dialektgeographie erschöpft sich dann im Messen der Ähnlichkeit von ortsdialekten, in der Feststellung von stärkeren und schwächeren Grenzlinien zwischen ihnen oder von Dialektgebieten verschiedener Größe. Verschiedenste Analysetechniken erlauben es, die aggregierten Dialektdaten zu visualisieren und auszuwerten. Damit, so könnte man meinen, ist die diatopische Variation im betrachteten Gebiet quantitativ umfassend beschrieben. Jedoch übersieht man so folgenden Umstand, durch den überhaupt erst stärkere und schwächere Grenzen zwischen Dialekten, ähnlichere und unähnlichere ortsdialekte zustande kommen können: nicht alle sprachlichen Variablen, die im 5
„Once a significant areal pattern is detected for a combination of given words, one can attempt to draw boundaries between informants and communities to express agglomerations of occurrence and thus construct linguistic regions. In this fashion, one can look forward to boundaries that segregate different linguistic regions based on results of quantitative analysis which are statistically validated.“ (Lee/k retzSChMar 1993, 554)
17
Motivation
2 Dos 1 Slo
3 Wsm
11 Meg
19 Rut
37 Ebm
46 ULi
61 Gre
62 Ltb
60 Höc
58 UBe 71 Kik
69 Gun
72 Wer 84 Lag
79 Rih
82 Vil
81 Glö
! 83 Ema
80 Off 95 Lph
, 10 9 Nu l
96 Gün
85 Aff
99 Röf
93 Sth 112 RiK 110 Reu
117 Stk
136 Döp
145 Ilt
147 Bth
148 Kru
152 Mik
150 Baz
149 NRa
! 153 GAi
176 Kmz
165 Kih
163 Olg 179 Btb 177 Wir
' , 180 Sal
167 Swg
166 Mit ' 181 MWa
! 178 Dih
143 Eur
204 Bux
192 Lau 193 Dax
194 Kam 195 Min
207 Wsh
206 Mmb 205 Mmg
208 Mus
219 Dik 221 Lac ! 220 Wor 222 Oto * 218 Kro 234 Grö 233 Leg
246 Mut
209 Dlw
157 Mch
160 OSw
159 Ahg
172 D ün
173 Jes
187 Swh
' 223 MRe
249 Utr
251 Rud 250 Kra
261 Wig
265 OTh ! 263 Btz 262 Kem
241 Fra
252 MOd 266 Leu
146 Ohs
145 Ilt
147 Bth
161 Alt
179 Btb
l 204 Bux
l 206 Mmb l 205 Mmg
l 219 Dik l 220 Wor
230 Lud
l 218 Kro
232 Päh , 245 Wes
l 233 Leg
l 234 Grö
254 Inr
259 WOb
255 Ast 256 Ptg
257 HPb 258 Psb
l l 246 Mut
! 272 Hug l K 260 Kzt
270 Rot
268 Bbe 269 Stg
Abb. 1a: ‘niesen’ (K. 2.47)
271 Söf
l 247 Alr
l 261 Wig
180 Sal
166 Mit
140 Kis
143 Eur
K K 169 Gra
l 223 MRe l 222 Oto l 236 R on
l 224 Egt
l 172 D ün
l 187 Swh
183 Smh
l 238 Ebh l 249 Utr
l 264 Wpr l l ! 263 Btz 262 Kem
196 Ram 197 Tür
l K 225 Pfz
l 265 OTh
K 211 Wch
l 188 Tfd
214 Lfl
l 267 Stg
l 254 Inr
D
l K 229 Dkl
l 255 Ast l 256 Ptg
l 270 Rot l 269 Stg
217 Hrg l 231 Dis
230 Lud
l! 244 Brk D l 243 Hfh
l 268 Bbe
D l l 215 Ent
216 Deh
K 226 Wsd 227 Lfd 228 Asc
l l 2 53 Bh o 252 MOd
189 Grf
200 Swi
K K K 213 Elo 212 Waa
l 242 Oze 240 Kfb l! K 239 OBe 241 Fra
l 266 Leu
173 Jes
l 203 Ing 202 OSo
201 Söd
! 198 Hol
l 251 Rud l 250 Kra
160 OSw l 174 Mam
171 Pri D K D 170 Seu
184 OMt
181 MWa
21 0 W ör
D 144 Pff
! 159 Ahg
157 Mch
168 Smü
l 126 Töd
142 Eis
185 Kfg 194 Kam 195 Min
209 Dlw l 208 Mus
l 248 Dim
167 Swg
141 Otm
1 39 Ha u
153 GAi
182 Etr
l 207 Wsh
l 235 Böh
121 Sta
138 Inn K 156 Kön 154 Bob
136 Döp
108 S bg
106 Gri
123 Lec 124 Wul l * l 122 Aug 125 Har
137 Anh
178 Dih
l l 192 Lau 193 Dax
190 Hei
217 Hrg
231 Dis
244 Brk
K 177 Wir
! 191 NiR
107 Aic 105 Müh 104 Ger
152 Mik
150 Baz
165 Kih
163 Olg
176 Kmz
87 Lwd 103 Gab
135 Ust
148 Kru 149 NRa ! 164 Ale
243 Hfh
2 53 Bh o 267 Stg
130 Rog
78 Grm
90 Inh
89 Pet
119 Big
134 OSö K 133 Zim
132 Eds
203 Ing
215 Ent
229 Dkl
239 OBe
117 Stk
77 Pöt
88 Tod
* 10 2 Re t
118 Aga 115 Bur
131 Sto
129 ORe
216 Deh
242 Oze
240 Kfb
264 Wpr 260 Kzt
214 Lfl
224 Egt 236 R on
235 Böh
248 Dim
202 OSo
199 Lbg 200 Swi
213 Elo
! 226 Wsd 227 Lfd 228 Asc
225 Pfz
238 Ebh
247 Alr
212 Waa
116 Fhd
11 3 Ich
111 Beu
128 Ilb
188 Tfd
201 Söd
196 Ram 197 Tür 198 Hol
85 Aff
101 Bon
68 Klm
76 Baa
75 Thi
D 7 4 Me i
120 Omh 114 Ett
162 ORo 175 Lbr
189 Grf
' ,* 211 Wch
110 Reu
171 Pri 170 Seu
184 OMt
21 0 W ör
112 RiK
10 9 Nu l
127 Wll 144 Pff
142 Eis
185 Kfg 191 NiR * 190 Hei
83 Ema
100 Wöa
* 99 Röf
151 Lnf
183 Smh
182 Etr
98 Knö 97 Def
66 Wal
64 Elg
86 Bib
96 Gün
156 Kön
155 OOt
168 Smü
141 Otm 140 Kis
! 169 Gra
164 Ale 162 ORo 161 Alt
126 Töd
125 Har
1 39 Ha u
154 Bob
95 Lph 94 Elh
91 Pfl
124 Wul
122 Aug
138 Inn 151 Lnf
146 Ohs
121 Sta
84 Lag
S 82 Vil
81 Glö
93 Sth
123 Lec
137 Anh
92 OEl
108 S bg
106 Gri
55 Erg
67 Ehk
65 Müs
S 73 L rh
72 Wer
80 Off ,* 107 Aic 105 Müh
104 Ger
135 Ust 133 Zim
130 Rog
79 Rih
87 Lwd 103 Gab
119 Big
134 OSö
132 Eds
69 Gun
90 Inh
89 Pet
! 10 2 Re t ! 120 Omh
118 Aga 115 Bur
131 Sto
129 ORe
! 128 Ilb
116 Fhd
11 3 Ich
111 Beu
127 Wll
114 Ett
71 Kik
7 4 Me i 88 Tod
! 62 Ltb 63 Ehi
70 Dlg
78 Grm
42 Bit
54 Bhm
53 RaL
50 Mrt 61 Gre 60 Höc
58 UBe
77 Pöt
41 Ren
52 Gen 51 Egs
48 Tap
59 Ber
57 Bah
68 Klm
75 Thi
86 Bib
! 101 Bon
! 100 Wöa
98 Knö
' 97 Def
94 Elh
66 Wal ! 76 Baa
46 ULi
44 Zir
56 Alb
67 Ehk
65 Müs
73 L rh
45 Dem
43 Stf
39 Ahm 40 Mxh 49 Don
47 Bis 55 Erg
34 Bid
33 Wlm
D 31 Da i
38 Kai
37 Ebm
42 Bit
54 Bhm
53 RaL
64 Elg
63 Ehi 70 Dlg
! 92 OEl
41 Ren
52 Gen 51 Egs
32 Tag
29 Itz
26 KSh 36 M ög
35 Fhm
50 Mrt 59 Ber
57 Bah
91 Pfl
27 Hdg 25 Hür
39 Ahm 40 Mxh 49 Don
48 Tap
44 Zir
56 Alb
33 Wlm
24 OEi
30 Mon
28 Fün
31 Da i
47 Bis 45 Dem
32 Tag
29 Itz
38 Kai
l!
23 Möh
19 Rut
34 Bid
l
l 15 Bwg
l l 22 Lah 21 Wlh
20 Wem 17 Nör
26 KSh ! 36 M ög
l 14 Dft
13 Mör
12 Dök
18 Pfä
30 Mon
27 Hdg 25 Hür 35 Fhm
11 Meg
16 Was
24 OEi 23 Möh
l
l 6 Det
10 Oet
8 Mof
15 Bwg
22 Lah 21 Wlh
28 Fün
43 Stf
14 Dft
13 Mör
12 Dök
20 Wem
l 7 Rai
l 5 MBe
3 Wsm 4 Hec
9 Bez
18 Pfä
17 Nör
2 Dos 1 Slo
6 Det
10 Oet
8 Mof 16 Was
7 Rai
5 MBe 4 Hec
! 9 Bez
l 232 Päh l 245 Wes l 259 WOb l l l 257 HPb 258 Psb l 272 Hug l 271 Söf
Abb. 1b: ‘dreieckige Papiertüte’ (K. 10.53)
Abb. 1: Die Karten für ‘niesen’ und für ‘dreieckige Papiertüte’ aus dem SBS, entnommen aus dem „Digitalen Sprachatlas von Bayerisch-Schwaben“ (DSBS).
aggregierten Zustand für dialektometrische Grenzlinien verantwortlich sind, sind gleich im Raum verteilt; ansonsten gäbe es nur scharfe Grenzen, und links und rechts von ihnen gegenseitig komplett unverständliche Varietäten. Der Blick in einen Dialektatlas wie den SBS offenbart ein anderes Bild: Die meisten der Karten weisen völlig unterschiedliche Verteilungen auf, die Variation zwischen ihnen mutet geradezu chaotisch an (s. z. B. Abb. 1; vgl. fiSCher 1895, 80). nur einige wenige wiederkehrende Strukturen lassen sich erkennen, z. B. bestimmte Verbreitungsareale einzelner Varianten, die mit auffälliger Häufigkeit wiederkehren, und die in ihrer Gesamtheit zu den Dialektgebieten beitragen, die die klassische Dialektometrie quantitativ erfasst. Der Normalfall ist jedoch (v. a. im Bereich der Lexik), dass jede Sprachkarte ihre eigene, individuelle Struktur aufweist. Diese Art der Variation, die geradezu unüberschaubare Variabilität zwischen den Verbreitungen einzelner sprachlicher Merkmale, stellt einen bisher vernachlässigten Forschungsgegenstand dar. Doch allein die Tatsache, dass überhaupt wiederkehrende Muster auftreten, zeigt, dass Struktur im scheinbaren chaos existiert. Dass zwischen den geographischen Verteilungen einzelner sprachlicher Variablen manchmal Zusammenhänge bestehen, ist seit Langem bekannt. Vor allem im Bereich der Lautgeographie weisen die Verbreitungen von systemisch verwandten Lauten oft fast identische Gren-
18
Einleitung
zen auf. Der Grund hierfür, der in gekoppeltem, sich im Raum manifestierendem Lautwandel ganzer Lautgruppen (beispielsweise bestimmter Diphthonge) besteht, wurde früh erkannt und 1918 von anton pfaLz erstmals unter dem Terminus Reihenschritte beschrieben (pfaLz 1918; vgl. auch wieSinger 1982). In der strukturalistisch ausgerichteten Dialektologie ist die Untersuchung von sprachgeographisch relevanten, systembedingten Beziehungen zwischen sprachlichen Merkmalen ein Hauptbeschäftigungsfeld (vgl. gooSSenS 1969; 1977, 89–101), wird jedoch bislang praktisch nicht mit quantitativen Methoden untersucht. Solche im Sprachsystem begründeten Beziehungen zwischen sprachlichen Variablen sind am einfachsten festzustellen und am besten untersucht im Bereich der Phonetik bzw. Phonologie. Die artikulatorische Beschreibung von Lauten impliziert schon durch Kategorien wie Artikulationsort oder Lippenrundung systematische Zusammenhänge.6 Für die Relevanz solcher Beziehungen für die geographische Verteilung mag die neuhochdeutsche Diphthongierung als Beispiel dienen, in der sich alle hohen Langvokale des Mittelhochdeutschen geographisch konsistent zu den jeweils entsprechenden steigenden Diphthongen entwickelt haben. Dass andere, ebenfalls parallel laufende Entwicklungen systemisch verwandter Laute jedoch nicht zur geographischen Konsistenz prädisponiert sind, illustrieren in eindrucksvoller Weise die Ergebnisse der Zweiten Lautverschiebung, was die Frage aufwirft, wieso sich bei diesen speziellen Beispielen die Vokale einheitlich verhalten haben, die Konsonanten jedoch nicht. ohne die Unterschiede der geographischen Entwicklung in diesen Fällen kommentieren oder gar erklären zu wollen, bleibt festzuhalten, dass die Identifikation solcher Zusammenhänge bisher weitgehend auf die Phonologie beschränkt ist. Für das Lexikon galt im Allgemeinen bislang die Annahme, dass es im Vergleich zum Lautsystem zu wenig strukturiert sei, als dass sinnvolle Kategorien gefunden werden könnten, die für die Verteilungsgeographie von Bedeutung wären (vgl. auch kurath 1972, 25): „Since the lexicon, with its thousands of items, is the least structured part of language, it is more susceptible to incidental variation than to systematic“ (franCiS 1983, 20). Diese Meinung ist offenbar vorherrschend (vgl. u. a. uLLMann 1953, 225; gooSSenS 1969, 53, 69; wakeLin 1984, 70; viereCk 1986, 725; Labov/aSh/boberg 2006, 41, 119), obwohl oder möglicherweise gerade weil es in einigen Fällen einen geradezu offensichtlichen Zusammenhang zwischen der sprachlichen Relation zwischen zwei Variablen und der geographischen Ähnlichkeit ihrer Verbreitung gibt, wie etwa in Abb. 2. Die linguistische Beziehung zwischen den Variablen ‘Kamm’ und ‘kämmen’ ist offensichtlich, die Karten sind fast identisch. Es ist klar, dass die Beziehung hier so eng ist, dass sich die Verteilungen der beiden Variablen gegenseitig bedingen oder sogar als zwei Versionen 6
ob es tatsächlich diese artikulatorischen Kategorien sind, die für die parallele Entwicklung von Lauten verantwortlich sind, ist hingegen fraglich; waLter h aaS (1978, 21) weist darauf hin, dass die „Symmetrie der Phonemsysteme […] nicht auf die Anatomie der Sprechwerkzeuge, sondern auf eine Besonderheit der menschlichen psychophysischen Struktur zurückgeführt werden“ muss. Er fährt fort: „Für den Linguisten genügt es, seine ‚Erklärungskette‘ bei der Feststellung abzubrechen, dass symmetrische organisation besteht und im Sprachwandel eine entscheidende Rolle spielt“.
19
Motivation
2 Dos
! 5 MBe
3 Wsm
1 Slo 10 Oet
11 Meg
16 Was
27 Hdg
37 Ebm
61 Gre
! 10 9 Nu l
' 112 RiK
' 110 Reu
, , 11 3 Ich
111 Beu
' , 127 Wll
,
114 Ett
116 Fhd 115 Bur
145 Ilt
* 148 Kru 150 Baz
149 NRa 164 Ale 162 ORo
161 Alt
165 Kih
163 Olg
* 176 Kmz
179 Btb 177 Wir
204 Bux
' 206 Mmb
194 Kam 195 Min
207 Wsh 208 Mus
221 Lac
220 Wor 218 Kro ' 233 Leg
' 246 Mut
' ! 223 MRe ! 224 Egt
222 Oto 236 R on
' 234 Grö
235 Böh 238 Ebh ' 248 Dim
' 247 Alr
' 249 Utr
' 264 Wpr 261 Wig 260 Kzt
209 Dlw
' 263 Btz 262 Kem
' 265 OTh
' ! 169 Gra
211 Wch
' 225 Pfz
252 MOd ' 266 Leu
' 254 Inr
141 Otm 140 Kis
98 Knö
10 9 Nu l
112 RiK ' 110 Reu
144 Pff
157 Mch
'! 159 Ahg
160 OSw
115 Bur
n 129 ORe
! 128 Ilb
131 Sto
145 Ilt
147 Bth
173 Jes
' * 214 Lfl
203 Ing ' 202 OSo
* 215 Ent 217 Hrg
' 255 Ast 256 Ptg
* 270 Rot
177 Wir
' 137 Anh
151 Lnf ' 152 Mik
218 Kro
246 Mut
n 224 Egt
' 248 Dim
261 Wig 260 Kzt
' 196 Ram 197 Tür
249 Utr
198 Hol
' ' 263 Btz 262 Kem
225 Pfz
' 265 OTh
, 171 Pri
239 OBe
212 Waa
' 214 Lfl
175 Lbr
189 Grf
203 Ing ' 202 OSo
215 Ent 217 Hrg * 216 Deh 231 Dis
' 230 Lud
' 229 Dkl
232 Päh 244 Brk
245 Wes
243 Hfh ' 254 Inr
267 Stg
173 Jes
* 188 Tfd
201 Söd ' 199 Lbg 200 Swi
213 Elo
259 WOb
255 Ast 256 Ptg
252 MOd 2 53 Bh o ! 266 Leu
160 OSw
187 Swh
' ! 185 Kfg
242 Oze 241 Fra
144 Pff
159 Ahg
' ' 172 D ün
170 Seu
' * 226 Wsd 227 Lfd 228 Asc
251 Rud 250 Kra
' 157 Mch
155 OOt
21 0 W ör 211 Wch
143 Eur 142 Eis
156 Kön
' 169 Gra
' 183 Smh
108 S bg
126 Töd
125 Har 141 Otm 140 Kis
' 184 OMt
181 MWa
* 240 Kfb
235 Böh 238 Ebh
' 247 Alr
' 168 Smü
167 Swg
166 Mit
223 MRe
' 264 Wpr
272 Hug
209 Dlw
236 R on 234 Grö
233 Leg ' 259 WOb
' 271 Söf
* 194 Kam 195 Min
208 Mus
n 221 Lac 219 Dik ' 220 Wor 222 Oto
* 257 HPb 258 Psb
180 Sal
122 Aug '! 1 39 Ha u
153 GAi
182 Etr
205 Mmg
121 Sta
' 154 Bob
136 Döp
107 Aic
* 106 Gri
105 Müh
, 123 Lec 124 Wul
138 Inn
n 178 Dih
204 Bux
231 Dis
245 Wes
165 Kih
, n 191 NiR 192 Lau 193 Dax ' 190 Hei ' 206 Mmb 207 Wsh
232 Päh
Abb. 2a: ‘Kamm’ (K. 2.6)
150 Baz
179 Btb
176 Kmz
216 Deh
' 269 Stg
148 Kru
n * 163 Olg
161 Alt
188 Tfd
! 230 Lud
244 Brk * 243 Hfh
' ' 268 Bbe
162 ORo 175 Lbr
189 Grf 187 Swh
201 Söd '* 199 Lbg 200 Swi
2 53 Bh o
' 118 Aga ' 135 Ust
78 Grm
90 Inh
89 Pet
104 Ger
119 Big
133 Zim
149 NRa
88 Tod
' 103 Gab
164 Ale ' '* 172 D ün
186 Beb
' 229 Dkl
117 Stk
68 Klm ! 77 Pöt
7 4 Me i * 87 Lwd
85 Aff
67 Ehk
66 Wal 76 Baa
86 Bib
134 OSö
n 132 Eds
130 Rog 146 Ohs
171 Pri * 170 Seu
' 185 Kfg
116 Fhd
55 Erg
75 Thi
10 2 Re t ' 120 Omh
n 114 Ett
42 Bit
54 Bhm
65 Müs
'! 101 Bon
! 100 Wöa
*
41 Ren
40 Mxh
53 RaL
64 Elg
' 73 L rh
' 84 Lag
11 3 Ich
111 Beu
! 127 Wll
143 Eur 142 Eis
' ' 99 Röf
97 Def
,
' 83 Ema
80 Off
! 96 G ün
94 Elh
158 Mer
156 Kön
' ' ' 226 Wsd 227 Lfd 228 Asc
267 Stg
' 125 Har
122 Aug
' ' 213 Elo 212 Waa
* 242 Oze 240 Kfb ' 239 OBe 241 Fra
126 Töd
62 Ltb
72 Wer
' 82 Vil
' 81 Glö
93 Sth
155 OOt
168 Smü
' 198 Hol
21 0 W ör
251 Rud ' 250 Kra
' 154 Bob
n 95 Lph
92 OEl
108 S bg ' 91 Pfl
123 Lec 124 Wul
' 184 OMt
196 Ram 197 Tür
71 Kik
*
50 Mrt
* 61 Gre
,
63 Ehi
* 79 Rih
107 Aic
* 106 Gri
105 Müh
' 1 39 Ha u
' 183 Smh
60 Höc
69 Gun
104 Ger
121 Sta
' * 153 GAi
59 Ber
70 Dlg
90 Inh
89 Pet
' 138 Inn
181 MWa
!
34 Bid
33 Wlm
52 Gen 51 Egs
58 UBe
87 Lwd
' 136 Döp
' 167 Swg
' 166 Mit
88 Tod
' 103 Gab
' 137 Anh
182 Etr
205 Mmg 219 Dik
180 Sal
151 Lnf ' 152 Mik
* 178 Dih
! 192 Lau 193 Dax
191 NiR ' 190 Hei
' 118 Aga ' 135 Ust
78 Grm
39 Ahm
49 Don
7 4 Me i
' 10 2 Re t ' 120 Omh ' 119 Big
134 OSö 133 Zim
130 Rog 147 Bth
117 Stk
85 Aff
77 Pöt
75 Thi
' 86 Bib
' 101 Bon
100 Wöa
132 Eds
146 Ohs
' 83 Ema
37 Ebm
57 Bah
68 Klm
38 Kai
48 Tap
44 Zir
56 Alb
67 Ehk 66 Wal 76 Baa
32 Tag 31 Da i
' 46 ULi
45 Dem 43 Stf
65 Müs
' 73 L rh
' 84 Lag
' 82 Vil
' 99 Röf
131 Sto
129 ORe
! 128 Ilb
98 Knö
' 72 Wer
71 Kik
' 81 Glö
' 80 Off
, , 96 Gün 95 Lph ' 94 Elh 97 Def
' 93 Sth
55 Erg
24 OEi 23 Möh
29 Itz
36 M ög
42 Bit
54 Bhm
53 RaL
64 Elg
63 Ehi
!
69 Gun
92 OEl
62 Ltb
60 Höc 70 Dlg
' 91 Pfl
41 Ren
27 Hdg
26 KSh
25 Hür 35 Fhm
47 Bis
*
15 Bwg
!!
30 Mon
28 Fün
50 Mrt 59 Ber
58 UBe
22 Lah 21 Wlh
20 Wem
52 Gen 51 Egs
,
19 Rut
34 Bid
33 Wlm
39 Ahm 40 Mxh 49 Don
48 Tap
, 44 Zir
57 Bah
79 Rih
32 Tag
38 Kai
6 Det
14 Dft
13 Mör
12 Dök
18 Pfä
17 Nör
29 Itz
47 Bis
56 Alb
16 Was
24 OEi
31 Da i
46 ULi
11 Meg
23 Möh
26 KSh 36 M ög
45 Dem
43 Stf
15 Bwg
22 Lah
7 Rai
5 MBe
10 Oet
8 Mof
! 30 Mon
28 Fün
3 Wsm 4 Hec
9 Bez
,
21 Wlh
20 Wem 19 Rut
35 Fhm
2 Dos 1 Slo
' 14 Dft
! 13 Mör
12 Dök
18 Pfä
17 Nör
25 Hür
7 Rai 6 Det
4 Hec
9 Bez 8 Mof
* 268 Bbe
257 HPb 258 Psb 272 Hug
* 270 Rot ' 269 Stg
271 Söf
Abb. 2b: ‘kämmen’ (K. 2.7)
Abb. 2: Die Karten für ‘Kamm’ und für ‘kämmen’ aus dem SBS, entnommen aus dem „Digitalen Sprachatlas von Bayerisch-Schwaben“ (DSBS).
derselben Verteilung, nämlich der des Morphems {kamm} und seiner Allomorphe, anzusehen sind. Dies ist anscheinend so banal, dass andere Zusammenhänge als Wortfamilienzugehörigkeit bisher nur selten als Erklärungsfaktoren für ähnliche Verbreitungen in Betracht gezogen worden sind. Dabei gibt es zahlreiche Karten, die auch ohne offensichtliche sprachliche Beziehung frappierende Ähnlichkeit aufweisen, wie etwa die Karten für ‘Wiesenland umbrechen’ und ‘Erde (vornehmlich im Acker)’ (vgl. Abb. 3, nächste Seite), die zwar keinen so deutlichen Bezug zueinander haben wie ‘Kamm’ und ‘kämmen’, aber dennoch eine in gewisser Hinsicht ähnliche Verteilung aufweisen. Ein thematischer Zusammenhang besteht jedoch auch hier (beide Karten gehören zum Themengebiet Boden und Ackerbau des SBS), doch ob dieser Zusammenhang tatsächlich mit der Ähnlichkeit der Karten in Verbindung steht oder ob die Ähnlichkeit dem Zufall zuzuschreiben ist, ist ohne eine breiter angelegte Untersuchung, die weitere Variablen einbezieht, nicht zu klären. Auf eine weitere mögliche Art des Zusammenhangs, die sich auf eine etwas allgemeiner gefasste Ähnlichkeit zwischen einzelnen Sprachkarten bezieht, weist andreaS LötSCher hin: Innerhalb ein und desselben Dialektgebiets können Erscheinungen vergleichbaren Typs sprachgeografisch sehr verschieden stark aufgesplittert sein, ein unterschiedliches Maß an
20
Einleitung
2 Dos
3 Wsm
10 Oet
W 11 Meg
8 Mof
27 Hdg
29 Itz
61 Gre
62 Ltb
60 Höc
69 Gun
71 Kik
72 Wer
83 Ema
80 Off 95 Lph
96 Gün 98 Knö
94 Elh
85 Aff
99 Röf
93 Sth 112 RiK
10 9 Nu l 110 Reu
11 3 Ich
111 Beu
127 Wll
147 Bth
150 Baz
149 NRa
136 Döp
154 Bob
165 Kih
163 Olg 179 Btb
176 Kmz
177 Wir
* 191 NiR
194 Kam 195 Min
207 Wsh
205 Mmg
208 Mus
H 219 Dik 221 Lac H 220 Wor 222 Oto 218 Kro
209 Dlw
247 Alr
235 Böh
248 Dim
212 Waa
214 Lfl
213 Elo
87 Lwd a 103 Gab
189 Grf
165 Kih 180 Sal
176 Kmz
: 156 Kön
; : 168 Smü
192 Lau
191 NiR 190 Hei
194 Kam 195 Min
207 Wsh
174 Mam
170 Seu
; : 184 OMt
172 D ün
204 Bux 208 Mus
249 Utr
241 Fra
251 Rud 250 Kra 265 OTh
252 MOd 266 Leu
244 Brk
; 214 Lfl
254 Inr
267 Stg
234 Grö 233 Leg
256 Ptg
246 Mut
257 HPb 258 Psb 272 Hug
269 Stg
271 Söf
Abb. 3a: ‘Wiesenland umbrechen’ (K. 12.17)
215 Ent 217 Hrg
231 Dis
; : 230 Lud
224 Egt
232 Päh 242 Oze
240 Kfb
235 Böh 237 OGü 238 Ebh
239 OBe a 254 Inr
247 Alr 250 Kra 264 Wpr : 263 Btz
270 Rot
268 Bbe
; : ; 203 Ing 202 OSo
216 Deh
: 226 Wsd 227 Lfd 228 Asc
259 WOb
255 Ast
2 53 Bh o
225 Pfz
; : 175 Lbr
; : 189 Grf
218 Kro
245 Wes
243 Hfh
; : 188 Tfd
187 Swh
213 Elo
211 Wch
221 Lac
220 Wor
232 Päh
229 Dkl 242 Oze
240 Kfb 239 OBe
219 Dik
230 Lud
; : 173 Jes
: 186 Beb
; 201 Söd : : 199 Lbg 200 Swi
196 Ram
! 209 Dlw
: 160 OSw
; : 159 Ahg
171 Pri
169 Gra
183 Smh
182 Etr
; : 144 Pff
142 Eis
158 Mer 157 Mch
185 Kfg
203 Ing
217 Hrg
: 167 Swg
126 Töd
; : 125 Har ; : 141 Otm 143 Eur
; : 154 Bob
181 MWa
178 Dih
215 Ent
123 Lec 124 Wul
153 GAi
166 Mit
108 S bg
104 Ger
; : 140 Kis 136 Döp
107 Aic
; : 106 Gri
105 Müh
:
152 Mik
150 Baz
149 NRa
! 161 Alt
231 Dis
226 Wsd 227 Lfd 228 Asc
224 Egt
263 Btz
202 OSo
199 Lbg 200 Swi
175 Lbr
148 Kru
90 Inh
89 Pet
216 Deh
N 237 OGü 238 Ebh
261 Wig 262 Kem
211 Wch
225 Pfz
264 Wpr N 260 Kzt
: 188 Tfd
187 Swh 201 Söd
198 Hol
223 MRe
236 R on 234 Grö
233 Leg
246 Mut
186 Beb
21 0 W ör
147 Bth
174 Mam 173 Jes
88 Tod
133 Zim 151 Lnf
146 Ohs
145 Ilt
78 Grm
7 4 Me i
; : 137 Anh
; : 135 Ust
68 Klm 77 Pöt
75 Thi
120 Omh ; 119 Big
v ; 134 OSö
; 67 Ehk
76 Baa
86 Bib 85 Aff
; 118 Aga
11 3 Ich
130 Rog : 160 OSw
159 Ahg
172 D ün
196 Ram 197 Tür
; 117 Stk
116 Fhd
144 Pff
171 Pri 170 Seu
183 Smh
114 Ett
143 Eur 142 Eis
185 Kfg
206 Mmb
: 112 RiK v v 110 Reu
55 Erg
66 Wal
64 Elg
73 L rh
; : 101 Bon
; : 100 Wöa
131 Sto
157 Mch
184 OMt
181 MWa 182 Etr
192 Lau 193 Dax
190 Hei
204 Bux
180 Sal
178 Dih
72 Wer
83 Ema
! 98 Knö
158 Mer
156 Kön
155 OOt
168 Smü
141 Otm 140 Kis
169 Gra
167 Swg
166 Mit
126 Töd
125 Har
1 39 Ha u
153 GAi
164 Ale 162 ORo 161 Alt
122 Aug
: 152 Mik
148 Kru
v 92 OEl
54 Bhm
53 RaL
65 Müs
10 2 Re t
138 Inn 151 Lnf
146 Ohs
145 Ilt
108 S bg
106 Gri
123 Lec 124 Wul
137 Anh
: 135 Ust 133 Zim
62 Ltb
82 Vil
81 Glö
104 Ger
121 Sta
134 OSö
132 Eds 130 Rog
71 Kik
80 Off
105 Müh
118 Aga 115 Bur
131 Sto
129 ORe
128 Ilb
61 Gre
;
; 84 Lag 79 Rih
107 Aic
103 Gab
120 Omh W 119 Big
116 Fhd W 117 Stk
114 Ett
70 Dlg
90 Inh
89 Pet
42 Bit
52 Gen 51 Egs
63 Ehi
69 Gun
88 Tod
10 2 Re t
60 Höc
; 58 UBe 78 Grm
41 Ren
39 Ahm 40 Mxh 49 Don
48 Tap 50 Mrt
57 Bah
87 Lwd
: 101 Bon
100 Wöa
97 Def
56 Alb 68 Klm
77 Pöt
7 4 Me i
86 Bib
82 Vil
81 Glö
66 Wal 76 Baa
75 Thi
73 L rh
84 Lag 79 Rih
37 Ebm 47 Bis
67 Ehk
65 Müs
; 34 Bid
33 Wlm
31 Da i
46 ULi
45 Dem ; ! 44 Zir 59 Ber
32 Tag
29 Itz
38 Kai
55 Erg 43 Stf
64 Elg
63 Ehi 70 Dlg
92 OEl
42 Bit
54 Bhm
53 RaL
50 Mrt 59 Ber
58 UBe
!
27 Hdg 26 KSh 36 M ög
52 Gen 51 Egs
24 OEi 23 Möh
30 Mon
28 Fün
35 Fhm
15 Bwg
22 Lah 21 Wlh
20 Wem
; 19 Rut
25 Hür 41 Ren
39 Ahm 40 Mxh 49 Don
48 Tap
44 Zir
57 Bah
91 Pfl
! 34 Bid
33 Wlm
38 Kai
37 Ebm
46 ULi
6 Det
14 Dft
13 Mör
12 Dök
18 Pfä
17 Nör
31 Da i
47 Bis
56 Alb
32 Tag
26 KSh 36 M ög
45 Dem
43 Stf
16 Was
24 OEi 23 Möh
30 Mon
28 Fün
11 Meg
8 Mof
22 Lah 21 Wlh
20 Wem
25 Hür
7 Rai
5 MBe 4 Hec
15 Bwg
19 Rut
35 Fhm
3 Wsm
10 Oet
14 Dft
13 Mör
12 Dök
18 Pfä
17 Nör
2 Dos
6 Det
4 Hec
9 Bez
16 Was
W 7 Rai
5 MBe
1 Slo
; 244 Brk a 243 Hfh a 255 Ast
266 Leu
267 Stg
259 WOb
256 Ptg
; : 2 53 Bh o 252 MOd
; 245 Wes
; ; 257 HPb 258 Psb 272 Hug
a 268 Bbe
270 Rot ; 269 Stg
; : 271 Söf
Abb. 3b: ‘Erde (vornehmlich im Acker)’ (K. 12.29)
Abb. 3: Die Karten für ‘Wiesenland umbrechen’ und für ‘Erde (vornehmlich im Acker)’ aus dem SBS, entnommen aus dem „Digitalen Sprachatlas von Bayerisch-Schwaben“ (DSBS). ‚arealer Diversität‘ aufweisen. […] In jedem Sprachatlas ist diese Tatsache unmittelbar erkennbar. Da sie so evident ist, erscheint sie möglicherweise auch banal. Wenn man nach den Gründen solcher Divergenzen fragt, wird der Sachverhalt etwas problematischer. (LötSCher 2006, 141)
LötSCher spricht hier von Raummustern, die nicht in der Übereinstimmung der Verbreitungsareale von Varianten bestehen. Es geht vielmehr um die A r t der Strukturiertheit ganzer Karten. So können manche etwa eine klare Gliederung in nur zwei, einander räumlich kaum durchdringende Variantengebiete aufweisen, andere dagegen viele kleine Gebiete, die immer noch klar voneinander abgegrenzt sein können; bei wieder anderen sind kaum Gebiete zu erkennen, da sich die Varianten räumlich sehr stark vermischen, usw. Erklärungsversuche für solche Unterschiede gibt es viele (vgl. 1.2.1.1), doch steht eine Überprüfung dieser Annahmen bis heute aus: Die Dialektometrie konnte bislang keine quantitativ begründeten Aussagen zu solchen Phänomenen machen, da sie durch die Aggregation die Variation zwischen den Verteilungen der Variablen unberücksichtigt lässt.
Motivation
21
1.1.2 Ziele Die Zielsetzung der vorliegenden Arbeit ist es, auf dem Wege der Einführung (geo-)statistischer, nicht-aggregativer Methoden und Analyseverfahren zu neuen Einsichten in die Struktur und die Gesetzmäßigkeiten diatopischer lexikalischer Variation zu gelangen. Konkret geht es um die statistisch gestützte Analyse der lexikalischen Variation, die in den wortgeographischen Bänden des SBS (Bd. 2; Bd. 8; Bd. 10–13) dokumentiert ist. Die Lexik wurde dabei aus zweierlei Gründen ausgewählt: Erstens versprach sie, leichter handhabbar zu sein als etwa die Phonetik, da man es hier (fast) ausschließlich mit nominalskalierten Daten zu tun hat (vgl. 3.2), während dort mit einer Mischung aus nominal- und intervallskalierten Daten zu rechnen ist. Zweitens wird dem Lexikon meist geringerer Systemcharakter zugesprochen als etwa dem Lautinventar (vgl. 1.1.1), so dass bei Ersterem mehr Variation (d. h. mehr Unabhängigkeit zwischen den Variablen) zu erwarten ist (vgl. auch wieSinger 2005, 1108). Dies erschwert zwar die Identifikation von Gesetzmäßigkeiten, doch die Suche nach solchen Regularitäten gerät wesentlich interessanter, da sie weniger offensichtlich sind als systemische Zusammenhänge zwischen lautlichen (oder auch morphologischen) Varianten. Da durch den Fokus auf die Lexik die eingeführten Analysemethoden zur Struktur geolinguistischer Variation an dem Bereich des sprachlichen Systems erprobt werden, der als am wenigsten strukturiert gilt, ist bei erfolgreicher Anwendung ihre Anwendbarkeit auf andere sprachliche Teilbereiche automatisch gewährleistet. Es wurde bereits erwähnt, dass es schon einige Ansätze zur Erklärung von Verbreitungsmustern von Varianten in der Sprachgeographie gibt (für Details s. 1.2.1). Die dabei herangezogenen Argumentationen gehen jedoch in den allermeisten Fällen nicht über – wenngleich plausible – Erklärungsversuche hinaus; eine tatsächliche Bestätigung ihrer Richtigkeit steht aber weiterhin aus. Desiderate bestehen also unter anderem in der statistischen Überprüfung von seit Längerem in der Literatur zu findenden Behauptungen, die bislang nicht durch quantitative Studien bestätigt werden konnten. Hierfür werden statistische Hypothesen formuliert, um sie dann mit adäquaten Mitteln zu testen (s. 4.6). Über die Überprüfung dieser Annahmen hinaus sollen auch Strukturen in der lexikalisch-diatopischen Variation aufgedeckt werden, die bisher nicht postuliert worden sind. Zu diesem Zweck werden explorative Methoden eingesetzt, die keine vorformulierten Hypothesen testen, sondern aus den Daten bislang unbekannte Strukturen extrahieren, die dann plausibel zu interpretieren sind. Das Vorhaben, die wortgeographische Variation in Bayerisch-Schwaben zu untersuchen, ist in drei aufeinander aufbauende Teilziele gegliedert: 1. Zunächst soll der Versuch unternommen werden, statistische, computergestützte Verfahren zu entwickeln, die in der Lage sind, a) Hypothesen über die Zusammenhänge zwischen sprachgeographischen Verteilungen und möglichen inner- oder außersprachlichen Faktoren zu überprüfen und
22
Einleitung
b) bisher unbekannte Strukturen und Regularitäten in einem Korpus an diatopischen Sprachdaten aufzudecken. Bei der Konzipierung und Ausarbeitung der Methoden spielte die Kompetenz der Ulmer Projektpartner im Bereich der räumlichen Statistik eine große Rolle, denn die Methoden sollten nicht nur linguistisch angemessen, sondern auch in statistischer Hinsicht solide sein und sich den gegenwärtigen Stand geostatistischer Methodik zunutze machen. Bei der Entwicklung der einzelnen Verfahren wurde darauf geachtet, dass sie zu sinnvoll interpretierbaren Ergebnissen führen, um Antworten auf die in Punkt 2 spezifizierten Fragestellungen zu liefern. 2. Das zweite Teilziel der Arbeit besteht darin, die entwickelten Methoden auf Daten des SBS anzuwenden, um konkrete dialektologische Fragestellungen zu beantworten und die Zweckmäßigkeit und Ergiebigkeit der Methoden zu demonstrieren. Dabei werden bislang ungesicherte Postulate über den Einfluss von sprachlichen und außersprachlichen Bedingungen auf die wortgeographische Variation überprüft und die Struktur der Sprachgeographie in BayerischSchwaben beleuchtet. Soweit es möglich ist, werden im Zuge dessen auch allgemeinere, über Bayerisch-Schwaben hinausgehende Fragestellungen berücksichtigt, wenn die mit den Daten des SBS erzielten Ergebnisse Rückschlüsse auf generelle, global gültige Mechanismen wortgeographischer Variation zulassen. Im Einzelnen sind folgende Fragen von Interesse: –
Gibt es semantische, grammatische oder pragmatische Eigenschaften von sprachlichen Variablen, die einen Einfluss auf die Art ihrer geographischen Verteilung haben?
–
Gibt es außersprachliche Faktoren, die einen Einfluss auf die Verteilung von sprachlichen Variablen haben?
–
Welche Strukturen und Grundtendenzen spielen bei der Konstitution des Sprachraums Bayerisch-Schwaben eine Rolle, und wie sind sie kausal zu interpretieren?
–
Gibt es Unterschiede in Bezug auf das Ausmaß, in dem die Verteilungen einzelner sprachlicher Variablen von solchen Grundtendenzen und Faktoren betroffen sind?
In epistemischer Hinsicht gibt es Überschneidungen zwischen diesen Fragen, z. B. zwischen der vierten und der ersten. Sie unterscheiden sich aber von der Herangehensweise her grundlegend: Während die ersten beiden Fragen das aktive Testen von bestimmten Zusammenhängen verlangen (also data-based und konfirmatorisch arbeiten), erlauben die dritte und vierte ein Vorgehen, bei dem keine Vorannahmen über vorhandene Strukturen notwendig sind (datadriven und explorativ). So können auch Strukturen und Regularitäten entdeckt werden, die vorher nicht postuliert wurden.
Forschungsgeschichtliche Grundlagen
23
3. Die in Punkt 1 entwickelten Verfahren sowie die in Punkt 2 erzielten Resultate sollen in den größeren Zusammenhang variationslinguistischer Sprachvariations- und -wandeltheorien gestellt werden. Am Ende steht – aufbauend auf bestehenden Modellen – die Formulierung eines sprachgeographisch ausgerichteten variationslinguistischen Modells, das die innerhalb dieser Studie gewonnenen Einsichten zusammen mit schon gesicherten Erkenntnissen zu beschreiben imstande ist und ein möglichst umfassendes Bild der wortgeographischen Dynamik zeichnet. Zur Bewältigung dieser Aufgaben müssen die Daten vorverarbeitet werden, um die geolinguistischen Informationen in sinnvoller Weise zu quantifizieren und so für statistische Tests zugänglich zu machen. Die Ergebnisse, die über die lexikalischdiatopische Variation in Bayerisch-Schwaben erzielt werden, sollen in zweierlei Hinsicht auch in einem allgemeineren Kontext gewinnbringend sein: Zum einen sollen durch die im Untersuchungsgebiet geltenden Gesetzmäßigkeiten auch Rückschlüsse auf allgemeine Prinzipien der Sprachgeographie möglich sein, die über das Untersuchungsgebiet hinausreichende, möglicherweise sogar universelle Gültigkeit haben; zum anderen sollen die in dieser Arbeit eingeführten Methoden für zukünftige geolinguistische Untersuchungen ein solides, flexibles und erweiterbares Instrumentarium für die Analyse räumlich verteilter Sprachdaten bereitstellen. 1.2
FoRScHUnGSGEScHIcHTLIcHE GRUnDLAGEn
Seit dem Ende des 19. Jahrhunderts wurden, anfangs in Deutschland, nach und nach auch in anderen Teilen der Welt, systematisch Informationen über Dialekte gesammelt, die die Sprachform darstellen, die am stärksten und deutlichsten von der geographischen Herkunft der Sprecher abhängt. Heute gibt es breit gefächerte und umfangreiche Sprachatlanten, welche die Sprachvariation in ihrer diatopischen Dimension quer durch alle Register, insbesondere aber in ihrer nähesprachlichsten Ausprägung, dokumentieren. Dabei walten zweierlei Motivationen: Die eine ist archivarisch; bedrohtes Wissen soll bewahrt werden. Man möchte die Dialekte, die Veränderungen und dem Einfluss der Standardvarietät unterliegen, für die nachwelt festhalten. Zum anderen gibt es eine explorative Motivation. Man möchte etwas über Sprachvariation im Raum erfahren, um dadurch Rückschlüsse auf Gesetzmäßigkeiten der Diatopie, Sprachwandelprozesse oder die Beziehungen zwischen Sprachregionen zu ziehen. Damit ist zwei Grundprinzipien wissenschaftlichen Erkenntnisinteresses Ausdruck gegeben: Am Anfang jeder induktiven Forschung steht das Datensammeln, die Dokumentation von möglichst vielen Einzelfällen, kurz: die Empirie. In der Dialektologie stehen die Sprachatlanten am Ende dieser Stufe. Daran anschließend besteht ein Interesse daran, die vielen, disparaten Einzeldaten auf allgemeinere Umstände zurückzuführen. Das Erkennen und die Beschreibung von Zusammenhängen und Gesetzmäßigkeiten stehen dabei im Vordergrund. So werden die Einzeldaten in einen größeren Zusammenhang gestellt; sie werden durch ihre Begleit-
24
Einleitung
umstände erklärbar und – zumindest teilweise – vorhersagbar. Zudem erlaubt das Aufdecken von Struktur in den Daten, sie kompakter und sinnvoller darzustellen. Die über die Datensammlung hinausgehenden Bestrebungen zum Aufdecken latenter Strukturen gehen in der Dialektologie bis ins 19. Jahrhundert zurück. Urteile über Zusammenhänge mit außersprachlichen Größen wurden dabei oft aufgrund von Beobachtungen und ohne Abklärung statistischer Aussagekraft getroffen (vgl. z. B. wenzeL 1930, 59; baCh 1969, 63, 170). Versuche, solche Aussagen quantitativ begründet und dadurch abgesichert zu treffen, wurden jedoch schon um die Wende vom 19. zum 20. Jahrhundert gemacht. Konkret wurde damals versucht, die Ähnlichkeitsverhältnisse zwischen benachbarten ortsmundarten durch das Auszählen von Unterschieden zu bestimmen und so Aussagen über das Vorhandensein von Dialektgrenzen zu treffen (vgl. z. B. haag 1898; 1905). Dieses Verfahren, das zwischenzeitlich den namen Dialektometrie erhielt, wurde im 20. und 21. Jahrhundert um viele Facetten erweitert (vgl. insbesondere Séguy 1971; goebL 1984; 2006; heeringa 2004; nerbonne 2009); das Vorgehen besteht dabei stets im Zählen oder Messen von Unterschieden zwischen ortsdialekten und der Bewertung von Dialektähnlichkeiten, die meist zum Zusammenfassen von ortsmundarten zu Dialektgebieten verwendet werden. 1.2.1 Faktoren sprachgeographischer Strukturen In der älteren Literatur oft angesprochen, aber praktisch nie quantitativ untersucht, ist die Rolle bestimmter Eigenschaften der sprachlichen Variablen für die geographische Verteilung ihrer Varianten. So wurde etwa behauptet, die Gebrauchshäufigkeit einer Variablen oder ihre Zugehörigkeit zu einer bestimmten semantischen Gruppe habe einen Einfluss auf die Art ihrer diatopischen Verbreitung (vgl. gooSSenS 1969, 88–89); die angeführten Beispiele haben jedoch meist nur illustrativen Wert, d. h. die Befunde sind nicht statistisch abgesichert. Der Versuch, sprachliche Grenzen mit außersprachlichen Faktoren kausal in Verbindung zu bringen (vgl. gooSSenS 1977, 74–89), scheiterte meist daran, dass sich zwar der Zusammenfall einer vorgegebenen Linie, etwa eines Flusses oder einer Territorialgrenze, mit einzelnen oder mehreren sprachlichen Isoglossen einwandfrei zeigen ließ, dass der Nachweis der statistischen Signifikanz einer solchen Koinzidenz vor dem Hintergrund des Gesamtvariablenkorpus aber nicht erbracht wurde, so dass unklar blieb, ob der Zusammenfall nur zufällig ist, ob er systematisch nur einzelne Untergruppen an Variablen betrifft, diese aber konsistent, oder ob er sich in allen sprachlichen Teilbereichen mit ausreichender Häufigkeit niederschlägt. Wie aber kann man Faktoren, die geolinguistische Strukturen beeinflussen, überhaupt identifizieren? Dies erfolgt im Normalfall über die Beobachtung des gehäuften gemeinsamen Auftretens von sprachgeographischen Befunden mit solchen hypothetischen Faktoren. Tritt eine bestimmte geolinguistische Raumstruktur auffällig oft zusammen mit einem nicht primär geolinguistischen Begleitumstand auf, so lässt sich eine Hypothese über deren kausalen Zusammenhang formulieren. Eine plausible Erklärung kann die Hypothese stützen. Relative Klarheit über das
Forschungsgeschichtliche Grundlagen
25
Zutreffen der Hypothese kann allerdings nur ein statistischer Test schaffen, der beurteilt, ob der Grad der Kookkurrenz zwischen sprachgeographischem Faktum und postulierter Ursache signifikant ist. Die hypothetischen Faktoren unterscheidet man gewöhnlich nach ihrer Zugehörigkeit zum inner- oder außersprachlichen Bereich (vgl. LöffLer 2003, 137–141), bei den Untersuchungsmethoden analog dazu zwischen der intra- und der extralinguistischen Methode (vgl. gooSSenS 1977, 74–101). Jede dieser Methoden ist geeignet, jeweils unterschiedliche räumliche Strukturen zu erklären: Mit der intralinguistischen Methode werden Annahmen über Strukturen formuliert, die sich zwar im Raum ausbilden, jedoch unabhängig von ihm als Bedingungsgröße; die extralinguistische Methode hingegen beschäftigt sich mit sprachgeographischen Strukturen, die eine bestimmte Lage im Raum aufweisen und sich an geographisch fixierten außersprachlichen Strukturen ausrichten. Deshalb werden raumunabhängige Muster meist durch innersprachliche Faktoren erklärt, raumgebundene Strukturen hingegen durch außersprachliche. 1.2.1.1 Innersprachliche Faktoren Der Raum ist bei der Suche nach Verteilungsmustern zunächst nur Beschreibungssystem: Ihm kommt bei der reinen Musteridentifikation und -klassifikation keine erklärende Bedeutung zu. Wenn Erklärungen für die Arten der Verteilung gegeben werden, d. h. Bedingungsfaktoren der räumlichen Muster beim namen genannt werden, so handelt es sich in der Regel um innersprachliche Faktoren. Zu den Ersten, die einen Zusammenhang zwischen der räumlichen Verbreitung von Variablen und deren semantischen Eigenschaften hergestellt haben, gehört waLter wenzeL. In seinem „Wortatlas des Kreises Wetzlar“ (1930) unterteilt er die Karten der einzelnen sprachlichen Phänomene anhand von Grenztypen, die auf ihnen aufscheinen. neben den Karten, die überhaupt keine unterschiedlichen Varianten aufweisen („Abteilung A. Einheitliche Bezeichnungen“), werden die Karten mit mehreren Varianten („Abteilung B. nicht-einheitliche Bezeichnungen“) unterteilt in 1) „Wörter mit scharfen Grenzlinien“, 2) „Wörter, bei denen scharfe Grenzfestlegungen nur teilweise möglich sind“, und 3) „Wörter, bei denen Grenzfestlegungen fast unmöglich sind“.7 Zwischen diesen wortgeographischen Verbreitungstypen und der Zugehörigkeit zu bestimmten Sachgebieten oder anderen semantischen Eigenschaften bestehen nach wenzeL gewisse Zusammenhänge. So fehlten beispielsweise Haushaltsgegenstände, Ackerbaugeräte und Handwerkszeug weitgehend in „Abteilung A“, da es „hier […] infolge landschaftlich-begrenzter Gepflogenheiten und durch Gradunterschiede in der Aufnahme bestimmter Kultureinflüsse am ehesten zur Bildung 7
Eine vierte Gruppe, „Tier- und Pflanzennamen“, beruht offensichtlich auf anderen als geographischen Kriterien, ist in sich aber wiederum nach solchen unterteilt.
26
Einleitung
wortgeographischer Grenzen“ (wenzeL 1930, 13) komme. In Gruppe 3 der „Abteilung B“ hingegen seien vor allem „solche Wörter, die der Kindersprache angehören oder ihr nahestehen, solche, die eine häufig gebrauchte und in mannigfacher Weise verwendbare Sache bezeichnen, und Erotika“ (wenzeL 1930, 59) zu finden; sie wiesen außerdem eine hohe Variantenzahl („reiche Synonymik“; wenzeL 1930, 59) auf. Dies treffe auch auf Tier- und Pflanzennamen zu, was teilweise „infolge des Spieltriebes und der Phantasie (namentlich der Kinder)“ (wenzeL 1930, 66) erklärt wird. adoLf baCh bietet in seiner „Deutschen Mundartforschung“ (1950) keine Systematik von Verteilungsmustern im engeren Sinne, sondern unterscheidet in erster Linie „Groß-“ und „Kleinräumigkeit“ (baCh 1950, 63) bei sogenannten „Formenkreisen“ (d. h. bei wortgeographischen Verteilungen einzelner Varianten). Großräumige Formenkreise zeigt […] etwa die Verbreitung der Wörter Haus, Dach, Wolf, Brot, Milch, Schuh. Kleinräumig dagegen ist die Verbreitung von Ausdrücken für die Begriffe Eichelhäher, Glühwürmchen, Heuschrecke, Maulwurf, Maßliebchen, Kreisel, für die eine Fülle von Synonymen über den dt. Raum hin auftritt. (baCh 1950, 63)
Dies scheint die Beobachtung wenzeLS bezüglich Tier- und Pflanzennamen zu bestätigen: Diese weisen offenbar aufgrund ihrer Variantenvielfalt kleinere Gebiete auf. Der Unterschied zwischen groß- und kleinräumiger Verteilung sei laut baCh besonders charakteristisch für die Wortgeographie, was er auf die Wirkung der Bedeutung und der Verwendungsweise der einzelnen Variablen zurückführt: Wortarmut und damit Großräumigkeit gilt dort, wo lebenswichtige, alltägliche, vielgebrauchte, oft beachtete Dinge und Vorstellungen gemeint sind. namen für das Allgemeine, Umfassende sind weiter verbreitet als die für das Einzelne, die der Gattungsbegriffe weiter als die der Artbegriffe. Wortreichtum und damit Kleinräumigkeit kennzeichnen die namen von Dingen, mit denen sich die Volksphantasie stark beschäftigt, zu denen der Mensch ein gefühlsbetontes Verhältnis hat, die aber für die Allgemeinheit und den allgemeinen Verkehr von untergeordneter Bedeutung bleiben. (baCh 1950, 170)
Für Tier- und Pflanzennamen zeigt baCh anhand einiger Beispiele, dass die Bezeichnungen für fremde oder aus der Fremde eingeführte Arten größere Gebiete ausbilden als die für einheimische; dass die Bezeichnungen für Nutzpflanzen und nutztiere größere Gebiete haben als die für nicht oder selten genutzte Tiere und Pflanzen; dass die Namen kleiner Tiere besonders kleine Gebiete ausbilden; dass Sonderbezeichnungen von Tieren (männliches, weibliches Tier; Muttertier etc.) weniger weit verbreitet sind als die Bezeichnungen der jeweiligen Art. Kleinräumig verteilt seien außerdem Benennungen für abergläubische Vorstellungen, obszöne Ausdrücke sowie Bezeichnungen aus der Landwirtschaft und dem Kinderleben (vgl. baCh 1950, 170–174). Diese Beobachtungen scheinen da, wo wenzeL ähnliche Konzeptualisierungen vornimmt, weitgehend mit seinen Ergebnissen konform zu gehen: So kann etwa die Kleinräumigkeit der obszönen Ausdrücke bei baCh mit der reichen Synonymik der „Erotika“ bei wenzeL in Verbindung gebracht werden. Trotz der zahlreichen Beispiele, die beide liefern, ist bislang unklar, ob ihre Beobachtungen einer statistischen Überprüfung standhalten würden. Jan gooSSenS stellt in seiner „Strukturellen Sprachgeographie“ (1969), die sich dediziert mit der Behandlung von innersprachlichen Faktoren beschäftigt (vgl.
Forschungsgeschichtliche Grundlagen
27
gooSSenS 1969, 14–25), die Frage nach dem Zusammenhang zwischen der Gebrauchsfrequenz von Variablen und der wortgeographischen Struktur. gooSSenS zitiert urieL weinreiCh und Jozef Leenen, die angeben, dass häufiger verwendete Wörter stabiler und ihre Gebiete daher klarer voneinander abgegrenzt seien, als dies bei seltener verwendeten Wörtern der Fall ist (vgl. gooSSenS 1969, 87–88), was Leenen mit verschiedenen Beispielen belegt. Dem widerspricht gooSSenS: Die Unterschiede in der Klarheit der räumlichen Verteilung seien nicht durch Einfluss der Gebrauchsfrequenz, sondern durch die Art des Zustandekommens des Atlasmaterials bedingt. Schriftlich gesammeltes Material begünstige eher Mischgebiete als mündlich erhobenes. Stattdessen postuliert er, dass das Eindringen von hochsprachlichen Ausdrücken zum Entstehen von Übergangszonen führe; für einige Fälle gibt er die Lautgestalt von Wörtern als Faktoren bei der Entstehung von Mischgebieten an. obwohl die „Typologie der arealen lexikalischen Gliederung deutscher Dialekte“ (1983) von r einer hiLdebrandt vom Prinzip her als extralinguistische Studie angelegt ist (vgl. hiLdebrandt 1983, 1333), werden auch intralinguistisch begründete Annahmen über Raummuster auf Wortkarten formuliert. Ähnlich wie gooSSenS äußert auch hiLdebrandt die Vermutung, dass verfahrenstechnische Bedingungen bei der Datenerhebung für „schwer einzuordnende“ (hiLdebrandt 1983, 1364) Wortkarten verantwortlich sein könnten. Doch er führt auch ein inhaltliches Kriterium an, das als Indikator für ein unruhiges Kartenbild in Frage kommt. Es handelt sich dabei um eine „psychologische Komponente, die sich im sog. expressiven Wortschatz niederschlägt“, der durch „spontane, gefühlsbetonte Schöpfungen“ geprägt sei und „häufig von der Kindersprache ihren Ausgang“ (hiLdebrandt 1983, 1364) nehme (eine Beobachtung, die so ähnlich bereits waLter wenzeL gemacht hat). Im Prinzip die gleiche Argumentation verfolgt andreaS LötSCher, der sich in jüngerer Zeit intensiv mit Faktoren „arealer Diversität“ beschäftigt hat. Als Bedingungsfaktoren für einen hohen Grad an Diversität führt er in erster Linie Expressivität (LötSCher 2005) und Besonderheiten in der Wortstruktur (LötSCher 2006) an; als Maß für die areale Diversität dient bei ihm die Variantenzahl (vgl. LötSCher 2005, 303). Der Mechanismus, der dafür sorge, dass expressiver Wortschatz eher zu Diversität neige, beruhe darauf, dass Expressivität kreativen und spontanen Sprachgebrauch begünstige, was zu „areal differenzierter und isolierter Polygenese bzw. Abwandlung unterschiedlicher Ausdrücke zum gleichen Konzept, mithin zu arealer Diversität im Ursprung“ (LötSCher 2005, 310) führe. Ein ähnlicher Mechanismus führe bei Ausdrücken mit ungewöhnlicher Wortstruktur dazu, dass diese unter einer gewissen Labilität leiden und so zu Abwandlungen und Re-Motivierungen neigen (vgl. LötSCher 2006, 147–148). Als Faktor für areale Uniformität wird semantische Prototypizität genannt, was mit einer entsprechenden Beobachtung baChS (s. o.) vergleichbar ist (vgl. LötSCher 2005, 304–305, 310). Es gibt mittlerweile einige Ansätze zur quantitativen Analyse räumlicher Verteilungsmuster einzelner Varianten, die in Abschnitt 1.2.2 kurz vorgestellt werden.
28
Einleitung
1.2.1.2 Außersprachliche Faktoren Während sich das Zurückführen von räumlichen Verteilungsmustern auf innersprachliche Faktoren vor allem auf Strukturtypen wie Mischgebiete oder die Größe von Variantenarealen konzentriert, geht es bei Versuchen, räumliche Strukturen durch außersprachliche Faktoren zu erklären, eher um den tatsächlichen Verlauf von Grenzen sowie um die geographische Lage von Verbreitungsgebieten. Die im 19. Jahrhundert vorherrschende Meinung über die räumliche Ausdehnung der Dialekte war die Vorstellung von der Einheit von Dialektgebiet und germanischem Stammesgebiet, die sich in den Bezeichnungen der Dialektverbände als Alemannisch, Fränkisch, Bairisch etc. spiegelt (vgl. u. a. SChirMunSki 1962, 134–135). Diese Vorstellung – einhergehend mit der Ansicht, die Dialekte seien in sich einheitlich und klar voneinander abgegrenzt – findet man etwa bei JaCob griMM, der in der Vorrede zur „Deutschen Grammatik“ (1822, XII) schreibt: „In der frühen zeit gelten viele dialecte gleichanſehnlich nebeneinander, ihre grenzen laufen mit denen der einzelnen ſtämme“. Von k arL MüLLenhoff stammt die sogenannte „Stammeshypothese“, die besagt, „daß die Siedlungsgrenzen der germanischen Stämme mit den Grenzen der modernen deutschen Mundarten zusammenfallen und mit deren Hilfe rekonstruiert werden können“ (SChirMunSki 1962, 62). Ohne Zirkelschluss kann diese Hypothese weder veri- noch falsifiziert werden, doch setzte sich „die Auffassung fest, daß nicht nur – ganz allgemein gesehen – die Mda- Gebiete der Gegenwart, sondern auch deren G ren zen im einzelnen mit den Gebieten und festen Grenzen der Volksstämme der dt. Frühzeit in unmittelbare Beziehung gebracht werden dürften“ (baCh 1950, 25). Als Faktor der geographischen Verteilung wurde somit in erster Linie die frühzeitliche Besiedlungsgeschichte angesehen. Zum Ende des 19. Jahrhunderts versuchte CarL haag in „Die Mundarten des oberen neckar- und Donaulandes“ (1898), die geographische Verbreitung von sprachlichen Phänomenen mit der Lage von nicht-sprachlichen räumlichen Gegebenheiten in Beziehung zu bringen. Dabei stützte er sich zunächst auf die Beobachtung des gemeinsamen Auftretens von sprachlichen und nicht-sprachlichen Grenzlinien. Er beschreibt die „Uebereinstimmung der sprachlichen mit physikalischen Grenzen“ (haag 1898, 95) sowie die „Art des Zusammengehens sprachlicher mit politischen (und physikalischen) Grenzen“ (haag 1898, 98): Physikalische (also topographische) Grenzen spielten fast nur dann eine Rolle, wenn sie mit politischen zusammenfielen; ehemalige politische Grenzen fänden dagegen sehr viele Entsprechungen bei den sprachlichen Grenzen. haag führte das auf deren Wirkung als „räumliche Verkehrshindernisse“ zurück; ihre Wirkung entfalteten sie deswegen bisweilen auch an landschaftlichen Barrieren, „da zuerst die politischen Verbände ihre Grenzen der natur des Landes anpassten“ (haag 1898, 95). „Wo politische Grenzen mit physikalischen zusammenfallen, […] entstehen besonders starke Sprachgrenzen.“ (haag 1898, 99) Ausschließlich physikalische Grenzen träten dagegen nur äußerst selten im sprachlichen Kartenbild auf. haag unternahm außerdem den Versuch, die „[v]erschiedene Wirkung politischer Grenzen nach Alter und Dauer“ (haag 1898, 96) zu untersuchen. Dabei stellte er fest,
Forschungsgeschichtliche Grundlagen
29
dass „[k]eine der alten Territorialgrenzen, […] die nicht ins 17. Jahrhundert herein sich in Kraft erhielt, […] eine Spur im Sprachenbild hinterlassen“ (haag 1898, 97) hat. „Als wirksam stellen sich einzig und allein diejenigen heraus, die mindestens bis ins 17., womöglich aber bis zu Ende des 18. Jahrhunderts in Kraft blieben […]. neue Grenzen, selbst aus dem 19. Jahrhundert, zeigen überall schon ihre gar nicht unbeträchtlichen Wirkungen“ (haag 1898, 98). Er resümiert: Die nachwirkung verschwundener politischer Grenzen, wenn sie noch so dauernd und tief waren, würde demnach 300 Jahre nicht überschreiten, die Wirkung neuer sich spätestens in 50 Jahren schon deutlich bemerkbar machen […]. Die Ausbreitung sprachlicher neuerungen dürfte demnach überhaupt wohl eine erheblich grössere Schnelligkeit, mundartliche Verhältnisse eine weit grössere Beweglichkeit und Unbeständigkeit besitzen, als ihnen gewöhnlich zugetraut wird. (h aag 1898, 98)
Die Stammeshypothese jedenfalls gilt spätestens mit adoLf baCh als „ein für allemal abgetan“, zumal wir über den „tatsächlichen Verlauf [der alten Stammesgrenzen] nur dürftige nachrichten besitzen“ (baCh 1950, 93, vgl. auch 25). Stattdessen betrachtet baCh (wie schon haag) den Verkehr als die wichtigste Erklärungsinstanz für Dialektgrenzen, wenngleich der Verkehr wiederum durch geschichtliche oder naturräumliche Bedingungen beeinflusst wird (vgl. baCh 1950, 80–135). Hierzu zählen bei baCh vor allem die Territorien des Mittelalters und der Frühen neuzeit, aber auch Grenzen der kirchlichen organisation wie etwa Bistums- oder auch Konfessionsgrenzen, die alle „organisationsräume der Menschen“ (baCh 1950, 81) darstellen. neben solchen Grenzen kommen naturräumliche Bedingungen „in Frage, dann – und nur dann! – nämlich, wenn sie dem Verkehr abträglich sind oder ihn gar unmöglich machen. Aber diese Grenzen sind, aufs Ganze gesehen, von weit geringerer Bedeutung als die politischen“ (baCh 1950, 100). Dazu zählen etwa „hin und wieder“ (baCh 1950, 100) Gebirge, Wälder und Sümpfe. „nur ausnahmsweise beobachten wir, daß Flüsse Verkehrsgrenzen darstellen und deshalb MdaScheiden bewirkt haben“ (baCh 1950, 103). Dies sei insbesondere dann der Fall, wenn sie mit einer politischen Grenze zusammenfielen, so dass diese die eigentlichen Ursachen darstellten; insofern stimmt baCh mit haag überein. Bei modernen staatlichen Verwaltungsbezirken erwartet er keine dialektgeographische Wirkung, da sie zu schwach seien. Dezidiert widmet sich theodor fringS dem „ursächlichen Zusammenhang zwischen Sprachgeographie und Geschichtsgeographie“ (fringS 1956, Bd. II, 24). Sprache begreift er dabei ganz allgemein als „ein geschichtsgeographisch bedingtes soziales Gebilde“ (fringS 1956, Bd. II, 26). Am Beispiel des Rheins zeigt er verschiedene Typen des Vorrückens von sprachlichen Formen (z. B. Keil, wellenförmige oder isoliert-punktuelle Infiltration), und setzt sie in Beziehung zur Wirkung des Rheins als Verkehrsstraße, zur Barrierewirkung von Gebirgen und zur Funktion von Städten als Zentren. In Hinblick auf die Datengrundlage ist fringS’ Argumentation symptomatisch für dialektgeographische Studien dieser Zeit: Sie stützt sich im Wesentlichen auf einzelne sprachliche Merkmale. Ihrer Plausibilität tut dies keinen Abbruch, doch für eine Untermauerung der beobachteten Regelmäßigkeiten wäre mehr Material wünschenswert.
30
Einleitung
Auf diese Problematik weist Jan gooSSenS hin, der das von ihm „extra-linguistische Methode“ genannte Verfahren – die Erklärung von Distributionen durch extralinguistische Faktoren – entscheidend systematisiert hat. Erst das wiederholte Auftreten einer bestimmten sprachgeographischen Struktur – über mehrere Sprachkarten einzelner sprachlicher Phänomene hinweg – rechtfertige die Annahme eines entsprechenden ursächlichen Zusammenhangs: Ist […] das Verteilungsmuster einer bestimmten dialektalen Erscheinung auch auf Karten mit anderen Erscheinungen zu erkennen – dies ist wohl der Regelfall – so […] ist […] anzunehmen, daß das sich wiederholende dialektgeographische Muster durch eine gemeinsame Ursache zustandegekommen ist, die die eigentliche Problematik der Kartensammlung darstellt. (gooSSenS 1977, 56)
Zur Bestätigung einer solchen Annahme ist eine gewisse Häufigkeit des beobachteten Musters im Kartenkorpus erforderlich: Die Betonung des Problemgebiet-charakters einer regionalen Sprachlandschaft kann darüber hinwegtäuschen, daß die Grenzen anderer Erscheinungen – die vielleicht ein Vielfaches der behandelten ausmachen – einen völlig anderen Verlauf haben können, daß also das betreffende Gebiet für die große Mehrheit seiner Spracherscheinungen gar kein spezifisches Problemareal ist. (gooSSenS 1977, 57)
Ebenso weist gooSSenS auf eine Schwierigkeit hin, die sich bei der Deutung von Dialektgrenzen als Folge von Verkehrsscheiden – seien sie politischer oder topographischer natur – ergibt. Dabei sei nicht nur darauf zu achten, dass die Deckungsgleichheit einer Dialektgrenze mit einer außersprachlichen Grenze über eine gewisse Länge verfügen muss, um aussagekräftig zu sein, sondern auch, dass das außersprachliche Korrelat jeweils nur einen einzelnen Faktor umfasst: Je länger die Strecke ist, über die die beiden Grenzen sich decken, um so größer ist die Wahrscheinlichkeit, daß diese Interpretation [des kausalen Zusammenhangs] zutrifft. Ist die betreffende Strecke nur kurz, so wird die Wahrscheinlichkeit kleiner. Die Glaubwürdigkeit dieser Art von Interpretation hängt außerdem von dem Standpunkt ab, den man beim Bestimmen der Verkehrsgrenze einnimmt. Ist dieser einheitlich, so ist der Beweis viel schlagender, als wenn man aus verschiedenen Grenzen […] eine Linie konstruiert, mit der die Isoglosse zusammenfällt. In letzterem Fall wird immer der Verdacht einer Konstruktion ad hoc vorliegen. (gooSSenS 1977, 76–77)
Der Anspruch auf Glaubwürdigkeit und Plausibilität der Schlussfolgerungen, der bei gooSSenS durchklingt, kommt einer impliziten Forderung nach quantitativen Methoden, die zu verlässlichen Ergebnissen führen, gleich. Die frühen sprachgeographischen Untersuchungen von dialektalen Grenzen stimmen zwar weitgehend darin überein, dass Verkehrsbewegungen ausschlaggebend für die Vermittlung von sprachlichen Varianten – und damit für die Ausbildung von Dialektgebieten – sind, wobei vor allem politische Grenzen als verkehrshemmende Faktoren angeführt werden, in geringerem Ausmaß auch naturräumliche Hindernisse. Eine Bewertung dieser Schlussfolgerungen, die oft auf der Grundlage von Beobachtungen, nicht von systematischen Auswertungen gemacht wurden, auf ihre Gültigkeit, ist jedoch nach wie vor erstrebenswert. Mit den Methoden CarL haagS zur Bewertung sprachlicher Grenzlinien, von denen in diesem Abschnitt nur einige Ergebnisse wiedergegeben wurden, begann sich schon früh ein quantitativ arbeitender
31
Forschungsgeschichtliche Grundlagen
Zweig der Dialektgeographie zu entwickeln, der durch die Aggregation von Daten auf Erkenntnisgewinn in Hinblick auf dialektgeographische Strukturen zielte: die Dialektometrie. 1.2.2 Quantitative Methoden in der Sprachgeographie Door meten tot weten – Motto des Labors von heike k aMerLingh onneS
Der Begriff der Dialektometrie geht zurück auf Jean Séguy, der ihn in den 1970er Jahren als Sammelbegriff für dialektologische „recherches des méthodes numériques“ (Séguy 1973a, 1) eingeführt hat. Dialektometrie kann somit als der quantitativ arbeitende Zweig der Dialektologie verstanden werden (vgl. auch Leinonen 2010, 38). Das grundlegende Prinzip der Dialektometrie besteht in der Reduktion der unüberschaubaren Variation in geographischen Dialektdaten auf wesentliche Informationen, die einer Erklärung durch bedingende Faktoren Vorschub leisten: Dialectometric techniques analyze linguistic variation quantitatively, allowing one to aggregate over what are frequently rebarbative geographic patterns of individual linguistic variants […]. This leads to general formulations of the relation between linguistic variation and explanatory factors. (nerbonne/k retzSChMar 2006, 387)
Die Entstehung der Dialektometrie ist im Lichte des „quantitative turn“ (britain 2002, 607) der Sozialwissenschaften in den 1960er Jahren zu sehen, der auch Forschungszweige wie die Psycho-, Ökono- oder Demometrie hervorbrachte, doch eigentlich hatte ihre Entwicklung lange Zeit vor der Prägung des Terminus ihren Anfang genommen. Ihre Geschichte begann mit der sogenannten Isoglossenmethode, die auf auguSt bieLenStein (1892) zurückgeht. [Bei der Isoglossenmethode] werden die auf mehreren Karten von einzelnen Spracherscheinungen vorkommenden Isoglossen alle auf eine Kombinationskarte eingezeichnet. Man nimmt dann an, daß man es dort, wo mehrere Linien zusammenfallen, mit einer wichtigen Dialektscheide zu tun hat und daß die Bereiche, die nur von wenigen oder gar keinen Linien durchkreuzt werden, verhältnismäßig einheitliche Mundartgebiete darstellen. (gooSSenS 1969, 54)8
Lange bevor der Ausdruck Dialektometrie geschaffen wurde, arbeitete CarL haag bereits mit einer Methode, die im Rückblick eindeutig als dialektometrisch zu bezeichnen ist. Es handelt sich dabei im Wesentlichen um eine Systematisierung von bieLenSteinS Isoglossenmethode. Um das lautgeographische Material seiner Arbeit „Die Mundarten des oberen neckar- und Donaulandes“ (1898) übersichtlicher zu machen, vereinte haag die Daten über lautliche Unterschiede zwischen benachbarten Orten in einer einzigen Karte. Dazu wurde jeder Unterschied durch 8
Vgl. auch kurath (1972, 24): „[…] one finds that in some parts of the area they [= isoglosses] run in bundles of various sizes – close-knit or spaced. These bundles show the location of major and minor dialect boundaries and thus indicate the dialectal structure of the total area.“
32
Einleitung
eine Linie – eine Isoglosse – markiert; wo mehrere Linien sich überlagerten, entstanden Linienbündel. Die Stärke des Abschnitts einer Dialektgrenze konnte er somit als die Zahl der Isoglossen, die sich dort deckten, beschreiben. Das Ziel dieser (zunächst rein kartographischen) Methode ist somit einerseits dialektklassifikatorischer Natur, indem sie versucht, Dialektgebiete voneinander abzugrenzen; zum andern dient sie auch dazu, Annahmen über Zusammenhänge zwischen linguistischen Grenzen und externen Faktoren (vgl. 1.2.1.2) quantitativ zu bewerten: […] diese [Kombinationskarte] stellte sich mehr und mehr in den Mittelpunkt der Arbeit, besonders als ich, nach einer Erklärung der gefundenen Linien suchend, die freudige Entdekkung gemacht hatte, dass sie eine überraschend weitgehende Uebereinstimmung mit alten politischen Grenzen zeigten. (h aag 1898, 4)
Jean Séguy, der den Terminus „dialectométrie“ (Séguy 1973a, 1) für quantitative dialektologische Studien geprägt hat, führte in den 1970er Jahren für den „Atlas linguistique de la Gascogne“ (Séguy 1973b) eine ähnliche Methode ein, bei der die sprachliche Distanz zwischen zwei orten gemessen wird, wobei er Lexikon, Lautung, Morphologie und Syntax berücksichtigte. Für benachbarte ortepaare wird aus der Zahl der nicht übereinstimmenden Belege in diesen Bereichen ein Index berechnet, der ihre linguistische ‚Unähnlichkeit‘ beschreibt (vgl. Séguy 1973b; für eine konzise Darstellung von SéguyS Methode vgl. franCiS 1983, 142–144, 154–158). Die Beziehung zwischen zwei orten lässt sich nun in Form der Stärke einer Grenzlinie zwischen ihnen visualisieren (was im Prinzip haagS Methode entspricht), oder umgekehrt in Form der Stärke einer Verbindungslinie zwischen ihnen. Séguy war außerdem der Erste, der den Zusammenhang zwischen sprachlicher Ähnlichkeit und geographischer Distanz untersucht hat, was ihm durch die Quantifizierung der linguistischen Distanz möglich wurde (vgl. Séguy 1971). Mit dem Aufkommen erschwinglicher EDV-Ausstattung war es nur eine Frage der Zeit, bis sich jemand die Rechenkraft von Computern zunutze machte, um wesentlich größere Datenmengen verarbeiten zu können, was hanS goebL in den 1980er Jahren gelang. goebL betrachtet alle ortepaare, nicht nur die benachbarten; so erhält er eine ort × ort-Matrix, die den Grad sprachlicher Ähnlichkeit zwischen allen ortsdialekten im Untersuchungsgebiet erfasst. Diese Ähnlichkeitsmatrix ist das zentrale Werkzeug der Dialektometrie goebLS und daran anknüpfender Methoden. Für die Auswertung der Ähnlichkeitsmatrix und die Visualisierung der Ergebnisse hat goebL eine Reihe neuer Methoden entwickelt.9 neben sogenannten Parameterkarten, die sekundäre, von der Ähnlichkeitsmatrix abgeleitete Werte kartieren, ist goebLS wohl wichtigste neuerung die Einführung der clusteranalyse.10 Die clusteranalyse ist ein beliebtes Hilfsmittel für die Klassifikation von Elementen mit paarweisen Ähnlichkeits- oder Distanzwerten, wie sie in Form der Ähnlichkeitsmatrix vorliegen. In diesem Fall stellen die orte mit ihren Dialekten die zu klassifizierenden Elemente dar. Sie werden Schritt für 9 10
Für eine ausführlichere Darstellung der hier beschriebenen Analyse- und Kartierungsverfahren s. z. B. goebL (1984, Bd. I) oder goebL (2006). Für eine detailliertere Einführung in die Anwendung der clusteranalyse als dialektometrische Methode vgl. goebL (1983, 17–29).
Forschungsgeschichtliche Grundlagen
33
Schritt zu clustern von wachsender Größe agglomeriert. Zu Beginn des Verfahrens gibt es so viele Cluster wie Orte, und jeder Cluster enthält genau einen Ort. Bei jedem Schritt werden nun die beiden Cluster zusammengefasst, die einander am ähnlichsten sind,11 wodurch die Gesamtzahl der Cluster jeweils um 1 sinkt. Dies lässt sich theoretisch fortsetzen, bis man nur noch einen cluster hat, der alle Karten enthält. Die entstandenen cluster können in Form von klar voneinander abgegrenzten Gebieten auf einer Karte dargestellt werden, oder – als nicht-kartographische Visualisierung – als ein Baumdiagramm (Dendrogramm), wobei jeder Schritt der clusterung als Verästelung erscheint.12 Der Trick liegt nun darin, das clusterverfahren an einem Punkt zu stoppen, an dem die clusteranzahl eine möglichst aussagekräftige Information über die innere Gliederung der Elementmenge vermittelt. Es gibt verschiedene automatisierte Methoden zur Ermittlung einer ‚optimalen‘ clusterzahl, doch oft wird dies auch nach Augenschein entschieden. Dies stellt neben der Wahl verschiedener anderer Parameter beim clustern eines der Hauptprobleme der Prozedur dar. Die Problematik dieses Verfahrens liegt in der Kappung der Dendrogrammstränge, die jeweils auf unterschiedlichem Werteniveau vorgenommen wurde. Da diese Verclusterung nicht völlig automatisch durchzuführen ist, geht das Vorwissen des Dialektologen in seine Entscheidungen ein und steuert somit auch den gesamten Klassifizierungsprozeß. (putSChke 1993, 429)
Auch die Wahl anderer Parameter ist nicht immer eindeutig; sie muss von Fall zu Fall entschieden werden: „Keines dieser Verfahren kann in Anbetracht des gegebenen Klassifikationszieles als ‚richtig‘ oder ‚falsch‘, sondern stets nur als ‚mehr oder weniger brauchbar‘ qualifiziert werden“ (goebL 1983, 17); doch „[f]ast alle der in der einschlägigen Literatur dazu beschriebenen Methoden ergeben brauchbare Resultate“ (goebL 2005, 511). Weitere Analysemethoden wurden vor allem in der niederländischen Dialektometrie, hauptsächlich von John nerbonne und wiLbert heeringa, erarbeitet. 11 12
Für die Messung der Ähnlichkeit zwischen zwei clustern, die mehr als ein Element enthalten, gibt es verschiedene Methoden, die hier nicht näher erläutert werden. Eine knappe Übersicht bietet heeringa (2004, 148–150). Die kartographische Darstellung der cluster als distinkte Gebiete suggeriert eine Einheitlichkeit und Abgegrenztheit, wo tatsächlich keine existiert. Ist man sich dieser Tatsache bewusst, so kann diese Darstellungsweise durchaus ein gutes Hilfsmittel für die Beurteilung der synchronen dialektalen Gliederung des Untersuchungsgebiets sein. Die Darstellung als Dendrogramm verleitet hingegen eher zu einer diachronen Interpretation der Verhältnisse: „A diachronic interpretation simulates, as in a theoretical ‘game’, the progressive fragmentation of a given linguistic area, beginning at the first bifurcation after the root. These views […] depend on the basic assumption that ca. 1900 years ago [in diesem Fall] Galloromania represented a linguistically homogeneous area which diversified progressively over the time.“ (goebL 2006, 421.) Davon abgesehen, dass goebL hier die Konzepte der taxonomischen und der phylogenetischen Klassifikation miteinander vermengt (vgl. LaSS 1997, 113–114; Croft 2000, 15–16), setzt diese Sichtweise das Stammbaummodell des Sprachwandels voraus, doch ist, wie er selbst ausführt, „[d]ie Annahme einer solchen initialen Homogenität […] glücklicherweise stets kontrovers geblieben“ (goebL 1983, 23; vgl. auch CavaLLi-Sforza /wang 1986, 39; woLfraM /SChiLLing-eSteS 2003, 721); sie besitzt somit auch nur sehr begrenztes Erklärungspotential.
34
Einleitung
neben der Verwendung von phonetischen Abständen (vgl. nerbonne/SiedLe 2005; heeringa 2004, 27–143) stehen dabei vor allem Verfahren zur Datenreduktion und -visualisierung im Mittelpunkt, die die Handhabung multivariater Daten erleichtern. Etwa mithilfe der sogenannten multidimensionalen Skalierung (MDS), um nur eines der verschiedenen Verfahren zu nennen, kann das hochdimensionale Beziehungsgeflecht der Ähnlichkeits-/Distanzmatrix auf einige wenige Dimensionen heruntergebrochen werden (typischerweise auf zwei, was die Darstellung der Beziehungen zwischen den orten auf Papier oder einem computerbildschirm wesentlich erleichtert oder überhaupt erst möglich macht; vgl. heeringa 2004, 156–163). Der Mainstream der Dialektometrie ist bis heute von einer fast ausschließlichen Verwendung aggregierter Daten gekennzeichnet, die nerbonne (2009) auch vehement verteidigt. Jedoch ist man sich gerade im Bereich der niederländischen Dialektometrie den Einschränkungen, die sich daraus ergeben, bewusst geworden: While concentrating on the aggregate analysis, dialectometric methods are likely to ignore the different underlying distribution patterns below the aggregate level […]. Aggregate analysis gives a view of the relationships between dialects, but in order to explain the relationships the diffusion patterns are important. (Leinonen 2010, 38)13
Einige Vorstöße, quantitative Analysen mit nicht-aggregierten Dialektdaten durchzuführen, liegen mittlerweile aus dem niederländischen und amerikanischen Raum vor (vgl. neben den nachfolgenden Beispielen auch grieve 2009; grieve/ SpeeLMan/geeraertS 2011). Ein Verfahren, das in jüngster Zeit von nerbonne und anderen verwendet wird, ist die Faktorenanalyse, die die Variation in einem Datensatz auf möglichst wenige zugrunde liegende Faktoren zurückzuführen versucht. Die Faktorenanalyse „proceeds from a matrix of correlations among variables, and, based on these, postulates common factors, which may be responsible for the correlations“ (nerbonne 2006, 468). Datengrundlage für die Analyse sind hier, anders als etwa bei der multidimensionalen Skalierung, die einzelnen, unaggregierten Befragungsergebnisse. So kann u. a. untersucht werden, welche sprachlichen Variablen sich in der Sprachgeographie durch strukturelle Zusammenhänge auszeichnen (vgl. nerbonne 2006, 468). Für näheres zur Faktorenanalyse s. 4.6.3. Eine erste quantitative Untersuchung der Wirkung der sprachlichen Eigenschaften von Variablen auf deren Distribution liegt in Form einer Studie von dirk SpeeLMan und dirk geeraertS vor (SpeeLMan/geeraertS 2008 und geeraertS/ SpeeLMan 2010). Sie untersuchten den Einfluss der empirisch ermittelten Eigenschaften „salience, vagueness and negative affect“ (SpeeLMan/geeraertS 2008, 229) von lexikalischen Variablen auf die „onomasiological heterogeneity“ (SpeeLMan/ geeraertS 2008, 229) ihrer geographischen Verteilungen. Um den Grad der lexikalischen Variabilität im Raum („heterogeneity“) zu berechnen, wurden sowohl die Anzahl der Varianten, die relative Ausdehnung ihres Vorkommens als auch der Grad der Verstreutheit der Belege berücksichtigt. Mittels multipler linearer 13
Vgl. auch Prokić (2007, 62): „Although techniques in dialectometry have shown to be successful in the analysis of the dialect variation, all of them aggregate over the entire available data, failing to extract linguistic structure from the aggregate analysis.“
Forschungsgeschichtliche Grundlagen
35
Regressionsanalyse errechneten SpeeLMan und geeraertS den Einfluss der erhobenen Eigenschaften auf die Heterogenität und erhielten so Werte, die einen Einfluss unterschiedlicher Stärke bestätigten; sie können damit ca. 60 % der Varianz der Heterogenitätswerte erklären (vgl. SpeeLMan/geeraertS 2008, 233). Somit ist erstmals die Relevanz einzelner sprachlicher – d. h. durch die sprachliche Variable oder deren Varianten bestimmter – Faktoren für ihre räumliche Verteilung auf quantitativer Basis bestätigt.
2 THEoRIE Für die nachfolgenden Ausführungen ist es unerlässlich, einige Konzepte und Begrifflichkeiten zu klären. Viele der verwendeten Fachtermini werden in der Literatur uneinheitlich verwendet, so dass eine Klärung ihrer Verwendungsweise in der vorliegenden Arbeit angeraten ist. Zudem müssen einige theoretische Grundlagen und Grundannahmen dargelegt werden, um die Voraussetzungen für wiederkehrende Themen zu schaffen. 2.1
SPRAcHDynAMIK IM RAUM Im Raume lesen wir die Zeit. – k arL SChLögeL
Zwei zentrale Begriffe, die geolinguistische Variation und Variabilität betreffen, Distribution und Diffusion, lassen sich mit den dichotomen Betrachtungsebenen der Sprache nach ferdinand de SauSSure (2001, 93–119) in Verbindung setzen: –
Dist r ibut ion bezeichnet die Verteilung sprachlicher Varianten im Raum zu einem bestimmten Zeitpunkt; hierbei handelt es sich also um eine sy nch ro n ische Betrachtungsweise.
–
Dif f usion bezeichnet den zeitlichen Vorgang der räumlichen Ausbreitung von sprachlichen Varianten, bezieht sich also auf ihr Auftreten in diach ron ischer Hinsicht.14
Dialektkarten zeigen (normalerweise) eine Momentaufnahme der sprachgeographischen Situation, wie sie zur Zeit der Datenerhebung existiert hat. Sie dokumentieren und beschreiben die Distribution von Varianten synchronisch. Erst wenn die Befunde erklärt werden sollen, wird der Blick auch auf die diachronische Ebene gerichtet: Synchronisch beobachtbare Raumstrukturen sind Querschnitte von nur diachronisch erfassbaren raumzeitlichen Entwicklungen. Ein Zurückführen von Distributionsmustern auf Diffusionsprozesse macht den Versuch einer Erklärung überhaupt erst möglich, denn die Distributionsmuster sind alles, was durch das Zeitfenster der Datenerhebung von den Diffusionsprozessen beobachtet werden kann; sie ermöglichen es aber bis zu einem bestimmten Grad, diese Prozesse zu rekonstruieren. 14
Einige Autoren verwenden die Bezeichnung Diffusion für jede Art von Ausbreitung durch die Sprechergemeinschaft, nicht nur für die diatopische (vgl. woLfraM /SChiLLing-eSteS 2003, 714). Ich verwende in dieser Arbeit Diffusion, wenn nicht anders expliziert, im geographischen Sinn (vgl. 2.1.3).
Sprachdynamik im Raum
37
Diese Zusammenhänge prägen die Lesart von Sprachkarten ganz enorm: An die zunächst synchronische Interpretation von Kartenbildern schließen sich fast immer Deutungen diachronischer Prägung an. Die Distribution von Varianten im Raum wird automatisch als Momentaufnahme oder als Ergebnis ihrer Diffusion, ihrer zeitlichen Ausbreitung im Raum, gesehen (vgl. hard 1972, 31, 40; haaS 2010, 649; graf 2010, 16):15 Das dialektgeographische Kartenbild ist in seiner Grenz- und Raumbildung n u r als Bewegung zu interpretieren, die im Augenblick der Aufnahme für einen Moment fixiert wurde. (LöffLer 2003, 132; Hervorhebung S. P.)
Die Erforschung von Distributionsmustern ist somit nicht vom Studium des Sprachwandels im Raum zu trennen. Das Schließen von der Gestalt einer Karte auf dahinterstehende Sprachwandelprozesse ist zwar oft alles andere als eindeutig und kann im Einzelfall zu Recht angezweifelt werden (vgl. hard 1972, 31–40), doch die Betrachtung von dialektgeographischen Strukturen ist ohne Blick auf Ausbreitungsprozesse kaum denkbar. Umgekehrt erlaubt eine Sprachkarte auch, einen einzigartigen Blickwinkel auf Sprachwandel im Raum einzunehmen: „The distribution of a feature on a linguistic map is the frozen reflex of a shift in linguistic behavior – a change in language“ (haaS 2010, 649). So wird die Sprachgeographie zum Hilfsmittel der Sprachwandelforschung (vgl. auch SBS, Bd. 1, 15–16): Dialect variation brings together language synchrony and diachrony in a unique way. […] there is a time dimension that is implied in the layered boundaries, or isoglosses, that represent linguistic diffusion from a known point of origin. Insofar as the synchronic dispersion patterns are reflexes of diachronic change, the examination of synchronic points in a spatial continuum also may open an important observational window into language change in progress. (woLfraM /SChiLLing-eSteS 2003, 713)
Dieses Zitat lässt sich durch eine Fülle von Beispielen illustrieren, in denen die eigentlich synchronen Strukturen auf einer Sprachkarte als ‚Beobachtungsfenster‘ für Sprachwandel verwendet werden (z. B. hard 1972, 25–30 oder weinhoLd 1985). So wurde etwa versucht, die Koinzidenz von Isoglossen zur Stützung der junggrammatischen Hypothese der Ausnahmslosigkeit der Lautgesetze heranzuziehen (vgl. WeinreiCh/Labov/herzog 1968, 151; vgl. auch 1.1.1). In der jüngeren, soziolinguistisch geprägten Sprachgeographieforschung spielt hingegen das Verstehen von Diffusionsprozessen ganz allgemein eine wichtige Rolle für das Verständnis von Sprachwandelprozessen: „In fact, an account of the diffusion of changes through space is fundamental to an understanding of the mechanism of change“ (baiLey et al. 1993, 360). Bei der Untersuchung von dialektgeographischen Strukturen, der statistischen Überprüfung von Zusammenhängen und bei der Deutung der Befunde mit Blick auf Diffusionsvorgänge ist es deshalb wichtig, Mechanismen des Sprachwandels in angemessener Weise zu berücksichtigen: „Studying the diffusion of linguistic features on the basis of static maps requires a theory of language change“ (haaS 2010, 649). 15
Zur einer allgemeineren Betrachtung der zeitlichen Dimension von geographischen Karten vgl. SChLögeL (2003, 86–87).
38
Theorie
2.1.1 Synchronie und Diachronie Der Schluss von synchronischen sprachlichen Verhältnissen auf diachronische Prozesse setzt bis zu einem gewissen Grad die Aufgabe der strikten SauSSure’schen Trennung dieser beiden Ebenen (vgl. 2.1) voraus (vgl. auch MCMahon 1994, 9–11). Sie stehen natürlich weiterhin als Beschreibungskategorien zur Verfügung,16 sonst wäre etwa eine Unterscheidung zwischen Diffusion und Distribution gar nicht möglich. Doch der Ausschluss der gleichzeitigen Betrachtung von Synchronie und Diachronie, wie er von SauSSure gefordert wurde, erweist sich in der Dialektologie als „unangemessen“ (haaS 1978, 2; vgl. auch SChMidt/herrgen 2011, 21–25). Stattdessen sollte die Sprachbetrachtung so angelegt sein, „dass sich keine Widersprüche zwischen ihrer synchronen und diachronen Komponente ergeben; die Theorie muss, in diesem Sinne, kohärent sein; Synchronie und Diachronie müssen systematisch aufeinander bezogen werden“ (k annengieSSer 1972, 4). Die Vereinigung beider Betrachtungsweisen und damit die Überwindung der Synchronie-Diachronie-Dichotomie wird gemeinhin unter dem Schlagwort Sprachdynamik angegangen. SChMidt/herrgen (2011, 20) verstehen unter Sprachdynamik „die Wissenschaft von den Einflüssen auf die sich ständig wandelnde komplexe Sprache und von den sich daraus ergebenden stabilisierenden und modifizierenden Prozessen“. Die durch den Begriff der Synchronie implizierte Statik wird so verneint, denn der „Anwendungsbereich statischer Analysen sind ruhende Gegenstände, bei denen sich die Kräfte gegenseitig aufheben“ (SChMidt/herrgen 2011, 23). Die Konsequenzen dieser Herangehensweise liegen in sprachgeographischer Hinsicht unter anderem im Verständnis von dem, was auf Sprachkarten dargestellt ist. Geographische Verteilungen von Varianten sind dynamisch, nicht statisch (vgl. auch SChMidt 2010, 211–212; SChMidt/ herrgen 2011, 19–25).17 Ebenso wie bei einem Foto eines an einem Baum vorbeifahrenden Autos die Beschreibung zu kurz greift, das Auto befinde sich vor dem Baum,18 so kann die Beschreibung einer Sprachkarte sich nicht darauf beschränken, die momentane Verbreitung der Varianten zu erfassen. In beiden Fällen sind jedoch Inferenzen erforderlich (vor allem über die Richtung der Bewegung), die nicht frei von Fehlerquellen sind (vgl. hard 1972, 31–40). nur in den seltensten Fällen sind die Distributionen in einem sprachgeographischen Korpus als Zustand zu sehen, der einen gewissen Grad an Stabilität aufweist; stattdessen ist das, was zu sehen ist, fast immer eine Momentaufnahme von change in progress, die sich nicht ohne Bezug auf Sprachwandelprozesse erklären lässt.
16 17 18
Entsprechend formuliert CoSeriu (1974, 9), „daß gerade die Antinomie Synchronie – Diachronie nicht der Objektebene angehört, sondern der Betrachtungsebene: sie bezieht sich nicht auf die Sprache, sondern auf die Sprachwissenschaft“. Für eine Gegenüberstellung des statischen und des dynamischen Paradigmas in geolinguistischer Hinsicht s. baiLey (1973, 34–35). Vgl. auch das Bild des Sonnensystems als Beispiel für ein echt dynamisches System bei SChMidt/herrgen (2011, 24).
39
Sprachdynamik im Raum
2.1.2 Sprachvariation und Sprachwandel Die Gegenwart hat allenfalls die Breite einer Rasierklinge, welche die Vergangenheit von der Zukunft trennt. – h anS-uLriCh wehLer, „Soziologie und Geschichte als nachbarwissenschaften“
Im vorausgehenden Abschnitt wurde deutlich gemacht, dass eine Sprachkarte nicht rein synchronisch interpretiert werden kann, sondern immer auch der Blick auf diachronische Verhältnisse notwendig ist, was weniger darin begründet liegt, dass beides in der Sprachgeographie vermengt wird, als vielmehr darin, dass es eine scharfe Trennlinie zwischen beiden Ebenen eigentlich nicht gibt; Synchronie und Diachronie sind in bestimmten Kontexten zwei Seiten einer Medaille. Dies wird deutlich, wenn man sich die mit diesen Begriffen eng verbundenen Konzepte von Sprachvariation und Sprachwandel vor Augen führt. Sprachvariation beschreibt die synchronische Variabilität von Sprache in diatopischer, diastratischer und diaphasischer Dimension (vgl. 2.2), während Sprachwandel die Veränderung von Sprache entlang eines Zeitstrahls bezeichnet. –
Sprachva r iat ion liegt vor, wenn zur Realisierung einer sprachlichen Funktion mehr als eine sprachliche Form zur Verfügung steht.
–
Sprachwa ndel liegt vor, wenn sich die Zuordnungen zwischen sprachlichen Funktionen und sprachlichen Formen über die Zeit verändern.
Beide sind vor allem auf der Arbitrarität sprachlicher Zeichen – oder allgemeiner: auf der Arbitrarität sprachlicher Konstruktionen – begründet. Eine Konstruktion (im Sinne der Konstruktionsgrammatik) ist eine beliebige nicht vorhersagbare oder aus ihren Bestandteilen herleitbare Paarung von Form und Funktion,19 z. B. von Wort und Bedeutung. Konstruktionen umfassen somit alle Form-FunktionPaare, die eigens erlernt werden müssen, weil die jeweilige Zuordnung nicht zwingend ist („including morphemes, words, idioms, partially lexically filled and fully general linguistic patterns“; goLdberg 2003, 219). nur durch diese Arbitrarität sind Sprachvariation und Sprachwandel möglich, denn nur so kann es multiple und veränderliche Zuordnungen von Form und Funktion geben. Beides kann demnach auf allen sprachlichen Ebenen auftreten: Statt des einen Wortes kann man auch ein anderes verwenden; an die Stelle eines bestimmten Morphems tritt ein anderes oder es wird anders ausgesprochen; eine bestimmte Ausdrucksweise wird von manchen Menschen anders verwendet. 19
„Any linguistic pattern is recognized as a construction as long as some aspect of its form or function is not strictly predictable from its component parts or from other constructions recognized to exist. In addition, many constructionist approaches argue that patterns are stored even if they are fully predictable as long as they occur with sufficient frequency.“ (goLdberg 2003, 219–220)
40
Theorie
Aus empirischer Sicht sind Sprachvariation und Sprachwandel relativ abstrakte Größen, denn wie viele sprachlichen Formen in welchem Ausmaß zur Verfügung stehen, lässt sich nicht ohne Weiteres messen. Erheben lassen sich nur Realisationsinstanzen der sprachlichen Zeichen 20 und deren Frequenzen; wirkliche Gleichzeitigkeit solcher Realisationsinstanzen lässt sich wohl nur ausnahmsweise beobachten. Sind sie aber nicht gleichzeitig, handelt es sich dann bei abweichenden Realisierungen schon um Sprachwandel? Will man etwa die Sprache einer Sprechergemeinschaft untersuchen, so wird man das Sprachverhalten ihrer Mitglieder beobachten, was jedoch nur über einen gewissen Zeit rau m hinweg, und nicht zu einem bestimmten Zeit pu n k t, möglich ist. Selten gebrauchte sprachliche Funktionen werden dabei vielleicht nur einige wenige Male – und so gut wie zwangsläufig zu verschiedenen Zeitpunkten – realisiert. Wenn dies durch unterschiedliche Formen geschieht, so ist nicht zu entscheiden, ob die unterschiedlichen Realisationen Stichproben einer durch Sprachvariation bedingten, aber gleichbleibenden Verteilung darstellen, oder ob sie Indizien für einen fortschreitenden Sprachwandel, d. h. eine sich in der Zeit ändernde Verteilung, sind. Es handelt sich dabei um ein Problem, das sich nur bei hochfrequenten sprachlichen Variablen oder einer Beobachtung über einen langen Zeitraum auflöst. Die enge Beziehung zwischen Sprachvariation und Sprachwandel äußert sich auch durch ihre gegenseitige Implikation, die zumindest in einer Richtung zwingend ist: not all variability and heterogeneity in language structure involves change; but all change involves variability and heterogeneity. (weinreiCh /Labov/herzog 1968, 188)
Sprachvariation („variability and heterogeneity“) wird hier als notwendige Voraussetzung für Sprachwandel aufgeführt.21 Wie ist dies zu verstehen? Sprachwandel beschreibt den Umstand, dass sich die Zuordnungen zwischen Funktionen und Formen mit der Zeit ändern. Klammert man Variation aus der Betrachtung sprachlicher Systeme aus – wie es Strukturalisten von SauSSure bis ChoMSky getan haben (vgl. weinreiCh/Labov/herzog 1968, 104–125; baiLey 1973, 2–13) – so ist jeder sprachlichen Funktion genau eine Form zugeordnet. Wie unter diesen Voraussetzungen Sprachwandel, z. B. im Bereich der Lexik – also neuzuordnung eines Signifikats zu einem Signifikanten –, erfolgen kann, ist unklar geblieben, da dies ohne Übergangsphase erfolgen müsste (vgl. weinreiCh/Labov/herzog 1968, 150–151), ein scheinbares Problem, das CharLeS-JaMeS baiLey (1973, 13) als „The temporal paradox“ bezeichnet hat. Aus diesem und anderen Gründen war die Aufgabe der Annahme kompetenzinhärenter Homogenität – und damit die Hinwendung zur Beschäftigung mit sprachlicher Variation – wohl der bedeutendste theoretische Schritt der Sozio- bzw. der Variationslinguistik: Die Variation innerhalb eines Sprachsystems wurde als wesentliche Eigenschaft der Sprachvariation überhaupt gewürdigt (vgl. auch bertheLe 2004, 728–736). Die Heterogenität einer Sprache 20 „‚Konkret‘ fassbar sind an der Sprache nur die konkreten Sprechakte, das ‚Sprachmaterial‘.“ (h aaS 1978, 6) 21 Vgl. u. a. auch woLfraM /SChiLLing-eSteS (2003, 715): „All change necessarily involves variation.“
Sprachdynamik im Raum
41
wurde so als Voraussetzung für die graduelle Ersetzung einer sprachlichen Form durch eine andere erkannt – und damit als Voraussetzung für Sprachwandel (vgl. WeinreiCh/Labov/herzog 1968, 159–170; haaS 1978, 6–7; vgl. auch 2.1.3). Gerade mit Blick auf die empirisch ausgerichtete Dialektologie hat diese Einsicht zur Folge, dass ein einheitlicher ortsdialekt nicht nur aufgrund praktischer Probleme, sondern auch prinzipiell nicht zu ermitteln ist (vgl. auch bertheLe 2004, 728–736): concurrent variants do not obscure an idealized homogeneous variety; they need instead to be analyzed as an integral aspect of the constant varietal flux. (SChMidt 2010, 202)
In der Terminologie der Variationslinguistik werden sprachliche Funktionen durch Variablen erfüllt, die durch verschiedene Varianten realisiert werden können. Varianten, die zur selben Variablen gehören (Allovarianten oder Konkurrenzformen), sind gegeneinander austauschbar; sie stehen zueinander in einem paradigmatischen Verhältnis. Die Wahl der Variante durch einen Sprecher wird durch die diatopische, die diastratische und die diaphasische Dimension bestimmt; sie kann aber auch frei sein. –
Eine Va r ia nte ist eine mögliche Realisationsform einer sprachlichen Funktion.
–
Eine Va r iable ist die Menge aller zur Realisierung einer bestimmten sprachlichen Funktion zur Verfügung stehenden Varianten.22
Formalistisch lassen sich die Definitionen dieser Begriffe wie folgt darstellen: Einer sprachlichen Funktion m ist eineindeutig eine Menge an n Varianten {x1m;…;xnm} zugeordnet, die zusammen die Variable X m bilden: m ↔ X m = {x1m;…;xnm}
(1)
Aus empirischer Sicht sind Frequenzen der einzelnen Varianten feststellbar: Wie viele Male wird Variante x1m, wie viele Male wird Variante x2m unter sonst gleichen Bedingungen verwendet, wenn die zugehörige Variable X m versprachlicht wird? Es liegt nahe, diese Frequenzen als Realisationen von Wahrscheinlichkeitsverteilungen zu betrachten (vgl. Labov 1969; Cedergren/Sankoff 1974; zusammenfassend ChriSten 1993, 9–10): Wie wahrscheinlich ist es beim Auftreten von Variable X m, dass sie als x1m bzw. x2m usw. realisiert wird? Jeder Variante x kommt dabei in einem bestimmten (durch die diatopische, diastratische und/oder diaphasische Dimension definierten) Bereich A eine bestimmte Auftretenswahrscheinlichkeit px(A) zu. Frequencies are clearly part of performance; but we use them to estimate probabilities, which are inherent in the ability to generate the observed behavior. It is our contention that these probabilities are properly part of competence. (Cedergren/Sankoff 1974, 343)
Die relative Frequenz einer Variante in einem Untersuchungskorpus dient als Schätzfunktion für ihre Wahrscheinlichkeit. Die Genauigkeit der Schätzung steigt 22 Da eine Variable damit eineindeutig auf eine sprachliche Funktion bezogen ist, kann sie vereinfachend mit ihr gleichgesetzt werden.
42
Theorie
mit der Menge der Daten. Auf diese Weise lässt sich die sogenannte A-priori- oder Anfangswahrscheinlichkeit einer Variante ermitteln, die das Auftreten eines Ereignisses unabhängig von Vorbedingungen beschreibt (vgl. JurafSky et al. 2001, 231; bod 2003, 16). Die probabilistische Herangehensweise an Variation in der Sprache erlaubt es jedoch auch, die Wahrscheinlichkeiten in Abhängigkeit von Bedingungsfaktoren zu untersuchen: Wie beeinflusst die Veränderung der räumlichen, sozialen oder situativen Rahmenbedingungen 23 die Auftretenswahrscheinlichkeit einer bestimmten Variante? Wie wird die Realisation einer Variablen durch ihre sprachliche Einbettung gesteuert? Solche Zusammenhänge werden durch sogenannte bedingte oder A-posteriori-Wahrscheinlichkeiten beschrieben, die die Wahrscheinlichkeit eines Ereignisses in Abhängigkeit des Vorliegens von Bedingungen angeben (vgl. JurafSky et al. 2001, 231; bod 2003, 16–17). Variation tritt nicht nur innerhalb einer Sprechergemeinschaft auf, sondern auch im Sprachverhalten von Individuen (z. B. diaphasisch gesteuert oder, wenn keine äußeren Faktoren zu bestimmen sind, frei).24 Somit kann man sagen, dass die Kompetenz eines einzelnen Sprechers nicht durch das homogene System eines bestimmten Idiolekts (oder im Fall von Multilingualismus auch mehrerer, nebeneinander bestehender, aber in sich homogener Idiolekte) erschöpfend beschrieben ist, sondern dass die Verknüpfungen zwischen Funktionen und Formen bestimmte Wahrscheinlichkeitsverteilungen aufweisen, die zudem mit außer- und innersprachlichen Bedingungen korreliert sein können. Die in den tatsächlich beobachtbaren Äußerungen eines Sprechers – oder einer Sprechergemeinschaft – realisierten Varianten stellen Stichproben aus den zugrunde liegenden Wahrscheinlichkeitsverteilungen dar (vgl. Cedergren/Sankoff 1974, 333) und unterliegen statistischen Schwankungen. Sprachwandel kann aus empirischer Sicht nur dann angenommen werden, wenn sich die Verteilungen der Varianten einer Variablen in signifikanter Weise verschieben, d. h. wenn sich die Werte der Stichproben (= der beobachteten Realisationen) so ändern, dass man nicht mehr davon ausgehen kann, dass sie Stichproben aus derselben Wahrscheinlichkeitsverteilung sind; dies kann mit statistischen Tests bekräftigt, jedoch nicht endgültig entschieden werden. 2.1.3 Mechanismen des Sprachwandels wiLLiaM Croft (2000, 42–63) unterscheidet zwei Arten von Sprachwandeltheorien: äußerungsbasierte Theorien (utterance-based theories) und spracherwerbsbasierte Theorien (child-based theories). Erwerbsbasierte Theorien sind die normalerweise 23 In der vorliegenden Arbeit werden ausschließlich räumliche Rahmenbedingungen untersucht. 24 Eines der Hauptpostulate der programmatischen Schrift weinreiCh /Labov/herzog (1968, 101) ist, „that nativelike command of heterogeneous structures is not a matter of multidialectism or ‘mere’ performance, but is part of unilinguial linguistic competence“. Die Annahme von Variation innerhalb der Kompetenz eines Sprechers (auch als „interne“ Variation bezeichnet; vgl. baiLey 1973, 80; SeiLer 2003, 153) erfordert ein Grammatikverständnis, das Variabilität berücksichtigt (vgl. Labov 1969; Croft 2000, 51–53).
Sprachdynamik im Raum
43
in einem generativ-grammatischen Kontext bevorzugten Sprachwandeltheorien, v. a. da Sprachwandel nur, wenn er beim Erstspracherwerb erfolgt, es erlaubt, die generativistische Annahme der Homogenität der individuellen Kompetenz bis zu einem gewissen Grad aufrechtzuerhalten: Sprachwandel kann unter dieser Voraussetzung nur stattfinden, indem bei der Aneignung des Sprachsystems ‚Fehler‘ gemacht werden, d. h. das replizierte Sprachsystem des Kindes nicht zu 100 % dem Inputsystem seiner Eltern entspricht. Während es sicher richtig ist, dass beim Erstspracherwerb Mechanismen zum Tragen kommen, die für Sprachwandelerscheinungen relevant sind, weist Croft die grundlegenden mit solchen Theorien verbundenen Annahmen zurück, da sie nicht mit empirischen Befunden vereinbar sind (vgl. Croft 2000, 45–46). Bei äußerungsbasierten Theorien, zu denen auch die „soziohistorische“ Sprachwandeltheorie gehört, stehen die Auswahl von Varianten (selection) und die modifizierte Replikation von Äußerungen (altered replication) im Mittelpunkt. Die sprachliche Äußerung und ihre (imperfekte) Imitation wird als primäre Instanz des Sprachwandels angesehen, und zwar über die Phase des Erstspracherwerbs hinaus. Croft nennt zwei zentrale Annahmen, von denen die äußerungsbasierte Sprachwandeltheorie der Soziolinguistik geprägt ist, die er durch empirische Befunde gestützt sieht: Two important theoretical claims are implicit in the concept of a linguistic variable as used by sociolinguists. First, language change does not involve an abrupt shift from A to B, but instead involves a period of variation between A and B; in this phase, A and B are variants of a single linguistic variable. Second, individual speakers typically use more than one variant of the linguistic variable. Both of these claims have strong empirical support. (Croft 2000, 54)
Croft fügt hinzu, dass die Verteilung der Varianten vom Faktor Zeit und sozialen Faktoren wie Klasse, Geschlecht, Alter und Ethnizität abhängt (vgl. Croft 2000, 54); eine Aufzählung, in der der Raum als wichtiger Faktor zu ergänzen ist (vgl. 2.2). Da Wandel von Sprache nach dieser Auffassung nicht nur bei ihrer Weitergabe von Generation zu Generation, sondern auch von Sprecher zu Sprecher erfolgen kann, implizieren die beiden genannten Postulate der Soziolinguistik, dass die individuelle Sprecherkompetenz variabel ist, d. h. sich auch im Erwachsenenalter noch ändern kann. Zudem sind gerade räumliche Diffusionsprozesse praktisch nur durch äußerungsbasierte Sprachwandeltheorien erklärbar, wenn man nicht Migration als ihre einzige Triebkraft heranziehen will. ohne die sprachwandelrelevanten Prozesse beim Erstspracherwerb zu verkennen, werde ich mich deshalb in dieser Arbeit auf die Berücksichtigung äußerungsbasierter Prozesse beschränken, da es nur mit ihnen möglich ist, Sprachwandel als räumliches Phänomen zu beschreiben. Im vorausgehenden Abschnitt wurde Sprachwandel als die Veränderung der Auftretenswahrscheinlichkeiten von Varianten definiert. Dies kann durch eine Verschiebung der Wahrscheinlichkeiten von schon bekannten Varianten geschehen, oder durch das Auftreten von neuen Varianten, deren Wahrscheinlichkeit von null auf einen bestimmten Wert steigt. Um beide Mechanismen zu beschreiben – das Hinzukommen neuer Varianten und die Veränderung der Wahrscheinlichkeiten vorhandener Varianten –, sind die Konzepte der Innovation (neuerung) und Diffusion (Ausbreitung) gebräuchlich, wobei der Terminus Diffusion nicht ein-
44
Theorie
heitlich verwendet wird: Er kann die Ausbreitung einer Variante in einer Sprechergemeinschaft, d. h. die Zunahme ihres Gebrauchs, bezeichnen, oder die Ausbreitung einer Variante im Raum, was wohl die üblichere Verwendungsweise ist. Beide Vorgänge sind nicht unabhängig voneinander zu sehen, gehorchen aber dennoch nicht identischen Gesetzmäßigkeiten. Allenfalls handelt es sich bei der räumlichen Diffusion um einen Spezialfall der ‚nicht-räumlichen‘ Diffusion. Deshalb halte ich es für notwendig, hier eine begriffliche Differenzierung vorzunehmen: Ich unterscheide zwischen der Etablierung (oder Propagierung) einer Variante, die sich auf ihre zeitliche Ausbreitung in einer gegebenen Sprechergemeinschaft bezieht, und der Diffusion einer Variante, die ihre zeitliche Ausbreitung im Raum beschreibt. 2.1.3.1 Innovation Without violating the uncertainty principle one or more particles can appear in a system and exist for immeasurably brief periods. In a sense their existence is “hidden” by an irreducible uncertainty in our knowledge of the system. Particles that appear in this way are called virtual particles; they cannot be observed directly as real particles can. – henry w. k endaLL, „A Distant Light“ you might say that a real particle is a virtual particle that lasts long enough that we don’t care to inquire how it was produced, or how it is eventually absorbed. – david griffithS, „Introduction to Elementary Particles“
In sprachdynamischen Prozessen verschieben sich nicht nur die Häufigkeiten der Varianten, die schon existieren, sondern neue Varianten entstehen und verdrängen ältere. Für gewöhnlich wird unterschieden zwischen der Schaffung einer neuen Variante und ihrer anschließenden Ausbreitung in der Sprechergemeinschaft (vgl. z. B. haag 1905, 187; CoSeriu 1974, 67–75; Croft 2000, 4–5). Das Entstehen einer neuen Variante bezeichnet man als Innovation. Wie genau der Vorgang der Innovation abläuft, ist eine Frage, deren Beantwortung bislang mitunter Probleme bereitet hat.25 25 Vgl. z. B. h aaS (1978, 43–44): „Das ‚actuation riddle‘ muss Rätsel bleiben, solange der allererste Schritt nicht aufgeklärt ist, dieser aber entzieht sich wie der Ursprung der Sprache selber dem Zugriff. Daher wird im folgenden, wie in allen vergleichbaren Arbeiten, nur der Prozess der Ausbreitung einer neuerung durch die individuellen Wissen und durch die Sprachgemeinschaft betrachtet, nicht aber die Schöpfung der neuerung selbst.“ Vgl. auch schon h aag (1905, 186): „Die Frage nach der Entstehungsursache [der sprachlichen neuerungen] im strengen Sinn ist unlösbar.“
Sprachdynamik im Raum
45
[…] sociohistorical theory has had difficulties with the mechanism for innovation. […] the central problem of the sociolinguistic theory of language change, for all its empirical success in explaining propagation, is that it always presupposes the existence of multiple variants. Instead, attention has been focused on the patterns of linguistic variation, or structured heterogeneity, in the speech community. […] Nevertheless, the question remains how specific variants arise and become part of the variable linguistic system. That is, a mechanism for innovation is also required. (Croft 2000, 54–55)
Die Problematik des ersten Schritts des Aufkommens einer neuen Variante – der Innovation – ist eine Folge der etwas paradoxen Situation, dass er unmöglich beobachtet werden kann (vgl. u. a. CoSeriu 1974, 69). Dies ist keine in der Empirie begründete Einschränkung, sondern ist eine Folge des Umstands, dass im Moment der Entstehung einer neuen Ausdrucksform (= ihres ersten Geäußert werdens) noch nicht entschieden ist, ob diese Form über ihren Entstehungskontext hinaus verwendet wird oder nicht. Die neue Variante ist so lange ein unauffälliger, flüchtiger Teil normaler Sprechtätigkeit, bis sie gehäuft in Erscheinung tritt; erst dann setzt Sprachwandel im eigentlichen Sinn ein. Innovative Formen entstehen dauernd, sind jedoch nicht sofort Teil der Kompetenz der beteiligten Sprecher, sondern zunächst nur spontane Problemlösungen, die im nächsten Moment oder nach einem Gespräch meist wieder vergessen sind. Sie bilden einen Pool an zunächst nur ad hoc gebildeten sprachlichen Formen, die die Möglichkeit zur Reproduktion mitbringen und damit zur Entstehung neuer, vollwertiger Varianten (im Sinne von mental dauerhaft gespeicherten Form-Funktion-Beziehungen, d. h. Konstruktionen; vgl. 2.1.2). okkasionell gebildete Augenblickskomposita sind ein Beispiel: Sie erlauben es, außersprachliche Gegebenheiten mit Mitteln adressierbar zu machen, die unter der Bedingung, zunächst nur im jeweiligen Gespräch oder Text verständlich zu sein, den Vorzug einer sprachökonomisch effizienten Ausdrucksseite bieten (vgl. k nobLoCh 2010). Die eingeschränkte Reichweite ihrer Verständlichkeit ist der Grund dafür, wieso die Lebensdauer solcher Komposita meist nicht über die Dauer des Diskurses hinausgeht, in dem sie geprägt werden. Dies verhindert jedoch nicht, dass sie unter bestimmten Umständen – etwa wenn eine nicht-kompositionale Adressierung eines bestimmten Konzepts besonders umständlich wäre oder das Kompositum besonders einprägsam ist (kurz, wenn es irgendeinen Vorteil gegenüber seinen ‚Konkurrenten‘ hat) – eine Lexikalisierung erfahren. In diesem Fall wird das Wort auch über seinen Entstehungskontext hinaus verwendet, an andere Sprecher weitergegeben und dadurch usuell. Die Komposition ist dabei (v. a. im Deutschen) eine typisch lexikalische Form der Innovation, die im normalen Betrieb der Sprache als eine Art Grundrauschen dauernd vorkommt. Ähnliche Arten von Augenblicksvarianten gibt es auf allen sprachlichen Ebenen; sie können durch sehr verschiedenartige Prozesse zustande kommen: These variations may be induced by the processes of assimilation or differentiation, by analogy, borrowing, fusion, contamination, random variation, or any number of processes in which the language system interacts with the physiological or psychological characteristics of the individual. Most such variations occur only once, and are extinguished as quickly as they arise. However, a few recur, and, in a second stage, they may be imitated more or less widely,
46
Theorie and may spread to the point where the new forms are in contrast with the older forms along a wide front. (Labov 1991, 1–2)
In gleicher Weise wie Komposita können alle Arten von Innovationen okkasionell auftreten; es handelt sich zunächst lediglich um ‚potentielle‘ Varianten. Einige der okkasionellen Innovationen können jedoch ausreichenden Impetus mitbringen, um weitere Verwendungen zu stimulieren und so usuell zu werden. Dieser Prozess der Usualisierung kann als Spezialfall der „Habitualisierung“ der Soziologie angesehen werden, bei der Handlungen durch Wiederholung musterhafte Verfestigung erfahren: All human activity is subject to habitualization. Any action that is repeated frequently becomes cast into a pattern, which can then be reproduced with an economy of effort and which, ipso facto, is apprehended by its performer as that pattern. Habitualization further implies that the action in question may be performed again in the future in the same manner and with the same economical effort. This is true of non-social as well as of social activity. (berger / LuCkMann 1991, 70–71) Generally, all actions repeated once or more tend to be habitualized to some degree. (berger / LuCkMann 1991, 75)
Das Ergebnis einer Usualisierung – einer sprachlichen Habitualisierung – ist eine persistente, vollwertige Variante, die nun zum sprachlichen Repertoire gehört. Erst ab diesem Punkt ist der Vorgang der Innovation abgeschlossen, der mit der Festlegung einer neuen Form-Funktion-Beziehung einhergeht (d. h. es wird eine neue mentale Konstruktion im Sinne der Konstruktionsgrammatik gebildet, vgl. 2.1.2). Im Fall der Komposition – wie auch bei allen anderen lexikalischen Innovationen – geschieht dies durch die Lexikalisierung einer neuen Variante, indem eine neue Verknüpfung von Wort und Bedeutung festgelegt wird, die eigens gelernt werden muss. Unter welchen Umständen es zu einer Usualisierung kommt, wird durch verschiedene Eigenschaften und Faktoren bestimmt, die in der Linguistik durchaus untersucht werden (s. z. B. weinreiCh/Labov/herzog 1968; Croft 2000; bergS/Stein 2001; M æhLuM 2006). Sie sind für die nachfolgenden Untersuchungen nicht von Belang (s. aber 6.1.1–6.1.2). Der Vorgang der Innovation hat demnach zwei Stadien: Ein okkasionelles Stadium, in dem eine neu geschaffene Form zunächst einmalig auftritt und daher nur eine potentielle Variante darstellt; dieses Stadium ist aufgrund seiner Flüchtigkeit für die Sprachwandelforschung nicht (oder nicht direkt) zugänglich, und es stellt auch noch keinen Sprachwandel im engeren Sinne dar, da okkasionelle Innovationen zwar etwas neues darstellen, doch keine Veränderungen im sprachlichen System, d. h. in der Kompetenz der Sprecher, bewirken. Das zweite Stadium der Innovation kann, muss aber nicht eintreten: die Usualisierung der neuen Form, die mit der mentalen neuverknüpfung von Form und Funktion einhergeht, d. h. mit ihrer Idiomatisierung (im Bereich der Lexik mit ihrer Lexikalisierung), wodurch aus einer potentiellen Variante eine persistente wird und sprachlicher Wandel im eigentlichen Sinne stattfindet.
Sprachdynamik im Raum
47
2.1.3.2 Etablierung Als Etablierung (oder Propagierung) einer Variante bezeichne ich den Ausbau ihres Gebrauchs in einer Sprechergemeinschaft (vgl. 2.1.3).26 Sie kann als sprachlicher Sonderfall der sogenannten „Institutionalisierung“ der Soziologie angesehen werden, bei der vereinzelte, zunächst spontan durchgeführte soziale Handlungen über den Zwischenschritt der Habitualisierung zu gesellschaftlichem Allgemeingut werden. Im idealisierten Extremfall ersetzt bei der Etablierung eine Variante eine andere vollständig. Sie ist als das Ergebnis zahlreicher individueller sprachlicher Ausgleichserscheinungen zu sehen, in denen eine Variante von einem Sprecher oder einer Sprechergruppe an andere weitergegeben wird. Dies äußert sich in der Anpassung der relativen Variantenfrequenzen in der Sprechergemeinschaft, im Extremfall von 0 % (die Variante ist unbekannt) auf 100 % (die Variante ist die einzig verfügbare). Die Ausgleichserscheinungen erfolgen dabei – aufeinander aufbauend – auf verschiedenen Ebenen: Auf der Diskurs- oder Performanzebene (Akkommodation), auf der (individuellen) Kompetenzebene (Adaptation) und schließlich auf der Ebene der kollektiven Konvention einer Sprechergemeinschaft (Etablierung). Adaptationsprozesse sind dabei als kumulierte Akkommodationsprozesse zu verstehen, Etablierungsprozesse als kumulierte Adaptationsprozesse. 1. Akkommodation Die elementarste und unmittelbarste Form des Ausgleichs auf Variantenebene tritt dann auf, wenn zwei Personen im Verlauf eines Gesprächs und für die Dauer des Gesprächs ihre Sprachformen bzw. deren Frequenzen aufeinander abstimmen.27 Diese sprachliche Konvergenz zweier Gesprächspartner wurde von howard giLeS im Rahmen der accommodation theory beschrieben (vgl. giLeS 1973 und giLeS/tayLor /bourhiS 1973; vgl. auch trudgiLL 1986, 1–38).28 Eine solche Form von Frequenzänderung ist zunächst temporär und kann innerhalb der stochastischen Spielräume der diatopisch, diastratisch und diaphasisch gesteuerten Variation erklärt werden, d. h. ohne eine dauerhafte Veränderung der zugrunde liegenden probabilistischen Sprecherkompetenzen annehmen zu müssen. Dies unterscheidet das Konzept der Akkommodation vom 26 Der Begriff Sprechergemeinschaft bleibt hierbei undefiniert. Die genaue Ausdehnung einer Sprechergemeinschaft kann nicht festgelegt werden und ist für die nachfolgenden Ausführungen nicht relevant. Insofern ist die Annahme einer weitgehend nach außen isolierten Sprechergemeinschaft eine idealisierende Vereinfachung. 27 „Ob solche Modifikationen und Stabilisierungen temporär bleiben oder ob sie tiefer greifende kognitive Reflexe bewirken (tendenzielle Umstrukturierung meines sprachlichen Wissens), hängt von der Bewertung der Interaktion, des Interaktionspartners und der Interak tionssituation ab: Eine Korrektur durch einen als vorbildlich eingeschätzten sprachlichen ‚Sozialisator‘ in einer der langen Erwerbsphasen der komplexen Gesamtsprache oder gar eine als ‚Blamage‘ empfundene Sprachverwendung kann sofortige nachhaltige Umstrukturierungen bewirken, eine gescheiterte Interaktion mit einem wenig geschätzten Gegenüber kann tendenziell wirkungslos bleiben.“ (SChMidt/herrgen 2011, 26) 28 Die Gründe für Konvergenz sind vielschichtig, und ich werde sie hier nicht weiter ausführen; ich werde auch nicht näher darauf eingehen, dass unter bestimmten Umständen auch das Gegenteil (Divergenz) der Fall sein kann.
48
Theorie
von SChMidt/herrgen bevorzugten Ansatz der (Mikro-)Synchronisierung, der sich explizit auf die Anpassung von Kompeten zen bezieht (vgl. SChMidt 2010, 212; SChMidt/herrgen 2011, 27, 29–30). Beobachtbar ist zunächst nur eine Anpassung des outputs in der aktuellen Situation – es handelt sich um „short-term convergence“ (vgl. hinSkenS/auer /k erSwiLL 2005, 5–7). Aus empirischer Sicht ist eine Veränderung der Kompetenzen (d. h. der individuellen Variantenwahrscheinlichkeitsverteilungen eines Sprechers) erst dann anzunehmen, wenn sich die beobachtbaren Frequenzen – unter Berücksichtigung aller variationssteuernden Einflussfaktoren – so ändern, dass eine zugrunde liegende Gleichverteilung (vorher/nachher) sehr unwahrscheinlich ist. Die sofortige „punktuelle, in der Einzelinteraktion begründete Modifizierung und zugleich Stabilisierung des individuellen sprachlichen Wissens“ (SChMidt/ herrgen 2011, 29) ist wohl nur in Ausnahmefällen zu beobachten. Kommt es tatsächlich zu einer Kompetenzanpassung, d. h. zur nachhaltigen Aneignung von Verwendungsmustern von Gesprächspartnern, so ist die nächste Stufe, die Adaptation, erreicht. 2. Adaptation In der Soziolinguistik herrscht die Annahme, dass die Kompetenz eines einzelnen Sprechers nicht nur heterogen ist, sondern sich im Laufe seines Lebens auch ändern kann, und zwar über die Phase des Spracherwerbs hinaus (vgl. 2.1.3). Erhöhter Input einer bestimmten Variante oder eines Variantenbündels in Form von Äußerungen anderer Sprecher über einen längeren Zeitraum führt, so die Vermutung, zu einer nachhaltigen Erhöhung des eigenen outputs dieser sprachlichen Form(en) – und damit zu „long-term convergence“ (vgl. hinSkenS/auer /k erSwiLL 2005, 5–7). Ein Sprecher, der in starkem Ausmaß einer Variante ausgesetzt ist, wird sie in der Zukunft selbst verstärkt verwenden: Every speaker is constantly adapting his speech-habits to those of his interlocutors; he gives up forms he has been using, adopts new ones, and, perhaps oftenest of all, changes the frequency of speech-forms without entirely abandoning any old ones or accepting any that are really new to him. (bLooMfieLd 1933, 326–328)
Ist eine solche Frequenzänderung nicht mehr durch stochastisch erwartbare Variation zu erklären, muss eine Veränderung der Kompetenz (und damit der zugrunde liegenden abstrakten Variantenwahrscheinlichkeiten) angenommen werden. Beim Ausmaß dieser Veränderung spielt die Häufigkeit und Intensität der Kommunikation eine wichtige Rolle. Je öfter und je länger zwei Personen miteinander kommunizieren, desto stärker neigen sie dazu, die verwendeten Varianten aufeinander abzustimmen. Sobald die Akkommodation mit bestimmten Gesprächspartnern zur Routine wird und so Gewöhnungseffekte eintreten, beginnen sich die Gebrauchsmuster zu verfestigen (vgl. auch britain 2004, 37); insofern ist die Adaptation eine sozial stimulierte Form der Usualisierung. Betroffen von einem Wandel sind so zunächst lediglich die Idiolekte der beteiligten Sprecher, und auch das streng genommen nur für die jeweilige Situationsart. Im Normalfall stimuliert jede Verwendung einer Variante ihre weitere Verwendung, und zwar je nach der Vorteilhaftigkeit der sprachlichen
Sprachdynamik im Raum
49
Form und dem Prestige des Verwenders unterschiedlich stark. Auf diese Weise werden manche (neuen) Varianten usualisiert, ihre Verwendung habitualisiert. Dies kann durchaus selbstverstärkend wirken, d. h. ein Sprecher kann sich eine bestimmte Form angewöhnen, indem er durch seine eigene Sprachverwendung Input erfährt.29 Es ist deshalb möglich, dass der neue output eines Sprechers für bestimmte Varianten eine höhere Frequenz aufweist als der Input, den er erfahren hat (z. B. wenn die fraglichen Varianten von einer prestigeträchtigen Person übernommen wird, der man nacheifert, oder wenn eine Variante sprachliche Eigenschaften aufweist, die sie besonders vorteilhaft machen).30 Adaptation umfasst deshalb nicht nur auf die Anpassung an Inputfrequenzen, sondern kann die Frequenzerhöhung einzelner Varianten bedeuten. 3. Etablierung Die beteiligten Sprecher sind Teil eines sozialen netzwerks, in dem sie weitere Kommunikationskontakte pflegen, die ebenso Akkommodations- und Adaptationserscheinungen unterliegen. Veränderungen der Variantenfrequenzen dieser Personen können durch den übermächtigen Input der anderen Kommunikationspartner gehemmt oder wieder rückgängig gemacht werden (wodurch z. B. potentielle Innovationen schnell wieder verschwinden können); unter günstigen Umständen werden einige Varianten aber auch an sie weitergegeben und beeinflussen so die kollektive Konvention innerhalb einer Gemeinschaft,31 beispielsweise einen ortsdialekt. Dadurch, dass eine prinzipielle Zweierkonstellation in ein netzwerk aus solchen Beziehungen eingebunden ist, wird aus einer Dyade eine Triade; analog zur Institutionalisierung der Soziologie werden bei der Etablierung durch Akkommodation und Adaptation entstandene Sprachgebrauchsmuster zu gesellschaftlichem Allgemeingut: At this point the situation changes qualitatively. The appearance of a third party changes the character of the ongoing social interaction between A and B, and it will change even further as additional individuals continue to be added. The institutional world, which existed in statu nascendi in the original situation of A and B, is now passed on to others. In this process institutionalization perfects itself. (berger /LuCkMann 2010, 75–76)
Die propagierten Varianten etablieren sich so in einem bestimmten Gesellschaftsteil und werden zunehmend häufiger gebraucht, so dass ihre Frequenzen insgesamt steigen, indem sie von immer mehr Mitgliedern der Sprechergemeinschaft adaptiert werden. Innerhalb eines stabilen, homogenen und abgeschlossenen netzwerks würden sich die Sprechverhalten der einzelnen Mitglieder so theoretisch auf Dauer angleichen 29 „Even the solitary individual on the proverbial desert island habitualizes his activity.“ (berger /LuCkMann 1991, 71) 30 bLythe/Croft (2012, 274) beschreiben diesen Vorgang als „boost“. 31 In der Terminologie von SChMidt/herrgen (2011, 30–34) heißt dieser Vorgang Mesosynchronisierung (die sogenannte Makrosynchronisierung ist auf einer anderen Ebene angesiedelt und bezeichnet die orientierung an einer gemeinsamen norm). Vgl. auch SChMidt (2010, 213–214).
50
Theorie
und stabilisieren, wenn man von hinzukommenden Innovationen einmal absieht. Ein solches Netzwerk ohne äußere Einflüsse stellt aber eine Idealisierung dar, die praktisch kaum vorkommt; die Ausbreitung in einer räumlich verteilten Sprechergemeinschaft, die Diffusion (s. nächster Abschnitt), lässt sich nur durch raumabhängige Einflüsse von Orten aufeinander beschreiben, da das Netzwerk der Sprecher im Raum nicht homogen ist, sondern von räumlichen Beziehungen geprägt ist. Hinzu kommt, dass die tatsächlich beobachtbaren Gebrauchsfrequenzen, die als Input für Akkommodationsprozesse (und damit für Adaptations- und Etablierungsprozesse) fungieren, auf Realisierungen von probabilistischen Zufallsvariablen beruhen und so statistischen Schwankungen unterliegen, die oft folgenlos bleiben, unter Umständen aber auch größere Veränderungen nach sich ziehen können (vgl. auch bLythe/Croft 2012, 275–276, 282): Allein die statistische Fluktuation trägt den Keim des dauerhaften Wandels in sich. In einer idealen, nach außen isolierten Sprechergemeinschaft folgt die Entwicklung der Häufigkeit einer Neuerung, so wird angenommen, bestimmten Gesetzmäßigkeiten. Typisch ist die Beschreibung eines S-förmigen Verlaufs (Abb. 4): Zunächst steigt die Frequenz (oder, abstrakt gesprochen, die Wahrscheinlichkeit) einer Variante langsam an; die Geschwindigkeit ihrer Zunahme steigt, und schließlich, wenn eine gewisse Sättigung erreicht ist, flacht die Kurve wieder ab (vgl. etwa weinreiCh/Labov/herzog 1968, 113–114; baiLey 1973, 77; k roCh 1989; ChriSten 1993, 12–13; MCMahon 1994, 52–53; ChaMberS/trudgiLL 1998, 162–165; Croft 2000, 183–190; zusammenfassend bLythe/Croft 2012, 278).32 Eine in der Sprachwissenschaft gängige mathematische Modellierung des Sförmigen Verlaufs von Sprachwandel ist das sogenannte piotrowSki-Gesetz, das die graduelle Ersetzung älterer Formen durch neuere als Differentialgleichung beschreibt, die sich mit verschiedenen Parametern an beobachtete Daten anpassen lässt und auch die Modellierung von unvollständigen oder rückläufigen Entwicklungen erlaubt (vgl. u. a. aLtMann 1983; piotrowSki/bektaev/piotrowSkaJa 1985, 81–100; LeopoLd 2005; beSt 2006, 106–123). Die Vorstellung der Durchsetzung einer neuerung nach dem Schema der S-Kurve ist unabhängig von ihrer Implementierung (s. z. B. k roCh 1989, 203–204 für alternative Implementierungen und 6.1.2 für ein eigenes Modell) als prototypisch und idealisiert zu anzusehen. Sie geht davon aus, dass eine sprachliche Form nach ihrem erstmaligen Auftreten ältere Konkurrenzformen zwangsläufig nach und nach ersetzt. In der Tat gibt es viele Beispiele, bei denen sich tatsächlich beobachtete Daten sehr gut als S-Kurve beschreiben lassen (vgl. z. B. beSt/kohLhaSe 1983b; ChriSten 1993, 20–21, 41; ChaMberS/trudgiLL 1998, 164; beSt 2003; für weitere Beispiele vgl. bLythe/Croft 2012, 279–280).
32
Die S-Kurve ist ein elementares Muster der Ausbreitung, das u. a. in der Geographie (vgl. h ägerStrand 1967, 257–258) und Soziologie (vgl. M ainzer 2008, 92–93) beschrieben wurde.
51
Sprachdynamik im Raum
p(t) 100 %
0%
t
Abb. 4: Idealisierter Verlauf der Etablierung einer sprachlichen Variante in Abhängigkeit von der Zeit (t).
2.1.3.3 Diffusion Die Ausbreitung von sprachlichen Varianten kann in allen variationslinguistischen Dimensionen erfolgen: diastratisch, diaphasisch und diatopisch. In diesem Abschnitt befasse ich mich mit der Ausbreitung im Raum, der Diffusion einer Variante. Etablierung und Diffusion sind dabei nicht als zeitlich sukzessive Schritte zu verstehen: Diffusion ist vielmehr eine räumlich differenzierte Betrachtungsweise der Etablierung, denn mit der räumlichen Diffusion einer Variante geht die Zunahme ihrer Wahrscheinlichkeit in einem betrachteten Areal und der dort vertretenen Sprechergemeinschaft einher. Das Konzept der räumlichen Diffusion geht zurück auf die Wellentheorie hugo SChuChardtS (1868) und JohanneS SChMidtS (1872). In Kontrast zur damals gängigen Stammbaumtheorie waren SChuChardt und SChMidt der Ansicht, dass sich eine sprachliche neuerung vom ort ihres Entstehens zunächst in die umliegenden Gebiete ausbreitet, von da aus weiter zu den daran anschließenden Gebieten und so weiter, so dass die Ausbreitung des Wandels im Raum der kreisförmigen Ausbreitung einer durch einen Steinwurf ausgelösten Welle auf einer Wasseroberfläche ähnelt. Synchron lässt sich die Begrenzung des aktuellen Ausbreitungsstadiums einer Variante in Form von Isoglossen beobachten. Die Annahmen der Soziolinguistik bezüglich der Heterogenität von Lekten – also auch von ortsdialekten – machten eine Anpassung dieses Modells notwendig (vgl. woLfraM/SChiLLing-eSteS 2003, 713–721). Galt vorher die Überzeugung, ortsmundarten seien in sich einheitlich (vgl. z. B. haag 1905, 187),33 was folglich bedeutete, Änderungen breiteten sich in Form von vorrückenden Isoglossen aus, so 33
Auch h anS goebL geht noch von einer lokal eindeutigen Beziehung zwischen Funktion und Form aus (vgl. z. B. goebL 1984, Bd. I, 16; 2005, 499–500; 2006, 412–414).
52
Theorie
kam man nun zu der Einsicht, dass die Variabilität von Dialekten zusammen mit der damit verbundenen Vorstellung des graduellen Sprachwandels auch ein graduelles Vorrücken von Innovationen im Raum bedeutet (vgl. z. B. baiLey 1973, 65– 109). So fordert trudgiLL mit Verweis auf den Geographen torSten hägerStrand, der mit seinem Modell der räumlichen Ausbreitung technischer Innovationen die soziolinguistische Dialektologie maßgeblich beeinflusst hat:34 Hägerstrand (1952) has written: “When studying changes we cannot draw boundary lines and observe their displacements. Instead we must ascertain the spatial diffusion of ratios.[”] That is, if the dialectologist were to adopt this approach, he would have to calculate the percentage of, say, postvocalic /r/ employed in each geographical cell (at given points in time) in exactly the same way that Labov and others have calculated percentages for different social class cells. This methodology will, of course, be considerably more complex than the methods traditionally employed in linguistic geography: sampling of some kind, for example, will need to be used. However, as a result of the development of sociolinguistic urban dialectology we now have the techniques for carrying out work of this sort. It is only in this way, moreover, that we will be able to obtain information about the geographical distribution of linguistic features that is detailed enough to be of any value. We do not just require to know the geographical location of a linguistic phenomenon; we need to know its ‘density’ and social distribution as well. (trudgiLL 1974, 222–223)
Die Auftretenshäufigkeit einer Variante, die trudgiLL als „percentage“ oder „density“ bezeichnet, weist aus (variationslinguistisch modifizierter) wellentheoretischer Sicht an ihrem Entstehungsort den höchsten Wert auf, während sie mit zunehmender Entfernung von ihrem Ursprung abnimmt; in diachronischer Hinsicht nehmen die Häufigkeiten an den einzelnen Orten, auch an entfernter gelegenen, mit der Zeit zu: In contrast with the increasing attenuation of physical waves in time and space, the waves under discussion show increasing strength in time […], although at any given moment those parts more distant from the origin than others will be statistically weaker. (baiLey 1973, 79)
Geht man von dem idealisierten Fall aus, dass sich eine Innovation nach ihrem Entstehen nach dem Muster der S-Kurve (s. letzter Abschnitt) in einer Sprechergemeinschaft ausbreitet, bis sie vorher dagewesene Konkurrenzformen vollständig ersetzt hat, so bedeutet das für die Ausbreitung im Raum, 1. dass der Verlauf an einem einzelnen betrachteten ort ebenfalls einer S-förmigen Entwicklung folgt, 2. dass der Verlauf an weiter vom Ursprungsort entfernten orten zeitversetzt stattfindet, und zwar in Abhängigkeit von der Entfernung, und 3. dass zu einem beliebigen Zeitpunkt die geographische Verteilung der Variante in Abhängigkeit von der Entfernung zum Ursprungsort ebenfalls (umgekehrt) 34 „Early sociolinguistic work on the geographical diffusion of innovations was triggered by the highly influential models of diffusion proposed by the Swedish human geographer Torsten Hägerstrand […]. It was his modeling of spatial diffusion […] which had the most impact on dialectology (and geography), […] since it provided a methodological framework that could be readily adopted to visually display geographical distributions of the frequencies of linguistic innovations“ (britain 2002, 608–609; vgl. h ägerStrand 1952; 1967).
53
Sprachdynamik im Raum
S-förmig ist (je nach Etablierungsstadium der Variante im Ursprungsort setzt die geographische [umgekehrte] S-Kurve dort entsprechend unterhalb von 100 % ein). Wenn man von idealisierten Bedingungen ausgeht (d. h. die Ausbreitung durch den Raum verläuft gleichmäßig, und die Etablierung der neuen Form verläuft an allen orten gleich), so sind Zeit- und Entfernungsachse gegeneinander austauschbar: Bewegt man sich vom Ursprungsort weg, so verhält sich p in Abhängigkeit von der Entfernung d umgekehrt wie in Abhängigkeit von t (vgl. baiLey 1973, 80): p(d) 100 %
0%
0
d
Abb. 5: Idealisierte Verteilung einer sprachlichen Variante zu einem bestimmten Zeitpunkt in Abhängigkeit von der geographischen Entfernung d von ihrem Entstehungsort.
Ähnliche Annahmen über die Verteilung der Relevanz eines ortes für seine Umgebung sind auch aus anderen Disziplinen bekannt. So zeigt etwa k arL erik bergSten (1951, 66–67, 71–80), dass die Anzahl der in einem ort geborenen Leute in und um diesen ort in Abhängigkeit von der Distanz zu diesem ort einer vergleichbaren Verteilung folgt. Bei hägerStrand (1967, 185–189, 201–204) zeigt sich, dass die Intensität der Migration zu einem ort und die Anzahl der Telefonate von und zu einem ort einen ähnlichen Zusammenhang mit der geographischen Distanz haben. hägerStrand erhob diese Daten empirisch, um sie als Indikatoren für die räumliche Verteilung der Kommunikationskontakte mit einem ort zu verwenden (vgl. hägerStrand 1967, 235–241), die auch von unmittelbarer Bedeutung für die Diffusion von sprachlichen Varianten sein dürfte. obwohl dieser Prozess, wie mehrfach angemerkt, auf einigen Idealisierungen und Vorannahmen beruht, entspricht er im Prinzip den Vorstellungen, die soziolinguistisch geprägten ‚Wellen‘- und Diffusionsmodellen zugrunde liegen, und ist für viele Fälle eine adäquate, wenn auch vereinfachende Beschreibung der Vorgänge. Relatively few examples of such diffusion have been found in the literature, however, perhaps reflecting its status as an iconic representation of diffusion – with diagrams ressembling [!] the ripples created by raindrops falling in a puddle of water – rather than one representing some empirically discovered pattern. (britain 2002, 623; vgl. auch h aaS 1978, 102)
54
Theorie
Im Wesentlichen sind es zwei vereinfachende Prämissen, die die praktische Anwendbarkeit des Modells einschränken: 1. Es wird angenommen, die Ausbreitung erfolgt in Abhängigkeit von der Entfernung gleichmäßig. 2. Es wird angenommen, dass sich alle Orte in Bezug auf ihren Einfluss und ihre Aufnahmebereitschaft gleich verhalten. Kein Problem stellt dagegen der Umstand dar, dass sich verschiedene neuerungen u. U. unterschiedlich schnell im Raum ausbreiten (vgl. auch weinreiCh/Labov/ herzog 1968, 153), da hierfür lediglich die Steigung der S-Kurve angepasst werden muss. Zu 1. Die in Punkt 1 vorgebrachte Annahme ergibt sich letztlich aus der in Abschnitt 2.2.4 ausgeführten Überlegung, dass die Häufigkeit und Intensität der Kommunikation zwischen Individuen (die „Kommunikationsdichte“;35 vgl. SChMidt 2010, 213; nach bLooMfieLd 1933, 46) die Übertragung von Varianten bestimmt. Und da Sprecher aus nahegelegenen orten tendenziell mehr miteinander sprechen als Sprecher aus weiter voneinander entfernten orten, ist die Annahme, dass sich Varianten in Abhängigkeit von der geographischen Entfernung ausbreiten, zunächst sinnvoll. Es ist aber ebenso plausibel, dass die geographische Entfernung nicht der einzige Faktor für Kommunikationsdichte ist. Das bedeutet, dass die Ausbreitung im Raum auch von anderen Faktoren abhängt, was dazu führen kann, dass sie ungleichmäßig erscheint (vgl. baiLey et al. 1993, 366). Auf diese Problematik sei hier nur verwiesen; eine eingehende Diskussion ihrer Implikationen erfolgt in den Abschnitten 2.2 und 4.3. Zu 2. Die zweite Annahme ist eine dem Modell geschuldete Vereinfachung („reflecting its status as an iconic representation of diffusion“; britain 2002, 623), deren tatsächliches Zutreffen in der Dialektologie wohl nie ernsthaft erwogen wurde. Gerade die Sonderrolle der Städte wurde früh erkannt (vgl. etwa beCker 1942; baCh 1950, 135–142). Aufbauend auf Arbeiten aus der Geographie, die sich z. B. mit der räumlichen Diffusion von Kulturgütern beschäftigen (v. a. hägerStrand 1952; 1967; gouLd 1969), hielt in den 1970er Jahren ein Konzept in die Sprachgeographie Einzug, das als hierarchische Diffusion bezeichnet wird. Hierarchische Diffusion bezeichnet im Gegensatz zur ‚kontagiösen‘ Diffusion der Wellentheorie die Ausbreitung von neuerungen durch eine Urbanitätsskala von oben nach unten (vgl. hard 1972, 30, 53; britain 2010, 148). Bei hägerStrand spielen dabei die Populationszahlen zweier orte (neben ihrer geographischen Distanz) eine herausragende Rolle für ihre Kontaktwahrscheinlichkeit. Bevölkerungsreiche Orte haben demnach einen größeren Einfluss auf bevölkerungsärmere als umgekehrt. gerhard hard (1972) übernahm das Modell hägerStrandS mit kleineren Anpassungen für die Dialektologie, was in der Folge aber kaum rezi35
Die Berücksichtigung anderer Faktoren wie Intimität oder emotionaler Intensität, wie es etwa beim Konzept der „tie strength“ (vgl. z. B. MiLroy/MiLroy 1985, 364–370) der Fall ist, ist hier wohl nicht erforderlich, da solche Faktoren bei sprachlichen Beziehungen von ganzen orten, nicht nur einzelnen Individuen, keine direkte Rolle spielen.
Sprachdynamik im Raum
55
piert wurde. Einflussreicher war die von hard unabhängige Arbeit zur Diffusion von peter trudgiLL (1974), die eher von hägerStrandS Modell inspiriert war als darauf aufbauend. trudgiLL schlägt ein aus der Ökonomie entlehntes „Gravitationsmodell“ vor, das den sprachlichen Einfluss zweier Orte aufeinander u. a. in Abhängigkeit von ihrer geographischen Distanz und ihren Bevölkerungszahlen berechnet. trudgiLLS Modell hat in verschiedenen Szenarien gute Übereinstimmung mit empirischen Befunden gezeigt (z. B. trudgiLL 1974; hinSkenS 1993; ChaMberS/ trudgiLL 1998, 178–186; SzMreCSanyi 2012). Dennoch ist seine Richtigkeit weiterhin umstritten (kritisch z. B. nerbonne/heeringa 2007, 288–289). hard (1972) weist darauf hin, dass es durch die Veränderung der sozialen Strukturen in jüngerer Zeit anzunehmen sei, dass hierarchische Diffusionsvorgänge, bei denen „hierarchische Strukturen (z. B. zentralörtliche Hierarchien) eine Rolle spielen und die deshalb den typischen ‚space-hopping influence of the central place structure‘ [gouLd 1969, 52]“ (hard 1972, 53) zeigen, „vom frühen Mittelalter bis zur Gegenwart zunehmenden (wenngleich natürlich nicht kontinuierlich wachsenden) Einfluß auf die ‚Kulturströmungen‘ […] gewonnen“ (hard 1972, 53) haben: nach hard spielten also kontagiöse Diffusionsvorgänge in früherer Zeit eine größere Rolle als heute, während die hierarchische Diffusion v. a. durch die fortschreitende Urbanisierung zunehmend an Bedeutung gewonnen habe. ob dem so zuzustimmen ist, sei dahingestellt; es ist jedoch festzuhalten, dass wohl keines der Diffusionsmodelle, weder ein nur wellentheoretisch noch ein nur hierarchisch ausgerichtetes, uneingeschränkte Gültigkeit beanspruchen können, denn „[i]t is not suggested that all linguistic changes follow the same pattern of diffusion“ (Labov 2003, 10). In der Tat zeigen baiLey et al. (1993) anhand von Daten aus oklahoma, dass sich verschiedene sprachliche Phänomene auf unterschiedliche Weise im Raum ausbreiten können: kontagiös, hierarchisch oder sogar kontrahierarchisch; auch Kombinationen dieser drei Muster treten auf (vgl. baiLey et al. 1993, 386). Sie kommen zu dem Schluss, that different patterns of diffusion are tied to the different social meanings that linguistic features carry. […] Although the diversity of patterns may seem surprising, they simply reflect the variety of demographic processes at work in a complex society and the complex motives people have for using the variety of language that they use. (baiLey et al. 1993, 386)
Zusammenfassend ist geographische Distanz ebenso wenig ein allgemeingültiger Prädiktor für Diffusion wie urbane Hierarchien. Beide sind aber – zusammen mit anderen – wichtige Faktoren, die in unterschiedlichem Ausmaß bei einzelnen Diffusionsvorgängen zum Tragen kommen. Alle diese Faktoren sind von Bedeutung für den Grad an Kommunikationsdichte – und zwar für jede sprachliche Variable unterschiedlich. Somit ist für jede sprachliche Funktion ein eigenes Kommunikationsdichtegeflecht anzunehmen – oder eine bestimmte, individuelle Realisation eines zugrunde liegenden ‚Archinetzes‘, im dem sich Diffusionsvorgänge mit unterschiedlicher Schnelligkeit abspielen; das Archinetz wird durch Distanzen und Bevölkerungszahlen bestimmt, seine Rolle für eine bestimmte Variable jedoch von ihrer jeweiligen sozialen Bedeutung und Kommunikabilität; es stellt ein
56
Theorie
Beziehungsgefüge dar, das die Kommunikationskanäle vorgibt, nicht jedoch die Intensität des darüber stattfinden Kommunikationsflusses. 2.2 RAUMKonZEPTE Es handelt sich, so kurz wie möglich ausgedrückt … darum, daß die Welt in Raum und Zeit in gewissem Sinne eine vierdimensionale nicht-euklidische Mannigfaltigkeit ist. ‒ herMann MinkowSki, „Das Relativitätsprinzip“
gaetano berruto beschreibt den sogenannten (letztlich auf eugenio CoSeriu zurückgehenden) Sprach- oder ‚variationslinguistischen‘ Raum, als ein Koordinatensystem, das durch die drei Variationsdimensionen Diatopie, Diastratie und Diaphasie aufgespannt wird, wobei als vierte Dimension noch die Diachronie zu ergänzen wäre (vgl. berruto 2010, 226–227).
DIASTRATIA
DIATOPIA DIAPHASIA
Abb. 6: Der variationslinguistische Raum (nach berruto 2010, 237).
Dabei ist die Tatsache zu berücksichtigen, dass die diatopische Dimension ihrerseits bereits aus (mindestens) zwei Raumdimensionen aufgebaut ist, die allerdings in der variationslinguistischen Forschung als äquivalent behandelt werden können. Ich möchte auf den nächsten Seiten den Blick auf diese, die diatopische, Dimension als Variationsparameter richten, der eine gewisse terminologische Unschärfe anhaftet. Wie gerhard hard (2008) ausführt, scheinen gerade in der Diskussion um den sogenannten spatial turn (v. a. in den 1990er Jahren) in den Sozial- und
Raumkonzepte
57
Geisteswissenschaften „[d]er Signifikant Raum und seine Derivate […] von irreduzibler Polysemie, ja Homonymie befallen zu sein“ (hard 2008, 263), was bei ihm eine Art von semantischem oder intellektuellem „Schwindelgefühl“ (hard 2008, 263, 266) auslöst. Trotz der begrifflichen Verwirrung um das Thema Raum scheinen sich die verschiedenen Herangehensweisen und Terminologien in den Kulturwissenschaften – und, soweit ich es beurteilen kann, auch in der Geographie – auf drei Grundparadigmata des Raumes zurückführen zu lassen (vgl. auch anderS 2010, 82–83), die ich mit david britain wiedergeben möchte: 1. 2.
3.
Euclidean space36 – the objective, geometric, socially divorced space of mathematics and physics. Social space – the space shaped by social organization and human agency, by the human manipulation of the landscape, by the contextualization of face-to-face interaction, by the creation of a built environment, and by the relationship of these to the way the state spatially organizes and controls at a political level. Perceived space – how civil society perceives its immediate and not so immediate environments – important given the way people’s environmental perceptions and attitudes construct and are constructed by everyday practice. (britain 2002, 604)37
Dabei ist der euklidische Raum die Grundlage für die beiden anderen, da er absolut und von ihnen unabhängig besteht, jedoch für sich genommen kaum Relevanz für die Humangeographie – abgesehen von seiner Rolle für die Kartographie – besitzt: „The role of [Euclidean] space is reduced to that of data presentation on a map“ (britain 2002, 607; vgl. auch 2004, 35) – ein Kritikpunkt, der gerade in Bezug auf die Dialektologie und dialektometrische Verfahren häufig genannt wird (s. z. B. putSChke 1993, 428–429; huMMeL/putSChke 1989, 14–15; huMMeL 1993, 4, 347; nauMann 1976, 92). Umgekehrt sind sozialer und perzeptiver – oder „kognitiver“ (vgl. berruto 2010, 236) – Raum vom euklidischen Raum abhängig: Letzterer ist ein wichtiger – wahrscheinlich der wichtigste – Faktor bei der Konstitution der beiden anderen. Sozialer und kognitiver Raum sind wiederum nicht unabhängig voneinander, da einerseits die soziale Beschaffenheit der Umgebung ihre Wahrnehmung mitbestimmt und andererseits die Wahrnehmung der Umgebung Einfluss auf soziale Handlungen und somit auf die Formung des sozialen Raums hat: Together these three combine to create spatiality, a key human geographic dimension. none of these three can exist independently of one another. Geometric space is appropriated and thus made social through human settlement, but social space can never be entirely free of the physical friction of distance. And our perceptions and value systems associated with our surroundings, although deeply affected by both social and Euclidean space, can in themselves affect the way space is later appropriated and colonized. (britain 2002, 607)
36 Genau genommen ist der euklidische Raum vom geographischen Raum zu trennen: Beide unterscheiden sich durch die Krümmung und Unregelmäßigkeiten der Erdoberfläche. Dieser Unterschied spielt in dieser Arbeit jedoch keine Rolle, da er sich im Untersuchungsgebiet des SBS nicht bemerkbar macht (vgl. vogeLbaCher 2011, 7). 37 Bei h ard (2008, 278) entspricht „Raum als (geometrisch-topologische) Struktur“ dem euklidischen, „Raum als Landschaft“ dem sozialen und „Raum als mental map(s) oder map(s) in mind(s)“ dem wahrgenommenen Raum.
58
Theorie
Einzuwenden wäre hier lediglich, dass der euklidische Raum – positivistisch gesehen – durchaus unabhängig vom sozialen und vom wahrgenommenen Raum existieren kann. Auf dieser Grundlage lässt sich der Aufbau von Räumlichkeit (spatiality) wie folgt schematisch darstellen: Euklidischer Raum
Sozialer Raum
Kogniver Raum Räumlichkeit
Abb. 7: Schema Räumlichkeit.
2.2.1 Euklidischer Raum Der euklidische (physikalische, geographische) Raum ist das Bezugssystem, in dem üblicherweise geolinguistische Daten – in Form von Karten – dargestellt werden. Insofern ist er im Bereich der Sprachkartographie primär. Als Beschreibungskategorie physikalisch lokalisierbarer Phänomene stellt er die grundlegende Form diatopischer Referenzierung dar, indem sprachliche Daten eindeutig einem Punkt in einem (nach der Projektion der gekrümmten Erdoberfläche) zweidimensionalen Koordinatensystem zugeordnet werden können. Doch der euklidische Raum spielt nicht nur als Beschreibungsrahmen eine wichtige Rolle. Gerade da schon bei einfacher geographischer Visualisierung der Daten Strukturen erkennbar werden, wird er auch als Erklärungsfaktor herangezogen. In der Humangeographie ist diese Herangehensweise als spatial approach bekannt (nicht zu verwechseln mit dem spatial turn in den Kultur- und Sozialwissenschaften).38 Beim spatial approach spielen ausschließlich geometrische Distanzen eine Rolle, der Raum wird „auf seine Mager-, Schwund-, ja Nullstufe reduziert: auf seine geometrisch-topologische Struktur. Der Raum erscheint als Distanzrelationsraum“ (hard 2008, 285). Für die Sprachgeographie bedeutet dies im einfachsten Fall: Sprachliche Ähnlichkeit von Dialekten wird durch geographische nähe erklärt: „Geographically proximate varieties tend to be more similar than distant ones“ (nerbonne/k Leiweg 2007, 154). nerbonne/k Leiweg (2007, 154) bezeichnen dieses Prinzip als Fundamental Dialectological Postulate, 38
Der spatial approach ist das Ergebnis einer in den späten 1960er Jahren initiierten, radikal quantitativ ausgerichteten, durch das geographische Pendant des quantitative turn bedingten neuorientierung in der Humangeographie (vgl. weiChhart 2001, 186; 2009, 65).
Raumkonzepte
59
was seine zentrale Bedeutung in der Dialektologie unterstreicht. Bis zu welchem Grad die geographische Distanz als Erklärungsfaktor ausreichend ist, wurde auf verschiedene Weise auszuloten versucht. Der allgemeine Konsens scheint dabei – mit Ausnahmen (z. B. SzMreCSanyi 2012 für Morphosyntax in England) – zu sein, dass die einfache geographische Distanz einen großen Anteil der sprachlichdiatopischen Variation erklärt.39 Das Fundamental Dialectological Postulate ist nicht auf allein die Dialektologie beschränkt, sondern ist, in einer allgemeineren Formulierung, fast ein Allgemeinplatz in der Geographie und der Geostatistik. „[…] everything is related to everything else, but near things are more related than distant things“, lautet das sogenannte Erste Gesetz der Geographie nach waLdo tobLer (1970, 236). In der Geostatistik wird dieses Phänomen als spatial dependence oder räumliche Autokorrelation bezeichnet (vgl. de SMith/goodChiLd/LongLey 2007, 45–46). Insofern ist die Beobachtung seiner Gültigkeit in der Dialektgeographie fast eine Banalität – interessant wäre es eher, räumliche Variantenverteilungen zu betrachten, die sich n icht allein durch geographische Proximität erklären lassen.40 Dass es eher schon erforderlich ist, die räumliche Autokorrelation aktiv auszublenden, um Aussagen über andere als rein räumliche Zusammenhänge in den Verteilungen von Varianten zu machen, zeigen die Bemühungen von Spruit et al. (2009) und piazza et al. (1995), herauszufinden, was an räumlichen Strukturen übrig bleibt, wenn man die nur durch räumliche Autokorrelation bedingten Relationen ignoriert. Auch wenn der euklidische Raum somit als Beschreibungssystem diatopischer Variation – meist in Form von Karten – durchaus notwendig ist, so ist er doch als explanativer Faktor nicht ausreichend.
39
S. z. B. fürs Lexikon: Séguy (1971); CavaLLi-Sforza /wang (1986); für die Phonetik: nerbonne/heeringa (2001; 2007); nerbonne (2010); für verschiedene sprachliche Teilbereiche: goebL (2005; 2006; 2007); Spruit et al. (2009). 40 Dass die Analyse der (lokal oder global bestimmten) Autokorrelation der Verteilungen einzelner Varianten durchaus lohnenswert sein kann, zeigt u. a. JaCk grieve (2009; grieve/ SpeeLMan/geeraertS 2011).
60
Theorie
2.2.2 Sozialer Raum Zweifellos sind die Räume, mit denen es die Geographie des Menschen zu tun hat …, nicht euklidisch. Sie sind vielfach weder isotrop (sondern haben bevorzugte und weniger bevorzugte Richtungen), noch kontinuierlich (sondern sind durch schwer und leicht passierbare Stellen strukturiert), noch homogen (es gibt vielmehr Stellen, die mehr, und andere, die weniger ‚wert‘ sind). – gerhard h ard, „Die Geographie“
Eine akkuratere Wiedergabe von sprachlich-diatopischen Beziehungen hat man sich vom Konzept des sozialen Raums erhofft, der als „Kulturraum“ (o. ä.) bereits in älteren dialektologischen Arbeiten in ähnlicher Form auftritt (s. z. B. baCh 1950, 63; fringS 1956, Bd. II, 23–27). Hier spielen statt absoluter geometrischer Verhältnisse die weichen, veränderlichen Beziehungen zwischen Akteuren die wichtigste Rolle. Der Raum definiert sich als ein Beziehungsgefüge, das durch zahlreiche Faktoren bedingt ist (allen voran durch den euklidisch-geographischen Raum),41 und das aus den Interaktionsbeziehungen zwischen Menschen besteht. Als solches besitzt er nicht die starren Verhältnisse des euklidischen Raumes, sondern ist eher als eine Art variables netzwerk zu verstehen, das sich aus dem Grad und der Art der Interaktion zwischen Individuen ergibt. In der Terminologie des Kulturwissenschaftlers Stephan günzeL (2008, 224–230) ist der soziale Raum ein topologisches, und nicht im engeren Sinne ein räumliches, Gefüge: Es geht um Lagebeziehungen, um das Verhältnis der Elemente zueinander, um festere oder losere Verknüpfungen. Die Soziologin Martina Löw (2001, 131) versteht „Raum als eine relationale (An)ordnung von Körpern, welche unaufhörlich in Bewegung sind, wodurch sich die (An)ordnung selbst ständig verändert“. Als netzwerk aufgefasst, können die Beziehungen zwischen den Elementen unterschiedlich stark ausfallen42 und können als Abstände – analog zu den Distanzen im euklidischen Raum – verstanden werden: Elemente können einander unterschiedlich nah oder fern sein.43
41
„Following the classic work of Hägerstrand 1967, geographers have shown that social exchanges of all sorts tend to decrease regularly with increasing distance. Quantitative study usually supports the validity of simple mathematical functions for the dependence of social contact on spatial distance.“ (CavaLLi-Sforza /wang 1986, 38) 42 „network strength – a measure of the time, emotional intensity, intimacy, function, and reciprocity of relationships“ (britain 2002, 611). 43 Die Vorstellung der „Stärke eines (sozialen) netzwerks“ (die sich aus der Stärke der Einzelverbindungen ergibt) in der Linguistik ist wesentlich von den Arbeiten von JaMeS und LeSLey MiLroy geprägt, die ihr Sprachwandelmodell auf das Konzept der netzwerkdichte (network strength scale) aufbauen (vgl. z. B. MiLroy/MiLroy 1985; MiLroy 1987).
Raumkonzepte
61
Als Gradmesser für das Ausmaß an sozialer Interaktion, d. h. auch für sprachlichen Austausch, verspricht der soziale Raum mehr Erklärungspotential für diatopische Sprachvariation zu beinhalten als der euklidische. Die Schwierigkeit besteht stets darin, dass es keine natürliche Skala für den Grad an Interaktion gibt, geschweige denn Klarheit darüber, wie „Interaktion“ genau aufzufassen ist. Die Distanzen im sozialen Raum sind also nicht wohldefiniert wie im euklidischen Raum. Angefangen mit trudgiLL (1974; vgl. 2.1.3.3) wurde jedoch immer wieder versucht, sich ihnen in verschiedener Weise anzunähern. Bei seinem „gravity model, a simple model which geographers have borrowed from the physical sciences in order to investigate the interaction of two centres“ (trudgiLL 1974, 233), sind es die zusätzlichen Faktoren population und prior-existing linguistic similarity, die zusammen mit der euklidisch-geographischen Distanz ein Maß für die Interaktion zwischen zwei orten bilden sollen. Mit diesem Modell ist trudgiLL in der Lage, plausible Werte für den sprachlichen Austausch unter englischen bzw. norwegischen Städten zu berechnen, jedoch sind die genauen Formeln durch einige Ad-hocEntscheidungen und andere Schwierigkeiten geprägt; sein großes Erklärungspotential für sprachliche Beziehungen wurde jedoch jüngst von SzMreCSanyi (2012) bestätigt.44 Eine empirische Annäherung an das Problem sozialer Distanzen hat hägerStrand (1967, 190–231) versucht, indem er die Zahl der Telefonkontakte zwischen verschiedenen orten ermittelt hat. Es wurde auch versucht, „the degree of accessibility between two places“ (gooSkenS 2004, 195) als Maß für linguistische Interaktion heranzuziehen; fuMio inoue (2004; 2006) verwendet die Länge von Eisenbahnstrecken, gooSkenS (2004) und SzMreCSanyi (2012) berechnen die Zugfahrzeiten zwischen zwei orten. Die Reisestrecke bzw. -dauer soll ein Maß für das Interaktionspotential zwischen zwei orten sein, denn „[i]f a place is easily accessible, people are more inclined to go to this place“ (gooSkenS 2004, 195). Die Studien zeigen, dass solche Annäherungen tendenziell einen größeren Anteil an sprachlich-diatopischer Variation erklären als die einfache geographische Distanz. Sozialer Raum, verstanden als Gefüge aus paarweisen Interaktionspotentialen, ist also, soweit er mit solchen einfachen Mitteln emuliert werden kann, ein besserer Erklärungsrahmen für diatopische Variation als der rein euklidische. Dennoch ist fraglich, bis zu welchem Grad die bisher vorgeschlagenen Annäherungen tatsächliche Interaktionsgefüge angemessen abzubilden vermögen, und vor allem, wie gut sie sprachliche Austauschbeziehungen wiedergeben können. 2.2.3 Kognitiver Raum Wenn von kognitivem (oder perzeptivem) Raum die Rede ist, dann ist die Art und Weise gemeint, in der räumliche Verhältnisse in den Vorstellungen der Menschen repräsentiert sind, und wie die Menschen ihre Umgebung wahrnehmen. 44 Für Kritik s. nerbonne/heeringa (2007, 288–289).
62
Theorie
Was ist ‚gefühlt‘ nahe, ‚gefühlt‘ weiter entfernt, zu welcher Raumeinheit fühlt man sich zugehörig, und wie ist die Erstreckung dieser Raumeinheit? Wie ist das Verhältnis zu anderen Raumeinheiten, welche befinden sich näher, welche weiter entfernt? „In dieser Dimension konstituiert sich der Raum durch die Wertvorstellungen, Meinungen und Wahrnehmungen, die Personen von bestimmten Raumausschnitten wie orten oder Regionen haben“ (anderS 2010, 83). Die enge Beziehung zum sozialen Raum ist offensichtlich: Der soziale Raum, das ‚Interaktionsgefüge‘, die (An)ordnung von Menschen und Gütern untereinander, bestimmt zweifellos die Wahrnehmung des Raums entscheidend mit. Umgekehrt vermag die Wahrnehmung des Raums den Aufbau des Interaktionsgefüges zu beeinflussen: Man ist weniger geneigt, in der Wahrnehmung existierende Grenzen oder Entfernungen zu durchqueren, was das Interaktionspotential über sie hinweg schmälert. Insofern besteht zwischen sozialem und perzeptivem Raum eine wechselseitige Beziehung. Erkenntnisse über die Wahrnehmung des Raums lassen sich u. a. gewinnen, indem man Befragungen durchführt. Im Einführungsband des SBS (Bd. 1, 84–87) finden sich Beispiele für die Kartierung der Ergebnisse solcher Befragungen. In K. 1.11 etwa sind die Antworten auf die Frage „In welcher Landschaft liegt der ort?“ verzeichnet, K. 1.18 gibt die Ergebnisse für „Sind die Leute hier am ort mehr Bayern oder Schwaben?“ wieder. Außerdem sind die Antworten auf die Frage „Welches sind die nachbarlandschaften und wo beginnen sie?“ verzeichnet. Solche Karten geben Aufschluss über die mentale Einteilung des Raums in Einheiten. Solche Erkenntnisse sind vor allem dann interessant, wenn man überprüfen möchte, inwieweit sich die mentalen Raumstrukturen mit sprachgeographischen Strukturen decken bzw. in welcher Weise sie sich gegenseitig beeinflussen. 2.2.4 Kommunikationsraum Der Sprachraum … erscheint als ein unendlich feines und verwickeltes Webstück von Fäden. – theodor fringS, „Sprache und Geschichte“
Das vielschichtige Konzept der Räumlichkeit, das sich aus den oben vorgestellten Arten von Raum konstituiert, ist von einer Komplexität, die es schwer macht, die Relevanz der einzelnen ‚Räume‘ für sprachliche Vorgänge abzuschätzen. Welcher Raum ist etwa gemeint, wenn von der Bedeutung des Raums für sprachliche Variation die Rede ist? Auf welche Art von Raum bezieht sich die ‚räumliche‘ Dimension Diatopie – ausschließlich auf den euklidischen? Die Verwendung des Raumbegriffs in der Sprachwissenschaft ist so vielgestaltig, wie es hard mit Blick auf den spatial turn beklagt hat (vgl. 2.2). Gibt es eine ‚richtige‘ Vorstellung davon, was Raum in Hinsicht auf Sprachgeographie zu bedeuten hat?
Diatopische Varietäten
63
Man kann dieses Problem umgehen, indem man annimmt, dass die räumlichen Beziehungen, die für sprachliche Verhältnisse eine Rolle spielen, eben jene sind, in denen sich sprachliche Vorgänge abspielen. Diese Beziehungen sind nichts anderes als jene Ausprägung „relationaler (An)Ordnungen“ der Aktanten, die unmittelbar mit sprachlichen Beziehungen in Verbindung steht. Um diese Beziehungen zu ermitteln, könnte man beispielsweise fragen: Wer redet wie viel mit wem? Wie viel sprachlicher Austausch findet statt? Eine relativ unverzerrte Idee davon, was den Raum sprachlicher Prozesse ausmacht, bekommt man, indem man sprachliche Ähnlichkeiten betrachtet: Was einander sprachlich ähnlich ist, ist ‚nah‘, was sich sprachlich unähnlich ist, ist ‚fern‘ in einem sprachlich definierten Raumgefüge. Dieser ‚Kommunikationsraum‘ (oder „Sprachraum“; vgl. fringS 1956, Bd. II, 24–26), in dem sprachlicher Austausch geschieht, stellt eine besondere Ausformung des sozialen Raumes dar, ist insofern auch vom kognitiven und natürlich mittelbar auch vom euklidischen Raum nicht unabhängig. Ebenso wie der soziale Raum als ein netzwerk aus sozialen Beziehungen verstanden wird, kann der Kommunikationsraum als ein netzwerk aus Kommunikationsbeziehungen verschiedener Stärke gesehen werden. Die Stärke der Beziehungen kann wiederum von verschiedensten Faktoren abhängen, die es zu bestimmen gilt; sie können sogar für Teile des Sprachinventars unterschiedlich ausfallen (vgl. auch 2.1.3.3). Für den Kommunikationsraum gilt, was hard in Bezug auf die Räume der Humangeographie schlechthin gesagt hat (vgl. 2.2.2): Er ist weder isotrop, noch kontinuierlich, noch homogen. Gelänge es jedoch, den Kommunikationsraum (bzw. sein Verhältnis zum euklidischen Raum und anderen Faktoren) so zu modellieren, dass alle Vorgänge, die sich in ihm abspielen, gleichförmig und nach allgemeingültigen Regeln erfolgen, so wäre man der natur sprachgeographischer Prozesse und Phänomene einen großen Schritt nähergekommen. Eine solche Modellierung des Kommunikationsraums auf der Grundlage sprachlicher Daten wird in Abschnitt 4.3–4.3.2 vorgestellt. 2.3 DIAToPIScHE VARIETÄTEn Ein zentrales Thema in der Dialektologie ist die Beschreibung von Dialektarealen, die als eigenständige diatopische Varietäten verstanden werden und dem Anspruch genügen sollen, in sinnhafter Weise von einer Fülle von räumlich verbreiteten Varianten zu abstrahieren. Die Einteilung des ‚variationslinguistischen Raumes‘ (d. h. des Raumes, der durch die drei Dimensionen diatopisch, diastratisch und diaphasisch aufgespannt wird; vgl. 2.2) in Varietäten ist der Versuch, ordnung in eine teils amorph, teils strukturiert erscheinende Masse an sprachlicher Variation zu bringen. Eine solche Varietät ist ein Ausschnitt aus dem variationslinguistischen Raum, der durch das Auftreten bestimmter Varianten geprägt ist; dabei ist sie im normalfall nie ganz homogen; sie weist immer auch interne Variation auf. Je weiter man den Geltungsbereich einer Varietät ausdehnt, desto größer wird die Variation innerhalb dieser Varietät. Je nach Ausdehnung des vorgenommenen Ausschnitts kann z. B. ein Unterschied zwischen zwei ortsdialekten als Variation
64
Theorie
innerhalb eines Dialektgebietes oder als Unterscheidungsmerkmal zwischen zwei kleineren Dialektgebieten angesehen werden. Die bestehenden Unterschiede zwischen den ortsdialekten werden so zu varietätsinterner Variation ‚umdeklariert‘ (vgl. auch baiLey 1973, 2–13). Die Ausdehnung einer Varietät ist demnach zu einem bestimmten Grad arbiträr. Das Konzept der Varietät ist nicht so klar allgemeingültig definierbar wie etwa das der Variablen (s. 2.1.2). Insofern ist der Begriff der Varietät problematisch (vgl. berruto 2010, 229–230), denn wie ein Ausschnitt aus dem variationslinguistischen Raum festgelegt wird, kann von sehr unterschiedlichen Kriterien abhängig sein. Das Vornehmen eines Ausschnitts kann etwa ad hoc erfolgen, d. h. vorlinguistisch aufgrund von nicht-sprachlichen Umständen vorgegeben sein.45 Eine solche ‚extra‘- oder ‚alinguistische‘ Definition einer Varietät legt zuerst einen bestimmten Bereich fest, fragt daraufhin nach der sprachlichen Situation in diesem Bereich und füllt ihn erst dann mit sprachlichen Befunden (vgl. auch ChriSten 2010, 270). Eine gewisse innere Homogenität wird dabei oft stillschweigend vorausgesetzt. Dies entspricht in vielen Fällen der wissenschaftlichen Vorgehensweise, v. a. bei der Datenerhebung zu dokumentarischen Zwecken, indem gefragt wird: Wie spricht man in einer bestimmten Region/Schicht/Situation? Am deutlichsten ist dies im Fall des ortsdialekts, bei dem dezidiert die Sprachform gemeint ist, die in einem klar umrissenen räumlichen Perimeter vorkommt; irgendwelche sprachlichen Gründe spielen bei der Festlegung des Geltungsbereichs keine Rolle. Auch bei räumlich flächenhaft ausgedehnten Varietäten ist die areale Ausdehnung oft primär gegeben, auch wenn bereits das Vorwissen der Forscher über die sprachliche Homogenität im jeweiligen Gebiet in die Festlegung des Untersuchungsbereichs einfließt. Insofern kann z. B. „der schwäbische Dialekt“ zunächst durchaus verstanden werden als „der in Schwaben gesprochene Dialekt“.46 Freilich schließt sich oft auch erst an die Datenerhebung eine Einteilung in Varietäten an; dies erfolgt dann auf der Grundlage sprachlicher Befunde. Dabei sind in der Regel zwei Kriterien zu erfüllen: relative innere Homogenität und relative Abgegrenztheit nach außen. Die Bestimmung einer Varietät und ihres Geltungsbereichs aus ihrer inneren Homogenität (und Heterogenität gegenüber anderen Varietäten) heraus wurde immer wieder mit verschiedenen – qualitativen wie quantitativen – Verfahren versucht, leidet aber bis heute an verschiedenen methodischen und konzeptuellen Problemen. So wird etwa in der Dialektologie oft versucht (beispielsweise bei der clusteranalyse, vgl. 1.2.2), eine trennscharfe Einteilung in Dialektgebiete (und damit in Varietäten) vorzunehmen; ein Vorhaben, das der sprachlichen Realität nicht gerecht wird, denn scharfe, eindeutige Abgrenzungen zwischen Dialektgebieten sind nach aller empirischen Evidenz die absolute Ausnahme.
Vgl. z. B. den Eintrag Varietät im „Lexikon der Sprachwissenschaft“ (buSSMann 2008, 772): „Die einzelnen außersprachlichen Variationsparameter (Region, Gruppe/Schicht, Situation, historische Dimension) sind dabei varietätendefinierend“. 46 Wie hierbei die Ausdehnung von Schwaben zu bestimmen ist, ist eine andere Frage; wird sie aufgrund sprachlicher Eigenschaften entschieden, so ist die Definition zirkulär.
45
Diatopische Varietäten
65
peter auer (1986, 99) setzt (auf diaphasischer Ebene) neben der inneren Homogenität und äußeren Abgegrenztheit noch weitere Kriterien für Varietäten an (ähnlich Lenz 2003, 389–390): das der eindeutig formulierbaren außersprachlichen Verwendungsbedingungen und das des emischen Status im Bewusstsein der Sprecher. Für den nachweis einer Varietät wäre also die Übereinstimmung einer 1. linguistisch homogenen und abgrenzbaren, 2. extralinguistisch genau definierbaren und 3. kognitiv repräsentierten Einheit zu zeigen. Diese drei Zugänge zum Konzept Varietät – der innersprachliche, der außersprachliche und der kognitive – betreffen Ausschnitte aus dem variationslinguistischen Kontinuum, die aufgrund unterschiedlicher Ausgangspunkte vorgenommen werden. Im Prinzip lassen sich damit drei Arten von Varietäten beschreiben: Solche, die aufgrund von sprachlicher Homogenität und Abgegrenztheit (nur) linguistisch definiert sind; solche, die aufgrund von außersprachlichen Verwendungsbedingungen (nur) extralinguistisch definiert sind; und solche, die aufgrund von Sprecherurteilen (und anderen Indikatoren) (nur) laienlinguistisch bzw. kognitiv definiert sind. Dabei ist klar, dass zwischen den so jeweils ermittelten Einheiten durchaus wechselseitige, nicht sofort durchschaubare Beziehungen bestehen können. Sie müssen daher m. E. auch zunächst getrennt ermittelt werden; die Bedingungen der Deckungsgleichheit dieser Verfasstheiten sind ein eigener Untersuchungsgegenstand, etwa: Wann deckt sich ein sprachlich homogener Bereich mit einer im Bewusstsein der Sprecher so empfundenen sprachvariativen Einheit? oder: Aufgrund welcher außersprachlichen Gegebenheiten lässt sich ein Bereich definieren, der relative sprachliche Homogenität nach innen und Abgegrenztheit nach außen besitzt? Einen primär innersprachlich geprägten Varietätenbegriff stellt gaetano berruto vor. Bei ihm steht das gemeinsame, gehäufte Auftreten bestimmter Varianten, d. h. von Variantenkombinationen, im Mittelpunkt; dabei wird angenommen, dass sich Varianten, die ähnliche Verteilungen aufweisen, zusammenfassen und gemeinsam beschreiben lassen. Zu ähnlichen Verteilungen kommt es, wenn mehrere Varianten über dasselbe kommunikative netzwerk vermittelt werden, von ähnlichen Einflüssen betroffen sind und dadurch ähnliche (parallele) Diffusionsprozesse erfahren, die jedoch im Detail schwerlich genau gleich ablaufen. Nach berruto (2010) konstituieren solche tendenziell kookkurrenten Varianten (d. h. Varianten, die in denselben Kontexten auftreten und dadurch ähnlich verbreitet sind) Varietäten: The tendential co-occurrence of variants gives rise to linguistic varieties. Therefore, a linguistic variety is conceivable as a set of co-occurring variants; it is identified simultaneously by both such a co-occurrence of variants, from the linguistic viewpoint, and the co-occurrence of these variants with extralinguistic, social features, from the external, societal viewpoint. (berruto 2010, 229)
Die Kookkurrenz von Varianten, ihr gemeinsames Auftreten (d. h. ihre gegenseitige Implikation oder „Koimplikation“; berruto 2004, 190), wird dabei in den Mittelpunkt gestellt. Diese kann von extralinguistischen Faktoren begleitet sein: Solche Faktoren wirken auf die Verbreitungen verschiedener Varianten gleichzeitig ein, so dass diese sich ähnlich im Raum verteilen. Es ist aber auch möglich, dass Varianten durch intralinguistische Gründe aneinander gekoppelt sind und
66
Theorie
sich dadurch parallel ausbreiten. Beides wird von berruto nicht getrennt voneinander betrachtet. Insgesamt steht die Annahme im Vordergrund, auffällige Häufungen von kookkurrenten Varianten (sogenannte Verdichtungen) seien nichts Zufälliges, sondern das Ergebnis paralleler Entwicklungen. As Downes (1984: 28) points out, “the linguistic side of any variety […] is a clustering tendency within a continuum”. Thus, the result is a Kontinuum mit Verdichtungen (Berruto 1987, “continuum con addensamenti”); varieties in this continuum represent concentration areas, where a variety, though not clearly-cut separated from other varieties, is identified by a particular frequency of certain variants, by the co-occurrence of several features and possibly by some diagnostic traits, which appear in that variety only. (berruto 2010, 236)
Damit werden verschiedene Kriterien der Varietäteneinteilung bedient: Durch die Kookkurrenz mehrerer Varianten wird eine relative innere Homogenität gewährleistet; gleichzeitig ist es möglich, verschiedene Verdichtungsbereiche kookkurrenter Varianten voneinander abzugrenzen und ihre Gebundenheit an außersprachliche Bereiche anzugeben. Die Abgegrenztheit von Varietäten voneinander, d. h. ihre Distinktheit, fällt bei diesem Ansatz jedoch inner- wie außersprachlich nicht so klar aus wie bei ‚scharfen‘ Dialekteinteilungen.47 Anknüpfend an berrutoS Varietätenkonzept soll an dieser Stelle – angesichts der Vielgestaltigkeit der Verwendungsweisen des Terminus Varietät (vgl. Maitz 2010), von denen die Ausführungen der letzten Absätze nur einen Ausschnitt wiedergeben48 – der Begriff der Varietät und damit in Verbindung stehende Konzepte für diese Arbeit geklärt werden. Vor allem erscheint es hilfreich, eine Unterscheidung zwischen den Termini Varietät und Lekt vorzunehmen. Beide werden oft weitgehend synonym verwendet (z. B. buSSMann 2008, 396, 772). Dabei werden sie entweder primär innersprachlich (z. B. berruto 2010) oder primär außersprachlich (z. B. veith 2005, 24; buSSMann 2008, 396, 772) definiert, wobei eine gewisse innere Homogenität stets vorausgesetzt wird; bisweilen wird explizit – wie weiter oben gezeigt – einer doppelt oder mehrfach motivierten Definition der Vorzug gegeben (z. B. auer 1986, 99; Lenz 2003, 389–390; roeLCke 2010, 16).49 Eine terminologische Unschärfe möchte ich vermeiden, indem ich außersprachlich definierte Ausschnitte aus dem Sprachraum Lekte nenne, innersprachlich definierte Ausschnitte Lekttypen. Ein Lekttyp ist durch seine sprachlichen „Strenger genommen bedeutet ein Kontinuum mit Verdichtungsbereichen allerdings nicht nur eine Abschwächung der Behauptung diskreter Varietäten, sondern gleichzeitig die Behauptung, dass zwischen den Verdichtungsbereichen ein Kontinuum von Möglichkeiten besteht.“ (MöLLer 2013, 46) 48 Eine weitere begriffliche Differenzierung nehmen SChMidt/herrgen (2011) vor, indem sie zwischen Voll- und sektoralen Varietäten unterscheiden; dabei stellen Vollvarietäten systematisch-grammatisch geprägte sprachvariative Einheiten dar, sektorale eher unsystematisch organisierte, im Wesentlich lexikalisch bestimmte Einheiten. Die Frage etwaiger Vollvarietäten berührt die vorliegende Arbeit nur am Rande, da es hier dezidiert um den lexikalischen Teilbereich geht, in dem nach SChMidt/herrgen allenfalls sektorale Varietäten festzustellen sein können. 49 „Unter einer Varietät wird […] ein sprachliches System verstanden, das […] durch eine Zuordnung bestimmter innersprachlicher Merkmale einerseits und bestimmter außersprachlicher Merkmale andererseits gegenüber weiteren Varietäten abgegrenzt wird“ (roeLCke 2010, 16). 47
Diatopische Varietäten
67
Merkmale (und deren statistisch fassbare Kookkurrenz) bestimmt, betrifft deshalb nur ein Teilinventar und hat eine unscharfe Ausdehnung, da die Verteilungen der Merkmale nie ganz übereinstimmen; ein Lekt ist dagegen über außersprachliche Variationsparameter (z. B. Region, Schicht) festgelegt und hat deshalb eine zumindest potentiell scharfe Ausdehnung (z. B. ein bestimmter ortsdialek t oder ein Regionaldialek t). Ein Lekttyp ist somit ein intensional bestimmter Ausschnitt aus dem Sprachraum, ein Lekt ein extensional bestimmter Ausschnitt. Von einer Varietät kann mit berruto dann gesprochen werden, wenn der Geltungsbereich eines Lekttyps (d. h. einer signifikanten Kombination kookkurrenter Varianten) wesentlich mit einer oder mehreren außersprachlichen Gebrauchsbedingungen in Zusammenhang steht: Wenn eine Menge von gewissen kongruierenden Werten bestimmter sprachlicher Variablen […] zusammen mit einer gewissen Menge von Merkmalen auftreten, die Sprecher und/oder Gebrauchssituationen kennzeichnen, dann können wir von einer sprachlichen Varietät sprechen. (berruto 2004, 189)
Es wäre zu diskutieren, ob auf diatopischer Ebene schon die Bestimmbarkeit der geographischen Verbreitung eines Lekttyps die Anforderungen an das außerlinguistische Kriterium des Varietätenstatus erfüllt (dann wäre jeder Lekttyp eine Varietät), oder ob dafür die Identifikation kongruenter außersprachlicher Merkmale erforderlich ist. Der Einfachheit halber werde ich im Folgenden nicht zwischen (Dia-)Lekttyp und (diatopischer) Varietät unterscheiden; in diesem Sinne ist eine Varietät dann ganz allgemein ein sprachlich definierter Ausschnitt aus dem variativen Kontinuum, dem ein außersprachlicher Geltungsbereich zugewiesen werden kann. Das perzeptiv-kognitive Kriterium von auer und Lenz wird in der vorliegenden Arbeit nicht angesetzt, da es m. E. epistemisch zu einer anderen Ebene gehört. Beide Verfasstheiten – außersprachlich-extensionaler Lekt (Typ „Schwäbisch ist das, was in Schwaben gesprochen wird“) sowie innersprachlich-intensionaler Lekttyp (Typ „Schwäbisch spricht, wer Gascht und Fescht sagt“) – können parallel zu wissenschaftlich-linguistischen, d. h. etischen Erkenntnissen auch auf laienlinguistisch-perzeptiver, d. h. emischer Seite vorkommen; dann handelt es sich folglich um kognitive (bewusst oder unbewusst konzeptualisierte) Lekte oder Lekttypen. Entsprechend kann man neben wissenschaftlich-dialektologisch definierten, etischen auch kognitiv-laienlinguistisch verfasste, emische Varietäten beschreiben. berrutoS Konzept von „Verdichtungen in einem Kontinuum“ (berruto 2004, 190) hat – ungeachtet der Frage des Varietätenstatus – bereits in einigen Arbeiten (insbesondere zur Diaphasie) Anwendung gefunden, darunter Lenz (2003) und MöLLer (2013). obschon in Ansätzen vorhanden, fehlt in sprachgeographisch ausgerichteten Arbeiten bislang eine Anwendung des Konzepts auf der Grundlage von diatopischen Kookkurrenzen, d. h. von Dialektarealen als Verdichtungsbereichen im geolinguistischen Kontinuum; stattdessen herrscht immer noch das Bild des in mehr oder weniger einheitliche Dialektgebiete gegliederten Sprachraums vor, deren Abgrenzung untereinander gewisse Übergangsbereiche zugebilligt werden (vgl. berruto 2010, 236). Es herrscht in gewissem Sinne nach wie vor
68
Theorie
eine top-down-Sichtweise vor, die von einer bestimmten Struktur (der areal begrenzten) ausgeht und diese nach und nach (manchmal, so scheint es, etwas widerwillig) den nicht so klaren Befunden anpasst. Die umgekehrte Sichtweise auf die Strukturiertheit des Sprachraums, d. h. ein bottom-up-Zugang, der von den sprachlichen Befunden ausgeht und erst von dort zu einer Idee dessen gelangt, was ein Dialektareal ausmacht, ist, soweit ich sehe, in der dialektologischen Forschung bisher überhaupt noch nicht in Angriff genommen worden, würde aber ganz neue Perspektiven eröffnen. In der diatopischen Dimension lassen sich Lekte – Dialekte – als Mengen von orten (also als Dialektgebiete) beschreiben, Dialekttypen hingegen als Mengen von (kookkurrenten) Varianten. Letzteres impliziert, dass das Auftreten der Varianten, deren Verteilungen nie ganz deckungsgleich sind, den entsprechenden Dialekttyp an unterschiedlichen orten zu unterschiedlichen Graden evozieren kann. Tritt etwa an einem bestimmten ort nur die Hälfte von ansonsten tendenziell kookkurrenten Varianten auf, so könnte man sagen, dass die Varietät, den diese Varianten konstituieren, zu 50 % vorliegt. Umgekehrt bedeutet dies, dass Varianten, die zwar vereinzelt zusammen mit den varietätskonstituierenden Varianten auftreten, insgesamt aber nicht in auffälliger Weise mit ihnen kookkurrieren, nicht als Bestandteile des Dialekttyps begriffen werden können. Es gibt also Varianten, die – aufgrund ihrer Kookkurrenz – ab einer gewissen Häufung die Einordnung einer Sprachprobe zu einem bestimmten Dialekttyp erlauben, und solche, die, obwohl sie zusammen mit ihnen auftreten kön nen, keinen Hinweis darauf liefern, dass der entsprechende Dialekttyp vorliegt. Die kookkurrenten und damit varietätskonstituierenden Varianten können deshalb als die Merkmale eines Dialekttyps bezeichnet werden, auch wenn sie nur einen Teil des sprachlichen Inventars abdecken und – einzeln betrachtet – durchaus abweichende Verbreitungen haben können. Um es mit adoLf baCh zu sagen: Ein Dialekt ist also nicht zu bestimmen durch so und so viele Züge, die anderswo nicht vorkommen, er besteht vielmehr aus einer bestimmten Kombination von Erscheinungen, die jede für sich eine viel größere Verbreitung haben können, was nicht ausschließt, daß einzelne in der Tat nur in der betr. Kernlandschaft zu finden sind. (baCh 1950, 62)
Ein Dialekttyp ist demnach definiert durch die Menge seiner Merkmale (abhängig davon, wie stark ihre Kookkurrenz mit den anderen Merkmalen ausgeprägt ist, in unterschiedlichen Gewichtungen), die in der Realität nicht überall gemeinsam auftreten müssen, dies aber insgesamt gesehen in relevanter Weise tun. Ein Variantenaufkommen, das exakt der Zusammenstellung der Merkmale eines Dialekttyps entspricht (möglicherweise sogar entsprechend ihrer Gewichtung), würde diesen Dialekttyp in prototypischer Reinform darstellen, auch wenn dies in der Realität wahrscheinlich nirgends ganz erreicht wird: Überall gibt es auch Varianten, die global gesehen eigentlich nicht mit den übrigen am ort kookkurrieren. Eine Varietät in der diatopischen Dimension kann demnach als Dialekttyp betrachtet werden, der durch seine Merkmale charakterisiert ist und in Einzel(d ia)lek ten (z. B. ortsdialekten) unterschiedlich stark repräsentiert ist. Einzelne Dialekte sind unterschiedlich typische Vertreter eines Dialekttyps; dadurch kommt den jeweiligen Orten eine unterschiedlich starke Zu-
Diatopische Varietäten
69
gehörigkeit zum entsprechenden Areal zu. Die Merkmale des Dialekttyps sind für ihn charakteristisch, da einzelne von ihnen stellvertretend für alle anderen, ähnlich verteilten Merkmale stehen können, die mit ihnen in unterschiedlichem Ausmaß kookkurrieren. Diese Merkmale sind jedoch zu verschiedenen Graden charakteristisch für einen bestimmten Dialekttyp; sie haben unterschiedlich hohe Merkmalswerte. Sie kommen dabei nicht nur im Kernbereich des entsprechenden Dialektareals vor, sondern in abnehmenden Graden auch in seinen Rand- und umliegenden Bereichen. Dort stehen sie zunehmend neben Varianten, mit denen sie insgesamt gesehen eher nicht kookkurrieren. Die Einzelverteilungen der Merkmale eines Dialekttyps können relativ stark voneinander verschieden sein, ohne dass diese ihre Merkmalshaftigkeit vollständig einbüßen. Die unscharfe räumliche Ausdehnung von Dialekttypen spiegelt dies wider. Die Übergänge zwischen den gesetzten, definierten Sprachgebieten gestalten sich in der Regel fließend, nicht abrupt. Sie gehen durch die Zu- oder Abnahme von für sie als charakteristisch angenommenen Merkmalen ineinander über, wobei diese Merkmale meist nur in Teilen des Gebiets gelten oder noch weitere Gebiete einschließen können. So ist das als schwäbisch geltende „sch“ im Inlaut in Wörtern wie „Gascht“ oder „Fescht“ (für „Gast“ und „Fest“) auch im westlichen Bairischen (bis nach Pasing) daheim und umfasst den ganzen Südwesten bis nach Luxemburg […]. Das oft als bairisches „Kennwort“ bezeichnete Fasching beginnt in den alten ortsdialekten erst ein gutes Stück östlich von München, von da an aber gilt es bis zur ungarischen Grenze […]. Das Wort ist also nicht in allen ortsdialekten dessen, was man gewöhnlich „bairisch“ nennt, vorhanden. (könig 2010b)
Das Verhältnis zwischen den Einzelverteilungen von Varianten und den Ausdehnungen der Dialekttypen ist nun ganz ähnlich zu dem zwischen „Kennwörtern“ (Merkmalen) und „Sprachgebieten“: Einzelne Varianten kookkurrieren in einer bestimmten Region; sie sind für diese Region charakteristisch. Tun dies viele Varianten in gleicher oder ähnlicher Weise, so konstituieren sie eine Varietät und damit einen Ausschnitt aus der sprachgeographischen Realität, der durch relative innere Homogenität, aber trotz seiner unscharfen Ränder durch Eigenständigkeit geprägt ist. Da sich die Dialekttypen aufgrund ihrer Unschärfe räumlich überlappen, kann ein einzelner ortsdialekt durch die Anteile beschrieben werden, zu denen er durch verschiedene Dialektty pen (bzw. durch deren Merkmale) geprägt ist. Die diatopische Schichtung von Lekttypen lässt sich somit durch die Anteile ihrer Merkmale an lokalen Gesamtinventaren beschreiben (Abb. 8, nächste Seite). Diese Sichtweise vereint das Konzept des Dialektkontinuums, wie es etwa von ChaMberS/trudgiLL (1998, 5–7) vertreten wird (vgl. auch berruto 2010, 235–236; könig 2010a), mit der Annahme, es gebe distinkte Dialektgebiete, wie sie etwa mit der Isoglossenmethode (vgl. 1.2.2, 5.1.3) oder in der Dialektometrie mithilfe der clusteranalyse (vgl. 1.2.2) zu bestimmen versucht wurden.50 Es existiert demnach zwar ein prinzipiell amorphes Kontinuum, eine weitgehend strukturlose dialektale Variation, 50 Für eine Diskussion, ob die sprachgeographische Variation eher die Gestalt eines Kontinuums oder von Arealen besitzt, s. ChaMberS/trudgiLL (1998, 89–123); nerbonne/heeringa (2001).
70
Theorie
Abb. 8: Modell der Schichtung von Dialekttypen im Raum.
die jedoch von Konzentrationen und Verdichtungen durchbrochen ist, die Typen konstituieren. Diese Typen sind zwar nicht scharf voneinander zu trennen, jedoch durch eine gewisse innere Homogenität charakterisiert und dadurch identifizierbar. Auch in ihren Kerngebieten (d. h. da, wo sie der jeweils am stärksten vertretene Typ sind, vgl. Abb. 8) kommen sie nicht ausschließlich vor; es sind stets auch Varianten anderer Typen und damit Anteile anderer Varietäten präsent. Wie gezeigt wurde, ist die Terminologie der auf eLeanor roSCh (1975) zurückgehenden Prototypentheorie, auf der auch die durch george Lakoff (1987) begründete Prototypensemantik beruht, besonders gut geeignet, um Varietäten zu beschreiben, und dabei gleichzeitig kompatibel zu berrutoS Kook kur renzansatz. Varietäten sind demnach unscharfe Kategorien, denen sich Lekte mit variierender Stringenz zuordnen lassen. Lekte können demnach mehr oder weniger typische Vertreter einer Varietät – eines Lekttyps – sein. Dabei ist ferner zu unterscheiden zwischen perzeptiv-kognitiven (d. h. laienlinguistischen) und empirisch-statistischen (d. h. wissenschaftlich-dialektologischen) Lekttypen (vgl. S. 67). Erstere sind emische, letztere etische Entitäten. Dass laienlinguistische Dialektkonzeptualisierungen kognitive Prototypeneffekte aufweisen, wurde bereits verschiedentlich gezeigt (vgl. ChriSten 1998, 51–57; 2010; bertheLe 2006, 164–167; k riStianSen 2008; anderS 2010, 107–110). offenbar ist also auch der landläufige Dialektbegriff von Unschärfe geprägt: Ausgehend von verschiedenen Merkmalen kann man eine bestimmte Redeweise zu einem gewissen Grad einem kognitiven Dialekttyp, etwa Bairisch, zuordnen. Der Merkmalswert einer Variante entspricht dabei der sogenannten Reizvalidität der Prototypentheorie (cue validity; vgl. SChMid 1993, 13). Zu kognitiven Konzeptualisierungen von Dialekttypen gibt es bereits einige Arbeiten (s. o.); die Identifikation von wissenschaftlich-dialektologischen Dialekttypen lässt sich statistisch über die Untersuchung von Variantenkookkurrenzen erreichen (vgl. hierzu 5.2). Inwieweit sich empirisch-statistische mit perzeptiv-kognitiven Dialekttypen (als „kognitive Bezugspunkte“; SChMid 1993, 11; nach roSCh 1975)51 decken und welche Bezie51
Für die Dialektologie vgl. ChriSten 1998, 275–277.
Diatopische Varietäten
71
hungen zwischen ihnen bestehen, würde einen gewinnbringenden Forschungsgegenstand darstellen. Vor allem wäre zu vermuten, dass die statistisch ermittelten Merkmalswerte mit der Frequenz und der perzeptiven Salienz von Varianten gewichtet werden müssen, um der Reizvalidität im kognitiven Sinne näherzukommen. Zudem ist davon auszugehen, dass nicht alle empirisch ermittelten Dialekttypen überhaupt als perzeptive Prototypen konzeptualisiert sind und umgekehrt.
3 DATEn Extra atlantes linguisticos nulla salus dialectometrica ‒ h anS goebL, „Dialektometrie“
Grundlage für die in dieser Arbeit durchgeführte Untersuchung ist das onomasiologische wortgeographische Material des „Sprachatlas von Bayerisch-Schwaben“ (SBS), der in den Jahren 1984 bis 2009 unter der Leitung von werner könig an der Universität Augsburg erstellt wurde. Der SBS dokumentiert die dialektale Variation im bayerischen Regierungsbezirk Schwaben und angrenzenden Gebieten in Oberbayern und Mittelfranken, im Süden wurde jedoch das durch den „Vorarlberger Sprachatlas“ (VALTS) schon abgedeckte Gebiet ausgeklammert. Mit ca. 2.700 Karten in 14 Bänden ist der SBS der umfangreichste Sprachatlas im deutschsprachigen Raum. Das Untersuchungsgebiet umfasst 272 Erhebungsorte und erstreckt sich ca. 90 km von West nach ost und ca. 150 km von nord nach Süd (eine Liste der 272 Aufnahmeorte ist auf S. 247–248 zu finden). Primäres Ziel des SBS war es, den Basisdialekt und damit die geographische Variation der ältesten noch ermittelbaren Mundart festzuhalten. Hierfür wurden ältere Personen befragt, v. a. aus dem bäuerlichen Milieu. Im normalfall gab es ein bis zwei, in Ausnahmefällen bis zu sechs Informanten pro ort. 3.1
STRUKTUR DER DATEn
Die Antworten der Gewährspersonen auf die einzelnen Fragen wurden von den Kartierern der SBS-Bände zu Varianten zusammengefasst und in Form von Symbolen kartiert. Dabei steht ein Symbol an einem ort für eine dort belegte Variante. Gibt es auf einer Karte mehrere Symbole pro ort und Variable, so wurde mehr als eine Variante angegeben; die Symbole sind jedoch nicht mit den individuellen Antworten der einzelnen Informanten zu verwechseln. Informationen darüber, von welchem Informanten an einem ort welche Variante stammt, lassen sich mithilfe der Karten des SBS nicht ermitteln.52 Mit Abb. 9 ist eine originale wortgeographische Karte des SBS abgebildet. An den meisten Orten ist jeweils eine Variante, an manchen jedoch bis zu zwei oder drei verzeichnet. Ähnliche Symbole oder durch Nebenzeichen modifizierte gleiche Symbole stehen für ähnliche Varianten. 52
Dies lässt sich jedoch oft durch einen Blick in die ebenfalls abgedruckten (und demnächst im DSBS einsehbaren) Beleglisten erreichen, in denen die Antworten nach ort und teilweise nach Informant aufgeschlüsselt sind.
Struktur der Daten
73
Abb. 9: originale Punktsymbolkarte 8.80 ‘Kartoffelkraut’ aus dem SBS (Legende: Abb. 10, S. 75).
74
Daten
Für die Erstellung der einzelnen Punktsymbolkarten für den SBS war die Digitalisierung der einzelnen Symbolinformationen erforderlich, d. h. der Informationen darüber, welche(s) Symbol(e) an welchen orten welcher Karte zu drucken war. Die dabei entstandenen Dateien, die nach der Fertigstellung der Bände aufbewahrt wurden, bilden die Datengrundlage für die Untersuchungen in dieser Arbeit. Dies ist mit folgenden Konsequenzen verbunden: –
Die Analysen werden mit interpretierten Daten durchgeführt, denn die reinen Belegdaten wurden bereits interpretativ vorverarbeitet, etwa beim Zusammenfassen der Belege zu Varianten.
–
Die Informationen darüber, welche Gewährsperson für welchen Beleg verantwortlich ist, stehen nicht zur Verfügung, da sie nicht in elektronisch verarbeitbarer Form vorliegen.
–
Es ist zu entscheiden, wie mit den Symbolen bei den Analysen umzugehen ist, beispielsweise wenn zwei Symbole zwar unterschieden werden können, sich aber trotzdem ähneln (d. h. für sprachlich ähnliche Varianten stehen).
Um dem letzten Punkt Rechnung zu tragen, wurden die Daten der Kartierungsdateien nach Kriterien, die im nächsten Abschnitt näher erläutert werden, in lexikalisch sinnvoller Weise klassifiziert, wobei z. B. rein phonetische Unterschiede ignoriert wurden (vgl. 3.2), und in eine SQL-Datenbank übertragen.53 In dieser Datenbank ist für jede Karte jedem der 272 Orte ein Eintrag zugewiesen. Jeder Eintrag enthält eine oder mehrere distinkte Varianten; manchmal ist der Eintrag jedoch, wenn kein Beleg vorliegt, leer. Da die Datenbank keinerlei Informationen darüber enthält, wie viele Gewährspersonen zu einem einzelnen kartierten Symbol beigetragen haben, müssen diese in Ermangelung anderer Anhaltspunkte als gleichwertig behandelt werden: Es ist verzeichnet, ob eine Variante an einem ort aufgezeichnet wurde oder nicht; es gibt jedoch keine Informationen darüber, von welcher Gewährsperson die Varianten stammen, oder wie die relativen Gebrauchsfrequenzen der Varianten an einem ort einzuschätzen sind. In diesem Sinne sind die Einträge binäre Informationen über das Vorkommen von Varianten, die im Rahmen der Reliabilität der erhobenen Daten Auskunft über die dialektale Situation an einem ort geben (zur Verlässlichkeit dieser Informationen s. 4.1). Trotz dieses binären charakters sind in eingeschränktem Maße Rückschlüsse auf relative Frequenzen möglich (vgl. 4.1, 4.2.2). Die SQL-Datenbank stellt das unmittelbare Arbeitsmaterial dar, auf dessen Grundlage alle nachfolgenden Analysen durchgeführt wurden. Aufgrund von technischen Beschränkungen und teilweise unvollständigen Daten konnten nicht alle onomasiologischen Wortkarten des SBS in die Datenbank importiert werden. Das Arbeitskorpus für die Untersuchungen in dieser Arbeit umfasst somit insgesamt 735 lexikalische Variablen. 53
Für die Typisierung der Varianten gilt mein Dank konStantin niehauS; die Ersterstellung der Datenbank wurde von MiChaeL böhM und M atthiaS kugLer durchgeführt (vgl. böhM / kugLer 2006), eine überarbeitete Version davon hat a aron SpettL implementiert. Auch dafür mein herzlicher Dank.
Lexikalische Systematik
75
Abb. 10: Die Legende von Karte 8.80 (‘Kartoffelkraut’) (Abb. 9, S. 73).
3.2 LEXIKALIScHE SySTEMATIK Um die digital vorliegenden Daten des SBS für maschinelle Analysen zugänglich zu machen, war eine Strukturierung der originaldaten erforderlich. Dies wird klar, wenn man sich vor Augen führt, wie die Daten vorliegen: Es handelt sich bei der Datenbank zunächst nur um die Zuordnung von nummern, die für Symbole stehen, zu nummern, die orte repräsentieren. In dieser Form ist sie für eine Auswertung wenig geeignet, weshalb die durch die Kartierer vorgenommene Symboli-
76
Daten
sierung in für die vorliegende Untersuchung sinnvolle Systematik gebracht werden musste. Die nummern, die für die lexikalischen Varianten stehen, sind codes für die kartierten Symbole. Man kann sie im Symbolheft des SBS (1995) nachschlagen. So findet sich etwa unter der Nummer 1 das Symbol , oder unter nummer 4701 . Im Atlas kann man dann in der Legende der jeweiligen Karte das Symbol nachschlagen, für welche lexikalische Variante das Symbol (und somit die Symbolnummer) steht, und kann so die in der Datenbank verzeichneten nummern auf die kartierten Varianten beziehen. Auch für sogenannte Zusatzzeichen gibt es eine Tabelle im Symbolheft. Die Zusatzzeichen sind eine Art diakritische Zeichen, die die Hauptsymbole modifizieren. Sie stehen für bestimmte lexikalische Eigenschaften wie etwa das Vorhandensein eines bestimmten Bestimmungsworts oder Präfixes, oder auch für Metainformationen wie die Qualifikation eines Belegs als „älter“, „richtiger“ o. ä. (vgl. Abb. 10). Sie können über oder unter sowie links oder rechts des Hauptsymbols stehen. Die codes dieser nebensymbole stehen in der Datenbank in separaten Spalten. Eine Variante wird also im Atlas als ein Hauptsymbol mit oder ohne Zusatzzeichen dargestellt. Sowohl Haupt- als auch nebensymbole sind zu einem gewissen Grad ikonisch, d. h. graphisch ähnliche Symbole stehen für lexikalisch ähnliche Varianten. Dies lässt sich am Beispiel von Abb. 10 demonstrieren. Varianten, die den Bestandteil Kraut enthalten, haben ein Dreieckssymbol, Varianten, die den Bestandteil Staude enthalten, haben ein Strichsymbol, und Varianten, deren Bestimmungswort den Bestandteil Erde enthält, haben ein kreisförmiges Zusatzsymbol. Dabei ist zu beachten, dass mitunter auch Varianten durch ähnliche Symbole sozusagen als „verschieden, aber ähnlich“ gekennzeichnet werden, die sich rein lautlich zwar unterscheiden, lexikalisch aber keine Unterschiede aufweisen. (Solche – nur lautlich verschiedenen – Varianten werden üblicherweise in der Legende unter einer fettgedruckten Beschriftung zusammengefasst. Jede fettgedruckte Beschriftung steht somit für eine lexi kalische Variante, auch wenn mit den einzelnen Symbolen abweichende Lautungen unterschieden werden.) Solche rein lautlichen Unterschiede sind also für eine Untersuchung auf lexikalischer Ebene zu ignorieren (vgl. auch goebL 1984, Bd. I, 31). Andererseits sind durchaus vorhandene Ähnlichkeitsbeziehungen zwischen lexikalisch unterscheidbaren Varianten zu berücksichtigen. Dies ist etwa der Fall, wenn zwei Varianten dasselbe Grundwort, aber unterschiedliche Bestimmungswörter oder Präfixe haben, was durch leicht abgewandelte Hauptsymbole oder durch Zusatzsymbole kodiert sein kann. Somit steht man vor der Schwierigkeit, die Haupt- und Nebensymbolcodes jeder Karte in eine lexikalisch sinnvolle ordnung zu bringen, in der folgende Regeln gelten sollten: 1. Rein lautliche (d. h. systematischen Lautentsprechungen folgende) Unterschiede sind zu ignorieren. 2. Die getrennten Systeme der Haupt- und nebensymbolcodes sind in ein geschlossenes System zu integrieren. 3. Lexikalisch unterschiedliche Formen sollen unterscheidbar sein.
77
Lexikalische Systematik
4. Lexikalisch nicht identische, aber ähnliche Formen sollen aufeinander beziehbar sein. Das Variablenbündel aus Hauptsymbol, nebensymbol links, rechts, oben, unten besteht aus theoretisch maximal fünf Dimensionen, die jeweils nominales Datenniveau aufweisen. (Die nummern der Symbolcodes sind bloße Indexe, die eine ordinal- oder Intervallskala vielleicht suggerieren, aber nicht tatsächlich begründen.) Lexikalische Informationen sind, wie im vorausgehenden Absatz bereits angedeutet, nicht einheitlich kodiert; d. h. z. B. das Vorhandensein eines bestimmten Präfixes kann entweder durch eine Abwandlung des Hauptsymbols oder durch ein Zusatzsymbol angegeben sein. Insofern bietet das fünfdimensionale Variablenbündel keine lexikalisch sinnvolle Struktur, da die fünf Symboldimensionen nicht eindeutig auf lexikalische Eigenschaften beziehbar sind. Um eine lexikalisch sinnvolle Datenstruktur zu erzielen, musste das System dahingehend umgebaut werden, dass Punkte 1–4 erfüllt sind. Für die vorliegende Studie wurde dieses Problem durch ein hierarchisches nominalskaliertes System gelöst,54 was eine praktikable und verhältnismäßige Lösung darstellt, auch wenn lexikalisch stringentere und akkuratere Lösungen (z. B. ein mulitvariates System) denkbar sind, was jedoch wieder zu anderen Problemen führen würde. In diesem hierarchischen nominalskalier ten System können zwei Belege auf einer niedrigen Ebene als verschieden gelten, auf einer höheren (= abstrakteren) Ebene aber als zur selben Variante gehörig. So wird unterschiedlichen Graden der Ähnlichkeit Rechnung getragen. In der vorliegenden Studie wurde hierfür von der Vorarbeit der Kartierer Gebrauch gemacht. Diese haben durch die Auswahl der Haupt- und nebensymbole und die Formatierung der Legende (wie etwa das Verwenden von Unterüberschriften) lexikalisch bedingte Einteilungen der Belege in Varianten auf unterschiedlichen Abstraktionsniveaus vorgenommen. Diese Einteilungen wurden nun für die Typisierung der Belege herangezogen. Es ergeben sich drei Ebenen unterschiedlicher Abstraktionsgrade für die Einteilung der Belege in Varianten: rein lautliche Unter schiede werden igno riert Level 1 Level 2 Level 3
lexikalisch relevante Nebensymbole wer den ignoriert
ja ja ja
Unterschiede zwi schen ähnlichen Hauptsymbolen wer den ignoriert nein nein ja nein ja ja
Tab. 1: Die lexikalischen Abstraktionslevels und ihre Kriterien.
Bei Level 1 ist die lexikalische Einteilung am feinsten, ohne dass rein lautliche Unterschiede berücksichtigt würden; ab Level 2 werden in nebensymbolen kodierte lexikalische Informationen ignoriert (meist Präfixe oder Bestimmungswörter, vgl. Abb. 10, S. 75). Auf Level 3 ist die lexikalische Einteilung am gröbsten, indem 54 „We follow general sociolinguistic practice in dividing potentially continuous variation into a number of discrete variants of a linguistic variable.“ (bLythe/Croft 2012, 272)
78
Daten
auch Varianten mit unterschiedlichen Hauptsymbolen als gleich behandelt werden, wenn durch eine graphische Ähnlichkeit auch lexikalische Ähnlichkeit angezeigt ist. Hier sind also jeweils alle lexikalisch miteinander verwandten Varianten zusammengefasst.55 Die Frage, welcher der Ebenen 1 bis 3 bei der Auswertung der Vorzug zu geben ist, lässt sich nicht allgemeingültig beantworten. Während klar ist, dass die Art der Klassifikation immer Einfluss auf die Ergebnisse hat, ist nicht sofort ersichtlich, welche von mehreren möglichen Klassifikationen die beste ist. Abhängig vom Erkenntnisziel kann eine Klassifikation allenfalls besser oder schlechter sein; insofern ist das Erkenntnisinteresse entscheidend bei der Wahl der Klassifikation (vgl. 4.5.4). Das bedeutet, dass es grundsätzlich richtige Klassifikationen nicht gibt, sondern immer nur zweckdienliche:56 Diese Vorsortierung (Filterung) ist eine notwendige und unabdingbare Voraussetzung für die Erstellung der Datenmatrix […] und hat zur Folge, daß die in der Datenmatrix enthaltenen Informationen in einer zunächst nicht näher bestimmbaren Weise aus ‚objektiven‘ (d. h. der Objektwelt verpflichteten) und ‚subjektiven‘ (d. h. dem Taxonomen, bzw. dessen Objektschau oder Theorie verpflichteten) Anteilen besteht. Immerhin geht ja nicht die Objektwelt direkt in die Datenmatrix ein, sondern nur deren theoriegeneriertes Abbild aus der Sicht (ϑεωϱία) des Taxonomen. […] Dazu kommt, daß der teleologische Charakter von Klassifikationen – man kann Klassifikationen nur in Hinblick auf ein gewisses Ordnungsziel erstellen – oft verkannt, bzw. Klassifikationen überhaupt mit Deskriptionen verwechselt werden. Klassifikationen sind demnach stets brauchbar oder unbrauchbar, jedoch nie richtig oder falsch. (goebL 1984, Bd. I, 17)
Der Taxonom ist in unserem Fall also der jeweilige Kartierer, dessen Sicht auf die Daten wir uns zu eigen machen. Die Bearbeiter der wortgeographischen Bände des SBS haben sich lange und intensiv mit den Aufzeichnungen auseinandergesetzt (jede Einzelkarte hat im Schnitt eine Woche Arbeitszeit erfordert), was das Vertrauen darauf rechtfertigt, dass die von ihnen vorgenommenen Klassifikationen lexikalisch sinnvoll sind. Wie die Levels für die jeweiligen Anwendungen und Zielsetzungen zu bewerten sind, wird in Abschnitt 4.5.4 diskutiert.
55
Die Levels 1 bis 3 entsprechen ungefähr den in eine Rangordnung gebrachten „allgemein gültigen Prinzipien der Taxatbildung im lexikalen Bereich“ bei goebL (1984, Bd. I, 34): 1. morphologisch und/oder akzentmäßig voneinander verschiedene Etyma (entspricht Level 1), 2. wortbildungstechnisch voneinander verschiedene Etyma (entspricht Level 2), 3. ganz verschiedene Etyma (entspricht Level 3). 56 h anS goebL (1984, Bd. I, 17–22, 31–37) setzt sich intensiv mit der Problematik der Klassifikation auseinander. Dass auch er zu keinem abschließenden oder auch nur für seine Studie einheitlichen Klassifikationsprinzip kommt, zeigt der Umstand, dass einige der tatsächlich von ihm vorgenommenen Klassifikationen auf „ad hoc gebildeten Taxaten [= Varianten]“ beruhen, wobei goebL entschuldigend hinzufügt, „daß es sich hier um eine in vielen anderen Wissenschaften […] vorhandene und dort auch als solche längst anerkannte crux handelt“ (goebL 1984, Bd. I, 20).
4 METHoDIK The study of variation is necessarily quantitative. ‒ wiLLiaM Labov, „contraction, Deletion, and Inherent Variability of the English copula“
Die bisherige quantitative geolinguistische Forschung war – mit einigen Ausnahmen – wesentlich von dem Interesse geprägt, Dialektgebiete voneinander abzugrenzen. obwohl die Vorstellung des „einheitlichen Mundartgebiets“ seit langem überwunden ist (vgl. baCh 1950, 58–62), herrschen nach wie vor Methoden vor, die auf eine kategoriale Abgrenzung solcher Areale zugeschnitten sind und deren Ergebnisse dadurch innere Homogenität zumindest suggerieren (vgl. 2.3). Versuche, Übergangsgebiete zwischen den Dialektarealen zu erfassen und wiederzugeben,57 sind ein Fortschritt, ändern aber nichts an der grundsätzlichen Fixierung auf die Dialektklassifikation und die damit verbundene Idee des (zumindest im Kern) einheitlichen Mundartgebiets. Gerade die klassifikatorisch geprägte Dialektometrie zwingt ihren Daten die Einteilungsvorstellung geradezu auf: Egal wie die Daten aussehen, solange ein Mindestmaß an räumlicher Autokorrelation gegeben ist (vgl. 2.2.1), kommen zwangsläufig kohärente Dialektgebiete heraus; Informationen über deren interne Struktur und gegenseitige Abhängigkeit werden mit vielen der gängigen Methoden aber unterdrückt. Die Aggregation der Daten verhindert zudem, dass erkennbar wird, welche sprachlichen Phänomene für eine Einteilung verantwortlich sind, und welche möglicherweise sogar gegen sie sprechen, was auch woLfgang putSChke in seiner „Kritik dialektologischer Einteilungskarten“ bemängelt. Da diese Kritik genuin mit der Methode selbst verbunden ist, sind Verbesserungen nur über verfahrensmäßige Änderungen zu erzielen; die Anforderungen hierzu sind weitgehend klar und bestehen in einem Mitführen des sprachlichen Belegs. Dies läuft im Kern auf andere Verfahren hinaus, die nicht die Identität der Sprachdaten[,] sondern die Identität der Verbreitungsflächen benutzen, um so über die Metrisierung von Arealitäten zu klassifikatorischen Aussagen zu gelangen. (putSChke 1993, 428)
Auch Ansätze, die nicht die Einteilung in Dialektgebiete zum Ziel haben, arbeiten so gut wie ausnahmslos aggregativ, weisen also die im Prinzip gleiche Problematik auf. Als Beispiel sei die in Groningen entwickelte Methode genannt, ein dialektales Kontinuum mithilfe von multidimensionaler Skalierung darzustel57
Vgl. z. B. die bekannte Einteilungskarte von peter wieSinger (1983, K. 74.4); in der Dialektometrie ist die quantitative Erzeugung „unscharfer“ ( fuzzy) Einteilungskarten durch die Verwendung des sogenannten „noisy clustering“ möglich geworden (vgl. z. B. nerbonne et al. 2011, 83).
80
Methodik
len (vgl. heeringa 2004, 156–164, 207–211, 266–274; vgl. auch 1.2.2). Zwar ist hier die Vorstellung von Dialektgebieten aufgegeben, solange sie sich nicht von selbst aus dem Kontinuum ‚herausschälen‘ (wie es etwa im Fall des Friesischen bei heeringa [2004, 272] geschieht), was einen gewissen Fortschritt darstellt; die aggregative Sichtweise macht es jedoch nach wie vor unmöglich, quantitativ begründete Aussagen über die Verteilungen einzelner sprachlicher Variablen und ihre Beziehungen untereinander zu machen, ein Kritikpunkt, den auch thereSe Leinonen hervorhebt: […] a drawback of the aggregate measures of linguistic similarity/dissimilarity used in dialectometry is that it is hard to trace back the linguistic features characterizing the linguistic areas that have been detected in the aggregate. Moreover, the aggregate distances can hide varying distributions of dialectal features in the original data. Sometimes different distribution patterns can reveal more about the causes of dialectal variation than an aggregate analysis does. […] While concentrating on the aggregate analysis, dialectometric methods are likely to ignore the different underlying distribution patterns below the aggregate level […]. Aggregate analysis gives a view of the relationships between dialects, but in order to explain the relationships the diffusion patterns are important. (Leinonen 2010, 38)
Eine angemessene Berücksichtigung der Distributionsmuster einzelner Varianten ist nur möglich, wenn man auf aggregative Methoden so weit wie möglich verzichtet und die Identität der sprachlichen Einzeldaten (gemäß der Forderung putSChkeS) bewahrt. Zwar involviert jede Datenanalyse eine gewisse Abstraktion vom Speziellen und eine Ausblendung von Unwesentlichem; dies kann jedoch auch auf andere Weise erfolgen als durch die Aggregation von Unterschieden. Darum ist es erforderlich, einen anderen Blickwinkel einzunehmen, um so andere Fragestellungen angehen zu können als die in der klassischen Dialektometrie verfolgten. Essenziell ist dabei die Verträglichkeit der verwendeten Methoden mit der zugrunde liegenden Theorie. Einer probabilistischen Theorie ist in dieser Arbeit als empirisches Gegenstück eine statistische Methodik gegenübergestellt. Bei den meisten davon handelt es sich um geostatistische Methoden,58 denn nicht nur die Daten selbst, sondern auch ihre geographische Anordnung spielt eine wesentliche Rolle bei den meisten der Verfahren. Als genuin quantitatives Methodenbündel versteht sich die hier propagierte Geostatistische Dialektometrie59 als eine in großen Teilen neue, theoretisch fundierte Methodologie innerhalb der quantitativen Sprachgeographie, die den aggregativen Blickwinkel der klassischen dialektometrischen Verfahren aufgibt und ihn auf die Beziehungen zwischen Varianten und Variablen statt auf die Beziehungen zwischen ortsdialekten richtet.
58
59
Geostatistische Methoden wurden in der Sprachgeographie bislang in nennenswerter Weise v. a. von JaCk grieve eingesetzt (grieve 2009; grieve/SpeeLMan/geeraertS 2011). Weitere Verweise auf geostatistische Verfahren in der bisherigen Forschung finden sich an entsprechender Stelle. „While the essential difference between dialectometry and traditional dialect geography from the start has been the focus on aggregate analysis in dialectometry, the word dialectometry literally means ʻmeasuring dialectʼ. Literally dialectometry could, thus, include any quantitative/computational analysis of dialects.“ (Leinonen 2010, 38)
Der sprachliche Beleg als statistische Stichprobe
4.1
81
DER SPRAcHLIcHE BELEG ALS STATISTIScHE STIcHPRoBE
Die in dieser Studie verwendete Methodik beruht auf einigen Annahmen, die die Daten in Sprachatlanten betreffen. Da solche Atlanten auf Antworten beruhen, die ausgewählte Repräsentanten ausgewählter orte auf ausgewählte Fragen gegeben haben, reflektieren sie nur einen Ausschnitt aus der sprachlichen Realität. Zunächst handelt es sich um räumlich diskrete Messungen, die als Stichproben aus einer (pseudo-)kontinuierlichen60 räumlichen Verteilung genommen wurden.61 Selbst wenn wir annehmen, dass die Belege mehr sind als einfache Stichproben, da ein „Informant als Experte“ (SBS, Bd. 1, 20) für mehr Personen als nur für sich selbst sprechen kann, müssen wir akzeptieren, dass die Daten einem gewissen statistischen ‚Rauschen‘ unterliegen. Mit Hilfe statistischer Methoden können diese Unzulänglichkeiten jedoch ein Stück weit ausgeglichen werden und dadurch eine Annäherung an die angenommene zugrunde liegende Verteilung, für die die Stichproben sprechen sollen, erzielt werden. In der traditionellen Dialektometrie wird versucht, durch die Aggregation vieler Verteilungen ein ‚stärkeres Signal‘ (vgl. nerbonne 2010, 3822) von den Daten zu erhalten, „[in order] to compensate for the noisiness of individual distributions“ (Spruit et al. 2009, 1624). Bei diesem Vorgehen gehen jedoch die Informationen über individuelle Variantenverteilungen verloren, wie im letzten Abschnitt ausgeführt wurde. Eine andere Möglichkeit, das Signal zu stärken, besteht darin, den Blick auf die geographische Umgebung eines orts statt auf andere Variablen zu richten.62 Jedem ort kann man Werte zuweisen, die die geographische Verbreitung der Varianten in seiner Umgebung beschreiben, auch wenn an dem ort selbst keine Belege vorhanden sind. Ein Blick in die nachbarschaft eines ortes gibt uns so Aufschluss über die Verlässlichkeit einzelner Belege. Wenn beispielsweise ein einzelner ‚Ausreißer‘ in einem ansonsten gleichmäßigen Gebiet liegt, so ist es sehr wahrscheinlich, dass eine andere Gewährsperson am selben ort (oder sogar dieselbe Person zu einer anderen Zeit oder in einer anderen Situation) die Variante der umliegenden orte geliefert hätte. Gleichzeitig ist zu erwarten, dass einige wenige Leute der nachbarorte auch mit der Variante des Ausreißers hätten aufwarten können. Dies ist ein sehr einfaches Beispiel, um die Grundannahme zu illustrieren: Je mehr Belege einer bestimmten Variante in 60 Sprache ist nicht kontinuierlich im Raum verteilt, obwohl das vereinfachend oft so dargestellt wird (vgl. z. B. heeringa /nerbonne 2001; vgl. auch Lang 1982, 63), sondern pseudo-kontinuierlich: Die Verteilung der Sprecher oder der Äußerungen im Raum ist punktuell, sie können aber als Realisationen aus einem kontinuierlichen Wahrscheinlichkeitsraum angesehen werden. 61 Zur kartographischen Behandlung von „flächenhaft verteilte[n] diskrete[n] Beobachtungen (Messungen, Zählungen) einer sich kontinuierlich verändernden Erscheinung“ vgl. auch kohLStoCk (2004, 140–141). 62 Das Fehlen des Raumbezugs in der dialektologischen Forschung ist oft beklagt worden: „[…] although traditional dialectology is often (always?) portrayed as one of the earliest forms of geographical linguistics, in fact there is virtually no geographical contribution to the work at all. The role of space is reduced to that of data presentation on a map“ (britain 2002, 607; vgl. auch 2.2).
82
Methodik
der Umgebung eines ortes auftreten, umso wahrscheinlicher ist es, dass diese Variante auch an dem ort selbst vorkommt, auch wenn der dort befragte Informant eine andere angegeben hat. Wenn man die aufgezeichneten sprachlichen Belege einer Variante als Stichproben wertet, so kann man auf der Grundlage ihrer geographischen Verteilung die Wahrscheinlichkeit schätzen, mit der sie an einem bestimmten ort zu erwarten ist. Dies bedeutet, dass mithilfe der Belegdaten der umliegenden orte eine Schätzung der lokalen Auftretenswahrscheinlichkeit einer Variante vorgenommen werden kann. Dies wird durch die Annahme des Fundamental Dialectological Postulate (vgl. 2.2.1) ermöglicht, nach dem die Ähnlichkeit zwischen ortsdialekten in unmittelbarer nähe am höchsten ist. Deshalb bewirken viele abweichende Varianten in der Umgebung eines ortes eine Absenkung der Wahrscheinlichkeit der dort belegten Variante; dieser Beleg ist dann weniger verlässlich. Umgekehrt schwächt dies aber auch die Wahrscheinlichkeit der Varianten der umliegenden orte, da der Ausreißer auch auf sie einen gewissen (wenn auch kleinen) Einfluss hat. So können für jeden Ort und jede Variante Prozentsätze ermittelt werden, die näherungswerte für ihre lokal erwarteten Auftretenswahrscheinlichkeiten angeben. Sie zeigen auch, welche Variante die vorherrschende in einem bestimmten Teilgebiet einer Karte ist, was es erlaubt, die Karte in Dominanzareale von Varianten einzuteilen. Diese dienen als Zwischenschritt für weitergehende Analysen und bieten – sozusagen als nebenprodukt – die Möglichkeit, reproduzierbar und konsistent Flächenkarten aus Punktsymbolkarten zu erstellen. 4.2 Von DER PUnKTSyMBoL- ZUR FLÄcHEnKARTE63 Die abkürzende Redeweise von der Verbreitung von Sprachen oder sprachlichen Erscheinungen läßt uns leicht vergessen, daß Menschen in ganz anderer Weise Raum einnehmen als z. B. Meere, Wüsten etc. Es gehört nun gerade zur Methode der Sprachgeographie, so zu tun, als sei dies nicht der Fall. ‒ Jürgen Lang, „Sprache im Raum“
Der erste Schritt bei der Analyse von Variantendistributionen besteht in der automatisierten Erstellung von Flächenkarten aus den vorverarbeiteten Daten (vgl. 3.2). Flächenkarten, wie sie mit der hier vorgestellten Methode erzeugt werden, stellen Abstraktionen von den punktuell verteilten Belegdaten dar, die sie für die strukturelle Analyse zugänglich machen. Ausgehend von den stichprobenartigen Punktbelegen werden räumliche Dichteverteilungen der Varianten errechnet. Diese Dichteverteilungen und ihre Eigenschaften dienen als quantifizierte Zusam63 Für die hervorragende Zusammenarbeit bei der Entwicklung dieses Verfahrens danke ich JonaS ruMpf.
Von der Punktsymbol- zur Flächenkarte
83
menfassungen der originaldaten, an denen statistische Analyse- und Vergleichsverfahren ansetzen; sie stellen Schätzungen der räumlichen Wahrscheinlichkeitsverteilung der Varianten dar. Es liegt nahe, die Daten, die den Punktsymbolkarten zugrunde liegen (vgl. Abb. 9, S. 73), als Ansammlungen von Punktmustern in der Ebene zu betrachten. Punktmuster sind räumliche Anordnungen von punktweise verteilten Daten, deren Eigenschaften durch die räumliche Statistik erfasst werden können (vgl. z. B. baddeLey et al. 2006; diggLe 2003; iLLian et al. 2008; Stoyan/Stoyan 1994). Die hier vorgestellte Implementierung des geostatistischen Verfahrens der Intensitätsschätzung wurde v. a. durch zwei Ansätze aus der Sprachgeographie inspiriert.64 Von pauL JanSSen (1973) stammt ein Interpolationsverfahren, das geographische Abstände verwendet, um für den nicht erfassten Raum zwischen den Belegorten Variantenvorkommen zu schätzen; haraLd händLer (1977) und CarL Ludwig nauMann (händLer /nauMann 1976) haben eine Methode zur automatischen Isoglossendetektion in Punktsymbolkarten vorgestellt, bei der die sprachliche Eingebundenheit eines ortes in seine Umgebung eine entscheidende Rolle spielt. 4.2.1 Datenseparation und Belegkarten Im ersten Schritt werden die Daten für eine sprachliche Variable in sogenannte Belegkarten für ihre Varianten aufgeteilt. Auf jeder dieser Belegkarten tritt jeweils nur eine einzige Variante auf, und zwar an genau den orten, an denen sie belegt ist. Auf diese Weise erhalten wir Punktmuster des Auftretens für jede Variante. Da es im SBS häufig vorkommt, dass auf einer Punktsymbolkarte mehrere Varianten an einem Ort verzeichnet sind, kommt jeder Variante x für jeden Befragungsort a ein ‚Gewicht‘ wx(a) zu: Ist x die einzige Variante der betrachteten Variablen X, die an ort a auftritt, so erhält sie das Gewicht wx(a) = 1. Andernfalls ist ihr Gewicht gegeben als ihr Anteil an den Gesamtbelegen am ort; d. h., wenn x beispielsweise durch einen von insgesamt drei am ort a verzeichneten Belegen für die Variable 1 Entsprechend wird der Variante x an allen orten, X vertreten ist, so ist wx(a) = ‒. 3 an denen sie in den Belegdaten nicht auftritt, der Wert wx(a) = 0 zugewiesen. Das Gewicht einer Variante x1 der Variablen X am ort a ist somit definiert wie folgt:
wx1 (a) =
rx1 (a) ∑x∈ X rx (a)
(2)
64 Bereits in den 1990er Jahren wurden dialektgeographische Experimente mit der verwandten Kerndichteschätzung durchgeführt. Die Implementierung von Light/k retzSChMar (1996) führte zu Dichtekarten von LAMSAS-Daten (vgl. z. B. k retzSChMar 1996 oder , 02.05.2013), wurde darüber hinaus aber nicht weiter verfolgt. watteL/van r eenen (1995) haben ein Extrapolationsverfahren vorgestellt, das letztlich auch auf Kerndichteschätzung beruht; es wurde aber kaum rezipiert und praktisch nicht weiterentwickelt (vgl. watteL/van r eenen 2010).
84
Methodik
Dabei ist rx(a)
die Zahl der Belege für Variante x am ort a, und
X
die Variable X als Menge der zu ihr gehörigen Varianten.
Die Gewichte sind somit in gewisser Weise Pseudofrequenzen, die die relative Häufigkeit der Belege am Ort angeben. Es handelt sich um eine rudimentäre Schätzung der relativen Gebrauchsfrequenz der jeweiligen Variante im lokalen Sprachgebrauch, die in Ermangelung anderer Informationen alle Belege gleichwertig behandelt.65 Die so in Belegkarten aufgeteilten Daten lassen sich graphisch darstellen, wobei das Gewicht der Variante durch die Farbintensität am jeweiligen Ort visualisiert wird (s. Abb. 11; eine Liste der 272 Aufnahmeorte ist auf S. 247–248 zu finden). Diese Datenseparierung führt zu so vielen Belegkarten, wie Varianten für eine Variable existieren. Im Fall der Karte 8.80 ‘Kartoffelkraut’ sind es auf Level 3 sieben. Die in Abb. 11 in Grau dargestellten relativen Beleghäufigkeiten gliedern sich in fünf Stufen (s. Tab. 2). Es ist zu beachten, dass für die Darstellung ein sogenanntes Voronoi-Mosaik (auch bekannt als Thiessen-Polygone)66 verwendet wird. Dazu wird jedem Datenpunkt die ihn umgebende Fläche zugewiesen, und zwar dergestalt, dass jeder Flächenpunkt dem nächstgelegenen Datenpunkt zugeteilt wird, so dass sich wabenartige Zellen ergeben. Die Kanten zwischen den einzelnen Zellen sind somit durch die Mittellote der Verbindungsstrecken zwischen den Datenpunkten gegeben. Durch diese Darstellungsweise wird die punktuelle Information der einzelnen orte für ihre unmittelbare Umgebung generalisiert,67 d. h. man nimmt eine primitive Schätzung der zu erwartenden Werte in den Zellen anhand ihrer Zentren vor. Der unmittelbare Vorteil besteht darin, aus einer Karte mit punktuellen Informationen eine pseudoexhaustive Flächenkarte zu generieren, was jedoch erst in Abschnitt 4.2.3 richtig zum Tragen kommt. wx (a) = 1 2 3 1 wx (a) = 2
wx (a) =
wx (a) =
1 3
wx (a) = 0
Tab. 2: Legende zu Abb. 11.
65 Im Prinzip das gleiche Verfahren zur Konvertierung von absoluten Beleghäufigkeiten in relative Frequen zen verwenden SpeeLMan/geeraertS (2008, 223–224). 66 Für eine detaillierte Einführung in Voronoi-Tessellationen s. z. B. okabe et al. (2000). 67 Zum Konzept der Generalisierung in der Kartographie s. kohLStoCk (2004, 81–85).
85
Von der Punktsymbol- zur Flächenkarte
17 26
36
43 56 57
44
48
59
58
70
91 109
93
112
110
130 146
145
162
161 176
177
4 20
218
221 222
224
248
260
217
232
257
256
218
258
18
25 36
45
43 56 57
44
48
59
58
70
71
69
92 94
91 109
96 97
93
112
110
111
127
113 114
130 146
145
147
162
161 176
177 191
190 4 20
218 233
246 260
148 149 164
150
179
208
221 222 220
247
237 248
262
209
171
198
211
212
174 172
224 238
226
240 239
241
187
185 199
200
188
201
251 250 265
252 266
229
254
230
189
256
257
258
270 269
Abb. 11c: K. 8.80/Stengel
176
271
177 191
218 233
246 260
148 149 164
150
179
208
221 222 220
247
237
262
198
171
211
212
174 172
224 238
226
240 239
241
187
185
200
188
201
251 250 265
252 266
229
254
230
203
217 231 232
245
243 244 255 256
253
189
202
215
214
213
227 228
242
173 175
186
199
144 160
159
216
249
263
210
225
236
235
248
195 209
157
170
183
197
142
158
156
184
196
223
264 261
180
126 143
140
155 169
168
167
108
107
125
141
138 139
181
90
106 124
121 122
153
182 194
123
154 152
78
89
105
104
136
151
178 192 193
206
234
137
166
165
163
119
118 135
133
207
205
117 134
132 147
162
161
219
259
113 114
102 120
116
131
130 146
145
99
88 87
85 101
68 77
75
74
103
100
67
76
86
83
55
66
64
73
84
82
80 98
65
72
42
54
53
51
50 62
71
115
129
231 232
255
268
111 128
190 217
272 267
110
203
245
243 244
253
109
112
202
215
214
213
227 228
242
173 175
186
216
249
263
210
225
236
235
197
195
223
264 261
196
94 93
127 144 160
159
170
183
182 194
142
157
184
92
158
156
169
168
167
181
143
140
155
153
126
125
141
138 139
96 97
95
52
63
81
79 108
107
106 124
121 122
154 152
90
34
41
40
39
49
61
60
69
29
33
31
48
59 70
91
123
44 58
78
89
105
104
136
151
178 192 193
206
234
180
119 137
135
166
165
163
102
118
134 133
207
205
219
117
131 132
101
120
116 115
129
128
99
88 87
85 103
100
77
75
74
57
68
76
86
83
80 98
73
84
82
81
79 95
72
67
66
64
63
45
43 56
65
62
32
38
37
46
24
23 30
27
26
15
22
21 28
47
55
7 6 14
13
20
35
42
54
53
51
50
61
60
52
271
5
12
11
19
36
41
40
39
49
258
270
3
10
25
31
47 46
257
256
18
16
34
33
38
37
35
255
268
4
9
17
32
29
27
26
24
23 30
28
259
272
8
22
21
20
19
17
232 245
243 244
254
267
2 1
15
4
8 16
217 231
230
253
252 266
7
14
13
12
203 202
215
214
229
189
188
201
200
213
242
241
251
265
6
4 11
173 175
Abb. 11b: K. 8.80/Staude
5
3
10
187
185
269
20
2 9
240
250
263
262
174 172
227 228
226
239
238
264
Abb. 11a: K. 8.80/Kraut 1
224
236
249
248
261
260
271
225
237
247
171
199
212
144 160
186
198
211
142
159
216
223
235
234
246
272
269
221 222
210
209
208
220
233
270
268
267
207
205
197
195
143
158
170
183
182 196
194
125
141
157
184
108
107
126
140
156
169
168
167
166
124
155
153
181
180
178 192 193
206
219
231
259
255
254
266
177 191
154 152
165 179
123
138 139
136
90
106
121 122
137 135
151
150
163
190
245
243 244
253
252
265
263
262
203
230
229
242
241
251 250
264 261
240 239
238
249
227 228
226
176
119
118
134
148 149 164
147
162
161
202
215
214
213
146
117
133
78
89
105
104
120
116 115
130
88
102
68 77
87 103
101
67
66 76
74
85
55
75
86
83
42
54
53
64
73
84
82
41
65
72
100
132
52
62
71
99
131
129
145
189
188
201
200
98
113 114
111 128
173 175
187
185
212
112
110
174 172
216
237
247
246
211
225
236
235
234
210
223
220
233
171
199
93
127
160
186
198
109
144
159
170
183
182
209
157
184
197
126
158
156
169
168
167
166
196
208
91
155
153
181
195
207
205
154 152
180
194
206
219
119
136
94
39
63
80
96 97
95
92
34
33
40
51
50
61
60
81
79
123 124 125 121 122 143 141 138 139 142 140
137 135
178 192 193
191 190
106
59
69
108
107
48
70
90
89
105
104
151
165 179
102
118
134
150
163
101
117
133
148 149 164
147
88 87
85
44 58
78
120
115 132
74
103
100 116
131
129
128
75
86
83
99
113 114
111
127
98
73
84
82
80
96 97
94
72
57
68 77
32
49
46
45
43 56 67
76
30 31
47
55
66
64
63
81
79 95
92
54
53
65
62
71
69
52 51
50
61
60
39
49
47 46
24
23
38
37
35
42
15
22
29
27
26
36
41
40
14
13 21
20 28
25
31 38
37
35
45
34
33
6 12
11
19
17
32
29
27
10 18
16
7
5
3 4
9
8 24
23 30
28
25
15
22
21
20
19
1
14
13
12
11
18
2
6
4
10
8 16
7
5
3 4
9
20
2 1
259 257
258 272
267
270
268 269
271
Abb. 11d: K. 8.80/Stock
Abb. 11 (Fortsetzung auf S. 87): Belegkarten aller sieben Varianten der Karte ‘Kartoffelkraut’ (K. 8.80), Level 3 (Legende: Tab. 2).
86
Methodik
4.2.2 Intensitätsschätzung nachdem in der beschriebenen Weise Belegkarten für alle Varianten einer Karte erstellt worden sind,68 wird für jede der Belegkarten ein sogenanntes Intensitätsfeld geschätzt. Vereinfacht gesagt beschreibt das Intensitätsfeld einer Variante ihre geschätzte Auftretenswahrscheinlichkeit an allen Belegorten.69 In Übereinstimmung mit den Ausführungen in Abschnitt 4.1 kann erwartet werden, dass das Auftreten einer Variante trotz des Fehlens eines entsprechenden Belegs wahrscheinlich ist, wenn die Variante in vielen der umliegenden orte belegt ist. Umgekehrt ist ein einzelner Beleg in einer völlig anders beschaffenen Umgebung mit einiger Wahrscheinlichkeit nur als ‚Ausreißer‘ anzusehen. Die sogenannte Intensitätsschätzung ist ein Verfahren, das es erlaubt, die Wahrscheinlichkeit des Auftretens einer Variante an einem ort in Abhängigkeit von den umliegenden orten zu schätzen. Die Intensität ix(a) einer Variante x an einem ort a ist somit eine Annäherung an die Wahrscheinlichkeit, mit der die Variante dort auftritt. Bei der Intensitätsschätzung tragen die Variantenbelege aller orte zur Intensität an einem einzelnen ort bei, und zwar in Abhängigkeit von ihrer Distanz zu diesem ort. Ein zu einem ort ai benachbarter ort aj mit Variantengewicht wx(aj) = 1 trägt also dazu bei, die Intensität von Variante x am ort ai zu erhöhen. Ist aj nicht benachbart, sondern weiter entfernt, ist sein Einfluss entsprechend kleiner. Ebenso ist der Einfluss kleiner (oder sogar der Intensität von x abträglich), wenn das Gewicht wx(aj) nicht 1, sondern evtl. nur ‒12 oder ‒13 ist. Die Verwendung von trudgiLLS (1974, 234–235) Methode zur Berechnung des Einflusses zweier Orte aufeinander (vgl. 2.1.3.3, 2.2.2) ist hier nicht möglich. Die im Rahmen von trudgiLLS Diffusionsmodell aufgestellte Gleichung beschreibt die Stärke des Einflusses eines Ortes auf einen anderen in Abhängigkeit von deren Bevölkerungszahlen. Die Intensitätsschätzung soll jedoch nicht Diffusionsvorgänge simulieren, sondern geht von den Aussagen einiger weniger Gewährspersonen pro ort aus, um deren Reliabilität gegenseitig zu stabilisieren. Würde man den Einfluss in Übereinstimmung mit trudgiLL unter Einbeziehung der Bevölkerungszahl bestimmen, so würden die Belege von Gewährspersonen aus bevölkerungsreichen orten drastisch überbewertet: Der bevölkerungsreichste ort im Untersuchungsgebiet, Augsburg, hat etwa nur einen Informanten, der deswegen nicht zuverlässiger ist als ein Informant aus einem kleinen Dorf. Stattdessen wird hier eine sogenannte Kernfunktion verwendet, um die statistische Relevanz zweier orte füreinander zu bestimmen. Eine Kernfunktion gibt an, wie stark der Einfluss in Abhängigkeit von der Entfernung ist; die Bevölkerungszahl spielt hierbei keine Rolle. Auch die Anzahl an Informanten pro ort wird nicht berücksichtigt, da nicht klar ist, welcher Beleg von wie vielen Informanten stammt (vgl. 3.1). Dabei ist zu entscheiden, in welcher Art und Weise der Einfluss mit wachsender Entfernung abfällt (z. B. linear oder quadratisch), und wie schnell 68 Es werden nicht jedes Mal tatsächlich die Karten erstellt, die lediglich eine Visualisierung sind, aber es werden jedes Mal die Daten in der dargestellten Weise separiert. 69 Die Intensität lässt sich theoretisch für alle beliebigen Punkte im Raum berechnen, nicht nur für die Belegorte (vgl. S. 90, Abb. 14, S. 92).
87
Von der Punktsymbol- zur Flächenkarte
17 26
36
43 56 57
44
48
59
58
70
94
91 109
93
112
110
130 146
145
176
177
207
20
4
206
205
219 218
224
203
217
233
259
255
254
218
245
257
256
258
246
272 270
268
267
260
271
269
2 10
8 18
16
36
57
45 44
70
92 94
91 109
96 97
93
112
110
111
127
147
162
161 176
177 191
190 4 20
218 233
246 260
150
179
208
247
237 248
262
238
249 264
261
224
236
235
263
157
265
198
211
212
226
240
252 266
271
174 172
187
185 199
200
241
227 228 229
242
254
173 175 188
201
230
203
217 231 232
245
243 244 255 256
253
189
202
215
214
213
144 160
171 186
183
197
251 250
258
126
159
170
184
239
257 270
158
156
169
168
167
225
256 268
143 142
216
223
255
272 267
108
107
125
141 140
155
153
181
210
254 253
90
106 124
121 122
154 152
195 209
123
138 139
151
196
252 266
259
78
89
105
104
136
182 194
206
234
180
119 137
178 192 193
221 222 220
102
118
166
165
163
207
205
219
148 149 164
88
103
135
133
265
232 245
243 244
68 77
87
85 101
117 134
132
251 250
229
242
217 231
67
66
75
74
120
116
131
130 146
145
99
263
241
230
55
76
86
83 100
113 114
73
84
82
115
129
128
98
65
72
80
262
240 239
227 228
42
54
64
63
81
79 95
41
53
51
62
71
69
52
50
61
60
248
264 261
224 238
249
226
203
215
214
213
189
202
34
33
40
39
49 48
59
58
247
212
188
201
31
47 46
225
236 237
211
200
216
223
220
235
210
187
185 199
24
23 32
38
37
35
43 56
22
29
27
26
209
198
173 175
15
30
28
25
221 222
197
174 172
7
21
20
19
17
208
171 186
6 14
13
12
11
206
196 195
144 160
159
170
183
182 194
157
184
178
142
158
156
169
168
167
181
126 143
140
155
153
108
107
125
141
138 139
151 152
124
121 122
136
90
106
Abb. 11f: K. 8.80/Pflichter.
5
3 4
9
180
123
154
166
165 179
192 193
234
137 135
78
89
105
104
269
Abb. 11e: K. 8.80/Rebe. 1
150
119
118
134 133
207
205
219
231 232
253
266
177 191
190
117
115
163
88
102
68 77
87
120
116
148 149 164
86
101
67
66 76
74
85
55
75
103
100
132 147
162
176
189
215
243 244
146
84
42
54
53
64
73
83
41
65
72
82
99
113 114
130
161
98
52
62
71
80
131
129
202
230
229
242
241
252
265
263
262
173 175 188
201
214
227 228
251 250
264
260
240
249
248
261
187
200
213
111
145
174 172
185 199
212
226
239
238
237
247
246
211
225
236
235
234
171
198
110
128
160
186
216
223
220
233
210
209
208
221 222
197
195
144
159
170
183
182 196
194
112
127
142
157
184
93
158
156
169
168
167
166 181
180
109
143
140
155
153
126
125
141
138 139 154
178 192 193
191 190
121 122
136
152
165 179
119 137
135
94
91 124
96 97
39
63
81
79 95
92
34
33
40
51
50
61
60
69
108
107
59
32 31
48
70
90
106
123
44 58
78
89
105
104
151
150
163
102
118
134 133
148 149 164
147
162
161
117
115 132
101
120
116
131
129
128
88 87
85 103
100
99
113 114
111
127
98
74
57
68 77
75
86
83
80
96 97
73
84
82
81
79 95
92
72
67
66 76
30
49
46
45
24
23
38
37 47
55 43 56
65 64
63
26
15
22
29
27
35
42
54
53
62
71
69
52 51
50
61
60
39
49
47 46
36
41
40
14
13 21
20 28
25
31 38
37
35
45
34
33
6 12
11
19
17
32
29
27
10 18
16
7
5
3 4
9
8 24
23 30
28
25
15
22
21
20
19
1
14
13
12
11
18
2
6
4
10
8 16
7
5
3 4
9
20
2 1
259 257
258 272
267
270
268 269
271
Abb. 11g: K. 8.80/-laub. Abb. 11 (Fortsetzung): Belegkarten aller sieben Varianten der Karte ‘Kartoffelkraut’ (K. 8.80), Level 3 (Legende: Tab. 2, S. 84).
88
Methodik
er abfällt. Um Ersteres festzulegen, muss ein geeigneter Kerntyp gewählt werden, wie er in der einschlägigen Literatur zu finden ist (s. z. B. SiLverMan 1986). Häufig wird der sogenannte zweidimensionale Normalverteilungskern verwendet, bei dem der Einfluss nach einem in unmittelbarer Umgebung des Ortes zunächst langsamen Rückgang stark abfällt, aber nie ganz null wird. Es handelt sich hierbei um die sogenannte ‚Gauß-Glocke‘:
Abb. 12: normalverteilungskern.
Die Ähnlichkeit des normalverteilungskerns mit der umgekehrten S-Kurve in Abschnitt 2.1.3.3 (Abb. 5, S. 53) ist offensichtlich. In beiden Fällen ist der Einfluss im unmittelbaren Umfeld des ausstrahlenden ortes groß, um dann schnell abzufallen und schließlich sanft auszulaufen, obwohl leicht unterschiedliche Dinge dargestellt sind: Der Kern in Abb. 12 stellt nicht den Verlauf einer Diffusion im Raum dar, sondern die Relevanz, die die Entfernung für die Einbeziehung eines Beleges in die Schätzung hat. Die Ähnlichkeit ist dennoch nicht zufällig: Die Kernfunktion stellt eine Einschätzung der Aussagekraft der Informanten eines ortes für seine Umgebung dar, die letztlich durch räumliche Diffusionsvorgänge begründet ist. Der zweidimensionale Normalverteilungskern ist definiert durch die Formel
KGauß (d,h) =
1 e 2π
1 d ∙ 2 h
2
,
(3)
wobei d die Entfernung bezeichnet und h die sogenannte Bandbreite, die angibt, wie schnell bzw. wie stark der Einfluss mit der Entfernung abnimmt. Mit größerer Bandbreite wird die Glocke flacher, mit kleinerer steiler. Es muss also für die Bandbreite eine geeignete Wahl getroffen werden. Möglichkeiten, eine ‚optimale‘ Bandbreite automatisch zu bestimmen, werden in Abschnitt 4.5.1 besprochen. Auch für die Kernfunktion gibt es verschiedene Kandidaten; einige davon werden in Abschnitt 4.5.2 vorgestellt.70
70
Für die nachfolgenden Beispiele wurde der sogenannte K3-Kern (vgl. 4.5.2) und ein automatisches Verfahren zur Bandbreitenbestimmung namens CL-Methode (vgl. 4.5.1) verwendet.
Von der Punktsymbol- zur Flächenkarte
89
Nach Spezifizierung von Kernfunktion und Bandbreite kann ein sogenannter zweidimensionaler Kerndichteschätzer formuliert werden, mit dem die Intensität einer Variante an einem ort geschätzt wird.71 An dieser Stelle werde ich nur kurz auf die für die nachfolgenden Untersuchungen relevanten Aspekte eingehen. Der Kerndichteschätzer ux(a1) für die Intensität von Variante x am ort a1 ist definiert als
ux (a1 ) =
K(d(a1, a),h) ⋅ wx (a) .
(4)
a∈ A
Dabei steht A für die Menge der Erhebungsorte und d(a1,a) für die geographische Distanz zwischen den orten a1 und a. Kernfunktion und Bandbreite sind durch K bzw. durch h bezeichnet. Durch den Kerndichteschätzer wird das Auftretensgewicht wx(a) eines jeden Ortes a ∈ A nach Maßgabe von Kern und Bandbreite im Raum ausgebreitet, so dass auch der zu untersuchende ort a1 einen Teil von wx(a) erhält. Von weiter entfernten orten erhält a1 also bei gleichem wx(a) einen kleineren Anteil als von näheren. Umgekehrt fällt der Anteil auch dann kleiner aus, wenn a zwar nicht so weit entfernt, sein Auftretensgewicht wx(a) aber kleiner ist. Den Schätzwert für die Intensität von Variante x am ort a1 erhält man, indem man diese von allen orten erhaltenen Anteile aufsummiert. Die Summe der Schätzwerte aller Varianten einer Variablen muss nun auf 1 normiert werden, u. a. um im Sinne der Vergleichbarkeit der Werte unerwünschte Randeffekte zu vermeiden: Werden die Werte nicht normiert, so sind die Werte im Zentrum der Karte systematisch höher als an den Rändern, was daran liegt, dass zentralere orte mehr nähere nachbarn haben als am Rand liegende, und so in der Summe mehr größere Anteile bekommen. Die normierung stellt sicher, dass ein niedrigerer Intensitätswert nur aufgrund der Position auf der Karte ausgeschlossen ist. Somit ergibt sich für die Intensität ix1(a) einer Variante x1 am ort a:
ix1 (a) =
ux1 (a) ∑x∈ X ux (a)
(5)
Ermittelt man die Intensität ix(a) für alle orte a ∈ A, so kann man das Intensitätsfeld einer Variante x graphisch darstellen. Zu diesem Zweck geht man ähnlich vor wie bei den Belegkarten (Abb. 11, S. 85, 87): Bei den Belegkarten wurde wx(a) kartiert, bei den Intensitätskarten wird nun ix(a) kartiert. Das bedeutet, die Karte mit den ortspunkten wird in Voronoi-Zellen zerlegt, die sodann mit einem Grauton eingefärbt werden, der durch den Intensitätswert von Variante x am jeweiligen ort bestimmt ist. Die Intensitätswerte können nicht nur diskrete Werte annehmen wie das Auftretensgewicht wx(a) (vgl. Tab. 2, S. 84), sondern jeden beliebigen Wert zwischen 0 und 1.
71
Detaillierte Darstellungen der Methoden der Kerndichteschätzung finden sich z. B. in SCott (1992) und SiLverMan (1986).
90
Methodik
Abb. 13a zeigt das Intensitätsfeld der Variante Kraut der Variablen ‘Kartoffelkraut’ auf Level 3. Salopp ausgedrückt handelt es sich hierbei um eine geglättete Version von Abb. 11a (S. 85). Die Grauwerte visualisieren die Intensitätswerte der Variante Kraut, die für jeden Ort das Auftreten von Kraut am ort selbst und in seiner Umgebung angeben, wobei die Ausdehnung dessen, was noch als Umgebung gilt, in ‚unscharfer‘ Weise durch die Bandbreite spezifiziert ist; hier beträgt die Bandbreite 15,0 km. Wie oben angedeutet, wurde die Bandbreite als optimal für die Karte ‘Kartoffelkraut’ bestimmt (hier mit der sogenannten CL-Methode, vgl. 4.5.1). Die Intensitäten können, wie bereits erwähnt, als die aus den Belegdaten geschätzten Auftretenswahrscheinlichkeiten der Variante am jeweiligen Ort interpretiert werden (was eine Verbesserung im Vergleich zu den in Abschnitt 4.2.1 eingeführten Variantengewichten darstellt, da sie auf einer durch geographische Relationen informierten Schätzung beruhen). Am ehesten würde man Kraut demnach im nordosten zu hören bekommen, wobei die Wahrscheinlichkeit nach Süden hin und etwas schwächer nach Westen hin abnimmt. Dort sind auch bzw. vor allem andere Varianten gebräuchlich, wie ein Blick auf die originale Punktsymbolkarte (Abb. 9, S. 73) bestätigt, auf der Kraut als gestricheltes Dreieckssymbol ( ) dargestellt ist (vgl. Abb. 10, S. 75). In den annähernd weißen Zellen ist die Intensität und damit die geschätzte Wahrscheinlichkeit von Kraut nahezu null. Die Intensitätsschätzung wird für alle Varianten einer Variablen durchgeführt. Abb. 13 zeigt die geschätzten Intensitätsfelder für alle Varianten der Beispielkarte ‘Kartoffelkraut’ (K. 8.80). Der direkte Vergleich mit Abb. 11 (S. 85, 87) führt das Verhältnis zwischen Vorkommens- und Intensitätskarten vor Augen. Die Intensitäten stark vertretener und kompakt verteilter Varianten akkumulieren sich zu dunkelgrauen Feldern, während vereinzelt auftretende Varianten so stark geglättet werden, dass sie teilweise kaum mehr auszumachen sind (z. B. Abb. 13d: Variante Stock). Die Intensität wurde hier nur für die 272 Belegorte geschätzt, was für die Untersuchungen in dieser Arbeit ausreichend ist. Die Intensität ist auch stufenlos für die gesamte Fläche bestimmbar, indem man die Formeln (4) und (5) (S. 89) auf alle Punkte in der Fläche anwendet. Durch eine solche Interpolation kann man Auftretenswahrscheinlichkeiten von Varianten auch für orte schätzen, die nicht Teil der Erhebung waren (vgl. MeSChenMoSer /pröLL 2012a), was ein wertvolles Hilfsmittel für das Füllen von Datenlücken und Vervollständigung des ortsnetzes darstellen kann.72 Abb. 14 (S. 92) zeigt eine solche kontinuierliche Intensitätskarte.
72 Zu diesem Zweck wird das Verfahren bereits mit Gewinn von yveS SCherrer (2010; 2011) und owen r aMbow (SCherrer /r aMbow 2010a; 2010b) angewandt. Ähnliche stufenlos interpolierte Intensitätskarten werden auch in watteL/van r eenen (1995; 2010) generiert.
91
Von der Punktsymbol- zur Flächenkarte
17 26
36
43 56 57
44
48
59
58
70
91 109
93
112
110
130 146
145
162
161 176
177
20
4
221 222
218
225 224
236
232
257
256
218
258
269
18
25 36
45
43 56 57
44
48
59
58
70
71
69
92 94
91 109
96 97
93
112
110
111
127
113 114
130 146
145
147
162
161 176
177 191
190 4 20
218 233
246 260
148 149 164
150
179
208
221 222 220
247
237 248
262
209
171
198
211
212
174 172
224 238
226
240 239
241
187
185 199
200
188
201
251 250 265
252 266
229
254
230
189
256
257
258
270 269
Abb. 13c: K. 8.80/Stengel
176
271
177 191
218 233
246 260
148 149 164
150
179
208
221 222 220
247
237
262
198
171
211
212
174 172
224 238
226
240 239
241
187
185
200
188
201
251 250 265
252 266
229
254
230
203
217 231 232
245
243 244 255 256
253
189
202
215
214
213
227 228
242
173 175
186
199
144 160
159
216
249
263
210
225
236
235
248
195 209
157
170
183
197
142
158
156
184
196
223
264 261
180
126 143
140
155 169
168
167
108
107
125
141
138 139
181
90
106 124
121 122
153
182 194
123
154 152
78
89
105
104
136
151
178 192 193
206
234
137
166
165
163
119
118 135
133
207
205
117 134
132 147
162
161
219
259
113 114
102 120
116
131
130 146
145
99
88 87
85 101
68 77
75
74
103
100
67
76
86
83
55
66
64
73
84
82
80 98
65
72
42
54
53
51
50 62
71
115
129
231 232
255
268
111 128
190 217
272 267
110
203
245
243 244
253
109
112
202
215
214
213
227 228
242
173 175
186
216
249
263
210
225
236
235
197
195
223
264 261
196
94 93
127 144 160
159
170
183
182 194
142
157
184
92
158
156
169
168
167
181
143
140
155
153
126
125
141
138 139
96 97
95
52
63
81
79 108
107
106 124
121 122
154 152
90
34
41
40
39
49
61
60
69
29
33
31
48
59 70
91
123
44 58
78
89
105
104
136
151
178 192 193
206
234
180
119 137
135
166
165
163
102
118
134 133
207
205
219
117
131 132
101
120
116 115
129
128
99
88 87
85 103
100
77
75
74
57
68
76
86
83
80 98
73
84
82
81
79 95
72
67
66
64
63
45
43 56
65
62
32
38
37
46
24
23 30
27
26
15
22
21 28
47
55
7 6 14
13
20
35
42
54
53
51
50
61
60
52
271
5
12
11
19
36
41
40
39
49
258
270
3
10
25
31
47 46
257
256
18
16
34
33
38
37
35
255
268
4
9
17
32
29
27
26
24
23 30
28
259
272
8
22
21
20
19
17
232 245
243 244
254
267
2 1
15
4
8 16
217 231
230
253
252 266
7
14
13
12
203 202
215
214
229
189
188
201
200
213
242
241
251
265
6
4 11
173 175
Abb. 13b: K. 8.80/Staude
5
3
10
187
185
269
20
2 9
240
250
263
262
174 172
227 228
226
239
238
264
Abb. 13a: K. 8.80/Kraut 1
224
236
249
248
261
260
271
225
237
247
171
199
212
144 160
186
198
211
142
159
216
223
235
234
246
272 270
268
267
221 222
210
209
208
220
233
259
255
254 253
266
207
205
197
195
143
158
170
183
182 196
194
125
141
157
184
108
107
126
140
156
169
168
167
166
124
155
153
181
180
178 192 193
206
219
231
245
243 244
177 191
154 152
165 179
123
138 139
136
90
106
121 122
137 135
151
150
163
190 217
230
229
242
241
252
265
263
262
227 228
251 250
264
260
240
249
248
261
203 202
215
214
176
119
118
134
148 149 164
147
162
161
189
188
201
200
213
212
226
239
238
237
247
246
211
187
199
146
117
133
78
89
105
104
120
116 115
130
88
102
68 77
87 103
101
67
66 76
74
85
55
75
86
83
42
54
53
64
73
84
82
41
65
72
100
132
52
62
71
99
131
129
145
173 175
98
113 114
111 128
174 172
185
198
112
110
160
186
216
223
235
234
210
209
220
233
197
93
127
159
170
183
182 196
208
157
184
109
144
171
169
168
167
166
126
158
156
155
153
181
195
207
205
154 152
180
194
206
219
119
136
94
39
63
80
96 97
34
33
40
51
50
61
60
81
79 95
92 91
123 124 125 121 122 143 141 138 139 142 140
137 135
178 192 193
191
106
59
69
108
107
48
70
90
89
105
104
151
165 179
102
118
134
150
163
190
117
133
148 149 164
147
101
44 58
32
49
46
45
78
120
115 132
88 87
85 103
100 116
131
129
128
74
57
68 77
75
86
83
99
113 114
111
127
98
73
84
82
80
96 97
94
72
67
66 76
30 31
47
55 43 56
65 64
63
81
79 95
92
54
53
62
71
69
52 51
50
61
60
39
49
47 46
24
23
38
37
35
42
15
22
29
27
26
36
41
40
14
13 21
20 28
25
31 38
37
35
45
34
33
6 12
11
19
17
32
29
27
10 18
16
7
5
3 4
9
8 24
23 30
28
25
15
22
21
20
19
1
14
13
12
11
18
2
6
4
10
8 16
7
5
3 4
9
20
2 1
259 257
258 272
267
270
268 269
271
Abb. 13d: K. 8.80/Stock
Abb. 13 (Fortsetzung auf S. 93): Intensitätskarten aller sieben Varianten der Karte ‘Kartoffelkraut’ (K. 8.80), Level 3. Parameter: K3-Kern, h = 15,0 (CL).
92
Methodik
2
1
3
9
5
4
10 18
16
25
59
60
58
94
109
112
110
113
111
127
115
145
147
176
179
177 191
165
163
192
193
204 219 218 233
221 220 234
222
247
248 264
261 260
237
262
263
211
209 225
226
238
239 251
250
198
227
157
253
266
160
159
171
174
170
172
173
186 188
187
202
215
214
216
228
267
217 231
230
232
243
256 268 269
245
244
255
254
175 189 203
201
200
199 213
242
241
144
142
158
185
252 265
140
155 169
212
143
141
139 156
126
229
240
236 249
246
210
223
153
183
197
195
208
224 235
182
196
194
207
154
108
107
125
122
138
184
180
178
123 124
121
137
167 168
181
190 205 206
166
90
106
104
120
136
152
150
149 164
162
161
151
148
105
102 119
118 135
133
78
89
87 103
101
117
88
86
68
77
76
75
74
85
83
134
132
130 146
116
114
131
129
128
84
100
99
98
97
93
73
82
55 67
66
64
72
80
96
95
92 91
62
71
81
54
53 65
63
70 69 79
52 51
42
41
40
50
61
34
33
31
49 48
44
57
23 32
29
39
47
24
22
38
37
46
45
43 56
15
30
28
27
26 36
35
7
14
21
20
19
17
6 13
12
11
8
259 257
270
258 272 271
Abb. 14: Exhaustiv geschätztes Intensitätsfeld der Variante Kraut der Karte ‘Kartoffelkraut’ (K. 8.80).
4.2.3 Gradierte Flächenkarten Für jeden Befragungsort im Untersuchungsgebiet liegen nun Intensitäten für alle Varianten vor. Jeder Ort besitzt dadurch ein Variantenprofil, das aus Variantenanteilen besteht, die für eine Variable zusammen 100 % ergeben. Im nächsten Schritt werden Flächenkarten aus den geschätzten Intensitätsfeldern erstellt.73 Dazu wird jeder Ort derjenigen Variante zugewiesen, die dort die höchste geschätzte Intensität hat, da diese Variante diejenige ist, deren Auftreten am entsprechenden Ort am wahrscheinlichsten ist. Ich bezeichne sie als die jeweils „dominante“ Variante. Die dominante Variante der Variablen X m am ort a wird m (a) bezeichnet. Der Grad der Dominanz (bezeichnet durch im Folgenden als xmax 73 Diese Flächenkarten sind vereinfachte Visualisierungen von geographischen Dialektdaten. Es gibt gewiss ausgefeiltere Methoden, um sprachliche Daten auf einer Karte abzubilden (s. z .B. eLSpaSS/könig 2008; pröLL 2011). Die hier verwendeten Flächenkarten sollen jedoch in erster Linie zur Einsichtnahme in die Ergebnisse des Verfahrens dienen; für eine klassische qualitative Interpretation sind sie nicht detailliert genug. Die weiteren Analysen erfolgen mit den vorverarbeiteten Daten, auf denen die Karten beruhen, nicht mit den Karten selbst. Sie sind aber reproduzierbar erzeugbar und bilden Grundstrukturen der Karten anschaulich ab.
93
Von der Punktsymbol- zur Flächenkarte
17 26
36
43 56 57
44
48
59
58
70
94
91 109
93
112
110
130 146
145
176
177
207
20
4
206
205
219 218
224
203
217
233
259
255
254
218
245
257
256
258
246
272 270
268
267
260
271
269
2 10
8 18
16
36
57
45 44
70
92 94
91 109
96 97
93
112
110
111
127
147
162
161 176
177 191
190 4 20
218 233
246 260
150
179
208
247
237 248
262
238
249 264
261
224
236
235
263
157
265
198
211
212
226
240
252 266
271
174 172
187
185 199
200
241
227 228 229
242
254
173 175 188
201
230
203
217 231 232
245
243 244 255 256
253
189
202
215
214
213
144 160
171 186
183
197
251 250
258
126
159
170
184
239
257 270
158
156
169
168
167
225
256 268
143 142
216
223
255
272 267
108
107
125
141 140
155
153
181
210
254 253
90
106 124
121 122
154 152
195 209
123
138 139
151
196
252 266
259
78
89
105
104
136
182 194
206
234
180
119 137
178 192 193
221 222 220
102
118
166
165
163
207
205
219
148 149 164
88
103
135
133
265
232 245
243 244
68 77
87
85 101
117 134
132
251 250
229
242
217 231
67
66
75
74
120
116
131
130 146
145
99
263
241
230
55
76
86
83 100
113 114
73
84
82
115
129
128
98
65
72
80
262
240 239
227 228
42
54
64
63
81
79 95
41
53
51
62
71
69
52
50
61
60
248
264 261
224 238
249
226
203
215
214
213
189
202
34
33
40
39
49 48
59
58
247
212
188
201
31
47 46
225
236 237
211
200
216
223
220
235
210
187
185 199
24
23 32
38
37
35
43 56
22
29
27
26
209
198
173 175
15
30
28
25
221 222
197
174 172
7
21
20
19
17
208
171 186
6 14
13
12
11
206
196 195
144 160
159
170
183
182 194
157
184
178
142
158
156
169
168
167
181
126 143
140
155
153
108
107
125
141
138 139
151 152
124
121 122
136
90
106
Abb. 13f: K. 8.80/Pflichter
5
3 4
9
180
123
154
166
165 179
192 193
234
137 135
78
89
105
104
269
Abb. 13e: K. 8.80/Rebe 1
150
119
118
134 133
207
205
219
231 232
253
266
177 191
190
117
115
163
88
102
68 77
87
120
116
148 149 164
86
101
67
66 76
74
85
55
75
103
100
132 147
162
176
189
215
243 244
146
84
42
54
53
64
73
83
41
65
72
82
99
113 114
130
161
98
52
62
71
80
131
129
202
230
229
242
241
252
265
263
262
173 175 188
201
214
227 228
251 250
264
260
240
249
248
261
187
200
213
111
145
174 172
185 199
212
226
239
238
237
247
246
211
225
236
235
234
171
198
110
128
160
186
216
223
220
233
210
209
208
221 222
197
195
144
159
170
183
182 196
194
112
127
142
157
184
93
158
156
169
168
167
166 181
180
109
143
140
155
153
126
125
141
138 139 154
178 192 193
191 190
121 122
136
152
165 179
119 137
135
94
91 124
96 97
39
63
81
79 95
92
34
33
40
51
50
61
60
69
108
107
59
32 31
48
70
90
106
123
44 58
78
89
105
104
151
150
163
102
118
134 133
148 149 164
147
162
161
117
115 132
101
120
116
131
129
128
88 87
85 103
100
99
113 114
111
127
98
74
57
68 77
75
86
83
80
96 97
73
84
82
81
79 95
92
72
67
66 76
30
49
46
45
24
23
38
37 47
55 43 56
65 64
63
26
15
22
29
27
35
42
54
53
62
71
69
52 51
50
61
60
39
49
47 46
36
41
40
14
13 21
20 28
25
31 38
37
35
45
34
33
6 12
11
19
17
32
29
27
10 18
16
7
5
3 4
9
8 24
23 30
28
25
15
22
21
20
19
1
14
13
12
11
18
2
6
4
10
8 16
7
5
3 4
9
20
2 1
259 257
258 272
267
270
268 269
271
Abb. 13g: K. 8.80/-laub Abb. 13 (Fortsetzung): Intensitätskarten aller sieben Varianten der Karte ‘Kartoffelkraut’ (K. 8.80), Level 3. Parameter: K3-Kern, h = 15,0 (CL).
94
Methodik
m (a)) entspricht also dem Grad der Präferenz für die dominante Variante an eiimax nem ort, die durch m (a) (a) = max ix (a) im max(a) = ix max m
x∈ X
(6)
gegeben ist. Indem jeder Befragungsort genau einer Variante – der jeweils dominanten – zugewiesen wird, wird das Untersuchungsgebiet in Dominanzgebiete der einzelnen Varianten zerlegt. Ein solches Dominanzgebiet ist definiert als die Menge der orte, an denen eine Variante x ∈ X m die dominante ist (bezeichnet durch Ax): m (a) = x} Ax = {a| x max
(7)
Dass man nun tatsächlich von „Flächenkarten“ sprechen kann, wird zum einen durch die Voronoi-Tessellation ermöglicht (vgl. 4.2.1), die jeden Punkt der Fläche einem Belegort zuweist und so zu einer exhaustiven Aufteilung der Grundfläche führt; zum anderen sind durch die Intensitätsschätzung die Vorkommensgebiete der Varianten nicht mehr so zersplittert wie etwa in Abb. 11 (S. 85, 87), sondern eher glatt und zusammenhängend wie in Abb. 13 (S. 91, 93). Die Grenzen zwischen den Gebieten ergeben sich entlang der Kanten der Voronoi-Zellen, an denen die Dominanz von einer Variante zu einer anderen kippt. Abb. 15 (im Anhang, S. 250) zeigt die Flächenkarte für ‘Kartoffelkraut’ mit den angegebenen Parametern. Auch für orte, an denen aus verschiedenen Gründen kein Beleg vorliegt, ist nun ein Schätzwert vorhanden (in diesem Fall z. B. für Augsburg [ort 122]; vgl. Abb. 9, S. 73). Verschiedene Varianten sind durch verschiedene Farbtöne dargestellt; das Gebiet der Variante Kraut ist rot markiert. Grenzen zwischen Gebieten sind orange gekennzeichnet. obwohl es auf Level 3 sieben verschiedene Varianten gibt, sind hier nur fünf Gebiete zu sehen. Dies ist dadurch zu erklären, dass die restlichen zwei Varianten an keinem der Befragungsorte dominant sind. Mit anderen Worten: Diese Varianten kommen nicht häufig genug vor oder sind nicht kompakt genug angeordnet, um ihre eigenen Gebiete auszubilden. Diese Varianten bezeichne ich im Kontrast zu den dominanten als „nicht-dominant“:74 Sie sind vorhanden, treten aber an der Oberfläche nicht in Erscheinung. Zusätzlich zur Kennzeichnung der Variantenzugehörigkeit durch die Farbwahl ist hier die Helligkeit der einzelnen Voronoi-Zellen variiert. Es handelt sich um eine „gradierte Flächenkarte“ (vgl. auch k ronenfeLd 2005; 2007), die Abstufungen in der Zugehörigkeit von ortspunkten zu Flächen zulässt. Die Farbintensität, mit der eine Zelle eingefärbt ist, gibt den Grad der Dominanz der jeweiligen
74
naheliegend wäre auch – in Anlehnung an die biologische Terminologie – die Bezeichnung rezessiv. Da diese jedoch auch die nicht intendierte Bedeutung ‘im Rückgang begriffen’ hat, vermeide ich sie.
Von der Punktsymbol- zur Flächenkarte
95
Variante an.75 Je höher die Dominanz, desto dunkler die Farbe. Dazu wird die m (a) (vgl. Formel [6]) gewählt. Farbintensität an einem ort a proportional zu imax Bei einem Vergleich von Abb. 9 und Abb. 15 kann man erkennen, dass die dunkelsten Farben (d. h. die höchsten Dominanzwerte) in denjenigen Bereichen auftreten, in denen eine Variante nahezu frei von jeder Durchmischung mit anderen Varianten auftritt, so z. B. im Südosten oder im nordosten des Untersuchungsgebietes. Dort, wo mehrere Varianten nebeneinander auftreten, sind die Farben deutlich blasser. Wie gut zu sehen ist, ist dies auch entlang der Grenzen zwischen den Dominanzgebieten der Fall, die durch orangefarbene Linien markiert sind. Dies verwundert nicht, denn es ist bekannt, dass Isoglossen meist keine scharfen Grenzen darstellen: closer investigation would probably reveal that most speakers over the whole area know both words, and in some areas the two words are interchangeable, perhaps with a preference for one over the other […]. The isogloss, therefore, does not mark a sharp switch from one word to the other, but the center of a transitional area where one comes to be somewhat favored over the other. (franCiS 1983, 5)
Der Begriff der Isoglosse ist daher nicht nur insofern problematisch, als er einen „sharp switch“ suggeriert, wo in der Realität in Wirklichkeit ein mehr oder weniger sanfter Übergangsbereich existiert (vgl. auch händLer /wiegand 1982; SChneider 1988, 177–179); das Einzeichnen von Isoglossen in eine Karte ist zumeist auch ein subjektiver und nicht mit den gleichen Ergebnissen wiederholbarer Prozess (vgl. Lee/k retzSChMar 1993, 543–544). Die hier vorgelegte Methode erlaubt genau dies: Die Isoglossenziehung als wiederholbares Experiment zu operationalisieren und dadurch zu objektivieren. Die Grenzlinien zwischen Varianten trennen sie dabei nicht kategorisch voneinander, sondern begrenzen nur die Bereiche, in denen sie jeweils vorherrschen. Die räumliche Dynamik der Varianten ist durch diese Darstellungsweise nur teilweise erfasst, denn es werden nur die Werte der jeweils dominanten Varianten abgebildet. Ist man jedoch interessiert an dem, was unterhalb der Dominanzschwelle an Variation herrscht, kann es hilfreich sein, einen Querschnitt durch die Flächenkarte vorzunehmen. So kann man beispielsweise eine gedachte Linie quer durch das Untersuchungsgebiet von Kellmünz (ort 176) im Südwesten bis Tödtenried (ort 126) im osten legen (Abb. 16, nächste Seite). Für diese ortekette kann man nun die volle Intensitäteninformation darstellen (Abb. 17, S. 251). In diesem Querschnitt haben nur die Varianten Pflichter, Staude und Kraut Intensitäten größer als null. obwohl Kraut fast überall relativ stark vertreten ist, erreicht es nur an einem ort (Balzhausen) einen dominanten Wert. Meist ist Staude vorherrschend, östlich des Lechs (ab ottmaringen) wird relativ abrupt Pflichter dominant. So wird sichtbar, wie die Übergangszonen entlang von Grenzlinien unter der Oberfläche aussehen. Hier, bei K. 8.80, sind solche Übergänge schon auf der Punktsymbolkarte zu erkennen; doch auch auf anderen Karten, bei denen die Punktsym75
Technisch gesehen sind Helligkeits- und Sättigungsunterschiede gleichzeitig für die wechselnden Farbintensitäten verantwortlich. So konnte der Effekt des ‚Verblassens‘ an Stellen mit geringer Dominanz am besten bewerkstelligt werden.
96
Methodik
bolkarten keinerlei Übergänge zwischen den Variantengebieten zeigen, ergeben sich durch die Methode Übergangsgebiete. Dies ist eine Folge der mit der Intensitätsschätzung einhergehenden Glättung, aber keineswegs eine unerwünschte: Die Präferenzwerte der einzelnen Varianten – inklusive der Werte der dominanten Varianten – werden in Abhängigkeit von der Entfernung zueinander geschätzt, und es ist absolut plausibel, dass auch bei einer scheinbar klaren Belegsituation ein geringer Prozentsatz der Bevölkerung eines ortes gelegentlich die Variante einer nachbargemeinde verwendet – oder zumindest kennt. 2 1
10
6
31
57
44
48
59
58
92 94
91 109
96 97
93
112
110
111
127
129
128
113 114
146
147
162 2
161 176
177 191
190 4 20
218 233
246 260
148 149 9 164 179
152
208
171
211
212
174 172
224 238
226
240 239
241
187
185 199
200
188
201
251 250 265
252 266
229
254
230
203
217 231 232
245
243 244 255 256
253
189
202
215
214
213
227 228
242
173 175
186
216
249
263
210
225
236 237
262
209
223
235
248
195
198
144 160
159
170
183
197
143 142
157
184
196
126
158
156
169
168
167
181
108
107
125
141 140 14
155
153
90
106 124
138 139
151
182 194
264 261
180
123
121 122
136
78
89
105
104
154
178 192 193
221 222 220
247
137 135
166
165
163
206
234
150
119
118
134 133
207
205
219
117
115 132
102 120
116
131
130
145
99
88 87
85 101
68 77
75
74
103
100
67
76
86
83
80 98
73
84
82
81
79 95
72
55
66
64
63
42
54
53
65
62
71
69
52 51
50
61
60 70
41
40
39
49
47 46
45
34
33
38
37
35
43 56
32
29
27
26
24
23 30
28 36
15
22
21
20
19
17 25
14
13
12
11
18
16
7
5
3 4
9
8
259 257
258 272
267
270
268 269
271
Abb. 16: Die in Abb. 17 (im Anhang, S. 251) betrachteten orte.
4.3 ABSTAnDSMASS Das Verfahren der Intensitätsschätzung sowie die damit erzeugten Flächenkarten können aus verschiedenen Gründen kritisiert werden. Auf Kritikpunkte, die die fehlende Wiedergabe von Einzelbelegen in der Flächenkarte etc. betreffen, gehe ich hier nicht näher ein; der nutzen der Flächenkarte besteht gerade in der Abstraktion von den Einzelbelegen, die ja in der originalen Punktsymbolkarte weiterhin für qualitative Untersuchungen zur Verfügung stehen. Zu Recht kann aber kritisiert werden, dass mögliche Sprachinseln durchs Raster fallen, da ihre Belege wie einzelne Streubelege behandelt werden; dass strukturelle Grenzlinien zwischen den Varianten durch die Glättung verschoben oder ungenau werden; kurz: dass auf mehreren Karten systematisch auftretende Strukturen genauso behandelt
Abstandsmaß
97
werden wie zufällige auf einzelnen Karten auftretende Strukturen. Die systematischen Strukturen sind gleichermaßen der Glättung unterworfen wie zufällige Strukturen, was die Identifikation von wiederkehrenden Mustern erschwert. Ein Beispiel: Der Lech ist als starke Dialektgrenze bekannt, und so ist auch bei wortgeographischen Karten zu erwarten, dass er oft eine klare Grenze zwischen den Verbreitungsgebieten zweier Varianten bildet. Wird eine solche Karte nun der oben beschriebenen Flächenkartenerzeugung unterzogen, so kann die auf der Punktsymbolkarte klar ausgebildete Unterscheidung – Variante x1 auf der einen, Variante x2 auf der anderen Seite des Lechs – dadurch verschleiert werden, dass die Grenze durch die Glättung begradigt und so verschoben wird. Die Intensitätsschätzung ‚weiß‘ nicht, dass der Lech eine Dialektgrenze ist, und behandelt ihn wie jede andere Variantengrenze im Untersuchungsgebiet. Dies zeigt einmal mehr, dass der einfache geographische (euklidische) Abstand ein nur eingeschränkt geeignetes Bezugssystem für geolinguistische Relationen darstellt. Aus dialektaler Sicht sind zwei orte beiderseits des Lechs eben n icht gleich weit ‚entfernt‘ voneinander wie zwei orte auf derselben Seite des Lechs. Auf diese Problematik wurde bereits ausführlicher in den Abschnitten 2.2‒2.2.4 eingegangen. Wie kann man das Problem lösen? Größere Abstände zwischen orten da einzubauen, wo man eine stärkere Grenze vermutet, ist problematisch, da es ja gerade ein Ziel ist, solche Strukturen mit der hier vorgestellten Methode zu identifizieren. Von der Verwendung von Gravitationsmodellen oder der Heranziehung von Eisenbahnstrecken oder Reisedauer ist ebenfalls abzuraten, da bislang nicht überzeugend gezeigt werden konnte, wie gut diese Methoden linguistisch relevante Abstände wiedergeben (vgl. 2.2.2). In Abschnitt 2.2.4 wurde dargelegt, dass für die Beschreibung der räumlichen Verhältnisse in Bezug auf geolinguistische Strukturen am besten eine Art ‚Kommunikationsraum‘ geeignet ist, der als netzwerk aus Kommunikationsverbindungen verstanden werden kann: näher zueinander ist, wer mehr miteinander kommuniziert, weiter entfernt, wer weniger miteinander kommuniziert. Die Stärke des kommunikativen Austauschs bestimmt den sprachlichen Austausch: Wer mehr miteinander kommuniziert, neigt eher dazu, gleiche oder ähnliche sprachliche Formen zu verwenden, als Individuen, die wenig miteinander kommunizieren (vgl. 2.1.3.2). Insofern kann der Grad an sprachlicher Übereinstimmung als Maß für sprachlichen Austausch dienen – und somit als bestmögliche Annäherung an die kommunikativen Distanzen, die den Kommunikationsraum konstituieren. Dabei spielt es keine Rolle, über welche Pfade der sprachliche Austausch erfolgt – über Migration, Handelsbeziehungen, Zugreisen, Telefongespräche, oder mittelbar über Dritte. Der Grad an sprachlicher Übereinstimmung zweier orte ist die direkte Folge daraus, wie viel Kontakt sie bis zum Zeitpunkt der Erhebung gehabt haben. Es erscheint deshalb sinnvoll, die bereits bestehenden Möglichkeiten zur Messung sprachlicher Ähnlichkeiten heranzuziehen, um ein Modell des Kommunikationsraums zu schaffen. Da wir es hier mit lexikalischen Daten zu tun haben, ist es am besten, nur die lexikalische Übereinstimmung zu messen. Sie gibt wieder, welche Rolle die jeweiligen Beziehungen beim Austausch von lexikalischen Einheiten in der Vergangenheit gespielt haben. In unserem Fall bedeutet dies: Die
98
Methodik
lexikalische Übereinstimmung zwischen zwei orten gibt an, wie viel Austausch an Wortmaterial durch Kommunikation zwischen ihnen stattgefunden hat. Der lexikalische Abstand kann den euklidischen Abstand in der Intensitätsschätzung ersetzen, so dass sich beispielsweise durch eine Barriere wie den Lech getrennte Orte bei der Glättung wesentlich weniger beeinflussen als Orte, die bei gleichem euklidischen Abstand durch eine direkte Straße verbunden sind. Umgekehrt können geographisch weiter entfernte orte größere Wirkung aufeinander haben, wenn sie etwa aufgrund von Migrationsbewegungen eine große Übereinstimmung des Lexikons aufweisen. Dies verhindert die oben beschriebenen unerwünschten Effekte, beispielsweise dass Sprachinseln ‚unter den Tisch fallen‘ oder systematisch auftretende Grenzen nicht exakt wiedergegeben werden. Bei Untersuchungen im phonetischen, morphologischen oder syntaktischen Bereich müsste der linguistische Abstand entsprechend auf der Grundlage von phonetischen, morphologischen oder syntaktischen Daten erfolgen; auch ein ebenenübergreifend ermittelter linguistischer Abstand könnte u. U. sinnvoll sein. 4.3.1 Lexikalische Distanz In der Fachliteratur findet man verschiedene Methoden, die zur Messung von lexikalischen Abständen geeignet sind. Die in Abschnitt 1.2.2 vorgestellten dialektometrischen Methoden beruhen alle auf der Distanzmessung zwischen Erhebungsorten auf verschiedenen sprachlichen Ebenen (Phonetik, Morphologie, Lexikon), so dass nur kleine Anpassungen an die hier gegebenen Erfordernisse nötig sind. Das wohl etablierteste Hilfsmittel zur Messung von sprachlichen Abständen ist die Ähnlichkeitsmatrixmethode von hanS goebL. a) Der Relative Fündigkeitswert (RFW) Zur einfachen Distanzmessung dient bei goebL der sogenannte „Relative Fündigkeitswert“ (RFW), der sich unmittelbar als Umkehrung des „Relativen Identitätswerts“ (RIW) ergibt. Der Relative Identitätswert beschreibt dabei für ein ortepaar, für welchen Anteil der betrachteten Variablen identische Varianten auftreten.76 Er berechnet sich wie folgt:
RIWjk = 100⋅
∑pi=1 KOIjk
i
∑pi=1 KOIjk + ∑pi=1 KODjk i
(8) i
Dabei ist RIWjk
das Maß für die Ähnlichkeit zwischen den ortspunkten j und k,
i
der Laufindex der jeweiligen Variablen,
p
die Gesamtzahl der betrachteten Variablen,
76
Die Beschreibung der Berechnung des RIW folgt goebL (1984, Bd. I, 75–77).
99
Abstandsmaß
KOIjk KODjk
die Koidentität der ortspunkte j und k in Bezug auf die Variable i (= 1 wenn identisch, 0 wenn nicht identisch),
i
i
die Kodifferenz der ortspunkte j und k in Bezug auf die Variable i (= 1 wenn verschieden, 0 wenn nicht verschieden).
Der RFW nach goebL (1984) als Maß für die sprachliche Distanz zwischen zwei orten ergibt sich sodann als RFWjk = 100 – RIK jk.
(9)
b) dlex Die Berechnung des RFW ist mit den Daten des SBS nicht eins zu eins umzusetzen, da goebL von einer jeweils eindeutigen Koidentität bzw. Kodifferenz ausgeht, was nur bei genau einer belegten Variante pro ort und Variable möglich ist. Im SBS kommen jedoch bis zu drei verschiedene Varianten pro Ort und Variable vor. Man muss daher statt der binären Unterscheidung zwischen Koidentität KOIjk ∈ {0;1} und Kodifferenz KODjk ∈ {0;1}77 ein kontinuierliches Spektrum i i an Übereinstimmung zwischen zwei orten schon i n Bez ug auf ei ne Va r iable zulassen. Eine naheliegende Methode zur Berechnung der Ähnlichkeit in Bezug auf Variable X m lautet wie folgt:
simm ai ,aj =
(10)
min wx ai ,wx aj
x∈ X m
Dabei ist wx(a) das Gewicht der Variante x am ort a (vgl. 4.2.1). Die Ähnlichkeit zweier Orte in Bezug auf ein Merkmal entspricht nach dieser Definition dem Anteil der Gewichte der Varianten, der beiden orten mindestens zukommt. Für den Fall, dass an mindestens einem der beiden orte kein Beleg für X m vorliegt, ist sim m(ai,aj) = 0. nehmen wir zum Beispiel an, dass folgende Verteilung der Gewichte gegeben ist: Ort ai
Ort aj
Variante x1
wx1(ai) = 0,3̅
wx1(aj) = 0,5
Variante x2
wx (a ) = 0,3̅
wx2(aj) = 0,5
Variante x3
wx3(ai) = 0,3̅
wx3(aj) = 0
2
i
Tab. 3: Beispiel für die Verteilung der Gewichte dreier Varianten einer Variablen X m an den orten ai und aj. 77 Die Summe aus Koidentitäten und Kodifferenzen im nenner von goebLS Formel dient dazu, dass nullbelege ignoriert werden: Bei einem fehlenden Beleg an mindestens einem der zwei Orte ist kein sinnvoller Vergleich möglich, diese Ortepaare werden deshalb für die jeweilige Variable nicht berücksichtigt.
100
Methodik
So ist der Anteil des Gewichts für Variante x1, der an beiden orten mindestens vorkommt, 0,3̅, ebenso für Variante x2; für Variante x3 ist der Anteil, der mindestens an beiden orten vorkommt, 0. sim m(ai,aj) errechnet sich somit als 0,3̅ + 0,3̅ + 0 = 0,6. ̅ Der Grad der linguistischen Übereinstimmung der orte ai und aj in Bezug auf alle Variablen des betrachteten Korpus ergibt sich aus dem Durchschnitt der sim m-Werte der einzelnen Variablen. Fälle, in denen mindestens einer der beiden orte keinen Beleg hat, müssen bei der Mittelwertbestimmung nicht eigens ausgeschlossen werden, weil in diesen Fällen simm(ai,aj) = 0 ist und im Zähler nicht die Gesamtzahl der Merkmale steht, sondern nur die Gesamtzahl der Merkmale, für die an beiden orten mindestens ein Beleg vorliegt: sim ai ,aj =
∑ X m∈ simm ai ,aj n ai ,aj
(11)
Dabei ist 𝕄 die Menge der Variablen X m und n(ai,aj) die Zahl der Variablen, für die sowohl für ai als auch für aj mindestens ein Beleg vorliegt. Auf den Faktor 100 (der beim RFW nur dazu dient, die in Prozentsätze zu konvertieren) wird ∑ X mErgebnisse ∈ simm ai ,aj ,ajj) ∈=[0;1] liegt also nun ein Wert lexikalischer Ähnlichkeit verzichtet. Mit sim (aaii,a ,aj Distanzmaß überführt werden kann: vor, der analog zum RFW einfachninaiein ∑ X m∈ simm ai ,aj (12) dlex(ai,aj) = 1 – sim (aaii,a ,ajj) = n ai ,aj dlex(ai,aj) ∈ [0;1] bezeichnet nun die lexikalische Distanz zwischen ai und aj.78 Sie entspricht dem RFW, mit dem Unterschied, dass sie mehrere Varianten pro ort zulässt und zwischen 0 und 1 statt zwischen 0 und 100 liegt. Eine von SpeeLMan/grondeLaerS/geeraertS (2003, 320–322) vorgeschlagene, einfachere Berechnungsweise kann ebenfalls für dlex verwendet werden;79 sie führt zu identischen Werten (vgl. vogeLbaCher 2011, 7–8). Dabei wird zunächst die mittlere Differenz der relativen Frequenzen (hier: der Gewichte) aller Varianten einer Variablen an zwei orten berechnet:
diffm ai ,aj =
1 2
x∈ X
m
wx (ai ) – wx aj
(13)
Die erhaltenen Werte werden nun über alle Variablen gemittelt. Für den Fall, dass an mindestens ai oder aj kein Beleg vorliegt, ist der Wert von diffm nicht sinnvoll. Deshalb werden diese Fälle mithilfe des Faktors nm(ai,aj) neutralisiert und
78
Im Prinzip genauso gehen SpeeLMan/geeraertS (2008, 227–228) bei der Distanzmessung vor, die zunächst eine Distanz dPRo („profile-based dissimilarity“) für jedes Merkmal ermitteln, die hier mit 1 – sim m gleichzusetzen wäre. dlex entspricht genau dagg bei SpeeLMan/ geeraertS (2008, 234), das dort durch Mittelwertbildung aus den einzelnen dPRo -Werten gewonnen wird. 79 Für die Idee zur Verwendung dieser Berechnungsweise und ihre Implementierung danke ich JuLiuS vogeLbaCher. Für weitere Informationen s. piCkL et al. (i. V.).
0
10
20
30
40
50
60
70
80
90
0
40
60
80
100
120
140
Abb. 18: Streudiagramm der geographischen Distanz dgeo (x-Achse) gegen die lexikalische Distanz dlex (Level 3) (y-Achse). Die schwarze Linie stellt die logarithmische Regression dar (R2 = 0,70).
20
160
Abstandsmaß
101
102
Methodik
wiederum durch das Verwenden des Zählers n(ai,aj) bei der Mittelwertbildung nicht berücksichtigt. dlex ai ,aj =
1 n ai ,aj
X m∈
diffm ai ,aj ⋅nm ai ,aj
(14)
Dabei ist nm(ai,aj) = 1, wenn sowohl an ai als auch an aj jeweils mindestens ein Beleg für die Variable X m vorliegt, und 0, wenn an mindestens einem der beiden orte kein Beleg für die Variable X m vorliegt. Abb. 18 (S. 101) zeigt ein Streudiagramm von geographischer Distanz (im Folgenden dgeo) und dlex (Level 3) für alle ortepaare. Bei 272 orten ergibt dies 36.856 Datenpunkte. Die dlex-Werte wurden (wie bei allen nachfolgenden Analysen) normalisiert, so dass sie den gleichen Mittelwert wie die dgeo-Werte haben und dadurch besser mit ihnen vergleichbar sind. Wie bereits in Studien mit vergleichbaren linguistischen Distanzmaßen beobachtet wurde (vgl. z. B. heeringa /nerbonne 2001; nerbonne/heeringa 2007, 288–289; nerbonne 2010), zeigt die lexikalische Distanz augenscheinlich einen logarithmischen Zusammenhang mit der geographischen; eine entsprechende Regression ergibt ein Bestimmtheitsmaß von R2 = 0,70, d. h. 70 % der Varianz der linguistischen Abstände sind durch die euklidische Distanz erklärbar, und zwar über einen logarithmischen Zusammenhang (eine lineare Regression ergibt eine erklärte Varianz von 67 %). Dies stellt, verglichen mit entsprechenden Ergebnissen aus anderen Studien (z. B. nerbonne 2010; SzMreCSanyi 2012), einen relativ hohen Wert dar. Es lässt sich (aufgrund der Punktdichte leider nur vage) feststellen, dass oberhalb der ‚Hauptwolke‘ eine weitere, kleinere, ebenfalls längliche nebenwolke erkennbar ist. Dabei handelt es sich um die ortepaare, die durch den Lech, der mit Abstand die stärkste Dialektgrenze im Untersuchungsgebiet darstellt (vgl. 5.1.3.1), getrennt sind. Das dortige Verhältnis von linguistischem und geographischem Abstand ist durch eine größere Abweichung geprägt als das bei ortepaaren, die nicht durch eine Dialektgrenze getrennt sind. 4.3.2 Implementierung Die Implementierung des linguistischen Abstands ins Intensitätsschätzungsverfahren gestaltet sich relativ einfach. Im Prinzip ist in der Formel für die Berechnung der Intensitäten der Varianten nur der geographische Abstand durch den linguistischen Abstand zu ersetzen:
ux (a1 ) =
K(dlex (a1,a),h) ⋅wx (a)
(15)
a∈ A
Die Formel an sich ist dieselbe wie bei der Intensitätsschätzung mit geographischem Abstand (vgl. Formel [4], S. 89). Auch das weitere Vorgehen entspricht prinzipiell dem in den Abschnitten 4.2.2–4.2.3 für dgeo beschriebenen. Die bei der
103
Abstandsmaß
17 26
36
43 56 57
44
48
59
58
70
91 109
93
112
110
130 146
145
162
161 176
177
207
20
4
206
205
219 218
224
263
262
217
232
257
256
218
258
18
25 36
45
43 56 57
44
48
59
58
70
71
69
92 94
91 109
96 97
93
112
110
111
127
113 114
130 146
145
147
162
161 176
177 191
190 4 20
218 233
246 260
148 149 164
150
179
208
221 222 220
247
237 248
262
209
171
198
211
212
174 172
224 238
226
240 239
241
187
185 199
200
188
201
251 250 265
252 266
229
254
230
189
256
257
258
270 269
Abb. 19c: K. 8.80/Stengel
176
271
177 191
218 233
246 260
148 149 164
150
179
208
221 222 220
247
237
262
198
171
211
212
174 172
224 238
226
240 239
241
187
185
200
188
201
251 250 265
252 266
229
254
230
203
217 231 232
245
243 244 255 256
253
189
202
215
214
213
227 228
242
173 175
186
199
144 160
159
216
249
263
210
225
236
235
248
195 209
157
170
183
197
142
158
156
184
196
223
264 261
180
126 143
140
155 169
168
167
108
107
125
141
138 139
181
90
106 124
121 122
153
182 194
123
154 152
78
89
105
104
136
151
178 192 193
206
234
137
166
165
163
119
118 135
133
207
205
117 134
132 147
162
161
219
259
113 114
102 120
116
131
130 146
145
99
88 87
85 101
68 77
75
74
103
100
67
76
86
83
55
66
64
73
84
82
80 98
65
72
42
54
53
51
50 62
71
115
129
231 232
255
268
111 128
190 217
272 267
110
203
245
243 244
253
109
112
202
215
214
213
227 228
242
173 175
186
216
249
263
210
225
236
235
197
195
223
264 261
196
94 93
127 144 160
159
170
183
182 194
142
157
184
92
158
156
169
168
167
181
143
140
155
153
126
125
141
138 139
96 97
95
52
63
81
79 108
107
106 124
121 122
154 152
90
34
41
40
39
49
61
60
69
29
33
31
48
59 70
91
123
44 58
78
89
105
104
136
151
178 192 193
206
234
180
119 137
135
166
165
163
102
118
134 133
207
205
219
117
131 132
101
120
116 115
129
128
99
88 87
85 103
100
77
75
74
57
68
76
86
83
80 98
73
84
82
81
79 95
72
67
66
64
63
45
43 56
65
62
32
38
37
46
24
23 30
27
26
15
22
21 28
47
55
7 6 14
13
20
35
42
54
53
51
50
61
60
52
271
5
12
11
19
36
41
40
39
49
258
270
3
10
25
31
47 46
257
256
18
16
34
33
38
37
35
255
268
4
9
17
32
29
27
26
24
23 30
28
259
272
8
22
21
20
19
17
232 245
243 244
254
267
2 1
15
4
8 16
217 231
230
253
252 266
7
14
13
12
203 202
215
214
229
189
188
201
200
213
242
241
251
265
6
4 11
173 175
Abb. 19b: K. 8.80/Staude
5
3
10
187
185
269
20
2 9
240
250
263
262
174 172
227 228
226
239
238
264
Abb. 19a: K. 8.80/Kraut 1
224
236
249
248
261
260
271
225
237
247
171
199
212
144 160
186
198
211
142
159
216
223
235
234
246
272
269
221 222
210
209
208
220
233
270
268
267
207
205
197
195
143
158
170
183
182 196
194
125
141
157
184
108
107
126
140
156
169
168
167
166
124
155
153
181
180
178 192 193
206
219
231
259
255
254
266
177 191
154 152
165 179
123
138 139
136
90
106
121 122
137 135
151
150
163
190
245
243 244
253
252
265
189 203
230
229
242
241
176
119
118
134
148 149 164
147
162
161
202
215
214
227 228
251 250
264
260
240
249
248
261
173 175 188
201
200
213
212
226
239
238
237
247
246
211
187
199
146
117
133
78
89
105
104
120
116 115
130
88
102
68 77
87 103
101
67
66 76
74
85
55
75
86
83
42
54
53
64
73
84
82
41
65
72
100
132
52
62
71
99
131
129
145
174 172
185
198
225
236
235
234
171
98
113 114
111 128
160
186
216
223
220
233
210
209
208
221 222
197
110
144
159
170
183
182 196 195
112
127
142
157
184
93
158
156
169
168
167
166 181
109
143
140
155
153
126
125
141
138 139
152
180
194
121 122
136
154
178 192 193
191
119 137
135
94
39
63
80
96 97
34
33
40
51
50
61
60
81
79 95
92 91
124
59
69
108
107
48
70
90
106
123
44 58
32
49
46
45
78
89
105
104
151
165 179
102
118
134
150
163
190
117
133
148 149 164
147
101
120
115 132
88 87
85 103
100 116
131
129
128
74
57
68 77
75
86
83
99
113 114
111
127
98
73
84
82
80
96 97
94
72
67
66 76
30 31
47
55 43 56
65 64
63
81
79 95
92
54
53
62
71
69
52 51
50
61
60
39
49
47 46
24
23
38
37
35
42
15
22
29
27
26
36
41
40
14
13 21
20 28
25
31 38
37
35
45
34
33
6 12
11
19
17
32
29
27
10 18
16
7
5
3 4
9
8 24
23 30
28
25
15
22
21
20
19
1
14
13
12
11
18
2
6
4
10
8 16
7
5
3 4
9
20
2 1
259 257
258 272
267
270
268 269
271
Abb. 19d: K. 8.80/Stock
Abb. 19 (Fortsetzung auf S. 105): Intensitätskarten aller sieben Varianten der Karte ‘Kartoffelkraut’ (K. 8.80), Level 3. Parameter: dlex, K3-Kern, h = 53,0 (CL).
104
Methodik
Intensitätsschätzung erhaltenen Werte lassen sich wieder in Form von Intensitätskarten darstellen (Abb. 19). nun wird weiter wie in Abschnitt 4.2.3 verfahren. Die Intensitätskarten werden zu einer Flächenkarte vereint, indem jeder Ort der Variante mit der dort höchsten Intensität – der jeweils dominanten Variante – zugewiesen wird (Abb. 20 im Anhang, S. 252). Die Unterschiede zu Abb. 15 (S. 250) sind klar zu sehen. Die Grenzverläufe sind weniger glatt, und auch die Struktur der Intensitätswerte der dominanten Varianten sieht weniger gleichförmig in der Fläche verteilt aus. So treten Strukturen zutage, die auf der dgeo-basierten Flächenkarte nicht zu sehen sind, wie etwa eine prominente keilförmige Ausbuchtung entlang des Lechverlaufs in der mittleren rechten Hälfte des Untersuchungsgebiets. Einige Dinge werden so besser erfasst (andere wiederum schlechter). Während diese Darstellung den Abstraktionsgrad von Abb. 15 weitgehend bewahrt, ist sie doch detailreicher. Wie beim geographischen Abstand lässt sich nun auch hier ein Querschnittprofil anlegen, das Einblick in die Variation auch der nicht-dominanten Varianten gewährt. Entlang derselben Linie wie weiter oben (vgl. Abb. 16, S. 96) ergibt sich das in Abb. 21 (im Anhang, S. 251) dargestellte Bild. Wie in Abb. 17 ist westlich des Lechs vor allem Staude dominant, östlich davon Pflichter; jedoch erreicht Kraut kurz vor dem Lech einen dominanten Wert in Haunstetten, und Staude ist in Eurasburg die stärkste Variante. Die Intensitätsverteilung erscheint hier insgesamt etwas differenzierter als bei der Verwendung von dgeo. Dies äußert sich zum einen darin, dass nun auch die Varianten Rebe und Stengel in geringem Umfang vertreten sind, zum anderen darin, dass der beim Überschreiten des Lechs zu verzeichnende Bruch viel deutlicher abgebildet ist als in Abb. 17. 4.4 DISTRIBUTIonSKEnnWERTE80 Flächenkarten sind – obwohl oder gerade weil sie Abstraktionen von den originaldaten darstellen – ein etabliertes Werkzeug für dialektologische Untersuchungen. Gradierte Flächenkarten, die wie in Abschnitt 4.2.3 beschrieben erzeugt werden, können darüber hinaus als Vorverarbeitung der Daten für eine weitergehende statistische Untersuchung dienen. Zur Beurteilung elementarer Struktureigenschaften der Karten können auf ihrer Grundlage Kennwerte errechnet werden, die verschiedene Aspekte der Struktur der Karten quantitativ beschreiben. Eigenm (a) (vgl. 4.2.3), die bei der Erstellung der Flächenkarten berechnet schaften wie imax werden, können dabei helfen, die strukturellen charakteristiken dieser Karten zu quantifizieren. Solche Kennzahlen sind in zweierlei Hinsicht von nutzen. Zum einen können wir die Karten untereinander in Bezug auf verschiedene Fragestellungen vergleichen (z. B.: „Welche Karten sind homogener, welche heterogener aufgebaut?“ – „Welche Regelmäßigkeiten gibt es bei der Verteilung der Heterogenität im Kar80 Für die Zusammenarbeit bei der Entwicklung dieser Kennwerte danke ich JonaS ruMpf.
105
Distributionskennwerte
17 26
36
43 56 57
44
48
59
58
70
94
91 109
93
112
110
130 146
145
176
177
207
20
4
206
205
219 218
224
203
217
233
259
255
254
218
245
257
256
258
246
272 270
268
267
260
271
269
2 10
8 18
16
36
57
45 44
70
92 94
91 109
96 97
93
112
110
111
127
129
128
145
147
162
161 176
177 191
20 4
190
218 233
246 260
150
179
208
221 222 220
247
237 248
262
238
249 264
261
224
236
235
263
157
198
211
212
226
240 239
241
251 250 265
252 266
258
271
174 172
187
185 199
200
229
254
173 175 188
201
230
203
217 231 232
245
243 244 255 256
253
189
202
215
214
213
144 160
171 186
227 228
242
126
159
170
183
197
225
257 270
143 142
216
223
256 268
158
156
169
168
167
210
255
272 267
108
107
125
141 140
155
153
184
195
254 253
90
106 124
121 122 138 139
181
196 209
123
154 152
182 194
252 266
259
78
89
105
104
136
151
178 192 193
206
234
180
119 137
135
166
165
163
207
205
219
148 149 164
88
103 102
118
134 133
265
232 245
243 244
68 77
87
85 101
117
115 132
251 250
229
242
217 231
67
66
75
74
120
116
263
241
230
55
76
86
83 100
113 114
73
84
82
99
131
130 146
98
65
72
80
262
240 239
227 228
42
54
64
63
81
79 95
41
53
51
62
71
69
52
50
61
60
248
264 261
224 238
249
226
203
215
214
213
189
202
34
33
40
39
49 48
59
58
247
212
188
201
31
47 46
225
236 237
211
200
216
223
220
235
210
187
185 199
24
23 32
38
37
35
43 56
22
29
27
26
209
198
173 175
15
30
28
25
221 222
197
174 172
7
21
20
19
17
208
171 186
6 14
13
12
11
206
196 195
144 160
159
170
183
182 194
157
184
178
142
158
156
169
168
167
181
126 143
140
155
153
108
107
125
141
138 139
151 152
124
121 122
136
90
106
Abb. 19f: K. 8.80/Pflichter
5
3 4
9
180
123
154
166
165 179
192 193
234
137 135
78
89
105
104
269
Abb. 19e: K. 8.80/Rebe 1
150
119
118
134 133
207
205
219
231 232
253
266
177 191
190
117
115
163
88
102
68 77
87
120
116
148 149 164
86
101
67
66 76
74
85
55
75
103
100
132 147
162
176
189
215
243 244
146
84
42
54
53
64
73
83
41
65
72
82
99
113 114
130
161
98
52
62
71
80
131
129
202
230
229
242
241
252
265
263
262
173 175 188
201
214
227 228
251 250
264
260
240
249
248
261
187
200
213
111
145
174 172
185 199
212
226
239
238
237
247
246
211
225
236
235
234
171
198
110
128
160
186
216
223
220
233
210
209
208
221 222
197
195
144
159
170
183
182 196
194
112
127
142
157
184
93
158
156
169
168
167
166 181
180
109
143
140
155
153
126
125
141
138 139 154
178 192 193
191 190
121 122
136
152
165 179
119 137
135
94
91 124
96 97
39
63
81
79 95
92
34
33
40
51
50
61
60
69
108
107
59
32 31
48
70
90
106
123
44 58
78
89
105
104
151
150
163
102
118
134 133
148 149 164
147
162
161
117
115 132
101
120
116
131
129
128
88 87
85 103
100
99
113 114
111
127
98
74
57
68 77
75
86
83
80
96 97
73
84
82
81
79 95
92
72
67
66 76
30
49
46
45
24
23
38
37 47
55 43 56
65 64
63
26
15
22
29
27
35
42
54
53
62
71
69
52 51
50
61
60
39
49
47 46
36
41
40
14
13 21
20 28
25
31 38
37
35
45
34
33
6 12
11
19
17
32
29
27
10 18
16
7
5
3 4
9
8 24
23 30
28
25
15
22
21
20
19
1
14
13
12
11
18
2
6
4
10
8 16
7
5
3 4
9
20
2 1
259 257
258 272
267
270
268 269
271
Abb. 19g: K. 8.80/-laub Abb. 19 (Fortsetzung): Intensitätskarten aller sieben Varianten der Karte ‘Kartoffelkraut’ (K. 8.80), Level 3. Parameter: dlex, K3-Kern, h = 53,0 (CL).
106
Methodik
tenkorpus?“), und dies kann nun aufgrund der numerischen natur der Kennwerte mit statistischen und maschinellen Methoden schneller und konsistenter bewältigt werden als bisher. Zum anderen lassen sie uns die Qualität und die Brauchbarkeit der verschiedenen Parameter zur Kartenerzeugung für verschiedene Zwecke beurteilen und vergleichen (s. Abschnitt 4.5). 4.4.1 Komplexität Als Komplexität Cm einer Karte (bzw. einer Variablen X m) wird der Grad ihrer Zergliederung in kontingente Teilgebiete bezeichnet. Zur Quantifizierung dieser Kenngröße wird zunächst die Gesamtgrenzlänge zwischen den Gebieten unterschiedlicher Varianten berechnet. Es ist ein äußerst nahe liegendes Vorgehen, diese Größe als Indikator für die Komplexität einer Karte zu betrachten, denn eine größere Gesamtgrenzlänge bedeutet häufigere Wechsel zwischen dominanten Varianten; ein Umstand, der die Karte im Ganzen komplexer erscheinen lässt. nicht berücksichtigt werden dabei Intensitätsschwankungen innerhalb der entstandenen Flächen, deren Erfassung mittels einer weiteren Kenngröße in Abschnitt 4.4.3 erläutert wird. Es ist wichtig zu beachten, dass selbst Karten mit einer identischen Anzahl von Variantenflächen deutlich unterschiedliche Gesamtgrenzlängen aufweisen können: Bei glatten und zusammenhängenden Gebieten entsteht eine deutlich geringere Gesamtgrenzlänge als bei Gebieten, deren Grenzverläufe ausgefranst oder zerstückelt sind. Um die Komplexität über verschiedene Untersuchungsgebiete hinweg vergleichbar zu machen, wird sie zudem normalisiert, indem durch die Gesamtfläche des betrachteten Gebiets geteilt wird, die in unserem Fall 11.315 km2 beträgt. Der Kennwert Cm erhält somit die Einheit km–1 und gibt dadurch an, auf wie viele Grenzlinien man im Schnitt trifft, wenn man im
180 160
Karten/Variablen
140 120 100 80 60 40 20 0 0,00
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0,10
0,11
Komplexität C (in km–1)
Abb. 22: Verteilung der Komplexitätswerte in allen 735 Karten (Level 3, Parameter: dgeo, K3-Kern).
107
Distributionskennwerte
Untersuchungsgebiet 1 km zurücklegt. Die Grenzen, die auf der Flächenkarte in Abb. 15 (S. 250) orange markiert sind, haben eine Gesamtlänge von 423,7 km; damit hat die Karte eine Komplexität von 0,037 km–1. Abb. 22 zeigt die Verteilung der Cm-Werte in allen 735 Karten. Die Beispiele in Abschnitt 4.4.4 schaffen einen Bezugsrahmen, der diese Werte leichter interpretierbar macht. Theoretisch kann die Komplexität der Karten des SBS bis zu 0,764 km–1 lang werden (hierfür dürften keine zwei benachbarten orte zum selben Gebiet gehören), aber Werte über 0,1 km–1 sind in der Praxis sehr selten. 4.4.2 Kompaktheit Eine zweite Strukturkenngröße für Flächenkarten ist das mittlere Auftretensgewicht Lx = w̅ x einer Variante x in dem ihr zugeordneten Gebiet Ax (vgl. 4.2.3), also
Lx =
1 | Ax |
wx (a) für x | Ax ≠ {}.
(16)
a ∈ Ax
Diese Kennzahl kann beschrieben werden als der Anteil der Gewichte in Ax, der tatsächlich von x stammt. Der Extremfall Lx = 1 tritt nur dann auf, wenn an allen Befragungsorten in Ax nur eine einzige Variante, nämlich x, auftritt. Andernfalls wird ein Teil der in Ax auftretenden Varianten durch die Zuordnung zu x nicht wiedergegeben. Treten beispielsweise an einem ort a die Varianten x1 und x2 mit wx1(a) = ‒12 und wx2(a) = ‒12 auf, und ist x1 die dominante Variante am ort a (vgl. 4.2.3), so wird das Auftretensgewicht wx2(a) = ‒12 durch die Zuordnung von a zu Ax1 nicht berücksichtigt. Grob gesagt ist der Wert von Lx umso größer, je weniger von x verschiedene Varianten in Ax auftreten. Lx wird daher als die „Gebietskompaktheit der Fläche der Variante x“ bezeichnet. Entsprechend wird die Gesamtkompaktheit
250
Karten/Variablen
200 150 100 50 0 0,0
0,1
0,2
0,3
0,4 0,5 Kompaktheit L
0,6
0,7
0,8
0,9
Abb. 23: Verteilung der Kompaktheitswerte in allen 735 Karten (Level 3, Parameter: dgeo, K3-Kern).
108
Methodik
einer Karte über das Mittel der lokalen Gewichte der jeweils dominanten Varianten definiert:
1 |A|
Lm =
wx mmax (a) (a)
(17)
a∈ A
Die Kompaktheit Lm ∈ [0;1] einer Karte kann man auch als die „Wiedergabetreue“ der Flächenkarte zu den originaldaten bezeichnen, da sie angibt, in welchem Umfang die Rohbelege durch die Aufteilung in Flächen wiedergegeben werden. Die in Abb. 15 (S. 250) dargestellte Karte hat Lx-Werte von 0,41 für das hellgrüne Gebiet im Südwesten des Untersuchungsgebiets (Variante Rebe) bis hin zu 0,90 für das dunkelgrüne in der Südhälfte (Variante Staude). Die Gesamtkompaktheit der Karte, Lm, ist 0,84, d. h. 84 % der Belege auf der Karte werden durch die Zuordnung der orte zu den einzelnen Gebieten wiedergegeben. In Abb. 23 (S. 107) ist wiederum die Verteilung der Werte im Kartenkorpus dargestellt. Auch für dieses charakteristikum werden in Abschnitt 4.4.4 diverse Beispiele angeführt, welche diese Zahlen in einen Kontext stellen. 4.4.3 Homogenität Schließlich sind mit
Bx =
1 | Ax |
im max ( a ) a ∈ Ax
und
Bm =
1 | A|
für x ∈ X m, x | Ax ≠ {}
(18)
im max (a)
(19)
a∈ A 200 180
Karten/Variablen
160 140 120 100 80 60 40 20 0 0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
Homogenität B
Abb. 24: Verteilung der Homogenitätswerte in allen 735 Karten (Level 3, Parameter: dgeo, K3-Kern).
109
Distributionskennwerte
Kennzahlen für die Homogenität von Variantengebieten (Bx) bzw. des gesamten Untersuchungsgebiets für eine Variable (Bm) verfügbar. Begründen lässt sich diese m (a) anzeigen, dass die geschätzte Interpretation damit, dass hohe Werte von imax m Intensität der dominanten Variante (x max(a)) deutlich höher ist als die anderer Varianten (vgl. Formel [6], S. 94). Mit anderen Worten: Große Werte für Bx bedeuten, dass im Gebiet der Variante x keine große Durchmischung mit anderen Varianten auftritt, dieses Gebiet also homogen ist. Im Unterschied zu Lx wird bei der Berechnung von Bx die geschätzte Auftretenswahrscheinlichkeit der Variante x verwendet; es geht hier also nicht um die Rohbelege. Das hellgrüne Gebiet (Rebe) in Abb. 15 (S. 250) hat eine Homogenität von Bx = 0,46, während die Homogenität des dunkelgrünen Gebietes (Staude) 0,78 beträgt und die Homogenität der gesamten Flächenkarte (Bm) 0,77. Für Vergleichsbeispiele siehe wiederum Abschnitt 4.4.4. 4.4.4 Zusammenfassung und Beispiele In Abb. 25 (im Anhang, S. 253) sind sechs Beispiele von Einzelflächenkarten mit ihren jeweiligen Distributionskennwerten dargestellt. Wie bei diesen Beispielen bereits zu erkennen ist, gibt es eine positive Korrelation zwischen Kompaktheit und Homogenität sowie eine negative Korrelation zwischen Komplexität und den anderen beiden Kennwerten. C C L B
L
B –0,440
–0,440 –0,650
–0,650 0,933
0,933
Tab. 4: pearSon’scher Korrelationskoeffizient für die Komplexität, Kompaktheit und Homogenität innerhalb des Kartenkorpus (Parameter der einzelnen Karten: s. S. 253).
Dies ist wenig überraschend, wenn man das Zustandekommen der Werte berücksichtigt. Die Homogenität greift gewissermaßen auf die geglättete Version der Informationen zurück, die für die Kompaktheit verwendet wird, was die hohe Korrelation zwischen ihnen erklärt. Für die negative Korrelation zwischen Komplexität und Homogenität gibt es zwei Gründe. Erstens messen beide in gewisser Weise die geographische Variation an zwei Enden eines Spektrums, das von Variation in kleinem Maßstab (Variation innerhalb von Gebieten = Homogenität) bis zu Variation in großem Maßstab (Variation zwischen Gebieten = Komplexität) reicht. Da es keine natürliche Schranke zwischen kleinem und großem Maßstab gibt, gehen beide ineinander über und sind deshalb nicht unabhängig voneinander. Da die Grenzlinien zwischen den Gebieten die Stelle in einem Übergangsgebiet markieren, an dem eine Variante stärker wird als die andere, führt eine höhere Komplexität außerdem zu einer niedrigeren Homogenität, da sie automatisch mit insgesamt mehr (heterogenen) Übergangsgebieten einhergeht. Dieser Effekt wird dadurch
110
Methodik
verstärkt, dass durch die Intensitätsschätzung scheinbar scharfe Trennlinien zwischen Variantengebieten geglättet werden, was ebenfalls zur Absenkung der Homogenität führt. Dies ist eine Folge der Methode, jedoch keine unerwünschte, denn scharfe Grenzlinien sind oft ein Artefakt der stichprobenhaften Datenerhebung. Aufgrund der hohen Korrelation zwischen B und L ist es sinnvoll, nur jeweils einen von beiden für die Einschätzung von Strukturinformationen zu verwenden, da beide sehr ähnliche Aussagekraft haben. Ich werde dafür im Folgenden hauptsächlich auf B zurückgreifen, wenn es darum geht, die diatopische Variation ‚auf kleinem Maßstab‘ einzuschätzen. L kann allerdings dann noch ein sinnvoller Indikator sein, wenn es darum geht, die ‚Qualität‘ einer Flächenkarte, d. h. ihre Wiedergabetreue die Rohdaten betreffend, zu bewerten. 4.5 WAHL DER PARAMETER Bei der Vorverarbeitung der Daten durch die Intensitätsschätzung ist eine Reihe von Parametern festzulegen. Diese sind im Einzelnen: –
die Bandbreite (entspricht dem Grad der Glättung der Daten)
–
das Abstandsmaß (dgeo oder dlex)
–
die Kernfunktion (normalverteilungskern oder K3-Kern, theoretisch noch weitere Kerne möglich; vgl. SiLverMan 1986, 76–78)
–
das Abstraktionslevel (1–3)
Nach welchen Kriterien für jeden der Parameter einige geeignete Wahl für eine spezifische Anwendung getroffen werden kann, wird im Folgenden erörtert. 4.5.1 Bandbreite Die Bestimmung der Bandbreite ist eine der wichtigsten Entscheidungen bei der Durchführung der Intensitätsschätzung und damit bei der Erzeugung von Flächenkarten. Wie in Abschnitt 4.2.2 ausgeführt, ist die Bandbreite ein Glättungsparameter, der festlegt, wie stark die Punktdaten in der Fläche verteilt werden. Die geeignete Wahl des Glättungsparameters h stellt die größte Schwierigkeit bei der Implementierung eines Kernschätzers dar, wie er zur Bestimmung der Intensitäten in den Formeln (4) (S. 89) und (15) (S. 102) verwendet wird. Sie wirkt sich dadurch auch erheblich auf die Gestalt einer Flächenkarte aus – und damit auf ihre in Abschnitt 4.4 definierten Kennwerte. Somit muss für die Bandbreite h für jede Karte – d. h. für jede Variable – eine geeignete Wahl getroffen werden; es herrscht in der Literatur sogar die Ansicht, dass die Wahl der Bandbreite weit wichtiger ist als die Wahl der Kernfunktion (vgl. z. B. diggLe 2003, 188; MøLLer / waagepeterSen 2004, 37; Stoyan/Stoyan 1994, 237–239). Für zu große Werte von h gehen zu viele Details der Daten verloren, wohingegen für kleine Werte von h nicht ausreichend von den zugrunde liegenden Daten abstrahiert wird.
Wahl der Parameter
111
Abb. 26 (im Anhang, S. 254) zeigt die Auswirkung der Bandbreite für verschiedene Werte von h auf die mit dlex erzeugten Flächenkarten am Beispiel von K. 8.80 ‘Kartoffelkraut’. Bei den Bandbreiten 30 und 40 ist der Glättungseffekt wohl zu gering; die Gebiete sind stark zergliedert, einzelne Streubelege werden als eigenständige Gebiete gewertet, und orte mit fehlenden Belegen (weiß) können meist keinem Gebiet zugeordnet werden. Der nutzen der Intensitätsschätzung, nämlich die Kompensation von durch die Datenerhebung entstandenen Mängeln und Repräsentativitätsproblemen (vgl. 4.1), hält sich somit in Grenzen. Bei den Bandbreiten 50 und 60 zeigt die Glättung etwa den erwünschten Abstraktionsgrad, der es ermöglicht, von den Einzelbelegen zu einer (mithilfe der in Abschnitt 4.4 definierten Kennwerte auch quantifizierbaren) Beurteilung der Karte in Bezug auf Vorkommens- und Dominanzgebiete der wichtigsten Varianten zu kommen. Während Abb. 26c noch zu einem gewissen Grad die in Abb. 26a und b sichtbare Zerstückelung aufweist, zeigt Abb. 26d eine klare Gliederung in vier Gebiete, die allenfalls ein paar der Details im Süden vermissen lassen. Für die Bandbreiten 70 und 80 ist hingegen eine zu starke Glättung zu konstatieren, da sich die beiden häufigsten Varianten hier (fast) alle anderen, kleineren Gebiete einverleiben und so erhebliche, für die Deutung und Bewertung der Karte notwendige Informationen verlorengehen. Die ‚optimale‘, d. h. für unsere Zwecke am besten dienliche Bandbreite wäre nach dieser Einschätzung zwischen 50 und 60 zu suchen. Mit Blick auf die Aussagekraft eines ortes für einen anderen beschreibt die Bandbreite, wie diese mit wachsender Entfernung abnimmt. Davon abhängig, wie stark die Varianten einer Variablen räumlich kommuniziert werden, kann die Abnahme ‚schneller‘ oder ‚langsamer‘ geschehen; d. h. die Aussagekraft eines ortes für einen anderen kann von Variable zu Variable unterschiedlich sein, abhängig davon, wie ‚diffusionsaffin‘ die entsprechende Variable ist (vgl. auch 2.1.3.3, 2.2.4, 6.1.3). Deshalb ist es sinnvoll, für jede Variable eine individuelle Bandbreite zu bestimmen. Die Verwendung einer einzigen Bandbreite für alle Karten hat sich zudem als unbefriedigend erwiesen, da die unterschiedlichen Ausprägungen der Variantenverteilungen – je nach Ballung bzw. Durchmischung der Varianten – unterschiedliche Glättungsgrade erforderlich machen. Eine Karte, die schon als Punktsymbolkarte eine Struktur mit zwei großen Hauptgebieten, die ineinander übergehen, aufweist, ‚verträgt‘ mehr Glättung als eine Karte, die aus zahlreichen kleinen, jedoch deutlich voneinander abgegrenzten Gebieten besteht. In der einschlägigen Literatur werden verschiedene Möglichkeiten diskutiert, wie die Bandbreite geeignet gewählt werden kann (vgl. SiLverMan 1986), darunter auch automatisierte Verfahren, die die Bandbreite so wählen, dass das gegebene Punktmuster möglichst gut durch das zu ermittelnde Intensitätsfeld wiedergegeben wird. Ein sogenanntes Likelihood-Kreuzvalidierungsverfahren (likelihood cross-validation, LcV) arbeitet beispielsweise, indem überprüft wird, welche Bandbreite das lokale Vorkommen einer Variante am besten ‚vorhersagt‘. Dieses Verfahren hat sich jedoch als zu empfindlich gegenüber ‚Ausreißern‘ herausgestellt (vgl. auch SiLverMan 1986, 88). Daneben stellt die sogenannte Methode der kleinsten Quadrate (least-squares cross-validation, LScV) ein populäres Verfahren zur Bandbreitenoptimierung dar (vgl. z. B. SiLverMan 1986, 87–88). Bei ihr wird die Bandbreite
112
Methodik
so bestimmt, dass die Summe der Quadrate der Abweichungen zwischen dem Intensitätsfeld und den originaldaten minimal ist. Diese Methode liefert mit denen der LcV vergleichbare Ergebnisse, ohne eine vergleichbare Sensitivität gegenüber Streubelegen zu haben, erfordert jedoch erheblich mehr Rechenaufwand. Diese weit verbreiteten Verfahren, LcV und LScV, stellen sozusagen adaptive Parameter dar, die das Problem der Bandbreitenwahl für jede Karte auf eine einmalige Entscheidung – die Wahl des optimierungsverfahrens – reduzieren. Die mit diesen adaptiven Parametern ermittelten Bandbreiten liefern in den meisten Fällen durchaus zufriedenstellende Ergebnisse; in manchen Fällen aber nehmen die h-Werte im Hinblick auf die erzeugten Flächenkarten offenbar zu große oder zu kleine Werte an, so dass Informationen über Dominanzgebiete von Varianten, wie sie in den Flächenkarten dargestellt werden, verloren gehen. Die LcV-generierte Flächenkarte für K. 8.80 (Abb. 27a, im Anhang, S. 255) stellt wohl kein schlechtes Ergebnis dar, jedoch sind die kleineren Gebiete im Westen und Osten etwas unterrepräsentiert; die LScV-basierte Flächenkarte (Abb. 27b) hingegen ist noch stark zerstückelt und kann etwa für Augsburg (die weiße Zelle) keinen Schätzwert aufweisen. Aufgrund dieser Schwächen, die die etablierten Verfahren zur Bandbreitenbestimmung bei der Verwendung für die Erzeugung von Flächenkarten beeinträchtigen, wurde für diese konkrete Anwendung ein weiterer adaptiver Parameter entwickelt. Dieser greift auf die in Abschnitt 4.4 vorgestellten Kennwerte zurück und verwendet sie als Kriterien für eine optimale Umsetzung als Flächenkarte. Eine Flächenkarte soll einerseits einen Überblick über vorhandene Strukturen verschaffen und dabei andererseits nicht ungenauer als nötig sein. Für beide Kriterien liegen quantifizierbare Eigenschaften der Flächenkarten vor: Bei kleiner Bandbreite ist die Gesamtgrenzlänge auf der Karte am höchsten; mit zunehmendem Glättungsgrad sinkt sie, bis sie irgendwann 0 erreicht und die Karte nur noch aus einem Gebiet besteht. Die Gesamtgrenzlänge C (vgl. 4.4.1) kann daher als ‚Arbeitsmaß‘ für die relative Vereinfachung der Ursprungsstruktur einer Karte verwendet werden. Daneben bietet die Kompaktheit L ein Maß für die Treue einer Flächenkarte zu den originaldaten (vgl. 4.4.2), dessen Wert bei geringer Bandbreite am höchsten ist und mit zunehmender Glättung abnimmt. Es liegt also nahe, ein ausgewogenes Verhältnis zwischen den Werten C und L einer Flächenkarte anzustreben: C sollte möglichst klein sein, um einen gewissen Grad an Abstraktion zu gewährleisten; L sollte dagegen möglichst groß sein, damit die nähe zu den originaldaten in ausreichendem Maße gegeben ist und Detailstrukturen in der Flächenkarte nicht verschwinden. Da sich beide Werte entgegengesetzt verhalten, bietet sich die Verwendung einer Kostenfunktion an. Die Bandbreite h wird dabei so gewählt, dass das folgende Funktional für Flächenkarten maximiert wird:81 max C(h) – C(h) ∙ L(h)– min L(h) → max h∈ Θ
81
h∈ Θ
h∈ Θ
(20)
Für die Implementierung und optimierung der Kostenfunktion danke ich henrik h aSSfeLd.
Wahl der Parameter
113
Der Bandbreiten-Parameter h durchläuft dabei einen Parameterraum Θ, in dem h so gesucht wird, dass das Funktional seinen maximal möglichen Wert annimmt. Der Parameterraum ist durch den minimalen und den maximalen Abstand zwischen zwei Orten definiert, d. h. Θ = [min d; max d], wobei für d je nach Anwendung dgeo oder dlex einzusetzen ist. Die Idee hinter diesem Vorgehen ist, dass die resultierenden Flächenkarten eine möglichst geringe Komplexität (für ausreichende Abstraktion) und gleichzeitig eine möglichst hohe Kompaktheit (für ausreichende Wiedergabetreue) aufweisen sollen. Da sich C und L bei wachsender Bandbreite unterschiedlich stark verändern, wird die Bedeutung von L in der Kostenfunktion durch die Wurzel reduziert. Die Wirkung dieser CL-Bandbreitenoptimierung im Fall der Beispielkarte 8.80 zeigt Abb. 27c (im Anhang, S. 255). Die Bandbreite liegt nun innerhalb des intuitiv als sinnvoll eingeschätzten Bereichs zwischen 50 und 60. Alle vier Gebiete sind deutlich ausgeprägt, und für alle orte liegt ein Schätzwert vor. Das in Abb. 27b sichtbare kleinere Gebiet im Südwesten ist ansatzweise vorhanden, und einzelne rote orte im Süden verdeutlichen, dass dort eine gewisse Präsenz der Variante gegeben ist. Dieses Ergebnis der CL-Methode stellt den besten Kompromiss unter den betrachteten Bandbreitenbestimmungsverfahren dar. Hinzu kommt, dass sie weitaus weniger rechenintensiv ist als das LcV- oder das LScV-Verfahren. Es muss nicht erwähnt werden, dass eine objektive Bewertung der verschiedenen Verfahren schwierig ist, da nicht klar, welche Kriterien anzusetzen sind. Die statistische Literatur bietet hier keine universellen Entscheidungsregeln, und nennt sogar die Wahl der Bandbreite (nicht nur des automatischen Verfahrens) nach subjektivem Eindruck als legitimes Vorgehen (vgl. SiLverMan 1986, 43–45). Vor diesem Hintergrund ist es wohl zulässig, ein Kriterium zu definieren, das auf die spezielle Anwendung für die Erzeugung von Flächenkarten zugeschnitten ist, indem es Eigenschaften dieser Flächenkarten als Parameter heranzieht, wie es in der Kostenfunktionale in Formel (20) vorliegt. Die CL-Methode ist auf verschiedene Abstandsmaße gleichermaßen anwendbar. Abb. 28 (im Anhang, S. 255) zeigt zum Vergleich die entsprechenden Karten mit dgeo als Abstandsmaß unter Verwendung der verschiedenen Methoden zur Bestimmung von h. Während sich bei LcV die oben erwähnte Anfälligkeit gegenüber Streubelegen (vgl. S. 111) sehr stark äußert, liefert diesmal LScV ein durchaus brauchbares Ergebnis. Wiederum bietet jedoch auch hier die CL-Methode die augenscheinlich beste Einteilung. 4.5.2 Kernfunktion Während die Bandbreite bestimmt, wie stark der Einfluss eines Ortes in seine Umgebung ausstrahlt, legt die Kernfunktion fest, in welcher Form dies geschieht. Beim in Abschnitt 4.2.2 vorgestellten normalverteilungskern KGauß etwa (vgl. Abb. 12, S. 88) fällt der Einfluss in der näheren Umgebung zunächst schwach ab, bei wachsender Entfernung dann stärker. Ab einem bestimmten Punkt flacht die Kurve wieder ab, wobei auch in großer Entfernung nie der Wert 0 erreicht wird.
114
Methodik
obwohl der Wahl der Kernfunktion im Vergleich zur Wahl der Bandbreite eine nachrangige Bedeutung zugemessen wird, muss auch sie in geeigneter Weise getroffen werden. neben dem normalverteilungskern werden in der einschlägigen Literatur weitere Kerne vorgestellt (vgl. z. B. SiLverMan 1986, 43). Für die Verwendung im vorliegenden Intensitätsschätzungsverfahren hat sich der sogenannte K3Kern bewährt, der starke Ähnlichkeit mit KGauß aufweist, jedoch bei Überschreiten der Bandbreite den Wert 0 erreicht.
K3 (d,h) =
d ⎧ –1 ⎪ 4π 1– h ⎨ ⎪0 ⎩
d 1h
2 3
2 3
für d < h, (21) für d ≥ h.
Abb. 29: K3-Kern.
Der wesentliche Vorteil dieser Kernfunktion gegenüber der normalverteilungsfunktion besteht darin, dass er wesentlich schneller berechnet werden kann (vgl. SiLverMan 1986, 76–77, 88–89). Auch der Umstand, dass K3 sich nicht asymptotisch 0 annähert, sondern für d ≥ h tatsächlich den Wert 0 annimmt, stellt unter vielen Szenarien einen Vorteil dar. K3 wird deshalb in dieser Arbeit ausschließlich verwendet. 4.5.3 Abstandsmaß In Abschnitt 4.3 wurde ausgeführt, inwiefern die Verwendung eines ‚kommunikativen‘ oder ‚linguistischen‘ Abstandsmaßes anstelle des konventionellen geographisch-euklidischen Abstandes sinnvoll sein kann. Dies bedeutet jedoch nicht, dass dem in Form von dlex implementierten lexikalischen Abstand bei wortgeographischen Untersuchungen uneingeschränkt der Vorzug zu geben ist. Unter bestimmten, verfahrenstechnisch bedingten Voraussetzungen kann auch die Ver-
115
Wahl der Parameter
wendung von dgeo die bessere Wahl sein. Die Entscheidung für dgeo oder dlex ist je nach Anwendungsziel zu treffen. dlex ist vor allem dazu geeignet, eine bessere Abbildung von Details (etwa von Grenzverläufen oder Sprachinseln) zu ermöglichen. Dies prädestiniert dieses Abstandsmaß vor allem für die Verwendung bei der Überprüfung außersprachlicher Einflussfaktoren, wie sie in Abschnitt 5.1.3 durchgeführt wird, da diese sich normalerweise raumgebunden manifestieren, während innersprachliche Faktoren dazu tendieren, raumu ngebundene Verbreitungsmuster auszubilden (vgl. 1.2.1). ob dlex auch die bessere Wahl für die Überprüfung innersprachlicher Faktoren ist (vgl. 5.1.1, 5.1.2), hängt deshalb eher davon ab, ob die Kennwerte solche raumungebundenen Verbreitungsmuster bei dlex besser quantifizieren als bei dgeo (vgl. 4.4). Hierfür bieten die Kennwerte selbst gute Anhaltspunkte. Die Kompaktheit oder ‚Wiedergabetreue‘ L beispielsweise beschreibt, wie gut die originaldaten durch eine Flächenkarte repräsentiert werden; ein hoher L-Wert bedeutet demnach, dass die Flächenkarte eine gute Darstellung der tatsächlichen Belegsituation ist. Auf der anderen Seite sollen die Kennwerte B und C möglichst unabhängig voneinander verschiedene Eigenschaften der Variablendistributionen beschreiben; das bedeutet, dass die gegenseitige Abhängigkeit der Kennwerte B und C (vgl. 4.4.4) nicht zu hoch sein darf, da mit jedem der Werte eine distinkte Eigenschaft der Flächenkarten wiedergegeben werden soll; mit anderen Worten, B und C sollen möglichst nicht dasselbe messen. Zwar gibt es bereits eine relativ hohe inhaltlich bedingte Korrelation zwischen B und C (Karten mit hoher Komplexität neigen auch zu höherer Heterogenität), doch die verfahrenstechnisch bedingte Korrelation ist möglichst gering zu halten. Daher liegt es nahe, den Mittelwert von L über alle Karten (im Folgenden L̅ ) und den pearSon’schen Korrelationskoeffizienten der B- und C-Werte (ϱ(B,C)) für dgeo und dlex zu betrachten. dgeo L̅ Level 1 Level 2 Level 3
dlex
ϱ(B,C) 0,693 0,719 0,761
L̅ ‒0,703 ‒0,700 ‒0,696
ϱ(B,C) 0,731 0,752 0,776
‒0,873 ‒0,827 ‒0,805
Tab. 5: Gütekriterien L̅ und ϱ(B,C) für mit geographischem bzw. linguistischem Abstand erzeugte Flächenkarten aller 735 Variablen (Bandbreitenbestimmungsverfahren: CL).
Für alle drei Levels führt dlex zu einer größeren mittleren Wiedergabetreue als dgeo, wobei sich der Abstand von Level 1 bis Level 3 stark verringert. Die negative Korrelation zwischen der Heterogenität und der Komplexität der Flächenkarten ist durchweg bei dgeo geringer als bei dlex. Zusammenfassend lässt sich wohl sagen, dass die besseren Werte von dgeo in Bezug auf ϱ(B,C) die schlechteren in Bezug auf L̅ aufgrund des größeren Unterschieds überwiegen.82 Dies spricht dafür, für intra82 Theoretisch könnte man hier wie im vorausgehenden Abschnitt eine Kostenfunktion aufstellen, die das Verhältnis zwischen L̅ und ϱ(B,C) optimiert. Aufgrund der überschaubaren Menge an Wertepaaren wird hier darauf verzichtet.
116
Methodik
linguistische Analysen eher auf dgeo als auf dlex zu setzen, ohne dass die andere Möglichkeit gänzlich ungeeignet wäre. 4.5.4 Abstraktionslevel Aus Tab. 5 (S. 115) geht hervor, dass die Wiedergabetreue L einer Karte im Durchschnitt von Level 1 bis Level 3 ansteigt, was nicht weiter verwundert: Level 3 hat den höchsten Abstraktionsgrad, d. h. relativ viele Einzelbelege werden zusammengefasst (vgl. 3.2), was die Gebiete insgesamt größer werden lässt und dadurch zu höherer Kompaktheit führt. Doch auch die negative Korrelation zwischen B und C ist für beide Abstandsmaße auf Level 3 am geringsten, was als ein Gütemerkmal angesehen werden kann, da die individuelle Aussagekraft beider Kennzahlen dann höher ist. Beide Kriterien sprechen also für die Verwendung von Level 3, auf dem die Einzelkarten sowohl die höchste Wiedergabetreue erreichen als auch die größte Unabhängigkeit zwischen den charakteristiken B und C. Die meisten Analysen in Kapitel 5 werden deshalb mit Level 3 durchgeführt. Unter besonderen Umständen oder für besondere Fragestellungen kann jedoch durchaus auch einer der anderen Abstraktionsgrade eine sinnvolle Wahl darstellen (s. z. B. 5.2.1). 4.6 STATISTIScHE VERFAHREn Wie in Abschnitt 4 angedeutet, werden in dieser Studie statistische Methoden angewandt, um Annahmen und Postulate über den Zusammenhang von sprachgeographischen Strukturen und inner- und außersprachlichen Faktoren zu überprüfen. In den folgenden Abschnitten werden Grundprinzipien von statistischen Tests vorgestellt, die in Kapitel 5 (Analyse) Verwendung finden. Da diese zunächst nicht anwendungsbezogene Darstellung etwas abstrakt ist, mag der Leser es praktischer finden, diese Seiten zunächst zu überspringen und bei Bedarf bei der Lektüre des Analyse-Kapitels zu konsultieren. 4.6.1 Testen von Hypothesen83 Eine statistische Hypothese ist eine Aussage über die Grundgesamtheit oder über die Wahrscheinlichkeitsverteilung, aus der eine oder mehrere Stichproben stammen. Die zu testende Hypothese wird als nullhypothese H0 bezeichnet, der eine mit ihr unvereinbare Alternativhypothese H1 gegenübersteht, die meist für einen vermuteten Zusammenhang steht und damit die eigentlich ‚interessante‘ Hypothese darstellt. Die nullhypothese ist dagegen sozusagen die Arbeitshypothese, die im normalfall davon ausgeht, dass ein vermuteter Zusammenhang n icht besteht. 83 Die Ausführungen in diesem Abschnitt beruhen im Wesentlichen auf gibbonS (1985, 8–16) und kugLer (2009, 15–18).
Statistische Verfahren
117
Gibt es genügend Evidenz dafür, dass sie nicht zutrifft, so wird sie zugunsten der Alternativhypothese verworfen, was einer Bestätigung des mutmaßlichen Sachverhalts gleichkommt (vorbehaltlich einer gewissen Fehlerwahrscheinlichkeit). Im Testverfahren wird anhand der Stichprobe(n) entschieden, ob die nullhypothese zugunsten der Alternativhypothese verworfen wird. Der eigentliche Test besteht aus einer Ablehnungsregel, die die Entscheidung steuert, ob die nullhypothese bei einem vorher festgelegten Signifikanzniveau α abzulehnen ist; dabei muss die Wahrscheinlichkeit p, dass H0 verworfen wird, obwohl sie zutrifft, kleiner als α sein. Diese Wahrscheinlichkeit ist der sogenannte p-Wert, der oft in statistischen Tests verwendet wird, um das Ergebnis auszudrücken: Ist p < α, so gilt der Wert als signifikant (H0 wird verworfen); ist p ≥ α, so liegt keine Signifikanz vor (H0 wird aufrechterhalten). Um einen Test zu konstruieren, wird eine sogenannte Testgröße T festgelegt, die eine Funktion der beobachteten Daten darstellt; sie ist sozusagen das Kriterium für die Ablehnungsregel von H0. Die Wahrscheinlichkeit p, die angibt, wie wahrscheinlich es unter Annahme des Zutreffens von H0 es ist, einen mindestens so extremen Wert für T zu erhalten, wie er sich aus den beobachteten Daten ergibt, muss für die Ablehnung von H0 kleiner als α sein. Die Konstruktion des Tests hängt von der Hypothese und von der Beschaffenheit der Daten ab. So wird etwa zwischen parametrischen und nicht-parametrischen Tests unterschieden: Bei parametrischen Tests wird davon ausgegangen, dass die Zufallsvariable eine bestimmte Verteilung aufweist (z. B. normalverteilung); für nicht-parametrische Tests sind solche Annahmen in der Regel nicht erforderlich, d. h. man kann sie auch auf Daten anwenden, über deren Verteilung man nichts weiß. Parametrische Tests sind bei nominal- oder ordinalskalierten Daten nicht anwendbar, hier benötigt man nicht-parametrische Testverfahren. 4.6.2 Monte-carlo-Methoden84 Sogenannte Monte-carlo-Tests sind statistische Testverfahren, die auf Simulation beruhen. Dabei werden zufällige Realisationen im Ereignisraum S einer bestimmten Zufallsvariablen automatisch erzeugt, d. h. Zufallsstichproben ‚simuliert‘, und mit einer zu untersuchenden ‚echten‘ Stichprobe verglichen. So kann festgestellt werden, ob die Werte der echten Stichprobe der gleichen Verteilung unterliegen wie die Werte der simulierten Zufallsstichproben, m. a. W. ob die Verteilung der Werte der Stichprobe den gleichen Gesetzmäßigkeiten unterliegt wie die der simulierten Werte, oder ob andere Faktoren eine Rolle spielen. Die Schwierigkeit besteht hier oft in der Konstruktion des Simulationsmechanismus. Die Formulierung des Hypothesenpaars eines einseitigen Monte-carlo-Tests lautet für eine zufällige Stichprobe X = (X1, …, Xn) mit Stichprobengröße n ∈ ℕ und den Realisationen x = (x1, …, xn) ∈ S ⊂ ℝ n wie folgt: 84 Für die Ausführungen in diesem Abschnitt vgl. kugLer (2009, 18–21). Monte-carlo-Tests finden Anwendung in den Abschnitten 5.1.2 und 5.1.3.
118
Methodik
H0: φ(X) ≥ φ(Y)
vs.
H1: φ(X) < φ(Y),
(22)
wobei Y = (Y1, …, Yn) eine Stichprobe mit Realisationen in S ist und φ eine messbare Funktion der Stichproben, beispielsweise deren Standardabweichung. Realisationen der Stichprobe Y werden durch Simulation erzeugt. Die Annahme der nullhypothese wäre demnach, dass eine bestimmte Funktion der ‚tatsächlichen‘ Stichprobe X, z. B. ihre Standardabweichung, mit der der Realisationen der simulierten Zufallsstichprobe Y übereinstimmt, während die Alternativhypothese die Ungleichheit dieser Funktionen aussagt. Konkret soll z. B. im Fall der Standardabweichung getestet werden, ob die Standardabweichung der Stichprobe X innerhalb eines bestimmten, durch den Ereignisraum S vorgegebenen Rahmens durch Zufall erklärbar ist oder nicht. Um dies zu überprüfen, wird eine große Anzahl von Realisationen von Y erzeugt. Je größer die Anzahl der Simulationen, umso besser wird – nach dem Gesetz der großen Zahl – die Zuverlässigkeit des Tests. Die Zahl der Simulationen M wird vorher spezifiziert; übliche Werte sind z. B. 99 oder 999. Durch die wiederholte Simulation erhält man M Realisationen von Y mit je n Proben, bezeichnet als y1 = (y11, …, y1n); …; y M = (y1M, …, y nM). Für y1 bis y M sowie für x wird nun φ berechnet. oft geschieht dies mittels einer geeigneten Schätzfunktion φ̂, da sich Funktionen wie die Standardabweichung nicht unmittelbar aus den Realisationen der Stichprobe berechnen lassen. Die erhaltenen Werte von φ bzw. φ̂ werden nun der Größe nach sortiert. Ist φ̂(x) unter den ⌊α · (M + 1)⌋ kleinsten Werten, so ist H0 zu verwerfen. Damit ist die Testgröße TMc(φ̂(x)) definiert: Sie gibt die Position von φ̂(x) in den M + 1 aufsteigend sortierten Werten von φ̂ an. Der p-Wert ist nun zu berechnen als der Anteil von φ̂-Werten, die kleiner oder gleich φ̂(x) sind, an den M + 1 gesamten φ̂-Werten: p=
|Φ(x)| , M +1
(23)
wobei Φ(x) = {y | φ̂(y) ≤ φ̂(x)}. Ist p < α, so ist dies als Bestätigung dafür zu werten, dass die tatsächliche Stichprobe X einer anderen Verteilung unterliegt – z. B. in Bezug auf die Standardabweichung – als die artifizielle Stichprobe Y. 4.6.3 Faktorenanalyse Die Faktorenanalyse (FA) ist ein Analyseverfahren aus der multivariaten Statistik, das auf Daten- bzw. Dimensionsreduktion beruht.85 dougLaS biber, der die FA erstmals in der Variationslinguistik verwendet hat, fasst ihre Arbeitsweise am Beispiel der Analyse textueller Variation wie folgt zusammen: In a factor analysis, a large number of original variables, in this case the frequencies of linguistic features, are reduced to a small set of derived variables, the ʻfactorsʼ. Each factor 85 Für eine Einführung in die Funktionsweise der FA vgl. tabaChniCk /fideLL (2007, 607–627).
Statistische Verfahren
119
represents some area in the original data that can be summarized or generalized. That is, each factor represents an area of high shared variance in the data, a grouping of linguistic features that co-occur with a high frequency. (biber 1991, 79)
Die grundlegende Arbeitsweise der FA ist also, die Variation in den Daten auf wenige zugrunde liegende Faktoren zurückzuführen.86 Es kann vorkommen, dass mehrere sprachliche Varianten dazu tendieren, gemeinsam aufzutreten, d. h. ihre Wahrscheinlichkeiten korrelieren. Solche Varianten kann man zusammenfassen, indem man ihre korrelierenden Anteile durch einen Faktor ausdrückt. Dadurch lassen sich die Distributionen einer Vielzahl von Varianten durch einige wenige Faktoren beschreiben, und jede einzelne Variantendistribution durch eine Kombination aus Faktoren. Ein wesentlicher Vorteil gegenüber anderen datenreduzierenden Verfahren wie z. B. der in der Dialektometrie verwendeten Aggregation (vgl. 1.2.2) besteht u. a. darin, dass die Ursprungsdaten aus den dimensionsreduzierten Daten weitgehend wiederhergestellt werden können, d. h. es werden bei der Datenreduktion im Idealfall nur redundante Informationen zusammengefasst, alle distinktiven bleiben erhalten. Einer der grundlegenden Vorteile der FA (auch gegenüber der verwandten Hauptkomponentenanalyse) liegt in den Möglichkeiten bei der Interpretation der Ergebnisse (vgl. Leinonen 2010, 37). Zudem führt sie zu robusten Ergebnissen, da die Sensitivität gegenüber kleinen Schwankungen in den Ausgangsdaten nicht so groß ist wie etwa bei der clusteranalyse (vgl. Leinonen 2010, 37). Mit dem linearen Modell der FA (vgl. vogeLbaCher 2011, 22) wird versucht, die Rohdatenmatrix W durch die Kombination weniger Faktoren F mit ihren individuellen Ladungen L zu beschreiben. Die Matrix µ enthält die Erwartungswerte der Variablen. Die Bestandteile der Varianz in W, die nicht von den Faktoren erfasst werden kann, bilden die Matrix der Residuen E. W= µ+L·F+E
(24)
Eine detailliertere und anwendungsbezogene Beschreibung des Vorgehens bei der FA erfolgt im Zuge ihres Einsatzes (vgl. 5.2).
86 neben der Anwendung der FA im Bereich der Textanalyse wie bei biber (1991) gibt es mittlerweile einige Anwendungen im Bereich der Geolinguistik, darunter nerbonne (2006), hyvönen/Leino/SaLMenkivi (2007), Leino/hyvönen (2009), grieve (2009), Leinonen (2010) und SzMreCSanyi /woLk (2011).
5 AnALySE Wie im vorangehenden Kapitel angedeutet, werden bei der Auswertung der Daten auf der einen Seite Methoden zur Überprüfung von Hypothesen und auf der anderen Seite Methoden zur Extraktion von Struktur aus den Daten angewandt. Erstere verwenden die Daten, um Annahmen über bestimmte Zusammenhänge auf den Prüfstand zu stellen (data-based); diese Annahmen sind vorgefasst, und es gilt, sie auf der Grundlage der Daten zu überprüfen. Eine solche Vorgehensweise ist konfirmatorisch, d. h. bereits existierende Annahmen über die Daten werden entweder verworfen oder bekräftigt. Bei der anderen Herangehensweise sind die Daten selbst die treibende Kraft (data-driven), d. h. sie werden ohne vorher formulierte Hypothesen nach Strukturen und Zusammenhängen durchsucht; dieses Vorgehen nennt man explorativ. 5.1
KonFIRMAToRIScH (DATA-BASED)
In der ersten Hälfte des Analysekapitels werden vermutete oder im Raum stehende Zusammenhänge, wie sie in Abschnitt 1.2.1 vorgestellt wurden, auf ihre Stichhaltigkeit überprüft. So wird getestet, ob Eigenschaften, die sich den sprachlichen Variablen zuschreiben lassen (wie etwa Themengebiet oder Gebrauchsfrequenz), als innersprachliche Faktoren für die geographischen Verteilungen auf den entsprechenden Karten infrage kommen. Daneben wird untersucht, ob außersprachliche Bedingungen – d. h. in unserem Fall: nicht-sprachliche, geographisch fassbare Strukturen – einen nachweisbaren Einfluss auf die Distribution sprachlicher Varianten haben. 5.1.1 Gebrauchsfrequenz Zum Zusammenhang zwischen der Gebietsgröße von Varianten und deren Gebrauchsfrequenz macht adoLf baCh folgende Aussage (vgl. auch 1.2.1.1): Wortarmut und damit Großräumigkeit gilt dort, wo lebenswichtige, alltägliche, vielgebrauchte, oft beachtete Dinge und Vorstellungen gemeint sind. […] Wortreichtum und damit Kleinräumigkeit kennzeichnen die namen von Dingen, mit denen sich die Volksphantasie stark beschäftigt, zu denen der Mensch ein gefühlsbetontes Verhältnis hat, die aber für die Allgemeinheit und den allgemeinen Verkehr von untergeordneter Bedeutung bleiben. (baCh 1950, 170)
Lässt man die angesprochene (schwer fassbare) semantische Komponente außer Acht, so könnte man baChS Aussage vereinfacht auf die simple Formel „Gebietsgröße ~ Gebrauchsfrequenz“ herunterbrechen: Gebietsgröße und Gebrauchsfre-
Konfirmatorisch (data-based)
121
quenz sollten positiv korreliert sein. Dies wird von baCh anhand folgender Beispiele illustriert: Großräumige Formenkreise [= Variantendistributionen] zeigt […] etwa die Verbreitung der Wörter Haus, Dach, Wolf, Brot, Milch, Schuh. Kleinräumig dagegen ist die Verbreitung von Ausdrücken für die Begriffe Eichelhäher, Glühwürmchen, Heuschrecke, Maulwurf, Maßliebchen, Kreisel, für die eine Fülle von Synonymen über den dt. Raum hin auftritt. (baCh 1950, 63)
Durch die in Kapitel 4 eingeführten Methoden zur Verarbeitung von geolinguistischen Daten sind wir nun in der Lage zu testen, ob für unsere Daten ein solcher Zusammenhang tatsächlich besteht. Ein Maß für die durchschnittliche Gebietsgröße auf der Karte einer sprachlichen Variablen liegt mit der Komplexität C (4.4.1) vor: Je höher C, desto kleiner sind die Gebiete auf der Karte. Wenn baChS Beobachtung stimmt, müsste C also mit den Gebrauchshäufigkeiten der Variablen negativ korreliert sein. Um dies zu überprüfen, werden Daten über die Vorkommenshäufigkeit der auf den Karten verzeichneten Variablen benötigt, d. h. darüber, wie häufig eine bestimmte Bedeutung oder sprachliche Funktion verwendet wird. Solche Daten liegen etwa in Form des „Häufigkeitswörterbuchs gesprochener Sprache“ (HGS) von arno ruoff (1981) vor. Dieses Wörterbuch hat den Vorzug, dass es auf einem gesprochensprachlichen Korpus „unvorbereiteter, freier Gespräche“ (ruoff 1981, 9) beruht, das aus einer zu unserem Untersuchungsgebiet benachbarten Region (Baden-Württemberg; vgl. ruoff 1981, 10) stammt, was wohl eine ausreichende Ähnlichkeit zu Bayerisch-Schwaben haben dürfte, da nicht mit großen Unterschieden in der Va r iablen häufigkeit (wohl aber in der Va r ia ntenhäufigkeit) zu rechnen ist. Erfasst wurden in ruoffS Erhebung „Mundarten und Umgangssprachen“ (ruoff 1981, 9), was unserer Untersuchung ebenfalls entgegenkommt. Mit der Verwendung des HGS und dem Abgleich seiner Daten mit Informationen aus dem SBS sind jedoch auch einige Probleme verbunden, die nachfolgend kurz dargestellt werden. 1. Eine erhebliche Problematik bei der Untersuchung von lexikalischen Merkmalsfrequenzen ist, dass die Auftretenshäufigkeiten einzelner Lexeme sehr stark vom Gesprächsthema abhängig sind: „one challenge in the study of lexical variation is that term frequencies are influenced by a variety of factors, such as the topic of discourse“ (eiSenStein et al. 2010, 1277). Man kann also (vor allem bei Inhaltswörtern) von einer ‚absoluten‘ Variablenfrequenz gar nicht sprechen, lediglich von einer variablen, vom Thema und anderen Faktoren abhängigen Frequenz. Man muss sich damit begnügen, derlei Zusammenhänge nur in groben Zügen zu untersuchen, und die angegebenen Frequenzen lediglich als Indikatoren für eine grobe Einteilung in ‚eher häufig‘ und ‚eher selten‘ ansehen. Dass die Informantengespräche bei der Aufnahme für das HGS in erster Linie über ‚ländliche‘ Themen mit einem „erhebliche[n] Vorherrschen der Themenkreise Landwirtschaft und Waldarbeit“ (ruoff 1981, 14) geführt wurden, scheint also für eine basisdialektale Untersuchung jedenfalls nicht ganz unpassend zu sein.
122
Analyse
2. Ein weiteres Problem besteht darin, dass im HGS nicht die Häufigkeiten von Variablen verzeichnet sind, sondern Häufigkeiten von Varianten; eine Zuordnung zu Variablen oder Bedeutungsangaben gibt es nicht. Die Variantenhäufigkeiten müssen deshalb zu Variablenhäufigkeiten addiert werden: Wenn etwa die Frequenz der Variable ‘Großmutter’ ermittelt werden soll, so müssen die Frequenzen der Varianten Großmutter, alte Mutter, Ahne usw. aus dem HGS ermittelt und anschließend zusammengefasst werden. Häufig treten jedoch bei der Ermittlung der Variantenfrequenzen Probleme auf. So ist z. B. beim Lemma spielen nicht ersichtlich, wie oft es in der Bedeutung ‘ein Spiel spielen’, und wie oft es in der Bedeutung ‘ein Instrument spielen’ im Korpus vorkommt, da nur eine Zahl für das Vorkommen der Ausdrucksseite, unabhängig von der Bedeutung, gegeben wird. So bereitete die Zuordnung der Lemmata und ihrer Häufigkeiten zu den sprachlichen Variablen des SBS immer wieder Schwierigkeiten. nichtsdestoweniger stellt das HGS die beste verfügbare Quelle für Häufigkeiten in einer dem SBS vergleichbaren Sprachlage dar, und für eine Vielzahl (687) der 735 betrachteten Variablen konnten einigermaßen verlässliche absolute Vorkommensfrequenzen aus dem HGS extrahiert werden. 3. Schließlich ist zu anzumerken, dass im SBS eine gewisse neigung zugunsten von komplexeren Karten herrscht. Dies liegt daran, dass Variablen, die praktisch keine geographisch relevante Verteilung aufwiesen, nicht im SBS kartiert wurden. Dabei handelt es sich im normalfall um solche Phänomene, die „im ganzen Untersuchungsgebiet relativ gleichförmig vorkommen. Über sie wird im Kommentarteil in den Einleitungen zu den einzelnen systematischen Kapiteln berichtet“ (SBS, Bd. 1, 40). Es fehlen also gerade solche Variablen,
0,12
Komplexität C (in km–1)
0,10 0,08 0,06 0,04 0,02 0,00 1
10
100
1000
10000
Gebrauchsfrequenz nach dem HGS (logarithmisch)
Abb. 30: Zusammenhang der Gebrauchsfrequenz (absolute Vorkommenshäufigkeit) nach dem HGS (x-Achse) mit der Komplexität C einer Variablenkarte (y-Achse). Die x-Achse ist aus Gründen der Übersichtlichkeit logarithmisch skaliert.
123
Konfirmatorisch (data-based)
die sehr großräumige Variantengebiete bilden, was die Resultate etwas verzerren kann. Wie Abb. 30 zeigt, ist kein nennenswerter Zusammenhang zwischen der Kartenkomplexität und der Frequenz einer Variablen zu erkennen. Diese Einschätzung wird durch den pearSon’schen Korrelationskoeffizienten bestätigt, der mit ϱ = ‒0,053 recht gering ausfällt. Der innerhalb dieser Gegenüberstellung erkennbare Einfluss ist leicht negativ, was baChS Beobachtung also im Prinzip zu bestätigen scheint; eine lineare Regressionsanalyse ergibt jedoch eine Bestimmtheit von R2 = 0,0028, d. h. der lineare Zusammenhang der beiden Größen erklärt lediglich 0,28 % der Variation der Komplexität der vorliegenden Karten. Damit ist der Zusammenhang äußerst klein (ein F-Test bestätigt, dass er nicht signifikant von 0 verschieden ist; p = 0,17), was bedeutet, dass die Vorkommenshäufigkeit einer sprachlichen Variablen als Prädiktor für die Komplexität der zugehörigen Karte nicht geeignet ist. Doch auch andere Struktureigenschaften als die Komplexität von Distributionen wurden mit der Vorkommenshäufigkeit der Variablen in Verbindung gebracht. So schreibt etwa Jozef Leenen: Je bekannter und gebräuchlicher ein Begriff ist, um so deutlicher ist die Unterscheidung der vorkommenden Worttypen und um so schärfer die Abgrenzung der entsprechenden Wortgebiete. (Leenen 1952, 34; zitiert nach gooSSenS 1969, 88)
Die Schärfe der Abgrenzung von Wortgebieten lässt sich wiederum mit einem in dieser Arbeit definierten Charakteristikum beschreiben: Die sogenannte Homogenität einer Karte, B (vgl. 4.4.3), gibt an, wie stark die Durchmischung des Gebiets einer Variante mit dem Vorkommen von anderen Varianten ist. Karten mit schärfer
1,0 0,9 0,8
Homogenität B
0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,0 1
10
100
1000
10000
Gebrauchsfrequenz nach dem HGS (logarithmisch)
Abb. 31: Zusammenhang der Gebrauchsfrequenz (absolute Vorkommenshäufigkeit) nach dem HGS (x-Achse) mit der Homogenität B einer Variablenkarte (y-Achse). Die x-Achse ist aus Gründen der Übersichtlichkeit logarithmisch skaliert.
124
Analyse
abgegrenzten Gebieten haben also höhere Werte von B, während Karten mit nicht scharf definierten Gebieten niedrigere Werte von B aufweisen. Ein Blick auf Abb. 31 (S. 123) verrät, dass auch hier bei statistischen Tests kein Zusammenhang zwischen Homogenität und Gebrauchshäufigkeit zu erkennen ist. ϱ ist diesmal mit 0,029 leicht positiv, was nicht verwundert, da C und B negativ korreliert sind (vgl. 4.4.4). Die lineare Regressionsanalyse ergibt eine Bestimmtheit von R2 = 0,00083; es wird also wie bei C nur ein minimaler Anteil der Variation in der Stichprobe (0,083 %) durch den linearen Zusammenhang mit der Frequenz erklärt. Dieser Anteil ist ebenfalls weit von Signifikanz entfernt (F-Test: p = 0,45). Der Vollständigkeit halber sei noch die dritte der in Abschnitt 4.4.2 vorgeschlagenen charakteristiken, die Kompaktheit oder Wiedergabetreue L, untersucht, bei der jedoch nicht mit überraschenden Ergebnissen zu rechnen ist, da sie sich ähnlich wie B verhält (vgl. 4.4.4). Auch die Darstellung in Abb. 32 lässt keinen Zusammenhang vermuten. Die Korrelation zwischen Gebrauchsfrequenz und Kompaktheit beträgt 0,012. Die Bestimmtheit bei einer linearen Regressionsanalyse beträgt 0,136 % (nicht signifikant von 0 verschieden; F-Test: p = 0,76). Somit wurde gezeigt, dass für keine der drei strukturellen Kartencharakteristiken – Komplexität, Homogenität oder Kompaktheit – Einfluss durch die Gebrauchshäufigkeit der sprachlichen Variablen nachgewiesen werden kann. Das bedeutet, dass die Aussagen von adoLf baCh und Jozef Leenen bezüglich des Zusammenhangs zwischen Gebietsgröße bzw. Grenzschärfe und der Gebräuchlichkeit der entsprechenden Variablen nicht bestätigt werden konnten. Diese Feststellung gilt freilich nur für die onomasiologischen wortgeographischen Karten des SBS, soweit den entsprechenden Variablen Frequenzwerte aus 1,0 0,9 0,8
Kompaktheit L
0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,0 1
10
100
1000
10000
Gebrauchsfrequenz nach dem HGS (logarithmisch)
Abb. 32: Zusammenhang der Gebrauchsfrequenz (absolute Vorkommenshäufigkeit) nach dem HGS (x-Achse) mit der Kompaktheit L einer Variablenkarte (y-Achse). Die x-Achse ist aus Gründen der Übersichtlichkeit logarithmisch skaliert.
Konfirmatorisch (data-based)
125
dem HGS zugewiesen werden konnten. Sie gilt auch nur für die sprachlichen Phänomene, die im SBS kartographisch erfasst sind (vgl. die Einschränkung weiter oben bzgl. einer neigung zugunsten von komplexeren Karten). Es ist also durchaus möglich, dass das Ergebnis anders ausfiele, würde man die fehlenden, sehr wenig komplexen Karten mit ins Korpus aufnehmen. Es ist jedoch sehr unwahrscheinlich, dass diese wenigen Karten, die wohl allesamt eine Komplexität von 0 km aufweisen würden, das Bild in signifikanter Weise kippen könnten. Eine weitere Einschränkung in Bezug auf die Aussagekraft der Ergebnisse besteht in der Problematik der Varianten-Variablen-Zuordnungen, auf die bereits weiter oben im selben Abschnitt hingewiesen wurde, die ebenfalls die Verlässlichkeit der Untersuchung beeinträchtigt. Trotz dieser Einschränkungen dürfte die Tendenz der Resultate im Groben aber wohl zutreffen. Sprachdynamisch interpretiert bedeutet dies, dass die Häufigkeit, mit der eine Variable versprachlicht wird, wohl keinen nennenswerten Einfluss auf die Diffusionseigenschaften ihrer Varianten hat. Würde sich mit erhöhter Gebrauchshäufigkeit auch die Diffusionsgeschwindigkeit erhöhen, so wäre mit größeren Arealen (und damit niedrigerer Komplexität) zu rechnen (so baChS Annahme); dies ist offenbar nicht der Fall. Möglicherweise hängt die Affinität zur Diffusion nicht von der Frequenz ab, mit der eine Variable gebraucht wird, sondern von den Kontexten, in denen sie gebraucht wird: Wird sie eher im häuslichen Bereich verwendet, so ist mit einer wenig räumlicher Diffusion zu rechnen; wird sie bei öffentlichen Anlässen gebraucht, so ist eher mit räumlicher Diffusion zu rechnen (vgl. 5.1.2.4). Auch in Bezug auf die Etablierung von Varianten lässt sich kein Zusammenhang feststellen; würden sich die Varianten häufig gebrauchter Variablen schneller etablieren, so wären homogenere Karten zu erwarten (so LeenenS Beobachtung); auch dies kann mit den vorliegenden Daten nicht bestätigt werden. Stattdessen scheint die Homogenität eher mit inhaltlichen Eigenschaften verknüpft zu sein (vgl. 5.1.2.4). Das Testen eines möglichen Zusammenhangs zwischen den Kennwerten und anderen sprachlichen Eigenschaften der Variablen als ihrer Frequenz ist an dieser Stelle leider nicht möglich, da verlässliche quantitative Daten über solche Eigenschaften fehlen. Ein Einblick in die Möglichkeiten bietet die Studie von SpeeLMan und geeraertS (2008; geeraertS/SpeeLMan 2010), in der die speziell erhobenen Eigenschaften Salienz, Vagheit und negativer Affekt von sprachlichen Phänomenen mit einer Maßzahl für distributionelle Heterogenität abgeglichen werden (vgl. 1.2.2). 5.1.2 Variablengruppen Dieser Teil der Datenauswertung widmet sich der Überprüfung von Zusammenhängen zwischen verschiedenen kategorialen Einteilungen der Variablen und ihren Distributionskennwerten. Dies involviert eine Zuweisung von Eigenschaften auf nominalniveau zu den Variablen: Eine Variable hat (oder vielmehr die Varianten einer Variable haben) – etwa für die ‚Dimension‘ Wortart – eine von mehreren Kategorien, z. B. Substantiv oder Adjektiv; diese Kategorien sind nominalskaliert,
126
Analyse
d. h. voneinander unterscheidbar, aber ohne eine Rangordnung oder einen Wert auf einer Skala zu besitzen. Anders als bei intervallskalierten Vergleichsdaten kann mit nominalskalierten Daten nicht einfach eine Korrelations- oder Regressionsanalyse vorgenommen werden, da den Werten, die sie annehmen können, die notwendigen numerischen Eigenschaften fehlen. Solche Daten erfordern nichtparametrische Testverfahren (vgl. 4.6.1). Einfach anwendbare und sinnvoll erscheinende Klassifikationen sind die Einteilungen gemäß Wortart, Bandzugehörigkeit und Themengebiet. Die Einteilung in Wor t a r ten erklärt sich von selbst. Die jeweiligen Bä nde können mit losen Themenverbänden in Verbindung gebracht werden. So behandelt Band 2 Themen aus dem weiten Bereich Mensch, während sich Band 12 mit landwirtschaftlichen Themen wie Ackerbau und Weidewirtschaft beschäftigt und Band 11 die Tierhaltung behandelt. Für Band 8, 10 und 13 sind keine so bündigen Überbegriffe zu finden. Die Kategorisierung nach T hemengebieten folgt der Einteilung der Karten durch die jeweiligen Autoren der Bände in Sachgruppen; so ist etwa Band 2 in die Themengebiete der menschl. Körper, körperl. u. seel. Äußerungen, die menschl. Gemeinschaft und Kleidung unterteilt. Diese Themengebiete stellen eher lose Anwendungsbereiche der sprachlichen Phänomene dar als rigide semantische Kategorien; gerade deshalb sind sie wohl näher an alltagsweltlich relevanten Domänen. Zwar haben die Einteilungen in Bände und Themengebiete klare Defizite (z. B. heißt eines der Themengebiete einfach weitere Karten), doch stellen sie aufgrund ihrer grundsätzlichen nähe zu Bereichen des Alltagslebens eine brauchbare Kategorisierung dar, zumal es schwierig ist, mit stringenteren relevanten Einteilungen aufzuwarten. Die konkrete Problemstellung für den vorliegenden Fall besteht nun darin, den Zusammenhang zwischen diesen Kategorien (d. h. nominalskalierten unabhängigen Variablen) und den Kennwerten C, L und B (vgl. 4.4) (d. h. intervallskalierten abhängigen Variablen) statistisch zu untersuchen. Dabei sind folgende Fragen zu klären: 1. Besteht ein Zusammenhang zwischen einzelnen Variablenkategorien und den durch die Kennwerte quantifizierten Eigenschaften der entsprechenden Distributionen? 2. Wenn ja, welcher Art ist die Auswirkung der Zugehörigkeit einer Variablen zu einer bestimmten Kategorie auf ihre geographische Verteilung? Für die Beantwortung dieser Fragen wird auf die in Abschnitt 4.6 eingeführten statistischen Tests zurückgegriffen. Hierfür werden die Werte, die C, L und B für die einzelnen Karten einer Kartengruppe annehmen, als Zufallsstichprobe behandelt.87 D. h.: Einer Gruppe G = {m1; …; mk} mit den entsprechenden k Variablen X m1, …, X mk aus der Gesamtmenge 𝕄 aller Variablen im Korpus und ihren entsprechenden Karten sind die drei Kennwertvektoren CG = {Cm1; …; Cmk}, LG = {L m1; …; L mk} und BG = {Bm1; …; Bmk} zugewiesen, die die Vergleichswerte für die nachfolgende Auswertung darstellen. 87 Zur Zulässigkeit dieser Annahme vgl. kugLer (2009, 52–53).
Konfirmatorisch (data-based)
127
Der Test wird nun so angelegt, dass überprüft wird, ob die Werte von CG, LG und BG insgesamt signifikant höher oder niedriger ausfallen, als es in einer zufällig zusammengewürfelten Gruppe H gleichen Umfangs der Fall wäre. Um dies zu überprüfen, d. h. um zu testen, ob die Werte innerhalb der Gruppe G signifikant groß oder klein sind, wird ein Monte-carlo-Testverfahren (vgl. 4.6.2) angewandt. Dies beinhaltet die Simulation von Zufallsstichproben, d. h. in diesem Fall: von Variablengruppen als Realisationen von H. Die Zahl M der Simulationen wird vorher festgelegt. Das bedeutet, es werden M Variablengruppen mit je k Variablen zufällig aus der Gesamtmenge der Variablen, 𝕄, ausgewählt. Man erhält so die Variablengruppen H 1 = (m11, …, m1n); …; H M = (m1M, …, mnM ). Es soll nun beispielsweise geprüft werden, ob die Komplexität C der Karten in Gruppe G signifikant klein bzw. groß ist, d. h. ob die Distributionen der Variablen in Gruppe G bezüglich C insgesamt besonders hohe oder niedrige Werte aufweisen. Hierfür wird der geschätzte Erwartungswert der Verteilung in G (der dem arithmetischen Mittel, notiert als C̅ G, entspricht) mit den entsprechenden Werten der zu H gehörenden Variablengruppen,CC̅ H1, …,CC̅ H M, verglichen. In diesem Sinne wird das folgende Testproblem definiert: H0: C̅ G = C̅ H
vs.
H1: C̅ G < C̅ H
vs.
H2: C̅ G > C̅ H
(25)
Es handelt sich hierbei eigentlich um zwei einseitige Tests, die im Prinzip getrennt voneinander, aber anhand derselben Testgröße und deshalb im selben Durchgang durchgeführt werden können. Hierfür wird das arithmetische Mittel für CG sowie jeweils fürCCH1, …,CCH M berechnet. So erhält man insgesamt M + 1 Werte, die in aufsteigender Reihenfolge sortiert werden. Die Position von C̅ G in dieser Reihe entscheidet nun über die Verwerfung von H0. Liegt sie unterhalb von α · (M + 1), d. h. ist der p-Wert (vgl. 4.6.1–4.6.2) kleiner als α, so ist H0 zugunsten von H1 zu verwerfen: Der geschätzte Erwartungswert von CG ist dann signifikant klein, d. h. die Karten in Gruppe G sind signifikant weniger komplex, als es in zufälligen Gruppierungen der Fall ist. Liegt sie oberhalb von (1 – α) · (M + 1), d. h. ist der pWert größer als 1 – α,88 so ist H0 zugunsten von H2 zu verwerfen: Der geschätzte Erwartungswert von CG ist dann signifikant groß, d. h. die Karten in Gruppe G sind signifikant komplexer, als es in zufälligen Gruppierungen der Fall ist. Für L und B wird analog verfahren. Zusammengefasst wird mit dem beschriebenen Monte-carlo-Testverfahren überprüft, ob die Distributionskennwerte Komplexität, Kompaktheit und Homogenität in einzelnen vorgegebenen Kartengruppen signifikant große oder kleine Werte annehmen. Wie in Abschnitt 5.1.1 ist auch hier zu beachten, dass es im Korpus eine neigung zugunsten von komplexeren (und damit heterogeneren) Karten gibt, da nur Daten für Variablen vorliegen, die innerhalb des Untersuchungsgebiets nennenswerte diatopische Variation aufweisen.
88 Eigentlich stellt sich die Situation folgendermaßen dar: Der p-Wert für den zweiten Test, p2, ist 1 – p1 (der Komplementärwert des p-Werts für den ersten Test). Beide müssen jeweils kleiner als α sein, um signifikant zu sein.
128
Analyse
5.1.2.1 Wortarten Angewandt auf eine Einteilung der Karten89 nach der Wortart der betreffenden Variablen bzw. Varianten ergibt sich bei einer Simulationszahl von M = 999 das in Tab. 6 dargestellte Bild.90 Alle drei Kennwerte für die nur zehn Variablen umfassende Wortart Interjektion sind signifikant. Hierzu wurden alle Variablen gezählt, die durch Ausdrücke realisiert werden, die unabhängig von Satzkonstruktionen gebraucht werden. Die Gruppe besteht aus folgenden Variablen: – – – – – – – – – –
‘der ortsübliche Gruß unter Einheimischen’ (10.205) ‘Guten Morgen’ (10.206) ‘Guten Abend’ (10.208) ‘Abschiedsgruß’ (10.211) ‘Lockruf für die Kühe’ (11.53) ‘Lockruf für die Schweine’ (11.72) ‘Zuruf für Zugtiere: Stehenbleiben!’ (13.126) ‘Zuruf für Zugtiere: Weitergehen!’ (13.127) ‘Zuruf für Zugtiere: nach links!’ (13.129) ‘Zuruf für Zugtiere: nach rechts!’ (13.131)
Während die Komplexität dieser Karten sehr niedrig ist (C), sind ihre Gebiete sehr homogen (B) und kompakt (L). Das bedeutet, man hat es hier vor allem mit weit verbreiteten Varianten zu tun, die regional und lokal nur wenige Konkurrenzformen aufweisen. obwohl die Gruppe sehr klein ist, ist diese Tendenz so ausgeprägt, dass sie sich beim Signifikanztest eindeutig bemerkbar macht. Für die Grußformeln lässt sich dies leicht erklären: Sie sind Bestandteil praktisch jeder Konversation und neigen dadurch besonders zu Austausch und Ausgleich, d. h. sie prägen die interpersonelle Kommunikation in besonderem Maße, gerade über Distanzen. Zudem spielen sie eine Rolle bei der Pflege von sozialen Beziehungen, was Akkommodation im Einzelfall und Adaptation in der Routine begünstigt. Durch diese Kombination aus sozialer Relevanz und entfernungsunabhängigem Einsatz sind sie besonders empfänglich für Etablierung und Diffusion (vgl. auch S. 134). Die weite Verbreitung der Zurufe für Zugtiere liegt wohl an der hohen Mobilität ihrer typischen Verwender: Kaum eine Personengruppe war in der Vergangenheit wohl so ‚mobil‘ wie Fuhrleute, was eine kleinräumige Verteilung der Varianten unwahrscheinlich macht: Ein Einsatzbereich, der vom Wesen her auf Beweglichkeit angelegt ist, begünstigt die weite Verbreitung der entsprechenden sprachlichen Formen. Durch diese mobilen ‚Diffusoren‘ konnten sie auch an weniger mobile Sprecher wie Landwirte weitergegeben werden. obwohl die Lockrufe für Kühe und Schweine mit den Zurufen für Zugtiere augenscheinlich einiges gemeinsam haben, liegt der Fall hier aber etwas anders. Hohe Mobilität ist hier wohl 89 Für diese und die nachfolgenden Analysen wurden die Karten des Abstraktionslevels 3 mit den folgenden Parametern verwendet (vgl. auch 4.5): dgeo, K3-Kern, CL. 90 Zum Problem des multiplen Testens s. S. 138.
129
Konfirmatorisch (data-based) C Adjektiv (20) Adverb (14) Interjektion (10) Substantiv (504) Verb (182) Zahlwort (3)
p 0,430 0,293 ↓ 0,006 0,464 0,784 0,886
L Adjektiv (20) Adverb (14) Interjektion (10) Substantiv (504) Verb (182) Zahlwort (3)
p 0,457 0,336 ↑ 0,995 0,341 0,602 0,075
B Adjektiv (20) Adverb (14) Interjektion (10) Substantiv (504) Verb (182) Zahlwort (3)
p 0,480 0,287 ↑ 1,000 0,267 0,537 0,540
Tab. 6: p-Werte aus dem Monte-Carlo-Test nach Wortarten (die jeweilige Gruppengröße steht in Klammern; zwei Karten konnten nicht zugewiesen werden). Der mit einem abwärtsgerichteten Pfeil markierte p-Wert liegt unterhalb von α = 0,05, d. h. der entsprechende mittlere Kennwert ist signifikant klein; die mit aufwärtsgerichteten Pfeilen markierten p-Werte liegen oberhalb von 1 – α = 0,95, d. h. die entsprechenden mittleren Kennwerte sind signifikant groß.
nicht ausschlaggebend; vielmehr ist die Ursache in der Entstehung der Varianten selbst zu suchen. Die Lockrufe sind meist onomatopoetisch (z. B. sug sug sug für Schweine), was die Arbitrarität bei der neuschöpfung stark einschränkt. Dadurch ist die Variantenvielfalt von vornherein beschränkt, und viele Sprecher werden zu gleichen oder ähnlichen Lösungen kommen, ohne dass sie auf einen gemeinsamen Ursprung (außer den Lauten der Tiere selbst) zurückzuführen sind. Insgesamt lassen sich beide Fälle – Lockrufe und Zurufe – aber auch auf das hohe Alter der Formen und das Ausbleiben von Innovationsereignissen in jüngerer Zeit zurückführen (vgl. auch die Bemerkungen zu Band 12 im folgenden Abschnitt). Diese Erklärungsansätze zeigen, dass verschiedene Umstände bei der Ausbildung von sprachgeographischen Strukturen ähnliche Effekte haben können: Faktoren, die den Innovationsprozess selbst beeinflussen, können zu ähnlichen Distributionsmustern führen wie Faktoren, die auf der Ebene der Diffusion von Varianten wirken. 5.1.2.2 Bände Bei einer Einteilung der Variablen nach den Bänden des SBS führt die Montecarlo-Methode bei einer Simulationszahl von M = 999 zu den in Tab. 7 (nächste Seite) dargestellten p-Werten. In Bezug auf die Komplexität C sind die Werte für die Bände 2, 10 und 12 signifikant. Während die Karten aus Band 10 wesentlich komplexer sind als der Rest, liegen die Karten aus Band 2 und Band 12 deutlich unter dem Erwartbaren, d. h. dort sind die Verbreitungen der Varianten auffallend großflächig. Bei Band 2, der sich (grob gesagt) mit der Thematik Mensch beschäftigt, ist dieser Umstand wohl im Zusammenhang mit der Zugehörigkeit der sprachlichen Variablen zum sozialen Bereich zu sehen, der regen interpersonellen Austausch der entsprechenden Formen begünstigt. nicht unmittelbar einleuchtend ist die geringe Komplexität der Karten von Band 12, der landwirtschaftliche Themen behandelt. Man könnte annehmen, dass bei der relativ ortsgebundenen bäuerlichen Bevölkerung nur wenig Austausch im
130 C Band 2 (133) Band 8 (97) Band 10 (134) Band 11 (123) Band 12 (141) Band 13 (107)
Analyse p ↓ 0,045 0,775 ↑ 0,982 0,649 ↓ 0,020 0,469
L Band 2 (133) Band 8 (97) Band 10 (134) Band 11 (123) Band 12 (141) Band 13 (107)
p 0,821 0,066 ↓ 0,041 0,649 0,946 0,546
B Band 2 (133) Band 8 (97) Band 10 (134) Band 11 (123) Band 12 (141) Band 13 (107)
p 0,895 ↓ 0,024 0,115 0,625 0,781 0,694
Tab. 7: p-Werte aus dem Monte-Carlo-Test nach Bänden (die jeweilige Gruppengröße steht in Klammern). Die mit abwärtsgerichteten Pfeilen markierten p-Werte liegen unterhalb von α = 0,05, d. h. die entsprechenden mittleren Kennwerte sind signifikant klein; die mit aufwärtsgerichteten Pfeilen markierten p-Werte liegen oberhalb von 1 – α = 0,95, d. h. die entsprechenden mittleren Kennwerte sind signifikant groß.
Raum stattfindet, was zu einem zersplitterteren Kartenbild führen würde. Es ist jedoch zu beachten, dass hier ein Themengebiet mit hohem Alter vorliegt, dessen sprachliche Varianten in der Vergangenheit über lange Zeit Diffusion und Ausgleich erfahren haben, so dass hier wohl geolinguistische Entwicklungen in einem späten Stadium vorliegen. Dafür spricht auch, dass der Ackerbau auf dem Land nicht mehr die gleiche zentrale Bedeutung hat wie ehemals (d. h. weniger Leute betreiben heute Landwirtschaft als früher, und die abgefragten Techniken wurden mittlerweile durch neuere, effizientere Möglichkeiten ersetzt), so dass in diesem Bereich in jüngerer Zeit wenig Anlass zur Innovation sprachlicher Varianten und deren Ausbreitung bestanden hat. Es liegt also ein relativ gefestigtes Bild vor, das durch lang andauernde Ausgleichserscheinungen entstanden ist und wegen weitgehend nicht mehr stattfindender sprachlicher Neuerungen konserviert wurde. Die außergewöhnlich hohe Komplexität in Band 10 ist aufgrund der thematisch nicht so kompakten Zusammenstellung an dieser Stelle schwer zu klären; deshalb wird hier auf den nächsten Abschnitt verwiesen, in dem deutlich wird, welche thematischen Gruppen in Band 10 für diese Signifikanz verantwortlich sind. Dasselbe gilt für die signifikant niedrigen Werte für die Gebietskompaktheit L in Band 10 und die Homogenität B in Band 8. 5.1.2.3 Themengebiete Bei einer Einteilung der Karten nach den Themengebieten des SBS liefert die Monte-carlo-Testmethode bei M = 999 die Ergebnisse, die in Tab. 8 verzeichnet sind. Die signifikant niedrige Komplexität der Karten in der Gruppe die menschl. Gemeinschaft scheint die Interpretation bezüglich Band 2 (vorausgehender Abschnitt) zu bestätigen, da damit ausgerechnet diejenige Gruppe einen signifikanten Wert aufweist, die am stärksten sozial geprägt ist. Die Werte für L und B sind stets vor dem Hintergrund zu betrachten, dass sie mit C stark negativ korreliert sind (vgl. 4.4.4). So ist für die Gruppe das Bauernhaus zu sehen, dass der signifikant niedrige p-Wert für B mit einem hohen (jedoch nicht signifikanten) p-Wert für C korrespondiert. Die Erklärung für die hohe Kom-
131
Konfirmatorisch (data-based)
Band 13
Band 12
Band 11
Band 10
Band 8
Band 2
C der menschl. Körper (34) körperl. u. seel. Äußerungen (46) die menschl. Gemeinschaft (44) Kleidung (9) das Bauernhaus (22) Wohnung u. Einrichtungsgegenstände (16) Wettererscheinungen (14) freie Tiere (7) Pflanzen, Obst u. Gemüse (31) Mosterei (3) Blumen (4) Kinderspiele (16) Haushalt (37) Ernährung, Kochen u. Backen (45) Bauern u. Arbeitskräfte (4) Zeiteinteilung u. Grüßen (24) Adverbien (8) Rindvieh u. Milchverarbeitung (62) Schwein, Ziege, Schaf, Pferd (38) Geflügelhaltung u. Imkerei (13) weitere Haustiere (10) Gelände (11) Boden u. Ackerbau (26) Düngung (11) Heuernte (45) Getreide (48) Wald u. Holz (42) Zäune (9) Transport (41) Körbe, Gefäße u. Traggestelle (12) weitere Karten (3)
p 0,275 0,414 ↓ 0,026 0,226 0,923 0,097 ↑ 0,966 0,443 0,336 0,806 0,320 ↑ 0,980 ↑ 0,951 0,838 ↑ 0,995 0,211 0,542 0,776 0,436 ↓ 0,026 0,916 0,346 0,170 ↓ 0,043 0,058 0,878 0,081 0,632 0,742 0,860 0,469
L
p 0,811 0,581 0,833 0,246 0,097 0,669 ↓ 0,006 0,306 0,686 0,285 0,643 0,100 0,324 0,158 ↓ 0,001 0,772 0,376 0,184 0,701 ↑ 0,971 0,638 0,199 0,520 ↑ 0,975 ↑ 0,990 0,423 ↑ 0,992 0,228 0,404 0,355 0,442
B
p 0,842 0,656 0,898 0,261 ↓ 0,030 0,675 ↓ 0,001 0,178 0,589 0,290 0,651 ↓ 0,041 0,272 0,239 ↓ 0,006 ↑ 0,980 0,210 0,179 0,806 0,938 0,560 0,419 0,561 ↑ 0,951 0,797 0,363 ↑ 0,990 0,524 0,395 0,055 0,392
Tab. 8: p-Werte aus dem Monte-Carlo-Test nach Themengebieten (die jeweilige Gruppengröße steht in Klammern). Die mit abwärtsgerichteten Pfeilen markierten p-Werte liegen unterhalb von α = 0,05, d. h. die entsprechenden mittleren Kennwerte sind signifikant klein; die mit aufwärtsgerichteten Pfeilen markierten p-Werte liegen oberhalb von 1 – α = 0,95, d. h. die entsprechenden mittleren Kennwerte sind signifikant groß.
plexität liegt wohl in der häuslichen und somit ortsgebundenen natur der Themengruppe, die einen hohen Grad an räumlicher Diffusion nicht begünstigt, sondern eher hindert. Der Grund für die niedrige Homogenität B ist somit wohl zumindest teilweise auf die negative Korrelation mit C zurückzuführen. Entscheidend dürfte hier aber auch eine sachliche und terminologische Unschärfe sein, die ein Blick in die Kommentare zu den einzelnen Karten dieser Gruppe im SBS offenbart. Auffällig oft wird etwa darauf verwiesen, dass die Gewährspersonen „in der Sache nicht immer genau zu unterscheiden wußten und daß die vorhandenen Bezeichnungen in ihrem Bedeutungsumfang nicht genau einzugrenzen sind“ (Kommentar
132
Analyse
zu K. 8.5 ‘Stufe[n] vor der Haustüre’; SBS, Bd. 8, 24). Dies liegt wohl zum einen an dinglichen Unterschieden in der Bauform, zum anderen daran, dass man es nicht mit disjunkten Gebäudeteilen zu tun hat, so dass sich die Abgrenzungen verschieben können. Die Frage ist somit für die Informanten oft nicht mehr eindeutig. Das Ergebnis sind unsystematisch variierende Antworten und Doppelbelege. Beides führt zu einer erheblichen Absenkung der messbaren Homogenität. Die Distributionskennwerte der Gruppe Wettererscheinungen sind durchweg signifikant: Die Karten sind sehr komplex, sehr heterogen und die Gebiete wenig kompakt. Die Karten lassen sich nur schlecht durch Flächenkarten wiedergeben. Wettererscheinungen sind zwar einerseits in starkem Maße Teil der alltäglichen Kommunikation: Über Wetter spricht man. Dies würde eher für eine großräumige, einheitliche Verteilung der entsprechenden Varianten sprechen. Andererseits sind Wettererscheinungen Phänomene, die oft Anlass zu emotionalen Reaktionen bieten, und dass Begriffe mit emotionalem Potential eher zu kleinräumigen Verbreitungsgebieten mit zahlreichen Streubelegen neigen, wurde schon verschiedentlich beobachtet (vgl. baCh 1950, 170; hiLdebrandt 1983, 1364 und insbesondere LötSCher 2005, 308–311; vgl. auch Abschnitt 1.2.1.1). Emotional aufgeladene Konzepte neigen dazu, häufig neu versprachlicht zu werden und neu motiviert zu werden: Die emotive Funktion wird durch Expressivität im Ausdruck umgesetzt, welche wiederum durch Affekt und Spontaneität bewirkt wird (vgl. herMannS 2002). Es ist zu vermuten, dass auch der Abbau von Varianten in diesem Bereich langsamer vonstattengeht als bei ‚sachlicheren‘ Konzepten; zumindest scheint es, dass bei emotional aufgeladenen Begriffen Vielfalt und Variation ein zentrales Merkmal des Vokabulars ausmachen. Möglicherweise lassen sich expressive Varianten weniger leicht von anderen verdrängen, da sie aufgrund ihrer emotionalen Komponente mental beständiger sind. Dies führt insgesamt zu ausgeprägter Diversität in der Heteronymie und im Kartenbild, was sich zunächst in der lokalen und regionalen Variation niederschlägt (gemessen durch L und B), und infolge räumlicher Diffusion – sowie der natürlichen Korrelation der drei Größen – auch in C. So dürfte auch zu erklären sein, dass innerhalb dieser Gruppe die Karten für ‘fein regnen’ (K. 8.47) und für ‘stark regnen’ (K. 8.48) die mit Abstand höchsten C-Werte innerhalb der Gruppe aufweisen, während die Karten für die mit weniger affektivem Potential versehenen Windrichtungen (K. 8.40–44) aber deutlich weniger komplex sind. Hinzu kommt, dass die einzelnen Wettererscheinungen, vor allem wenn es sich etwa um verschiedene Spielarten des Regens handelt, nicht immer scharf voneinander abzugrenzen sind, was zu Schwankungen in der Benennung führt (ein Umstand, den auch r einer hiLdebrandt (1983, 1333, 1364) beobachtet und als „referentielle Varianz“ bezeichnet hat). Haushalt ist ein Bereich, der vom Wesen her ortsgebundene Tätigkeiten beinhaltet. Es handelt sich hier um Aufgabenbereiche, die zuhause – im Haus – durchgeführt werden, oft alleine. Dies begünstigt diatopische Variation, da für eine weiträumige Ausbreitung der Varianten die notwendigen Voraussetzungen – Mobilität der Sprecher, sozial relevanter charakter der Konzepte, etc. – fehlen (eine ähnliche Tendenz ist auch bei der Gruppe Ernährung, Kochen u. Backen zu erkennen, erreicht dort aber keinen signifikanten Wert). Auch bei der Gruppe Kin-
Konfirmatorisch (data-based)
133
derspiele fehlt die Mobilität der Sprecher; die Konzepte sind sozial relevant, die soziale Interaktion beschränkt sich aber auf einen kleinen räumlichen Umkreis: Kinder spielen in erster Linie in der nachbarschaft; auf dem Hof oder auf der Straße bringt man sich Spiele wie Fangen bei. Dies begünstigt die Entstehung von kleinräumig verbreiteten Varianten, was sich in einem hohen p-Wert für C äußert und eine Beobachtung baChS bestätigt, nach der „die namen für viele Spiele u nd Verg nüg u ngen und ihre Mittel eine Fülle örtlicher Sonderformen“ (baCh 1950, 173) zeigten (vgl. auch LötSCher 2005, 304 und 1.2.1.1). Bemerkenswert ist hier, dass auch B einen signifikant hohen Wert erreicht, was wohl nicht allein auf die Korrelation mit C zurückzuführen ist, da der B-Wert bei Haushalt trotz eines ähnlich hohen C weit von Signifikanz entfernt ist. Sowohl wenzeL als auch hiLdebrandt erklären das ‚unruhige‘ Kartenbild bei Themen, die mit Kindern zu tun haben, „infolge des Spieltriebes und der Phantasie (namentlich der Kinder)“ (wenzeL 1930, 66) bzw. mit „spontane[n], gefühlsbetonte[n] Schöpfungen“, die „besonders häufig von der Kindersprache ihren Ausgang“ (hiLdebrandt 1983, 1364) nehmen. Kindern wird also attestiert, besonders aktive und emotionsgeleitete Innovatoren zu sein.91 Bei der (sehr kleinen) Gruppe Bauern u. Arbeitskräfte ist anzumerken, dass die hohe Komplexität auf die beiden Karten ‘mittlerer Bauer’ (K. 10.186) und ‘großer Bauer’ (K. 10.187) zurückgeht, und in geringerem Maße auf die Karte ‘kleiner Bauer’ (K. 10.184/185);92 die Karte für ‘Magd’ (K. 10.174) hat einen unauffälligen Wert.93 Hier ist, ähnlich wie bei der Gruppe Wettererscheinungen, die Erklärung für die hohe Komplexität zunächst in der Emotionalität der bezeichneten Konzepte zu suchen, denn die einzelnen Varianten haben stark wertenden charakter. Die Bezeichnung für die Größe der Landwirtschaft eines Bauern, die eng mit dessen wirtschaftlicher und sozialer Stellung verbunden ist, ist oft abwertenden, spöttischen und missgünstigen Motivationen unterworfen (vgl. z. B. die Varianten Pfröpfler für den kleinen Bauern oder Grattler für den mittleren). Für diese ‚Emotionalitätshypothese‘ spricht, dass alle drei Distributionskennwerte stark ihren Entsprechungen bei Wettererscheinungen ähneln, für die eine ganz ähnliche Erklärung vorgeschlagen wurde. Außerdem ist zu beachten, dass es nicht immer klar abgegrenzte Konzepte für die drei Größenkategorien (kleiner, mittlerer, großer Bauer) gibt; die Übergänge sind fließend, was zu Unsicherheiten in der Benennung führt. Die Unschärfe des Konzepts führt so zur Labilität des Ausdrucks, was sich in einer Fülle von Re-Motivierungen und Ad-hoc-Bildungen niederschlägt (vgl. auch LötSCher 2006, 147–148). 91
Diese Annahme in Bezug auf die Lexik hat nichts mit Theorien zu tun, die den Spracherwerb von Kindern als treibende Kraft des Sprachwandels (vor allem in Bezug auf die Grammatik) sehen (vgl. hierzu Croft 2000, 44–53; vgl. auch 2.1.3). 92 Die Varianten für ‘kleiner Bauer’ sind im SBS in zwei getrennten Karten dargestellt; für die Auswertung im Rahmen der vorliegenden Studie wurden die Varianten wieder zu einer Variablen zusammengefasst. 93 Aus technischen Gründen fehlen die Karten für ‘Dienstboten’ (K. 10.182) und ‘Taglöhner’ (K. 10.183). Die Variable ‘Knecht’ wurde nicht onomasiologisch, sondern semasiologisch kartiert und ist deshalb ebenfalls nicht Teil des Korpus (vgl. Kapitel 3).
134
Analyse
Während die Karten in der Gruppe Zeiteinteilung u. Grüßen nicht signifikant großflächig sind, erreicht die Homogenität der Karten einen sehr hohen Wert. Die Erklärung hierfür liegt auf der Hand: Grußformeln sind Äußerungen mit praktisch ausschließlich phatischer Funktion, die sozial eine große Rolle spielen (vgl. auch S. 128). Dies sind ideale Voraussetzungen für raschen Ausgleich und nachhaltige Etablierung (vgl. 2.1.3.2), was die hohe Homogenität der entsprechenden Karten erklärt. Zeiteinteilung hingegen ist zwar kein primär soziales Begriffsfeld, jedoch spielt es gerade bei interpersonellen Kontakten eine Rolle: Wann immer Erlebnisse erzählt oder Tätigkeiten aufeinander abgestimmt werden, dient die Zeiteinteilung als gemeinsamer orientierungsrahmen. Dies ist von umso größerer Bedeutung, je irregulärer der Kontakt zwischen zwei Personen ist, was ebenfalls einheitliche Konzepte und Ausdrücke erfordert und dadurch große Einheitlichkeit im Kartenbild plausibel erscheinen lässt. Für die deutliche Großflächigkeit der Variantendistributionen in der Gruppe Geflügelhaltung u. Imkerei (zur Imkerei gehören nur zwei der 13 Karten) gibt es mehrere mögliche Gründe: Zum einen enthält diese Gruppe zahlreiche Variablen, die zu onomatopoetisch motivierten Varianten neigen (z. B. bei ‘gackern [von der Henne]’ [K. 11.117], ‘Küken’ [K. 11.119], ‘glucken [von der Henne]’ [K. 11.120]), was die Arbitrarität der neubildungen einschränkt und so die Variantenzahl von vornherein begrenzt; wenn Unterschiede zwischen den Varianten auftreten, so sind sie eher lautlicher natur. Weniger lexikalische Varianten teilen so denselben Raum untereinander auf (vgl. auch S. 129), was im Schnitt zu größeren Gebieten führt. Als zweiter Faktor kommt der oben bei Band 12 erwähnte Mechanismus (vgl. S. 130) in Frage, der darin besteht, dass bei landwirtschaftlichen Themen oft ein spätes Stadium sprachgeographischer Entwicklung vorliegt: Die älteren Varianten konnten sich in der Vergangenheit über einen längeren Zeitraum nachhaltig etablieren und diffundieren, während das Innovationspotential vor allem in jüngerer Zeit erheblich abgenommen hat. So sind gefestigte, großflächige Strukturen entstanden, die heute kaum mehr durch neuerungen gestört werden, was auch die hohe Homogenität und signifikant hohe Gebietskompaktheit in dieser Gruppe erklärt. Die gleiche Erklärung dürfte auch für den signifikant niedrigen Komplexitätswert sowie die signifikant hohe Kompaktheit und Homogenität der Gruppe Düngung gelten. Bemerkenswert ist hier außerdem, dass die Signifikanzen den Werten der Gruppen Wettererscheinungen und Bauern u. Arbeitskräfte, die mit stark wertenden und dadurch relativ emotionalen Konzepten erklärt wurden, genau entgegengesetzt sind, so dass hier möglicherweise eine besonders sachliche, nicht von Affekt geprägte Themengruppe zu sehen ist: Bei einer solchen Gruppe ist nicht mit einer hohen Innovationsrate zu rechnen, was die vorhandenen Variantengebiete stabil und dadurch kompakt hält. Die Werte für Heuernte und Wald u. Holz gehen in eine ähnliche Richtung, erreichen aber nicht für alle Werte Signifikanz. Interessant ist, dass die relative Einheitlichkeit und Großflächigkeit bei landwirtschaftlichen Begriffen im Widerspruch zu bisherigen Beobachtungen steht. So hatte etwa wenzeL den Eindruck, dass neben Haushaltsgegenständen und Handwerkszeug auch Ackerbaugeräte selten einheitliche Bezeichnungen aufweisen,
Konfirmatorisch (data-based)
135
„denn hier kommt es infolge landschaftlich-begrenzter Gepflogenheiten und durch Gradunterschiede in der Aufnahme bestimmter Kultureinflüsse am ehesten zur Bildung wortgeographischer Grenzen“ (wenzeL 1930, 13). Ähnlich argumentiert baCh (1950, 174): „Von landschaftlich beschränkter Verbreitung und Vielgestaltigkeit sind […] viele Wörter für la ndwi r tschaf tliche Ver r icht u ngen […]. Auch namen für Tech n isches können kleinräumig verbreitet sein, etwa dann, wenn sie mit landwirtschaftlichen Geräten, die eine lange Vergangenheit haben, verbunden sind“. Schließlich attestiert peter wieSinger (2005, 1109) „Bezeichnungen des Ackerbaus, der Graswirtschaft, der Viehzucht und der Milchwirtschaft“ in Anlehnung an k ranzMayer (1956, 3–4) „Verkehrsferne“, was sich eigentlich in kleinräumigen Verbreitungen der Varianten manifestieren sollte. Ein solcher Zusammenhang ist mit den Karten des SBS nicht zu bestätigen; eher ist das Gegenteil der Fall. 5.1.2.4 Zusammenfassung Eine monokausale Erklärung, welche die Diversität für alle Erscheinungen auf ein einziges Prinzip zurückführt, dürfte wohl zu kurz greifen. ‒ andreaS LötSCher, „Wortgestalt und areale Diversität“
In den letzten drei Abschnitten ist deutlich geworden, dass die Interpretation der Ergebnisse der Monte-carlo-Tests bezüglich der drei Kenngrößen C, L und B sehr schwierig ist, da viele mögliche Faktoren eine Rolle spielen können und man sich so leicht dem Vorwurf aussetzt, ex post jeweils Ad-hoc-Erklärungen für die einzelnen Werte zu liefern, die deshalb keinerlei Vorhersagekraft haben. Im Einzelfall mögen die Erklärungsversuche deshalb durchaus angezweifelt werden. Es scheint aber doch der Fall zu sein, dass sich einige der angebotenen Erklärungen auf Grundtendenzen zurückführen lassen, die das Gesamtbild plausibel erscheinen lassen. So lassen sich Konzepte mit sozialer Relevanz oder sogar phatischer Komponente insofern mit solchen zusammenfassen, die mit einer gewissen Mobilität der Sprecher verbunden sind, als beide charakteristiken mit einer erhöhten Diffusionsaffinität und dadurch mit größeren und homogeneren Variantengebieten einhergehen. Die genannten Eigenschaften lassen sich also auf ein Prinzip zurückführen, das auf der Ebene der Diffusion wirkt. Andere Mechanismen setzen auf anderen Ebenen an, wie beispielsweise Affekt und Expressivität, die die neigung zur Innovation und die Beständigkeit von Varianten beeinflussen.94 Entsprechend dieser Einflussebenen lassen sich die einzelnen Punkte wie folgt zusammenfassen (s. auch Tab. 9, S. 138): 94 Auf die Rolle von Innovations- und Diffusionsvorgängen für die areale Distribution von Varianten wurde bereits von andreaS LötSCher (2010) hingewiesen.
136
Analyse
1. Innovationsaffinität Die Innovationsaffinität gibt an, ob ein Konzept eher zur sprachlichen neuerung neigt oder diese eher gemieden wird. Bei einer niedrigen Innovationsaffinität kommen nur selten neue Formen hinzu. Dies ist etwa dann der Fall, wenn die bezeichneten Sachen nicht mehr in Gebrauch sind oder Tätigkeiten nicht mehr oft ausgeübt werden; man hat es dann mit veraltendem oder veraltetem Wortschatz zu tun. Vorhandene und sich etablierende Konventionen werden nicht gestört und bleiben stabil; dies begünstigt Kompaktheit und Homogenität, Komplexität wird nicht gefördert. Eine hohe Innovationsaffinität liegt oft bei emotionalen Konzepten vor, die zu spontaner und expressiver neubildung neigen. Die entstehenden sprachlichen Innovationen äußern sich zunächst lokal und stören so die Entstehung von Homogenität und Kompaktheit etablierter Varianten. Besonders wenn dabei viele mental stabile Formen auftreten, führt dies zu erhöhter Heterogenität (vgl. auch 6.1.3). Die neuen Formen können in die Umgebung diffundieren, was eine Erhöhung der Komplexität bewirkt.95 2. Arbitrarität Einige Variablen neigen dazu, Varianten mit eingeschränkter Arbitrarität auszubilden. Dies ist insbesondere bei onomatopoetisch motivierten Ausdrücken der Fall. Dieser auf der Ebene der Innovation greifende Mechanismus führt dazu, dass die Variabilität und damit die Variantenvielfalt im Vergleich zu anderen Variablen beschränkt ist (vgl. auch 2.1.2). Während die Innovationsaffinität durchaus die gleiche sein kann wie bei ansonsten vergleichbaren Variablen, ist die Wahrscheinlichkeit größer, dass mehrere Innovatoren unabhängig voneinander zu einem gleichen oder ähnlichen (d. h. lautlich leicht verschiedenen) sprachlichen Ausdruck gelangen. Dies bedeutet, dass bei gleicher Innovationsaffinität die Homogenität größer ist, da lokal weniger verschiedene Formen miteinander konkurrieren. Gleichzeitig sinkt die Komplexität, da bei der Diffusion polygenetisch entstandene, aber homonyme Varianten zu einheitlichen Variantengebieten verschmelzen können. 3. Diffusionsaffinität Die Diffusionsaffinität beschreibt, wie stark die Varianten einer Variablen dazu neigen, sich im Raum zu verbreiten. Die Diffusionsaffinität ist eine Eigenschaft, die u. a. mit dem sogenannten „Verkehrswert“ der bezeichneten Sache in Verbindung gebracht werden kann: Je kleiner der Verkehrswert eines Gegenstandes, eines Lebewesens oder einer Tätigkeit ist, desto mehr entzieht sich sein name der nivellierenden Wirkung großer sozialer Zusammenhänge, desto mehr gehört die Benennung der Dorf- oder gar der Familiensprache an. (Jaberg 1937, 187)96 95 Der Einfluss der emotionalen Eigenschaft „negative affect“ auf die Heterogenität der geographischen Verteilung wurde bereits in SpeeLMan/geeraertS (2008) und geeraertS/SpeeLMan (2010) gezeigt (vgl. 1.2.1.1). 96 Eine ähnliche Terminologie findet sich bei k ranzMayer (1956, IX–X, 3), der fünf „wortsoziologische“ Kategorien unterscheidet: „volksfremde“, „verkehrsgebundene“, „verkehrsnahe“, „verkehrsferne“ und „verkehrsfremde“ Begriffe.
Konfirmatorisch (data-based)
137
Als Faktoren für eine hohe Diffusionsaffinität wurden neben der Mobilität der Sache bzw. des Sprechers bereits die soziale Relevanz mit möglicher phatischer Komponente sowie die ortsungebundenheit der Tätigkeit genannt. Diese Eigenschaften führen zur schnellen Verbreitung von Varianten im Raum, ihrer Diffusion, was ihre großräumige Ausbreitung begünstigt. Dies führt zu großen Variantengebieten, was sich in niedriger Komplexität äußert. Das Gegenteil ist bei ortsgebundenen Tätigkeiten der Fall. Hier sind der räumlichen Ausbreitung Steine in den Weg gelegt, die Gebiete bleiben klein und allein schon durch die Korrelation der Werte heterogen und uneinheitlich. 4. Wort-Sache-Beziehung Die Wort-Sache-Beziehung ist im Bereich des mentalen Lexikons angesiedelt, wo die Zuordnung durch begriffliche Unschärfen sowohl in semasiologischer wie auch in onomasiologischer Hinsicht erschwert sein kann.97 Es handelt sich hierbei um eine referenzielle Uneindeutigkeit, die Labov wie folgt illustriert: In any kitchen, there are many containers that are obviously bowls, cups, mugs, and dishes. But there are others that might be called cups, or might not; or might be a kind of a cup, according to some, but a kind of a dish according to others. (Labov 1973, 340)
Es ist also nicht nur damit zu rechnen, dass solche Abgrenzungen von Dialekt zu Dialekt verschieden sind, sondern auch von Sprecher zu Sprecher, oder dass sogar ein und derselbe Sprecher zu verschiedenen Zeitpunkten zu unterschiedlichen Zuordnungen kommen kann. Deshalb können solche Unschärfen das Ergebnis einer Datenerhebung beeinträchtigen, da die abgefragten Items unter Umständen nicht als einheitliches Konzept im mentalen Lexikon der jeweiligen Gewährsperson vorliegen, was zu unsicheren und semantisch uneinheitlichen Antworten sowie zu Doppel- und Mehrfachbelegen führt. Dies äußert sich in Distributionen von verringerter Homogenität und Kompaktheit.98 Die Komplexität sollte von diesem Mechanismus unbeeinflusst bleiben, weil die Unsicherheit bei der Zuordnung unabhängig von der Geographie zu wechselnden Antworten führt, und vor allem deshalb, weil die Uneindeutigkeit in vielen Fällen durch die Erhebungssituation selbst bedingt ist. Die Befunde aus den Abschnitten 5.1.2.1‒5.1.2.3 können nun im Lichte dieser Klassifikation neu betrachtet werden (s. Tab. 10‒12, S. 139‒140). Es zeigt sich, dass die Stärke des Einflusses mit diesem vereinfachten Schema nicht vorhersagbar ist, allenfalls in welche Richtung er wirkt, denn signifikante Werte werden 97 Für eine eingehende Behandlung von semasiologischen wie onomasiologischen Abgrenzungsschwierigkeiten in lexikalischer Variation vgl. geeraertS et al. (1994) und geeraertS (2010). Der Einfluss von „lack of familiarity“ und „non-uniqueness“, die ebenfalls mit einer unscharfen Wort-Sache-Beziehung einhergehen können, auf die Heterogenität der geographischen Verteilung wurde in SpeeLMan/geeraertS (2008) und geeraertS/SpeeLMan (2010) gezeigt (vgl. 1.2.1.1). 98 Im Prinzip dieselbe Beobachtung hat hiLdebrandt (1983, 1333, 1364) gemacht. Auch die Darstellung des Zusammenhangs zwischen Prototypizität und Diversität bei LötSCher (2005, 304–305, 310) folgt einer ähnlichen Argumentation.
138
Analyse
Beispielszenarien
Innovationsaffinität
Arbitrarität
Diffusionsaffinität WortSache Beziehung
hoch
z. B. Expressivität, Emotionalität, Tabu
niedrig
z. B. veralteter Wortschatz
frei eingeschränkt
z. B. Hang zu Onomatopoetika
hoch
z. B. Mobilität, soziale Relevanz, phatische Komponente
niedrig
z. B. Ortsgebundenheit, Tabu
eindeutig unscharf
z. B. unklare Abgrenzung zu anderen Konzepten, mehrdeutige Fragesituation
C
L, B
+ ‒ ‒ + + ‒ ‒ + ‒ + + ‒ + ‒
Tab. 9: Faktoren bei der Ausbildung der Kartencharakteristiken Komplexität (C), Gebietskompaktheit (L) und Homogenität (B) mit Beispielszenarien. Die Mechanismen wurden aus den Interpretationen der Ergebnisse der Monte-carlo-Tests in den vorausgehenden drei Abschnitten extrahiert.
nicht überall erreicht, wo eine Wirkung ‚vorhergesagt‘ wird. Außerdem werden C, L und B verschieden stark beeinflusst, was durch die unterschiedlichen Wirkungsbereiche der Mechanismen bedingt ist. Zusammenfassend lässt sich also sagen, dass ein eindeutiger Effekt der jeweiligen Gruppierungen auf die einzelnen Distributionskennwerte feststellbar ist, wobei der Effekt bei der Komplexität C am größten ist: Hier sind 25,6 % aller p-Werte signifikant, während es bei L und B jeweils 18,6 % sind.99 Die konkreten Auswirkungen lassen sich am besten durch Grundmechanismen der Innovation und der Diffusion sowie semantisch-referentieller Eigenschaften der sprachlichen Zeichen erklären.
99 Pro Zeile in den Tabellen Tab. 6‒8 (S. 129‒131) wurden insgesamt sechs nicht unabhängige Tests durchgeführt: für jede Kenngröße einer für die untere Schwelle (H0 gegen H1) und einer für die obere (H0 gegen H2). Für jeden dieser Einzeltests beträgt die Wahrscheinlichkeit, dass fälschlich Signifikanz attestiert wird (ein sogenannter „Fehler 1. Art“), genau α = 5 %. Bei insgesamt 43 Zeilen wäre somit für jede Testart (also H1 oder H2 für C, L oder B) mit durchschnittlich α · 43 = 2,15 solchen „Fehlalarmen“ zu rechnen. Im Schnitt haben sich für jede Testart 4,67 statistisch signifikante Werte ergeben, d. h. etwa die Hälfte der statistisch signifikanten Werte geht wohl auf nicht-zufällige Effekte zurück, vor allem dann, wenn sich mehrere Signifikanzen bei einer Stichprobe (d. h. bei einer Kartengruppe) gegenseitig stützen.
139
Konfirmatorisch (data-based)
1. Wortarten C
L, B
‒
+
C
L, B
‒
+
C
L, B
‒
+
C
L, B
‒
+
C
L, B
Interjektionen Grußformeln: soziale Relevanz, phatisch Diffusionsaffinität: hoch Zurufe für Zugtiere: Mobilität der Sprecher Diffusionsaffinität: hoch Lockrufe: oft onomatopoetisch Arbitrarität: eingeschränkt Tab. 10: Wortarten mit signifikanten Distributionskennwerten und mögliche Deutung.
2. Bände Band 2 Thema „Mensch“: sozial Diffusionsaffinität: hoch
Band 8, 10 siehe Themengebiete Band 12 Landwirtschaft: veraltender Wortschatz Innovationsaffinität: niedrig Tab. 11: Bände mit signifikanten Distributionskennwerten und mögliche Deutung.
3. Themengebiete die menschl. Gemeinschaft sozial Diffusionsaffinität: hoch
das Bauernhaus Ortsgebundenheit Diffusionsaffinität: niedrig
+
terminologische Unschärfe WortSacheBeziehung: unscharf
Wettererscheinungen emotionales Potential Innovationsaffinität: hoch „referentielle Varianz“ WortSacheBeziehung: unscharf (Hildebrandt 1983, 1333; 1364)
C
+
‒ L, B
‒
Tab. 12 (Fortsetzung nächste Seite): Themengebiete mit signifikanten Distributionskennwerten und mögliche Deutung.
140
Analyse
Kinderspiele Ortsgebundenheit Diffusionsaffinität: niedrig gefühlsbetonte Bildungen, „Spieltrieb Innovationsrate: hoch und Phantasie“ (Wenzel 1930, 66)
Haushalt Ortsgebundenheit Diffusionsaffinität: niedrig
Bauern u. Arbeitskräfte Größe der Landwirtschaft: Innovationsaffinität: hoch emotionales Potential
C
L, B
+
‒
C
L, B
+
‒
C
L, B
+
begriffliche Unschärfe WortSacheBeziehung: unscharf
Zeiteinteilung u. Grüßen sozial relevant, phatisch Diffusionsaffinität: hoch
Geflügelhaltung u. Imkerei oft onomatopoetisch Arbitrarität: eingeschränkt veraltender Wortschatz Innovationsaffinität: niedrig
Düngung veraltender Wortschatz Innovationsaffinität: niedrig
Heuernte veraltender Wortschatz Innovationsaffinität: niedrig
Wald u. Holz veraltender Wortschatz Innovationsaffinität: niedrig
‒
C
L, B
‒
+
C
L, B
‒
+
C
L, B
‒
+
C
L, B
‒
+
C
L, B
‒
+
Tab. 12 (Fortsetzung): Themengebiete mit signifikanten Distributionskennwerten und mögliche Deutung.
Konfirmatorisch (data-based)
141
5.1.3 Barrieren und Verstärker Was diese Grenzen anbelangt So ist bekannt ja anerkannt Daß sie meistens fließend sind ‒ toCotroniC, „Die Grenzen des guten Geschmacks 2“
Eine der Grundannahmen der Dialektologie ist die, dass sich Dialektgebiete durch Bündel von Isoglossen voneinander abgrenzen (vgl. 1.2.2). Übergangsgebiete zwischen Dialekten finden sich dort, wo Isoglossen lose im Raum verteilt sind; Dialektgrenzen sind da anzutreffen, wo mehrere Isoglossen zusammenfallen. Konsequenterweise wurde immer wieder versucht, durch das Übereinanderlegen von Isoglossen zu einer Vorstellung der räumlichen Dialektgliederung zu gelangen. Hintergrund dieser Herangehensweise, der sogenannten Isoglossenmethode (vgl. 1.2.2), ist die Vorstellung, dass es (außer- oder innersprachliche) Umstände gibt, die dafür verantwortlich sind, dass sich Isoglossen an bestimmten Linien im Raum – oder auch aneinander – ausrichten (vgl. auch gooSSenS 1969, 58; könig 2007, 143–145), und dass eine solche Bündelung Grund zur Annahme ist, sie grenze zwei Varietäten voneinander ab: Da hat sich denn gezeigt, daß durch Vergleich der verschiedensten mundartlichen Unterschiede in allen Gegenden Deutschlands eine Unzahl von Mundartgrenzen festgestellt werden kann, die das ganze Land wie ein netz in größere und kleinere, manchmal nur eine oder wenige ortschaften umfassende Gebiete aufteilen. Wo sich diese Mundartgrenzen zu dicken Bündeln häufen, spricht man dann von Sprachschranken, die, wie sich immer wieder gezeigt hat, häufig geschichtlichen Grenzen des ausgehenden Mittelalters oder der Neuzeit folgen. (nübLing 1988, 317)
Dahinter steckt wohl implizit die Annahme, dass es einen gewissen Grad an zufälliger, chaotischer Variation im Bereich der räumlichen Variantenverteilungen gibt, der die Verläufe einzelner Isoglossen regellos erscheinen lässt, und dass ein gehäuftes Auftreten ab einem bestimmten Grad Anlass zur Vermutung gibt, dass eine solche Bündelung nicht durch den Zufall, sondern durch bestimmte Einflussfaktoren zustande gekommen ist und zu einem merklichen sprachlichen Auseinanderdriften der Ortsdialekte geführt hat. Als Einflussfaktoren werden neben den eben erwähnten geschichtlichen Grenzen häufig auch jüngere politische, naturräumliche oder ‚psychologische‘ Grenzen angeführt (vgl. könig 2007, 143). Die Bewertung solcher Isoglossenbündel erweist sich in der Praxis jedoch als reichlich schwierig, denn das Bild, das sich durch das Übereinanderlegen von Isoglossen ergibt, ist oft weit weniger deutlich als mitunter gehofft wurde: Historical linguists […] hoped that isoglosses would support the firm division of linguistic territories into hierarchically ordered sets of languages, dialects and subdialects. Here again the evidence has been disappointing: an unselected set of isoglosses does not divide a territory into clear-cut areas, but rather into a crosshatched continuum of finely subdivided fragments. (weinreiCh /Labov/herzog 1968, 151; vgl. auch girard/LarMouth 1993, 108)
142
Analyse
Wie das Zusammenfallen von Isoglossen im Einzelfall zu bewerten ist, hängt im Wesentlichen davon ab, welche Verteilungsdichte von Isoglossen als ‚normal‘ betrachtet werden kann. Es ist anzunehmen, dass es einen breiten Bereich gibt, der als unauffällig gelten kann, innerhalb dessen es aber durchaus zu größeren, wenngleich bedeutungslosen, Schwankungen der Dichte kommen kann. Überschreitet die Dichte jedoch eine bestimmte Schwelle, so ist dies ein Indiz dafür, dass diese Häufung nicht mehr nur zufällig ist, sondern dass außersprachliche, Sprachkontakt hindernde Faktoren im Spiel sind. Umgekehrt gilt, dass, wenn eine bestimmte Schwelle u nterschritten wird, ebenfalls keine zufällige Verteilung mehr vorliegt, sondern dass es außersprachliche Gegebenheiten gibt, die für einen verstärkten Sprachkontakt sorgen und dadurch die Entstehung von Isoglossen hemmen. Man kann bei extrem hohen und niedrigen Werten der Isoglossendichte also von Barrieren bzw. von Verstärkern von Sprachkontakt sprechen.100 Somit ist man praktisch schon bei der Formulierung der entsprechenden statistischen Hypothesen angelangt: H0: Es gibt keinen Unterschied zwischen dem gehäuften Auftreten von Isoglossen entlang einer bestimmten, gegebenen Linie und dem, was durch Zufall zu erwarten wäre. H1: Entlang dieser gegebenen Linie treten mehr Isoglossen auf, als es durch den Zufall zu erwarten wäre. H2: Entlang dieser gegebenen Linie treten weniger Isoglossen auf, als es durch den Zufall zu erwarten wäre. Könnte man das Zutreffen von H1 mit einer gewissen Verlässlichkeit für eine sinnvoll gewählte Linie nachweisen, so wäre das ein starkes Indiz für die Existenz eines geographischen Diffusionshindernisses, an dem sich Isoglossen stauen. Umgekehrt deutet das Zutreffen von H2 auf einen Verstärker von sprachlichem Austausch hin. Eine solche statistische Überprüfung, ob Isoglossenbündel als signifikant oder nur als zufällig einzuschätzen sind, wurde bislang meines Wissens noch nicht durchgeführt. Um dies zu bewerkstelligen, sind die oben formulierten Hypothesen zunächst in eine mathematische Form zu bringen. Die tatsächlich beobachtete Isoglossendichte entlang eines Pfades P wird als R P bezeichnet, während das durch Zufall zu erwartende Auftreten als RQ notiert wird. Extreme Werte können nun an beiden Enden der Skala auftreten: Sowohl besonders hohe R P -Werte, die für das Vorhandensein einer Barriere sprechen, als auch besonders niedrige R P -Werte, die einen Indikator für einen Verstärker von Sprachkontakt darstellen, können signifikant sein. Entsprechend werden die Hypothesen wie folgt formuliert:
100 Für die Diskussion von Barrieren und Verstärkern („barriers and amplifiers“) s. auch baiLey et al. (1993, 383–386); woLfraM /SChiLLing-eSteS (2003, 727–729). h ard (1972, 26) spricht von „Kanälen und Barrieren“.
143
Konfirmatorisch (data-based)
H0: R P = RQ
H1: R P < RQ
vs.
vs.
H2: R P > RQ101
(26)
nun ist die Isoglossendichte R zu definieren. Das Auffinden von Isoglossen ist durch das in Abschnitt 4.2.3 beschriebene Verfahren operationalisiert: Die Isoglossen sind die Linien zwischen den Dominanzgebieten einzelner Varianten. Liegen entlang eines Pfades besonders viele Isoglossen vor, so ist er als Grenze stark und eine Barriere, ansonsten ist er schwach und keine Barriere. Um die Häufigkeit des Auftretens solcher Grenzlinien entlang eines vorgegebenen Pfades zu messen, liegt es nahe, zunächst gesondert für die einzelnen Kantenstücke des Pfades das Auftreten von Isoglossenteilstücken zu zählen, so dass sich für jedes Kantenstück (das jeweils zwischen zwei benachbarten Orten liegt) eine relative Isoglossenhäufigkeit in Abhängigkeit von der betrachteten Gesamtvariablenzahl angeben lässt. f ai ,aj =
|
1
|
X m∈
(27)
m xm max (ai ) ≠ x max aj
Hier wird das Auftreten von Grenzlinien zwischen zwei orten gezählt und damit die relative Frequenz innerhalb des Variablenkorpus errechnet. f(ai,aj) ist die relative Isoglossenfrequenz zwischen den orten ai und aj, 𝕄 steht für die Menge m (a) ist die jeweils dominante Variante am Ort aller betrachteten Variablen, und xmax m a für eine Variable X (vgl. 4.2.3). Eine einzelne Grenzkante zwischen zwei nachbarorten liegt dann vor, wenn sie nicht dieselbe dominante Variante haben. f(ai,aj) ist demnach 0, wenn zwischen den orten ai und aj bei allen betrachteten Variablen nie eine Grenzlinie auftritt, und 1, wenn zwischen ihnen immer eine Grenzlinie auftritt. In der Praxis liegt es zwischen diesen beiden Extremen. Da manche Grenzkanten ‚schärfer‘ sind als andere (d. h. die Intensitätswerte beiderseits einer Kante können unterschiedlich stark voneinander abweichen), kann es sinnvoll sein, sie nach ihrer Trennschärfe zu gewichten. Wenn sich etwa die Intensitätswerte auf beiden Seiten einer Kante stark unterscheiden, so ist die Grenzlinie als scharf zu bewerten, während sie eher fließend ist, wenn die Dominanz zwar von einer zur anderen Variante umschlägt, aber die Intensitätswerte sich sonst nur wenig unterscheiden. Bei einer solchen Gewichtung kann es sogar sinnvoll sein, auf die Bedingung zu verzichten, dass eine Grenzlinie vorliegen muss, und nur die Intensitäten der jeweils dominanten Varianten an beiden Orten vergleichen. Damit kann man Intensitätsunterschiede auch dann erfassen, wenn sie keinen Dominanzunterschied zur Folge haben. Die Umsetzung einer solchen alternativen Berechnungsweise lautet wie folgt: f ~ ai ,aj =
1 2∙| |
X m∈
m (a ) aj im max ai – ixmax i
m m + imax aj – ixmax
aj
ai
(28)
Hier wird die durchschnittliche Differenz der Intensitäten der jeweils dominanten Varianten ermittelt und der Mittelwert dieses Wertes über alle Variablen berech101 Es handelt sich hierbei wiederum um die verkürzte Schreibweise zweier einseitiger Tests (vgl. S. 127): H0: R P ≤ RQ vs. H1: R P > RQ und H0: R P ≥ RQ vs. H2: R P < RQ.
144
Analyse
net. Je stärker die Intensitätswerte der jeweils dominanten Varianten zweier Orte im Mittel abweichen, umso höher ist f ~, und umgekehrt. f ~ liegt dabei wiederum zwischen 0 und 1. Der zu erwartende Wert für f oder f ~ wird u. a. durch die Entfernung der beiden betrachteten Erhebungsorte beeinflusst. Liegen sie weit voneinander entfernt, so ist eine höhere Grenzlinienfrequenz bzw. ein höherer Intensitätsunterschied zu erwarten, als wenn sie nahe beieinander liegen. Deshalb wird dieser Wert ( f bzw. f ~) mithilfe der Entfernung d(ai,aj) zwischen den orten ai, aj normalisiert, indem durch sie geteilt wird. Man misst also nicht das bloße Auftreten von Grenzlinien, sondern die relative Grenzlinienfrequenz (oder den mittleren Intensitätsunterschied) zwischen zwei orten pro Kilometer. Zudem wird durch die Länge der Kante zwischen ai und aj, λ(ai,aj), geteilt, da über einen längeren Abschnitt mehr Austausch möglich ist.102 Die so ermittelte Maßzahl wird analog zum elektrischen Widerstand als „sprachlicher“ oder in diesem Fall als „lexikalischer Widerstand“ R(ai,aj) oder Rp zwischen dem ortepaar p = {ai,aj} bezeichnet, und kann entweder auf der Grenzfrequenz f oder auf der Intensitätsdifferenz f ~ beruhen:103 (~) R(~) ai ,aj = p =R
f (~) ai ,aj d ai ,aj ∙ λ ai ,aj
(29)
Ein Prüfpfad (sinnvoll wäre z. B. ein Fluss oder eine politische Grenze) besteht aus mehreren aneinandergereihten Kanten (die jeweils einem ortepaar entsprechen). Die Berechnung des lexikalischen Gesamtwiderstandes R P (oder genauso R P~) eines Pfades P = {p1; …; pk} aus k Einzelkanten erfolgt analog zur Berechnung von elektrischem Widerstand in Parallelschaltung: –1
RP = p∈P
1 Rp
(30)
Ein geringer Einzelwiderstand ‚schwächt‘ den Gesamtwiderstand so wesentlich mehr, als ihn ein hoher Einzelwiderstand ‚stärkt‘. So wird sichergestellt, dass Pfade, die schwache Einzelglieder enthalten, keine zu hohen Widerstände erhalten; die gesamte Kette muss konstant hohe Werte aufweisen, um insgesamt einen hohen Wert zu erzielen. nur so ist gewährleistet, dass nur solche Pfade mit einem hohen Widerstand bewertet werden, die ihn auf der ganzen Strecke aufweisen. Durch das Aufaddieren der reziproken Einzelwiderstände sinkt mit jedem zusätzlichen Teilstück der Gesamtwiderstand: Je mehr Einzelwiderstände hinzukommen, desto niedriger wird der Gesamtwiderstand. Deshalb sind die Widerstände für unter-
102 Der Faktor 1/λ(ai,aj) lässt sich auch damit begründen, dass bei einer höheren Erhebungsortedichte statt einer längeren Kante mehr kürzere Kanten zu berücksichtigen wären, was ebenfalls zu einer Verringerung des Gesamtwertes führen würde (analog zur Berücksichtigung der Querschnittsfläche bei der Berechnung eines elektrischen Widerstands). 103 Die Berechnung des sprachlichen Widerstands folgt wesentlich vogeLbaCher (2011, 59).
Konfirmatorisch (data-based)
145
schiedlich lange Pfade nicht direkt miteinander vergleichbar (der tatsächliche Vergleichswert hierfür ist der p-Wert des Monte-carlo-Tests). R P verrät uns in dieser Form noch nichts über die statistische Einschätzung des Gesamtwiderstandes. Es kann aber als Testgröße in einem Signifikanztest dienen, der bewertet, wie wahrscheinlich es ist, dass ein bestimmter Widerstand ‚zufällig‘ zustande gekommen ist. Da die Verteilung der möglichen Werte von R P in der Gesamtmenge an möglichen Pfaden unbekannt ist, ist ein nicht-parametrischer Test erforderlich (vgl. 4.6.1). Hierfür wird eine Monte-carlo-Simulation (vgl. 4.6.2) durchgeführt, die eine hohe Anzahl an zufälligen Pfaden generiert.104 Die simulierten Pfade müssen dabei folgende Bedingungen erfüllen: Sie müssen – – – –
die gleiche Anzahl an Kanten wie der Prüfpfad haben, zusammenhängend sein, nicht-verästelt sein und keine geschlossene Schleife bilden, in der Simulation gleich wahrscheinlich sein.
Die Simulation erfolgt nach folgendem Algorithmus, der zufällige Pfade nach den genannten Bedingungen erzeugt: 1. Von den insgesamt 753 vorhandenen Einzelkanten (= benachbarten Ortepaaren) wird eine zufällig ausgewählt. 2. An diese Kante schließen vier potentielle weitere an (an jedem Ende zwei), es sei denn, sie berührt den Kartenrand, dann sind es nur zwei (am dem Kartenrand abgewandten Ende). Von diesen vier bzw. zwei berührenden Kanten wird eine zufällig ausgewählt. 3. An die neu hinzugekommene Kante schließen zwei potentielle weitere an, es sei denn, sie berührt den Kartenrand, dann folgen keine weiteren. In diesem Fall wird der Pfad verworfen und wieder bei Punkt 1. begonnen; im anderen Fall wird eine der zwei anschließenden Kanten zufällig ausgewählt und hinzugenommen. 4. Wenn die neu hinzugekommene Kante an eine bereits verwendete anschließt, wird der Pfad verworfen und wieder bei 1. begonnen; ansonsten wird 3. und 4. wiederholt, bis die Kantenzahl der des Prüfpfades entspricht. Diese Simulation wird mehrere Male durchgeführt, bis die vorher festgelegte Simulationsanzahl M erreicht ist. Man erhält so die M zufälligen Pfade Q1 = (q11, …, q1k); …; Q M = (q1M, …, qkM ), für die sich die Widerstände RQ 1, …, RQ M berechnen lassen. Zusammen mit R P ergibt dies M + 1 R-Werte, die in aufsteigender Reihenfolge sortiert werden. Liegt die Position von R P oberhalb von (1 – α) · (M + 1) (d. h. ist der p-Wert größer als 1 – α; vgl. 4.6.2), so ist H0 zugunsten von H1 zu verwerfen: Der Prüfpfad hat dann einen signifikant hohen Widerstand, d. h. er ist auffallend ‚undurchlässig‘ für sprachliche Ausgleichserscheinungen; er ist eine Barriere. Der Widerstand von P kann jedoch auch signifikant niedrige Werte annehmen, der Prüfpfad ist dann auffallend ‚durchlässig‘; entlang seines Verlaufs treten wesent104 Die Simulation der Pfade folgt vogeLbaCher (2011, 60–62).
146
Analyse
lich seltener Isoglossen (oder niedrigere Intensitätsunterschiede) auf, als normalerweise zu erwarten wäre. P stellt dann eine Linie dar, über die hinweg reger sprachlicher Austausch herrscht; er ist ein Verstärker. Eine Besonderheit der beiden Widerstände R und R ~ erlaubt in begrenztem Ausmaß einen Schluss auf das relative Alter der jeweiligen Grenzlinie. Der isoglossenbasierte Widerstand R gibt die Stärke einer Grenzlinie an, d. h. die relative Isoglossenhäufigkeit ungeachtet ihrer Schärfe. Der intensitätsbasierte Widerstand R ~ hingegen gibt an, wie stark sich die Intensitäten links und rechts des Pfades ähneln, d.h. die Schärfe einer Grenzlinie, ungeachtet davon, ob sich dies in Isoglossen äußert oder nicht. Die Betrachtung beider Maßzahlen lässt eine diachrone Interpretation zu. Eine signifikante Stärke weist zunächst darauf hin, dass entlang des Prüfpfades eine sprachliche Hürde gegeben ist, die zu irgendeinem Zeitpunkt zur Ausbildung einer sprachlichen Grenze geführt hat. Er alleine lässt jedoch noch keinen Schluss darauf zu, ob dies zeitlich weiter zurück liegt oder erst kurz vor der Datenerhebung geschehen ist. Betrachtet man zusätzlich den intensitätsbasierten Widerstand, so sind Aussagen über die Schärfe der Grenze möglich. Ist er nicht signifikant hoch, so ist die Grenze unscharf; erreicht er einen signifikanten Wert, so ist die Grenze scharf. Eine scharfe Grenze muss in jüngerer Zeit noch aktiv gewesen sein, sonst wäre sie mittlerweile durch Ausgleichsbewegungen ‚verwischt‘ worden und dadurch unscharf geworden. Genau dies wird durch einen nicht signifikanten Wert ausgedrückt: Die Grenze ist unscharf, d. h. sie ist seit Längerem nicht mehr wirksam. Eine andere Möglichkeit ist, dass es sich dabei um eine noch junge Grenze handelt, die erst dabei ist, sich zu entwickeln. Bei signifikant niedrigen R ~-Werten ist das Gegenteil der Fall: Es ist davon auszugehen, dass es durch den verstärkten Kontakt zunächst zur Angleichung der Intensitäten kommt; in einem zweiten Schritt führt dies dazu, dass sich weniger Isoglossen ansiedeln. Sind beide Widerstände signifikant niedrig, so ist die Verstärkung schon seit längerer Zeit und auch aktuell noch wirksam; ist nur der intensitätsbasierte Widerstand signifikant, so ist die Verstärkung eine jüngere Erscheinung. 5.1.3.1 Flüsse naheliegende Prüfpfade im Bereich der Topographie sind Flüsse. Sie sind von natur aus linienförmig und eignen sich daher in besonderer Weise als Prüfpfade. Flüsse sind Verkehrshindernisse, die je nach Breite, Tiefe, Fließgeschwindigkeit etc. unterschiedlich schwer zu überwinden sind. Da sie dadurch Verkehrsbarrieren darstellen, werden sie oft für Sprachgrenzen verantwortlich gemacht. Im Bereich des SBS gilt dies insbesondere für den Lech, der als starke Dialektgrenze gilt und vor allem aufgrund seiner jahrhundertelangen Bedeutung als Territorialgrenze (Westgrenze des Herzogtums Baiern) als Verkehrsbarriere und als Scheide zwischen dem alemannischen und dem bairischen Dialektraum angesehen wird (vgl. z. B. bohnenberger 1928, 284–290; könig 2001; 2010a; 2010b). Wenn auch die Widerstände R und R ~ der untersuchten Flüsse (Abb. 33 im Anhang, S. 256) nicht unmittelbar miteinander vergleichbar sind, so haben doch
Konfirmatorisch (data-based)
147
Lech 41 Kanten / 138,8 km
Stärke (isoglossenbasiert/R): Schärfe (intensitätsbasiert/R~):
pWert ↑ 1,000 ↑ 1,000
Wertach 29 Kanten / 123,1 km
Stärke (isoglossenbasiert/R): Schärfe (intensitätsbasiert/R~):
0,309 0,205
Donau 28 Kanten / 117,4 km
Stärke (isoglossenbasiert/R): Schärfe (intensitätsbasiert/R~):
↑ 0,953 0,919
Günz 26 Kanten / 103,4 km
Stärke (isoglossenbasiert/R): Schärfe (intensitätsbasiert/R~):
0,639 0,157
Zusam 23 Kanten / 90,9 km
Stärke (isoglossenbasiert/R): Schärfe (intensitätsbasiert/R~):
0,210 ↓ 0,017
Schmutter 23 Kanten / 88,6 km
Stärke (isoglossenbasiert/R): Schärfe (intensitätsbasiert/R~):
0,586 0,366
Mindel 20 Kanten / 81,9 km
Stärke (isoglossenbasiert/R): Schärfe (intensitätsbasiert/R~):
0,544 0,065
Paar 16 Kanten / 59,7 km
Stärke (isoglossenbasiert/R): Schärfe (intensitätsbasiert/R~):
0,799 0,679
Wörnitz 11 Kanten / 44,5 km
Stärke (isoglossenbasiert/R): Schärfe (intensitätsbasiert/R~):
0,812 0,341
Altmühl 9 Kanten / 33,5 km
Stärke (isoglossenbasiert/R): Schärfe (intensitätsbasiert/R~):
0,928 0,744
Iller 7 Kanten / 34,3 km
Stärke (isoglossenbasiert/R): Schärfe (intensitätsbasiert/R~):
0,473 0,556
Tab. 13: p-Werte von elf Flüssen im Untersuchungsgebiet (M = 9999).
ihre p-Werte universale Aussagekraft (Tab. 13): Sie geben die Position des jeweiligen Widerstandes im Vergleich mit den Widerständen von M = 9999 simulierten Pfaden gleicher Länge an. p-Werte über 0,95 bedeuten, dass der entsprechende Widerstand signifikant hoch ist; p-Werte unter 0,05 bedeuten, dass der entsprechende Widerstand signifikant niedrig ist. Der p-Wert von 1,000 im Fall des Lechs sagt aus, dass dieser Fluss im Vergleich zu allen zufällig gebildeten Pfaden gleicher Länge den höchsten Widerstand aufweist. Da die Simulationszahl mit 9.999 sehr hoch ist, kann man schließen, dass der Lech innerhalb des Untersuchungsgebiets wohl die markanteste Grenze von vergleichbarer Länge darstellt; sein Widerstand ist extrem hoch. Der Lech ist in der Lexik nicht nur eine sehr starke, sondern auch eine sehr scharfe Barriere, denn auch für den intensitätsbasierten Widerstand erreicht er einen extremen Wert. Abgesehen vom Lech erreicht nur die Donau einen signifikant hohen Widerstand, jedoch lediglich im Fall des isoglossenbasierten Widerstands R. Mit der Donau liegt ein sehr großer Fluss vor, der innerhalb des Untersuchungsgebiets einen ähnlichen Abfluss aufweist wie der Lech (beide vor der Vereinigung ca. 100 m3/s,
148
Analyse
danach ca. 250 m3/s).105 Einen weiteren hohen, aber nicht signifikanten R-Wert hat die Altmühl. Für die Altmühl zeigt sich jedoch kein Zusammenhang mit dem Abfluss; sie ist wesentlich kleiner (ca. 10 m3/s). Sie fällt innerhalb des Untersuchungsgebiets in etwa mit der Dialektgrenze zwischen dem Mittel- und dem nordbairischen106 zusammen, was den hier erzielten Befund zwar stützt, die Rolle der Flüsse allgemein aber nicht zu erhellen vermag. In beiden Fällen (Donau und Altmühl) ist der p-Wert für R entscheidend größer als der für R ~, was sich als verminderte Trennschärfe beider Linien und somit als Hinweis auf eine rezent an Bedeutung verlierende Barrierewirkung deuten lässt. Die übrigen Flüsse zeigen größtenteils unauffällige p-Werte. Bemerkenswert ist jedoch der signifikant niedrige R ~-Wert der Zusam. Er drückt aus, dass die Zusam unter 9.999 zufällig erzeugten Pfaden gleicher Länge unter den 5 % mit den geringsten intensitätsbasierten Widerständen ist. Die orte links und rechts der Zusam neigen also stark dazu, ähnliche Variantenanteile aufzuweisen, während die Zahl der Isoglossen nicht signifikant niedrig ist. Demnach ist es in jüngerer Zeit (d. h. nicht lange vor der Datenerhebung) zu verstärktem sprachlichem Austausch über die Zusam hinweg gekommen. ob diese Verstärkung schon länger besteht, lässt sich aufgrund des nicht signifikanten R-Wertes nicht eindeutig entscheiden. Die Mindel zeigt ähnliche (wenn auch nicht signifikante) p-Werte wie die Zusam. Zusammen mit den ebenfalls eher niedrigen R ~-Werten für Wertach, Günz und Schmutter lässt sich dies möglicherweise so deuten, dass in dem Gebiet zwischen Iller und Lech (bzw. zwischen Ulm und Augsburg) vor allem Diffusionsbewegungen in West-Ost- (oder Ost-West-) Richtung stattfinden, die dafür sorgen, dass sich nicht leicht Isoglossen mit nord-Süd-Ausrichtung anlagern. Ein Probetest entlang einer Linie zwischen Ulm und Augsburg, d. h. eines senkrecht zu diesen Flüssen verlaufenden Prüfpfades, ergibt einen p-Wert für R ~ von 0,721, was die Vermutung stützt, dass in diesem Bereich eher ost-West- als nord-Süd-ausgerichtete Isoglossen vorkommen. Eine weitere Erklärung für diesen Umstand könnte sein, dass der Lech als starke Barriere Isoglossen an sich zieht und so als Attraktor fungiert, der dafür sorgt, dass parallel zu ihm verlaufende Isoglossen eher selten sind; eine nord-Süd-Isoglosse, die sich am Lech anlagert, kann nicht mehr östlich oder westlich von ihm auftreten. 5.1.3.2 Politische Grenzen Politische Grenzen können starke Verkehrshindernisse sein, vor allem wenn sie mit Passier- und Zollkontrollen verbunden sind. Das erschwerte Überschreiten der Grenze führt demnach auch zu erschwertem sprachlichem Austausch. Doch auch reine Verwaltungsgrenzen können unter Umständen Kommunikationshindernisse darstellen, etwa wenn sie mit einer geographischen Aufteilung des öffentlichen Lebens, etwa in Bezug auf Schulen oder Berufsausübung, verbunden sind. Der 105 Die Werte stammen vom niedrigwasser-Informationsdienst Bayern () und wurden von mir zusammengefasst und gerundet. 106 nach eduard nübLing (1988, 118); vgl. auch SBS (K. 1.8).
149
Konfirmatorisch (data-based)
2 1
5
3
10
8 18
16
36
45
57
44
48
59
58
94
91 109
96 97
95
93
112
110
111
127
129
128
146
147
162
161 176
177 191
190 4 20
218 233
246 260
150
247
208
237 248
262
209
211
212
174 172
224 238
226
240 239
187
185 199
200
188
201
251 250 265
252 266
229
254
203
217 231
Oberbayern
230
232
245
243 244 255 256
253
189
202
215
214
213
227 228
242
241
173 175
186
216
225
249
263
210
198
144 160
159
170
183
197
126
158 157
171
169
168
167
108
107
106
156
155
184
195
236
90
123 124 125 121 122 143 141 139 138 142 140
153
181
196
223
235
78
89
105
104
154
152
182 194
264 261
180
136
151
178 192 193
221 222 220
137
135
166
165 179
88 87
119
118
134
133
163
206
234
117
115
Schwaben
148 149 164
74
102
68 77
75
103 101
67
66 76
86 85
Oberbayern
55
120
116
207
205
219
84
100
99
132
130
145
98
73
83
80
113 114 131
72
82
81
79
65 64
63
42
54
53
51
62
71
69
92
61
60 70
52
50
41
40
39
49
47 46
34
33
31 38
37
35
43 56
32
29
27
26
24
23 30
28
25
15
22
21
20
19
17
7
14
13
12
11
Mielfranken 6
4
9
259 257
258 272
267
270
268 269
271
Abb. 34: Die bayerischen Bezirksgrenzen (Stand 1980).
Mittelfranken (1980) 15 Kanten / 59,3 km
Stärke (isoglossenbasiert/R): Schärfe (intensitätsbasiert/R~):
pWert ↑ 0,996 ↑ 0,983
Oberbayern (1980) Nordteil 15 Kanten / 71,4 km
Stärke (isoglossenbasiert/R): Schärfe (intensitätsbasiert/R~):
0,883 0,652
Oberbayern (1980) Südteil 31 Kanten / 115,4 km
Stärke (isoglossenbasiert/R): Schärfe (intensitätsbasiert/R~):
0,557 0,267
Tab. 14: p-Werte der Bezirksgrenzen nach der Gebietsreform 1972 (M = 9999). Die Grenze Schwabens zu oberbayern muss in zwei Teilstücken überprüft werden, da das Testverfahren nur zusammenhängende Prüfpfade zulässt.
Frage, ob und welche Arten von politischen Grenzen sich tatsächlich in Form von signifikanten sprachlichen Grenzen manifestieren, wird in diesem Abschnitt exemplarisch anhand verschiedener politischer Gebietsaufteilungen nachgegangen.107 Die ersten zu prüfenden Pfade sind durch die heutigen Bezirksgrenzen gegeben, die seit der Gebietsreform der 1970er Jahre Bestand haben (Abb. 34), d. h. nur einige Jahre vor dem Beginn der Aufnahmen für den SBS im Jahr 1984 festgelegt 107 Die in diesem Abschnitt untersuchten Grenzverläufe folgen zorn (1955), SpindLer (1969), frei /fried/k ieSSLing (1982–) sowie SBS (Bd. 1, K. 3–4).
150
Analyse
2 1
10
6
18
36
57
45 44
48
59
58
70
94
91 109
96 97
95
92 93
112
110
111
127 128
146 162
161 176
177 191
190 4 20
218 233
246 260
179
206
208
234
247
237 248
262
209
171
211
212
174 172
224 238
226
240 239
241
187
185 199
200
188
201
251 250 265
252 266
229
254
230
203
217 231 232
245
243 244 255 256
253
189
202
215
214
213
227 228
242
173 175
186
216
249
263
210
225
236
264 261
195
198
144 160
159
170
183
197
126
158 157
184
108
107
106
156
155 169
168
167
181
196
223
235
90
123 124 125 121 122 143 141 139 138 142 140
153
182 194
78
89
105
104
154
152 166
180
136
151
178 192 193
221 222 220
137
135
133
165
163
88 87
119
118
134
150
207
205
219
117
Schwaben
148 149 164
74
102
68 77
75
103 101
67
66 76
86 85
55
120
116
132 147
84
100
99
113 114 131
130
145
98
73
83
80
115
129
72
82
81
79
65 64
63
42
54
53
51
62
71
69
52
50
61
60
41
40
39
49
47 46
34
33
31 38
37
35
43 56
32
29
27
26
24
23 30
28
25
15
22
21
20
19
17
Mielfranken
14
13
12
11
8 16
7
5
3 4
9
Oberbayern 259
257
258 272
267
270
268 269
271
Abb. 35: Die bayerischen Bezirksgrenzen (Stand 1955).
Mittelfranken (1955) 20 Kanten / 74,2 km
Stärke (isoglossenbasiert/R): Schärfe (intensitätsbasiert/R~):
pWert ↑ 0,996 ↑ 0,972
Oberbayern (1955) 46 Kanten / 178,8 km
Stärke (isoglossenbasiert/R): Schärfe (intensitätsbasiert/R~):
0,829 0,559
Tab. 15: p-Werte der Bezirksgrenzen vor der Gebietsreform 1972 (M = 9999).
wurden. Aufgrund des relativ geringen Alters der Grenzlinien würde man vermutlich allenfalls geringe Auswirkungen auf die sprachliche Situation erwarten. Wie sich in Tab. 14 zeigt, sind beide Abschnitte der Außengrenze oberbayerns unauffällig. Die Grenzlinie Mittelfrankens zeigt jedoch für beide Widerstände signifikant hohe Werte. Wie dies zu deuten ist, wird im Nachfolgenden noch zu diskutieren sein. Zunächst wenden wir uns jedoch den Vorläufern der heutigen Bezirksgrenzen zu, deren Verlauf das Untersuchungsgebiet von 1944 bis 1972 politisch unterteilte (Abb. 35). Wie Tab. 15 zeigt, ist hier ebenfalls die Grenze zu Mittelfranken für beide Widerstände signifikant, während die Grenze zu Oberbayern keine ausgeprägt hohen Werte zeigt. Die Vorgänger der Regierungsbezirke waren die alten Kreise des Königreichs Bayern (Abb. 36). Auch sie unterlagen territorialem Wandel, hier wird ihr Grenz-
151
Konfirmatorisch (data-based)
2 1
6
Rezatkreis 10
8
36
31
57
45 44
48
59
58
70
94
91 109
96 97
95
92 93
112
110
111
127
146
145
162
161 176
177 191
20 4
190
218 233
246 260
117
148 149 164 179
247
237 248
262
209
171
211
212
174 172
224 238
226
240 239
187
185 199
200
188
201 215
214
213
251 250 265
252 266
227 228 229
242
241
254
173 175
186
216
249
263
210
225
236
264 261
195
198
230
189 203
202 217
Isarkreis 231
232 245
243 244 255 256
253
144 160
159
170
183
197
126
158 157
184
108
107
106
156
155 169
168
167
181
196
223
235
90
89
105
104
78
123 124 125 121 122 143 141 139 138 142 140
153
182 194 208
221 222 220
88 87
154 152
178 192 193
206
234
180
136
151
166
165
163
137 135
133 150
119
118
134
132
207
205
219
74
102
68 77
120
116
113 114
101
67
66
75
86 85
55
76
103
100
99
131
147
84
Oberdonaukreis
98
130
73
83
115
129
128
80
72
82
81
79
65 64
63
42
54
53
51
62
71
69
52
50
61
60
41
40
39
49
47 46
Regenkreis
34
33
38
37
35
43 56
32
29
27
26
24
23 30
28
25
15
22
21
20
19
17
14
13
12
11
18
16
7
5
3 4
9
259 257
258 272
267
270
268 269
271
Abb. 36: Die bayerischen Kreisgrenzen (Stand 1818).
Oberdonaukreis (Nord) 23 Kanten / 91,6 km
Stärke (isoglossenbasiert/R): Schärfe (intensitätsbasiert/R~):
pWert 0,927 0,665
Rezatkreis 28 Kanten / 124,5 km
Stärke (isoglossenbasiert/R): Schärfe (intensitätsbasiert/R~):
↑ 0,976 0,853
Regenkreis 9 Kanten / 43,2 km
Stärke (isoglossenbasiert/R): Schärfe (intensitätsbasiert/R~):
0,941 0,868
Isarkreis 30 Kanten / 121,3 km
Stärke (isoglossenbasiert/R): Schärfe (intensitätsbasiert/R~):
0,778 0,728
Tab. 16: p-Werte der Grenze der Reichskreise (Stand 1818) (M = 9999).
verlauf zwischen 1817 und 1837 untersucht. Signifikant hoch ist in diesem Fall lediglich der isoglossenbasierte Widerstand der Außengrenze des ehemaligen Rezatkreises, der innerhalb unseres Untersuchungsgebiets den Vorläufer Mittelfrankens darstellt. Die einseitige Signifikanz bei R spricht für eine nicht mehr aktive Wirkung dieser Grenze. Die nordgrenze des oberdonaukreises ist nicht (ganz) signifikant, obwohl sie in großen Teilen mit der Rezatkreisgrenze übereinstimmt. Bei noch weiter zurück liegenden, v. a. mittelalterlichen und frühneuzeitlichen Territorien stellt sich das Problem, dass ihr Grenzverlauf über die Zeit wenig kon-
152
Analyse
2 1
10
6
18
36
45
43 56
57
44
48
59
58
70
94
91 109
96 97
95
92 93
112
110
111
127 128
162
161 176
177 191
190 4 20
218
246
179
247
260
237 248
262
263
210
211
212
174 172
224 238
226
240 239
241
187
185 199
200
188
201
251 250 265
252 266
229
254
230
203
217 231 232
245
243 244 255 256
253
189
202
215
214
213
227 228
242
173 175
186
216 225
249 264
261
209
198
144 160
159
170
183
197
126
158 157
171
169
168
167
108
107
106
156
155
184
195
236
90
123 124 125 121 122 143 141 139 138 142 140
153
181
196
223
235
78
89
105
104
154 152
182 194 208
221 222 220 234
180
136
151
178 192 193
206
233
137
166
165
163
88 87
119
118 135
133 150
207
205
219
117 134
132 148 149 164
74
102
68 77
75
103 101
67
66 76
86 85
55
120
116
113 114
147
84
100
99
131
130 146
145
98
73
83
80
115
129
72
82
81
79
65 64
63
42
54
53
51
62
71
69
52
50
61
60
41
40
39
49
47 46
34
33
31 38
37
35
Pfalz-Neuburg
32
29
27
26
24
23 30
28
25
15
22
21
20
19
17
14
13
12
11
8 16
7
5
3 4
9
259 257
258 272
267
270
268 269
271
Abb. 37: Die Außengrenzen des Herzogtums Pfalzneuburg (Stand um 1800).
Herzogtum Pfalz-Neuburg (Nord) 29 Kanten / 125,2 km
Stärke (isoglossenbasiert/R): Schärfe (intensitätsbasiert/R~):
pWert ↑ 0,997 ↑ 0,952
Herzogtum Pfalz-Neuburg (Süd) 25 Kanten / 100,4 km
Stärke (isoglossenbasiert/R): Schärfe (intensitätsbasiert/R~):
0,807 0,551
Tab. 17: p-Werte des Herzogtums Pfalz-neuburg (Stand um 1800) (M = 9999).
stant war und einzelne Orte häufig ihre Zugehörigkeit ändern konnten. Deshalb sollen hier exemplarisch zwei Territorien untersucht werden, die über längere Zeit relativ konstant waren. Das Herzogtum Pfalz-neuburg (Abb. 37) geht auf die älteren Grafschaften Lechsgemünd-Graisbach und Dillingen zurück, die den Hauptteil wittelsbachischen Besitzes innerhalb des heutigen Schwabens darstellten. Das Herzogtum existierte von 1505 bis 1808. Es stellt dadurch eine relative Konstante innerhalb des schwäbischen ‚Flickenteppichs‘ dar. Untersucht wurde der Grenzverlauf, wie er um 1800 gegeben war.108 Die nordgrenze des Herzogtums Pfalz-neuburg zeigt 108 Die Südgrenze konnte nicht bis zum östlichen Rand des Untersuchungsgebiets durchgezogen werden, da ort 68 (Klingsmoos) erst seit 1822 existiert.
153
Konfirmatorisch (data-based)
2 1
10
6
18
36
46
45 44
48
59
58
70
94
91 109
93
112
110
111
127
113 114
162
161 176
177 191
190 4 20
219 218 233
246 260
179
208
221 222 220
247
237 248
262
209
210
198
171
211
212
174 172
187
185
200
224
226
240 239
265
252 266
229
242
241
251 250
227 228
254
230
217 231 232
245
243 244 255 256
253
189 203
202
215
214
213
188
201
216
238
173 175
186
199
144 160
159
170
183
197
126
158 157
184
108
107
106
156
155 169
168
167
225
249
263
90
123 124 125 121 122 143 141 139 138 142 140
153
181
195
236
264 261
152
196
223
235
78
89
105
104
154
151
166
180
136
182 194
206
234
137
178 192 193
88 87
119
118 135
133 150
165
163
207
205
117 134
132 148 149 164
147
74
102
68 77
75
103 101
67
66 76
86 85
55
120
116
131
130 146
145
84
100
99
115
129
128
98
73
83
80
96 97
95
92
72
82
81
79
65 64
63
42
54
53
51
62
71
69
52
50
61
60
41
40
39
49
47
57
34
33
31 38
37
35
43 56
32
29
27
26
24
23 30
28
25
15
22
21
20
19
17
14
13
12
11
8
Grafscha Oengen 16
7
5
3 4
9
259 257
258 272
267
270
268 269
271
Abb. 38: Die Außengrenze der Grafschaft oettingen (ca. 1450–1801).
Grafschaft Oettingen 19 Kanten / 78,5 km
Stärke (isoglossenbasiert/R): Schärfe (intensitätsbasiert/R~):
pWert ↑ 0,974 0,797
Tab. 18: p-Werte der Grafschaft oettingen (ca. 1450–1801) (M = 9999).
für beide Widerstände signifikant hohe Werte. Dies ist ein Indiz dafür, dass diese Linie auch nach dem Ende des Herzogtums noch Wirkung zeigte, was teils mit ihrem partiellen Fortbestehen in den jüngeren Kreis- und Bezirksgrenzen, teils mit der nachwirkung von über lange Zeit entstandenen, verfestigten sprachlichen Gegensätzen erklärt werden könnte. Die Südgrenze ist unauffällig. Ein weiteres relativ stabiles Territorium war die Grafschaft oettingen (Abb. 38), die vom 14. Jahrhundert an bis zu ihrer Mittelbarmachung Anfang des 19. Jahrhunderts in vergleichsweise konstanter Form existierte. Trotz ihrer relativen Beständigkeit in der Substanz wechselten einzelne orte mitunter zwischen der Grafschaft und den nachbarterritorien hin und her; dies gilt hier insbesondere für die orte Bissingen (47) und Wemding (20). Der untersuchte Grenzverlauf wurde so gewählt, dass er den Grundbestand der Grafschaft oettingen möglichst gut wiedergibt. Mit diesem Territorium wird gleichzeitig ein konfessioneller Gegensatz getestet, denn das Bekenntnis in der Grafschaft war über lange Zeit mehr-
154
Analyse
heitlich evangelisch, was sie von ihrem katholisch geprägten Umland unterschied (vgl. zorn 1955, K. 30; SpindLer 1969, K. 28). Der bis 1972 bestehende Landkreis nördlingen stimmte in seiner räumlichen Ausdehnung in großen Teilen mit der ehemaligen Grafschaft überein. Die Außengrenze der Grafschaft oettingen, die zum Teil eine gemeinsame Grenze mit Pfalz-neuburg war, erzielt beim isoglossenbasierten Widerstand einen signifikant hohen Wert, beim intensitätsbasierten ist dies nicht der Fall. Dies könnte darauf hindeuten, dass die Grenze ihre sprachliche Wirkung seit dem Ende des Bestehens der Grafschaft teilweise eingebüßt hat. Auf gesellschaftliche Bewegungen über die ehemalige Grenze hinweg deutet auch der Umstand hin, dass im ehemaligen Gebiet der Grafschaft mittlerweile der Katholizismus überwiegt (vgl. zorn 1955, K. 48; SpindLer 1969, K. 28). Durch die Untersuchung der älteren Grenzen wurde auch Licht auf die Befunde für die modernen Bezirksgrenzen geworfen. Der Umstand, dass die oberbayerische Grenze durchweg keine signifikante Wirkung zeigt, während sowohl das alte und das neue Mittelfranken signifikante Werte erzielen, kann wohl damit erklärt werden, dass letztere mit älteren, teilweise über Jahrhunderte bestehenden Territorialgrenzen zusammenfallen: Die jüngere Grenze von Mittelfranken (Stand 1980) zeigt partielle Übereinstimmung mit der über lange Zeit stabilen Grenze der Grafschaft oettingen, und auch mit der immerhin noch über zwanzig Jahre bestehenden jüngeren Grenze zwischen Regen- und Rezatkreis. Die ältere mittelfränkische Grenze (Stand 1955) zeigt gleichermaßen teilweise Übereinstimmung mit oettingen und zudem mit dem Herzogtum Pfalz-Neuburg. Der ebenfalls signifikante Rezatkreis zeigt teilweise übereinstimmenden Verlauf mit der gemeinsamen Grenze von oettingen und Pfalz-neuburg. Hinzu kommt, dass in diesen Bereich die alte Dreistammesecke zwischen Schwaben, Baiern und Franken fällt; der Einfluss des nördlich gelegenen ostfränkischen wird hier spürbar (vgl. auch S. 194). Wie die Karte „Sind die Leute hier am ort mehr Bayern oder Schwaben?“ des SBS (K. 1.18) ausweist, orientiert sich die wahrgenommene Zugehörigkeit im Fall der Franken bereits weitgehend an den heutigen Bezirksgrenzen. Für die Grenzen zwischen Schwaben und oberbayern bzw. zwischen oberdonau- und Isarkreis lassen sich keine weiter als 1817 zurückgehenden Vorläufer anführen, was erklären dürfte, warum sie in keiner der verschiedenen Ausprägungen einen signifikanten Wert erzielen. Die wohl markanteste alte Grenze in dieser Region war die Westgrenze des wittelsbachischen Herzogtums Baiern, die meist mit der alten Stammesgrenze zwischen Schwaben und Baiern identifiziert wird und über Jahrhunderte dem Verlauf des Lechs folgte. Mit dem Lech wurde diese schon im vorausgehenden Abschnitt als signifikant bestätigt. 5.1.3.3 Exploratorengrenzen Zuletzt sollen noch Pfade geprüft werden, die zwar nicht als sprachliche Barrieren im eigentlichen Sinne infrage kommen, sondern als mögliches Artefakt der
155
Konfirmatorisch (data-based)
2 1
10
6
18
36
57
45 44
48
94
91 109
93
112
110
111
127 128
113 114
147
162
161 176
177 191
190 4 20
218 233
246 260
179
208
221 222 220
247
237 248
262
224 238
249
263
171
211
212
174 172
226
240 239
241
187
185 199
200
188
201
251 250 265
229
230
266
254
267
217 231 232
255
256
253
203
245
243 244
259
M R 252
189
202
215
214
213
227 228
242
173 175
186
216 225
236
235
210
198
144 160
159
170
183
197
195
223
264 261
196 209
157
184
126
158
156
155 169
168
167
181
108
107
106
123 124 125 121 122 143 141 139 138 142 140
153
182 194
90
89
105
104
154 152
178 192 193
206
234
180
136
151
166
165
163
207
205
219
150
119 137
135
133
148 149 164
102
118
134
132
130 146
145
117
131
B S
101
78
120
116 115
129
88 87
103
100
99
68 77
75
74
85
67
76
86
83
80 98
73
84
82
81
96 97
95
92
72
55
66
64
63
71
69
65
62
42
54
53
51
50
61
60 70
79
52
E F
59
58
41
40
39
49
47 46
34
33
31 38
37
35
43 56
32
29
27
26
24
23 30
28
25
15
22
21
20
19
17
14
13
12
11
8 16
7
5
3 4
9
257
258 272
270
268 269
271
Abb. 39: Die Exploratorengrenzen des SBS.
Edith Funk 24 Kanten / 91,4 km
Stärke (isoglossenbasiert/R): Schärfe (intensitätsbasiert/R~):
pWert ↑ 0,964 ↑ 0,968
Brigitte Schwarz 37 Kanten / 161,3 km
Stärke (isoglossenbasiert/R): Schärfe (intensitätsbasiert/R~):
0,836 0,699
Manfred Renn 45 Kanten / 180,0 km
Stärke (isoglossenbasiert/R): Schärfe (intensitätsbasiert/R~):
0,898 0,792
Tab. 19: p-Werte der Exploratorengrenzen als Ergebnis der Monte-carlo-Simulation (M = 9999).
Datenerhebung. Bei den Aufnahmen für den SBS wurden drei Exploratoren eingesetzt, die jeweils zusammenhängende Gebiete innerhalb des Untersuchungsgebiets zugewiesen bekamen (Abb. 39): edith funk, brigitte SChwarz und Manfred r enn.109 Die Exploratoren unterscheiden sich in ihren Aufnahmegewohnheiten, so dass sich hieraus durchaus Konsequenzen für das aufgezeichnete Datenmaterial
109 Sonderfälle stellen die orte 112, 130 und 190 dar, die durch M anfred r enn bearbeitet wurden, obwohl sie im Gebiet von brigitte SChwarz liegen (vgl. hierzu auch S. 184), die orte 123 und 149, die von edith funk bearbeitet wurden, sowie die orte 122 und 169 (Befragung durch werner könig).
156
Analyse
ergeben können;110 Manfred r enn neigt etwa stärker dazu, ältere Varianten zu selektieren als die beiden anderen Exploratoren (vgl. SBS, Bd. 1, 30–31). Wenn es durch die Aufzeichnungsgewohnheiten der Exploratoren zu einem feststellbaren Unterschied zwischen den notierten Varianten beiderseits dieser „Exploratorengrenzen“ gekommen ist (vgl. SBS, Bd. 1, 45), so sollte dies über das gleiche Verfahren wie für sprachliche Barrieren nachweisbar sein. Wie sich herausstellt (Tab. 19), manifestiert sich die Außengrenze des Explorationsgebiets von edith funk in signifikanter Weise in den lexikalischen Daten des SBS. Die Grenzen der beiden anderen Exploratoren erreichen ebenfalls überdurchschnittliche, aber keine signifikanten Werte. Dies lässt darauf schließen, dass edith funk Aufzeichnungsgewohnheiten hatte, die sich deutlich von denen der anderen Exploratoren unterschieden. In Band 1 des SBS schreibt werner könig über edith funk: Sie hatte im Studium zwar dialektologische Übungen besucht, aber nie eine größere mundartkundliche Arbeit geschrieben. […] EF ist der Typ von Exploratorin, die zunächst eher wenig Vorwissen mitbringt, sich aber relativ schnell in ihr Dialektgebiet eingearbeitet hat. […] Sie ist auch der Typ von Exploratorin, die sich nicht nur auf den ältesten erreichbaren Stand beschränkt, sondern eher auch spontane umgangssprachliche Formen dokumentiert und die weniger als die beiden anderen Exploratoren zu Transkriptionen neigt, die in Richtung phonematischer Vereinfachung gehen. (SBS, Bd. 1, 30)
offenbar haben diese Eigenheiten zu relevanten Unterschieden im aufgezeichneten Dialektmaterial geführt. Dies ist vor allem deshalb bemerkenswert, weil solche Effekte im Bereich der Lexik eher weniger zu erwarten wären; die lexikalische Form einer aufzuzeichnenden Variante ist meist relativ eindeutig, v. a. im Vergleich zur phonetischen Variation. Die Unterschied liegt stattdessen in der Selektion der Varianten: Werden beispielsweise Antworten aufgezeichnet, die deutlich von der Standardsprache geprägt sind? offenbar entschied edith funk hier nach anderen Kriterien als die beiden anderen Exploratoren. Um zu prüfen, ob die Signifikanz auf den Gegensatz zu einem bestimmten der beiden anderen Exploratoren zurückgeht, wurden auch noch die jeweiligen Teilabschnitte der Grenzen getestet. Wie zu sehen ist (Tab. 20), ist edith funkS Gebiet nur im Ganzen merklich von den anderen verschieden, nicht aber der getrennt betrachtete Gegensatz zu Manfred r enn oder zu brigitte SChwarz. Es ist aber zu erkennen, dass der Unterschied zwischen edith funk und Manfred r enn größer ist als der zwischen edith funk und brigitte SChwarz. Dies erscheint plausibel, denn auch brigitte SChwarz war „relativ wenig selektierend“ (SBS, Bd. 1, 31), im Gegensatz zu Manfred r enn, dessen Aufnahmen „eher von antiquarischem Interesse geprägt [sind], seine primäre Aufmerksamkeit gehört der Aufzeichnung des alten Dialekts“ (SBS, Bd. 1, 30). Die Grenze zwischen den Gebieten von brigitte SChwarz und Manfred r enn ist jedoch unauffällig.
110 Ein weiterer Beleg hierfür sind einige Befunde der Faktorenanalyse (vgl. S. 184–185).
157
Konfirmatorisch (data-based) pWert Funk/Schwarz 8 Kanten / 36,4 km
Stärke (isoglossenbasiert/R): Schärfe (intensitätsbasiert/R~):
0,815 0,826
Funk/Renn 16 Kanten / 55,0 km
Stärke (isoglossenbasiert/R): Schärfe (intensitätsbasiert/R~):
0,920 0,934
Schwarz/Renn 29 Kanten / 25,0 km
Stärke (isoglossenbasiert/R): Schärfe (intensitätsbasiert/R~):
0,699 0,486
Tab. 20: p-Werte der Teil-Exploratorengrenzen als Ergebnis der Monte-carlo-Simulation (M = 9999).
5.1.3.4 Zusammenfassung Das in den vorangehenden Abschnitten vorgestellte Testverfahren erlaubt es, beliebige Pfade im Untersuchungsgebiet daraufhin zu untersuchen, ob sie innerhalb des betrachteten Variablenkorpus (d. h. in diesem Fall in der Lexik) signifikante Barrieren oder Verstärker von sprachlichem Austausch darstellen. Für einige vorgegebene, extralinguistische Gegebenheiten wie bestimmte Flüsse und politische Grenzen konnte nachgewiesen werden, dass sich dort auffällig häufig lexikalische Unterschiede feststellen lassen, was auf einen Stauungseffekt von Diffusionsbewegungen hinweist. Die beiden Maße für sprachlichen Widerstand („Stärke“ und „Schärfe“ einer Grenzlinie) können dabei in begrenztem Ausmaß Auskunft über die relative chronologie einer Barriere geben, etwa im Fall der Donau und einiger politischer Grenzen. In einem Fall wurde festgestellt, dass ein Fluss (die Zusam) auffällig niedrige Intensitätsunterschiede aufweist, so dass er als Verstärker von sprachlichem Austausch gelten kann; dies ist möglicherweise (zumindest teilweise) auf eine ‚Fernwirkung‘ des Lechs zurückzuführen. neben dieser Grundfunktion ist das Verfahren auch geeignet, das Datenkorpus auf andere vermutete linienförmige Strukturen zu testen, die nicht das Ergebnis von Barriere- oder Verstärkungswirkungen sind. Im konkreten Fall wurde der Einfluss der drei Exploratoren auf das Datenmaterial getestet; es konnte ein Effekt festgestellt werden, der darin besteht, dass sich eines der Exploratorengebiete in signifikanter Weise von den anderen unterscheidet. Die vorgestellte Methode ist damit in der Lage, beliebige linienförmige Strukturen auf ihre sprachgeographische Relevanz hin zu testen. Primäre Unterscheidungsmerkmale von der älteren Isoglossenmethode sind die Berücksichtigung der Gesamtlänge des Pfades und die Möglichkeit zur Bestimmung von statistisch aussagekräftigen Werten.
158
Analyse
5.2 EXPLoRATIV (DATA-DRIVEN): FAKToREnAnALySE111 Das Verfahren der Faktorenanalyse (FA) wurde in Abschnitt 4.6.3 bereits kurz vorgestellt. Es handelt sich um ein Verfahren der multivariaten Statistik, mit dem man in Daten Gemeinsamkeiten, d. h. über mehrere Variablen (im mathematischen Sinn) hinweg wiederkehrende Muster, identifizieren kann, ohne Vorannahmen dar über treffen zu müssen, welche Gemeinsamkeiten bestehen. Insofern handelt es sich bei der FA um eine Data-Mining-Methode, die es erlaubt, einen großen Datenbestand nach latenten Strukturen zu ‚durchkämmen‘. Hierfür bricht die FA die Fülle an Variation auf einige wenige Variationsdimensionen (Faktoren) herunter, die die Gesamtvariation möglichst kompakt und umfassend beschreiben. Angewandt auf unser Problem bedeutet dies: Wenn mehrere sprachliche Varianten dazu tendieren, gemeinsam aufzutreten (d.h. zu kookkurrieren), dann kann man diese zusammenfassen (verdichten), indem man ihre räumlichen Verteilungen durch einen einzelnen, repräsentativen Faktor ausdrückt. Die FA ist demnach auch eine Methode zur Datenreduktion und -kompaktierung, die jedoch (anders als die in der Dialektometrie beliebte Aggregation; vgl. 1.2.2) eine Erhaltung und Rekonstruierbarkeit der Ausgangsdaten gewährleistet. In unserem Fall werden die Faktoren aus den Korrelationen zwischen Variantenverteilungen, m. a. W. aus den Kookkurrenzen von Varianten, gebildet; dadurch erlauben sie es, lexikalische Teilbereiche kompakt und sinnvoll zu beschreiben und mit Blick auf inner- und außersprachliche Zusammenhänge zu interpretieren. Durch ihre Eigenschaften ist die FA besonders gut geeignet, 1. die Variation in den Daten in einer sinnvollen und aussagekräftigen Weise zusammenzufassen, um sie so besser und einfacher beschreiben und deuten zu können, sowie 2. bisher unentdeckte und unvermutete Regularitäten, Zusammenhänge und Strukturen aufzudecken. Ein Beispiel für die lohnende Anwendung einer mit der FA eng verwandten Methode, der sogenannten Hauptkomponentenanalyse (PcA, nach dem englischen Terminus principal component analysis), ist der Aufsatz „Genetics and the origin of European languages“ von aLberto piazza et al. (1995). Die Autoren wenden die PcA auf eine Datensammlung an, die aus räumlich über Europa verteilten menschlichen Genfrequenzen besteht, und extrahieren drei Hauptkomponenten, die sie mit Blick auf die Ausbreitung von Kulturtechniken und Sprachfamilien interpretieren.112 Diese Komponenten stellen (ähnlich wie die Faktoren in der FA) Zusammenfassungen von jeweils ähnlich verteilten (d. h. korrelierten) Genfrequenzen in der Datensammlung dar und lassen so gemeinsame Ursachen von untereinander korrelierten Verteilungen vermuten. Die geographische Verteilung der Werte von 111 Die technische Umsetzung und Durchführung der Faktorenanalyse für diese Untersuchung beruht in weiten Teilen auf der Arbeit von JuLiuS vogeLbaCher (2011, 21–41). Ich danke ihm herzlich für die Implementierung und Anwendung des Verfahrens. 112 Eine Diskussion weiterer Komponenten findet sich in CavaLLi-Sforza (2000, 117–121).
Explorativ (data-driven): Faktorenanalyse
159
Komponente 1, die in Kleinasien am höchsten sind und dann nach nordwesten hin abnehmen, zeigt eine hohe Übereinstimmung mit der Verteilung der archäologischen Fundstätten des allmählichen Vorrückens neolithischer Kulturtechniken. Komponente 2 zeigt eine nord-Süd-Verteilung, die sich evtl. mit klimatischen Bedingungen oder dem Vorkommen von uralischen Sprachen in Verbindung bringen lässt. Die Verteilung von Komponente 3 weist auf einen Zusammenhang mit der Ausbreitung der sogenannten Kurgankultur hin. Diese drei Hauptkomponenten lassen somit an einen Zusammenhang mit drei Expansionswellen denken, die über Europa hinwegzogen und ihre Spuren im genetischen Material der europäischen Bevölkerung hinterlassen haben (die Zusammenhänge mit den archäologischen Daten sind statistisch signifikant). Die Komponenten 1 und 3 lassen sich zusätzlich mit zwei distinkten Ausbreitungswellen von indoeuropäischen Sprachen in Verbindung bringen, Komponente 2 möglicherweise mit einer Ausbreitung von uralisch sprechenden Menschen, wenngleich die statistische Evidenz hierfür klein ist. Diese Studie zeigt in eindrucksvoller Weise, wie die PcA – und damit auch die FA – bei geographisch verteilten Daten zu erstaunlichen Ergebnissen führen kann, wenn die Ergebnisse sinnvoll interpretiert werden; dies gilt insbesondere dann, wenn sie mit externen Daten verglichen werden können. Aus diesem Grund bietet sich die Anwendung von PcA bzw. FA auf die vorliegenden lexikalisch-diatopischen Daten an. Die prinzipielle Anwendbarkeit von FA und PcA in der Geolinguistik wurde in jüngerer Zeit schon in einigen Publikationen gezeigt (vgl. 4.6.3). Erst in jüngster Zeit wurde in der Geolinguistik begonnen, das Interpretationspotential dieser Methode auszuschöpfen (s. z. B. grieve 2009 und Leinonen 2010). Der FA wird in dieser Arbeit der Vorzug gegeben, da sie weniger sensitiv gegenüber ‚Rauschen‘ in den Daten ist und ihre Ergebnisse leichter zu interpretieren sind (vgl. fieLd 2000, 433–434). 5.2.1 Beschaffenheit der Daten Da die FA mit einer Korrelationsmatrix der beobachteten Daten arbeitet (vgl. tabaChniCk /fideLL 2007, 634–635), sind Daten von mindestens intervallskaliertem Format erforderlich, d. h. sie müssen durch numerische Werte gegeben sein, die eine Aussage über Abstände zwischen diesen Werten erlauben. Daher bieten sich die Variantengewichte (vgl. 4.2.1) oder die geschätzten Variantenintensitäten (vgl. 4.2.2) der einzelnen Orte an, die jeweils zwischen 0 und 1 liegen können. Da die Intensitäten das Ergebnis einer Schätzung auf der Grundlage der Gewichte sind, die Repräsentativitätsprobleme bei der Betrachtung einzelner Variablen mindern soll (vgl. 4.1), ist bei der FA den Gewichten der Vorzug zu geben, da sie die Daten in ihrer unverarbeiteten Form darstellen; die Repräsentativitätsdefizite stellen bei der FA aufgrund der Menge der betrachteten Varianten kein Problem dar. Hier ist abermals die Wahl des Levels zu diskutieren, das den betrachteten Abstraktionsgrad der Daten darstellt (vgl. 3.2). Hier führt uns die Überlegung, dass das erste der drei linguistisch sinnvollen Levels den geringsten Abstraktionsgrad und somit den höchsten Informationsgehalt aufweist, zu Level 1. Überlegungen
160
Analyse
zu Diffusionsbewegungen und dergleichen, wie sie in Abschnitt 4.5.4 zu Level 3 geführt haben, sind für die FA wohl von untergeordneter Wichtigkeit. Es ergibt sich eine Matrix des Formats 12.341 Varianten × 272 orte, die insgesamt 12.341 · 272 = 3.356.752 Variantengewichte enthält.113 Dies entspricht je nach Sichtweise 12.341 statistischen Variablen mit je 272 Fällen (sogenannte R-TypFaktorenanalyse) oder – bei Transposition der Matrix – 272 Variablen mit je 12.341 Fällen (Q-Typ-Faktorenanalyse). Im vorliegenden Fall wurde die zweite Variante gewählt; diese Vorgehensweise und die entsprechende Formatierung der Daten ist für unseren Fall die empfohlene, da für die Korrelationsmatrix die Zahl der Fälle wesentlich höher sein soll als die Zahl der Variablen. Die Ergebnisse beider Herangehensweisen sind vom Informationsgehalt her durchaus vergleichbar.114 Um eine Datensammlung hinsichtlich seiner Eignung für die Durchführung einer FA zu beurteilen, verwendet man oft das sogenannte k aiSer-Meyer-oLkinKriterium (KMo-Wert; vgl. baCkhauS et al. 2006, 276–277). Der KMo-Wert nimmt Werte zwischen 0 und 1 an und beschreibt, wie gut die Variablen – hier: die Gewichte der sprachlichen Varianten – miteinander korrelieren. Die vorliegenden Daten erzielen einen Wert von 0,993 und eignen sich somit erst au n lich (marvelous) gut für die FA,115 d. h. es gibt viele stark ausgeprägte Korrelationen zwischen einzelnen Varianten. 5.2.2 Faktorenzahl Eine wichtige Entscheidung bei der FA ist die Wahl der Faktorenzahl, d. h. der Zahl an Dimensionen, auf die die hohe Ursprungsdimensionalität reduziert wird (vgl. tabaChniCk /fideLL 2007, 644–646). Die Zahl der Faktoren ist jedoch keine so kritische Größe wie etwa die Zahl der cluster bei der clusteranalyse (vgl. 1.2.2), da jeder hinzukommende Faktor einen kleineren Anteil an Variation enthält als die vorhergehenden. Je mehr Faktoren berechnet werden, umso besser lassen sich die Ursprungsdaten rekonstruieren. Ab einer bestimmten Faktorenzahl werden jedoch mit jedem hinzukommenden Faktor nicht mehr tatsächlich substantielle, sondern nur mehr zufällige Korrelationen reproduziert. Solches durch Messfehler oder statistische Fluktuationen entstehende ‚Rauschen‘ ist für die Interpretation uninteressant. Eine eindeutige Lösung für die Bestimmung der Faktorenzahl existiert nicht, doch es gibt einige Verfahren, die zu guten Lösungen führen. Eine oft gebrauchte Methode ist das sogenannte k aiSer-Kriterium. Sie verwendet die sogenannten Eigenwerte der Faktoren, die angeben, wie viel Varianz 113 Die insgesamt 12.341 Varianten ergeben sich als Summe aller Varianten der 735 Variablen des Korpus; d. h. eine Variable hat auf Level 1 im Schnitt 12.341 / 735 = 16,79 Varianten. 114 „The choice of R or its transpose […] is […] not a matter of end goal but of convenience and of the ease of meeting statistical requirements.“ (CatteLL 1978, 326) 115 nach der üblichen Einteilung nach k aiSer /r iCe (1974) sind Werte ≥ 0,9 „marvelous“, ≥ 0,8 „meritorious“, ≥ 0,7 „middling“, ≥ 0,6 „mediocre“, ≥ 0,5 „miserable“ und < 0,5 „unacceptable“ (die üblichen deutschen Entsprechungen sind „erstaunlich“, „verdienstvoll“, „ziemlich gut“, „mittelmäßig“, „kläglich“ und „untragbar“; vgl. baCkhauS et al. 2006, 276).
Explorativ (data-driven): Faktorenanalyse
161
von einem Faktor erklärt wird. Ist der Eigenwert eines Faktors 1, so erklärt er das Äquivalent der Varianz einer statistischen Variablen (= eines Ortes), d. h. in unserem Fall 1 / 272 = 0,368 % der Gesamtvarianz. Ein Faktor mit Eigenwert 40 würde demzufolge so viel Varianz erklären wie 40 einzelne orte, oder bei einer Gesamtzahl von 272 Orten 40 / 272 = 14,7 % der Gesamtvarianz. Das k aiSer-Kriterium sortiert nun alle Faktoren aus, die weniger als die Varianz einer statistischen Variablen (= eines Ortes) erklären. Das sind alle diejenigen Faktoren, die einen Eigenwert < 1 haben. Angewandt auf die vorliegenden lexikalischen Daten von Level 1 lässt das k aiSer-Kriterium 14 Faktoren zu; ab dem 15. Faktor wäre der Eigenwert kleiner als 1. Für den speziellen Fall, dass eine geographische Verteilung vorliegt, wie es bei unseren Daten der Fall ist, schlägt wartenberg (1985) ein besonderes Verfahren zur Bestimmung der Faktorenzahl vor. Weist ein Faktor eine geographisch kohärente Verteilung auf, so kann man davon ausgehen, dass er aussagekräftig ist; tut er das nicht, so enthält er wohl nur statistisches Rauschen. Um dies zu überprüfen, testet wartenberg die räumliche Autokorrelation (vgl. 2.2.1) der einzelnen Faktoren auf statistische Signifikanz,116 d. h. er testet, ob die räumliche Kohärenz der Faktoren durch Zufall zustande gekommen ist oder nicht. Liegt Signifikanz vor, so lässt er den Faktor zu; liegt sie nicht vor, wird der Faktor verworfen. Diese Methode ist einleuchtend, geht man doch davon aus, dass sich systematische Korrelationen in den beobachteten Daten (d. h. systematische Kookkurrenzen von Varianten) – und damit die aussagekräftigen Faktoren – durch geographische nähe bestimmt sind. In der Praxis mag sich der Signifikanztest oft erübrigen, da sich eine geographische Verteilung, die von ‚Rauschen‘ verschieden ist, meist schon beim bloßen Betrachten der kartierten Faktoren eindeutig erschließt (vgl. nächster Abschnitt). Ist bei diesem Vorgehen ein eindeutiges Ergebnis nicht zu erzielen, so lässt sich der Signifikanztest noch nachholen. Für die vorliegende Untersuchung hat es sich als praktikabel erwiesen, zunächst eine eher große Faktorenzahl zuzulassen, die Ergebnisse zu kartieren und auf geographische Kohärenz hin zu überprüfen, um erwünschte, d. h. sprachgeographisch bedingte Faktoren von solchen zu trennen, die durch statistische Fluktuationen oder andere Datendefizite zustande gekommen sind. Auf dieser Grundlage wurde eine Faktorenzahl von 20 als sinnvoll erachtet und die FA mit dieser Vorgabe neu durchgeführt. 5.2.3 Faktorladungen Aus der Anwendung der FA auf die in Abschnitt 5.2.1 beschriebenen Daten wurden 20 Faktoren errechnet, die im Sinne besserer Interpretierbarkeit mithilfe des sogenannten Varimax-Verfahrens ‚rotiert‘ wurden. „Rotation of factors is a process by which the solution is made more interpretable without changing its under116 wartenberg verwendet hierfür Moran’s I (vgl. Moran 1950), eine oft verwendete Kenngröße für räumliche Autokorrelation.
162
Analyse
lying mathematical properties“ (tabaChniCk /fideLL 2007, 609); sie dient dazu, die aussagekräftigste aus einer Reihe von mathematisch gleichwertigen Lösungen auszuwählen.117 Die Ergebnisse der FA bestehen u. a. aus einer Ladungsmatrix, die für jeden Faktor die Ladungen der einzelnen Orte enthält. Diese Faktorladungen beschreiben die Bedeutung der einzelnen Faktoren für die Beobachtungswerte an den jeweiligen Orten.118 In unserem Fall lassen sich die Ladungen (getrennt nach Faktoren) als Karten graphisch darstellen, um so die Relevanz eines Faktors für die orte geographisch zu visualisieren. Die in Abb. 40 (im Anhang, S. 257–261) abgebildeten Faktoren sind nach ihren Maxima sortiert, d. h. nach der maximal durch sie an einem einzelnen ort erklärten Varianz. Diese 20 Faktoren beschreiben einen Anteil von 59,32 % der Gesamtvarianz. Das bedeutet, dass ca. drei Fünftel der Variation durch die in Abb. 40 dargestellten Tendenzen erklärt werden können, die in unterschiedlichem Ausmaß zu den Verteilungen der einzelnen Varianten beitragen (das jeweilige Ausmaß wird durch die Faktorwerte quantifiziert, vgl. nächster Abschnitt), während ca. zwei Fünftel der Variation nicht durch solche Tendenzen erklärt werden können; diese bestehen wohl aus idiosynkratischer oder chaotischer Variation in den Verteilungen der Varianten. Die Vorzeichen der Faktorladungen sind arbiträr und dadurch austauschbar; die Ladungen eines Faktors könnten also genau umgekehrte Werte aufweisen, ohne dass sich die Information dadurch ändern würde (vgl. wartenberg 1985, 666). Wichtig ist nur, dass auf der Karte gleichfarbige orte (d. h. solche mit gleichem Vorzeichen) in Bezug auf den entsprechenden Faktor zueinander positiv korreliert sind, während unterschiedlich eingefärbte orte zueinander negativ korreliert sind. Dies bedeutet, dass eine Variante (je nach Faktorwert, vgl. nächster Abschnitt) mit hoher Wahrscheinlichkeit entweder an beiden oder an keinem von zwei gleichfarbigen orten auftritt, während sie an zwei unterschiedlich eingefärbten orten mit hoher Wahrscheinlichkeit nur an einem der beiden orte auftritt. Im vorliegenden Fall wurden die Vorzeichen so gewählt, dass die Summe der positiven Ladungen höher ist als die Summe der negativen Ladungen, so dass dominierende Kernbereiche stets positiv (blau) dargestellt sind. Mit den möglichen Ausnahmen 9 und 13 weisen alle Faktoren auf den ersten Blick eine geographisch kohärente Verteilung auf; das bedeutet, ihre Faktorladungen neigen dazu, geographisch gehäuft aufzutreten. Dadurch wäre das wartenberg-Kriterium der räumlichen Kohärenz von 18 der Faktoren augenscheinlich erfüllt, jedoch ohne dass dieser Eindruck statistisch überprüft worden wäre. Über die speziellen Rollen der Faktoren 9 und 13 wird im Interpretationsteil (5.2.5) zu reden sein. Die Tatsache, dass bei so gut wie allen Faktoren die geographische Verteilung der Ladungen eine deutlich wahrnehmbare räumliche Kohärenz aufweist, zeigt, dass die durch die Faktoren wiedergegebenen Gemeinsamkeiten der Variantenverteilungen tatsächlich durch ähnliche Diffusionsvorgänge im Raum entstanden sein müssen; das Fundamental Dialectological Postulate (2.2.1) scheint bestätigt. 117 Zur Prozedur der Rotation vgl. vogeLbaCher (2011, 35–36). 118 Zusätzlich erhält man eine Matrix mit den sogenannten Faktorwerten, die den Zusammenhang zwischen den Faktoren und den sprachlichen Varianten beschreiben (vgl. 5.2.4).
Explorativ (data-driven): Faktorenanalyse
163
Dabei drängt sich die Vermutung auf, dass sich die jeweils zu einem Faktor beitragenden Variantendistributionen durch eine gemeinsame inner- oder außersprachliche Konditionen erklären lassen. 5.2.4 Faktorwerte Die Faktorwerte quantifizieren den Zusammenhang zwischen einer sprachlichen Variante und einem Faktor. Ein positiver Faktorwert besagt, dass die Werte (hier: die Gewichte) einer Variante positiv mit den Faktorladungen korrelieren, während bei einem negativen Faktorwert das Gegenteil der Fall ist. Bei einem Faktorwert von 0 besteht kein Zusammenhang zwischen dem Faktor und der jeweiligen Variante. Um Faktorwerte zu schätzen, gibt es verschiedene Methoden (vgl. braChinger /oSt 1996, 690–693; tabaChniCk /fideLL 2007, 650–651); hier wurde die sogenannte bartLett-Methode verwendet (s. braChinger /oSt 1996, 690–691). Betrachtet man etwa die Variante däuen der Variable ‘wiederkäuen’ (K. 11.49), so ergibt sich ein sehr hoher Faktorwert (9,13) für Faktor 4 (im nachfolgenden F4, F5 usw.), was sich in einer starken Ähnlichkeit der entsprechenden Intensitätskarte (Abb. 42a, nächste Seite) mit der Ladungskarte des Faktors (Abb. 40d, S. 257) niederschlägt. Diese Ähnlichkeit ist insbesondere deshalb bemerkenswert, weil die Karte von F4, die nur auf den Gewichten, nicht auf den Intensitäten beruht, augenscheinlich mit der Intensitätskarte in Abb. 42a in vielerlei Hinsicht fast identisch ist, während die Ähnlichkeit mit der Gewichtskarte (Abb. 41a) weitaus geringer ausfällt. Die Faktorkarte weist eine geographisch konditionierte Glättung auf, ähnlich wie bei der Intensitätsschätzung, und das, obwohl keinerlei geographische Information in die Faktorenanalyse eingeflossen ist; die Glättung ergibt sich aus den Daten selbst. Dies kann auch als eine Bestätigung der Ergebnisse der Intensitätsschätzung angesehen werden. Die Variante (-)säubern der Variable ‘die länger andauernde Reinigung nach dem Kalben’ (K. 11.31) hat dagegen einen Faktorwert für F4 nahe 0, d. h. ihre Verteilung hat wenig mit ihm zu tun; entsprechend ist die Ähnlichkeit zwischen ihrer Gewichts- (Abb. 41b) bzw. Intensitätskarte (Abb. 42b) zur Karte von F4 sehr gering. Die in Abb. 41c und Abb. 42c kartierte Variante Erbes der Variable ‘Erbse’ hat einen stark negativen Faktorwert für F4 (‒3,72). Dies äußert sich in einer Verbreitung, die zu der von F4 praktisch invers ist. Die Frage, welche Varianten in besonderer Weise von einem bestimmten Faktor geprägt sind, lässt sich in der Praxis nur umständlich beantworten. Zwar liegen mit den Faktorwerten quantifizierte und einfach zu interpretierende Werte für die Bedeutung der Faktoren für die Verbreitungen der Varianten vor, was im Einzelfall auch keine Probleme bereitet; die Schwierigkeit liegt jedoch in der großen Menge an Varianten. 12.341 Varianten sind es im verwendeten Kartenkorpus insgesamt; F4 hat auf 2.209 davon einen positiven Einfluss, der in den allermeisten Fällen allerdings nahe 0 liegt (Abb. 43, S. 165). Es liegt nahe, nur die extremen Werte zu betrachten. nimmt man etwa an, dass F4 nur für die 5 % der Varianten mit den höchsten Faktorwerten eine signifikante Bedeutung hat, so muss man immer noch 617 einzelne Varianten betrachten.
164
Analyse 5
3
10 18
16
36
35
26
57
44
59
58
95 94
92 91 93 109 110
96 97
72
86
88
57
78 79
107
106
108
20
246 260
247 248
210
223
198
226
251
250
259 258
246
272
270
268
267
245
257
256
253
252
265 266
231 232
243 244
260
271
269
80
72
64
63 73
84
82
54
53
65
67
66 76
86
88
57
78
116
79
107
106
192 193
194
108
Abb. 41a: ‘wiederkäuen’/däuen (K. 11.49)
247 248
210
223
198
226
251
250
259
257
256
258
61
60
70
72
67
66 76
86
68
77
88
87 85 103 105 101 102 104
78 90
89
83
100
98 99
55
75
74
42
54
53 65
64
63 73
84
82
81
80
62
71
52 51
50
41
40
39
49 48
34
33
116
107
106
108
117
115
192 193
247 248
260
271
269
111
246
272
270
268
267
245
243 244
253
252
265 266
231 232
255
254
59
113 114
207 206 205 219 221 222 220 218 234 235 233
217
230
96 97
112
191 190
202
215 216
38
37
32 31
120 123 124 126 118 119 121 122 125 137 141 143 134 127 131 135 138 139 129 142 144 136 140 132 128 133 130 158 154 156 151 148 157 159 150 160 146 147 152 153 155 145 149 171 174 164 168 169 162 166 167 172 173 165 170 161 163 175 184 186 179 180 181 176 177 189 187 188 178 183 182 185
203
201
214
227 228 229
240 242 239 241
237 238 249
262 263
199 200
212 213
211
225 224
236
264
261
196 197
209
95 94
92 91 93 109 110
117
195
208
44 58
29
24
23
30
28
15
22
21
20
27
46
45
69
90
89
87 85 103 105 101 102 104
43 56
68
77
26
47
55
75
74
83
100
98 99
113 114
207 206 205 219 221 222 220 218 234 235 233
217
230
112
191 190
202
215 216
255
254
203
201
214
227 228 229
240 242 239 241
237 238 249
262 263
199 200
212 213
211
225 224
236
264
261
196 197
209
96 97
62
71
52 51
36
35
42
120 123 124 126 118 119 121 122 125 111 137 115 141 143 134 127 131 135 138 139 129 142 144 136 140 132 128 133 130 158 154 156 151 148 157 159 150 160 146 147 152 153 155 145 149 171 174 164 168 169 162 166 167 172 173 165 170 161 163 175 184 186 179 180 181 176 177 189 187 188 178 183 182 185
117
195
208
95 94
61
60
81
4
194
4
207 206 205 219 221 222 220 218 234 235 233
59
25
14
13
12
7
6
4
11 19
17
41
5
3
10 18
16
34
33
40
39
49 50
24
32 31
38
37
48
70
20
192 193
191 190
116
113 114
92 91 93 109 110
120 123 124 126 118 119 121 122 125 111 137 115 141 143 134 127 131 135 138 139 129 142 144 136 140 132 128 133 130 158 154 156 151 148 157 159 150 160 146 147 152 153 155 145 149 171 174 164 168 169 162 166 167 172 173 165 170 161 163 175 184 186 179 180 181 176 177 189 187 188 178 183 182 185 112
44 58
29
2 9
8
23
30
28
15
22
21
20
27
46
45
69
90
89
87 85 103 105 101 102 104
43 56
68
77
83
100
98 99
67
66 76
26
47
55
75
74
36
35
42
54
53 65
64
63 73
84
82
81
80
62
71
52 51
50
61
60
70
69 79
48
25
1
14
13
12
7
6
4
11 19
17
41
5
3
10 18
16
34
33
40
39
49
46
45
24
32 31
38
37 47
43 56
29
2 9
8
23
30
28
27
15
22
21
20
19
17 25
1
14
13
12
7
6
4
11
194
4
2 9
210
209
223
198
226
251
250
232 245
243 244
259
257
256
258 272
270
268
267
217 231
230
253
252
265 266
202
215 216
255
254
203
201
214
227 228 229
240 242 239 241
237 238 249
262 263
199 200
212 213
211
225 224
236
264
261
196 197
195
208
20
1 8
271
269
Abb. 41c: ‘Erbse’/Erbes (K. 8.89)
Abb. 41b: ‘die länger andauernde Reinigung nach dem Kalben’/(-)säubern (K. 11.31)
Abb. 41: Belegkarten zu verschiedenen Varianten (Level 1).
36
35
26
49
57
44 58
59
95 94
92 91 93 109 110
96 97
81
80
48 61
60
70
69 79
46
45
62
71 82
72
63 73
84
25
52 51 64 74
86
54
53 65
67 77
88
57
68 78
106
79
107
108
120 123 124 126 118 119 121 122 125 111 137 115 141 143 134 127 131 135 138 139 129 142 144 136 140 132 128 133 130 158 154 156 151 148 157 159 150 160 146 147 152 153 155 145 149 171 174 164 168 169 162 166 167 172 173 165 170 161 163 175 184 186 179 180 181 176 177 189 187 188 178 183 182 185 112
192 193
191 190
116
113 114
194
4
207 206 205 219 221 222 220 218 234 235 233
20
246 260
247 248 261
195
208
209
223 236
264
210 225
224
237 238 249
262 263
117
196 197
250
198
211 226
252
265 266
254
203
202
215 216
230
217 231 232
243 244 255 256
253 267
201
214
227 228 229
240 242 239 241 251
199 200
212 213
245
257
259 258 272
270
268 269
49
44 58
59
271
Abb. 42a: ‘wiederkäuen’/däuen (K. 11.49), h = 61,0
95 94
92 91 93 109 110
96 97
61
60
70 81
80
48 62
71 82
72
63 73
84
25
52 51 64 74
86
54
53
65
67 77
88
57
68 78
106
79
107
108
120 123 124 126 118 119 121 122 125 111 137 115 141 143 134 127 131 135 138 139 129 142 144 136 140 132 128 133 130 158 154 156 151 148 157 159 150 160 146 147 152 153 155 145 149 171 174 164 168 169 162 166 167 172 173 165 170 161 163 175 184 186 179 180 181 176 177 189 187 188 178 183 182 185 112
191 190
116
113 114
192 193
207 206 205 219 221 222 220 218 234 235 233
194
246 260
247 248 261
195
208
209
223 236
264
210 225
224
237 238 249
262 263
117
196 197
250
198
211 226
252
265 266
254
203
202
215 216
230
217 231 232
243 244 255 256
253 267
201
214
227 228 229
240 242 239 241 251
199 200
212 213
245
257
259 258 272
270
268 269
49
44
59
58
271
Abb. 42b: ‘die länger andauernde Reinigung nach dem Kalben’/(-)säubern (K. 11.31), h = 57,8
95 94
92 91 93 109 110
96 97
61
60
70 81
80
48 62
71 82
72
63 73
84
34
33
52 51 64 74
86
41
40
39
42
54
53 65
55 67
66 76
77
75 88
87 85 103 105 101 102 104
68 78
90
89
83
100
98 99
50
32 31
38
37
46
45
69
90
89
87 85 103 105 101 102 104
43 56
29
24
23
30
28
15
22
21
20
27
47
55
66 76
75
36
35
42
26
14
13
12
7
6
4
11 19
17
41
40
39
5
3
10 18
16
34
33
83
100
98 99
50
24
32 31
38
37
46
45
69
90
89
87 85 103 105 101 102 104
43 56
29
2 9
8
23
30
28
15
22
21
20
27
47
55
66 76
75
36
35
42
26
1
14
13
12
7
6
4
11 19
17
41
40
39
5
3
10 18
16
34
33
83
100
98 99
50
24
32 31
38
37 47
43 56
29
2 9
8
23
30
28
27
22
21
20
19
17 25
15
106
107
108
120 123 124 126 118 119 121 122 125 137 141 143 134 127 131 135 138 139 129 142 144 136 140 132 128 133 130 158 154 156 151 148 157 159 150 160 146 147 152 153 155 145 149 171 174 164 168 169 162 166 167 172 173 165 170 161 163 175 184 186 179 180 181 176 177 189 187 188 178 183 182 185 112
111
191 190
116
113 114
192 193
207 206 205 219 221 222 220 218 234 235 233 247 248
246 260
261
117
115
194
4
18
16
1
14
13
12
7
6
4
11
195
208
20
5
3
10
4
2 9
20
1 8
209
223 236
264
210 225
224
237 238 249
262 263
196 197
250
198
211 226
252
265 266
254
203
202
215 216
230
217 231 232
243 244 255 256
253 267
201
214
227 228 229
240 242 239 241 251
199 200
212 213
245
257
259 258 272
270
268 269
271
Abb. 42c: ‘Erbse’/Erbes (K. 8.89), h = 61,8
Abb. 42: Intensitätskarten zu den Varianten aus Abb. 41. Parameter: dlex, K3-Kern, CL.
Bei einem Niveau von 1 % sind es 123. Bei der Vorstellung der einzelnen Faktoren (vgl. 5.2.6) werden aus Platzgründen jeweils nur die ersten 20 Varianten mit den höchsten Faktorwerten aufgeführt, was bei F4 etwa 0,9 % aller Varianten mit positivem F4-Faktorwert darstellt. Für die Auswertung der gesamten 20 · 12.341
165
Explorativ (data-driven): Faktorenanalyse
(9.632)
Varianten
10.000 8.000 6.000 4.000 2.000
0
(1.329) (24)
(100)
(320)
< -3
< -2
< -1
(312)