130 59 13MB
German Pages 215 [218] Year 2015
BEIHEFTE
Simon Pröll
Raumvariation zwischen Muster und Zufall Geostatistische Analysen am Beispiel des Sprachatlas von Bayerisch-Schwaben
Germanistik
ZDL
Franz Steiner Verlag
zeitschrift für dialektologie und linguistik
beihefte
160
Simon Pröll Raumvariation zwischen Muster und Zufall
zeitschrift für dialektologie und linguistik beihefte In Verbindung mit Michael Elmentaler und Jürg Fleischer herausgegeben von Jürgen Erich Schmidt
band 160
Simon Pröll
Raumvariation zwischen Muster und Zufall Geostatistische Analysen am Beispiel des Sprachatlas von Bayerisch-Schwaben
Franz Steiner Verlag
Bibliografische Information der Deutschen Nationalbibliothek: Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über abrufbar. Dieses Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist unzulässig und strafbar. © Franz Steiner Verlag, Stuttgart 2015 Druck: Hubert & Co., Göttingen Gedruckt auf säurefreiem, alterungsbeständigem Papier. Printed in Germany. ISBN 978-3-515-11055-6 (Print) ISBN 978-3-515-11056-3 (E-Book)
INHALTSVERZEICHNIS
VORWORT ...................................................................................................
9
1 EINLEITUNG UND ÜBERSICHT ............................................................ 11 2 HERANFÜHRUNG: VOM EINZELBELEG ZUR VARIETÄT .............. 13 2.1 Grundlagen ....................................................................................... 2.1.1 Empirische und historische Ausgangspunkte..................... 2.1.2 Prinzipien der Dialektometrie ............................................ 2.1.3 Grenzen des dialektometrischen Variationsbegriffs .......... 2.2 Multivariate Sichtweisen.................................................................. 2.2.1 Erweiterung des Modells.................................................... 2.2.2 Dynamische Theorien ........................................................ 2.2.3 Komplexität, Emergenz und Zufall .................................... 2.2.4 Genese und Wandel des Systems ....................................... 2.2.5 Illusionen der Trennschärfe und der Reinheit .................... 2.2.6 Rekurs: Die Bedeutung der Einzelvariablen ...................... 2.3 Chancen einer stochastischen Perspektive ....................................... 2.3.1 Desiderat ............................................................................ 2.3.2 Probabilisierung der Variationsdimensionen ..................... 2.3.3 Varietätenkonstruktion .......................................................
13 13 16 17 19 19 20 22 25 28 29 31 31 32 36
3 TECHNIK: STOCHASTISCHE BILDANALYSE .................................... 39 3.1 Datengrundlage und vorbereitende Schritte der Datenverarbeitung 39 3.1.1 Quellen und Inhalte der Beispieldaten ............................... 41 3.1.2 Datenbankdesign ................................................................ 43 3.1.3 Gewichtung ........................................................................ 44 3.1.4 Skalenniveau und Kategorisierung der Varianten.............. 44 3.1.5 Distanzmaße ....................................................................... 48 3.1.6 Dichteschätzung ................................................................. 51
3.1.7 Generierung und Visualisierung verschiedener Kartentypen........................................................................ 3.1.8 Zusammenfassung: Gesamtprozess und Nutzen ................ 3.2 Statistische Werte der Karten ........................................................... 3.2.1 Komplexität, Kompaktheit und Homogenität .................... 3.2.2 Kovarianz ...........................................................................
53 58 59 60 63
6
Inhaltsverzeichnis
3.3 Clustern von Sprachkarten basierend auf räumlicher Ähnlichkeit .. 3.3.1 Was ist Clustern (und welchem Zweck dient es)? ............. 3.3.2 Typen von Clusteralgorithmen ........................................... 3.3.3 Technisches Vorgehen beim unscharfen Clustern von Sprachkarten ...................................................................... 3.3.4 Interpretationsmöglichkeiten der Ergebnisse ..................... 3.4 Faktorenanalyse ............................................................................... 3.4.1 Grundlagen ......................................................................... 3.4.2 Faktorenzahl und Projektimplementierung ........................ 3.4.3 Resynthese aus Faktoren ....................................................
65 65 66 71 74 79 80 81 83
4 SUBKORPORA .......................................................................................... 84 4.1 Wortschatz ....................................................................................... 4.1.1 Kennwertanalysen .............................................................. 4.1.2 Raumstrukturelle Ähnlichkeit der Kategorien (Cluster) .... 4.1.3 Geografische Grundstrukturen (Faktoren) ......................... 4.1.4 Fazit .................................................................................... 4.2 Lautung ............................................................................................ 4.2.1 Kennwertanalysen .............................................................. 4.2.2 Raumstrukturelle Ähnlichkeit der Kategorien (Cluster) .... 4.2.3 Geografische Grundstrukturen (Faktoren) ......................... 4.2.4 Fazit .................................................................................... 4.3 Formen ............................................................................................. 4.3.1 Kennwertanalysen .............................................................. 4.3.2 Raumstrukturelle Ähnlichkeit der Kategorien (Cluster) .... 4.3.3 Geografische Grundstrukturen (Faktoren) ......................... 4.3.4 Fazit ....................................................................................
84 84 85 91 98 99 99 103 106 116 116 118 121 124 132
5 GESAMTSYSTEM UND VARIETÄTENKONSTRUKTION ................. 133 5.1 Vergleich der Subkorpora ................................................................ 5.1.1 Kennwerte .......................................................................... 5.1.2 Systematische Verzerrungen .............................................. 5.1.3 Relationen zwischen den Subkorpora ................................ 5.2 Konstruktion und Gestalt eines Gesamtsystems .............................. 5.2.1 Perspektivenabhängigkeit der Dialektkonstruktion ........... 5.2.2 Globale Faktorenanalyse .................................................... 5.2.3 Frequenzkorrigierte Faktorenanalyse ................................. 5.3 Tiefenvielfalt .................................................................................... 5.3.1 Latente Variation ................................................................ 5.3.2 Mischverhältnisse der Orte ................................................ 5.3.3 Typischste Variablen ..........................................................
133 133 137 138 141 141 144 147 149 149 150 152
Inhaltsverzeichnis
7
6 ERGEBNISSE, KONSEQUENZEN UND PERSPEKTIVEN .................. 156 6.1 Zum Sprachraum Bayerisch-Schwaben ........................................... 6.1.1 Norden ................................................................................ 6.1.2 Flüsse: Donau und Lech ..................................................... 6.1.3 Westen ................................................................................ 6.1.4 Zentrum .............................................................................. 6.1.5 Städte .................................................................................. 6.1.6 Osten .................................................................................. 6.1.7 Süden .................................................................................. 6.2 Rückwirkungen auf Theorie und Methode ...................................... 6.2.1 Der Abschied von der Isoglosse ......................................... 6.2.2 Prototypen .......................................................................... 6.2.3 Reihenschritte ..................................................................... 6.2.4 Perspektiven für Simulationsstudien .................................. 6.2.5 Die kritische Masse ............................................................ 6.2.6 Selbstkritik: Der Nimbus der Zahl ..................................... 6.3 Beiträge zur Qualitätssicherung in der Variationslinguistik ............ 6.3.1 Skizzierung des Desiderats ................................................ 6.3.2 Defektive Datenlage ........................................................... 6.3.3 Bestimmung der Güte der Verfahren ................................. 6.3.4 Probabilisierung von Störgrößen........................................ 6.3.5 Ermittlung und Subtraktion von Störfaktoren .................... 6.3.6 Rauschgeminderte (Re-)Konstruktion der Gesamtvariation .................................................................
157 157 158 159 160 160 161 162 162 162 163 164 164 165 166 167 167 168 168 170 172 176
7 FAZIT ......................................................................................................... 178 LITERATURVERZEICHNIS ....................................................................... 179 ANHANG 1: GRUNDKARTE UND ORTSLISTE DES SBS ..................... 189 ANHANG 2: FARBABBILDUNGEN .......................................................... 193 REGISTER..................................................................................................... 213
VORWORT
Von der Mühsal meiner Arbeit will ich nicht sprechen. (Jorge Luis Borges, Die Inschrift des Gottes)
1
0
Frequenz (Hertz)
-1 104
0
0
Sekunden Time (s)
3
Augsburg, Sommer 2014
1
EINLEITUNG UND ÜBERSICHT
Praktisch alle modernen Wissenschaften suchen nach Mustern im Chaos, nach Regelmäßigkeiten in den Daten, die sie erheben oder erzeugen – das gilt im selben Maße für die Astrophysik, wie es für die Variationslinguistik gilt. Diese Arbeit, ein Resultat des DFG-geförderten Projekts Neue Dialektometrie mit Methoden der stochastischen Bildanalyse (in Zusammenarbeit des Lehrstuhls für Deutsche Sprachwissenschaft der Universität Augsburg und des Instituts für Stochastik der Universität Ulm),1 bildet keine Ausnahme. Sie thematisiert dies im Rahmen eines variationslinguistischen Grundproblems, der Konstruktion von ganzen Varietäten bzw. Dialekten, im Spannungsfeld zweier scheinbar unvereinbarer Blickwinkel: Wer sich mit Variation beschäftigt, beschäftigt sich – solange er auf empirisch abgesichertem Terrain bleiben will – mit einer Vielzahl an Einzelphänomenen, die sich idiosynkratisch, bisweilen chaotisch und damit in größerer Anzahl unüberschaubar zeigen. Demgegenüber ist der Blick auf Variation per se im Regelfall globaler Natur und will bzw. darf sich nicht auf Einzelphänomene einschränken; das Interesse gilt hoch- und höchstrangigen Ordnungen, wobei notwendigerweise hohe Grade an Abstraktion über die eigentlichen Daten gebildet werden müssen. Für sich genommen kann keiner dieser beiden Blickwinkel ein befriedigendes Gesamtbild von sprachlicher Variation zeichnen. Der Kompromiss beider Herangehensweisen, der in dieser Arbeit angestrebt wird, ist durch einen wahrscheinlichkeitsbasierten Zugang möglich, der weiterhin das Gesamtbild der Varietät(en) im Blick hat, dabei aber ihre jeweilige interne Variabilität transparent hält, indem er in jedem Analyseschritt die Ausprägungen der einzelnen Sprachphänomene klar registrieren und benennen kann. Der Text gliedert sich grob in einen theoriegeleiteten Teil (Kapitel 2), einen technik- und methodenorientierten Teil (Kapitel 3) sowie einen anwendungsbezogenen Teil (Kapitel 4 und 5), gerahmt von diesem Einleitungskapitel sowie einem konzentrierten Ergebnis- und Konsequenzenkapitel (Kapitel 6) und einem knappen abschließenden Fazit (Kapitel 7). Der Theorieteil bietet einen Forschungsüberblick über relevante Sprachvariations- und Sprachwandelmodelle nebst den jeweils damit verbundenen technischen Aspekten. Der Schwerpunkt liegt darauf, die Komplexität und innere Variabilität des Gegenstandes zu verdeutlichen sowie bestehende Ansätze zur Beschreibung und Erklärung seiner vielfältigen Gestalt zu präsentieren. Dabei ist es das Ziel, darzulegen, was eine geostatistische Herangehensweise dazu beitragen kann, bestehende Lücken in Theorie und Praxis zu schließen.
1
Mein herzlicher Dank gilt neben allen engagierten Beteiligten dieses Projekts und den Korrekturlesern älterer Fassungen dieses Texts den Herausgebern der Reihe sowie dem Bezirk Schwaben, der die Arbeit mit dem Förderpreis des Bezirks Schwaben 2014 bedacht hat.
12
Einleitung und Übersicht
Im methodenorientierten Teil werden Prinzipien und Verfahren der stochastischen Bildanalyse vorgestellt, die als Grundlage für die später angewandten Techniken dienen und es erlauben sollen, Variationsmuster zu quantifizieren und miteinander zu vergleichen. Zunächst beinhaltet dies die Umlegung der für variationslinguistische Unternehmungen wie etwa Sprachatlanten punktuell erhobenen Informationen in eine wahrscheinlichkeitsbasierte, flächige Interpretation. Das wird durch Schätzung der Auftretenswahrscheinlichkeit jeder Variante an jedem Ort erzielt. Mittels exemplarischer Anwendung auf das Material des SBS („Sprachatlas von Bayerisch-Schwaben“) zeigt das Kapitel weiterhin, wie aus diesen Flächenkarten individuelle Werte ausgelesen werden können, die es ermöglichen, Karten in objektiverer Art und Weise miteinander zu vergleichen, als es der rein optische Eindruck leisten kann. Diese Werte bilden dann die Basis für weiterführende Analysen: So wird anschließend gezeigt, wie mit automatisierten Verfahren Gruppen von Sprachkarten gebildet werden, die eine ähnliche Raumstruktur aufweisen, und latente gemeinsame Strukturen, sogenannte Faktoren, aus großen Mengen an Karten ermittelt werden können. Der anwendungsorientierte Teil der Arbeit ist in zwei Teilbereiche untergliedert: In Kapitel 4 werden jeweils einzeln Wortschatz, Lautung und Formen des Bayerisch-Schwäbischen Raums mittels der im Vorfeld erarbeiteten Techniken analysiert. Kapitel 5 zeigt das Gesamtvarietätengefüge, also Zusammenhänge und Unterschiede zwischen den einzelnen sprachlichen Systemteilen (Wortschatz, Lautung, Formen). Somit können Aussagen über die Gesamtgestalt einer Varietät getroffen bzw. die Einflüsse einzelner Teilmengen auf die Gesamtvariation ermittelt werden. Form, Kontur und Inhalt einer Varietät werden gleichzeitig als transparente, graduelle Struktur darstellbar und nicht als dichotomisches Konstrukt. Die Ergebnisse bestätigen die Vermutung, dass das klassische Konzept der „Dialekteinteilung“ selbst problematisch ist: Gestalt und Ertrag einer Einteilung unterscheiden sich zwischen den sprachlichen Teilsystemen (Wortschatz, Lautung, Wortbildung, Syntax) teils deutlich. Vom Deskriptiven über das Inferierende hin zur Qualitätssicherung und Kritik fortschreitend werden zu guter Letzt in Kapitel 6 die Ergebnisse des Anwendungsteils für den Bayerisch-Schwäbischen Raum gebündelt dargestellt sowie Konsequenzen für die Theoriebildung im Bereich Variation und Wandel gezogen. Zum Abschluss bietet das Kapitel Ansätze zu einer variationslinguistischen Fehlertheorie: Einerseits kann die Intensitätsschätzung als ein Mittel zur Qualitätssicherung des Datensatzes interpretiert werden. Zusätzlich können einzelne Faktoren auch aus der Gesamtvariation entfernt werden – dies gilt sowohl für „echte“ Faktoren als auch für Störfaktoren, die während der Erhebung oder Bearbeitung der Daten entstehen.
2
HERANFÜHRUNG: VOM EINZELBELEG ZUR VARIETÄT
Dieses einführende Kapitel dient zweierlei Zwecken: Zum einen stellt es variationslinguistische Theorien, Modelle und Methoden dar, die genutzt wurden und werden, um den sowohl theoretischen als auch methodischen Spagat zwischen der empirischen Erhebung einzelner Sprachproben und der abstrahierenden Konstruktion kompletter Varietäten zu meistern. Der Schwerpunkt liegt auf dem Zusammenspiel zwischen einer eher qualitativen und einer eher quantitativen Forschungsperspektive, das nötig ist, um einen Gegenstand zu fassen, der im Laufe der Abstraktion vom Einzeldatum zum Gesamtsystem zunehmend komplexere Strukturen zeigt. Zum anderen wird mittels einer kritischen Beleuchtung dieser bestehenden Ansätze hergeleitet, was durch einen wahrscheinlichkeitsbasierten Blickwinkel auf Variation und Wandel für Theorie und Methode gewonnen werden kann. 2.1 2.1.1
GRUNDLAGEN
Empirische und historische Ausgangspunkte
Die grundlegende empirische Arbeit von Variationslinguisten bzw. Dialektologen ist die (direkte oder indirekte) Erhebung einzelner Variablen. Doch die Beschäftigung mit Einzelvariablen ist mühsam und im Regelfall lediglich ein Mittel zum Zweck: Man will klar voneinander unterscheidbare Gegenstände oder Klassen, hochrangige Strukturen, sich wiederholende Muster in seiner Umwelt erkennen. Die zentrale, hochrangigste Struktur der regionalen Sprachvariation, der Regiolekt oder Dialekt, existiert jedoch nicht als direkt messbare Entität – er muss aus empirischen Messungen vieler Einzelvariablen konstruiert werden.2 Schon die Ortsgrammatiken in der Nachfolge der junggrammatischen Schule, mit denen das Studium der geografischen Sprachvariation in den deutschsprachigen Ländern im modernen Sinn beginnt, zeigen zwangsläufig diese Dualität: Die Forscher erheben einzelne Variablen, letztlich aber zu dem Zweck, ein Gesamtbild der Mundart eines ausgewählten Orts zu zeichnen (vgl. Abbildung 1).
2
Das rezente (Wieder-)Aufleben des wissenschaftlichen Interesses an Laienmeinungen zu Dialekten und Dialektgrenzen im Rahmen der perzeptiven Dialektologie oder Wahrnehmungsdialektologie (vgl. z. B. – mit jeweils unterschiedlichen Ausrichtungen – ANDERS 2010, KÖNIG 2010a und PURSCHKE 2011) kann ebenfalls als Lösungsvorschlag zu diesem Dilemma interpretiert werden: Statt Einzelvariablen werden von vornherein (mentale) Gesamtkonzepte ermittelt.
14
Heranführung: Vom Einzelbeleg zur Varietät
Abb. 1: Grundlegendes Variationsmodell (eine Dimension).
Die über den einzelnen Ortsdialekt hinausgreifende, traditionelle Dialektgeografie stellte – in Analogie zu anderen Disziplinen, die als Untersuchungsvariable (oder Projektionsfläche) den Raum nutzen – die Ergebnisse ihrer Erhebungen in der Form von Karten dar, die zunächst jeweils ein Einzelphänomen zeigten. Präferierte Methoden waren (und sind) dabei die Darstellung als a) Punktsymbolkarte und / oder b) Isoglossenkarte. Für jeden Ort ermittelt man also für jede Variable von Interesse die lokale(n) Variante(n) und stellt diese mittels eines jeweiligen Symbols direkt am Erhebungsort dar (siehe Abbildung 2a). Darstellung ist immer auch eine Form von Interpretation; diese Form der Darstellung ist dabei relativ treu zu den tatsächlich erhobenen Daten, sie visualisiert Belege direkt an den entsprechenden Erhebungsorten. Dennoch suggeriert sie bereits einiges – ähnliche Symbole legen Ähnlichkeit der Varianten nahe, das Gehirn konstruiert aus gleichen, eigentlich punktuellen Symbolen Flächen etc. (vgl. ausführlicher PRÖLL 2011). Die Isoglossenkarte (siehe Abbildung 2b) interpretiert stärker: Sie konstituiert eine Grenze zwischen einzelnen Varianten, hier steht also nicht mehr der empirisch ermittelte Einzelbeleg im Vordergrund, sondern die Flächenbildung und die angenommenen Grenzen der Verteilung der Varianten – angenommen daher, weil die jeweilige Grenze nicht gemessen wurde bzw. als Entität überhaupt nicht messbar ist. Die Isoglosse3 ist ein rein virtueller, dichotomischer Schnitt durch den Raum mit einer klaren Trennung beider Seiten voneinander.
3
RUOFF (1980, 94–95) legt stichhaltig dar, dass der Terminus selbst „erstens unpraktisch […] und zweitens im Grunde falsch“ ist. Ich teile diese Ansicht, verwende ihn aber hier dennoch: a) aus Konsistenzgründen, weil sich seine Alternativen in der Literatur bislang nicht durchgesetzt haben und b) weil ich im Folgenden insgesamt gegen das dahinterstehende Konzept argumentiere.
15
Grundlagen
Abb. 2a: Idealisierte Punktsymbolkarte.
Abb. 2b: Idealisierte Isoglossenkarte.
Schon früh ist Mundartforschern/Dialektologen zweierlei aufgefallen: Zum einen, dass Grenzen zwischen Phänomenen nicht immer absolut sind, sondern dass es Übergangsgebiete (welcher Natur auch immer; darauf wird später zurückzukommen sein) gibt, vgl. etwa die folgende, typische Aussage aus GLUTH / LOMPA / SMOLKA (1982, 487–488), dass „die Vorstellung einer Grenzlinie überhaupt unangemessen sein kann, nämlich dann, wenn der Gebietsrand eigentlich als Übergangszone angesehen werden müßte“. Zum anderen, dass die Darstellung von idiosynkratischen Grenzen einer einzelnen Variable keine relevante globale Aussage über den anvisierten Untersuchungsgegenstand bieten kann, oder anders gesagt, dass es ein massives Repräsentativitätsproblem dabei gibt, eine Variable als aussagekräftig für eine gesamte Varietät anzusehen. Das führt zu dem Zwang, eine oder mehrere Variablen auswählen zu müssen, die geeignet erscheinen, die Varietät als Ganzes zu repräsentieren (vgl. RUOFF 1980, 98–99). Ohne robuste Kriterien wäre diese Auswahl eine reine ad-hoc-Entscheidung – aber auch diese Kriterien selbst bleiben wohl grundsätzlich tautologischer Natur. In jedem Fall fällt der Großteil der Gesamtvariation unter den Tisch. Zunächst wurde versucht, diesem Repräsentativitäts- / Selektionsproblem durch Kombinationskarten beizukommen, wobei die Isoglossen mehrerer Variablen in eine einzige Karte gezeichnet werden. Dadurch zeigen sich Isoglossenbündel (vgl. GIRNTH 2010, 112–116), was in der Gesamtvariation der kombinierten Phänomene Übergangsbereiche sichtbar macht.4 Diese Übergangsgebiete zeigen aber lediglich Überschneidungen zwischen Ausprägungen verschiedener Variablen, keine Übergangsgebiete von Varianten innerhalb einer Variablen: Die jeweiligen einzelnen Gebiete der kombinierten Varianten bleiben dichotomisch, 4
Das bekannteste Beispiel für eine derartige Karte stellt wohl die viel zitierte (bzw. abgebildete) Karte zur Einteilung der deutschen Dialekte in WIESINGER (1983a) dar.
16
Heranführung: Vom Einzelbeleg zur Varietät
was dazu führt, dass die durch die dichotomische Isoglossentechnik mangelnde Validität der Variantendarstellung nicht nur bestehen bleibt, sondern sich durch die Überlagerung sogar noch anhäuft (vgl. ähnlich PRÖLL 2014). Schon PAUL ([1920] 1995, 42–43) gibt überdies zu bedenken, dass die Gesamtvariation sich dergestalt nicht ökonomisch abbilden lässt: Ziehen wir daher in einem zusammenhängenden Sprachgebiete die Grenzen für alle vorkommenden dialektischen Eigentümlichkeiten, so erhalten wir ein sehr kompliziertes System mannigfach sich kreuzender Linien. Eine reinliche Sonderung in Hauptgruppen, die man wieder in so und so viele Untergruppen teilt u. s. f., ist nicht möglich. (PAUL [1920] 1995, 42–43)
Für größere Datenmengen ist demnach eine deutliche Abstraktion bzw. Datenreduktion nötig. Konsequenz dieser Erkenntnis war die Ausprägung einer dezidiert quantitativen Variationslinguistik bzw. Dialektologie. 2.1.2
Prinzipien der Dialektometrie
Im vorliegenden Kontext sind hier zunächst insbesondere diejenigen Bereiche der quantitativen Dialektologie relevant, die seit den in der Nachfolge HAAGS (1898) entstandenen Arbeiten SÉGUYS (1971, 1973) und GOEBLS (1982, 1984) unter dem Terminus Dialektometrie5 rangieren. Die große Innovationsleistung der Dialektometrie besteht darin, mittels Zusammenfassung von Einzeldaten ein Gesamtbild erzeugen zu können: Die Datengrundlage, auf der der Großteil an dialektometrischen Untersuchungen beruht, ist das Aggregat der Dialektdaten, die zusammengefasste Gesamtvariation. Technisch umgesetzt wird dies unter anderem durch die Erstellung einer sogenannten Ähnlichkeitsmatrix. Dazu zählt man für jedes Paar von Orten, wie viele Variablen in beiden Orten die gleiche Variante haben. Dieser Grad an Übereinstimmung, in der Terminologie GOEBLS (1984) der relative Identitätswert (RIW), ist ein reziprokes Maß, skaliert zwischen 0 und 1 (bzw. zwischen 0 und 100 %): Er lässt sich dadurch problemlos kartieren.6 Entsprechend lässt sich auch eine Distanzmatrix gewinnen, die den Grad an Verschiedenheit der Orte bündelt. Weitere Verfeinerungen dieser grundlegenden Aggregationstechniken (wie etwa Gewichtungen der Matrix, vgl. z. B. GOEBL 2005) existieren und werden mit Erfolg eingesetzt – die Feinheiten sind hier im Moment aber nicht relevant. Aus diesem Aggregat der Daten werden darüber hinaus durch sogenanntes Clustern Orte zu Gebieten zusammengefasst. Beim Clustern werden Daten (hier die aggregierte Gesamtvariation) mittels robuster Kriterien in Klassen aufgeteilt 5
6
Eine terminologische Anmerkung in eigener Sache: Die Methoden, die im nachfolgenden Kapitel 3 vorgestellt werden, sind im strengeren Sinn nicht durchgängig als Dialektometrie zu apostrophieren, fußen aber zum Teil auf entsprechenden Grundüberlegungen zum Nutzen quantitativer Techniken, wandeln typische Verfahren der Dialektometrie ab bzw. haben den Anspruch, Probleme zu überwinden oder zu vermeiden, die insbesondere die Dialektometrie aufwirft. Siehe dazu genauer Abschnitt 3.1.5, ab Seite 48.
Grundlagen
17
(siehe dazu insbesondere die detailliertere Einführung in Clustertechniken in Abschnitt 3.3.1, ab Seite 65; die genauen technischen Details spielen hier noch keine Rolle). Als Ergebnis erhält man „Dialektregionen“, Gruppen von Orten, die sich ähneln, weil sie sich jeweils in einer gewissen Anzahl an Merkmalen entsprechen. Ziel der Analyse des Aggregats ist es, die „höchstrangigen Strukturen“ der gemessenen Daten aufzudecken und Strömungen und Grundmuster zu finden, die die Gesamtheit der Variabilität der untersuchten Daten adäquat erfassen. So stellt sich GOEBL (2005, 509) mittels Aggregation explizit gegen „Wortschatzstudien […] im Zeichen kasuistischer Einzelanalysen“: Demgegenüber belegen die hier gezeigten synthetischen Resultate, daß es möglich ist, durch die konsequente Addition vieler Einzel-„Geschichten“ zu einer Global-„Geschichte“ der lexikalischen Bewirtschaftung einer bestimmten Gegend durch die betreffenden Sprecher vorzustoßen bzw. diese zu rekonstruieren. (GOEBL 2005, 509)
Die Anzahl an Messpunkten ist endlich, die Gesamtzahl an Variablen im Sprachsystem dagegen unbegrenzt. GOEBL (2005, 500) ist davon überzeugt, dass sich ab einer Überlagerung von ca. 200–300 Variablen „die Gestalt (Musterung, Struktur etc.) von dialektometrischen Synthesen […] nur mehr wenig verändert“. Die individuellen Strukturen einzelner Variablen würden also spätestens ab dieser Größenordnung keine große Rolle mehr spielen;7 die räumliche Gestalt des angenommenen Gesamtsystems könnte aus einer bewältigbaren Menge an Einzeldaten inferiert werden. Je nach Blickrichtung und Fragestellung kann es nun als Stärke oder als Schwäche aggregativer Methoden gesehen werden, dass wiederkehrende, dominante Strukturen sich gegen Ausreißer in den Daten durchsetzen (positiver Sichtwinkel) bzw. Einzelphänomene in der Gesamtvariation untergehen (negativer Sichtwinkel). 2.1.3
Grenzen des dialektometrischen Variationsbegriffs
Eine Varietätenkonstruktion nach diesem Vorgehen ist aber nicht frei von weiteren Reduktionen; so beschäftigt sich die ursprüngliche Art der dialektometrischen Analyse, wie sie etwa in GOEBL (1982, 1984, 2005) vertreten wird, nicht mit der Rolle des Individuums bzw. der Sprechergemeinschaft als Träger der Variation. Bei dialektologischen Erhebungen wird naturgemäß versucht, Störgrößen gering zu halten, indem man – soweit möglich – die Sozialparameter der Gewährspersonen kontrolliert. Hauptsächlich dient das (neben rein erhebungspraktischen Vorteilen, vgl. KÖNIG 1988b, 173) dazu, die Messungen der einzelnen Orte untereinander vergleichbar zu machen. Die Belege sind daher im Idealfall repräsentativ für die Alters- und Sozialstruktur, nach der die Gewährspersonen ausgewählt wurden.8 Das heißt aber noch nicht, dass die Personen eines Ortes, die den Aus7 8
Unerwähnt bleibt dabei jedoch, dass dazu Grundanforderungen an diese Daten zu stellen sind. Die Abschnitte 5.2.1 (ab Seite 141) und 6.2.5 (ab Seite 165) gehen darauf näher ein. Aber sie sind natürlich mitnichten repräsentativ für den gesamten Ort, der eine völlig andere – und in keinem Fall homogene – Alters- und Sozialstruktur aufweisen kann. Ein solches Pos-
18
Heranführung: Vom Einzelbeleg zur Varietät
wahlkriterien entsprechen, auch sprachlich eine homogene Gruppe bilden müssen. Es folgt daraus auch nicht, dass jede dieser Personen nur Träger einer einzigen Variante sein kann. Laut GOEBL (1997, 23) interpretiert die Romanistik das Auftreten von mehreren Belegen an einem Ort meist als „the beginning of a sociolinguistic disintegration of the local dialect or geolinguistic stratum under consideration“. Dies führt nun aber zur Annahme einer Homogenität der Ortsdialekte, deren Grundüberzeugung es ist, dass es nur eine repräsentative Form pro Ort gäbe, die ausnahmslos von jedem repräsentativen Sprecher im Ort genutzt würde: ein Ort = eine Gewährsperson = ein Beleg.9 Sowohl die Repräsentativität der Gewährspersonen als auch die des Belegs wird absolut gesetzt; folglich findet sich z. B. in den Daten der romanischen Atlanten, auf denen die Analysen in GOEBL (1984) beruhen, praktisch nirgends ein Ort mit mehreren Belegen. Die dafür schon in der Erhebungsphase zwangsläufig nötige Vorselektion schafft zwar eindeutigere Karten, zeichnet aber ein Gesamtbild der Variation, das weniger treu zur tatsächlich beobachtbaren Variation ist.10 Treten dennoch mehrere Antworten an einem Ort auf, müsste dies als „Verunreinigung“ des Datensatzes gesehen werden – die Gewährsperson wäre kein kompetenter Sprecher der ansässigen Varietät, der Explorator hätte die falschen Fragen gestellt – oder der Forscher beschäftige sich mit „a blending of sociolinguistic and geolinguistic information“ (GOEBL 1997, 28). Diese Annahmen korrespondieren mit einer (implizit) statischen Sprachsystemanschauung sowie einer (wiederum oft impliziten) problematischen Dichotomie zwischen Synchronie und Diachronie:11 Das System Sprache scheint über das Individuum hinaus homogen, stabil und außerdem als Objekt direkt messbar zu sein. Der Messpunkt ist „synchroner“ Natur, aber auf eine a historische Art, als statischer Zustand. Die Diachronie des Systems hätte man sich als lineare Abfolge a-historischer, synchroner Schnitte vorzustellen. Ein derartig konzipierter, statischer Variationsbegriff konstruiert aber ein System, das a) von seinen Nutzern unabhängig ist und b) als Zustand beschrieben wird. Ob man die individuelle Vatulat würde auch die Ausrichtung der meisten Dialektatlanten verkennen, die gar nicht in der Absicht erstellt wurden, eine sozial repräsentative Sicht des aktuellen Sprachgebrauchs an einem Ort zu leisten, sondern den ältesten greifbaren, im Verschwinden befindlichen Dialekt zu dokumentieren. 9 In einigen Erweiterungsarbeiten zur grundlegenden Dialektometrie wird das nicht nur kritisch gesehen, sondern auch als Ausgangspunkt für die technische Berücksichtigung von Mehrfachbelegen an einem Ort herangezogen, vgl. NERBONNE / KLEIWEG (2003); PEREA / UEDA (2010); NERBONNE / KRETZSCHMAR (2013); AURREKOETXEA / FERNANDEZ / RUBIO / RUIZ / SÁNCHEZ (2013) (mit einem kurzen Forschungsüberblick). Das Repräsentativitätspostulat der Gewährsperson bleibt davon aber unberührt. 10 In diesem Zuge muss allerdings betont werden, dass im ursprünglichen Rahmen der Dialektometrie aus Gründen der Reliabilitätssicherung direkt die Sprachatlanten als Gegenstand fungieren, nicht ihr Interpretament (vgl. GOEBL 1982, 15; GOEBL 1984, 5, 18–19). BAUER (2009, 172) jedoch löscht auch bereits kartierte Mehrfachbelege für die Aggregation. 11 Man vergleiche dagegen HAAS (1978, 2): „[W]enn in irgendeiner Sparte der Sprachwissenschaft die prinzipielle Trennung von Synchronie und Diachronie sich als unangemessen erweist, dann in der Mundartforschung.“
Multivariate Sichtweisen
19
riation und Interaktion im System nun als Soziolinguistik apostrophiert oder nicht,12 es ist riskant, sie als eigene Variationsebene neben der geografischen Variation zu betrachten (vgl. dazu besonders BERTHELE 2004, mit einem wissenschaftshistorischen Überblick). Eine alternative Betrachtungsweise könnte etwa konstatieren, dass individuelle Variation erst dafür sorgt, dass geografische Variation entsteht: „The particular structure that the linguistic space has is the consequence of the language activity of people“ (AURREKOETXEA 2010, 208). 2.2
MULTIVARIATE SICHTWEISEN 2.2.1
Erweiterung des Modells
Spätestens an diesem Komplexitätsstatus sprachwissenschaftlicher Modellbildung hat man es demnach mit (mindestens) zwei Dimensionen von Variation zu tun, die zu berücksichtigen sind (siehe Abbildung 3). Erstens: Die Variation kann nur in Form von Einzelvariablen gemessen werden, der anvisierte Gegenstand dieser Dimension ist aber die Gesamtheit der Variablenausprägungen oder zumindest strukturell zusammenhängender Teilaspekte. Diese Gesamtheit spiegelt aber lediglich den Idiolekt eines einzelnen Sprechers wider. Zweitens: Messpunkte der Variation sind Individuen, Aussageziel aber das Gesamtsystem aller Sprecher einer Varietät.
Abb. 3: Erweitertes Variationsmodell (zwei Dimensionen). 12 Vgl. etwa die Aussage von AURREKOETXEA / FERNANDEZ / RUBIO / RUIZ / SÁNCHEZ (2013, 26) in Juxtaposition zu GOEBL (1997): „Any speaker can hear more than one word or allophone for a concrete concept and can use it in any circumstance, without taking into account sociolinguistic factors or motivations“; grundsätzlich so auch WEINREICH / LABOV / HERZOG (1968, 101). Man vergleiche auch die differenzierte Diskussion des amerikanischen Arms der Dialektometrie, etwa durch KRETZSCHMAR / SCHNEIDER (1996, 5–16).
20
Heranführung: Vom Einzelbeleg zur Varietät
Das Gesamtsystem ist nicht direkt messbar, es wird von zwei Dimensionen aus erschlossen: Mittels der Erhebung vieler einzelner Variablen inferiert man den Idiolekt eines Individuums, mittels einer Vielzahl an Individuen inferiert man die Population. Das Gesamtsystem, den Sprachgebrauch der Population, inferiert man demnach mittels einer Vielzahl an von Individuen geäußerten Varianten.13 Diese Verknüpfung zwischen jeweils einer individuellen, qualitativ analysierbaren und einer höher strukturierten, nur quantitativ fassbaren Seite der Variation erfordert für den Empiriker eine entsprechende Berücksichtigung auf methodischer Ebene; es bedarf aber auch eines theoretischen Rahmens, der diese Aspekte angemessen würdigen kann. Dieses Desiderat führte zu den sogenannten dynamischen Theorien.14 2.2.2
Dynamische Theorien
Als repräsentative Vertreter der Familie der dynamischen Theorien zu Variation und Wandel greife ich hier exemplarisch CROFTS evolutionären Sprachwandel (CROFT 2000) sowie KELLERS Theorie der unsichtbaren Hand (KELLER 2003) heraus, da beide einen starken Fokus auf die Relation zwischen Individuum, Gesellschaft und System legen. CROFTS Modell (am prominentesten dargestellt in CROFT 2000) adressiert exakt und pointiert die Relation zwischen Sprecher und System: „Languages don’t change; people change language through their actions“ (CROFT 2000, 4); Wandel ist kein Prozess, der sich an einem isolierten Gegenstand (etwa der zum System verkürzten und abstrahierten „Sprache“) abspielt, sondern an einzelnen Äußerungen und individuellem sprachlichen Wissen (bzw. ihrer Weitergabe): „The evolution of both of these entities, particularly utterances, occurs through replication, not inherent change” (CROFT 2000, 3; vgl. ähnlich auch PAUL [1920] 1995, 34). Auch KELLER will seine Theorie der unsichtbaren Hand explizit als evolutionäre Theorie verstanden wissen (vgl. KELLER 2003, 13–14), die sich allerdings im Gegensatz zu CROFTS evolutionärem Sprachwandel an sozialwissenschaftlichökonomischen Vorlagen orientiert, nicht an genetisch-biologischen. Die Anbindung an den Terminus der Evolution geschieht auch hier in klarer Abgrenzung zu SCHLEICHER (1873), der Sprache – ebenfalls in Analogie zu damals vorherrschenden wissenschaftlichen Strömungen – als Organismus betrachtet, dabei aber nicht 13 So schon PAUL ([1920] 1995, 24): „Das wahre Objekt für den Sprachforscher sind vielmehr sämtliche Äusserungen der Sprechtätigkeit an sämtlichen Individuen in ihrer Wechselwirkung auf einander.“ 14 Der Übergang von „statischen“ zu „dynamischen“ Theorien ist natürlich fließend und nicht ohne Übergeneralisierungen zu treffen. ALTMANN (1985) sieht den Hauptunterschied in der Konzentration auf qualitative Konzepte einerseits und quantitative andererseits: Die statischeren Theorien nutzen vermehrt lineare Modelle, um Zusammenhänge zu fassen, stützen sich auf Logik „or simply verbal descriptions“ (ALTMANN 1985, 183), während die dynamische Perspektive vermehrt Wahrscheinlichkeiten, stochastische Prozesse und systemtheoretische Überlegungen integriert (vgl. auch WILDGEN / PLATH 2005, 689).
Multivariate Sichtweisen
21
nur die Unterscheidung zwischen Ontogenese und Phylogenese ignoriert (vgl. KELLER 2003, 75), sondern auch durch die starke Hypostasierung dessen, was er als Sprache begreift,15 den ontologischen Status von (dehistorisierter) Abstraktions- und Empirieebene durcheinanderbringt (vgl. zum Grundproblem CROFT 2000, 2).16 KELLER (2003) fasst Sprache weder als organisches Phänomen, das sich kraft seiner Eigenschaften selbsttätig ändert, noch von einem mechanistischen Standort aus als reines Objekt, das von seinen Sprechern aktiv und (mehr oder minder) bewusst zielgerichtet geändert wird, auf. Er sieht sie als ein Phänomen der dritten Art, ein nicht-intendiertes Resultat intentionaler Handlungen der Sprecher. Wichtig dabei ist, dass intentional nicht mit geplant oder bewusst gleichzusetzen ist (vgl. genauer KELLER 2003, 25–29). KELLERS Theorie des Wandels fußt auf einem stochastischen Prozess: „Invisible-hand-Prozesse kommen dadurch zustande, daß viele Leute in gewissen Aspekten ähnlich handeln“ (KELLER 2003, 126). Es bedarf demnach einer Anzahl an Sprechern, die eine sprachliche Variante mehr oder weniger ähnlich produzieren.17 Auslösende Faktoren des Wandels – wie auch Faktoren der Stase – sind für KELLER (2003) Kommunikationsprinzipien, Maximen, die die Strategien hinter der menschlichen Kommunikation leiten. Als „Hypermaxime“ gilt: „Rede so, daß Du sozial erfolgreich bist“ (KELLER 2003, 142). Zur Stase führen (Unter-)Maximen, die Abwandlungen des Prinzips „Rede so wie die anderen“ (KELLER 2003, 138) sind, etwa „Rede so, daß Du als Gruppenzugehöriger zu erkennen bist“ oder „Rede so, daß Du nicht auffällst“ (KELLER 2003, 137). Demgegenüber sind Faktoren des Wandels, „dynamische Maximen“, offen individuellerer Natur, z. B. „Rede so, daß Du beachtet wirst“, „Rede so, daß Du als nicht zu der Gruppe gehörig erkennbar bist“ (KELLER 2003, 139) etc., aber auch die Ökonomieformel „Rede so, daß es Dich nicht unnötige Anstrengung kostet“ (KELLER 2003, 140). Maximen können einander gegenläufig sein – Kommunikation heißt also auch, im Spannungsfeld dieser sich teilweise widersprechenden Impulse zu agieren. Die Theorie der unsichtbaren Hand behandelt Sprachvariation als „zusammengesetzt aus einem Mikrobereich, der intentional ist, und einem Makrobereich, 15 „Die Sprachen sind Naturorganismen, die, ohne vom Willen des Menschen bestimmbar zu sein, entstunden, nach bestimmten Gesetzen wuchsen und sich entwickelten und wiederum altern und absterben“, so SCHLEICHER (1873, 7). 16 Bei aller Kritik sollte aber nicht übersehen werden, dass es offenbar das Hauptziel SCHLEICHERS (1873) war, eine Anbindung der Sprachwissenschaft an empirische Methoden der Naturwissenschaften zu propagieren; dass die Verbindung zwischen Evolutionsbiologie und Sprachwandel lediglich in Form einer groben Analogie greift, scheint ihm klar zu sein, siehe diesbezüglich vor allem das Ende des vorletzten Absatzes, Seite 33: „Begreiflicher Weise konnten es nur die Grundzüge der Darwinschen Anschauungen sein, die auf Sprachen Anwendung finden. Das Reich der Sprachen ist von dem der Pflanzen und Thiere zu verschieden, als dass die Gesammtheit der Darwinschen Ausführungen mit ihren Einzelheiten für dasselbe Geltung haben könnte.“ 17 KELLERS anschauliche Beispiele behandeln die Entstehung eines Staus (KELLER 2003, 90–91) und eines Trampelpfades (KELLER 2003, 100–102); das Prinzip ist dem Sprachwandel vergleichbar.
22
Heranführung: Vom Einzelbeleg zur Varietät
der kausaler Natur ist“ (KELLER 2003, 92). Ohne es explizit so zu benennen, vereint dies gleichzeitig auch zwei Betrachtungsebenen, eine qualitative sowie eine quantitative: Die Perspektive auf den einzelnen Sprecher in seiner Funktion als Agent des Sprachwandels ist qualitativer Art, die auf das Produkt des Wandels selbst (das System) ist dagegen quantitativer Art. CROFTS (2000) Biologiemetaphorik ist dazu analog zu lesen; quasi nebenbei adressiert sie auch das empirische Grundproblem der Variationslinguistik: A language and its speakers should be defined in population terms just as species generally are. A geographical race is a traditional geographical dialect: defined geographically, slightly divergent structurally, but not enough presumably to prevent communication (i.e. intelligibility) or to provide a separate sociolinguistic identity […]. (CROFT 2000, 19)
Entscheidender Punkt dieser Passage ist, wie das Konzept der „Population“ einen Zusammenhang zwischen den konkreten Individuen und der nur abstrakt zugänglichen Sprache (im Sinne von langue) herstellt. Eine Population gründet sich auf die Existenz und Interaktion der Individuen – sie beinhaltet alle Züge aller Individuen, also Elemente, die jeweils einem Teil der Individuen gemeinsam sind, in ihrer Summe aber über jedes Individuum hinausgehen. Auch Idiosynkrasien der Individuen gehen in die Gestalt der Population ein. 2.2.3
Komplexität, Emergenz und Zufall
Die Population – und in der Folge das Gesamtsystem – ist aber mehr als die Summe seiner Teile: Variation entsteht nicht allein dadurch, dass mehrere Sprecher existieren, sondern dadurch, dass diese Individuen wiederholt miteinander interagieren. Die Wiederholung grundlegender (kommunikativer) Operationen (auch Iteration genannt) erzeugt Komplexität (vgl. RICHTER / ROST 2004, 24). Diese Operationen selbst können dabei von einem logischen Standpunkt aus gesehen äußerst einfach sein, aber dennoch zu hoher Komplexität führen (vgl. RICHTER / ROST 2004, 9). Die Interaktion zwischen den Individuen über die Iterationen hinweg erzeugt Emergenz (vgl. RICHTER / ROST 2004, 25), also das spontane Auftreten mindestens einer Eigenschaft des Gesamtsystems, die nicht auch eine Eigenschaft eines seiner Teilsysteme ist.18 Das begünstigt Unvorhersagbarkeit, und zwar in zweierlei Hinsicht (vgl. GREVE / SCHNABEL 2011, 10, Fn. 3): Zum einen ist die Gesamtstruktur aus einem Teilsystem bzw. von einer „niedrigeren“ Ebene aus nicht erschließbar – die Analyse einzelner Variablen oder des Sprachverhaltens einzelner Individuen kann also das Gesamtsystem nicht erfassen. Gleichzeitig erschwert es Projektionen in die Zukunft; da die Entwicklung eines derartigen Systems längerfristig nicht prognostizierbar ist, kann Sprachwandel praktisch nicht vorhergesehen werden.19
18 Vgl. zur Diskussion um Grade von Emergenz GREVE / SCHNABEL (2011). 19 Man vergleiche dazu auch HEISENBERG ([1927] 1994, 284): „An der scharfen Formulierung des Kausalgesetzes: Wenn wir die Gegenwart kennen, können wir die Zukunft berechnen, ist
Multivariate Sichtweisen
23
Als geradezu gegensätzliche Position enthalten viele Wandeltheorien explizit oder (meist) implizit ein teleologisches Element, das klären soll, „wie ein bestimmtes Ganzes aus seinen Teilen hervorgeht“ (KÜPPERS / PASLACK 1996, 45): Wenn Wandelprozesse als notwendige Konsequenz ihrer Bedingungen angesehen werden (was auch für Emergenzphänomene zutrifft), so müssen bestimmte Voraussetzungen und Bedingungen notwendigerweise und unausweichlich auch bestimmte Wandlungen bewirken; das System bewegt sich von Anfang an gerichtet auf einen Endzustand zu, der Wandel ist daher prognostizierbar.20 Dies gilt aber nur unter der Voraussetzung, dass alle Parameter des Systems bekannt sind, ansonsten sind Vorhersagen problematisch. Kleine Abweichungen auf einer Iterationsstufe (etwa durch einen unbekannten Parameter) ändern in einem dynamischen, komplexen System die weiteren Iterationsschritte möglicherweise dermaßen, dass das System chaotisch erscheint (vgl. RICHTER / ROST 2004, 4). Enthält das System eine zufällige Komponente, ist die Vorhersage unmöglich (vgl. auch CROFT 2000, 3).21 Woher aber kommt die zufällige Variation im Sprachsystem? Ich illustriere dies exemplarisch auf der Ebene der individuellen Sprachproduktion: Abbildung 4 zeigt ein vereinfachtes psycholinguistisches Produktionsschema, erweitert durch SHANNONS (1949) grundlegendes Kommunikationsmodell. Der Sprecher wählt eine Botschaft und kodiert sie (mentaler Prozess), das kodierte Signal wird artikuliert (neuronaler/anatomischer Prozess) und im Medium übermittelt (physikalischer Prozess). Im Medium ist das Signal Modulationen durch Störgrößen ausgesetzt und verliert an Stärke, die Übertragungsqualität wird durch Rauschen negativ beeinflusst. Das Signal wird sowohl vom Hörer als auch vom Sprecher rezipiert (anatomischer/neuronaler Prozess) und dekodiert (mentaler Prozess).22
nicht der Nachsatz, sondern die Voraussetzung falsch. Wir können die Gegenwart prinzipiell nicht in allen Bestimmungsstücken genau kennen lernen.“ 20 KELLER (2003, 22–25) vermutet, dass die alternative (und angemessenere) Vorstellung von Sprachwandel als einem permanenten, nicht zielgerichteten Vorgang für den Menschen vor allem deshalb problematisch ist, weil er kein vergleichbares Szenario selbst erfahren kann; er führt als typisches Beispiel den Handwerker und seine Arbeit als zielgerichteten Prozess an, dessen Phasen (Idee, Werden, Resultat) als Analogie dienen (können bzw. müssen). Das führt in Konsequenz zu der Annahme, Sprache würde sich auf einen von vornherein definierten Zustand hin entwickeln, den sie an irgendeinem Zeitpunkt auch erreicht. (Da sich das Resultat eines finalen Prozesses von seinem Endzustand aus nur verschlechtern kann, führt diese Analogiebildung zur Annahme des „Verfalls“ der Sprache.) 21 Entsprechendes zeigt sich auch in der Wetterforschung: Zuverlässige Voraussagen sind aufgrund der dynamischen Basis des zugrundeliegenden Systems schon im Bereich von zwei bis drei Wochen praktisch unmöglich (vgl. ECKHARDT 2004, 36–38). 22 Der Nutzwert für den Hörer ist auch dem Laien sofort einsichtig, aber auch die Produktion des Sprechers bedarf dieses sogenannten self-monitorings (siehe dazu näher die Produktionsmodelle von LEVELT 1989; 1993 und HERRMANN 1995).
24
Heranführung: Vom Einzelbeleg zur Varietät
Abb. 4: Einfaches psycholinguistisches Modell der Sprachproduktion.
Dieses Modell ist rudimentär, dennoch existieren bereits auf diesem Abstraktionsniveau mindestens drei verschiedene Möglichkeiten stochastischer Fluktuationen, die innerhalb des Individuums anzusetzen sind sowie zusätzlich eine vierte, externe Fluktuationsquelle. 1. Es ist von einem Netzwerk aus Umgebungsvariablen, Weltwissen und aktuellem psychischem Systemzustand abhängig, welche Variante ein Sprecher auswählt und kodiert (vgl. HERRMANN 1995, hier insbesondere 48–67 zum Umgebungsrepräsentations- und Operatorenauswahl-System); manche dieser Umgebungsvariablen sind klar definierbar bzw. korrespondieren mit Gesprächsmaximen (wie z. B. von KELLER 2003 beschrieben, siehe oben), andere sind weniger transparent bzw. greifen auf vielschichtige, für uns bisher unvorhersehbare Art ineinander – wir nennen das dann Zufall. 2. Die Artikulation ist ein muskulärer Vorgang und als solcher ein Prozess, der zwangsläufig ständiger Fluktuation ausgesetzt ist. Jeder einzelne Artikulationsakt hat seine minimal von anderen Artikulationsakten verschiedenen Umstände und Bedingungen. Der Muskeltonus eines Individuums schwankt ständig, die Artikulationsorgane sind daher – auch bei hypothetisch völlig identischen neuronalen Steuerungsimpulsen23 – niemals in exakt derselben Position. Entsprechend sind keine zwei Laute identisch, nicht einmal im selben artikulatorischen Kontext. Bei jedem Sprecher streuen also z. B. die physikalisch messbaren Parameter eines Vokals ständig um einen Mittelwert herum.
23 „Hypothetisch“ deshalb, weil auch das neuronale Signalsystem, das die Artikulationsorgane steuert, faktisch ständigen Streuungen unterworfen ist – streng genommen verkompliziert sich die Angelegenheit zusätzlich dadurch, dass offenbar schon innerhalb der Bewegungskontrolle mit Emergenz und Symmetriebrechung zu rechnen ist (vgl. TULLER / KELSO 1993).
Multivariate Sichtweisen
25
3. Die Rezeption eines Signals ist ebenfalls ein Vorgang, der Schwankungen ausgesetzt ist; die Interpretation eines akustischen Reizes ist ein anatomisch-neuronaler Prozess, der sich – wie schon die Erzeugung – in permanentem Flux befindet. 4. Zusätzlich führt das Rauschen, das in jedem Medium vorhanden ist (also auch die Schallwellen der sprachlichen Äußerung im Medium Luft begleitet), zu einer stetigen, aber nicht statischen Beeinflussung des Signals. Das heißt, die Sprachproduktion ist in einem ständigen Zustand minimaler Fluktuationen; diese weisen die Charakteristik von Rauschen auf, sind also zufälliger Natur (und daher am sinnvollsten mit statistischen bzw. stochastischen Mitteln beschreibbar, vgl. WILDGEN / PLATH 2005). In der Interaktion der Individuen überlappen und beeinflussen sich diese Schwankungen gegenseitig (in einem ebenfalls nicht vorhersehbaren Muster); über viele Kommunikationsvorgänge hinweg kann der Durchschnitt der Realisierung eines Lauts auf diese Art „driften“.24 2.2.4
Genese und Wandel des Systems
COSERIU (1974, 122) scheint nahezulegen, dass diese Fluktuationen irrelevant sind: „[D]a die Sprache keine physische Existenz und Kontinuität besitzt, haben diese so oft postulierten ‚unmerklichen Veränderungen‘ keinerlei Möglichkeit, sich zu erhalten und aneinander anzuschließen.“ Diese Interpretation wäre aber aus psycholinguistischem Rahmen betrachtet vorschnell: Die einzelne Realisierung hat natürlich über die konkrete Äußerung hinaus keine „physische Existenz“ im Sinne eines physikalisch messbaren Ereignisses; sie wirkt aber über das selfmonitoring auf das zurück, was PAUL ([1920] 1995, 58) als „Lautbild“ bezeichnet, eine abstrakte psychische Zielvorstellung der Artikulation, die sich in Abhängigkeit von eigener Produktion („Bewegungsgefühl“, PAUL [1920] 1995, 49) und Rezeption anderer Sprecher unbewusst wandeln kann (vgl. auch OUDEYER 2006, 21). Eine breite Anzahl an Simulationsstudien zur sprachlichen Dynamik und Evolution wie die von DE BOER (1997, 2001, 2005) oder OUDEYER (2006) zeigen, dass Fluktuation des Signals, Interaktion der Sprecher / Hörer und Rückkopplung der Rezeption auf die Produktion ausreichen, um in einer Population von simulierten Agenten ein (optimales) Vokalsystem entstehen zu lassen. Mehr noch: Werden die Agenten der Simulationen (wie durch LIVINGSTONE 2002, wo sich auch eine Übersicht über ältere Ansätze findet) „geografisch“ aufgeteilt, entwickeln sich Dialekte, in Teilpopulationen emergieren unterschiedliche Systeme. Fluktuationen (bzw. Mutationen und Fehler, vgl. LIVINGSTONE 2002, 103– 104) können demnach über Interaktion und Rückkopplung zu Änderungen in kon24 Ein Modell dieser Art ist in der Hauptsache für gesprochene, „natürliche“ Sprachsysteme wie die alten (Basis-)Dialekte im Deutschen angemessen. Für Standard- und Schriftsprachen bzw. den Kontakt mit ihnen können (insbesondere durch Kodifizierung und Normierung) andere bzw. weitere Bedingungen gelten.
26
Heranführung: Vom Einzelbeleg zur Varietät
tinuierlichen Variablen (wie etwa Lauten) führen.25 Sprache ist aber nicht ausschließlich kontinuierlich. Variablen in Lexik und Morphologie sind diskret – es gibt keine unendlichen, in der Produktion streuenden Zwischenwerte zwischen Semmel und Brötchen. Die Entstehung neuer Varianten ist ebenfalls diskreter Natur; sie ist das, was gemeinhin als Innovation im System bezeichnet werden kann (vgl. HAAS 1978; CROFT 2000).26 Dieser Innovationsprozess entzieht sich absurderweise der Empirie. Das erste Auftreten einer Innovation (z. B. in Form eines ad-hoc-Kompositums) ist theoretisch beobachtbar, stellt aber nach gängiger Meinung noch keinen Beitrag zum Sprachwandel dar (vgl. den Überblick in PICKL 2013a, 44–47); relevant für den Sprachwandel wird die Innovation erst dann, wenn sie von der singulären ad-hocBildung eines einzelnen Sprechers zumindest einen Reflex in einer sprachlichen Äußerung eines Hörers bewirkt. Die (quantitative) Zunahme der Nutzung einer Innovation bezeichnet CROFT (2000, 8) der Evolutionsmetapher folgend entsprechend als „propagation“. Dass sich im Laufe dieses Prozesses eine Variante durchsetzt, sieht DE BOER (2005) als Beispiel für Emergenz und positive Rückkopplung: At first, many words will be coined, but the ones that are most frequently used (or most frequently used by the most prestigious speakers) will be most useful in communication and will eventually be adopted by more and more speakers, until only one word remains. (DE BOER 2005, 125)
Das Zustandekommen und der Wandel von Sprachsystemen (sowohl Subsystemen wie auch des Gesamtsystems) beruhen demnach zumindest teilweise auf der Interaktion von Sprechern. Das ist ein Prozess, und ein Prozess erfordert eine zeitliche Abfolge.27 Zu den oben angeführten Beschreibungsdimensionen der Variablen und der Individuen (vgl. Abbildung 3) muss somit die Zeit bzw. die Interaktion hinzugefügt werden. Abbildung 5 stellt den Versuch dar, dieses mehrdimensionale, dynamische Modell zu visualisieren. 25 Wohlgemerkt sind nur die Realisierungen der Variablen kontinuierlich, die systemischen Kontroll- und Kombinationsaspekte sind diskret (siehe auch OUDEYER 2006, 24). 26 Eine populärwissenschaftlich gängige Hypothese zum Auftreten lexikalischen Wandels ist, dass Veränderungen der Umweltbedingungen der Sprecher auch Veränderungen in der Sprache nach sich ziehen: Wenn ein neuer Gegenstand erfunden wird, entsteht – wie auch immer – eine Bezeichnung für diesen Gegenstand. Für Abstrakteres – Haltungen, Wertsysteme, kurzum alles, was konzeptualisiert und bezeichnet werden kann – geschieht Analoges. KELLER (2003, 20) mahnt diesbezüglich jedoch an, dass Wandel der Welt „weder notwendig noch hinreichend für Veränderungen in unserer Sprache“ sei. Die Annahme eines zwingenden Zusammenhangs sieht er in der Überbetonung einer reinen Abbildungsfunktion der Sprache begründet. 27 Der zeitliche Aspekt ist gleichzeitig nach LÜDTKE (1999, 9–10) ein Grund für die theoretische Unmöglichkeit von Stase im Sprachsystem: „Ein festes, d.h. für alle seine Sprecher / Hörer gleichzeitig identisch vorliegendes Sprachsystem ist eine platonische Idee. Da nämlich die Quasi-Gleichheit der Sprachpotentiale in den Gehirnen der Sprecher / Hörer sich nur mittels sprachlicher Kommunikationsakte herstellen und aufrechterhalten läßt, diese aber Zeit konsumieren, und da außerdem jeder Sprechakt auch schon das System – sei es auch minimal – verändert, kann es so etwas wie eine absolute Ruhelage einfach nicht geben.“
Multivariate Sichtweisen
27
Abb. 5: Dynamisches Variationsmodell (drei Dimensionen).
Das System ist eine Funktion des Zusammenwirkens aller Faktoren. Eine adäquate Beschreibung des Systems muss also aus einzelnen Messpunkten die Interaktion innerhalb einer Population in Bezug auf die Gesamtheit der Variablen inferieren können. (Population und Interaktion sind eventuell nur zwei sprichwörtliche Seiten einer Medaille, ihre Trennung wäre demnach nicht nur unnötig, sondern geradezu absurd. Die hier vertretene stochastische Perspektive berücksichtigt daher beide Aspekte mittels desselben Verfahrens.) Viele dialektologische Ansätze (unter anderem ein Großteil der dialektometrischen Studien) klammern die Zeit aus ihren Modellen aus, in dem Ansinnen, eine statische Beschreibung eines Zustands zu bekommen – das umgeht scheinbar das Problem, den interaktiven, dynamischen Aspekt des Systems berücksichtigen zu müssen. Dass Erhebungen praktisch zeitgleich, mit idealerweise gleichaltrigen Gewährspersonen durchgeführt werden, bedeutet allerdings noch nicht, dass man den Faktor „Zeit“ von Beleg zu Beleg gleich behandelt oder gar die Daten von ihm bereinigt hätte. Die zwangsläufig statische Methode der Kartierung zementiert den entsprechenden Eindruck der Homogenität noch zusätzlich. Dieser zeitlose Zustand existiert aber nicht; er ist keine bloße Reduktion des Beobachteten, sondern schlichtweg undenkbar, da er nicht zu erfahren und zu beschreiben ist – die Beschreibung von Sprache als statischem Objekt sagt nichts über die Natur der Sprache als Prozess aus, auch nicht zu dem „Zeitpunkt“, an dem gemessen wurde. Die Fotografie eines Wasserfalls ist eine schlechte Repräsentation des Phänomens selbst: Dass man in der statischen Abbildung dennoch den ursprünglichen, dynamischen Prozess wiedererkennt, liegt daran, dass man mittels grundlegendem Weltwissen (Wassertropfen schweben nicht, Objekte fallen nach unten) und per-
28
Heranführung: Vom Einzelbeleg zur Varietät
sönlicher Erfahrung (der Erinnerung an ein entsprechendes Erlebnis) die Dynamik aus der Statik der Abbildung inferieren kann. Im Klartext heißt das: Da das System Sprache seine Gestalt überhaupt erst durch einen dynamischen Prozess erhält, lässt sich seine Varianz nur dann annähernd abbilden, wenn man aus der Abbildung die Dynamik noch inferieren kann.28 2.2.5
Illusionen der Trennschärfe und der Reinheit
Tritt man nun zum einen vom Ortsdialekt, zum anderen von der Einzelvariablen einen Schritt zurück, so ist durch just diese Reduktion die Perspektive auf größere Strukturen, also Varietäten bzw. Dialekte, oft nicht frei von weiteren unterschwelligen Homogenitätsannahmen. Die Hypothese stabiler, diskreter Varietäten (sei es räumlicher, sozialer oder stilistischer Natur) ist zwar in der Dialektologie generell nach außen hin – unter dem Eindruck ständiger empirischer Gegenindizien – kontinuierlich der Perspektive gewichen, dass an den angenommenen Rändern der Varietäten mehr oder weniger breite Übergangsbereiche existieren. Das Axiom von Varietäten als prinzipiell trennscharfe Einheiten ist dieser Perspektive aber nach wie vor immanent (vgl. ähnlich PICKL 2013a, 67–68, 79): Es gibt eine „reine“ Varietät X, eine „reine“ Varietät Y und dazwischen einen diffusen Übergangsbereich (man vergleiche etwa die viel zitierte Karte zur Einteilung der deutschen Dialekte in WIESINGER 1983a).29 Im Bild des Dialektkontinuums bewegt man sich somit stets abwechselnd durch klare und diffuse Bereiche, die ein momentanes „Ungleichgewicht“ in Folge eines aktuellen Wandelprozesses aufweisen. Im dialektometrischen Bereich entsteht der Eindruck diskreter Klassen speziell durch das Clustern von Orten. Den kritischeren unter den dementsprechend arbeitenden Forschern bleibt diese Problematik natürlich nicht verborgen: All the different areas are distinguished discretely, so that if we filled in the dialect areas with different colors, we would also see discrete borders leading to the impression that “with one step, you hear Bavarian”. The impression of local speakers and that of dialect experts is that borders are seldom so precise. (NERBONNE 2010a, 485)
Hier zeigt sich der tendenziell hermeneutische bzw. zyklische Bezug zwischen Theorie und Empirie: Das vorherrschende Gedankenmodell, die Suche nach diskreten Varietäten, führt zur Entwicklung einer Methodik, die entsprechende Er28 Eine ähnliche Leistung vollbringt unser Wahrnehmungssystem, das unsere dreidimensionale Umwelt zunächst auf einen niederdimensionaleren Raum projiziert: Die menschliche Wahrnehmung der dritten Raumdimension ist eine darauffolgende Rekonstruktionsleistung des Gehirns (vgl. ANDERSON 2001: 44–46, 73–74; GOLDSTEIN 2002: 225–273). 29 Dazu MÆHLUM (2007, 43): „I det hele tatt bør en være oppmerksom på at forestillingen om den ‚reine‘ varieteten – det være seg standard, dialekt eller regiolekt – er nokså mytisk“ [„Insgesamt sollte man beachten, dass die Vorstellung von der ‚reinen‘ Varietät – sei es Standard, Dialekt oder Regiolekt – ziemlich mythisch ist“, meine Übersetzung].
Multivariate Sichtweisen
29
gebnisse leisten kann – diese Ergebnisse untermauern wiederum die Grundannahmen, die zur technischen Seite geführt haben.30 Ausrichtung dieser Arbeit ist es, die Variation innerhalb der Varietät zu berücksichtigen, daher verschieben die später präsentierten Methoden den Fokus entsprechend stärker auf den Nachweis der Variabilität des Gegenstandes. 2.2.6
Rekurs: Die Bedeutung der Einzelvariablen
Im Rahmen der Ähnlichkeitskarten, die GOEBL (1982, 1984, 2005) folgen, ist der Blickwinkel wiederum auf den Ortsdialekt gerichtet: Die Karten sind darauf ausgelegt, Ähnlichkeiten zwischen benachbarten Orten zu visualisieren.31 Abbildung 6 zeigt eine entsprechende Karte (im Original von Susanne Kuffer erstellt, hier für die Abbildung in Graustufen nachbearbeitet) zur Ähnlichkeit von Langvokalen und Diphthongen im Gebiet des „Sprachatlas von Bayerisch-Schwaben“ (SBS), aus den unveröffentlichten dialektometrischen Analysen der 1990er Jahre: Ausgehend vom Referenzort Türkheim (weißes Polygon) nimmt die aufsummierte Ähnlichkeit von den dunkler zu den heller eingefärbten Feldern ab. Die Orte um Türkheim herum haben also relativ häufig die gleichen Langvokale und Diphthonge, die mittelfränkische Region im Nordosten dagegen nicht. Die (zweifelsfrei geglückte) Darstellungsintention der Karte ist es, die aggregierten Ähnlichkeiten und Unähnlichkeiten zu einem Ort auf einen Blick zu visualisieren. Die Stärke dieser Dateninterpretation (und überhaupt der gesamten aggregativen Methodik) besteht darin, die idiosynkratische Variabilität einzelner Variablen unterdrücken zu können, „to compensate for the noisiness of individual distributions“ (SPRUIT / HEERINGA / NERBONNE 2009, 1624). Das ist ein legitimes und sinnvolles Mittel, um – man verzeihe die Statistikanalogie – eine Art „arithmetisches Mittel der regionalen Variation“ bilden zu können; für viele Fragestellungen ist der Mittelwert aber nicht besonders aussagekräftig. So wie die Durchschnittsnote einer Schulklasse kein Zeugnis über die Leistung einzelner Schüler gibt, so enthält die aggregierte Masse an Dialektdaten keine Auskunft darüber, welche Variablen sich wie verhalten, oder noch stärker: Der abstrahierte, „per Durchschnitt“ ermittelte Gesamtdialekt entspricht keiner der einzelnen Variablenverbreitungen, ist vielen von ihnen vielleicht nicht einmal besonders ähnlich.
30 Vgl. dazu insbesondere auch CHRISTEN (1998, 8–12). 31 Das Programm Visual DialectoMetry (VDM) (siehe näher HAIMERL 2006) setzt den aktuellsten technischen Stand dieses Verfahrens eindrucksvoll in die Praxis um.
30
Heranführung: Vom Einzelbeleg zur Varietät
Abb. 6: Ähnlichkeitskarte (Langvokale und Diphthonge) zum Sprachatlas von BayerischSchwaben (SBS).
In stärker individuenzentrierten Wissenschaftsdisziplinen (wie etwa der analytischen Psychologie) ist diese differenzierte Perspektive seit langem Usus, man vergleiche beispielsweise JUNGS analoge Beobachtung: Die statistische Methode vermittelt zwar die ideale Durchschnittlichkeit eines Sachverhalts, nicht aber ein Bild von dessen empirischer Wirklichkeit. Sie gibt zwar einen unanfechtbaren Aspekt der Wirklichkeit, kann aber die tatsächliche Wahrheit bis zur Irreführung verfälschen. Die wirklichen Tatsachen zeichnen sich durch ihre Individualität aus; überspitzt könnte man sagen, daß das wirkliche Bild sozusagen auf lauter Ausnahmen von der Regel beruhe, und mithin die absolute Wirklichkeit den vorherrschenden Charakter der Irregularität habe. (JUNG 1964, 10)
Chancen einer stochastischen Perspektive
31
Über den schon in 2.1.3 (ab Seite 17) thematisierten Punkt hinaus, dass die Dialektometrie nicht die Variation, sondern einen Idiolekt pro Ort misst,32 ist demnach noch etwas anderes nachteilig: Aus den aggregierten Daten wird nicht mehr klar, welche Variablen dieser allgemeinen Tendenz, die im Aggregat erscheint, überhaupt entsprechen und welche nicht.33 Nicht nur die Bedeutung des einzelnen Sprechers, seiner Interaktion mit anderen Sprechern und der Population als Ganzes bleibt außen vor, auch die individuelle Gestalt der Einzelvariablen wird aus dem Gesamtbild ausgeklammert. Das heißt jedoch nicht, dass man sich in der Konsequenz wieder auf eine strikt qualitative Sichtweise beschränken muss; Lösung des Dilemmas kann eine prinzipiell quantitative Perspektive sein, die nicht nur globale Durchschnittswerte, sondern weiterführende statistische Informationen über die Masse an Einzelphänomenen bereitstellt: Welche Variablen weichen wie weit vom Mittel ab? Lässt sich die Gesamtvariation in gegenstands- / eigenschaftsadäquate Untergruppen teilen? Weisen die vom Aggregat unterdrückten Ausreißer Gemeinsamkeiten auf? 2.3
CHANCEN EINER STOCHASTISCHEN PERSPEKTIVE 2.3.1
Desiderat
In der Gesamtschau führt dies dazu, dass die Basis für eine deskriptive (sowie eine auf sie aufbauende inferierende) Variationslinguistik eine Perspektive sein muss, die ein dynamisches, komplexes System adäquat erfassen kann.34 Diese Perspektive kann nur quantitativer Art sein,35 und das heißt hier, dass stochastische Verteilungen, Wahrscheinlichkeiten erfasst werden müssen, die einen probabilistischen Blick auf die Gesamtgestalt ermöglichen, vgl. auch ALTMANN (1985) sowie CROFT (2000): […] we can often restrict ourselves to static relations without great loss. There is a large number of problems of this kind. One can perform such research work for years at the cost of remaining on the mere surface of linguistic analysis. […] It then turns out to be necessary to express the (stochastic) dependencies by means of (probability) functions. (ALTMANN 1985, 186) 32 Was für die Ethnologie gilt, gilt auch für die Variationslinguistik: „Der Ort der Untersuchung ist nicht der Gegenstand der Untersuchung. Ethnologen untersuchen nicht Dörfer (Stämme, Städte, Wohnbezirke…), sie untersuchen in Dörfern“ (GEERTZ 2003, 32). 33 Diese Beobachtung ist kein Novum dieser Arbeit: Es existieren bereits einige neuere Ansätze innerhalb der Dialektometrie, die versuchen, diese Lücke zumindest teilweise zu schließen. Auf einige von ihnen komme ich in Abschnitt 2.3.3, ab Seite 36, zu sprechen. 34 Man vergleiche entsprechend WILDGEN / PLATH (2005, 703), die diese Schlussfolgerung aus der Metaanalyse der Daten von LABOV (1994; 2001) ziehen. 35 Das lässt sich am besten durch eine Analogie verdeutlichen: Wer über die Mischung zweier Flüssigkeiten etwas aussagen will, kann keine Einzelfallstudie zu jedem beteiligten Molekül beider Flüssigkeiten anfertigen, sondern muss auf Basis von grundsätzlichen Eigenschaften und Interaktionen der einzelnen Moleküle Angaben zur Gesamtheit machen, und zwar auf statistischer Ebene.
32
Heranführung: Vom Einzelbeleg zur Varietät Probabilistic explanations are particularly effective when the object of study is a population: a gene pool or a population of organisms, for example – or a population of speakers, or of utterances. Both speakers and utterances form populations, and that is what allows probabilistic mechanisms of language change to be effective explanations. (CROFT 2000, 3)
Da die dynamischen Theorien zu Variation und Wandel jedoch weitgehend den Raum als Dimension oder Faktor vernachlässigen – man vergleiche z. B. CROFT (2000, 54), der die soziale und temporale Abhängigkeit des Wandels betont, den Raum aber ignoriert (vgl. dazu ebenfalls kritisch PICKL 2013a, 43) –, sei besonders darauf hingewiesen, dass es darüber hinaus einer dezidiert raumorientierten Methodik bedarf. Die ersten beiden Abschnitte dieses Kapitels waren gegliedert durch den Schritt von der Einzelvariable zum Aggregat, dann vom Individuum zur Population, abschließend von der Interaktion zum System; für die Herleitung der stochastischen Perspektive drehe ich – wegen der besonderen Bedeutung des Raums für den vorliegenden Ansatz – die Reihenfolge um. Dreh- und Angelpunkt bleibt, auf welcher Ebene wir Variation messen und für welche Ebene wir sie annehmen: Wir messen Einzelvariablen an Individuen, zielen aber auf das durch Interaktion der Individuen entstehende System aller Variablen ab (siehe Abbildung 5, Seite 27). Interaktion und Population haben einen klar geografischen Aspekt: sie sind Erscheinungen von immanent diatopischer Natur, und zwar auf der Ebene der Variablen. Interaktion und Population sollten dementsprechend pro Variable berücksichtigt werden, nicht erst global. Die einzelnen Variablen, deren Raumverteilung eine Konsequenz der Interaktion und Population ist, müssen anschließend gesamt, aber auch gesondert behandelt werden können. Das führt dazu, dass zunächst nicht aggregiert, sondern ein Korpus aus allen Variablen (in der Form von Einzelkarten) gebildet wird. Auf diese Weise bleibt die volle Variabilität der Daten grundsätzlich stets zugriffsbereit (auch wenn einzelne Verfahren, die in Kapitel 3 vorgestellt werden, durchaus zu einem späteren Zeitpunkt Daten aggregieren). 2.3.2
Probabilisierung der Variationsdimensionen36
Der Schlüssel zur Berücksichtigung der Interaktion liegt in der Perspektive, die Einzelbelege probabilistisch in Bezug auf die Variable zu interpretieren: Die an einem Ort erhobenen Stichproben sind jeweils mit einer gewissen Wahrscheinlichkeit repräsentativ für die tatsächlich vorhandene Variation. Im Rahmen einer Erhebung zur regionalen Variation werden aus einer extrem großen Datenmenge – der kompletten Anzahl aller Äußerungen jedes einzelnen Sprechers, der Idiolekte der Gesamtpopulation – Stichproben genommen (vgl. LIVINGSTONE 2002, 101). Obwohl in der Variationslinguistik (sowohl in der Theorie als auch in der Praxis) große Anstrengungen unternommen wurden und werden, um eine möglichst hohe 36 Teile dieses Abschnitts lehnen sich an RUMPF / PICKL / ELSPAß / KÖNIG / SCHMIDT (2009) sowie PRÖLL (2014) an.
Chancen einer stochastischen Perspektive
33
Repräsentativität dieser Stichproben für die Gesamtvariation zu gewährleisten,37 ist dennoch in jedem Fall mit wesentlichen Einschränkungen zu rechnen: [T]he data obtained in the surveys do not faithfully reflect the „real“ situation at the record locations. Even if we concede that the records are more than regular statistical samples […], we have to acknowledge the fact that the data are subject to a certain amount of random fluctuation. (RUMPF / PICKL / ELSPAß / KÖNIG / SCHMIDT 2009, 282)
Das führt zur folgenden Perspektive: Wenn man einen Einzelbeleg an einem Ort betrachtet und viele umliegende Orte dieselbe Variante aufweisen, hat der Beleg eine relativ hohe Glaubwürdigkeit bzw. Wahrscheinlichkeit; haben jedoch alle umliegenden Orte eine andere Variante, ist naheliegend, dass der Beleg einen Ausreißer darstellt. Das heißt, dass kein Einzelbeleg einfach zu 100 % als repräsentativ angesehen wird, stattdessen wird das Umfeld – also die potentielle Interaktion der Population – mit einbezogen. Je näher sich zwei Messpunkte sind, desto eher wird man einen gewissen Grad an Übereinstimmung zwischen ihnen vermuten.38 Die Stärke eines Belegs bzw. das Gewicht, die Wahrscheinlichkeit, die wir ihm zubilligen, hängt also von seinem Umfeld ab. COSERIU (1974, 122–123) betont, dass die oft postulierte „Gradualität“ des Sprachwandels quantitativer Art ist: Die relativen Gebrauchsfrequenzen von Variante V1 und V2 verschieben sich über die Phase des Wandels hinweg (vgl. auch BÜCHERL 1999, 152–153). Dies beginnt beim ausschließlichen Gebrauch von Variante V1 zum Initialpunkt des Wandels und führt zur Phase des Auftretens und der Zunahme der Frequenz von Variante V2. Der hypothetische „Endpunkt“ eines Wandelprozesses kann – falls man als „Ende“ eines Wandelprozesses ein lokal stabiles System betrachtet – ebenso das völlige Verschwinden von Variante V1, also der ausschließliche Gebrauch von Variante V2, als auch die Erfolglosigkeit der Innovation, also der Verlust von Variante V2 unter wiederhergestellter Dominanz von Variante V1, sein. Für den „synchronen Schnitt“ durch den Wandelprozess39 heißt dies, dass zum beobachteten Zeitpunkt alle Varianten über alle Sprecher hinweg betrachtet in jeweils unterschiedlichen Gebrauchsfrequenzen auftreten. Bei COSERIU (1974) hat dies zunächst offenbar keine geografische Dimension, sondern gilt für einzelne Messpunkte. Abbildung 7 projiziert diese frequenzorientierte, quantitative Sicht auf Variation in den geografischen Raum hinein, sie zeigt einen (fiktiven und idealisierten) Querschnitt durch ein Kontaktgebiet zweier Varianten. In Ort A wird zu 100 % Variante V1 genutzt, in Ort D ausschließlich Variante V2. Auf dem Weg von A 37 Es mangelt hier an Zeit und Platz, um der Dichte und Kreativität dieser Ansätze gerecht zu werden. Einen Überblick über zentrale Punkte der dialektologischen Qualitätssicherung bietet KÖNIG (2010b). Zu Implikationen zur Qualitätssicherung, die direkt aus der vorliegenden Methodik erwachsen, sei auf Kapitel 6, Abschnitt 6.3 (ab Seite 167) vorverwiesen. 38 Was genau unter „Nähe“ in diesem Kontext verstanden werden kann, steht in Abschnitt 3.1.5, ab Seite 48, im Mittelpunkt 39 Dieser „Schnitt“ ist nicht gleichzusetzen mit der Enthistorisierung des Systems (vgl. oben, 2.1.3, ab Seite 18). Er geschieht im Bewusstsein, dass der zugrundeliegende Gegenstand dynamisch ist, seine Dynamik durch den Schnitt nicht verliert und ohne sie inexistent wäre.
34
Heranführung: Vom Einzelbeleg zur Varietät
nach D durchläuft man ein Gebiet, in dem beide Varianten in unterschiedlicher Frequenz im Gebrauch sind. Am Umschlagspunkt zwischen dem Gebiet, in dem Variante V1 gebräuchlicher (also „dominant“) ist und dem anderen, in dem Variante V2 dominiert, könnte man im Prinzip eine Isoglosse ziehen. Diese ist aus einem derartigen Blickwinkel aber eher ein Abfallprodukt, zentral geht es hier nicht um die Darstellung der Umschlagslinie, sondern um die Intensitäten der Varianten, also die Gebrauchsfrequenzen, nicht die Gebrauchsgrenzen (vgl. ähnlich PRÖLL 2014). Quasi nebenbei umgeht man so auch das Isoglossenproblem (siehe 2.1.1, ab Seite 13).
Abb. 7: Probabilistische Sicht auf Kontaktgebiete von Varianten.
Ich illustriere im Folgenden exemplarisch anhand der Reihenschritttheorie, inwiefern eine probabilistische Perspektive gleichzeitig interaktionelle und populationsabhängige Aspekte fassbar macht. Im Rahmen der Reihenschritttheorie wird davon ausgegangen, dass mehrere phonetische Wandelprozesse miteinander interagieren. Ändern sich die Realisierungen eines Phonems, so ändern sich – um z. B. einen Phonemzusammenfall zu vermeiden – in der Folge auch die Realisierungen eines oder mehrerer anderer Phoneme, die artikulatorisch ähnlich gelagert sind. Beim (kontinuierlichen, intern bedingten) Lautwandel treten dann im Reihenschritt qualitative Änderungen einer gesamten Reihe als „gekoppelte, parallele Weiterentwicklung zu einer neuen gekoppelten Vokalreihe“ auf, und zwar dergestalt, „daß Ausgangs- und Endstufe in einem direkten Bezugsverhältnis stehen“ (WIESINGER 1982, 147). Zum einen ist notwendig, dass die beteiligten Laute stets phonematisch distinkt bleiben und zum anderen, dass die einzelnen Wandelprozesse tatsächlich miteinander in Relation stehen (vgl. GORDON 2002, 253–254). Der Wandel führt dann im Extremfall dazu, dass nach Abschluss des Prozesses jedes Element die „Position“ im System erreicht hat, die vorher sein Nachbar innehatte. Wird eine systemische Erklärung wie diese allerdings auf nur eine Dimension (die der Variable, vgl. Abbildung 1) reduziert, werden das System und seine Elemente hypostasiert, weil die einzelne Variable, das sprechende Individuum und das gesamte Sprachsystem nicht getrennt voneinander betrachtet werden. Problematische Interpretation 1: Weil Element E1 sich zu Zeitpunkt x wandelt, muss sich (im Anschluss, zu Zeitpunkt y) Element E2 wandeln, um einen Phonemzusammenfall E1 = E2 zu vermeiden. Das wäre paradox, weil nach Abschluss des Wandels von E1 der Zusammenfall E1 = E2 bereits besteht. Einzige Triebfeder des
Chancen einer stochastischen Perspektive
35
Wandels von E2 ist es ja schließlich, den Zusammenfall mit E1 zu vermeiden (vgl. GORDON 2002, 254). Die einzelnen Elemente müssten sich also zeitgleich ändern. Dann handelt es sich aber um einen einzigen, gleichmäßigen Wandel, nicht mehrere zeitlich unterscheidbare Einzelprozesse. Die Konstruktion einer Chronologie der interdependenten Wandelprozesse impliziert also ein Nacheinander der Einzelprozesse, das es nicht geben muss (und vielleicht nicht einmal geben kann). Problematische Interpretation 2: Weil sich im System an einer Stelle etwas ändert, ist das System für eine gewisse Zeit in irgendeiner Hinsicht „schlecht“ und muss sich erst wieder regenerieren, indem es sich an mehreren anderen Stellen selbsttätig ändert. Abgesehen von der unterschwelligen Implikation, der Wandel eines Systems wäre zunächst immer eine Verschlechterung, zieht eine solche Blickrichtung unweigerlich nach sich, dass in Gebieten mit Lautwandelerscheinungen „schlechter“ gesprochen wird als in statischen Gebieten.40 Diese Annahme von „schlechten“ Systemen beruht auf einer Gleichsetzung von Individuum und Gemeinschaft. Ein Individuum hat kein schlechtes System, weil dies seine Kommunikationsfähigkeit massiv beeinträchtigen würde. Die Population hat auch kein schlechtes System, sie setzt sich aus einer Vielzahl von Individualsystemen, von Idiolekten zusammen (man vergleiche etwa die Analysen im ANAE, dem „Atlas of North American English“). Der Wandel von einem System zum anderen ist innerhalb der Population ein stochastischer Prozess: Vereinfacht dargestellt hat zu jedem Zeitpunkt jeweils eine gewisse Anzahl Individuen der Gesamtpopulation System S1, der Rest System S2. Beide Systeme sind voll funktional. Der Wandelprozess ist der Wandel des Frequenzverhältnisses von System S1 zu System S2. Nimmt man an einem bestimmten Zeitpunkt eine Messung vor, zeigt die zeitliche Dynamik des Prozesses einen Reflex in der Frequenzverteilung des Phänomens.41 Sprachatlanten enthalten aber keine Informationen über die Gebrauchsfrequenz einer Variante in der Population. Wir inferieren diese Frequenz, indem wir eine sogenannte Intensitätsschätzung durchführen. Die Belege an den einzelnen Messpunkten werden als punktuelle Realisierung bzw. Messung einer quasi „hinter“ den Messdaten stehenden, kontinuierlichen Verteilung gesehen. In der Folge schätzt man die Wahrscheinlichkeit, mit der ein Beleg angegeben worden wäre, wenn man alle Personen aus dem Ort bzw. dem Umfeld des Ortes befragt hätte (siehe dazu im Detail 3.1.6, ab Seite 51). In dieses Verfahren fließen auch Mehrfachbelege, also „konkurrierende“ Formen an einem Belegort, ein. Die Probabilisierung umgeht dabei die Frage, für was diese Mehrfachbelege stehen, ebenso wie das theoretische Problem verschiedener Modelle der „Lokalisierung“ der Variation bzw. der Repräsentativität – dies 40 Eine ähnliche Implikation zeigte sich schon oben, im Rahmen der Diskussion um die postulierte Homogenität von Ortsdialekten und den Status von Übergangsgebieten (siehe 2.2.5, ab Seite 28). 41 Selbstredend weiß man in der Dialektologie schon länger, dass dieser Reflex der Dynamik bisweilen auch schon allein durch die Kartierung nominaler Daten aus der Raumstruktur hervortritt, man siehe HAAS (2010) oder die Ausführungen zur Interpretation von geografischen Mustern auf Karten in GOOSSENS (1977, 74–85) und KÖNIG (2001: 141). Die Probabilisierung hilft jedoch, diese Tendenz noch zu verstärken.
36
Heranführung: Vom Einzelbeleg zur Varietät
bedarf einer näheren Erläuterung. Variation an nur einem Messpunkt ist prinzipiell aus verschiedenen Gründen möglich: a) An einem Ort nutzt bei zwei Varianten ein gewisser Prozentsatz an Sprechern immer die eine Variante, der Rest immer die andere. b) In den Sprechern koexistieren beide Varianten, die mit jeweils ihrer eigenen (sprecher- und situationsabhängigen) Wahrscheinlichkeit genutzt werden. c) Ein Teil der Sprecher folgt a), ein anderer b) (das dürfte der wahrscheinlichste Fall sein). Dieses Problem wird hier nicht gelöst – das ist aber auch nicht notwendig. Die Probabilisierung erzeugt aus Einzelmessungen Gesamtwerte für jeden Ort, sie inferiert aber nichts über den bzw. die einzelnen Sprecher.42 Die Frage nach der Natur der individuellen Variation wird also umgangen, jeder Einzelbeleg jeder Gewährsperson behält aber weiterhin in seiner Gänze Einfluss auf das Gesamtergebnis. 2.3.3
Varietätenkonstruktion
Geht man davon aus, dass Sprache ein komplexes System darstellt, „whose functioning is due to bottom-up and non-linear interactions of local components“ (CANGELOSI / PARISI 2002, 25), ein System also, das auf leichte Änderungen der Ausgangsbedingungen in den darauf aufbauenden, höheren Systemebenen äußerst sensibel reagieren kann, dann wird klar, welche Bedeutung der Umgang mit dem Einzelbeleg für alle höherrangigen Interpretationen nach sich zieht. Daher sind die im Rahmen unseres Projekts Neue Dialektometrie entwickelten Verfahren im Gegensatz zu den schon länger etablierten Methoden der Dialektometrie in den Worten PICKLS (2013a, 16) „darauf zugeschnitten, die individuelle Variation einzelner Variablen zu bewahren, gesondert auszuwerten und zu vergleichen, um den durch Aggregation herbeigeführten Variationskollaps zu vermeiden.“ Antriebsfeder dafür ist hauptsächlich eine andere wissenschaftliche Interessenlage, nicht der Zweifel an der grundsätzlichen Legitimität anderer Verfahren. Der stochastische Zugang soll die bestehende quantitative Dialektologie nicht ersetzen (das könnte er auch gar nicht), sondern sie um eine variantenorientiertere Perspektive bereichern, die die interaktionelle, dynamische Natur des Sprachsystems im Raum stärker als bisher möglich abbilden kann. Vor allem die „Groninger Schule“ der Dialektometrie teilt prinzipiell die Ansicht, dass Einzelvariablen relevante Informationen bereitstellen; im Laufe des letzten Jahrzehnts häufen sich in ihrem Umfeld Studien, die trotz einer grundsätzlich aggregativen Perspektive auf Einzelinformationen zurückgreifen. So analysiert HEERINGA (2004, 266–271), welche phonetischen Variablen am stärksten mit 42 Das heißt auch, dass die Ebene der Empirie nicht verlassen werden muss: Die Einzelmessung und die Gesamtheit des Sprachgebrauchs an einem Ort sind (zumindest theoretisch) empirisch beobachtbare Größen, die interne Variation eines Sprechers aber nicht.
Chancen einer stochastischen Perspektive
37
dem aggregierten Gesamtbild der Varietät korrelieren; WIELING (2012, 49–67) clustert niederländische Dialektgebiete (ebenfalls auf Basis des Aggregats lautlicher Unterschiede) mittels eines Verfahrens, das zeigt, wie stark die einzelnen Laute zur Zusammengehörigkeit des geclusterten Gebiets beitragen. Dass sich diese Studien ausschließlich mit phonetischem Material beschäftigen, ist kein Zufall: Da lautliche Werte kontinuierlicher Natur sind (bzw. in kontinuierlichen Werten ausgedrückt werden können), lassen sie sich unkomplizierter zueinander in Relation setzen. Auf (nominalskalierte) lexikalische, morphematische und syntaktische Variablen sind die Techniken daher nicht direkt anwendbar. GRIEVE / SPEELMAN / GEERAERTS (2011) wählen daher einen korpuslinguistischen Weg, um mit Frequenzwerten arbeiten zu können – die Daten in Sprachatlanten enthalten allerdings meist keine Frequenzinformationen und sind strikt nominaler Natur (vgl. auch MESCHENMOSER / PRÖLL 2012a, 178–179). Durch die Intensitätsschätzung werden die nominalen Daten jedoch in (kontinuierliche) Frequenzwerte umgewandelt. Somit werden nicht nur Variablen der einzelnen Subsysteme (Wortschatz, Lautung, Formen) direkt miteinander vergleichbar gemacht, es können auch die individuellen räumlichen und statistischen Eigenschaften jedes Phänomens einzeln ermittelt werden. Der Blick wird erst auf die Varietät gerichtet, nachdem man ein Korpus an Variablen (in der Form von einzelnen Phänomenkarten bzw. ihrer individuellen geostatistischen Eigenschaften) gebildet hat, in dem der interaktionale / populationsbedingte Aspekt für jede Einzelvariable per Intensitätsschätzung berücksichtigt wurde. Operationen, die sich mit mehreren Variablen gleichzeitig beschäftigen, werden anhand dieses Korpus durchgeführt. Im Detail werden die einzelnen Verfahren im Verlauf des nachfolgenden Kapitels (3) von technischer Seite erläutert und anschließend in den Kapiteln 4–6 in der Praxis erprobt. Sie sollen – wie es auch schon für die Dialektometrie gilt – dominante Strukturen in Sprachatlanten aufdecken, darüber hinaus aber auch die interne, verzweigte Feinstruktur der Daten fassen können. Grob gesagt soll es möglich sein, – die einzelnen Variablen nach a) ihren statistischen Eigenschaften sowie b) ihrer Raumstruktur analysieren und in Subsysteme gruppieren zu können, – die so ermittelten Subsysteme a) zueinander in Relation setzen und b) ihren Einfluss auf das Gesamtsystem fassen zu können sowie – wiederkehrende Muster, Raumstrukturen und Wirkfaktoren aus der Masse der Variablen herausfiltern, isolieren und auf ihren Ursprung zurückführen zu können.43
43 Zusätzlich eröffnet die wahrscheinlichkeitsbasierte Perspektive auch Möglichkeiten der Qualitätssicherung und Fehlerkontrolle in der Variationslinguistik. Auf diesen Aspekt werde ich zum Abschluss der Arbeit in Kapitel 6, Abschnitt 6.3 (ab Seite 167) noch ausführlicher eingehen.
38
Heranführung: Vom Einzelbeleg zur Varietät
Dazu bedarf es einer Methodik, die die Probleme impressionistischer ad-hocVerfahren (mangelnde Objektivität / Reliabilität / Validität etc.) vermeidet. Der Lösungsansatz, der dieser Arbeit zugrunde liegt, fußt auf der Anwendung von quantitativen Methoden, die der Disziplin der stochastischen Bildanalyse entstammen.
3
TECHNIK: STOCHASTISCHE BILDANALYSE It’s more fun to compute. (Kraftwerk)
Dieses Kapitel befasst sich gezielt mit den technischen Grundlagen und der Anpassung geostatistischer Verfahren an den Bereich der Variationslinguistik. Das Verständnis dieser Aspekte ist maßgebliche Voraussetzung dafür, die Anwendung der Techniken auf konkretes Datenmaterial, wie es in den nachfolgenden Kapiteln im Vordergrund steht, zu durchdringen. Zunächst wird dargestellt, wie die punktuellen Daten von Sprachatlanten als wahrscheinlichkeitsbasierte Flächenkarten interpretiert werden können (Abschnitt 3.1) und welche statistischen Werte dieser Karten für weitere Analysen relevant sind (Abschnitt 3.2). Nachfolgend (in Abschnitt 3.3) werden Methoden aufgezeigt, wie und nach welchen Kriterien sich große Datensätze (im vorliegenden Fall die Karten eines Sprachatlanten) mittels sogenanntem Clustern in Gruppen differenzieren lassen. Abschließend (Abschnitt 3.4) steht mit der Faktorenanalyse ein Verfahren zur Identifikation und Interpretation von globalen Faktoren und Tendenzen innerhalb der Daten im Mittelpunkt. 3.1
DATENGRUNDLAGE UND VORBEREITENDE SCHRITTE DER DATENVERARBEITUNG
Um Daten aus Dialekterhebungen mit Methoden der stochastischen Bildanalyse analysieren zu können, müssen a) gewisse Grundanforderungen an die Daten erfüllt sein sowie b) einige Aufbereitungsschritte an den Daten durchgeführt werden. Die Grundanforderungen sind leicht zu beschreiben und ähnlich leicht zu erfüllen: Die Methoden, die im Laufe dieses Kapitels expliziert werden, sind generell auf jede Form von punktuellen Daten anwendbar, die räumliche Verteilung aufweisen. Zu Demonstrationszwecken werden sie hier an Daten des „Sprachatlas von Bayerisch-Schwaben“ exemplifiziert. Die Aufbereitungsschritte sind komplexer: Für die ursprünglichen Publikationen wurden die Daten in Form von Punktsymbolkarten visualisiert. Diese sind nicht direkt mit stochastischen Methoden verarbeitbar; die mathematischen Operationen der folgenden Kapitel können nur an Datensätzen durchgeführt werden, nicht auf Basis der Visualisierungen. Dieses Kapitel skizziert die nötigen Grundlagen und Schritte und diskutiert relevante Möglichkeiten und Beschränkungen der Verarbeitung der Daten. Hier zunächst ein kurzer Überblick über den Gesamtprozess, dessen Struktur auch dieses Kapitel folgt:
40 –
Technik: Stochastische Bildanalyse
Die Daten müssen grundsätzlich geeignet sein (siehe 3.1.1, Quellen und Inhalte der Beispieldaten). – Die Daten werden in einer maschinenlesbaren Datenbank organisiert (3.1.2, Datenbankdesign). – Eventuelle Mehrfachbelege an einem Ort werden zueinander in Verhältnis gesetzt (gewichtet) (3.1.3, Gewichtung). – Die Belege werden zu Kategorien zusammengefasst (3.1.4, Skalenniveau und Kategorisierung der Varianten). – Der Grad der Nähe der jeweiligen Messpunkte zueinander wird festgelegt (3.1.5, Distanzmaße). – Die ursprünglich punktuellen Belege werden mittels Intensitätsschätzung als Flächeninformation interpretiert (3.1.6, Dichteschätzung). – Die als Fläche geschätzten Daten werden als Karten visualisiert (3.1.7, Generierung und Visualisierung verschiedener Kartentypen). Der Gesamtprozess wandelt also punktuell vorliegende empirische Daten mittels Intensitätsschätzung in probabilistische Flächeninformation um. Solch ein Vorgehen lässt sich wie folgt legitimieren: Generell ist anzunehmen, dass Daten, die sich in irgendeiner Beziehung „nahe“ sind und thematisch miteinander zu tun haben, einander beeinflussen (bzw. zumindest gemeinsam von einer anderen Größe beeinflusst werden). Auch speziell für die Belege aus Sprachatlanten ist das eine plausible Interpretation. Liegt an einem Ort Variante V1 vor, an allen umliegenden Orten aber Variante V2, dann ist die Wahrscheinlichkeit gegeben, dass die Variante V1 „nur“ einen Ausreißer in einem von V2 dominierten Gebiet darstellt, oder anders formuliert: Hätte man in einer Erhebung mehr als nur eine Gewährsperson am Ort befragt, dann hätten mit gewisser Wahrscheinlichkeit auch einige Variante V2 geäußert. Umgekehrt ist davon auszugehen, dass in den umliegenden Orten mit V2 als erhobener Variante auch eine (vermutlich geringere, aber vorhandene) Anzahl an Gewährspersonen mit V1 geantwortet hätte (vgl. RUMPF / PICKL / ELSPAß / KÖNIG / SCHMIDT 2009, 282). Wenn man an einzelnen Messpunkten (also etwa Orten eines Untersuchungsgebiets) Stichproben nimmt (so wie es in Dialekterhebungen gemacht wird), kann man zunächst lediglich Aussagen über jede einzelne Messung treffen. Hintergrund einer solchen Erhebung ist jedoch, dass man zwischen den gemessenen Stichproben einen Zusammenhang vermutet, dass gewissermaßen „hinter“ den erhobenen Stichproben eine Verteilung existieren muss, deren wirkliche Gestalt uns nicht bekannt ist. Für dieses Problem hat sich in einer Vielzahl von Disziplinen der Einsatz sogenannter Dichte- bzw. Intensitätsschätzungen bewährt, in dessen Rahmen die Messpunkte als ein sogenannter zufälliger Punktprozess gesehen werden (siehe ausführlicher RUMPF 2010, 19–24). Daher wird – weil man eine Aussage über den Zusammenhang der einzelnen Messungen treffen will – die unbekannte Dichte der jeweiligen Wahrscheinlichkeit für einen gewissen Wert aus den einzelnen Stichproben geschätzt; aus Stichproben einer Zufallsvariable gewinnt man dadurch eine geglättete, stetige Wahrscheinlichkeitsverteilung (vgl. RUMPF 2010, 49).
Datengrundlage und vorbereitende Schritte der Datenverarbeitung
41
Das Verfahren wurde über einen längeren Zeitraum im Rahmen des Projekts Neue Dialektometrie mit Methoden der stochastischen Bildanalyse erfolgreich erprobt und bereits mehrfach publiziert (RUMPF / PICKL / ELSPAß / KÖNIG / SCHMIDT 2009; RUMPF 2010; PICKL / RUMPF 2011, 2012; PICKL 2013a). Deshalb wird es hier nicht erneut in seiner vollen technischen Tiefe hergeleitet und erläutert, sondern lediglich in einem Umfang, der das nötige Hintergrundwissen für die technischen und anwendungsorientierten Partien dieser Arbeit, die auf dieses Verfahren aufbauen, liefert sowie den aktuellen Stand der Ausweitung bzw. Weiterentwicklung dokumentiert. 3.1.1
Quellen und Inhalte der Beispieldaten
Der „Sprachatlas von Bayerisch-Schwaben“ (im Folgenden kurz SBS) entstand in den Jahren 1984 bis 2009 als DFG-gefördertes Projekt der Universität Augsburg unter der Leitung von Werner König. Das Material des SBS wurde in Form einer direkten Befragung durch Exploratoren erhoben (vgl. detaillierter SBS 1, 24–25 und 29–32), die Antworten wurden direkt im Feld mittels eines Systems, dass sich an den Teuthonista-Vorgaben (siehe TEUCHERT 1924) orientiert, in die Fragebücher transkribiert und anschließend elektronisch erfasst. Aus den Antworten auf die insgesamt 2267 Fragen (KÖNIG 1988b, 171) des Fragebuchs wurden Karten zu Wortschatz, Lautung und Formen erstellt, die in 13 Bänden (plus einem Registerband) publiziert wurden (vgl. die Einzelauflistung der Bände und ihrer Bearbeiter im Literaturverzeichnis unter dem Eintrag SBS). Das Ortsnetz umfasst 272 Punkte auf einer Fläche von ca. 11300 Quadratkilometern (SBS 1, 17);44 abgedeckt wird der Regierungsbezirk Schwaben (mit Ausnahme des Südens, der zum Untersuchungsgebiet des „Vorarlberger Sprachatlas“, kurz VALTS, gehört) sowie ein Teil der im Osten anschließenden Regierungsbezirke Mittelfranken und Oberbayern, wodurch sich das Untersuchungsgebiet mit dem „Sprachatlas von Mittelfranken“ (SMF) und dem „Sprachatlas von Oberbayern“ (SOB) überschneidet (siehe Abbildung 8).
44 Die Ortsliste sowie eine Grundkarte finden sich im Anhang 1, ab Seite 189.
42
Technik: Stochastische Bildanalyse
Abb. 8: SBS-Untersuchungsgebiet und benachbarte Regionalatlanten.
In Tabelle 1 ist aufgelistet, wie sich die einzelnen Kategorien auf die Bände verteilen und wie viele Karten aus den Bänden jeweils in das Korpus dieser Arbeit eingegangen sind. Der Einführungsband ist nicht angeführt, da er keine Karten zu sprachlichen Variablen enthält. 2 Wortschatz 134 Lautung Formen -
3
4
106 197 -
∑ Tab. 1: Kartenzahlen im Korpus.
5
6
7
8
9
10
11
193 -
183
327 -
97 -
357
152 4 -
126 146 -
12
13
∑
128 783 4 831 1 541 2155
Datengrundlage und vorbereitende Schritte der Datenverarbeitung
43
Die Zahl der berücksichtigten Karten ist geringer als die der Printbände – aus inhaltlichen, technischen wie auch logistischen Gründen konnten nicht alle Datensätze übertragen werden. Systematisch ausgeschlossen wurden Karten, die Informationen abseits der Bereiche Wortschatz/Lautung/Formen bereitstellen (den mit Abstand größten Anteil machen dabei die zirka 150 Karten zu Vorkommen, Bedeutung und Sachtypen, die mit einer Bezeichnung verbunden sind, aus). Eine weitere Teilmenge der Karten schied aus, weil auf ihnen mehrere Variablen gemeinsam kartiert wurden; diese Karten ließen sich nicht sinnvoll auf einer einzigen dichtegeschätzten Flächenkarte darstellen (da sich die Varianten unterschiedlicher Variablen gegenseitig schwächen würden). Um dieses Problem zu umgehen, hätte man alle betroffenen Karten manuell in Einzelkarten zerlegen müssen, was nicht nur eine effektive Neukartierung bedeutet hätte, sondern auch die Vergleichbarkeit zu den Printbänden (schon allein in Bezug auf die Nummerierung der Karten) empfindlich geschwächt hätte. Nicht übernommen wurde ferner eine kleinere Anzahl an Karten, die in den Printbänden größtenteils leer abgedruckt wurden (weil sie lediglich Abweichungen von einem anderswo bzw. überhaupt nicht kartierten „Normalfall“ bündeln) – ein Vergleich dieser Teilkarten mit den voll kartierten Regelkarten hätte zu systematischen Abweichungen in den Auswertungen geführt, die nicht auf sprachliche, sondern auf rein kartierungstechnische Unterschiede zurückzuführen gewesen wären. Da die Originaldatensätze über einen längeren Zeitraum und von einer Vielzahl an Bearbeitern genutzt und geändert wurden (wobei immer wieder Arbeits- und Versuchsversionen zum selben ursprünglichen Datensatz entstanden), war darüber hinaus in einzelnen Fällen die schlussendlich als Karte publizierte Version als Datensatz nicht mehr eindeutig identifizierbar und musste aus Gründen der Qualitätssicherung ausgeklammert werden. 3.1.2
Datenbankdesign
Ursprünglich wurden für den SBS die Transkriptionen aus den Fragebüchern manuell in ein dBASE-Datenbanksystem übertragen. Jeder späteren Karte entsprach eine Tabelle mit 272 Spalten (für die Erhebungsorte) mal 24 Zeilen (Informationen wie etwa Name des Belegorts, Koordinaten auf der Karte, Explorator, Belegnummer aus dem Fragebuch, etc., siehe KÖNIG 1999 für genauere Informationen). Das dBASE-System ermöglicht nach heutigen Maßstäben nur einen relativ langsamen Zugriff auf große Datenmengen; schließlich war es ursprünglich auch nicht für den gleichzeitigen Zugriff auf mehrere oder gar alle Variablen gedacht, sondern zur Speicherung der Daten pro Einzelkarte. Durch Redundanzen (z. B. doppelte Kodierung des Erhebungsorts per Name und Nummer) wird der Zugriff auch innerhalb dieser sogenannten BSA-Dateien des SBS noch zusätzlich verlangsamt (vgl. BÖHM / KUGLER 2006, 21–27).
44
Technik: Stochastische Bildanalyse
Im Rahmen der Vorverarbeitung wurden daher alle Daten in einer MySQLDatenbank zusammengefasst:45 Rückgrat dieser Datenbank (und damit aller nachfolgenden Analysen) ist die Zuordnung von Belegen zu einem Ort. Die Datenbank enthält die volle, ursprüngliche Varianz des Datensatzes, das System greift auf die Verknüpfung zwischen Ortspunkten und Varianten zurück. Für jede Generalisierung, d. h. jede Zusammenfassung der Daten zu abstrakteren Kategorien (siehe unten, 3.1.4), ist eine eigene Tabelle vorhanden, die Varianten zusammenfasst. 3.1.3 Gewichtung An jedem der 272 Erhebungsorte wurde mindestens eine Gewährsperson befragt, im Schnitt 3,5 (d. h. pro Ort, nicht pro Frage; siehe näher SBS 1, 17–22). Mehrfachantworten waren grundsätzlich möglich, es kann demnach mehrere Belege für einen Ort geben (siehe zur linguistischen Relevanz Abschnitt 2.3.2, ab Seite 32); das erfordert eine Gewichtung der Belege. Da unter den Belegen an einem Ort keine Hierarchie festgelegt wurde, werden sie als gleichwertig betrachtet: Wurde an Ort A Variante V1 geäußert, entspricht das 100 %, wurden die Varianten V1 und V2 genannt, werden ihnen jeweils 50 % zugesprochen, bei drei Varianten V1, V2 und V3 jeweils 33 % (mehr als drei Antworten liegen niemals vor; vgl. ausführlicher PICKL 2013a, 83–84). Diese Werte sind später (d. h. während den Schritten, die in Abschnitt 3.1.6 thematisiert werden) für die relative Gewichtung der einzelnen Varianten zueinander nötig. 3.1.4
Skalenniveau und Kategorisierung der Varianten
Prinzipiell sind alle Daten nominalskaliert, d. h. zwei Varianten lassen sich nur im Hinblick darauf unterscheiden, ob sie identisch oder abweichend voneinander sind; graduelle Unterschiede bzw. Hierarchieabstufungen der Varianten sind aus den Daten selbst nicht gegeben (zur Diskussion um Lautkarten als möglichem Sonderfall siehe unten). Für lexikalische Variation ist das anhand eines Beispiels intuitiv sofort nachvollziehbar: Die Varianten Spälter und Spreißel für einen Holzsplitter in der Haut (SBS 2, Karte 28) lassen sich in keine begründbare Reihenfolge oder Nähebeziehung zueinander setzen – sie sind einfach nur verschieden und demnach nominalskaliert. Da Karten mit phonetischer Information auf kategorial anders strukturierten Daten als Lexemkarten aufbauen, stellen sich besondere Fragen und Anforderun45 Aaron Spettl bin ich zu Dank dafür verpflichtet, dass er nicht nur die im Projekt ursprünglich entwickelte Datenbankstruktur (nach BÖHM / KUGLER 2006, in PICKL 2013a noch so genutzt) optimiert, sondern darüber hinaus auch die Anpassung und Integration aller hier im Folgenden vorgestellten Techniken (die von verschiedenen Autoren – zum Teil auch in verschiedenen Programmiersprachen – entwickelt wurden) in ein einheitliches, auch für InformatikLaien (wie den Autor dieser Arbeit) nutzbares Softwaresystem (GeoLing, herunterladbar unter ) überwacht hat.
Datengrundlage und vorbereitende Schritte der Datenverarbeitung
45
gen an die Verwendung der Daten, die sich zentral um den Punkt bewegen, ob die Informationen in Lautkarten dasselbe Skalenniveau wie Lexem- und Formenkarten aufweisen und damit analog zu ihnen behandelt werden können. Die „Groninger Schule“ der Dialektometrie arbeitet erfolgreich mit Methoden zur phonetischen Abstandsmessung mittels der sogenannten Levenshtein-Distanz (in der Folge von KESSLER 1995 popularisiert, am prominentesten wohl in HEERINGA 2004 sowie NERBONNE / HEERINGA 2010 umgesetzt), was zu Recht als Fortschritt betrachtet wird: Earlier work in dialectometry analyzed the data at a nominal level, where each pair of linguistic items was measured as the same or different, while the application of Levenshtein distance allows numeric characterizations per pair of pronunciations to be obtained. (NERBONNE 2010a, 481)
Die dabei entstehenden Karten stellen Übergänge dar – dem Leser dieser Arbeit stellt sich daher eventuell die Frage, warum in den folgenden phonetischen Karten keine lautlichen Übergänge modelliert wurden, wenn Verfahren dazu augenscheinlich existieren. Zunächst sei daher betont, dass auch HEERINGA (2004) keine Variantenübergänge erfasst, sondern Varietätenübergänge: Der phonetische Abstand vieler einzelner Varianten wird gemessen, diese Werte werden aggregiert und anschließend visualisiert. Es wird also keine Aussage zur Qualität einzelner Variablen getroffen, sondern die Ähnlichkeit kompletter Varietäten erfasst, wobei der Einfluss einer einzelnen Variable auf das Gesamtbild von ihrem phonetischen Abstand zum Vergleichsmoment abhängt. Phonetische Abstandsmessungen im Rahmen eines einzelphänomenbezogenen Vorgehens sind jedoch problematisch; genauer thematisiert wird dies weiter unten. Eine vorgeschaltete Frage ist aber, ob phonetische Werte – im Gegensatz zu lexikalischen und morphologischen – auf der Varianten- bzw. Variablenebene überhaupt sinnvoll interpolierbar sind. Während die Wahl eines bestimmten Lexems oder eines anderen eine digitale Situation darstellt, haben lautliche Äußerungen einen analogen Charakter, da es eine unendliche Anzahl von möglichen Zwischenschritten zwischen zwei Äußerungen geben kann. Zwischen Frikadelle und Fleischküchle lässt sich zwar keine Skala anlegen, phonetische Realisierungen zwischen den beiden Lautidealen, die man als [ɛ] und [æ] transkribiert, könnten aber theoretisch mittels unendlich feiner Zwischenschritte beschrieben werden. Wenn Ort A Variante [ɛ] und Ort D Variante [æ] aufweist, ermöglicht dies dann auch eine (qualitative) Aussage für Orte, die geografisch zwischen A und D liegen? Oder, anders gefragt: Was für eine empirische Realität haben Übergangsgebiete zwischen zwei lautlichen Varianten? Die Annahme von Zwischenschritten müsste in der Anwendung aussehen wie in Abbildung 9:
Abb. 9: Hypothetisches Modell für die Interpolation von Artikulationen.
46
Technik: Stochastische Bildanalyse
Problematisch ist an einem solchen Modell mehreres. Zum einen impliziert es einen falschen Blick auf die Relation zwischen synchronischer und diachronischer Beschreibungsebene. Die Varianten in Ort A und Ort D können sich historisch aus demselben Element gespalten haben, wie es die interpolierten Zwischenschritte nahelegen; sie müssen es aber nicht. Daher sind die beobachteten Varianten nur als Entsprechungen auf synchroner Ebene interpretierbar, nicht als Wandelprozess (vgl. auch NERBONNE / HEERINGA 2010, 553). Zum anderen gibt es zunächst keinen Grund, anzunehmen, dass sich die Varianten der Orte A und D auf irgendeine Art beeinflussen. Nur unter dieser Annahme wäre es sinnvoll, davon auszugehen, dass dazwischen liegende Areale qualitative Übergangsgebiete darstellen. Wenn wir (in Übereinstimmung mit COSERIU 1974, 123) von Übergangsgebieten quantitativer Art ausgehen, in denen die Varianten in jeweils unterschiedlichen Frequenzen auftreten (siehe 2.3.2, ab Seite 32), dann impliziert ein solcher Betrachtungswinkel praktischerweise auch, dass lautlicher Wandel – zumindest auf der Betrachtungsebene der einzelnen Variable – nach demselben Prinzip wie lexikalische / morphologische / syntaktische Variation beschrieben werden kann bzw. muss, nämlich einem digitalen. Kurz gesagt: Wir interpolieren Gebrauchswahrscheinlichkeiten, also quantitative Information, keine qualitative. Zusätzlich sind phonetische Sequenzvergleiche notorisch anfällig für systematische und unsystematische Fehler, die auf Kosten der Reliabilität und Validität der Methoden gehen. In aggregativen Verfahren, wie z. B. in HEERINGA (2004), eliminieren sich kleinere unsystematische Fehler im besten Fall gegenseitig (bzw. gehen im Rauschen unter);46 systematische Fehler bleiben jedoch bestehen. Im schlimmsten Fall schaukeln sie sich auf oder täuschen Zusammenhänge vor, die durch die Daten nicht gerechtfertigt sind und sich lediglich aus dem Aggregationsprozess ableiten. In nicht-aggregativen Vorgehensweisen stellen aber auch Fehler unsystematischer Art ein Problem dar, da sie nicht durch die Masse der anderen Daten zu Rauschen werden.47 Damit existieren zwei Argumente gegen eine Sonderbehandlung von Lautkarten, ein theoretisches und ein methodologisches: Von theoretischer Seite ist festzuhalten, dass die Behandlung von Lautdaten in Form von qualitativen Übergangsgebieten nicht zulässig bzw. nur in Einzelfällen (genauer: für ausgewählte Einzelorte) verantwortbar ist, da es Wandelvorgänge präsupponiert, die dem Material nicht angemessen sein müssen. Mögliche Ausnahmefälle setzen dabei je46 Vgl. hierzu auch NERBONNE (2010a, 480): „The procedure is admittedly rough, but it derives accuracy from the application to large amounts of data.“ 47 Darüber hinaus ist zwar das zugrundeliegende physikalische Signal kontinuierlich, das Transkriptionssystem aber digital. Die Skala, die für die Distanzmessung angelegt wird, projiziert die Transkriptionen zwar zurück auf die ursprüngliche Artikulation, die Daten sind dabei aber höchstens ordinalskaliert, ebenso, wie z. B. Schulnoten ordinaler Natur sind: Der Abstand zwischen einem [i] und einem [e] ist nicht zwingend gleich dem Abstand zwischen [e] und [ɛ]. Phonetische Abstandsmessungen erzeugen also streng genommen ein fiktives Intervallskalenniveau über nominalskalierte Daten, das letztlich arbiträr gebildet werden muss. Auch daher ist es wenig sinnvoll, in einem Verfahren, das auf Informationen über Einzelphänomene beruht, ein Skalenniveau vorzutäuschen, das sich aus den Daten nicht ergibt.
Datengrundlage und vorbereitende Schritte der Datenverarbeitung
47
weils eine exakte Kenntnis der vorherrschenden Bedingungen voraus, so dass eine Anwendung und Auswertung mittels der hier gegebenen Methoden lediglich bestehende Ergebnisse reproduzieren könnte – ein zyklisches „Wissen“ dieser Art scheint nicht erstrebenswert. Weiterhin sind – von methodologischer Seite aus betrachtet – die Verfahren zur qualitativen phonetischen Distanzmessung nicht geeignet, um für nicht-aggregative dialektometrische Verfahren angewandt werden zu können. Dazu tritt noch ein drittes Argument, das von der Auswertungspraxis her zu begründen ist, nämlich dass es vordringliches Ziel dieser Studie ist, Relationen bzw. Unterschiede zwischen den Raumbildern der einzelnen sprachlichen Subkorpora zu ermitteln (siehe dazu insbesondere Kapitel 5). Vergleichbarkeit ist aber nur auf Basis einer einheitlichen Datengrundlage möglich, eine verschiedenartige Behandlung der unterschiedlichen Subkorpora würde also dem Forschungsziel zuwiderlaufen. Die Nominalskalierung der Daten bildet den kleinsten gemeinsamen Nenner und wird daher auf die gesamten Daten angewandt. In der SBS-Datenbank sind den Ortspunkten jeweils Rohdaten (im Regelfall phonetische Transkriptionen) sowie eine Nummer, die für ein Punktsymbol in der Karte steht, zugewiesen.48 Die Symbole wurden vom jeweiligen Bearbeiter der Karte gezielt so gewählt, dass die relative „Nähe“ verschiedener Varianten durch optisch ähnliche oder sprechende Symbole verdeutlicht werden – allein aus der Nummer ist diese Intention aber nicht mehr erkennbar. Daher werden in einem manuellen Arbeitsschritt die einzelnen nominalskalierten Daten zu (wiederum nominalskalierten) Kategorien zusammengefasst, die die Nähebeziehungen der Belege (bzw. ihrer Symbole) in mehreren Abstraktionsebenen rekonstruieren. Es wurde versucht, sich dabei möglichst eng an die Einteilungen zu halten, die durch die Bearbeiter der jeweiligen Bände festgelegt wurden. Dies nicht zu tun, hätte zum einen die erneute manuelle Kategorisierung jedes einzelnen Belegs nach sich gezogen, zum anderen aber auch die Treue des Datensatzes zur originalen SBSPublikation empfindlich geschwächt und die detaillierten, oftmals fein abgewogenen und begründeten Entscheidungen der Bearbeiter, die über Jahre intensiv mit ihren jeweiligen Abschnitten beschäftigt waren, für nichtig erklärt. Es war aber explizit nicht der Sinn des Projekts, das zugrundeliegende Material von Grund auf neu zu erarbeiten oder bereits getroffene Entscheidungen und Interpretationen fundamental zu kritisieren. Im Gegenteil sollten die weiterführenden Methoden und Interpretation nach Möglichkeit treu zur Originalpublikation bleiben (vgl. entsprechend auch PICKL 2013a, 78). Für das Projekt wurden dafür drei verschiedene Abstraktionsebenen angesetzt, Level 1–3.49 Level 1, der niedrigste Abstraktionsgrad, fasst Varianten bzw. Symbole zusammen, die feine Unterschiede anzeigen, die über das direkte Kartenthe48 Der Zusammenhang zwischen diesen Nummern (die für den Druck der Originalpublikation dienten) und den Punktsymbolen ist im Symbolheft zum SBS (SBSSYM) dokumentiert. 49 Die verschiedenen Abstraktionsebenen, die im Rahmen des Projekts gebildet wurden, bauen aufeinander auf; das müssen sie aber nicht. Genauso gut könnten Kategorisierungen quasi „nebeneinander“ in der Datenbank verwaltet werden, z. B. eine Tabelle, die etymologisch nahe Varianten zusammenfasst, neben einer anderen, die auf der gleichen Ebene ohne Rücksicht auf Etymologien morphologische Kriterien (wie Diminutivbildung o. ä.) bündelt.
48
Technik: Stochastische Bildanalyse
ma hinausgehen (so z. B. lautliche Variation in den Lexikkarten) und die (im Regelfall) durch optisch sehr ähnliche Symbole ausgedrückt wurden. Ab Level 2 werden diejenigen Zusatzinformationen, die durch ergänzende Nebensymbole kartiert wurden, ignoriert. Auf Level 3 liegt die stärkste Abstraktionsebene vor: Hierfür werden Symbole zusammengefasst, die generell inhaltlich verwandte Varianten vertreten.50 In einigen Printbänden sind diese Subgruppen in den Kartenlegenden klar durch (meist fette) Überschriften voneinander abgetrennt; die Ähnlichkeiten in Größe, Form, Struktur oder Schattierung dieser Subgruppen an Symbolen sind meist offenkundig. Dennoch sind die Zuordnungen nicht strikt mechanistisch möglich. Trotz regelmäßig wiederkehrender Schemata in der Symbolisierung ist eine gute Anzahl an Karten idiosynkratisch kartiert. Im Zweifelsfall ist das oberste Entscheidungskriterium visueller Natur: Je mehr sich die Symbole auf den Originalkarten optisch ähneln bzw. wahrnehmungspsychologisch zur Flächenwahrnehmung führen (siehe diesbezüglich PRÖLL 2011), desto eher werden sie zusammengefasst.51 3.1.5
Distanzmaße
Mit der Kategorisierung der Varianten ist die Vorverarbeitung der Daten auf punktueller Ebene abgeschlossen. Für den nächsten Schritt – die Umlegung der gemessenen punktuellen Information in geschätzte Flächeninformation – wurde weiter oben bereits mehrfach thematisiert, dass die Bedeutung der Messdaten an einem Ort in diesem Verfahren auch von den Daten, die an anderen Orten gemessen wurden, abhängig ist. Diese Interdependenz der Werte verschiedener Orte kann aber nicht konstant sein. Daher benötigt man zum einen Informationen darüber, wie weit die Messpunkte voneinander entfernt sind, zum anderen muss bestimmt werden, wie stark die Messpunkte (in Abhängigkeit von ihrer Entfernung) sich beeinflussen.52 Je „weiter“ zwei Orte voneinander entfernt sind, desto niedriger ist ihr Einfluss aufeinander. Diese „Entfernung“ zwischen den Messpunkten wird durch ein sogenanntes Distanzmaß bestimmt; dieses Distanzmaß wird dann
50 In konkreten Zahlen ausgedrückt werden die Originalbelege auf Level 1 zu genau 32235 Varianten zusammengefasst, die wiederum auf Level 3 zu 12437 Varianten reduziert werden. 51 Für die gewissenhafte Umsetzung dieser mitunter schwierig zu realisierenden Vorgaben gilt mein herzlicher Dank Konstantin Niehaus (Wortschatz) sowie Marieke Schöning und Theresa Hub (Lautung und Formen). 52 Das ist einer der Hauptunterschiede zu den „probabilistic maps“ in WATTEL / REENEN (1995, 2010), die auf den ersten Blick dem hier vertretenen Ansatz ähnlich wirken; dort werden die erhobenen Daten grundsätzlich als repräsentativ für ihren Erhebungsort betrachtet. Weiterhin beeinflussen sich Varianten, die sich überlappen, nicht gegenseitig, das Verfahren trifft also lediglich eine Aussage darüber, dass, falls an einem Ort A Variante V1 auftritt, nach einer Gauß‘schen Verteilung auch der Nachbarort B diese Variante mit einer gewissen Wahrscheinlichkeit aufweist. An einer intuitiv zu treffenden Intensitätsgrenze wird dann eine Isoglosse gezeichnet (vgl. WATTEL / REENEN 2010, 500).
Datengrundlage und vorbereitende Schritte der Datenverarbeitung
49
in einen Kerndichteschätzer (dazu näher 3.1.6) eingesetzt, der die Intensität der Messungen für die Fläche schätzt. Das in RUMPF / PICKL / ELSPAß / KÖNIG / SCHMIDT (2009), der originären Publikation der Technik, verwendete Distanzmodell für den Abstand zwischen den Messpunkten ist das der euklidischen Distanz, vereinfacht gesagt also der Luftlinie zwischen zwei Orten (im Folgenden auch als geo abgekürzt). Für den 2dimensionalen Raum errechnet sie sich in Form eines Differenzvektors wie in Formel (1). ,
(1)
Da die euklidische Distanz eine kontinuierliche Größe ist, die direkt aus dem Raum auslesbar ist und mittels derer die Karte selbst auch wieder visualisiert wird, lassen sich die so ermittelten Werte auch dementsprechend kontinuierlich, also mit einer beliebigen Zahl an interpolierten Zwischenschritten, visualisieren. Nachteilig ist, dass die komplexe soziale Interaktion zwischen verschiedenen Orten durch die euklidische Distanz nicht berücksichtigt werden kann; bloße physikalische Nähe ist noch kein Beleg für tatsächlich stattfindenden Kontakt, auch wenn beide zweifelsohne oft Hand in Hand gehen: It should be added that geographic distance “as the crow flies” has been used as a particularly straightforward operationalization of “the chance of social contact”, which is presumably the genuine influence. GOOSKENS (2005) [Zitierweise angepasst, S.P.] […] presents convincing indication that social contact is the real variable behind geographic distance […]. (NERBONNE 2010a, 482)
Der entscheidende Vorteil der rein euklidischen Distanz als Maß für den Abstand der Erhebungsorte ist natürlich, dass sie unproblematisch zu ermitteln ist. Eine kulturelle oder gar „psychologische“ (vgl. die Raumdimensionen BRITAINS 2010) Distanz eines Ortes zum anderen ist unzweifelhaft deutlich schwerer zu erheben (und zu quantifizieren). Einen noch relativ leicht zu operationalisierenden Schritt in diese Richtung stellt das andere Abstandmaß dar, das in dieser Arbeit genutzt wird, der sogenannte linguistische Abstand. Er geht auf das dialektometrische Grundinstrument der Distanzmatrix (vgl. 2.1.2, ab Seite 16) zurück. Für jedes Ortspaar wird bestimmt, bei wie vielen Variablen sie identische Varianten aufweisen und bei wie vielen nicht. GOEBL (1982; 2005) visualisiert dies, die Ähnlichkeit eines Ortes zu allen anderen auf Basis der gesamten Daten, direkt. PICKL (2013a) dagegen nutzt den linguistischen Abstand, also den Erkenntnisstand über die Verhältnisse der Gesamtvariation von Ort zu Ort, als Distanzmaß für den Einfluss von Orten aufeinander (zu den technischen Details sei auf PICKL 2013a, 98–104 verwiesen). Dieser Abstandstyp ist ein kulturelles, historisches Maß, das aus der aktuellen Gestalt des Sprachsystems abgeleitet wird: Wenn historisch Kontakt zwischen zwei Orten bestand – so die Annahme –, dann ähneln sich ihre Populationen heutzutage in sprachlicher Hinsicht im Regelfall stärker, als wenn sie keinen Kontakt gehabt hätten. Der Grad ihrer sprachlichen Übereinstimmung (auf das Gesamtkorpus
50
Technik: Stochastische Bildanalyse
bezogen) wird also als aussagekräftig über die kommunikative Raumsituation angesehen. Sowohl VOGELBACHER (2011) als auch PICKL (2013a) zeigen klar, worin der entscheidende Unterschied zwischen beiden Distanzmaßen liegt: Der geografische Abstand erzeugt stärker geglättete Karten, der Einzelbeleg wird zugunsten der Fläche geschwächt. Der linguistische Abstand lässt hingegen Sprachinseln und scharfe Kanten (wie den Lech) klar hervortreten, weil ihre hohe Eigenständigkeit über das Gesamtkorpus hinweg zu einer hohen Distanz (und damit Unempfindlichkeit) gegenüber ihren Nachbarn führt.53 Tendenziell wird von einem starken Zusammenhang zwischen geografischem und linguistischem Abstand ausgegangen: Generally, geographically remote areas are linguistically less similar than geographically close areas so that a high correlation can be expected between linguistic distance and geographic distance. (GOOSKENS 2005, 39)
VOGELBACHER (2011) zeigt entsprechend für die Lexikkarten des SBS, dass der geografische und der linguistische Abstand mit r = 0,77 relativ hoch korrelieren, die Geografie „beschreibt“ also 59 % (r2) der lexikalischen Variation.54 Nachdem durch die Daten drei unterschiedliche sprachliche Ebenen abgedeckt werden, liegt es nahe, nicht einfach einen einzigen, sondern für jede Ebene einen eigenen Typ des linguistischen Abstands anzusetzen, also für Wortschatz, Lautung und Formen einzeln auszuzählen. Es wurde statt eines allgemeinen linguistischen Abstands auf Basis des Gesamtkorpus jeweils der lexikalische (lex), phonologische (pho) und morphologische (mor) Abstand bestimmt und angewandt (vgl. auch PICKL / SPETTL / PRÖLL / ELSPAß / KÖNIG / SCHMIDT 2014).
53 Weitere Distanzmaße sind selbstverständlich möglich; sie spielen im weiteren Lauf dieser Arbeit aber keine Rolle. Getestet wurde im Projektrahmen, statt der euklidischen Distanz den tatsächlichen Reiseaufwand (kürzeste Wegstrecke / schnellste Verbindung) einzusetzen (vgl. VOGELBACHER 2011). Das ist vor allem für kurze und mittlere Größenordnungen interessant, da sich für große Distanzen im Regelfall die kürzeste Strecke immer mehr der euklidischen Distanz annähert. Für das relativ kleinräumige und engmaschige Gebiet BayerischSchwabens zeigt sich laut VOGELBACHER (2011) aber schon für kurze Strecken ein relativ ähnliches Bild. GOOSKENS (2004, 2005) sowie SZMRECSANYI (2008, 2011) experimentieren mit weiteren vielversprechenden Distanzmaßen, die sich problemlos in das Intensitätsschätzverfahren einsetzen ließen. 54 Der Zusammenhang zwischen linguistischem und geografischem Abstand ist – auch in unterschiedlichen Sprachregionen – offenbar am besten logarithmisch zu beschreiben (NERBONNE 2010b schlägt im Rahmen einer Metaanalyse mehrerer Einzelstudien dafür den Namen „Séguy’s curve“ vor); lediglich STANFORD (2012) ermittelt für sein sehr kleines Untersuchungsgebiet ein minimal besseres lineares Modell. Für einen Teildatensatz seiner Daten, mit Distanzen unter 25 km, kollabiert auch dieser Zusammenhang.
Datengrundlage und vorbereitende Schritte der Datenverarbeitung
3.1.6
51
Dichteschätzung
Für die Glättung von punktuellen Daten zu Flächeninformation muss für jeden Mess- bzw. Kartierungspunkt festgelegt werden, wie stark der Einfluss der anderen Messpunkte auf die eigene Intensität sein soll, oder anders formuliert, wie stark sich die Daten überlappen. Dies wird mittels einer sogenannten Kerndichteschätzung bewerkstelligt. Die Ergebnisse einer solchen Dichteschätzung hängen von der Auswahl eines Kerntyps sowie seiner Bandbreite ab. Die Fläche, die durch einen Kern abgedeckt wird, entspricht immer genau 1 – die Dichteschätzung ändert nichts am „Gewicht“ des Belegs, sie „verschmiert“ ihn nur. Für unsere Zwecke in der Fläche müssen die Kerne natürlich zweidimensional sein. Formel (2) (nach PICKL 2013a, 88) steht für die zweidimensionale Normalverteilung, die sogenannte Gaußglocke. ß
1 2
,
(2)
Der Wert für d gibt die Entfernung an (siehe dazu den vorangegangenen Abschnitt), die Bandbreite h ist ein Maß dafür, wie rasch die Glocke abfällt. Für hohe Werte von h wird die Glocke flach, der Einflussbereich eines Punktes vergrößert sich dadurch, die Karte wird stärker geglättet. Da sich die Normalverteilung asymptotisch 0 annähert, diesen Wert aber nie erreicht, hat unter Anwendung des Gauß-Kerns jeder Ort (selbst bei sehr geringen Bandbreiten) Einfluss auf jeden anderen. Als Alternative empfiehlt RUMPF (2010, 58) einen Epanechnikov-Kern, kurz K3. Im Gegensatz zu KGauß wird K3 am Rand der Bandbreite gleich 0 (vgl. (3), aus PICKL 2013a, 114): ,
4
1
ü 0
(3)
ü
K3 ist deutlich schneller berechenbar, auch weil dank des Verhaltens an den Rändern der Bandbreite die Anzahl an Orten, die in die Berechnung der Intensität einbezogen werden muss, kleiner wird. Die räumliche Projektion beider Kerntypen in Abbildung 10 hilft, die Unterschiede zu erfassen.
52
Technik: Stochastische Bildanalyse
Abb. 10: Zur Dichteschätzung eingesetzte Kerne.
Die Wahl des Kerns beeinflusst das Ergebnis einer Dichteschätzung generell deutlich schwächer als die Wahl der Bandbreite (vgl. z. B. JANERT 2010, 20); auch für den Spezialfall unserer Karten gilt dies, wie RUMPF (2010, 49–63) zeigen kann. Die Bandbreite kann nach den Vorbildern RUMPF (2010, 59–70) sowie PICKL (2013a, 110–113) gezielt optimiert werden. Grundlegende Verfahren dafür sind LCV (likelihood cross-validation), wodurch die Bandbreite so gewählt wird, dass eine beobachtete Variante am besten vorhergesagt wird, sowie LSCV (leastsquares cross-validation), wobei der Quadratsummenfehler zwischen Beobachtung und Schätzung minimiert wird. In PICKL (2013a, 110–113) werden beide anhand der Lexikkarten erprobt – LSCV ist im Vergleich weniger anfällig, wenn es um Ausreißer in den Daten geht (vgl. auch RUMPF / PICKL / ELSPAß / KÖNIG / SCHMIDT 2009). Eigens entwickelt wurde dort weiterhin CL, ein kosten-/nutzenoptimierendes Verfahren – damit wird ein Kompromiss zwischen zwei erstrebenswerten, aber kontradiktorischen Eigenschaften der aus der Schätzung resultierenden Karte anvisiert: Sie sollte möglichst zusammenhängende Gebiete haben, dabei aber auch die zugrundeliegenden Daten möglichst ungeschönt repräsentieren. Beide Eigenschaften lassen sich durch statistische Werte der Karte ausdrücken, die in Abschnitt 3.2 (ab Seite 59) als Komplexität (kurz C) bzw. Kompaktheit (kurz L) eingeführt werden. Die ideale Bandbreite ist diejenige, die für möglichst niedrige Komplexität bei möglichst hoher Kompaktheit sorgt (vgl. VOGELBACHER 2011, 12; PICKL 2013a, 112–113). Die beiden Parameterkombinationen, die im Rahmen dieser Arbeit praktisch ausschließlich verwendet werden, sind: – Abstraktionsniveau auf Level 3, linguistisches Distanzmaß, das der untersuchten Ebene entspricht, K3-Kern, Bandbreite durch minCmaxL bestimmt, oder kurz: L3, lex / pho / mor, K3, CL sowie – Abstraktionsniveau auf Level 3, euklidisches Distanzmaß, Gaußkern, Bandbreite durch LCV bestimmt, kurz: L3, geo, Gauß, LCV.
Datengrundlage und vorbereitende Schritte der Datenverarbeitung
3.1.7
53
Generierung und Visualisierung verschiedener Kartentypen
Abschließender Teil der grundlegenden Datenverarbeitung ist die Visualisierung der intensitätsgeschätzten Datensätze in der Form von (Flächen-)Karten. Dazu muss zunächst die Projektionsfläche bestimmt werden. Im grundlegenden Verfahren von RUMPF / PICKL / ELSPAß / KÖNIG / SCHMIDT (2009) wird ein Mosaik aus sogenannten Voronoi-Zellen genutzt. Ein Voronoi-Diagramm (auch Thiessen-Polygon genannt) dient dazu, einen mehrdimensionalen Raum möglichst optimal in einzelne Gebiete um gegebene Fixpunkte herum aufzuteilen: Alle Punkte des Raums werden dem Fixpunkt (dem – vorgegebenen – Zentrum eines Gebiets) zugewiesen, dem sie am nächsten sind. Die Grenze zwischen zwei Gebieten wird durch das Mittellot der beiden korrespondierenden Fixpunkte bestimmt, also indem eine Verbindung zwischen zwei Fixpunkten angelegt wird (die gestrichelte Linie in Abbildung 11), auf die man exakt in ihrer Mitte im 90°Winkel eine Gerade ansetzt. Diese Gerade ist die gesuchte Grenze; sie ist für jeden ihrer Punkte immer gleich weit von beiden Fixpunkten entfernt.
Abb. 11: Beispiel der Aufteilung eines Raums anhand einzelner Punkte in Voronoi-Zellen.
Alle hier erzeugten SBS-Flächenkarten haben eine identische Tesselation, die als Leerschablone in Abbildung 12 zu sehen ist.
54
Technik: Stochastische Bildanalyse
Abb. 12: Tesselation des SBS-Gebiets.
Die grundlegendste Form der Visualisierung ist die Variantenkarte, die jeweils die Intensität einer einzelnen Variante visualisiert. Zur Erzeugung von Flächenkarten55 zu einer Variable werden dann die jeweiligen dichtegeschätzten Variantenkarten kombiniert. Den Varianten werden zur besseren Differenzierung Farben zugeordnet (zur Farbwahl siehe unten, ab Seite 53). Abbildung 13 zeigt oben die Visualisierungen der vier Varianten, die im Datensatz zur SBS-Karte 6181 enthalten sind. Diese unterschiedlichen, intensitätsgeschätzen Variantenflecken überlagern sich; für die Gesamtkarte (unten in Abbildung 13) wird dann an jedem Ort die Variante mit dem höchsten absoluten Wert, also die „dominante“ Variante visualisiert.
55 Zur mitunter farbigen Terminologie nicht nur der kartografischen Aspekte der Dialektometrie verweise ich ohne weiteren Kommentar auf DICKINSON (1973, 51, Fußnote 1): „Shading maps are often called choropleth maps. It is unfortunate that the essentially simple techniques of statistical cartography have been given a variety of complicated, confusing and not-yetstandardised names of pseudo-Greek origin. […] It is the author’s opinion that they suggest a mystique where none exists and tend to induce a rigid rather than a flexible approach to the various techniques.“
Datengrundlage und vorbereitende Schritte der Datenverarbeitung
55
Abb. 13: Einzelvarianten- und Flächenkarte zu Datensatz 6181, hast (L3, geo, Gauß, LCV) (in Farbe auf Seite 193).
Die Struktur der ersten drei Variantenkarten findet sich jeweils deutlich als dominantes Gebiet auf der Gesamtkarte wieder: Variante 1 (Typ hǫš(d)) als grünes, Variante 2 (Typ hȃoš(d)/hȏuš(d)) als blaues und Variante 3 (Typ haš(d)) als rotes Gebiet. Die Ausbreitung von Variante 4 (Typ həšd) ist jedoch in der Gesamtkarte nicht mehr direkt zu identifizieren – ihre Intensität ist (wie schon in der Variantenkarte zu sehen) zu schwach bzw. die Intensitäten der anderen Varianten sind höher, daher hat sie keine eigenen dominanten Gebiete. Dennoch hinterlässt Variante 4 einen Reflex auf der Gesamtkarte: Im Nordosten, wo die Varianten 2, 3 und 4 koexistent sind, „schwächen“ sich die Varianten gegenseitig, weswegen die dominanten Flecken von Variante 2 und 3 dort heller erscheinen. Auch seltene Formen haben damit eine Auswirkung auf das Gesamtbild. Der Vorteil einer Berechnung der Daten in Form von Flächeninformationen basierend auf Wahrscheinlichkeiten ist nicht nur, dass durch ein solches Verfahren der Einfluss der Aufnahmeorte untereinander mit einbezogen wird. Es lassen sich darüber hinaus die Auftretenswahrscheinlichkeiten der einzelnen Varianten
56
Technik: Stochastische Bildanalyse
für jeden Punkt des Beobachtungsfensters (und nicht nur für die Ortspunkte selbst) bestimmen, also interpolieren. Das ist besonders für Anwendungen bei mangelhafter Datenlage interessant; die Wahrscheinlichkeit, dass ein benachbarter Ortspunkt dieselbe Variante aufweist, wird generell vorhanden sein – das ist intuitiv sofort einleuchtend. Ist ein Ortspunkt, an dem keine Daten vorliegen, von Orten umgeben, die alle dieselbe Variante aufweisen, ist die Wahrscheinlichkeit naturgemäß hoch, dass Gewährspersonen am fraglichen Ort ebenfalls diese Variante nutzen würden. Das Verfahren kann somit auch leere Datenpunkte interpolieren, also mit einer gewissen Wahrscheinlichkeitsqualität die Variante eines Punkts auf der Karte voraussagen. In MESCHENMOSER / PRÖLL (2012a) wurde die Intensitätsschätzung entsprechend statt auf Voronoi-Zellen auf die Felder eines engmaschigen, über die Beobachtungsfläche gelegten Rasters angewandt, was einen glatteren visuellen Eindruck erzeugt; dabei wurde neben den Werten direkt an den Erhebungsorten auch die Wahrscheinlichkeit der Rasterfelder zwischen den Orten interpoliert. Das Raster ist beliebig eng wählbar (natürlich verbunden mit höherem Rechenaufwand), es kann also im Extremfall pixelgenau interpoliert werden. Die Interpolation ist aber nicht für alle Distanzmaße möglich. Grundlegend kann man für die Visualisierung zwischen zwei Typen von Distanzmaßen unterscheiden: solchen, die kontinuierlicher sowie reziproker Natur sind und solchen, die es nicht sind. Kontinuierlich heißt, dass sich aus den Werten der Orte auch die Zwischenwerte bilden lassen. Am Beispiel reiner räumlicher Distanz ist das besonders einfach nachvollziehbar. Sind zwei Orte A und B sieben Kilometer voneinander entfernt, so kann man in der Ebene eine Verbindungslinie zwischen beiden anlegen; verfolgt man diese Linie einen Kilometer lang, hat man noch sechs Kilometer vor sich, der Abstand dieses Messpunkts zu Ort A entspricht 1/7 der Distanz von A zu B. Verfolgt man sie vier Kilometer lang, hat man noch drei Kilometer vor sich, der Abstand dieses Messpunkts zu Ort A entspricht 4/7 der Distanz von A zu B. Jeder dieser Zwischenwerte ist klar vorhersagbar und kann auf einer linearen Skala angetragen werden. Gleichzeitig ist der Abstand reziprok in dem Sinne, dass er von B nach A genauso weit ist wie von A nach B, nämlich sieben Kilometer. Dieser kontinuierliche, reziproke Typ kann für Punkte zwischen Orten interpoliert werden. Für den anderen Typ gilt das nicht. Nimmt man als Distanzmaß z. B. die Zeit, die man für die Überwindung der Strecke zwischen zwei Orten benötigt, sind Kontinuität und Reziprozität nicht gegeben. Liegt in der Mitte zwischen Ort A und Ort B ein Fluss, dann stellt dieser ein zeitaufwändigeres Hindernis als der Rest der Strecke dar, die Skala ist also nicht linear, die Zwischenwerte lassen sich nicht kontinuierlich berechnen. Liegt Ort A auf einem Berg und Ort B in einem Tal, so ist die Strecke von A nach B (bergab) schneller zu bewältigen als die von B nach A (bergauf), das Distanzmaß ist also nicht reziprok. Für die euklidische Distanz ist die Interpolation unproblematisch, da die Variable räumliche Distanz der kartographischen Darstellung sowieso zwingend immanent ist: Ein kontinuierliches Raumphänomen wird auf eine kontinuierliche räumliche Darstellung projiziert. Der linguistische Abstand z. B. ist aber kein Raumphänomen, und kontinuierlich ist er auch nicht. Anders formuliert: Ist der
Datengrundlage und vorbereitende Schritte der Datenverarbeitung
57
linguistische Abstand von Ort A zu Ort B gleich d, dann ist der linguistische Abstand von Ort A zur Mitte zwischen den Orten A und B nicht automatisch ½ × d. Daher ist für Distanzmaße, die sich nicht aus einem kontinuierlichen Raummaß ableiten, lediglich die Voronoi-Darstellung sinnvoll. Die Farbgebung der Karten folgt dem HSB-Modell (kurz für Hue-SaturateBrightness). Die Auswahl der Farbtöne für die einzelnen Varianten findet durch gleichmäßige Teilung des Farbraums statt: Das Spektrum der visuell wahrnehmbaren Wellenlängen wird für n Varianten an n Punkten im jeweils gleichen Abstand geschnitten (vgl. ausführlicher PRÖLL 2011, 47–48). Die jeweilige Intensität einer dominanten Variante an den Visualisierungspunkten wird durch Sättigung und Helligkeit angezeigt. Dadurch sind Übergangsgebiete zwischen zwei Varianten, in denen naturgemäß die Dominanz einer Variante jeweils durch den Einfluss der anderen geschwächt wird, relativ hell. Bewusst wurde auf ein Modell der Farbmischung in Übergangsgebieten verzichtet, wie es etwa in WATTEL / REENEN (2010) durchgeführt ist: For instance, with three basic types of observation [also Varianten, S.P.] to which the three primary colors are assigned, the influences will mix to a full color picture with many shades, even after only a limited number of observations. (WATTEL / REENEN 2010, 499)
HEERINGA (2004) wendet dieses Visualisierungsverfahren auf aggregierte Daten an, die zunächst mittels einer Hauptfaktorenanalyse auf drei Faktoren reduziert werden, bevor jeder dieser drei Faktoren an die Werte für Rot, Grün und Blau gekoppelt wird. Für die hier vorliegenden Daten ist eine derartige Vorgehensweise aber nicht empfehlenswert. Zum einen täuschen diese durch Mischen von zwei Varianten entstandenen Zwischenfarben ein Skalenniveau vor, das sich aus den Daten nicht ableiten lässt; wenn man verschiedene Varianten durch Farbwahl klassifiziert, impliziert z. B. ein grüner Übergang zwischen einem blauen und einem gelben Areal eine dritte, qualitative Unterscheidung, also eine dritte Variante; dabei liegt faktisch lediglich eine quantitative Unterscheidung zweier Varianten zu Grunde. Zum anderen beschränkt man massiv die Anzahl an kartierbaren Varianten, weil sich bei mehr als drei „puren“ Variantenfarben zwangsläufig für „gemischte“ Häufigkeitswerte dieselben Farben erneut ergeben können; ein Farbton stünde also gleichzeitig für eine dominierende Variante V1 und für ein Übergangsgebiet aus zwei anderen Varianten V2 und V3.56 Für eines der weiter unten vorgestellten Verfahren, das unscharfe Clustern von Sprachkarten (siehe Abschnitt 3.3.3, ab Seite 71), wird jedoch eine andere Form von visueller Daten(re)präsentation gewählt, die sogenannten Prävalenzkarten. Für die Erzeugung dieses Kartentyps wird a) die Intensitätsschätzung pixelgenau interpoliert und b) die Farbinformation ignoriert, die bei den Flächenkarten der Unterscheidung der einzelnen dominanten Varianten dient:57 Visualisiert 56 Für weitere semiotische und wahrnehmungspsychologische Aspekte und Problemfelder, die die Visualisierung von Daten in Form von Sprachkarten grundlegend begleiten, sei auf NAUMANN (1982) sowie PRÖLL (2011) verwiesen. 57 Zum Verständnis ist ein kurzer Vorgriff notwendig: Für dieses Verfahren bedarf es monochromer Karten, weil die sogenannte Kovarianz (siehe 3.2.2, ab Seite 63), die zur Clusterung
58
Technik: Stochastische Bildanalyse
wird nur die Intensität der jeweils dominanten Variante. Dies erschwert die visuelle Differenzierung einzelner Variantengebiete weniger, als es zu erwarten wäre, da die einzelnen Gebiete im Regelfall durch helle Bänder optisch voneinander separiert werden (siehe dazu den Vergleich der Kartierungsmethoden in Abbildung 14).
Punktsymbolkarte 2121, Witwer, SBS Band 2, S. 523.
Entsprechende Flächenkarte mit Voronoi-Mosaiken.
Entsprechende Prävalenzkarte, interpoliert
Abb. 14: Drei Visualisierungen eines Datensatzes (in Farbe auf Seite 194).
Diese hellen Bänder entstehen in Übergangsbereichen von einer Variante zur anderen (also dort, wo auf der Flächenkarte in Abbildung 14 „Isoglossen“ entstehen), da für jede Variante der Einfluss der jeweils „andersartigen“ Nachbarvariante durch die Dichteschätzung zu einer Schwächung der eigenen Intensität führt. 3.1.8 Zusammenfassung: Gesamtprozess und Nutzen Der Gesamtprozess der Datenvorverarbeitung läuft also – kurz zusammengefasst – nach diesem Muster ab: Die von Natur aus punktuellen empirischen Belege einer Spracherhebung werden in einer Datenbank abgelegt, nach Häufigkeit am Belegort gewichtet und – falls notwendig oder wünschenswert – zu Kategorien gebündelt. Dann werden die Belege unter Nutzung eines Distanzmaßes (euklidisch, linguistisch, o. ä.) mittels eines Kerndichteschätzers (der einen Kerntyp und eine Bandbreite benötigt, wobei letztere sich automatisch optimieren lässt) als Flächeninformation geschätzt. Die geschätzten Intensitäten lassen sich im Anschluss in der Form von Flächenkarten visualisieren. Diese Verarbeitungsschritte sind zunächst aus rein technischer Sicht notwendig, um das volle Potential stochastischer Methoden (wie sie in den folgenden genutzt wird, nur aus Datensätzen mit lediglich einer Variable (hier der Helligkeit) bestimmt werden kann.
Statistische Werte der Karten
59
Abschnitten präsentiert werden) auf die Daten anwenden zu können. Inhaltlich jedoch sind sie nicht minder relevant, da das Endergebnis – eine wahrscheinlichkeitsbasierte Aussage über die Sprachverwendung eines gesamten Areals – ein Objekt rekonstruiert, das der Forscher mittels Feldforschung ursprünglich zu untersuchen gedenkt, das durch die unvermeidlichen Einschränkungen der empirischen Dialekterhebung jedoch nur in Form von Stichproben zu erzielen ist. Darüber hinaus hat die Dichteschätzung punktueller Daten aber noch zwei weitere immense Vorteile: Der eine liegt offensichtlich auf der Ebene der visuellen Aufbereitung. Die Möglichkeit, einen Datensatz als Fläche darstellen zu können, suggeriert abweichende Interpretationen der Daten bzw. ermöglicht sie erst (vgl. PRÖLL 2011). Der andere Vorteil ist, dass die Dichteschätzung es gestattet, disparate Datensätze miteinander vergleichbar zu machen. So lässt sich etwa der Vergleich des Wenker-Atlas mit den Regionalatlanten der zweiten Generation nach Ansicht von SCHMIDT / HERRGEN (2011, 155, 200) bislang nur sinnvoll realisieren, indem man die Daten auf ein gemeinsames Ortsnetz reduziert, was zum Teil mit beträchtlichem Informationsverlust einhergeht. Die Dichteschätzung hilft, dieses Problem zu umgehen, indem sie die punktuellen Daten in Flächeninformation umwandelt, ohne dabei jedoch konventionelle Flächenkarten zu erzeugen, deren Nutzung für diese Zwecke SCHMIDT / HERRGEN (2011, 155) als „problematisch“ apostrophieren: Flächenkarten sind dichotomischer Natur, ihre Einteilung in Gebiete muss mehr oder weniger arbiträr vorgenommen werden. Bei der Dichteschätzung dagegen wird für jeden Ort (nicht für die gesamte Fläche) ein kontinuierlicher Wahrscheinlichkeitswert erzeugt, der auch die „unterschwellige“ Variation (also konkurrierende Varianten) berücksichtigt. Die Einteilung in Gebiete wird nach robusten Kriterien in direkter Abhängigkeit der zugrundeliegenden Daten vollzogen. Die Ortsnetze zweier (oder mehrerer) Untersuchungen müssen demnach nicht dieselbe Dichte aufweisen (obwohl das natürlich weiterhin der Idealfall bleibt); die Erhebungsorte selbst müssten nicht einmal deckungsgleich sein. 3.2
STATISTISCHE WERTE DER KARTEN
Um ein verlässliches (d. h. maschinenlesbares und reproduzierbares) Vergleichsmoment der Karten untereinander zu haben, werden verschiedene statistische Werte der Einzelkarten ermittelt. Die ersten drei, Komplexität, Kompaktheit und Homogenität, gehen auf RUMPF / PICKL / ELSPAß / KÖNIG / SCHMIDT (2009) zurück; sie sind sowohl dort als auch in PICKL (2013a, 104–110) von technischer Seite ausführlich dargelegt und werden deshalb hier nur so weit erläutert, wie es zum Verständnis der Auswertungen später relevant erscheint. Der vierte Wert, die Kovarianz, ist eine statistische Standardmaßzahl, die später (in Abschnitt 3.3.3) den Dreh- und Angelpunkt für die Gruppierung von Karten darstellen wird. Alle diese Werte können sowohl für einzelne Varianten auf einer Karte als auch als Durchschnittswert einer kompletten Karte berechnet werden. Um den Unterschied zu verdeutlichen, nutze ich die folgende Notationskonvention: Han-
60
Technik: Stochastische Bildanalyse
delt es sich um eine Aussage zu einer einzelnen Variante, so wird der Name der Variante in den Index des Kennwerts gestellt, nach dem Muster KennwertVariante; ohne Index handelt es sich um den Durchschnittswert für eine ganze Karte. 3.2.1
Komplexität, Kompaktheit und Homogenität
Die Kenngröße der Komplexität einer Karte (kurz C) ist dazu gedacht, den „Grad ihrer Zergliederung in kontingente Teilgebiete“ (PICKL 2013a, 106) zu quantifizieren. Dafür wird die Länge der Grenzen zwischen dominanten Varianten aufsummiert: Je komplexer die Verteilung der Variation auf einer Karte ist, desto mehr Grenzen zwischen unterschiedlichen Regionen existieren, so die Grundannahme. Die Kompaktheit (kurz L) ist ein Maß dafür, wie viel der an einem jeweiligen Ort vorhandenen Variation durch die dominante Variante wiedergegeben wird (vgl. RUMPF / PICKL / ELSPAß / KÖNIG / SCHMIDT 2009, 291); die durchschnittliche Kompaktheit einer Karte zeigt also an, „how well the raw data is represented by the area-class map“ (RUMPF 2010, 93). Die Quantifizierung der dritten Größe, der Homogenität (kurz B), lässt sich guten Gewissens als bislang offenes Desiderat der Variationslinguistik bezeichnen: Vor allem ist zwischen zwei Arten von Gebieten zu unterscheiden: kompakten und diffusen, wobei die diffusen Gebiete entweder als nicht mehr oder als noch nicht kompakt interpretiert werden können oder aber als solche Regionen, in denen sich die Auswirkungen von Störfaktoren besonders bemerkbar machen […]. (GLUTH / LOMPA / SMOLKA 1982, 488)
Was im Zitat lediglich durch „kompakt“ und „diffus“ unterschieden wird, ist im hier vorliegenden Modell durch einen kontinuierlichen Homogenitätswert repräsentierbar. Dieser stellt dar, in welchem Ausmaß die Regionen auf der Karte durchmischt sind. Wenn etwa die stärkste Variante nur knapp dominant ist und eine oder mehrere starke „latente“ Varianten maskiert, wird der Wert für B klein. Abbildung 15 zeigt am Beispiel dreier Karten, wie die Werte für C, L und B mit dem Kartenbild korrespondieren. Die größtenteils einfarbige, dunkle Karte 5101 (links) hat nur eine relativ kurze Gesamtgrenzlänge, die hellere Karte 12108 (rechts) mit einer deutlich höheren Anzahl an verschiedenen dominanten Varianten hat einen entsprechend höheren Wert für C; die mittlere Karte liegt in etwa dazwischen, sowohl vom optischen Eindruck her als auch bezogen auf den gemessenen Wert. Die Grenzlänge C kann im SBS zwischen minimal 0 km und maximal 8644 km liegen (RUMPF 2010, 92). 0 km entsprechen einer Karte, auf der nur eine einzige Variante überall dominant ist – 8644 km ist der theoretische Maximalwert für eine Karte, auf der kein Ort (bzw. keine Voronoi-Zelle) an einen Ort mit derselben dominanten Variante grenzt. Der Maximalwert tritt im Korpus nicht auf.
Statistische Werte der Karten
61
Abb. 15: Kennwerte dreier Beispielkarten (alle Karten L3, geo, Gauß, LSCV) (in Farbe auf Seite 194).
Der Kompaktheitswert L ist ebenfalls anschaulich zu interpretierten: Karte 5101 hat einen Kompaktheitswert von L = 0,914. Das bedeutet, dass 91,4 % der zugrundeliegenden Daten auf der Karte tatsächlich sichtbar (also durch die dominanten Gebiete auf der Karte abgebildet) sind. Für Karte 12108 sind es dagegen nur 66,4 % (L = 0,664).58 Die Homogenitätswerte bewegen sich für die drei Karten – ebenfalls dem optischen Eindruck folgend – zwischen sehr hoher Homogenität bei der dunklen, vorwiegend einfarbigen Karte und mäßiger Homogenität bei der durchmischten Karte, auf der eine größere Anzahl an Varianten konkurrieren. Es ist kein Zufall, dass bei den drei Beispielkarten die Werte für L und B parallel zu sein scheinen: PICKL (2013a, 109–110) zeigt, dass die Werte für Kompaktheit und Homogenität für die Lexik hoch positiv korrelieren (je nach Intensitätsschätzungsverfahren bis zu r = 0,93) und nutzt daher im Regelfall nur den Wert für Homogenität. Für das Gesamtkorpus an Karten (also unter Einbezug der Laut- und Formenkarten) ergeben sich allerdings deutlich niedrigere Korrelationen von r = 0,61 (L3, geo, Gauß, LCV), r = 0,56 (L3, geo, Gauß, LSCV) und r = 0,68 (L3, lex / pho / mor, K3, CL)59 (siehe detaillierter 5.1.1, ab Seite 133).60 58 L ist somit ein Maß, das beim Vergleich zweier disparater Datensätze (siehe oben, Seite 59) eine zentrale Rolle spielen könnte: Die Gesamtqualität des Vergleichs ist als das Produkt der L-Werte der verglichenen Karten quantifizierbar. 59 Alle Korrelationen nach Pearson, jeweils hochsignifikant (p ≪ 0,001). 60 Eine kurze technische Anmerkung: Alle Verarbeitungsschritte, die direkt an den Datensätzen der Atlanten ansetzen (bis hin zu den Visualisierungen, der Ermittlung der Kenngrößen und den in den noch folgenden Abschnitten erläuterten Analysetechniken), werden ausschließlich
62
Technik: Stochastische Bildanalyse
Daher nutze ich im Folgenden beide Werte, da sie für Phonologie und Morphologie offenbar weniger stark parallel laufen und damit auch einzeln Aussagekraft besitzen. Der Blick auf das Gesamtkorpus zeigt auch, dass die Wahl der Methode zur Bandbreitenoptimierung zwar für Einzelkarten relevant, in Bezug auf grundlegende statistische Charakteristika der Daten aber vernachlässigbar ist. So korrelieren die Werte für Komplexität, Kompaktheit und Homogenität zum Beispiel auf Level 3, geo, Gaußkern, zwischen LCV und LSCV mit r = 0,88, r = 0,99 und r = 0,97 (vgl. Abbildung 16).
Abb. 16: Korrelation zwischen LCV und LSCV (L3, geo, Gauß).
Im Fall der Kompaktheit bleibt die Korrelation selbst bei stark abweichenden Parametern der Kerndichteschätzung (etwa L3, geo, Gauß, LCV gegen L3, phon, K3, CL) stets deutlich über 90 % – die Korrelationen der anderen Kennwerte werden unter diesen Umständen jedoch merklich geringer und sinken zum Teil bis auf knapp 50 %.61 Kompaktheit ist demnach ein Wert, der praktisch ungeachtet der genutzten Parameter stabil bleibt. Das ist keine Überraschung, schließlich trägt zur Bildung des Kompaktheitwerts hauptsächlich die im Datensatz vorhandene Anzahl der Varianten pro Ort bzw. ihre Repräsentation auf der dichtegeschätzten Karte bei; diese Zahl bleibt unabhängig von Kernfunktion und Bandbreite, die nur wenig Einfluss auf die Kompaktheit haben, stabil.
mit dem im Projekt entwickelten, Java-basierten Softwarepaket durchgeführt. Für die weiterführende statistische Auswertung der Ergebnisse dient die freie Statistiksoftware bzw. Programmiersprache R (R Core Team 2014); Einblick in die Struktur Rs und Anregungen zur Handhabung, Analyse und Visualisierung von Daten verdanke ich vor allem JOHNSON (2008), TEETOR (2011), ADLER (2010), KABACOFF (2011) sowie einer Vielzahl an hervorragenden Beiträgen auf stackoverflow.com. Neben den Basisfunktionen wurden meist die Pakete ggplot2 (WICKHAM 2009) sowie Lattice (SARKAR 2008) zur Visualisierung der Ergebnisse eingesetzt (weitere verwendete Pakete werden an den entsprechenden Stellen der Arbeit angeführt). 61 Man sollte sich in diesem Zusammenhang aber vor Augen führen, dass auch Korrelationen um 50 % in den Sozialwissenschaften aufgrund der grundsätzlich von Störfaktoren durchzogenen Daten als sehr hoch gelten (vgl. etwa SEDLMEIER / RENKEWITZ 2008, 221).
63
Statistische Werte der Karten
3.2.2
Kovarianz
Die sogenannte Kovarianz ist ein statistischer Wert, der den Zusammenhang zweier Variablen x und y angibt. Für einen gleichsinnigen Zusammenhang, also den Fall, dass hohe Werte von x mit hohen Werten von y bzw. niedrige Werte von x mit niedrigen Werten von y einhergehen, wird die Kovarianz positiv. Für gegensinnige Werte, also hohes x zu niedrigem y oder umgekehrt, wird die Kovarianz negativ. Sie ist die Summe der Produkte der Abweichungen der Variablen vom Mittelwert, normalisiert mit dem Durchschnitt der Abweichungen (vgl. JOHNSON 2008, 61–62).62 Generalisiert wird sie nach Formel (4) berechnet (vgl. FAHRMEIR / KÜNSTLER / PIGEOT / TUTZ 2009, 136, 350). 1
,
̅
(4)
Die Werte für x und y werden aus der Helligkeit am Messpunkt bestimmt. Wir erinnern uns: Helle Regionen entstehen, wenn sich Varianten gegenseitig schwächen, d. h. entweder gemeinsam in einer Region auftreten oder ihre Regionen aufeinander treffen. Eine komplette Karte lässt sich allerdings nicht einfach nur durch die Relation zweier Variablen sinnvoll beschreiben; daher wird mehrfach gemessen, und zwar jeweils die durchschnittliche Kovarianz für einen bestimmten Abstand h auf der Karte. h stellt dann eine Funktion dar, die vom Abstand h abhängt ( 0 gibt demnach die Varianz an). Formel (5) stellt die dementsprechende Adaption von Formel (4) dar. 1 |
|
̅ ,
̅
(5)
∈
Z(x) bzw. Z(y) stehen für den Wert der Prävalenz an Ort x bzw. y, ̅ für den Durchschnittswert. Es wird also das Produkt der jeweiligen Abweichungen vom Durchschnittswert berechnet. Wenn x und y beide in Richtung gleicher Werte tendieren (d. h. beide hohe positive bzw. hohe negative Werte aufweisen), dann nimmt das Produkt positiven Wert an; weichen die Tendenzen von x und y voneinander ab, so wird das Produkt negativ. Der Nenner des Bruchs, Nδ(h), repräsentiert die Menge an Punktpaaren mit einer Entfernung von rund h zueinander. Diese Menge ist in Formel (6) definiert. ,
∈
∶
|
|
(6)
62 Wird die Kovarianz mittels der jeweiligen Standardabweichung normalisiert, ergibt sich der Korrelationskoeffizient – „the correlation coefficient rxy is simply a scaled version of the sum of the product of the deviations […]. Correlation is identical to covariance, except that correlation is scaled by the standard deviations. So covariance can have any value, and correlation ranges from 1 to -1“ (JOHNSON 2008, 62).
64
Technik: Stochastische Bildanalyse
M bildet das Raster der Messpunkte im Beobachtungsfenster; die Genauigkeit und Glättung wird durch δ gesteuert. Für die vorliegende Anwendung gilt δ = ½, was eine Rundung auf ganze Kilometer bewirkt. Über jeden möglichen Wert für x und y mit rund Abstand h (also jeden möglichen ganzzahligen Kilometerabstand auf der Karte) wird dann das obige Produkt aufsummiert (vgl. MESCHENMOSER / PRÖLL 2012a). Als Ergebnis erhält man eine sogenannte empirische Kovarianzfunktion, also den distanzabhängigen durchschnittlichen Zusammenhang der Helligkeit der Punkte des Untersuchungsgebiets. Grafisch lassen sich die empirischen Kovarianzfunktionen wie in Abbildung 17 darstellen.
Karte 2119 (Trauzeuge des Bräutigams)
Karte 12055 (zweiter Grasschnitt)
Karte 13048 (mechanische Sägemühle)
Abb. 17: Prävalenzkarten und ihre gemessenen empirischen Kovarianzfunktionen.
Für sehr hohe h-Werte ist die mögliche Anzahl der Ortspaare nicht mehr sehr groß, weswegen die Kovarianzfunktionen dort an Aussagekraft verlieren. Werte größer als 120 km werden daher nicht mehr berücksichtigt. Durch die Mittelung über Distanzen von Ortspaaren liefert die KovarianzKurve einer Karte ein abstraktes Raumbild anstelle eines konkreten. Da mit dem Messen des distanzabhängigen, statistischen Wertes der Kovarianz die konkrete Rauminformation verloren geht, ist es demnach nicht mehr möglich, aus der Kovarianz-Kurve die ursprüngliche Karte zu resynthetisieren bzw. direkt aus der Kurve eindeutige Rückschlüsse über das Kartenbild zu ziehen.
Clustern von Sprachkarten basierend auf räumlicher Ähnlichkeit
3.3
65
CLUSTERN VON SPRACHKARTEN BASIEREND AUF RÄUMLICHER ÄHNLICHKEIT
Die folgenden Seiten erläutern ein Verfahren, das es – mittels der Kovarianz der Karten – ermöglicht, Karten nach ihrer räumlichen Ähnlichkeit zueinander gruppieren zu können (vorausgesetzt, dass sie nach den Vorgaben aus Abschnitt 3.1 dieses Kapitels vorverarbeitet wurden). Dies erlaubt es, große Korpora an Karten nach ihrer zugrundeliegenden Raumstruktur aufzuteilen. Bewerkstelligt wird dies durch sogenanntes Clustern. Nach einer grundlegenden Einführung in die Prinzipien und Gründe des Clusterns in 3.3.1 und dem Blick auf die Hauptgruppen an Clusteralgorithmen in 3.3.2 wird in Abschnitt 3.3.3 gezeigt, wie unscharfe, probabilistische Gruppen aus Karten gebildet werden können; zum Abschluss diskutiert 3.3.4 Implikationen dieser Technik. 3.3.1
Was ist Clustern (und welchem Zweck dient es)?
Clusteranalysen werden generell angewandt, um eine größere, unklassifizierte Datenmenge in mehrere kleinere Gruppen von Daten zu katalogisieren. Dabei ist beabsichtigt, dass die entstehenden Untergruppen a) in sich möglichst homogen und dabei b) zueinander möglichst distinkt sein sollten. Man braucht dazu ein Vergleichsmoment, also einen Wert, der die einzelnen Elemente repräsentiert, und einen Algorithmus, der diese Werte zuverlässig gruppiert. Im Bereich der quantitativen Sprachwissenschaft bzw. der Dialektometrie ist Clustern mittlerweile ein weit verbreitetes und bewährtes Verfahren (siehe auch 2.1.2, ab Seite 16); üblicherweise wird es angewandt, um einzelne Orte zu Dialekten zu gruppieren (vgl. z. B. NERBONNE / KRETZSCHMAR 2003; HEERINGA 2004; GOEBL 1984, 2005). Das Vergleichsmoment ist dabei der Grad an Übereinstimmung zwischen den Orten. Wenn z. B. zwei Orte bei 90 % der untersuchten Variablen die gleiche Variante aufweisen, werden sie zu einer Dialektregion zusammengefasst, stimmen sie nur in 10 % der Variablen überein, dann nicht. Abbildung 18 zeigt eine entsprechende Clusterkarte von Christine Feik zu Band 2 (Wortgeographie I) des „Sprachatlas von Bayerisch-Schwaben“ (aus den unveröffentlichten dialektometrischen Arbeiten zum SBS in den 90er Jahren), in der eine Aufteilung der Gesamtvariation aus dem SBS-Band 2 in sieben Cluster (die in der Folge als „Dialektregionen“ interpretiert werden können) vorgenommen wird.
66
Technik: Stochastische Bildanalyse
Abb. 18: Adaption einer unveröffentlichten Clusterkarte zu SBS-Band 2 (nach Christine Feik).
Die Legende zeigt, dass manche der Cluster sich mehr ähneln als andere – Übergangsgebiete oder Variation innerhalb der Gebiete lassen sich so allerdings nicht darstellen. Ergebnis ist eine dichotomische Konstruktion von Varietäten, von exklusiven Dialektlandschaften, aus der Gesamtvariation. Ziel des neuen hier vorgestellten Verfahrens ist es aber ja nicht, rein aggregativ zu arbeiten, sondern variablenbezogen. Daher werden hier keine Orte zu Gebieten geclustert, sondern Karten: Aus einer größeren Anzahl an Einzelkarten (also Variablen) werden Gruppen aus Karten gebildet, die eine ähnliche Raumstruktur aufweisen. Das Ergebnis der Clusterung zeigt dann nicht eine räumliche Einteilung des Aggregats, sondern eine Einteilung der Gesamtvariation in Gruppen aus Variablen, die sich räumlich ähnlich verteilen. 3.3.2 Typen von Clusteralgorithmen Für dieses Unterfangen existiert eine Vielzahl verschiedener möglicher Algorithmen. Clusteralgorithmen lassen sich nach mehreren Gesichtspunkten in Bezug auf ihre Funktionalität und Leistung unterscheiden (vgl. z. B. mögliche Taxonomien in ABONYI / FEIL 2007, 8 oder BORTZ 1993, 527–531). Dabei ist im Besonderen die Unterscheidung zwischen der Art der resultierenden Gruppen – „hart“ oder
Clustern von Sprachkarten basierend auf räumlicher Ähnlichkeit
67
„weich“ – sowie der Weise, wie die Daten zusammengefasst werden – hierarchisch oder nicht-hierarchisch – relevant. „Scharfe“ bzw. „harte“ Algorithmen ordnen jeden Datenpunkt fest und eindeutig einem einzigen Cluster zu. Abbildung 18 ist das Resultat einer harten Clusterzuweisung und zeigte bereits, zu welchen Interpretationen dies in der Dialektologie führen kann: Die scharfe Aufteilung von Orten in Cluster auf der Karte impliziert eine ebenso scharfe Aufteilung von „Dialektgebieten“ im realen Raum (vgl. auch PICKL / RUMPF 2012, PRÖLL 2014 sowie die Anmerkung in NERBONNE 2010a, 485, die bereits in Abschnitt 2.2.5 zitiert wurde). Zusätzlich reagieren Clustertechniken dieses Typs sehr empfindlich; selbst geringe Unterschiede in den Daten können zum Teil drastisch veränderte Gebietseinteilungen nach sich ziehen, was für die Darstellung des komplexen Systems Sprache keine gute Voraussetzung darstellt (näheres dazu in Abschnitt 3.3.3). Das Konzept „weicher“ Einteilungen ist dagegen der Beobachtung geschuldet, dass in der Natur vorhandene Kategorien oftmals unscharfe Grenzen aufweisen. Dies führte – vor allem in der Nachfolge von ZADEH (1965) – zur Beschäftigung mit fuzziness, zu Theorien und Modellen zu fuzzy sets und fuzzy logic, aus denen sich unter anderem auch die Prototypensemantik speist. „Weiche“, also unscharfe Methoden geben jeweils die Wahrscheinlichkeit an, mit der ein Datenpunkt zu einem Cluster gehört, und zwar für jeden Cluster einzeln. Besonders für Daten, für die mit fließenden Übergängen oder hohem Rauschen zu rechnen ist,63 sind weiche Einteilungen oft eine bessere Repräsentation. Wie kommt man nun von den rohen Daten zu diesen Gruppen, seien sie scharf oder unscharf? Dazu kann man entweder hierarchisch vorgehen oder nichthierarchisch bzw. partitionierend. Zunächst zur ersten Möglichkeit, dem hierarchischen Vorgehen. Hierbei werden sogenannte Bottom-up- und Top-downVerfahren unterschieden; ausschlaggebend ist dabei die Betrachtungsrichtung des Gegenstands bzw. der Startpunkt. In Bottom-up-Verfahren (die in der Clusteranalyse deutlich häufiger angewandt werden, vgl. BORTZ 1993, 529) wird zunächst jeder einzelne Datenpunkt als Cluster betrachtet. Dann werden in jedem Schritt jeweils die beiden Cluster, die sich am ähnlichsten sind, zu einem Cluster zusammengefasst. Clusteringalgorithmen unterscheiden sich in Bezug darauf, was als „ähnlich“ anzusehen ist: Bei single linkage wird der Abstand zwischen zwei Clustern durch die beiden Elemente ihrer jeweiligen Cluster gemessen, die den geringsten Abstand zueinander haben (daher auch der alternative Name „Minimummethode“); bei complete linkage wird der Abstand anhand der beiden Elemente bestimmt, die voneinander am weitesten entfernt sind („Maximummethode“); für average linkage wird der Abstand zweier Cluster mittels der Durchschnittswerte aller Elemente aus dem einen Cluster und aller Elemente aus dem anderen Cluster ermittelt (vgl. BORTZ 1993, 529); das Ward-Verfahren versucht, die Cluster so kompakt wie möglich zu halten und betrachtet daher solche Elemente als besonders ähnlich, deren Verbindung die gesamte Fehlerquadrat63 „Finally it is worth noting, once again, that dialectological data is noisy“ (NERBONNE 2006, 473).
68
Technik: Stochastische Bildanalyse
summe am wenigsten erhöht (deshalb wird sie immer wieder auch sprechender „Minimum-Varianz-Methode“ genannt; vgl. genauer BORTZ 1993, 532–535). Das Zusammenfassen der beiden ähnlichsten Cluster geschieht solange, bis entweder alle Datenpunkte zusammengefasst sind (also nur noch ein einziger Cluster existiert) oder ein Abbruchkriterium erfüllt ist. Abbildung 19 zeigt exemplarisch an einem kleinen, intuitiv verständlichen Datensatz das Ergebnis einer Clusterung. Es wurden 15 Orte des Untersuchungsgebiets nach ihren Einwohnerzahlen (bzw. der der Gemeinde) per average linkage gruppiert.64 Das Ergebnis ist als sogenanntes Dendrogramm dargestellt.
Abb. 19: Clusterung von 15 Orten im Untersuchungsgebiet auf Basis der Einwohnerzahlen.
Wie dem Dendrogramm zu entnehmen (und wie es auch zu erwarten) ist, fasst der Algorithmus jeweils die kleineren (d. h. die Gruppe Aindling bis Graben, alle rund zwischen 3400 und 4400 Einwohner) sowie die kleinsten Gemeinden (Nordendorf bis Schmiechen, zwischen 1100 und 2300 Einwohner) früh zu eigenen Ästen zusammen, da zwischen ihnen kein großer absoluter Abstand in Bezug auf die Einwohnerzahlen besteht. Dann fügt er die fusionierte Gruppe der mittelgroßen Gemeinden (Meitingen bis Wertingen, 7400 bis 12000 Einwohner) hinzu, zuletzt auch die Gruppe der größten Orte (mit Zahlen zwischen 18100 und 29000), die erst relativ spät zusammengefasst wird: Hier sind die absoluten Diffe-
64 Die Daten stammen vom Bayerischen Landesamt für Statistik und Datenverarbeitung, Stand Ende 2011. Die Clusterung erfolgte mittels der hclust-Funktion in R (R Core Team 2014).
Clustern von Sprachkarten basierend auf räumlicher Ähnlichkeit
69
renzen zwischen den Einwohnerzahlen deutlich größer als zwischen den kleineren und kleinsten Gemeinden. Dendrogramme wie dieses erinnern optisch bisweilen an die Verästelungen der Stammbaumtheorie und werden in gewissem Umfang auch so interpretiert: Die Dendrogramme können im Prinzip sowohl synchron (zu Zwecken der Dialektklassifikation) als auch diachron (zu Zwecken der Rekonstruktion der dialektalen Ausgliederung) interpretiert werden. (GOEBL 2005, 511)
In absoluter Formulierung ist diese Analogie allerdings gefährlich. Ein Stammbaum stellt eine temporale Entwicklung dar: Ein Urzustand differenziert sich über die Zeit hinweg zu mehreren späteren Zuständen aus. Die Clusterung von Daten (z. B. Dialekten) sagt aber nichts über temporale Prozesse aus, sondern lediglich über jeweilige Ähnlichkeiten zum Clusterzeitpunkt. Konkret heißt das, dass sich z. B. Varianten ähneln können, ohne sich aus demselben „Ast“ entwickelt zu haben (wie es z. B. biologisch in der Form konvergenter Evolution beobachtbar ist) – synchrone Ähnlichkeiten müssen nicht durch diachrone Entwicklungen „genetisch“ bedingt sein (vgl. auch PICKL 2013a, 33; PICKL / RUMPF 2012, 205). Diese Unterscheidung gilt im Übrigen auch für den „Spenderbereich“ dieser Analogie, die Evolutionsbiologie (vgl. etwa CROFT 2000, 15–16). Zurück zu den Typen der Zusammenfassung von Datenpunkten: Die andere große Gruppe an Algorithmen ist nicht-hierarchischer bzw. partitionierender Natur – der bekannteste Vertreter dieser Gruppe ist wohl die k-Means-Methode. Grundgemeinsamkeit dieser Methoden ist, dass vorgegeben wird, in wie viele Cluster (k) die Daten unterteilt werden sollen. Die Datenpunkte werden anschließend demjenigen Cluster zugeordnet, dessen Mittelpunkt (mean) sie am nächsten sind (vgl. BORTZ 1993, 530–536). Aus dieser Gruppe wird im Folgenden (3.3.3) der Fuzzy C-MeansAlgorithmus Anwendung finden (nach BEZDEK 1981; für eine kondensierte Darstellung siehe ABONYI / FEIL 2007, 17–23), der als Resultat „weiche“ Gruppen erzeugt; es wird die Zugehörigkeitswahrscheinlichkeit jedes Elements zu jedem der Cluster ermittelt. Wie alle partitionierenden Verfahren bestimmt auch der Fuzzy C-Means-Algorithmus die Anzahl der Cluster nicht selbst: Diese muss von außen vorgegeben werden (zur Bestimmung einer sinnvollen Anzahl siehe unten, 3.3.3, ab Seite 71). Die Inhalte der einzelnen Cluster werden durch einen iterativen Prozess gewonnen, der für einen zweidimensionalen Datensatz in Abbildung 20 exemplifiziert wird. Für die gewünschte Anzahl an Clustern wird durch einen randomisierten Prozess jeweils ein vorläufiges Clusterzentrum an einem zufälligen „Ort“ erzeugt (t = 1). Dieses vorläufige Zentrum stellt lediglich einen rechnerischen Punkt dar, es ist kein konkretes Element aus dem Datensatz. Für jedes Datum wird dann die Distanz zu jedem dieser zufälligen Clusterzentren berechnet (t = 2). Jedes Datum wird dann als Element des Clusters betrachtet, zu dessen Zentrum es die geringste Distanz hat (t = 3). Daraufhin wird das Clusterzentrum erneuert: Der Mittelwert aller Daten, die dem Cluster zugeteilt wurden, wird berechnet (t = 4). Dieser Wert wird als neues Clusterzentrum gesetzt (t = 5). Daraufhin wird wieder bestimmt, welches Datum am nächsten am (neueren) Clusterzent-
70
Technik: Stochastische Bildanalyse
rum liegt, aus dem Mittel dieser Zuordnung wieder ein neues Clusterzentrum gebildet usw. Dieses Verfahren wird durch so viele Iterationen fortgesetzt, bis sich die Clusterzentren bei einem Iterationsschritt nicht mehr bewegen, die Cluster also stabil bleiben (vgl. auch PRÖLL 2013).
Abb. 20: Illustration des Fuzzy C-Means-Algorithmus (zwei Dimensionen).
In den Arbeiten zum Projekt, welches das Rückgrat dieses Textes bildet, wurden sowohl harte hierarchische (vorgestellt in RUMPF / PICKL / ELSPAß / KÖNIG / SCHMIDT 2010) als auch weiche partitionierende Clusterungen von Karten (vorgestellt in MESCHENMOSER / PRÖLL 2012a) entwickelt. Ich konzentriere mich im Folgenden auf die unscharfe Technik, auf deren Basis alle Clusterungen in dieser Arbeit beruhen.
Clustern von Sprachkarten basierend auf räumlicher Ähnlichkeit
3.3.3
71
Technisches Vorgehen beim unscharfen Clustern von Sprachkarten65
Als Grundlage für das unscharfe Clustern von Karten dienen die Kovarianzfunktionen der Karten, die miteinander verglichen werden: Man ermittelt zunächst für jede einzelne Karte die entsprechende Kovarianzfunktion (siehe 3.2.2, ab Seite 63), anschließend bildet man dann mittels Clustern dieser Kovarianzfunktionen Gruppen. Dazu wird der Fuzzy C-Means-Algorithmus (siehe dazu ausführlich Abschnitt 3.3.2, darin ab Seite 69) genutzt, der jeweils die Wahrscheinlichkeiten der Gruppenzugehörigkeit eines einzelnen Elements angibt. Da die Kovarianzfunktion distanzbezogen, aber ortsunabhängig gemessen wird, haben die Karten, die als „ähnlich“ bestimmt werden, nicht notwendigerweise einander entsprechende Belege an den gleichen Orten. Somit lassen sich auch Strukturähnlichkeiten entdecken, die nicht an konkrete Orte gebunden sind. Insbesondere werden solche Karten als „ähnlich“ zu einer Referenzkarte bezeichnet, die nach Rotation oder Spiegelung Belege an den gleichen Orten wie die Referenzkarte besitzen (vgl. Abbildung 21 für eine Musterdarstellung von drei stilisierten Karten, die bei unterschiedlicher Variantenlage identische Kovarianzwerte aufweisen).
Abb. 21: Fiktive Karten mit identischer Kovarianz, aber unterschiedlicher Belegposition.
Dadurch, dass ein weicher Clusteringalgorithmus genutzt wird, ist der Beobachtung Rechnung getragen, dass die feste Zuordnung jeder Karte zu genau einem Cluster mitunter keine gute Abbildung der Wirklichkeit sein kann. Schließlich ist nicht davon auszugehen, dass nur eine einzige Einflussgröße (bzw. nur eine bestimmte Mischung aus Einflussgrößen) den Auslöser für eine bestimmte Raumverteilung darstellt; vielmehr werden unterschiedliche Phänomene zu unterschiedlichem Grad von unterschiedlichen Größen beeinflusst sein. Eine probabilistische Zuweisung ist daher gegenstandsadäquater. In der Spracherkennung wird dies intuitiv besonders deutlich: In freier Rede artikulierte Laute sind grundsätzlich „mehr oder weniger gute Vertreter eines bestimmten Phonems“ (MEHL 1995, 144), man benötigt keine exakte Entsprechung von Reiz und mentaler „Schablo65 Dieses Kapitel basiert zu Teilen auf MESCHENMOSER / PRÖLL (2012a), einzelne Teile wurden außerdem bereits in PRÖLL (2013) veröffentlicht; mit gewissen Überschneidungen ist daher zu rechnen. Daniel Meschenmoser, der den Anstoß zu diesem Verfahren geleistet und sich um Technik und Umsetzung gekümmert hat, gebührt mein herzlichster Dank.
72
Technik: Stochastische Bildanalyse
ne“, um ein Muster zu erkennen (oder wiederzuerkennen) (vgl. ANDERSON 2001, 49–74) – verbale Kommunikation wäre unmöglich, falls es so wäre. Allerdings gilt es, den Blick nicht nur auf die Zuweisungswahrscheinlichkeit zu einer Kategorie zu richten; dies würde nämlich implizieren (so etwa in MEHL 1995), dass die Kategorien selbst immer dichotomisch sind, die Unschärfe also nur für die Elemente relevant ist, für die Kategorien aber Trennschärfe gilt. Für die Cluster, die hier aus Sprachkarten gebildet werden, ist davon explizit nicht auszugehen, genauso wenig, wie dies auch für natürliche Kategorien zwangsläufig zutreffen muss (man bedenke beispielsweise die Unschärfe der Kategorien Obst und Gemüse). Das folgende Kapitel erörtert diese beiden Unschärfehierarchien im Detail. Ein weiteres Argument für unscharfe Clusteralgorithmen ist, dass sie im Gegensatz zu hierarchischen Bottom-up-Verfahren robust sind. NERBONNE / KLEIWEG / HEERINGA / MANNI (2008) sowie PROKIĆ / NERBONNE (2008) zeigen, dass im hierarchischen Clustern bisweilen kleine Nuancen der Ausgangssituation (also der initialen bzw. mikroskopischen Bedingungen) zu deutlich anderen Clusterbildungen (also auf der iterierten bzw. makroskopischen Ebene) führen können. Das unscharfe Clustern reagiert als Top-down-Verfahren dagegen unempfindlich auf Schwankungen in der Mikroebene. Vielmehr ermöglicht der iterative Prozess, durch den sich die Clusterzentren anordnen, eine optimierte Verteilung der Zentren, das Verfahren führt somit zu einer möglichst optimalen Gruppeneinteilung aller Datenpunkte (vgl. auch PRÖLL 2013). „Optimalität“ ist auch das nötige Stichwort für die Bestimmung der Clusteranzahl. Was die „beste“ Zahl an Clustern ist, ist im Spannungsfeld von zwei verschiedenen Optimierungsmotiven zu klären: Je mehr Cluster man hat, desto besser sind die Daten aufgeteilt – das hieße aber, dass es die beste Aufteilung wäre, wenn jedes Element ein eigener Cluster wäre. Offensichtlich ist das keine ökonomische Aufteilung. Das ökonomische Gegenteil, die Einteilung aller Daten in einen Cluster, würde dagegen einen einzigen schlechten Cluster ergeben. Für eine praktikable Lösung balanciert man beide Tendenzen gegeneinander aus. Immer benötigt die Wahl der Clusterzahl letztlich eine Entscheidung des Forschers; eine automatisierte, streng objektivierte Lösung besteht nicht. Eine Möglichkeit ist es, zwei Verfahren zu kombinieren (vgl. MESCHENMOSER / PRÖLL 2012a): Zunächst wird das Kartenkorpus mittels des Ward-Verfahrens (siehe oben, 3.3.2, darin auf Seite 68), also hierarchisch, geclustert. Auf diese Einteilung wird anschließend der sogenannte Scree-Test (auch Ellenbogenkriterium genannt) angewandt. Dieser wurde von CATTELL (1966) vorgestellt; er ist ursprünglich dazu gedacht, die optimale Zahl an Faktoren in multivariaten Analysen zu finden (siehe zu Faktoren genauer den nachfolgenden Abschnitt 3.4, ab Seite 79). Dafür ermittelt man den sogenannten Eigenwert der Faktoren, der charakteristischerweise für die prominentesten Faktoren relativ hoch ist, für die weniger starken aber relativ deutlich abfällt, wodurch sich ein „Ellenbogen“ bildet (vgl. BORTZ 1993, 503–504; TABACHNICK / FIDELL 2007, 644–645). In Abbildung 22 ist dies beispielhaft dargestellt: Der dritte Faktor stellt den „Ellenbogen“ dar, eine höhere Faktorenzahl fügt der Erklärungskraft der Faktorenanalyse nicht mehr viel hinzu.
Clustern von Sprachkarten basierend auf räumlicher Ähnlichkeit
73
Abb. 22: Screeplot (konstruiertes Beispiel).
Für die Ermittlung einer geeigneten Clusterzahl wird analog dazu die Fehlerquadratsumme gegen die Clusterzahl geplottet, der Screeplot wird dann von der anderen Seite der x-Achse aus interpretiert; der „Ellenbogen“ zeigt sich an der Stelle, an der die Zusammenfassung von zwei Clustern zu einem die Fehlerquadratsumme unverhältnismäßig stark ansteigen lässt (vgl. auch BORTZ 1993, 534). Hier hingegen gehe ich einen einfacheren Weg, der nichtsdestotrotz mit Faktoren zu tun hat: Über jedes Subkorpus, das für diese Arbeit per Clusteranalyse untersucht wird, wird ebenfalls eine Faktorenanalyse durchgeführt (siehe unten). Auch für die Wahl der Faktorenzahl ist eine Entscheidung von außen vonnöten – um diese externen Eingriffe auf ein Minimum zu beschränken, setze ich als Clusterzahl die Anzahl an Faktoren an, die aus den entsprechenden Daten extrahiert wurden. Das Verfahren zur Ermittlung der Faktorenzahl ist in 3.4.2 (ab Seite 81) detailliert beschrieben. Die Gesamtprozedur für die Durchführung des unscharfen Clusterns ist somit: 1. Jede Karte wird durch ihre Kovarianzfunktion (siehe 3.2.2, ab Seite 63) repräsentiert. 2. Eine geeignete Anzahl an Clustern wird bestimmt (siehe direkt oben). 3. Der Fuzzy-C-Means-Algorithmus (siehe 3.3.2, ab Seite 66) wird mit der entsprechenden Clusterzahl auf das Korpus aus Kovarianzfunktionen angewandt.
74
Technik: Stochastische Bildanalyse
3.3.4
Interpretationsmöglichkeiten der Ergebnisse
Nach dem Durchlauf des Algorithmus erhält man für jede einzelne Karte den Grad der Zugehörigkeit zu jedem der Cluster (bzw. die Nähe der Karte zu jedem Clusterzentrum). Jede Karte lässt sich nun dem Cluster(zentrum) zuweisen, dem es am nächsten ist; die Nähebeziehungen zu den anderen Clustern bleiben dabei erhalten. Tabelle 2 zeigt einen Ausschnitt einer Clusterung der Lexikbände mittels 14 Zentren. Ausgewählt sind die ersten 15 Karten aus Band 2. Die Spalten rechts des Kartennamens geben die jeweilige Zugehörigkeit zu einem Cluster in Prozent an. Zwei- und dreistellige Prozentwerte sind durch Schriftgröße hervorgehoben. Karten↓ Cluster→ 2003: Sommersprossen 2004: Pickel 2005: Beule 2006: Kamm 2007: kämmen 2008: Kopfschuppen 2009: Augenbrauen 2010: Gerstenkorn 2011: Brille 2012: Mund 2014: Zahnfleisch/Kiefer 2015: heiser 2016: Schnupfen 2017: Kinn 2018: schwerhörig
1
2
3
4
5
6
7
8
1%
0%
0%
0%
1%
0%
0%
0%
2%
0%
0%
0%
1%
0%
0%
5%
0%
1%
0%
73% 5% 21% 14% 17% 1% 3% 50% 2%
10
11
12
13
14
0%
0%
3%
0%
0%
0%
9 94% 16%
0%
0%
80%
0%
0%
2%
0%
0%
10%
1%
0%
0%
18% 11%
0%
1%
2%
0%
8%
0%
0%
4%
0%
1%
16% 29%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
0%
1%
0%
0%
3%
0%
0%
0%
5%
0%
0%
0%
99% 28%
0% 0%
0%
62%
0%
0%
4%
0%
3%
11%
4%
7%
2%
49%
1%
1%
2%
6%
0%
5%
0%
0%
0%
0%
0%
0%
0%
0%
1%
2%
0%
28%
0%
8%
6%
2%
1%
1%
2%
1%
0%
10% 45%
0%
0%
0%
0%
0%
0%
0%
0%
100%
0%
0%
5%
0%
1%
45%
5%
1%
0%
35%
1%
0%
7%
1%
1%
4%
1%
1%
0%
4%
2%
1%
0%
7%
1%
0%
32% 25%
0%
25%
3%
3%
1%
1%
1%
2%
0%
8%
4%
0%
0%
1%
2%
0%
3%
25% 10%
0%
0%
0%
0%
0%
0%
1%
93%
2%
0%
0%
1%
1%
0%
0%
0%
13% 41% 0%
0%
11% 66% 0%
Tab. 2: Tabellarische Darstellung der Clusterzuweisung (14 Cluster, Lexikbände).
In einigen Fällen ist die Zuweisung klar zu treffen, siehe dazu im Beispiel Karte 2003 (Sommersprossen), die für Cluster 9 einen Wert von 94 % aufweist. Andere Fälle sind weit weniger eindeutig, so z. B. Karte 2006 (Kamm), für die als höchster Wert eine Zugehörigkeitswahrscheinlichkeit von 21 % ermittelt wird. Die Werte für Cluster 1, 3, 5 und 12 liegen fast gleichauf (18 %, 21 %, 17 % sowie 16 %). Somit scheint Karte 2006 im Überschneidungsgebiet gleich mehrerer Cluster zu liegen, Karte 2003 dagegen in direkter Nähe des Zentrums von Cluster 9. Abstrakt gesprochen führt die unscharfe Clusterung in k Cluster dazu, dass jede Karte als Punkt in einem k-dimensionalen Raum betrachtet wird: Die Zuordnungswahrscheinlichkeit zu jeweils einem Cluster ist ihr Wert auf seiner Dimensionsachse. Mittels dimensionsreduzierender Verfahren wie der multidimensionalen Skalierung lassen sich diese k Dimensionen prinzipiell auf weniger Dimensionen reduzieren und somit auch visualisieren. Testweise wurde dies auch hier durchgeführt, die Resultate sind allerdings nicht besonders erhellend. Man vergleiche hierzu Abbildung 23, in der in drei Dimensionen das Ergebnis einer multidimensionalen Skalierung der Clusterung aller SBS-Lautkarten in 16 Cluster visualisiert ist.66 Jeder der Punkte entspricht einer Karte, Beschriftungen unterbleiben aus Gründen der Übersichtlichkeit. 66 Visualisierung: R-Paket scatterplot3d (LIGGES / MÄCHLER 2003).
Clustern von Sprachkarten basierend auf räumlicher Ähnlichkeit
75
Abb. 23: Multidimensionale Skalierung einer Clusterung der Lautkarten (16 Cluster).
Die Reduktion von 16 Dimensionen auf nur drei geht offenbar mit zuviel Informationsverlust einher – insgesamt lassen sich so nur noch 35 % der zugrundeliegenden Variation beschreiben. Eine Vielzahl der Unterschiede der Karten ist damit nicht mehr darstellbar, weswegen sich die meisten Karten in drei Dimensionen auf relativ kleinem Raum ballen. Entsprechendes gilt für Abbildung 24, in der die Karten (kleine Symbole), die Clusterzuweisungen (Polygone), die Clusterzentren (Kreise) und die Nähe der Cluster zueinander (Linien) auf zwei Dimensionen reduziert sind.67
67 Umsetzung und Visualisierung: R-Paket flexclust (LEISCH 2006).
76
Technik: Stochastische Bildanalyse
Abb. 24: Neighbourhood plot einer Clusterung der Lautkarten (16 Cluster).
Auch hier ist lediglich ein kleiner Teil der Karten bzw. der 17 Cluster sinnvoll auszumachen, der größte Teil der Variation findet sich geballt in der Nähe des Ursprungs wieder. In beiden Fällen überrascht das nicht besonders, schließlich war es ja der Sinn der Clusterung, die Variation des Datensatzes möglichst distinkt – und damit gerade nicht reduzierbar – auf 16 Dimensionen aufzuteilen. Im Folgenden wird daher auf den Versuch verzichtet, die Gesamtzusammenhänge innerhalb multidimensionaler Räume zu visualisieren. Immerhin kann Abbildung 24 aber grafisch andeuten, dass sich die unscharfen Cluster zu einem gewissen Teil überschneiden bzw. ineinander ausfransen. Bei hohen Clusterzahlen kann mitunter auch beobachtet werden, dass die Clusterung eine natürliche Gruppe räumlich und thematisch ähnlicher Karten, die bei einer anderen Clusterzahl eventuell ein eigenes Zentrum gebildet hätten, quasi in mehrere Cluster „zerschneidet“. Bisweilen er-
Clustern von Sprachkarten basierend auf räumlicher Ähnlichkeit
77
kauft man sich demnach – typisch für Ökonomieprozesse – die Qualität der Gesamtclusterung mit Kompromissen im Detail.68 Da die Cluster keine scharfen Kanten aufweisen, sondern ein Wertekontinuum darstellen, lassen sie sich analog zur Prototypentheorie69 begreifen: Im Zentrum eines Clusters steht ein Prototyp70 der geografischen Struktur, der ideale Vertreter der Gruppe. Er entspricht keiner reell auftretenden Karte;71 vgl. entsprechend SAEED (2003, 37): „[S]ome researchers […] have argued that the central prototype is an abstraction. This abstraction might be a set of characteristic features, to which we compare real items“. Zu den Rändern des Clusters hin wird die Zugehörigkeit schwächer; die Ähnlichkeit zu Karten anderer Cluster steigt dementsprechend. Abbildung 25 unternimmt den Versuch, geografische Ähnlichkeit analog dem Grad der Prototypizität in semantischen Modellen zu visualisieren (als Vorbild dient die populäre Illustration zur Prototypizität bei Vögeln, siehe AITCHISON 1997, 68).72
68 Hier scheint mir ein knapper Exkurs zur Qualitätssicherung sinnvoll: Es ist klar, dass das Ziel einer Clusteranalyse – die Aufteilung von Daten in möglichst voneinander distinkte, intern möglichst homogene Gruppen – in Abhängigkeit der Datenbeschaffenheit unterschiedlich gut gelingt. Zur Evaluierung von Clusterergebnissen, also des Grades dieses Gelingens, existiert geradezu ein Füllhorn an Möglichkeiten: RAND (1971), BEZDEK (1973), DUNN (1974) oder ROUSSEEUW (1987) stellen nur die Spitze des Eisbergs dar. Dennoch urteilen FÄRBER et al. (2010, 1): „[T]he fundamental problem of a valid evaluation has not yet been solved.“ Clusterverfahren mittels Werten zu evaluieren, die für den Clustervorgang selbst als Grundlage dienen (= interne Validierung, so z. B. durch DUNN 1974), kann das Ergebnis (positiv) verzerren: Wenn ein Algorithmus anhand des Kriteriums X gruppiert, dann ist zu erwarten, dass er in Bezug auf dieses Kriterium erfolgreicher ist als ein Algorithmus, der anhand eines anderen Kriteriums vorgeht. Bewertet man Clusterungen dagegen mittels externer Kriterien (wie RAND 1971), bedarf es eines „gold standards“ als Vergleichsmöglichkeit. Dies beschneidet allerdings den Nutzen für explorative Zwecke empfindlich, weil der Wert der Clusterung auf die Reproduktion ohnehin schon vorhandener Erkenntnisse reduziert wird (man vergleiche dazu auch FÄRBER et al. 2010, 4: „Clustering is usually used to discover new structures in the data, instead of reproducing known structure.“) Als wesentlichen Beitrag zur Validierung von dialektometrischem Clustern verweise ich auf PROKIĆ (2010, 44–53). 69 Nach ZADEHS (1965) Konzept der „fuzzy sets“ in der Folge von ROSCH (1973) und ROSCH / MERVIS (1975) ausgearbeitet; zur allgemeinen Einführung siehe AITCHISON (1997, 65–92), zur generellen Prototypizität linguistischer Elemente auch TAYLOR (2003). 70 Terminologisch so auch ABONYI / FEIL (2007, 18). 71 Die Anwendung des Fuzzy C-Means-Algorithmus führt schließlich zu einem rein rechnerischen Mittelpunkt des Clusters, vgl. 3.3.2, ab Seite 69. 72 Man vergleiche auch die entsprechenden Abbildungen in MESCHENMOSER / PRÖLL (2012a) und PRÖLL (2013), die dem Vorbild optisch näher kommen.
78
Technik: Stochastische Bildanalyse
Abb. 25: Visualisierte Zugehörigkeitswerte der Karten zweier überlappender Cluster.
Dargestellt sind die Karten zweier sehr kleiner Cluster aus der Formengeografie (vgl. detaillierter Abschnitt 4.3.2, ab Seite 121); im Mittelpunkt der jeweiligen Cluster steht der abstrahierte (virtuelle) Prototyp der Raumverteilung. Die Nähe der Karten zu diesem rechnerischen Mittelpunkt ist durch Strichstärke indiziert. Während z. B. die Karten zu lasse (6148), gebe (6144) und im Stehen (9398) klar zu Clusterzentrum 1 und stehe (6147), sie (9236) und verkehrt herum (9366) deutlich mit hohen Werten zu Clusterzentrum 8 zugewiesen werden, ist die Situation für gehe (6146), st. Flexion, Nom. Sg. Mask. (9294) und er (9221) nicht so eindeutig; zwar sind sie näher an Clusterzentrum 8 (86,38 %, 81,90 %, 67,93 %), haben aber auch Ähnlichkeiten zu Clusterzentrum 1 (10,75 %, 11,45 %, 26,77 %). Das zeigt nicht nur, dass sich die Cluster überlappen und ineinander übergehen, sondern auch, dass sich durch eine unscharfe Clusterung die Variation in einem Datensatz ähnlich eines Netzwerks beschreiben lässt: Die Clusterzentren entsprechen Grundmustern der Verteilung, stellen also gewissermaßen räumliche Distributionsprototypen dar. Für jede Karte wird im Rahmen der Clusterung ermittelt, wie sehr sie jedem dieser Prototypen entspricht; dadurch lässt sich jede einzelne Karte als individuelle Zusammensetzung bzw. Mischung der prototypischen Verteilungen beschreiben. Die Karte mit der höchsten Zugehörigkeitswahrscheinlichkeit ist demnach auch dem (idealisierten) Prototyp des geografischen Musters am ähnlichsten. Karten, die sich generell an den Rändern der Cluster befinden, sind keinem der Prototypen besonders ähnlich. Die Karten in der Nähe des Prototyps bilden gemeinsam eine mehr oder weniger kohärente „Raumfamilie“. Jede Karte wird somit in ein Netzwerk von Erklärungsmustern eingebettet, denen
Faktorenanalyse
79
es jeweils zu einem gewissen Prozentsatz ähnelt. Das Phänomen kann als Mischform mehrerer idealer Verteilungen (der Clusterzentren) gesehen werden.73 Diese Ausführungen sollten verdeutlichen, dass die Clusterung einzelner Karten ein komplexes Verfahren mit äußerst weitreichenden Interpretationsmöglichkeiten darstellt; es kann nicht der Anspruch einer Pilotstudie sein, diese auszureizen. Für besonders vielversprechend halte ich es, die Netzwerkanalogie tiefergehend auszunutzen, sowohl für die Visualisierung als auch die Interpretation der vielschichtigen Relationen, die aus individuellen Raumverteilungen und unscharfen Gruppen erwachsen. 3.4
FAKTORENANALYSE74
Zum Abschluss des Technikkapitels gilt der Blick einem Verfahren namens Faktorenanalyse.75 Auf Daten aus Sprachatlanten angewandt erfüllt es klar ein Desiderat, so findet sich etwa bei GOEBL (2005) folgende Passage: Es ist allerdings sehr schwer, für die auf einer Sprachatlaskarte aufscheinende Typen- bzw. Taxat-Vielfalt die verursachenden Wirkfaktoren (Kräfte, Synergien etc.) in eindeutig quantifizierbarer Form zu erfassen. Zwar haben viele Einzelanalysen von Sprachatlasdaten (vor allem im Rahmen der Onomasiologie) diesbezüglich eine Vielzahl anekdotischer Information beigebracht. Doch beschränkt sich deren Erklärungskraft jeweils nur auf eine einzige Sprachatlaskarte. Die Einbindung dieser disparaten Einzelphänomene in eine mathematisch faßbare Gesamtsynergetik ist bis jetzt noch nicht geglückt bzw. scheint zur Zeit auch außer Griffweite zu sein. (GOEBL 2005, 500)
Die Faktorenanalyse leistet genau das: das Aufspüren von interpretierbaren geografischen Faktoren, also räumlichen Grundmustern, die sich durch große Teile der analysierten Daten ziehen.
73 Da die Kovarianz nicht die absolute, sondern die relative Raumrelation anzeigt, darf das Ergebnis jedoch nicht so interpretiert werden, dass ein Prototyp eine konkrete Form der Raumverteilung (also genau einer Karte mit ihrer Variantenverteilung entsprechend) darstellt. Die konkrete Form ist lediglich eine Realisierungsmöglichkeit der abstrakten, relativen Verteilung. Auch hier ist man demnach der semantischen Prototypentheorie nahe: „Je genauer man Prototypen untersucht, desto hartnäckiger entziehen sie sich unserem Zugriff“ (AITCHISON 1997, 81). 74 Dieser Abschnitt ist parallel zu PRÖLL / PICKL / SPETTL (2015) entstanden, beide Texte überschneiden sich daher in vielen Punkten. 75 Eine kurze terminologische Anmerkung: Die Termini Faktor(en)analyse (kurz FA) und Hauptkomponentenanalyse bzw. Principal Component Analysis (kurz PCA) werden häufig synonym bzw. in hierarchischem Verhältnis (wobei PCA als Unterform der FA gilt, so z. B. BORTZ 1993) genutzt. Die Ergebnisse ähneln sich, es sind aber im Detail zwei verschiedene Verfahren (vgl. TABACHNICK / FIDELL 2007, 609–610; 634–635 sowie BACKHAUS / ERICHSON / PLINKE / WEIBER 2011, 356–357). Im Rahmen des Projekts Neue Dialektometrie wurden ausschließlich Techniken genutzt, die der engeren Definition von „Faktorenanalyse“ folgen, keine Hauptkomponentenanalysen.
80
Technik: Stochastische Bildanalyse
3.4.1
Grundlagen
Ursprünglich wurde die Faktorenanalyse in einem psychologischen Kontext entwickelt und popularisiert (vgl. WOTTAWA 1996, 813); dort dient sie dem Zweck, latente (d. h. nicht direkt beobachtbare) Variablen, die Ausprägung von Persönlichkeitsmerkmalen wie Intelligenz oder Aggression, aus manifesten (d. h. direkt gemessenen) Variablen (die z. B. über die einzelnen Items eines Fragebogens erhoben wurden) zu ermitteln – die Analogien zur Tragweite und Erklärungskraft in Bezug auf sprachliche Daten sind wohl klar erkennbar. Pioniere der Faktorenanalyse sprachlicher Daten waren (schwach rezipiert) WERLEN (1984) sowie BIBER (1985; 1991), der das Verfahren in der Korpuslinguistik etabliert hat. NERBONNE (2006) wendet es als erster auf dezidiert räumlich aufgelöste Sprachdaten, nämlich auf Vokaldaten des „Linguistic Atlas of the Middle and South Atlantic States“ (LAMSAS), an.76 Mit den bereits im Laufe der Arbeit vorgestellten Analysemethoden teilt sich die (explorative) Faktorenanalyse die grundlegende methodologische Stärke, nicht hypothesenbasiert vorgehen zu müssen. Stattdessen lässt die Faktorenanalyse – ohne Vorannahmen und Voreinschränkungen – Strukturen und Zusammenhänge quasi „aus den Daten selbst“ erscheinen.77 Technisch geschieht das über die Analyse der Korrelationen der einzelnen Varianten: Wenn Varianten häufig gemeinsam zu beobachten sind, also ihr Auftreten korreliert, dann muss man nicht jede einzelne Variante in ihrem individuellen Auftreten einzeln beschreiben, sondern kann ihren korrelierenden Anteil durch einen einzigen Faktor ausdrücken. Die Faktorenanalyse ist also ein dimensionsreduzierendes Verfahren, viele einzelne Varianten werden durch eine (deutlich) geringere Zahl an Faktoren ausgedrückt, die ihre Gemeinsamkeiten in jeweils nur einer Grundtendenz erfassen (vgl. ähnlich PICKL 2013a, 118–119). Jeder dieser Faktoren kann als Ausdruck eines latenten Prozesses gesehen werden, der für den Zusammenhang zwischen den Varianten verantwortlich ist, sie sind gewissermaßen „hypothetische Größen, die das Zustandekommen von Korrelationen erklären sollen“ (BORTZ 1993, 473; vgl. auch TABACHNICK / FIDELL 2007, 608). Grob zusammengefasst werden dafür zunächst die Korrelationen der gesamten zugrundeliegenden Daten untereinander ermittelt. Anschließend werden aus dieser Korrelationsmatrix die Faktoren extrahiert – dabei entspricht (im Gegensatz zur Hauptkomponentenanalyse) im Regelfall die durch die Faktoren beschriebene Varianz nicht völlig der beobachteten Ursprungsvarianz des Datensatzes (vgl. BACKHAUS / ERICHSON / PLINKE / WEIBER 2011, 356); schwache Korrelationen,
76 Das dort vorgestellte Verfahren basiert auf phonetischen Abstandsmessungen und ist daher in dieser Form nur auf lautliche Daten anwendbar; wir gehen im Folgenden anders vor. 77 Das kann natürlich auch als zweischneidiges Schwert gesehen werden, weil es mitunter dazu führt, dass die Ergebnisse einer Faktorenanalyse fehlinterpretiert bzw. überschätzt werden; man vergleiche zur Kritik grundlegend BORTZ (1993, 475–476) und TABACHNICK / FIDELL (2007, 608–609).
Faktorenanalyse
81
die mit höherer Wahrscheinlichkeit auf Rauschen in den Daten zurückgehen, fallen unter den Tisch.78 WOTTAWA (1996) stellt die Extraktion anschaulich so dar, daß man zunächst die Daten […] als Punkte in einem Raum darstellt, dessen (korrelierte) Achsen durch die einzelnen Variablen (Tests, Meßwertreihen) gegeben sind. Dieser Raum, dessen Dimension i. a. mit der Zahl der Variablen übereinstimmt, erhält durch die Analyse ein neues, orthogonales Achsensystem. (WOTTAWA 1996, 815)
Die Anzahl an Faktoren, die extrahiert werden, ergibt sich nicht automatisch, sondern erfordert eine (subjektive) Entscheidung von außen (siehe den nachfolgenden Abschnitt 3.4.2 für unsere Herangehensweise). Die Extraktion und damit Datenreduktion erfolgt anschließend „durch die Auswahl ‚wichtiger‘ Achsen“ (WOTTAWA 1996, 815) im mehrdimensionalen Achsensystem. Ausführliche Informationen zum Vorgehen sind BACKHAUS / ERICHSON / PLINKE / WEIBER (2011, 329–369) sowie TABACHNICK / FIDELL (2007, 607–651) zu entnehmen. 3.4.2
Faktorenzahl und Projektimplementierung
Zur Bestimmung der Faktorenzahl wird das Kaiser-Guttman-Kriterium angewandt, das besagt, dass alle berücksichtigten Faktoren einen Eigenwert > 1 aufweisen müssen (vgl. BACKHAUS / ERICHSON / PLINKE / WEIBER 2011, 359).79 Das ist eine relativ konservative Herangehensweise, d. h. man erhält unter Anwendung des Kaiser-Guttman-Kriteriums eine eher hohe Anzahl von Faktoren bzw. ein eher hochdimensionales Ergebnis der Reduktion. Für die Anwendung auf die SBS-Daten hat sich das als sinnvoll erwiesen – im nachfolgenden Anwendungsteil der Arbeit zeigt sich, dass die „schwächeren“ Faktoren, die in niedrigerdimensionalen Analysen unter den Tisch gefallen wären, schlüssig interpretierbar sind (vgl. auch PICKL 2013a). Weil es – wie bei der Bestimmung der Clusterzahl, siehe 3.3.3 – keine eindeutige, zwingende Zahl an auszuwählenden Faktoren gibt, legen die Ergebnisse meines Erachtens eine weniger rigide Dimensionsreduktion nahe.80 Weiterhin ist es am sinnvollsten, als Abstraktionsniveau der Daten (siehe 3.1.4) Level 1 zu nutzen, den niedrigsten Abstraktions- bzw. Interpretationsgrad: Stärke der Faktorenanalyse ist ja schließlich, „data-driven“ aus den „rohen“ Daten Strukturen zu extrahieren. Wendet man nun die Faktorenanalyse z. B. auf Level 3 an, extrahiert man Strukturen aus einer bereits stärker interpretierten bzw. abstrahierten Datengrundlage – das ist natürlich nicht empfehlenswert.81 Entsprechend 78 Das bietet Möglichkeiten für die variationslinguistische Qualitätssicherung, die in Abschnitt 6.3.5 (ab Seite 172) näher behandelt werden. 79 Ein Eigenwert > 1 bedeutet, dass der Faktor insgesamt mehr erklärt als die Varianz eines Datenpunkts, hier also der Gesamtvariation eines Ortes. 80 Man vergleiche dazu auch den pragmatischen Evaluationsansatz von TABACHNICK / FIDELL (2007, 608), der diese Herangehensweise stützt: „A good PCA or FA ‚makes sense‘; a bad one does not.“ 81 Man vergleiche GRIESʼ (2012, 43) Empfehlung, „idealerweise auf dem höchstmöglichen Informationsniveau“ zu arbeiten.
82
Technik: Stochastische Bildanalyse
wird auf die Daten zwar nach der Gewichtung (3.1.3) und Kategorisierung (3.1.4), aber noch vor der Intensitätsschätzung (3.1.6) zugegriffen: Die Intensitätsschätzung stellt bereits eine (Flächen-)Interpretation der Daten dar, eine Faktorenanalyse interpretierter Daten könnte nicht zwischen den Artefakten dieser Interpretation und den tatsächlich in den Daten vorhandenen Faktoren unterscheiden.82 Schlussendlich werden die Anteile der Korrelationsmatrix, die durch die Faktoren reproduziert werden können, pro Ort und pro Faktor kartiert. Dabei kann man analog zu den oben gezeigten Variantenkarten oder den Flächenkarten vorgehen. Entweder visualisiert man die jeweilige Stärke nur eines Faktors pro Ort – das ermöglicht für jede rekonstruierte latente Struktur eine eigene Karte – oder man kartiert pro Ort jeweils den stärksten Faktor, was eine Art „Dialekteinteilung“ in Bezug auf den Einfluss einzelner dominanter Faktoren auf ihre entsprechenden Regionen ermöglicht. Abbildung 26 beinhaltet ein Beispiel für jeden dieser beiden Kartentypen.
Abb. 26: Beispiel, Karten eines Einzelfaktors (links, zweitstärkster Faktor der Morphologie) und der dominanten Faktoren einer Faktorenanalyse (rechts, Morphologie).
82 Davor warnen auch TABACHNICK / FIDELL (2007, 613): „However, beware of using estimation procedures […] that are likely to overfit the data and cause correlations to be too high. These procedures may ‚create‘ factors.“
Faktorenanalyse
83
Der jeweilige Faktorwert einer Variante zeigt an, wie stark sie mit einem Faktor korreliert. Abbildung 27 visualisiert die Faktorwerte aller Varianten der Nominalmorphologiekarten des SBS als Jitterplot.
Abb. 27: Faktorwerte aller Varianten der Nominalmorphologiekarten.
Für jeden Faktor (x-Achse), der aus den Daten der Nominalmorphologie extrahiert wurde, wird der jeweilige Faktorwert jeder Variante mittels eines kleinen Punkts angezeigt. Die dichten schwarzen Bänder um die Nulllinie herum zeigen, dass die meisten Varianten nur relativ schwach zum Faktor beitragen, stärkere Korrelationen (positiver und negativer Art) zeichnen sich als Ausschläge auf der y-Achse ab. 3.4.3 Resynthese aus Faktoren Wenn korrelierende Züge der Variation sich durch Faktoren beschreiben lassen, können umgekehrt auch die einzelnen Varianten mittels der Faktorladungen wiederhergestellt werden (so in PICKL 2013a, 200–203). Ebenso lässt sich aus den Faktoren natürlich die gesamte durch sie beschriebene Variation rekonstruieren. Besonders interessant daran ist, dass einzelne Faktoren von diesem Verfahren ausgeschlossen werden können, man kann also Korrelationen, die sich durch den Datensatz ziehen, entfernen. Die Treue zum Originaldatensatz nimmt dabei natürlich ab. In Abschnitt 6.3.5 (ab Seite 172) wird thematisiert, wie dies gezielt dazu eingesetzt werden kann, um Schwächen in den Daten zu beseitigen.
4
SUBKORPORA
Als erster zusammenhängender interpretatorischer Komplex der vorliegenden Arbeit soll gezeigt werden, inwiefern die vorgestellten Methoden dazu dienen können, Zusammenhänge innerhalb linguistischer Teilsysteme zu finden und zu quantifizieren. Die einzelnen Abschnitte analysieren jeweils die internen Verhältnisse eines SBS-Subkorpus (Wortschatz, Lautung und Formen). Die Reihenfolge orientiert sich an der Abfolge der SBS-Teilbände (Lexik / Phonetik / Morphologie). Die Resultate sind bewusst in erster Linie deskriptiv präsentiert: Als zentralen Ertrag dieser Arbeit verstehe ich die Erprobung einer neuen Form der variationslinguistischen Methodologie, nicht die Neuinterpretation der bayerischschwäbischen Dialektlandschaft. 4.1
WORTSCHATZ
Die Lexik des SBS83 wurde bereits kompetent und in hohem Detailgrad durch PICKL (2013a, b) aus der hier ebenfalls gewählten Perspektive, die er treffend probabilistische Geolinguistik nennt, beleuchtet. Im Vordergrund stehen dort Interpretationen unter Zuhilfenahme der Größen Komplexität, Kompaktheit und Homogenität (vgl. 3.2.1, ab Seite 60) sowie Faktorenanalysen (vgl. 3.4, ab Seite 79). Diese Ergebnisse sollen hier aus nachvollziehbaren Gründen nicht 1 : 1 reproduziert werden; um den im weiteren Verlauf der Arbeit folgenden Vergleich der Ebenen auch ohne das Hinzuziehen von PICKL (2013a) zu ermöglichen und außerdem in die hier angewandten statistischen Testverfahren einzuführen, werden dennoch Punkte angeschnitten, die dort bereits behandelt wurden. In der Hauptsache aber dient das Kapitel einer Erweiterung der Analysen mit Hilfe der Techniken, die durch die Gruppierung von Sprachkarten auf Basis ihrer raumstruktuellen Ähnlichkeit (vgl. 3.3, ab Seite 65) zur Verfügung stehen. 4.1.1
Kennwertanalysen
Zunächst starten wir mit einem rein deskriptiven Blick auf die raumstatistischen Eigenschaften der Lexik. Abbildung 28 zeigt per Punktwolken den Zusammenhang der Kennwerte der einzelnen Karten (jede Karte entspricht einem Punkt).
83 Sechs von den zwölf Bänden des SBS mit sprachlichen Karten – die Bände 2, 8, 10, 11, 12 und 13 – enthalten lexikalische Variation. Die Gesamtzahl der digital vorliegenden LexikKarten beträgt 783.
Wortschatz
85
Abb. 28: Zusammenhänge der Kenngrößen der Lexik (L3, lex, K3, CL).
Die hohe Korrelation zwischen Kompaktheit und Homogenität ist optisch sofort augenfällig. Der Zusammenhang mit der Komplexität ist dagegen negativer Art, hohe Homogenität bzw. Kompaktheit gehen eher mit niedriger Komplexität einher. PICKL (2013a, b) nutzt die Kennwerte, um zu ermitteln, inwiefern semantische Gruppen sich auch in der Geografie widerspiegeln. Zur Ergänzung dieser Ergebnisse wird hier auf das Teilkorpus aller Lexikkarten das unscharfe Clusterverfahren angewandt, dessen technische Details in Kapitel 3.3 (ab Seite 65) beschrieben sind. 4.1.2
Raumstrukturelle Ähnlichkeit der Kategorien (Cluster)84
Für die Originalpublikation des SBS wurden die Wortschatzbände in verschiedene Kategorien untergliedert, die in Tabelle 3 dargestellt sind. Wie zu sehen ist, ist der thematische Skopus der Bände zwar jeweils nicht beliebig, insgesamt aber dennoch eher unscharf. Diese mangelnde Trennschärfe zieht sich naturgemäß auch durch die Kartenthemen der einzelnen Kategorien. Zum einen ist eine klare semantische Kategorisierung der Welt notorisch problembehaftet; darüber hinaus folgen die Kategorien dem ursprünglichen Fragebuch des SBS. Diese sind jedoch nicht rein nach semantischen, sondern auch nach erhebungspsychologischen Gesichtspunkten angeordnet. Dennoch stellt sich die Frage, ob Karten aus unterschiedlichen semantischen Kategorien – so lose diese auch abgegrenzt sein mögen – auch unterschiedliche Raumstrukturen aufweisen, eventuell sogar mit einer gewissen Systematik. Methodisch ist dazu das in Abschnitt 3.3 (ab Seite 65) vorgestellte Verfahren tauglich, das mittels unscharfem Clustern der Kovarianzfunktionen einzelner Karten Gruppen aus räumlich ähnlichen Karten bilden kann.
84 Vorergebnisse dieses Abschnitts wurden bereits in MESCHENMOSER / PRÖLL (2012a), der Erstpublikation der zugrundeliegenden Technik, als Beispieldaten genutzt.
86
Subkorpora
Band 2
8
10
11
12
13
Der menschliche Körper
Das Bauernhaus
Kinderspiele
Gelände
Wald und Holz
Wohnung und Einrichtungsgegenstände
Haushalt
Rindvieh und Milchverarbeitung
Boden und Ackerbau
Zäune
Körperliche und seelische Äußerungen Die menschliche Gemeinschaft Kleidung
Wettererscheinungen
Ernährung, Kochen und Backen
Schwein, Ziege, Schaf, Pferd
Freie Tiere
Bauern und Arbeitskräfte
Geflügelhaltung und Imkerei
Pflanzen, Obst und Gemüse
Zeiteinteilung und Grüßen
Weitere Haustiere
Mosterei
Adverbien
Transport Düngung Heuernte
Körbe, Gefäße und Traggestelle
Getreide
85
Blumen
Tab. 3: Themengebiete der SBS-Bände zur Lexik.
Der erste Schritt dazu ist die Festlegung einer Clusterzahl (siehe 3.3.3, ab Seite 71). Für die Faktorenanalyse legt das Kaiser-Guttman-Kriterium 14 Faktoren nahe, daher wurde der Clustervorgang ebenfalls für 14 Cluster durchgeführt. Alle Karten – in diesem wie auch in den noch folgenden Clustervorgängen – sind auf L3, geo, Gauß, LCV intensitätsgeschätzt.86 Die Ergebnisse des unscharfen, nicht-hierarchischen Clusterns geben für jede Karte an, wie nahe sie jedem (rechnerischen) Clusterzentrum ist; man erzielt somit Aussagen darüber, wie wahrscheinlich eine Karte zu jedem der Cluster gehört. Diese Ergebnisse lassen sich in die Richtung „harter“ Clusterverfahren simplifizieren, indem man jede Karte dem Cluster zuweist, zu dem sie am wahrscheinlichsten gehört (so wurde auch in MESCHENMOSER / PRÖLL 2012a verfahren). Mittels Binomialtests können diese Verteilungen auf Signifikanz geprüft werden; wirft man die in Stochastik-Beispielen omnipräsente Münze, so liegt die theoretische Wahrscheinlichkeit, Kopf zu erhalten, bei 50 % (d. h. p = 0,5). Die Binomialverteilung beschreibt nun die Wahrscheinlichkeit, bei n Würfen x mal Kopf zu erhalten (siehe ausführlicher FAHRMEIR / KÜNSTLER / PIGEOT / TUTZ 2009, 397–408; POSPESCHILL 2006, 409–417). Auf unseren Fall übertragen heißt das, dass für x Karten eines Themas in einem Cluster mit n Karten die erwartete Wahrscheinlichkeit von p = Karten im Cluster / Karten im Korpus bestünde, wenn die Karten „zufällig“ verteilt wären. Fällt die über die Binomialverteilung ermittelte tatsächliche Wahrscheinlichkeit für x Karten unter 5 %, kann man nicht mehr davon ausgehen, dass die Verteilung diesem zufälligen Muster entspricht, es sind – statistisch signifikant – überzufällig viele Karten dieses Themas im Cluster. 85 Die Kategorie Adverbien ist natürlich keine semantische Gruppe, trotzdem wurde sie als Untergliederung des Bandes 10 genutzt und taucht deshalb auch in der Kategorienübersicht auf. 86 Die Wahl des euklidischen Abstands (geo) ist dadurch zu begründen, dass nicht schon durch unterschiedliche linguistische Abstandsmaße pro Subkorpus (lex / pho / mor) systematische Unterschiede induziert werden sollen.
Wortschatz
87
Führt man jedoch wie hier anhand einer einzigen Stichprobe wiederholt Tests durch, gilt es, das Phänomen der sogenannten Alphafehlerkumulierung zu beachten: Jeder einzelne Test hat eine lokale Wahrscheinlichkeit für einen Fehler erster Art (das Signifikanzniveau). Bei mehreren Tests mit dieser lokalen Alphafehlerwahrscheinlichkeit steigt die globale Wahrscheinlichkeit eines Fehlers. Angenommen, man setzt ein lokales α-Level von 0,05 an, dann ist das globale Alphafehlerniveau für zwei Tests gleich 1 – (1 – 0,05)2, also 0,0975. Für n Tests lässt sich diese kumulative Wahrscheinlichkeit nach Formel (7) ermitteln. αglobal =1 – (1 – αlokal )n
(7)
Die am einfachsten zu handhabende, aber auch konservativste Vorgehensweise um das globale Niveau herabzusetzen ist die Bonferroni-Korrektur, bei der das gewünschte globale Level durch die Anzahl der Tests geteilt wird, um die nötigen lokalen Levels zu bestimmen, oder abstrahiert wie in Formel (8): αglobal αlokal = (8) n Für das oben angeführte Beispiel von zwei Tests zu einer Stichprobe würde man demnach für jeden Test ein Signifikanzniveau von 0,025 ansetzen, um insgesamt eine Fehlerwahrscheinlichkeit von p ≤ 0,05 garantieren zu können. Das korrigierte lokale Alphaniveau multipler Tests zur Clusterung berechnet sich bei uns also nach Formel (9): αglobal αlokal = (9) Cluster×Gruppen Für ein globales Alphaniveau von p = 0,05 ist bei 14 Clustern und 6 Lexikbänden demnach ein lokales Alphaniveau von p = 0,000595 zu fordern, bei 14 Clustern und 30 semantischen Kategorien sinkt das Niveau auf p = 0,000119. Zugegebenermaßen stellt das eine ziemlich rigide Vorgabe dar; ich gebe daher lokal zwei Signifikanzniveaus an, das strenge korrigierte und das unkorrigierte. Zusätzlich beziffere ich die erwartete Anzahl der „falschen“ positiven Treffer – ermittelt durch das Alphaniveau multipliziert mit der Anzahl der durchgeführten Tests –, zum Vergleich mit den tatsächlich gefundenen Treffern. Abbildung 29 stellt nun für die Kategorien aus Tabelle 3 dar, a) in welchen Clustern überdurchschnittlich viele Karten einer Kategorie enthalten sind und b) in welchen Fällen das Resultat signifikant ist.
88
Subkorpora
Abb. 29: Absolute standardisierte Clusterzuweisungen der Lexikkarten (nach Kategorien).
Die absolute Anzahl der Karten einer Kategorie in einem Cluster wurde nach Formel (10) standardisiert, um den Einfluss von Kategorien- und Clustergröße auszuschalten. Karten einer Kategorie im Cluster Gesamtzahl aller Karten × Karten in der Kategorie Karten im Cluster
(10)
Der Erwartungswert einer rein zufälligen Verteilung liegt nach der Standardisierung bei eins. Alle zufälligen und unterzufälligen Ergebnisse ≤ 1 werden nicht dargestellt, für alle überzufälligen Ergebnisse visualisiert die Grauskala, mit der die Quadrate gefüllt sind, den Faktor der Überzufälligkeit (bis zum fünffachen des Erwartungswerts). Sind die Ergebnisse signifikant hoch, so wird das durch vergrößerte Quadrate angezeigt, Signifikanz unterdurchschnittlichen Auftretens durch ein ×. Alle Treffer sind lediglich lokal signifikant (αlokal < 0,05). Das Bonferroni-korrigierte Niveau von αglobal < 0,05, das αlokal < 0,000119 verlangt, wird nirgends erreicht. Bei 420 Tests mit einem Alphafehler von maximal 0,05 ist mit bis zu 21 falsch positiven Werten zu rechnen – deutlich mehr, als überhaupt als signifikant ermittelt wurden. Dessen ungeachtet sind Tendenzen auszumachen; man vergleiche nur die fast gegenläufige Verteilung überzufälliger Werte der Kategorien Rindvieh und Milchverarbeitung und Schwein, Ziege, Schaf, Pferd oder auch der kleineren Kategorien Kleidung und Freie Tiere. Als Gegenstück dazu entsprechen sich Kleidung und Das Bauernhaus deutlich stärker. Auch die Cluster, die ja als eine Form von
Wortschatz
89
„Raumprototypen“ gesehen werden können, weisen im Vergleich klare Unterschiede auf. Während Cluster 5 und 7 insgesamt weniger Kategorien klar beherbergen, diese wenigen dafür aber den Erwartungswert relativ stark überschreiten, sind die Werte für Cluster 6 und 9 näher am Durchschnitt – sie stehen damit quasi für thematisch unspezifischere Raumstrukturen. Abbildung 30 liegt eine gröbere Kategorisierung der Karten zugrunde. Statt der Kategorien aus Tabelle 3 werden ganze Bände genutzt, der semantische Skopus der Gruppen wird somit noch einmal beträchtlich unschärfer.
Abb. 30: Absolute standardisierte Clusterzuweisungen der Lexikkarten (nach Bänden).
Dennoch zeigen sich auch hier Muster, etwa die Gegenläufigkeit zwischen Band 11 und 12, der Gegensatz zwischen Cluster 4 (mit vermehrt Karten aus Band 10 und 11) und Cluster 5 (Band 8, 12 und 13) usw. Was jedoch die Signifikanz der Resultate angeht, wiederholen sich die Beobachtungen der feineren Untergliederung in Abbildung 29: Bis zu vier falsch positiv signifikante Werte wären zu erwarten (84 Tests multipliziert mit einem Alphafehler von 0,05 pro Test) – bei nur drei ermittelten. Das korrigierte Niveau wird nie erreicht. Strenge Kriterien erlauben demnach keine belastbaren Evidenzen; trotzdem zeigen sie Tendenzen auf. Offenbar regiert im Wortschatz nicht das Chaos, wenn es um Raumverteilungen von Varianten geht. Zu einem gewissen Grad gibt die „harte“ Zuweisung zu Clustern Hinweise auf Regelmäßigkeiten, auf Strukturen über den individuellen Fall hinaus. Da jedoch gerade Wahrscheinlichkeiten und Unschärfen im Mittelpunkt dieses Texts stehen, sollten auch dezidiert die Vorteile einer unscharfen Clusterung zum Zuge kommen. Im Folgenden wird daher die Wahrscheinlichkeit dargestellt, mit der eine Karte aus einer bestimmten Kategorie einem Cluster zugeordnet wird. Dazu wird die Summe der Einzelwahrscheinlichkeiten aller Karten einer Kategorie durch die Anzahl der Karten der Kategorie geteilt (also das arithmetische Mit-
90
Subkorpora
tel der Werte einer Kategorie pro Cluster errechnet). Eine Standardisierung auf die Clustergröße ist nicht möglich bzw. nötig, weil es keine unterschiedlichen Clustergrößen gibt: Schließlich gehört jede Karte jedem Cluster an, nur mit unterschiedlicher Wahrscheinlichkeit. Es lässt sich allerdings ein durchschnittlicher Erwartungswert pro Cluster angeben (100 % / Anzahl der Cluster), der als Vergleichswert durchaus nützlich ist. In Abbildung 31 sind diese Zuordnungswahrscheinlichkeiten für „die durchschnittliche Karte“ einer semantischen Kategorie dargestellt. Kategorien mit einer totalen Kartenzahl, die unter der Clusterzahl liegt (< 14), wurden hierfür ausgeklammert, um Verzerrungen zu vermeiden. Der durchschnittliche Erwartungswert pro Cluster entspricht einer weißen Einfärbung, Unterschreitungen dieses Werts sind rot, höhere Werte grün. Die Reihen und Spalten sind nach Ähnlichkeit geordnet. Dem Dendrogramm oben ist zu entnehmen, welche Kategorien sich in Bezug auf die durchschnittliche Wahrscheinlichkeit wie ähnlich sind.
Abb. 31: Wahrscheinlichkeiten der Clusterzuweisung in der Lexik (in Farbe auf Seite 195).
Wortschatz
91
So läuft die Clusterzuweisung der Kategorien Rindvieh und Milchverarbeitung und Getreide eher parallel als die von Körbe, Gefäße und Traggestelle und Wohnung und Einrichtungsgegenstände. Während man daher bei ersteren prinzipiell ähnlichere Raumstrukturen annehmen wird, gilt für letztere das Gegenteil: Wenn eine Karte die typischen Raumstrukturen anderer Karten der Kategorie Körbe, Gefäße und Traggestelle aufweist, gehört sie wahrscheinlicher zu Cluster 12 als Cluster 2 – für eine typische Wohnung und Einrichtungsgegenstände-Karte verhält es sich dagegen genau umgekehrt. Das Dendrogramm auf der rechten Seite visualisiert die Nähe der Cluster untereinander. Relativ deutlich zeigen sich drei Gruppen an Clustern, die jeweils in Ästen zusammengruppiert werden. Die fünf oberen Cluster (12, 11, 3, 1 und 6) sind als Gruppierungspunkt für Karten aus den meisten semantischen Kategorien überdurchschnittlich wahrscheinlich, verkörpern also Prototypen von Raumstrukturen, die in der Lexik generell häufiger sind. Die mittleren 5 Cluster (5, 2, 4, 14 und 9) sind differenzierter: Hier sind Zerspleißungen, Spezialisierungen zu beobachten. Während gewisse Kategorien wahrscheinlicher sind, fallen andere unterzufällig ins Gewicht. Die restlichen 4 Cluster sind für die meisten Kategorien unwahrscheinlich, manche sogar für alle. Diese Cluster repräsentieren „Außenseiter“ der Raumverteilungen, d. h. ein paar wenige Karten mit ungewöhnlicher Struktur, die von den meisten anderen („reguläreren“) Karten klar unterschieden sind. Für den Großteil der Kategorien ist es daher höchst unwahrscheinlich, ebenfalls dieser Struktur zu entsprechen. 4.1.3
Geografische Grundstrukturen (Faktoren)
Um geografische Grundstrukturen entdecken zu können, die über die einzelne Karte hinausgehen, widmen wir uns zu guter Letzt den tiefen Korrelationen, die durch die gesamten Lexikdaten gehen. Dies geschieht mittels der Faktorenanalyse (technisch ausführlich in Abschnitt 3.4, ab Seite 79, beschrieben), deren Zweck das Aufspüren von Entsprechungen der Raumverteilungen möglichst vieler Varianten ist. Abbildung 32 zeigt das Ergebnis einer Faktorenanalyse der Lexikdaten; mittels 14 Faktoren87 werden so 56,76 % der Varianz in den Grunddaten dokumen-
87 PICKL (2013a) führt die Faktorenanalyse der Lexik mit 20 Faktoren durch, hier werden dagegen nur 14 angesetzt. Prinzipiell gibt es keine „richtige“ Anzahl an Faktoren (vgl. Faktorenzahl und Projektimplementierung, 3.4.2, ab Seite 81) – die Wahl einer höheren Anzahl durch PICKL (2013a) ist damit begründbar, dass zum einen auch die schwächeren Faktoren in der Analyse noch interpretierbar und räumlich kohärent sind und zum anderen dort der Blick einer möglichst exhaustiven Analyse der Lexik (und nur der Lexik) gilt. Hier hingegen ist es für den später folgenden Vergleich der Subkorpora wichtig, ein gemeinsames Kriterium für die jeweilige Faktorenzahl zur Hand zu haben. Daher wird hier grundsätzlich dem KaiserGuttman-Kriterium (siehe Faktorenzahl und Projektimplementierung, 3.4.2, ab Seite 81) gefolgt.
92
Subkorpora
tiert. Kartiert ist hier pro Ort jeweils nur der stärkste Faktor; nicht alle 14 Faktoren werden auf diese Weise sichtbar.
Abb. 32: Dominante Faktoren der Lexik (in Farbe auf Seite 196).
Zur Orientierungshilfe wie auch zum Vergleich sind in Abbildung 33 drei stilisierte Karten abgedruckt, die Informationen zu relevanten außersprachlichen Gliederungen des Gebiets zeigen: Die Karte links visualisiert die Grenzen der drei angeschnittenen Regierungsbezirke nach der bayerischen Gebietsreform 1971– 1980. Mittig sind die Aufnahmeorte der SBS-Exploratoren dokumentiert.
Wortschatz
93
Das nördliche Gebiet wurde komplett von Edith Funk erhoben, im Westen waren neben der Hauptexploratorin Brigitte Schwarz auch Edith Funk (in Niederraunau, 149) und Manfred Renn (in Rieden an der Kötz, 112, Roggenburg, 130 und Heimertingen, 190) tätig; in dessen Areal im Osten wurden wiederum auch ein Ort von Edith Funk (Lechhausen, 123) und zwei von Werner König (Augsburg, 122 sowie Graben, 169) erhoben.88 Die abweichenden Orte innerhalb der ansonsten zusammenhängenden Exploratorengebiete sind per Initialen der jeweiligen Exploratoren markiert. Die rechte Karte präsentiert die größeren Flüsse im Gebiet.
Abb. 33: Außersprachliche Gliederungen des SBS-USG: Bezirksgrenzen (Stand 1980), Exploratoren, Flüsse.
In Abbildung 34 und 35 sind alle Faktoren der Lexik – auch die, die an keinem Ort dominant sind – einzeln kartiert. Die Gebiete, in denen die Faktoren dominieren (also die jeweiligen Flecken der Gesamtschau in Abbildung 32), sind eigens umrandet. Für die Faktoren, die nicht nur einen positiven, sondern auch einen negativen Part aufweisen, sind beide Anteile nebeneinander dargestellt.89
88 Das ist eine verkürzte und vereinfachte Darstellung, die für unsere Zwecke aber ausreichend ist. Genauere Informationen zur Erhebung finden sich im Einführungsband des SBS (SBS 1, 28–32). 89 Negative Korrelation findet sich an Orten, die – nicht zufällig, sondern regelmäßig – eine andere Variante als das positive Gebiet aufweisen; sie ist also nicht einfach unabhängig vom positiven Faktoranteil, sondern sein Komplementärstück.
94
Subkorpora
Abb. 34: Faktoren 1–9 der Wortgeografie.
Aufschlussreich ist zunächst, wie deutlich sich der Verlauf des Lechs (vgl. Abbildung 33) auch in den subdominanten Teilen der Faktoren widerspiegelt. Die Intensitäten der Faktoren 1, 3, 4 und 5 brechen an seinem Westufer, die Faktoren 2
Wortschatz
95
und 6 am Ostufer abrupt ein. Der stärkste Faktor (mit 11,90 % dokumentierter Varianz) strahlt aus dem Südwesten nach Nordosten aus – sein Kerngebiet deckt ein Areal ab, das im weiteren Sinn als „Allgäu“ bezeichnet werden kann. Faktor 2 stellt dagegen den traditionell als „Lechrainisch“ bezeichneten Raum des SBSUntersuchungsgebiets heraus, mit einer klaren Grenze nach Westen und einem Übergangsgebiet in den Norden hinein. Faktor 3 hat sein Kerngebiet im Raum Donau-Ries; auffällig ist der „Satellit“, den sein dominantes Areal weiter im Süden hat. Hierbei handelt es sich um Königsbrunn, eine relativ junge Siedlung, die – ergänzt durch den Zuzug von überdurchschnittlich vielen Vertriebenen nach dem Ende des zweiten Weltkriegs – auch vom Ries aus besiedelt wurde (so auch PICKL 2013a, 172). Das „Allgäu“ und der vierte Faktor gehen im Westen ineinander über. Dieser vierte Faktor soll hier „Mittelostschwäbisch“ genannt werden (ohne damit eine systemische Relation zu anderen niederalemannischen Dialekten implizieren zu wollen).90 Faktor 3 und 5 werden räumlich durch die Donau voneinander abgeschnitten, ein Befund, den PICKL (2013a, 180) ebenfalls beobachtet.91 Während Faktor 3 sinnvollerweise als „Nordostschwäbisch“ gesehen werden sollte, ist die Gestalt des fünften Faktors bislang undokumentiert. Von seiner Raumstruktur her entspricht er in etwa den „Westlichen Wäldern“, heute ein großes Landschaftsschutzgebiet, das im Norden von Donau und Lech, im Westen und Osten von Mindel und Wertach eingerahmt wird und im Süden auf der Höhe Türkheims (197) endet. Die Faktoren 6 und 7 führen in Abstufungen vom „mittelbairischen“ zum „nordbairischen“ Raum hin. Die Faktoren 8 und 9 werden zwar nirgendwo dominant, müssen daher aber nicht per se weniger interessant sein. Im Gegenteil bilden gerade diese „unterschwelligen“, latenten Faktoren diejenigen Aspekte der Variation, die mit bislang üblichen quantitativen Methoden ausgeblendet wurden. So zeigen etwa diese beiden Faktoren jeweils einen Gegensatz innerhalb des Gebiets, das schon durch Faktor 1 scheinbar exhaustiv erfasst wurde: Zum einen gibt es innerhalb des „Allgäuer“ Raums eine Ballung um Mindelheim / Türkheim herum (Faktor 8), zum anderen positive Korrelationen am südlichen / südöstlichen Rand des Untersuchungsgebiets (Faktor 9) – entgegengesetzt dazu stehen die negativen Korrelationen beider Faktoren im streng südwestlichen Raum. PICKL (2013a, 185–186) führt aus, dass der Gegensatz, der sich hier in Faktor 9 manifestiert, die Einzugsgebiete von Lech und Iller widerspiegelt; die Grenze zwischen positiven und negativen Werten entspricht der Wasserscheide.
90 KÖNIG (2011) betont, dass Dialektbezeichnungen sich üblicherweise aus bestehenden Landschafts- bzw. Siedlungsnamen speisen; für den „mittelschwäbischen“ Raum existiert jedoch kein entsprechendes Vorbild. Grundsätzlich sind (auch im vorliegenden Text) alle Dialektbezeichnungen als reine „Hilfskonstrukte“ (KÖNIG 2001, 1) zu verstehen – keinesfalls sollte leichtfertig eine kulturelle oder gar historische Einheit der Gebiete über ihre momentane sprachliche Ähnlichkeit hinaus erwartet werden. 91 Die Bedeutung der Donau kann dort mittels Tests der Signifikanzen von Grenzen weiter untermauert werden (vgl. PICKL 2013a, 147–148).
96
Subkorpora
Abb. 35: Faktoren 10–14 der Wortgeografie.
Für Faktor 10 sind mehrere Interpretationen denkbar: PICKL (2013a, 182–183) schlägt sehr plausibel einen Zusammenhang mit dem Einzugsgebiet Lauingens, wie es in den SBS-Karten zu früheren Marktorten (Karte 12) und heutigen Ein-
Wortschatz
97
kaufsorten (Karte 13) im Einführungsband dokumentiert ist (SBS 1, 88–95), sowie dem südwestlichen Teil des Herzogtums Pfalz-Neuburg vor. Die negativen Korrelationen dieses Faktors, die sich bei den hier gewählten 14 Faktoren (statt 20 bei PICKL 2013a) stärker zeigen, legen jedoch auch nahe, dass der Faktor die Auswirkung einer Exploratorengrenze zwischen Edith Funk (Nordwesten, positiv) und Manfred Renn (Zentrum, negativ) darstellen könnte. Im Einführungsband des SBS wird ein systematischer Unterschied der beiden erläutert; während Edith Funk „sich nicht nur auf den ältesten erreichbaren Stand beschränkt, sondern eher auch spontane umgangssprachliche Formen dokumentiert“ seien Manfred Renns Erhebungen „eher von antiquarischem Interesse geprägt, seine primäre Aufmerksamkeit gehört der Aufzeichnung des alten Dialekts“ (SBS 1, 30).92 Besonderes Augenmerk verdient die Beobachtung, dass die meisten Flächen, die die Faktoren abdecken, räumlich zusammenhängend sind, also räumliche Autokorrelation aufweisen. Für Faktor 11 und 12 gilt das weniger stark. Hier zeigen sich diskontinuierliche Strukturen, aber auch diese sind nicht zufällig: Neben einer Ecke im Südosten bzw. dem Einzugsgebiet Ulms stechen die bevölkerungsreichsten Orte des Untersuchungsgebiets heraus, die Faktoren erfassen demnach die typisch „städtischen“ Variablenausprägungen. Diese „Städtefaktoren“ werden im Rahmen der Phonologie und Morphologie sowie in Abschnitt 6.1.4, ab Seite 160, noch genauer betrachtet, ebenso wie Faktor 13, der einen latenten Gegensatz innerhalb des bairischen Raums offenbart. Der positive Anteil beinhaltet den Übergang zum nordbairischen Raum und (schwächer) den sogenannten „Lechrain“ (siehe auch hierzu ausführlicher die Analysen zu Lautung und Formen), der negative Teil kann eventuell als Tendenz zum Raum München hin interpretiert werden. Der schwächste lexikalische Faktor, den das Kaiser-Guttman-Kriterium zulässt, entspricht dem Einzugsgebiet Memmingens (vgl. Karten 1012/3, SBS 1, 88–95; PICKL 2013a, 190). Ringförmig setzen sich dagegen zum Osten hin schwach die Regionen mit negativen Korrelationen ab, die zwar dem ostschwäbischen Raum angehören, aber an anderen (Wirtschafts-)Zentren (Günzburg, Mindelheim, Kempten) orientiert sind. Als positiv ist zu werten, dass sich die Ergebnisse der vorliegenden 14Faktoren-Lösung (basierend auf insgesamt 783 Karten) nicht wesentlich von der 20-Faktoren-Lösung durch PICKL (2013a) (für die 735 Karten genutzt wurden) unterscheiden; vor allem bei den stärkeren Faktoren sind die Unterschiede vernachlässigbar. Die schwächeren Tendenzen in den Daten haben jedoch bei mehr Faktoren größere Chancen, als einzelne Faktoren aufzutreten. Vor allem zeigt sich dies in Form je eines Faktors „Ulm“, eines Faktors „Südbairisch“ und eines Faktors „Städte“ bei PICKL (2013a), während diese drei Tendenzen hier zu nur zwei Faktoren zusammengefasst werden – meines Erachtens der einzige wirkliche 92 Vielleicht ist es wichtig zu erwähnen, dass die Varianten, die hier die höchsten Ladungen aufweisen, hauptsächlich aus dem unmittelbaren Ernteprozess stammen oder mit Nahrungsmitteln bzw. ihrem Entstehungs- und Aufnahmeprozess zu tun haben. Der Faktor tritt so ähnlich auch in Lautung und Formen auf, ist dort aber weniger naheliegend als exploratorenbedingt zu erklären.
98
Subkorpora
Nachteil für die Interpretation, der der Anwendung des Kaiser-GuttmanKriteriums erwächst.93 Dass sich beide Analysen dennoch so stark ähneln, lässt die Belastbarkeit sowohl der zugrundeliegenden Daten als auch des Verfahrens erahnen. 4.1.4
Fazit
Diese knappe Darstellung einiger zentraler Resultate zum Wortschatz der SBSErhebungen zeigt bereits, dass mittels geostatistischer Methoden quantitative Analysen möglich sind, die über den bisherigen Detailgrad der Dialektometrie hinausgehen – sowohl die unscharfe Clusterung als auch die Faktorenanalyse erzeugen Ergebnisse, die nicht nur durchaus plausibel sind, sondern auch detailliert über bislang verborgene Feinheiten der geografischen Sprachvariation informieren. Die spezifischen Eigenheiten der Lexik werden schon von PAUL ([1920] 1995, 47) herausgestellt: „Am wenigsten ist der Wortschatz und seine Verwendung charakteristisch. […] Hier gibt es mehr individuelle Verschiedenheit als in irgend einer andern Hinsicht.“ Da das Lexikon einer (jeden) Sprache infinit ist, es keine geschlossene Klasse gibt, ist die Annahme plausibel, dass kein System von sich gegenseitig stützenden Interdependenzen existiert. Dennoch zeigt sich mit Hilfe der Clusterung, dass Gruppen von Karten, die nach semantischen Gesichtspunkten gebildet wurden, auch ähnliche Raumstrukturen aufweisen können. Mitnichten ist also lexikalische Variation regellos – sicherlich bedarf es jedoch für feinere Interpretationen auch einer ausgefeilteren Herangehensweise auf semantischem Terrain. Auch die Faktorenanalysen verdeutlichen, dass die arealen Muster des bayerisch-schwäbischen Wortschatzes im SBS nicht nur in bislang unerreichter Tiefe als graduelle Strukturen darstellbar sind, sondern im gleichen Atemzug mit einem engen Geflecht an Raumverteilungen unterschiedlichster Herkunft – politischer, ökonomischer, aber auch datenerhebungsbedingter Art – verknüft werden können. Der (begründeten, vgl. KÜMMEL 2007) Ansicht, dass jedes Wort „seine eigene Geschichte“ habe, widerspricht offenbar nicht die empirisch gewonnene Erkenntnis, dass sich die Geschichten einer großen Zahl an Wörtern überlappen und gegenseitig ergänzen können.
93 Gleichzeitig steigt mit der Hervorhebung einzelner, schwacher Unterströmungen in den Daten natürlich auch das Risiko, „Phantomfaktoren“ zu erzeugen, also tatsächlich zusammengehörige Strukturen auseinanderzureißen.
Lautung
4.2
99
LAUTUNG
Zu lautlichen Phänomenen enthält das digitale Korpus insgesamt 831 Lautkarten, davon 504 zum Vokalismus und 327 zum Konsonantismus. Im SBS sind diese Karten ursprünglich auf die Bände 3, 4, 5 (Vokalismus) und 7 (Konsonantismus) verteilt – Band 7 wurde in zwei Teilbänden publiziert. Für Raumstrukturen im lautlichen Bereich gelten deutlich andere Grundannahmen und Voraussetzungen als für die Lexik – im Licht der Reihenschritttheorie (zur theoretischen Heranführung siehe 2.3, ab Seite 31) ist davon auszugehen, dass sich phonetische Phänomene spürbar regelmäßiger verteilen als lexikalische. Zunächst lässt sich das mittels eines Blicks auf die Kennwerte überprüfen. 4.2.1
Kennwertanalysen
Abbildung 36 zeigt – wie schon in der Lexik umgesetzt (vgl. Abbildung 28, Seite 85) – die entsprechenden Zusammenhänge in Form von Punktwolken.
Abb. 36: Zusammenhänge der Kenngrößen der Lautung (L3, pho, K3, CL).
Kompaktheit und Homogenität korrelieren insgesamt schwächer als in der Lexik, was auf den vergleichsweise höheren Anteil an Karten zurückzuführen ist, die bei gerínger Kompaktheit hohe Homogenität aufweisen. Viele dieser ungewöhnlicheren Wertkombinationen gehen direkt auf die Art der ursprünglichen Kartierung zurück: Auf den betroffenen Karten wurden nur ein Teil der Orte mit Symbolen versehen, Ortspunkte mit „unmarkierten“ Varianten wurden nicht eigens visualisiert, um sie optisch in den Hintergrund treten zu lassen. Dies lässt die Kompaktheitswerte automatisch absinken. Dank der niedrigen absoluten Zahl dieser Karten bleibt das für weitere Untersuchungen dennoch unproblematisch. Abbildung 37 stellt die Kennwerte des Vokalismus und des Konsonantismus untereinander. Histogramme und die durchgezogene Dichtekurve repräsentieren die Werte nach der Intensitätsschätzung auf Abstraktionslevel 3, phonetischer Abstand, K3-Kern, Bandbreiten nach dem CL-Verfahren; die gestrichelte Dichtelinie zeigt zum direkten Vergleich die Ergebnisse für L3, geo, Gauß, LCV.
100
Subkorpora
Abb. 37: Histogramm der Kennwerte im Vokalismus (oben) und Konsonantismus (unten) (L3, pho, K3, CL; gestrichelte Linie: L3, geo, Gauß, LCV).
Auf den ersten Blick auffällig sind vor allem die abweichenden Werte für Homogenität. Ein Kolmogorov-Smirnov-Test94 zeigt die Eigenständigkeit der Verteilungen von Vokalen und Konsonanten in Bezug auf Kompaktheit, Homogenität und Komplexität sowohl für die Dichteschätzung mittels phonetischem Distanzmaß, K3-Kern und Bandbreitenschätzung nach dem CL-Verfahren als auch mittels geografischer Distanz, Gauß-Kern und Bandbreiten per LCV (vgl. Tabelle 4).
Kompaktheit Homogenität Komplexität
pho, K3, CL D p 0,1369 0,0012 0,2084 < 0,0001 0,1591 0,0001
geo, Gauß, LCV D p 0,2343 < 0,0001 0,2359 < 0,0001 0,0993 0,0405
Tab. 4: Ergebnisse der Kolmogorov-Smirnov-Tests zu Vokalen und Konsonanten.
Das Lautsystem ist also raumstrukturell nicht homogen. Ich betrachte daher Vokalismus und Konsonantismus im Folgenden einzeln. Wie in der oberdeutschen Dialektologie üblich, folgt die Behandlung der Vokale dem rekonstruierten mittelhochdeutschen Bezugssystem, nicht dem Phonemsystem der neuhochdeutschen Standardlautung. Beide Systeme (normalisiertes Mittelhochdeutsch und Neuhochdeutsch) stellen letztlich Konstrukte dar, allerdings ist für das mittelhochdeutsche System von Entsprechungen in den Dialekten auszugehen, für das Neuhochdeutsche nicht. 94 Der Kolmogorov-Smirnov-Test ist ein nichtparametrisches Verfahren, um zwei Wahrscheinlichkeitsverteilungen auf Übereinstimmung zu prüfen.
Lautung
101
Abbildung 38 zeigt die Rekonstruktion eines angenommenen mittelhochdeutschen Vokalsystems (nach WIESINGER 1983b, 1043–1045 sowie SCHMIDT 2004, 249– 251; ebenso HAAS 2010, 650), links die Kurzvokale, rechts die Langvokale und Diphthonge.
Abb. 38: System der mhd. Kurzvokale (links) sowie Langvokale und Diphthonge (rechts).95
Für Abbildung 39 wurden jeweils die Durchschnittswerte (C, L und B) der Karten zu einem mittelhochdeutschen Phonem ermittelt (L3, pho, K3, CL). Anschließend wurden die drei Werte pro Phonem als Wert für Rot (Kompaktheit), Grün (Homogenität) und Blau (Komplexität) im RGB-Farbraum interpretiert und die Positionen im Vokaltrapez entsprechend eingefärbt.96
Abb. 39: Kennwerte der Vokalkarten des SBS, in den RGB-Raum projiziert (links Kurzvokale, rechts Langvokale und Diphthonge) (in Farbe auf Seite 197).
95 Dieses System ist natürlich hypothetischer Natur, Aussagen zur genauen lautlichen Qualität der entsprechenden Realisierungen sind nicht möglich – schon allein, weil es auf schriftsprachbasierten Analysen beruht. Es soll auch in keiner Weise angedeutet werden, es hätte ein überregionales oder gar einheitliches mittelhochdeutsches System gegeben. 96 Zur Illustration: Hätten die Karten zu einem Phonem z. B. im Durchschnitt eine Kompaktheit von 1,0, eine Homogenität von 0,8 und eine Komplexität von 0, würde man 100 % Rot, 80 % Grün und 0 % Blau mischen. Das Resultat wäre ein kräftiges, helles Gelborange. (Die Idee verdanke ich HEERINGA 2004; vgl. auch oben, Seite 57.)
102
Subkorpora
Eine Verschiebung in den Bereich Lila/Blau zeigt an, dass relativ hohe Komplexität vorliegt, Ocker bzw. Gelb entsprechen genau dem Gegenteil (jeweils bei etwa gleichen Homogenitäts- und Kompaktheitsniveaus). Geht der Ton ins Grünliche, ist zusätzlich die Homogenität gegenüber der Kompaktheit erhöht. Im Bereich der Kurzvokale zeigt sich, dass die Hochzungenvokale (ebenso wie der Primärumlaut ä) komplexer sind, also einen höheren Grad an räumlicher Zersplitterung aufweisen – die Mittelzungenvokale haben komplementär dazu weniger unterschiedliche bzw. zusammenhängendere Areale. Der gleiche Gegensatz besteht zwischen steigenden (öü, ou) und fallenden (üə, uə) Diphthongen. Die strukturelle Nähe der langen Hochzungenvokale ist zwar weniger deutlich ausgeprägt als bei den Kurzvokalen, eine klare Tendenz (in Form relativ hoher Homogenität) zeigt sich aber dennoch.97 Wir sehen demnach einen Zusammenhang zwischen den geostatistischen Eigenschaften der Vokalkarten und ihrer systemischen Position. Anders formuliert: In der Raumstruktur dialektaler Variation spiegeln sich Reflexe von Reihenschritten wider. Das Beeindruckende daran ist nicht die wenig überraschende Beobachtung, dass Reihen empirisch nachweisbar sind, sondern, dass sie das auch nach der langen Abstraktionskette Exploration → Transkription → Kartierung → Dichteschätzung → Kennwertmessung → Mittelwertbildung der Kennwerte noch sind, und zwar nicht etwa über akustische Parameter der Vokale, sondern allein über die Raumstrukturen ihrer Verteilungen. Nun zu den Konsonanten: In Abbildung 40 sind mittels Boxplots die Werte für Kompaktheit, Homogenität und Komplexität (L3, pho, K3, CL) dargestellt. Sie sind auf neun Untergruppen des Konsonantismus unterteilt: bilabiale, alveodentale und velare Plosive, labiodentale, alveolare, velare und glottale Frikative, Liquide sowie Affrikaten (in der Abbildung jeweils von links nach rechts angeordnet). Nasale wurden im SBS nicht eigens kartiert. In den größeren Gruppen zeigen sich Ausreißer in den Daten, die auf nur teilweise kartierte Phänomene (also Ausschnittskarten) zurückzuführen sind (siehe oben, Seite 99). Der Löwenanteil der Karten unterscheidet sich zwar augenscheinlich nicht stark, allerdings scheinen die Velar- und Glottalfrikative systematisch auszuscheren: Sie weisen niedrigere Kompaktheits- und Homogenitätswerte bei höherer Komplexität auf, was für kleinflächigere Variation spricht. Mittels Kruskal-Wallis-Tests (vgl. diesbezüglich detaillierter 5.1.1, ab Seite 133) lässt sich das bestätigen (Kompaktheit: H = 44,4869, p < 0,0001; Homogenität: H = 42,2987, p < 0,0001; Komplexität: H = 24,8107, p = 0,0017). Im Konsonantismus findet sich also offenbar eine signifikante systematische Abweichung zwi97 Dies entspicht der (damals noch engeren) Reihenschrittdefinition WIESINGERS (1982), nach der als „Reihe“ nur Kombinationen aus jeweils zwei oder drei Hoch- bzw. Mittelzungenvokalen bzw. von ihnen ausgehenden Diphthongen in Frage kämen. Tiefzungenvokale träten nur in Ausnahmefällen als Teil einer Reihe auf, wobei es sich in diesen Fällen „phonetisch um eine gestörte Vokalreihe“ (WIESINGER 1982, 147) handle. Später (vgl. WIESINGER 2011) wird der Begriff der „Reihe“ – analog zur anglophonen Linguistik – weiter gefasst: Jede Gruppe an Lauten (also auch Konsonanten), die sich artikulationsphonetisch in Form einer Skala fassen lassen, könnten als Reihe angesehen werden.
Lautung
103
schen Lautklassen und Raumstruktur, die sich über die Kenngrößen nachweisen lässt.
Abb. 40: Vergleich der Kennwerte innerhalb des Konsonantismus.
4.2.2
Raumstrukturelle Ähnlichkeit der Kategorien (Cluster)
Zur unscharfen Clusterung der Lautkarten werden (parallel zur Faktorenzahl im kommenden Abschnitt) 17 Cluster veranschlagt. Abbildung 41 präsentiert die Anzahl von Karten mit maximaler Wahrscheinlichkeit für den jeweiligen Cluster, normalisiert im Verhältnis zu Clustergröße und Kategoriengröße.
Abb. 41: Absolute standardisierte Clusterzuweisungen der Lautkarten.
104
Subkorpora
Wie zuvor sind nur Kombinationen aus Kategorie und Cluster mit einem Quadrat versehen, bei denen dem Cluster mehr Karten zugewiesen werden als durchschnittlich zu erwarten wäre; bei zufälligen und unterzufälligen Ergebnissen (0 ≤ x ≤ 1) bleiben die Felder leer. Lokal signifikante Kombinationen (an den rohen Daten ermittelt, nicht an den normierten) werden durch vergrößerte Quadrate (= signifikant häufig) oder ein × (= signifikant selten) markiert. Zwei Testergebnisse erfüllen sogar das rigorose lokale Alphaniveau, das sich aus der BonferroniKorrektur (hier p < 0,000260) ergibt. Sie sind in der Abbildung mit Sternen gekennzeichnet; die Karten zu Alveolarplosiven sind signifikant häufig in Cluster 8 enthalten, die Labiodentalfrikative in Cluster 6. Die probabilistische Clustereinteilung der Kategorien ist Abbildung 42 zu entnehmen. Zur Erinnerung: Der Levelplot visualisiert die Wahrscheinlichkeit, mit der eine Karte einer jeweiligen Kategorie die prototypische Struktur eines Clusters erfüllt; die Durchschnittswahrscheinlichkeit (weiß) liegt bei 100 % / 16 Cluster = 6,25 % pro Cluster.
Abb. 42: Wahrscheinlichkeiten der Clusterzuweisung in der Lautung (in Farbe auf Seite 197).
Lautung
105
Wie das Dendrogramm an der Oberseite der Grafik verdeutlicht, sind insbesondere die Vokaluntergruppen besonders affin zueinander und treten mit sehr ähnlichen Wahrscheinlichkeiten gemeinsam auf. Für Abbildung 43 werden in einer differenzierteren Aufgliederung lediglich die Vokalklassen dargestellt, zunächst wieder in absoluter Form.
Abb. 43: Absolute standardisierte Clusterzuweisungen der Vokalklassen.98
Es zeigt sich, dass die Vokale zwar in der Aufteilung Kurzvokale / Langvokale / Diphthonge homogen wirken, sich in der genaueren Unterteilung aber weitere interne Differenzierungen zeigen. Die „natürlichen“ Unterklassen haben demnach nochmals voneinander abweichende Raumstrukturen – wenn auch weniger stark als die gröberen Kategorien der gesamten Lautung. Der Blick auf die probabilistische Zuweisung (Abbildung 44) bekräftigt diesen Eindruck.
98 Da die Klasse der kurzen Mittelzungenvokale weniger einheitlich als die anderen Klassen ist, wird sie nochmals in ungerundet (e-Laute) und gerundet (o und œ) untergliedert.
106
Subkorpora
Abb. 44: Wahrscheinlichkeiten der Clusterzuweisung der Vokalklassen (in Farbe auf Seite 198).
Die Unterschiede zwischen den einzelnen Klassen sind zwar interessant, aber tatsächlich relativ gering. Die jeweiligen Ähnlichkeiten zueinander lassen sich dementsprechend schlecht interpretieren; vermutlich gehen zumindest einige der Unterschiede eher auf pures statistisches Rauschen als auf linguistisch relevante Unterschiede zurück. 4.2.3
Geografische Grundstrukturen (Faktoren)
Zur Analyse tieferer räumlicher Zusammenhänge innerhalb des bayerischschwäbischen Lautsystems kommt erneut die Faktorenanalyse zum Einsatz. Dabei gilt der Blick zunächst wieder jeweils den Vokalen und Konsonanten einzeln, anschließend folgt die gesamte Lautung. Der Vokalismus ist in Abbildung 45 kartiert.
Lautung
107
Abb. 45: Dominante Faktoren im Vokalismus (in Farbe auf Seite 199).
Mittels 18 Faktoren lassen sich so 66,13 % der Varianz beschreiben. Für den stärksten (und großflächigsten) Faktor im Osten des Untersuchungsgebiets, der insgesamt 20,16 % der Varianz beschreibt, führt Tabelle 5 die stärksten zehn beteiligten Varianten auf. Wie zu sehen ist, kann er maßgeblich auf Langvokale und Diphthonge zurückgeführt werden (da alle der stärksten Karten zu Band 5 gehören), oder genauer: auf die für das Mittelostschwäbische charakteristische Diphthongrealisierung (vgl. KÖNIG 2010c).
108
Subkorpora
Karte
Variante
5118: mhd. ou in »auch« 5063: mhd. â vor l in »malen« 5124: mhd. ou vor (ehemaligem) Fortisfrikativ in »(ein)kaufen« 5125: mhd. ou vor (ehemaligem) Fortisfrikativ in »laufen« 5K63: Vorkommen von Kürze bei mhd. ȃ vor t in »Blater« 5119: mhd. ou in »glauben«/»Glaube(n)« 5068: mhd. æ vor (ehemaligem) Fortisfrikativ in »Sträßlein« 5121: Mhd. ou in »Auge(n)« 5128: mhd. ou/(öu) vor (ehem.) Fortisfrikativ in »Raufe(l)« 5086: mhd. æ/ȃ vor l in »Pfähle«
Typ âo Typ âo Typ âo Typ âo Typ âo Typ âo Typ âe Typ âo Typ âo Typ ȃe
Faktorwert 5,69 5,53 5,42 5,36 5,27 5,16 5,14 5,12 5,07 5,06
Tab. 5: Die zehn höchsten Faktorwerte zu Faktor 1 in Abbildung 45.
Hier stützen sich also die „klassischere“ und die quantitative Dialektologie gegenseitig: Dass in der quantitativen Analyse die stärkste identifizierte Grundstruktur im gesamten lautlichen Subkorpus mit einer klassisch als typisch angesehenen Einzelisoglosse koinzidiert, zeigt, dass a) die Kenntnis von ausgesuchten Experten auch auf nicht-quantitativer Basis zu repräsentativen, validen Aussagen führen kann und b) die Ergebnisse quantitativer Studien glaubwürdig sind und nicht grundsätzlich im Verdacht stehen müssen, lediglich Artefakte der statistischen Vorgehensweise zu sein. Den jeweiligen Intensitäten des Faktors pro Ort ist zu entnehmen, dass das Zentrum dieses Faktors, also der Punkt, an dem er die höchste Dominanz hat, gute 25– 30 Kilometer östlich des Großraums Ulm liegt. Der Faktor ist demnach nicht als urbane Erscheinung, die von Ulm aus ausstrahlt, zu sehen. Der zweitstärkste Faktor, der „keilförmig“ vom Nordosten in das Zentrum des Untersuchungsgebiets ragt, ist maßgeblich durch die Entwicklung von mhd. ou und â zu ô-Monophthongen sowie mhd. û zu ao (im Gegensatz zu den mittelostschwäbischen ouRealisierungen in Faktor 1) gekennzeichnet. Wie schon in der Lexik wird dieser Faktor bis nach Königsbrunn (156) punktuell dominant. Der oben als „Allgäu“ titulierte Raum reicht hier nicht nur weniger weit in den Norden hinein, sondern ist auch – wie es in der Lexik bereits latent angelegt war – auf zwei Faktoren aufgeteilt. Im Stadtgebiet Augsburg setzt sich ein Faktor in Stadtbergen (121), Augsburg (122) und Lechhausen (123) durch; auch in Landsberg (199) ist er dominant. Ein Faktor spiegelt das rechtslechische Gebiet südlich von Augsburg wider, das gemeinhin „Lechrain“ genannt wird.99 Die Spaltung des bairischen Raums östlich von Augsburg, die der Analyse der Lexik zu entnehmen ist, kann auch hier beobachtet werden; das Wittelsbacher Land tritt mit besonders hoher Intensität hervor. Am Nordrand des Untersuchungsgebiets treten auf wenig Raum sogar drei Faktoren dominant zu Tage, die am ehesten mit „Nordbairisch“ und „Oberostfränkisch“ (vgl. KÖNIG / RENN 2007, 25) in Einklang gebracht werden können.
99 Zum Lechrain sei grundlegend auf WÖLZMÜLLER (1987) verwiesen.
Lautung
109
Soweit zum Vokalismus; Abbildung 46 zeigt die 63,66 % der Varianz der Konsonantismusdaten, die durch eine Faktorenanalyse mittels ebenfalls 18 Faktoren beschreibbar ist.
Abb. 46: Dominante Faktoren des Konsonantismus (in Farbe auf Seite 200).
Im Gegensatz zum Vokalismus zeichnet sich der stärkste Faktor nicht im Westen, sondern in Form eines breiteren „Keils“ im Norden / Nordwesten ab, der auch in der Nachbarschaft Ulms dominant wird. Diese 18,62 % der Korrelationen, die durch Lenisierungen praktisch aller Konsonanten herbeigeführt wurden, sind ein klarer Reflex der binnenhochdeutschen Konsonantenschwächung (zum Phänomen näher SIMMLER 1983; KÖNIG 2001, 148–149). Sie zieht sich bis in das städtische Zentrum des Untersuchungsgebiets hinein, für das im Konsonantismus kein eigener dominanter Faktor existiert; generell stechen die bevölkerungsreichen Regionen im Vergleich zu den anderen Subkorpora am schwächsten heraus, lediglich
110
Subkorpora
ein schwacher, nirgends dominanter Faktor (Nummer 17 von insgesamt 18, mit 0,55 % beschriebener Varianz) bündelt Eigenheiten des Raums Augsburg und Landsbergs. Das dominante Gebiet des Lechrains ist im Vergleich zum Vokalismus zurückgedrängt, unter Einbezug seines latenten Anteils entsprechen sich die Strukturen aber. Deutlicher als im Vokalismus wird hier augenfällig, dass der „mittelostschwäbische“ Faktor, der in einem spürbar kleineren Areal dominant wird, nicht vom Stadtgebiet Ulm aus ausstrahlt, sondern ein ländliches Kerngebiet hat. Dass das „Allgäu“ in den Konsonantismusdaten zwar ebenfalls zweigeteilt ist, dabei aber andere Umbruchpunkte aufweist und vergleichsweise weit in den Norden reicht, zeigt, wie wenig belastbar ein grenzenorientierter Varietätenbegriff hier ist. Andere Gegensätze sind deutlicher: Was im mittelbairischen Faktor des Vokalismus als starker Intensitätsunterschied des Wittelsbacher Landes zu beobachten ist, tritt hier in der Form zweier getrennter Faktoren auf, wobei die Umschlagspunkte (abrupt von hoher zu niedriger Intensität im Vokalismus, von der Dominanz des nördlichen zum südlichen Faktor hier im Konsonantismus) sich entsprechen. Eine Interpretation als Exploratorengrenze liegt hier nahe; genauer wird dies im Rahmen der Analyse der gesamten Lautung ausgeführt. Weiterhin ist im Konsonantismus auch die räumliche Autokorrelation der Faktoren augenscheinlich am geringsten – ein Blick auf die Einzelfaktoren zeigt, dass die Faktoren räumlich weniger klar zusammenhängend sind als in den anderen Subkorpora. Die reine Geografie spielt demnach offenbar eine weniger große Rolle für den Konsonantismus als etwa für den Vokalismus. Den Abschluss der Interpretationen zur Lautung bildet eine Faktorenanalyse der gesamten lautlichen Daten.100 Diese stellt nicht einfach die Schnittmenge jeweils einer Analyse der Vokal- und der Konsonantendaten dar; mittels der Analyse auf Grundlage aller Lautdaten können auch Korrelationen zwischen Vokalen und Konsonanten gefunden werden, was prinzipiell Strukturen hervortreten lassen könnte, die in Einzelanalysen nicht zum Tragen kommen. In Abbildung 47 ist wieder jeweils der an einem Ort dominante Faktor kartiert; von insgesamt 16 Faktoren werden so neun direkt sichtbar. Die Faktorenanalyse fasst hier 63,70 % der ursprünglichen Varianz.
100 PRÖLL / PICKL / SPETTL (2015) enthält hierzu Vorergebnisse mit weniger Material (601 statt 831 Karten).
Lautung
111
Abb. 47: Dominante Faktoren der gesamten Lautung (in Farbe auf Seite 201).
In den Abbildungen 48 und 49 sind die einzelnen Faktoren kartiert, die aus den Daten extrahiert wurden.
112
Subkorpora
Abb. 48: Faktoren 1–10 der Lautgeografie.
Für Faktor 1, der wieder am besten als ‚Mittelostschwäbisch‘ zu apostrophieren ist, sind in Tabelle 6 diejenigen 10 Varianten aufgelistet, die die höchsten Faktorwerte aufweisen.
113
Lautung
Karte
Variante
7143: mhd. z (< germ. t) in »heraußen« 5118: mhd. ou in »auch« 5124: mhd. ou vor (ehemaligem) Fortisfrikativ in »(ein)kaufen« 7014: mhd. b im In- und Auslaut 7201: mhd. h (< germ. h) in »siehst du« 5125: mhd. ou vor (ehemaligem) Fortisfrikativ in »laufen« 5119: mhd. ou in »glauben/Glaube(n)« 4057: mhd. ë in »Besen« 5121: mhd. ou in »Auge(n) « 5K03: mhd. ü vor l in »Säulen«
mit Lenis-Frikativ, Typ hųșə Diphthonge vom Typ âo
Faktorwert 5,94 5,75
Diphthonge vom Typ âo
5,53
realisiert als Lenis-Plosiv Form ohne Reflex von mhd. h
5,49 5,45
Diphthonge vom Typ âo
5,43
Diphthonge vom Typ âo fallender Diphthong, Typ bę̄əsəm Diphthonge vom Typ âo Diphthonge vom Typ ei
5,35 5,34 5,33 5,30
Tab. 6: Faktorwerte der zehn stärksten Varianten in Faktor 1.
Auch unter Einbezug des gesamten Lautsystems tritt hier die Diphthongrealisierung hervor, ergänzt durch lenisierte/nullrealisierte Plosive und Frikative. Der benachbarte, zweitstärkste Faktor (Nordostschwäbisch) ist wie im Konsonantismus maßgeblich auf die binnenhochdeutsche Konsonantenschwächung zurückzuführen. Die nördliche, in etwa waagerechte Grenze zwischen den beiden stärksten Faktoren koinzidiert mit einer Exploratorengrenze: Hier treffen sich die Gebiete, in denen Edith Funk (im Norden) respektive Brigitte Schwarz (im Südwesten) zur Datensammlung aktiv waren. Vermutlich bedingt bzw. begünstigt dies den Umsprung der Dominanz, der sich – wie später zu sehen sein wird – auch in der Morphologie zeigt. Bereits in der Lexik konnte man einen latenten Gegensatz zwischen zwei Teilen des Allgäus sehen, die den Einzugsgebieten von Lech und Iller entsprechen. Diese Teilung ist hier dominant und wird durch die beiden Faktoren 3 und 8 abgedeckt. Die Faktoren 5 und 7 belegen den Raum scharf östlich des Lechs und – eher grob – südlich der Donau, der klassischerweise als „Mittelbairisch“ angesehen wird. Der schwächere Faktor 7 lässt zwei Interpretationen zu: Zum einen zeigt er an, wie stark der Gegensatz zwischen bairischem und alemannischem Raum besonders entlang des nördlichen Lechs (der trotz der Überwindung naturräumlicher Grenzen bis heute eine starke „mentale Grenze“ bildet, vgl. detaillierter 6.1.2, ab Seite 158) ist, indem er quasi neben Faktor 5 einen „zusätzlichen“ Gegensatz zum alemannischen Raum widerspiegelt. Zum anderen ist aber auch an einen systematischen Unterschied in den Erhebungen zu denken, da zwischen den relativ abrupt umschlagenden Arealen höchster Intensität eine Exploratorengrenze verläuft. Im Süden war Manfred Renn tätig, im Norden Edith Funk, der Werner König im Einführungsband attestiert, dass sie „weniger als die beiden anderen Exploratoren zu Transkriptionen neigt, die in Richtung phonematischer Vereinfachung gehen“ (SBS 1, 30). Faktor 4 (für den insbesondere Realisierungen von mhd. a ausschlaggebend sind) umgrenzt klar den Lechrain. Während Faktor 6 den nordbairischen Raum einfasst, dokumentiert Faktor 9 einen latenten Gegensatz, der sich auch in der Formengeografie zeigt: Positive Werte in der Staudenregion westlich von Augsburg stehen gegen das Ries im Nordwesten. Faktor 10 ent-
114
Subkorpora
spricht den bevölkerungsreichen Gebieten Ostschwabens, laut KIEßLING (2009, 47) einer „Städtelandschaft“, die „in Deutschland nur wenige Parallelen“ findet. In Augsburg (122), Lechhausen (123) und Landsberg am Lech (199) ist er der stärkste Faktor; neben den Augsburger Stadtteilen und Vororten treten auch Kaufbeuren (240), Kempten (262), Memmingen (205), Neu-Ulm (109), Dillingen (70), Nördlingen (17) und das Gebiet um Donauwörth (49) deutlich hervor. Ausschlaggebend sind hierfür insbesondere standardkonformere Varianten im Vokalismus wie monophthongische o-Realisierungen oder Kürze in Einsilblern wie Frosch, Stall oder Darm. Die durch Faktor 12 (in Abbildung 49) beschriebene Fläche deckt sich mit den Arealen, die von den SBS-Informanten als Einzugsgebiet des Marktorts Lauingen (früher) bzw. des Einkaufsorts Dillingen (zur Erhebungszeit) angegeben wurden (vgl. die Karten 12 und 13, SBS 1, 88–95). Für Faktor 11 könnte ein ähnlicher Zusammenhang zwischen Ulm / Weißenhorn (positiver Anteil) und Mindelheim (negativer Anteil) bestehen. In Faktor 13 (Abbildung 49) kann man den Übergang zum (oberost-) fränkischen Dialektraum erkennen, entsprechend der Form, wie er auch anderweitig („isoglossenbasiert“) dokumentiert ist (vgl. etwa KÖNIG / RENN 2007, 25). Faktor 15 zeigt – wie als Ergänzung zu Faktor 9 – den Gegensatz zwischen dem Holzwinkel und einem Areal, das mit der ehemaligen Grafschaft Oettingen (bzw. dem Ries) koinzidiert. Diese hebt sich nicht nur von ihrem Umland ab, weil sie „vom 14. Jahrhundert an bis zu ihrer Mittelbarmachung Anfang des 19. Jahrhunderts in vergleichsweise konstanter Form existierte“ (PICKL 2013a, 153), sondern auch, weil sie im Gegensatz zu den östlichen und südlichen Nachbarregionen überwiegend evangelisch war (PICKL 2013a, 153– 154). Faktor 16 stellt den Kernbereich des „Mittelostschwäbischen“ gegen den Wirtschaftsraum Memmingen. Seine Struktur im Nordosten ist (deutlicher) auch in der Morphologie identifizierbar und vermutlich als Übergangsstreifen zwischen Mittel- und Nordbairisch zu interpretieren; hier ist wohl im Sinne RUOFFS (1980, 100) von „Kontaminationsformen“, die sich „an Nahtstellen“ finden, auszugehen.
Lautung
Abb. 49: Faktoren 11–16 der Lautgeografie.
115
116
Subkorpora
4.2.4
Fazit
Die Analysen zur Lautgeografie bestätigen zunächst, dass die Interpretierbarkeit der Faktorenanalyse der Lexik (sowohl bei PICKL 2013a als auch im vorangegangenen Kapitel 4.1.3, ab Seite 91) kein Zufallstreffer ist. Auch hier erzeugen die Verfahren durchweg interpretierbare Ergebnisse. So deuten schon die Kennwerte (Kompaktheit, Homogenität und Komplexität) des Vokalismus darauf hin, dass potentiell reihenbildende Phoneme auch ähnliche Raumstrukturen aufweisen. Die Konsonanten betreffend schreibt Werner KÖNIG im Vorwort zu Band 7.1, dass die dort gesammelten Karten an einer bisher nie gekannten Zahl an Beispielen [zeigen], daß scheinbar identische lautliche Fälle verschiedene geographische Verteilungen besitzen können, ohne daß diese vorerst irgendwie vorausgesagt werden können. Das Oszillieren von Grenzen ist bisher noch nie so eindringlich gezeigt worden, vor allem nicht im Bereich des Konsonantismus. Nicht die Regularität steht hier im Mittelpunkt, sondern das Einzelphänomen, dessen Regelhaftigkeit erst durch weitere Analyse und auch durch weitere Fortentwicklung der sprachwissenschaftlichen Theorie gefunden werden muß. (SBS 7.1, V)
Tatsächlich lässt sich im Konsonantismus über die Kennwertinterpretation kein dem Vokalismus entsprechendes, deutliches Ergebnis zu Reihen o. ä. erzielen. Per Clusterung treten dagegen handfeste Unterschiede der Raumstrukturen der einzelnen Lautklassen zu Tage, im Vokalismus zum Teil so deutlich, dass beim multiplen Testen auf Signifikanz sogar das strenge Gütekriterium der BonferroniKorrektur erfüllt wird. Aufschlussreich ist, wie stark sich die Resultate der Faktorenanalyse auf den ersten Blick von denen der Lexik unterscheiden – gleichzeitig aber auch, wie verblüffend sie sich in anderen, latenten Strömungen ähneln. 4.3
FORMEN
Die noch nicht behandelten Bände 6 und 9 des SBS beinhalten Karten zur Morphologie und Syntax; der neunte Band wurde (wie schon der siebte im Bereich der Lautung) in zwei Teilbänden publiziert. Insgesamt liegen 541 Karten zur Formengeografie vor, auf die Verbalmorphologie (in Band 6 abgehandelt) entfallen davon 183 Karten. 330 weitere Karten, ursprünglich in Band 9 abgedruckt, behandeln die Variation der Nominalmorphologie.101 Der syntaktische Bereich ist schon im Print-SBS mit insgesamt nur 32 Karten (9370–9401) sehr knapp gehalten; davon konnten 28 digital aufbereitet werden, komparative Aussagen zur Syntax sind daher schwer realisierbar und auch dann noch mit gewisser Vorsicht zu betrachten. Nachdem die Syntaxkarten nicht einmal ein Prozent der Gesamtkartenzahl ausmachen, sollten sie für die weitere Analyse in ein größeres Teilkorpus eingebunden werden. Ursprünglich sind 101 Erwähnt werde sollte hier jedoch, dass die Grenze zu rein lautlichen Phänomenen insbesondere bei den Formenkarten mitunter nicht so klar ist, wie die Aufteilung in Bände es suggeriert.
117
Formen
die Karten dem letzten Abschnitt von SBS-Band 9.2 (ansonsten zur Nominalmorphologie) zugeordnet – das wird entsprechend auch hier anvisiert. Um die Tauglichkeit dieser Zuordnung auf den Prüfstand zu stellen, sind in Abbildung 50 die für die Nomina (oben) und die Syntax (unten) ermittelten Kennwerte in Form von Histogrammen gegenübergestellt.102
Abb. 50: Histogramme der Kennwerte für Nomina (oben) und Syntax (unten) (L3, mor, K3, CL; gestrichelt: L3, geo, Gauß, LCV).
Der visuelle Vergleich legt nahe, dass eine Einordnung unter die Nominalmorphologie unproblematisch wäre (die Schiefe der Komplexität scheint zwar abweichend, das muss der niedrigen absoluten Zahl wegen aber nicht zwangsläufig bedeutsam sein). Ein Kolmogorov-Smirnov-Test für alle drei Kennwerte (vgl. Tabelle 7) legt nahe, dass beide Gruppen aus der gleichen Verteilung stammen: Die p-Werte der Tests sind für Kompaktheit und Homogenität weit über dem kritischen Niveau von 0,05, unter dem die Nullhypothese einer gleichen Verteilung in signifikantem Maße unwahrscheinlich wäre. Lediglich die Komplexität weicht bei geo / Gauß / LCV eventuell ab.
Kompaktheit Homogenität Komplexität
pho, K3, CL D p 0,0941 0,9799 0,1102 0,8872 0,1287 0,8032
geo, Gauß, LCV D p 0,1845 0,3635 0,1381 0,7278 0,3190 0,0125
Tab. 7: Ergebnisse der Kolmogorov-Smirnov-Tests zu Nomina und Syntax. 102 Wie in der Lautung gilt auch hier: Histogramme und durchgezogene Dichtelinien beruhen auf L3, mor, K3-Kern, CL; gestrichelte Dichtelinien auf L3, geo, Gauß, LCV.
118
Subkorpora
Daher werden die Syntax-Karten im Folgenden meist zusammen mit den anderen Karten aus Band 9 behandelt – Abweichungen von dieser Praxis werden explizit angezeigt. 4.3.1
Kennwertanalysen
Auch hier bietet sich zunächst ein rein deskriptiver Blick auf die raumstatistischen Eigenschaften der einzelnen Karten an: Abbildung 51 zeigt ihre Kennwertplots.
Abb. 51: Zusammenhänge der Kenngrößen der Formen (L3, mor, K3, CL).
Analog zur Lautung (vgl. Abbildung 36, Seite 99) ist die Korrelation zwischen Kompaktheit und Homogenität der Karten geringer als in der Lexik (vgl. Abbildung 28, Seite 85), da eine kleine Gruppe an Karten bei relativ geringer Kompaktheit hohe Homogenitätswerte zeigt. Auch hier ist das auf die Kartierungsweise der Originalpublikation zurückzuführen (siehe die diesbezüglichen Ausführungen auf Seite 99). Der Vergleich der Kennwerte der Verben und Nomen/Syntax ist Abbildung 52 zu entnehmen. Wie oben beschreiben die Histogramme und durchgezogenen Dichtelinien L3, pho, K3-Kern, CL, die gestrichelten Dichtelinien zum Vergleich L3, geo, Gauß, LCV. Was schon für die Vokale gilt, wiederholt sich hier mit den Verben; zwischen der Verbalmorphologie und den anderen Karten besteht offenbar ein Unterschied.103 Ein Kolmogorov-Smirnov-Test bestätigt diese Vorahnung (vgl. Tabelle 8). Kompaktheit sowie Komplexität der Verben und der Nomen/Syntax unterscheiden sich; je nach Typus der Intensitätsschätzung gilt dies auch für die Homogenität.
103 Noch stärker als in der Lautung sieht man anhand der Komplexitätskurven auch einen systematischen Unterschied zwischen den beiden Dichteschätzverfahren: Bei euklidischem Abstand erhöht sich der Anteil an Karten mit einer Kantenlänge von 0 km. Offenbar treten kleinräumige dominante Variantenflecken bei linguistischem Abstand eher hervor, geografisch werden sie dagegen eher weggeglättet.
119
Formen
Abb. 52: Histogramme der Kennwerte der Formen (L3, mor, K3, CL; gestrichelt: L3, geo, Gauß, LCV).
Kompaktheit Homogenität Komplexität
pho, K3, CL D p 0,2399 < 0,0001 0,1225 0,0537 0,2449 < 0,0001
geo, Gauß, LCV D p 0,2972 < 0,0001 0,1907 0,0003 0,1744 0,0013
Tab. 8: Ergebnisse der Kolmogorov-Smirnov-Tests zu Verben und Nomen/Syntax.
Häufig wird ein Zusammenhang zwischen der Gebrauchsfrequenz eines Verbs und seiner Zugehörigkeit zur starken oder schwachen Flexion vermutet (an exponierter Stelle zuletzt durch LIEBERMAN et al. 2007 bestätigt). Für Dialektmaterial sind frequenzbezogene Erklärungsmuster allerdings methodisch problematisch, da sich Gebrauchsfrequenzen für Dialekte im Regelfall nur sehr schwer empirisch ermitteln lassen. PICKL (2013a, 120–125) zeigt, dass die Frequenz eines Lexems, so wie sie aus Häufigkeitswörterbüchern gewonnen werden kann, offenbar nicht in Zusammenhang mit der Komplexität, Kompaktheit und Homogenität seiner Karte steht. Ich kombiniere zum Test zwei Hypothesen – hochfrequente Verben seien stabiler in der starken Flexionsklasse, Niederfrequentes sei kleinräumiger verteilt. So müsste über die Zugehörigkeit zur Flexionsklasse (die hypothetisch von der Gebrauchsfrequenz beeinflusst ist) eine Aussage zur Raumstruktur möglich sein. Ein entsprechender Vergleich starker, schwacher und besonderer Verben (zu letzteren zähle ich hier auch die Präteritopräsentia) ist in der Form von Boxplots in Abbildung 53 visualisiert.
120
Subkorpora
Abb. 53: Vergleich der Kennwerte innerhalb der Verben.
Es ist augenfällig, dass kein relevanter Unterschied besteht; dies lässt sich jeweils durch einen Kruskal-Wallis-Test für jeden Kennwert klar bestätigen. Mit unseren geostatistischen Methoden lässt sich demnach zumindest über die Kennwerte kein geografischer Strukturunterschied zwischen den verbalen Flexionsklassen nachweisen; die im System vergleichsweise „markierteren“ starken bzw. besonderen Verben weichen von ihrer Raumstruktur her nicht merklich vom schwachen Paradigma ab. Die Untergruppen der Nominalmorphologie scheinen in Bezug auf die Kennwerte weiter zu streuen, wie die Boxplots in Abbildung 54 verdeutlichen.
Abb. 54: Vergleich der Kennwerte innerhalb der Nomina.
Ein Kruskal-Wallis-Test zeigt, dass sich hier die Werte im Gruppenvergleich signifikant unterscheiden; ausschlaggebend hierfür ist die vergleichsweise höhere Kompaktheit der Orts- und Richtungsadverbien im Vergleich zu Pronomen und
Formen
121
Substantiven sowie der Homogenitäts- und Komplexitätsunterschiede zwischen Pronomen auf der einen und Substantiven auf der anderen Seite.104 4.3.2
Raumstrukturelle Ähnlichkeit der Kategorien (Cluster)
Wie bereits bei Wortschatz und Lautung geschehen soll nach der Kennwertanalyse auch direkt die Raumstruktur der einzelnen Karten per Clusterung auf Regelmäßigkeiten überprüft werden. Abbildung 55 zeigt dazu in schon bekannter Manier den relativen Anteil an Karten einer Kategorie, der dem Zentrum des jeweiligen Clusters am nächsten ist – überzufällige Kombinationen werden durch ein Quadrat gekennzeichnet. Die Grauskala, die den Faktor für den Grad an Überzufälligkeit angibt, wurde wieder beim Fünffachen des Zufallswerts abgeschnitten, um die Interpretation des Gros der Werte nicht wegen ein paar hohen Einzelwerten zu erschweren. (Diese Ausreißer sind der insgesamt geringeren Zahl an Formenkarten und den daraus resultierenden kleinen Kategoriegrößen geschuldet.) Einige Zuweisungen sind auf einem lokalen Alphaniveau von p = 0,05 signifikant (visualisiert durch größere Quadrate für signifikant hohe und ein × für signifikant niedrige Werte), ein globales Alphaniveau von p = 0,05 – das hier ein lokales Niveau von p < 0,000174 erfordert – wird genau einmal erreicht (visualisiert durch einen Stern). Die Karten zu Infinitiv und Konjunktiv scheinen relativ deutlich zu einigen wenigen Clustern zu gehören. Das gilt auch für die (sehr kleinen) Gruppen zu Gerund und Zahlwörtern; auch die Personalformen des Verbs, die Orts- und Richtungsadverbien sowie die Syntax sind in jeweils einem Cluster auffällig, scheinen also eher eine Raumstruktur zu haben, die sie von anderen Kategorien unterscheidet. Die Gruppen Besondere Verben und Besonderheiten des Wurzelvokals bei starken Verben sind dagegen offenbar in Bezug auf ihre Raummuster ähnlicher; wie in Wortschatz und Lautung lassen sich kleine „Außenseiter“-Cluster mit wenigen überdurchschnittlichen Ergebnissen (1, 5, 8) ebenso beobachten wie große Cluster mit vielen durchschnittsnahen Zusammenhängen (7, 12, 15), in denen sich tendenziell häufigere Grundstrukturen sammeln.105
104 Ermittelt wurde dies durch post-hoc durchgeführte Wilcoxon-Mann-Whitney-Tests mit korrigiertem α-Niveau (Bonferroni-Korrektur). 105 Zwei der „Außenseiter“-Gruppierungen sind bereits als Beispiel aus dem Technik-Kapitel bekannt (Abbildung 25, Seite 78): Cluster 2 und 8, die in der Hauptsache die Raumstruktur einer Teilmenge der Karten zum Konjunktiv wiedergeben.
122
Subkorpora
Abb. 55: Absolute standardisierte Clusterzuweisungen der Formen.
Abbildung 56 widmet sich den durchschnittlichen Wahrscheinlichkeiten, mit denen eine Karte einem Clusterzentrum entspricht; wiederum wurden diejenigen Kategorien ausgeklammert, deren Kartenzahl kleiner als die Clusterzahl ist, da eine Mittelwertberechnung hier wenig sinnvoll wäre. Die erwartete Wahrscheinlichkeit (weiß) liegt wieder bei 100 % / 16 Cluster = 6,25 % pro Cluster. Die Einzelkategorien zu Adjektiven (Flexion und Bildung) wurden testweise fusioniert. Das Ergebnis ist – im direkten Vergleich mit der „harten“ Zuweisung der einzelnen Kategorien in Abbildung 55 – zunächst erklärungsbedürftig, was das Spannungsfeld zwischen Muster und Zufall erneut anschaulich illustriert. Es zeigt sich, dass die Zuordnungswahrscheinlichkeiten zu Clustern, zu denen nur eine der beiden Kategorien in der vorgeschalteten „harten“ Analyse überdurchschnittlich beiträgt, hier gemeinsam oft unterdurchschnittlich sind.
Formen
123
Abb. 56: Wahrscheinlichkeiten der Clusterzuweisung der Formen (in Farbe auf Seite 202).
Das erlaubt zwei Interpretationen: Entweder sind die Clusterzuweisungswahrscheinlichkeiten der Adjektivkarten grundsätzlich eher niedrig (sie werden dann unter hartem Blickwinkel als eher schlechte Karten zwar ihren Hauptclustern zugewiesen, unter unscharfem Blick besteht zwischen mehreren Clustern aber fast kein Unterschied an Zuweisungswahrscheinlichkeit), oder die beiden Kategorien haben unterschwellig gegenläufige Tendenzen, die sich in der harten Zuweisung nicht zeigen können, sich im Unscharfen aber gegenseitig austarieren. Der Blick auf die Werte der Einzelkarten führt zur unbefriedigenden Einsicht, dass es ein wenig von beidem ist. Einerseits herrscht mit Karten, die ziemlich eindeutig zugewiesen werden, Regelhaftigkeit; gleichzeitig existiert aber eine kritische Masse an Karten, die sich idiosynkratisch zeigen und entweder scheinbar zufällig zu anderen Clustern affin sind oder durchweg sehr niedrige Zuweisungswahrschein-
124
Subkorpora
lichkeiten haben, also von keinem Cluster ausreichend gut erfasst werden können. Als Folgerung bleibt, dass die Adjektivkarten als Ganzes kein gemeinsames Raumbild haben und daher aus raumstrukturellem Blickwinkel eine Kategorie „Adjektiv“ schlicht untauglich ist. Andere Ergebnisse sind leichter zu interpretieren: Die Resultate zu den Konjunktivkarten bekräftigen das in der harten Clusterung gewonnene Bild einer „Außenseiterstellung“ unter den Formenkarten. Auch der eigenständige Status der Pronomen, der bereits in den Kennwertanalysen aufscheint, ist den Zuweisungen abzulesen. 4.3.3
Geografische Grundstrukturen (Faktoren)
Beim Blick in die geografischen Grundstrukturen werden auch in der Morphologie zunächst Verben und Nomen einzeln auf ihre Raumstrukturen hin untersucht, dann erst die gesamten Daten. Für die Teilanalysen wird wieder auf die Abbildung und Interpretation jedes einzelnen Faktors verzichtet. Die Synopse der Verbalfaktoren ist in Abbildung 57 kartiert. Mit 68,21 % erfasster Varianz ist die Faktorenanalyse der Verbalmorphologie im Vergleich am nähesten am Originaldatensatz. Auffällig ist, dass in der Verbalmorphologie – im Gegensatz zu allen anderen Resultaten der Faktorenanalyse – offenbar kein Unterschied zwischen dem ostschwäbischen Raum einerseits und dem Allgäuer Raum andererseits existiert. Der stärkste, gemeinsame Faktor (rot), der mit 23,18 % fast ein Viertel der Variation beschreibt, speist sich besonders stark – aus Infinitivrealisierungen von kontrahierten bzw. Wurzelverben: lǫ̂̃ũ(n) für lassen, štǫ̂̃ũ und gǫ̂̃ũ für stehen und gehen sowie – aus Formen des Plural Indikativ Präsens mit auslautendem Dentalplosiv: ręxnəd, nẹməd, khọməd, štandəd für (wir/ihr/sie) rechnen, nehmen, kommen, stehen. Zu dem zweitstärksten Faktor, dem „Keil“ aus dem Nordwesten, tragen besonders stark Varianten mit ǫ als Wurzelvokal (2./3. Singular Indikativ Präsens) bei, wie štǫš, gǫš, hǫš(d) für (du) stehst, gehst, hast sowie štǫd, gǫd für (er) steht, geht. Im Norden setzt sich ein „oberostfränkischer“ (vgl. KÖNIG / RENN 2007, 25) Faktor durch. Im Übergangsbereich zwischen diesem „oberostfränkischen“, dem „nordbairischen“ und dem „mittelbairischen“ Raum tritt ein weiterer Faktor auf, der allerdings nirgends dominant wird. Zu ihm tragen besonders stark Varianten mit kurz realisiertem Stammvokal bei (nach dem Prinzip einer Realisierung von geeggt als gĕgd gegen gēxd und gēgd im Norden und geg im Süden). Der „mittelbairische“ Faktor ist in Wulfertshausen (124) und Harthausen (125), also direkt östlich von Augsburg/Lechhausen, am stärksten.
Formen
125
Abb. 57: Dominante Faktoren der Verbalmorphologie (in Farbe auf Seite 203).
Abbildung 58 stellt die dominanten Faktoren des Nominalsubkorpus dar. Mit insgesamt 59,55 % erklärter Varianz hat die Faktorenanalyse hier im Vergleich mit den anderen Subkorpora die zweitschwächste Erklärungskraft, knapp über der Lexik (siehe hierzu ausführlicher 6.3.5, ab Seite 172). Auf den ersten Blick wirken die dominanten Faktoren der Nominalmorphologie auch räumlich weniger kohärent als die oben analysierten Subkorpora. Stärkster Faktor ist wieder der mittelostschwäbische, hier allerdings in anderer Konfiguration mit dem Allgäuer Faktor: Die Übergangsregion, die als eigener Faktor dominant wird, ist bis zu 45 Kilometer (Luftlinie) breit. Wie in der Verbalmorphologie gibt es im Nordosten einen Gegensatz zwischen Oberostfränkisch, Nordbairisch und Mittelbairisch, mit einem schwächeren Übergangs- oder Ausgleichsfaktor dazwischen. Auch im westlichen Umland Augsburgs kommt es zu
126
Subkorpora
einer starken Durchmischung verschiedener Faktoren, wobei ein „Stauden“Faktor knapp dominant wird.
Abb. 58: Dominante Faktoren der Nominalmorphologie (in Farbe auf Seite 204).
Neben dem in den systembildenden Subkorpora omnipräsenten Lechrain sticht am östlichen Rand des Untersuchungsgebiets Mammendorf (174) aus dem Umfeld heraus, zusammen mit Oberottmarshausen (155) weiter westlich und Lachen (221) im Südwesten. Hier handelt es sich nicht um ein sprachliches Phänomen, sondern ein erhebungsbedingtes: An einigen Erhebungsorten wurde nicht das gesamte Fragebuch abgefragt, was zu fehlenden Belegen im Datensatz führt. An diesen drei Orten sind die Lücken groß genug, um im nur 358 Karten umfassenden Nominalsubkorpus dominant zu werden (siehe grundlegend SBS 1, 17 sowie weiterführend unten 6.3.2, ab Seite 168, und 6.3.5, ab Seite 172). Im äußersten Südosten fällt ein Faktor auf, der sich exklusiv in der Nominalmorphologie zeigt.
Formen
127
Seine stärksten Variablen sind größtenteils lokaler bzw. deiktischer Natur, z. B. denen (... werde ich es geben), herauf (Sag ihm, er soll zu uns ... kommen), heroben, hinauf (Er geht auf den Berg ...) usw. Sein Areal entspricht dem „südbairischen“ Gebiet, das auch REICHEL (2003) im Rahmen einer Systematik der Richtungs- und Lageadverbien in Bayern ermittelt. Testweise wurde auch eine Faktorenanalyse der wenigen Syntaxkarten durchgeführt – naturgemäß ist die Karte aufgrund der dünneren Datengrundlage relativ rau (Abbildung 59, Varianz: 83,85 %).
Abb. 59: Dominante Faktoren der Syntax (in Farbe auf Seite 205).
Eine grundlegende Ähnlichkeit zur Struktur der anderen Subkorpora ist erkennbar (man vergleiche etwa die nordöstliche Ecke, den angedeuteten Lechverlauf oder die Trennung in „Allgäu“ und „Mittelostschwäbisch“), sollte aber nicht überbewertet werden.
128
Subkorpora
Die Analyse aller Formenkarten gemeinsam ist in Abbildung 60 zu sehen. Hier beschreibt die FA insgesamt 61,01 % der zugrundeliegenden Variation.
Abb. 60: Dominante Faktoren in Verbal-, Nominal- und Syntaxdaten (in Farbe auf Seite 206).
In der Gestalt der Gesamtmorphologie setzt sich die Teilung des ostschwäbischen und allgäuerischen Raums durch, mit einem Übergangsbereich, der dem der Nominalmorphologie entspricht. Der gesamte Norden entspricht im Grunde den Einzelanalysen – im Vergleich zu Wortschatz und Lautung fällt auch hier der oberostfränkische Faktor auf. Die Trennung zwischen mittelbairischem und lechrainischem Raum ist in dieser Form aus der Lautung geläufig. Abbildungen 61 bis 63 zeigen jeweils die einzelnen Faktoren hinter dem Gesamtbild.
Formen
129
Abb. 61: Faktoren 1–7 der Formengeografie.
Die Strukturen der stärksten Faktoren ähneln denen der Lautung, als deutlichste Abweichung hat der zusätzliche „fränkische“ Einschlag durch Faktor 7 zu gelten – der Übergangsbereich vom Nord- zum Mittelbairischen (hier Faktoren 6 und 4) verläuft in der Lautung jedoch über einen deutlicheren Übergangsfaktor. Neben den subdominanten Feinheiten der großen Faktoren ist in der Einzeldarstellung wiederum vor allem interessant, inwiefern sich in schwächeren, kleinflächigeren Faktoren Gegensätze innerhalb der stärkeren, größeren Faktoren finden: In Faktor 8 steht innerhalb des Allgäus das Mindelheimer Einzugsgebiet im schwachen, aber räumlich kohärenten Kontrast zum restlichen Mittelschwäbischen. Während Faktor 9 die Wasserscheide zwischen Iller und Lech zeigt, stellt Faktor 10 (wie schon in der Lexik dominant und der Lautung latent zu beobachten) die Region der Westlichen Wälder (bzw. hier etwas kleinräumiger der Stauden) gegen das Ries.
130
Subkorpora
Abb. 62: Faktoren 9–13 der Formengeografie.
Das Zusammenwirken der positiven und negativen Teile von Faktor 11 legt einen latenten Gegensatz innerhalb des Mittelbairischen nahe (der in der Lautung dominant erscheint). Ein Blick in die Ladungen der beteiligten Varianten zeigt, dass
Formen
131
dieser Faktor wieder besonders stark von deiktischen Elementen geprägt wird: Realisierungen von „herauf“, „stehend/im Stehen“ und „hinauf“ geben im positiven Teil den Ausschlag, die nördlicheren Realisierungen von „herauf“ und „hinauf“ prägen aber gleichzeitig auch die negative Seite des Faktors. Die Südgrenze der negativen Seite ist jedoch auch eine Exploratorengrenze (Edith Funk im Norden, Manfred Renn im Süden), eventuell ist diese Unterscheidung also auch ein Artefakt der Erhebung. Faktor 12 ist wiederum sowohl geografisch als auch sprachlich ein „städtischer“ Faktor, zu dem insbesondere standardnahe Varianten beitragen. Faktor 13 entspricht dem Einzugsgebiet Lauingens (vgl. ausführlicher PICKL 2013a, 182–183).
Abb. 63: Faktoren 14–16 der Formengeografie.
Faktor 14 scheint dem bayerisch-schwäbischen Teil der Grafschaft Oettingen zu entsprechen, die (wie bereits im Rahmen der Lautungsanalysen ausgeführt) über einen längeren Zeitraum evangelisch war; eventuell spielt hier demnach auch ein konfessioneller Unterschied eine Rolle. In Faktor 15 treten die Orte mit Teilaufnahmen an die Oberfläche, die bereits im Rahmen der Analyse der Nominaldaten
132
Subkorpora
angesprochen wurden, dazu zeigt er aber auch latente Strömungen, Turbulenzen innerhalb größerer, oberflächlich scheinbar homogener Areale, die erneut im schwächsten Faktor auftreten. Dessen negativer Teil überwiegt gar den positiven; diese Strukturen beider Faktoren sind wohl als Bündelung mehrerer „Übergangsfaktoren“ zu interpretieren. 4.3.4
Fazit
Obwohl die Kennwerte der Formengeografie tendenziell weniger auf einen Systemcharakter der Morphologie hindeuten als die entsprechenden Analysen der Lautung, entsteht dennoch bereits hier der (erwartbare) Eindruck, dass sie der Lautung näher stehen als dem Wortschatz – zu Beginn des folgenden Kapitels soll dies im Detail überprüft werden. In der Clusterung der Formen zeigt sich besonders deutlich, dass wenige idiosynkratische Karten größeren Verbänden sehr paralleler Karten gegenüberstehen – ob dies tatsächlich dem Gegenstand oder nur der vergleichsweise kleineren Datenbasis (in der Ausreißer deutlicher durchschlagen können) geschuldet ist, muss anderweitig geklärt werden. Auch die dominanten Strukturen der Faktorenanalyse ähneln relativ offensichtlich denen des anderen systembildenden Subkorpus, der Lautung; neben Abweichungen, die auf einzelne Orte begrenzt sind, unterscheiden sich hauptsächlich die Übergänge vom Nord- zum Mittelbairischen und vom Ostschwäbischen zum Allgäu. Im Gegensatz zur Lautung wird die Teilung des Allgäus nicht dominant, dafür existiert ein eigener „fränkischer“ Faktor.
5
GESAMTSYSTEM UND VARIETÄTENKONSTRUKTION
Nach dem Blick auf (sub-)systeminterne Variation in Kapitel 4 gilt es nun, möglichst ein Gesamtbild der Variation zu erstellen. Dazu stellt Abschnitt 5.1 zunächst die Daten der Subkorpora nebeneinander. Abschnitt 5.2 zeigt den Versuch, zu einer Darstellung des Gesamtsystems (also einer gesamten Varietät) zu kommen; daraus ergeben sich zum Abschluss des Kapitels (Abschnitt 5.3) auch Schlussfolgerungen zur grundsätzlichen Unschärfe von Varietäten sowie zur Perspektiven- und Datenabhängigkeit. 5.1
VERGLEICH DER SUBKORPORA 5.1.1 Kennwerte
Zunächst steht auf dem Prüfstand, ob sich anhand der Kennwerte der Einzelkarten ermitteln lässt, ob geostatistisch gesehen ein Unterschied zwischen den Subkorpora existiert. Als rein deskriptiver Einstieg dient Abbildung 64 mit einem Vergleich der Scatterplots der Teilgruppen und des Gesamtkorpus, Tabelle 9 führt die jeweiligen Korrelationskoeffizienten (Pearson) an. Es ist klar erkennbar, dass sich die Grundtendenzen – wenig überraschend – ähneln, gleichzeitig aber auch, dass sich die Teilkorpora nicht entsprechen. Neben der höheren Anzahl an Ausreißern in Lautung und Formen (mit hoher Homogenität, aber niedriger Kompaktheit), die auf Teilkartierungen zurückzuführen sind (siehe oben, 4.2.1, ab Seite 99), weisen im Wortschatz mehr Karten sowohl niedrigere Homogenität als auch Kompaktheit auf.
134
Gesamtsystem und Varietätenkonstruktion
Abb. 64: Zusammenhänge der Kenngrößen im Gesamtsystem (L3, lex / pho / mor, K3, CL).
Tab. 9: Werte zu Abbildung 64.
Die Histogramme in Abbildung 65106 vertiefen zusammen mit Tabelle 10 den Blick auf die Kennwerte der drei Subkorpora.
106 Auch hier sind wieder zwei verschiedene Parameterkombinationen der Intensitätsschätzung zum Vergleich parallel dargestellt: Die Histogramme und durchgängigen Linien zeigen L3, lex / pho / mor, K3, CL, die gestrichelten Linien L3, geo, Gauß, LCV.
Vergleich der Subkorpora
135
Abb. 65: Histogramme zu den Kennwerten der Subkorpora (L3, lex / pho / mor, K3, CL; gestrichelt: L3, geo, Gauß, LCV).
Grundsätzlich sind Kompaktheit und Homogenität linksschief verteilt (skew). Das ist als gutes Zeichen für die Aussagekraft unserer Methoden interpretierbar, da dies für relativ viele hohe Werte spricht, die wiederum zeigen, dass die intensitätsgeschätzten Karten die zugrundeliegenden Daten gut wiedergeben. Vor allem in der Lautung ist zusätzlich die hohe Wölbung (kurtosis) auffällig.
136
Gesamtsystem und Varietätenkonstruktion
Tab. 10: Statistische Werte der Subkorpora.
Ob und wie sich Unterschiede der Subkorpora statistisch aufspüren und testen lassen, ist ein typisch sozialwissenschaftliches Problem und ist daher am besten mittels Verfahren klärbar, die in den entsprechenden Disziplinen gängig sind. Untersucht werden soll der Zusammenhang zwischen einer kategorialen Variable – der Gruppenzugehörigkeit der Karte, also dem Subkorpus – und einer (bzw. mehreren) intervallskalierten Variable(n) – den Kennwerten der einzelnen Karten. Das ist z. B. analog zu psychologischen Studien zu sehen, die den Einfluss einer Kategorie (etwa Geschlecht) auf eine kontinuierliche Observation (wie Aggressivität) untersuchen. Klassisches Mittel dazu ist die sogenannte Varianzanalyse, auch ANOVA (analysis of variance) genannt. Die Varianzanalyse ist ein parametrisches Verfahren, das zwei Voraussetzungen an die Daten stellt: Die Werte innerhalb der Gruppen sollten möglichst – normalverteilt sein und – homogene Varianz aufweisen (vgl. SEDLMEIER / RENKEWITZ 2008, 448). Schon der erste Blick auf einen Plot der Daten zeigt, dass von einer Normalverteilung wohl nicht auszugehen ist; ein Kolmogorov-Smirnov-Test (der hier die empirische Verteilung mit der zu erwartenden Normalverteilung vergleicht) bestätigt dies. In SEDLMEIER / RENKEWITZ (2008, 449) wird jedoch betont, dass „Abweichungen von der Normalverteilung die Wahrscheinlichkeit für einen α-Fehler nur unwesentlich“ beeinflussen, außer man untersuche „sehr kleine Stichproben oder die Populationsverteilungen sind extrem schief“. Die Verletzung des Varianzhomogenitätspostulats sei bei gleich großen Gruppen nicht problematisch, bei verschieden großen Gruppen allerdings schon. Unsere Gruppen sind deutlich unterschiedlich groß und weisen laut dafür durchgeführten Levene-Tests auch keine Varianzhomogenität (Homoskedastizität) auf. Die Voraussetzungen für eine valide Varianzanalyse sind daher nicht gegeben – ich folge der Empfehlung von SEDLMEIER / RENKEWITZ (2008, 581) und nutze stattdessen nicht-parametrische
Vergleich der Subkorpora
137
Rangtests, die unter diesen Umständen „bei der Signifikanzprüfung verlässlichere Ergebnisse“ liefern. Als nicht-parametrische Alternative zur Varianzanalyse mit mehr als zwei Gruppen wird gemeinhin der Kruskal-Wallis-Test (oder H-Test) genannt (vgl. z. B. ADLER 2010, 404). Ein Kruskal-Wallis-Test der Daten zu Abbildung 65 zeigt, dass sich die Ebenen in Hinsicht auf Kompaktheit, Homogenität und Komplexität hoch signifikant unterscheiden; die Wahrscheinlichkeit für die Nullhypothese (= gleiche Population der Stichproben) liegt jeweils praktisch bei Null (p ≪ 0,0001). Für die gestrichelt angedeutete andere Intensitätsschätzung mit den Parametern L3, geo, Gauß, LCV sind die Ergebnisse für Kompaktheit und Homogenität vergleichbar, lediglich die Komplexität schert hier aus (p = 0,5714). Post-hoc-Tests (auf einem Signifikanzniveau von p = 0,001) belegen außerdem, dass die Unterschiede zwischen Lautung und Formen untereinander vernachlässigbar sind, im Vergleich mit der Lexik aber jeweils nicht (vgl. Tabelle 11).
Tab. 11: Multiple comparison test (Kruskal-Wallis, p = 0,001) der Subkorpora.107
5.1.2
Systematische Verzerrungen
Was verursacht die Abweichung der Lexik in Bezug auf Kompaktheit und Homogenität? Eine mögliche Erklärung liefert der Blick auf die jeweilige Anzahl an Varianten auf einer Karte – diese ist nämlich nicht gleichmäßig über das Korpus verteilt. Abbildung 66 stellt die durchschnittliche Variantenzahl pro Karte in den einzelnen Subgruppen dar.
107 Durchgeführt mittels des R-Pakets pgirmess (GIRAUDOUX 2013).
138
Gesamtsystem und Varietätenkonstruktion
Abb. 66: Durchschnittliche Anzahl an Varianten pro Karte (L3).
Der ungleich höhere Durchschnittswert an Varianten pro Karte in der Lexik beruht maßgeblich auf lexikalischen Mehrfachbelegen an einem Ort. Während sich für die anderen Subkorpora meist genau eine Lautung/ein Wortbildungstyp/etc. pro Ort aus den Antworten ergibt, werden in der Lexik immer wieder mehrere Formen an einem Ort genannt. Die Art der Evokation ist dabei abweichend: Während Lautung und Formen kein explizites, „enzyklopädisches“ Sprachwissen der Gewährspersonen verlangen, ist ein Dialektwort auch dem Laien direkt und explizit zugänglich. Dadurch werden auch Parallelformen, die die Gewährsperson aktiv oder passiv beherrscht, oder noch von den Vorfahren bekannte Reliktformen eher wiedergegeben. Die hohe Variantenanzahl führt in der Lexik nun dazu, dass deutlich häufiger Varianten an einem Ort miteinander „konkurrieren“. Damit sinkt die Dominanz der stärksten Variante. Gleichzeitig sinkt der Grad an Wiedergabetreue, da ein geringerer Teil der Varianten auf der Karte sichtbar wird. Obwohl diese systematische Verzerrung die Kennwerte der Lexikkarten vermutlich beeinflusst, kann sie jedoch nicht die einzige Ursache für die Verschiedenheit der Gruppen sein. Auch Vokalismus und Konsonantismus bzw. Verben und Nomina unterscheiden sich signifikant, ohne dass sie stark divergierende Variantenzahlen pro Karte hätten. 5.1.3
Relationen zwischen den Subkorpora
Um weitere Zusammenhänge dokumentieren zu können, bediene ich mich wieder der Clusterung von Karten basierend auf ihren Kovarianzfunktionen, dieses Mal unter gleichzeitigem Einbezug aller Karten, die zur Verfügung stehen. Das Prinzip ist bereits aus den vorigen Kapiteln bekannt, ebenso die dazugehörigen Visualisierungen: Der Levelplot in Abbildung 67 verdeutlicht, wie viele Karten einer Kategorie jeweils einem Cluster am wahrscheinlichsten zugewiesen werden – die Graustufen geben das Vielfache des anhand von Cluster- und Kategoriengröße standardisierten Erwartungswerts (= 1) wieder.
Vergleich der Subkorpora
139
Abb. 67: Absolute standardisierte Clusterzuweisungen im Gesamtkorpus.
Grundsätzlich ist die Tendenz zu beobachten, dass sich die einzelnen Kategorien in komplexen Mustern gegenüberstehen. So zeigt etwa Cluster 11 einen Gegensatz zwischen Lexikbänden und Vokalismus, eine Verteilung, sie sich ähnlich in den Clustern 1 und 2 wiederfindet. Cluster 4 steht generell eher für das Lautsystem, weist vor allem aber signifikant108 hohe Werte für Substantive und Adjektive auf – zwischen diesen Kategorien gibt es offenbar räumliche Entsprechungen. Ergänzend folgt wiederum in Abbildung 68 der durchgängig probabilistische Blick, der die durchschnittliche Wahrscheinlichkeit angibt, mit der eine Karte einer Kategorie zu einem Clusterzentrum zugewiesen wird (Erwartungswert ≈ 6,67 % pro Cluster). Besonderes Augenmerk verdient die „Nähe“ der Lexikbände zueinander. Das lässt Raum für Spekulationen: Zum einen könnten die Lexikkarten in ihrer Raumstruktur – im Gegensatz zu den (sub-)systembildenden Kategorien – besonders homogen und ähnlich sein; zum anderen sind die Lexikbände als Gruppen aber zum Teil deutlich größer als die anderen Kategorien, außerdem ist ihre innere thematische Heterogenität viel höher.
108 Alle signifikanten Werte (angezeigt durch vergrößerte Quadrate bzw. Kreuze) sind auf einem lokalen Alphaniveau von p = 0,05 signifikant. Das Bonferroni-korrigierte lokale Alphaniveau von p < 0,000175 wird zweimal erreicht, beide Male durch Plosivkarten.
140
Gesamtsystem und Varietätenkonstruktion
Abb. 68: Wahrscheinlichkeiten der Clusterzuweisung im Gesamtkorpus (in Farbe auf Seite 207).
Es wäre demnach denkbar, dass die Lexikkategorien einfach nur den jeweiligen Durchschnittswert für ihren Cluster widerspiegeln. Korreliert man – zunächst die Zuweisungswahrscheinlichkeiten der einzelnen Kategorien mit den Durchschnittswerten der Cluster und anschließend – die so ermittelten Korrelationskoeffizienten mit der Kategoriengröße, so zeigt sich insgesamt eine Korrelation von r = 0,63, lediglich für die Lexikbände dagegen sogar r = 0,85. Mehr als die anderen Kategorien neigen die Lexikbände demnach zu räumlicher Unspezifität. Dies wird noch durch Abbildung 69 bekräftigt: Pro Subkorpus sind die Wahrscheinlichkeiten dargestellt, mit denen die Karten zu ihren jeweils nächsten Clusterzentren gehören.
Abb. 69: Zuweisungswahrscheinlichkeiten zum stärksten Cluster.
Konstruktion und Gestalt eines Gesamtsystems
141
Dass die Lexik die niedrigste „Clusterkohärenz“ aufweist, stützt das Bild einer generellen Raumverteilung, die weniger gut durch „Prototypen“ beschreibbar ist. 5.2
KONSTRUKTION UND GESTALT EINES GESAMTSYSTEMS 5.2.1
Perspektivenabhängigkeit der Dialektkonstruktion
Das heranführende Kapitel 2 stellte bereits eines der grundlegenden Probleme der Geolinguistik dar, den Weg vom empirisch gemessenen Einzelbeleg zur abstrakten Konstruktion eines (mehr oder minder deutlichen) „Dialekt“-Gebiets. Immer wieder wurde dabei deutlich, wie stark die Gestalt dieses Konstruktionsresultats von arbiträren Selektionen abhängt: Sei es nun das Ziehen einer Isoglosse, die Auswahl an Variablen, die in eine Kombinationskarte eingehen, oder das Ausblenden von Variation an einem Messpunkt. NERBONNE (2006, 464) fasst die Problematik auf konzise Art so zusammen: „Normally, no criteria are identified as to which features are to be studied for their geographic (or social) distribution, and yet the conclusions depend greatly on their choice.“ Seine Kritik zielt hier auf „nondialectometric work“ ab – die Tragweite seiner Aussage ist aber größer. Auch die Gestalt dialektometrischer Einteilungen ist von der Selektion der analysierten Variablen abhängig, allerdings nicht mehr auf dem Niveau der Variablen, sondern auf dem Niveau des Aggregats bzw. einer Systemebene. NERBONNE (2006) analysiert die Daten des LAMSAS zum Vokalismus; HEERINGA (2004) stellt die regionale Variation Norwegens auf Basis der Ausspracheunterschiede der Fabel „Nordwind und Sonne“109 dar, die sprachliche Variation in den Niederlanden mittels Unterschieden aus 125 Wörtern, PROKIĆ (2010) diejenige Bulgariens mittels 157 Wörtern; GOEBL (1982, 1984) wählt für die Analysen zum AIS gezielt Lexik und Morphologie aus Band I, II und IV (zusammen 621 Karten); die allgemein geläufige Grobgliederung der deutschen Dialektgebiete in den niederdeutschen und hochdeutschen Raum nach der Durchführung der zweiten Lautverschiebung basiert auf der Verteilung der Realisierungen von gerade einmal sechs germanischen Konsonantenphonemen (bzw. je nach Sichtweise einem einzigen Reihenschritt, vgl. SCHWERDT 2000, 177–189, 361–374; WIESINGER 2011, 209); WIESINGERs vielrezipierte Einteilungskarte zu den deutschen Dialekten ist vornehmlich auf Daten zu Vokalsystemen gestützt (vgl. WIESINGER 1983a, 810–814). All dieses Material ist (jeweils zu unterschiedlichen Graden) selektiver Natur. Bestehende Einteilungen in „Dialektgebiete“ fußen bislang entweder auf der Aggregation von Daten, der Selektion von Daten oder gar der Aggregation selektierter 109 Die norwegische Fassung nordavinden og sola hat 58 types. HEERINGA (2004, 211) ist sich der Beschränkungen dieses Materials selbstverständlich bewusst: „[T]he text […] is a rather short text. We are not sure of the extent to which the translations of this text are representative pictures of the varieties. […] The classification […] may not be interpreted as the classification of Norwegian dialects, but as one classification which only reflects the variation in the translations of the fable […].“
142
Gesamtsystem und Varietätenkonstruktion
Daten. Die einen Ansätze stützen sich auf das Lautsystem – bzw. eine Teilauswahl, die als repräsentativ für das Lautsystem gelten soll –, um eine Aussage über das Gesamtsprachsystem zu treffen, andere klammern gerade das Lautsystem aus. Dabei gibt es in der Forschungsgeschichte eine klare Präferenz für lautliche Daten. Aller Wahrscheinlichkeit nach hat das mehrere Gründe. Relevant ist sicherlich der ökonomische Aspekt: Das Lexikon einer Sprache ist theoretisch unendlich groß, das Phoneminventar dagegen im Regelfall gerade einmal zweistellig. Zum Teil fiel die Wahl der lautlichen Ebene aber auch dezidiert aus der pragmatischen Motivation heraus, an die größere Zahl der ebenfalls am Lautsystem orientierten Vorgängerstudien anschließen zu können (vgl. etwa FREUDENBERG 1974, 1–7).110 Der vorangegangene Abschnitt 5.1 konnte zeigen, dass sich im Raum Bayerisch-Schwaben die geostatistischen Eigenschaften von Wortschatz, Lautung und Formen klar unterscheiden. Das heißt, dass wir gewissermaßen auch in quantitativen Studien, die ja auch gezielt entwickelt wurden, um Idiosynkrasien der Daten unterdrücken zu können, durch die Wahl der Datenbasis – ebenso wie durch die Festlegung von operationalisierten, letztlich aber arbiträren Umschlagpunkten (wie etwa dichotomischen „Dialektgrenzen“) – eine individuelle Gestalt der Varietät konstruieren. Der Terminus Gestalt ist nicht nur aus stilistischen Gründen gewählt: Ich lehne mich hier an die wahrnehmungspsychologische Schule der Gestaltpsychologie an, die sich ebenfalls mit der Entstehung kohärenter Eindrücke aus der scheinbaren Regellosigkeit befasst: La Gestalt est une organisation spontanée du champ sensoriel qui fait dépendre les prétendus « éléments » de « touts » eux-mêmes articulés dans les touts plus étendus. Cette organisation n’est pas comme une forme qui se poserait sur une matière hétérogène; il n’y a pas de matière sans forme; il y a seulement des organisations plus ou moins stables, plus ou moins articulées. (MERLEAU-PONTY [1934] 1996, 25)
Die Analogie versagt – oder gewinnt an Relevanz, je nach Standpunkt – im Bezug zur Struktur unserer Wissenschaftssysteme, ihrer habituellen und kulturellen Form, denn „the scientist does not preserve the gestalt subject’s freedom to switch back and forth between ways of seeing“ (KUHN 2012, 85).111 Aus der Analyse der SBS-Subkorpora im vorangegangenen Kapitel gehen drei unterschiedliche Gestalten hervor. In Abbildung 70 sind zunächst die einzeln bereits bekannten Karten der in Lexik, Phonologie und Morphologie dominanten Faktoren zum Vergleich nebeneinandergestellt.
110 Ein weiterer Grund mag insbesondere in technisch komplexeren Untersuchungen auch sein, dass sich lautliche Information auf kontinuierlichen Skalentypen erfassen und analysieren lässt, lexikalische und morphologische aber nur nominal (vgl. dazu auch 3.1.4, ab Seite 44, sowie MESCHENMOSER / PRÖLL 2012a). 111 So schreibt auch FLECK ([1935] 1980, 121) über den Prozess der wissenschaftlichen Sozialisierung, man verlöre „zugleich die Fähigkeit, der Gestalt Widersprechendes zu sehen“.
Konstruktion und Gestalt eines Gesamtsystems
143
Abb. 70: Dominante Faktoren der Lexik, Phonologie und Morphologie.
Für tiefere Einzelanalysen sei auf die entsprechenden Kapitel (4.1.3, ab Seite 91; 4.2.3, ab Seite 106; 4.3.3, ab Seite 124) zurückverwiesen – hier genügt ein kursorischer Vergleich: Der „mittelostschwäbische“ Faktor variiert in seiner Fläche deutlich, ebenso wie sein Übergang in den Allgäuer Raum. Der Übergang zwischen dem Nord- und dem Mittelostschwäbischen ist graduell, aber offenbar räumlich stabil. Das Gebiet des Lechrains ist in den systembildenden Subkorpora praktisch deckungsgleich, während es in der Lexik im Mittelbairischen aufgeht. Die Grenze zum nordbairischen Raum liegt im Bereich der Lexik weiter nördlich als in der Phonologie und Morphologie und ist insgesamt ein Gebiet mit transitorischem Charakter. Nur in der Morphologie zeigt sich auch ein „fränkischer“ Faktor im Norden. In den Stauden, westlich von Augsburg, fließen die verschiedenen Faktoren aus dem Westen, Norden und Süden (nicht aber aus dem Osten) ineinander und überlagern sich gegenseitig; in der Lexik wird im größeren Raum der Westlichen Wälder ein sonst unterschwelliger Faktor dominant. Es bestätigt sich also die Annahme, dass die räumliche Gestalt einer Varietät stark davon abhängt, welche Daten zu Rate gezogen werden – je nach Auswahl „kippt“ die Gestalt, latente Strukturen treten in den Vordergrund. Mitnichten ist die „Einteilung“, die aus Lautungen gewonnen werden kann, die bindende, der sich Morphologie und Wortschatz unterordnen müssten; ebensowenig ist die lexikalische Variation schlichtweg ungeordnet. Die Gestalt der Variation aller Daten ist aber nicht einfach mit einer Mischung der drei Karten aus Abbildung 70 identisch; die Faktorenanalyse kann auf Grundlage aller Variablen Korrelationen globalerer Natur finden, die über das einzelne Subkorpus hinausgehen und daher dort
144
Gesamtsystem und Varietätenkonstruktion
nicht offenbar werden. Für ein Gesamtbild gibt es demnach keine Alternative dazu, tatsächlich die gesamten Daten zu nutzen.112 5.2.2
Globale Faktorenanalyse
Die Ergebnisse einer Faktorenanalyse aller 2155 Karten sind in Abbildung 71 visualisiert. Insgesamt sind so 59,90 % der ursprünglichen Datenvarianz fassbar.
Abb. 71: Gesamtsystem (absolute Zahlen) des SBS (in Farbe auf Seite 208).
112 Das soll nicht darüber hinwegtäuschen, dass selbstverständlich auch die Gesamtheit der Variablen, die mittels des SBS-Fragebuchs erhoben wurden, lediglich eine Stichprobe darstellt – aber das ist ein Problem der Datenerhebung, nicht der Auswertung.
Konstruktion und Gestalt eines Gesamtsystems
145
Die Abbildungen 72 und 73 kartieren die einzelnen Faktoren. Die grundlegenden Raumstrukturen der stärkeren Faktoren sind aus den oben erfolgten Detailanalysen der Subkorpora im Prinzip bereits vertraut.
Abb. 72: Faktoren 1–9 im SBS-Gesamtkorpus.
146
Gesamtsystem und Varietätenkonstruktion
Mittelostschwäbisch (Faktor 1), Nordostschwäbisch (Faktor 2) und Allgäu (Faktor 3) gehen (süd-)westlich von Augsburg fließend ineinander über, in einem Gebiet, in dem (meist latent) die typischen Formen der Westlichen Wälder inferieren.
Abb. 73: Faktoren 10–15 im SBS-Gesamtkorpus.
Konstruktion und Gestalt eines Gesamtsystems
147
Östlich des Lechs dominieren im Norden Augsburgs abrupt bairische Formen (Faktor 4), im Süden ist quasi als Zwischenschritt der Lechrain (Faktor 5) vorgeschaltet. Die Teilung des Allgäus (hier durch die Faktoren 3 und 7 abgedeckt) ist ebenfalls schon aus den Einzelanalysen bekannt. Mit Faktor 8 werden die Formen der Westlichen Wälder in direkter Nachbarschaft Augsburgs dominant, während Faktor 9 den Gegensatz zwischen „Süd-“ und „Mittelbairisch“ erfasst. Faktor 10 bündelt die Spezifika der dichter besiedelten Regionen: Die Korrelation zwischen der durch diesen Faktor beschriebenen Varianz und der Einwohnerzahl pro Ort beträgt r = 0,49 (Bevölkerungsstand 1871) bzw. r = 0,55 (Stand 1970, Werte jeweils aus SBS 1).113 In Faktor 11 spiegelt sich das Einzugsgebiet Lauingens wider, im positiven Teil von Faktor 12 das Memmingens (man vergleiche dazu die Karten 12 und 13 im SBS-Einführungsband, SBS 1, 88–95). Faktor 13 ist wohl zumindest teilweise durch die Exploration bedingt: Seine positive Seite bricht abrupt an den Exploratorengrenzen Manfred Renns ein. Faktor 14 ist wiederum der bereits bekannte Gegensatz des Holzwinkels gegen die mehrheitlich evangelische Grafschaft Oettingen. Anhand von Faktor 15 wird der oben kurz angerissene Punkt offenbar, dass die Faktorenanalyse aller Daten übergreifende Korrelationen aufdecken kann, die sich auf der Ebene der einzelnen Teilsysteme nicht zeigen: Sein positiver Teil entspricht im Wesentlichen (bis auf das kleine zusätzliche Areal im Südosten) der Außengrenze des Bezirks Oberbayern, wogegen die negativen Anteile (neben einer zusätzlichen Fläche im Osten von Augsburg, die in etwa den bayerisch-schwäbischen Teil des Bistums München-Freising abdeckt, vgl. SBS 1, 63, Karte 1002) der Bezirksgrenze Mittelfrankens entsprechen (jeweils Stand 1980). 5.2.3
Frequenzkorrigierte Faktorenanalyse
Auch das oben gezeigte Gesamtbild stellt jedoch keinen neutralen Blick auf die Variation Bayerisch-Schwabens dar: Da das Verhältnis der Karten zu Wortschatz/ Lautung/Formen im Korpus bei 1,45 : 1,54 : 1 (bzw. 0,94 : 1 : 0,65) liegt, wird das Gesamtbild unter Einbezug aller Karten von der Lautung dominiert. Leider ist unklar, welches Verhältnis der einzelnen Subsysteme ideal wäre; als Kontrast zur „unkorrigierten“ Analyse setze ich testweise zunächst ein korrigiertes Verhältnis von 1 : 1 : 1 an114 – aller bislang erfolgten Selektionskritik zum Trotz muss somit in den quantitativ stärker vertretenen Bereichen eine (Zufalls-)Auswahl getroffen werden. 113 Nimmt man nicht die Bevölkerungszahlen, sondern den Bevölkerungszuwachs zwischen 1871 und 1970 als Vergleichsgrundlage, ergibt sich ein nahezu identischer Wert von r = 0,57. 114 Offensichtlich ist das nur eine von vielen möglichen Gewichtungen des Materials. Genauso gut könnte man natürlich Wortschatz und Systeme auch als tokens und types sehen, der Wortschatz wäre die Realisierung bzw. der Träger der systematischen Variation in Lautung und Form. In diesem Fall wäre eine deutlich stärkere Gewichtung der Phonetik und Morphologie vonnöten. Aus Platz- und Skopusgründen unterbleibt hier eine weitere Exporation dieser Überlegungen – vom technischen Standpunkt aus wären sie jedoch problemlos umsetzbar.
148
Gesamtsystem und Varietätenkonstruktion
Für jede frequenzkorrigierte Faktorenanalyse werden insgesamt 300 Karten genutzt, zusammengesetzt aus einer Zufallsauswahl von jeweils 100 Wortschatz-, 100 Laut- und 100 Formenkarten. Um Schwankungen aufgrund der Randomisierung aufzufangen, wird diese Stichprobenanalyse mehrfach durchgeführt. Für Abbildung 74 wurden zehn frequenzkorrigierte Faktorenanalysen übereinanderprojiziert.115
Abb. 74: Overlay von zehn randomisierten Karten, je mit 100 Lexik-, Lautungs- und Formenkarten (in Farbe auf Seite 209).
Das Ergebnis zeigt, wie stabil manche Regionen auch unter Zufallsauswahl der beteiligten Karten sind: Der nördliche Verlauf des Lechs ist ebenso wie der Lechrain in allen Analysen beständig. Für andere Regionen gilt das allerdings 115 Im Prinzip stellt dieses Vorgehen eine simple Art des Bootstrappings (vgl. EFRON 1979) dar.
Tiefenvielfalt
149
nicht. Insbesondere der stark variierende Verlauf der „Südgrenze“ des mittelostschwäbischen Faktors zeigt eindrucksvoll, wie naheliegend eine probabilistische Perspektive ist: Der Übergang zum benachbarten Allgäu ist fließend, je nach Auswahl der Karten changiert der Allgäuer Raum überdies zwischen einer zusammengefassten und einer zweiteiligen Repräsentation. Abhängig vom Kartenmaterial wird auch der „fränkische“ Faktor, der in der Morphologie im Norden auszumachen war, dominant oder nicht. Zwischen Nord- und Mittelbairisch lässt sich ein breiter Übergangsgürtel feststellen; das Kerngebiet des Untersuchungsgebiets in einem Halbkreis westlich um Augsburg herum ist offenbar besonders sensibel in Bezug auf die zugrundegelegten Daten. Das legt die Interpretation nahe, dass dieser „Westliche Wälder“-Faktor eher ein Relikt- als ein Innovationsgebiet ist. Es sei in diesem Zusammenhang auch nochmals betont, dass die entstandenen Gesamtbilder zwar exhaustiver Natur sind (weil sie den gesamten Raum abdecken), dabei aber nicht die Grenzen, sondern die Zentren dieser Strukturen relevant sind. 5.3
TIEFENVIELFALT Infinite Diversity in Infinite Combinations (Grundprinzip der vulkanischen Philosophie)
5.3.1 Latente Variation So eindrucksvoll die dominanten Strukturen, die in der Faktorenanalyse offenbar werden, auch sind: Die Möglichkeit, auch die schwächeren Faktoren zu dokumentieren, ist es, die den größeren Gewinn für die dialektologische Methodologie bedeutet. Schließlich ähneln die Karten der dominanten Faktoren zu einem gewissen Grad – wenig überraschend – älteren, dialektometrischen Karten (man vergleiche nur Abbildung 6 auf Seite 30 oder Abbildung 18 auf Seite 66 mit den hier neu generierten Karten). Freilich sind die Faktorenanalysenkarten weitaus detaillierter, da sie Intensitäten darstellen und Übergangsgebiete andeuten. Die latenten Strukturen jedoch, die quasi die subliminale Variation unterhalb der Dominanzgrenze bündeln, waren bislang völlig unsichtbar. Sie bestätigen nun in ihrer Vielfalt, Widersprüchlichkeit, aber mitunter auch verblüffenden Klarheit die lange gehegten Vermutungen (man vergleiche stellvertretend für eine Masse an Texten mit vergleichbarem Impetus etwa CHRISTEN 1998, 2010; AUER 2004; NERBONNE / HEERINGA 2010), dass das Konstrukt homogener Dialektgebiete eine Fiktion ist (vgl. auch PICKL 2013c). Gerade für das Schwäbische kann auch LAMELI (2014, 83) – von einer methodisch klar anders geleiteten, aber ebenfalls quantitativen Position aus – zeigen, dass die schwäbischen Mundarten vergleichsweise heterogen sind und ihr Konsensus der „vergleichbare Grad ihrer Unterschiedlichkeit zu den nicht schwäbischen Regionen“ ist (vgl. ähnlich auch schon FISCHER 1895). Ergebnisse wie die-
150
Gesamtsystem und Varietätenkonstruktion
ses, unterstützt durch Faktorenanalysen auch größerer Räume, können dazu beitragen, das Bewusstsein für die im originären Wortsinn weniger offensichtlichen Züge der Variation zu schärfen. 5.3.2 Mischverhältnisse der Orte Zugleich ermöglichen die Ergebnisse der Faktorenanalyse auch, klarere Aussagen zur Situation der einzelnen Orte zu tätigen; PICKL (2013a, 198–199) spricht hier von „Ortsprofilen“. Jeder Faktor an jedem Ort weist eine gewisse Ladung auf, also den Grad an Korrelationen zwischen mehreren Varianten spezifisch an diesem Ort. Quadrierte Korrelationen ergeben das Bestimmtheitsmaß der Varianz – das heißt, dass das Quadrat einer Faktorladung pro Ort dem Prozentsatz entspricht, zu dem die Variation des Orts durch diesen Faktor beschrieben wird. Das ermöglicht es, für jeden Ort exakt das Mischverhältnis der Faktoren, die seine Varietät konstituieren, darzustellen. Das theoretische Konzept eines probabilistischen Übergangs von Varianten, das im Heranführungskapitel ausgearbeitet wurde (vgl. insbesondere 2.3.2, ab Seite 32; die dazugehörige Illustration ist hier in Abbildung 75 erneut wiedergegeben), kann nun a) mit empirischen Daten unterfüttert und b) auf gesamte Varietäten angewandt werden.
Abb. 75: Modell probabilistischer Variantenübergänge.
Ich zeige im Folgenden zwei Beispiele, die sich deutlich unterscheiden. Im ersten Beispiel (Abbildung 76) wird der Übergang vom dominant nordostschwäbischen Ziertheim über den in der Hauptsache mittelostschwäbischen Raum hinein in die südliche Region, in der allgäuerische Formen langsam die Oberhand gewinnen, visualisiert. Der Übergang erfolgt durchweg kontinuierlich; entsprechend dem Eindruck, der sich bereits aus den weiter oben erfolgten einzelnen Faktorenanalysen ergibt, reihen sich die Orte an einem Dialektkontinuum auf.
Tiefenvielfalt
151
Abb. 76: Faktorenprofile von Ziertheim (44) bis Heimertingen (190), kontinuierlicher Übergang vom Nordostschwäbischen über das Mittelostschwäbische zum Allgäuerischen hin (in Farbe auf Seite 210).
Obwohl der Startpunkt in nordostschwäbisch dominiertem Gebiet liegt, die Strecke durch ein dominant mittelostschwäbisches Areal läuft und in einem Gebiet mit langsam zunehmend allgäuerischen Formen endet, überquert man niemals eine wirkliche „Grenze“. Abbildung 77 zeichnet ein ganz anderes Bild: Vom Westen des Untersuchungsgebiets, in dem nord- und mittelostschwäbische Formen dominieren, geht es ostwärts durch ein Areal, in dem kontinuierlich Realisierungen, die typisch für die Westlichen Wälder sind, zunehmen und letztlich dominieren.
Abb. 77: Faktorenprofile von Gundelfingen (69) nach Tödtenried (126), Übergang Nordostschwäbisch / Westliche Wälder, abrupter Umschlag ins Bairische (in Farbe auf Seite 210).
152
Gesamtsystem und Varietätenkonstruktion
Im städtischen Großraum um Augsburg herum – hier durch Gersthofen und Lechhausen vertreten – nehmen die Formen des auf dem Land marginalen „städtischen“ Faktors massiv zu; außerdem sinkt die Beschreibungskraft der Faktorenanalyse gegenüber dem westlichen Umland stark ab, d. h. eine größere Anzahl an Varianten korrelieren nicht stark genug untereinander, um beschrieben zu werden – der Rauschanteil im Signal nimmt zu.116 Zwischen Lechhausen und Wulfertshausen schließlich findet ein abrupter Umschlag ins Bairische statt: Der prozentuale Anteil der „schwäbischen“ Faktoren fällt plötzlich gegen Null, während die weiter westlich höchstens marginalen mittelbairischen Formen praktisch die gesamte beschriebene Variation ausmachen.117 Varietätenquerschnitte wie diese verbinden nicht nur das Konzept des Dialektkontinuums und das Modell der stochastischen Natur von Übergängen mit empirischen Daten, sie können auch für jeden Messpunkt in bisher nicht greifbarem Ausmaß die Vielfalt und Eigenheit der lokalen Variation zeigen. 5.3.3
Typischste Variablen
Für die Analyse der Tiefenvariation eines Korpus wie diesem bleibt bislang die Frage offen, welche Variablen nun besonders typisch für die Raumstrukturen Bayerisch-Schwabens sind, oder anders gefragt: Welche Karte hat dort verschiedene Varianten, wo auch die Faktorenanalyse verschiedene Faktoren ermittelt? Um dies zu klären, kann man die Karten ermitteln, die möglichst hohe Ladungen der Varianten auf möglichst vielen Faktoren gleichzeitig haben. „Hoch“ kann in unserem Fall jedoch zweierlei bedeuten: Zum einen stark positive Korrelationswerte, zum anderen aber auch einfach nur stark von Null (also Nicht-Korrelation) abweichende Werte. Addiert man lediglich alle Faktorenladungen aller n Varianten einer Karte (vgl. Formel (11)), (11) geht man das Risiko ein, dass sich hohe positive der einen und hohe negative Korrelationen der anderen Varianten gegenseitig ausmitteln; das Resultat wäre eine niedrige Summe, obwohl ein starker Einfluss der Gesamtkarte auf das Faktorenbild besteht. Addiert man dagegen absolute Werte der n Faktorenladungen, um die Summe der Stärke der Korrelationen unabhängig von ihrer Ausrichtung zu bilden (wie nach Formel (12)), 116 Abschnitt 6.3.5 (ab Seite 172) konzentriert sich explizit auf diesen Anteil an Variation, der gerade nicht per Faktorenanalyse ermittelt werden kann. 117 Das Mischverhältnis der Faktoren könnte auch als Gradmesser einer „Komplexität“ der Sprachsituation am Ort interpretiert werden, man vergleiche TABACHNICK / FIDELL (2007, 612): „Complexity is indicated by the number of factors with which a variable correlates. A pure variable, which is preferred, is correlated with only one factor, whereas a complex variable is correlated with several.“
153
Tiefenvielfalt
|
|
(12)
begünstigt man Karten mit negativer Korrelation: Vielen mittelstarken positiven Faktorenladungen stehen in den Daten einige wenige sehr starke negative Ladungen entgegen. Diese entstehen dadurch, dass eine Variante ein Raummuster aufweist, das dem Faktor streng entgegengesetzt ist; deckt der Faktor z. B. das Stadtgebiet Augsburgs ab, findet sich diese entsprechende Variante überall außer dort. Im Regelfall ist der durch einen Faktor beschriebene Teil des Untersuchungsgebiets kleiner als der nicht-beschriebene – daher haben die negativen Faktorenladungen, die auf diese Art entstehen, sehr hohe Werte, weil sie eine große Fläche bzw. viele Orte abdecken. Dieser Typus an Struktur ist interessant, trägt aber nichts direkt zur hier gestellten Frage bei. Daher werden nur die positiven Korrelationen berücksichtigt; der Gesamtwert der Karte wird nach Formel (11) ermittelt, aber nur für die Teilmenge an Varianten mit positiver Faktorenladung. Die Karten mit den höchsten Gesamtwerten sind in Tabelle 12 aufgeführt; sie ist auf das oberste Prozent des Gesamtkorpus beschränkt. Karte Karte 9388: nimmer (ich mag jetzt ... ) Karte 13059: Steuern einer Langholzfuhre Karte 13038: Hausmesser Karte 9354: herüben Karte 9025: Rettich Karte 10012: ein Kind auf dem Rücken tragen Karte 6111: 1. Pl. Ind. Präs., Endung (sehen) Karte 6122: 3. Pl. Ind. Präs., Endung (sehen) Karte 12110: Sammeln des hingemähten Getreides Karte 11088: Gefäß, in dem das Fleisch eingesalzen wird Karte 7064: Mhd. t im Inlaut nach r Karte 9175: Krankheit Karte 9173: Näherinnen Karte 11049: wiederkäuen Karte 8011: Boden über der Tenne Karte 10219: irgendwo Karte 10105: Dampfnudeln Karte 8012: Boden unter dem Dach Karte 7093: Mhd. k im Inlaut nach Nasal Karte 4024: Mhd. i in Milch Karte 9368: mittendurch (... ist er gefahren) Karte 9316: dreckig/drecket Tab. 12: Stärkstes Prozent der summierten Faktorenwerte.
Σ 112,07 111,16 110,22 109,80 109,47 108,92 107,88 106,56 105,24 104,62 104,35 103,19 102,98 101,75 101,45 101,43 101,24 100,47 99,99 99,88 99,70 99,57
154
Gesamtsystem und Varietätenkonstruktion
Die Häufung der Nominalkarten ist zwar auffällig, ein Fisher-Yates-Test118 zeigt allerdings, dass sie nicht signifikant ist (p > 0,05) – dass überraschenderweise nur eine Karte zum Vokalismus vertreten ist, dagegen schon (p < 0,05) Die gängige Praxis, Dialektareale mittels Isoglossen im Vokalismus zu konstruieren, erscheint in diesem Licht zunehmend überdenkenswert. Führt man lediglich über die Daten der Spitzengruppe von 22 Karten eine Faktorenanalyse durch, erhält man Abbildung 78 als Resultat.119 Diese Karte, die nur auf knapp über einem Prozent der Daten beruht, ähnelt der Gesamtkarte dominanter Faktoren, erstellt mit allen Daten (Abbildung 71, Seite 144), ziemlich klar. Wohlgemerkt gilt diese Ähnlichkeit jeweils den overten Strukturen der dominanten Faktoren, nicht den feinen latenten Zügen der Variation, wie sie weiter oben regelmäßig durch schwächere Faktoren dokumentiert werden – diese lassen sich nur unter Einbezug einer deutlich breiteren Datenbasis sinnvoll interpretieren. Es ist also nicht so, dass die Reduktion des Korpus auf die typischsten Variablen die unscheinbarere Masse der restlichen Karten für die Analyse überflüssig machen würde.
118 Der Fisher-Yates-Test wird üblicherweise dort eingesetzt, wo für einen Chi-Quadrat-Test die beteiligten Werte zu klein sind (n < 30, Erwartungswerte < 5) und daher zu unzuverlässigen Ergebnissen führen würden. Da er deutlich komplexer zu berechnen ist, wurde er früher aus pragmatischen Gründen nur selten auf größere Datensätze angewandt, was den Status des deutlich einfacher zu berechnenden Chi-Quadrat-Tests als Quasi-Standard zementierte; die Leistungskraft aktueller Computersysteme macht dieses Problem jedoch obsolet. Soweit ich die entsprechende Literatur überblicke, existiert bislang kein Konsens darüber, ob der (konservativere) Fisher-Yates-Test auch für große Datensätze die bessere Wahl ist. Konservativere Signifikanzen stellen für eine (Pilot-)Studie m. E. aber sowieso kein Hindernis, sondern eine erstrebenswerte Vorsichtsmaßnahme dar; die untersuchte Datenmenge ist zudem nicht als „groß“ zu bezeichnen. 119 Ausnahmsweise wird hier nicht das Kaiser-Guttman-Kriterium angewandt, weil es aufgrund der geringen Kartenzahl zur Überschätzung schwacher Korrelationen führen würde. Stattdessen werden nur fünf Faktoren angesetzt, um ein (arbiträr gewähltes) Verhältnis von 4 : 1 zwischen Karten und Faktoren nicht zu überschreiten.
Tiefenvielfalt
Abb. 78: Faktorenanalyse der 22 stärksten Karten (in Farbe auf Seite 211).
155
6
ERGEBNISSE, KONSEQUENZEN UND PERSPEKTIVEN Wenn wir den Quellen der Erkenntnis nachforschen, begehen wir meist den Fehler, uns dieselben viel zu einfach vorzustellen. FLECK ([1929] 1983, 46)
Welche zentralen Aussagen lassen sich nun aus der Methodik und den Einzelergebnissen dieser Arbeit erzielen? Dieses abschließende Kapitel widmet sich dem Versuch, die Ergebnisse in kondensierter Form darzustellen sowie die möglichen Implikationen für die sprachwissenschaftliche Theorie und Methodologie herauszuarbeiten. Nachdem die Anwendungskapitel (4 und 5) eher datengesteuerter Natur waren, wird hier (in Abschnitt 6.1) der Blickwinkel auf den Raum, den Ursprung der Daten, als Gegenstand zurückgelenkt. Darüber hinaus bietet dieses Kapitel dem Leser die Möglichkeit, Informationen über den Sprachraum Bayerisch-Schwaben zu beziehen, ohne sich tiefer mit den technisch-methodischen Aspekten der Arbeit beschäftigen zu müssen.120 Für den ergebnisorientierten Leser ist dies m. E. ein klarer Zugewinn an Ökonomie. Dem theorieinteressierten Leser wird danach (in Abschnitt 6.2) die Gelegenheit gegeben, relevante empirische Ergebnisse der Untersuchung an das einführende Theoriekapitel (2) anbinden zu können. Damit wird gleichzeitig die Klammer geschlossen, deren Grundstruktur diese Arbeit – mal mehr, mal weniger deutlich – folgt: von der Theorie zum Problem, vom Problem zur Praxis, von der Abstraktion der Praxis zurück zur Theorie. Den Abschluss (in Abschnitt 6.3) bilden Beiträge zur Qualitätssicherung in der Variationslinguistik, die sich direkt oder indirekt aus den vorgestellten Methoden ergeben: Betrachtungen zu Belastbarkeit und Güte der Methoden, aber auch Chancen, im Sinne einer „Fehlerkorrektur“ Störgrößen in den Daten zu detektieren, zu quantifizieren und – wo möglich – aus den ursprünglichen Daten zu subtrahieren.
120 Im Zuge dessen bitte ich jedoch um Nachsicht dafür, dass ich weder Kulturwissenschaftler noch Historiker bin und daher nicht beabsichtige, in diesen Bereichen unnötig herumzudilettieren. Die Ergebnisse sind deskriptiv zu verstehen – die fachkundige Interpretation der Beobachtungen sei entsprechenden Experten überlassen.
Zum Sprachraum Bayerisch-Schwaben
6.1
157
ZUM SPRACHRAUM BAYERISCH-SCHWABEN 6.1.1
Norden
Die Einzelregionen adressiere ich – der Leserichtung des abendländischen Schriftwesens entsprechend – beginnend im Nordwesten bis in den Südosten. Im Nordwesten des Untersuchungsgebiets zeichnet sich auf Reliefkarten (z. B. der des SBS, hier in Abbildung 79 wiedergegeben) deutlich das Nördlinger Ries ab.
Abb. 79: Die im SBS genutzte Reliefkarte.
Es ist ein vor knapp 15 Millionen Jahren durch einen Meteoriten verursachter, annähernd kreisrunder Einschlagskrater mit einem Durchmesser zwischen 22 und 24 Kilometern, auch geologisch klar vom Umland abgegrenzt. Untersuchungen zu den Ortsnamen des Gebiets haben gezeigt, dass es siedlungsgeschichtlich gesehen einer spürbar früheren germanischen Besiedlungsphase angehört als das südlichere Umland (KÖNIG 2004), wohl vor allem wegen seines überaus fruchtbaren Bodens (vgl. LENGGER 2002, 23). Eine ebenfalls im Projektrahmen entstandene Pilotstudie zur automatisierten Mustererkennung auf einzelnen Karten (MESCHENMOSER / PRÖLL 2012b), die als Material lediglich auf die Lexik zurückgreift, konnte bereits zeigen, dass die Daten eine Vielzahl kreisförmiger Variantenflecken der Größe und Gestalt des Nördlinger Rieses enthalten (ein Ergebnis, das in aggregativen Verfahren durch die große Datenmasse unterdrückt würde). Insbesondere Band 2 weist eine deutliche Häufung auf. Die Faktorenanalysen im vorigen Teil der Arbeit verdeutlichen aber auch, dass sich in der Mehrheit der analysierten Karten die naturräumliche Grenze des
158
Ergebnisse, Konsequenzen und Perspektiven
Rieses nicht als scharfe Grenze eines Sprachraums darstellt. So zeigen zwar einige der Faktoren im Nordwesten des Untersuchungsgebiets ein „Kerngebiet“ mit hoher Dominanz, das – mal mehr, mal weniger gut – dem Nördlinger Ries entspricht, gleichzeitig reicht der betreffende Faktor aber weit in das Zentrum des Gebiets hinein. Überspitzt könnte man sagen, dass das Ries sprachlich in Königsbrunn endet: Königsbrunn wurde als relativ junge Siedlung maßgeblich aus dem Ries heraus bevölkert. Da dieser „nordostschwäbische“ Faktor unter anderem die binnenhochdeutsche Konsonantenschwächung beschreibt (vgl. 4.2.3, ab Seite 106), ist die Frage, ob er einen aus dem Norden vordringenden, progressiven Keil oder ein vom Westen aus zurückgedrängtes, im Ries noch am stärksten erhaltenes Reliktgebiet darstellt, in Bezug zur Geschichte der binnenhochdeutschen Konsonantenschwächung (siehe z. B. SIMMLER 1983) zu stellen. Laut KÖNIG (2011, 2) sei BayerischSchwaben in Mittelalter und früher Neuzeit grundsätzlich (politisch bedingt) „sprachlich eher passiv empfangend denn selbst innovativ expandierend“ gewesen; sprachliche Innovationen erreichten den alemannischen Teil des Untersuchungsgebiets hauptsächlich aus nordwestlicher Richtung. Im Vokalismus wie auch in Verbal- und Nominalmorphologie tritt im Osten anschließend ein fränkisches (vgl. KÖNIG / RENN 2007, 25) Gebiet hervor; ganz im Nordosten tritt man dann in den nordbairischen Raum. WEITHMANN (2007, 22) schreibt, dass aus politischer Perspektive „[d]ie Grenzziehung Oberbayerns nach Norden […] seit jeher ‚fluktuierend‘ und diversen Interessenslagen unterworfen“ gewesen sei. Die vorliegenden Ergebnisse unterstützen diesen Eindruck von sprachlicher Seite. Die Faktorenanalysen zeigen grundsätzlich eine eigenständige Region im Nordosten, jedoch mit unterschiedlicher Ausdehnung in den Süden. Die Sprachgeografie reflektiert hier eventuell als quasi „eingefrorener“ Spiegel die verschiedenen Stadien der Regionalgeschichte;121 zwischen Ober- und Nordbayern verläuft aus sprachlicher Sicht ein Übergangsgürtel von ca. 15 bis 30 Kilometern Breite. In Lautung und (besonders stark) Formen wird dieser Streifen von der Faktorenanalyse gar als eigener Faktor gewertet. 6.1.2
Flüsse: Donau und Lech
In diesem Gürtel liegt auch der Verlauf der Donau nach der Einmündung des Lechs. Demnach fungiert sie dort offenbar nicht als Grenze, weiter westlich jedoch schon:122 In der Lexik – aber nur dort – teilt die Donau zwei Faktoren (das Nordostschwäbische und die Westlichen Wälder) voneinander.
121 Es ist zu überlegen, ob sich hier (wie etwa durch ROTHER 2010 propagiert) über die Raumbilder der einzelnen Variablen und die historischen Grenzziehungen eine Chronologie der sprachlichen Wandelerscheinungen ermitteln lässt. 122 Schon FISCHER (1895, 84–85) schreibt diesem Teil des Donauverlaufs eine trennende Funktion zu.
Zum Sprachraum Bayerisch-Schwaben
159
Ganz anders gestalten sich (wie vorauszusehen war) die Ergebnisse zum Lech. Jede Analyse unterstreicht, dass er nördlich von Augsburg eine äußerst starke Dialektscheide darstellt;123 nicht nur schlichtweg als Gegensatz zwischen Alemannisch und Bairisch (oder Mittelostschwäbisch und Mittelbairisch), sondern auch spezifisch zwischen den Formen der Westlichen Wälder sowie denen des Wittelsbacher Landes. Die Hypothese, dass die Unterschiede in heutiger Zeit direkt auf die Besiedlung der entsprechenden Gebiete durch verschiedene Stämme zurückzuführen wäre, kann als widerlegt gelten (vgl. KÖNIG 2011) – anzunehmen ist vielmehr, dass sich beide dialektalen Großräume über die Jahrhunderte von einer noch relativ schwach differenzierten gemeinsamen Basis stetig auseinanderentwickelt haben, was durch mangelnden Kontakt über den Lech hinweg begünstigt wurde. Somit stoppten Wandelerscheinungen, die „vor allem von Osten kamen“ (KÖNIG 2011, 2), am Lech. Man macht es sich zu leicht, als Ursache für mangelnden Kontakt lediglich vom Lech als einem unpassierbaren natürlichen Hindernis auszugehen: Er war zunächst eine politische (und somit ökonomische) Grenze, die durch verminderte Kommunikation über die Grenze hinweg im Laufe der Zeit zu einer „Mentalitätsscheide“124 (WEITHMANN 2007, 21) wird, zu der sich parallel auch eine Sprachgrenze entwickelt. Der Lech kann daher als Beispiel dafür stehen, dass Sprachunterschiede durch „mentale Grenzziehung“ (AUER 2004, 166) verstärkt werden.125 6.1.3
Westen
Der westliche Raum des Untersuchungsgebiets ist dominiert von mittelostschwäbischen Formen. Ulm bzw. Neu-Ulm spielt dabei jedoch nicht die Rolle, die in den bisherigen, dichotomischen Einteilungen impliziert war, nämlich die eines Zentrums der Ausbreitung mittelostschwäbischer Formen nach Osten. Die differenzierteren Faktorenanalysen können zeigen, dass das Zentrum dieses Sprachraums weiter östlich liegt. Das Mittelostschwäbische ist damit offenbar kein städtisch geprägtes Innovationsphänomen. Seine Ausbreitung ist von der gewählten 123 Auch der oben erwähnten Pilotstudie zur Mustererkennung (MESCHENMOSER / PRÖLL 2012b) mit lexikalischem Material ist zu entnehmen, dass sich – vor allem auf der Karte zu Band 11 und der Gesamtkarte – der Lech quasi als Negativrelief abzeichnet. Das bedeutet, dass es in direkter Nähe zum Lech keine Varianten gibt, die sich über den Lech hinaus ausbreiten. 124 IBROM (1973, 8–10) führt zwar aus, dass neben Fährverbindungen und sogar durchquerbaren Furten in wasserarmen Zeiten auch Handelsbeziehungen und Grundbesitz auf der jeweils anderen Seite dokumentiert sind – über den Lech hinweg geheiratet wurde aber dennoch nicht (vgl. KÖNIG 2011). 125 Humangenetische Studien belegen einen Zusammenhang zwischen mentaler Grenze, Sprache und Interaktion quasi unter vertauschten Vorzeichen: BARBUJANI / SOKAL (1990) zufolge sind in Europa die Linien, die größere genetische Unterschiede markieren, meist auch sprachliche Grenzen. Ihre Folgerung ist, dass sprachliche Barrieren die Vermischung der Populationen erschweren bzw. verhindern. Sprachliche und interaktionelle Distanz sind offenbar in einem System positiver Rückkopplungen verknüpft.
160
Ergebnisse, Konsequenzen und Perspektiven
Datengrundlage abhängig – die Areale, in denen es dominant ist, unterscheiden sich zwischen den einzelnen Subkorpora zum Teil beträchtlich: Während der Faktor im Vokalismus die größte Fläche abdeckt und bis an den Lech heran dominant bleibt, ist er im Konsonantismus bis auf sein Kerngebiet reduziert. Der Übergang zu allen Faktoren auf der alemannischen Lechseite ist hochgradig fließend. In Lautung und Formen entsprechen sich zum Nordostschwäbischen hin die Umschlagpunkte der Dominanz; sie koinzidieren mit einer Exploratorengrenze. Es ist davon auszugehen, dass die Exploratorenunterschiede hier als „Katalysator“ fungieren, als „Zünglein an der Waage“, das den letzten Ausschlag in einem arealen Gleichgewicht zwischen beiden Faktoren darstellt.126 6.1.4
Zentrum
Im zentralen Bereich Bayerisch-Schwabens zeichnet sich ein Areal ab, das bislang in seiner mundartlichen Bedeutung praktisch undokumentiert ist. Wie für das Mittelostschwäbische existiert dafür kein althergebrachter Landschaftsname, daher dient behelfsmäßig die vergleichsweise moderne Arealbezeichnung „Westliche Wälder“ als Hilfskonstrukt. Dieses Landschaftsschutzgebiet deckt sich relativ exakt mit den Strukturen, die sich (dominant in der Lexik, größtenteils latent in den anderen Subkorpora) dort zeigen, wo sich die anderen alemannischen Faktoren treffen. Vermutlich ist es ein Reliktgebiet (das legen zumindest die frequenzkorrigierten Faktorenanalysen in 5.2.3, ab Seite 147, nahe) oder zumindest ein Kontaminationsgebiet der stärkeren Strömungen aus dem Nordwesten, Westen und Süden, die dort ineinander übergehen. 6.1.5
Städte
Sehr deutlich treten die bevölkerungsreichen Orte als eigene, räumlich diskontinuierliche Struktur hervor. Während der altbayerische Teil des Untersuchungsgebiets lange im Wesentlichen konservativer Agrarraum war (vgl. HEINZE 1995, 39), ist vor allem der nördlichere Teil Bayerisch-Schwabens laut KIEßLING (2009, 47) Teil der „Städtelandschaft“ Ostschwabens, die „in Deutschland nur wenige Parallelen“ hat: Allen voran strahlte Augsburg durch sein urbanes Kultur- und Wirtschaftsleben weit in sein schwäbisches Umland hinein. […] In den anderen schwäbischen Reichsstädten Memmingen, Lindau, Kaufbeuren und Kempten verlief die Entwicklung in kleinerem Maßstab ähnlich. (HEINZE 1995, 38)
Wie zu erwarten war, handelt es sich bei den Phänomenen, die diese „städtische“ Tendenz ausmachen, um standardnähere Formen; am schwächsten ist der Unter126 KELLE (1995, 111) schreibt Flüssen eine entsprechende Funktion zu; die Analogie zu Exploratorengrenzen erscheint mir naheliegend.
Zum Sprachraum Bayerisch-Schwaben
161
schied zwischen Stadt und Land im Konsonantismus. Aufschlussreich ist, dass neben den bevölkerungsstarken Ortspunkten auch das relativ kleine Kaisheim (38) Anteil am „städtischen“ Faktor hat. Der Schlüssel zu diesem zunächst ungewöhnlichen Befund steckt in den besonderen sozioökonomischen Umständen Kaisheims, das bereits seit 1816 Standort einer Justizvollzugsanstalt ist und der Beamtenqualifikation dient; der SBS-Einführungsband konstatiert, es sei „sehr stark von der Justizvollzugsanstalt geprägt; im Markt Kaisheim gibt es nur noch zwei Bauern; sehr starke Fluktuation in der Bevölkerung; ein Teil der Bevölkerung arbeitet in Donauwörth“ (SBS 1, 208). Für Augsburg und Lechhausen kann man nicht ausschließen, dass sie aus Erhebungsgründen besonders deutlich hervortreten: Sie liegen im Erhebungsgebiet von Manfred Renn, ihre Daten wurden aber von Werner König (Augsburg) und Edith Funk (Lechhausen) erhoben. Klar ist jedoch, dass dies nicht den alleinigen Effekt darstellen kann, schließlich zeigen die „Stadtfaktoren“ der einzelnen Analysen jeweils auch immer subdominante Effekte in weiteren bevölkerungsstarken Orten, und zwar unabhängig vom Explorator; des Weiteren tritt der Effekt nicht in Graben auf, dem anderen Erhebungsort Werner Königs im Erhebungsgebiet Manfred Renns. 6.1.6
Osten
Südlich von Augsburg ist die Bedeutung des Lechs als Grenzfluss geringer als im Norden. Als Schritt zwischen den alemannischen Formen im Westen und dem mittelbairischen Raum im Osten tritt zwischen Lech und Ammersee der Lechrain (vgl. FRIED 1982; NÜBLING 1991). Die Faktorenanalysen sind hier sehr eindeutig interpretierbar: Lexikalisch geht der Lechrain im östlich anschließenden oberbayerischen Teil des Gebiets auf, Mittelbairisch beginnt in Bezug auf den Wortschatz also im Prinzip bereits an der lechrainischen Westgrenze.127 Alle systembildenden Teile des Sprachsystems stellen dagegen ganz klar umrissen das Gebiet des Lechrains als eigenständig heraus.128
127 Allerdings konnte durch MESCHENMOSER / PRÖLL (2012b) auch für die Lexik gezeigt werden, dass der Lechrain sich von seinem Umfeld abgrenzt. 128 Mehr noch als für die anderen „Gebiete“ im bayerisch-schwäbischen Raum gilt es hier zu beachten, dass man sich mit der Gestaltfindung und Benennung grundsätzlich an der Grenze zur Zirkularität bewegt. WÖLZMÜLLER (1987, 13) ist zu entnehmen: „Der Lechrain, weder politisch noch landschaftlich ein geschlossenes Gebiet, grenzt sich nur durch das Selbstverständnis seiner Bewohner von den benachbarten Bayern und Schwaben ab. Darum läßt sich eine Abgrenzung der Region am besten mit Hilfe der gravierenden Mundartgrenzlinien durchführen.“ Wir finden nun per Faktorenanalyse eine sprachlich eigenständige, geografisch relativ klar abgegrenzte Region, die einem Vergleich mit WÖLZMÜLLERS (1987, 16) „Lechrain“-Karte standhält – und nennen sie „Lechrain“.
162
Ergebnisse, Konsequenzen und Perspektiven
6.1.7
Süden
Für das Allgäu bestätigt sich deutlich, dass es keine festlegbare nördliche Grenze besitzt. Der Übergangsbereich zum mittelostschwäbischen Raum sowie in die Stauden hinein ist fließend – in der Verbalmorphologie existiert nicht einmal mehr ein Unterschied zwischen Allgäuerisch und Mittelostschwäbisch. Darüber hinaus ist auch der zentralere Bereich des Allgäus mitnichten homogen, sondern beinhaltet eine Vielzahl an Unterströmungen. Hervorzuheben sind vor allem die Trennung zwischen einem an der Iller und einem am Lech orientierten Teil, der besonders stark im Vokalismus durchscheint, sowie die Übereinstimmung latenter Strukturen mit dem wirtschaftlichen Einzugsgebiet Memmingens. In MESCHENMOSER / PRÖLL (2012b) zeigten sich darüber hinaus auf keiner der Karten Kreiszentren im Allgäu. Daraus folgt, dass der Südwesten des Untersuchungsgebiets weitgehend nahtlos in das Gebiet des VALTS übergeht.129 (Die angewandte Prozedur kann keine großen, nur teilweise einsehbaren Strukturen identifizieren; eventuelle Kreisstrukturen, die ihr Zentrum südlich oder südwestlich außerhalb des Untersuchungsgebiets hätten,130 blieben unidentifiziert.) Der gesamte linkslechische Raum Bayerisch-Schwabens ist somit ein Gebiet fließender Übergänge (vgl. dazu insbesondere 5.3.2, ab Seite 150) – geradezu ein Musterbeispiel für das Konzept eines „Dialektkontinuums“. Lediglich die Städte stechen (individuell jeweils mehr oder minder deutlich) aus dem Kontinuum hervor. 6.2
RÜCKWIRKUNGEN AUF THEORIE UND METHODE Viele konfligierende Mengen an Überzeugungen können mit der Ordnung der Natur konsistent sein, obwohl keine einzige eindeutig mit ihr übereinstimmen kann. HARDING (2003, 167)
6.2.1
Der Abschied von der Isoglosse
Die direkteste und sichtbarste Neuerung der Methoden, die im DFG-Projekt Neue Dialektometrie mit Methoden der stochastischen Bildanalyse entwickelt wurden, dürfte in der Verquickung theoretischer Konzepte zur Gradualität und Dynamik von regionaler Variation mit einer stochastisch geleiteten Methodik, die entsprechende theoretische Konzepte adäquat fassen kann, bestehen. Dass eine derartige 129 Vgl. auch KLAUSMANN (2012: 67): „Gemeinsamkeiten mit dem benachbarten Allgäu findet man auf den Karten des VALTS immer wieder. Nicht umsonst bezeichnet man die Nordostecke Vorarlbergs vom sprachlichen Standpunkt aus als Vorarlberger Allgäu.“ 130 Eine mögliche, aber keinesfalls zwingende Interpretation dieses Befundes wäre etwa die einer Stufenlandschaft im Allgäu.
Rückwirkungen auf Theorie und Methode
163
Empiriekonzeption ein drängendes Desiderat darstellt, ist der einschlägigen Literatur ebenso zu entnehmen wie eine zunehmende Unzufriedenheit mit der althergebrachten, auf Dichotomien fixierten Variationsforschung. Stellvertretend seien AUER (2004) und CHRISTEN (1998; 2010) als Kritiker einer starren, von einer (national-)romantischen Territorialideologie abstammenden Zerteilung des Raums genannt. „Sprachgrenzen sind ein statistisches Problem“, konstatiert RUOFF (1980, 108) – all das, was sich als probabilistische Geolinguistik (PICKL 2013a) bezeichnen lässt, steht nicht gegen diese Aussage, erweitert sie aber zu einer Perspektive, aus der die Frage nach Grenzen irrelevant wird: Grenzen bilden lediglich ein Abfallprodukt des Betrachtungsgegenstands, der ursprünglich im Fokus stand und stehen sollte, nämlich der Sprachverwendung an einem Ort, einem Gebiet oder einer Fläche. Die Isoglosse ist ein reines Hilfskonstrukt, das bemüht werden muss, wenn der eigentliche Kern des Interesses sich nicht anderweitig fassen lässt. Intensitätsschätzung und Faktorenanalyse machen dieses Konstrukt praktisch überflüssig. Daher unterscheiden sich die Resultate auch grundsätzlich von Karten mit eindeutigen Regionen neben Übergangsgebieten nach dem Vorbild von WIESINGER (1983a) – jedes Gebiet ist ein Mischgebiet, allein der Grad der Ausprägung variiert. 6.2.2 Prototypen Neuland betritt das Neue Dialektometrie-Projekt weiterhin, wenn es um die Verknüpfung zwischen Prototypentheorie, Variationstheorie und dialektologischer Praxis geht. So liest man noch bei CHRISTEN (1998, 51), dass die Prototypentheorie „bis heute keinen Eingang in die Dialektologie gefunden“ habe. Ein Jahrzehnt später ist das Konzept in der Theorie bereits präsenter: Lectal categories, in short, constitute prototype categories. If lectal varieties constitute prototype categories, some realizations will be more „typical“ or „central“ or „better examples“ of a given variety than others. (KRISTIANSEN 2008, 59)
Insbesondere das unscharfe Clustern von Sprachkarten kann nun in einem dritten Schritt die Empirie mit einbeziehen. Das Potential dieses Verfahrens ist noch auszutesten und kann im Rahmen einer diesbezüglich eher experimentell gelagerten Pilotstudie wie dieser nicht abschließend bewertet werden. Die grundsätzlichen Möglichkeiten, Sprachkarten a) unter Bezug auf ihre räumliche Struktur in Relation zueinander setzen zu können und gleichzeitig b) individuell in ein komplexes Netzwerk an Ähnlichkeiten zu prototypischen Raumverteilungen einbetten zu können, erscheinen m. E. zumindest im Grundsatz vielversprechend.
164
Ergebnisse, Konsequenzen und Perspektiven
6.2.3 Reihenschritte Auch Verfahren zur Analyse systemischer Relationen rücken dadurch in greifbare Nähe: So moniert z. B. GORDON (2002, 253), dass bislang noch keine Methodologie existiert, mit der ein im Entstehen begriffener oder gerade stattfindender Reihenschritt überhaupt ermittelt werden kann. Klar ist, dass es dafür der simultanen Untersuchung von kompletten Systemen bedarf. Aus qualitativer Sicht ist hier sicherlich vor allem der Aufwand ein Hindernis. Auch in der Dialektometrie fehlt jedoch die Auseinandersetzung mit dem Systemcharakter der Lautung in ihrer Gänze. Der Blick gilt – wie in der Lexik – den aufsummierten Unterschieden, der Gesamtdistanz der Messpunkte zueinander. Somit handelt es sich in der quantitativen Forschung primär um ein methodologisches Desiderat, in der qualitativen vermutlich eher um ein pragmatisches. Das Clustern von Sprachkarten bietet eine Chance, beide Desiderate in einem Durchgang zu adressieren. Aus einem Korpus aus Lautkarten lassen sich über die Raumstruktur der Karten diejenigen Phoneme ermitteln, die vermutlich an einem Wandelprozess beteiligt sind: Gesetzt den Fall, man hält die Reihenschritthypothese sowie die Annahme von Optimalitätstendenzen des Vokalsystems für belastbar – und das tue ich –,131 dann müssten bei stabilen Systemen in den Regionen (also ohne aktuellen Wandel) die Variantenausbreitungen der einzelnen Laute deckungsgleich sein. Die einzelnen Karten wären identisch in Bezug auf Lage und Größe ihrer Variantengebiete und hätten damit bei einer Clusterung identische Zuweisungswahrscheinlichkeiten zum selben Cluster. Entspricht ein Phänomen nicht dem Reihenschrittcharakter, dann stimmt seine räumliche Aufteilung nicht mit der homogenen Gruppe an anderen Vokalkarten überein; die Zugehörigkeitswerte zum jeweiligen Cluster ändern sich dementsprechend. 6.2.4
Perspektiven für Simulationsstudien
Ein weiterer wesentlicher Ertrag der oben propagierten Techniken soll hier lediglich skizziert werden: Über den vergleichenden Blick auf empirische historischsoziale, kulturelle, psychologische und sprachsysteminterne Größen hinaus ermöglichen sie auch die Annäherung an Phänomene und Vorgehensweisen, die üblicherweise Gegenstand der Naturwissenschaften im strengeren Sinn darstellen, nämlich Simulationen und Modellierungen. Im Zusammenhang mit Arbeiten wie dieser zur Diffusion sprachlicher Variation mag sich die Frage stellen, wozu man sich überhaupt noch zusätzlich mit simulierten Daten beschäftigen sollte – schließlich ist es schon schwierig genug, Aussagen zur „echten“ Variation zu treffen, die die „unsimulierte“ Welt per empirischer Datenerhebung zur Verfügung 131 Konkret für das SBS-Material liefert bereits die Interpretation der Kennwerte in Abschnitt 4.2.1 (ab Seite 99) dafür Evidenzen: Die Analyse der Kompaktheit, Homogenität und Komplexität im Vokalismus deutet darauf hin, dass potentiell reihenbildende Phoneme übereinstimmende Raumstrukturen aufweisen.
Rückwirkungen auf Theorie und Methode
165
stellt. Sinn von simulierten Daten ist, dass die Simulation im Regelfall auf einem relativ simplen Grundmuster beruht. Die Reproduktion einer empirischen Begebenheit mittels Simulation bedeutet also eine Reduktion der Beschreibungskomplexität, oder konkret: Die gemessene Verteilung von Varianten im Raum ist komplex, die Simulation erzeugt einen entsprechenden komplexen Zustand aber mittels einfacher Regeln. Die komplexe Variantenstruktur lässt sich also mittels einfacher Regeln herbeiführen. Man vereinfacht sich somit unter Umständen die Erklärung scheinbar komplexer Phänomene mit ihrer erfolgreichen Simulation, vgl. KOCHENDÖRFER (2000, 15): „Eine, vielleicht die wesentlichste Funktion der Simulation ist es, Zusammenhänge darzustellen und auszuwerten, deren Komplexität die menschliche Anschauung überfordern.“ Darüber hinaus helfen Simulationen, Vagheit in Theorien zu finden und zu vermeiden. Schlecht definierte oder schlicht falsche Annahmen über Voraussetzungen, Faktoren und Zusammenspiel führen in Simulationen zu unrealistischen Ergebnissen – entsprechend ist es auch möglich, zur Hypothesenprüfung gezielt Simulationen zu unrealistischen Szenarien durchzuführen (vgl. CANGELOSI / PARISI 2002; NORRIS 2005). Das Problem, das (auch) in der Sprachwissenschaft den Nutzen von simulierten Daten meist empfindlich schmälert, stellen CANGELOSI / PARISI (2002, 26) so dar: „At present, not many computer models make direct comparisons between simulation results and available empirical evidence, although simulations tend to be constrained on empirical research.“ Genau dies leistet die stochastische Herangehensweise; durch die Quantifizierung raumstruktureller Eigenschaften sind nun die Möglichkeiten dazu gegeben, Empirie und Simulation gleichwertig behandeln und damit vergleichen zu können. 6.2.5
Die kritische Masse
Dass sich die vorgestellten Methoden im Überlappungsbereich qualitativer und quantitativer Analysen bewegen, ermöglicht es zudem, auch Übergangsphänomene genauer beleuchten zu können. Die Aussage GOEBLS (2005, 500), dass die Gestalt einer aggregativen dialektometrischen Synthese ab einer Zahl von etwa 200 bis 300 Karten stabil bleibt, zieht nicht nach sich, dass die Analyse von mehr Karten redundant wäre. Die Stabilität gilt für eine randomisierte Auswahl an Karten aus einer stabilen Gesamtheit – aber welche linguistisch relevante Information lässt sich schon durch eine randomisierte Gruppe repräsentieren? Die Beobachtung stützt lediglich die triviale Erkenntnis, dass 200 bis 300 zufällige Stichproben aus einer im Fall von GOEBL (2005) etwa um den Faktor zwei bis sechs größeren Population ein weitgehend repräsentatives Sample darstellen. Die Resultate der frequenzkorrigierten Faktorenanalyse (5.3.3, ab Seite 152) bestätigen das auch für die SBS-Daten. Die interessantere Frage bleibt jedoch, inwiefern sich nicht-randomisierte bzw. inhaltlich bedeutsame Gruppierungen voneinander unterscheiden. Da bei vielen „gleichen“ (bzw. ähnlichen) Variablen die Entropie (der Informationsgehalt) der einzelnen Variablen abnimmt, wird sie informationstheoretisch zunehmend redun-
166
Ergebnisse, Konsequenzen und Perspektiven
dant (vgl. SHANNON / WEAVER [1949] 1998). Nutzt man keine Zufallsauswahl der Variablen, sondern nur die, die am stärksten zur Gestalt einer Gesamtauswertung beitragen, dann kann aus der Schaukelstuhl-Perspektive des Auswertenden statt des Fragebuchentwerfers post hoc die Anzahl der Variablen, die analysiert werden sollen, zum Teil drastisch reduziert werden. Abschnitt 5.3.3 (ab Seite 152) konnte zeigen, dass in der Faktorenanalyse die extreme Reduktion der Datengrundlage auf zirka ein Prozent (von 2155 auf 22 Karten), das am stärksten der Gesamtgestalt entspricht, immer noch ein adäquates Gesamtbild zeichnet.132 6.2.6
Selbstkritik: Der Nimbus der Zahl The fact is that, despite its mathematical base, statistics is as much an art as it is a science. HUFF ([1954] 1993, 122)
Man sollte jedoch grundlegend berücksichtigen, dass das number crunching komplexerer komputativer oder statistischer Verfahren einen gewissen Grad an Objektivität und Detailliertheit suggeriert, der die de facto nicht immer erfüllt werden kann. Das ist kein Abgesang auf quantitative Methoden,133 im Gegenteil: Es ist ein Plädoyer für verantwortungsvollen Umgang, für Verfeinerung und Transparenz. Mit der gezielten Wahl konservativerer statistischer Methoden – etwa dem Kaiser-Guttman-Kriterium zur Bestimmung der Faktorenzahl (vgl. 3.4.2, ab Seite 81), der Bonferroni-Korrektur zur Kompensation der Alphafehlerkumulierung (vgl. Seite 87) oder dem Vorzug nicht-parametrischer Tests, wenn die Voraussetzung für stärkere parametrische Tests nicht einwandfrei gesichert sind (vgl. Seite 136) – ist eine entsprechende Absicht verbunden: Die Absicht, die Zahl überbewerteter Resultate im Rahmen dieser Pilotstudie gering zu halten, um keine unrealistischen Erwartungshaltungen zu erzeugen, die Nachfolgestudien nicht reproduzieren könnten – selbstverständlich auf Kosten einiger Ergebnisse, die sich eventuell in risikoreicheren Herangehensweisen gezeigt hätten. Dass die Analysen nicht permanent von höchstsignifikanten Werten überstrahlt werden, ist kein Grund zur Besorgnis; wenn man die breit rezipierte Warnung IOANNIDIS‘ (2005) ernst nimmt („Too large and too highly significant effects may actually be more likely to be signs of large bias in most fields of modern research“, IOANNIDIS 2005, 700), gewinnen die Resultate dadurch gar an Glaubwürdigkeit. Es wird Aufgabe weiterer Untersuchungen sein müssen, die Leistungsfähigkeit der vorgeschlagenen Methoden weiter auszureizen, Stärken zu finden und Fehler zu reduzieren. 132 Selbstredend ist das Risiko groß, den Informationsgehalt einzelner Variablen im Vorfeld falsch einzuschätzen. Es empfiehlt sich daher weiterhin, jegliche Ökonomieentscheidung auf spätere Phasen von Längsschnittstudien zu begrenzen. 133 Argumentativ sollte man sich hier m. E. an HUFF ([1954] 1993, 123) orientieren: „But arbitrarily rejecting statistical methods makes no sense either. That is like refusing to read because writers sometimes use words to hide facts and relationships rather than to reveal them.“
Beiträge zur Qualitätssicherung in der Variationslinguistik
6.3
167
BEITRÄGE ZUR QUALITÄTSSICHERUNG IN DER VARIATIONSLINGUISTIK Qaghmeyllj tlchlD, ylyoH.134 (Klingonisches Sprichwort)
Um dem – zumindest zu einem gewissen Grad – zuzuarbeiten, zeigt dieser letzte Textteil der Arbeit, inwiefern eine probabilistische Perspektive zur Handhabung von Fehlerquellen beitragen kann. Dies beinhaltet sowohl, Teile der bislang präsentierten Techniken zu anderen Zwecken zu nutzen bzw. weiterführend zu interpretieren als auch Adaptionen der Techniken vorzuschlagen. 6.3.1
Skizzierung des Desiderats
Die modernen Naturwissenschaften haben sich im unmittelbaren Zusammenspiel mit der Entwicklung der sie stützenden Apparatur (sei sie rein technischer oder methodischer Art) entwickelt.135 Die Apparatur „erzeugt“ den Messfehler und entpersonalisiert ihn gleichzeitig; es ist nichts Ehrenrühriges an meiner Arbeit, wenn mein Ergebnis aufgrund eines ungenauen Werkzeugs nicht exakt ist. Da die Philologien scheinbar apparaturunabhängig sind, wird diese einzige legitime Störquelle ausgeklammert. Die verbleibende Fehlerquelle ist der Irrtum, die Inkompetenz des Forschers, nicht die Genauigkeit seiner Apparatur. In den Natur- und Sozialwissenschaften werden Forschungsergebnisse auch durch die Angabe der Messgenauigkeit als glaubwürdig betrachtet. Der impressionistische Charakter geisteswissenschaftlicher Forschung ermöglicht es zwangsläufig oft nicht, hier mit denselben Standards zu messen; gerade in quantitativen sprachwissenschaftlichen Verfahren, in denen es möglich ist, Fehlermargen zu ermitteln, sollte es aber Usus statt Luxus sein, diese auch explizit anzugeben. Fehlerquellen in der variationslinguistischen Forschung sind – ebenso wie der eigentliche Forschungsgegenstand selbst – Faktoren, die den Inhalt und die Gestalt der Varianz in den Daten formen. Kann man diese einzelnen Faktoren isolieren und quantifizieren, so kann man sie auch aus dem Datensatz entfernen. Das gilt sowohl für die im Lauf der Datenerhebung und -verarbeitung induzierten Störfaktoren als auch für die Faktoren, die der ursprünglichen Variation zugrundeliegen.
134 „Habe den Mut, deine Fehler zuzugeben.“ 135 „Meßgeräte zwingen, einen solchen Einheitsbegriff zu verwenden, für den sie gebaut worden sind, mehr noch, sie zwingen, solche Begriffe anzuwenden, aus denen sie hervorgegangen sind“ (FLECK [1936] 1983, 111).
168
Ergebnisse, Konsequenzen und Perspektiven
6.3.2
Defektive Datenlage
Oben wurde bereits angedeutet, dass das Berechnungsverfahren für Flächenkarten Datenpunkte interpolieren kann, für die keine Belege vorhanden sind (siehe 3.1.7, ab Seite 53). Das Schätzverfahren kann somit der Voraussage der Wahrscheinlichkeit einer Variante an diesem Datenpunkt dienen. Besonders interessant ist das für die Interpretation bzw. „Korrektur“ von Datensätzen, die Lücken aufweisen. WATTEL / REENEN (1995) kartieren mit diesem Ziel beispielsweise archäologische Funde nach einem probabilistischen Modell – sieht man einen Fundort auch für seine Umgebung als aussagekräftig an, so ergeben sich durch Häufungen von Funden innerhalb eines Gebietes Probabilitätskarten, die einen vermuteten flächigen Gebrauch des Gegenstands anzeigen. Für den sprachlichen Bereich wird die Interpolation von Ortspunkten umso interessanter, je schlechter aufgelöst die Daten sind; vor allem ist dabei an notorisch lückenhafte sprachhistorische Daten zu denken. In Sprachatlanten ist die Anzahl fehlender Daten im Regelfall durch das rigide Untersuchungsdesign deutlich kleiner; dennoch gibt es wohl im Datensatz eines jeden Atlanten fehlende Datenpunkte. Systematisch betrifft dies im Ortsnetz des SBS vor allem Augsburg (122), wo keine Landwirtschaft vorhanden ist, sowie Ottmarshausen und Obergünzburg (120 und 237), wo Probleme mit der Leistungsfähigkeit der Gewährspersonen auftraten. Weiterhin gibt es Ortspaare, die sich (aus verschiedenen Gründen) zu einer Aufnahme ergänzen bzw. ergänzen sollten: Es handelt sich hierbei um Scheuring / Beuerbach (170 / 186), Mammendorf / Landsberied (174 / 175) sowie Dickenreishausen / Lachen (219 / 221). Entsprechendes war außerdem für Bobingen und Oberottmarshausen (154 / 155) geplant, Bobingen wurde dann aber doch komplett erhoben (siehe detaillierter SBS 1, 17). Globale Techniken wie die Faktorenanalysen zeigen den Status dieser Abweichungen deutlich. Auf den Einzelkarten glättet die Dichteschätzung diese Ausreißer dagegen zu einem gewissen Grad. 6.3.3
Bestimmung der Güte der Verfahren
Über den Intensitätswert dominanter Varianten lässt sich die „Güte“ der Intensitätsschätzung bestimmen: Für jeden Ort wird der Intensitätswert der dominanten Variante gemessen, und zwar auf allen Karten. Der Durchschnitt wird dann visualisiert. So erhält man eine Karte der „Trennschärfe“ der Orte wie in Abbildung 80. Zunächst zur linken Karte: Hier wurde die Intensitätsschätzung auf Level 3, geo, Gauß-Kern, LCV durchgeführt. Klar zeigen sich ein räumlich zusammenhängendes Gebiet, in dem die Durchschnittsintensität deutlich geringer ausfällt, sowie – ebenfalls geografisch zusammenhängend – Regionen mit höherer Durchschnittsintensität. Ermittelt man die Durchschnittsintensität dagegen nicht auf Basis der euklidischen, sondern der linguistischen Distanz (lex / pho / mor, K3, CL), zeigt sich dieses Muster nicht; man vergleiche dazu die rechte Karte der Abbildung.
Beiträge zur Qualitätssicherung in der Variationslinguistik
169
Abb. 80: Durchschnittliche Intensität der dominanten Variante pro Ort.
Offenbar ist unter Anwendung der euklidischen Distanz die systematisch schwächere Intensität der zentraleren Region ein Artefakt der Glättung – dort, wo häufig Variantenübergänge in den Daten sind, schwächen sich benachbarte Orte gegenseitig in den Intensitäten ihrer jeweils dominanten Varianten; beim linguistischen Abstand dagegen zeigt sich für die meisten Orte ein relativ einheitlicher Durchschnittswert (zwischen 71 und 79 %, im Gegensatz zu Werten zwischen 68 und 85 % beim euklidischen Abstand – beide Datenreihen korrelieren übrigens mit r = 0,57). Lediglich die Orte direkt am Rand des Untersuchungsgebiets haben gelegentlich leicht erhöhte Werte, vermutlich, weil sie insgesamt weniger Nachbarorte haben. Darüber hinaus fallen Augsburg und Lechhausen auf – ihr Status als „Inseln“ innerhalb des Restgebiets führt zu höherem Abstand gegenüber den Nachbarn, dies wiederum zu stärkerer Intensität der dominanten Variante. Der
170
Ergebnisse, Konsequenzen und Perspektiven
linguistische Abstand ist demnach (wie schon auf Einzelkarten auszumachen war) stabiler und auch in Übergangszonen sowie Flecken mit Inselcharakter robust.136 6.3.4
Probabilisierung von Störgrößen
Die restlichen Abschnitte konzentrieren sich darauf, Störgrößen in den Daten durch Intensitätsschätzung und Faktorenanalyse zu finden und zu mindern. Als Beispiele dienen systematische Fehler, die durch die Gewährsperson oder den Explorator entstehen. Die Inkorporation weiterer Störgrößen wäre für eine umfassendere Fehlermethodologie unumgänglich, aus Skopusgründen haben hier aber diejenigen Präferenz, die sich direkt aus den SBS-Daten sowie der probabilistischen Perspektive ergeben.137 Was die Gewährsperson angeht, so können Fehlermargen im Rahmen einer probabilistischen Geolinguistik nicht nur dokumentiert, sondern aktiv gemindert werden. Zunächst zum Ausgangspunkt, der Auswahl der Gewährsperson: Eine Grundlage der Dialektologie ist es, dass die Gewährsperson kompetent sein muss. Ein Grundproblem der Dialektologie ist, dass es dafür keine Garantie gibt. Auch die gewissenhafteste Auswahl der Gewährspersonen kann manche internen Faktoren nicht ausschließen, die bedeutsame Auswirkungen auf das Ergebnis haben können.138 Die Repräsentativität der GP für die Sprechergruppe, die sie vertritt, kann im Vorfeld am sinnvollsten auf soziolinguistischem Weg gelöst werden, im Nachhinein kann die Anwendung statistischer Methoden dazu dienen, manche Fehlerquellen abschätzen und zu einem gewissen Teil auch eliminieren zu können. Im vorliegend dargestellten, stochastisch orientierten Modell ist es vornehmlich die Probabilisierung des Einzelbelegs, die dies leisten kann. Das ist in Sachen Datenqualität ein kritischer Punkt, den es genauer auszuführen gilt, denn die vorgestellten Methoden wirken zwar zunächst rein deskriptiv, sind streng genommen aber bereits zu einem gewissen Grad interpretativ; sie sind interpretativ in dem 136 Zu vertiefen wäre diese Güteprüfung z. B. mittels Bootstrapping (nach EFRON 1979), wobei man zunächst einzelne Belege (also die Werte eines einzelnen Ortspunkts) aus der Berechnung herauslässt und anschließend überprüft, ob die interpolierte Variante der reellen Variante entspricht oder nicht. Dies kann automatisiert für jeden Ort auf jeder Karte durchgeführt werden. Am Ende erhält man für jeden Ort einen Prozentsatz, der die Vorhersagbarkeit dieses Orts angibt, sowie einen globalen Durchschnittswert, der die Voraussagequalität der Methode insgesamt darstellt. Ein prinzipiell ähnliches Vorgehen schlagen auch WATTEL / REENEN (2010, 503) für ihre „probabilistic maps“ (vgl. Seite 48, Fn. 52) vor; durch PICKL / SPETTL / PRÖLL / ELSPAß / KÖNIG / SCHMIDT (2014) wird Entsprechendes anhand der SBS-Lexik vorgestellt. 137 Für den Störfaktor Transkription sei insbesondere auf KÖNIG (1988a) verwiesen. 138 Hauptsächlich denkt man in diesem Zusammenhang an systematische Abweichungen, die spezifisch an die Person gebunden sind. Das Problem beinhaltet aber auch unsystematische Fluktuationen, wie sie etwa im Rahmen der Sprachproduktion (und Rezeption, wenn es den Explorator betrifft) überindividuell allgegenwärtig sind (vgl. dazu Abschnitt 2.2.3, ab Seite 22).
Beiträge zur Qualitätssicherung in der Variationslinguistik
171
Sinne, dass etwa im Rahmen der Dichteschätzung Grundannahmen über die Natur räumlicher Daten präsupponiert werden. Wir gehen davon aus, dass die Distanzmaße – zumindest mit einem gewissen Grad an Genauigkeit – einen Zusammenhang der Daten modellieren, der sich nicht direkt messen lässt. Eine mögliche Kritik an diesem Eingriff in die Daten könnte folgendermaßen aussehen: Die Dichteschätzung sei ein interpretatives Verfahren, die „reinen“ Originaldaten, die quasi „in freier Wildbahn“ erhoben wurden, würden damit verfälscht und verlören ihre Ursprünglichkeit. So verkennt man aber die Genese der Daten – GEERTZ (2003) reflektiert die empirische Praxis folgendermaßen: Die Vorstellung vom „natürlichen Laboratorium“ ist […] schädlich gewesen, nicht nur weil der Vergleich falsch ist – um was für ein Laboratorium handelt es sich, in dem keiner der Parameter manipulierbar ist? –, sondern weil sie zu der Vorstellung führte, die aus ethnographischen Untersuchungen herrührenden Daten seien reiner, grundlegender, solider oder weniger konditioniert (das beliebteste Wort ist „elementarer“) als die anderer Arten von Sozialforschung. (GEERTZ 2003, 32–33)
Es erscheint mir wichtig, dies nochmals zu betonen: Auch unsere Daten sind evoziert und damit bereits „künstlicher“ Natur. Bereits KÖNIG (1975) widmet sich diesem Faktum explizit und ausführlich; AUER (2010) hält pointiert fest: Wie alle anderen sozialwissenschaftlichen Daten, die mit bestimmten Instrumenten für spezielle Fragestellungen erhoben werden, sind Dialektdaten also nicht Ausgangspunkt der Forschung als einem sozialen Ergebnis, sondern schon ihr erstes Resultat. (AUER 2010, 24)
Weiterhin sind die Annahmen, die der Dichteschätzung zugrundegelegt werden, unkontrovers. Dass geografischer und linguistischer Abstand korrelieren, ist allgemein akzeptiert (vgl. zum Überblick NERBONNE 2010b; außerdem hier Fußnote 54 auf Seite 50), die Handhabung von Mehrfachbelegen an einem Ort gar ein deutliches Desiderat (vgl. dazu ausführlicher Abschnitt 2.1.3, ab Seite 17). Bereits die Aggregation von Daten unterdrückt effektiv „schlechte“ Einzelbelege, liefert eine Gewährsperson aber (aus welchen Gründen auch immer) in höherer Zahl „schlechte“ Belege, so werden diese auch im Aggregat dominant. Systematische Fehler in Sachen Gewährsperson schlagen in dialektometrischen Verfahren daher zur Gänze durch. Für dichtegeschätzte Daten gilt das nicht: Weil die Belege, die ihn umgeben, Rückwirkungen auf die Stärke jedes einzelnen Belegs haben, werden Ausreißer gedämpft, und zwar individuell für jede Variable. Eine weitere Form der probabilistischen Gütesicherung mit Bezug zur Gewährsperson ist für die Daten des SBS und ähnlicher Projekte irrelevant, für moderne Korpora zur soziolinguistischen Variation aber umso nützlicher. Im Gegensatz zu traditionellen Sprachatlanten werden Korpora zur aktuellen Sprachvariation bisweilen für andere Anforderungen und Fragestellungen gesammelt und greifen notwendigerweise auch auf andere Daten zurück. Die Untersuchung der Basisdialekte ist kein vorrangiges Ziel mehr, weil dieser Sprachstand – zusammen mit seinen Sprechern – im Begriff ist, zu verschwinden. Die sozial möglichst homogene Gruppe an Gewährspersonen weicht einer möglichst repräsentativen Stichprobe durch die Gesellschaft. Das zieht in einer modernen, mobilen Gesellschaft auch nach sich, dass Gewährspersonen nicht ortsfest sind:
172
Ergebnisse, Konsequenzen und Perspektiven Indeed, in a synchronic dialect study there is no principled reason for excluding short-term residents: synchronic linguistics is the study of the language of a speech community at one point in time and as such all members of a speech community must qualify as possible informants, regardless of how long they have been members of that speech community. Only by sampling language from across the entire present population of a region can current and pervasive regional linguistic patterns be identified. (GRIEVE 2011, 516)
Eine solcherart beschaffene Datenbasis erfordert einen anderen Umgang mit der Repräsentativität von Belegen. Eine mögliche Lösung bestünde etwa in der Gewichtung der Belegrepräsentativität mittels des Alters und der Aufenthaltsdauer der GP: Man kartiert jeden Beleg an jedem Wohnort der GP, gewichtet mit dem Anteil an Lebenszeit, die die GP dort gewohnt hat. Zusammengezählt hätten diese „Teilbelege“ immer ein Gesamtgewicht von 1, der Beleg würde also gewissermaßen „gerecht“ nach Wohndauer im Raum verteilt. 6.3.5 Ermittlung und Subtraktion von Störfaktoren Während die Intensitätsschätzung auf Variablenebene Fehler adressieren kann, leistet die Faktorenanalyse Entsprechendes auf Varietätenebene. Der Prozess der Faktorenanalyse ist für sich genommen schon eine „Rauschminderung“ der zugrundeliegenden Daten. Weil Faktoren Korrelationen zwischen Varianten darstellen, fallen die Anteile der Daten, die untereinander nicht (bzw. nur schwach) korrelieren, unter den Tisch.
Abb. 81: Dokumentierte Varianz und gefilterte Rauschanteile pro Subgruppe.
Beiträge zur Qualitätssicherung in der Variationslinguistik
173
Das führt zu einer „Bereinigung“ des Datensatzes von Tendenzen, die – rein von einem statistischen Standpunkt aus betrachtet – irrelevant für das Gesamtbild sind, keinen Zusammenhang mit anderen Tendenzen aufweisen. Derjenige Anteil der Datenvarianz, den die Faktorenanalyse nicht erklärt, wird als „chaotischer“ Teil der Variation betrachtet. Der Prozentgrad dieses Rauschanteils kann für die Subkorpora des SBS Abbildung 81 entnommen werden. Im Prinzip könnte dies für eine Art Entropiemessung des Signals (im Sinne von SHANNON / WEAVER [1949] 1998) genutzt werden.
Abb. 82: Durch die Faktorenanalyse unerklärte Anteile der Variation pro Ort.
174
Ergebnisse, Konsequenzen und Perspektiven
Über die jeweiligen Faktorladungen kann dieser Informations- bzw. Rauschgrad auch pro Ort ermittelt und kartiert werden, so geschehen in Abbildung 82. Die besonders dunklen Orte mit dem höchsten Grad an unerklärter Variation sind Augsburg (63,58%), Oberottmarshausen (69,44 %), Scheuring (64,85 %), Mammendorf (86,60 %), Landsberied (64,10 %), Beuerbach (78,16 %), Dickenreishausen (64,78 %), Lachen (77,76 %) und Obergünzburg (66,82 %) – also exakt diejenigen, die in Punkt 6.3.2 (ab Seite 168) als Orte mit Datenproblem aufgeführt sind.
Abb. 83: Durch die Faktorenanalyse unerklärte Anteile der Variation pro Ort, ohne Teilaufnahmen (entsprechende Orte schraffiert).
Beiträge zur Qualitätssicherung in der Variationslinguistik
175
PICKL (2013a) identifiziert in der Faktorenanalyse der Lexik einen Faktor, der direkt auf die oben thematisierten fehlenden Belege und lokal besonderen Bedingungen in der Erhebungsphase zurückführbar ist (vgl. dort die Seiten 180–182). Da hier mit einer niedrigeren Faktorenzahl gearbeitet wird und demnach schwächere Faktoren eh ignoriert werden, wird dieser Störfaktor im vorliegenden Text nicht als eigener Lexikfaktor identifiziert: Er ist zwar lokal äußerst bedeutsam, sein Anteil an der globalen Variation liegt allerdings unterhalb der Grenze, die das Kaiser-Guttman-Kriterium verlangt; er schlägt daher dort im Rauschanteil durch. In den vorliegenden Analysen ist dieser Störfaktor dafür im Formen-Teilkorpus belegt (siehe 4.3.3, ab Seite 124). Ignoriert man die Orte, deren hoher Rauschanteil Erhebungsartefakten geschuldet ist, lässt sich eine deutlichere Karte wie in Abbildung 83 erstellen (die Prozent- / Grauskala ist im Vergleich zu Abbildung 82 gestaucht, die ausgeblendeten Orte sind durch Schraffur angezeigt). Hellere (d. h. durch die Faktorenanalyse besser beschreibbare) Gebiete treten – wenig überraschend – in Arealen auf, in denen die Kerngebiete starker Faktoren liegen. Der bairische Raum ist dagegen durchgängig schwächer. Eventuell ist das eine direkte Konsequenz dessen, dass die Fläche des bairischen Anteils im Untersuchungsgebiet kleiner als die schwäbische ist – je mehr Fläche Faktoren inkorporieren, desto mehr Varianz können sie auch beschreiben und desto eher sind sie stark genug, um von der Faktorenanalyse detektiert zu werden. „Bairische“ Faktoren haben demnach in der Theorie in unserem Korpus eine weniger große Chance, aus den Daten extrahiert zu werden. Unabhängig davon sind vor allem Orte mit hohen Einwohnerzahlen herausstechend schlecht beschreibbar, allen voran Augsburg, Landsberg und das ansonsten meist eher unauffällige Mering (vgl. die detailliertere Auflistung in Tabelle 13). Ort
Rauschanteil
Augsburg Landsberg am Lech Mering Prittriching Marxheim Raitenbuch Ottmaring Daiting Gersthofen Lechhausen
63,58 % 60,81 % 57,39 % 53,92 % 52,92 % 52,28 % 52,07 % 51,85 % 51,35 % 50,37 %
Tab. 13: Rauschanteile der zehn rauschintensivsten Orte (ohne Orte mit Teilaufnahmen).
Die Einwohnerzahl (Stand 1970) und der Rauschanteil korrelieren (ohne Orte mit Teilaufnahmen) mit r = 0,32; der „städtische“ Faktor und der Rauschanteil korrelieren gar mit r = 0,39.
176
Ergebnisse, Konsequenzen und Perspektiven
Eine weitere mögliche Fehlerquelle, die hier nicht kontrolliert, aber immerhin dokumentiert werden kann, ist auf systematische Abweichungen in der Exploration der Daten zurückzuführen. Im SBS-Einführungsband heißt es: „Überspitzt ausgedrückt machen wir einen Atlas zu den Dialekt-Schreibungen unserer Exploratoren“ (SBS 1, 38). In der Printversion des SBS sind die Gebiete der Hauptexploratoren in jeder Karte mit eingezeichnet, um eventuelle entsprechende Einflüsse erkennen zu können. PICKL (2013a, 141–157) geht einen bedeutenden Schritt weiter: Er untersucht für die Lexik des SBS, ob sich bestimmte Grenzen innerhalb des Untersuchungsgebiets signifikant häufig in den einzelnen Karten wiederfinden. Dabei wird auch die Bedeutung der Exploratoren untersucht, wobei klar gezeigt werden kann, dass sich die Exploratorengrenzen überzufällig verhalten (PICKL 2013a, 154–157). Auch die hier vorliegenden Faktorenanalysen, sowohl die einzelner Subkorpora als auch die der Gesamtvariation, legen systematische Abweichungen sowohl in den Frage- als auch den Transkriptionsgewohnheiten der Exploratoren nahe.139 Eine Vielzahl möglicher Störfaktoren, von deren Existenz zwar auszugehen war, die sich bislang aber nicht messen ließen, ist somit klar identifizierbar. 6.3.6 Rauschgeminderte (Re-)Konstruktion der Gesamtvariation The signal is the truth. The noise is what distracts us from the truth. SILVER (2012, 17)
Die Möglichkeiten der Faktorenanalyse gehen aber noch darüber hinaus; so kann man in der Rekonstruktion der Gesamtheit der Daten aus den einzelnen Faktorladungen (vgl. 3.4.3, ab Seite 83) gezielt bestimmte Faktoren ausschließen. PICKL (2013a, 222–223, 249) rekonstruiert das lexikalische Gesamtsystem ohne den Faktor für Teilaufnahmen und fehlende Belege und erstellt somit eine Gesamtschau ohne diese Rauschquelle. Es wäre ebenso problemlos möglich, Strukturen in der Rekonstruktion zu ignorieren, die offenbar auf systematische Abweichungen der Exploratoren untereinander zurückzuführen sind. Aber ein Vorgehen dieser Art ist natürlich nicht auf Fehlerquellen beschränkt: So ließe sich etwa der Anteil der Variation, der mit bevölkerungsreichen Regionen im Zusammenhang steht (der „städtische“ Faktor) ignorieren, um ein von standardnäheren Formen „bereinigtes“ Bild der Variation zu zeichnen. Auf Variantenebene könnten dagegen Clusterverfahren zur Rauschreduktion genutzt werden, indem man – quasi als „Müllcontainer“ – einen Cluster identifiziert (bzw. gezielt einrichtet), in dem Karten mit uninteressanter bzw. „verrausch139 Um dem Verdacht vorzubeugen, ich würde hier die Qualität der Erhebungen bzw. die Kompetenz der Exploratoren in den Schmutz ziehen wollen, sei an dieser Stelle ganz klar festgehalten: Die hohe Konsistenz des Datensatzes, trotz einer Erhebungsphase über mehrere Jahre und in vielen tausenden Interviewstunden, ist und bleibt beeindruckend und gibt ein hervorragendes Zeugnis der Präzision der Planung sowie der Fähigkeiten der Exploratoren.
Beiträge zur Qualitätssicherung in der Variationslinguistik
177
ter“ Raumstruktur landen. Diese Karten können von weiteren Analysen ausgeschlossen werden. Die aggregative Dialektometrie unterdrückt diese Außenseiter durch große Datenmengen – so könnten sie auch gezielt aussortiert werden. Für die post-hoc-Qualitätssicherung stellt die probabilistische Geolinguistik demnach mehrere Optionen zur Verfügung: Die Dichteschätzung nivelliert in einzelnen Varianten „schlechte“ Einzelbelege, mittels der Faktorenanalyse ist es ferner möglich, die Daten auf Aggregatebene a) von statistischem Rauschen zu befreien (weil das Rauschen unkorreliert ist und daher nicht durch einen Faktor ausgedrückt wird) und b) identifizierte Störfaktoren in der Rekonstruktion ignorieren zu können.
7
FAZIT Jede wissenschaftliche Erkenntnis ist in erster Linie eine Enttäuschung, denn indem sie das Erstaunen befriedigt, zerstört sie das Staunen. Aber in der nächsten Etappe schafft jede Lösung eine Reihe neuer Fragen, deshalb folgt auf die Erkenntnisenttäuschung ein neues und tieferes Staunen. FLECK ([1936] 1983, 125)
Abschließend fasse ich den Inhalt und die Erträge dieser Arbeit wie folgt zusammen: Die aktuelle Sicht auf Sprache als komplexes System erfordert eine entsprechende, mehrdimensionale Perspektive auf geolinguistische Variation, die sowohl die individuelle als auch die populative Ebene mit einbezieht. Die traditionelle quantitative Dialektologie bzw. Dialektometrie kann – oder sollte – dazu sowohl in theoretischer als auch methodischer Hinsicht angepasst werden. Ziel dieser Arbeit war es, zu zeigen, wie eine stochastische Herangehensweise an geolinguistische Daten (als Ergänzung zu bestehenden Methoden) aussehen kann: Aus punktuellen empirischen Daten werden Intensitäten geschätzt, raumstatistische Eigenschaften von Sprachkarten können gemessen und verglichen werden; es lassen sich Gruppen aus räumlich ähnlichen Karten bilden und tiefgehende Strukturen in den Daten über ihre Kookkurrenzen aufspüren. Die Erfassung komplexer räumlicher Eigenschaften in Form von anschaulich interpretierbaren, objektiviert vergleichbaren Werten sowie die daraus folgende Anbindung an etablierte Standardverfahren der statistischen Auswertung sind klare Stärken der Verfahren. In Bezug auf Sprache als System wurde offenbar, dass sich die hartnäckige Überzeugung, dass die Lexik ein Konglomerat idiosynkratischer Verteilungen sei, höchstens tendenziell bekräftigen lässt – zwar ist die Systematizität des Lautsystems und der Morphologie insgesamt höher (und ihre Raumbilder paralleler), aber auch im Wortschatz existieren Muster, so wie in Lautung und Formen Entropie herrschen kann. Differenziertere bzw. differenzierendere Methoden wie die Übertragung von Konzepten der Unschärfe auf Zusammenhänge innerhalb und zwischen Varietäten, sowie nicht zuletzt die unterschwelligen Strukturen, die durch Faktorenanalysen aus scheinbar homogenen Daten gewonnen werden, führten vor Augen, wie fragil und komplex in der geografischen Sprachvariation das Zusammenwirken von Regularität und Irregularität sein kann.
LITERATURVERZEICHNIS ABONYI, JÁNOS / BALÁZS FEIL (2007): Cluster Analysis for Data Mining and System Identification. Basel/Boston/Berlin: Birkhäuser. ADLER, JOSEPH (2010): R in a Nutshell. Beijing/Cambridge [u. a.]: OʼReilly. AIS = JABERG, KARL / JAKOB JUD (Hg.) (1928–1960): Sprach- und Sachatlas Italiens und der Südschweiz. Bände 1–8. Zofingen: Ringler. AITCHISON, JEAN (1997): Wörter im Kopf. Eine Einführung in das mentale Lexikon. Tübingen: Niemeyer. ALTMANN, GABRIEL (1985): On the Dynamic Approach to Language. In: BALLMER, THOMAS T. (Hg.): Linguistic Dynamics. Discourses, Procedures and Evolution. Berlin/New York: de Gruyter, 181–189. ANAE = LABOV, WILLIAM / SHARON ASH / CHARLES BOBERG (2006): The Atlas of North American English. Phonetics, Phonology and Sound Change. Berlin/New York: Mouton de Gruyter. ANDERS, CHRISTINA ADA (2010): Wahrnehmungsdialektologie. Das Obersächsische im Alltagsverständnis von Laien. Berlin/New York: de Gruyter. ANDERSON, JOHN R. (2001): Kognitive Psychologie. 3. Auflage. Heidelberg/Berlin: Spektrum. AUER, PETER (2004): Sprache, Grenze, Raum. In: Zeitschrift für Sprachwissenschaft 23/2, 149–180. AUER, PETER (2010): Der Grunddialekt als Konstrukt: Wie Gewährspersonen und Erheber in der direkten Befragen die Daten der Atlasdialektologie konstituieren. In: HUCK, DOMINIQUE / THIRESIA CHOREMI (Hg.): Parole(s) et langue(s), espaces et temps. Mélanges offerts à Arlette Bothorel-Witz. Strasbourg: Université de Strasbourg, 23–36. AURREKOETXEA, GOTZON (2010): The correlation between morphological, syntactic and phonological variation on the Basque language. In: HESELWOOD, BARRY / CLIVE UPTON (Hg.): Proceedings of Methods XIII. Papers from the Thirteenth International Conference on Methods in Dialectology, 2008. Frankfurt am Main: Lang, 207–218. AURREKOETXEA, GOTZON / KARMELE FERNANDEZ-AGUIRRE / JESÚS ANGEL RUBIO / BORJA RUIZ / JON SÁNCHEZ (2013): DiaTech: A New Tool for Dialectology. In: Literary and Linguistic Computing 28/1, 23–30. BACKHAUS, KLAUS / BERND ERICHSON / WULFF PLINKE / ROLF WEIBER (2011): Multivariate Analysemethoden. 13., überarbeitete Auflage. Berlin: Springer. BARBUJANI, GUIDO / ROBERT R. SOKAL (1990): Zones of sharp genetic change in Europe are also linguistic boundaries. In: Proceedings of the National Academy of Sciences of the United States of America 87/5, 1816–1819. BAUER, ROLAND (2009): Dialektometrische Einsichten. Sprachklassifikatorische Oberflächenmuster und Tiefenstrukturen im lombardo-venedischen Dialektraum und in der Rätoromania. San Martin de Tor: Istitut Ladin Micurà de Rü. BERTHELE, RAPHAEL (2004): Dialektsoziologie – Soziolinguistische Aspekte der Dialektologie. In: AMMON, ULRICH / NORBERT DITTMAR / KLAUS J. MATTHEIER / PETER TRUDGILL (Hg.): Sociolinguistics. Soziolinguistik. 1. Teilband. 2. Auflage. Berlin/New York: de Gruyter, 721–738. BEZDEK, JAMES C. (1973): Cluster Validity with Fuzzy Sets. In: Journal of Cybernetics 3/3, 58–73. BEZDEK, JAMES C. (1981): Pattern recognition with fuzzy objective function algorithms. New York: Plenum Press. BIBER, DOUGLAS (1985): Investigating macroscopic textual variation through multifeature/multidimensional analyses. In: Linguistics 23/2, 337–360.
180
Literaturverzeichnis
BIBER, DOUGLAS (1991): Variation across speech and writing. Cambridge [u. a.]: Cambridge University Press. BÖHM, MICHAEL / MATTHIAS KUGLER (2006): Analyse räumlich aufgelöster Sprachdaten. Unveröffentlichter Forschungsbericht, Universität Ulm. BORTZ, JÜRGEN (1993): Statistik für Sozialwissenschaftler. 4. Auflage. Berlin/Heidelberg: Springer. BRITAIN, DAVID (2010): Conceptualizations of geographic space in linguistics. In: LAMELI, ALFRED / ROLAND KEHREIN / STEFAN RABANUS (Hg.): Language and Space Volume 2: Language Mapping. Berlin/New York: de Gruyter, 69–97. BÜCHERL, RAINALD (1999): Dialektwandel in Übergangsgebieten. In: STEHL, THOMAS (Hg.): Dialektgenerationen, Dialektfunktionen, Sprachwandel. Tübingen: Narr, 151–170. CANGELOSI, ANGELO / DOMENICO PARISI (2002): Computer Simulation: A New Scientific Approach to the Study of Language Evolution. In: CANGELOSI, ANGELO / DOMENICO PARISI (Hg.): Simulating the evolution of language. London/Berlin/Heidelberg: Springer, 3–28. CATTELL, RAYMOND B. (1966): The scree test for the number of factors. In: Multivariate Behavioral Research 1, 245–276. CHRISTEN, HELEN (1998): Dialekt im Alltag. Eine empirische Untersuchung zur lokalen Komponente heutiger schweizerdeutscher Varietäten. Tübingen: Niemeyer. CHRISTEN, HELEN (2010): Was Dialektbezeichnungen und Dialektattribuierungen über alltagsweltliche Konzeptualisierungen sprachlicher Heterogenität verraten. In: ANDERS, CHRISTINA ADA / MARKUS HUNDT / ALEXANDER LASCH (Hg.): Perceptual Dialectology. Neue Wege der Dialektologie. Berlin/New York: de Gruyter, 269–290. COSERIU, EUGENIO (1974): Synchronie, Diachronie und Geschichte. Das Problem des Sprachwandels. München: Fink. CROFT, WILLIAM (2000): Explaining language change. An evolutionary approach. Harlow: Longman. DE BOER, BART (1997): Generating Vowel Systems in a Population of Agents. In: HUSBANDS, PHIL / INMAN HARVEY (Hg.): Fourth European Conference On Artificial Life. Cambridge: MIT Press, 503–510. DE BOER, BART (2001): The Origins of Vowel Systems. Oxford/New York: Oxford University Press. DE BOER, BART (2005): Self-organisation in language. In: HEMELRIJK, CHARLOTTE K. (Hg.): Selforganisation and Evolution of Social Systems. Cambridge: Cambridge University Press, 123–139. DICKINSON, GORDON C. (1973): Statistical mapping and the presentation of statistics. Second edition. London: Arnold. DUNN, JOSEPH C. (1974): Well-Separated Clusters and Optimal Fuzzy Partitions. In: Journal of Cybernetics 4/1, 95–104. ECKHARDT, BRUNO (2004): Chaos. Frankfurt am Main: Fischer Taschenbuch. EFRON, BRADLEY (1979): Bootstrap Methods: Another Look at the Jackknife. In: The Annals of Statistics 7/1, 1–26. FAHRMEIR, LUDWIG / RITA KÜNSTLER / IRIS PIGEOT / GERHARD TUTZ (2009): Statistik. Berlin: Springer. FÄRBER, INES / STEPHAN GÜNNEMANN / HANS-PETER KRIEGEL / PEER KRÖGER / EMMANUEL MÜLLER / ERICH SCHUBERT / THOMAS SEIDL / ARTHUR ZIMEK (2010): On using class-labels in evaluation of clusterings. In: FERN, XIAOLI Z. / IAN DAVIDSON / JENNIFER DY (Hg.): Proceedings of the 1st international workshop on discovering, summarizing and using multiple clusterings (MultiClust) held in conjunction with KDD 2010. Online: http://eecs.oregonstate.edu/research/ multiclust/Evaluation-4.pdf [Stand: 14.11.2014] FISCHER, HERMANN (1895): Geographie der schwäbischen Mundart. Mit einem Atlas von achtundzwanzig Karten. Tübingen: Laupp. FLECK, LUDWIK ([1929] 1983): Zur Krise der „Wirklichkeit“. In: SCHÄFER, LOTHAR / THOMAS SCHNELLE (Hg.): Ludwik Fleck: Erfahrung und Tatsache. Gesammelte Aufsätze. Frankfurt am Main: Suhrkamp, 46–58. FLECK, LUDWIK ([1935] 1980): Entstehung und Entwicklung einer wissenschaftlichen Tatsache. Einführung in die Lehre vom Denkstil und Denkkollektiv. Frankfurt am Main: Suhrkamp.
Literaturverzeichnis
181
FLECK, LUDWIK ([1936] 1983): Das Problem einer Theorie des Erkennens. In: SCHÄFER, LOTHAR / THOMAS SCHNELLE (Hg.): Ludwik Fleck: Erfahrung und Tatsache. Gesammelte Aufsätze. Frankfurt am Main: Suhrkamp, 84–127. FREUDENBERG, RUDOLF (1974): Der alemannisch-bairische Grenzbereich in Diachronie und Synchronie. Marburg: Elwert. FRIED, PANKRAZ (1982): Die Mundart im Landkreis Landsberg. In: MÜLLER-HAHL, BERNHARD (Hg.): Heimatbuch für den Landkreis Landsberg am Lech. München: Hoeppner, 283–186. GEERTZ, CLIFFORD (2003): Dichte Beschreibung. Bemerkungen zu einer deutenden Theorie von Kultur. In: Dichte Beschreibung. Beiträge zum Verstehen kultureller Systeme. Frankfurt am Main: Suhrkamp, 7–43. GIRAUDOUX, PATRICK (2013): pgirmess: Data analysis in ecology. R package version 1.5.7. Online: http://CRAN.R-project.org/package=pgirmess [Stand: 14.11.2014] GIRNTH, HEIKO (2010): Mapping language data. In: LAMELI, ALFRED / ROLAND KEHREIN / STEFAN RABANUS (Hg.): Language and Space Volume 2: Language Mapping. Berlin/New York: de Gruyter, 98–121. GLUTH, KLAUS / MARION LOMPA / HANS-HENNING SMOLKA (1982): Verfahren dialektologischer Karteninterpretation und ihre Reichweite. In: BESCH, WERNER / ULRICH KNOOP / WOLFGANG PUTSCHKE / HERBERT ERNST WIEGAND (Hg.): Dialektologie. Ein Handbuch zur deutschen und allgemeinen Dialektforschung. Berlin/New York: de Gruyter, 485–500. GOEBL, HANS (1982): Dialektometrie. Prinzipien und Methoden des Einsatzes der Numerischen Taxonomie im Bereich der Dialektgeographie. Wien: Verlag der Österreichischen Akademie der Wissenschaft. GOEBL, HANS (1984): Dialektometrische Studien. Anhand italoromanischer, rätoromanischer und galloromanischer Sprachmaterialien aus AIS und ALF. 3 Bände. Tübingen: Niemeyer. GOEBL, HANS (1997): Some Dendrographic Classifications of the Data of CLAE 1 and CLAE 2. In: VIERECK, WOLFGANG / HEINRICH RAMISCH / HARALD HÄNDLER / CHRISTIAN MARX (Hg.): The Computer Developed Linguistic Atlas of England 2. Tübingen: Niemeyer, 23–32. GOEBL, HANS (2005): Dialektometrie. In: KÖHLER, REINHARD / GABRIEL ALTMANN / RAJMUND G. PIOTROWSKI (Hg.): Quantitative Linguistik. Ein internationales Handbuch. Berlin/New York: de Gruyter, 498–531. GOLDSTEIN, EUGEN BRUCE (2002): Wahrnehmungspsychologie. 2. Aufl. Heidelberg/Berlin: Spektrum. GOOSKENS, CHARLOTTE (2004): Norwegian dialect distances geographically explained. In: GUNNARSSON, BRITT-LOUISE / LENA BERGSTRÖ / GERD EKLUND / STAFFAN FRIDELL / LISE H. HANSEN / ANGELA KARSTADT / BENGT NORDBERG / EVA SUNDGREN / MATS THELANDER (Hg.): Language Variation in Europe. Papers from the Second International Conference on Language Variation in Europe ICLaVE 2. Universität Uppsala, 195–206. GOOSKENS, CHARLOTTE (2005): Traveling time as a predictor of linguistic distance. In: Dialectologia et Geolinguistica 13, 38–62. GOOSSENS, JAN (1977): Deutsche Dialektologie. Berlin/New York: de Gruyter. GORDON, MATTHEW J. (2002): Investigating Chain Shifts and Mergers. In: CHAMBERS, JACK K. / PETER TRUDGILL / NATALIE SCHILLING-ESTES (Hg.): The Handbook of Language Variation and Change. Malden: Blackwell, 244–266. GRIES, STEFAN (2012): Statistische Modellierung. In: Zeitschrift für germanistische Linguistik 40/1, 38–67. GRIEVE, JACK (2011): A regional analysis of contraction in written American English. In: International Journal of Corpus Linguistics 16/4, 514–546. GRIEVE, JACK / DIRK SPEELMAN / DIRK GEERAERTS (2011): A statistical method for the identification and aggregation of regional linguistic variation. In: Language Variation and Change 23/2, 193–221. GREVE, JENS / ANNETTE SCHNABEL (2011): Einleitung. In: GREVE, JENS / ANNETTE SCHNABEL (Hg.): Emergenz. Zur Analyse und Erklärung komplexer Strukturen. Berlin: Suhrkamp, 7–33. HAAG, KARL (1898): Die Mundarten des oberen Neckar- und Donaulandes. Reutlingen: Hutzler. HAAS, WALTER (1978): Sprachwandel und Sprachgeographie. Wiesbaden: Steiner.
182
Literaturverzeichnis
HAAS, WALTER (2010): A study on areal diffusion. In: SCHMIDT, JÜRGEN ERICH / PETER AUER (Hg.): Language and Space Volume 1: Theories and Methods. Berlin: de Gruyter, 649–667. HAIMERL, EDGAR (2006): Database Design and Technical Solutions for the Management, Calculation, and Visualization of Dialect Mass Data. In: Literary and Linguistic Computing 21/4, 437–444. HARDING, SANDRA (2003): Starke Objektivität. In: VOGEL, MATTHIAS / LUTZ WINGERT (Hg.): Wissen zwischen Entdeckung und Konstruktion. Erkenntnistheoretische Kontroversen. Frankfurt am Main: Suhrkamp, 162–190. HEERINGA, WILBERT JAN (2004): Measuring dialect pronunciation differences using levenshtein distance. Dissertation, Rijksuniversiteit Groningen. HEINZE, STEFAN (1995): Die Region Bayerisch-Schwaben. Studien zum schwäbischen Regionalismus im 19. und 20. Jahrhundert. Augsburg: Verlag der Schwäbischen Forschungsgemeinschaft. HEISENBERG, WERNER ([1927] 1994): Über die Grundprinzipien der „Quantenmechanik“. In: MEYENN, KARL VON (Hg.): Quantenmechanik und Weimarer Republik. Braunschweig/Wiesbaden: Vieweg, 283–284. HERRMANN, THEO (1995): Allgemeine Sprachpsychologie. Grundlagen und Probleme. 2. Auflage. Weinheim: PVU. HUFF, DARRELL ([1954] 1993): How to lie with statistics. New York/London: Norton. IBROM, ERNST (1973): Die schwäbisch-bairischen Dialekte zwischen Augsburg und der Donau. Augsburg: Historischer Verein für Schwaben. IOANNIDIS, JOHN P. A. (2005): Why most published research findings are false. In: PLoS Medicine 2/8, 696–701. JANERT, PHILIPP K. (2010): Data Analysis with Open Source Tools. Beijing/Cambridge [u. a.]: OʼReilly. JOHNSON, KEITH (2008): Quantitative Methods in Linguistics. Oxford: Blackwell. JUNG, CARL GUSTAV (1964): Gegenwart und Zukunft. Zürich/Stuttgart: Rascher. KABACOFF, ROBERT I. (2011): R in Action: Data Analysis and Graphics with R. Shelter Island: Manning. KELLE, BERNHARD (1995): Ist die Donau eine Binnengrenze im Schwäbischen? Ein Beitrag zur Frage: Flüsse als Sprachgrenzen? In: LÖFFLER, HEINRICH (Hg.): Alemannische Dialektforschung. Bilanz und Perspektiven. Beiträge zur 11. Arbeitstagung Alemannischer Dialektologen. Tübingen/Basel: Francke, 107–122. KELLER, RUDI (2003): Sprachwandel. 3. Auflage. Tübingen: Francke. KESSLER, BRETT (1995): Computational dialectology in Irish Gaelic. In: Proceedings of the 7th Conference of the European Chapter of the Association for Computational Linguistics. Dublin: EACL, 60–67. KIEßLING, ROLF (2009): Kleine Geschichte Schwabens. Regensburg: Pustet. KLAUSMANN, HUBERT (2012): Kleiner Sprachatlas von Vorarlberg und Liechtenstein. Innsbruck/ Wien/Bozen: Studienverlag. KOCHENDÖRFER, GÜNTER (2000): Simulation neuronaler Strukturen der Sprache. Tübingen: Narr. KÖNIG, WERNER (1975): Überlegungen zur Beschreibung von Aufnahmesituation und Informant bei sprachgeographischen Erhebungen. Mit einem Vorschlag zur Operationalisierung individueller Eigenschaften von Informanten. In: Deutsche Sprache 3/4, 346–364. KÖNIG, WERNER (1976): Der Landschaftsname Allgäu. Zur Abhängigkeit seines Bedeutungsumfangs von regionalen, psychologischen und soziologischen Faktoren. In: Alemannisches Jahrbuch 1973/75, 184–200. KÖNIG, WERNER (1988a): Zum Problem der engen phonetischen Transkription. Schwierigkeiten und Fehlerquellen am Beispiel von deutscher Substandard-Lautung. In: Zeitschrift für Dialektologie und Linguistik 55/2, 155–178. KÖNIG, WERNER (1988b): Der Sprachatlas von Bayerisch Schwaben im Rahmen der anderen Sprachatlanten des Alemannischen. In: FRIED, PANKRAZ / WOLF-DIETER SICK (Hg.): Die historische Landschaft zwischen Lech und Vogesen. Augsburg: Schwäbische Forschungsgemeinschaft, 165–185. KÖNIG, WERNER (1999): Das Kartierungssystem des Sprachatlas von Bayerisch-Schwaben. In: Dialectologia et Geolinguistica 7, 59–79.
Literaturverzeichnis
183
KÖNIG, WERNER (2001): dtv-Atlas Deutsche Sprache. 13. Auflage. München: Deutscher Taschenbuch Verlag. KÖNIG, WERNER (2004): Ortsnamen auf -ingen im Ries. Zur sprachhistorischen Interpretation sprachgeographischer Strukturen. In: BOK, VÁCLAV / ULLA WILLIAMS / WERNER WILLIAMSKRAPP (Hg.): Studien zur deutschen Sprache und Literatur. Festschrift für Konrad Kunze. Hamburg: Kovač, 259–270. KÖNIG, WERNER (2010a): Kommunikative Reichweiten. Ein Beitrag zur perzeptiven Dialektologie am Beispiel des Films „Wer früher stirbt ist länger tot“. In: Zeitschrift für Dialektologie und Linguistik 77/1, 1–18. KÖNIG, WERNER (2010b): Investigating language in space: Methods and empirical standards. In: SCHMIDT, JÜRGEN ERICH / PETER AUER (Hg.): Language and Space Volume 1: Theories and Methods. Berlin/New York: de Gruyter, 494–511. KÖNIG, WERNER (2010c): Großmundarten und Dialektgrenzen. In: FREI, HANS / PANKRAZ FRIED / FRANZ SCHAFFER (Hg.): Historischer Atlas von Bayerisch-Schwaben. 2. Auflage. Augsburg: Verlag der schwäbischen Forschungsgemeinschaft. 5. Lieferung, XIII, 1. KÖNIG, WERNER (2011): Alemannisch-Schwäbische Dialekte in Bayern. In: Historisches Lexikon Bayerns. Online: http://www.historisches-lexikon-bayerns.de/artikel/artikel_45732 [Stand: 14.11.2014] KÖNIG, WERNER / MANFRED RENN (2007): Kleiner Sprachatlas von Bayerisch-Schwaben. Augsburg: Wißner. KRETZSCHMAR, WILLIAM A. / SCHNEIDER, EDGAR W. (1996): Introduction to Quantitative Analysis of Linguistic Survey Data. An Atlas by the Numbers. Thousand Oaks/London/New Delhi: Sage Publications. KRISTIANSEN, GITTE (2008): Style-shifting and shifting styles: A socio-cognitive approach to lectal variation. In: KRISTIANSEN, GITTE / RENÉ DIRVEN (Hg.): Cognitive Sociolinguistics. Berlin/New York: Mouton de Gruyter, 45–88. KUHN, THOMAS S. (2012): The Structure of Scientific Revolutions. 50th Anniversary Edition. Chicago: University of Chicago Press. KÜMMEL, MARTIN JOACHIM (2007): Konsonantenwandel. Bausteine zu einer Typologie des Lautwandels und ihre Konsequenzen für die vergleichende Rekonstruktion. Wiesbaden: Reichert. KÜPPERS, GÜNTER / RAINER PASLACK (1996): Die natürlichen Ursachen von Ordnung und Organisation. In: KÜPPERS, GÜNTER (Hg.): Chaos und Ordnung. Formen der Selbstorganisation in Natur und Gesellschaft. Stuttgart: Reclam, 44–60. LABOV, WILLIAM (1994): Principles of Linguistic Change. Volume 1: Internal Factors. Cambridge: Blackwell. LABOV, WILLIAM (2001): Principles of Linguistic Change. Volume 2: Social Factors. Cambridge: Blackwell. LAMELI, ALFRED (2014): Distanz als raumstrukturelle Eigenschaft dialektaler Kontaktsituationen. Eine Analyse des Schwäbischen. In: HUCK, DOMINIQUE (Hg.): Alemannische Dialektologie: Dialekte im Kontakt. Beiträge zur 17. Arbeitstagung zur alemannischen Dialektologie in Straßburg vom 26.–28.10.2011. Stuttgart: Steiner, 67–86. LAMSAS = MCDAVID, RAVEN I. (Hg.) (1980): Linguistic atlas of the middle and south Atlantic states. Chicago: University of Chicago Press. LEISCH, FRIEDRICH (2006): A Toolbox for K-Centroids Cluster Analysis. In: Computational Statistics and Data Analysis 51/2, 526–544. LENGGER, WERNER (2002): Leben und Sterben in Schwaben. Studien zur Bevölkerungsentwicklung und Migration zwischen Lech und Iller, Ries und Alpen im 17. Jahrhundert. Augsburg: Wißner. LEVELT, WILLEM J. M. (1989): Speaking. From intention to articulation. Cambridge: MIT Press. LEVELT, WILLEM J. M. (1993): The Architecture of Normal Spoken Language Use. In: BLANKEN, GERHARD / JÜRGEN DITTMANN / HANNELORE GRIMM / JOHN C. MARSHALL / CLAUS-W. WALLESCH (Hg.): Linguistic Disorders and Pathologies. Berlin/New York: de Gruyter, 1–15. LIEBERMAN, EREZ / JEAN-BAPTISTE MICHEL / JOE JACKSON / TINA TANG / MARTIN A. NOWAK (2007): Quantifying the evolutionary dynamics of language. In: Nature 449, 713–716.
184
Literaturverzeichnis
LIGGES, UWE / MARTIN MÄCHLER (2003): Scatterplot3d – an R Package for Visualizing Multivariate Data. In: Journal of Statistical Software 8/11, 1–20. LIVINGSTONE, DANIEL (2002): The Evolution of Dialect Diversity. In: CANGELOSI, ANGELO / DOMENICO PARISI (Hg.): Simulating the evolution of language. London/Berlin/Heidelberg: Springer, 99–117. LÜDTKE, HELMUT (1999): Sprache zwischen ‘Chaos’ und spontaner Ordnung. In: STEHL, THOMAS (Hg.): Dialektgenerationen, Dialektfunktionen, Sprachwandel. Tübingen: Narr, 1–17. MEHL, STEPHAN (1995): Zur Präzisierung des Begriffs der Unschärfe. In: HITZENBERGER, LUDWIG (Hg.): Angewandte Computerlinguistik. Vorträge im Rahmen der Jahrestagung 1995 der Gesellschaft für Linguistische Datenverarbeitung (GLDV) e.V., Regensburg, 30.–31.3.1995. Hildesheim/Zürich/New York: Olms, 143–151. MERLEAU-PONTY, MAURICE ([1934] 1996): La Nature de la perception. In: Le primat de la perception et ses conséquences philosophiques. Lagrasse: Éditions Verdier, 15–38. MESCHENMOSER, DANIEL / SIMON PRÖLL (2012a): Using fuzzy clustering to reveal recurring spatial patterns in corpora of dialect maps. In: International Journal of Corpus Linguistics 17/2, 176–197. MESCHENMOSER, DANIEL / SIMON PRÖLL (2012b): Automatic detection of radial structures in dialect maps: determining diffusion centers. In: Dialectologia et Geolinguistica 20, 71–83. MOJENA, RICHARD (1977): Hierarchical grouping methods and stopping rules: An evaluation. In: The Computer Journal 20/4, 359–363. MOSER, GEORG (1933): Studien zur Dialektgeographie des Staudengebietes und des anstoßenden Lechrains. Marburg: Friedrich. MÆHLUM, BRIT (2007): Konfrontasjoner. Når språk møtes. Oslo: Novus. NAUMANN, CARL LUDWIG (1982): Kartographische Datendarstellung. In: BESCH, WERNER / ULRICH KNOOP / WOLFGANG PUTSCHKE / HERBERT ERNST WIEGAND (Hg.): Dialektologie. Ein Handbuch zur deutschen und allgemeinen Dialektforschung. Band 1.1. Berlin/New York: de Gruyter, 667–692. NERBONNE, JOHN (2006): Identifying Linguistic Structure in Aggregate Comparison. In: Literary and Linguistic Computing 21/4, 463–476. NERBONNE, JOHN (2010a): Mapping aggregate variation. In: LAMELI, ALFRED / ROLAND KEHREIN / STEFAN RABANUS (Hg.): Language and Space Volume 2: Language Mapping. Berlin/New York: de Gruyter, 476–495. NERBONNE, JOHN (2010b): Measuring the diffusion of linguistic change. In: Philosophical transactions of the Royal Society of London B 365, 3821–3828. NERBONNE, JOHN / WILBERT HEERINGA (2007): Geographic distributions of linguistic variation reflect dynamics of differentiation. In: FEATHERSTON, SAM / WOLFGANG STERNEFELD (Hg.): Roots: Linguistics in Search of its Evidential Base. Berlin: de Gruyter, 267–297. NERBONNE, JOHN / WILBERT HEERINGA (2010): Measuring Dialect Differences. In: SCHMIDT, JÜRGEN ERICH / PETER AUER (Hg.): Language and Space Volume 1: Theories and Methods. Berlin: de Gruyter, 550–567. NERBONNE, JOHN / PETER KLEIWEG (2003): Lexical Distance in LAMSAS. In: Computers and the Humanities 37/3, 339–357. NERBONNE, JOHN / PETER KLEIWEG / WILBERT HEERINGA / FRANZ MANNI (2008): Projecting Dialect Distances to Geography: Bootstrap Clustering vs. Noisy Clustering. In: PREISACH, CHRISTINE / HANS BURKHARDT / LARS SCHMIDT-THIEME / REINHOLD DECKER (Hg.): Data Analysis, Machine Learning and Applications. Proceedings of the 31st Annual Conference of the Gesellschaft für Klassifikation e.V., Albert-Ludwigs-Universität Freiburg, March 7–9, 2007. Berlin/Heidelberg: Springer, 647–654. NERBONNE, JOHN / WILLIAM A. KRETZSCHMAR (2003): Introducing computational methods in dialectometry. In: Computers and the Humanities, 37/3, 245–255. NERBONNE, JOHN / WILLIAM A. KRETZSCHMAR (2013): Dialectometry++. In: Literary and Linguistic Computing 28/1, 2–12. NORRIS, DENNIS (2005): How do computational models help us develop better theories? In: CUTLER, ANNE (Hg.): Twenty-first century psycholinguistics. Four cornerstones. Mahwah: Erlbaum, 331–346.
Literaturverzeichnis
185
NÜBLING, EDUARD (1991): Der Lechrain als sprachliche Saumlandschaft zwischen den süddeutschen Großmundarten Bairisch und Schwäbisch-Alemannisch. In: FRIED, PANKRAZ (Hg.): Forschungen zur schwäbischen Geschichte. Mit Berichten aus der landesgeschichtlichen Forschung in Augsburg. Sigmaringen: Thorbecke, 235–315. OUDEYER, PIERRE-YVES (2006): Self-Organization in the Evolution of Speech. Oxford/New York: Oxford University Press. PAUL, HERMANN ([1920] 1995): Prinzipien der Sprachgeschichte. 10., unveränderte Auflage. Tübingen: Niemeyer. PEREA, MARIA-PILAR / HIROTO UEDA (2010): Applying Quantitative Analysis Techniques to La flexió verbal en els dialectes catalans. In: Dialectologia et Geolinguistica 18, 99–114. PICKL, SIMON (2013a): Probabilistische Geolinguistik. Geostatistische Analysen lexikalischer Distribution in Bayerisch-Schwaben. Stuttgart: Steiner. PICKL, SIMON (2013b): Lexical Meaning and Spatial Distribution. Evidence from Geostatistical Dialectometry. In: Literary and Linguistic Computing 28/1, 63–81. PICKL, SIMON (2013c): Verdichtungen im sprachgeografischen Kontinuum. In: Zeitshrift für Dialektologie und Linguistik 80/1, 1–35. PICKL, SIMON / JONAS RUMPF (2011): Automatische Strukturanalyse von Sprachkarten. Ein neues statistisches Verfahren. In: GLASER, ELVIRA / JÜRGEN ERICH SCHMIDT / NATASCHA FREY (Hg.): Dynamik des Dialekts – Wandel und Variation. Akten des 3. Kongresses der Internationalen Gesellschaft für Dialektologie des Deutschen (IGDD). Stuttgart: Steiner, 267–286. PICKL, SIMON / JONAS RUMPF (2012): Dialectometric Concepts of Space: Towards a Variant-Based Dialectometry. In: HANSEN, SANDRA / CHRISTIAN SCHWARZ / PHILIPP STOECKLE / TOBIAS STRECK (Hg.): Dialectological and folk dialectological concepts of space. Berlin: de Gruyter, 199–214. PICKL, SIMON / AARON SPETTL / SIMON PRÖLL / STEPHAN ELSPAß / WERNER KÖNIG / VOLKER SCHMIDT (2014): Linguistic distances in dialectometric intensity estimation. In: Journal of Linguistic Geography 2/1, 25–40. POSPESCHILL, MARKUS (2006): Statistische Methoden. Strukturen, Grundlagen, Anwendungen in Psychologie und Sozialwissenschaften. München: Elsevier. PROKIĆ, JELENA (2010): Families and Resemblances. Dissertation, Rijksuniversiteit Groningen. PROKIĆ, JELENA / JOHN NERBONNE (2008): Recognising groups among dialects. In: International Journal of Humanities and Arts Computing 2/1–2, 153–172. PRÖLL, SIMON (2011): Wahrnehmungspsychologische Aspekte der Sprachkartografie. In: Zeitschrift für Dialektologie und Linguistik 78/1, 39–60. PRÖLL, SIMON (2013): Detecting Structures in Linguistic Maps – Fuzzy Clustering for Pattern Recognition in Geostatistical Dialectometry. In: Literary and Linguistic Computing 28/1, 108–118. PRÖLL, SIMON (2014): Stochastisch gestützte Methoden der Dialektdifferenzierung. In: HUCK, DOMINIQUE (Hg.): Alemannische Dialektologie: Dialekte im Kontakt. Beiträge zur 17. Arbeitstagung zur alemannischen Dialektologie in Straßburg vom 26.–28.10.2011. Stuttgart: Steiner, 233–246. PRÖLL, SIMON / SIMON PICKL / AARON SPETTL (2015): Latente Strukturen in geolinguistischen Korpora. In: ELMENTALER, MICHAEL / MARKUS HUNDT / JÜRGEN ERICH SCHMIDT (Hg.): Deutsche Dialekte. Konzepte, Probleme, Handlungsfelder. Akten des 4. Kongresses der Internationalen Gesellschaft für Dialektologie des Deutschen (IGDD). Stuttgart: Steiner, 247–258. PURSCHKE, CHRISTOPH (2011): Regionalsprache und Hörerurteil. Grundzüge einer perzeptiven Variationslinguistik. Stuttgart: Steiner. RAND, WILLIAM M. (1971): Objective Criteria for the Evaluation of Clustering Methods. In: Journal of the American Statistical Association 66/336, 846–850. R Core Team (2014): R: A Language and Environment for Statistical Computing. Wien: R Foundation for Statistical Computing. Online: http://www.R-project.org [Stand: 14.11.2014] REICHEL, SIBYLLE (2003): Richtungs- und Lageadverbien im Untersuchungsgebiet des Bayerischen Sprachatlas. Regensburg: Edition Vulpes. RICHTER, KLAUS / JAN-MICHAEL ROST (2004): Komplexe Systeme. 2. Auflage. Frankfurt am Main: Fischer Taschenbuch.
186
Literaturverzeichnis
ROTHER, MARLIES (2010): Regionalsprachgeschichte von Bayerisch-Schwaben auf neuer Basis: die diatopisch orientierte Rekonstruktion. In: CHRISTEN, HELEN / SIBYLLE GERMANN / WALTER HAAS / NADIA MONTEFIORI / HANS RUEF (Hg.): Alemannische Dialektologie: Wege in die Zukunft. Beiträge zur 16. Arbeitstagung für alemannische Dialektologie in Freiburg / Fribourg vom 07.–10.09.2008. Stuttgart: Steiner, 305–314. RUMPF, JONAS (2010): Statistical Models for Geographically Referenced Data. Applications in Tropical Cyclone Modelling and Dialectology. Dissertation, Universität Ulm. RUMPF, JONAS / SIMON PICKL / STEPHAN ELSPAß / WERNER KÖNIG / VOLKER SCHMIDT (2009): Structural analysis of dialect maps using methods from spatial statistics. In: Zeitschrift für Dialektologie und Linguistik 76/3, 280–308. RUMPF, JONAS / SIMON PICKL / STEPHAN ELSPAß / WERNER KÖNIG / VOLKER SCHMIDT (2010): Quantification and Statistical Analysis of Structural Similarities in Dialectological Area-Class Maps. In: Dialectologia et Geolinguistica 18, 73–100. RUOFF, ARNO (1980): Probleme der Sprachgrenzen und -übergänge. In: KÖNIG, WERNER / HUGO STOPP (Hg.): Historische, geographische und soziale Übergänge im alemannischen Sprachraum. München: Vögel, 93–109. ROSCH, ELEANOR (1973): Natural Categories. In: Cognitive Psychology 4/3, 328–350. ROSCH, ELEANOR / CAROLYN MERVIS (1975): Family Resemblances: Studies in the Internal Structure of Categories. In: Cognitive Psychology 7/4, 573–605. ROUSSEEUW, PETER (1987): Silhouettes: A graphical aid to the interpretation and validation of cluster analysis. In: Journal of Computational and Applied Mathematics 20, 53–65. SAEED, JOHN I. (2003): Semantics. Second Edition. Oxford: Blackwell. SARKAR, DEEPAYAN (2008): Lattice. Multivariate Data Visualization with R. New York: Springer. SBS = KÖNIG, WERNER (Hg.) (1996–2009): Sprachatlas von Bayerisch-Schwaben. Band 1–14. Heidelberg: Winter. Einzelbände: SBS 1 = KÖNIG, WERNER (1997): Einführung. SBS 2 = FEIK, CHRISTINE (1996): Wortgeographie I: Der menschliche Körper / Körperliche und seelische Äußerungen / Die menschliche Gemeinschaft / Kleidung. SBS 3 = RENN, MANFRED (1997): Lautgeographie I: Vokalquantitäten. SBS 4 = HEIDENREICH, HEIKE (1999): Lautgeographie II: Kurzvokale. SBS 5 = KUFFER, SUSANNE (1998): Lautgeographie III: Langvokale / Diphthonge. SBS 6 = FUNK, EDITH (1998): Formengeographie I: Verbum. SBS 7.1 = IHLE, SABINE (2001): Lautgeographie IV: Konsonantismus I. Plosive. SBS 7.2 = IHLE, SABINE / MICHAEL KÖCK / ANDREA ZEISBERGER / SABINE PFRENGER (2003): Lautgeographie IV: Konsonantismus II. Frikative, Affrikaten, Liquide, Nasale. SBS 8 = RENN, MANFRED (2000): Wortgeographie II: Bauernhaus / Wohnung und Einrichtungsgegenstände / Wettererscheinungen / Freie Tiere / Pflanzen, Obst und Gemüse / Mosterei / Blumen. SBS 9.1 = ZEISBERGER, ANDREA (2003): Formengeographie II: Nomen I. Substantive / Artikel. SBS 9.2 = ZEISBERGER, ANDREA / EDITH FUNK (2003): Formengeographie II: Nomen II. Pronomen / Adjektive / Zahlwörter / Orts- und Richtungsadverbien / Syntax. SBS 10 = FUNK, EDITH (2005): Wortgeographie III: Zeiteinteilung und Grußformeln / Spielen und Spielzeug / Ernährung, Kochen und Backen / Hausarbeit / Bauern und Arbeitskräfte / Adverbien. SBS 11 = LÖBER, LARS (2001): Wortgeographie IV: Rindvieh und Milchverarbeitung / Schwein, Ziege, Schaf, Pferd / Geflügelhaltung und Imkerei / Weitere Haustiere. SBS 12 = RENN, MANFRED (2006): Wortgeographie V: Gelände, Boden, Ackerbau / Getreide / Düngung und Heuernte / Hanf und Flachs. SBS 13 = HIRT, ANDREA (2005): Wortgeographie VI: Wald, Holz und Zäune / Transport / Körbe und Gefäße. SBS 14 = FUNK, EDITH / ADRIAN SCHÜLLER / KARIN BERNBACHER / ANDREAS WICK / ELISABETH BEDUCKER (2009): Register.
Literaturverzeichnis
187
SBSSYM = HAHN, MARION / SUSANNE KUFFER / MICHAEL SCHMOLL / JOACHIM ZIENTEK (1995): Sprachatlas von Bayerisch-Schwaben. Symbolheft. Auf der Basis des Symbolbüchleins für den Wortatlas der kontinentalgermanischen Winzerterminologie. Manuskript, Universität Augsburg. SCHLEICHER, AUGUST (1873): Die Darwinsche Theorie und die Sprachwissenschaft. 2. Auflage. Weimar: H. Böhlau. SCHMIDT, JÜRGEN ERICH / JOACHIM HERRGEN (2011): Sprachdynamik. Berlin: Erich Schmidt. SCHMIDT, WILHELM (2004): Geschichte der deutschen Sprache. 9. Auflage. Stuttgart: S. Hirzel Verlag. SCHWERDT, JUDITH (2000): Die 2. Lautverschiebung. Wege zu ihrer Erforschung. Heidelberg: Winter. SEDLMEIER, PETER / FRANK RENKEWITZ (2008): Forschungsmethoden und Statistik in der Psychologie. München/Boston [u. a.]: Pearson Studium. SÉGUY, JEAN (1971): La relation entre la distance spatiale et la distance lexicale. In: Revue de linguistique romane 35, 335–357. SÉGUY, JEAN (1973): La dialectométrie dans l’Atlas linguistique et ethnographique de la Gascogne. In: Revue de linguistique romane 37, 1–24. SHANNON, CLAUDE E. (1949): Communication in the presence of noise. In: Proceedings of the Institute of Radio Engineers 37/1, 10–21. SHANNON, CLAUDE E. / WARREN WEAVER ([1949] 1998): The mathematical theory of communication. Urbana, Chicago: University of Illinois Press. SILVER, NATE (2012): The Signal and the Noise. Why So Many Predictions Fail – but Some Don’t. New York: Penguin. SIMMLER, FRANZ (1983): Konsonantenschwächung in den deutschen Dialekten. In: BESCH, WERNER / ULRICH KNOOP / WOLFGANG PUTSCHKE / HERBERT ERNST WIEGAND (Hg.): Dialektologie. Ein Handbuch zur deutschen und allgemeinen Dialektforschung. Band 1.2. Berlin/New York: de Gruyter, 1121–1129. SMF = MUNSKE, HORST HAIDER / ALFRED KLEPSCH (Hg.) (2003–2007): Sprachatlas von Mittelfranken. Bände 1–7. Winter: Heidelberg. SOB = EICHINGER, LUDWIG M. (Hg.) (2008–2010): Sprachatlas von Oberbayern. Bände 2–6. Winter: Heidelberg. SPRUIT, MARCO RENÉ / WILBERT HEERINGA / JOHN NERBONNE (2009): Associations among linguistic levels. In: Lingua 119/11, 1624–1642. STANFORD, JAMES N. (2012): One size fits all? Dialectometry in a small clan-based indigenous society. In: Language Variation and Change 24/2, 247–278. SZMRECSANYI, BENEDIKT (2008): Corpus-based Dialectometry: Aggregate Morphosyntactic Variability in British English Dialects. In: International Journal of Humanities and Arts Computing 2/1–2, 279–296. SZMRECSANYI, BENEDIKT (2011): Corpus-based dialectometry: a methodological sketch. In: Corpora 6/1, 45–76. TABACHNICK, BARBARA G. / LINDA S. FIDELL (2007): Using Multivariate Statistics. Boston [u. a.]: Pearson. TAYLOR, JOHN R. (2003): Linguistic Categorization. Third Edition. Oxford/New York: Oxford University Press. TEETOR, PAUL (2011): R Cookbook. Beijing/Cambridge [u. a.]: OʼReilly. TEUCHERT, HERMANN (1924): Lautschrift des Teuthonista. In: Teuthonista 1, 5. TULLER, BETTY / J. A. SCOTT KELSO (1993): Dynamical Systems and Speech. In: BLANKEN, GERHARD / JÜRGEN DITTMANN / HANNELORE GRIMM / JOHN C. MARSHALL / CLAUS-W. WALLESCH (Hg.): Linguistic Disorders and Pathologies. Berlin/New York: de Gruyter, 416–425. VALTS = GABRIEL, EUGEN (Hg.) (1985–2001): Vorarlberger Sprachatlas mit Einschluß des Fürstentums Liechtenstein, Westtirols und des Allgäus. Bregenz: Vorarlberger Landesbibliothek. VOGELBACHER, JULIUS (2011): Statistische Analyse von Wortvarianten des Sprachatlas von BayerischSchwaben. Diplomarbeit, Universität Ulm. WATTEL, EVERT / PIETER VAN REENEN (1995): Visualisation of extrapolated social-geographical data. In: BOONSTRA, ONNO / GEURT COLLENTIER / BART VAN GELDEREN (Hg.): Structures and Contin-
188
Literaturverzeichnis
gencies in Computerized Historical Research. Proceedings of the IX International Conference of the Association for History and Computing. Hilversum: Verloren, 253–262. WATTEL, EVERT / PIETER VAN REENEN (2010): Probabilistic maps. In: LAMELI, ALFRED / ROLAND KEHREIN / STEFAN RABANUS (Hg.): Language and Space Volume 2: Language Mapping. Berlin/ New York: de Gruyter, 495–505. WEINREICH, URIEL / WILLIAM LABOV / MARVIN I. HERZOG (1968): Empirical Foundations for a Theory of Language Change. In: LEHMANN, WINFRIED P. / YAKOV MALKIEL (Hg.): Directions for Historical Linguistics. A Symposium. Austin: University of Texas Press, 95–195. WEITHMANN, MICHAEL W. (2007): Kleine Geschichte Oberbayerns. Regensburg: Pustet. WERLEN, ERIKA (1984): Studien zur Datenerhebung in der Dialektologie. Stuttgart: Steiner. WICKHAM, HADLEY (2009): ggplot2. Elegant Graphics for Data Analysis. New York: Springer. WIELING, MARTIJN (2012): A Quantitative Approach to Social and Geographical Dialect Variation. Dissertation, Rijksuniversiteit Groningen. WIESINGER, PETER (1982): Die Reihenschrittheorie: Muster eines dialektologischen Beitrags zur Erklärung des Lautwandels. In: BESCH, WERNER / ULRICH KNOOP / WOLFGANG PUTSCHKE / HERBERT ERNST WIEGAND (Hg.): Dialektologie. Ein Handbuch zur deutschen und allgemeinen Dialektforschung. Band 1.1. Berlin/New York: de Gruyter, 144–151. WIESINGER, PETER (1983a): Die Einteilung der deutschen Dialekte. In: BESCH, WERNER / ULRICH KNOOP / WOLFGANG PUTSCHKE / HERBERT ERNST WIEGAND (Hg.): Dialektologie. Ein Handbuch zur deutschen und allgemeinen Dialektforschung. Band 1.2. Berlin/New York: de Gruyter, 807–900. WIESINGER, PETER (1983b): Phonologische Vokalsysteme deutscher Dialekte. Ein synchronischer und diachronischer Überblick. In: BESCH, WERNER / ULRICH KNOOP / WOLFGANG PUTSCHKE / HERBERT ERNST WIEGAND (Hg.): Dialektologie. Ein Handbuch zur deutschen und allgemeinen Dialektforschung. Band 1.2. Berlin/New York: de Gruyter, 1042–1076. WIESINGER, PETER (2011): Bairisch w – b – p. Strukturelle Klärung eines alten Streitfalles. In: Zeitschrift für Dialektologie und Linguistik 78/2, 188–226. WILDGEN, WOLFGANG / PETER JÖRG PLATH (2005): Katastrophen- und Chaostheorie in der linguistischen Modellbildung. In: KÖHLER, REINHARD / GABRIEL ALTMANN / RAJMUND G. PIOTROWSKI (Hg.): Quantitative Linguistik. Ein internationales Handbuch. Berlin/New York: de Gruyter, 688–705. WÖLZMÜLLER, MARTIN (1987): Der Lechrainer und seine Sprache. Landschaft, Brauchtum, Mundart. Landsberg am Lech: Landsberger Verlagsanstalt Martin Neumeyer. WOTTAWA, HEINRICH (1996): Multivariate Verfahren der Eigenschaftsanalyse. In: PAWLIK, KURT (Hg.): Grundlagen und Methoden der Differentiellen Psychologie. Göttingen/Bern/Toronto/ Seattle: Hogrefe, 807–831. ZADEH, LOTFI ASKER (1965): Fuzzy Sets. In: Information and Control 8, 338–353.
ANHANG 1: GRUNDKARTE UND ORTSLISTE DES SBS
190
Anhang 1: Grundkarte und Ortsliste des SBS
Anhang 1: Grundkarte und Ortsliste des SBS 1 Schopflohe 2 Dornstadt 3 Westheim 4 Hechlingen 5 Markt Berolzheim 6 Dettenheim 7 Raitenbuch 8 Marktoffingen 9 Belzheim 10 Oettingen i. Bay. 11 Megesheim 12 Döckingen 13 Möhren 14 Dietfurt 15 Bieswang 16 Wallerstein 17 Nördlingen 18 Pfäfflingen 19 Rudelstetten 20 Wemding 21 Weilheim 22 Langenaltheim 23 Mörnsheim 24 Obereichstätt 25 Hürnheim 26 Kleinsorheim 27 Heroldingen 28 Fünfstetten 29 Itzing 30 Monheim 31 Daiting 32 Tagmersheim 33 Wellheim 34 Biesenhard 35 Forheim 36 Mönchsdeggingen 37 Ebermergen 38 Kaisheim 39 Altisheim 40 Marxheim 41 Rennertshofen 42 Bittenbrunn 43 Staufen 44 Ziertheim 45 Demmingen 46 Unterliezheim 47 Bissingen 48 Tapfheim 49 Donauwörth 50 Mertingen 51 Eggelstetten 52 Genderkingen 53 Rain (Lech) 54 Burgheim 55 Ergertshausen 56 Altenberg 57 Bachhagel 58 Unterbechingen 59 Bergheim 60 Höchstädt 61 Gremheim 62 Lauterbach 63 Ehingen 64 Ellgau 65 Münster 66 Wallerdorf 67 Ehekirchen 68 Klingsmoos
69 Gundelfingen 70 Dillingen a. d. Donau 71 Kicklingen 72 Wertingen 73 Langenreichen 74 Meitingen 75 Thierhaupten 76 Baar (Schwaben) 77 Pöttmes 78 Grimolzhausen 79 Riedhausen 80 Offingen 81 Glött 82 Villenbach 83 Emersacker 84 Laugna 85 Affaltern 86 Biberbach 87 Langweid 88 Todtenweis 89 Petersdorf 90 Inchenhofen 91 Pfuhl 92 Oberelchingen 93 Steinheim 94 Echlishausen 95 Leipheim 96 Günzburg 97 Deffingen 98 Knöringen 99 Röfingen 100 Wörleschwang 101 Bonstetten 102 Rettenbergen 103 Gablingen 104 Gersthofen 105 Mühlhausen 106 Griesbeckerzell 107 Aichach 108 Schiltberg 109 Neu-Ulm 110 Reutti 111 Beuren 112 Rieden an der Kötz 113 Ichenhausen 114 Ettenbeuren 115 Burtenbach 116 Freihalden 117 Steinekirch 118 Agawang 119 Biburg 120 Ottmarshausen 121 Stadtbergen 122 Augsburg 123 Lechhausen 124 Wulfertshausen 125 Harthausen 126 Tödtenried 127 Wullenstetten 128 Illerberg 129 Oberreichenbach 130 Roggenburg 131 Stoffenried 132 Edelstetten 133 Ziemetshausen 134 Oberschöneberg 135 Ustersbach 136 Döpshofen
137 Anhausen 138 Inningen 139 Haunstetten 140 Kissing 141 Ottmaring 142 Eismannsberg 143 Eurasburg 144 Pfaffenhofen 145 Illertissen 146 Obenhausen 147 Breitenthal 148 Krumbach 149 Niederraunau 150 Balzhausen 151 Langenneufnach 152 Mickhausen 153 Grossaitingen 154 Bobingen 155 Oberottmarshausen 156 Königsbrunn 157 Merching 158 Mering 159 Althegnenberg 160 Oberschweinbach 161 Altenstadt (Iller) 162 Oberroth 163 Olgishofen 164 Aletshausen 165 Kirchheim 166 Mittelneufnach 167 Schwabegg 168 Schwabmünchen 169 Graben 170 Scheuring 171 Prittriching 172 Dünzelbach 173 Jesenwang 174 Mammendorf 175 Landsberied 176 Kellmünz 177 Winterrieden 178 Dietershofen 179 Breitenbrunn 180 Salgen 181 Markt Wald 182 Ettringen 183 Schwabmühlhausen 184 Obermeitingen 185 Kaufering 186 Beuerbach 187 Schwabhausen 188 Türkenfeld 189 Grafrath 190 Heimertingen 191 Niederrieden 192 Lauben 193 Daxberg 194 Kammlach 195 Mindelheim 196 Rammingen 197 Türkheim 198 Holzhausen 199 Landsberg am Lech 200 Schwifting 201 Schöffelding 202 Oberschondorf 203 Inning 204 Buxheim
191 205 Memmingen 206 Memmingerberg 207 Westerheim 208 Mussenhausen 209 Dirlewang 210 Bad Wörishofen 211 Weicht 212 Waal 213 Ellighofen 214 Lengenfeld 215 Entraching 216 Dettenhofen 217 Herrsching 218 Kronburg 219 Dickenreishausen 220 Woringen 221 Lachen 222 Ottobeuren 223 Markt Rettenbach 224 Eggenthal 225 Pforzen 226 Westendorf 227 Lengenfeld 228 Asch 229 Denklingen 230 Ludenhausen 231 Dießen (Ammersee) 232 Pähl 233 Legau 234 Grönenbach 235 Böhen 236 Ronsberg 237 Obergünzburg 238 Ebersbach 239 Oberbeuren 240 Kaufbeuren 241 Frankenried 242 Osterzell 243 Hohenfurch 244 Birkland 245 Wessobrunn 246 Muthmannshofen 247 Altusried 248 Dietmannsried 249 Untrasried 250 Kraftisried 251 Ruderatshofen 252 Marktoberdorf 253 Bertoldshofen 254 Ingenried 255 Altenstadt 256 Peiting 257 Hohenpeissenberg 258 Peissenberg 259 Weilheim i. Oberbayern 260 Kreuzthal 261 Wiggensbach 262 Kempten 263 Betzigau 264 Wildpoldsried 265 Oberthingau 266 Leuterschach 267 Stötten am Auerberg 268 Bernbeuren 269 Steingaden 270 Rottenbuch 271 Schöffau 272 Huglfing
ANHANG 2: FARBABBILDUNGEN
Abb. 13 (Farbe): Einzelvarianten- und Flächenkarte zu Datensatz 6181, hast (L3, geo, Gauß, LCV) (zu Seite 55).
194
Punktsymbolkarte 2121, Witwer, SBS Band 2, S. 523.
Anhang 2: Farbabbildungen
Entsprechende Flächenkarte mit Voronoi-Mosaiken.
Entsprechende Prävalenzkarte, interpoliert
Abb. 14 (Farbe): Drei Visualisierungen eines Datensatzes (zu Seite 58).
Abb. 15 (Farbe): Kennwerte dreier Beispielkarten (alle Karten L3, geo, Gauß, LSCV) (zu Seite 61).
Anhang 2: Farbabbildungen
Abb. 31 (Farbe): Wahrscheinlichkeiten der Clusterzuweisung in der Lexik (zu Seite 90)
195
196
Anhang 2: Farbabbildungen
Abb. 32 (Farbe): Dominante Faktoren der Lexik (zu Seite 92).
Anhang 2: Farbabbildungen
Abb. 39 (Farbe): Kennwerte der Vokalkarten des SBS, in den RGB-Raum projiziert (links Kurzvokale, rechts Langvokale und Diphthonge) (zu Seite 101).
Abb. 42 (Farbe): Wahrscheinlichkeiten der Clusterzuweisung in der Lautung (zu Seite 104).
197
198
Anhang 2: Farbabbildungen
Abb. 44 (Farbe): Wahrscheinlichkeiten der Clusterzuweisung der Vokalklassen (zu Seite 106).
Anhang 2: Farbabbildungen
Abb. 45 (Farbe): Dominante Faktoren im Vokalismus (zu Seite 107).
199
200
Anhang 2: Farbabbildungen
Abb. 46 (Farbe): Dominante Faktoren des Konsonantismus (zu Seite 109).
Anhang 2: Farbabbildungen
Abb. 47 (Farbe): Dominante Faktoren der gesamten Lautung (zu Seite 111).
201
202
Anhang 2: Farbabbildungen
Abb. 56: Wahrscheinlichkeiten der Clusterzuweisung der Formen (zu Seite 123).
Anhang 2: Farbabbildungen
Abb. 57 (Farbe): Dominante Faktoren der Verbalmorphologie (zu Seite 125).
203
204
Anhang 2: Farbabbildungen
Abb. 58 (Farbe): Dominante Faktoren der Nominalmorphologie (zu Seite 126).
Anhang 2: Farbabbildungen
Abb. 59 (Farbe): Dominante Faktoren der Syntax (zu Seite 127).
205
206
Anhang 2: Farbabbildungen
Abb. 60 (Farbe): Dominante Faktoren in Verbal-, Nominal- und Syntaxdaten (zu Seite 128).
Anhang 2: Farbabbildungen
207
Abb. 68 (Farbe): Wahrscheinlichkeiten der Clusterzuweisung im Gesamtkorpus (zu Seite 140).
208
Anhang 2: Farbabbildungen
Abb. 71 (Farbe):Gesamtsystem (absolute Zahlen) des SBS (zu Seite 144).
Anhang 2: Farbabbildungen
Abb. 74 (Farbe): Overlay von zehn randomisierten Karten, je mit 100 Lexik-, Lautungs- und Formenkarten (zu Seite 148).
209
210
Anhang 2: Farbabbildungen
Abb. 76 (Farbe): Faktorenprofile von Ziertheim (44) bis Heimertingen (190), kontinuierlicher Übergang vom Nordostschwäbischen über das Mittelostschwäbische zum Allgäuerischen hin (zu Seite 151).
Abb. 77 (Farbe): Faktorenprofile von Gundelfingen (69) nach Tödtenried (126), Übergang Nordostschwäbisch / Westliche Wälder, abrupter Umschlag ins Bairische (zu Seite 151).
Anhang 2: Farbabbildungen
Abb. 78 (Farbe): Faktorenanalyse der 22 stärksten Karten (zu Seite 155).
211
REGISTER
A Adjektive .................................................122 Aggregation ........................... 16, 29, 46, 171 AIS...........................................................141 Allgäu ................ 95, 110, 113, 124, 128, 162 Alphafehlerkumulierung ....................87, 166 ANAE ........................................................35 ANOVA........................... → Varianzanalyse Area-class-Karte ........................................54 Artikulation................................................24 Augsburg .........................................108, 110 Autokorrelation..................................97, 110 B B (Kenngröße) ..................... → Homogenität Bandbreite............................................52, 62 besondere Verben ....................................120 binnenhd. Konsonantenschwächung.......109, 113, 158 Binomialtest ...............................................86 Bonferroni-Korrektur.........................87, 104 Bootstrapping ..................................148, 170 Bulgarisch ................................................141 C
Dialektkontinuum ..............28, 146, 150, 162 Dialektometrie .......................................... 16 Ähnlichkeitsmatrix ............................... 16 Distanzmatrix ................................. 16, 49 relativer Identitätswert ......................... 16 Donau ............................................... 95, 158 E Eigenwert .................................................. 81 Einwohnerzahl ................................ 147, 175 Ellenbogenkriterium ................ → Scree-Test Emergenz ............................................ 22, 24 Entropie .......................................... 165, 173 Ethnologie......................................... 31, 171 euklidische Distanz ............................. 49, 56 Evolutionärer Sprachwandel ............... 20, 69 Explorator ......................................... 92, 176 Exploratorengrenze ..............97, 113, 131, 147, 160, 176 F Faktorenanalyse ................................ 79, 176 fehlende Belege ......... 55, 126, 131, 168, 174 Fisher-Yates-Test.................................... 154 Flüsse ................................................ 93, 158 Fragebuch ................................................. 85 Fuzzy C-Means ............................. 69, 71, 77
C (Kenngröße) ...................... → Komplexität Chaos .......................................................173 CL ..............................................................52 Clustern ...............................................28, 65 Evaluation .............................................77 Grundprinzipien ..............................16, 65 Typen von Algorithmen ..................66, 69 Clusterzentrum ....................................69, 78
G
D
Holzwinkel...................................... 114, 160 Homogenität ............................................. 60
Deixis...............................................127, 131 Dendrogramm ......................................68, 90
Gebrauchsfrequenz ................................. 119 H
214
Register
I
M
Idiolekt.......................................................19 Infinitiv ....................................................121 Informationstheorie ................... 23, 165, 173 Innovation ..........................................26, 158 Interpolation .......................... 45, 49, 55, 168 Isoglosse ...................... 14, 34, 108, 154, 162 iterativer Prozess ...........................22, 23, 69
Marktort ............................................ 96, 114 Mehrfachbelege ...................18, 35, 138, 171 Mittelhochdeutsch................................... 100 multidimensionale Skalierung .................. 74 multiples Testen .→ Alphafehlerkumulierung Mustererkennung .................................... 157
J Junggrammatiker .......................................13 K Kaiser-Guttman-Kriterium ............81, 91, 98 Kolmogorov-Smirnov-Test ..... 100, 117, 136 Kommunikationsmaximen.........................21 Kommunikationsmodell ............................23 Kompaktheit ..............................................60 komplexes System .............................22, 165 Komplexität ...............................................60 Konfession .......................................114, 131 Königsbrunn .............................. 95, 108, 158 Konjunktiv .........................................78, 121 Korpus .................................................32, 37 corpus-driven ........................................80 Korrelation ........................... 63, 80, 133, 172 negative .........................................93, 153 Kovarianz ......................................63, 71, 79 Kruskal-Wallis-Test.........................120, 137
N naturräumliche Grenze............................ 158 Niederländisch ........................................ 141 Norwegisch ............................................. 141 O Optimalität .............................................. 164 Organismusmetapher ................................ 20 Ortsdialekt .............................................. 150 Ortsgrammatik .......................................... 13 Ortsnamen ............................................... 157 P PCA .......................................................... 79 perzeptive Dialektologie ........................... 13 Population ................................................. 22 Prävalenzkarte .......................................... 57 Propagation ............................................... 26 Prototypentheorie.............67, 77, 78, 91, 163 Psycholinguistik........................................ 23 Punktsymbolkarte ............................... 14, 39
L
R
L (Kenngröße) ..................... → Kompaktheit LAMSAS ...........................................80, 141 Landwirtschaft ...........................................97 LCV ............... → likelihood cross-validation least-squares cross-validation ....................52 Lech ............................. 50, 94, 113, 158, 159 Lechrain ..................... 97, 108, 110, 147, 161 Levenshtein-Distanz ..................................45 likelihood cross-validation ........................52 LSCV ........→ least-squares cross-validation
R (Software) ................................. 62, 68, 74 Randomisierung .............................. 148, 165 Rauschen............................23, 106, 152, 172 Regierungsbezirk .........................41, 92, 147 Reihenschritttheorie .....34, 99, 102, 141, 164 Rekursion ................................. → Rekursion Reliabilität ................................................ 18 Repräsentativität ..........................17, 33, 170 Ries ....................................95, 113, 129, 157 Romanistik ................................................ 18 Romantik ................................................ 163 Rückkopplung ........................................... 25
215
Register S
U
Schiefe .............................................117, 135 Scree-Test ..................................................72 Simulation..........................................25, 164 Skalenniveau.................... 25, 37, 44, 45, 142 falsches .................................................57 SMF ...........................................................41 SOB ...........................................................41 Soziolinguistik ...........................................18 Sprachatlas von Bayerisch-Schwaben .......41 Sprachproduktion ......................................23 Sprachrezeption ...................................23, 72 Sprachverfall..............................................23 Stadt ........................... 97, 108, 114, 152, 160 Stammbaum ...............................................69 Stase...........................................................26 Stauden ............................................ 113, 160 stochastischer Prozess............ 21, 23, 35, 152 Subjektivität .......................................91, 142 Syntax ..............................................116, 127
Unschärfe .................................67, 71, 85, 89
T Teleologie ..................................................23 Territorialideologie ............................28, 163 Theorie der unsichtbaren Hand ..................20 Thiessen-Polygon ..... → Voronoi-Diagramm Transkription, phonetische ..............113, 170
V Validität ........................................ 16, 46, 72 VALTS ............................................. 41, 162 Variantenkarte .......................................... 54 Varianzanalyse........................................ 136 Varianzhomogenität ................................ 136 Voronoi-Diagramm................................... 53 W Wahrnehmungspsychologie ......... 14, 28, 48, 57, 142 Westliche Wälder ...... 95, 129, 146, 149, 160 Wetterforschung ....................................... 23 Wilcoxon-Mann-Whitney-Test ............... 121 Wirtschaft ............................................... 159 Wirtschaftszentrum ................................... 97 Wittelsbacher Land ................................. 108 Wölbung ................................................. 135 Z Zirkularität ...................................28, 47, 161 zufälliger Punktprozess ............................. 40 zweite Lautverschiebung ........................ 141
chumo kiscreib filo chumor kipeit (St. Galler Schreibervers, Codex Sangallensis 623, Seite 209)
z e i t s c h r i f t f ü r d i a l e k t o l o g i e u n d l i ng u i s t i k
–
beihefte
In Verbindung mit Werner König und Dieter Stellmacher herausgegeben von Jürgen Erich Schmidt.
Franz Steiner Verlag
ISSN 0341–0838
149. Christoph Purschke Regionalsprache und Hörerurteil Grundzüge einer perzeptiven Variationslinguistik 2011. 364 S. mit 53 s/w- und 30 Farbabb., 47 Tab., kt. ISBN 978-3-515-09927-1 150. Agnes Kolmer Pronomen und Pronominalklitika im Cimbro Untersuchungen zum grammatischen Wandel einer deutschen Minderheitensprache in romanischer Umgebung 2012. 253 S. mit 20 Tab., kt. ISBN 978-3-515-10151-6 151. John Bellamy Language Attitudes in England and Austria A Sociolinguistic Investigation into Perceptions of High and Low-Prestige Varieties in Manchester and Vienna 2012. 245 S. mit 62 Abb. und 78 Tab., kt. ISBN 978-3-515-10272-8 152. Roland Kehrein Regionalsprachliche Spektren im Raum Zur linguistischen Struktur der Vertikale 2012. 389 S. mit 67 s/w- und 7 Farbabb., 40 Tab., kt. ISBN 978-3-515-10273-5 153. Robert Möller Erscheinungsformen rheinischer Alltagssprache Untersuchungen zu Variation und Kookkurrenzregularitäten im „mittleren Bereich“ zwischen Dialekt und Standardsprache 2013. 372 S. mit 50 Abb., 42 Tab. und 1 Karte, kt. ISBN 978-3-515-10122-6 154. Simon Pickl Probabilistische Geolinguistik Geostatistische Analysen lexikalischer Variation in Bayerisch-Schwaben
155.
156.
157.
158.
159.
2013. 269 S. mit 63 Abb. und 45 Tab., kt. ISBN 978-3-515-10463-0 Dominique Huck (Hg.) Alemannische Dialektologie: Dialekte im Kontakt Beiträge zur 17. Arbeitstagung für alemannische Dialektologie in Straßburg vom 26.–28.10.2011 2014. 300 S. mit 39 s/w- und 4 Farbabb., 29 Tab., 16 Ktn., kt. ISBN 978-3-515-10343-5 Magnus Breder Birkenes Subtraktive Nominalmorphologie in den Dialekten des Deutschen Ein Beitrag zur Interaktion von Phonologie und Morphologie 2014. 256 S. mit 12 Abb. und 52 Tab., kt. ISBN 978-3-515-10785-3 Thomas Krefeld / Elissa Pustka (Hg.) Perzeptive Linguistik: Phonetik, Semantik, Varietäten 2014. 216 S. mit 39 Abb. und 10 Tab., kt. ISBN 978-3-515-10314-5 Michael Elmentaler / Markus Hundt / Jürgen Erich Schmidt (Hg.) Deutsche Dialekte. Konzepte, Probleme, Handlungsfelder Akten des 4. Kongresses der Internationalen Gesellschaft für Dialektologie des Deutschen (IGDD) 2015. 516 S. mit 57 Abb. und 55 Tab., 40 Farbabb. auf 20 Tafeln, kt. ISBN 978-3-515-10984-0 Christian Schwarz Phonologischer Dialektwandel in den alemannischen Basisdialekten Südwestdeutschlands im 20. Jahrhundert Eine empirische Untersuchung zum Vokalismus 2015. 584 S. mit 213 s/w- und 14 Farbabb., 90 Tab., kt. ISBN 978-3-515-10295-7
Variationslinguistik ist – kurz gesagt – die Suche nach Mustern im Chaos, nach Regelmäßigkeiten in sprachlichen Daten. Diese Arbeit zeigt, was eine stochastische Herangehensweise diesbezüglich leisten kann: Sie ermöglicht die Erfassung komplexer räumlicher Eigenschaften in Form von anschaulich interpretierbaren, objektiviert vergleichbaren Werten sowie die Anbindung an etablierte statistische Standardverfahren. In exemplarischer Anwendung auf das Material des Sprachatlas von BayerischSchwaben werden Zusammenhänge und Unterschiede zwischen einzelnen sprachlichen Systemteilen (Wortschatz, Lautung, Formen) in bislang unerreich-
ISBN 978-3-515-11055-6
9 7 83 5 1 5 1 1 0556
ter Transparenz sichtbar. Dabei bestätigt sich die Vermutung, dass das klassische Konzept der „Dialekteinteilung“ zu undifferenziert ist. Die Übertragung von Konzepten der Unschärfe auf Zusammenhänge innerhalb und zwischen Varietäten sowie die Visualisierung latenter Strukturen, die scheinbar homogenen Daten zugrunde liegen, führen vor Augen, wie fragil und komplex in der geografischen Sprachvariation das Zusammenwirken von Regularität und Irregularität sein kann. Die Arbeit wurde mit dem Förderpreis des Bezirks Schwaben 2014 ausgezeichnet.
www.steiner-verlag.de Franz Steiner Verlag