Universale phonologische Strukturen und Prozesse [Reprint 2010 ed.] 9783111678207, 9783484303102

Die Buchreihe Linguistische Arbeiten hat mit über 500 Bänden zur linguistischen Theoriebildung der letzten Jahrzehnte in

193 104 64MB

German Pages 228 [232] Year 1994

Report DMCA / Copyright

DOWNLOAD PDF FILE

Table of contents :
Inhaltsverzeichnis
Vorwort
Universelle Nuklearphonologie mit epiphänomenaler Silbenstruktur
Einige Argumente gegen die Silbe als universale prosodische Hauptkategorie
The Notions ’Inherently Cyclic’ and ’Stress Erasure’
Prosodische und tonale Faktoren bei der Disambiguierung syntaktischer Strukturen
Functional differences between consonants and vowels in German
Psychische Präsenzzeit und Selbstorganisation von Sprache
Perzeption, Produktion und die Lernbarkeit von Sprachen
Hinweise auf ein sprachübergreifendes allgemeines Prinzip bei der Wahrnehmung fremdsprachlicher Vokalkontraste
Phonologische Gesetzmäßigkeiten der Kindersprache aus synchroner und diachroner Sicht
Adressen der Autoren
Recommend Papers

Universale phonologische Strukturen und Prozesse [Reprint 2010 ed.]
 9783111678207, 9783484303102

  • 0 0 0
  • Like this paper and download? You can publish your own PDF file online for free in a few minutes! Sign Up
File loading please wait...
Citation preview

Linguistische Arbeiten

310

Herausgegeben von Hans Altmann, Peter Blumenthal, Herbert E. Brekle, Gerhard Heibig, Hans Jürgen Heringer, Heinz Vater und Richard Wiese

Universale phonologische Strukturen und Prozesse Herausgegeben von Karl Heinz Rainers, Heinz Vater und Henning Wode

Max Niemeyer Verlag Tübingen 1994

Die Deutsche Bibliothek - CIP-Einheitsaufnahme Universale phonologische Strukturen und Prozesse / hrsg. von Karl-Heinz Ramers ... -Tübingen: Niemeyer, 1994 (Linguistische Arbeiten ; 310) NE: Ramers, Karl-Heinz [Hrsg.]; GT ISBN 3-484-30310-7

ISSN 0344-6727

© Max Niemeyer Verlag GmbH & Co. KG, Tübingen 1994 Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Printed in Germany. Druck: Weihert-Druck GmbH, Darmstadt Einband: Hugo Nadele, Nehren

Inhaltsverzeichnis

v

Vorwort

l

Theo Vennemann Universelle Nuklearphonologie mit epiphänomenaler Silbenstruktur

7

Peter Auer Einige Argumente gegen die Silbe als universale prosodische Hauptkategorie

55

Wim Zonneveld The Notions 'Inherently Cyclic' and 'Stress Erasure'

79

Caroline Fery Prosodische und tonale Faktoren bei der Disambiguierung syntaktischer Strukturen

97

Michael Jessen Functional differences between consonants and vowels in German

115

Gertraud Fenk-Oczlon, August Fenk Psychische Präsenzzeit und Selbstorganisation von Sprache

151

Henning Wode Perzeption, Produktion und die Lernbarkeit von Sprachen

169

Ocke-Schwen Bohn Hinweise auf ein sprachübergreifendes allgemeines Prinzip bei der Wahrnehmung fremdsprachlicher Vokalkontraste

189

Ursula Stephany Phonologische Gesetzmäßigkeiten der Kindersprache aus synchroner und diachroner Sicht

205

Adressen der Autoren

223

Vorwort Karl Heinz Ramers, Heinz Vater, Henning Wode

Dieser Sammelband enthält überarbeitete Fassungen von Vorträgen, die im Februar 1992 in der AG "Universale phonologische Strukturen und Prozesse" auf der 14. Jahrestagung der Deutschen Gesellschaft für Sprachwissenschaft in Bremen gehalten wurden *. Die AG hatte es sich zum Ziel gesetzt, Beschränkungen für segmentale und suprasegmentale phonologische Strukturen in verschiedenen Sprachen zu analysieren und ihre Universalität zu erforschen. Darüber hinaus sollte ermittelt werden, welchen sprachübergreifenden Entwicklungslinien der Aufbau des phonologischen Systems beim Erst- und Zweitspracherwerb folgt, und welchen universalen Beschränkungen Sprachproduktion und -perzeption unterliegen. Die Phonologic hat in den letzten anderthalb Jahrzehnten eine intensive Entwicklung durchgemacht. Die Einsicht, daß das "SPE"-Modell von Chomsky/Halle 1968 The Sound Pattern of English nicht ausreicht zur Erklärung prosodischer - und auch vieler segmentaler - Phänomene 1, führte zur Herausbildung der sogenannten Nichtlinearen Phänologie. Sie begnügt sich nicht mit der Segmentierung einer linearen Kette, sondern nimmt eine hierarchische Anordnung an, wie sie bereits aus der Konstituentenanalyse der Syntax bekannt ist. So nehmen die meisten Silbenphonologen heute an, daß die Silbe in die Konstituenten Onset und Reim gegliedert ist, wobei der Reim sich in Nukleus und Koda untergliedert2. Die Nichtlineare Phonologic hat zwei verschiedene Richtungen hervorgebracht: Charakteristisch für die Autosegmentale Phonologic (vgl. Wiese 1986 und 1988) ist, daß die phonologische Analyse nicht mehr einsträngig betrieben wird, sondern auf verschiedene "tiers" (Schichten) verteilt wird. Eine solche vielschichtige Darstellung ähnelt einer Partitur. Besonders wichtig sind in der Autosegmentalen Phonologic die Skelett-Schicht, die phonotaktische Regularitäten ausdrückt, und die Segment-Schicht 3, die die einzelnen Segmente mit ihren Merkmalen enthält. Da keine l:l-Entsprechung vorliegt, können zwei Einheiten der Segment-Schicht mit einer Einheit der Skelett-Schicht verbunden sein, wie z.B. bei den deutschen Affrikaten /ts/ und /pf/. Umgekehrt kann Wir danken allen Referenten und Teilnehmern der AG für ihre wertvollen Beiträge und Anregungen sowie Martin Neef für seine hervorragende Formatierungsarbeit. l Im SPE-Modell stehen phonologische Regeln im Mittelpunkt, die zugrundeliegende Segmente umordnen, tilgen oder einfügen. Prosodische Phänomene haben aber nicht einzelne Segmente, sondern größere Einheiten als Domäne und können auch in Mehrfachmarkierung längerer Sequenzen bestehen, so bei der ungarischen Vokalharmonie (vgl. Van der Hülst/Smith 1982:20). ^ Diese bereits von Pike/Pike 1947 beschriebene Strukturierung wurde in den achtziger Jahren wieder aufgenommen, z.B. von Selkirk 1982. 3 Die Segment-Schicht nennt Goldsmith (1990:50) "phonemic tier".

eine Einheit der Segment-Schicht mit zwei Einheiten der Skelett-Schicht assoziiert sein, z.B. bei langen Vokalen. Die metrische Phonologic - die z. B. Giegerich 1985 seinen Untersuchungen zugrundelegt - ist durch die Verwendung abstrakter Einheiten gekennzeichnet, die relativ zueinander definiert sind: "s" bezeichnet das in einer Sequenz stärkere Element, "w" das schwächere. Oberhalb der Silbe werden "s/w" als "stärkere/schwächere relative Prominenz", unterhalb der Silbe als "einen höheren/schwächeren Sonoritätsgrad besitzend" definiert (vgl. Giegerich 1985:2f) 4. Wichtig für die neuere Entwicklung der prosodischen Phonologie ist die Annahme hierarchisch angeordneter prosodischer Einheiten: Silbe 5, Fuß, phonologisches Wort etc (vgl. Nespor/Vogel 1986) 6. Mehrere der hier veröffentlichten Beiträge betreffen die Silbenstruktur bzw. alternative Analysen, die nicht mehr die Silbe als prosodische Einheit anerkennen (vgl. Vennemann und Auer). Die Analyse der Silbenstruktur war in der SPE-Phonologie zwangsläufig in eine Sackgasse geraten, da man gezwungen war, suprasegmentale Eigenschaften wie Silbischkeit als segmentale (z.B. mithilfe des Merkmals [±silbisch]) zu behandeln. Erst mit der Lösung vom SPE-Modell und der Herausbildung der Nichtlinearen Phonologie bekam die Silbenforschung neuen Auftrieb (vgl. die bereits erschienenen Sammelbände zur Silbenstruktur des Deutschen von Vennemann 1982 und Eisenberg/Ramers/Vater 1992). Der Beitrag von Theo VENNEMANN knüpft an frühere Analysen an. Er vertritt die These - die an zahlreichen Beispielen aus dem Deutschen und dem Hopi illustriert wird-, daß die Silbe als prosodische Einheit entbehrlich ist. Statt dessen sind Energiekonturen, die nach Sievers 190l5 aus Abfolgen von Paaren aus Crescendo () bestehen, die relevanten Grundeinheiten. Sie sind jeweils mit Sprachlauten in der Segmentschicht verbunden, wobei ein Unterschied zwischen sanftem und scharfem Silbenschnitt besteht: Beim sanften Schnitt landen die Verbindungslinien vom Crescendo und Decrescendo auf demselben Sprachlaut, beim scharfen Schnitt dagegen landet die vom Decrescendo ausgehende Linie auf einem Konsonanten, von dem gleichzeitig eine Linie zum nächsten Crescendo führt, wobei der nächste Sprachlaut die Rolle eines "Gelenks" spielen kann (d.h. ambisyllabisch ist). Die Silbe erweist sich danach als Epiphänomen über den Energiekonturen. Aus anderer Perspektive relativiert auch Peter AUER den Status der Silbe als zentraler phonologischer Einheit. Er geht von der Grundthese aus, daß sich die Sprachen der Welt nach der Wahl der "phonologischen Hauptkategorie" in "Wort- und Silbensprachen" typisieren lassen. Neben Silbensprachen wie Standarditalienisch und Pali stellt er Sprachen, in denen das phonologische Wort im Zentrum des phonologischen Giegerich (1985:2) sagt: "...the sonority relations that hold among neighbouring segments can be expressed in terms of the relative prominence of segments. Sonority, it has been argued, is the intra-syllabic counterpart of stress (Kiparsky 1981)". Bzw. noch unterhalb der Silbe (oder statt der Silbe, vgl. die Beiträge von Vennemann und Auer, in diesem Band) die More. Über die oberhalb des phonologischen Worts anzunehmenden Einheiten (wie Klitik-Einheit, phonologische Phrase etc.) besteht noch kein Konsens.

Systems steht. Zu letzteren zählt er u.a. !xoö, Tamang und Neuhochdeutsch. Er belegt seine These mit Daten dieser drei Wortsprachen aus den Bereichen Tonzuweisung, Phonotaktik, Silbenstruktur und Assimilationen. Besonders intensiv behandelt er die Auslautverhärtung im Deutschen und problematisiert die Auffassung von der Silbe als ihrer relevanter Domäne. Auers Ansatz ist gekennzeichnet durch eine Abwendung von einer reinen Silbenphonologie hin zu einem Modell, welches eine differenzierte Hierarchie prosodischer Kategorien im Sinne von Nespor/Vogel 1986 zugrundelegt. Als zentrales Phänomen der Prosodie untersucht Wim ZONNEVELD den Wortakzent im Rahmen der Lexikalischen Phonologic. Den Ausgangspunkt seiner Untersuchung bildet die Frage nach dem Aufbau der Phonologie-Morphologie-Schnittstelle. Er vergleicht zwei konkurrierende Modelle der Interaktion dieser beiden Komponenten der Grammatik: (1) Alle morphologischen Operationen sind strikt getrennt von den phonologischen und gehen diesen in der Derivation voran (Halle/Vergnaud 1987). (2) Morphologie und Phonologic interagieren in zyklischer Form miteinander (Booij/Rubach 1987). In einer detaillierten Analyse der Akzentuierung komplexer Wörter im Niederländischen weist Verf. nach, daß nur im zweiten Modell die Fakten - z.B. die Akzentsensitivität bestimmter Affigierungen - adäquat beschrieben werden können. Der Beitrag von Caroline FERY ist einer anderen Schnittstelle der Grammatik gewidmet, der Relation zwischen Phonologic und Syntax. Die Verf. untersucht verschiedene Möglichkeiten der prosodischen Disambiguierung segmental identischer, aber syntaktisch unterschiedlich strukturierter Sätze im Standarddeutschen. Anhand der phonetischen Analyse von 20 geeigneten Testsatzpaaren ermittelt sie neben den in der Intonationsforschung schon intensiv untersuchten Mitteln der Akzentplazierung und der Phrasierung durch Pausensetzung oder Grenztöne zwei weitere, bisher wenig beachtete Möglichkeiten: (1) unterschiedliche Tonsequenzen, die u.a. zur Markierung von Skopusunterschieden dienen, und (2) Tonregisterverschiebungen, die z.B. zur Differenzierung restriktiver von nicht-restriktiven Relativsätzen benutzt werden können. Michael JESSEN geht - einer Konzeption von Jakobson/Waugh 1986 folgend - von der Hypothese aus, daß Vokale und Konsonanten prototypischerweise unterschiedliche (nämlich redundante vs. distinktive) Funktionen im Sprachsystem erfüllen. Diese These überprüft er mit Hilfe einer akustischen Analyse phonetischer Korrelate der Gespanntheitsopposition bei Vokalen und Konsonanten im Deutschen. Er findet für Vokale keine einheitliche phonetische Eigenschaft mit distinktiver Funktion, während für die Differenzierung der Obstruenten die Turbulenzdauer als invariantes Unterscheidungsmerkmal fungiert. lessen betrachtet die Funktionsunterschiede zwischen Vokalen und Konsonanten nicht als einzelsprachliches Phänomen. Den universalen Charakter dieser Differenzierung untermauert er durch die Erörterung empirischer Befunde aus den Bereichen Spracherwerb, Sprachevolution, Sprachtypologie und Neurolinguistik. Die vier psycholinguistisch ausgerichteten Beiträge betreffen Fragen des Erst- und Zweitspracherwerbs, kapazitäre Begrenzungen der sprachlichen Informationsverarbeitung, der Sprachperzeption und -produktion sowie Fragen der Lernbarkeit menschli-

eher Sprachen. Das zentrale Anliegen dieses Bandes findet in mehreren Aspekten seinen Niederschlag, und zwar einmal in global kognitiven Zusammenhängen der Art und des Umfangs der Informationsverarbeitung im Gedächtnis; zweitens in medienspezifischen Zwängen, wenn sich Informationsverarbeitung biologisch bedingt je nach Sinnesmodalität unterscheidet; und drittens in Lerabarkeitserwägungen. Die sprachlichen Strukturierungs- und Realisierungsmöglichkeiten sind durch diese übergeordneten Zwänge universell begrenzt. Gertraud FENK-OCZLON und August FENK greifen einen allgemein-kognitiven Aspekt auf. Sie gehen davon aus, daß die Menge der pro Zeiteinheit bearbeitbaren Information maximal begrenzt ist. Ein durch komplexere Strukturen bedingter höherer Bearbeitungsaufwand in einem Bereich erfordert als Ausgleich geringere Komplexität in einem anderen. Zu mehreren Sprachen werden aus einer Proposition bestehende "Kernsätze" im Hinblick auf die Anzahl ihrer Intonationseinheiten, Wörter, Silben und Phoneme verglichen. In ihren empirischen linguistischen Befunden sehen die Autoren Parallelen zur Verarbeitung nichtsprachlicher Information sowie zu bekannten Koinzidenzen der Sprachtypologie, z.B. daß SOV-Sprachen zu einfachen Silben, silbenreichen Wörtern und agglutinierender Morphologie neigen. Vermutet wird daher, daß sich typologische Tendenzen zumindest zum Teil als Folge allgemeiner, nicht notwendigerweise linguistischer Verarbeitungweisen des Gedächtnisses erklären lassen. Henning WODE gibt einen Überblick über die ontogenetische Entwicklung der Sprachschallperzeption und verbindet sie mit phylogenetischen Aspekten. Sein Beitrag ist ein Beispiel für biologisch bedingte Restriktionen sprachlicher Strukturierungsmöglichkeiten. Das auditive System des homo sapiens zeichnet sich durch genetisch vorgegebene Bereiche erhöhter - auditiver - Sensibilität aus. Sie sind mit der Geburt, also schon bei Neugeborenen, vorhanden und erfüllen zwei Funktionen: Phylogenetisch sind sie die Grundlage für das nach Zahl und Art begrenzte Inventar der lautlichen Oppositionen, die in menschlichen Sprachen für distinktive Zwecke genutzt werden; ontogenetisch ermöglichen sie dem Lerner die Entwicklung der perzeptuellen Kategorien der Zielsprache(n). Die bekannten phonologischen Schwierigkeiten älterer Zweitsprachenlerner erklären sich nicht als Verlust der ursprünglichen Sensibilitäten, sondern als Einschränkungen der Zugriffsmöglichkeiten auf sie, wenn die perzeptorischen Bereiche durch die Kategorien der Erstsprache(n) besetzt sind. Ocke-Schwen BOHN präzisiert diesen Sonderfall des Zweitspracherwerbs am Beispiel von englisch /i i/. Sie unterscheiden sich durch Dauer und spektrale Eigenschaften. Nach traditioneller Sicht differenzieren Sprecher mit Erstsprache ohne Opposition zwischen /i/ und l\l bzw. mit Vokalen, die nicht nach Dauer unterschieden werden (z.B. Spanisch und Mandarin) Englisch /i i/ nach spektralen Eigenschaften; Sprecher des Deutschen nach spektralen und Dauereigenschaften. Bonns Experimente präzisieren die bisherige Sichtweise, weil auch Sprecher des Mandarin und Spanischen englisch l'\l und lil nach Dauer differenzierten, und zwar, so Bonn, weil die spektralen Ei-

genschaften nicht ausreichen: Die ursprünglich vorhandene Sensibilität für Dauer ist durch Kontakt mit Mandarin und Spanisch nicht völlig verlorengegangen. Ursula STEPHANY wendet den funktionalen Ansatz der Emergenten Grammatik im Sinne von Hopper 1987 auf den Erstspracherwerb, vornehmlich des Deutschen und Griechischen, an. Im Gegensatz zu nativistischen Ansätzen generativer Prägung verlangt dieser Ansatz einerseits eine stärkere Berücksichtigung des sprachlichen Inputs und andererseits einen ständigen gegenseitigen Rückbezug der "Synchronie" auf die "Diachronie". Spracherwerb wird nicht als Erwerb von Regeln, sondern als Prozeß der Grammatikalisierung (hier: der Phonologisierung) gesehen. Die von Linguisten als Regeln beschriebene Systemhaftigkeit bildet sich erst nach und nach heraus; durch die stete Verwendung von Ausdrücken sichern sich die "Regeln" selbst ihre Existenz. Belegt wird die These vor allem durch Harmonisierungs- und Silbenstrukturprozesse. Stephanys Ansatz stellt zum einen sicher, daß Informationsverarbeitungszwängen nach Art der von Fenk-Oczlon/Fenk beschriebenen von Anfang an auch auf den Prozeß der Phonologisierung durchschlagen, und setzt zum anderen voraus, daß die perzeptorischen Fähigkeiten, wie in Wode (in diesem Band) nachgewiesen, schon beträchtlich früher weiter entwickelt sein müssen, als dies aus herkömmlichen Beschreibungen zur Entwicklung der Produktionsphonologie kleiner Kinder zu entnehmen ist. Insgesamt stellen die psycholinguistischen Beiträge eine Reihe sprachlicher Phänomene heraus, die nicht ohne weiteres von den bislang verfügbaren phonologischen Theorien erfaßt werden, und legen daher eine -Weiterentwicklung dieser Theorien nahe.

Literatur Booij, G.E./ Rubach, J., 1987. Postcyclic versus postlexical rules in Lexical Phonology. Linguistic Inquiry 18:1-44. Chomsky, N./ Halle, M., 1968. The sound pattern of English. New York: Harper & Row. Eisenberg, P. / Ramers, K.H. / Vater, H. (eds.), 1992. Silbenphonologie des Deutschen. Tübingen: Giegerich, H.J., 1985. Metrical phonology and phonological structure. German and English. Cambridge: Cambr. University Press. Goldsmith, J., 1990. Autosegmental & Metrical Phonology. Oxford: Blackwell. Halle, M. / Vergnaud, J.-R., 1987. An Essay on Stress. Cambridge/MA: MIT Press. Hopper, P. J. 1987. Emergent Grammar. Annual Meeting of the Berkeley Linguistics Society 13:139157. Hulst, H. van der / Smith, N., 1982. Autosegmental and metrical phonology. In: Hülst, H. van der / Smith, N. (eds.), 1982. The Structure of Phonological Representations (Part J). Dordrecht: Foris, 1-45. Jakobson, R. / Waugh, L.R., 1987. The sound shape of language, Berlin: Mouton de Gruyter.

Kiparsky, P., 1981. Remarks on the metrical structure of the syllable. In: Dressler, W.U. et al. (eds.) 1981. Phänologien 1980: Akten der Vierten Internationalen Phänologie-Tagung. Innsbruck: IBS 36:245-256. Nespor, M. /Vogel, L, 1986.Prosodicphonology. Dordrecht: Foris. Pike, K. / Pike, E., 1947. Immediate constituents of Mazateco syllables. Internationaljournal of American L inguistics 13:78-91. Selkirk, E.O., 1982. The syllable. In: Hulst, H. van der / Smith, N. (eds.) 1982:337-383. Sievers, E., 1901^. Grundzüge der Phonetik zur Einführung in das Studium der Lautlehre der indogermanischen Sprachen. Leipzig: Breitkopf & Härtel. Vennemann, T., 1982a. Zur Silbenstruktur der deutschen Standardsprache. In: Vennemann, Th. (ed.), 1982. Silben, Segmente, Akzente. Tübingen: Niemeyer (=Ling. Arbeiten 126), 261-305. Wiese, R., 1986. Zur Theorie der Silbe. Studium Linguistik 20:1-15. Wiese, R., 1988. Silbische und lexikalische Phänologie: Studien zum Chinesischen und Deutschen. Tübingen: Niemeyer (=LA 211).

Köln / Kiel, März 1993

Universelle Nuklearphonologie mit epiphänomenaler Silbenstruktur Theo Vennemann gen. Nierfeld

0. Übersicht I.Ziele der Arbeit 2. Die Silbenschnitte in einer früheren Auffassung 3. Aufbau einer Silbenschnittphonologie ohne Silbenschicht 3.1. Eliminierung der Silbenschicht 3.2. Nähere Charakterisierung der Silbenschnitte 3.3. Silbenschnitte und Silbengewicht 4. Darstellung einiger traditioneller Konzepte in der neuen Theorie 4.1. Silbenschnitte und Silbengewicht in Sprachen ohne Silbenschnittopposition 4.2. Langdiphthonge und Geminaten 4.3. Realisationsphonologische Transformationen 4.4. Stabilitätsphänomene 4.5. Energiekonturen, Sonoritätsprofil und Extrasyllabizität 4.6. Definition einiger syllabischer Begriffe 4.7. Die standarddeutsche Auslautverhärtung 5. Silbenschnitt im Hopi 6. Schlußbetrachtung 7. Ausblick

1. Ziele der Arbeit In meinem Aufsatz "The rule dependence of syllable structure" (1988a) habe ich auf eine Reihe schwieriger Probleme von Silbenphonologien hingewiesen und in Weiterführung der Ansätze von Alan Bell (1976,1979) und Wolfgang Kreitmair (1984) vorgeschlagen, daß eine richtigere phonologische Theorie, für die ich den Namen "Nuklearphonologie" vorschlug, auf tieferen Organisationsprinzipien aufzubauen habe, die auf einem geeignet zu definierenden Kohäsionsbegriff für Sprachlaute untereinander und im besonderen zum Nukleus beruhten, so daß sich Silbenstruktur in einer solchen Theorie als epiphänomenal erweise. In jüngeren Arbeiten (1990,1991a, b) habe ich gezeigt, daß man den standarddeutschen Vokalismus am günstigsten in einem prosodischen Rahmen mit Eduard Sievers' Energiekonturen beschreibt, in welchem Abfolgen von Paaren aus Crescendo () zu Abfolgen aus Sprachlauten in Beziehung gesetzt wer-

8 den (Sievers 1901: §§ 557-559, 565, 578, 596,598). Die Darstellung in meiner "Skizze der deutschen Wortprosodie" (1991b) weist aber gewisse unerwünschte Redundanzen auf. In der folgenden Darstellung möchte ich erstens die erwähnten Redundanzen beseitigen und zweitens zeigen, daß die in den genannten drei Arbeiten (1990,1991a, b) für das Deutsche entwickelte Silbenschnittphonologie sich zugleich als Skizze einer Universalphonologie verstehen läßt, welche gewisse Aporien der Silbenphonologien dadurch vermeidet, daß in ihr der Begriff der Silbe nicht als Grundbegriff vorkommt. Um letzteres zu leisten, werde ich einige universelle Konzepte der allgemeinen Phonologie silbenschnittphonologisch rekonstruieren. Außerdem werde ich für eine nichtgermanische Sprache, das uto-aztekische Hopi, dem Silbenschnitteigenschaften zugeschrieben worden sind (Trubetzkoy 1939:176-179,197) und dem infolgedessen in einem metrisch-phonologischen Rahmen eine besondere, aber meines Erachtens erfolglose Behandlung zuteil wurde (Anderson 1984: 88-95), zeigen, wie sich die für sie festgestellten Regularitäten in dem hier entwickelten Rahmen auf eine natürliche, intuitiv ansprechende Weise zum Ausdruck bringen lassen.

2. Die Silbenschnitte in einer früheren Auffassung Zunächst exemplifiziere ich die in der "Skizze der deutschen Wortprosodie" (1991b) gegebene Darstellung der Silbenschnitte und verdeutliche die in ihr enthaltenen Redundanzen. Im nächsten Abschnitt werde ich dann die Redundanzen eliminieren. Anschließend soll gezeigt werden, wie die eigentlichen Vorteile der Silbenschnittphonologie auch in dem so verschlankten Rahmen erhalten bleiben. Die Darstellungen in (1) [auf der folgenden Seite] illustrieren das Vorgehen in der "Skizze"; es handelt sich um die dortige Nr. (8). Diese Darstellungen sind folgendermaßen zu lesen. Dem jeweiligen Wort ist seine wortphonologische Form zugeordnet, dieser die Folge der Silben (eigentlich ^ bzw. ^, 2 usw.), jeder von diesen ihr Morenraster, auf dem die Anzahl der zu der Silbe gehörigen Zeiteinheiten (Moren) und - durch den Pfeil - die Stelle des Silbengipfels ausgedrückt sind. Den Zeiteinheiten sind Sprachlaute zugeordnet. Im Beispiel Koma sind diese /k/ und /o/ bzw. /m/ und /a/. Diese plazierten Sprachlaute wiederum sind durch Verbindungslinien auf eine bestimmte Weise dem Crescendo () der betreffenden Silbe zugeordnet. Im Beispiel Koma ist die Weise der Zuordnung der plazierten Sprachlaute an die Konturteile für beide Silben die natürlichste; sie ist zugleich diejenige, die in den weitaus meisten Sprachen der Welt die einzige ist: Der Gipfelsprachlaut markiert die Stelle, an dem das Crescendo in das Decrescendo übergeht (er gehört beiden Konturteilen an), während der Silbenkopf ganz zum Crescendo, die (hier leere) Silbenkoda

(1)

N

d a I t

da

N N I\\N

k o m a l t l t

k o m a l t l t

Komm*

N V o

t

Leo

ganz zum Decrescendo gehört. Die Verbindung des Gipfelsprachlauts sowohl mit dem Crescendo als auch mit dem Decrescendo stellt definitionsgemäß den sanften Schnitt dar, der mit Gespanntheit des Gipfelvokals und weiteren phonetischen Eigenschaften (z.B. Gedehntheit unter Akzent) einhergeht.1 Auf die Frage der phonetischen Korrelate des phonologischen Konzepts der Silbenschnitte kann ich hier nicht eingehen; vgl. die entsprechenden Ausführungen und die Literaturhinweise in Vennemann 1991a. Durch einen ausfühlichen Brief Eli Fischer-J0rgensens vom 1. Februar 1991 und ein im Wintersemester 1992-93 gemeinsam mit Hans G. Tillmann durchgeführtes Seminar bin ich belehrt, daß die Beantwortung dieser Frage sich schwieriger gestalten wird, als die intuitive Klarheit des Konzepts und seine deskriptive Fruchtbarkeit dies erwarten lassen; dafür bin ich den beiden Kollegen dankbar. Was ich vor allem gelernt habe, ist, daß sich nicht ein einziges, gewissermaßen "hauptverantwortliches" phonetisches Merkmal als Grundlage der Schnitte finden lassen wird, sondern daß der intuitive Eindruck der Schnitte durch ein ganzes Bündel phonetischer Eigenschaften hervorgerufen werden dürfte, dessen Komponenten zudem von verschiedenen Sprechern in verschiedenen Umgebungen unterschiedlich gewichtet werden können. Nun ist dies im Hinblick auf meinen theoretischen Ansatz nicht etwa entmutigend, sondern, wie Tillmann dankenswerterweise ausgeführt hat, im Gegenteil die eigentliche Bestätigung meiner Auffassung, daß der grundlegende Unterschied zwischen den beiden Reihen standarddeutscher Vollvokale kein segmentaler, sondern ein prosodischer ist. Insofern dürfen auch die Phonologen auf die Ergebnisse des neuen DFG-Projekts "Ermittlung der arikulatorischen Realisierung der deutschen Vokale" am Münchner Institut für Phonetik gespannt sein. - Die Komplexität des phonetischen Problems wird auch in einer wichtigen neuen Publikation von Eli Fischer-Jergensen (1990) deutlich. Doch erkenne ich selbst dort einen Silberstreif: "Finally one might perhaps argue that for the speaker the vowels [l], [Y], [u] are simply short versions of the long vowels [i:], [y:], [u:], and therefore he aims at the same FQ value, the laxness being a lower level feature due to the short duration of these vowels" (134). Hiervon unterscheidet sich meine eigene Auffassung nur in dem einen Punkt, daß auch der Längenunterschied nicht als solcher grundlegend für die Opposition ist. Wenn die Autorin ihren nächsten Aufsatz folgendermaßen beschließt: "Finally one might perhaps argue that for the speaker the vowels [I], [Y], [U] and [i], [y], [u] are simply the abruptly and smoothly cut versions of the same vowels, /i/, /ü/, /u/, and therefore he aims at the same FQ value, the shortness and laxness on the one hand and the length and tenseness on the other being lower level features

10

Daß diese Zuordnung zwar die natürlichste, aber zumindest im Standarddeutschen nicht die einzige ist, zeigt die Darstellung des Wortes Komma. Diese stimmt in allen Zügen mit derjenigen des Wortes Koma überein, ausgenommen die Zuordnung der Sprachlaute zu den Konturteilen: In der ersten Silbe ist der Gipfelsprachlaut nur mit dem Crescendo, nicht auch mit dem Decrescendo verbunden; das Decrescendo fällt vielmehr in den auf den Gipfelsprachlaut folgenden Konsonanten. Dies stellt definitionsgemäß den scharfen Schnitt dar, der mit Ungespanntheit des Gipfelvokals und weiteren Eigenschaften (z.B. Kürze und Zentralisierung) einhergeht. Da in diesem Beispiel in der ersten Silbe auf den Gipfelsprachlaut kein Konsonant mehr folgt, fällt das Decrescendo in den ersten (im Beispiel einzigen) Konsonanten des Kopfs der Folgesilbe, /m/. Indem dieser sowohl dem Decrescendo der ersten Silbe als auch dem Crescendo der zweiten Silbe angehört, empfinden native Sprecher ihn als beiden Silben angehörig. Die Darstellung bringt diese Ambisyllabizität des plazierten Konsonanten /m/ sinnfällig zum Ausdruck. Die Darstellung des Beispiels Leo in (1) zeigt, daß im Hiat nur sanfter Schnitt möglich ist: Beim Hiat ist definitionsgemäß die erste Silbe offen und die zweite Silbe nackt, so daß also - wiederum definitionsgemäß - kein Konsonant vorhanden ist, in den das Decrescendo der ersten Silbe fallen könnte; da es auch in den Gipfel der zweiten Silbe nicht fallen kann, muß es im Gipfelsprachlaut der ersten Silbe ablaufen, und das ist gerade die Definition des sanften Schnitts. Ich habe bereits in der "Skizze" vermerkt, daß die Anzeigung des Silbengipfels durch den Pfeil redundant ist: Der Silbengipfel ist einfach die Stelle auf dem Morenraster bzw. in der Sprachlautfolge, auf die das Energiemaximum des Crescendos der Silbe fällt, also in der Darstellung diejenige Stelle, auf die die letzte Verbindungslinie des Crescendos zuläuft. Es ist somit unnötig, Positionen auf dem Raster darüberhinaus noch einmal als gipfelhaft auszuzeichnen. Die störendste Redundanz in den Darstellungen der "Skizze" besteht jedoch darin, daß die Darstellung einer phonologischen Wortform immer gerade soviele Paare aus Crescendo und Decrescendo - so viele Konturen - wie Silbenknoten auf weist. Ich muß also - mit Occams Rasiermesser - das eine oder das andere aus der Theorie herausschneiden. Die Paare aus Crescendo und Decrescendo kann ich nicht hinauswerfen, da ich sie für die Darstellung der Silbenschnitte brauche, wie an den Beispielen Koma und Komma in (1) zu erkennen ist. Also muß ich die Silbenknoten herausschneiden, mithin die ganze Darstellungsschicht für Silben eliminieren. Das mag zunächst überraschen, da ich selbst mit guten Gründen die in Silben gliedernde Wortrepräsentation in die neuere (generative) Phonologie eingeführt habe (Vennemann 1972) und da durch die Berücksichtigung der Silbe seither von zahlreichen Forschern trotz ansonsten unterschiedlicher theoretischer Orientierung bedeutende Erfolge erzielt worthat are part of the phonetic realization of the syllable cut opposition in these vowels", dann wäre ein hohes Maß an Gemeinsamkeit der Auffassung erreicht.

11

den sind. Aber die Maßnahme ist angesichts der in meinem Aufsatz "The rule dependence of syllable structure" (1988a) geschilderen unüberwindlichen Probleme der Silbenphonologie unausweichlich.

3. Aufbau einer Silbenschnittphonologie ohne Silbenschicht Es gilt nach dem Vorstehenden, die Darstellung so einzurichten, daß die Konturen die Anzeige der syllabischen Organisation mit übernehmen. Im folgenden werde ich allerdings die neuen Gebilde, vor allem wo ich an eingebürgerte Sprechweisen anknüpfen möchte, auch oft Silben nennen; und entsprechend bei ihren Bestandteilen. Zur Erinnerung daran, daß es sich nicht um den klassischen Silbenbegriff handelt/ setze ich gelegentlich die entsprechenden Ausdrücke der Silbenphonologie in Anführungsstriche. Oft spreche ich neutral einfach von Positionen innerhalb der phonologischen Wortformen. Aber auch die syllabischen Sprechweisen selbst sind harmlos, da man die Silbe und ihre Bestandteile in dem neuen Rahmen definieren kann, worauf ich später zurückkomme. 3.1. Eliminierung der Silbenschicht Die Elimination der Silbenschicht macht es nötig, die Konturen direkt mit dem Knoten für die phonologische Wortform zu verbinden. Dann drückt die Anzahl der Konturen aus, wieviele "Silben" das Wort enthält, nämlich wieviele Gipfelpositionen; z.B. stellen die partiellen Strukturbeschreibungen in (2) [auf der folgenden Seite] von links nach rechts Wörter mit "einsilbiger", "zweisilbiger" bzw. "dreisilbiger" Wortform dar.2 Von dieser Vorstellung leitet sich die Bezeichnung "Nuklearphonologie" her: Während wir von Silben an dieser Stelle noch nicht reden können, weil sie noch gar nicht eingeführt sind, steht der Begriff des Nukleus - eigentlich: des Gipfels - von Anfang an zur Verfügung. Mehr meinen wir als Linguisten nicht, wenn wir sagen, selbst naive native Sprecher seien in der Lage, die Anzahl der Silben eines WorMengentheoretisch sind die Konturen als Folgen aus Crescendo und Decrescendo zu verstehen, also als Objekte, die als Einheiten in den Strukturbaum eingehen. - Am Rande sei bemerkt, daß sich die hier zu entwickelnde Theorie natürlich geradesogut mengentheoretisch formulieren ließe oder auch in prädikatenlogischer Sprache oder zur Gänze auf Deutsch oder Englisch. Diese Sprachen werden aber im allgemeinen nicht so gut verstanden. Z.B. hat mich im Anschluß an meinen Vortrag in Cortona, in welchem ich die Theorie der Silbenschnitte auf Englisch entwickelte (Vennemann 1991a), Elizabeth Selkirk gefragt: "How are you going to represent that?" Und andere haben dasselbe mit anderen Worten gefragt. Da es mir auf die Sprache der Darstellung gar nicht ankommt, sondern nur auf den theoretischen Gehalt, verwende ich wie in der "Skizze" graphische Repräsentationen, die sich an Goldsmiths "autosegmentalen" Repräsentationen orientieren, ohne daß ich deswegen allerdings seine transformationeile phonologische Theorie übernähme (vgl. Goldsmith 1990).

12

tes festzustellen: Sie können die Anzahl der Nuklei feststellen, auch wenn sie etwaige Silben selbst nicht bestimmen können. Z.B. besteht kein Zweifel, daß im Standarddeutschen Wörter wie extra /eksträ/, Probstei /pröpstai/, erster /erster/ "zweisilbig", also zweigipflig sind, auch wenn es selbst Linguisten schwer fällt, die Silben (genauer: die Silbenbasen) dieser Wörter abzugrenzen. In meinem Aufsatz "Zur Silbenstruktur der deutschen Standardsprache" (1982) glaubte ich noch, in solchen Fällen "dezisionistisch" verfahren zu müssen. Die neue Theorie macht das überflüssig: Wie ich unten zeigen werde, gibt es in ihr keine Verpflichtung, alle Sprachlaute der wortphonologischen Sprachlautfolge eindeutig an eine Silbe - was ja ohnehin nur heißen kann: an eine Kontur - zu binden. (2)

Die Konturen drücken von links nach rechts den (intuitiv aufgefaßten) Intensitätsverlauf in der Zeit aus.3 Auch die Sprachlaute schreiben wir konventionell von links nach rechts zum Ausdruck des Ablaufs in der Zeit. Man wird schon deshalb vermuten, daß es richtig ist, den Zeitpfeil zwischen den Konturen und den Sprachlautfolgen anzuordnen. Das erweist sich auch im weiteren Verlauf der Exposition als richtig. Die Beispiele (1) erhalten damit die Darstellung in (3) [auf der folgenden Seite]. In dieser Darstellung habe ich jeweils die letzte Verbindungslinie eines Crescendos und die erste Verbindungslinie eines Decrescendos - die kritischen Verbindungslinien, wie ich kurz sage - fett gezeichnet. Die fetten Verbindungslinien bedeuten aber nichts anderes als die einfachen. Die Fettzeichnung soll nur dem Auge helfen, schnell die Nuklei zu identifizieren, und zudem auf die Unterschiede in den Schnittverhältrussen hinweisen.

In der Wahrnehmung gesprochener Sprache entspricht diese pulsierende Abfolge der Konturen der Tillmannschen B-Prosodie (der Silben), die hinsichtlich der Rapidität der Ereignisabfolge zwischen der A-Prosodie (der satzmelodischen Einheiten) und der C-Prosodie (der Sprachlaute) liegt (vgl. Tillmann mit Mansell 1980:3941,111-116).

13

(3)

Komma

Korn»

Leo

< >

AM/ /V V —

m

1

m a

3.2. Nähere Charakterisierung der Silbenschnitte In allen vier Beispielen von (3) ist zufälligerweise die Schlußsilbe eine offene Vollsilbe. Bei den zugehörigen Konturen landen deshalb die kritischen Verbindungslinien auf demselben Sprachlaut, genauer: auf demselben Zeitpunkt des Zeitpfeils. Das folgt (a) aus der Definition des Gipfels zusammen mit (b) dem Postulat, daß zu jedem Crescendo ein Decrescendo gehört, und (c) Goldsmiths Prinzip, daß Verbindungslinien sich nicht kreuzen dürfen. Nun ist ein solches Landen der beiden kritischen Verbindungslinien gerade die Definition des sanften Schnitts, vgl. (4).

(4)

sanfter Schnitt



scharfer Schnitt

s*

V Es folgt also aus dem Ansatz (braucht mithin nicht stipuliert zu werden), daß wortfinale offene (monophthongische) "Vollsilben" (d.h. Positionen mit Vollvokal, also nicht-reduzierte Positionen) nur sanften Schnitt haben können. Dasselbe gilt für offene Vollsilben vor nackten Silben, also im Hiat, vgl. in (3) das Beispiel Leo. Es gilt also generell für offene Vollsilben, auf die nicht im selben Wort eine bedeckte Silbe folgt (d.h. eine Silbe mit nicht-leerem Kopf). Da sanft geschnittene Vollsilben stets gespannten Vokal haben, folgt also, daß offene Vollsilben, auf die nicht im selben Wort eine bedeckte Silbe folgt, stets gespannten Vokal haben.

14

Ebenfalls aus dem Ansatz (also wiederum, ohne daß es stipuliert werden müßte) folgt, daß scharf geschnittene Positionen "geschlossen" sind: Sie sind es entweder naturä, wenn nämlich die kritische Verbindungslinie des Decrescendos einen Sprachlaut findet, den nicht zugleich das nächste Crescendo für sich beansprucht, oder sonst virtuell, indem sich die kritische Verbindungslinie des Decrescendos den ersten Sprachlaut des folgenden Crescendos mit diesem teilt. Im letzteren Fall wird dieser Sprachlaut - genauer: sein Zeitpunkt auf dem Zeitpfeil - "ambisyllabisch"; er bildet ein "Gelenk". Das sieht man am Beispiel Komma in (3). "Ambisyllabizität" ist also in diesem Ansatz eine unvermeidliche Folge des Bemühens, eine nicht-finale "offene Silbe" scharf zu schneiden. Nicht zur Verfügung steht bei dieser virtuellen Schließung selbstverständlich der Gipfelsprachlaut des folgenden Crescendos; virtuelle Schließung ist also, wie schon oben angedeutet, nur vor bedeckter Silbe möglich.4 "Ambisyllabizität" der hier behandelten Art - "Gelenkbildung" - schaut also stets wie in (5) aus; unten in Abschnitt 4.5 bespreche ich eine weitere Art, vgl. insbesondere (27). (5)

Ambisyllabizität; l. Fall: Gelenkbildung

\v\

v.

*r

Gelenkbildung: minimale Darstellung

-v.

H-1-h-»·

-H

Sanfter und scharfer Schnitt kontrastieren nicht nur in von Hause aus offenen Silben (mit virtueller Schließung bei scharfem Schnitt, vgl. in (3) die ersten Silben der Beispiele Koma und Komma), sondern auch in naturä geschlossenen Silben, d.h., wenn für die kritische Verbindungslinie des Decrescendos ein nicht-gipfelhafter Sprachlaut (bzw. der entsprechende Zeitpunkt auf dem Zeitpfeil) zur Verfügung steht, der nicht zugleich vom nachfolgenden Crescendo beansprucht wird. Das ist in (6) [auf der folgenden Seite] für finale und nicht-finale Silben dargestellt (Beet /bet/, Bett /bet/, Aalto /'äl.tö/, Alto /'äl.tö/). Da es nach meiner Auffassung im Standarddeutschen keine Quantität gibt, ist die Zuordnung der Sprachlaute in der Sprachlautfolge zu den Zeitpunkten auf dem Zeitpfeil weithin eine Eins-zu-eins-Abbildung. Man kann mithin für diese Sprache auf die explizite Darstellung dieses Verhältnisses im allgemeinen verzichten. Eine mögIn der lexikalischen Peripherie ist virtuelle Schließung nach der Deutung von David Restie auch in finalen offenen Silben möglich, nämlich durch Einfügung eines Minimalkonsonanten, des Glottalverschlußlautes, in die leere "Koda". Dieser dient dann als Landeplatz für das Decrescendo, z.B. in der aus dem Adverb da gewonnenen Lautgeste dä\; vgl. Vennemann 1991b: 93, Fn. 12.

15

liehe Ausnahme vom Eins-zu-eins-Verh ltnis stellen die Affrikaten dar, insbesondere die mit /t/ alternierende Affrikata /t8/, wie in nativ/Nation, d.i. /n .'tif/ versus /n .'tsi n/ / vgl. unten die Darstellung von -tion in (20). (6)

Beet

Beti

A&Ito

Alto

Φ

Φ

Φ

Φ

M A\ v\/v \\A/ •s.



-^

H —l b



-*. ^

^ ^

—l - h

e

b

t

e

t

a

l

t

-,*-

-*. «r

o

—l

1

a

t

l

o

Eine weitere Verdichtung der Darstellung erh lt man, wenn man durch Konvention auf die ausdr ckliche Angabe des in phonologischen Kontexten selbstverst ndlichen Wortformknotens φ verzichtet. Das ist f r (3) in (7), f r (6) in (8) dargestellt.

A

(7)

*
< >

< > < >

< > < >

A/ A/ A/ AW A/ V

d (8)

k

a

o

m a

Beet

Bett

•s.^·

v.*'

k

o

m a

l

e

Alto

ΑΛ//Ο



Schwere Silbe:

Vt ] Im Hopi kommt dieser Fall offenbar häufig vor, vgl. Trubetzkoy 1939:177, Fn. 3; 193.

18

Da die Schicht der Silbenknoten im gegenwärtigen Ansatz nicht mehr existiert (es gibt keine Silben im Sinne der Silbenphonologie), entsteht die Aufgabe, eine geeignete Entsprechung festzulegen, also schwere Positionen innerhalb der Wortform. Wie logisch aus der Definition folgt, gibt es, syllabisch gesprochen, drei Weisen, wie eine Silbe schwer werden kann: Sie ist schwer, wenn sie (a) geschlossen oder (b) diphthongisch oder (c) scharf geschnitten ist. Die nuklearphonologischen Entsprechungen sind in den Pänultimae der Beipiele in (10) dargestellt. Die Pänultimae sind durch Unterstreichung hervorgehoben.6 (10)

(a) Vennd*

(b) Suleik*

(c) Marokko

NA N NA N NA\N

v e r a n d a

z u l a i k a

m a

r o

k o

Vergleichen wir damit die nuklearphonologischen Entsprechungen der leichten Pänultimae in (11); die Beispiele sind so gewählt, daß sie zugleich die größere Freiheit der Akzentuierbarkeit bei leichten Pänultimae illustrieren. (11)

(a)

TiriH

NNN t

i

r

i

(c)

(b) Bikini

l i

hfimikri

N N N N N /A/ b

i

k

i

n i

m i m i k r i

Das Gemeinsame der Pänultimae in (10) gegenüber denjenigen in (11) ist deutlich: Während in (11) das Decrescendo keinen eigenen Sprachlaut (eigentlich: keinen ei6

Auf die Frage, ob diphthongische Silben sanft oder scharf geschnitten seien, gehe ich hier nicht ein (vgl. Vennemann 1991a: 219). In (lO.b) sind sie als scharf geschnitten aufgefaßt. Nimmt man an, daß sie sanft geschnitten seien, so ist nur eine zusätzliche Verbindungslinie vom Decrescendo zum Gipfelsprachlaut zu ziehen. Auf die Frage des Silbengewichts hat das keinen Einfluß.

19

genen Punkt auf dem Zeitpfeil) beansprucht, sondern sich ganz an den Gipfelzeitpunkt bindet, verbindet sich in (10) das Decrescendo mit einem vom Gipfelsprachlaut separaten Sprachlaut. Dadurch zieht in (10) das Decrescendo notwendigerweise mindestens einen Sprachlaut - einen Zeitpunkt - an seine Kontur heran, während in (11) das Decrescendo in dieser Hinsicht nichts weiter beiträgt. Natürlich kann auch eine sanft geschnittene Position schwer sein; aber sie ist es dann stets, weil eine "geschlossene Silbe" vorliegt, d.h. die Position natura durch einen Konsonanten geschlossen ist, z.B. in Aalto, vgl. (8)7 Wie die Definition des Silbengewichts für das Standarddeutsche zeigt, gilt für diese Sprache nicht die "klassische" Definition des Silbengewichts, wie sie z.B. aus dem Lateinischen und aus dem älteren Deutsch einschließlich aller bekannten bzw. rekonstruierten Vorstufen (also vom Urindogermanischen bis zum Mittelhochdeutschen) bekannt ist: DEFINITION (des klassischen Silbengewichts): Eine Silbe (bei Sprachen mit Silbenreduktion: eine Vollsilbe) heißt leicht, wenn sie offen ist und einen kurzen Nukleus hat (anders, nämlich im Rahmen mit Baumstrukturen operierender syllabischer Theorien formuliert: wenn ihr Reim sich nicht verzweigt); sonst schwer. Diese Definition greift im Standarddeutschen nicht, weil diese Sprache keine Quantitätssprache ist, das definierende Kriterium "kurzer Nukleus" also keine Anwendung findet. Das Standarddeutsche ist eine Sprache mit einem nicht-klassischen Silbengewicht. Trotzdem gilt auch für sie das Wesentliche, nämlich das Unterscheidungsmerkmal, daß die schweren Positionen im Vergleich mit den leichten ein phonologisches "Mehr" aufweisen müssen, wobei dieses "Mehr" allerdings sprachspezifisch ist. Die traditionelle Weise, das phonologische "Mehr" auszudrücken, ist die Zuweisung von Gewichtseinheiten, d.h. zum Gewicht beitragenden Moren, an Zeitpunkte auf dem Zeitpfeil, also durch eine Bewertungsprozedur für phonologische Strukturen. Stellen wir also den Unterschied zwischen standarddeutschen leichten und schweren Positionen mittels einer Moren zuweisenden Bewertungsprozedur dar. In (12) sind die entscheidenden Strukturen der pänultimalen Positionen von Mimikri, Veranda, Suletka, Marokko und Aalto gezeigt.

Falls man diphthongische Silben als sanft geschnitten auffaßt, so wären auch solche sanft geschnittenen Silben schwer. Übrigens spricht wohl auch nichts dagegen, diphthongische Silben als (natura, aber durch Vokal) geschlossen aufzufassen.

20

(12)

Mimttri

Vennd» "^

Su/e/Aa

^

"^

^

Λ4

A\

A\

m i

r a n

l

Marokko

AV r

o

k

a

i

A*lto

M H—l

a

l

In (13) habe ich in den entscheidenden Konfigurationen die Morenbewertung vorgenommen. Wieder sind zur Verdeutlichung die kritischen Verbindungslinien fett gezeichnet. (13)

einmorig, leicht

A

z weimorig, schwer

=A =f= μ

V \

zweimorig, schwer

\ \

21

Wie man sieht, lassen sich die beiden Fälle der schweren Position zusammenfassen; denn ob das Decrescendo und der Gipfelzeitpunkt unverbunden sind (scharfer Schnitt) oder verbunden (sanfter Schnitt), ist offenbar gleichgültig. Das ist in (14) ausgeführt. (14)

einmorig, leicht

\ \ \

=ic:

zweimorig, schwer

\ \

\ \

Die Darstellung in (14) läßt die für das Standarddeutsche gültige Morenbewertung als -Zuweisungsregel ablesen: -ZUWEISUNGSREGEL:

1. Der letzten Verbindungslinie vom Crescendo zum Zeitpfeil (d.h. der Gipfellinie) wird ein zugewiesen. 2. Der ersten Verbindungslinie vom Decrescendo zum Zeitpfeil, die nicht zum Gipfelzeitpunkt läuft, wird ein zugewiesen. Für spezielle Zwecke kann man den Begriff der Überschwere definieren, der auf die Stellung im Wort Bezug nehmen muß: DEFINITION (für das Standarddeutsche): Eine nicht wortfinale schwere Position ist einfach schwer, wenn nur eine einzige Verbindungslinie vom Decrescendo zum Zeitpfeil läuft, sonst überschwer; eine wort-finale schwere Position ist einfach schwer, wenn nur eine einzige Verbindungslinie vom Decrescendo nicht zum Gipfelzeitpunkt verläuft, sonst überschwer. Einfach schwer sind alle bisher betrachteten Beispiele nicht wortfinaler schwerer Positionen, ausgenommen die erste Position in Aalto; ferner alle bisher betrachteten Beispiele geschlossener Einsilbler. Überschwer ist die erste Position in Aalto. Überschwer sind überall im Wort Positionen mit Konsonantengruppen, die sich dem Decrescendo verbinden, wie /If/ in Hälfte, /rt s / in Arznei, /st/ in Anapäst, wobei der Schnitt, wie man sieht, scharf oder sanft sein kann, wenn er auch tatsächlich überwiegend scharf ist. Am Wortende hingegen sind genau alle einfach geschlossenen (einschließlich der diphthongisch endenden) Positionen einfach schwer, nämlich

22

unabh ngig vom Schnitt; jedenfalls kann ich z.B. in den zweiten Silben von Stilett und Milet keinen Gewichtsunterschied feststellen, sowenig wie in Bett und Beet. Ob es zweckm ig ist, die μ-Zuweisung auf den Fall der berschwere zu erweitern, also mehr-als-zwei-morige Positionen zu definieren, ist meines Wissens unerforscht. Technisch l t es sich leicht einrichten, vgl. die Beispiele in (15). Interessant w re bei einem solchen Vorgehen, da eine μ-Zuweisung an die Verbindung von einem Decrescendo zum Gipfelzeitpunkt nur zul ssig ist, wenn es bereits eine andere μ-Zuweisung an eine Verbindungslinie des Decrescendos gibt. (15)

einmorig, leicht

zweimorig, schwer

\

dreimorig, berschwer

\ μ μAμ

\

μ

μ

\

\

V

\ Λ

ι

k

a

a

in Kami, Tosca , Toscana

r

in Arktis

—r—»· -τ

k

viermorig, berschwer

7" \

\ \ \ a

in AaL'to

in Afar, Alto



\μ Kμ μ 1

1

a

viermorig, berschwer

dreimorig, berschwer

1

l

(

- ι ——r-^·

Ρ

in .Anap st

S

t

^—

f

1

1

1

a

r

k

in frt&rkt

—r-^· t

23

4. Darstellung einiger traditioneller Konzepte in der neuen Theorie Es stellt sich nun die Frage, wie sich die bisher für das Standarddeutsche entwickelte nuklearphonologische Skizze als Skizze einer universellen Nuklearphonologie verstehen läßt. Die Aussichten für eine solche Verallgemeinerung sind günstig. Denn erstens ist die neue Theorie reicher an Ausdrucksmitteln, indem sie nicht mit undifferenzierten -Knoten operiert, sondern mit den feiner differenzierenden Energiekonturen; und zweitens ist das Herzstück jeder phonologischen Theorie, die Quantitätslehre als Basis der Akzentlehre, schon universell ausgelegt: Die bildliche Darstellung der einmorig-leichten und der zweimorig-schweren Positionen in (14) wie auch die -Zuweisungsregel ist genau diejenige, die man auch für die klassischen Quantitätssprachen braucht. 4.1. Silbenschnitte und Silbengewicht in Sprachen ohne Silbenschnittopposition Wie stellen sich die Energiekonturen in der Beschreibung von Sprachen dar, die keine Silbenschnittopposition aufweisen, in denen also der oben in (4) dargestellte Kontrast nicht besteht? Dabei soll nicht ausgeschlossen sein, daß auch solche Sprachen Silbenschnitte aufweisen, nämlich redundanterweise, z.B. als unterstützende phonetische Interpretantien von Länge und Kürze.8 Das muß schon aus dem Grunde zulassen werden, weil anders nicht zu verstehen wäre, daß Silbenschnitte als phonologische Opposition überhaupt entstehen. Worauf es ankommt, ist, daß in den jetzt zu betrachtenden Sprachen die Konturen nicht kontrastierend eingesetzt werden dürfen. Es ist aber erstens festzulegen, wie die Verbindungslinien vom Crescendo und Decrescendo zu ziehen sind, und zweitens dürfen die Silbenschnitte benutzt werden, um die Beschreibung phonetischer Unterschiede zwischen den Sprachen schon in der phonologischen Repräsentation anzulegen. Es kommt auf die Frage an, wie sich leichte und schwere Positionen in den klassischen und nichtklassischen Quantitätssprachen darstellen. Der klassische Fall ist in (16) [auf der folgenden Seite] illustriert. Man sieht in (16) den springenden Punkt: Die zweite Struktur, welche Langvokale von Kurzvokalen unterscheidet und für Quantitätssprachen konstituierend ist, gibt es im Standarddeutschen nicht. Dafür gibt es in den klassischen Quantitätssprachen keine "Ambisyllabizität", keine Gelenke. Auch gibt es in manchen Quantitätssprachen in geschlossenen Silben sowohl Lang- als auch Kurz vokale, vgl. im Lateinischen ad 'zu, bei', äs 'Einheit, Ganzes'. Das kann es im Standarddeutschen nicht geben, aber "dafür" gibt es dort die Opposition von sanftem und scharfem Schnitt, vgl. (17).

Das Hopi weist eine Silbenschnittopposition zusätzlich zur Vokallängenopposition auf. Darauf komme ich unten in Abschnitt 5 zurück.

24

(16)

einmorig, leicht

zweimorig, schwer



\1 1

k

\μ / μ

V \

\/ \

«

k

|

V a

Langvokal

^.

k β ll k aι rX in cauda in cantor canrut

in cams

Kurzvokal

1|

1

1—*

|

in Cat

(17)

\μ / μ —|

+>

zweimorig, schwer

scharfer Schnitt

sanfter Schnitt

\ \ ι

{L

1ι—^

(1

in lat. td
" z.B. "C D" schriebe, da die Bedeutung der Zeichen in jedem Fall im Rahmen einer zugehörigen semantischen Theorie, nämlich im Rahmen der Phonetik, erklärt werden muß. Tatsächlich hat der Dconismus ja schon dort ein Ende, wo die Notation nicht zum Ausdruck bringt, daß die Energieausgabe insgesamt im Decrescendo schwächer ist als im Crescendo. Gleichwohl scheint mir hier besonders anschaulich gemacht, weshalb die wohlbekannten Sprachlauthierarchien die immer wieder festgestellte Rolle in der Sprachlautorganisation spielen; wir sind offenbar einer expliziten Darstellung des Kohäsionsbegriffs, insbesondere der Gipfelaffinität (ungenau auch Vokalaffinität genannt), ein Stück näher gekommen. 4.6. Definition einiger syllabischer Begriffe Obwohl die traditionellen Silbenbestandteile - Kopf, Koda, Körper, Reim usw. (vgl. die Definitionen in Vennemann 1988b: 5-10) - im hier entwickelten Ansatz keine zentrale Rolle spielen, lassen sie sich dennoch ohne weiteres definieren. Betrachten wir nämlich eine bestimmte Kontur einer phonologischen Wortform, so nennen wir zunächst den Komplex aller derjenigen Strukturelemente, die von unten her mit der Kontur verbunden sind (einschließlich der Kontur selbst), die zu der Kontur gehörige Silbe. Die Basis einer solchen Silbe läßt sich alsdann definieren als die Folge der Sprachlaute, die zu der Silbe gehört. Vielleicht empfiehlt es sich aber, diese Festlegung dahingehend einzuschränken, daß ein Gelenk nicht zur Basis der ersten Silbe gehört. Ein Gelenksprachlaut würde dann zwar definitionsgemäß zur ersten Silbe gehören, aber eben nicht zu ihrer Basis. Diese Einrichtung der Begriffe würde sehr schön zum Ausdruck bringen, daß eine scharf geschnittene Silbe mit nachfolgender Ambisyllabizität "eigentlich offen" und nur "virtuell geschlossen" ist. Um dies zu verdeutlichen, habe ich in (29) [auf der folgenden Seite] die Beispiel Koma und Komma aus der obigen Darstellung (3) herausgezogen und die Silben und ihre Basen in Kästen gesetzt, die jeweils erste mit festem Strich, die jeweils zweite mit gebrochenem Strich.

36

Im Vergleich der beiden Repräsentationen wird sinnfällig, wie der scharfe Schnitt gewissermaßen in die zweite Silbe hineinlangt und einen Sprachlaut zur eigenen Silbe herüberzieht, so daß diese breiter (schwer!) wird, ohne daß sich jedoch ihre eigene Basis deswegen veränderte. (29)

/v

/^ ^-

l

|k B i5d

.|

[- stimmhaft] /

t

43

5. Silbenschnitt im Hopi Das uto-aztekische Hopi (Dialekt des Dorfes Toreva17 in Arizona) ist insofern eine nicht-prototypische Silbenschnittsprache, als es sowohl phonologisch relevante Silbenschnitte als auch phonologisch relevante Vokallänge aufweist (Trubetzkoy 1939: 176-179,197 aufgrund eines Briefes von Benjamin Lee Whorf, ferner Whorf 1963,159 mit Fn. 3). Grundlegend für die Betrachtung ist das folgende Minimaltripel: pas (mit Kurzvokal und scharfem Schnitt) 'sehr', pas (mit Kurzvokal und sanftem Schnitt) 'Feld', pas (mit Langvokal und sanftem Schnitt) 'still'. Trubetzkoy schreibt für die drei Wörter beziehentlich pas, pas und päs. Das ist in der jetzigen Umgebung insofern ungünstig, als hier zwar V den scharfen Schnitt der betreffenden Silbe, V aber nicht Vokallänge, sondern sanften Schnitt bezeichnet. Whorf (1963, 159, § 3 et passim) schreibt entsprechend V ("dipped vowel"), V (normale Kurzvokale, ohne Kennzeichnung) und V- (Langvokale).18 Da die Trubetzkoysche Notation lediglich ad hoc verwendet wurde und ohne Folgen blieb, desgleichen auch die Whorfsche Notation bei Jeanne 1982 nicht mehr verwendet ist, gehe ich hier nicht von meiner eigenen Notation ab und übersetze Trubetzkoys und Whorfs Transkriptionen nach den Regeln (42) in meine Schreibweise:

(42)

V, V * V V, V => V

pas, pas pas, pas

V, V' => V:

päs, pa-s

=» pas => päs =* pä:s

Beim scharfen Schnitt ist die Ausdrückung der Kürze überflüssig, da laut Trubetzkoy scharfer Schnitt nur bei Silben mit Kurzvokal vorkommt. Umgekehrt ist bei Langvokal eigentlich die Ausdrückung des sanften Schnitts überflüssig, da laut Trubetzkoy bei Silben mit Langvokal nur sanfter Schnitt vorkommt; ich schreibe gleichwohl "V:", um nicht unnötig weit von Trubetzkoys Schreibung abzuweichen, aber auch, weil es auf den Schnitt ja im gegenwärtigen Kontext hauptsächlich ankommt.19 Bei Trubetzkoy mit dem älteren Namen Mishongnovi (Anglisierung von [mosärjnevi]) identifiziert; vgl. Whorf 1963:158. Da Whorfs Artikel vielleicht nicht ganz so leicht zugänglich ist wie die Bücher von Sievers, Jespersen und Trubetzkoy, sei seine Beschreibung der einschlägigen Prosodien (für das Hopi von Toreva) hier zitiert (1963:159, § 3): "Low syllables have only one length, short. Firm syllables may contain vowels of three lengths: long, and two varieties of short (or rather nonlong); medium, which is half-long with a decline of force before any following consonant, and clipped, which is short and staccato, interrupted at full force by the closure of the following consonant, and not occurring in word-final vowels." Jeanne (1982: 245) hat offenbar eine ganz andere Auffassung von diesen phonologischen Verhältnissen: "In the course of the discussion, I suggest an analysis of the two sorts of 'long vowel' (one with steady pitch, the other with falling tone) which appear in my Third Mesa speech." Ob es sich hier um einen Unterschied des Dialekts, der Generation oder der Theorie handelt, geht aus dieser

44

Anderson (1984: 88-95) hat einen Versuch unternommen, die für die Silbenschnitte im Hopi von Whorf und Trubetzkoy festgestellten Regularitäten im Rahmen der sogenannten metrischen Phonologie graphisch darzustellen. Das Problem ist dabei natürlich nicht die Vokallänge, die er als Doppelung des einfachen (kurzen) Vokals auffaßt, sondern die Opposition von scharfem und sanftem Schnitt auf Silben mit Kurzvokal. Anderson findet eine Lösung durch Ausnutzung der Möglichkeiten derjenigen internen Strukturierung der Silbe, die er aus dem Angebot der "metrischen" Phonologie ausgewählt hat: "According to this analysis, dose contact [Jespersens "fester Anschluß", der dem scharfen Schnitt entspricht] between a vowel and a following consonant corresponds to a syllable in which the consonant actually forms a part of the syllable nucleus; loose contact ["loser Anschluß", sanfter Schnitt] corresponds to a sequence of nuclear vowel plus nonnuclear consonant" (Anderson 1984:89). Darstellung nicht hervor. Auch Anderson (1984:90) setzt sich mit Jeanne 1982 nicht weiter auseinander, sondern befaßt sich ganz mit Trubetzkoys Darstellung. - Lyle Campbell, einer der besten Kenner der amerikanischen Sprachen, schreibt mir in einem langen Brief vom 14. November 1992 (aus dem Gedächtnis, wie er betont, aber deswegen kaum weniger zuverlässig), 1. daß die Whorfsche Beschreibung nicht mehr akzeptiert werde und 2. daß das Hopi zwei Sorten von Dialekten aufweise: "In the first there are simply CV (short), CV: (long), and CVh syllables (CV:h is impossible). In the other dialects these are CV, CV: (level pitch), and CV: (with falling pitch, from *CVh). I think that Laveme Jean's (1982) description [d.i. Jeanne 1982, T.V.] with pitch/tone is essentially right, then. Some of the things that complicate people's perception of this is that underlying and historically ealier V: gets shortened when not stressed, however, in the tone dialects *Vh becomes V: and is not shortened when not stressed, but also bears no pitch contrast, as stressed instances do - this might suggest to some three degrees of something or different kinds of non-falling V:. In sum, I think there is nothing very mysterious about Hopi syllables - it's the normal sort of thing one might expect to get in tonogenesis." Ich kann mich auf Campbells vielfältige Ausführungen, die auch weitere Sprachen umfassen, aus verschiedenen Gründen erst an anderer Stelle näher einlassen. Doch möchte ich mir schon hier zwei Hinweise erlauben: 1. Auch für das Standarddeutsche wird die Silbenschnittbeschreibung nicht mehr akzeptiert; ich versuche ja gerade, die Einsicht in ihre Richtigkeit wiederzubeleben, und wage deshalb zu hoffen, daß ein Erfolg dieser Theorie für das Deutsche auch zu einer Wiederbelebung der Whorf-Trubetzkoyschen Deutung des Hopi führen wird. 2. Die Einteilung der (einschlägigen) Silben jener Dialekte, zu denen offenbar - auf früherer Entwicklungsstufe - der von Whorf beschriebene Toreva-Dialekt gehört, in CV (kurz), CV: (lang) und CVh (nebst dem Hinweis, CV:h sei nicht möglich), bestätigt mich eher in der Ansicht, daß Whorf recht hatte; denn der CVh-Typus scheint mir nichts anderes zu sein als die scharf geschnittene CV-Silbe mit (möglicherweise bereits phonologisiertem) akkresziertem h, denn das h dürfte (zumindest ursprünglich) nichts anderes sein als ein angefügter minimaler glottaler "Landeplatz" für das Decrescendo der offenen scharf geschnittenen CV-Silbe (wie der Glottalverschluß am Ende von deutsch Da!, vgl. die Deutung von David Restle in Vennemann 1991b: 93, Fn. 12). Unter Berücksichtigung des Zeitfaktors und des Dialektunterschieds möchte ich den folgenden Entwicklungspfad ansetzen: /CV/ (mit scharfem Schnitt, ~ ) > [CVh] > /CVh/ > [CVh] (mit fallendem Ton, ~ ) > /CV:/ > /CV:/ (Tonverlust bei Akzentlosigkeit). - Im übrigen enthält Campbells Brief keineswegs in erster Linie Kritikpunkte und Caveats, sondern Literaturhinweise und Kontaktadressen sowie die Anregung, die Frage der Silbenschnitte im größeren Zusammenhang von Globalisierungen (z.B. Stod im Dänischen) und Tonogenesis in mehreren Sprachen weiter zu untersuchen.

45

Deutlicher als Worte zeigt Andersons Darstellung von Trubetzkoys Minimaltripel das Gemeinte. Dabei steht " " für Syllable, "O" für Onset 'Kopf, "R" für Rime 'Reim', "N" für Nucleus und "M" für Margin 'Koda'; ich füge am Fuß der Darstellungen in (43) meine Transkriptionen hinzu. (43)

(a)

(b)

(c)

0 N

R

R

/\

/\

N

M

a

s

N

M

/\

v*

a

'sehr1

s

p

p&s 'Feld1

a

a

s

'still'

Man muß anerkennen, daß die drei verschiedenen phonologischen Formen drei verschiedene graphische Darstellungen erhalten haben. Die Darstellungen sind auch in mindestens dreifacher Hinsicht nicht unplausibel. Erstens drückt (a) im Vergleich mit (b) aus, daß der silbenschließende Konsonant beim "festen Anschluß" dem Vokal näher steht als beim "losen Anschluß", nämlich mit ihm unter einem und demselben Knoten vereinigt ist. Zweitens - darauf weist Anderson selbst hin - erkennt man sofort, weshalb, wie es in Trubetzkoys Beschreibung (1939:176) festgestellt ist, die extrakurzen Vokale in Endsilben nicht möglich sind:20 Es ist dort kein Konsonant vorhanden, der wie in (a) unter den Nukleusknoten gehängt werden könnte. Drittens auch darauf weist Anderson hin - macht seine Darstellung den vierten Fall, die Verbindung von Langvokal mit "festem Anschluß" (scharfem Schnitt), von vornherein unwahrscheinlich: Es müßte dann zu den beiden Vokalen ein drittes Segment, der fest angeschlossene Konsonant, unter den Nukleusknoten treten, während das Hopi ansonsten, wie die meisten anderen Sprachen auch, nicht mehr als zwei Segmente im Nukleus zuläßt. Gleichwohl scheint mir diese Lösung nur "technisch" gelungen, nicht aber intuitiv ansprechend. Die Darstellung in (43.a) scheint mir in Andersons Rahmen eine plausible Darstellung für Langvokale (bei zwei identischen Vokalen) und für Diphthonge, und das meint er ja sicher auch, wenn er schreibt, daß die meisten Sprachen höchstens zwei Segmente (Langvokale und Diphthonge), nicht aber drei (Triphthonge) oder mehr Segmente im Nukleus zulassen. Es kann indes wohl keine Rede 20

Vgl. auch das Ende des Whorf-Zitats in Fn. 18.

46

davon sein, daß die Silbe des Wortes pas 'sehr' in einem einschlägigen Sinne diphthongisch sei; die entsprechende Silbe im Standarddeutschen (etwa in Paß oder Kompaß) ist es jedenfalls nicht.21 Während man über diesen Aspekt des Andersonschen Vorschlags vielleicht noch dikutieren kann, scheitert der Ansatz aber regelrecht gleich an Trubetzkoys zweiter Beispielreihe, die Anderson nicht behandelt. Ich sortiere sie in (44) nach ihren kritischen Eigenschaften in Kolumnen: (44)

Kurzvokal scharfer Schnitt

Kurzvokal sanfter Schnitt

frai'Nuß' qalä 'Schneide'

teoä 'etwas werfen' stue'Behälter'

Langvokal sanfter Schnitt

qä:lä 'Blatte' siVi^'Holzkohle'

Wie will Anderson tevä 'Nuß' und qälä 'Schneide' darstellen? Nach universeller Syllabierungsregel gehört ein einzelner intervokalischer Konsonant zur zweiten Silbe. Gleichwohl braucht Anderson diesen Konsonanten im Nukleus der ersten Silbe, weil das seine Definition des "festen Anschlusses" (des scharfen Schnitts) ist. Die Darstellung von tevä'Nuß' müßte also bei ihm wie in (45) aussehen.

(45) O

R N

te v

'Nuß1

Dieses Schreckensbild hat Anderson uns aber wohl ersparen wollen. In der Tat müssen solche Repräsentationen prinzipiell aus jeder phonologischen Theorie ausgeschlossen werden: Es kann nicht ein Sprachlaut gleichzeitig zum Nukleus der einen 2l Übrigens hat das Hopi [von Toreva], wie Trubetzkoy (1939: 176) ausdrücklich sagt, keine Diphthonge.

47

Silbe und zum Kopf der nächsten Silbe gehören. Ambisyllabizität muß prinzipiell auf Elemente der Schale (Kopf und Koda) beschränkt bleiben. Alle diese Aporien verschwinden, wenn wir nun die Hopi-Wörter in der oben entwickelten Silbenschnittphonologie darstellen. Zunächst zeigt (46) Trubetzkoys Minimaltripel; zugleich ist gezeigt, warum die "extrakurzen" Vokale nicht in offenen Silben am Wortende erscheinen (Trubetzkoy 1939:176, Whorf 1963:159, § 3): Die Definition des scharfen Schnitts würde dort zu einer defekten Silbe führen. (46) /7^'sehr 1

·*^



a

'Feld1

·. ^ -

\ p

pfs

s

pi;s 'still1

- . ^ ·

- . ^ ·

/

1 &

A B E R : * po

s

p

Va

1

\

s

In (47) [auf der folgenden Seite] ist links teva 'Nuß', rechts teva 'etwas werfen' dargestellt. Wie man sieht, ist die Darstellung für den Fall der Erzeugung des scharfen Schnitts auf einer offenen Silbe unvollständig. Das liegt daran, daß aus Whorfs und Trubetzkoys Beschreibungen nicht hervorgeht, wie dieser Fall im Toreva-Hopi phonetisch gelöst ist. Die Theorie sagt zwei Lösungsmöglichkeiten voraus: Ambisyllabizität, nämlich Gelenkbildung, oder aber die Einfügung eines Minimalkonsonanten, etwa h, als "Landeplatz" für das Decrescendo, vgl. (47).22

22

Daß in diesem Fall h als Minimalkonsonant eingefügt würde, schließe ich aus den Angaben von Lyle Campbell, vgl. oben Fn. 19. Die Einfügung wäre, wie dort beschrieben, vielleicht zuerst nur phonetisch, eine Desonorierung der zweiten Hälfte des Vokals, später dann phonologisiert und quantitätsrelevant, wie der Übergang zum Langvokal in den anderen Dialekten zeigt.

48

tevt 'Nuß'

(47)

' etwas werfen'

A I / V A/A/ e

v

'Nuß1

tev

(47')

e

v

iev& 'Nuß1

A W A \ A/ t

v

t

Der Effekt der Extrakürze - der scharf abgeschnittenen ["clipped"] bzw. StaccatoQualität - des Gipfelvokals würde durch die eine wie die andere Lösung hervorgerufen. - Der Vollständigkeit halber zeige ich in (48) [auf der folgenden Seite] den Gegensatz von Lang- und Kurzvokal in der sanft geschnittenen Erstsilbe von Zweisilblern.

49

ve 'Behälter1

(48)

• .

.

·

/

^

·

·

^

.

si:ve 'Holzkohle'

^

/

H

*>

->*

h



—».



/ e

Ebenfalls der Vollständigkeit halber sei dargestellt, was es bedeuten würde, den vierten Fall der Kombination aus Vokalquantität und Silbenschnitt zu konstruieren, den es im Hopi nicht gibt: Langvokal und scharfen Schnitt. Da die zweite Hälfte eines Langvokals natürlich ungeeignet ist, die erste Hälfte abzuschneiden, hierzu vielmehr nur ein vom Gipfelsprachlaut verschiedener Sprachlaut, in der Regel ein Konsonant geeignet ist, müßte dieser Sprachlaut im Falle eines hypothetischen pa:s das /s/ sein. Der scharfe Schnitt ist definiert durch das Auseinander laufen der kritischen Verbindungslinien. Die kritischen Verbindungslinien sind definiert als die letzte Verbindungslinie vom Crescendo zum Zeitpfeil und die erste Verbindungslinie vom Decrescendo zum Zeitpfeil. Die zweite kritische Verbindungslinie - fett gezeichnet - müßte also vom Decrescendo zum Konsonanten laufen, der auf den Gipfel folgt, die erste kritische Verbindungslinie - ebenfalls fett gezeichnet - müßte parallel zur zweiten laufen; der Gipfel müßte demnach in der zweiten Hälfte des Langvokals liegen, vgl. die Darstellung des hypothetische Beispiel in (49) [auf der folgenden Seite]. Dies ist zwar zeichnerisch möglich. Gleichwohl dürfte dieser vierte Fall, die Kombination von Langvokal und scharfem Schnitt, wegen des Erfordernisses, die Energieausgabe über einen Langvokal hinweg ständig zunehmen zu lassen, nicht häufig vorkommen. Im Hopi kommt er jedenfalls wie auch im Deutschen nicht vor.23

Möglicherweise kommt er in bestimmten mittelamerikanischen Sprachen vor; vgl. Rensch 1978. Ich gehe darauf in Vennemann i.E. kurz ein.

50

(49)

->.

pie&no cla&ve > chia&ve ne&bu&la > neb&la > neb&bia b. Vom Vulgärlatein zum Italienischen: Epenthese eines Halbvokals in Vokalsequenzen: Pa&du&a > Pa&do&va vi&du&a > ve&do&va ru&i&na > ro&vi&na etc. c. Vom Sanskrit zum Pali: Vereinfachung anlautender Konsonantenverbindungen: sro&tas > so&ta 'Strom' svap&na > sop&pa 'Schlaf praj&na > pan&nä 'Wissen* etc. Leider gibt es aber wahrscheinlich ebenso viele Gegenbeispiele, in denen ein Sprachwandelprozeß die nicht-präferierten Strukturen ergibt, also z.B. anlautende Konsonantenverbindungen, oder schwächere anstelle von stärkeren Silbenanstiegen. Einige Beispiele dafür finden sich unter (3):

58

(3) Beispiele für 'Verschlechterung' des Silbenanstiegs im Sprachwandel a. Vom Mhd. zum Nhd.: Verlust zwischenvokalischer Halbvokale (im Hiatus): hou&wen > hau&en b u&wen > bau&en scs&jen > sä&en etc.

b. Vom Vulgärlatein zu den westl. romanischen Sprachen: Erweichung inlautender Konsonanten, etwa im Provenzalischen: vi&ta > vi&da

a&mi&ca > a&mi&ga Ste&pha&nus > E&ste&ve etc. c. Vom Vulgärlatein zum Romagnolo (Dialekt der Emilia Romagna): Bildung anlautender Konsonanten Verbindungen (Mayerthaler 1982) dominica > dmenga hospitale > zbdel levare > (a)lve'r etc. d. Vom Französischen zumfranfais avance: Bildung anlautender Konsonantenverbindungen peut etre > ptetre petit > ptit chemin > chmin Dieselbe Beobachtung läßt sich für das Coda Law machen. Auch hier finden wir zwar problemlos Beispiele, die der Vorhersage entsprechen (vgl. (4)), aber ebenso problemlos Gegenbeispiele (vgl. (5)).

(4) Beispiele flir Optimierung des Silbenabfalls a. Vokalisierung des (mhd. bzw. std.) auslautenden /!/ im Bairischen: hal&ten > [hoj.dn] WaW>[vojdJ

stellen ([Jtsln]) > [Jdoejn] b. Vereinfachung silbenauslautender lateinischer Konsonantenverbindungen im (Std.-italienischen: sex&tu > ses&to iunxi > giun&si punc&tu > pun&to etc.

59

(5) Beispiele gegen die Optimierung des Silbenabfalls a. Vom Ahd. zum Mhd. und vom Mhd. zum Nhd:. Nebensilbenschwächung und Bildung von Konsonantenverbindungen ni&mis > nimmst hü&ti > haut ri&chi&tuom > rich&tuom lo&be&te > lob&te hü&beschlhö&vesch > hübsch kin&de&lin > kind&lein

b. Vom Vulgärlatein zum Piemontesischen: Auslautverstärkung (Mayerthaler 1982) bo&nu> borjb> bofji> bok tem&pu > teijk&po se&ra > sej&ra etc. Es scheint also, daß Silbenpräferenzgesetze nicht universal gültig sind. Das ist an sich nicht verwunderlich, denn Präferenzgesetze sind nun einmal keine Gesetze und durch Gegenbeispiele nicht ohne weiteres zu widerlegen. So könnten abweichende Fälle durch historische oder soziale Einzelentwicklungen bedingte oder sogar normierte Sprachspezifika sein. Die Beispiele sprechen jedoch gegen eine solche Erklärung als kulturell überformte, 'unnatürliche' Formen: es gibt vielmehr keinen Anlaß, die genannten 'Ausnahmen' als weniger 'natürlich' einzustufen als die präferenzkonformen Beispiele. Eine weitere Möglichkeit zur Erklärung der Abweichungen von Vennemanns Silben-Präferenzgesetzen (die von ihm selbst auch berücksichtigt wird) ist ihre Interaktion mit anderen phonologisehen Präferenzen. Eine solche Interaktion scheint es nun tatsächlich zu geben, und zwar mit Präferenzen auf der Ebene des phonologischen Wortes.

2. Wort- und Silbensprachen: eine typologische Perspektive Der hier vertretenen Hypothese zufolge setzen sich Silbenpräferenzgesetze nur in einem phonologischen Typus von Sprache gegen wortbezogene phonologi sehe Präferenzen durch; diesen Typus will ich - in Anlehnung an Donegan/Stampe (1979) Silbensprachen nennen (und sie von Wortsprachen abgrenzen). Demzufolge zeigen die Gegenbeispiele nicht, daß Vennemanns Präferenzgesetze falsch sind, sondern vielmehr, daß sie charakteristische natürliche Tendenzen zusammenfassen, die für einen phonologischen Sprachtyp dominant sind: Das Mittel- und Neuhochdeutsche, das Proven9alische und die italienischen Dialekte der Emilia Romagna und des

60

Piemont sind Wortsprachen oder zeigen eine Tendenz in diese Richtung, während Standarditalienisch oder Pali Silbensprachen sind. Um den Gegensatz zwischen Silben- und Wortsprachen zu verdeutlichen, ist es sinnvoll, in Anlehnung an die Prosodische Phonologic von Nespor/Vogel (1986) eine Hierarchie prosodischer Kategorien vorzusehen. Diese Hierarchie schließt die Silbe mit ein, es gibt jedoch sowohl darunter eine weitere prosodische Kategorie (nämlich die More), als auch darüber eine Reihe größerer Kategorien (zu den wichtigsten davon gehören das phonologische Wort und die Intonationsphrase).1 Jede der prosodischen Ebenen in der Hierarchie ist phonologisch definiert; ihre Existenzberechtigung bezieht sie also aus der Tatsache, daß zum Beispiel prosodische Phänomene wie Akzent oder Dauer, phonotaktische Phänomene oder auch phonologische Regeln sie benötigen. Jede Ebene der Hierarchie hat Verbindungen zur Morphologie bzw. Syntax, ist jedoch prinzipiell autonom. Sprachen unterscheiden sich sich dadurch, welche dieser Kategorien sie zur prosodischen Hauptkategorie machen. Die sprachspezifische Fixierung dieses Parameters ist für die jeweilige Phonologie eine zentrale Angelegenheit, die sich in zahlreichen Epiphänomenen niederschlägt. Oder umgekehrt formuliert: Um festzustellen, welche der prosodischen Ebenen für eine Sprache die Hauptkategorie stellt, ist zu fragen, um welche prosodische Kategorie sich die phonologisehen Regelmäßigkeiten der Sprache verdichten. Die Wahl der prosodischen Hauptkategorie kann folglich mehr oder weniger eindeutig ausfallen, je nach Anzahl der phonologischen Regelmäßigkeiten, die darauf bezug nehmen; es kann Sprachen geben, in denen zwei Kategorien in Konkurrenz stehen. Die Wahl einer Hauptkategorie impliziert außerdem natürlich nicht, daß die übrigen Kategorien völlig ohne Bedeutung sind; ihre Bedeutung ist lediglich geringer als die der Hauptkategorie. Es ist aber auch möglich, daß bestimmte prosodische Kategorien in einer Sprache keinerlei Rolle spielen. Nun ist es nicht unplausibel zu vermuten, daß für viele Sprachen die prosodische Hauptkategorie die Silbe ist. Diese Silbensprachen folgen der Teleologie der optimalen CV-Silbe, maximieren den Silben-Anstieg und minimieren den Silben-Abfall, zeigen gut formulierbare phonotaktische Strukturbedingungen, die für alle Silben der Sprache gelten, optimieren die Silbenstruktur gemäß den Vennemannschen Präferenzgesetzen im Lauf des Sprachwandels, weisen prosodische Phänomene wie Ton oder Akzent der Silbe zu, und ermöglichen es ihren Benutzer/-innen durch die Nespor/Vogel (1986:16) sehen bekanntlich die folgenden prosodischen Domänen vor: Silbe, Fuß, phonologisches Wort, klitische Gruppe, phonologische Phrase, Intonationsphrase und phonologische Äußerung. Sie kennen also keine More. Daß diese Domänen notwendigerweise in jeder Sprache vorhanden sind und gerechtfertigt werden können, scheint mir jedoch eine angreifbare Behauptung.

61 Klarheit der einschlägigen Regeln und Strukturen die Silbe als psychisch reale Kategorie wahrzunehmen und zu verarbeiten. Zu dieser (möglicherweise der Standard-) Lösung bei der Wahl einer prosodischen Hauptkategorie gibt es jedoch Alternativen. Die wichtigste ist, eine größere Hauptkategorie zu wählen, die stärker an die morphologische Einheit des Worts gebunden (wenn auch keineswegs mit ihr identisch) ist. Ich werde mich mit dieser Alternative im folgenden befassen. Zu dem durch sie bestimmten Sprachtyp der Wortsprachen gehören z.B. das Deutsche und das Englische, aber auch Sprachen aus völlig anderen genetischen Sprachgruppierungen, wie ich gleich anhand des Tamang und des !xoö zeigen werde.2 Vorauszuschicken ist eine Bemerkung zur Definition des phonologischen Wortes. Die Extension des phonologischen Wortes ist Resultat der in einer Sprache geltenden Regeln und Strukturen. Sie kann demzufolge sowohl größer sein als das morphologische Wort (etwa im Fall der Hinzunahme kl i tischer Elemente) als auch kleiner. In einer Sprache mit demarkativem Wortakzent wird dieser selbstverständlich wesentlich zur Definition des phonologischen Wortes beitragen (das phonologische Wort trägt in einer solchen Sprache genau einen Akzent). Eine allgemeingültige Definition läßt sich jedoch nicht geben; notwendige Bedingung ist lediglich, daß es sich um eine phonologisch relevante Kategorie handelt, deren Extension unter Rekurs auf das morphologische Wort sprachspezifisch bestimmt wird.

3. Jxoo und Tamang als Wortsprachen Zunächst zwei relativ 'exotische' Beispiele für Wortsprachen, die zeigen sollen, daß die Unterscheidung zwischen Silben- und Wortsprachen nicht nur aus eurozentrischer Perspektive Sinn macht. Das !xoö ist eine Khoisan (Buschmann)-Sprache, die im Südwesten von Botswana und in Namibia gesprochen wird. Die phonologischen Eigenschaften, auf

Neben der Silbe und dem phonologischen Wort als prosodischen Hauptkategorien wird im Fall der Morensprachen behauptet, daß hier die More als Hauptkategorie fungiere (vgl. zur Diskussion Auer 1991); das Japanische wird oft als Beispiel genannt. Es gibt außerdem natürlich zahlreiche Sprachen, die anstelle des phonologischen Wortes auf eine andere größere prosodische Ebene bezug nehmen, z.B. den Fuß oder die phonologisches Phrase (etwa: Yidüi und West-Grönländisch). Allerdings scheint in diesen Sprachen doch die Silbe die Hauptkategorie zu sein.

62 die ich mich hier beziehe, teilt es mit den anderen Khoisan-Sprachen, zum Beispiel mit dem Nama (Hottentot).3 Im ! ist das phonologische Wort mit dem morphologischen Stamm identisch. Suffixe (andere Affixe gibt es nicht) zählen nicht zum phonologisehen Wort. Das phonologische Wort erweist sich aufgrund der folgenden phonologi sehen Phänomene als prosodische Hauptkategorie, die direkt darauf - und nicht auf die Silbe, die in der Phonologic des ! keine Rolle spielt, kleinere Einheit ist die More bezug nehmen: 1) Tonzuweisung. Das Inventar von Tonmustern, das auf die einzelnen Moren im Wort verteilt wird, umfaßt //, M-level, L und M-falling. In einem phonologi sehen Wort kommen aber nur Sequenzen von identischen Tönen vor. Dies zeigt, daß der lexikalische Ton auf das phonologische Wort als prosodische Einheit projiziert wird, nicht auf die Silbe. (Die Beispiele unter (6) machen deutlich, daß die Töne nicht auf Silben, sondern nur auf phonologi sehen Wörtern distinktiv sind; phonemisch stehen sich jeweils ein- und zweisilbige Wörter gegenüber. Suffixe haben einen eigenen Ton, obwohl sie einsilbig sind. Sie können wegen ihrer spezifischen Phonotaktik nicht als eigene phonologische Wörter analysiert werden, sondern eher als wortexterne Elemente.) (6) Mögliche Tonmuster im !xoö(nus: Traill 1985:34) (i) H-Ton CV: /|qhu :/ 'white person'

CVCV /!ula/ 'quiver'

(ii) MF-Ton CVN /Oum/ 'sleep' (n.)

CV?V /sa?ä7 'seed'

(iii) M-Ton CV?N /||uh?u/ 'bird'

CV?CV /?!noh?li/ 'mist'

(iv) L-Ton CV: /so:/ 'medicine'

CVV /tshoa/ 'brand' (n.)

2) Phonotaktik. Das phonologische Wort hat eine spezifische Struktur, die durch Abnahme der phonologi sehen Information und der phonologischen Stärke von links nach rechts gekennzeichnet ist.

3

Für das !xoö liegt eine umfangreiche und kompetente Darstellung der Phonetik und Phonologic von Traill (1985) vor; für das Nama finden sich die entsprechenden Informationen in älteren Untersuchungen von Meinhof (1909), Beach (1938) und besonders Vedder (1938).

63 a) Jedes phonologische Wort besteht aus zwei Moren. (Die phonetische Silbenzahl kann hingegen zwischen l und 3 schwanken, was teils daher rührt, daß phonemisch V?, also glottalisierte Vokale, phonetisch zweigipflig realisiert wird, nämlich V^V. Suffixe sind einmorig.) Vgl. dazu (7): (7) Segmentale und Morenstruktur des phonologischen Wortes im !xoo

c

Tu

C C C

Uj Uj U^

C

UJMJ

;

C C

UJMJ U?Uj

C

N Uj

/b, dU,m, r> l/

Uokale, Nasaluokale, Nasale

alle Konsonantenphoneme (ca. 119)

alleUokalphoneme (44)

C

n,

Uj Uj N

Beispiele für die einzelnen Typen finden sich unter (6). Zu beachten ist, daß die völlig regelmäßige phonotaktische Struktur des !xoö als solche nur beschreibbar ist, wenn die prosodischen Kategorien phonologisches Wort und More zur Verfügung stehen. Die Kategorie Silbe ist hingegen nutzlos. (b) Die einzelnen Positionen im unter (7) skizzierten Wortschema unterliegen massiven segmentalen Restriktionen, und zwar von links nach rechts zunehmend. So zentrieren sich in der wort-initialen C-Position die meisten phonemischen Oppositionen; in ihr (und nur in ihr) kommen die für die Khoisan-Sprachen typischen Schnalzlaute vor. Von ihnen gibt es fünf, die aber fast alle mit 16 verschiedenen sog. Begleitern kombinierbar sind; da neben den Schnalzlauten weitere 50 Konsonantenphoneme nachweisbar sind, ist in der Initialposition im Wort die gigantische Anzahl von etwa 120 distinktive Kontrasten möglich. In der ersten (und gegebenenfalls einzigen) Vokalposition kommen fünf Vokale vor, die kurz oder lang, pharyngalisiert, glottalisiert, gehaucht (breathy) oder nasaliert sein können. Auch manche Kombinationen aus diesen Sekundärartikulationen sind möglich. All diese Kontraste sind ebenfalls phonemisch, d.h. auch in der zweiten Position im Wort, der ersten Vokalposition, steht eine enorme Menge von phonemischen Kontrasten zur

64

Verfügung. In der inlautenden Konsonantenposition findet man hingegen lediglich /b,dy,m,n,rj,l/; in der phonemisch zweiten Vokalposition lediglich die einfachen oder nasalierten Vokale (wobei noch vokalharmonieähnliche Restriktionen gelten); schließlich sind auslautende Konsonanten überhaupt nur in Einsilblern zugelassen und können nur Nasale sein. (Vgl. das Schema unter (7).) Es ist umgekehrt klar, daß dieser sehr regelmäßigen Wortstruktur keine einheitliche Silbenstruktur entspricht. Diese ist vielmehr von der Position im phonologischen Wort abhängig. Das !xoö repräsentiert den interessanten Fall einer Tonsprache ohne oder zumindest ohne deutlichen, vom Ton unabhängigen Wortakzent4, die trotzdem (anders als die meisten Tonsprachen) eindeutig eine größere Einheit als die Silbe in das Zentrum ihrer Phonologic stellt. Dasselbe gilt auch für das zweite Beispiel, nämlich das Tamang, einer mit dem ! in keiner Weise verwandten tibetobirmanische Sprache aus Nepal. (Ich folge der Beschreibung von Mazaudon 1973). Im Gegensatz zum ! ist das phonologische Wort im Tamang weitgehend mit dem morphologischen identisch, d.h., es umfaßt mögliche Suffixe mit. Komposita zählen jedoch als zwei Wörter. Hier beobachtet man die folgenden S trukturregelmäß igkeiten:

wortbezogenen

Prozesse

und

a) Es gibt keinen Wortakzent, das phonologische Wort ist aber durch die Tonzuweisung eindeutig gekennzeichnet: nur die erste Silbe eines Wortes ist Träger lexikalischer (distinktiver) Töne, die dann auf den folgenden Rest des Wortes ausgedehnt werden. Suffixe sind (im Gegensatz zum !xoö) ebenfalls (zugrundeliegend) tonlos. Es gibt vier Töne, wobei die beiden tiefen Töne nur auf phonetischen Hauchvokalen vorkommen. (Beispiele unter (8).) (8) Mögliche Tonmuster auf den phonologischen Wörtern im Tamang (nach Mazaudon 1973) (a) Einsilbler /ltsha:/ 'etre trop sale' ßt&a:/ Vetablir' /3tse:/ 'etre beau' i'.l 'penser, se rappeler'

Der von Meinhof (1909) konstatierte angebliche deutliche Emphaseakzent ist laut Beach (1938) mit dem Hochton identisch.

65

(b) Zweisilbler Alaipa/ 'vent' /2la:pa/ 'se cacher' /3tsatsa/ 'petit' /4lapa/ 'grande trompe' (c) Dreisilbler (als Verba simplicia selten nativ) /itarija/ 'patron' (Entlehnung aus dem Nepal.) /2philaNko/ 'etincelle' Pperere/ (redupl.) 'douleur ä l'interieur d'un muscle, crampe' 'porteur' (Entlehnung aus dem Nepal.) b) Die Silbenstruktur der ersten und nicht-ersten Silben im phonologi sehen Wort ist verschieden. Besonders opponieren nur in der ersten Silbe lange und kurze Vokalphoneme. In dreisilbigen Wörtern werden manchmal die medialen Silben reduziert bzw. getilgt; vgl. (9). (9) /4seterek/ 'defeuiller' /!apa+Ia/ 'du pere' /2ai+ni 3kate+la/ 'de vous autres' (Mazaudon 1973:59f.)

-> [setrek] — > [apla] — > [ainikatla]

c) Das phonologische Wort ist die Domäne, innerhalb derer Assimilationen und Dissimilationen stattfinden. Durch eine Wortgrenze werden diese Prozesse hingegen blockiert. Zu den Assimilationen gehört z.B. die progressive Liquidassimilation in Suffixen wie /la/ (Genetiv oder hypothetisches Futur), cf. (10): (10) Liquidassimilation im Tamang (Mazoudon 1973:50) /1kan+la/ 'de la nourriture' (Gen.) — > ^pin+la/ 'il donnera' (Futhypoth.) — > aber: */fry:?e?9/ /art+ig/ — > */art?ik/ /ist+er/ —

14

Vgl. zum gleichen Verhalten von Suffixen und Enklitika auch: köstlich, sahnig, kauf ich. (Werbespruch, 1991)

71

in den meisten Regional standards (außer z.B. dem schweizerdeutschen) kaum möglich bei Präfixen, Präklise und in Komposita: /ab#art/ —> /ab&?art/, /ap&?art/ (* /a&'part/) /fer+axtn/ —> /fteTaxtn/ (* /fe&'randa/ Veranda) /der+andörs/ —> /dB?and9re/ (* /dary:be/) /noi+ank0mliry —> /nDi?ank0mlir/ (??/noiank0mliry) Die Beispiele zeigen, daß es im Standarddeutschen eine Hierarchie von Junkturen gibt: innerhalb des Wortstammes plus seiner meisten Suffix-Erweiterungen sind Assimilationen und Resilbifizierungen am häufigsten und meist obligatorisch. Allerdings gibt es eine Anzahl von Suffixen wie -keit, -schaß, -bar u.a., die sich wie Bestandteile von Komposita verhalten. Sie gehören also offensichtlich nicht zu der durch Stamm plus Suffixe definierten phonologischen Einheit. An der morphologischen Grenze zwischen Präfix und Stamm gelten hingegen wesentlich restriktivere Bedingungen. Über die Grenzen des morphologisehen Verbum simplex hinweg sind die meisten der genannten Prozesse im normalen Sprechtempo unmöglich. Die klitischen Erweiterungen verhalten sich uneinheitlich: Enklitische Elemente gehen eine engere phonologische Bindung an ihre Umgebung ein als präklitische (vgl. dazu auch Prinz 1991:112). Aus diesen Befunden ergibt sich zunächst einmal zweifelsfrei, daß oberhalb der Silbe weitere prosodische Kategorien notwendig sind. Solang man nur mit der Silbe als Kategorie operiert, lassen sich die skizzierten Regelmäßigkeiten nicht erfassen, denn Präfixe, Suffixe, Klitika und Wörter können alle einsilbig sein und von ihrer segmentalen Struktur her dieselben Bedingungen für Resilbifizierung aufweisen. Zusammen mit den genannten phonotaktisehen Kriterien und der Akzentuierung läßt sich aus der Analyse von Assimilationen und Resilbifizierung in einem zweiten Schritt das phonologische Wort des Deutschen definieren. Es setzt sich nach meiner Auffassung zusammen aus dem Stamm, den Präfixen, den meisten Suffixen (ausgenommen -heu, -keit, -bar, -lieh etc.) und den enklitischen Erweiterungen. Wie die Beispiele zeigen, ist es allerdings notwendig, unterhalb dieser prosodischen Hauptkategorie (also zwischen phonologischem Wort und Silbe) eine weitere, weniger zentrale zu postulieren, die die Präfixe und Präklitika nicht mit umfaßt; mangels etablierter Terminologie möchte ich hier vom prosodischen Stamm sprechen. 15 Für das Verhalten der Enklitika gelten außerdem mancherlei 15

Der Terminus 'Fuß', obwohl von manchen Phonologen und Phonologinnen verwendet, scheint mir wenig glücklich zu sein; weder reflektiert er die morphologische Basis der phonologisch-prosodischen Einheit, um die es hier geht, noch ist er mit dem phonetischen Begriff des Fußes kompatibel, der (eben genau umgekehrt) von der Morphologie gänzlich unabhängig ist.

72

Sonderbedingungen. Komposita und die morphologischen Bildungen mit wortwertigen Suffixen bestehen auf jeden Fall aus mehreren phonologischen Wörtern.16 All die genannten Argumente sprechen dafür, dem phonologischen Wort (teils auch dem phonologischen Stamm) im Deutschen eine zentrale Rolle zuzusprechen, eine Rolle, die mit der für das Tamang und für das !xoö skizzierten durchaus vergleichbar ist.

5. Evidenz für die Silbe im Deutschen? Um zu belegen, daß im Deutschen das phonologische Wort die prosodische Hauptkategorie ist, muß natürlich nicht nur gezeigt werden, daß diese Kategorie die Domäne für phonologische Prozesse und phonotaktische Regelmäßigkeiten ist, sondern auch, daß mögliche Prozesse, die sich auf die Silbe beziehen, jenen an Bedeutung oder Häufigkeit unterlegen sind. Welche Evidenz für die Notwendigkeit der prosodischen Kategorie Silbe gibt es also im Deutschen? Unter den Regelmäßigkeiten des Deutschen, die in der phonologischen Literatur unter Bezug auf die Silbe beschrieben bzw. als Evidenz für die Relevanz der Silbe genannt werden, kann man drei Gruppen unterscheiden: Phänomene, die tatsächlich zurecht so beschrieben werden, Phänomene, die fälschlicherweise so beschrieben werden und Prozesse, deren Anwendungsdomäne variabel ist und die unter Rekurs auf die Silbe alleine nur unzureichend beschrieben sind. Ich will für die drei Gruppen jeweils nur einige Beispiele geben. Zur ersten Gruppe gehört die r-Vokalisierung. Sie ist - in den Varietäten und Standardvarietäten des Deutschen, die die r-Vokalisierung überhaupt zulassen bzw. fordern, also z.B. nicht für die schweizerdeutsche Variante des Standarddeutschen auf /r/ in der Coda beschränkt. Silbenanlautende /r/ können dagegen nicht vokalisiert werden (vgl. Bernbure vs. Bären [bc.R9n]).17 16

17

Der Grund dafür, daß ich den Begriff des phonologischen Wortes für eine Einheit reserviere, die die Präfixe mit umfaßt, liegt darin, daß die Gleichung "ein phonologisches Wort = ein Akzent" nicht durchbrochen werden sollte. Unbetonte Präfixe wie be-, ver- verhalten sich von ihrer Akzentstruktur her, aber auch von ihrer Phonotaktik her wie unakzentuierte Nebensilben innerhalb des Wortes und sollten deshalb auch so beschrieben werden. (Für die wortwertigen Suffixe, die einen Nebenakzent tragen, gilt das nicht.) Auch ambisilbische /r/ verhalten sich wie heterosilbische (silbeneinleitende) (vgl. die Beispiele unten, hochgestelltes & symbolisiert Ambisilbizität des Folgekonsonanten). Ein Problem sind hier Fälle zwischen zwei Schwa: hier wird trotz Ambisilbizität sowohl resilbifiziert als auch vokalisiert.

73 Die Akzentregeln des Deutschen nehmen in gewisser Weise ebenfalls auf Silben ihre Position im Wort und ihre Schwere - bezug, auch wenn die Akzentuierung im Deutschen in erster Linie morphologisch (von morphologischen Grenzen, besonders der Wortgrenze) und lexikalisch bestimmt ist (vgl. Eisenberg 1991, Vennemann 1991). Zur zweiten Gruppe, nämlich den Regelmäßigkeiten, die von manchen Phonologen fälschlicherweise mit der deutschen Silbe in Verbindung gebracht werden, gehört die Verteilung der Frikative [9] und [x]. Bailey (1978:5) legt zum Beispiel den velaren Frikativ zugrunde und behauptet, daraus ließe sich nur innerhalb der Silbe der palatale ableiten. Abgesehen davon, daß die genauere Analyse der Verteilung der beiden Laute nahelegt, eher den palatalen Laut zugrundezulegen, ist die Beschränkung der Assimilation auf die Domäne der Silbe falsch bzw. sie führt zu völlig unplausiblen Silbifizierungen wie etwa

(18) /psy:&