175 119 73MB
German Pages 231 [232] Year 1988
Linguistische Arbeiten
206
Herausgegeben von Hans Altmann, Herbert E. Brekle, Hans Jürgen Heringer, Christian Rohrer, Heinz Vater und Otmar Werner
Thomas Berg
Die Abbildung des Sprachproduktion sproze s ses in einem Aktivationsflußmodell Untersuchungen an deutschen und englischen Versprechern
Max Niemeyer Verlag Tübingen 1988
For Joe
who has made me aware of the real problems
Gedruckt mit Hilfe von Forschungsmitteln des Landes Niedersachsen
CIP-Titelaufnahme der Deutschen Bibliothek Berg, Thomas : Die Abbildung des Sprachproduktionsprozesses in einem Aktivationsflußmodell: Unters, an dt. u. engl. Versprechern /Thomas Berg. — Tübingen: Niemeyer, 1988 (Linguistische Arbeiten ; 206) NE:GT ISBN 3-484-30206-2
ISSN 0344-6727
Max Niemeyer Verlag Tübingen 1988 Alle Rechte vorbehalten. Ohne Genehmigung des Verlages ist es nicht gestattet, dieses Buch oder Teile daraus photomechanisch zu vervielfältigen. Printed in Germany. Druck: Weihert-Druck GmbH, Darmstadt.
Vorwort
Obwohl diese Arbeit über weite Strecken einen Alleingang darstellt, ist eine Reihe von Leuten an ihrem Zustandekommen maßgeblich beteiligt. Ihnen allen voraus mein Doktorvater Prof. Ernst Burgschmidt, der mir mit seiner Aufforderung zum Promovieren einen geheimen Wunsch erfüllte. Er hat mir in den drei Jahren des Projekts stets die gedankliche Freiheit gewährt, die ich für die Entwicklung meiner zum Teil etwas unkonventionellen Ideen so sehr benötigte, ohne es dabei jedoch zu versäumen, dort Kurskorrekturen vorzunehmen, wo ich mich in zu abstrakten und damit letzten Endes nichtssagenden Konzepten verlor. Nicht weniger grundlegend war die zeitweilige finanzielle Hilfe meiner Eltern, ohne die ich nicht die Möglichkeit gehabt hätte, dieses Vorhaben in einem überschaubaren zeitlichen Rahmen, wenn überhaupt, zu vollenden. Im Laufe der Jahre stellte sich ein reger Briefkontakt mit einer Anzahl von Psycholinguisten ein, die mit mir die Faszination an Versprechern teilen. Die Intensität der Korrespondenz war dabei proportional zu der Relevanz, die ihre Beiträge für meine Theoriebildung besaßen. Sie alle haben in entscheidendem Maße dazu beigetragen, daß ich mich in eine für einen Linguisten recht exotische Gedankenwelt hineinversetzen und dort heimisch fühlen konnte. Namentlich sind in diesem Zusammenhang mindestens Trevor Harley, Gary Dell, Eric Keller und Marcel van den Broecke zu nennen. Zwei weitere Personen verdienen, dabei besonders hervorgehoben zu werden. Michael Motley hat mich nicht verdammt, als ich mit seiner Theorie ins Gericht ging. Er bewies im Umgang mit unbequemen Daten und ihrem Lieferanten eine Souveränität, von der ich nur hoffen kann, daß sie sich bei der Rezeption dieser Arbeit auch auf mich überträgt. Bei Joe Stemberger war es genau umgekehrt: Hier war er es, der fast nie mit dem einverstanden war, was ich sagte. Seine Worte waren oft schmerzlich; aber keiner hat es besser als er verstanden, in einer wahren Flut von Briefen meinen Blick für die wesentlichen Probleme zu schärfen und mir eine theoretische Perspektive zu eröffnen, innerhalb welcher ich meine Gedanken organisieren konnte. Er hat auf diese Weise den inhaltlichen Grundstock zu dieser Arbeit gelegt. Last but not least möchte ich einige Personen erwähnen, die mir bei ganz konkreten Einzelproblemen zur Seite standen. Hierzu zählt meine Frau beim Korrekturlesen, Winfried Böer bei der Durchführung einer Parallelanalyse, als mir bei meinen Ergebnissen Zweifel an mir selbst kamen und Manfred Kreutz, der sich die Mühe machte, sich in ein für ihn fremdes Gebiet hineinzudenken, als ich mich mit der Lösung statistischer Probleme schon fast allein gelassen sah. Allen Erwähnten und einigen mehr gilt mein herzlicher Dank. T.B., im August 1985
VI
Vorwort zur Drucklegung
Das vorliegende Buch ist die überarbeitete Fassung meiner im Sommer 1985 eingereichten Dissertation. Die erfolgten Veränderungen sind vornehmlich auf Verbesserungsvorschläge einer Reihe von Lesern zurückzuführen. Dazu zählen zunächst meine beiden Referenten, wobei mich Dieter Cherubims detaillierte Randbemerkungen vor einer Vielzahl unklarer Formulierungen und stilistischer Mängel bewahrten. Als bereitwilliger Ansprechpartner in statistischen Fragen machte mir Georg Schön deutlich, welche Unzahl an Bedingungen erfüllt sein muß, bevor man von einem statistisch einwandfreien Verfahren sprechen kann. Daß sich in einigen Tabellen Fehler eingeschlichen hatten, war Gary Dell aufgefallen. Beim Korrekturlesen halfen mir meine Eltern und Evelyn Schade. Dankbar bin ich neben den Genannten auch den Herausgebern der Linguistischen Arbeiten, Otmar Werner und Hans Altmann, für die wohlwollende Aufnahme meiner Arbeit in diese Reihe. T.B. im September 1987
VII Inhaltsverzeichnis
Seite 1. 2. 3. 4. 4. 4. 4. 4. 5. 6.
1. 2. 3. 4.
7. 8. 8. 1. 8. 2. 9. 9. 9. 9. 9. 9. 9. 9. 9. 9. 9. 9. 9. 9. 9. 9. 9. 9.
1. 1.1. 1.1.1. 1.1.2. 1.1.3. 1.2. 1.3. 1.4. 1.4.1. 1.4.2. 1.4.3. 2. 3. 4. 5. 6. 7.
Zum Verhältnis zwischen Linguistik und Psycholinguistik: Die Relevanz externer Daten für die sprachwissenschaftliche Theoriebildung Versprecher als empirische Daten: Grundlegende Aspekte Kurzer Abriß der Versprecherforschung Die Datenbasis Definition des Untersuchungsgegenstands Vorstellung des Korpus Zur Versprecherklassifikation Das Korpus in der Gesamtschau: Grundlegende Tendenzen Das Handwerkzeug: Die versprecherbeeinflussenden Faktoren Linguistische versus psycholinguistische Variabilität: Die Rolle der Sprache bei den Versprechern Parallelität versus Serialität des Informationsflusses Zur Methodik der empirischen Analyse Versprechermotivation durch Konstruktion Theoretische Ahnlichkeitsbestimmung und empirischer Interaktionsindex Die Größe der modifizierten Einheit Phonem versus Phonem Wort-und Silbenpositionen Initial versus medial Wortinitial versus silbeninitial Silbenposition und Kontextidentität Nähe versus Distanz Intramorphemische versus intraverbale versus interverbale Modifikationen Die deskriptive Dimension: Substitution versus Addition versus Elision Sprachliche Motivierung der Entscheidung Die Rolle der versprecherbegünstigenden Faktoren Zum Verhältnis von Fehlerposition und Deskriptionsklasse Phonem versus Cluster Phonem versus Wort Phonologische Modifikationsgrößen und Lexikalität Wort versus Wort: Substantiv versus Präposition Lexem versus Wort Morphem versus Morphem
l 5 7 13 13 13 15 19 21 25 30 34 34 37 47 47 50 50 53 54 57 57 59 59 60 62 65 69 75 77 78 79
VIII 9. 9. 9. 10. 10. 10. 10. 10. 10. 10. 10. 10. 10. 10. 10. 10. 10.
7.1. 7.2. 8. 1. 1.1. 1.2. 1.3. 1.4·. 1.5. 2. 3. 4. 5. 6. 7. 8.
11. 12. 13. 13. 13. 14. 15. 16. 16. 16. 16. 16. 16. 16. 16. 16. 16. 16. 16. 16. 16. 16. 16.
1. 2.
1. 1.1. 1.2. 1.3. 2. 2.1. 2.2. 2.3. 2.4. 3. 4. 5. 6. 6.1. 6.1.1.
Präfix versus Stammlexem Lexem versus Lexem Segment versus Suprasegment Die explikative Dimension Antizipation versus Perseveration Die Rolle der distinktiven Merkmale Die Rolle der Betonung Die Position des Triggers Die Entfernung zwischen Fehler und Quelle Die Rolle der Lexikalität Antizipation versus Permutation Permutation versus Verschiebung Permutation versus Maskierung Maskierung versus Dissimilation Maskierung versus Anlautmaskierung Dissimilation versus Antizipation/Perseveration Überblendungen: intramorphemisch versus intraverbal versus interverbal Eine erste theoretische Auswertung der empirischen Befunde: ein Plädoyer für Parallelität Ein Rahmenmodell der Sprachproduktion Das Netzwerk als Produktionsmechanismus Die Struktur Die Kontrollstruktur Zur Frage eines eigenständigen Kurzzeitgedächtnis Einfach-versus Mehrfach-versus Vielfachabspeicherung Aktivation Grundbedingungen der Aktivation Genese der Aktivation: die Spezifität des ideationellen Outputs Vollaktivierung und Aktivationsschwelle Aktivationssummation und Kompensation Aktivationsbeeinflussende Faktoren IntrinsischeÄhnlichkeit Extrinsische Ähnlichkeit: Die Silbenpositionskonstanz Doppelquelligkeit Kontextidentität Maskierungen Audibilität Aktuelle versus nicht-aktuelle Verarbeitungsposition Lokale Maximal-versus verteilte Minimalaktivation Weitere Leistungen der non-lokalen Minimalaktivation Häufigkeit der einzelnen Deskriptionsklassen
79 82 83 85 85 85 86 89 91 92 93 95 100 100 103 104 106 110 115 121 121 125 129 132 137 137 137 138 139 141 142 143 144 144 149 152 153 156 159 159
IX
16. 6.1.2. 16. 7. 16. 7.1. 16. 7.2. 16. 7.3. 16. 8. 16. 9. 16.10. 16.11. 16.12. 17. 17. 1. 17. 2. 17. 3. 17. 4. 17. 5. 17. 17. 17. 17. 17. 17. 17. 18. 18.
6. 7. 8. 8.1. 8.2. 8.3. 8.4. 1.
18. 2. 19.
Die mentale Irrealität phonotaktischer Regeln Aktivationsfluß und das Netzwerk Verarbeitungsunterschiede auf der Phonem-und der Merkmalebene Die Generierung voVi unorthodoxem Material Zur Dauer der Interaktion Grenzen der versprecherbegünstigenden Faktoren Zur Verarbeitung der Initialposition Zur Anzahl der erforderlichen Aktivationsmuster pro Äußerung Das Aktivationsmodell im Kontrast zu herkömmlichen Theorien Zwischenzusammenfassung und Schlußfolgerungen Versprecherlokalisation und Stufigkeit Verarbeitungsebene versus Verarbeitungsstufe Kritische Diskussion zweier Planungs/Exekutionsmodelle Die Notwendigkeit der Unterscheidung in eine Planungsund eine Exekutionsstufe Die Leistungen eines zweistufigen Produktionsmodells Die Problematik eines Modells ohne die Planungs/ Exekutionsdistinktion Sind Versprecher Ausdruck einer Störung bei der Sprachplanung? Diskussion gängiger Konzeptionen des Exekutionsmechanismus Ein alternatives Planungs/Exekutionsmodell Grundsätzliches Detailaspekte Weitere Leistungen des vorliegenden Modells Realisation statt Exekution Versuch einer Synthese Integration (Teil 1): Der Informationsfluß als Schlüssel zum Verständnis des Sprachproduktionsprozesses Integration (Teil II): Aktivation und Hyperaktivation Zusammenfassung und Schlußfolgerung Literaturverzeichnis
162 164 165 167 168 168 172 173 175 177 180 180 181 183 185 187 188 192 194 194 196 200 201 205 205 208 211 213
1.
Zum Verhältnis zwischen Linguistik und Psycholinguistik: Die Relevanz externer Daten für die sprachwissenschaftliche Theoriebildung
Es ist ein zentrales Problem jeder empirischen Forschung, welche Daten zur Verifikation oder Falsifikation von Hypothesen herangezogen werden können. Diese Frage ist natürlich in entscheidendem Maße von den Zielsetzungen der jeweiligen Wissenschaft abhängig. So steht in der modernen Linguistik die Erstellung eines mehr oder weniger stark formalisierten Apparats für eine möglichst effiziente Beschreibung des sprachlichen Systems im Vordergrund. Dieser Ansatz beinhaltet eine spezifische Sichtweise, die die Sprache aus ihrem facettenreichen Funktions- und Bedingungsgeflecht herauslöst. Mit diesem Schritt ist in gewisser Weise die Auswahl der zu berücksichtigenden bzw. zu ignorierenden Daten präjudiziert. Es ist insofern naheliegend, daß die Linguistik zur Inventarisierung der Elemente und zur Analyse ihrer vielfältigen Beziehungen innerhalb des geschlossenen Ganzen Material zugrunde legte, das möglichst direkte Einblicke in Aufbau und Struktur des Systems vermitteln sollte. Mit Chomskys Syntax- und späterer Phonologietheorie, die von den meisten als die größte Revolution in der Sprachwissenschaft des 20. Jahrhunderts angesehen wird, erfolgte der Versuch eines Ausbruchs aus der isolierenden Forschungstradition, dies allerdings nur an einer Stelle: Der Sprecher wurde als ein relevanter Faktor in der Sprachanalyse erkannt, der Weg zur Sprache wurde über den Sprachbenutzer gesucht. Damit stand nicht mehr die Sprache als fertiges Produkt im Mittelpunkt, vielmehr wurde sie als Produktionsleistung zum Gegenstand des wissenschaftlichen Interesses.1 Das Hauptaugenmerk galt nun nicht mehr dem System der Sprache, sondern der Kompetenz des Sprechers. Diese Neuorientierung blieb nicht ohne Rückwirkungen auf die empirischen Grundlagen: In den Vordergrund traten vor allen Dingen Grammatikalitätsurteile, mit denen der Sprecher-Linguist oft von ihm selbst konstruierte Beispiele als richtig oder falsch beurteilte.2 In dem Moment nun, wo die Fähigkeit zum Generieren von Sprache in das Zentrum der Untersuchungen gerückt wird, erhält die so definierte Sprachwissenschaft eigentlich eine eminent psychologische Dimension. Es kann insofern nicht überraschen, daß Chomsky die Linguistik als einen Teilbereich der kognitiven Psychologie versteht (Chomsky 1972). Jedoch bleibt er in der Anbindung der ersteren an die letztere Disziplin 1 Allerdings sollte nicht unerwähnt bleiben, daß der Ansatz, Sprache als einen Produktionsprozeß zu begreifen, älteren Ursprungs ist. Er läßt sich in der psychologisch orientierten Sprachwissenschaft von Hermann Paul bis Karl Bühler nachweisen. 2 Wieweit diese metasprachliche Kompetenz als Mittel zur Erforschung der objektsprachlichen Kompetenz verwendet werden kann, steht auf einem ganz anderen Blatt (cf. Hörmann 1976).
2 zutiefst ambivalent. Auf der einen Seite betont er, daß er mit seiner (linguistischen) Kompetenztheorie keine Aussagen über ein (psychologisches) Performanzmodell machen will, bestimmt aber auf der anderen Seite das Aufgabengebiet der Linguistik wie folgt: ...Hence, in the technical sense, linguistic theory is mentalistic, since it is concerned with discovering a mental reality underlying actual behavior.3 (Chomsky 1965:4).
Nicht zufällig setzt der Autor in diesem Zusammenhang die Aufgaben des Linguisten mit denen des kindlichen Sprachenlerners gleich. So ist es nicht verwunderlich, daß viele Psychologen Chomskys Theorie für geeignet hielten, um sie auf ihre psychische Realität hin zu prüfen. Das darf aber nicht über die Tatsache hinwegtäuschen, daß seine Theorie nur pseudopsychologischen Status besitzt. Für unsere Zwecke ist von Bedeutung, daß mit Chomskys Öffnung zur Psychologie eine Aufwertung der externen empirischen Evidenz4 im Vergleich zur traditionell internen einherging, obwohl er sich ironischerweise gerade gegen die Relevanz von Performanzdaten ausgesprochen hatte. Wenn Sprache etwas mit Generierung zu tun hat, dann muß es auch legitim sein, solches Material heranzuziehen, das eher psychologischer Natur ist. Um eine Untergruppe dieser externen Daten geht es in der vorliegenden Arbeit, nämlich um Versprecher. Versprecher haben potentiell eine zweifache Relevanz: zum einen als Evidenzen für Sprachproduktionsprozesse und zum anderen als Evidenzen für die linguistische Systembzw. Kompetenztheorie. Da ihre Bedeutung für die Psycholinguistik relativ unbestritten ist, soll primär ihr Aussagewert für die Linguistik diskutiert werden. Theoretisch gibt es die bereits bei Chomsky anklingenden zwei (bzw. drei) Möglichkeiten. Versprecher können zur Beantwortung linguistischer Fragestellungen einerseits als völlig irrelevant verworfen oder als prinzipiell aussagekräftig angesehen werden. Im letzteren Fall läßt sich weiterhin danach unterscheiden, ob man die externe Evidenz in gleichem Maße für relevant hält wie die interne oder ob den psycholinguistischen Daten mehr »Glauben« zu schenken ist als den linguistischen. Für eine kategorische Trennung beider Bereiche, wie sie besonders von McNeill (1975) gefordert wird, spricht einiges. A priori besteht kein Grund zu der Annahme, daß der intellektuelle Zugriff des Linguisten ein direktes Abbild dessen ist, was im Sprecher unbewußt beim Sprechen vor sich geht. Psychologen und Linguisten verfolgen grundsätzlich unterschiedliche Ziele, oder, um die obige Analogie aufzugreifen, was das Kind mit der Sprache macht, ist etwas völlig anderes als die Methode des Sprachwissenschaftlers. Während der Generative Linguist bei der Analyse und Theoriebildung nach Kriterien wie Einfachheit, Ökonomie, Eleganz oder Generalisierbarkeit vorgeht, um Beziehungen zwischen Sätzen bzw. anderen linguistischen Größeneinheiten auszudrücken, kommt es 3 Hervorhebung von mir. 4 Zur Datenfrage als methodischem Problem der Linguistik hat sich ausführlich Zwicky (1975) geäußert. Er unterscheidet traditionelle Daten, wie sie von den Strukturalisten verwendet wurden (z.B. phonemische Distributionsanalysen), von »zusätzlichen« Daten zur Validierung linguistischer Hypothesen. Hierzu zählen Sprachspiele, Spracherwerb und Sprachverlust, um nur einige zu nennen. Diese beiden Materialquellen werden in der Literatur als interne bzw. externe Evidenz bezeichnet.
dem Psycholinguisten vor allem darauf an, Strategien zu beschreiben, mit Hilfe welcher der Sprachbenutzer das zu verarbeitende Material mit den verarbeitungstechnischen Gegebenheiten in Einklang bringen kann. Mit dieser Argumentation ließe sich eventuell eine Unvergleichbarkeit beider Forschungsansätze begründen. Andererseits gibt es gute Gründe für einen direkten Zusammenhang zwischen der linguistischen und der psycholinguistischen Repräsentation von Sprache. Sprache ist nicht ein abstrakter Besitz, sondern eine erworbene Technik, die im Perzeptions- und Produktionsprozeß zur Geltung kommt. Welche mentale Organisation der Sprache zugrunde liegt, dürfte entscheidend von ihren strukturellen Eigenschaften und ihrer Funktion als Kommunikationsmittel abhängig sein. Auf jeden Fall sollte kein Zweifel daran bestehen, daß eine Konvergenz von psycholinguistischer und linguistischer Interpretation einer Theorie größere Glaubwürdigkeit verleiht, als wenn sie sich nur auf eine Forschungsrichtung stützt. Problematisch wird es jedoch in dem nicht gerade seltenen Fall, wo die linguistischen und psycholinguistischen Ergebnisse konfligieren, man also in eine Position gedrängt wird, in der eine Entscheidung hinsichtlich der größeren Aussagekraft des einen oder anderen Ansatzes getroffen werden muß. Das Problem soll im Vorgriff auf die Versprecheranalysen an zwei konkreten Beispielen erörtert werden. Chomsky postuliert eine Vielzahl von syntaktischen Transformationen, mit denen Tiefenstrukturen in Oberflächenstrukturen umgewandelt werden. Eine von ihnen ist die im Englischen obligatorische Verschiebung der Partikel in Fällen, wo die Objektnominalphrase pronominal realisiert ist. Wenn diese Regel nun im Laufe der Generierung einer Äußerung aktiv angewandt wird, sollte man annehmen, daß sie gelegentlich auch ausbleibt, so daß Versprecher wie der folgende zu erwarten wären: (1)
Can I turn off this? statt: Can I turn this off?
In der Tat glaubt Fay (1980) in solchen Fällen Evidenz für die psychische Realität Chomskyscher Transformationsregeln gefunden zu haben. Diese Hypothese blieb jedoch nicht lange unwidersprochen. Stemberger (1982) argumentierte, daß derartige Beispiele das Ergebnis einer Interaktion zweier alternativer Konstruktionen sind, ein Rückgriff auf Transformationen also nicht erforderlich ist. Die Möglichkeit einer Involvierung syntaktischer Prozesse im Sinne Chomskys konnte damit zwar in Frage gestellt, jedoch nicht ausgeschlossen werden. Zwingender ist der Befund Motleys (1985), dessen Versuchspersonen durch einen experimentell herbeigeführten Differenzierungskonflikt zwischen den beiden alternativen Mustern Can I turn this off? und Can I turn off this light? genau die von Fay zitierten Fälle produzierten. Damit bleibt für die transformationeile Interpretation solcher Versprecher wenig Raum. Das zweite Beispiel stammt aus der Phonologic. Chomsky & Halle (1968) überführen Wörter von der systematischen phonemischen zur phonetischen Repräsentationsebene mit Hilfe phonologischer Regeln wie der des velar softening. So wird beispielsweise electricity über die Basis electric deriviert. Wenn dem [s] in electricity ein /k/ zugrunde liegt, mit anderen Worten die velare Aufweichung psychisch real ist, dann wären Versprecher zu erwarten, in denen unter bestimmten Bedingungen (z.B. im Wortanlaut) das zugrunde liegen-
de /k/ zum Vorschein käme. Wie jedoch wiederholt festgestellt wurde (z.B. Cearley 1974, Mohanan 1982), ist das nicht der Fall. A charge of electricity wird bei einer Phonemvertauschung nicht zu karge, sondern zu wrge. Um Chomskys Position zu verteidigen, könnte man beispielsweise argumentieren, daß die Versprecher erst auf einer Stufe auftreten, auf der die morphologische Derivation bereits abgeschlossen ist. Demnach würden Versprecher überhaupt keine Aussagen über die in der Linguistik postulierten Prozesse machen. Diese Argumentation basiert jedoch auf einem falschen Verständnis von Regeln. Denn die Existenz von Regeln impliziert immer auch die Möglichkeit ihres Ausfalls (Cherubim 1980). Das generelle Problem, vor dem man steht, betrifft den Umgang mit »unbequemem« Material. Es stellt sich in jeder Wissenschaft zu jeder Zeit. So ergab sich beispielsweise in der Linguistik die Situation, daß das strukturalistische Distinktivitätsprinzip durch das Phänomen der Neutralisation in Frage gestellt wurde. Die Reaktion einiger Strukturalisten bestand darin, das Problem der Phonemidentifikation in spezifischen Positionen als irrelevant zu erachten (Donegan & Stampe 1979). Dieselbe Möglichkeit bietet sich auch in bezug auf die psycholinguistischen Daten. Ob man ihnen Aussagekraft zubilligt oder nicht, hängt bemerkenswerterweise weniger von ihnen selbst als von dem Anspruch ab, den der Linguist an sich selbst stellt. Soll seine Theorie ansatzweise eine mentale Realität haben, muß Chomskys Modell verworfen werden, wenn nicht, bleibt es unbeschadet. Im letzteren Fall ergibt sich aber ein möglicherweise schwerwiegendes Problem. Wenn linguistische Hypothesen nicht an externen (z.B. psycholinguistischen) Daten gemessen werden dürfen, muß grundsätzlich geklärt werden, welche Kriterien zur Evaluation geeignet sind und welche nicht. Mit einem Ausschluß von Kriterien ergibt sich die Gefahr, daß die Hypothesenbildung zu wenig an der Wirklichkeit ausgerichtet ist. In Householders (1979) Beurteilung der Beiträge zu der »Conference on the Differentiation of Qurrent Phonological Theories« kommt diese Schwierigkeit mit Exemplarischer Deutlichkeit zum Ausdruck. Er spricht den Zusammenhang von Modellen und Realität an und schließt in bezug auf Theorien, die mächtiger als die sprachliche Wirklichkeit sind, mit den Worten: Or would we not rather keep the powerful devices and concede that they are, after all, linguists' devices that correspond to nothing particular in the speaker's brain? (Householder 1979:264)
Wenn man sich vor Augen hält, daß Sprache und Sprechen ohne unser Gehirn gar nicht denkbar wären, können diese resignierenden Worte nicht der Weisheit letzter Schluß sein! Die Psycholinguistik stellt immerhin einen Ausweg (unter anderen) aus dieser Ratlosigkeit dar. Dies setzt aber voraus, daß linguistische Modelle auf ihre psychische Realität überprüft werden dürfen, mit anderen Worten, Versprecher im Sinne einer externen Evidenz als relevante Datenbasis akzeptiert werden. Es ist verständlich, daß jeder Versprecherforscher, der sich der Linguistik verpflichtet fühlt, diese Position zu seinem Credo macht.
2.
Versprecher als empirische Daten: Grundlegende Aspekte
Nachdem im vorangegangenen Kapitel die prinzipielle Relevanz der Versprecher für die linguistische Theoriebildung erörtert worden ist, soll im folgenden gefragt werden, wieweit Fehlleistungen ein geeigneter Gegenstand der wissenschaftlichen Analyse sind. Allgemein läßt sich feststellen, daß sie mit weniger grundlegenden Interpretationsschwierigkeiten behaftet sind als z.B. Daten aus der Aphasieforschung. Die Vorzüge normalsprachlicher Fehlleistungen sind vor allen Dingen in ihrer »Echtheit« zu sehen, d.h., als Ausdruck einer fehlgeschlagenen Intention entziehen sie sich einer bewußten Kontrolle und damit der Gefahr der Verfälschung durch den Sprecher. Sie sind per definitionem nicht konstruiert. Diese Natürlichkeit kann aber nur dann als eine positive Eigenschaft der Versprecher gewertet werden, wenn das heuristische Prinzip Gültigkeit besitzt, demzufolge die Störung eines Prozesses generell denselben Mechanismen gehorcht, die den störungsfreien Ablauf bestimmen. Diese Überzeugung war einer der wesentlichen Leitgedanken für Meringers Versprechersammlung und wird bis auf den heutigen Tag — nicht nur in der Linguistik — unangefochten vertreten. Die Rechtfertigung dieser Methode liegt zum einen in der Regelhaftigkeit der Fehler, zum anderen in der Differenzierbarkeit der Störungen als Voraussetzung zur Isolierung einzelner Komponenten des Produktionssystems. Vereinzelt werden Zweifel an dem Aussagewert der Versprecher aufgrund ihrer geringen Auftretenshäufigkeit geäußert (McNeill 1979). Hinter dieser Kritik scheint sich die Annahme zu verbergen, daß die Seltenheit von Daten mit ihrer Repräsentativität korreliert. Dies ist jedoch falsch. Die Quantität von Ereignissen sagt a priori nur wenig über ihre Repräsentativität aus. Ein weiteres Problem der McNeillschen Argumentation liegt in einer fragwürdigen Konzeption der den Versprechern zugrunde liegenden Prozesse. Versprecher sind nicht Ausdruck eines gänzlich zusammengebrochenen Vorgangs, sondern involvieren eine einzelne Störung in einem mehr oder weniger gut isolierbaren Subsystem, wobei alle übrigen Prozeßkomponenten völlig normal arbeiten. Gerade dieses normale Funktionieren aller übrigen Teile rechtfertigt das Postulat des hohen Aussagewerts der Versprecher. Ein zweiter Einwand betrifft weniger den Aussagewert der Fehlleistungen als solchen, sondern die Art und Weise der Datenerhebung. Sie müssen wahrgenommen, verstanden, im Gedächtnis behalten und aufgeschrieben werden. All dies sind interpretative Vorgänge, die durch ihre Fehleranfälligkeit die empirischen Daten verfälschen können. So besteht die Gefahr der Vermischung perzeptueller und produktioneller Bedingungen bei der Versprechersammlung. Am ausführlichsten hat Cutler (1981) auf diese Probleme hingewiesen. Ihre Warnungen bleiben jedoch rein programmatischer Natur, da sie keinen
einzigen Fall aufzeigt, wo eine Kontrolle der perzeptueilen Einflüsse eine Reanalyse und -interpretation erforderlich machen würde. Wie dem auch sei, zwei theoretische Möglichkeiten zur Vermeidung dieser Gefahr bieten sich an. Man kann ausschließlich auf Tonoder Videoband aufgezeichnete Sprache auf Versprecher — gegebenenfalls von mehreren Leuten — untersuchen lassen. Dieser Weg, der im übrigen von Cutler eingeschlagen wurde (Cutler 1983, Garnham et al. 1981), erfordert nicht nur einen hohen technischen Aufwand, sondern bringt auch, wie MacKay & Kempler (1984) gezeigt haben, eine Vielzahl neuer Probleme mit sich. So sind in einfachen Bandaufnahmen die kommunikativen Rahmenbedingungen ausgeschaltet, es besteht beispielsweise keine Möglichkeit mehr, den Sprecher nach seiner Intention zu befragen. Dies kann aber bei der Fehlerklassifikation ein sehr hilfreiches Verfahren sein. Der andere Weg besteht im Rückgriff auf die stark kontrollierte Laborsituation. Die Produktion von Versprechern wird damit aus ihrer natürlichen Einbettung in das künstliche Experiment überführt. Der Zweifel an der Brauchbarkeit der Daten ist vor dem Hintergrund des lange währenden Streits zwischen experimentell und naturalistisch orientierten Psychologen zu sehen, welche Vorgehensweise die wissenschaftlichere sei. Die Vorund Nachteile der einen wie der anderen Methode sollen hier nicht diskutiert werden. Im Idealfall sollten beide Wege ähnliche Resultate liefern. Dies ist auch weitgehend der Fall, was die Versprecherforschung betrifft (Stemberger, im Druck). Wenn eine solche Konvergenz aber nicht gegeben oder nicht möglich ist, erscheint es ratsam, beide Forschungsstränge als gleichwertig und komplementär zu betrachten (Menn & Obler 1982). Sofern nun der prinzipielle Aussagewert der Versprecher gegeben ist, kann man sich ihrer generellen Analysierbarkeit zuwenden. Ihre Problematik besteht im wesentlichen in der Schwierigkeit einer eindeutigen Klassifikation. Diese Mehrdeutigkeit hängt mit dem Phänomen der Selbstkorrektur vor Vollendung einer fehlerhaften Äußerung, vor allem aber mit der potentiellen Plurikausalität der Versprecher zusammen (Weimer 1925). In der Regel werden diese Probleme dadurch zu bewältigen versucht, daß man die unklaren Fälle solange eliminiert, bis jegliche Ambiguität beseitigt ist. Dies kann soweit führen, daß immerhin die Hälfte der Daten für unbrauchbar erklärt wird, wie Goldstein (1968) es beispielsweise getan hat. Hier wird das Problem gewiß an der falschen Stelle angegangen, denn es wird in den Daten und nicht in der Klassifikation gesucht. So wird die Fülle des Materials relativ willkürlich beschnitten, anstatt die reichlich vorhandene Ambiguität als entscheidende Eigenschaft der Versprecher zu verstehen und als Indiz für die Unangemessenheit des Wunsches nach Eindeutigkeit zu werten. Die Schwierigkeit einer eindeutigen Zuweisung der Versprecher in bestimmte vorgefertigte Kategorien ist daher eher ein Pseudoproblem; die wahre Herausforderung besteht vielmehr in der theoretischen Aufarbeitung der Ambiguität als eines der hervorstechenden Merkmale dieser Funktionsstörungen.
3.
Kurzer Abriß der Versprecherforschung
Wenn im folgenden die historische Entwicklung und ansatzweise der heutige Stand der Versprecherforschung nachgezeichnet werden soll, dann dient dies im besonderen der Vorstellung der zentralen Fragestellungen und der Situierung dieser Studie in den Zusammenhang der Theoriebildung. Damit ist klar, daß es nicht um eine umfassende Historiographie gehen kann, sondern um eine Beschränkung auf das für die vorliegende Arbeit Relevante. Gemäß ihrem ambivalenten Charakter läßt sich die wissenschaftliche Auseinandersetzung mit Versprechern von Beginn an in zwei relativ unabhängig voneinander verlaufenden Forschungstraditionen zurückverfolgen. Auf der einen Seite stehen die historisch orientierten Sprachwissenschaftler um die Jahrhundertwende wie Paul, Meringer, Sturtevant oder Jespersen, die die Versprecher als synchrone Evidenz für diachrone Prozesse verwerteten. Dagegen ist die psychologische Seite in ihrem Zugriff auf die Versprecher weniger einheitlich. Auch hier wird der Aspekt des Lautwandels diskutiert (Wundt 1900). Daneben dienen die sprachlichen Fehlleistungen als empirisches Material für die zur damaligen Zeit beliebten Assoziationsstudien (Bawden 1900). Ihre primäre Bedeutung wird aber in ihrer Aussagekraft für den Grenzbereich von Normalität und Pathologie gesehen. Die Freudschen Interpretationen der Versprecher als psychopathologische Alltagsphänomene bedürfen aufgrund ihres Bekanntheitsgrads keiner weiteren Erwähnung. Das Gemeinsame all dieser Arbeiten ist interessanterweise die wesensfremde »Ausschlachtung« der Versprecher. Freud und seine zahlreichen Nachfolger benutzten sie für ihre psychoanalytische Theorie, Meringer zur Erhellung des diachronen Prozesses der Dissimilation. Aus diesem Grunde wird verständlich, weshalb die Versprecher zu beiden Problemen keine perspektivenreichen Aussagen machen konnten, denn sie sind ihrem Charakter nach Produkte des Sprachproduktionsprozesses. Und nur diesem sind sie unmittelbar verpflichtet, nur für diesen können sie als natürliche Evidenz herangezogen werden. Mit diesen Überlegungen wird deutlich, weshalb die Versprecher in diesem konzeptueilen Rahmen nur sporadisches und kein dauerhaftes Interesse erwecken konnten. Diese Situation hielt an bis zu Lashleys (1951) Arbeit zu den dem Verhalten zugrunde liegenden mentalen Organisationsprinzipien. Hier wurden die Versprecher zum ersten Mal konsequent in Genese und Funktion ernst genommen. Die im vorliegenden Zusammenhang wichtigste Schlußfolgerung Lashleys ist, daß Versprecher, die eine Reihenfolgestörung von linear angeordneten Elementen involvieren, das Postulat nahelegen, daß sich zumindest die interagierenden Elemente vor der Artikulation in einem Zustand partieller Produktionsbereitschaft befinden müssen. Denn sonst hätte ein für später geplantes Element gar nicht nach vorne drängen können. Wir erhalten hier erste wichtige Einblicke in
8 eine Stufe der Sprachplanung, auf der mehrere Bausteine zur gleichen Zeit vorhanden sind. Von dieser genuin psycholinguistischen Stoßrichtung bleiben die relevanten Arbeiten der 60er Jahre nicht unbeeinflußt. So berufen sich Cohen (1966), Boomer & Laver (1968), Hotopf (1968) und Nooteboom (1969) explizit auf Lashley. Neben der stärker psycholinguistischen Orientierung, die in der Erstellung von ersten, noch relativ vagen Stufenmodellen der Sprachproduktion resultiert (Cohen 1966, Laver 1970), wird auch parallel dazu die linguistische Deskription der Fehlleistungen vorangetrieben. Als ein wesentliches Faktum stellen sich verschiedene Arten der Ähnlichkeit als versprecherbeeinflussende Faktoren heraus. Erste Modelle werden vorgelegt, in denen die Lokalisation der Fehlfunktionen auf bestimmten Sprachproduktionsstufen thematisiert wird (MacKay 1969, 1970a, 1971). Dabei stehen prinzipiell zwei Forschungsstrategien zur Verfügung. Die hypothetische Lokalisation kann als Methode zur Stufenidentifikation verwandt werden, oder unabhängig motivierte Stufen können mit Hilfe der Fehler falsifiziert oder verifiziert werden. Beide Wege werden im Laufe der Zeit beschritten. In der einschlägigen Literatur wird die Veröffentlichung von Fromkins Aufsatz im Jahre 1971 als die theoretische Fundierung der Beschäftigung mit Versprechern und damit als Auslöser einer breiteren Forschungstätigkeit auf diesem Gebiet angesehen. Dies ist insofern zweifelsohne richtig, als sich mit ihrer Arbeit neue Perspektiven auftaten. Sie schuf zunächst die psycholinguistischen Voraussetzungen für eine theoretisch abgesicherte Beschäftigung mit diesem Thema, indem sie die Frage nach der psychischen Realität systemlinguistischer Konstrukte stellte. Diese Frage erwies sich als die Grundlegung der Versprecherlinguistik, da ohne eine Klärung der psycholinguistischen Relevanz systemlinguistisch motivierter Deskriptionseinheiten solide Erkenntnisfortschritte nicht möglich sind. Fromkin (1971) kam dabei zu dem Schluß, daß mehr oder weniger alle traditionellen linguistischen Größeneinheiten psychisch real sind, Ergebnisse, die im weiteren Verlauf der Forschung dann zumindest für abstrakte Morphophoneme (Linell 1979, Smith 1982), Silben (Shattuck 1975) und distinktive Merkmale (Shattuck-Hufnagel & Klatt 1979a) relativiert wurden. Dabei wurde in der Regel jedoch weniger die mentale Realität dieser Einheiten in Frage gestellt als auf ihren Sonderstatus verwiesen. Fromkins zweite große Leistung besteht in der Erstellung eines relativ vollständigen, auf Versprecherdaten gegründeten Modells der Sprachproduktion. Aus der Perspektive des Linguisten kam es ihr dabei vor allem auf die Integration der sprachlichen Analyseebenen an, die in einem Prozeßmodell räumlich angeordnet sind. Für die Autorin standen damit Fragen im Vordergrund, die beispielsweise die Deutung des Verhältnisses von Syntax zur Phonologie oder zur Lexik betrafen. Außer acht blieb jedoch (verständlicherweise) die gesamte Palette der eher psychologischen Fragestellungen. So setzt sie quasi automatisch die räumliche Anordnung mit einer zeitlichen gleich, so daß der Informationsfluß ohne weiteren Kommentar seriell und nur von oben nach unten, also von der Idee zur Artikulation, erfolgt.5 Allerdings muß auch betont werden, daß zu dem Zeit5 Sie steht damit ganz unmittelbar unter dem Einfluß der linguistischen Diskussion z.B. über die Anwen-
punkt die theoretischen Voraussetzungen in der Psychologie fehlten, um einseitig fundierte Systeme — beim Sprechen kann der Zugang zur Phonologic nur über die Morphologie gefunden werden, nicht umgekehrt — in einer parallelen Anordnung abzubilden. Den nächsten Meilenstein bilden die nach Fromkin wohl am häufigsten zitierten Beiträge von Garrett (1975, 1976). Sie schließen nahtlos an Fromkins Postulat des seriellen Informationsflusses an, sind jedoch, bedingt durch die Herkunft des Forschers, stärker psychologisch ausgerichtet. So stellt er Fromkins unausgesprochene Annahme in Frage, daß jeder linguistischen Deskriptionsebene automatisch eine psychologische Verarbeitungsstufe zuzuordnen ist. Für ihn lassen sich alle Versprecher auf drei Stufen erfassen, so daß notwendigerweise das l: l Verhältnis von linguistischer und psycholinguistischer Ebene aufgegeben wird. Grundlage für die Identifikation von Verarbeitungsstufen ist nicht mehr die bloße Existenz verschiedener in Versprecher involvierter Größeneinheiten, sondern Versprechereigenschaften, die sich bei verschiedenen Fehlerkategorien in gleicher Weise zeigen können. So führen unterschiedliche Eigenschaften von Versprechern zur Postulierung einer bestimmten Anzahl von Verarbeitungsstufen. Mit diesem Verfahren versucht Garrett, die Störfunktionen an unterschiedlichen Punkten im Produktionsprozeß zu lokalisieren. Die Tatsache, daß sich auf dem 12. Weltkongreß der Linguisten in Wien 1977 eine eigene Arbeitsgruppe zum Thema Versprecher konstituiert hat (Fromkin 1978), ist als ein deutliches Indiz für die Etablierung dieses interdisziplinären Gebiets zu werten. Dabei wird eine Ausweitung des Forschungsgegenstands auf andere Formen von Fehlleistungen erkennbar. So finden neben den Verhörern auch Zungenbrecher und »Verzeiger«, also Fehler in der Produktion der Zeichensprache Taubstummer, Beachtung. In seinem programmatischen Beitrag zu diesem Kongreß zeigt MacKay (1980) drei zukunftsträchtige Richtungen für die Versprecherforschung auf: verbesserte Methoden der naturalistischen Datenerhebung, die Versprechererzeugung im Labor und die theoretische Integration der Ergebnisse.6 Für unsere Belange ist der letzte Punkt der wichtigste, und MacKay selbst leistete mit seiner Theorie der konzeptuellen Verfügbarkeit im internen Lexikon dazu einen bedeutsamen Beitrag. Der erste Schritt zur Realisierung dieses Ziels erfolgte bereits in Dell & Reichs Vortrag auf dem Wieher Kongreß und einem inhaltlich vergleichbaren, aber noch wenig elaborierten Beitag zum LACUS-Forum7 1977 (Dell & Reich 1977). Richtig bekannt wurde dieses Modell aber erst mit Dells Dissertation (1980) und den entsprechenden Veröffentlichungen (Dell & Reich 1980, 1981). Damit ist das neue Jahrzehnt als der Beginn einer zweiten Versprecherforschergeneration zu verstehen. Mit Dells8 Aktivationsflußmodell dungsreihenfolge von Regeln (rule ordering) in einem Kompetenzmodell (siehe in diesem Zusammenhang auch Aaronson & Rieber 1979:11). 6 Wie sich heute herausgestellt hat, bewies MacKay in allen drei Fällen ein bemerkenswertes Gespür für die Richtung, die die Forschung einschlagen sollte. 7 LACUS = Linguistic Association of Canada and the United States 8 Damit ist natürlich nicht gemeint, daß Dell der alleinige Begründer dieser Theorie ist. Ihm kommt das Verdienst zu, sie für die Sprachproduktion entwickelt zu haben. Als Vorgänger bzw. als parallele Entwicklun-
10
nimmt eine Forschungsrichtung Konturen an, die sich als überaus fruchtbar erweisen soll und in zunehmendem Maße andere Psycholinguisten in ihren Bann zieht (Stemberger 1985a, Harley 1984, Motley & Camden 1985). Dabei kann der Bruch mit der »Elterngeneration« nicht deutlicher sein. Er läßt sich an folgenden Punkten veranschaulichen, die einerseits die Stärken der neuen und andererseits die Schwächen der alten Ansätze zum Ausdruck bringen. Im folgenden soll das Augenmerk jedoch retrospektiv auf die Modelle der 70er Jahre gerichtet werden. Um Redundanzen zu vermeiden, wird die »Kindergeneration« weitgehend ausgespart bleiben. Der Diskussion der kontroversen Eigenschaften der Aktivationsflußmodelle ist der gesamte letzte Teil dieser Arbeit gewidmet. 1. Im Gegensatz zur »Kindergeneration« fehlt es den »Eltern« an einem psycholinguistischen Rahmen, innerhalb dessen die empirischen Daten interpretierbar werden. Dies soll an einem konkreten Problem aus der Versprecherklassifikation verdeutlicht werden. Fromkin (1973b) subsumiert eine Vielzahl solch zweideutiger Fälle wie (2) rfocumenrfation. statt: documentation unter der Rubrik der Merkmalfehler ([stimmlos] -> [stimmhaft]), obwohl sie genausogut als Phonemfehler (/t/-*/d/) hätten interpretiert werden können.10 Fromkins Hang zu einer subphonemischen Analyse erklärt sich, so läßt sich vermuten, aus ihrer Bindung an die Generative Schule; sie sieht also die Versprecher im Licht der aphonemischen Phonologietheorie von Chomsky & Halle (1968). Der entscheidender Punkt ist nun aber, daß die linguistische Theorie psycholinguistisch gesehen eine Prätheorie ist und insofern nur in begrenztem Umfang Anhaltspunkte für verhaltensmäßige Einordnungen liefern kann." Die Elterngeneration ist daher als theoriearm zu bezeichnen, 2. Während die zweite Generation Anspruch auf potentielle Erfassung des gesamten Versprecherspektrums erhebt, können die Analysen der ersten Generation immer nur auf Teilbereiche angewendet werden. Zwei Beispiele mögen dies verdeutlichen. Fromkin kann mit ihrem an den linguistischen Deskriptionsklassen orientierten Performanzmodell nur solche Fehler erklären, die eine linguistisch motivierte Einheit involvieren. Für unmotivierte Größen wie Phonemsequenzen, die kleiner oder größer als eine Silbe sind, besteht beispielsweise keine Möglichkeit der Integration. Solche Fälle sind aber in allen größeren Korpora belegt. Shattuck-Hufnagel (1979) hat ein Zwei-Ebenen-Modell von Schlitzen und Füllelementen entwickelt, in welchem Lautsubstitutionen wie (3)
Maars and Botley. statt: Baars and Afotley
als Evidenz für die Modifikation auf der Füllerebene unter Intaktlassung der Schlitzebene gen wären u.a. Collins & Loftus (1975) in der Gedächtnisforschung, McClelland & Rumelhart (1981) in der visuellen Wahrnehmung und Anderson (1983) in der allgemeinen Kognitiven Psychologie zu nennen. 9 Da es hier mehr um die Ideengeschichte geht, erfolgt die Diskussion dieses aktuellen Modells zu einem späteren Zeitpunkt. 10 Griffen (1981) geht sogar soweit und interpretiert alle derartigen Fälle als Merkmalaffizierungen. 11 Man bedenke, daß die linguistische Theoriebildung von wechselnden Interessen abhängig, also zeitlich bedingt ist, die Prinzipien der Sprachproduktion jedoch kaum.
interpretiert werden. Diese Hypothese basiert auf der Tatsache, daß bei dem Fehlerprozeß das /b/ aus Baars genau in die Position gerät, die durch die Wanderung des /m/ frei geworden ist. Dieser Mechanismus eignet sich gut zur Erklärung von Substitutionen, es bleibt aber unklar, wie die Theorie auf natürliche Art und Weise Additionen und Elisionen miteinbeziehen kann. Denn dazu müßten im Falle der Additionen neue Schlitze geschaffen und im Falle der Elisionen alte gestrichen werden. Shattuck-Hufnagel (1979) schlägt bezeichnenderweise dieses Verfahren nicht vor, sondern postuliert in Anlehnung an Boomer & Laver (1968) eine kanonische Silbenform (template), die eine maximale Anzahl von Schlitzen in Abhängigkeit von der maximalen Silbenstruktur einer Sprache bereitstellt. Dies bedeutet, daß fast immer eine Vielzahl von Schlitzen unbesetzt bleibt. Ich habe gerade dieses Beispiel ausgewählt, weil es mir in eine Richtung zu weisen scheint, die für die Psycholinguistik nicht besonders fruchtbar ist. Hier erfolgt nämlich erneut eine Anbindung der Performanzforschung an Vorstellungen der Kompetenzlinguistik. Denn Shattuck-Hufnagel entfernt sich mit ihrem Modell von der unmittelbaren Erfassung psychologischer Gegebenheiten und postuliert stattdessen ein abstraktes Allgemeinschema, das mit der Aktualgenese von Äußerungen nur noch bedingt etwas zu tun hat. Die Gruppe der Additionen und Elisionen findet also ihren Platz in dem zur Diskussion stehenden Modell nur mit Zusatzannahmen, die ihrerseits problematisch sind. 3. Im Kontrast zu den Aktivationsflußmodellen haben die älteren Konzeptionen Schwierigkeiten bei der Behandlung von Ausnahmen. Dieser Punkt wird nur ganz begrenzt von dem vorangegangenen abgedeckt. Ausnahmen sind sinnvollerweise nur als mehr oder weniger seltene Regelverletzungen zu definieren. Additionen lassen sich aber nicht als Ausnahmen von Substitutionen verstehen, da es sich in beiden Fällen um eigenständige Kategorien handelt, wobei keine die andere durch mehr Regelhaftigkeit dominiert. So haben dann wiederum Shattuck-Hufnagel (1979) oder auch Crompton (1981) besonders mit solchen Versprechern Schwierigkeiten, die beispielsweise Silbenstrukturbeschränkungen nicht respektieren. Das Problem der Berücksichtigung von Ausnahmen ist grundsätzlicherer Art, als es auf den ersten Blick erscheinen mag. Man kann natürlich solche Fälle mit dem Argument ihrer geringen Frequenz ignorieren, das entläßt einen jedoch nicht aus der Verpflichtung, zumindest eine generelle Erklärungsmöglichkeit anzubieten. In der Tat sind die Modelle der älteren Machart prinzipiell unfähig, mit Ausnahmen adäquat umzugehen. Diese wurden in der Regel geflissentlich übersehen, statistische Tendenzen wurden irreführenderweise als »Gesetze« formuliert (Wells 1951, Boomer & Laver 1968). So wurden z.B. Versprecherdaten als klares Indiz für den monophonematischen Status der Diphthonge gewertet (Fromkin 1971, Roberts 1975). Nun ist aber seit einiger Zeit bekannt, daß es auch solche Fälle gibt, bei denen im Zuge des Fehlerprozesses Diphthonge aufgespalten werden (Stemberger 1983a). Es ist jedoch völlig unklar, wie eine solche Variabilität psycholinguistisch zu interpretieren ist; Diphthonge können nicht in einer Fehlleistung monophonematisch und in der nächsten biphonematisch sein. 12 Zusammenfassend läßt sich also festhalten, daß es den älteren Modellen an der erforderli12 Zu einem Lösungsvorschlag zu diesem Problem, cf. Berg (1986b).
12 chen Flexibilität mangelt, um auch Ausnahmen angemessen berücksichtigen zu können. Durch die Existenz dieser seltenen Fälle geraten besagte Modelle damit in prinzipielle Schwierigkeiten. Damit soll die tour d'horizon durch die Forschungsgeschichte bis zum Ende der 70er Jahre abgeschlossen werden. Die Zeit danach ist natürlich nicht stehengeblieben. Sie hat, wie bereits angedeutet, die Entwicklung der Aktivationsflußmodelle hervorgebracht. Diese lassen sich in ihren weniger kontroversen Annahmen wie folgt charakterisieren: Das Sprachproduktionssystem gleicht einem Netzwerk, in welchem verschiedene miteinander verbundene Verarbeitungsebenen hierarchisch organisiert sind. Die linguistische Grundlage dieses psycholinguistischen Modells bildet somit die Stratifikationsgrammatik (Lamb 1966, Lockwood 1972). Die Informationsverarbeitung auf und zwischen den einzelnen Ebenen erfolgt mit Hilfe des Prinzips des Aktivationsflusses. Die sprachlichen Elemente werden als Knotenpunkte im Netzwerk repräsentiert. Die Information fließt entlang der durch die Struktur des Systems vorgegebenen Verbindungslinien, also z. B. von einem Morphem zu den entsprechenden Phonemen. Ziel des Systems ist es, die der Intention des Sprechers am nächsten kommenden Knoten zur rechten Zeit zu aktivieren. Aktivation bedeutet allerdings noch nicht automatisch Produktion. Sie fließt im System von oben nach unten (feedforward) und von unten nach oben (feedback), so daß der Aktivationsgrad eines beliebigen Knotens immer mehrfach beeinflußt ist. Durch den additiven Charakter des Aktivationsflusses besteht die Möglichkeit, die Einflüsse mehrerer Faktoren (Plurikausalität) zu konzeptualisieren. Gesteuert werden die Aktivationsniveaus also durch systeminterne Verarbeitungsbedingungen und den semantischen Input. Für andere externe Einflußfaktoren bleibt dabei wenig Raum. Diese kurze Beschreibung soll genügen, um einen ersten Eindruck von diesem Ansatz zu vermitteln. Es kann daher Mitte der 80er Jahre nicht um eine Grundlegung der Aktivationstheorie gehen. In der vorliegenden Arbeit wird daher von der Annahme ausgegangen, daß es zu einer Reihe von Grundprinzipien keine echte Alternative gibt. Das bedeutet jedoch keineswegs, daß die Aktivationsmodelle bereits im Bereich der Unfalsifizierbarkeit erstarrt sind, ganz im Gegenteil, sie lassen durch ihre Flexibilität einen enormen Spielraum für alternative Theoreme und für die Eingliederung bislang unberücksichtigter Phänomene, so daß sich hier ein reiches Betätigungsfeld auftut. Die Alternativität bei Detailproblemen darf aber keinesfalls darüber hinwegtäuschen, daß eine Anzahl von Grundsatzfragen nicht die adäquate Klärung erfahren hat, die für eine solide Weiterentwicklung dieses Forschungszweigs erforderlich ist. Vor allem diesen grundsätzlichen Problemen ist diese Dissertation gewidmet.
13
4.
Die Datenbasis
4.1.
Definition des Untersuchungsgegenstands
Folgende Definition bildet den Ausgangspunkt dieser Arbeit: Ein Versprecher ist die unbeabsichtigte Abweichung von der ideolektalen Norm eines kompetenten Sprachbenutzers. Die Einzelbestandteile dieser Definition sollen im folgenden kurz erläutert werden. Die Einschränkung auf prinzipiell kompetente Sprecher wird durch die Schwierigkeit erforderlich, Fehlleistungen bei Sprachlernenden oder Sprachgestörten als individuelle Normverstöße zu diagnostizieren. Denn bei letztgenannten Sprechergruppen ist häufig nicht genau zwischen Kompetenz- und Performanzfehlern zu trennen, ein Problem, das sich bei kompetenten Sprachbenutzern nicht stellt, da Versprecher per defmitionem Performanzfehler sind. Das bedeutet aber nicht, daß sich der Versprecherstatus einer jeden Fehlleistung exakt bestimmen läßt. Diese Ungewißheit hat eine doppelte Ursache. Sie Hegt zum einen in der Bestimmung der ideolektalen Norm und zum anderen in der Ermittlung der Sprecherintention. Für den letzteren Fall ist die Selbstkorrektur von großer Hilfe, die in der überwiegenden Anzahl der Versprecher erfolgt. Daran ist nämlich recht deutlich ablesbar, was der Sprecher eigentlich hatte sagen wollen. In den übrigen Fällen hängt die Leichtigkeit der Intentionsbestimmung von der Art des Verstoßes ab. Phonologische Fehlleistungen sind in der Regel leichter zu erkennen als semantische. Als schwierig erweist sich manchmal die Bestimmung der ideolektalen Norm. Da es praktisch unmöglich ist, von jedem Informanden ein ideolektales Profil zu erstellen, ist der Sammler auf eine interindividuelle Norm angewiesen. Diese kann als abstrakte Schnittmenge immer nur einen (wenn auch erheblichen) Teil des Ideolekts erfassen. Zu dieser Verfahrensweise gibt es jedoch keine Alternative. Aus diesem Problem läßt sich aber die Forderung ableiten, Daten aus einer möglichst homogenen Sprechergruppe zu erheben. Insgesamt ist festzustellen, daß die Bestimmung des Versprecherstatus von sprachlichen Äußerungen in den meisten Fällen ohne größere Schwierigkeiten durchzuführen ist. Dies ist besonders dann der Fall, wenn die Gesamtsituation — innersprachlich wie außersprachlich —, in die das Versprechen eingebettet ist, dem Beobachter zugänglich ist.
4.2.
Vorstellung des Korpus
Das Fundament dieser Arbeit bilden gut 6000 deutsche Versprecher, die nach einer Einübungsphase in den Jahren 1981-1984 gesammelt wurden. Die Notwendigkeit einer eige-
14
nen Datenbasis ergab sich u.a. aus der Tatsache, daß meines Wissens in diesem Jahrhundert noch kein größeres deutsches Versprecherkorpus zu wissenschaftlichen Zwecken13 erstellt worden ist. Die einzige bekannte Sammlung ist um die Jahrhundertwende datiert und stammt von dem Österreicher Indogermanisten Rudolf Meringer (Meringer & Mayer 1895, Meringer 1908). Trotz vielfachen Lobs, das ihm hinsichtlich seiner Akkuratheit in der Datenerhebung gezollt worden ist, kommt man an dem Problem nicht vorbei, daß Meringer sein Korpus nur ausschnittweise publiziert, aber nie die Kriterien expliziert hat, die zur Berücksichtigung des einen und zur Ignorierung des anderen Versprechers geführt haben. Es besteht somit die Gefahr, daß er nur die ihm persönlich interessant erscheinenden Fälle vorgelegt hat, wodurch eine Repräsentativität als Voraussetzung für eine statistische Auswertung seiner Sammlung möglicherweise nicht mehr gegeben ist. Die Erstellung meines Korpus erfolgte durch Beobachtung des Sprachgeschehens um mich herum, an dem ich selbst als Interaktant oder als passiver Zuhörer beteiligt war. Dabei hatten Kommunikationssituationen, die räumlich oder zeitlich nicht verschoben waren, den Vorrang gegenüber Radio und Fernsehen, bei denen die Möglichkeit der Rückfrage nicht gegeben war. So ist es zu erklären, daß zwar eine große Anzahl von Sprechern Beiträge zu meinem Korpus geleistet haben, diese Beiträge quantitativ aber erheblich variieren. Während mein Korpus von vielen Personen nur eine einzige Fehlleistung verzeichnet, haben andere Sprecher jeweils weit über 100 Beispiele geliefert. Zu den Informanden ist zu vermerken, daß es sich bei ihnen weitgehend um (durchschnittlich) gebildete Sprecher der Hochsprache im norddeutschen Raum handelt. Nach konventioneller Vorgehensweise wurden die Versprecher sofort nach ihrem Auftreten — wenn erforderlich auch in phonetischer Umschrift — notiert, um mnemonische Störfaktoren zu minimieren. Besonderer Wert wurde dabei aus o.g. Gründen auf die zumindest annähernde Erfassung aller Versprecher in einem bestimmten Zeitraum gelegt. Um Konzentrationsschwächen auszuschalten, dauerten die Sammelperioden selten länger als zwei Stunden. Nicht hingegen notiert werden konnten die Versprecher, die möglicherweise auftraten, während ich mit dem Aufschreiben eines gerade gehörten beschäftigt war. Neben dem handschriftlichen entstand ein kleines Tonbandkorpus durch die Aufzeichnung von Sprechsendungen im Rundfunk und Fernsehen. Dieses diente vor allem der Überprüfung der eigenen Hörfähigkeiten, indem das zur selben Sendung handschriftlich fixierte Material mit der späteren Auswertung des Bands verglichen wurde. Wesentliche Unterschiede konnten dabei nicht festgestellt werden. Erweitert wurde das deutsche Korpus um kleinere Materialsammlungen aus anderen Sprachen. Mit der Anzahl von 6000 Beispielen stößt man ungefähr an die Grenzen dessen, was eine Einzelperson ohne die Hilfe moderner Techniken der Datenverarbeitung in einem überschaubaren zeitlichen Rahmen zu bewältigen imstande ist. Damit erreicht man ungefähr den Umfang der großen amerikanischen Korpora (Fromkin 1975, Stemberger 1985a, Shattuck-Hufnagel 1983a). So paradox es auch klingen mag: mit 6000 ist anderer13 Kleinere Sammlungen sind hingegen angelegt worden, so von Bierwisch (1975), Kettemann (1980) und Wiese (1987). Daneben gibt es einige zum Zwecke der Erheiterung erstellte Sammlungen von Mitarbeitern der öffentlich-rechtlichen Rundfunkanstalten (Rockmann, unveröffentlicht, Hirsch 1981 und Rauch 1978, 1981).
15
seits gerade die untere Grenze dessen erreicht, was für aussagekräftige Analysen erforderlich ist. Denn die Versprechervielfalt ist so enorm, daß nach einer Verteilung auf bestimmte Kategorien manchmal nicht mehr als 10 Elemente auf eine Klasse entfallen. Dies bedeutet, daß sich Prozentverhältnisse durch die Hinzufügung weniger Beispiele drastisch verändern und Schlußfolgerungen damit nur unter Vorbehalt gezogen werden können. Alle im Rahmen dieser Arbeit durchgeführten Analysen basieren auf meinem deutschen Korpus. Soweit vorhanden werden aus der Versprecherliteratur vergleichbare englische Beispiele zur weiteren Illustration herangezogen, in Einzelfallen auch einfachere französische (F), schwedische (S) und holländische (H). Hypothesen können und sollen, darauf sei nachdrücklich hingewiesen, mit den fremdsprachlichen Einzelfällen nicht untermauert werden. Allerdings deuten sie auf die prinzipielle Vergleichbarkeit der Versprecherphänomene über die Einzelsprache hinweg hin (cf. Berg 1987b).
4.3.
Zur Versprecherklassifikation
Das Problem der Theoriegebundenheit jeder Klassifikation ist hinlänglich bekannt (Kainz 1956). Dabei wird das Verhältnis von Theoriebildung und Fehlerklassifikation am besten in einem Kreisprozeß sichtbar. Zunächst entstehen Kategorisierungskriterien aufgrund einer prätheoretischen Erwartungshaltung. Als Beispiel sei auf die in Kap. 3 erläuterte Strategie Fromkins bei der Identifizierung phonemischer versus subphonemischer Größeneinheiten verwiesen. Dieser Schritt hat natürlich Auswirkungen auf die daraus zu entwickelnde Theorie. Demgegenüber führt eine alternative Theorie wie das Aktivationsmodell zu der Prognose, daß Merkmalfehler im Vergleich zu Phonemfehlern die Ausnahme sein müssen, da Merkmale nur einseitig (über die Phoneme), Phoneme aber beidseitig (über die Morpheme und die Merkmale) aktiviert werden. So wird es gegebenenfalls erforderlich, aufgrund der theoretischen Orientierung eine Umklassifizierung vorzunehmen. Letztlich bleibt diese revidierte Klassifikation nicht ohne Rückwirkungen auf die theoretische Arbeit. Theoriebildung und Kategorisierung sind also wechselseitig voneinander abhängig. Wenn sich die eine Seite ändert, zieht das unweigerlich Veränderungen auf der anderen nach sich. Es wird damit deutlich, daß keine Klassifikation objektiv, neutral oder endgültig ist. Die Gefahren, die aus diesem Problem erwachsen, sind nicht zu unterschätzen. Zwei Forscher können zu unterschiedlichen Theorien nicht nur durch unterschiedliche Interpretationen derselben Daten, sondern auch durch divergierende Klassifikationsstrategien gelangen. Fehler — und zwar nicht-sprachliche — können daher sowohl in der Theoriebildung auftreten wie auch klassifikationsgebunden sein. Es empfiehlt sich insofern, bei der kritischen Würdigung der Modelle immer diese Ambivalenz im Auge zu behalten. Nach einer langen Zeit der Entwicklung und Abwandlung hat sich ein Versprecherklassifikationsraster bewährt, welches in seiner Grundstruktur drei Ebenen ansetzt, mit denen jeweils eine Beschreibung der Fehlleistung, eine Ursachenzuweisung und die
16 Erfassung der Größe der involvierten Einheit möglich wird. Alle drei Dimensionen sind irreduzibel und weitgehend voneinander unabhängig. Eine Trennung von Deskription und Explikation wird in der relevanten Literatur nicht konsequent vollzogen. Sie ist nicht nur eine Grundbedingung methodischer Stringenz, sondern auch deswegen ratsam, weil eine vorschnelle Klassifikation in Anbetracht der potentiellen Plurikausalität höchst problematisch ist. Ziel der Trennung von Deskription und Explikation ist es, sichtbare bzw. interpretative Eigenschaften als solche zu kennzeichnen und systematisch voneinander zu unterscheiden. Auf der deskriptiven Dimension wird versucht, das Beobachtbare unter weitgehender Zurückstellung der interpretativen Komponente zu kategorisieren. Hingegen beinhaltet die Zuordnung im explikativen Bereich den Versuch, die Fehlleistung linguistisch bzw. psycholinguistisch zu erklären. Auf der zweiten Dimension soll die Einheit erfaßt werden, die von der Störfunktion betroffen ist. Im folgenden sind die wichtigsten Kategorien nach ihrer Zugehörigkeit geordnet zusammengestellt . Tabelle l: Ein dreidimensionales Raster für die Klassifikation von Versprechern Deskription
Größe der modifizierten Einheit
Explikation
1. Dimension
2. Dimension
3. Dimension
Substitution Addition Elision Doppelsubstitution Addition-Elision
Merkmal Phonem Phonemsequenz Cluster Silbe Lexem Grammem Wort
Antizipation Perseveration Permutation Verschiebung Überblendung Interferenz Kontraktion Assoziation Maskierung
Die mittlere Spalte der Tabelle l führt die wichtigsten Einheiten auf, die durch das Versprechen in Mitleidenschaft gezogen werden können. Sie ist nicht vollständig, da theoretisch jede beliebige Größe versprecherfähig ist. Mit den fünf deskriptiven Kategorien sind die theoretischen Möglichkeiten der Oberflächenbeschreibung nahezu vollständig erfaßt, wobei sich die Doppelsubstitution und die Addition-Elision bereits als Kombinationen der drei grundlegenden Kategorien der Addition, Elision und Substitution erweisen. Andere als die aufgeführten Kombinationen sind in der Praxis kaum nachzuweisen. Die dritte Dimension ist prinzipiell offen, da hier nur die bekannten Versprechermechanismen aufgeführt sind. Es ist aber nicht auszuschließen, daß mit der Zeit weitere Kategorien hinzukommen können. Die Diskussion der einzelnen Versprechertypen erfolgt im Hauptteil dieser Arbeit. Es muß darauf hingewiesen werden, daß auch mit diesem Raster eine strikte Trennung von Deskription und Explikation nicht zu erreichen ist. So enthält z.B. die Doppelsubstitution auf der deskriptiven Ebene insofern eine explikative Komponente, als hier zwei Modifikationen an zwei verschiedenen Positionen in einen Kausalzusammenhang
17
gebracht werden. Zur Illustration sei auf (4) verwiesen. (4)
Ich bitte herzlich um VerAei.zung-- Verzeihung.14
Die naheliegende Erklärung, daß es sich in (4) um eine Permutation handelt, wird dadurch relativiert, daß theoretisch auch zwei voneinander unabhängige Fehlerprozesse wirksam gewesen sein könnten, nämlich die Perseveration des /h/ und die des /ts/. Solche Fälle sind zwar selten, weisen aber auf die Grenzen des vorgeschlagenen Kategorisierungsschemas hin. Ein weiteres Problem liegt in der Tatsache, daß auf der dritten Dimension nicht alle Versprechertypen gleichwertig sind. So sind die reinen Antizipationen irreduzibel, die Maskierungen und Verschiebungen aber ihrer Wirkungsrichtung nach als antizipatorisch bzw. perseveratorisch zu untergliedern. Hier wird es also erforderlich, mit Unterkategorien zu arbeiten. Dieses dreidimensionale Klassifikationsraster eröffnet die Perspektive, die Möglichkeiten und Grenzen des Zusammentreffens der Kategorien aus den drei Ebenen in einem Versprecher auszuloten. Dieses Verfahren kann ein wichtiger Anhaltspunkt für die Theoriebildung sein. Über das vorgelegte Klassifikationsraster hinaus läßt sich eine Vielzahl von Subkategorisierungen vornehmen. Dabei ist abzuwägen, bis zu welchem Punkt die Aufteilung in Unterkategorien noch sinnvoll ist. Geht die Kategorisierung nicht weit genug, besteht die Gefahr, daß wichtige Unterschiede innerhalb einer Gruppierung unerkannt bleiben, geht sie hingegen zu weit, ist nicht auszuschließen, daß übergeordnete Regularitäten durch eine Zersplitterung verwischt werden. Generell besteht in der Literatur eher die Neigung zu vorschnellen Verallgemeinerungen. Dieses wird in späteren Kapiteln deutlich werden. Die Möglichkeit der Subklassifikation ist besonders im phonologischen Bereich vorhanden. Folgende Kriterien dienen hier der Ausdifferenzierung: 1. Der Abstand zwischen Ziel- und Quellelement: Dieser Abstand wird in der Literatur in der Regel silbisch gemessen (Nooteboom 1969). Es scheint jedoch, daß eine mehr linguistisch orientierte Verfahrensweise vorzuziehen ist, in der respektierte oder ignorierte Grenzen von Größeneinheiten der entscheidende Faktor sind. Für das Deutsche mit seinen zahlreichen Komposita ergeben sich damit die Möglichkeiten von intramorphemischen, intraverbalen15, interverbalen und interclausalen bzw. -sententiellen Versprechern. Eine Zuordnung zu einer der vier Unterklassen ist in den meisten Fällen eindeutig vorzunehmen. Probleme gibt es natürlich dort, wo eine präzise Definition von den Begriff des Worts gefordert ist und wo das in der gesprochenen Sprache so häufige Phänomen der Satzsegmentierung auftritt. Sollte man bei einem eventuellen Versprecher in dem deutschen Wort Wassermühle eine intraverbale, hingegen in der englischen Entsprechung water mill eine interverbale Analyse ansetzen? Die Orthographie ist hier sicherlich nur in beschränktem Maße als Argument heranzuziehen. Aufgrund der relativen Kohärenz der 14 Es handelt sich hier um die Interaktion von Phonemen, so daß die unterschiedliche phonetische Realisierung des /h/ in betonter und unbetonter Silbe vernachlässigt werden kann. 15 Verbal wird hier und im folgenden in Ermangelung einer Alternative als Adjektiv zu Wort verwandt.
18 Komposita, wie sie beispielsweise im Betonungsmuster zum Ausdruck kommt, wird die intraverbale Interpretation vorgezogen. Die Entscheidung, ob (5)
Das ist zu diesem Scheit-- Zeitpunkt, Herr Schüttle, schwer zu sagen.
interverbal oder interclausal zu werten ist, wird hier zugunsten der interverbalen Interpretation getroffen, da die Anrede keinen Satzcharakter aufweist. 2. Nähe versus Distanz: Unter Distanz sind solche Fälle zu verstehen, bei denen die Interaktion näherer Elemente von der sprachlichen Struktur her möglich gewesen wäre, aber nicht erfolgt ist, wie in (6). (6)
Das war schehr— sehr gut und schön.
Obwohl das /g/ in gut dichter an der Zielposition steht, läßt sich das /z/ von dem /JV aus schön verdrängen16. Distanz liegt also immer dann vor, wenn ein prinzipiell geeignetes, näher stehendes Element nicht in den Fehlerprozeß einbezogen wird. Dabei ist die Bestimmung der Eignung zweifelsfrei theoriegebunden. Hierzu müssen alle bekannten Eigenschaften der Versprecher herangezogen werden. Wenn beispielsweise die in der Mitte stehende Größe mittelbar einer syntaktischen Kategorie zuzurechnen ist, die generell Tendenzen zur Versprecherresistenz aufweist, besteht kein Grund, davon auszugehen, hier sei ein geeignetes Element übersprungen worden. Es ist schließlich daraufhinzuweisen, daß Nähe nicht unbedingt im wörtlichen Sinn zu verstehen ist. Nicht-distante Versprecher können durchaus im Falle einer mangelnden Eignung des dazwischen befindlichen Materials Ziel- und Quellelemente betreffen, die erheblich auseinanderliegen. 3. Die Silbenposition phonemischer Versprecher: Es ist allgemein bekannt, daß sich Versprecher sehr unterschiedlich auf die einzelnen Silbenpositionen verteilen, wobei die Anlautposition überdurchschnittlich repräsentiert ist (Nooteboom 1967, Stemberger 1983b). Dieses Faktum legt die Vermutung nahe, daß versprecherbeeinflussende Faktoren möglicherweise positionssensitiv operieren. Zu klären bleibt bei diesem Punkt jedoch die Frage, an welcher linguistischen Größe die Position definiert werden soll. Selbst die gründlichsten Versuche zur Klärung dieses Problems schlugen insofern fehl, als sich keine Größe als die Referenzeinheit empfahl. Diese Ergebnisse zeigen eher die Müßigkeit der Suche nach einer einzigen richtigen Lösung; hier war die Frage offenbar falsch gestellt. Richtiger erscheint die Annahme, daß alle Größen durch ihre nur partielle Überlappung eine gewisse Eigenständigkeit haben und insofern alle ihren Beitrag zu dem Positionseffekt leisten. Als Einstieg wird hier trotz der Ergebnisse von Shattuck-Hufnagel (1982b) die Silbe gewählt, hauptsächlich deswegen, weil damit die detailliertesten Analysen möglich sind. Dabei müssen die anderen Referenzeinheiten nicht unberücksichtigt bleiben. Falls erforderlich, kann also zwischen wort-, lexem- und silbeninitialen Versprechern unterschieden werden. 16 Voraussetzung dafür, daß eine solche Argumentation sinnvoll ist, ist natürlich die Annahme, daß die Entfernung zwischen Ziel- und Quellphonem ein relevanter Faktor in der Versprecheranalyse ist. Siehe dazu weiter unten.
19
4. Wortklassenidentität: Schließlich besteht die Möglichkeit, phonemische Versprecher danach zu klassifizieren, ob ihre jeweiligen Ziel- und Quellelemente Einheiten der gleichen Wortart angehören oder nicht. Diese Frage setzt natürlich voraus, daß die Syntax einen Einfluß auf die Phonologic ausüben kann. Würde man diesen Faktor ignorieren, käme das der impliziten Annahme gleich, daß ein solcher Einfluß nicht existiert. Ein diesbezüglicher Nachweis müßte aber erst noch erbracht werden.
4.4.
Das Korpus in der Gesamtschau: Grundlegende Tendenzen
Um einen allgemeinen Eindruck von dem erstellten Korpus zu vermitteln, sollen den Detailanalysen der späteren Kapitel einige Informationen im Überblick vorangestellt werden. Versprecher entstehen generell durch den wechselseitigen Druck, den die sprachlichen Elemente aufeinander ausüben. Dieser Druck kann paradigmatischer oder syntagmatischer Art sein, wobei beide Aspekte zusammenspielen und insofern additiv wirken können. Insgesamt betrachtet sind syntagmatische Versprecher häufiger als paradigmatische; das Verhältnis der beiden Typen zueinander variiert allerdings in Abhängigkeit von der Größe der modifizierten Einheit. So sind die paradigmatischen Fehlleistungen auf der Wortebene deutlich stärker vertreten als auf der Phonemebene. Es gibt zwei denkbare Auswirkungen des Drucks innerhalb des sprachlichen Systems. Entweder unähnliche Elemente werden ähnlich (bzw. identisch) oder ähnliche (bzw. identische) Elemente werden unähnlich gemacht. Beide Möglichkeiten sind auch im Korpus belegt, wobei »Dissimilationen« im Vergleich zu den »Assimilationen« einen geringen Prozentsatz ausmachen. Je nach Wirkungsrichtung im Satz läßt sich weiterhin zwischen antizipatorischen und perseveratorischen Fehlleistungen unterscheiden. Bei den »Assimilationen« dominiert mehr die antizipatorische Richtung, während bei den »Dissimilationen« die perseveratorische häufiger ist. Auch wenn die Versprechervielfalt enorm ist, konzentriert sich die überwiegende Mehrzahl der Fehlleistungen auf wenige Kategorien. Qualitativ sind also der Versprecherausprägung kaum Grenzen gesetzt, quantitativ jedoch in erheblichem Maße. Die beiden Größen, die mit Abstand am häufigsten in Versprecher involviert sind, umfassen die Phoneme und die Wörter, wobei jene noch stärker vertreten sind als diese. Will man bei den Phonemen weiter unterteilen, läßt sich feststellen, daß Vokale seltener in den Versprecherprozeß hineingezogen werden als Konsonanten. Bei letzteren läßt sich ein Positionseffekt ausmachen: Die Initialposition ist nämlich, wie bereits erwähnt, weit anfälliger für Versprecher als die übrigen Positionen. Eine weitere Beeinflussung entsteht durch den Betonungsgrad der Silbe, in der sich das betreffende Segment befindet. Elemente unbetonter Silben sind viel resistenter als solche aus betonten. Auf der deskriptiven Ebene erweisen sich die Substitutionen als die häufigste Versprecherkategorie; ihnen folgen die Additionen und Elisionen. Die bipositionellen Klassen der Doppelsubstitution und der Addition-Elision sind dagegen selten. Damit ist bereits für den explikativen Bereich ausgesagt, daß Permutationen und Verschiebungen nur in geringem Umfang in meinem Korpus zu verzeichnen sind. Am häufigsten sind die Antizipationen, deutlich seltener bereits die Perseverationen.
20
Aus dem Vorangehenden läßt sich die am stärksten vertretene Untergruppe im Korpus ableiten: Es ist eine antizipatorische Phonemsubstitution in initialer Position und in betonter Silbe. Im empirischen Teil dieser Arbeit werden diese und viele andere Kategorien an Beispielen verdeutlicht und ihre Besonderheiten erörtert. An dem skizzierten »Massierungsverhalten« der Versprecher ist zu erkennen, daß sie als abweichende Sprachmuster ausgeprägten Gesetzmäßigkeiten unterliegen. In der Tat ist darin die Voraussetzung für eine wissenschaftliche Beschäftigung mit ihnen zu sehen.
21
5.
Das Handwerkzeug: die versprecherbeeinflussenden Faktoren
In diesem Kapitel soll das »Handwerkzeug« für die empirischen Analysen im Hauptteil bereitgestellt werden. Hierbei geht es um all die Faktoren, die einen Einfluß auf das Entstehen bzw. die Ausprägung der Fehlleistungen haben. Diese Faktoren, die zur Grundlagenforschung in diesem Bereich der Psycholinguistik gehören, sind zu einem relativ großen Prozentsatz bekannt. Es empfiehlt sich hier eine klare Trennung von linguistischen und psycholinguistischen Bedingungen. Im großen und ganzen besteht bei der Beurteilung der sprachlichen Gegebenheiten Einigkeit, während ihre sprachproduktionelle Einordnung naturgemäß Gegenstand heftiger Kontroversen ist. Für unsere Belange ist dabei die Existenz eines bestimmten Phänomens von größerer Bedeutung als die Umstrittenheit seiner psycholinguistischen Interpretation. In dem, was folgt, sollen nun die wesentlichen Ergebnisse der Grundlagenforschung zusammengetragen werden. Wenn alle versprecherbeeinflussenden Faktoren auf einen Nenner gebracht werden müßten, so wäre es gewiß der der Ähnlichkeit. Shattuck-Hufnagel (1982a) folgend empfiehlt sich zur Systematisierung der Problematik eine Trennung in extrinsische und intrinsische Ähnlichkeit. Letztere bezieht sich auf die analytische Beschreibung von Elementenpaaren, also den Grad der Übereinstimmung hinsichtlich der Merkmale bei Phonemen oder der Phoneme bei Morphemen. Unter ersterer ist das gesamte Beziehungsgeflecht zu verstehen, in welches ein bestimmtes Element eingebunden ist. Dazu zählen Silbenposition, Betonung, Nachbarschaft usw. Der Begriff ist damit etwas weiter gefaßt als bei Shattuck-Hufnagel (1982a), die ihn vor allen Dingen auf die Silben- bzw. Wortposition bezieht. Es ist nicht ohne eine gewisse Verwunderung zu verzeichnen, daß die Beurteilung der intrinsischen Ähnlichkeit nicht einhellig ist. Während die phonetische Ähnlichkeit interagierender Segmente nach anfänglichen Zweifeln (Boomer & Laver 1968) inzwischen allgemein akzeptiert ist, bestehen in der Einschätzung der Wortfehler Meinungsunterschiede. Unangefochten ist zwar, daß paradigmatische Wortmodifikationen sowohl im semantischen als auch im formalen Bereich sich ähneln können, Garrett (1982:83) hat jedoch wiederholt bestritten, daß beide Dimensionen der Ähnlichkeit additiv die Wahrscheinlichkeit eines Versprechers beeinflussen. Auch bestreitet er den Einfluß der Phonologic auf Wortpermutationen.17 Beide Problembereiche sind empirisch angegangen worden: Sowohl im syntagmatischen als auch im paradigmatischen konnte die Rolle der Ähnlichkeit überzeugend nachgewiesen werden (zum Problem der additiven Wirkung, cf. Shallice & 17 Es ist zu vermuten, daß seine Ansicht durch die prognostischen Grenzen seines Modells geprägt ist.
22
McGill 1978, Harley 1984; zum Problem der phonologischen Motivierung von Wortvertauschungen, cf. Dell 1980, Dell & Reich 1981). Kommen wir zur extrinsischen Ähnlichkeit. Es hat sich in diesem Bereich herausgestellt, daß die Versprecher Einflüssen äußerst unterschiedlicher Herkunft unterliegen. Die meisten relevanten Ergebnisse stammen aus experimentalpsychologischen Studien, die direkt für den Nachweis solcher Einflüsse konzipiert wurden. Die in dieser Arbeit zur Verwendung kommenden werden im folgenden kurz vorgestellt. Eines der ältesten Phänomene in der Versprecherforschung ist die Erkenntnis, daß die Wahrscheinlichkeit einer phonemischen Substitution davon abhängt, ob die daraus resultierende Phonemsequenz lexikalisiert ist oder nicht. Schon Wundt (1900) und Bawden (1900) hatten derartige Einflüsse vermutet. Das Problem wird in (7) an einem positiven (a) und einem negativen (b) Beispiel verdeutlicht. (7)
a. It's a rraeal mistery. statt: a real mistery. (Fromkin 1973b) b. »active perbs. statt: ^active verbs. (Fromkin 1973b)
Auch hier sei der Vollständigkeit halber daraufhingewiesen, daß der Lexikalitätseffekt als solcher nicht allgemein anerkannt wird (Fromkin 1980, Garrett 1976). Alle Untersuchungen, die sich einem direkten Test dieser Frage verschrieben haben, kommen jedoch zu demselben positiven Ergebnis (Baars, Motley & MacKay 1975, Dell & Reich 1981, Motley 1986, Berg 1986a). Uneinigkeit besteht auch in der Frage, wie dieses Phänomen zustande kommt. Im Aktivationsmodell ist die Erklärung recht einfach, da sich der Effekt als natürliche Folge der Hypothese ergibt, daß Wörter und Segmente auf unterschiedlichen Ebenen repräsentiert sind und eine lexikalisierte Phonemsequenz »Bestätigung« von den höheren Ebene erhält und insofern mehr Aktivation als eine nicht-lexikalisierte auf sich verbuchen kann (Dell & Reich 1977). Demgegenüber sehen Baars, Motley & MacKay (1975) in diesem Phänomen das Wirksamwerden einer präartikulatorischen Kontrollinstanz. Der zweite Effekt steht zumindest von seiner theoretischen Interpretation her mit der Lexikalität im Zusammenhang. Motley & Baars (1975a) konnten experimentell eine Sensitivität von Phonemsubstitutionen' auf Übergangswahrscheinlichkeiten nachweisen. Versprecher reagieren also darauf, ob durch das neue Phonem eine häufigere oder seltenere Phonemverbindung entsteht. Im Englischen z.B. ist die Sequenz /nau/ häufiger als /kau/ im Wortanlaut zu finden, so daß cosy nooks u.a. aufgrund dieses Faktors zu nosy cooks wird. Dell (1980:153) schlägt vor, diesen Effekt als ein Nebenprodukt der Lexikalität anzusehen, da häufigere Kombinationen an mehr lexikalische Elemente gebunden sind und ihnen durch diese mehr Aktivation zugeführt wird. Dieser Effekt soll hier jedoch trotz seiner Relevanz nicht weiterverfolgt werden, da bisher keine statistischen Auswertungen von Übergangswahrscheinlichkeiten im Deutschen vorliegen (G. Altmann, persönliche Mitteilung). Deshalb kann dieses Phänomen im empirischen Teil dieser Studie auch nicht berücksichtigt werden. Meiers (1967) Auszählungen sind für unsere Zwecke zu grob, da sie nicht nach Positionen im Wort differenziert sind. Der dritte Effekt bezieht sich auf die Nachbarschaft der interagierenden Segmente. Es
23
konnte experimentell demonstriert werden, daß die Häufigkeit eines Versprechers davon mitbestimmt wird, ob die in den Fehlerprozeß involvierten Phoneme von identischen Elementen flankiert werden oder nicht (Dell 1984, aber auch schon MacKay 1970a). Wiederum wird das Phänomen durch ein positives (a) und ein negatives (b) Beispiel illustriert. (8)
a. I go and jack my pack, statt: I go and pack, my jack. (Wogenstein 1977) b. I didn't explain this c/arefully enough, statt: c arefully enough. (Shattuck-Hufnagel 1979)
Darüber hinaus konnte Dell (1984) zeigen, daß nicht nur unmittelbare, sondern auch mittelbare Elemente von diesem Effekt betroffen sind. Die theoretische Diskussion dieser Spielform der Ähnlichkeit soll später erfolgen. Im folgenden versprecherbeeinflussenden Faktor handelt es sich um eine Konstellation, bei der sich in der Nähe des Zielelements ein mit ihm identisches Element, der Trigger, aufhält, ohne selbst direkt (also als Fehler, Quelle oder Ziel) an dem Fehlerprozeß beteiligt zu sein. Die nächsten Beispiele illustrieren die konstitutiven Bestandteile der Versprecher. (9) a. beef needle soup, statt: beef noodle soup. (Fromkin 1973b) b. Deshalb im letzten Moment in die Runrfe eingeladen- eingeladen: Walter Träger. In (9) beispielsweise ist das /i:/ in needle das Fehlerelement, das /u:/ in noodle das Ziel, das /i:/ in beef die Quelle und das /u:/ in soup der Trigger. Shattuck-Hufnagel (1979) sieht die Funktion des Triggers in einer Schwächung des Zielelements, was zu einer erhöhten Fehlerquote führt. Es blieb bis auf den heutigen Tag bei dieser Hypothese, ein direkter Beweis der Existenz des Triggers, der am ehesten experimentell zu erbringen wäre, steht noch aus. Jedoch läßt sich dieses Defizit durch eine indirekte Beweisführung ausgleichen. Wie Shattuck-Hufnagel (1979) ausführt, ähneln getriggerte Versprecher den Maskierungen. Diese Kategorie bringt zum Ausdruck, daß die Identität zweier in Nachbarschaft stehender Größen Verarbeitungsschwierigkeiten mit sich bringen kann (»Ranschburgsche Hemmung«), so daß X, entweder die Produktion von X2 gefährdet oder umgekehrt. An der Existenz dieses Mechanismus besteht kein Zweifel (MacKay 1969). In dem Moment nun, wo nachgewiesen werden kann, daß die Wahrscheinlichkeit einer Substitution nicht nur von der Stärke des verdrängenden, sondern auch von der Schwäche des verdrängten Elements abhängt, wäre der Trigger als begünstigender Faktor ursächlich an der Entstehung des Fehlerprozesses beteiligt. Diese Annahme ist nicht nur intuitiv plausibel, sie konnte auch in Dells (1980:142) Computersimulationsexperimenten bekräftigt werden. Der Trigger gliedert sich damit als vierter Faktor (nach Fehler, Ziel und Quelle) in die Versprecherdeskription ein. Damit ist jedoch noch nicht geklärt, ob allen zielidentischen Elementen automatisch eine Triggerfunktion zugesprochen werden kann. Bei der Identifikation eines potentiellen Triggers ist es naheliegend, dieselben Maßstäbe anzulegen, die für die Identifikation der übrigen Fehlerfunktionsträger gelten (so z.B. die Nahe oder die Involvierung von openclass words). Der sinnvollste Weg ist daher, mit Hilfe einer Art Kommutationsprobe fest-
24
zustellen, ob das angenommene Triggerelement auch als Fehler hätte fungieren können.18 Ist dies der Fall, kann der Trigger als identifiziert gelten. Hier wird einmal mehr die Theorieabhängigkeit der Versprecherdeskription deutlich. Eine weitere Spielform der externen Ähnlichkeit könnte dadurch ermittelt werden, daß die Wortklassenidentität derjenigen Wörter bestimmt wird, in denen es zu einer phonemischen Interaktion gekommen ist. Diese Möglichkeit wurde bereits im letzten Kapitel angesprochen. Eine indirekte Beweisführung liefe darauf hinaus, den Einfluß der Syntax als Funktion verschiedener Versprecherkategorien zu berechnen. Auf der Basis von Garretts (1980:196) Daten läßt sich ermitteln, daß Antizipationen und Perseverationen von Phonemen in 31% der Fälle das syntaktische Identitätskriterium erfüllen, während dies bei Permutationen in immerhin 39% der Fälle so ist. Der X2-Test deutet aber nur auf eine schwache Signifikanz hin: 3,02, p ,0. θ'
CM Μ >
Ή
?£& & flJ rt ^H rt
co w
^o<
CM
W >
~*—s >»-·'
0 "u B
~-B
o"
-, 13
CM w *B
OT'O'
-H Ϊ?
w1
ο
u > u *^ »·Η U pi U C O t J B > C M B > 5'O'
en
o,
>
>·
In ΟΪ
^^"Tl 'S t>
B2. Sätze, die zwei benachbarte Lexemkomplexe enthalten, sind allerdings selten, so daß es nicht verwunderlich ist, daß Versprecher wie (72) in meinem Korpus kaum belegt sind. (72)
Wir haben morgen Elternabend vom K.inderabend— vorn Kindergarten.
Es ist daher erforderlich, das Blickfeld auf die monolexemischen Wörter als einem Interaktionspartner auszuweiten. Streng genommen verlassen wir damit wieder den morphologischen Bereich und kommen auf die Analyse im Kap. 9.6. zurück. Dieser Schritt erscheint jedoch dadurch gerechtfertigt, daß diese Fälle denselben Gesetzmäßigkeiten unterliegen wie die rein morphologischen Modifikationen. Eine erste Vermutung wäre, daß die Interaktion aufgrund der im phonologischen Bereich ermittelten Positionskonstanz immer nur zwischen dem Wort und dem 1. Bestandteil der polylexemischen Einheit stattfindet. Dem ist jedoch nicht so: Von insgesamt 20 ( + 3 zweideutigen) Versprechern, die sich für die Analyse eignen, betreffen 9 den 1. Bestandteil des Lexemkomplexes und 11 den 2. Daß die Modifikation in der Initialposition nicht höher ist, als per Zufall zu erwarten wäre, ist etwas verwunderlich. Es deutet darauf hin, daß ein anderer Faktor diesen Effekt neutralisiert. Was führt also zu einer Substitution des 1. Bestandteils in (73) und des 2. in (74)? (73)
Da ist ein Bäcker— ein Fleischer in der Bäckerstra&e.
(74)
Mit Ihrem Austritt ist also nach wie vor Kritik an diesem Milliarden£nVz£-- /credit verbunden.
So deutlich wie in (73) die semantische Ähnlichkeit zutage tritt, so deutlich ist es die formale in (74). Welcher Faktor hier dominiert (ohne daß der andere damit bedeutungslos würde), wird schnell sichtbar, wenn man den Konstruktionstest durchführt. Es zeigt sich nämlich, daß in 18 von 20 Fällen die Konstruktion zu einer größeren semantischen Anomalie führt. Dies tritt besonders stark in den konstruierten Lexemkomplexen hervor. Eine Milliardenkritik wie in (74) ist beispielsweise weniger bizarr als ein Kritikkredit. Das Ergebnis, daß die semantische Wohlgeformtheit das entscheidende Kriterium bei der Entscheidung für das 1. oder 2. Element ist, ist insofern von Bedeutung, als der Einfluß semantischer Faktoren auf die Sequenzierung von Wörtern und Lexemen in der Literatur negiert worden ist (Garrett 1976). In der Tat ist es schwerer, das Ausbleiben der semantischen Dimension theoretisch aufzuarbeiten als ihr Vorhandensein. Aus der Hypothese der semantischen Einflußnahme läßt sich eine interessante Prognose ableiten. Wenn die Semantik Substitutionen in der 2. Lexemposition begünstigt, müßte das Paradigma in dieser Position offener als in der 1. sein. Das erste Element müßte sich also leichter an ein zweites angliedern können als umgekehrt. Mit anderen
83
Worten: Das Determinatum sollte generell über weniger Bindungsarme verfügen als das Determinans. Dabei ist zu bedenken, daß neben den realisierten auch potentielle Bindungsarme und eventuell auch die Häufigkeiten der jeweiligen Komposita zu berücksichtigen sind. Untersuchungen, die zur Überprüfung dieser Prognose herangezogen werden könnten, sind mir aus der Wortbildungsforschung jedoch nicht bekannt.
9.8.
Segment versus Suprasegment
Nachdem auf den vorangegangenen Seiten ausschließlich syntagmatische Fehlleistungen zur Sprache gekommen sind, soll in diesem abschließenden Kapitel zur Größe der modifizierten Einheit paradigmatischen Fällen Aufmerksamkeit geschenkt werden.48 Eine Unterklasse von ihnen ist durch die Störung eines verwandten Worts auf der phonologischen Ebene gekennzeichnet. Da diese Gruppe recht heterogen ist, wird sie unter der Bezeichnung Interferenz eines morphologischen Nachbarn*9 geführt. Dieser Fehlertypus manifestiert sich sowohl auf der segmentalen (75) als auch auf der suprasegmentalen (76) Ebene. (75) (76)
a. Diese Planung ist nichts StatiAes— StatijcAes. (StatiA) b. The »SED« translated as the »Socialist Unity— Unity Party«, (unison) a. daß gewisse Dinge terminologisch— terminologisch zustande kommen. (Terminologie) b. F: Quelquefois, ce sont les municipolites— municipalites. (municipal)
Die offensichtliche Ähnlichkeit zwischen (75) und (76) legt die Möglichkeit eines Vergleichs von segmentaler und suprasegmentaler Modifikation nahe. Wie bei der Analyse der Cluster -»Phonem-Interaktionen läßt sich die ganze Problematik mit einer einzigen Regel erfassen: Diejenige Ebene wird affiziert, auf der — von links nach rechts gesehen — die erste Diskrepanz auftritt. Liegt diese im segmentalen Bereich, entsteht ein segmentaler Fehler, liegt sie im suprasegmentalen Bereich, entsteht ein Wortbetonungsfehler. Die obigen Beispiele verdeutlichen diese Gesetzmäßigkeit. In (75) gleichen sich Ziel- und Quellwort in ihrem Betonungsmuster, während in (76) die segmentalen Unterschiede erst im suffigalen Bereich auftreten, nachdem die suprasegmentale Struktur bereits divergierte. Interessant ist bei dieser Regularität die Leseweise von links nach rechts. Sie wird im theoretischen Teil wieder aufgegriffen werden. Abschließend sei darauf aufmerksam gemacht, daß die Tatsache, daß die segmentalen Versprecher viermal so häufig vorkommen wie die suprasegmentalen, nicht automatisch als Indiz für eine größere Modifikationsresistenz der Suprasegmente gewertet werden kann. Dieser zahlenmäßige Unterschied ergibt sich u.a. daraus, daß eine Diskrepanz aufgrund der zahlreichen Oppositionsverhältnisse im segmentalen Bereich erheblich wahrscheinlicher ist als im suprasegmentalen. Aufschluß über dieses Problem könnten solche 48 Damit ist keine rigorose sprachproduktionelle Trennung in Syntagmatik und Paradigmatik impliziert. 49 Über den ihr zugrunde liegenden Fehlerprozeß (Überblendung oder nicht) ist damit noch nichts gesagt.
84 Fälle geben, bei denen die Diskrepanz im einen wie im anderen Bereich an derselben vokalischen50 Position auftritt. Sie sind jedoch in meinem Korpus nicht belegt.
50 Diese Vergleichsmöglichkeit ergibt sich natürlich nur dann, wenn es legitim ist, die Wortbetonung im Nucleus verankert zu sehen.
85
10.
Die explikative Dimension
10.1.
Antizipation versus Perseveration
10.1.1.
Die Rolle der distinktiven Merkmale
Es folgt die Analyse der explikativen Dimension, wobei die Kontrastierung von Antizipation und Perseveration an den Anfang gestellt werden soll. Antizipationen enthalten eine oft beklagte Schwierigkeit. Durch die Häufigkeit der Selbstkorrektur zwischen dem Fehler- und dem Quellelement lassen sie sich nicht von den Permutationen abgrenzen. Versprecher wie (77) können insofern entweder eine unvollendete Antizipation oder eine beginnende Permutation sein. (77)
about to ball— ßll out of the balcony. (Fromkin 1973b)
Der einfachste Weg wäre, derartige Fälle zu ignorieren und nur vollständige Antizipationen zu berücksichtigen. Bei einem Verhältnis von 1:10 in meinem Korpus würde dies jedoch die Materialgrundlage erheblich schmälern und einen quantitativ soliden Vergleich zwischen den Kategorien unmöglich machen. Es wird daher nötig, zwei getrennte Kontrastierungen für die eine wie für die andere antizipatorische Kategorie durchzuführen. Da sie in ihrem Verhalten kaum voneinander abweichen, soll in den meisten Fällen der Vergleich mit der quantitativ wichtigeren Kategorie vorgestellt werden. Die erste Frage, die sich bei der Kontrastierung von phonemischen Antizipationen und Perseverationen stellt, ist, ob sie preferentiell unterschiedliche Elemente oder Elementengruppen in den Fehlerprozeß hineinziehen. Allerdings wären die Voraussetzungen für eine solche Asymmetrie nicht leicht gegeben. Damit sie zustande kommen kann, ist es nämlich erforderlich, daß systematisch bestimmte Lautgruppen von anderen verdrängt werden. Stehen diese dann weiter hinten im Satz, wird eine Perseveration wahrscheinlicher, sind sie weiter vorne, besteht mehr Gelegenheit für eine Antizipation. Nun haben Shattuck-Hufnagel & Klatt (1979a) gezeigt, daß sich das Konzept der Dominanz nicht auf phonemische Substitutionen anwenden läßt. Eine psycholinguistische Alternative bestünde in der Annahme, daß den explikativen Versprecherkategorien unterschiedliche Generierungsmechanismen zugrunde liegen und diese Unterschiedlichkeit sich in ihrer Reaktion auf subphonemische Information zeigt. Trotz der Schwierigkeiten, die sich bei der theoretischen Begründung unterschiedlicher Fehlergenerierungsmechanismen für Antizipationen und Perseverationen ergeben, sind derartige Hypothesen in der Literatur aufgestellt worden. Diese sind dazu noch konträr in ihren Aussagen. Während Shattuck-Hufnagel & Klatt (1979b), ohne direkt die zur
86 Diskussion stehenden Fehlerklassen zu kontrastieren, eine Tendenz zur Bewahrung der Artikulationsart in Perseverationen feststellen, wird selbiges Merkmal bei Reich (1977) besonders häufig in Perseverationen modifiziert. Diese Aussagen sind leicht zu überprüfen. Dazu wurden unter Anwendung des dreigliedrigen Merkmalsystems alle konsonantischen Versprecher auf ihre subphonemischen Veränderungen untersucht, also auch mehrere in einem Fehler. Dabei ergibt sich folgendes Bild: Tabelle 31: Art der Merkmalinvolvienmg als Funktion der explikativen Klasse explikative Klasse
Stimme
Art
Ort
Antizipation
123 (10%)
493 (40%)
623 (50%)
Perseveration
40 (9%)
166 (37%)
241 (54%)
Auch wenn leichte Unterschiede bei Art und Ort nicht zu übersehen sind, läßt sich im großen und ganzen feststellen, daß sich weder Reichs (1977) noch Shattuck-Hufnagel & Klatts (1979b) Hypothese mit meinem Korpus bestätigen läßt. Zu Vermutungen, daß hier interlinguale Unterschiede bei der Verarbeitung des Deutschen und des Englischen eine Rolle spielen, besteht kein Anlaß. Denn auch Dell (1980) konnte mit seinem englischen Korpus Reichs Modell falsifizieren. Unser erstes Ergebnis ist also ein negatives: Die Entscheidung, ob antizipatorisch oder perseveratorisch modifiziert wird, hängt nicht mit unterschiedlichen phonologischen Eigenschaften des involvierten Materials zusammen.
10.1.2.
Die Rolle der Betonung
Bekanntlich umfaßt die Betonung zwei recht unterschiedliche Aspekte, je nachdem, ob sie ein Einzelwort oder einen Satz zur Domäne hat. Trotz ihrer andersartigen Repräsentation und Determiniertheit beeinflussen Wort- und Satzbetonung im Prinzip dieselbe linguistische Größeneinheit: die Silbe. Die Tatsache, daß die Unterschiede mehr in der Herkunft der Beeinflussung liegen, bedingt, daß beide Betonungsarten in jeweils anderen Entscheidungsbereichen potentiell relevant sind: Die Satzbetonung ist für interverbale, die Wortbetonung für intramorphemische Versprecher von Bedeutung. Normalerweise gilt im Fehlerprozeß das Ähnlichkeitsprinzip, nach welchem Versprecher vorrangig in gleich stark oder schwach betonten Silben auftreten. In diesem Bereich ist insofern wenig Aufschlußreiches zu erwarten. Dieses Ähnlichkeitsprinzip wird nun — notgedrungenermaßen — in zwei Punkten außer Kraft gesetzt, nämlich dort, wo aufgrund der sprachlichen Bedingungen eine Gleichheit auf der suprasegmentalen Ebene nicht vorhanden ist. Dies ist im intramorphemischen Bereich hinsichtlich der Wortbetonung und im interverbalen hinsichtlich der Satzbetonung der Fall. Denn es kann jeweils nur eine Silbe im Wort
87
die Wortbetonung und im Satz die Satzbetonung tragen. Um diese sprachlich bedingten Asymmetrien wird es in der folgenden Analyse gehen. In der Versprecherforschung wird die Rolle der Wortbetonung ebenso wie die der Satzbetonung kontrovers diskutiert. Beginnen wir mit ersterer. Bei der Auswertung des deutschen Korpus von Meringer stellte MacKay (1970a, 1971) bei Permutationen und Antizipationen eine Tendenz zum verfrühten Auftreten von Phonemen aus betonten Silben fest (stress pre-entry). Nicht untersucht wurde dabei, inwieweit bei Perseverationen der gegenteilige Effekt (stress post-entry) auftritt. Dieses empirische Ergebnis interpretiert MacKay als Hinweis darauf, daß betonte Elemente ein höheres Aktivationsniveau besitzen als unbetonte. Erstaunlicherweise konnte ShattuckHufnagel (1983a) diesen Effekt anhand ihres englischen Korpus nicht bestätigen. Daß hier einzelsprachliche Bedingungen ausschlaggebend sind, wie sie vermutet, darf aufgrund der Ähnlichkeit beider Sprachen in bezug auf die hier relevanten Aspekte (Tendenz zur Erstsilbenbetonung, Silbenzahl, usw.) bezweifelt werden. Zur Klärung dieses Punkts wäre wohl eine interlinguale Experimentalstudie erforderlich. Eine ähnliche Kontroverse ist bei der Beurteilung der Satzbetonung zu erkennen. Boomer & Laver (1968) stellten in ihrem Minimalkorpus fest, daß das Tonwort besonders häufig als Quelle in den Fehlerprozeß involviert ist. Vergleichbar mit MacKay sehen sie darin den Ausdruck seiner außergewöhnlich starken Präsenz im neurolinguistischen Programm. Fodor, Bever & Garrett (1974) stellen diese Interpretation jedoch in Frage. Sie behaupten, daß die Modifikationsfreudigkeit des Tonworts eine Folge seiner zeitlichen Priorität im Rahmen des Satzkonstruktionsprozesses ist. Diese ist dadurch bedingt, daß das Tonwort den semantischen Fokus bildet, der als erster verarbeitet wird und um den herum sich die übrigen Planungseinheiten anordnen. Fodor et al. negieren damit implizit das Prinzip der waagerechten Parallelität, welches in Kap. 7 als eine Voraussetzung für das Zustandekommen von Versprechern gewertet wurde. Es wäre insofern erforderlich, daß die Nicht-Tonworte im Laufe der Planung das Tonwort »einholen«, damit es überhaupt zu einer Interaktion kommen kann. Damit lassen sich aber nur die Fälle erfassen, bei denen das Tonwort als Quelle fungiert; die von Boomer & Laver (1968) belegten Beispiele, in denen es das Fehlerelement beherbergt, bleiben ungeklärt. Dieser Lösungsvorschlag wird dem Problem also nicht gerecht. Damit ist allerdings nicht gesagt, daß die Satzbetonung automatisch ein relevanter Faktor sein muß. Sie könnte auch ein Artefakt einer semantisch-syntaktischen oder auch textlinguistischen Vorrangstellung des Tonworts sein (Nöth 1979, Lattey 1979). Die Bedeutung der Satzbetonung bleibt also ungeklärt. Jetzt können die beiden Stränge der Satz- und Wortbetonung wieder zusammengeführt werden. Gefragt werden soll nach den Prognosen, die sich aus der vermuteten Rolle der Suprasegmente ableiten lassen. Wenn diese Einfluß auf den Fehlerprozeß nehmen, so die Überlegung, dann fungiert die Tonsilbe aufgrund ihrer herausragenden Stellung mehr als Quelle denn als Ziel. Elemente aus betonten Silben müßten demzufolge eher andere unbetonte verdrängen, als sich selbst von ihnen verdrängen zu lassen. Für die hier zur Diskussion stehende Entscheidung auf der 3. Dimension bedeutet das, daß sich mit
88 der Stellung der Tonsilbe die Auftretenswahrscheinlichkeit von Antizipationen bzw. Perseverationen verändert. Im intramorphemischen Bereich nimmt sich das so aus, daß im Falle von Endbetonung mehr Antizipationen und im Falle von Anfangsbetonung mehr Perseverationen zu erwarten sind. So erhält man zwei Normalfälle und zwei Ausnahmen, die sich schematisch wie folgt darstellen lassen. Abbildung l: Theoretisch zu erwartender Effekt der Wortbetonung
Normalfall
Betonung Silben
l
Fehlertyp
Antizipation
l
Ulj
l_£j l
Ausnahmefall '
'
Perseveration
i
·
·
/
Perseveration
Antizipation
Im interverbalen Bereich sieht es ähnlich aus. Es ist zu erwarten, daß sowohl in Antizipationen als auch in Perseverationen das Tonwort eher die Funktion der Quelle als die des Ziels innehat. Auch hierzu zur Verdeutlichung eine schematische Darstellung. Abbildung 2: Theoretisch zu erwartender Effekt der Satzbetonung Normalfall Z
irst /»art. statt: the^irst part. (Shattuck-Hufnagel 1979)
(113) ist (112) gegenüber im Vorteil, als es durch ein vorhandenes Zielelement, was den
105
Dissimilationen ja fehlt, eine bessere Rechtfertigung besitzt. Wenn nun die Dissimilationen im Vergleich zu den Antizipationen motiviert sein sollen, muß ihre Existenz damit begründet werden, daß für sie kein geeignetes Element zum Antizipieren oder Perseverieren im sprachlichen Kontext vorhanden ist. In Ermangelung eines passenden Zielphonems, so lautet die Hypothese, kommt es dann zur Intrusion eines nicht geplanten, sekundären Elements. Die Ergebnisse in Tabelle 41 bestätigen diese Vermutung. Tabelle 41: Möglichkeit der Konstruktion von Antizipationen/Perseverationen bei Dissimilationen gegeben Ja
nein
42
25
Zunächst ist auf ein kleineres methodisches Problem hinzuweisen. Nicht immer läßt sich für die konstruierten Antizipationen oder Perseverationen eine eindeutige Quelle finden. So können manchmal zwei Quellen theoretisch in Frage kommen. Sicherheitshalber wurden diese Fälle von der Analyse ausgeschlossen. Wie aus Tabelle 41 ersichtlich wird, ist in mehr als einem Drittel der Fälle (so z.B. in (l 12a)) ein Versprechertyp mit Quelle ( = Antizipation oder Perseveration) nicht zu realisieren. Dabei wurden die üblichen Kriterien zur Quellenidentifikation zugrunde gelegt, also gleiche Silbenposition, möglichst geringe Entfernung usw. Es ist nun erforderlich, einen näheren Blick auf die 42 positiven Beispiele zu werfen und der Frage nachzugehen, inwieweit sie funktionstüchtige Quellen besitzen. Dazu wird die phonologische Ähnlichkeit der 42 potentiellen Quellen und Ziele berechnet. Das Resultat ist in Tabelle 42 enthalten. Tabelle 42: Merkmalanalyse der konstruierten Antizipationen bzw. Perseverationen einmerkmalig
zweimerkmalig
dreimerkmalig
9
21
12
Tabelle 42 bringt zum Ausdruck, daß die phonologische Ähnlichkeit bei den konstruierten Antizipationen bzw. Perseverationen keine Rolle spielt. Sie liegt mit durchschnittlich 2,07 Merkmalinvolvierungen pro Versprecher noch leicht unter dem Zufallsniveau. Die Dissimilationen erweisen sich somit im Kontrast zu den anderen explikativen Kategorien als gut motiviert. Der empirische Vergleich stützt also die theoretische Charakterisierung der Dissimilationen als »Notlösungen«. Da kein Element vorhanden ist, das als Quelle fungieren könnte, erhalten die nicht-intendierten Phoneme über die Sekundäraktivation Gelegenheit zur Intrusion. Aus dieser ungewöhnlichen Anforderung an die Dissimilationen läßt sich die Prognose ableiten, daß sie ein seltener Fehlertyp sein sollten, was ja auch der Fall ist.
106
10.8.
Überblendungen: Intramorphemisch versus intraverbal versus interverbal
Wie bereits im Abschlußkapitel zur Größe der modifizierten Einheit soll auch die letzte empirische Untersuchung dieses Kapitels die paradigmatische Achse berücksichtigen. Da zwischen Überblendungen und den bisher diskutierten syntagmatischen Fehlleistungen kein direktes Konkurrenzverhältnis besteht, lassen sie sich schlecht zum Zwecke der Motiviertheitsanalyse in Beziehung setzen. Stattdessen bietet sich bei ihnen die Gelegenheit, nach intrakategorialen Gesetzmäßigkeiten zu suchen. Überblendungen lassen sich je nach Größe der interagierenden Sprachelemente in intramorphemische (114), intraverbale (115) und interverbale (116) unterteilen. (114) (115) (116)
a. b. a. b. a. b.
Ich bin das /att- jatt. (/eid) Aerrible. (terrible Aorrible) (Fromkin 1973b) Jeglicher Kontakt zur Außenwelt ist unterboten— verboten, (untersagt) dealsman. (dealer salesman) (Fromkin 1973b) ein Liter pro jeden-- für jeden, (pro Kopf) It's spent me a year. (It's taken me a year I spent a year) (Fay 1981)
Das erste, was an diesem Versprechertypus ins Auge fällt, ist die Abhängigkeit der Größe der modifizierten Einheit von der Größe der konkurrierenden Elemente. In (l 14) entsteht eine phonemische Substitution durch den gegenseitigen Druck zweier Morpheme, in (115) eine präfigale durch zwei (morphologisch komplexe) Wörter und in (116) eine verbale durch zwei Phrasen/Konstituenten. Dabei müssen natürlich nicht wie in (l 14) immer nur Phoneme ersetzt werden. Die Variabilität erstreckt sich sowohl auf die deskriptive Zuordnung (117) als auch auf die Größe der modifizierten Einheit (118). (117) (118)
In England gibt's den Aoft— oft so. (Aäufig) Die Pizzas gibt's bei Penny besonders gallig-- billig, (günstig)
Zur Erklärung dieser Variabilität besteht die Möglichkeit, vollständig auf die bisherigen Untersuchungsergebnisse zurückzugreifen. Die Entscheidung auf der 1. Dimension ergibt sich primär aus den sprachlichen Bedingungen. Stehen sich wie in (117) eine Leerposition und eine besetzte gegenüber, wird von der Möglichkeit der Addition Gebrauch gemacht. Die Variabilität auf der 2. Dimension ist bekanntlich komplexer, da hier neben den sprachlichen Gegebenheiten die psycholinguistischen Faktoren eine größere Rolle spielen. Die ungewöhnliche CV-Involvierung in (118) wird beispielsweise vermutlich durch den lexikalisierten Nachbarn Gülle begünstigt. Das Entscheidende in diesem Zusammenhang ist jedoch, daß diese Variabilität auf natürliche Weise begrenzt ist. Alle intramorphemischen Versprecher betreffen submorphemische Größeneinheiten oberhalb der Merkmalebene, alle intraverbalen subverbale Einheiten oberhalb der Phonemebene und alle interverbalen subclausale Einheiten oberhalb der Morphemebene. Dies gilt für alle Versprecher, die gleich große Kontrahenten involvieren. Ist das nicht der Fall, gilt die einfache Regel, daß der jeweils größere der determinierende Faktor ist. Interagieren also z.B. ein präfigiertes und ein nicht-präfigiertes Verb wie in (119), so verhalten sie sich genauso wie reguläre intraverbale Versprecher.
107 (119)
Wohnungen sind schwer zu ^kriegen-- kriegen, (bekommen)
Es besteht ganz offenbar eine Tendenz, die morphologisch komplexere Struktur in solchen Fehlleistungen zu bewahren. Die ermittelten Gesetzmäßigkeiten lassen sich wie folgt darstellen: Abbildung 4: Beziehung zwischen Größe der konkurrierenden und der modifizierten Elemente Größe der konkurrierenden Elemente Konstituent Won Morphem Phonem
Größe der modifizierten Elemente
-______^~~~ » Wort ~ ~ · > Morphem (Morphologie) _ ~ * Phonem (Phonologic) Merkmal
Konsequenterweise müßten, wie in diesem Schema angedeutet, Phonemkonflikte auf der Merkmalebene gelöst werden. Da sich der paradigmatische Konflikt aber in der Regel aufgrund semantischer Ähnlichkeit ergibt, sind solche Fälle nicht zu erwarten. Allerdings konnte in einer Experimentalstudie, die die Grenzen des normalen Sprachverhaltens überschritt, genau der erwartete Effekt, nämlich Merkmalfehler durch Phonemkonkurrenz, nachgewiesen werden (Laver 1980). Das Auffällige an den Überblendungen ist, daß der Fehler immer genau eine Stufe tiefer als die der Konkurrenzsituation auftritt. 58 Man bedenke, daß es keinen Grund vorab gibt, weshalb Versprecher dieser Gesetzmäßigkeit unterliegen müssen. Dies wird besonders an den insgesamt 13 Ausnahmen deutlich, die sich auf 3 intramorphemische (120), 5 intraverbale (121) und weitere 5 interverbale (122) Fälle verteilen. (120) (121) (122)
Was machst du denn mit dem Geh-- Äaby? (Kind) Davor wird noch so'n Stück aufgej/nirt. (gezielt aufge/ührt) Wenn man so schwere Vasen um den Hals tragen— tragen kann, (trägt)
In (120) und (121) wird die phonemische bzw. morphologische Ebene übersprungen. Im Normalfall hätte in (120) Kebi und in (121) aufgespielt herauskommen müssen. Die möglichen Gründe für diese Ausnahmen sind vielfältig. Wie überall kann nicht völlig ausgeschlossen werden, daß im Einzelfall Fehlklassifikationen vorgenommen worden sind. Wahrscheinlicher und auch produktiver ist jedoch der Ansatz, sie als echte Ausnahmen zu akzeptieren und auf ihren Aussagewert zu prüfen. Eine erste Erklärung läßt sich aus einer näheren Betrachtung der nach der allgemeinen Regel zu erwartenden Formen ableiten. In (122) wäre aufgrund der Dominanz des sprachlich komplexeren Interaktanten trägt kann zu erwarten gewesen. Diese Anordnung zweier finiter Verbformen ist jedoch in 58 Es sei daraufhingewiesen, daß Motley, Baars & Camden (1983:94) diesen Effekt bei der Analyse experimentell induzierter synlagmatischer Versprecher unabhängig entdeckt haben. Sie nennen ihn Ordinal Conflict Effect. Da aber Motley (1985) nach anfänglicher Euphorie ihn bereits wieder verworfen hat, kann diese Theorie hier beiseite gelassen werden.
108 hohen Grad anormal und, da Versprecher zur Normalität tendieren, äußerst unwahrscheinlich. Die Regelverletzung erweist sich also wie in anderen Fällen auch als motivierbar. Ein zweiter Faktor kommt in folgendem Beispiel zum Ausdruck: (123)
Das kannste nur für eine begrmi— begrenzte Zeit nehmen, (gewisse)
(123) und vergleichbare Fälle entstehen möglicherweise dadurch, daß das Verarbeitungssystem die interne Struktur der Kontrahenten falsch interpretiert. Da beide aus psycholinguistischer Sicht morphologisch komplex sind (Stemberger 1985a), wäre eine Modifikation an der Morphemgrenze, also gegrenzte oder bewisse zu erwarten gewesen. Daß diese Formen nicht aufgetreten sind, deutet darauf hin, daß eine Konfliktsituation zwischen zwei monomorphematischen Elementen vorgelegen hat. Diese Fehleinschätzung könnte mit dem auch in der Linguistik unklaren Status des ge- in gewisse zusammenhängen. Neben diesen Ausnahmen zum Ordinal Conflict Effect gibt es eine weitere sehr interessante Gruppe von Versprechern, die ihm offenbar zuwiderläuft. Diese Kategorie wird in (124) exemplifiziert: (124)
a. Wann wird er sich entscheiden— entsch eiden? (entschließen) b. maistly. (mostly mamly) (Fromkin 1973b)
In beiden Beispielen liegen morphologisch komplexe Interaktionspartner vor, und trotzdem kommen keine Morphemsubstitutionen, sondern Phonemsubstitutionen zustande. Da die Versprecher in (124) typisch sind, liegt die Vermutung nahe, daß dies mit der Identität der Affixe der Konkurrenten zusammenhängt. Hätte der Sprachverarbeitungsmechanismus diese Tatsache ignoriert, wäre ein Versprecher akustisch nicht nachweisbar. Wir haben es hier also mit einer neuen Variante des Audibilitätsprinzips zu tun. Es führt im Falle der Überblendungen zu einer systematischen Verletzung der in Abbildung 4 dargestellten Gesetzmäßigkeiten. Diese Erscheinung soll, ohne daß damit bereits eine bestimmte theoretische Interpretation nahegelegt wäre, Herunterschaltung genannt werden: Im Falle einer formalen Identität auf einer Ebene wird die Fehlfunktion auf der nächst tieferen realisiert. Das Phänomen des Herunterschaltens ist insofern von Bedeutung, als es das Grundprinzip der Überblendungen, die Synonymic, außer Kraft zu setzen scheint. Wenn in (124a) auch ein Differenzierungskonflikt zwischen den Synonymen sich entscheiden und sich entschließen vorliegt, durch Ignorieren der Identitäten kommt eine Interaktion, wie aus dem Versprecherresultat ersichtlich, nur zwischen scheiden und schließen zustande. Diese Morpheme sind zwar eigenständig in der Sprache verankert, allerdings mit klar unterschiedlichen Bedeutungen. Die Synonymic entsteht erst über die Präfigierung. So muß ge schlußfolgert werden, daß hier augenscheinlich Nicht-Synonyme überblendet worden sind. Es hat den Anschein, daß die semantische Identität aufgrund von formaler Identität an die nächsttiefere Ebene weitergegeben werden kann. Damit ist nicht gesagt, daß die Elemente der tieferen Ebene künstlich zu Synonymen werden, sondern daß sie sich wie Synonyme verhalten. Formale Identität kann also dieselben verarbeitungstechnischen Konsequenzen nach sich ziehen wie semantische.
109 Ein vergleichbarer Effekt läßt sich in dem bereits erwähnten Experiment von Laver (1980) erkennen. Der Sequenzierungskonflikt wurde von ihm auf der verbalen bzw. morphemischen Ebene mit Hilfe sinnloser Silben herbeigeführt. Da sich die Silben aber nur in ihrem Nucleus unterscheiden, traten die Fehler eine Stufe tiefer, auf der Merkmalebene, auf. Dieser Herunterschalteffekt wird im Rahmen des Audibilitätsprinzips im nun folgenden theoretischen Teil erörtet werden.
110
11.
Eine erste theoretische Auswertung der empirischen Befunde: ein Plädoyer für Parallelität
Dieses Kapitel hat vor allen Dingen Gelenkfunktion. Es stellt zwischen dem empirischen Teil und dem folgenden theoretischen Modell eine Verbindung her, die aus darstellungstechnischen Gründen erst zum Schluß dieser Studie in ihrer vollen Tragweite deutlich werden wird. Es geht hier primär um die Sicherung und eine erste theoretische Aufarbeitung der Versprecheranalysen. In den kommenden Kapiteln werden dann die Voraussetzungen geschaffen, um die hier gewonnenen Erkenntnisse in einen größeren Zusammenhang stellen zu können. Die zentrale These, die sich aus dem empirischen Teil ableiten läßt, ist als ein umfassendes Plädoyer für den parallelen Informationsfluß zu charakterisieren. Auf dieser Grundlage läßt sich die Behauptung aufstellen, daß kein serielles Modell in der Lage ist, die vorliegenden Resultate zu erklären. Dies gilt sowohl für den waagerechten als auch für den senkrechten Aspekt. Beide werden im folgenden nacheinander erörtert. Hinter der Analyse der Gesetzmäßigkeiten in den Ausprägungsformen der Versprecher stand die Überlegung, daß eine lokale Parallelität, die durch die Existenz der Versprecher zum Ausdruck kommt, durch die Motivierungsmethode in eine generelle überführt werden kann. Denn die Erkenntnis, daß sich eine erfolgte Fehlleistung im Kontrast zu anderen theoretisch möglichen, aber nicht erfolgten motivieren läßt, spricht für die prinzipielle Präsenz von Alternativen im Verarbeitungssystem. Gleichzeitig stehen daher nicht nur die interagierenden, sondern auch die nicht direkt am Fehlerprozeß beteiligten Elemente zur Verfügung. Die Motivierung der einzelnen Fehlerkategorien konnte in vollem Umfang nachgewiesen werden, so daß eine lückenlose Motivationskette vorliegt. Dies bedeutet, daß generell alle Planungselemente einer Äußerung (z.B. Wörter) parallel verarbeitet werden. Es ist jedoch zu beachten, daß dies die Beschreibung des Potentials des Produktionssystems darstellt. Im konkreten Einzelfall besteht oft eine Diskrepanz zwischen Möglichkeit und Realisierung. So ist es wirklichkeitsnäher, davon auszugehen, daß die Planung auch beim Sprechen noch revidiert wird. Dies wäre dann natürlich ein serielles Verfahren, welches der Hypothese der prinzipiell parallelen Verarbeitung aber nicht zuwiderläuft. Die Parallelität offenbart sich auf allen Ebenen: Phoneme werden gleichzeitig mit anderen Phonemen geplant, Wörter gleichzeitig mit anderen Wörtern. Bei der Sprachgenerierung sind prinzipiell alle Elemente einer Ebene präsent, wenn auch in unterschiedlicher Stärke. Dort, wo ein Zuviel an Stärke auftritt, kommt es zu Versprechern. Sie sind, wie mehrfach im empirischen Teil demonstriert wurde, durch ihren sprachlichen Kontext »gedeckt«. Dieser muß daher vorhanden sein. Die Unklarheit seines verarbeitungsmäßigen Status,
Ill
wie sie noch von Shattuck-Hufnagel (1979) und Garrett (1980) herausgestellt wurde, ist damit beseitigt. Alle Modelle, die einen grundsätzlich seriellen waagerechten Informationsfluß postulieren, sind als erklärungsinadäquat zurückzuweisen. Diese Schlußfolgerung steht zumindest zu einem Befund im Widerspruch. Rumelhart & McClelland (1982) und Nooteboom (1981) konnten nachweisen, daß die Wahrnehmung von Wörtern nicht völlig parallel erfolgt. Vielmehr wird eine Strategie angewandt, nach welcher das Wort von außen nach innen aufgeschlüsselt wird. Rumelhart & McClelland (1982:77) nehmen zur Erklärung dieses Effekts von ihrem ansonsten völlig parallelen Ansatz Abstand und postulieren, daß zuerst die beiden äußeren Phoneme (bzw. Grapheme) verarbeitet werden und danach die mittleren (in Wörtern mit 4 Buchstaben). So entsteht ein hybrides Modell, da die parallele Verarbeitung für den An- und Auslaut beibehalten wird. Es ist unverkennbar, daß diese Form der Serialität mit den hier vorgelegten Ergebnissen nicht vereinbar ist. In Rumelhart & McClellands Modell wäre eine Interaktion zwischen absoluten und relativen Silbenpositionen nicht denkbar. Solche Fälle sind aber in meinem Korpus belegt, wie folgendes Beispiel zeigt: (125)
Kioyb--Kioj*.
Man könnte geneigt sein zu glauben, daß bei der Generierung von Sprache das Prinzip des parallelen Informationsflusses konsequenter umgesetzt wird als bei ihrer Wahrnehmung. Dies würde für unterschiedliche Produktions- und Perzeptionsstrategien sprechen. Dieses Postulat erscheint jedoch in Anbetracht der Tatsache unhaltbar, daß ein mit den genannten Befunden vergleichbarer Effekt auch bei Versprechern nachzuweisen ist. Wie Tweney, Tkasz & Zaruba (1975) und Hurford (1981) zeigen konnten, ähneln sich formale Wortsubstitutionen an der Peripherie weit mehr als im Zentrum, so auch in (126): (126)
You used coupons, statt: croutons. (Stemberger 1983c)
Die Vergleichbarkeit des produktioneilen und perzeptuellen Bereichs ist offensichtlich: In beiden sind die Leistungen am Rande besser und in der Mitte schlechter. Wie kann dieser serielle Positionseffekt nun erklärt werden, ohne von dem Konzept der Parallelität Abstand zu nehmen? Rumelhart & McClelland (1982) selbst deuten einen Weg an, der eine plausible Perspektive eröffnet. Die Positionen innerhalb von Wörtern erhalten eine unterschiedliche Ausgangsaktivation, initiale am meisten, finale am zweitmeisten und mediale am wenigsten. Damit läßt sich ansatzweise erklären, weshalb die einzelnen Positionen unterschiedlich modifikationsanfällig sind, denn je höher die Ausgangsaktivation, desto stärker ist die Abwehrkraft gegen potentielle Eindringlinge, d.h., desto besser sind die Leistungen. Diese Hypothese erfaßt die wesentlichen Eigenschaften der Versprecher, so daß zumindest für diesen Bereich ein Rückgriff auf das Konzept der Serialität nicht erforderlich ist. Kontroverser wird in der psycholinguistischen Literatur bekanntlich die Frage der senkrechten Parallelität diskutiert. In diesem Bereich sind die vorliegenden empirischen Resultate nicht minder eindeutig. Während die Analyse der deskriptiven und explikativen Versprecherdimension Rückschlüsse auf die waagerechte Parallelität gestattet, erge-
112 ben sich die relevanten Aussagen zur senkrechten Parallelität aus der Analyse des Motivationsverhältnisses zwischen den modifizierten Größeneinheiten. Hier hat sich erwiesen, daß dieselbe Motivierung, die im syntagmatischen Kontext nachgewiesen werden konnte, auch zwischen den Produkten der verschiedenen Verarbeitungsebenen vorhanden ist. Phoneme sind also nicht nur durch andere Phoneme, sondern auch durch Wörter usw. »gedeckt«. Wenn man hier den Begriff paradigmatisch verwenden wollte, müßte man ihn also erheblich weiter fassen, als es normalerweise getan wird. Ein Versprecher kommt daher auch deswegen zustande, weil die Bedingungen für ein fehlerfreies Sprechen auf allen anderen Verarbeitungsebenen günstiger sind. Die Motivation ist durch die Verkettung der einzelnen Ebenen vollständig und, wie die Untersuchungen ergeben haben, auch beidseitig. Das heißt, eine höhere hierarchische Einheit ist nicht nur durch eine tiefere motiviert, sondern auch umgekehrt. Diese Schlußfolgerung hat weitreichende Konsequenzen für viele etablierte Modelle in der Literatur. Am deutlichsten werden sie an Garretts Konzeption des Sprachproduktionsprozesses sichtbar. Er postuliert eine funktioneile Stufe, auf der Wortpermutationen auftreten. Diese wird von einer positionellen gefolgt, die für Phonempermutationen verantwortlich zeichnet. Welche Vorhersagen macht nun ein solches Modell hinsichtlich der Motivierung der Versprecher? Da die beiden Stufen streng seriell geordnet sind und relativ unabhängig voneinander operieren (also nicht interaktiv sind), ist eine Motivierung zwischen den Verarbeitungsergebnissen beider Stufen ausgeschlossen. Es ist auch kaum möglich, das Modell mit nachträglichen Zusatzannahmen so zu interpretieren, daß eine Entscheidung auf der positionellen Stufe durch Bedingungen auf der funktioneilen gedeckt ist. Man müßte dann argumentieren, daß sich die Wahrscheinlichkeit einer Störung auf der späteren Stufe erhöht, wenn auf der früheren .alles wie geplant abgelaufen ist, da Doppelstörungen äußerst selten sind. Mit einer solchen Argumentation kann die Motivation der höheren durch die tiefere Stufe jedoch auf keinen Fall erfaßt werden. Die Entscheidung auf der funktionellen Stufe kann nicht durch Bedingungen auf der positionellen beeinflußt werden. Dies ist ja gerade das Hauptcharakteristikum serieller Konzeptionen. Diese versagen damit vollends bei der Erklärung der im empirischen Teil ermittelten Resultate. Die Erkenntnis, daß die Verarbeitung im funktioneilen Bereich auch von positionellen Gegebenheiten abhängt, ist indes so neu nicht. Dell & Reich (1981) haben festgestellt, daß phonologische Faktoren durchaus Einfluß auf die Verarbeitung auf der Wortebene nehmen. Diese Tatsache führt sie jedoch nicht, wie zu erwarten wäre, dazu, Garretts serielles Modell abzulehnen. Stattdessen erweitern sie Garretts Blickrichtung auf die einzelnen Verarbeitungsstufen um die Gedächtnissysteme, von denen sie ihre Information beziehen. Innerhalb der diversen Lexika, die in Form eines Netzwerks organisiert sind, findet nun ein weitgehend paralleler Informationsfluß von oben nach unten und von unten nach oben statt. Den Mechanismus für die zur Diskussion stehenden Befunde lokalisieren Dell & Reich (1981) also in einer Erweiterungskomponente der Garrettschen Konzeption und versuchen letztere dadurch gegen die interaktiven Effekte zu immunisieren. Die Autoren setzen somit zwei Aspekte in Beziehung, die sich durch konträre Eigen-
113
Schäften auszeichnen. In Garretts Teil wird seriell, in ihrem eigenen parallel verarbeitet. Zur besseren Verständlichkeit läßt sich ihr Modell wie folgt veranschaulichen: Abbildung 5: Dell & Reichs (1981) Verarbeitungsmodell Verarbeitungsstufe
bezieht Information aus
Gedächtnissystem
(Beschränkungen)
(Tendenzen)
Funktionelle Stufe
Wortlexikon
Positionelle Stufe
l
Phonemlexikon
Wieweit es theoretisch möglich ist, daß die Regelsysteme der beiden Verarbeitungsstufen seriell arbeiten, während ihre jeweiligen Informationslieferanten parallel operieren, muß dahingestellt bleiben. Das Problem dieses Modells liegt jedoch ganz woanders. Dell & Reich (1981) nehmen eine konzeptuelle Trennung in Verarbeitungsstufen und Gedächtnissysteme vor und rechtfertigen diese mit unterschiedlichen Verarbeitungsresultaten, für die die beiden Komponenten verantwortlich sind. Garretts Teil fällt — ihnen zufolge — die Generierung von echten Beschränkungen (constraints) zu, wie z.B. die Wortklassenidentität auf der funktionellen Stufe und die Silbenpositionsidentität auf der positionellen. Das aktivationale Netzwerk hingegen ist der Verursacher für alle statistischen Tendenzen in den Versprecherdaten, wie z.B. der Lexikalitätseffekt. Wie jedoch bereits in Kap. 3 und 10.3. angedeutet wurde, gibt es keine Bildungsgesetze, die die Fehlleistungen 100%ig befolgen. Zwei weitere Beispiele mögen dies illustrieren. (127) (128)
Das ging einzig um allein um 100 Mark, statt: einzig und allein. Dein Uea-Eeck- Be« ist Gold wert.
Wenn Versprecher also den von Dell & Reich (1981) postulierten Beschränkungen nicht vollständig unterliegen, bricht eine strenge Unterscheidung in constraints und probabilistic outcomes zusammen. Übrig bleiben dann nur noch unterschiedliche Stärken in den statistischen Tendenzen. Diese sind — im Einklang mit den Autoren — im Netzwerk ursächlich zu lokalisieren. Daß es stärkere und schwächere Tendenzen gibt, kann nicht weiter verwundern, wenn man bedenkt, daß durch die Interaktivität ebenenfremde und ebenenkonforme Effekte möglich sind. Daß die Lexikalität schwächer ist als die Wortklassenidentität, erklärt sich also daraus, daß jene ebenenfremd Einfluß auf die phonologische Verarbeitung nimmt und diese ebenenkonform die Verarbeitung auf der verbalen steuert. Die Folge der Lokalisierung im Netzwerk ist, daß die Garrettschen Verarbeitungsstufen ihrer Hauptfunktion entledigt sind und dadurch die Trennung zwischen ihnen und den Gedächtnissystemen — zumindest so, wie sie von den Autoren konzeptualisiert worden ist — hinfällig wird. Auch ist in diesem Zusammenhang auf Stemberger (1985a) kritisch einzugehen. Er hat zwar die Idee der Parallelität explizit in die Sprachproduktionsforschung hineinge-
114
tragen, bleibt jedoch in der Umsetzung dieses Gedankens manchmal inkonsequent und fallt in serielle Schemata zurück. So behauptet er, daß Morphemüberblendungen, die sich ja als Phonemmodifikationen manifestieren, zu einem Zeitpunkt entstehen, wo die Merkmalebene noch nicht aktiviert ist (Stemberger 1985a: 236). Eine solche Situation ist in dem vorliegenden Modell nicht denkbar, zumindest nicht als Normalzustand. Denn durch die parallele Verarbeitung bleibt die Aktivation nicht auf einer Ebene stecken, wie Stemberger annimmt. Im Gegenteil, das ganze System ist mehr oder weniger zu jedem Zeitpunkt aktiv, auch wenn damit nicht ausgeschlossen ist, daß die Verarbeitungsergebnisse auf der höheren Ebene eher vorliegen können als auf der tieferen. Stembergers Hypothese läßt sich auch empirisch testen. Wenn tatsächlich die Merkmale bei derartigen Phonemmodifikationen noch unbeansprucht sind, dürften die interagierenden Phoneme keine phonologische Ähnlichkeit aufweisen. Die Interaktion müßte zufallsbedingt sein. Wie in Kap. 14 zu zeigen sein wird, unterliegen, wie zu erwarten, paradigmatische Phonemsubstitutionen dem Ähnlichkeitsprinzip jedoch in gleicher Weise wie syntagmatische. Dies ist aber nur möglich, wenn die Merkmale bei der (Fehl)Produktion der Phoneme »mitgeholfen« haben. Dies ist im vorzulegenden Modell sogar zwingend erforderlich, da eine Aktivierung der Phoneme ohne die Merkmale gar nicht denkbar ist. Dieses Problem wird zu einem späteren Zeitpunkt wieder aufgegriffen werden. Es ist somit erneut festzustellen, daß die Serialität dem Prinzip der Ähnlichkeit diametral entgegensteht und daß selbst Parallelisten wie Stemberger ihre Sicht des Informationsflusses nicht immer konsequent durchhalten. Die vorangehende Diskussion hat zu zeigen versucht, daß der Ansatz des seriellen Informationsflusses in bezug auf Versprecher nicht erklärungsadäquat ist. Dies gilt nicht nur für die reinen seriellen, sondern auch für die gemischten Modelle wie dem von Dell & Reich (1981). Zentraler Gegenstand der Kritik ist dabei bisher die Art des mentalen Informationsflusses gewesen. Wie aber bereits aus der Besprechung des Dell & Reichschen Beitrags sichtbar wurde, ist diese Frage nicht in Unabhängigkeit von der Funktion und Anzahl der Verarbeitungsstufen zu beurteilen. Die Parallelität kann also zum Ausgangspunkt für die weitere Analyse der psycholinguistischen Bedingungen der Sprachproduktion gemacht werden. Wie die kommenden Kapitel zeigen werden, ist mit der Entscheidung zugunsten der Parallelität der Verlauf der Erörterung zu einem nicht unerheblichen Teil vorgezeichnet. Die Beantwortung der Frage der Parallelität versus Serialität zieht nun eine Vielzahl von Konsequenzen nach sich, die manchmal nur noch in einem mittelbaren Zusammenhang mit der empirischen Basis stehen. Dennoch komme ich auf dieses Problem ständig zurück.
115 12.
Ein Rahmenmodell der Sprachproduktion
Ehe die Ergebnisse der Versprecheranalyse weiter theoretisch aufgearbeitet werden, muß der Rahmen abgesteckt werden, in welchem die hier untersuchten Komponenten des Sprachproduktionsprozesses zu identifizieren sind. Es herrscht weitgehend Einigkeit darüber, daß eine adäquate Theorie mindestens drei Funktionen zu berücksichtigen hat, die hierarchisch wie folgt anzuordnen sind: Abbildung 6: Das konventionelle Rahmenmodell der Sprachproduktion
Abbildung 6 benennt die Eckpfeiler des Sprachproduktionsprozesses. Unter Ideation ist eine nicht-sprachliche Repräsentationsstufe zu verstehen, auf der durch die Interaktion des Individuums mit der Umwelt semantische Strukturen erzeugt werden. Diese Ideen steuern die Aktivationsvorgänge in der sprachlichen Komponente. Hier wird Sprache noch als abstraktes Gebilde aufgefaßt, das im nächsten Schritt die Steuerung der Artikulationsorgane bedingt und schließlich zu Schallwellen führt. Ein solcher Minimalkonsens wird aus dem Vergleich vieler einschlägiger Konzeptionen offenkundig (z.B. Garrett 1982, Laver 1970, Cohen 1966 etc.). Zugrunde liegt diesem Rahmenmodell, daß alle drei Funktionen irreduzibel sind. Gründe für eine solche Isolierung von Komponenten gibt es genug, wobei es leichter scheint, die Artikulation von der Sprache als die Ideation von der Sprache abzugrenzen. Daß die Artikulation eine fakultative Komponente des Sprechens ist, ist aus der Möglichkeit abzulesen, Sprache unter Verzicht auf die Muskelinnervation zu generieren. Die Fähigkeit zur Artikulation ist daher wohl eher die Antwort auf die kommunikative Funktion als integraler Bestandteil der Spracherzeugung zu werten. Der fakultative Charakter der Exteriorisierung des Sprechens impliziert daher die prinzipielle Isolierbarkeit der artikulatorischen Komponente. Die Eigenständigkeit von Sprache und Denken ist ein eminent philosophisches Problem, das hier ausgeklammert werden muß. Für den Psycholinguisten ergibt sich besagte Trennung daraus, daß die Sprache primär der Bedeutungsvermittlung dient, sie
116 jedoch selbst kein Instrument zur Generierung von Bedeutung, sondern nur zur Kodierung derselben ist.59 Die Erfordernis einer expliziten Trennung beider Ebenen ist in vielen Untersuchungsgebieten erkennbar; besonders deutlich wird sie im Bereich des kindlichen Spracherwerbs, wo oftmals eine entwicklungsmäßige Asynchronie zwischen beiden Komponenten nachweisbar ist. So machen Bilingualismusstudien deutlich, daß der Auftretenszeitpunkt von semantisch vergleichbaren Sprachmustern u.a. durch ihre sprachliche Komplexität determiniert wird. Mit großer Wahrscheinlichkeit wird ein mit Englisch und Deutsch aufwachsendes Kind question tags im Englischen erst zu einem späteren Zeitpunkt benutzen als die entsprechenden invariablen Strukturen (oder?, ne? etc.) im Deutschen (Mills 1981). Ein zweites Beispiel aus der Spracherwerbsforschung verdeutlicht den auch Erwachsenen bekannten Unterschied zwischen Meinen und Sagen. Wenn ein Kind mommy sock sagt, dann ist aus seinem sonstigen Verhalten und der Analyse des außersprachlichen Kontexte häufig erkennbar, daß der sprachlichen Äußerung unterschiedliche semantische Strukturen zuzuweisen sind (z.B. mommy's sock im Gegensatz zu Mommy is putting on my sock) (Clark & Clark 1977). Dies ist nur mit dem Postulat unterschiedlicher Intentionen möglich, die auf der sprachlichen Kodierungsebene aufgrund diverser Beschränkungen des kindlichen Outputs in einer Struktur zusammenfallen. Es ist zu bedenken, daß die prinzipielle Isolierbarkeit der Komponenten im obigen Modell nicht automatisch mit ihrer vollständigen Unabhängigkeit voneinander gleichzusetzen ist. Die einzelnen Stufen sind durch Richtungspfeile verbunden, der Output der höheren Stufe ist der Input der tieferen. Dies hat eine wichtige Konsequenz. Um eine erfolgreiche Kommunikation zwischen den Stufen zu ermöglichen, muß die Information in einer Weise kodiert sein, daß sie von der jeweils tieferen Stufe »verstanden« wird. Eine Kompatibilität der Verarbeitungsresultate ist zwingend geboten, Zweifel an der Hypothese der Eigenständigkeit der einzelnen Stufen sind daher angebracht. Da dieses Problem grundlegend ist, bedarf es einiger genauerer Ausführungen. Wie aus Abbildung 6 ersichtlich, fließt die Information ausschließlich von oben nach unten; die Verarbeitung auf einer höheren Stufe kann also nicht durch die auf einer tieferen beeinflußt werden. Bei näherer Betrachtung wird schnell deutlich, daß ein solches serielles Modell nicht erklärungsadäquat sein kann. Ein Beispiel aus meinem subjektiven Erfahrungsbereich möge das verdeutlichen. Nach einem Aufenthalt in englischsprachiger Umgebung kamen mir, als ich nach langer Zeit wieder Deutsch sprach, oft englische Ausdrücke in den Sinn, die mir zur Realisierung meiner Gedanken geeigneter erschienen als deutsche. Dieses Phänomen war anfänglich sehr stark, nahm jedoch mit der Zeit kontinuierlich ab. Es ist nicht mit dem Hinweis auf eine stärkere psychische Präsenz des Englischen als ein perseverativer Gewohnheitseffekt abzutun, da es hier nicht um die Leichtigkeit des Abrufs sprachlicher Elemente, sondern um die »Entsprechungsfunktion« der Sprache selbst geht. Das Deutsche konnte, so kam es mir vor, meine Absichten weniger gut versprachlichen als das Englische. Die naheliegende Schlußfolgerung daraus ist, daß 59 Diese Position ist in der Linguistik jedoch nicht unumstritten. Es wird auch die Meinung vertreten, daß Bedeutung nicht nur auf der Ideationsstufe, sondern auch durch Sprache selbst erzeugt wird.
117
meine Auseinandersetzung mit einem anders strukturierten sprachlichen System Rückwirkungen auf meine Ideenbildung gehabt hat. An dieser Stelle ist einem möglichen Mißverständnis vorzubeugen: Natürlich ist damit nicht gemeint, daß eine neue Sprache eine geistige Metamorphose herbeiführt. Vielmehr wird die Hypothese aufgestellt, daß die Ideation flexibel genug ist, um den Möglichkeiten und Grenzen des sprachlichen Realisierungsmediums Rechnung zu tragen. Dies ist gleichbedeutend mit der rückwirkenden Einflußnahme der sprachlichen Komponente auf die Abläufe auf der Ideationsstufe. Eine ähnliche Form der wechselseitigen Einflußnahme läßt sich auf den beiden unteren Stufen nachweisen. Laver (1979, 1980) hat, wie bereits erwähnt, in einem Experiment künstlich einen Konflikt konträrer Vokale erzeugt. Dabei stellte sich heraus, daß diejenigen Vokalpaare, die artikulatorisch sehr ähnlich sind (vorrangig solche, die sich mehr in der Quantität als in der Qualität unterscheiden), im Gegensatz zu den anderen besonders verschmelzungsresistent sind. Lavers Erklärung ist neuromuskulärer Natur. Das Ergebnis, daß einige Vokalpaare überblendungsunwillig sind, begründet er mit der Tatsache, daß die Produktion genau dieser Vokalpaare von ein und demselben Muskelsystem gewährleistet wird und es schlecht vorstellbar ist, daß dieses zur Ausführung konträrer neuronaler Anweisungen gleichzeitig imstande ist. Auch wenn Lavers Hypothese alternative Erklärungsweisen nicht ausschließt, besteht kein Zweifel an ihrer Plausibilität, denn was neuromuskulär nicht machbar ist, kann auch nicht produziert werden. Hier wird also die Möglichkeit einer Beschränkung der Verarbeitung auf der abstrakt-sprachlichen Ebene durch artikulatorische Gegebenheiten ersichtlich. Die zentrale Frage, die sich in beiden Fällen stellt, ist folgende: Woher »weiß« das sprachliche System, was artikulatorisch möglich ist und woher das ideationelle, was sprachlich möglich ist? Mit anderen Worten: wie ist die Einflußnahme einer unteren Stufe auf die Verarbeitungsweise der oberen zu konzeptualisieren? Kempen (1977) schlägt eine Feedbackschleife von der Sprache zur Ideation vor.60 Danach würde in einem ersten Schritt eine Idee entstehen und selbige in einem zweiten zur Aktivierung bestimmter sprachlicher Einheiten führen. Im Falle eines Mißverhältnisses zwischen ideationellen Forderungen und sprachlichen Möglichkeiten würde dann in einem dritten Schritt eine Revision des ideationellen Outputs notwendig werden. Bei näherer Betrachtung erweist sich Kempens (1977) Modell als kaum funktionstüchtig. Durch Rückmeldung der Sprache wird der Ideation bedeutet, daß der gewünschten Versprachlichung nicht die geeigneten Mittel zur Verfügung stehen. Nach welchen Kriterien, so muß gefragt werden, kommt es zum ersten Aktivierungsversuch sprachlicher Strukturen? Da die Ideation in Kempens Modell zunächst noch nichts über die sprachliche Ebene »weiß«, gibt es nur eine denkbare Antwort: durch bloßes Ausprobieren. Eine Übereinstimmung zwischen beiden Ebenen wäre also zufallsbedingt und bei der enormen Vielfalt der möglichen Ideen sogar recht unwahrscheinlich. Fast jede Idee würde 60 Kempen (1977) verwendet die Begriffe conceptualize und formulator, die weitgehend deckungsgleich mit den von mir verwendeten sind. Allerdings ist daraufhinzuweisen, daß der formulator bei Kempen eine eingeschränktere Funktion hat, da er den Bereich der Phonologic ausschließt und der nächst tieferen Stufe zuweist.
118 demzufolge nach ihrer Generierung verworfen werden, eine höchst unökonomische und daher zweifelhafte Annahme. Es ist auch zu bedenken, daß selbst eine Revision nur dann funktionieren kann, wenn das Feedback der Ideation das sprachliche System vollständig verfügbar macht. Signalisiert es dagegen nur, daß es Probleme bei der Versprachlichung gibt, könnte die Ideation auch im zweiten Anlauf nur nach dem Prinzip des Ausprobierens verfahren und stünde insofern nicht besser da als beim ersten Mal. Dabei liegt das Problem in Kempens (1977) Theorie weniger in der Nutzbarmachung des Konzepts des Feedbacks per se, sondern vielmehr in der Rolle des Feedbacks in dem von ihm gewählten Modell. Kempen gerät nämlich in die Falle der Serialität, da das Feedback immer erst wirksam werden kann, wenn die relevanten Entscheidungen bereits getroffen sind. Dann ist es jedoch zu spät. An diesem Punkt wird deutlich, weshalb das Feedback in einem seriellen Modell völlig wirkungslos bleiben muß (Berg 1986c). Die Lehre, die sich hieraus ziehen läßt, ist daher die Notwendigkeit, den seriellen Ansatz zugunsten eines parallelen aufzugeben. Diese Perspektive erscheint für die Konzeptualisierung des Verhältnisses zwischen Gedanken und Sprache nicht unrealistisch, ist jedoch auf die Beziehung der beiden unteren Stufen zueinander nicht leicht anwendbar. Es gibt keinen Grund zu der Annahme, daß die Artikulation parallel zur sprachlichen Programmierung erfolgt. Ganz im Gegenteil, die Tatsache, daß beide Systeme völlig unterschiedlichen zeitlichen Beschränkungen unterliegen, ist immer wieder demonstriert worden. Bezeichnenderweise schlägt Laver (1980) bei seinem Interaktionsproblem auch einen ganz anderen Weg als Kempen (1977) ein. Er repräsentiert die Vokale in einer artikulatorisch-motorischen Dimension, d.h., eigentlich ebenenfremde Information wird offiziell zu einem Organisationsprinzip des sprachlichen Verarbeitungssystems gemacht. Mit diesem Schritt erübrigt sich natürlich der Rückgriff auf das Feedback, welches isoliert betrachtet wiederum nur einen Ausprobiereffekt zur Folge hätte. Fassen wir vorläufig zusammen: Uns stehen prinzipiell zwei Wege zur Lösung des Kommunikationsproblems zwischen den Ebenen zur Verfügung: die parallele Informationsverarbeitung auf unterschiedlichen Stufen mit der Möglichkeit des Feedbacks und der Aufbau einer Ebene auf der Basis artfremder Information, was in letzter Konsequenz der völligen Ersetzung ebenenkonformer Information durch ebenenfremde gleichkäme. Wie es scheint, sind beide Lösungsansätze in ihrem Nutzwert hinsichtlich des Verhältnisses zwischen Ideation und Sprache bzw. des zwischen Sprache und Artikulation unterschiedlich zu beurteilen. Während aufgrund temporaler Asynchronien die Parallelität für den unteren Bereich kaum in Frage kommt, ist der obere theoretisch für beide Möglichkeiten offen. Es empfiehlt sich daher, ihn erneut unter die Lupe zu nehmen. In einem provokativen Aufsatz spricht sich Danks (1977) gegen die kategorische Trennung von Sprache und Denken aus. Er ist jedoch in seinen Konsequenzen erheblich radikaler als Kempen (1977) und hebt die Grenzen zwischen beiden Komponenten des Produktionsprozesses vollständig auf. Ideenbildung und der Aufbau einer sprachlichen Repräsentation werden für ihn letztlich zu ein und demselben Vorgang. Es sei am Rande vermerkt, daß die Reaktionszeitexperimente, die er zur Stützung seiner Hypothese
119
durchführt, methodisch fragwürdig sind, wie Wiese (1983) gezeigt hat. Viel interessanter ist jedoch, daß Danks seine eigene Hypothese in der Diskussion nicht konsequent durchhält. Er (1977:252) meint, daß der Sprecher neben der Sprache auch über eine oder mehrere Denksprachen (mentalese) verfügt und räumt damit implizit ein, daß es verschiedene Repräsentationsformen der Information und damit verschiedene Verarbeitungsstufen gibt. Er weist ferner daraufhin, daß das »Mentalesisch«, das zum Zwecke der Versprachlichung generiert wird, bereits so strukturiert ist, daß es den Ansprüchen der kommenden Verarbeitungsstufe gerecht werden kann. Es ist offenkundig, daß dieser Lösungsvorschlag gewisse Parallelen zu Lavers aufweist. Unterschiede bestehen in dem Ausmaß der Vorwegnahme von später Relevantem auf der jeweils höheren Stufe. Allerdings ist auch dieser Weg nicht ganz unproblematisch. Es ist klar, daß in jedem Fall der Output der höheren und der Input der tieferen Stufe kompatibel oder umwandelbar sein müssen. Dies erfordert ein gewisses Maß an Antizipation, so wie es von Danks (1977) mit Recht postuliert wird. Wie hat man sich aber die Genese dieser Antizipation vorzustellen? Eine etwas gewagte Hypothese bestünde darin, aufgrund der gewohnheitsmäßigen Rückkopplung und der generellen Aufnahmefähigkeit von Information von unten eine Internalisierung des Feedbacks auf der höheren Stufe anzunehmen. Demzufolge würde sich das Feedback in gewisser Weise verselbständigen und zu einem integralen Bestandteil der jeweils höheren Ebene werden. Dies ist jedoch reine Spekulation. Ob die postulierte Vorwegnahme soweit führen muß, daß weitgehende Redundanzen in beiden Systemen entstehen, bleibt zumindest fraglich. In letzter Konsequenz würde es immerhin dazu führen, daß Ideen bereits motorisch repräsentiert sind. Und ob es richtig ist, die Phoneme ihres abstrakten linguistischen Charakters zu berauben, erscheint ebenso fragwürdig. Sinnvoll ist es hingegen, die Repräsentationsform so zu wählen, daß sie nicht nur ebenengetreu ist (also z.B. abstrakt-sprachliche Parameter im abstrakten Sprachsystem), sondern auch direkt in beispielsweise artikulatorische Parameter überführbar ist. Dies ist auf jeden Fall nur möglich, wenn das Verarbeitungssystem weiter oben über die Verarbeitungsbedingungen weiter unten orientiert ist, und zwar zu einem Zeitpunkt, wo die Verarbeitung auf der höheren Ebene noch zu beeinflussen ist. Dies wiederum führt unweigerlich zum Postulat des Feedbacks bei parallelem Informationsfluß. Parallelität und Input/Output-Kompatibilität tragen beide zum Funktionieren des Systems auf ihre Weise bei. Mit Hilfe der gleichzeitigen Einflußnahme von unten nach oben wird es dann auch möglich, von vornherein Repräsentationen auf einer Ebene aufzubauen, die auf einer tieferen fortführbar sind. Auf diese Weise lassen sich die bei Kempen (1977) angetroffenen Probleme des Ausprobierens vermeiden. Nach der Kompatibilitätshypothese müßten Lavers (1980) Ergebnisse neben der vorgetragenen motorischen auch einer higher/«>£/-Interpretation zugeführt werden können. Dies ist auch der Fall. Wie Berg (1985a) in einem anderen Zusammenhang zeigte, läßt sich die Substitutionsresistenz von Segmenten, die sich nur in einem binären Merkmal unterscheiden, mit ihren spezifischen psycholinguistischen Verarbeitungsprinzipien im aktivationellen Netzwerk erklären. Diese Deutung setzt allerdings voraus, daß die Substitutionshäufigkeit als Hinweis auf die Verschmelzungsbereitschaft der Segmente gewertet werden kann.
120
Trotz einer Vielzahl ungelöster Probleme lassen sich die Ergebnisse der Diskussion in folgenden vorsichtigen Schlußfolgerungen zusammenfassen: Ein einfaches serielles Modell wie in Abbildung 6 ist nicht funktionstüchtig, auch wenn seine hierarchisch angeordneten Verarbeitungskomponenten unangetastet bleiben. Die Interaktion zwischen den einzelnen Stufen bringt die Notwendigkeit eines parallelen Informationsflusses von oben nach unten und von unten nach oben mit sich. Dieses ist plausibler für die Konzeptualisierung des Verhältnisses zwischen Ideation und Sprache als zwischen Sprache und Artikulation. Die Vorgänge bei der Sprachprogrammierung und der Artikulation sind nicht synchron zu deuten. Trotzdem liegt unzweifelhaft eine Beeinflussung von ersterer durch letztere vor. Dies suggeriert möglicherweise die Präsenz von artfremder Information auf jeder Verarbeitungsebene durch internalisiertes Feedback, zumindest aber eine dem Ergebnis nach gleichwertige Funktionsweise. Nur dadurch kann dem Kompatibilitätsprinzip Genüge getan werden. Dieses Prinzip muß gelten, auch wenn die Beziehung von einem Phonem (bzw. seinen Konstituenten) zu seinen akustischen Korrelaten bzw. den Konfigurationen des Sprechtrakts längst nicht so eindeutig ist, wie man es sich wünschen würde. Nach dieser Einbindung der sprachlichen Komponente in das Rahmenmodell folgt nun eine ausführliche Beschreibung ihrer Funktionsweise.
121
13.
13.1.
Das Netzwerk als Produktionsmechanismus
Die Struktur
Nachdem die Grenzen der sprachlichen Komponente im Gesamtprozeß der Sprachproduktion nach oben und nach unten abgesteckt sind und angedeutet wurde, welchen Bedingungen die Informationsübermittlung vom einen zum anderen Subsystem unterliegen muß, sind die Voraussetzungen geschaffen, um die Sprachkomponente genauer ins Blickfeld der Betrachtung zu rücken. Es wird sich zeigen, daß es sich hierbei um einen komplexen, außerordentlich gut integrierten Mechanismus handelt, in welchem eins ins andere greift. Bei den folgenden Ausführungen ergibt sich dadurch die Schwierigkeit, interdependente Teilaspekte notwendigerweise nacheinander zu besprechen. Da eine nachvollziehbare Darstellung ohne eine gewisse Strukturierung undenkbar ist, wird es unvermeidlich, ein und dasselbe Problem an verschiedenen Orten aufzugreifen und mit Querverweisen zu arbeiten. Die Anordnung der einzelnen Kapitel mit ihren Themenschwerpunkten erfolgt daher in der Hauptsache danach, wieviel Vorwissen für ihr Verständnis erforderlich ist. Ich beginne mit der Identifikation der für die Generierung von Sprache erforderlichen Verarbeitungsebenen und ihrem Verhältnis zueinander. Diese Aufgabe ist — zumindest in begrenztem Maße — in Unkenntnis der Verarbeitungsmechanismen in diesen Komponenten zu bewerkstelligen. Es geht also zunächst darum, welche sprachlichen Ebenen psycholinguistisch relevant sind. Dabei läßt sich die Hypothese einer Minimalzahl an Ebenen dem Postulat eines Maximums an Ebenen gegenüberstellen. Nach diesem sind alle von Linguisten für notwendig erachteten Ebenen für den Sprachproduktionsprozeß erforderlich, während jener zufolge nur eine bestimmte Auswahl daraus von Bedeutung ist. Vorab ist festzustellen, daß bei einigen Ebenen die Frage unstrittig ist. Daß es mindestens eine Phonem- und eine Wortebene geben muß, ist eine naheliegende Schlußfolgerung aus über 1000 Versprechern aus jeder Rubrik in allen größeren Korpora. Schwierigkeiten tauchen dagegen z.B. bei den Morphemen und den Clustern auf.61 Es kann nicht sehr verwundern, daß sich hier Problembereiche der Theoretischen Linguistik in der Psycholinguistik widerspiegeln. Die klarsten empirischen Aussagen hierzu treffen die Überblendungen. Es wurde ermittelt, daß eine ihrer herausragenden Eigenschaften darin besteht, einen Selektionskonflikt auf einer bestimmten Stufe auf der nächsttieferen auszutragen. Dieses Faktum 61 Zur Rolle der Merkmale siehe weiter unten. Die Silbe wird in dieser Arbeit aufgrund ihres sehr komplexen Sonderstatus ausgeklammert. Sie bildet auch keine separate Ebene im Netzwerk, die Silbenstruktur hingegen schon.
122
ermöglicht besser als jedes andere den Schritt, von unproblematischen Ebenen ausgehend auf die Existenz problematischer zu schließen. Auf die Morphemebene bezogen, lautet die Frage, ob ein Wort, ganz gleich, wie komplex es aus morphologischer Sicht ist, zu einer morphemischen oder phonemischen Modifikation führt. Würden immer nur phonemische Größen affiziert werden, gäbe es keinen Grund zur Postulierung einer linguistischen Ebene zwischen den Wörtern und den Phonemen. Dem ist, wie in Kap. 10.8. ausgeführt wurde, jedoch nicht so. Morphologisch komplexe Wörter, zumindest all diejenigen, für die empirische Evidenz vorgebracht worden ist, also präfigierte Wörter und Lexemkomposita,62 führen nicht zu phonologischen, sondern zu morphologischen Fehlleistungen. Solche Versprecher sind nicht ohne den Rückgriff auf eine morphologische Verarbeitungsebene zu erklären. Andererseits werden Konflikte zwischen morphologisch nicht analysierbaren Wörtern phonemisch gelöst. Es sieht also so aus, als wenn Simplexe der phonologischen Ebene und Komplexe der morphologischen übergeordnet sind. Die Repräsentation beider Strukturtypen wäre damit klar unterschiedlich anzusetzen, wie es in Abbildung 7 vorläufig zum Ausdruck kommt. Abbildung 7: Vorläufige Repräsentation von Simplexen und Komplexen Simplex Wort
Komplex Wort
bzw.
Wort
Lexem Lexem Präfix Lexem
Diese asymmetrische Repräsentationsform ist nicht nur theoretisch unbefriedigend, sie wird auch durch die empirischen Befunde in Frage gestellt. In komplexere Einheiten eingebundene Lexeme können nämlich, wie in Kap. 9.7.2. gezeigt wurde, problemlos mit unabhängigen Wörtern interagieren, wie in (129). (129)
daß die Theorie-- daß die Philosophie der Bildungstheorie im Alltag ohne Folgen bleibt.
Nun gehört es aber zu einer der elementaren Erkenntnisse in der Versprecherforschung, daß nur solche Elemente interagieren, die demselben Verarbeitungsvokabular bzw. derselben Verarbeitungsebene zuzurechnen sind (Shattuck 1975, Garrett 1976). Wenn Wörter also mit integrierten Lexemen Positionen tauschen, müssen sie auf einen Nenner gebracht werden. Da Wörter gleichermaßen mit anderen Wörtern wie mit Lexemen interagieren können, wird es erforderlich, sie wie folgt ambig, also sowohl verbal als auch morphologisch zu repräsentieren:
62 Keine Aussage wird damit in bezug auf die anderen nicht analysierten morphologischen Komplexe wie suffigierte Formen o.a. gemacht.
123 Abbildung 8: Repräsentation von Wörtern Simplex Wort
Lexem
Dieser Lösungsvorschlag, bei dem die Ambiguität nicht neutralisiert und keine Entscheidung zugunsten der einen oder anderen Ebene erzwungen wird, scheint dem theoretischen Status dieser Größeneinheit eher gerecht zu werden als andere quasi-eindeutige Interpretationen. Zwar bringt dieser Schritt auch mehr Redundanz in das psycholinguistische System, sie ist aber nur partiell. Denn die Spezifika der jeweiligen Repräsentationsebene bleiben erhalten. So ist beispielsweise ein und derselbe Simplex auf der verbalen Ebene syntaktisch und auf der morphologischen morphologisch, also asyntaktisch repräsentiert. Nachdem nun die morphologische Verarbeitungsebene zweifelsfrei nachgewiesen werden konnte, soll dasselbe Verfahren auf den Bereich der Cluster angewendet werden. Gibt es also, so lautet die Frage, noch eine Ebene zwischen der morphemischen und der phonemischen? Von Interesse sind hier natürlich nur solche Überblendungen, bei denen mindestens ein Partner geclustert ist. Folgende theoretische Überlegungen sind der Analyse voranzustellen: Es wäre nach allen bisher durchgeführten Untersuchungen unrealistisch zu erwarten, daß ein Konflikt zwischen Lexemen mit CG entweder immer oder gar nicht zu einer Aufspaltung führen würde. Es kann also nur um statistische Tendenzen gehen. Die Existenz einer Clusterebene würde implizieren, daß die überwiegende Mehrzahl der Fälle an ihr nicht vorbeikommen könnte. Erklärungsbedürftig wären dann die Ausnahmen, bei denen eine Ebene übersprungen wird. Da das in der Versprecherwirklichkeit selten vorkommt, dürfte sich auch die Anzahl der Ausnahmen in Grenzen halten. Auf der anderen Seite brauchen im Falle der Nicht-Existenz einer separaten Clusterebene Versprecher, bei denen die Konsonantentraube nicht aufgelöst wird, nicht selten zu sein. Dies hängt damit zusammen, daß die ausschließliche Existenz einer phonemischen Ebene keineswegs gleichbedeutend ist m\f der Beschränkung, nur phonemische Größen zu generieren, solange die einzelnen Ebenen nicht isoliert arbeiten. Die Hypothese der Abwesenheit einer Clusterebene steht und fällt daher mit der Fähigkeit des Systems, durch Interaktion zwischen der phonemischen und der morphemischen Ebene »unkonventionelle« Größen wie Cluster o.a. zu generieren. Je besser diese Fähigkeit ist, desto häufiger können Clusterkohärenzen auftreten, ohne daß damit das Postulat einer eigenen Verarbeitungsebene für sie erforderlich wird. Dieser Punkt wird später wieder aufgegriffen werden. Zur empirischen Klärung des Problems ist auf die syntagmatischen Analysen aus Kap. 9.2. zurückzugreifen. Sie haben gezeigt, daß Cluster in der Regel aufgespalten werden, spezielle Clustertypen allerdings ein hohes Maß an Kohärenz aufweisen. Ver-
124
gleichbare Eigenschaften treten bei den Überblendungen zutage. Wenn man nur die eindeutigen Beispiele zugrunde legt, dominiert die Aufspaltung (130) (N = 7); Kohärenzen (131) (N = 4) kommen durch spezielle Clustertypen oder phonotaktische Restriktionen zustande. (130) (131)
a. b. a. b.
Da bricht man sich alle Gneh— Gräten. (Knochen) Zri- (Z ion Bryce) (Stemberger 1985a) Ich habe das Gefühl-- das Ge/uhl. (Gespür) Du hast ihn vollAändig— vollständig aufgegessen, (vollkommen)
Zu diesen 11 deutschen Fällen kommen mindestens 10 weitere, bei denen der Übergang von einem Wort zum anderen an identischen Segmenten erfolgt. Diesen fällt dadurch eine Art Brückenbildungsfunktion zu (Crompton 1981:694). Unter dem Vorbehalt, daß in der Hälfte der Beispiele die Bruchstelle und damit die Größe der modifizierten Einheit nicht zweifelsfrei identifiziert werden kann, lassen sich folgende Schlußfolgerungen ziehen: Daß unter den eindeutigen Fällen mehr Aufspaltungen als Kohärenzen (7:4) zu finden sind, spricht eher gegen eine eigenständige Clusterebene. Gäbe es sie, wäre nicht zu erklären, weshalb verbale bzw. morphologische Konflikte so häufig auf der phonemischen Ebene ausgetragen werden. Von den beiden folgenden Darstellungen des Netzwerks ist also das Modell B vorzuziehen. Abbildung 9: Modelle des Wortabrufs aus dem Lexikon A: mit Clusterebene
B: ohne Clusterebene
{slick}
(slick)
/sl7 Ist
l\l
/i/
/k/
/s'/
Kl
iil
/k"/
Bei der Verarbeitung eines Morphems wie slick werden also die entsprechenden Phoneme direkt ohne Zwischenstufe abgewählt.63 Damit gibt es auch keine Rechtfertigung für ein Clusterlexikon, welches alle in einer Sprache vorkommenden Clustertypen inventarisiert. Man könnte geneigt sein zu glauben, die hier vorgetragene Position stünde zu der vorherrschenden Meinung in der Literatur im Widerspruch. So kommen MacKay (1972a) und Dressler (1976) zu dem Ergebnis, daß die Bruchstelle bei Überblendungen vermehrt an der Clustergrenze zu lokalisieren ist. Ganz ohne Zweifel ist der Kohäsionsgrad bei CG-Verbindungen höher als bei CV-Strukturen, so daß ein gewisser Prozentsatz an Clustermodifikationen zu erwarten ist. Diese Kohäsion ist aber nicht als Ausdruck einer eigenständigen Verarbeitungsebene für Cluster zu interpretieren, sondern vielmehr als eine Folge der internen Organisation der Silbe (Fudge 1987). So sind zwei konsonanti63 Diese psycholinguistischen Schlußfolgerungen haben letzten Endes auch Auswirkungen auf die Kontroverse in der Linguistik, ob Cluster monophonematisch oder biphonematisch zu werten sind. Aus sprachproduktioneller Sicht spricht kaum etwas für die monolithische Interpretation.
125
sehe Elemente phonetisch wie phonologisch stärker aneinander gekoppelt als ein konsonantisches und ein vokalisches. Die relative Kohärenz der Cluster ist also grundsätzlich als eine Folge der Silbenstruktur zu verstehen. Es besteht daher keine Veranlassung, das beobachtete Verhalten der Konsonantentrauben als Hinweis auf die Existenz einer eigenständigen Clusterebene zu deuten. Die Hypothese, daß für Cluster keine spezielle Verarbeitungsebene bereitgestellt wird, erhält unabhängige Bestätigung durch einen weiteren empirischen Aspekt. Bekanntlich interagieren Cluster mühelos mit Einzelkonsonanten. Da ein Austausch von Elementen auf verschiedenen Ebenen nicht möglich ist, gäbe es nur die Möglichkeit, sie wie bei den monolexemischen Wörtern ambig zu repräsentieren. Für einen solchen Schritt gibt es jedoch keine unabhängige Motivation. Nimmt man jedoch an, daß die phonologische Ebene gleichermaßen Einzelphoneme wie Phonemkombinationen hervorbringen kann,64 erklärt sich das freie Interaktionsverhalten der Cluster wie von selbst. Die Struktur des Netzwerks nimmt somit Konturen an. Zu einer verbalen und einer phonemischen gesellt sich eine morphemische Verarbeitungsebene. Diese drei sind um die subphonemische, die syntaktische und die prosodische Komponente zu ergänzen. Im folgenden geht es um das Verhältnis dieser Subsysteme zueinander und somit um die Kontrollstruktur.
13.2.
Die Kontrollstruktur
Unter Kontrollstruktur wird gemeinhin die Steuerung des Informationsflusses zwischen den einzelnen Subsystemen verstanden. Auch zu dem Problem ihrer Anordnung im Gesamtprozeß sind die Überblendungen am aussagekräftigsten. Ihre Hauptbedeutung liegt unzweifelhaft darin, daß sie eine hierarchische Organisation des Netzwerks implizieren. Das Prinzip, daß die Konfliktlösung immer direkt unterhalb derjenigen Ebene erfolgt, auf der das Problem aufgetreten ist, ist nur mit dieser Annahme zu erklären. Der Effekt des Herunterschaltens legt dieselbe Schlußfolgerung nahe. Ebenenlose, lineare Modelle versagen hier vollends. Die Grenzen des Aussagewerts der Überblendungen bzw. der Versprecher schlechthin werden allerdings an dem Punkt erreicht, wo es gilt, zwischen einer Hierarchie und einer Heterarchie zu unterscheiden. Unter ersterer versteht man, der grundlegenden Erörterung von Turvey, Shaw & Mace (1978) folgend, eindeutige Dominanzrelationen zwischen den Subsystemen, so daß das eine das andere beeinflußt aber nicht umgekehrt. Heterarchien lassen sich ihrerseits in eine starke und eine schwache Version aufteilen. Die schwache beinhaltet die Struktur der Hierarchie plus Rückkopplungsschleifen, wodurch die niedrigen Ebenen auf die höheren einwirken können. In einer starken Heterarchie gibt es dann überhaupt keine Dominanzrelationen mehr: Jede Komponente beeinflußt die andere und wird von ihr beeinflußt. Auf den Gesamtprozeß der Sprachproduktion bezogen, erscheint eine vollständige Heterarchie 64 Dieser Nachweis steht noch aus, siehe dazu weiter unten.
126
unwahrscheinlich, da die absolute Vorrangstellung der Semantik unantastbar ist.65 Ich schließe damit an die Diskussion des Rahmenmodells der Sprachproduktion an. Hier ist die semantische Komponente weitgehend mit der ideationellen gleichzusetzen. Über die Relationen zwischen den rein linguistischen Subsystemen ist damit aber noch nichts gesagt, sie könnten durchaus stark heterarchisch organisiert sein. Eine ausschließlich hierarchische Struktur ist im Lichte der Diskussion des Rahmenmodells nicht zu erwarten, denn wenn es Feedback bereits im Großen gibt, ist es wahrscheinlich, daß es auch im Detail nachzuweisen ist. Das Bild verkompliziert sich, wenn man einen Blick über die Grenzen der Sprachproduktion wirft. Es ist Gegenstand vieler Debatten, inwieweit Produktions- und Perzeptionsvorgängen gemeinsame Mechanismen und Repräsentationsebenen zugrunde liegen. Gesetzt den Fall, dem wäre bis zu einem gewissen Grad so und das Netzwerk diente gleichermaßen den sensorischen und den motorischen Fähigkeiten, dann würde zum Zwecke des Verstehens die Kontrollstruktur des Sprechens auf den Kopf gestellt werden. Damit wäre im übrigen auch die Priorität der Semantik nicht gegeben. Wenn das Netzwerk also diese Flexibilität besitzt, kann es nicht mehr als Hierarchie oder Heterarchie charakterisiert werden. Dann wäre das Konzept der Doppelhierarchie oder -heterarchie (in der schwachen Form) anzusetzen, eine Möglichkeit, die über den Kanon von Turvey et al. (1978) hinausgeht. In dieser Doppelheterarchie (in ein und demselben System!) können demzufolge je nach Sprachmodalität jeweils die beiden Endpunkte der Bedeutung und des akustischen Signals Ausgangsbasis für die weitere Informationsverarbeitung werden.56 Diese Überlegungen haben nur Ausblickcharakter und sollen an diesem Punkt ihr vorläufiges Ende finden. Für ein Zwischenresümee läßt sich festhalten, daß der Gesamtprozeß der Sprachproduktion vermutlich schwach heterarchisch gegliedert ist, während für die rein sprachliche Komponente die Möglichkeit einer starken Heterarchie bisher nicht auszuschließen ist. Dieser Bereich soll jetzt an ausgewählten Beispielen näher betrachtet werden. Die Überblendungen machten eine hierarchische Anordnung der verbalen, morphologischen und phonemischen Ebene deutlich. Nichts gesagt ist damit über die Stellung der syntaktischen Komponente im Produktionssystem. Es kann keinen Zweifel geben, daß sie stark mit der verbalen interagiert (Stemberger 1982, Bock 1982) und wie die Lexik ihre Information von der Semantik bezieht. Syntax und Lexik arbeiten insofern parallel und interaktiv. Unklar ist hingegen das Verhältnis der Syntax zur Phonologic, ein Problembereich, dem in der Linguistik und Psycholinguistik verstärkt Bedeutung beigemessen wird (Cooper & Paccia-Cooper 1980, Selkirk 1984). Ihm wollen wir uns jetzt zuwenden. Theoretisch gibt es drei Konzeptualisierungsmöglichkeiten: Es gibt A) überhaupt keine Verbindung zwischen Syntax und Phonologic, es gibt B) eine mittelbare oder 65 Alle Versuche der Generativen Semantik, der Syntax diese Priorität einzuräumen, sind aus psycholinguistischer Sicht unhaltbar. 66 Dies gilt nicht für die anderen Komponenten, denn sonst hätten wir es eindeutig mit einer vollständigen Heterarchie zu tun.
127
C) eine unmittelbare.67 Es besteht bei der Erörterung dieser Frage die Möglichkeit, direkt auf die Ergebnisse der ersten Auswertung des empirischen Teils zurückzugreifen. Trotzdem soll, um beide Informationsverarbeitungsmodi erneut zu kontrastieren, die Frage gleichzeitig von dem parallelen wie dem seriellen Standpunkt aus beleuchtet werden. In der Tat sind zwei der drei Möglichkeiten von der Art des Informationsflusses abhängig. Lösung A (keine Verbindung zwischen beiden Komponenten) ist nämlich nur in einem seriellen Modell möglich, ein paralleles würde immer zu einer noch so indirekten Kommunikation führen. Damit ist bereits Lösung B skizziert. Die mittelbare Relation entsteht in einem parallelen Modell automatisch über einen beliebigen gemeinsamen Verbindungspunkt von Syntax und Phonologie. Dies ist aus naheliegenden Gründen die Lexik. Im Gegensatz dazu ist Lösung C von der Art des Informationsflusses unabhängig. Sowohl in einem parallelen als auch in einem seriellen Modell wäre hier eine ebenso direkte Verbindungslinie zwischen beiden zur Diskussion stehenden Subsystemen erforderlich, wie sie zwischen Lexik und Syntax besteht. Welche Aussagen lassen sich nun aus den empirischen Daten ableiten? Aufgrund der allgemeinen Wichtigkeit dieser Problematik soll auch auf andere psycholinguistische Evidenzen zurückgegriffen werden. Bock (1987) hat experimentell nachgewiesen, daß die Selektion einer syntaktischen Struktur auch von der Leichtigkeit der Abwahl phonologischer Information determiniert wird. Dieses psycholinguistische Argument läßt sich durch die Analyse sprachlicher »Endprodukte« erhärten. Kürzere Wörter stehen generell vor längeren in kreativen und fossilisierten Äußerungen (Cooper & Ross 1975). Mit diesem Befund läßt sich bereits Lösung A eliminieren. Wenn man nun nach der Wirkung der Syntax auf phonemische Versprecher fragt, ist ein offensichtlicher Zusammenhang auf den ersten Blick nicht zu erkennen. Zwei Faktoren deuten jedoch daraufhin, daß dieser Eindruck täuscht. Es ^vurde bereits an naturalistischen Daten festgestellt, daß syntaktische Einflüsse bei Permutationen stärker zutage treten als bei monopositionellen Fehlerkategorien (cf. Kap. 5). Aus dem Experimentalbereich kommt ein ähnliches Ergebnis. Motley, Baars & Camden (1981) haben nachgewiesen, daß sich die Wahrscheinlichkeit von Phonemsubstitutionen erhöht, wenn sie in ein akzeptables syntaktisches Muster eingebettet sind. Während Bocks (1982) Daten auf die Beeinflussung von syntaktischen Entscheidungen durch phonologische Kriterien hindeuten, attestieren die Versprecher die Abhängigkeit phonologischer Entscheidungen von syntaktischen Bedingungen. Es besteht somit kein Zweifel, daß von einem wechselseitigen Informationsaustausch zwischen beiden Subsystemen auszugehen ist. Um eine Entscheidung zwischen Lösung A und B zu treffen, braucht nur festgestellt zu werden, was eine direkte Verbindung zwischen Syntax und Phonologie implizieren würde. Phonemversprecher müßten danach generell aus wortklassenmäßig identischen Wörtern stammen. Das ist jedoch nicht der Fall. In weit über der Hälfte aller phonemischen Modifikationen wird die syntaktische Kategorie des beherbergenden Worts nicht 67 Weiterhin lassen sich B und C in eine gerichtete und eine ungerichtete, wechselseitig sich beeinflussende Version untergliedern.
128
respektiert. Es kommt also nur Lösung B, die über die Lexik vermittelte Beziehung zwischen beiden Komponenten, in Frage. Damit ist eine unabhängige Entscheidung zugunsten des parallelen Informationsflusses zwischen den Verarbeitungsebenen gefallen. Die Richtigkeit dieser Lösung wird durch folgende empirische Tatsache untermauert. Es ist bekannt, daß Modifikationen auf der Wortebene fast immer der Beschränkung der Wortklassenidentität gehorchen, während Morpheme dies bereits weniger häufig und Phoneme, wie oben ausgeführt, in noch geringerem Maße tun. Würde eine direkte Relation zwischen Syntax und Phonologic vorliegen, wäre unerklärlich, weshalb die Phonemmodifikationen weniger syntaxabhängig sind als die Morphemmodifikationen. Im Falle einer indirekten Relation ist dies aber genau die Richtung der Prognose. Da die phonologische Ebene weiter von der Syntax entfernt ist als die morphologische, ist leicht nachzuvollziehen, daß in einem parallelen Modell der Effekt der Syntax in Abhängigkeit von der Entfernung innerhalb des Systems zu spüren ist. Der syntaktische Einfluß schlägt also auf die tieferen Ebenen durch, mehr jedoch auf die morphologische als auf die phonologische. Als Zusammenfassung der bisherigen Ergebnisse bietet sich folgendes unvollständiges Modell der sprachlichen Komponente und ihrer Abgrenzung nach oben an. Nicht berücksichtigt wurde die Prosodie, die vermutlich an die Syntax zu koppeln wäre. Die Pfeile in Abbildung 10 kennzeichnen die Richtung des Informationsflusses bei der Generierung einer sprachlichen Äußerung. Abbildung 10: Ausschnitt aus der Kontrollstruktur des Netzwerkes Semantik Wort
Syntax
129 14.
Zur Frage eines eigenständigen Kurzzeitgedächtnisses
Nachdem die linguistischen Basiskomponenten innerhalb des Netzwerks identifiziert und ihre Abhängigkeiten voneinander analysiert worden sind, ist es an der Zeit, sich mehr den psychologischen Fragestellungen zu widmen. Das Hauptproblem dieses Kapitels wird sein, das Verhältnis zwischen dem Netzwerk einerseits und den Konzepten des Langzeitund des Kurzzeitgedächtnisses andererseits zu klären. Ausgangspunkt dabei sind die de Saussureschen Achsen der Syntagmatik und Paradigmatik. Auf den ersten Blick erscheint eine grundlegende Einteilung in syntagmatische und paradigmatische Fälle unproblematisch. Sie wird in der Tat auch von einer Reihe von Forschern vorgenommen (z.B. Söderpalm Talo 1980, Naucier & Söderpalm 1981). Stemberger (1985a) verwendet eine vergleichbare Unterscheidung in kontextuelle und non-kontextuelle Fehlleistungen. Das Analyseverfahren ist recht einfach. Ist ein Versprecher durch den sprachlichen Kontext einer Äußerung zu erklären, ist er syntagmatisch zu werten, wenn nicht, ist eine paradigmatische Klassifikation erforderlich. Überblendungen und formale Wortsubstitutionen gehören der ersten Kategorie an, Antizipationen und Perseverationen der zweiten. Das Verhältnis von Syntagmatik und Paradigmatik auf der einen Seite und Langzeit- und Kurzzeitspeicher auf der anderen erscheint dabei sehr direkt. Paradigmatische Fehlleistungen sind Störungen von Abrufprozessen im Langzeitgedächtnis, wohingegen syntagmatische eine Folge der Interaktion zweier Langzeitgedächtniselemente sind, die im Kurzzeitspeicher zustande kommt. Die Existenz separater Speichersysteme impliziert, daß Versprecher an zwei unterschiedlichen Stellen in der Generierung einer Äußerung auftreten können. Ich komme damit auf das Problem der Stufigkeit im Sprachproduktionsprozeß zurück. In dem Moment nun, wo solch eigenständige Orte der Fehlergenese postuliert werden, kann es prinzipiell keine Interaktion zwischen beiden Speichertypen in der Versprecherproduktion geben. Mit anderen Worten: die Hypothese eines Arbeitsspeichers beinhaltet, daß hier Fehler in Unabhängigkeit vom Langzeitgedächtnis entstehen. Diese sind also entweder durch das eine oder das andere System bedingt. Eventuell könnte man sich einen Einfluß des Langzeitspeichers auf den Kurzzeitspeicher vorstellen, der umgekehrte Fall, daß,Abrufentscheidungen im Langzeitgedächtnis durch Vorgänge im Kurzzeitgedächtnis beeinflußt werden, ist dagegen kaum denkbar. Für die Versprecherdaten bedeutet das, daß sich syntagmatische und paradigmatische Einflüsse generell nicht kombinieren dürfen. Das Prinzip der Ambiguität, welches als so grundlegend für die Fehlleistungen erkannt wurde, müßte bildlich gesprochen vor den Toren der Syntagmatik/Paradigmatik-Unterscheidung halt machen. Es gilt nun, diese klare Prognose der empirischen Überprüfung zu unterziehen. Von
130
vielen potentiell interessanten Kategorien wurde der Bereich der Wortbildung ausgewählt. Dazu zählen vor allem Derivations- und Flektionsfehler. Je nach zugrunde gelegtem morphologischem Ansatz verändert sich auch ihr theoretischer Status; hier sollen Fälle wie (132 - 134) vorläufig als Nicht-Applikation einer produktiven morphologischen Transformation interpretiert werden. (132) (133) (134)
was Berufsangste angeht, statt: Berufsängste. damit sie dementsprechend gilt— gilt. She's always goed— gone into weird things. (Stemberger 1985a)
In (132) blieb ein Teil der Pluralisierung aus, in (133) ein Teil der Abwandlung der infinitivischen Basis, während in (134) eine unregelmäßige Partizipbildung regularisiert wurde. In allen drei ausgewählten Beispielen erhält der paradigmatische Fehlerprozeß eine syntagmatische Stützung, d.h., es findet sich ein Element im Kpntext, welches dem Fehler gleicht. Rein theoretisch könnten diese Fälle daher auch als Antizipationen oder Perseverationen gewertet werden. Ihre Ähnlichkeit mit syntagmatisch »ungestützten« Fehlern und ihre Unähnlichkeit mit rein phonologischen Versprechern68 macht diese Interpretation jedoch unwahrscheinlich. Dem Postulat des Kurzzeitspeichers zufolge darf der syntagmatische Kontext bei der Applikation der Transformation keine Rolle spielen; die Existenz identischer Segmente müßte zufällig sein. Es ist jedoch keine große Schwierigkeit, die Nullhypothese abzulehnen. Sie wurde approximativ dadurch ermittelt, daß ein Zeitungstext mittlerer Länge unter dem Gesichtspunkt analysiert wurde, in wieviel Prozent der Fälle sich ein Ablaut oder Umlaut in der direkten Nachbarschaft (maximal zwei Wörter Abstand) eines identischen Basisvokals oder abgewandelten Vokals in betonter Position befand. Dies war in 6 von 20 Fällen so. Wenn man nun alle Wortbildungsfehler, die mit einem ausreichenden Kontext in meinem Korpus verzeichnet sind, zugrunde legt, stellt sich heraus, daß knapp zwei Drittel (45 von 73 Fällen) von ihnen eine Quelle oder einen Trigger aufweisen. Dieser Unterschied ist hoch signifikant (JC2(1) = 90,8, a
Final (3)
- -10'9
I
=
100
CVCC (9)
Präfmal (1) -36-1-47
22-3-25
loo -
'
,n -4-3-6 100 =
PPVP IK\
Gesamt
., J, 1G
-16,9
-76,2
... -°'7 + 15,8
Tabelle 44: Auswirkungen der Elision auf die Frequenz der Silbentypen Silbentyp
Initial (16)
Postinital (3)
/ U*1 /Ctl) 7 L>V
-44-16-47 100
.. '331
p\/ fy**\ UV (£5)
-23-16-25 100
'
-8-16-9 100
~U'J
1
/ * (yj fQ\ UVL.U
loo
36-1-9 100
„,
- ·31
J A
'
-3-3-6
loo - 7 ' 4
-434,5
Final (3) -22-3-47
41-3-6
PPWi"1 f£\
Gesamt
Präfinal (1)
too - ·°·5
7,4
3,2
-31,5
Es ist klar zu erkennen, daß, wenn man als Ankerpunkt die Substitutionen bei Null ansetzt, Additionen ebenso wie Elisionen der Silbenfrequenz abträglich sind. Dabei ist dies in weit stärkerem Maße bei den Elisionen (-455,5) als bei den Additionen (-77,3) der Fall, eine Tendenz, die sich bereits bei der CVC-Struktur deutlich abzeichnet. Es läßt sich also als Ergebnis festhalten, daß die Normalitätstendenz (gemessen an der prozentualen Auftretenshäufigkeit) von Additionen weniger unterlaufen wird als von Elisionen. Deswegen sind diese auch seltener als jene. An diesem Beispiel wird das Zusammenwirken einer sprachlichen Norm und dem Prinzip der Minimalaktivation deutlich, welches diese Norm mental abbildet. Es ist demnach zu vermuten, daß neben dem psychischen Mechanismus die Silbenbautypen einer Sprache der primäre Verursacher der Frequenzunterschiede bei den einzelnen deskriptiven Klassen sind. Dies kann natürlich empirisch überprüft werden. Man kann aus diesem Postulat die Prognose ableiten, daß sich in einer Sprache mit anderen Silbenstruk-
162
turpräferenzen (z.B. deutlich mehr offene als geschlossene Silben im Japanischen) die prozentualen Anteile der deskriptiven Kategorien anders darstellen. Das Englische ist für eine derartige Überprüfung aufgrund seiner vergleichbaren Bauweise weniger geeignet. Die Sammlung von Versprecherdaten aus anderen Sprachen ist daher dringender denn je.
16.6.1.2. Die mentale Irrealität phonotaktischer Regeln Es ist eine lang geübte Praxis in der Linguistik, Regelsysteme aufzustellen, mit Hilfe welcher man alle möglichen Fälle erfaßt und alle unmöglichen ausschließt. Prinzipiell gibt es zwei konträre Vorgehensweisen. Die Regel kann entweder positiv oder negativ formuliert werden. Welcher Weg eingeschlagen wird, wird vor allen Dingen in Abhängigkeit von der Komplexität des Regelsystems entschieden. Aus diesem Grund werden phonotaktische Regeln zumeist als phonotaktische Beschränkungen notiert. Es ist einfacher festzustellen, daß anlautendes /dl/ nicht erlaubt ist, als aufzuzählen, welche Clusterverbindungen ein /d/ bzw. ein III einzugehen imstande ist. Die Existenz phonotaktischer Beschränkungen wird in der Linguistik kaum angezweifelt. So gehört es auch zu einer der ersten und häufig wiederholten Beobachtungen in der Versprecherforschung, daß Fehlleistungen mit den phonotaktischen Möglichkeiten der Sprache konform gehen. Ausnahmen traten in den ersten kleineren Versprecherkorpora kaum oder gar nicht auf; heute ist jedoch klar, daß es solche Fälle gibt: (148)
a. die D/ei— Dreig/iederung des Dialogs. b. in a first floor d/orm— d orm room. (Stemberger 1983b)
Wären Beispiele wie (148) nicht belegt, könnte man mit einer gewissen Plausibilität argumentieren, daß hier Beschränkungen am Werk sind. Jedoch müßte man dann erklären, wie diese auf das Verarbeitungsresultat des Produktionssystems Einfluß nehmen. Daß eine nachträgliche Verifikation durch eine mentale Kontrollinstanz in Form eines negativen Regelsystems nicht überzeugen kann, wurde bereits bei der Vokalelisionsresistenz festgestellt. Tatsache ist jedoch, daß es Fälle wie (148) gibt. Ihre bloße Existenz kann bereits als Evidenz gegen die Annahme der phonotaktischen Beschränkungen gewertet werden, denn es fragt sich, wie solche Versprecher unter diesen Bedingungen überhaupt zustande kommen können. Aufgrund der Analysen der vorangegangenen Kapitel ist die Antwort klar, da es sich hier wiederum um einen normativen Aspekt der Versprecher handelt. Zu klären ist daher, wie das Prinzip der verteilten Minimalaktivation phonotaktisch akzeptable Sequenzen wahrscheinlich und inakzeptable unwahrscheinlich macht. Ich komme dazu auf die Clusterproblematik zurück und verbinde das konkrete Beispiel (149)
Da ringelt- Mngelt das Telefon.
mit der Frage, weshalb das /t/ den Cluster /kl/ verdrängt und nicht den ersten Bestandteil daraus. Letztere Möglichkeit wäre allein schon deswegen zu erwarten gewesen, weil die Interaktionsfreudigkeit von /t/ und /k/ sehr hoch ist. Allerdings hätte eine derartige Sub-
163
stitution zu der unorthodoxen Sequenz /tl/81 geführt. Wie wird diese nun von vornherein gehemmt? Nicht zufallig ähnelt die Antwort der Erklärung der Übergangswahrscheinlichkeit, da phonotaktische Beschränkungen nichts anderes als eine Art Nullübergangswahrscheinlichkeit darstellen. Für das vorliegende Beispiel gilt nun, daß eine Verbindung von /t/ und /!/ auf der syntagmatischen Achse von dem Gesamtsystem keine Unterstützung erfahren würde, da sie dort keinen einzigen Freund hat. Das bedeutet, daß das /t/ als Kandidat für eine / l/-Position kaum Aktivation erhält und insofern auch nicht das /k/ verdrängen kann. Dies gilt, wie der belegte Versprecher zeigt, im übrigen nicht für die gesamte Anlautkonsonanzposition, denn ingelt kann das /t/ sehr gut akzeptieren. Es wird damit deutlich, was sich bereits z.B. bei der Kontextidentität gezeigt hat. Die Wahrscheinlichkeit eines Versprechers hängt nicht nur von der Interaktionsfreudigkeit zweier Elemente ab, sondern auch von der Art der Bindungsarme des syntagmatischen Kontexts. Das Aktivationsniveau wird von beiden Faktoren gleichermaßen beeinflußt. In seltenen Fällen liegen die Aktivationsverhältnisse dann so, daß die Macht des einen Faktors so groß ist, daß er den anderen »überrollt« und es zu unorthodoxen Sequenzen kommt. Bezeichnenderweise ist die Interaktionsfreudigkeit von /r/ und /!/ in (148a) auch besonders hoch. Das Bedeutsame dieser Erklärung ist, daß das Netzwerk offenbar vollständig auf phonotaktische Beschränkungen verzichten kann. Ihre Nicht-Existenz kann zwar nicht bewiesen, aber zumindest doch ihre Überflüssigkeit herausgestellt werden. Die non-lokale Minimalaktivation erfüllt automatisch die gewünschten Effekte. Es schält sich somit die Erkenntnis heraus, daß regelhaftes Verhalten, so paradox es auch klingen mag, aus psycholinguistischer Sicht nicht notwendigerweise die Existenz von Regeln impliziert. Zwar ist der hier postulierte Mechanismus, der regelhaftes Verhalten verursacht, in der Linguistik nicht völlig unbekannt. Die verteilte Minimalaktivation könnte man nämlich als psycholinguistisches Korrelat des Analogiekonzepts verstehen. Der Vergleich zwischen der Analogie und der Minimalaktivation hinkt aber mehr, als man auf den ersten Blick meinen könnte. Die Aktivationsart geht nämlich in ihrer Erklärungskraft weit über die Analogie hinaus. Während letztere vor allen Dingen in der Historischen Linguistik oft als catch a//-Kategorie für unregelmäßige Formen Verwendung findet, ist erstere als der wahre Verursacher von jeglichem normorientierten Verhalten zu sehen. Dies hängt damit zusammen, daß für das Postulat der Analogie in der Linguistik bereits eine einzige Form als Modell ausreichend ist, während sich die verteilte Aktivationsart, wie das Wort schon sagt, auf das gesamte Netzwerk erstreckt. In der Linguistik stehen Regeln und Analogie als Konzepte mit unterschiedlichem Referenzbereich nebeneinander, in der Psycholinguistik hingegen wird mit der Minimalaktivation das ganze Feld des normgebundenen Verhaltens abgedeckt. 81 Es ist zu beachten, daß phonotaktische Beschränkungen trotz des Einflusses artikulatorischer Bedingungen (Diver 1979) bis zu einem bestimmten Grad willkürlich sind. Dies wird zum einen in einer gewissen einzelsprachlichen Variabilität in diesem Punkt und zum anderen in der Kindersprache deutlich. Meine Tochter ersetzte beispielsweise noch lange, nachdem sie /Cl/-Cluster beherrschte, /k/ durch /t/, so daß Wörter wie Tlo statt Klo entstanden. Interessanterweise gelang ihr nach Überwindung dieser Stufe selbst die imitative Produktion von Tlo nicht mehr.
164
Das Problem der phonotaktischen Regeln eignet sich hervorragend als Aufhänger für eine Analyse des Verhältnisses zwischen Linguistik und Psycholinguistik. In der hier verfolgten Zielsetzung sollen jedoch folgende Bemerkungen genügen: Es scheint, daß die Formulierung von Regeln, was als Dreh- und Angelpunkt jeglicher linguistischer Betätigung angesehen werden kann, in der Sprachproduktion von untergeordneter Bedeutung ist. Damit ist natürlich nicht gemeint, daß der Produktionsmechanismus vollständig auf Regeln verzichtet. Aussagen sind hier nur über die diskutierten phonotaktischen Regeln möglich. Es ist durchaus vorstellbar, daß andersartige Regelapparate, wie z.B. die rewrite rules von den hier getroffenen Feststellungen unberührt bleiben. Nichtsdestotrotz zeichnet sich ab, daß zum Sprechen die Formulierung und der Rückgriff auf explizite Abstraktionen offensichtlich nicht erforderlich ist. Das Produktionssystem erzeugt durch seine Struktur und seine Verarbeitungsbedingungen quasi als Nebeneffekt Abstraktionen. Dies mag den Linguisten, die Householders (1979) Bemerkungen aus dem Kap. l dieser Studie als Herausforderung ansehen, zu denken geben. Die Absage an phonotaktische Regeln als Bestandteil des Sprachproduktionsmechanismus erscheint auch über das begrenzte Feld der Versprecher hinaus plausibel. Die politisch Interessierten im deutschen und englischen Sprachraum wären beispielsweise, falls sie über ein phonotaktisches Regelwerk verfügten, gezwungen gewesen, 1972, als Ceylon Republik wurde, ihre /sr/-Beschränkung für den Anlaut wegen eines einzigen Worts aufzugeben. Daß die Aufnahme eines neuen Items die Eliminierung bestimmter Regeln nach sich zieht, kann kaum einleuchten. Es ist aber auch deswegen gar nicht möglich, weil sich der Sprachbenutzer trotz der Integration des neuen Worts ein Gefühl für die Ungewöhnlichkeit des /sr/-Clusters bewahrt. Mit dem Regelkonzept ist eine derartige Relativität jedoch nicht zu erfassen. Hier zeigt sich also, daß prinzipielle Bedenken gegen die mentale Realität phonotaktischer Regeln erhoben werden müssen. Es ist bemerkenswert, daß trotz erheblicher Vereinfachung des Systems selbst die Vertreter des aktivationellen Ansatzes auf das Konzept der phonotaktischen Regeln kaum verzichten. Während Dell (1980, 1984) sie als Komponente in sein Netzwerkmodell ohne weiteres aufnimmt und sie dort sogar eine sehr wesentliche Rolle spielen, läßt Stemberger (1983b) die Frage offen, ob es sich dabei um einen aktiven oder passiven Mechanismus der Aktivationsbeeinflussung handelt. In diesem Kapitel wurde eine Alternativlösung vorgeschlagen, deren grundlegende Idee auf folgenden zukunftsweisenden Schlußbemerkungen von Rumelhart & McClelland (1982) basiert: ... it may be fruitful to continue exploring the possibility that other types of apparently rule-governed behavior may be accounted for by synthesis of stored knowledge about individual cases. (Rumelhart & McClelland 1982:93)
16.7.
Aktivationsfluß und das Netzwerk
Nachdem einige wesentliche Prinzipien des Aktivationsflusses bekannt sind, ist es an der Zeit, diese genauer in Beziehung zur Netzwerkstruktur zu setzen. Dabei soll es vornehm-
165
lieh um die Klärung folgender Fragen gehen: Sind die Aktivationsverhältnisse auf allen Verarbeitungsebenen die gleichen? Auf welche Weise läßt sich mit einer genau definierten Anzahl von Ebenen jede beliebige sprachliche Größeneinheit generieren? Wie lange muß die Aktivation zwischen den Ebenen fließen, bis es zu einer Produktion kommen kann? Im folgenden wende ich mich diesen drei Fragen der Reihe nach zu.
16.7.1.
Verarbeitungsunterschiede auf der Phonem- und der Merkmalebene
Durch die kooperative Wirkung von Feedforward and Feedback ergibt sich zwangsläufig, daß zur Produktion eines Items mindestens ein zweifacher Informationsfluß erforderlich ist. Ein Phonem bedarf also der Bestätigung der lexikalischen ebenso wie der der Merkmalebene. Im vorliegenden Netzwerkmodell ist diese Situation der vertikalen »Einreihung« für das Wort bzw. Morphem gegeben, nicht jedoch für das distinktive Merkmal. Es steht am äußersten Ende der Hierarchie und nur mit den Phonemen in Verbindung. Auf dieser Ebene ist damit das Prinzip der Doppelanbindung nicht mehr gewährleistet. Es ist naheliegend, daß diese Tatsache Auswirkungen auf die Verarbeitungsmodalitäten und letztlich auch auf die Funktion der Merkmale im Produktionssystem hat. Oft ist in der Literatur die Frage nach dem psycholinguistischen Status der Phonemkomponenten aufgeworfen worden. Die Meinungen gehen hier weit auseinander. Während Fromkin (1971) sie als unabhängig steuerbare Planungseinheiten ansieht, sind sie für Shattuck-Hufnagel & Klatt (1979a) nur Etiketten für phonemische Kategorien. Mit anderen Worten: während Shattuck (1975) den Merkmalen den Charakter von Planungseinheiten abspricht, stellt Fromkin (1971) sie auf dieselbe Stufe wie alle anderen Größeneinheiten. Beide Positionen sind nicht haltbar. Dabei liegt das Problem weniger darin, Argumente für die eine oder andere Seite zu finden als im Ansatz der Fragestellung. Es bleibt nämlich letzten Endes unklar, was genau unter einer Planungseinheit in einem psycholinguistischen Modell zu verstehen ist. Daß die Merkmale eine psychische Realität besitzen, kann nicht bezweifelt werden, denn wie sonst sollten Versprecher wie (150) erklärt werden? (150)
a. Arähtet—/>rärfeterminiert. b. (ficar— guitar. (Stemberger 1985a)
Merkmale wie die Stimmhaftigkeit oder der Artikulationsort sind demzufolge auch Planungseinheiten, da sie zur Generierung einer Äußerung in Anspruch genommen werden. Das berechtigt jedoch nicht zu dem Schritt, sie in ihrem Status anderen Größeneinheiten gleichzustellen. Denn wie Fromkin (1971) selbst einräumt, sind Merkmalfehler seltener als segmenteile. Dies ist genau das Ergebnis, das nach dem hierarchischen Ebenenmodell zu erwarten ist. Aufgrund der ausschließlich einseitigen Bindung an die Phoneme fehlt es den Merkmalen an dem erforderlichen Aktivationsspielraum, um in den Fehlerprozeß mit einer gewissen Regelmäßigkeit involviert zu werden. In dem Netzwerkmodell erfüllen die Merkmale nur die Funktion des Aktivationslieferanten für die Segmente. Diese Situa-
166
tion macht die Phoneme flexibel, sie selbst aber ziemlich unbeweglich. Merkmale bilden also zweifelsohne eine eigene Verarbeitungsebene, sie existieren aber nicht um ihrer selbst willen, sondern nur, um das Phonemlexikon (auf der tieferen Ebene) zu organisieren und um damit die Integration der Phoneme zu gewährleisten. Diese psycholinguistische Theorie der Merkmale ermöglicht nun einen Fortschritt gegenüber dem in Kap. 3 als Prätheorie entlarvten Klassifikationsverfahren in Fromkin (1973b). Wenn Phoneme im Vergleich zu Merkmalen die weit besseren Möglichkeiten der Involvierung in einen Fehlerprozeß haben, sollte im Fall von Ambiguität in der Gruppenzuweisung prinzipiell zugunsten der Segmente entschieden werden. Dies mag im Einzelfall verkehrt sein, auf die Gesamtheit der Versprecher bezogen, steht es jedoch im Einklang mit der Theorie. Es ist zu beachten, daß eine so vorgenommene Versprecherklassifikation natürlich keinen Anspruch auf Objektivität erhebt, sie unterscheidet sich jedoch von Fromkins Methode dadurch, daß sie durch eine psycholinguistische und nicht länger durch eine linguistische Theorie motiviert ist. Damit sind die Voraussetzungen geschaffen, um der Frage nach unterschiedlichen Verarbeitungsbedingungen auf der Phonem- und Merkmalebene nachzugehen. Erste Unterschiede werden aus der Beobachtung deutlich, daß bei der Aktivierung eines Phonems automatisch — je nach zugrunde gelegter Merkmaltheorie — mindestens drei Elemente im Merkmallexikon angesprochen werden. Daraus ergibt sich eine insgesamt weit höhere Nutzung der Merkmalknoten als der Segmentknoten. Ein Beispiel möge das verdeutlichen. Bei angenommener gleicher Häufigkeit von stimmhaften und stimmlosen Segmenten wird das Merkmal [stimmlos] in 50% aller Fälle in Anspruch genommen, während selbst der häufigste Konsonant in seiner Auftretensfrequenz weit unter 20% liegt. Dies hat eine naheliegende Konsequenz für die Verarbeitungsbedingungen auf beiden Ebenen: Die Merkmale müssen robuster, d.h. belastbarer sein. Jede Äußerung führt nämlich mit großer Wahrscheinlichkeit zur gleichzeitigen Doppel- bzw. Mehrfachbeanspruchung desselben Merkmals, eine Situation, die sich für die Phoneme (in gleicher Position) viel seltener stellt. Man sollte daher annehmen, daß Merkmale notgedrungenermaßen mit Mehrfachbeanspruchungen besser fertig werden als Segmente. Dies ist empirisch zu prüfen. Für die Phoneme konnte nachgewiesen werden, daß eine Doppelbeanspruchung zu einer Aktivationssteigerung führt. Wenn also die Verarbeitungsbedingungen auf beiden Ebenen identisch sind, sollten auch Merkmale durch einen zweifachen Befehl hyperaktiviert werden. Es läßt sich an zwei Punkten zeigen, daß dem jedoch nicht so ist. Im Extremfall müßte die Hyperaktivierung wie bei den Phonemen zu Maskierungen führen. Dies ist jedoch theoretisch unmöglich, ein Phonem kann nicht unspezifiziert z.B. für die Artikulationsart bleiben. Diese Unmöglichkeit ist eine logische Folge der relativen Uneigenständigkeit der Merkmale: Ohne die Phoneme sind sie nichts. In dem Moment, wo das Feedback von einem Merkmal zu einem Phonem nicht funktioniert, ist davon auszugehen, daß das Phonem gar nicht zur Produktion gelangt. Wenn es jedoch so wäre, daß bei Doppelanforderung auf der Merkmalebene ein Phonem ausfällt, dann könnte die Ähnlichkeit keine versprecherbegünstigende Wirkung mehr haben.
167
Der zweite Punkt betrifft die minimale Hyperaktivation. Wie oben ausgeführt, wird im Laufe einer Äußerung jedes Merkmal mehr als einmal angefordert. Dies bedeutet, daß mehr oder weniger alle Merkmale in Hyperaktivation geraten und diese an die betreffenden Phoneme weiterleiten. Durch den großen Überschneidungsbereich auf der Merkmalebene kann nun von einem differenzierten Aktivierungseffekt keine Rede mehr sein. Er ist mehr oder weniger vollständig dadurch neutralisiert, daß, wenn überhaupt, alle Merkmale von ihm profitieren. Die Schlußfolgerung liegt daher nahe, daß Phoneme und Merkmale nicht denselben Verarbeitungsbedingungen unterliegen. Die Ursache ist darin zu sehen, daß die Merkmale generell höheren Ansprüchen im Vergleich zu den Segmenten genügen müssen. Es ist ein altbekannter Effekt, daß eine wiederholte Verwendung die Verarbeitung insgesamt problemloser macht. Deswegen ist das Merkmal unempfindlicher und wird besser mit Doppelbefehlen fertig. Es wächst quasi mit den gestellten Aufgaben. Für ein Phonem sieht die Situation jedoch etwas anders aus: Durch seine geringere Inanspruchnahme ist es aber auch weniger vor eventuellen Verarbeitungsschwierigkeiten gefeit. Die Gründe für die ermittelten Verarbeitungsunterschiede legen nahe, daß sie nicht nur im Vergleich von segmenteller und Merkmalebene zu finden sein sollten. In der Tat haben Rumelhart & McClelland (1982) auch Unterschiede zwischen der Wort- und der Phonemebene feststellen können.
16.7.2.
Die Generierung von unorthodoxem Material
Es wurde in Kap. 14.1. behauptet, daß eine Beweisführung gegen die Existenz einer Clusterverarbeitungsebene (Clusterlexikon) nur dann überzeugend ist, wenn nachgewiesen werden kann, daß solche Phonemsequenzen ausschließlich durch die Interaktion der phonemischen und der lexikalischen Ebene ohne Zwischenstufe generierbar sind. Dieser Nachweis soll nun erbracht werden. Folgendes Beispiel wird der Analyse zugrunde gelegt: (151) (151')
coat iAmtting. statt: throat oitting. (Fromkin 1973b) *croat thutung. statt: throat oitting.
Das Problem reduziert sich auf die bekannte Frage, ob und wie ein Cluster gegenüber einer Einzelphonemmodifikation zu motivieren ist. Dabei genügt bereits eine prinzipielle Motivierungsmöglichkeit; wieweit sie dann im Einzelfall ausgenutzt wird, ist eine andere Frage. Solche prinzipiellen Begünstigungen für Cluster sind natürlich vorhanden. Im obigen Beispiel ist es der Lexikalitätseffekt, der coat gegenüber croat den Vorzug gibt. Das bedeutet, daß die lexikalische Ebene für eine Clustermodifikation mehr Aktivation zur Verfügung stellt als für eine einzelphonemische. Deshalb kommt es dann auch zu (151) und nicht zu (151'). Phonem- und Lexemebene sind also durch ihre Interaktivität prinzipiell imstande, ebenenfremde Einheiten zu generieren. Dies gilt nicht nur für Cluster, sondern auch für alle anderen Phonemverbindungen. Die gesamte Bandbreite von unorthodoxen Größen-
168
einheilen in Versprechern (cf. Kap. 10.4.) ist also mit Hilfe von nur zwei Ebenen zu erzeugen. Der Schlüssel für diese außergewöhnliche Kreativität liegt in der Fähigkeit ihrer Interaktion.
16.7.3.
Zur Dauer der Interaktion
Ratcliff & McKoon (1981) haben nachgewiesen, daß die Geschwindigkeit des Aktivationsflusses extrem hoch ist. Dieses Ergebnis kann als Garant einer maximalen Interaktivität gewertet werden. Es besteht insofern kein Grund zu der Annahme, daß sich der Aktivationsfluß mit einem zweimaligen Durchlaufen einer jeden Verarbeitungsebene (einmal durch Feedforward, einmal durch Feedback) begnügt. Immerhin sind dem Aktivationsfluß und damit der Interaktivität keine mechanischen Grenzen gesetzt. Durch wiederholtes Durchlaufen derselben Ebene besteht nun die Möglichkeit, die Verarbeitungsergebnisse auf allen Ebenen so auszutarieren, daß eine maximale Kongruenz erreicht wird. Damit wird eine natürliche, weil systeminterne Begrenzung des Aktivationsflusses erkennbar. Er könnte in dem Moment sein Ziel erreichen, wo sich die Aktivationsverhältnisse stabilisiert haben, wo also selbst durch eine weitere Interaktion sie sich nicht mehr verändern. Diese Erklärung erweckt den Eindruck, daß der Produktionsmechanismus zur Generierung seines Outputs unbegrenzt Zeit hat. Dies ist natürlich eine Idealvorstellung. In Wirklichkeit unterliegt er durch das Sprechtempo den Beschränkungen der realen Zeit. Dadurch kann die Situation eintreten, daß der Output angefordert bzw. weiterverarbeitet wird, ehe sich die Aktivationsverhältnisse eingependelt haben. Die Folge wäre eine erhöhte Versprecherwahrscheinlichkeit. In der Tat ist es eine oft getroffene Feststellung, daß bei schnellerem Sprechen die Anzahl der Fehler zunimmt. Zungenbrecher sind gewiß der beste Beweis dafür (Kupin 1979). Es erscheint daher sinnvoll, mit Motley (1974:87) ein externes Zeitschema zu postulieren, mit dem der Sprecher die Dauer des Aktivationsflusses im Netzwerk regulieren kann. 16.8.
Grenzen der versprecherbegünstigenden Faktoren
Es konnte im empirischen Teil gezeigt werden, daß die Interaktion in der Regel zwischen dicht beieinander stehenden Elementen erfolgt. Kommt hingegen eine Fehlleistung zwischen entfernteren Größen zustande, sind besonders begünstigende Faktoren im Spiel. Dies ist mit dem Konzept der Kompensation gut zu erklären. MacKay (1970a) sieht den Effekt der »Nächstenliebe« als eine generelle Eigenschaft segmenteller Versprecher an. Wenn MacKay damit recht hat, müßte die Modifikationswahrscheinlichkeit mit zunehmender Nähe korrelieren. Dies ist jedoch nicht der Fall, wenn man die Frequenzen der einzelnen Versprecherkategorien in Betracht zieht. Die nicht-normalisierten Daten zeigen deutlich, daß intramorphemische Fehlleistungen erheblich seltener als intermor-
169
phemische sind. Mehr noch: nach MacKay (1970a) müßten die meisten Versprecher zwischen direkt benachbarten Phonemen zustande kommen. Auch das ist eindeutig nicht gegeben. MacKays Schlußfolgerung ist daher zu undifferenziert. Wenn an ihr trotzdem etwas Wahres ist — und daran besteht kein Zweifel —, muß es also einen Punkt geben, der die Grenze der Begünstigung markiert. Bis zu ihm wirkt die Nähe offenbar förderlich, darüber hinaus jedoch hemmend. Es soll zunächst versucht werden, diesen Punkt zu lokalisieren. In absoluten Zahlen ausgedrückt, sind interverbale Versprecher weit häufiger als intraverbale. Aussagekräftig wird dieses Resultat aber erst, wenn man die sprachlichen Bedingungen für die beiden Typen in Rechnung stellt. Intraverbale Fehlleistungen setzen nämlich per definitionem Lexemkomplexe oder Grammem-Lexem-Verbindungen voraus. Da phonologische Modifikationen in Grammemen eher die Ausnahme sind, geht es primär um die Häufigkeit der Lexemkomplexe. Die Durchsicht eines gesprochenen Korpus (ISminütige Aufzeichnung eines Gesprächs in einer Talkshow) erbringt ein Verhältnis zwischen Teilsätzen (als der Größeneinheit, die in einem Zug geplant wird) mit und ohne Lexemkomplex von ca. 1:5. Übertragen auf die Tatsache, daß interverbale Versprecher knapp dreimal so häufig wie intraverbale sind, bedeutet das, daß die statistische Normalisierung die intraverbale als die häufigste Versprecherkategorie ausweist. Es läßt sich also festhalten, daß der Kulminationspunkt in der intraverbalen Distanz interagierender Elemente erreicht ist. Danach endet das MacKaysche Prinzip und beginnt die Modifikationsresistenz. Graphisch läßt sich die Situation wie folgt grob skizzieren. Abbildung 17: Interaktionsbereitschaft als Funktion der Entfernung Interaktionsbereitschaft
intramorphemisch
intraverbal
interverbal
Entfernung
Mit zunehmender Entfernung im interverbalen Bereich bewegt sich die Interaktionsbereitschaft asymptotisch auf den Nullpunkt zu. Daß hier zur isolierten Analyse des Distanzeffekts stark vereinfacht wurde, braucht nicht extra erwähnt zu werden. Worin liegen nun die Ursachen für den Verlauf der Kurve? Es müssen ganz offensichtlich andere Aktivationsfaktoren dem Prinzip der »Nächstenliebe« zuwiderlaufen. Tatsächlich greift hier in entscheidendem Maße das Gesetz der Positionskonstanz ein. Versprecher sind bekanntlich auch davon abhängig, daß sie eine positionelle Identität aufweisen. Analysiert man daraufhin die einzelnen Versprecherklassen, so zeigt sich, daß intramorphemische nur der Positionskonstanz auf der Silbenebene gerecht werden können, intraverbale auf der Silben- und Morphemebene und interverbale einschließlich der
170
Wortebene immerhin auf allen dreien. Gesetzt den Fall, die Anzahl der Ebenen, auf denen sich die Identität nachweisen läßt, korreliert mit der Höhe des Aktivationsniveaus, so wird schnell deutlich, daß interverbale Versprecher in Hinblick auf die Positionskonstanz am besten und intramorphemische am schlechtesten wegkommen. Diese Prognose deckt sich mit der Tendenz in den nicht-normalisierten Daten. Wie interagieren nun beide Aktivationsfaktoren? Welcher von beiden, wenn überhaupt, der stärkere ist, ist eine weitere wichtige Frage. Die Positionskonstanz kann durch positionswechselnde Versprecher genauso »überrollt« werden wie die »Nächstenliebe« durch entferntere Fehlleistungen. Angenommen, beide Faktoren wären gleich stark, so würden sie sich bei ihrer gegenläufigen Tendenz in ihrer Wirkungsweise neutralisieren. D.h., gleiche Häufigkeiten für die drei Versprecherklassen wären zu erwarten. Daraus, daß das nicht der Realität entspricht, ist zu schließen, daß beide Faktoren nicht denselben Stellenwert haben, vorausgesetzt, hier sind nicht noch weitere aktivationelle Faktoren im Spiel. Um den empirischen Daten gerecht zu werden, wird es deshalb erforderlich, der Positionskonstanz eine größere Bedeutung beizumessen als der »Nächstenliebe«. Wenn man willkürlich eine unterschiedliche Beeinflussungsstärke im Verhältnis von 2: l zugrunde legt, ergibt sich folgendes Bild. Mit den Faktoren l, 2 und 3 wird der Grad der günstigen Bedingungen ausgedrückt. Tabelle 45: Frequentielle Effekte bei der Interaktion zw eier aktivationeller Fak toren Versprechertyp
Nächstenliebe (1)
Positionskonstanz (2)
Gesamt
intramorphemisch
3-1
1-2
5
intraverbal
2-1
2-2
6
interverbal
1-1
3-2
7
Tabelle 45 macht deutlich, daß man sich mit der vorgenommenen unterschiedlichen Gewichtung der aktivationellen Parameter den empirischen Verhältnissen zumindest in der nicht-normalisierten Form nähert. Weshalb die intraverbalen Versprecher aber in Wirklichkeit häufiger als die interverbalen sind, ist damit nicht zu erklären. Es ist zu bedenken, daß dies prinzipiell nicht möglich ist; ganz gleich, welchen Faktor man auch für die Positionskonstanz ansetzt, die interverbale Kategorie bleibt immer im Vorteil. Daraus ist zu schließen, daß bei den intraverbalen Fehlleistungen besondere Umstände eine Rolle spielen müssen. Ihnen will ich mich im nächsten Kapitel zuwenden. Soviel läßt sich bis hierhin also feststellen: Der Positionseffekt beeinflußt die Aktivationsniveaus in stärkerem Maße als die Distanz. Die Schwäche des Entfernungsfaktors könnte damit zusammenhängen, daß für eine Planungseinheit alle Phoneme mehr oder weniger gleichzeitig bereitgestellt werden müssen. Das bedeutet, daß sie alle ein gewisses Aktivationsniveau besitzen, größere Unterschiede daher nicht vorhanden sind, so daß dieser Faktor notwendigerweise eine geringere Rolle spielt. Man bedenke, daß die Schwä-
171
ehe dieses Faktors erst die Voraussetzung für syntagmatische Versprecher schafft, denn sonst würde ja eine Kommunikation zwischen unterschiedlichen Elementen in derselben Äußerung gar nicht zustande kommen können. Als nächstes erfolgt die Analyse eines zweiten Bereichs, bei dem die Grenzen der Aktivationsbegünstigung augenfällig werden. Neben dem Phänomen der Nächstenliebe hatte MacKay (1970a) auch die phonologischen Eigenschaften der Interaktanten untersucht. Er kam wie viele andere nach ihm zu dem Ergebnis, daß interagierende Elemente einander ähneln. Diese Behauptung ist nun genau wie die oben diskutierte zu relativieren. Unter der Voraussetzung, daß die Identität qualitativ nichts anderes ist als die Ähnlichkeit, ist nämlich im Rückgriff auf die Analyse der Maskierungen daran zu erinnern, daß es hierbei zu vollständigen Interaktionsresistenzen kommt. MacKay (1970a) zufolge wäre jedoch zu erwarten gewesen, daß die Interaktion mit zunehmender Ähnlichkeit wahrscheinlicher wird. Man könnte dem entgegenhalten, daß die Inbezugsetzung von Ähnlichkeiten und Identitäten eventuell doch nicht zulässig ist. Es läßt sich aber mit einer weiteren Versprecherkategorie demonstrieren, daß MacKays Aussage zu undifferenziert ist, auch ohne daß die Gleichung Vollähnlichkeit = Identität stimmen muß. Laut MacKay (1970a) müßten Versprecher bei Phonemen, die sich nur in einem distinktiven Merkmal unterscheiden, besonders häufig sein. Dies gilt jedoch nicht für die stimmhaft/stimmlosen Paare (Berg 1985a). Durch alle Versprecherkorpora hindurch zieht sich eine Diskrepanz zwischen theoretischer Erwartung und Wirklichkeit. Beispiele wie (152) sind eher selten. (152)
a. .Baris is the most beautiful city, statt: Paris.(Fromkin 1973b) b. F: Ne /»ougez pas— ne fougez pas.
Sollten /p/—/b/ Paare aufgrund ihrer Interaktionsunwilligkeit als besonders unähnlich angesehen werden? Nein, ganz im Gegenteil: diverse Ergebnisse lassen solche Paare als noch ähnlicher als beispielsweise /p/ und /k/ erscheinen. Die Interaktion von stimmhaft/stimmlosen Paaren wäre aus diesem Blickwinkel die direkte Vorstufe zu den identische Elemente betreffenden Maskierungen. Beide Typen gleichen sich in der Generierung von Hyperaktivation, unterscheiden sich aber quantitativ. Die Entsprechung des Kulminationspunkts bei der Nächstenliebe, die Intraverbalität, läßt sich also in den /p/—/t/ o.a. Paaren erkennen. Hier ist die Fehlerhäufigkeit am größten. Über diesen Punkt hinaus nimmt sie ab, als nächste Orientierungspunkte sind bei der Nächstenliebe der intramorphemische Bereich, bei der phonologischen Ähnlichkeit die stimmhaft/stimmlosen Paare und schließlich die identischen Phoneme zu lokalisieren. So interagieren /p/—/b/ Paare nur selten und /p/—/p/ Paare überhaupt nicht. Es läßt sich also eine deutliche Kontinuität nachweisen, was sich auch in den postulierten Aktivationsmechanismen widerspiegelt. Die Ähnlichkeit zwischen /t/ und /k/ führt über »normale« Aktivationsverhältnisse zu einer starken Interaktion. Bei /t/ und /d/ sieht es jedoch schon anders aus. Hier wird ein Hyperaktivationseffekt postuliert, der bei der Verarbeitung des /t/ alle stimmlosen Konsonanten besonders begünstigt und damit automatisch die Chancen für eine Intrusion aller stimmhaften Segmente minimiert (Berg 1985a). Die Folge ist eine geringe Interaktionsrate bei /d/ und /t/. Diese Hyperaktivation
172
verstärkt sich im Falle von identischen Elementen und führt zu einer völligen Interaktionsresistenz. Dies ist als unabhängige Bestätigung für die Deutung der Maskierungen im Rahmen des Konzepts des maximalen Aktivationszuwachses zu werten. Abschließend sei darauf hingewiesen, daß die aufgezeigte Parallelität bei der Nächstenliebe und der phonologischen Ähnlichkeit nur in der Oberfläche besteht. Die begünstigende Wirkung der Nächstenliebe existiert generell, sie wird nur durch andere Faktoren durchkreuzt. Die begünstigende Wirkung der Ähnlichkeit existiert jedoch nicht generell, sondern nur bis zu einem gewissen Punkt. Danach schlägt sie aufgrund systeminterner Verarbeitungsbedingungen in ihr Gegenteil um.
16.9.
Zur Verarbeitung der Initialposition
Daß die Initialposition besonders modifikationsfreudig ist, gehört zu den Standardaussagen der Versprecherforschung (cf. zuletzt Shattuck-Hufnagel 1987). Die meisten Autoren sehen darin Evidenz für eine höhere Ausgangsaktivation im Vergleich zu den anderen Positionen. Weitgehend ungeklärt sind die Ursachen für diesen Sonderstatus der Initialposition. Das interessanteste Experiment zu diesem Problem hat Shattuck-Hufnagel (1982c) durchgeführt. Sie konnte nachweisen, daß der Effekt bei sinnlosen Silben oder bloßen Aneinanderreihung von sinnvollen Wörtern nicht existiert; nur wenn normale Sprachmuster verwandt werden, kommt er zum Vorschein. Dieses Resultat wirft Zweifel an der statischen Hypothese der höheren Ausgangsaktivation auf und läßt eine dynamische Konzeption plausibler erscheinen. Der entscheidende Unterschied in ShattuckHufnagels (1982c) Experimenten besteht in der Verwendung der Syntax. Sobald Wörter in einen syntaktischen Rahmen eingebettet sind, wird der Initialitätseffekt sichtbar. Es scheint, als ob die Hyperaktivation im Anlaut syntaktisch determiniert ist. Was könnte der Zweck eines solchen Prinzips sein? Die Aufgabe der Syntax ist es, isoliert abgespeicherte Wörter in einen größeren Zusammenhang einzubinden. Es ist insofern nicht abwegig, die Initialaktivierung als einen Mechanismus zu verstehen, der die für ein syntaktisches Muster geplanten lexikalischen Elemente markiert. Sie wäre demzufolge so etwas wie eine Orientierungshilfe für die Syntax. Denn es muß ja für jede Äußerung eine spezielle Aktivationskonstellation entstehen, und dazu ist ein Abgrenzen des gewünschten von ungewünschtem Material erforderlich. Die Hypothese würde also lauten, daß die Syntax mit der Initialaktivation einen gewissen zeitlich begrenzten Zusammenhalt zwischen diversen Wörtern verwirklicht und auf diese Weise das Auffinden des gewünschten Materials erleichtert. Nichts zwingt zu der Annahme, daß die Hyperaktivation in der Initialposition nur eine einzige Funktion erfüllen kann. In Kap. 16.2.4. wurde die Hypothese aufgestellt, daß der Anlaut besonders markiert sein muß, damit die lineare Kodierung der Reihenfolgeinformation funktioniert. Hier ist eine naheliegende Möglichkeit, wie ausgeführt wurde, der Weg über die vermehrte Aktivation.
173
Im vorangegangenen Kapitel wurde gezeigt, daß intraverbale Versprecher in Wirklichkeit häufiger als interverbale sind. Aus dem empirischen Teil ist daran zu erinnern, daß die Asymmetrie zwischen Antizipationen und Perseverationen besonders deutlich in der Initialposition ausgeprägt ist. Die sich anbietende Schlußfolgerung ist die, daß die Hyperaktivation im intraverbalen Bereich offenbar noch ausgeprägter ist als im interverbalen. Dies ist aufgrund der eben aufgestellten Hypothese auch nicht anders zu erwarten. Wenn nämlich der Grad der Aktivation als Ausdruck einer psycholinguistischen Kohärenz gewertet werden kann, ist es nur folgerichtig, daß diese bei intraverbalen Sprachmustern stärker ist als bei interverbalen. Dies wird bei der Kontrastierung von Beispielen wie Pelzmütze versus Pelz, Mütze und Handschuhe schnell erkennbar. Insofern läßt sich die Behauptung aufstellen, daß die linguistische Kohärenz psycholinguistisch in Form von speziellen Aktivationskonstellationen zwischen den betreffenden Einheiten kodiert ist. Um die besonders hohe Anzahl an Antizipationen im Vergleich zu den Perseverationen im intraverbalen Bereich zu erklären, ist es ausreichend, die Anfangsposition des zweiten Bestandteils des Lexemkomplexes gegenüber dem ersten zu begünstigen. Dadurch werden automatisch Vorwirkungen wahrscheinlicher und Nachwirkungen unwahrscheinlicher. Dieses spezifische Ungleichgewicht auf dem intraverbalen Sektor ist auf dem interverbalen so nicht vorhanden. Dies könnte damit zusammenhängen, daß die Reihenfolge von Lexemen in Lexemkomplexen fast ausnahmslos festgeschrieben ist. Potentielle Synonyme wie houseboat versus boathouse sind eine Rarität. Die Position von Wörtern in einem Satz ist hingegen kaum von vornherein festgelegt. Dadurch sind alle Elemente gleichwertiger und erhalten auch dasselbe Maß an Hyperaktivation im Anlaut. Exakt auf dieselbe Art und Weise läßt sich die vollständige Asymmetrie im intramorphemischen Bereich erklären. Hier ist die Abfolge der Phoneme gänzlich festgelegt. Das bedeutet, daß die medialen Elemente besonders stark an das Initialsegment gebunden sind. Die psycholinguistische Kodierung dieser Bindung erfolgt wie gesagt über die Aktivationspegel: Diejenigen der medialen Elemente sind im Vergleich zu demjenigen des initialen so stark erhöht, daß Perseverationen nahezu unmöglich werden. Schließlich soll einem möglichen Einwand begegnet werden. Wenn die Initialsegmente prinzipiell höher aktiviert sind als alle anderen, weshalb verdrängen sie dann nicht alle anderen, anstatt sich selbst von anderen Initiallauten verdrängen zu lassen? Die Antwort auf diese Frage ergibt sich daraus, daß die Positionskonstanz ein äußerst wichtiger Faktor bei der Beeinflussung der Aktivationsverhältnisse ist, wie im letzten Kapitel gezeigt wurde. Das bedeutet, daß bei der Verarbeitung einer nicht-initialen Position die Initiallaute nicht als ernsthafte Konkurrenten in Betracht kommen, da sie selbst nur schwach aktiviert sind. Daran kann auch ihr Sonderstatus nichts ändern. Die Rolle der Positionen im Aktivationsprozeß wird im nächsten Kapitel näher beleuchtet.
16.10.
Zur Anzahl der erforderlichen Aktivationsmuster pro Äußerung
Inzwischen sind eine Reihe aktivationsbeeinflussender Faktoren bekannt. Es ist jetzt an
174 der Zeit zu explizieren, was bisher immer implizit behandelt wurde, nämlich inwieweit ihre Wirkungsweise positionsabhängig ist. Es sollen dazu die Bedingungen der Besetzung zweier verschiedener Phonempositionen systematisch miteinander verglichen werden. Als Ausgangspunkt dient das Beispiel (153). (153)
teep
a cape, statt: keep a tape. (Fromkin 1973b)
Es geht also um die Frage, wie die Aktivationsverhältnisse in den beiden aufzufüllenden Anlautpositionen aussehen. Um das gewünschte /k/ in keep zu generieren, durchläuft die Aktivation das Netzwerk, ausschnittsweise wie folgt dargestellt. Links der gestrichelten Linie befindet sich das intendierte und rechts davon das durch Feedback sekundär mitaktivierte Material. Abbildung 18: Aktivationsfluß bei der Auffüllung der /k/-Position keep
velar
Verschluß stimmlos
Für die zweite Position stellt sich das Bild wie folgt dar: Abbildung 19: Aktivationsfluß bei der Auffüllung der /tAPosition tape
Lick
alveo
Die erste Feststellung ist scheinbar banal: Mit der Unterschiedlichkeit der intendierten Segmente ändern sich auch die Aktivationsverhältnisse im Netzwerk. Dies gilt nicht nur aufgrund der phonologischen Ähnlichkeit, sondern auch beispielsweise aufgrund der Lexikalität. Bei der Auffüllung der ersten Position ist das intendierte /k/ von dieser Warte aus gesehen durch das gleichzeitig geplante /t/ aus tape weniger gefährdet, weil teep kein Bestandteil des Lexikons ist. Anders dagegen in der zweiten Position. Hier würde eine Verdrängung zu der lexikalisierten Sequenz cape führen. Das bedeutet, daß die Konkurrenz durch ein und denselben Effekt an beiden Positionen unterschiedlich groß ist. Daraus ist die Schlußfolgerung zu ziehen, daß sich die Aktivationsverhältnisse von Position zu Position mehr oder weniger radikal ändern. Es ist insofern nicht möglich, einen Satz mit einem Aktivationsmuster hervorzubringen. Zumindest für jede Phonemposition scheint ein eigenes Muster erforderlich zu sein.
175
Gilt dies nun auch für die Wörter oder die distinktiven Merkmale? Wenn man an die Vergleichbarkeit der Verarbeitungsbedingungen auf der verbalen und der phonemischen Ebene denkt, ist die Frage für die Wörter eindeutig positiv zu beantworten. Im subphonemischen Bereich sieht es jedoch anders aus. Da die Merkmale eines Phonems in dem vorgelegten Netzwerkmodell gleichzeitig abgerufen werden, sind individuelle, zeitlich trennbare Aktivationszustände für sie nicht möglich. Die Aktivierung eines Phonems, wofür sie ja ausschließlich verantwortlich sind, kann nicht in Phasen zerlegt werden. Dies bestätigt erneut die Sonderstellung der distinktiven Merkmale. Das Ergebnis lautet daher, daß zur Produktion einer Äußerung so viele aktivationale Zustände erforderlich sind, wie es Phoneme als kleinste primäre Einheiten im Produktionssystem gibt. Wenn nun aber jedes Segment auf eine andere Aktivationskonstellation zurückgeht, fragt sich, wie dann noch Garretts (1975) Prinzip der verarbeitungsmäßigen Gleichzeitigkeit Genüge getan werden kann. Diesem zentralen Problem wird im nächsten Kapitelkomplex nachgegangen.
16.11.
Das Aktivationsmodell im Kontrast zu herkömmlichen Theorien
Abschließend soll auf einige Punkte eingegangen werden, für die sich in einem Aktivationsflußmodell gänzlich andere Perspektiven als in herkömmlichen Theorien ergeben. Dies betrifft zum einen den Fall, daß sich schwerwiegende Probeme in Nichts auflösen können und zum anderen die Tatsache, daß ein und dasselbe Resultat zu völlig entgegengesetzten Interpretationen Anlaß geben kann. Es geht dabei weniger um eine erschöpfende Kontrastierung beider Modellbereiche; die angeführten Fälle haben daher nur exemplarischen Charakter. Wie bereits erwähnt, hatten Motley & Baars den Lexikalitätseffekt experimentell nachgewiesen (Baars et al. 1975). Ihre Erklärung bestand darin, einen Kontrollmechanismus zu postulieren, der lexikalisierte Sequenzen passieren läßt und nicht-lexikalisierte zurückweist. Als Beispiel möge die zu produzierende Sequenz det wuck dienen. Durch eine spezielle Technik erwartet die Versuchsperson eine Sequenz mit einer Anlautkonsonanz in umgekehrter Reihenfolge, also w.. d... Bekanntlich ist die Wahrscheinlichkeit der Phonemvertauschung von dem Status der Lexikalität abhängig, im vorliegenden Fall tritt daher eine vermehrte Produktion von wet duck ein. Die entscheidende Frage ist nun aber, wie der Kontrollmechanismus zu der Information über den lexikalischen Status der Phonemsequenz gelangt. Baars (1980) und Motley & Baars (1975b: 19) sehen nur die Möglichkeit des Ausprobierens, d.h., jede zu produzierende Zielsequenz (wie det wuck) wird automatisch in wet duck rekodiert und dann auf ihre Lexikalität hin überprüft. Immerhin ist nicht zu verkennen, daß die Kontrollinstanz eine fundierte Entscheidung trifft, also alternative Möglichkeiten auf irgendeine Art und Weise mitbedacht worden sind. Es muß jedoch gefragt werden, was ein solcher Ausprobiermechanismus für Auswirkungen hätte. Motley & Baars (1975b) sehen einen Konflikt an einer einzigen Position zwischen nur zwei Alternativen. In der gesprochenen Sprache ist, wie die Verschiedenartigkeit der Ver-
176
Sprecher demonstriert, eine Konkurrenzsituation jedoch ein allgegenwärtiges Phänomen. In letzter Konsequenz konkurriert jeder mit jedem um jede Position. Würde versucht werden, diesem Problem durch Ausprobieren Herr zu werden, dürfte es eine Ewigkeit dauern, bis die richtige Lösung gefunden ist. Das ganze Sprachproduktionssystem würde dadurch lahmgelegt werden. Die Problematik des Motley & Baarsschen Ansatzes liegt also in unhaltbaren Prämissen zu den Konkurrenzbedingungen im Verarbeitungssystem. Ganz anders sieht die Situation jedoch in einem Aktivationsmodell aus. Hier hat jedes Segment in jeder Position automatisch einen bestimmten aktivationellen Wert, der u.a. auch von der Information der nächsthöheren Ebene determiniert wird. Dies verleiht den Phonemen, die zu Lexikalisierungen beitragen, gegenüber den anderen einen gewissen Vorsprung. Eine separate kognitive Operation des Durchspielens diverser Alternativen wird in einer aktivationellen Konzeption hinfällig, weil alle Elemente gleichzeitig, wenn auch unterschiedlich stark aktiviert sind und diese Aktivationspegel die Verarbeitung bestimmen.82 Diese Eigenschaft führt direkt zum zweiten Punkt. Butterworth (1981:656) argumentiert in bezug auf die Form der Kontrollstruktur im Produktionssystem, daß eine Interaktion zwischen dem prosodischen, lexikalischen und syntaktischen Subsystem deshalb nicht möglich ist, weil sonst eine erheblich höhere Anzahl von Versprechertypen generiert werden würde, als in der Realität vorzufinden ist. Ein Fehler in einem Subsystem würde Störungen in anderen Systemen auslösen, so daß es zu einer Ausuferung von Fehlrepräsentationen käme. Die Folge wäre, daß »unkontaminierte« Versprecher kaum auftreten könnten. Wenn man einmal davon absieht, daß dieses Resultat gar nicht so unerwünscht wäre, ist zu bedenken, daß Butterworth (1981) eine einseitige Konzeption der Interaktivität zugrunde legt. Sie kann bei ihm nur zu einer Potenzierung von Störfällen führen. In einem Aktivationsmodell ist aber genau der gegenteilige Effekt zu erwarten. Durch die Interaktivität wird ein Aktivationspegel gerade dann gesenkt (oder besser: gar nicht erst ein gewisses Niveau erreichen), wenn die Reaktion in einem anderen Subsystem negativ ausfallt. Auf diese Weise werden Fehler eher vermieden als begünstigt. Dies ist eine natürliche Folge in einem Aktivationsmodell, welches die gleichzeitige Aktivierung verschiedener Knoten erlaubt, ohne daß alle automatisch die Produktionsschwelle erreichen müssen. Butterworths Ausuferungsproblem stellt sich im Aktivationsmodell also ebensowenig wie Motley & Baars' Ausprobiermechanismus. Was Butterworth (1981) als Argument gegen die Interaktivität wertet, läßt sich im vorliegenden konzeptuellen Rahmen sogar in ein Argument dafür umwandeln. Das folgende Beispiel macht auch die Bandbreite der interpretativen Möglichkeiten deutlich. Es geht dabei um die Rolle der Inhibition, dem Gegenstück zur Aktivation. MacKay (1970a) sieht dieses Konzept dort gegeben, wo sich gegenseitig ausschließende motorische Programme involviert sind. Da seine Analysen klar gezeigt haben, daß der 82 Diese Tatsache ermöglicht prinzipiell auch die gleichzeitige Aktivität von Knoten aus sehr unterschiedlichen Quellen, z.B. aus dem sprachlichen System selbst und aus der visuellen Verarbeitung der Umwelt. Vor diesem Hintergrund wird es dann überflüssig, für verschiedene Quellen unterschiedliche Verarbeitungsmechanismen zu postulieren, wie Harley (1983) es tut.
177
Artikulationsort besonders häufig affiziert ist, setzt er in diesem Parameter eine inhibitorische Beziehung an, so z.B. zwischen /b/ und /g/. Laut dieser Hypothese ist eine Substitution dieser beiden Phoneme Ausdruck einer Beeinträchtigung der inhibitorischen Verhältnisse. Man mache sich MacKays Gedankengang deutlich: Er definiert einen negativen Mechanismus aufgrund seines Versagens. Anstatt zu sagen, daß eine Bremse vorhanden sein muß, weil ein Auto auch schnell fahren kann, erscheint es plausibler, dieses Faktum gerade als Evidenz gegen die Existenz einer Bremse zu werten. Neben diesem theoretischen Argument läßt sich aber auch die empirische Unzulänglichkeit dieser Hypothese demonstrieren. Bekanntlich sind /b/—/p/ Interaktionen besonders selten. MacKay (1970a) zufolge dürfte in diesem Fall nur eine geringe Inhibition vorliegen. Beide Phoneme lösen aber konträre motorische Programme aus, so daß MacKay auch hier nicht auf Inhibition verzichten würde. Unklar bleibt dann aber, warum die Inhibition im einen Fall zu einer hohen Interaktionsrate und im anderen zu einer niedrigen führt. Dieser Lösungsvorschlag ist daher abzulehnen. Sinnvoller erscheint der Weg, die Inhibition dort zu postulieren, wo die Interaktionsrate niedrig ist. Diese Rechtfertigung der Inhibition wäre dann ex positivo aufgrund ihrer Wirksamkeit. Damit wird es auch nicht mehr erforderlich, eine ebenso starke inhibitorische Beziehung zwischen /b/ und /g/ anzunehmen; ihre häufige Interaktion kann nun viel besser als Ausdruck einer ungenügenden Inhibition gewertet werden.
16.12.
Zwischenzusammenfassung und Schlußfolgerungen
Die Aktivierung eines Knotenpunkts ist im wesentlichen von zwei Faktoren abhängig: dem ideationellen Output und den systeminternen Verarbeitungsbedingungen. Versprecher sagen über den ersten vergleichsweise wenig aus, so daß sich die Analyse vornehmlich auf den zweiten konzentrieren muß. Dafür sind hier recht weitgehende Aussagen über das Netzwerk möglich. Je weiter man sich im Sprachverarbeitungssystem von der Semantik entfernt, desto expliziter lassen sich seine Eigenschaften beschreiben und erklären und sein Verhalten prognostizieren. Die Aktivationsniveaus auf der phonemischen Ebene werden von einer Vielzahl von Faktoren additiv83 beeinflußt. Es ergibt sich aus der Struktur des Netzwerks und der Art des Informationsflusses, daß bei der Aktivierung einer gewünschten Einheit das ganze System an ihrer Produktion beteiligt ist». Diese Behauptung erklärt ansatzweise, weshalb eine pathologische Störung selten Einzelwörter befällt, Verhalten also nicht »herausschneidbar« ist84 (Lenneberg 1967). Die Gefahr der Interferenz bei gleichzeitiger Aktivität
83 Additiv ist hier nicht unbedingt im engen mathematischen Sinne zu verstehen. Es ist auch denkbar, daß das Zusammenwirken zweier Faktoren komplexer ist, als daß es mit einer einfachen Addition zu berechnen wäre. 84 Nur angedeutet werden kann hier die Frage, inwieweit von einer psycholinguistischen auf eine neurologische Non-Lokalität geschlossen werden darf. Eine perspektivenreiche Alternative legt Hinton (1981) zu der traditionellen Meinung vor, daß ein Knotenpunkt einer Hardware-Einheit (z.B. ein Neuron) entspricht. Er
178
der Knotenpunkte ist gering. Da die Produktion einer Größeneinheit erst beim Erreichen einer Schwelle gewährleistet ist, spielt es keine Rolle, wie stark die anderen mitaktiviert werden, solange sie unterhalb dieser Schwelle bleiben. Es hat sich gezeigt, daß die Bedingungen für eine Produktion noch enger umrissen werden müssen. Es muß nicht nur ein gewisses Aktivationsniveau erreicht sein, sondern es darfauch ein bestimmtes Maß nicht überschritten werden. Maximale Hyperaktivation wie Partialaktivation können also gleichermaßen zum Ausbleiben der Produktion führen. Die Regelmäßigkeit in den empirischen Daten macht es möglich, für einige Segmentpositionen bei einigen vorgegebenen sprachlichen Konstellationen allgemeine Aktivationszustände zu ermitteln. Diese können als abstrahierende, statische Abbildungen immer nur übergebührlich vereinfachen. Nichtsdestotrotz werden auf diese Weise Tendenzen sichtbar. Zwei Beispiele mögen zur Veranschaulichung ausreichen. Das erste betrifft die Tatsache, daß intramorphemische Versprecher im großen und ganzen Ausnahmeerscheinungen sind. Das bedeutet, daß bei der Auffüllung jeder beliebigen Position in einem Wort die Elemente aus Nachbarwörtern eine größere Konkurrenz darstellen als diejenigen aus demselben Wort. Schematisch läßt sich das wie folgt darstellen. Als aktuelle Verarbeitungsposition wird der mit einem Pfeil markierte Anlaut zugrunde gelegt. Die Wörter bestehen aus den drei unspezifizierten Phonemen , und Z. Abbildung 20: Aktivationsverhältnisee in einem Satz mit drei monoleiemischen Wörtern l
X2 Aktivationsgrad Y,
Y2
Y3 Z3
l Wort 2 |
| Wort 3 |
Das zweite Beispiel macht den Einfluß der sprachlichen Struktur noch deutlicher. Es ist bekannt, daß intraverbale Versprecher am häufigsten sind, d.h., sobald ein Lexemkomplex in einem Satz auftaucht, kommen Versprecher, falls sie auftreten, nur schwerlich an ihm vorbei. Dies läßt sich folgendermaßen veranschaulichen: Abbildung 21: Aktivationsverhältnisse in einem Satz mit einem Lexemkomplex
4· X
2A V2B
X3
Aktivationsgrad
Wort 11 | Lexem A Lexem B | | Wort 3 | Wort 2 schlägt stattdessen vor, Knoten durch unterschiedliche Aktivationskonstellationen in ein und derselben Neuronenpopulation zu repräsentieren. Damit entspräche ein Knoten nicht mehr einem einzigen Neuron, sondern einer bestimmten »Schaltung« zwischen einer Vielzahl von Neuronen.
179
Diese Schemata, so idealisiert sie auch sein mögen, lassen erkennen, wie die Aktivationskonstellation im Normalfall unter den gegebenen sprachlichen und sprachproduktionellen Bedingungen aussieht. Spätestens an diesem Punkt nimmt die Versprecherforschung eine prognostische Dimension an. Verhalten vorhersagbar zu machen, ist nach Wells (1951) das höchste Ziel wissenschaftlicher Betätigung. Es kann kein Zweifel daran bestehen, daß Vorhersagen immer nur probabilistischer Natur sein können. Dies gilt sowohl für den Fall, daß Versprecher überhaupt auftreten als auch dafür, welche Form sie annehmen. Während zu der ersten Frage die Ergebnisse noch spärlich sind, kann in bezug auf die zweite nun auf einige Erkenntnisse verwiesen werden.
180
17.
17.1.
Versprecherlokalisation und Stufigkeit
Verarbeitungsebene versus Verarbeitungsstufe
Auf den vorangegangenen Seiten war immer wieder von Verarbeitungsebenen die Rede, die danach definiert wurden, welche sprachliche Information für die Produktion psycholinguistisch relevant ist. So konnte eine syntaktische, eine morphologische, eine phonemische und eine subphonemische Komponente isoliert werden, nicht jedoch ein Clusterlexikon. Daneben wurde auch Garretts Sprachproduktionsmodell vorgestellt, das sich durch zwei bzw. drei Verarbeitungsstufen auszeichnet. Damit wird eine konzeptuelle Trennung deutlich, die bisher kommentarlos vorgenommen wurde: die Unterscheidung von Verarbeitungsebenen und -stufen. Während unter Ebene das zu verstehen ist, was an sprachlichem Material organisiert bereitsteht, kennzeichnet Stufe die Prozesse, wie mit dieser Information zum Zwecke der Produktion umgegangen wird. Das Verhältnis zwischen Stufe und Ebene ist recht komplex und stellt sich in den bereits vorliegenden Modellen recht unterschiedlich dar. Dies hängt auch damit zusammen, daß beide Aspekte bis zu einem gewissen Grad logisch voneinander unabhängig sind. So ist bei Garrett der Verzicht auf eine 1:1 Entsprechung sichtbar, die positionelle Stufe umfaßt z.B. zwei Ebenen. Dell (1986) stellt dieses 1:1 Verhältnis wieder her, indem er die positioneile Stufe in eine morphologische und eine phonologische aufspaltet. Stemberger (1985a) und Keller (1980) unterscheiden zwischen einer Planungs- und einer Exekutionsstufe, denen jeweils sehr spezielle Verarbeitungskompetenzen zugeschrieben werden. Anhaltspunkt ist dabei die Frage der Fehlerlokalisation. Für den Bereich der Verarbeitungsebenen ist dieses Problem vergleichsweise gering. Ein Phonemversprecher ist immer auf der phonemischen Ebene zu lokalisieren, ein Clusterfehler — zumindest in dem hier vorgeschlagenen Modell — als Produkt der Interaktion der morphemischen und der phonemischen Ebene zu sehen usw. Die Versprecherlokalisation im Bereich der Verarbeitungsstufen ist dagegen schwieriger, weil über ihre Anzahl und ihre psycholinguistische Funktion a priori nur wenig Gesichertes vorausgesetzt werden kann. Die Lokalisation wird damit zu einem methodischen Entdeckungsprinzip, mit dem sich herausfinden läßt, was mit der sprachlichen Information gemacht wird. Wenn sich also beispielsweise keine Versprecher finden lassen, die einer bestimmten Stufe mit den und den Eigenschaften zuzuweisen sind, wird dies als Evidenz gegen die Existenz einer solchen Stufe betrachtet. Als Einstieg in die Problematik sollen zwei Planungs/Exekutionsmodelle vorgestellt und kritisch unter die Lupe genommen werden.
181
17.2.
Kritische Diskussion zweier
Planungs-/Exekutionsmodelle
Es geht im folgenden zunächst weniger um eine allgemeine Motivierung der Trennung in eine Planungs- und eine Exekutionsstufe. Vielmehr soll jetzt gefragt werden, wie diese Aspekte funktionell definiert und welche Versprechertypen auf welcher Stufe zu lokalisieren sind. Das erste relevante Modell stammt von Keller (1980). Er gründet seine Annahme einer Zweistufigkeit in der Hauptsache auf die Notwendigkeit der Trennung zweier zeitlicher Rahmenbedingungen. Während bei der Exekution artikulatorische Beschränkungen (z.B. die Beweglichkeit der Sprechorgane) beachtet werden müssen, kann die Planung erheblich schneller vonstatten gehen. Es ist zu erkennen, daß Keller (1980) Exekution weitgehend mit Artikulation gleichsetzt. Von besonderer Relevanz ist nun, wie der Autor die beiden Stufen zu speziellen Versprecherklassen in Beziehung setzt. Die überwiegende Zahl der Fehlleistungen treten ihm zufolge in der Planungsphase auf. Dazu zählen alle Selektions- und Sequenzierungsfehler. Die Exekution hingegen ist nach Keller für das Phänomen der Akkommodation verantwortlich. Es handelt sich hierbei um einen subsidiären Prozeß, bei dem der Fehler eine weitere Veränderung, sprich eine Anpassung an die neue Situation nach sich zieht. Dazu empfiehlt sich ein Blick auf (154). (154)
a meeting
arathon. statt: an eating marathon. (Fromkin 1973b)
Durch die antizipatorische Verschiebung des /m/ ändert sich der phonologische Kontext, von dem die Wahl des entsprechenden Allomorphs abhängig ist. In allen Beispielen, die bei Fromkin (1973b) verzeichnet sind, wird die sprachlich »richtige« Form produziert. Fromkin (1971) neigt im Rahmen ihres seriellen Modells dazu, den Akkommodationsprozeß als dem eigentlichen Fehlerprozeß temporal nachgeordnet zu sehen, schließt aber auch nicht die Möglichkeit aus, daß beide Vorgänge parallel ablaufen könnten (z.B. Fromkin 1973a:27). In ihrer Nachfolge ist diese Position von vielen Rezipienten ungebührend eingeengt worden (z. B. Saffran, Schwartz & Marin 1980). Auch Keller läßt nur das zeitliche Nacheinander zu. Dies ist auch wenig überraschend, denn es ist die notwendige Voraussetzung für die unterschiedliche Stufenzuweisung, die er vornimmt. Immerhin können zwei gleichzeitige Prozesse schwerlich auf unterschiedlichen Stufen lokalisiert werden, die in einem weitgehend seriellen Verhältnis zueinander stehen.85 Damit offenbart sich bereits ein Kernproblem des Kellerschen Modells. Es funktioniert nur, wenn eine zeitliche Trennung zwischen Fehlerauftritt und Akkommodation vorausgesetzt wird. Es besteht jedoch kein Grund, weshalb in einem grundsätzlich parallelen Modell, wie es hier vorgeschlagen wird, diese beiden Prozesse nicht auch parallel ablaufen können. Diese Meinung vertritt auch Stemberger (1983b). Er kann zeigen, daß die Akkommodation nicht mit absoluter Zuverlässigkeit erfolgt, sondern in seltenen Fällen auch ausbleibt, wie in (155).
85 Keller (1980:38) bezeichnet die Verarbeitung auf beiden Stufen als parallel, meint damit aber jeweils unterschiedliches sprachliches Material (cf. Kap. 7).
182
(155)
Fat impotes [impautiz]— imposes its own strain. (Stemberger 1983b)
Die Existenz solcher Ausnahmen gestattet Rückschlüsse in bezug auf die Art des Informationsflusses. Wenn die Akkommodation erst einsetzt, nachdem über Qualität und Reihenfolge des geplanten Materials endgültig entschieden ist, besteht kein Grund, nicht zu akkommodieren. D.h., Fälle wie (155) dürften nicht auftreten. Legt man hingegen eine parallele Informationsverarbeitung zugrunde, besteht die Möglichkeit, daß die Abstimmung zwischen gleichzeitig präsenten Einheiten nicht glückt. Dies sollte allerdings in einem interaktiven Aktivationssystem die Ausnahme sein (Berg 1987a). Es besteht daher keine Veranlassung, Fehler und Akkommodationsprozesse in der zeitlichen Dimension zu entzerren, wie Keller (1980) es tut. Die von ihm vorgenommene empirische Ausgestaltung der Exekutionsstufe erweist sich deshalb als nicht tragfähig. Auf weitere Probleme seines Modells soll hier nicht näher eingegangen werden (cf. Berg 1985b). Es ist zu beachten, daß sich die Argumentation hier nicht generell gegen die Zweistufigkeit richtet, sondern gegen die spezielle Ausprägung, die diese Dichotomic durch Keller erfahren hat. Auch in Stembergers (1985a) Sprachproduktionsmodell ist die Planungs/Exekutionsunterscheidung von zentraler Bedeutung. Er füllt sie jedoch inhaltlich völlig anders auf als Keller (1980). Sein Ausgangspunkt ist eine theoretisch begründete Trennung in Selektion und Linearisierung; von daher erfolgt eine Versprecherkategorisierung in Selektions-, Sequenzierungs- und sequentiellen Selektionsfehlern.86 Zu den Selektionsfehlern rechnet der Autor paradigmatische Wortsubstitutionen und Überblendungen, zu den sequentiellen Selektionsfehlern zählen solche, die auf sprachlich-syntagmatische oder außersprachliche Einflüsse zurückzuführen sind. Diese beiden Typen sind für ihn Planungsfehler. Nur echte Sequenzierungsfehler treten ihm zufolge auf der Exekutionsstufe auf. Dazu gehört eine spezielle Untergruppe der Permutationen und vor allen Dingen die Mehrzahl der Verschiebungen. Stemberger gründet diesen Versuch der unterschiedlichen Fehlerlokalisation neben theoretischen Erwägungen vornehmlich auf spezifische empirische Eigenschaften der von ihm definierten Versprecherklassen. Ihre Unterschiedlichkeit wird somit zum Argument für ihre unterschiedliche Genese. Es folgt ein näherer Blick auf die Versprechertypen, die Stemberger der Exekutionsstufe zuweist. Der Autor identifiziert (156) als einen Planungs-, (157) jedoch als einen Exekutionsfehler. (156)
Die Maschine muß unbedingt aus der Wäsche, statt: Die Wäsche muß unbedingt aus der Maschine. (157) We could each take a check of packs, statt: a pack of checks. (Stemberger 1985a) Es lassen sich in Stembergers Arbeit drei Gründe für eine unterschiedliche Stufenzuweisung in (156) und (157) erkennen. Keiner von ihnen beinhaltet eine klare entweder/oder Entscheidung, sondern gibt nur eine Tendenz an. Der erste ist der aus den Beispielen am 86 Eine recht ähnliche Unterscheidung, allerdings ohne die sequenziellen Selektionsfehler, nimmt Bierwisch (1975) vor.
183
deutlichsten ersichtliche. Exekutionsfehler finden nur zwischen mehr oder weniger direkt benachbarten Elementen statt; Planungsfehler dagegen erlauben ein höheres Maß an Zwischenmaterial. Dieses Kriterium kann jedoch nicht als Argument angeführt werden. Der Abstand zwischen den interagierenden Elementen ist völlig zufällig, bedingt nur durch die Sprecherintention. Mehr noch, er ist für den Versprecherprozeß relativ irrelevant, solange es zwei gleichermaßen spezifizierte syntaktische Positionen gibt. (156) und (157) liegen daher gänzlich parallele Generierungsmechanismen zugrunde. Die beiden anderen Gründe sind noch schwerer nachzuvollziehen. Zum einen sollten sich laut Stemberger Exekutionsfehler nicht von der syntaktischen Kategorie anfechten lassen. Die Wortklassenrespektierung ist aber gerade ein herausragendes Merkmal fast aller Wortpermutationen. Zum anderen stellt der Autor fest, daß suffigales Material bei Selektionsfehlern zurückgelassen wird. Per Implikation sollte das bei Exekutionsfehlern nicht der Fall sein. Ob die »Strandung« erfolgt, ist jedoch primär von der Art der flektionalen oder derivationalen Suffigierung abhängig, wie Stemberger (1985a) selbst gezeigt hat. Es besteht daher kein Grund, eine solche Variabilität in den Bereich der Versprechergenese hineinzutragen. Für eine lokalisationelle Trennung, die mitten durch die Kategorie der Permutationen verläuft, besteht also keine Veranlassung. Inwieweit Stembergers zweite Gruppe, die Verschiebungen, aus dem Rahmen der sonstigen Versprecherklassen herausfällt, ist eine Frage, die nur durch die Motivationsanalyse beantwortet werden kann. Diese ist insbesondere vor diesem theoretischen Hintergrund in Kap. 10.3. durchgeführt worden. Das Ergebnis war eindeutig. Verschiebungen sind maximal durch die sprachlichen Bedingungen im Kontrast zu den Permutationen (und somit auch zu anderen explikativen Kategorien) motiviert. Ihr auffälligstes Charakteristikum, die Mitnahme der Satzbetonung, wurde als Folge der Involvierung wortklassenmäßig unterschiedlich spezifizierter Elemente erklärt. Die Schlußfolgerung lautet, daß an den Verschiebungen psycholinguistisch gesehen nichts Ungewöhnliches ist; eine Ausgliederung aus der Gemeinschaft der übrigen Versprechertypen erscheint daher nicht gerechtfertigt. Dazu kommt, daß viele »gewöhnliche« Eigenschaften einen solchen Schritt gar nicht erlauben würden. Dies bedeutet, daß Stembergers Zweiteilung in eine Planungs- und eine Exekutionsphase aus empirischen Gründen nicht haltbar ist. Wiederum gilt dasselbe wie bei Keller (1980): Die Problematik liegt mehr in der spezifischen Interpretation dieser Dichotomic als in ihr selbst.
17.3.
Die Notwendigkeit der Unterscheidung in eine Planungs- und eine Exekutionsstufe
Nachdem sich zwei Konzeptionen der Planungs/Exekutionsdistinktion als nicht tragfahig erwiesen haben, ist es an der Zeit, diese Unterscheidung auf ihre Brauchbarkeit schlechthin abzuklopfen. Theoretisch gibt es zwei Möglichkeiten: Entweder die aufgezeigten Schwächen deuten auf eine prinzipielle Untauglichkeit hin, oder sie sind nur modellspezi-
184
fischer Art und stellen damit die Unterscheidung als solche nicht in Frage. Welche Alternative die richtige ist, hängt davon ab, inwieweit die Trennung in zwei Sprachverarbeitungsphasen mehr aus theoretischen als aus empirischen Überlegungen erforderlich wird. Aus empirischer Sicht sprach bisher wenig dafür. Stemberger (1985a) behauptet, daß Selektion und Sequenzierung isolierbare Prozesse der Sprachproduktion darstellen und insofern auch konzeptuell getrennt werden müssen. Diese Erwägung drückt jedoch nur eine theoretische Erwartungshaltung aus, sie ist kein stichhaltiges Argument. Es ist genausogut möglich, daß im selben Moment, wo seligiert wird, bereits sequenziert wird. Kellers (1980) Ansatz ist da schon überzeugender. Neben den unterschiedlichen temporalen Bedingungen weist er auf ein Argument hin, das auf Lashley (1951) zurückgeht87 und auch deswegen als besonders zwingend angesehen werden kann, weil es ein empirisch gestütztes ist. Lashley (1951) machte, wie in Kap. 3 angedeutet wurde, geltend, daß Antizipationen oder Permutationen nur dadurch entstehen können, daß sich vor dem Sprechen das sprachliche Material weiter voraus in »Alarmbereitschaft« befinden muß, als es für die bloße Artikulation nötig wäre. Diese Vorausplanung muß mindestens bis zur Fehlerquelle reichen. Der entscheidende Punkt ist, daß ein einstufiges Modell, bei dem die Aktivierung einer Einheit entweder vollständig oder gar nicht erfolgt ist, dieses Phänomen grundsätzlich nicht erklären kann. Für die Zwischenstufe einer Präaktivation, wie Lashley sie sinngemäß nennt, ist kein Platz. Es wird damit unumgänglich, eine Planungsphase von einer Exekutionsphase zu trennen. Wenn nun die Planungsstufe als ein unverzichtbarer Bestandteil der Sprachproduktion anzusehen ist, stellt sich die Frage ihrer Daseinsberechtigung und damit ihrer Funktion. Weshalb muß man also beim Sprechen planen? Zur Beantwortung dieser Frage empfiehlt sich ein Blick auf die Entwicklung der menschlichen Sprache. Ich folge dabei im Ansatz den Ausführungen Chafes (1970). Es ist weitgehend unbestritten, daß der Anfangspunkt einer phylogenetischen Theorie in Vokalisationen zu sehen ist, welchen in Bühlers Organonmodell ausschließlich Symptomcharakter zufallt. Der Ausdruck emotionaler Botschaften ist heute wie damals eine wichtige Funktion der Sprache. Allmählich wurde Chafe zufolge die außersprachliche Wirklichkeit komplexer, so daß ein Bedürfnis entstand, mehr an Information zu übermitteln, als es mit diesem primitiven Symbolsystem möglich war. Um den höheren Anforderungen zu genügen, mußte eine Methode der Kodierung entwickelt werden, die mit den Gegebenheiten der menschlichen Physiologie und Psychologie im Einklang stand. Da sich mit dem Sprechapparat nur eine begrenzte Anzahl von perzeptuell distinktiven Lauten erzeugen läßt, gab es nur die Möglichkeit, das l: l Verhältnis von Laut und Idee aufzugeben und erstere zum Ausdruck von letzterer zu kombinieren. Mit diesem »Kunstgriff« entstand ein ausreichend großes Potential, das als adäquates Kodierungsmittel fungieren konnte. Die Kombinierbarkeit elementarer
87 Es wäre korrekter zu sagen, daß Lashley (1951) dieses Argument bekannt gemacht hat, es jedoch schon vor ihm vermutlich ohne sein Wissen vorgebracht wurde. So k'ommentiert Meillet (1922) einen Permutationsfehler wie folgt: On voit bien id comment taute la phrase est preparee a tafois et comment, par suite, un fragment peut etre en quelque sorte transpose. (Meillet 1922:98)
185
Spracheinheiten ist so zu einem wesentlichen Charakteristikum menschlicher Sprache geworden. Diese Kombination hat nun psycholinguistisch gesehen eine ganz wichtige Konsequenz: Während in Spezialfällen die Kombinierung in einer quasi-zeitlosen Dimension erfolgt (so bei den distinktiven Merkmalen), muß sie normalerweise als Sequenzierung stattfinden. Dies wird auf der phonemischen Ebene an solchen Beispielen wie engl. [ti:] versus [i:t] deutlich. Was stellt nun die so skizzierte Sprachentwicklung für Anforderungen an den Produktionsmechanismus? Ist für die Generierung einer Interjektion wie oh\ ein zweistufiges Modell erforderlich? Gewiß nicht. Hier braucht nichts geplant zu werden, was nicht auch im selben Moment produziert werden könnte. Wie steht es aber mit der Produktion des deutschen Ausdrucks für Schmerz aua? Hier sind auf der signißant-Ebene bereits zwei linearisierbare Grundbausteine zu identifizieren. Damit es zur konventionellen Bezeichnung der Empfindung kommt, müssen also beide Segmente und ihre Reihenfolge geplant werden, damit die einzige Alternative [a(:)au] verhindert wird. Was bei diesem Beispiel nur in rudimentärer Form erkennbar ist, nimmt bei dem, was wir normalerweise unter Sprache verstehen, erheblich klarere Gestalt an. Auf der Ebene des Satzes oder Teilsatzes, der von vielen Forschern als die grundlegende Plariungseinheit angesehen wird, ist leicht nachzuvollziehen, daß ein solch kompliziertes Gebilde nicht mit Hilfe eines einstufigen Modells zu erzeugen ist. Spätestens an diesem Punkt wird der entscheidende Zusammenhang von psycholinguistischer Stufigkeit und sprachlicher Komplexität sichtbar. Die Planungsphase läßt sich daher als eine sprachproduktionelle Reaktion aufgehobene sprachliche Anforderungen an das Verarbeitungssystem verstehen, Anforderungen, die sich wiederum aus einem erhöhten Kommunikationsanspruch ableiten. Dadurch, daß zur Kodierung der semantischen Information ein sprachlicher Einzelbaustein nicht ausreicht, ist das Produktionssystem also gezwungen, mehrere Bausteine auf einmal zu generieren, ohne daß diese gleichzeitig produziert werden müßten. Damit ist eine planende Verarbeitungsstufe geschaffen.
17.4.
Die Leistungen eines zweistufigen Produktionsmodells
Es ist im Rahmen einer Studie zur Sprachproduktion angemessen, die allgemeinen Möglichkeiten zu skizzieren, die sich für einen Sprecher in einem zweistufigen Modell ergeben. Dazu verlasse ich kurzzeitig das Feld der Versprecher zu einem Zeitpunkt, wo viele Details der Planungs/Exekutionsdistinktion noch gar nicht ausgearbeitet sind. Wie im vorigen Kapitel angesprochen wurde, besteht die Hauptleistung der Planungsstufe darin, komplexes sprachliches Material für die Produktion aufzubereiten. Theoretisch können dadurch alle wesentlichen Entscheidungen im Überblick getroffen werden, bevor der erste Laut exekutiert ist. Dies beinhaltet die Möglichkeit der vollständigen Abstimmung der Einzelbestandteile aufeinander; jedes Element bzw. jede Struktur kann durch die Präsenz aller anderen solange modifiziert werden, bis ein sprachlich einwandfreies Ergebnis erreicht ist. In einem reinen Exekutionsmodell besteht diese Mög-
186
lichkeit natürlich nicht. Daß Einzelentscheidungen oft nur in Hinblick auf den gesamten Planungskomplex zu fällen sind, ist in der Linguistik immer wieder nachgewiesen worden. Eines der einleuchtendsten Beispiele dafür ist die Intonation, die fundiert nur dann generiert werden kann, wenn der Satz in seinen wesentlichen Aspekten als Informationsquelle vorliegt. Eine Vielzahl weiterer Einzelprobleme ist nur im Kontext eines größeren Gebildes zu lösen. Zweifelsohne ist die so umrissene Sprechtätigkeit idealtypisch, da es bisher mehr um das Potential des zweistufigen Modells ging. Die Wirklichkeit ist davon, auch wenn die Intonation in den meisten Fällen richtig generiert wird, natürlich weit entfernt. Die Möglichkeit, die Planung zu vollenden, ehe die Exekution beginnt, ist nämlich kein Zwang bzw. wird von den Sprechern nicht als solcher empfunden. D.h., sie sehen keinen Grund, Planungsaktivitäten einzustellen, nur weil die Artikulation eingesetzt hat. Es wird weitergeplant88, zu Ende geplant oder gar für bestimmte Bereiche erst damit angefangen. Diese Charakterisierung ist erheblich realitätsnäher als die idealtypische. Als primäre Evidenz dafür dienen die nicht syntaktisch determinierten Sprechpausen, die als ein Ausdruck für einen unabgeschlossenen Planungsvorgang angesehen werden können (Butterworth 1980). Sie treten bezeichnenderweise mitten im Satz und nicht nur, wie im Idealfall zu erwarten, an der Satzgrenze auf. Wie stark die Wirklichkeit von diesem Idealfall abweicht, wird besonders an der Transkription spontaner Sprechsprache deutlich.89 Daß kaum eine linguistische Grenze gegen Sprechpausen immun ist, weist darauf hin, daß die Entscheidungsprozesse bis zum letzten Moment hinausgezögert werden können. Wortabbrüche lassen sich auch unter diesem Aspekt betrachten. Im folgenden Beispiel wurde das Wort nicht zu Ende geführt, weil eine Unsicherheit ob des richtigen Fortgangs bestand. (158)
in der Biblio- in der Bibliographie. (Berg 1986a)
Der Abbruch erfolgte genau an der Stelle, wo sich die bereits artikulierte Phonemsequenz in Bibliographie bzw. Bibliothek gabelt. Es läßt sich also feststellen, daß der Sprecher nicht immer mehr plant, als unbedingt nötig ist. Man könnte es das Prinzip des maximalen Hinauszögerns von Entscheidungen auf der Planungsebene nennen. Dieses Prinzip beinhaltet, wie oben angedeutet, jedoch Gefahren. Bei der bereits erfolgten Exekution von unvollständig geplantem Material kann die Situation eintreten, daß die dadurch entstandenen Beschränkungen (z.B. syntaktischer Art) mit den Kollokationsmöglichkeiten des später Geplanten kollidieren. So entstehen Anakoluthe. Wenn ein Sprecher also dieses hohe Risiko der Unvereinbarkeit eingeht, läßt sich vermuten, daß er gute bzw. zwingende Gründe dafür hat. Einer ist offensichtlich: Er gewinnt dadurch Zeit, um eine noch besser durchdachte Entscheidung zu treffen. Ein zweiter Grund läßt sich daraus ableiten, daß Pausen über ein gewisses Maß hinaus im Kommunikationsprozeß als störend empfunden werden bzw. sich für den Sprecher nachteilig auswirken können. Würde er das Planen und Exekutieren strikt nacheinander durchführen, läuft er z.B. Gefahr, das Wort unge88 Für eine experimentelle Bestätigung dieser These, siehe Lindsley (1975). 89 Ein exzellentes Beispiel dafür liefern Maclay & Osgood (1959).
187
wollt an den Hörer abzugeben. Daß die Planung mit in die Exekutionsphase hineingezogen wird, ist demnach eine Folge des zeitlichen Drucks der Kommunikationssituation. Ein weiterer Grund für den Aufschub ergibt sich aus gewissen Verarbeitungsbeschränkungen des Produktionsmechanismus. Manchmal sieht man sich gezwungen, sich so verschachtelt auszudrücken, daß mit der vollständigen Überblicksplanung eines solchen komplexen Satzgefüges das Maß des Möglichen im Bereich der Kurzzeitspeicherung überschritten ist. Man muß daher mit der Artikulation beginnen, ehe die Planung beendet ist und diese dann sukzessiv vervollständigen. Oft genug wird dabei jedoch »zu hoch gepokert«. Am Ende des Satzes angelangt, weiß man nicht mehr, welche Auflagen vom Anfang zu erfüllen sind.90 Vor diesem Hintergrund läßt sich ein guter von einem schlechten Sprecher unterscheiden. Der professionelle scheint sich weniger dadurch auszuzeichnen, daß er die Planungsphase mit großer Schnelligkeit und hoher Effizienz vor Beginn der Artikulation abschließt, sondern in der Lage ist, aus bestimmten Situationen, in die er durch eine unvollständige Planung mehr oder weniger zufällig hineingeraten ist, einen sprachlich glatten Ausweg im Einklang mit seiner Intention zu finden. Noch dazu muß dies so zügig, d.h. parallel zur Exekution erfolgen, daß die Flüssigkeit des Sprechens gewährleistet bleibt. Diese Flexibilität bzw. Anpassungsfähigkeit an einmal Geäußertes, das nicht ungeschehen gemacht werden kann, macht also die Kunst der freien Rede aus.
17.5.
Die Problematik eines Modells ohne die Planungs/Exekutionsdistinktion
Wenn die Planungs/Exekutionsdistinktion eine unverzichtbare Komponente des Sprachproduktionsprozesses ist, müßten diejenigen Theorien, die auf sie nicht zurückgreifen, in gewisser Hinsicht unzulänglich sein. Die Beantwortung der Frage, wo und wie sich diese Unzulänglichkeit manifestiert, soll einen Einblick in die genaue Funktion der beiden Phasen vermitteln. Dazu erfolgt der Rückgriff auf das Aktivationsmodell von Dell (1980, 1986, im Druck), das vollständig auf die Planungs/Exekutionsdistinktion verzichtet. Was ergeben sich nun daraus für Probleme in seiner Theorie? Ein genauer Blick auf die Art des Informationsflusses, die dem Modell zugrunde liegt, kann dazu aufschlußreich sein. Es sei zunächst daraufhingewiesen, daß Dell bezeichnenderweise weder in seiner 1980er noch in seiner 1986er Arbeit den Ausdruck parallel verwendet. Obgleich kein Zweifel daran besteht, daß seine Konzeption von der gleichzeitigen Aktivierung vieler verschiedener Knotenpunkte ausgeht, sind für ihn waagerechte und senkrechte Parallelität keine Eckpfeiler, wie es für das hier entwickelte Modell gilt. Ganz im Gegenteil, durch die Inkorporierung des Garrettschen Ansatzes legen sich Dell & Reich (1981), wie bereits erwähnt, sogar auf eine senkrechte Serialität hinsichtlich der Verarbeitungsstufen fest. Gerade das 1981er Modell macht die Verschmelzung von parallelen und seriellen Aspek90 Mein Eindruck ist, daß diese Gefahr im Deutschen durch die häufige Endstellung des Verbs besonders groß ist.
188
ten deutlich. Daß, wie in Kap. 12 gezeigt wurde, keine klare Trennungslinie zwischen den postulierten Operationsbereichen der beiden Verarbeitungsarten zu ziehen ist, impliziert nun, daß die Haltung der Autoren in bezug auf die Art des Informationsflusses ambivalent sein muß. Dies kommt besonders klar in Dell (1986) zum Ausdruck. Er betont einerseits, daß Repräsentationen auf verschiedenen Ebenen gleichzeitig aufgebaut werden, führt andererseits aber kurz darauf das Konzept des aktuellen Knotenpunkts ein, welches die Idee beinhaltet, daß an einem Punkt gerade Information fließt und an einem anderen nicht. Dadurch werden Momentaufnahmen möglich, wie Dell (1986) sie in seiner 1. Abbildung darstellt. Es muß betont werden, daß sein Aktualitätskonzept in letzter Konsequenz nur in einem seriellen Rahmen Aussagekraft besitzt, da in einem parallelen potentiell alle Knotenpunkte gerade ihre Arbeit verrichten. Dells Ambivalenz weitet sich sogar in echte Widersprüche aus. Während er einerseits bemerkt, daß zu einem bestimmten Zeitpunkt der Verarbeitung noch keine Repräsentation auf der phonologischen Ebene aufgebaut ist, betont er andererseits, daß die phonologische Kodierung gleichzeitig mit der der höheren Ebenen erfolgt. Es ist also zu erkennen, daß — zumindest in diesem Modell — der Verzicht auf die Planungs/Exekutionsunterscheidung mit einer Ungenauigkeit in der Identifikation von paralleler und serieller Informationsverarbeitung einhergeht. Die Schlußfolgerung, die sich daraus ergibt, liegt nahe: Die Planungs- und die Exekutionsphase definieren die Bereiche, innerhalb welcher sich die Lokalisation von parallelen und seriellen Verarbeitungsstrategien vornehmen läßt. Eine derartige Zuweisung fällt nicht schwer, wenn man sich die zentralen Eigenschaften der beiden Phasen vor Augen hält. Die Exekution ist per definitionem ein serieller Vorgang. In Hinblick auf die Ergebnisse des empirischen Teils und der theoretischen Erörterungen des letzten Kapitels ist es naheliegend, die Parallelität der Planungsstufe zuzuweisen. Es gilt nun zu klären, welche Aspekte der Versprecher welcher Verarbeitungsstufe zuzurechnen sind. So kann die Frage der Fehlerlokalisation klarer gestellt und fundierter beantwortet werden.
17.6.
Sind Versprecher Ausdruck einer Störung bei der Sprachplanung?
Viele Psycholinguisten vertreten die Meinung, daß die meisten oder alle Versprecher in der Planungsphase des Sprechens auftreten. Dies gilt nicht nur für Stemberger (1985a) und Keller (1980), die explizit im Rahmen einer Planungs/Exekutionsdistinktion arbeiten, sondern auch z.B. für Garrett (op. cit.), Shattuck-Hufnagel (op. cit.) und Harley (1985), bei denen diese Unterscheidung eine nicht so zentrale Rolle spielt. Besonders die erste Gruppe vertritt die Hypothese, daß die Verarbeitung auf der Planungsstufe parallel erfolgt. Dies hat eine wichtige empirische Konsequenz: Versprechereigenschaften dürfen nur auf parallele Bedingungen zurückzuführen sein, nicht auf serielle. Ehe diese Vorhersage überprüft werden kann, ist es jedoch erforderlich, die Funktionsweise der Planungsstufe kurz zu beleuchten. Bezugspunkt wird dabei meist Stemberger (1985a) sein, da sein Modell in dieser Hinsicht das expliziteste ist.
189
Wie erwähnt zählt Stemberger (1985a) zu denjenigen, die die Verarbeitung auf der Planungsstufe als völlig parallel ansehen. Daneben konzipiert er den Aktivationsprozeß als einen Wettbewerb, bei dem jeder gegen jeden um die »Thronbesetzung« kämpft. Die erfolgreiche Generierung einer Größeneinheit beruht auf der Fähigkeit eines Elements, am meisten Aktivation auf sich zu vereinen, um dadurch alle Kontrahenten zu inhibieren. Dies bedeutet, daß die Planung eines bestimmten Elements nur unter Zurückstellung aller anderen erfolgen kann. Mit anderen Worten heißt das, daß nie zwei Elemente gleichzeitig die »Thronbesteigung« vornehmen können. Dies ist nun aber genau das, was auf der Planungsstufe durch den parallelen Informationsfluß geleistet werden soll. Wenn dies nicht möglich ist, könnte hier nur seriell gearbeitet werden. Es offenbart sich damit ein schwerwiegender Widerspruch in Stembergers (1985a) Modell, der durch die Kombination von Parallelität und kompetitiven Netzwerkaktivationsmodalitäten zustande kommt. Stemberger (1985a) hat dieses Problem selbst gesehen und schlägt vor, es durch zwei Zusatzannahmen zu beseitigen. Dadurch, daß es zum parallelen Informationsfluß keine Alternative gibt, können diese Zusatzannahmen nur darauf hinauslaufen, die gleichzeitige Selektion mehrerer Einheiten zu gewährleisten. Dazu nimmt Stemberger (1985a, b) an, daß ab einem gewissen Aktivationsgrad der Inhibitionsmechanismus nicht mehr greift, so daß Elemente, die diesen Punkt erreicht haben, sich nicht mehr gegenseitig behindern. Die zweite Annahme ist im Prinzip nur eine Explizierung der ersten. Der Autor geht davon aus, daß der Aktivationsschub, der Planungseinheiten in eine inhibitionsfreie Zone befördert, durch eine Assoziation zwischen einem syntaktischen Schlitz und einem lexikalischen Element zustande kommt. Durch ihre unterschiedliche syntaktische Funktion werden demzufolge alle zu planenden Größeneinheiten gegeneinander abgeschirmt, so daß es bei der Verarbeitung des Elements mit der Funktion A und dem mit der Funktion B nicht zu Interferenzen kommt. Es ist zu beachten, daß allein die syntaktische Kategorie die erforderliche Trennschärfe nicht mitbringt, da ohne weiteres zwei Nomina in einen Planungsrahmen fallen können. Vonnöten ist daher eine Art Rollenkodierung. Beide Postulate Stembergers erscheinen im Ansatz brauchbar, sind aber noch nicht ausreichend expliziert. Wenn eine rollenspezifische Abschirmung erfolgt, um Interferenzen zu vermeiden, wie soll es dann noch zu Interaktionen in Versprechern kommen? Ein gewisses Maß an gegenseitiger Behinderung ist also erforderlich. Neben der Rollenkodierung bleibt auch das Verhältnis zwischen Aktivation und Inhibition unklar. Ohne gewisse Zusatzannahmen ist schwer nachzuvollziehen, wie die Aktivation ab einem bestimmten Niveau wirkungslos werden soll. Auch wenn Stembergers Modell den Widerspruch zwischen Parallelität und Konkurrenzverhalten nicht gänzlich beseitigt, liefert es Ansätze zur Problemlösung, die in die richtige Richtung weisen. Unter dem Vorbehalt, daß einige Unklarheiten noch zu beseitigen sind, läßt sich die Stembergersche Planungsstufe also als funktionstüchtig bezeichnen. Somit sind die Voraussetzungen geschaffen, um Stembergers Modell zu testen. Es geht zunächst um folgendes Problem: Wenn Versprecher auf einer parallel arbeitenden Stufe auftreten, müßte die Position des Triggers in Relation zu den anderen Fehlerfunk-
190
tionen weitgehend zufallig sein, solange sie in den Rahmen der geplanten Äußerung hineinfällt. Im speziellen dürften keine frequenziellen Unterschiede bestehen, ob der Trigger zwischen der Quelle und dem Ziel oder am Rande steht. Zur Klärung dieser Frage werden die Ergebnisse aus Tabelle 33 in Tabelle 46 zusammengefaßt. Tabelle 46: Position des Triggers im Verhältnis zu den anderen Fehlerfunktionen links von Quelle/Ziel
Mitte
rechts von Quelle/Ziel
29
11
27
Es ist klar erkennbar, daß eine starke Asymmetrie in der Position des Triggers vorhanden ist. Er bevorzugt einige und meidet andere. Obwohl in der Mitte eine Auftretenswahrscheinlichkeit von 33% zu erwarten wäre, zeigt er sich dort nur halb so häufig (16%). Dieses Resultat ist mit einem parallelen Ansatz schlecht vereinbar. Da in einem solchen Modell alle geplanten Elemente mehr oder weniger gleich stark aktiviert sind, besteht kein Grund, weshalb der Trigger an den Randpositionen mehr Durchschlagskraft haben sollte als in der Mitte. Dieser Punkt ist natürlich nur die Einzelmanifestation eines viel umfassenderen Phänomens. Ganz allgemein läßt es sich mit dem Begriff der Positionalität kennzeichnen. Generell ist eine Positionssensitivität mit einem parallelen Modell ohne spezielle Zusatzannahmen unvereinbar. Nehmen wir als Beispiel das allgegenwärtige Phänomen der Tendenz zur syntagmatischen Nähe. Es kann kein Zweifel daran bestehen, daß in (159) häufiger mit einer Maskierung zu rechnen ist als in (160), da kleiner als y ist. (159)
the flight of the kimbletee /b/
(160)
The book on the green shelf is brown.
Vorausgesetzt, beide Äußerungen werden in einem Zug geplant, besteht in einem parallelen Modell keine natürliche Möglichkeit, die /b/s in (159) stärker zu repräsentieren als in (160), um so ihre erhöhte Interaktionsfreudigkeit zum Ausdruck zu bringen. In einer seriellen Theorie bestünden solche Schwierigkeiten nicht, da hier die Entfernung leicht zu kodieren ist. Um nachzuweisen, daß das parallele Modell doch erklärungsadäquat ist, müßten diverse Bedingungen gegeben sein. Dies ist nach dem heutigen Kenntnisstand jedoch nicht der Fall. So könnte die lineare Distanz ein Artefakt einer syntaktisch funktionellen Ähnlichkeit sein. Je dichter zwei Segmente nebeneinanderstehen, desto
191
größer ist die Wahrscheinlichkeit, daß sie derselben funktioneilen Einheit (z.B. NP, VP) zuzurechnen sind. Da Ähnlichkeit bekanntlich ein versprecherbegünstigender Faktor ist, könnte dies theoretisch eine Erklärung für die »Nächstenliebe« in einer parallelen Konzeption sein. Diese Lösung scheitert allerdings daran, daß der Einfluß der Syntax auf phonologische Fehlleistungen zwar vorhanden, aber doch nicht ausreichend ist, um damit den starken Effekt der Positionalität vollständig zu erfassen. Auch das nächste Beispiel greift auf Bekanntes zurück. In Kap. 16.5. wurde die frequenzielle Asymmetrie der Antizipationen und Perseverationen als Evidenz für eine Unterscheidung zwischen bereits artikuliertem und noch nicht artikuliertem Material interpretiert. Vor der Artikulation ist das Aktivationsniveau generell höher als hinterher, deshalb das Übergewicht der Vorwegnahmen. Dies ist jedoch keine natürliche Voraussage eines parallelen Modells. In einem solchen wäre zu erwarten, daß ein Sequenzierungsproblem wie in (161) symmetrisch mal in die eine, mal in die andere Richtung gelöst wird. (161)
aß und /m/
atschig /n/
Dies hängt wohl gemerkt damit zusammen, daß die relevante Entscheidung auf der Planungsstufe getroffen wird, wo exekutioneile Gesichtspunkte per definitionem keine Rolle spielen. Um die empirisch nachgewiesene Häufigkeitsasymmetrie in einem parallelen Zusammenhang zu erfassen, müßte sie zunächst völlig neu interpretiert werden. Wie das aussehen könnte, ist jedoch unklar. Schließlich soll ein letzter Problembereich aus dem empirischen Teil aufgegriffen werden. Es handelt sich dabei um den in Kap. 9.8. ermittelten Links/Rechts-Effekt, der besagt, daß der Modifikationsort (in einem speziellen Versprechertyp) davon abhängt, wo das erste nicht-identische Element — von links nach rechts gerechnet — auftritt. Hier wird die Inadäquatheit einer parallel konzipierten Verarbeitungsstufe zur Erklärung dieses Phänomens besonders deutlich. Der Links/Rechts-Effekt stellt damit massiv den Versuch in Frage, Fehlerphänomene auf einer parallelen Stufe zu lokalisieren. Die vorangegangene Diskussion hat zum Ziel gehabt, folgendes deutlich zu machen: Versprecher, die in der Literatur generell als Planungsprobleme angesehen werden, lassen sich nicht auf einer Stufe identifizieren, auf der ausschließlich parallel gearbeitet wird. Dazu weisen die Fehlleistungen zu viele Eigenschaften auf, die aus einem parallelen Modell nicht hervorgehen, mit einem seriellen jedoch leicht in Einklang zu bringen sind. Daraus ergibt sich die Schlußfolgerung, daß die allgemein praktizierte Zuweisung der Versprecher auf die Planungsstufe zurückgewiesen werden muß. Weiterhin hat sich gezeigt, daß die Planungsphase, unabhängig davon, wo der Ursprung der Versprecher letzten Endes zu finden ist, am einfachsten und elegantesten zu konzeptualisieren ist, wenn die Möglichkeit der gleichzeitigen Verarbeitung mehrerer Elemente auf natürliche Weise gegeben ist. Dies bedeutet, daß das Konkurrenzprinzip zu einem bestimmten Zeitpunkt außer Kraft gesetzt sein muß.
192
Die Ergebnisse dieses Kapitels sind primär negativ, aber nicht minder wichtig. Es ist jetzt geklärt, wie auf der Planungsstufe nicht verfahren wird und wo die Genese der Versprecher nicht zu finden ist. Es wird daher in einem nächsten Schritt erforderlich, diese negativen Erkenntnisse in positive umzumünzen. Zuvor ist es jedoch angebracht, die Exekutionsphase in derselben Manier unter die Lupe zu nehmen, wie es für die Planung geschehen ist. Erst ihre kritische Diskussion schafft die Voraussetzungen für eine fundierte Neukonzeption der Stufenproblematik im Sprachproduktionsprozeß.
17.7.
Diskussion gängiger Konzeptionen des Exekutionsmechanismus
Irgendeine Art der Exekution ist in allen Sprachproduktionsmodellen zumindest implizit vorhanden. Nur wenige Autoren machen sich jedoch die Mühe, die Eigenschaften der Informationsverarbeitung auf dieser Stufe näher zu umreißen. Am explizitesten ist dies in einem Aktivationsmodell möglich, Ausgangspunkt wird damit erneut Stemberger (1985a). Er sieht die Exekution in seiner Theorie als die Stufe an, auf der die parallel selegierten Sprachelemente in eine lineare Dimension umgewandelt werden. In dieser Hinsicht ist Stembergers Modell mit MacKays (1969, 1970a) Abtastmodell vergleichbar. Es läßt sich insofern in die folgenden Überlegungen miteinbeziehen. In beiden Konzeptionen ändern sich die Aktivationsverhältnisse mit jeder exekutierten Einheit. Es muß nun gefragt werden, welche aktivationsbeeinflussenden Faktoren auf dieser Verarbeitungsstufe in Aktion treten. Stemberger läßt sich hierüber nicht exakt aus, es ist jedoch relativ leicht zu schlußfolgern, daß er die Nähe als das entscheidende Kriterium betrachtet. Den Aktivationsvorgang in der Exekutionsphase hat man sich dann so vorzustellen, daß die Aktivität mit dem Herannahen des Zeitpunkts der Artikulation kontinuierlich zunimmt und danach mit zunehmender Entfernung wieder abnimmt. Theoretisch gibt es dabei zwei Möglichkeiten: Die Aktivationszustände einzelner Elemente überlappen sich, oder der Aufbau des einen beginnt erst, wenn das andere bereits exekutiert ist. Aufgrund der Tatsache, daß die Spracheinheiten durch die Planung ja bereits ein gewisses Maß an Aktivation besitzen, kann nur die erste Hypothese überzeugen. Dies würde eine treppenoder wellenförmige Konfiguration bedeuten, wie sie in Abbildung 22 für das Wort stop zum Ausdruck kommt. Abbildung 22: Abbildung des Aktivationsprozesses bei der Exekution /
Aktivationsstärke
S
* t
' S
l
-
o
0
s
p
p! l
,
t
_ ! p]
; t Is 1 1
_ p__
_.
o
»Zeit
193
Mit der Exekution eines jeden Elements ändern sich also die Aktivationsniveaus aller anderen geplanten Einheiten. So ist das /s/ beispielsweise bei der Exekution des /t/ stärker aktiviert als bei der des /p/. Eine zweite Eigenschaft dieser Konzeption ist darin zu sehen, daß die Exekution generell elementenunabhängig arbeitet. D.h., aufgrund der Tatsache, daß nur die Entfernung zählt, wird die Qualität der Elemente neutralisiert. So hat es z.B. auf die Aktivation keinen Einfluß, ob es sich bei dem nächsten Element um einen Vokal oder einen Konsonanten handelt, eine Frage, die auf der Planungsstufe (bei Stemberger) von zentraler Bedeutung ist. Folgender wesentlicher Sachverhalt wird somit deutlich: Die Aktivationsvorgänge in der Planungs- und Exekutionsphase laufen in Stembergers Modell deutlich unterschiedlich ab. Die Aktivierung bei der Planung erfolgt auf der Grundlage der Verarbeitungsmodalitäten des Netzwerks, bei der Exekution hingegen werden die Aktivationspegel der Elemente der Reihe nach bis zur Produktionsschwelle angehoben. Um diesen Schritt durchzuführen, ist ein Rückgriff auf das aktivationale Netzwerk nicht nötig. Die Exekution arbeitet also im Gegensatz zur Planung ohne selbiges. Was für Versprechertypen sind nun in einem solchen Modell auf dieser Stufe zu erwarten? Wie erinnerlich lokalisiert Stemberger auf der Exekutionsstufe hauptsächlich Verschiebungen. In der Tat müssen es solche Fehler sein, bei denen eine Reihenfolgestörung vorliegt. Eine wichtige Prognose ist, daß die Fehlerfrequenz mit zunehmender Nähe der interaktionsfähigen Elemente steigen sollte. Daneben sollten die Verschiebungen eine häufige Versprecherklasse sein, da die Planungsstufe mit der Exekutionsstufe in der Hinsicht gleichgestellt ist, daß sie beide vollständige Verarbeitungskompetenzen haben. Es gibt daher keinen Grund, weshalb die bekanntlich hohe Zahl der Störfalle bei der Planung nicht auch in der Exekutionsphase vorzufinden sein sollte. Beginnen wir mit letzterer Vorhersage. Verschiebungen sind insgesamt ein eher seltener Versprechertyp. Auf der phonemischen Ebene befinden sich in meinem Korpus beispielsweise nur 10, darunter (125) und (162). Vier davon bekunden die Interaktion eines Vokals und eines Konsonanten, 6 die Interaktion zweier Konsonanten. (162)
Die Sozialausschüsse sind dafrüh— dafür, daß...
Man könnte geneigt sein zu glauben, daß die Seltenheit dieser Versprecher eine logische Konsequenz der eingeschränkten artikulatorischen Möglichkeiten ist. Wie sollte eine Reihenfolgestörung im Initialcluster von trip zustande kommen, wenn anlautendes tautosyllabisches /rt/ auf außerordentliche Ausspracheschwierigkeiten stößt? Dieser Faktor ist nicht von der Hand zu weisen. Es ist jedoch zweifelhaft, ob er allein zur Erklärung der äußerst geringen Anzahl von Exekutionsfehlern im Vergleich zu den Tausenden von Planungsfehlern in Stembergers Modell ausreicht. Denn es gibt doch viele Möglichkeiten der Verschiebung innerhalb eines Worts, ohne daß damit automatisch das Sonoritätsprinzip der Silbenstruktur verletzt werden müßte. Gerade zwischen Vokalen und Konsonanten sind Reihenfolgestörungen oft problemlos durchzuführen. Greifen wir ein zweites Beispiel auf. Auf der syntaktischen Ebene gibt es solche artikulatorischen Beschränkungen nicht. Jedes Wort kann an jeder beliebigen Position gesprochen werden. Hier ist daher eine relativ gleichmäßige Verteilung der Verschiebungen zu
194
erwarten. Eine solche Symmetrie ist in meiner Materialsammlung aber nicht zu erkennen. Es sind bezeichnenderweise vornehmlich solche Wortarten von Verschiebungen betroffen, die eine besonders variable Stellung im Satz einnehmen, also Adverbien usw. Es gibt jedoch keinen einzigen Fall in meinem Korpus, bei dem die normale Reihenfolge Artikel-Nomen invertiert ist. Dieses Ausbleiben läßt sich mit der Hypothese der invariablen Stellung des Artikels gut erklären. Es ist also festzustellen, daß die Verschiebung auf der Wortebene offenbar nicht nur von der Entfernung, sondern auch von anderen aktivationsbeeinflussenden Faktoren abhängig ist, so z.B. von der Normalität der Wortstellung. Es sieht also danach aus, als wenn auf der Stufe, die für die Verschiebungen verantwortlich ist, doch nicht ganz auf Netzwerkinformation verzichtet werden kann. Die andere Prognose, daß die Wahrscheinlichkeit der Modifikation eine Funktion der Nähe der Interaktanten ist, konnte bereits in Kap. 16.8. relativiert werden. Wie dort gezeigt wurde, nimmt diese Wahrscheinlichkeit innerhalb des intramorphemischen Bereichs drastisch ab. Diese Tatsache ist mit Stembergers Konzeption der Exekutionsphase nicht vereinbar. Die Exekutionsstufe als ein Mechanismus der Linearisierung durch ausschließlich entfernungsbedingte Aktivationsveränderungen muß demzufolge zurückgewiesen werden. Denn die sprachliche Wirklichkeit liefert nicht die Versprecher, weder in qualitativer noch in quantitativer Hinsicht, die laut dieser Konzeption produziert werden müßten. Es wird also im Rahmen des Zweistufenmodells eine Neudefinition vor allem der Exekutionsphase erforderlich. Dies ist die Absicht des kommenden Kapitels.
17.8.
Ein alternatives Planungs/Exekutionsmodell ,
17.8.1.
Grundsätzliches
An den Anfang dieses Kapitels soll die Aufgabe gestellt werden, die unstrittigen Eigenschaften der Planungs- und Exekutionsphase zusammenzutragen. Dazu komme ich auf das Aktivationsmodell zurück. Auf beiden Stufen geht es um die Aktivierung von Spracheinheiten, die sich insofern in zwei Phasen einteilen läßt. Die Planung dient der Präaktivierung und die Exekution der Hauptaktivierung. Eine exakte Trennungslinie ist zwischen beiden Aktivationsarten vermutlich nicht zu ziehen, erscheint aber auch für das weitere theoretische Vorgehen nicht erforderlich. Während die Planung die gleichzeitige Verfügbarkeit einer gewissen Anzahl von Elementen sicherstellt, bringt die Exekution die so aktivierten Größen in eine temporale Dimension, d.h., eine nach der anderen erreicht ihren Aktivationsgipfel. Nicht klar ist bisher, ob beide Verarbeitungsstufen auf das Netzwerk zurückgreifen. Eine von ihnen muß es mindestens, denn die Versprecher sind von den Verarbeitungsbedingungen des Netzwerks geprägt. Sie würden dann also auf dieser Stufe zu lokalisieren sein. Im übrigen hat sich durch die empirischen Analysen im Hauptteil dieser Arbeit herausgestellt, daß alle Versprecher trotz ihrer Unterschied-
195
lichkeit einheitlich beurteilt werden können. Es ließ sich keine Gruppe erkennen, die in irgendeiner Weise Außenseiterstatus hat; alle Fehlleistungen wiesen, wenn auch durch ihre spezifischen sprachlichen Bedingungen auf unterschiedliche Art und Weise, Merkmale der Netzwerkprägung auf.91 Dies bedeutet, daß nichts dagegen spricht, alle Fehler auf ein und derselben Stufe zu lokalisieren. Die Frage lautet nun natürlich, welche das ist. In bezug auf die Planungsstufe kann festgestellt werden, daß sich aus ihrer parallelen Vorgehensweise spezifische Merkmale ihres Verarbeitungsmodus ableiten lassen. Daß beliebige Einheiten gleichzeitig in Alarmbereitschaft versetzt werden können, setzt voraus, daß ein wechselseitiger Ausschluß von Planungselementen im System nicht erfolgt. Diese Tatsache erhält die Bezeichnung Prinzip der freien Fahrt. Ohne selbiges ist nicht vorstellbar, wie die Planung ihren Aufgaben nachkommen kann. Vor dem Hintergrund, daß Planen Präaktivieren bedeutet, läßt sich erkennen, daß die Präaktivierung jeder in seiner Struktur eingebetteten Einheit zu jedem beliebigen Zeitpunkt möglich, ja sogar notwendig ist. Diese Schlußfolgerung ergibt sich direkt aus der parallelen Informationsverarbeitung. Das Prinzip der freien Fahrt impliziert, daß es auf der Planungsstufe zwischen zu ein und derselben syntaktischen Struktur gehörenden Elementen — zumindest zu einem gewissen Zeitpunkt — keine Konkurrenzsituation gibt. Daraus erwächst eine bedeutsame Erkenntnis: Wenn die Konkurrenzsituation nur bedingt gegeben ist, Versprecher aber erst durch das Konkurrenzprinzip zustande kommen, fehlt eine wichtige Voraussetzung dafür, Fehler auf der Planungsstufe zu lokalisieren. Es wird daher unumgänglich, der vorherrschenden Meinung in der Literatur entgegenzutreten. In einer Zweistufenkonzeption bliebe demnach nur noch die Exekutionsstufe als Ort der Fehlergenese übrig. Es soll jedoch nicht einfach nur der gekürt werden, der als letzter übrigbleibt. Vielmehr wäre es von Vorteil, wenn sich gewichtige Argumente für die Zuweisung der Versprecher auf die Exekutionsstufe anführen ließen. Bekanntlich ist es die Aufgabe der Exekutionsstufe, Elemente in einer bestimmten Reihenfolge zu vollaktivieren. Hier muß das Ausschlußprinzip gelten, d.h., es kann immer nur einer zu einem bestimmten Zeitpunkt an der Reihe sein. Dies ist genau die Bedingung, die zu einer vollständigen Konkurrenzsituation führt. Theoretisch kämpfen alle Bausteine um jede Position, auch wenn sich dies in der Praxis des Einzelfalls erheblich reduziert. Wiederum ist das Ausschlußprinzip in Verbindung mit der Vollaktivation zu sehen. Erst die Tatsache, daß zwei Elemente nicht gleichzeitig artikuliert werden können, da sie widersprüchliche Nervenimpulse involvieren, führt zu Entscheidungen, die die Planungsstufe nicht kennt. Dieses sind geradezu ideale Entstehungsbedingungen für Versprecher. Damit die Exekution »versprechergerecht« arbeiten kann, muß allerdings eine wichtige Voraussetzung erfüllt sein: Die Hauptaktivierung muß auf derselben Grundlage wie die Präaktivation der Planungsphase erfolgen: dem Netzwerk. Ein einfacher serieller Aktivationsschub nach dem Kriterium der Distanz wäre inadäquat. In der Tat spricht 9l Dies gilt zwar für alle hier besprochenen Fehlertypen, jedoch konnte nicht die gesamte Bandbreite der Versprecher in dieser Arbeit abgehandelt werden. Anzeichen dafür, daß nicht-behandelte Klassen aus der Rolle fallen, gibt es aber kaum. Wenn überhaupt, dann wären Silbenelisionen die aussichtsreichsten Kandidaten.
196
nichts dagegen, die Linearisierung auch über das Netzwerk herbeizuführen. Dies ist die einfachste Lösung; ansonsten brauchte man einen Spezialmechanismus, sprich: einen Abtaster, der nur für die Serialisierung verantwortlich ist. Sie erfolgt so automatisch durch eine spezifische Aktivationsstrategie im Netzwerk. Vor dem Hintergrund des Gesagten ist es kein Problem mehr, alle Versprecher auf der Exekutionsstufe zu lokalisieren, da hier alle für Fehlleistungen wesentliche Bedingungen zusammentreffen. Dabei weisen die empirischen Daten den Weg zu einem Modell, welches sich auch aus theoretischen Erwägungen empfiehlt. In diesem Modell kann auf zusätzliche Mechanismen weitgehend verzichtet werden. Planung und Exekution greifen auf dasselbe Informations- und Verarbeitungsreservoir zurück. Sie unterscheiden sich in ihrer Funktion nur minimal, und zwar insoweit, wie es durch ihre unterschiedliche Zielsetzung erforderlich wird. Die Aktivierung findet also in zwei Schüben statt. Dies erscheint zwar weniger ökonomisch als ein einphasiger Prozeß, ist aber als psycholinguistische Antwort auf sprachliche Komplexität eine ungleich effizientere Verarbeitungstaktik.
17.8.2.
Detailaspekte
Die Bedeutsamkeit des vorangegangenen Kapitels legt eine Detaillierung der dort gewonnenen Erkenntnisse nahe. Als wichtigste Aufgabe muß zunächst der Nachweis erbracht werden, daß alle Versprecher auf der Exekutionsstufe generierbar sind. Dabei stellt sich das Problem in umgekehrter Weise im Vergleich zu Stembergers (1985a) Modell. Versprecher, die für ihn das Postulat einer abtastähnlichen Funktion erforderlich machten, müssen nun auch mit Hilfe der Netzwerkaktivation zu produzieren sein. Es folgt deshalb zum letzten Mal ein Blick auf die Verschiebungen. Zu bedenken ist, daß sich Stembergers und die hier vorgelegte Exekutionsphase in einem Punkt überlappen. Beide postulieren den aktivationsbeeinflussenden Faktor der Nähe. In der Tat ist dieser Überschneidungsbereich Voraussetzung dafür, daß das auf den vorangegangenen Seiten entwickelte Modell funktionsfähig ist. Denn gäbe es diese Überlappung nicht, wären Stembergers Exekutionsfehler mit meiner Konzeption der Exekutionsstufe nicht zu erklären. Wenn Verschiebungen nun hauptsächlich auf den Aktivationsfaktor der Nähe zurückgehen und dieser einer unter mehreren ist, sollte ein solcher Versprechertyp relativ selten sein, da ihm die Unterstützung der anderen Faktoren weitgehend versagt bleibt. Genau das ist auch der Fall. Benachbarte Reihenfolgestörungen werden zwar dadurch begünstigt, daß sie den Faktor der Nähe maximal umsetzen können, werden jedoch wiederum dadurch unwahrscheinlicher gemacht, daß andere, vermutlich stärkere Faktoren die Aktivationsverhältnisse in die entgegengesetzte Richtung lenken. Es ist also festzuhalten, daß Verschiebungen bis zu einer gewissen Quantität auch mit der hier vorgelegten Konzeption einer Exekutionsphase zu generieren sind. Alle weitere Fakten, die für andere Modelle problematisch sind, erfahren eine natürliche Erklärung. Im Kapitel zu den Aktivationsverhältnissen wurde die Unterscheidung in eine aktuelle und eine gerade nicht zu verarbeitende Position nötig. Sie ergibt sich direkt
197
aus der Tatsache, daß die serielle Exekutionsstufe die für Versprecher relevante ist. Je nachdem, ob ein Element gerade exekutiert wird oder nicht, ist die Intensität des Aktivationsflusses größer oder kleiner. So kommt es zur Differenzierung von minimaler und maximaler Hyperaktivation bei dem Kontextidentitätseffekt bzw. bei den Maskierungen. Auf ähnliche Weise läßt sich die Häufigkeitsasymmetrie zwischen Antizipationen und Perseverationen erklären. Sobald die Exekution hierbei eine Rolle spielt, kann die Hypothese der Aktivationsverbrennung durch Artikulation greifen. Der Links/Rechts-Effekt zeigt sehr deutlich, wie die Fehlergenerierungsstufe primär seriell arbeiten muß, damit beim ersten nicht-identischen Element, also dort, wo eine Konkurrenzsituation gegeben ist, die Intrusion erfolgen kann. Eine parallele Konzeption kann diesem Problem nicht gerecht werden. Es gilt nun, folgendem scheinbaren Widerspruch zu begegnen: Wenn alle Versprecher auf einer vor allem seriell arbeitenden Produktionsstufe auftreten, wie können sie dann im Hauptteil dieser Arbeit als Evidenz für einen parallelen Informationsfluß interpretiert werden? Was ist an ihnen dann noch parallel? Hierzu ist die Unterscheidung zwischen Verarbeitungsebene und -stufe und ihr Verhältnis zueinander zu berücksichtigen. Es läßt sich graphisch wie folgt umreißen: Abbildung 23: Verhältnis der Verarbeitungsebenen zu den -stufen Stufen
Ebenen im Netzwerk Wort*
r
Planung
Morphem
Exekution
Phonem
l.
»Syntax
l
I
Merkmal
Beide Verarbeitungsstufen beziehen sich also auf alle Verarbeitungsebenen gleichermaßen. Sie nutzen prinzipiell dieselbe Information.92 Das Entscheidende ist nun, daß die sprachliche Information parallel generiert und so den Verarbeitungsstufen zur Verfügung gestellt wird. Beide gehen dann auf ihre spezielle Art mit der Information um. In der Planungsphase wird aus der parallel erhältlichen Information ausgewählt und das Ergebnis kurzzeitgespeichert, während die Exekutionsphase für die Serialisierung desselben zuständig ist. Auf diese Weise wird das Potential für serielle und parallele Verarbeitungsstrategien geschaffen. In Versprechern als einer Ausdrucksform von Sprache manifestie92 Diese Position ist auch neurologisch plausibel. Die wesentlichen Aspekte, die auf eine fruchtbare Diskussion mit Eric Keller zurückgehen, können hier nur angedeutet werden. Der Planung und der Exekution liegt generell dieselbe Neuronenpopulation zugrunde. Beide Phasen unterscheiden sich jedoch dadurch, welche Zellen wie zur Feuerung gebracht werden. Bei der Planung gelangt eine repräsentative Auswahl zur Feuerung, während bei der Exekution die Gesamtpopulation zum Einsatz kommt. Weiterhin wird auf der ersten Stufe gleichzeitig gefeuert, während dies auf der zweiten primär nacheinander geschieht.
198
ren sich beide Einflüsse mit besonderer Deutlichkeit. Serielle Aspekte weisen sie auf, weil sie in einem primär seriellen Prozeß zutage treten und parallele, weil dem eine gleichzeitige Bereitstellung von Information vorausgeht. Dies wird nur dadurch möglich, daß die Verarbeitungsebenen parallel vorgehen. Aufgrund der Tatsache, daß beiden Verarbeitungsstufen dasselbe Material zur Verfügung steht, können sie sich in ihrem Informationsstand auch nicht unterscheiden. Dies hat eine wichtige Konsequenz sowohl für die Planung als auch für die Exekution. Lashley (1951) ging davon aus, daß die Elemente in der Planungsphase temporal ungeordnet sind und ein Abtastmechanismus sie in eine zeitliche Dimension überführt. Damit darf jedoch nicht gemeint sein, daß die Kotemporalität mit einer Asyntaktizität gleichzusetzen ist. Im vorliegenden Modell ist die Planungsphase vollständig spezifiziert, d.h., Information über die serielle Abfolge ist genauso repräsentiert wie jede andere auch. Das Produkt der Planungsphase ist damit nicht in irgendeiner Weise unfertig und unspezifisch, wie es z.B. Keller (1980) angenommen hat. Für die Exekutionsstufe erübrigt sich dadurch die Funktion, die serielle Abfolge, also syntaktische Information neu zu generieren. Sie setzt vielmehr das in eine lineare Dimension um, was vorher schon hierarchisch kodiert war. Nachdem das Verhältnis zwischen Stufen und Ebenen beleuchtet worden ist, empfiehlt sich ein näherer Blick auf das Verhältnis der Stufen zueinander. In Abbildung 23 kommt bereits eine serielle Konzeption zum Ausdruck. In der Tat kann keine Hauptaktivierung erfolgen, ehe nicht die Präaktivation stattgefunden hat. Diese Serialität scheint eine logische Notwendigkeit zu sein, sie gilt aber, wohl gemerkt, nur für ein und dasselbe Material. Unterschiedliches Material kann natürlich gleichzeitig prä- bzw. hauptaktiviert werden. Daß sich Planungs- und Exekutionsprozesse überschneiden, ist eine altbekannte Erkenntnis in der Psycholinguistik (Goldman-Eisler 1968). Was bedeutet nun die Serialität in die Sprache der Aktivationstheorie umgesetzt, wenn man bedenkt, daß es nahezu unmöglich ist, die Grenze zwischen dem Ende der Präaktivation und dem Anfang der Hauptaktivation genau zu lokalisieren? Die Neuformulierung kann nur so lauten, daß der Aktivationsprozeß in einem seriellen Modell an irgendeinem Punkt eine Pause macht. Bis dahin wird prä-, danach hauptaktiviert. Die Länge der Pause ist dabei irrelevant. Im Extremfall könnte sie sogar, wie im Falle der Interjektionen, buchstäblich verschwinden. Im Normalfall ist sie eine Folge der zeitlichen Differenz zwischen Planung und Exekution. In einem parallelen Modell ist immer mit Interferenzen zu rechnen. Wenn beide Verarbeitungsstufen also an unterschiedlichem Material gleichzeitig operieren, muß gefragt werden, wieweit Vorgänge auf der einen nicht durch Vorgänge auf der anderen beeinträchtigt werden können. Das flüssige Sprechen eines kompetenten Sprachbenutzers deutet bereits daraufhin, daß die beiden Prozesse so organisiert sein müssen, daß die Gefahr der Interferenz insgesamt gering ist. Der Deutlichkeit halber empfiehlt sich eine Unterscheidung hinsichtlich der Richtung der Interferenz. So könnte zum einen die Planung die Exekution und zum anderen die Exekution die Planung behindern. Daß eine Störung der Exekution durch die Planung möglich ist, kann als Grundvoraussetzung für das Auf-
199
treten von Versprechern angesehen werden. Diese bringen nämlich genau diesen Sachverhalt zum Ausdruck. In (163)
F: Je vais taire du Je. statt: Je vais^aire du the. (Grammont 1895)
interferiert z.B. die Exekution des /f/ mit dem geplanten /t/ und umgekehrt. Dasselbe Prinzip gilt für die anderen Versprecher, nicht nur die syntagmatischen. Der umgekehrte Fall, daß durch die Exekution die Planung in Mitleidenschaft gezogen wird, ist etwas schwerer zu beurteilen, da geplantes Material per defmitionem nicht die Produktionsschwelle erreicht und insofern unhörbar bleibt. Kann also die Planung des Phonems /X/ dadurch unmöglich gemacht werden, daß dasselbe oder ein anderes gerade exekutiert wird? Eine Lösung des Problems deutet sich durch das Prinzip der freien Fahrt auf der Planungsstufe an. Es wurde notwendig, um die gleichzeitige Aktivierung mehrerer Größeneinheiten im Netzwerk zu erklären und läßt sich direkt auf die vorliegende Frage übertragen. Wenn die Planung keine Interferenz durch sich selbst kennt, ist es unwahrscheinlich, daß sie von einer vergleichbaren, auch über das Netzwerk laufenden Aktivationsstrategie behindert werden kann. Dies ist jedoch kein zwingender Beweis, sondern vielmehr eine Vorhersage der unabhängig entwickelten Hypothese der freien Fahrt. Es ist nicht klar, inwieweit sich diese Frage einer experimentellen Prüfung unterziehen läßt. Diese Überlegungen führen wieder zu der zentralen Frage der Fehlerlokalisierung zurück. Einerseits wurde behauptet, daß alle Versprecher durch die Exekutionsphase zustande kommen, andererseits erscheint es nicht möglich, eine klare Trennungslinie zwischen dem Planungs- und dem Exekutionsvorgang zu ziehen, da die Aktivationsmodalitäten auf beiden Stufen in vieler Hinsicht übereinstimmen. Auch dies ist nur ein scheinbarer Widerspruch. Wie bereits nachgewiesen wurde, macht die ordnungsgemäße Erfüllung der Planungsaufgaben einen Verzicht auf ein syntagmatisches Konkurrenzverhältnis unumgänglich. Dadurch aber, daß die Planungselemente interferenzlos und friedlich koexistieren, ist die Vermutung naheliegend, daß auf dieser Verarbeitungsstufe Versprecher prinzipiell unmöglich sind. Damit soll jedoch nicht ausgeschlossen werden, daß die Planungsstufe trotzdem einen gewissen Beitrag zur Fehlergenese leistet. Da Versprecher eine Frage von Aktivationsgraden sind und selbige bereits bei der Planung möglicherweise Schwankungen unterworfen sind, spricht einiges für die Annahme, daß Fehlleistungen in der Planungsphase vorbereitet werden. Der entscheidende Punkt ist nun aber folgender: Ganz gleich, wie verkehrt die Planungsstufe auch gearbeitet haben mag, zu einem tatsächlichen Versprecher kommt es erst dann, wenn der bei der Planung aufgetretene Störfall bei der Exekution repliziert und somit bestätigt wird. Die Exekutionsstufe übernimmt also durch die etwas abgewandelte Wiederholung des Aktivationsprozesses auf der Planungsstufe eine Art Kontrollfunktion. Was auf der ersten Stufe passiert, ist daher für die Fehlergenerierung im Vergleich zu den Vorgängen auf der zweiten von sekundärer Bedeutung. Das Ergebnis der Exekution ist die Grundlage für die Artikulation, so daß Versprecher sich nur zeigen können, wenn sie während der Exekution aufgetreten sind. Wahrnehmbare Fehlleistungen kommen also durch spezifische Aktivationsbedingungen
200
bei der Exekution zustande, wobei nicht auszuschließen ist, daß Probleme auf der Planungsstufe auftreten können, die dann in einem zweiten Durchlauf durch das aktivationelle Netzwerk auf der Exekutionsstufe beseitigt werden.
17.8.3.
Weitere Leistungen des vorliegenden Modells
Im weiteren stehen zwei Problembereiche zur Debatte, für die die Planungs/ Exekutionsdistinktion einfache Lösungen parat hält. In Kap. 15 ging es um die Schwierigkeiten, die mit der Annahme der einmaligen Repräsentation von sprachlichen Einheiten in einem Modell entstehen, welches ihre gleichzeitige Inanspruchnahme durch mehrere Befehle postuliert. So wird bei Stemberger (1985a) von vielen Knotenpunkten eine Mehrfachleistung gefordert. In dem hier vorgeschlagenen Modell stellt sich dieses Problem nicht in dem Maße. Nur im Bereich der Präaktivation wird eine Mehrfachbeanspruchung desselben Elements erforderlich, bei der »anstrengenderen« Hauptaktivierung aufgrund des seriellen Charakters der Exekutionsphase jedoch nie. Das bedeutet, daß das betreffende Element immer wieder Zeit zur »Regeneration« hat. Interessanterweise spiegelt sich diese Erholungsphase auch in der Sprachstruktur wider. MacKay (1970b) konnte in einem wenig beachteten Aufsatz zeigen, daß selbst so entfernte Sprachen wie Kroatisch und Hawaiisch keine identischen Phoneme in nächster Nachbarschaft aufweisen. Dies läßt sich als eine Folge von performanzbedingten Verarbeitungsschwierigkeiten interpretieren. Verständlich wird jetzt auch, weshalb die Wahrscheinlichkeit der Maskierungen mit abnehmender Entfernung der identischen Größen steigt. Je näher sie beieinander stehen, desto mehr steht der type unter dem Eindruck der Überlastung und desto eher erfolgt der Ausfall an einer Position. Es ist also festzustellen, daß sich Stembergers (1985a, 1983d) Zweifel an der Richtigkeit der Einfachabspeicherung aus einer falschen Konzeption der Aufgaben ableiten lassen, die ein type zu erfüllen hat. Zur selben Zeit braucht er nur Minimalleistungen zu erbringen, bei erwarteten Höchstleistungen hingegen gehen die Befehle immer nur der Reihe nach ein, und das dazu mit einem zeitlichen Abstand, so daß weitgehend die Möglichkeit der Regeneration gegeben ist. Damit läßt sich nicht nur Stembergers (1983d) Hypothese der Mehrfachabspeicherung zurückweisen, sondern auch die der einmaligen Repräsentation bekräftigen. Die Hypothese, daß dem Produktionsvorgang ein zweiphasiger Durchlauf durch das aktivationelle Netzwerk zugrunde liegt, löst auch folgendes Paradox: Wie kann die Exekution eines Elements Schwierigkeiten bereiten, wie es ja durch die Sprechpausen zum Ausdruck kommt, wenn es bereits auf der Planungsstufe identifiziert wurde? Dies muß z.B. bei einem Verb der Fall sein, da sonst die Planung der übrigen Äußerung gar nicht hätte durchgeführt werden können. Immerhin gibt das Verb oft die syntaktische Struktur vor. Naheliegend wäre doch die Annahme, daß in dem Moment, wo ein Element geplant ist, seine Exekution keine größeren Schwierigkeiten mehr bereiten sollte. Zumindest in Stembergers (1985a) Konzeption der Exekutionsphase wäre das die vernünftigste Prognose, da er sie als einfaches serielles Über-die-Schwelle-Heben ansieht. Wenn nun aber doch
201
Schwierigkeiten auftreten, müssen sie auch erklärt werden. Eine Möglichkeit wäre, die Planungsphase eher abstrakt und unspezifiziert zu konzipieren. Diesen Weg haben Clark & Clark (1977) eingeschlagen. Sie meinen, daß einem Satz wie (164)
The girl is tasting the soup,
ein Planungsskelett wie in (164') vorausgeht: (164')
[ Entität 15 1 | Handlunge9|
| Entität, 2 |
Die Konkretisierung solcher Schemata erfolgt den Autoren zufolge erst auf der Exekutionsstufe. Die völlig andere Definition der Verarbeitungsaufgaben von Planung und Exekution im Vergleich zu den bisherigen Ansätzen braucht hier nicht herausgestellt zu werden. Sprechpausen sind in einem solchen Modell natürlich kein Problem. Sie ergeben sich aus der Tatsache, daß zum Zeitpunkt der Exekution gerade erst die Hauptarbeit beginnt. Daß dabei Schwierigkeiten auftreten können, kann nicht überraschen. Jedoch ist dieses Modell in vielerlei Hinsicht nicht haltbar. Es wäre unökonomisch, wenn man sich beim Sprechen erst überlegt, daß man über eine Handlung reden möchte und sich danach erst fragt, um was für eine Handlung es sich überhaupt dreht. Clark & Clark (1977) gehen implizit davon aus, daß der Sprachproduktionsmechanismus überfordert ist, wenn bereits bei der Planung konkrete Knotenpunkte angesprochen werden. Hier wird also eine Form von Abstraktionismus postuliert, die offenbar keine mentale Realität besitzt. Es spricht nichts dagegen, von vornherein die Netzwerkeinheiten zu aktivieren, die der Intention am nächsten kommen. Auf weitere Probleme dieses Modells soll nicht näher eingegangen werden. Unbeschadet alternativer Theorien ist daher davon auszugehen, daß die Planungsstufe potentiell voll spezifiziert ist. Warum kann die Exekution eines bereits präaktivierten Elements dann noch auf Probleme stoßen? Die Antwort ist in der hier entwickelten Konzeption der Exekutionsstufe zu finden. Denn die Exekution tritt den beschwerlichen Weg an, die Hauptaktivierung eines speziellen Items über das Netzwerk durchzuführen. Dies impliziert die Gefahr vielfältiger Interferenz. Immerhin bedeutet die Exekution, daß eine Ausdifferenzierung diverser Kandidaten solange erfolgt, bis nur ein einziger die Schwelle erreicht. Natürlich wird die Exekution durch die Planung erleichtert, jedoch nicht in einem Maße, daß bereits auf der Planungsstufe alle Schwierigkeiten ausgeschaltet werden können. Es ist daher durchaus denkbar, daß in einem so komplexen Aktivationsprozeß Schwierigkeiten im zweiten Durchgang trotz einer Präaktivierungsphase im ersten auftreten.
17.8.4.
Realisation statt Exekution
In den vorangegangenen Kapiteln wurden drei Planungs/Exekutionsmodelle und ihre Schwächen diskutiert und daraufhin diese Unterscheidung inhaltlich neu aufgefüllt. Das signifie wurde also massiv verändert, während das signifiant bisher unbehelligt blieb. Jetzt
202
ist es an der Zeit, den Exekutionsbegriff zu hinterfragen. In der biologischen Sichtweise bedeutet Exekution die Ausführung eines zuvor mental aufgebauten Schemas, in der Regel in Form von neuromuskulären Impulsen. Dadurch kommt sichtbares Verhalten zustande. Auf den Bereich der Sprachproduktion übertragen, heißt das, daß Exekution mit Artikulation gleichzusetzen ist. Dies ist eine Interpretation, die aufgrund der bisherigen Erörterungen nicht vollständig auszuschließen ist. Sie würde bedeuten, daß Versprecher Artikulationsphänomene sind. Daß diese Ansicht aber nicht haltbar ist, soll im folgenden gezeigt werden. Ein jeder profitiert von der Möglichkeit des Sprechens, ohne Zunge oder Lippen zu bewegen. Obwohl nur gedachte Sprache für objektive experimentelle Analysen kaum zugänglich ist, besteht wenig Zweifel, daß sie denselben Spezifikationsgrad erreichen kann wie artikulierte. Deshalb ist es theoretisch möglich, daß man sich auch gedanklich versprechen kann. Aus der Existenz solcher Versprecher läßt sich also ableiten, ob die Artikulation mit den Fehlleistungen in einem Kausalzusammenhang steht. Gibt es keine Verdenker, liegt der Fall klar auf der Hand: Dann war die bisherige Zuweisung der Fehler auf eine präartikulatorische Exekutionsstufe unrichtig. Gibt es sie aber doch, scheint die Artikulation einen fakultativen Zusatzprozeß darzustellen, der keine versprecherinduzierende Funktion hat.93 Zur Klärung dieses Problems ist auf Hotopf (1983) zurückzugreifen. Er schlägt eine wichtige Zweiteilung in unterdrückte Versprecher und Verdenker vor. Zu ersteren zählt er solche Fälle, bei denen der Sprecher im Zuge des Redeflusses einen Versprecher in dem noch nicht konvertierten abstrakt-linguistischen Programm herannahen sieht, also entdeckt, ehe er zur Artikulation gelangt. Abhängig davon, wie weit das Problem noch entfernt ist, kann es dann beseitigt werden, ohne daß der Sprechfluß merklich beeinträchtigt sein muß. Was sagen solche unterdrückten Versprecher über den Sprachproduktionsprozeß aus? Sie zeigen zunächst, daß es vor der Artikulation eine Phase gibt, auf der das sprachliche Material dem Bewußtsein des Sprechers bereits zugänglich ist. Es ist naheliegend, diese als die Exekutionsphase zu identifizieren. Die subjektive Erfahrung lehrt, daß man nur ein kleines Stück auf das noch ausstehende Material »blicken« kann. Dies deutet daraufhin, daß die Zeitspanne zwischen Exekution und Artikulation minimal sein muß. Natürlich ist nicht auszuschließen, daß sie variiert. Introspektive Evidenz weist daraufhin, daß sie stark modalitätenspezifisch ist. So geht dem Schreiben beispielsweise eine gedankliche Exekutionsphase voraus, die weit über das Einzelwort hinausreichen kann. An diesem Punkt wird die Trennung von Exekution und Artikulation besonders offensichtlich. Da diese jener vorauseilt und Fehler in dem Zwischenraum vor dieser und nach jener entdeckt werden, besteht kein Zweifel an der Feststellung, daß Fehlleistungen nichts mit der Artikulation zu tun haben. Es spricht also alles dafür, sie auf der präartikulatorischen Exekutionsstufe zu lokalisieren, da unterdrückte Versprecher zum intersubjektiven Erfahrungsbereich gehören. 93 Das heißt allerdings nicht, daß dieser Prozeß nicht auch störanfällig sein kann. Jedoch sind diese Probleme anderer Art als die abstrakteren Versprecher. Sie werden in der Literatur als Disarthrien geführt.
203
Hotopfs (1983) zweite Kategorie, die Verdenker, sind ebenso real. In der Nachfolge einiger anderer Forscher liefert auch er empirische Nachweise darüber, daß Fehlleistungen ebenfalls in solchen Situationen auftreten können, in denen eine Artikulation nie beabsichtigt war. Man kann sich beim stillen Sprechen also genauso vertun wie beim lauten. Dies erscheint auch nicht weiter ungewöhnlich. Dell (1977) hat sich diese Situation zunutze gemacht, indem er Versuchspersonen Zungenbrecher still lesen und sie dann über ihre stillen Versprecher berichten ließ. Seine Ergebnisse zeigen, daß selbige von den artikulierten in einem Kontrollexperiment nicht abweichen. Dies wirft jedoch ein Problem auf. Erinnern wir uns dazu noch einmal an die Häufigkeitsasymmetrie bei Antizipationen und Perseverationen. Dieser Effekt wurde mit der Hypothese zu erfassen versucht, daß die Aktivationsniveaus der bereits artikulierten Elemente durch Aktivationsverlust bei der Artikulation zustande kommen. Die Senkung des Aktivationspegels kann daher nicht, wie bislang angenommen, eine Folge der Artikulation sein. Es ist naheliegend, den Effekt, der bisher der Artikulation zugewiesen wurde, auf die Exekution zu verlagern. Diese stellt sich damit erneut als eine von der Artikulation strikt zu trennende Komponente im Sprachproduktionsprozeß dar. Um diesem Unterschied Ausdruck zu geben, soll der Begriff Exekution in Ermangelung eines besseren in Realisierung abgeändert werden. Diese Bezeichnung ist zwar vage, enthält dafür aber nicht die Konnotationen des Exekutionsbegriffs. Gemeint ist damit die Überführung des parallel geplanten Materials in ein serielles Nacheinander. Die Artikulation kann ihr folgen, muß aber nicht. Die Realisierung wird damit zu einem unverzichtbaren Bestandteil des Produktionsprozesses. Sprache läßt sich gedanklich vollständig spezifiziert generieren, sie wird also nicht erst durch die Artikulation vollkommen.94 Es wurde festgestellt, daß auch Verdenker und unterdrückte Versprecher in ihrer seriellen Dimension wahrgenommen werden. Dadurch wird die Hypothese unterstrichen, daß sie auf der Realisationsstufe entstehen. Da die Artikulation auch seriellen Charakter hat, muß die Frage aufgeworfen werden, weshalb die Funktionen der einen Komponente nicht von der anderen z.B. durch Kurzschließen der Planung mit der Artikulation übernommen werden können. Theoretisch erscheint dieser Weg gangbar, er würde das System jedoch in entscheidender Hinsicht schwächen, wenn nicht sogar lahmlegen. Es bestünde dann nämlich keine Möglichkeit mehr, eine kognitive Kontrolle über den eigenen SprechVorgang auszuüben. Denn gäbe es keine Realisationsstufe, würde man erst nach bzw. während der Artikulation erfahren, wie man eine bestimmte Idee sprachlich umgesetzt hat. Dies dürfte nicht nur zu Peinlichkeiten für den Sprecher führen, sondern viel allgemeiner eine bewußte Vorbereitung des Sprechens und damit in letzter Konsequenz den gesamten Kommunikationsprozeß gefährden, denn es müßte immer aufs Geratewohl artikuliert werden. Diese Überlegungen machen die zentrale Bedeutung der Realisationsstufe deutlich. Sie ist mehr als nur ein Probelauf für die Artikulation, sie ist ein integraler Bestandteil der sprachlichen Kodierung. Wieweit das fertige sprachliche 94 Daß Sprache natürlich nicht ohne Artikulation zu erlernen ist, bleibt dessen unbeschadet. Hier geht es wohl gemerkt um die Aktualgenese.
204
Produkt der Realisation artikuliert wird, ist eine Entscheidung, die mit der Versprachlichung einer Idee als solcher dann nur noch wenig zu tun hat.
205 18.
Versuch einer Synthese
18.1.
Integration (Teil 1): der Informationsfluß als Schlüssel zum Verständnis des Sprachproduktionsprozesses
Da zu Darstellungszwecken eine Aufsplitterung des Gesamtkomplexes unvermeidlich war, soll nun zum Ende des theoretischen Teils der Versuch unternommen werden, die vielfältigen Beziehungen zwischen den Einzelbestandteilen zu verdeutlichen und diese in ein integriertes System einzubinden. Beginnen wir mit dem aktivationalen Netzwerk. Die Stärke dieses Konzepts liegt in seiner Polyfunktionalität. Es ist gleichzeitig Gedächtnis und Produktionssystem. Hier finden sich nicht nur die Gedächtniseinheiten als solche, sondern sie sind auch gleich so organisiert, daß sie für die Generierung bereitstehen. Diese Verbindung ist wünschenswert, da Sprache allein als abstraktes Gebilde kein Selbstzweck ist; sie existiert nur zum Zwecke ihrer Verwendung. Insofern muß das Gedächtnis so strukturiert sein, daß es seinen Aufgaben im Produktions- (und Rezeptions)prozeß in optimaler Weise nachkommen kann. Daß sein Aufbau also von pragmatischen Gesichtspunkten bestimmt wird, erscheint nur naheliegend. So ist es beispielsweise beim Sprechen wichtig, daß man zur Informationsübermittlung eine fundierte Entscheidung zwischen mehreren Bedeutungsträgern treffen kann. Durch die Interkonnektivität des Systems stehen dem Sprecher automatisch diverse Alternativen zur Verfügung, unter denen er dann entsprechend seiner Intention auswählen kann. Das Prinzip der Vernetzung ergibt nur dann einen Sinn, wenn es aktualgenetisch genutzt werden kann. Dazu dient der Mechanismus der Aktivation, die über die vorgegebenen Verbindungslinien und Knotenpunkte durch das Netzwerk fließt. Auf diese Weise wird ein psycholinguistisches System konzeptualisiert, das neurologischen nicht ganz unähnlich und zumindest ansatzweise in neurologische übertragbar ist. Obwohl Aktivation ein graduelles und Einzelneuronenfeuerung ein absolutes Konzept ist, kann hier über die Integration von Zellverbänden der graduelle Effekt erzielt werden. Ähnliches gilt vermutlich für die Knotenpunkte, die weniger individuellen Nervenzellen als vielmehr spezifischen Schaltungen innerhalb ganzer Populationen entsprechen (Hinton 1981). Die Verbindungslinien zwischen den Knotenpunkten könnten beispielsweise synaptisch gedeutet werden. Die Prinzipien des Aktivationsflusses und der mannigfaltigen Verbindungen ermöglichen die gleichzeitige Aktivität einer Vielzahl von Elementen. Dieser Effekt kommt besonders auch dadurch zur Geltung, daß, wie Ratcliff & McKoon (1981) bekanntlich nachgewiesen haben, die Zeit, die ein Signal braucht, um die Entfernung zwischen zwei Knotenpunkten zurückzulegen, verschwindend gering ist. Die Parallelität ist nicht nur
206
zur Meisterung der komplexen Aufgabe des Sprechens erforderlich, sie bietet auch viele Vorzüge. So besteht z.B. in parallelen Aktivationsmodellen die Möglichkeit, auf das Konzept des diskreten Kurzzeitspeichers zu verzichten. In einem seriellen Modell hingegen muß das bereits verarbeitete Element für die Zeit, während das nächste an der Reihe ist, irgendwo »abgestellt« werden, da mit ihm in diesem Moment ja nichts passiert, es aber später wieder gebraucht wird. Es muß sozusagen warten, bis die anderen so weit sind. Die theoretische Konsequenz daraus ist das Postulat eines Speichers pro Verarbeitungsebene, wie es z.B. bei Ellis (1982) zum Ausdruck kommt. Eine solche Notwendigkeit fällt in einer parallelen Konzeption weg, da die Elemente unterschiedlicher Ebenen ungefähr zum selben Zeitpunkt seligiert werden. Die Funktion der kurzzeitig erhöhten Verfügbarkeit kann auch von dem Aktivationsmechanismus erfüllt werden. Dadurch, daß erbestimmte Elemente nicht nur in Alarmbereitschaft versetzt, sondern diese auch aufrechterhält, läßt sich auf einen diskreten Kurzzeitspeicher als eigenständige Verarbeitungsstufe verzichten. Über die Parallelität lassen sich auch Aussagen über die Netzwerkstruktur machen. Im großen und ganzen verwenden auch serielle Modelle eine hierarchische Gliederung, dies jedoch oft recht inkonsequent. So wird z.B. in Anlehnung an Chomsky & Halle (1968) häufig nicht zwischen einer Phonem- und einer Merkmalebene getrennt. Eine solche Entscheidung wird dadurch notwendig, daß in einem seriellen Modell Interaktionen zwischen den beiden Ebenen nicht denkbar sind. Da aber die phonologische Ähnlichkeit bei Phonemsubstitutionen aller Art unübersehbar ist, gibt es nur die Möglichkeit, die Existenz getrennter Ebenen zu negieren. Dies führt, wie in dieser Studie demonstriert wurde, in letzter Konsequenz zu theoretischen Absurditäten und zu einer Vielzahl von Zusatzannahmen mit ad hoc-Charakter. Anders dagegen der parallele Ansatz. Er ermöglicht per definitionem die Interaktion unterschiedlicher Informationsquellen, und zwar unter Wahrung des hierarchischen Aufbaus. Dieses vielleicht wichtigste Wesensmerkmal der menschlichen Sprache läßt sich in einem psycholinguistischen Modell, das auf einem parallelen Informationsfluß aufbaut, auf ideale Weise repräsentieren. Denn damit behalten die einzelnen Ebenen ihre Identität, stehen jedoch nicht beziehungslos unter- bzw. übereinander und haben insofern die Möglichkeit vielfältiger Interaktion. Diese Theoriebildung entspricht weitestgehend den Befunden der Linguistik. Der parallele Informationsfluß in einem hierarchischen Netzwerk hat auch Auswirkungen auf das Problem, wie oft jedes Einzelelement abgespeichert ist. Damit eine Interaktion überhaupt stattfinden kann, ist es unumgänglich, daß die Elemente zueinander in Beziehung stehen. Da dies in dem hier entwickelten Modell nicht lateral, sondern hierarchisch erfolgt, besteht nur die Möglichkeit, Beziehungen ebenenübergreifend auszudrücken. Dies wäre aber nicht zu realisieren, wenn z.B. das /b/ in blood ein anderes als das /b/ in brother wäre. Man muß daher beide in einem type abstrahieren, um die phonologische Ähnlichkeit zwischen beiden lexikalischen Items zur Geltung zu bringen. Über ein gemeinsames Element auf der tieferen Ebene kommen also non-lateral die diversen Beziehungen zwischen Elementen und damit letztlich die gesamte Organisation des Netzwerks zustande. Die Ebenentranszendenz, die in Versprechern so klar zum Vorschein kommt, ist insofern nur mit einem parallelen Informationsfluß zu verwirklichen.
207
Die Organisation des Netzwerks hat nicht nur die Funktion der Integration, sondern auch, worauf in dieser Arbeit nicht eingegangen worden ist, die der Automatisierung (Stemberger 1985a). Durch die hierarchische Aufspaltung wird das komplexe Abrufproblem erheblich gemindert. Alle weniger kreativen Komponenten, so besonders die Phonologie, können indirekt, also über höher stehende Einheiten abgerufen werden, so daß der Sprecher seine Aufmerksamkeit mehr auf die wesentlichen semantischen Entscheidungen lenken kann. In einem solchen Modell läßt sich der scheinbare Widerspruch der Auswirkungen der Ähnlichkeit und der Identität auf die mentale Informationsverarbeitung gut erklären. Wie erinnerlich begünstigt die Ähnlichkeit sie, wahrend die Identität sie erschwert. In einer hierarchischen Konzeption mit Einfachabspeicherung bedeutet Ähnlichkeit auf der einen Ebene Identität auf der nächsttieferen. Die Lösung des Problems erweist sich daher als verarbeitungsebenenabhängig. Durch Ähnlichkeit wird eine Verbindung zu anderen Elementen derselben Ebene hergestellt. Dies ist zweifelsohne ein begünstigender Effekt auf der höheren Ebene. Hingegen nimmt sich die gleiche Situation auf der tieferen so aus, daß ein Element doppelt beansprucht wird. Dies kann bekanntlich zu den Schwierigkeiten führen, die als hemmender Effekt gedeutet worden sind. Mit der Parallelität eröffnet sich eine weitere Perspektive, deren Bedeutung in jüngeren Arbeiten immer mehr zur Geltung kommt: das Feedback. Es ist zusammen mit dem Feedforward der Garant der Interaktivität. Zu bedenken ist, daß der Informationsfluß von unten nach oben nur in einer parallelen Theorie Sinn ergibt. Seine Existenzberechtigung besteht nämlich darin, daß die Entscheidung auf der höheren Ebene noch nicht endgültig, sondern nur vorläufig getroffen ist, diese daher noch beeinflußt werden kann. Genau das ist der Grund, weshalb Feedback in einem seriellen Modell nutzlos ist, denn hier ist ja per defmitionem bereits alles entschieden. Bezeichnenderweise verzichten die Serialisten auch weitgehend auf dieses Konzept. Seine explikative Kraft ist jedoch ausgesprochen groß. Nicht nur, daß es eine maximale Integration der Komponenten gewährleistet, es löst auch alle Schwierigkeiten, die mit dem Problemfeld der Kontrollinstanzen verbunden sind (Berg 1986c). Erwähnt werden sollte ferner, daß das Feedback auch in der Neurologic nachgewiesen werden konnte, selbst wenn sein Ausmaß dort noch nicht völlig geklärt ist. Auf jeden Fall deckt sich das psycholinguistische Konzept mit dem, was neurologisch möglich oder gar plausibel ist. Die Parallelität führt weiterhin von den Verarbeitungsebenen zu den Stufen in dem hier definierten Sinn. Damit der parallele Informationsfluß im Netzwerk auch einen Sinn hat, muß er zumindest von einer Verarbeitungsstufe ausgenutzt werden. Dies ist die Planungsphase. Mit einem seriellen Ansatz käme man hier nicht zurande, da die Versprachlichung einer abstrakten Idee eine recht komplexe sprachliche Kodierung erforderlich macht. Diese ist bei der Begrenztheit der potentiell unterscheidbaren Laute und dem sich daraus ergebenden Linearisierungszwang nur parallel zu bewerkstelligen. Ein serielles Modell könnte dem komplexen Bedingungsgefüge in einem Satz nicht Rechnung tragen. Mit der Parallelität erübrigt sich darüber hinaus das Postulat von mehreren Verarbeitungsstufen, die unterschiedliche sprachliche Information bereitstellen. Diese Perspektive
208
ergibt sich aus der Natur der Sache. Wenn alles gleichzeitig erfolgt, besteht keine Veranlassung mehr, ein 1:1 Verhältnis von Verarbeitungsstufe und -ebene zugrunde zu legen. Schließlich ist die Parallelität auch in einem größeren Zusammenhang zu sehen. Obwohl sich in dem Rahmenmodell der Sprachproduktion die Ideation, die sprachliche Programmierung und die Artikulation aus logischen Gründen gut isolieren lassen, bestehen Anzeichen, daß auch zwischen diesen Komponenten Interaktionen stattfinden und für diese auch theoretische Vorkehrungen getroffen werden müssen. Obgleich in diesem Bereich die Parallelität an die Grenzen unserer Vorstellungskraft stößt, erscheint es unvermeidlich, das, was sich innerhalb des sprachlichen Systems als außerordentlich fruchtbar erwiesen hat, auch über seine Grenzen hinweg einzusetzen. Wie das genau aussehen kann, muß jedoch offen bleiben.
18.2.
Integration (Teil 2): Aktivation und Hyperaktivation
Der vielleicht entscheidende Vorteil des Aktivationskonzepts liegt darin, daß es sich hierbei um eine relative Größe handelt. Es kann nicht mehr nur entweder generiert oder nicht generiert werden, sondern es lassen sich Zwischenstufen konzeptualisieren. Differentielle Effekte ebenso wie die Plurikausalität des Verhaltens können mit diesem Konzept gut erfaßt werden. Ein Schwerpunkt dieser Studie lag darauf zu zeigen, wie über das Konzept der Aktivation eine Reihe sehr unterschiedlicher Phänomene auf einen Nenner gebracht werden kann. Dies ist eine zweite Form der Integration, die im folgenden im Zusammenhang dargelegt werden soll. Da die Aktivation der grundlegende und verbindende Mechanismus ist, der für alle Formen des sprachlichen Verhaltens verantwortlich zeichnet, müssen Hypothesen über den Informationsfluß in besonderem Maße aufeinander abgestimmt sein. Ein Postulat, das zur Erklärung eines bestimmten Sachverhalts aufgestellt wird, macht automatisch Vorhersagen zu anderen Problemfeldern bzw. schränkt gleichermaßen den Interpretationsrahmen in anderen Bereichen ein. Die weitreichenden Konsequenzen einer einzelnen Idee sollen jetzt am Beispiel der variablen Aktivationsstärke illustriert werden. Bei diversen Phänomenen bietet sich das Konzept der Hyperaktivation an. Hierzu zählt z.B. das vermehrte Auftreten der Versprecher in der Initialposition und in betonten Silben. Etwas weniger offensichtlich ist die Anwendung dieses Konzepts auf die Kontextidentität und die Interaktionsresistenz zwischen stimmhaften und stimmlosen Konsonanten. In bezug auf letzteres Phänomen wäre es naheliegend, daß eine verringerte Versprecherfrequenz ganz im Gegenteil Ausdruck eines Inhibitionsmechanismus ist. Diese theoretisch durchaus mögliche Interpretation wird jedoch dadurch unwahrscheinlich gemacht, daß sich in anderen Bereichen wenig Evidenz für Inhibition aufspüren läßt. Die Alternative dazu besteht darin, statt Inhibition zwischen Ungleichen Hyperaktivation zwischen Gleichen anzunehmen. Der Effekt ist der gleiche und läßt sich auch gut begründen, wenn man die drei Parameter der Stimmhaftigkeit, des Artikulationsorts und der Art für psycholinguistisch real hält und binären Parametern eine etwas andere Verarbeitungsweise
209
zubilligt (cf. Berg 1985a). Über das Konzept der Hyperaktivation läßt sich auch eine Verbindung zwischen (psycholinguistischer) Interaktionsunwilligkeit und (linguistischer) Suprasegmentalität herstellen. Auch dieses so andersartig erscheinende Phänomen kann man als Folge von Hyperaktivation erklären. Aus der Inbezugsetzung von Initialität und Suprasegmentalität läßt sich eine sehr spezifische Prognose ableiten. Wenn »undurchsichtige« Versprecher wie in (27) zur Produktion von sekundär aktivierten Elementen führen, die Initialposition aber die primären stärkt, müßte es hier zu einer Art Neutralisation kommen, da sich in dieser Position zwei konträre Effekte manifestieren. Genau das ist auch der Fall: Hier wird die Suprasegmentalität in gewissem Umfang beseitigt (Berg 1985a). Auch für das Phänomen der Doppelquelligkeit dient das Konzept der Hyperaktivation als natürliche Erklärung. Damit ist jedoch automatisch eine bestimmte Verarbeitungsstrategie für all die Erscheinungen festgelegt, bei denen identische Elemente eine entscheidende Rolle spielen, als da wären die Kontextidentität, der Trigger und die Maskierungen. Wenn also die Interpretation richtig ist, sollte man in vergleichbaren Fällen zu ähnlichen Resultaten kommen. Dies ist z.B. in bezug auf die Kontextidentität der Fall. Ihre versprecherbegünstigende Wirkung läßt sich am besten durch die Hyperaktivation sicherstellen. In einer Hinsicht unterscheidet sich dieser Effekt nun von den Maskierungen. Diese treten in aktuellen Verarbeitungspositionen auf, jener in (relativ) ruhenden. Nichts ist naheliegender, als diesem Unterschied dadurch Geltung zu verschaffen, daß in dem einen Fall der Aktivationsfluß intensiver erfolgt als in dem anderen. Folglich entsteht die Differenzierung in minimale und maximale Hyperaktivation. Erstere ist für den Kontextidentitätseffekt, letztere für die Maskierungen verantwortlich. Dies ist gewiß nicht diejenige Erklärung dieser explikativen Kategorie, die einem als erstes in den Sinn kommt. Sie erhält jedoch unabhängige Bestätigung dadurch, daß man sich der Herausforderung nicht entziehen kann, den nur quantitativen Unterschied zwischen Ähnlichkeit und Identität, so wie er sich aus dem Netzwerk ableitet, im Aktivationskonzept auszudrücken. Wollte man die Maskierungen generell als Folge des Ausbleibens von Aktivation verstehen, bliebe völlig unklar, warum die Aktivation ab einem gewissen Punkt »abknickt«. Legt man jedoch für diese Elisionen ein Zuviel an Aktivation zugrunde, kann die Kontinuität zwischen Ähnlichkeit und Identität in verarbeitungstechnischer Hinsicht gewahrt werden. Dieser Schritt macht allerdings die Zusatzannahme erforderlich, daß es oberhalb der Schwelle eine (diskrete oder fließende) Grenze gibt, jenseits welcher es zu Produktionsschwierigkeiten kommt. Auf diese Weise läßt sich der ungewöhnliche Versprechertyp der Maskierungen in das Gesamtbild des Verarbeitungsmechanismus integrieren; die Überbelastungshypothese ergibt sich aus dem getrennt entwickelten Postulat der Hyperaktivation. Es zeigt sich somit, daß verschiedenartige Phänomene zwar eine gewisse Individualität aufweisen, wie es auch durch eine geringe Anzahl von sich nicht widersprechenden Zusatzannahmen bekundet wird, sie aber andererseits eine gemeinsame Grundlage haben, die in der variablen Aktivationsstärke ihren Ausdruck findet. Auf diese Art und Weise kann die Integration von Einzelaspekten vollzogen werden. Eine solch integrative
210
Theoriebildung ist sicherlich in bezug auf ein einziges Gehirn, das alles leistet, anzustreben. Die Gefahr dieser Vorgehensweise ist allerdings auch nicht zu verkennen: Angenommen, ein Konzept wie die Hyperaktivation erweist sich in einer Hinsicht als unhaltbar, ist nicht auszuschließen, daß in einer Kettenreaktion kausal damit verknüpfte Erklärungen ins Wanken geraten. Dieses Risiko einzugehen, erscheint jedoch dadurch gerechtfertigt, daß der integrative Ansatz der vermutlich einzig realistische ist.
211 19.
Zusammenfassung und Schlußfolgerungen
Die vorliegende Dissertation stellt den Versuch dar, die Richtigkeit der McNeillschen (1979) Behauptung, daß die Sprachproduktion ein einziger komplexer Prozeß ist, so gut es geht nachzuweisen. Dies bedeutet zunächst, daß alle Versprecher auf derselben Verarbeitungsstufe zu lokalisieren sind. Die spezifischen Charakteristika einzelner Fehlergruppen müssen insofern mehr im Zusammenhang mit ihren sprachlichen Bedingungen als mit unterschiedlichen psycholinguistischen Verarbeitungsstufen gesehen werden. Von einem einzigen komplexen Prozeß zu sprechen, impliziert aber auch, daß ein serieller Informationsfluß, der das System in Scheiben schneiden würde, nicht möglich ist. Vereinheitlichend kann nur die Parallelität wirken. Sie ergibt sich aus mindestens zwei entscheidenden Argumenten. Das erste ist ein negatives. Worin bestünde der Sinn von Verarbeitungsstufen, die sich jeweils bestimmte sprachliche Teilinformationen reservieren? Er kann nur darin liegen, daß diese (postulierte) Aufgabenteilung eine Folge der Unfähigkeit einer Stufe ist, die Gesamtinformation zu bewältigen. Zu einer solchen Unterschätzung der Fähigkeiten des Produktionssystems besteht jedoch kein Anlaß. Das System muß sogar aufgrund der wechselseitigen Dependenzen gleichzeitig Zugang zu allen potentiell relevanten Informationsquellen haben. Es wird also erneut deutlich, daß die Parallelität auf ökonomische Weise dasselbe zu leisten vermag, was die Serialität, wenn überhaupt, nur mit Stufen erreichen kann. Das zweite Argument für die Parallelität läßt sich aus dem Aufbau der Sprache selbst ableiten. Auch die Linguistik kann keine klaren Grenzen zwischen den einzelnen Deskriptionsebenen ziehen, wie es besonders im Bereich der Morphophonologie deutlich wird. Hier ist die Situation vorzufinden, daß Entscheidungen auf der höheren morphologischen Ebene erst getroffen werden können, wenn Informationen über die tiefere phonologische vorliegen. Man denke hier beispielsweise an die Realisierung des Pluralmorphems im Englischen. Obwohl es unklar ist, welcher Regeltypus psychisch real ist (Derwing & Baker 1977), besteht kein Zweifel, daß die Entscheidung auf der Grundlage submorphemischer Gegebenheiten gefällt werden muß. Diese Abhängigkeit ist in einem streng seriellen Verarbeitungssystem nicht leicht abzubilden. Hingegen ist sie eine natürliche Erscheinung in einer parallelen Konzeption. Sie ermöglicht Freiheiten, also nicht abgeschlossene Verarbeitungsvorgänge, die, wie man sieht, von der Sprache auch ausgeschöpft werden. Die Hypothese lautet daher, daß der parallele Informationsfluß der ideale psychologische Mechanismus zur Produktion des komplexen Gebildes Sprache ist. Er ist es, der der Sprachstruktur die Möglichkeit gibt, so zu sein, wie sie ist. Dies ist in einer Hinsicht eine fast triviale Feststellung: Die Struktur der Sprache kann nicht anders aussehen, als ihre Produktionsbedingungen es erlauben. Immerhin ist die Sprache eine Pro-
212
duktionsleistung. Diese Feststellung beinhaltet andererseits auch die Perspektive, die Struktur der Sprache über psycholinguistische Verarbeitungsmöglichkeiten und -grenzen zu ergründen. Dies kann sich als ein komplementärer und ebenso fruchtbarer Weg wie der Versuch erweisen, sprachliche Phänomene (z.B. in der Phonologic) aus den physiologischen Bedingungen des menschlichen Sprechapparats abzuleiten. Hierin sind mögliche Fortschritte von einer reinen Deskription zu einer Explikation zu sehen. In einem Punkt ist McNeills (1979) Postulat des einen Gesamtkomplexes nur bedingt zu verwirklichen. Es erscheint unvermeidlich, zwei Verarbeitungsstufen anzusetzen, eine Planungsstufe und eine Realisationsstufe. Allerdings stehen diese nicht isoliert nebeneinander, sondern sind in ein geschlosssenes System integriert. Zum Ende der Planungsphase gilt das Prinzip der freien Fahrt, während in der Realisationsphase ein Kampf um jede Position stattfindet. Das Verhältnis zwischen beiden ist ein serielles in dem Sinn, daß nichts hauptaktiviert werden kann, was nicht bereits die Präaktivationsphase durchlaufen hat. Die Notwendigkeit des Zweistufenmodells ist im Zusammenhang mit der Wechselwirkung zwischen sprachlicher Struktur und psycholinguistischer Verarbeitungsstrategie zu sehen. Aufgrund der Komplexität der sprachlichen Äußerung und der wechselseitigen Bedingtheit aller Komponenten im System ist eine Überblicksentscheidung unvermeidlich. Damit ist gleichzeitig festgelegt, daß auf der Planungsstufe parallel verarbeitet werden muß. Die Realisation als Vorstufe zur Artikulation arbeitet hingegen primär seriell und nur sekundär parallel. Ansonsten sind sich beide Stufen aber in vieler Hinsicht ähnlich. So laufen beide über das aktivationale Netzwerk, greifen also vollständig auf dieselbe Information zurück. Nicht zuletzt wird auf diese Weise die Integration des Systems gewährleistet. Zusammenfassend läßt sich also sagen, daß die sprachproduktionellen Prinzipien, die hier als Bestandteil der mentalen Informationsverarbeitung identifiziert worden sind, in der spezifischen Struktur der Information begründet sind. D.h., die Verarbeitung erfolgt auf eine Weise, die von dem zu verarbeitenden Material determiniert wird. Dies ist gewiß eine wünschenswerte Schlußfolgerung, nur darf sie nicht dahingehend interpretiert werden, daß nur die Sprache die Verarbeitungsmechanismen beeinflußt und nicht umgekehrt. Der wahren Natur der Sprache und der Sprachverarbeitung kann nur ein interaktionaler Ansatz gerecht werden.
213 Literaturverzeichnis
Aaronson, Doris, Robert W. Rieber. 1979. Controversial issues in psycholinguistics. Psycholinguistic research: Implications and applications, hg. von Doris Aaronson, Robert W. Rieber, 3-20. Hillsdale, N.J., Lawrence Erlbaum. Aitchison, Jean. 1972. Mini-Malapropisms. British Journal of Disorders of Communication 7. 38-43. Anderson, John R. 1976. Language, memory and thought. Hillsdale, N.J., Lawrence Erlbaum. — 1983. The architecture of cognition. Cambridge, Mass., Harvard University Press. — , Peter L. Pirolli. 1984. Spread of activation. Journal of Experimental Psychology: Learning, Memory and Cognition 10. 791-798. Baars, Bernard J. 1980. On eliciting predictable speech errors in the laboratory. Errors in linguistic performance, hg. von Victoria A. Fromkin, 307-318. New York, Academic Press. — , Michael T. Motley. 1976. Spoonerisms as sequencer conflicts: evidence from artificially elicited errors. American Journal of Psychology 89. 467-484. — , Michael T. Motley, Donald G. MacKay. 1975. Output editing for lexical status in artificially elicited slips of the tongue. Journal of Verbal Learning and Verbal Behavior 14. 382-391. Bawden, H. Heath. 1900. A study of lapses. Psychological Review, Series of Monograph Supplements Vol. Ill, No. 4 (Whole No. 14). 1-122. Berg, Thomas. 1982. Rezension von Speech errors: a classified bibliography, von Anne Cutler. Braunschweig (vervielfältigt). — 1985a. Is voice a suprasegmental? Linguistics 23. 883-915. — 1985b. Rezension von Introduction aux systemes psycholinguistiques, von Eric Keller. Romanistisches Jahrbuch 36. 143-147. — 1986a. The aftermath of error occurrence: psycholinguistic evidence from cutoffs. Language and Communication 6. 195-213. — 1986b. The monophonematic status of diphthongs revisited. Phonetica 43. 198-205. — 1986c. The problems of language control: editing, monitoring, and feedback. Psychological Research 48. 133-144. — 1987a. The case against accommodation: evidence from German speech error data. Journal of Memory and Language 26. 277-300. — 1987b. A cross-linguistic comparison of slips of the tongue. Bloomington, Indiana University Linguistics Club. Bierwisch, Manfred. 1975. Psychologische Aspekte der Sprache. Berlin, Akademie-Verlag. — 1981. Linguistics and language error. Linguistics 19. 583-626. Blumstein, Sheila E. 1973. A phonological investigation of aphasic speech. The Hague, Mouton. — 1978. Segment structure and the syllable in aphasia. Syllables and segments, hg. von Alan Bell, Joan B. Hooper, 189-200. Amsterdam, North Holland. Bock, J. Kathryn. 1982. Toward a cognitive psychology of syntax: information
214
processing contributions to sentence formulation. Psychological Review 89. 1-47. 1987. An effect of the accessibility of word forms on sentence structures. Journal of Memory and Language 26. 119-137. Bond, Zinny S. 1969. Constraints on production errors. Papers from the fifth regional meeting of the Chicago Linguistic Society, hg. von Robert J. Binnick, Alice Davison, Georgia M. Green, Jerry L. Morgan, 302-305. Chicago, Chicago Linguistic Society. Boomer, Donald S., John Laver. 1968. Slips of the tongue. Speech errors as linguistic evidence, hg. von Victoria A. Fromkin, 120-131. The Hague, Mouton, 1973. Broecke, Marcel P.R. van den, Louis Goldstein. 1980. Consonant features in speech errors. Errors in linguistic performance, hg. von Victoria A. Fromkin, 47-65. New York, Academic Press. Brown, Roger, David McNeill. 1966. The "tip of the tongue" phenomenon. Journal of Verbal Learning and Verbal Behavior 5. 325-337. Butterworth, Brian. 1980. Evidence from pauses in speech. Language Production. Vol. 1: Speech and talk, hg. von Brian Butterworth, 155-176. London, Academic Press. — 1981. Speech errors: old data in search of new theories. Linguistics 19. 627-662. Cearley, Alvin. 1974. The only phonological rule ordering principle. Papers from the parasession on natural phonology, hg. von Anthony Brück et al., 30-42. Chicago, Chicago Linguistic Society. Chafe, Wallace L. 1970. Meaning and the structure of language. Chicago, University of Chicago Press. Cherubim, Dieter. 1980. Abweichung und Sprachwandel. Fehlerlinguistik, hg. von Dieter Cherubim, 124-152. Tübingen: Niemeyer. Chomsky, Noam. 1965. Aspects of the theory of syntax. Cambridge, Mass., MIT Press. — 1972. Language and mind. (Enlarged edition). New York, Harcourt Brace Jovanovich. — , Morris Halle. 1968. The sound pattern of English. New York, Harper & Row. Clark, Herbert H., Eve V. Clark. 1977. Psychology and language. An introduction to psycholinguistics. New York, Harcourt Brace Jovanovich. Cohen, Antonie. 1966. Errors of speech and their implications for understanding the strategy of language users. Speech errors as linguistic evidence, hg. von Victoria A. Fromkin, 88-92. The Hague, Mouton, 1973. Collins, Allan M., Elisabeth F. Loftus. 1975. A spreading-activation theory of semantic processing. Psychological Review 82. 407-428. Cooper, William E., Jeanne Paccia-Cooper. 1980. Syntax and speech. Cambridge, Mass., Harvard University Press. — , J.R. Ross. 1975. World order. Papers from the parasession on factionalism, hg. von R.E. Grossmann, L.J. San, T.J. Vance, 63-111. Chicago, Chicago Linguistic Society. Crompton, Andrew. 1981. Syllables and segments in speech production. Linguistics 19, 663-716. Cutler, Anne. 1981. The reliability of speech error data. Linguistics 19. 561-582. — 1982a. (Hg.). Slips of the tongue and language production. The Hague, Mouton. — 1982b. Speech errors: a classified bibliography. Bloomington, Indiana University Linguistics Club. — 1983. Speakers' conception of the function of prosody. Prosody: models and measurements, hg. von Anne Cutler, D. Robert Ladd, 79-91. Heidelberg, Springer. — , David Fay. 1982. One mental lexicon, phonologically arranged: comments on —
215 Hurford's comments. Linguistic Inquiry 13. 107-113. , Stephen D. Isard. 1980. The production of prosody. Language Production. Vol. 1: Speech and talk, hg. von Brian Butterworth, 245-269. London, Academic Press. Danks, Joseph H. 1977. Producing ideas and sentences. Sentence Production. Developments in research and theory, hg. von Sheldon Rosenberg, 229-258. Hillsdale, N.J., Lawrence Erlbaum. Delattre, Pierre. 1965. Comparing the phonetic features of English, French, German and Spanish. Heidelberg, Julius Groos. Dell, Gary S. 1977. Slips of the mind. The fourth LACUS-Forum, hg. von Michel Paradis, 69-74. Columbia, S.C., Hornbeam Press. — 1980. Phonological and lexical encoding in speech production: an analysis of naturally occurring and experimentally elicited speech errors. Unpublished doctoral dissertation. University of Toronto. — 1984. Representation of serial order in speech: evidence from the repeated phoneme effect in speech errors. Journal of Experimental Psychology: Learning, Memory and Cognition 10. 222-233. — 1986. A spreading-activation theory of retrieval in sentence production. Psychological Review 93. 283-321. — im Druck. The retrieval of phonological forms in production: tests of predictions from a connectionist model. Journal of Memory and Language 27. — , Peter A. Reich. 1977. A model of slips of the tongue. The third LACUS-Forum, hg. von RJ. Di Pietro, E.L. Blansitt, 448-455. Columbia, S.C., Hornbeam Press. — , Peter A. Reich. 1980. Toward a unified model of slips of the tongue. Errors in linguistic performance, hg. von Victoria A. Fromkin, 273-286. New York, Academic Press. — , Peter A. Reich. 1981. Stages in sentence production: an analysis of speech error data. Journal of Verbal Learning and Verbal Behavior 20. 611-629. — , J. Segal, E. Bergman. 1985. Effects of frequency and vocabulary type on phonological speech errors. Paper presented at the annual meeting of the Psychonomic Society, Boston. Derwing, Bruce L., William J. Baker. 1977. The psychological basis for morphological rules. Language learning and thought, hg. von John Macnamara, 85-110. New York, Academic Press. Diver, William. 1979. Phonology as human behavior. Psycholinguistic research: Implications and applications, hg. von Doris Aaronson, Robert W. Rieber, 161-186. Hillsdale, N.J., Lawrence Erlbaum. Donegan, Patricia J., David Stampe. 1979. The study of natural phonology. Current approaches to phonological theory, hg. von Daniel A. Dinnsen, 126-173. Bloomington, Indiana University Press. Dressier, Wolfgang U. 1976. Tendenzen in kontaminatorischen Fehlleistungen (und ihre Beziehung zur Sprachgeschichte). Die Sprache 22. 1-10. Egeth, Howard E. 1966. Parallel versus serial processes in multi dimensional stimulus discrimination. Perception and Psychophysics 1. 245-252. Ellis, Andrew W. 1979. Speech production and short-term memory. Psycho linguistics series, Vol. 2. Structures and processes, hg. von John Morton, John C. Marshall, 157187. London, Elek Science Press. — 1982. Spelling and writing (and reading and speaking). Normality and pathology in cognitive functions, hg. von Andrew W. Ellis, 113-146. London, Academic Press. Fant, Gunnar, Björn Lindblom. 1961. Studies of minimal speech and sound units. —
216 Speech Transmission Laboratory. (Quarterly Progress Report 2, Royal Institute of Technology, 1-11. Fay, David. 1980. Performing transformations. Perception and production of fluent speech, hg. von Ronald A. Cole, 441-468. Hillsdale, N.J., Lawrence Erlbaum. — 1981. Substitutions and splices: a study of sentence blends. Linguistics 19. 717-749. — , Anne Cutler. 1977. Malapropisms and the structure of the mental lexicon. Linguistic Inquiry 8. 505-520. Fodor, Janet D., Jerry A. Fodor, Merrill F. Garrett. 1975. The psychological unreality of semantic representations. Linguistic Inquiry 6. 515-531. Fodor, Jerry A., Thomas G. Bever, Merrill F. Garrett. 1974. The psychology of language. An introduction to psycholinguistics and generative grammar. New York, McGraw-Hill. — , Merrill F. Garrett, Edward C.T. Walker, C.H. Parkes. 1980. Against definitions. Cognition 8. 263-367. Fromkin, Victoria A. 1971. The non-anomalous nature of anomalous utterances. Language 47'. 27-52. — 1973a. Introduction. Speech errors as linguistic evidence, hg. von Victoria A. Fromkin, 11-45. The Hague, Mouton. — 1973b. Appendix. A sample of speech errors. Speech errors as linguistic evidence, hg. von Victoria A. Fromkin, 243-269. The Hague, Mouton. — 1975. A linguist looks at "A linguist looks at schizophrenic language". Brain and Language 2. 498-503. — 1978. Speech errors: slips of the tongue, ear, pen and hand. Proceedings of the twelfth international congress of linguists. Vienna, 1977, hg. von Wolfgang U. Dressler, Wolfgang Meid, 120-122. Innsbruck, Innsbrucker Beiträge zur Sprachwissenschaft. — 1980. Introduction. Errors in linguistic performance, hg. von Victoria A. Fromkin, 112. New York, Academic Press. — 1983. Aspects of a model of speech production: evidence from speech errors. Sound structures. A Festschrift for Antonie Cohen, hg. von Marcel P.R. van den Broecke, Vincent van Heuven, Wim Zonneveld, 105-112. Dordrecht, Foris. — 1984. Untitled. Contribution to Symposium 1. Proceedings of the tenth international congress of phonetic sciences, hg. von Marcel P.R. van den Broecke, Antonie Cohen, 143-150. Dordrecht, Foris. Fudge, Eric C. 1987. Branching structure within the syllable. Journal of Linguistics 23. 359-377. Garnham, Alan, Richard C. Shillock, Gordon D.A. Brown, Andrew J.D. Mill, Anne Cutler. 1981. Slips of the tongue in the London-Lund corpus of spontaneous conversation. Linguistics 19. 805-817. Garrett, Merrill F. 1975. The analysis of sentence production. The psychology of learning and motivation. Vol. 9., hg. von Gordon H. Bower, 133-177. New York, Academic Press. — 1976. Syntactic processes in sentence production. New approaches to language mechanisms, hg. von Roger J. Wales, Edward C.T. Walker, 231-256. Amsterdam, North Holland. — 1980. Levels of processing in sentence production. Language Production. Vol. 1: Speech and talk, hg. von Brian Butterworth, 177-220. London, Academic Press. — 1982. Production of speech: observations from normal and pathological language use. Normality and pathology in cognitive functions, hg. von Andrew W. Ellis, 19-76. London, Academic Press. — , Mary-Louise Kean. 1980. Levels of representation and the analysis of speech
217 errors. Juncture, hg. Mark Aronoff, Mary-Louise Kean, 79-89. Cambridge, Mass., MIT Press. Gerber, S.E., Susan Vertin. 1969. Comparative frequency counts of English phonemes. Phonetica 19. 133-141. Glushko, Robert J. 1979. The organization and activation of orthographic knowledge in reading aloud. Journal of Experimental Psychology: Human Perception and Performance 5. 674-691. Goldman-Eisler, Frieda. 1968. Psycholinguistics: experiments in spontaneous speech. New York, Academic Press. Goldstein, Louis. 1980. Categorical features in speech perception and production. Journal of the Acoustical Society of America 67. 1336-1348. Goldstein, Mymon. 1968. Some slips of the tongue. Psychological Reports 22. 1009-1013. Grammont, Maurice. 1895. La dissimilation consonantique dans les langues indoeuropeennes et dans les langues romanes. Dijon. Griffen, Toby D. 1981. Slips of the tongue and metathesis in a nonsegmental model. The seventh LACUS-Forum, 138-144. Columbia, S.C., Hornbeam Press. Halle, Morris, Jean-Roger Vergnaud. 1980. Three-dimensional phonology. Journal of Linguistic Research 1. 83-105. Harley, Trevor A. 1983. Producing models of speech production. Cardiff (vervielfältigt). — 1984. A critique of top-down independent levels models of speech production: evidence from non-plan-internal speech errors. Cognitive Science 8. 191-219. — 1985. The intrusion of environmental material into normal speech. Coventry (vervielfältigt). Hinton, Geoffrey E. 1981. Implementing semantic networks in parallel hardware. Parallel models of associative memory, hg. von Geoffrey E. Hinton, James A. Anderson, 161-186. Hillsdale, N.J., Lawrence Erlbaum. Hirsch, Eike Christian. 1981. Durch die Bluse. Der Stern 26. 88. Hockett, Charles F. 1967. Where the tongue slips, there slip I. Speech errors as linguistic evidence, hg. von Victoria A. Fromkin, 93-119. The Hague, Mouton, 1973. Hörmann, Hans. 1976. Meinen und Verstehen. Grundzüge einer psychologischen Semantik. Frankfurt, Suhrkamp, 1978. Hotopf, W.H. Norman. 1968. Unintentional errors in speech and writing as clues to processes underlying word production. London (vervielfältigt). — 1983. Lexical slips of the pen and tongue: what they tell us about language production. Language Production. Vol. 2: Development, writing and other language processes, hg. von Brian Butterworth, 147-199. London, Academic Press. Householder, Fred W. 1979. How different are they? Current approaches to phonological theory, hg. von Daniel A. Dinnsen, 252-264. Bloomington, Indiana University Press. Hurford, James R. 1981. Malapropisms, left-to-right listing, and lexicalism. Linguistic Inquiry 12. 419-423. Johnson-Laird, Philip. 1977. Psycholinguistics without linguistics. Tutorial essays in psychology. Vol. 1., hg. von Norman S. Sutherland, 75-135. Hillsdale, N.J., Lawrence Erlbaum. Kainz, Friedrich. 1956. Psychologie der Sprache. 4. Band: Spezielle Sprachpsychologie. Stuttgart, Enke. Keller, Eric. 1980. Planning and execution in speech production. Recherches linguistiques a Montreal 13. 34-51. — 1985. Introduction aux systemes psycho linguistiques. Chicoutimi, Quebec, Gaetan Morin.
218 Kempen, Gerard. 1977. Conceptualizing and formulating in sentence production. Sentence production. Developments in research and theory, hg. von Sheldon Rosenberg, 259-274. Hillsdale, N.J., Lawrence Erlbaum. — , Pieter Huijbers. 1983. The lexicalization process in sentence production and naming: indirect election of words. Cognition 14. 185-209. Kettemann, Bernhard. 1980. On the reality of segmental and transsegmental features. Folia Linguistica 14. 437-452. Kupin, Joseph J. 1979. Tongue twisters as a source of information about speech production. Bloomington, Indiana University Linguistics Club, 1982. Ladefoged, Peter. 1983. Cross-linguistic studies of speech production. The production of speech, hg. von Peter F. MacNeilage, 177-188. New York, Springer. Lamb, Sidney M. 1966. Outline of stratificational grammar. Washington, D.C., Georgetown University Press. Lashley, Karl S. 1951. The problem of serial order in behavior. Psycholinguistics. A book of readings, hg. von Sol Saporta, 180-198. New York, Holt, Rinehart and Winston, 1961. Lattey, Elsa. 1979. Utterance potential, code switching and speech errors. Le Langage et I'Hommell. 51-57. Laver, John. 1970. The production of speech. New horizons in linguistics, hg. von John Lyons, 53-75. Harmondsworth, Penguin. — 1979. The neuromuscular representation of speech. Proceedings of the ninth international congress of phonetic sciences, Copenhagen, 1979, hg. von Eli Fischer-J0rgensen, 200. Copenhagen, Institute of Phonetics. — 1980. Slips of the tongue as neuromuscular evidence for a model of speech production. Temporal variables in speech, hg. von Hans W. Dechert, Manfred Raupach, 21-26. The Hague, Mouton. Legenhausen, Lienhard. 1975. Fehleranalyse und Fehlerbewertung. Berlin, CornelsenVelhagen & Klasing. Lenneberg, Eric H. 1967. Biological foundations of language. Übers.: Biologische Grundlagen der Sprache. Frankfurt, Suhrkamp, 1972. Lindsley, James R. 1975. Producing simple utterances: how far ahead do we plan? Cognitive Psychology 7. 1-19. Linell, Per. 1979. Psychological reality in phonology. Cambridge, Cambridge University Press. Lockwood, D.G. 1972. Introduction to stratificational linguistics. New York, Harcourt, Brace, Jovanovich. MacKay, Donald G. 1969. Forward and backward masking in motor systems. Kybernetik 6. 57-64. — 1970a. Spoonerisms: the structure of errors in the serial order of speech. Speech errors as linguistic evidence, hg. von Victoria A. Fromkin, 164-194. The Hague, Mouton, 1973. — 1970b. Phoneme repetition in the structure of languages. Language and Speech 13. 199-213. — 1971. Stress pre-entry in motor systems. American Journal of Psychology 84. 35-51. — 1972a. The structure of words and syllables: evidence from errors in speech. Cognitive Psychology 3. 210-227. — 1972b. Hierarchic specification of words: evidence from paradigmatic speech errors. Paper delivered to the conference on the problems of serial order in behavior, Michigan. — 1973. Complexity in output systems: evidence from behavioral hybrids.
219 American Journal of Psychology 86. 785-806. 1980. Speech errors: retrospect and prospect. Errors in linguistic performance, hg. von Victoria A. Fromkin, 319-332. New York, Academic Press. — 1982. The problems of flexibility, fluency and speed-accuracy trade-off in skilled behavior. Psychological Review 89. 483-506. — 1986. Self-inhibition and the disruptive effects of internal and external feedback in skilled behavior. Generation and modulation of action patterns, hg. von Herbert Heuer, Christoph Fromm, 174-186. Berlin, Springer. — , Daniel Kempler. 1984. Rezension von Slips of the tongue and language production, hg. von Anne Cutler. Language 60. 436-441. Maclay, H., Charles E. Osgood. 1959. Hesitation phenomena in spontaneous speech. Word 15. 19-44. Marslen-Wilson, William D. 1975. Sentence perception as an interactive parallel process. Science 189. 226-228. McClelland, James L., David E. Rumelhart. 1981. An interactive activation model of context effects in letter perception: Part 1: An account of basic findings. Psychological Review 88. 375-407. McNeill, David. 1975. The place of grammar in a theory of performance. Developmental psycholinguistics and communication disorders, hg. von Doris Aaronson, Robert W. Rieber, 171-177. New York, New York Academy of Sciences. — 1979. The conceptual basis of language. New York, Halsted Press. Meier, Helmut. 1967. Deutsche Sprachstatistik. Hildesheim, Olms. Meillet, Antoine. 1922. De quelques fautes. Bulletin de la Societe linguistique de Paris 23. 98-99. Menn, Lise, Loraine K. Obler. 1982. Exceptional language data as linguistic evidence: an introduction. Exceptional language and linguistics, hg. von Loraine K. Obler, Lise Menn, 3-14. New York, Academic Press. Meringer, Rudolf. 1908. Aus dem Leben der Sprache. Versprechen, Kindersprache, Nachahmungstrieb. Berlin, Behrs. — , Karl Mayer. 1895. Versprechen und Verlesen. Eine psychologisch-linguistische Studie. Stuttgart, Göschen. Mills, Anne E. 1981. It's easier in German, isn't it? The acquisition of tag questions in a bilingual child. Journal of Child Language 8. 641-647. Mohanan, Karuvannur P. 1982. Lexical Phonology. Bloomington, Indiana University Linguistics Club. Motley, Michael T. 1974. Acoustic correlates of lies. Western Speech 38. 81-87. — 1985. The production of verbal slips and double entendres as clues to the efficiency of normal speech production. Journal of Language and Social Psychology 4. 275-293. — 1986. On replicating the SLIP technique: a reply to Sinsabaugh and Fox. Communication Monographs 53. 342-351. — , Bernard J. Baars. 1975a. Encoding sensitivities to phonological markedness and transitional probability: evidence from spoonerisms. Human Communication Research 2. 353-361. — , Bernard J. Baars. 1975b. Toward a model of integrated editing processes in prearticulatory encoding: evidence from laboratory generated verbal slips. Paper presented at the Speech Communication Association, Houston. — , Bernard J. Baars, Carl T. Camden. 1981. Syntactic criteria in prearticulatory editing: evidence from laboratory-induced slips of the tongue. Journal of Psycholinguistic Research 10. 503-522. —
220
—
, Bernard J. Baars, Carl T. Camden. 1983. Experimental verbal slip studies: a review and an editing model of language encoding. Communication Monographs 50. 79-101. — , Carl T. Camden. 1985. Nonlinguistic influences on lexical selection: evidence from double entendres. Communication Monographs 52. 124-135. Naucler, Kerstin, Ewa Söderpalm. 1981. Slips of the tongue, slips of the pen — slips of the mind. Working Papers in Linguistics/Phonetics, Lund University 21, 95-108. Nöth, Winfried. 1979. Errors as a discovery procedure in linguistics. International Review of Applied Linguistics 17. 61-76. Nooteboom, Sieb G. 1967. Spontane fonologische versprekingen. IPO Technical Progress Report No. 93. Eindhoven. — 1969. The tongue slips into patterns. Speech errors as linguistic evidence, hg. von Victoria A. Fromkin, 144-156. The Hague, Mouton, 1973. — 1981. Lexical retrieval from fragments of spoken words: beginnings vs. endings. Journal of Phonetics 9. 407-424. Norman, Donald A., Daniel G. Bobrow. 1975. On data-limited and resource-limited processes. Cognitive Psychology 7. 44-64. Peters, Ann M. 1977. Language learning strategies: Does the whole equal the sum of the parts? Language 53. 560-573. Pike, Kenneth L. 1967. Language in relation to a unified theory of the structure of human behavior. The Hague, Mouton. Ratcliff, Roger, Gail McKoon. 1981. Does activation really spread? Psychological Review 88. 454-462. Rauch, Fred. 1978. Mit dem Gongschlag ist es 6 Mark 30. Rosenheim, Rosenheimer Verlagshaus. — 1981. Gongschlag Nr. 2. Rosenheim, Rosenheimer Verlagshaus. Reich, Peter A. 1977. Evidence for a stratal boundary from slips of the tongue. Forum Linguisticum 2. 119-132. Roberts, E.W. 1975. Speech errors as evidence for the reality of phonological units. Lingua 35. 263-296. Rockmann, Hermann. 1981. Persönliche Mitteilung. Rumelhart, David E., James L. McClelland. 1982. An interactive activation model of context effects in letter perception: Part 2: The contextual enhancement effect and some tests and extensions of the model. Psychological Review 89. 60-94. Saffran, Eleanor M., Myrna F. Schwartz, Oscar S.M. Marin. 1980. Evidence from aphasia: isolating the components of a production model. Language Production. Vol. 1: Speech and talk, hg. von Brian Butterworth, 221-241. London, Academic Press. Schelvis, Marian. 1985. The collection, categorization, storage and retrieval of spontaneous speech error material at the Institute of Phonetics, Utrecht. Progress Report of the Institute of Phonetics at the University of Utrecht 10, 3-14. Selkirk, Elisabeth. 1984. Phonology and syntax. The relationship between sound and structures. Cambridge, Mass., MIT Press. Shallice, Tim, Janina McGill. 1978. The origins of mixed errors. Attention and Performance VII, hg. von Jean Requin, 193-208. Hillsdale, N.J., Lawrence Erlbaum. Shattuck, Stefanie. 1975. Speech errors and sentence production. Unpublished doctoral dissertation. MIT Cambridge, Mass. Shattuck-Hufnagel, Stefanie. 1979. Speech errors as evidence for a serial-ordering mechanism in sentence production. Sentence processing: psycholinguistic studies presented to Merrill Garrett, hg. von William E. Cooper, Edward C.T. Walker,
221
295-342. Hillsdale, N.J., Lawrence Erlbaum. 1982a. Three kinds of speech error evidence for the role of grammatical elements in processing. Exceptional language and linguistics, hg. von Loraine K. Obler, Lise Menn, 133-142. New York, Academic Press. — 1982b. Position constraints on interacting segments in elicited errors favor the word over the stressed syllable. Journal of the Acoustical Society of America 72, Supplement 1. 48. — 1982c. Position of errors in tongue twisters and spontaneous speech: evidence for two processing mechanisms? MIT Research Laboratory of Electronics, Speech Communication, Working Papers 1. 1-8. — 1983a. Sublexical units and suprasegmental structure in speech production planning. The production of speech, hg. von Peter F. MacNeilage, 109-136. New York, Springer. — 1983b. The word-position similarity constraint on segmental speech errors: further experimental results. Journal of the Acoustical Society of America 74, Supplement 1. 117. — 1987. The role of word-onset consonants in speech production planning: new evidence from speech error patterns. Motor and sensory processes of language, hg. von Eric Keller, Myrna Gopnik, 17-51. Hillsdale, N.J., Lawrence Erlbaum. — , Dennis H. Klatt. 1979a. The limited use of distinctive features and markedness in speech production: evidence from speech error data. Journal of Verbal Learning and Verbal Behavior 18. 41-55. — , Dennis H. Klatt. 1979b. Distinctive feature constraints on phoneme errors of different types. Proceedings of the ninth international congress of phonetic sciences, Copenhagen, 1979, hg. von Eli Fischer-Jorgensen, 317. Copenhagen, Institute of Phonetics. Smith, Ian. 1982. Abstractness in phonology: The English velar nasal. Linguistics 20. 391-409. Söderpalm, Ewa. 1979. Speech errors in normal and pathological speech. Lund, Gleerup. Söderpalm Talo, Ewa. 1980. Slips of the tongue in normal and pathological speech. Errors in linguistic performance, hg. von Victoria A. Fromkin, 81-86. New York, Academic Press. Soll, Ludwig. 1974. Gesprochenes und geschriebenes Französisch. Berlin, Erich Schmidt. Stampe, David. 1973. A dissertation on natural phonology. Bloomington, Indiana University Linguistics Club, 1979. Stemberger, Joseph P. 1982. Syntactic errors in speech. Journal of Psycholinguistic Research 11. 313-345. — 1983a. The nature of /r/ and /!/ in English: evidence from speech errors. Journal of Phonetics 11. 139-147. — 1983b. Speech errors and theoretical phonology. Bloomington, Indiana University Linguistics Club. — 1983c. Inflectional malapropisms: form-based errors in English morphology. Linguistics 21. 573-602. — 1983d. Lexical access and serial order in sentence production. Paper given at the fifth annual conference of the Cognitive Science Society, Rochester. — 1984. Length as a suprasegmental: evidence from speech errors. Language 60. 895913. — 1985a. The lexicon in a model of language production. New York, Garland. — 1985b. Phonological rule ordering in a model of language production. Bloomington, —
222
Indiana University Linguistics Club. im Druck. The reliability and replicability of naturalistic speech error data: a comparison with experimentally induced errors. The psychology of errors: a window on the mind?, hg. von Bernard J. Baars. New York, Plenum Press. — , Rebecca Treiman. 1986. The internal structure of word-initial consonant clusters. Journal of Memory and Language 25. 163-180. Taft, Marcus, Kenneth I. Forster. 1976. Lexical storage and retrieval of polymorphemic and polysyllabic words. Journal of Verbal Learning and Verbal Behavior 15. 607-620. Townsend, James T. 1971. A note on the identifiability of parallel and serial processes. Perception and Psychophysics 10. 161-163. — 1972. Some results concerning the identifiability of parallel and serial processes. British Journal of Mathematical Statistical Psychology 25. 168-199. Turvey, Michael T., Robert E. Shaw, William Mace. 1978. Issues in the theory of action: degrees of freedom, coordinative structures and coalitions. Attention and Performance VII, hg. von Jean Requin, 557-595. Hillsdale, N.J., Lawrence Erlbaum. Tweney, Ryan D., Sharon Tkasz, Sally Zaruba. 1975. Slips of the tongue and lexical storage. Language and Speech 18. 388-396. Tyler, Lorraine K. 1981. Serial and interactive-parallel theories of sentence processing. Theoretical Linguistics 8. 29-65. Väsquez, Carol A. 1981. Sentence processing: evidence against the serial, independent stage assumption. Journal of Psycholinguistic Research 10. 363-374. Weimer, Hermann. 1925. Psychologie der Fehler. Leipzig, Julius Klinghardt. Wells, Rulon. 1951. Predicting slips of the tongue. Speech errors as linguistic evidence, hg. von Victoria A. Fromkin, 82-87. The Hague, Mouton, 1973. Wickelgren, Wayne A. 1969. Context-sensitive coding, associative memory and serial order in (speech) behavior. Psychological Review 76. 1-15. Wiese, Richard. 1983. Psycholinguistische Aspekte der Sprachproduktion. Hamburg, Buske. — 1987. Versprecher als Fenster zur Sprachstruktur. Studium Linguistik 21. 45-55. Wogenstein, Peter G. 1977. Slips of the tongue and the speech production process. An analysis of tongue slips. Unveröffentlichte Staatsarbeit. Universität Gießen. Wundt, Wilhelm. 1900. Völkerpsychologie. Band 1: Die Sprache. Leipzig, Engelmann. Zwicky, Arnold M. 1975. The strategy of generative phonology. Phonologica 1972, hg. von Wolfgang U. Dressler, F.V. Mares, 151-165. München, Fink. —