Psychologie des Lernens: Methoden, Ergebnisse, Anwendungen [Reprint 2020 ed.] 9783112312452, 9783112301180

227 89 20MB

German Pages 289 [296] Year 1970

Table of contents :
Vorwort
Inhaltsübersicht
1. Sozialkulturelle Bedingtheit der Auffassung vom Lernen
2. Lernen als Forschungsgegenstand
3. Vorläufige Skizzierung allgemeiner Charakteristika vom Lernen
4. Frühe Lernforschung: Gedächtnis, Merken und Reproduktion
5. Lernen nach dem Konzept von bedingendem Signal und bedingter Reaktion
6. Lernen am Erfolg
7. Lernen durch Einsicht
8. Lernen und Motivation
9. Lernen im behavioristischen Assoziationismus
10. Lernen und Verhalten
11. Lernen von gefordertem und ausgegebenem Verhalten
12. Lernen und kognitives Verhalten
13. Lernen von Emotionen und Entlastung durch Verbalisierung
14. Die Zwei-Faktoren-Theorie des Lernens
15. Lernen als Veränderung der Verhältniswahrscheinlichkeit von Reizauswahl und Reaktionsausgabe
16. Übung
17. Lerntransfer und Generalisation
18. Vergleichen und Unterscheiden: Diskriminations-Lernen
19. Vergessen und Verlernen
20. Lernkapazitäten
21. Biologie und Pathologie des Lernens
22. Organisationsformen des Lernens
23. Lernen und Kommunikation
24. Lernen in semantischen Bezugssystemen
25. Kybernetische Modelle des Lernens
26. Lernen als Aktion und Interaktion
Autorenverzeichnis
Stichwortverzeichnis

Recommend Papers

Psychologie des Lernens: Methoden, Ergebnisse, Anwendungen 9783110835519, 9783110036916

173 100 16MB Read more

Die Mayaforschung: Geschichte, Methoden, Ergebnisse 9783964562289

Un estudio fundamentado sobre el desarrollo de la investigación sobre los Maya, los distintos ramos de la investigación

141 49 21MB Read more

Satellitengeodäsie: Grundlagen, Methoden und Anwendungen 9783110849776, 9783110100822

174 78 15MB Read more

Systemtheoretische Literaturwissenschaft: Begriffe - Methoden - Anwendungen 9783110219012, 9783110219005

This handbook gives an overview of systems theory in the field of literature, culture and media studies. The individual

153 112 4MB Read more

Psychologie: Theorien - Methoden - Arbeitsfelder. Ein Grundkurs 3499554194

Die 34 Beiträge dieses «Grundkurses» geben die Hauptströmungen der gegenwärtigen Psychologie wieder, analysieren die fru

187 87 19MB Read more

Photogrammetrie: Band 2 Verfeinerte Methoden und Anwendungen 9783110906158, 9783110181630

147 56 32MB Read more

Information und Kaufentscheidung: Methoden und Ergebnisse empirischer Konsumentenforschung [Reprint 2019 ed.] 9783110867459, 9783110104783

124 31 11MB Read more

Die Psychologie des Totalitarismus 9783958905436

Der Bestseller aus Belgien: Totalitarismus überwinden und persönliche Freiheit finden Totalitarismus ist kein Zufall und

147 91 2MB Read more

Künste dekolonisieren: Ästhetische Praktiken des Lernens und Verlernens 9783839457726

De- und postkoloniale ästhetische Praktiken haben als Interventionen das Kunstfeld nachhaltig verändert und einen wichti

108 36 7MB Read more

Die 15 Gebote des Lernens: Schule nach PISA 9783863126117

Der populäre Bildungskritiker Peter Struck setzt sich mit den Ergebnissen der aktuellen Bildungsstudien und der durch si

107 3 2MB Read more

Psychologie des Lernens: Methoden, Ergebnisse, Anwendungen [Reprint 2020 ed.]
9783112312452, 9783112301180

Author / Uploaded
Otto Walter Haseloff
Eduard Jorswieck

0 0 0
Like this paper and download? You can publish your own PDF file online for free in a few minutes! Sign Up

File loading please wait...

Citation preview

HASELOFF —

JORSWIECK

PSYCHOLOGIE DES L E R N E N S

PSYCHOLOGIE DES LERNENS Methoden, Ergebnisse, Anwendungen

Dr. med. OTTO WALTER HASELOFF o. Professor f ü r Psychologie und

Dr. med. EDUARD JORSWIECK o. Professor f ü r Sonderpädagogik

W A L T E R DE G R U Y T E R & CO vormals G. J. Gösdien'sche Verlagsbuchhandlung — J . Guttentag, Verlagsbuchhandlung Georg Reimer — Karl J . Trübner — Veit & Comp.

B E R L I N 1970

© Copyright 1970 by Walter de Gruyter & Co, vormals G. J . Gösdien'sche Verlagshandlung — J . Guttentag, Verlagsbuchhandlung — Georg Reimer — Karl J . Trübner — Veit & Comp., Berlin 30 — Alle Rechte, auch die des auszugsweisen Nachdrucks, der fotomechanischen Wiedergabe, der Herstellung von Mikrofilmen und der Übersetzung vorbehalten. — ArchivNr. 5619701 — Printed in Germany. — Satz und Drude: Buchdruckerei Franz Spiller, 1 Berlin 36 — Einband : W. Hanisch, Berlin-Zehlendorf

Vorwort Die Lernforschung hat in Deutschland an Bedeutung gewonnen. Dies einmal, weil sich Pädagogik und Schule in unserem Lande verstärkt wissenschaftliche Erkenntnisse zum Zweck der Optimierung von Unterrichtsprozessen und für die Verbesserung prüfbarer Lernergebnisse zunutze machen wollen. Aber auch weil die Psychologie, die Verhaltensforschung und die Sozialwissenschaften — von der ökonomisch orientierten Konsumforschung über die Soziologie bis hin zu den politischen Wissenschaften in zunehmendem Maße zur Anwendung lerntheoretischer Erklärungsmodelle gelangt sind. Das vorliegende Buch ist vorwiegend für Studenten und für Lehrer geschrieben, denen es eine nicht überspezialisierte, aber dennoch wissenschaftlich zuverlässige Information über Stand und Entwicklung der Lernforschung sowie weiterführendes Quellenmaterial für die Bessergestaltung von Lehr- und Lernprozessen bereitstellen will. Daher sind besonders jene lerntheoretischen Forschungen berücksichtigt worden, die praktisch nützlich sein können. Unsere Absicht war es, die Darstellung für alle diese Lehrenden und Lernenden lesbar zu halten und damit ein Stück weit in der Darstellung selbst die dargestellten Lernprinzipien zu verwirklichen. Die Eingangskapitel geben eine Hinführung auf einige sozialkulturelle Bestimmungsgrößen der Lernforschung sowie vorbereitende allgemeinere Kennzeichnungen der Struktur von Lernprozessen. Der erste Teil des Buches gibt die Darstellung explizierter Lerntheorien in annähernd historischer Abfolge, während die letzten 11 Kapitel Lernvorgänge ihren theoretisch zu bestimmenden Bedingungen und ihren praktischen Konsequenzen gemäß beschreiben. Gedankt sei an dieser Stelle den Studenten, die durch Mitarbeit und Wissenwollen dem Manuskript zur Fertigstellung verholfen haben; aber auch den Lehrern und Kollegen, die durch Nachfrage, Kritik und Anregung den Fortschritt der Arbeit gefördert haben. Berlin-Zehlendorf / Dezember 1969 O T T O W A L T E R HASELOFF / EDUARD JORSWIECK

Inhaltsübersicht 1. Sozialkulturelle Bedingtheit der Auffassung vom Lernen..

1

2. Lernen als Forschungsgegenstand

4

3. Vorläufige Skizzierung allgemeiner Charakteristika vom Lernen

13

4. Frühe Lernforschung: Gedächtnis, Merken und Reproduktion

16

5. Lernen nach dem Konzept von bedingendem Signal und bedingter Reaktion

28

6. Lernen am Erfolg

36

7. Lernen durch Einsicht

43

8. Lernen und Motivation

53

9. Lernen im behavioristischen Assoziationismus

65

10. Lernen und Verhalten

70

11. Lernen von gefordertem und ausgegebenem Verhalten

92

12. Lernen und kognitives Verhalten

103

13. Lernen von Emotionen und Entlastung durch Verbalisierung 112 14. Die Zwei-Faktoren-Theorie des Lernens

125

15. Lernen als Veränderung der Verhältniswahrscheinlidikeit von Reizauswahl und Reaktionsausgabe 141 16. Übung

152

17. Lerntransfer und Généralisation

160

18. Vergleichen und Unterscheiden: Diskriminations-Lernen . . 168 19. Vergessen und Verlernen

174

20. Lernkapazitäten

186

21. Biologie und Pathologie des Lernens

193

22. Organisationsformen des Lernens

205

23. Lernen und Kommunikation

213

VIII

Inhaltsübersicht

24. Lernen in semantischen Bezugssystemen

225

25. Kybernetische Modelle des Lernens

241

26. Lernen als Aktion und Interaktion

259

Autorenverzeichnis

275

Stichwortverzeichnis

278

1. Sozialkulturelle Bedingtheit der Auffassung vom Lernen Das Wort „Lernen" besitzt für die Mehrzahl der Menschen einen zwiespältigen Klang. Es löst Gefühle ernsthafter Zielstrebigkeit aus und erweckt Erinnerungen an mancherlei Erfolgserlebnisse und erhebende Einsichten. Zugleich aber klingen beim Wort „Lernen" auch vielfältige Vorstellungen an von mühseliger Anstrengung, raschem Vergessen und ausbleibendem Erfolg. Gefühlsmäßig spannungsvolle Gehalte und Einstellungen sind übrigens auch mit dem Wort „Arbeit" in ganz ähnlicher Weise verbunden. Die Gefühlsverwandtschaft der Worte „Lernen" und „Arbeit" ist wohl nicht zufällig, sie beruht vielmehr auf besonderen kulturhistorischen Entwicklungen. Diese sind dafür verantwortlidi, daß „Lernen" jahrhundertelang als das Privileg einer führenden Gesellschaftsschicht galt, während die handarbeitende Bevölkerung — vielfach bis heute — Bücherlesen und „Lernen" als eine anspruchsvolle Form von verhüllter Bequemlichkeit und von Nichtstun auffaßt. In neuerer Zeit aber meldet sich zunehmend eine Haltung an, von der aus strenges und ausdauerndes Lernen als geistlos, als überfordernd, ja als eigentlich unzumutbar erscheint. In diesem Zusammenhang ist interessant, daß in unserer Sprache der Begriff „Auswendiglernen" einen sehr negativen Beiklang besitzt, während die gleiche Leistung im Englischen höchst auszeichnend „learning by heart" genannt wird. Gefühlsmäßige Ambivalenzen sind zweifellos daran mitbeteiligt, daß in der zeitgenössischen deutschen Pädagogik ein gewisser Widerwillen gegen Lernen überhaupt vorherrscht. Eine ganze Reihe pädagogischer Programmatiker definiert eine von ihnen abgelehnte ältere Unterrichtspraxis bekanntlich als „Lernschule" und sucht sie dadurch abzuwerten. Ursprünglich war aber in Deutschland begonnen worden, Lernprozesse empirisch zu untersuchen. Die Mehrzahl der ersten bekannteren deutschen Experimentalpsychologen — wie E B B I N G H A U S , G. E . M Ü L L E R oder M E U M A N N — hat sich vorwiegend mit experimentellen Lern- und Gedächtnisstudien beschäftigt. Wissenssoziologisch interessant ist hierbei, daß ausschließlich die Gesetze verbalen Lernens neutraler Inhalte sowie das wertfreie Zahlengedächtnis zum Untersuchungsgegenstand wurden. Aus der jeweiligen Wahl des Zugangsweges zur Problematik des Lernens ergeben sich interessante kultursoziologische Aspekte. So blieben in Deutschland alle diejenigen Formen des Lernens weniger beachtet, 1 Haseloff-Jorswiedc, Psychologie

2

Sozialkulturelle Bedingtheit der Auffassung vom Lernen

die nicht den Charakter der Aneignung vorher genau festgelegten Gedächtnismaterials hatten. Lernerfolge wurden demgemäß ausschließlich am Grad der Aneignung der vorgelegten Wort- und Zahlenfolgen gemessen. Die deutsche Lernpsychologie erforschte also die Gesetze der passiven Rezeption eines vorgeschriebenen und bereits genormten „Lehrstoffes". Von einem deutlich andersartigen Ansatz ging die Lernforschung in den angelsächsischen Ländern aus. Vor allem die amerikanischen Psychologen interessierten sich weniger für die passive Aufnahme vorgenormten Gedächtnismaterials. Statt dessen galt ihre Aufmerksamkeit mehr jenem Lernen, das sich in der aktiven Auseinandersetzung mit alltäglichen Lebenssituationen vollzieht. Diese beiden Grundauffassungen des Lernens — einmal als passivrezeptives Aufnehmen und zum anderen als aktive Selbstbelehrung durch das eigene probierende Verhalten — spiegeln sich deutlich auch im Zugriff gegenüber der Problematik der Übung. „Üben" bedeutet in der einen Blickweise mechanisierte Wiederholung, die zu wachsender Erinnerungssicherheit und erhöhter Reproduktionsgeschwindigkeit führt. In der anderen Sicht erscheint Übung als ein suchendes, probierendes und auswählendes Verhalten, bei dem schließlich der erfolgreichste Weg der Problemlösung gefunden und befestigt wird. Die Unterschiedlichkeit dieser Grundauffassungen von Lernen und Üben ergibt sich aus zwei kulturell bedingt unterschiedlichen Mentalitäten. Die Überbetonung der Rezeptivität im Lernen und die Einengung des Gegenstandes der Lernforschung auf die Akquisition kulturell genormten Gedächtnismaterials innerhalb spezifischer Institutionen — vor allem der Schule — entspricht der Eigenart einer „präskriptiven" Gesellschaft, in der Aktivität weitgehend durch Vorschriften geformt ist. Demgegenüber verbindet sich die experimentelle und probabilistische Interpretation des Lernens mit dem Bezugssystem einer weniger traditionsbestimmten, dafür aber dynamischen und durch beweglichere Mentalität bestimmten Gesellschaft. Dergleichen standortbedingte Sichten haben die Anerkennung der Tatsache erschwert, daß „Lernen" sehr unterschiedliche Formen der Anpassung und Aktivität bezeichnet. Es ist wissenschaftlich wenig ertragreich, einen Teilaspekt des Lernens zuungunsten aller anderen zu verabsolutieren. Vielmehr gilt es festzuhalten, daß es tatsächlich unterschiedliche Formen des Lernens gibt. Forschendes Bemühen sollte sich mehr als bisher auf die objektive Prüfung und vorurteilslose Siditung und Ordnung aller im Bereich der Lernforschung gewonnenen Ergebnisse richten. Im untenstehenden Schema geben wir eine historisch orientierte Zusammenstellung der Fortschritte der Analysen und der Theorien des Lernens, soweit sie näher in den folgenden Kapiteln behandelt werden.

Sozialkulturelle Bedingtheit der Auffassung vom Lernen

3

Geschichte der Lernpsychologie Verfasser

Datum

EBBINGHAUS

1885

EHRENFELS

1890

THORNDIKE

1898 1913

PAWLOW

1899

KATZ

1911

WERTHEIMER

1904 1912

KÖHLER

1917

THORNDIKE

1947 1932 1935

Experimentiersituation

Lernhypothese

Sinnlose Silben Mensch Transponierte Melodien, Mensdi Problemkasten Hühner, Katzen

Verhalten als Funktion der Wiederholung Gestaltqualität

1921 1942 1938 1953

Futter Hund Farbenkombinationen, Mensdi Wortassoziationen B e wegungstäuschung Mensch Futtererlangung Schimpansen Katzen Labyrinth Wörterlernen, Kinder Problemkasten Katzen Skinnerbox Ratten, Tauben

TOLMAN

1932 1938

Labyrinth Ratten

HULL

1940 1952

Labyrinth Ratten

OSGOOD

1953

UNDERVOOD

1954

Wörter, semantisches Differential Menschen Wortlisten Menschen

ESTES

1957

GUTHRIE SKINNER

l1

Optische Stimuli Menschen

Versuch und Irrtum, Bereitschaft; Befriedigungs- und Störungsauslöser Bedingter Reflex, Auslöschung Perzeptuelle Muster Organisierte Beziehungen

Einsichtiges Lernen, Bedeutungsverleihung Isomorphismus Effekt der Nachwirkung und der Zusammengehörigkeit, Erfolgslernen Kontiguität; Assoziative Hemmung Operante Konditionierung; Spontane und herausgelockte Reaktionen und Responses. Autoinstruktion Intervenierende Variable Zweckmäßiges Verhalten, kognitive »Karten", Erwartung Reinforcement; HabitHierarchie; Zielgradient; Extinktion Mediating-(Vermittlungs-) Theorie Assoziationsstiftung, Assoziationsnetz und Auswahl Wahrscheinlichkeit der Reizselektion und der Reaktionsauswahl

2. Lernen als Forschungsgegenstand Erste „psychologische", wenn auch noch vorwissensdiaftliche Experimente sind zugleich Anfänge lernpsychologischen Forschens. Eine vom Lernen unbeeinflußte Sprachentwicklung beim Kleinkind sollte sichtbar gemacht werden. Solch Experimente, die dem ägyptischen König Psammetich I. und dem Kaiser Friedrich II. von Hohenstaufen zugeschrieben werden, mißlangen. Dies nicht nur, weil es keine kulturunabhängige Ursprache gibt, sondern weil Menschen ohne ein Mindestmaß an Lernen lebensunfähig bleiben. Während Tieren in Form von Automatismen und Instinkten ein zunächst hinreichendes Verhaltensgesamt mitgegeben ist, muß der Mensch seine Instinktlosigkeit langwierig durch Lernen ausgleichen. Der biologische Zwang zum Lernen vermittelt dem Menschen aber zugleich die Chance zu intelligentem Verhalten und zu einer fast unbegrenzten Variabilität des Handelns. Menschen und in unterschiedlichem Umfang auch Tiere lernen, sich im Dasein zu halten. Trotz dieser umfassenden vitalen Funktion des Lernens ergeben sich nicht unerhebliche Schwierigkeiten, einen Begriff „Lernen" gültig zu definieren. Gelegentlich ist die beliebige Veränderung irgendeines Verhaltens, mit dem auf eine bestimmte Situation geantwortet wurde, auf Lernen zurückgeführt worden. Ein solcher sehr allgemeiner Gebrauch des Wortes verkennt jedoch, daß sich vielfach Verhaltensänderungen auch gegenüber identischen Situationen ergeben, die durch erfahrungsfreie biologische Prozesse — vor allem durch Wachstum, Reifung und Alterung — zustande kommen, ohne daß also Lernvorgänge beteiligt sind. Darüber hinaus gibt es weitere Verhaltensänderungen, die unerlernt sind. Ursachen solcher Verhaltenswechsel sind vor allem: kurzzeitige hormonal-vegetative Regulationsprozesse, Veränderungen der Reaktionslage durch Pharmaka, kurzfristige somatisch bedingte Zustandsänderungen (Ermüdung, Stress) und schließlich auch körperliche Erkrankungen. Damit wird deutlich, daß eine Überdehnung des Lernbegriffes — so daß er dann jegliche Änderung von Verhaltensweisen umfaßt — nur geeignet ist, Verwirrung zu stiften und dann als Begriff „unhandlich" und „ungeeignet" ist. Vor allem ist ein derart überdehnter Lernbegriff ungeeignet zur Beschreibung derjenigen komplexen Prozesse, die das Lernen verbaler Informationen ermöglichen. Umgekehrt ist es unzweifelhaft verfehlt, Lernen — wie es bei uns vielfach noch im Sinne älterer pädagogischer Denkweisen üblich ist — allein

L e r n e n als Forsdiungsgegenstand

5

auf Auswendiglernen von institutionell vorausgelesenen verbalen Informationen und auf die Aneignung kulturell geschätzter Fertigkeiten zu beschränken. Lernprozesse dergestalt nur auf ein in der Schule erwartbares Verhalten einzuschränken, ist für psychologische Forschung und als Basis für ein Erklärungsmodell unzureichend, da die Mehrzahl aller von der neueren Lernforschung gewonnenen Ergebnisse und Einsichten unberücksichtigt bliebe. Sowohl die Überdehnung des LernbegrifFes wie seine unsachgemäße Einengung entstammen historischen Gründen: EBBINGHAUS und andere deutsche Gedächtnisforscher haben, in Anknüpfung an die englische Assoziationspsychologie, das Lernen noch ausschließlich mit der Rezeption verbalen Materials gleichgesetzt. Demgegenüber haben frühe amerikanische Lerntheoretiker — wie etwa WATSON — das gesamte Verhalten des Organismus auf „Lernen" zurückgeführt. Nach dieser frühen behavioristischen Auffassung ist Verhalten zunächst zufällig und wird erst durch Lernen ausgeformt. Diese Unterschiedlichkeit der Grundauffassungen macht es erforderlich, genauer zu prüfen, welche Befunde, Einsichten und Problemaspekte der Lerntheoretiker für eine Gesamttheorie des Lernens relevant sind. Beginnen wir unseren Überblick mit der deutschen Gedächtnispsychologie: EBBINGHAUS ließ in seinen klassischen Experimenten Versuchspersonen sinnfreie Silben lernen. Diese Methode war folgerichtig, da es ihm nur um die allgemeinen Gesetze des Lernens ging. Individuell motivierte Assoziationen waren deshalb möglichst auszuschalten. In der Praxis hat sich dann jedoch bald gezeigt, daß entgegen der experimentellen Anordnung alle Versuchspersonen dazu übergingen, sich eine sinnvolle Organisation des Gedächtnismaterials zu schaffen. Hierzu wurden derartige inhaltlich sinnlose Silbenreihen rhythmisiert, durdi logische Hilfsvorstellungen gruppiert oder durch spontane Einfälle in persönlich sinnvolle Beziehung gebracht. Durch derartige unprogrammgemäße Hilfen organisiert sich ein inhaltlich bedeutungsloses Lernmaterial dergestalt, daß der Lernende sehr viel weniger vitale Energie, psychische Aktivität und Übungszeit aufzubringen hat, als wenn er rein mechanisch ohne diese Hilfen auswendig lernte. Diese Tatsache zeigt, daß gerade das verbale Lernen — im Gegensatz zur Grundannahme von EBBINGHAUS — keineswegs unpersönlichen, stets identischen Gesetzen folgt. Vielmehr erweist sich gerade am Lernen informationslosen Gedächtnismaterials indirekt, welche große Bedeutung aktive Gerichtetheit und individuelle Ordnung für den Lernerfolg haben. So zeigt sich, daß wir beim Erlernen eines informationslosen Materials etwa zehnmal soviel Wiederholungen und Lernaufwand benötigen wie für erzählenden oder argumentierenden Text. Dennoch erbrachten die Untersuchungen der Schule von EBBINGHAUS viele, heute oft zu Unrecht entwertete Ergebnisse.

6

L e r n e n als Forsdiungsgegenstand

G. E. MÜLLER und seine Schüler erwiesen dann später, daß Leistungen vom Charakter des Wiedererkennens weniger dem Vergessen ausgesetzt sind als die rein gedankliche Reproduktion. Praktisch und theoretisch gleich bedeutsam war vor allem der von JOST geführte Nachweis, daß mehrere, über einen längeren Zeitraum verteilte Wiederholungen zu schnellerem Lernen und besserem Behalten führen, als einmalige Lernarbeit mit gehäuften Wiederholungen, wie sie naiv von Schulkindern bevorzugt wird. V o r allem aber zeigte ein anderer Mitarbeiter G. E. MÜLLERS, NARZISS ACH, daß die Einstellung des Lernenden, sein „Lernwille", einen erheblichen Einfluß auf den Lernerfolg hat. Darüber hinaus konnte ACH nachweisen, daß um so schneller gelernt wird, je wirksamer ordnungsbildende und richtungsgebende Faktoren das Lernmaterial durchgliedern. Derartige, auch Lernabläufe organisierende Faktoren, nannte ACH „determinierende Tendenzen". In ihnen haben wir eine theoretische Vorform der später dann als sehr wichtig erkannten Lernmotive zu sehen. Etwa gleichzeitig haben mehrere stark weltanschaulich bestimmte Gegenbewegungen gegen den abstrakten Elementarismus der deutschen Assoziationspsychologie eingesetzt. Einige formierten sich zur Ganzheitslehre der Leipziger Schule oder zur Gestaltpsychologie der Berliner Schule. Eine bleibende Bedeutung hat die Gestaltpsychologie unter der F ü h r u n g v o n WERTHEIMER u n d KÖHLER g e w o n n e n . N i c h t n u r f ü r die

Strukturierung der Wahrnehmungen, sondern auch für Lernen und Erinnerung galt nach dieser Auffassung das Prinzip der spontanen Selbstregulation des psychischen Geschehens. Damit erscheint Lernen nicht mehr als die Bahnung und umständebedingte Kombination elementarer Assoziationen, sondern als spontane Bildung mehr oder weniger stabiler Gedächtnisgestalten. Von hier aus war eine einleuchtende Interpretation des Einsichtigen Lernens möglich, das als der Prozeß einer Neustrukturierung des Erlebnisfeldes in Richtung auf Einfachkeit, Eindeutigkeit und Beherrschbarkeit gedeutet wurde. Bleibende Wirkung auf die Theorie des Lernens und des Gedächtnisses sind weiterhin von der Psychoanalyse ausgegangen. Vor allem die wichtige Einsicht, daß das Vergessen oft affektiv bedingt ist und die Folge eines aktiven und genau „gezielten" Veränderungsprozesses darstellt. Damit war der erste und entscheidende Hinweis darauf erfolgt, daß Vergessen und Lernen in engstem Wirkungszusammenhang mit der Dynamik von Bedürfnissen und Motiven steht. Die lerntheoretisch grundlegende Erkenntnis, daß nicht nur Gewohnheiten, Fertigkeiten und Wissen, sondern auch Gefühle gelernt werden, folgt aus der Empirie der Psychoanalyse. Die neurotische Veränderung der Persönlichkeit erweist sich als eine langfristige Fehlanpassung, die aus früh gelernten Angst- und Schuld-

Lernen als Forschungsgegenstand

7

gefühlen sowie aus einem inadäquaten Festhalten infantiler Gefühlserwartungen hervorgeht. Gelernte und dann habitualisierte Gefühlserwartungen erschweren oder verhindern ein wirklichkeitsangemessenes, reifes Verhalten. Den drei großen mitteleuropäischen Konzeptionen der Psychologie: der Assoziationsschule, der Gestalttheorie und der Psychoanalyse ist gemeinsam, daß sie Lernen, Einsicht und Gedächtnis von der Dynamik menschlichen Erlebens her interpretieren. In anderen Ländern dagegen ist Lernen von einer mehr physiologischen Konzeption her untersucht worden. Den wichtigsten Ausgangspunkt bildeten dabei die Experimente und die aus ihnen abgeleiteten Theoreme des russischen Physiologen I. P. Pawlow. P a w l o w ging davon aus, daß Lebewesen mit ihrer Umwelt durch Leistungen des Nervensystems verbunden sind. Dabei erfolgt die biologisch vorgegebene Beantwortung primärer äußerer Reize auf dem Wege des „unbedingten Reflexes". Bei höheren Tieren aber werden die angeborenen Reflexe mehr oder weniger überbaut durch Systeme erlernter Kopplungen von sekundären Reizen mit angeborenen Reaktionen. Diese Kopplungen, die P a t i o t „bedingte Reflexe" nennt, verbinden also gelernte „Signale" für biologisch nützliche oder schädliche Reize mit unerlernten Verhaltensantworten. P a w l o w analysierte in seinen Experimenten vor allem das Erlernen und Verlernen solcher Kopplungen von gelernten Signalen mit angeborenen Reaktionen. Die jeweilige Gesamtheit unbedingter und bedingter Reize wird von Reflexologen „erstes Signalsystem" genannt. Doch kommt beim Menschen ein gleichfalls erlerntes „zweites Signalsystem" hinzu, dessen Leistung den qualitativen Unterschied zwischen menschlichem und tierischem Verhalten erklärt. Nur der Mensch verfügt über dieses zweite Signalsystem in Form von gehörten, geschriebenen und gesprochenen Worten. Das Wort ist für die Schule Pawlows das Signal der Signale. Die entscheidende Bedeutung des zweiten Signalsystems ergibt sich für den Menschen aus der Notwendigkeit eines kooperativen Handelns in der Gruppe, das nicht möglich ist ohne das zweite Signalsystem der sprachlichen Kommunikation. Die Betrachtungsweise und die experimentelle Arbeit der Behavioristen hatte im Anfang große Ähnlichkeit mit derjenigen der russischen Reflexologen. Auch sie experimentierten zunächst fast ausschließlich mit Tieren und gingen in gleicher Weise wie die PAWLOW-Schule von elementaren Lerneinheiten aus. Diese wurden aber nicht so eng physiologisch aufgefaßt wie von der PAWLOW-Schule, sondern als „Assoziationen" bezeichnet. Jedoch versteht die behavioristische Schule unter „Assoziation" nicht wie die deutsche Gedächtnispsychologie eine wechselseitige Verknüpfung von Vorstellungen oder Empfindungen. „Assoziation" ist hier vielmehr die (gelernte) Verbindung äußerer Reize mit (gleichfalls gelernten) Verhaltensreaktionen.

8

Lernen als Forsdiungsgegenstand

Nach dieser Auffassung ist das gerade beobachtbare Verhalten gegenüber einer beliebigen Situation zunächst zufällig. Erst problematische Situationen, in denen ein Bedürfnis entweder stimuliert oder seine Befriedigung verhindert wird, lösen eine starke, jedoch nur wenig koordinierte Aktivität aus. Aus einer Vielzahl von zur Verfügung stehenden Reaktionen erweist sich dann eine bestimmte Verhaltensweise als erfolgreich. Diese Verhaltensweise tritt bei fortschreitendem Lernen in ähnlichen Situationen schließlich mit immer größerer Wahrscheinlichkeit auf. Dieses erstmalig von THORNDIKE beschriebene „Lernen am Erfolg" manifestiert sich also in der wachsenden Häufigkeit passender und im Seltenerwerden unpassender Reaktionen. Zur Klärung der hier vorliegenden Gesetzmäßigkeiten bediente sich THORNDIKE der Methodik des sogenannten Problemkäfigs. Um aus einem solchen Käfig herauszukommen und zu ihrem Futter zu gelangen, muß beispielsweise eine Ratte eine Tür öffnen, die durch ein System von mehreren Klinken verriegelt ist. Die Mechanik ist für das Tier nicht durchschaubar. Das Tier vollführt nun eine große Zahl zufälliger Bewegungen, unter denen ebenso zufällig auch richtige sind. Bei jeder Wiederholung des Versuches werden die falschen also erfolglosen Bewegungen seltener, während die richtigen immer rascher und häufiger auftreten. Nach einer bestimmten Zeit treten nur noch die richtigen Bewegungen auf. Die Ratte hat gelernt — allerdings ohne jegliche gedankliche Einsicht. Zu Unrecht ist gegen Untersuchungen dieser Art eingewandt worden, daß sie zwar bei Ratten sinnvoll sind, nicht aber auf den Menschen beziehbar seien. Tatsächlich aber vollzieht sich das Lernen einer großen Zahl menschlidier Fertigkeiten von der Art des Radfahrens, des Schwimmens oder Autofahrens, aber auch des Lesens und Schreibens gemäß den Verlaufsordnungen eines Lernens nach Versuch und Irrtum. Die beiden wichtigsten von THORNDIKE gefundenen Gesetzmäßigkeiten sind das Frequenzgesetz und das Effektgesetz, das die seiegierende Wirkung des Erfolges beschreibt. Während EBBINGHAUS noch glaubte, daß es beim Lernen auf die Anzahl der Wiederholungen ankäme, konnte THORNDIKE nachweisen, daß der Lernerfolg entscheidend abhängt von den Rückwirkungen der aus einem Verhalten sich ergebenden Erfolge und Mißerfolge, Belohnungen und Strafen. Ein wichtiges Forschungsergebnis THORNDIKES besteht schließlich in dem Nachweis, daß aktivitätsbegünstigende Gesamteinstellungen des Lernenden sowie das bereits vorher Gelernte jeden Lernerfolg stark beeinflussen. Die letztgenannten Einsichten THORNDIKES zeigen, daß der Behaviorismus schon früh von dem engen Deutungsschema des Lernens als Bildung und Verstärkung assoziativer Beziehungen zwischen einem Stimulus und einer Reaktion abgekommen ist. Vielmehr wird der innere Gesamtzustand des Lernenden und sein vorangegangenes Lernen als wich-

Lernen als Forschungsgegenstand

9

tige Variable in dem Bedingungsgefüge erkannt, das über den jeweils aktuellen Lernerfolg entscheidet. Den bedeutungsvollsten Ausbau erfuhr die behavioristische Konzeption durch den

1952 verstorbenen

CLARK LEONHARD H U L L .

HÜLL

ersetzte die umgangssprachlichen Beschreibungsmodelle des älteren Behaviorismus durch eine präzis formalisierte Zeichensprache. In diesem Versuch einer axiomatisdi-deduktiv aufgebauten und völlig exakten Theorie der Psydiologie überhaupt geht es um die vollständige Aufklärung des Lernens am Erfolg. Die wichtigsten Variablen innerhalb dieses exakten theoretischen Modells von HULL sind: 1. 2. 3. 4.

das Reizgefüge als Repräsentation einer Situation, die Reaktion als Verhaltensantwort des Organismus, das Bedürfnis als Repräsentation innerer Spannungen sowie schließlich die Belohnung in F o r m der erreichten Bedürfnisreduktion.

Jede durch ein Verhalten des Organismus zustande gekommene Spannungsreduktion führt zu einer Verstärkung der entsprechenden Verhaltensbereitschaft. Diesem „Law of Reinforcement" weist HULL eine entscheidende Stellung in seinem System zu. Durch wiederholte Reaktionsverstärkung bildet sich ein Gewohnheitspotential, von dessen Stärke die Wahrscheinlichkeit der Auslösung und die Intensität von Verhaltensweisen abhängen. Die Leistungsfähigkeit dieses Lernmodells hat die Schule HULLS durch Hunderte von Untersuchungen der funktionalen Abhängigkeiten der verschiedenen Modellvariablen experimentell verifiziert. Die gesamte Theorie HULLS, von ihm abschließend in dem Werk „A Behavior System" dargestellt, bestand schließlich aus siebzehn Postulaten und aus fünfzehn Sätzen. Die Hauptleistung dieser gewaltigen Forschungsarbeit besteht in der präzisen Aufdeckung jener intervenierenden Variablen, die zwischen beobachtbaren Situationsmerkmalen und gleichfalls beobachtbaren Verhaltensweisen eine erklärende Verbindung herzustellen gestatten. Erst mit Hilfe dieser intervenierenden Variablen wie Triebstärke, Habitstärke oder Reaktionspotential wurde es möglich, Verhalten vorherzuberechnen. Heute darf gesagt werden, daß HULL die erste streng verifizierbare und zugleich logisch völlig eindeutige psychologische Theorie geschaffen hat, daß aber lerntheoretisch relevante Sachverhalte wie der der Einsicht, der des Lernens emotionaler Reaktionen oder sozialnormativer Anpassungen sowie das Erlernen von Bedürfnissen selbst in diesem System unberücksichtigt geblieben sind. Daher verdienen diejenigen modernen Lerntheoretiker unser besonderes Interesse, die ihre Forschungsarbeit auf die Klärung eben dieser Fragen gerichtet haben. Besondere Bedeutung hat in diesem Zusammenhang SKINNER, der in sehr produktiver Weise reaktives und operatives Verhalten einander gegenübergestellt hat. Reaktives Verhalten wird unwillkürlich aus-

10

L e r n e n als Forschungsgegenstand

gegeben, nur seine auslösenden Reize sind für den Beobachter erkennbar. SKINNER betont, daß rein reaktives Verhalten für den Menschen praktisch weitgehend bedeutungslos ist, da menschliches Verhalten vorwiegend operativen Charakter hat. Dies beruht auf einer z. T . gezielten Auswahl von Reizen und orientiert sich mehr an künftigem Erfolg als an der aktuellen Reizkonfiguration. Der Fortschritt des Lernens wird meßbar an der Vergrößerung der „Reflexreserve". SKINNER versteht darunter die Gesamtzahl von Reaktionen, die gegenüber einer Reizsituation überhaupt zur Verfügung stehen. Lernen vollzieht sich vor allem als induktive Konditionierung oder Generalisierung oder als Unterscheidung zwischen verhaltensauslösenden Reizsituationen. Um eine Verschmelzung der behavioristischen Lerntheorie mit der gestaltpsychologischen Konzeption bemüht sidi EDWARD CHANCE TOLMAN. E r geht davon aus, daß Lebewesen auch in einfachen Lernsituationen kaum auf singulare Reize reagieren, und daß sie auch nicht festgelegte Reaktionsketten lernen. Gelernt werden vielmehr verhaltensorientierende Signale. An der Konfiguration von Signalen wird Einsicht gewonnen. Lernen besteht in dieser Auffassung also nicht im Aufbau von starren Reiz-Reaktions-Verbindungen, sondern im Aufbau von Signalsystemen im Nervensystem, die als Orientierungspläne das Verhalten lenken. Für diese Zeichengestalt-Theorie von TOLMAN spricht, daß selbst Ratten sich in Lernsituationen kaum völlig chaotisch verhalten, sondern meist systematisch variierend den Weg zur Problemlösung suchen. Wichtig ist auch, daß Tiere und Menschen fast immer mehr lernen, als in ihrem augenblicklich problemlösenden Verhalten zu erkennen ist. Ein solches Lernen geschieht vielfach auch in Situationen, in denen keine Motivspannung besteht. Allerdings kann das Gelernte dann erst in Situationen angewendet werden, die einen Bedürfnisdrude auslösen. TOLMAN betont beispielsweise, daß viele unserer individuellen und sozialen Fehlanpassungen wie Regression, Fixierung oder Ablenkung der Aggression auf Fremdgruppen von einem gelernten Orientierungsplan abhängen, der zu eng ist und der infolge zu heftiger Bedürfnisspannungen und zu intensiver Versagungen aufgestellt worden ist. Ausgehend einerseits von HÜLL, andererseits von FREUD, haben DOLLARD u n d M I L L E R d i e b e h a v i o r i s t i s c h e n M e t h o d e n u n d K o n z e p t i o n e n i n

eine theoretisch-konstruktive Verbindung mit der Psychoanalyse gebracht. Dabei ist ihre Untersuchung des Lernens emotionaler Reaktionen von besonderer Bedeutung. Von hier aus gelangten DOLLARD und MILLER zu einer ersten lerntheoretischen Interpretation der Entstehung von neurotischen Störungen und Persönlichkeitsfehlentwicklungen. Emotionale Probleme treten als Folge starker, für den Betreffenden nicht auflösbarer Triebspannungen auf. Der „adäquat angepaßte"

11

Lernen als Forschungsgegenstand

Mensch hat — vor allem durch Abwägen, Denken und intelligentes Verhalten — gelernt, derartige Triebspannungen zur Lösung zu bringen. Dabei ist die Sprache von entscheidender Bedeutung. N u r mit ihrer Hilfe können Verdrängungen aufgehoben werden. Das Erlernen von Verbalisierung unbewußter Konflikte ermöglicht differenzierende Unterscheidung und Nachdenken, Voraussicht und realitätsangepaßtes Planen. D a das Unbewußte in moderner Terminologie identisch ist mit dem Bereich des unverbalisierten Erlebens, kann sozial normiertes Verhalten nur soweit gelernt werden, wie die Sprache reicht. In diesem Zusammenhang ist es bedeutungsvoll, daß sexuelles oder aggressives Erleben in unserer Sprache nur sehr unzureichend verbalisiert werden kann. Mit DOLLARD und MILLER — so kann gesagt werden — ist die moderne Lernforschung aus dem Laboratorium herausgetreten und geht wichtigen praktischen Bewährungen entgegen. Die experimentelle Lernforschung mußte lange Zeit zwangsläufig davon abstrahieren, daß sich menschliches Lernen stets innerhalb eines sozialkulturellen Institutionsgefüges vollzieht und von diesem sozialen System mitgesteuert wird. In vereinfachten, modellartigen Experimentalsituationen aber lassen sich soziale Faktoren schon auf Grund ihrer Komplexität nur schwer nachbilden. Deshalb gelang es erst in den letzten Jahren, Grundformen sozialen Lernens experimentell zu studieren. So konnte HEBB zeigen, daß und wie Ratten — dem Menschen darin weitgehend vergleichbar — soziale Rangordnungen und auch soziales Rivalisieren lernen. Dabei wurde deutlich, daß selbst elementare Lernprozesse je nach der Stellung in der Gruppe unterschiedlich ablaufen. In hierzu genau entsprechender Weise gelang Sozialpsychologen wie K U R T LEWIN d e r N a c h w e i s , d a ß d e r i n d i v i d u e l l e L e r n e r f o l g

weit-

gehend abhängt vom zwischenmenschlichen Klima einer Gruppe und von der in ihr jeweils dominanten Mentalität. Auch fast alle Befunde der modernen Kulturanthropologie lassen sich nur so deuten, daß die von Kultur zu Kultur wechselnden Charakterzüge, Werteinstellungen und Mentalitäten vom einzelnen mehr oder weniger erfolgreich gelernt werden in seiner Auseinandersetzung mit den Institutionen und Verhaltenserwartungen der Gesellschaft. Schließlich bleibt noch auf die lerntheoretische Bedeutung der Kybernetik hinzuweisen, die die Struktur sowohl elementarer wie diejenige komplexer Lernprozesse am Modell elektronischer Rechengeräte oder sich selbst steuernder „mechanischer Schildkröten" analysiert. Derartige v o n ASHBY, U T T L E Y u n d G R E Y WALTER k o n s t r u i e r t e

Lernmaschinen

stellen Apparate dar, die Umgebungsreize registrieren, speichern und als Erfahrungen zur Lenkung künftigen Verhaltens selbständig auswerten. Auf mehrdeutige Situationen antworten diese Geräte mit unentschiedenen Reaktionen, die dem ratlosen Verhalten von Lebewesen vergleichbar sind, die unter Affektspannung und emotionalem Kon-

12

Lernen als Forschungsgegenstand

fliktdruck stehen. Derartige Geräte können sogar Gewohnheiten aufbauen, die neurotischen Anpassungsstörungen gleichzusetzen sind. An kybernetischen Verhaltensmodellen wie den mechanischen Aktionsapparaten konnten schließlich die Minimalbedingungen für das Auftreten sozialer Verhaltensweisen und sozialen Lernens studiert werden. Darüber hinaus gelang es, die allgemeinen wahrscheinlichkeitstheoretischen Aspekte von Lernen überhaupt sichtbar zu machen.

3. Vorläufige Skizzierung allgemeiner Charakteristika vom Lernen Vor unserer ausführlicheren Darstellung des Lerngeschehens wird im folgenden eine annähernd axlomatische Definition von Lernen gegeben; dies soll als vorweggenommenes Konzept die einzelnen Seiten des Lernvollzugs und ihre Zuordnung zu unterschiedlichen theoretischen Ansätzen erleichtern. Das Wort Lernen bezeichnet diejenige intervenierende Variable, die längerfristige Neuanpassungen an äußere Umstände, an soziale Systeme und an innere Zustände erklärt. Diese vorgegebene Minimaldefinition ist so hinreichend allgemein gehalten, daß sie für alle langfristigen Neuanpassungen offener Systeme, also für Tiere, Menschen, soziale Gruppen sowie elektronischer Repräsentationen derselben Geltung hat. Dabei kennzeichnet „langfristig" weder den Zeitbedarf der Lernvorgänge, noch die Wirkungszeit des Gelernten, sondern soll gegenüber den kurzfristigen, selbstregulatorischen physiologischen Anpassungen abgehoben werden. Zur genaueren Verdeutlichung dieser grundlegenden Konzeption von Lernen werden einige Prinzipien zusätzlich benötigt: 1. Ausschließlich organisch bedingte Reaktionen in den Bereichen des Verhaltens und Erlebens — seien sie kurzfristig und reversibel oder langfristig und irreversibel — besitzen nicht den Charakter von Lernen. 2. Lernen wird erkennbar a) am Auftreten bisher nicht beobachteter Verhaltensweisen und bisher nicht geäußerter Erlebnisreaktionen, b) an Veränderungen der Wahrscheinlichkeit, mit der Verhaltensweisen und Erlebnisreaktionen gegenüber mehrfach begegnenden Signalen, Umständen oder sozialen Situationen aktualisiert werden. 3. Zustandekommen, Umfang und Richtung von Neuanpassungen werden mitbestimmt durch unerlernte oder vorgängig erworbene Verhaltensmuster. Solche Dispositionen bilden ein individuelles Reaktionspotential, das fortlaufend durch Lernen verändert, vermehrt oder differenziert wird. 4. Neuanpassungen vom Charakter des Lernens kommen nicht zustande ohne die Rezeption von in Zeichen transponierten Informationen. (Informationen hier verstanden als Äquivalenzklasse

14

5.

6.

7.

8.

9.

10.

11.

Vorläufige Skizzierung allgemeiner Charakteristika vom Lernen

gleichbedeutender Signalmengen von Bewußtseinstatsachen und faßbaren Fakten.) Zustands- und Umständeänderungen anmeldende Repräsentationen, auch Informationen erster Art genannt, bilden zusammen mit Informationen über Informationen, auch als Informationen zweiter Art bezeichnet (Beispiel: Wissen), das individuelle Informationspotential, das durch Lernen vermehrt, verringert, vereinfadit oder differenziert wird. Aufnahme, Wirksamkeit und Wiederherstellbarkeit von Informationen erster und zweiter Art werden — unabhängig von ihrer Eigenbeschaffenheit — vom Umfang und von der Struktur des bestehenden individuellen Informationspotentials bestimmt. Gegenüber komplexen Situationen und Problemlagen vollzieht sich Lernen a) operativ als gerichtete Umgruppierung und Organisation von Einheiten des Informationspotentials oder b) explorativ als Zuwachs an kognitiven, differenzierenden und korrigierenden Informationen zum bestehenden Informationspotential. Kurzfristige oder langfristige Verschiebungen im Anpassungsgleichgewicht zwischen lernendem System und seiner Umgebung lösen zustandsanmeldende Informationen aus, auch als „Motivation" bezeichnet. Motivation stellt bei hinreichender Aktionsanregung des Systems, bei affektiver Zielbezogenheit und bei spezifisch thematisierter Vermissung und Erwartung einen wichtigen Erklärungsansatz für Einsetzen und Dauer eines Lernvorgangs dar. Motivationen, etwa als Bedürfnisspannung oder als dranghafte Strebungen, sind «auswählend" bei der Wahrnehmung von Lernreizen und „auswählend" bei der Festlegung der neu zu lernenden Reaktionen beteiligt. Steht ein langfristig anhaltender Anpassungswechsel im direkten zeitlichen und thematischen Zusammenhang mit einer Situation, so sprechen wir von manifestem Lernen. Ändert sich dagegen das Informations- oder das Reaktionspotential abgelöst von definiten Lernsituationen, so sprechen wir von „latentem Lernen". Motivation aktualisiert und organisiert latent Gelerntes. Die Motivationsstruktur, das Reaktionspotential und das Informationspotential des Lernenden wirken als ein strukturierendes Selektionssystem, das über die funktionelle Bedeutung und die Beibehaltung neu geforderten Verhaltens und über die Zulassung und Speidierung sich neu anbietender Informationen entscheidet. Am Lernprozeß unterscheiden sich folgende dynamische Stufen: a) Aneignung (Akquisition), b) Speicherung (Reproduzierbarkeit),

Vorläufige Skizzierung allgemeiner Charakteristika vom Lernen

15

c) Organisation (Gliederung und Systematisierung), d) Anwendung (Übung, Transfer). 12. Ergebnisse von Lernprozessen sind: a) Informationen und ihre 'wahrnehmungsbestimmten Interpretationsschemata, b) Gefühle und Motive, c) Erwartungen und Einstellungen, d) Semantische Systeme und symbolische Operationen in ihnen, e) Gewohnheiten, Fertigkeiten, f) Verhaltens- und Erlebnissteuerung: Aufschub, Verzichte, Abwehrmedianismen, g) Interaktionen in sozialen Gruppen: Haltungen, Kommunikations-, Wert- und Rollenmuster. Die oben zusammengestellten zwölf Prinzipien, die bei der Schilderung von Lernen in den nachfolgenden Kapiteln von uns benutzt werden, sind als Orientierungshilfe für den Leser gedacht und haben ausdrücklich nur bedingt den Charakter eines Axiomen- und Postulatensystems.

4. Frühe Lernforschung: Gedächtnis, Merken und Reproduktion Eine der ältesten Deutungen des Lernens sah im erfolgreichen Lernvorgang überwiegend die Fähigkeit, aufgenommene Bewußtseinsinhalte möglidist originalgetreu zu reproduzieren. Aus dieser vortheoretischen Entscheidung ergab sich zwangsläufig, daß der Merkfähigkeit und den „mechanischen" Reproduktionsleistungen das Hauptinteresse auch der Pädagogen und Erzieher gehörte. Zwar hatte EBBINGHAUS keine „vorsätzliche" Einengung seiner Forschungen im Bereich von Gedächtnis und Lernen auf Merk- und Reproduktionsprozesse vollzogen. Die Ergebnisse und Theorien der frühen deutschen Lernforschung sind jedoch durch eine methodische Vorentscheidung in starkem Maße bestimmt worden: Forschungsziel dieser frühen Lernforschung war die Aufklärung der Gesetze des Merkens, des Behaltens und der Reproduktion in möglichster Unabhängigkeit von den Inhalten und der Bedeutung des Erlernten, gewissermaßen eines Lernens „an sich". Die experimentelle Arbeit mit sinnfreiem Gedächtnismaterial schien die Lösungsmöglichkeit für diese Aufgabe. Es ist jedoch unverkennbar, daß die Forschungsergebnisse und über sie hinweg dann auch die frühen Theorien für Gedächtnis und Lernen durch die Wahl dieses methodischen Kunstgriffs in einer sehr formalistischen Weise festgelegt und bestimmt worden sind. Keineswegs kann der Forsdiungsweg der frühen deutschen Lerntheorie als verfehlt angesehen werden. Es ist jedoch nachdrücklich zu betonen, daß die praktische Anwendung von Ergebnissen der Lernforschung ebenso wie das tiefere Verständnis der Lern- und Anpassungsprozesse gerade erst in der kontrastierenden Abhebung von den Methoden und Ergebnissen einer „inhaltsfreien" Gedächtnisforschung erwächst. Die alte Gedächtnispsychologie untersuchte demgemäß vor allem sogenannte Reproduktionsvorgänge. Als Grundlage dieser Vorgänge dachte sie sich nervöse „Spuren" sog. Engramme, die allerdings mehr hypothetischer als beschreibender Natur waren. Konkret darzustellende hirnanatomische Verbindungsträger zwischen den hypothetisch angenommenen Spuren bezeichnete sie als „Assoziationsfasern" und die ihnen zugeordnete funktionelle Leistung als „Assoziation". Alle psychologischen Vorbedingungen des Reproduktionsvorganges, ganz gleich, ob Spuren oder Assoziationen, faßte die Gedächtnispsychologie dann als sogenanntes „Gedächtnis" zusammen. Hierin spricht sidi die

Frühe Lernforsdiung: Gedächtnis, Merken und Reproduktion

17

„atomistisdie" Grundposition der älteren assoziationstheoretisch orientierten Gedäditnispsychologen aus. Die neueren gehirnpsychologischen Experimente sowie neurologisdiklinischen Erfahrungen zeigen dagegen, daß stets ein erheblicher Teil aller Ganglienzellen an jedem einzelnen psychischen Prozeß beteiligt ist. Der Versuch, die Leistungen des Gehirns auf einzelne mehr oder -weniger autonome Zentren einzuengen und damit eine „Topographie" von Funktionszentren zu schaffen, ist zugunsten einer „Topologie" (W. R. HESS) kooperierender nervöser Systeme aufgegeben worden. Gedächtnisspuren sind daher nicht an bestimmte Stellen lokalisiert. Das einer gelernten Assoziation entsprechende Engramm besteht also keineswegs aus einer festen Verbindung zwischen einzelnen Neuronen. Vielmehr entspricht der Modellvorstellung des „Engramms" ein dynamisches Muster von Hirnprozessen. Aufbau und Veränderung solcher Erregungsmuster sind als funktionelle Reorganisation eines Systems von Hunderttausenden von Ganglienzellen aufzufassen. Die Ganglienzellen können nur „binär"*) entscheiden. Dabei ist die Erinnerung an einen Vorgang stets an eine Speicherung von Symbolen gebunden. Die Reproduktion besteht dann in der mehr oder weniger verbalisierten oder veranschaulichten Reaktivierung von symbolischen Repräsentationen. Dieser Vorgang der Reproduktion bezieht sich nicht nur auf Tatsachen und Namen, Ereignisse und Situationen, auf Bedeutungszusammenhänge und Strukturen, sondern auch auf komplexere Kenntnisse, die man sich durch Unterricht, Lektüre und das Hören von Vorlesungen erworben hat. Während zur Reproduktion von Erlebtem eine jeweils typische Zeitmarke gehört, fehlt diese in den meisten Fällen bei den verbalen, im Gedächtnis gespeicherten Kenntnissen. In beiden Gruppen von Gedächtnismaterial ist die Erinnerung vielfach mit reproduzierbaren Vorstellungsbildern**) verknüpft. Diese haben jedoch nur selten den Charakter klarer, anschaulicher Bilder. Treten undeutliche Vorstellungsbilder dennoch auf, so ist die Erinnerungssicherheit ins Schwanken geraten. Beim Versuch der Korrektur und Präzisierung der Gedächtnisinhalte dienen anschauliche Vorstellungsbilder dann dazu, die Erinnerung dem ursprünglichen Erlebnis wieder so nahe wie möglich zu bringen. Die experimentellen Methoden der traditionellen Gedächtnispsychologie aber haben Handlungen, Bewegungen und Gewohnheiten sowie Fertigkeiten wie Radfahren, Schwimmen und Maschineschreiben — insgesamt also komplexe Verhaltensweisen —, nicht als Untersu*) Jedes auch komplexe Entsdieidungsproblem ist abbildbar auf einem Gefüge zweiseitiger Informationen von der Form 0—1. Elemente von Elektronengehirnen oder die Zellen des menschlichen Gehirns .operieren" gleichfalls »binär", sie sind entweder erregt oder nicht. **) Also mit rekombinierten Wahrnehmungsresten. 2 Haseloff-Jorswieck, Psydiologie

18

Frühe Lernforschung: Gedächtnis, Merken und Reproduktion

chungsgegenstand anerkannt. Noch weniger lag es im Erwartungshorizont der frühen Lern- und Gedäditnisforscher Persönlichkeitszüge, Mentalitäten und Ideologien als erlernte kognitive und/oder normative Muster zu erkennen. Statt dessen sollte der Erwerb, das Bewahren und die Wiederaktivierung möglichst einfacher Bewußtseinsinhalte erforscht werden. Das in der neuen Lernpsychologie dann analysierte Verhalten von Tieren im Problemkäfig, die Beschäftigung mit dem sogenannten Mehr-Wahlproblem, dem Labyrinthlernen oder den bedingten „Reflexen" PAWLOWS konstituieren insgesamt einen Bereich des „perzeptiv-motorischen" Lernens, der wegen seiner zweidimensionalen Verknüpfung kognitiver und motorischer Prozesse außerhalb der Erwartungen der frühen Gedächtnispsychologie blieb. Wie schon gesagt, entfalteten sich deren Fragestellungen und Erkenntnisse in enger Abhängigkeit von wohldurchdachten experimentellen Methoden. Wir verstehen die Konzeption dieser frühen Lernforschung am besten, wenn wir uns zunächst der Struktur dieser Methoden zuwenden. Dabei handelt es sich im einzelnen um die folgenden Verfahren:

4.1 Erlernungsmethode Material: Sinnlose Silben, einer Zufallsfolge entsprechende Zahlenreihe, nicht miteinander verbundene Wörter*). Darbietung: Meist mit Hilfe eines Tachistoskops, Expositionszeit variabel, gewöhnlich zwei Sekunden. Bewertung: 1. Anzahl der Repetitionen, die für einen gewissen Grad von Lernen notwendig ist; 2. Erforderlicher Zeitaufwand. Dieses auf EBBINGHAUS**) zurückgehende Verfahren hat den Vorteil, daß sich der Verlauf des Erlernens genau verfolgen läßt. So konnte *) Einen Überblick über die Regeln und Vorschriften, die beim Aufbau derartiger sinnloser Reihen berücksichtigt werden müssen, gibt E. R. HILGARD in »Handbook of Experimental Psydiology", New York 1951, S. 517 ff. **) HERMANN EBBINGHAUS begann, ohne ein Universitätsstudium, psychologische Experimente durchzuführen. 1873 promovierte er dann in Bonn mit einer Dissertation über VON HARTMANNS „Philosophie des Unbewußten". Die Kenntnis der englischen Assoziationspsychologen veranlagte ihn wahrscheinlich, seine experimentellen Gedächtnisuntersuchungen zu unternehmen, die in der Zeitschrift f. Psychologie Bd. 6, 14, 22, 24, 35, 37, 41, 42, 44, 45, 56, 59 sowie im Archiv f. d. ges. Psych. Bd. 1, 2, 4,

Frühe Lernforschung: Gedächtnis, Merken und Reproduktion

19

auf diesem Wege festgestellt werden, daß gegenüber sinnlosem Material beim Erlernen von sinnvollem Material nur V1» der Wiederholungen nötig war. EBBINGHAUS forderte für die Lernuntersuchungen ein möglichst assoziationsfreies Material, um eine Variation des Lernerfolges durch die unterschiedliche Vorerfahrung der Versuchspersonen und jeweils persönlicher Anknüpfungspunkte an das Material auszuschalten. Inzwischen ist nachgewiesen worden, daß die Versuchsperson entgegen der experimentellen Versuchsordnung regelmäßig versucht, sich eine Organisation des Lernmaterials zu schaffen, es z. B. in einem bestimmten Rhythmus zu lesen. Das Lernmaterial wird gruppiert oder die Versuchsperson bedient sich gemäß ihrer Kenntnisse und Interessen individuell begründeter oder konventioneller Assoziationen. Diese Selbsthilfen sind Ausdruck der Lernabsicht und Erfahrung der Versuchsperson. Sie stellen einen Spezialfall antizipatorischer Organisationstendenz dar, die fast alles Erleben und Verhalten aufweist. Durch diese Hilfen wird ein Verhalten organisiert, das ein Minimum an Lernaufwand benötigt. Dabei wird auch die Anzahl der erforderlichen Wiederholungen wesentlich reduziert. Nachdem eine Liste von Silben hinreichend erlernt worden ist, nimmt die Leistung der Hilfen ab oder verschwindet ganz. Dies alles zeigt, daß zielgerichtetes Lernen über mechanisch-assoziative Verknüpfungen hinausgeht. Es werden persönlich bedeutungsvolle Brücken und Zwischenassoziationen eingefügt, die, nachdem sie ihren Dienst getan haben, entbehrt werden können.

4.2 Ersparnismethode Material: Vorwiegend Wort-, Silben und Ziffernreihen. Darbietung: Die Versuchsperson liest die Reihen so lange, bis fehlerfreie Reproduktion erfolgt. Danach läßt man einige Zeit verstreichen, ehe das Lernen aufs neue erfolgt. 6, 12, 17 sowie schließlich in der Ztschr. f. angewandte Psych. Bd. 1—5 erstmals erschienen sind. 1885 erschienen seine Ergebnisse zusammengefaßt in der Arbeit »Ober das Gedächtnis". EBBINGHAUS erprobte die von ihm gefundenen Methoden an sich selbst. Um homogenes und assoziationsfreies Lernmaterial zu erhalten, konstruierte er eine große Zahl (im Deutschen 2300 brauchbare) sinnloser Silben, die aus zwei Konsonanten und einem in der Mitte stehenden Vokal bestanden. Von ihm stammen die Erlernungs- und die Ersparnismethode. 1886 wurde EBBINGHAUS in Berlin zum außerordentlichen Professor ernannt, nachdem er vorher 6 Jahre in Berlin Dozent war. 1894 übernahm er einen Lehrstuhl in Breslau. Weitere wichtige Leistungen EBBINGHAUS' waren die Erfindung des Lüdtentests und das Lehrbuch mGrundziige der Psychologie". 1902 erschien davon der erste Band. 1908 veröffentlichte er sein Werk , A b r i ß der Psychologie r

20

Frühe Lernforschung: Gedächtnis, Merken und Reproduktion

Bewertung: Die Ersparnis, die die Versuchsperson entweder an der Anzahl der Lesungen oder an der Lernzeit gewonnen hat, führt zur Variation der Bewertungspunkte. So sind beispielsweise 1010 Sekunden zum Erlernen von 8 Reihen erforderlich, während dann nach 31 Tagen nur noch 803 Sekunden zum Wiedererlernen benötigt werden. Damit beträgt die Zeitersparnis 207 Sekunden oder 20,5 %> der ursprünglichen Zeit. Diese Methode wurde von EBBINGHAUS erfunden und angewandt, um das Behalten nach längeren Zeitintervallen zu prüfen. Das Ersparnisergebnis wird nach folgender Formel ermittelt: Ursprüngliches Lernen — Neulernen — -—n ; Ursprüngliches Lernen

X 100 = Ersparnisprozent

konnte dabei nachweisen, daß die Lernzeit rascher wächst, als dies der Verlängerung der Lernreihen entsprechen würde. Das Wiedererlernen nach 24 Stunden erfolgt dann jedoch für längere Reihen mit absolut und relativ größerer Ersparnis als für kürzere Reihen. Die Ersparnis mißt die Stärke der Assoziation von Glied zu Glied. Dabei zeigen sich auch Assoziationen zu entfernten Gliedern, die jedoch schwächer sind als die zu Nachbargliedern. EBBINGHAUS

Menge der gelernten Silbenpaare Menge der gelernten Silbenpaare

Erhebliche Bedeutung hat auch das Erlernen von Silbenpaaren gewonnen. Wir haben hierzu die Ergebnisse eines Experiments in Kurvenform dargestellt. 4.3 Methode der behaltenen Glieder Material: Meist zusammenhängende Texte.

21

Frühe Lernforschung: Gedächtnis, Merken und Reproduktion

Darbietung: Entweder liest der Versuchsleiter vor, oder die Versuchsperson liest selbst. Dabei ist genau festgelegt, wie oft der Text gelesen werden darf. Der Text ist meist vorher bereits in logische und sachliche Einheiten eingeteilt. Die Versuchsperson reproduziert nach ihrer Beschäftigung mit dem Lernmaterial gemäß den vorher festgelegten Zeiten und Bedingungen das von ihr Behaltene mündlich oder (besser) schriftlich. Bewertung: Einen Punkt für jede sachlich zutreffend reproduzierte Einheit. Bei dieser Methode muß in einem Vorversuch ein Kontrollschema aufgestellt werden. Es ist auch möglich, dieses Kontrollschema als ein Erwartungsschema zu formulieren. Der Lernerfolg manifestiert sich dann in der Abweichung von diesem Erwartungsschema. 4.4 Treffermethode (G. E. Moller)») Material: Sinnlose Silbenpaare. Darbietung: Die Versuchsperson liest eine Serie der Silbenpaare mehrmals durch, die Anzahl der Rezeptionen wird genau bestimmt. Bei der Prüfung werden die ersten Glieder der Silbenpaare jeweils in zufälliger Ordnung dargeboten, die Versuchsperson muß mit dem jeweils zugehörigen zweiten Teil des Paares antworten. Bewertung: Richtige Reproduktionen werden als Treffer bezeichnet und bewertet. Mit dieser Methode läßt sich also die Reproduktions- und Trefferzeit *) GEORG ELIAS MÜLLER w u r d e e b e n s o w i e EBBINGHAUS 1 8 5 0 g e b o r e n . E r

war

Schüler von LOTZE in Göttingen, dessen Lehrstuhl für Philosophie er 1881 übernahm und 40 Jahre innehatte. MÜLLER übte (ähnlich wie WUNDT) einen starken Einfluß auf die Psychologie aus. Sein berühmtes Laboratorium zog viele hervorragende Studenten a n , u n t e r d e n e n SCHUMANN, PILZECKER, J O S T , SPEARMEN, JAENSCH u n d K R O H

Bedeu-

tung gewonnen haben. — MÜLLER hat kein eigenes psychologisches System ausgearbeitet. Seine Forschungsergebnisse betrafen: Psychophysik, Raumauffassung und Gedächtnis. Seine bedeutsamsten Untersuchungen lagen auf dem Gebiet des Gedächtnisses. Er und seine Mitarbeiter führten die Arbeiten von EBBINGHAUS fort. Sie verbesserten seine Technik erstens durch Benutzung von Instrumenten, die jede gewünschte Schnelligkeit in der Darbietung des zu lernenden Materials zuließen, und zweitens durch die Einführung bestimmter Regeln in bezug auf die Wahl der einzelnen Silben. MÜLLER entwickelte die „Treffermethode". Er faßte seine Forschungen über das Gedächtnis in drei großen Bänden zusammen: „Zur Analyse der Gedächtnistätigkeit und des Vorstellungsverlaufes' 1,1911.

22

Frühe Lernforschung: Gedächtnis, Merken und Reproduktion

bestimmen (Zeit, die von der Darbietung des ersten Gliedes bis zur Reproduktion des zweiten Gliedes vergeht). Diese Methode wird auch beim Lernen von Vokabeln angewandt. Die Geschwindigkeit jeder einzelnen Wiedergabe ist ein wichtiges Merkmal der Assoziationsstärke, wie MÜLLER und PILZECKER nachweisen konnten*). MÜLLER und SCHUMANN gelangten im Laufe ihrer Forschungen zur Berücksichtigung weiterer Faktoren, die für den Lernerfolg wichtig sind: a) Haltung und Einstellung des Lernenden; b) Lernwille; c) Organisiertes Material zu lernen ist oft ökonomischer als das Lernen von Teilinhalten. Damit war bereits früh erkennbar geworden, daß Lernprozesse theoretisch zulänglich nur erfaßt werden können, wenn die Dynamik der Motive in die Theorie einbezogen wird. Auf der anderen Seite konnte man nun die Assoziationsgesetze, die schon sehr lange diskutiert wurden, quantitativ ausdrücken (vgl. TmrMB-MARBEsches Geläufigkeitsgesetz). 4.6 Wiedererkennungsmethode**) Material: Beispielsweise Photographien, geometrische Figuren.

man

verwendet

heute

vor

allem

Darbietung: 20 Photographien oder Figuren werden einmal oder mehrere Male gezeigt. Danach werden sie mit 20 neuen Photographien gemischt und in zufälliger Ordnung dargeboten. Die wiedererkannten Photos werden markiert. Bewertung: P = R — F (R = Prozentzahl der richtig wiedererkannten Photos, F = Prozentzahl der falsch erkannten, neuen Photos). Wiedererkennen erweist sich gegenüber der Reproduktion als der einfachere Prozeß und scheint dem Vergessen weniger ausgesetzt zu sein als die Reproduktion. In einem Versuch wurden 25 Einheiten (Wörter, Silben, Sprichwörter) in 50 Sekunden erlernt. *) MÜLLER & PILZECKER übernahmen audi die Methode der gepaarten Assoziationen, die von CALKINS eingeführt worden war und die sich als sehr wertvoll für die Erforschung anderer Probleme des Gedächtnisses erwiesen hat. **) Vgl. hierzu E. CLAPAREDE „Récognition et moitié", Arth. d. Psydi. 11 (1911), und K. KOFFKA „Principles of Gestalt Psychology", New York (1935).

Frühe Lernforsdiung: Gedächtnis, Merken und Reproduktion

23

Die Reproduktion erfolgt nach dem Prinzip der behaltenen Glieder und die Wiedererkennung nach der Methode der identischen Reihen. Dabei wurden folgende Resultate erzielt: Reproduktion, richtig Wiedererkennung, richtig

Silben

Wörter

Sprichwörter

12 °/o 42 °/o

39 °/o 65 °/o

22 °/o 67 °/o

Die Wiedererkennungsmethode hat Bedeutung für die Bestimmung des kindlichen Wortschatzes. Der aktive Wortschatz (Gesamtheit der selbst gesprochenen Wörter), der funktionell vom Prozeß der Reproduktion abhängt, ist stets wesentlich kleiner als der passive Wortschatz (Gesamtheit der verstandenen Wörter), der an die Funktion der Wiedererkennung gebunden ist*). 4.6 Rekonstruktionsmethode Material: Reize, z. B. Gerüche. Darbietung: Eine Reihe von Reizen wird in einer gewissen Ordnung dargeboten. Bei der Probe werden die Reize in einer anderen Reihenfolge plaziert. Die Versuchsperson soll sie dann gemäß der ursprünglichen Reihung ordnen. Die Frage, welche Bedeutung die relative Position einer Reproduktionseinheit innerhalb einer Reihe von reproduzierbaren Inhalten für die Erinnerungs- und Reproduktionswahrscheinlichkeit selbst besitzt, ist noch immer nicht völlig geklärt. Für jüngere Kinder der Vorschulzeit spielt die Stellung der einzelnen Reproduktionseinheit innerhalb der Serie offenbar kaum eine Rolle. Im Alter zwischen 6 und 10 werden dann Initial- und Finaltendenzen (N. ACH) im Reproduktionsprozeß deutlicher. Die ersten und die letzten Reproduktionseinheiten gewinnen eine höhere Wahrscheinlichkeit des Behaltens. Dementsprechend kann gesagt werden, daß topologische Determinationen der Gedächtnisleistung verhältnismäßig früh und überwiegend bei jüngeren Kindern auftreten. N. MILLER (1934) stellte an einer Versuchsgruppe von 89 Kindern im Alter vom ungefähr 1. bis zum etwa 13. Lebensjahr fest, daß das Wiederfinden von versteckten Gegenständen bis zum 5. Lebensjahr nicht durch die Farbe einer „Versteckschachtel" bestimmt war, sondern durch die Positionen der in Frage kommenden Schachteln zueinander. *) Kinder zwischen 8,6 Lj. und 11,6 Lj. rekognizieren 9 Formen oder 6 Bilder, ihr Rekall dem gleichen Material gegenüber beträgt dagegen 4 Formen und 1 Bild.

24

Frühe Lernforschung: Gedächtnis, Merken und Reproduktion

Hierzu — mit gleichem Ergebnis — als Wiederholung dieser frühen Experimente auch FOPPA ( 1 9 6 1 ) * ) . Die Forschungen von EBBINGHAUS zusammenfassend kann auf zwei zentrale Gesetze hingewiesen werden: 1. Zwischen dem U m f a n g des Lernmaterials — zum Beispiel der zunehmenden L ä n g e sinnloser Silben — und der Anzahl von einprägenden Wiederholungen, die bis zum Erlernen erforderlich sind, formulierte EBBINGHAUS (1885) „ Ü b e r das Gedächtnis" folgendes: „ D i e Anzahl der notwendigen Wiederholungen wächst mit zunehmender Silbenzahl der Reihe a n f a n g s außerordentlich schnell, später langsamer" (Figur 1, S. 20). 2. Bereits nach kurzer Zeit (etwa 20 Minuten) macht sich das Vergessen bemerkbar. A u s diesem G r u n d e schafft die neue Wiederholung beim Lernen (auch sinnlosen Materials) eine Lernersparnis.

benutzte ( 1 9 1 1 „Grundzüge der PsychologieS. 684) den prozentualen Anteil an Lernersparnis zur Darstellung seiner „Vergessenskurve". Sie zeigt, daß nach 20 Minuten die Ersparnis 5 8 % beträgt. Nach einer Stunde ist die Ersparnis nur noch 4 4 % . Nach einem Tage beträgt sie 3 4 % und nach 6 Tagen schließlich nur 2 5 % . Nach einer Woche müssen also % des ehemals gelernten Materials ohne Lernersparnis neu aktiviert werden. Während die ersten vier Methoden ( 4 . 1 bis 4 . 4 S. 1 8 — 2 1 ) Reproduktionsvorgänge untersuchen, beruhen die letzten beiden auf Wiedererkennen. Mit Hilfe dieser Methoden gelang J O S T ein wichtiger Beitrag zur Ökonomie des Lernens. Seine Untersuchungen führten zur Formulierung zweier Gesetze: Das erste JosTsche Lerngesetz hat folgende Vorgeschichte: EBBINGHAUS lernte in einem Versuch neun 12silbige Reihen mit sinnlosen Silben bis zur fehlerfreien Reproduktion. An folgenden Tagen wurden die Reihen bis zum fehlerfreien Hersagen wiedergelernt. Dabei ergab sich folgendes Resultat:

EBBINGHAUS

Tage Anzahl von Lernversuchen (Durchschnittszahlen)

1

2

3

4

5

6

16,5

2

7,5

5

3

2,5

Sinnvolles Material, z . B . Stanzen aus „Don J u a n " von BYRON, konnten dagegen schon am 5. Tage, ohne Wiederlernen, fehlerfrei reproduziert werden. D a das Lernen jeden Tag den gleichen Grad der Vervollkommnung erreichte, mußte also die Versuchsperson für jeden folgenden Tag ein geringeres Quantum vergessen haben. *) Der Einfluß wechselnder Anordnungen auf d u Erlernen von Silben und Wortreihen. Zschr. exp. Psych. 8, 339 (1961).

Frühe Lernforsdiung: Gedächtnis, Merken und Reproduktion

25

Von ähnlichen Versuchen aus gelangte J O S T zur Formulierung seines ersten Gesetzes: „Wenn zwei Assoziationen zu einem gewissen Zeitpunkt dieselbe Stärke haben, dann wird die ältere nicht so schnell geschwächt wie die jüngere." An anderer Stelle gibt J O S T seinem ersten Lerngesetz folgende Fassung: „Wenn zwei Assoziationen zu einem gewissen Zeitpunkt denselben Wert des Behaltens haben, dann wird dieser letztere bei dem jüngeren schneller vermindert." Dieses Gesetz kann auch aus der allgemeinen Vergessenskurve abgeleitet werden. In der Folge hat sich erwiesen, daß Lernen mit verteilten Wiederholungen schneller zum Erfolg führt und besseres Behalten ergibt als Lernen mit gehäuften Wiederholungen. Eine Ausnahme machen jedoch die Anfangsstadien des Lernens, bei denen die gehäufte Wiederholung einen günstigen Effekt erzielt. Wahrscheinlich ist ein stärkerer Einsatz von Lernenergie notwendig, um die Anfangsschwierigkeiten zu überwinden. 1 8 9 7 formulierte J O S T an Hand dieser Ergebnisse sein zweites Gesetz: „Wenn zwei Assoziationen dieselbe Stärke, aber verschiedenes Alter haben, so wird die ältere mehr als die jüngere durch dieselben Wiederholungen verstärkt." Ein weiteres Untersuchungsergebnis geht dahin, daß das „ganzheitliche" oder detaillierte Anbieten von Lernmaterial ohne signifikanten Effektunterschied bezüglich normalsinniger oder schwachsinniger Kinder ist (PECHSTEIN). Es ist wichtig zu wissen, ob die Art der Beschäftigung in dem Zeitraum zwischen Lernen und Reproduktion eine Bedeutung für das Behalten hat. MÜLLER und PILZECKER führten hierzu u. a. folgende Versuche durch: Es werden in einer gewissen Zeit (4 Min.) 15 Adjektive gelernt. Nach 5 Minuten Ruhepause wurden die Wörter dann reproduziert. Beim Vergleichsversuch wird eine neue Reihe gelernt, wobei jedoch die eingeschaltete 5-Minuten-Pause mit Arbeit auszufüllen war: z.B. mit dem Lernen eines Gedichtes, mit fortlaufender Addition oder mit etwas Ähnlichem. Darauf erfolgt dann die Reproduktion der zweiten Reihe. Durchschnittlich erweist sich das Behalten der zweiten Reihe als deutlich erschwert gegenüber dem der ersten Reihe. Die Tatsache, daß eine hinterher eingeschobene Arbeit ein früher erfolgtes Lernen verschlechtert, wird retroaktive Hemmung genannt. MÜLLER und PILZECKER waren der Ansicht, daß die Art der Arbeit während der Pause für die Wirkung der retroaktiven Hemmung gleichgültig sei. Später wurde jedoch festgestellt, daß die retroaktive Hemmung am größten ist, wenn man sich in der Pause mit gleichartigem Material beschäftigt. Jedoch darf in der Pause kein identisches Material gelernt werden. In diesem Falle würde es sich ja

26

Frühe Lernforschung: Gedächtnis, Merken und Reproduktion

dann um das Wiedererlernen einer bereits gelernten Reihe handeln und der Reproduktionserfolg müßte größer werden. Wenn die Aktivität, die in der Pause eingeschoben wird, sehr unterschiedlich gegenüber der ursprünglichen ist, dann ist die retroaktive Hemmung nicht so intensiv wie bei Material von mittlerem Ähnlichkeitsgrad. Empirische Feststellungen über die Art der Exposition (vokal, auditiv oder optisch) sowie deren Wirkung auf den Behaltensvorgang ergaben z. B. bis zum 9. Lebensjahr beim Zahlenlernen keine signifikanten Leistungsunterschiede (DAYLEY 1 9 2 6 ) . Eine Sonderfrage betrifft schließlich das „Minuten"- bzw. „Sekundengedächtnis". Hier lassen sich wichtige Einblicke gewinnen, wenn die Veränderungen des Lernens untersucht werden, die sich bei schweren degenerativen oder toxischen Schädigungen des Zentralnervensystems (KoRSAKowsyndrom) ergeben. Hier zeigt sich nämlidi, daß die Kranken in der Lage sind, rezentes (frisches) Material über längere Zeit hinweg zu behalten und zu reproduzieren. Aber selbst bei derart umfangreichen Zerstörungen des Gehirns erweist sich andererseits, daß die heute oft betonte Unterscheidung zwischen „Altgedächtnis" und „Frisch-Gedächtnis" nicht generell zutrifft. Vielmehr sind die reproduzierbaren Inhalte des Restgedächtnisses deutlich abhängig von der Lebenssituation, in der sich der Betreffende befindet und von der Wichtigkeit bestimmter Züge dieser Situation für die Persönlichkeit. So betrifft bei männlichen Kranken das reproduzierte Restmaterial häufiger Themen aus der eigenen Berufs- und Arbeitswelt. Gleiches gilt aber auch für ehemals berufstätige Frauen, während sonst durch Ausfall der Merkfähigkeit geschädigte Frauen vor allem Erinnerungsreste aus Haushalt und Kinderstube konfabulieren. Mit diesen letzten Hinweisen wird deutlich, daß in den Konzeptionen von EBBINGHAUS und MÜLLER motivationale und emotionale*), aber auch intellektuelle Einflußgrößen auf das Bewahren von Bewußtseinsinhalten keine hinreichende Berücksichtigung fanden. Unsere Analyse der Methoden und Hauptergebnisse der frühen Gedächtnispsychologie hat erkennen lassen, daß die einfache Gleichsetzung von Gedächtnisprozessen (Erwerb, Rezeption und Reproduktion) mit dem Gesamtbereich des Lernens, wie er heute übrigens in einigen Spielarten der Kybernetik erneut aktiviert worden ist, der Problemlage und den Erkenntnischancen einer empirischen Lernforschung nicht voll gerecht wird. Kritische Probleme zur Gedächtnistheorie des Lernens sind etwa folgende: 1. Spuren spezifischer Ereignisse und die Art ihrer Konservierung. *) vgl. hierzu die umfangreidie Fakten- und Auffassungssammlung von D. RAPAPORT, Organisation and Pathology of thought, New York (1959).

Frühe Lernforschung: Gedächtnis, Merken und Reproduktion

27

2. Welche Form der Speicherung ist für das Gedäditnislernen hypothetisch anzunehmen. 3. Ist die „gedächtnismäßige" Konservierung synchron mit der Aufnahme des Bewußtseinsinhaltes oder ein Prozeß, der sich nach der Aufnahme organisiert. 4. Welche in der „Speicherzeit" ablaufenden Vorgänge und welche Organisationen des gespeicherten Materials sind für den Umfang des Reproduzierbaren verantwortlich. 5. Wie erfolgt die Reaktualisierung des bereitliegenden, mehr oder weniger neu- oder umorganisierten Materials. 6. Schließlich gibt es untersdiiedliche Speichersysteme mit je unterschiedlicher Leistung für den eigentlichen Lernprozeß. Eine Übersicht über die vorliegende Literatur*) zeigt, daß Gedächtnis, Wiedererkennen und Reproduzierbarkeit für die Neuanpassung zwar notwendige Voraussetzung, keineswegs aber einzige, hinreichende Bedingung sind.

"') GOMULICKI: The Development and present status of the trace theory of memory, Brit. Journ. Psych., Monograph 29, 1953.

5. Lernen nach dem Konzept von bedingendem Signal und bedingter Reaktion und seine Nachfolger wollten eine neurophysiologische Theorie an die Stelle der gesamten Psychologie setzen. Dieses Forschungsprogramm wurde von P A W L O W als eine Hypothese interpretiert und nicht als ein starres, weltanschaulich motiviertes Vorhaben. Die außerordentlich fruchtbare experimentelle Arbeit, die durch diese Konzeption ausgelöst wurde, erwies sich im Laufe der Zeit auch als höchst wichtig für die methodischen und theoretischen Probleme der Lernforschung. Die Reflexologie liefert ein elementares physiologisches Modell des Lernens. Zentraler Begriff dieses Modells ist der Reflex*). Dabei wird jede Antwort eines Organismus auf einen Reiz „Reflex" genannt, wenn diese Antwort durch das Nervensystem vermittelt wird. P A W L O W definiert wörtlich: „Mit dem Reflexbegriff wird die gesetzmäßige Verbindung irgendeines Agens der Außen- und Innenwelt vermittels der rezeptorischen Nervenapparate, der Nervenfasern, der Nervenzellen und der Nervenendigungen mit dieser oder jener Tätigkeit des Organismus bezeichnet." Folgt man dieser so weit gefaßten Definition, dann bestimmt man eine sehr große Anzahl von „Reflexen", die jeweils eine mehr oder weniger wichtige Aufgabe im Vollzug der inneren oder äußeren Anpassung des Organismus erfüllen. Ihre Komplexität und ihr Integrationsgrad sind erwartungsgemäß außerordentlich unterschiedlich. Biologische Funktionen von Reflexvorgängen liegen zunächst im Bereich der Stoffwechselprozesse. Bei den meisten Arten ist bereits in sehr frühen Embryonalstufen durch unbedingt ablaufende Reflexe eine weitgehende Sicherung etwa des Wasser-, Salz-, Mineral-, Zuckerhaushaltes sichergestellt. I W A N P E T R O W I T S C H P A W L O W hat nachweisen können, daß neben den angeborenen Sdilüsselreizen und Auslöseschemata unter besonderen Bedingungen auch zunächst biologisch völlig indifferente Reize zu Auslösern — oder wie es P A W L O W nennt — zu Signalen werden können. Reaktionen des Organismus auf Signale (von zunächst indifferenten Reizen) nennt P A W L O W bedingte Reflexe. Damit diese zuPAWLOW

*) SETSCHENOV, I. M.: Die Reflexe des Gehirns, S. 137 (1863): „Der Nervenapparat verändert sich nadi einem jeden auf ihn einwirkenden neuen Einfluß immer mehr, und dieser Einfluß wird von ihm mehr oder weniger lange festgehalten, von einem beliebigen vorausgegangenen Einfluß bis zu einem beliebig nachfolgenden."

Lernen nach dem Konzept von bedingendem Signal

29

Standekommen bzw. genauer gelernt werden, sind eine Reihe von Determinanten unerläßlich. 1. Ausreichend häufig zeitliche Nähe der Einwirkung des indifferenten Reizes zu der Einwirkung des „unbedingten" „Reizes". 2. Die Einwirkung des indifferenten Reizes kann der Einwirkung des unbedingten Reizes um eine kurze Zeit vorausgehen, zeitlich synchron sein oder verzögert werden. 3. Während der Kombination der unbedingten mit bedingten Reizen dürfen keine starken Nebenreize auftreten. 4. Der indifferente Reiz sollte im Vergleich zum unbedingten Reiz eine geringere biologische Bedeutsamkeit haben.

Infolge hinreichend häufig wiederholten, zeitlichen Zusammenfalls der etwa von der Nahrung ausgehenden Reize werden z.B. die Reize auf den optischen und Geruchsapparat zu bedingten Erregern*), zu Signalen für die reflektorische Nahrungsreaktion. Ursprünglich indifferente Reize bekommen so die Bedeutung von alarmierenden Zeichen, die den Organismus auf Zeitpunkt und Art des zu erwartenden Ereignisses vorbereiten. Im Bereich aller Disziplinen der Human- und Veterinärmedizin sind derartige bedingt-reflektorische Leistungen der Organismen in großer Zahl experimentell hervorgerufen und z. T. auch therapeutisch verwendet worden**). In all diesen „Lernsituationen" und im individuellen Aufbau einer Vielzahl bedingter Reflexe vollzieht sich stets eine zunehmende Distanz zu den lebenswichtigen Objekten, zum Beispiel zur Nahrung. Schließlich werden „ . . . durch die bedingten R e f l e x e . . . nicht nur die unmittelbaren Einwirkungen widergespiegelt, . . . sondern auch die Zusammenhänge zwischen den einzelnen Erscheinungen und Ereignissen der materiellen Welt"***). Das „materielle" Substrat des bedingten Reflexes entsteht durch funktionelle Veränderungen in den höchsten Abschnitten des Zentralnervensystems, in der Großhirnrinde. Diese Funktionsveränderungen werden als „Erregung" und „Hemmung" gedeutet. Durdi das nahezu gleichzeitige Auftreten zweier Erregungsherde im Zentralnervensystem, nämlich das des unbedingten und das des zunächst noch indifferenten Reizes, gewinnt der zweite die Tendenz, den ersten mitzuproduzieren: „Es werde eine Nervenleitung zwischen jenen Herden gebahnt". Die Fähigkeit zur Bildung neuer zeitweiliger Ver») Patlow, I. P.: ( 1 9 3 8 ) Smtl. Werke. Bd. I I I , 2; Berlin ( 1 9 5 3 , S. 3 0 1 ) formuliert: „Die Bildung des bedingten Reflexes beruht auf dem Erregungsprozeß." * * ) Bykow, K. M.: Großhirnrinde und innere Organe, Berlin ( 1 9 5 2 , S. 1 6 3 ) meint: „ . . . daß es keine Reaktion des Gesamtorganismus auf Einwirkungen des äußeren oder inneren Milieus gibt, an der die Hirnrinde nicht beteiligt wäre". Vgl. hierzu auch K . Foppas Zusammenstellung in Lernen, Gedächtnis, Verhalten, S . 1 7 , Berlin ( 1 9 6 5 ) . * * * ) Wazuro, E. G.: Einige neue Prinzipien in der Lehre von der höheren Nerventätigkeit. Z. Phys. d. UdSSR, Heft 3 (1947).

30

Lernen nach dem Konzept von bedingendem Signal

bindungen wurde von P A W L O W kortikale Schließungsfunktion*) genannt. Die Schließung derartiger zeitweiliger Verbindungen korrespondiert mit der Tätigkeit definierter kortikaler „nervlicher Gebilde", sogenannten Analysatoren**). Primär antworten stets nur definierte Bereiche der Analysatoren auf die Signale, die von den peripheren Rezeptoren zum Leistungsabschnitt der Analysatoren hinaufgeleitet werden. Bereits 1 8 6 2 hatte I . M . S E T S C H E N O W eine höchst wichtige Beobachtung gemacht: Eine zusätzliche Reizung, eine Art Nebenreiz, des Großhirns vergrößert die Zeitspanne zwischen aufgenommenem Reiz und reflektorischer Reaktion. P A W L O W unterzog dann diese sogenannte zentrale Hemmung, die einer neuen, zeitweiligen kortikalen Schließung entgegensteht, einer genaueren Untersuchung. Er konnte zeigen, daß man grundsätzlich zwischen zwei Grundtypen der Hemmung unterscheiden müsse, einer unbedingten äußeren Hemmung und einer bedingten inneren Hemmung. Im einzelnen führten P A W L O W S Forschungen hinsichtlich der u n b e d i n g t e n H e m m u n g e n zu folgender Unterscheidung: 1. Äußere Hemmung: Sie äußert sich in einer Unterbrechung der laufenden Reaktion unter Einfluß der plötzlichen Wirkung eines kräftigen, stärkere zentrale Erregung verursachenden Außenreizes. Die biologische Funktion dieser Hemmung ist offensichtlich die Ermöglichung einer raschen Neuorientierung („Orientierungsreflex") und die Bereitstellung neuer Reaktionsmöglichkeiten. Wird ein Nebenreiz häufiger wiederholt, schwächt sich auch der Orientierungsreflex ab („erlöschender Hemmer"). 2. Überbelastungshemmung: Die Steigerung der Intensität eines Reizes verstärkt im allgemeinen auch die Reflexreaktion. Von einer bestimmten Grenze an jedoch bleibt diese Reaktion konstant, um dann bei nodi übermäßiger Reizintensität nachzulassen, ja schließlich ganz auszufallen. Als Überbelastungshemmung wird auch der Ausfall bedingter Reflexe angesehen, der durch synchrones Anbieten zweier gleich starker bedingender Reize entsteht. 3. wird eine Überbelastungshemmung dann interpretiert, wenn eine übermäßige Erregungssteigerung von (z. B. Nahrungs-)Zentren im Hirn die Auslösung des Reflexes inhibiert (z. B. Wegfall oder Verringerung des „bedingten" Speichelflusses). Weiterhin bekommt *) zitiert nadi BYKOV, K . U . : Lehrbuch der Physiologie, S. 711, Moskau (1959). * * ) Analysatoren entsprechen etwa den motorischen oder sensorischen Rindenfeldern, wie sie die Repräsentationshypothese der älteren Neuroanatomie vertritt.

L e r n e n nach d e m K o n z e p t v o n b e d i n g e n d e m Signal

31

jeder beliebige bedingte Reiz bei Wiederholung*) ohne Abwechslung mit anderen bedingten Reizen Hemmwirkung; das ist nach der Theorie ein Erschöpfungszustand der durch monotone Reizgebung angeforderten Nervenzellen von Analysatoren. Hiermit ist ein Übergang zu den inneren oder bedingten Hemmungen gegeben: 4. Auslösch ende Hemmung: Bei häufiger Nichtbestätigung eines bedingten positiven Reizes nimmt dieser zunehmend die Signalbedeutung eines Hemmreizes an. Diese auslöschende Hemmung garantiert eine gewisse Variabilität der Anpassung. Sie entsteht immer dann, wenn die Grundbedingung für die Bildung bedingter Reflexe, nämlich das zeitliche Zusammenfallen zweier Erregungsherde (entstanden unter der Wirkung des bedingten und des ihn bekräftigenden unbedingten Reizes), nicht mehr gewährleistet ist. Dieses „Erlöschen" wurde später von amerikanischen Psychologen unter dem Begriff „Extinktion" einer genaueren Analyse unterzogen. 5. Differenzierungshemmung: Diese hemmt in Situationen bestimmter Art die spezifischen Reaktionen. Beispiel: „Viele Hausfrauen klagen über die .Diebereien' der Katzen, staunen über deren Schlauheit und sehen darin Elemente einer bewußten Tätigkeit. Die Katze benimmt sich in der Tat in Anwesenheit der Herrin ,wohlerzogen', in ihrer Abwesenheit dagegen klettert sie auf den Tisch und stiehlt" (WAZURO). Differenzierung**) ist jene Form der inneren Hemmung, die unter der Einwirkung von durch den unbedingten Reiz nicht bekräftigten „Agenzien" entsteht, die dem systematisch bekräftigten Agens ähnlich sind. Durch die Differenzierungshemmung wird es Lebewesen also möglich, „Agenzien" zu unterscheiden, deren Eigenschaften sehr ähnlich sind, die aber dennoch unterschiedliches Verhalten erfordern. In zunächst neuartigen, eventuell belastenden Situationen überwiegt die „einfache, auslöschende Hemmung" gegenüber der „Differenzierungshemmung". Auf diese Weise wird dem Organismus zunächst die Möglichkeit zur Verallgemeinerung des zu lernenden indifferenten Reizes gegeben. PAWLOW untersuchte dieses Phänomen als sogenannte „Generalisation" bedingter Reflexe. 6. Verspätungshemmung: Während die bisher geschilderten inneren Hemmungen Reaktionen von Lebewesen auf die Eigentümlidikeiten von äußeren Reizen verfeinern, präzisiert die Verspä*) BYKOW, K. M.: a. a. O., S. 733. Diese Hemmungsart zeigt bereits deutlich, wie bedingte Reflexprozesse generell für allgemein physiologische Daten, hier refraktäre Phasen, erklärend werden. **) PSCHONIK, A. T.: Hirnrinde und rezeptorische Funktion des Organismus. S. 17, Berlin (1956).

32

Lernen nadi dem Konzept von bedingendem Signal

tungshemmung die bedingte Reaktion in zeitlicher Hinsidit. Die Zeitspanne zwischen bedingtem Reiz und erforderlicher Reaktion wird also mitgelernt. Die Reaktion wird zunächst im Sinne der Auslöschung gehemmt und erst zu dem gelernten Zeitpunkt freigegeben. Auf diese Weise wird das Lebewesen vor unnötiger Energievergeudung bewahrt. Dabei kann die unbedingte Reflexzeit länger dauern als die bedingte, d. h. die Latenzzeit zwischen bedingendem Reiz und bedingtem Reflex (aber auch im Falle der Unbedingung) ist durch einen Hemmungsprozeß im „Analysator" zu erklären. Läßt die Erholung von Hirnzentren längere Zeit keine Wiederholung bedingt-reflektorischer Vorgänge zu, wird von Nachhemmung gesprochen. Die wichtigsten Versuchstiere Pawlows waren in den ersten Jahren Hunde, später dann Schimpansen. An ihnen machte er sehr bald die Beobachtung, daß Affen in den meisten Situationen eine ganze Reihe von Handlungen vollziehen, die nicht den Bedingungen der jeweiligen Aufgabe entsprechen. Sie probieren im wahrsten Sinne des Wortes verschiedene Mittel und Möglichkeiten aus, um die jeweilige, sich aus der Situation ergebende Aufgabe zu bewältigen. Amerikanische Psychologen beobachteten diesen Vorgang zur gleichen Zeit und unterzogen dieses Verhalten als „Versuch und Irrtum" einer genaueren Analyse. Pawlow bezeichnete dieses Verhalten als „chaotische Reaktion", die als ein Durcheinander von Erregung, Hemmung, ausgearbeiteten Differenzierungen oder hypnotischen Phasen gedeutet wurden. Er konnte zeigen, daß Tiere in einer ihnen unbekannten Situation prinzipiell zunächst mit einer „chaotischen" Reaktion beginnen. Dadurch produzieren sie quasi zufällig Umstände und Konstellationen, die früheren Situationen in bestimmtem Umfang entsprechen und so, gemäß damals gebildeten zeitweiligen Verbindungen, beantwortet werden können. In seinen Affenversuchen wies Pawlow weiterhin nach, daß Affen über keine verallgemeinerten (abstrakten) Vorstellungen verfügen. In einem Versuch z.B. holte ein Affe vom Lande Wasser, um ein Feuer auf einem Floß zu löschen, statt das Wasser aus dem See zu schöpfen, was er sehr wohl gelernt hatte. Tiere entwickeln augenscheinlich nur „gegenständliche Relationen des Verhaltens". Die Tiere und Menschen haben ein Signalsystem der Wirklichkeit gemeinsam. Darüber hinaus verfügt der Mensch durch seine Sprache, die im Prozeß der historischen Entwicklung unter der Einwirkung sozialer Faktoren entstand, über ein neues Prinzip der Nerventätigkeit: über die Abstraktion. Die Entstehung bzw. das Erlernen abstrakter Kenntnisse folgt nach Pawlow ungefähr dem nachstehenden Schema:

Lernen nach dem K o n z e p t von bedingendem Signal

33

Elementare Kenntnisse ergeben sich nach P A W L O W aus primärer Generalisation bedingter Reflexe (Ähnlichkeitsassoziationen). Diesem Vorgang liegt eine Art „Verwechslung" ähnlicher Sachverhalte zugrunde. Der elementaren Verallgemeinerung nicht differenzierter Sachverhalte steht dann Differenzierung und Unterscheidung ( = sekundäre Generalisation; Kenntnis der Dinge nach ihren je individuellen, konkreten Besonderheiten) gegenüber. Die Zusammenfassung der Gegenstände und Erscheinungen auf Grund ihrer wesentlichen Merkmale kann dann mit bedingten Reaktionen (meist Wörtern) gekoppelt werden. So wird die Bildung des zweiten Signalsystems möglich. Also alles, was an Eindrücken, Empfindungen, Gefühlen und Vorstellungen von unserer Umwelt gelernt wird, bildet nach P A W L O W das erste Signalsystem; dies haben wir mit den Tieren gemeinsam. Das Wort aber ermöglicht ein zweites, speziell dem Menschen eigenes Signalsystem für die Wirklichkeit. Das Wort ist das Signal der ersten Signale. „Das Wort ist natürlich für den Menschen ein ebenso realer bedingter Reiz wie alle anderen bedingten Reize, die auch bei Tieren auftreten. Das Wort kann alle Reize ersetzen und kann deshalb auch alle Tätigkeiten und Reaktionen des Organismus hervorrufen, die durch diese Reize bedingt werden*)." Zahlreiche Wortreize entfernen uns einerseits von der Wirklichkeit. Wir müssen uns deshalb ständig erinnern und überprüfen, um unser Verhältnis zur Wirklichkeit nicht zu entstellen. Aber: „Andererseits hat uns gerade das Wort zu Menschen gemacht,... Es unterliegt jedoch keinem Zweifel, daß die Grundgesetze, die für die Funktionen des ersten Signalsystems aufgestellt worden sind, auch für das zweite Signalsystem gelten müssen, denn es handelt sich bei dieser Arbeit immer um das gleiche Nervengewebe." ( P A W L O W „Bedingte Reflexe" Med. Enzykl. 33,1936.) An Kindern wurde besonders von A. G . I W A N O W - S M O L E N S K I und N. I. K R A S N O G O R S K I die Hypothese vom 2. Signalsystem überprüft. Dabei soll die Reizersetzung durch einen verbalen Stimulus tatsächlich die gleiche Reaktion hervorrufen wie der originäre Reiz. Ob das Wort gesprochen, gehört oder gelesen wird, der bedingte Reflex soll stets zustande kommen**). Abschließend sei darauf hingewiesen, daß die Arbeiten P A W L O W S am konsequentesten von K . M . B Y K O W fortgeführt wurden. Er nahm vor allem die Lösung folgender konkreter Aufgaben in Angriff: ») PATLOT, J. P.: Werke, Bd. IV, S. 341 (1954). **) PSCHONIK, A. T.: a. a. O., S. 271 ff. (1956). 3 Haseloff-Jorswieck, Psychologie

34

Lernen nach dem Konzept von bedingendem Signal

1. D i e Untersuchung der funktionellen Beziehungen der Hirnrinde zu den inneren Organen und den Gewebsvorgängen, z. B. den Oxydationsprozessen. 2. D i e Erforschung der Möglichkeit der Entstehung bedingter Reflexe aus Reizen, die v o n inneren Organen ausgehen, und die Erforsdiung der Interorezeptoren (innere Sinnesorgane). 3. D i e Klärung der Wechselbeziehungen zwischen zeitweiligen extero- und interorezeptorischen Verbindungen. 4. D i e Analyse des Mechanismus der zeitweiligen Verbindung der inneren Organe und der Gewebsprozesse.

Zusammenfassend kann gesagt werden, daß die PAWLOwschule für die Lernforschung grundlegende Bedeutung erlangt hat. Besonders die Untersuchungen zum zweiten Signalsystem, zur Pathologie des Verhaltens und zur Aufklärung der Zusammenhänge zwischen Lernen und Gesamtorganismus sind noch nicht ausreichend ausgeschöpft. Mit dieser Aufzählung ist bereits der Bereich abgesteckt, in dem sich die vorwiegende Kritik gegen die überdehnte Anwendung des Konzepts „bedingter Reflex" bewegt. So betont D. O. HEBB*), daß Kinder die Bildung bedingter Reflexe (primary learning) sehr viel schneller vollziehen als der Erwachsene, der eine vergleichsweise viel größere Zahl von Assoziationen zur Verfügung hat. LASHLEY**) zeigte, daß niedere Tiere und Schwachsinnige bei sehr einfachen Lernforderungen ebenso schnell lernen wie der durchschnittliche Mensch. Die Behauptung von der Wichtigkeit der Sprache für das zweite Signalsystem ist mehrfach angezweifelt worden, insbesondere ist nicht nachgewiesen, wie die jede Sprache charakterisierenden, völlig inkonkreten Füllwörter als „bedingte Reflexe" wirksam werden können, da diese nie „Agenzien" anschaulicher Art oder gar vorstellungsfähig sind*'"1'*). Weiterhin haben die Fortschritte der Neuroanatomie und der Neurophysiologie einige Implikationen des PAWLCiwkonzepts aufgelöst. So wurde demonstriert, daß die Behauptung PAWLOWS, der konditionierte Reflex errege im „Analysatorbereich" gleichzeitig das Zentrum des unbedingten Reflexes, nicht zutrifft+). Gleichzeitige sensorische und motorische Aktivität genügt nicht, einen bedingten Reflex zu etablieren, wenn die motorische Reaktion direkt *) HEBB, D. O.: The organisation of Behavior. S. 115, N . Y. (1961). **) LASHLEY, K. S.: Nervous Mechanism in learning. S. 529, Worcester (1929). ***) Vgl. Krasners Tabelle über positive und negative verbale Konditionierungserfolge. S. 160, Studies of the conditioning of verbal behavior, Psych. Bull. 55 (1958). + ) ZENER, K.: The Significance of behavior accompanying conditioned salivary sécrétion for théories of the conditioned response, Amer. Journ. Psych. 50, 384—403, (1937).

Lernen nach dem K o n z e p t von bedingendem Signal

35

durch Reizung der motorischen Cortex erzeugt wird (LOUCKS 1935)*), was gerade nach der Basisauffassung der Reflexologen leichter vollziehbar sein müßte. Von den vielfältigen, neuen Befunden der Neurophysiologie sind im Zusammenhang mit dem Problem des „bedingten Reflexes" vielleicht folgende von gewisser Bedeutung: Die meisten quergestreiften Muskeln zeigen eine eindeutige Versorgung durch einen „spezifischen" N e r v , der dann auch isoliert auf Bedingungen reagieren mag. Derartige Konditionierungen werden bereits kompliziert, wenn ein Muskel zwei- oder polynerval versorgt wird und in der Muskelreaktion sowieso ein Defizit hervorgerufen wird. N u n ist gerade ein für das Sprechen nicht unwichtiger Muskel (Krikothyreoideus) doppelt versorgt (Laryngicus superior und laryngicus medius). Ähnlich ist die ursprüngliche Hypothese von der Erregungsausbreitung in der motorischen Cortex weiter aufzudifferenzieren, da sich bei der isolierten Reizung einer motorischen (Pyramiden-) Zelle zeigte, daß die anodale Elektrode eine nach Dauer und Intensität andere Muskelbewegung auslöst als die kathodale Erregungssetzung der gleichen Pyramidenzelle**). Andere hirnexperimentelle Befunde zeigen recht unterschiedliche Wirkungen der Abtragung von Hirn teilen auf konditionierte Reflexe; so lassen sich bei Katzen, Pavianen oder Halbaffen einmal Verstärk u n g e n * * * ) z. B. von bedingten Fluchtreflexen nachweisen, zum anderen Abschwächungen + ) aufweisen. Aber auch die Datensammlung von PENFIELD und PEROT + + ) macht die Existenz einer „interpretativen" Cortex, und nicht einer reflektorischen, wahrscheinlich. Über diese, die Pawlowsche Hypothese angreifende Kritik hinaus, ist zu sagen, daß der praktische Ertrag weitgehend im medizinischtherapeutischen Bereich verblieben ist. Pädagogische Auswirkungen sind — abgesehen vom Gewohnheitslernen in der Kleinkinderzeit — nicht zu verzeichnen. Ein Unterrichtsvorhaben höherer Schülerjahrgänge, in dem bedingte Reflexe 2. und höherer Ordnungen oder gar methodische Manipulationen im 2. Signalsystem gezielt eingesetzt wurden, sind nicht bekannt geworden.

*) HEBB, D. O.: a. a. O., S. 176 (1961). * * ) Li, C. L.: Cortical intracelluar synaptic potentials in response to thalamic Stimulation. J. Cell. Comp. Physiol. 61, 165—179 (1963). [Nach S. OCHS: Elements of Neurophysiology, N. Y. (1965).] * * * ) MOORE, R. Y.: Effects of some rhinencephalic lesions on retention of conditioned avoidance behavior in cats: J . Comp. Phys. Psychol. 57, 65 (1964). + ) SATINOFF, E.: Behavioral thermoregulation in response to local cooling of the rat brain. Amer. Journ. Physiol. 207, 1389 (1964). + + ) PENFIELD, W., & P. PEROT: The trains record of auditory and visual experience, Brain 86, 595 (1963). 3*

6. Lernen am Erfolg Es ist vor allem das Verdienst E. L. T H O R N D I K E S * ) , daß die amerikanischen Lerntheoretiker durch ihre Fragestellungen (und dann durch ihre Ergebnisse) der Pädagogik wichtige Einsichten vermittelt haben. Als einer der wichtigsten Pioniere der Lernforschung hat THORNDIKE ihren charakteristischen Stil mitbestimmt — einen Stil, der durch methodische Exaktheit, durch experimentelle Fundierung und durch pädagogische Intentionierung gekennzeichnet ist. Wie alle Behavioristen betrachtete THORNDIKE das Lernen als eine Angelegenheit des ganzen Organismus und des gesamten Verhaltens. Durch diesen sehr breiten Ansatz sollten Freiheit des Experimentierens und zugleich Aufschlüsse über die menschliche Natur überhaupt gewonnen werden. Wie andere frühe Behavioristen experimentierte auch der Funktionalist THORNDIKE vorzugsweise mit Tieren, zunächst mit Hühnern, Katzen und Hunden. Er entwarf 15 Probierkästen für Katzen, 9 für Hunde und 3 für Hühner. Dann experimentierte er auch mit Ratten, weil diese nur wenig mehr als der Mensch durch Instinkte festgelegt sind. Man kann deshalb viele der aus ihrem Lernverhalten abgeleiteten Gesetze unter Beachtung entsprechender methodologischer Voraussetzungen auf menschliches Lernverhalten übertragen. THORNDIKE hat diesen Ansatz später auf Anregung von J . M. C A T T E L L , der ihn an die Columbia-University holte, durch Experimente mit Schulkindern voll bestätigt. Wie andere Lerntheoretiker ging auch THORNDIKE vom Assoziationsmodell aus. Jedoch bedeutet es bei ihm nicht wie bei den Assoziationspsychologen die Verknüpfung von Einzelvorstellungen mit seelischen Inhalten, sondern die Verknüpfung eines Stimulus mit einer Reaktion. Nach seiner Auffassung ist Verhalten, wenn es nicht instinktgesteuert ist, zunächst zufällig (vgl. auch P A W L O W S „Chaotische Reaktion"). Auf einen Stimulus können vielfältige und zunächst weitgehend beliebige Reaktionen erfolgen. Eine Ratte muß z. B. zu *) EDWARD LEE THORNDIKE w u r d e a m 31. August 1874 geboren. Er w a r bereits 1903 Professor f ü r Psychologie a m T e a d i i n g C o l l e g e der C o l u m b i a - U n i v e r s i t y , N e w Y o r k . Er leitete an dieser U n i v e r s i t ä t die psychologische A b t e i l u n g und d a s Institut f ü r wissenschaftliche pädagogische Forschung, THORNDIKE starb a m 19. August 1949. Seine bekannteste Veröffentlichung ist sein Buch „Psychologie der Erziehung" u n d die mehrmals a u f g e l e g t e D i s s e r t a t i o n : ,Animal Intelligence" (1898). Dieses W e r k h a t einen bis heute nachwirkenden Einfluß auf die amerikanische Schule, vor a l l e m durch die Betonung des experimentellen Verhaltens, des Erfolges u n d der M o t i v a t i o n .

Lernen am Erfolg

37

ihrem Futter gelangen, kann das aber nur, wenn sie eine Tür öffnet, die durch ein System von 3 Klinken verriegelt ist. Das System ist für sie nicht durchschaubar. Sie vollführt nun zufällige Bewegungen, unter denen auch die richtigen sind. Bei hinreichend häufiger Wiederholung des Versuches werden die falschen Bewegungen dann seltener. Nach einer bestirnten Zeit erfolgen nur noch die richtigen Bewegungen, wenn die Ratte ausdauernd genug war. Das Versuchstier hat gelernt, allerdings ohne einsichtiges „Verstehen". Dieses Lernen am Erfolg ist auch beim Menschen häufig anzutreffen*). Alles Lernen läßt sich in dieser Betrachtungsweise auf das Verhältnis von Versuch und Irrtum, „trial and error learning", zurückführen, bei dem die Irrtümer oder Fehler allmählich vermieden und die richtigen, zum Ziele führenden Handlungen in immer kürzerer Zeit ausgeführt werden. Die richtigen Handlungen üben sich durch Gebrauch ein und die unrichtigen werden durch Nicht-Gebrauch weniger leicht reproduzierbar. Die Tiere lernen „by trial and error, and accidental success" („durch Versuch und Irrtum und durch zufälligen Erfolg"). T H O R N D I K E begründete die als „Connectionism"**) bezeichnete Richtung der Lerntheorien. Lernen ist danach die Bindung und Verstärkung der assoziativen Beziehungen zwischen dem Stimulus S und der Reaktion R. Die Stärke der S-R-Beziehung entspricht dem Grad der statistischen Wahrscheinlichkeit, mit der auf eine wiederholt begegnenden Situation wiederholt geantwortet wird. Tiere lernen überwiegend, indem sie bestimmte Verhaltensweisen direkt an Situationen binden. Auch ein großer Bereich menschlichen Lernens läßt sich mit Hilfe des Frequenz- und des Effektgesetzes erklären, wonach durch die gehäufte Bindung („bind" oder „connection") der Situation an die erfolgreiche Bewegung letztere erleichtert wieder auftritt. Zwei Gesetzmäßigkeiten hat T H O R N D I K E für das Lernen im Sinne langfristiger Neuanpassung gelten lassen, ein Frequenzgesetz (entspricht dem Frequenz-Gesetz von EBBINGHAUS), das er später das Prinzip der „exercise" nannte und das Gesetz des Effekts. Später formulierte T H O R N D I K E seinen Begriff „Erfolg" nur in „pleasure" und später in „satisfaction". Negative Verhaltenskonsequenzen sollten ebenfalls die Lernwirkung modifizieren***). 6. 1. Das Frequenzgesetz Eine Reaktion (R), die auf einen Stimulus (S) folgt, wird durch Wiederholung verstärkt, bei NichtÜbung geschwächt. Die Verbindung * ) THORNDIKE formuliert dies so: „ D a s Tier hat nidit mehr bewußte Einsicht in den Ursadienzusammenhang mit dem Effekt als sie der Mensch hat, der gewohnheitsmäßig die Tür durdi Drehen des Türknopfes öffnet." „Adult learning" N . Y . (1927). * * ) THORNDIKE, E . L . : „Selected Writings from a Connectionist's Psychology", (1949). * * * ) THORNDIKE, E. L . : The fundamental of Learning, 312, N . Y . (1932).

38

Lernen am E r f o l g

S — R nennt THORNDIKE „Konnexion" (hieraus wird der Terminus Connectionismus verständlich.) Lernen ist danach also die Herstellung und Verstärkung der assoziativen Beziehungen zwischen einem Stimulus und einer Reaktion. Der Grad der Verstärkung ist abhängig von der Intensität, der Dauer und der Häufigkeit, mit der sie vollzogen oder gebraucht wird*). Ist eine Assoziation einmal konstelliert, so ist die Wahrscheinlichkeit, daß beim Auftreten der gleichen Situation auch die gleiche Reaktion vollzogen wird, groß. Übung führt zu mechanischem Handlungsablauf, zu problemlos ablaufendem und daher ökonomischem Verhalten. Deshalb kann in der Schule auch nie ganz ohne Übung gelernt werden, da hiermit die Zahl der Erfolge erhöht wird.

6. 2. Das Effektgesetz Das Effektgesetz behandelt die Rüdewirkung der Zielerreichung auf die Handlung. Es sagt aus: Wichtig bei der Verstärkung einer Assoziation ist der Nacheffekt. Eine Konnexion wird gefestigt, wenn die Reaktion zur Spannungsreduktion des Organismus, also zu einem befriedigenden Resultat führt („positiver Nacheffekt"). Ist das Ergebnis dagegen nicht befriedigend („negativer NachefTekt"), so wird die Konnexion geschwächt. Bei Lustgefühl (durch Gratifikation und Spannungsreduktion) prägt sich eine Assoziation ein. Unlustgefühl (Mißerfolg, Frustration, Strafe) schwächt sie, ist aber zugleich neuer Anreiz, solange weitere Reaktionen auszuführen, bis die richtige auftritt. Diese wird mit der Situation zu einer Assoziation verbunden, bei der die Wahrscheinlichkeit der Wiederholung groß ist. Die Richtigkeit des Effektgesetzes wurde durch viele Versuche mit Ratten im „Hampion-Co«rf a -Labyrinth geprüft. Vor allem aber fundiert das Effektgesetz diejenige Lerntheorie, die große Zustimmung in der Lehrerschaft gefunden hat. Dieses Gesetz hat zudem theoretische Bedeutung in einem die Grenzen des „Lernens" im engeren Sinne weit überschreitenden Umfang. So wird es auch angewandt auf den Prozeß des Mißlingens oder Gelingens innerhalb einer Persönlichkeitsentwicklung. Seine beiden Basisannahmen ergänzte THORNDIKE in den Weiterentwicklungen seiner Theorie durch mehrere Hilfshypothesen: a) Das Prinzip der multiplen Reaktion Das Fehlschlagen des ersten Versuches, der zur Erlangung der Triebbefriedigung unternommen wurde, bildet in Verbindung mit den verbleibenden Anreizen der Situation den Stimulus für eine neue *) THORNDIKE, E. L . : »The original Nature of man", S. 170.

Lernen am E r f o l g

39

Reaktion. Vielfaches Reagieren oder variierte Reaktion ermöglicht auch vielfache Reaktionsauslese. Mit der Annahme, multiple Reaktionen führten zu jener für den Organismus erfolgreichen Reaktion, hängt eine weitere, von T H O R N DIKE als Gesetz formulierte Annahme zusammen: b) Das Gesetz der Bereitschaft Es behandelt die physiologischen Vorbedingungen einer die Triebbefriedigung herbeiführenden Handlung. „Bereitschaft" ist eine Gesamteinstellung des Organismus, durch die möglichst viele potentielle Reaktionen aktualisiert werden können. Dies versuchte T H O R N D I K E durch eine „statistische" Neuronenleitungstheorie zu verifizieren. Speziellere Annahmen machte T H O R N D I K E über die durch Übung gestiftete Assoziationsstärke in bezug auf die Lernsituation. c) Teilwirksamkeit der Situation Ist die Verbindung einer definierten Situation mit einer bestimmten Reaktion zustande gekommen, so wird später bereits irgend ein Element der neuen Situation dazu tendieren, die gleiche Gesamtreaktion hervorzurufen. Die Verbindung knüpft vor allem an jene Elemente der Totalsituation an, die sich durch Kontrast, Intensität und Affektbetonung auszeichnen (auch bekannt als „Identität von Elementen"). Nach dem Prinzip der bedingten Reaktionen können auch umgekehrt die Reaktionen an andere als die ursprünglichen Reize angeknüpft werden (substituierter Reiz). Reaktionen können also auch an Vorstellungen, nicht nur an Sinneseindrücke gebunden werden*). THORNDIKES Arbeit über T r a n s f e r bedient sich auch dieser „identischen Elemente" und hatte im weiteren pädagogische Auswirkungen. Seine berühmte statistische Analyse der Buchstabenhäufigheit hat sich in dem auch heute noch als Schulstandardbuch bekannten T H O R N D I K E LoRGE**)-Dictionary niedergeschlagen. Das praktische Vorgehen in der Schule war also beherrscht von der THORNDiKEschen Hypothese, daß Kindern keine generellen Regeln zu lehren sind, sondern ähnliche Elemente anzubieten seien. Im Zusammenhang hiermit stehen zwei weitere THORNDiKE-Regeln: *) Nur selten bildet der Mensch Assoziationen mit der gesamten Situation. Meist wird seine Reaktion nur durch Teilelemente der Situation bestimmt. Danach findet also ganzheitliches Lernen nur ganz selten statt. Aus der Lage wird jeweils die Situation ausgelesen, aus ihr wieder ein Teilbereidi, auf den reagiert wird. Da sich die Persönlichkeit dfifferenziert, muß also audi die Situation differenziert werden. „Ganzheitliche 0 Reaktionen wären z. B. nur bei starkem Hunger zu erwarten. Sonst aber beantwortet der Mensch nur, was für ihn wichtig ist. Im Gegensatz zum Tier ist sein Wahrnehmungsfeld größer als sein Aktionsfeld. **) THORNDIKE, E. L. & L. LORGE: The Teadier's word book of 30 000 words N. Y. (1944).

40

Lernen am Erfolg

d) Reagieren nach Analogien Dieses Gesetz geht aus dem Assoziationsprinzip hervor. Wenn ein Reiz dazu tendiert, eine bestimmte Reaktion hervorzurufen, so haben auch die ihm ähnlichen Reize die gleiche Wirkung (eine Parallele zum Spread-efTekt). e) Die assoziative Verschiebung Hier liegt die nämliche Tatsache zugrunde wie bei dem Reagieren nach Analogien. Eine Reaktion, die an eine bestimmte Situation gebunden war, kann auch auf andere, ähnliche Situationen übertragen werden. f) Belongingness bezeichnet demgemäß die Zusammengehörigkeit einer Reaktion mit der gesamten Situation. Nach diesem Prinzip wird eine Verbindung leichter gelernt, wenn die Reaktion zur Situation gehört; und ein Nacheffekt ist wirksamer, wenn er zu der assoziativen Verbindung gehört, die er verstärkt. So wird Englisch leichter in England gelernt. In seinen pädagogischen Auswirkungen wurde diese These THORNDIKES heftig angegriffen, denn die Gegenwartsgebundenheit des Lernstoffes führte, wie die Kritiker des amerikanischen Schulwesens nach dem zweiten Weltkrieg meinten, dazu, daß Mathematik und die anderen Fächer (Chemie und Physik) nicht gefordert wurden, ebenso wia Fremdsprachen nicht, wenn kein Berufsziel dies verlangte*). Das Frequenz- und das Effektgesetz schienen die Eliminierung unrichtiger und die Fixierung richtiger Reaktionen zu erklären. Später zeigte THORNDIKE jedoch, daß das Frequenzgesetz nur eine begrenzte Gültigkeit besitzt. Es ergab sich, daß in Experimenten, in denen es keine anderen Lernfaktoren außer Wiederholung gab, überhaupt kein Lernen erfolgte. Diese Erkenntnis ergab sich ja bereits aus der Kritik an den Ebbinghaus-Experimenten (Kap. 3), die — wie auch W. JAMES formulierte — nur zeigten, daß die Reproduktion eines frequent angebotenen Gedichtes nichts über die Lerndauer eines neuen Gedichts besagt. Werden aber positive Nacheffekte in Form von Belohnungen für die richtigen Reaktionen eingeschaltet, so ergaben sich deutliche Lernerfolge. Außerdem zeigte sich, daß negative Nacheffekte nur in bestimmten Fällen die Reaktion schwächen. Oft wird eine Reaktion sogar durch negative Nacheffekte verstärkt. Der negative Nacheffekt bildet also in dieser Hinsicht keinen Gegensatz zum positiven Nacheffekt. Das Gesetz des positiven Nacheffektes ist somit das primäre Gesetz des Lernens. Dem Frequenzgesetz kommt daher nur sekundäre Bedeutung zu. *) MAYER, M.: The sdiools, S. 79, N . Y. (1961).

Lernen am Erfolg

41

Bloße Wiederholung ohne Nacheffekte bedingen also kein Lernen und negative Nacheffekte können die gelernten Assoziationen gegebenenfalls auch verstärken. Im letztgenannten Fall bleibt nämlich die Aufgabe unerledigt bestehen. Insgesamt erwies sich das „Effektgesetz" als primäres Lerngesetz. Pädagogisch gesehen kommt dem Lob als positivem Nadieffekt große Bedeutung zu, während die Strafe fragwürdig bleibt, da sie gegebenenfalls das bestrafte Verhalten sogar verstärken kann*). Nach 1930 erweiterte T H O R N D I K E seine Theorie durch drei neue theoretische Konzepte: „belongingness", „polarity" und „spread of effect". Die Richtung der gestifteten Lernassoziationen betrifft die Hypothese von der g) Polarität: Assoziationen werden dann leichter in der Richtung reproduziert, in der sie gestiftet wurden, als umgekehrt. H a t man also Vokabeln deutsch-englisch gelernt, fällt es einem schwer, sie umgekehrt zu reproduzieren. Auch hier ist daran zu erinnern, daß stark polarisierte (entgegengesetzte) Assoziationen sich wegen ihrer Kontrastwirkung leichter einprägen können und daß zu große N ä h e Vertauschungen herbeiführen kann. In engem Zusammenhang hiermit steht die Annahme von der Ausbreitungswirkung. h) Spread of effect: Reaktionen, die in zeitlicher Nachbarschaft mit erfolgreichen Reaktionen stehen, werden gleichfalls mitverstärkt. Belohnungen stärken also nicht nur die primär gelernte Verbindung, sondern auch die benachbarten Reaktionen. Zum Beispiel wird eine Reiz-Reaktionsverbindung nicht nur durch auf sie unmittelbar bezogene Belohnungen verstärkt. Vielmehr führt die Belohnung auch zur Verstärkung der Auftretenswahrscheinlichkeit strukturell verwandter Reiz-Reaktions-Verbindungen. Diese These erklärt für den pädagogischen Bereich, daß gemeinsam mit der Veränderung von Transferinhalten einstmals Gelerntes negativen Beigeschmack erhält und dann eine Beschäftigung mit „akademischen" Gegenständen sowohl für den Lehrer als auch erst recht für den Schüler nahezu ausschloß. Eine andere Kritik richtet sich gegen den Erfolgs-, Lust- oder Belohnungsbegriff; denn die zu trainierende K a t z e o. ä. Tier „weiß" doch nichts von seiner Belohnung; im Experiment mit jüngeren Kindern zeigt sich, daß diese sehr wohl bemerken, in welcher engen Bindung ihre Belohnung mit der vorangegangenen ihnen abverlangten Leistung steht, und demgemäß audi ihre Lernleistung feinsinnig steuern. * ) Weiterhin definiert S t r a f e ein Verhalten nur als falsch, ohne zugleich zu zeigen, welches Verhalten als richtiges gefordert ist.

42

Lernen am E r f o l g

Die Freude und das frühe Interesse T H O R N D I K E S an messenden psychologischen Verfahren*) brachte es nahezu zwangsläufig mit sich, daß nur das als gelernt galt, was meßbar, d. h. von der Person oder dem Tier ausgedrückt wurde in Sprache oder Bewegung. Alles, was gegenwärtig als „latentes Lernen" verstanden wird, umfaßt gerade jene nicht im aktuellen Verhalten beobachtbare Neuanpassung. Zusammenfassend kann gesagt werden: Die Lerntheorie T H O R N D I K E S erklärte systematisch den Aufbau von Gewohnheiten und das Erlernen von Fertigkeiten. Gleichzeitig stellt die Einbeziehung der Wahrscheinlichkeitsbetrachtung in die Lernforschung einen entscheidenden und weiterwirkenden Fortschritt dar. T H O R N D I K E nimmt wie viele Psychologen an, daß sich Gewohnheiten, Reiz-Reaktionsverbindungen und Gedächtnisinhalte ohne bewußtes Auswählen und Stellungnahme des Menschen ausbilden. Andererseits akzeptiert er, daß das planvolle Auswählen eines Teilinhaltes der Situation dem Erlebnisablauf — besonders dem Denken — eine aktional bestimmte Richtung gibt. Beim selektiven Lernen werden also bestimmte Teile einer Situation bevorzugt oder vernachlässigt. Komplexe Situationen werden dadurch differenziert. Ein sehr spezieller Teilinhalt eines äußeren Ereignisses oder inneren Gedankenablaufs kann daher Anknüpfungspunkt für weiteres Denken und Handeln werden. Das Lernen durch schlußfolgerndes Denken steht den Gesetzen der Gewohnheit nicht entgegen, sondern erwächst gleichfalls aus diesem Geschehen. Von großer Bedeutung für die Schule aber ist T H O R N D I K E S Erkenntnis, daß alles Lernen analytisch**) ist. Die assoziative Verbindung erfolgt nur selten mit der gegebenen Gesamtsituation. Vielmehr begrenzt sie sich auf Teilbereiche der Situation. So kommt es stets zur Koppelung von Teilsituationen mit Teilreaktionen. Diese Nebenassoziationen bewahren sich stets einen gewissen Grad an Selbständigkeit.

*) THORNDIKE, E. L.: A n I n t r o d u c t i o n to the Theory of Mental and social Measurement. N . Y. (1904). **) So betont THORNDIKE, d a ß „Ganzheiten nicht über das N o t w e n d i g e hinaus vermehrt werden sollten", a. a. O., S. 215.

7. Lernen durch Einsicht Die Gestaltschule stellt eine am Anfang des 20. Jahrhunderts auftretende Gegenbewegung gegen den abstrakten Elementarismus und Empirismus der älteren Assoziationspsychologie dar. Hieraus erklärt sich, daß die Gestaltpsydiologen bemüht waren, die Bedeutung vergangener Erlebnisse einzuschränken. Sehr viele Prozesse, die andere psychologische Richtungen auf vorgängige, wenn auch unterschiedliche Lernvorgänge zurückführen, sucht die Gestaltschule noch heute mit Hilfe des Prinzips einer aktuellen, spontanen Selbstregulation zu deuten. Demgemäß ergab sich in der Experimentiermethode der Gestaltpsychologen eine Yersuchssituation, deren Ende scheinbar „offen" blieb (während bei den Assozionisten in der Versuchsplanung ein streng determiniertes Ende abzusehen war). So wurde vor allem versucht, die Wahrnehmung, später auch andere kognitive Prozesse, durch dieses selbstregulatorische Prinzip zu erklären, das den perzeptuellen oder den anderen Erkenntnisvorgängen aus internen und nativen Systembedingungen heraus eine jeweils optimale, d. h. der vorgegebenen Wirklichkeit angepaßte, Ordnung verleihen soll. Um die Bedeutung der Gestaltpsychologie und ihrer mehrfachen Derivate für die Lernforschung voll würdigen zu können, sei ein kurzer, historisdi-wissenschaftstheoretischer Abriß der Entwicklung der Gestaltschule einleitend gegeben: Als Vorläufer der gestaltpsychologischen Schule ist die auf VON EHRENFELS*) zurückgehende Lehre von der Gestaltqualität anzusehen. VON EHRENFELS demonstrierte seine Auffassung daran, daß eine Melodie nicht als bloße Summe ihrer einzelnen Töne verstanden werden kann. Damit treffen wir auf das erste Gestaltkriterium: Das Ganze ist mehr als die Summe seiner Teile. Das zweite Kriterium betrifft die Transponierbarkeit von Gestalten, in unserem Fall also die Transponierbarkeit der Melodie. Hierbei kann es geschehen, daß in der ursprünglichen Melodie und in der * ) CHRISTIAN FREIHERR VON EHRENFELS (1859—1932) hatte als erster von „Gestaltsqualitäten" eines Ganzen gesprochen, die gegenüber den in ihnen enthaltenen Elementen Unabhängigkeit bewahren sollen. Die semantische Vieldeutigkeit von Begriffen wie „Ganzheit", „Gestalt" usw. hat diese Forsdiungsrichtung von vornherein mit vielen Unklarheiten und einer speziellen, impliziten Erkenntnistheorie belastet.

44

Lernen durch Einsicht

transponierten kein einziger Ton mehr identisch ist. Dennoch ist die Melodie erhalten, d. h. ihre „Gestaltqualität" ist identisch geblieben. Nachdem der Gestaltbegriff durch von EHRENFELS in die Psychologie eingeführt worden war, leiteten sich von diesem Modell — je nach der Auffassung über das Entstehen von Gestaltwahrnehmungen — verschiedene psychologische Schulen ab: 1. Die Leipziger Schule der Ganzheits- und Strukturpsychologie von FELIX KRUEGER, die heute noch von A. WELLEK vertreten wird. 2. Die Grazer Schule mit ihrer Produktionstheorie der Gestaltwahrnehmung von A. M E I N O N G (1894) und BENUSSI sowie: 3. Die Berliner Schule, deren Begründer M. WERTHEIMER und deren Hauptvertreter W. K Ö H L E R , K . KOFFKA SC K . LEWIN waren. Die Berliner Schule ist die empirischer orientierte Lehrmeinung unter diesen Richtungen. So beginnt die Gestaltpsychologie als eine im engeren Sinne psychologische Theorie mit der Arbeit von M A X W E R T HEIMER*): „Über das Sehen von Bewegungen**)." Obwohl Zeit- und Raumperzeptionen Gegenstand umfassender Forschungsarbeiten gewesen sind, hatte man die Bewegung, deren Erfassung sowohl eine Raum- als auch eine Zeitperzeption voraussetzt, bis zu diesem Zeitpunkt vernachlässigt. WERTHEIMER faßte die Bewegung als eine Erscheinung auf, die nicht weiter in einzelne Bestandteile zerlegt werden kann, und postulierte damit die Identität von Reiz und Wahrnehmung. Er stellt in seiner Arbeit die bereits bekannte Tatsache zur Debatte, daß z. B. in der Dunkelheit zwei leuchtende Punkte, die kurz hintereinander aufleuchten, den Eindruck vermitteln, daß sie hin und her springen. Es wird in sie eine Bewegung hineingesehen, die in der objektiven Reiz-Konfiguration nicht gegeben ist. WERTHEIMER nannte dieses Sehen einer nicht existierenden Bewegung das „Phi-Phänomen". Die Hypothese WERTHEIMERS ging also auf eine Betonung der bereits vororganisierten Beziehungen der Wahrnehmungsmuster, die durch Wiederholungen der Perzeption diese „Organisation" erleichtert. Auch andere Wahrnehmungsphänomene wurden stets in Ablehnung einer reinen Reduktion auf atomistische Sinneseinheiten erklärt. So wurde in einer umfangreichen, experimentellen Untersuchung des Denkens und der Wahrnehmung erneut die „Bündel-Hypothese" der alten Assoziationspsychologie widerlegt, nach der sich das bewußte *) MAX WERTHEIMER, der Begründer der Berliner Sdiule der Gestaltpsychologie, wurde 1880 in Prag geboren. Er war Schüler Oswald KÜLPES, Leiter der „Würzburger Sdiule" und Initiator der experimentellen „Denkpsydiologie" in Deutschland. 1918 wurde WERTHEIMER a. o. Professor in Berlin und arbeitete hier bis zum Jahre 1929. D a n n ging er als o. Professor nach F r a n k f u r t . 1933 emigrierte er in die USA und hatte — bis zu seinem Tode im Jahre 1943 — eine Professur in N e w York inne. **) Zeitschrift f ü r Psychologie und Physiol. der Sinnesorgane, 161—265 (1912).

Lernen durch Einsicht

45

Erleben aus Elementen, etwa aus Empfindungen, Vorstellungen oder Gefühlen atomistisch zusammensetze. Die Gestaltpsychologie betont demgegenüber die Nichteindeutigkeit der Beziehungen zwischen Reiz und Empfindung. Ein roter Fleck in einem entsprechenden Umfeld erscheint nicht mehr rot, grau kann in einem entsprechenden Umfeld rot aussehen usw. Jede Wahrnehmung erweist sich also als eingebettet in den aktuellen Gesamtzustand unseres Erlebens. WERTHEIMER nannte die „atomis tischen" Verbindungen von psychischen Elementen „Und-Verbindungen" und betont dagegen: Das bewußte Erleben, bzw. die ihm entsprechenden Vorgänge im Gehirn seien „Gestalten", d. h. sich selbst gliedernde Komplexe von psychischen bzw. gehirnphysiologischen Vorgängen, in denen alle Einzelvorgänge zusammenwirken. Alle Einzelvorgänge wirken aufeinander, keiner könne geändert werden, ohne daß sich die anderen mitändern, so daß das „Ganze" und seine Glieder sich wechselseitig bestimmen. In dieser allseitigen Wechselwirkung sei die „Gestalt" ein bevorzugter Gleichgewichtszustand, der phänomenal über die Qualitäten der Glieder dominiert und der das mehrdeutige Reizfeld vereindeutigt. Das „Ganze" ist dabei genetisch und funktional vor dem Einzelelement (Reiz) gegeben. Die Berliner Schule verzichtete darüberhinaus auch — im Gegensatz zur österreichischen Schule — auf die Annahme von zu den Gestalten zusätzlich zur Summe der Teile hinzuzuordnenden Inhalten. In ihrer Auseinandersetzung mit dem Behaviorismus verneinte sie die Möglichkeit einer konstanten Zuordnung von Reizen und Empfindungen (Konstanzannahme), und in Ablehnung der Assoziationspsychologie interpretiert sie das Entstehen von Ganzheiten durch das räumlichzeitliche Zusammentreffen von Teilen*). Nach KÖHLERS**) Konzeption unterscheiden sich die psychophysischen Gestalten nicht prinzipiell von den physischen Gestalten in der anorganischen Natur. Vielmehr sind sie strukturell isomorph. Daraus folgt, daß psychische und physische Gestalten, also auch die bioelektrischen Prozesse des Gehirns, mit den gleichen, nämlich physikalischen Methoden beschreibbar sind. Unsere Skizzierung der Entwicklung der Gestaltschule macht verständlich, daß im Laufe der Zeit der Gestaltbegriff selbst einen außerordentlich weiten Umfang angenommen hat. Die Gestaltschule spricht im einzelnen von: *) Von einer modernen wissenschafts theoretischen Auffassung her bleiben solche Interpretationen semantisch weitgehend sterile „Spradispiele". **) WOLFGANG KÖHLER wurde 1887 geboren. Er w a r Schüler von STUMPF. (Dieser hatte 1894 das von EBBINGHAUS in Berlin gegründete Laboratorium übernommen. W e r k : „Die Tonpsydiologie".) Nadi der Emeritierung STUMPFS im J a h r e 1921 wurde KÖHLER sein Nachfolger. 1934 emigrierte KÖHLER in die U S A .

46

Lernen durch Einsicht

1. Optischen Gestalten ( F i g u r - H i n t e r g r u n d ; Farbgestalten), 2. Bewegungsgestalten (Rhythmische Gestalten, Zeit-Raum-Gestalten), 3. Akustischen Gestalten (Melodien), 4. Taktilen Gestalten (Ziffern, Buchstaben), 5. Gestalten des Geruchssinnes, 6. Denkgestalten (Schlußfiguren), 7. Gefühlsgestalten, 8. Handlungsgestalten.

In dieser Aufzählung wird deutlich, daß der üblichen Einteilung des exterozeptiven Empfindens sowie der alten Trichotomie „Fühlen", „Denken" und „Wollen" bzw. „Handeln" einfach jeweils das Gestaltmodell additiv hinzugefügt ist. Eine besondere Gruppe der Handlungsgestalten wären schließlich die „Lerngestalten". Jeder Lernvorgang setzt sich in dieser Betrachtung nicht aus einer Summe voneinander unabhängiger, elementarer Lernprozesse zusammen. Vielmehr integrieren diese sich im Sinne der Gestaltbildung zu einem einzigen Lernvorgang. In der gleichen Weise bilden die Gedächtnisinhalte Gestalten, und zwar unabhängig davon, ob sie leicht erinnert werden können oder nicht. Ihre Konservierung wird durch eine, allen einmal gebildeten Gestalten innewohnende Kohäsionskraft erreicht, die also dem Zerfall von (Gedächtnis)-Gestalten entgegenwirkt. Gemäß der Ansicht der Gestaltschule folgen die Gestaltbildungsprozesse sämtlich denselben Gesetzen, die nach der IsomorphismusHypothese ebenso für die entsprechenden hirnphysiologischen Vorgänge gelten sollen. Auch alle Lernvorgänge und Gedächtnisinhalte sollen sich im Sinne dieser „Gesetze" organisieren. Die sogenannten Gestaltprozesse und ihre Beschreibungen von Lernvorgängen seien im folgenden skizziert: 1. Gesetz der Prägnanz: Nach diesem Gesetz schließen sich nahe oder gleichartige Elemente „von selbst" zu Gestalten zusammen. K O F F K A hat dieses „Prägnanzgesetz" in folgender Weise formuliert: „Die psychologische Organisation wird immer so gut sein, wie die herrschenden Bedingungen es erlauben" (Tendenz zur guten Gestalt). „Gut" umfaßt hier Eigenschaften wie etwa: Regelmäßigkeit, Symmetrie, Geschlossenheit, Einheitlichkeit, Ausgeglichenheit, maximale Einfachheit, Knappheit*). Hauptbedingung ist hierfür das (visuelle) Feld, das als ein räumliches Konstrukt gedacht ist, dem die Phänomene der visuellen Erfahrung zugeordnet werden können**). Der Organismus hat zudem eine Tendenz zu ganz bestimmten ausgezeichneten Verhaltensweisen, sei es, daß es sich um Wahrnehmun*) K. KOFFKA: Principles of gestalt psychology, 110, N. Y . 1935. * * ) Zit. nadi C. E. OSGOOD, „Method and Theory in Experim. Psychology" S. 200, N. Y . (1961).

Lernen durch Einsicht

47

gen, Denkprozesse, Gedächtnisinhalte, Haltungen oder auch Bewegungen handelt. Dabei ist Prägnanz von den Eigenbedingungen des psychophysischen Organismus oder von einem „inneren Gestaltdruck" abhängig, wodurch dem Organismus jeweils die bestmögliche Leistung abgenötigt werde. 2. Gesetz der Normtendenz der Gestalt: In der Wahrnehmung und vor allem im Erinnerungsbild werden offene „Linien" geschlossen, einzelne „Unregelmäßigkeiten" (einer Gestalt) formal oder empirisch ausgeglichen, so daß eine optimale Eindeutigkeit und Ordnung entsteht. D a ß sich in der psydiophysischen Dynamik Gestalten herausstrukturieren, wird bevorzugt auf dreifache Weise gedeutet: Erstens seien „Gestalten" Korrelate cerebraler Erregungsvorgänge, zweitens seien sie modelliert aus einer Fülle individueller Erfahrungen und drittens entstünden sie aus der Eigengliederung der Reizbedingungen. Dies sind nun auch Bedingungen für eine gestalthafte Gliederung von Lernen und Erinnern. „Lerngestalten" bilden sich im Sinne der folgenden Gestaltgesetze*): 3. Gesetz der Nähe: Die Zusammenfassung der Teile eines Reizgefüges erfolgt unter sonst gleichen Umständen im Sinne des „kleinsten Abstandes". 4. Gesetz der Gleichheit: Werden mehrere verschiedenartige Elemente wirksam, so besteht eine Tendenz zur Zusammenfassung der unter sich gleichartigen Elemente zu Gruppen. 5. Gesetz der Geschlossenheit: Die „Linien", die eine „Fläche"**) umschließen, werden unter sonst gleichen Umständen leichter als eine Einheit aufgefaßt als diejenigen, die eine solche Funktion nicht ausüben, die sich also nicht zusammenschließen.

6. Gesetz der guten Kurve oder des gemeinsamen Schicksals: Diejenigen Teile einer Figur, die irgendeinen Zusammenhang aufzuweisen scheinen, bilden leichter „höhere" Einheiten. Diese Gesetzmäßigkeit beschreibt die verminderte Wahrscheinlichkeit, daß sich Teile, die verschiedenen Gegenständen angehören, zusammenschließen bzw. die größere Wahrscheinlichkeit, daß man optisch in Berührung stehende Objekte richtig „auseinandersieht". Doch beim Lernen und Erinnern führt diese Gesetzmäßigkeit eher zu Fehlinterpretationen vergangener Situationen. 7. Gesetz der gemeinsamen Bewegung: Elemente, die sich gemeinsam oder auf ähnliche Weise bewegen bzw. sich überhaupt (im Gegensatz zu anderen ruhenden) bewegen, schließen sich zusammen. *) Die hier angegebenen 6 mGestaltgesetze" dürften die wichtigsten sein. H E L S O N hat über 100 Gestaltgesetze zusammengestellt und als Sonderfälle seiner Adaptationsleveltheorie erklärt. H. HELSON: „Current trcnds and issues in adaptations-level theory." Amer. Psydi. 19, 26 (1964). **) „Linie" und „Fläche" sind hier — genauer betrachtet — topologisdie Begriffe.

48

Lernen durch Einsicht

8. Gesetz der Erfahrung: Mehrdeutige Reizkonfigurationen schließen sich gegebenenfalls dispositionell leichter zu jenen Gestalten zusammen, die durch individuelle Erfahrung bedingt sind. In dem letztgenannten „Gesetz der Erfahrung" erkennt die Gestaltpsychologie die Mitwirkung der Erfahrung bei der Dingkonstitution an. Dieses Gesetz steht, genau betrachtet, im Widerspruch zum gestaltpsychologischen Prinzip der spontanen Selbstregulation und dürfte die Aufgabe haben, als Korrekturhypothese auch diejenigen Sachverhalte deuten zu helfen, die zum Gestaltprinzip in offensichtlichem Widerspruch stehen. Diese Gestaltgesetze sollen sich, wie schon gesagt, sowohl auf das Gebiet der Perzeption, auf das des Verhaltens als auch auf das Lernen von Menschen und Tieren beziehen. „Lernen" ist in dieser Auffassung nichts anderes als das Bilden relativ stabiler, überdauernder Gestalten. Pädagogische Aufgabe wäre demnach, bevorzugt in der Realität jene Konstellationen aufzufinden, die es dem Lernenden gestatten, sein Inventar an strukturiertem Wissen mit dem Neuangebot in Kongruenz zu bringen. Insbesondere die Postulierung einer „ganzheitlichen Erlebnisweise in der Kinderzeit"*) führte Lehrer und Erzieher dazu, ganzheitlich organisierten Lernstoff in umfangreichen Einheiten anzubieten. Tierisches Verhalten läßt sich nicht selten einigermaßen zwanglos in der Weise interpretieren, daß auch sie in „Gestalten" wahrnehmen, lernen und handeln. Dies zeigen aufschlußreiche Tierexperimente. Das bekannteste ist KÖHLERS Affenversuch. KÖHLER deutete seine Ergebnisse als „Einsicht in die Gesamtsituation", wobei er den Begriff „Einsicht" als die Umstrukturierung des Erlebnisfeldes definiert, die zwar von der vorangegangenen Erfahrung abhängig ist und einer Periode des Probierens und Fehlermachens folgt, aber von dem Augenblick an, in dem die Einsicht gewonnen wurde, kann diese Umstrukturierung leichter wiederholt werden. V o n KÖHLERS E r g e b n i s s e n

a u s g e h e n d , h a t KOFFKA d i e T h e o r i e

des

„Lernens durch Versuch und Irrtum", wie sie z. B. von THORNDIKE dargestellt wurde, im Sinne der Gestaltschule neu gedeutet. Lernen, wie KOFFKA es interpretiert, erscheint als die Bildung von Gestaltqualitäten, die f ü r die vorgegebenen Aufgaben gerade umfangreich und komplex genug sind. Nachdem jedoch ein allgemeiner Trend der Psychologie sich stärker sozialpsychologischen Problemen zuwandte, traten auch Fragen des Gruppenlebens, der Arbeitswelt, der Konflikte in das Blickfeld der Gestaltpsychologen. Mit dem Erscheinen von KOFFKAS „Prinzipien der Gestaltpsychologie" 1935 trat die Gestaltschule in eine neue Phase, in der sich das Inter*) WERNER, H.: Comparativ Psychology of mental development. betont diesen Aspekt in der frühen Kindheitsentwidclung.

N.Y. (1940),

Lernen durch Einsicht

49

esse vom Gebiet der Perzeption stärker auf das der Strebungen verlagerte. Der wichtigste Psychologe in dieser Arbeitsrichtung war K. LEWIN, in dessen Schule vor allem gezeigt wurde, daß Vergessen oder Behalten weitgehend von der Gesamtsituation und von der Handlungsdynamik abhängig ist*). Demgemäß werden nicht nur die handlungsauslösenden Außenreize für das Lernen wichtig, sondern auch der je herrschende Innenzustand des lernenden Organismus fördert oder hemmt die Schaffung strukturierter Ganzheiten. Nicht die Reize lösen danach eine Handlung aus, sondern bedürfnisartige innere Spannungen. Da auch der Lernprozeß als Gestaltbildungsprozeß angesehen wird, bedarf es einer Lernabsicht, um ein dargebotenes Material oder eine Situation zu strukturieren, umzugestalten und/oder zu organisieren. Diese Lernabsicht entsteht durch Bedürfnisse oder Interessen, durch Motivationen. LEWIN**) unterscheidet zwischen „objektiven" Bedürfnissen und „Quasi"-Bedürfnissen. Letztere werden auch als Vorwegnahmen oder abgeleitete Motive gekennzeichnet. Bedürfnisse entstehen, wenn ein Aufforderungscharakter der Umwelt auf ein gespanntes System trifft. Ein zunächst neutraler Wahrnehmungsgegenstand wird erst unter diesem Bedürfnisdruck zum Wirkgegenstand. Die Bedürfnisspannung bzw. der Gestaltungsdruck fordern dem Organismus die bestmögliche Leistung ab. Also werden Mittel zur Bedürfnisbefriedigung gesucht. Sie erfolgt dementsprechend besser, wenn der Organismus motiviert ist; wenn irgendein Gegenstand, Vorgang oder Person Spannungsreduktion „verspricht". Die Bedürfnisbefriedigung vollzieht sich in einer so neu strukturierten Problemsituation. Beim Umstrukturieren werden instrumenteile oder gedankliche Mittel in neuen Gestaltzusammenhängen gesehen und ihre Zweckmäßigkeit zur Bedürfnisbefriedigung kann dann erkannt werden. Lernen erfordert also „Einsicht" in die Anpassungsmöglichkeiten des Organismus an den vorgegebenen Lebensraum. Dabei sind natürlich die gespeicherten und organisierten Gestaltungen und ihr „Schicksal" im Organismus von Bedeutung. KÖHLER beschäftigte sich zusammen mit VON RESTORFF mit den Beziehungen zwischen Wahrnehmungsvorgängen und Gedächtnisleistungen im „Spurenfeld". Dabei wurde als elementare Tatsache des geistig*) ZEIGARNIK, B.: „Das Bekalten erledigter und unerledigter Handlungen" in K. LETIN (Hrsg.) »Untersuchungen zur Handlungs- und Affektpsychologie", Psych. Forschung (1927). **) KURT LEWIN wurde 1890 in Posen geboren. Er w a r o. Professor in Berlin. 1933 emigrierte er in die USA. Er dehnt die Anschauung der Gestaltschule auch auf Triebe und Motive aus und veröffentlichte in den USA vor allem zwei Werke, 1935: „Eine dynamische Theorie der Persönlichkeit", 1936: „Prinzipien einer topologischen Psychologie". 4 H a s e l o f f - J o r s w i e d c , Psychologie

50

Lernen durch Einsicht

seelischen Lebens vorausgesetzt, daß Erlebtes im Gedächtnis behalten und zu späteren Zeiten erinnert wird. Erklärt wird dieser Tatbestand daraus, daß jede Wahrnehmung im Gehirn eine „Spur" hinterläßt, die bei Erinnern und Wiedererkennen von Vergangenem reaktiviert wird*). Man bezeichnet also als Spuren die Korrelate früherer Eindrücke im Zentralnervensystem. Der eigenartigen Ablaufsordnung des ursprünglichen Prozesses entsprechen ebenso eigenartige Gestaltungen der resultierenden Spur. (Wenn eine doppeldeutige Figur AB nur als A erlebt und eingeprägt wird, so kann sie nur dann wiedererkannt werden, wenn sie abermals lediglich als A erlebt wird.) Die Spur wird nicht vom physikalisch-chemisch erzeugten Muster im Sinnesepithel, sondern vom Figurenerlebnis hinterlassen. Jedoch prägen sich nur wenige Spuren so fest ein, daß sie lange Zeit erhalten bleiben; viele Spuren verlöschen früher oder später. Die Orte im Gehirn, an denen die Spuren vergangener Wahrnehmungen zurückbleiben, werden insgesamt als „Spurenfelder" bezeichnet, die nach definierten Regeln organisiert sind**). V O N RESTORFF konnte zeigen, daß isoliert stehende Glieder viel besser eingeprägt und behalten werden als solche, die häufig innerhalb gleichartigen Materials auftreten. Bereichsbildung im Gedächtnis wird nach V O N RESTORFF durch einen Sprung im Ähnlichkeits- oder „Verschiedenheitsverlauf***) einer Reihe bewirkt und bedeutet die gestaltmäßige Abhebung oder Isolierung einzelner Reihenglieder oder Teilbereiche von der Gesamtreihe. Nicht die absolute Größe der Verschiedenheit zwischen den Reihengliedern soll für Häufung, Isolierung und Bereichsbildung maßgebend sein, sondern der „Verlauf der Verschiedenheit". Die Ausbildung eines gleichmäßig verlaufenden festen Bereiches setzt die Reproduzierbarkeit seiner Glieder herab"1"). Gegenüber HÖFFDING, der die These aufgestellt hat, daß jede Reproduktion durch Gleichzeitigkeitsassoziation an eine Reproduktion nach Ähnlichkeitsassoziationen gebunden ist, vertrat K Ö H L E R auf Grund *) Vgl. Engramm, die durch Reizeinwirkung erfolgte Daueränderung organischer (Hirn-)Substanz. **) RESTORFF, H . V.: O b e r die Wirkungen von Bereidisbildungen im Spurenfeld, (1935). ***) Von einem gleichmäßigen Verschiedenheitsverlauf wird dann gesprochen, wenn die Verschiedenheiten von einem Reihcnglied zum nächsten gleich oder annähernd gleich sind; deren absolute Größe soll dabei keine Rolle spielen. Ein Sprung im Verschiedenheitsverlauf liegt vor, wenn der G r a d der Verschiedenheit zwischen zwei Reihengliedern an einer Stelle deutlich größer oder kleiner ist. + ) Die Lernschwierigkeiten der Versuchspersonen in den klassischen Experimenten der Gedächtnispsychologie beruhten also weniger, wie man ursprünglich annahm, auf der N o t w e n d i g k e i t einer künstlichen Zusammenhangsbildung zwischen sinnlosen Materialien; die Lernerfolge würden vielmehr durch die Tendenz monotoner, gehäufter Reihenfolgen bedroht, feste Bereiche auszubilden, innerhalb derer einzelne Glieder nur schwer reproduziert werden können.

Lernen durch Einsicht

51

der RESTORFFschen Versudisergebnisse die Auffassung, daß dies nur der Fall ist, wenn zeitlich verschiedene, inhaltlich jedoch ähnliche Wahrnehmungsprozesse auf jeweils verschiedenen Leitungsbahnen von den Wahrnehmungsorganen zur Hirnrinde gelangen. Erinnern und Wiedererkennen vergangener Geschehnisse wird durch die selektive Wirkung eines aktuellen Prozesses auf die Spur eines ähnlichen, vergangenen Geschehens im Spurenfeld erklärt. Die Gestaltpsychologie hat ihren wichtigsten Beitrag zur Lerntheorie durch die Hypothesenbildung zur Struktur einsichtigen Lernens geleistet. Zum ersten Male beobachtet und beschrieben wurde einsichtiges Lernen von W. KÖHLER. Auf Teneriffa führte er mit Affen Experimente durch, die geeignet gewesen waren, das von den Behavioristen beschriebene „trial-anderror-Lernen" sichtbar zu machen. Auch die bemerkenswerten Arbeitten von R. YERKES und seinen Mitarbeitern über die Fähigkeit von Schimpansen, Werkzeuge zu benutzen, legen eher die Vermutung nahe, daß Schimpansen den Umgang mit Werkzeugen durch Versuch und Irrtum erlernen. Statt dessen beobachtete KÖHLER, daß die Affen nicht kontinuierlich lernen, Fehler zu vermeiden und richtige Reaktionen anzuwenden. Vielmehr schieben Affen während des Lernvorganges Handlungspausen ein, denen meist unmittelbar eine entscheidende Umgestaltung und Verbesserung der zu lernenden Handlungsverläufe folgt. deutete dieses Beobachtungsergebnis dahingehend, daß eine Art Denken stattgefunden haben müsse und daß nun der Affe besser überschaue. Das von ihm vermutete plötzliche strukturelle Durchsichtigwerden der Situation nannte KÖHLER „Einsicht". Er definierte diesen Begriff als eine plötzliche Umstrukturierung des Erlebnisfeldes, die im allgemeinen einem Problemhandeln und den dabei gemachten Erfahrungen folgt und dann (in entsprechenden Situationen) erleichtert reproduziert werden kann. Die pädagogische Auswertung dieser „Lernart" sollte eigentlich darin bestehen, ein manuelles oder gedankliches Problem so darzubieten, daß spontane Umstrukturierungen im Sinne der aufgabegemäßen Einsicht erfolgen. Die Unterrichtspraxis des Alltags zeigt zwar ein Auftreten von „Aha-Erlebnissen" im Sinne der Einsicht der Gestaltpsychologen. Aber gleichzeitig macht jeder Lehrer die Erfahrung, daß, wenn Einsicht auftritt, nur wenige Kinder an ihr teilhaben. Zugleich ist der Zeitpunkt des Einsichtgewinns nahezu völlig unvorhersehbar. Daß eine Schülergruppe oder gar die gesamte Schulklasse während einer Unterrichtsstunde „Einsicht" gewinnt, ist schon deswegen hochunwahrscheinlich, weil keine Anweisungen darüber zur Verfügung gestellt werden konnten, wie ein Lernstoff in praxi organisiert werden sollte, um dieses Einsichtigwerden zu erzielen. KÖHLER

52

Lernen durch Einsicht

Wenig berücksichtigt wurde die im Zusammenhang mit „einsichtigem Lernen" beobachtete Tatsache, daß die kognitiven Erlebnisse oft dazu führen, daß eine gewonnene Gesamtkenntnis über einen Gegenstand fast zwangsläufig seine Einzelheiten, aber auch den einmal vollzogenen Lösungsweg vollkommen vergessen läßt. Es restiert dann nur noch das Evidenzgefühl. Einer der wichtigsten Kritiker KÖHLERS war PAWLOW. Er wiederholte mit großer Sorgfalt dessen Experimente und zeigte, daß erstens vorhergehende Erfahrungen z. B. Affen daran hindern, mit neuartigen Situationen spontan fertig zu werden, und daß zweitens die so stark betonte Pause im Verhaltensablauf durchaus auch anderer Deutungen fähig ist. THORNDIKE zog es vor, auf jegliche Deutung zu verzichten und jeden Sprung in der Lernkurve in nur formeller Verwendung dieses Begriffs als „Einsicht" zu bezeichnen. Erst die Untersuchungen TOLMANS gestatteten es dann, über die vorwiegend deflatorische Lösung des Einsichtproblems hinauszugelangen. Besonders hat sich jedoch Kritik gegen die spekulative Hirnmythologie erhoben, die implizit von Beginn gestaltpsychologischer Theoriebildung das Wissenschaftskonzept belastet haben, dann aber in der Neuronentheorie KÖHLERS auch explizit formuliert und seitdem widerlegt wurden*).

* ) OSGOOD, C . E . : a. a. O., S. 210 ff. und H . W. NISSEN: Phylogenese Comparison STEVENS Handbook of exp. Psydiol. S. 374, N . Y. (1951).

in S. S.

8. Lernen und Motivation Eine ausgearbeitete systematisierte Theorie des Lernens hat die Psychoanalyse nidit hervorgebracht; Auffassungen und Hypothesen über Akquisition, Speicherung und Reproduktion von neuen Anpassungsleistungen sind vielmehr oft nur unausdrücklich oder als Nebenergebnisse einer umfassenderen Persönlichkeitstheorie zustandegekommen. Um die Jahrhundertwende teilte S. FREUD erstmals eine von den Ergebnissen der Assoziationsforschung deutlich unterschiedene Auffassung über die Dynamik des Vergessens und damit auch des Lernens mit. Gemäß der HERBARTschen Modellvorstellung vom Wechselspiel der Assoziationen gegeneinander („frei steigende Vorstellungen") fand FREUD jene psychologischen Prozesse, die bewirken, daß und wann Bewußtseinsinhalte reproduzierbar oder nicht mehr reproduzierbar sind. Etwa gleichzeitig mit den Untersuchungen von EBBINGHAUS und den Experimentalergebnissen PAWLOWS gewann FREUD seine Problemstellung und Untersuchungsmethoden aus einem äußerst verwickelten Material. Er hatte sich mit den in ständiger Wandlung begriffenen Erlebnisabläufen von psychisch Erkrankten auseinanderzusetzen. Die Rüdeführung der je individuellen Ergebnisse oder Fehlverarbeitungen läßt sehr bald jene handlungsauslösenden Faktoren hervortreten, die in vorangehenden Lebensepodien die Akquisition eben dieser neurotisdien Fehlverhaltensweisen begünstigten. Aus den Selbstschilderungen jedes Patienten gewann FREUD den Eindruck, daß spezifische Motivationen für das Entstehen von Neurosen verantwortlich sind. Die Motivation erhielt eine zentrale Stellung in seinem Theoriegebäude. Die Anpassungsstörungen vom Charakter der Neurose wurden von FREUD auf spezifische Schicksale, auf individuelle Bedürfnisse*) und auf Motivationen zurückgeführt, wie sie im Laufe der Persönlidikeitsentwicklung erfahren wurden. Das jede Persönlichkeit strukturell kennzeichnende Funktionsgefüge der Motive bestimmt aber, in welchem Umfang und in welcher Intensität sich einzelne Motive als eine Antwort auf Störungen des Anpassungsgleichgewichts durchsetzen. *) Die individuell erlebten Bedürfnisse erhalten, da sie in ähnlichen Ausformungen von sehr vielen Menschen beschrieben werden, im Konzept der dynamischen Psydiologie die Benennung „Motiv".

54

Lernen und Motivation

Das individuelle Motivationsgefüge ergibt sich dabei in der Interaktion zwischen dem Heranwachsenden und einer ausgezeichneten „Beziehungsperson" („Liebesobjekt"). Erst diese spezifische Weise, in der der Mensch in seine Umwelt eingefügt ist und die sich daraus ergebenden je-persönlichen Wechselbeziehungen zwischen dem einzelnen und seiner physischen und sozialen Umgebung ermöglichen den Aufbau und damit das Erkennen dessen, was Motivation genannt und dynamische Relation zwischen den einzelnen Motiven sowie als deren gegenseitige Determiniertheit definiert wird. Die Begriffe Motiv und Motivation beziehen sich dabei auf ein und denselben Sachverhalt. Motiv erfaßt dabei mehr den subjektiv unmittelbar erlebten, gegenständlichen Aspekt, Motivation zielt mehr auf den übergreifenden Persönlichkeits-Aspekt. FREUD ist in seinem Modell der Persönlichkeitsentwicklung den Wechselfällen, denen die Motive stets ausgesetzt sind, in den Begriffen „bewußt" und „unbewußt" geredit geworden. Während etwa Schmerz, Hunger und allgemeines Unbehagen beim Neugeborenen lediglich zu einem sich entäußernden Alarmzustand führen, der effektlos abläuft, wird mit zunehmender Aufnahme von Information aus der Umgebung und aus dem eigenen Körper ein Verhalten aktiviert, das je nach dem Grad seiner Zweckmäßigkeit die Befriedigung eines Bedürfnisses begünstigt. Die von der Bedürfnisspannung befreiende Handlung selbst ist als Anpassungsvorgang zu verstehen. Im Jargon der Biologie von Fließgleichgewichten formuliert, assimiliert bei der Bedürfnisbefriedigung der betreffende Organismus Anteile der Umgebung. Dies Hineinnehmen kann sich beim Menschen auf der Ebene von imaginierten Repräsentanten seiner Umwelt vollziehen. Die Anpassung des intellektuell begabten Organismus erzielt beim Umgang mit imaginierten Umgebungsrepräsentanten eine zunehmende Realitätsanreicherung. Kommen Bedürfnisbefriedigungen mit Hilfe dieser Kenntnisse erneut zustande, so werden ursprüngliche und negativ gesteuerte Bedürfnisse bewußt erlebt. Gleichzeitig werden die notwendigen Informationen, aber auch die zugehörigen Verhaltensweisen zielgerechter im Sinne der Befriedigung verwendet. Es handelt sich also um den Erwerb von Verhaltensweisen, die ausgewählt und beibehalten werden, weil sie komplikationslose Befriedigung ermöglichen. Dabei gerät die langfristige Anpassung an die so erworbenen Befriedigungsmöglichkeiten in vielerlei Konflikte. Sehr bald beginnt nämlich der heranwachsende Mensch Behinderungen in der Befriedigung seiner Bedürfnisse zu erfahren. Unbefriedigte Bedürfnisse bedeuten jedoch für ihn Frustrationen. Die häufigsten Folgen von Versagungen sind die emotionalen Erfahrungen von Aggression und Angst. Diese für den Bereich der Motivation charakteristischen

Lernen und Motivation

55

Alarmzustände können wiederum durch zielbezogene, d. h. spannungsreduzierende Handlungen vernichtet oder verhindert werden. Die Struktur der Befriedigung ermöglichenden Handlung ist nur eindeutig durch Erfahrungen über Durchsetzbarkeit der Aktion mit oder gegenüber anderen Menschen determiniert. Ist Spannungsreduktion durch Aktivität nicht möglich, werden andere, ebenfalls früh akquirierte Auswege oder Umwege gesucht*). Die Bedürfnisbefriedigung wird aufgeschoben und auf einen späteren Zeitpunkt angesetzt. Der vielleicht auch sachlich erzwungene Aufschub wird in der Phase des Lernens solchen „Aufschiebens" stets „unsachlich" mit der frustrierenden Person (Liebesobjekt) verknüpft. Ein anderer, ebenfalls gelernter Ausweg bei unmöglicher Bedürfnisbefriedigung ist die „Verdrängung", wobei entweder das vom Organismus gemeldete Bedürfnis nicht mehr erlebt wird, ein das Bedürfnis möglicherweise befriedigendes Objekt nicht wahrgenommen wird oder die die Befriedigung verhindernde Person „übersehen" wird bzw. die tatsächlich in der Außenwelt gegebenen Verhinderungsfaktoren (Barrieren) nicht erkannt werden. Insgesamt entledigt sich der Mensch der Motivspannungen durch Abw-ehrmechanismen, um den gefürchteten unlustvollen Zuständen wie z. B. dem Affektsturm von vornherein zu entgehen. Abwehrmechanismen sind in der Reihenfolge ihrer Häufigkeit und Wichtigkeit die Verdrängung, die Projektion, die Identifikation, die Introjektion, die Reaktionsbildung und schließlich die Verschiebung**). Abgesehen von den zum Teil nodi umstrittenen Thesen bezüglich erster Erfahrungen des jungen Kindes bei der Nahrungsaufnahme (orale Phase) und der Art und Intensität der Reinlichkeitsdressur (anale Phase) als prägende Momente des Charakters, ist in unserem Zusammenhang vor allem F R E U D S Hinweis auf die Tendenz des Kindes zur Identifikation mit einem der Elternteile und die damit verbundene Introjektion sozialer Motive und Werteinstellungen von größter Wichtigkeit. N u r ganz allgemein und im Hinblick auf die Identifikation soll hier das Schicksal eines Motivs bis zu seiner Uberformung durch soziale Motive aus der Umwelt skizziert werden: Jede Modifikation und Sozialisierung von Bedürfnissen in der Richtung herrschender kultureller Normen bedeutet zunächst Zurücksetzung und Versagung — ist also Frustration. *) Während Tiere ihren biologischen Bedarf in artspezifischer und artdienlicher Weise mittels starrer Verhaltensmuster innerhalb ihrer jeweiligen U m w e l t zum Ausdruck bringen, erleben Mensdien ihre Bedürfnisse sowie die Verhaltenserwartungcn und Normsetzungen ihrer sozial-kulturellen U m w e l t als persönliche H e r a u s f o r d e rung. Somit mUssen Mensdien ihre Bedürfnisse mit H i l f e ihrer Intelligenz — als dem funktionellen Äquivalent z u m Instinkt der Tiere — in der von der jeweiligen K u l t u r festgelegten A r t und Weise zum Ausdruck bringen. * * ) FREUD, A.: Das Ich und die Abwehrmedianismen, München, S. 34 ff. (1964).

66

Lernen und Motivation

Häufig wird das darauf folgende, der Entlastung dienende kindliche Verhalten von Lärm, lautem Spielen und dergleichen im Elternhaus wiederum nicht geduldet. Dem jungen Kind bleibt nichts weiter übrig, als nun auch seine expansiven aggressiven Tendenzen zu verdrängen. Damit verliert aber die ursprüngliche Motivspannung keineswegs an Geladenheit. Diese bleibt vielmehr erhalten und strebt auf allen möglichen Wegen nach Abfuhr und Entladung. Ist diese Abfuhr nach außen nicht zu realisieren — verhindert etwa durch Strafandrohung — wird eine Gegenbesetzung gegen den aggressiven Impuls geschaffen. Die Gegenbesetzung ist — je jünger das Kind um so häufiger — genau dem Verbotsverhalten der Erwachsenen gemäß. Eine solche Gegenbesetzung stellt also ein gelerntes affektives Muster dar, das in folgender Weise funktioniert: Immer wenn der abzuwehrende z. B. aggressive Impuls (oder später auch die mit ihm verbundenen Signale) auftaudien, wird ein Angststoß freigesetzt, der seinerseits gelernte Hemmungen aktiviert, die gezielte Aktivität und damit auch die Aggression unterbinden. Die so charakterisierte Gegenbesetzung konstituiert in Gestalt der Ängste ein neues Motiv. Angst erweist sich damit auch als Signal f ü r eine von innen kommende Triebgefahr. Unlustbewirkendes Verhalten der Erziehenden läßt definierte kindliche Verhaltensweisen weniger wahrscheinlich werden als solche, für die die Personen der Umwelt „angenehme", „lustbetonte " Verhaltensweisen gestatten. Der Lernerfolg ist auch hier an der größeren Wahrscheinlichkeit des Auftretens verbotener oder erlaubter Handlungsweisen zu messen. Dabei muß allerdings betont werden, daß eine soldie Wahrscheinlichkeitsvoraussage über das Auftreten bestimmter Verhaltensweisen (Abwehren) einlinig nur f ü r das „Abgewehrte" gilt, das sonst Angst hervorriefe*). Das Lernen lustbetonter versus unlustbetonter Wörter, die Voraussage ihres festeren oder lockereren Behaltens ist die häufigste Methode, der FREUDschen Position experimentell nachzugehen, aber auch diese hat den Nachteil, „kollektiv" als lust- oder unlustvoll geltende Reizwörter zu testen und nicht die emotionale Ichbeteiligung der Versuchsperson, und läßt dann auch keinen Rückschluß auf die originäre, frühkindliche Lernsituation zu. Hier wie in anderen experimentellen Iso*) Experimentelle Nachuntersuchungen dieser Hypothese sind natürlich erschwert, speziell bei Erwachsenen, da diesen ein gelerntes Repertoire an „Abwehr" zur Verfügung steht. Aber auch bei Kindern ist hier kein eindeutiges Ergebnis erzielt worden (z. B. JERSILD 1931 bejaht. LEEPER 1935 verneint diese Lernmechanismen). JERSILD, A. T.: Memory for the pleasant as compared with the unpleasant. Journ.exp. Psych. 14, 284 (1931) und LEEPER, R.: The role of motivation in learning, Journ. of gen. Psych. 46, 4 (1935).

Lernen und Motivation

57

lierungsversuchen der Affekt-Wirkung auf das Lernen gelingt es nicht, das Gefühl als Variable von seinen interpsychischen Zusammenhängen zu lösen. Da formal den Gefühlen eine polare Konstitution von Zuständlichkeit und Gegenständlichkeit eigen ist, geraten in zunehmendem Maße die zu erlernenden Gefühle vom Zuständlichen weg, hin zum Gegenständlichen. So ist die erste Lebenszeit vorwiegend durch die Herrschaft der Zuständlichkeit über das Verhalten gekennzeichnet. Lernen bedeutet in dieser Phase, die größere Wahrscheinlichkeit des Auftretens von Zuständlichkeiten angesichts unterschiedlichster Reize oder Reizkonfigurationen. Mit zunehmender biologischer Reife und wachsender psychischer Entwicklung tritt der „Gegenstandspol", der sachliche Bezug des Gefühls hervor. Dies wird durch den Aufbau einer psychischen Regulationsstelle ermöglicht. F R E U D nimmt an, daß die Ausformung der Emotionalität und Motivation besondere Entwicklungsstufen der Persönlichkeit charakterisiert. Die Gesamtheit bewußt erlebter Bedürfnisse und Gefühle sowie die ihnen zugeordneten Aktualisierungen des Reaktionspotentials zur Realitätsanpassung und zur Bedürfnisbefriedigung kennzeichnen nun diese Steuerungsstelle, das „Ich". Das „Ich" sortiert gewissermaßen jene „Gegenstände", Personen und Vorgänge, die mit Gefühlen belegt werden können, ohne dieses „Ich" zu schädigen. Lernen in und nach der Phase der Idikonstituierung bedeutet dann eine Neuanpassung gefühlsgesteuerten und motivbedingten Verhaltens an die Existenzbedingungen des Menschen. Dagegen werden die „internalisierten", aus der kulturellen Normierung stammenden Bedürfnissteuerungen nicht als zum eigenen „Ich" gehörig erlebt. F R E U D bezeichnet diese Regulationsinstanzen gegenüber sozial nicht zugelassenen Bedürfnissen oder Bedürfnisbefriedigungen als „Über-Ich". Ein durch Verdrängung oder einen anderen Abwehrmechanismus entstandenes, nun angstbesetztes Motiv entstammt entweder dem „Über-Ich" oder dem „Ich". Im ersten Fall der „Abstammung" aus dem „Überich" wäre dieses Motiv ein unverbalisierter, bereits introjizierter Strafimpuls, im zweiten Fall der Herkunft aus dem „Ich" eine Vorstellung oder Verbalisierung der möglichen Strafe. Diese Motive aus dem „Über-Ich" oder dem „Ich" sind also mit Angst assoziiert und diese garantiert, daß der betreffende z. B. aggressive Impuls fortan schon im Keime erstickt wird. So erlebt das Kind bei jedem neuerlichen Auftauchen von aggressiven Impulsen Angst, und um dieser zu entgehen, ist ständige Neuverdrängung erforderlich. Unter dem Aspekt des Lernens hat demnach das „Über-Ich" einen Einfluß auf die Häufigkeit des Auftretens von kulturellen Hemmungen, gelernt wird die Vermeidung, die Hemmung, die Gewissensregung, im ganzen also wird das einmal konstituierte „Über-Ich" in seinem Bestände geschützt.

58

Lernen und Motivation

Ganz ähnlich liegen die Dinge beim nicht gelösten Motivkonflikt, der ebenfalls von Frustrationen seinen Ausgang nimmt. Im Gegensatz zur vollen Frustration verbleibt dem Menschen aber noch die Möglichkeit, zwischen einem eigenen Motiv und einem bereits introjizierten „Überich"-Motiv oder auch den vorgestellten Konsequenzen des eigenen Tuns — z. B. Strafe, Liebesentzug, Risikounsicherheit — zu wählen. Gewinnt keines der in einem Konflikt verwickelten Motive die Oberhand, so wird der Konflikt storniert, was zur Folge hat, daß mindestens eines der beiden Motive unerledigt fortbesteht. Unter Umständen kann das „Ich" dieses fortbestehende, aber unter Strafe gestellte Motiv nur über den Abwehrmedianismus der Verdrängung beherrschen. Durch diese Prozesse, durch die weder die Befriedigung noch der endgültige Verzicht auf ein Motiv zustande kommt, ist für jede psychische Weiterentwicklung und Konsolidierung des „Ichs" der verhängnisvolle Weg prämorbider Verhaltensmuster geprägt. Frustationen (Versagung, Versuchung, Konflikt) die für die bis dahin entstandene Persönlichkeitsstruktur spezifisch sind, können neurotische Symptome und Verhaltensweisen fördern*). Aus unserer eben skizzierten Abfolge ergibt sich eine grundsätzliche Lernhypothese der FREuoschen Theorie: Nach ihr legt die individuelle Ausformung des persönlichen Motivationsgefüges fest, was aus der Umgebung wahrgenommen werden kann und welche Erlebnisrepräsentationen vom „Ich" zugelassen werden. Motivationen steuern also Selektion und Akquisition strukturierter Wahrnehmungssituationen. Das Motivationsgefüge selbst ist hiernach jedoch bereits wieder eine Konsequenz jener, in frühkindlichen Phasen entworfenen „Weltbildes", das sich aus lust- und unlustvollen Zuständen bildete. Wurden später die Motive mit Realitätskenntnis d. h. Ichfunktionen verknüpft und damit ein Kontext zwischen beiden hergestellt, so resultiert daraus eine verläßlidie Erfassung von Situationen und die Verfügung über Verhaltensweisen, durch die variierende Motive befriedigt werden können. Im Gegensatz zur Lernhypothese von den konditionierenden Bedingungen und konditionierten Reaktionen wird im psychoanalytischen Lernmodell der Weg verfolgt, den die zunächst diffuse Zuständlichkeit in ihrem stetig enger werdenden Kontext mit der Gegenständlichkeit nimmt und dabei zu gesteigerter und strukturierter Komplexität gelangt. Es wird nun deutlich: je mehr solche Strukturen zur Verfügung stehen, um so leichter gelingt im Falle einer Frustration eine kognitive *) Vgl. hierzu E. Jorsvieck & J. Katwan: „Neurotische Symptome — eine Statistik über Art und Auftreten in den Jahren 1947, 1956 und 1965." Z. psydi. som. Med. u. Psychoanalyse 13, 22 (1967).

Lernen und Motivation

59

Umstrukturierung. Diese verspricht noch einen Erfolg, ohne daß Affekte oder Abwehrmedianismen ausgelöst werden müssen. Um so besser kann dann aber auch eine bedürfnisweckende Situation überblickt und adäquat beantwortet werden. In jedem Fall, am wenigsten noch bei der Aggression, ist eine Umstrukturierung der Situation notwendig. Vor allem der problem- und bedürfnislösende Umweg bedingt die Einschaltung von Zwischenzielen, von neuen Motiven, sowie eine kognitive Staffelung der Zielgegenstände. Dabei werden vorweg — in Gedanken — Handlungen entworfen und deren Wirkungen vorgestellt. Von einer in solcher Weise vorentworfenen Situation aus wird in Gedanken weiter gehandelt. Die Staffelung der Motive, eine Zweck—Mittel-Relation, die beim Menschen sehr komplex werden kann, unterscheidet ihn grundlegend von allen Tieren. Wie D.O. HEBBS Affenversuche zeigen, können selbst höchste Säugetiere zwar noch Mittel, aber kaum oder gar nicht Mittel für Mittel verwenden oder Mittel bearbeiten. Tun sie es im Sinne reiner Imitation, verlieren sie jedoch den Lösungsweg, weil so auch das ursprüngliche Ziel entmotiviert wird. Dies hängt mit der Zeitordnung von Motiventstehung, Befriedigung oder Aufschub zusammen. Beim Aufschub zum Beispiel haben sowohl das aufgeschobene Motiv wie auch die „Hilfsmittel" ihre bestimmte Stellung in der Erlebnisund Handlungsstruktur, so daß das ursprüngliche und aufgeschobene Motiv ohne viel Energie aktiv bleiben kann. Auch alle Abwehrmechanismen funktionieren besser, je weniger intellektuelle Energie das Festhalten einer Struktur kostet, je häufiger also gelernt ist, daß Motivbefriedigung durch nachfolgende Unlust entwertet wird. J e nach dem Entwicklungs- und Differenzierungsgrad des „Ich" und in Wechselbeziehung damit, je nach Stärke der Blockierung und dem Wert der Gratifikation wird mit mehr oder weniger primitiven Abwehrmedianismen wie Sublimierung, mit Aufschub oder Umweg operiert. Die eben charakterisierten Wechselbeziehungen zwischen Motivation und Realität spielen für den Anpassungsprozeß an sich ändernde Innen- und Außensituationen, also für den Lernprozeß, bereits am Beginn des Lebens eine wichtige Rolle, insoweit, als sich aus der persönlichen Motivationsstruktur eines Menschen ergibt, welche situationeilen Gegebenheiten von ihm wahrnehmungs- und gefühlsmäßig überhaupt erfaßt werden können. Treten beim zur Bedürfnisbefriedigung führenden Verhalten neue, motivational abgelehnte Ergebnisse auf, wird die zielgerichtete Handlung abgebrochen oder auf ein anderes (Ersatz-) Ziel gelenkt. Der außenstehende Beobachter hat in dem ersten Fall den Eindruck, es kann nicht gelernt werden, im zweiten Fall, es wird Falsches gelernt. Nach dieser Auffassung FREUDS vom Lernvorgang legen Bedürfnisse und die zur Bedürfnisbefriedigung erworbenen Verhaltensweisen den

60

Lernen und Motivation

sich in der frühen Kindheit abgrenzenden Bereich fest, in dem später langfristige Anpassungsmechanismen überhaupt erworben und differenziert werden können. Demgemäß ist in den ersten Entwicklungsjahren eine Selektionsstruktur der Wahrnehmung und der Erfahrung erworben, die bewirkt, daß bestimmte, emotional nicht ertragbare Kenntnisse, Daten und „Bildungsinhalte" aus dem Bewußtsein ferngehalten werden, oder nur für relativ kurze Dauer erinnert werden können. Die nur kurzfristige Wirksamkeit bestimmter Anpassungsleistungen und das Erlernen neuer Situationsstrukturen für kurze Zeit erklärt F R E U D nach dem Schema des motivierten Vergessens und meint damit die für Lernen und Vergessen bedeutungsvolle Wirksamkeit von Abwehrmechanismen. Verdrängungen schaffen wohl in den frühen Entwicklungsstadien unerwünschte Situationen aus der Welt, damit aber sind die sie erzeugenden Motive selbst und die ihnen zugehörige „Energie" noch nicht aufgehoben. Zudem ist während des Entwicklungsgeschehens nie genau festzustellen, inwieweit eine Verdrängung nun wirklich gelungen ist und inwieweit damit ein ganz bestimmter Teil der Realität für das Individuum als informationstragende Repräsentation vernichtet worden ist. Drängt diese oder eine ähnliche Realität dennoch ins Bewußtsein, so werden Nachverdrängungen, neue Verdrängung und weitere Abwehrmedianismen oder „Gegenbesetzungen" erforderlich. Alle diese erlernten Maßnahmen konsumieren Energie, reduzieren den Gesichtskreis und behindern selbstverständlich die Bewegungsfreiheit des wachsenden „Ich". Hiermit tritt eine für die psychoanalytische Lerntheorie überhaupt problematische Barriere auf, wenn es gilt, experimentell diese Hypothesen zu belegen. Hier sind behavioristische Vermeidungsexperimente mit negativem Verstärker oder verzögerter Belohnung angesetzt worden, die das analytische Lernprinzip eigentlich umkehren. Dies besagt nämlich, daß Vermeiden als ein spezielles Verhalten gelernt wird, und führt Vermeidungslernen nicht auf Reiz-Reaktionsmechanismen, sondern auf Lust-Unlust-Erlebnisse zurück, die zunächst im Zusammenhang mit Personen stehen. Die Wechselwirkung von Lernleistung und persönlicher Bindung an den Lehrenden stellt hierbei nur einen Sonderfall motivierten Lernens dar. So ist auch die Lernbereitschaft; nicht nur von sachlichen Interessen, sondern — je jünger der Lernende — von der lehrenden Person determiniert. Zusammenfassend läßt sich dieser Lernfaktor wie folgt charakterisieren: Lernen erfolgt unter definierter Zuständlichkeit (Motivation) des Lernenden. Dabei wird um so wirksamer gelernt, je deutlicher und erfaßbarer der Zusammenhang des zu Lernenden mit den Bedürfnissen des Lernenden ist. Dabei wird langfristige Anpassung um so eher erfolgen, je häufiger Motivbefriedigung wahrscheinlich wird. Lerneffizienz wird um so geringer, je widerspenstiger Umwelt oder

Lernen und Motivation

61

Personen sich gegen Bedürfnisbefriedigung des Lernenden einstellen. In gleicher Weise ist ein Motivationsverlust und damit Nicht-Lernen mit einer weit in die Zukunft verlegten Befriedigung verbunden. Von den Emotionen sind mandimal Schock und Furcht (traumatische) Lernfaktoren, die bewirken, daß in ähnlichen Situationen nicht gelernt wird. Die Quote von egozentrischen zu gegenstandsbezogenen Motiven erlaubt gleichzeitig einen Rückschluß auf die erreichte Verminderung von ichbetonten Einstellungen und auf das Reifen des vermehrten Sachinteresses an der Außenwelt. FREUD nimmt an, daß das Quantum psychischer Energie (Libido) während der Entwicklung im wesentlichen konstant bleibt. Beim Durchlaufen der Entwicklungsstufen wird nicht neue Energie erzeugt, vielmehr verbindet sich die vorgegebene Libido mit neuen Motiven. Die Erfassung und lernende Bewältigung der Objektwelt wird in dem Maße präziser, indem Energie von der eigenen Person abgezogen und damit für die aktive Orientierung frei wird. Ebenso wie für die Libidotheorie gilt die Annahme einer vorgegebenen Energiequantität auch für die Theorie der Abwehrmechanismen. Wenngleich das „Ich" auch in jedem Entwicklungsstadium einen mit dem Alter zunehmenden Betrag an Energie für Abwehrzwecke abzuzweigen vermag, so hat doch das jeweils individuelle zur Verfügung stehende Energiequantum seine Grenzen. Wird dieser Betrag überfordert, beginnen Konflikte bzw. unerledigte Motive pathogene Wirkungen zu entfalten. Ständige Verhaltensstörungen und ihre Kompensation binden in steigendem Maße die für die Weiterentwicklung der „/(¿"-Steuerung notwendige Energie und verursachen damit Fixierungen, Regressionen auf früher sinnvolles Verhalten und neuerliche Abwehrmaßnahmen gegen die regressiven, sozial nicht gebilligten Motive. Neurotische Symptome oder Deformierungen des „Ich" bestimmen nun als Charakterfehlentwicklung das weitere Bild. Wird dieser Mechanismus der Abwehr von für die Person unakzeptierbaren Forderungen gegenüber kurzfristig erzwungenen Anpassungen wirksam, folgt ein Vergessen des gerade Gelernten. Das Beibehalten würde für die Person eine ständige Herausforderung verpönter und unlusterzeugender Bedürfnisbefriedigung bedeuten, die abgewehrt, also vergessen werden. Das motivierte Vergessen steht somit im Dienste der Aufrechterhaltung langfristig erworbener Anpassungen. Eine Erziehung, die diese Sachverhalte kennt, sollte von vornherein anstreben, die aus Versagungen angestauten Energien ständig in eine wagnishafte, zielstrebige und produktive Aktivität zu wandeln. Sieht sich das Kind einer Verzichtsituation oder einem Konflikt zwischen zwei einander ausschließenden Motiven gegenüber — z. B. einem eigenen Vorhaben und der von den Eltern geforderten Unterlassung — so werden von jedem Kind, wenn auch nicht immer ganz

62

Lernen und Motivation

bewußt, die einander ausschließenden Motive geprüft, welches mehr Lust oder aber zumindest weniger Gefahr zu bringen verspricht. Diese sogenannte „Lustbilanz" zieht das „Ich" — dies ist seine Hauptaufgabe. Damit ist der Hinweis auf die Wichtigkeit zwischenmenschlicher „Atmosphäre" im Erziehungsraum unmittelbar einsichtig, da das Verhalten der Erzieher in der jeweils gegebenen Verzichtsituation die Wahl des Abwehrmechanismus bedingt. Es ist ein Unterschied, ob ein durch vorgängige Erfahrung bereits ängstliches Kind bei erneut vorgetragener Strafandrohung seine Wünsche lediglich verdrängt oder auf Grund der eigenen „Lustbilanz" das Verhalten mit der in Aussicht gestellten Belohnung adoptiert und somit das ursprünglich gewollte und nunmehr weniger lustbringende Motiv allein abstellt, d. h. darauf verzichtet. Es hängt auch von der Art der Blockierung sowie von der für den Verzicht winkenden Belohnung ab, was in der Frustration geschieht. Je radikaler die Blockierung und je geringer der Lohn, desto primitivere Mechanismen werden in der Wunschversagungssituation auftauchen. Ein Kind, dem bei unbedeutenden Vergehen daseinsgefährdende Strafen angedroht werden oder das überhaupt nur sehr wenig Wohlwollen und Zärtlichkeit von den Eltern empfangen und die Hoffnung, jemals mehr zu bekommen, aufgegeben hat, wird zu primitiveren Mechanismen neigen. Ein solches Kind ist dann bereits zu diesem Zeitpunkt in der Entwicklung seiner motivationalen Steuerung zurückgeblieben. So ist die lernende Adoption eines sozial-kulturell gewünschten Verhaltens weitgehend vom Verhalten des Erziehers abhängig. Über Belohnung und innerliche Anteilnahme ermöglicht er dem Kind erst angstfreies Verzichten und bereitet damit den Wandel der sterilen Frustrationssituation über die Verinnerlidiung ihrer normativen Forderungen zu einem sozial angepaßten Verhalten vor. Durch Lob und Anerkennung von Pflegepersonen und fürsorglichen Erziehern wird der Heranwachsende zur Übernahme sozialer Motive und kulturell sanktionierter Motivkomplexe ermutigt, er akzeptiert und lernt in zunehmendem Maße die über Identifikation mit dem jeweiligen Elternteil innerlich aufzubauenden sozialen Rollenmuster seiner Kultur und deren Normen. Anschauungen und Maximen, die sich der Heranwachsende als Projektion des sozial-kulturellen Leitbildes völlig zu eigen gemacht hat, erscheinen ihm dann als unumstößliche „natürliche" oder „gottgewollte" Selbstverständlichkeiten. Der Aufbau der Persönlichkeit vollzieht sich also im psychoanalytischen Modell vorwiegend durch Frustration, d. h. Tabuierung und Einschränkung von Vitalbedürfnissen und Wandlung der unerwünschten Antriebe durch verschiedenste Abwehrmechanismen zu sozial höher

Lernen und Motivation

63

bewerteten Strebungen und zu in Rollen gefaßten Verhaltensmustern, die an sozialkulturellen Leitbildern orientiert sind*). Vor allem in den an sozial-kulturellen Leitbildern orientierten Institutionen der Schule und Familie findet dieser Motivwandel als Lern- und Anpassungsvorgang seine sichtbarste Ausprägung. Die sidi aus der Rollenstruktur und dem Institutionsgefüge der Gesellschaft und ihrer Bezugsgruppen ergebenden sozialen Motive der Einordnung, Bestätigung und Bewährung als ein am Erfolg orientiertes Handeln können unter dem Begriff der sozialen Motivation zusammengefaßt werden. D a die Verhaltensmuster der sozialen Einordnung und des Erfolghandelns im frühesten Kindesalter im Erziehungsraum der Familie geprägt werden, ist das kulturelle Niveau der Familie, der ökonomische und berufliche Lebenserfolg der Eltern und die Einordnung der Familie in das Wert- und Orientierungssystem der sie umfassenden Großgruppe für die spätere erfolgreiche Lebensbewältigung ihrer Kinder von hödister Bedeutung. Dies zeigt sich deutlich beim Übertritt des Kindes aus der Familie in neue Gruppen, wie z. B. Spielgruppe oder Sdiulklasse. In der neuen Gruppensituation erweist sich dann, ob neue entlastende Anpassungsleistungen und damit eine Zunahme an neuen Realitätserfahrungen möglich sind; oder ob gelernt worden ist, die Herausforderungen zu motivationalen Entlastungen mit Angst zu besetzen, so daß der andrängende motivationale Impuls gegenüber der vorgegebenen Situation blind wird. Während die motivierten Lernvorgänge in der frühen Kindheit stets dadurch gekennzeichnet sind, daß sowohl die der Bedürfnisbefriedigung dienenden Informationen als auch die zugehörigen Verhaltensweisen in einem mittelbaren Kontext zum originären Motiv stehen, ist die Motivierung von in der Schule üblichen Lernvorgängen erheblich erschwert, da dort auf originäre Bedürfnisse als Lernanlässe kaum zurückgegriffen werden kann. In der Schule handelt es sich um langfristige Anpassungen an Inform a t i o n - und Interpretationsschemata sowie um operatives Verhalten in kognitiven Systemen, die nur in einem indirekten, dem jungen Schulkind nicht durchschaubaren Zusammenhang mit zukünftiger Erleichterung von Bedürfnisbefriedigungen stehen. Soziale Motive wie Ehrgeiz, Beliebtheit, Rivalisation, Geltung und Machtbedürfnisse übernehmen nun eine unentbehrliche Mittlerrolle, die die Erfassung von Zeichensystemen und den Erwerb von Fertigkeiten begünstigen. Zu dieser Situation muß abermals nun ein sidi allmählich strukturierender Motivationszusammenhang wirksam werden, der bestimmt und auswählt, weldie sozialen Bedürfnisse bevorzugt entlastet werden *) JORSWIECK, E . : A n a l y s e eines 12jährigen, intelligenzgesdiädigten K i n d e s . P r a x . K i n d . Psych. 7, 253 (1958).

64

Lernen und Motivation

dürfen und welche Motive der Verdrängung und Abwehr anheimfallen müssen. Beiden Entwicklungsstufen, der frühen Kindheit und der Schulzeit, ist jedoch, wie wir gesehen haben, gemeinsam, daß sich die persönlichkeitsspezifische Form der Anpassung mit anderen Personen oder in Interaktion von Gruppen vollzieht. Das in der Psychoanalyse implizierte Lernmodell ist also stark sozialpsychologisch bestimmt und definiert — wie sich in einer modernen Terminologie formulieren läßt — das Lernen als Verknüpfung von in der Entwicklung sidi wandelnden Motivstrukturen mit einer sich daraus ergebenden spezifischen Informationsbewertung und determinierten Mobilisierung von Reaktionsmustern.

9. Lernen im behavioristischen Assoziationismus R. GUTHRIE"') bezeichnet seine Lerntheorie selbst als „behavioristischen Assoziationismus". Am Beginn seiner lernpsychologischen Bemühungen steht dementsprechend die Auffindung von Verhaltensweisen, die zwar universal bei allen Menschen auftreten, aber gelernt werden müssen. Diese als „coenotrop"**) bezeichneten Verhalten stellen sich als Zusammentreffen einer zunächst noch „offenen" Antwortreaktion (noch nicht besetzten Assoziation) mit universal vorkommenden Reizkonfigurationen dar. In diesen frühen Auffassungen GUTHRIES zeichnet sich bereits sein grundsätzlicher, lerntheoretischer Ansatz ab: „Ein Reizmuster, das zur Zeit des Antwortverhaltens wirkt, wird, wenn es wieder auftritt, dazu tendieren, jenes Antwortverhalten zu produzieren." Vorbedingung für die Gültigkeit dieses Prinzips ist die weitgehend exakte Wiederholung des ursprünglichen Reizmusters. Er nimmt weiter an, daß eine Assoziation zwischen Reizmuster und Antwortverhalten sofort und in voller Stärke auftritt und damit also dem „Alles-oder-Nichts"-Gesetz folgt. Am Beginn seiner Theoriebildung beschränkt er sich auch strikt nur auf beobachtbare Reizgefüge und simultan beobachtbare Reaktionen und sucht „den Gesetzen der Bewegung, wie sie von Reizen bestimmt werden", auf die Spur zu kommen. Präzise formuliert GUTHRIE seine Auffassung folgendermaßen: „Unsere Position darüber, was assoziiert ist, ist diese: ein Stimulus und eine Reaktion. Es wäre vielleicht exakter, zu sagen, das, was assoziiert ist, ist Stimulation eines Sinnesorgans und eine korrespondierende Muskelkontraktion oder Drüsensekretion. Sie also assoziiert nennend meinen wir, daß die Stimulation zur Gelegenheit für die Antwortreaktion geworden ist, wegen einer in der Vergangenheit hergestellten Assoziation der beiden***)." G U T H R I E unterscheidet streng zwischen „Bewegungen" und „Handlungen". Bewegungen beziehen sich ausschließlich auf glanduläre oder

EDWIN

*) EDVIN RAY GUTHRIE wurde 1886 in Lincoln (Nebraska) geboren. Er studierte an einigen Universitäten der Vereinigten Staaten. Seit 1943 ist er Professor für Psychologie. GUTHRIE gehörte verschiedenen militärischen Verbänden als Psychologe an. Aus der Zahl seiner Bücher hat vor allem „The Psychology of Learning" N . Y. 1935 große Bedeutung. **) In „General Psychology in terms of behavior", GUTHRIE & S. SMITH, N . Y. (1921). Coenotrop heißt soviel wie »Zwang zum Zusammenlaufen". ***) GUTHRIE, E. R.: Conditioning: A Theory of Learning in Terms of Stimulus, Response and Association; N a t l . Soc. Stud. Educ. 41st Yearbook, N . Y. (1942). 5 Haseloff-Jorswiedt, Psydiologie

66

Lernen im behavioristisdien Assoziationismus

motorische Reaktionen. Handlung gehört zu einer Klasse von Bewegungen, die nach ihrer Wirkung definiert ist oder nach dem Schlußresultat (z. B. öffnen einer Tür, Niederdrücken eines Hebels o. ä.). Handlung in dieser Definition wird im Versuch-Irrtum-Verhalten oder beim instrumentellen Lernen untersucht, während die klassische Konditionierung ausschließlich mit „Bewegungen" experimentiert. Das wesentliche Postulat ist also die Gleichzeitigkeit von Reiz und Reaktion. Motivation"'), etwa Hunger oder Durst, verstärkt eher die Reaktion, nicht aber die Assoziation zwischen Reiz und Reaktion. Durch diese Definition sucht G U T H R I E seinem wissenschaftlichen Bestreben nachzukommen, nur mit „beobachtbaren und benennbaren Items" zu rechnen. Zu meßbaren und beobachtbaren Größen gehören Reize oder wie er sie nennt „Cues"**). Das Reizmuster (cue) ist zusammengefügt aus exterozeptiven, interozeptiven und propriozeptiven Reizen. Wenn insbesondere bei den Aktionen die sichtbare Gleichzeitigkeit von Reiz und Bewegung nicht gegeben ist, so fallen nach der Ansicht GUTHRIES in dies zeitliche Intervall kontiguierte Vollzüge, die sich dem experimentellen Zugriff noch entziehen. Die bei der Wiederholung einer Aktion beobachtbaren Assoziationsstiftungen ergeben sich nach dem Kontiguitätsprinzip so, daß sich immer neue, gleichzeitige Reiz-Reaktionsverknüpfungen aus der Mannigfaltigkeit der Reizpopulation der vorgegebenen Situationen bilden. So erklärt er am Beispiel des Schreibmaschinenlernens die zunehmende Sicherheit des Vollzuges entsprechend der eben dargestellten Auffassung so, daß sich zunächst nach dem Alles-oder-Nichts-Gesetz nur wenige Bewegungsvollzüge bilden, die bei Herstellung der exakten Wiederholungssituation sofort da sind, so daß sich neue Reiz-Reaktionsverknüpfungen, die den Vollzug stetig komplettieren, einstellen können usw. Die stärkste Assoziation ist stets diejenige mit der Reaktion, die auf den stärksten „cue" eintritt, wobei gleichzeitig eine solche Konditionierung dazu tendiert, alle vorangehenden Konditionierungen aufzuheben***). Ein weiterer, wichtiger Aspekt seiner lerntheoretischen Konzeption liegt in der Annahme, daß die jeweils zuletztgegebene Antwort diejenige ist, die als die wahrscheinlichste gegenüber der sich wiederholenden Situation auftritt. Das Alles-oder-Nichts-Gesetz der Kontiguität löst eine Sequenz von Responses auf Stimulus-Cues aus, die *) Die Bedeutung von Motivation innerhalb seines Lernkonzepts formuliert sich so: Triebreduktion vollzieht sidi durdi das Verschwindenlassen einer Gelegenheit, in der sonst Konfliktresponses gelernt würden. **) Cue ist irgendein unkonditionierter oder vorher konditionierter Stimulus f ü r die in Frage kommende Reaktion. Anstelle von cues spridit GUTHRIE manchmal auch von „conditioners". ***) Nach E. R. GUTHRIE & G. P. HORTON: Cats in a puzzle box, N . Y. (1946) Rinehart.

Lernen im behavioristischen Assoziationismus

67

dann ihr Ende erreicht, wenn die Zielerreichung vollzogen ist. Die Aktionssequenz hat also eine Tendenz zur Minimisierung von Beginn an, wobei jede nicht geglückte Zielerreichung den Prozeß aufrechterhält. GUTHRIE hält die „üblichen" physiologischen Hypothesen über Widerstandsvariationen in Synapsen für wenig ertragreich und verneint auch die Einführung eines hypothetischen Lernfaktors, etwa H U L L S „Habit" ( S H R ) . Vielmehr erlaubt Kontiguität nur eine graduelle Entwicklung bis zur vollen „ S t ä r k e " und „Lebhaftigkeit". Stimulus-Cues werden bei identischer Wiederholung immer mehr der Antwortreaktion verbunden, so daß deren Auslösung durch Wiederholung stetig sicherer wird. GUTHRIE verneint weiterhin strikt Erfolg, Belohnung und Zielerreichung als Verstärkungsfaktoren des Lernens, vielmehr billigt er ihnen nur Wirkung auf die Herstellung jener Stimulus-Cues zu, die die Handlungssituation zu der vorläufig letzten macht und deswegen ihr „erfolgreiches" Wiederauftreten fördert. Auslösdiung oder Hemmung, wie sie im PAWLOWschen oder HULLschen Konzept entwickelt wurden, verneint GUTHRIE. Er meint vielmehr, auch im Sinne anderer Theoretiker der Interferenz, daß eine neue, die erste verdrängende Assoziation gebildet wird. Der Wettstreit zwischen zwei Assoziationen verläuft in dieser Auffassung nach algebraischen Regeln („Counterconditioning"). D a s in der HuLLSchen Lerntheorie wichtige Prinzip der Extinktion (Auslöschung) einer gelernten Reaktion erklärt GUTHRIE dagegen aus seiner Theorie in folgender Weise: 1. Der konditionierte Reiz mag zwar vorhanden sein; es kommt keine Reaktion zustande, weil die geforderte Reaktion unter der Reaktionssdiwelle liegt. 2. Die Antwort wird bei gleichzeitig angeregter Antwortreaktion verhindert durch das Fehlen instrumenteller Hilfen; es tritt eine beliebige andere Reaktion auf. 3. Das Wiederauftreten des konditionierten Reizes erfolgt zu früh, nämlich noch in der refraktären, d. h. nervös nodi unerregbaren Phase.*) Diese Extinktionsbedingungen erläutern sich aus der Beschränkung auf rein physiologische Daten, von denen Bewegungen oder Aktionen abhängig sind, und reiztheoretisch wird das „behavioristische" Vergessen auf Interferenz zurückgeführt. So formuliert GUTHRIE einmal: „ D i e gegenwärtige Theorie nimmt an, daß das Repertoire der Antworten durch die physikalische Struktur des antwortenden Organismus und durch die unendlich große Zahl von kombinierten Verhalten, deren die Effektoren fähig sind, bestimmt ist." Nach dieser Interpretation der Auslösdiung eines Verhaltens ( z . B . Vergessen) geht eigentlich keine je gestiftete Assoziation zwischen * ) GUTHRIE, E. R . : The Psychology of human conflict, N . Y . (1937). 5»

68

L e r n e n i m behavioristischen A s s o z i a t i o n i s m u s

Reizkonstellation und gleichzeitig ablaufender Antwort verloren. Zwar zeigt die Person in einer vorgelegten Versuchsanordnung, wie G U T H R I E annimmt, eine Reihe später nicht wieder auftretender Reaktionen. Jede einzelne dieser „Versuchs"-Reaktionen wird nach dem Alles-oder-Nichts-Prinzip zu einem besonderen (nun mit anderen konkurrierenden) Aktionsanreiz (Cue). Dabei kommt es zu Assoziationen (in bezug auf die gewünschte Zielreaktion). Andere erfolgreiche Reaktionen treten an die Stelle der zuerst kontiguierten Reaktion. Jede Lernsituation enthält potentiell eine Fülle von unbedingten Reizen, so daß stets eine genügende Zahl von Assoziationen mit der auftretenden Reaktion verknüpft werden und ihr Hervortreten damit gesichert ist. Die jeweils nächste Reiz-Reaktionskontiguität gelingt dabei um so rascher, wenn die Reizmuster (Cues) miteinander kompatibel sind. Übung bedeutet in dieser lerntheoretischen Auffassung demnach, daß stets möglichst genau die gleiche Situation geschaffen wird, damit keine Dissoziation der gewünschten Reaktion durch neu sich herausbildende Nebenassoziationen entsteht. Erfolgloses Üben tritt dagegen sofort auf, wenn die basierenden elementaren Bewegungen nicht ablaufen können, weil die inkompatible Anreizsituation zu störenden Assoziationen führt. Es muß dann also auf möglichst eindeutige und reizvertraute Übungssituationen zurückgegangen werden. Aus diesem Erklärungsansatz ergibt sich auch zwanglos, daß G U T H R I E beim Übungsvorgang der Häufigkeit der Wiederholung einer Reaktion kaum Bedeutung zumißt. Die detaillierte Zerlegung eines komplexen Verhaltensablaufes (z. B. Schreibmaschine bedienen) zeigt vielmehr, daß die vom Handlungsziel bestimmte Reihenfolge sich sofort einstellt, wenn die bewegungsproduzierenden Reize in der erforderlichen Reihenfolge"") auftreten. G U T H R I E hält den Versuch, das „erfolgreiche Verhalten" vom Ziel, von der Belohnung oder der Strafe abhängig zu machen, für einen Fehlweg, weil er lediglich die „vorläufige" letzte Reizkombination über Gebühr hervorhebt. G U T H R I E sagt, daß der Vollzug der Reaktion selbst in einer Verstärkungszunahme resultiert (tatsächlich also in einem Anwachsen der Zahl potentieller Cues, die jetzt mit der Reaktion verbindbar sind). Die numerische Analyse der Reizpopulation, die gleichzeitig mit der Reaktion gegeben ist, führte später durch E S T E S ZU einer wahrscheinlichkeitsstatistischen Lerntheorie. E S T E S formuliert diesen Zusammenhang folgendermaßen: „Bei Vollzug der Antwort (Response R 1 ) werden alle neuen Elemente im augenblicklichen effektiven Sample zu R 1 konditioniert." * ) Dies Prinzip der Postremity meint, daß die letzte kompatible Reizkonfiguration assoziiert wird mit der erfolgreichen folgenden Reaktion.

Lernen im behavioristischen Assoziationismus

69

Einen Transfer kann GUTHRIE nur gelten lassen, soweit die neue Situation möglichst viele Reizidentitäten mit der Reizpopulation der ursprünglichen bereits beantworteten Situation besitzt*). Während die behavioristischen Lerntheorien etwa THORNDIKES oder HULLS den Motivationen eine wichtige Rolle für das Ingangsetzen von Bewegungsfolgen und komplexeren Lernvorgängen zuschreiben, setzt GUTHRIE als vitale Vorbedingung nur einen Zustand erregter Unruhe voraus. Erfolgreiches Lernen eliminiert dann diesen Unruhezustand und schafft damit ein neues Anpassungsgleichgewicht. Mit dem Tode seines Schöpfers ist die Kontiguitätstheorie ständig bedeutungsloser geworden, die Kritik dagegen zunehmend angewachsen**): 1. Die „Assoziation" zwisdien Cue und Response erklärt nicht die postulierte Einheit des Ereignisfeldes. 2. Gradueller Lernleistungszuwachs wird negiert, obwohl beobachtbar und meßbar. 3. Die in der Kontiguität hypothetisch vorausgesetzten intervenierenden Prozesse sind nicht (experimentell oder statistisch) faßbar.

*) Hier hat GUTHRIES skeptische Haltung gegenüber Tests wohl ihren Ursprung. Er kennzeichnet sie als .höchst nützliche und praktische Arbeit, aber er (der Test) hat nichts zur psychologischen Theorie beigetragen". **) OSGOOD: a . a . O . , S. 3 6 7 .

10. Lernen und Verhalten Die Lerntheorie von CLARK LEONHARD H Ü L L * ) kurz charakterisiert, stellt eine S-R-Theorie dar. Sie gehört also zu den Theorien, bei denen das Hauptgewicht auf der Beschreibung der Koppelung zwischen Reizen (S) und Reaktionen (R) liegt. H U L L S Theorie unterscheidet sich jedoch von der Kontiguitäts-Theorie GUTHRIES. Die Theorie von E. R. G U T H R I E ist eine Fortsetzung der klassischen Assoziationstheorie und nimmt an, daß jede Kombination von Reizen, die einmal eine Bewegung begleitet, die Tendenz erwirbt, bei ihrem Wiederauftreten diese Bewegung auszulösen. Dagegen nimmt H U L L ganz entgegengesetzt an, daß Lernen prinzipiell eine Verstärkung von Reaktionstendenzen sei. G U T H R I E und H U L L unterscheiden sich auch in dem Maß an wissenschaftlicher Strenge, das beide für die Darstellung ihrer Untersuchungsergebnisse für erforderlich halten. H U L L formuliert sich in einer exakten und stark formalisierten Sprache. Der Begriff „Theorie" hat in der Verhaltensforschung, wie H U L L sagt, eine Vielzahl von Bedeutungen. H U L L selbst definiert den Begriff wie folgt: „Eine Theorie ist eine systematisch schlußfolgernde Ableitung der sekundären Grundsätze (secondary principles) über beobachtete Erscheinungen aus einer relativ kleinen Anzahl primärer Grundsätze (primary principles) oder Postulate — fast wie die sekundären Grundsätze oder Lehrsätze der Geometrie letztlich als eine logische Hierarchie (Rangordnung) von wenigen Originaldefinitionen und hauptsächlichen Grundsätzen, genannt Axiome, hergeleitet sind." H U L L kennzeichnet die Eigenart einer systematischen wissenschaftlichen Theorie in dreierlei Richtungen. 1. In der Aufstellung von Definitionen der unentbehrlichen Termini, die in dem System gebraucht werden; 2. in der Aufstellung von Postulaten, welche die Beziehung zwischen den Naturphänomenen, die von den Termini repräsentiert werden, betreffen; *) CLARK L. HULL (1884—1952) in Acron (New York) geboren, studierte am Alma College und wurde 1913 Bachelor of Arts an der Universität Michigan. Seit 1914 wirkte er als Professor der Psychologie an der State Normal School in Ost-Kcntucky und später am Institute for Human Relations (Yale). Er war Mitglied der American Association for Advancement of Science und audi der Amerikanischen Psychologischen Gesellschaft, deren Senat er von 1931 bis 1933 angehörte und deren Präsident er von 1935 bis 1936 war.

Lernen und Verhalten

71

3. in einer Hierarchie von ineinandergreifenden Theoremen, die aus den Postulaten durch einen rigorosen logischen Prozeß abgeleitet sind. Die Hierarchie der Theoreme und der abgeleiteten Lehrsätze (bei H U L L „corollaries" genannt) baut das Gebäude seiner strengen wissenschaftlichen Theorie auf. Theoreme sind „Wenn-Dann" - Festsetzungen, die sagen, wenn die und die vorhergehenden Bedingungen bestehen, dann folgen die und die Konsequenzen. Die Leistungsfähigkeit eines wissenschaftlichen Systems hängt von der Übereinstimmung der Theoreme mit den Beobachtungen ab, auf die sie sich beziehen. Wichtig sind hierbei Definitionen von Termini, die sich auf Unbeobachtetes oder Unbeobachtbares beziehen, wie z. B. bei H U L L die „Reizspur" (stimulus trace), das „Hemmungsfeld" (inhibitory potential), die „Reizschwelle" (reaction threshold). H U L L fordert, daß „unobservels" eindeutig mit zwei oder mehr beobachtbaren Faktoren durch unzweideutige Beziehungen miteinander verbunden werden, so daß sie auch durch diese Beziehung definiert werden können*). Das beobachtete Verhalten gliedert H U L L in Einheiten auf, die er „habits" nennt; diese stellen mehr oder weniger komplexe Reaktionsgefüge auf definierte Wiederholungen von Reizorganisationen dar. H U L L geht davon aus, daß alles Verhalten, das individuelle und soziale, das moralische und unmoralische, das normale und psychopathologische, den gleichen physiologischen Gesetzmäßigkeiten folgt. Unterschiede im Zustandekommen von Verhalten rühren aus den unterschiedlichen Zuständen her, unter denen habits sich aufbauen. Das hier gebrauchte Wort „Gewohnheit" darf nicht mit dem sehr allgemeinen und komplexen Begriff unserer Alltagssprache verwechselt werden. Um dieser Verwechslung in Zukunft aus dem Wege zu gehen, wird die von H U L L benutzte Bezeichnung „habit" verwendet. Ein Habit ist also eine ReizReaktionsverbindung, eine Assoziation zwischen bestimmten Reizen und einer darauffolgenden Reaktion. Habit kann so einfach wie ein „bedingter Reflex" oder wie eine bedingte Reaktion sein. Das Akquirieren von Habits, ihre Entstehungsbedingungen oder auch ihre Auslöschung und Dauer fordern möglichst genau definierte Termini sowie *) Die „unobservels" entsprechen dem von HANS REICHENBACH geprägten Begriff „Illata". Unter „Illata" versteht REICHENBACH nicht sichtbare, aber erschlossene Dinge, im Unterschied zu den „Konkreta", den beobachtbaren Dingen, und den „Abstrakta", welche Zusammenfassungen von Konkreta darstellen und nicht direkt beobachtet werden können. Die Illata dagegen sind keine Verbindungen von Konkreta, sondern bezeichnen selbständig existierende Sachverhalte, die aus den Konkreta erschlossen werden und deren Existenz auf der Basis von Konkreta nur wahrscheinlich ist. Erforderlich sind derartige „unobservels" oder „Illata", damit die Beziehungen zwischen den Konkreta erklärt werden können. Der wichtigste Typus von „unobservels" oder „Illata" sind die „intervenierenden Variablen", die wie „Lernen", „Motivation" oder „Persönlichkeit" vielfältige Beobachtungen zu strukturieren und zu erklären gestatten.

72

Lernen und Verhalten

eine möglichst kleine, aber hinreichende Anzahl von Grundsätzen. Die wichtigsten Begriffe seiner Theorie sind folgende: 1. Reiz ( s t i m u l u s ) : Er ist psychologisch relevant in seiner spezifischen physikalischen Stärke (S) und in seinem entsprechenden neurologischen Resultat im Organismus (s). 2. Trieb (d r i v e): So wird jeder besonders starke Reiz genannt, der den Organismus zu einem Verhalten zwingt. Die physiologische Stärke (D) motiviert Verhalten. Von D zu unterscheiden sind die objektiv beobachtbaren Bedingungen (CD), die den Trieb hervorrufen. 3. Signal (c u e): Es sind diejenigen Aspekte eines Reizes, die über Zeit, Ort und Art der Reaktion entscheiden. Während „Trieb" also mehr ein Terminus für die Quantität des Reizes ist, repräsentiert „Signal" die qualitative Bedeutung eines „Reizes" für das Verhalten. 4. Reaktion ( r e s p o n s e ) : Dies ist jede Antwort des Organismus auf den Signalwert eines Reizes. Gelernt wird nach HULL nur dann, wenn es zur Reaktion kommt und dadurch eine Triebreduktion stattfindet. Die Reaktion kann eventuell allein in der Bereitstellung verschiedener Verhaltensmöglichkeiten bestehen (antizipatorische Reaktion), die dann als Vorstellungen, Gedanken oder Absichten erlebt werden. 5. Belohnung (r e w a r d): Sie ist die sich als Habitverstärkung auswirkende Triebreduktion. Dies ist im allgemeinen das Ende eines für den Organismus starke Reize setzenden Zustandes, also auch das Ende einer Bestrafung. 6. Hemmung ( i n h i b i t i o n ) : Hiermit ist die Wahrscheinlichkeit bezeichnet, daß eine Reaktion nicht auftritt. Die Grundhypothese über Organismen charakterisiert sich in H U L L S Auffassung als ein sich selbst erhaltender Mechanismus, dessen Verhalten durch eine definierte Anzahl von Naturgesetzen bestimmt wird. Für diese Abfolge von Ereignissen, die über die Außenenergie zur Produktion von Verhalten führt, benutzt H U L L eine technische Sprache, durch die er auch seine Theorie in Formeln ausdrücken kann. Die wichtigsten seiner Zeichen und ihre Bedeutung sind nachstehend aufgeführt*): S s l

8

HR

der physikalische Reiz, Stimulus der aufsteigende nervöse Impuls Impulsmuster aus s mit anderen zugleich aufsteigenden s Habit aus Impulsmuster (s) plus motorischem Reaktionsmuster

gH^ D gEß IR jlg

*) HULL, C. L.: Principles of Behavior (1943).

generalisiertes Habit Bedürfniszustand des Organismus (Drive) hervorgerufenes (evoziertes) Reaktionspotential aus gH R und D angeborenes Hemmungspotential (Inhibition) erlernte Hemmung (gemäß dem Vorgang bei gH R )

Lernen und Verhalten gE!jj effektives Reaktionspotential als Differenz von SER

O

— (IR + S!R)

Oszillation des ReaktionsPotentials als Folge dauernder Reaktionsnotwendig-

gE!° R

73

keiten des Organismus auf wechselnde Reizeinwirkungen das sdiließlidi momentan wirkende Reaktionspotential aus sE! R plus O

Vorwiegend mit diesen Begriffen formuliert H U L L sechzehn „Postulate", die für das Verhalten und das Erlernen von Verhalten aller Säugetiere Gültigkeit haben sollen, also auch für den Menschen. Die Theorie, die H U L L auf diesen Postulaten aufbaut, ist eine „molare" Verhaltenstheorie. „Molar" heißt hier, anders als „molekular", daß nicht die jeweils als kleinstmöglich angenommene Verhaltenseinheit und ihre physiologischen Korrelate mit einbezogen sind. Die Ergebnisse der Neurophysiologie können der Verhaltenstheorie noch nicht so hinreichend eindeutig zugeordnet werden, daß sie als Postulate in die Verhaltenstheorie aufgenommen werden könnten. Deshalb wird die Theorie zur Zeit „molar" genannt. Zunächst hypothetische und dann experimentell bestätigte „intervenierende Variablen", die das nicht direkt Beobachtbare exakt zu messen und als Einflußgröße der Vorhersage in den Griff zu bekommen gestatten, nehmen als Voraussetzung HULLS eine zentrale Stellung im Theoriensystem ein. Der Begriff „intervenierende Variable"*) erhält seinen Sinn bei H U L L dadurch, daß diese Variablen zwischen den Reizen und den auf sie folgenden Reaktionen „vermitteln". So wird der physikalische Reiz (S) durch „Perzeption" zum aufsteigenden nervösen Impuls (s) im sensorisdien System des Menschen. Durch „Interaktion" mit bereits vorliegenden anderen afferenten Impulsen wird (s) modifiziert zu einem qualitativ einzigartigen „Impulsmuster" (s). Durch den Prozeß der „Summation" kumulieren sich verstärkende Wiederholungen der Assoziation von aufsteigenden wahrgenommenen Reizen mit absteigenden motorischen Ereignissen zur sog. Habitstärke ( S H R ). Da der aktuelle, evokative Reiz nicht mit der zentralen Tendenz der vorangegangenen Reizpopulationen identisch ist, bleibt nur die „generalisierte" Habitstärke ( S H R ) verfügbar. Diese generalisierte Habitstärke kombinatorisch vermehrt mit Bedürfnissen (D), „Motivation" genannt, führt zum Reaktionspotential (sE R ). Da jedoch (hypothetisch angenommene) angeborene biologische Hemmungen (I R ) und erlernte Hemmungen (gI R ) das Reaktionspotential mindern, muß diese Inhibition (Hemmung) subtrahiert werden von (SER). Hieraus folgt als Ergebnis das effektive Reaktionspotential (gE!R). Dieses effektive Reaktionspotential ändert sich ständig; diesen Prozeß kennzeichnet *) Unter einer „intervenierenden Variablen" versteht man eine nicht direkt meßbare oder beobachtbare Veränderliche im Verhalten, die aber durdi ihren funktionellen Zusammenhang mit den beobachtbaren Variablen objektiv definierbar und meßbar wird.

74

Lernen und Verhalten

H u l l als „Oszillation" ( S O R ). Das schließlich beobachtbare momentan wirkende Reaktionspotential ist dann ( S E!° R ) und entspricht in der alten S-R-Formel der Lerntheoretiker dem Zeichen R für Reaktion oder Response. H u l l gibt dem (R) noch eine Reihe von Indizes, die als (P) die Wahrscheinlichkeit der Evokation gerade dieser Reaktion, als (t) die Latenzzeit bis zum Auftreten, als (n) die Zahl der fehlenden (notwendigen) Verstärkungen und als (A) schließlich die Weite oder Amplitude der beobachteten Reaktion kennzeichnen sollen. Von diesen eben beschriebenen Variablen sind der Beobachtung zugänglich der Reiz (S) und meßbar im physikalischen Maßsystem, ebenso wie die Reaktion (R) mit ihren Indizes P, t, n im gleichen Maßsystem erfaßt werden kann. Auch die Variable (D) Bedürfnis ist durch eine Reihe von Meßvorschriften, den Stoffwechsel des Organismus betreffend, von H u l l zu einer beobachtbaren Einflußgröße gemacht worden. Die anderen in unserer Symbolliste und der kurzen Beschreibung von aufeinanderfolgenden Prozessen (Perzeption, Interaktion, Summation, Oszillation und Evokation) erfaßten Untereinheiten dieses Verhaltensmodells sind mit „intervenierenden" Variablen verknüpft. Die Einführung intervenierender Variablen wurde notwendig, je genauer man in die Struktur des tierischen und menschlichen Verhaltens einzudringen vermochte, weil es immer schwieriger wird, Reize und andere objektive Meßgrößen einerseits und das ausgelöste und reagierende Verhalten andererseits in direkte Beziehungen miteinander zu bringen. Symbolische Konstruktionen wie intervenierende Variablen haben einen zweifelhaften Wert, wenn sie nicht in eindeutigen Beobachtungen und wiederholbaren Messungen verankert sind. Deshalb müssen Hilfsmittel gefunden werden, durch die Werte der intervenierenden Variablen mit Hilfe von Messungen im Bereich der Anfangsbedingungen des zu erklärenden Ablaufs festgelegt werden können. Von da müssen aber wieder Verfahren gefunden werden, um zu ermitteln, in welchem Grade die im Ablauf veränderten Meßgrößen mit den Erwartungswerten übereinstimmen. Auf diese Weise entsteht ein kompliziertes Geflecht von Kontrollexperimenten und anderen technischen Verfahren, deren allgemeine Grundlagen allen Wissenschaften gemeinsam, deren jeweilige Einzelheiten jedoch nur für einen bestimmten Forschungszweig eigentümlich und bezeichnend sind. Lassen sich aus der hypothetischen Konstruktion keine prüfbaren Erwartungswerte in bezug auf die Ausgangszustände der zu erklärenden Abläufe formulieren, so kann die Hypothesengröße nicht empirisch verifiziert werden. Unverifizierbare Hypothesen haben jedoch keinen Platz in einer exakten Wissenschaft. Der richtige Gebrauch von symbolischen Konstruktionen wird am besten mit Hilfe einer mathematischen Gleichung gesichert, die die

Lernen und Verhalten

75

funktionalen Beziehungen wiedergibt. Eine empirische Wissenschaft ist mit HANS REICHENBACH im modernen Sinne des Wortes eine glückliche Kombination von Mathematik und Beobachtung. Die Mathematik ist analytischer Natur, d. h. ihre Lehrsätze sind (bezüglich ihrer Aussagen über beobachtbare Dinge) leer. Darum gelten sie streng und sind gerade deshalb auf die Naturwissenschaften anwendbar. Die Mathematik kann nie ein wissenschaftliches Resultat verfälschen, da sie inhaltlich-wissenschaftlichen Aussagesystemen — auch in versteckter Form — keinerlei Inhalt unkontrolliert hinzufügen kann. Notwendig aber ist eine mathematische Formulierung in allen den theoretischen Zusammenhängen, in denen die Sicherung der Widerspruchsfreiheit (wie z . B . bei den aus Postulaten abgeleiteten Theoremen) erforderlich (und möglich) ist. Das gesamte theoretische System HULLS besteht aus 16 Postulaten und 15 aus ihnen deduzierten Gesetzen (corrolaries). Sie sind in HULLS Werk „Principies of Behavior" (1943) festgelegt. Die für eine traditionelle Wissenschaftsauffassung überbescheidene Benennung experimentell erarbeiteter Gesetzmäßigkeiten als „Postúlate" sollte dabei nicht den Eindruck erwecken, als käme den Forschungsergebnissen HULLS eine geringere Sicherheit zu als etwa den sogenannten Gestalt„Gesetzen". Das Gegenteil ist der Fall. Im folgenden können wir nur die Postúlate HULLS selbst, nicht aber ihre Ableitungen im einzelnen, darstellen. Postulat 1 Wenn eine Reizenergie (S) (z. B. Licht) auf das reizvermittelnde Rezeptororgan (Auge) trifft, wird ein nervöser Impuls (s) erzeugt („afferenter Impuls"). Dieser wird die Nervenbahnen entlang über das Gehirn oder ein Zentrum im Rückenmark zu den Wirkorganen (vor allem Muskulatur und Drüsen) geleitet. Während der Wirkung der Reizenergie (S) steigert sich der afferente Impuls (s) nach einer kurzen Latenz schnell zu einem Intensitäts-Maximum und fällt dann allmählich zu einem relativ niedrigen Wert ab. Nach Beendigung der Wirkung der Reizenergie (S) auf das Empfang-Organ setzt der afferente Impuls (s) seine Aktivität im zentralen Nervengewebe für einige Sekunden fort, während sein Energiebetrag allmählidi gegen Null abnimmt. Dieser Intensitätsschwund ist eine einfädle, absinkende Funktion seines Wertes von der Zeit an, in der S zu wirken aufhörte. Das Postulat 1 beschreibt also, wie auch das folgende, Perzeption und Verlauf des Reizgesdiehens, das das Verhalten auslöst. Afferente Erregungen steigen rasch zu einer maximalen Intensität an und klingen dann allmählidi ab. Nach Beendigung des Reizes am Rezeptor wirkt der afferente nervöse Impuls noch eine Weile im zentralen Nervensystem nach.

76

Lernen und Verhalten

Postulat 2 Alle afferenten nervösen Impulse (s), die in irgendeinem Augenblick im Nervensystem wirken, stehen untereinander in Interaktion, und zwar derart, daß sie jeden Impuls in ein etwas anderes Impulsmuster (s) verändern. Die gegenseitige Beeinflussung variiert dabei mit den gleichzeitig assoziierten afferenten Impulsen. Die Größe des Wechselwirkungseffektes (Interaktionseffekt) eines afferenten Impulses auf einen zweiten ist eine monoton wachsende Funktion der Größe der ersten. Aus diesem Postulat 2 folgt, daß eine Reizenergie (S) nicht nur afferente Impulse (s) produziert, sondern auch andere afferente Impulse (s) verändert. Genauer heißt das: Wenn in einem bestimmten Augenblick eine beliebige Anzahl afferenter Impulse (s) ins Nervensystem eingetreten ist, dann wirkt jeder Impuls auf einen anderen oder auf mehrere modifizierend. Wirkt ein afferenter Impuls auf einen zweiten ein und verändert ihn, so sind Charakter und Maß der Veränderung nicht mehr die gleichen wie bei jener, die durch die Wirkung eines dritten entsteht. Der letzte Satz des Postulats besagt dann: Je größer der erste afferente Impuls ist, der auf einen zweiten wirkt, desto größer ist der Effekt der Interaktion, d. h. desto mehr wird der zweite verändert. Die Art und das Maß der Veränderung werden nicht postuliert. So stellt das Postulat vor allem eine wissenschaftslogische und behavioristische Ortsbestimmung für Fragestellungen der Gestaltpsychologie dar. Postulat 3 Organismen besitzen angeborene nervöse Verbindungen zwischen Rezeptor und Effektor. Wenn Reiz und Trieb zusammen auftreten, aktualisieren jene Verbindungen eine Hierarchie von Reaktionen. Der Begriff „Hierarchie von Reaktionen" soll andeuten, daß die ausgelösten Reaktionen auf unterschiedliche Weise zu verschiedenen Graden der Bedürfnisreduktion führen. Die Reaktionen der Hierarchie sind entweder einzeln oder in Kombinationen besser zur Bedürfnisreduktion geeignet, als es eine beliebige oder zufällige Auswahl von Reaktionspotentialen wäre, die sich aus anderen Reiz- und Triebverbindungen ergeben. Dieses Postulat bezieht sich also auf Bedürfnisse und auf die Aktivierung von Reaktionen durch Bedürfnisse. Das gilt auch für das Postulat 4. Doch begegnen wir dort zwei neuen Begriffen, auf die zunächst hingewiesen werden soll: „Habitstärke" und „Verstärkung" (Reinforcement). Mit „Habitstärke" ist die Assoziationsfestigkeit zwischen Reiz und darauffolgender Reaktion gemeint; kurz gesagt, die Wahrsdieinlidikeit, mit der ein Reiz eine bestimmte Reaktion aktiviert.

Lernen und Verhalten

77

Was aber H U L L unter „Verstärkung" versteht, sei an Hand der folgenden Überlegungen erklärt: Für die Vielzahl verschiedener Bedürfnislagen, in denen sich höher organisierte Tiere befinden, reidien angeborene, fertige Verbindungen zwischen Rezeptor- und Effektororganen (auf die sich das Postulat 3 bezog) zur Optimierung der Lebensbewältigung nicht aus. Dieser natürliche Mangel an ererbten Reaktionsbereitschaften wird durch Lernen beseitigt. Lernen ist entweder die Verstärkung des Gefälles in einer Reaktionshierarchie, die durch ein Bedürfnis hervorgerufen wurde, oder aber Lernen ist die Neugestaltung von Verbindungen zwischen Rezeptor- und Effektororganen. Die erste Form stellt ein einfaches selektives Lernen und die zweite ein Lernen von bedingten Reflexen dar. Es gibt auch Zwischenformen des Lernens, in denen selektives und Bedingungslernen gleichzeitig stattfinden. Ein Vergleich dieser, oberflächlich gesehen, ziemlich verschiedenen Formen des Lernens zeigt, daß ein allgemeines Prinzip alle diese Formen durchläuft. Dieses Prinzip nennt H U L L das „Gesetz der primären Verstärkung" (law of primary reinforcement). Es lautet folgendermaßen : „Immer wenn eine Reaktion (R) in zeitlicher Nachbarschaft zu einem afferenten Impuls (s°) erfolgt, oder mit dem überdauernden Engramm eines solchen Impulses, der aus dem Auftreten einer Reizenergie (S°) auf ein Rezeptororgan entsteht, und wenn dieses ungefähr gleichzeitige Auftreten (von S° und R) mit einer Bedürfnisreduktion assoziiert ist, dann wird für diesen Reiz die Tendenz verstärkt werden, bei späterem Auftreten die nämliche Reaktion hervorzurufen." Aus diesem Gesetz ist es möglich, sowohl die différentielle RezeptorEffektor-Verstärkung des einfachen selektiven Lernens als auch den Aufbau ganz neuer Rezeptor-Effektor-Verbindungen abzuleiten, die sowohl für das Lernen bedingter Reflexe als auch für gewisse Formen des selektiven Lernens charakteristisch sind. Ebenso wie das Verstärkungsprinzip selbst ist auch der in ihm verwendete Begriff „Reizspur" („stimulus trace") hypothetischer Natur. Die „Reizspur" ist ein nachklingender Prozeß im Rezeptorbereich des Gehirns (entspricht dem Engramm älterer Psychologien). Von diesem Verstärkungsprozeß wird angenommen, daß er der Entladung eines Rezeptororgans mit stufenweise sich vermindernder Stärke für einige Sekunden und möglicherweise sogar für Minuten folgt-). Im ersten Postulat wurden die Reizenergien und die durch sie erzeugten afferenten nervösen Impulse durch Symbole (S) und (s) repräsentiert. Demgegenüber bezeichnet H U L L die im Verstärkungsprozeß betrachteten Reizenergien und die ihnen entsprechenden Impulse mit *) Diese Vermutung HULLS hat sidi niAt verifizieren lassen. OSGOOD S. 372.

78

Lernen und Verhalten

den Symbolen (S°) und (s°). Diese Reizenergien (S°) sind genauso physikalische Reizenergien wie jene Reizenergien, die durch das Symbol (S) repräsentiert werden und die wir im Postulat 1 kennenlernten. Neben der „primären Verstärkung" bzw. „primären Motivation" (wie man das Gesetz auch bezeichnet) kennt H u l l noch die „sekundäre Verstärkung" bzw. „sekundäre Motivation". Sie erfolgt durch einen Reiz, der eng und beständig mit der Bedürfnisbefriedigung verbunden war, d.h. genauer gesagt: Ein neutraler Reiz, der eng und beständig mit der Verringerung einer Bedürfnisspannung assoziiert war, kann selbst zur Verstärkung von Reaktionstendenzen führen. Postulat 4

Immer wenn eine Effektor-Aktivität ( R - » r ) und eine RezeptorAktivität (S° -» s°) in enger zeitlicher Nachbarschaft (SCr) vorkommen und diese enge zeitliche Nachbarschaft mit einer Bedürfnisreduktion (G) eng assoziiert ist oder mit einem Reiz, der seinerseits mit einer Bedürfnisreduktion eng und beständig assoziiert war, immer dann verstärkt sich die Tendenz ( A SHR) dieses afferenten Impulses, jene Reaktion bei späteren Gelegenheiten wiederum auszulösen-"'') (Abb. 10,1).

» |>

R l>

ASWft

r G Abb. 10,1

Die aufeinanderfolgenden Verstärkungen summieren sich zu einer kombinierten Habitstärke (sH R ); sie ist eine einfache, positiv anwachsende Funktion der Anzahl der Verstärkungen (N). Die obere Grenze (m) dieser Lernkurve ist das Produkt dreier Variabler: 1. Eine positiv anwachsende Funktion von der Größe der Bedürfnisreduktion, die eine primäre Verstärkung einschließt oder in einer sekundären Verstärkung assoziiert ist; je größer also das Ausmaß *) Hierin bedeuten G = Belohnung (Gratifikation, Verminderung eines Bedürfnisses) und A SHR = Anwachsen der Habitstärke, also der Assoziationsfestigkeit zwischen Reiz und darauffolgender Reaktion.

Lernen und Verhalten

79

der Befriedigung ist, desto höher ist der Meßwert dieser Funktion. 2. Eine negative Funktion der Verzögerung, der Zeit (t) zwischen Reaktion und Verstärkung; je kürzer diese Zeit, desto höher ist also der Wert der Funktion. 3. Eine negativ anwachsende Funktion des Grades der Ungleichzeitigkeit (t") von bedingtem Reiz S ° und der Reaktion R, wenn beide von kurzer Dauer sind; d. h. je kleiner das Zeitintervall zwischen bedingtem Reiz und Reaktion ist, desto höher ist der Wert. Die Wirkung des bedingten Reizes S ° kann soweit verlängert sein, daß sie auf den Anfang der Reaktion R übergreift, dann handelt es sich um eine negativ anwachsende Funktion der Dauer (t') der fortlaufenden Wirkung von S ° auf das Rezeptororgan. Das Postulat 4 sagt also aus, daß die Habitstärke (die Festigkeit einer Reiz-Reaktionsverbindung) wächst, wenn primäre oder sekundäre Verstärkung stattgefunden hat. Die Vergrößerungen von aufeinanderfolgenden Verstärkungen summieren sich und ergeben die kombinierte Habitstärke g H R : Diese läßt sich nun als einfache positiv anwachsende Funktion der Zahl der Verstärkungen (N) darstellen.

Abb. 10,2

Die Habitstärke wird in der theoretischen Einheit „1 hab" gemessen. „1 hab" ist definiert als ein Hundertstel der maximalen Habitstärke (1 hab = Max [ S H R ] : 100). Die obere Grenze (m) der dargestellten Lernkurve ist als diese maximale Habitstärke zu betrachten. Um nun die unten folgende Ableitung der mathematischen Festsetzung von Postulat 4 besser verstehen zu können, müssen wir die funktionalen Beziehungen der drei Variablen zur Habitstärke noch genauer betrachten. Diese funktionalen Relationen werden als Gradienten bezeichnet: Verstärkungsgradient, Zielgradient, Asynchronismusgradient. (Das Wort „Gradient" bedeutet soviel wie Steigung bzw. Neigung. In der Physik z. B. wird unter „Gradient" ein Vektor

80

Lernen und Verhalten

verstanden, der die Richtung der größten Änderung [des Anstiegs] einer Ortsfunktion angibt.) Betrachten wir zunächst den „ Verstärkungsgradienten". HÜLL versteht unter diesem die Steigung bzw. Neigung der Habitstärke, die ihrerseits durch die Quantität des Verstärkungsagens bestimmt wird, das zur primären Verstärkung verwendet wurde. Der Verstärkungsgradient ist also eine Funktion, die von dem Grad der primären Verstärkung abhängt und die den Zuwachs der Habitstärke angibt. Wir haben oben schon gesehen, daß die Habitstärke S H R als eine Funktion der Anzahl der Verstärkungen (N) dargestellt werden kann. Diese Funktion läßt sich symbolisch in folgender Weise ausdrücken: (1) N(SHR) = M ( l - e " m ) Hier stellt M das absolute physiologische Maximum der Habitstärke mit unbeschränkter Verstärkung dar, N die Anzahl der Verstärkungen, i eine empirisch zu bestimmende Konstante, die die Zuwachsrate der Funktion bis zu ihrem Maximum determiniert und e die Basis der natürlichen Logarithmen (e = 2,7183). Diejenige Habitstärke, die sich aus einer einzigen Verstärkung ergibt, ist lediglich als Funktion der Bedürfnisreduktion zu betrachten. Die dem HuLLschen Verstärkungsgradienten entsprechende Funktion formuliert sidi dann aus dem HuLLschen Verstärkungsgradienten. (2)

M

= M' (1 — e"KW)

Hierin ist M ' die skalare Größe für den Verstärkungsgradienten, W der Betrag der hier gebrauchten verstärkenden Kraft oder kürzer gesagt: der Verstärkungsgrad, und k ebenfalls wie i eine empirisch zu bestimmende Konstante. Will man bei der Benennung der Buchstaben den Begriff „Verstärkungsgradient" vermeiden, so kann man selbstverständlich auch analog der Benennung von M ( = absolutes Maximum) sagen: M ' ist dasjenige Maximum der Habitstärke, das durch den Charakter und den Betrag der hier gebrauchten verstärkenden Kraft bestimmt ist. Unsere Formel (2) sagt folgendes aus: Unter dem „Verstärkungsgradienten" versteht man eine mit negativer Beschleunigung wachsende Funktion des Grades der Verstärkung*). Wenden wir uns nun der zweiten Variablen zu: Während der Verstärkungsgradient gewissermaßen ein Gradient der primären Verstärkung ist, also durch die Größe der Bedürfnisreduktion bestimmt wird, die in einer primären Verstärkung vorhanden ist, und der damit die direkte Wirkung der Belohnung auf die Habitstärke angibt, bezieht sich der Zielgradient auf die sekundäre Verstärkung * ) Der Begriff „negative Beschleunigung", der hier für die Beschreibung einer wachsenden Funktion verwendet wird, bedeutet, daß die Differenz 8 zweier aufeinanderfolgender Funktionswerte M ' bei regelmäßig zunehmendem W stets kleiner wird, daß also das Wachsen der Funktion nachläßt.

Lernen und Verhalten

81

eines Habits. Es handelt sich also bei ihm um eine Verstärkung mit Hilfe von Reizen, die mit der Bedürfnisreduktion eng und beständig assoziiert waren. Er ist durch die zeitliche Entfernung einer Reaktion (R) vom Ziel, nämlich der Belohnung (G), bestimmt. Je kleiner die zeitliche Entfernung (t) ist, desto größer ist die Habitstärke. Die allgemeine Gleichung für diese Funktion lautet: (3)

m ' = M ' e"Jt

Hierin stellt t die Verzögerung der Verstärkung dar, d. h. die zeitliche Entfernung zwischen Reaktion und Belohnung, eine empirische Konstante und m' den Zielgradienten bzw. die obere Grenze der Habitstärke, die durch die Verzögerung der Verstärkung bestimmt ist. Ein Vergleich dieser Gleichung (3) mit der obigen (2) zeigt, daß sich der Zielgradient vom Verstärkungsgradienten ableiten läßt. Vom Zielgradienten wiederum läßt sich der Asynchronismusgradient ableiten. Er stellt die Funktion dar, die durch den Grad der Ungleichheit von bedingtem Reiz S° und Reaktion R bestimmt wird, wenn beide von kurzer Dauer sind oder wenn S° auf den Anfang von R übergreift. Ist die Ungleichzeitigkeit im Auftreten von S° und R derart, daß S° auf den Anfang von R übergreift, so bezeichnet man den Grad der Ungleichzeitigkeit mit t'. Der Gradient ist dann eine negativ anwachsende Funktion der Länge der Zeit t ' . Greift S nicht auf den Anfang von R über und sind beide von kurzer Dauer, so wird das Zeitintervall zwischen S° und R mit t" bezeichnet, und der Asynchronismusgradient ist dann eine negativ beschleunigte, fallende Funktion von t", ähnlich dem Zielgradienten:

Abb. 10,3

Der Asynchronismusgradient gibt also die Habitstärke für eine bedingte Reaktion an, wenn die Zeit variiert, um welche die Reaktion (und die Verstärkung) später auftritt als der Reiz. Dieser Gradient ist am größten, wenn die Wirkung des bedingten Reizes nicht länger als eine halbe Sekunde bis zum Beginn der Reaktion anhält. Danach fällt er in beiden Richtungen rasch ab (siehe Abbildung). 6 Haselolf-Jorswieck, Psychologie

Lernen und Verhalten

82

(4) m = m' e"ut' oder (5) m = m* e"Tt"

2

1,5 1

0,5

0,5

7

1,5 2

2,5

3

Abb. 10,4 Mathematische Festsetzung des Postulats 4 Die mathematische Festsetzung des Postulates 4 ist deutlich kürzer, vorteilhafter und lehrreicher als die wörtliche Formulierung, die oben gegeben -wurde. Sie besteht zunächst darin, daß die oben dargestellten Gleichungen vorausgesetzt werden: Es wird vorausgesetzt, daß (2) M' = M (1 — e"kw) und (3) m' = M" e'Jt ist und entweder (4) m = m'e' ut ' oder (5) m = mV1*" gilt sowie (6)SHB= m ( l - e - N ) . Setzen wir nun Gleichung (4) in Gleichung (6) ein, so erhalten wir (7) s H r = m'e"ut' (1 - O . (3) in (7): (8) s H r = M' e e (1 (2) in (8): (9) S H R = M (1 — e'kw) e"Jt e"ut' (1 — e w ) . Dies ist eine der gesuchten möglichen Gleichungen. Sie gilt f ü r den Fall, daß die Reaktion R folgt und sich mit der andauernden Wirkung des bedingten Reizes S°auf ein Rezeptororgan für die Dauer t' überschneidet. Die andere Gleichung erhält man, indem man statt der Gleichung (4) die Gleichung (5) entsprechend in die Gleichung (6) einsetzt. In dem HuLLschen System gibt es neben den drei erwähnten Gradienten noch weitere. Von diesen sei aber nur noch derjenige erwähnt, der in bezug auf das folgende, also das fünfte Postulat, von Bedeutung ist. Es ist der Reizgeneralisationsgradient, der eine ähnliche Form

Lernen und Verhalten

83

hat wie der Zielgradient. Er besagt, daß die Habitstärke in dem Grade abnimmt, in dem die Entfernung des ursprünglichen vom gegenwärtigen Reiz auf dem Reizkontinuum wächst. Diese Entfernung auf dem Reizkontinuum wird in Untersdiiedsschwellen als Einheiten gemessen. Postulat

5

Die generalisierte Habitstärke S H R setzt sich zusammen erstens aus einer negativ anwachsenden Funktion der Habitstärke zur Zeit der Verstärkung und zweitens aus der Größe der Differenz (8) auf dem Reizkontinuum zwisdien den afferenten Impulsen von s° und S; dort, wo 8 einen qualitativen Unterschied darstellt, ist die Neigung des Gradienten der negativ anwachsenden Funktion steiler, als wenn 8 einen quantitativen Unterschied darstellte. Im Unterschied zur Habitstärke bezieht sich die generalisierte Habitstärke*) auch auf Reize, die sich von den ursprünglich konditionierten Reizen um ein weniges unterscheiden. Die Größe der Differenz zweier solcher Reize kann in „eben merklichen Unterschieden", d. h. in Untersdiiedsschwellen als Einheiten gemessen werden. Das Postulat 5 legt demnadi das Ausmaß des Mitlernens (Transfer) fest und nennt dessen Bedingungen. Postulat

6

Assoziiert mit einem Trieb (D) ist ein charakteristischer Triebreiz (CD), dessen Intensität eine monoton wachsende Funktion des infragekommenden (zugehörigen) Triebes ist. Unter einer „monoton wachsenden Funktion" y = f(x) versteht man eine Funktion, deren y-Werte sich mit zunehmendem x ständig vergrößern; x und y sind proportional. (Es tritt bei einer solchen Funktion z. B. nicht der Fall ein, daß zwei Funktionswerte y an zwei verschiedenen x-Stellen gleich sind.) Danach besagt also das Postulat 6, daß die Intensität des Triebreizes, der mit dem Trieb assoziiert ist, um so größer ist, je stärker der zugehörige Trieb ist. Postulat

7

Alle primären Triebe, die im Innern eines Organismus zu einer gegebenen Zeit wirken, laden jede effektive Habitstärke (sH! R ) zu einem Reaktionspotential ( S E R ) auf. Die Größe dieses Potentials ist prinzipiell Ergebnis einer wachsenden Funktion von D. Das Reaktionspotential wird in „wats"**) gemessen, wobei 1 wat (analog dem hab) gleich 0,01 des maximalen Reaktionspotentials ist. Die habs werden zu wats, wenn Triebe auf sie einwirken. Die Triebe *) Audi „effektive Habitstärke" genannt. **) In Erinnerung an WATSON SO genannt. 6»

84

Lernen und Verhalten

werden in „ m o t e s " gemessen. D a b e i ist ein mote (entsprechend wie oben) 0,01 der m a x i m a l e n Triebstärke. D i e Maßeinheiten verbinden sidi gemäß dem Postulat 7 in folgender Weise: „wats = habs • m o t e s "

Postulat

8

Immer wenn eine R e a k t i o n ( R ) im O r g a n i s m u s ausgelöst wird, w i r d umgekehrt gleichzeitig ein primärer negativer Trieb ( D ) erzeugt. a ) D i e s e r p r i m ä r e n e g a t i v e T r i e b h a t eine a n g e b o r e n e K a p a z i t ä t ( J R ) , d a s R e a k t i o n s p o t e n t i a l ( g E R ) in seiner W i r k u n g zu h e m m e n ; b) die S t ä r k e der reinen H e m m u n g ( J ° r ) , die durch eine F o l g e v o n R e a k t i o n s a u s l ö s u n g e n e r z e u g t w i r d , ist eine e i n f a c h e linear w a c h s e n d e F u n k t i o n der A n z a h l der A u s l ö s u n g e n ( n ) ; c) die reine H e m m u n g J ° R ist eine p o s i t i v beschleunigte, a n w a c h s e n d e F u n k t i o n der A r b e i t ( W ) , die in der A u s f ü h r u n g der R e a k t i o n enth a l t e n ist; d) r e a k t i v e H e m m u n g ( J R ) v e r s c h w i n d e t als eine einfache, n e g a t i v wachs e n d e F u n k t i o n der Z e i t ( t ' " ) .

D e r Inhalt dieses Postulates 8 besagt also vor allem, daß die Auslösung irgendeiner R e a k t i o n eine reaktive H e m m u n g erzeugt („Restitutionsphase" bei MIERKE), die aber mit der Zeit verschwindet ( „ s p o n tane E r h o l u n g " ) . Postulat

9

Reize (S), die mit dem A u f h ö r e n einer R e a k t i o n ( R ) eng assoziiert sind, werden auf die H e m m u n g ( J R ) bedingt, die mit dem Auslösen dieser R e a k t i o n assoziiert ist. D a d u r c h entsteht zunächst eine bedingte H e m m u n g . Bedingte H e m m u n g e n ( S J R ) aber summieren sich p h y siologisch mit reaktiven H e m m u n g e n ( j R ) z u einer R e a k t i o n gegen das Reaktionspotential; also etwa so, wie eine positive H a b i t - T e n d e n z sich mit jeder anderen summiert. Aus diesem Postulat folgt, daß sich die bedingte H e m m u n g nicht wie eine reaktive H e m m u n g ausbreitet. Sie wirkt vielmehr wie ein H a b i t . D a s H e m m u n g s p o t e n t i a l w i r d in ,,pavs" ! ; ') gemessen; ein „ p a v " ist dadurch definiert, d a ß es ein w a t aufhebt b z w . hemmt. A u s dem Reaktionspotential und dem H e m m u n g s p o t e n t i a l , die in der Berechnung des Reaktionspotentials einfach voneinander subtrahiert werden, ergibt sich das effektive R e a k t i o n s p o t e n t i a l : (10) Postulat

SE!r = S E R - J R

10

Mit jedem Reaktionspotential ( g E R ) ist prinzipiell ein H e m m u n g s potential ( s O R ) assoziiert, das v o n Augenblick z u Augenblick in seinem Q u a n t u m (innerhalb der Grenzen statistischer Wahrschein* ) In Erinnerung an P a w l o w so genannt.

Lernen und Verhalten

85

lichkeit) oszilliert, dessen Umfang sowie Maximum und Minimum aber konstant bleiben. Das Quantum dieses oszillierenden Hemmungspotentials bleibt völlig unbeeinflußt, auch von den Habits, mit denen es im Augenblick im Organismus assoziiert ist. Die Verminderung des effektiven Reaktionspotentials S E! R durch die Wirkung von s O R ist nur durch das Quantum von S E! R in der vorhandenen Zeit begrenzt. Für das momentane effektive Reaktionspotential gilt also: (11)

SE!°R

=

S

E!R-SOR

Damit ist gewissermaßen die Existenz eines momentanen effektiven Reaktionspotentials postuliert. Der zweite Teil des Postulats 10 besagt, daß das Quantum des Hemmungspotentials und die gegebenen Habits, wenn beide in einem bestimmten Teilabschnitt zusammen auftreten, voneinander unabhängig sind. Setzt man hier statt der erwähnten Habits den Begriff Reaktionspontential, was ohne Einschränkungen zulässig ist, so muß man das Postulat folgendermaßen verstehen: Das Quantum des Hemmungspotentials, das von Augenblick zu Augenblick schwankt, wird nicht durch das effektive Reaktionspotential beeinflußt, mit dem das Hemmungspotential augenblicklich assoziiert ist, und zwar selbst dann nicht, wenn das Hemmungspotential mit mehreren verschiedenen Reaktionspotentialen verbunden ist. Daraus folgt, daß der Verminderungsbetrag gegenüber dem effektiven Reaktionspotential S E! R durch die Wirkung des oszillierenden Hemmungspotentials s O R nur von dem Quantum des S E! R in der vorhandenen Zeit abhängt (oder anders ausgedrückt, daß die Veränderliche für das momentane effektive Reaktionspotential gH!° R lediglich die Größe des effektiven Reaktionspotential gE!R innerhalb der gegebenen Zeit ist). Das Oszillationspotential s O R vermag also nicht, den Wert S E! R unterhalb einer Reaktionsschwelle S L R zu halten, wenn S E! R genügend groß ist. Mit dem Postulat 10 wurde das momentane effektive Reaktionspotential definiert. In dem folgenden Postulat wird seine funktionelle Bedeutung für das Verhalten festgelegt: Postulat

11

Das momentane Reaktionspotential S E!° R muß die Reaktionsschwelle S L r überschreiten, ehe ein Reiz (S) eine Reaktion (R) hervorbringen kann. Das Postulat wird mit Hilfe der mathematischen Aussagenlogik festgesetzt. Wir wollen uns im folgenden diese mathematische Festsetzung genauer ansehen, und zwar deshalb, weil sie beispielhaft für die Arbeitsweise von H u l l ist und auch beispielhaft die Bedeutung

86

Lernen und Verhalten

zeigt, die die Verwendung der mathematischen Logik und ihrer Symbole für wissenschaftliche Aussagen haben k a n n : Mathematische Festsetzung von Postulat 11 Die Übersetzung des Postulates 11 in die konventionelle Zeichensprache der mathematischen Logik führt zu folgender Formel: (12)

(3x)

A xES A

s

E ! °

r

>

s

Lr

A D A

(Hy) A y E R

Neben den uns bereits bekannten Symbolen bedeuten hierin: H = „es existiert" oder „es g i b t . . . " (z. B.: 3 x = „es gibt ein x derart, daß . . . " ) A = „und" „ist in" oder „gehört zu" (z. B.: x E S = x „gehört zu S") ^ = ein Zeidien der Implikation: „ w e n n . . . , dann . . . , " (z. B. x C y = „x impliziert y" oder „wenn x ist, dann ist auch y"). Die Formel (12) ist nicht ohne weiteres in die gewöhnliche Umgangssprache übertragbar, da es einerseits nicht üblich ist, zwischen die Symbole ( 3 x ) und ( x E S ) ein A zu setzen und andererseits, das Implikationszeichen c . in zwei A einzuschließen. Würde man dennoch eine Übertragung versuchen, so wäre die sich aus Formel (12) ergebende Aussage sinnlos. W i r betrachten also zunächst einmal die A als Trennungszeichen und setzen dafür Klammern. D a n n erhält die Formel (12) folgende Gestalt: (12') ( 3 x) (x E S) ( S E ! ° R > sLr) => O y) (y E R) oder, wenn wir aus Zweckmäßigkeitsgründen das eine A stehenlassen wollen: (12") ( 3 x) (x E S) A g E ! ° R > g L R =» (gy) ( y E R ) A B C Diese F o r m ( 1 2 " ) ist schon bei weitem differenzierter, läßt aber immer noch mehrere Möglichkeiten der Übersetzung zu, sofern wir nicht wissen, ob C von A plus B oder nur von B impliziert ist. I n der mathematischen Aussagenlogik haben die Operatoren (so werden die Verbindungs- bzw. Trennungszeichen genannt) einen verschiedenen Rang, d. h. der eine Operator trennt zwei Aussageformen A und B stärker als ein anderer (zweitrangiger); ähnlich wie in der Algebra*). Es ist 3 • 4 + 5 = (3 • 4) + 5 = 17 und nicht 2 7 , was sich aus der Form 3 • (4 + 5) ergäbe. Das Additionszeichen trennt hier stärker als die Multiplikationszeidien. Nach der Trennstärke geordnet ergibt sich folgende Rangliste der Operatoren: CZ und dies trennt stärker als A» und dies trennt stärker als V, und dies trennt stärker als = , und dies trennt stärker als + , und dies trennt stärker als usw. usw. *) KLEENE, ST.

S. 72—75.

C.: „Introduction to Metamathematics", § 17 Formations rules,

87

Lernen und Verhalten

Kennzeichnen wir nun die verschiedenen Ränge der beiden Zeichen A und —) durch weitere Klammern, so erhalten wir für die Formel (12") die eindeutig übersetzbare Form: (12'")

( 3 x ) [ ( x E S) A

(SE!°R >

S

LR)]

=>

[(H y ) ( y E R ) ]

Die Übersetzung lautet: Wenn es eine Größe x gibt, derart, daß sie zu einem Reiz S gehört, und wenn das momentane effektive Reaktionspotential gE!° R größer als die Reaktionsschwelle S L R ist, dann existiert auch eine Größe y, die zur Reaktion R gehört. Mit Hilfe dieser Übersetzung können wir den Wert einer mathematischen logischen Aussage gegenüber einer wörtlichen Formulierung erkennen. Denn wie hieraus ersichtlich, sagt die Formel (12) bzw. (12"') in einer viel kürzeren, eindeutigeren und informationsreicheren Weise das aus, was durch die wörtliche Formulierung des Postulates 11 ausgedrückt werden soll. Aus der Formel (12) ist nämlich eindeutig zu entnehmen, daß es nicht der Reiz S ist, der direkt eine Reaktion R hervorrufen kann, sondern daß es gewisse Faktoren (besser: Variable) gibt, die, wenn sie dem Reiz S angehören und SE!°r größer ist als G L R , gewisse andere Variable hervorrufen, welche mit der Auslösung einer Reaktion R verbunden sind. Diese den Tatsachen entsprechend genaue und ausführliche Aussage wird man wohl kaum aus dem Postulat 11 entnehmen können, wenn man dessen wörtliche Formulierung leidithin liest, ohne dabei an die vorher postulierten intervenierenden Variablen zu denken. Die nun folgenden „Postulate sind nichts anderes als Anweisungen dafür, wie die Berechnungen bis zum momentanen effektiven Reaktionspotential unter Einbezug der Reaktionsschwelle S L R empirisch auf ihre Richtigkeit geprüft werden können. Sie sind die empirischen Verankerungen des Systems der intervenierenden Variablen, die zwischen Reiz und Reaktion eingeschaltet werden müssen, wenn man verläßliche Voraussagen über das Verhalten von Organismen machen will"*). Postulat 12

Die Wahrscheinlichkeit (p) einer Reaktionsauslösung im quergestreiften Muskel ist eine normale (ogivenförmige) Wahrscheinlichkeitskurve der Häufigkeit, mit der das effektive Reaktionspotential ( S E ! ° r ) die Reaktionsschwelle ( S L r ) überschritten hat. Die folgende graphische Darstellung illustriert die Abhängigkeit der Wahrscheinlichkeit der Auslösung einer Reaktion von der Zahl der vorhergehenden Verstärkungen. Diese ogivenförmige Kurve wird verständlich, wenn man daran denkt, daß immer mehr von der Oszillationsbreite des Hemmungs*) TOMAN, W . : Einführung in die moderne Psychologie, S. 61, Wien (1951).

88

Lernen und Verhalten

potentials oberhalb der Reaktionsschwelle zu liegen kommt, je größer die Habitstärke und damit im weiteren auch das effektive Reaktionspotential •wird. Zuletzt kann schließlich das Hemmungspotential, auch wenn es gerade zu seiner äußersten Stärke hinaufoszilliert, die Reaktion nicht mehr verhindern; das ist hier mit der 28. Wiederholung erreicht.

Zahl der Verstärkungen Abb. 10,5 Postulat

13

Die Latenz ( s t R ) eines Reizes, der eine Reaktion im quergestreiften Muskel hervorbringt, ist eine negativ beschleunigte, monoton abfallende Funktion des momentanen effektiven Reaktionspotentials ( S E!° r ), vorausgesetzt, daß dieses die Reaktionsschwelle überschreitet. Dieses Postulat besagt also, daß die Latenzperiode eines Reizes in dem Grade kürzer wird, in dem das momentane effektive Reaktionspotential die Reaktionsschwelle übersteigt. Postulat

14

Die durchschnittliche Anzahl der unverstärkten Reaktionsauslösungen in quergestreiften Muskeln (n), die für eine experimentelle Auslöschung (Extinktion) der Reizreaktionsverbindung erforderlich ist, stellt eine einfache, linear wachsende Funktion des effektiven Reaktionspotentials (sE!r) dar, vorausgesetzt, daß jenes am Anfang die Reaktionsschwelle überschreitet. Mit dem Anwachsen des effektiven Reaktionspotentials (das die Reaktionsschwelle überschreitet) wächst die Zahl der erforderlichen unbelohnten Reaktionen (der quergestreiften Muskeln), um eine „Löschung" der Reiz-Reaktionsverbindung hervorzubringen; je weiter also das effektive Reaktionspotential über der Reaktionsschwelle

Lernen und Verhalten

89

liegt, desto größer ist der Widerstand gegen das Vergessen des Gelernten. Postulat Ii Die Amplitude (A) des nervösen Prozesses, der über das autonome Nervensystem eine Reaktion vermittelt, ist eine einfache linear wachsende Funktion des momentanen effektiven Reaktionspotentials ( S E ! ° r ) . Die Postulate 12 bis 15 definieren vier objektive Kontrollmöglichkeiten für die Gültigkeit der HuiLschen Theorie: 1. die Wahrscheinlichkeit, mit der eine bestimmte Reaktion auftritt, 2. die Latenzzeit der Reaktion, 3. der Widerstand gegen Extinktion und schließlich 4. die Amplitude der Reaktion.

Diese vier Variablen können zuverlässig gemessen werden und stellen deshalb eine objektive Kontrollmöglichkeit für die Richtigkeit der Theorie und ihre Folgen dar. Postulat 16 Wenn zwei Reaktionspotentiale (GER) zu zwei oder mehr unvereinbaren Reaktionen (R) in einem Organismus zur gleichen Zeit aufgerufen werden, dann wird nur jene Reaktion ausgelöst, deren momentanes Reaktionspotential ( S E ! ° R ) das größere ist. Mit dem Postulat 16 werden die Festsetzungen der grundlegenden Prinzipien vervollständigt. Versuchen wir uns nun abschließend an Hand eines zusammenfassenden Schemas das sich in den Postulaten spiegelnde Gesamtmodell des Lerngeschehens zu veranschaulichen: In dem folgenden Schema sind die Zusammenhänge zwischen den wichtigsten symbolischen Konstruktionen dargestellt, die H u l l in seinem System der Verhaltenstheorie verwendet. Die symbolischen Konstruktionen sind durch eingekreiste Symbole charakterisiert, dagegen sind die Symbolisierungen der sie stützenden, empirisch beobachtbaren Bedingungen und Tatsachen ohne Kreis gezeichnet: Zwischen Reiz und Reaktion schieben sich nach H u l l also sechs Konfigurationen intervenierender Variabler ein. Diese Konfigurationen intervenierender Variabler oder „Segmente", wie H u l l sagt, sind der Reihe nach: Verstärkung, Generalisation, Motivation, Hemmung, Oszillation und Reaktionsauslösung. Alle diese Prozesse oder Segmente setzen sich aus den verschiedensten intervenierenden Variablen zusammen (eingekreiste Symbole), welche jedoch immer in funktionaler Abhängigkeit von objektiv meßbaren Größen stehen (Symbole ohne Kreis). Das erste Segment der dargestellten Kette betrifft die Verstärkung einer Reiz-Reaktionsverbindung durch Bedürfnisbefriedigung (Postulate 3 und 4). Aus ihr ergibt sich die Habitstärke, die von der Zahl der bisherigen Wiederholungen mit Verstärkung abhängt. Das zweite

Lernen und Verhalten

90

betrifft die Generalisation, die dann auftritt, wenn der gegenwärtige Reiz nicht ganz derselbe ist wie der ursprünglich gelernte. Diese ergibt die effektive Habitstärke, die sich aus der Habitstärke im Zeitpunkt der Verstärkung (§) und der Differenz (8) dieser beiden Verstärkung '

1

Generalisation

Abb. 10,6

Reize zusammensetzt (Postulat 5). Die Abweichung des gegenwärtigen Reizes vom ursprünglich bedingten kann hier physikalisch gemessen werden. Das dritte Segment bezieht sich auf die Motivation, die durch die effektive Habitstärke und das aktuelle Bedürfnis nach dem Zielobjekt bestimmt wird. Dabei hängt die Stärke des Bedürfnisses oder des Triebes von den Lebens- und Umgebungsbedingungen ab, die durchaus kontrollierbar sind. Habitstärke und Trieb multiplizieren sich und ergeben das Reaktionspotential (Postulat 6 und 7). Das vierte Segment bezieht sich auf das effektive Reaktionspotential, das sidi durch Subtraktion der reinen Hemmung vom Reaktionspotential ergibt (Postulat 8 und 9). Sowohl die angeborene Hemmung als auch die bedingte Hemmung, aus denen sich die effektive Hemmung einer Reaktion zusammensetzt, sind direkt meßbar durch die in der Reaktion zu leistende physikalische Arbeit, von der sie abhängen. Der fünfte Prozeß berücksichtigt die Oszillation der Hem-

Lernen und Verhalten

91

mung, die bewirkt, daß die Stärke der Hemmung von Augenblick zu Augenblick leicht untersdiieden ist (Postulat 10). Das Oszillationspotential läßt sich in der Gleichung der Gaußschen Kurve beschreiben. Der sechste Prozeß beschreibt die Reaktionsauslösung, die schließlich von der Größe des momentanen effektiven Reaktionspotentials abhängt. Das momentane effektive Reaktionspotential erhält man aus der Addition bzw. Subtraktion des Oszillationspotentials, d. h. die momentane Abweichung der Hemmungsstärke von ihrem Mittelwert. Liegt das momentane effektive Reaktionspotential oberhalb der objektiv bestimmbaren Reizschwelle, dann tritt die Reaktion auf und kann, genau so wie der auslösende Reiz, objektiv gemessen werden. Hierfür sind diesem Prozeß die vier objektiven Bedingungen (p, s t B , n, A) zugeordnet, die in den Postulaten 12 bis 15 festgesetzt wurden. Einen kritischen Ansatz arbeitet OSGOOD gegen HULLS Reinforcement (aber auch gegen alle anderen „Effekttheorien") heraus, wenn er betont, daß nicht erklärt wird, wie ein in der Gegenwart wirkender Reiz oder eine Triebreduktion rückwärts wirkende Konsequenzen im Nervensystem entwickeln sollte, durch ein unendlich komplexes nervöses Leitungsnetz hindurch"'). Versuche, die Verstärkungstheorie des Lernens praktischen Zwecken zugänglich zu machen, etwa für den alltäglichen Schulbetrieb, sind nicht bekannt geworden. Die Vielzahl kontrollierender Experimente zu HULLS Theorie beziehen sich auf die Testung der von ihm eingeführten neuen Parameter. Da diese im Laufe der Theorieentwicklung durch HULL umdefiniert wurden (1943 zu 1951)**), konnten besonders die komplexeren Systemelemente nicht pragmatischen Aufgaben zugeordnet werden. Die deutlichste Kritik erhebt sich gegen dieses Vorgehen und der Zweifel an der Nützlichkeit der strikten Formalisierbarkeit. So fordert M. H. MARX mehr eindringende psychologische Entdeckungen als verfeinerte mathematische Formulierung***).

*) OSGOOD, S. E.: a. a. O., S. 380.

**) HULL, C. L.: Principles of Behavior (1943)

und Essentials of Behavior (1951). ***) MARX, M. H.: The Analysis of gross functions, J. Gen. PsyA. 92, 119 (1958).

11. Lernen von gefordertem und ausgegebenem Verhalten B. F. S K I N N E R * ) gilt als Schöpfer einer eigenständigen Lerntheorie, die es ermöglicht, insbesondere auch „verbales Verhalten" und Lernen in seinen Gesetzmäßigkeiten zu erfassen. Ausgehend von der einfachsten Verhaltenseinheit definiert er einen Reflex als die beobachtete Verknüpfung von zwei Ereignissen, von Stimulus und Response**). Unter diesem Gesichtspunkt gewinnen Anfangs- und Endformen jedes Verhaltens, nämlich Stimulus und Response, ihre besondere Bedeutung. Sie allein sind am intakten (nicht chirurgisch oder anderweitig veränderten) Organismus beobachtbar. Deshalb ist auch der Reflex als Ausgangsmodell von S K I N N E R S speziellem behavioristischen Ansatz so bedeutsam, da er per definitionem die Notwendigkeit einer Beziehung zwischen Stimulus und Response enthält. Im Gegensatz zu mehr physiologisch orientierten Betrachtungsweisen will er jedoch den Reflex genauer unter dem Aspekt der Verhaltensbeschreibung beleuchten. Dabei umfaßt der Ausdruck Verhalten prinzipiell die gesamte Aktivität des Organismus; jedoch wendet sich S K I N N E R zunächst lediglich der Bewegungsaktivität zu. Er interessiert sich für jede interne Änderung, die einen beobachtbaren hinreichend eindeutigen Einfluß auf die Bewegung des Organismus hat. Die Hypothese jedoch, daß das Verhalten eines Organismus allein die Funktion der Einflüsse sei, die auf den Organismus wirken, ist zu generell; ihr entsprechen zudem keine direkten Beobachtungen. Deshalb wird es wichtig, Korrelationen zwischen Gesamtverhalten und Gesamt-Reizkonfiguration aufzufinden. Gleich bedeutsam aber sind die Korrelationen zwischen Teil-Stimuli und einzelnen Verhaltenseinheiten, Responses. Um Reflexe möglichst rein beobachten zu können und um insbesondere die reflexologischen Auswirkungen be* ) BURRHUS FREDERIC SKINNER

w u r d e 1904 in S u s q u e h a n a ( P e n n s y l v a n i a ) geboren.

Während seines Studiums an einer Reihe von amerikanischen Universitäten erwarb er mehrere akademische Grade. 1948 wurde er als Professor für Psychologie an die Harvard-University berufen. Seine bekanntesten Werke sind „The Behavior of Organism" und „Science and Human Behavior". **) Stimulus und Response werden gewöhnlich als Reiz und Reaktion übersetzt; Stimulus ist aber genereller als Reiz (sowohl das einfache Tageslicht als auch etwa der Inhalt eines Buches kann in SKINNERS Theorie als Stimulus gelten) und Response bezeichnet nicht allein Antwortverhalten, sondern audi jede ausgegebene (emitted) Verhaltenseinheit. Daher sollen bei der Diskussion der Forschungen von SKINNER die Begriffe Stimulus und Response als Originaltermini beibehalten werden.

Lernen von gefordertem Verhalten

93

stimmter Variationen von Auslösungsstimuli beobachten zu können, mußten diese Reflexe isoliert werden. Dies ist die insbesondere von M A R S H A L L H A L L ausgebaute Methode der Reflex-Physiologie. Der Zweck dieses Vorgehens ist üblicherweise die Untersuchung einer bestimmten Verhaltenseinheit in Beziehung zu einer kontrollierten Variablen, die von anderen Variablen unabhängig, jedoch auf eben die zu untersuchenden Verhaltenseinheiten bezogen ist. Dazu müßten die Variablen, über die keine Beobachtungen angestellt werden sollen, konstant gehalten werden. Diese Methode hat gegenüber dem üblichen experimentellen Vorgehen der Reflexphysiologie den Vorteil, daß die Bedingungen der Isolierung von Variablen der zu untersuchenden Beziehung zwischen Stimulus und Response ebenfalls beobachtbar bleiben und keinen weitgehenden Eingriff in den Organismus fordern, der seinerseits zusätzliche unbeobachtbare Variablen mit ins Spiel bringen könnte. Die Erforschung des Reflexes führte zu der Formulierung zweier Arten von Gesetzen. Das erste beschreibt Korrelationen von Stimuli und Responses. Obwohl in recht spezifischen Begriffen formuliert, ist es aber von so großer Allgemeinheit, daß es durch andere Gesetze ergänzt werden muß, die die exakten Bedingungen der Korrelationen beschreiben. Zweitens gibt es Gesetze, die Veränderungen dieser Beziehungen als Funktionen dritter Variablen beschreiben; dabei sind diese dritten Variablen in jedem Falle Bedingungen des Experiments. Diese sekundären Gesetze können je nach der experimentellen dritten Variablen in Gruppen zusammengefaßt werden. Der Einfachheit halber können wir sagen, daß sie Veränderungen in der Reflexstärke beschreiben. Im Verhalten intakter Organismen unterstreicht die augenscheinliche Variabilität spezifischer Stimulus-Response-(S-R-)Beziehungen die Bedeutung dieser Gesetze der zweiten Art. Soweit sich die theoretischen Modelle von „Konditionierung", „Emotion" und „Trieb" auf das Verhalten beziehen, werden sie in dieser Auffassung im wesentlichen als Veränderungen in der Reflex-Stärke angesehen. Die quantitative Untersuchung dieser Variablen dürfte zur Aufdeckung von Gesetzen führen, die den Verlauf solcher Veränderungen beschreiben, also zu Gesetzen der zweiten Art. S K I N N E R meint, daß es schwierig werden dürfte, Verhaltensweisen von Organismen zu finden, die nicht durch Gesetze der ersten oder der zweiten Art beschrieben werden können. Zumindest unter dem Gesichtspunkt der wissenschaftlichen Methode sei damit durch das Prinzip des Reflexes eine hinreichende Beschreibung des Verhaltens gesichert. D a es S K I N N E R vor allem um die wissenschaftlich exakte Beschreibung des Verhaltens geht, wird sein theoretisches System als deskriptiver Behaviorismus bezeichnet. Er beschreibt Lernen im wesentlichen nach

94

Lernen v o n gefordertem Verhalten

dem Prinzip der Konditionierung. Damit steht seine Auffassung grundsätzlich den Theorien von G U T H R I E und H U L L nahe. Von diesen Forschern weicht seine Konzeption jedoch insofern ab, als er ausdrücklich die Annahme zurückweist, daß das gesamte Verhalten ausgehe von Reaktionen, in denen Anforderungen aus der Umwelt beantwortet werden und in denen das Verhalten in Richtung auf optimale Anpassung des Organismus an die Umweltbedingungen umgeformt ist. SKINNER unterscheidet von diesen umgebungsgeformten „Responses" eine andere Gruppe von Verhaltensweisen, die „Operants". Dem reaktiven stellt er also ausdrücklich ein operatives Verhalten gegenüber. Als „Respondent" bezeichnet SKINNER jede Verhaltenseinheit, die aus dem Organismus „herausgelockt" (elicited) wird. „Herausgelockt" oder vielleicht besser „gefordert" meint dabei, daß der Zusammenhang zwischen dem auslösenden Stimulus und der darauf folgenden Verhaltenseinheit für den außenstehenden Beobachter unmittelbar erkennbar ist (z. B. Kniesehnenreflex). Das „Respondent", das geforderte, reaktive Verhalten, ist also an den Stimulus gebunden. Die strenge S-R-Beziehung gilt nach dieser Definition ausschließlich für respondentes Verhalten, für geforderte Verhaltenseinheiten. Sie ist nach SKINNER für die Erklärung spezifisch menschlichen Lernens nur wenig zweckmäßig, da menschliches Verhalten vorwiegend als operativ zu charakterisieren ist. Beim „operativen" Verhalten werden die Verhaltenseinheiten (responses) aus dem Organismus „herausgeschickt" (emitted). „Herausgeschickt" oder besser „ausgegeben" heißt hier, daß aus einer Anzahl von Stimuli eine Auswahl getroffen worden ist. Welcher Stimulus den Organismus zu einem Response veranlaßt, ist für den außenstehenden Beobachter meist nicht unmittelbar erkennbar. Das operative Verhalten orientiert sich mehr am Erfolg des Verhaltens als am jeweils „verwendeten" Stimulus. In grober Vereinfachung können die beiden von SKINNER unterschiedenen Arten des Verhaltens auch als „unwillkürlich" und „willkürlich" gedeutet werden. Der englische wissenschaftliche Terminus „response" bedeutet keineswegs nur reaktives Verhalten oder nur Antwortverhalten, deshalb wird im vorliegenden Kapitel auf das Wort Reaktion verzichtet. SKINNER

kennt also zwei Arten von Verhaltenseinheiten:

a) Respondents; das sind hervorgelockte, reaktive Responses oder geforderte Verhaltensteile, die fest mit dem Stimulus verknüpft sind, und b) Operants; das sind herausgeschickte, oder besser ausgegebene Responses oder operative Verhaltenseinheiten, die nicht von einem Stimulus ausgelöst werden. Diese ausgegebenen Operants sind mit dem Erfolg des Verhaltens verbunden.

Lernen v o n g e f o r d e r t e m V e r h a l t e n

95

Ein Operant kann und wird häufig auch mit einem früher respondent wirksamen Stimulus gekoppelt. In diesem Falle wird er zu einem „discriminated operant", also zu einer Verhaltenseinheit, die ausgewählt wird aus einem Repertoire jener Verhaltenseinheiten, die ausgegeben werden könnten. Der Stimulus wird damit zum Anlaß für das Auswählen und Ausgeben dieses Operant. SKINNER führt hierzu einen neuen T y p R ein, der die Verbindung eines Stimulus mit dem Operant-Verhalten darstellt und auf die Korrelation mit der Verstärkung hinweisen soll (R = response reinforcement). Nach SKINNER handelt es sich um ein Operant und nicht um ein Respondent, um eine geforderte Verhaltenseinheit, wie das für den Fall eines natürlichen, unerlernten Reflexes gegeben wäre. Der Unterschied zwischen den beiden von SKINNER begrifflich sorgsam getrennten Arten des Verhaltens liegt vor allem also in der verschiedenartigen Kopplung von Stimulus und Response begründet. Gewiß stellt SKINNER in Rechnung, daß auch die vom Organismus ausgegebenen Verhaltenseinheiten, die „willkürlich" produzierten Reaktionen oder „Operants", irgendwelche Stimuli voraussetzen. Doch konzentriert er sidi weniger auf diese Stimuli als auf die Untersuchung zweier anderer Funktionen, entsprechend dem Vorbild C. L. HULLS auf die Funktion der Wiederverstärkung, die stets zu beobachten ist, wenn eine Verhaltenseinheit zur Bedürfnisreduktion führt und dadurch gelernt wird, und zweitens auf die Unterscheidungsfunktion, die sogenannte „discrimination". Diskrimination wird wirksam, wenn bestimmte Stimuli selektiv mit reaktionsverstärkenden Ereignissen gekoppelt worden sind. Dadurch bestimmen sie schließlich die für die Anwendung der gelernten Verhaltenseinheiten jeweils „geeigneten" Situationen. Dieser zweite Prozeß muß deutlich von der klassischen Beschreibung des bedingten Reflexes durch PAWLOW abgehoben werden. Ein Problem, das SKINNER mit besonderem Nachdruck verfolgt hat, ist das der „Programmierung" von Verhaltensweisen. Hier handelt es sich um das Sich-Herausbilden von Verlaufsformen und Zeitplänen, nach denen sich Verhaltenseinheiten zu komplexen Verhaltensweisen verfestigen. Herkömmlicherweise wurde bei Lernexperimenten so verfahren, daß jedesmal „belohnt" wurde, wenn der Organismus „richtig" reagiert hatte. Neben dieses experimentelle Muster tritt heute die Ergänzung „intermittierender" oder „partieller Reaktionsverstärkung". In dieser Form des Experiments wird das lernende Lebewesen*) nicht für jede, sondern beispielsweise nur noch für jede dritte oder achte richtige Antwort belohnt. SKINNER war nicht der einzige Forscher, der in dieser Weise experimentiert hat, doch ging er am systematischsten * ) Zuerst Katzen und Ratten, später Tauben und Affen, heute vorwiegend Kinder und Patienten.

96

Lernen von gefordertem Verhalten

vor. Er berücksichtigte eine Fülle v o n Details, um zu zeigen, wie die verschiedenen Arten von „ P r o g r a m m e n " das Verhalten v e r ä n d e r n . Als Beispiel sei die folgende Versuchsanordnung skizziert: U m die Ausgabe (Emission) von Responses unabhängig v o n äußeren StimulusKonstellationen zu p r ü f e n , entwarf S K I N N E R einen nach ihm b e n a n n ten Kasten, der v e r d u n k e l t werden k a n n u n d nahezu schalldicht ist. I n diesem Kasten befindet sich eine H e b e l a r m a t u r , die auf Herunterdrücken durch das Versuchstier Futter ausliefert. Das Tier w i r d nach einem bestimmten D i ä t p l a n gefüttert u n d getränkt, ohne d a ß es die Box verlassen kann. In der graphischen Darstellung k a n n jeder Hebeldruck auf die Zeitachse notiert werden. W e n n nun die Futterspende überwiegend oder dauernd ausbleibt, ergibt sich eine Auslöschkurve. In dieser S K I N N E R - B O X können aber nicht nur Extinktionsraten beobachtet werden, die Versuchsanordnung dient auch der Untersuchung v o n periodischer Rekonditionierung, von Verstärkung gemäß einem vorher fixierten Verhältnis v o n Belohnung u n d Nichtbelohnung sowie von Diskriminationslernen. S K I N N E R u n d seine Mitarbeiter haben einen ganzen K a t a l o g von verschiedenen derartigen „schedules" (sprich skedjuls), v o n verschiedenen Verstärkungsabfolgen oder Belohnungsprogrammen entwickelt. Wichtig sind hierbei die v o n S K I N N E R in H a r v a r d entwickelten progressiven Verhaltensprogramme, bei denen das erste Verhalten eine Situationsä n d e r u n g bewirkt, die als Stimulus f ü r das n u n folgende Verhalten dient, u n d dies weiter zu beliebigen Verhaltenssequenzen. D e r Begriff „periodische Rekonditionierung" bezieht sich dabei auf ein experimentelles Arrangement, bei dem Futter nach einer genau geplanten Zeittafel angeboten w i r d (alle 3, 6 oder 9 Minuten), ohne Rücksicht auf die jeweilige Hebelbetätigung durch das Versuchstier. Bei dieser Untersuchungsbedingung w i r d ein uniformes Verhalten der Tiere p r o d u z i e r t ; T a u b e n z. B. neigen bei diesem V e r f a h r e n zu stereotypen Ritualisierungen ihres Verhaltens. Eine andere Versuchsanordnung bezieht sich auf die Verstärkung nach fixiertem Verhältnis. Jede f ü n f t e oder zehnte Hebelreaktion des Versuchstieres w i r d in diesem Fall mit Futterlieferung belohnt. Bei allmählicher Steigerung der Verstärkungsrate wächst dagegen die Zahl der Instrumentenbetätigungen viel rascher. Ist einmal dieser Z u s t a n d hergestellt, so w i r d die Z a h l des Responses u m so höher, je geringer die Z a h l der Verstärkungen ist. Eine Versuchsanordnung z u r K l ä r u n g der Diskrimination sieht beispielsweise folgendermaßen aus: Futter gibt es nur, w e n n beim H e b e l druck ein zusätzlicher Reiz, z. B. Licht, präsent ist. Diskrimination gilt n u r d a n n als erreicht, w e n n das Tier auch bei Aufleuchten des Lichtes reagiert. Z u r Untersuchung des Erlernens von Differenzierung dient schließlich folgendes A r r a n g e m e n t : Die Hebeltätigkeit m u ß gegen einen experi-

Lernen von gefordertem Verhalten

97

mentell veränderlichen und festgelegten Widerstand erfolgen. Das Tier lernt sein Antwortverhalten in genau festgelegten Grenzen vollziehen. Die durch eine einzige Verstärkung geschaffene Reflexreserve (S. 101) ist außerordentlich groß. Wird nach der ersten Verstärkung durch die Belohnung des ausgegebenen Verhaltenteils kein weiteres Futter mehr verabreicht, bemüht sich die Ratte dennoch bis zu 50mal trotz ausbleibender Belohnung, weitere Nahrung zu erlangen. Wird dagegen vorher etwa 250mal hintereinander jeder Response belohnt, also verstärkt*), so drückt die Ratte den futterspendenden Hebel bei Ausbleiben des Erfolgs nur noch etwa 20mal und stellt ihre Bemühungen dann ein. Bleibt das Versuchstier in der S K I N N E R - B O X für sich, so hängt es von ihm selbst ab, wie oft es den Hebelmechanismus bedient. Das Zahlenverhältnis der ausgegebenen Verhaltenseinheiten zu den verstärkten Responses bezeichnet also das Extinktionsverhältnis. Dieses Resultat drückt S K I N N E R im Quotienten der sogenannten „Extinktionsrate" aus. In der zweiten (veränderten) Versuchsreihe wird das belohnende Futter nach einer festgesetzten Zahl von Responses ausgegeben. Diese Anordnung bezeichnet S K I N N E R als „fixed ratio". Innerhalb einer Stunde wurden (bei konstantem Verhältnis von Responses zu Verstärkungen) folgende Gesamtzahlen von Responses festgestellt: Verhältnis 48 Responses 96 Responses 192 Responses

: 1 Verstärkung : 1 Verstärkung : 1 Verstärkung

Gesamtzahl von Responses 620 768 960

Wiederum zeigt sidi, daß bei der geringsten Häufigkeit der Verstärkungen die „Reflexstärke", die Bereitschaft zur Ausgabe von Responses, am größten ist. Mit diesen Verhältniszahlen sdiuf sich S K I N N E R eine Möglichkeit, die operante Konditionierung meßbar zu machen. Wir können aus diesen Ergebnissen folgern, daß die Aktivität trotz vieler „Enttäuschungen" bei nur gelegentlicher Befriedigung am stärksten wachgehalten wird. Dasselbe gilt umgekehrt auch für Strafen; S K I N N E R stellt fest, daß die Responsebereitschaft durch Bestrafung nicht verringert wird (wenn z. B. die Ratte bei jedem Hebeldruck einen elektrischen Schlag erhält). Die temporäre Hemmung, den Hebelmechanismus zu bedienen, benutzten S K I N N E R und E S T E S als Maßstab für die Intensität der Furcht des Versuchstieres. Diese Ansicht wird durch die Untersuchung von E S T E S bestätigt, der ermittelte, daß Strafe zu einer Verringerung der Gesamtzahl von Reaktionen während des Auslöschungsvorganges führt, obwohl die Strafe * ) Dieses Training w i r d an mehreren Tagen durchgeführt, damit nicht eine Übersättigung des Versuchstieres eintritt. 7 Haseloff-Jorswiv'dc, Psychologie

Lernen von gefordertem Verhalten

98

bei jeder (falschen) Reaktion eintritt. Nach ergänzenden Versuchen derselben Serien konnte ESTES sogar beobachten, daß die bestrafte Verhaltenseinheit am selben Tage z w a r sehr schnell abzunehmen schien, daß dafür aber an einem der nächsten T a g e eine Zunahme der ständig bestraften Verhaltenseinheiten erfolgte. 100-,

50

A B C Auslöschung am Tag der Bestrafung A = nicht bestraft;

A B C Auslöschung nach der Anpassung

B=periodisch bestn; C=regelmäßig bestr

I n diesem Experiment wurden drei Kontrollgruppen miteinander verglichen. J e d e Gruppe umfaßte sechs Ratten. (Die Berücksichtigung der statistischen Regeln, nach denen die Bestätigung oder Verwerfung von Hypothesen zu erfolgen hat, wäre bei derartigen Untersuchungen wünschenswert.) Säule A der graphischen Darstellung zeigt die natürliche Auslöschung eines Responses, der nicht beeinflußt wurde. Säule B zeigt demgegenüber die Verhaltensweise derjenigen Rattengruppe, deren Responses periodisch mit Minutenabstand durch elektrischen Schlag bestraft wurden. Säule C zeigt den Auslöschungsgrad bei einer Rattengruppe, bei der jeder Response bestraft wurde. Diesem Versuch folgten zwei Anpassungstage, an denen sich die R a t ten in den gleichen Käfigen aufhielten, die Hebel waren jedoch zurückgezogen. Infolge der Anpassung nahmen die Responses der Gruppe B beschleunigt ab. Die Gruppe C antwortete mit erhöhter Responsebereitschaft, die sich auch durch ständige Bestrafung nicht eindämmen ließ. Es zeigt sich also, daß ständige Belohnung oder Bestrafung für das instrumentelle Lernen ungünstig sind. SKINNERS Experimente erbrachten vor allem folgende Ergebnisse:

Lernen v o n gefordertem Verhalten

99

a) Verhaltenseinheiten, die erfolglos bleiben, vermindern die Reflexreserve, die sich unter positiver Stimulation gebildet hatte*). Das ist das Prinzip der induktiven Auslöschung. b) Verhaltenseinheiten, die auf positive Stimulation hin gebildet wurden, sind auch in Gegenwart negativer Stimuli verfügbar und anwendbar. SKINNER bezeichnet diesen Sachverhalt als induktive Konditionierung oder Generalisation. c) Die Häufigkeit, mit der die auf positive Stimulierung gebildeten Verhaltenseinheiten abgegeben werden, wird durch auslesende Verstärkung und durch Auslöschung erhöht. Andererseits können erfolgreiche Verhaltenseinheiten abgeschwächt werden, wenn der Erfolg ausbleibt. Dies ist SKINNERS Gesetz der Unterscheidung (discrimination). Die lerntheoretische Konzeption SKINNERS tritt in seiner Auffassung von der Konditionierung operativen Verhaltens klar zutage. Er beschreibt sie mit Hilfe zweier Grundprinzipien: a) Operants (operante Verhaltenseinheiten) sind dem verstärkenden Stimulus zwar nicht ähnlich; jedoch wird ihr Auftreten vom verstärkenden Stimulus erzwungen. Verschwindet der Stimulus, so unterliegt das Operant der Auslöschung (extinction). b) Bei der Konditionierung von Operants kann die Verstärkung erst erfolgen, wenn die betreffenden Verhaltenseinheiten vom Organismus ausgegeben (emitted) worden sind. Bei dem Versuch, die operante Konditionierung möglichst eng an den instrumentellen Response zu binden, kam SKINNER zur Methode der Approximation. Da bei diesem Verfahren die Belohnung (Futter) nahezu im gleichen Augenblick gespendet wird, in dem das Tier mit dem intendierten Verhalten einsetzt (in der Terminologie SKINNERS: die Verhaltenseinheit ausgibt), wird es möglich, das Versuchstier so zu trainieren, daß sein Verhalten genau dem Plan des Versuchsleiters entspricht. Um dies zu demonstrieren, führte SKINNER folgenden Versuch im Hörsaal durch: Eine einjährige Taube, auf 80 % ihres Durchschnittsgewichts reduziert, hatte im Vorversuch gelernt, auf ein Klingelzeichen zu einer in ihrem Käfig schwingenden Futterschale zu kommen. (Vor dem Demonstrationsversuch bekommt sie 24 Stunden kein Futter.) An dem Käfig ist eine weiße Karte mit einem schwarzen Fleck in der Mitte angebracht; die Taube befindet sich außerhalb des Käfigs. Sie soll lernen, den schwarzen Fleck auf der Karte zu hacken. Schaut der Vogel zufällig zur Karte hin, wird er, wie vorher trainiert, gefüttert. Nach 4- bis 5maligem Hacken wird das Futter weggenommen. Das *) SKINNER unterscheidet positive Stimuli, auf die ein operatives Verhalten erfolgreich war, und negative Stimuli, bei denen der Erfolg ausblieb. 7"

100

Lernen v o n gefordertem Verhalten

Tier tendiert nun dazu, nach Wegnahme des Futters an den Platz zurückzukehren, auf dem es sich vor dem Klingelzeichen befand. Nun wiederholen sich diese Maßnahmen bei jedem Schritt, den das Tier in Richtung auf die Karte unternimmt. (Daß die Taube immer wieder auf den alten Platz zurückkehrt, bedeutet keine Störung.) Das Versuchstier nähert sich allmählich der Karte, hackt auch zunächst auf diese ungezielt ein, bis es durch weitere Wiederholung der Prozedur dazu gebracht ist, auf den schwarzen Fleck zu hacken. Der gesamte Lernvorgang nimmt nur drei bis fünf Minuten in Anspruch. Allein dadurch, daß man dieser hungrigen Taube im richtigen Augenblick Futter bietet, ist es möglich, in kürzester Zeit drei oder vier genau umrissene Verhaltenseinheiten herauszubilden (shape)*). Durch das als Formungsprozeß (shaping process) bezeichnete Konditionierungstraining können in einander folgenden Teilschritten auch extrem komplexe Verhaltensabfolgen erzeugt werden. SKINNER betont: „Diese neue Methode, das Verhalten zu formen und in seiner Stärke zu bewahren, ist ein großer Fortschritt gegenüber den althergebrachten Tediniken der Berufsdompteure, und es überrascht nicht, daß unsere Laboratoriumsergebnisse bereits zur kommerziellen Abrichtung von Tieren angewandt werden. In wissenschaftlichem Zusammenhang werden sie weiterhin zu Demonstrationszwecken benutzt, die sich weit über das Interesse am Lernen erheben. Es ist beispielsweise nicht sehr schwer, jene komplexen Bindungen herzustellen, unter denen verschiedene Formen des Sozialverhaltens auftreten**)." So können Tauben z. B. lernen, miteinander Ball zu spielen, eine Tatsache, die nicht recht zu den in Deutschland oft noch starr vertretenen Instinkttheorien passen will. SKINNERS Gesetz der Konditionierung läßt sich mit THORNDIKES EfFektgesetz vergleichen. Erfährt ein Operant eine Verstärkung, so wächst die Wahrscheinlichkeit seines Auftretens in ähnlichen Situationen. THORNDIKES Gesetz unterscheidet sich jedoch insofern, als nach SKINNERS Auffassung nicht die S-R-Verbindung, sondern der Stimulus verstärkt wird. Für die operante Konditionierung ist es also notwendig, daß die Anzahl der Operants (genauer: Die Häufigkeit ihres Auftretens) in einer stimulierenden Situation zunimmt. Dadurch wird eine wachsende Anzahl neuer, dieser Situation zugehöriger Stimuli mit der operativen Verhaltenseinheit assoziiert. J e größer die Zahl der Responses auf eine so komplexe stimulierende Situation * ) SKINNER, B. F.: Some Contributions of an Experimental Analysis of Behavior, The Amer. Psydiol. 8, 69 (1953). * * ) z . B . : eine Drehung um sich selbst, einen Doppelkreis in Form einer 8 laufen, in eine Ecke laufen und dort stillstehen, Redien des Halses oder Klopfen mit dem Fuß; in B. F. SKINNER: „The Science of Learning and the Art of Teadiing", Harvard Educationel Review 24, 86—97 (1954).

Lernen von gefordertem Verhalten

101

ist, um so erfolgreicher wird das operative Verhalten, und um so mehr wird daher der Response auf diese Situation verstärkt. Die Verstärkung von Operants erfolgt also entweder dadurch, daß neue Stimuli in der Situation auftreten oder daß neue Responses zu der Situation gebildet werden. Die Anzahl der auf eine stimulierende Situation folgenden Responses benutzt S K I N N E R als Maß für unterschiedliche Reflexstärke. Die Vergrößerung der Reflexstärke ist jedodi nur ein Merkmal der Veränderung, die durch Verstärkung erzeugt wird. Vor allem handelt es sich hier nämlich um ein Anwachsen der Reflexreserve. Unter „Reflexreserve" versteht S K I N N E R die Gesamtzahl der Responses, die ein Organismus gegenüber einer Stimulussituation gebildet hat. Je größer die Reflexreserve ist, um so mehr Möglichkeiten hat der Organismus, auf eine Situation zu reagieren. Zwischen Reflexstärke und Reflexreserve besteht eine proportionale Beziehung. Wird die Reflexstärke vergrößert, so vergrößert sich auch die Reflexreserve. Die Reflexstärke — und damit audi die Reflexreserve — kann durch Förderung und Hemmung, aber auch durch Emotionen und Triebe verändert werden. Nach S K I N N E R vollzieht sich Lernen als eine Vergrößerung der Reflexreserve. Sie kann einerseits durch Übung in einer Situation und andererseits durch erfolgreiches Verhalten anwachsen. Die Größe der Reflexreserve ist jedoch keine einfache Funktion der Verstärkung. Es gibt spezifische Vorgänge, durch die größere Reflexreserven aufgebaut werden. Ein aus der Theorie und den Tierexperimenten hervorgegangenes Verfahren von S K I N N E R ist der sog. „verbale Summator". Um einerseits „stimulusfreie" Responses und zum anderen Summationswirkungen von gleichbleibenden Stimulusfolgen bei der Sprachentwicklung zu erfassen, bedient er sich folgender Reihe von Vokallauten: „ee, ay, ai, ä, oh" und als neutralen Vokal „uh"; dieser wird als einziger nicht akzentuiert wiedergegeben. Die Vokalserie wird jeweils in bestimmter Kombination angeboten. Die Versuchsperson hat das, was sie hört und als sinnvoll auffaßt, sofort zu sagen; dies wiederholt sich mehrmals und z. T. wächst das Sinnverständnis tatsächlich*). Dabei versteht S K I N N E R „Verbalverhalten" als eine Untereinheit menschlichen Verhaltens überhaupt, die von Variablen außerhalb des Organismus ausgelöst wird**). Die Einheit der wirkenden Variablen ist der Verbaloperant, der nicht mit dem Wort oder dem Satz zu * ) SAUL ROSENBERG benutzte dieses „ T a u t o p h o n " als projektives Verfahren und schuf eine dem RoHRSCHACH-Versudi ähnliche Auswertung; vgl. audi SKINNER „The Verbal Summator and a Method for the Study of latent Spcech", Journ. of Psych. 2, 76 (1936). *'')

SKINNER, B . F . : „ V e r b a l B e h a v i o r " , S. 3, N . Y . ( 1 9 5 7 ) .

102

Lernen von gefordertem Verhalten

identifizieren ist, sondern von einzelnen Phonemen bis zu ganzen Satzgebilden reicht. Er unterscheidet unterschiedliche Operants wie „mand" (Response unter der Kontrolle depravierender oder aversiver Stimuli), „tact, echoic, textual oder intraverbal" (a. a. O., S. 81—82). Es handelt sich dabei jeweils um wechselnde Kontrollstimuli, die eine syntaktische Einheit evozieren oder verstärken. Die Haupteinwände gegen SKINNERS operative Konditionierungstheorie richten sich vorwiegend gegen die Annahmen: 1. Responses sind nicht undeterminiert; die Annahme, daß sie nach reiner Zufälligkeit auftreten, ist eigentlich nicht erlaubt. Vielmehr ist zu erwarten, daß auch emittiertes Verhalten aus einem auch durch Erfahrung bestimmten Verhaltenspotential stammt. 2. Die Zuordnung von durch den Experimentator oder Lehrer gesetzten Reiz mit dem emittierten Verhalten braucht nicht notwendig einzutreten; vielmehr kann der „lernwichtige" Reiz gerade ein dem Experimentator unbekannter oder unbemerkter sein. 3. Es gelingt nicht, eindeutig nachzuweisen, daß die richtige, gewünschte Reaktion (Response) tatsächlich durch die nachfolgenden experimentellen Vorkehrungen verstärkt oder in der Zuordnung gefestigt ist.

12. Lernen und kognitives Verhalten TOLMANS*) Theorie bemüht sich um eine produktive Bearbeitung gestaltpsychologischer Hypothesen mit behavioristischen Methoden. Seine konstruktiven Begriffe übernimmt er aus beiden Schulen. Da TOLMAN überzeugt ist, daß das Verhalten von einer Vielzahl von Variablen bestimmt ist, berücksichtigt seine Theorie die Konzepte von „Motivation", „Persönlichkeit" und „Lernen" sowie Hypothesen zur Struktur der perzeptiven und kognitiven Prozesse. Im Mittelpunkt seiner Theorie steht nicht der weitgehend spekulative, durdi erkenntnistheoretische Vorentscheidungen bestimmte Gestaltbegriff, sondern vielmehr der exakt abgegrenzte Begriff der Zeichengestalt (sign-Gestalt). TOLMANS Theorie ist durch drei fundamentale Eigenarten gekennzeichnet, die vorwiegend seiner behavioristischen Schulung entstammen: a) Sein System verwirft als „behavioristische Konzeption" den für die Gestaltpsychologie zentralen Erkenntnisweg der Selbstbeobachtung. Wenn TOLMAN Aussagen über Bewußtseinstatsadien oder Leistungskonzeptionen macht, spricht er stets von Interpretationen beobachteter Verhaltensweisen. Diese methodische Haltung zwingt ihn, den Begriff der „intervenierenden Variablen"**) einzuführen. Korrekt bezeichnet er damit die nicht sichtbaren Tatbestände, die innerhalb der Persönlichkeit wirksam sind und die zwischen der Wahrnehmung der äußeren Umstände und der jeweils beobachteten zielgerichteten Reaktion vermitteln. Die zwischen die einzelnen Verhaltensweisen eines Menschen erklärend einzuschaltenden intervenierenden Variablen identifiziert TOLMAN beispielsweise als quantitativ und qualitativ differenzierte Gefühlszustände. Als die wichtigsten intervenierenden Variablen aber erscheinen — in gleicher Weise wie bei anderen modernen Lerntheoretikern — einzelne Motivationen und Bedürfnissysteme (believe value matrix). Zur Vervollständigung der Theoriebildung über intervenierende Variable stellt MARX dem ortho* ) EDWARD C H . TOLMAN, 1 8 8 6 — 1 9 5 9 .

**) Intervenierende Variable beziehen sich dabei nur scheinbar auf Gegenstände des subjektiven Erlebens, wie Zielerwartung, Vorstellung u. a. Tatsächlich verwendet TOLMAN diese Begriffe nicht als verabsolutierte direkte Bewußtseinsinhalte, sondern als verbale Zeichen, die operational definiert sind. Es handelt sich also um hypothetische, zu Erklärungszwecken eingeführte Denkmittel, die nicht auf das „Wesen" einer Sache abzielen, sondern nur insofern bedeutungsvoll sind, als sie sich in ihren Auswirkungen empirisch bestätigen lassen.

104

Lernen und kognitives Verhalten

doxen Begriff einen neueren E/C-Typ der intervenierenden Variablen gegenüber, wobei experimentelle (E) mit kontrollierenden (C) Bedingungen verglichen werden*). b) TOLMANS System ist ein molarer Bebaviorismus: Obgleich TOLMAN die Bedeutung physikalischer und physiologischer Tatsachen für den Aufbau des Verhaltens nicht leugnet, bekennt er sich doch zur Konzeption eines molaren Behaviorismus. Der Begriff „molar" bezieht sich auf übergeordnete Verhaltensweisen (z. B. findet ein Tier seinen Weg zum Futter), während der „molekulare" Betrachtung auf kleinste Verhaltenseinheiten rekurriert, wie sie einzelne Reaktionselemente, „Verhaltensteile'', Muskelkontraktionen oder Einzelempfehlungen darstellen. Ergänzend ist hier anzumerken, daß mit dem jeweiligen Organisationsniveau oder mit der komplexen Variation des Kontextes des infrage stehenden Geschehens auch der Aspekt „molekular-molar" wandelbar ist. Mit dem Begriff „molar" ordnet sich TOLMAN in die Gruppe derjenigen Psychologen ein, die komplexe Situations- und Handlungseinheiten zum Gegenstand ihrer Forschung machen. Dabei bezieht sich seine der Gestaltstheorie verwandte Konzeption jedoch nicht primär auf Vorgänge vom Charakter der Wahrnehmung, sondern auf die Erklärung aktiven und zielgerichteten Verhaltens. c) Sein System ist also auf die Erklärung zielorientierten Handelns gerichtet. Er verzichtet auf physiologische Erklärungen und geht von der Tatsache aus, daß beobachtbares Verhalten prinzipiell als ziel-, mindestens aber als zweckgerichtet gedeutet werden kann. TOLMAN untersucht „zweckmäßiges Verhalten"**), das an objektiv bestimmbaren Zielen reguliert ist. Seine Kritik richtet sich gegen den HuLLschen Dualismus der Formel Stimulus-Response. Für ihn ist das tatsächliche komplexe Handeln nicht Ergebnis einer elementaren und konstanten Wechselwirkung zwischen S und R. TOLMAN bemüht sich deshalb um den Aufbau einer Orientierungstheorie. In ihrem Mittelpunkt steht der Begriff der Erwartung, durch die zwei Reizgegebenheiten miteinander verbunden werden. Im einzelnen werden von den Vertretern der Kognitivtheorie des Verhaltens folgende grundsätzliche Einwände gegen den Behaviorismus erhoben: *) MARX, M. H . : Intervening Variable or hypothetical construct? Psydi. Rev. 58, 240 (1951). **) TOLMAN stellt alle beobachtbaren und experimentell nidit darstellbaren Variablen zusammen, die seiner Ansicht nach das Verhalten beeinflussen (etwa im Sinne der „silent organization"). Dieses sind zumeist die auf die aktuelle Umgebung bezogenen oder von ihr abhängigen Variablen: Essen, Trinken, motorische Geschicklichkeit, differenzierte Wahrnehmung der Reize u. a. m. Sodann die Variablen der individuellen Differenzen: Erbanlage, Alter, vorausgegangene Erfahrung, jeweilige endokrine Bedingungen usw.

Lernen und kognitives Verhalten

105

a) Reduktionismus: Der Versuch, ein komplexes, durch multiple Zwischenbeziehungen charakterisiertes Ganzes in Begriffen einfacher Elemente oder Teile zu erklären, bringe irrtümliche Konsequenzen mit sich. Insbesondere die Methoden der Isolierung von Details, die Ermittlung von Konstanten, mathematischen Summierungen oder die Metaphern des Ursprungs oder der Analogie könnten von den Theoretikern der Kognition nicht akzeptiert werden*). b) Der atomistisch-reduktive Fehler der S-R-Theorie, nämlich die „vorwissenschaftliche" Überzeugung, daß etwas sehr „Kleines" fundamentaler sei als etwas „Großes". c) Die genetische Fehlorientierung der Behavioristen, nämlich die Behauptung, was genetisch früher sei, ist fundamentaler für den Verhaltensaufbau, als was später geschehe""""). d) Die peripheristische „Fehlkonzeption" des Behaviorismus, daß nämlich das Periphere und die beobachtete Reaktion durch unbedeutende und zu vernachlässigende „Mittelstücke" verbunden seien***). e) Die Verstärkungshypothese, daß nämlich zum Lernen grundsätzlich die Reduktion von Bedürfnisspannungen oder Motivationsentlastungen gehöre + ). Die gelernte Reaktion variiert vielmehr mit der jeweils gegebenen Situation. Dabei unterscheidet T O L M A N zwischen der momentanen und der erst im Verlauf einer Handlung sich einstellenden Situation. Die Situation ändert sich bereits während des Ablaufes der sie beantwortenden Handlung. Mit jeder Situationsänderung werden neue unterschiedliche Reize aufgenommen. Gestützt auf zahlreiche Rattenversuche, bezieht T O L M A N eine feldtheoretische Position und sagt: „Wir glauben, daß im Verlauf des Lernens so etwas wie eine Landkarte (fieldmap) der Umgebung im Gehirn der Ratte errichtet wird." Das Versuchstier ist dabei einer Vielzahl von Reizen ausgesetzt. Das zentrale System trifft dann eine geeignete Auswahl aus dem Reizmaterial. Es wird also kein An- und Ausschalten einer festgeprägten Verbindung von Reiz und Reaktion angenommen. Impulse werden in dieser theoretischen Sicht vielmehr überarbeitet und zu einem Orientierungsplan der Umgebung (cognitive map) geformt. Dieser Plan ist dann bestimmend für die späteren Antworten des Tieres. Die nachfolgenden Reaktionen des Tieres sind stets von der Struktur dieses Orientierungsplanes anhängig, d. h. davon, ob er eng und begrenzt oder aber breit und umfassend ist. Ist der

*) SLOANE, E. S.: Reductionism. Psydi. Rev. 52, 214 (1945). "'*) M c LEOD, R. B.: The phenomenological approadi to social psydiology. Psych. Rev. 54, 193 (1947). ***) LEEPER, R. W.: A motivational theory of emotion to replace emotional disorganized response. Psydi. Rev. 55, 5 (1948). + ) ALLPORT, G. W . : Personality, N . Y. (1937).

106

Lernen und kognitives Verhalten

„kognitive Plan" breit und umfassend, hat das Verhaltenssystem mehr Auswahlmöglichkeiten und kann seine Reaktion den neuen Bedingungen besser anpassen. Bei seinen Experimenten mit Albinoratten ging TOLMAN von zwei theoretischen Positionen aus: a) Lernen beruht nicht auf der Assoziationsstiftung von Reiz-Reaktionsverbindungen, sondern besteht im Aufbau erwartungsbedingter Einstellungsmuster (sets) im Nervensystem, die wie Orientierungspläne wirken. b) Diese Pläne werden als entweder eng und begrenzt oder als breit und umfassend charakterisiert. Theorie besagt also, daß Tiere auch in einfachen Lernexperimenten nicht unmittelbar auf Reize reagieren, und nicht Reaktionsketten*) auswendig lernen, sondern daß sie, indem ihnen unterwegs Reize begegnen, Zeichen lernen, an deren Hinweischarakter sie Einsicht erwerben. Lernen erfolgt hiernach nicht „medianisch", das Tier bildet nicht Reaktionsketten aus, sondern es erwirbt eine Art „Uberschau" über die Situation. Nach Auffassung TOLMANS ist dieser Vorgang nicht vom Effektgesetz (means-and-readiness) abhängig. Tiere (und auch Menschen) zeigen vielmehr in komplexen Situationen ein spontanes exploratives Verhalten. Diese Theorie TOLMANS wurde im Laufe vielfältiger komplizierter Experimente entwickelt. Seine Experimente und deren Resultate lassen sich nach fünf Gesichtspunkten ordnen (1—5). TOLMANS

1. Experimente zum latenten Lernen Die ersten Experimente zum latenten Lernen wurden bereits 1929 von BLODGETT**) durchgeführt. Er arbeitete mit drei Rattengruppen — eine Kontroll- und zwei Experimentalgruppen — die durch ein Sechs-T-Labyrinth zu laufen hatten(Abb. 12,1). Dabei ergab sich: Die Kontrollgruppe (I) durchlief innerhalb 24 Stunden einmal die Gänge und fand am Ziel Futter. Die Fehlerkurve sank am zweiten Tag. Die Tiere der Gruppe I I wurden in den ersten sechs Tagen nicht im Labyrinth, sondern in ihren Boxen zwei Stunden vor dem Versuch gefüttert. Vom 7. Tag an fanden die Ratten dieser Gruppe am Ziel Futter: erst dann ergab sich ein deutliches Fallen der Fehler*) Die qualitativen Unterschiede von „molaren' und „molekularen' Lernvollzügen sind etwa an folgenden Beispielen verdeutlicht: Die Lippenbewegung eines Sprechers registriert der übliche Zuhörer nicht, wohl aber gewinnen sie f ü r den Taubstummen den Charakter eines „molaren" Geschehens. **) BLODGET, H . C.: „The effect of introduction of reward upon the maze performance of rats". Univ. Col. Psych. Zitat nach E. Osgood, „Methods", N . Y. (1961).

107

Lernen und kognitives Verhalten Sechs-T-Labyrinth nach B L O D G E T T

Nahrung

Start

_ r u

c Abb. 12,1

kurve. D i e Tiere der Gruppe I I I fanden das Futter nach dem dritten T a g , erst dann setzte ein Absinken der Fehlerkurve ein ( A b b . 12,2). Daraus f o l g t f ü r die Experimentiergruppen, daß sie bei nicht motivierendem Ziel scheinbar nicht lernten. Ein besonders starkes Absinken der Fehlerkurve w a r dann festzustellen, wenn ein belohnendes Ziel wirksam war. D i e Versuchstiere hatten also mehr gelernt, als sie in dem vorangegangenen Versuchsverhalten erkennen ließen (latent learning). Während des nicht motivierten Verhaltens hatten — so kann das Ergebnis gedeutet werden — die Ratten einen L a u f p l a n (eine „cognitive m a p " ) aller Gassen des Labyrinths aufgestellt, diesen Orientierungsplan jedoch erst beim motivierten H a n d e l n aktiviert. 3,5 3,0 o, 2ß •5

| 2.0 •s

1,5

N

C 7,00,5

8. ( Kontrollgruppe)

Gruppe I Gruppe I Gruppe M

—

(Futter vom 7. Tage an) (Futter vorn 3. Tage an) Abb. 12,2

9. Tag

108

Lernen und kognitives Verhalten

Die Experimente zum latenten Lernen folgen fast alle diesem Beweisprinzip, nämlich nach Einführung einer Belohnung die Verbesserungsrate der Leistung zu ermitteln. Weitere Experimente zum Problem des latenten Lernens führen dann SPENCE u n d L I P P I T T d u r c h * ) .

In einem einfachen Labyrinth in Y-Form wird am rechten Ende Wasser, am linken Ende Futter angeboten. Die Experimentatoren ließen eine Anzahl von Ratten, die weder hungrig noch durstig waren, durch dieses Labyrinth laufen. Nach annähernd 30 Versuchen, in denen die Versuchstiere keiner Bedürfnisspannung unterworfen waren, ließen die Versuchsleiter nun eine Gruppe der Ratten in hungrigem Zustand, die andere in durstigem Zustand in das Labyrinth laufen. Jede Versuchsgruppe fand sofort den Weg, der ihr die Bedürfnisbefriedigung erlaubte. Die Tiere haben also ohne motivationale Spannung einen Orientierungsplan aufgebaut, mit dessen Hilfe sie sich unter motivationalem Druck sofort situationsentsprechend verhalten konnten. Die Frage, ob die Triebreduktion zur Leistungsverbesserung führt oder für die geglückte Leistung verantwortlich ist, wird weiter unten debattiert. 2. Experimente über Versuch und Irrtum

(VTE)**)

Der Begriff V T E wurde von MÜNZINGER geprägt und bezeichnet das Zögern, Vor- und Zurücksehen bei Ratten und alle nicht vollständigen Bewegungsabläufe, bevor die Tiere an einem Entscheidungspunkt, der sich deutlich in der Bewegungskurve abzeichnet, im Labyrinth entweder den einen oder den anderen Weg wählen. TOLMAN unternahm in Anlehnung an LASHLEYS bekannte Versuchsanordnung folgendes Experiment: Eine Ratte wird auf eine Plattform gebracht, von der zwei Türen abgehen, die durch visuelle Reize, etwa Quer- oder Längsstreifung, unterschiedlich gekennzeichnet sind. Die Ratte lernt, gegen die richtige Tür zu springen, diese öffnet sich dann und gibt einen Futterplatz frei. Wählt es die falsche Tür, fällt das Tier auf eine Plattform, von der ein Weg zum Ausgangspunkt zurückführt. Die hierbei anfallenden Beobachtungen sind folgendermaßen gedeutet: Die Ratte lernt um so schneller, je leichter die Wahl ist (eindeutige, wohlunterscheidbare Alternativen: schwarz-weiß); jedoch unternimmt sie auch mehr Aktionen nach dem Prinzip von Versuch und Irrtum als gegenüber einer schwierigen Situation. Der Lerneffekt sei um so * ) SPENCE, K . \P„ & R . O . LIPPITT: An experimental Test on the sign-Gestalt theory o f trial- and error Learning. J o u r . exp. Psych. 36, 491 (1946) und C . L . HULL: Differential habituation to internal stimuli in the albinorat. J o u r . , comp. Psych. 16, 255 (1933). * * ) MÜNZINGER, K . F . : „Vicarious Trial and E r r o r at a point of choice", Journ. genet. Psych. 52, 75 ff. (1938).

Lernen und kognitives Verhalten

109

besser, je mehr VTE-Handlungen unternommen werden. Beim Menschen würde man das Gegenteil erwarten, also mehr VTEs bei schwierigerer Aufgabe. Dabei ist jedoch zu bedenken, daß die Aufgabenstellung für Ratte und Mensch verschieden ist. Bei der Ratte beginnen VTEs möglicherweise erst, wenn sie herausgefunden hat, was von ihr verlangt wird. Je größer die Differenz der Stimuli, um so mehr wird das Tier durch diese aktiviert. Dabei sollen Lernvorgänge in Form von Auswahl und Vergleich der Stimuli ausgelöst werden. Es entspricht diese Darstellung dem im deutschen Sprachgebrauch üblichen Begriff des „Problemhandelns", bei dem ausdrücklich der unvollständige Charakter der Aktion hervorgehoben wird*). 3. Experimente über Meidungsverhalten

nach Einzelstimulus

Verschiedene Versuche von BRADFORD HUDSON'"') wurden mit der Zielsetzung durchgeführt, herauszufinden, ob bereits bei einem einmaligen Versuch eine Vermeidungsreaktion gelernt werden kann. Ratten wurden hierzu auf einen Futternapf konditioniert, hinter dem ein gestreiftes Schild aufgestellt war. Das Berühren des Napfes wurde mit elektrischem Schlag gekoppelt. In der Folge lernten die Versuchstiere, das Schild zu meiden. Verschwand bei der Schockwirkung das Schild oder ging das Licht aus, konnten sie dagegen keine zur Meidung führende Assoziation bilden. T O L M A N interpretiert diese Ergebnisse dahingehend, daß der Orientierungsplan einen „aufbauenden" Charakter habe. Eine passive Aufnahme sämtlich zufällig anwesender Reize finde dabei also nicht statt. 4. Experiment zur

Hypothesenbildung

Unter Hypothese wird hier eine der Problemlösung vorauslaufende versuchsweise Lösungskonzeption verstanden. Wird eine Hypothese gebildet, so konfiguriert sich das Verhalten nicht zufällig, allein den Wahrscheinlichkeitsgesetzen folgend. Vielmehr scheint es sich in einer Sequenz systematischer Entscheidungen zu vollziehen***). TOLMAN gelangte zu dieser Auffasung, nachdem er gefunden hatte, daß Ratten bei Labyrinthversuchen die Wahl ihres Weges nicht willkürlich vornehmen, sondern diesen in einer als systematisch anmutenden Weise aufbauen. Es wird eine Verbindung zwischen der kognitiven Struktur mentaler „Netze", unanschaulichen Gedanken, Transfer beim Problemlösen und bei gewissen Generalisationsprozessen als gemeinsamer *) J. S. SZYMANSKI spricht von Probierbewegungen in „Versuche über die Wirkung der Faktoren, die als Antrieb zum Erlernen einer Handlung dienen können". Pflüger's Ardi. 171, 374 (1918). **) HUDSON, B. H.: „One trial leaming in the domestic rat". Gen. Psych. Mon. 38, 77 f. (1950). ***) D. KRECH hat diesen anscheinend systematisch getroffenen Entscheidungen den Begriff der „Hypothesen" unterlegt.

110

Lernen und kognitives Verhalten

N e n n e r a n g e n o m m e n . PIAGET, BARTLETT u n d LASHLEY

verwenden

hier den Begriff Schema, während PORTMAN und BRUNER „Hypothesen" vorziehen. TOLMAN*) hat in seinen letzten Schriften die Orientierungskarte in „kognitive Matrix" umbenannt, die ein größeres Hypothesensystem (Hypothesenformation) umfassen kann. 5. Experimente

zur räumlichen

Orientierung

Hierbei geht es darum, die Begrenztheit der im Rattenhirn sich herausbildenden Orientierungspläne festzustellen. Es wurde beispielsweise beobachtet, daß eine Gruppe von Ratten, die das Durchlaufen eines Labyrinths gelernt hatte, den Deckel über ihrem Startplatz zur Seite schob, herauskletterte, über die Holzdecken des Labyrinths lief und auf der anderen Seite wieder zum Futterplatz einstieg. Neben dieser 1929 von LASHLEY berichteten Beobachtung wurden Versuche angestellt, in denen Ratten den richtigen Weg in einem Labyrinth verschlossen fanden; sie liefen daraufhin in den dem Ziel am nächsten gelegenen Gang. In einem anderen Experiment eines Mitarbeiters**) von TOLMAN wurden durch Rotation der ursprünglichen Anordnung veränderte Durchlaufverhältnisse geschaffen, in denen die Versuchstiere wiederum bewiesen, daß der von ihnen aufgebaute Orientierungsplan auch nach solcher Veränderung eine Annäherung an das Ziel ermöglichte. Diese und andere Versuche erlaubten den Schluß, daß die Orientierungspläne allgemeinere Laufregeln beinhalten, die Drehungen des Labyrinths in der Ebene oder im Raum nicht zu beeinflussen ermöglichen. Die Invarianz gegenüber den äußeren Veränderungen ist jedoch beim Tier geringfügiger als bei komplexen Orientierungssystemen von Menschen. Zur Frage der Ubertragbarkeit der Rattenexperimente auf die Bedingungen menschlichen Verhaltens ist festzustellen, daß sich auch beim Menschen unter bestimmten Bedingungen eher eng umschriebene als variable (transfergeeignete) Orientierungspläne herausbilden; dies ist der Fall: a) bei Hirnverletzungen, b) bei einer Uberdosis von Wiederholungen gegenüber einer bestimmten Aufgabe (Overlearning) sowie c) bei äußerst motivierenden oder stark frustrierenden Bedingungen. Nadi TOLMAN resultierten viele unserer individuellen und sozialen Fehlanpassungen aus übermotiviertem oder überfrustriertem Verhalten. Regression und Fixierung, aber auch die Verschiebung der Aggression auf Fremdgruppen sind Folgen eines zu engen, schematisierenden *) TOLMAN, E. C . : A psychological model in „Toward a general theory of action" Parsons, Harvard (1951). * * ) TOLMAN, E. C„ B. F. RITCHIE & D. KALISH: „Studies in spatial learning" Jour, exp. Psydi. 36, 221 (1946).

Lernen und kognitives Verhalten

111

Orientierungsplanes, der sich infolge zu heftiger Motivationen bzw. zu intensiver Frustrationen konfigurierte*). Zusammenfassend kann gesagt werden, daß es den Bemühungen von TOLMAN oder den ähnlich gerichteten von FIELD oder NORMAN MAIER zwar nicht in einem strengeren wissenschaftlichen Sinn gelungen ist, „Hypothesenbildung", „Urteil" und „Einsicht" bei Tieren auf dem Wege der geschilderten Versuche nachzuweisen, dennoch dürften TOLMANS Konzeptionen für die Erklärung komplexen Lernens beim Menschen durchaus ihre Bedeutung haben. TOLMAN hat in seiner bekannten Arbeit mit dem Titel „Es gibt mehr als eine Art des Lernens" auf unterschiedliche Lernformen aufmerksam gemacht; die hier genannten Lernmodi sind von uns in vorstehendem Text behandelt worden. Eine kritische Würdigung ist bei C. E. OSGOOD (a. a. O . , S. 471) zu finden. Die geschichtliche Entwicklung dieser speziellen Lerntheorie soweit sie experimentelle Untersuchung offener Situationen betrifft, sei kurz angeschlossen: Autor

Erscheinungs- Untersudiungsjähr verfahren

1. EHRENFELS

1890

2. KATZ, D .

1911

3. BÜHLER, K.

1913

4. WERTHEIMER 1912 5. KÖHLER

1913/17

6. TOLMAN

1932/38

Transponierte Melodien Farbenkombinationen Linien v o n Rechtecken Bewegungsillusionen

L e k b

iffe der

xheorIe

Gestaltqualität Gestaltmuster Wahrnehmungsganzes und konstituierende Teile Phi-Phänomen

Schimpansen

Einsicht, Prägnanz, Isomorphismus Ratten Zielgerichtetes Verhalten; Labyrinthlernen Zeichen — Bezeichnetes — Relation; kognitive Muster

Schließlich ist noch anzumerken, daß eine leistungsfähige didaktische Ausnutzung der Zeichengestalttheorie in der Schularbeit mit Kindern bisher nicht zustande gekommen ist.

*) Hierzu ist die Psychologie des Dogmatismus zu zählen.

13. Lernen von Emotionen und Entlastung durch Verbalisierung Auf den Theorien HULLS und FREUDS aufbauend haben D O L L A R D * ) & MILLER"'*) vor allem in ihrem Werk „Personality and Psychotherapy" (1950) die behavioristischen Methoden mit den psychoanalytischen Konzeptionen in eine Verbindung gebracht. Dabei wurde zunächst zweierlei wichtig: 1. Die dem empiristischen Charakter des Behaviorismus entsprechende zentrale Stellung des Lernens. Auch DOLLARD 8C MILLER sehen das Verhalten als grundsätzlich durch vorgängige Erfahrung geformt, d. h. gelernt an. 2. Die aus der psychoanalytischen Rekonstruktion der pathogenetischen Bedingungen neurotisciier Persönlichkeitsfehlentwicklungen stammende Theorie der Motivation. Die Bedeutung von DOLLARD & M I L L E R liegt darin, daß sie als erste tiefenpsychologische Probleme unter lerntheoretischen Gesichtspunkten analysiert und dabei operationale Reformulierungen wichtiger psychoanalytischer Konzepte erarbeitet haben. Die Autoren gehen davon aus, daß das Verhalten, durch das sich der Mensch als rationales Wesen und als Angehöriger bestimmter Gruppen, Gesellschaftsklassen oder Kulturen charakterisiert, in sehr viel höherem Umfang gelernt als angeboren ist. Innerhalb eines theoretischen Modells des Lernens sind vor allem vier Variable von Wichtigkeit: 1. 2. 3. 4.

Triebe, Stimuli, an denen sidi das Verhalten orientieren kann, Reaktionen (Verhaltensweisen), sowie Verstärkung (vgl. HULL).

Mittels dieser Variablen läßt sich der Lernvorgang etwa wie folgt beschreiben: Als Folge von Triebspannungen treten Reaktionen auf, *) JOHN DOLLARD ist 1900 in den USA geboren, promovierte 1931, arbeitete an einigen amerikanischen Universitäten und war im Kriege Berater des US-Verteidigungsministeriums. Zur Zeit ist er Professor an der Yale-University. Seine Bedeutung erlangte er vor allem mit dem Werk »Frustration and Aggression" (1938/39) (mit Miller und anderen). * * ) NEAL ELGAR MILLER ist 1909 in den USA geboren, promovierte 1935, arbeitete 1935/36 am Wiener Psychoanalytischen Institut und wurde dann Professor an der Yale-University. Die meisten seiner Werke publizierte er gemeinsam mit DOLLARD; so z. B. „Social Learning and Imitation" (1941) und „Frustration and Aggression" (1939) sowie „Personality and Psydiotherapy" (1950).

L e r n e n v o n E m o t i o n e n u n d E n t l a s t u n g durch V e r b a l i s i e r u n g

113

die durch Reize an den Umständen orientiert oder im Sinne kultureller Institutionen kanalisiert werden. Zeitigt die erste Verhaltensweise keinen Erfolg und damit auch keine Reduktion der Triebspannung, so tritt diese Verhaltensweise in der Regel zurück. Es entsteht eine Situation, in der die Auslöschung der nicht erfolgreichen Verhaltensweisen ein sogenanntes random behavior, d. h. zielloses Verhalten auslöst. Führt eine bestimmte Verhaltensweise dagegen zum Erfolg, so wird die Kopplung zwischen Reiz und Reaktion verstärkt. Tritt die gleiche Triebspannung gleichzeitig mit andersartigen Umständen, also mit andersartigen Reizen oder mit anderen verhaltensdirigierenden Reizkonfigurationen (pattern of cues) auf, so gewinnt die zuvor erfolgreiche Verhaltensweise auch bei etwas andersartigen Reizkonfigurationen eine verstärkte Wahrscheinlichkeit, sich erneut zu aktualisieren. Die Variablen des lerntheoretischen Modells von DOLLARD & MILLER sind also: 1. Triebe (drives): Diese fungieren als starke Stimuli, die Reaktionen auslösen. Dabei wird zwischen (1) primären oder angeborenen und (2) sekundären, d. h. gelernten Trieben genau unterschieden. Primäre Triebe sind z. B. Schmerz, Hunger, Durst, Müdigkeit, der Geschlechtstrieb. Sogenannte „gelernte Triebe" werden auf der Basis der Primärtriebe gelernt, sie stellen eine Form der Motivation dar, die durch die Aufnahme von informativen Daten der Realität umgeformt und strukturiert ist. Wichtige Funktionen der Primärtriebe sind danach meist weiterhin in ihnen enthalten, z . B . : Hunger in Appetit. Als Sekundärtriebe (im Deutschen vielfach Strebungen genannt) werden die folgenden bezeichnet: Geltungsstreben, Erfolgswille, Machtstreben, Besitzstreben, Sicherheitsbedürfnis. 2. Reize und Anreizkonfigurationen (cues"')): Reize können nach Stärke und Art variieren. Ein extremer Reiz, wie helles Licht oder Lärm, kann funktionell „Triebwert" erreichen und eine spezifische Verhaltensweise aktualisieren. Dasselbe gilt für innere Stimuli, wie z. B. Stoffwechseländerungen. Neben den Funktionen interner Stimulation können die Motivationen über Konditionierungen auch Funktionen äußerer Reize übernehmen, durch die z. B. das Verhalten beim ö f f n e n der Speisekammer bei Hunger gesteuert wird. Eine unterschiedliche Stärke der Stimulation kann selbst (propriozeptiv) unterschiedlich deutlich erlebt werden und damit variable interne Stimulusfunktionen übernehmen. 3. Reaktion (responses): Eine Reaktion erfolgt nur selten auf Grund eines einzelnen Stimulus, sondern häufiger auf Grund eines StimulusMusters (stimulus pattern). Anlässe zur Neuanpassung zu bemerken, * ) „cue" ist hier als dirigierende und steuernde Empfindung zu verstehen im Gegensatz zu Reizwirkung auf das Bewußtsein (arousal-system). 8 H a s e l o f f - J o r s w i e d c , Psychologie

114

Lernen von Emotionen und Entlastung durdi Verbalisierung

ist ebenfalls eine wichtige gelernte Reaktion. In diesen Zusammenhang gehören das sogenannte Problembewußtsein und das „Aufpassen"-Lernen. Triebe oder allgemeiner: motivationale Spannungen veranlassen — so kann, die drei obengenannten Aspekte zusammenfassend gesagt werden — ein Individuum, auf bestimmte äußere Reize in einer bestimmten durch die jeweilige Motivation determinierten Weise zu reagieren. Innerhalb der möglichen Reaktionen unterscheiden DOLLARD SC M I L LER eine Stufenordnung: Das allererste Lernen einer Reaktion bildet die Initialstufe. Dieses Lernen ändert das Repertoire der dem Individuum überhaupt möglichen Verhaltensweisen. Damit konfiguriert sich eine neue resultierende Stufe komplexer Verhaltensweisen. Diese kann in der Folge dann durch noch komplexere Verhaltensmuster überbaut werden, die aus gelernten Verbindungen zwischen Verhaltensweisen, also aus bereits gelernten Verhaltensorganisationen, hervorgehen. Allerdings soll diese Hierarchie der Verhaltensweisen nicht ausschließlich durch Lernen bedingt, sondern in geringerem Umfang auch durch die Organisation des Gehirns vorgegeben sein*). Die für eine spezifische Reizsituation adäquate Reaktion wird durch die Verstärkung, über sprachliche Symbolisierung sowie mit Hilfe von Nachahmung ausgewählt. Das bedeutet hinsichtlich der intermediären Funktion der Sprache, daß die assoziative Verbindung zwischen den als signalisierende Reize auftretenden Wörtern einerseits, spezifischen Situationen und den in ihnen erfolgreichen Reaktionen andererseits gelernt werden muß. Nachahmung vermag die Anzahl der Reaktionen (nach dem Prinzip von Versuch und Irrtum) zu begrenzen. Triai und error, Nachahmung und verbale Instruktionen sind verschiedene Wege, Reaktionen zu bedingen, für die es eine verstärkte Wahrscheinlichkeit des Erfolges gibt. 4. Verstärkung (reinforcement): Verstärkung wird als Folge einer meist plötzlichen Reduktion eines starken Triebes definiert. Ein interessantes Experiment zum Zustandekommen der Verstärkung wurde von GREENSON durchgeführt: Der Experimentator bat die Versuchspersonen, alle Worte zu nennen, die ihnen in den Sinn kommen. Bei Substantiven, die im Plural standen, räusperte er sich. Darauf wurden häufiger Plural-Substantive genannt. Auch THORNDIKE konnte experimentell zeigen, daß die Verstärkung einer Handlung völlig unbemerkt und automatisch sein kann. Vorurteile, Überzeugungen und Gefühlshaltungen werden auf diese Weise gelernt; ebenso aber auch Fertigkeiten. *) Oft wird eine ganze Anzahl von Reaktionseinhclten mit einem Reiz verbunden, so daß sie zusammen, simultan oder sukzessiv, auftreten. Auf diese Weise entstehen neue Verhaltensmuster, bei denen die Einzelreaktionen alt, ihre Kombinationen jedoch neu sind.

Lernen von Emotionen und Entlastung durch Verbalisierung

115

Ist ein Verhalten gelernt, so schließt dies ein neues trial-and-errorLernen der gleichen Reaktion mit andersartigem Stimulus aus. Soll eine neue Reaktion gelernt werden, muß zunächst eine Situation geschaffen werden, in der die bisher gelernten Reaktionen erfolglos bleiben. Diese neue Situation fungiert als Problemsituation (learning dilemma). Das Theorem der Verstärkung macht verständlich, daß ein Verhalten, das zu einem nahen Ziel führt, mehr verstärkt wird als ein Verhalten, das zu einem entfernteren Ziel führt. Die Verfasser sprechen daher von einem Verstärkungsgradienten, der mit der Annäherung an das Ziel zuerst langsam, dann schneller zunimmt. Wenn wir vorhin sagten, daß eine Reiz-Reaktions-Verbindung bewußt sein kann, so bedeutet diese Aussage offensichtlich ein Zugeständnis an die Ergebnisse der Ich-Psychologie (FRENCH, RAPAPORT, HARTMANN), die es nahelegt, rationaler Verhaltenssteuerung einen größeren Anteil am Lerngeschehen zuzumessen, als dies den Auffassungen der älteren, orthodoxen Behavioristen entsprach. Aber auch die Tatsache, daß die Reiz-Reaktions-Verbindung „unbewußt" bleiben kann, hat weitreichende Konsequenzen für das praktische Leben; deshalb sind z. B. Vorurteile und Gefühle so schwer korrigierbar. Besonders gilt dies für den Fall, daß die ursprüngliche Reiz-Reaktions-Verbindung durch Generalisierung gänzlich der rationalen Kontrolle entzogen wird. Ist eine Verhaltensweise gelernt, dann läuft sie unter den gleichen Bedingungen immer gleich ab. Erst wenn die Reaktion erfolglos bleibt, sieht sich das Individuum genötigt, durch trial and error andere Reaktionen zu probieren. Die vier basalen Faktoren der Lernprozesse sind wie auch bei anderen Behavioristen nach DOLLARD & MILLER: Trieb, Signal, Reaktion und Verstärkung. Der Trieb ruft Reaktionen hervor, die durch Signale gesteuert werden. Signale fungieren als orientierende Stimuli, die nicht stark genug sind, um Triebfunktionen übernehmen zu können. Wird die erste Reaktion nicht durch Triebreduktion belohnt, folgen weitere wahllose Reaktionen. Ist eine dieser neuen Reaktionen durch Triebreduktion erfolgreich, wird die Verbindung dieser Antwort mit dem Signal-Muster verstärkt, so daß die Reaktion bei gleichem Trieb, aber anderem Signal probiert wird. Da die Verstärkung ihren Effekt nur durch Reduktion der Triebspannung erzielt, kann ohne vorgängige Triebspannung Belohnung keinen Effekt auf Verhaltensweisen erzielen. Ist das Bedürfnis durch ausreichenden Reaktionserfolg reduziert, so wird die Tendenz zur Wiederholung der belohnten Antwort aktuell geschwächt und andere Reaktionen treten auf, bis die Triebspannung wieder zu spezifisch-reaktionsauslösender Stärke angestiegen ist. Zur Erklärung komplexer Zusammenhänge greifen DOLLARD & M I L LER auf eine Reihe bekannter Begriffe des Lerngeschehens zurück: 8*

116

Lernen von Emotionen und Entlastung durch Verbalisierung

1. Extinktion oder Auslöschung einer Reaktion: Die vorübergehende Auslöschung wird auch von anderen Autoren beschrieben. Es erwies sich als zweckmäßig, Extinktionen gegen ein einfaches Vergessen und gegen Verdrängung abzugrenzen. Das Zusatztheorem von DOLLARD Sc MILLER zum Vorgang der Auslöschung besagt: Wird eine gelernte Reaktion ohne Erfolg angewandt, so kommt es zu einer progressiven Abnahme der Wahrscheinlichkeit des Wiederauftretens dieser Reaktion. Ein Wiederanwachsen des Triebes oder das Zustandekommen eines neuen Erfolges kann jedoch der Auslöschungstendenz stets entgegenwirken. Ein ausgelöschter Trieb (also ein zuvor gelerntes Motiv) oder eine ausgelöschte Gewohnheit können wieder aufgenommen werden, wenn während einer bestimmten Zeitspanne diese Reaktion nicht angefordert wurde, wenn also auch keine erneut erfolglosen Versuche aufgetreten waren. Vergessen werden dagegen Reaktionen, die über einen gewissen Zeitpunkt hinaus nicht angefordert wurden, durch die also auch niemals Mißerfolge erlebt werden konnten. Die Verdrängung schließlich stellt einen aktiven Vorgang, eine Abwehrmaßnahme des Ich dar. 2. Generalisierung: Der Erfolg, der auf eine dem Reizmuster spezifisch zugeordnete Reaktion eintritt, verstärkt nicht nur die Tendenz für ein entsprechendes Auftreten von Reaktionen dieses Musters, sondern zugleich auch für ähnliche Muster. Die Generalisierungstendenz wächst sowohl mit der Triebstärke als auch mit der Ähnlichkeit des Reizmusters. 3. Diskrimination oder Unterscheidung: Sie macht ein differenzierteres Verhalten möglich, als es der Mechanismus der Generalisierung allein erlauben würde. Intelligenz und Erfahrung spielen dabei zweifellos eine große Rolle, jedoch hängt die Möglichkeit einer Unterscheidung allgemein von dem Grad der Ähnlichkeit zweier Reizmuster ab. 4. Antizipatorische Tendenzen: Vom Grundsatz der Verstärkung werden antizipatorische Tendenzen abgeleitet. Wie bereits ausgeführt, bewirkt der Verstärkungsgradient, daß ein Individuum das Ziel auf kürzestem Wege zu erreichen sucht. Darin liegt die Tendenz, die entscheidende spannungsreduzierende Handlung vorwegzunehmen. Das bedeutet unter Umständen eine Ersparnis (wenn z. B. die Hand, die einen heißen Ofen berühren will, schon vorher zurückgezogen wird), es kann aber auch einen Irrtum bedeuten (wenn z. B. der Ofen gar nicht heiß ist). Der Mensch hat vitale Triebe wie Hunger und Durst. Er besitzt zunächst noch keines jener Bedürfnisse, die ihn später als Mitglied einer bestimmten Nation, einer sozialen Schicht, als Träger einer beruflichen Rolle usw. charakterisieren. Selbst die späterhin möglicherweise stärksten Motive wie Furcht oder Aggression oder das Streben nach Besitz, Macht und Ansehen werden erst im Verlauf des Prozes-

Lernen von Emotionen und Entlastung durch Verbalisierung

117

ses der Sozialisierung gelernt. Es ist Hauptaufgabe einer erfolgreichen Sozialisierung, solche Motive zu lernen, die helfen können, vitale Triebbedürfnisse unter Kontrolle zu halten (Über-Ich-Bildung). Damit ist zugleich gesagt, daß die Wechselbeziehungen von Kindheit und Gesellschaft charakter- und persönlidikeitsbildende Bedeutung hat*). Der Prozeß der Persönlichkeitsentwicklung kann also als Lerngeschehen innerhalb der Kultur gedeutet werden, wobei die gelernten Motive ihrerseits wieder Lernen motivieren und steuern. Einige dieser Gesetzmäßigkeiten lassen sich mit Hilfe der bisher erarbeiteten Begriffe am Beispiel der Furcht darstellen. Die Grundprinzipien des Lernens von Furdit und die Funktionen der Furcht als „gelernter Trieb" lassen sich zunächst am besten an Tierversuchen veranschaulichen: In einem weißen Käfig wird Ratten ein elektrischer Schlag appliziert. Sie haben die Möglichkeit, durdi eine offenstehende Tür in einen angrenzenden schwarzen Käfig zu fliehen. Später fliehen die Ratten aus dem weißen Käfig, der also mit Furcht konditioniert wurde (ohne den Primärtrieb Schmerz), sofort in den schwarzen Käfig, ohne daß sie einen Schlag bekommen haben. Sie zeigen gleichzeitig im weißen Käfig bei geschlossener Tür alle angeborenen**) Anzeichen von Furdit, wie Urinieren, Koten, gespanntes Niederducken usw. Die Furcht, die hier als Reaktion auf das Signal „weißer Käfig" gelernt wurde, motiviert also eine Anzahl von Reaktionen, die entweder Teile des Musters „Furcht" sind oder in der angeborenen Reaktionshierarchie sind. Die Versuchsanordnung läßt sich nun leicht so variieren, daß die Ratten die Möglichkeit erhalten, mittels einer Vorrichtung die geschlossene Tür zu öffnen. Dabei stellt sich heraus, wie auch MOWRER***) zeigen konnte, daß gelernte Furcht ein trial-and-error-Verhalten motiviert. Durch Reduktion der Furditspannungen werden schließlich diejenigen Verhaltensweisen verstärkt, die zum ö f f n e n der Tür führen und damit ein Verlassen des Käfigs ermöglichen. Unter Umständen kann aber die augenblickliche Reduktion von Schmerz und Furdit verstärkend auf diejenige Reaktion wirken, die zufällig zeitlich mit dieser Reduktion zusammenfällt"1"). Häufiger aber wirkt Strafe in folgender Weise: Furcht wird mit den „cues" gekoppelt, die in der bestraften Verhaltensweise enthalten sind. Das geschieht am sichersten und wirkungsvollsten, wenn die Strafe noch während der Exekution der unerwünschten Verhaltensweise oder *) KARDINER, A . : T h e I n d i v i d u a l a n d h i s s o c i e t y , N . Y . (1939) u n d E . ERIKSON:

Childhood and Society, N. Y. (1950). **) angeboren hier verstanden als im Nervensystem ausgedrückte genetische Informationen. ***) in der Mowrer-Miller Avoidance-Box, Jour. exp. Psych. 31, 6 (1942). „A multipurpose learning demonstration". + ) So ist das Weglaufen eine bevorzugte Reaktion bei viel geprügelten Hunden.

118

Lernen von Emotionen und Entlastung durch Verbalisierung

unmittelbar danach einsetzt. J e später die Strafe (als „negativer" Reiz) folgt, um so loser gestaltet sich der Zusammenhang zwischen ihr und der jeweils zu bestrafenden Reaktion. Nach einer gezielten „Strafe" beginnt ein Mensch bereits beim Gedanken an die mit Strafandrohung besetzte Verhaltensweise eine „vorsorgliche" Unterdrückung der Bedürfnisse, die das funktionsauslösende Verhaltensmuster aktivieren könnten. Auf diese Weise verstärkt die Furchtreduktion solche Reaktionen, die das Denken an oder die Ausführung von bestraften Verhaltensweisen verhindern. Diese Funktion der Furcht spielt eine große Rolle bei der Sozialisierung und wird seit jeher von allen Kulturen zur Stabilisierung eines normgerechten Verhaltens ausgenutzt. Furcht kann leicht an neutrale Reize konditioniert werden, so daß in vielen Situationen durch Furcht ein Verhalten ausgelöst wird, das eine realitätsgerechte Erfassung und Bewältigung der aktuellen Situation verhindert. Besondere Konflikte zwischen der Furcht und anderen starken Motiven wie etwa sexuellen Bedürfnissen bedeuten vielfach ein kulturspezifisches Dilemma für die Einzelpersönlichkeit wie für die Gesellschaft. Furcht wird auf Reize gelernt. Furcht kann dann wie jeder andere Respons mit reaktionsauslösenden Reizen verknüpft werden, die dann die gleichen Funktionen wie vitale Bedürfnisse übernehmen. Auch unterschiedliche Verstärkungen werden gelernt. Vorher neutrale Reize gewinnen dann die Fähigkeit, triebreduzierende Reaktionen zu verstärken. Solche neutralen Reize können auf diesem Wege wie Futter für ein hungriges Tier wirken. In unserer Gesellschaft funktioniert z. B. Geld als „gelernte Verstärkung". Für junge Kinder stellt Geld dagegen noch einen neutralen Reiz dar: bedrucktes Papier. Ältere Kinder lernen dann recht schnell seinen Wert kennen*). Später begünstigen Geldzeichen als Signal das Lernen neuer oder verhindern die Auslöschung bereits gelernter Verhaltensweisen. Zwischen „gelernten Trieben" und gelernten Verstärkungen besteht eine enge Verwandtschaft. Reaktionsverstärkungen können die funktionelle Bedeutung von Motiven annehmen, wie uns das im Falle des Geldes geläufig ist. Diese Signale übernehmen stimulierende und motivierende Funktionen, indem sie Reaktionen aktivieren: sie können Verstärkungswerte annehmen, indem sie Bedürfnisspannungen reduzieren. Dieser Zusammenhang scheint die Basis für Perversionen (vor allem für Fetischismen) darzustellen. Daß Auslöschung und Zielbindung sexueller Erregung überhaupt den Gesetzen des Lernens unterliegen, illustriert die Tatsache, daß sexuelles Verhalten von Kultur zu Kultur weitgehend unterschiedlich ist und audi innerhalb einer Kultur zeitbedingte Wandlungen erkennen läßt. * ) als universales Tausdimittel.

Lernen v o n Emotionen und Entlastung durdi Verbalisierung

119

lieben besonders das Lernen von ermotionalen Reaktionen hervor*). Fast alle Lerntheoretiker sind zu der Einsicht gelangt, daß Neulernen weitgehend von der Dynamik der Emotionen und Motive abhängig ist. Die Bedeutung von DOLLARD & MILLER liegt vor allem darin, daß sie fragten, wie Gefühle und Motivationen gelernt werden. Die lerntheoretische Interpretation neurotischer Störungen und Persönlidikeitsfehlentwicklungen kann in dieses Problemfeld eingeordnet werden. Emotionale Probleme treten als Folge starker Triebspannungen auf. Den kulturellen Verhaltenserwartungen angepaßte Menschen lernen eine Reihe rationaler Verhaltensmuster zur Reduktion von Triebspannungen. Hierbei kommt der Sprache eine zentrale Funktion zu. Durch sie können Verdrängungen aufgehoben und differenzierende Unterscheidung, Nachdenken, Voraussicht und angepaßtes Planen entwickelt werden. Bleibt aber der Konflikt unbewußt, dann leidet das Individuum unter den Folgen einer Fehlanpassung, die ständig bestraft wird. N u r in dem Grade, in dem der Konflikt bewußt gemacht wird, können einsichtige, rationale Reaktionen neue Wege aus der Konfliktsituation weisen. Schon das Aussprechen bestimmter Worte und Gedanken kann heftige Triebspannungen verringern*"'). Damit entlastende Symbolisierung, Denken und Verbalisation zustande kommen, müssen allerdings die unmittelbar triebreduzierenden Reaktionen zunächst gehemmt werden. Im Zustand vollständiger Triebentlastung kommt es nicht zum Denken, zum „verinnerlichten Probehandeln". Gedanken ihrerseits ermöglichen Unterscheidungen (Diskriminationen), die darauf zielen, Fehlanpassungen zu korrigieren. Dazu müssen sidi diejenigen Reaktionen durchsetzen, die durch Gedanken ausgelöst und gesteuert werden und einen relativ raschen Wechsel in der Beziehung zu den äußeren Umständen zur Folge haben. Diskrimination ist manchmal schon durch zwei Verbalreaktionen möglich, von denen jede mit je einem Stimulus konditioniert ist. Können dergestalt beispielsweise gefährliche und ungefährliche Situationen unterschieden werden, so wird Furchtreduktion erreicht. DOLLARD & MILLER

Die allgemeine Basis für neurotische Verhaltensweisen des Erwachsenenalters bilden unbewußte emotionale Konflikte der Kindheit. Das junge Kind hat noch nicht gelernt zu warten, zu hoffen, zu denken und auf diese Weise eine ungeordnete Situation durch kontrollier*) Bekanntlidi hat die deutsche Lernforschung systematisch nur Probleme des Gedächtnisses für Silben, Zahlen, also für verbalisierte Zusammenhänge untersudit. Es gehört zu den traditionellen Mustern unserer Kultur, ethisch-sozial relevante Verhaltensweisen sowie den gesamten Bereich der Gefühle mit Selbstverständlichkeit für erblich bestimmt zu halten. **) So kann sich z. B. bereits das Mitteilen intimer Gedanken furditreduzierend auswirken.

120

Lernen v o n Emotionen und Entlastung durch Verbalisierung

bare Strukturierung der Zukunft überschaubar zu machen. Das Kind ist physisch, geistig und emotional von den Eltern, von seiner unmittelbaren sozialen Umgebung, abhängig. Die Kultur, die weitere soziale Umgebung, stellt dann bald Forderungen an das Kind, die es zu erfüllen lernen muß. Dabei ergeben sich vier Situationen, in denen langandauernde emotionale Konflikte gelernt werden: 1. 2. 3. 4.

die Vernachlässigung, die Sauberkeitsgewöhnung, die sexuelle Erziehung und das Stellungnehmen zu aggressiven Verhaltensweisen.

Jede der vier Lernsituationen kann die Entwicklung und Strukturierung des Charakters beeinflussen, da jede von ihnen langandauernde emotionale Konflikte wechselnder Valenz enthält. 1. Die ersten Lernsituationen stehen in engem Zusammenhang mit der Nahrungsaufnahme. Dies gilt besonders für Situationen der Vernachlässigung, in denen neurotische Verhaltensweisen gelernt werden. Dabei gibt es drei Grundmuster: a) Das Kind wird nicht gefüttert, wenn es schreit. Dies führt zu emotionalen Erfahrungen, die schließlich eine passive Dauerhaltung begründen. b) Das Kind wird vernachlässigt und ist chronisch hungrig. Auf diese Weise werden generalisierte negative Zukunftserwartungen gelernt, obwohl die Lebensumstände und das Verhalten des Kindes undramatisch erscheinen. c) Das Kind kann Soziabilität oder aber das Fehlen einer gefühlsmäßig bedeutungsvollen zwischenmenschlichen Kommunikation lernen. Hier steht die Furcht, allein gelassen zu werden, im Vordergrund. Diese Furdit wird oft mit Dunkelheit konditioniert. Die Eltern bestrafen dann nicht selten die durch Angst bedingte Unruhe des Kindes. Die Folge kann ein heftiger Konflikt zwischen der Angst vor dem Dunkel und der neu gelernten Furdit vor den Eltern sein. Diese frühen Konflikte sind für das Kind unverbalisiert und daher auch später nicht bewußt. Konflikte, die vom Kind nicht sprachlich formuliert werden können, bleiben unbewußt. 2. Die Erziehung zur Sauberkeit kann zu Konflikten führen. Das Kind muß lernen, seine Exkremente an einem bestimmten Ort abzugeben und seinen Körper zu reinigen; später ist darüber hinaus das Unterdrücken unnötiger Erwähnung dieses Geschehens zu lernen. Die Konflikte in diesem Bereich entstehen dadurch, daß das Kind sauber werden soll in einer Entwicklungszeit, in der verbale Hilfen kaum zur Verfügung stehen. Es lernt durch Exkretionsabgabe an *) Im Vergleich zu Reaktionen, die in entsprechenden Situationen durch unverbalisierte Triebspannungen oder äußere Stimuli ausgelöst werden.

Lernen von Emotionen und Entlastung durdi Verbalisierung

121

einem dafür nicht vorgesehenen Ort und verbindet die darauffolgende Bestrafung (gleich negativer Stimuli) mit Angst. Jeder Charakter wird von diesen Lernvorgängen geprägt. Vor allem werden bestimmte Grundmuster des Hergebens oder Behaltens in dieser Situation gelernt. Differenzierte Bereiche der Über-Ich-Organisation eines Menschen bilden sich in dieser Zeit heraus. 3. Konflikte durch frühe Sexualerziehung: Konflikte zwischen sexuellen Bedürfnissen und gelernter Angst charakterisieren häufig strukturelle Bestandteile neurotischer Persönlidikeitsfehlentwidtlungen. Quellen dafür sind: a) Das Masturbationstabu; es verbietet und bestraft Masturbation. b) Später das Tabu für homosexuelle Betätigung. Von größerer Bedeutung für die Persönlichkeitsentwicklung aber sind jene emotionalen Haltungen und Erwartungen sowie jene Ängste, die in den dramatischen Spannungen frühkindlicher „Liebessituationen" gelernt werden. Das Kind l e r n t , daß eine liebevolle Zuwendung nicht ihm allein gilt, sondern andere Menschen und deren Zugewandtheit auch mit seinen Eltern und Geschwistern teilen muß. Das anschauliche Modell hierfür ist die „ödipussituation". Daraus resultierende Angstkonflikte können gleichfalls nicht benannt werden und bleiben daher unbewußt. Angst in Verbindung mit dem Geschlechtstrieb kann sich bis in das Erwachsenenalter hinein fortsetzen. Der Mensch hat nicht zwischen den tabuierten Geschlechtsgefühlen seiner Kindheit und der relativen Freiheit des Erwachsenen zu unterscheiden gelernt. 4. Aggressionsbereitschaft ist allgemein die Folge einer frustrierenden Situation und tritt vielfach in Verbindung mit der Angst vor ihrer Bestrafung auf. Angst ist daher nicht nur an die verhaltenshemmenden Reizkonfigurationen einer verbotenen Situation gebunden, sondern tritt auch in Verbindung mit „cues" auf, die mit gefühlshaften Empfindungen der Kindheit verknüpft sind. Aggressionsbereitschaft ist besonders häufig die Folge von Frustration, die an den angedrohten oder erlebten Verlust der Liebe und Bestätigung der Eltern konditioniert ist. Audi pathologische Verhaltensweisen von Erwachsenen lassen sich auf Frustration zurückführen, die als Reaktionen bei Nichterreichen bestimmter Ziele auftreten. Pathologische Verhaltensweisen können also gelernt werden. Das resultierende aggressive Verhalten wird bestraft und bildet dann einen sekundären Ärger-Furcht-Konflikt. Die persönlichkeitscharakterisierenden Grundstrukturen derartiger Konflikte wiederholen sich von dem frühesten Kindesalter an. Aggressionsbereitschaft kann, wie schon gesagt, als Folge jeder Frustrationssituation entstehen. Konflikte sind aber häufiger Ursachen von Frustrationen. Dabei kann ein Konflikt die Folge des gleich-

122

Lernen von Emotionen und Entlastung durch Verbalisierung

zeitigen Auftretens eines primären und eines gelernten Motivs sein, wie dies beim Sexualität-Angst-Konflikt der Fall ist. Konflikte können aber auch auf der gleichzeitigen Wirksamkeit zweier starker gelernter Triebe basieren: Aggression-Angst-Konflikt. Wichtig ist das Lernen neurotischer Verhaltensmuster: Gelernte Motive in ihrer speziellen Funktion als Bedürfnisse, Signale oder Verstärkungen bestimmen Charakter und Persönlichkeit des einzelnen Menschen. I m Gegensatz zu primären Trieben können sie durch Mißerfolg geschwächt werden. Die gelernten Motive variieren mit den verschiedenen Bedingungen des Lernens in einer Kultur, einer Epoche oder einer sozialen Schicht. Theoretisch kann jedes stark frustrierte Bedürfnis neurotische Symptome auslösen. In unserer Gesellschaft bilden Angst, Aggression und sexuelle Triebspannung jedoch diejenigen Motivationen, die besonders häufig zum Anlaß unbewältigter neurotischer Konfliktspannungen werden und damit auch bevorzugte Entstehungsanlässe neurotischer Symptome darstellen*). Neurotische Symptome werden in der Weise gelernt, daß Furcht**) in verschiedener Weise auf neue Reizkonfigurationen übertragen wird. Dabei ist zu beachten: 1. J e ähnlicher Stimuli den ursprünglich traumatisch oder neurotisierend wirkenden Situationen sind, desto stärker werden sie in der Folge generalisiert (gradient of generalisation). 2. Nachdem Furcht als Reaktion auf bestimmte Signale gelernt worden ist, dienen diese Signale als gelernte, verstärkende Ursache dafür, daß jedes weitere Signal, das ihnen wiederholt vorausgeht, Furcht auslösen kann***). 3. Wenn Furcht an reaktionsauslösende Signale gebunden ist, dann gewinnt jeder neue Stimulus zugleich auch die Fähigkeit, Furcht hervorzurufen. Hier handelt es sich um eine sekundäre, reaktionsvermittelnde Generalisation. Ein Zwang wird in einer der späteren Auslösungskonfiguration ähnlichen Situation gelernt und dann verstärkt. Dies gilt beispielsweise für die phobische Meidung geschlossener Räume, bestimmter Tiere oder breiter Straßen. Gewöhnlich vermittelt die ritualisierte Zwangshandlung nur eine zeitweilige Angstreduktion. Die Angst wächst immer von neuem an und veranlaßt dann das Individuum, die jeweils akquirierte Zwangshandlung zu wiederholen. Wird eine Zwangshandlung unterbrochen, wie z. B. Händewaschen, so erfährt das *) Dabei hat das Symptom vor allem die Funktion, die neurotis&e, chronisch frustrierte Spannung abzuführen oder abzuwehren, woraus sidi die unbewußte Tendenz des Neurotikers zum Festhalten und zur Symbolbedeutung seiner Symptomatik erklärt. * * ) Oft als Phobien sekundär an Objekte fixiert. * * * ) Hier handelt es sidi also um eine Konditionierung höherer Ordnung.

Lernen von Emotionen und Entlastung durch Verbalisierung

123

Individuum einen starken Angstanstieg, der nur durch die erneute Zwangsausführung reduziert werden kann. Wird eine dominierende Gewohnheit durch einen Konflikt blockiert oder durch Nichtbelohnung ausgelöscht, so tritt die nächststärkere Reaktion auf. Wurde diese dergestalt aktualisierte Reaktion während des Kindesalters gelernt und verstärkt, so stellt ihr erneutes Auftreten eine Regression dar. D O L L A R D SC M I L L E R folgen der Hypothese, daß innere reizbedingte Reaktionen, die ein spezifisch zielgerichtetes Verhalten bewirken, sowie Auslösungsmuster für gelernte Motivationen, denselben Gesetzen gehorchen wie oifen sichtbare, direkt umständebezogene Verhaltensweisen. Im Falle einer Neurose wird vielfach durch starke Furcht ein Konflikt unterhalten, der die Zielhandlungen hemmt, die normalerweise z. B. sexuelle oder aggressive Triebspannungen entlasten. Dabei wird durch diejenigen „cues" starke Furcht ausgelöst, die mit der verbotenen Zielhandlung konditioniert werden. Neurotische Persönlichkeiten, die in hohem Umfang die Hemmung und Vermeidung bestimmter, tabuierter Zielhandlungen gelernt haben, reagieren in solchen Situationen mit Konflikthandlungen. Die dadurch entstehende Furchtreduktion bedingt eine Tendenz zu immer wiederholtem Auftreten dieser Konflikthandlungen. Da die Konflikthandlungen das Auftreten triebreduzierender Zielhandlungen verhindern, verstärkt sich jedoch das frustrierte Bedürfnis. Eine solche chronische Frustration führt zu dauernder Angst. Zugleich werden als Folge frustrierter Triebspannungen auch diejenigen Verhaltensweisen mit Angst gekoppelt, die eine Zielannäherung bedeuten würden. Der Neurotiker wird also gleichzeitig durch frustrierte Triebspannungen und durch Furcht stimuliert. Furcht und Schuldgefühl motivieren auch die Verdrängung verbaler reizauslösender Reaktionen (Gedanken), durch die sie bedingt werden; indem die Verdrängung Furchtspannung reduziert, wird ein Lernprozeß ausgelöst, der wiederum die Bereitschaft zur Verdrängung verstärkt. Da verbale Reaktionen die Basis rationalen Verhaltens und Prüfens sind, verursacht ihre Verdrängung die scheinbare Dummheit des Neurotikers. So sind neurotische Menschen fast nie in der Lage, unterschiedliche emotionale Situationen ausreichend zu differenzieren. Unrealistische Furcht kann daher nicht korrigiert werden. So schließt sich der Kreis von Furcht, Verdrängung, „Dummheit", Mangel an Diskrimination und Fortdauer unrealistischer Furcht. Frustrationsbedingte Einschränkungen der Einsicht hindern den Neurotiker vor allem, adäquate Lösungen seiner Probleme zu finden*). *) SCHULTZ-HENCKE betont in diesem Zusammenhang, in Anlehnung an ALFRED ADLER, die sekundär gelernten Reaktionsmuster von Riesenansprüdien und Bequemlichkeit. Der gehemmte Mensdi, S. 73, Stuttgart (1939).

124

Lernen von Emotionen und Entlastung durch Verbalisierung

Kritisch ist anzumerken, daß die Präzision der Termini bei N . MILLER I . D O L L A R D nicht sehr groß ist. So betont M I L L E R in „Learnable Driver and rewards" (1951), daß „drive and motivation", „rewards and reinforcement", „cue and Stimulus" gleichwertig von ihnen benutzt werden. Experimentell gestützt ist das Lernen von Motiven nur im Falle der „Furcht", die ihrerseits auf Hunger basiert. Die Applikation des Basiskonzepts auf Begriffe der Psychoanalyse hat sich bisher interpretativ und kreativ ausgewirkt, die Technik des analytischen Vorgehens aber nicht zu beeinflussen gemocht. &

14. Die Zwei-Faktoren-Theorie des Lernens Überschauen wir die historische Entwicklung der Lerntheorien in der ersten Hälfte des 20. Jahrhunderts, so wurden im wesentlichen drei Hauptpositionen vertreten: a) Das Bedingungslernen (Konditionierung), dem sich nach den grundlegenden Forschungen PAWLOWS vor allem W A T S O N und später auch G U T H R I E zuwandten, b) das Verhaltenslernen (trial-and-error; Lernen am Erfolg), das insbesondere von T H O R N D I K E und C . L. H U L L dargestellt wurde und c) das Orientierungslernen (Zeichenlernen), dessen genauere Kenntnis wir vor allem den Forschungsarbeiten TOLMANS verdanken. O R V A L H O B A R T M O T O R versuchte über ein Jahrzehnt hindurch, eine monistische Konzeption des Lernens zu entwickeln; jedoch schienen ihm dann klinische und experimentelle Befunde sowie logische Bedingungen insgesamt nahezulegen, daß es zwei grundsätzlich voneinander zu unterscheidende Lernprozesse gibt, die zunächst vereinfachend unter den Bezeichnungen „Lösungslernen" und „Zeichenlernen" umschrieben werden sollen. Im Jahre 1947 trat M O T R E R erstmalig mit dieser Konzeption hervor, die er „Zwei-Faktoren-Theorie" nannte. Gemäß den Ergebnissen seiner weiteren Forschungsarbeiten veränderte und verbesserte er sein Modell und stellte 1956 seine „Zweite Version der Zwei-Faktoren-Theorie" vor. Die jüngste, wiederum verbesserte Fassung seiner Theorie stammt aus dem Jahre 1960.

Nadi der Konditionierungstechnik PAWLOWS wird das Lernen im wesentlich als Stimulus-Substitution angesehen (Kap. 5 S. 29). Die Grundlage der Kontiguitätstheorie GUTHRIES ist das Zusammentreffen eines Reizes mit einer Bewegung, die eine Störung des Anpassungsgleichgewichtes aufhebt, so daß dieser Reiz in Zukunft die zur Neuanpassung führende Reaktion auslöst (Kap. 9 S. 65). Auf THORNDIKES Effektgesetz von 1931 baut die Theorie des Lernens am Erfolg auf, die sich vor allem der Reiz-Reaktions-Verbindung („bond") und ihrer Habitualisierung („habit") zuwendet (Kap. 6 S. 38). In der Huixschen Lerntheorie tritt die Konditionierung als eine Art Nebenprodukt des grundlegenden Erfolgslernens auf, die Reiz-Reaktions-Verbindung wird durdi ihre Assoziation mit einer Triebreduktion verstärkt, so daß in diesem Modell der primären Verstärkung der Motivation eine entscheidende Bedeutung zukommt (Kap. 10 S. 83). Neben dem Be-

126

Die Z w e i - F a k t o r e n - T h e o r i e des Lernens

dingungs- und dem Verhaltenslernen schreibt M O W R E R dem Begriff der Erwartung hervorgehobene Bedeutung zu, den er aus der Orientierungstheorie von TOLMAN entlehnte (vgl. Kap. 1 2 S . 1 0 4 ) . Erwartet wird dabei als Folge der Reizsituation (1) mit der zugehörigen Reaktion die Reizsituation (2). Damit wird alles Lernen im Sinne der Konditionierung zu einem Zeichen- und Signallernen. Nach kritischer Betrachtung dieser Theorien stellte M O W R E R sich gegen Ende der vierziger Jahre — wie gesagt — auf den Standpunkt, daß die Eleganz einer monistischen Konzeption des Lernprozesses nur um den Preis einer Übervereinfachung zu erreichen sei, durch die nicht alle beobachteten Phänomene des Lernens in befriedigender Weise erklärt werden können. Darum kam er in der ursprünglichen Fassung seiner Theorie zu der erwähnten Annahme von zwei verschiedenen, nicht weiter reduzierbaren Arten des Lernens: Die beiden „Faktoren" seiner Theorie sind das „Zeichenlernen", das im wesentlichen der Konditionierung gleichkommt, und das „Lösungslernen", das sich aus dem Verhalten nach Versuch und Irrtum ergibt. Diesen beiden Lernprozessen ordnet M O W R E R unterschiedliche neurophysiologische Vorgänge zu. Dem „Zeichenlernen" wird neurophysiologisch das autonome Nervensystem (mit seinen hormonalen und enzymatischen Auswirkungen bzw. Bedingungen) unterlegt. Das autonome Nervensystem ermöglicht nach der Auffassung M O W R E R S auch die Reizsubstitution ( P A W L O W ) und die Assoziationsstiftung. Demgegenüber basiert das „Lösungslernen" auf den Funktionen des Zentralnervensystems und ermöglicht mit seinen Systemeigentümlichkeiten auch die Substitution von Reaktionen (THORNDIKE). Die Lernprozesse, die PAWLOW als „bedingte" Reflexvorgänge beschrieben hat, definiert M O W R E R damit als Vorgänge, in denen das Antwortverhalten des Lebewesens gleich bleibt und lediglich das Reizsignal abgewandelt wird. Die Lernkonzeption THORNDIKES dagegen wendet ihr Hauptinteresse der Abwandlung des Antwortverhaltens gegenüber gleichbleibenden Reizkonfigurationen zu. Diesen Reiz- oder Reaktionssubstitutionen werden als theoretische Basisannahmen einerseits das Kontiguitätsprinzip GUTHRIES und andererseits das Verstärkungsprinzip H U L L S unterlegt. Für das Zeichenlernen ist also Kontiguität oder Assoziation die primäre Bedingung; für das Lösungslernen ist die primäre Vorbedingung Verstärkung oder Belohnung. Bei so exakter Trennung des Lernprozesses läßt sich nun kaum noch von einem Verhalten sprechen, das auf der Basis direkter Konditionierung entstanden sein sollte. Allein die Emotionen können mit neuen Reizen (Signalen oder Zeichen) im Sinne des Konditionierungsprinzips verknüpft werden. Die Emotionen wirken dann als intervenierende Variable. Der Behaviorismus THORNDIKES begrenzte seine Lernforschungen einerseits auf Situationen, in denen zwar das Untersudiungstier durch

Die Zwei-Faktoren-Theorie des Lernens

127

Hunger, Durst oder andere metabolisch begründete Triebe motiviert war, ohne diesen biologischen Vorgängen eine entsprechende Rolle beim Lernen zuzuschreiben. Die Theorie MOWRERS macht nun klar, daß Versuch und Irrtum auch mit gleichem Erfolg vollzogen werden, wenn der Organismus durch einen erworbenen, sekundären Trieb, wie ihn Emotionen hervorrufen, motiviert ist. Lösungs- und Zeichenlernen kann in einer Gegenüberstellung folgendermaßen differenziert werden: 1.

2.

„Lösungslernen" erfolgt, wenn Triebspannungen reduziert worden sind und Probleme gelöst werden. Demgegenüber vollzieht sich „Zeichenlernen" dann, wenn ein vorher neutraler Reiz den Triebeinsatz begleitet. Lösungslernen bedarf des Zentralnervensystems, Zeidienlernen ist auf das autonome Nervensystem angewiesen.

3.

Lösungslernen benötigt Skelettmuskulatur, Zeichenlernen nimmt Drüsen und glatte Muskulatur in Anspruch.

4.

Lösungslernen involviert Zielhandlungen (behavior), Zeidienlernen unwillkürliche interne Reaktionen (Emotionen).

„Zeidienlernen" ist also der Vorgang, durch den Furcht von dem unkonditionierten auf den konditionierten Stimulus übertragen wird; „Lösungslernen" dagegen ist der Vorgang, durch den der Organismus ein Antwortverhalten aufbaut bzw. auszuwählen lernt, durch das er Furchtspannungen in zweckmäßiger Weise reduziert. In bezug auf menschliches Lernen gibt MOWRER folgende Erläuterungen: „In einem Falle (Lösungslernen) erwirbt das Subjekt eine Tendenz zur Handlung (Aktion), die die Lösung eines Problems darstellt, mag dieses Problem durch einen primären oder sekundären „Trieb" entstanden sein. Im anderen Falle erwirbt der Organismus eine E r wartung, eine Prädisposition, einen Glauben oder eine Orientierung. Durch die letztere Art des Lernens werden sekundäre Strebungen oder Emotionen mit neuen Objekten verbunden und schaffen so Probleme, wo vorher keine waren." Mit anderen Worten: Lösungslernen ist Problemlösung, Triebreduktion, Lustgewinn; während Zeichenlernen oder Konditionierung oft — vielleicht stets — Probleme schafft. Ebenso wie andere Lernforscher —

z . B . H U L L , DOLLARD,

MILLER,

SKINNER U. a. — verwendet auch MOWRER den Begriff der „intervenierenden Variablen" in seinem Lernmodell. Zunächst fand unter den intervenierenden Variablen besonders die Furcht sein Interesse. Nach dem Prinzip der Kontinuität findet Zeichenlernen bei steigender Motivation und bei simultanem Auftreten von Reiz und Verhaltensweise statt. Die steigende Triebspannung erzeugt im Organismus eine Emotion — z. B. Furcht — die zu dem Reiz konditioniert wird. Zeichenlernen ist also durch das Auftreten einer Emotion und durch Konditionierung auf einen ursprünglich neutralen Reiz gekenn-

128

Die Zwei-Faktoren-Theorie des Lernens

zeichnet. Das Streben des Organismus nach Furchtreduktion und damit also Reduktion der Triebspannung führt zu einem trial-and-errorVerhalten, in dem das Lernen am Erfolg dann das Lösungslernen darstellt. Diesen Hinweis auf die Verflechtung von Zeichen- und Lösungslernen konnte M O W R E R durch Experimente erhärten, in denen er wiederum die intervenierende Variable Furcht zweckvoll einsetzte. In diesen Experimenten konnte er zeigen, daß die einfache Verbindung von S (Stimulus) und R (Reaktion) durch interne Vorgänge im Organismus aufdifferenziert werden muß. Diese Erweiterung besteht in einer inneren Furchtreaktion, die als interner Reiz das Lösungsverhalten veranlaßt. So entwickelt er das bekannte S-R-Schema weiter zu dem Modell: „S-r: s-R". Diese Differenzierung ist — wie wir weiter unten sehen werden — wichtig auch für die Theorie der Funktionsweise von Sprache. Durch den experimentellen Nachweis der internen Furchtreaktion gelangt M O W R E R ZU einer neuen Theorie der Wirkungen von Bestrafung: Im Gegensatz zu T H O R N D I K E S Annahme, nach der bestrafte, d. h. nutzlose S-R-Verbindungen aus dem Verhaltensrepertoire eliminiert werden, zeigte er, daß Bestrafung Furcht erzeugt, die wie ein Primärtrieb wirkt und Verhaltensweisen zur künftigen Vermeidung von Bestrafung auslöst. Wenn also der Organismus durch den sekundären „Trieb" motiviert ist, erfolgt trial-and-error-Verhalten, bis eine Reaktion gefunden wird, die diese sekundäre Triebspannung reduziert, und mit deren Erlernen künftig durch dieses strafmeidende Verhalten einem neuerlichen Auftreten der Sekundärspannung entgegengewirkt werden kann. Demgemäß ist in der „S-r : s-R"-Formel: S das Gefahrensignal, r die konditionierte Furchtreaktion, die als Trieb s erlebt wird, der seinerseits R als gelernte Antwort hervorruft. Es wird also über das Signal S aus der internen Reaktion r ein interner Reiz s für das Antwortverhalten. R. M O W E R arbeitet nach folgendem Experimentierschema:

%

R3

Si

Rt

S,

Eine Ratte mit Hunger (s) hat, um Futter zu erlangen, die Antwort (Rj) gelernt. Nun wird sie durch elektrischen Schock beim Futterholen bestraft (Sx). (S t ) erzeugt die Furchtreaktion (r) und während der Wiederholung von (Rj) entstehen kinästhetisdie und andere Reize, sobald Furcht auftritt. Diese neuen Stimuli (S2, S 3 ) werden mit (r)

Die Zwei-Faktoren-Theorie des Lernens

129

konditioniert. Das Ergebnis ist, daß (Rj) verhindert oder vermieden wird und dafür neue Reaktionen (R2, R s ) auftreten, die ebenfalls Hunger zu befriedigen vermögen. Aus diesem Ablauf wird deutlich, daß Lösungslernen mit Triebreduktion (Belohnung), Zeichenlernen mit Triebinduktion (Furcht) verbunden ist, und Konditionierung demgemäß als der Erwerb von neuen emotionalen Reaktionen redefiniert werden muß. In den folgenden Forschungsvorhaben beschäftigt sich Mowrer mit einer Reihe geistvoller Experimente aus der Schule der Neobehavioristen, die den zeitlichen Zusammenhang von konditionierendem Reiz (CS) und neutral begründetem unkonditioniertem Reiz (Un CS) betrafen. Er wählt verschiedene Versuchsanordnungen, so daß CS einmal dem Un CS vorausgeht, zum zweiten, daß CS und Un CS mit der Beendigung von Un CS zusammenfällt, daß viertens CS dem Un CS folgt und fünftens schließlich, daß CS als Dauerreizkonstellation über das gesamte Bestehen von Un CS wirkt ( M o w e r SC Aiken, 1954)*). Hierbei ergab sich, daß der Erwerb von Emotionen aus der konditionierenden Verbindung ehemals neutraler Reize mit störenden Reizen hervorgeht. Diese emotionshervorrufenden Reize werden noxisdie Reize (Noxe = Schädlichkeit) genannt, also z. B. der elektrische Schlag. Da die Wirkung noxischer Reize mit ihrem Einsetzen gegeben ist, können sie sowohl bestehende Reaktionen verhindern, als auch neue Reaktionen hervorrufen. So kann Furcht zur Auslöschung von Motivationen führen, aber auch den Organismus zu neuer Aktivität motivieren und verstärken, damit eben Furcht reduziert wird; eine derart konfigurierte Reizkonfiguration kann demnach (a) höhergeordnete Konditionierungen oder (b) einen neuen Satz von Habits produzieren**). Wenn ein Reiz — sei er nun reaktionsproduziert (intern) oder umgebungserzeugt — einer deutlichen Triebunterdrückung vorausgeht, wird Furcht zu diesem Reiz konditioniert. Die Kopplung Reizsignal—Furcht kann reaktionsvermeidend wirken im Sinne passiver Vermeidung, wenn das „Furditsignal" reaktionsproduziert war. Dagegen tritt aktives Vermeidungsverhalten auf, wenn das konditionierende Signal „umgebungsproduziert" wurde. Diese Interpretation schließt ein, daß wenn Furcht an einen Reiz oder ein Reizgefüge attachiert worden ist, diese Furchtreduktion belohnt oder verstärkt wird, welches Verhalten audi immer mit dieser Reak*) MOTRER, O. H„ & E. G. AIKEN: „Contiguity vs. drive-reduction in conditioned fear: variations in conditioned and unconditioned Stimuli", Amer. J. Psych. 67, 26 (1954). **) MOTRER, O. H„ & R. R. LAMOUREUX: „Avoidance conditioning and signal duration—a study of secondary motivation and reward", Psych. Monogr. 54, Nr. 247 (1942). 9 Haseloff-Jorswiedc, Psychologie

130

Die Zwei-Faktoren-Theorie des Lernens

tion verknüpft wird. Diese Verstärkungsart nennt MOWRER Typ 1 der sekundären Verstärkung. Hierzu wurden folgende Verstärkungsexperimente durchgeführt: Gruppe 1: Konsekutive Verstärkung, jeder erfolgreiche Lösungsweg eines Tieres (im T-Labyrinth) wird mit Futter belohnt. Gruppe 2: Alternative Verstärkung, auf einen belohnten Versuch folgt prinzipiell ein unbelohnter Versuch. Gruppe 3: Differenzierte Verstärkung, dem Ort der Belohnung (Futterabteil) wird bei erfolgreichem Versuch und folgender Belohnung eine besondere Gestaltung oder Färbung gegeben. Die Tiere der Gruppe 3 erzielten die häufigsten Lösungen in kürzester Zeit. Habits, die auf dem Wege sekundärer Verstärkung zustande gekommen sind, widerstehen der Auslöschung besser. Der Typ 2 der sekundären Verstärkung kann nur in zwei aufeinanderfolgenden Lernstufen experimentell dargestellt werden: a) zunächst wird eine assoziative Verknüpfung zwischen einem bislang neutralen Reiz und einer Verhaltensweise im Sinne der primären Verstärkung gestiftet, b) sodann wird im Sinne der sekundären Verstärkung durch die intermittierende Präsentation des Stimulus eine neue Verhaltensform, ein Habit geprägt. Bei dieser doppelt intermittierenden Verstärkung resultiert ein multiplikativer Effekt (nicht nur ein summativer). Die Versuchsanordnung ist folgendermaßen gekennzeichnet: 1. Training: Das Versuchstier, eine Ratte, wird in einen Käfig gesetzt, der mit einem wasserliefernden Mechanismus ausgestattet ist. Die sekundäre Verstärkung wird erzeugt, indem immer dann, wenn sidi das Tier in der Nähe des Wasserspenders aufhält, jede Minute ein kurzer Summton erfolgt. H a t das Tier die Assoziation Summton— Wasserausgabe gelernt, wird die auf den Summton ursprünglich folgende Verstärkung ausgesetzt, indem nicht mehr auf jede richtige Reaktion Wasser geliefert wird. Dies geschieht zunächst in alternierender, dann in sukzessiver Reihe für längere Dauer. Ausgehend von einem durchschnittlichen Verhältnis von einer belohnten gegenüber zehn unbelohnten Reaktionen wird die Zahl der Verstärkungen allmählich weiter gesenkt. Bei diesem Vorgehen läßt die Aktivität des Versuchstieres keineswegs nach; vielmehr reagiert es auf den Summton so, daß „jetzt Wasser da sein könnte". Zwar gibt es nur dann Wasser, wenn der Summer ertönt; aber der Summer ist kein sicheres Zeichen für Wassererhalt. 2. Testung: Sekundäre Verstärkung Typ 2 wird nun untersucht, indem der Ratte ein Hebel zum Herunterdrücken zur Verfügung steht, der mit dem Summer verknüpft ist. Der Summer verstärkt diese „Hebel-

131

Die Zwei-Faktoren-Theorie des Lernens

reaktion", ohne die Wasserlieferung zu beeinflussen; aber auch die Summer-Hebelreaktion wird intermittierend verstärkt. Zusammenfassend kann diese neuere Version der Zweifaktorentheorie des Lernens so beschrieben werden: Konditionierung wird weiter als ein reales Phänomen angesehen; aber sie wird zur Berücksichtigung emotionaler Reaktionen redefiniert, und der Erwerb von Furcht wird aufgefaßt als abhängig von der Konjunktion eines bis dahin neutralen Reizes mit dem Einsetzen eines schädigenden Reizes oder eines Triebes. Im Gegensatz hierzu wird die Terminierung oder Reduktion eines solchen Triebes durch jene Bedingungen hervorgerufen, die für Formierungen des Verhaltens überhaupt nötig sind. Für den Erwerb von passiver und aktiver Vermeidung wird angenommen, daß beide Formen des Lernens eingeschlossen sind. Im gegenwärtigen Stand seiner Theorie hat Mowrer besonders im Zusammenhang von aktiver und passiver Vermeidung und den zugeordneten emotionalen Reaktionen eine neue Konzeption entwickelt. Seine Kritik an den bisherigen Lerntheorien von Pawlow bis Thorndike bezieht sich vor allem auf das Fehlen bzw. die mangelnde Berücksichtigung einer durch Bestrafung ausgelösten internen Furchtreaktion des Organismus. Nun ist es in der jüngsten Fassung seiner Theorie nicht nur die Gefühlsqualität Furcht, sondern gleichermaßen die Gefühle der Hoffnung, Erleichterung und Enttäuschung, auf die er besonders hinweist. Alle vier emotionalen Qualitäten können direkt mit inneren und äußeren Reizen konditional verknüpft werden. Dadurch fungiert ein Reiz künftig als Signal für die zugeordnete Emotion. Das Lösungslernen, das von dieser Koppelung angereizt wird, teilt Mowrer in vier Verhaltenskategorien ein: in aktives und passives Annäherungs- und Vermeidungsverhalten. abnehmende Verstärkung +

zunehmende Verstärkung —

I. Antworterleichterung (habit)

II. Antwortverhinderung (punishment)

Ablauf auf antwortbezogene Reize hin

III. Platzannäherungsverhalten

IV. Platzvermeidungsverhalten

Ablauf auf unabhängige Reize hin

Die Furcht löst also genau zwei verschiedene Formen des Meidungsverhaltens aus: Bei der aktiven Meidung muß eine bestimmte Reaktion erfolgen, damit die Bestrafung ausbleibt; bei der passiven Meidung muß eine 9*

132

Die Zwei-Faktoren-Theorie des Lernens

bestimmte Verhaltensweise unterdrückt werden, damit keine Bestrafung ausgelöst wird. Dieser durch Furcht bestimmten Verhaltensformierung steht als Pendant das durch Hoffnung oder Erwartung ausgelöste aktive und passive Annäherungsverhalten gegenüber. Im Falle der Bestrafung einer Verhaltensweise entsteht nun ein Konflikt zwischen einer Verhaltenstendenz zur Strafmeidung und einer anderen zur Triebreduktion. Die Entscheidung dieses Konfliktes dürfte sich nach der Stärke der auftretenden Furcht und dem motivationalen Spannungszustand richten. In M O W R E R S Konzeption der beiden Typen der ersten und der zweiten Verstärkung spielen — wie bereits ausgeführt — Emotionen als interne Reaktionen eine wichtige Rolle. Während es sich bei der primären Verstärkung um Vitaltriebe handelt, deren energetische Beträge reduziert oder gesteigert werden, bezieht sich die Verstärkung zweiter Art auf Sekundärmotivationen, die, wie oben beschrieben, erlernt sind. Sind Emotionen wie Furcht oder Hoffnung wirksam geworden, so fungieren sie wie primäre Triebe. Sie lösen dann ein Verhalten nach dem Prinzip von trial and error aus, das seinerseits den Prinzipien der zweiten Verstärkung unterworfen ist. Im Typ I der zweiten Verstärkung geht es um Furcht und Erleichterung, in Typ II um Hoffnung und Enttäuschung. Furcht, die durch starke Triebspannung oder Schock erzeugt wird, assoziiert sich mit Reizen nach dem Prinzip der Kontiguität. Dann wirken diese Reize künftig als Gefahrensignal, das Meidungsverhalten konditional auslöst. Die Furcht als Sekundärtrieb wird reduziert, wenn passive Reaktionshemmung oder aktive Ortsmeidung dergestalt zum Erfolg führen, daß das Gefahrensignal verschwindet. Dann erfolgt Erleichterung, die als zweite Verstärkung nach Typ I bezeichnet wird. Wird jedoch mit dem Aufhören des Primärtriebes im Sinne der Kontiguität ein neutraler Reiz verknüpft, so erwirbt das Zeichen ein Hoffnungsfeedback, so daß es fortan als Sicherungszeidien eines der beiden Annäherungsverhalten auslöst. Die zweite Verstärkung nach Typ II entsteht, wenn das Sicherungszeichen durch die Annäherungssituation aufrechterhalten werden konnte. Diese Reduktion von Sekundärmotivationen bei der zweiten Verstärkung führt, ohne daß noch primäre Triebentspannung erfolgt, zu Konditionierungen, die außerordentlich stabil werden. Durch die assoziative Verknüpfung von Reizen und Emotionen nach dem Prinzip der Kontiguität, also durch Zeichenlernen, gewinnt der Organismus nach M O W R E R eine Prädisposition, eine Erwartungseinstellung, eine hypothetische Orientierung gegenüber der kommenden Situation, da die Reize in ihrer konditionierten Form als Vorstellungen und Erinnerungen die trial-and-error-Reaktion auf sozusagen servomechanischem Wege in angepaßte Bahnen lenken. Die Reaktion auf das aktuelle Mangelerlebnis ist also bereits vorbereitet, da das Zeichen, zu dem Furcht assoziiert wurde, die Zunahme der Triebspannung bzw.

D i e Z w e i - F a k t o r e n - T h e o r i e des L e r n e n s

133

Frustration ankündigt. Wenn weiter oben gesagt wurde, daß MOWRER sowohl das Bedingungslernen als auch das Lösungslernen in einer unitären Lerntheorie vereinigen wollte, so zeigte sich in den letzten Abschnitten, daß sein Modell alles Lernen als Zeichenlernen (nach einem der beiden Typen der zweiten Verstärkung) ansieht; damit ist das Lernen am Erfolg dem Lernen durch Konditionierung eindeutig untergeordnet. Obwohl sich hier eine gewisse Umstrukturierung der MowERschen Theorie andeutet, wird sie nach wie vor als ZweiFaktoren-Theorie bezeichnet, womit auf die entweder abnehmende oder zunehmende Verstärkung durch motivationale Spannungszustände bezug genommen wird. Wie wir gesehen haben, hat sich MOWRER vor allem mit den Bedingungen und Möglichkeiten des Zeichenlernens beschäftigt. Dabei ist er auch auf den Zeichenverkehr zwischen mehreren Organismen eingegangen. Diesen Zeichenverkehr, der einen bedeutsamen Spezialfall des Lernens voraussetzt, nennen wir Kommunikation. MOWRERS Theorie symbolischer Prozesse innerhalb der Kommunikation bezieht sich auf jene Prozesse, über die ein Organismus durch Sprache zu langfristigen Verhaltensänderungen veranlaßt wird. Dabei ist Sprache als ein System von Zeichen und Symbolen"') zu verstehen, die sinnlich wahrnehmbar, meist gesprochen oder geschrieben, von einem Kommunikator (Sender) zu einem Kommunikanten (Empfänger) übermittelt werden. MOWRER interessiert sich weiterhin für die Funktionen, die der Motivation in diesem Prozeß zukommen. Das Symbol sieht er, wie noch zu erläutern sein wird, als eine spezielle Art von Zeichen**) an. Zu der von THORNDIKE, BLOOMFIELD und vielen anderen vertretenen Auffassung, daß die wesentliche Aufgabe der Sprache die Erzielung von Verhaltensänderungen sei, fügt MOWRER den u. a. von SUSANNE K. LANGNER vertretenen Teilaspekt hinzu, daß die Übermittlung von Sprache nicht nur das Verhalten, sondern auch innere Reaktion und emotionelle Haltung ändert. Diese beiden Auffassungen von Sprache vereinigt MOWRER zu einer umfassenderen Konzeption, nach der innere, durch Wortbildung ausgelöste Reaktionen zunächst als subjektiv bedeutsam gelernt werden, aber nur dann gefestigt werden, wenn sie sich als nützlich erweisen. In der Terminologie der Zwei-Faktoren-Theorie lautet diese Konzeption folgendermaßen: Habits, die Wortproduktionen veranlassen, werden dadurch erworben, daß die inneren, durch Sprechen ausgelösten Reize den Prozeß der zweiten Verstärkung auslösen. Sobald sich diese Habits dann als zweckmäßig erweisen, werden sie durch die erste Verstärkung endgültig stabilisiert. *) MORRIS, C. V7.: Signs, language, and behavior, N . Y. (1946). **) MOVRER, O. H . : The psychologist looks at language, Am. Scient. (1954).

134

D i e Zwei-Faktoren-Theorie des Lernens

Das Kriterium für den Effekt der Kommunikation ist die Änderung des Verhaltens gegenüber denjenigen Geschehnissen, Personen oder Sachen, die in dem Kommunique durch Sprache bezeichnet wurden. An diesem — den älteren Theorien über Nutzen und Bedeutung der Sprache entlehnten — Kriterium vermißt MOWRER die Behandlung der Frage, über welche Mechanismen dieser Erfolg der Sprachverwendung eintritt. Er entwickelte eine Theorie über die Funktion von Sprache, die sich etwas an die Auffassung von P E I , GRIFFITH und URBAN anlehnt. Nach diesen Autoren werden (im Gegensatz zu der konventionellen Ansicht, daß Zeichen übertragen werden) Bedeutungen vom Sender zum Empfänger übermittelt. MOWRER nennt einen grammatischen Satz einen Zwei-Zeichen-Komplex und formuliert von daher, daß in der Kommunikation weniger einfache Bedeutungen von Person zu Person übertragen werden, sondern daß die Bedeutungsübertragung vielmehr von einem Zeichen, das der Kommunikator in bestimmter Weise abgibt, zu einem anderen Zeichen erfolgt. Die erfolgreiche Kommunikation setzt demgemäß voraus, daß bedeutungshaltige Zeichen verwendet werden sowohl auf der Seite des Kommunikators als auch des Kommunikanten — optimal wird dieser Zeichenverkehr, wenn die beiden Systeme gleiche Bedeutungen konventionalisiert haben*). Damit gewinnt die Kommunikation ihre Wichtigkeit durch die Kombination, Zuordnung oder Verknüpfung von durch Zeichen bezeichneten Bedeutungen in neuer und informativer Weise. Die beim Empfänger erregten Bedeutungen werden durch den Zwei-Zeichen-Komplex, den wir Satz nennen, in konditionaler Weise verknüpft. MOWRER erhebt also gemäß seiner Theorie des Zeichenlernens die Konditionierung zur Grundlage des Funktionierens von Sprache. Bei dieser Analyse der Sprachfunktion hat aber die Tatsache noch keine hinreichende Beachtung gefunden, daß der Kommunikant nach dem Verstehen eines Satzes auf die realen Gegenstände, deren Zeichen in diesem Satz vorkamen, so reagiert oder zu reagieren bereit ist, als seien sie die Zeichen selbst. Diese Erscheinung wird durch einen „mediating response", eine „vermittelnde Reaktion", bewirkt, die eine innere Antwort darstellt: Die Zeichen erwerben ihre Bedeutung zunächst auf konditionaler Grundlage durch Kontiguität und gewinnen damit die Kapazität, einen Teil der Gesamtreaktionen hervorzurufen, mit der der Organismus auf den Gegenstand selbst reagiert. (Vgl. „S r :s R" statt nur „S R"!) Bei dieser Zuordnung von Zeichen und realen Dingen handelt es sich um eine Konditionierung ersten Grades, die so stabil ist, daß sie beim *) Vgl. hierzu jedoch den modernen Aspekt der Sprache als ein Ausdrucksfeld für Mitteilung und Aufnahme von gedanklichen Konzepten, nachdem ein „Tutor" und ein „Player" (Spieler) das gemeinsame Konzept aufbauen und testen. [R. BRO\PN: „Words and things", N . Y. (1958).]

Die Zwei-Faktoren-Theorie des Lernens

135

Auftreten eines Satzes, der dieses Zeichen mit einem anderen neuen Zeichen verknüpft, nicht erlischt. Wird diese erstrangig konditionierte Bedeutung durch eine zweitrangige ersetzt, so wird die neue Bedeutung als Synonym für die ursprüngliche eingesetzt. Mit dieser Erklärung hat die Sprachverwendung aber noch nicht den Effekt der Verhaltensänderung begründet. Es handelt sich also nicht um eine Neukonditionierung, sondern darüber hinaus um eine Vermittlung von Reaktionshinweisen. Die ursprünglich mit dem Zeichen auftretende Reaktion auf die Bedeutung des Zeichens hin ist — wie wir gesehen haben — ein Teil der Gesamtreaktion, die als Reaktion auf den realen Gegenstand vom Organismus zu erwarten ist. Ein ursprüngliches Reaktionskonzept, das mit der Zeichenrezeption aktualisiert wird, richtet sich in seiner Reproduktion bevorzugt auf eben jenen Gegenstand oder auf die Situation, denen gegenüber die Konditionierung erfolgte. Die ursprüngliche Zeichenreaktion, die beim konditionierenden Erwerb einer neuen Bedeutung nicht erlischt, hat die Tendenz, auf eben jene reale Sache zurückzuwandern, zu der sie ursprünglich erworben wurde. Bei der Verknüpfung des Zeichens mit einer neuen Bedeutung, befördert die erst erworbene Zeichenreaktion bei ihrer Rückwanderung zum Realgegenstand sozusagen als Vehikulum audi die neue Bedeutung, so daß sie als Vermittlerin zwischen dem realen Ding und der neuen Bedeutung wirksam wird. Dieser Vorgang wurde 1953 von C A R P E N T E R erkannt und als „mediating-response" bezeichnet. Eine andere Bezeichnung für diesen „Bedeutungstransfer von Zeichen und Dingen" ist der Terminus der „semantischen Generalisation". Einerseits aus der erstrangigen konditionalen Verknüpfung mit der realen Sache und andererseits aus der zweitrangigen konditionalen Verknüpfung des Zeichens mit der neuen Bedeutung gewinnt die interne vermittelnde Reaktion die Funktion und Kapazität einer Verhaltensmodifizierenden. Um diese Theorie der Sprachfunktionen experimentell zu belegen, führte M O W R E R eine Reihe von Versuchen durch, die in ihrer systematischen Ordnung als Paradigma für das Verständnis der Funktion von Sätzen als Zwei-Zeichen-Komplexen gelten können. Als Versuchstiere benutzte M O W R E R Ratten, als reale Dinge einerseits Käse und andererseits einen elektrischen Schlag, als Zeichen für Käse ein Blinklicht, als Zeichen für Stromstoß einen Brummton. In diesen Experimenten wird gezeigt, wie Ratten auf vier verschiedenen Wegen lernen, Käse zu meiden, der sonst sehr von ihnen geschätzt wird. Diese Verhaltensänderung wird durch die Kommunikation von vier Satztypen errreicht; jedoch erst jeder vierter dieser Sätze kann als Sprache im engeren Sinne angesehen werden: 1. Herstellung des Ding-Ding-Satzes durdi Kombination der realen Dinge Futter und Schock.

136

Die Zwei-Faktoren-Theorie des Lernens

Käse

Re —

R

Schock jQse

Gesamtreaktion auf Futter

e

rB

R a Gesamtreaktion auf Schock

Rs

r8

interne, ablösbare Furchtkomponente der Schockgesamtreaktion

j8

t!

Die innere Furchtkomponente wird zum Futter konditioniert und löst aktives Vermeidungsverhalten aus. 2. Herstellung des Ding-Zeichen-Satzes durch Kombination von Futter-Schodk-Ton. Käse

Re Ton

Käse

^ rs

Zuvor muß die konditioneile Verbindung Schock Ton hergestellt werden.

Re

t

r3

I

3. Herstellung des Zeichen-Ding-Satzes durch die Kombination des Futtersignals (Blinklicht) und Schock. r

o

Schock bl. L.

4" r,

r s -Reaktion auf den Ton hin neigt zur Verhinderung der Freßreaktion

Rs re

r8

t I 4. Herstellung des Zeichen-Zeichen-Satzes durch Kombination von Futterzeidien (Blinklicht) und Schockzeichen (Brummton). r

kl'

e

^ rs

Ton bl. L.

re

rB

t

I

Das Blinklidit hat zuvor konditional Zeichenwert für Futter erworben.

In diesen vier Versuchsanordnungen, die je einen Satztyp darstellen, wird dem Versuchstier die Nachricht vermittelt, daß Käse gefährlich ist, da er Schmerz verursacht, wenn er gefressen wird. Im vierten Satz wird diese Information in Abwesenheit der realen Sachen vermittelt, das Versuchstier wird durch einen Zwei-Zeichen-Komplex zu der künftigen Verhaltensänderung in bezug auf Käse veranlaßt. Es hat also mit Hilfe einer rein sprachlich konstruierten Zeichenaussage Lernen stattgefunden. Deshalb sieht M O W R E R einen „Satz" prinzipiell als Mittel zur Herstellung von Konditionierung an, die grundsätzlich die „vermittelnde Reaktion" (mediating-response) enthalten. Wenn Tiere Zeichen-Zeichen-Sätze „verstehen" können, indem sie zu einer Verhaltensänderung gegenüber den bezeichneten Gegenständen veranlaßt werden, so ist zu fragen, weshalb sie dennoch keine Sprache entwickelt haben. Diese Frage führt uns auf die Unterschiede in

Die Zwei-Faktoren-Theorie des Lernens

137

den motivationalen Vorgängen bei Mensch und Tier. Im Gegensatz zum Menschen ist das Tier in seinem Verhalten und damit auch in seiner Lernkapazität weitgehend durch seine Instinkte determiniert; es kann seinen dispositionell festgelegten Betrag an Vitalmotivationen kaum vergrößern. Da aber ein Organismus nur für motivational bedeutsame Dinge, Geschehnisse oder Personen, Zeichen zu lernen vermag, folgt für Tiere mit ihrem geringeren Motivationsbetrag auch ein geringerer Betrag an lernbaren Zeichen. Menschen dagegen erwerben im Verlauf ihrer Entwicklung eine Fülle von Strebungen und Antrieben, die — da Menschen wegen ihrer Instinktarmut auf Lernen angewiesen sind — den weitaus überwiegenden Teil ihrer Gesamtmotivationen darstellen. Da also Menschen weit mehr Motive als Tiere besitzen, können sie auch einer größeren Zahl von realen Dingen Zeichen zuordnen, nämlich allen denen, die zu ihren mannigfaltigen Motivationen in Beziehung stehen. Außerdem sind Menschen im Gegensatz zu Tieren in der Lage, eine im Augenblick nicht reduzierbare Motivspannung zurückzustellen, sie aber gleichzeitig so weit wirksam zu erhalten, daß sie wieder mobilisiert werden kann, wenn sich eine Umweltkonstellation ergibt, die die Spannungsreduktion ermöglicht. Die Zahl der in dieser Weise zurückgestellten Motive wächst mit der Reifung des Menschen. In reiferem Zustand kann eine größere Zahl von Motiven zurückgestellt werden, so daß auch ein größeres Arsenal von reaktivierbaren Spannungen zur Verfügung steht. Tiere sind aber jeweils nur auf einen Trieb gerichtet und können immer nur eine Spannung (bis zu ihrer Reduktion) aktiv erhalten. N u r in motiviertem Zustand „verstehen" sie Zeichen, und zwar nur die Zeichen, die in den Kontext der motivationalen Spannungssituation passen; mit Beendigung des Spannungszustandes (z. B. sobald das Tier satt ist) verliert das Zeichen seine Bedeutung für das Tier, denn es kommt ihm kein unmittelbares Interesse mehr zu, und das Zeichenverständnis hört auf. Das Verständnis von Zeichen und Symbolen ist also von der ständig aktuellen oder unterschwelligen multiplen Motiviertheit der Menschen durch Vitalbedürfnisse, Antriebe oder Strebungen abhängig. Auch die Differenzierung zwischen Zeichen und Symbolen wird erst durch die Berücksichtigung der dahinterstehenden Motivation möglich. Bei starker Bedürfnisspannung ist ein Wort („Hilfe!" oder „Wasser!") ein Zeichen, ohne diese Spannung ist es ein Symbol („Er bot Hilfe an." oder „Dort fließt Wasser."). Das Symbol kann also als abstrahiertes Zeichen beschrieben werden. Diese Abstraktion können nur Menschen mit ihrer andersartigen motivationalen Struktur vollziehen, und erst mit der vielfältigen, neuartigen und informativen Verwendbarkeit dieser abstrahierten Symbole kann der Schritt von der subjektiven, durch Motivspannungen gesteuerten Zeichenverwendung zum freien sprachlichen Gebrauch der Symbole vollzogen

138

Die Zwei-Faktoren-Theorie des Lernens

werden, den wir bei nidit-mensdilichen Verhaltenssystemen vergeblich suchen. Auch Tiere können differenzierte Informationen weitergeben. Bienen z.B. können durch tanzartige Bewegungszeichen aussagen: „ . . . b e findet sich da und dort", jedoch müssen sie als Satzgegenstand die entdeckte Beute (Pollenstaub an den Hinterbeinen) vorweisen; da sie das reale Objekt nicht beschreiben können. Den Tieren fehlt die „Substantiv-Idee", sie haben keine Symbole, keine abstrahierten Zeichen für die Gegenstände. Die „Substantiv-Idee" ist jedoch nach M O W R E R nicht das einzige, was für das Entstehen einer satzgerechten Sprache verantwortlich ist, mit deren Hilfe kommunikatives Lernen möglich ist. Vielmehr ist Sprache von zwei Bedingungen abhängig, die ausschließlich beim Menschen vorliegen: 1. Bestimmte neurologische Konstellationen der evolutionären Entwicklung des Menschen (z. B. Sprachzentren im Gehirn) machen es möglich, zu einem motivationalen Spannungsgefüge oder zu einer Interessenkombination gehörige Wortzeichen zu produzieren (zu äußern oder aufzuschreiben), selbst wenn gleichzeitig andere Motivationen, Wünsche, Bedürfnisse oder Interessen wirksam sind. 2. Ein gewisser Grad an sozialer Entwicklung mit dem dazugehörigen Normendruck bereitet die spätere Vielfalt motivationaler Konstellationen und ihre wahlweise Aktivierbarkeit vor. Erst dieses subtile Zusammenwirken neurologischer Evolution und gesellschaftlicher Entwicklung dürfte die Bedingungen für den Aufbau der symbolischen Haltung vorbereitet haben, die ihrerseits die Grundlage für eine voll artikulierte freie Sprache ist. Das Phänomen der Sprache ist nicht nur hinsichtlich ihrer Leistungsfähigkeit ein bemerkenswertes Phänomen, sondern auch hinsichtlich der Unwahrscheinlichkeit ihres Auftretens. Zusammenfassend ist darauf hinzuweisen, daß der Versuch M O W R E R S zur Konstituierung einer Zwei-Faktorentheorie des Lernens wenig Resonanz gefunden hat und die Reduktion der Gefühle auf vier Grundvorkommnisse als nicht haltbar erwiesen ist. Nicht zuletzt ist auch der eklektische Charakter seiner theoretischen Bemühungen durch eine vortheoretische Bindung an kulturelle Normsysteme seiner Heimat bestimmt. Dies kennzeichnet auch seine Hypothesen zur Genese von Fehlverhaltensweisen. M O W R E R erblickt in der Neurose eine Fehlkonditionierung. Im Gegensatz zur psychoanalytischen Auffassung entspricht seiner Konzeption, daß das „Ich" von „Es" bestimmt ist. Neurotische Konflikte zwsichen „Es" und „Uber-Ich" würden nicht durch Verdrängung der „Es"-Tendenzen, sondern vielmehr durch Verdrängung der „Über-Ich"-Strebungen gelöst. In dieser Sicht wird die Neurose nicht zu einem Problem verdrängter Triebansprüche, sondern zu

Die Zwei-Faktoren-Theorie des Lernens

139

einem der verstoßenen Ideale. D a Neurosen also aus einem Konflikt mit Sozialnormen und Tabus entstehen, muß das Ziel der Therapie erworbener Fehlanpassungen nach MOWRER darin bestehen, die auf Grund der Fehlkonditionierung zustande gekommene Unfähigkeit zur Lösung problematischer Situationen dadurch zu beheben, daß integrative und sozial akzeptable Lösungsmethoden und Techniken für solche (chronischen und aktuellen) Konflikte gefunden und gelernt werden. Praktische Konsequenzen der MowRERschen Lernkonzeption sind zunächst in der Behandlung von kindlichen, chronischen Bettnässern bekannt (1938)*), die eine Konditionierung von Nässen mit Wecker-Uhrklingeln zur Grundlage hatte. In der praktischen Sdiultätigkeit hat sich MOWRERS dualistisches Konzept des Lernens eigentlich weder in der Darreichung von Lernstoff noch als Verhaltensanweisung für Lehrpersonen niedergeschlagen. Vielmehr ist er Anreger für Nachvollzug seiner Vermeidungsexperimente geworden, die etwa f ü r den Ausbau der Mediating-Theorie OSGOODS wichtig geworden sind. Im letzten Jahrzehnt ist mit der Verhaltenstherapie ein wichtiger Schritt in der praktischen Anwendung von lernpsychologischen Ergebnissen vollzogen worden. Grundannahme ist dabei, daß jedes Fehlverhalten gelernt worden ist und die Korrektur der Verhaltensstörung ebenso den Lerngesetzen folge. Eine einmal konditionierte Angst ist demgemäß mit einem „Konterkonditioning" zu korrigieren, das nach dem Prinzip der reziproken Hemmung verläuft. Dies Prinzip ist so formuliert worden: Wenn es gelingt, eine aus Angst gehemmte Reaktion in Gegenwart des angsterzeugenden Reizes hervorzurufen, dann wird sich das Band zwischen diesem Reiz und der Angst lockern**). Vorzugsweise wird Entspannung, evtl. mit Psychopharmaka, als solche Reaktionen begünstigend angesehen (Relaxationstherapie). D i e „Positive Rekonditionierung" dagegen oder „Operantes Bedingen" macht sich die lernpsychologische Tatsache zunutze, daß Fehlverhalten ersetzt werden kann durch ein Neuverhalten, also einen spontan ausgegebenen und belohnten Response (SKINNER). Eine weitere verhaltenstherapeutische Methode nutzt uuter der Bezeichnung „Systematische Desentisierung" ein lernexperimentelles Vorgehen aus, bei dem die ehemals gelernte, nun störende Vermeidungsreaktion Schritt für Schritt in ständig neuen, aber der ursprünglichen Traumasituation immer ähnlicheren Umständen für den Menschen uninteressanter wird, er ist gewissermaßen „ge*) MOWER, O. H., & W. M. MOTRER: Enuresis—a method for its study and treatment, Amer. Journ. Orthopsychiat. 28, 436 (1938). **) WOLFE, I., & A. A. LAZARUSS: „Behavior therapy techniques", S. 12, Braunschweig (1966).

140

Die Zwei-Faktoren-Theorie des Lernens

fühllos" geworden gegenüber den das Fehlverhalten auslösenden Reizen und Bedingungen*). Einen theoretisch wie praktisch bedeutenden Einfluß hat die behavioristische Lernpsychologie auf die Technik der Meinungs- und Einstellungsänderungen genommen. Vor allem die Reinforcement (Verstärkungs-)theorie schlägt sidi nieder in den sozialpsychologischen Arbeiten von H O V L A N D , J A N I S und KELLY**), die die Belohnung eines sozial erwünschten Verhaltens zu seiner Verstärkung einsetzten. Ähnliche Verstärkungsmethoden des Lernens nutzt M C G U I R E für seine „Inokulations"-Technik, bei der es darum geht, Menschen in ihrer Meinung und Einstellung zu stützen und gegen Gegenmeinungen zu immunisieren.

*) WALTON, D., & M. D . MATHER: „The application of learning principles t o the treatment of obsessive-compulsive states." Behav. Res. Ther. 1, 163 (1963). **) HOVLAND, C., J. JANIS & H. KELLEY: „Communication and Persuasion." N e w H a v e n (1953).

15. Lernen als Veränderung der Verhältniswahrscheinlichkeit von Reizauswahl und Reaktionsausgabe BUSH*) 8C MOSTELLER**) haben unter Anwendung statistischer Methoden mathematische Modelle für die Datenanalyse von Lernexperimenten entwickelt. Sie gehen davon aus, daß sich Lernen adäquat nur nach stochastischen Gesetzen beschreiben läßt. Das mathematische Lernmodell von BUSH und MOSTELLER enthält drei strukturelle Stufen:

1. Das mathematische System, 2. die Identifikation, d. h. die koordinierenden Definitionen sowie 3. die spezifischen Applikationen (Anwendungen).

Im mathematischen Modell werden nicht Sachverhalte der Realität, experimentelle Daten, empirische Quantitäten oder ähnliche Variable diskutiert. Diese Elemente des Systems werden nicht operational definiert, da sie abstrakte Begriffe darstellen***). Dennoch läßt sich ein mathematisches System durchaus als Grundlage für ein Modell benutzen, mit dessen Hilfe empirische Daten zu analysieren sind. Das hierfür vorgeschlagene mathematische System wird auf Klassen von Reaktionen und Ereignissen angewandt. BUSH und MOSTELLER fassen dabei die Vielfalt beobachteter Verhaltensweisen als statistische Erscheinung auf. Die ihnen zugrunde liegenden Reaktionstendenzen werden als Reihen von Wahrscheinlidikeitsvariablen interpretiert. Hierzu werden bestimmte mathematische Operatoren eingeführt, die mit eben den Ereignissen korrespondieren, die im Verlauf eines Lernprozesses das Antwortverhalten modifizieren. Die zweite Stufe des vorgeschlagenen mathematischen Lernmodells betrifft die Festlegung genereller Übereinstimmung zwischen den Elementen des mathematischen Systems und den empirischen Sachverhalten der Realität, also den Beobachtungsdaten, Meßreihen usw. Die Funktionen des mathematischen Systems müssen den Verhaltensweisen des lernenden Organismus so zugeordnet werden, daß die *) ROBERT R. BUSH lehrte bis 1951 Physik an der Princeton University; dort war er an der Konstruktion des „Princeton Cyclotrons" beteiligt. Z. Zt. ist er Assistant Professor of Social Relations an der H a r v a r d University. **) FREDERIK MOSTELLER lehrte bis 1946 an der Princeton University und arbeitete dort in einem Meinungsforsdiungsinstitut mit. Z. Zt. ist er Professor of Mathematical Statistics an der H a r v a r d University. ***) BESSER: Hypothetisdie Konstruktionen mit Vorhersagewert im Sinne der intervenierenden Variablen.

142

Lernen als Veränderung der Verhältnis Wahrscheinlichkeit

Ereignisse im System den theorierelevanten Ereignissen der Realität entsprechen. Im speziellen Fall handelt es sich darum, Reaktionstendenzen des Organismus durch Reihen von Wahrscheinlichkeitsvariablen darzustellen. Diese Zuordnungen und Identifikationen bilden die zweite der drei Grundlagen mathematischer Lernmodelle. Die dritte strukturelle Stufe im Aufbau eines stochastischen Lernmodells liegt in der Anwendung auf die Realität. Ein allgemeines (logisch-mathematisches) Modell ist hierzu in die Form von „spezifischen Lernmodellen" zu transformieren. Aus dem allgemeinen Modell können in dieser Weise zahlreiche spezifische Modelle extrahiert werden. Das von BUSH und MOSTELLER entwickelte Modell läßt sich z. B. zur Beschreibung mechanischen Lernens, zur Übung von Fehlervermeidung (avoidance training) ebenso aber zur Analyse von Risiko-Wahlsituationen (choice situations with risk) anwenden. Die in der zweiten Stufe erwähnte Identifikation von Systemelementen mit empirischen Variablen ist natürlich noch kein Kriterium für die Korrektheit und Leistungsfähigkeit des Modells. Jedoch ist es ein Vorteil formalisierter Modelle, daß nach Klärung bzw. Festlegung der Identifikationen von Modellelementen und empirischen Beobachtungen in einer spezifischen Situation sehr einfach zu prüfen ist, was das Modell zu leisten vermag. Korrekt kann es nur sein, wenn die Voraussage den nachfolgend erhobenen empirischen Daten entspricht. Dies gilt zunächst für das spezifische Modell. Das allgemeine Modell kann gegebenenfalls trotz Nichtbewährung in einer konkreten Situation verwendbar sein. Mangelhafte Übereinstimmung der empirischen Daten mit der Vorhersage beweist nur die Inkorrektheit des spezifischen Modells und/oder der versuchten Identifikationen. Die Richtigkeit im Aufbau des mathematischen Systems und vor allem die Richtigkeit der Identifikationsannahmen erweisen sich, indem ähnliche Identifikationen für unterschiedliche Situationen gewählt werden und dabei gute Resultate — genauer: bestätigte Vorhersagen — zustande kommen. Es muß also keineswegs das gewählte mathematische System selbst sein, das zu Fehlprognosen führte; vielmehr kann dasselbe System mit besseren Identifikationen zu guter Übereinstimmung zwischen Vorhersage und beobachteten Ergebnissen verhelfen. Daß zum Aufbau eines leistungsfähigen theoretischen Modells des Lernens die Form des mathematischen Systems nicht verwendbar sei, bleibt unbeweisbar. N u r eine größere Anzahl von Fehlprognosen mit immer wieder neuen Zuordnungen und Identifikationen könnte die Ungeeignetheit eines jeweils bestimmten mathematischen Systems erweisen. Grundsätzlich aber kann der Weg von einem mathematischen System zu vielen konkreten Lernmodellen führen. Dabei werden grundsätzlich nur die Modelle selbst — nicht aber der Formalismus — als brauchbar oder unbrauchbar erwiesen.

Lernen als Veränderung der Verhältniswahrsdieinlidikeit

143

Bislang pflegte man die experimentellen Daten aus Lernversuchen durch die einfachsten statistischen Techniken zu analysieren. Vielfach reicht zur Demonstration empirischer Sachverhalte tatsächlich bereits die anschauliche graphische Darstellung aus. Auch der Gruppenvergleich mit Chi-Quadrat oder t-Test ist kein besonders anspruchsvolles statistisches Verfahren. Jedoch gibt es zur Zeit noch keine Techniken zur hinreichend genauen Berücksichtigung der speziellen Probleme bei der Verarbeitung jener Daten, die in psychologischen Lernexperimenten anfallen. Eine der Schwierigkeiten gerade einer quantifizierenden Lernforsdiung liegt darin, daß ein Lernprozeß unwiederholbar ist, da die im Lernen sich vollziehenden Verhaltensänderungen nicht ohne weiteres aufgehoben werden können. Organismen, die am Beginn eines Experimentes als praktisch hinreichend „identisch" angesehen werden können, zeigen im Verlauf des Experimentes unterschiedliche Verhaltensänderungen, sie bleiben also nicht identisch. Die üblichen statistischen Standardmethoden müssen deshalb modifiziert werden. Das spezifische mathematische Modell von BUSH und MOSTELLER ermöglicht nun eine dergestalt exaktere statistische Datenanalyse. Dabei handelt es sich um ein vergleichsweise einfaches stochastisches*) Modell. Die hypothetischen Modellvariablen wurden dann „identifiziert", d . h . hier: experimentell ermittelten empirischen Befunden in geeigneter Weise zugeordnet. Auf diesem Wege entsteht ein mathematisches Lernmodell, das mehr empirischen Gehalt aufweist, als ein pseudoinformatives Kalkülmodell. Nach BUSH und MOSTELLER ist jede Änderung im Verhalten als Lernen anzusehen, ob es sich dabei um Anpassung, um zielgerichtetes Zweckverhalten oder um eine Übereinstimmung mit ähnlichen Kriterien handelt. Der Lernerfolg wird als „vollständig" angesehen, wenn die Verhaltensänderung einen definierten Stabilitätsgrad erreicht hat (Gleichförmigkeit ist dabei in dieser Definition nicht gefordert). Obwohl das dargestellte Modell dies nicht unabdingbar fordert, gehen BUSH und MOSTELLER von der Hypothese aus, daß Lernen sich nach Wahrscheinlichkeitsgesetzen vollzieht. Dabei ist unerheblich, ob das Verhalten selbst stochastischer oder deterministischer Natur ist. Jedenfalls eignet sich das stochastische Modell zur Beschreibung der *) Zum Begriff „Stochastik" sowie zur Struktur stochastischer Verhaltensorganisationen und Geschehensordnungen (gegenüber deterministischen und agonistisdien Ablaufs- und Entscheidungsordnungen) siehe HASELOFF: „Strategie und Planung" in: Modelle f ü r eine neue Welt, Bd. I, Desch-Verlag, Mündien (1964). „Der Begriff ,stodiastisch' kommt vom Griechischen ,stodios* die Zielscheibe. Die davon abgeleiteten Wortbildungen reichen im Griechischen vom Zielen bis zum Mutmaßen. BERNOULLI übernahm (1713) diesen Begriff in seine ,ars conjectandi'. Erst 1917 wurde Stochastik' erneut durch BORTKIETPICZ bekannt gemacht, der mit diesem Begriff die Anwendung der Wahrscheinlichkeitstheorie auf empirische Vielheiten definierte."

144

Lernen als Veränderung der Verhältnis-Wahrscheinlichkeit

Ergebnisse von Lernexperimenten durchaus, wie das folgende Beispiel zeigen soll: In einem T-förmigen Labyrinth (wie es schon von B R U N S W I C K und S T A N L Y , aber auch ähnlich in Y-Form von M O T R E R sowie von anderen Lernforschern benutzt wurde), wird eine Ratte trainiert, ausschließlich in einem Arm des Labyrinths nach Futter zu suchen. Die Versuchsleiter beobachten, welchen Weg das Tier bei den einzelnen Versuchen einschlägt. Es werden also die Sequenzen der von der Ratte gefällten (Rechts- oder Links-) Entscheidungen beobachtet und registriert. Zur Konstruktion eines funktions-, d. h. vorhersagefähigen Lernmodells müssen eine Anzahl von Abstraktionen vorgenommen werden: Da die Ratte sich bei jedem Versudi für links oder rechts zu entscheiden genötigt ist, besteht die Wahrscheinlichkeit p n , daß die Ratte sich bei Versuch n nach rechts wendet. H a t die Ratte keine anfängliche Positionspräferenz, ist die Entscheidungschance für den ersten Versuch 0,5 (p x = 0,5). Bei den folgenden Versuchen wächst dann die Wahrscheinlichkeit, daß sich die Ratte dem Futter zuwendet, bis sie — nach einer hinreichend großen Anzahl von Versuchen — schließlich den richtigen Weg mit Sicherheit wählt. Bei n-Versuchen liegen die Wahrscheinlichkeitswerte p n zwischen 0,5 und 1,00. Wodurch wird nun p n veranlaßt, von 0,5 (für n = 1) auf 1,00 (für n = sehr groß) anzuwachsen? Die Zunahme der Wahrscheinlichkeit ist nach B U S H und M O S T E L L E R eine Folge der (funktionellen) Veränderung im Gehirn des Versuchstieres. Beim ersten Versuch läuft die Ratte nach rechts und findet Futter oder sie läuft nach links und findet kein Futter. Läuft sie beim ersten Versuch nach rechts, so müßte das Futter als Belohnung (reinforcement) die Wahrscheinlichkeit erhöhen, daß die Ratte sich beim zweiten Versuch wieder nach redits wendet, d. h. p 2 größer als 0,5. Wenn die Ratte dagegen beim ersten Versuch in den linken Labyrintharm läuft, wo sie kein Futter findet, dürfte sich die Wahrscheinlichkeit verringern, daß sie beim zweiten Versuch wiederum nadi links läuft (negatives reinforcement). Also muß auch in diesem Falle die Wahrscheinlichkeit für ein richtiges Verhalten p 2 größer als 0,5 sein*). Wird im Interesse der Vereinfachung angenommen, daß der Zuwachs an Wahrscheinlichkeit jeweils ein bestimmter Bruchteil der maximal *) Hier wird deutlich, daß der Forschungsansatz von BUSH & MOSTELLER auf ein formales Kalkülmodell mit Vorhersageeigenschaften hinausläuft, wie sie in den Wirtschaftswissenschaften, beispielsweise von LEONTIEFF, schon vor längerer Zeit entwickelt worden sind. Das formale Modell von BUSH SC MOSTELLER ist kausalhypothetisch vorrangig durch die HuLLsche Lerntheorie bestimmt. Der Charakter des Modells würde es jedoch auch gestatten, andere inhaltliche Theoreme von Lernforschern aufzunehmen. Zur allgemeinen Problematik solcher „pseudoinformativer Kalkülmodelle" siehe HASELOFF: „Ober Logik und Technik der Entscheidungsplanung". In: Modelle für eine neue Welt, Bd. III, Desch-Verlag, München (1964).

Lernen als Veränderung der Verhältniswahrsdieinlichkeit

145

möglichen Zunahme sei, und wählen wir als diesen Bruchteil ein Zehntel: Dann beträgt die maximale Zunahme im zweiten Experiment p 2 = 0,5 + (l,0 —0,5) : 10 = 0,55. (Der Effekt der Belohnung auf der einen Seite soll zur didaktischen Vereinfadiung ebenso groß sein wie der Effekt der Niditbelohnung auf der anderen Seite.) Bei jedem Versuch ist dann zur Wahrscheinlichkeit p n ein Zehntel des Wertes 1 — p n hinzuzuaddieren.So erhält man p n + 1 . Damit ist p 3 =0,55 + (1,0 — 0,55) : 10 = 0,595. In dieser Weise lassen sich die hypothetischen Wahrscheinlichkeiten für beliebig viele Versuche vorweg errechnen. Die folgende Tabelle enthält einige Wahrscheinlichkeiten p n aus den ersten zwanzig Versuchen im Beispiel des T-Labyrinths:

Versudisnummern 1 2 3 4 6 8 10

Wahrscheinlichkeit 0,5 0,55 0,595 0,6355 0,7048 . 0,7609 . . 0,8063 . . .

Versudisnummern 11 12 13 15 16 18 20

Wahrscheinlichkeit p n 0,8257... 0,8431 . . . 0,8588... 0,8856 . . . 0,8971 . . . 0,9166 . . . 0,9325 . . .

Es gilt nun, dieses durch eine Reihe von Vorannahmen bestimmte Modell empirisch zu überprüfen. Zeigen die Verhaltensweisen einer hinreichend großen Zahl von Versuchstieren in einer hinreichend großen Zahl von Versuchen die (innerhalb der systemadäquaten Fehlergrenzen) prognostizierten Daten, so darf das gewählte Modell als empirisch bestätigt angesehen werden. Durch empirische Überprüfung der hier exemplifizierten Werte würden wir höchstwahrscheinlich zu einer Falsifikation des Modells gelangen. Dies dürfte vor allem an der willkürlichen Addition von je einem Zehntel von 1 — p n zu p n für jeden weiteren Teil versuch liegen. Dieser Wert fungiert hier gewissermaßen als mathematisches Äquivalent des Lerntempos; das tatsächliche Lerntempo von Ratten wird vermutlich ganz anders sein. Auch das Stetigkeitspostulat, daß nämlich pro Zeiteinheit unter gleichen Bedingungen um die gleichen Beträge hinzugelernt ist, bedarf der experimentellen Prüfung. Es ist aber möglich, alle Variablen des Modells so lange zu korrigieren, bis die experimentellen Beobachtungen mit den aus dem Modell gemäß der Eingangsdaten prognostizierten Befunden korrespondieren. Jedoch ist dieser „trial-and-error"-Prozeß zur empirischen Fundierung eines mathematischen Lernmodells keineswegs unumgänglich. Vielmehr läßt sich das Problem der empirischen „Aufladung" des Modells 10 Haseloff-Jorswiedc, Psydiologie

146

Lernen als Veränderung der Verhältniswahrsdieinlidikeit

algebraisch eleganter lösen: Der Zusatzwert für p n (in unserem Beispiel bisher 1—p n /10 läßt sich ohne Aussageverlust durdi die allgemeine Zahl a ausdrücken. Danach werden dann p^ p 2 . . . usw. nach a hin berechnet. Nun ist nur noch der Wert a so zu schätzen, daß er mit den bereits erhobenen experimentellen Daten korrespondiert. Es muß also der „Parameter"*) für die Daten geschätzt und anschließend die empirische Bestätigung sichergestellt werden. Ein dritter Annäherungsweg zur Präzisierung des Lernmodells entnimmt die Wahrscheinlichkeit p x für den ersten Versuch einfach den experimentellen Befunden, statt z. B. willkürlich 0,5 zu setzen. Das müßte in dem Grade zu besseren Ergebnissen führen, in dem Versuchstiere Positions- oder andere Verhaltenspräferenzen aufweisen, womit durchaus zu rechnen ist. Eine weitere Unvollständigkeit unseres Beispiels liegt in dem Postulat, daß Erfolg und Belohnung denselben Grad von Wahrscheinlichkeitsveränderung des Verhaltens hervorrufen wie die Nichtbelohnung. Für beide Seiten wären vielmehr unterschiedliche Parameter einzusetzen. Dann wird das Lernmodell allerdings recht umfänglich und unhandlich. Die Wahrscheinlichkeit p 2 wäre davon abhängig, welche Entscheidung das Versuchstier bei seinem ersten Versuch getroffen hat. Auch p 3 hängt davon ab, welchen Weg die Ratte beim ersten und dann beim zweiten Versuch eingeschlagen hat. Jeder Versuch verändert dergestalt (mittels seiner Folgen im Bereich der Bedürfnisspannung) die Wahrscheinlichkeiten für die Wahl künftiger Verhaltensweisen und Entscheidungen. Und zugleich gilt dies: Mehrere Ratten treffen eine größere Zahl verschiedener (Links- bzw. Rechts-)entscheidungen, die als empirische Daten berücksichtigt werden müssen. Dabei ergeben sich dann in den Experimenten unterschiedliche Wahrscheinlichkeiten bzw. eine Verteilung von Wahrscheinlichkeiten, die das Modell recht unanschaulich und ziemlich kompliziert werden läßt. Ungeachtet dessen aber ist das theoretische Modell zur Prognose des durch Lernen modifizierten Verhaltens durchaus geeignet. SOLOMON & WYNNE haben einen Versuch durchgeführt, in dem Hunde durch eine spezielle experimentelle Anordnung dazu veranlaßt werden, durch konditionierte Reaktionen die Meidung eines elektrischen Schlages zu lernen. Die Untersuchungsergebnisse ent*) Das Wort „Parameter" tritt in seiner gebräuchlichen statistischen Bedeutung als eine unbekannte modellexterne Quantität auf, die über eine Serie von Werten variieren kann. In der Statistik tritt der Begriff in den Zusammenhängen der Häufigkeitsverteilungen sowie in Modellen zur Beschreibung stodiastischer Ablaufsformen auf. Die zulässige Variationsbreite des Parameters definiert die beobachtete Klasse von Populationen oder Modellen.

Lernen als Veränderung der Verhältniswahrscheinlichkeit

147

halten empirische Daten über die durchschnittliche Anzahl der Versuche von der ersten Schockvermeidung, weiterhin über die durchschnittliche Anzahl der Versuche vor der zweiten Vermeidung des elektrischen Schlages sowie über die durchschnittliche Anzahl der erhaltenen Schläge während aller Versuche. Verändert man nun bestimmte experimentelle Bedingungen wie etwa die Intensität des Schlages oder das Zeitintervall zwischen Lichtsignal und Einsetzen des elektrischen Schlages, so kann durch Einsetzung dieser Parameter in das formale Modell die Reaktion bei jeder dieser Bedingungen im vorhinein errechnet werden. Das folgende Modell zeigt eine Möglichkeit der Dateninterpretation: Wenn bei jedem Versuch die Wahrscheinlichkeit q n besteht, daß der Hund einen elektrischen Schlag bekommt, und wenn der Hund im Verlauf des Experiments den elektrischen Schlag zu vermeiden lernt, dann muß mit dem Anwachsen der Zahl der Versuche n die Wahrscheinlichkeit q n geringer werden. Und zwar muß die Abnahme der Wahrscheinlichkeiten q n eine identifizierte Folge vorangegangener Erfahrungen des Versuchstieres sein. Vermeidet der Hund beim Versuch den elektrischen Schlag, so besteht die Wahrscheinlichkeit der Konstanten a • q n , daß er beim nächsten Versuch einen Schlag bekommt. Dabei muß zwischen 0 und 1 liegen, so daß a j q n kleiner als q n ist, aber ein positives Vorzeichen behält. Wenn der Hund beim Versuch n einen Schock erleidet, wird q n zur Errechnung der Wahrscheinlichkeit des Fehlverhaltens beim nächsten Versuch mit der Konstanten a 2 multipliziert. Dabei muß auch a 2 zwischen 0 und 1 liegen. So muß für jeden Versuch die Wahrscheinlichkeit des Fehlverhaltens bzw. des elektrischen Schlages entweder mit a1 oder mit a 2 multipliziert werden, damit die Wahrscheinlichkeit des Fehlverhaltens beim nächsten Versuch vorausgesagt werden kann. Die experimentellen Ergebnisse zeigen, daß praktisch jeder Hund beim ersten Versuch einen Schlag erleidet. Damit ist die Wahrscheinlichkeit des elektrischen Schlages q x gleich 1. Beim zweiten Versuch wird die Wahrscheinlichkeit des Schlages q 2 = a 2 q x = a 2 (denn qi = !)• Bekommt das Versuchstier beim zweiten Versuch einen elektrischen Schlag, so beträgt die Wahrscheinlichkeit für den dritten Versuch, gleichfalls einen Schlag zu bekommen, q 3 = a 2 q 2 = (a 2 ) 2 . Gelingt es dagegen dem Versuchstier, den elektrischen Schlag zu vermeiden, indem es das geforderte Verhalten zeigt, so ist q 3 = a 1 q 2 = a ^ . Damit wird deutlich: Soweit bekannt ist, wie oft der Hund vorher einen Schlag erlitten hat bzw. das falsche Verhalten gezeigt hat, so weit läßt sich die Wahrscheinlichkeit einer elektrischen „Bestrafung" bzw. die Wahrscheinlichkeit des Fehlverhaltens für jeden nachfolgenden Versuch berechnen. 10»

148

Lernen als Veränderung der Verhältniswahrscheinlichkeit

Dies geschieht nach der Formel: qn

= a21a1k

j

= Anzahl der vorangegangenen mit elektrischem Schlag

k

= Anzahl der vorangegangenen richtigen

Dabei ist bestraften Fehlreaktionen, Reaktionen,

also der Strafvermeidungen, und j + k = Anzahl der bisherigen Versuche.

Mit Hilfe dieser (und nur dieser!) empirischen Informationen lassen sich unterschiedliche Prognosen mit Hilfe der Parameter a 1 und a 2 berechnen. So läßt sich z . B . der Anteil der Versuchstiere ermitteln, die beim nächsten Versuch die falsche Reaktion zeigen werden. D a und a 2 als Konstanten fungieren, die beide kleiner als 1 sein müssen, tendiert dieser Anteil am Verhaltensrepertoire mit jedem •weiteren Versuch stärker nach 0 hin. Die Ergebnisse von SOLOMON & WYNNE weisen aus, daß nach einer hinreichend großen Anzahl von Trainingsläufen praktisch mit Sicherheit eine Schockvermeidung innerhalb der Erwartungswerte gelernt wird, so daß das mathematische Modell in dieser Hinsicht als verifiziert angesehen werden kann. Die Hauptschwierigkeit bei der Erreichung einer möglichst hohen Übereinstimmung zwischen empirischen Meßwerten und den aus dem Modell errechneten Prognosen liegt in der Schätzung von oij und a 2 aus den experimentellen Ergebnissen. Für den Fall unseres Beispiels mit den Hundeversuchen genügt die hier exemplifizierte Art der Schätzung vollauf. Betrachten wir zunächst die bereits erwähnte Aufstellung der durchschnittlichen Zahl von Versuchen, die notwendig war, um zu einer ersten Meidungsreaktion zu führen. Diese Statistik wird mit F t bezeichnet. F x ist ausschließlich vom Parameter a 2 abhängig, nicht dagegen von a 1 . Bevor nämlich die erste Meidung erreicht wurde, erlitt das Versuchstier bei jedem Versuch einen elektrischen Schlag. Damit beträgt die Wahrscheinlichkeit der Fehlreaktion bei jedem dieser ersten Versuche den Wert a 2 zur Potenz j, wobei j wie gesagt die Anzahl der vorangegangenen mit elektrischem Schlag bestraften Fehlreaktionen ist. Der Parameter a x wird erst nach der ersten Meidungsreaktion eingeführt. Damit erweist sich die Statistik F x als ausschließlich von a 2 abhängig. Die folgende Tabelle enthält die durchschnittliche Anzahl der Versuche F t vor der ersten (richtigen) Meidungsreaktion für verschiedene Werte von a P :

149

Lernen als Veränderung der Verhältniswahrsdieinlidikeit

«2

Fl

«2

0,82 0,84 0,86 0,88 0,89 0,90

2,88 3,07 3,29 3,56 3,73 3,91

0,92 0,94 0,96 0,98 0,99 1,00

Fi 4,39 5,08 6,23 8,84 12,52 unendlich

Aus dieser Tabelle kann die Statistik Fj^ direkt aus den empirischen Daten berechnet werden; man erhält dabei Schätzungen für a 2 . Beim Meidungslernen der Hunde betrug die durchschnittliche Anzahl der elektrisch „bestraften" Fehlreaktionen vor der ersten richtigen Reaktion F x = 4,50. Die oben auszugsweise wiedergegebene Tabelle zeigt für diesen Wert von Fj einen a 2 -Wert nahe bei 0,92. Als die durchschnittliche Gesamtzahl von Fehlreaktionen bzw. von elektrischen Bestrafungen fungiert eine Statistik, die wir im folgenden unter T 2 näher betrachten wollen. In dem hier dargestellten Modell ist die Statistik T 2 eine Funktion von cij und a 2 , weil die Daten zur Erreichung von T 2 eingesetzt sein müssen. In der folgenden Tabelle haben wir einige Werte von T 2 für verschiedene oij und a 2 zusammengestellt. Die Matrize enthält also die durchschnittliche Gesamtzahl der Fehlreaktionen bzw. elektrischen Bestrafungen T 2 für verschiedene Werte von a, und a,. a2 «1 0,75 0,78 0,81 0,84 0,87 0,90

0,90

0,92

0,94

0,96

0,98

6,11 6,57 7,13 7,83 8,75 10,00

6,70 7,23 7,86 8,66 9,71 11,16

7,51 8,12 8,87 9,81 11,05 12,77

8,73 9,47 10,39 11,55 13,10 15,27

10,98 11,99 13,24 14,85 17,02 20,12

Da T 2 direkt aus den experimentellen Ergebnissen ermittelt werden konnte und da a 2 bereits mit hinreichendem Bestätigungsgrad geschätzt wurde, kann die oben auszugsweise wiedergegebene Tabelle benutzt werden, um a t zu schätzen. Für die empirischen Daten aus dem Hunde-Experiment ergibt sich eine durchschnittliche Gesamtzahl von Fehlreaktionen bzw. elektrischen Bestrafungen T 2 = 7,80; der entsprechende a 2 -Wert ist 0,92. In der Spalte a 2 = 0,92 suchen wir nun den Wert auf, der T 2 = 7,80 am nächsten kommt; wir finden dann in der dj-Spalte den entsprechenden Wert a 1 = 0,81. Dieser Wert 0,81 entspricht der Schätzung des Parameters cij aus dem prognostischen Kalkülmodell. Der hier „didaktisch" beschriebene Schätzungsprozeß unterliegt zwar einem Stidiprobenfehler: die Verallgemeinerungsfähigkeit aber, und

150

Lernen als Veränderung der Verhältnis Wahrscheinlichkeit

damit im engeren Sinne auch die wissenschaftliche Aussagefunktion der aus formalisierten Modellen abgeleiteten Aussage hängen davon ab, daß die eingegebenen empirischen Daten gemäß den Stichprobenprinzipien der statistischen Forschungslogik erhoben worden sind*). In diesem Sinne kann als nachgewiesen angesehen werden, daß die Parameter d j und a 2 mittels des formalen Modells aus den Statistiken über die experimentellen Befunde geschätzt werden können; im Falle unseres Beispiels also aus den Statistiken F t und T 2 . Auf die naheliegende Frage, ob a t und a 2 von größerer Bedeutung sind als F 1 und T 2 , ist im Hinblick auf die Aufgaben des Modells zu sagen, daß es in der Form zweier Parameter a i und a 2 die Eigenarten der gesamten Verhaltenssequenz prüfbar vorhersagt. Ausgehend von den Schätzungen für cij und a 2 können zahlreiche weitere prognostische Werte berechnet (und nachher geprüft) werden. In diesem Sinne sind a x und a 2 in der Tat nützlicher als die Statistiken F j und T 2 selbst. Die Parameter a 1 und ) HASELOFF, O . W . : S t r a t e g i e und P l a n u n g , i n : D e r G r i f f nach der Zukunft. H r s g . v o n R . JUNGK & JOSEF MÜNDT. München, W i e n , Basel ( 1 9 6 4 ) .

252

Kybernetische Modelle des Lernens

Ein bereits realisiertes Studierfeld eines kybernetisch-sozialen Experimentierens ergibt sich bei der Kommunikation der bereits erwähnten „mechanischen Schildkröten". Die Untersuchung der Kommunikation und der Interaktion von Paaren und Gruppen beweglicher und selbstadaptiver Modelle erbrachte Einsichten in bestimmte Bedingungen sozial-kommunikativen Lernens. Solche „mechanischen Schildkröten" zeigen auch einfachste soziale Verhaltensmuster. Sie demonstrieren damit, daß das Verhalten auch sehr einfach reagierender Systeme bereits zweckgerichtet und unterscheidend sein kann. Dabei ist ihre Kooperation an die Einstellung der Lernmaschinen auf ein Kommunikationssystem gebunden, nach dem definierte Zeichen mit definierten Reaktionen beantwortet werden. Das „Verhalten" gewinnt über wechselseitigen Austausch von Zeichen in solchen Gruppensituationen kooperative oder rivalisierende Züge. Läßt man fünf oder sechs der sich selbst steuernden Apparate einen einigermaßen großen Raum „erforschen", so ist die Zufallswahrscheinlichkeit sehr gering, daß sich die Schildkröten treffen und Kontakt aufnehmen. Wird nun der verfügbare Raum allmählich (durch negative Stimuli) eingeengt, so beginnen die „Schildkröten" ihr Verhalten wechselseitig aufeinander zu beziehen. Es ist verblüffend, zu beobachten, daß sich die Maschinen merkbar zusammendrängen. Durch das Auftreten eines gemeinsamen Zieles oder eines allen zugänglichen positiven Stimulus wird die Aktivität der einzelnen Schildkröten rasch geweckt und richtungsmäßig gelenkt. Solange die der Zielsetzung dienenden Aktionen einander nicht stören, zeigt ihr Verhalten jeweils individuell unabhängige Eigenarten. Erst wenn sie sich dicht am Ziel zusammendrängen, kommt es in ihrem Verhalten zu deutlichen Anzeichen von Konkurrenz. Dieses Konkurrenzverhalten kann sogar eine völlige Behinderung und damit die Einstellung aller Bewegungen der Apparate auf das Ziel hin zur Folge haben. GREY W A L T E R * ) berichtet, daß bei schwächerem positivem Anreiz eine Tendenz zur Bildung kooperierender Ansammlungen zu beobachten ist. „Läßt man z. B. innerhalb eines umzäunten Raumes eine Lücke, durch die die Bewegung der Einzelwesen zwingend bestimmt wird, dann hat die so erzwungene gegenseitige Anreizung gelegentlich eine Einwilligung in die vorübergehende Führerschaft des Einzelwesens zur Folge, das die Lücke als erstes findet." Der Anführer soll sich gegenüber der Anziehungskraft der anderen als besonders unempfänglich erweisen. Ein weiterer Beitrag der Kybernetik zur Lerntheorie besteht darin, daß informationsverarbeitende offene Systeme, wie sie von Nachrichtentechnikern und Elektronikern gebaut werden, als Verhaltensmodelle studiert werden können, die wie andere Modelle verbaler, ") GREY, WALTER: a . a . O .

Kybernetische Modelle des Lernens

253

mathematischer oder technischer Art als Vorstufen von Theorien aufzufassen sind. Wenn aber Apparate lernend in kommunikative Interaktionsvorgänge eingeschaltet werden können, sind sie innerhalb solcher Kommunikation auch als Lehrende in der Lage, das Gelernte weiterzugeben. Die aus unterschiedlichen Richtungen der Lernforschung abgeleiteten Techniken der sogenannten Programmierten Instruktion, können auf Apparate übertragen werden, die dann eine Anzahl einfacher kommunikativer Funktionen übernehmen. Dabei besteht kein konsistenter Zusammenhang zwischen den modernen Lerntheorien und ihrer Übertragung in apparative und logische Darbietungshilfen. Auch zur Kybernetik ist der Zusammenhang inkonsistent. Doch glauben wir, daß die künftige Entwicklung zur erforderlichen Klärung der Grundannahmen programmierter Instruktion führen wird und daß sehr wahrscheinlich eine Reihe wichtiger, eindeutiger, sowohl didaktischer als auch lerntheoretischer Ergebnisse in diesem Bereich nutzbar gemacht werden können. Als sieben Merkmale eines ideal technisierten Lehrsystems werden genannt: Lehrstoffspeicher, Darbieter (des Lehrstoffs), Empfänger (Lernender), Antwort-Aufnahme-Einheit, Bewertungssystem (für die Richtigkeit der Antwort), Aktivitäts-Speicher (für das Antwortverhalten des Lernenden) sowie ein Steuerungssystem (zur Auswahl des darzubietenden Lehrstoffes). Dieses Lehr-Lern-System besteht also aus mehreren Untereinheiten, von denen die „Lehrmaschine" nur eine ist. Von ihr wird zunächst gefordert: a) Steuerung des Lehrprozesses, b) Kontrolle des Lernerfolges nach jedem Schritt, c) Ergebnisanzeige sogleich nach Antwort des Lernenden und d) individuelle Unterrichtung nach Wahl des einzelnen hinsichtlich U n t e r richtstempo und z. T. auch Stoffanordnung.

Die Untersdiiede zwischen Lehrmaschinen ergeben sich vor allem aus den verschiedenen Bedingungen, die sie zu erfüllen suchen. Diese Bedingungen sind wiederum weitgehend von den Programmen abhängig, die sie darbieten*). Dabei sind lineare Programme und die für ihre Darbietung geeigneten Maschinen (Programme in der von S K I N NER**) empfohlenen und seit langem bereits von P R E S S EY*) entwickelten Form) von Geräten zu unterscheiden, die das Prinzip der Aus*) SEELIG, G. F.: Buch oder Maschine? In: Programmiertes Lernen und programmierter Unterricht 4, 173 (1964). **) SKINNER, B. F.: Teaching machines, in: Science Vol. 128, Oct. 1958. *) PRESSEY, S. L.: A simple apparatus which gives tests and scores and teaches, in: School and Society, Vol. 23, Nr. 586 (1926). PRESSEY ist als der eigentliche Initiator der programmierten Instruktion anzusehen.

254

K y b e r n e t i s c h e M o d e l l e des L e r n e n s

wähl-Antworten (multiplechoice) in den verzweigten (branching) Programmen C R O W D E R S * ) verwirklichen. Verzweigte Programme bieten — im Gegensatz zu linearen Programmen — nicht nur auf die richtige Antwort hin neuen Lehrstoff; sie geben auch auf die falsche Antwort zusätzliche Informationen, die den Fehler zu erkennen und zu korrigieren helfen. Ein Programmautor muß sich zunächst einen sehr genauen Plan aufstellen, was er lehren will bzw. welchem Verhaltensschema sich der Lernende langfristig anpassen soll5"'). Erst nach diesbezüglichen Entscheidungen kann er sich zwischen einer oder mehreren Programmierungstechniken und geeigneten Maschinen entscheiden und sich ihrer bedienen. Als wesentlicher Vorteil des verzweigten Programms ist anzusehen, daß die Abfolge der dargebotenen Einheiten nicht allein vom Programm bestimmt wird, sondern auch vom Lernenden im Wechselverhalten mit dem Programm. An dieser Stelle deutet sich einiges von der inneren Problematik der programmierten Instruktion an: 1.

D i e e x t e r n e F e s t l e g u n g des g e s a m t e n Lerngeschehens l ä ß t f ü r i n d i v i d u e l l e s e x p l o r a t i v e s u n d p r o b l e m l ö s e n d e s V e r h a l t e n keinen R a u m .

2.

D i e P r o g r a m m i e r u n g e r f o l g t teilweise noch g e m ä ß d e m — empirisch u n b e s t ä t i g t e n — P o s t u l a t , d a ß der beste L e r n e f f e k t durch eine r i g o r o s e logische A n a l y s e u n d A u f t e i l u n g des L e h r s t o f f e s e r f o l g t .

3.

D i e f a s t i m m e r s t a r r e V e r l a u f s o r d n u n g der E i n z e l l ö s u n g e n k a n n sich bei g e h ä u f t e r W i e d e r h o l u n g v e r s e l b s t ä n d i g e n , so d a ß g e g e b e n e n f a l l s durch P r o b i e r e n u n d R o u t i n i s i e r u n g des stochastisch e r m i t t e l t e n L ö s u n g s a b l a u f s auch ein sehr L e r n u n l u s t i g e r o d e r ein D e b i l e r selbst ein l o g i s t i sches L e h r p r o g r a m m in a l l e n E i n z e l h e i t e n richtig z u lösen v e r m a g .

Wir glauben nicht, daß diese und andere problematische Aspekte der programmierten Instruktion eine Widerlegung des Konzepts darstellen. Vielmehr gilt es, Vorteile und Nachteile dieser Unterweisungsform im eigenen Lehrvorhaben zu berücksichtigen und die vielen offenen Fragen nicht durch engagierte Deklamationen der Gegner und Befürworter, sondern durch wissenschaftlich einwandfreie Prüfung zu klären. So ist auch die Frage, welche Art der Programmierung vorzuziehen sei, zur Zeit noch unentscheidbar; dagegen konnte bereits durch Vergleich mit konventionellen Lehrmethoden empirisch festgestellt werden, daß die Lehrprogramme für Lehrer wie auch für Lernende unter geeigneten Bedingungen Zeit sparen helfen. Bislang sind die Erfolgsvergleiche nicht nur methodisch und statistisch unzulänglich, sondern >f) CROWDER, N . A . : A. A., Sc R . GLASER: (1960). * * ) JORSWIECK, E . : Lektionsentwürfen für

Automatic tutoring by instrinsic programming, in: LUMSDAINE, Teaching Machines and Programmed Learning, Washington Zur methodischen und psychologischen Inhaltsanalyse einfache Schulverhältnisse. Prax. Kind. Psych. 15 (1969).

von

Kybernetische Modelle des Lernens

255

folgen auch nicht einem gemeinsamen pädagogischen Konzept von Lehrerfolg. Es gilt deshalb weiterhin, semantisch präzisierte und experimentell bestätigungsfähige Kriterien zu entwickeln, nach denen gute Programme von schlechten zu unterscheiden sind. Schließlich wird sich auch erst noch genauer zeigen müssen, wo die Grenzen des programmierten Lernens und Lehrens liegen; aber schon jetzt kann ihm eine belangvolle Stelle im Arsenal pädagogischer Wirkungsmittel vorausgesagt werden. Bei Lehrmaschinen werden im einzelnen drei Gruppen adaptiver Maschinen unterschieden: Sie werden als minimally adaptive, als intrinsically adaptive sowie als „extrinsically adaptive" bezeichnet*). Minimaladaptiv werden alle diejenigen Maschinen genannt, die dem Lernenden gestatten, einige bereits bekannte oder für ihn triviale Einheiten zu überspringen oder zusätzliche Informationen und Lernhilfe anzufordern. Demgegenüber soll die intrinsic-adaptive Maschine Fehler, die dem Lernenden unterlaufen, dadurch beantworten, daß sie ihm eine zu seinem speziellen Fehler passende Information erteilt. Als „intrinsic" wird also eine Programmierungstechnik bezeichnet, die die Antwort des Lernenden auf eine Antworten-Auswahl-Frage zur Auswahl derjenigen Vorgaben verwendet, die ihm als nächste dargeboten werden. Der Lernende löst durch sein Antwortverhalten eine Anpassung der Maschine in Gestalt einer Auswahlleistung aus und wird erst nach einem ihm zusagenden informierenden und seinen Fehler korrigierenden Seitenweg wieder auf den Hauptzweig des Programms zurückgeführt, so daß sich die Bezeichnung „verzweigte Programme" eingeführt hat. Kritisch wird gegen „intrinsic"-Programm-Maschinen vor allem eingewendet, daß die Wahl des Seitenzweigs eines Programms auf Grund einer einzigen Fehlantwort erfolgt, die in keinem Falle einer Fehleranalyse unterzogen wird. Dem intrinsic-Programm von Lehrmaschinen liegt also die Annahme zugrunde, daß alle Lernenden, die dieselbe Falsdiantwort geben, aus den gleichen Motiven und Bedingungen zum Drude auf den falschen Antwort-Knopf gelangt sind. Demgegenüber beruht die Anpassung der extrinsic-Mzsdime auf der Ermittlung von Reaktionsverteilungen, durch deren Analyse das Gerät die individuelle Lerntechnik des Lernenden ermitteln soll. Wenn aus dem Einzelfehler des Lernenden keine korrigierende Anpassung der Maschine erreicht werden kann, muß das Gerät das falsche Antwortverhalten zunächst speichern und auf diesem Wege eine kommunikative Wechselbeziehung zum Lernenden erarbeiten. Während andere Programme die Fehler des Lernenden sofort zu korrigieren ' ' ) D E L G E N , L . , R . , T . F I L E P , L . S . G O L D S T E I N SC B . W . A N G A L E T : A C o m p a r i s o n

Three Modes of Presenting a Programmed Instruction Sequence, N. Y. (1962).

of

256

Kybernetische Modelle des Lernens

suchen, soll die nach dem extrinsic-Prinzip arbeitende Lehrmaschine auch die Mißverständnisse, die zu den Fehlern geführt haben, auflösen. Solche Geräte passen sich dem individuellen Tempo an; treten Reaktionsverzögerungen auf, drosselt die Maschine auch das Darbietungstempo der Fragen. Sobald jemand mit der Maschine lernt, stellt sich das Gerät jeweils so ein, daß es neue Information in dem Grade präsentiert, der dem bis dahin jeweils erfolgten Lernablauf etwa entspricht. Zu Beginn der Lernarbeit wird die Maschine mehr Hilfen geben müssen. Im weiteren Verlauf spielt die Maschine ihren Präsentationsrhythmus so ein, daß die Ausgabe von Informationen minimisiert, die Leistung des Lernenden umgekehrt proportional stärker angefordert wird. Um ein anhaltendes Interesse des Lernenden zu erzielen, kann es nötig sein, daß das Programm an bestimmten Orten des Lernspiels einen völlig anderen Weg vorsieht. Diese Möglichkeit hält das „intrinsic"Programm nicht bereit. Bei allen durch Fehlantworten angebotenen Verzweigungen schreibt es einen gemeinsamen Lernweg vor. Tritt eine Lernschwierigkeit ein, deren Bewältigung im Gerät nicht vorprogrammiert ist, so wird durch ein entsprechendes Signal ein Lehrer aufmerksam gemacht. Er vermag dann die Verständnis-Schwierigkeiten des Lernenden aufzulösen*). Die bisher angebotenen Lehrmaschinen sind meist nur für das Training einer speziellen Fertigkeit konstruiert. Einen interessanten Entwurf dieser Maschinen stellt die häufig erwähnte und beschriebene S A K I (Solartron Automatic Keyboard Instructor) von Gordon P A S K dar. Eine der letzten Neuentwicklungen ist der Cybernex General Purpose Programmed Instructor. Dieses Gerät, das der Leistungsbeschreibung nach den oben aufgestellten Forderungen genügen soll, ist für viele unterschiedliche Lehrstoffe verwendbar. Dabei erwies sich die Ausarbeitung der Programme nicht einmal als so umständlich wie bei anderen, nur auf ein Programm spezialisierten Geräten. Das Lehren und Unterrichten von klassenähnlich zusammengesetzten Schülergruppen stellt ein spezielles Problem des Unterrichts mit Lehrmaschinen dar. Ansätze zur Lösung von Problemen der automatisch gesteuerten Unterrichtung von Gruppen finden sich in: a) Programmed Logic for Automatic Teadiing Operations (PLATO) der Universität von Illinois und b) Computer-based Laboratory for Automated School Systems (CLASS) der System Development Corporation.

Bei diesen Lehr-Lern-Systemen wird das Lernen jedes einzelnen Gruppenmitgliedes durch einen zentralen Elektronenrechner gelenkt, der

*) Eine eingehendere Einführung in die Probleme von Lehrmaschinen und programmiertem Unterricht bietet der von M. GOLDSMITH herausgegebene Sammelband: Mechanisation in the Classroom, London 1963, referiert von SEELIG, G. F., in: Programmiertes Lernen und programmierter Unterricht, 2, Berlin (1964).

Kybernetische M o d e l l e des L e r n e n s

257

den einzelnen lernenden Schüler mit den für seinen Lernerfolg notwendigen Lehreinheiten versorgt. Durdi solche, das Lernen in Schulklassen simulierende Systeme behauptet PASK, auch Kommunikation und soziale Interaktion der Lernenden untereinander in den Lehrprozeß eingeordnet zu haben. Diese Vermittlung von Erfahrungen beim erfolgreichen oder mißglückten Lernen mit den lernenden Partnern wird jedenfalls durch die in Deutschland bekannten Techniken der programmierten Instruktion nur zu oft vernachlässigt. Das von einem Elektronenrechner gesteuerte, für viele Lernende gleichzeitig angebotene Lehrprogramm besitzt möglicherweise so viele Verwendungsmöglichkeiten, daß sich die hohe Investition für Universitäten und Hochschulen lohnen mag. Vorerst gilt es hier jedoch, mit einiger Sorgfalt zwischen konzipierten, bereits konstruierten, sowie empirisch erprobten Programmträgern und Programmen zu unterscheiden. Auf Vorteile des Verfahrens hinweisend kann jedoch gesagt werden: Programmiertes Lernen fördert zunächst einmal die Begegnung mit einer für die Heranwachsenden positiv ausgezeichneten Welt der Apparate und der ihnen innewohnenden Möglichkeiten spielerischer Selbstbestätigung und Bewährung. Auch durch Buchprogramme werden solche sportlichen Einstellungen durchaus aktualisiert. Eine optimierte Informationsplanung gewährt weiterhin günstige Beziehungen zwischen Erfolgs- und Mißerfolgserlebnissen, durch die der einzelne Lernende eine genaue Orientierung über den Lehrstoff und die eigenen Verhaltensweisen zu erzielen vermag. Ein überwachender, impulsgebender und kontrollierender Lehrer sowie eine kritisch reagierende Gruppe müssen nicht als Aushilfen für individuelle Leistungsmotivation eintreten. Im programmierten Lernen kann der pädagogische Kontrolleur in beschränktem Ausmaß durch ein sportlich-faires Über-Ich ersetzt werden. Eigenmotivationen vom Charakter sozialer Dauerantriebe werden herausgefordert und können an die Stelle eines mehr oder weniger künstlich oder ideologisch motivierten Lerngeschehens treten. Dem Lehrer aber fallen neue und kompliziertere Aufgaben zu: Von einem Verwalter und Austeiler der Informationen wird er zu einem Impulsgeber und Helfer der kreativen Anpassung und des schöpferischen Denkens werden. Umfangreiche und detaillierte Information, wie sie durch programmiertes Lernen möglich wird, stellt keinen Gegensatz zu schöpferischem Denken und eigenkontrollierter, problemorientierter Aktivität dar. Wir haben den Gegenstandsbereich der programmierten Instruktion und der Lehrmaschinen*) im Abschnitt Kybernetik behandelt, obgleidi *) HASEIOFF & SEELIG: Diapositiv-Reihe: „Programmiertes Lernen und Lehrmaschinen". Institut f ü r Film u n d Bild in Wissenschaft u n d Unterricht. München (1965). 17 Haseloff-Jorswieck, Psydiologie

258

Kybernetische Modelle des Lernens

das Prinzip der Lehrmaschinen bereits 1926 von PRESSEY entwickelt worden ist. Die lerntheoretischen Konzeptionen, die dieser neuen Technologie des Lehrens und Lernens zugrunde liegen, gehören überwiegend den älteren Entwicklungsstufen der Lernforschung an. Dennoch haben wir diesen Abschnitt in das vorliegende Kapitel eingeordnet, weil in der programmierten Unterweisung das Prinzip der Information bedeutsam ist und gleichzeitig die Möglichkeit der unmittelbaren Erfolgskontrolle sowie der sorgfältigen Berücksichtigung eines selbstadaptiven Verhaltens in diesem Zusammenhang betont wird. Die Bedeutung der kybernetischen Denkweise für die Theoretisierung des Lernens liegt unseres Erachtens jedoch weitgehend in einem anderen Bereich: Das von einer Reihe von Kybernetikern bevorzugte Kanalmodell, in dem auch der Mensch im Bilde eines Informationskanals oder als sogenanntes informationsverarbeitendes System betrachtet wird, ist zwar zunächst nur eine Analogie, über deren wissenschaftlichen Nutzen noch sorgfältige wissenschaftstheoretische Klärungen Auskunft geben müssen. Aber es ist doch kein Zweifel, daß diese Betrachtungsweise sich mit den empirischen Konzepten der modernen Lernforschung durchaus verträgt. Dieser Zusammenhang besteht vor allem darin, daß ein Lebewesen informationstheoretisch als ein nachrichtenverarbeitendes Vermittlungssystem beschrieben wird, als ein Informations- oder Kommunikationskanal, bei dem Reize als Input und Reaktionen als Output figurieren. Diese Denkweise entspricht weitgehend der älteren Assoziationspsychologie sowie dem Früh-Behaviorismus. In diesem Zusammenhang ist es lerntheoretisch nun außerordentlich interessant und wichtig, daß M I L L E R , GALANTER & P R I B R A M * ) neuerdings (1960) den systematischen Versuch durchgeführt haben, den Menschen nicht als passiv registrierenden Informationsempfänger, sondern als ein mit Hilfe von Plänen die eingehenden Informationen aktiv ordnendes und manipulierendes System zu beschreiben. In diesem Konzept ist die zukünftige Entwicklung einer empirischen Kybernetik vorweggenommen, die über die kybernetischen Neuformulierungen älterer Psychologie und Lerntheorie hinausgelangt. In diesem Sinne erscheint als eine der kognitiven Grundoperationen die Identifikation von Regelmäßigkeiten innerhalb der Umgebung. Hier ergeben sich wichtige Zusammenhänge mit der modernen Hypothesentheorie, sowie mit neueren Ausformungen der Theorien des Gedächtnisses und des Denkens.

* ) M I L L E R , G . A . , E . GALANTER &

havior. N . Y . (1960).

K . H . PRIBRAM: P l a n s a n d I n s t r u c t u r e o f

Be-

26. Lernen als Aktion und Interaktion Unsere Darstellung der Lernforschung schließen wir ab mit einer operationalen Auffassung von Lernen. Die meisten Konzeptionen von Lernen gelangen von Postularen, Beobachtungen und Experimenten zu allgemeineren Aussagen. Sie erlauben dann, konkrete Beobachtungen z. B. in Schulklassen zu erklären und zugleich möglichst Aussagen abzuleiten, von denen aus korrekte und zutreffende Prognosen über den Erwerb langfristiger Neuanpassungen möglich sind. Es gibt jedoch zweifellos Schwierigkeiten, eine leistungsfähige Theorie, mit deren Hilfe wir Erklärung, also die prognostisch relevante Beschreibung der Ereignisse eines wohldefinierten Bereichs mit Hilfe wissenschaftlicher Gesetze und wohldefinierter Randbedingungen — durchführen können, auf den Bereich des menschlichen Handelns anzuwenden. Die Schwierigkeit, der wir hier begegnen, liegt in der außerordentlichen Komplexität der Sachverhalte; die angestrebte Rückkopplung am Bereich des praktischen Handelns ist jedoch erforderlich, wenn Theorie sich bestätigen soll und wenn sie durch zunehmende Erfahrung differenziert und bereichert werden soll. Es ist ein häufiger Fehlweg in der wissenschaftlichen Beschäftigung mit den Problemen des Lernens und zugleich der Grund für die nicht selten zu beobachtende eigentümliche praktische Unfruchtbarkeit solcher theoretischer Bemühungen, daß erneut, wie in den Tagen von EBBINGHAUS und G E O R G ELIAS M Ü L L E R , der Versuch gemacht wird, Lernen an sich — unabhängig von der Beschaffenheit der beteiligten Systeme, Menschen oder Gruppen und unabhängig von einflußnehmenden Bedingungen in der Realität — zu deuten und zu interpretieren. Wer so vorgeht, muß schließlich scholastisch, aus der Logik bestimmter Begriffe heraus, auf die Möglichkeit oder Unmöglichkeit, auf die Existenz oder Nichtexistenz von theorierelevanten Tatsachen schließen. Durch Ceteris-paribus-Klauseln werden dann solche Deduktionen — oft ohne Einsicht in den defensiven und jede korrigierende Kritik verunmöglichenden Charakter dieses Vorgehens — gegen jegliche widersprechende Erfahrung immunisiert. Oder eine andere vorsorgliche Abwehr möglicher Widersprüche der Beobachtung gegen die Theorie wird praktiziert: Ein einziges gedankliches Universalmodell wird so weit abstrahiert und formalisiert, daß es nur noch wissenschaftslogisch analysiert, nicht aber durch erfahrungsbezogene Argumentationen oder durch experimentelle Beobachtung geprüft werden 17»

260

Lernen als Aktion und Interaktion

kann. Andere Wege der Immunisierung gegen widersprechende Erfahrung ergeben sich in Konsequenz einer Betonung der Einmaligkeit und Unwiederholbarkeit jeder konkreten Lernsituation und des praktischen Einzelfalls. Wesentlich fruchtbarer und zugleich •wissenschaftstheoretisch korrekt ist es jedoch, eine wissenschaftliche Theorie des Lernens so zu formulieren, daß bestätigende oder widersprechende Erfahrung experimentell hergestellt oder in der Bestätigungsprüfung an der Realität zugelassen werden kann. Hierzu aber ist es erforderlich, daß eine formalisierte Theorie des Lernens einerseits logisch widerspruchsfrei, andererseits aber zugleich eindeutig auf variierende, auslösende und steuernde Randbedingungen zu beziehen ist. Deshalb hat eine erste Konkretion theoretischer Modelle des Lernens die Aufgabe, systeminterne (endogene) und systemexterne (exogene) Bedingungsfaktoren in ihrer Bedeutung für die Vorgänge der langfristigen Neuanpassung zu identifizieren und in ihrer Wertigkeit und Wechselwirkung zu erfassen. Die beiden lerntheoretisch wichtigen Gruppen von Bedingungsfaktoren werden in der nachfolgenden Zusammenstellung von einfachen und quantitativ meßbaren zu komplexeren und qualitativ faßbaren Kategorien geordnet: Meßtechnische Entsprechung

Bedingungsfaktoren des Lernens A : endogen B: exogen

Physikalische und physiologische Meßskalen

Standardisierte Maßeinheiten Vergleichende Häufigkeitsstatistik

Alter Wachheit und Müdigkeit Ernährungs- und Kräftezustand Krankhafte Störungen der Vitalität Intelligenz Motivation Vorinformation Fertigkeiten und Können

Qualitative Skalierungen und Wertkategorien

Einstellungen Haltungen Wertungen

Tageszeit, Wetter, Klima, Umgebung

Gruppenstruktur Konsistenz und Thematik des Lernmaterials Kulturell dominierendes Erwartungssystem Praktische Anwendbarkeit des Lehrgutes Bewertung der Anwendung gemäß Normen und Sanktionen der Subkultur

Die Erfassung und Beschreibung dieser exogenen und endogenen Bedingungsfaktoren einschließlich ihrer erwartbaren Korrelationen und Wechselwirkungen für den Lernerfolg ist wichtig, da Lehrer, In-

Lernen als Aktion und Interaktion

261

struktoren und Institutionen durch Kenntnis dieser Faktoren und Berücksichtigung ihrer Wirkungen das Lerngeschehen thematisch und auch der erwünschten Häufigkeit gemäß beeinflussen können. Diese Seite der Anwendung lerntheoretischer Erkenntnisse ist für die praktischen Aufgaben der Schule von großer Bedeutung. Eine konkrete Auffassung von Lernen fordert weiter die Anerkennung und systematische Berücksichtigung der Tatsache, daß konkrete Lernvorkommnisse sich stets im Rahmen sozialer und kultureller Konstellationen realisieren. Lernen vollzieht sich in der Realität menschlicher Vergesellschaftungen und stellt einen Vorgang dar, auf den im Interaktionsprozeß wechselseitig gerechnet wird. Ein Grund hierfür dürfte in der anthropologischen Sonderstellung des Menschen zu sehen sein, die bedingt, daß die Realisierung der biologisch gegebenen Möglichkeiten des menschlichen Verhaltens und der Erfahrung nicht ohne weiteres eine Sicherung seines Uberlebens gewährleistet. Das Erlernen bestimmter kulturspezifischer und diese Kultur zugleich fundierender Verhaltensweisen und Techniken ist eine notwendige Anpassung, die das Überleben sichert. Wir können hier perzeptive, kognitive und exekutive Muster unterscheiden, die in unterschiedlicher Weise in den verschiedenartigen Kulturen gelernt werden und die wiederum zu wichtigen Rand- und Auslösungsbedingungen für neue und andersartige Lernprozesse werden. In ihren Wechselwirkungen realisiert sich dann das beobachtbare Lerngeschehen. Zu seiner Aufhellung in jener oben skizzierten Betrachtung wird das zentrale Konzept der Handlung von uns eingeführt. In diesem Konzept verflechten sich die differenzierenden theoretischen Ansätze und Zugangsformen von der Biologie über Psychologie bis zu den Sozialwissenschaften in einer konkreten, realitätsorientierten Weise. Die komplexe menschliche Handlung ist historisch erst spät der psychologischen Analyse und dem Experiment unterworfen worden. Zunächst stellten komplexe Handlungsabläufe einen gewichtigen Gegenstand jahrhundertlangen spekulativen Nachdenkens dar, dessen restierende Ergebnisse — wegen der in ihnen enthaltenen normativen und zielorientierten Setzungen hinsichtlich der sozial sanktionierten oder favorisierten Handlungsziele — die psychologischen Einsichten in menschliche Handlung keineswegs gefördert haben. Methodische Schwierigkeiten einer empirischen Analyse beginnen daher bereits bei der begrifflichen Festlegung von Handlung, da schon der Anfang oder das Ende einer Aktion sowohl situationeil oder systemexogen als auch vom Ergebnis der handelnden Personen her (also systemintern) festgesetzt werden kann. Jedes Handlungsergebnis zielt unter anderem auch darauf ab, einen Gleichgewichtszustand zwischen Individuum und Gruppe wiederherzustellen. Während es im Laboratoriumsexperiment mit hinreichender Genauigkeit gelingt, iso-

262

Lernen als A k t i o n u n d I n t e r a k t i o n

lierte Sinnesempfindungen zu untersuchen und auch die Repetition des Versuchs durch unendlich viele Probanden keine neuen Ergebnisse erbringt, ist die Wiederholung selbst einfacher Einkaufshandlungen in einem auch nur angestrebt ähnlichen Ablauf kaum zu erreichen. Die Fülle der in den Handlungsvollzug eingehenden und ihn modifizierenden Randbedingungen ist experimentell wenig kontrollierbar. Der größere Teil psychologischer Arbeiten zu diesem Thema hat deshalb deskriptiven und illustrativen Charakter. Nahezu unbearbeitet ist dabei noch, wie die Akquisition und Speicherung von Handlungsmustern Zustandekommen oder wie die Applikation gelernter Handlung im Kontext konkreter Situationen erfolgt. Die anthropologisch axiomatische Festlegung des Menschen als eines handelnden Wesens hob Handlung aus dem Kontext der gesamten Verhaltens- und Erlebnisweisen so weit heraus, daß eine eigene Handlungspsychologie entsteht (P. v. SCHILLER)*), in der entweder alle Leistungen und Erlebnisweisen der Handlung subsummiert werden oder aber als nicht dem Gegenstandsbereich der Psychologie zugehörig bewertet werden. Ausdrücklich wird dabei auf den engen Zusammenhang von Situation als einem vielschichtigen Gesamt von Reizkonfigurationen mit der komplex erlebenden Person hingewiesen. Zum anderen steht die gezielte Einwirkung auf die Außenwelt, die den Handelnden erst als solchen diagnostizierbar werden läßt, im Vordergrund psychologischer Forschung. Komplizierend kommt hinzu, daß auch der Handlung bereits der Handlungsplan hinzugerechnet werden muß. Aus diesen, z. T. historisch bedingten Grundkonzeptionen leiten sich folgende Fragestellungen ab, die bei der Analyse des Handlungslernens wichtig werden: a) Struktur und Funktionsbestand des handelnden Systems, wozu wir endogene Faktoren wie Alter, Entwicklungsstand, aber auch Fertigkeiten zählen. Der handelnden Person wird eine mehr oder minder „bewußte" Intention auf ein Handlungsziel zugeschrieben, das in Gestalt einer effektiven Änderung der Umgebungsbedingung, sofort oder mit zeitlichem Abstand, erreicht werden soll (LEWIN)""'1''). In diesem Zusammenhang stellen sich die Aufgaben einer Analyse der Handlungsmotive und der Handlungsziele ebenso wie eine Untersuchung über das Aufschieben oder Fallenlassen von Handlungsplänen und Wiederaufnahme nach Unterbrechungen. b) Die die Handlung auslösenden, begleitenden oder beendenden „Innenbedingungen". Solche auslösenden, begleitenden oder die *) **)

P. V.: Aufgabe der Psychologie, Wien (1948). K.: Vorsatz, Wille und Bedürfnis. Berlin (1926).

SCHILLER, LEWIN,

Lernen als Aktion und Interaktion

263

Aktion beendenden Innenbedingungen werden als Wunsch, Drang, Trieb oder als Strebung erlebt. Sie stellen die mobilisierenden Faktoren (energetische Vermittler) für die Handlung dar. Eine zweite wichtige Innenbedingung ist die Aktualisierung einzelner Ideationen etwa von Wissen und Informationen, die die instrumenteilen Hilfen für die Realisierung der angestrebten Umgebungsveränderungen vorausentwerfen. Das antizipierende Abwägen und Ausphantasieren der durch die einzelnen Handlungsschritte zu bewirkenden Veränderungen in der Umwelt gemeinsam mit der erwarteten spezifischen Befriedigung bei erfolgreicher Zielerreichung sind bestimmend für den Handlungsaublauf. Konvergenz oder Divergenz von Handlungsabsicht und schließlichem Handlungserfolg, Zähigkeit oder Nachgiebigkeit beim Scheitern an Teilzielen, Plastizität oder Rigidität, notwendiger Neu- oder Wiederbeginn determinieren den Ablauf einer Aktion entscheidend. Diesem Verlauf der Handlung wird durch ein zentral wichtiges kybernetisches Modell entsprochen, das M I L L E R , G A L A N T E R SC P R I BRAM ausgearbeitet haben. Sie erklären Handlung als aus dem Prinzip des Servomechanismus folgende kybernetische Aktionseinheit. Diese Einheit setzt sich aus Test und Handlung, neuem Test und schließlicher Handlung zusammen (hieraus ergibt sich die Abkürzung T O T E = test-operate-test-exit). Handlung als Problemlösung umfaßt dann auch kontrollierende Wahrnehmung, die feststellt, daß der Zustand des Systems (z. B. die Lage im Raum) nicht dem Handlungsplan (gemäß den gesetzten Sollwerten) entspricht, so daß jetzt eine umständeverändernde Aktion einzusetzen hat. Dies wird solange fortgesetzt, bis zwischen Handlungsplan und Neuorientierungen Übereinstimmung festgestellt wird. c) Die das Handeln auslösenden, begleitenden oder beendenden „Umständebedingungen", die wir oben als systemexogene Bedingungsfaktoren bezeichneten. Diese Umgebungsbedingungen reichen von Gefahren und Bedrohungen für Leben und Existenz bis zu jenen Versudiungen und Verführungen, durch die latente Motive mobilisiert werden. Die Sicherheit und das Wohlbefinden störende Ereignisse können aktuell sein und sofortige Handlungen fordern. Sie führen dann zur Mobilisierung von Aktionen. Insbesondere sind es zwischenmenschlich bestimmte Situationen, die zu Handlungen führen. Dies gilt z. B. für jene Handlungen, die durch Neid, Haß, Ehrgeiz gespeist werden; Motive, die der andere durch seinen Besitz, sein Prestige oder seinen Erfolg im Handelnden hervorruft. d) Die im Handeln eingeplanten oder nicht kalkulierten Folgen in der Umwelt. Beabsichtigte und geplante, ebenso wie unkontrol-

264

Lernen als Aktion und Interaktion

lierbare und nicht vorausberechnete Handlungskonsequenzen stellen weitere, das Aktionslernen stark modifizierende Umstände dar*). Die Beurteilung des eigenen Handlungserfolges sowie die Verarbeitung von Fremdurteilen über den Erfolg wirken sich auf die Festigung und Speicherung von Aktionsmustern ebenso aus wie die Formen der Selbsttäuschung und die Verhinderung von einsichtiger Selbstkontrolle. Die Manöver der nachträglichen Rationalisierung von Fehlkonzepten im Handlungsplan stellen weitere Beispiele dar für die Bereitschaft zur Selbstberuhigung bei unerwarteten, sich gegen den Handelnden selbst richtenden Aktionsfolgen oder bei völlig nichtigen und effektlosen Bemühungen. Dies gilt wiederum in erhöhtem Umfang für Handlungen mit Sozialpartnern oder gegen sie. Hier steigt die Anzahl von zu berücksichtigenden Variablen sehr schnell an und verleitet leicht dazu, den Sozialpartner für verhaltenskonstanter zu halten, als es sich dann in der Auseinandersetzung mit ihm tatsächlich erweist. So mag zwar ein Kind voraussehen, was geschieht, wenn es seine im Spiel störende Puppe in die Zimmerecke setzt; eine gleiche Sicherheit der Voraussage erreicht das Kind jedoch nicht, wenn es den beim Spiel störenden kleineren Bruder in die Ecke setzt. Wichtige, das Aktionspotential erweiternde Lernprozesse erfolgen im Kleinkindalter, und zwar durch den Drude der Kultur auf die Motivationen und auf die erlaubten Handlungsziele des heranwachsenden Kindes. In diesem Zusammenhang ist der Begriff der basic personality strueture von KARDINER®'''"") wichtig. K A R D I N E R versteht unter diesem Begriff das System affektiver und exekutiver Muster, das sich vornehmlich unter dem Einfluß des dem Kleinkindalter eigentümlichen integrativen Lernen im Individuum konstelliert. Dieses Muster hat Einfluß auf das spätere kognitive System der Persönlichkeit und auf die Tönung der emotionalen Beziehungen zu den Sozialpartnern. Diese Grundpersönlichkeit ist stark gruppen- und kulturspezifisch und von der Persönlichkeitsstruktur des Erwachsenen streng zu unterscheiden***'). R. LINTON+) fügt diesem Konzept der basic personality

*) HULL, C. L . : Goal attraction a n d directing ideas conceived as habit p h e nomena, Psydi. Rev. 38, 478 (1935). **) KARDINER, A.: The Concept of Basic Personality Strueture as an O p e r a t i o n a l Tool in the Social Sciences. I n : R. LINTON (Hrsg.), (1945). ***) Die aus der Analyse einer Reihe von Kulturen gewonnenen Erkenntnisse, d a ß religiöse Vorstellungen u n d Praktiken starke Beziehungen zu dem K i n d - E l t e r n Verhältnis zeigen, f ü h r t KARDINER ZU der Annahme, d a ß das Gesamtsystem einer K u l t u r auf vier biologisdi und sozial gleich relevante Konstellationen einwirkt. Diese kulturtypisdien Lernsituationen lassen sich unter den Stidiworten mütterliche Pflege, Induktion von affektiver Zuneigung, frühe Erziehung, sexuelle Erziehung und Regelung der gegenseitigen Beziehungen der Geschwister zusammenfassen und haben wichtigen Einfluß auf die Struktur und die Ziele späteren Verhaltens. + ) LINTON, R . : The C u l t u r a l Background of Personality. N . Y . (1947).

Lernen als Aktion und Interaktion

266

structure den wichtigen Begriff der „Statuspersönlidikeit" hinzu. Dieses Konzept überbaut gewissermaßen die Basispersönlichkeit und ist mit ihr integriert. Dabei umfaßt die Statuspersönlichkeit in höherem Grade ausdrücklich gesteuerte und bewußt gelernte Einstellungen und Haltungen. Hier handelt es sich um normorientierte Verhaltenssysteme, die sich von den das Verhalten offen bestimmenden habits dadurch unterscheiden, daß sie einen erlernten Satz kulturell bedingter, aber nicht offen sichtbarer Modifikationen der Handlung darstellen. Wert fungiert dabei als verinnerlichter Stimulus, der im Sinne der Reaktionsgeneralisierung in einer Reihe von Situationen eine nicht offensichtliche Modifikation der Verhaltensausgabe hervorruft. Viele solcher wertnormativen Systeme und Muster sind in ihrer funktionalen Auswirkung stärker gruppendienlich als auf die Stabilisierung des Verhaltens des einzelnen gerichtet. Allgemein werden normative Systeme in ganz unterschiedlicher Weise in einer Kultur gelernt, je nach der sozialen Position, die der Lernende innehat. Hier begegnen wir zugleich einem der wichtigsten exogenen Gestaltungs- und Wirkungsfaktoren des Lernerfolgs*). Internalisierung der kulturellen Muster im Bereich des perzeptiven, kognitiven und exekutiven Verhaltens bedeutet eine Integrierung von Normen mit den motivationalen Bereichen der Persönlichkeitsstruktur sowie mit den im Informations- und Ideationspotential gespeicherten Daten des Realitätssystems einer Persönlichkeit. Die beiden Mechanismen der Internalisierung sind Identifikation und Imitation. Dabei wird durch die Identifikation oder Imitation nicht nur eine bestimmte Handlungsweise des einzelnen Akteurs festgelegt, sondern eine gruppenspezifische Organisation der Werte, Normen und vor allem der Symbole vollzogen. Auf diesem Wege kommt es zu einer Auswahl der Handlungen, die die Interaktion durch Auswahl der Sozialpartner und der Mittel zur Zielerreichung begrenzen. 1. Imitation. Die Nachahmung von Handlungen kann als ein erster Versuch der Akquisition von Aktionsmustern gelten. Als paradigmatisch gilt hier die Imitation von labial gebildeten Lauten (D. O. HEBB).

Geschlossene Handlungssequenzen werden nach dem 8. Lebensmonat imitiert (N. THUMB). Nach Entstehung und Vollzug unterschieden wird der Imitation die nachfolgende Liste von gegensätzlichen Kriterien zugeordnet ( D E CROLY 1934): a) Imitation, mit oder ohne die Absicht, zu imitieren, b) Imitation, mit oder ohne Verständnis des Imitierten, *) Zwar sind die Normen der einen Teilgruppe innerhalb der Kultur im allgemeinen nicht den Angehörigen anderer Gruppen unbekannt, jedoch kann gesagt werden, daß eine relativ ausgeprägte Differenzierung vorliegt, was besonders die Bereitschaft zu lernen in unterschiedlichen Statusbereichen einer Gesellschaft maßgebend bestimmt.

266

Lernen als A k t i o n und I n t e r a k t i o n

c) unmittelbare oder v e r a n l a ß t e I m i t a t i o n , d) e x a k t e r oder ungenauer I m i t a t i o n s v o l l z u g .

Amerikanische Lerntheoretiker zentrieren ihre Definition von Imitation dagegen ausschließlich auf den Sozialbereich. So definiert etwa E. ASCH die Imitation folgendermaßen; „Wenn ein Organismus auf einen anderen dadurch reagiert, daß er genau wie dieser reagiert." DOLLARD und MILLER sprechen in diesem Zusammenhang ebenfalls von Verhaltensgleichheit zweier oder mehrerer Personen, wobei sie allerdings nur intentionierte Verhaltenskopien meinen und als drittes Kriterium die emotionale Abhängigkeit vom Imitierten erwähnen. Die Orientierung am Handlungsvollzug eines anderen ist eine Folge der verhaltensverstärkenden Belohnung für das erfolgreiche Nachlernen aktionaler Modelle. Dabei wird Gratifikation nicht auf einen gegenständlichen Reiz hin erwartet. Vielmehr ist es die vormachende Person, die als Verstärkungsreiz wirkt und auf deren Handlung hin erst die Belohnung erwartet wird. DOLLARD und MILLER veranschaulichen diesen Sachverhalt so: Der jüngere Bruder läuft ebenso wie der ältere zur Tür, um den heimkommenden Vater zu begrüßen, obwohl er ihn nicht gehört hatte, allein weil das Zur-Tür-Laufen des älteren Bruders eine übliche Belohnung in Gestalt einer Süßigkeit verspricht. Hier ist es nun wichtig, sich klar zu machen, daß die zwischen den Menschen bestehenden Handlungsgefüge einen Systemcharakter aufweisen, der als Erwartungssystem verinnerlicht ist und das künftige Handeln zu stabilisieren vermag. Die aktional bedeutsamen Situationen unterliegen in jeder Kultur einer institutionellen Regelung. Das Ideationspotential der Persönlichkeit wird in seinen Grundbeständen offenbar in starkem Maße durch die zunächst imitierenden und dann verinnerlichten Regelungen bestimmt. Der Entwicklungsgang der Persönlichkeit — bestimmt durch die individuelle Sequenz der Lernprozesse — führt zum Erlernen der Realitätsprozesse einer Kultur. Der Unterschied zwischen projektiven und Realitätssystemen ist in unterschiedlichen Arten der Erfahrung und der dadurch ausgelösten Lernprozesse begründet. Bei Projektivsystemen ergeben sidi die Inhalte aus der Generalisierung der Antworten auf institutionalisierte Praktiken, die von Eltern und anderen Personen dem heranwachsenden Kind gegenüber angewandt worden sind. Die so geschaffenen Projektivsysteme haben eine wichtige Anpassungsfunktion. Sie beruhen auf dem Lustprinzip und dienen der Minderung psychischer Spannungen. Sie äußern sich im späteren Leben in bestimmten Ausformungen der Wahrnehmung, in semantischen Bedeutungserteilungen, in Affekten sowie in einer gesteigerten Lernbereitschaft in bezug auf spezifische psychosomatische Reaktion. Projektivsysteme zeigen eine

267

L e r n e n als A k t i o n u n d I n t e r a k t i o n

starke Generalisationstendenz auf Situationen, die keine Ähnlichkeit mit der zugrundeliegenden Erfahrung haben. Die Erfahrungsbasis der Realitätssysteme ist demgegenüber bestätigungs- und kontrollfähig. Die Verhaltensmuster exekutiver und kognitiver Art sind rational, was vor allem wichtig ist hinsichtlich der Beziehungen zwischen den Mitteln und den Zielen. Realitätssysteme als Mittel der Handlungssteuerung treten vor allem in technisch-handwerklichen Tätigkeiten auf, während in der Mehrzahl der Situationen des „praktischen" Lebens auch Komponenten des Projektivsystems mitbeteiligt sind. Wertsysteme und Ideologien beeinflussen die gesamte Systemhierarchie der Persönlichkeit. Sie stellen bewußte oder gelernte Direktiven dar, die vorzugsweise in zwei Formen realisiert werden: Einmal als Handlungsanweisungen gegenüber Entscheidungssituationen, die mit Ungewißheit und Risiko ausgestattet sind, sowie zweitens als Meidungsgebote gegenüber Situationen, die entweder gruppenstörenden Charakter haben oder sich der rationalen Kontrolle des einzelnen zu entziehen scheinen. 2. Lernen konstruktiver*) Handlungsmuster. Die Fixierung der imitierenden Reaktionen auf einen vermittelnden „Reizträger" zeichnet auch jene Handlungsfolgen aus, die beim Erwerb konstruktiver Handlungsmuster eine Rolle spielen. Dem entspricht die pädagogische Regel richtig vormachen und dann nachmachen lassen, die besonders in der alten Handwerkerlehre realisiert wurde und die deutlich zeigt, was hier mit Erwerb konstruktiver Handlungsmuster gemeint ist. Es handelt sich meist um den Erwerb motorisdi betonter, thematisch begrenzter Handlungsmuster. Gleichzeitig bestehen bestimmten Materialien gegenüber regelhaft festgelegte und vorgechriebene Manipulationen. Charakteristisch für Erlernen konstruktiven Handelns ist die Festlegung und notwendige Einhaltung einer zeitlichen Ordnung, mit der Arbeitsmaterialien, Methoden oder Wirkungsmittel herangezogen werden sollen. Die sich laufend verbessernde Leistung beim Allmählich-sich-anpassen an Material und Bearbeitungsvorschrift wird auf différentielles Üben zurückgeführt. Dabei wird auf einer höheren Stufe konstruktiver Imitation der als Vorbild agierende Mensch abgelöst durch Betriebsvorschriften, technische Anweisungen oder informell tradierte Umgangserfahrung, durch die der einzelne Arbeitsgang mehr oder weniger ausdrücklich festgelegt wird. Unmittelbare und vermittelnde Reize oder Reizträger fungieren dann als Verstärker für die erleichterte Übernahme technisch normierter manueller Muster. *) Konstruktiv kann hier gleichgesetzt werden mit kreativ, ferisch oder heuristisdi.

problemlösend,

schöp-

268

Lernen als Aktion und Interaktion

Das Erlernen von „motor habits" erweist sich dabei interessanterweise bei intelligenzverminderten Personen als ebenso erfolgreich wie bei in der intellektullen Norm liegenden Versuchspersonen*). Eine der Hauptschwierigkeiten beim Erlernen aktionaler Muster liegt im Transfer der auf diesem Wege gewonnenen Handlungsschemata auf neue und dabei in hinreichendem Grade ähnliche Situationen und Materialien. Eine allzu enge Fixierung am eingeübten Muster wird gegenüber neuen Aufgaben leicht zu Mißerfolgen führen. Ist dagegen der Handelnde schnell zur Aufgabe oder Modifizierung seiner Erfahrungen bereit, dann wird er vielleicht überbereitwillig zu Variationen der akquirierten Konstruktionsmuster übergehen. Das eine Verhaltensmuster gilt als unordentlich, flüchtig oder leichtfertig und das andere Muster bringt rasch in den Verdacht der Pedanterie oder Begriffsstutzigkeit. Dabei spielt der motorische Impuls und die Schnelligkeit seines Einsatzes eine wichtige Rolle bei der Bewertung einer Arbeitsleistung. GUILFORD**) und seine Schule haben hierzu noch motorische Präzision und motorische Koordinierung in zahlreichen Testverfahren untersucht. Eine andere Dimension der motorischen Leistung wird als Geschicklichkeit bei vielen betriebspsychologischen und Eignungsuntersuchungen getestet, weil sie als Grundlage mechanischer und technischer Fertigkeiten angesehen wird. Sichtbaren Fehlorientierungen eines konstruktiven Verhaltens wird in der Erwartung begegnet, genügend häufige Übung werde die Handlungsmuster einschleifen und dabei ganz von selbst auch das Konstruktionsprinzip des dabei entstehenden Produkts im Ideationspotential verfestigen. Diese Erwartung erfüllt sich tatsächlich gelegentlich. Die Beziehung zwischen motorischem Vollzug, der möglichst genau nach präskritivem Muster durchgeführt wird, und dem Erfassen des Konstruktionsprinzips der zu erstellenden Leistung setzt hiernach dreierlei voraus: a) daß das Erkennen einer Aufbauregel oder eines Arbeitsplanes dem Handelnden eindeutig vermittelt, welche motorischen Bewegungsabläufe erforderlich sind. b) daß überhaupt ein kognitiver Zusammenhang zwischen dem Bauplan einer konstruktiven Handlung und ihren motorischen Einzelbezügen innerlich vorschwebt sowie c) daß optimale Leistungen nur auf Grund dieses postulierten Zusammenhanges entstehen.

Hierzu ist zu sagen, daß die beiden ersten Forderungen realisiert sein können, jedoch nicht müssen. So ist nur daran zu erinnern, daß Menschen, die das Funktions- und Konstruktionsprinzip einer manuellen, maschinellen oder halbautomatischen Leistung rasch erfassen, ande*) ELLIS, N. R., M. PRYER, C. BARNETT: Motor learning and retention in mormals and defectives. Perc., Mot. Skills 10, 83 (1960). * » ) GUILFORD, J . P.: Persönlichkeit, S. 345, Weinheim (1964).

Lernen als Aktion und Interaktion

269

rerseits Schwierigkeiten in der Bedienung einer ähnlichen Maschine oder beim Begreifen eines abstrakten Verständigungsschemas haben können. Der motorisch geschickt und sauber Arbeitende kann jahrelang ohne völliges Begreifen der Aufbauprinzipien und des Konstruktionsplanes seiner dauernd durchgeführten Handlungen tätig sein. So zeigten Untersuchungen von AMMONS*), daß zusätzliche Informationen für einen Handlungsvollzug von einer bestimmten Grenze an den Arbeitsertrag erniedrigen. Andererseits konnten Leistungsabfälle auch dadurch erzielt •werden, daß bis dahin übliche Informationen für einen Arbeitsvollzug weggelassen wurden"'*). Wird das Erlernen von konstruktiven Handlungsmustern als ein Entwicklungsprozeß betrachtet, so erweist sich, daß der motorische Vollzug ohne Vorliegen oder Verstehen eines Konstruktionsplanes am Beginn steht. Erst die Zwänge des Materials und die Bedingungen des Mitteleinsatzes, in einer bestimmten zeitlichen Ordnung und den Substanzeigenschaften gemäß zu hantieren und zu manipulieren, bringen abgeschlossene Werke zustande; und in einem dritten Schritt der Entwicklung wird ein Spiel- oder Bauplan verfolgt, bei dem zeitliche und materiale Ordnungen bereits im Konzept mehr oder weniger klar konfiguriert sind***). Eine weitere, interessantere Frage beim Lernen aktionaler Modelle ist die des Transfers dieser Leistungen. Experimentell wurde motorischer Transfer untersucht, indem die gleiche Leistung als einhändig (bei Rechtshändern), z. B. für das Schreiben, Ballwerfen u. ä., durchgeführt wurde. Dabei ergab sich, daß die Beobachtung linkshändig arbeitender Personen genügte, um bei den Beobachtern eine signifikante Transferleistung zu erzielen. Ähnliche Transfererfolge waren durch B A K E R & WYLIE + ) auch dann zu erzielen, wenn allein eine verbale oder gedankliche (neutrale) Übung einsetzt. Der Anteil kognitiver Prozesse bei der Akquisition von motorischem Lernen kann nachgewiesen werden durch die Antizipation einer Handlung. Hierbei unterscheidet man folgende Stufen: ein abwartendes Beobachten des motorischen Vollzugs, dann Versuche der Voraussage der nächsten Handlungsschritte und schließlich drittens, die korrekte Antizipation der Aktion"1"1"). *) AMMONS, R. B.: Effects of knowledge of performance, Journ. gen. Psych. 90, 279 (1956). **) ELTELL, J. L . , & G . L . GRINDLEY: T h e e f f e c t o f k n o w l e d g e o f r e s u l t s o n l e a r n i n g a n d p e r f o r m a n c e , z i t . n a c h WOODWORTH 8C SCHLOSBERG, E x p e r i m e n t a l

Psychology (1960). ***) Vgl. hierzu STERN, W., 8C CH. BÜHLER, die diese Entwicklung mehrfach beschrieben haben. + ) BAKER, K. E„ SC R. C. WYLIE: Transfer of verbal training to a motor task, J. exp. Psych. 632 (1950). ++ ) VINCE, M. A.: The part played by intellectual processes in sensu-motor performance, Quart. J. exp. Psych. 75 (1953).

270

Lernen als Aktion und Interaktion

Bereits bei frühen Vollzügen im Aufbau konstruktiver Leistungen wird vielfach eine intensive soziale Orientierung hinsichtlich Anerkennung und Erfolg deutlich. Häufig erweist sich auch die Bereitschaft Älterer, Jüngeren in der Form Hilfe zu geben, daß sie durchgegliederte, motorische Muster vormachen oder verbale Schemata zur Verfügung stellen und deren Durchführung erzwingen. Es handelt sich bei diesen als autoritär oder dirigistisch charakterisierten Erscheinungen nicht selten um Wirkungen eines Ersparnisprinzips, bei dem den Nachwachsenden Zeit und Kraft für das Finden von Lösungsmustern erspart und verhaltensökonomisch auf „Transfer"leistungen abgezweckt wird. Die Tatsache, daß Kultur ein Institutionsgefüge darstellt, dessen Exekution schon im technisch-praktischen Bereich durchlaufend gelernt werden muß, wird durch das Konzept des Bezugsrahmens (frame of reference), das auf den amerikanischen Sozialpsydiologen MUZAFER SHERIF*) zurückgeht, erfaßt. Gegenüber dem Dilemma, daß man in der Beobachtung des Verhaltens von Menschen nicht mit Sicherheit von einem bestimmten Reiz auf eine bestimmte Antwort schließen kann, weist er darauf hin, wie Urteile und Handlungsmuster einer Person abhängig sind von deren vorgängiger Akquisition in definierten Gruppen. 3. Lernen interaktionaler Muster. Die Handlungen und Aktions muster, die wechselseitig durch Sozialpartner ausgelöst werden oder sich auf diese beziehen, nennen wir Interaktionen. Interaktionen stellen einen sozialen Prozeß dar, durch den der Handelnde als Gruppenmitglied seinen spezifischen Gruppenstatus innerhalb der Gruppe im Gleichgewichtszustand mit dem Funktions- und Ranggefüge hält. Rückgemeldete und erlebte Abweichungen von diesem Äquilibrium lösen also Interaktionen aus, und für unterschiedliche und spezifische Gruppensituationen gibt es Interaktionsmuster, die favorisiert sind und solche, die als unüblich oder als abnorm expliziten oder gewohnheitsmäßigen Sanktionen unterliegen. Dabei kann gesagt werden, daß je nach dem kulturellen Gesamtmuster ein und dieselbe Verhaltensweise unterschiedliche Bewertungen erfahren kann. So kann ein bestimmtes Verhalten, das beispielsweise in einer früheren Epoche als Sünde — als spezifischer Verstoß gegen eine gottgewollte Sozial- oder Naturordnung — aufgefaßt wurde, etwas später dann als ein Vergehen oder Verbrechen — als Verstoß gegen eine mehr oder weniger rational gesetzte rechtliche Verhaltensordnung, wieder etwas später dann als eine Krankheit, also als eine relativ wertfreie Normabweichung, die ihrem Träger ein bestimmtes Maß an sozialer Schonung verschafft, sowie schließlich in *) ROHNER, J. H., & M. SHERIF: Social psychology on the Crossroads, S. 105, N. Y. (1951).

L e r n e n als A k t i o n u n d I n t e r a k t i o n

271

einem weiteren Stadium als ethisch oder normativ belanglose Sonderbarkeit, Marotte oder Eigenart erscheinen, die vor allem auf den Außenstehenden komisch wirkt. Das Verhalten und seine Motive dürften in allen diesen Fällen relativ gleich bleiben, während sich die Normsysteme und zugleich auch die Interaktionsmuster geändert haben. Die begünstigten Verhaltenstechniken der Interaktion, die den harmonisierten Zustand des einzelnen mit der Gruppe sozial wieder herzustellen versprechen, wirken ihrerseits wieder nach dem Verstärkermodell. Das Befolgen der sozial begünstigten Interaktionen vermehrt die Wahrscheinlichkeit, daß das in Frage stehende interaktionale Muster rasch akquiriert, sicher gespeichert und erleichtert reproduziert wird. Das Ergebnis von Interaktionslernen ist am Grade der erreichten Konformität gemessen worden. So hatten unterschiedlich große Gruppen Urteile zu fällen. Die Experimentiergruppen erfuhren (gegenüber den Kontrollgruppen) das Ergebnis als Häufigkeitsverteilung der Bewertung. Es erwies sich hierbei, daß die Größe der Gruppen keine Rolle spielt, sondern vielmehr Konformität durch den Widerstand gegen die als Kritiker erlebten Gruppenangehörigen sowie deren prozentualen Anteil zur Gesamtgruppe"') zustande kommt. Konformität wird leichter erreicht, wenn es sich um Erwerb und Einsatz sozialen Verhaltens handelt, etwa der Eß- und Stuhlgewohnheiten, der Begrüßungsformen, der Kommunikationszeichen und vieler anderer primärer Sozialtechniken (Parsons)**). Jene sozial-aktionalen Muster dagegen, die an den kognitiven oder emotionalen Schemata der Gruppe orientiert sind, führen zu Verhaltenskonfigurationen sekundär-institutionistischer Art. Im Laufe langdauernder Gruppenzugehörigkeit kommt es dabei zu Generalisierungen. In dieser Weise können Situationsmuster zum Stimulus emotionaler, affektiver, aber auch ideativer oder motorischer Reaktionen werden, die jeweils in spezifischer Form auf soziale Ereignisse antworten***). Insgesamt führt die Akquisition von Interaktionsmustern zur Vereinheitlichung des Sozialverhaltens zweier oder mehrerer Personen im Sinne sich allmählich verstärkender Ähnlichkeit und/oder Ergänzbarkeit sowie damit auch zur Kalkulierbarkeit des Verhaltens. Hier erweisen sich funktionale Motivations- und Normäquivalenzen als ein verstärkender Faktor für soziale Bindung des Verhaltens von Grup*) GOLDBERG, S. C. : The situational determinants of C o n f o r m i t y to social norm, J. abn. Soc. P s y A . }0, 49 (1954). **) PARSONS, T., & R. BALES: The Family, Socialization and Interaction Process, 111. (1955), und BALES, R., Interaction Process Analysis, Cambridge (1951). ***) CARLSON, E. R . : Attitude Change through m o d i f i c a t i o n of attitude structure. J. abn. soc. P s y A . 256 (1956).

272

Lernen als Aktion und Interaktion

penmitgliedern. Die Wahrscheinlichkeit, daß auf diesem Wege Kongruenzen der Interaktionsmuster zustande kommen, -wächst mit der Dauer der Gruppenzugehörigkeit. Eine interessante Problematik wird mit dem Erwerb derjenigen Interaktionen aufgeworfen, die in der älteren Sozialpsychologie als induziertes Verhalten beschrieben wurden. Dieses sprachliche Bild drückt die Hypothese aus, daß die plötzliche Übernahme einer — meist motorischen — Interaktion sich entsprechend der Wirkung physikalischer Magnetfelder auf einen eingebrachten Leiter vollziehe. Diese Analogie der spontan anmutenden Übernahme auch abwegigen Verhaltens mit der Wirkung von Kraftfeldern liegt nahe, weil der Induzierte das auffällige Sozialverhalten erst zeigt, nachdem er mit dem anderen, also dem psychisch oder neurologisch Kranken zusammengekommen ist. Dieses beispielsweise an gestörten Schulkindern beschriebene Phänomen wird wegen seiner Anschaulichkeit und der außergewöhnlichen Bewegungsformen leicht von Kindern akquiriert, weil dabei Geltungsstreben befriedigt werden kann. Bei alledem kann gesagt werden, daß Interaktion und das Erlernen von Interaktionsmustern durch das Erlernen von Symbolen erleichtert wird, die den Handelnden hinsichtlich der Zielorientierung und der normativen Regulierung der Mittel beeinflussen. Der persönliche Ort dieses durch Lernen konstituierten Geschehens ist das Ideationspotential. Das Lernen aktionaler Modelle bezieht sich auf verschiedene Bereiche. Zunächst einmal auf integrierende Symbole und für wahr gehaltene Annahmen einer Gruppe. Zweitens auf Ausdrucks- und Selbstdeutungsmuster, drittens auf Wertorientierungen. Ihnen entsprechen drei jeweils dazugehörige kulturell normierte Standards: 1. Ein Erkenntnisstandard (Was ist wahr}), 2. Angemessenheitsnormen und Einschätzungsstandards (Was ist schön, menschlich, vernünftig, sachgerecht?), 3. Moralstandards bezüglich der Rechtmäßigkeit des Verhaltens. (Wasistrecht, gut, schlecht?)

Die Moralstandards*) haben in der Verhaltensorientierung eine strategisch wichtige Position, da sie die beiden ersten Standards und die ihnen zugeordneten Normen und Werte maßgeblich beeinflussen. Dies wieder in dreifacher Hinsicht: Erkenntnisbezogen als System von Regeln hinsichtlich der Gültigkeit und Richtigkeit gegenüber der Frage: „Was ist eine Tatsache?, Was ist ein BeweisWas ist ein Gesetzf. Zweitens einschätzungsbezogen im Blick auf die Angemessenheit der Objektauswahl und der mit ihr verbundenen Erwartungen in bezug auf Gratifikation. Drittens moralbezogen in Gestalt der *) KOHN, M. L.: Social Class and parental values. Amer. J . Social. 64, 337—351 (1959), der nadiweisen konnte, daß Eltern der sozial-ökonomisdien Untersdiicht ihre Kinder eher zur Konformität mit den Moralstandards erziehen als Eltern der Mittelklasse, die eine Internalisierung dieser Standards bei ihren Kindern erzwingen wollen.

Lernen als Aktion und Interaktion

273

Konsequenzen einzelner Handlungen und Handlungstypen hinsichtlich der Auswirkung der darin verwickelten Personen oder Gruppen. In der nachstehenden Zusammenstellung wird ein historischer Überblick der Theorieentwicklung des sozialen Lernens gegeben.

Theorieentwicklung

des

Interaktionslernens

Autor

Publikationsjahr

Typisdie Versudisanordnung

KATZ

1930

Hühner, Futterkörner

BARTLETT

1932

LEWIN

1926,1942

SHERIF

1931,1947 1951,1956

MURPHY

1942,1947

B R U N E R U.

1956 1947, 1951

POSTMAN BALES

1951

FESTINGER

1957

Hypothese

Konfiguration und soziale Rangordnung Reproduktionsleistun- Soziale Trends der Bedeutungserfassung gen in Gruppen gegenüber Problemstellungen Feldkräfte und Theorie des Wandels menschlichen Verhaltens Aktionseinheiten Perzeption in Gruppen Autokinetische Gruppendruck und Phänomene in favorisierte Interaktion Referenzgruppen, Jugendgruppen in Sommerlagern Übertragung psychoIndividuelle Norm, analytischer Einsichten soziale Norm auf soziales Lernen, Instruktion und Sozialeinstellungen Attitüden Bipolarität des Lernens Sozial-Perzeption Bedürfnis, Motivation, Wahrnehmung als Gruppenmitglied Interaktionsanalyse von Äquilibrium der sozialen Laboratoriumsgruppen Handlungen, Gleichgewicht der Gruppenstruktur Rollenübernahme Kognitive Dissonanz

18 Haseloff-Jorswiedc, Psydiologie

Autorenverzeichnis Allport, G. W. 105, 184 Ammons, R. B. 269 Angalet, B. W. 255 Annett, M. 169 Ashby, W. R. 244 Atkinson, J. W. 215 Austin, G. A. 230 Baker, K. E. 269 Bales, R. 271 Barnett C. D. 268 Bartlett, F. C. 194 Beach, F. A. 197 Benedict, R. 230 v. Bertalanffy, L. 241 Blinkov, S. M.200 Blodget, A. C. 106 Boring, E. G. 197 Broadbent, D . E . 210 Brown, R. 134, 230 Bruner, J. S. 168, 230 Bugelski, B. R. 179 Bunch, M. 196 Bykow, K. M. 29,30,31 Cadwallader, T. C. 179 Cannon, W. B. 201 Carlson, E. R. 271 Carnap, R. 234 Chein, 1.216 Claparede, E. 22 Clara, M. 201 Clark, R. A. 215 Corning, W. C. 205 Couffignal, L. 202 Crowder, N. A. 254 Crowley, M. E. 161 Deese, J. 182 De Labil, P. 246 Deigen, L. R. 255 Dobb, L. W. 231 Dollard, J. 112,166, 184

Ebbinghaus, H. 18, 19, 24, 175 Eccles, J. C. 249 Ellis, N. R. 268 Elwell, J. L. 269 Erikson, E. 117 Ettlinger, G. 162 Ferster, C. B. 180 Flockenhaus, K. F. 219 Foppa, K. 24,29 Forster, H. 161 Frank, H. 242 Freud, A. 55 Freud, S. 183 Fried, C. 204 Gagne, R. M. 161 Galanter, E. 196, 258 Glaser, R. 254 Glezer, 1.1. 200 Goldberg, S. C. 271 Goldstein, L. S. 255 Goltz, F. 201 Gomulicki 27,174 Goodnow, J. J. 230 Grindley, G. L. 269 Giulford, J. P. 268 Guthrie, E. R. 65, 66, 67, 163 Hall, V. P. 225 Halstead, W. C. 202 Hartmann, H. 184 Harvey, O. J. 184 Haseloff, O. W. 144, 149, 205, 215, 219, 221,237,251,257 Head, H. 194 Hebb, D. O. 34, 35, 166, 174, 197, 198 Helson, H. 47 Heron, A. 210 Hilgard, E. R. 219 Hörmann, H. 185 Hoffmann, H. J. 221 Holmes, G. 194

276

Autorenverzeidinis

Horowitz, S. D. 204 Horridge, G. A. 196 Horton, G. P. 66 Hovland, C. 139,165, 211, 217 Hudson, B . H . 109 Hull, C. L. 72, 91,108, 164, 264 Humphreys, L. G. 162, 171 Irion, A. L. 167, 209, 225 Jacobson, A. L. 204 Janis, I. 139, 217 Jeff res, L. A. 193 Jersild, A. T. 56 John, E. R. 202 Jones, H . M . 181 Jorswieck, E., 58, 63, 215, 237, 254 Jost, A. 152,217 Judd, C. H. 160 Kalish, D. 110 Kantor, S. B. 232 Kaplan, B. 232 Kardiner, A. 117, 205, 264 Katwan, J. 58 Katz, 1.1. 202 Kelley, H. 139, 217 Kelley, W. H. 229 Kleene, S. C. 86 Kluckhohn, C. 229 Koch, S. 225 Köhler, W. 45 Koffka, K. 22, 46 Kohn, M. L. 272 Krasner L. 34 Krech, D. 109 Lashley, K. S. 34,171, 174 Lasswell, H. D. 240 Lazarus, A. A. 139 Leeper, R. W. 56, 105 Lerner, D. 240 Levine, R . 216 Levy, N. 182 Lewin, K. 49, 213, 262 Li, C. L. 35 Linton, R . 264 Lippit, O. R. 108 Lorge, L. 39 Lowell, E. L. 215 Lumsdaine, A. A. 254

McClelland, D. C. 215 McConnel, I. V. 204 McCulloch, W. S. 197 McGeoch, J. A. 176, 209 McGuire, W. 139 McLeod, R. B. 105 Mandler, G. 167 Marquis, D. 219 Marx, M. H. 91, 104 Mather, M. D. 139 Mayer, M. 40 Meier, G. W. 196 Merton, R. K. 219 Miller, G. A. 196, 258 Miller, N. E. 112, 117,184 Moore, R. Y. 35 Morgan, C. T. 197 Morgenstern, O. 251 Morris, C. W. 133, 168 Mowrer, O. H. 117, 129, 133, 139, 181 Müller, G.E. 21, 182 Münzinger, K. F. 108 Murdock, B. B. 160 Murphy, G. 216 v. Neumann, J. 251 v. Neurath, O. 168 Nissen, H. W. 52,197 Nolan, C. 196 Ochs, S. 35 Osgood, C. E. 46, 52, 69, 165, 168 Parsons, T. 271 Pawlow, J. P. 29, 33 Penfield, W. 35 Perot, P. 35 Perrot, M. C. 180 Pool, I. de S. 240 Powers, F. F. 163 Pressey, S. L. 253 Pribram, K. H. 196, 258 Pryer, M. 269 Pschonik, A. T. 31, 33 Quastler, H. 244 Rainio, K. 151 Rapaport, D. 26, 184

Autorenverzeichnis Reid, R . L. 153,182 v. Restorff, H. 50 Ribot, Th. 210 Ritchie, B . F . 110 Rohner, J. H. 270 Satinoff, E. 35 Schade, I. P. 200 Schilder, P. 184 v. Schiller, P. 262 Schneidler, H. 196 Schultz-Hencke, H. 123 Seelig, G. F. 253, 256 Segerstedt, T. T. 228 Selfridge, O. G. 250 Setschenow, I. M. 28 Seward, J . P. 182 Shannon, C. 241 Sherif, M. 217, 270 Sigel, I. 170 Sippl, C. J. 213 Skinner, B . F . 92,100, 101, 164, 253 Sloane, E. S. 105 Smith, S. 65 Sodhi, K. S. 217 Spence, K. W. 108 Steinbuch, K. 241 Stern, W. 152 Stevens, S. S. 42 Stumpf, C. 45 Suci, G. J. 168

277

Sullivan, H. S. 227 Szymanski, J. S. 109 Tannenbaum, P. H. 168 Thorndike, E. L. 36, 37, 38, 42, 154, 162, 209 Thume, L. E. 161 Thurstone, L. L. 217 Tolman, E. C. 103,110,165, 171 Toman, W. 87, 188; 189 Tsien, H. S. 243 Underwood, B. J. 182 Vince, M. A. 269 Wade, M. 162 Walter, G. 242 Walton, D. 139 Wazuro, E. G. 29 Werner, H. 48, 232 Wertheimer, M. 44 Whorf, B. 229 Wiener, N. 242 Wieser, W. 249 Wölpe, I. 139 Woodworth, R . S. 161,162 Wulf, F. 174 Wylie, R . C. 269 Zeigarnik, B. 49 Zener, K. 34

Stichwortverzeichnis Abwehrmechanismen 55 Acetylcholin 200 Acetylcholinesterase 200 Äquipotentialität 197 Aggression 59, 121 Aha-Erlebnis 51 Akquisition 13 Aktionspotential 264 Alles-oder-Nichts-Gesetz 65, 155 Amnesie 195 Analysator 31 Aneignung 14 Angemessenheitsnormen 272 Anpassungsgleichgewicht 53 Anzeigenanalyse 219 Apraxie 202 Assoziation-Stiftung 3, 36 — Ähnlichkeit 36 — Gleichzeitigkeit 50 — N e t z 3, 8, 16 Auslöschung 3, 88, 116 Auswahlprogramm 253 Auswendiglernen 158 Autodidakt 205 Autoinstruktion 3 Bahnung 249 Balken (Corpus Callosum) 200 Bedingunglernen 125 Bedürfnis-Aufschub 55 — Quasi-Bedürfnis 49 Belohnung 72 Belongingness 41 Bereitschaft 39 Bestrafung 128 Bezugsgruppen 219 Binäre Repräsentation 183 Binärkode 248 Coenotrop 65 Connectionismus 37, 196 Contentanalyse 220 Contertransfer 165

Cortex, interpretative, 35 —, reflektorische 35 Counterconditioning 67 Cue 67 D N S (Desoxyribonukleinsäure) 203 Discriminanda 171 Diskrimination 95, 116 Dispersion 246 Effektausbreitung 41 Einstellungsmuster 106 Energiequantum 61, 189 Erfolgslernen 3 Erkenntnisstandards 272 Erwartung 3, 106 Es 57 f. Evokation 72 Extinction 3 Figur-Grund-Verhältnis 170 Fixierung 61 Frustration 54, 56,189 Funktion, semantische 283 f. Ganzheit 44 Gedächtnis, mechanisches 16 — Sekunden 26 — Alt-26 Gedächtnisforschung — Erlernungsmethode 18 — Ersparnismethode 19 — Methode der behaltenen Glieder 20 — Treffermethode 21 — Wiedererkennungsmethode 2 2 Rekonstruktionsmethode 23 Gegenbesetzung 56 Gegenständlichkeit 57 Gehirn-Topologie 17 Generalisation 33, 116, 122, 162, 166

Stichwortverzeichnis Gestalten Transponierbarkeit v. 43 Gestaltgesetze 46 f. Gestaltqualität 3, 43 Gradient 79 — Verstärkungs-80, 115 — Ziel- 80 — Asynchronismus 81 Gruppenmentalität 215 „hab" 79 Habit 71 — Hierarchie 3 — Stärke 76 Handlung, zielorientiert 104, 261 Handlungsmuster, konstruktive 267 Hausunterricht 206 Hemmung 3, 30 f., 71 — retroaktive 2 5 , 1 7 7 — proaktive 161 — äußere 30 — auslöschende 31 — Difierenzierungs- 31 — induktive 199 — konditionierte 181 — Überbelastungs- 30 — unbedingte 30 — Verspätungs- 31 Hemmungspotential 85 Hirnschädigung 196 Homöostat 201 Hopi-Sprache 229 Hypothese 7 4 , 1 0 9 Ich 57 f. Ideationspotential 190, 201, 236, 263 Identifikation 55 Identität von Elementen 3 9 , 1 6 2 Imitation 267 Impact 220 Induktion 164 Information — Definition 13 — erster Art 14 — zweiter Art 14 — Potential 14, 190 Informationsstatistik 240 Inhibition 72

279

Instinkt 193 Instruktion, programmierte 253 Intelligenz 186,198 Interferenz 67, 165, 178 Internalisierung 265 Introjektion 55 Isomorphismus 45 Ist-Wert 243 Konditionierung, operante 3, 35 Konformität 214 Kommunikation 133 f. — Definition 213 Kommunique 219 Konsumdemonstration 220 Kontiguität 3, 66 Korrelation — zwischen Eigenschaft und Erinnerung 221 f. Kreis, emotionaler 201 Kybernetik, empir. 258 Learning-set-factor 163 Lehrerfolg 255 Lehrmaschine 253 — extrinsic, — intrinsic 255 Lernen — Definition 13 — einsichtiges 3 — imitatives 233 — latentes 107,219 — Lösungs- 125,127 — motiviertes 60 — primäres 34 — protoplasmatisches 202 — symbolisch-operatives 208 — verbales 5 — verteiltes 158 Lernfaktoren, traumatische 61 Lerngesetze — Effektgesetz 38 — Frequenzgesetz 37 — Jostsche24, 2 5 , 1 5 2 Lernkurve 78 Lernmaschinen 11 Lernmodell — elektronisches 247 — stochastisches 141 Lernprozeß 14 Lernwille 2, 22

280

Stichwortverzeichnis

Libido 61 Liebesobjekt 52 Lust — Unlust 60 Lustbilanz 62 Manipulanda 171 Maschinen, lernende 242 Massenkommunikation 217 mechanische Schildkröten 246 Mediating-Theorie 3, 53 f. Merkfähigkeit 16 minimal-adaptive Lehrmaschinen 255 Mittel-Zweck-Beziehung 172 molar 73, 104 Moralstandards 272 Motivation 14, 66,112 — soziale 53 Motive, Autonomie der 184 Multistabilität 245 Muster, interaktionale 270 —, perzeptuelle 3 Nacheffekt, positiver 38 —, negativer 38 Netz, retikulo-kortikales 199 Neulernen 167 Neuropsychologic 193 Noxe 129 Objektsprache 226 Operant 94 Orientierung, aktive 61 — räumliche 110 Orientierungslernen 125 Orientierungsplan 10 Oszillation 73 „pav" 84 Phase, refraktäre 67 Phi-Phänomen 44 Phoneme 173 Plan, kognitiver 3,105 Prägnanz 220 Prestige 218 Problemhandeln 119 Programm 256 Projektion 55 Psycholinguistik 228

Reaktion 72,113 — chaotische 32 — multiple 38 — vermittelnde 136 — zufällige 36 Reaktionsauswahl 3 Reaktionsbildung 55 Reaktionspotential 13, 73, 190 Reaktionsschwelle 67 Rechner 250 Reduktionismus 105 Reflex 28 f. — bedingter 3, 7 — unbedingter 7 Reflexreserve 10, 97, 101 Reflexstärke 97 Regression 61 Reinforcement 3, 9, 76 Reiz 66, — exterozeptiv, interozeptiv, propriozeptiv 72 — Spur 77 — negativer 118 — schwelle 71 — Selektion 3 Rekonditionierung 96 Resonanz 221 Respondents 94 Response 72, 92 — stimulusfrei 101 Rückkoppelung 243 (feed-back) Rückmeldung 241 f. R N S (Ribonukleinsäure) 203 Schläfenlappenläsionen 194 Schließungsfunktion, kortikale 30 Schwachsinn, experimenteller 200 Selbstadaption 242 Selbstregulation, spontane 6, 43 Selbststimulierung 202 Sequenz, semantische 237 Servomedianismus 243 Signal 7, 72 Signalsystem, erstes, zweites 29, 33 Silben, sinnfreie 5,16,19, 157,175 — sinnvolle 176 Simulation, elektronische 251 Skinnerbox 96 Sleeper-effect 218

Stichwortverzeichnis Soll-Wert 243 Sozialisierung 55 Sozialtechnik 271 Sprachkonditionierung 230 Spurenfeld 49 f. Stereotype 216 Stimulus 65 — trace 77 Sublimierung 59, 235 Suppressorf eider 197 Symbol 133,232, 239 Synapse 249 Systeme, offene 241 — semantische 237 Tendenzen — antizipatorische 116 — determinierende 6 Transfer 154 — sprachlicher 160 — motorischer 160 Transmittersubstanz 201 Trieb 72, 112,117,194 Triebreiz 83 Überbelohnung 165 Über-Ich 57 f. Überlernen 110,153 Übertragung 166 Übungseffekt 152 Ultrastabilität 244 Umweg 59 Unbewußtes 231 Unterricht, programmierter 208 Unterscheidungsschwelle 169 Variable, intervenierende 3, 73, 103 Verbalverhalten 101 Verdrängung 55, 60, 183, 231 Vergessen 6

281

— affektives 6 — motiviertes 60, 61 — operatives 9 — reaktives 9 Verhalten — emittiertes 94 — programmiertes 95 — zufälliges 113 — zweckmäßiges 3, 104 Verhaltenslernen 125 Verhaltensmodelle 12 Verhaltensmuster, prämorbides 58 Vermeiden 60, 109 Verschiebung 55 — assoziative 40 Verschiedenheitsverlauf 50 Versuch und Irrtum 3, 8, 37, 108, 145 Verstärken 70 Verstärkung — alternative 130 — differenzierte 130 — intermittierende 95 — konsekutive 130 verzweigtes Programm 254 Vorstellung 17,191 — freisteigende 53 Wahrnehmung, rekombinierte 236 Wahrscheinlichkeit 143 „wat" 83 Wiederverstärkung 95 Zeichen 13, 133 — Gestalt 10 — lernen 125, 127 — repertoire, gruppenspezifisches 227 Zellensemble 198 Zielgradient 3 Zuständlidikeit 57

H A S E L O F F - HOFFMANN

Kleines Lehrbuch der Statistik Für Naturwissenschaft und Technik, Psychologie, Sozialforschung und Wirtschaft von Prof. Dr. O T T O WALTER H A S E L O F F und Dipl.-Psychologe HANS-JOACHIM HOFFMANN

4., neubearbeitete und erweiterte Auflage Oktav. Mit 59 Figuren, 99 Tabellen, 1 Anhang statistischer Arbeitstabellen und Übungsaufgaben, 1 Ausschlagtafel. XII, 330 Seiten. 1970. Flexibel DM 19,80

Dieses Buch ist für jeden, der sich statistischer Untersuchungsmethoden bedienen will, ohne sich mit langwierigen, theoretischmathematischen Untersuchungen zu belasten, geradezu ideal. Besondere Merkmale des Lehrbuches sind die Reichhaltigkeit des dargebotenen Stoffes, die einfache, klare, straffe Darstellung und die Genauigkeit. Marketing-Journal

In

Vorbereitung:

H A S E L O F F - HOFFMANN

Kleines Lehrbuch der praktischen Sozialforschung Planung, Durchführung und Auswertung von Test, Experiment und Umfrage in Sozialforschung und Verhaltenswissenschaften

Walter de Gruyter & C o • Berlin 30

de Gruyter Lehrbuch

WOLFGANG E. SPIESS - FRIEDRICH GEORG RHEINGANS

Einführung in das Programmieren in Fortran Mit 17 Abbildungen, 14 Tabellen und etwa 40 Programmierbeispielen, 30 Übungen. Groß-Oktav. 195 Seiten. 1970. Gebunden DM 14,BERNHARD HORNFECK

Algebra Groß-Oktav. 271 Seiten. 1969. DM 28,— HANS JOACHIM KOWALSKY

Lineare Algebra 4., verbesserte Auflage. Groß-Oktav. 342 Seiten. 1969. DM 48,FRIEDRICH ADOLF WILLERS

Methoden der praktischen Analysis 4. Auflage. Groß-Oktav. Etwa 430 Seiten. 1970. Im Druck WOLFGANG WETZEL - HORST SKARABIS - PETER NAEVE

Mathematische Propädeutik für Wirtschaftswissenschaftler Teil I: Lineare Algebra. Groß-Oktav. 99 Seiten. 1968. DM 8 , Teil II: Analysis. Etwa 160 Seiten. In Vorbereitung SEBASTIAN DWORATSCHEK

Einführung in die Datenverarbeitung Mit 266 Bildern, 189 Übungsaufgaben und Abbildungsanhang. 3., erweiterte Auflage. Groß-Oktav. XVI, 371 Seiten. 1970 Gebunden DM 24,— GERHARD NIEMEYER

Einführung in die lineare Planungsrechnung Groß-Oktav. 239 Seiten. 1969. DM 18,-

Walter de Gruyter & Co • Berlin 30

GEORG BAYER

Einführung in das Programmieren I. Programmieren in A L G O L . Mit 26 Abbildungen. Groß-Oktav. 172 Seiten. 1969. D M 1 2 II. Programmieren in einer Assembler-Sprache. Groß-Oktav. 132 Seiten. 1969. D M 12,WALTER SCHÖLER

Geschichte des naturwissenschaftlichen Unterrichts im 17. bis 19. Jahrhundert Erziehungstheoretische Grundlegung und schulgeschichtliche Entwicklung Groß-Oktav. 373 Seiten. 1970. Ganzleinen. D M 58,EWALD BURGER

Einführung in die Theorie der Spiele

Mit Anwendungsbeispielen, insbesondere aus Wirtschaftslehre und Soziologie 2., durchgesehene Auflage. Groß-Oktav. 169 Seiten. 1966. Ganzleinen D M 28,S. V A J D A

Theorie der Spiele und Linearprogrammierung Oktav. 129 Seiten. 1962. Ganzleinen D M 16,JOHANN PFANZAGL

Allgemeine Methodenlehre der Statistik 2 Bände. 3.-4., verbesserte Auflage. 1967/68. Je Band D M 5,80 (Sammlung Göschen Band 746/746 a, 747/747 a) Band I: Elementare Methoden unter besonderer Berücksichtigung der Anwendungen in den Wirtschafts- und Sozialwissenschaften Band II: Höhere Methoden unter besonderer Berücksichtigung der Anwendungen in Naturwissenschaften, Medizin und Technik PETER Q U A N T E

Lehrbuch der praktischen Statistik Bevölkerungs-, Wirtschafts-, Sozialstatistik Groß-Oktav. 443 Seiten. 1961. Ganzleinen D M 30,-

Walter de Gruyter & C o • Berlin 30

KLAUS

HOLZKAMP

Theorie und Experiment in der Psychologie Eine grundlagenkritische Untersuchung Groß-Oktav. VIII, 292 Seiten. 1964. Ganzleinen D M 42,P E T E R R. H O F S T Ä T T E R

Sozialpsychologie 4. Auflage. Mit 18 Abbildungen. 191 Seiten. 1970. D M 5,80 (Sammlung Göschen Band 104/104 a) WERNER HOFMANN - WOLFGANG ABENDROTH

Ideengeschichte der sozialen Bewegung des 19. und 20. Jahrhunderts 3., ergänzte u. neubearbeitete Auflage. 297 Seiten. 1970. D M 5,80 (Sammlung Göschen Band 1205/1205 a) PETER A T T E S L A N D E R

Methoden der empirischen Sozialforschung Unter Mitarbeit von Klaus Baumgartner, Franz Haag, Jörg ötterli, Rudolf Steiner 313 Seiten. 1969. D M 5,80 (Sammlung Göschen Band 1229/1229 a) WALTER

MOEDE

Psychologie des Berufs- und Wirtschaftslebens 190 Seiten. Mit 48 Abbildungen. 1958. D M 5,80 (Sammlung Göschen Band 851/851 a) W. M. K R A N E F E L D T

Therapeutische Psychologie Ihr W e g durch die Psychoanalyse Mit einer Einführung von C. G. Jung 3., unveränderte Auflage. 152 Seiten. 1956. D M 3,60 (Sammlung Göschen Band 1034)

Walter de Gruyter & C o • Berlin 30

HERMANN WEIMER - HEINZ WEIMER

Geschichte der Pädagogik 17., neubearbeitete Auflage. 205 Seiten. 1967. D M 5,80 Sammlung Göschen Band 145/145 a) LEOPOLD VON WIESE

Soziologie Geschichte und Hauptprobleme 8. Auflage. 183 Seiten. 1967. D M 5,80 (Sammlung Göschen Band 101/101 a) THEODOR

ERISMANN

Allgemeine Psychologie. 4 Bände (Sammlung Göschen) I. Grundprobleme. 3. Auflage. 146 Seiten. 1965. D M 3,60 (Band 831) II. Grundarten des psychischen Geschehens. 3. Auflage. 248 Seiten. 1970. D M 5,80 (Band 832/832 a) III. Experimentelle Psychologie und ihre Grundlagen. 1. Teil. 2., neubearbeitete Auflage. 112 Seiten. Mit 7 Abbildungen. 1962. D M 3,60 (Band 833) IV. Experimentelle Psychologie und ihre Grundlagen. 2. Teil. 2., neubearbeitete Auflage. 199 Seiten. Mit 20 Abbildungen. 1962. D M 5,80 (Band 834/834 a) WOLFRAM

BURISCH

Industrie- und Betriebssoziologie 5., neubearbeitete und erweiterte Auflage der bisherigen Darstellung von Ralf Dahrendorf. 215 Seiten. 1969. D M 5,80 (Sammlung Göschen Band 103/103 a) FRIEDRICH

FÜRSTENBERG

Wirtschaftssoziologie 2. Auflage. 1970. In Vorbereitung. (Sammlung Göschen Band 1193) GÜNTER

KEHRER

Religionssoziologie 158 Seiten. 1968. D M 3,60 (Sammlung Göschen Band 1228) Das Gesamtverzeichnis „Sammlung Göschen" erhalten jederzeit kostenlos bei Ihrem Buchhändler.

Walter de Gruyter & C o • Berlin 30

Sie

In Vorbereitung: ZIMMERMANN - ZIELINSKI

Lineare Programmierung Ein programmiertes Lehrbuch Groß-Oktav. Etwa 300 Seiten. 1970. Etwa DM 28,-

Eine neue Form der wissenschaftlichen Unterweisung wird hier in überzeugender Weise verwirklicht. Die enge Zusammenarbeit zwischen dem erfahrenen Fachgelehrten und dem erziehungswissenschaftlichen Experten führt zum bestmöglichen Ergebnis: In 10 Lernstunden zu je rund 50 Lernschritten wird der Stoff des gesamten Gebietes dem Lernenden in didaktisch hervorragender Methode sicher und schnell vermittelt, als Ergänzung zu den Vorlesungen, zum Selbststudium und als Mittel zur Weiterbildung in der betriebswirtschaftlichen Praxis.

Walter de Gruyter & Co • Berlin 30