198 43 28MB
German Pages 100 [105] Year 1983
Band 190 (1982)
ISSN 0044-3409
Heft 1
ZEITSCHRIFT FÜR
PSYCHOLOGIE mit Zeitschrift für angewandte Psychologie
Schriftleitung F r i e d h a r t K l i x , B e r l i n • H a n s - D i e t e r S c h m i d t , B e r l i n • H u b e r t S y d o w , Berlin Redaktion:
Unter
J ü r g e n Mehl, Berlin • Friedrich K u k l a , Berlin
Mitwirkung
v&n
N. Bischof, Zürich G. Clauß, Leipzig D. Dürner, B a m b e r g II. Düker, M a r b u r g H . - J . Eysenck, London P. Fraisse, Paris W. H a c k e r , Dresden J . H e l m , Berlin H. Hiebsch, J e n a A. Kossakowski, Berlin
D. K o v ä c , Bratislava B. F. Lomow, Moskau D. Magnussoll, Stockholm H . D. Rosier, Rostock W. P . Sintschenko, Moskau W. S t r a u b , Dresden M. Vorwerg, Leipzig D. W e n d t , H a m b u r g M. W e r t h e i m e r , Boulder
Z. P s y c h o l .
E V P 12,50 M j e H e f t
JOHANN
AMBROSIUS
BARTH
LEIPZIG
INHALT HASSENSTEIN, B. (Freiburg). Erbgut, Umwelt, Intelligenzquotient und deren mathematischlogische Beziehung. Mit 5 Abbildungen
345
KRAUSE, B. (Berlin). On Problems in Measuring Change. With 3 figures
367
KLIX, F.
(Berlin). Are learning processes evolutionary invariant? — An unproved assumption
in psychology of learning revisited. With 5 figures
381
SYDOW, II. (Berlin). Systeme der Künstlichen Intelligenz und Kognitive Psychologie . . .
392
HESSE, W. (Aachen). Training-induced Changes in Problem solving. With 7 figures
. . .
405
J., R E N A T E IIASCHKE und W . U . DORMAN (Jena). Zur Objektivierung sozial induzierter Aktivierungsprozesse auf der Grundlage evozierter Potentiale. Mit 6 Abbildungen
424
SCHWIND,
Buchbesprechungen
434
Manuskripte für Originalabhandlungen und Buchbesprechungen werden an Dr. J. Mehl, Sektion Psychologie der Humboldt-Universität, DDR -1020 Berlin, Oranienburger Str. IS erbeten. Für diese Zeitschrift werden grundsätzlich nur Arbeiten angenommen, die vorher weder im Inland noch im Ausland veröffentlicht worden sind. Mit der Annahme des Manuskriptes und seiner Veröffentlichung geht das alleinige Hecht der Vervielfältigung, Verbreitung und Übersetzung auf den Verlag über. Von Originalarbeiten liefert der Verlag an Stelleeines Honorars 50 Sonderdrucke. Buchbesprechungen werden nicht vergütet, dafür wird das Besprechungsexemplar Eigentum des Referenten. Beachten Sie bitte die Hinweise für die Manuskriptgestallung! Der Bezugspreis beträgt für den Band mit 4 Heften 50,—M zuzüglich Postgebühren. Auslandspreise sind den Zeitschriftenkatalogen des Außenhandelsbetriebes Buchexport zu entnehmen. Bestellungen nehmen entgegen: In der DDR der Postzeitungsvertrieb und der Verlag Johann Ambrosius Barth. In den sozialistischen Ländern der zuständige Postzeitungsvertrieb, in der BRD/Berlin (West) die Firma Zeitungsvertrieb Gebr. Petermann, Kurfürstenstr. 111 D -1000 Berlin (West) 30 und der örtliche Buch- und Zeitschriftenhandel. In allen anderen Staaten der örtliche Buch- und Zeitschriftenhandel. Bestellungen des Buch- und Zeitschriftenhandels sind zu richten an Buchexport Volkseigener Außenhandelsbetrieb der DDR, DDR - 7010 Leipzig, Leninstr. 16, Postfach 160. Die Lieferung erfolgt regelmäßig bis zur Abbestellung, die für das Ende des Quartals erfolgen muß, so daß sie zu dem gewünschten Termin noch berücksichtigt werden kann. Die vergriffenen Bände 1 (1890) bis 176 (1969) der Zeitschrift sind nachgedruckt worden und lieferbar bei: Sweets & Zeitlinger B. V. Backsets Department Heereweg 347—b, P.O. Box 810, 2160 SZ Lisse-Holland Adresse des Verlages: Johann Ambrosius Barth, D D R - 7 0 1 0 Leipzig, Salomonstr. 18 b, Postfach 109, Ruf 70131. Anzeigen werden erbeten für Inland an: V E B Fachbuchverlag, D D R - 7 0 1 0 Leipzig, RichardWagner-Str. 6; für Ausland an: Interwerbung GmbH — Gesellschaft für Werbung und Auslandsmessen der DDR, DDR-1157 Berlin-Karlshorst, Hermann-Duncker-Str. 89, Ruf 5 0 9 0 9 8 1 . Für die Anzeigenpreise gelten die Festlegungen gemäß Preiskatalog Nr. 286/1 vom 1. 7 . 1 9 7 5 .
Z E I T S C H R I F T FÜR P S Y C H O L O G I E Band 190, 1982
Helt 4
mit Zeitschrift f ü r angewandte Psychologie
Band 9 6
Aus dem Institut für Biologie I (Zoologie) der Universität Freiburg
Erbgut, Umwelt, Intelligenzquotient und deren mathematisch-logische Beziehungen V o n B . HASSENSTEIN Mit 5 Abbildungen
Zu welchen Anteilen lassen sich die /(^-Unterschiede in der Bevölkerung auf Unterschiede des Erbguts oder auf unterschiedliche Umwelteinflüsse zurückführen? Diese sowohl wissenschaftlich als auch sozial- und bildungspolitisch interessante Frage läßt sich bis heute nur indirekt untersuchen: durch das Auswerten von /(^-Unterschieden zwischen Personen in Abhängigkeit von deren Verwandtschaftsgrad und vom Grade der Übereinstimmung oder Unterschiedlichkeit ihrer Umwelt. Im folgenden wird dargelegt, welche Schlüsse auf die Bedingtheit der Test-Intelligenz durch solche Untersuchungen prinzipiell möglich sind.
1. Herleitung der Varianzanteile „Erbgut" und „Umwelt" der JQ-Varianz vom durchschnittlichen IQ-Unterschied zwischen erbgleichen, in verschiedener Umwelt aufgewachsenen Zwillingen Als Zahlenwerte, die die relative Abhängigkeit des IQ von Erbgut und Umwelt repräsentieren, gelten die Varianzanteile „Erbgut" und „Umwelt" der /^-Varianz. Seit zwei Jahrzehnten wird am häufigsten die Proportion 80 : 20 [%] zugunsten des Erbguts angegeben (zuletzt von E Y S E N C K 1981); doch werden gelegentlich auch 75 : 25 [%] oder 70 : 30 [%] genannt. Die Basis für diese Zahlenangaben sind die /(^-Unterschiede zwischen Personen in Abhängigkeit von deren Verwandtschaftsgrad und vom Grade der Übereinstimmung oder Unterschiedlichkeit ihrer Umwelt. Es dient dem Vorhaben der folgenden Erörterungen, wenn zunächst ein aus besonders wenigen und übersichtlichen Gedankenschritten zusammengesetzter Weg gezeigt wird, auf den man, ausgehend vom durchschnittlichen /(^-Unterschied zwischen erbgleichen und in verschiedener Umwelt aufgewachsenen Zwillingen, die Varianzanteile „Erbgut" und „Umwelt" der /Q-Gcsamtvarianz herleiten kann. Voraussetzung hierfür ist die Kenntnis einer mathematisch trivialen, aber in diesem Zusammenhang selten erwähnten Beziehung zwischen zwei Eigenschaften der Normalverteilung, dem durchschnittlichen Abstand zwischen je zweien der in ihr enthaltenen Einzelwerte und der Standardabweichung bzw. Varianz der Verteilung: 23
Z. Psychologie 190-4
346
Z. Psychol. Bd. 190 (1982) IL 4
Wählt man nach dem Zufall Einzelwerte aus einer Normalverteilung aus, so ist der durchschnittliche Abstand zwischen je zweien von ihnen eine Funktion von q 2 (der Standardabweichung der Normalverteilung), nämlich a— 128 a. (Wer sich \Tl
hierüber die volle Anschauung aneignen will, wähle aus einer Tafel normalverteilter Zufallswerte, z. B . von WOLD 1955, beliebige Zahlenpaare aus und ermittle deren durchschnittlichen Abstand.) Beispielsweise würde sich der IQ zwischen je zwei beliebig (etwa nach dem Adreßbuch) ausgewählten Personen durchschnittlich um 1 2 8 X 1 5 Punkte, also um 16,93 Punkte unterscheiden — vorausgesetzt natürlich, die Eichpopulation für den verwendeten /()-Test wäre wirklich repräsentativ für die betreffende Bevölkerung gewesen. ( „ A b s t a n d " = absoluter Wert der Differenz.) Unter Verwendung dieser Beziehung besteht der zuvor angekündigte kurze Herleitungsweg vom durchschnittlichen /(^-Unterschied zwischen erbgleichen Zwillingen zu den Varianzanteilen „ E r b g u t " und „ U m w e l t " der /()-Verteilung aus folgenden fünf Schritten, von denen der erste empirisch, die übrigen rein mathematischer Natur sind: 1. Messung des durchschnittlichen Abstandes zwischen in unterschiedlichen Lebens- und Bildungsumwelten aufgewachsenen erbgleichen Zwillingen. Voraussetzung für die Auswahl dieser Zwillingspaare muß sein, daß die Unterschiedlichkeit ihrer Lebens- und Bildungsumwelten für die allgemeine Variation der /(^-relevanten Umweltanteile in der Bevölkerung repräsentativ ist.
Als Ergebnisse entsprechender Studien sind bisher Durchschnittswerte zwischen 8,5 und 11,6 /(^-Punkten bekanntgeworden (Auswertung von Abb. 82 in KNUSSMANN 1980 aus JENSEN 1970). Als theoretische, veranschaulichende Zahlenbasis für die anschließende Modellrechnung verwende ich den Abstand von 7,57 /(^-Punkten. E r entspräche, wie sich dann zeigen wird, dem Varianzanteils-Verhältnis von 8 0 : 2 0 [%]. (Die entsprechenden Zahlenwerte für die Varianzanteil-Relationen 75 :25 [%] und 70 : 30 [%] wären nur wenig höher, nämlich 8,46 bzw. 9,27 /(^-Punkte. Bei voller Gleichheit genetischer und umweltlicher Einflüsse auf die /(^-Variation, also 50 : 50 [%], hätten erbgleiche, in zufallsmäßig unterschiedlichem Milieu aufgewachsene Zwillinge theoretisch einen durchschnittlichen /(^-Unterschied von 11,97 Punkten.) 2. Aus dem durchschnittlichen Abstand von /(^-Punkten errechnet sich die Standardabweichung a v der zugrunde liegenden Normalverteilung: 1 _ a u = 7 , 5 7 • — y ? r = 6 , 7 1 [/(^-Punkte], £
Diese Normalverteilung repräsentiert die Unterschiedlichkeit der variierenden f/mtfeZieinflüsse auf den gemessenen IQ. Daß diese Einflüsse hier als normalverteilt zu gelten haben, leitet sich daraus her, daß man die IQ-Verteilung unabhängig von der Größe des statistisch selbständigen Umweltbeitrags, d a m i t aber auch für den Fall des Fehlens einen solchen (mHX HaCTOHIiyie H3MeHeHHH.
IIpeRJiaraeMyw MOTO^i-iKy «eMOHCTpHpyioT c no'Mombio npHMepa.
References BENJAMIN, L . S.: Statistical treatment of the law of initial values ( L I V ) in a u t o n o m i c research Psychosom. Med. 25 (1963) 556-566. BENJAMIN, L . S.: Facts and artifacts in using analysis of covariance to „ u n d o " the l a w of initial values. Psychophysiology 4 (1967) 187-206. CRONBACJI, L . J., and FTJBBY, L : HOW we should measure „ c h a n g e " — or should we. Psychol. Bull. 74 (1970) 68-80. FAHRENBERG, I., and MYRTEK M. M . :
Zur Methodik der Verlaufsanalyse: Ausgangswerte, Reak-
tionsgrößen ( R e a k t i v i t ä t ) und Verlaufswerte. Psychol. Beitr. 10 (1967) 58—77. HOWARD, G. S., and DAILEY, P. R . : Response-shift bias:. A source of contamination of self-report measures. J. appl. Psychol. 64 (1979) 144-150. HOWARD, G. S., et al.: Internal invalidity in pretest-posttest self report evaluations and a re-evaluation of retrospective pretests. A p p l . Psychol. Measurement 3 (1979) 1—23. JÖRESKOG, K . G . : A n a l y z i n g psychological
data by structural analysis of covariance matrices.
I n : KRANTZ, D. H., et al. ( E d s . ) ; Contemporary developments in mathematical p s y c h o l o g y . I I . San Franzisco 1974. KRAUSE, B . : Modellansätze zur Komponentenanalyse in der Veränderungsmessung. Z. Psychol. 190 (1982) 170-182. KRAUSE, B., and METZLER, P . : Lehrbuch der angewandten Statistik, Berlin 1982. (in press). LORD, F. M . : Elementary models f o r measuring change. I n :
HARRIS, C. W . ( E d . ) : Problems in
measuring change. Madison 1963. LUDWIG, R . : Methoden der Fehler- und Ausgleichsrechnung. Berlin 1969. LYKKEN, D. T . : Neuropsychology and psychophysiology in personality research. I n : BORGATTA, E. F., and LAMBERT, W . W . ( E d s . ) : Handbook of personality theory and research.
Chicago
1968. MARASCUILO, L . A., and MCSWENNEY, Psychol. Bull. 67 (1967) 401-412. 25*
M.:
Nonparametric
post
hoc
comparisons f o r trend.
380
Z. Psychol. Bd. 190 (1982) II. 4
and STORM, R . : Tafeln der mathematischen Statistik. Leipzig 1 9 7 3 . M., F O R S T E R , F . , and W I T T M A N N , W.: Das Ausgangswertproblem. Z. exper. u. angew. Psych'ol. 24 (1977) 463-491. NOLLAU, V.: Statistische Analysen. Leipzig 1979. THOMPSON, G. H.: A formula to correct for the effect of errors of measurements on the correlation of initial values with gains. J . exp Psychol. 7 (1924) 321—324. THORNDIKE, E. L.: The influence of the chance imperfections of measures upon the relation of initial score to gain or loss. J . exptr. Psychol. 7 (1924) 225—232. W I L D E R , J . : Das Ausgangswertgesetz — ein unbeachtetes biologisches Gesetz; seine Bedeutung fiir Forschung und Praxis. Klin. Woclienschr. 41 {1931) 1889-1893. WINER, B. J . : Statistical principles in experimental design. New York 1962. M Ü L L E R , P . H . , NEUMANN, P . , MYRTEK,
Accepted: January, 15, 1982 Author's address: Dr. sc. B . K R A U S E , Department of Psychology Ilumboldt-University, Oranienburger Str. 18, GDR - 1020 Berlin
From the Department of Psychology, Ilumboldt-University Berlin
Are learning processes evolutionary invariant ? An unproved assumption in psychology of learning revisited 1 B y F.
KLIX
With 5 figures
There are well-known examples of scientific theories for which presuppositions are not explicitly taken into account. It seems to me that in learning theory as it has been developed in the first half of this century at least one such presupposition is included. It is the assumption that the laws of learning are in principle the same in all organisms. Because this statement refers to organisms of very different levels it includes that laws of learning are evolutionary invariant. 2 I should like to explain this presupposition and give reasons that it is false and must be changed in favour of evolutionary dependent, different levels; i. e. Darwinian theory must be included in psychobiological learning theory.
1. On the assumption of evolutionary-independend processes in Psychology and Biology as well With the practices of conditioning the main paradigm of all learning processes seemed to be well-known. PAVLOV (1953) assumed that the conditioned-reaction learning performances in lower organisms can be explained by the same principles as the acquisition of language in human beings. (His so-called second signal system functions in the same way as the receiving of food after a light stimulus with regard to salivary reaction.) PAVLOV himself identified his learning mechanism with the one analyzed by E. L. THORNDIKE. THORNDIKE again favoured the same basic assumption regarding the evolutionary independency of this phenomenon. He mentioned "that the underlying process also might be the same . . . in all animals, including m a n " . This opinion is shared by all behavioristic learning theorists. SKINNER'S s a m e position is well-known. H . F . HARLOW (1959) w r o t e : " . . . it is not 1 Leicht abgeiinderte F a s s u n g eines Vortrages, gehalten auf dem internationalen S y m p o s i u m dor Gesellschaft fur Physikalische und Mathematische Biologie der D D R a m 11. November 1981 in Kiihlungsborn. Die T a g u n g stand unter dem Titel Darwin to-day. 2 I would like to mention in this context that I was especially stimulated to this question by
t h e w o r k of W . H . THORPE ( 1 9 5 6 ) a n d a n a r t i c l e of M. E . BITTERMAN ( 1 9 7 5 ) .
382
Z. Psychol. lid. 190 (1982) H. 4
unreasonable to hypothesize that the fundamental process of learning has probably remained essentially unchanged for near countless million of years". What may be changed with the evolutionary level is the complexity of associations underlying the learning performance instead of its quality: " . . . the conditioned reflex is an universal mechanism of activity . . . in the course of evolution of the animal world there took place a quantitative growth or complication of higher nervous activity" (VORONIN).
What does it mean, this universal paradigm called condition reaction? It may be formulated with the following three statements: 1. If two stimuli and S2 respectively are perceptually related, one of them is neutral, the other related to an unconditioned response, then the neutral stimulus acquires the priming function for that response, it is "conditioned". 2. The main factor of this (and therewith all) learning procedures is the reward (or reinforcement). Reward (reinforcement) links reactions to stimuli. This is valid for simple reactions such as salivary response as well as for complex activities like approach or avoidance-learning. 3. The stronger the reinforcement the stronger the conncction between stimulus- and reaction and the faster the learning process. These three statements are the essentials of the classical learning theory, elaborated by biologists and psychologists as well. • Accordingly, learning is an organismic process which came into being outside the play of the Darwinian evolutionary factors. This might be possible for two reasons, namely: 1. Learning processes are universally organismic invariants because of their being optimal procedures of adaptivity. They allow a priori and in any case the best adaptive strategy. Evolutionary factors cannot make them better, but only worse procedures can arise and become removed due to their disadvantage in adaptivity. Or: 2. Learning processes are without any biological significance so that they have been dragged unchanged through the selection filters. I should like to begin with sentence. 2. It seems trivially refutable. Notwithstanding its detailed analysis leads us to some surprising consequences. We shift the point of view and ask: Why did learning processes during evolution come into being and why did they become dominating with progressing evolutionary levels in the development of species? In other words: Why did the historically long lasting stable, instinctive or innate behavior patterns not carry through in phylogenesises the possibly best adaptive principle? One can find the answer in visiting those organisms whose behavior control is mainly due to innate behavior patterns. Lower vertebrates or insects, bees or spiders might be examples. The following rule seems to be valid: The more stable and the more homogeneous the biotop in the sequence of generations is, the more prevailing are instinctive behavior patterns in behavior control and vice versa:
F. KLIX, Are learning processes e v o l u t i o n a r y i n v a r i a n t
383
The larger the varieties in any life space the more dominate individually adaptive, i. e. learning dependent? behavior patterns. The reason seems to be clear: Evolutionary laws have as a consequence that innate patterns of-animal behavior may originate and survive only in long lasting stationary environments. The lay-out of instinctive behavior patterns is related to a mean of environmental properties, i. e. an environment which may be expected with sufficient probability. Its adaptive value is the higher the more stable long-lasting environmental conditions remain unchanged. Nonstationary environmental conditions disadvantage innate behavior patterns and faciliate learning-dependent behavior patterns as well.' Learning dependent as well as innate behavior patterns have one essential point in common: They use the regularities in the environment for predicting events to be expected. They both are predictive in their function. However, while innate patterns receive their predictive value during long-lasting generation sequences, the learning mechanisms use short term regularities, regularities which may shift already within a short life span period. Here we become aware of one essential difference between both behavior-adjusting principles. It is forgetting. While forgetting of specie's memory is maladaptive (and therefore removed by evolution), forgetting of the learned patterns may be highly adaptive and favoured in evolution in all cases where the regularities in the environment are shifted or have vanished. Regarding the interlink between the evolution of species and the share of learned patterns we have to recognize: The variety of the environment depends not only on the environment itself but in the same sense on the evolutionary level of the organism. Running and climbing terrestricals are confronted with the highest variety of possible biotop upon our blue planet. Their share of learning depending patterns is by far greater than in birds or fishspecies. Essentially the yare the mammals which govern these biotops. Lower animals are surviving in local stable niches where high instinctive shares are appropriate. Security patterns such as mimicry are often to be met. Thus the analysis of sentence 2 leads us to the conclusion that learning processes are a result of Darwinian evolutionary factors. Factors, which influence the development to higher organisms, especially terrestrical mammals, lead to an increasing variety of life spaces which makes its calculability more difficult and more risky. Learning mechanisms are appropriate to reduce that risk by using temporarily valid information for predicting events. The rise of learning performances is a consequence of evolutionary conditions. Insofar sentence 2. Somewhat more difficult are things with regard to sentence 1: Are the laws of learning evolutionary invariant? Without doubt: they arise by evolutionary conditions (sentence 2) but: once come into being, are they optimal and not shifted by these conditions? Instead of engaging in comparative considerations of learning behavior I would like to cite only one example which might be able to support some doubts regarding this postulate. It makes us doubt that the assumption of more than quantitative growth in learning capabilities is correct. Figures 1 (after B I T T E R M A N , 1977) shows choice reaction behavior of goldfishes
384
Z. P s y c h o l . B d . 190 (1982) H. 4
too
10
20 days
30
40
10
20
30
200 trial blocks
Fig. 1. Choice reaction behavior of goldfishes (left) a n d rhesus m o n k e y s (right) t r a i n e d with a 70 : 30 reward ratio a n d shifted to a 50 : 50 a n d (right side) 30 : 70 ratio ( a f t e r BlTTERMAN. 1975)
(left). The probability of reward is 70 : 30 and 50 : 50 respectively for left or right decisions. On the right side we have choice reaction behavior under comparable conditions performed by rhesus monkeys. Figures 1 indicates that the effectiveness in probability-learning is quite different. Rhesus monkeys are extremely faster, they shift more rapid a change, and they learn the inversion very easily. What is the reason? Is the amount of reward different? This has been checked and was not valid. Are there different sensoric capabilities with regard to the requirement? Surely not. Or is the capability to predict among statistically distributed events faster and more correct? Probably it is. But what does this mean? Is it due to a larger amount of associations between the.events? If one used comparable results with human subjects to explain that difference, the assumption of counting events must be eliminated. What happens seems to be more, likely an inductive inference, i. e. a generalization across frequency proportions linked with an (unconscious) decision threshold. It is learning, but prediction seems to be caused by (unconscious) inferences in a time series analysis and not due to step-by-step reward evaluations. It is an hypothesis why rhesus monkey perform so much better, namely that they use a more efficient procedure for calculating proportions. Now we are aware that there might be qualitative discontinuities in learning-performances among organisms of different evolutionary levels. Processing of information, mediated by reinforcements, seems to be changed by cognitive capabilities as we can fin^ them among pre-human primates. Now I would like to turn to sentence (1) a little more in detail.
2. On qualitative diversities in learning performances Following W. H. T h o r p e , J . K o x o r s k i and other systematizers of learning phenomenae one can conclude that habituation of an inborn reaction is the most primitive kind of learning. It is a universally adaptive phenomenon to be found in almost all organisms including protozoa. In experiments with Aplysia californica, E . K e n d a l (1980) analysed the biochemical background. He found that under habituation conditions the calcium influx is reduced which in turn inhibits the release of the transmitter Norepinephrin. Thus the sensory linkage is broken and makes the motor reaction vanish.
F. K l i x , Are learning processes evolutionary invariant
s7 — Rf
ST
si
385
s"
si
R,
Sj.O,
Fig. 2. Learning schema for habituation (1) and conditioned reaction (2). S^, Situation properties, Ri: reaction to 5,-; 0V{ —, + ) : evaluation of the properties with impacts to motivational forces 0 „ Left side: general conditions; middle: the learning situation; right: the learning result
4.
a-i. otj
tSj 0„)
Si , Oy, Hy
Hv
»¡va-j
S; o ; orj
«i V (Ri 27j) A r
ijk f «rijJ«)
A r
ijk (0"i.k>
Fig. 3. Learning schema for (3) instrumental conditioning (4) trial and error learning a nd (5) insight learning: . . ., An: activities ^related to situational properties, shifting them from one state to another one until one shift relaxes the motive state (4). Hypotheses formation on Sj, checked by actions .1?, Aj+m, respectively. The outcome controlles the consecutive behavior. (5) : Insight:CT^f 2 : action programs in memory, related to situational properties. a g : goal state. List of relations between properties and actions; A'"¡jisi^i k) : concatenation of an action sequence, due to situational (a,) and goal properties (ffg). The difference guides the selection of actions until the goal is realized.
386
Z. Psychol. Bd. 190 (1982) H. 4
Conditioned reactions are provable among allmost all metazoes. Figure 2 indicates the conditions (left), the learning state (middle) as well as the learning result of these two kinds of individual adaptivity (right). As more complex levels in learning behavior, instrumental conditioning, trial and error learning as well as insight are discussed in literature. They are explained with figure 3. These last three kinds are linked with self-acting, spontaneous movements driven by actual'needs or motives. These kinds predominate in higher animals especially among mammals. But it is impossible to attach different evolutionary levels to these three different kinds of learning levels. The diversity of evolutionary courses produces a large variety of adaptive phenomena which are interlinked with specific needs and innate behavior patterns. Our goldfish-rhesus example reminds us that behind superficially similar performances quite different capabilities may be in the background. Instrumental conditioning and trial and error learning seem to be very similar. A given motive 0~ produces behavior patterns A i t j of which one reduces the given need by A i ( S i - - S j ' ) ^ =>{0~ ->-0 + ). This effect is fixed in memory and applicable under similar internal and external circumstances. But there is also the well-known phenomenon of alternative choice reactions combined with a delayed response situation (FISCHEL, 1936; HUNT 1944). A dog looks back during the baiting of two food places 1 and 2. Then the animal is turned around itself so that the direction orientation is dissolved. Food is "in about" one direction. The animal starts and finds place 1 empty. Instead of being punished, immediately after this experience the dog turns to place 2. Place 1 was not at all reinforcing itself, rather it bore the information that place 2 should be the remaining baited place. A n o n rewarded decision favours an alternative: Such a procedure is completely what happens with hypothesis-checking. The decision itself is analogous to what we may call an unconscious inference. H. v. HELMHOLTZ was the first who drew such a conclusion from animal learning behavior. The evolutionary power of such a learning procedure is obvious: Hypotheses-driven decision-making is more effective because it uses preconfirmed information as knowledge from memory. The learning expenditure is reduced, the procedure is shortened and realizes the same goal more effectively than the more stupid instrumental conditioning. This links learning behavior with the phenomenon of animal intelligence. I t is related to the effectiveness in the use of individual memory c'ontents (i. e. learning results) for new adaptivity. Hypothesis-driven learning bears the transition to the different kinds of cognitive learning and reasoning. I am able only to outline some general characteristics of that type of learning behavior. Cognitive learning is not only the use of memory contents for decisions in learning situations. It includes inference mechanism in a definite sense, namely in deriving implicitly stored knowledge. The early modes of inferential (or cognitive) learning may be found among pre-human primates. I should like to demonstrate the main point by two examples: D. J. GILLAN (1980) demonstrated in his experiments with chimpanzees that
F. KLIX, Arc learning processes evolutionary invariant
387
they (1) are in the position to draw transitive inferences and (2) that they are able to realize some kind of deductive reasoning in their behavior decisions. Referring to (1) the author rewarded the pairs
F+E-,
E+D-,
D+C-,
C+B-,
B+A-
in the sense of the sign + or — ( + meaning: reward, — : no reward). In test trials the animals receive the EB as well as the EC condition. They choose E correctly with 88 % i n the first and with 83 % under the second condition. It is quite the same performance we realize when we draw from A>B, B>C the conclusion A C. It is the derivation of implicitly stored knowledge by inferences. Referring to (2). A kind of deductive reasoning was recognized by GLLLAN in the following context: Behind a wall, invisible for the animals, there are two hiding places for food,, say p and q (see fig. 4). Two young chimpanzees, say A and B, ob-
q+
q P
P+
V
© q+ p
p
a/ (p v q) — •
{,-p
q)
Fig. 4. Experiment with chimpanzees, performed by D. Y . GILLAN. p,q: A , B : the animals; further description see text
hidejl baiting places;
serve how food seems to be carried to the places. A is allowed to go in the one direction. It prefers direction p. Having seen this direction, chimpanzee B is removed from the scene. It becomes returned when A is coming back with a fruit in its hand. If
388
Z. Psychol. Bel. 190 (1982) II. 4
allowed, B starts immediately in direction of q. The cognitive background of such a behavior decision is like a disjunctive syllogism: (pV?Mr
p^q)
Jt is use of knowledge, but in a revised, indirect mode. Inferences allow to derive implicitly stored knowledge. Cognitive procedures allow to predict and derive the right decision without any overt false trial. It is exactly what W. K o h l e r denominated "insight learning". Insight is not entirely mediated by perceptual information but rather based on mental or cognitive operations which become applied to stored knowledge. This kind of learning is not reactive, it is not primarily guided by reward steps, but instead it is generative in nature. The generative power is due to producing rules for which inductive or deductive reasoning are two examples. Construction of problem solving strategies, top-down or bottom-up techniques of information processing, heuristic techniques — all of them being examples for a learning dependent use of procedural knowledge. We do not know definitely how procedural knowledge is acquired. We know that there are mutual influences with language development of human being. Pertinent investigations reveal that local reward of sentence understanding is by far insufficient to understand the development of language comprehension and generation. The derivation of completely new composite nouns, the use of own morphological derivations and the transfer of semantic structures from one area of knowledge to another one indicates that the acquisition of rules for information processing and producing as well is the crucial point for understanding cognitive development of human being. What we more definitely know is that and how cognitive procedures are used for the construction of abstract concepts or abstract knowledge in general. With the help of cognitive procedures we are also able to construct the meta-level in our cognitive world: as to establish knowledge about our knowledge, mental skills or beliefs. In my book on the origin of human intelligence (Erwachendes Denken) I have demonstrated that the different historical figures or number systems reveal some information on the function modes of procedural knowledge. They can be used for a taxonomy of cognitive functions. In the cited book I gave reasons that these results of learning-dependent performances are. not reducible to evolutional laws. Basic motives are derivable from social contexts and different modes in the division of labour as it came into being with the development of human society. Nevertheless it is amusing to look for a moment at the psychobiological value of the more abstract kinds of human thinking and the acquisition of its accomplishments. With the diversity of biotops evolution again bears increasing constraints for adaptive patterns in the given environments. Increasing specialisation for appropriate adaptivity is the consequence. The formation of intelligence as a result of (pre-dominantly) learning capability creates kinds of adaptivity which are not restricted to special kinds of biotops. Just look at our two examples: The exployment of transitive relations in the information offered is independent of any special life space. Deductive reasoning re-
389
F. K l i x , Are learning processes evolutionary invariant
mains valid in all cases such as the detection of causality. With the cognitive background of learning an increasing independency of any specific environment comes into being. (The active change of environmental properties according to the own need is another consequence). The results of cognitive learning in comparison with those of conditioning reminds me of the difference between natural and computer languages. Computer languages are precisely differentiated and adaptable to a well defined, closed class of problem requirements (taken as a well-defined environment). Computer languages are optimal for that purpose. Natural languages are not so precise, they are more fuzzy, but optimal with regard to the infinite requirements of a non specific environment. The analogy holds for learning: Cognitive learning is nonspecialized adaptive behavior. It is thereby applicable to an infinite variety of different environmental conditions. We had asked if learning processes are derivable from any unique principle such as conditioning or if there are qualitative jumps in the functional principles of learning, already among animals. How such jumps might originate, this is, as I believe, subject of applied systems theory in biology. System theory knows solutions of that problem. I would like to restrict myself in this context to the statement that there are different levels of learning capabilities. One which is linked with the conditioning principle (habituation,, conditioned reaction, operant or instrumental conditioning might be subclasses) and another one which is linked with cognitive procedures in the Learning b y principles of
Influence of language
Types
Main Information Source for decision
Habituation CONDITIONING
Condit. reflex *
Environmental properties
Instrumental (operant) conditioning
Hypothesis formation * Inductive, deductive inferences REASONING Analogical reasoning *
Long-term-memory properties : Concepts, relations, procedures
Rule learning (Heuristic techniques)
Fig. 5. Main differences of learning capabilities: learning by conditioning and learning by reasoning
Z. Psychol. Bd. 190 (1982) II. 4
390
use of i n t e r n a l i n f o r m a t i o n ( h y p o t h e s e s - d r i v e n b e h a v i o r , reasoning o r inferences), a n d c o n s t r u c t i v e rules f o r b e h a v i o r p a t t e r n s (such as h e u r i s t i c o r analogical r e a s o n ing) m i g h t b e subclasses (fig. 5). B e t w e e n t h e s e k i n d s of l e a r n i n g t h e r e a r e p r o b a b l y d i f f e r e n c e s in q u a l i t y . I t remains t o be e x p l a i n e d h o w such q u a l i t y changes m a y occur. P r o b a b l y n o t as m a c r o m u t a t i o n s . I m e n t i o n e d s y s t e m - t h e o r e t i c a l solutions in t h a t c o n t e x t . Altogether I h a v e indicated t h a t and how evolutionary factors, detected
by
CHAKLES DARWIN, a r e a p p r o p r i a t e f o r u n d e r s t a n d i n g t h e g r o w t h of l e a r n i n g p r o cesses in e v o l u t i o n a n d t h e q u a l i t a t i v e changes in l e a r n i n g capabilities as w e l l .
Summary The paper regards one basic question: are all learning mechanisms due to the same principle, namely the conditioned reflex paradigm? It is argued that this behavioristic presupposition is false. During the evolution of higher organisms qualitative new learning mechanisms come into being; learning by reasoning or (equivalent) learning by inferences. Examples are given which stress the point that there is a qualitative jump in learning efficiency during evolutionary steps.
Zusammenfassung Es wird die Frage erörtert, ob das Prinzip der bedingten Reaktion die einzige Lernform ist. Es müßte sich dann um ein evolutionsgeschichtlich invariantes Phänomen handeln. Behavioristische Lerntheorien gehen davon ans, daß dies richtig ist: der Mechanismus des Lernens ist immer der gleiche, nur seine Komplexität nimmt mit der Evolutionshöhe zu. Im vorliegenden Text wird begründet, daß dies nicht richtig ist, sondern daß mit der Höherentwicklung der Arten qualitativ höhere Lernformen entstehen. Sie werden unter dem Begriff des inferentiellen Lernens zusammengefaßt. Beispiele dafür werden angeführt.
Pe3H>Me OöcyjKAaioT Bonpoc,
HHH.
ECJIH
HBJIHGTCH JIH
npntmnii
ycnoBHHX
CBH3eä emiHCTBeHHOii
(jjopMoft
oßyqe-
CMJIO 6H T a K , T o r ß a HMeJIOCb 6 n JlHBapnaHTHklii ( f i e H O M e H B H C T O p H H 3BOJIIOHHM.
E e x a B H o p i i c T H i i e c K H e T e o p i r a OßYQEHHH "HCXO^HT OT T o r o , HTO BTO n p a B H j i b H o : M6xaHH3 M o 6 y -
HCHHH HBJINCTCH Bcerjja TEM ®e caMHM, TOJIBKO ero KOMITJIGKCHOCTB noBHinaeTCH c ypoBHe M OBOJIMIJHH. B npeni>HBJieHHOM TeKCTe oöocHOBbiBaiOT, HTO BTO He n p a B H J i t . n o , N0T0MY HTO C
flajibHeiiiiiHM
pa3BHTHeM BHflOB B03HHKai0T KaTOCTBeHHO ÖOJtee BHCOKHe $ O p M H OSyqeHHH. OxBaTblBaiOT 3TH (JiopMH n o a noHHTMeM HH(|iepeHi(HanbHoro o6yqeHHH, n 0 K a 3 H B a i 0 T una HHX n p u M e p u .
References BITTERMAN, M. E . : The Comparative Analysis of Learning. Science 188 (1975) 699—709. FISCHEL, W . : Psyche und Leistung der Tiere. Berlin 1938. GILLAN, D. J . : Ascent of Apes. In: Human and Animal Mind. 2 5 0 1 Dahlem Workshop. 1981.
F. KLIX, Arc learning processes evolutionary invariant
391
KABLOW, H. F.: IN: KOCH, S. (Ed.): Psychology: A Study of a Science. Vol. 2. New York 1959. P. 53Iff. HUNT, J . Me V.: Personality and the Behavior Disorders. New York 1944. KENDAL, E. R. : Cellular Basis of Behavior. An Introduction to Behavioural Neurobiology. New ' York 1976 PAVLOV, I. P. : Gesammelte Werke, Bd. 3. Berlin 1953. SCHNEIRLA, T . C . : S e l e c t i c w r i t i n g s . IN: ARONSON, L . R . , TOBACH, E . , ROSENBLATT, J . S . , a n d
LEHBMAN, C. S. (Ed.) New York 1972. SKINNER, B. F . : In: KOCH, S. (Ed.): Psychology: A Study of a Science. Vol. 2. New York 1959. P. 374 ff. THORPE, W. II. : Learning and Instinct in Animals. London 1956. VORONIN, L. G . : P s y c h o l . B u l l . 59 (1962).
Accepted: March, 29, 1982 Author's address: Prof. Dr. F. KLIX, Department of Psychology Humboldt-University, Oranienburger Str. 18, GDR - 1020 Berlin
Aus der Sektion Psychologie der Humboldt-Universität Berlin
Systeme der Künstlichen Intelligenz und Kognitive Psychologie Von
H.SYDOW
Vor 10 J a h r e n wurde ich gebeten, einen Vortrag über Probleme der Maschinellen Intelligenz auf der Jahrestagung der Mathematischen Gesellschaft zu halten (SYDOW, 1972). In diesem Übersichtsvortrag waren damals als wichtigste Teilgebiete das Problemlösen, das Theorembeweisen, Frage-Antwort-Systeme, die Roboterforschung, die Zeichenerkennung und die Simulation kognitiver Prozesse zu bezeichnen. Einige dieser Gebiete befanden sich in einem optimistischen Experimentierstadium. Spezialisten der mathematischen Logik schmunzelten noch über die bescheidene Leistungsfähigkeit der Programme zum automatischen Theorembeweisen. Die Ausführungen zum ersten japanischen Roboter, der Spielzeugbausteine nach Grund-, Auf- und Seitenriß zu einer geforderten Konfiguration ordnete, erschienen sicher manchem als Kuriosum. Und an der Möglichkeit, wirklich kreative intelligente Prozesse zu simulieren, mit technischen Mitteln nachzubilden, bestand begründeter Zweifel. Die Situation h a t sich in den zurückliegenden 10 Jahren sehr verändert. In die sem F ü n f j a h r p l a n werden in der D D R 45000 Roboter eingesetzt und die durch sie erreichbare Steigerung der Arbeitsproduktivität soll noch in diesem J a h r f ü n f t wirksam werden. Verfahren der Zeichen- und Bilderkennung werden vielseitig angewendet. Interdisziplinäre Forschungsarbeiten der Rechentechnik, Mathematik, Linguistik und Psychologie haben zu leistungsfähigen Systemen der künstlichen Intelligenz geführt, und die Erforschung geistiger Prozesse selbst h a t sich hinsichtlich Gegenstand wie experimenteller und theoretischer Methoden stark gewandelt. Die Entwicklung der Mikroelektronik und der Robotertechnik h a t auch der Psychologie neue Aufgaben gestellt. Di3 Projektierung und Einführung automatisierter Arbeitsplätze auf der Grundlage der Bildschirmtechnik stellen vielseitige Anforderungen an die Psychologie. Ebenso muß ein breites Spektrum von Aufgaben in Verbindung mit der Robotertechnik gesehen werden. Es lassen sich heute vier Aufgabenbereiche angeben. — Bei der Projektierung von intelligenten Robotern werden Gesetzmäßigkeiten und Prinzipien kognitiver Prozesse berücksichtigt. Auf diesen P u n k t soll im weiteren ausführlicher eingegangen werden. — Programmierung von und Fehlerdiagnose bei Robotern erfordern den Einsatz
H. SYDOW, Künstliche Intelligenz U. Kognitive Psychologie
393
automatisierter Arbeitsplätze und sind in ihrer Effektivität auch von arbeitspsychologischen Gestaltungsprinzipien bestimmt. — Die Einsatzvorbereitung für Roboter stellt vielseitige Probleme. Sie reichen von der Auswahl der Arbeitsfunktionen, die von Robotern ausgeführt werden sollen, bis hin zur Bestimmung der organisatorischen Struktur des einsatzvorbereitenden Kollektivs. Die Auswahl der Arbeitsfunktionen ist zunehmend bei der Projektierung neuer Technologien und nicht erst von bestehenden Arbeitsplätzen und Technologien ausgehend vorzunehmen. — Der Nutzen des Einsatzes von Robotern wird erst voll realisiert, wenn die sozialen Auswirkungen gemeistert werden. Frei werdende Arbeitskräfte sind qualifizierungsgerecht, oft auch territorial, umzusetzen. Werktätige sind für neue Arbeitsaufgaben, die sich aus der Robotertechnik ergeben, zu qualifizieren. Für Werktätige, die im System Mensch—Roboter arbeiten, ist ein anspruchsvoller Arbeitsinhalt zu sichern, damit negative Folgen für die Arbeitsmotivation vermieden werden können. Die erste Generation von Robotern konnte erst in geringem Umfang (zu etwa 2—3 %) Arbeitskräfte freisetzen, die in der Teilefertigung und Montage beschäftigt waren. Die zweite und vor allem die dritte Generation sollen dies bei dem überwiegenden Teil dieser Arbeitskräfte bewirken. Neue Leistungseigenschaften sind dazu gefordert. Intelligente Roboter „zeichnen sich durch rationelles Reagieren auf nicht vorhersehbare oder nicht programmierbare Situationen aus, durch Lernfähigkeit und die dazu benötigte Situationserkennung sowie durch einfache Belehrungsmöglichkeiten auf hohem Sprachriiveau" (KEMPE, 1981). Im einzelnen folgen daraus diese Forderungen: — Roboter sollen Objekte identifizieren, ihre Position und Orientierung bestimmen. Sie sollen dies auch können, wenn Teile dieser Objekte durch andere Objekte verdeckt sind. Sie sollen Konfigurationen von Objekten, sogenannte Szenen erkennen. — Roboter sollten die natürliche Sprache verstehen, damit ihre Belehrung und ihre Steuerung in einfacher Form und ohne besondere Spezialkenntnisse erfolgen kann. — Ausgehend von Zielen sollen intelligente Roboter Teilziele formulieren und die Aufgabe soweit untersetzen, daß ein Handlungsplan entsteht. Sie müssen dabei komplexe Entscheidungen fällen, aus vorhandenem Wissen neues Wissen deduzieren oder sogar vorhandenes Wissen verallgemeinern beziehungsweise im Sinne einer Analogietechnik nutzen. — Pläne sind sensorgesteuert adaptiv auszuführen, an neue oder wechselnde Bedingungen anzupassen. Intelligente Roboter sollen also erkennen, „denken" und. vernünftig reagieren können und müssen dazu eine ganze Menge über das wissen, was sie tun sollen. Sind wir mit diesen Forderungen zu weit gegangen? Sind solche Roboter überhaupt realisierbar und wenn ja zu welchen Kosten? Jede der vier Forderungen umgreift ein breites Spektrum. So reicht die Sprach26
Z.Psychologie 190-4
394
Z. Psycho!. Bd. 190 (1982) Ii. 4
erkennung z. B. von der Erkennung eines beschränkten Repertoires von 20 Worten bis hin zum Verstehen eines komplizierten Textes. Man sollte also nicht abwarten, bis jede Forderung auf dem höchsten Niveau erfüllt ist, aber auch nicht die Augen davor verschließen, daß z. T. langfristige Aufgaben der Grundlagenforschung abzustecken sind. Die in fünf Fachgruppen erfolgende Grundlagenforschung zur Robotertechnik widmet sich den Fragen der Einsatzvorbereitung, den mechanischen Baugruppen, Antriebssystemen, Steuerungen und Meßsystemen sowie den Erkennungssystemen ( W O L F U. MASSOW, 1 9 8 1 ) . Die Forderung nach Sensorsystemen, gemeint sind Farbsensoren, Sprachsensoren, Bilderkennungs- und Kraftsensoren, deutet an, daß es um die Erarbeitung leistungsfähiger und ökonomisch vertretbarer Lösungen geht. Im Vordergrund steht nicht das exklusive Einzelsystem, sondern der Masseneinsatz auf der Grundlage neuer Lösungen der Mikroelektronik. Daneben sind freilich Anwendungsfälle denkbar, die einen hohen Kostenaufwand für einzelne Systeme rechtfertigen, zum Beispiel Reparaturroboter für Kernkraftwerke. Wenn intelligente Roboter nicht nur erkennen, sondern auch planen und adaptiv Handlungen realisieren sollen, dann sind Ergebnisse der Grundlagenforschung zu automatischen Planungsprozessen sowie zur Repräsentation, des dazu erforderlichen Wissens erforderlich. Ausgehend von den vier Forderungen an intelligente Roboter kann'nun gefragt werden, welche Forschungen dazu in der Künstlichen Intelligenz durchgeführt werden. Die im Abstand von zwei Jahren stattfindenden Internationalen Konferenzen zur Künstlichen Intelligenz geben eine erste Antwort darauf mit der Anzahl von Vorträgen, die zu einzelnen Forschungsgebieten gehalten wurden. An der Spitze liegen die Verarbeitung natürlicher Sprache und die Bildverarbeitung. Als nächstes folgen die Repräsentation von Wissen und der Erwerb von Wissen, danach Problemlösen und Suchprozesse sowie Theorembeweisen, Roboterforschung und automatisches Programmieren. Während vor zehn Jahren Basisfunktionen der Künstlichen Intelligenz wie Lernen, Klassifizieren, Problemlösen die Programme der Konferenzen bestimmten, sind jetzt die Vorträge und Symposien stärker auf die Realisierung ganzer Systeme orientiert. Am häufigsten werden spezielle Forschungsergebnisse in ihrem Nutzen für Systeme der Bildverarbeitung, Expertsysteme, Roboter, automatisches Programmieren und natürlich-sprachliches Interface mit Datenbanken begründet. Dabei ist es natürlich, daß Verfahren der Bildverarbeitung auch in der Roboterforschung zu finden sind. Ebenso sind automatische Planungsprozesse, Untersuchungen zur Repräsentation von Wissen und die Verarbeitung natürlicher Sprache unter den Forschungsarbeiten für verschiedene Systeme zu finden. Es ist sicher kein Zufall, daß diese vier Forschungsgebiete recht gut den vier Forderungen entsprechen, die an intelligente Roboter gestellt werden. Und in der Tat scheinen das Sehen des Menschen, das Sprachverstehen, die Struktur
I I . SYDOW, K ü n s t l i c h e I n t e l l i g e n z 11. K o g n i t i v e
Psychologie
395
des semantischen Gedächtnisses und Denkprozesse wesentliche Vorzüge des Menschen im Vergleich zu bisher bestehenden Systemen der künstlichen Intelligenz auszuweisen. Ein Blick auf diese vier Leistungsbereiche des Menschen zeigt zugleich, daß es sich dabei nicht um autonome Teilsysteme handeln kann. Sehen, Sprach verstehen und Planen sind ohne eine entsprechende Wissensbasis nicht denkbar. Unser Wissen wiederum erwerben wir aus visueller und sprachlicher Information unter Einsatz von Denkprozessen und der praktisch-gegenständlichen Tätigkeit, die zugleich der ontogenetische und phylogenetische Ursprung des Psychischen ist. Visuelle Wahrnehmung und Sprachverstehen sind ihrerseits nicht passive psychische Prozesse, sondern schließen in vielen Fällen Denkleistungen ein. So sind die Leistungseigenschaften des Menschen dadurch bestimmt, daß verschiedene kognitive, motorische und emotionalbewertende Komponenten zusammenwirken. Eine zentrale Stellung in diesem Gesamtsystem besitzt das semantische Gedächtnis, da es am deutlichsten die individuell angeeignete gesellschaftliche Erfahrung des Menschen als soziales Wesen repräsentiert. Freilich kann die Erforschung der Erkenntnisprozesse des Menschen nicht immer vom Ganzen ausgehen, sondern muß vernünftige Analyseeinheiten als Teilsysteme ausgliedern. Diese Einheiten sind mit W Y G O T S K I ( 1 9 6 4 ) so zu wählen, daß sie wesentliche Eigenschaften des Ganzen besitzen. Mit der Bestimmung von Funktionsblöcken des Gedächtnisses ( K L I X , 1 9 7 7 ) , von . Suchprozessen im Kurz- und Langzeitgedächtnis ( K L I X , 1 9 7 7 ; G E I S S L E K , 1 9 7 9 ) , der hierarchischen Struktur von Planungsprozessen ( S Y D O W , 1 9 7 6 ) , des Zusammenwirkens von semantischen und syntaktischen Komponenten beim Sprach verstehen ( D ' A R C A I S u. S C H R E T J D E R , 1 9 8 0 ) und der Struktur des menschlichen Gedächtnisses ( K L I X , 1978; K L U W E u. S P A D A , 1 9 8 1 ) wurden solche wesentlichen Eigenschaften des ganzen kognitiven Systems identifiziert. Wir wollen nun für drei Teilgebiete der Künstlichen Intelligenz näher betrachten, wie Erkenntnisse der Kognitiven Psychologie Berücksichtigung fanden bzw. weitere Entwicklungen anregen und damit auch Beiträge zur Roboterforschung liefern.
Repräsentation von Wissen Das Intelligenzniveau eines Systems der Künstlichen Intelligenz ist eine Funktion des Wissens, das in ihm über seine Umwelt und die Aufgabe gespeichert ist, die es ausführen soll. Der Nutzen dieses Wissens hängt von der Form ab, in der es repräsentiert und strukturiert ist. Drei Repräsentationsformen von Wissen werden gegenwärtig in der Künstlichen Intelligenz verwendet. Das sind Schemata (auch frames oder scripts genannt), semantische Netze und Regelsysteme (die sogenannten produetion systems). Grundidee der Ordnung des Wissens in Schemata ist die Auffassung, daß wesentliche Bereiche der Tätigkeit in Form von Routineprogrammen realisiert werden. Man denke etwa an relativ gleichbleibende .Handlungsfolgen beim Auf26'
396
Z. Psychol. Bd. 190 (1982) H. 4
stehen, beim Weg zur Arbeit, beim Einkaufen in einer Kaufhalle, beim Besuch eines Restaurants. Die wichtigsten Teilhandlungen in ihren Beziehungen zueinander können in einem Schema dargestellt werden. Es enthält als Einheiten Personen und Objekte, die sie charakterisierenden Eigenschaften und die zwischen ihnen bestehenden Relationen, durch die zeitliche, räumliche oder kausale Zusammenhänge einer Handlungsfolge abgebildet werden. Typische Situationen werden leicht als zugehörig zu einem der gespeicherten Schemata erkannt. Sätze wie „Gähnend angelte er nach dem Pantoffel", „Bereits nach einer halben Stunde konnte er die Speisekarte einsehen" oder „Sie ging mit dem Wagen zur Kasse" werden schnell verstanden und in den entsprechenden Kontext eingeordnet, obwohl solche Wortpaare wie gähnen und angeln oder Wagen und Kasse ohne den Kontext nicht notwendig verknüpfte Begriffe sind. Die Vorhersage weiterer Teilhandlungen gelingt mit hoher Sicherheit. Neues, aber zum Schema gehörendes Wissen kann schnell eingeordnet werden. Diesen Vorteilen steht das Problem gegenüber, daß neue, unbekannte Situationen nicht verstanden und semantisch mehrdeutige Sachverhalte eventuell nicht zutreffend analysiert werden. In psychologischen Analysen konnte eine Vielzahl von Schemata festgestellt werden, die kaum Unterschiede zwischen verschiedenen Personen aufweisen und die Grundlage einer schnellen Verständigung mit wenigen Worten sind. Handlungsfolgen, die nur lokal an variierende Bedingungen anzupassen und in ihrem globalen Aufbau wiederholt unverändert auszuführen, sind, werden vermutlich sehr effektiv als Schemata dargestellt. Semantische Netze enthalten das Wissen über eine Menge von Begriffen, indem diese als Knoten mit den definierenden Merkmalen und Relationen zwischen Begriffen als interpretierte Kanten dargestellt werden. Jeder Begriff geht damit verschiedene mögliche Beziehungen zu anderen Begriffen ein, je nachdem, in welchem Kontext und mit welcher spezifischen Bedeutung er verwendet wird. Das Verstehen natürlicher Sprache, die nicht auf die Beschreibung typischer Situationen oder Handlungen eingeschränkt ist, setzt die Repräsentation des begrifflichen Wissens in derartigen locker strukturierten semantischen Netzen voraus. Zwar ist der Aufwand, die Bedeutung eines Satzes mit diesem Netz zu bestimmen, größer als bei Schemata. Dagegen lassen sich mit dem Netz aus Sätzen oder Texten Konsequenzen unter sehr verschiedenen Kontexten ableiten, dies allerdings ebenfalls mit größerem Aufwand. Das menschliche begriffliche Gedächtnis ist vermutlich in seiner Universalität (verglichen mit einer kleinen Menge von Schemata) am besten als semantisches Netz vorzustellen. Es ist leicht durch neue Information ergänzbar, bietet die Möglichkeit, Wissen explizit und implizit, d. h. durch Inferenzen ableitbar zu speichern und damit der Speicherökonomie zu dienen. Das menschliche Gedächtnis hat jedoch den Vorzug, eine Art Symbiose zwischen den homogenen semantischen Netzen und einer Menge von Schemata zu sein. Denn mitunter werden durch einen Satz oder einzelne Wörter ganze Bereiche des semantischen Gedächtnisses voraktiviert, wodurch im Kontext die schnellere Realisierung von Suchprozessen erfolgt.
IT. SYDOW, Künstliche Intelligenz u. Kognitive Psychologie
397
Soll das Wissen vor allem für Planungsprozesse oder Inferenzen genutzt werden, dann bietet sich eine Repräsentation durch Regelsysteme an. Hierbei besteht das Wissen aus elementaren Regeln, die aus einer Bedingung und einer Aktion oder Konsequenz bestehen. Eine geordnete Menge solcher Regeln mit der darüber definierten Abarbeitungsvorschrift erlaubt die Aufstellung von Aktionsfolgen in Abhängigkeit von wechselnden Bedingungen. Unschwer ist zu erkennen, daß bei. dieser Repräsentationsform der Markowsche Algorithmenbegriff Pate stand. Jede Anwendung einer Regel auf aktuelle Bedingungen erzeugt neue Bedingungen und ermöglicht die Anwendung bisher nicht anwendbarer Regeln. Typische Beispiele sind die Bearbeitung eines Werkstücks oder die Montage eines Gerätes. Aber auch Regelsysteme für die Fehlersuche oder die medizinische Diagnose sind aufgestellt und in Expertsystemen genutzt worden. Solche Expertsysteme sind vor allem in der Medizin, Chemie, Geologie aber auch bei der Planung von Arbeitsschritten eingesetzt worden. Für das Erarbeiten von Expertsystemen ist von besonderer Wichtigkeit, das Wissen in einer Form darzustellen, die mit der Kodierung des Wissens beim Experten weitgehend übereinstimmt. Im System MYCIN zur Diagnose von Infektionskrankheiten sind z. B. 400 diagnostische und therapeutische Entscheidungsregeln gespeichert, die direkt aus verbalen Beschreibungen von Medizinern gewonnen wurden. So sind neue Regeln in natürlicher Sprache in das System eingebbar. Schlußketten von Regeln, die zu einer Diagnose oder einer therapeutischen Maßnahme führen, können dem Mediziner einfach erklärt und von ihm notfalls überprüft werden (DAVIS und Mitarb., 1977). Ein großer Vorteil des menschlichen Gedächtnisses besteht darin, daß es gleichzeitig begriffliches, lexikalisches und bildhaftes Wissen enthält und den flexiblen Übergang zwischen diesen drei Bereichen gewährleistet. So wird eine sprachliche Mitteilung oft bildhaft vorgestellt und ermöglicht das rasche Ausführen von gedanklichen Operationen und bildhaften Schlußprozessen, die über Mengen prädikatenlogischer Ausdrücke aufwendiger und weniger zielstrebig ablaufen würden. In einzelnen Arbeiten der Künstlichen Intelligenz wird versucht, derartige räumliche Repräsentationen und räumliche Schlußprozesse zu .realisieren (WALTZ u. B O G G E S S , 1979).
Planungs- und Problemlösungsprozesse Wenn ein intelligentes System Aufgaben interaktiv mit und in seiner Umwelt erfüllen soll, muß es über die Fähigkeit verfügen, individuelle Aktionen zu Aktionsfolgen zusammenzustellen, mit denen vorgegebene Ziele erreicht werden können. Das Resultat ist ein Handlungsplan. Er entsteht in einem Planungs- oder Problemlösungsprozeß. Die Komplexität des Planungsprozesses hängt von drei Faktoren ab. Erstens von der gestellten Aufgabe. Sie könnte lauten: „Bewege Objekt A vom Ort B zum
398
Z. Psychol. Bd. 190 (1982) II. 4
Ort C" oder „Lege die beste Folge von Arbeitsschritten zur Herstellung des Werkstücks auf dieser Zeichnung fest" oder gar „ R ä u m e die Küche auf, ich gehe ein Bier trinken". Der zweite Faktor ist das gespeicherte Wissen über die Umwelt. Die Bewegung des Objektes kann sehr kompliziert sein, wenn nichts über die Umwelt bekannt ist und Sensoren ortsabhängig nur partielle Information über Hindernisse liefern. Der dritte Faktor ist das Repertoire fertiger Programme und von Regeln, die die Reihenfolge ihrer Abarbeitung bestimmen. In den USA und in J a p a n wird ab 1985 mit dem Einsatz von Haushaltsrobotern gerechnet, die verschiedene Tätigkeiten nach relativ festen Programmen ausführen und nur in geringem Umfang selbst Planungsprozesse realisieren. Wir wollen an dieser Stelle nicht auf die Probleme eingehen, die mit der Ausführung von Handlungsplänen in Realzeit und unter realistischen Bedingungen zusammenhängen. Für Planungsprozesse selbst hat die Denkpsvchologie vier Prinzipien identifiziert, die der Mensch beim Lösen von Problemen beachtet. Sie werden in unterschiedlichem Umfang in den automatischen Problemlosem der Künstlichen Intelligenz berücksichtigt. Erste Voraussetzung erfolgreichen Problemlösens ist die Wahl einer geeigneten Repräsentationsform der Aufgabenbedingungen und verfügbaren Aktionen. Intensive Untersuchungen in der Kognitiven Psychologie sind der Frage gewidmet, wie der Mensch ausgehend von einer sprachlich formulierten Aufgabe ein geeignetes Beschreibungssystem entwickelt. Er tut dies in einem Lernprozeß, der zum einen die schrittweise Spezifizierung eines ersten allgemeinen Beschreibungsrahmens bewirkt, zum anderen aber auch die W a h l völlig neuer Problembeschreibungen beinhalten kann. Im automatischen Problemlösen der Künstlichen Intelligenz dominiert die feste Vorgabe der Repräsentationsform. Die Effektivität der Problemlösungsprogramme wird damit wesentlich durch den Problemanalytiker und Programmierer bestimmt. Neuartige Probleme können nicht verstanden, Programme nicht an wechselnde Bedingungen angepaßt werden. Zweitens wird das Planungsprozeß vom Menschen durch verschiedenartige heuristische Prinzipien gesteuert, die seine Effektivität erhöhen. Es werden deduktiv Randbedingungen formuliert, die die Menge aller kombinatorisch möglichen Aktionsfolgen einschränken, bis einfache Suchprozesse unter den verbleibenden Möglichkeiten die beste Lösung leicht identifizieren können. Die globalen Strategien der Ziel-Mittel-Analyse (DUNCKER, 1935; KLIX, 1971), die vom Ziel ausgehend Teilziele und wichtigste Aktionen festlegt und diese Teilziele wieder weiter untersetzt, sind in automatischen Problemlosem realisiert. Da das menschliche Denken aufgrund der Beschränkung des Kurzzeitgedächtnisses rekursive Prozesse nur in geringer Tiefe durchführen kann, sind uns diese Problemlösungsprogramme weit überlegen. Ein Beispiel stellt das S y s t e m GARI von DESCOTTE und LATOMBE (1981) dar. Es kann ausgehend von der Zeichnung eines Werkstücks die Folge der Bearbeitungsschritte festlegen. Sein Wissen ist als Regelsystem mit ca. 50 Regeln organisiert. J e d e Regel enthält Bedingungen über das Werkstück, die Zeichnung und die vorhandenen Maschinen und Aussagen, die unter diesen
H . SYDOW„ K ü n s t l i c h e Intelligenz u. K o g n i t i v e P s y c h o l o g i e
399
Bedingungen bei der Zusammenstellung der Aktionsfolge zu berücksichtigen sind. Solche Aussagen können sein: Führe Operation A vor Operation B aus! Führe (aus Ökonomiegründen) Operation C gleichzeitig mit Operation D aus! Führe Operation E mit der Maschine F aus! Die Anwendung einer Regel erzeugt neue Bedingungen, wodurch für den nächsten Schritt neue Regeln anwendbar werden. Die erzeugte Menge von Aussagen definiert eine partielle Ordnung über der Menge von Operationen, mit der dann eine kleine Menge von Plänen verträglich ist. Ein drittes Prinzip menschlicher Denkprozesse ist die hierarchische Planung von Aktionsfolgen. Die kombinatorische Vielfalt von Aktionsfolgen wird dadurch eingeschränkt, daß von einem Teil der Aufgabenbedingungen abstrahiert wird. An die Stelle von Operationen treten Makrooperationen. Die tatsächlich zu realisierende Aktionsfolge wird damit auf verschiedenen Ebenen unterschiedlich beschrieben. Ihre hierarchische Struktur entspricht den Prinzipien, die L E O N T J E W (1979) für die Organisation der menschlichen Tätigkeit formuliert hat. Die hierarchische Planung legt zuerst auf höheren Niveaus Teile der Aktionsfolge fest und versucht die Lösung des verallgemeinerten Problems schrittweise zu konkretisieren. In einer Übersicht gab S A C E R D O T I (1979) verschiedene automatisierte Problemlösungstaktiken, darunter auch die hierarchische Planung an. Er konnte auf leistungsfähige Programme verweisen, die insbesondere die bei hierarchischen Planungsprozessen häufig auftretenden Widersprüche mit Debugging-Techniken zu bewältigen gestatten. Ein viertes Prinzip besteht darin, daß in einem Denkprozeß Lernen stattfindet. Es werden allgemeine Eigenschaften von Lösungsfolgen formuliert, die bei der Lösung neuer Probleme genutzt werden können. S A C E R D O T I (1979) gibt vier Arten verallgemeinerbarer Eigenschaften von Aktionsfolgen an und verweist auf automatische Problemlösungstechniken, die derartige Lernprozesse zu realisieren gestatten. Die Fähigkeit des Menschen, Lösunge.n aus einem Wissensbereich auf einen ganz anderen Gegenstand im Sinne analogen Schließens anzuwenden, stellt eine noch ungelöste Herausforderung für die Künstliche Intelligenz dar.
Das Verstehen natürlicher Sprache Mit den ersten Untersuchungen des Frequenzspektrums von isolierten Wörtern und mit der Anwendung von Klassifizierungsverfahren zur Unterscheidung verschiedener Wörter wurde ein Optimismus ausgelöst, der die automatische Übersetzung und natürlich die „automatische Schreibmaschine" in den nahen Zugriff stellte. Doch bald zeigten sich die Probleme, die mit einer Wort-für-Wort-Verarbeitung verbunden sind und daraus folgen, daß die Bedeutungsstruktur eines Satzes nicht nur benachbarte Worte verknüpft. Wenn für Roboter einfache Belehrungs-
400
Z. Psychol. Bd. 190 (1982) H. 4
möglichkeiten auf hohem Sprachniveau gefordert werden, dann muß die Verarbeitung natürlicher Sprache das Problem der Bedeutungserfassung lösen. Unsere Sprache hat die Funktion, zwischen denkenden Wesen zu vermitteln. So muß als Ergebnis der Herausbildung der Sprache ihre Struktur dieser Funktion entsprechen. Die Struktur der Sprache ist von der Struktur unseres Wissens und unseres Denkens nicht zu trennen. So kann eine lineare Vorstellung vom Prozeß des Sprachverstehens von der sensorischen Identifikation einzelner Spracheinheiten, über die Bestimmung von Worteinheiten und die syntaktische Analyse bis hin zu internen Repräsentationen, die semantisch interpretiert werden können, nicht erfolgreich sein. Muß das heißen, daß die Lösung des Problems der automatischen Spracherkennung insgesamt in die ferne Zukunft zu verschieben ist? Die Einzelworterkennung, die Erkennung isoliert gesprochener Worte, ist bei beschränktem Vokabular sprechergebunden gut befierrschbar. Von bestehenden Systemen werden 100 verschiedene Wörter jeweils in 30—300 ms mit seiner Sicherheit von 98 % erkannt. Die Kosten der Systeme steigen jedoch beim Übergang zu fließender Sprache und zur Sprecherunabhängigkeit etwa um zwei Zehnerpotenzen. Dies betrifft ein eingeschränktes Vokabular bei Verzicht auf Syntax und Semantik. Schwerpunkte des Einsatzes der Einzelworterkennung werden vor allem bei Industrierobotern, in der Bürogeräte- und Terminalsteuerung, in der Maschinensteuerung und bei der Datenerfassung gesehen. Psychologische Probleme treten in diesem Zusammenhang nur dadurch auf, daß sich die Nutz.er solcher Erkennungssysteme an eine eingeschränkte Sprache anpassen müssen. Bei der Weiterentwicklung von Auskunftssystemen und von Expertsystemen wird man wohl noch für einige Zeit auf die volle akustische Spracherkennung verzichten müssen. Aber auch bei Eingabe der Sprache über eine Tastatur als geschriebene Sprache verbleiben zu lösende Probleme. Die Künstliche Intelligenz ging für einige Jahre von der Auffassung aus, daß die volle syntaktische Analyse der semantischen Interpretation von Sätzen vorangehen muß. So wurden syntaktische Analyseverfahren mit großer Intensität und beträchtlichem Erfolg ausgearbeitet. Die semantische Satzinterpretation ist dagegen für viele Satzstrukturen und Kontextabhängigkeiten noch nicht gelöst, so daß zur Zeit mehr Sätze syntaktisch analysiert als verstanden werden können. Eines der am weitesten entwickelten syntaktischen Analyseverfahren ist die Netzwerkgrammatik von WOODS (1972). Sie geht auf den Gedanken zurück, daß Sätze einer Sprache durch einen endlichen Automaten, einen Akzeptor, identifiziert werden können. Allerdings muß der endliche Automat erweitert werden, damit Hypothesen über das Vorhandensein syntaktischer Konstituenten geprüft werden können und bei negativem Ergebnis zu früheren Analyseetappen zurückgesprungen werden kann. Die Zustände des Akzeptors entsprechen den bereits abgearbeiteten Satzteilen. Außerdem sind ihnen Operationen zur Erzeugung und Verarbeitung von Listenstrukturen zugeordnet. Haben die Worte eines
Ii. SYDOW, Künstliche Intelligenz u. Kognitive Psychologie
401
Satzes den Akzeptor aus dem Initialzustand in einen Endzustand überführt, so hat der Satz eine vom Netzwerk akzeptierbare syntaktische Struktur. Die Gesamtheit der Operationen, die den durchlaufenen Knoten entsprechen, erzeugt zugleich die Konstituentenstruktur des Satzes. Weiterentwicklungen der Netzwerkgrammatiken prüfen für die sukzessiv eingegebenen Worte des zu analysierenden Satzes semantische Bedingungen und treffen Entscheidungen über neue Konstituenten auf der Grundlage semantischen Wissens (WOODS, 1977). Diese Analyseverfahren vermeiden Beschränkungen der vorrangig semantisch orientierten Analyseverfahren (Bischof, 1981; WOODS, 1977, S . 1012). Sie entsprechen damit Ergebnissen der psycholinguistischen Untersuchungen zum Sprachverstehen. D ' A R C A I S und SCHRETJDER (1980) geben die verschiedenen Informationen an, die ein Mensch beim Verstehen eines Satzes ausnutzt. Das sind: — die lautsprachliche Struktur des Satzes, — die Sprachkompetenz auf der phonologischen, morphologischen, syntaktischen, lexikalischen und begrifflichen Ebene, — das Wissen des Hörers über den Sprecher, seine Kompetenz und Motivation, — die spezifischen Aspekte der Kommunikationssituation und — das Wissen des Hörers über den Gegenstand der Kommunikation. Generell läßt sich sagen, daß semantische und pragmatische Information nicht erst nach vollständiger syntaktischer Analyse des Satzes genutzt werden, sondern zum frühest möglichen Zeitpunkt Schritte der syntaktischen Analyse determinieren. Umgekehrt ist die Erkennung von Wortbedeutungen während der Satzverarbeitung, der Zugriff zum Lexikon, von den bereits verarbeiteten syntaktischen und semantischen Teilstrukturen abhängig ( J A R V E L L A U. W T T B B E N - D A M E N , 1980).
Albschließende Bemerkungen Grundlagenforschung als Vorlaufforschung für intelligente Roboter wird in der Künstlichen Intelligenz und in der Kognitiven Psychologie vor allem in vier Gebieten betrieben. Das sind Sprach verstehen, Bild- und Szenenanalyse, Repräsentation von Wissen und Problemlösungsprozesse. Diese Gebiete haben nicht nur Bedeutung für die Entwicklung intelligenter Roboter, sondern für verschiedene Systeme der Künstlichen Intelligenz. Drei dieser Gebiete wurden in den Forschungsschwerpunkten charakterisiert und es wurde versucht, die Einbeziehung von Erkenntnissen der Kognitiven Psychologie zu beschreiben. Die Bild- und Szenenanalyse wurde hier nicht berücksichtigt. E s konnten nicht einzelne Systeme der Künstlichen Intelligenz oder interessante Experimente der Kognitiven Psychologie im Detail dargestellt werden. Mit der Diskussion allgemeiner Prinzipien sollte versucht werden, einen Beitrag
402
Z. Psychol. Bd. 190 (1982) Ii. 4
zum Nachdenken über zukünftige Robotergenerationen zu leisten und Aufgaben der Grundlagenforschung zu benennen. Die vier Forschungsgebiete entsprechen vier allgemeinen Forderungen an intelligente Roboter. Diese Forderungen umspannen jede ein breites Spektrum von einfachsten bis hin zu sehr anspruchsvollen Leistungen. Detaillierte Analysen sind erforderlich, um sagen zu können, wann diese Leistungen auf den verschiedenen Niveaus mit ökonomisch vertretbarem Aufwand realisierbar sind. Hinsichtlich der Beziehungen zwischen der Künstlichen Intelligenz und der Kognitiven Psychologie stand eine Richtung im Vordergrund. E s wäre ebenso interessant gewesen, die Auswirkungen der Künstlichen Intelligenz auf die Kognitive Psychologie darzustellen, gibt es doch bei einigen Vertretern der Künstlichen Intelligenz die Auffassung, ihre Disziplin habe die Funktion einer theoretischen Psychologie, oder mit anderen Worten,, jede Theorie über geistige Prozesse müsse in Form eines Systems der Künstlichen Intelligenz darstellbar sein. Die geistigen Prozesse, die den Gegenstand der hier abgekürzt bezeichneten Kognitiven Psychologie ausmachen, werden in der Allgemeinen Psychologie nicht isoliert untersucht, sondern in ihrer Entwicklung, unter dem Tätigkeitsaspekt und als Bestandteil der gesamten Persönlichkeit betrachtet. Dadurch werden neomentalistische und sensualistische Konzeptionen vermieden, wie sie z. B . von WELITSCHXOWSKI u n d SINTSCHENKO (1979) der cognitive psychology in den U S A
vorgeworfen wurden. Erkenntnisse über geistige Prozesse werden in verschiedenen gesellschaftlichen Bereichen angewendet. Ihre Überführung in die Künstliche Intelligenz bietet die Möglichkeit, ihre Gültigkeit im Sinne einer Reproduzierbarkeit intelligenter Leistungen zu prüfen und langfristig einen Beitrag zur Erhöhung der ökonomischen Leistungskraft der Volkswirtschaft der D D R zu leisten. Zusammenfassung Die Entwicklung und der E i n s a t z intelligenter Roboter stellen an verschiedene Bereiche der Grundlagenforschung, darunter auch an die Künstliche Intelligenz und die Kognitive Psychologie, neuartige Anforderungen. Vier Leistungseigenschaften intelligenter Roboter werden näher betrachtet und zu Schwerpunkten der Forschung in der Künstlichen Intelligenz und in der Kognitiven Psychologie in Beziehung gesetzt. F ü r drei Teilgebiete der Künstlichen Intelligenz wird die Nutzung von Erkenntnissen der Kognitiven Psychologie geprüft (Repräsentation von Wissen, Planungs- und Problemlösungsprozesse, Verstehen natürlicher Sprache).
Summary The construction and the application of intelligent robots are a challenge to different areas of basic research including Artificial Intelligence and Cognitive Psychology. The author analyses four capabilities in intelligent robots which he relates to the main points of research in Artificial Intelligence and in Cognitive Psychology. l i e discusses for three subareas of Artificial Intelligence the use of results of Cognitive Psychology (representation of knowledge, planning and problem solving processes, comprehension of natural language).
403
II. SYDOW, K ü n s t l i c h e Intelligenz u. K o g n i t i v e P s y c h o l o g i e
Pe3H)Me Pa3BHTHe h npHMeHenne HHTejuinreimiBix PO6OTOB nocTaBHT HOBwe a a a a ' i n nepej; pa3JinqIlblMH oßjiaCTHMH HCCJieflOBaHHH OCHOB, CpeflH HHX H nepefl HCKyCCTBeHHOii HHTejKIHreHIiHeft h KorHHTHBHoii ncHxojiorHeß. HeTtipe cnocoßa BMiiojmeHHH nHTejuinrenTHHX POÖOTOB aHaJiw3HpyiOT H CBH3BIBäK)T C TJiaBHHMH TOHKaMH HCCJieROBaHHH HCKyCCTBeHHOft HHTejUIHreHIJHH H KOrHHTMBHOÜ IICHXCJIOrHH. fljIH TpH HaCTHMX OÖJiaCTefl HCKyCCTBeHHOH HHTGJIJIHrßHIJHH n p o BepHioT Hcn0Jib30BaHHe 3HaHHH KorHHTHBHoii ncHxoJiorHH (penpeaeHTaiiHH :iHaHHH, n p o u e c c o B naaHHpoBaHHH H pememiH npoßjiew, nomiMamiH ecTecTBeimoro H3WKa).
Literatur D'ARCAIS, G. F., und ScHREUDER, R . : T h e use of s y n t a c t i c a n d lexical i n f o r m a t i o n d u r i n g l a n g u a g e processing, 22. I n t e r n a t i o n a l e r Psychologenkongreß. L e i p z i g 1980. BISCHOF, \Y. F . : N e u e r e A n s ä t z e der S p r a c h a n a l y s e in der K ü n s t l i c h e n Intelligenz. I n : FOPPA, K . , und GRONER, R . , ( H r s g . ) : K o g n i t i v e S t r u k t u r e n u n d ihre E n t w i c k l u n g . B e r n 1981. DAVIS, R . , BUCHANAN, B . G., u n d SHORTLIFFE, E . I I . : P r o d u c t i o n rules as a r e p r e s e n t a t i o n for a k n o w l e d g e - b a s e d c o n s u l t a t i o n s y s t e m . Artific. Intel!. 8, 1977 DESCOTTE, Y., LATOMBE, J . C., und GARI: A p r o b l e m solver t h a t p l a n s how to m a c h i n e m e c h a n i c a l p a r t s . P r o c e e d i n g s of the 7. I J C A I 1981. Vol. II. P. 7 6 6 - 7 7 2 . DUXCKER, K . : Zur P s y c h o l o g i e des p r o d u k t i v e n D e n k e n s . Berlin 1935. GEISSLER, H. G . : Coding levels in v i s u a l recognition. Z. P s y c h o l . 187 (1979) 207—214. JARVELLA, R . J . , u n d WUBBEN-DAMEN, A . : L e x i c a l d e p e n d e n c i e s in sentence processing, 22. Intern a t i o n a l e r P s y c h o l o g e n k o n g r e ß . L e i p z i g 1980. KEMPE, V . : I n d u s t r i e r o b o t e r — S t a n d und P e r s p e k t i v e n der F o r s c h u n g . S p e k t r u m 11 (1981) 2—5. K L I X , F . : I n f o r m a t i o n u n d V e r h a l t e n , Berlin 1971. K L I X , F . : S t r u k t u r e l l e u n d funktionelle K o m p o n e n t e n des G e d ä c h t n i s s e s . I n : K L I X , F \ , u n d SYDOW, H. ( H r s g . ) : Zur P s y c h o l o g i e des G e d ä c h t n i s s e s . Berlin 1977. K L I X , F . : On the r e p r e s e n t a t i o n of s e m a n t i c i n f o r m a t i o n in h u m a n l o n g - t e r m - m e m o r y . Z. P s y c h o l . 186 (1978) 2 6 - 3 8 . . KLUWE, R . , u n d SPADA, I I . : Wissen u n d seine V e r ä n d e r u n g : einige p s y c h o l o g i s c h e B e s c h r e i b u n g s a n s ä t z e . I n : FOPPA, K . , und GRONER, R . ( H r s g . ) : K o g n i t i v e S t r u k t u r e n u n d ihre E n t w i c k lung. B e r n 1981. LEONTJEW, A. N . : T ä t i g k e i t , B e w u ß t s e i n , Persönlichkeit, Berlin 1979. I.EOXTJEW, A. A . : „ E i n h e i l e n " u n d N i v e a u s der T ä t i g k e i t . S o w j e t w i s s e n s e h a f t . G e s e l l s e h a f t s w i s s . B e i t r . 4 (1979) 4 0 5 - 4 1 6 . SACERDOTI,
1085.
E. D.:
P r o b l e m s o l v i n g t a c t i c s . Proceedings of t h e
6. l.TCAI. 1979.
Vol.
II.
P.
1077—
SYDOW, I L : P r o b l e m e der Maschinellen Intelligenz. J a h r e s t a g u n g der M a t h e m a t i s c h e n Gesells c h a f t der D D R . D r e s d e n 1972 SYDOW, I i . : S t r u k t u r e r k e n n u n g in k o g n i t i v e n Prozessen, H u m b o l d t - U n i v e r s i t ä t . Diss. B . Berlin 1976. WALTZ, D. L., u n d BOGGESS, L . : Visual a n a l o g r e p r e s e n t a t i o n s for n a t u r a l l a n g u a g e u n d e r s t a n d i n g . Proceedings of the 6. I J C A I 1979. Vol. I I . P. 9 2 6 - 9 3 4 . WELITSCHKOWSKI, B . M., u n d SINTSCHENKO, V. P . : Methodologische P r o b l e m e der m o d e r n e n gnitiven Psychologie. V o p r . filos., H e f t 7 (1979) 67—79. WOLF, A., u n d MASSOW., I I . : I n d u s t r i e r o b o t e r der (1981) 1 0 - 1 7 .
ko-
n ä c h s t e n G e n e r a t i o n . T e c h n . G e m e i n s c h a f t 12
404
Z. Psychol. Bd. 190 (1982) H. 4
WOODS, W. A.: An experimental parsing system for transition network grammars. In: RUSTIN", R. (Ed.): Natural language processing. New York 1972. WOODS, W. A.: Panel on natural language processing. Proceedings of the 5. I J C A I 1977. Vol. 11. P. 1 0 1 1 . WYGOTSKI, L. S.: Denken und Sprechen. Berlin 1964. Eingegangen am 5. 3. 1982 Anschrift des Verfassers: Prof. Dr. II. SYDOW, Sektion Psychologie der Humboldt-Universität Berlin, D D R - 1020 Berlin, Oranienburger Str. 18
From tlie Department of Psycliology, Rheinisch-Westfälische Technische Hochschule Aachen
Training-induced changes in problem solving B y F. W. HESSE With 7 figures
1. Introduction If one wants to improve human problem solving behavior, one can refer back to certain propositions in the literature, for example, strategy instructions as described by P O L Y A ( 1 9 4 5 ) , or new approaches such as S T E R N B E R G ' S ( 1 9 7 7 ) which analyze the components of problem solving behavior. Training with respect to such components could possibly help people, in solving problems. But would it not be more promissing to look for strategy instructions which might enable people to find their own approach to problem handling—perhaps more in POLYA'S sense? In the following experiment, two different training instructions were compared. First, a strategy-plan, based on the empirical analysis of successful problem solving behavior was developed. The second strategy—in the following called selfreflection—strategy—relied on the capability of people to reflect upon and evaluate their own problem solving behavior. It was assumed that people would improve their problem solving through the use of self-reflection.
2. Theoretical Basis For our purposes, the information processing approach of problem solving psychology offers the best propositions. A good theoretical starting point are the theories of cognitive structure by MCCARTHY & H A Y E S ( 1 9 6 9 ) and D O R N E R ( 1 9 7 6 ) . They postulate that the problem solver needs a -definitive knowledge of the area in which the problem is to be solved. This, they call the epistemic or knowledge structure (ES). Additionally the problem solver needs a construction technique to produce unfamiliar transformations. In the simplest of cases such a construction technique might consist of the specifications for a systematic trial and error analysis. It is assumed that the problem solver has a "library" of facilities at his disposition which contains a large set of construction techniques appropriate for their respective problems and areas of reality. These construction facilities
406
Z. Psychol. Bel. 190 (1982) II. 4
for the transformation of a given problem state into a desired one are called heuristic or "search-techniques", and the total quantity of these structures in the memory of a problem solver represents the heuristic structure (HS). But only making use of E S , people solve routine problems. HS, on the other hand, is necessary for productive thought. With the aid of E S , an individual is capable of meeting most of the requirements of everyday life and work. In order, however, to solve a problem for Avhich a plan of action has to be found or constructed, the HS must be employed.
3. Assessment of E S and HS Belated Training If one distinguishes cognitive, organisation into E S and HS, there remain basically two possible ways of improving an individual's problem solving capability. One is to further his knowledge, the other is to improve his HS. Up to now, it has been the practice of school and professional education to emphasize improvement of E S . The application of such knowledge is, nevertheless, largely domain specific. People are, however, often faced with problems whose solutions cannot immediately be retrieved from memory. In this case, resorting to E S does not facilitate problem solving, whereas HS has potentially much broader applications.
4. A Brief Survey of Training Techniques Strategies related to HS can be divided into global and specific approaches. Global training approaches try to improve problem solving through various techniques and strategies, and are normally not restricted to a specific problem domain. Specific training approaches are concerned with only one strategy or in some cases a restricted area of application. Many general approaches proceed from non-specific propositions, such as not immediately structuring a problem but first considering it from all sides (PoSNER, 1976, 264 f), or " t o think laterally" (DE BONO, 1968) as much as possible. Another approach is concerned with strategy transformations (NECHES and HAYES, 1978). The strategies studied by KLAUS, and WALLACE (1976) distinguish between recognition of consistencies and elimination of redundancies. ANDERSON (1975) distinguishes two basic categories of heuristics: "heuristics of simplification" in which the number of steps required for the solution is reduced, and "heuristics of stimulus variation" whereby potentially relevant items are activated in representation memory. Specific training techniques can be grouped according to the strategies they use, e. g., into self-reflection, self-instruction, and backwards strategies. Using a self-reflection training, REITHER (1979) not only found better solutions but
F. \V. HESSE, Training-induced changes
407
also a deeper penetration of the problem. Similar assessments are made by MEICHENBAUM (1974) who studied self-instruction training. With backwards strategy, the solution is attained by proceeding from back to front. That people do indeed use such strategies has been shown by KLIX (1971), GOLOGOR (1974), and DORNER (1974). A m o n g others, STERNBERG (1977) a n d JACOBS a n d VANDEVEN-
TER (1972) concerned themselves with problem solving in analogy items. JACOBS and VANDEVENTER, for example, put together 12 relations for classifying "matrix items" like those in RAVEN'S (1962) APM. They used them to train children who subsequently improved substantially in a transfer test involving new stimulus dimensions. Most of these training approaches have, however, certain weaknesses. It is often the case that training propositions are so imprecise or are formulated in such an abstract manner that it is hard to see how they can be put to use in a concrete way. Moreover, some of these techniques have never been investigated empirically. Evaluating the training techniques from the perspective of HS, a further weakness must be seen in the fact that the training effects are limited to rather restricted situations. This poses the problem that one cannot distinguish HS and E S effects because the latter are intimately related to familiarity with the problem material.
5. Objective of the Experiment In the following, the form, construction, execution, and effect of the training in the present inquiry are presented in detail. The following requirements must be taken into consideration: 1. The training should bring about a quantitative and qualitative improvement in performance. The qualitative improvement will be assessed by considering changes in how the problems were handled by the subjects. 2. The effectiveness of the training should be examined using problems other than those in the training to reduce the influence of E S . 3. In order that a training effect is not merely demonstrable for a very narrow area, problems should be chosen for which general intelligence is required. 4. The training should be with adults to avoid the mere balancing of discrepancies in intellectual development which can obscure results in child experiments.
6. Problem Domain Now, how can we devise an investigation which fulfils the requirements outlined above? Since it is generally argued that the items of RAVEN'S (1962) APMTest measure general intelligence, items of that sort seem to be particularly appro-
408
Z. Psychol. Bd. 190 (1982) II. 4
priate. In the training phase of the experiment, matrix-items of the APM-type were used. In the test phase, items directly taken from the APM were used (see below). Strategy Training This training goes back to an empirical analysis of solving R A V E N ' S ( 1 9 6 2 ) A P M items (PTTTZ-OSTERLOH, 1981). The successful handling of APM items seems to require at least 3 steps: — recognition of relevant progressions — deduction of valid rule — application of the rule to the last row or column to construct the solution figure. Further theoretical analysis suggested a strategy training which, in essence, consists of teaching subjects to proceed along those three steps (see below). Self-reflection Training It seems sensible to take into account another and in many respects very different training possibility. In this training the subjects are asked to critically evaluate their own solving behavior. Thus, they should be able to define what they have already done, what was good or bad about it, what they could subsequently change, and what they have to watch out for in order to improve their problem solving behavior. As the subjects work with this "self-reflection strategy", they will supposedly develop an individual procedure which will enable them to advance more surely towards the solution. Herein lies a special type of heuristic in as much as the subjects will be urged to develop their own individual heuristic. The same objective was pursued with both forms of training: a testable improvement in solving problems. The two approaches have, however, certain advantages and disadvantages: — certainly, the advantage of the strategy instruction is that it is based on an empirical analysis. Thus, one can arrive at a relatively complete catalogue of the possible and relevant steps to a solution. — on the other hand, this empirical analysis only works with accessible data (e.g., thinking aloud) so that only a part of behavior can be examined. Moreover, a strategy program is necessarily extremely explicit and, therefore, possibly too atomistic for some subjects. — in the case of self-reflection, self-observation forms the basis of strategy development. So it may be possible to develop more individualized procedures. These would certainly be not only more economical but subjects would more likely adopt them. — the danger of self-reflection lies primarily in its subjectivity. As a rule a person only works with a limited number of possibilities which lead to problem solution. Moreover, he may have strong preferences for some of these possibilities.
F. W. HESSE, Training-induced changes
r" O F o ja fcß o o O t*
27 Z. Psychologie 190-4
409
410
Z. Psychol. Bd. 190 (1982) H.